从Java的类型转换看MySQL和Oracle中的隐式转换


说起数据类型转换,在开发中如此,在数据库中也是如此,之前简单对比过MySQL和Oracle的数据类型转换情况,可以参见MySQL和Oracle中的隐式转换
不过当时写完之后,有个读者随口问了一句为什么,为什么呢?似乎自己还是一知半解,说是规则,无规矩不成方圆,倒也无可非议,不过我觉得还是要再看看,看看还能有哪些收获,接下来的内容我就不能保证正确性了,希望大家明辨,也希望提出意见,毕竟就是希望把问题搞明白而已。

 首先开发语言中就有数据类型的隐式转换,这一点在java中尤为明显,毕竟一个承载了太多使命的语言如此庞大,又是强类型语言,数据类型的转换就是一个尤为重要的部分了。Java中的数据类型转换主要有下面的规则。
//转换规则:从存储范围小的类型到存储范围大的类型。
//具体规则为:byte→short(char)→int→long→float→double
自己也嘚瑟了一下,写了个简单的小程序以示明证,这个程序不能说明我会java.
 public class Test {
 public static void main(String args[]){
 /*1*/    System.out.println("aa");
/*2*/    System.out.println('a');
/*3*/    byte a=10;
/*4*/    System.out.println(a);
/*5*/    char b='b';
/*6*/    int c=b;
/*7*/    System.out.println(b);
/*8*/    System.out.println(c);
    }
 }
这个程序的输出为
aa
 a
 10
 b
 98

这样写的目的就是,
 第1行,第2行中的单引号,双引号需要做的事情就是标示它是一个变量值,两者的效果在这个时候是一致的。
 第3行初始化了一个byte变量,然后输出,这个时候还是byte
但是第5行声明了一个char型变量,然后在第6行中做了类型的隐式转换,在第7行中输出为字符b,但是在第8行输出为
 通过这个简单的例子可以发现确实数据类型做了隐式转换,而且单引号,双引号在这个例子中的作用是一致的,就是标示变量。
 因为在Java中查看数据类型的转换代价还是相对要困难一些,我们可以在数据库中来类比。
 首先还是重复之前的测试,准备一批的数据。创建一个表,然后插入一些值。
create table test (id1 number,id2 varchar2(10));
  begin                 
    for i in 1..100 loop
    insert into test values(i,chr(39)||i||chr(39));
    end loop;
    commit;
    end;
    /
 create index ind1_test on n1.test(id1);
 create index ind2_test on n1.test(id2);
然后收集统计信息。
exec dbms_stats.gather_table_stats('TEST','TEST',CASCADE=>TRUE);
这个时候查看执行计划
explain plan for select *from test where id1='2';
 SQL>  select *from table(dbms_xplan.display);
 PLAN_TABLE_OUTPUT
 ----------------------------------------------------------------------------------------------------
 Plan hash value: 2759464289
 -----------------------------------------------------------------------------------------
 | Id  | Operation                  | Name      | Rows  | Bytes | Cost (%CPU)| Time    |
 -----------------------------------------------------------------------------------------
 |  0 | SELECT STATEMENT            |          |    1 |    20 |    1  (0)| 00:00:01 |
 |  1 |  TABLE ACCESS BY INDEX ROWID| TEST      |    1 |    20 |    1  (0)| 00:00:01 |
 |*  2 |  INDEX RANGE SCAN          | IND1_TEST |    1 |      |    1  (0)| 00:00:01 |
 -----------------------------------------------------------------------------------------
 Predicate Information (identified by operation id):
 PLAN_TABLE_OUTPUT
 -------------------------------------------------------------
    2 - access("ID1"=2)
通过这个确实可以看到谓词信息的部分    2 - access("ID1"=2) 已经自动做了转换,这个时候一个触发了一个索引扫描。
 但是这个过程还是看不出有数据类型转换的痕迹,我们做一个看似有问题的例子,来触发一下。尽管id1位int型,但是使用字符型来触发。
SQL>    explain plan for select *from test where id1='A';
 Explained.
 SQL>  select *from table(dbms_xplan.display);
 PLAN_TABLE_OUTPUT
 ----------------------------------------------------------------------------------------------------
 Plan hash value: 2759464289
 -----------------------------------------------------------------------------------------
 | Id  | Operation                  | Name      | Rows  | Bytes | Cost (%CPU)| Time    |
 -----------------------------------------------------------------------------------------
 |  0 | SELECT STATEMENT            |          |    1 |    20 |    1  (0)| 00:00:01 |
 |  1 |  TABLE ACCESS BY INDEX ROWID| TEST      |    1 |    20 |    1  (0)| 00:00:01 |
 |*  2 |  INDEX RANGE SCAN          | IND1_TEST |    1 |      |    1  (0)| 00:00:01 |
 -----------------------------------------------------------------------------------------
 Predicate Information (identified by operation id):
 PLAN_TABLE_OUTPUT
 ------------------------------------------------
    2 - access("ID1"=TO_NUMBER('A'))
可以看到谓词信息已经发生了变化。  2 - access("ID1"=TO_NUMBER('A'))从这个地方我们可以看到确实触发了一个to_number的操作。
 而优化器在这个时候虽然触发了,但是在sql运行的时候,就会报出错误,这个时候可以看到Oracle还是蛮严谨的。
SQL> select *from test where id1='A';
 select *from test where id1='A'
                            *
 ERROR at line 1:
 ORA-01722: invalid number
而如果使用双引号,生成执行计划都会抛错。
SQL> explain plan for select *from test where id1="A";
explain plan for select *from test where id1="A"
                                            *
ERROR at line 1:
ORA-00904: "A": invalid identifier
可见单引号和双引号在Oracle代表的含义还是有很大差别。

 我们来看看在MySQL中的表现。
 还是创建一个简单的表,插入一些数据。
> create table test (id1 int,id2 varchar(10));
 > insert into test values(1,'1');
 > insert into test values(2,'2');
 > insert into test values(3,'3');
 > commit;
 > create index idx_id1 on test(id1);
 > create index idx_id2 on test(id2);
这个时候生成执行计划,可以发现走了索引
> explain select * from test where id1='1';
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 | id | select_type | table | type | possible_keys | key    | key_len | ref  | rows | Extra      |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 |  1 | SIMPLE      | test  | ref  | idx_id1      | idx_id1 | 5      | const |    1 | Using where |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 1 row in set (0.00 sec)
而如果查看id1为varchar的类型时,也走了索引。
> explain select * from test where id1='a';
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 | id | select_type | table | type | possible_keys | key    | key_len | ref  | rows | Extra      |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 |  1 | SIMPLE      | test  | ref  | idx_id1      | idx_id1 | 5      | const |    1 | Using where |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 1 row in set (0.00 sec)
差别更大的就是如果使用id1='a',也能够正常执行,只是没有任何匹配的记录。
> select * from test where id1='a';
 Empty set (0.00 sec)
而如果由单引号改为双引号,也能够正常运行。
> select * from test where id1="a";
 Empty set (0.00 sec)
而且双引号的情况下,生成执行计划也没有问题。
> explain select * from test where id1="a";
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 | id | select_type | table | type | possible_keys | key    | key_len | ref  | rows | Extra      |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 |  1 | SIMPLE      | test  | ref  | idx_id1      | idx_id1 | 5      | const |    1 | Using where |
 +----+-------------+-------+------+---------------+---------+---------+-------+------+-------------+
 1 row in set (0.00 sec)
可以看出在MySQL中这个时候的范围似乎更宽,在MySQL中不光用单引号,双引号,而且还经常会看到·这种符号。
 这种在MySQL中可以灵活声明一些变化���,举个不太恰当的例子,比如我们创建一个表,一个字段为int,类型为int直接按照下面的方式来写,肯定抛错。
> create table test1(int int);
 ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'int int)' at line 1
 crea' at line 1
可以加上·,就可以识别了。
> create table test1(`int` int);
 Query OK, 0 rows affected (0.00 sec)

这个对比的跨度有点大,但是通过一些小把戏似乎还是能够看出在这些类型的转换中,优化器这边的触发情况。再接再厉,继续探究。

相关内容