String字符常量池和intern()


常量池(Constant Pool)指的是在编译期被确定,并被保存在已编译的class文件中的一些数据。它包括了关于类、方法、接口等中的常量,也包括字符串常量。

JVM在运行的时候,会装进存在于.class文件中的常量池。

常量池在运行中,是可以扩展的,如String.intern()方法:先检查常量池里有没有相同Unicode的常量,没有则添加,然后返回此String的引用。

String私有地维护了一个初始时为空的字符串常量池。

字符串常量是在编译期就加载到常量池了,直接调用就可以了。而String.intern()和字符串常量的调用原理差不多,所以每次使用常量"Hello"的时候,等价于"Hello".intern(),当然效率会更高一些。

String.intern()

String.intern()是用的本地方法native

public native String intern();

private static final HashMap<String, String> stringPoolMap = new HashMap<String, String>();

    public static String intern(String str) {

        String result = stringPoolMap.get(str); 

        if (result == null) {
            stringPoolMap.put(str, str);
        }
        return result;
    }
}

接下来,我们看看常量池和字符串引用的一些交互:
 
1、首次加入常量池

String s3 = new String(newchar[] {'a', 'b'});
System.out.println(s3 == s3.intern());  // true:s3放入了常量池

// ------------------

String s3 = new String("ab");
System.out.println(s3 == s3.intern()); // false:”ab”放入了常量池

上面的两个校验操作返回的结果不一样,第一种情况,s3.intern()的时候,常量池还没有"ab",所以s3的地址被插入到了常量池,所以s3和s3.intern()是指向同一个地方的。

而第二种情况,"ab"在编译时就插入常量池了,所以s3.intern()指向的是常量池的"ab",而不是s3本身,所以s3和s3.intern()不相等。

2、常量和new String

String s1 = "ab";    // 编译期会把"ab"添加到常量池

String s2 = new String("ab");  // 只是"ab"从常量池取,而new又重新创建了一个String

System.out.println(s1 ==s2);  // false:两个不同的对象,返回

System.out.println(s1.intern()== s2);  // false:s1 等价于 s1.intern()

System.out.println(s1 ==s2.intern()); // true:intern会到常量池中查找

运行期间,s1直接指向常量池的"ab",而s2用new创建,相当于先从常量池拿出"ab",然后再创建一个String。

所以s1和s2是两个对象;s1.intern()和s1都是指向常量池,所以两者等价。而s2.intern()也是从常量池中获取,所以s1 == s2.intern()。

总结:字符串常量池是JVM为了缓存我们用过的字符常量,避免重复创建字符对象,来提高效率。但是遇到一些特殊情况,如字符串相加操作,往往会产生很多多余无用的字符常量,这个处理方式就值得商榷了。  大伙有什么想法,可以讨论讨论 :)

相关内容