Constant Pool常量池的概念:
在講到String的一些特殊情況時,總會提到String Pool或者Constant Pool,但是我想很多人都不太明白Constant Pool到底是個怎麼樣的東西,運行的時候存儲在哪裡,所以在這裡先說一下Constant Pool的內容。
String Pool是對應於在Constant Pool中存儲String常量的區域.習慣稱為String Pool,也有人稱為String Constant Pool.好像沒有正式的命名。
在java編譯好的class文件中,有個區域稱為Constant Pool,他是一個由數組組成的表,類型為cp_info constant_pool[],用來存儲程序中使用的各種常量,包括Class/String/Integer等各種基本Java數據類型。
對於Constant Pool,表的基本通用結構為:
cp_info {
u1 tag;
u1 info[];
}
tag是一個數字,用來表示存儲的常量的類型,例如8表示String類型,5表示Long類型,info[]根據
類型碼tag的不同會發生相應變化。
對於String類型,表的結構為:
CONSTANT_String_info {
u1 tag;
u2 string_index;
}
tag固定為8,string_index是字符串內容信息,類型為:
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
tag固定為1,length為字符串的長度,bytes[length]為字符串的內容。
(以下代碼在jdk6中編譯)
為了詳細理解Constant Pool的結構,我們參看一些代碼:
String s1 = "sss111";
String s2 = "sss222";
System.out.println(s1 + " " + s2);
由於"sss111"和"sss222"都是字符串常量,在編譯期就已經創建好了存儲在class文件中。
在編譯後的class文件中會存在這2個常量的對應表示:
08 00 11 01 00 06 73 73 73 31 31 31 08 00 13 01 ; ......sss111....
00 06 73 73 73 32 32 32 ; ..sss222
根據上面說的String常量結構,我們分析一下:
開始的08為CONSTANT_String_info結構中的tag,而11應該是它的相對引用,01為CONSTANT_Utf8_info的tag,06為對應字符串的長度,73 73 73 31 31 31為字符串對應的編碼,接著分析,會發現後面的是對應"sss222"的存儲結構。
經過上面分析,我們知道了11和13是兩個字符串的相對引用,就可以修改class文件來修改打印的內容,把class文件中的00 6E 00 04 00 03 00 00 00 24 12 10 4C 12 12 4D改成00 6E 00 04 00 03 00 00 00 24 12 10 4C 12 10 4D,程序就會輸出sss111 sss111,而不是和原程序一樣輸出sss111 sss222,因為我們把對"sss222"的相對引用12改成了對"sss111"的相對引用10。
public class Test {
public static void main(String[] args) {
String s1 = "sss111";
String s2 = "sss111";
}
}
在上面程序中存在2個相同的常量"sss111",對於n個值相同的String常量,在Constant Pool中只會創建一個,所以在編譯好的class文件中,我們只能找到一個對"sss111"的表示:
000000abh: 08 00 11 01 00 06 73 73 73 31 31 31 ; ......sss111
在程序執行的時候,Constant Pool會儲存在Method Area,而不是heap中。
另外,對於""內容為空的字符串常量,會創建一個長度為0,內容為空的字符串放到Constant Pool中,
而且Constant Pool在運行期是可以動態擴展的。
關於String類的說明
1.String使用private final char value[]來實現字符串的存儲,也就是說String對象創建之後,就不能再修改此對象中存儲的字符串內容,就是因為如此,才說String類型是不可變的(immutable)。
2.String類有一個特殊的創建方法,就是使用""雙引號來創建.例如new String("i am")實際創建了2個String對象,一個是"i am"通過""雙引號創建的,另一個是通過new創建的.只不過他們創建的時期不同, 一個是編譯期,一個是運行期!
3.java對String類型重載了+操作符,可以直接使用+對兩個字符串進行連接。
4.運行期調用String類的intern()方法可以向String Pool中動態添加對象。
String的創建方法一般有如下幾種
1.直接使用""引號創建;
2.使用new String()創建;
3.使用new String("someString")創建以及其他的一些重載構造函數創建;
4.使用重載的字符串連接操作符+創建。
例1
String s1 = "sss111";
//此語句同上
String s2 = "sss111";
System.out.println(s1 == s2); //結果為true
例2
String s1 = new String("sss111");
String s2 = "sss111";
System.out.println(s1 == s2); //結果為false
例3String s1 = new String("sss111");
s1 = s1.intern();
String s2 = "sss111";
System.out.println(s1 == s2);
例4
String s1 = new String("111");
String s2 = "sss111";
String s3 = "sss" + "111";
String s4 = "sss" + s1;
System.out.println(s2 == s3); //true
System.out.println(s2 == s4); //false
System.out.println(s2 == s4.intern()); //true
例5
這個是The Java Language Specification中3.10.5節的例子,有了上面的說明,這個應該不難理解了
package testPackage;
class Test {
public static void main(String[] args) {
String hello = "Hello", lo = "lo";
System.out.print((hello == "Hello") + " ");
System.out.print((Other.hello == hello) + " ");
System.out.print((other.Other.hello == hello) + " ");
System.out.print((hello == ("Hel"+"lo")) + " ");
System.out.print((hello == ("Hel"+lo)) + " ");
System.out.println(hello == ("Hel"+lo).intern());
}
}
class Other { static String hello = "Hello"; }
package other;
public class Other { static String hello = "Hello"; }
輸出結果為true true true true false true,請自行分析!
結果上面分析,總結如下:
1.單獨使用""引號創建的字符串都是常量,編譯期就已經確定存儲到String Pool中;
2.使用new String("")創建的對象會存儲到heap中,是運行期新創建的;
3.使用只包含常量的字符串連接符如"aa" + "aa"創建的也是常量,編譯期就能確定,已經確定存儲到String Pool中;
4.使用包含變量的字符串連接符如"aa" + s1創建的對象是運行期才創建的,存儲在heap中;
5.使用"aa" + s1以及new String("aa" + s1)形式創建的對象是否加入到String Pool中我不太確定,可能是必須調用intern()方法才會加入。
還有幾個經常考的面試題:
1.
String s1 = new String("s1") ;
String s2 = new String("s1") ;
上面創建了幾個String對象?
答案:3個 ,編譯期Constant Pool中創建1個,運行期heap中創建2個.
2.
String s1 = "s1";
String s2 = s1;
s2 = "s2";
s1指向的對象中的字符串是什麼?
答案: "s1"