對於每個Java程序員來說,HelloWorld是一個再熟悉不過的程序。它很簡單,但是這段簡單的代碼能指引我們去深入理解一些復雜的概念。這篇文章,我將探索我們能從這段簡單的代碼中學到什麼。如果你對HelloWorld有獨到的理解,請留下你的評論。
HelloWorld.java
public class HelloWorld { /** * @param args */ public static void main(String[] args) { System.out.println("Hello World"); } }
Java程序是基於類構建的,每一個方法,字段必須存在於類裡面。這是因為Java是面向對象的:一切都是對象,即一個類的實例。相對於函數式編程,面向對象編程有很多優勢,如更加模塊化,可擴展性更好等。
main方法是靜態方法,程序的入口;靜態方法意味著這個方法是屬於類,而不是對象。
那為什麼是這樣呢?為什麼不使用非靜態方法作為程序的入口呢?
如果這個方法是非靜態的,那麼在使用這個方法之前需要先創建對象,因為非靜態方法需要由對象來調用。作為一個程序的入口,這樣的設計是不現實的。在沒有雞的情況下,我們不能獲取雞蛋。因此,程序入口被設置為靜態方法。
另外,main方法的入參"String[] args"表明一個字符串數組可以傳入該方法用於執行程序的初始化工作。
為了運行這個程序,Java文件首先被編譯成字節碼存入一個.class文件。那麼這個字節碼文件是怎樣的呢?字節碼本身是不易讀的,我們使用十六進制編輯器打開它,結果如下:
從上面的字節碼,我們看到了很多操作碼(如CA, 4C,),它們中的每一個都對應著一個助記碼(如下面例子中的aload_0),操作碼是不易讀的,但是我們可以使用javap去查看.class文件的助記符形式。
"javap -c"可以打印類中每個方法的反匯編代碼,反匯編代碼即一些指令,這些指定組成了java的字節碼。
javap -classpath . -c HelloWorld
public class HelloWorld extends java.lang.Object{ public HelloWorld(); Code: 0: aload_0 1: invokespecial #1; //Method java/lang/Object."<init>":()V 4: return public static void main(java.lang.String[]); Code: 0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #3; //String Hello World 5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: return }
以上代碼包含了兩個方法,一個是構造方法,由編譯器自動插入;另一個是main方法。
在每個方法的下面,都有一系列的指令,如aload_0,invokespecial #1等。每個指定對應的含義可以查看Java字節碼指令列表。舉個例子,aload_0加載棧中局部變量的引用,getstatic獲取類中的靜態字段值。注意getstatic後面的"#2",其指向運行時常量池,常量池是Java運行時數據區域。因此,使用"javap -verbose"命令,可以幫助我們查看常量池。
另外,每條指令的前面都有一個數字,如0,1,4等。在字節碼文件中,每一個方法都有對應的字節碼數組。這些數字對應的正是數組的索引,這些數組存放了操作碼和對應參數。每個操作碼長度為一個字節,可以有0或多個參數,這就是為什麼這些數字不是連續的。
現在,我們可以使用"javap -verbose"命令深入看下這個類:
javap -classpath . -verbose HelloWorld
public class HelloWorld extends java.lang.Object SourceFile: "HelloWorld.java" minor version: 0 major version: 50 Constant pool: const #1 = Method #6.#15; // java/lang/Object."<init>":()V const #2 = Field #16.#17; // java/lang/System.out:Ljava/io/PrintStream; const #3 = String #18; // Hello World const #4 = Method #19.#20; // java/io/PrintStream.println:(Ljava/lang/String;)V const #5 = class #21; // HelloWorld const #6 = class #22; // java/lang/Object const #7 = Asciz <init>; const #8 = Asciz ()V; const #9 = Asciz Code; const #10 = Asciz LineNumberTable; const #11 = Asciz main; const #12 = Asciz ([Ljava/lang/String;)V; const #13 = Asciz SourceFile; const #14 = Asciz HelloWorld.java; const #15 = NameAndType #7:#8;// "<init>":()V const #16 = class #23; // java/lang/System const #17 = NameAndType #24:#25;// out:Ljava/io/PrintStream; const #18 = Asciz Hello World; const #19 = class #26; // java/io/PrintStream const #20 = NameAndType #27:#28;// println:(Ljava/lang/String;)V const #21 = Asciz HelloWorld; const #22 = Asciz java/lang/Object; const #23 = Asciz java/lang/System; const #24 = Asciz out; const #25 = Asciz Ljava/io/PrintStream;; const #26 = Asciz java/io/PrintStream; const #27 = Asciz println; const #28 = Asciz (Ljava/lang/String;)V; { public HelloWorld(); Code: Stack=1, Locals=1, Args_size=1 0: aload_0 1: invokespecial #1; //Method java/lang/Object."<init>":()V 4: return LineNumberTable: line 2: 0 public static void main(java.lang.String[]); Code: Stack=2, Locals=1, Args_size=1 0: getstatic #2; //Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #3; //String Hello World 5: invokevirtual #4; //Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: return LineNumberTable: line 9: 0 line 10: 8 }
JVM規范中是這樣描述的:
運行時常量池是為方法服務的,類似於常規程序設計語言中的符號表,但是常量池包含的數據比典型的符號表范圍較廣。
"invokespecial #1"指令中的"#1"指向常量池中的#1常量,即"Method #6.#15;",根據這些數字,我們可以遞歸的得到最終常量。行號表可以方便調試人員知道Java源代碼中的哪些行對應字節碼中的哪些指令。如,Java源代碼中的第9行對應main方法中的code 0,第10行對應code 8。
如果你想要知道更多關於字節碼的內容,可以嘗試創建一個更加復雜的類,並編譯查看。相對而言,HelloWorld太簡單了。
現在的問題是JVM如何裝載Java類以及如何調用main方法?
在main方法執行之前,JVM需要完成以下步驟,
加載步驟是由Java類加載器完成的,在JVM啟動的時候,使用了三個類加載器:
所以HelloWorld是由系統類加載器加載的,當main方法執行之前,會觸發加載,鏈接,初始化其它依賴類操作。
最終,main方法幀 被push到JVM棧中,程序計數器開始做相應操作,將println方法幀push到JVM棧中,當main方法執行完畢,棧中對應的數據被彈出,然後執行完畢。
譯文鏈接:http://www.programcreek.com/2013/04/what-can-you-learn-from-a-java-helloworld-program/