整個教程中已經不時的出現一些內存管理和垃圾回收的相關知識。這裡進行一個小小的總結。
Java是在JVM所虛擬出的內存環境中運行的。內存分為棧(stack)和堆(heap)兩部分。我們將分別考察這兩個區域。
棧的基本概念參考紙上談兵: 棧 (stack)。許多語言利用棧數據結構來記錄函數調用的次序和相關變量(參考Linux從程序到進程)。
在Java中,JVM中的棧記錄了線程的方法調用。每個線程擁有一個棧。在某個線程的運行過程中,如果有新的方法調用,那麼該線程對應的棧就會增加一個存儲單元,即幀(frame)。在frame中,保存有該方法調用的參數、局部變量和返回地址。
調用棧
Java的參數和局部變量只能是基本類型的變量(比如int),或者對象的引用(reference)。因此,在棧中,只保存有基本類型的變量和對象引用。
引用所指向的對象保存在堆中。(引用可能為Null值,即不指向任何對象)
引用與對象
當被調用方法運行結束時,該方法對應的幀將被刪除,參數和局部變量所占據的空間也隨之釋放。線程回到原方法,繼續執行。當所有的棧都清空時,程序也隨之運行結束。
如上所述,棧(stack)可以自己照顧自己。但堆必須要小心對待。堆是JVM中一塊可自由分配給對象的區域。當我們談論垃圾回收(garbage collection)時,我們主要回收堆(heap)的空間。
Java的普通對象存活在堆中。與棧不同,堆的空間不會隨著方法調用結束而清空。因此,在某個方法中創建的對象,可以在方法調用結束之後,繼續存在於堆中。這帶來的一個問題是,如果我們不斷的創建新的對象,內存空間將最終消耗殆盡。
查看本欄目
垃圾回收(garbage collection,簡稱GC)可以自動清空堆中不再使用的對象。垃圾回收機制最早出現於1959年,被用於解決Lisp語言中的問題。垃圾回收是Java的一大特征。並不是所有的語言都有垃圾回收功能。比如在C/C++中,並沒有垃圾回收的機制。程序員需要手動釋放堆中的內存。
由於不需要手動釋放內存,程序員在編程中也可以減少犯錯的機會。利用垃圾回收,程序員可以避免一些指針和內存洩露相關的bug(這一類bug通常很隱蔽)。但另一方面,垃圾回收需要耗費更多的計算時間。垃圾回收實際上是將原本屬於程序員的責任轉移給計算機。使用垃圾回收的程序需要更長的運行時間。
在Java中,對象的是通過引用使用的(把對象相像成致命的毒物,引用就像是用於提取毒物的鑷子)。如果不再有引用指向對象,那麼我們就再也無從調用或者處理該對象。這樣的對象將不可到達(unreachable)。垃圾回收用於釋放不可到達對象所占據的內存。這是垃圾回收的基本原則。
(不可到達對象是死對象,是垃圾回收所要回收的垃圾)
早期的垃圾回收采用引用計數(reference counting)的機制。每個對象包含一個計數器。當有新的指向該對象的引用時,計數器加1。當引用移除時,計數器減1。當計數器為0時,認為該對象可以進行垃圾回收。
然而,一個可能的問題是,如果有兩個對象循環引用(cyclic reference),比如兩個對象互相引用,而且此時沒有其它(指向A或者指向B)的引用,我們實際上根本無法通過引用到達這兩個對象。
因此,我們以棧和static數據為根(root),從根出發,跟隨所有的引用,就可以找到所有的可到達對象。也就是說,一個可到達對象,一定被根引用,或者被其他可到達對象引用。
橙色,可到達;綠色,不可到達
JVM的垃圾回收是多種機制的混合。JVM會根據程序運行狀況,自行決定采用哪種垃圾回收。
我們先來了解"mark and sweep"。這種機制下,每個對象將有標記信息,用於表示該對象是否可到達。當垃圾回收啟動時,Java程序暫停運行。JVM從根出發,找到所有的可到達對象,並標記(mark)。隨後,JVM需要掃描整個堆,找到剩余的對象,並清空這些對象所占據的內存。
另一種是"copy and sweep"。這種機制下,堆被分為兩個區域。對象總存活於兩個區域中的一個。當垃圾回收啟動時,Java程序暫停運行。JVM從根出發,找到可到達對象,將可到達對象復制到空白區域中並緊密排列,修改由於對象移動所造成的引用地址的變化。最後,直接清空對象原先存活的整個區域,使其成為新的空白區域。
可以看到,"copy and sweep"需要更加復雜的操作,但也讓對象可以緊密排列,避免"mark and sweep"中可能出現的空隙。在新建對象時,"copy and sweep"可以提供大塊的連續空間。因此,如果對象都比較"長壽",那麼適用於"mark and sweep"。如果對象的"新陳代謝"比較活躍,那麼適用於"copy and sweep"。
上面兩種機制是通過分代回收(generational collection)混合在一起的。每個對象記錄有它的世代(generation)信息。所謂的世代,是指該對象所經歷的垃圾回收的次數。世代越久遠的對象,在內存中存活的時間越久。
根據對Java程序的統計觀察,世代越久的對象,越不可能被垃圾回收(富人越富,窮人越窮)。因此,當我們在垃圾回收時,要更多關注那些年輕的對象。
現在,具體看一下JVM中的堆:
查看本欄目
我們看到,堆分為三代。其中的永久世代(permanent generation)中存活的是Class對象。這些對象不會被垃圾回收。我們在RTTI中已經了解到,每個Class對象代表一個類,包含有類相關的數據與方法,並提供類定義的代碼。每個對象在創建時,都要參照相應的Class對象。每個對象都包含有指向其對應Class對象的引用。
年輕世代(young generation)和成熟世代(tenured generation)需要進行垃圾回收。年輕世代中的對象世代較近,而成熟世代中的對象世代較久。
世代
年輕世代進一步分為三個區域
eden(伊甸): 新生對象存活於該區域。新生對象指從上次GC後新建的對象。
新生對象生活於伊甸園
from, to: 這兩個區域大小相等,相當於copy and sweep中的兩個區域。
當新建對象無法放入eden區時,將出發minor collection。JVM采用copy and sweep的策略,將eden區與from區的可到達對象復制到to區。經過一次垃圾回收,eden區和from區清空,to區中則緊密的存放著存活對象。隨後,from區成為新的to區, to區成為新的from區。
如果進行minor collection的時候,發現to區放不下,則將部分對象放入成熟世代。另一方面,即使to區沒有滿,JVM依然會移動世代足夠久遠的對象到成熟世代。
如果成熟世代放滿對象,無法移入新的對象,那麼將觸發major collection。JVM采用mark and sweep的策略,對成熟世代進行垃圾回收。
以上是對JVM內存管理的一個概述。實際上,JVM擁有眾多版本。不同版本實施的GC機制會有不小的差異。另一方面,Java本身並沒有規定JVM的GC實施方式。GC依然是JVM發展的一個熱點方向。我們可以預期JVM的GC機制在未來會發生許多變化。
作者:Vamei 出處:http://www.cnblogs.com/vamei