1.Java在內存中的狀態
首先我們先寫一個代碼為例子:
Person.Java
packagetest;
importJava.io.Serializable;
public class Person implementsSerializable
{
static final long serialVersionUID = 1L;
String name; //姓名
Person frIEnd; //朋友
publicPerson() {}
publicPerson(String name)
{
super();
this.name =name;
}
}
Test.Java
packagetest;
public classTest
{
public static voidmain(String[] args)
{
Person p1 = new Person("Kevin");
Person p2 = new Person("Rain");
Person p3 = new Person("Sunny");
p1.frIEnd =p2;
p3 =p2;
p2 = null;
}
}
把上面Test.Java中main方面裡面的對象引用畫成一個從main方法開始的對象引用圖的話就是這樣的(頂點是對象和引用,有向邊是引用關系):
當程序運行起來之後,把它在內存中的狀態看成是有向圖後,可以分為三種:
1)可達狀態:在一個對象創建後,有一個以上的引用變量引用它。在有向圖中可以從起始頂點導航到該對象,那它就處於可達狀態。
2)可恢復狀態:如果程序中某個對象不再有任何的引用變量引用它,它將先進入可恢復狀態,此時從有向圖的起始頂點不能再導航到該對象。在這個狀態下,系統的垃圾回收機制准備回收該對象的所占用的內存,在回收之前,系統會調用finalize()方法進行資源清理,如果資源整理後重新讓一個以上引用變量引用該對象,則這個對象會再次變為可達狀態;否則就會進入不可達狀態。
3)不可達狀態:當對象的所有關聯都被切斷,且系統調用finalize()方法進行資源清理後依舊沒有使該對象變為可達狀態,則這個對象將永久性失去引用並且變成不可達狀態,系統才會真正的去回收該對象所占用的資源。
上述三種狀態的轉換圖如下:
2.Java對對象的4種引用
1)強引用 :創建一個對象並把這個對象直接賦給一個變量,eg :Person person = new Person("sunny"); 不管系統資源有麼的緊張,強引用的對象都絕對不會被回收,即使他以後不會再用到。
2)軟引用 :通過SoftReference類實現,eg : SoftReference<Person> p = new SoftReference<Person>(new Person("Rain"));,內存非常緊張的時候會被回收,其他時候不會被回收,所以在使用之前要判斷是否為null從而判斷他是否已經被回收了。
3)弱引用 :通過WeakReference類實現,eg : WeakReference<Person> p = new WeakReference<Person>(new Person("Rain"));不管內存是否足夠,系統垃圾回收時必定會回收。
4)虛引用 :不能單獨使用,主要是用於追蹤對象被垃圾回收的狀態。通過PhantomReference類和引用隊列ReferenceQueue類聯合使用實現,eg :
package test;
importJava.lang.ref.PhantomReference;
importJava.lang.ref.ReferenceQueue;
public classTest
{
public static voidmain(String[] args)
{
//創建一個對象
Person person = new Person("Sunny");
//創建一個引用隊列
ReferenceQueue<Person> rq = new ReferenceQueue<Person>();
//創建一個虛引用,讓此虛引用引用到person對象
PhantomReference<Person> pr = new PhantomReference<Person>(person, rq);
//切斷person引用變量和對象的引用
person = null;
//試圖取出虛引用所引用的對象
//發現程序並不能通過虛引用訪問被引用對象,所以此處輸出為null
System.out.println(pr.get());
//強制垃圾回收
System.gc();
System.runFinalization();
//因為一旦虛引用中的對象被回收後,該虛引用就會進入引用隊列中
//所以用隊列中最先進入隊列中引用與pr進行比較,輸出true
System.out.println(rq.poll() ==pr);
}
}
運行結果:
3.Java垃圾回收機制
其實Java垃圾回收主要做的是兩件事:1)內存回收 2)碎片整理
3.1垃圾回收算法
1)串行回收(只用一個CPU)和並行回收(多個CPU才有用):串行回收是不管系統有多少個CPU,始終只用一個CPU來執行垃圾回收操作,而並行回收就是把整個回收工作拆分成多個部分,每個部分由一個CPU負責,從而讓多個CPU並行回收。並行回收的執行效率很高,但復雜度增加,另外也有一些副作用,如內存隨便增加。
2)並發執行和應用程序停止 :應用程序停止(Stop-the-world)顧名思義,其垃圾回收方式在執行垃圾回收的同時會導致應用程序的暫停。並發執行的垃圾回收雖然不會導致應用程序的暫停,但由於並發執行垃圾需要解決和應用程序的執行沖突(應用程序可能在垃圾回收的過程修改對象),因此並發執行垃圾回收的系統開銷比Stop-the-world高,而且執行時需要更多的堆內存。
3)壓縮和不壓縮和復制 :
①支持壓縮的垃圾回收器(標記-壓縮 = 標記清除+壓縮)會把所有的可達對象搬遷到一起,然後將之前占用的內存全部回收,減少了內存碎片。
②不壓縮的垃圾回收器(標記-清除)要遍歷兩次,第一次先從跟開始訪問所有可達對象,並將他們標記為可達狀態,第二次便利整個內存區域,對未標記可達狀態的對象進行回收處理。這種回收方式不壓縮,不需要額外內存,但要兩次遍歷,會產生碎片
③復制式的垃圾回收器:將堆內存分成兩個相同空間,從根(類似於前面的有向圖起始頂點)開始訪問每一個關聯的可達對象,將空間A的全部可達對象復制到空間B,然後一次性回收空間A。對於該算法而言,因為只需訪問所有的可達對象,將所有的可達對象復制走之後就直接回收整個空間,完全不用理會不可達對象,所以遍歷空間的成本較小,但需要巨大的復制成本和較多的內存。
3.2堆內存的分代回收
1)分代回收的依據:
①對象生存時間的長短:大部分對象在Young期間就被回收
②不同代采取不同的垃圾回收策略:新(生存時間短)老(生存時間長)對象之間很少存在引用
2) 堆內存的分代:
①Young代 :
Ⅰ回收機制 :因為對象數量少,所以采用復制回收。
Ⅱ組成區域 :由1個Eden區和2個Survivor區構成,同一時間的兩個Survivor區,一個用來保存對象,另一個是空的;每次進行Young代垃圾回收的時候,就把Eden,From中的可達對象復制到To區域中,一些生存時間長的就復制到了老年代,接著清除Eden,From空間,最後原來的To空間變為From空間,原來的From空間變為To空間。
Ⅲ對象來源 :絕大多數對象先分配到Eden區,一些大的對象會直接被分配到Old代中。
Ⅳ回收頻率 :因為Young代對象大部分很快進入不可達狀態,因此回收頻率高且回收速度快
②Old代 :
Ⅰ回收機制 :采用標記壓縮算法回收。
Ⅱ對象來源 :1.對象大直接進入老年代。
2.Young代中生存時間長的可達對象
Ⅲ回收頻率 :因為很少對象會死掉,所以執行頻率不高,而且需要較長時間來完成。
③Permanent代 :
Ⅰ用 途 :用來裝載Class,方法等信息,默認為64M,不會被回收
Ⅱ對象來源 :eg:對於像Hibernate,Spring這類喜歡AOP動態生成類的框架,往往會生成大量的動態代理類,因此需要更多的Permanent代內存。所以我們經常在調試Hibernate,Spring的時候經常遇到Java.lang.OutOfMemoryError:PermGen space的錯誤,這就是Permanent代內存耗盡所導致的錯誤。
Ⅲ回收頻率 :不會被回收
3.3常見的垃圾回收器
1)串行回收器(只使用一個CPU):Young代采用串行復制算法;Old代使用串行標記壓縮算法(三個階段:標記mark—清除sweep—壓縮compact),回收期間程序會產生暫停,
2)並行回收器:對Young代采用的算法和串行回收器一樣,只是增加了多CPU並行處理; 對Old代的處理和串行回收器完全一樣,依舊是單線程。
3)並行壓縮回收器:對Young代處理采用與並行回收器完全一樣的算法;只是對Old代采用了不同的算法,其實就是劃分不同的區域,然後進行標記壓縮算法:
① 將Old代劃分成幾個固定區域;
② mark階段(多線程並行),標記可達對象;
③ summary階段(串行執行),從最左邊開始檢驗知道找到某個達到數值(可達對象密度小)的區域時,此區域及其右邊區域進行壓縮回收,其左端為密集區域
④ compact階段(多線程並行),識別出需要裝填的區域,多線程並行的把數據復制到這些區域中。經此過程後,Old代一端密集存在大量活動對象,另一端則存在大塊空間。
4)並發標識—清理回收(CMS):對Young代處理采用與並行回收器完全一樣的算法;只是對Old代采用了不同的算法,但歸根待地還是標記清理算法:
① 初始標識(程序暫停):標記被直接引用的對象(一級對象);
② 並發標識(程序運行):通過一級對象尋找其他可達對象;
③ 再標記(程序暫停):多線程並行的重新標記之前可能因為並發而漏掉的對象(簡單的說就是防遺漏)
④ 並發清理(程序運行)
4.內存管理小技巧
1)盡量使用直接量,eg:String JavaStr = "小學徒的成長歷程";
2)使用StringBuilder和StringBuffer進行字符串連接等操作;
3)盡早釋放無用對象;
4)盡量少使用靜態變量;
5)緩存常用的對象:可以使用開源的開源緩存實現,eg:OSCache,Ehcache;
6)盡量不使用finalize()方法;
7)在必要的時候可以考慮使用軟引用SoftReference