程式師世界 >> 編程語言 >> .NET網頁編程 >> C# >> C#入門知識 >> .Net垃圾收集機制—了解算法與代齡，.net垃圾收集

.Net垃圾收集機制—了解算法與代齡，.net垃圾收集

編輯：C#入門知識

.Net垃圾收集機制—了解算法與代齡，.net垃圾收集

垃圾收集器在本質上就是負責跟蹤所有對象被引用到的地方，關注對象不再被引用的情況，回收相應的內存。在.NET平台中同樣如此，有效的提高.NET垃圾回收性能，能夠提高程序執行效率。

　　其實垃圾收集並不是伴隨Java出現的，早在1958年，圖林獎得主John發明的Lisp語言就已經提供了GC的功能，這是GC的第一次出現，是思想的一次閃光！而後，1984年Dave Ungar發明的Small talk語言第一次正式采用了GC機制。.Net的垃圾回收機制是個很大的話題，如果你沒接觸過類似C++那樣的語言，就很難理解GC是一個多麼重要、令人興奮的東西：

　　1.提高軟件系統的內聚。

　　2.降低編程復雜度，使程序員不必分散精力去處理析構。

　　3.不妨礙設計師進行系統抽象。

　　4.減少由於內存運用不當產生的Bug。

　　5.成功的將內存管理工作從程序的編寫時，脫離至運行時，使不可預估的管理漏洞變為可預估的。

　　1.算法

　　垃圾收集器的本質,就是跟蹤所有被引用到的對象，整理對象不再被引用的對象，回收相應的內存。這聽起來類似於一種叫做“引用計數(Reference Counting)”的算法，然而這種算法需要遍歷所有對象，並維護它們的引用情況，所以效率較低些，並且在出現“環引用”時很容易造成內存洩露。所以.Net中采用了一種叫做“標記與清除(Mark Sweep)”算法來完成上述任務。“標記與清除”算法，顧名思義，這種算法有兩個本領：

　　“標記”本領——垃圾的識別：從應用程序的root出發，利用相互引用關系，遍歷其在Heap上動態分配的所有對象，沒有被引用的對象不被標記，即成為垃圾；存活的對象被標記，即維護成了一張“根-對象可達圖”。其實，CLR會把對象關系看做“樹圖”，無疑，了解數據結構的同學都知道，有了“樹圖”的概念，會加快遍歷對象的速度。　　檢測、標記對象引用，是一件很有意思的事情，有很多方法可以做到，但是只有一種是效率最優的，.Net中是利用棧來完成的，在不斷的入棧與出棧中完成檢測：先在樹圖中選擇一個需要檢測的對象，將該對象的所有引用壓棧，如此反復直到棧變空為止。棧變空意味著已經遍歷了這個局部根(或者說是樹圖中的節點)能夠到達的所有對象。樹圖節點范圍包括局部變量(實際上局部變量會很快被回收，因為它的作用域很明顯、很好控制)、寄存器、靜態變量，這些元素都要重復這個操作。一旦完成，便逐個對象地檢查內存，沒有標記的對象變成了垃圾。

　　“清除”本領——回收內存：啟用Compact算法，對內存中存活的對象進行移動，修改它們的指針，使之在內存中連續，這樣空閒的內存也就連續了，這就解決了內存碎片問題，當再次為新對象分配內存時，CLR不必在充滿碎片的內存中尋找適合新對象的內存空間，所以分配速度會大大提高。

　　但是大對象（large object heap）除外，GC不會移動一個內存中巨無霸，因為它知道現在的CPU不便宜。通常，大對象具有很長的生存期，當一個大對象在.NET托管堆中產生時，它被分配在堆的一個特殊部分中，移動大對象所帶來的開銷超過了整理這部分堆所能提高的性能。

　　Compact算法除了會提高再次分配內存的速度，如果新分配的對象在堆中位置很緊湊的話，高速緩存的性能將會得到提高，因為一起分配的對象經常被一起使用(程序的局部性原理)，所以為程序提供一段連續空白的內存空間是很重要的。

　　2.代齡(Generation) 　

　代齡就是對Heap中的對象按照存在時間長短進行分代，最短的分在第0代，最長的分在第2代，第2代中的對象往往是比較大的。Generation的層級與FrameWork版本有關，可以通過調用GC.MaxGeneration得知。　　通常，GC會優先收集那些最近分配的對象(第0代)，這與操作系統經典內存換頁算法“最近最少使用”算法如出一轍。但是，這並不代表GC只收集最近分配的對象，通常，.Net GC將堆空間按對象的生存期長短分成3代：新分配的對象在第0代(0代空間最大長度通常為256K)，按地址順序分配，它們通常是一些局部變量；第1代(1代空間最大長度通常為2 MB)是經過0代垃圾收集後仍然駐留在內存中的對象，它們通常是一些如表單，按鈕等對象；第2代是經歷過幾次垃圾收集後仍然駐留在內存中的對象，它們通常是一些應用程序對象。

　　當內存吃緊時(例如0代對象充滿)，GC便被調入執行引擎--也就是CLR--開始對第0代的空間進行標記與壓縮工作、回收工作，這通常小於1毫秒。如果回收後內存依然吃緊，那麼GC會繼續回收第1代(回收操作通常小於10毫秒)、第2代，當然GC有時並不是按照第0、1、2代的順序收集垃圾的，這取決於運行時的情況，或是手動調用GC.Collect(i)指定回收的代。當對第2代回收後任然無法獲得足夠的內存，那麼系統就會拋出OutOfMemoryException異常，當經過幾次GC過後，0代中的某個對象仍然存在，那麼它將被移動到第1代。同理，第1、2代也按同樣的邏輯運行。　　這裡還要說的是，GC Heap中代的數量與容量，都是可變的(這由一個“策略引擎”控制，在第二節中，會介紹到“策略引擎”)，以下代碼結合Windbg可以說明這個問題，以下代碼中，可以通過單擊按鈕“button1”，不斷的分配內存，而後獲得對象“a”的代齡情況，並且在Form加載時也會獲得“a”的代齡。　　1.public partial class Form

1 : Form

　　2.{

　　3. private string a = new string(a,1);

　　4. public Form1()

　　5. {

　　6. InitializeComponent();

　　7. }

　　8. private void button1_Click(object sender, EventArgs e)

　　9. {

　　10. a = new string(a, 900000);

　　11. label1.Text = GC.GetGeneration(a).ToString();

　　12. }