城裡的人想出去,城外的人想進來。這是《圍城》裡的一句話,它可能比《圍城》本身更加有名。我想這句話的前提是,要麼住在城裡,要麼住在城外,二者只能居其一。否則想住在城裡就可以住在城裡,想住在城外就可以住在城外,你大可以選擇單日住在城裡,雙日住在城外,也就沒有心思去想出去還是進來了。
理想情況是即可以住在城裡又可以住在城外,而不是走向極端。盡管像青蛙一樣的兩棲動物絕不會比人類更高級,但能適應於更多環境的能力畢竟有它的優勢。技術也是如此,共享內存和線程局部存儲就是實例,它們是為了防止走向內存完全隔離和完全共享兩個極端的產物。
當我們發明了MMU時,大家認為天下太平了,各個進程空間獨立,互不影響,程序的穩定性將大提高。但馬上又認識到,進程完全隔離也不行,因為各個進程之間需要信息共享。於是就搞出一種稱為共享內存的東西。
當我們發明了線程的時,大家認為這下可爽了,線程可以並發執行,創建和切換的開銷相對進程來說小多了。線程之間的內存是共享的,線程間通信快捷又方便。但馬上又認識到,有些信息還是不共享為好,應該讓各個線程保留一點隱私。於是就搞出一個線程局部存儲的玩意兒。
共享內存和線程局部存儲是兩個重要又不常用的東西,平時很少用,但有時候又離不了它們。本文介紹將兩者的概念、原理和使用方法,把它們放在自己的工具箱裡,以供不時之需。
1. 共享內存
大家都知道進程空間是獨立的,它們之間互不影響。比如同是0xabcd1234地址的內存,在不同的進程中,它們的數據是不同的,沒有關系的。這樣做的好處很多:每個進程的地址空間變大了,它們獨占4G(32位)的地址空間,讓編程實現更容易。各個進程空間獨立,一個進程死掉了,不會影響其它進程,提高了系統的穩定性。
要做到進程空間獨立,光靠軟件是難以實現的,通常要依賴於硬件的幫助。這種硬件通常稱為MMU(Memory Manage Unit),即所謂的內存管理單元。在這種體系結構下,內存分為物理內存和虛擬內存兩種。物理內存就是實際的內存,你機器上裝了多大內存就有多大內存。而應用程序中使用的是虛擬內存,訪問內存數據時,由MMU根據頁表把虛擬內存地址轉換對應的物理內存地址。
MMU把各個進程的虛擬內存映射到不同的物理內存上,這樣就保證了進程的虛擬內存是獨立的。然而,物理內存往往遠遠少於各個進程的虛擬內存的總和。怎麼辦呢,通常的辦法是把暫時不用的內存寫到磁盤上去,要用的時候再加載回內存中來。一般會搞一個專門的分區保存內存數據,這就是所謂的交換分區。
這些工作由內核配合MMU硬件完成,內存管理是操作系統內核的重要功能。其中為了優化性能,使用了不少高級技術,所以內存管理通常比較復雜。比如:在決定把什麼數據換出到磁盤上時,采用最近最少使用的策略,把常用的內存數據放在物理內存中,把不常用的寫到磁盤上,這種策略的假設是最近最少使用的內存在將來也很少使用。在創建進程時使用COW(Copy on Write)的技術,大大減少了內存數據的復制。為了提高從虛擬地址到物理地址的轉換速度,硬件通常采用TLB技術,把剛轉換的地址存在cache裡,下次可以直接使用。
從虛擬內存到物理內存的映射並不是一個字節一個字節映射的,而是以一個稱為頁(page)最小單位的為基礎的,頁的大小視硬件平台而定,通常是4K。當應用程序訪問的內存所在頁面不在物理內存中時,MMU產生一個缺頁中斷,並掛起當前進程,缺頁中斷負責把相應的數據從磁盤讀入內存中,再喚醒掛起的進程。
進程的虛擬內存與物理內存映射關系如下圖所示(灰色頁為被不在物理內存中的頁):
也許我們很少直接使用共享內存,實際上除非性能上有特殊要求,我更願意采用socket或者管道作為進程間通信的方式。但我們常常間接的使用共享內存,大家都知道共享庫(或稱為動態庫)的優點是,多個應用程序可以公用。如果每個應用程序都加載一份共享庫到內存中,顯然太浪費了。所以操作系統把共享庫放在共享內存中,讓多個應用程序共享。另外,同一個應用程序運行多個實例時,也采用同樣的方式,保證內存中只有一份可執行代碼。這樣的共享內存是設為只讀屬性的,防止應用程序無意中破壞它們。當調試器要設置斷點時,相應的頁面被拷貝一分,設置為可寫的,再向其中寫入斷點指令。這些事情完全由操作系統等底層軟件處理了,應用程序本身無需關心。
共享內存是怎麼實現的呢?我們來看看下圖(黃色頁為共享內存):