你寫了一個PHP腳本,一般都不用考慮內存洩露和垃圾回收的問題,因為一般情況下你的腳本很快就執行完退出了。
但在一些運行時間長,數據量大的時候,程序運行一段時間後,php腳本就占用了過多內存,然後就報錯(PHP Fatal error: Allowed memory size of 134217728 bytes exhausted)退出了。一般來說,每個頁面處理結束,新建的simple_html_dom對象就應該被銷毀了——但是實際上沒有,很明顯,內存洩露發生了。
PHP的垃圾回收機制
PHP5.3之前使用的垃圾回收機制是單純的“引用計數”,也就是每個內存對象都分配一個計數器,當內存對象被變量引用時,計數器+1;當變量引用撤掉後,計數器-1;當計數器=0時,表明內存對象沒有被使用,該內存對象則進行銷毀,垃圾回收完成。
“引用計數”存在問題,就是當兩個或多個對象互相引用形成環狀後,內存對象的計數器則不會消減為0;這時候,這一組內存對象已經沒用了,但是不能回收,從而導致內存洩露。
PHP5.3開始,使用了新的垃圾回收機制,在引用計數基礎上,實現了一種復雜的算法,來檢測內存對象中引用環的存在,以避免內存洩露。
查看內存是否洩露
看是否有該釋放的內存沒有被釋放,可以簡單的通過 調用 memory_get_usage 函數查看內存使用情況來判斷;memory_get_usage 函數返回的內存使用數據據說不是很准確,可以使用 php 的 xdebug 擴展來獲得更准確翔實的內存使用情況。
class A{ private $b; function __construct(){ $this->b = new B($this); } function __destruct(){ //echo "A destruct\n"; } } class B{ private $a; function __construct($a){ $this->a = $a; } function __destruct(){ //echo "B descturct\n"; } } for($i=0;;$i++){ $a = new A(); if($i00 == 0){ echo memory_get_usage()."\n"; } }
上面就構造了一個會產生環狀引用的例子。每次創建一個A對象的實例a,a就創建一個B對象的實例b,同時讓b引用a。這樣,每個A對象永遠被一個B引用,而每個B對象同時被一個對象A引用,引用環就這樣產生了。
在PHP5.2的環境下執行這段代碼,會發現內存使用在單調上漲,也沒有A和B的析構函數被執行後輸出的“A/B desctruct”信息;直到內存耗盡,輸出“PHP Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 40 bytes)”。
在PHP5.3的環境下執行這段代碼,則發現內存使用在上跳下竄,但是永遠沒有超過一個限額。程序也會輸出大量的“A/B desctruct”,這說明析構函數被調用了。
我的同事的程序中,就存在這種引用的環路,而他的腳本,實在php5.2.3下執行的。simple_html_dom工具中,有兩個類,分別是simple_html_dom和simple_html_dom_node,前者中有一個數組成員變量nodes,數組中每個元素都是一個simple_html_dom_node對象;而每個simple_html_dom_node對象都有一個成員變量dom,該dom的值就是前面的simple_html_dom對象——這樣就形成了一個漂亮的引用環,導致了內存洩露。解決的辦法也很簡單,就是simple_html_dom對象在使用完畢時,主動調用其clear函數,清空其成員變量nodes,環就被打破了,內存洩露也就不會發生了。
其他
1. 垃圾回收的時機
PHP中,引用計數為0,則內存立刻釋放。也就是說,不存在環狀引用的變量,離開變量的作用域,內存被立刻釋放。環狀引用檢測則是在滿足一定條件下觸發,所以在上面的例子中,會看到使用的內存有大幅度的波動。也可以通過 gc_collect_cycles 函數來主動進行環狀引用檢測。
2. &符號的影響
顯式引用一個變量,會增加該內存的引用計數:
$a = "something"; $b = &$a;
此時unset($a), 但是仍有$b指向該內存區域的引用,內存不會釋放。
3. unset函數的影響
unset只是斷開一個變量到一塊內存區域的連接,同時將該內存區域的引用計數-1;在上面的例子中,循環體內部,$a=new A(); unset($a);並不會將$a的引用計數減到零;
4. = null 操作的影響
$a = null 是直接將$a 指向的數據結構置空,同時將其引用計數歸0。
5. 腳本執行結束的影響
腳本執行結束,該腳本中使用的所有內存都會被釋放,不論是否有引用環。