引用計數指針是否能有效地回收,對意外關機之後數據的恢復來說至關重要,關鍵是要避免對象復制。
怎樣從災難性故障中,恢復一個長期運行、系統級的後台守護進程或者服務,在如今的軟件設計過程中,已成為了一個重要的考慮因素。當這些軟件是由C++語言編成,並使用了引用計數的智能指針時,那麼,智能指針的有效回收,對系統是否具有可伸縮級的恢復能力、甚至正確地繼續未完成的操作來說,都顯得至關重要。
在本文中,描述了一種方法,可從關機之後的軟件恢復中,有效地回收引用計數指針,而且此方法在內存占用方面也非常高效,這種方法的關鍵在於避免對象復制,而對象復制通常是由C++中指針引用的串行化與反串行化這種傳統技術產生的。當從存檔文件中反串行化時,本方法使用了標記(tag)來唯一地識別指針對象,且在恢復時由一個對象緩存來保存指針引用。
本文以一個基於事件的商業實時作業調度系統來進行演示,其通常由大型市場咨詢公司使用,每天都會在集群工作站上處理數不勝數的計算任務。
為什麼許多C++軟件項目會使用自動內存管理技術呢,因為它有以下好處:
² 代碼安全性。避免了太早釋放一個對象所帶來的風險。
² 代碼正確性。避免了忘記釋放未使用內存所帶來的風險。
² 代碼模塊性。代碼中不再需要點綴著與程序無關的簿記代碼。
² 編程簡單性。現在可假定一種無限內存的計算模式。
² 編程高效性。程序員不再擔心內存管理問題。
引用計數智能指針,有時也稱為“計數體術語”,是一種生命期受管的對象,其對引用它的數量,有一個內部的計數器。當內部引用計數為零時,這些對象會自動銷毀自身,這是一種非常有用的技術,已運用在許多C++軟件產品項目中,因為簡單易行,且無需對語言或編譯器進行任何擴展。
引用計數智能指針能進一步定義為一體式或分離式,一體式智能指針把引用計數放在自身內,而分離式智能指針則把引用計數放在對象之外。在本文中,使用的是分離式智能指針方案,這需要在訪問實際對象指針之前,在智能指針模板對象中重載 -> 或 * 操作符,從本質上來說,這也是代理(Proxy)設計模式的一個特例。
就目前來說,還沒有一種方案以高效利用內存的方式描述了怎樣恢復智能指針,而傳統的C++對象串行與反串行化方法,會導致內存低效,因為當一個反串行化的對象遇到一個對它的引用時,總是會創建一個新對象,在最壞的情況下,這會把一個恢復後的守護進程的內存消耗量,推到一個無法接受的高度,致使它無法繼續運行下去。
問題的引出
傳統對象的串行與反串行化方案,也能實現智能指針,只不過在內存上比較低效而已。在這些傳統方案中,當一個對象串行化時,對象內的成員指針被解引用,它的內容與對象一起“串行”進存檔文件中。這種方法的問題在於,當反串行化時,成員指針會再次構造,且是每個恢復的對象都會這樣。
下面以基於事件的作業調度系統來進行講解,作業定義在CJobDef對象中,其包含了作業的靜態屬性,如它執行的命令、工作目錄、及作業執行時的用戶ID。而作業定義的運行實例則包裝在CJobInst對象中,其包含了一些與實例有關的屬性,如它的進程ID、執行參數、及運行歷史記錄。在類層次上,每個CJobInst對象都包含了一個成員,其引用到觸發這次作業實例的原始CJobDef對象。
圖1是軟件停止運行之前的系統,運行時CJobInst對象的多個實例可能會引用至同一個CJobDef對象。在軟件停止及恢復後,傳統串行化對象恢復方法,會導致為每個運行的CJobInst對象,都創建一個CJobDef對象,如圖2中所示。
圖1:恢復之前的對象圖
圖2:內存低效恢復之後的對象圖