本文介紹 C/C 編寫可移植程序的12要點:
1.分層設計,隔離平台相關的代碼。就像可測試性一樣,可移植性也要從設計抓起。一般來說,最上層和最下層都不具有良好的可移植性。最上層是 GUI,大多數GUI都不是跨平台的,如Win32 SDK和MFC。最下層是操作系統API,大多部分操作系統API都是專用的。
如果這兩層的代碼散布在整個軟件中,那麼這個軟件的可植性將非常的差,這是不言自明的。那麼如何避免這種情況呢?當然是分層設計了:
最底層采用Adapter模式,把不同操作系統的API封裝成一套統一的接口。至於封裝成類還是封裝成函數,要看你采用的C還是C 寫的程 序了。這看起來很簡單,其實不盡然(看完整篇文章後你會明白的),它將耗去你大量的時間去編寫代碼,去測試它們。采用現存的程序庫,是明智的做法,有很多 這樣的庫,比如,C庫有glib(GNOME的基礎類),C 庫有ACE(ADAPTIVE Communication Environment)等 等,在開發第一個平台時就采用這些庫,可以大大減少移植的工作量。
最上層采用MVC模型,分離界面表現與內部邏輯代碼。把大部分代碼放到內部邏輯裡面,界面僅僅是顯示和接收輸入,即使要換一套GUI,工作量 也不大。這同時也是提高可測試性的手段之一,當然還有其它一些附加好處。所以即使你采用QT或者GTK 等跨平台的GUI設計軟件界面,分離界面表現與內 部邏輯也是非常有用的。
若做到了以上兩點,程序的可移植性基本上有保障了,其它的只是技術細節問題。
2.事先熟悉各目標平台,合理抽象底層功能。這一點是建立在分層設計之上的,大多數底層函數,像線程、同步機制和IPC機制等等,不同平台提 供的函數,幾乎是一一對應的,封裝這些函數很簡單,實現Adapter的工作幾乎只是體力活。然而,對於一些比較特殊的應用,如圖形組件本身,就拿GTK 來說吧,基於X Window的功能和基於Win32的功能,兩者差巨大,除了窗口、事件等基本概念外,幾乎沒有什麼相同的,如果不事先了解各個平台 的特性,在設計時就精心考慮的話,抽象出來的抽口在另外一個平台幾乎無法實現。
3.盡量使用標准C/C 函數。大多數平台都會實現POSIX (Portable Operating System Interface)規定的函數,但這些函數較原生(Native) 函數來說,性能上的表現可 能較次一些,用起來也不如原生函數方便。但是,最好不要貪圖這種便宜而使用原生函數函數,否則搬起的石頭最終會軋到自己的腳。比如,文件操作就用 fopen之類的函數,而不要用CreateFile之類的函數等。
4.盡量不要使用C/C 新標准裡出現的特性。並不是所有的編譯器都支持這些特性,像VC就不支持C99裡面要求的可變參數的宏,VC對一些模板特性的支持也不全面。為了安全起見,這方面不要太激進了。
5.盡量不要使用C/C 標准裡沒有明確規定的特性。比如你有多個動態庫,每個動態庫都有全局對象,而且這些全局對象的構造還有依賴關系, 那你遲早會遇到麻煩的,這些全局對象構造的先後順序在標准裡是沒有規定的。在一個平台上運行正確,在另外一個平台上可能莫明其妙的死機,最終還是要對程序 作大量修改.
6.盡量不要使用准標准函數。有些函數大多數平台上都有,它們使用得太廣泛了,以至於大家都把它們當成標准了,比如atoi(把字符串轉換成整數)、 strdup(克隆字符串)、alloca(在棧分配自動內存)等等。不怕一萬,就怕萬一,除非明白你在做什麼,否則還是別碰它們為好。
7.注意標准函數的細節。也許你不相信,即使是標准函數,拋開內部實現不論,就其外在表現的差異也有時令人驚訝。這裡略舉幾個例子:
int accept(int s, struct sockaddr *addr, socklen_t *addrlen); addr/ addrlen本來是輸出參數,如果是C 程序員,不管怎麼樣,你已經習慣於初始化所有的變量,不會有問題。如果是C程序員,就難說了,若 沒有初始化它們,程序可能莫名其妙的crash,而你做夢也懷疑不到它頭它。這在Win32下沒問題,在Linux下才會出現。
int snprintf(char *str, size_t size, const char *format, ……);第二個參數size,在Win32下不包括空字符在內,在Linux下包括空字符,這一個字符的差異,也可能讓你耗上幾個小時。
int stat(const char *file_name, struct stat *buf);這個函數本身沒有問題,問題出在結 構stat上,st_ctime在Win32下代表創建(create)時間,在Linux下代表最後修改 (change)時間。
FILE *fopen(const char *path, const char *mode);在讀取二進制文件,沒有什麼問題。在讀取文本文件可要小心,Win32下自動預處理,讀出來的內容與文件實際都長度不一樣,在Linux則沒有問題。
8.小心數據標准數據類型。不少人已經吃過int類型由16位轉變成32位帶來的苦頭,這已經是陳年往事了,這裡且不談。你可知道char在 有的系統上是有符號的,在有的系統是無符號的嗎?你可知道wchar_t在Win32下是16位的,在Linux 下是32位的嗎?你可知道有符號的 1bit的位域,取值是0和-1而不是0和1嗎?這些貌合神離的東東,端的是神出鬼沒,一不小心著了它的道。
9.最好不要使用平台獨有的特性。比如Win32下DLL可以提供一個DllMain函數,在特定的時間,操作系統的Loader會自動調用這個函數。這類功能很好用,但最好不要用,目標平台可不能保證有這種功能。
10.最好不要使用編譯器特有的特性。現代的編譯器都做很人性化,考慮得很周到,一些功能用起非常方便。像在VC裡,你要實現線程局部存儲, 你都不調用TlsGetValue /Tls TlsSetValue之類的函數,在變量前加一個__declspec( thread )就行了,然而 盡管在pthread裡有類似的功能,卻不能按這種方式實現,所以無法移植到Linux下。同樣gcc也有很多擴展,是在VC或者其它編譯器裡所沒有的。
11.注意平台的特性。比如:
在Win32下的DLL裡面,除非明確指明為export的函數外,其它函數對外都是不可見的。而在Linux下,所有的非static的全局變量和函數,對外全部是可見的。這要特別小心,同名函數引起的問題,讓你查上兩天也不為過。
目錄分隔符,在Win32下用‘\’,在Linux下用‘/’。
文本文件換行符,在Win32下用‘ ’,在Linux下用‘ ’,在MacOS下用‘ ’。
字節順序(大端/小端),不同硬件平台的字節順序可能不一樣。
字節對齊,在有的平台(如x86)上,字節不對齊,無非速度慢一點,而有的平台(如arm)上,它完全用錯誤的方式去讀取數據,而且不會給你一點提示。若出問題,可能讓你一點頭緒都沒有。
12.最好清楚不同平台的資源限制。想必你還記得DOS下同時打開的文件個數限制在幾十個的情形吧,如今操作系統的功能已經強大多了,但是並 非沒有限制。比如Linux下的共享內存默認的最大值是4M。若你對目標平台常見的資源限制了然於胸,可能有很大的幫助,一些問題很容易定位。