語言調用規范是指進行一次函數調用所采用的傳遞參數的方法,返回值的處理以及調 用堆棧的清理。Microsoft C/C++ 語言中采用了五種調用規范,分別是__cdecl, __stdcall, __fastcall,thiscall和nake每一中調用規范都是利用eax作為返回值,如果 函數返回值是64位的,則利用edx:eax對來返回值。Nake調用規范非常的靈活,足以獨立 的一篇文章描述,這裡就不再描述nake調用規范。下表列出了前面四種規范調用的特點:
關鍵字 堆棧清理者 參數傳遞順序 __cdecl 調用者 從右至左 __stdcall 被調用者 從右至左 __fastcall 被調用者 從右至左,前兩個參數由寄存器ecx,edx傳遞 thiscall 被調用者或者調用者 從右至左
__cdecl 最大好處在於由於是調用者清理棧,它可以處理可變參數,缺點則在於它增 加了程序的大小,因為在每個調用返回的時候,需要多執行一條清理棧的指令。
__stdcall 是在windows程序設計中出現的最多的調用規則,所有的不可變參數的API 調用都使用這個規則。
__fastcall 在windows內核設計中被廣泛的使用,由於兩個參數由寄存器直接傳遞, 采用這種規則的函數效率要比以上兩種規則高。
thiscall是C++成員函數的默認調用規范,編譯期間,這種調用會根據函數是否支持可 變參數表來決定采用什麼方式清理堆棧。如果成員函數不支持可變參數,那麼它就是用參 數入棧,ecx保存this指針的方式進行調用,如果成員函數支持可變參數,那麼它的調用 和__cdecl類似,唯一不同的是將this指針最後壓入棧中進行傳遞。
調用者和被調用者必須采用同樣的規則才能保證程序的正常執行,曾經看到很多程序 員犯的錯誤就是由於調用規范的不一樣,致使程序異常,比如:
DWORD ThreadFunc(LPVOID lpParam)
{
//…
}
CreateThread(..,(LPTHREAD_START_ROUTINE)ThreadFunc, …);
如果在編譯期間沒有指定編譯選項/Gz(指定未指明調用規范的函數采用__stdcall方 式),那麼編譯器自動將ThreadFunc處理成__cdecl調用規范(/Gd),這樣可能在線程開 始的時候正常執行,然而退出的時候由於堆棧沒有正常清理,造成訪問違例或者非法指令 錯誤。
以上說了很多清理棧的問題,那麼為什麼清理棧很重要呢。堆棧是線程相關的,也就 是說每一個線程含有一個堆棧,這個堆棧上保存了局部變量,調用返回地址等很多線程相 關的數據,這也是為什麼獨立運行的線程可以調用同樣一個函數而互不干擾的原因。堆棧 的特點恐怕大家已經非常熟悉了,那麼根據上面的每一種調用,我給出一個簡單的圖示來 說明清理堆棧的重要性,以及為什麼上面的例子代碼會出錯。
圖一 這是線程堆棧在運行的時候的樣子
調用前和後esp的差值中間包含了函數參數表,返回地址這樣的重要信息,舉個簡單的 調用例子.假設有某個函數定義是這樣的:
Int __cdecl func(void* p);
再假設esp調用函數前的數值為0x1234,那麼在進入這個函數體內看到的堆棧是這樣的 :
122C 1230 1234
Next p
這裡的next指調用函數後的下一條指令的位置。調用函數的匯編碼:
Push p
Call func
Add esp,4 《--注意這裡,由於是cdecl調用,需要調用者清棧。
而一個__stdcall調用的匯編碼:
Push p
Call func
這裡沒有了add esp,4這個指令,因為在func函數返回的時候自己將esp已經復原了。 再來看剛才舉的錯誤的例子,由於強制轉換的作用,線程開始函數被設置成了stdcall調 用,而實際的線程函數被編譯後,並沒有執行堆棧的清理工作,線程函數返回的時候,由 於堆棧的不正確,當然會發生錯誤。修改這個bug的方法只要在線程函數的定義前把 __cdecl改成_stdcall即可。
有了上面的例子做基礎來理解可變參數表就簡單的多了,由於各種調用規范的限定, 致使只有__cdecl調用規范可以采用可變參數表。先來看看可變參數表的定義(可以參考 sdk目錄下src\crt\varargs.h):
typedef char *va_list;
#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
#define va_dcl va_list va_alist;
#define va_start(ap) ap = (va_list)&va_alist
#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ap = (va_list)0
va_list居然被定義成char* ?沒錯,這實際是用來定義了一個指針,指針的sizeof() 就是操作系統可訪問的地址空間的大小,也就是CPU相關的字長。_INTSIZEOF宏很簡單, 就是用來將數據以n的數據大小對齊。va_start宏有點模糊,可是如果你看懂了上面的堆 棧數據結構,那麼顯然它就是獲得最後一個固定參數的地址,也就是堆棧上的地址, va_arg先使得ap指向下一個參數,然後取得當前參數的值(注意,這個值正是堆棧上的值 ),va_end使得取參數過程結束。
這幾個宏完成的動作很簡單了,實際就是取得可變參數表在堆棧上的起始位置,然後 根據參數類型,依次從堆棧上取出每一個參數。
本文簡單的介紹了微軟C/C++支持的調用類型,結合實例描述了規范的實際應用,最後 根據CRT提供的源代碼分析了可變參數表的實現。