在對函數進行調試過程中,電腦沒有辦法知道一個函數調用需要多少個、什麼樣的參數,也沒有硬件可以保存這些參數,所以這大大的提高了對函數調用的准缺無誤性。
也就是說,計算機不知道怎麼給這個函數傳遞參數,傳遞參數的工作必須由函數調用者和函數本身來協調。為此,計算機提供了一種被稱為棧的數據結構來支持參數傳遞。棧是一種先進後出的數據結構,棧有一個存儲區、一個棧頂指針。棧頂指針指向堆棧中第一個可用的數據項被稱為棧頂)。用戶可以在棧頂上方向棧中加入數據,這個操作被稱為壓棧(Push)。
壓棧以後,棧頂自動變成新加入數據項的位置,棧頂指針也隨之修改。用戶也可以從堆棧中取走棧頂,稱為彈出棧(pop),彈出棧後,棧頂下的一個元素變成棧頂,棧頂指針隨之修改。
函數調用時,調用者依次把參數壓棧,然後調用函數,函數被調用以後,在堆棧中取得數據,並進行計算。函數計算結束以後,或者調用者、或者函數本身修改堆棧,使堆棧恢復原裝。
在參數傳遞中,有兩個很重要的問題必須得到明確說明: 當參數個數多於一個時,按照什麼順序把參數壓入堆棧 函數調用後,由誰來把堆棧恢復原裝在高級語言中,通過函數調用約定來說明這兩個問題。常見的調用約定有:
◆stdcall
◆cdecl
◆fastcall
◆thiscall
◆naked call
stdcall調用約定
stdcall很多時候被稱為pascal調用約定,因為pascal是早期很常見的一種教學用計算機程序設計語言,其語法嚴謹,使用的函數調用約定就是stdcall。在Microsoft C++系列的C/C++編譯器中,常常用PASCAL宏來聲明這個調用約定,類似的宏還有WINAPI和CALLBACK。
stdcall的調用約定意味著:1)參數從右向左壓入堆棧,2)函數自身修改堆棧 3)函數名自動加前導的下劃線,後面緊跟一個@符號,其後緊跟著參數的尺寸以上述這個函數為例,參數b首先被壓棧,然後是參數a,函數調用function(1,2)調用處翻譯成匯編語言將變成:
push ebp 保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出時恢復mov ebp,esp 保存堆棧指針mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向aadd eax,[ebp + 0CH] 堆棧中ebp + 12處保存了bmov esp,ebp 恢復esppop ebpret 8
注意不同編譯器會插入自己的匯編代碼以提供編譯的通用性,但是大體代碼如此。其中在函數開始處保留esp到ebp中,在函數結束恢復是編譯器常用的方法。從函數調用看,2和1依次被push進堆棧,而在函數中又通過相對於ebp(即剛進函數時的堆棧指針)的偏移量存取參數。函數結束後,ret 8表示清理8個字節的堆棧,函數自己恢復了堆棧。
cdecl調用約定
cdecl調用約定又稱為C調用約定,是C語言缺省的調用約定,它的定義語法是: int function (int a ,int b) //不加修飾就是C調用約定int __cdecl function(int a,int b)//明確指出C調用約定
在寫本文時,出乎我的意料,發現cdecl調用約定的參數壓棧順序是和stdcall是一樣的,參數首先由有向左壓入堆棧。所不同的是,函數本身不清理堆棧,調用者負責清理堆棧。由於這種變化,C調用約定允許函數的參數的個數是不固定的,這也是C語言的一大特色。對於前面的function函數,使用cdecl後的匯編碼變成:
調用處push 1push 2call functionadd esp,8 注意:這裡調用者在恢復堆棧被調用函數_function處push ebp 保存ebp寄存器,該寄存器將用來保存堆棧的棧頂指針,可以在函數退出時恢復mov ebp,esp 。
保存堆棧指針mov eax,[ebp + 8H] 堆棧中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向aadd eax,[ebp + 0CH] 堆棧中ebp + 12處保存了bmov esp,ebp 恢復esppop ebpret 注意,這裡沒有修改堆棧MSDN中說,該修飾自動在函數調用名前加前導的下劃線,因此函數名在符號表中被記錄為_function,但是我在編譯時似乎沒有看到這種變化。