在任何語言中,函數都是最基本的組成單元。對於php的函數,它具有哪些特點?函數調用是怎麼實現的?php函數的性能如何,有什麼使用建議?本文將從原理出發進行分析結合實際的性能測試嘗試對這些問題進行回答,在了解實現的同時更好的編寫php程序。同時也會對一些常見的php函數進行介紹。
在php中,橫向劃分的話,函數分為兩大類: user function(內置函數) 和internal function(內置函數)。前者就是用戶在程序中自定義的一些函數和方法,後者則是php本身提供的各類庫函數(比如sprintf、array_push等)。用戶也可以通過擴展的方法來編寫庫函數,這個將在後面介紹。對於user function,又可以細分為function(函數)和method(類方法),本文中將就這三種函數分別進行分析和測試。
一個php函數最終是如何執行,這個流程是怎麼樣的呢?
要回答這個問題,我們先來看看php代碼的執行所經過的流程。
從圖1可以看到,php實現了一個典型的動態語言執行過程:拿到一段代碼後,經過詞法解析、語法解析等階段後,源程序會被翻譯成一個個指令(opcodes),然後ZEND虛擬機順次執行這些指令完成操作。Php本身是用c實現的,因此最終調用的也都是c的函數,實際上,我們可以把php看做是一個c開發的軟件。
通過上面描述不難看出,php中函數的執行也是被翻譯成了opcodes來調用,每次函數調用實際上是執行了一條或多條指令。
對於每一個函數,zend都通過以下的數據結構來描述
typedef union _zend_function { zend_uchar type; /* MUST be the first element of this struct! */ struct { zend_uchar type; /* never used */ char *function_name; zend_class_entry *scope; zend_uint fn_flags; union _zend_function *prototype; zend_uint num_args; zend_uint required_num_args; zend_arg_info *arg_info; zend_bool pass_rest_by_reference; unsigned char return_reference; } common; zend_op_array op_array; zend_internal_function internal_function; } zend_function; typedef struct _zend_function_state { HashTable *function_symbol_table; zend_function *function; void *reserved[ZEND_MAX_RESERVED_RESOURCES]; } zend_function_state;
其中type標明了函數的類型:用戶函數、內置函數、重載函數。Common中包含函數的基本信息,包括函數名,參數信息,函數標志(普通函數、靜態方法、抽象方法)等內容。另外,對於用戶函數,還有一個函數符號表,記錄了內部變量等,這個將在後面詳述。 Zend維護了一個全局function_table,這是一個大的hahs表。函數調用的時候會首先根據函數名從表中找到對應的zend_function。當進行函數調用時候,虛擬機會根據type的不同決定調用方法, 不同類型的函數,其執行原理是不相同的 。
內置函數,其本質上就是真正的c函數,每一個內置函數,php在最終編譯後都會展開成為一個名叫zif_xxxx的function,比如我們常見的sprintf,對應到底層就是zif_sprintf。Zend在執行的時候,如果發現是內置函數,則只是簡單的做一個轉發操作。
Zend提供了一系列的api供調用,包括參數獲取、數組操作、內存分配等。內置函數的參數獲取,通過zend_parse_parameters方法來實現,對於數組、字符串等參數,zend實現的是淺拷貝,因此這個效率是很高的。可以這樣說,對於php內置函數,其效率和相應c函數幾乎相同,唯一多了一次轉發調用。
內置函數在php中都是通過so的方式進行動態加載,用戶也可以根據需要自己編寫相應的so,也就是我們常說的擴展。ZEND提供了一系列的api供擴展使用
和內置函數相比,用戶通過php實現的自定義函數具有完全不同的執行過程和實現原理。如前文所述,我們知道php代碼是被翻譯成為了一條條opcode來執行的,用戶函數也不例外,實際中每個函數對應到一組opcode,這組指令被保存在zend_function中。於是,用戶函數的調用最終就是對應到一組opcodes的執行。
對於棧的維護,zend在這裡做了優化。預先分配一個長度為N的靜態數組來模擬堆棧,這種通過靜態數組來模擬動態數據結構的手法在我們自己的程序中也經常有使用,這種方式避免了每次調用帶來的內存分配、銷毀。ZEND只是在函數調用結束時將當前棧頂的符號表數據clean掉即可。
因為靜態數組長度為N,一旦函數調用層次超過N,程序不會出現棧溢出,這種情況下zend就會進行符號表的分配、銷毀,因此會導致性能下降很多。在zend裡面,N目前取值是32。因此,我們編寫php程序的時候,函數調用層次最好不要超過32。當然,如果是web應用,本身可以函數調用層次的深度。
類方法其執行原理和用戶函數是相同的,也是翻譯成opcodes順次調用。類的實現,zend用一個數據結構zend_class_entry來實現,裡面保存了類相關的一些基本信息。這個entry是在php編譯的時候就已經處理完成。
在zend_function的common中,有一個成員叫做scope,其指向的就是當前方法對應類的zend_class_entry。關於php中面向對象的實現,這裡就不在做更詳細的介紹,今後將專門寫一篇文章來詳述php中面向對象的實現原理。就函數這一塊來說,method實現原理和function完全相同,理論上其性能也差不多,後面我們將做詳細的性能對比。
雖然函數名長度對性能有一定影響,但具體有多大呢?這個問題應該還是需要結合實際情況來考慮,如果一個函數本身比較復雜的話,那麼對整體的性能影響並不大。
一個建議是對於那些會調用很多次,本身功能又比較簡單的函數,可以適當取一些言簡意赅的名字。