Lua是一門小巧精致的語言,特別適用於嵌入其它的程序為它們提供腳本支持。不過腳本通常是用戶編寫的,很有可能出現死循環,雖說這是用戶的問題,但卻會造成我們的宿主程序死掉。所以檢測用戶腳本中的死循環並中止這段腳本的運行就顯得非常重要了。
可是,一個現實的問題是死循環並不好檢測,一些隱藏較深的死循環連人都很難找出來,更不用說讓機器去找了。所以實際采用的方案多是檢測腳本的執行時間,如果超過一定的限度,就認為裡面有死循環,我下面的例子也是用的這種方法。
以下是幾個相關的全局變量(我是喜歡把C++當C用的程序員,C++的忠實粉絲請忍耐一下:))的定義。
1 lua_State* g_lua = NULL; // lua腳本引擎
2 volatile unsigned g_begin = 0; // 腳本開始執行的時間
3 volatile long g_counter = 0; // 腳本執行計數, 用於判斷執行超時
4 long g_check = 0; // 進行超時檢查時的執行計數
run_user_script用來執行用戶腳本,它首先通過GetTickCount把當前的時間記錄到g_begin中去。然後將g_counter加一,在執行完用戶腳本後再將其加一,這樣就可以保證執行用戶腳本時它是個奇數,而不執行時是偶數,檢測腳本超時的代碼可以籍此來判斷當前是否在執行用戶腳本。還要注意調用用戶腳本要使用lua_pcall而不是lua_call,因為我們中止腳本的執行會產生一個Lua中的“錯誤”,在C/C++中它是一個異常,只有用lua_pcall才能保證這個錯誤被Lua腳本引擎正確處理。
1 int run_user_script( int nargs, int nresults, int errfunc )
2 {
3 g_begin = GetTickCount();
4 _InterlockedIncrement( &g_counter );
5 int err = lua_pcall( g_lua, nargs, nresults, errfunc );
6 _InterlockedIncrement( &g_counter );
7 return err;
8 }
下面的check_script_timeout用來檢測腳本超時,需要在另外一個線程中周期性的調用,原因我想就不用解釋了吧。它首先把當前的腳本計數記錄到g_check中,然後看是否在執行用戶腳本,沒有就直接返回,有的話就看一下這段腳本執行了多長時間,超過限度就通過lua_sethook設置一個鉤子函數timeout_break。這個鉤子函數會在用戶腳本執行時被調用。
1 void check_script_timeout()
2 {
3 g_check = g_counter;
4
5 // 沒有執行用戶腳本, 不檢查超時
6 if( (g_check & 0x00000001) == 0 )
7 return;
8
9 // 如果執行時間超過了設置的超時時間(這裡是1秒), 終止它
10 if( GetTickCount() - g_begin > 1000 )
11 {
12 int mask = LUA_MASKCALL | LUA_MASKRET | LUA_MASKLINE | LUA_MASKCOUNT;
13 lua_sethook( g_lua, timeout_break, mask, 1);
14 }
15 }
最後就是那個鉤子函數了,它首先把鉤子去掉,因為這個鉤子只要執行一次就行了。由於設置鉤子和執行鉤子是在不同的線程中,並且鉤子從設置到執行需要一定的時間,所以它要通過對比g_check和g_counter來判斷是否還在運行判斷超時所執行的那段腳本,不是就什麼也不做,是就通過luaL_error產生一個錯誤,並中止腳本的執行,而這個錯誤最終會被run_user_script中的lua_pcall捕獲。
1 void timeout_break( lua_State* L, lua_Debug* ar )
2 {
3 lua_sethook( L, NULL, 0, 0 );
4 // 鉤子從設置到執行, 需要一段時間, 所以要檢測是否仍在執行那個超時的腳本
5 if( g_check == g_counter )
6 luaL_error( L, "script timeout." );
7 }
上面的檢測使用了兩個線程,其實在一個線程中也可以做到,並且更簡單。但那樣會導致鉤子函數頻繁執行,影響效率,如果對性能沒什麼要求的話,也可以采用。