程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> PHP查詢MySQL大量數據的內存占用分析

PHP查詢MySQL大量數據的內存占用分析

編輯：關於PHP編程

　　這篇文章主要是從原理, 手冊和源碼分析在PHP中查詢MySQL返回大量結果時, 內存占用的問題, 同時對使用MySQL C API也有涉及.

　　昨天, 有同事在PHP討論群裡提到, 他做的一個項目由於MySQL查詢返回的結果太多(達10萬條), 從而導致PHP內存不夠用. 所以, 他問, 在執行下面的代碼遍歷返回的MySQL結果之前, 數據是否已經在內存中了? -

　　while ($row = mysql_fetch_assoc($result)) {

　　// ...

　　}

　　當然, 這種問題有許多優化的方法. 不過, 就這個問題來講, 我首先想到, MySQL是經典的C/S(Client/Server, 客戶端/服務器)模型, 在遍歷結果集之前, 底層的實現可能已經把所有的數據通過網絡(假設使用TCP/IP)讀到了Client的緩沖區, 也有另一種可能, 就是數據還在Server端的發送緩沖區裡, 並沒有傳給Client.

　　在查看PHP和MySQL的源碼之前, 我注意到PHP手冊裡有兩個功能相近的函數:

　　mysql_query()

　　mysql_unbuffered_query()

　　兩個函數的字面意思和說明證實了我的想法, 前一個函數執行時, 會把所有的結果集從Server端讀到Client端的緩沖區中, 而後一個則沒有, 這就是”unbuffered(未緩沖)”的意思.

　　那就是說, 如果用mysql_unbuffered_query()執行了一條返回大量結果集的SQL語句, 在遍歷結果之前, PHP的內存是沒有被結果集占用的. 而用mysql_query()來執行同樣的語句的話, 函數返回時, PHP的內存占用便會急劇增加, 立即耗光內存.

　　如果閱讀PHP的相關代碼, 可以看到這兩個函數的實現上的異同:

　　/* {{{ proto resource mysql_query(string query [, int link_identifier])

　　Sends an SQL query to MySQL */

　　PHP_FUNCTION(mysql_query)

　　{

　　php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_STORE_RESULT);

　　}