許多 PHP 開發人員認為,由於標准的 PHP 缺少線程功能,因此實際 PHP 應用程序不可能執行多任務處理。例如,如果應用程序需要其他 Web 站點的信息,那麼在遠程檢索完成之前它都必須停止。這是錯誤的!通過本文了解如何使用 stream_select 和 stream_socket_client 實現進程內 PHP 多任務處理。
PHP 不支持線程。盡管如此,與前述大多數 PHP 開發人員所相信的想法形成對比的是,PHP 應用程序可以 執行多任務處理。讓我們開始盡可能清晰地描述一下 “多任務” 和 “線程” 對於 PHP 編程的意義。
並發的種類
首先拋開幾個和主題無關的例子。PHP 與多任務或並發的關系十分復雜。在較高層次上,PHP 經常涉及多任務:以多任務方式使用 標准的服務器端 PHP 安裝 —— 例如,作為 Apache 模塊。換句話說,若干個客戶機 —— Web 浏覽器 —— 可以同時請求同一個 PHP 解釋的頁面,而 Web 服務器將差不多同時返回所有這些頁面。
一個 Web 頁面不會妨礙其他 Web 頁面的發送,盡管可能會由於諸如服務器內存或網絡帶寬之類的受限資源而使它們相互之間略有妨礙。這樣,實現並發 的系統級需求可能適合使用基於 PHP 的解決方案。就實現而言,PHP 允許它的管理 Web 服務器負責實現並發。
Ajax 名下的客戶端並發近幾年來也已成為開發人員關注的焦點。雖然 Ajax 的含義已經變得十分模糊,但是它的一個方面是浏覽器顯示可以同時執行計算和 保留對諸如選擇菜單項之類的用戶操作的響應。這實際上就是某種 多任務。用 PHP 編碼的 Ajax 就是這樣 —— 但是不涉及任何特定的 PHP;用於其他語言的 Ajax 框架均以完全相同的方法操作。
只粗略地涉及 PHP 的第三個並發實例是 PHP/TK。PHP/TK 是 PHP 的擴展,用於為核心 PHP 提供可移植圖形用戶界面(GUI)綁定。PHP/TK 允許用 PHP 編寫代碼構造桌面 GUI 應用程序。其基於事件的特性將模擬一種易於掌握並且比線程更少出錯的並發形式。此外,並發是 “繼承” 自一項輔助技術,而不是 PHP 的基本功能。
向 PHP 本身添加線程支持的試驗已經做過多次。據我所知,沒有一次是成功的。但是,Ajax 框架和 PHP/TK 的面向事件的實現表明事件可能比線程能更好地體現 PHP 的並發。PHP V5 證明事實確實如此。
PHP V5 將提供 stream_select()
使用標准的 PHP V4 和更低版本,必須按順序執行 PHP 應用程序的所有工作。例如,如果程序需要在兩個商業站點檢索商品的價格,則請求第一個站點的價格,等待至響應到達,再請求第二個站點的價格,然後再次等待。
如果程序請求同時完成若干項任務會怎麼樣?總體來看,程序將在一段時間內完成,在這段時間內,將始終進行連續處理。
第一個示例
新的 stream_select 函數及它的幾個助手使這成為可能。請考慮以下示例。
清單 1. 同時請求多個 HTTP 頁面
<?php
echo "Program starts at ". date(h:i:s) . ".
";
$timeout=10;
$result=array();
$sockets=array();
$convenient_read_block=8192;
/* Issue all requests simultaneously; theres no blocking. */
$delay=15;
$id=0;
while ($delay > 0) {
$s=stream_socket_client("phaseit.net:80", $errno,
$errstr, $timeout,
STREAM_CLIENT_ASYNC_CONNECT|STREAM_CLIENT_CONNECT);
if ($s) {
$sockets[$id++]=$s;
$http_message="GET /demonstration/delay?delay=" .
$delay . " HTTP/1.0
Host: phaseit.net
";
fwrite($s, $http_message);
} else {
echo "Stream " . $id . " failed to open correctly.";
}
$delay -= 3;
}
while (count($sockets)) {
$read=$sockets;
stream_select($read, $w=null, $e=null, $timeout);
if (count($read)) {
/* stream_select generally shuffles $read, so we need to
compute from which socket(s) were reading. */
foreach ($read as $r) {
$id=array_search($r, $sockets);
$data=fread($r, $convenient_read_block);
/* A socket is readable either because it has
data to read, OR because its at EOF. */
if (strlen($data) == 0) {
echo "Stream " . $id . " closes at " . date(h:i:s) . ".
";
fclose($r);
unset($sockets[$id]);
} else {
$result[$id] .= $data;
}
}
} else {
/* A time-out means that *all* streams have failed
to receive a response. */
echo "Time-out!
";
break;
}
}
?>
如果運行此清單,您將看到如下所示的輸出。
清單 2. 從清單 1 中的程序獲得的典型輸出
Program starts at 02:38:50.
Stream 4 closes at 02:38:53.
Stream 3 closes at 02:38:56.
Stream 2 closes at 02:38:59.
Stream 1 closes at 02:39:02.
Stream 0 closes at 02:39:05.
了解這其中的工作原理至關重要。在較高層次上,第一個程序將發出幾個 HTTP 請求並接收 Web 服務器發送給它的頁面。雖然生產應用程序將很可能尋找若干個 Web 服務器的地址 —— 可能是 google.com、yahoo.com、ask.com 等 —— 但是此示例將把它的所有請求發送到位於 Phaseit.net 的企業服務器上,只為降低復雜度。
Web 頁面請求在延遲(可變)後返回結果,如下所示。如果程序按順序發出請求,則需花費大約 15+12+9+6+3 (45) 秒鐘才能完成。如清單 2 所示,它實際上花費 15 秒鐘完成。性能提高了三倍。
使這成為可能的是 PHP V5 的新 stream_select 函數。請求都是以常規方法發起,方法為打開幾個 stream_socket_client 並向對應於 http://phaseit.net/demonstration/delay?delay=$DELAY 的每個 stream_socket_client 寫入 GET。如果您通過浏覽器請求此 URL,則在幾秒鐘之後,您將看到:
Starting at Thu Apr 12 15:05:01 UTC 2007.
Stopping at Thu Apr 12 15:05:05 UTC 2007.
4 second delay.
延遲服務器將作為 CGI 實現,如下所示:
清單 3. 延遲服務器實現
#!/bin/sh
echo "Content-type: text/html
<HTML> <HEAD></HEAD> <BODY>"
echo "Starting at `date`."
RR=`echo $REQUEST_URI | sed -e s/.*?//`
DELAY=`echo $RR | sed -e s/delay=//`
sleep $DELAY
echo "<br>Stopping at `date`."
echo "<br>$DELAY second delay.</body></html>"
雖然清單 3 的特殊實現特定於 UNIX?,但是本文中幾乎所有實現都將很好地應用於 Windows?(尤其是 Windows 98 以後的版本)或 PHP 的 UNIX 安裝。特別地,清單 1 可以托管在任意一個操作系統中。因此,Linux? 和 Mac OS X 都是 UNIX 變體,因此這裡所有的代碼都可以在兩者的任意一種中運行。
按照以下順序向延遲服務器發出請求。
清單 4. 進程啟動順序
delay=15
delay=12
delay= 9
delay= 6
delay= 3
stream_select 的作用是盡可能快速地接收結果。在這種情況下,它執行的順序與發出結果的順序剛好相反。3 秒後,第一個頁面已經准備好讀取。程序的這一部分也符合常規 PHP —— 在本例中,使用 fread。就像在其他 PHP 程序一樣,讀取可以很好地通過 fgets 完成。
處理將以同樣的方法繼續。程序將在 stream_select 停止,直至數據就緒。重要的一點是,只要任何 連接具有數據,不管順序怎樣,程序都將開始讀取。這是程序進行多任務處理或並發處理來自多個請求的結果的方法。
注意,這沒有對主機 CPU 造成任何負擔。經常會遇到這樣一些連網程序,以 CPU 使用率急速上升至 100% 的方式在 while 中使用 fread。那種情況不會出現在這裡,因為 stream_select 擁有支持立即響應所需的屬性(只要有任何讀取信息),但是它將在各讀取操作間隙的等待時間內產生可忽略的 CPU 負載。
必備的 stream_select() 知識
諸如此類的基於事件的編程並不是最基本的。雖然清單 1 被簡化到只包含最基本要素,但是涉及作為多任務應用程序必要元素的回調或協調的任何編碼,比簡單的程序順序更讓人覺得陌生。在這種情況下,大多數挑戰集中在 $read 數組上。注意,它是一個引用;stream_select 將通過改變 $read 的內容返回重要信息。就像指針是 C 的最大絆腳石一樣,引用似乎是 PHP 中最讓程序員感到棘手的一部分。
您可以使用這項技術向任意個外部 Web 站點發出請求,確信您的程序會盡快收到所有結果,而無需等待其他請求。實際上,該技術將正確處理所有 TCP/IP 連接,而不只是 Web 端口 80 上的連接,因此您可以大體上管理 LDAP 檢索、SMTP 傳輸、SOAP 請求等。
但那不是全部。PHP V5 將管理 “流” 之類的各種連接,而不僅是簡單的套接字。PHP 的 Client URL library (CURL) 支持 HTTPS 證書、FTP 上傳、cookie 等。(CURL 允許 PHP 應用程序使用各種協議連接至服務器)。由於 CURL 將提供流接口,因此從程序的角度來看,連接是透明的。下一個部分將展示 stream_select 如何多路傳輸本地計算。
對於 stream_select 還有幾點需要注意。它還在進行文檔整理,因為即使最新的 PHP 書籍都沒有涉列它。可在 Web 上獲得的