如果我們的網站提供文件下載的服務,那麼通常我們都希望下載可以斷點續傳(Resumable Download),也就是說用戶可以暫停下載,並在未來的某個時間從暫停處繼續下載,而不必重新下載整個文件。
通常情況下,Web服務器(如Apache)會默認開啟對斷點續傳的支持。因此,如果直接通過Web服務器來提供文件的下載,可以不必做特別的配置,即可享受到斷點續傳的好處。由於這些文件直接通過Web服務器來提供下載,後端腳本無法對這個下載過程進行控制。這對於僅提供公開、靜態文件的網站來說不是問題,但對於需要提供私有、動態文件的網站來說,直接通過Web服務器來提供下載就無法滿足需求了。這時,就需要在編寫後台腳本程序時,加入對斷點續傳的支持。
本文將以PHP為例,簡要介紹實現文件下載斷點續傳的方法。
原理
斷點續傳的原理還是比較直觀的。
HTTP協議規定了如何傳輸某個資源的一部分,而不是全部。比如,有一個文件的大小是1000字節,浏覽器可以只請求該文件的前300個字節,或者只請求第500到第1000個字節。通過這種方式,就可以不必在一次請求中傳輸某個資源的全部內容,而是發起多次請求,每次僅請求其中的一部分內容。等所有這些請求都返回之後,再把得到的內容一塊一塊的拼接起來得到完整的資源。
實現斷點續傳就是要利用HTTP協議的上述特性。當用戶暫停下載的時候,浏覽器會記錄已經下載到什麼位置,當用戶在未來某一時間恢復下載時,就可以從上次暫停的位置繼續下載,而不必從頭開始。
實現
由於部分傳輸不是強制的,服務器可以支持也可以不支持,所以,我們需要在程序中告訴浏覽器,它請求的資源是否支持部分傳輸。這可以通過設置HTTP的 Accept-Ranges 響應頭信息來實現。PHP代碼如下:
復制代碼 代碼如下:
header('Accept-Ranges: bytes');
Accept-Ranges: bytes 告訴浏覽器,該資源支持以字節為單位的部分傳輸。這個響應頭需要附加在支持部分傳輸的所有資源上。
當接受到一個請求時,我們需要從浏覽器的請求中提取浏覽器具體是在請求資源的哪一個部分。這個信息是通過 Range 請求頭來傳遞的。在PHP中,它被存儲在$_SERVER['HTTP_RANGE']中。我們需要檢查這個變量是否定義了,如果定義了,則使用該值,否則,就將range設為整個資源。
復制代碼 代碼如下:
$range = "0-". ($content_length-1);
if(isset($_SERVER['HTTP_RANGE'])){
$range = $_SERVER['HTTP_RANGE'];
}
接下來,就需要分析 $range 的值,來決定返回資源的哪一部分內容。可能的取值示例:
復制代碼 代碼如下:
100-200 // 第100到第200字節
500- // 第500字節到文件末尾
-1000 // 最後的1000個字節
這裡需要注意,得到一個Range之後,你需要對它的取值進行檢驗,包括:
1.開始位置非負
2.結束位置需要大於開始位置
3.開始位置需要小於文件長度減一 (因為這裡的位置索引是從0開始的)
4.若結束位置大於文件長度減一,則需要把它的值設置為文件長度減一
如果Range的取值不合法,則需要終止程序並告知浏覽器:
復制代碼 代碼如下:
header('HTTP/1.1 416 Requested Range Not Satisfiable');
為了保持文章簡潔,具體的校驗代碼這裡就不提供了。下面假定你已經校驗了Range的取值,並得到了 $start 和 $end 兩個變量,分別表示開始位置和結束位置。
接下來要做的就是把文件的對應部分的內容發送給浏覽器。不過要注意的是,這裡涉及到需要發送多個HTTP響應頭信息,具體如下:
復制代碼 代碼如下:
header('HTTP/1.1 206 Partial Content');
header('Accept-Ranges: bytes');
header("Content-Range: bytes $start-$end/$filesize");
$length = $end - $start + 1;
header("Content-Length: $length");
/* 輸出文件的指定部分 */
這裡的$length需要注意一下,它的取值是本次傳輸的內容的長度,而不是整個文件的長度。另外需要注意的一點是,這裡的HTTP狀態碼是206,不是200。
總結
文件下載的斷點續傳實際上是利用了HTTP協議中對傳輸部分文件的支持。而HTTP協議的這一特性不僅可以用於實現斷點續傳,客戶端程序也可以利用它來實現多線程下載。
在實現斷點續傳的過程中,需要注意正確設置各種HTTP頭信息。錯誤的頭信息將導致用戶下載到的文件損壞,無法使用。