程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> PHP綜合 >> Apache環境下PHP利用HTTP緩存協議原理解析及應用分析

Apache環境下PHP利用HTTP緩存協議原理解析及應用分析

編輯:PHP綜合
對於靜態頁面還有Etag。

一、先來看第一種情況:apache 靜態頁面

apache發送給客戶端的靜態頁面一般包含Last-Modified和Etag,這兩個標簽的值來自靜態文件的修改時間和inode。

下面是截取得apache返回客戶端的頭

XML/HTML代碼
復制代碼 代碼如下:
Last-Modified: Fri, 26 Jan 2007 01:53:34 GMT
ETag: "3f9f640-318-cb9f8380"

搜索引擎之所以喜歡靜態文件是因為有這兩個標識,可以判斷文件是否更新過

二、PHP等動態頁面

由於php是動態生成的,它的內容是不能根據php程序的時間來確定最後修改日期,所以默認php返回客戶端的時候補包含任何緩存控制,要想利用好緩存就必須了解緩存機制,和理減少b,s的交互,縮減帶寬流量,減輕服務器負擔...好處多多。

三、緩存控制的具體含義

先解釋一下本人經過測試理解的這幾個標簽的含義

Cache-Control:指定請求和響應遵循的緩存機制。在請求消息或響應消息中設置Cache-Control並不會修改另一個消息處理過程中的緩存處理過程。請求時的緩存指令包括no-cache、no-store、max-age、max-stale、min-fresh、only-if-cached,響應消息中的指令包括public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age。

各個消息中的指令含義如下:

Public指示響應可被任何緩存區緩存。

Private指示對於單個用戶的整個或部分響應消息,不能被共享緩存處理。這允許服務器僅僅描述當用戶的部分響應消息,此響應消息對於其他用戶的請求無效。

no-cache指示請求或響應消息不能緩存

no-store用於防止重要的信息被無意的發布。在請求消息中發送將使得請求和響應消息都不使用緩存。

max-age指示客戶機可以接收生存期不大於指定時間(以秒為單位)的響應。

min-fresh指示客戶機可以接收響應時間小於當前時間加上指定時間的響應。

max-stale指示客戶機可以接收超出超時期間的響應消息。如果指定max-stale消息的值,那麼客戶機可以接收超出超時期指定值之內的響應消息。

php用法:

在輸出之前用header(),(如果使用ob_start()可以將header放在程序任意地方)

PHP代碼
復制代碼 代碼如下:
header('Cache-Control: max-age=8');

max-age=8表示最大生存期8秒,超過8秒浏覽器必須去服務器重新讀取,這個時間是以用戶的讀取頁面開始計時的,而Expires是絕對時間。

Expires:緩存過期的絕對時間,如果過了它指定的那個時間點,浏覽器就不認緩存了,要去服務器重新請求一份最新的。

Last-Modified:文檔的最後修改時間,它的妙用就是:1

如果是靜態文件,客戶端會發上來它緩存裡的時間,apache會來比對,如果發現沒有修改就直接返回一個頭,狀態碼是304,字節數非常少,(高級版本還會增加比較Etag來確定文件是否變化)

2 php動態文件:

客戶端發上比對時間,php會判斷是否修改,如果修改時間相同,就只會返回1024字節,至於為什麼返回1024不得而知,如果你的php生成的文件非常大,它也只返回1024,所以比較省帶寬,客戶端會根據服務器端發過來的修改時間自動從緩存文件裡顯示。

注:如果沒有Last-Modified頭,Cache-Control和Expires也是可以起作用的,但每次請求要返回真實的文件字節數,而不是1024

四、HOW ?

靜態頁面不用去管它了,如果想更好的控制靜態頁面的緩存,apache有幾個模塊可以很好的控制,這裡不討論

php頁面:

這裡分兩種:

1、不經常改動的頁面,類似新聞發布,這類頁面的特點:第一次發布之後會有幾次改動,隨著時間推移基本不會再修改。控制策略應該是:1第一次發布之發送Last-Modified,max-age設定1天,修改過之後更新Last-Modified,max-age時間隨著修改次數正常。這樣似乎比較繁瑣,還要記錄修改次數,也可以預計一下下次可能的修改時間用Expires指定到大概時間過期

PHP代碼
復制代碼 代碼如下:
//header('Cache-Control: max-age=86400');//緩存一天
header('Expires: Mon, 29 Jan 2007 08:56:01 GMT');//指定過期時間
header('Last-Modified: '.gmdate('D, d M Y 01:01:01',$time).'GMT');//格林尼治時間,$time是文件添加時候的時間戳

2 經常改動的頁面

類似bbs,論壇程序,這種頁面更新速度比較快,緩存的主要作用是防止用戶頻繁刷新列表,導致服務器數據庫負擔,既要保證更新的及時性,也要保證緩存能被利用

這裡一般用Cache-Control來控制,根據論壇的發帖的頻率靈活控制max-age。

PHP代碼
復制代碼 代碼如下:
header('Cache-Control: max-age=60');//緩存一分鐘
header('Last-Modified: '.gmdate('D, d M Y 01:01:01',$time).'GMT');//格林尼治時間,$time是帖子的最後更新時間戳

五 額外

1 刷新,轉到,強制刷新的區別

浏覽器上有刷新和轉到按鍵,有的浏覽器支持用ctrl+F5強制刷新頁面,它們的區別是什麼?

轉到:用戶點擊鏈接就是轉到,它完全使用緩存機制,如果有Last-Modified那麼不會和服務器通訊,用抓包工具可以查看到發送字節是0byte,如果緩存過期,那麼它會執行F5刷新的動作。

刷新(F5):這種刷新也是根據緩存是否有Last-Modified來決定,如果有會轉入304或1024(php),如果沒有最後更新時間那麼去服務器讀取,返回真實文檔大小

強制刷新:完全拋棄緩存機制,去服務器讀取最新文檔,向服務器發送的header如下

XML/HTML代碼
復制代碼 代碼如下:
Cache-Control: no-cache

2 調試工具

查看浏覽器和服務器交互比較好的工具是httpwatch pro,現在的版本4.1,支持ie7

還有別的代理抓包工具可以分析,http debugging。沒用過,還有tcp抓包工具,2000自帶的network。另外還有tcp抓包工具,2000自帶的network monitor不過不是專門針對http的比較難用。
  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved