第一章 針對系統調用過多的優化
我這次的優化針對syscall調用過多的問題,所以使用strace跟蹤apache進行分析。
1. apache2ctl -X &
使用-X(debug)參數啟動httpd進程,這個時候只啟動1個httpd進程
2. ps -ef | grep httpd
找到需要strace的pid
3. strace -p $PID -o /tmp/strace.log
發送一個http請求到httpd,就能看到strace信息了。
一、include_path問題
一般可以看到很多這類信息:
stat64("/error/dir/test.php", 0xbfab4b9c) = -1 ENOENT (No such file or directory)
解決方法:
1. 在應用php裡面設置include_path,去掉'.'等相對路徑,將其中包含使用文件比較多的目錄放到前面。保證遍歷include_path的時候能夠很快找到。
2. 使用絕對路徑進行include,require,include_once,require_once
3. 使用php的自動加載機制
二、apache的rewrite配置
復制代碼 代碼如下:
RewriteEngine On
RewriteCond %{DOCUMENT_ROOT}%{REQUEST_FILENAME} !-f
RewriteCond %{DOCUMENT_ROOT}%{REQUEST_FILENAME} !-d
RewriteRule .* %{DOCUMENT_ROOT}%/index.php
#RewriteRule .* /index.php
這裡最後一個注釋掉的rewrite配置不好,因為它每次請求都會多一次syscall
stat64("/index.php", 0xbfab4b9c) = -1 ENOENT (No such file or directory)
三、apache日志問題
我們在測試一個問題的時候,發現如果自定義日志裡面記錄了訪問時間等信息,會多出很多
stat64("/etc/localtime", {st_mode=S_IFREG|0644, st_size=165, ...}) = 0
如果記錄的日志比較多,性能下降非常嚴重,對於簡單應用,記錄復雜日志,性能會下降30倍。
解決方法:
在多個apache前端架http層的proxy,如haproxy,nginx。在這些地方記錄日志。接入層負載一般不高,所以proxy可以做一些記錄日志的工作。在這種配置下,可以關閉apache的日志。
四、realpath()問題
大家可以看一下這篇文章:http://bugs.php.net/bug.php?id=43864
lstat64調用多了之後,主機CPU和IO都會比較高。
究其原因,因為php5.2.x對realpath()的實現不夠好,導致會針對目錄層次,逐級調用lstat64()。
為了解決這個問題,它使用了realpath_cache,針對某個文件,存儲其realpath。這裡只存儲了葉子節點的realpath,而對 路徑上的內容沒有存儲,所以在做"/a/b/c/d/e/f/g/a.php"realpath檢查的時候逐級調用lstat64,而在做"/a/b/c /d/e/f/g/b.php"檢查的時候,還要對""/a/b/c/d/e/f/g/"做逐級檢查。所以有些優化建議就是"減少目錄層次,甚至放到"/"根目錄下"。當然我不推薦這麼干。從5.3.0開始,php對realpath()做了高效的實現,路realpath的中間路徑也做了緩存,以上面的情況為例,檢查"/a/b/c/d/e/f/g/b.php"的時候就只會做"b.php"的檢查了。所以,升級到php5.3.0以上版本能夠很好地解決這個問題。
解決方法:
1. 盡量少用include_once和require_once
因為這兩個函數會做realpath檢查,防止有符號鏈接的情況導致重復加載。不用它們就能減少realpath的調用。
2. 合理設定php.ini中的realpath_cache_size和realpath_cache_ttl參數
既然使用了realpath_cache,那肯定有大小限制。對於使用了很多文件,比如用了Zend Framework的項目,可能默認realpath_cache_size=16k就太小了,需要增大這個設置,推薦設置為256K以上。另外默認realpath_cache_ttl=120,2分鐘就過時了,怎麼也要設定為3600(1小時)。
這裡需要注意的是,這個realpath_cache是每隔apache進程獨占的,所以很吃內存的,不能設置的太大。
3. 升級到php5.3.x
沒什麼好說的,如果應用經過詳細測試沒有問題,那麼推薦升級到高版本。
五、APC的使用
apc能夠緩存php的opcode碼,能普遍提升30%的性能。但是默認apc.stat=1,這樣每次請求都會訪問需要使用的php文件,看看這個文件是否更新了,已決定是否重新編譯php文件。這個是很耗性能的,推薦關掉。
解決方法:
1. 設定apc.stat=0,不必每次請求都訪問需要用到的php文件。
需要注意的是:每次發版本改動了php文件的時候,必須調用apc_clear()清除apc緩存,否則你的代碼永遠也不會生效。
六、smarty調優
對於模塊化比較好,而且應用比較多的網站,如果使用了smarty模板系統,這個時候就需要對smarty進行調優了,否則smarty部分的開銷就很可觀。之前根據一個經驗來看,smarty可以占到10%左右的開銷。
默認配置下,smarty對檢測每個模板文件是否有更新,決定是否重新編譯模板文件。如果模板文件比較多,則會多出很多stat系統調用,加上context switch,開銷會不小。
解決方法:
1. $smarty->compile_check = false;
去掉每次的檢測,但是這樣之後,每次發版本都要把compile_dir目錄的已編譯模板刪除,否則你的模板文件永遠也不會生效了。
2. 如果可能,可以使用cache功能。
結論
經過上面的調優,結論如下:
1. 升級到php5.3.1開啟上面的優化,比5.2.3性能高10%以上
2. 在優化配置下,使用Zend Framework開發的一個搜索應用,每秒請求可達210/rps
3. 在優化配置下,使用doophp framework開發的一個搜索應用,每秒請求可達450/rps
第二章 使用APC緩存
php程序的執行流程
—》客戶端(浏覽器)請求Get hello.php
—-》cgi服務器接(譬如apache)收到請求,根據配置尋找php的處理程序(譬如mod_php)
—-》apache加載php的處理程序,php的處理程序讀取php.ini初始化php的解釋環境
—-》mod_php定位尋找hell.php,將其載入到內存中來
—-》mod_php編譯源代碼成為opcode樹
—-》mod_php執行opcode樹
—-》生成結果給浏覽器
在這個過程中,有幾點是需要注意的:
1、 對許多代碼文件說,特別是含有很多包含文件(include or require)。它們需要花費更多的時間和解析並產生中間代碼。
2、 即使PHP代碼文件沒有發生改變,這個執行過程還會嚴格的按照流程執行。也就是說,無論你的應該程序是否發生改變,每次調用的時候,都需要重新編譯生成opcode碼。(其實這就是編譯緩存存在的理由)
3、 這個流程不僅僅發生在主要的代碼文件,對於每一次的include和require來說,都會執行這個流程。(這是可以繼續優化的)
那些地方可以優化呢?
1、將mod_php fast-cgi化,避免每次都要加載這個模塊,這個模塊還要每次都去初始化php的解釋環境。
2、緩存php文件的opcode碼,這樣話,避免每次都去編譯。
APC可用用來實現第2點。編譯緩存去掉了執行PHP過程中的解析過程,所以它對含有大量PHP代碼的應用程序是非常有效的。通常情況下可以提升2-3倍以上的速度。對於包含大量include文件的項目,編譯緩存更現實出它的優越性。
注:include並不會被編譯緩存進行緩存。比如現在有兩個文件:main.php 和tobeInclude.php,其中main.php中有這樣的語句include tobeInclude.php'。假設中間碼的後綴為.op(實際上不是這樣)。那麼加上緩存cache後 main.php=>main.op ,tobeInclude.php=>tobeInclude.op。但是PHP在執行main.php的時候,她還是需要去解析main.op中的include命令,去調用tobeInclude.op的內容。具體流程是這樣的。
…=>執行main.op=>執行tobeInclude.op=>…
而不是之間簡單的執行main.op
所以說"過多的include文件會降低程序性能的"。
APC的具體配置。
Alternative PHP Cache(APC)是 PHP 的一個免費公開的優化代碼緩存。它用來提供免費,公開並且強健的架構來緩存和優化 PHP 的中間代碼。
APC 官方網站為 http://pecl.php.net/package/apc
1、安裝
以PHP extension 形式安裝
phpize
./configure --enable-apc --enable-apc-mmap
make
make install
生成.so,將.so拷貝到php引用modules的目錄下,修改權限755
2、配置
apc.enabled boolean
apc.optimization optimization
選項在腳本中可以改變
APC PHP.ini配置選項詳解
[APC]
; Alternative PHP Cache 用於緩存和優化PHP中間代碼
apc.cache_by_default = On
;SYS
; 是否默認對所有文件啟用緩沖。
; 若設為Off並與以加號開頭的apc.filters指令一起用,則文件僅在匹配過濾器時才被緩存。
apc.enable_cli = Off
;SYS
; 是否為CLI版本啟用APC功能,僅用於測試和調試目的才打開此指令。
apc.enabled = On
; 是否啟用APC,如果APC被靜態編譯進PHP又想禁用它,這是唯一的辦法。
apc.file_update_protection = 2
;SYS
; 當你在一個運行中的服務器上修改文件時,你應當執行原子操作。
; 也就是先寫進一個臨時文件,然後將該文件重命名(mv)到最終的名字。
; 文本編輯器以及 cp, tar 等程序卻並不是這樣操作的,從而導致有可能緩沖了殘缺的文件。
; 默認值 2 表示在訪問文件時如果發現修改時間距離訪問時間小於 2 秒則不做緩沖。
; 那個不幸的訪問者可能得到殘缺的內容,但是這種壞影響卻不會通過緩存擴大化。
; 如果你能確保所有的更新操作都是原子操作,那麼可以用 0 關閉此特性。
; 如果你的系統由於大量的IO操作導致更新緩慢,你就需要增大此值。
apc.filters =
;SYS
; 一個以逗號分隔的POSIX擴展正則表達式列表。
; 如果源文件名與任意一個模式匹配,則該文件不被緩存。
; 注意,用來匹配的文件名是傳遞給include/require的文件名,而不是絕對路徑。
; 如果正則表達式的第一個字符是"+"則意味著任何匹配表達式的文件會被緩存,
; 如果第一個字符是"-"則任何匹配項都不會被緩存。"-"是默認值,可以省略掉。
apc.ttl = 0
;SYS
; 緩存條目在緩沖區中允許逗留的秒數。0 表示永不超時。建議值為7200~36000。
; 設為 0 意味著緩沖區有可能被舊的緩存條目填滿,從而導致無法緩存新條目。
apc.user_ttl = 0
;SYS
; 類似於apc.ttl,只是針對每個用戶而言,建議值為7200~36000。
; 設為 0 意味著緩沖區有可能被舊的緩存條目填滿,從而導致無法緩存新條目。
apc.gc_ttl = 3600
;SYS
; 緩存條目在垃圾回收表中能夠存在的秒數。
; 此值提供了一個安全措施,即使一個服務器進程在執行緩存的源文件時崩潰,
; 而且該源文件已經被修改,為舊版本分配的內存也不會被回收,直到達到此TTL值為止。
; 設為零將禁用此特性。
apc.include_once_override = Off
;SYS
; 請保持為Off,否則可能導致意想不到的結果。
apc.max_file_size = 1M
;SYS
; 禁止大於此尺寸的文件被緩存。
apc.mmap_file_mask =
;SYS
; 如果使用–enable-mmap(默認啟用)為APC編譯了MMAP支持,
; 這裡的值就是傳遞給mmap模塊的mktemp風格的文件掩碼(建議值為"/tmp/apc.XXXXXX")。
; 該掩碼用於決定內存映射區域是否要被file-backed或者shared memory backed。
; 對於直接的file-backed內存映射,要設置成"/tmp/apc.XXXXXX"的樣子(恰好6個X)。
; 要使用POSIX風格的shm_open/mmap就需要設置成"/apc.shm.XXXXXX"的樣子。
; 你還可以設為"/dev/zero"來為匿名映射的內存使用內核的"/dev/zero"接口。
; 不定義此指令則表示強制使用匿名映射。
apc.num_files_hint = 1000
;SYS
; Web服務器上可能被包含或被請求的不同源文件的大致數量(建議值為1024~4096)。
; 如果你不能確定,則設為 0 ;此設定主要用於擁有數千個源文件的站點。
apc.optimization = 0
; 優化級別(建議值為 0 ) 。
; 正整數值表示啟用優化器,值越高則使用越激進的優化。
; 更高的值可能有非常有限的速度提升,但目前尚在試驗中。
apc.report_autofilter = Off
;SYS
; 是否記錄所有由於early/late binding原因而自動未被緩存的腳本。
apc.shm_segments = 1
;SYS
; 為編譯器緩沖區分配的共享內存塊數量(建議值為1)。
; 如果APC耗盡了共享內存,並且已將apc.shm_size指令設為系統允許的最大值,
; 你可以嘗試增大此值。
apc.shm_size = 30
;SYS
; 每個共享內存塊的大小(以MB為單位,建議值為128~256)。
; 有些系統(包括大多數BSD變種)默認的共享內存塊大小非常少。
apc.slam_defense = 0
;SYS(反對使用該指令,建議該用apc.write_lock指令)
; 在非常繁忙的服務器上,無論是啟動服務還是修改文件,
; 都可能由於多個進程企圖同時緩存一個文件而導致競爭條件。
; 這個指令用於設置進程在處理未被緩存的文件時跳過緩存步驟的百分率。
; 比如設為75表示在遇到未被緩存的文件時有75%的概率不進行緩存,從而減少碰撞幾率。
; 鼓勵設為 0 來禁用這個特性。
apc.stat = On
;SYS
; 是否啟用腳本更新檢查。
; 改變這個指令值要非常小心。
; 默認值 On 表示APC在每次請求腳本時都檢查腳本是否被更新,
; 如果被更新則自動重新編譯和緩存編譯後的內容。但這樣做對性能有不利影響。
; 如果設為Off 則表示不進行檢查,從而使性能得到大幅提高。
; 但是為了使更新的內容生效,你必須重啟Web服務器。
; 這個指令對於include/require的文件同樣有效。但是需要注意的是,
; 如果你使用的是相對路徑,APC就必須在每一次include/require時都進行檢查以定位文件。
; 而使用絕對路徑則可以跳過檢查,所以鼓勵你使用絕對路徑進行include/require操作。
apc.user_entries_hint = 100
;SYS
; 類似於num_files_hint指令,只是針對每個不同用戶而言。
; 如果你不能確定,則設為 0 。
apc.write_lock = On
;SYS
; 是否啟用寫入鎖。
; 在非常繁忙的服務器上,無論是啟動服務還是修改文件,
; 都可能由於多個進程企圖同時緩存一個文件而導致競爭條件。
; 啟用該指令可以避免競爭條件的出現。
apc.rfc1867 = Off
;SYS
; 打開該指令後,對於每個恰好在file字段之前含有APC_UPLOAD_PROGRESS字段的上傳文件,APC都將自動創建一個upload_的用戶緩存條目(就是APC_UPLOAD_PROGRESS字段值)。
3、php函數
apc_cache_info - Retrieves cached information (and meta-data) from APC's data store
apc_clear_cache - Clears the APC cache
apc_define_constants - Defines a set of constants for later retrieval and mass-definition
apc_delete - Removes a stored variable from the cache
apc_fetch - Fetch a stored variable from the cache
apc_load_constants - Loads a set of constants from the cache
apc_sma_info - Retrieves APC's Shared Memory Allocation information
apc_store - Cache a variable in the data store
4、注意:
Apc與apache的進程共享內存,所以只有在執行apache進程時,才可以往apc中存值,普通的php進程不能訪問apc共享內存。
第三章 提高PHP性能的編碼技巧
0、用單引號代替雙引號來包含字符串,這樣做會更快一些。因為PHP會在雙引號包圍的字符串中搜尋變量,單引號則不會,注意:只有echo能這麼做,它是一種可以把多個字符串當作參數的"函數"(譯注:PHP手冊中說echo是語言結構,不是真正的函數,故把函數加上了雙引號)。
1、如果能將類的方法定義成static,就盡量定義成static,它的速度會提升將近4倍。
2、$row['id'] 的速度是$row[id]的7倍。
3、echo 比print 快,並且使用echo的多重參數(譯注:指用逗號而不是句點)代替字符串連接,比如echo $str1,$str2。
4、在執行for循環之前確定最大循環數,不要每循環一次都計算最大值,最好運用foreach代替。
5、注銷那些不用的變量尤其是大數組,以便釋放內存。
6、盡量避免使用__get,__set,__autoload。
7、require_once()代價昂貴。
8、include文件時盡量使用絕對路徑,因為它避免了PHP去include_path裡查找文件的速度,解析操作系統路徑所需的時間會更少。
9、如果你想知道腳本開始執行(譯注:即服務器端收到客戶端請求)的時刻,使用$_SERVER[‘REQUEST_TIME']要好於time()。
10、函數代替正則表達式完成相同功能。
11、str_replace函數比preg_replace函數快,但strtr函數的效率是str_replace函數的四倍。
12、如果一個字符串替換函數,可接受數組或字符作為參數,並且參數長度不太長,那麼可以考慮額外寫一段替換代碼,使得每次傳遞參數是一個字符,而不是只寫一行代碼接受數組作為查詢和替換的參數。
13、使用選擇分支語句(譯注:即switch case)好於使用多個if,else if語句。
14、用@屏蔽錯誤消息的做法非常低效,極其低效。
15、打開apache的mod_deflate模塊,可以提高網頁的浏覽速度。
16、數據庫連接當使用完畢時應關掉,不要用長連接。
17、錯誤消息代價昂貴。
18、在方法中遞增局部變量,速度是最快的。幾乎與在函數中調用局部變量的速度相當。
19、遞增一個全局變量要比遞增一個局部變量慢2倍。
20、遞增一個對象屬性(如:$this->prop++)要比遞增一個局部變量慢3倍。
21、遞增一個未預定義的局部變量要比遞增一個預定義的局部變量慢9至10倍。
22、僅定義一個局部變量而沒在函數中調用它,同樣會減慢速度(其程度相當於遞增一個局部變量)。PHP大概會檢查看是否存在全局變量。
23、方法調用看來與類中定義的方法的數量無關,因為我(在測試方法之前和之後都)添加了10個方法,但性能上沒有變化。
24、派生類中的方法運行起來要快於在基類中定義的同樣的方法。
25、調用帶有一個參數的空函數,其花費的時間相當於執行7至8次的局部變量遞增操作。類似的方法調用所花費的時間接近於15次的局部變量遞增操作。
26、Apache解析一個PHP腳本的時間要比解析一個靜態HTML頁面慢2至10倍。盡量多用靜態HTML頁面,少用腳本。
27、除非腳本可以緩存,否則每次調用時都會重新編譯一次。引入一套PHP緩存機制通常可以提升25%至100%的性能,以免除編譯開銷。
28、盡量做緩存,可使用memcached。memcached是一款高性能的內存對象緩存系統,可用來加速動態Web應用程序,減輕數據庫負載。對運算碼(OP code)的緩存很有用,使得腳本不必為每個請求做重新編譯。
29、當操作字符串並需要檢驗其長度是否滿足某種要求時,你想當然地會使用strlen()函數。此函數執行起來相當快,因為它不做任何計算,只返回在zval 結構(C的內置數據結構,用於存儲PHP變量)中存儲的已知字符串長度。但是,由於strlen()是函數,多多少少會有些慢,因為函數調用會經過諸多步驟,如字母小寫化(譯注:指函數名小寫化,PHP不區分函數名大小寫)、哈希查找,會跟隨被調用的函數一起執行。在某些情況下,你可以使用isset() 技巧加速執行你的代碼。
(舉例如下)
if (strlen($foo) < 5) { echo "Foo is too short"$$ }
(與下面的技巧做比較)
if (!isset($foo{5})) { echo "Foo is too short"$$ }
調用isset()恰巧比strlen()快,因為與後者不同的是,isset()作為一種語言結構,意味著它的執行不需要函數查找和字母小寫化。也就是說,實際上在檢驗字符串長度的頂層代碼中你沒有花太多開銷。
34、當執行變量$i的遞增或遞減時,$i++會比++$i慢一些。這種差異是PHP特有的,並不適用於其他語言,所以請不要修改你的C或Java代碼並指望它們能立即變快,沒用的。++$i更快是因為它只需要3條指令(opcodes),$i++ 則需要4條指令。後置遞增實際上會產生一個臨時變量,這個臨時變量隨後被遞增。而前置遞增直接在原值上遞增。這是最優化處理的一種,正如Zend的PHP 優化器所作的那樣。牢記這個優化處理不失為一個好主意,因為並不是所有的指令優化器都會做同樣的優化處理,並且存在大量沒有裝配指令優化器的互聯網服務提供商(ISPs)和服務器。
35、並不是事必面向對象(OOP),面向對象往往開銷很大,每個方法和對象調用都會消耗很多內存。
36、並非要用類實現所有的數據結構,數組也很有用。
37、不要把方法細分得過多,仔細想想你真正打算重用的是哪些代碼?
38、當你需要時,你總能把代碼分解成方法。
39、盡量采用大量的PHP 內置函數。
40、如果在代碼中存在大量耗時的函數,你可以考慮用C擴展的方式實現它們。
41、評估檢驗(profile)你的代碼。檢驗器會告訴你,代碼的哪些部分消耗了多少時間。Xdebug調試器包含了檢驗程序,評估檢驗總體上可以顯示出代碼的瓶頸。
42、mod_zip可作為Apache模塊,用來即時壓縮你的數據,並可讓數據傳輸量降低80%。
43、在可以用file_get_contents替代file、fopen、feof、fgets等系列方法的情況下,盡量用file_get_contents,因為他的效率高得多!但是要注意file_get_contents在打開一個URL文件時候的PHP版本問題;
44、盡量的少進行文件操作,雖然PHP的文件操作效率也不低的;
45、優化Select SQL語句,在可能的情況下盡量少的進行Insert、Update操作;
46、盡可能的使用PHP內部函數(但是我卻為了找個PHP裡面不存在的函數,浪費了本可以寫出一個自定義函數的時間,經驗問題啊!);
47、循環內部不要**變量,尤其是大變量:對象(這好像不只是PHP裡面要注意的問題吧?);
48、多維數組盡量不要循環嵌套賦值;
49、在可以用PHP內部字符串操作函數的情況下,不要用正則表達式;
50、foreach效率更高,盡量用foreach代替while和for循環;
51、用單引號替代雙引號引用字符串;
52、"用i+=1代替i=i+1。符合c/c++的習慣,效率還高";
53、對global變量,應該用完就unset()掉;