在了解過世界最大的PHP站點,Facebook的後台技術後,今天我們來了解一個百萬級PHP站點的網站架構:Poppen.de。Poppen.de是德國的一個社交網站,相對Facebook、Flickr來說是一個很小的網站,但它有一個很好的架構,融合了很多技術,如 Nigix、MySQL、CouchDB、Erlang、Memcached、RabbitMQ、PHP、Graphite、Red5以及Tsung。
Poppen.de目前有200萬注冊用戶數、2萬並發用戶數、每天20萬條私有消息、每天25萬登錄次數。而項目團隊有11個開發人員,兩個設計,兩個系統管理員。該站點的商業模式采用免費增值模式,用戶可以使用搜索用戶、給好友發送消息、上載圖片和視頻等功能。
如果用戶想享受不受限制發送消息和上載圖片,那麼就得根據需要支付不同類型的會員服務,視頻聊天及網站其他服務也采用同樣的策略。
Nginx
Poppen.de 所有的服務都是基於Nginx服務上的。前端有兩台Nginx服務器在高峰期提供每分鐘15萬次請求的負載,每個機器已經有四年壽命,並且只有一個CPU 和3GB RAM。Poppen.de擁有三台獨立的圖像服務器,由三台Nginx服務器為*.bilder.poppen.de提供每分鐘8萬次請求服務。
Nginx 架構中一個很酷的設計就是有很多請求是由Memcached處理的,因此請求從緩存中獲取內容而不需要直接訪問PHP機器。比如,用戶信息頁(user profile)是網站需要密集處理的內容,如果把用戶信息頁全部緩存到Memcached上,那麼請求直接從Memcached上獲取內容。 Poppen.de的Memcached每分鐘可以處理8000次請求。
架構中有三個Nginx圖像服務器提供本地圖像緩存,用戶上載圖 像到一個中央文件服務器。當向這三個Nginx之一中請求圖像時,如果服務器本地中沒有存在該圖像,則從中央文件服務器下載到該服務器上作緩存並提供服 務。這種負載均衡的分布式圖像服務器架構設計可以減輕主要存儲設備的負載。
PHP-FPM
該網站運行在PHP- FPM上。共有28台雙CPU、6GB內存的PHP機器,每個機器上運行100個PHP-FPM的工作線程。使用啟用了APC的PHP5.3.x。 PHP5.3可以降低CPU和內存使用率的30%以上。
推薦閱讀:Nginx + PHP-FPM + APC=絕妙的組合
程序代碼是基於Symfony1.2框架之上開發的。一是可以使用外部資源,二是 能夠提高項目開發進度,同時在一個著名的框架上可以讓新開發人員更容易加入到團隊中來。雖然沒有任何事情都是十全十美的,但可以從Symfony框架中得 到很多好處,讓團隊可以更多的精力放在Poppen.de的業務開發上去。
網站性能優化使用XHProf,這是Facebook開源出來的一個類庫。這個框架非常容易個性化和配置,能夠可以緩存大部分高代價的服務器計算。
MySQL
MySQL是網站主要的RDBMS。網站又幾個MySQL服務器:一台4CPU、32GB的服務器存儲用戶相關信息,如基本信息、照片描述信息等。這台機器已經使用了4 年,下一步計劃會使用共享集群來替換它。目前仍基於這個系統上進行設計,以簡化數據訪問代碼。根據用戶ID進行數據分區,因為網站中大部分信息都是以用戶 為中心的,如照片、視頻、消息等。
有三台服務器按主-從-從配置架構提供用戶論壇服務。一台從服務器負責網站自定義消息存儲,到現在有 2.5億條消息。另外四台機器為主-從配置關系。另外由4台機器配置成NDB族群專門服務於密集型寫操作數據,如用戶訪問統計信息。
數據表設計盡量避免關聯操作,盡可能緩存最多的數據。當然,數據庫的結構化規范已經完全被破壞掉了。因此,為了更容易搜索,數據庫設計創建了數據挖掘表。大部分表是MyISAM型表,可以提供快速查找。現在的問題是越來越多的表已經全表鎖住了。Poppen.de正考慮往XtraDB存儲引擎上遷移。
Memcached
網站架構中Memcached應用相當多,超過45GB的高速緩存和51個節點。緩存了Session會話、視圖緩存以及函數執行緩存等。架構中有一個系統 當記錄被修改時可以自動地把數據更新到緩存中去。未來改善緩存更新的可能方案是使用新的Redis Hash API或者MongoDB。
RabbitMQ
在 2009年中開始在架構中使用RabbitMQ。這是一個很好的消息解決方案,便於部署和集中到這個架構中去,在LVS後運行了兩台RabbitMQ服務 器。在上個月,已經把更多的東西集成到該隊列中,意味著同一時刻有28台PHP服務器每天要處理50萬次請求。發送日志、郵件通知、系統消息、圖像上載等 更多的東西到這個隊列中。
應用PHP-FPM中的fastCGI_finish_request()函數集成隊列消息,可以把消息異步發 送到隊列中。當系統需要給用戶發送Html或JSON格式響應時,就調用這個函數,這樣用戶就沒有必要等到PHP腳本清理。
這個系統可以改善架構資源管理。例如,在高峰期服務每分鐘可以處理1000次登錄請求。這表示有1000並發更新用戶表保存用戶的登錄時間。由於使用了隊列機制,可以 按相反的順序來運行這些查詢。如果需要提高處理速度,只需要增加更多的隊列處理者即可,甚至可以增加更多的服務器到這集群中去,而不需要修改任何配置和部 署新節點。
CouchDB
日志存儲CouchDB運行在一台機器上。在這台機器上可以根據模塊/行為進行日志查詢 /分組,或者根據錯誤類型等等。這對定位問題非常有用。在使用日志聚合服務CouchDB之前,不得不逐台登錄到PHP服務器上設法日志分析定位問題,這 是非常麻煩的。而現在把所有的日志集中到隊列中保存到CouchDB中,可以集中進行問題檢查和分析。
Graphite
網站使用Graphite采集網站實時信息並統計。從請求每個模塊/行為到Memcached的命中和未命中、RabbitMQ狀態監控以及Unix負載等等。Graphite服務平均每分鐘有4800次更新操作。實踐已經證實要監測網站發發生什麼是非常有用的,它的簡單文本協議和繪圖功能可以方便地即插即 用的方式用於任何需要監控的系統上。
一件很酷的事情是使用Graphite同時監控了網站的兩個版本。一月份部署了Symfony框架新 版本,以前代碼作為一個備份部署。這就意味著網站可能會面臨性能問題。因此可以使用Graphite來對兩個版本在線進行對比。
發現新版本上的Unix負載表較高,於是使用XHProf對兩個版本進行性能分析,找出問題所在。
Red5
網站為用戶也提供了兩種類型的視頻服務,一種是用戶自己上載的視頻,另外一種是視頻聊天,用戶視頻互動和分享。到2009年年中,每月為用戶提供17TB的流量服務。
Tsung
Tsung 是一個Erlang編寫的分布式基准分析工具。在Poppen.de網站中主要用於HTTP基准分析、MySQL與其他存儲系統(XtraDB)的對比分 析。用一個系統記錄了主要的MySQL服務器的流量,再轉換成Tsung的基准會話。然後對該流量進行回放,由Tsung產生數以千計的並發用戶訪問實驗 室的服務器。這樣就可以在實驗環境中與真實場景非常接近。