Memcache是danga.com的一個項目,最早是為 LiveJournal 服務的,目前全世界不少人使用這個緩存項目來構建自己大負載的網站,來分擔數據庫的壓力。它可以應對任意多個連接,使用非阻塞的網絡IO。由於它的工作機制是在內存中開辟一塊空間,然後建立一個HashTable,Memcached自管理這些HashTable。Memcache官方網站:http://www.danga.com/memcached,更多詳細的信息可以來這裡了解。
為什麼會有Memcache和memcached兩種名稱?其實Memcache是這個項目的名稱,而memcached是它服務器端的主程序文件名,知道我的意思了把~~~~。一個是項目名稱,一個是主程序文件名,在網上看到了很多人不明白,於是混用了。
分為兩個過程:memcache服務器端的安裝和memcached客戶端的安裝。
所謂服務器端的安裝就是在服務器(一般都是linux系統)上安裝Memcache實現數據的存儲。
所謂客戶端的安裝就是指php(或者其他程序,Memcache還有其他不錯的api接口提供)去使用服務器端的Memcache提供的函數,需要php添加擴展。
<?php //連接 $mem = new Memcache; $mem->connect("db.bkjia.com", 12000); //保存數據 $mem->set('key1', 'This is first value', 0, 60); $val = $mem->get('key1'); echo "Get key1 value: " . $val ."<br />"; //替換數據 $mem->replace('key1', 'This is replace value', 0, 60); $val = $mem->get('key1'); echo "Get key1 value: " . $val . "<br />"; //保存數組 $arr = array('aaa', 'bbb', 'ccc', 'ddd'); $mem->set('key2', $arr, 0, 60); $val2 = $mem->get('key2'); echo "Get key2 value: "; print_r($val2); echo "<br />"; //刪除數據 $mem->delete('key1'); $val = $mem->get('key1'); echo "Get key1 value: " . $val . "<br />"; //清除所有數據 $mem->flush(); $val2 = $mem->get('key2'); echo "Get key2 value: "; print_r($val2); echo "<br />"; //關閉連接 $mem->close(); ?>
如果正常的話,浏覽器將輸出:
Get key1 value: This is first value Get key1 value: This is replace value Get key2 value: Array ( [0] => aaa [1] => bbb [2] => ccc [3] => ddd ) Get key1 value: Get key2 value:
初始化一個Memcache的對象:$mem = new Memcache;
連接到我們的Memcache服務器端,第一個參數是服務器的IP地址,也可以是主機名,第二個參數是Memcache的開放的端口:$mem->connect("192.168.0.200", 12000);
保存一個數據到Memcache服務器上,第一個參數是數據的key,用來定位一個數據,第二個參數是需要保存的數據內容,這裡是一個字符串,第三個參數是一個標記,一般設置為0或者MEMCACHE_COMPRESSED就行了,第四個參數是數據的有效期,就是說數據在這個時間內是有效的,如果過去這個時間,那麼會被Memcache服務器端清除掉這個數據,單位是秒,如果設置為0,則是永遠有效,我們這裡設置了60,就是一分鐘有效時間:$mem->set(‘key1‘, ‘This is first value’, 0, 60);
從Memcache服務器端獲取一條數據,它只有一個參數,就是需要獲取數據的key,我們這裡是上一步設置的key1,現在獲取這個數據後輸出輸出:
$val = $mem->get(’key1′); echo "Get key1 value: " . $val;
現在是使用replace方法來替換掉上面key1的值,replace方法的參數跟set是一樣的,不過第一個參數key1是必須是要替換數據內容的key,最後輸出了:
$mem->replace('key1', 'This is replace value', 0, 60); $val = $mem->get('key1'); echo "Get key1 value: " . $val;
同樣的,Memcache也是可以保存數組的,下面是在Memcache上面保存了一個數組,然後獲取回來並輸出:
$arr = array('aaa', 'bbb', 'ccc', 'ddd'); $mem->set('key2', $arr, 0, 60); $val2 = $mem->get('key2'); print_r($val2);
現在刪除一個數據,使用delte接口,參數就是一個key,然後就能夠把Memcache服務器這個key的數據刪除,最後輸出的時候沒有結果:
$mem->delete('key1'); $val = $mem->get('key1'); echo "Get key1 value: " . $val . "<br />";
最後我們把所有的保存在Memcache服務器上的數據都清除,會發現數據都沒有了,最後輸出key2的數據為空,最後關閉連接:
$mem->flush(); $val2 = $mem->get('key2'); echo "Get key2 value: "; print_r($val2); echo "<br />";
使用Memcache的網站一般流量都是比較大的,為了緩解數據庫的壓力,讓Memcache作為一個緩存區域,把部分信息保存在內存中,在前端能夠迅速的進行存取。那麼一般的焦點就是集中在如何分擔數據庫壓力和進行分布式,畢竟單台Memcache的內存容量的有限的。我這裡簡單提出我的個人看法,未經實踐,權當參考。
分布式應用
Memcache本來支持分布式,我們客戶端稍加改造,更好的支持。我們的key可以適當進行有規律的封裝,比如以user為主的網站來說,每個用戶都有User ID,那麼可以按照固定的ID來進行提取和存取,比如1開頭的用戶保存在第一台Memcache服務器上,以2開頭的用戶的數據保存在第二胎Mecache服務器上,存取數據都先按照User ID來進行相應的轉換和存取。
但是這個有缺點,就是需要對User ID進行判斷,如果業務不一致,或者其他類型的應用,可能不是那麼合適,那麼可以根據自己的實際業務來進行考慮,或者去想更合適的方法。
減少數據庫壓力
這個算是比較重要的,所有的數據基本上都是保存在數據庫當中的,每次頻繁的存取數據庫,導致數據庫性能極具下降,無法同時服務更多的用戶,比如MySQL,特別頻繁的鎖表,那麼讓Memcache來分擔數據庫的壓力吧。我們需要一種改動比較小,並且能夠不會大規模改變前端的方式來進行改變目前的架構。
我考慮的一種簡單方法:
後端的數據庫操作模塊,把所有的Select操作提取出來(update/delete/insert不管),然後把對應的SQL進行相應的hash算法計算得出一個hash數據key(比如MD5或者SHA),然後把這個key去Memcache中查找數據,如果這個數據不存在,說明還沒寫入到緩存中,那麼從數據庫把數據提取出來,一個是數組類格式,然後把數據在set到Memcache中,key就是這個SQL的hash值,然後相應的設置一個失效時間,比如一個小時,那麼一個小時中的數據都是從緩存中提取的,有效減少數據庫的壓力。缺點是數據不實時,當數據做了修改以後,無法實時到前端顯示,並且還有可能對內存占用比較大,畢竟每次select出來的數據數量可能比較巨大,這個是需要考慮的因素。
我們上面的Memcache服務器端都是直接通過客戶端連接後直接操作,沒有任何的驗證過程,這樣如果服務器是直接暴露在互聯網上的話是比較危險,輕則數據洩露被其他無關人員查看,重則服務器被入侵,因為Mecache是以root權限運行的,況且裡面可能存在一些我們未知的bug或者是緩沖區溢出的情況,這些都是我們未知的,所以危險性是可以預見的。為了安全起見,我做兩點建議,能夠稍微的防止黑客的入侵或者數據的洩露。
內網訪問
最好把兩台服務器之間的訪問是內網形態的,一般是Web服務器跟Memcache服務器之間。普遍的服務器都是有兩塊網卡,一塊指向互聯網,一塊指向內網,那麼就讓Web服務器通過內網的網卡來訪問Memcache服務器,我們Memcache的服務器上啟動的時候就監聽內網的IP地址和端口,內網間的訪問能夠有效阻止其他非法的訪問。
# memcached -d -m 1024 -u root -l 192.168.0.200 -p 11211 -c 1024 -P /tmp/memcached.pid
Memcache服務器端設置監聽通過內網的192.168.0.200的ip的11211端口,占用1024MB內存,並且允許最大1024個並發連接。
設置防火牆
防火牆是簡單有效的方式,如果卻是兩台服務器都是掛在網的,並且需要通過外網IP來訪問Memcache的話,那麼可以考慮使用防火牆或者代理程序來過濾非法訪問。一般我們在Linux下可以使用iptables或者FreeBSD下的ipfw來指定一些規則防止一些非法的訪問,比如我們可以設置只允許我們的Web服務器來訪問我們Memcache服務器,同時阻止其他的訪問。
# iptables -F # iptables -P INPUT DROP # iptables -A INPUT -p tcp -s 192.168.0.2 –dport 11211 -j ACCEPT # iptables -A INPUT -p udp -s 192.168.0.2 –dport 11211 -j ACCEPT
上面的iptables規則就是只允許192.168.0.2這台Web服務器對Memcache服務器的訪問,能夠有效的阻止一些非法訪問,相應的也可以增加一些其他的規則來加強安全性,這個可以根據自己的需要來做。