程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> memcached完全剖析–1. memcached的基礎

memcached完全剖析–1. memcached的基礎

編輯：關於PHP編程

發表日：2008/7/2

原文鏈接：http://gihyo.jp/dev/feature/01/memcached/0001
這個系列文章的鏈接在這裡：
第1次：http://www.phpchina.com/html/29/n-35329.html
第2次：http://www.phpchina.com/html/30/n-35330.html
第3次：http://www.phpchina.com/html/31/n-35331.html
第4次：http://www.phpchina.com/html/32/n-35332.html
第5次：http://www.phpchina.com/html/32/n-35333.html
我是mixi株式會社開發部系統運營組的長野。日常負責程序的運營。從今天開始，將分幾次針對最近在Web應用的可擴展性領域的熱門話題memcached，與我公司開發部研究開發組的前坂一起，說明其內部結構和使用。
memcached是什麼？
memcached的特征
協議簡單
基於libevent的事件處理
內置內存存儲方式
memcached不互相通信的分布式
安裝memcached
memcached的安裝
memcached的啟動
用客戶端連接
使用Cache::Memcached
使用Cache::Memcached連接memcached
保存數據
獲取數據
刪除數據
增一和減一操作
總結
memcached是什麼？
memcached 是以LiveJournal 旗下Danga Interactive 公司的Brad Fitzpatric 為首開發的一款軟件。現在已成為 mixi、 hatena、 Facebook、 Vox、LiveJournal等眾多服務中提高Web應用擴展性的重要因素。
許多Web應用都將數據保存到RDBMS中，應用服務器從中讀取數據並在浏覽器中顯示。但隨著數據量的增大、訪問的集中，就會出現RDBMS的負擔加重、數據庫響應惡化、網站顯示延遲等重大影響。
這時就該memcached大顯身手了。memcached是高性能的分布式內存緩存服務器。一般的使用目的是，通過緩存數據庫查詢結果，減少數據庫訪問次數，以提高動態Web應用的速度、提高可擴展性。
圖1 一般情況下memcached的用途
memcached的特征
memcached作為高速運行的分布式緩存服務器，具有以下的特點。
協議簡單
基於libevent的事件處理
內置內存存儲方式
memcached不互相通信的分布式
協議簡單
memcached的服務器客戶端通信並不使用復雜的XML等格式，而使用簡單的基於文本行的協議。因此，通過telnet 也能在memcached上保存數據、取得數據。下面是例子。
$ telnet localhost 11211 Trying 127.0.0.1... Connected to localhost.localdomain (127.0.0.1). Escape character is '^]'. set foo 0 0 3 （保存命令） bar （數據） STORED （結果） get foo （取得命令） VALUE foo 0 3 （數據） bar （數據）
協議文檔位於memcached的源代碼內，也可以參考以下的URL。
http://code.sixapart.com/svn/memcached/trunk/server/doc/protocol.txt
基於libevent的事件處理
libevent是個程序庫，它將Linux的epoll、BSD類操作系統的kqueue等事件處理功能封裝成統一的接口。即使對服務器的連接數增加，也能發揮O(1)的性能。 memcached使用這個libevent庫，因此能在Linux、BSD、Solaris等操作系統上發揮其高性能。關於事件處理這裡就不再詳細介紹，可以參考Dan Kegel的The C10K Problem。
libevent: http://www.monkey.org/~provos/libevent/
The C10K Problem: http://www.kegel.com/c10k.html
內置內存存儲方式
為了提高性能，memcached中保存的數據都存儲在memcached內置的內存存儲空間中。由於數據僅存在於內存中，因此重啟memcached、重啟操作系統會導致全部數據消失。另外，內容容量達到指定值之後，就基於LRU(Least Recently Used)算法自動刪除不使用的緩存。 memcached本身是為緩存而設計的服務器，因此並沒有過多考慮數據的永久性問題。關於內存存儲的詳細信息，本連載的第二講以後前坂會進行介紹，請屆時參考。
memcached不互相通信的分布式
memcached盡管是“分布式”緩存服務器，但服務器端並沒有分布式功能。各個memcached不會互相通信以共享信息。那麼，怎樣進行分布式呢？這完全取決於客戶端的實現。本連載也將介紹memcached的分布式。
圖2 memcached的分布式
接下來簡單介紹一下memcached的使用方法。
安裝memcached
memcached的安裝比較簡單，這裡稍加說明。
memcached支持許多平台。
Linux
FreeBSD
Solaris (memcached 1.2.5以上版本)
Mac OS X
另外也能安裝在Windows上。這裡使用Fedora Core 8進行說明。
memcached的安裝
運行memcached需要本文開頭介紹的libevent庫。Fedora 8中有現成的rpm包，通過yum命令安裝即可。
$ sudo yum install libevent libevent-devel
memcached的源代碼可以從memcached網站上下載。本文執筆時的最新版本為1.2.5。 Fedora 8雖然也包含了memcached的rpm，但版本比較老。因為源代碼安裝並不困難，這裡就不使用rpm了。
下載memcached：http://www.danga.com/memcached/download.bml
memcached安裝與一般應用程序相同，configure、make、make install就行了。
$ wget http://www.danga.com/memcached/dist/memcached-1.2.5.tar.gz $ tar zxf memcached-1.2.5.tar.gz $ cd memcached-1.2.5 $ ./configure $ make $ sudo make install
默認情況下memcached安裝到/usr/local/bin下。
memcached的啟動
從終端輸入以下命令，啟動memcached。
$ /usr/local/bin/memcached -p 11211 -m 64m -vv slab class 1: chunk size 88 perslab 11915 slab class 2: chunk size 112 perslab 9362 slab class 3: chunk size 144 perslab 7281 中間省略 slab class 38: chunk size 391224 perslab 2 slab class 39: chunk size 489032 perslab 2 <23 server listening <24 send buffer was 110592, now 268435456 <24 server listening (udp) <24 server listening (udp) <24 server listening (udp) <24 server listening (udp)
這裡顯示了調試信息。這樣就在前台啟動了memcached，監聽TCP端口11211 最大內存使用量為64M。調試信息的內容大部分是關於存儲的信息，下次連載時具體說明。
作為daemon後台啟動時，只需
$ /usr/local/bin/memcached -p 11211 -m 64m -d
這裡使用的memcached啟動選項的內容如下。
選項說明-p使用的TCP端口。默認為11211-m最大內存大小。默認為64M-vv用very vrebose模式啟動，調試信息和錯誤輸出到控制台-d作為daemon在後台啟動
上面四個是常用的啟動選項，其他還有很多，通過
$ /usr/local/bin/memcached -h
命令可以顯示。許多選項可以改變memcached的各種行為，推薦讀一讀。
用客戶端連接
許多語言都實現了連接memcached的客戶端，其中以Perl、PHP為主。僅僅memcached網站上列出的語言就有
Perl
PHP
Python
Ruby
C#
C/C++
Lua
等等。
memcached客戶端API：http://www.danga.com/memcached/apis.bml
這裡介紹通過mixi正在使用的Perl庫鏈接memcached的方法。
使用Cache::Memcached
Perl的memcached客戶端有
Cache::Memcached
Cache::Memcached::Fast
Cache::Memcached::libmemcached
等幾個CPAN模塊。這裡介紹的Cache::Memcached是memcached的作者Brad Fitzpatric的作品，應該算是memcached的客戶端中應用最為廣泛的模塊了。
Cache::Memcached - search.cpan.org: http://search.cpan.org/dist/Cache-Memcached/
使用Cache::Memcached連接memcached
下面的源代碼為通過Cache::Memcached連接剛才啟動的memcached的例子。
#!/usr/bin/perl use strict; use warnings; use Cache::Memcached; my $key = "foo"; my $value = "bar"; my $expires = 3600; # 1 hour my $memcached = Cache::Memcached->new({ servers => ["127.0.0.1:11211"], compress_threshold => 10_000 }); $memcached->add($key, $value, $expires); my $ret = $memcached->get($key); print "$ret\n";
在這裡，為Cache::Memcached指定了memcached服務器的IP地址和一個選項，以生成實例。 Cache::Memcached常用的選項如下所示。
選項說明servers用數組指定memcached服務器和端口compress_threshold數據壓縮時使用的值namespace指定添加到鍵的前綴
另外，Cache::Memcached通過Storable模塊可以將Perl的復雜數據序列化之後再保存，因此散列、數組、對象等都可以直接保存到memcached中。
保存數據
向memcached保存數據的方法有
add
replace
set
它們的使用方法都相同：
my $add = $memcached->add( '鍵', '值', '期限' ); my $replace = $memcached->replace( '鍵', '值', '期限' ); my $set = $memcached->set( '鍵', '值', '期限' );
向memcached保存數據時可以指定期限(秒)。不指定期限時，memcached按照LRU算法保存數據。這三個方法的區別如下：
選項說明add僅當存儲空間中不存在鍵相同的數據時才保存replace僅當存儲空間中存在鍵相同的數據時才保存set與add和replace不同，無論何時都保存
獲取數據
獲取數據可以使用get和get_multi方法。
my $val = $memcached->get('鍵'); my $val = $memcached->get_multi('鍵1', '鍵2', '鍵3', '鍵4', '鍵5');
一次取得多條數據時使用get_multi。get_multi可以非同步地同時取得多個鍵值，其速度要比循環調用get快數十倍。
刪除數據
刪除數據使用delete方法，不過它有個獨特的功能。
$memcached->delete('鍵', '阻塞時間(秒)');
刪除第一個參數指定的鍵的數據。第二個參數指定一個時間值，可以禁止使用同樣的鍵保存新數據。此功能可以用於防止緩存數據的不完整。但是要注意，set函數忽視該阻塞，照常保存數據
增一和減一操作
可以將memcached上特定的鍵值作為計數器使用。
my $ret = $memcached->incr('鍵'); $memcached->add('鍵', 0) unless defined $ret;
增一和減一是原子操作，但未設置初始值時，不會自動賦成0。因此，應當進行錯誤檢查，必要時加入初始化操作。而且，服務器端也不會對超過2 ³²時的行為進行檢查。
總結
這次簡單介紹了memcached，以及它的安裝方法、Perl客戶端Cache::Memcached的用法。只要知道，memcached的使用方法十分簡單就足夠了。
下次由前坂來說明memcached的內部結構。了解memcached的內部構造，就能知道如何使用memcached才能使Web應用的速度更上一層樓。歡迎繼續閱讀下一章。
版權聲明：可以任意轉載，但轉載時必須標明原作者charlee、原始鏈接以及本聲明。