磁盤搜索是性能的很大瓶頸。這個問題在數據大量增長以至於無法使用有效的緩存時尤為明顯。或多或少隨即訪問大數據庫時,就必然會有至少一次磁盤搜索來讀數據,兩次磁盤搜索來寫數據。最小化這個問題的辦法就是降低磁盤搜索次數。
增加有效磁盤馬達數量(這能減少搜索時的開銷)或者將不同的文件鏈接到不同的磁盤上又或者分盤:
使用符號鏈接
意思是,把 MyISAM 表的索引文件和/或數據文件從數據目錄下通常的地方鏈接到其他磁盤上(這也是分盤)。如果這個磁盤沒有其他用途的話,這對讀寫次數都比較好。詳情請看"7.6.1 Using Symbolic Links"。
分盤
如果有好幾個磁盤,就把第一個區塊放在第一個磁盤,把第二個區塊放在第二個磁盤,以此類推。這意味著正常的數據大小比分盤後的數據小(或者完全一樣),這能獲得更好性能。分盤完全依賴於操作系統以及分盤的大小,因此要用不同的分盤大小基准測試應用程序。詳情請看"7.1.5 Using Your Own Benchmarks"。基准測試的速度的不同完全依賴於分盤大小。依賴分盤設置參數以及磁盤數量,會得到大量不同的測量結果。必須隨機或者順序選擇優化方法。
可能會為了可靠性采用 RAID 0+1,這時,就必須用 2*N 個驅動去來保存 N 個驅動器上的數據。如果有足夠的內存這可能是最好的方法。不過,這也需要使用卷管理軟件來有效地管理數據。
另一個好辦法是RAID的級別根據數據的重要性而定。例如,把能重新生成的有點重要的數據保存在RAID 0磁盤上,把很重要的數據如主機信息日志等保存在RAID 0+1或者RAID N磁盤上。RAID N在有很多個寫入時可能會有問題,因為會同時請求更新同一個字節位。
在Linux上,可以用 hdparm 來配置磁盤接口以獲得更好的性能(在負載下高達100%也不是不可能的)。以下 hdparm 配置選項對MySQL就很合適,對其他應用程序可能也不錯:
hdparm -m 16 -d 1
注意,當使用這個命令之後性能和可靠性會依賴硬件,因此我們強烈建議在使用 hdparm 後一定要做測試。請查閱 hdparm 的手冊。如果沒有正確使用 hdparm,則可能導致文件系統沖突,所以在試驗之前備份一下。
還可以在數據庫使用的文件系統上設置其參數:如果無需知道文件的最後訪問時間(這對數據庫系統沒用),則在掛載文件系統時使用 -o noatime 選項。這就會略過更新文件系統節點的最後訪問時間,也就減少了磁盤搜索。在很多操作系統上,可以在掛載文件系統是使用 -o async 選項以異步更新它。如果你的機器相當的穩定,這會帶來性能提升但可靠性並沒犧牲多少(默認只能在Linux上這樣用)。
1、使用符號鏈接
可以把數據表或者數據庫移動到別的目錄下,然後用符號鏈接到新的位置來代替。你可能想這麼做,例如,想要把表分布到不同的磁盤上以提高系統速度,就把它們移動到有更多剩余空間的磁盤上。
建議只是把數據庫鏈接到其他磁盤上,數據表的鏈接是最後的選擇。
1.1 在 Unix 上符號鏈接數據庫
在Unix上,給數據庫做符號鏈接的方法是先在其他磁盤上創建一個目錄,然後再把它鏈接到MySQL數據文件目錄下。
shell> mkdir /dr1/databases/test
shell> ln -s /dr1/databases/test /path/to/datadir
MySQL不支持把一個目錄鏈接成多個數據庫。只要沒有在數據庫間做符號鏈接,那麼它就沒問題。假使在MySQL數據文件目錄下已經有一個數據庫 db1 了,然後把 db1 鏈接到 db2 :
shell> cd /path/to/datadir
shell> ln -s db1 db2
現在,在 db1 中的表 tbl_a,也會在 db2 中出現。如果有一個客戶端要更新 db1.tbl_a 而另一個要更新 db1.tbl_a,這時就會出問題了。
如果確實需要這麼做,那麼就修改一個源文件。要修改的文件根據MySQL版本不同而不同。MySQL 4.0或更新,在 `mysys/my_symlink.c' 文件中找到以下語句:
if (!(MyFlags & MY_RESOLVE_LINK) ||
(!lstat(filename,&stat_buff) && S_ISLNK(stat_buff.st_mode)))
MySQL 4.0以前,在 `mysys/mf_format.c' 文件中找到如下語句:
if (flag & 32 || (!lstat(to,&stat_buff) && S_ISLNK(stat_buff.st_mode)))
然後把這個語句改成:
if (1)
在Windows上,在編譯MySQL時使用選項 -DUSE_SYMDIR 就能內置支持目錄符號鏈接。這可以讓你把不同的數據庫放到不同的磁盤上。
1.2 在 Unix 上符號鏈接數據表
在MySQL 4.0以前,除非特別小心否則不要鏈接數據表。有一個問題是,當在一個符號鏈接表上執行 ALTER TABLE, REPAIR TABLE, 或 OPTIMIZE TABLE 時,符號鏈接就會被刪除然後替換成原來的文件。這是因為執行這些語句時,需要在數據庫目錄下創建臨時文件,然後在操作完成後把臨時文件替換到原來的文件中去。
最好不要在不能很好支持 realpath() 調用的操作系統上鏈接數據表(不過至少Linux和Solaris支持 realpath())。執行 SHOW VARIABLES LIKE 'have_symlink' 語句來檢查你的系統是否支持符號鏈接。
在MySQL 4.0,MyISAM 表完全支持符號鏈接。而其他表類型如果也做符號鏈接的話,則很可能在執行語句前會碰到一些奇怪的問題。
MySQL 4.0中的 MyISAM 表符號鏈接以如下方式工作:
在數據目錄下,總是有表定義文件,以及數據文件,以及索引文件。數據和索引文件可以被移動到任何處然後用符號鏈接代替,但是表定義文件不可以。
可以分別把數據和索引文件鏈接到不同目錄下。
在 MySQLd 沒有運行時可以用命令行 ln -s 手工完成符號鏈接。如果用SQL,可以在 CREATE TABLE 時使用選項 DATA DIRECTORY 和 INDEX DIRECTORY 告訴服務器使用符號鏈接。詳情請看"14.2.6 CREATE TABLE Syntax"。
myisamchk 不會替換符號鏈接的數據或索引文件。它直接在符號鏈接指向的文件上操作。任何臨時文件都創建在數據或索引文件所在的目錄下。
當刪除一個符號鏈接的表後,鏈接表及其指向的表都會被刪除。這就是為什麼不能以 root 身份運行 mysqld 的原因,同樣地,不要允許用戶有權寫MySQL數據庫目錄。
如果用 ALTER TABLE ... RENAME 語句重命名一個表且沒有把它移動到其他數據庫下,那麼在數據庫目錄下的文件就被改名了,相應地,它指向的數據或索引文件也改名了。
如果用 ALTER TABLE ... RENAME 語句把表移動到其他數據庫下,則這個表就移動到其他數據庫目錄下。舊的鏈接及其所指向的文件都被刪掉。換言之,新的表就不再被符號鏈接了。
如果沒有使用符號鏈接,那麼就給 MySQLd 增加選項 --skip-symbolic-links
確保無人能刪除或重命名數據文件目錄以外的文件。
在MySQL 4.0.15以前, SHOW CREATE TABLE 語句不會報告一個表是否有符號鏈接。MySQLdump 也一樣,它是用 SHOW CREATE TABLE 來產生 CREATE TABLE 語句的。
表符號鏈接操作還不支持:
ALTER TABLE 操作會忽略 DATA DIRECTORY 和 INDEX DIRECTORY 表選項。
BACKUP TABLE 和 RESTORE TABLE 也沒考慮符號鏈接。
`.frm` 文件肯定不能被符號鏈接(在前面提到,索引及數據文件可以被符號鏈接)。企圖這麼做(比如用同義)的話就會導致一些錯誤。假設有在數據庫目錄下有一個數據庫 db1,庫裡有一個表 tbl1,在 db1 目錄下把 tbl2 符號鏈接到 tbl1:
shell> cd /path/to/datadir/db1
shell> ln -s tbl1.frm tbl2.frm
shell> ln -s tbl1.MYD tbl2.MYD
shell> ln -s tbl1.MYI tbl2.MYI
現在如果有一個線程讀取 db1.tbl1 而另一個線程更新 db1.tbl2 時就有問題了:
查詢緩存就會被愚弄了(它認為 tbl1 沒有被更新,因此返回out-of-data結果)。
在 tbl2 上執行 ALTER 語句也會失敗。
1.3 在 Windows 上符號鏈接數據庫
從MySQL 3.23.16開始,Windows上支持用 -DUSE_SYMDIR 選項編譯 mysqld-max 和 MySQL-max-nt 服務器。這就可以通過符號鏈接把一個數據庫放在其他磁盤上。這跟在Unix上做符號鏈接相似,只是設置過程不大一樣而已。
從MySQL 4.0開始,默認支持符號鏈接。如果不需要,用 skip-symbolic-links 選項關閉它。
[MySQLd]
skip-symbolic-links
在MySQL 4.0以前,默認不支持符號鏈接。想要支持它,就要在 `my.cnf' 或 `my.ini' 文件中增加如下內容:
[MySQLd]
symbolic-links
在Windows上,在MySQL數據文件目錄下創建一個包含目標目錄路徑的文件來做符號鏈接。這個文件的名字叫 `db_name.sym`,db_name 是數據庫的名字。
假設MySQL數據文件目錄是 `C:\MySQL\data',現在想要把數據庫 foo 放在 `D:\data\foo` 目錄下。按以下方法設置:
確認 `D:\data\foo` 目錄存在,如果有必要就創建它。如果在數據文件目錄下已經存在一個數據庫目錄名為 `foo`,那麼就把它移動到下 `D:\data`。否則,符號鏈接就不生效。移動數據庫的時候最好不要運行服務器,以避免可能出現的問題。
創建一個文件 `C:\MySQL\data\foo.sym`,它的內容是路徑 D:\data\foo\。
之後,數據庫 foo 下的所有表都會創建到`D:\data\foo` 下。注意,如果在MySQL數據文件目錄下已經存在該數據庫目錄,那麼就不會使用符號鏈接了。