前面各段介紹了普通的 MySQL 用戶利用表創建和索引操作,以及利用查詢的編寫能夠進行的優化。不過,還有一些只能由 MySQL 管理員和系統管理員來完成的優化,這些管理員在 MySQL 服務器或運行 MySQL 的機器上具有控制權。有的服務器參數直接適用於查詢處理,可將它們打開。而有的硬件配置問題直接影響查詢處理速度,應該對它們進行調整。
磁盤問題
正如前面所述,磁盤尋道是一個性能的大瓶頸。當數據開始增長以致緩存變得不可能時,這個問題變得越來越明顯。對大數據庫,在那你或多或少地要隨機存取數據,你可以依靠你將至少需要一次磁盤尋道來讀取並且幾次磁盤尋道寫入。為了使這個問題最小化,使用有低尋道時間的磁盤。
為了增加可用磁盤軸的數量(並且從而減少尋道開銷),符號聯接文件到不同磁盤或分割磁盤是可能的。
1、使用符號連接
這意味著你將索引/數據文件符號從正常的數據目錄鏈接到其他磁盤(那也可以被分割的)。這使得尋道和讀取時間更好(如果磁盤不用於其他事情)
2、分割
分割意味著你有許多磁盤並把第一塊放在第一個磁盤上,在第二塊放在第二個磁盤上,並且第 n塊在第(n mod number_of_disks)磁盤上,等等。這意味著,如果你的正常數據大小於分割大小(或完美地排列過),你將得到較好一些的性能。注意,分割是否很依賴於OS和分割大小。因此用不同的分割大小測試你的應用程序。見10.8 使用你自己的基准。注意對分割的速度差異很依賴於參數,取決於你如何分割參數和磁盤數量,你可以得出以數量級的不同。注意你必須選擇為隨機或順序存取優化。
為了可靠,你可能想要使用襲擊RAID 0+1(分割+鏡像),但是在這種情況下,你將需要2*N個驅動器來保存N個驅動器的數據。如果你有錢,這可能是最好的選擇!然而你也可能必須投資一些卷管理軟件投資以高效地處理它。
一個好選擇是讓稍重要的數據(它能再生)上存在RAID 0磁盤上,而將確實重要的數據(像主機信息和日志文件)存在一個RAID 0+1或RAID N磁盤上。如果因為更新奇偶位你有許多寫入,RAID N可能是一個問題。
你也可以對數據庫使用的文件系統設置參數。一個容易的改變是以noatime選項掛裝文件系統。這是它跳過更新在inode中的最後訪問時間,而且這將避免一些磁盤尋道。
硬件問題
可利用硬件更有效地改善服務器的性能:
1、在機器中安裝更多的內存。這樣能夠增加服務器的高速緩存和緩沖區的尺寸,使服務器更經常地使用存放在內存中的信息,降低從磁盤取信息的要求。
2、如果有足夠的 RAM 使所有交換在內存文件系統中完成,那麼應該重新配置系統,去掉所有磁盤交換設置。否則,即使有足以滿足交換的 RAM,某些系統仍然要與磁盤進行交換。
3、增加更快的磁盤以減少 I/O 等待時間。尋道時間是這裡決定性能的主要因素。逐字地移動磁頭是很慢的,一旦磁頭定位,從磁道讀塊則較快。
在不同的物理設備上設法重新分配磁盤活動。如果可能,應將您的兩個最繁忙的數據庫存放在不同的物理設備上。請注意,使用同一物理設備上的不同分區是不夠的。這樣沒有幫助,因為它們仍將爭用相同的物理資源磁盤頭)。移動數據庫的過程在第 10 章中介紹。
4、在將數據重新放到不同設備之前,應該保證了解該系統的裝載特性。如果在特定的物理設備上已經有了某些特定的主要活動,將數據庫放到該處實際上可能會使性能更壞。例如,不要把數據庫移到處理大量Web 通信的Web 服務器設備上。
5、在設置 MySQL 時,應該配置其使用靜態庫而不是共享庫。使用共享庫的動態二進制系統可節省磁盤空間,但靜態二進制系統更快然而,如果希望裝入用戶自定義的函數,則不能使用靜態二進制系統,因為 UDF 機制依賴於動態連接)。
服務器參數的選擇
服務器有幾個能夠改變從而影響其操作的參數或稱變量)。系統變量的當前值可以通過執行mysqladmin varibles命令來檢查,其中幾個參數主要與查詢有關,有必要在此提一下:
delayed_queue_size
此參數在執行其他 INSERT DELAYED 語句的客戶機阻塞以前,確定來自 INSERT DELAYED 語句的放入隊列的行的數目。增加這個參數的值使服務器能從這種請求中接收更多的行,因而客戶機可以繼續執行而不阻塞。
key_buffer_size
此參數為用來存放索引塊的緩沖區尺寸。如果內存多,增加這個值能節省索引創建和修改的時間。較大的值使 MySQL 能在內存中存儲更多的索引塊,這樣增加了在內存中找到鍵值而不用讀磁盤塊的可能性。
在 MySQL 3.23 版及以後的版本中,如果增加了鍵緩沖區的尺寸,可能還希望用 --init-file 選項啟動服務器。這樣能夠指定一個服務器啟動時執行的 SQL 語句文件。如果有想要存放在內存中的只讀表,可將它們拷貝到索引查找非常快的 HEAP 表。
back_log
引入客戶機連接請求的數量,這些請求在從當前客戶機中處理時排隊。如果你有一個很忙的站點,可以增加改變量的值。
編譯和鏈接怎樣影響MySQL的速度
大多數下列測試在Linux上並用MySQL基准進行的,但是它們應該對其他操作系統和工作負載給出一些指示。
當你用-static鏈接時,你得到最快的可執行文件。使用Unix套接字而非TCP/IP連接一個數據庫也可給出好一些的性能。
在Linux上,當用pgcc和-O6編譯時,你將得到最快的代碼。為了用這些選項編譯“sql_yacc.cc”,你需要大約200M內存,因為gcc/pgcc需要很多內存使所有函數嵌入inline)。在配置MySQL時,你也應該設定CXX=gcc以避免包括libstdc++庫(它不需要)。
只通過使用一個較好的編譯器或較好的編譯器選項,在應用中你能得到一個10-30%的加速。如果你自己編譯SQL服務器,這特別重要!
在Intel上,你應該例如使用pgcc或Cygnus CodeFusion編譯器得到最大速度。我們已經測試了新的 Fujitsu編譯器,但是它是還沒足夠不出錯來優化編譯MySQL。
這裡是我們做過的一些測量表:
·如果你以-O6使用pgcc並且編譯任何東西,mysqld服務器是比用gcc快11%用字符串99的版本)。
·如果你動態地鏈接(沒有-static),結果慢了13%。注意你仍能使用一個動態連接的MySQL庫。只有服務器對性能是關鍵的。
·如果你使用TCP/IP而非Unix套接字,結果慢7.5%。
·在一個Sun SPARCstation 10上,gcc2.7.3是比Sun Pro C++ 4.2快13%。
·在Solaris 2.5.1上,在單個處理器上MIT-pthreads比帶原生線程的Solaris慢8-12%。以更多的負載/cpus,差別應該變得更大。
由TcX提供的MySQL-Linux的分發用pgcc編譯並靜態鏈接。
總結
本節簡單介紹了如何在服務器級優化數據庫的性能,以及提高數據庫性能涉及到的硬件問題。選擇一個盡量快的系統,使用RAID磁盤陣列是非常容易想到的方法。
對於數據庫守護程序,既可以在編譯時就提供合適的參數,也可以在選項文件中提供需要優化的參數。
思考題
1、使用ANALYSE過程分析語句SELECT * FROM pet,判斷是否有必要改變列的類型。
2、現在讓你需要優化表pet,可以用那些手段做到?