編者按:數據庫性能優化和數據庫管理系統密切相關,不同的數據庫管理系統在具體操作上有很大不同。繼本報連續在2003年第48期、49期上刊登《Sybase數據庫性能調優》和《Oracle服務器性能調整攻略》,分別討論了Sybase和Oracle數據庫管理系統以後,本期我們將具體介紹SQL Server數據庫的性能優化方法。
數據庫是企業信息的核心,其應用水平的高低直接影響到企業管理水平。選擇了一個高性能的數據庫產品不等於就有一個好的數據庫應用系統,如果數據庫系統設計不合理,不僅會增加客戶端和服務器端程序的編程和維護的難度,而且還會影響系統實際運行的性能。一般來講,在一個管理信息系統的分析、設計、測試和試運行階段,因為數據量較小,設計人員和測試人員往往只注意到功能的實現,而很少會注意到性能的不足,等到系統投入實際運行一段時間後,才發現系統的性能在降低,這時再來考慮提高系統性能則要花費更多的人力、物力,而其最終結果就是給整個系統又打上了一個補丁,所以設計階段是優化的重點。本文以SQL Server數據庫為例,從以下幾個方面討論如何實現數據庫系統的性能優化。
數據庫設計
實現SQL Server數據庫的優化,首先要有一個好的數據庫設計方案。在實際工作中,許多SQL Server方案往往是由於數據庫設計得不好導致性能很差。實現良好的數據庫設計必須考慮這些問題:
1. 邏輯數據庫規范化問題
一般來說,邏輯數據庫設計會滿足規范化的前3級標准:
第1規范:沒有重復的組或多值的列;
第2規范: 每個非關鍵字段必須依賴於主關鍵字,不能依賴於一個組合式主關鍵字的某些組成部分;
第3規范: 一個非關鍵字段不能依賴於另一個非關鍵字段。
遵守這些規則的數據庫設計會產生較少的列和更多的表,因而也就減少了數據冗余,也減少了用於存儲數據的頁。
2. 生成物理數據庫
要想正確選擇基本物理實現策略,必須了解和利用好數據庫訪問格式和硬件資源的操作特點,特別是內存和磁盤子系統I/O。以下是一些常用技巧:
與每個表列相關的數據類型應該反映數據所需的最小存儲空間,特別是對於被索引的列更是如此。比如能使用smallint類型就不要用integer類型,這樣索引字段可以被更快地讀取,而且可以在一個數據頁上放置更多的數據行,因而也就減少了I/O操作。
把一個表放在某個物理設備上,再通過SQL Server的段把它的不分簇索引放在一個不同的物理設備上,這樣能提高性能。尤其是系統采用了多個智能型磁盤控制器和數據分離技術的情況下,這樣做的好處更加明顯。
用SQL Server段把一個頻繁使用的大表分割開,並放在多個單獨的智能型磁盤控制器的數據庫設備上,這樣也可以提高性能。因為有多個磁頭在查找,所以數據分離也能提高性能。
用SQL Server段把文本或圖像列的數據存放在一個單獨的物理設備上可以提高性能。一個專用的智能型的控制器能進一步提高性能。
應用系統設計
在應用系統的設計中,要著重考慮以下幾點:
1.合理使用索引
索引是數據庫中重要的數據結構,它的根本目的就是提高查詢效率。索引的使用要恰到好處,其使用原則如下:
在經常進行連接,但是沒有指定為外鍵的列上建立索引,而不經常連接的字段則由優化器自動生成索引;在頻繁進行排序或分組(即進行group by或order by操作)的列上建立索引;在條件表達式中經常用到的不同值較多的列上建立索引,在不同值少的列上不要建立索引。比如在雇員表的“性別”列上只有“男”與“女”兩個不同值,因此就無必要建立索引。如果建立索引不但不會提高查詢效率,反而會嚴重降低更新速度。 如果待排序的列有多個,可以在這些列上建立復合索引。
2. 避免或簡化排序
應當盡量簡化或避免對大型表進行重復的排序。當能夠利用索引自動以適當的次序產生輸出時,優化器就避免了排序這個步驟。為了避免不必要的排序,就要正確地增建索引,合理地合並數據庫表(盡管有時可能影響表的規范化,但相對於效率的提高是值得的)。如果排序不可避免,那麼應當試圖簡化它,如縮小排序的列的范圍等。
3.消除對大型表行數據的順序存取
在嵌套查詢中,表的順序存取對查詢效率可能產生致命的影響。我們有時可以使用並集來避免順序存取。盡管也許在所有的檢查列上都有索引,但某些形式的where子句會強迫優化器使用順序存取,這一點也應注意。
4. 避免相關子查詢
如果一個列同時在主查詢和where子句中出現,很可能當主查詢中的列值改變之後,子查詢必須重新查詢一次。而且查詢嵌套層次越多,效率越低,因此應當盡量避免子查詢。如果子查詢不可避免,那麼要在子查詢中過濾掉盡可能多的行。
5.避免困難的正規表達式
Mathes和Like關鍵字支持通配符匹配,但這種匹配特別耗時。例如:SELECT * FROM customer WHERE zipcode LIKE “98_ _ _”,即使在zipcode字段上已建立了索引,在這種情況下也還是采用順序掃描的方式。如果把語句改為:SELECT * FROM customer WHERE zipcode >“98000”,在執行查詢時就會利用索引來查詢,顯然會大大提高速度。
6.使用臨時表加速查詢
把表的一個子集進行排序並創建臨時表,有時能加速查詢。它有助於避免多重排序操作,而且在其他方面還能簡化優化器的工作。臨時表中的行要比主表中的行少,而且物理順序就是所要求的順序,減少了磁盤I/O,所以查詢工作量可以得到大幅減少。但要注意,臨時表創建後不會反映主表的修改。在主表中數據頻繁修改的情況下,注意不要丟失數據。
操作系統相關優化
操作系統性能的好壞直接影響數據庫的使用性能,如果操作系統存在問題,如CPU過載、過度內存交換、磁盤I/O瓶頸等,在這種情況下,單純進行數據庫內部性能調整是不會改善系統性能的。我們可以通過Windows NT的系統監視器(System Monitor)來監控各種設備,發現性能瓶頸。
CPU 一種常見的性能問題就是缺乏處理能力。系統的處理能力是由系統的CPU數量、類型和速度決定的。如果系統沒有足夠的CPU處理能力,它就不能足夠快地處理事務以滿足需要。我們可以使用System Monitor確定CPU的使用率,如果以75%或更高的速率長時間運行,就可能碰到了CPU瓶頸問題,這時應該升級CPU。但是升級前必須監視系統的其他特性,如果是因為SQL語句效率非常低,優化語句就有助於解決較低的CPU利用率。而當確定需要更強的處理能力,可以添加CPU或者用更快的CPU 替換。
內存 SQL Server可使用的內存量是SQL Server性能最關鍵因素之一。而內存同I/O子系統的關系也是一個非常重要的因素。例如,在I/O操作頻繁的系統中,SQL Server用來緩存數據的可用內存越多,必須執行的物理I/O也就越少。這是因為數據將從數據緩存中讀取而不是從磁盤讀取。同樣,內存量的不足會引起明顯的磁盤讀寫瓶頸,因為系統緩存能力不足會引起更多的物理磁盤I/O。
可以利用System Monitor檢查SQL Server的Buffer Cache Hit Ratio計數器,如果命中率經常低於90%,就應該添加更多的內存。
I/O子系統 由I/O子系統發生的瓶頸問題是數據庫系統可能遇到的最常見的同硬件有關的問題。配置很差的I/O子系統引起性能問題的嚴重程度僅次於編寫很差的SQL語句。I/O子系統問題是這樣產生的,一個磁盤驅動器能夠執行的I/O操作是有限的,一般一個普通的磁盤驅動器每秒只能處理85次I/O操作,如果磁盤驅動器超載,到這些磁盤驅動器的I/O操作就要排隊,SQL的I/O延遲將很長。這可能會使鎖持續的時間更長,或者使線程在等待資源的過程中保持空閒狀態,其結果就是整個系統的性能受到影響。
解決I/O子系統有關的問題也許是最容易的,多數情況下,增加磁盤驅動器就可以解決這個性能問題。
當然,影響性能的因素很多,而應用又各不相同,找出一個通用的優化方案是很困難的,只能是在系統開發和維護的過程中針對運行的具體情況,不斷加以調整。
(計算機世界報 第200402期 C12)