如果你正在負責一個基於SQL Server的項目,或者你剛剛接觸SQL Server,你都有可能要面臨一些數據庫性能的問題,這篇文章會為你提供一些有用的指導(其中大多數也可以用於其它的DBMS)。
在這裡,我不打算介紹使用SQL Server的竅門,也不能提供一個包治百病的方案,我所做的是總結一些經驗----關於如何形成一個好的設計。這些經驗來自我過去幾年中經受的教訓,一直來,我看到許多同樣的設計錯誤被一次又一次的重復。
你了解你的工具嗎?
不要輕視這一點,這是我在這篇文章中講述的最關鍵的一條。也許你也看到有很多的SQL Server程序員沒有掌握全部的T-SQL命令和SQL Server提供的那些有用的工具。
“什麼?我要浪費一個月的時間來學習那些我永遠也不會用到的SQL命令???”,你也許會這樣說。對的,你不需要這樣做。但是你應該用一個周末浏覽所有的T-SQL命令。在這裡,你的任務是了解,將來,當你設計一個查詢時,你會記起來:“對了,這裡有一個命令可以完全實現我需要的功能”,於是,到MSDN查看這個命令的確切語法。
不要使用游標
讓我再重復一遍:不要使用游標。如果你想破壞整個系統的性能的話,它們倒是你最有效的首選辦法。大多數的初學者都使用游標,而沒有意識到它們對性能造成的影響。它們占用內存,還用它們那些不可思議的方式鎖定表,另外,它們簡直就像蝸牛。而最糟糕的是,它們可以使你的DBA所能做的一切性能優化等於沒做。不知你是否知道每執行一次FETCH就等於執行一次SELECT命令?這意味著如果你的游標有10000條記錄,它將執行10000次SELECT!如果你使用一組SELECT、UPDATE或者DELETE來完成相應的工作,那將有效率的多。
初學者一般認為使用游標是一種比較熟悉和舒適的編程方式,可很不幸,這會導致糟糕的性能。顯然,SQL的總體目的是你要實現什麼,而不是怎樣實現。
我曾經用T-SQL重寫了一個基於游標的存儲過程,那個表只有100,000條記錄,原來的存儲過程用了40分鐘才執行完畢,而新的存儲過程只用了10秒鐘。在這裡,我想你應該可以看到一個不稱職的程序員究竟在干了什麼!!!
我們可以寫一個小程序來取得和處理數據並且更新數據庫,這樣做有時會更有效。記住:對於循環,T-SQL無能為力。
我再重新提醒一下:使用游標沒有好處。除了DBA的工作外,我從來沒有看到過使用游標可以有效的完成任何工作。
規范化你的數據表
為什麼不規范化數據庫?大概有兩個借口:出於性能的考慮和純粹因為懶惰。至於第二點,你遲早得為此付出代價。而關於性能的問題,你不需要優化根本就不慢的東西。我經常看到一些程序員“反規范化”數據庫,他們的理由是“原來的設計太慢了”,可結果卻常常是他們讓系統更慢了。DBMS被設計用來處理規范數據庫的,因此,記住:按照規范化的要求設計數據庫。
不要使用SELECT *
這點不太容易做到,我太了解了,因為我自己就經常這樣干。可是,如果在SELECT中指定你所需要的列,那將會帶來以下的好處:
1 減少內存耗費和網絡的帶寬
2 你可以得到更安全的設計
3 給查詢優化器機會從索引讀取所有需要的列
了解你將要對數據進行的操作
為你的數據庫創建一個健壯的索引,那可是功德一件。可要做到這一點簡直就是一門藝術。每當你為一個表添加一個索引,SELECT會更快了,可INSERT和DELETE卻大大的變慢了,因為創建了維護索引需要許多額外的工作。顯然,這裡問題的關鍵是:你要對這張表進行什麼樣的操作。這個問題不太好把握,特別是涉及DELETE和UPDATE時,因為這些語句經常在WHERE部分包含SELECT命令。
不要給“性別”列創建索引
首先,我們必須了解索引是如何加速對表的訪問的。你可以將索引理解為基於一定的標准上對表進行劃分的一種方式。如果你給類似於“性別”這樣的列創建了一個索引,你僅僅是將表劃分為兩部分:男和女。你在處理一個有1,000,000條記錄的表,這樣的劃分有什麼意義?記住:維護索引是比較費時的。當你設計索引時,請遵循這樣的規則:根據列可能包含不同內容的數目從多到少排列,比如:姓名+省份+性別。
使用事務