1. 縱向分表
縱向分表是指將一個有20列的表根據列拆分成兩個表一個表10列一個表11列,這樣單個表的容量就會減少很多,可以提高查詢的性能,並在一定程度上減少鎖行,鎖表帶來的性能損耗。
縱向分表的原則是什麼呢,應該怎樣拆分呢?答案是根據業務邏輯的需要來拆分,對於一張表如果業務上分兩次訪問某一張表其中一部分數據,那麼就可以根據每次訪問列的不同來做拆分; 另外還可以根據列更新的頻率來拆分,例如某些列每天要更新3次,有些列從創建開始基本上很少更新。
舉例:
假定場景,我有一張用戶表,這張表包含列:
ID, UserName, Password, RealName, Gender, Email, IsEmailValid, Birthday, Country, City, Address, Mobile, Phone, ZipCode, Hometown, OfficePhone, Company, Position, Industry, LatestLoginTime, LatestLoginIP, LoginTimes,OnlineMinutes
假定現在我們的登錄出現了性能問題,用戶登錄經常出現數據庫超時的現象。我們打算用拆表的方法解決這個問題。先看下涉及到登錄的字段有:UserName,Password,LatestLoginTime,LatestLoginIP,LoginTimes;那麼我們就可以以此為依據將原表拆分為:UserLogin和UserBase 兩個表,後者包含除了登錄信息的其他列信息;兩張表都要包含主鍵ID。
2. 橫向分區
橫向分區是將表從行的角度拆分,例如將創建時間在05年之前的數據放在一個分區上,將05年到08年之間的數據放到另一個分區上,以此類推。橫向分區所根據的列必須在聚集索引上,通常會根據時間,主鍵id等進行劃分。
橫向分區將數據劃分為不同的區,在根據分區列條件進行查詢時可以縮小查詢的范圍,從而提高查詢的性能;另外如果數據庫服務器有多個cpu,則可以通過並行操作獲得更好的性能。
到底要根據那個列進行橫向的分區和查詢有關系,我們在建表的時候需要分析,會根據那個列進行查詢。
舉例:
1. 訂單是一個實效性很強的實體,我們很少查詢幾年前的訂單數據,我們就可以在訂單的創建時間列上創建分區函數來做分區。
2. 比如帖子通常情況下只有在首頁推薦的最新的帖子被訪問次數很多,而幾年前的帖子被訪問的幾率較小,這時候我們可以根據帖子的主鍵id來做分區,id小於300w的在一個分區上,id在300到600w之間的在一個分區上。
有關分區的更多信息,請參考高性能網站建設之 MS Sql Server數據庫分區
有關如何進行分區,請參考Sql Server 分區演練