程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> Sql分區表理解及實現

Sql分區表理解及實現

編輯：關於SqlServer

　　如果你的數據庫中某一個表中的數據滿足以下幾個條件，那麼你就要考慮創建分區表了。

　　1、數據庫中某個表中的數據很多。很多是什麼概念?一萬條?兩萬條?還是十萬條、一百萬條?這個，我覺得是仁者見仁、智者見智的問題。當然數據表中的數據多到查詢時明顯感覺到數據很慢了，那麼，你就可以考慮使用分區表了。如果非要我說一個數值的話，我認為是100萬條。

　　2、但是，數據多了並不是創建分區表的惟一條件，哪怕你有一千萬條記錄，但是這一千萬條記錄都是常用的記錄，那麼最好也不要使用分區表，說不定會得不償失。只有你的數據是分段的數據，那麼才要考慮到是否需要使用分區表。

　　3、什麼叫數據是分段的?這個說法雖然很不專業，但很好理解。比如說，你的數據是以年為分隔的，對於今年的數據而言，你常進行的操作是添加、修改、刪除和查詢，而對於往年的數據而言，你幾乎不需要操作，或者你的操作往往只限於查詢，那麼恭喜你，你可以使用分區表。換名話說，你對數據的操作往往只涉及到一部分數據而不是所有數據的話，那麼你就可以考慮什麼分區表了。

　　那麼，什麼是分區表呢?

　　簡單一點說，分區表就是將一個大表分成若干個小表。假設，你有一個銷售記錄表，記錄著每個每個商場的銷售情況，那麼你就可以把這個銷售記錄表按時間分成幾個小表，例如說5個小表吧。2009年以前的記錄使用一個表，2010年的記錄使用一個表，2011年的記錄使用一個表，2012年的記錄使用一個表，2012年以後的記錄使用一個表。那麼，你想查詢哪個年份的記錄，就可以去相對應的表裡查詢，由於每個表中的記錄數少了，查詢起來時間自然也會減少。

　　但將一個大表分成幾個小表的處理方式，會給程序員增加編程上的難度。以添加記錄為例，以上5個表是獨立的5個表，在不同時間添加記錄的時候，程序員要使用不同的SQL語句，例如在2011年添加記錄時，程序員要將記錄添加到2011年那個表裡;在2012年添加記錄時，程序員要將記錄添加到2012年的那個表裡。這樣，程序員的工作量會增加，出錯的可能性也會增加。

　　使用分區表就可以很好的解決以上問題。分區表可以從物理上將一個大表分成幾個小表，但是從邏輯上來看，還是一個大表。

　　接著上面的例子，分區表可以將一個銷售記錄表分成五個物理上的小表，但是對於程序員而言，他所面對的依然是一個大表，無論是2010年添加記錄還是2012年添加記錄，對於程序員而言是不需要考慮的，他只要將記錄插入到銷售記錄表——這個邏輯中的大表裡就行了。SQL Server會自動地將它放在它應該呆在的那個物理上的小表裡。

　　同樣，對於查詢而言，程序員也只需要設置好查詢條件，OK，SQL Server會自動將去相應的表裡查詢，不用管太多事了。

　　這一切是不是很誘人?

　　的確，那麼我們就可以開始動手創建分區表了。

　　第一、創建分區表的第一步，先創建數據庫文件組，但這一步可以省略，因為你可以直接使用PRIMARY文件。但我個人認為，為了方便管理，還是可以先創建幾個文件組，這樣可以將不同的小表放在不同的文件組裡，既便於理解又可以提高運行速度。創建文件組的方法很簡單，打開SQL Server Management Studio，找到分區表所在數據庫，右鍵單擊，在彈出的菜單裡選擇“屬性”。然後選擇“文件組”選項，再單擊下面的“添加”按鈕，如下圖所示：

　　第二，創建了文件組之後，還要再創建幾個數據庫文件。為什麼要創建數據庫文件，這很好理解，因為分區的小表必須要放在硬盤上，而放在硬盤上的什麼地方呢?當然是文件裡啦。再說了，文件組中沒有文件，文件組還要來有啥用呢?還是在上圖的那個界面，選擇“文件”選項，然後添加幾個文件。在添加文件的時候要注意以下幾點：

　　1、不要忘記將不同的文件放在文件組中。當然一個文件組中也可以包含多個不同的文件。

　　2、如果可以的話，將不同的文件放在不同的硬盤分區裡，最好是放在不同的獨立硬盤裡。要知道IQ的速度往往是影響SQL Server運行速度的重要條件之一。將不同的文件放在不同的硬盤上，可以加快SQL Server的運行速度。

　　在本例中，為了方便起見，將所有數據庫文件都放在了同一個硬盤下，並且每個文件組中只有一個文件。如下圖所示。

　　第三、創建一個分區函數。這一步是必須的了，創建分區函數的目的是告訴SQL Server以什麼方式對分區表進行分區。這一步必須要什麼SQL腳本來完成。以上面的例子，我們要將銷售表按時間分成5個小表。假設劃分的時間為：

　　第1個小表：2010-1-1以前的數據(不包含2010-1-1)。

　　第2個小表：2010-1-1(包含2010-1-1)到2010-12-31之間的數據。

　　第3個小表：2011-1-1(包含2011-1-1)到2011-12-31之間的數據。

　　第4個小表：2012-1-1(包含2012-1-1)到2012-12-31之間的數據。

　　第5個小表：2013-1-1(包含2013-1-1)之後的數據。

　　那麼分區函數的代碼如下所示：

　　[c-sharp] view plaincopy CREATE PARTITION FUNCTION partfunSale (datetime)

　　AS RANGE RIGHT FOR VALUES ('20100101','20110101','20120101','20130101')

　　其中：

　　1、CREATE PARTITION FUNCTION意思是創建一個分區函數。

　　2、partfunSale為分區函數名稱。

　　3、AS RANGE RIGHT為設置分區范圍的方式為Right，也就是右置方式。

　　4、FOR VALUES ('20100101','20110101','20120101','20130101')為按這幾個值來分區。

　　這裡需要說明的一下，在Values中，'20100101'、'20110101'、'20120101'、'20130101'，這些都是分區的條件。“ 20100101”代表2010年1月1日，在小於這個值的記錄，都會分成一個小表中，如表1;而小於或等於'20100101'並且小於'20110101'的值，會放在另一個表中，如表2。以此類推，到最後，所有大小或等於'20130101'的值會放在另一個表中，如表5。

　　也許有人會問，為什麼值“ 20100101”會放在表2中，而不是表1中呢?這是由AS RANGE RIGHT中的RIGHT所決定的，RIGHT的意思是將等於這個值的數據放在右邊的那個表裡，也就是表2中。如果您的SQL語句中使用的是Left而不是RIGHT，那麼就會放在左邊的表中，也就是表1中。

　　第四、創建一個分區方案。分區方案的作用是將分區函數生成的分區映射到文件組中去。分區函數的作用是告訴SQL Server，如何將數據進行分區，而分區方案的作用則是告訴SQL Server將已分區的數據放在哪個文件組中。分區方案的代碼如下所示：

　　[c-sharp] view plaincopy CREATE PARTITION SCHEME partschSale

　　AS PARTITION partfunSale

　　TO (

　　Sale2009,

　　Sale2010,

　　Sale2011,

　　Sale2012,

　　Sale2013)

　　其中：

　　1、CREATE PARTITION SCHEME意思是創建一個分區方案。