我們知道SQLSERVER的數據行的存儲有兩種數據結構:A: 堆 B :B樹(binary 二叉樹)
數據按照這種兩種的其中一種來排序和存儲,學過數據結構的朋友應該知道二叉樹,為什麽用二叉樹,因為方便用二分查找法來快速
找到數據。如果是堆,那麼數據是不按照任何順序排序的,也沒有任何結構,數據頁面也不是首尾相連的,不像B樹,數據頁面
使用雙向鏈表首尾相連。堆表只依靠表裡的IAM頁(索引分配映射頁)將堆的頁面聯系在一起,IAM裡記錄了頁面編號,頁面位置
除非表裡有聚集索引,如果沒有的話那麼表裡的數據的存儲就是堆結構
那麼非聚集索引呢?非聚集索引也是堆結構?其實SQLSERVER有幾種頁面類型(數據都使用一頁一頁來存儲,就像Windows的內存也是使用頁面來組織的)
其中有一種是索引頁 ,一種是數據頁
我感覺很多書都說不清,就像我一樣,在文章的開頭也是這樣說的:數據行的存儲有兩種數據結構:A: 堆 B :B樹(二叉樹)
我覺得應該是數據頁面的存儲有兩種數據結構:1、堆 2、B樹
先說一下:索引頁,不管是聚集索引還是非聚集索引,這些索引數據都存放在索引頁,而索引頁都是按照B樹的結構裡存儲的
而堆頁:也就是實際的數據行,如果表裡沒有聚集索引,那麼實際的數據就放在堆頁,如果聚集索引,那麼數據就放在索引頁
而B樹裡的節點 ,其實又叫頁面,又叫節點 在B樹裡會有一頁:root page(亦即是根節點),非聚集索引和聚集索引都是一樣的
所以:數據行的存儲有兩種數據結構:A: 堆 B :B樹(二叉樹)
上面這句話應該明白了吧?
在說一下,在堆裡的數據頁面完全是隨機存放的,而數據頁面之間唯一的邏輯連接是記錄在IAM頁裡的,所以IAM頁也就扮演了root page的角色
那麼聚集索引呢?聚集索引也是堆結構?
非聚集索引放在索引頁,B樹結構,數據依舊放在堆頁,那麼如果數據頁放在堆裡,不像聚集索引放在B樹的葉子節點裡
(亦即是放在索引頁裡),那麼非聚集索引和實際的數據如何發生聯系呢?
答案是:在非聚集索引的葉子節點(葉子頁面)會有行定位器,而行定位器的作用請看下面紅色字
非聚集索引與聚集索引具有相同的B樹結構,他們之間的顯著差別在於以下兩點:
(1)基礎表的數據行不按非聚集鍵的順序排序和存儲
(2)非聚集索引的葉層是由索引頁而不是由數據頁組成
(3)建立非聚集索引的表可以是一個B樹,也可以是一個堆
(4)如果表是堆(意味著該表沒有聚集索引),行定位器指向行的指針。該指針是由文件標識符ID:頁碼:頁上的行數生成。整個
指針稱為行ID(RID)
(5)如果表有聚集索引或索引視圖上有聚集索引,則行定位器會指向聚集索引鍵。SQL通過使用存儲在非聚集索引的葉子內的
指針(指向聚集索引鍵)搜索聚集索引來檢索實際數據
非聚集索引不會改變或改善實際數據頁的存儲模式。他的B樹結構只針對自己的索引頁面。
不過,非聚集索引跟聚集索引的作用還是一樣的,相當於檢字表
最後總結一下吧,這麽短的隨筆總結啥子呢?
當然是總結表的結構,因為曾經有人在論壇裡問過一張表的結構
A 有聚集索引的表或者有聚集索引也有非聚集索引 (B樹)
B 沒有任何索引(堆)
C 沒有聚集索引,有非聚集索引(B樹+堆)
論壇裡有人簡稱A為聚集表 ,B和C為堆表
記得以前在大學裡數據結構老師講過的一些數據結構:大根堆 ,小根堆 ,雙向鏈表,二叉樹
可惜現在全部還給老師了
附上圖片
堆表的結構
非聚集索引的結構
聚集索引的結構