程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> Sql Server中的非聚集索引詳細介

Sql Server中的非聚集索引詳細介

編輯:關於SqlServer

  非聚集索引,這個是大家都非常熟悉的一個東西,有時候我們由於業務原因,sql寫的非常復雜,需要join很多張表,然後就淚流滿面了。。。這時候就有DBA或者資深的開發給你看這個猥瑣的sql,通過執行計劃一分析。。。或許就看出了不該有的表掃描。。。萬惡之源。。。然後給你在關鍵的字段加上非聚集索引後。。。才發現提速比阿斯頓馬丁還要快。。。那麼一個問題來了,為什麼非聚集索引能提速這麼快。。。怎麼做到的???是不是非常的好奇???

這篇我們來解開神秘面紗。

 一:現象

      先讓我們一睹非聚集索引的真容,看看到底在執行計劃看來是個什麼玩意。。。我這裡有個product表,裡面灌了8w多數據,然後在Name列上建立

一個非聚集索引,就像下圖一樣:

  

從上圖中看到了兩個好玩的東西,一個就是我想看到的“索引查找[nonclustered]”,這個大家很熟悉,也是這篇要說的,然後我們還看到了一個“RID查找”,乍一看這是什麼雞巴玩意。。。非聚集索引跟它扯上什麼關系了???

二:什麼是RID

  通過前面幾篇,我想大家都知道了數據頁中的記錄是如何尋找的?秘密就是通過slot槽位中的偏移量決定的,那問題來了,如果上升到數據頁層面,我只需要(pageID:slotID)就可以找到記錄了,對不對?那如果我上升了文件層面,那是不是只需要知道(fileID:pageID:slotID)就可以找到數據頁中的 記錄了?其實這裡的RID就是站在文件的高度通過(fileID:pageID:slotID)找到表記錄的。。。既RID=RowID=(fileID:pageID:slotID),如果你非要眼見實的話,在sq中l還真提供了這麼個函數(sys.fn_PhysLocFormatter(%%physloc%%)),我們看下圖:

看了上面的圖,是不是很興奮,一目了然,比如productID=18088這條記錄,然來是在1號文件,34941號數據頁,0號槽位上,productID=18089是在1號槽位上,好了,當你知道RID是個什麼東西的時候,我想你已經離徹底理解非聚集索引不遠啦。。。

 三:非聚集索引

  有一點我們肯定知道,就是非聚集索引是可以加速查找的,要是跟表掃描那樣的龜速,那也就失去了索引的目的,既然能加速,是因為它和聚集索引一樣,在底層都玩起了B樹,首先我們插入一些樣例數據。

DROP TABLE dbo.Person

CREATE TABLE Person(ID INT IDENTITY,NAME CHAR(900))
CREATE INDEX idx_Person_Name ON dbo.Person(Name)

DECLARE @ch AS INT=97

WHILE @ch<=122
BEGIN
  INSERT INTO dbo.Person VALUES(REPLICATE(CHAR(@ch),5))
  SET @ch=@ch+1
END

上面的sql,我故意在Name列設置為900個char,這也是索引的上限值,這樣的話,我DBCC就可以導出很多數據頁和索引頁了。

可以看到,當我dbcc ind 的時候,發現Person表中已經有4個數據頁,5個索引頁,其中151號數據頁是表跟蹤頁,174號為索引跟蹤頁,這也就說明當我建立索引後,引擎給我們分配了專門的索引頁來存放我們建立的Name索引,那下一步就是我們來看看這些索引中都存放著什麼,這也是我非常關心的,接下來我導出173號索引頁。

復制代碼 代碼如下:
 DBCC PAGE(Ctrip,1,173,1)

Slot 0, Offset 0x60, Length 912, DumpStyle BYTE

Record Type = INDEX_RECORD      Record Attributes = NULL_BITMAP   Record Size = 912

Memory Dump @0x000000000EF1C060

0000000000000000:  16616161 61612020 20202020 20202020 †.aaaaa      
0000000000000010:  20202020 20202020 20202020 20202020 †         
0000000000000020:  20202020 20202020 20202020 20202020 †         
0000000000000030:  20202020 20202020 20202020 20202020 †         
0000000000000040:  20202020 20202020 20202020 20202020 †         
0000000000000050:  20202020 20202020 20202020 20202020 †         
0000000000000060:  20202020 20202020 20202020 20202020 †         
0000000000000070:  20202020 20202020 20202020 20202020 †         
0000000000000080:  20202020 20202020 20202020 20202020 †         
0000000000000090:  20202020 20202020 20202020 20202020 †         
00000000000000A0:  20202020 20202020 20202020 20202020 †         
00000000000000B0:  20202020 20202020 20202020 20202020 †         
00000000000000C0:  20202020 20202020 20202020 20202020 †         
00000000000000D0:  20202020 20202020 20202020 20202020 †         
00000000000000E0:  20202020 20202020 20202020 20202020 †         
00000000000000F0:  20202020 20202020 20202020 20202020 †         
0000000000000100:  20202020 20202020 20202020 20202020 †         
0000000000000110:  20202020 20202020 20202020 20202020 †         
0000000000000120:  20202020 20202020 20202020 20202020 †         
0000000000000130:  20202020 20202020 20202020 20202020 †         
0000000000000140:  20202020 20202020 20202020 20202020 †         
0000000000000150:  20202020 20202020 20202020 20202020 †         
0000000000000160:  20202020 20202020 20202020 20202020 †         
0000000000000170:  20202020 20202020 20202020 20202020 †         
0000000000000180:  20202020 20202020 20202020 20202020 †         
0000000000000190:  20202020 20202020 20202020 20202020 †         
00000000000001A0:  20202020 20202020 20202020 20202020 †         
00000000000001B0:  20202020 20202020 20202020 20202020 †         
00000000000001C0:  20202020 20202020 20202020 20202020 †         
00000000000001D0:  20202020 20202020 20202020 20202020 †         
00000000000001E0:  20202020 20202020 20202020 20202020 †         
00000000000001F0:  20202020 20202020 20202020 20202020 †         
0000000000000200:  20202020 20202020 20202020 20202020 †         
0000000000000210:  20202020 20202020 20202020 20202020 †         
0000000000000220:  20202020 20202020 20202020 20202020 †         
0000000000000230:  20202020 20202020 20202020 20202020 †         
0000000000000240:  20202020 20202020 20202020 20202020 †         
0000000000000250:  20202020 20202020 20202020 20202020 †         
0000000000000260:  20202020 20202020 20202020 20202020 †         
0000000000000270:  20202020 20202020 20202020 20202020 †         
0000000000000280:  20202020 20202020 20202020 20202020 †         
0000000000000290:  20202020 20202020 20202020 20202020 †         
00000000000002A0:  20202020 20202020 20202020 20202020 †         
00000000000002B0:  20202020 20202020 20202020 20202020 †         
00000000000002C0:  20202020 20202020 20202020 20202020 †         
00000000000002D0:  20202020 20202020 20202020 20202020 †         
00000000000002E0:  20202020 20202020 20202020 20202020 †         
00000000000002F0:  20202020 20202020 20202020 20202020 †         
0000000000000300:  20202020 20202020 20202020 20202020 †         
0000000000000310:  20202020 20202020 20202020 20202020 †         
0000000000000320:  20202020 20202020 20202020 20202020 †         
0000000000000330:  20202020 20202020 20202020 20202020 †         
0000000000000340:  20202020 20202020 20202020 20202020 †         
0000000000000350:  20202020 20202020 20202020 20202020 †         
0000000000000360:  20202020 20202020 20202020 20202020 †         
0000000000000370:  20202020 20202020 20202020 20202020 †         
0000000000000380:  20202020 20940000 00010000 00020000 †   ...........

復制代碼 代碼如下:
Row - Offset                        
7 (0x7) - 6480 (0x1950)             
6 (0x6) - 5568 (0x15c0)             
5 (0x5) - 4656 (0x1230)             
4 (0x4) - 3744 (0xea0)              
3 (0x3) - 2832 (0xb10)              
2 (0x2) - 1920 (0x780)              
1 (0x1) - 1008 (0x3f0)              
0 (0x0) - 96 (0x60)
 

從上面至少可以發現三個有趣的現象:

<1>:173號索引頁中slot0和slot1槽位指向記錄的內容已經有序了,比如:aaaaa,bbbbb。。。。這樣。。。。原來非聚集索引也是有序呀。。。

<2>:6161616161就是16進制的aaaaa。

    9400000001000000 :這幾個數字非常重要,因為是16進制表示,所以2位16進制表示一個字節,所以可以這麼解釋,前面4個字節表示

    pageID,中間2個字節表示fileID,後面2個字節表示slot,看到這裡你是不是想起了RID。。。因為RID就是這三樣的組合。。。原來非聚集索

   引的記錄存放的就是“key+RowID”呀。。。。

<3>:通過最後的槽位列表,可以得知173號索引頁上存放著8條索引記錄。

 

  好了,看完了葉子節點,我們再看分支節點,也就是IndexLevel=1的那條索引數據頁,也就是78號。ok,dbcc看看吧。

當看到這個列表的時候,不知道你腦子裡面是不是有一幅圖出來了,就像上一篇看到聚集索引一樣,因為它的結構和聚集索引非常像,只不過非聚集索引這裡多了一個RID而已。。。最後我也把圖貢獻一下。

 

總結一下:在走非聚集索引的時候,比如你的條件是where name='jjjjj' 時,它的邏輯是這樣的,根據78號索引數據頁的key的范圍,然後通過rowid走到了79號索引數據頁,然後在79號索引數據頁中順利的找到了jjjjj,這時候就可以拿出jjjjj的rowid去表數據頁中直接定位記錄,最後輸出。。。。。這個也就是博客開頭的地方為什麼會出現RID的查找。。。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved