程式師世界 >> 數據庫知識 >> SqlServer數據庫 >> 關於SqlServer >> SQL Server2014 哈希索引原理詳解

SQL Server2014 哈希索引原理詳解

編輯：關於SqlServer

當一個key-value鍵值對傳遞給一個哈希函數的時候，經過哈希函數的計算之後，根據結果會把key-value鍵值對放在合適的hash buckets（哈希存儲桶）裡

舉個栗子

我們假設對10取模（ % 10 ）就是哈希函數。如果key-value鍵值對的key是1525 ，傳遞到哈希函數，那麼1525 會存放在第五個bucket裡

因為5 as 1525 % 10 = 5。

同樣，537 會存放在第七個bucket ，2982 會存放在第二個bucket ，依次類推

同樣，在hash index裡面，哈希索引列會被傳遞給哈希函數做匹配（類似於java裡面的HashMap的Map操作），匹配成功之後，

索引列會被存儲在匹配到的hash bucket裡面的表裡，這個表裡會有實際的數據行指針，再根據實際的數據行指針查找對應的數據行。

概括來說，要查找一行數據或者處理一個where子句，SQL Server引擎需要做下面幾件事

1、根據where條件裡面的參數生成合適的哈希函數

2、索引列進行匹配，匹配到對應hash bucket，找到對應hash bucket意味著也找到了對應的數據行指針（row pointer）

3、讀取數據

哈希索引比起B樹索引簡單，因為它不需要遍歷B樹，所以訪問速度會更快

哈希函數和相應語法的例子

CREATE TABLE dbo.HK_tbl
 (
  [ID] INT IDENTITY(1, 1)
    NOT NULL
    PRIMARY KEY NONCLUSTERED HASH WITH ( BUCKET_COUNT = 100000 ) ,
  [Data] char(32) COLLATE Latin1_General_100_BIN2
      NULL ,
  [dt] datetime NOT NULL,
 )
 WITH (
   MEMORY_OPTIMIZED =
   ON,
   DURABILITY =
   SCHEMA_AND_DATA);

在SQL Server 2014裡面，內存優化表創建完之後就不能再加哈希索引了，但是在 SQL Server 2016 裡支持表創建完之後添加哈希索引，不過

添加哈希索引是一個離線操作。

哈希索引的Bucket 數量

( BUCKET_COUNT = 100000 )定義了哈希索引能夠使用的BUCKET數量，這個Bucket 是固定的並且由用戶指定Bucket 數量，

而不是執行查詢的時候由SQL Server決定生成的Bucket 數量。BUCKET數量總是2的次方的四捨五入( 1024, 2048, 4096 etc..)

SQL Server2014的哈希索引其實跟MySQL的自適應哈希索引原理其實差不多，都是為了擺脫B樹的束縛，使查找效率更快

How does a relational database work這篇文章也有描述hash join的原理，大家可以看一下