程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> 簡單談談數據庫索引，簡單數據庫索引

簡單談談數據庫索引，簡單數據庫索引

編輯：MySQL綜合教程

簡單談談數據庫索引，簡單數據庫索引

　　最近筆試面試特別多的都問到了數據庫索引，由於之前並沒有單獨做系統的復習，導致許多關於索引的知識點記憶的很模糊，今天整理下相關筆記(並沒有深挖，對於初學者還是可以看看的)，僅供參考。

什麼是索引

　　數據庫索引好比是一本書前面的目錄，能加快數據庫的查詢速度。

例如這樣一個查詢：select * from table1 where id=44。如果沒有索引，必須遍歷整個表，直到ID等於44的這一行被找到為止;有了索引之後(必須是在ID這一列上建立的索引)，直接在索引裡面找 44(也就是在ID這一列找)，就可以得知這一行的位置，也就是找到了這一行。可見，索引是用來定位的。

索引分為聚簇索引和非聚簇索引兩種，聚簇索引是按照數據存放的物理位置為順序的，而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度，而非聚簇索引對於單行的檢索很快。

　　建立索引的目的是加快對表中記錄的查找或排序。

　　為表設置索引要付出代價的：一是增加了數據庫的存儲空間，二是在插入和修改數據時要花費較多的時間(因為索引也要隨之變動)。

為什麼要創建索引

創建索引可以大大提高系統的性能。

第一，通過創建唯一性索引，可以保證數據庫表中每一行數據的唯一性。

第二，可以大大加快數據的檢索速度，這也是創建索引的最主要的原因。

第三，可以加速表和表之間的連接，特別是在實現數據的參考完整性方面特別有意義。

第四，在使用分組和排序子句進行數據檢索時，同樣可以顯著減少查詢中分組和排序的時間。

第五，通過使用索引，可以在查詢的過程中，使用優化隱藏器，提高系統的性能。

也許會有人要問：增加索引有如此多的優點，為什麼不對表中的每一個列創建一個索引呢?因為，增加索引也有許多不利的方面。

第一，創建索引和維護索引要耗費時間，這種時間隨著數據量的增加而增加。

第二，索引需要占物理空間，除了數據表占數據空間之外，每一個索引還要占一定的物理空間，如果要建立聚簇索引，那麼需要的空間就會更大。

第三，當對表中的數據進行增加、刪除和修改的時候，索引也要動態的維護，這樣就降低了數據的維護速度。

在哪建索引

　　索引是建立在數據庫表中的某些列的上面。在創建索引的時候，應該考慮在哪些列上可以創建索引，在哪些列上不能創建索引。一般來說，應該在這些列上創建索引：

1.在經常需要搜索的列上，可以加快搜索的速度;

2.在作為主鍵的列上，強制該列的唯一性和組織表中數據的排列結構;

3.在經常用在連接的列上，這些列主要是一些外鍵，可以加快連接的速度;在經常需要根據范圍進行搜索的列上創建索引，因為索引已經排序，其指定的范圍是連續的;

4.在經常需要排序的列上創建索引，因為索引已經排序，這樣查詢可以利用索引的排序，加快排序查詢時間;

5.在經常使用在WHERE子句中的列上面創建索引，加快條件的判斷速度。

同樣，對於有些列不應該創建索引。一般來說，不應該創建索引的的這些列具有下列特點：

第一，對於那些在查詢中很少使用或者參考的列不應該創建索引。這是因為，既然這些列很少使用到，因此有索引或者無索引，並不能提高查詢速度。相反，由於增加了索引，反而降低了系統的維護速度和增大了空間需求。

第二，對於那些只有很少數據值的列也不應該增加索引。這是因為，由於這些列的取值很少，例如人事表的性別列，在查詢的結果中，結果集的數據行占了表中數據行的很大比例，即需要在表中搜索的數據行的比例很大。增加索引，並不能明顯加快檢索速度。

第三，對於那些定義為text, image和bit數據類型的列不應該增加索引。這是因為，這些列的數據量要麼相當大，要麼取值很少,不利於使用索引。

第四，當修改性能遠遠大於檢索性能時，不應該創建索引。這是因為，修改性能和檢索性能是互相矛盾的。當增加索引時，會提高檢索性能，但是會降低修改性能。當減少索引時，會提高修改性能，降低檢索性能。因此，當修改操作遠遠多於檢索操作時，不應該創建索引。

索引的數據結構

　　B-tree，B是balance，一般用於數據庫的索引。使用B-tree結構可以顯著減少定位記錄時所經歷的中間過程，從而加快存取速度。而B+tree是B-tree的一個變種，大名鼎鼎的MySQL就普遍使用B+tree實現其索引結構。

　　插入（insert）操作：插入一個元素時，首先在B-tree中是否存在，如果不存在，即在葉子結點處結束，然後在葉子結點中插入該新的元素，注意：如果葉子結點空間足夠，這裡需要向右移動該葉子結點中大於新插入關鍵字的元素，如果空間滿了以致沒有足夠的空間去添加新的元素，則將該結點進行“分裂”，將一半數量的關鍵字元素分裂到新的其相鄰右結點中，中間關鍵字元素上移到父結點中（當然，如果父結點空間滿了，也同樣需要“分裂”操作），而且當結點中關鍵元素向右移動了，相關的指針也需要向右移。如果在根結點插入新元素，空間滿了，則進行分裂操作，這樣原來的根結點中的中間關鍵字元素向上移動到新的根結點中，因此導致樹的高度增加一層。

　　刪除(delete)操作：首先查找B-tree中需刪除的元素,如果該元素在B-tree中存在，則將該元素在其結點中進行刪除，如果刪除該元素後，首先判斷該元素是否有左右孩子結點，如果有，則上移孩子結點中的某相近元素到父節點中，然後是移動之後的情況；如果沒有，直接刪除後，移動之後的情況.。刪除元素，移動相應元素之後，如果某結點中元素數目小於ceil(m/2)-1，則需要看其某相鄰兄弟結點是否豐滿（結點中元素個數大於ceil(m/2)-1），如果豐滿，則向父節點借一個元素來滿足條件；如果其相鄰兄弟都剛脫貧，即借了之後其結點數目小於ceil(m/2)-1，則該結點與其相鄰的某一兄弟結點進行“合並”成一個結點，以此來滿足條件。

下面結合例子詳細講解mysql中索引的使用

索引是快速搜索的關鍵。MySQL索引的建立對於MySQL的高效運行是很重要的。下面介紹幾種常見的MySQL索引類型。

在數據庫表中，對字段建立索引可以大大提高查詢速度。假如我們創建了一個 mytable表：

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL
); 我們隨機向裡面插入了10000條記錄，其中有一條：5555, admin。

在查找username="admin"的記錄 SELECT * FROM mytable WHERE
username='admin';時，如果在username上已經建立了索引，MySQL無須任何掃描，即准確可找到該記錄。相反，MySQL會掃描所有記錄，即要查詢10000條記錄。

索引分單列索引和組合索引。單列索引，即一個索引只包含單個列，一個表可以有多個單列索引，但這不是組合索引。組合索引，即一個索包含多個列。

MySQL索引類型包括：

（1）普通索引

這是最基本的索引，它沒有任何限制。它有以下幾種創建方式：

◆創建索引

CREATE INDEX indexName ON mytable(username(length));
如果是CHAR，VARCHAR類型，length可以小於字段實際長度；如果是BLOB和TEXT類型，必須指定 length，下同。

◆修改表結構

ALTER mytable ADD INDEX [indexName] ON (username(length))

◆創建表的時候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL,
INDEX [indexName] (username(length)) ); 刪除索引的語法：

DROP INDEX [indexName] ON mytable;

（2）唯一索引

它與前面的普通索引類似，不同的就是：索引列的值必須唯一，但允許有空值。如果是組合索引，則列值的組合必須唯一。它有以下幾種創建方式：

◆創建索引

CREATE UNIQUE INDEX indexName ON mytable(username(length))

◆修改表結構

ALTER mytable ADD UNIQUE [indexName] ON (username(length))

◆創建表的時候直接指定

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL,
UNIQUE [indexName] (username(length)) );

（3）主鍵索引

它是一種特殊的唯一索引，不允許有空值。一般是在建表的時候同時創建主鍵索引：

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL,
PRIMARY KEY(ID) ); 當然也可以用 ALTER 命令。記住：一個表只能有一個主鍵。

（4）組合索引

為了形象地對比單列索引和組合索引，為表添加多個字段：

CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL,
city VARCHAR(50) NOT NULL, age INT NOT NULL );
為了進一步搾取MySQL的效率，就要考慮建立組合索引。就是將 name, city, age建到一個索引裡：

ALTER TABLE mytable ADD INDEX name_city_age (name(10),city,age);
建表時，usernname長度為 16，這裡用
10。這是因為一般情況下名字的長度不會超過10，這樣會加速索引查詢速度，還會減少索引文件的大小，提高INSERT的更新速度。

如果分別在
usernname，city，age上建立單列索引，讓該表有3個單列索引，查詢時和上述的組合索引效率也會大不一樣，遠遠低於我們的組合索引。雖然此時有了三個索引，但MySQL只能用到其中的那個它認為似乎是最有效率的單列索引。

建立這樣的組合索引，其實是相當於分別建立了下面三組組合索引：

usernname,city,age usernname,city usernname 為什麼沒有
city，age這樣的組合索引呢？這是因為MySQL組合索引“最左前綴”的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這三列的查詢都會用到該組合索引，下面的幾個SQL就會用到這個組合索引：

SELECT * FROM mytable WHREE username="admin" AND city="鄭州" SELECT * FROM
mytable WHREE username="admin" 而下面幾個則不會用到：

SELECT * FROM mytable WHREE age=20 AND city="鄭州" SELECT * FROM mytable WHREE
city="鄭州"

（5）建立索引的時機

到這裡我們已經學會了建立索引，那麼我們需要在什麼情況下建立索引呢？一般來說，在WHERE和JOIN中出現的列需要建立索引，但也不完全如此，因為MySQL只對<，<=，=，>，>=，BETWEEN，IN，以及某些時候的LIKE才會使用索引。例如：

SELECT t.Name FROM mytable t LEFT JOIN mytable m ON t.Name=m.username
WHERE m.age=20 AND m.city='鄭州'
此時就需要對city和age建立索引，由於mytable表的userame也出現在了JOIN子句中，也有對它建立索引的必要。

剛才提到只有某些時候的LIKE才需建立索引。因為在以通配符%和_開頭作查詢時，MySQL不會使用索引。例如下句會使用索引：

SELECT * FROM mytable WHERE username like'admin%' 而下句就不會使用：

SELECT * FROM mytable WHEREt Name like'%admin' 因此，在使用LIKE時應注意以上的區別。

（6）索引的不足之處

上面都在說使用索引的好處，但過多的使用索引將會造成濫用。因此索引也會有它的缺點：

◆雖然索引大大提高了查詢速度，同時卻會降低更新表的速度，如對表進行INSERT、UPDATE和DELETE。因為更新表時，MySQL不僅要保存數據，還要保存一下索引文件。

◆建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重，但如果你在一個大表上創建了多種組合索引，索引文件的會膨脹很快。

索引只是提高效率的一個因素，如果你的MySQL有大數據量的表，就需要花時間研究建立最優秀的索引，或優化查詢語句。

（7）使用索引的注意事項

使用索引時，有以下一些技巧和注意事項：

◆索引不會包含有NULL值的列

只要列中包含有NULL值都將不會被包含在索引中，復合索引中只要有一列含有NULL值，那麼這一列對於此復合索引就是無效的。所以我們在數據庫設計時不要讓字段的默認值為NULL。

◆使用短索引

對串列進行索引，如果可能應該指定一個前綴長度。例如，如果有一個CHAR(255)的列，如果在前10個或20個字符內，多數值是惟一的，那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁盤空間和I/O操作。

◆索引列排序

MySQL查詢只使用一個索引，因此如果where子句中已經使用了索引的話，那麼order
by中的列是不會使用索引的。因此數據庫默認排序可以符合要求的情況下不要使用排序操作；盡量不要包含多個列的排序，如果需要最好給這些列創建復合索引。

◆like語句操作

一般情況下不鼓勵使用like操作，如果非使用不可，如何使用也是一個問題。like “%aaa%” 不會使用索引而like
“aaa%”可以使用索引。

◆不要在列上進行運算

select * from users where YEAR(adddate)<2007;
將在每個行上進行運算，這將導致索引失效而進行全表掃描，因此我們可以改成

select * from users where adddate<‘2007-01-01’;

◆不使用NOT IN和<>操作

以上，就對其中MySQL索引類型進行了介紹。