在數據庫表中,使用索引可以大大提高查詢速度。 假如我們創建了一個 testIndex 表:
CREATE TABLE testIndex(i_testID INT NOT NULL,vc_Name VARCHAR(16) NOTNULL);
我們隨機向裡面插入了 1000 條記錄,其中有一條 i_testID vc_Name 555 erquan
在查找 vc_Name="erquan" 的記錄 SELECT *FROM testIndex WHERE vc_Name='erquan'; 時,如果在vc_Name 上已經建立了索引,MySql 無須任何掃描,即准確可找到該記錄!相反,MySql 會掃描所有記錄,即要查詢 1000。以索引將查詢速度提高 100 倍。
一、索引分單列索引和組合索引
單列索引:即一個索引只包含單個列,一個表可以有多個單列索引,但這不是組合索引。組合索引:即一個索包含多個列。
二、介紹一下索引的類型
1、普通索引。
這是最基本的索引,它沒有任何限制。它有以下幾種創建方式:
(1)創建索引:CREATE INDEX indexName ONtableName(tableColumns(length));如果是CHAR,VARCHAR類型,length可以小於字段實際長度;如果是 BLOB 和 TEXT 類型,必須指定 length,下同。
(2)修改表結構:ALTER tableName ADD INDEX[indexName] ON (tableColumns(length))
(3)創建表的時候直接指定:CREATE TABLE tableName ( [...],INDEX [indexName] (tableColumns(length)) ;
2、唯一索引。
它與前面的"普通索引"類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。它有以下幾種創建方式:
(1)創建索引:CREATE UNIQUE INDEX indexName ONtableName(tableColumns(length))
(2)修改表結構:ALTER tableName ADD UNIQUE[indexName] ON (tableColumns(length))
(3)創建表的時候直接指定:CREATE TABLE tableName ( [...],UNIQUE [indexName] (tableColumns(length));
3、主鍵索引
它是一種特殊的唯一索引,不允許有空值。一般是在建表的時候同時創建主鍵索引:CREATE TABLE testIndex(i_testID INT NOT NULL AUTO_INCREMENT,vc_NameVARCHAR(16) NOT NULL,PRIMARY KEY(i_testID)); 當然也可以用ALTER 命令。記住:一個表只能有一個主鍵。
4、全文索引
MySQL 從 3.23.23 版開始支持全文索引和全文檢索。
刪除索引的語法:DROP INDEX index_name ON tableName
三、單列索引和組合索引
為了形象地對比兩者,再建一個表:
CREATE TABLE myIndex ( i_testID INT NOT NULL AUTO_INCREMENT, vc_NameVARCHAR(50) NOT NULL, vc_City VARCHAR(50) NOT NULL, i_Age INT NOT NULL,i_SchoolID INT NOT NULL, PRIMARY KEY (i_testID) );
在這 10000 條記錄裡面 7 上 8 下地分布了 5 條 vc_Name="erquan" 的記錄,只不過 city,age,school 的組合各不相同。
來看這條 T-SQL:SELECT i_testID FROM myIndex WHEREvc_Name='erquan' AND vc_City='鄭州' AND i_Age=25;
首先考慮建單列索引:
在 vc_Name 列上建立了索引。執行 T-SQL 時,MYSQL 很快將目標鎖定在了 vc_Name=erquan 的 5 條記錄上,取出來放到一中間結果集。在這個結果集裡,先排除掉 vc_City 不等於"鄭州"的記錄,再排除 i_Age 不等於 25 的記錄,最後篩選出唯一的符合條件的記錄。
雖然在 vc_Name 上建立了索引,查詢時MYSQL不用掃描整張表,效率有所提高,但離我們的要求還有一定的距離。同樣的,在 vc_City 和 i_Age 分別建立的單列索引的效率相似。
為了進一步搾取 MySQL 的效率,就要考慮建立組合索引。就是將 vc_Name,vc_City,i_Age 建到一個索引裡:
ALTER TABLE myIndex ADD INDEX name_city_age(vc_Name(10),vc_City,i_Age);
建表時,vc_Name 長度為 50,這裡為什麼用 10 呢?因為一般情況下名字的長度不會超過 10,這樣會加速索引查詢速度,還會減少索引文件的大小,提高 INSERT 的更新速度。
執行 T-SQL 時,MySQL 無須掃描任何記錄就到找到唯一的記錄!!
肯定有人要問了,如果分別在 vc_Name,vc_City,i_Age 上建立單列索引,讓該表有 3 個單列索引,查詢時和上述的組合索引效率一樣嗎?大不一樣,遠遠低於我們的組合索引。雖然此時有了三個索引,但 MySQL 只能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的組合索引,其實是相當於分別建立了
vc_Name,vc_City,i_Age
vc_Name,vc_City
vc_Name
這樣的三個組合索引!為什麼沒有 vc_City,i_Age 等這樣的組合索引呢?這是因為 mysql組合索引“最左前綴”的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這三列的查詢都會用到該組合索引,下面的幾個 T-SQL 會用到:
SELECT * FROM myIndex WHREE vc_Name="erquan" ANDvc_City="鄭州"
SELECT * FROM myIndex WHREEvc_Name="erquan"
而下面幾個則不會用到:
SELECT * FROM myIndex WHREE i_Age=20 AND vc_City="鄭州"
SELECT * FROM myIndex WHREE vc_City="鄭州"
四、使用索引
到此你應該會建立、使用索引了吧?但什麼情況下需要建立索引呢?一般來說,在 WHERE 和 JOIN 中出現的列需要建立索引,但也不完全如此,因為 MySQL 只對 <,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE(後面有說明)才會使用索引。
SELECT t.vc_Name FROM testIndex t LEFT JOIN myIndex m ONt.vc_Name=m.vc_Name WHERE m.i_Age=20 AND m.vc_City='鄭州'時,有對 myIndex 表的 vc_City 和 i_Age 建立索引的需要,由於testIndex 表的 vc_Name 開出現在了 JOIN 子句中,也有對它建立索引的必要。
剛才提到了,只有某些時候的 LIKE 才需建立索引?是的。因為在以通配符 % 和 _ 開頭作查詢時,MySQL 不會使用索引,如 SELECT * FROM myIndex WHERE vc_Name like'erquan%'
會使用索引,而 SELECT * FROM myIndex WHEREt vc_Namelike'%erquan' 就不會使用索引了。
五、索引的不足之處
上面說了那麼多索引的好話,它真的有像傳說中那麼優秀麼?當然會有缺點了。
1、雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行 INSERT、UPDATE 和DELETE。因為更新表時,MySQL 不僅要保存數據,還要保存一下索引文件。
2、建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快。
講了這麼多,無非是想利用索引提高數據庫的執行效率。不過索引只是提高效率的一個因素。如果你的MySQL 有大數據的表,就需要花時間研究建立最優秀的索引或優化查詢語句。
假如你有一個表,
SQL> CREATE TABLE test_tab (2 id INT,
3 name VARCHAR(10),
4 age INT,
5 val VARCHAR(10)6 );你的業務,有一個查詢,是
SELECT * FROM test_tab WHERE name = 一個外部輸入的數據
剛開始,數據不多的時候,執行效果還不錯。
隨著數據量的增加,這個查詢,執行起來,越來越慢了。
然後在 name 上面 建立了索引
CREATE INDEX idx_test4_name ON test_tab (name );
這樣, 可以加快前面那個查詢的速度。
但是,某天,你執行了下面這個SQL, 發現速度又慢了
SELECT * FROM test_tab WHERE age = 25
為啥呢? 因為 age 字段上面,沒有索引
索引只在 name 上面有
換句話說, 也就是 WHERE 裡面的條件, 會自動判斷,有沒有 可用的索引,如果有, 該不該用。
多列索引,就是一個索引,包含了2個字段。
例如:CREATE INDEX idx_test_name_age ON test_tab (name, age);那麼SELECT * FROM test_tabWHEREname LIKE '張%'
AND age = 25
這樣的查詢,將能夠使用上面的索引。
多列索引,還有一個可用的情況就是, 某些情況下,可能查詢,只訪問索引就足夠了, 不需要再訪問表了。例如:SELECTAVG( avg ) AS 平均年齡FROMtest_tabWHEREname LIKE '張%'
這個時候, name 與 age 都包含在索引裡面。 查詢不需要去檢索表中的數據。
就用 mysql 數據庫舉例吧
一、什麼是索引?
索引用來快速地尋找那些具有特定值的記錄,所有MySQL索引都以B-樹的形式保存。如果沒有索引,執行查詢時MySQL必須從第一個記錄開始掃描整個表的所有記錄,直至找到符合要求的記錄。表裡面的記錄數量越多,這個操作的代價就越高。如果作為搜索條件的列上已經創建了索引,MySQL無需掃描任何記錄即可迅速得到目標記錄所在的位置。如果表有1000個記錄,通過索引查找記錄至少要比順序掃描記錄快100倍。
假設我們創建了一個名為people的表:
CREATE TABLE people ( peopleid SMALLINT NOT NULL, name CHAR(50) NOT NULL );
然後,我們完全隨機把1000個不同name值插入到people表。下圖顯示了people表所在數據文件的一小部分:
可以看到,在數據文件中name列沒有任何明確的次序。如果我們創建了name列的索引,MySQL將在索引中排序name列:
對於索引中的每一項,MySQL在內部為它保存一個數據文件中實際記錄所在位置的“指針”。因此,如果我們要查找name等於“Mike”記錄的peopleid(SQL命令為“SELECT peopleid FROM people WHERE name=\'Mike\';”),MySQL能夠在name的索引中查找“Mike”值,然後直接轉到數據文件中相應的行,准確地返回該行的peopleid(999)。在這個過程中,MySQL只需處理一個行就可以返回結果。如果沒有“name”列的索引,MySQL要掃描數據文件中的所有記錄,即1000個記錄!顯然,需要MySQL處理的記錄數量越少,則它完成任務的速度就越快。
二、索引的類型
MySQL提供多種索引類型供選擇:
普通索引
這是最基本的索引類型,而且它沒有唯一性之類的限制。普通索引可以通過以下幾種方式創建:
創建索引,例如CREATE INDEX <索引的名字> ON tablename (列的列表);
修改表,例如ALTER TABLE tablename ADD INDEX [索引的名字] (列的列表);
創建表的時候指定索引,例如CREATE TABLE tablename ( [...], INDEX [索引的名字] (列的列表) );
唯一性索引
這種索引和前面的“普通索引”基本相同,但有一個區別:索引列的所有值都只能出現一次,即必須唯一。唯一性索引可以用以下幾種方式創建:
創建索引,例如CREATE UNIQUE INDEX <索引的名字> ON tablename (列的列表);
修改表,例如ALTER TABLE tablename ADD UNIQUE [索引的名字] (列的列表);
創建表的時候指定索引,例如CREATE TABLE tablename ( [...], UNIQUE [索引的名字] (列的列表) );
主鍵
主鍵是一種唯一性索引,但它必須指定為“PRIMARY KEY”。如果你曾經用過AUTO_INCREMENT類型的列,你可能已經熟悉主鍵之類的概念了。主鍵一般在創建表的時候指定,例如“CREATE TABLE tablename ( [...], PRIMARY KEY (列的列表) ); ”。但是,我們也可以通過修改表的方式加入主鍵,例如“ALTER TABLE ta......余下全文>>