使用索引時數據庫性能優化的必備技能之一。在MySql數據庫中,有四種索引:聚焦索引(主鍵索引)、普通索引、唯一索引以及我們這裡將要介紹的全文索引(FUNLLTEXT INDEX)。
全文索引(也稱全文檢索)是目前搜索引擎使用的一種關鍵技術。它能夠利用【分詞技術】等多種算法智能分析出文本文字中關鍵詞的頻率和重要性,然後按照一定的算法規則智能地篩選出我們想要的搜索結果。
在MySql中,創建全文索引相對比較簡單。例如:我們有一個文章表(article),其中有主鍵ID(id)、文章標題(title)、文章內容(content)三個字段。現在我們希望能夠在title和content兩個列上創建全文索引,article表及全文索引的創建SQL語句如下:
CREATE TABLE `article` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `title` varchar(200) DEFAULT NULL, `content` text, PRIMARY KEY (`id`), FULLTEXT KEY `title` (`title`,`content`) ) ENGINE=MyISAM DEFAULT CHARSET=utf8;
上面就是在創建表的同時創建全文索引的SQL示例。此外,如果我們要給已經存在的表的指定字段創建全文索引,同樣以article表為例,我們可以使用如下SQL語句進行創建:
ALTER TABLE article ADD FULLTEXT INDEX fulltext_article(title,content);
在MySql中創建全文索引之後,現在就該了解如何使用了。眾所周知,在數據庫中進行模糊查詢是使用like關鍵字進行查詢的,例如:
SELECT * FROM article WHERE content LIKE ‘%查詢字符串%';
那麼,我們在使用全文索引也這樣使用嗎?當然不是,我們必須使用特有的語法才能使用全文索引進行查詢,例如,我們想要在article表的title和content列中全文檢索指定的查詢字符串,我們可以如下編寫SQL語句:
SELECT * FROM article WHERE MATCH(title,content) AGAINST (‘查詢字符串');
強烈注意:MySql自帶的全文索引只能用於數據庫引擎為MYISAM的數據表,如果是其他數據引擎,則全文索引不會生效。此外,MySql自帶的全文索引只能對英文進行全文檢索,目前無法對中文進行全文檢索。如果需要對包含中文在內的文本數據進行全文檢索,我們需要采用Sphinx(斯芬克斯)/Coreseek技術來處理中文。
注:目前,使用MySql自帶的全文索引時,如果查詢字符串的長度過短將無法得到期望的搜索結果。MySql全文索引所能找到的詞默認最小長度為4個字符。另外,如果查詢的字符串包含停止詞,那麼該停止詞將會被忽略。
注:如果可能,請盡量先創建表並插入所有數據後再創建全文索引,而不要在創建表時就直接創建全文索引,因為前者比後者的全文索引效率要高。