<通過MySQL內置全文檢索實現中文的相關檢索>
關鍵字:MySQL 全文檢索 全文索引 中文分詞 二元分詞 區位碼 相似度
/**
* @author : walkerlee
* @copyright : www.neatstudio.com | www.walkerlee.Net
*/
轉載請保留以上信息。
注:本文使用的MySQL版本為:MySQL 4.0.x
在MySQL4中,是已經開始支持全文檢索(索引)的了。但是只是對英文支持全文檢索。
由於英文在書寫上的特殊性,使得分詞算法相對中文來說,簡單得多。一般來說,我們可以通過單詞與單詞之間的空格,以及標點符號來完成這個分詞過程。
但是就中文來說,就沒有那麼簡單。MySQL無法對中文做出正確的分詞,假設有如下英文句子:
引用: