程式師世界 >> 數據庫知識 >> MYSQL數據庫 >> MySQL綜合教程 >> Mysql全文本檢索

Mysql全文本檢索

編輯：MySQL綜合教程

Mysql全文本檢索

mysql 全文索引

注意並非所有的引擎都支持全文檢索

mysql最常用的引擎 INnodb 和 myisam 後者支持全文檢索前者不支持

創建表的時候指定要檢索列

CREATE TABLE TEST_FULLTEXT(note_id int not null auto_increment,note_text text null,
primaty key(note_id),FULLTEXT(note_text)
)engine=myisam;



fulltext 索引某個列 fulltext(note_text) ，在某note_text列上建立全文索引

插入數據

然後用 match()指定列 Against()指定詞

如 語句
select *
from TEST_FULLTEXT
where Match(note_text) Against('hello');


查找note_txt列中含有 hello詞的行 返回的結果為 兩行
note_text
'hello' was said by quester 
quster say 'hello' to pp and he try again



- 注意 搜索是不區分大小的 除非使用 BINARY方式
    既然這樣 為什麼 不用  like語句呢  再來看上面例子  用like實現

select *
from TEST_FULLTEXT
where note_text like '%hello%';


返回的結果一樣為兩行
note_text
quster say 'hello' to pp and he try again
'hello' was said by quester 

看采用全文搜索和like的返回結果   使用全文搜索的返回結果是已經排好序的   而 like的返回結果則沒有
排序主要是針對  hello出現在行的位置   
全文結果中 第一個詞  和 第三個詞    like則沒有按順序排




Mysql主要根據等級來進行排序



我們可以采用下面方式查看 表中某一列 在某一個詞的等級 ，繼續用上面的例子
select note_text, Match(note_text) Aginst('hello') as rannk
from TEST_FULLTEXT


輸出如下：
 note_text                                             rank
 fhgjkhj                                                0
 fdsf shi jian                                          0
 quster say 'hello' to pp and he try again           1.3454876123454
 huijia quba                                            0
 'hello' was said by quester                         1.5656454547876





等級的計算 由 mysql 由根據行中詞的數目、唯一詞的數目、整個索引中詞的總數以及包含改詞行的數目計算出來 不包含詞的行的等級 為0 上面的結果中 詞在前面的等級值要高於在後面的






使用查詢擴展



當你想要在note_text 中查找 pp時 從上面知道 只有一行 如果用下面語句
select note_text 
from test_fulltext
where match(note_text) against('pp');


返回結果是
note_text
quster say 'hello' to pp and he try again


如果采用擴展查詢，分為以下三部

1、先根據全文檢索 查找到 所有行 如上面的返回結果 只有一行
2、mysql檢索上面1的所以行，選擇有用的詞
3、mysql再次全文檢索，這一次還需要加上2中選擇出來的有用的詞 作為against中的詞
select note_text 
from test_fulltext
where match(note_text) against('pp' with query expansion);


返回結果
note_text
quster say 'hello' to pp and he try again
'hello' was said by quester                        


如pp本來有的行中含有 hello 所以hello也作為關鍵字




使用布爾查詢


即使沒有建立fulltext索引也能夠用，但是速度非常慢 沒有50%規則  （參見下 50%規則介紹）
可以用包含特定意義的操作符，如 +、-、""，作用於查詢字符串上。查詢結果不是以相關性排序的。


<喎?http://www.Bkjia.com/kf/ware/vc/" target="_blank" class="keylink">vcHJlPgo8cD4KyOfT777kPC9wPgo8cHJlIGNsYXNzPQ=="brush:sql;">select note_text 
from test_fulltext
where match(note_text) against('hello -pp*' IN BOOLEAN MODE );


表示匹配hello但是不包含 pp的行 結果為
note_text
'hello' was said by quester  



全文檢索的一些說明 和限制


1、只有MyISAM表支持
2、對大多數的多字節字符集適用，進行全文索引的列必須使用相同的字符集和校驗碼(collation)。
3、表意性語言，如漢語、日語沒有詞分界符(英語用空格隔開每個單詞)，全文分析器無法確定一個詞的開始和結尾，所以MySQL中的全文檢索不支持。
4、在自然語言檢索中，只能檢索被全文索引的那些列，如果要對索引的多列進行某一列的檢索，必須對這一列單獨建立全文索引。布爾檢索可以在非索引的列上進行，但會慢一些。
5、against後的參數必須是常量字符串。
6、索引沒有記錄關鍵詞在字符串中的位置，排序算法太單一。
7、如果索引不在內存中，檢索速度會很慢；如果是短語查詢，需要索引和數據都在內存中，否則速度會很慢，所以需要更大的key buffer。索引有碎片時也會很慢，所以需要更頻繁的optimize table操作。
8、全文索引對於insert、update、delete都很慢。如更改100個詞需要進行100次的索引操作而不是1次。


50% 規則

     如果一個詞出現在50%以上的行中，那麼mysql將他作為一個非用詞忽略   50%規則不適用於布爾查詢

    如果行數小於三行   則不返回結果  參考 50%規則


						   
							
						
						
						
							上一頁:mysql的lag和Lead函數
下一頁:開啟服務器Mcrypt.so加密庫的方法


				
					
						MySQL綜合教程
						
					
					
						
						
							
							MySQL基本知識及練習(5)
							MySQL基本知識及練習(5)
		1.求一個班級數學平均分			
						
						
						
							
							MySQL MMM高可用方案，mysqlmmm方案
							MySQL MMM高可用方案，mysqlmmm方案

介紹
			
						
						
						
							
							MySQL使用show status查看MySQL服務器狀態信息，statusmysql
							MySQL使用show status查看MySQL服務器狀態			
						
						
						
							
							安裝SQL server 提示重新啟動計算機失敗怎麼解決？
							安裝SQL server 提示重新啟動計算機失敗怎麼解決？&			
						
						
						
							
							MySQL 數據庫開啟遠程連接並不難
							
以下的文章主要介紹的是MySQL 數據庫開啟遠程連接的時機			
						
						
						
							
							Mysql不能顯示中文的解決辦法
							
		Mysql不能顯示中文的解決辦法
 
在my


			
				
					相關文章
					
						用表單來提交sql（轉）3
使用SQL Server連接服務器訪問DB2 Server
oracle查看執行最慢與查詢次數最多的sql語句
Plsql Developer連接Oracle時出現Could not initialize oci.dll解決方案
Oracle在Mybatis中SQL語句的配置方法
PL/SQL Developer連接64位的Oracle圖文教程
oracle數據庫遷移到MySQL的方法總結
利用PL/SQL從Oracle數據庫導出和導入數據
MariaDB性能調優工具mytop的使用詳解
Centos7 下mysql重新啟動MariaDB篇 
					
					
					
				
					
						閱讀排行榜
					
					
						
						my sql存儲過程學習總結
						
						mysql修改索引時，外鍵約束造成的奇怪問題
						
						MySQL replace into 語句淺析（一），mysqlreplace
						
						利用Java進行MySql數據庫的導入和導出
						
						mysql5.7.11 winx64安裝配置方法圖文教程，mysql5.7.11winx64
						
						MySQL性能優化的最佳21條經驗
						
						[MySQL]生產環境MySQL數據庫事務一直在RUNNING
						
						MySQL5的異常處理
						
						mysql處理存在則更新，不存在則插入（多列唯一索引）
						
						MySQL連接字符串中的幾個重要步驟
						
						Mysql¸ß¼¶Ö®Ö÷´Ó¸´ÖÆ
						
					
				
				
					熱門圖文
					
						
						
						
					
					
						
						數據庫之：Mysql數據庫服務器安裝與配置
						
						教你如何用Access逐條輸出Excel2000記錄
						
						磁盤已滿造成的mysql啟動失敗問題分享
						
						MySQL數據庫技術(19)
						
						SQL之經典SQL語句大全，sql語句大全
						
						Sybase iq隨筆學習(20151027)
						
						基於Oracle ADF的應用程序開發過程
						
						NoSQL 數據庫你應該了解的 10 件事
						
					
				
				
					欄目導航
					
						MYSQL入門知識SQL基礎知識關於MYSQL數據庫Mariadb數據庫MySQL綜合教程

Mysql全文本檢索

Mysql全文本檢索

- 注意搜索是不區分大小的除非使用 BINARY方式

等級的計算由 mysql 由根據行中詞的數目、唯一詞的數目、整個索引中詞的總數以及包含改詞行的數目計算出來不包含詞的行的等級為0 上面的結果中詞在前面的等級值要高於在後面的

Mysql全文本檢索

Mysql全文本檢索

- 注意 搜索是不區分大小的 除非使用 BINARY方式

等級的計算 由 mysql 由根據行中詞的數目、唯一詞的數目、整個索引中詞的總數以及包含改詞行的數目計算出來 不包含詞的行的等級 為0 上面的結果中 詞在前面的等級值要高於在後面的

- 注意搜索是不區分大小的除非使用 BINARY方式

等級的計算由 mysql 由根據行中詞的數目、唯一詞的數目、整個索引中詞的總數以及包含改詞行的數目計算出來不包含詞的行的等級為0 上面的結果中詞在前面的等級值要高於在後面的