程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> php實現scws中文分詞搜索的方法,

php實現scws中文分詞搜索的方法,

編輯:關於PHP編程

php實現scws中文分詞搜索的方法,


本文實例講述了php實現scws中文分詞搜索的方法。分享給大家供大家參考,具體如下:

1、4個文件(本站下載地址。)解壓後,放到一個地方 eg:E:/wamp/scws

2、php.ini 中配置

extension = php_scws.dll 
scws.default.charset = utf8 //配置默認的編碼方式
scws.default.fpath = "E:/wamp/scws" //加壓後文件的路徑

3、使用

$so = scws_new(); 
$so->set_charset('utf8'); //編碼
// 這裡沒有調用 set_dict 和 set_rule 系統會自動試調用 ini 中指定路徑下的詞典和規則文件 
$so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');
//$so->add_dict('./dd.txt',SCWS_XDICT_TXT);
$so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 
$so->set_duality(0);  //散字二元 
$so->set_ignore(0); //忽略標點符號
$so->set_multi(0); 
$wd='要搜索的內容';
$so->send_text($wd); 
while($tmp = $so->get_result())
//遍歷後即得到字符串分割後的內容,
//根據得到的內容分別到數據庫中查找(like匹配)
{
}

親自試驗了一下如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>test</title>
</head>
<body>
<?php
function search($keywords,$table,$key1,$key2){
// (要查找的字符串,表名,字段一,字段二)如果就一個字段的話,$key2='';
 $arr=array();
 $str=array(); 
 if( preg_match("/^[^\x80-\xff]+$/", $keywords)){//判斷keywords是否全為英文,全為英文的話按照字符串切割處理
 $str1=explode(' ',$keywords); //先按照空格切割
 foreach($str1 as $key=>$value)
 {
  $str2=explode(',',$value); //,切割
  foreach($str2 as $k=>$v)
  {
  $str3=explode('.',$v); //。切割
  foreach($str3 as $kk=>$vv)
  {
   array_push($arr,$vv);//處理完後,返回一個數組
  }
  }
 }
 }else{//對中文的分詞處理
 $so = scws_new(); 
 $so->set_charset('utf8'); 
  // 這裡沒有調用 set_dict 和 set_rule 系統會自動試調用 ini 中指定路徑下的詞典和規則文件 
   $so->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb');
   $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 
   $so->set_duality(0);  //散字二元 
  $so->set_ignore(0); //忽略標點符號
  $so->set_multi(0);
 $so->send_text($keywords);
 while ($tmp = $so->get_result())//得到一個數組,裡面包含詞組和標點符號
 {
  foreach($tmp as $key=>$value)
  {
  $value=$value["word"];
  if(preg_match("/^[一-龥]{6,21}$/", $value))//去除標點符號
  {
   array_push($arr,$value);
  }
  }
 }
 }
 foreach($arr as $key=>$value)//便利得到的數組,到數據庫中匹配
 {
 if($key2!='')
 {
  $sql="select * from `$table` where `$key1` like '%$value%' or `$key2` like '%$value%'";
 }else{
  $sql="select * from `$table` where `$key1` like '%$value%'";
 }
 $query=mysql_query($sql);
 array_push($str,$query);
 }
 return $str;
}
include('conn.php');
$keywords="哈哈lsd djk,hdjs dd";
$table='two_key';
$key1='address';
$key2='';
$query=search($keywords,$table,$key1,$key2);
foreach($query as $key=>$value)
{
 while($row=mysql_fetch_array($value))
 {
 echo $row[id].'----'.$row[name].'-----'.$row[address].'<br>';
 }
}
?>
</body>
</html>

希望本文所述對大家PHP程序設計有所幫助。

您可能感興趣的文章:

  • 開源php中文分詞系統SCWS安裝和使用實例
  • php利用scws實現mysql全文搜索功能的方法
  • PHPAnalysis中文分詞類詳解
  • 使用Discuz關鍵詞服務器實現PHP中文分詞
  • PHP中文分詞 自動獲取關鍵詞介紹
  • PHP中文分詞的簡單實現代碼分享

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved