程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 網頁編程 >> PHP編程 >> 關於PHP編程 >> 中文分詞處理方法

中文分詞處理方法

編輯:關於PHP編程

[php]
<?php 
 
/**
 * 中文分詞處理方法
 *+---------------------------------
 * @param stirng  $string 要處理的字符串
 * @param boolers $sort=false 根據value進行倒序
 * @param Numbers $top=0 返回指定數量,默認返回全部
 *+---------------------------------
 * @return void
 */ 
function scws($text, $top = 5, $return_array = false, $sep = ',') { 
    include('./pscws4/pscws4.php');//去下面給的網址把pscws4下載下來  
    $cws = new pscws4('utf-8'); 
    $cws -> set_charset('utf-8'); 
    $cws -> set_dict('./pscws4/etc/dict.utf8.xdb'); 
    $cws -> set_rule('./pscws4/etc/rules.utf8.ini'); 
    //$cws->set_multi(3);  
    $cws -> set_ignore(true); 
    //$cws->set_debug(true);  
    //$cws->set_duality(true);  
    $cws -> send_text($text); 
    $ret = $cws -> get_tops($top, 'r,v,p'); 
    $result = null; 
    foreach ($ret as $value) { 
        if (false === $return_array) { 
            $result .= $sep . $value['word']; 
        } else { 
            $result[] = $value['word']; 
        } 
    } 
    return false === $return_array ? substr($result, 1) : $result; 

print_r(scws('青花夔龍紋香爐')); 

<?php

/**
 * 中文分詞處理方法
 *+---------------------------------
 * @param stirng  $string 要處理的字符串
 * @param boolers $sort=false 根據value進行倒序
 * @param Numbers $top=0 返回指定數量,默認返回全部
 *+---------------------------------
 * @return void
 */
function scws($text, $top = 5, $return_array = false, $sep = ',') {
    include('./pscws4/pscws4.php');//去下面給的網址把pscws4下載下來
    $cws = new pscws4('utf-8');
    $cws -> set_charset('utf-8');
    $cws -> set_dict('./pscws4/etc/dict.utf8.xdb');
    $cws -> set_rule('./pscws4/etc/rules.utf8.ini');
    //$cws->set_multi(3);
    $cws -> set_ignore(true);
    //$cws->set_debug(true);
    //$cws->set_duality(true);
    $cws -> send_text($text);
    $ret = $cws -> get_tops($top, 'r,v,p');
    $result = null;
    foreach ($ret as $value) {
        if (false === $return_array) {
            $result .= $sep . $value['word'];
        } else {
            $result[] = $value['word'];
        }
    }
    return false === $return_array ? substr($result, 1) : $result;
}
print_r(scws('青花夔龍紋香爐'));


 

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved