程式師世界 >> 編程語言 >> 網頁編程 >> ASP編程 >> 關於ASP編程 >> asp中利用CSW中文分詞組件來實現自己網站的內容關鍵詞自動提取

asp中利用CSW中文分詞組件來實現自己網站的內容關鍵詞自動提取

編輯：關於ASP編程

比如標題是：騰訊QQ 2006 珊瑚蟲集成版 v4.5b
分詞後：[此資源關鍵詞:騰訊 QQ 珊瑚蟲集成 ]
並且把關鍵詞做成專題，可以為每個內容頁面生成相關連接了
用CSW中文分詞組件
下載：http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代碼，比較粗淺，但實用

codecsw 得到輸出的所有分詞結果，用它的組建裡面有個ASP文件，你一看就知道怎麼得到分詞結果了，這個不詳細說了。
復制代碼代碼如下:
fcon=split(htm," ")
fcs=ubound(fcon)
for fci=0 to fcs
if fci mod 2=0 then
fcn=fcn&fcon(fci)&"$fc^#$"  '我這裡用$fc^#$來分割每個分詞
else
fcw=fcw&fcon(fci)&"$fc^#$"
end if

next
fcn=left(fcn,len(fcn)-12) '去掉最前面的$fc^#$
fcw=left(fcw,len(fcw)-6) 去掉最後面的$fc^#$
don=split(fcn,"$fc^#$")
donn=split(fcw,"$fc^#$")
dos=ubound(don)
for doi=0 to dos
fcname=don(doi)  '得到分詞
fcsx=donn(doi)   '得到分詞屬性
'下面是判斷分詞符合我所提出的屬性，比如名詞、名動詞、動詞等，排除了數詞、狀詞和連接詞等。
if fcsx="/b" or fcsx="/nz" or fcsx="/n" or fcsx="/an" or fcsx="/nx" or fcsx="/f" or fcsx="/i" or fcsx="/l" or fcsx="/ng" or fcsx="/nr" or fcsx="/ns" or fcsx="/nt" or fcsx="/nz" or fcsx="/v" or fcsx="/vn" or fcsx="/s" or fcsx="/g" then
if len(fcname)>1 then
if instr(fcname1,fcname&"$") then
else
if fcname<>" " and fcname<>"" then
fcname=replace(replace(replace(trim(fcname),chr(10),""),chr(13),""),chr(10)&chr(13),"") '去除分詞的換行和回車鍵
if len(fcname)>1 then
'這裡是分詞入庫，我的分詞庫只有三個字段，自動ID、分詞名稱和分詞所屬的內容ID
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 * from fc where fcname='"&fcname&"'"
rs.open sql,conn,1,3
if rs.eof then
rs.addnew
end if
rs("fcname")=fcname
if instr(rs("mid"),","&id&",") then
else
rs("mid")=rs("mid")&","&id&","
end if
rs.update
rs.close
set rs=nothing
'分詞入庫結束
end if
end if
response.write fcname&"("&fcsx&")<br>"
mfc=mfc&fcname&","
end if
fcname1=fcname1&fcname&"$"
end if
end if
next
'這裡是將分詞添加到內容表，在內容表我只多加了一個分詞字段mfc
if right(mfc,1)="$" then mfc=left(mfc,len(mfc)-1)
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 mfc from m where mid="&id
rs.open sql,conn,1,3
rs("mfc")=mfc
rs.update
rs.close
set rs=nothing
end if

就這樣實現了，呵呵，在分詞表的內容ID都是用,來分割的，讀取的時候自己研究下就可以