想要把一大段中文文本中所有的標點符號刪除掉,然後分詞制作語料庫使用,大神們有沒有辦法呢?或者哪位大神有中文語料庫給個鏈接好不好?我想做新聞的文本相似度分析,提取關鍵詞的時候需要語料庫。 謝謝大神們~~~~~
既然你要語料庫,程序就不是必須的了,用ultraedit之類的工具,內置批量替換功能,運行下即可。
在C#winform中如何畫
請問如果做重置IE的批處理,
vs windows窗口
android中nine-p
創建表結構的時候,需要創建外
vmx文件修改參數,怎麼用記