用C#寫了個漢字轉拼音的小工具,和網上大部分工具不同,這個通過分詞算法,解決了多音字的問題,並且提供聲調,可開可關。
如題,用"銀行 行不行 行家說了算"舉例,如果轉拼音卻不能識別多音字,就慘了。
而這個小工具的效果如圖:
實現了3種分詞算法:
* 正向最大匹配
* 反向最大匹配
* 雙向最大匹配
(這個雙向匹配的歧義處理辦法,還是本人創新。。。)
軟件下載:
http://pan.baidu.com/s/1mTg3T
-----------------分割線---------------------
這裡,不得不提一下分詞算法這個事情。
不過都寫在這就太長了,還是放到下一篇再談。
-----------------源代碼(含生成好的程序)--------------------
百度網盤:
http://pan.baidu.com/s/1ED1Ls
騰訊微雲:
http://url.cn/PnnMOU
使用注意:
* bin/release目錄下,已經包含了生成的軟件。
* 顯示拼音時,因為詞庫的中文單字非常不全,我引用了微軟的ChnCharInfo.dll,來獲得一些單字拼音。這個庫是要下載Visual Studio International Pack安裝到系統才會有的。
不過你可以直接從bin/release裡面找到,自己重新引用一下就行了。只需要引用: ChnCharInfo.dll,但下面2個文件也不能刪掉ChnCharInfo.xml和zh-CN目錄下的 ChnCharInfo.resources.dll