你可能已經注意到,如今語音合成越來越普遍。成百上午的電動玩具和小器具都能夠以機器的聲音向它們的主人講話。不管它是一個講話的嬰兒玩偶,一個會談話的計步器或是一新的自動電話系統,現在幾乎每天都會有一種使用文本來發音的產品發行。
文本-到-語音(TTS)技術,也稱為語音合成,是把輸入的文本轉換成音頻語音的過程。這種方式會優於預先錄制好的文本-它必須對要說的內容提前了解。而使用TTS,卻有可能加入動態的信息,該動態的信息可以來自於一個數據庫;或是用戶不斷重復的話。
一、TTS試驗
如果你看到或聽說過實際的TTS,那麼你可能想下載一個免費版本的ReadPlease 2003。該產品能夠讀取Windows剪貼板中的文本。要使用它,你只需要簡單地把一些文本粘貼到ReadPlease編輯器中(見圖1)-並且假定你的PC揚聲器打開了,那麼你會聽到文本的播放。當前,該產品僅能工作在所有的Windows桌面OS版本中,但是他們還計劃發行針對Mac,Unix,Palm和Windows CE系統的版本。
ReadPlease令人感興趣的地方在於,你可以使用ReadPlease編輯器來試驗你的TTS參數選擇。例如,你可以通過上下移動如圖1所示的Speed滑動塊控件來調整發音速度。你還可以通過點擊在小臉圖標下方的箭頭按鈕來改變所用的語音。
圖1.ReadPlease 2003應用程序:這個Windows應用程序可能讀任何從剪貼板中粘貼到編輯字段中的文本。
你需要什麼呢?Visual Studio.NET 2003,微軟語音應用程序SDK 1.1
點擊"Tools"菜單,然後選擇"Options"允許你進一步用該TTS編輯器進行試驗,例如,你可以調整在段落之間的語音引擎的暫停時間長度。升級到ReadPlease Plus版本將可以使你存取另外的一個發音編輯器選項,它讓你指定怎樣讀一個特別的詞。ReadPlease Plus還包括一個你可以停靠在你的Windows桌面頂部的任務條。因此,你可以快速地從任何基於文件的應用程序拖動文本到任務欄上並讓它讀給你聽。
缺省狀態下,該ReadPlease應用程序使用內置的微軟語音(Mark,Mike,Sam或Marilyn)。但是,你可以選擇性地購買更高質量的AT&T Natural Voices,例如在AT&T Natural Voices Starter Pack中提供的語音。該Starter包包括8K版本的"Mike"和"Crystal",它們二者聽起來都優於缺省的微軟聲音。
作者注: 術語8K意味著,該抽樣頻率用於創建發生在每秒8000位的WAV文件。另外一種格式是16k,它可以產生一種更清晰和更為自然的聽覺效果。基本上,樣本率越高,聲音質量好越。