我們知道,微信最開始就是做語音聊天而使得其更加流行的,因此語音的識別處理自然也就成為微信交流的一個重要途徑,微信的開發接口,也提供了對語音的消息請求處理。本文主要介紹如何利用語音的識別,對C#開發的微信門戶應用的整個事件鏈的處理操作,使得在我們的微信賬號裡面,更加方便和多元化對用戶的輸入進行處理。
微信的API這麼定義語音的識別的:開通語音識別功能,用戶每次發送語音給公眾號時,微信會在推送的語音消息XML數據包中,增加一個Recongnition字段。
語音的消息格式如下所示。
<xml> <ToUserName><![CDATA[toUser]]></ToUserName> <FromUserName><![CDATA[fromUser]]></FromUserName> <CreateTime>1357290913</CreateTime> <MsgType><![CDATA[voice]]></MsgType> <MediaId><![CDATA[media_id]]></MediaId> <Format><![CDATA[Format]]></Format> <MsgId>1234567890123456</MsgId> </xml>
根據以上微信接口的定義,我們可以定義一個實體類來對消息的傳遞進行處理,如下所示。
/// <summary> /// 接收的語音消息 /// </summary> [System.Xml.Serialization.XmlRoot(ElementName = "xml")] public class RequestVoice : BaseMessage { public RequestVoice() { this.MsgType = RequestMsgType.Voice.ToString().ToLower(); } /// <summary> /// 語音格式,如amr,speex等 /// </summary> public string Format { get; set; } /// <summary> /// 語音消息媒體id,可以調用多媒體文件下載接口拉取數據。 /// </summary> public string MediaId { get; set; } /// <summary> /// 消息ID /// </summary> public Int64 MsgId { get; set; } /// <summary> /// 語音識別結果,UTF8編碼 /// </summary> public string Recognition { get; set; } }
我們看到,這裡我們最感興趣的是語音的識別結果,也就是Recognition的字段,這個就是微信服務器自動根據用戶的語音轉換過來的內容,我測試過,識別率還是非常高的。
這個實體類,在整個微信應用的消息傳遞中的關系如下所示:
明確了上面的語音對象實體,我們就可以看看它們之間是如何處理的。
微信消息的處理邏輯如下圖所示。
其中我們來看看語音的處理操作,我的代碼處理邏輯如下所示。
/// <summary> /// 對語音請求信息進行處理 /// </summary> /// <param name="info">語音請求信息實體</param> /// <returns></returns> public string HandleVoice(Entity.RequestVoice info) { string xml = ""; // 開通語音識別功能,用戶每次發送語音給公眾號時, // 微信會在推送的語音消息XML數據包中,增加一個Recongnition字段。 if (!string.IsNullOrEmpty(info.Recognition)) { TextDispatch dispatch = new TextDispatch(); xml = dispatch.HandleVoiceText(info, info.Recognition); } else { xml = ""; } return xml; }
在這裡,我先看看,是否獲得了微信的語音識別結果,如果獲得,那麼這個時候,就是和處理用戶文本輸入的操作差不多了,因此把它轉給TextDispatch的處理類進行處理。
其中這裡面的處理邏輯如下所示。
首先我根據識別結果,尋找是否用戶讀出了微信門戶的菜單名稱,如果根據語音結果找到對應的菜單記錄,那麼我們執行菜單事件(如果是URL的View類型菜單,我們沒辦法重定向到指定的鏈接,因此給出一個鏈接文本提示,給用戶單擊進入;如果沒有找到菜單記錄,那麼我們就把語音識別結果作為一般的事件進行處理,如果事件邏輯沒有處理,那麼我們最後給出一個默認的語音應答提示結果就可以了。
具體的處理代碼如下所示。
/// <summary> /// 如果用戶用語音讀出菜單的內容,那麼我們應該先根據菜單對應的事件觸發,最後再交給普通事件處理 /// </summary> /// <param name="info"></param> /// <returns></returns> public string HandleVoiceText(BaseMessage info, string voiceText) { string xml = ""; MenuInfo menuInfo = BLLFactory<Menu>.Instance.FindByName(voiceText); if (menuInfo != null) { #region 如果找到菜單對象的處理 if (menuInfo.Type == "click") { //模擬單擊事件 RequestEventClick eventInfo = new RequestEventClick(); eventInfo.CreateTime = info.CreateTime; eventInfo.EventKey = menuInfo.Key; eventInfo.FromUserName = info.FromUserName; eventInfo.ToUserName = info.ToUserName; xml = base.DealEvent(eventInfo, eventInfo.EventKey); } else { //由於無法自動切換到連接, //轉換為連接文本供用戶進入 string content = string.Format("請單擊鏈接進入<a href=\"{0}\">{1}</a> ", menuInfo.Url, menuInfo.Name); ResponseText textInfo = new ResponseText(info); textInfo.Content = content; xml = textInfo.ToXml(); } #endregion } else { //交給事件機制處理 if (string.IsNullOrEmpty(xml)) { xml = HandleText(info, voiceText); } } //最後如果沒有處理到,那麼提示用戶的語音內容 if (string.IsNullOrEmpty(xml)) { ResponseText textInfo = new ResponseText(info); textInfo.Content = string.Format("非常抱歉,您輸入的語音內容沒有找到對應的處理方式。您的語音內容為:{0}", voiceText); xml = textInfo.ToXml(); } return xml; }
微信門戶測試界面效果如下所示。
為了方便對客戶會話的記錄,我的微信門戶後台,會記錄用戶的語音輸入內容,如下所示。
當然,微信後台的管理界面,也能夠查到相應的語音記錄,界面如下所示。
以上就是我對微信語音的消息定義和事件處理的邏輯,其實語音是一個重要的輸入,如果正確的識別內容,比手工輸入的效果更好,給用戶提供另外一種高效的輸入和事件處理操作。
這樣的處理模式,能夠使得我們整個微信門戶框架,不管是對於用戶的語音輸入,還是文本輸入,還是菜單事件的處理,都可以融為一體,實現更加完美的銜接。
如果對這個《C#開發微信門戶及應用》系列感興趣,可以關注我的其他文章,系列隨筆如下所示:
C#開發微信門戶及應用(11)--微信菜單的多種表現方式介紹
C#開發微信門戶及應用(10)--在管理系統中同步微信用戶分組信息
C#開發微信門戶及應用(9)-微信門戶菜單管理及提交到微信服務器
C#開發微信門戶及應用(8)-微信門戶應用管理系統功能介紹
C#開發微信門戶及應用(7)-微信多客服功能及開發集成
C#開發微信門戶及應用(6)--微信門戶菜單的管理操作
C#開發微信門戶及應用(5)--用戶分組信息管理
C#開發微信門戶及應用(4)--關注用戶列表及詳細信息管理
C#開發微信門戶及應用(3)--文本消息和圖文消息的應答
C#開發微信門戶及應用(2)--微信消息的處理和應答
C#開發微信門戶及應用(1)--開始使用微信接口