專利名稱:語音識別控制系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明實施例涉及語音控制技術(shù),尤其涉及一種語音識別控制系統(tǒng)和方法。
背景技術(shù):
電視、電腦、手機(jī)等顯示終端的業(yè)務(wù)操作,對普通家庭用戶,特別是對于老人或者 孩子來說,手動操作方法復(fù)雜。通過語音控制終端設(shè)備的業(yè)務(wù)操作可以簡化操作方法,例 如,用戶可以在手機(jī)中通過語音查電話號碼、寫短信等。當(dāng)前,通過語音控制終端設(shè)備的應(yīng)用單元,通常有兩種方式。一種方式為將語音 識別模塊與某一特定的應(yīng)用單元綁定,將語音識別模塊的語音識別能力作為特定的應(yīng)用單 元的能力,在這種情況下,語音識別能力不能被其他的應(yīng)用單元使用,無法通用。另一種方 式為終端設(shè)備提供公用的語音識別模塊,設(shè)備中的其它應(yīng)用單元通過特定的應(yīng)用編程接 口(API)調(diào)用語音識別模塊,以獲取語音識別能力;在這種情況下,在終端中不能由多個設(shè) 備同時使用語音識別模塊,存在局限性。綜上所述現(xiàn)有技術(shù)中語音控制的適用范圍小,且不能通用。
發(fā)明內(nèi)容
本發(fā)明提供一種語音識別控制系統(tǒng)和方法,用以解決現(xiàn)有技術(shù)中語音控制的適用 范圍小,且不能通用的缺陷,實現(xiàn)具有通用性的語音控制,適用范圍廣。本發(fā)明實施例提供一種語音識別控制系統(tǒng),包括語音輸入設(shè)備,用于對接收到的語音信號進(jìn)行采樣,得到語音信號;將所述語音信 號輸入語音消息中間件;語音消息中間件,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消 息,所述語音消息中攜帶所述語音信號對應(yīng)的文本信息將所述語音消息發(fā)送至需要所述語 音消息的應(yīng)用單元;應(yīng)用單元,用于接收所述語音消息中間件發(fā)送的所述語音消息,根據(jù)所述語音消 息中的文本信息控制所述應(yīng)用單元的運行狀態(tài)。本發(fā)明實施例提供一種語音識別控制方法,包括對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息,所述語音消息中攜帶所 述語音信號對應(yīng)的文本信息;將所述語音消息發(fā)送至需要所述語音消息的應(yīng)用單元,以使所述應(yīng)用單元根據(jù)所 述語音消息中的文本信息控制應(yīng)用單元的運行狀態(tài)。本發(fā)明提供的語音識別控制系統(tǒng)和方法,通過語音消息中間件對語音輸入設(shè)備輸 入的語音信號進(jìn)行識別得到攜帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該 消息類型的應(yīng)用單元,則可以將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運 行狀態(tài),該語音控制具有通用性,可以適用于各種功能的應(yīng)用單元。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例一提供的語音識別控制系統(tǒng)的結(jié)構(gòu)示意圖;圖2為本發(fā)明實施例二提供的語音識別控制系統(tǒng)的結(jié)構(gòu)示意圖;圖3為本發(fā)明實施例三提供的語音識別控制方法的流程示意圖;圖4a為本發(fā)明實施例四提供的語音識別控制方法的流程示意圖;圖4b為本發(fā)明實施例四提供的語音識別控制方法的信令流程示意圖;圖5a為本發(fā)明實施例五提供的語音識別控制方法的流程示意圖;圖5b為本發(fā)明實施例五提供的語音識別控制方法中消息管理的信令流程示意 圖;圖5c為本發(fā)明實施例五提供的語音識別控制方法中消息通知的信令流程示意 圖;圖6a為本發(fā)明實施例六提供的語音識別控制方法中注冊過程的流程示意圖;圖6b為本發(fā)明實施例六提供的語音識別控制方法中注冊過程的信令流程示意 圖;圖6c本發(fā)明實施例六提供的語音識別控制方法中注銷過程的流程示意圖;圖6d為本發(fā)明實施例六提供的語音識別控制方法中注銷過程的信令流程示意 圖;圖6e為本發(fā)明實施例六提供的語音識別控制方法中狀態(tài)控制的信令流程示意 圖。
具體實施例方式為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。實施例一圖1為本發(fā)明實施例一提供的語音識別控制系統(tǒng)的結(jié)構(gòu)示意圖,如圖1所示,該語 音識別控制系統(tǒng)包括語音輸入設(shè)備15、語音消息中間件13和應(yīng)用單元11。其中,語音輸入設(shè)備15,用于對接收到的語音信號進(jìn)行采樣,得到語音信號;將所 述語音信號輸入語音消息中間件;語音消息中間件13,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音 消息,所述語音消息中攜帶所述語音信號對應(yīng)的文本信息;將所述語音消息發(fā)送至需要所 述語音消息的應(yīng)用單元;應(yīng)用單元11,用于接收所述語音消息中間件發(fā)送的所述語音消息,根據(jù)所述語音 消息中的文本信息控制所述應(yīng)用單元的運行狀態(tài)。
具體地,語音消息中間件是一種可以運行在例如、電腦、手機(jī)、機(jī)頂盒等設(shè)備的操 作系統(tǒng)之上的服務(wù)性應(yīng)用。語音消息是以語音作為輸入源,通過特定的語音處理與識別處 理技術(shù),將語音轉(zhuǎn)換為可以識別和處理的信息。例如,用戶以語音方式輸入“關(guān)機(jī)”的語音 指令,通過語音消息中間件處理后,可以變成“關(guān)機(jī)”的文本指令或者其它應(yīng)用可以識別和 處理的指令格式。其中,語音消息中至少包括識別出來的文本信息。文本信息也可以叫做 語音消息的消息內(nèi)容,可以是精確的消息描述,也可以是模糊的消息描述。例如,“關(guān)機(jī)”的 語音輸入的消息內(nèi)容可以識別為“關(guān)機(jī)”的精確文本指令,也可以是“XX關(guān)機(jī)XX”等模糊文 本指令。由于語音識別經(jīng)常具備模糊性,所以,語音消息中包含的消息內(nèi)容可以支持模糊性 描述,各種應(yīng)用單元可具備模糊性語音消息的處理能力。具體實現(xiàn)時,語音消息的內(nèi)容可 以使用XML格式描述,也可以使用其它文本或二進(jìn)制方式描述,可以根據(jù)實際需要確定。因 此,語音消息識別子系統(tǒng)識別語音信號時,根據(jù)消息特征庫,可能將同一條語音信號識別出 一條或多條文本信息。在應(yīng)用單元中可以包括文本消息特征庫,應(yīng)用單元處理文本信息的 方法具體可以包括以下情況情況一、如果語音消息中只包含單條文本信息,應(yīng)用單元可以分離出語音消息中 的文本信息,將文本信息轉(zhuǎn)換成執(zhí)行指令。應(yīng)用單元的消息處理模塊檢索和比對文本消息 特征庫,將文本信息轉(zhuǎn)換成執(zhí)行指令。如果轉(zhuǎn)換成功,則執(zhí)行獲取的執(zhí)行指令。處理完成語 音消息后,刪除語音消息。例如,語音上網(wǎng)應(yīng)用單元獲取到包含文本信息“搜索開機(jī)”的語音消息時,上網(wǎng)應(yīng) 用分離出“搜索”執(zhí)行指令,并將“開機(jī)”作為搜索的具體內(nèi)容,此時,語音上網(wǎng)應(yīng)用單元可 以直接啟動上網(wǎng)功能并搜索“開機(jī)”相關(guān)的信息。但是,如果是開關(guān)機(jī)應(yīng)用單元接收到包含 文本信息“搜索關(guān)機(jī)”的語音消息,則處理過程可以是開關(guān)機(jī)應(yīng)用單元識別出其中包含“關(guān) 機(jī)”信息時,可以彈出對話框,提示用戶是否確認(rèn)“關(guān)機(jī)”,如果用戶選擇是,則開關(guān)機(jī)應(yīng)用單 元生成關(guān)機(jī)指令并執(zhí)行。再如,語音上網(wǎng)應(yīng)用單元獲取到僅包含文本信息“開機(jī)”的語音消息時,由于語音 上網(wǎng)應(yīng)用單元未找到其支持的可以轉(zhuǎn)化成執(zhí)行指令的文本信息例如“搜索”等,則僅將“開 機(jī)”作為搜索的內(nèi)容,但不執(zhí)行搜索過程,直至下次再接收到包含“搜索”的語音消息時,才 執(zhí)行搜索“開機(jī)”的過程;也可以將僅包含文本信息“開機(jī)”的語音消息丟棄或不處理。情況二、語音消息中包含多條文本信息時由于方言、環(huán)境不同,同一條語音信息可能被識別出多條文本信息。如果識別出多 條文本信息,則生成的語音消息中可以包括多條文本信息,并且根據(jù)消息特征庫中語音特 征的相似度的大小,對識別出的多條文本信息排序,相似度越高的,排序越靠前。例如,語音語音上網(wǎng)應(yīng)用單元獲取到包含文本信息“搜索開機(jī)”、“搜搜開雞”的語 音消息時,語音上網(wǎng)應(yīng)用單元可以彈出對話框,提示用戶選擇是“搜索開機(jī)”還是“搜搜開 雞”,根據(jù)用戶的選擇和確定輸入的內(nèi)容進(jìn)行處理,如果用戶選擇“搜索開機(jī)”,則處理過程 與上述的情況一類似。由于在語音消息中,多條文本信息是有序的,所以,上網(wǎng)應(yīng)用可以有 序的顯示文本信息。此外,語音消息中還可以包括消息類型、消息產(chǎn)生時間、消息有效期等。其中,消 息類型可以有多種劃分方法,例如可以將消息類型劃分為持續(xù)型消息、突發(fā)型消息,其中, 持續(xù)型消息是持續(xù)的語音轉(zhuǎn)換得到的消息,突發(fā)型消息則是間歇和/或突發(fā)的語音轉(zhuǎn)換得到的消息。再如可以將消息類型劃分為說話型、歌唱型等。消息類型也可以不進(jìn)行設(shè)置或 者只設(shè)置一種,所有注冊的應(yīng)用單元,都可以獲取該消息類型的語音消息,消息類型的具體 劃分在本發(fā)明實施例中不做限制。如果設(shè)備中的應(yīng)用單元需要獲取語音消息,可先向語音消息中間件注冊所需的消 息類型,當(dāng)語音消息中間件在獲取到相關(guān)類型的語音消息后,可以將相關(guān)類型的語音消息 推送給對應(yīng)的應(yīng)用單元,從而使應(yīng)用單元可以根據(jù)語音輸入和識別的結(jié)果完成控制過程。 語音消息中間件可向設(shè)備的應(yīng)用層的所有應(yīng)用單元提供語音消息的處理和傳送服務(wù)。一個 應(yīng)用單元同時可以注冊多個消息獲取請求。以語音上網(wǎng)應(yīng)用單元為例將語音上網(wǎng)應(yīng)用單 元劃分為服務(wù)發(fā)現(xiàn)模塊、消息處理模塊和第一應(yīng)用注冊模塊。用戶將語音上網(wǎng)應(yīng)用單元啟 動后,該語音上網(wǎng)應(yīng)用單元的服務(wù)發(fā)現(xiàn)模塊在系統(tǒng)中查找語音消息中間件是否運行,如果 未運行,則可運行該語音消息中間件。其中,語音消息中間件也可以默認(rèn)為在系統(tǒng)啟動后自 動運行,但在沒有應(yīng)用單元需要語音消息時,不啟動該語音消息中間件的語音獲取與識別 功能,即不啟動語音獲取模塊、語音處理模塊與語音識別模塊等與語音獲取與識別功能有 關(guān)的模塊。在語音上網(wǎng)應(yīng)用單元啟動并查找到語音消息中間件后,調(diào)用自身的消息第一應(yīng) 用注冊模塊向語音消息中間件注冊所需的消息類型。語音消息中間件接收到相關(guān)請求后, 啟動語音消息獲取與識別功能,并將獲取到的該語音上網(wǎng)應(yīng)用單元所需的語音消息遞送給 語音上網(wǎng)應(yīng)用單元。語音上網(wǎng)應(yīng)用單元獲取語音消息后,分離出語音消息中的文本指令例 如“上網(wǎng)”,啟動上網(wǎng)功能,查找匹配的網(wǎng)站和網(wǎng)絡(luò)內(nèi)容。本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜 帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該消息類型的應(yīng)用單元,則可以 將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用 性,可以適用于各種功能的應(yīng)用單元。實施例二圖2為本發(fā)明實施例二提供的語音識別控制系統(tǒng)的結(jié)構(gòu)示意圖,如圖2所示,在實 施例一的基礎(chǔ)上該語音識別控制系統(tǒng)的語音消息中間件13可以包括語音消息識別子系 統(tǒng)21和語音消息通知子系統(tǒng)23。其中,語音消息識別子系統(tǒng)21,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處 理;提取所述語音信號的特征碼,根據(jù)消息特征庫中預(yù)先存儲的特征碼對所述語音信號的 特征碼進(jìn)行匹配;若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本信息生成攜帶所述文 本信息的語音消息,所述語音消息還包括消息類型,將所述語音消息發(fā)送至語音消息通知 子系統(tǒng);語音消息通知子系統(tǒng)23,用于提取所述語音消息的消息類型,查詢是否存在需要 該消息類型的語音消息的應(yīng)用單元;若存在,則向所述需要該消息類型的語音消息的應(yīng)用 單元發(fā)送所述語音消息。進(jìn)一步地,語音消息識別子系統(tǒng)21可以包括語音處理模塊210、語音識別模塊 211、消息特征庫212、第一消息通知模塊213和第一服務(wù)控制模塊214 ;其中,語音處理模塊210,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處理;語音識別模塊211,用于提取所述語音信號的特征碼,根據(jù)消息特征庫212中預(yù)先 存儲的特征碼對所述語音信號的特征碼進(jìn)行匹配;若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本信息,生成攜帶消息類型和所述文本信息的語音消息;消息特征庫212,用于保存匹配所用的特征碼;第一消息通知模塊213,用于向所述語音消息通知子系統(tǒng)23發(fā)送所述語音消息;第一服務(wù)控制模塊214,用于根據(jù)所述語音消息通知子系統(tǒng)23的指示控制所述語 音消息識別子系統(tǒng)21的運行狀態(tài)。此外,語音消息識別子系統(tǒng)21還可以包括語音獲取模塊215和第一服務(wù)交互接 Π 216 ;其中,語音獲取模塊215,用于接收所述語音輸入設(shè)備輸入的所述語音信號,將所 述語音信號預(yù)處理后發(fā)送至所述語音處理模塊210 ;第一服務(wù)交互接口 216,用于將所述第一消息通知模塊發(fā)送的所述語音消息轉(zhuǎn)發(fā) 至所述語音消息通知子系統(tǒng)23的第二服務(wù)交互接口 ;其中,所述第一服務(wù)控制模塊214,還用于控制所述語音處理模塊210、語音識別 模塊211、消息特征庫212、第一消息通知模塊213、語音獲取模塊215和第一服務(wù)交互接口 216之間的交互。具體地,設(shè)備的操作系統(tǒng)(硬件)層的語音輸入設(shè)備向語音獲取模塊215提供語 音信號。語音處理模塊210啟動后,通知語音獲取模塊215從語音輸入設(shè)備中獲取語音信 息,相關(guān)語音信息通過語音處理模塊210預(yù)處理后,送給語音識別模塊。語音輸入設(shè)備輸入 的語音信號可以是連續(xù)的,語音獲取模塊215可以同時接收多路語音輸入設(shè)備,語音獲取 模塊215可以從一個或多個語音輸入設(shè)備獲取語音信號,一邊獲取一邊處理。語音獲取模 塊215還可以設(shè)置語音輸入設(shè)備的運行參數(shù)和運行狀態(tài)。其中,運行參數(shù)主要包括語音采 樣率和輸入格式,運行狀態(tài)主要包括啟動、停止、暫停等。語音處理模塊210接收并處理語 音獲取模塊215傳送的每一路語音信號,如果存在多路語音信號,語音處理模塊210還可以 將多路語音信號按一定規(guī)則合成為單路語音信號。輸入的各路語音信號存在一定的屬性, 主要包括語音的正負(fù)向?qū)傩裕渲?,正?fù)向?qū)傩允侵溉绻Z音信號是需要識別的關(guān)鍵信 息,則約定為正向,否則,約定為負(fù)向。負(fù)向語音信號通常用于采集背景聲音,背景聲音通常 不用于識別,而用于信號去噪。語音處理模塊210將處理后的語音信號推送給語音識別模 塊211。語音處理模塊210連續(xù)分塊地向語音識別模塊211推送語音信號。語音識別模塊 211接收和處理來自語音處理模塊210的語音信號,檢查和匹配語音信號,將語音信號轉(zhuǎn)換 成語音消息。語音識別模塊211將生成的語音消息推送給第一消息通知模塊213。語音識 別模塊211提取語音信號的特征碼,并通過消息特征庫212模塊檢查和匹配預(yù)存儲的特征 碼,如果找到相同的或相似的特征碼,則可認(rèn)為找到匹配的語音消息??梢愿鶕?jù)需要選用的 語音識別算法,以檢查和匹配特征碼,并生成語音消息。匹配時,可以使用模糊算法。消息 特征庫212可以保存一些可以識別的語音消息的特征碼,從而向語音識別模塊211提供語 音消息特征碼的檢查和匹配服務(wù)。語音識別模塊211生成的語音消息通過第一消息通知模 塊213和第一服務(wù)交互接口 216傳送給語音消息通知子系統(tǒng)。第一服務(wù)交互接口 216提供 接口,與語音消息通知子系統(tǒng)交互。第一服務(wù)控制模塊214是語音消息識別子系統(tǒng)的控制 中心。第一服務(wù)控制模塊214可以啟動、關(guān)閉、暫停語音獲取模塊等各個模塊的運行狀態(tài)。 其它各個模塊通過第一服務(wù)控制模塊214相互交互。再進(jìn)一步地,語音消息通知子系統(tǒng)23包括消息管理模塊231、應(yīng)用管理模塊232、第二消息通知模塊233和第二服務(wù)控制模塊234。其中,消息管理模塊231,用于將各個語音消息保存為一個消息隊列;定期檢查所 述消息隊列中當(dāng)前是否存在需要發(fā)送的語音消息,若存在需要發(fā)送的語音消息,則提取所 述語音消息的消息類型,指示應(yīng)用管理模塊232查詢是否存在需要該消息類型的語音消息 的應(yīng)用單元,若存在,則指示第二消息通知模塊233向需要該消息類型的語音消息的應(yīng)用 單元發(fā)送所述語音消息;應(yīng)用管理模塊232,用于查詢是否存在需要該消息類型的語音消息的應(yīng)用單元; 若存在,則所述消息管理模塊231返回所述需要該消息類型的語音消息的應(yīng)用單元的信 息;第二消息通知模塊233,用于根據(jù)所述消息管理模塊231的指示,向需要該消息類 型的語音消息的應(yīng)用單元發(fā)送所述語音消息;第二服務(wù)控制模塊234,用于指示所述語音消息識別子系統(tǒng)21需要控制的運行狀 態(tài)。此外,語音消息通知子系統(tǒng)23還可以包括應(yīng)用交互接口 235、第一應(yīng)用注冊模塊 236和第二服務(wù)交互接口 237。其中,應(yīng)用交互接口 235,用于將所述第二消息通知模塊233的所述語音消息轉(zhuǎn)發(fā) 至需要該消息類型的語音消息的應(yīng)用單元;將接收的所述應(yīng)用單元發(fā)送的語音消息獲取請 求的注冊或注銷信息發(fā)送至第一應(yīng)用注冊模塊236 ;第一應(yīng)用注冊模塊236,用于根據(jù)所述應(yīng)用單元的語音消息獲取請求的注冊或注 銷信息,對所述應(yīng)用單元的語音識別控制功能進(jìn)行注冊或注銷;第二服務(wù)交互接口 237,用于接收所述語音消息識別子系統(tǒng)的第一服務(wù)交互接口 216發(fā)送的所述語音消息;其中,第二服務(wù)控制模塊234,還用于控制所述應(yīng)用管理模塊232、消息管理模塊 231、第二消息通知模塊233、應(yīng)用交互接口 235、第一應(yīng)用注冊模塊236和第二服務(wù)交互接 口 237之間的交互。再進(jìn)一步地,語音消息通知子系統(tǒng)23還可以包括服務(wù)注冊模塊和配置管理模 塊,其中,服務(wù)注冊模塊,用于在所述語音消息通知子系統(tǒng)啟動時,根據(jù)設(shè)定規(guī)則注冊所述 語音消息通知子系統(tǒng)的運行狀態(tài);配置管理模塊,用于對所述語音消息通知子系統(tǒng)的運行 參數(shù)進(jìn)行配置管理。第二服務(wù)控制模塊234,還可以控制服務(wù)注冊模塊、配置管理模塊與語 音消息通知子系統(tǒng)的其他各個子模塊之間的交互。具體地,不同設(shè)備的應(yīng)用層可以包括不同的應(yīng)用單元,例如,桌面管理應(yīng)用、瀏覽 器應(yīng)用、播放器應(yīng)用等。語音消息通知子系統(tǒng)23的應(yīng)用交互接口 235為應(yīng)用單元提供約 定接口,應(yīng)用層的應(yīng)用單元通過應(yīng)用交互接口 235與語音消息通知子系統(tǒng)23交互。如圖2 所示,每個應(yīng)用單元11可以包括服務(wù)發(fā)現(xiàn)模塊31、消息處理模塊32和第二應(yīng)用注冊模塊 33,這三個模塊可以分別通過語音消息通知子系統(tǒng)23的應(yīng)用交互接口 235的服務(wù)發(fā)現(xiàn)接 口、消息通知接口、應(yīng)用注冊接口與語音消息通知子系統(tǒng)23交互。通過應(yīng)用注冊接口,應(yīng)用 單元的第二應(yīng)用注冊模塊33可以向語音消息通知子系統(tǒng)23發(fā)送語音消息獲取請求的注冊 和/或注銷信息;通過消息通知接口,應(yīng)用單元的消息處理模塊32可以接收到所需的語音 消息;通過服務(wù)發(fā)現(xiàn)接口,應(yīng)用單元的服務(wù)發(fā)現(xiàn)模塊31可以查找到當(dāng)前正在運行的語音消息通知子系統(tǒng)23。應(yīng)用單元還可以包括其他與其應(yīng)用功能相對應(yīng)的模塊,在此不做限制。第一應(yīng)用注冊模塊236通過應(yīng)用交互接口 235接收和處理應(yīng)用單元的語音消息獲 取請求的注冊和/或注銷信息后,與應(yīng)用管理模塊232協(xié)同管理應(yīng)用單元的語音消息獲取 請求注冊和/或注銷信息。當(dāng)應(yīng)用單元需要接收某類型的語音消息時,向語音消息中間件 發(fā)送語音消息獲取請求的注冊信息,語音消息獲取請求的注冊信息內(nèi)容可以主要包括應(yīng) 用類型、應(yīng)用標(biāo)識、需要獲取的消息類型及參數(shù)、消息獲取接口等。其中,應(yīng)用標(biāo)識、消息類 型、消息參數(shù)、消息獲取接口合稱為四元組信息,一個四元組信息唯一確定一個語音消息獲 取請求及其相關(guān)消息。其中,應(yīng)用標(biāo)識為唯一確定該應(yīng)用單元的標(biāo)識信息;消息類型可以 參見實施例一中的描述,不同的應(yīng)用單元可以對應(yīng)不同或相同的消息類型;消息參數(shù)為指 標(biāo)識應(yīng)用在運行狀態(tài)下的唯一性標(biāo)識值,例如,應(yīng)用在進(jìn)程中的進(jìn)程標(biāo)識值,可以作為指示 應(yīng)用單元自身的上下文指針,方便查找該應(yīng)用單元;消息獲取接口為應(yīng)用單元用于接收或 提取語音消息的函數(shù)指針,語音消息中間件調(diào)用該消息獲取接口可以將語音消息推送給應(yīng) 用單元,在調(diào)用該消息獲取接口時,可以將消息參數(shù)一并返回給應(yīng)用單元。如果應(yīng)用單元注 冊成功,則第一應(yīng)用注冊模塊236向應(yīng)用單元反饋與四元組信息唯一對應(yīng)的消息接收標(biāo)識 碼;否則,通知應(yīng)用單元注冊失敗。此外,應(yīng)用單元可以刪除某個語音消息獲取請求,在刪除 過程中,需要包括第一應(yīng)用注冊模塊236反饋的消息接收標(biāo)識碼以及對應(yīng)的四元組信息。 當(dāng)刪除成功時,消息接收標(biāo)識碼失效。如果應(yīng)用提供的消息接收標(biāo)識碼和對應(yīng)的四元組信 息不正確,或者失效,則第一應(yīng)用注冊模塊236可以拒絕相關(guān)請求。應(yīng)用管理模塊232管理已經(jīng)注冊的應(yīng)用單元及其語音消息獲取請求的相關(guān)消息。 當(dāng)存在需要通知的語音消息時,消息管理模塊231可以通過應(yīng)用管理模塊232查找需要通 知的語音消息的應(yīng)用單元的信息。應(yīng)用管理模塊232根據(jù)第一應(yīng)用注冊模塊236的請求,創(chuàng) 建、保存、修改或刪除指定的應(yīng)用單元的語音消息獲取請求的相關(guān)信息(包括消息接收標(biāo) 識碼和四元組信息),消息接收標(biāo)識碼可由應(yīng)用管理模塊232創(chuàng)建,也可由其它模塊創(chuàng)建。此外,消息管理模塊231管理來自語音消息識別子系統(tǒng)的語音消息,消息管理模 塊231以消息隊列的方式管理語音消息。消息管理模塊231獲取到語音消息后,提取語音 消息的消息類型,通過應(yīng)用管理模塊232查找并匹配需要指定語音消息類型的應(yīng)用,找到 應(yīng)用后,通過第二消息通知模塊233向應(yīng)用提供語音消息。第二消息通知模塊233向所有 需要約定消息類型的應(yīng)用提供語音消息。語音消息處理完后,在約定條件下,第二消息通知 模塊233可以刪除相關(guān)語音消息。第二消息通知模塊233根據(jù)消息管理模塊231的要求, 通過應(yīng)用交互接口 235向應(yīng)用推送指定語音消息,或者通知應(yīng)用單元提取指定語音消息。 第二消息通知模塊233調(diào)用應(yīng)用的消息獲取請求四元組信息的消息獲取接口,通知應(yīng)用接 收和/或提取語音消息。服務(wù)注冊模塊在語音消息通知子系統(tǒng)啟動時,以某種規(guī)則注冊語 音消息通知子系統(tǒng)的運行狀態(tài)。應(yīng)用的服務(wù)發(fā)現(xiàn)模塊可以根據(jù)該規(guī)則找到運行中的語音消 息通知子系統(tǒng)。實施例可以自定義所述規(guī)則。常用的規(guī)則有,共享內(nèi)存、共享信號量等。配 置管理模塊用于對所述語音消息通知子系統(tǒng)的運行參數(shù)進(jìn)行配置管理。第二服務(wù)交互接口 237提供接口,與語音消息識別子系統(tǒng)交互。第二服務(wù)控制模塊234是語音消息通知子系 統(tǒng)的控制中心。第二服務(wù)控制模塊234可以啟動、關(guān)閉、暫停語音消息識別子系統(tǒng)的運行狀 態(tài)。其它模塊通過第二服務(wù)控制模塊234相互交互。本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該消息類型的應(yīng)用單元,則可以 將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用 性,可以適用于各種功能的應(yīng)用單元。實施例三圖3為本發(fā)明實施例三提供的語音識別控制方法的流程示意圖,如圖3所示,該語 音識別控制方法包括步驟101、對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息,所述語音消息 中攜帶所述語音信號對應(yīng)的文本信息;步驟102、將所述語音消息發(fā)送至需要所述語音消息的應(yīng)用單元,以使所述應(yīng)用單 元根據(jù)所述語音消息中的文本信息控制應(yīng)用單元的運行狀態(tài)。具體地,本實施例的語音識別控制方法可以由上述實施例中的語音識別控制系統(tǒng) 完成,語音識別控制系統(tǒng)中,語音消息中間件的語音消息識別子系統(tǒng)對語音輸入設(shè)備輸入 的語音信號進(jìn)行識別得到語音消息后,語音消息通知子系統(tǒng)檢查需要所述語音消息的應(yīng)用 單元,若存在,則將語音消息發(fā)送至應(yīng)用單元,以使應(yīng)用單元根據(jù)語音消息控制應(yīng)用單元的 運行狀態(tài)。其中,語音消息中除了可以包括文本信息外,還可以包括消息類型、消息產(chǎn)生時 間、消息有效期等,具體可以參見實施例一中的相關(guān)描述。本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜 帶文本信息的語音消息后,若存在需要該語音消息的應(yīng)用單元,則可以將該語音消息發(fā)送 至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用性,可以適用于各種 功能的應(yīng)用單元。實施例四圖4a為本發(fā)明實施例四提供的語音識別控制方法的流程示意圖,如圖4所示,在 實施例三的基礎(chǔ)上,該語音識別控制方法的步驟101可以包括步驟201、對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處理;步驟202、提取所述語音信號的特征碼,根據(jù)消息特征庫中預(yù)先存儲的特征碼對所 述語音信號的特征碼進(jìn)行匹配;步驟203、若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本信息,生成攜帶所述 文本信息的語音消息,所述語音消息還包括消息類型。其中,本實施例的語音識別控制方法可以由上述實施例中的語音識別控制系統(tǒng)完 成,語音識別控制系統(tǒng)的具體結(jié)構(gòu)可以參照上述實施例一和實施例二的相關(guān)描述,如圖4b 所示,為本發(fā)明實施例四提供的語音識別控制方法的信令流程示意圖,其中,上述步驟101 對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息,所述語音消息中攜帶所述語音信 號對應(yīng)的文本信息,具體方法可以包括步驟301、語音消息識別子系統(tǒng)的語音獲取模塊從語音輸入設(shè)備的語音采集模塊 獲取語音信號。如果語音獲取模塊啟動接收語音信號,則語音輸入設(shè)備可以不間斷地向語 音獲取模塊傳送語音信號,直至語音獲取模塊中止相關(guān)接收過程。步驟302、語音獲取模塊將獲取的各路語音信號進(jìn)行量化、去噪等預(yù)處理,將預(yù)處 理的語音信號推送給語音處理模塊。上述的步驟301至步驟302是語音獲取與預(yù)處理流程。步驟302中將預(yù)處理后的語音信號推送給語音處理模塊的過程,可以是同步或異步操作過程,既可以實時推送,也可 以每隔一段時間推送一定數(shù)據(jù)量的語音信號。語音獲取模塊還可以設(shè)置語音輸入設(shè)備的運 行參數(shù)和運行狀態(tài)。其中,運行參數(shù)主要包括語音采樣率和輸入格式,運行狀態(tài)包括啟動、 停止、暫停等。此外,語音獲取模塊還可以向?qū)?yīng)的語音輸入設(shè)備反饋語音信號的接收狀 態(tài)。步驟303、語音處理模塊對語音獲取模塊傳送的各路語音信號優(yōu)化處理,推送給語 音識別模塊。例如如果存在多路語音信號,可以將多路語音信號按一定規(guī)則合成為單路語 音信號。上述步驟302中預(yù)處理語音信號的過程也可以由語音處理模塊完成,預(yù)處理的過 程也可以歸屬于對語音信號進(jìn)行優(yōu)化處理的過程中。步驟304、語音處理模塊可以將優(yōu)化處理后的語音信號連續(xù)分塊地向語音識別模 塊推送語音信號。步驟304可以是同步或異步的過程。上述的步驟303和步驟304為語音優(yōu)化處理的過程。步驟305、語音識別模塊接收到來自語音處理模塊的語音信號后,對語音信號進(jìn)行 識別,得到文本信息,具體方法是語音識別模塊提取語音信號的特征碼,查找消息特征庫 中預(yù)先存儲的特征碼,如果在消息特征庫中預(yù)先存儲的特征碼中查找到與語音信號的特征 碼相同或相似的特征碼,則匹配成功,獲取該語音信號的特征碼對應(yīng)的文本信息。步驟306、語音識別模塊將識別出的文本信息推送給第一消息通知模塊。上述的步驟305和步驟306為語音識別的過程,可以將語音信號識別成文本信息。步驟307、第一消息通知模塊將接收到的文本信息封裝成應(yīng)用單元可以識別的語 音消息,封裝后的語音消息中攜帶消息類型和文本信息。步驟308、語音消息識別子系統(tǒng)的第一消息通知模塊將攜帶消息類型和文本信息 的語音消息發(fā)送給語音消息識別子系統(tǒng)的第一服務(wù)交互接口,然后該語音消息識別子系統(tǒng) 第一的服務(wù)交互接口將該語音消息推送給語音消息通知子系統(tǒng)的第二服務(wù)交互接口。上述的步驟307到步驟308是語音消息通知的過程,可以將攜帶消息類型和文本 信息的語音消息推送給語音消息通知子系統(tǒng)。本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜 帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該消息類型的應(yīng)用單元,則可以 將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用 性,可以適用于各種功能的應(yīng)用單元。實施例五圖5a為本發(fā)明實施例五提供的語音識別控制方法的流程示意圖,如圖5所示,在 實施例三、四的基礎(chǔ)上,該語音識別控制方法的步驟102可以包括步驟401、將各個語音消息保存為一個消息隊列;步驟402、定期檢查所述消息隊列中當(dāng)前是否存在需要發(fā)送的語音消息。步驟403、若存在需要發(fā)送的語音消息,則提取所述語音消息的消息類型,查詢是 否存在需要該消息類型的語音消息的應(yīng)用單元;步驟404、若存在,則向所述需要該消息類型的語音消息的應(yīng)用單元發(fā)送所述語音 消息。其中,本實施例的語音識別控制方法可以由上述實施例中的語音識別控制系統(tǒng)完成,語音識別控制系統(tǒng)的具體結(jié)構(gòu)可以參照上述實施例一和實施例二的相關(guān)描述,如圖5b 所示,為本發(fā)明實施例五提供的語音識別控制方法中消息管理的信令流程示意圖,其中,語 音消息中間件的語音消息通知子系統(tǒng)的各個模塊獲取并管理語音消息識別子系統(tǒng)發(fā)送的 語音消息的主要處理流程可以包括步驟501、語音消息通知子系統(tǒng)的第二服務(wù)交互接口接收語音消息識別子系統(tǒng)的 第一服務(wù)交互接口發(fā)送的攜帶消息類型和文本信息的語音消息。該步驟可以接著上一實施 例中的步驟308。步驟502、語音消息通知子系統(tǒng)的第二服務(wù)交互接口將攜帶消息類型和文本信息 的語音消息推送給消息管理模塊。步驟503、消息管理模塊提取語音消息的消息類型后,指示應(yīng)用管理模塊進(jìn)行收方 檢查,即檢查是否有應(yīng)用單元需要該消息類型的語音消息。步驟504、應(yīng)用管理模塊查詢是否有應(yīng)用需要指定消息類型的語音消息,如果存在 有應(yīng)用需要指定消息類型的語音消息,則向消息管理模塊返回成功的檢查結(jié)果,執(zhí)行步驟 507 ;否則,向消息管理模塊返回失敗的檢查結(jié)果后執(zhí)行步驟505。步驟505、如果沒有應(yīng)用單元需要指定消息類型的語音消息,消息管理模塊將無主 語音消息的相關(guān)信息如語音消息的消息類型、無應(yīng)用單元需要的狀態(tài)等,推送給第二服務(wù) 控制模塊,以獲取的無主語音消息的處理方法。其中,本實施例中的無主語音消息是指沒有 應(yīng)用單元注冊需要的指定消息類型的語音消息。步驟506、第二服務(wù)控制模塊返回?zé)o主語音消息的處理方法。例如如果第二服務(wù) 控制模塊要求保留相關(guān)的無主語音消息,則轉(zhuǎn)至步驟507,否則,消息管理模塊拋棄相關(guān)的 無主語音消息,并轉(zhuǎn)至步驟508。其中,上述步驟503-506的查詢過程是可選步驟,也可以不執(zhí)行步驟503-506,而 執(zhí)行步驟502之后,直接執(zhí)行步驟507。步驟507、消息管理模塊存儲相關(guān)語音消息。步驟508、消息管理模塊向第二服務(wù)交互接口反饋語音消息的處理結(jié)果,例如正 常處理,未處理等。步驟509、語音消息通知子系統(tǒng)的第二服務(wù)交互接口將語音消息的處理結(jié)果反饋 給語音消息識別子系統(tǒng)的第一服務(wù)交互接口。然后語音消息識別子系統(tǒng)的第一服務(wù)交互接 口可以將語音消息的處理結(jié)果反饋給語音消息識別子系統(tǒng)的第一消息通知模塊。如圖5c所示,為本發(fā)明實施例五提供的語音識別控制方法中消息通知的信令流 程示意圖,其中,若存在需要所述消息類型的應(yīng)用單元,則語音消息通知子系統(tǒng)的各個模塊 將所述語音消息發(fā)送至所述應(yīng)用單元的具體過程可以包括步驟601、消息管理模塊定期檢查消息隊列中是否存在需要發(fā)送的語音消息。如果 存在,則執(zhí)行步驟602 ;如果不存在,則繼續(xù)定期檢查。步驟602、消息管理模塊通過應(yīng)用管理模塊查詢是否存在需要接收某一消息類型 (步驟601中查找到的需要發(fā)送的某一條語音消息的消息類型)的應(yīng)用單元。步驟603、應(yīng)用管理模塊將查詢結(jié)果返回給消息管理模塊。如果應(yīng)用管理模塊沒有 查到需要接收該消息類型的應(yīng)用單元,則消息管理模塊可以刪除這一條語音消息,并轉(zhuǎn)回 步驟601,繼續(xù)處理下一條語音消息。如果查到存在需要該消息類型的應(yīng)用單元,則執(zhí)行步驟 604。步驟604、消息管理模塊通過第二消息通知模塊,向查找到需要該消息類型的應(yīng)用 單元推送該語音消息。步驟605、第二消息通知模塊將該語音消息推送給應(yīng)用交互接口。步驟606、應(yīng)用交互接口向應(yīng)用單元推送該語音消息。步驟607、應(yīng)用單元的消息處理模塊接收到該語音消息后,向應(yīng)用交互接口反饋處
理結(jié)果。步驟608、應(yīng)用交互接口將應(yīng)用單元的語音消息處理結(jié)果反饋給第二消息通知模 塊。步驟609、第二消息通知模塊將語音消息處理結(jié)果反饋給消息管理模塊。如果一條語音消息有多個接收應(yīng)用單元,則可以重復(fù)執(zhí)行步驟604至步驟609,依 次或同時向每個應(yīng)用單元推送某一消息類型的語音消息。此外,消息管理模塊在處理完某條語音消息后,可以刪除該條語音消息相關(guān)的信 肩、ο本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜 帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該消息類型的應(yīng)用單元,則可以 將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用 性,可以適用于各種功能的應(yīng)用單元。實施例六在實施例三、四、五的基礎(chǔ)上,本發(fā)明實施例六提供的語音識別控制方法,在進(jìn)行 語音識別之前或者過程中還可以包括注冊過程和/或注銷過程。其中,如圖6a所示,為本發(fā)明實施例六提供的語音識別控制方法中注冊過程的流 程示意圖,注冊過程為根據(jù)所述應(yīng)用單元的語音消息獲取請求的注冊信息,對所述應(yīng)用單 元的語音識別控制功能進(jìn)行注冊,具體可以包括步驟701、接收應(yīng)用單元的語音消息獲取請求的注冊信息,所述注冊信息中包括所 述應(yīng)用單元的注冊所需的四元組信息,所述四元組信息包括應(yīng)用標(biāo)識、消息類型、消息參數(shù) 和消息獲取接口;步驟702、若所述注冊信息有效,根據(jù)所述四元組信息,查詢所述應(yīng)用單元的語音 識別控制功能是否已經(jīng)注冊;步驟703、如果未注冊,則存儲所述應(yīng)用單元的四元組信息,根據(jù)所述四元組信息 生成對應(yīng)的消息接收標(biāo)識碼,并向所述應(yīng)用單元返回攜帶所述消息接收標(biāo)識碼的注冊成功 結(jié)果。由于消息接收標(biāo)識碼與該應(yīng)用單元的四元組信息對應(yīng),通過該消息接收標(biāo)識碼可以 快速查找到該應(yīng)用單元的四元組信息,從而加快注冊速度,并對在后續(xù)需要對應(yīng)用單元進(jìn) 行注銷時,加快注銷速度。其中,本實施例的語音識別控制方法可以由上述實施例中的語音識別控制系統(tǒng)完 成,語音識別控制系統(tǒng)的具體結(jié)構(gòu)可以參照上述實施例一和實施例二的相關(guān)描述,如圖6b 所示,為本發(fā)明實施例六提供的語音識別控制方法中注冊過程的信令流程示意圖,其中,語 音消息中間件的語音消息通知子系統(tǒng)的各個模塊根據(jù)應(yīng)用單元的語音消息獲取請求的注 冊信息,對應(yīng)用單元的語音識別控制功能進(jìn)行注冊的具體過程如下
步驟801、語音消息通知子系統(tǒng)的應(yīng)用交互接口接收應(yīng)用單元的語音消息獲取請 求的注冊信息,其中,注冊信息包括應(yīng)用類型、應(yīng)用標(biāo)識、消息獲取接口、消息類型、消息參 數(shù)等,其中,應(yīng)用標(biāo)識、消息類型、消息參數(shù)和消息獲取接口為該注冊信息的四元組信息。步驟802、語音消息通知子系統(tǒng)的應(yīng)用交互接口對應(yīng)用單元的語音消息獲取請求 的注冊信息進(jìn)行預(yù)處理,并將相關(guān)的注冊信息轉(zhuǎn)發(fā)給語音消息通知子系統(tǒng)的第一應(yīng)用注冊 模塊。步驟803、第一應(yīng)用注冊模塊將注冊信息發(fā)送給應(yīng)用管理模塊,指示應(yīng)用管理模塊 查詢應(yīng)用單元的語音識別控制功能是否已經(jīng)注冊。其中,第一應(yīng)用注冊模塊還可以檢查應(yīng) 用單元通過語音消息獲取請求的注冊信息提供的注冊信息是否符合約定的規(guī)則,如果符合 約定的規(guī)則,則有效,如果不符合約定的規(guī)則,則直接轉(zhuǎn)至步驟806直接返回處理結(jié)果。步驟804、應(yīng)用管理模塊檢查該應(yīng)用單元的注冊信息是否已經(jīng)存在,如果應(yīng)用單元 的注冊信息已經(jīng)存在,表明該應(yīng)用單元的語音識別控制功能已經(jīng)注冊,則轉(zhuǎn)到步驟805,反 饋注冊結(jié)果。如果未注冊,則存儲該應(yīng)用單元的注冊信息(包括四元組信息),并生成消息 接收標(biāo)識碼,通過步驟805返回注冊結(jié)果。此外,如果該應(yīng)用單元的語音消息獲取請求的注 冊信息是第一個有效請求,則應(yīng)用管理模塊可以通知語音消息通知子系統(tǒng)的第二服務(wù)控制 模塊,有應(yīng)用單元要獲取語音消息,語音消息通知子系統(tǒng)的第二服務(wù)控制模塊可以檢查并 啟動語音消息識別子系統(tǒng)。步驟805、應(yīng)用管理模塊向語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊反饋應(yīng)用單 元的注冊信息的處理結(jié)果,例如處理成功、失敗或未處理。步驟806、語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊將處理結(jié)果反饋給語音消息 通知子系統(tǒng)的應(yīng)用交互接口。步驟807、語音消息通知子系統(tǒng)的應(yīng)用交互接口將處理結(jié)果反饋給應(yīng)用單元的第 二應(yīng)用注冊模塊。其中,語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊通過應(yīng)用交互接口向應(yīng)用單元反 饋的注冊結(jié)果可以包括注冊的狀態(tài)如成功或失敗;語音消息獲取請求的注冊信息處理失 敗原因如四元組信息不對;注冊成功時返回消息接收標(biāo)識碼等。應(yīng)用單元根據(jù)語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊的反饋結(jié)果做后繼處理。 如果注冊成功,則應(yīng)用單元需要保存反饋的消息接收標(biāo)識碼。注冊成功后,應(yīng)用單元通過注 冊的消息獲取接口獲取通知消息。其中,如圖6c所示,本發(fā)明實施例六提供的語音識別控制方法中注銷過程的流程 示意圖,注銷過程為根據(jù)所述應(yīng)用單元的語音消息獲取請求的注銷信息,對所述應(yīng)用單元 的語音識別控制功能進(jìn)行注銷,具體可以包括步驟901、接收應(yīng)用單元的發(fā)送的語音消息獲取請求的注銷信息,所述注銷信息包 括已經(jīng)注冊的消息接收標(biāo)識碼和四元組信息;步驟902、若所述消息接收標(biāo)識碼和所述四元組信息正確,則刪除所述消息接收標(biāo) 識碼和所述四元組信息,以使所述消息接收標(biāo)識碼失效。其中,如果僅存在該已注銷的應(yīng)用 單元需要的某一消息類型的語音消息,則可以刪除該消息類型的語音消息;如果存在多個 應(yīng)用單元需要相同的消息類型的語音消息,則可以逐個檢查是否還有需要該消息類型的應(yīng) 用單元,如果沒有,則可以刪除該消息類型的語音消息。在消息隊列為空時,則語音消息通知子系統(tǒng)可以通知語音消息識別子系統(tǒng)停止語音消息的獲取與識別過程。如圖6d所示,為本發(fā)明實施例六提供的語音識別控制方法中注銷過程的信令流 程示意圖,其中,對于已經(jīng)向語音消息通知子系統(tǒng)成功注冊過的應(yīng)用單元,語音消息中間件 的語音消息通知子系統(tǒng)的各個模塊可以根據(jù)應(yīng)用單元的語音消息獲取請求的注銷信息,對 應(yīng)用單元的語音識別控制功能進(jìn)行注銷,注銷時,應(yīng)用單元需要提供注冊時生成的相應(yīng)的 消息接收標(biāo)識碼及與該消息接收標(biāo)識碼對應(yīng)的四元組信息,具體過程如下步驟111、應(yīng)用單元的第二應(yīng)用注冊模塊向語音消息通知子系統(tǒng)的應(yīng)用交互接口 發(fā)送語音消息獲取請求的注銷信息。注銷信息的內(nèi)容主要包括,消息接收標(biāo)識碼、該消息接 收標(biāo)識碼對應(yīng)的四元組。步驟112、語音消息通知子系統(tǒng)的應(yīng)用交互接口將應(yīng)用的語音消息獲取請求的注 銷信息轉(zhuǎn)發(fā)給語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊。步驟113、語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊通過語音消息通知子系統(tǒng)的 應(yīng)用管理模塊檢查應(yīng)用單元的注銷信息中的請求類型等四元組信息是否完整,以及消息接 收標(biāo)識碼是否存在和有效。如果四元組信息不完整,或者消息接收標(biāo)識碼不存在,則直接轉(zhuǎn) 至步驟115,通知語音消息獲取請求的注銷信息失??;否則,執(zhí)行步驟114。步驟114、如果應(yīng)用單元提交的消息接收標(biāo)識碼及對應(yīng)的四元組信息存在且有效, 應(yīng)用管理模塊檢查是否還有應(yīng)用單元需要接收語音消息。如果沒有應(yīng)用單元需要接收語音 消息,則應(yīng)用管理模塊通知第二服務(wù)控制模塊無應(yīng)用需要獲取語音消息,此時,語音消息通 知子系統(tǒng)的第二服務(wù)控制模塊可以通知語音消息識別子系統(tǒng)停止語音的獲取與識別過程。步驟115、語音消息通知子系統(tǒng)的應(yīng)用管理模塊將注銷信息的處理結(jié)果反饋給語 音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊。步驟116、語音消息通知子系統(tǒng)的第一應(yīng)用注冊模塊將處理結(jié)果反饋給語音消息 通知子系統(tǒng)的應(yīng)用交互接口。步驟117、語音消息通知子系統(tǒng)的應(yīng)用交互接口將語音消息獲取請求的注銷信息 的處理結(jié)果反饋給應(yīng)用單元的第二應(yīng)用注冊模塊。語音消息通知子系統(tǒng)向應(yīng)用單元反饋的 處理結(jié)果可以包括應(yīng)用單元的語音消息獲取請求的注銷信息的處理狀態(tài)如成功或失敗; 請求處理失敗原因如四元組信息不對等。如果語音消息獲取請求的注銷信息處理成功,則 其對應(yīng)的消息接收標(biāo)識碼失效。如圖6e所示,為本發(fā)明實施例六提供的語音識別控制方法中狀態(tài)控制的信令流 程示意圖,其中,語音服務(wù)中間件的語音消息通知子系統(tǒng)和語音消息識別子系統(tǒng)的狀態(tài)控 制過程可以包括步驟121、語音消息通知子系統(tǒng)的應(yīng)用管理模塊檢查是否有應(yīng)用單元需要獲取語 音消息。步驟122、如果語音消息通知子系統(tǒng)的應(yīng)用管理模塊檢查到有應(yīng)用單元需要獲取 語音消息,則通知語音消息通知子系統(tǒng)的第二服務(wù)控制模塊檢查和控制語音消息識別子系 統(tǒng)的運行狀態(tài)。例如語音消息通知子系統(tǒng)的應(yīng)用管理模塊在處理應(yīng)用單元的語音消息獲取請求 的注冊或注銷信息時,檢查當(dāng)前是否有應(yīng)用單元需要獲取語音消息,如果有,則通知語音消 息通知子系統(tǒng)的第二服務(wù)控制模塊啟動語音消息識別子系統(tǒng);如果沒有,則通知語音消息通知子系統(tǒng)的第二服務(wù)控制模塊可以關(guān)閉語音消息識別子系統(tǒng)。步驟123、語音消息通知子系統(tǒng)的第二服務(wù)控制模塊指示語音消息通知子系統(tǒng)的 第二服務(wù)交互接口,檢查語音消息識別子系統(tǒng)的運行狀態(tài)。其中,語音消息識別子系統(tǒng)的運 行狀態(tài)主要包括語音消息識別子系統(tǒng)是否啟動、語音獲取模塊、語音處理模塊及語音識別 模塊等是否正常工作。步驟124、語音消息通知子系統(tǒng)的第二服務(wù)交互接口檢查語音消息識別子系統(tǒng)是 否啟動,如果啟動,則執(zhí)行步驟125 ;如果未啟動,則執(zhí)行步驟128。步驟125、語音消息通知子系統(tǒng)的第二服務(wù)交互接口通過語音消息識別子系統(tǒng)的 第一服務(wù)交互接口,向語音消息識別子系統(tǒng)的第一服務(wù)控制模塊發(fā)送當(dāng)前的狀態(tài)獲取請 求。步驟126、語音消息識別子系統(tǒng)的第一服務(wù)控制模塊檢查語音消息識別子系統(tǒng)的 當(dāng)前狀態(tài),并將該當(dāng)前狀態(tài)返回給語音消息識別子系統(tǒng)的第一服務(wù)交互接口。步驟127、語音消息識別子系統(tǒng)的第一服務(wù)交互接口將獲取到的語音消息識別子 系統(tǒng)的當(dāng)前狀態(tài)反饋給語音消息通知子系統(tǒng)的第二服務(wù)交互接口。步驟128、語音消息通知子系統(tǒng)的第二服務(wù)交互接口將獲取到的語音消息識別子 系統(tǒng)的當(dāng)前狀態(tài)轉(zhuǎn)發(fā)給語音消息通知子系統(tǒng)的第二服務(wù)控制模塊。其中,如果是未啟動,則 返回語音消息識別子系統(tǒng)未啟動的運行狀態(tài),如果已經(jīng)啟動,則返回語音消息識別子系統(tǒng) 各個子模塊的當(dāng)前狀態(tài)。上述的步驟123至步驟128是語音消息識別子系統(tǒng)的運行狀態(tài)查詢流程。通過步 驟123到步驟128、語音消息通知子系統(tǒng)的第二服務(wù)控制模塊可以實時或周期性的獲知語 音消息識別子系統(tǒng)的當(dāng)前狀態(tài)。步驟129、如果語音消息通知子系統(tǒng)的第二服務(wù)控制模塊檢查到有應(yīng)用需要獲取 語音消息,且語音消息識別子系統(tǒng)未啟動,則語音消息通知子系統(tǒng)的第二服務(wù)控制模塊啟 動語音消息識別子系統(tǒng),然后,執(zhí)行步驟123至步驟128檢查語音消息識別子系統(tǒng)的當(dāng)前狀 態(tài)。如果語音消息通知子系統(tǒng)的第二服務(wù)控制模塊接收到的狀態(tài)為語音消息識別子系統(tǒng)已 經(jīng)啟動,且獲取了語音消息識別子系統(tǒng)的當(dāng)前狀態(tài),例如啟動或暫停語音消息獲取、處理 或識別過程等,則執(zhí)行步驟130。此外,如果語音消息通知子系統(tǒng)的第二服務(wù)控制模塊接收到的狀態(tài)為語音消息識 別子系統(tǒng)已經(jīng)啟動,但是無應(yīng)用單元需要獲取語音消息,則可以轉(zhuǎn)至步驟138,關(guān)閉語音消 息識別子系統(tǒng)。步驟130、語音消息通知子系統(tǒng)的第二服務(wù)控制模塊將語音消息識別子系統(tǒng)的當(dāng) 前狀態(tài)發(fā)送給語音消息通知子系統(tǒng)的第二服務(wù)交互接口。步驟131、語音消息通知子系統(tǒng)的第二服務(wù)交互接口將語音消息識別子系統(tǒng)的當(dāng) 前狀態(tài)發(fā)送給語音消息識別子系統(tǒng)的第一服務(wù)交互接口。步驟132、語音消息識別子系統(tǒng)的第一服務(wù)交互接口將語音消息識別子系統(tǒng)的當(dāng) 前狀態(tài)發(fā)送給語音消息識別子系統(tǒng)的第一服務(wù)控制模塊。步驟133、語音消息識別子系統(tǒng)的第一服務(wù)控制模塊根據(jù)接收到的當(dāng)前狀態(tài),控制 語音消息識別子系統(tǒng)的各個模塊例如語音獲取模塊的狀態(tài)調(diào)整。步驟134、語音消息識別子系統(tǒng)的語音獲取模塊根據(jù)接收到的當(dāng)前狀態(tài)調(diào)整自己的狀態(tài)后,向語音消息識別子系統(tǒng)的第一服務(wù)控制模塊反饋調(diào)整結(jié)果,將最新的運行狀態(tài) 反饋給語音消息識別子系統(tǒng)的第一服務(wù)控制模塊。語音消息識別子系統(tǒng)的第一服務(wù)控制模塊可以按照與上述步驟133和步驟134類 似的方法及相關(guān)的控制狀態(tài),控制其它模塊例如,語音處理模塊、語音識別模塊等的運行狀 態(tài)。步驟135、語音消息識別子系統(tǒng)的第一服務(wù)控制模塊收集各個模塊的當(dāng)前狀態(tài),并 將收集的各個模塊的當(dāng)前狀態(tài)反饋給語音消息識別子系統(tǒng)的第一服務(wù)交互接口。步驟136、語音消息識別子系統(tǒng)的第一服務(wù)交互接口將語音消息識別子系統(tǒng)各個 模塊的當(dāng)前狀態(tài)反饋給語音消息通知子系統(tǒng)的第二服務(wù)交互接口。步驟137、語音消息通知子系統(tǒng)的第二服務(wù)交互接口將語音消息識別子系統(tǒng)各個 模塊的當(dāng)前狀態(tài)反饋給語音消息通知子系統(tǒng)的第二服務(wù)控制模塊。其中,步驟130至步驟137是語音消息識別子系統(tǒng)各個模塊的運行狀態(tài)控制流程。 通過步驟130至步驟137,語音消息通知子系統(tǒng)的第二服務(wù)控制模塊可以控制語音消息識 別子系統(tǒng)的運行狀態(tài)。步驟138、語音消息通知子系統(tǒng)的第二服務(wù)控制模塊關(guān)閉語音消息識別子系統(tǒng)。然 后,如果有檢查到有應(yīng)用單元需要獲取語音消息,再通過步驟123至步驟128檢查語音消息 識別子系統(tǒng)的運行狀態(tài)。本實施例通過語音消息中間件對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到攜 帶消息類型和對應(yīng)的文本信息的語音消息后,若存在需要該消息類型的應(yīng)用單元,則可以 將該語音消息發(fā)送至該應(yīng)用單元,可以控制該應(yīng)用單元的運行狀態(tài),該語音控制具有通用 性,可以適用于各種功能的應(yīng)用單元。本發(fā)明上述實施例中通過語音服務(wù)中間件實現(xiàn)本發(fā)明語音識別控制方法的過程 僅為示例,對語音服務(wù)中間件的結(jié)構(gòu)的劃分也可以采用其他實現(xiàn)方式,例如將語音消息通 知子系統(tǒng)與語音消息識別子系統(tǒng)作為一個系統(tǒng)劃分功能模塊,或者改變這兩個子系統(tǒng)的功 能模塊名稱及相互關(guān)系。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過 程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機(jī)可讀取存儲介質(zhì)中,該程序 在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或光 等各種可以存儲程序代碼的介質(zhì)。最后應(yīng)說明的是以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然 可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替 換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精 神和范圍。
權(quán)利要求
1.一種語音識別控制系統(tǒng),其特征在于,包括語音輸入設(shè)備,用于對接收到的語音信號進(jìn)行采樣,得到語音信號;將所述語音信號輸 入語音消息中間件;語音消息中間件,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息, 所述語音消息中攜帶所述語音信號對應(yīng)的文本信息,將所述語音消息發(fā)送至需要所述語音 消息的應(yīng)用單元;應(yīng)用單元,用于接收所述語音消息中間件發(fā)送的所述語音消息,根據(jù)所述語音消息中 的文本信息控制所述應(yīng)用單元的運行狀態(tài)。
2.根據(jù)權(quán)利要求1所述的語音識別控制系統(tǒng),其特征在于,所述語音消息中間件包括 語音消息識別子系統(tǒng),用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處理;提取所述語音信號的特征碼,根據(jù)消息特征庫中預(yù)先存儲的特征碼對所述語音信號的特征碼進(jìn)行匹 配;若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本信息生成攜帶所述文本信息的語音 消息,所述語音消息還包括消息類型,將所述語音消息發(fā)送至語音消息通知子系統(tǒng);語音消息通知子系統(tǒng),用于提取所述語音消息的消息類型,查詢是否存在需要該消息 類型的語音消息的應(yīng)用單元;若存在,則向所述需要該消息類型的語音消息的應(yīng)用單元發(fā) 送所述語音消息。
3.根據(jù)權(quán)利要求2所述的語音識別控制系統(tǒng),其特征在于,所述語音消息識別子系統(tǒng) 包括語音處理模塊,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處理; 語音識別模塊,用于提取所述語音信號的特征碼,根據(jù)消息特征庫中預(yù)先存儲的特征 碼對所述語音信號的特征碼進(jìn)行匹配;若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本 信息,生成攜帶消息類型和所述文本信息的語音消息; 消息特征庫,用于保存匹配所用的特征碼;第一消息通知模塊,用于向所述語音消息通知子系統(tǒng)發(fā)送所述語音消息; 第一服務(wù)控制模塊,用于根據(jù)所述語音消息通知子系統(tǒng)的指示控制所述語音消息識別 子系統(tǒng)的運行狀態(tài)。
4.根據(jù)權(quán)利要求3所述的語音識別控制系統(tǒng),其特征在于,所述語音消息識別子系統(tǒng) 還包括語音獲取模塊,用于接收所述語音輸入設(shè)備輸入的所述語音信號,將所述語音信號預(yù) 處理后發(fā)送至所述語音處理模塊;第一服務(wù)交互接口,用于將所述第一消息通知模塊發(fā)送的所述語音消息轉(zhuǎn)發(fā)至所述語 音消息通知子系統(tǒng)的第二服務(wù)交互接口;所述第一服務(wù)控制模塊,還用于控制所述語音處理模塊、語音識別模塊、第一消息通知 模塊、語音獲取模塊和第一服務(wù)交互接口之間的交互。
5.根據(jù)權(quán)利要求2-4任一所述的語音識別控制系統(tǒng),其特征在于,所述語音消息通知 子系統(tǒng)包括消息管理模塊,用于將各個語音消息保存為一個消息隊列;定期檢查所述消息隊列中 當(dāng)前是否存在需要發(fā)送的語音消息,若存在需要發(fā)送的語音消息,則提取所述語音消息的 消息類型,指示應(yīng)用管理模塊查詢是否存在需要該消息類型的語音消息的應(yīng)用單元,若存在,則指示第二消息通知模塊向需要該消息類型的語音消息的應(yīng)用單元發(fā)送所述語音消 息;應(yīng)用管理模塊,用于查詢是否存在需要該消息類型的語音消息的應(yīng)用單元;若存在,則 所述消息管理模塊返回所述需要該消息類型的語音消息的應(yīng)用單元的信息;第二消息通知模塊,用于根據(jù)所述消息管理模塊的指示,向需要該消息類型的語音消 息的應(yīng)用單元發(fā)送所述語音消息;第二服務(wù)控制模塊,用于指示所述語音消息識別子系統(tǒng)需要控制的運行狀態(tài)。
6.根據(jù)權(quán)利要求5所述的語音識別控制系統(tǒng),其特征在于,所述語音消息通知子系統(tǒng) 還包括應(yīng)用交互接口,用于將所述第二消息通知模塊的所述語音消息轉(zhuǎn)發(fā)至需要該消息類型 的語音消息的應(yīng)用單元;將接收的所述應(yīng)用單元發(fā)送的語音消息獲取請求的注冊或注銷信 息發(fā)送至第一應(yīng)用注冊模塊;第一應(yīng)用注冊模塊,用于根據(jù)所述應(yīng)用單元的語音消息獲取請求的注冊或注銷信息, 對所述應(yīng)用單元的語音識別控制功能進(jìn)行注冊或注銷;第二服務(wù)交互接口,用于接收所述語音消息識別子系統(tǒng)的第一服務(wù)交互接口發(fā)送的所 述語音消息;所述第二服務(wù)控制模塊,還用于控制所述應(yīng)用管理模塊、消息管理模塊、第二消息通知 模塊、應(yīng)用交互接口、第一應(yīng)用注冊模塊和第二服務(wù)交互接口之間的交互。
7.一種語音識別控制方法,其特征在于,包括對語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息,所述語音消息中攜帶所述語 音信號對應(yīng)的文本信息;將所述語音消息發(fā)送至需要所述語音消息的應(yīng)用單元,以使所述應(yīng)用單元根據(jù)所述語 音消息中的文本信息控制應(yīng)用單元的運行狀態(tài)。
8.根據(jù)權(quán)利要求7所述的語音識別控制方法,其特征在于,所述對語音輸入設(shè)備輸入 的語音信號進(jìn)行識別得到語音消息,所述語音消息中攜帶所述語音信號對應(yīng)的文本信息, 包括對所述語音輸入設(shè)備輸入的語音信號進(jìn)行處理;提取所述語音信號的特征碼,根據(jù)消息特征庫中預(yù)先存儲的特征碼對所述語音信號的 特征碼進(jìn)行匹配;若匹配成功,根據(jù)該語音信號的特征碼對應(yīng)的文本信息,生成攜帶所述文本信息的語 音消息,所述語音消息還包括消息類型。
9.根據(jù)權(quán)利要求8所述的語音識別控制方法,其特征在于,所述將所述語音消息發(fā)送 至需要所述語音消息的應(yīng)用單元,包括若存在需要發(fā)送的語音消息,則提取所述語音消息的消息類型,查詢是否存在需要該 消息類型的語音消息的應(yīng)用單元;若存在,則向所述需要該消息類型的語音消息的應(yīng)用單元發(fā)送所述語音消息。
10.根據(jù)權(quán)利要求9所述的語音識別控制方法,其特征在于,所述提取所述語音消息的 消息類型之前,包括將各個語音消息保存為一個消息隊列;定期檢查所述消息隊列中當(dāng)前是否存在需要發(fā)送的語音消息。
11.根據(jù)權(quán)利要求9或10所述的語音識別控制方法,其特征在于,還包括根據(jù)所述應(yīng)用單元的語音消息獲取請求的注冊信息,對所述應(yīng)用單元的語音識別控制 功能進(jìn)行注冊;或根據(jù)所述應(yīng)用單元的語音消息獲取請求的注銷信息,對所述應(yīng)用單元的語音識別控制 功能進(jìn)行注銷。
12.根據(jù)權(quán)利要求11所述的語音識別控制方法,其特征在于,所述根據(jù)所述應(yīng)用單元 的語音消息獲取請求的注冊信息,對所述應(yīng)用單元的語音識別控制功能進(jìn)行注冊,包括接收應(yīng)用單元的語音消息獲取請求的注冊信息,所述注冊信息中包括所述應(yīng)用單元的 注冊所需的四元組信息,所述四元組信息包括應(yīng)用標(biāo)識、消息類型、消息參數(shù)和消息獲取接 Π ;若所述注冊信息有效,根據(jù)所述四元組信息,查詢所述應(yīng)用單元的語音識別控制功能 是否已經(jīng)注冊;如果未注冊,則存儲所述應(yīng)用單元的四元組信息,根據(jù)所述四元組信息生成對應(yīng)的消 息接收標(biāo)識碼,并向所述應(yīng)用單元返回攜帶所述消息接收標(biāo)識碼的注冊成功結(jié)果。
13.根據(jù)權(quán)利要求11所述的語音識別控制方法,其特征在于,所述根據(jù)所述應(yīng)用單元 的語音消息獲取請求的注銷信息,對所述應(yīng)用單元的語音識別控制功能進(jìn)行注銷,包括接收應(yīng)用單元的發(fā)送的語音消息獲取請求的注銷信息,所述注銷信息包括已經(jīng)注冊的 消息接收標(biāo)識碼和四元組信息;若所述消息接收標(biāo)識碼和所述四元組信息正確,則刪除所述消息接收標(biāo)識碼和所述四 元組信息,以使所述消息接收標(biāo)識碼失效。
全文摘要
本發(fā)明公開了一種語音識別控制系統(tǒng)和方法。其中,該語音識別控制系統(tǒng)包括語音輸入設(shè)備,用于對接收到的語音信號進(jìn)行采樣,得到語音信號;將所述語音信號輸入語音消息中間件;語音消息中間件,用于對所述語音輸入設(shè)備輸入的語音信號進(jìn)行識別得到語音消息,所述語音消息中攜帶所述語音信號對應(yīng)的文本信息;將所述語音消息發(fā)送至需要所述語音消息的應(yīng)用單元;應(yīng)用單元,用于接收所述語音消息中間件發(fā)送的所述語音消息,根據(jù)所述語音消息中的文本信息控制所述應(yīng)用單元的運行狀態(tài)。本發(fā)明具有通用性,可以適用于各種功能的應(yīng)用單元。
文檔編號G06F3/16GK102004624SQ20101054245
公開日2011年4月6日 申請日期2010年11月11日 優(yōu)先權(quán)日2010年11月11日
發(fā)明者加雄偉 申請人:中國聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司