一種實現(xiàn)語音識別功能的方法
【專利摘要】一種實現(xiàn)語音識別功能的方法,其特征在于:有一個聲音采集模塊,能夠支持聲音錄入功能,將聲音采集為數(shù)字數(shù)據(jù),即配備麥克風或者可以提供相同功能的其他設(shè)備;有語音識別模塊將聲音數(shù)據(jù)轉(zhuǎn)化為文本;有語義解析模塊將文本理解為指令或者指令集;聲控程序,可以按照各自的意愿制定出非常人性化的交互方式和產(chǎn)品體驗;支持至少一種喚醒錄音方式,可以通過喚醒詞喚醒、硬件按鈕喚醒或者軟件按鈕喚醒;最終實現(xiàn)真正的語音功能。本發(fā)明的優(yōu)點:可以控制導(dǎo)航機播報內(nèi)容及播報時機、錄音開始停止狀態(tài),及交互次數(shù)和發(fā)聲,產(chǎn)品體驗完全依賴于開發(fā)者的想法和設(shè)計,與聲音控制程序沒有任何耦合;給開發(fā)者帶來了全新的體驗。
【專利說明】一種實現(xiàn)語音識別功能的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及導(dǎo)航領(lǐng)域,特別涉及了一種實現(xiàn)語音識別功能的方法。
【背景技術(shù)】
[0002]隨著汽車電子行業(yè)的興起,汽車導(dǎo)航系統(tǒng)開始走入人們的視線。汽車導(dǎo)航系統(tǒng),是在嵌入式硬件、全球GPS定位、地理信息數(shù)據(jù)的基礎(chǔ)上,為駕駛者提供電子地圖、車輛定位、實時語音引導(dǎo)、實時畫面引導(dǎo)等服務(wù)的綜合體。
[0003]提到科技的進步,則不能不提及產(chǎn)品的人工智能化,語言和聲音作為人與人之間最常用和最便利的方式,如果能應(yīng)用到人機交互中,那將會大大提高用戶體驗,效率及安全性。語音識別經(jīng)過幾十年的坎坷發(fā)展,到如今已經(jīng)初步達到可應(yīng)用的水平,從降噪到識別到語義解析都達到一個空前的高水平。
[0004]但是在應(yīng)用界還并沒有非常的普及,出現(xiàn)的產(chǎn)品也還遠遠沒有達到完全“解放雙手”的目的,從開發(fā)上講,效率和成本都是非常的高,而且目前很多企業(yè)應(yīng)用的方案可維護和可擴展性很差,一旦有需求的變更,則會對開發(fā)者造成非常大的困擾;從產(chǎn)品上講,出現(xiàn)的一些語音識別的平臺,將會造成語音產(chǎn)品同質(zhì)化嚴重的情況,不利于該行業(yè)的發(fā)展。現(xiàn)在的語音產(chǎn)品開發(fā)方案存在著很多問題,諸如效率低,靈活性差,產(chǎn)品體驗不夠好,產(chǎn)品同質(zhì)化嚴重等問題,很多企業(yè)為了想做語音識別產(chǎn)品而沒有好的方案,最后僅只投入了根據(jù)識別文字匹配字符串的功能。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的是為了在導(dǎo)航終端實現(xiàn)語音產(chǎn)品,特提供了一種實現(xiàn)語音識別功能的方法。
[0006]本發(fā)明提供了一種實現(xiàn)語音識別功能的方法,其特征在于:所述的實現(xiàn)語音識別功能的方法,具備以下特征:
[0007]有一個聲音采集模塊,能夠支持聲音錄入功能,將聲音采集為數(shù)字數(shù)據(jù),即配備麥克風或者可以提供相同功能的其他設(shè)備;
[0008]有語音識別模塊將聲音數(shù)據(jù)轉(zhuǎn)化為文本;
[0009]有語義解析模塊將文本理解為指令或者指令集;
[0010]聲控程序,通過定義通信接口的方式將應(yīng)用程序和語音控制程序本來存在的復(fù)雜度降低而不相互耦合,雙方只是相互約定好原則,就可以按照各自的意愿制定出非常人性化的交互方式和產(chǎn)品體驗;
[0011]有至少一款的應(yīng)用程序,與聲控程序進行交互,實現(xiàn)語音識別功能;
[0012]支持至少一種喚醒錄音方式,可以通過喚醒詞喚醒、硬件按鈕喚醒或者軟件按鈕喚醒;
[0013]用戶功能通過語音喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音,錄音狀態(tài)下,用戶可以輸入自己的指令,語音處理模塊將會經(jīng)過聲音采集,聲音識別,語義解析,命令下發(fā),命令執(zhí)行,命令執(zhí)行反饋,反饋意見處理等幾個過程,最終實現(xiàn)真正的語音功能,其中該專利更強調(diào)的是命令執(zhí)行反饋和反饋意見處理的部分。
[0014]所述的實現(xiàn)語音識別功能的方法,通過語音輸入,聲控程序負責識別和解析,并將指令發(fā)送給應(yīng)用程序,不用關(guān)心具體的處理方式,將聲音控制程序真正作成一個與業(yè)務(wù)無關(guān)的平臺;應(yīng)用程序通過與聲控程序的接口,可以控制導(dǎo)航機播報內(nèi)容及播報時機、錄音開始停止狀態(tài),及交互次數(shù)和發(fā)聲,產(chǎn)品體驗完全依賴于開發(fā)者的想法和設(shè)計,與聲音控制程序沒有任何耦合;除了語音播報,聲控程序能夠顯示和記錄下人機交互的對話過程,方便查看。
[0015]所述的實現(xiàn)語音識別功能的方法,實現(xiàn)的硬件整體框架分為三個部分:
[0016]終端設(shè)備:負責聲音采集,音頻數(shù)據(jù)與服務(wù)器的傳輸,解析結(jié)果獲取和處理;云端服務(wù)器:負責語音識別和語義解析,并從網(wǎng)絡(luò)獲取相應(yīng)的信息,為終端設(shè)備提供數(shù)據(jù);車聯(lián)網(wǎng)服務(wù)器:負責整合網(wǎng)絡(luò)資源,為云端服務(wù)器提供信息;
[0017]終端設(shè)備實現(xiàn)原理和流程:
[0018]用戶對著聲音采集設(shè)備說出指令;
[0019]聲控程序通過操作系統(tǒng)API獲取音頻數(shù)據(jù),將音頻數(shù)據(jù)發(fā)送到云端服務(wù)器上,云端服務(wù)器進行識別,解析,最終將解析結(jié)果發(fā)送給聲控程序;
[0020]聲控程序根據(jù)解析結(jié)果,識別是哪一類的指令,并發(fā)送給指定的應(yīng)用程序;
[0021]應(yīng)用程序根據(jù)自己的優(yōu)先級,進行響應(yīng),如果能處理則進行自處理,如果不能處理,則返回給聲控程序不能處理的通知,由聲控程序通知下一個應(yīng)用程序;
[0022]以此類推,直到所有應(yīng)用都經(jīng)過了處理為止;
[0023]云端服務(wù)器實現(xiàn)原理和流程:
[0024]云端服務(wù)器在此方案中處于可選的地位,如果不選,則此邏輯需要在聲控程序里實現(xiàn);
[0025]服務(wù)器主要解決識別和解析的作用,由服務(wù)器選擇使用哪家的識別和解析引擎,并且也可以自身也做解析,實現(xiàn)個性化;
[0026]服務(wù)器需要做好良好的封裝,以便在替換語音識別和解析引擎時,對終端沒有影響;
[0027]如果是問答性的指令,可以從車聯(lián)網(wǎng)服務(wù)器上獲取相關(guān)信息,然后返回給終端設(shè)備;
[0028]車聯(lián)網(wǎng)服務(wù)器:提供網(wǎng)絡(luò)信息資源。
[0029]實現(xiàn)語音識別功能的方法,具體實現(xiàn)的步驟如下:
[0030]系統(tǒng)啟動,默認啟動聲音控制程序,將初始化語音識別和語義解析模塊初始化;
[0031]初始化成功后,用戶可以通過喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音;
[0032]導(dǎo)航儀的聲音控制程序收到語音指令后,進行識別和解析,將解析結(jié)果發(fā)送給優(yōu)先級最聞的應(yīng)用程序;
[0033]應(yīng)用程序接收到解析結(jié)果之后,進行分析和處理,將處理結(jié)果發(fā)送給聲音控制程序;
[0034]如果應(yīng)用程序反饋未處理,聲音控制程序再將解析結(jié)果發(fā)送給優(yōu)先級次之的應(yīng)用程序,依次類推;
[0035]所有應(yīng)用都沒有能夠處理的命令,聲音控制程序給出相應(yīng)的反饋信息;
[0036]以上七個接口既可以將聲音控制程序和應(yīng)用程序的獨立開來,相互開發(fā)互不影響,且業(yè)務(wù)邏輯完全放到了應(yīng)用程序中;
[0037]啟動完成握手協(xié)議,應(yīng)用程序啟動后,需要通知到聲音控制程序,方便其協(xié)調(diào);聲音控制程序向應(yīng)用程序發(fā)送解析結(jié)果指令,讓應(yīng)用程序進行處理;應(yīng)用程序觸發(fā)聲音控制程序進行播報,并給出播報內(nèi)容,這是為了使語音產(chǎn)品的發(fā)聲角色保持統(tǒng)一;聲音控制程序播報結(jié)束給到應(yīng)用程序的通知,讓應(yīng)用程序進行下一步的處理;應(yīng)用程序觸發(fā)聲音控制程序進行錄音,這是核心接口,觸發(fā)自動的人機交互功能;應(yīng)用程序通知聲音控制程序結(jié)束對話,聲音控制程序回到待機狀態(tài);應(yīng)用程序通知聲音控制程序發(fā)過來的某條指令是否被處理:如果被處理,則聲音控制程序不會將其發(fā)送給其他應(yīng)用;如果未被處理,則聲音控制程序需要繼續(xù)發(fā)送給其他應(yīng)用;另外,還有一個輔助賣萌接口 ;聲音控制程序自發(fā)處理,若是不能被識別的指令,則可以給出賣萌或者其他反饋。
[0038]本發(fā)明的優(yōu)點:
[0039]本發(fā)明所述的實現(xiàn)語音識別功能的方法,效率和可擴展性都非常強可以解決開發(fā)效率低,產(chǎn)品單一化同質(zhì)化嚴重的問題;通過語音輸入,聲控程序負責識別和解析,并將指令發(fā)送給應(yīng)用程序,不用關(guān)心具體的處理方式,將聲音控制程序真正作成一個與業(yè)務(wù)無關(guān)的平臺;應(yīng)用程序通過與聲控程序的接口,可以控制導(dǎo)航機播報內(nèi)容及播報時機、錄音開始停止狀態(tài),及交互次數(shù)和發(fā)聲,產(chǎn)品體驗完全依賴于開發(fā)者的想法和設(shè)計,與聲音控制程序沒有任何耦合;除了語音播報,聲控程序能夠顯示和記錄下人機交互的對話過程,方便查看;給開發(fā)者帶來了全新的體驗。語音識別產(chǎn)品勢在必行,目前作為車載導(dǎo)航,一個安全性需要非常高的領(lǐng)域,支持語音識別更是剛需。
【專利附圖】
【附圖說明】
[0040]下面結(jié)合附圖及實施方式對本發(fā)明作進一步詳細的說明:
[0041]圖1為實現(xiàn)語音識別功能的方法框架結(jié)構(gòu)示意圖;
[0042]圖2為終端設(shè)備內(nèi)部的框架原理圖;
[0043]圖3為云端服務(wù)器內(nèi)部的框架原理圖;
[0044]圖4為車聯(lián)網(wǎng)服務(wù)器內(nèi)部的框架原理圖。
【具體實施方式】
[0045]實施例1
[0046]本發(fā)明提供了一種實現(xiàn)語音識別功能的方法,其特征在于:所述的實現(xiàn)語音識別功能的方法,具備以下特征:
[0047]有一個聲音采集模塊,能夠支持聲音錄入功能,將聲音采集為數(shù)字數(shù)據(jù),即配備麥克風或者可以提供相同功能的其他設(shè)備;
[0048]有語音識別模塊將聲音數(shù)據(jù)轉(zhuǎn)化為文本;
[0049]有語義解析模塊將文本理解為指令或者指令集
[0050]有一款聲控程序,負責a)、b)、c)的實現(xiàn),并通過定義通信接口的方式將應(yīng)用程序和語音控制程序本來存在的復(fù)雜度降低而不相互耦合,雙方只是相互約定好原則,就可以按照各自的意愿制定出非常人性化的交互方式和產(chǎn)品體驗;
[0051]有至少一款的應(yīng)用程序,與d)程序進行交互,實現(xiàn)語音識別功能;
[0052]支持至少一種喚醒錄音方式,可以通過喚醒詞喚醒、硬件按鈕喚醒或者軟件按鈕喚醒;
[0053]用戶功能通過語音喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音,錄音狀態(tài)下,用戶可以輸入自己的指令,語音處理模塊將會經(jīng)過聲音采集,聲音識別,語義解析,命令下發(fā),命令執(zhí)行,命令執(zhí)行反饋,反饋意見處理等幾個過程,最終實現(xiàn)真正的語音功能,其中該專利更強調(diào)的是命令執(zhí)行反饋和反饋意見處理的部分。
[0054]所述的實現(xiàn)語音識別功能的方法,通過語音輸入,聲控程序負責識別和解析,并將指令發(fā)送給應(yīng)用程序,不用關(guān)心具體的處理方式,將聲音控制程序真正作成一個與業(yè)務(wù)無關(guān)的平臺;應(yīng)用程序通過與聲控程序的接口,可以控制導(dǎo)航機播報內(nèi)容及播報時機、錄音開始停止狀態(tài),及交互次數(shù)和發(fā)聲,產(chǎn)品體驗完全依賴于開發(fā)者的想法和設(shè)計,與聲音控制程序沒有任何耦合;除了語音播報,聲控程序能夠顯示和記錄下人機交互的對話過程,方便查看。
[0055]所述的實現(xiàn)語音識別功能的方法,實現(xiàn)的硬件整體框架分為三個部分:
[0056]終端設(shè)備:負責聲音采集,音頻數(shù)據(jù)與服務(wù)器的傳輸,解析結(jié)果獲取和處理;云端服務(wù)器:負責語音識別和語義解析,并從網(wǎng)絡(luò)獲取相應(yīng)的信息,為終端設(shè)備提供數(shù)據(jù);車聯(lián)網(wǎng)服務(wù)器:負責整合網(wǎng)絡(luò)資源,為云端服務(wù)器提供信息;
[0057]終端設(shè)備實現(xiàn)原理和流程:
[0058]用戶對著聲音采集設(shè)備說出指令;
[0059]聲控程序通過操作系統(tǒng)API獲取音頻數(shù)據(jù),將音頻數(shù)據(jù)發(fā)送到云端服務(wù)器上,云端服務(wù)器進行識別,解析,最終將解析結(jié)果發(fā)送給聲控程序;
[0060]聲控程序根據(jù)解析結(jié)果,識別是哪一類的指令,并發(fā)送給指定的應(yīng)用程序;
[0061]應(yīng)用程序根據(jù)自己的優(yōu)先級,進行響應(yīng),如果能處理則進行自處理,如果不能處理,則返回給聲控程序不能處理的通知,由聲控程序通知下一個應(yīng)用程序;
[0062]以此類推,直到所有應(yīng)用都經(jīng)過了處理為止;
[0063]云端服務(wù)器實現(xiàn)原理和流程:
[0064]云端服務(wù)器在此方案中處于可選的地位,如果不選,則此邏輯需要在聲控程序里實現(xiàn);
[0065]服務(wù)器主要解決識別和解析的作用,由服務(wù)器選擇使用哪家的識別和解析引擎,并且也可以自身也做解析,實現(xiàn)個性化;
[0066]服務(wù)器需要做好良好的封裝,以便在替換語音識別和解析引擎時,對終端沒有影響;
[0067]如果是問答性的指令,可以從車聯(lián)網(wǎng)服務(wù)器上獲取相關(guān)信息,然后返回給終端設(shè)備;
[0068]車聯(lián)網(wǎng)服務(wù)器:提供網(wǎng)絡(luò)信息資源。
[0069]實現(xiàn)語音識別功能的方法,具體實現(xiàn)的步驟如下:
[0070]系統(tǒng)啟動,默認啟動聲音控制程序,將初始化語音識別和語義解析模塊初始化;
[0071]初始化成功后,用戶可以通過喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音;
[0072]導(dǎo)航儀的聲音控制程序收到語音指令后,進行識別和解析,將解析結(jié)果發(fā)送給優(yōu)先級最聞的應(yīng)用程序;
[0073]應(yīng)用程序接收到解析結(jié)果之后,進行分析和處理,將處理結(jié)果發(fā)送給聲音控制程序;
[0074]如果應(yīng)用程序反饋未處理,聲音控制程序再將解析結(jié)果發(fā)送給優(yōu)先級次之的應(yīng)用程序,依次類推;
[0075]所有應(yīng)用都沒有能夠處理的命令,聲音控制程序給出相應(yīng)的反饋信息;
[0076]以上七個接口既可以將聲音控制程序和應(yīng)用程序的獨立開來,相互開發(fā)互不影響,且業(yè)務(wù)邏輯完全放到了應(yīng)用程序中;
[0077]啟動完成握手協(xié)議,應(yīng)用程序啟動后,需要通知到聲音控制程序,方便其協(xié)調(diào);聲音控制程序向應(yīng)用程序發(fā)送解析結(jié)果指令,讓應(yīng)用程序進行處理;應(yīng)用程序觸發(fā)聲音控制程序進行播報,并給出播報內(nèi)容,這是為了使語音產(chǎn)品的發(fā)聲角色保持統(tǒng)一;聲音控制程序播報結(jié)束給到應(yīng)用程序的通知,讓應(yīng)用程序進行下一步的處理;應(yīng)用程序觸發(fā)聲音控制程序進行錄音,這是核心接口,觸發(fā)自動的人機交互功能;應(yīng)用程序通知聲音控制程序結(jié)束對話,聲音控制程序回到待機狀態(tài);應(yīng)用程序通知聲音控制程序發(fā)過來的某條指令是否被處理:如果被處理,則聲音控制程序不會將其發(fā)送給其他應(yīng)用;如果未被處理,則聲音控制程序需要繼續(xù)發(fā)送給其他應(yīng)用;另外,還有一個輔助賣萌接口 ;聲音控制程序自發(fā)處理,若是不能被識別的指令,則可以給出賣萌或者其他反饋。
【權(quán)利要求】
1.一種實現(xiàn)語音識別功能的方法,其特征在于:所述的實現(xiàn)語音識別功能的方法,具備以下特征: 有一個聲音采集模塊,能夠支持聲音錄入功能,將聲音采集為數(shù)字數(shù)據(jù),即配備麥克風或者可以提供相同功能的其他設(shè)備; 有語音識別模塊將聲音數(shù)據(jù)轉(zhuǎn)化為文本; 有語義解析模塊將文本理解為指令或者指令集 聲控程序,通過定義通信接口的方式將應(yīng)用程序和語音控制程序本來存在的復(fù)雜度降低而不相互耦合,雙方只是相互約定好原則,就可以按照各自的意愿制定出非常人性化的交互方式和產(chǎn)品體驗; 有至少一款的應(yīng)用程序,與聲控程序進行交互,實現(xiàn)語音識別功能; 支持至少一種喚醒錄音方式,可以通過喚醒詞喚醒、硬件按鈕喚醒或者軟件按鈕喚醒; 用戶功能通過語音喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音,錄音狀態(tài)下,用戶可以輸入自己的指令,語音處理模塊將會經(jīng)過聲音采集,聲音識別,語義解析,命令下發(fā),命令執(zhí)行,命令執(zhí)行反饋,反饋意見處理等幾個過程,最終實現(xiàn)真正的語音功能,更強調(diào)的是命令執(zhí)行反饋和反饋意見處理的部分。
2.按照權(quán)利要求1所述的實現(xiàn)語音識別功能的方法,其特征在于:所述的實現(xiàn)語音識別功能的方法,通過語音輸入,聲控程序負責識別和解析,并將指令發(fā)送給應(yīng)用程序,不用關(guān)心具體的處理方式,將聲音控制程序真正作成一個與業(yè)務(wù)無關(guān)的平臺;應(yīng)用程序通過與聲控程序的接口,可以控制導(dǎo)航機播報內(nèi)容及播報時機、錄音開始停止狀態(tài),及交互次數(shù)和發(fā)聲,產(chǎn)品體驗完全依賴于開發(fā)者的想法和設(shè)計,與聲音控制程序沒有任何耦合;除了語音播報,聲控程序能夠顯示和記錄下人機交互的對話過程,方便查看。
3.按照權(quán)利要求1所述的實現(xiàn)語音識別功能的方法,其特征在于:所述的實現(xiàn)語音識別功能的方法,實現(xiàn)的硬件整體框架分為三個部分: 終端設(shè)備:負責聲音采集,音頻數(shù)據(jù)與服務(wù)器的傳輸,解析結(jié)果獲取和處理;云端服務(wù)器:負責語音識別和語義解析,并從網(wǎng)絡(luò)獲取相應(yīng)的信息,為終端設(shè)備提供數(shù)據(jù);車聯(lián)網(wǎng)服務(wù)器:負責整合網(wǎng)絡(luò)資源,為云端服務(wù)器提供信息; 終端設(shè)備實現(xiàn)原理和流程: 用戶對著聲音采集設(shè)備說出指令; 聲控程序通過操作系統(tǒng)API獲取音頻數(shù)據(jù),將音頻數(shù)據(jù)發(fā)送到云端服務(wù)器上,云端服務(wù)器進行識別,解析,最終將解析結(jié)果發(fā)送給聲控程序; 聲控程序根據(jù)解析結(jié)果,識別是哪一類的指令,并發(fā)送給指定的應(yīng)用程序; 應(yīng)用程序根據(jù)自己的優(yōu)先級,進行響應(yīng),如果能處理則進行自處理,如果不能處理,則返回給聲控程序不能處理的通知,由聲控程序通知下一個應(yīng)用程序; 以此類推,直到所有應(yīng)用都經(jīng)過了處理為止; 云端服務(wù)器實現(xiàn)原理和流程: 云端服務(wù)器在此方案中處于可選的地位,如果不選,則此邏輯需要在聲控程序里實現(xiàn); 服務(wù)器主要解決識別和解析的作用,由服務(wù)器選擇使用哪家的識別和解析引擎,并且也可以自身也做解析,實現(xiàn)個性化; 服務(wù)器需要做好良好的封裝,以便在替換語音識別和解析引擎時,對終端沒有影響; 如果是問答性的指令,可以從車聯(lián)網(wǎng)服務(wù)器上獲取相關(guān)信息,然后返回給終端設(shè)備; 車聯(lián)網(wǎng)服務(wù)器:提供網(wǎng)絡(luò)信息資源。
4.按照權(quán)利要求1所述的實現(xiàn)語音識別功能的方法,其特征在于: 實現(xiàn)語音識別功能的方法,具體實現(xiàn)的步驟如下: 系統(tǒng)啟動,默認啟動聲音控制程序,將初始化語音識別和語義解析模塊初始化; 初始化成功后,用戶可以通過喚醒詞喚醒或者硬件/軟件按鈕觸發(fā)開始錄音; 導(dǎo)航儀的聲音控制程序收到語音指令后,進行識別和解析,將解析結(jié)果發(fā)送給優(yōu)先級最聞的應(yīng)用程序; 應(yīng)用程序接收到解析結(jié)果之后,進行分析和處理,將處理結(jié)果發(fā)送給聲音控制程序;如果應(yīng)用程序反饋未處理,聲音控制程序再將解析結(jié)果發(fā)送給優(yōu)先級次之的應(yīng)用程序,依次類推; 所有應(yīng)用都沒有能夠處理的命令,聲音控制程序給出相應(yīng)的反饋信息; 以上七個點既可以將聲音控制程序和應(yīng)用程序的獨立開來,相互開發(fā)互不影響,且業(yè)務(wù)邏輯完全放到了應(yīng)用程序中; 啟動完成握手協(xié)議,應(yīng)用程序啟動后,需要通知到聲音控制程序,方便其協(xié)調(diào);聲音控制程序向應(yīng)用程序發(fā)送解析結(jié)果指令,讓應(yīng)用程序進行處理;應(yīng)用程序觸發(fā)聲音控制程序進行播報,并給出播報內(nèi)容,這是為了使語音產(chǎn)品的發(fā)聲角色保持統(tǒng)一;聲音控制程序播報結(jié)束給到應(yīng)用程序的通知,讓應(yīng)用程序進行下一步的處理;應(yīng)用程序觸發(fā)聲音控制程序進行錄音,這是核心接口,觸發(fā)自動的人機交互功能;應(yīng)用程序通知聲音控制程序結(jié)束對話,聲音控制程序回到待機狀態(tài);應(yīng)用程序通知聲音控制程序發(fā)過來的某條指令是否被處理:如果被處理,則聲音控制程序不會將其發(fā)送給其他應(yīng)用;如果未被處理,則聲音控制程序需要繼續(xù)發(fā)送給其他應(yīng)用;另外,還有一個輔助賣萌接口 ;聲音控制程序自發(fā)處理,若是不能被識別的指令,則可以給出賣萌或者其他反饋。
【文檔編號】H04L29/08GK104318924SQ201410636777
【公開日】2015年1月28日 申請日期:2014年11月12日 優(yōu)先權(quán)日:2014年11月12日
【發(fā)明者】韓慶愷, 解威, 趙銀祥, 戰(zhàn)楊 申請人:沈陽美行科技有限公司