語音控制方法以及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及家電技術(shù)領(lǐng)域,具體地,涉及一種語音控制方法以及一種語音控制系統(tǒng)。
【背景技術(shù)】
[0002]傳統(tǒng)的家用設(shè)備(例如家用電器)通過遙控器和/或控制面板的按鍵進行人機交互。隨著科技的發(fā)展,語音識別技術(shù)越來越多的應(yīng)用于家用設(shè)備的控制,成為一種新的人機交互方式。
[0003]但是,目前語音控制技術(shù)只針對特定語種(例如標(biāo)準(zhǔn)普通話)進行識別,無法實現(xiàn)多語言種類(例如中國各地方言等)自動識別。現(xiàn)有的解決方案是需要用戶手工選擇所要識別的方言,例如一款在手機上運行的語音助手應(yīng)用程序(APP),可支持標(biāo)準(zhǔn)普通話、四川話、河南話、廣東話等方言識別,但需要用戶在設(shè)置菜單中選擇所要識別的方言,不夠智能、用戶體驗較差。即現(xiàn)有技術(shù)中缺少一種更智能、更全面、用戶體驗更佳的多語言種類自動識別的語音控制方法和/或系統(tǒng)。
【發(fā)明內(nèi)容】
[0004]針對現(xiàn)有技術(shù)中存在的語音控制不能支持多語種自動識別的技術(shù)問題,本發(fā)明提供了一種語音控制方法,該方法包括:接收第一語音信號,其中所述第一語音信號包括用于標(biāo)識所述第一語音信號的語言種類的標(biāo)識詞;根據(jù)所述標(biāo)識詞以及特征數(shù)據(jù)庫中的語言種類集合確定接收到的第一語音信號的語言種類;根據(jù)所確定的所述第一語音信號的語言種類在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合;接收第二語音信號,其中所述第二語音信號包括控制設(shè)備執(zhí)行操作的指令,以及所述第一語音信號的語言種類與所述第二語音信號的語言種類相同;以及根據(jù)所述第二語音信號和所提取的命令詞集合控制設(shè)備執(zhí)行操作。
[0005]相應(yīng)地,本發(fā)明還提供了一種語音控制系統(tǒng),該系統(tǒng)包括:語音接收單元,用于接收第一語音信號和第二語音信號,其中所述第一語音信號包括用于標(biāo)識所述第一語音信號的語言種類的標(biāo)識詞,所述第二語音信號包括控制設(shè)備執(zhí)行操作的指令,以及所述第一語音信號的語言種類與所述第二語音信號的語言種類相同;語言種類識別單元,用于根據(jù)所述標(biāo)識詞以及特征數(shù)據(jù)庫中的語言種類集合確定接收到的第一語音信號的語言種類;語言種類提取單元,用于根據(jù)所確定的所述第一語音信號的語言種類在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合;控制單元,用于根據(jù)所述第二語音信號和所提取的命令詞集合控制設(shè)備執(zhí)行操作。
[0006]采用本發(fā)明提供的語音控制方法以及系統(tǒng),通過接收包括用于標(biāo)識所述第一語音信號的語言種類的標(biāo)識詞的第一語音信號,根據(jù)所述標(biāo)識詞以及特征數(shù)據(jù)庫中的語言種類集合確定接收到的第一語音信號的語言種類,之后根據(jù)所確定的所述第一語音信號的語言種類在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合,然后接收包括控制設(shè)備執(zhí)行操作的指令的第二語音信號(所述第一語音信號的語言種類與所述第二語音信號的語言種類相同),以及最后根據(jù)所述第二語音信號和所提取的命令詞集合控制設(shè)備執(zhí)行操作,能夠?qū)崿F(xiàn)自動識別來自用戶的多語言種類的語音控制命令,提高了語音控制的智能化、全面化、自動化水平,用戶體驗更佳。
[0007]本發(fā)明的其它特征和優(yōu)點將在隨后的【具體實施方式】部分予以詳細(xì)說明。
【附圖說明】
[0008]附圖是用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與下面的【具體實施方式】一起用于解釋本發(fā)明,但并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0009]圖1是根據(jù)本發(fā)明的一種實施方式的示例語音控制系統(tǒng)的結(jié)構(gòu)示意圖;
[0010]圖2是根據(jù)本發(fā)明的一種實施方式的示例特征數(shù)據(jù)庫的結(jié)構(gòu)示意圖;
[0011 ]圖3是根據(jù)本發(fā)明的一種實施方式的示例語音控制系統(tǒng)執(zhí)行的流程圖;以及
[0012]圖4是根據(jù)本發(fā)明的一種實施方式的示例語音控制方法的流程圖。
[0013]附圖標(biāo)記說明
[0014]10語音接收單元20語言種類識別單元
[0015]30語言種類提取單元40控制單元
[0016]100語音控制系統(tǒng)
【具體實施方式】
[0017]以下結(jié)合附圖對本發(fā)明的【具體實施方式】進行詳細(xì)說明。應(yīng)當(dāng)理解的是,此處所描述的【具體實施方式】僅用于說明和解釋本發(fā)明,并不用于限制本發(fā)明。
[0018]下面將舉例說明本發(fā)明的思想,但應(yīng)當(dāng)理解的這些示例為非局限性示例,本發(fā)明的保護范圍不限于此:
[0019]為了更加清楚地說明本發(fā)明的思想,以語音控制系統(tǒng)100為例進行詳細(xì)地說明。圖1是根據(jù)本發(fā)明的一種實施方式的示例語音控制系統(tǒng)的結(jié)構(gòu)示意圖,如圖1所示,該系統(tǒng)可以包括:語音接收單元10,用于接收第一語音信號和第二語音信號,其中所述第一語音信號包括用于標(biāo)識所述第一語音信號的語言種類的標(biāo)識詞,所述第二語音信號包括控制設(shè)備執(zhí)行操作的指令,以及所述第一語音信號的語言種類與所述第二語音信號的語言種類相同;語言種類識別單元20,用于根據(jù)所述標(biāo)識詞以及特征數(shù)據(jù)庫中的語言種類集合確定接收到的第一語音信號的語言種類;語言種類提取單元30,用于根據(jù)所確定的所述第一語音信號的語言種類在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合;控制單元40,用于根據(jù)所述第二語音信號和所提取的命令詞集合控制設(shè)備執(zhí)行操作。
[0020]采用這樣的實施方式,可以自動識別用戶的命令的語言種類并執(zhí)行該命令的對應(yīng)操作,實現(xiàn)更加智能地、自動地、全面地人機交互,獲得良好的用戶體驗。
[0021]具體來說,為了實現(xiàn)自動識別語言重種類,該系統(tǒng)100還可以包括特征數(shù)據(jù)庫,圖2是根據(jù)本發(fā)明的一種實施方式的示例特征數(shù)據(jù)庫的結(jié)構(gòu)示意圖,如圖2所示,該特征數(shù)據(jù)庫可以包括語言種類集合A和多個命令詞集合,所述語言種類集合A包括關(guān)于標(biāo)識語音信號的語言種類的標(biāo)識詞的多個語言種類的特征數(shù)據(jù),所述語言種類包括標(biāo)準(zhǔn)普通話以及中國各地方言(例如粵語、四川話、河南話、天津話、東北話等等)。例如,語言種類集合A可以包括al、a2、a3-_anr-an,假設(shè)使用“美的空調(diào)”作為A集合中的標(biāo)識詞,則al可以對應(yīng)粵語發(fā)音“美的空調(diào)”的特征數(shù)據(jù),a2可以對應(yīng)標(biāo)準(zhǔn)普通話發(fā)音“美的空調(diào)”的特征數(shù)據(jù),a3可以對應(yīng)四川話發(fā)音“美的空調(diào)”的特征數(shù)據(jù),a4可以對應(yīng)河南話發(fā)音“美的空調(diào)”的特征數(shù)據(jù)等等。
[0022]多個命令詞集合可以為命令詞集合bl、b2、b3…bm.._bn,其中的每一個命令詞集合與A集合中的每一語言種類對應(yīng)(如圖2中箭頭所示),即每一個命令詞集合包括控制設(shè)備執(zhí)行操作的該語言種類的多個命令詞的特征數(shù)據(jù)。例如,命令詞集合bl可以是粵語發(fā)音“開機”、“關(guān)機”、“調(diào)高一度”、“調(diào)低一度”……等命令詞的特征數(shù)據(jù),命令詞集合b2可以是標(biāo)準(zhǔn)普通話發(fā)音“開機”、“關(guān)機”、“調(diào)高一度”、“調(diào)低一度”……等命令詞的特征數(shù)據(jù),命令詞集合b3可以是四川話發(fā)音“開機”、“關(guān)機”、“調(diào)高一度”、“調(diào)低一度”……等命令詞的特征數(shù)據(jù),命令詞集合b4可以是河南話發(fā)音“開機”、“關(guān)機”、“調(diào)高一度”、“調(diào)低一度”……等命令詞的特征數(shù)據(jù)。
[0023]配置好特征數(shù)據(jù)庫后,系統(tǒng)即可以開始工作,以家用設(shè)備為例(例如空調(diào))來描述詳細(xì)人機交互過程,圖3是根據(jù)本發(fā)明的一種實施方式的示例語音控制系統(tǒng)執(zhí)行的流程圖,如圖3所示:
[0024]語音接收單元10首先可以接收第一語音信號,其中所述第一語音信號包括用于標(biāo)識所述第一語音信號的語言種類的標(biāo)識詞。例如,第一語音信號可以是用戶以粵語說出“美的空調(diào)”。其中所述語音接收單元10可以是任何適當(dāng)?shù)卣Z音接收元件或設(shè)備,例如其可以是麥克風(fēng)或者麥克風(fēng)、放大器等的組合。
[0025]接著,語言種類識別單元20可以根據(jù)所述標(biāo)識詞以及特征數(shù)據(jù)庫中的語言種類集合確定接收到的第一語音信號的語言種類。根據(jù)本發(fā)明的一種實施方式,語言種類識別單元20可以在所述標(biāo)識詞與所述語言種類集合中的一種語言種類的特征數(shù)據(jù)匹配的情況下,將所述特征數(shù)據(jù)庫中該語言種類確定為所述第一語音信號的語言種類。例如,語言種類識別單元20可以確定用戶所說的語言種類為粵語,即對應(yīng)于特征數(shù)據(jù)庫A集合中的al,從而系統(tǒng)匹配到用戶正在使用al語言種類與空調(diào)進行語音交互。反之,如果匹配失敗,則返回到標(biāo)識詞監(jiān)聽,重新確定語言種類。這里的具體語音識別過程與現(xiàn)有技術(shù)相似,為了不混淆本發(fā)明的保護范圍,在此不再贅述。
[0026]在確定了用戶的語言種類后,語言種類提取單元30可以根據(jù)所確定的所述第一語音信號的語言種類在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合。例如,如圖2所示,根據(jù)特征數(shù)據(jù)庫A集合中的al,在特征數(shù)據(jù)庫中提取該語言種類對應(yīng)的命令詞集合bl。
[0027]接著,用戶繼續(xù)與空調(diào)進行交互,說出已經(jīng)識別出的語言種類的命令詞,即第二語音信號(所述第