一種語音定時操作方法、裝置及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種語音定時操作方法、裝置及系統(tǒng),該方法包括:獲取用戶輸入的語音命令信息;將所述語音命令信息轉(zhuǎn)化為文字命令信息;識別所述文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,根據(jù)所述文字命令信息生成操作命令和計時命令;根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。通過語音實現(xiàn)定時操作,無需按鍵輸入,減少了操作的復(fù)雜程度,使用戶能夠更簡單、方便、快捷的實現(xiàn)對各種設(shè)備的定時操作。
【專利說明】
一種語音定時操作方法、裝置及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及語音操作技術(shù)領(lǐng)域,特別涉及一種語音定時操作方法、裝置及系統(tǒng)。
【背景技術(shù)】
[0002]隨著科學(xué)技術(shù)的發(fā)展,越來越多的智能設(shè)備在日程生活中得到廣泛應(yīng)用,這些智能家用設(shè)備從最初的機械操作控制發(fā)展到現(xiàn)在的電子操作控制,實現(xiàn)越來越智能化的操作控制。
[0003]但不論是最初的機械操作控制還是后來的電子操作控制,都需要用戶操作按鈕或按鍵來實現(xiàn)對設(shè)備的操作控制,而隨著設(shè)備功能的越來越強大,需要操作的功能也越來越多,比如我們常用的微波爐、烤箱、熱水器等家用設(shè)備上邊的操作按鈕越來越多越來越復(fù)雜,這無形中增加了用戶操作的難度,不便于用戶的操作,比如我們想要對設(shè)備做一個定時操作,可能需要多次操作按鈕,實現(xiàn)所要定時的時間和功能。此外,比較多的功能通過較少的按鈕實現(xiàn),對于操作技能比較低的用戶而言,比如老人,其學(xué)會操作比較費力。
[0004]因此現(xiàn)有的設(shè)備定時操作具有便利差、操作復(fù)雜,對用戶操作技能要求高等不足之處。
【發(fā)明內(nèi)容】
[0005]本發(fā)明提供一種語音定時操作方法、裝置及系統(tǒng),用以解決現(xiàn)有技術(shù)中存在定時操作便利性差,操作復(fù)雜的問題,實現(xiàn)更方便、快捷、便于操作的定時操作。
[0006]本發(fā)明提供一種語音定時操作方法,包括:
[0007]獲取用戶輸入的語音命令信息;
[0008]將所述語音命令信息轉(zhuǎn)化為文字命令信息;
[0009]識別所述文字命令信息中是否有數(shù)字;
[0010]當(dāng)有數(shù)字時,根據(jù)所述文字命令信息生成操作命令和計時命令;
[0011 ]根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。
[0012]在一些可選的實施例中,根據(jù)所述文字命令信息生成操作命令和計時命令,具體包括:
[0013]將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0014]在一些可選的實施例中,所述操作命令中包括當(dāng)前命令和滯后命令;所述計時命令中包括滯后命令的滯后時長信息。
[0015]在一些可選的實施例中,所述生成操作命令和計時命令,具體包括:
[0016]提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞;
[0017]判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞;
[0018]當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。
[0019]在一些可選的實施例中,所述將所述語音命令信息轉(zhuǎn)化為文字命令信息,具體包括:
[0020]采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。
[0021]在一些可選的實施例中,采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,具體包括:
[0022]采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;
[0023]采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;
[0024]確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0025]在一些可選的實施例中,所述獲取用戶輸入的語音命令信息,具體包括:
[0026]獲取用戶通過本地輸入接口輸入的語音命令信息;或
[0027]獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。
[0028]本發(fā)明實施例還提供一種語音定時操作裝置,包括:
[0029]語音獲取模塊,用于獲取用戶輸入的語音命令信息;
[0030]語音轉(zhuǎn)換模塊,用于將所述語音命令信息轉(zhuǎn)化為文字命令信息;
[0031]內(nèi)容識別模塊,用于識別所述文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,通知命令生成模塊;
[0032]命令生成模塊,用于根據(jù)所述文字命令信息生成操作命令和計時命令;
[0033]操作執(zhí)行模塊,用于根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。
[0034]在一些可選的實施例中,所述命令生成模塊,具體用于:
[0035]將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0036]在一些可選的實施例中,所述命令生成模塊,具體用于:
[0037]提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞;
[0038]判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞;
[0039]當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。
[0040]在一些可選的實施例中,所述語音轉(zhuǎn)換模塊,具體用于:
[0041]采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。
[0042]在一些可選的實施例中,所述語音轉(zhuǎn)換模塊,具體用于:
[0043]采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;
[0044]采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;
[0045]確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0046]在一些可選的實施例中,所述語音獲取模塊,具體用于:
[0047]獲取用戶通過本地輸入接口輸入的語音命令信息;或
[0048]獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。
[0049]本發(fā)明實施例還提供一種語音定時操作系統(tǒng),包括:遠程客戶端和定時操作設(shè)備;
[0050]所述遠程客戶端,用于接收用戶輸入的語音命令信息,通過無線通信網(wǎng)絡(luò)發(fā)送給所述定時操作設(shè)備;
[0051 ]所述定時操作設(shè)備,用于獲取所述遠程客戶端發(fā)送的所述語音命令信息;將所述語音命令信息轉(zhuǎn)化為文字命令信息;識別所述文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,根據(jù)所述文字命令信息生成操作命令和計時命令;根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。
[0052]在一些可選的實施例中,所述定時操作設(shè)備,具體用于:
[0053]將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0054]在一些可選的實施例中,所述定時操作設(shè)備,具體用于:
[0055]提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞;
[0056]判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞;
[0057]當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。
[0058]在一些可選的實施例中,所述定時操作設(shè)備,具體用于:
[0059]采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。
[0060]在一些可選的實施例中,所述定時操作設(shè)備,具體用于:
[0061]采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;
[0062]采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;
[0063]確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0064]本發(fā)明實施例提供的語音定時操作方法、裝置及系統(tǒng),能夠通過語音實現(xiàn)操作定時,無需操作按鍵即可實現(xiàn)操作,便利了用戶操作,降低了定時操作的復(fù)雜程度,其實現(xiàn)更方便、快捷,降低了對用戶操作技能的要求。
[0065]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0066]下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。
【附圖說明】
[0067]附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0068]圖1為本發(fā)明實施例中語音定時操作方法的流程圖;
[0069]圖2為本發(fā)明實施例一中語音定時操作方法的流程圖;
[0070]圖3為本發(fā)明實施例二中語音定時操作方法的流程圖;
[0071 ]圖4為本發(fā)明實施例中語音定時操作裝置的結(jié)構(gòu)示意圖;
[0072]圖5為本發(fā)明實施例中語音定時操作系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0073]以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0074]為了解決現(xiàn)有技術(shù)中的問題,本發(fā)明實施例提供一種語音定時操作方法,該方法能夠允許設(shè)備通過本地輸入和遠程輸入語音操作命令,實現(xiàn)對設(shè)備的語音控制。
[0075]本發(fā)明實施例提供的語音定時操作方法,其流程如圖1所示,包括如下步驟:
[0076]步驟SlOl:獲取用戶輸入的語音命令信息。
[0077]用戶可以通過定時操作設(shè)備上設(shè)置的語音輸入功能模塊,輸入語音命令信息。例如:定時操作設(shè)備為能夠?qū)崿F(xiàn)定時操作的燃氣灶或電飯煲,用戶想要實現(xiàn)煮半小時后自動停止,則用戶可以輸入語音命令信息“煮半小時后關(guān)火”。
[0078]步驟S102:將獲取的語音命令信息轉(zhuǎn)化為文字命令信息。
[0079]定時操作設(shè)備實現(xiàn)語音到文字的轉(zhuǎn)換,以便識別用戶輸入的操作命令。沿用上邊的例子,定時操作設(shè)備將用戶輸入的語音命令信息轉(zhuǎn)化為文字命令信息“煮半小時后關(guān)火”。
[0080]針對輸入的語音命令信息,找到一個與之匹配度最高的文字序列,實現(xiàn)語音到文字的轉(zhuǎn)化,得到文字命令信息,其中匹配度可以用概率表示。例如用Y表示語音命令信息,W表示文字命令信息,則是要找到與Y匹配度最高的W??梢圆捎眠x定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。
[0081]步驟S13:識別轉(zhuǎn)化出的文字命令信息中是否有數(shù)字。當(dāng)有數(shù)字時,執(zhí)行步驟S104;當(dāng)沒有數(shù)字時,執(zhí)行步驟S106。
[0082]定時操作設(shè)備識別文字命令信息中是否有數(shù)字,尤其是時間數(shù)字。沿用上邊的例子,文字命令信息中包括的數(shù)字為“半小時”。
[0083]步驟S104:根據(jù)轉(zhuǎn)化出的文字命令信息生成操作命令和計時命令。
[0084]當(dāng)有數(shù)字時,說明需要定時操作,則將文字信息轉(zhuǎn)化為操作命令和即時命令,此時可以對文字命令信息進行分詞處理,從分詞后得到的詞語中找出操作命令詞、計時命令詞,根據(jù)分詞后得到的操作命令詞和計時命令詞生成操作命令和計時命令。
[0085]其中,操作命令中包括當(dāng)前命令和滯后命令,當(dāng)前命令是當(dāng)前執(zhí)行的命令,滯后命令是計時后執(zhí)行的命令;計時命令中包括滯后命令的滯后時長信息,也可以包括當(dāng)前命令的持續(xù)時長信息。通常是文字命令信息中識別出的數(shù)字。
[0086]沿用上邊的例子,文字命令信息進行分詞后,能夠找出的操作命令詞有“煮”和“關(guān)火”,計時命令詞有“半小時”,還有表征滯后操作的滯后操作指示詞“后”,根據(jù)分離出的這些分詞之間的關(guān)聯(lián)關(guān)系,比如邏輯關(guān)系,時間先后關(guān)系等,可以知道“半小時”這個計時命令詞是操作命令詞“關(guān)火”的滯后時長信息,也可以說是操作命令詞“煮”的持續(xù)時長信息,通過“后”這樣的時序詞區(qū)分當(dāng)前命令和滯后命令。因此,可以得到當(dāng)前命令“煮”,滯后命令“關(guān)火”,表示滯后命令滯后時長信息或當(dāng)前命令持續(xù)時長信息的計時命令“半小時”。
[0087]步驟S105:根據(jù)生成的操作命令和計時命令執(zhí)行相關(guān)操作。
[0088]生成操作命令和計時命令后,定時操作設(shè)備可以執(zhí)行生成的操作命令和計時命令,沿用上邊的例子,執(zhí)行當(dāng)前命令“煮”和計時命令“半小時”,調(diào)節(jié)火的大小或加熱溫度,以滿足煮的條件,持續(xù)時長為半小時;執(zhí)行滯后命令“關(guān)火”和計時命令“半小時”,執(zhí)行的滯后時長為半小時,從煮的處理開始計時,半小時后自動關(guān)火。
[0089]步驟S106:結(jié)束本次定時操作流程。
[0090]可選的,提示用戶本次定時操作失敗,請重新輸入操作命令。
[0091]本發(fā)明實施例提供的技術(shù)方案,即使用戶不熟悉設(shè)備的按鈕或按鍵操作,也能方便的通過簡單的語音輸入實現(xiàn)定時操作,方便、快捷,可操作性強,操作便利。
[0092]實施例一
[0093]本發(fā)明實施例一提供一種語音定時操作的具體實現(xiàn)方法,其流程如圖2所示,包括如下步驟:
[0094]步驟S201:獲取用戶通過本地輸入接口輸入的語音命令信息。
[0095]定時操作設(shè)備本地設(shè)置有具有語音輸入功能的模塊,用戶可以通過本地輸入接口,直接對著定時操作設(shè)備錄入語音。
[0096]步驟S202:將獲取的語音命令信息轉(zhuǎn)化為文字命令信息。
[0097]采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,具體可以包括:
[0098]采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;
[0099]采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;
[0100]確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0101]然后可以得到語音命令信息對應(yīng)的為文字命令信息。
[0102]步驟S203:識別轉(zhuǎn)化出的文字命令信息中是否有數(shù)字。
[0103]當(dāng)有數(shù)字時,執(zhí)行步驟S204;當(dāng)沒有數(shù)字時,執(zhí)行步驟S207。
[0104]步驟S204:將轉(zhuǎn)化出的文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配。
[0105]可以預(yù)先在本地設(shè)置操作命令詞和計時命令詞詞庫,將語音命令信息轉(zhuǎn)化為文字命令信息之后,可以將分詞后得到的其中的非數(shù)字部分與存儲的操作命令詞和計時命令詞進行匹配,以便確認文字命令信息中是否包括操作命令詞和計時命令詞。
[0106]當(dāng)匹配成功時,執(zhí)行步驟S205;未匹配成功時,執(zhí)行步驟S207。
[0107]步驟S205:根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0108]當(dāng)匹配成功時,可以生成相應(yīng)的操作命令和計時命令。
[0109]步驟S206:根據(jù)生成的操作命令和計時命令執(zhí)行相關(guān)操作。
[0110]步驟S207:結(jié)束本次定時操作流程。
[0111]可選的,提示用戶本次定時操作失敗,請重新輸入操作命令。
[0112]實施例二
[0113]本發(fā)明實施例二提供一種語音定時操作的具體實現(xiàn)方法,其流程如圖3所示,包括如下步驟:
[0114]步驟S301:用戶通過遠程客戶端輸入語音命令信息。
[0115]這種情況適用于用戶的遠程操作,例如用戶不在家或不再定時操作設(shè)備跟前時,也能方便的進行定時操作,通過遠程客戶端,例如移動終端等設(shè)備實現(xiàn)語音命令信息的輸入。
[0116]步驟S302:遠程客戶端將輸入的語音命令信息發(fā)送給定時操作設(shè)備。
[0117]遠程客戶端,例如移動終端可以通過無線通信網(wǎng)絡(luò)與定時設(shè)備建立通信連接,將用戶輸入的語音命令信息發(fā)送給定時操作設(shè)備。
[0118]步驟S303:定時操作設(shè)備獲取遠程客戶端發(fā)送過來的語音命令信息。
[0119]定時操作設(shè)備獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息,實現(xiàn)遠程定時操作的命令的獲取。
[0120]步驟S304:將獲取的語音命令信息轉(zhuǎn)化為文字命令信息。
[0121 ]步驟S305:識別轉(zhuǎn)化出的文字命令信息中是否有數(shù)字。
[0122]當(dāng)有數(shù)字時,執(zhí)行步驟S306;當(dāng)沒有數(shù)字時,執(zhí)行步驟S312。
[0123]步驟S306:將轉(zhuǎn)化出的文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞相匹配。
[0124]當(dāng)匹配成功時,執(zhí)行步驟S307;當(dāng)沒有匹配成功時,執(zhí)行步驟S312。
[0125]步驟S307:提取文字命令信息中匹配成功的操作命令詞和計時命令詞。
[0126]將文字命令信息中匹配成功的操作命令詞和計時命令詞作為省城操作命令和即時命令的關(guān)鍵詞,以便生成對應(yīng)的操作命令和計時命令。
[0127]步驟S308:判斷操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞。若是,執(zhí)行步驟S309;若否,執(zhí)行步驟S310。
[0128]根據(jù)操作命令是否有對應(yīng)的滯后操作標(biāo)識詞,來確定生成當(dāng)前命令還是滯后命令。此處通過判斷操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞,是否需要生成滯后命令,對于有相關(guān)聯(lián)的預(yù)先存儲的滯后操作指示詞和/或計時命令詞的操作命令詞,可以生成滯后命令,否則生成當(dāng)前命令。
[0129]步驟S309:生成滯后命令和對應(yīng)的計時命令。
[0130]例如,沿用上邊的例子,對于有關(guān)聯(lián)的滯后操作指示詞“后”才執(zhí)行的操作命令“關(guān)火”,生成滯后命令和對應(yīng)的計時命令。
[0131]步驟S310:生成當(dāng)前命令。
[0132]上述步驟306-步驟S310實現(xiàn)了根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0133]步驟S311:根據(jù)生成的操作命令和計時命令執(zhí)行相關(guān)操作。
[0134]步驟S312:結(jié)束本次定時操作流程。
[0135]本發(fā)明實施例提供的技術(shù)方案,可以實現(xiàn)遠程的定時操作,更方便了用戶實現(xiàn)對定時操作設(shè)備的定時操作。
[0136]基于同一發(fā)明構(gòu)思,本發(fā)明實施例還提供一種語音定時操作裝置,其結(jié)構(gòu)如圖4所示,包括:語音獲取模塊401、語音轉(zhuǎn)換模塊402、內(nèi)容識別模塊403、命令生成模塊404和操作執(zhí)行模塊405。
[0137]語音獲取模塊401,用于獲取用戶輸入的語音命令信息。
[0138]語音轉(zhuǎn)換模塊402,用于將輸入的語音命令信息轉(zhuǎn)化為文字命令信息。
[0139]內(nèi)容識別模塊403,用于識別轉(zhuǎn)化出的文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,通知命令生成模塊404。
[OMO]命令生成模塊404,用于根據(jù)轉(zhuǎn)化出的文字命令信息生成操作命令和計時命令。
[0141]操作執(zhí)行模塊405,用于根據(jù)生成的操作命令和計時命令執(zhí)行相關(guān)操作。
[0142]優(yōu)選的,上述命令生成模塊404,具體用于將文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0143]優(yōu)選的,上述命令生成模塊404,具體用于提取文字命令信息中匹配成功的操作命令詞和計時命令詞;判斷提取的操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞;當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。
[0144]優(yōu)選的,上述語音轉(zhuǎn)換模塊402,具體用于采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令?目息O
[0145]優(yōu)選的,上述語音轉(zhuǎn)換模塊402,具體用于采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0146]優(yōu)選的,上述語音獲取模塊401,具體用于獲取用戶通過本地輸入接口輸入的語音命令信息;或獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。
[0147]基于同一發(fā)明構(gòu)思,針對遠程輸入語音操作命令的情況,本發(fā)明實施例還提供一種語音定時操作系統(tǒng),該系統(tǒng)結(jié)構(gòu)如圖5所示,包括:遠程客戶端501和定時操作設(shè)備502。
[0148]遠程客戶端501,用于接收用戶輸入的語音命令信息,通過無線通信網(wǎng)絡(luò)發(fā)送給定時操作設(shè)備502。
[0149]定時操作設(shè)備502,包括如圖4所示的語音定時操作裝置,可以獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。定時操作設(shè)備502,用于獲取遠程客戶端發(fā)送的用戶輸入的語音命令信息;將輸入的語音命令信息轉(zhuǎn)化為文字命令信息;識別轉(zhuǎn)化出的文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時;根據(jù)轉(zhuǎn)化出的文字命令信息生成操作命令和計時命令;根據(jù)生成的操作命令和計時命令執(zhí)行相關(guān)操作。
[0150]優(yōu)選的,上述定時操作設(shè)備502,具體用于將文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞相匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。
[0151]優(yōu)選的,上述定時操作設(shè)備502,具體用于提取文字命令信息中匹配成功的操作命令詞和計時命令詞;判斷操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞;當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。
[0152]優(yōu)選的,上述定時操作設(shè)備502,具體用于采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令?目息O
[0153]優(yōu)選的,上述定時操作設(shè)備502,具體用于采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率;采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率;確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
[0154]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器和光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。
[0155]本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0156]這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0157]這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0158]顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
【主權(quán)項】
1.一種語音定時操作方法,其特征在于,包括: 獲取用戶輸入的語音命令信息; 將所述語音命令信息轉(zhuǎn)化為文字命令信息; 識別所述文字命令信息中是否有數(shù)字; 當(dāng)有數(shù)字時,根據(jù)所述文字命令信息生成操作命令和計時命令; 根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述文字命令信息生成操作命令和計時命令,具體包括: 將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。3.如權(quán)利要求1所述的方法,其特征在于,所述操作命令中包括當(dāng)前命令和滯后命令;所述計時命令中包括滯后命令的滯后時長信息。4.如權(quán)利要求1所述的方法,其特征在于,所述生成操作命令和計時命令,具體包括: 提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞; 判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞; 當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。5.如權(quán)利要求1所述的方法,其特征在于,所述將所述語音命令信息轉(zhuǎn)化為文字命令信息,具體包括: 采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。6.如權(quán)利要求5所述的方法,其特征在于,采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,具體包括: 采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率; 采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率; 確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。7.如權(quán)利要求1-6任一所述的方法,其特征在于,所述獲取用戶輸入的語音命令信息,具體包括: 獲取用戶通過本地輸入接口輸入的語音命令信息;或 獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。8.一種語音定時操作裝置,其特征在于,包括: 語音獲取模塊,用于獲取用戶輸入的語音命令信息; 語音轉(zhuǎn)換模塊,用于將所述語音命令信息轉(zhuǎn)化為文字命令信息; 內(nèi)容識別模塊,用于識別所述文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,通知命令生成豐旲塊; 命令生成模塊,用于根據(jù)所述文字命令信息生成操作命令和計時命令; 操作執(zhí)行模塊,用于根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。9.如權(quán)利要求8所述的裝置,其特征在于,所述命令生成模塊,具體用于: 將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。10.如權(quán)利要求8所述的裝置,其特征在于,所述命令生成模塊,具體用于: 提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞; 判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞; 當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。11.如權(quán)利要求1所述的裝置,其特征在于,所述語音轉(zhuǎn)換模塊,具體用于: 采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。12.如權(quán)利要求11所述的裝置,其特征在于,所述語音轉(zhuǎn)換模塊,具體用于: 采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率; 采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率; 確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。13.如權(quán)利要求8-12任一所述的裝置,其特征在于,所述語音獲取模塊,具體用于: 獲取用戶通過本地輸入接口輸入的語音命令信息;或 獲取用戶通過遠程客戶端輸入并通過無線通信網(wǎng)絡(luò)發(fā)送過來的語音命令信息。14.一種語音定時操作系統(tǒng),其特征在于,包括:遠程客戶端和定時操作設(shè)備; 所述遠程客戶端,用于接收用戶輸入的語音命令信息,通過無線通信網(wǎng)絡(luò)發(fā)送給所述定時操作設(shè)備; 所述定時操作設(shè)備,用于獲取所述遠程客戶端發(fā)送的所述語音命令信息;將所述語音命令信息轉(zhuǎn)化為文字命令信息;識別所述文字命令信息中是否有數(shù)字;當(dāng)有數(shù)字時,根據(jù)所述文字命令信息生成操作命令和計時命令;根據(jù)所述操作命令和計時命令執(zhí)行相關(guān)操作。15.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述定時操作設(shè)備,具體用于: 將所述文字命令信息中的非數(shù)字文字與預(yù)設(shè)的操作命令詞和計時命令詞向匹配,當(dāng)匹配成功時,根據(jù)匹配成功的操作命令詞和計時命令詞生成操作命令和計時命令。16.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述定時操作設(shè)備,具體用于: 提取所述文字命令信息中匹配成功的操作命令詞和計時命令詞; 判斷所述操作命令詞是否有對應(yīng)的計時命令詞或滯后操作指示詞; 當(dāng)判斷為是時,生成滯后命令和對應(yīng)的計時命令;當(dāng)判斷為否時,生成當(dāng)前命令。17.如權(quán)利要求14-16任一所述的系統(tǒng),其特征在于,所述定時操作設(shè)備,具體用于: 采用選定的聲學(xué)模型和語言模型,確定與輸入的語音命令信息匹配度最高的文字命令信息,得到語音命令信息對應(yīng)的為文字命令信息。18.如權(quán)利要求17所述的系統(tǒng),其特征在于,所述定時操作設(shè)備,具體用于: 采用選定的語言模型,根據(jù)待匹配文字中每個分詞相對于所有當(dāng)前已知詞的概率,確定待匹配文字的序列本身概率; 采用選定的聲學(xué)模型確定待匹配文字發(fā)出語音命令信息這段語音的概率; 確定待匹配文字的序列本身概率與待匹配文字發(fā)出語音命令信息這段語音的概率的乘積最大的待匹配文字為語音命令信息匹配度最高的文字命令信息。
【文檔編號】G10L15/22GK106057197SQ201610355526
【公開日】2016年10月26日
【申請日】2016年5月25日
【發(fā)明人】鄭艷霞
【申請人】北京云知聲信息技術(shù)有限公司