處理用戶輸入數(shù)據(jù)40并且在130處評估用戶輸入數(shù)據(jù)40。如果在130處用戶輸入數(shù)據(jù)不指示以激活語音識別,則可選地,可以在140處顯示指示未識別輸入的消息,并且110處方法繼續(xù)針對用戶輸入數(shù)據(jù)40進(jìn)行監(jiān)視。
[0029]然而,如果在130處用戶輸入數(shù)據(jù)40指示以激活語音識別,則在150處激活輸入設(shè)備16b、16n以開始記錄用戶的語音、手勢和/或注視。在160處如果記錄的輸入是語音輸入,則基于語音識別方法在170處處理記錄的語音數(shù)據(jù)48以確定語音命令。在180處根據(jù)語音命令確定選擇的語音系統(tǒng)52。基于選擇的語音系統(tǒng)52在190處生成激活/解激活信號70并且將其傳送到適合的語音系統(tǒng)16a-16n。此后,在200處方法可以結(jié)束。
[0030]然而,在160處如果記錄的數(shù)據(jù)相反不是語音數(shù)據(jù),在210處記錄的數(shù)據(jù)是注視數(shù)據(jù)56,則基于注視識別方法在220處處理記錄的注視數(shù)據(jù)56以確定用戶的注視的方向。在230處根據(jù)用戶的注視的方向確定選擇的語音系統(tǒng)60?;谶x擇的語音系統(tǒng)60在190處生成激活/解激活信號70并且將其傳送到適合的語音系統(tǒng)16a-16n。此后,在200處方法可以結(jié)束。
[0031]然而,在160處如果記錄的數(shù)據(jù)不是語音數(shù)據(jù),并且在240處記錄的數(shù)據(jù)不是手勢數(shù)據(jù),而是,在210處記錄的數(shù)據(jù)是記錄的手勢數(shù)據(jù)64,則基于手勢識別方法在250處處理記錄的手勢數(shù)據(jù)64以確定用戶的手勢的方向。在260處根據(jù)用戶的手勢的方向確定選擇的語音系統(tǒng)68?;谶x擇的語音系統(tǒng)68在190處生成激活/解激活信號70并且將其傳送到適合的語音系統(tǒng)16a-16n。此后,在200處方法可以結(jié)束。
[0032]在圖3中示出的方法圖示了處理語音數(shù)據(jù)、注視數(shù)據(jù)和手勢數(shù)據(jù)中的一個(gè)以確定選擇的語音系統(tǒng)。如可以理解的那樣,可以處理語音數(shù)據(jù)、注視數(shù)據(jù)和手勢數(shù)據(jù)中的兩個(gè)或更多以確定選擇的語音系統(tǒng)。例如,如果兩個(gè)或更多輸入指示相同的語音系統(tǒng),則該語音系統(tǒng)是選擇的語音系統(tǒng)。在另一示例中,如果一個(gè)輸入指示第一語音系統(tǒng)并且另一輸入指示第二語音系統(tǒng),則可以顯示指示差異(discr印ancy)的消息。
[0033]本領(lǐng)域的技術(shù)人員將理解,連同本文公開的實(shí)施例描述的各種說明性的邏輯塊、模塊和算法步驟可以被實(shí)現(xiàn)為電子硬件、計(jì)算機(jī)軟件或者兩者的組合。上文按照功能和/或邏輯塊部件(或模塊)以及各種處理步驟描述了實(shí)施例和實(shí)施中的某些。然而,應(yīng)理解,這樣的塊部件(或模塊)可以由被配置成執(zhí)行指定功能的任何數(shù)量的硬件、軟件和/或固件部件實(shí)現(xiàn)。為了清楚地說明硬件和軟件的該可交換性,上文已經(jīng)按照它們的功能一般地描述了各種說明性部件、塊、模塊、電路和步驟。這樣的功能是被實(shí)現(xiàn)為硬件還是軟件取決于被施加在整個(gè)系統(tǒng)上的特定應(yīng)用和設(shè)計(jì)約束。本領(lǐng)域技術(shù)人員可以針對每個(gè)特定的應(yīng)用以變化的方式實(shí)現(xiàn)所描述的功能,但這樣的實(shí)施決定不應(yīng)被解釋為引起從本發(fā)明的范圍背離。例如,系統(tǒng)或者部件的實(shí)施例可以采用各種集成電路部件,例如存儲器元件、數(shù)字信號處理元件、邏輯元件、查找表等等,其可以在一個(gè)或多個(gè)微處理器或者其他控制設(shè)備的控制下執(zhí)行各種功能。另外,本領(lǐng)域技術(shù)人員將理解,本文描述的實(shí)施例僅是示例性實(shí)施。
[0034]可以用通用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或者其他可編程的邏輯器件、分立門或者晶體管邏輯、分立硬件部件或者被設(shè)計(jì)以執(zhí)行本文描述的方法的它們的任何組合來實(shí)現(xiàn)或者執(zhí)行連同本文公開的實(shí)施例描述的各種說明性邏輯塊、模塊和電路。通用處理器可以是微處理器,但是在替代方案中,處理器可以是任何常規(guī)的處理器、控制器、微控制器或者狀態(tài)機(jī)。處理器也可以被實(shí)現(xiàn)為計(jì)算設(shè)備的組合,例如,DSP和微處理器的組合、多個(gè)微處理器、一個(gè)或多個(gè)微處理器連同DSP核,或者任何其他這樣的配置。
[0035]連同本文公開的實(shí)施例描述的方法或算法的步驟可以被直接地實(shí)現(xiàn)在硬件中、在由處理器執(zhí)行的軟件模塊中或者在兩者的組合中。軟件模塊可以駐留在RAM存儲器、閃存、ROM存儲器、EPR0M存儲器、EEPR0M存儲器、寄存器、硬盤、可移動盤、CD-ROM或者本領(lǐng)域中所知的任何其他形式的存儲介質(zhì)中。示例性的存儲介質(zhì)耦合到處理器,使得處理器可以從存儲介質(zhì)讀信息并且向存儲介質(zhì)寫信息。在替代方案中,存儲介質(zhì)可以對處理器不可或缺(be integral to)。處理器和存儲介質(zhì)可以駐留在ASIC中。ASIC可以駐留在用戶終端中。在替代方案中,處理器和存儲介質(zhì)可以作為分立部件駐留在用戶終端中。
[0036]在該文檔中,諸如第一和第二等等的關(guān)系術(shù)語可以被單獨(dú)地用于區(qū)分一個(gè)實(shí)體或動作與另一實(shí)體或動作,而未必要求或者暗示在這樣的實(shí)體或者動作之間的任何實(shí)際的這樣的關(guān)系或次序。諸如“第一”、“第二”、“第三”等等之類的數(shù)值序數(shù)僅表示多個(gè)中的不同的單個(gè),并且不暗示任何次序或順序,除非由權(quán)利要求語言具體地限定。在任何權(quán)利要求中的文本的順序不暗示必須以根據(jù)這樣的順序的時(shí)間或邏輯次序執(zhí)行處理步驟,除非由權(quán)利要求語言具體地限定??梢砸匀魏未涡蚪粨Q處理步驟而不背離本發(fā)明的范圍,只要這樣的交換不與權(quán)利要求語言矛盾并且不是邏輯上無意義的。
[0037]雖然已經(jīng)在本發(fā)明的上述詳細(xì)描述中呈現(xiàn)了至少一個(gè)示例性實(shí)施例,但是應(yīng)理解存在大量的變型。還應(yīng)理解一個(gè)或多個(gè)示例性實(shí)施例只是示例,并且不意圖以任何方式限制本發(fā)明的范圍、可應(yīng)用性或者配置。相反地,上述詳細(xì)描述將為本領(lǐng)域技術(shù)人員提供用于實(shí)現(xiàn)本發(fā)明的示例性實(shí)施例的方便的路線圖。應(yīng)理解,可以在示例性實(shí)施例中描述的元件的功能和布置中做出各種改變而不背離如在所附權(quán)利要求書中記載的本發(fā)明的范圍。
【主權(quán)項(xiàng)】
1.一種在具有至少兩個(gè)語音使能系統(tǒng)的環(huán)境中管理語音處理的方法,包括: 記錄指示用戶的動作的第一用戶數(shù)據(jù); 由處理器基于記錄的用戶數(shù)據(jù)確定對第一語音使能系統(tǒng)的選擇;以及 由處理器基于第一語音使能系統(tǒng)生成信號以進(jìn)行激活和解激活語音處理中的至少一個(gè)。2.如權(quán)利要求1所述的方法,其中用戶的動作包括用戶的手勢。3.如權(quán)利要求1所述的方法,其中用戶的動作包括用戶的注視。4.如權(quán)利要求1所述的方法,其中用戶的動作包括來自用戶的所說的命令。5.如權(quán)利要求1所述的方法,其中信號激活第一語音使能系統(tǒng)的語音處理。6.如權(quán)利要求1所述的方法,其中信號激活使用與第一語音使能系統(tǒng)相關(guān)聯(lián)的詞匯和語音處理技術(shù)中的至少一個(gè)的集中的語音的處理器的語音處理。7.如權(quán)利要求1所述的方法,進(jìn)一步包括記錄指示用戶的第二動作的第二用戶數(shù)據(jù),并且其中確定對第一語音使能系統(tǒng)的選擇基于第一記錄的用戶數(shù)據(jù)和第二記錄的用戶數(shù)據(jù)。8.如權(quán)利要求1所述的方法,進(jìn)一步包括接收指示激活記錄的用戶輸入數(shù)據(jù),并且其中基于用戶輸入數(shù)據(jù)執(zhí)行記錄。9.如權(quán)利要求1所述的方法,其中連續(xù)地執(zhí)行記錄。10.一種在具有至少兩個(gè)語音使能系統(tǒng)的環(huán)境中管理語音處理的系統(tǒng),包括: 輸入設(shè)備,其記錄指示用戶的動作的第一用戶數(shù)據(jù);以及 處理器,其基于所記錄的用戶數(shù)據(jù)確定第一語音使能系統(tǒng)的選擇,并且基于第一語音使能系統(tǒng)生成信號以進(jìn)行激活和解激活語音處理中的至少一個(gè)。
【專利摘要】本發(fā)明涉及用于管理多語音系統(tǒng)環(huán)境中的語音識別的方法和系統(tǒng)。提供用于管理在具有至少兩個(gè)語音使能系統(tǒng)的環(huán)境中的語音處理的方法和系統(tǒng)。在一個(gè)實(shí)施例中,方法包括:記錄指示用戶的動作的第一用戶數(shù)據(jù);由處理器基于所記錄的用戶數(shù)據(jù)確定對第一語音使能系統(tǒng)的選擇;以及由處理器基于第一語音使能系統(tǒng)生成信號以進(jìn)行激活和解激活語音處理中的至少一個(gè)。
【IPC分類】G10L15/26
【公開號】CN105261361
【申請?zhí)枴緾N201510392770
【發(fā)明人】W.羅杰斯, E.勒蘇-戴克, S.懷特洛夫
【申請人】霍尼韋爾國際公司
【公開日】2016年1月20日
【申請日】2015年7月7日
【公告號】EP2966644A2, EP2966644A3, US20160011853