專利名稱:用于與用戶執(zhí)行對(duì)話通信的系統(tǒng)的方法
本發(fā)明涉及一種用于與用戶執(zhí)行對(duì)話通信的系統(tǒng)的方法。通過(guò)分析用戶的語(yǔ)音信號(hào)來(lái)產(chǎn)生并向用戶呈現(xiàn)語(yǔ)義項(xiàng)的一個(gè)候選列表。根據(jù)預(yù)定義的準(zhǔn)則來(lái)執(zhí)行與候選列表中語(yǔ)義項(xiàng)之一相關(guān)聯(lián)的動(dòng)作,除非用戶從候選列表中選擇一個(gè)不同的語(yǔ)義項(xiàng)。本發(fā)明進(jìn)一步涉及到一種用在與用戶執(zhí)行對(duì)話通信的系統(tǒng)中的對(duì)話設(shè)備。
在本領(lǐng)域內(nèi)已普遍接受語(yǔ)音識(shí)別從未達(dá)到100%的精度。因此,處理錯(cuò)誤與不確定性的方法是一個(gè)重要的研究領(lǐng)域??捎玫姆椒ㄓ上嚓P(guān)系統(tǒng)的使用場(chǎng)景來(lái)決定。
僅語(yǔ)音對(duì)話的系統(tǒng),類似基于電話的系統(tǒng),主要使用澄清問(wèn)題以及隱式的或顯式的驗(yàn)證。主要用來(lái)將任意文本口述到字處理器中的系統(tǒng)可以提供從語(yǔ)音識(shí)別器遞送的候選列表得到的備選項(xiàng),其中顯示器顯示該轉(zhuǎn)換后的文本。在此過(guò)程中產(chǎn)生了一組備選項(xiàng),該備選項(xiàng)通常以樹(shù)狀圖形式表示,但可以被轉(zhuǎn)換為一個(gè)可能的字序列的列表。這就是通常所稱的n-最佳候選列表。一個(gè)口述系統(tǒng)可以顯示字的候選列表或者一個(gè)字序列的一部分,其中不同備選項(xiàng)之間的相似度足夠高,這樣用戶可以通過(guò)鍵盤命令來(lái)選擇最佳備選項(xiàng)。然而,這些系統(tǒng)卻不適合與用戶以交互的方式進(jìn)行通信。
對(duì)于多模式口頭對(duì)話系統(tǒng),即通過(guò)語(yǔ)音和一種附加模態(tài)控制的系統(tǒng),執(zhí)行用戶命令的結(jié)果通常以候選列表的形式顯示出來(lái)。例如,由話音控制的電子節(jié)目指南顯示了關(guān)于查詢的最好結(jié)果。對(duì)于具有巨大詞匯和非常簡(jiǎn)單的對(duì)話結(jié)構(gòu)的特定應(yīng)用,類似在汽車導(dǎo)航系統(tǒng)中輸入目的地來(lái)進(jìn)行路線規(guī)劃,在顯示器上顯示候選列表?,F(xiàn)有技術(shù)的多模式口頭對(duì)話系統(tǒng)的問(wèn)題在于候選列表是僅有的可能反應(yīng),它不可能基于該候選列表而繼續(xù)通信。由于缺少用戶與系統(tǒng)之間的交互通信,所以通信變得對(duì)用戶非常不友好。
本發(fā)明的目的是通過(guò)提供交互式的且用戶友好的方法和設(shè)備來(lái)執(zhí)行與用戶的對(duì)話通信,從而解決上述問(wèn)題。
按照一個(gè)方面,本發(fā)明涉及一種與用戶執(zhí)行對(duì)話通信的系統(tǒng)的方法,該方法包括以下步驟
-記錄包括動(dòng)作的請(qǐng)求的語(yǔ)音信號(hào),該動(dòng)作要由上述系統(tǒng)執(zhí)行,其中上述語(yǔ)音信號(hào)由上述用戶產(chǎn)生,-使用語(yǔ)音識(shí)別來(lái)分析上述記錄的語(yǔ)音信號(hào),并將上述分析結(jié)果與系統(tǒng)中定義的預(yù)定義語(yǔ)義項(xiàng)進(jìn)行比較,其中每個(gè)上述語(yǔ)義項(xiàng)都與一個(gè)動(dòng)作相關(guān)聯(lián),-根據(jù)上述比較來(lái)產(chǎn)生一個(gè)候選列表,其中上述候選列表標(biāo)識(shí)了從上述預(yù)定義的語(yǔ)義項(xiàng)中選出的有限數(shù)量的語(yǔ)義項(xiàng),-向上述用戶呈現(xiàn)上述候選列表,以及-執(zhí)行與上述候選列表中上述語(yǔ)義項(xiàng)之一相關(guān)聯(lián)的動(dòng)作,該動(dòng)作根據(jù)預(yù)定義的準(zhǔn)則選出,除非上述用戶從上述候選列表中選擇了一個(gè)不同的語(yǔ)義項(xiàng)。
因此,候選列表在用戶與系統(tǒng)間提供了延續(xù)的交互通信,這使得通信對(duì)用戶非常友好。此外,由于限制了用戶可選擇的語(yǔ)義項(xiàng),錯(cuò)誤糾正的可能性得到了大幅提高。舉例而言,如果用戶請(qǐng)求包括播放一首特定歌曲,但是沒(méi)有找到與這首歌曲的精確匹配,那么顯示一個(gè)與被請(qǐng)求歌曲相匹配,即發(fā)音相似達(dá)到特定的預(yù)定義級(jí)別的歌曲列表。在這種情況下,用戶可能會(huì)根據(jù)被顯示的候選列表做出糾正。因?yàn)橛脩舻倪x擇僅僅基于候選列表,因此這大大降低了錯(cuò)誤的風(fēng)險(xiǎn)。在另一個(gè)示例中,用戶的請(qǐng)求可能包括播放滾石樂(lè)隊(duì)(Rolling Stones)的一些東西。在這種情況下,產(chǎn)生的候選列表可能包括了滾石樂(lè)隊(duì)的所有歌曲。因此用戶可以根據(jù)上述候選列表選擇一首歌曲,即滾石樂(lè)隊(duì)的歌曲,或者系統(tǒng)在用戶沒(méi)有響應(yīng)所顯示候選列表的情況下隨機(jī)地選擇一首歌曲。
在一個(gè)實(shí)施方案中,上述呈現(xiàn)的候選列表中的語(yǔ)義項(xiàng)包括了基于與用戶請(qǐng)求的不同匹配的各種可信度。
因此,當(dāng)將該候選列表呈現(xiàn)給用戶的時(shí)候,與上述語(yǔ)義項(xiàng)相關(guān)聯(lián)的各種動(dòng)作也可以以分選的形式呈現(xiàn)給用戶。例如第一個(gè)候選項(xiàng)是最佳匹配于用戶請(qǐng)求的候選項(xiàng),第二個(gè)候選項(xiàng)是次最佳的候選項(xiàng),等等。
在一個(gè)實(shí)施方案中,當(dāng)將上述候選列表呈現(xiàn)給用戶時(shí),上述候選列表中具有最高可信度的語(yǔ)義項(xiàng)被自動(dòng)選中。
因此,用戶僅需要在具有最高可信度的候選項(xiàng)非正確候選項(xiàng)的情況下選擇一個(gè)語(yǔ)義項(xiàng)。所以上述候選列表的實(shí)際使用就被最小化了,因?yàn)楹芸赡芫哂凶罡呖尚哦鹊恼Z(yǔ)義項(xiàng)就是正確選項(xiàng)。例如,用戶可能請(qǐng)求一個(gè)音樂(lè)自動(dòng)點(diǎn)唱機(jī)來(lái)播放一首歌曲。在這種情況下,可能的候選列表包括與被請(qǐng)求歌曲具有相似發(fā)音(例如用戶的語(yǔ)音信號(hào))的一首或多首歌曲。與被請(qǐng)求歌曲發(fā)音最接近的歌曲,即最佳匹配的那一首歌曲,因此可能是具有最高可信度的備選項(xiàng)。顯然,如果用戶僅僅需要在例如10%的情況下做出糾正的話,那么通信會(huì)被大幅改善。
在一個(gè)實(shí)施方案中,如果用戶沒(méi)有選擇上述候選列表中的任何語(yǔ)義項(xiàng),那么上述候選列表中具有最高可信度的語(yǔ)義項(xiàng)被自動(dòng)選中。
因此,沉默與贊成是一樣的。當(dāng)用戶看到或聽(tīng)到(這取決于候選列表是如何呈現(xiàn)的)具有最高可信度的備選項(xiàng)是正確的選項(xiàng)時(shí),他/她不必做任何類型的確認(rèn)。這又再次最小化了上述候選列表的實(shí)際使用。
在一個(gè)實(shí)施方案中,上述可能的候選列表在一個(gè)預(yù)定義的時(shí)間間隔內(nèi)呈現(xiàn)給用戶。
因此,不必為用戶呈現(xiàn)該候選列表達(dá)一個(gè)長(zhǎng)的時(shí)間周期,且因此系統(tǒng)與用戶之間的交互也變得更延續(xù)。在前一實(shí)施方案中提到如果用戶沒(méi)有響應(yīng)的話,一個(gè)語(yǔ)義項(xiàng)就被自動(dòng)選中,舉例而言包括在例如5秒后自動(dòng)選中它,即用戶有5秒去選擇另一個(gè)語(yǔ)義項(xiàng)。
在一個(gè)實(shí)施方案中,呈現(xiàn)上述候選列表給用戶包括向用戶顯示上述候選列表。
因此,提供了一種方便的備選方案來(lái)將候選列表呈現(xiàn)給用戶。更優(yōu)選地,自動(dòng)檢查是否有顯示器存在。如果存在顯示器則可能使用該顯示器。
在一個(gè)實(shí)施方案中,將上述可能的候選列表呈現(xiàn)給用戶包括給用戶播放上述可能的候選列表。
因此,不需要顯示器來(lái)給用戶呈現(xiàn)候選列表。如果系統(tǒng)包括一個(gè)汽車導(dǎo)航系統(tǒng),那么這是一個(gè)非常大的益處,在這里用戶可以在駕駛過(guò)程中與系統(tǒng)進(jìn)行交互。
在又一方面,本發(fā)明涉及一種計(jì)算機(jī)可讀介質(zhì),其中存儲(chǔ)的指令使處理單元執(zhí)行上述方法。
按照另一方面,本發(fā)明涉及一種要用在與用戶執(zhí)行對(duì)話通信的系統(tǒng)中的對(duì)話設(shè)備,該對(duì)話設(shè)備包括-一個(gè)記錄器,用于記錄包括動(dòng)作的請(qǐng)求的語(yǔ)音信號(hào),該動(dòng)作要由上述系統(tǒng)執(zhí)行,其中上述語(yǔ)音信號(hào)由上述用戶產(chǎn)生,
-一個(gè)語(yǔ)音識(shí)別器,用于使用語(yǔ)音識(shí)別來(lái)分析上述記錄的語(yǔ)音信號(hào),并將上述分析結(jié)果與系統(tǒng)中定義的預(yù)定義語(yǔ)義項(xiàng)進(jìn)行比較,其中每個(gè)語(yǔ)義項(xiàng)都與一個(gè)動(dòng)作相關(guān)聯(lián),其中根據(jù)上述比較來(lái)產(chǎn)生一個(gè)候選列表,上述候選列表標(biāo)識(shí)了從上述預(yù)定義的語(yǔ)義項(xiàng)中選出的有限數(shù)量的語(yǔ)義項(xiàng),-用于將上述候選列表呈現(xiàn)給用戶的裝置,以及-用于執(zhí)行與上述候選列表中上述語(yǔ)義項(xiàng)之一相關(guān)聯(lián)的動(dòng)作的裝置,該動(dòng)作要根據(jù)預(yù)定義的準(zhǔn)則而選出,除非上述用戶從上述候選列表中選擇了一個(gè)不同的語(yǔ)義項(xiàng)。
因此,提供了一個(gè)可以與各種系統(tǒng)相集成的對(duì)用戶友好的設(shè)備,該設(shè)備改善了上述用戶與系統(tǒng)間的對(duì)話通信。
在一個(gè)實(shí)施方案中,用于將上述候選列表呈現(xiàn)給上述用戶的裝置包括一個(gè)顯示器。
更優(yōu)選地,該設(shè)備適合于檢查一個(gè)顯示器是否存在,以及基于此而檢查是否應(yīng)該向用戶顯示它。例如,該顯示器可被配備以一個(gè)觸摸屏等等,使得在必要時(shí)用戶可以通過(guò)點(diǎn)擊來(lái)執(zhí)行糾正。
在一個(gè)實(shí)施方案中,用于將上述候選列表呈現(xiàn)給上述用戶的裝置包括一個(gè)聲學(xué)設(shè)備。
因此,當(dāng)例如顯示器不存在時(shí),候選列表可以被大聲地播放給用戶。當(dāng)然,系統(tǒng)可以同時(shí)被配備以顯示器和聲學(xué)設(shè)備,并且用戶可以命令該系統(tǒng)以對(duì)話的方式進(jìn)行通信(例如因?yàn)橛脩粽隈{駛),或者通過(guò)上述顯示器來(lái)通信。
下面將結(jié)合附圖,詳細(xì)地描述本發(fā)明且尤其是其優(yōu)選實(shí)施方案,在附圖中,圖1以圖形方式例示了根據(jù)本發(fā)明的用戶與系統(tǒng)之間的對(duì)話通信,圖2例示了用于與用戶執(zhí)行對(duì)話通信的系統(tǒng)的方法的一個(gè)實(shí)施方案流程圖,圖3顯示了一個(gè)系統(tǒng)的示例,該系統(tǒng)包括了一個(gè)用于與用戶執(zhí)行對(duì)話通信的對(duì)話設(shè)備,以及圖4顯示了根據(jù)本發(fā)明的一個(gè)對(duì)話設(shè)備,該對(duì)話設(shè)備被用在與用戶執(zhí)行對(duì)話通信的系統(tǒng)中。
圖1以圖形方式例示了根據(jù)本發(fā)明的用戶105與系統(tǒng)101之間的對(duì)話通信。包括動(dòng)作的請(qǐng)求的語(yǔ)音信號(hào)107由用戶產(chǎn)生并由系統(tǒng)101記錄,該動(dòng)作要由上述系統(tǒng)101執(zhí)行。通過(guò)使用語(yǔ)音識(shí)別而對(duì)語(yǔ)音信號(hào)進(jìn)行分析,并將分析結(jié)果與系統(tǒng)101中定義的預(yù)定義語(yǔ)義項(xiàng)103進(jìn)行比較。這些語(yǔ)義項(xiàng)可以是要被系統(tǒng)執(zhí)行的動(dòng)作,例如在系統(tǒng)101是音樂(lè)自動(dòng)點(diǎn)唱機(jī)的情況下要播放不同的歌曲。分析可能包括在用戶請(qǐng)求的發(fā)音與預(yù)定義語(yǔ)義項(xiàng)103之間尋找匹配。根據(jù)該分析而產(chǎn)生一個(gè)候選列表109,該候選列表包括有限數(shù)量的語(yǔ)義項(xiàng),例如111、113,它們符合與預(yù)定義語(yǔ)義項(xiàng)103的匹配準(zhǔn)則。舉例而言,匹配準(zhǔn)則可以包括所有的、有超過(guò)80%的可能性是正確匹配的匹配,這些匹配被認(rèn)為是可能的候選項(xiàng)。這個(gè)候選列表109被呈現(xiàn)給用戶105,且與候選列表中語(yǔ)義項(xiàng)111、103之一相關(guān)聯(lián)的動(dòng)作根據(jù)預(yù)定義準(zhǔn)則被執(zhí)行,除非用戶105從上述候選列表中選擇了一個(gè)不同的語(yǔ)義項(xiàng)。例如,預(yù)定義準(zhǔn)則可包括自動(dòng)選擇與具有最佳匹配的語(yǔ)義項(xiàng)相關(guān)聯(lián)的動(dòng)作,即具有最高可信度的動(dòng)作。
圖2顯示了用于與用戶執(zhí)行對(duì)話通信的系統(tǒng)的方法的一個(gè)實(shí)施方案流程圖。在這個(gè)實(shí)施方案中,用戶的語(yǔ)音信號(hào)或用戶輸入(U_I)201包括要由上述系統(tǒng)執(zhí)行的動(dòng)作的請(qǐng)求,該語(yǔ)音信號(hào)或者用戶輸入由語(yǔ)音識(shí)別器處理,該語(yǔ)音識(shí)別器根據(jù)與該系統(tǒng)中預(yù)定義語(yǔ)義項(xiàng)的最佳匹配來(lái)產(chǎn)生一個(gè)或多個(gè)備選項(xiàng)或者一個(gè)候選列表(C_L)203。例如,用戶的語(yǔ)音信號(hào)可以包括讓音樂(lè)自動(dòng)點(diǎn)唱機(jī)播放由Pink Floyd演唱的“wish youwere here(希望你在這里)”的請(qǐng)求。根據(jù)用戶的語(yǔ)音信號(hào)(U_I)201,系統(tǒng)構(gòu)造一個(gè)候選列表,該候選列表按照與系統(tǒng)中預(yù)定義的語(yǔ)義項(xiàng)最佳匹配的次序排序,并且自動(dòng)以最佳候選項(xiàng)(S_O)205開(kāi)始所期望的操作,即播放與標(biāo)題“wish you were here”最佳匹配的候選項(xiàng)。如果候選列表僅包括這一個(gè)候選項(xiàng)(O_C?)207,那么系統(tǒng)的正常操作將會(huì)繼續(xù),例如,在設(shè)備是一個(gè)音樂(lè)自動(dòng)點(diǎn)唱機(jī)時(shí),正常顯示會(huì)繼續(xù)進(jìn)行(E)217。
如果候選列表包括一個(gè)以上的候選項(xiàng)(O_C?)207,則通過(guò)例如給識(shí)別語(yǔ)法裝載候選條目(L_R_G)209,而將一個(gè)候選列表呈現(xiàn)(P_C_L)111給用戶。該候選列表可以例如包括一個(gè)具有相似發(fā)音的藝術(shù)家列表。候選列表可能被顯示達(dá)某一預(yù)定義的時(shí)間周期,因此用戶有機(jī)會(huì)選擇另一個(gè)候選條目,且由此執(zhí)行糾正。但是,如果在預(yù)定義的時(shí)間周期(T_O)213內(nèi)用戶沒(méi)有響應(yīng),則假定具有最佳匹配的候選項(xiàng)是正確的,例如,nr.l.列出的候選項(xiàng)。在兩種情況下,帶有候選條目的識(shí)別語(yǔ)法被卸載(U_R_G)215,且正常的顯示會(huì)繼續(xù)進(jìn)行(E)217。
在一個(gè)實(shí)施方案中,如果在一個(gè)要形成的操作,例如播放一首歌曲的操作中,一個(gè)候選項(xiàng)具有非常高的可信度,則該請(qǐng)求被立即啟動(dòng),即該歌曲被播放,而不再提示具有低得多的可信度的可能候選列表。然而,如果該歌曲不正確,那么用戶可以通過(guò)例如再次重復(fù)標(biāo)題來(lái)表明此情況。這優(yōu)選地將由該設(shè)備通過(guò)向用戶再提示可能的候選列表而進(jìn)行響應(yīng)。
在一個(gè)實(shí)施方案中,該候選列表被呈現(xiàn),盡管候選列表中只含有一個(gè)合理的備選項(xiàng)。這是要提供有關(guān)設(shè)備對(duì)用戶輸入的解譯的反饋。舉例而言,如果設(shè)備與自動(dòng)點(diǎn)唱機(jī)集成在一起,那么在歌曲被播放的同時(shí),歌曲名也被顯示出來(lái)。
在一個(gè)實(shí)施方案中,該設(shè)備適合為該用戶顯示可尋址項(xiàng)。例如,在用戶的輸入是要播放滾石樂(lè)隊(duì)的一些東西的情況中,候選列表包括滾石樂(lè)隊(duì)的所有(或者部分)歌曲。
在一個(gè)實(shí)施方案中,用戶通過(guò)說(shuō)出一個(gè)可選的候選項(xiàng)的名字、或者通過(guò)直接或由其在列表中的位置(例如“數(shù)字2”)命名想要的可選候選項(xiàng)來(lái)選擇一個(gè)候選條目。在后一情形中,語(yǔ)音識(shí)別器可能對(duì)數(shù)字是魯棒的。
在一個(gè)實(shí)施方案中,用戶通過(guò)使用一種指示形式(modality),例如觸摸屏、遙控等,來(lái)選擇一個(gè)候選條目。
在一個(gè)實(shí)施方案中,最佳候選項(xiàng)可能由于用戶將不使用它而被排除在識(shí)別詞匯之外以便進(jìn)行糾正,并且它不能被誤解為其它候選項(xiàng)。例如,用戶說(shuō)“播放甲殼蟲樂(lè)隊(duì)(Beatles)的一些東西”,而設(shè)備將這個(gè)用戶輸入理解成“播放老鷹樂(lè)隊(duì)(Eagles)的一些東西”。當(dāng)用戶注意到錯(cuò)誤并重述“播放甲殼蟲樂(lè)隊(duì)的一些東西”時(shí),該設(shè)備會(huì)排除老鷹樂(lè)隊(duì),因?yàn)樗诘谝淮螘r(shí)不正確。因此,對(duì)可能的候選項(xiàng)的選擇就減少了一個(gè)候選項(xiàng),即老鷹樂(lè)隊(duì)。
在一個(gè)實(shí)施方案中,設(shè)備向用戶傳達(dá)哪些可尋址的條目是已知的。例如,在一個(gè)音樂(lè)自動(dòng)點(diǎn)唱機(jī)的應(yīng)用中,用戶不知道一首歌曲的正確名字,例如用戶說(shuō)“Sergeant Peppers”,但是數(shù)據(jù)庫(kù)包括“SergeantPepper’s lonely heart”。因此,設(shè)備或者將這一個(gè)候選項(xiàng)建議給用戶,或者它立刻開(kāi)始播放此歌曲。
圖3顯示了系統(tǒng)的示例,該系統(tǒng)包括了一個(gè)用于與用戶執(zhí)行對(duì)話通信的對(duì)話設(shè)備。用戶301可以與具有對(duì)話設(shè)備的電視303進(jìn)行交互。當(dāng)設(shè)備感測(cè)到監(jiān)視器存在時(shí),它可能自動(dòng)地使用該監(jiān)視器與用戶301進(jìn)行交互,由此可激活且在電視監(jiān)視器上顯示一個(gè)候選列表,以及在一段時(shí)間后,例如5秒后,撤消(deactivate)該候選列表。當(dāng)然,也可以通過(guò)對(duì)話來(lái)進(jìn)行交互。例如,默認(rèn)地,電視303在用戶301和對(duì)話設(shè)備之間進(jìn)行交互期間被關(guān)閉。此外,如果用戶301在交互期間遇到問(wèn)題,例如,因?yàn)榄h(huán)境噪聲級(jí)別突然增加,或者系統(tǒng)內(nèi)的一個(gè)新應(yīng)用被首次使用,那么用戶301可以打開(kāi)電視303并可獲得有關(guān)該設(shè)備理解什么的反饋以及選擇想要的備選項(xiàng)的可能性。
對(duì)話設(shè)備也可以與一臺(tái)計(jì)算機(jī)或者一個(gè)“家庭對(duì)話系統(tǒng)”305或類似的適合與用戶301以類似人類的方式進(jìn)行交互的系統(tǒng)集成在一起。在這一示例中,進(jìn)一步使用例如照相機(jī)的附加傳感器來(lái)作為一個(gè)交互代理。此外,對(duì)話設(shè)備可以集成到任何種類的移動(dòng)設(shè)備307、觸摸墊板等等中。使用該設(shè)備的應(yīng)用的另一個(gè)例子是汽車導(dǎo)航系統(tǒng)309。在所有這些情形中,對(duì)話設(shè)備適合于感測(cè)與用戶進(jìn)行交互的方式,即是通過(guò)對(duì)話還是獨(dú)白。
圖4顯示了根據(jù)本發(fā)明的一個(gè)對(duì)話設(shè)備400,該對(duì)話設(shè)備要用在與用戶105執(zhí)行對(duì)話通信的系統(tǒng)101中,其中對(duì)話設(shè)備400包括記錄器(Rec)401、語(yǔ)音識(shí)別器(S_R)402、顯示設(shè)備(Disp)403和/或聲學(xué)設(shè)備(Ac_D)404以及處理器(P)405。
記錄器(Rec)401記錄來(lái)自用戶105的語(yǔ)音信號(hào)107,其中該語(yǔ)音信號(hào)107可例如包括讓音樂(lè)自動(dòng)點(diǎn)唱機(jī)播放一首歌曲的請(qǐng)求。然后,語(yǔ)音識(shí)別器(S_R)402使用語(yǔ)音識(shí)別來(lái)分析記錄的語(yǔ)音信號(hào)107,并將上述來(lái)自分析的結(jié)果與系統(tǒng)101中定義的以及/或預(yù)存儲(chǔ)的預(yù)定義語(yǔ)義項(xiàng)103進(jìn)行比較。如果分析結(jié)果包括多個(gè)可能的候選備選項(xiàng),則基于與系統(tǒng)101中預(yù)定義語(yǔ)義項(xiàng)103的最佳匹配來(lái)產(chǎn)生一個(gè)候選列表。然后,顯示設(shè)備(Disp)403和/或聲學(xué)設(shè)備(Ac_D)404將候選列表109呈現(xiàn)給上述用戶105。這可以通過(guò)例如在電視監(jiān)視器上顯示該候選列表、或通過(guò)向用戶播放它來(lái)完成。這典型地是候選列表包括一個(gè)以上候選項(xiàng)的情況。
處理器(P)405可以例如被預(yù)先編程,因此在預(yù)定義的時(shí)間后它自動(dòng)選擇最佳匹配的候選項(xiàng),例如,nr.l.列出的候選項(xiàng)要被播放。此外,在候選列表僅包括一個(gè)候選項(xiàng)的情況下,系統(tǒng)的正常操作繼續(xù),例如,在設(shè)備是一個(gè)音樂(lè)自動(dòng)點(diǎn)唱機(jī)的情況下,候選項(xiàng)被自動(dòng)播放。
值得指出的是,上述實(shí)施方案是舉例說(shuō)明而不是限制本發(fā)明,本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求
范圍的情況下將能夠設(shè)計(jì)出多種替代實(shí)施方案。在權(quán)利要求
中,任何置于括號(hào)間的參考符號(hào)都不應(yīng)解釋為限制權(quán)利要求
。單詞“包括”并不排除權(quán)利要求
中記載之外的其它元件和步驟的存在。本發(fā)明可借助包含幾個(gè)不同元件的硬件以及借助一個(gè)合適編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在枚舉了幾個(gè)裝置的設(shè)備權(quán)利要求
中,這些裝置中的幾個(gè)裝置可以由同一個(gè)硬件項(xiàng)來(lái)體現(xiàn)。僅僅是某些措施在一些互不相同的從屬權(quán)利要求
中記載的事實(shí)并不表示不能使用這些措施的組合來(lái)獲益。
權(quán)利要求
1.一種用于與用戶(105)執(zhí)行對(duì)話通信的系統(tǒng)(101)的方法,該方法包括如下步驟記錄包括動(dòng)作的請(qǐng)求的語(yǔ)音信號(hào)(107),該動(dòng)作要由上述系統(tǒng)執(zhí)行,其中上述語(yǔ)音信號(hào)(107)由上述用戶(105)產(chǎn)生,使用語(yǔ)音識(shí)別來(lái)分析上述記錄的語(yǔ)音信號(hào),并將上述分析結(jié)果與系統(tǒng)(101)中定義的預(yù)定義語(yǔ)義項(xiàng)(103)進(jìn)行比較,其中每個(gè)上述語(yǔ)義項(xiàng)(103)都與一個(gè)動(dòng)作相關(guān)聯(lián),根據(jù)上述比較產(chǎn)生一個(gè)候選列表(109),其中上述候選列表(109)標(biāo)識(shí)了從上述預(yù)定義的語(yǔ)義項(xiàng)(103)中選出的有限數(shù)量的語(yǔ)義項(xiàng)(111,113)向上述用戶(105)呈現(xiàn)上述候選列表(109),以及執(zhí)行與上述候選列表(109)中上述語(yǔ)義項(xiàng)(111,113)之一相關(guān)聯(lián)的動(dòng)作,該動(dòng)作根據(jù)預(yù)定義的準(zhǔn)則選出,除非上述用戶(105)從上述候選列表(109)中選擇了一個(gè)不同的語(yǔ)義項(xiàng)。
2.根據(jù)權(quán)利要求
1的方法,其中上述被呈現(xiàn)的候選列表(109)中的上述語(yǔ)義項(xiàng)(111,113)包括基于用戶請(qǐng)求的不同匹配的各種可信度。
3.根據(jù)權(quán)利要求
1或2的方法,其中當(dāng)將上述候選列表(109)呈現(xiàn)給用戶(105)時(shí),來(lái)自上述候選列表(109)中的具有最高可信度的語(yǔ)義項(xiàng)(111,113)被自動(dòng)選中。
4.根據(jù)權(quán)利要求
1至3中任何一項(xiàng)的方法,其中如果用戶(105)沒(méi)有從上述候選列表(109)中選擇任何語(yǔ)義項(xiàng),則來(lái)自上述候選列表(109)中具有最高可信度的語(yǔ)義項(xiàng)(111,113)被自動(dòng)選中。
5.根據(jù)權(quán)利要求
1至4中任何一項(xiàng)的方法,其中上述候選列表(109)呈現(xiàn)給用戶達(dá)一個(gè)預(yù)定義的時(shí)間間隔。
6.根據(jù)權(quán)利要求
1至5中任何一項(xiàng)的方法,其中呈現(xiàn)上述候選列表(109)給用戶(105)包括顯示上述候選列表(109)給用戶(105)。
7.根據(jù)權(quán)利要求
1至6中任何一項(xiàng)的方法,其中呈現(xiàn)上述候選列表(109)給用戶(105)包括播放上述候選列表(109)給用戶(105)。
8.一種計(jì)算機(jī)可讀介質(zhì),其中存儲(chǔ)的指令使處理單元執(zhí)行方法1至7。
9.一種用在與用戶(105)執(zhí)行對(duì)話通信的系統(tǒng)(101)中的對(duì)話設(shè)備(400),包括-一個(gè)記錄器(401),用于記錄包括動(dòng)作的請(qǐng)求的語(yǔ)音信號(hào)(107),該動(dòng)作要由上述系統(tǒng)(101)執(zhí)行,其中上述語(yǔ)音信號(hào)(107)由上述用戶(105)產(chǎn)生,-一個(gè)語(yǔ)音識(shí)別器(402),用于使用語(yǔ)音識(shí)別來(lái)分析上述記錄的語(yǔ)音信號(hào)(107),并將上述分析結(jié)果與系統(tǒng)(101)中定義的預(yù)定義語(yǔ)義項(xiàng)(103)進(jìn)行比較,其中上述每個(gè)語(yǔ)義項(xiàng)(103)都與一個(gè)動(dòng)作相關(guān)聯(lián),其中根據(jù)上述比較來(lái)產(chǎn)生一個(gè)候選列表(109),上述候選列表(109)標(biāo)識(shí)了從上述預(yù)定義的語(yǔ)義項(xiàng)(103)中選出的有限數(shù)量的語(yǔ)義項(xiàng)(111,113),-用于將上述候選列表(109)呈現(xiàn)給上述用戶(105)的裝置(403,404),以及-用于執(zhí)行與上述候選列表(109)中上述語(yǔ)義項(xiàng)(111,113)之一相關(guān)聯(lián)的動(dòng)作的裝置(405),該動(dòng)作要根據(jù)預(yù)定義的準(zhǔn)則選出,除非上述用戶(105)從上述候選列表(109)中選擇了一個(gè)不同的語(yǔ)義項(xiàng)。
10.根據(jù)權(quán)利要求
9的對(duì)話設(shè)備,其中將上述候選列表(109)呈現(xiàn)給上述用戶(105)的上述裝置包括一個(gè)顯示器(403)。
11.根據(jù)權(quán)利要求
9的對(duì)話設(shè)備,其中將上述候選列表(109)呈現(xiàn)給上述用戶(105)的上述裝置包括一個(gè)聲學(xué)設(shè)備(404)。
專利摘要
本發(fā)明涉及一種用于與用戶(105)執(zhí)行對(duì)話通信的系統(tǒng)(101)的方法。用戶的語(yǔ)音信號(hào)(107)被記錄并進(jìn)行分析,該語(yǔ)音信號(hào)包括對(duì)要由系統(tǒng)(101)執(zhí)行的動(dòng)作的請(qǐng)求。分析的結(jié)果與系統(tǒng)(101)中定義的預(yù)定義語(yǔ)義項(xiàng)(103)進(jìn)行比較,其中每個(gè)語(yǔ)義項(xiàng)都與一個(gè)動(dòng)作相關(guān)聯(lián)。根據(jù)上述比較來(lái)產(chǎn)生并向用戶(105)呈現(xiàn)一個(gè)候選列表(109),這個(gè)列表標(biāo)識(shí)了從預(yù)定義的語(yǔ)義項(xiàng)(103)中選出的有限數(shù)量的語(yǔ)義項(xiàng)(111,113)。與候選列表(109)中語(yǔ)義項(xiàng)之一相關(guān)聯(lián)的動(dòng)作根據(jù)預(yù)定義的準(zhǔn)則被執(zhí)行,除非用戶(105)從候選列表(109)中選擇一個(gè)不同的語(yǔ)義項(xiàng)。
文檔編號(hào)G10L15/22GK1993732SQ20058002666
公開(kāi)日2007年7月4日 申請(qǐng)日期2005年7月27日
發(fā)明者T·波特勒, H·肖爾, F·薩森謝德特, J·F·馬施納 申請(qǐng)人:皇家飛利浦電子股份有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan