用于管理語音系統(tǒng)的對話的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及用于管理語音系統(tǒng)的對話的方法和系統(tǒng)。方法和系統(tǒng)被提供來用于管理語音系統(tǒng)的語音對話。在一個(gè)實(shí)施例中,一種方法包括:接收來自語音系統(tǒng)的用戶的第一表達(dá);確定來自第一表達(dá)的可能結(jié)果的第一列表,其中第一列表包括至少兩個(gè)要素,每個(gè)要素表示一種可能結(jié)果;分析第一列表的所述至少兩個(gè)要素來確定要素的歧義;以及基于部分正字法和所述歧義來對用戶生成語音提示。
【專利說明】用于管理語音系統(tǒng)的對話的方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本【技術(shù)領(lǐng)域】主要涉及語音系統(tǒng),并且更特別地涉及用于使用部分正字法(partial orthography)來管理語音系統(tǒng)內(nèi)的對話的方法和系統(tǒng)。
【背景技術(shù)】
[0002] 交通工具語音識別系統(tǒng)對由交通工具的乘員發(fā)出的語音執(zhí)行語音識別或理解。語 音表達(dá)通常包括指令,其通信于或控制交通工具的一個(gè)或多個(gè)特征或可由交通工具訪問的 其它系統(tǒng)。語音對話系統(tǒng)響應(yīng)于語音表達(dá)生成語音指令。在一些情況下,響應(yīng)于語音識別 生成語音指令,需要進(jìn)一步的信息以便執(zhí)行語音識別。例如,語音指令可以要求用戶重復(fù)語 音表達(dá),或者可以要求用戶從可能性的列表中進(jìn)行選擇。這類語音指令可能是笨拙的,難以 理解,或者可能不能解決識別問題。
[0003] 因此,希望的是提供改善的方法和系統(tǒng)來管理語音對話用以改善語音識別。因此, 進(jìn)一步希望的是提供方法和系統(tǒng)來使用部分正字法管理語音對話用以改善語音識別。更進(jìn) 一步,從后續(xù)詳細(xì)描述和所附權(quán)利要求書,結(jié)合附圖和前述【技術(shù)領(lǐng)域】和【背景技術(shù)】來理解,本 發(fā)明的其它所需特征和特性將變得清楚明了。
【發(fā)明內(nèi)容】
[0004] 方法和系統(tǒng)被提供來用于管理語音系統(tǒng)的語音對話。在一個(gè)實(shí)施例中,一種方法 包括:接收來自語音系統(tǒng)的用戶的第一表達(dá);確定來自第一表達(dá)的可能結(jié)果的第一列表, 其中第一列表包括至少兩個(gè)要素,每個(gè)要素表示一種可能結(jié)果;分析第一列表的所述至少 兩個(gè)要素來確定要素的歧義;以及基于部分正字法和所述歧義來對用戶生成語音提示。
[0005] 在另一實(shí)施例中,一種系統(tǒng)包括:第一模塊,其接收來自語音系統(tǒng)的用戶的第一表 達(dá),并且確定來自第一表達(dá)的可能結(jié)果的第一列表。第一列表包括至少兩個(gè)要素,每個(gè)要素 表示一種可能結(jié)果。第二模塊分析第一列表的所述至少兩個(gè)要素來確定要素的歧義。第三 模塊基于部分正字法和所述歧義來對用戶生成語音提示。
[0006] 本發(fā)明還提供以下技術(shù)方案: 1. 一種用于管理語音系統(tǒng)的語音對話的方法,包括: 接收來自語音系統(tǒng)的用戶的第一表達(dá); 確定來自第一表達(dá)的可能結(jié)果的第一列表,其中第一列表包括至少兩個(gè)要素,每個(gè)要 素表示一種可能結(jié)果; 分析第一列表的所述至少兩個(gè)要素來確定要素的歧義;以及 基于部分正字法和所述歧義來對用戶生成語音提示。
[0007] 2.如技術(shù)方案1所述的方法,進(jìn)一步包括: 響應(yīng)于語音提示接收來自用戶的第二表達(dá); 確定來自第二表達(dá)的可能結(jié)果的第二列表;以及 基于第一列表和第二列表生成結(jié)果。
[0008] 3.如技術(shù)方案2所述的方法,其中,基于第一列表的可能結(jié)果與第二列表的可能 結(jié)果的融合來生成結(jié)果。
[0009] 4.如技術(shù)方案2所述的方法,進(jìn)一步包括: 基于第二列表更新語音模型的語法;以及 使用語音模型的更新語法來生成結(jié)果。
[0010] 5.如技術(shù)方案1所述的方法,其中,所述分析包括:分析第一列表的所述至少兩 個(gè)要素來確定所述至少兩個(gè)要素之間的差別。
[0011] 6.如技術(shù)方案5所述的方法,其中,所述分析進(jìn)一步包括:確定第一列表的第一 要素的槽位與第二要素的槽位之間的差別來確定差別。
[0012] 7.如技術(shù)方案6所述的方法,其中,確定差別包括:確定第一要素的槽位與第二 要素的槽位之間的正字法差別。
[0013] 8.如技術(shù)方案7所述的方法,其中,正字法差別是基于與槽位相關(guān)聯(lián)的語言。
[0014] 9.如技術(shù)方案7所述的方法,其中,正字法差別是基于槽位的字母、數(shù)字、字符、 音素和音調(diào)中的至少一個(gè)。
[0015] 10.如技術(shù)方案6所述的方法,其中,確定差別包括:確定第一要素的槽位與第二 要素的槽位之間的置信度差別。
[0016] 11.如技術(shù)方案10所述的方法,其中,確定差別進(jìn)一步包括:確定第一要素的槽 位與第二要素的槽位之間的正字法差別。
[0017] 12.如技術(shù)方案6所述的方法,其中,所述分析進(jìn)一步包括:從所述差別中選擇最 大差別,并將歧義類型設(shè)定為與關(guān)聯(lián)于所述最大差別的槽位相關(guān)聯(lián)的槽位類型,并且其中 對用戶生成語音提示是基于歧義類型。
[0018] 13.如技術(shù)方案1所述的方法,其中,所述部分正字法是基于所確定的正字法差 別類型。
[0019] 14.如技術(shù)方案1所述的方法,其中,所述部分正字法是基于所確定的歧義類型。
[0020] 15.如技術(shù)方案1所述的方法,進(jìn)一步包括: 基于歧義來確定歧義類型; 基于歧義來確定差別類型;并且 其中,生成語音提示是基于所述歧義類型和所述差別類型。
[0021] 16.如技術(shù)方案1所述的方法,其中,接收第一表達(dá)是通過交通工具的人機(jī)界面 模塊。
[0022] 17. -種用于管理語音對話的語音系統(tǒng),包括: 第一模塊,其接收來自語音系統(tǒng)的用戶的第一表達(dá),并且確定來自第一表達(dá)的可能結(jié) 果的第一列表,其中第一列表包括至少兩個(gè)要素,每個(gè)要素表示一種可能結(jié)果; 第二模塊,其分析第一列表的所述至少兩個(gè)要素來確定要素的歧義;以及 第三模塊,其基于部分正字法和所述歧義來對用戶生成語音提示。
[0023] 18.如技術(shù)方案17所述的語音系統(tǒng),其中,所述第一模塊響應(yīng)于語音提示接收來 自用戶的第二表達(dá),其中所述第二模塊確定來自第二表達(dá)的可能結(jié)果的第二列表;并且其 中第四模塊基于第一列表和第二列表生成結(jié)果。
[0024] 19.如技術(shù)方案18所述的語音系統(tǒng),其中,所述第四模塊基于第一列表的可能結(jié) 果與第二列表的可能結(jié)果的比較來生成結(jié)果。
[0025] 20.如技術(shù)方案18所述的語音系統(tǒng),其中,所述第四模塊基于第二列表來更新語 音模型的語法;并使用語音模型的更新語法來生成結(jié)果。
【專利附圖】
【附圖說明】
[0026] 下面將結(jié)合以下附圖來描述示例性實(shí)施例,附圖中相似附圖標(biāo)記表示相似要素, 并且附圖中: 圖1是包括依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)的交通工具的功能框圖; 圖2是數(shù)據(jù)流圖,示出了依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng);并且 圖3-5是流程圖,示出了可以由依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)執(zhí)行的語音方 法。
【具體實(shí)施方式】
[0027] 以下詳細(xì)描述本質(zhì)上僅僅是示例性的,并不旨在限制應(yīng)用和用途。更進(jìn)一步,沒有 意圖被在前面的【技術(shù)領(lǐng)域】、【背景技術(shù)】、
【發(fā)明內(nèi)容】
或以下詳細(xì)描述中給出的任何明示或暗示 的理論限制。如本文中所使用的,術(shù)語模塊是指專用集成電路(ASIC)、電子電路、執(zhí)行一個(gè) 或多個(gè)軟件或固件程序的存儲器和處理器(共享、專用或分組)、組合邏輯電路、和/或提供 所描述功能的其它適當(dāng)部件。
[0028] 依據(jù)本公開的示例性實(shí)施例,語音系統(tǒng)10被示出為被包括在交通工具12內(nèi)。在多 個(gè)不同示例性實(shí)施例中,語音系統(tǒng)10通過人機(jī)界面(HMI)模塊14為一個(gè)或多個(gè)交通工具 系統(tǒng)提供語音識別或理解和對話。這類交通工具系統(tǒng)可以包括例如但不限于電話系統(tǒng)16、 導(dǎo)航系統(tǒng)18、媒體系統(tǒng)20、遠(yuǎn)程信息處理系統(tǒng)22、網(wǎng)絡(luò)系統(tǒng)24或可以包括依賴于語音的應(yīng) 用的任何其它交通工具系統(tǒng)。如能夠理解的,語音系統(tǒng)10的一個(gè)或多個(gè)實(shí)施例可適用于具 有依賴于語音的應(yīng)用的其它非交通工具系統(tǒng),因此并不局限于本交通工具示例。
[0029] 語音系統(tǒng)10通過通信總線和/或其它通信手段26 (例如,有線、短距離無線或長 距離無線)與多個(gè)交通工具系統(tǒng)14-24通信。通信總線可為例如但并不局限于控制器區(qū)域 網(wǎng)絡(luò)(CAN)總線、本地互連網(wǎng)絡(luò)(LIN)總線或任何其它類型的總線。
[0030] 語音系統(tǒng)10包括語音理解模塊32、對話管理器模塊34和語音生成模塊35。如能 夠理解的,語音理解模塊32、對話管理器模塊34和語音生成模塊35可以被實(shí)施為單獨(dú)的系 統(tǒng)和/或如所示的組合系統(tǒng)。一般而言,語音理解模塊32使用一個(gè)或多個(gè)語音識別技術(shù)來 接收和處理來自HMI模塊14的語音表達(dá)(speech utterance)。語音理解模塊32從語音表 達(dá)生成可能結(jié)果的一個(gè)或多個(gè)列表(例如,基于置信度閾值),并將列表發(fā)送至對話管理器 模塊34。在多個(gè)不同實(shí)施例中,語音理解模塊32使用存儲在數(shù)據(jù)庫中的預(yù)先限定的可能性 來生成列表。例如,預(yù)先限定的可能性可為存儲在電話薄中的名稱或號碼、存儲在地址簿中 的名稱或地址、存儲在音樂目錄中的歌曲名稱或藝人、等等。
[0031] 對話管理器模塊34管理交互序列和待基于列表說給用戶的語音提示的選擇。特 別地,當(dāng)列表包含多于一個(gè)的可能結(jié)果時(shí),對話管理器模塊34使用消除歧義策略來管理與 用戶的對話提示,使得能夠確定識別的結(jié)果。消除歧義策略有助于識別用戶目標(biāo),而不是識 別用戶正在說的準(zhǔn)確詞語。語音生成模塊35基于由對話管理器34確定的對話向用戶生成 發(fā)聲提示。
[0032] 現(xiàn)在參考圖2,數(shù)據(jù)流圖示出了依據(jù)多個(gè)不同示例性實(shí)施例的語音理解模塊32和 對話管理器模塊34。如能夠理解的,根據(jù)本公開的語音理解模塊32和對話管理器模塊34 的多個(gè)不同示例性實(shí)施例可以包括任意數(shù)量的子模塊。在多個(gè)不同示例性實(shí)施例中,圖2 中示出的子模塊可以被組合和/或被進(jìn)一步劃分,用以使用消除歧義策略來類似地管理對 話。在多個(gè)不同示例性實(shí)施例中,對話管理器模塊34包括列表分析器模塊40、歧義辨識符 模塊42、提示管理器模塊44和結(jié)果確定模塊45。語音理解模塊32包括識別器模塊46。
[0033] 參考語音理解模塊32,識別器模塊46接收作為輸入的來自用戶的語音表達(dá)47 (例 如,通過HMI模塊14 (圖1))。識別器模塊46使用一個(gè)或多個(gè)語音模型來處理語音表達(dá) 47,用以確定可能結(jié)果的列表50。列表50包括表示處理過程的可能結(jié)果的一個(gè)或多個(gè)要素 (element)。在多個(gè)不同實(shí)施例中,列表的每個(gè)要素包括一個(gè)或多個(gè)槽位(slot),其各自與 取決于應(yīng)用的槽位類型相關(guān)聯(lián)。例如,如果應(yīng)用支持打電話給電話薄聯(lián)系人(例如,"呼叫 John Doe"),則每個(gè)要素可以包括具有名、中間名和/或姓氏的槽位類型的槽位。在另一示 例中,如果應(yīng)用支持導(dǎo)航(例如,"去往陽光大街1111號(1111 Sunshine Boulevard)"), 則每個(gè)要素可以包括具有門牌號碼、和街道名稱等的槽位類型的槽位。在多個(gè)不同實(shí)施例 中,槽位和槽位類型可以被存儲在數(shù)據(jù)庫中,并由識別器模塊46訪問。列表50的每個(gè)要素 或槽位與作為處理過程的結(jié)果被確定的置信度得分(confidence score)相關(guān)聯(lián)。
[0034] 現(xiàn)在參考對話管理器模塊34,列表評價(jià)器模塊40接收作為輸入的來自語音理解 模塊32的列表50。列表評價(jià)器模塊40評價(jià)列表50,用以確定是否需要消除歧義。例如, 當(dāng)列表50包含多于一個(gè)的要素時(shí),列表分析器模塊40選擇被列表用于由歧義辨識符模塊 42進(jìn)一步處理,被稱為選擇列表52。當(dāng)列表50只包含一個(gè)要素或是響應(yīng)于語音提示56 (如 將論述的)被接收的時(shí),列表評價(jià)器模塊40將該列表作為更新列表62提供至結(jié)果確定模 塊45。如能夠理解的,在多個(gè)不同實(shí)施例中,當(dāng)列表50只包含一個(gè)要素并且相關(guān)聯(lián)的置信 度得分低時(shí),列表50可以被選擇用于進(jìn)一步處理。然而,為了示例性目的,將在包含多于一 個(gè)的要素的選擇列表52的背景中論述本公開。
[0035] 歧義辨識符模塊42接收作為輸入的選擇列表52。歧義辨識符模塊42處理選擇列 表52的要素,用以辨識要素之間的歧義。歧義辨識器模塊42基于要素之間的歧義而生成 歧義類型54。例如,歧義類型可基于歧義要素的槽位類型(例如,名、姓氏、街道名稱、街道 號碼等)。
[0036] 歧義辨識器模塊42通過辨識具有特定槽位類型的要素的槽位之間的歧義來辨識 要素之間的歧義。例如,對于要素中的槽位的數(shù)量,歧義辨識器模塊42處理要素的第一槽 位來辨識任何歧義,然后處理要素的第二槽位來辨識任何歧義,以此類推。在多個(gè)不同實(shí)施 例中,歧義辨識器模塊42辨識選擇列表52中的前Μ名的要素之間的歧義,其中Μ是大于2 的整數(shù)。例如,歧義辨識器模塊42處理選擇列表52的前兩名要素的槽位來辨識歧義,其中 要素基于相關(guān)聯(lián)的置信度得分被排名為前兩名。
[0037] 歧義辨識器模塊42進(jìn)一步通過確定特定槽位類型的槽位之間的差別來辨識要素 之間的歧義。在多個(gè)不同實(shí)施例中,歧義辨識器模塊42基于槽位的正字法(orthography) 來確定差別。例如,槽位的正字法可根據(jù)與槽位相關(guān)聯(lián)的語言,口語或書面均可。歧義辨識 器模塊42評價(jià)正字法的一個(gè)或多個(gè)方面來確定差別(例如,字母、數(shù)字、字符、音素、音調(diào) 等)。當(dāng)歧義辨識器模塊42基于槽位的正字法來辨識歧義時(shí),差別類型55得以生成,其辨 識正字法的方面(例如,字母、數(shù)字、字符、音素、音調(diào)等),其辨識差別。
[0038] 例如,對于要素中的所有槽位,歧義辨識器模塊42比較要素的(例如前Μ名要素 的)第一槽位來確定各第一槽位之間的正字法差別,比較要素的第二槽位來確定各第二槽 位之間的正字法差別,以此類推。具有最大正字法差別的要素的槽位被辨識為歧義槽位。與 歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。正字法的被辨識為最大差別的方面被選 擇為差別類型55。
[0039] 在多個(gè)不同實(shí)施例中,歧義辨識器模塊42通過確定與槽位或要素相關(guān)聯(lián)的置信 度得分的差別來確定要素之間的歧義。例如,對于要素中的所有槽位,歧義辨識器模塊42 比較要素的(例如前Μ名要素的)第一槽位的置信度得分來確定置信度差別,比較要素的 第二槽位的置信度得分來確定置信度差別,以此類推。要素的具有最小置信度差別的槽位 被辨識為歧義槽位,并且與歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。當(dāng)歧義辨識 器模塊42基于與槽位相關(guān)聯(lián)的置信度來辨識歧義時(shí),差別類型55被設(shè)定為預(yù)定值,例如, 基于與槽位相關(guān)聯(lián)的正字法。
[0040] 在再一些實(shí)施例中,歧義辨識器模塊42基于槽位的正字法和置信度得分來辨識 要素之間的歧義。例如,對于要素中的所有槽位,歧義辨識器模塊42比較要素的(例如前Μ 名要素的)第一槽位的置信度得分來確定置信度差別,比較要素的第二槽位的置信度得分 來確定置信度差別,以此類推。要素的具有最小置信度差別的槽位被辨識為歧義槽位,并且 與歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。歧義辨識器模塊42然后確定與最小 置信度差別相關(guān)聯(lián)的槽位之間的正字法差別,并基于正字法差別來設(shè)定差別類型55。如能 夠理解的,歧義辨識器模塊42可按其它方式來使用槽位的正字法和置信度得分兩者,因此 并不局限于本示例。
[0041] 提示管理器模塊44接收作為輸入的歧義類型54和差別類型55。提示管理器模塊 44基于選擇的歧義類型54和差別類型55來生成語音提示56。在多個(gè)不同實(shí)施例中,語音 提示56基于部分正字法來得以生成。例如,語音提示56要求用戶拼出/說出歧義類型54 的差別類型55的X數(shù)。例如,如果所辨識的歧義類型54是姓氏并且所辨識的差別類型55 是字母,則提示管理器模塊44生成語音提示,其包括"請拼出姓氏的前三個(gè)字母"、"請拼出 姓氏的最后四個(gè)字母"、"請拼出姓氏的數(shù)個(gè)字母"等等。在另一示例中,如果歧義類型54是 街道號碼并且差別類型55是數(shù)字,則提示管理器模塊44生成語音提示,其包括:"請說出街 道號碼的前三個(gè)數(shù)字"、"請說出街道號碼最后三個(gè)數(shù)字"、"請說出街道號碼的數(shù)個(gè)數(shù)字"等 等。如能夠理解的,數(shù)X可被預(yù)先限定,或可基于槽位之間的所確定的正字法差別來確定。
[0042] 結(jié)果確定模塊45接收作為輸入的更新列表62和/或選擇列表52。結(jié)果確定模塊 45基于選擇列表52和/或更新列表62來確定結(jié)果64。在多個(gè)不同實(shí)施例中,結(jié)果確定模 塊45通過融合選擇列表52與更新列表62來確定結(jié)果64。例如,結(jié)果確定模塊45融合(或 組合)選擇列表52和更新列表62的要素和要素的置信度得分來生成融合列表。例如,如 果選擇列表52包含與更新列表62的要素相同的要素,則該要素的置信度得分被組合(例 如,通過加法或一些其它計(jì)算),并且該要素以組合的置信度得分被添加至融合列表。然后 評價(jià)融合列表的置信度得分來確定結(jié)果64。
[0043] 在多個(gè)不同的其它實(shí)施例中,結(jié)果確定模塊45使用更新列表62來更新被使用來 對初始語音表達(dá)和/或?qū)碚Z音表達(dá)執(zhí)行語音識別或理解的語音模型的語法65。例如,可 使用更新的語法從初始語音表達(dá)的語音識別來確定結(jié)果64。
[0044] 現(xiàn)在參考圖3-5,這些流程圖示出了可以由依據(jù)多個(gè)不同示例性實(shí)施例的語音系 統(tǒng)10執(zhí)行的語音方法。如鑒于本公開能夠理解的,方法內(nèi)的操作順序并不局限于如圖3-5 中示出的順次執(zhí)行,而是可以按照應(yīng)用和依據(jù)本公開以一個(gè)或多個(gè)變化的順序來執(zhí)行。如 能夠進(jìn)一步理解的,方法的一個(gè)或多個(gè)步驟可以被添加或去除,而不改變方法的精神。
[0045] 如圖所示,方法可以在步驟99處開始。在步驟100處接收語音表達(dá)47。在步驟110 處,對語音表達(dá)47執(zhí)行一種或多種語音識別方法來確定結(jié)果的列表50。例如,如果語音表 達(dá)是"呼叫Scott Rothestein",則名稱可能不被直接識別,并且對于"Scott Rothestein" 的可能結(jié)果的列表50被生成(例如,從地址簿中列出的名稱)。在一個(gè)示例中,列表50的 前三名要素包括"Scott Austin"、"Scott Rothstein" 和"Tom Rothman"。如能夠理解的, 方法將在本示例的背景中被論述,但是并不局限于此。
[0046] 由于列表50包含多于一個(gè)的要素,所以列表50被選擇為選擇列表52,用于在步 驟120處進(jìn)行進(jìn)一步處理。在步驟125處確定列表的歧義。例如,在步驟130處確定差別。 假定以上的示例性列表,槽位基于第一詞語和第二詞語,并且槽位類型是名和姓。對于名 的槽位的差別是基于與名相關(guān)聯(lián)的槽位之間的正字法差別和/或置信度差別來確定的;并 且對于姓氏的槽位的差別是基于與姓氏相關(guān)聯(lián)的槽位的正字法差別和/或置信度差別來 確定的。例如,對于名的正字法差別在"Scott"與"Scott"以及"Scott"與"Tom"之間確 定;對于姓氏的正字法差別在"Austin"與"Rothstein"、"Rothstein"與"Rothman"以及 "Rothman" 與 "Austin" 之間確定。
[0047] 然后,在步驟140處將歧義類型54設(shè)定為槽位的具有最大差別的槽位類型,并在 步驟150處將差別類型55設(shè)定為正字法的具有最大差別的方面。在提供的示例中,姓氏是 具有最大差別的槽位類型,并且姓氏的最后一個(gè)音節(jié)是正字法的具有最大差別的方面。在 步驟160處,基于歧義類型54和差別類型55生成語音提示56。例如,語音提示56可以包 括"請拼出姓氏的最后幾個(gè)字母"。
[0048] 然后,在步驟100處以接收第二語音表達(dá)47來繼續(xù)方法。在步驟110處,對第二 語音表達(dá)47執(zhí)行一種或多種語音識別方法來確定結(jié)果的第二列表50。由于該列表是響應(yīng) 于語音提示56接收到的,所以在步驟120處將列表50設(shè)定為更新列表62,并且不進(jìn)一步做 歧義的處理。在步驟180處,如以上所描述的,使用列表52、62的融合或基于更新列表62 更新語法,來基于選擇列表52和/或更新列表62生成結(jié)果64。例如,如圖4中示出的,結(jié) 果64通過以下方式生成:通過在步驟190處融合列表52、62,其又是通過在步驟200處將 列表52、62的要素和置信度得分組合成單個(gè)融合列表,在步驟210處基于置信度得分對融 合列表進(jìn)行分類,并在步驟220處將分類了的融合列表的首位要素選擇為結(jié)果64。
[0049] 在另一示例中,如圖5中示出的,結(jié)果64基于在步驟230處從更新列表62確定的 更新語法來生成,方法是通過:在步驟240處使用更新列表62來生成更新語法,在步驟250 處使用更新語法生成更新列表來對第一語音表達(dá)47執(zhí)行語音識別,并在步驟260處將更新 列表的首位要素(或首位置信度得分)選擇為結(jié)果64。
[0050] 返回參考圖3,當(dāng)在步驟180處確定結(jié)果64之后,可以在步驟270處結(jié)束方法。
[0051] 如能夠理解的,方法可以對于任意數(shù)量的語音表達(dá)47進(jìn)行重復(fù),因?yàn)椴襟E120處 的標(biāo)準(zhǔn)可基于列表中的要素的數(shù)量、可基于對語音提示56的響應(yīng)的數(shù)量或任何其它標(biāo)準(zhǔn)。 如能夠進(jìn)一步理解的,在對至少兩個(gè)語音表達(dá)的處理之后,如果要素的歧義仍然存在,則可 以執(zhí)行其它方法來確定結(jié)果。
[0052] 雖然在前述詳細(xì)描述中給出了至少一個(gè)示例性實(shí)施例,但是應(yīng)該理解的是存在大 量的變型。還應(yīng)該理解的是:一個(gè)示例性實(shí)施例或多個(gè)示例性實(shí)施例只是示例,并不旨在以 任何方式限制本公開的范圍、適用性或構(gòu)造。相反,前述詳細(xì)描述將為本領(lǐng)域技術(shù)人員提供 便利的線路圖來實(shí)施一個(gè)示例性實(shí)施例或多個(gè)示例性實(shí)施例。應(yīng)該明白的是:可在要素的 功能和配置中做出各種變化,而不背離如在所附權(quán)利要求及其法律等同方案中闡述的本公 開的范圍。
【權(quán)利要求】
1. 一種用于管理語音系統(tǒng)的語音對話的方法,包括: 接收來自語音系統(tǒng)的用戶的第一表達(dá); 確定來自第一表達(dá)的可能結(jié)果的第一列表,其中第一列表包括至少兩個(gè)要素,每個(gè)要 素表示一種可能結(jié)果; 分析第一列表的所述至少兩個(gè)要素來確定要素的歧義;以及 基于部分正字法和所述歧義來對用戶生成語音提示。
2. 如權(quán)利要求1所述的方法,進(jìn)一步包括: 響應(yīng)于語音提示接收來自用戶的第二表達(dá); 確定來自第二表達(dá)的可能結(jié)果的第二列表;以及 基于第一列表和第二列表生成結(jié)果。
3. 如權(quán)利要求2所述的方法,其中,基于第一列表的可能結(jié)果與第二列表的可能結(jié)果 的融合來生成結(jié)果。
4. 如權(quán)利要求2所述的方法,進(jìn)一步包括: 基于第二列表更新語音模型的語法;以及 使用語音模型的更新語法來生成結(jié)果。
5. 如權(quán)利要求1所述的方法,其中,所述分析包括:分析第一列表的所述至少兩個(gè)要 素來確定所述至少兩個(gè)要素之間的差別。
6. 如權(quán)利要求5所述的方法,其中,所述分析進(jìn)一步包括:確定第一列表的第一要素 的槽位與第二要素的槽位之間的差別來確定差別。
7. 如權(quán)利要求6所述的方法,其中,確定差別包括:確定第一要素的槽位與第二要素 的槽位之間的正字法差別。
8. 如權(quán)利要求7所述的方法,其中,正字法差別是基于與槽位相關(guān)聯(lián)的語言。
9. 如權(quán)利要求7所述的方法,其中,正字法差別是基于槽位的字母、數(shù)字、字符、音素 和音調(diào)中的至少一個(gè)。
10. -種用于管理語音對話的語音系統(tǒng),包括: 第一模塊,其接收來自語音系統(tǒng)的用戶的第一表達(dá),并且確定來自第一表達(dá)的可能結(jié) 果的第一列表,其中第一列表包括至少兩個(gè)要素,每個(gè)要素表示一種可能結(jié)果; 第二模塊,其分析第一列表的所述至少兩個(gè)要素來確定要素的歧義;以及 第三模塊,其基于部分正字法和所述歧義來對用戶生成語音提示。
【文檔編號】G10L15/22GK104112448SQ201310747386
【公開日】2014年10月22日 申請日期:2013年12月31日 優(yōu)先權(quán)日:2013年4月19日
【發(fā)明者】E.茨爾克爾-漢科克, G.塔爾瓦, X.趙, G.T.林德曼 申請人:通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司