用于管理語音系統(tǒng)的對話的方法和系統(tǒng)的制作方法

文檔序號：2826581閱讀：368來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于管理語音系統(tǒng)的對話的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及用于管理語音系統(tǒng)的對話的方法和系統(tǒng)。方法和系統(tǒng)被提供來用于管理語音系統(tǒng)的語音對話。在一個(gè)實(shí)施例中，一種方法包括：接收來自語音系統(tǒng)的用戶的第一表達(dá)；確定來自第一表達(dá)的可能結(jié)果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及基于部分正字法和所述歧義來對用戶生成語音提示。
【專利說明】用于管理語音系統(tǒng)的對話的方法和系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本【技術(shù)領(lǐng)域】主要涉及語音系統(tǒng)，并且更特別地涉及用于使用部分正字法（partial orthography)來管理語音系統(tǒng)內(nèi)的對話的方法和系統(tǒng)。

【背景技術(shù)】
[0002] 交通工具語音識別系統(tǒng)對由交通工具的乘員發(fā)出的語音執(zhí)行語音識別或理解。語音表達(dá)通常包括指令，其通信于或控制交通工具的一個(gè)或多個(gè)特征或可由交通工具訪問的其它系統(tǒng)。語音對話系統(tǒng)響應(yīng)于語音表達(dá)生成語音指令。在一些情況下，響應(yīng)于語音識別生成語音指令，需要進(jìn)一步的信息以便執(zhí)行語音識別。例如，語音指令可以要求用戶重復(fù)語音表達(dá)，或者可以要求用戶從可能性的列表中進(jìn)行選擇。這類語音指令可能是笨拙的，難以理解，或者可能不能解決識別問題。
[0003] 因此，希望的是提供改善的方法和系統(tǒng)來管理語音對話用以改善語音識別。因此，進(jìn)一步希望的是提供方法和系統(tǒng)來使用部分正字法管理語音對話用以改善語音識別。更進(jìn) 一步，從后續(xù)詳細(xì)描述和所附權(quán)利要求書，結(jié)合附圖和前述【技術(shù)領(lǐng)域】和【背景技術(shù)】來理解，本發(fā)明的其它所需特征和特性將變得清楚明了。

【發(fā)明內(nèi)容】

[0004] 方法和系統(tǒng)被提供來用于管理語音系統(tǒng)的語音對話。在一個(gè)實(shí)施例中，一種方法包括：接收來自語音系統(tǒng)的用戶的第一表達(dá)；確定來自第一表達(dá)的可能結(jié)果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及基于部分正字法和所述歧義來對用戶生成語音提示。
[0005] 在另一實(shí)施例中，一種系統(tǒng)包括：第一模塊，其接收來自語音系統(tǒng)的用戶的第一表達(dá)，并且確定來自第一表達(dá)的可能結(jié)果的第一列表。第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果。第二模塊分析第一列表的所述至少兩個(gè)要素來確定要素的歧義。第三模塊基于部分正字法和所述歧義來對用戶生成語音提示。
[0006] 本發(fā)明還提供以下技術(shù)方案： 1. 一種用于管理語音系統(tǒng)的語音對話的方法，包括：接收來自語音系統(tǒng)的用戶的第一表達(dá)；確定來自第一表達(dá)的可能結(jié)果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及基于部分正字法和所述歧義來對用戶生成語音提示。
[0007] 2.如技術(shù)方案1所述的方法，進(jìn)一步包括：響應(yīng)于語音提示接收來自用戶的第二表達(dá)；確定來自第二表達(dá)的可能結(jié)果的第二列表；以及基于第一列表和第二列表生成結(jié)果。
[0008] 3.如技術(shù)方案2所述的方法，其中，基于第一列表的可能結(jié)果與第二列表的可能結(jié)果的融合來生成結(jié)果。
[0009] 4.如技術(shù)方案2所述的方法，進(jìn)一步包括：基于第二列表更新語音模型的語法；以及使用語音模型的更新語法來生成結(jié)果。
[0010] 5.如技術(shù)方案1所述的方法，其中，所述分析包括：分析第一列表的所述至少兩個(gè)要素來確定所述至少兩個(gè)要素之間的差別。
[0011] 6.如技術(shù)方案5所述的方法，其中，所述分析進(jìn)一步包括：確定第一列表的第一要素的槽位與第二要素的槽位之間的差別來確定差別。
[0012] 7.如技術(shù)方案6所述的方法，其中，確定差別包括：確定第一要素的槽位與第二要素的槽位之間的正字法差別。
[0013] 8.如技術(shù)方案7所述的方法，其中，正字法差別是基于與槽位相關(guān)聯(lián)的語言。
[0014] 9.如技術(shù)方案7所述的方法，其中，正字法差別是基于槽位的字母、數(shù)字、字符、音素和音調(diào)中的至少一個(gè)。
[0015] 10.如技術(shù)方案6所述的方法，其中，確定差別包括：確定第一要素的槽位與第二要素的槽位之間的置信度差別。
[0016] 11.如技術(shù)方案10所述的方法，其中，確定差別進(jìn)一步包括：確定第一要素的槽位與第二要素的槽位之間的正字法差別。
[0017] 12.如技術(shù)方案6所述的方法，其中，所述分析進(jìn)一步包括：從所述差別中選擇最大差別，并將歧義類型設(shè)定為與關(guān)聯(lián)于所述最大差別的槽位相關(guān)聯(lián)的槽位類型，并且其中對用戶生成語音提示是基于歧義類型。
[0018] 13.如技術(shù)方案1所述的方法，其中，所述部分正字法是基于所確定的正字法差別類型。
[0019] 14.如技術(shù)方案1所述的方法，其中，所述部分正字法是基于所確定的歧義類型。
[0020] 15.如技術(shù)方案1所述的方法，進(jìn)一步包括：基于歧義來確定歧義類型；基于歧義來確定差別類型；并且其中，生成語音提示是基于所述歧義類型和所述差別類型。
[0021] 16.如技術(shù)方案1所述的方法，其中，接收第一表達(dá)是通過交通工具的人機(jī)界面模塊。
[0022] 17. -種用于管理語音對話的語音系統(tǒng)，包括：第一模塊，其接收來自語音系統(tǒng)的用戶的第一表達(dá)，并且確定來自第一表達(dá)的可能結(jié) 果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；第二模塊，其分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及第三模塊，其基于部分正字法和所述歧義來對用戶生成語音提示。
[0023] 18.如技術(shù)方案17所述的語音系統(tǒng)，其中，所述第一模塊響應(yīng)于語音提示接收來自用戶的第二表達(dá)，其中所述第二模塊確定來自第二表達(dá)的可能結(jié)果的第二列表；并且其中第四模塊基于第一列表和第二列表生成結(jié)果。
[0024] 19.如技術(shù)方案18所述的語音系統(tǒng)，其中，所述第四模塊基于第一列表的可能結(jié) 果與第二列表的可能結(jié)果的比較來生成結(jié)果。
[0025] 20.如技術(shù)方案18所述的語音系統(tǒng)，其中，所述第四模塊基于第二列表來更新語音模型的語法；并使用語音模型的更新語法來生成結(jié)果。

【專利附圖】

【附圖說明】
[0026] 下面將結(jié)合以下附圖來描述示例性實(shí)施例，附圖中相似附圖標(biāo)記表示相似要素，并且附圖中：圖1是包括依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)的交通工具的功能框圖；圖2是數(shù)據(jù)流圖，示出了依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)；并且圖3-5是流程圖，示出了可以由依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)執(zhí)行的語音方法。

【具體實(shí)施方式】
[0027] 以下詳細(xì)描述本質(zhì)上僅僅是示例性的，并不旨在限制應(yīng)用和用途。更進(jìn)一步，沒有意圖被在前面的【技術(shù)領(lǐng)域】、【背景技術(shù)】、
【發(fā)明內(nèi)容】
或以下詳細(xì)描述中給出的任何明示或暗示的理論限制。如本文中所使用的，術(shù)語模塊是指專用集成電路（ASIC)、電子電路、執(zhí)行一個(gè) 或多個(gè)軟件或固件程序的存儲器和處理器（共享、專用或分組）、組合邏輯電路、和/或提供所描述功能的其它適當(dāng)部件。
[0028] 依據(jù)本公開的示例性實(shí)施例，語音系統(tǒng)10被示出為被包括在交通工具12內(nèi)。在多個(gè)不同示例性實(shí)施例中，語音系統(tǒng)10通過人機(jī)界面（HMI)模塊14為一個(gè)或多個(gè)交通工具系統(tǒng)提供語音識別或理解和對話。這類交通工具系統(tǒng)可以包括例如但不限于電話系統(tǒng)16、導(dǎo)航系統(tǒng)18、媒體系統(tǒng)20、遠(yuǎn)程信息處理系統(tǒng)22、網(wǎng)絡(luò)系統(tǒng)24或可以包括依賴于語音的應(yīng) 用的任何其它交通工具系統(tǒng)。如能夠理解的，語音系統(tǒng)10的一個(gè)或多個(gè)實(shí)施例可適用于具有依賴于語音的應(yīng)用的其它非交通工具系統(tǒng)，因此并不局限于本交通工具示例。
[0029] 語音系統(tǒng)10通過通信總線和/或其它通信手段26 (例如，有線、短距離無線或長距離無線）與多個(gè)交通工具系統(tǒng)14-24通信。通信總線可為例如但并不局限于控制器區(qū)域網(wǎng)絡(luò)（CAN)總線、本地互連網(wǎng)絡(luò)（LIN)總線或任何其它類型的總線。
[0030] 語音系統(tǒng)10包括語音理解模塊32、對話管理器模塊34和語音生成模塊35。如能夠理解的，語音理解模塊32、對話管理器模塊34和語音生成模塊35可以被實(shí)施為單獨(dú)的系統(tǒng)和/或如所示的組合系統(tǒng)。一般而言，語音理解模塊32使用一個(gè)或多個(gè)語音識別技術(shù)來接收和處理來自HMI模塊14的語音表達(dá)（speech utterance)。語音理解模塊32從語音表達(dá)生成可能結(jié)果的一個(gè)或多個(gè)列表（例如，基于置信度閾值），并將列表發(fā)送至對話管理器模塊34。在多個(gè)不同實(shí)施例中，語音理解模塊32使用存儲在數(shù)據(jù)庫中的預(yù)先限定的可能性來生成列表。例如，預(yù)先限定的可能性可為存儲在電話薄中的名稱或號碼、存儲在地址簿中的名稱或地址、存儲在音樂目錄中的歌曲名稱或藝人、等等。
[0031] 對話管理器模塊34管理交互序列和待基于列表說給用戶的語音提示的選擇。特別地，當(dāng)列表包含多于一個(gè)的可能結(jié)果時(shí)，對話管理器模塊34使用消除歧義策略來管理與用戶的對話提示，使得能夠確定識別的結(jié)果。消除歧義策略有助于識別用戶目標(biāo)，而不是識別用戶正在說的準(zhǔn)確詞語。語音生成模塊35基于由對話管理器34確定的對話向用戶生成發(fā)聲提示。
[0032] 現(xiàn)在參考圖2,數(shù)據(jù)流圖示出了依據(jù)多個(gè)不同示例性實(shí)施例的語音理解模塊32和對話管理器模塊34。如能夠理解的，根據(jù)本公開的語音理解模塊32和對話管理器模塊34 的多個(gè)不同示例性實(shí)施例可以包括任意數(shù)量的子模塊。在多個(gè)不同示例性實(shí)施例中，圖2 中示出的子模塊可以被組合和/或被進(jìn)一步劃分，用以使用消除歧義策略來類似地管理對話。在多個(gè)不同示例性實(shí)施例中，對話管理器模塊34包括列表分析器模塊40、歧義辨識符模塊42、提示管理器模塊44和結(jié)果確定模塊45。語音理解模塊32包括識別器模塊46。
[0033] 參考語音理解模塊32,識別器模塊46接收作為輸入的來自用戶的語音表達(dá)47 (例如，通過HMI模塊14 (圖1))。識別器模塊46使用一個(gè)或多個(gè)語音模型來處理語音表達(dá) 47,用以確定可能結(jié)果的列表50。列表50包括表示處理過程的可能結(jié)果的一個(gè)或多個(gè)要素 (element)。在多個(gè)不同實(shí)施例中，列表的每個(gè)要素包括一個(gè)或多個(gè)槽位（slot)，其各自與取決于應(yīng)用的槽位類型相關(guān)聯(lián)。例如，如果應(yīng)用支持打電話給電話薄聯(lián)系人（例如，"呼叫 John Doe")，則每個(gè)要素可以包括具有名、中間名和/或姓氏的槽位類型的槽位。在另一示例中，如果應(yīng)用支持導(dǎo)航（例如，"去往陽光大街1111號（1111 Sunshine Boulevard)"），則每個(gè)要素可以包括具有門牌號碼、和街道名稱等的槽位類型的槽位。在多個(gè)不同實(shí)施例中，槽位和槽位類型可以被存儲在數(shù)據(jù)庫中，并由識別器模塊46訪問。列表50的每個(gè)要素或槽位與作為處理過程的結(jié)果被確定的置信度得分（confidence score)相關(guān)聯(lián)。
[0034] 現(xiàn)在參考對話管理器模塊34,列表評價(jià)器模塊40接收作為輸入的來自語音理解模塊32的列表50。列表評價(jià)器模塊40評價(jià)列表50,用以確定是否需要消除歧義。例如，當(dāng)列表50包含多于一個(gè)的要素時(shí)，列表分析器模塊40選擇被列表用于由歧義辨識符模塊 42進(jìn)一步處理，被稱為選擇列表52。當(dāng)列表50只包含一個(gè)要素或是響應(yīng)于語音提示56 (如將論述的）被接收的時(shí)，列表評價(jià)器模塊40將該列表作為更新列表62提供至結(jié)果確定模塊45。如能夠理解的，在多個(gè)不同實(shí)施例中，當(dāng)列表50只包含一個(gè)要素并且相關(guān)聯(lián)的置信度得分低時(shí)，列表50可以被選擇用于進(jìn)一步處理。然而，為了示例性目的，將在包含多于一個(gè)的要素的選擇列表52的背景中論述本公開。
[0035] 歧義辨識符模塊42接收作為輸入的選擇列表52。歧義辨識符模塊42處理選擇列表52的要素，用以辨識要素之間的歧義。歧義辨識器模塊42基于要素之間的歧義而生成歧義類型54。例如，歧義類型可基于歧義要素的槽位類型（例如，名、姓氏、街道名稱、街道號碼等）。
[0036] 歧義辨識器模塊42通過辨識具有特定槽位類型的要素的槽位之間的歧義來辨識要素之間的歧義。例如，對于要素中的槽位的數(shù)量，歧義辨識器模塊42處理要素的第一槽位來辨識任何歧義，然后處理要素的第二槽位來辨識任何歧義，以此類推。在多個(gè)不同實(shí)施例中，歧義辨識器模塊42辨識選擇列表52中的前Μ名的要素之間的歧義，其中Μ是大于2 的整數(shù)。例如，歧義辨識器模塊42處理選擇列表52的前兩名要素的槽位來辨識歧義，其中要素基于相關(guān)聯(lián)的置信度得分被排名為前兩名。
[0037] 歧義辨識器模塊42進(jìn)一步通過確定特定槽位類型的槽位之間的差別來辨識要素之間的歧義。在多個(gè)不同實(shí)施例中，歧義辨識器模塊42基于槽位的正字法（orthography) 來確定差別。例如，槽位的正字法可根據(jù)與槽位相關(guān)聯(lián)的語言，口語或書面均可。歧義辨識器模塊42評價(jià)正字法的一個(gè)或多個(gè)方面來確定差別（例如，字母、數(shù)字、字符、音素、音調(diào) 等）。當(dāng)歧義辨識器模塊42基于槽位的正字法來辨識歧義時(shí)，差別類型55得以生成，其辨識正字法的方面（例如，字母、數(shù)字、字符、音素、音調(diào)等），其辨識差別。
[0038] 例如，對于要素中的所有槽位，歧義辨識器模塊42比較要素的（例如前Μ名要素的）第一槽位來確定各第一槽位之間的正字法差別，比較要素的第二槽位來確定各第二槽位之間的正字法差別，以此類推。具有最大正字法差別的要素的槽位被辨識為歧義槽位。與歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。正字法的被辨識為最大差別的方面被選擇為差別類型55。
[0039] 在多個(gè)不同實(shí)施例中，歧義辨識器模塊42通過確定與槽位或要素相關(guān)聯(lián)的置信度得分的差別來確定要素之間的歧義。例如，對于要素中的所有槽位，歧義辨識器模塊42 比較要素的（例如前Μ名要素的）第一槽位的置信度得分來確定置信度差別，比較要素的第二槽位的置信度得分來確定置信度差別，以此類推。要素的具有最小置信度差別的槽位被辨識為歧義槽位，并且與歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。當(dāng)歧義辨識器模塊42基于與槽位相關(guān)聯(lián)的置信度來辨識歧義時(shí)，差別類型55被設(shè)定為預(yù)定值，例如，基于與槽位相關(guān)聯(lián)的正字法。
[0040] 在再一些實(shí)施例中，歧義辨識器模塊42基于槽位的正字法和置信度得分來辨識要素之間的歧義。例如，對于要素中的所有槽位，歧義辨識器模塊42比較要素的（例如前Μ 名要素的）第一槽位的置信度得分來確定置信度差別，比較要素的第二槽位的置信度得分來確定置信度差別，以此類推。要素的具有最小置信度差別的槽位被辨識為歧義槽位，并且與歧義槽位相關(guān)聯(lián)的槽位類型被選擇為歧義類型54。歧義辨識器模塊42然后確定與最小置信度差別相關(guān)聯(lián)的槽位之間的正字法差別，并基于正字法差別來設(shè)定差別類型55。如能夠理解的，歧義辨識器模塊42可按其它方式來使用槽位的正字法和置信度得分兩者，因此并不局限于本示例。
[0041] 提示管理器模塊44接收作為輸入的歧義類型54和差別類型55。提示管理器模塊 44基于選擇的歧義類型54和差別類型55來生成語音提示56。在多個(gè)不同實(shí)施例中，語音提示56基于部分正字法來得以生成。例如，語音提示56要求用戶拼出/說出歧義類型54 的差別類型55的X數(shù)。例如，如果所辨識的歧義類型54是姓氏并且所辨識的差別類型55 是字母，則提示管理器模塊44生成語音提示，其包括"請拼出姓氏的前三個(gè)字母"、"請拼出姓氏的最后四個(gè)字母"、"請拼出姓氏的數(shù)個(gè)字母"等等。在另一示例中，如果歧義類型54是街道號碼并且差別類型55是數(shù)字，則提示管理器模塊44生成語音提示，其包括："請說出街道號碼的前三個(gè)數(shù)字"、"請說出街道號碼最后三個(gè)數(shù)字"、"請說出街道號碼的數(shù)個(gè)數(shù)字"等等。如能夠理解的，數(shù)X可被預(yù)先限定，或可基于槽位之間的所確定的正字法差別來確定。
[0042] 結(jié)果確定模塊45接收作為輸入的更新列表62和/或選擇列表52。結(jié)果確定模塊 45基于選擇列表52和/或更新列表62來確定結(jié)果64。在多個(gè)不同實(shí)施例中，結(jié)果確定模塊45通過融合選擇列表52與更新列表62來確定結(jié)果64。例如，結(jié)果確定模塊45融合（或組合）選擇列表52和更新列表62的要素和要素的置信度得分來生成融合列表。例如，如果選擇列表52包含與更新列表62的要素相同的要素，則該要素的置信度得分被組合（例如，通過加法或一些其它計(jì)算），并且該要素以組合的置信度得分被添加至融合列表。然后評價(jià)融合列表的置信度得分來確定結(jié)果64。
[0043] 在多個(gè)不同的其它實(shí)施例中，結(jié)果確定模塊45使用更新列表62來更新被使用來對初始語音表達(dá)和/或?qū)碚Z音表達(dá)執(zhí)行語音識別或理解的語音模型的語法65。例如，可使用更新的語法從初始語音表達(dá)的語音識別來確定結(jié)果64。
[0044] 現(xiàn)在參考圖3-5,這些流程圖示出了可以由依據(jù)多個(gè)不同示例性實(shí)施例的語音系統(tǒng)10執(zhí)行的語音方法。如鑒于本公開能夠理解的，方法內(nèi)的操作順序并不局限于如圖3-5 中示出的順次執(zhí)行，而是可以按照應(yīng)用和依據(jù)本公開以一個(gè)或多個(gè)變化的順序來執(zhí)行。如能夠進(jìn)一步理解的，方法的一個(gè)或多個(gè)步驟可以被添加或去除，而不改變方法的精神。
[0045] 如圖所示，方法可以在步驟99處開始。在步驟100處接收語音表達(dá)47。在步驟110 處，對語音表達(dá)47執(zhí)行一種或多種語音識別方法來確定結(jié)果的列表50。例如，如果語音表達(dá)是"呼叫Scott Rothestein"，則名稱可能不被直接識別，并且對于"Scott Rothestein" 的可能結(jié)果的列表50被生成（例如，從地址簿中列出的名稱）。在一個(gè)示例中，列表50的前三名要素包括"Scott Austin"、"Scott Rothstein" 和"Tom Rothman"。如能夠理解的，方法將在本示例的背景中被論述，但是并不局限于此。
[0046] 由于列表50包含多于一個(gè)的要素，所以列表50被選擇為選擇列表52,用于在步驟120處進(jìn)行進(jìn)一步處理。在步驟125處確定列表的歧義。例如，在步驟130處確定差別。假定以上的示例性列表，槽位基于第一詞語和第二詞語，并且槽位類型是名和姓。對于名的槽位的差別是基于與名相關(guān)聯(lián)的槽位之間的正字法差別和/或置信度差別來確定的；并且對于姓氏的槽位的差別是基于與姓氏相關(guān)聯(lián)的槽位的正字法差別和/或置信度差別來確定的。例如，對于名的正字法差別在"Scott"與"Scott"以及"Scott"與"Tom"之間確定；對于姓氏的正字法差別在"Austin"與"Rothstein"、"Rothstein"與"Rothman"以及 "Rothman" 與 "Austin" 之間確定。
[0047] 然后，在步驟140處將歧義類型54設(shè)定為槽位的具有最大差別的槽位類型，并在步驟150處將差別類型55設(shè)定為正字法的具有最大差別的方面。在提供的示例中，姓氏是具有最大差別的槽位類型，并且姓氏的最后一個(gè)音節(jié)是正字法的具有最大差別的方面。在步驟160處，基于歧義類型54和差別類型55生成語音提示56。例如，語音提示56可以包括"請拼出姓氏的最后幾個(gè)字母"。
[0048] 然后，在步驟100處以接收第二語音表達(dá)47來繼續(xù)方法。在步驟110處，對第二語音表達(dá)47執(zhí)行一種或多種語音識別方法來確定結(jié)果的第二列表50。由于該列表是響應(yīng) 于語音提示56接收到的，所以在步驟120處將列表50設(shè)定為更新列表62,并且不進(jìn)一步做歧義的處理。在步驟180處，如以上所描述的，使用列表52、62的融合或基于更新列表62 更新語法，來基于選擇列表52和/或更新列表62生成結(jié)果64。例如，如圖4中示出的，結(jié) 果64通過以下方式生成：通過在步驟190處融合列表52、62,其又是通過在步驟200處將列表52、62的要素和置信度得分組合成單個(gè)融合列表，在步驟210處基于置信度得分對融合列表進(jìn)行分類，并在步驟220處將分類了的融合列表的首位要素選擇為結(jié)果64。
[0049] 在另一示例中，如圖5中示出的，結(jié)果64基于在步驟230處從更新列表62確定的更新語法來生成，方法是通過：在步驟240處使用更新列表62來生成更新語法，在步驟250 處使用更新語法生成更新列表來對第一語音表達(dá)47執(zhí)行語音識別，并在步驟260處將更新列表的首位要素（或首位置信度得分）選擇為結(jié)果64。
[0050] 返回參考圖3,當(dāng)在步驟180處確定結(jié)果64之后，可以在步驟270處結(jié)束方法。
[0051] 如能夠理解的，方法可以對于任意數(shù)量的語音表達(dá)47進(jìn)行重復(fù)，因?yàn)椴襟E120處的標(biāo)準(zhǔn)可基于列表中的要素的數(shù)量、可基于對語音提示56的響應(yīng)的數(shù)量或任何其它標(biāo)準(zhǔn)。如能夠進(jìn)一步理解的，在對至少兩個(gè)語音表達(dá)的處理之后，如果要素的歧義仍然存在，則可以執(zhí)行其它方法來確定結(jié)果。
[0052] 雖然在前述詳細(xì)描述中給出了至少一個(gè)示例性實(shí)施例，但是應(yīng)該理解的是存在大量的變型。還應(yīng)該理解的是：一個(gè)示例性實(shí)施例或多個(gè)示例性實(shí)施例只是示例，并不旨在以任何方式限制本公開的范圍、適用性或構(gòu)造。相反，前述詳細(xì)描述將為本領(lǐng)域技術(shù)人員提供便利的線路圖來實(shí)施一個(gè)示例性實(shí)施例或多個(gè)示例性實(shí)施例。應(yīng)該明白的是：可在要素的功能和配置中做出各種變化，而不背離如在所附權(quán)利要求及其法律等同方案中闡述的本公開的范圍。
【權(quán)利要求】
1. 一種用于管理語音系統(tǒng)的語音對話的方法，包括：接收來自語音系統(tǒng)的用戶的第一表達(dá)；確定來自第一表達(dá)的可能結(jié)果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及基于部分正字法和所述歧義來對用戶生成語音提示。
2. 如權(quán)利要求1所述的方法，進(jìn)一步包括：響應(yīng)于語音提示接收來自用戶的第二表達(dá)；確定來自第二表達(dá)的可能結(jié)果的第二列表；以及基于第一列表和第二列表生成結(jié)果。
3. 如權(quán)利要求2所述的方法，其中，基于第一列表的可能結(jié)果與第二列表的可能結(jié)果的融合來生成結(jié)果。
4. 如權(quán)利要求2所述的方法，進(jìn)一步包括：基于第二列表更新語音模型的語法；以及使用語音模型的更新語法來生成結(jié)果。
5. 如權(quán)利要求1所述的方法，其中，所述分析包括：分析第一列表的所述至少兩個(gè)要素來確定所述至少兩個(gè)要素之間的差別。
6. 如權(quán)利要求5所述的方法，其中，所述分析進(jìn)一步包括：確定第一列表的第一要素的槽位與第二要素的槽位之間的差別來確定差別。
7. 如權(quán)利要求6所述的方法，其中，確定差別包括：確定第一要素的槽位與第二要素的槽位之間的正字法差別。
8. 如權(quán)利要求7所述的方法，其中，正字法差別是基于與槽位相關(guān)聯(lián)的語言。
9. 如權(quán)利要求7所述的方法，其中，正字法差別是基于槽位的字母、數(shù)字、字符、音素和音調(diào)中的至少一個(gè)。
10. -種用于管理語音對話的語音系統(tǒng)，包括：第一模塊，其接收來自語音系統(tǒng)的用戶的第一表達(dá)，并且確定來自第一表達(dá)的可能結(jié) 果的第一列表，其中第一列表包括至少兩個(gè)要素，每個(gè)要素表示一種可能結(jié)果；第二模塊，其分析第一列表的所述至少兩個(gè)要素來確定要素的歧義；以及第三模塊，其基于部分正字法和所述歧義來對用戶生成語音提示。
【文檔編號】G10L15/22GK104112448SQ201310747386
【公開日】2014年10月22日申請日期:2013年12月31日優(yōu)先權(quán)日:2013年4月19日
【發(fā)明者】E.茨爾克爾-漢科克, G.塔爾瓦, X.趙, G.T.林德曼申請人:通用汽車環(huán)球科技運(yùn)作有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載