多遍車輛語音識(shí)別系統(tǒng)和方法
【專利說明】多遍車輛語音識(shí)別系統(tǒng)和方法
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求享有于2012年6月22日遞交的、標(biāo)題為“Mult1-pass Vehicle VoiceRecognit1n Systems and Methods) ”的美國臨時(shí)專利申請(qǐng)?zhí)?1/663,423的權(quán)益和優(yōu)先權(quán),其公開內(nèi)容通過引用全部并入本文。
【背景技術(shù)】
[0003]本發(fā)明總體上涉及基于車輛的語音識(shí)別系統(tǒng)和方法的領(lǐng)域。
[0004]—些語音識(shí)別系統(tǒng)嘗試來識(shí)別大量的詞語、短語或名稱。開發(fā)為用戶提供高精確度以及快速響應(yīng)時(shí)間的感覺的語音識(shí)別系統(tǒng)是具有挑戰(zhàn)性的并且是困難的。使用大量的詞匯導(dǎo)致更慢的語音識(shí)別的響應(yīng)時(shí)間。傳統(tǒng)的語音識(shí)別系統(tǒng)嘗試通過給用戶提示命令或任務(wù)的離散片段(例如,“哪個(gè)州? ”,“哪個(gè)城市? ”等)來加快所感知的響應(yīng)時(shí)間。
【發(fā)明內(nèi)容】
[0005]本公開的一個(gè)實(shí)施例涉及用于車輛的語音識(shí)別系統(tǒng)。該語音識(shí)別系統(tǒng)包括用于接收來自用戶的話語的麥克風(fēng)。該語音識(shí)別系統(tǒng)還包括存儲(chǔ)器,所述存儲(chǔ)器包括用于語音識(shí)別的命令或名稱的部分集合,以及用于語音識(shí)的命令或名稱的較大集合。該語音識(shí)別系統(tǒng)還包括與所述麥克風(fēng)和所述存儲(chǔ)器通信的處理電子器件。處理電子器件可以被配置為處理所接收到的話語以獲得話語數(shù)據(jù)。處理電子器件進(jìn)一步被配置為使用所獲得的話語數(shù)據(jù)進(jìn)行至少兩遍語音識(shí)別。在第一遍中,將話語數(shù)據(jù)與所述部分集合進(jìn)行比較。在第二遍中,將話語數(shù)據(jù)與所述較大集合進(jìn)行比較。
[0006]本公開的另一實(shí)施例涉及用于由用于車輛的語音識(shí)別系統(tǒng)所使用的計(jì)算機(jī)化的方法。該方法包括在麥克風(fēng)處接收來自用戶的話語。該方法進(jìn)一步包括從存儲(chǔ)器加載命令或名稱的部分集合。該方法進(jìn)一步包括通過將所述接收到的話語的表示與所加載的命令或名稱的部分集合進(jìn)行比較來進(jìn)行第一遍語音識(shí)別。該方法還包括當(dāng)獲得滿足或超過第一置信度水平的匹配時(shí)做出語音識(shí)別決定。該方法還包括,當(dāng)在所述第一遍語音識(shí)別中沒有獲得匹配時(shí),通過將所接收到的話語的表示與命令或名稱的完整集合進(jìn)行比較來進(jìn)行第二遍語音識(shí)別,完整集合大于部分集合。該方法進(jìn)一步包括以下中的至少一個(gè):輸出來自第一遍語音識(shí)別的匹配的指示或來自第二遍語音識(shí)別的匹配的指示以供用戶確認(rèn),以及基于來自第一遍語音識(shí)別的匹配或來自第二遍語音識(shí)別的匹配來執(zhí)行車輛功能。
【附圖說明】
[0007]根據(jù)以下結(jié)合附圖的詳細(xì)描述將更充分地理解本公開,在附圖中類似的附圖標(biāo)記指代類似的元件,其中:
[0008]圖1A是根據(jù)示例性實(shí)施例的具有語音識(shí)別系統(tǒng)的車輛透視圖;
[0009]圖1B是根據(jù)示例性實(shí)施例的圖1A中的語音識(shí)別系統(tǒng)的框圖;
[0010]圖2是根據(jù)示例性實(shí)施例的用于進(jìn)行多遍語音識(shí)別的過程的流程圖;
[0011]圖3A是根據(jù)示例性實(shí)施例的諸如圖1B中所示的用戶便攜式設(shè)備的框圖;以及
[0012]圖3B是根據(jù)示例性實(shí)施例的諸如圖1B中所示的用戶便攜式設(shè)備的框圖,其中所述設(shè)備被配置為還與遠(yuǎn)程服務(wù)器通信。根據(jù)各個(gè)示例性實(shí)施例,圖1B中的車輛語音識(shí)別系統(tǒng),圖1B、圖3A和圖3B所示的用戶便攜式設(shè)備以及圖3B中的遠(yuǎn)程服務(wù)器可以組合以形成一個(gè)系統(tǒng)。
【具體實(shí)施方式】
[0013]大體上參照附圖,示出根據(jù)示例性實(shí)施例的用于車輛的語音識(shí)別系統(tǒng)。該語音識(shí)別系統(tǒng)能通過在第一遍語音識(shí)別中將所接收到的話語(例如,表示話語的數(shù)據(jù))與語法的所選定的小集合(例如,語音命令、名稱、語音標(biāo)簽、收藏的地點(diǎn),收藏的聯(lián)系人等)進(jìn)行比較以提供更快的話語識(shí)別。如果第一遍成功,則該系統(tǒng)的感知速度是非??斓?。如果第一遍不成功,則系統(tǒng)將使用可能語法的較大集合(或完整集合)(例如,完整的地址簿、完整的電話簿、完整的命令列表等)來進(jìn)行第二遍。
[0014]在示例性實(shí)施例中,用于車輛的語音識(shí)別系統(tǒng)包括用于接收來自用戶的話語的麥克風(fēng)。該系統(tǒng)還包括存儲(chǔ)器,所述存儲(chǔ)器具有用于語音識(shí)別的命令或名稱的部分集合。該存儲(chǔ)器還包括用于語音識(shí)的命令或名稱的較大集合。該系統(tǒng)還包括與所述麥克風(fēng)和所述存儲(chǔ)器通信的處理電子器件。處理電子器件被配置為處理所接收到的話語以獲得話語數(shù)據(jù)。處理電子器件進(jìn)一步被配置為使用所獲得的話語數(shù)據(jù)進(jìn)行至少兩遍語音識(shí)別。在第一遍中,話語數(shù)據(jù)與部分集合進(jìn)行比較。在第二遍中,話語數(shù)據(jù)與較大集合進(jìn)行比較。
[0015]存儲(chǔ)器相對(duì)于處理電子器件可以是在本地的(例如,是處理電子器件一部分或本地地耦合到處理電子器件)。當(dāng)確定在第一遍中是否存在匹配時(shí)處理電子器件可以要求第一置信度水平,而當(dāng)確定在第二遍中是否存在匹配時(shí)處理電子器件可以要求第二置信度水平。當(dāng)在第一遍中滿足或超過所要求的第一置信度水平時(shí)處理電子器件可被配置為跳過第二遍。處理電子器件可被配置為基于在麥克風(fēng)處所接收到的或在用戶輸入設(shè)備處所接收的用戶反饋來適應(yīng)性地更新所述第一置信度水平。對(duì)于第一遍的不同置信度水平和不同的命令或名稱的部分集合可與車輛的不同用戶或不同的用戶設(shè)備相關(guān)聯(lián)。用于語音識(shí)別的命令或名稱的部分集合可包括以下中的至少一個(gè):(a)命令的部分集合、(b)語音標(biāo)簽的部分集合、和(C)用戶特定的收藏聯(lián)系人或用戶特定的收藏電話簿名稱的集合。在其它實(shí)施例中,用于語音識(shí)別的命令或名稱的部分集合可包括以下中的至少一個(gè):(a)最常用命令的集合、(b)最常用語音標(biāo)簽的集合、和(C)最常用聯(lián)系人或電話簿名稱的集合。處理電子器件可進(jìn)一步被配置為隨著命令或名稱的使用頻率發(fā)生變化而更新第一遍中的用于語音識(shí)別的命令或名稱的部分集合。
[0016]本發(fā)明的另一實(shí)施例涉及用于由用于車輛的語音識(shí)別系統(tǒng)所使用的計(jì)算機(jī)化的方法。該方法包括在麥克風(fēng)處接收來自用戶的話語。該方法進(jìn)一步包括從存儲(chǔ)器加載命令或名稱的部分集合并且通過將所述接收到的話語的表示與所加載的命令或名稱的部分集合進(jìn)行比較來進(jìn)行第一遍語音識(shí)別。接著,該方法包括當(dāng)獲得滿足或超過第一置信度水平的匹配時(shí)做出語音識(shí)別的決定。當(dāng)在所述第一遍語音識(shí)別中沒有獲得匹配時(shí),通過將所接收到的話語的表示與命令或名稱的完整集合進(jìn)行比較來進(jìn)行第二遍語音識(shí)別。完整集合大于部分集合。該方法進(jìn)一步包括以下中的至少一個(gè):(a)輸出來自第一遍語音識(shí)別的匹配的指示或來自第二遍語音識(shí)別的匹配的指示以供用戶確認(rèn),以及(b)基于來自第一遍語音識(shí)別的匹配或來自第二遍語音識(shí)別的匹配來執(zhí)行車輛功能。
[0017]在一個(gè)優(yōu)選的實(shí)施例中,在沒有來自遠(yuǎn)程系統(tǒng)的輔助的情況下進(jìn)行第一遍和第二遍,并且從對(duì)于語音識(shí)別系統(tǒng)在本地的存儲(chǔ)器來加載部分集合和完整集合。在其它實(shí)施例中,可從本地存儲(chǔ)器加載部分集合,而從另一設(shè)備(例如,移動(dòng)電話,平板計(jì)算機(jī)等)接收更完整的集合。
[0018]在示例性實(shí)施例中,第二置信度水平用于將所接收到的話語的表示與命令或名稱的完整集合進(jìn)行比較。第一置信度水平和第二置信度水平可以是不同的。第一置信度水平可高于所述第二置信度水平。該方法可包括基于在所述麥克風(fēng)處所接收到的或在用戶輸入設(shè)備處所接收到的用戶反饋來適應(yīng)地更新第一置信度水平。適應(yīng)性地更新可包括響應(yīng)于指示第一遍結(jié)果不正確的用戶反饋來提高第一置信度水平。適應(yīng)性地更新可進(jìn)一步包括響應(yīng)于指示第一遍的結(jié)果正確的用戶反饋來降低第一置信度水平。該方法可進(jìn)一步包括針對(duì)語音識(shí)別系統(tǒng)的多個(gè)不同的用戶或用戶設(shè)備中的每一個(gè)保持不同的命令或名稱的部分集合。用于語音識(shí)別的命令或名稱的部分集合包括以下中的至少一個(gè):(a)最常用命令的集合、(b)最常用語音標(biāo)簽的集合、和(C)最常用聯(lián)系人或電話簿名稱的集合。該方法可進(jìn)一步包括隨著命令或名稱的使用頻率發(fā)生變化而更新第一遍中的用于語音識(shí)別的命令或名稱的部分集合。
[0019]參照?qǐng)D1A和圖1B,本發(fā)明的實(shí)施例涉及用于車輛100的語音識(shí)別系統(tǒng)102。語音識(shí)別系統(tǒng)102被示出為車輛100的一部分。語音識(shí)別系統(tǒng)102包括麥克風(fēng)128。語音識(shí)別系統(tǒng)102或耦合的車輛系統(tǒng)還可包括被耦合到語音識(shí)別系統(tǒng)102的收發(fā)器130。語音識(shí)別系統(tǒng)102可包括或被耦合到任意數(shù)量的顯示器(例如,IXD顯示器、觸摸屏顯示器等)或任意數(shù)量的用戶界面元件(例如,按鈕、開關(guān)、用于選擇的觸摸屏元件、撥號(hào)盤、操縱桿、安裝在方向盤上的控制器件等)。車輛100的車輛電子系統(tǒng)(語音識(shí)別系統(tǒng)102為其組件)可包括通信功能(例如,藍(lán)牙電話連接,車庫門通信系統(tǒng),例如由Johnson Controls出售的H0MELINK等),用戶的舒適和便利功能,安全功能,諸如無線電的娛樂功能,或其它用戶界面功能。
[0020]在不同的實(shí)施例中,語音識(shí)別系統(tǒng)102可以是各種車輛系統(tǒng)的一部分或跨各種車輛系統(tǒng)分布。例如,語音識(shí)別系統(tǒng)102可以是車輛導(dǎo)航系統(tǒng)的一部分或獨(dú)立設(shè)備的一部分,所述獨(dú)立設(shè)備可將輸入和輸出提供到車輛子系統(tǒng),例如車輛導(dǎo)航系統(tǒng)、車輛HVAC系統(tǒng)、車輛無線電系統(tǒng)等。所有這樣的架構(gòu)以及它們的組合都在本公開的范圍之內(nèi)。權(quán)利要求書可呈現(xiàn)于該申請(qǐng)或隨后的申請(qǐng)中以將本發(fā)明縮窄到任何一個(gè)實(shí)施例或一組實(shí)施例。
[0021]語音識(shí)別系統(tǒng)包括處理電子器件104。處理電子器件104被示出為包括處理器106和存儲(chǔ)器108。處理器106可被實(shí)現(xiàn)為通用處理器、專用集成電路(ASIC)、一個(gè)或多個(gè)現(xiàn)場(chǎng)可編程門陣列(FPGA)、一組處理組件或其它合適的電子處理組件。處理電子器件104可包括