專利名稱:使用聲音相關(guān)的車輛信息以增強語音識別的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用例如與聲音相關(guān)的車輛信息,信號處理,以及其他操作或信息的組合增強車輛語音識別。
背景技術(shù):
許多車輛裝備有語音對話,語音致動,或語音控制的車輛系統(tǒng)。語音對話系統(tǒng)可以基于言語命令執(zhí)行功能,提供信息,和/或提供響應(yīng)。語音對話系統(tǒng)可以將來自麥克風(fēng)的聲音(例如,由車輛乘客發(fā)出的言語)處理或轉(zhuǎn)換為音頻信號。語音識別可以應(yīng)用到音頻信號,并且識別的言語可以由語義解釋器處理?;谘哉Z命令的解釋,諸如對話控制系統(tǒng)的系統(tǒng)可以執(zhí)行動作,產(chǎn)生響應(yīng),或執(zhí)行其他功能。響應(yīng)可以是例如視頻信號,音頻信號,文本至語音信號,由車輛系統(tǒng)進(jìn)行的動作,或?qū)囕v乘客的其他通知的形式。聲音命令的清楚和辨識能力可以影響語音激活車輛系統(tǒng)的功能。然而麥克風(fēng)在減小聲音命令的清晰度的情況下會經(jīng)常接收與言語和非言語相關(guān)的聲音的信號。與非言語相關(guān)的聲音可以包括車輛相關(guān)的噪音(例如,發(fā)動機噪音,冷卻系統(tǒng)噪音等),非車輛相關(guān)的噪音(例如,車輛外部的噪音),音頻系統(tǒng)聲音(例如,音樂,廣播相關(guān)聲音),以及其他聲音。非言語相關(guān)的聲音可能經(jīng)常大于言語命令,勝過和/或曲解言語命令。因此,如果非言語相關(guān)的聲音曲解言語命令,則語音識別系統(tǒng)或方法可能不能正確地運作。類似地,系統(tǒng),例如對話控制系統(tǒng)的精確度在對言語命令產(chǎn)生響應(yīng)時可以被非言語相關(guān)的聲音減小。非言語相關(guān)的聲音,例如,可以曲解或勝過文本至通話響應(yīng),音頻,以及從語音對話系統(tǒng)和/或其他系統(tǒng)輸出的其他信號。因此,需要基于與聲音或聲學(xué)相關(guān)的車輛信息以增強語音識別,對話控制,和/或言語提示系統(tǒng)的系統(tǒng)或方法。
發(fā)明內(nèi)容
在與車輛相關(guān)的處理器中可以接收音頻信號。表不一個或多個聲音的聲音相關(guān)車輛信息可以由處理器接收。聲音相關(guān)車輛信息可以或可以不包括音頻信號?;诼曇粝嚓P(guān)車輛信息可以修改語音識別處理或系統(tǒng)。本發(fā)明還提供了以下方案:
1.一種方法,包括:
在與車輛相關(guān)聯(lián)的處理器中接收音頻信號;
在處理器中接收表不一個或多個聲音的聲音相關(guān)的車輛信息,聲音相關(guān)的車輛信息不包括音頻信號;以及
基于聲音相關(guān)的車輛信息修改語音識別處理。2.如方案I所述的方法,包括基于聲音相關(guān)的車輛信息確定干擾曲線記錄。3.如方案2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及
應(yīng)用濾波器至音頻信號。
4.如方案2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄選擇聲學(xué)模型;以及
使用聲學(xué)模型解碼言語。5.如方案2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄確定自動語音識別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動語音識別模塊前端中的音頻信號。6.如方案2所述的方法,其中基于聲音相關(guān)的車輛信息確定干擾曲線記錄包括基于多種類型的聲音相關(guān)的車輛信息使用邏輯操作確定干擾曲線記錄。7.如方案I所述的方法,包括:
在增強語音識別功能中基于聲音相關(guān)的車輛信息測量語音識別修改的成功;以及 基于測量的成功適用語音識別修改。8.如方案I所述的方法,包括:
對音頻信號中的言語命令產(chǎn)生響應(yīng);以及 對車輛乘員輸出響應(yīng)。9.一種系統(tǒng),包括:
存儲器;
與車輛相關(guān)聯(lián)的處理器,其用于:
接收音頻信號;
接收表不一個或多個聲音的聲音相關(guān)的車輛信息,聲音相關(guān)的車輛信息不包括音頻信號;以及
基于聲音相關(guān)的車輛信息修改語音識別處理。10.如方案9所述的系統(tǒng),其中處理器用于基于聲音相關(guān)的車輛信息確定干擾曲線記錄。11.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車輛信息修改語音識別處理,該處理器用于:
基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及 應(yīng)用濾波器至音頻信號。12.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車輛信息修改語音識別處理,該處理器用于:
基于干擾曲線記錄選擇聲學(xué)模型;以及 使用聲學(xué)模型解碼言語。13.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車輛信息修改語音識別處理,該處理器用于:
基于干擾曲線記錄確定自動語音識別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動語音識別模塊前端中的音頻信號。14.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車輛信息確定干擾曲線記錄,該處理器用于通過量化聲音相關(guān)的車輛信息確定干擾曲線記錄。15.如方案10所述的系統(tǒng),其中為了基于聲音相關(guān)的車輛信息確定干擾曲線記錄,該處理器用于使用表格確定干擾曲線記錄。
16.如方案9所述的系統(tǒng),其中處理器用于:
在增強語音識別功能中基于聲音相關(guān)的車輛信息測量語音識別修改的成功;以及 基于測量的成功適用語音識別修改。17 —種方法,包括:
使用一個或多個與車輛相關(guān)聯(lián)的麥克風(fēng)測量聲音;
將表示聲音的信號傳送至自動語音識別系統(tǒng);
在控制器接收與引起聲音的車輛系統(tǒng)的操作相關(guān)的信息;
基于信息計算干擾曲線記錄,干擾曲線記錄表示噪音類型和噪音水平;以及 基于干擾曲線記錄改變語音識別。18.如方案17所述的方法,其中基于干擾曲線記錄改變語音識別包括:
基于干擾曲線記錄選擇濾波器和濾波器設(shè)置;以及
應(yīng)用濾波器至信號。19.如方案17所述的方法,其中基于干擾曲線記錄改變語音識別包括:
基于干擾曲線記錄確定聲學(xué)模型;以及
使用聲學(xué)模型解碼信號中的言語。20.如方案17所述的方法,其中基于干擾曲線記錄改變語音識別包括: 基于干擾曲線記錄選擇自動語音識別系統(tǒng)前端中的濾波器;以及
使用自動語音識別系統(tǒng)前端中的濾波器濾波信號。
在說明書的總結(jié)部分中尤其指出并且清楚地要求保護(hù)的是看作本發(fā)明的主題。然而,當(dāng)結(jié)合附圖閱讀時,通過參照以下詳細(xì)描述可以最佳地理解本發(fā)明的組成以及操作方法,以及其目標(biāo),特征,和優(yōu)點。圖1是根據(jù)本發(fā)明的實施例的具有自動語音識別系統(tǒng)的車輛的示意 圖2是根據(jù)本發(fā)明的實施例的自動語音識別系統(tǒng)的示意 圖3是根據(jù)本發(fā)明的實施例的語音對話系統(tǒng)的方框 圖4是根據(jù)本發(fā)明的實施例的自動語音識別系統(tǒng)的方框 圖5是根據(jù)本發(fā)明的實施例的語音對話促使系統(tǒng)的方框 圖6是根據(jù)本發(fā)明的實施例的語音對話系統(tǒng)的方框圖;以及 圖7是根據(jù)本發(fā)明的實施例的方法的流程圖。將要理解,為簡單和清楚地示出,附圖中所示的元件不必須按比例繪制。例如,為了清楚,一些元件的尺寸可以相對于其他元件放大。此外,認(rèn)為合適的話,在附圖中附圖標(biāo)記可以重復(fù)以表示對應(yīng)或類似的元件。
具體實施例方式在以下的詳細(xì)描述中,為了提供本發(fā)明的實施例的徹底理解,闡述了許多的細(xì)節(jié)。然而,本領(lǐng)域技術(shù)人員將要理解的是,在沒有這些具體細(xì)節(jié)的情況下可以實施本發(fā)明的實施例。在其他示例中,公知的方法,過程,部件,以及電路沒有具體描述,以免使本發(fā)明不清
/E.0
除非以其他方式具體地指出,否則從以下討論中清楚的是,整個說明書討論中適用的諸如“處理”,“計算”,“存儲”,“確定”等術(shù)語,表示計算機或計算系統(tǒng),或類似的電子計算裝置的動作和/或處理,其將對表示為計算系統(tǒng)的寄存器和/或存儲器內(nèi)的物理(諸如電子)量的數(shù)據(jù)進(jìn)行操作和/或轉(zhuǎn)換為類似表示為計算系統(tǒng)的存儲器,寄存器或其他這樣的信息存儲,傳輸或顯示裝置內(nèi)的物理量的其他數(shù)據(jù)。本發(fā)明的實施例可以使用聲音相關(guān)的車輛信息(例如,車輛系統(tǒng)上的信息,其涉及車輛中的聲音,但本身不包括聲音信號或記錄或音頻信號或記錄),涉及產(chǎn)生或引起聲音的車輛系統(tǒng)操作的信號或信息,聲學(xué)相關(guān)的車輛信息,或干擾聲音信息(例如,表示窗戶位置,發(fā)動機每分鐘轉(zhuǎn)數(shù)(RPM),車輛速度,加熱通風(fēng)與制冷(HVAC)系統(tǒng)風(fēng)扇設(shè)置,音頻水平,或其他參數(shù)的數(shù)據(jù));外部聲音測量;以及其他信息以增強語音識別,促進(jìn)使用,例如語音對話,對話控制,和/或其他的語音對話系統(tǒng)或方法。提示例如可以是從語音對話系統(tǒng)輸出到使用者的信息,言語,或其他的音頻信號。聲音或聲學(xué)相關(guān)的車輛信息本身可以不包括聲音信號。例如,聲音或聲學(xué)相關(guān)的信息可以表不發(fā)動機RPM (例如包括其上的信息),但不是表不發(fā)動機產(chǎn)生的聲音的信號。聲音或聲學(xué)相關(guān)的信息可以表不窗戶打開(或打開一定量)的事實(例如包括其上的信息),而不是表示風(fēng)通過打開的窗戶所產(chǎn)生的聲音。聲音相關(guān)的車輛信息可以表示或包括描述車輛或車輛系統(tǒng)的狀態(tài)的車輛參數(shù)。產(chǎn)生或引起聲音的與車輛系統(tǒng)操作相關(guān)的聲音相關(guān)的車輛信息或信號或信息可以用來產(chǎn)生干擾曲線記錄(IPR)。干擾曲線記錄例如可以包括噪音或聲音類型參數(shù),噪音水平或聲音強度參數(shù),及其他信息。(在一些實施例中,聲音相關(guān)的車輛信息可以包括噪聲類型參數(shù)和/或噪聲水平參數(shù)。)噪聲類型參數(shù)例如可以表示或基于一種聲音相關(guān)的車輛信息(例如,發(fā)動機RPM,HVAC風(fēng)扇設(shè)置,窗戶位置,音頻重放水平,車輛速度,或其他信息)或聲音相關(guān)車輛信息的類型的組合。例如,噪聲類型參數(shù)可以包括窗戶是否打開或打開多少的指示(但不包括表示風(fēng)聲的信號)。噪聲水平參數(shù)可以表示聲音強度水平相關(guān)的車輛信息(例如,HVAC風(fēng)扇設(shè)置聞,中,低,或關(guān)閉;首頻重放水平聞,中,低,或關(guān)閉;或其他聲首相關(guān)的車輛信息)或聲音相關(guān)的車輛信息的組合(例如,打開窗戶和閾值速度以上的速度可以表示為風(fēng)的噪聲類型參數(shù)和高的噪音水平參數(shù))。例如,噪聲水平參數(shù)可以包括風(fēng)扇是否運行或運行多少的指示(但不包括表示風(fēng)扇的聲音的信號)。在一些實施例中,干擾曲線記錄可以是或可以包括整數(shù)(例如,8位整數(shù)或其他類型的整數(shù)),百分比,一個范圍的值,或其他數(shù)據(jù)或信息。在一些實施例中,干擾曲線記錄(例如,噪聲類型參數(shù),噪聲水平參數(shù)和/或其他參數(shù))可以用來增強語音識別。干擾曲線記錄例如可以由語音識別系統(tǒng)或處理(例如,包括信號處理器,自動語音識別(ASR)系統(tǒng),或其他系統(tǒng)或方法)使用從而修改或改變聲音信號以提高語音識別系統(tǒng)或處理解碼。在一個示例中,信號處理器,ASR,或其他系統(tǒng)可以基于干擾曲線記錄(例如,噪聲類型參數(shù)和噪聲水平參數(shù)),應(yīng)用預(yù)訓(xùn)練的濾波器(例如,Weiner濾波器,梳狀濾波器,或其他電子信號濾波器)從而修改或改變輸入信號以限制或除去噪音并且提高語音識別。例如,基于噪聲類型參數(shù)可以應(yīng)用一種類型的預(yù)訓(xùn)練濾波器,并且基于噪聲水平參數(shù)濾波器設(shè)置或參數(shù)可以確定和/或應(yīng)用。濾波器設(shè)置或參數(shù)例如可以控制或表示濾波器的量或水平或濾波,濾波的頻率,或濾波器的其他屬性。濾波的水平(例如,濾波的量),濾波的頻率,以及濾波器的其他屬性例如可以基于可以表示窗戶位置(例如,窗戶打開了多少的百分比)的噪聲水平參數(shù),發(fā)動機每分鐘轉(zhuǎn)數(shù)(RPM),車輛速度,環(huán)境控制風(fēng)扇設(shè)置,音頻重放水平,或其他車輛參數(shù)。例如,如果噪聲水平參數(shù)表示高水平的噪音而不是低水平的噪音,濾波的更高水平或量而不是低水平可以應(yīng)用到輸入信號中。當(dāng)然可以使用濾波器水平和噪聲水平參數(shù)的不同組合??梢允褂闷渌盘柼幚矸椒ê?或模塊。在一個示例中,基于干擾曲線記錄(例如,噪聲類型參數(shù)和噪聲水平參數(shù)),ASR或其他系統(tǒng)可以應(yīng)用預(yù)訓(xùn)練聲學(xué)模型以改進(jìn)語音識別?;诟蓴_曲線記錄(例如,噪聲類型參數(shù),噪聲水平參數(shù),和/或其他參數(shù))可以選擇一種預(yù)訓(xùn)練聲學(xué)模型(例如,在多個聲學(xué)模型中)。在一些實施例中,一種聲學(xué)模型可以對應(yīng)于一個或多個干擾曲線記錄。例如,基于聲音相關(guān)的車輛信息如果產(chǎn)生了預(yù)定的干擾曲線記錄,則可以使用預(yù)定聲學(xué)模型。根據(jù)一些實施例,基于干擾曲線記錄可以適用語音識別處理的變型。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來適用或改變信號修改參數(shù)(例如,濾波器參數(shù)或其他參數(shù)),適用或訓(xùn)練聲學(xué)模型變換矩陣,適用或改變使用哪個預(yù)訓(xùn)練的聲學(xué)模型,或適用語音對話系統(tǒng)的其他特征。在適用操作中,信號修改參數(shù)的效果例如可以通過確定在識別言語中(例如,字,句,以及言語的其他部分)的語音識別系統(tǒng)的ASR或其他部件的成功或有效性進(jìn)行監(jiān)控或測量?;谠摐y量,信號修改參數(shù)例如可以適用或改變以改進(jìn)語音識別和語音對話系統(tǒng)的功能或成功。在一個示例中,基于給定組的噪音類型參數(shù)和噪音水平參數(shù)可以應(yīng)用以給定組濾波器參數(shù)操作的預(yù)定濾波器(例如,Weiner濾波器,梳狀濾波器,或其他的濾波器)?;谠胍纛愋蛥?shù)和噪音水平參數(shù),適用模塊例如可以測量以給定組參數(shù)操作的濾波器在增強或改進(jìn)語音識別中是如何有效或成功的?;谠摐y量,濾波器參數(shù)可以適用或改變以改進(jìn)或增強語音識別??梢赃m用其他的信號修改參數(shù)。在一些實施例中,干擾曲線記錄(例如,噪音類型參數(shù),噪音水平參數(shù),和/或其他的參數(shù))可以由文本至言語,音頻處理,或其他模塊或方法進(jìn)行使用以增強言語提示或語音對話,音頻輸出,或典型地至乘客的其他的音頻信號輸出?;谠胍纛愋蛥?shù),噪音水平參數(shù),和/或其他的參數(shù),音頻處理模塊或其他的系統(tǒng)例如可以增加或減小提示水平,成形或重新成形提示頻譜,修改提示程度,或以其他方式改變提示。音頻處理模塊例如可以增加音頻輸出音量水平,成形或重新成形音頻頻譜(例如,音頻重放頻譜),修改音頻重放程度,和/或以其他方式改變音頻或聲音?;谠胍纛愋蛥?shù),噪音水平參數(shù),和/或其他參數(shù),文本至言語模塊或其他系統(tǒng)例如可以修改或改變言語速率,音節(jié)持續(xù)時間,或其他的言語相關(guān)的參數(shù)。根據(jù)一些實施例,可以適用基于干擾曲線記錄的言語提示,音頻輸出,或其他音頻信號輸出的修改。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來適用或改變與增加或降低提示水平相關(guān)的參數(shù),用于成形或重新成形提示頻譜的參數(shù),用來修改提示程度的參數(shù),和/或其他參數(shù)。在適用操作中,可以測量用來增加或降低提示水平的參數(shù),用來重新成形提示頻譜的參數(shù),用來修改提示程度的參數(shù),和/或其他參數(shù)的效果。言語或音頻提示的實質(zhì)或內(nèi)容可以改變?;跍y量,可以適用或改變用來增加或降低提示水平的參數(shù),用來重新成形提示頻譜的參數(shù),用來修改提示程度的參數(shù),和/或其他參數(shù)以改進(jìn)或增強提示或音頻輸出功能。在一些實施例中,干擾曲線記錄(例如,噪音類型參數(shù),噪音水平參數(shù),和/或其他參數(shù))例如可以通過對話控制模塊或其他系統(tǒng)或方法使用以增強車輛乘員與語音對話系統(tǒng)的互動。語音對話控制模塊或其他系統(tǒng)例如可以基于噪音類型參數(shù),噪音水平參數(shù),和/或其他參數(shù)修改對話控制,介紹提示(例如,介紹性的提示),修改音頻提示,修改輸出言語的實質(zhì)或內(nèi)容,修改對話類型,收聽并且響應(yīng)使用者混淆,修改多種形式對話,修改后端應(yīng)用功能,和/或執(zhí)行其他操作。根據(jù)一些實施例,可以適用基于干擾曲線記錄的語音對話控制的修改。在適用操作中,監(jiān)督的學(xué)習(xí)可以用來適用或改變在對話控制中使用的參數(shù),提示介紹,提示修改,對話類型修改,使用者混淆響應(yīng),多種形式對話修改,后端應(yīng)用功能修改,和/或其他的操作。在適用操作中,可以測量在對話控制中使用的參數(shù),提示介紹,提示修改,對話類型修改,使用者混淆響應(yīng),多種形式對話修改,后端應(yīng)用功能修改,和/或其他的操作的效果?;跍y量,可以適用或改變在對話控制中使用的參數(shù),提示介紹,提示修改,對話類型修改,使用者混淆響應(yīng),多種形式對話修改,后端應(yīng)用功能修改,和/或其他的操作以改進(jìn)或增強語音對話系統(tǒng)功能。根據(jù)本發(fā)明的實施例的語音對話系統(tǒng)或方法通過基于精確定時的或?qū)崟r的車輛聲音相關(guān)的信息,噪聲特性的預(yù)先理解,以及其他信息,修改或改變自動語音識別,音頻提示,對話控制和/或其他操作,可以是尤其有用的。附加地,用來修改或改變自動語音識別,提示,對話控制和/或其他操作的參數(shù)可以適用或改變以在語音對話系統(tǒng)的整個壽命中改進(jìn)語音對話系統(tǒng)的功能。通過本發(fā)明的實施例可以實現(xiàn)其他的和不同的優(yōu)點。圖1是根據(jù)本發(fā)明的實施例的具有自動語音識別系統(tǒng)的車輛的示意圖。車輛10(例如汽車,貨車,或其他車輛)可以包括或連接到語音對話系統(tǒng)100。一個或多個麥克風(fēng)20可以與系統(tǒng)100相關(guān)聯(lián),并且麥克風(fēng)20可以接收或記錄對話,環(huán)境噪聲,車輛噪聲,音頻信號及其他聲音。麥克風(fēng)20可以位于車艙22內(nèi)部,車艙22外部,或在其他位置。例如,一個麥克風(fēng)20可以位于車艙22內(nèi)部并且可以接收或記錄言語,非言語相關(guān)的聲音,噪音,和/或車艙22內(nèi)部的聲音。非言語相關(guān)的聲音可以包括例如車輛10相關(guān)的噪音(例如,發(fā)動機噪音,加熱通風(fēng)與制冷(HVAC)系統(tǒng)噪聲等),非車輛相關(guān)的噪音(例如,車輛外部的噪音),音頻系統(tǒng)聲音(例如,音樂,廣播相關(guān)聲音),以及其他聲音。一個或多個外部麥克風(fēng)24例如可以位于車艙22的外部(例如,在車身,保險杠,車尾行李箱,擋風(fēng)玻璃或其他位置上)。一個或多個傳感器可以附著于車輛10或與車輛10相關(guān)聯(lián)。窗戶位置傳感器60,發(fā)動機每分鐘轉(zhuǎn)速(RPM)傳感器26,車速傳感器28 (例如,車速表),HVAC傳感器30 (例如,HVAC風(fēng)扇設(shè)置傳感器),音頻水平傳感器32(例如,音頻系統(tǒng)音量水平),外部麥克風(fēng)24,以及諸如風(fēng)擋刮水器傳感器的其他或不同的傳感器可以測量聲音相關(guān)的車輛信息,車輛參數(shù),車輛狀態(tài),車輛外部的噪音,或車輛相關(guān)信息。聲音相關(guān)的車輛信息或干擾聲音信息可以例如經(jīng)由有線鏈接50 (例如,數(shù)據(jù)總線,控制器區(qū)域網(wǎng)(CAN)總線,F(xiàn)lexray,以太網(wǎng))或無線鏈接傳輸至系統(tǒng)100。可以由系統(tǒng)100或其他系統(tǒng)使用聲音相關(guān)的車輛信息以確定表不聲音相關(guān)的車輛信息的干擾曲線記錄(例如,噪聲曲線記錄)或其他數(shù)據(jù)??梢允褂闷渌虿煌膫鞲衅骰蛐畔ⅰT诒景l(fā)明的一個實施例中,語音對話系統(tǒng)100可以是或可以包括安裝在儀表板上或車輛的控制臺中,客艙22中,或車尾行李箱中的計算裝置。在替換的實施例中,語音對話系統(tǒng)100可以位于車輛的其他部分中,可以位于車輛的多個部分中,或可以具有遠(yuǎn)程定位的全部或部分其功能(例如,在遠(yuǎn)程服務(wù)器中或諸如移動電話的便攜式計算裝置中)。語音對話系統(tǒng)100例如可以執(zhí)行一個或多個輸出語音對話或音頻提示至車輛乘客并且輸入表示來自車輛乘客的言語的音頻信息。根據(jù)一些實施例,揚聲器,麥克風(fēng),電聲換能器,耳機,或其他裝置40可以響應(yīng)于聲音命令,語音響應(yīng),音頻命令,音頻警告,信息請求,或其他音頻信號輸出,廣播,或傳輸音頻提示或語音對話。至聲音命令的音頻提示和/或響應(yīng)例如可以響應(yīng)于來自車輛乘客的言語命令,請求,或應(yīng)答輸出。提示例如可以包括關(guān)于系統(tǒng)100功能,車輛功能的信息,來自使用者(例如,車輛乘客)的問題請求信息,由使用者請求的信息,或其他信息。在一些實施例中,提示和語音輸入可以以其他方式在車輛中使用。在一些實施例中,顯示器,屏幕,或其他圖像或視頻輸出裝置42可以輸出信息,警告,視頻,圖像或其他數(shù)據(jù)至車輛10中的乘客。顯示器42上顯示的信息例如可以響應(yīng)于來自車輛10中的駕駛員或其他乘客的信息請求而顯示。在一些實施例中,車輛10可以包括與麥克風(fēng)20分開或相關(guān)聯(lián)的輸入裝置或區(qū)域44。輸入裝置或觸覺裝置44例如可以是觸摸屏,鍵盤,指針裝置,轉(zhuǎn)向信號或其他裝置。輸入裝置44例如可以用來使能,停用,或調(diào)整語音對話系統(tǒng)100的設(shè)置。盡管論述了各種傳感器和輸入,在某些實施例中可以僅使用傳感器或輸入的子集(例如,一個或其他數(shù)目)。圖2是根據(jù)本發(fā)明的實施例的語音對話系統(tǒng)的示意圖。語音對話系統(tǒng)100可以包括一個或多個處理器或控制器110,存儲器120,長期存儲器130,輸入裝置或區(qū)域44,以及輸出裝置或區(qū)域42。輸入裝置或區(qū)域140與輸出裝置或區(qū)域150例如可以組合成可以是系統(tǒng)100的一部分的觸屏顯示器和輸入。系統(tǒng)100可以包括一個或多個數(shù)據(jù)庫150,其可以包括例如聲音或聲學(xué)相關(guān)的車輛信息160 (例如,干擾聲音信息),干擾曲線記錄(IPR)180,語音對話系統(tǒng)實體170,以及其他信息。聲音相關(guān)的車輛信息160例如可以包括車輛參數(shù),記錄的聲音,和/或其他信息。數(shù)據(jù)庫150例如可以包括干擾曲線記錄180 (例如,噪聲類型參數(shù)、噪聲水平參數(shù),和/或其他信息),噪聲曲線,噪聲曲線記錄,和/或表示車輛參數(shù)和/或其他信息的其他數(shù)據(jù)。數(shù)據(jù)庫150可以全部或部分地存儲在存儲器120,長期存儲器130的一個或兩者中,或其他裝置中。處理器或控制器110例如可以是中央處理器(CPU),芯片,或任意適當(dāng)?shù)挠嬎慊蛴嬎銠C裝置。處理器或控制器110可以包括多個處理器,并且可以包括通用處理器和/或諸如圖形處理芯片的專用處理器。處理器Iio可以執(zhí)行例如存儲在存儲器120或長期存儲器130中的代碼或指令以實施本發(fā)明的實施例。存儲器120可以是或可以包括,例如,隨機存取存儲器(RAM),只讀存儲器(R0M),動態(tài)RAM (DRAM),同步DRAM (SD-RAM),雙數(shù)據(jù)率(DDR)存儲芯片,閃速存儲器,易失性存儲器,非易失性存儲器,超高速緩沖存儲器,緩沖器,短期存儲器單元,長期存儲器單元,或其他適當(dāng)?shù)拇鎯ζ鲉卧虼鎯卧?。存儲?20可以是或可以包括多個存儲器單元。長期存儲器130可以是或可以包括,例如,硬盤驅(qū)動器,軟盤驅(qū)動器,光盤(⑶)驅(qū)動器,可錄式光盤(⑶-R)驅(qū)動器,通用串行總線(USB)裝置或其他適當(dāng)?shù)目梢苿拥暮?或固定的存儲單元,并且可以包括多個這樣的單元或這樣的單元的組合。圖3是根據(jù)本發(fā)明的實施例的語音對話系統(tǒng)的方框圖。圖3的系統(tǒng)例如可以是圖2的系統(tǒng)的一部分,或其他系統(tǒng)的一部分,并且可以將其功能由圖2的系統(tǒng),或由其他系統(tǒng)執(zhí)行。圖3的系統(tǒng)的部件例如可以是專用硬件部分,或可以是由處理器110執(zhí)行的全部或部分代碼。麥克風(fēng)20或其他輸入裝置可以接收,記錄或測量車輛中聲音,噪音,和/或言語。聲音可以包括言語,言語命令,語音命令或來自車輛10中的乘客的其他表示。麥克風(fēng)20可以將包括言語命令的表不輸入聲音的音頻信號或信號200傳輸或發(fā)送至系統(tǒng)100,語音識別系統(tǒng)或處理201,或其他模塊或系統(tǒng)。語音識別系統(tǒng)或處理201例如可以包括信號處理器202(例如,語音識別前端),語音識別模件204,以及其他系統(tǒng)或模塊。包括言語命令的表不輸入聲音的音頻信號200可以輸出到與系統(tǒng)100相關(guān)聯(lián)的自動語音識別系統(tǒng)201,信號處理器或信號處理或增強裝置,適用模塊,或其他裝置。信號處理器202例如可以接收音頻信號。信號處理器202例如可以濾波,放大數(shù)字化,或以其他方式轉(zhuǎn)換信號200。信號處理器202可以傳輸信號200至語音識別模件或裝置204。自動語音識別(ASR)模塊或語音識別模件204可以摘錄,識別,或確定來自信號200的字,句,語言,語音,或聲音模式。字可以通過例如將音頻信號與聲學(xué)模型,列表,或公知的字,語音和/或句的數(shù)據(jù)庫進(jìn)行比較而摘錄?;诒容^,基于最高的相似性和/或匹配的可能性,可能識別的字或句可以排序。ASR模塊204可以將表示識別的字或句的信號200輸出或傳輸至語義解釋器206。根據(jù)一些實施例,車輛乘客可以輸入命令或信息至輸入裝置44。輸入裝置44可以傳輸或輸出表不命令或信息的信號至觸覺輸入識別模塊208。觸覺輸入識別模塊208可以識別,解碼,摘錄,或確定信號中或來自信號的字,句,語言,或語音。觸覺輸入識別模塊208例如可以通過將來自輸入44的信號與字,句,語言,或語音的統(tǒng)計的模型,數(shù)據(jù)庫,詞典或目錄相比較以識別信號中的字,句,語言,或語音。觸覺輸入識別模塊208可以將表示識別的字或句的信號輸出或傳輸至語義解釋器206。觸覺信號例如可以與來自語義解釋器206中的ASR模塊204的信號合并或進(jìn)行比較。根據(jù)一些實施例,語義解釋器206可以確定來自ASR模塊204,觸覺輸入識別模塊208和/或其他裝置或模塊的信號輸出中的字,句,語言或語音的含義。語義解釋器206例如可以是分析程序(例如,語義分析程序)。語義解釋器206例如可以將識別的字串與可以表示含義的對話動作進(jìn)行映射。對話動作例如可以參看應(yīng)用的實體(例如,應(yīng)用實體的部件)。例如,使用者可以提供言語命令或字串(例如“為我尋找酒店”)并且語義解釋器206可以分析或映射字串至對話動作(例如,信息(類型=酒店))。語義解釋器206例如可以使用一種模型,其涉及字至應(yīng)用實體(例如,應(yīng)用實體中的對話動作)。模型例如可以被歸入語音識別語法(例如,數(shù)據(jù)庫150,存儲器120,或其他位置中)和/或其他位置。語音識別模塊204可以識別聲明中的字并且傳輸表示字的信號至語義解釋器206。對話動作,表示言語命令的信息,和/或其他信息或信號可以輸出到對話控制模塊210。在一些實施例中,對話控制模塊210可以產(chǎn)生,計算或確定至對話動作的響應(yīng)。例如,如果對話動作是信息請求(例如,信息(類型=酒店)),對話控制模塊210可以確定至提供信息的請求的響應(yīng)(例如,酒店的位置),請求進(jìn)一步信息的響應(yīng)(例如,“你的價格范圍是多少? ”),或其他響應(yīng)。對話控制模塊210可以結(jié)合或關(guān)聯(lián)后端應(yīng)用212運作。后端應(yīng)用212例如可以是數(shù)據(jù)搜索(例如,搜索發(fā)動機),導(dǎo)航,立體聲或廣播控制,音樂檢索,或其他類型的應(yīng)用。根據(jù)一些實施例,反應(yīng)發(fā)生器或響應(yīng)生成模塊214例如可以接收來自對話控制模塊210的響應(yīng)信息。響應(yīng)生成模塊214例如可以公式化或產(chǎn)生文本,短語,或字(例如,公式化句子),用于輸出到車輛乘客的響應(yīng)??梢暿疽饽K216可以通過響應(yīng)生成模塊214產(chǎn)生顯示文本響應(yīng)輸出的圖像,系列圖像,或視頻??梢暿疽饽K216可以輸出圖像,系列圖像,或視頻至顯示器44或其他裝置。文本至言語模塊218可以轉(zhuǎn)換來自響應(yīng)生成模塊214的文本至言語,音頻信號輸出,或可聽信號輸出。語音信號可以從文本至言語模塊218輸出至音頻信號處理器220。音頻信號處理器220可以從數(shù)字至音頻轉(zhuǎn)換信號,放大信號,解壓縮信號,和/或其他修改或轉(zhuǎn)變信號。音頻信號可以輸出到揚聲器40。揚聲器40可以廣播響應(yīng)至車輛乘客。干擾曲線模塊222可以接收聲音相關(guān)的車輛信息160,車輛參數(shù),接收的聲音信號,和/或來自數(shù)據(jù)總線50或其他源的表示一個或多個聲音的其他信息。在一些實施例中,數(shù)據(jù)總線50可以傳輸或轉(zhuǎn)換聲音相關(guān)的車輛信息160至與語音對話系統(tǒng)100相關(guān)聯(lián)的干擾曲線模塊222或與系統(tǒng)100相關(guān)聯(lián)的其他模塊或裝置。干擾曲線記錄(IPR)ISO可以基于聲音相關(guān)的車輛信息160通過干擾曲線模塊222產(chǎn)生,確定或計算。干擾曲線記錄180可以包括噪聲水平參數(shù)(例如,聲音強度參數(shù)),噪聲或聲音類型參數(shù),和/或其他信息。基于聲音相關(guān)的車輛信息160,接收的聲音,和/或表示聲音或噪音的其他信息,可以確定噪聲水平參數(shù),噪聲類型參數(shù)、和/或其他參數(shù)。例如,聲音相關(guān)的車輛信息160可以表示或表明加熱,通風(fēng),和空調(diào)(HVAC)系統(tǒng)風(fēng)扇打開并且以高設(shè)置在操作。例如可以產(chǎn)生包括風(fēng)扇的噪聲類型參數(shù)(例如,噪聲類型=風(fēng)扇)以及高噪聲水平參數(shù)(例如,噪聲水平=高)的IPR 180以表示指示HVAC風(fēng)扇在高設(shè)置的聲音相關(guān)的車輛信息160??梢援a(chǎn)生包括噪聲類型參數(shù),噪聲水平參數(shù),以及其他參數(shù)的其他參數(shù)的其他IPR 180。噪聲水平參數(shù)和噪聲類型參數(shù)可以表示車輛中的噪音或聲音或車輛中類似存在的噪音或聲音,但典型地不包括實際噪音或聲音的音頻信號或記錄。根據(jù)一些實施例,基于噪聲水平參數(shù),噪聲類型參數(shù),和/或其他參數(shù),修改模塊或步驟224可以改變或修改音頻信號200,濾波器噪音,和/或以其他方式修改自動語音識別。在一些實施例中,通過應(yīng)用濾波器至音頻信號200,確定在語音識別中使用的聲學(xué)模型,和/或以其他方式增強信號處理202,語音識別204,或語音識別步驟或處理,修改模塊224可以修改音頻信號200。根據(jù)一些實施例,干擾曲線記錄例如可以通過文本至對話218,音頻處理220,或其他模塊或方法進(jìn)行使用以增強從系統(tǒng)100輸出的音頻言語提示,聲頻輸出,或其他聲音或廣播。文本至對話218參數(shù)或輸出可以通過增加或降低言語速度,增加或降低音節(jié)持續(xù)時間,和/或以其他方式修改從系統(tǒng)100的言語輸出(例如,經(jīng)由揚聲器40)可以進(jìn)行修改?;诟蓴_曲線記錄(例如,噪聲類型參數(shù),噪聲水平參數(shù),及其他參數(shù))可以修改與音頻處理220相關(guān)的參數(shù)(例如,提示水平,提示頻譜,音頻重放,或其他參數(shù))。來自系統(tǒng)的音頻輸出例如可以通過增加提示水平(例如,音量),改變提示音高,成形或重新成形提示頻譜(例如,以增加信號噪音比),增強音頻重放(例如,立體聲重放),和/或以其他方式增強或改變來自系統(tǒng)100的聲頻輸出(例如,經(jīng)由揚聲器40)而修改??梢允褂梦谋局裂哉Z218,音頻處理220,和/或其他類型言語提示或聲頻輸出修改224的組合。例如,可以使用Lombard類型或其他類型的言語修改。Lombard類型修改例如可以以人在喧吵環(huán)境下,具有背景噪聲的環(huán)境下,或在溝通很困難的設(shè)置中的對話為模型。Lombard類型修改例如可以使用音頻處理220,文本至言語218,或其他模塊和/或操作修改音頻頻譜,音高,言語速度,音節(jié)持續(xù)時間及其他音頻特性。根據(jù)一些實施例,基于噪聲水平參數(shù),噪聲類型參數(shù),和/或其他參數(shù),可以修改和/或改變對話控制210或與言語對話系統(tǒng)100相關(guān)聯(lián)的其他系統(tǒng)或處理。例如通過實施或利用澄清動作(例如,詢問使用者輸入的清楚的確認(rèn),以重復(fù)輸入,或其他澄清),確定并且輸出介紹的音頻提示(例如,在窗戶下降,高發(fā)動機RPM,或基于其他車輛參數(shù)時聲音識別可能困難,提示使用者使用輸出言語),修改提示(例如,控制提示的速度或定時),修改對話類型(例如,提示使用者單一的軌跡或簡單的信息而不是復(fù)雜信息,強制使用精確的短語,避免混合的主動以及其他修改),監(jiān)控并且響應(yīng)使用者混淆,和/或以其他方式修改對話控制210,對話控制210可以修改或改變(例如,通過修改模塊224)。在一些實施例中,多種形式對話(例如,結(jié)合觸覺,視覺或其他對話的語音對話)例如可以修改(例如,通過修改模塊224)。例如,通過在言語提示上恢復(fù)成,評價,或證實可見顯示,通過還原為系統(tǒng)假設(shè)的可見顯示(例如,對于信息以及其他提示的問題,請求),提示或請求來自使用者的觸覺確認(rèn)(例如,提示使用者從顯示在觸摸屏或其他輸出裝置上的響應(yīng)的清單中選擇響應(yīng)),鼓勵使用者觸覺形式(例如,減少與語義解釋器206相關(guān)聯(lián)的信任水平),基于應(yīng)用功能的子集的其他形式從言語切換(例如通過觸覺裝置的簡單命令和控制),或其他修改,多種形式對話可以修改。基于干擾曲線記錄可以修改后端應(yīng)用功能(例如,通過修改模塊224)。例如,后端應(yīng)用服務(wù)或特征的功能可以鎖定,減少,或以其他方式修改(例如,鎖定語音搜索,允許廣播控制,以及其他服務(wù))。圖4是根據(jù)本發(fā)明的實施例的自動語音識別系統(tǒng)的方框圖。根據(jù)一些實施例,干擾曲線模塊222可以接收聲音相關(guān)的車輛信息160,例如包括或表示來自數(shù)據(jù)總線50的車輛參數(shù)以及其他信息。車輛參數(shù)例如可以包括窗戶位置(例如,打開或關(guān)閉,打開一定量等),發(fā)動機設(shè)置(例如發(fā)動機每分鐘轉(zhuǎn)數(shù)(RPM)),車輛速度,HVAC風(fēng)扇設(shè)置(例如,關(guān)閉,低,中,高),音頻重放水平,或其他車輛相關(guān)參數(shù)。根據(jù)一些實施例,干擾曲線模塊222可以接收來自麥克風(fēng)的聲音相關(guān)的車輛信息160 (例如,外部麥克風(fēng)24,內(nèi)部麥克風(fēng)20,或其他麥克風(fēng))。在一些實施例中,來自麥克風(fēng)的聲音相關(guān)的車輛信息160可以包括非言語相關(guān)的聲音,車輛相關(guān)的聲音,非車輛相關(guān)的聲音,基礎(chǔ)結(jié)構(gòu)聲音,風(fēng)噪音,路面噪音,來自車艙外的人的言語,環(huán)境聲音。干擾模塊222例如可以基于聲音相關(guān)的車輛信息160產(chǎn)生干擾曲線記錄(IPR) 180。干擾曲線記錄180例如可以是表格,數(shù)據(jù)集,數(shù)據(jù)庫,或其他組信息。每個IPR 180例如可以是聲音相關(guān)的車輛信息160 (例如,車輛參數(shù)以及其他聲音或信息)的表現(xiàn)。例如IPR 180可以包括噪音水平參數(shù)304 (例如,聲音強度參數(shù)),噪音類型參數(shù)306 (例如,聲音類型參數(shù)或噪音分類參數(shù)),以及表示聲音相關(guān)的車輛信息160的其他參數(shù)。在一些實施例中,噪音水平參數(shù)304,噪音類型參數(shù)306,以及其他參數(shù)可以表示聲音相關(guān)的車輛信息160的種類的組合(例如,車輛參數(shù),接收的聲音,和/或其他聲音或信息)。包括噪音水平參數(shù)304,噪音類型參數(shù)306,和/或其他參數(shù)的IPR 180例如可以表示實時的,連續(xù)的,或在預(yù)定時間段的車輛參數(shù)(例如,發(fā)動機RPM,HVAC風(fēng)扇設(shè)置,窗戶位置等)或車輛相關(guān)的聲音。當(dāng)語音對話系統(tǒng)100啟動,車輛在任何時間通電,或在其他時間,干擾曲線記錄180例如可以連續(xù),實時產(chǎn)生。
噪音類型參數(shù)306例如可以是表示或源自包括車輛參數(shù)(例如,發(fā)動機RPM,窗戶位置,HVAC風(fēng)扇設(shè)置,車輛速度,音頻重放水平,以及其他參數(shù))的聲音相關(guān)的車輛信息160和/或其他信息的分類,歸類,標(biāo)簽,標(biāo)記,或信息?;诮邮兆訡AN總線50的信號(例如,聲音相關(guān)的車輛信息160),噪音或聲音類型參數(shù)306例如可以確定,產(chǎn)生,或分配。接收自CAN總線50的信號例如可以表示或包括聲音相關(guān)的車輛信息160,其可以表示車輛參數(shù)(例如,車輛窗戶位置,發(fā)動機RPM,車輛速度,HVAC風(fēng)扇設(shè)置,音頻重放水平,以及其他參數(shù))和/或其他信息。噪音類型參數(shù)306例如可以表示車輛參數(shù),預(yù)先限定的車輛參數(shù)的組合,或接收自CAN總線50的其他信息。例如,如果信號接收自CAN總線50顯示發(fā)動機RPM高于閾值RPM值,發(fā)動機的噪音類型參數(shù)306 (例如,噪音_類型=發(fā)動機)可以產(chǎn)生或分配。例如,經(jīng)由CAN總線50接收的顯示HVAC系統(tǒng)在某設(shè)置的信號可以導(dǎo)致風(fēng)扇的噪音或聲音類型參數(shù)306的產(chǎn)生或分配(例如,噪音_類型=風(fēng)扇)。例如,顯示窗戶打開的聲音相關(guān)的車輛信息160可以導(dǎo)致窗戶的噪音類型參數(shù)306的分配(例如,噪音_類型=窗戶)。可以使用其他的噪音類型參數(shù)306確定,分配,以及分類。噪音水平參數(shù)304例如可以源自于車輛參數(shù)(例如,包括風(fēng)扇刻度或輸入設(shè)置,HVAC系統(tǒng)設(shè)置,發(fā)動機RPM,車輛速度,音頻重放水平,和/或其他的車輛參數(shù))。噪音水平參數(shù)304例如可以是聲音水平(例如,聲音分貝水平(dB))的表示或聲音水平或特征的其他測量。噪音水平參數(shù)304例如可以是低,中,高或其他參數(shù)并且可以表示或定量聲音強度的范圍。在一些實施例中,干擾曲線記錄180 (例如,噪音水平參數(shù)304以及噪音類型參數(shù)306)可以使用邏輯(例如,使用度量或閾值),數(shù)學(xué)方法,表格(例如查找表),或其他操作確定,產(chǎn)生,或計算。例如,如果聲音相關(guān)的車輛信息160顯示發(fā)動機RPM高于預(yù)定閾值,可以確定或產(chǎn)生發(fā)動機的噪音類型參數(shù)306 (例如,噪音_類型=發(fā)動機)以及高的噪音水平參數(shù)304 (例如,噪音_類型=高)。例如,如果來自數(shù)據(jù)總線的車輛參數(shù)顯示HVAC風(fēng)扇在高設(shè)置,可以分配等于風(fēng)扇的噪音類型參數(shù)306 (例如,噪音_類型=風(fēng)扇),高的噪音水平參數(shù)304(噪音_水平=高),和/或其他的參數(shù)??梢允褂闷渌牟僮?。典型地,噪音類型參數(shù)是從清單,例如,發(fā)動機,窗戶打開,風(fēng)扇,風(fēng),音頻,音頻等中選出來的離散參數(shù)。然而,可以使用其他的噪音類型參數(shù)。噪音類型參數(shù)和噪音水平參數(shù)典型地不包括關(guān)于產(chǎn)生的實際噪音的錄音或其他的直接信息。在一些實施例中,多種類型的聲音相關(guān)的車輛信息160的組合(例如,車輛參數(shù),測量的聲音,以及其他聲音或信息)在一些實施例中可以以邏輯操作和/或其他的數(shù)學(xué)操作使用以確定或計算干擾曲線記錄180 (例如,噪音水平參數(shù)304和噪音類型參數(shù)306)。例如,如果來自數(shù)據(jù)總線的聲音相關(guān)的車輛信息160顯示車輛速度大于閾值速度(例如,70英里/小時(mph)或其他速度)以及窗戶位置超過閾值(例如,超過25%打開或其他閾值),可以確定,分配,或產(chǎn)生高的噪音水平參數(shù)304 (例如,噪音_水平=高)和等于風(fēng)的噪音類型參數(shù)306 (例如,噪音_類型=風(fēng))??梢允褂闷渌拈撝岛蛥?shù)。在一些實施例中,干擾曲線記錄180可以使用量化或其他操作確定,產(chǎn)生,或計算。聲音相關(guān)的車輛信息160,車輛參數(shù),測量的聲音,或其他信息例如可以量化以確定噪音水平參數(shù)304值和噪音類型參數(shù)306值。例如,發(fā)動機RPM值可以量化為8位或其他大小的整數(shù)噪音水平參數(shù)304值。噪音水平參數(shù)304 (例如,8位整數(shù)表示發(fā)動機噪聲)例如可以包括與發(fā)動機特征相關(guān)的信息(例如,發(fā)動機基本的頻率和諧波)。音頻重放水平,例如可以量化為8位或其他大小的整數(shù)。每個8位整數(shù)例如可以表示干擾曲線記錄180(例如,噪音水平參數(shù)304)??梢允褂闷渌牧炕襟E。根據(jù)一些實施例,修改模塊或處理224可以基于干擾曲線記錄180修改音頻信號200,濾波器信號,以及改進(jìn)語音對話系統(tǒng)100功能。在一些實施例中,修改模塊或處理224可以修改音頻信號200,濾波器噪音,音頻信號200的修改特征,和/或以其他方式獨立于語音識別裝置300 (例如,在語音識別204之前),依賴于語音識別302 (例如,在語音識別204期間,使用例如ASR前端314),或在其他步驟或處理期間,改變聲音信號200。在一些實施例中,音頻信號200 (例如,來自麥克風(fēng)20的輸出)可以獨立于語音識別模塊204或在語音識別模塊204中接收之前進(jìn)行修改,濾波或改變。例如,系統(tǒng)100可以包括多個濾波器312 (例如,Weiner濾波器,梳狀濾波器,模擬,數(shù)字,被動,主動,離散時間,連續(xù)時間,以及其他類型的濾波器)并且每個濾波器312可以包括濾波器參數(shù)320。濾波器312例如可以存儲在存儲器120,數(shù)據(jù)庫150,長期存儲器130,或類似的存儲裝置中。每個濾波器312和濾波器參數(shù)320例如,可以最佳地用于濾波某些噪音水平參數(shù)304和噪音類型參數(shù)306。音頻信號200例如可以在信號處理202期間修改和/或改變。音頻信號200可以基于干擾曲線記錄180 (例如,噪音類型參數(shù)306和噪音水平參數(shù)304)在信號處理202期間修改?;谠胍纛愋蛥?shù)306,修改模塊310例如可以確定濾波器312 (例如,Weiner濾波器,梳狀濾波器,低通濾波器,高通濾波器,帶通濾波器,或其他類型的濾波器)或其他模塊或裝置以濾波,限制,或減少干擾噪音。濾波器參數(shù)322 (例如,頻率,振幅,諧波,調(diào)音,或其他參數(shù))例如可以基于噪音水平參數(shù)304確定。濾波器312可以應(yīng)用到信號處理器202或在其他模塊或步驟中的輸入信號,音頻信號200,或其他類型的信號中。根據(jù)一些實施例,如果IPR 180顯示風(fēng)噪音(例如,噪音_類型=風(fēng))可能存在,可以通過信號處理器202應(yīng)用濾波器312 (例如,Weiner濾波器)以濾波或減少音頻信號200中的風(fēng)噪音。在一些實施例中,Weiner濾波器參數(shù)320可以基于噪音水平參數(shù)304 (例如,噪音_水平=高,中,低,或關(guān)閉),噪音類型參數(shù)306,以及其他參數(shù)而確定。例如,修改模塊224可以包括預(yù)定的Weiner濾波器參數(shù)320以基于給定的噪音水平參數(shù)304在信號處理202期間應(yīng)用。濾波器312 (例如,Weiner濾波器)應(yīng)用后,信號中減少或限制了風(fēng)噪音的音頻信號200例如可以輸出到自動語音識別(ASR)模塊204。根據(jù)一些實施例,如果IPR 180顯示可能存在發(fā)動機噪音(噪音_類型=發(fā)動機),在信號處理202期間可以應(yīng)用時間改變的梳狀濾波器312以濾出發(fā)動機噪聲。隨時間變化的梳狀濾波器312參數(shù)例如可以基于噪音水平參數(shù)304 (例如,表示發(fā)動機噪音的8位整數(shù))而確定。噪音水平參數(shù)304 (例如,8位整數(shù)表示發(fā)動機噪聲)例如可以包括與發(fā)動機特征相關(guān)的信息(例如,發(fā)動機基本的頻率和諧波)?;谠胍羲絽?shù)304,隨時間變化的梳狀濾波器312參數(shù)例如可以確定。隨時間變化的梳狀濾波器參數(shù)322例如可以確定從而梳狀濾波器與音頻信號200的發(fā)動機噪聲部分中的基本的頻率和諧波對齊。具有與音頻信號200的發(fā)動機噪音部分中的基本的頻率和諧波對齊的參數(shù)322的隨時間變化的梳狀濾波器參數(shù)322可以在聲音信號200轉(zhuǎn)換(例如,信號傅里葉變換)中衰減或減少發(fā)動機基本的頻率和諧波的強度。具有衰減或減少的基本的發(fā)動機頻率和振幅的信號200例如可以輸出到自動語音識別解碼器316中。自動語音識別解碼器316可以解釋音頻信號200中的言語,命令,或其他息。根據(jù)一些實施例,可以測量在增加的語音識別功能中基于噪音類型參數(shù)和噪音水平參數(shù)的語音識別修改的成功?;谠摐y量,可以適用成功的語音識別修改(例如,在學(xué)習(xí)或監(jiān)督的學(xué)習(xí)操作期間)。根據(jù)一些實施例,使用給定干擾曲線記錄180 (例如,噪音類型參數(shù)306和噪音水平參數(shù)304)的濾波器參數(shù)322 (例如,Weiner濾波器,梳狀濾波器等)可以在制造期間,在適用處理320期間(例如,學(xué)習(xí)或監(jiān)督的學(xué)習(xí)操作),或其他時間中限定。濾波器參數(shù)322例如,可以確定從而濾波器312在除去來自音頻信號200的噪音時最有效。在適用處理320期間,與信號200相關(guān)的信號200和IPR 180可以在系統(tǒng)100接收(例如,在適用模塊320處)。例如,信號200可以包括言語,噪音,以及可能的其他聲音。與信號200相關(guān)的干擾曲線記錄180例如可以在同時或大致同時接收信號200時并行地從數(shù)據(jù)總線50輸出。適用模塊320例如可以通過將信號200與(例如,用預(yù)定濾波器參數(shù)320操作的)來自濾波器312的信號輸出進(jìn)行比較或使用其他方法測量在從信號200除去噪音時濾波器參數(shù)322如何有效(例如,基于IPR 180得出或確定)。在改進(jìn)語音識別中成功或濾波器參數(shù)322可以使用其他的方法和/或度量進(jìn)行測量。適用模塊320可以基于測量變化或適用濾波器參數(shù)322以更有效地從與給定IPR 180相關(guān)的信號200中除去噪音(例如,給定噪音類型參數(shù)306和噪音水平參數(shù)304)。適用步驟320例如可以是當(dāng)車輛由駕駛員駕駛時或在其他時間并且濾波器參數(shù)322可以基于監(jiān)督的學(xué)習(xí)或其他的方法適用時而執(zhí)行。例如,在適用處理320期間,車輛可以在窗戶打開時以超過預(yù)定閾值速度駕駛并且高的噪音水平參數(shù)304和風(fēng)的噪音類型參數(shù)306 (例如,噪音_類型=風(fēng))可以產(chǎn)生。在適用操作320期間,包括言語以及其他噪音(例如,車輛相關(guān)的噪音)的信號200可以在系統(tǒng)100處接收(例如,來自麥克風(fēng)20)。適用模塊320例如可以測量在從信號200中除去噪音時濾波器參數(shù)322如何有效(例如,基于噪音類型參數(shù)306和噪音水平參數(shù)304)。在一些實施例中,通過將信號200與來自濾波器312的信號輸出進(jìn)行比較(例如,用預(yù)先確定的濾波器參數(shù)320操作)或使用其他的方法,可以測量在從信號200中除去噪音時濾波器參數(shù)322如何有效。與噪音類型參數(shù)306和噪音水平參數(shù)304相關(guān)的濾波器參數(shù)322例如可以適用或改變?yōu)楦行У臑V波器或從信號200中除去噪音。在一些實施例中,如果在從信號中除去噪音時測量的濾波器參數(shù)322是有效的或成功的,與噪音類型參數(shù)306和噪音水平參數(shù)304相關(guān)的濾波器參數(shù)322可以不改變或適用。濾波器參數(shù)322的成功或有效例如可以通過估計給定濾波器參數(shù)322的語音識別204的性能或功能而確定。可以使用其他的方法和度量。根據(jù)一些實施例,修改模塊310可以修改語音識別模塊204中的模塊和/或裝置內(nèi)的音頻信號200。音頻信號200,例如可以從麥克風(fēng)20或類似裝置接收并且可以包括來自車輛乘員(例如,乘客,駕駛員等)的言語以及其他聲音(例如,背景噪音,車輛相關(guān)的聲音,以及其他聲音)。語音識別模塊204例如可以包括自動語音識別(ASR)前端314?;贗PR180,信號可以在ASR前端314修改以濾波出噪音(例如,風(fēng)噪音,發(fā)動機噪音或其他類型的噪音)或以其他方式修改音頻信號200。濾波器312 (例如,Weiner濾波器)例如可以用于ASR前端314中的信號200以從音頻信號200中濾波出風(fēng)噪音。該類型的濾波器312和濾波器參數(shù)322可以基于噪音類型參數(shù)306和噪音水平參數(shù)304確定。例如,車輛10可以在窗戶打開時以超過閾值速度的速度移動并且可以產(chǎn)生風(fēng)的噪音類型參數(shù)306和高的噪音水平參數(shù)304。基于風(fēng)的噪音類型參數(shù)306和高的噪音水平參數(shù)304,具有預(yù)定濾波器參數(shù)322的濾波器312 (例如,Weiner濾波器)可以應(yīng)用到ASR前端314中的信號200中。根據(jù)一些實施例,自動語音識別模塊204可以包括聲學(xué)模型318。在聲音分析以解碼言語期間可以選擇在多個聲學(xué)模型318中的具體的以前產(chǎn)生的聲學(xué)模型,模型的選擇例如取決于干擾曲線記錄180 (例如,噪音水平參數(shù)304和/或噪音類型參數(shù)306)。聲學(xué)模型318可以是或可以包括表示音素,聲音,字,句或言語的其他元素以及它們相關(guān)的或典型的波形之間關(guān)系的統(tǒng)計模型(例如,Hidden Markov Model (HMM)統(tǒng)計模型或其他統(tǒng)計模型)。根據(jù)一些實施例,IPR 180 (例如,噪音水平參數(shù)304,噪音類型參數(shù)306,或其他參數(shù))可以用來確定,選擇或挑選在語音識別操作中使用哪個聲學(xué)模型318。例如,IPR 180(例如,高的噪音水平參數(shù)304和窗戶的噪音類型參數(shù)306)可以顯示信號中高的窗戶噪音。修改模塊310可以基于顯不高的窗戶噪音的IPR 180,在一些聲學(xué)模型318中選擇或確定最適于解碼具有高的窗戶噪音的信號中的言語的聲學(xué)模型318。在適用操作320,制造,試驗,或其他時間期間,可以從言語采樣中適用,訓(xùn)練或產(chǎn)生聲學(xué)模型318?;谠胍羲絽?shù)304和噪音類型參數(shù)306在適用操作320期間(例如,監(jiān)督的學(xué)習(xí)操作)例如可以適用聲學(xué)模型318。適用模塊320例如可以測量聲學(xué)模型322(例如,基于IPR 180確定的)在從信號200中解碼言語時如何有效??梢詼y量在改進(jìn)語音識別時聲學(xué)模型322 (例如,包括預(yù)定聲學(xué)模型變換矩陣)的成功以及基于測量可以適用聲學(xué)模型322。例如可以使用最大似然線性回歸或其他的數(shù)學(xué)方法適用聲學(xué)模型322以適用或者訓(xùn)練結(jié)合預(yù)定噪音類型參數(shù)306和噪音水平參數(shù)304使用的聲學(xué)模型變換矩陣。例如,在適用或訓(xùn)練操作期間,車輛10可以在窗戶打開的情況下以超過閾值速度駕駛。高的噪音水平參數(shù)304和風(fēng)的噪音類型參數(shù)306 (例如噪音_類型=風(fēng))可以產(chǎn)生并且輸出至適用模塊320。言語以及其他噪音可以記錄(例如,由麥克風(fēng)20)并且包括言語的信號200可以輸出到適用模塊320??梢詼y量基于風(fēng)的噪音類型參數(shù)306 (例如,噪音_類型=風(fēng))和高的噪音水平參數(shù)304 (例如,噪音_水平=高)的解碼言語中的聲學(xué)模型318的成功?;跍y量,使用最大似然線性回歸技術(shù)或其他的數(shù)學(xué)或統(tǒng)計方法可以產(chǎn)生或適用聲學(xué)模型變換矩陣。當(dāng)產(chǎn)生顯示高的風(fēng)噪音(例如,風(fēng)的噪音類型參數(shù)306和高的噪音水平參數(shù)304)的干擾曲線記錄180時,具有適用的聲學(xué)模型變換矩陣的聲學(xué)模型318例如可以在隨后的系統(tǒng)100操作中使用。當(dāng)車輛10由駕駛員駕駛的同時例如可以執(zhí)行適用320 (例如,包括監(jiān)督的學(xué)習(xí)),并且聲學(xué)模型318可以基于監(jiān)督的學(xué)習(xí)改變或修改。最適合于在具有高的窗戶噪音的信號中解碼言語的聲學(xué)模型318例如可以在具有高的風(fēng)噪音的監(jiān)督的學(xué)習(xí)操作期間已經(jīng)訓(xùn)練或限定。圖5是根據(jù)本發(fā)明的實施例的增強語音對話音頻提示的方框圖。根據(jù)一些實施例,干擾曲線記錄180 (例如,包括噪音類型參數(shù)306和噪音水平參數(shù)304)可以用來修改音頻信號400 (例如,從系統(tǒng)100輸出)。干擾曲線記錄180 (例如,噪音類型參數(shù)306和噪音水平參數(shù)304)可以由文本至言語218,音頻處理220,或其他模塊或方法使用以提高言語提示,聲音輸出,或從系統(tǒng)100的廣播輸出。
根據(jù)一些實施例,修改模塊224可以基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù))修改與音頻處理220相關(guān)的參數(shù)(例如,提示水平,提示頻譜,提示程度,聲音型譜,音頻水平,或其他參數(shù))。修改模塊224例如可以增加提示水平(例如,音量),改變提示頻譜,成形和/或重新成形提示頻譜(例如,增加信號噪音比),增強音頻重放(例如,立體重放),和/或以其他方式增強或改變從系統(tǒng)100的聲音輸出(例如,經(jīng)由揚聲器40)。例如,如果噪音水平參數(shù)304顯示信號400中的噪音超過閾值水平(例如,dB水平),可以增加提示水平(例如,來自揚聲器40的輸出)音頻水平407。在一些實施例中,提示頻譜402例如可以修改,成形,或重新成形。提示可以是來自系統(tǒng)100的音頻或聲音輸出,例如,包括對車輛乘員的言語并且提示頻譜402例如可以是音頻頻譜,包括一定范圍的頻率,強度,聲音壓力,聲音能量,和/或其他聲音相關(guān)的參數(shù)。提示頻譜402例如可以修改,成形,或重新成形以增加車輛10中的信號噪音比(例如,在車輛內(nèi)部中或在車輛乘員的附近)。提示頻譜402例如可以修改以增強或放大對應(yīng)于來自車輛相關(guān)的聲音中高噪音能量(例如,發(fā)動機噪音,風(fēng)噪音,風(fēng)扇噪音,以及其他聲音)的頻譜部分中的提示頻譜402 (例如,頻率頻譜,能量頻譜,或其他類型的聲音相關(guān)的頻譜)。提示頻譜402例如可以放大具有高的噪音能量的頻譜的一部分以增加信號噪音比,其可以表示提示聲音水平(例如,從系統(tǒng)100的提示輸出)與車輛內(nèi)部中的噪音水平(例如,發(fā)動機噪音,風(fēng)噪音,HVAC風(fēng)扇噪音,以及其他噪音)的比率。提示頻譜402例如可以使用音頻處理器模塊220,文本至言語模塊218,或其他系統(tǒng)或模塊進(jìn)行修改。在一個實施例中,噪音類型參數(shù)306可以顯示發(fā)動機噪音(例如,噪音_類型參數(shù)=發(fā)動機)以及噪音水平參數(shù)304可以表示發(fā)動機噪音的水平。噪音水平參數(shù)304例如可以是發(fā)動機RPM的量化表現(xiàn)(例如,8位整數(shù)或表示發(fā)動機RPM的其他整數(shù))?;谠胍羲絽?shù)304 (例如,發(fā)動機RPM的量化表示),修改模塊224可以放大或加強提示頻譜402的預(yù)定部分。例如,噪音類型參數(shù)306和噪音水平參數(shù)304可以對應(yīng)于聲音頻譜的低頻率部分(例如,低于1000赫茲(Hz)或其他頻率)中的高噪音能量和頻譜的高頻率部分(例如,高于1000赫茲(Hz)或其他頻率)中的低噪聲能量。提示頻率頻譜402的低頻率部分(例如,低于1000赫茲或其他頻率)可以放大或加強以增加低頻率的提示與發(fā)動機噪音的比率。在一些實施例中,音頻頻譜404 (例如,來自立體聲,收音機或其他裝置)例如可以修改或重新成形。音頻頻譜404例如可以修改或重新成形以增加車輛中的音頻信號與噪音的比率。音頻頻譜404例如可以使用音頻處理模塊220和/或其他裝置或模塊進(jìn)行修改。音頻信號404例如可以修改以加強或放大對應(yīng)于來自車輛相關(guān)的聲音中高噪音能量(例如,發(fā)動機噪音,風(fēng)噪音,風(fēng)扇噪音,以及其他聲音)的音頻頻譜404的部分中的音頻頻譜404(例如,音頻頻率頻譜,音頻能量頻譜,或其他類型的聲音相關(guān)的頻譜)。音頻頻譜404例如可以放大具有高噪音能量的頻譜的一部分以增加信號噪音比,其可以表示車輛內(nèi)部中的音頻(例如,來自揚聲器40的音頻輸出)與噪音的比率。根據(jù)一些實施例,音頻提示或音頻程度406可以基于干擾曲線記錄180修改或改變。提示或音頻程度406例如可以基于噪音類型參數(shù)306和噪音水平參數(shù)304修改以增加提示或音頻(例如,來自揚聲器40的輸出)的清晰度和/或可理解性。例如,噪音類型參數(shù)306可以顯示車輛10中風(fēng)噪音的存在并且噪音水平參數(shù)304可以表示風(fēng)噪音的水平(例如,風(fēng)噪音的音量)。基于噪音水平參數(shù)304 (例如,低,中,高,或其他參數(shù)),可以改變(例如,使得更高或更低)提示或音頻程度406 (例如,與頻率相關(guān))。提示或音頻程度406的改變例如可以取決于噪音水平參數(shù)306的比率或以其他方式與噪音水平參數(shù)306相關(guān)的。例如,在比柔軟的車輛噪音更大的車輛噪音存在時,提示或音頻程度406可以進(jìn)一步改變(例如,與如果噪音水平參數(shù)304中或低相比,如果噪音水平參數(shù)304高,可以更高的改變)。在一些實施例中,基于噪音類型參數(shù)306和噪音水平參數(shù)304,提示或音頻程度306可以更低地減少或改變。根據(jù)一些實施例,修改模塊224通過增加或減少言語速率410,增加或減少音節(jié)持續(xù)時間412,和/或以其他方式修改從系統(tǒng)100的言語輸出(例如,經(jīng)由揚聲器40)例如可以修改文本至言語218輸出。言語速率410例如可以基于噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他信息修改。言語速率410例如可以修改以減少高噪音條件中提示的言語速率410 (例如,如果噪音水平參數(shù)306更高或其他值)。降低言語速率410例如可以增加在大聲或高噪音環(huán)境(例如,在具有大聲的車輛相關(guān)的聲音的車輛中)中語音對話的可理解性。在一些實施例中,言語速率410可以基于噪音類型參數(shù)306和噪音水平參數(shù)304增加以增加來自系統(tǒng)100的語音對語話頻提示的可理解性。根據(jù)一些實施例,提示音節(jié)持續(xù)時間412例如可以基于噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他信息修改。提示音節(jié)持續(xù)時間412例如可以包括輔音,元音,和/或與人言語相關(guān)的其他音節(jié)的發(fā)音的持續(xù)時間。音節(jié)持續(xù)時間412例如可以取決于或相對于噪音水平參數(shù)304按比例增加。例如,音節(jié)持續(xù)時間412相對于由噪音類型參數(shù)306和噪音水平參數(shù)304表不的車輛相關(guān)的聲音(例如,發(fā)動機噪音,HVAC系統(tǒng)噪音,風(fēng)噪音以及其他聲音)增加而增加(例如,音節(jié)發(fā)音的持續(xù)時間可以更長)。在一些實施例中,可以修改文本至言語218,音頻處理220,和/或其他類型的言語提示或聲頻輸出。修改模塊224例如可以使用Lombard類型或其他的言語修改。Lombard類型修改可以模擬人言語修改或在高聲環(huán)境,具有高背景噪音的環(huán)境,或其他高噪音水平環(huán)境中補償。Lombard類型修改例如可以包括從包括修改提示信號頻譜402,修改提示信號程度406,修改提示信號言語速率410,和修改提示信號音節(jié)持續(xù)時間412的組中選擇出的信號400修改的任何組合。Lombard類型修改例如可以取決于噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他信息。例如,顯示高的風(fēng)噪音可能存在時,風(fēng)的噪音類型參數(shù)306(例如,噪音_類型=風(fēng))和高的噪音水平參數(shù)304可以產(chǎn)生?;谠胍纛愋蛥?shù)306和噪音水平參數(shù)304,可以修改提示頻譜402,提示程度406,提示言語速率410,提示音節(jié)持續(xù)時間412,和/或其他提示參數(shù)的預(yù)定組合以增加提示的可理解性。在制造,試驗,適用320,或其他處理期間例如可以確定噪音類型參數(shù)306和噪音水平參數(shù)304的應(yīng)用預(yù)定組合的給定組合。預(yù)定組合例如可以是最佳地增加言語提示的可理解性,可懂性或清晰度的組合。根據(jù)一些實施例,可以適用320提示修改以改進(jìn)提示的清晰度和/或可理解性。與預(yù)定噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù)相關(guān)的提示修改224的有效性或影響進(jìn)行測量和適用或可以基于測量進(jìn)行改變。提示修改的有效性例如可以通過監(jiān)控使用者或乘員對修改提示的響應(yīng)進(jìn)行測量。例如,提示可以基于噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù)進(jìn)行修改并且乘員對提示的響應(yīng)可以測量。例如,提示可以引起或請求來自乘員的響應(yīng)。如果乘員對提示不作出響應(yīng),以不可預(yù)知的方式對提示作出響應(yīng)(例如,提供了混淆的響應(yīng)),或執(zhí)行其他動作,可以確定可以適用提示修改224以改進(jìn)提示的清晰度。在一個示例中,提示修改224例如可以通過使得提示修改224停用而適用。例如,如果確定提示修改224不改進(jìn)言語提示的清晰度或可理解性,可以停止或停用提示修改224(例如,提示修改模塊)。在一個示例中,提示修改224通過改變提示修改參數(shù)(例如,頻譜,程度,言語速率,音節(jié)持續(xù)時間,和/或其他提示修改參數(shù))可以修改。例如,提示頻譜402修改參數(shù)可以適用或改變以改進(jìn)言語提示的清晰度。提示頻譜402修改參數(shù)例如可以適合于加強或提高提示頻譜402的不同部分中的提示信號400??梢允褂闷渌倪m用方法。圖6是根據(jù)本發(fā)明的實施例的語音對話控制系統(tǒng)的方框圖。根據(jù)一些實施例,對話控制210或與語音對話系統(tǒng)100的其他系統(tǒng)或處理可以基于噪音類型參數(shù)304,噪音水平參數(shù)306,和/或其他參數(shù)進(jìn)行修改或改變224。對話控制動作500可以基于干擾曲線記錄180(例如,噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù))進(jìn)行修改224。對話控制作用500例如可以通過對話控制210模塊操作而執(zhí)行并且可以包括提示輸出到使用者,與輸入或輸出確定相關(guān)的動作,或其他操作。對話控制作用500例如可以包括解釋動作502,減少語義解釋器信任水平504,以及其他處理或操作。對話控制動作500例如可以基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他參數(shù))通過實施解釋動作502進(jìn)行修改。如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示在車輛10附近(例如,在車艙)可能存在高噪音,解釋動作502例如可以實施或利用。根據(jù)一些實施例,解釋動作502可以包括使用者輸入的清楚的確認(rèn),音頻提示或詢問使用者重復(fù)輸入,或以其他方式提示使用者解釋輸入。請求使用者輸入的清楚確認(rèn)的音頻提示508例如可以是輸出(例如,使用揚聲器40)。例如,使用者可以詢問(例如,輸入言語至語音對話系統(tǒng)請求信息)語音對話以尋找餐廳(例如,“最近的餐廳在哪里? ”)。如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示存在高水平或噪音(例如,車輛相關(guān)的噪音或聲音的高水平),語音對話模塊210例如可以輸出使用者語句的提示請求確認(rèn)。音頻提示508例如可以輸出,詢問使用者證實使用者正在尋找餐廳(例如,“你是否在說‘最近的餐廳在哪里? ’ ”)。如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示可能存在背景噪音,當(dāng)使用者輸入難以理解,或在其他時間時,每次使用者提供輸入時提示508可以輸出請求使用者輸入的清楚的確認(rèn)。可以使用其他的解釋動作或提示。根據(jù)一些實施例,解釋動作502可以包括詢問或請求使用者重復(fù)輸入。對話控制模塊210例如可以輸出提示,請求使用者重復(fù)它們的輸入。例如,如果使用者詢問語音對話系統(tǒng)100去尋找最近的酒店(例如,“最近的酒店在哪里”)并且噪音類型參數(shù)306和/或噪音水平參數(shù)304顯示可能發(fā)生高噪音水平(例如,噪音_水平=高),提示可以輸出,請求使用者重復(fù)它們的輸入。提示508例如可以輸出,詢問使用者重復(fù)他們的語句(例如,“請重復(fù)”,“我沒有聽清楚,請重復(fù)”,或其他重復(fù)的請求)。如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示可能存在背景噪音,當(dāng)使用者輸入難以理解,或在其他時間時,每次使用者提供輸入時提示508可以輸出請求使用者重復(fù)他們的輸入??梢允褂闷渌慕忉寗幼?02。根據(jù)一些實施例,可以鼓勵解釋動作502和/或通過改變語義解釋器信任水平504(例如,通過減少信任水平504或以其他方式改變信任水平504)可以增加解釋動作502的可能性。信任水平504可以基于噪音類型參數(shù)306和噪音水平參數(shù)304進(jìn)行改變或修改。信任水平504例如可以表示來自使用者的字串,短語,或其他言語輸入(例如,“為我找酒店”)與語音對話系統(tǒng)實體170中的對話動作相匹配或相對應(yīng)(例如,通知(類型=酒店))的可能性或確定性。信任水平504例如可以是表示字串與語音對話系統(tǒng)實體170中的對話動作匹配的信任度,可能性,或概率的百分比,數(shù)值,或其他參數(shù)。信任水平504例如可以與由語義解釋器206產(chǎn)生的對話動作相關(guān)聯(lián)。對話動作和相關(guān)的信任水平504例如可以從語義解釋器206輸出到對話控制模塊210。對話控制模塊210例如可以基于對話動作和相關(guān)的信任水平504產(chǎn)生輸出到使用者的響應(yīng)。例如,如果信任水平504低于閾值信任水平506,對話控制模塊504可以執(zhí)行解釋動作502 (例如,請求使用者輸入的清楚的確認(rèn),請求使用者重復(fù)輸入,以及其他解釋動作)。如果與對話動作相關(guān)的信任水平504高于閾值信任水平506,對話動作可以視為使用者的輸入的正確解釋(例如,使用者的語音對話轉(zhuǎn)換為字串)并且對話控制模塊210例如可以產(chǎn)生響應(yīng),執(zhí)行動作,或以其他方式響應(yīng)于對話動作。根據(jù)一些實施例,從語義解釋器206輸出的信任水平504例如可以基于噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他信息進(jìn)行修改或減少。例如,如果噪音水平參數(shù)304顯示可能存在車輛相關(guān)的噪音超過預(yù)定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來自語義解釋器的信任水平504輸入。在一些實施例中,如果噪音類型參數(shù)306和/或噪音水平參數(shù)304顯示對高的噪音水平的緩和在車輛10中可能發(fā)生(例如,車輛客艙中),信任水平504例如可以從百分之九十(例如,90%)減少至例如百分之八十(例如,80%)或其他值??梢允褂闷渌男湃嗡?04。信任水平504中的減少例如可以是非線性的。無論噪音類型參數(shù)306和/或噪音水平參數(shù)304顯示背景噪音是否可能存在,超過預(yù)定邊界信任水平的信任水平504例如可以不減少或改變。例如,當(dāng)?shù)陀谶吔玳撝?例如,百分之九十五或其他值)的信任水平504可能減少的同時,超過邊界閾值(例如,百分之九十五或其他值)信任水平504 (例如,與對話動作相關(guān)的)可以不改變或減少??梢允褂闷渌倪吔玳撝?。根據(jù)一些實施例,可以適用320給定干擾曲線記錄(例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他信息)的對話控制動作500的修改。例如,通過測量噪音類型參數(shù)306和/或噪音水平參數(shù)304與對話控制210成功或功能之間的相互關(guān)系,可以適用對話控制動作500 (例如,執(zhí)行解釋動作502,減少信任水平504,以及其他修改)的修改。在適用處理320中例如可以確定給定干擾曲線記錄180的對話控制210的最佳修改。用于給定干擾曲線記錄180的對話控制的最佳修改可以是對使用者最少麻煩的和/或最佳改進(jìn)系統(tǒng)100功能的修改。例如,噪音類型參數(shù)306與噪音水平參數(shù)304可以顯示高的風(fēng)噪音可能存在并且語義解釋器信任水平504可以基于噪音類型參數(shù)306和噪音水平參數(shù)304修改224??梢詼y量具有修改的信任水平504的對話控制210功能(例如,對話控制210的成功或?qū)υ捒刂?10成功)?;趯υ捒刂?10是否輸出對使用者輸入的適當(dāng)?shù)捻憫?yīng),例如可以測量對話控制210功能或成功。例如,如果使用者輸入對最近加油站的位置的請求(例如,“最近的加油站在哪里? ”),對話控制210響應(yīng)列出的加油站將被認(rèn)為是對話成功而來自對話控制210的無關(guān)主題音頻提示508 (例如,“最近的餐廳是餐廳A和餐廳B”)輸出將不會認(rèn)為成功??梢允褂闷渌某晒y量方法?;趯υ捒刂?10功能或成功的測量,給定干擾曲線記錄180的對話控制動作500可以適用以改進(jìn)對話控制210系統(tǒng)的功能。例如,當(dāng)噪音類型參數(shù)306和噪音水平參數(shù)304顯示高的風(fēng)噪音可能存在時,適用320可以確定解釋動作502 (例如,使用者輸入的清楚的確認(rèn),要求使用者重復(fù)輸入)比減少語義解釋器信任水平504更有效。例如,當(dāng)噪音類型參數(shù)306和噪音水平參數(shù)304顯示高的發(fā)動機噪音可能存在時,適用320可以確定減少信任水平504 (例如,通過預(yù)定信任水平減少參數(shù)或量)對使用者是最有效和最少麻煩的。例如,對話控制動作500的修改224 (例如,實施解釋動作502,減少信任水平504,以及其他修改)例如可以適于使用給定組的噪音類型參數(shù)306和噪音水平參數(shù)304的最有效和最少麻煩的對話控制動作500。根據(jù)一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他信息)可以導(dǎo)入和/或修改音頻提示508。提示例如可以包括來自系統(tǒng)100的信息輸出并且可以響應(yīng)于使用者輸入通過對話控制模塊210產(chǎn)生。提示508可以響應(yīng)于使用者輸入從系統(tǒng)100典型地輸出以提供信息至使用者,或用于其他功能。在一些實施例中,提示508可以通知使用者由于高的背景噪音語音對話系統(tǒng)100功能和/或性能可能減少或改變。例如提示508可以基于噪音類型參數(shù)306和/或噪音水平參數(shù)304產(chǎn)生。提示508例如可以設(shè)置語音對話系統(tǒng)100性能的使用者的期望(例如,系統(tǒng)100性能可能減少),為使用者準(zhǔn)備不同的交互作用類型(例如,通知使用者系統(tǒng)100可以請求使用者解釋語句,重復(fù)語句,并且執(zhí)行其他的功能),或以其他方式通知使用者在背景噪音存在時系統(tǒng)100性能可能改變。噪音類型參數(shù)306和噪音水平參數(shù)304例如可以顯示高的風(fēng)噪音。基于顯示高的風(fēng)噪音的噪音類型參數(shù)306和噪音水平參數(shù)304,通過對話控制模塊210可以產(chǎn)生提示508并且輸出至使用者(例如,使用揚聲器40)。提示508例如可以設(shè)置具有高的風(fēng)噪音的系統(tǒng)100性能的使用者期望。例如,提示可以是“請注意在高速時窗戶打開時聲音識別是困難的”或其他的提示508。基于提示508,使用者可以考慮關(guān)閉車輛窗戶以改進(jìn)系統(tǒng)100性能。在一些實施例中,提示508可以基于為使用者準(zhǔn)備的不同的語音對話交互作用類型的噪音類型參數(shù)306和噪音水平參數(shù)304。提示508例如可以是“聲音識別很困難,我可以請求進(jìn)一步解釋,請原諒,你想去哪里? ”或其他提示。基于提示508,使用者的期望可以管理并且使用者例如可以準(zhǔn)備或預(yù)先警告系統(tǒng)100可能輸出進(jìn)一步解釋動作502 (例如,請求解釋,重復(fù),以及其他解釋)和/或系統(tǒng)100功能可能修改(例如,補償背景噪音的高水平)。根據(jù)一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他信息)可以修改或控制提示508的速度和/或定時。提示508輸出的定時例如可以修改或推遲以在當(dāng)?shù)捅尘霸胍?例如,車輛相關(guān)的聲音)可能存在于車輛10中時輸出提示508。例如,噪音類型參數(shù)306和噪音水平參數(shù)304可以顯示高的發(fā)動機噪音可能存在于車輛中(例如,噪音_類型=發(fā)動機并且噪音_水平=高)。高的發(fā)動機噪音的噪音類型參數(shù)306和噪音水平參數(shù)304例如可以顯示發(fā)動機RPM可能高(例如,駕駛員可能加速車輛10)?;陲@示高的發(fā)動機噪音的噪音類型參數(shù)306和噪音水平參數(shù)304,對話控制210可能延遲提示508輸出。對話控制210例如可以延遲提示508輸出,直到噪音水平參數(shù)304顯示發(fā)動機噪音可能減少為止。在一些實施例中,對話控制210可能在預(yù)定一段時間延遲提示508輸出。例如可以是車輛加速的典型的或平均時間量的預(yù)定一段時間可以基于典型的駕駛員特性(例如,典型的加速時間),或可能是其他時間段。典型的或平均加速時間例如可以在車輛試驗,制造期間,或在語音對話適用處理320期間確定。根據(jù)一些實施例,對話類型514可以修改以改變或減少語法困惑510或基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他信息)。語法困惑510例如可以是在給定時間由語音識別模塊或裝置204使用的語音識別語法的復(fù)雜度。對話控制模塊210例如可以基于干擾曲線記錄180確定語法困惑。語法困惑510例如可以通過執(zhí)行單個口識別,強制使用精確的措辭,避免混合的創(chuàng)造,和/或使用其他的技術(shù)或方法進(jìn)行減少或修改。語法困惑510例如可以基于噪音類型參數(shù)306和噪音水平參數(shù)304減少或改變。例如,噪音類型參數(shù)306和噪音水平參數(shù)304可以顯示高的風(fēng)噪音(例如噪音_類型=風(fēng),噪音_水平=高)可能存在?;陲@示高的風(fēng)噪音的噪音類型參數(shù)306和噪音水平參數(shù)304,對話控制210可以通過執(zhí)行單個口識別,強制使用精確的措辭,避免混合的創(chuàng)造,和/或執(zhí)行其他的動作減少語法困惑510。單個口識別例如可以通過減少或修改復(fù)雜的提示而減少語法困惑510,該減少或修改復(fù)雜的提示請求多個口或類型的信息為請求減少數(shù)目或單個口的信息的多個較簡單的音頻提示。例如,“你喜歡聽什么音樂”的復(fù)雜的提示可以修改或簡化為多個單個口提示“請輸入音樂名稱”,后面跟隨“請輸入藝術(shù)家”和/或其他的提示。當(dāng)然可以使用與其他主題相關(guān)的其他提不。在一些實施例中,通過強制使用來自使用者(例如,車輛乘員)的精確的措辭,可以修改對話類型514以減少語法困惑510。來自使用者的精確的措辭可以通過提示使用者提供精確的響應(yīng)而不是一般的響應(yīng)而強制使用。例如,其可能引起來自使用者的許多不同的響應(yīng)的提示508 “你想要哪個服務(wù)”,可以修改為可以引出來自使用者的具體的或精確的措辭的“請說出一個:a.音樂,b.方向,c.氣候控制”的提示。如果噪音類型參數(shù)306和/或噪音水平參數(shù)304顯示車輛中可能存在高的噪音水平(例如,風(fēng),發(fā)動機,HVAC系統(tǒng),音頻重放或其他噪音)對話控制模塊210可以強制使用來自使用者的精確的措辭。當(dāng)然可以使用與其他追相關(guān)的其他提示。在一些實施例中,對話類型514可以通過減少混合的初始對話類型514進(jìn)行修改以減少語法困惑510?;旌系某跏紝υ掝愋?14例如可以允許使用者響應(yīng)他們沒有問的問題。如果噪音類型參數(shù)306和/或噪音水平參數(shù)304顯示可能存在超過閾值的噪音水平,混合的創(chuàng)造例如可以停止或停用以減少語法困惑510。例如,對話控制210可以輸出請求一種信息的提示(例如,“你想尋找什么類型的酒店”),并且混合的創(chuàng)造可以允許使用者提供無關(guān)的主題響應(yīng)(例如,“最近的餐廳在哪里? ”)??梢允褂门c其他主題相關(guān)的其他提示508。停止混合的創(chuàng)造例如可以需要使用者響應(yīng)所問的問題,而不允許使用者改變話題主題。如果使用者提供與問題無關(guān)的主題響應(yīng),對話控制模塊210可以請求使用者響應(yīng)所問的問題。根據(jù)一些實施例,可以適用320給定干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他參數(shù)或信息)的對話類型514的修改。對話類型514修改224(例如,改變語法困惑510或其他的對話類型修改)例如可以通過測量基于干擾曲線記錄180(例如,噪音類型參數(shù)306和/或噪音水平參數(shù)304)的對話類型514的修改與對話控制210成功或功能之間的相互關(guān)系而適用??梢源_定用于給定干擾曲線記錄180的對話類型514或語法困惑510減少方法的最佳修改(例如,單個口識別,強制使用精確措辭,避免混合的創(chuàng)造,或其他語法困惑減少方法)。用于給定干擾曲線記錄180的對話類型514的最佳修改可以是對使用者最少麻煩,最改進(jìn)系統(tǒng)100功能,和/或引起對話成功的修改。對話類型514的最佳修改例如可以通過測量在有和沒有對話類型514或語法困惑510的修改的情況下對話控制210成功而確定??梢员容^與對話類型514或語法困惑510的不同類型的修改相關(guān)的測量的對話控制成功以確定最改進(jìn)對話控制成功的對話類型514或語法困惑510的修改。例如,干擾曲線記錄180 (例如,噪音類型參數(shù)306和噪音水平參數(shù)304)可以顯示高HVAC相關(guān)的噪音可能存在并且語法困惑510可能基于干擾曲線記錄180減少或修改224。語法困惑510例如可以通過修改對話類型514以強制使用精確措辭而減少(例如,提示使用者從選項列表中選擇(例如,“請說一個:a.音樂,b.方向,或c.油”代替“你想要那種服務(wù)? ”))??梢詼y量具有精確措辭的強制使用(例如,減少的語法困惑510)的對話控制210成功(例如,對話控制系統(tǒng)210的成功)。對話控制210功能或成功例如可以基于使用者是否正確地完成對話動作(例如,響應(yīng)于提示),使用者是否獲得正確的對話結(jié)果(例如,使用者發(fā)現(xiàn)他們尋找的東西),或基于其他的度量或參數(shù)而測量。具有精確措辭的強制使用(例如,減少的語法困惑510)的對話控制210成功(例如,對話控制系統(tǒng)210的成功)可以與沒有精確措辭的對話控制210成功或具有對話類型514或語法困惑510的其他類型的修改的對話控制成功210進(jìn)行比較。例如,其確定基于某一干擾曲線記錄180 (例如,噪音類型參數(shù)306和噪音水平參數(shù)304)的一種對話類型514修改以減少語法困惑510 (例如,單個口識別)可以引起減少的對話控制成功或比另一種對話類型514修改和/或沒有修改以減少語法困惑510的更少成功?;谠摯_定,給定某一干擾曲線記錄180的一種對話類型514可能在增加對話成功中較少成功或不成功,該類型的對話類型514修改例如可以停止,適用,和/或由不同類型的對話類型514修改替代。例如,適用320可以確定當(dāng)噪音類型參數(shù)306和噪音水平參數(shù)304顯示可能存在高的HVAC噪音或其他車輛相關(guān)的噪音時通過強制使用精確措辭減少語法困惑510可能比避免混合的創(chuàng)造更有效。例如,適用320可以確定當(dāng)噪音類型參數(shù)306和噪音水平參數(shù)304顯示可能存在高的HVAC噪音時通過強制使用精確措辭減少語法困惑510可能對使用者最有效和最少麻煩。根據(jù)一些實施例,基于干擾曲線記錄180 (例如,噪音水平參數(shù)304,噪音類型參數(shù)306,以及其他信息)對話控制210可以監(jiān)控(例如,收聽)并且響應(yīng)使用者混淆516。如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示在車輛10中或圍繞車輛10可能存在高的噪音水平,對話控制210例如可以修改以監(jiān)控或收聽并且響應(yīng)使用者的混淆516。為了監(jiān)控并且響應(yīng)使用者混淆516,對話控制210例如可以修改以識別來自使用者的解釋請求輸入。解釋請求(例如,由使用者說出)例如可以包括措辭,諸如“重復(fù)”,“我聽不見你”,“重復(fù)該提示”,“不清楚”,“什么? ”,或其他措辭。來自使用者的解釋請求例如可以由對話控制210響應(yīng)。對話控制210例如可以通過重復(fù)最后的提示輸出,改述最后提示,或執(zhí)行其他動作來響應(yīng)來自使用者的解釋請求。提示508 (例如,“最近的餐廳是ABC飯館”或其他提示)例如可以通過改變提示508中措辭的順序而改述(例如,“ABC是最近的餐廳”)??梢允褂闷渌奶崾尽8鶕?jù)一些實施例,基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,和/或其他信息)可以修改多種形式,多功能,或其他類型的對話。多種形式對話512例如可以包括結(jié)合觸覺,視覺的語音對話,或其他對話。多種形式對話512例如可以包括請求使用者輸入信息至觸覺裝置(例如,輸入裝置44或其他裝置)的語音對話音頻提示??梢允褂闷渌愋偷亩喾N形式對話512。在一些實施例中,如果噪音類型參數(shù)306和噪音水平參數(shù)304顯示在車輛10中或圍繞車輛10可能存在高水平的噪音,多種形式的對話512例如可以通過恢復(fù)成或證實為在言語提示上的可見顯示,通過恢復(fù)成或切換為系統(tǒng)假設(shè)的可見顯示(例如,問題,請求信息,或其他提示),提示或請求來自使用者的觸覺確認(rèn)(例如,從顯示在觸摸屏或其他輸出裝置上的響應(yīng)列表中選擇響應(yīng)),鼓勵觸覺形式的使用(例如,減少語義解釋器的信任),從言語切換到應(yīng)用功能的子集的其他形式(例如,通過觸覺裝置的簡單命令和控制),或其他修改進(jìn)行修改?;谠胍纛愋蛥?shù)306和噪音水平參數(shù)304,對話控制模塊210例如可以通過顯示問題,詢問信息,以及輸出裝置42 (例如顯示屏)上其他類型的提示轉(zhuǎn)換成系統(tǒng)假設(shè)的可見顯示。例如使用者可以要求觸覺確認(rèn)。對話控制210例如可以要求使用者使用觸覺裝置,輸入裝置44 (例如,鍵盤,觸摸屏,或其他輸入裝置)和/或其他裝置確認(rèn)對話提示508 (例如,語音對話提示)或來自系統(tǒng)100的其他信息輸出進(jìn)行響應(yīng)。系統(tǒng)100例如可以使用揚聲器40,輸出裝置42,或其他裝置輸出語句“請通過輸入是確認(rèn)你說過酒店”,并且使用者可以通過輸入響應(yīng)(例如,按下按鈕,輸入“是”或其他的響應(yīng))至輸入裝置44或其他裝置提供觸覺確認(rèn)。在一些實施例中,對話控制模塊210可以要求使用者從選項列表中選擇響應(yīng)。例如,系統(tǒng)100可以提示使用者使用觸覺裝置,輸入裝置44 (例如,鍵盤,觸摸屏,或其他輸入裝置),和/或其他裝置從一列選項中選擇選項。系統(tǒng)100例如可以輸出提示“請在觸摸屏上選擇類別:酒店,餐廳,或加油站”并且使用者可以通過在觸覺裝置,輸入裝置44,和/或其他裝置上輸入選擇的選項(例如,酒店,餐廳,或加油站)而響應(yīng)提示。根據(jù)一些實施例,修改模塊224例如可以通過改變語義解釋器信任水平504而鼓勵或增加觸覺對話的使用。例如如果信任水平504低于閾值信任水平506,對話控制模塊504可以請求觸覺確認(rèn),觸覺選擇,或來自使用者的其他類型的輸入。如果與對話動作相關(guān)的信任水平504高于閾值信任水平506,對話動作可以視為使用者輸入的正確解釋,并且系統(tǒng)100可以基于對話控制使用言語(例如,系統(tǒng)100可以不請求觸覺確認(rèn),觸覺選擇,或來自使用者的其他類型的輸入)。信任水平504例如可以基于干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,或其他信息)而減少。例如,如果干擾曲線記錄180 (例如,噪音水平參數(shù)304)顯示可能存在車輛噪音相關(guān)的噪音超過預(yù)定閾值(例如,噪音_水平=中,噪音_水平=高,或其他噪音_水平值),可以減少來自語義解釋器的信任水平504輸入。信任水平504例如可以是與語音識別中的確定性相關(guān)或取決于語音識別中的確定性的連續(xù)的值(例如,在0%與100%之間或其他數(shù)值范圍)。基于干擾曲線記錄180,信任水平504例如可以從第一信任水平值改變(例如,減小或增加)至第二信任水平值(例如,信任水平值小于第一信任水平值)。信任水平504例如可以根據(jù)函數(shù)(例如,連續(xù)函數(shù))改變(例如,減少或增加)。如果噪音水平參數(shù)304顯示零或低背景噪音(例如,噪音水平參數(shù)=低),信任水平504例如可以是百分之九十五(例如,95%)或任意其他值。如果干擾曲線記錄180顯示降低至高噪音水平在車輛10中可能存在,信任水平504例如可以從第一值(例如,百分之九十五或其他值)例如減少至第二值(例如,百分之八十或其他值),其例如小于第一值。如果干擾曲線記錄180 (例如,噪音類型參數(shù)306和/或噪音水平參數(shù)304)顯示高的背景噪音,減少信任水平504可以增加對話控制210可請求觸覺確認(rèn),來自使用者的選擇或其他觸覺輸入的可能性。根據(jù)一些實施例,多種形式對話可以通過從言語至系統(tǒng)100功能(例如,預(yù)定后端應(yīng)用212功能)的子集的其他形式(例如,觸覺輸入,視覺輸出,和/或其他形式)切換而修改?;谠胍纛愋蛥?shù)306,噪音水平參數(shù)304,和/或其他信息,一個或多個后端應(yīng)用212可以從基于言語的形式至非言語的言語形式(例如,觸覺或其他形式)進(jìn)行切換。其他后端應(yīng)用212例如可以不切換至非言語形式(例如,控制和/或命令可以保持基于言語)。例如,如果噪音類型參數(shù)306與噪音水平參數(shù)304顯示高的發(fā)動機噪音(例如,噪音_類型=發(fā)動機,噪音_水平=高),當(dāng)其他后端應(yīng)用212可不從言語切換至基于觸覺的控制的同時,預(yù)定后端應(yīng)用212 (例如,收音機,地圖,語音搜索,或其他后端應(yīng)用)功能(例如,控制和命令)可以從基于言語至基于觸覺的控制(例如,使用輸入裝置44)進(jìn)行切換。例如,如果聲音類型參數(shù)306和/或聲音水平參數(shù)304顯示背景噪音,語音搜索和/或其他的后臺應(yīng)用212可停止(例如,鎖定),并且基于言語的收音機控制和/或其他的后臺應(yīng)用212可以不停止(例如,可保持工作)。如果在車輛試驗,制造期間,或適用320期間,聲音類型參數(shù)306和/或聲音水平參數(shù)304顯示背景噪音,例如可以確定哪個后端應(yīng)用212切換至其他形式(例如,觸覺輸入或其他輸入模式)或停止。根據(jù)一些實施例,可以適用320給定干擾曲線記錄180 (例如,噪音類型參數(shù)306,噪音水平參數(shù)304,以及其他信息)的多種形式對話512的修改。通過測量噪音類型參數(shù)306和/或噪音水平參數(shù)304與對話控制210成功或功能之間的相關(guān)性,例如可以適用320多種形式對話512的修改224 (例如,恢復(fù)成可見顯示,請求觸覺確認(rèn),鼓勵觸覺形式的使用,從言語至應(yīng)用功能子集的其他形式的切換,和/或其他修改)。適用320例如可以確定用于給定干擾曲線記錄180的多種形式對話512的最佳修改(例如,恢復(fù)成可見顯示,請求觸覺確認(rèn),鼓勵觸覺形式的使用,從言語至應(yīng)用功能子集的其他形式的切換和/或其他修改)。用于給定干擾曲線記錄180的對話類型514的最佳修改可以是對使用者最少麻煩和/或最佳改進(jìn)系統(tǒng)100功能的修改。多種形式對話512修改策略或方法的適用320可以類似于對話類型514修改策略的適用,對話控制動作500的適用,以及其他適用320處理或方法。在一些實施例中,可以適用基于噪音類型曲線306和噪音水平曲線304的對話控制210操作的全部類型的修改224。如在此討論的,修改224的類型,可以包括對話控制動作500的修改,音頻提示508的導(dǎo)入,提示508的修改,對話類型514的修改(例如,以減少語法困惑510),監(jiān)控并且響應(yīng)使用者混淆516,多種形式對話512的修改,后端應(yīng)用212功能的修改,和/或其他類型的修改224??梢詼y量,估計,或計算基于噪音類型參數(shù)306和/或噪音水平參數(shù)304的對話成功與對話控制的修改之間的相關(guān)性。一種類型的對話控制210修改224的成功例如可以通過確定使用者是否對對話控制提示508提供了可預(yù)測的響應(yīng)(例如,使用者是否響應(yīng)了有關(guān)或無關(guān)主題),使用者是否提供了對提示508的任何響應(yīng),或使用其他方法進(jìn)行測量或估計。基于測量的對話控制成功,通過停止,停用,改變或切換對話控制修改224的類型,或以其他方式改變對話控制修改224,可以適用對話控制210處理與操作的修改。對話控制修改224操作例如可以通過變化與給定噪音類型參數(shù)306與噪音水平參數(shù)304相關(guān)的參數(shù)而改變。例如,可以改變語義解釋器信任水平504,可以改變與提示的速度和定時相關(guān)的參數(shù),可以改變或適用其他參數(shù)以改進(jìn)對話控制210成功??梢赃m用或改變其他參數(shù)和操作。圖7是根據(jù)本發(fā)明的實施例的方法的流程圖。在操作600中,音頻信號(圖3的音頻信號)可以接收在與車輛(例如,圖3的車輛10)相關(guān)聯(lián)的處理器中(例如圖2的處理器110或圖3的信號處理器202)。信號處理器202例如可以由處理器110全部或部分地實施。
操作610中,表示或?qū)?yīng)于一個或多個聲音的聲音相關(guān)的車輛信息(例如,圖2的聲音相關(guān)的車輛信息160,或與產(chǎn)生或引起聲音的車輛系統(tǒng)的操作相關(guān)的信號或信息)可以接收在處理器中(例如,圖3的干擾曲線模塊222)。在一些實施例中聲音相關(guān)的車輛信息不包括音頻信號。干擾曲線模塊222例如可以由處理器110全部或部分地實施。操作620中,干擾曲線記錄(例如,圖2的干擾曲線記錄180)可以基于聲音相關(guān)的車輛信息確定。干擾曲線記錄例如可以包括噪音類型參數(shù)(例如,圖4的噪音類型參數(shù)306),噪音水平參數(shù)(例如,圖4的噪音水平參數(shù)304),和/或其他參數(shù)。干擾曲線記錄例如可以基于多種類型的與聲音相關(guān)的車輛信息使用邏輯操作或其他數(shù)學(xué)操作確定。在一些實施例中,干擾曲線記錄可以通過量化聲音相關(guān)的車輛信息(例如,車輛發(fā)動機RPM信息)確定。操作630中,語音識別處理或系統(tǒng)(例如,在圖3的語音識別模塊204和/或信號處理器202中)基于聲音相關(guān)的車輛信息和/或干擾曲線記錄可以修改。語音識別例如可以基于干擾曲線記錄通過選擇或確定信號處理器(例如,信號處理器212),自動語音識別系統(tǒng)前端(例如,圖4的ASR前端314),或其他裝置中的濾波器(例如,圖4的濾波器312)以及濾波器參數(shù)(例如,圖4的濾波器參數(shù)322)進(jìn)行修改。濾波器例如可以應(yīng)用于音頻信號??梢援a(chǎn)生音頻信號中的響應(yīng)至對話命令(例如,由圖3的對話控制模塊210和/或響應(yīng)產(chǎn)生器214)并且響應(yīng)可以輸出(例如,經(jīng)由圖2的顯示42或揚聲器40)至車輛乘員??梢允褂闷渌虿煌盗械牟僮鳌1景l(fā)明的實施例可以包括用于執(zhí)行在此處描述的操作的裝置。這樣的裝置可以為所需目的特別地構(gòu)造,或可以包括通過存儲在計算機中的計算機程序有選擇地啟動或重新配置的計算機或處理器。這樣的計算機程序可以存儲在計算機可讀或處理器可讀的非臨時存儲介質(zhì),包括軟盤,光盤,CD-ROM,磁性光盤的任意類型的盤,只讀存儲器(R0M),隨機存取存儲器(RAM),電可編程只讀存儲器(EPR0M),電可擦除和可編程只讀存儲器(EEPR0M),磁或光學(xué)卡,或適于存儲電指令的任意其他類型的介質(zhì)。將要理解,各種編程語言可以用來實施在此處描述的本發(fā)明的教導(dǎo)。本發(fā)明的實施例可以包括物品,諸如非臨時的計算機或處理器可讀非臨時的存儲介質(zhì),例如存儲器,盤驅(qū)動器,或USB閃速存儲器編碼,包括或存儲指令,例如計算機可執(zhí)行指令,當(dāng)由處理器或控制器執(zhí)行時使得處理器或控制器執(zhí)行在此公開的方法。指令可以使得處理器或控制器執(zhí)行實現(xiàn)在此公開的方法的處理。在此公開了不同的實施例。某些實施例的特征可結(jié)合其他實施例的特征;因此某些實施例可結(jié)合多個實施例的特征。為了示出和描述的目的,已經(jīng)展現(xiàn)了本發(fā)明的實施例的上述描述。不旨在是排他的或?qū)⒈景l(fā)明限制為公開的精確形式。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,在上述教導(dǎo)下可做出許多修改,變化,替換,改變,以及等同形式。因此應(yīng)當(dāng)理解所附的權(quán)利要求旨在覆蓋落入本發(fā)明的真實精神內(nèi)的全部這樣的修改和變化。
權(quán)利要求
1.一種方法,包括: 在與車輛相關(guān)聯(lián)的處理器中接收音頻信號; 在處理器中接收表不一個或多個聲音的聲音相關(guān)的車輛信息,聲音相關(guān)的車輛信息不包括音頻信號;以及 基于聲音相關(guān)的車輛信息修改語音識別處理。
2.如權(quán)利要求1所述的方法,包括基于聲音相關(guān)的車輛信息確定干擾曲線記錄。
3.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄確定濾波器和濾波器參數(shù);以及 應(yīng)用濾波器至音頻信號。
4.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄選擇聲學(xué)模型;以及 使用聲學(xué)模型解碼言語。
5.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車輛信息修改語音識別處理包括: 基于干擾曲線記錄確定自動語音識別模塊前端中的濾波器和濾波器參數(shù);以及 將濾波器應(yīng)用至自動語音識別模塊前端中的音頻信號。
6.如權(quán)利要求2所述的方法,其中基于聲音相關(guān)的車輛信息確定干擾曲線記錄包括基于多種類型的聲音相關(guān)的車輛信息使用邏輯操作確定干擾曲線記錄。
7.如權(quán)利要求1所述的方法,包括: 在增強語音識別功能中基于聲音相關(guān)的車輛信息測量語音識別修改的成功;以及 基于測量的成功適用語音識別修改。
8.如權(quán)利要求1所述的方法,包括: 對音頻信號中的言語命令產(chǎn)生響應(yīng);以及 對車輛乘員輸出響應(yīng)。
9.一種系統(tǒng),包括: 存儲器; 與車輛相關(guān)聯(lián)的處理器,其用于: 接收音頻信號; 接收表不一個或多個聲音的聲音相關(guān)的車輛信息,聲音相關(guān)的車輛信息不包括音頻信號;以及 基于聲音相關(guān)的車輛信息修改語音識別處理。
10.一種方法,包括: 使用一個或多個與車輛相關(guān)聯(lián)的麥克風(fēng)測量聲音; 將表示聲音的信號傳送至自動語音識別系統(tǒng); 在控制器接收與引起聲音的車輛系統(tǒng)的操作相關(guān)的信息; 基于信息計算干擾曲線記錄,干擾曲線記錄表示噪音類型和噪音水平;以及 基于干擾曲線記錄改變語音識別。
全文摘要
本發(fā)明涉及使用聲音相關(guān)的車輛信息以增強語音識別的方法和系統(tǒng)。具體地,在與車輛相關(guān)聯(lián)的處理器中可以接收音頻信號??梢杂商幚砥鹘邮毡硎疽粋€或多個聲音的聲音相關(guān)的車輛信息。聲音相關(guān)的車輛信息可以或可以不包括音頻信號?;诼曇粝嚓P(guān)的車輛信息可以修改語音識別處理或系統(tǒng)。
文檔編號G10L15/20GK103208284SQ201310019218
公開日2013年7月17日 申請日期2013年1月17日 優(yōu)先權(quán)日2012年1月17日
發(fā)明者E.茨爾克爾-漢科克, O.尖霍尼 申請人:通用汽車環(huán)球科技運作有限責(zé)任公司