用于調(diào)整用于激活話音輔助功能的檢測(cè)閾值的方法及設(shè)備的制造方法
【專利說明】用于調(diào)整用于激活話音輔助功能的檢測(cè)閾值的方法及設(shè)備
[0001 ] 相關(guān)申請(qǐng)案的交叉參考
[0002]本申請(qǐng)案主張2013年9月17日申請(qǐng)的共同擁有的美國(guó)非臨時(shí)專利申請(qǐng)案第14/029,131號(hào)的優(yōu)先權(quán),所述申請(qǐng)案的內(nèi)容以全文引用的方式并入本文中。
技術(shù)領(lǐng)域
[0003]本發(fā)明大體上涉及用于激活移動(dòng)裝置中的話音輔助功能的方法。更具體來說,本發(fā)明涉及調(diào)整用于檢測(cè)移動(dòng)裝置中的目標(biāo)關(guān)鍵字的閾值。
【背景技術(shù)】
[0004]近年來,例如智能電話及平板計(jì)算機(jī)等移動(dòng)裝置的使用已變得普遍。此類移動(dòng)裝置一般允許無線網(wǎng)絡(luò)上的話音及數(shù)據(jù)通信。通常,這些裝置包含額外的特征或應(yīng)用,其提供經(jīng)設(shè)計(jì)以增強(qiáng)用戶便利性的多種功能。
[0005]在此類應(yīng)用或特征之間,話音輔助應(yīng)用使得移動(dòng)裝置能夠從用戶接收語(yǔ)音命令以用于響應(yīng)于所述語(yǔ)音命令操作各種功能或其它應(yīng)用。例如,話音輔助應(yīng)用可允許用戶說出語(yǔ)音命令以調(diào)用所要的電話號(hào)碼、播放音頻文件、拍攝圖片、搜索因特網(wǎng)或獲得天氣信息,而不需要用手物理地操作移動(dòng)裝置。因此,用戶可選擇使用語(yǔ)音命令在其中用戶可能不希望或不可物理地操作移動(dòng)裝置的多種情形中控制移動(dòng)裝置的各種操作。
[0006]常規(guī)的話音輔助應(yīng)用經(jīng)常響應(yīng)于用戶的物理輸入(例如,用手)而被激活。然而,由于使用話音輔助應(yīng)用的目的中的一者可為在沒有物理輸入的情況下操作移動(dòng)裝置,所以用戶可發(fā)現(xiàn)不方便或難以物理地激活話音輔助應(yīng)用。因此,一些移動(dòng)裝置允許用戶通過說出語(yǔ)音命令而激活所述話音輔助應(yīng)用。
[0007]然而,此類移動(dòng)裝置經(jīng)常錯(cuò)誤地響應(yīng)于由裝置所俘獲的各種輸入聲音而被激活或無法響應(yīng)于恰當(dāng)?shù)恼Z(yǔ)音命令而被激活。例如,移動(dòng)裝置可錯(cuò)誤地將另一人的話語(yǔ)辨識(shí)為恰當(dāng)?shù)恼Z(yǔ)音命令且激活話音輔助應(yīng)用。另一方面,在移動(dòng)裝置處于響亮的環(huán)境中時(shí),移動(dòng)裝置可歸因于背景噪聲而辨識(shí)不出恰當(dāng)?shù)恼Z(yǔ)音命令且因此無法激活話音輔助應(yīng)用。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供用于通過基于閾值檢測(cè)輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的方法及裝置,所述閾值可根據(jù)裝置的情境進(jìn)行調(diào)整。
[0009]根據(jù)本發(fā)明的一個(gè)方面,揭示一種用于激活移動(dòng)裝置中的話音輔助功能的方法。所述方法包含通過聲音及接收輸入聲音流且確定所述移動(dòng)裝置的情境。在此方法中,基于所述情境而調(diào)整用于激活所述話音輔助功能的閾值。所述方法基于所述經(jīng)調(diào)整的閾值從所述輸入聲音流檢測(cè)目標(biāo)關(guān)鍵字。如果檢測(cè)到所述目標(biāo)關(guān)鍵字,那么所述方法激活所述話音輔助功能。本發(fā)明還描述與此方法相關(guān)的設(shè)備、裝置、裝置組合及計(jì)算機(jī)可讀媒體。
[0010]根據(jù)本發(fā)明的另一方面,一種用于激活話音輔助功能的移動(dòng)裝置包含聲音傳感器、閾值調(diào)整單元及話音激活單元。所述聲音傳感器經(jīng)配置以接收輸入聲音流。所述閾值調(diào)整單元經(jīng)配置以通過確定移動(dòng)裝置的情境而調(diào)整用于激活話音輔助功能的閾值。所述話音激活單元經(jīng)配置以在基于經(jīng)調(diào)整的閾值從輸入聲音流檢測(cè)到目標(biāo)關(guān)鍵字的情況下激活所述話音輔助功能。
【附圖說明】
[0011]當(dāng)結(jié)合附圖閱讀時(shí),通過參考以下詳細(xì)描述將理解本發(fā)明的發(fā)明性方面的實(shí)施例。
[0012]圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在確定移動(dòng)裝置的情境是在車輛中時(shí)經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置。
[0013]圖2說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在用戶可能將清醒時(shí)在確定移動(dòng)裝置的情境是在早晨的情況下經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置。
[0014]圖3說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在用戶可能睡著時(shí)在確定移動(dòng)裝置的情境是在夜晚的情況下經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置。
[0015]圖4說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在確定移動(dòng)裝置的情境是在包袋中時(shí)經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置。
[0016]圖5說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在接收文本消息的情境中經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置。
[0017]圖6說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以通過基于移動(dòng)裝置的情境調(diào)整用于檢測(cè)目標(biāo)關(guān)鍵字的閾值而從輸入聲音流檢測(cè)目標(biāo)關(guān)鍵字的移動(dòng)裝置的框圖。
[0018]圖7說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動(dòng)裝置中的經(jīng)配置以輸出用于確定移動(dòng)裝置的情境的聲音流及傳感器數(shù)據(jù)的傳感器單元的框圖。
[0019]圖8說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動(dòng)裝置中的經(jīng)配置以通過推斷移動(dòng)裝置的情境而確定用于激活話音輔助功能的檢測(cè)閾值的閾值調(diào)整單元的框圖。
[0020]圖9是根據(jù)本發(fā)明的一個(gè)實(shí)施例的在移動(dòng)裝置中執(zhí)行的用于通過推斷移動(dòng)裝置的情境而確定用于激活話音輔助功能的檢測(cè)閾值的方法的流程圖。
[0021]圖10是根據(jù)本發(fā)明的一個(gè)實(shí)施例的在移動(dòng)裝置中執(zhí)行的用于產(chǎn)生經(jīng)調(diào)整的檢測(cè)閾值且在指定時(shí)間周期之后將檢測(cè)閾值復(fù)位到預(yù)定檢測(cè)閾值的方法的流程圖。
[0022]圖11說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動(dòng)裝置中的經(jīng)配置以通過基于經(jīng)調(diào)整的檢測(cè)閾值檢測(cè)輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的話音激活單元的框圖。
[0023]圖12是根據(jù)本發(fā)明的一個(gè)實(shí)施例的在移動(dòng)裝置中執(zhí)行的用于基于經(jīng)調(diào)整的檢測(cè)閾值檢測(cè)輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的方法的流程圖。
[0024]圖13說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的無線通信系統(tǒng)中的移動(dòng)裝置的框圖,其中根據(jù)移動(dòng)裝置的情境而調(diào)整用于基于檢測(cè)閾值檢測(cè)輸入聲音流中的目標(biāo)關(guān)鍵字的方法及設(shè)備。
【具體實(shí)施方式】
[0025]現(xiàn)在將詳細(xì)參考各種實(shí)施例,在附圖中說明所述實(shí)施例的實(shí)例。在以下詳細(xì)描述中,陳述眾多具體細(xì)節(jié)以便提供對(duì)本發(fā)明的透徹理解。然而,對(duì)于所屬領(lǐng)域的一般技術(shù)人員將是顯而易見的是可在沒有這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其它情況下,未詳細(xì)描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會(huì)不必要地混淆各種實(shí)施例的各方面。
[0026]圖1說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在確定移動(dòng)裝置110的情境是在車輛130中時(shí)經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置110。在此所說明的實(shí)施例中,移動(dòng)裝置110的用戶120在駕駛車輛130,同時(shí)移動(dòng)裝置110放置在車輛130的乘客座椅上。圖1的移動(dòng)裝置110可為配備有用于在輸入聲音中辨識(shí)用戶的語(yǔ)音的語(yǔ)音辨識(shí)功能的智能電話。
[0027]在激活移動(dòng)裝置110中的話音輔助功能時(shí),移動(dòng)裝置110可使用語(yǔ)音辨識(shí)功能響應(yīng)于各種口頭請(qǐng)求、指令、命令及來自用戶120單獨(dú)的類似者。例如,用戶120可在已經(jīng)激活話音輔助功能時(shí)說出例如“呼叫SUSAN”的指令。作為響應(yīng),移動(dòng)裝置110辨識(shí)所述指令且使用與所辨識(shí)的姓名相關(guān)聯(lián)的電話號(hào)碼呼叫Susan。移動(dòng)裝置110中的話音輔助功能可響應(yīng)于經(jīng)由移動(dòng)裝置110的按鈕或觸摸屏的輸入而被激活。
[0028]在一些實(shí)施方案中,在來自用戶120的輸入聲音中檢測(cè)到目標(biāo)關(guān)鍵字時(shí),移動(dòng)裝置110存儲(chǔ)用于激活話音輔助功能的預(yù)定目標(biāo)關(guān)鍵字。如本文所用,術(shù)語(yǔ)“目標(biāo)關(guān)鍵字”是指可用于激活移動(dòng)裝置110中的功能或應(yīng)用的一或多個(gè)字或聲音的任何數(shù)字或模擬表示。舉例來說,例如“HEY話音輔助”或“開始話音輔助”等預(yù)定關(guān)鍵字可存儲(chǔ)在移動(dòng)裝置110中以作為用于激活話音輔助功能的目標(biāo)關(guān)鍵字。在從用戶120接收輸入聲音時(shí),移動(dòng)裝置110可通過對(duì)所接收的輸入聲音執(zhí)行語(yǔ)音辨識(shí)功能而檢測(cè)輸入聲音中的目標(biāo)關(guān)鍵字。
[0029]移動(dòng)裝置110可經(jīng)配置以基于檢測(cè)閾值而檢測(cè)目標(biāo)關(guān)鍵字以確保所要的置信水平。在一個(gè)實(shí)施例中,移動(dòng)裝置110計(jì)算輸入聲音與目標(biāo)關(guān)鍵字之間的類似性程度(或關(guān)鍵字匹配得分)且將類似性程度與檢測(cè)閾值進(jìn)行比較。在計(jì)算類似性程度中,可使用目標(biāo)關(guān)鍵字的預(yù)設(shè)聲音模型。如果輸入聲音與目標(biāo)關(guān)鍵字(或聲音模型)之間的類似性程度超過檢測(cè)閾值,那么移動(dòng)裝置110檢測(cè)輸入聲音中的目標(biāo)關(guān)鍵字且激活話音輔助功能。另一方面,如果類似性程度未超過檢測(cè)閾值,那么移動(dòng)裝置110確定未在輸入聲音中檢測(cè)到目標(biāo)關(guān)鍵字。
[0030]所述檢測(cè)閾值影響在檢測(cè)輸入聲音中的目標(biāo)關(guān)鍵字中的準(zhǔn)確度。例如,如果檢測(cè)閾值過高,那么移動(dòng)裝置110可從包含目標(biāo)關(guān)鍵字的輸入聲音檢測(cè)不到目標(biāo)關(guān)鍵字。在此情況下,移動(dòng)裝置110可“未命中”輸入聲音中的目標(biāo)關(guān)鍵字,且導(dǎo)致目標(biāo)關(guān)鍵字的增加的未命中率。另一方面,如果檢測(cè)閾值過低,那么移動(dòng)裝置110可在不包含目標(biāo)關(guān)鍵字的輸入聲音中錯(cuò)誤地檢測(cè)到目標(biāo)關(guān)鍵字。在此情況下,移動(dòng)裝置可錯(cuò)誤地激活話音輔助功能(即,“假激活”),且導(dǎo)致話音輔助功能的增加的假激活率。
[0031]在一些實(shí)施方案中,起初將檢測(cè)閾值設(shè)定為預(yù)定值(例如,默認(rèn)值)且隨后基于移動(dòng)裝置110的情境中的改變進(jìn)行調(diào)整。參看圖1,移動(dòng)裝置110經(jīng)配置以基于來自例如聲音傳感器、全球定位系統(tǒng)(GPS)及加速度計(jì)等各種傳感器的情境數(shù)據(jù)而確定情境。例如,移動(dòng)裝置110的聲音傳感器可俘獲包含引擎聲音及道路噪聲等環(huán)境交通噪聲以作為輸入聲音。另外,GPS及加速度計(jì)可監(jiān)視移動(dòng)裝置110的位置、速度及/或加速度。基于來自傳感器的情境數(shù)據(jù),移動(dòng)裝置110可將移動(dòng)裝置110的情境識(shí)別為在車輛中。
[0032]在確定移動(dòng)裝置110的情境是在車輛中時(shí),可假設(shè)圖1中的移動(dòng)裝置110的用戶120與用手物理地操作移動(dòng)裝置110相比更可能使用話音輔助功能。因此,移動(dòng)裝置110可將檢測(cè)閾值調(diào)整到低于針對(duì)正常或未識(shí)別的情境預(yù)定的默認(rèn)檢測(cè)閾值的值。減小的檢測(cè)閾值增加檢測(cè)到目標(biāo)關(guān)鍵字的可能性(例如,減小的未命中率),從而減小用戶必須用手操作移動(dòng)裝置110的可能性。
[0033]還可假設(shè)在一些其它情境中使用話音輔助功能的可能性較高。圖2說明根據(jù)本發(fā)明的一個(gè)實(shí)施例的在確定移動(dòng)裝置110的情境是在早晨的情況下在用戶210可能將清醒時(shí)經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測(cè)閾值的移動(dòng)裝置110。移動(dòng)裝置110放置在用戶210附近,例如放在床220附近的桌子230上,如圖2中所說明。
[0034]在此實(shí)例中,用戶210在早晨醒來但仍坐在床220上。在這種情況下,移動(dòng)裝置110中的照度傳感器可產(chǎn)生指示移動(dòng)裝置110的明亮環(huán)境的情境數(shù)據(jù)。此外,移動(dòng)裝置110中的時(shí)鐘單元還可提供當(dāng)前時(shí)間(例如,7:00AM)作為情境數(shù)據(jù)。在一些實(shí)施例中,可將當(dāng)前時(shí)間與由用戶210在移動(dòng)裝置110中設(shè)定的指示他或她通常何時(shí)醒來的時(shí)間進(jìn)行比較。另外,移動(dòng)裝置110中的聲音傳感器還俘獲具有小強(qiáng)度的安靜環(huán)境聲