提供預(yù)先計(jì)算的熱詞模型的制作方法
【專利摘要】方法、系統(tǒng)和設(shè)備,包括在計(jì)算機(jī)存儲(chǔ)介質(zhì)上編碼的計(jì)算機(jī)程序,用于:對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出該詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù);對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于該詞或子詞的音頻數(shù)據(jù),訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型;從計(jì)算裝置接收候選熱詞;識(shí)別與候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給計(jì)算裝置。
【專利說明】
提供預(yù)先計(jì)算的熱詞模型
技術(shù)領(lǐng)域
[0001 ]本公開一般涉及語音識(shí)別。
【背景技術(shù)】
[0002]語音功能化家庭或其他環(huán)境的現(xiàn)實(shí)一一也就是用戶只需要大聲講出查詢或命令并且基于計(jì)算機(jī)的系統(tǒng)將應(yīng)答查詢和回答查詢和/或使得命令被執(zhí)行的現(xiàn)實(shí)一一取決于我們。語音功能化環(huán)境(例如家庭、工作場所、學(xué)校等等)可以使用相連麥克風(fēng)裝置的網(wǎng)絡(luò)來實(shí)施,所述麥克風(fēng)裝置遍布環(huán)境的不同房間或區(qū)域分布。通過這種麥克風(fēng)網(wǎng)絡(luò),用戶幾乎能夠從環(huán)境中任何地方口頭查詢系統(tǒng),不需要在他/她面前或者甚至附近有計(jì)算機(jī)或其他裝置。例如,在廚房里烹飪時(shí),用戶可以詢問系統(tǒng)“how many milliliters in three cups?(3#有多少毫升?)”,并且作為響應(yīng),例如以合成發(fā)音輸出的形式接收來自系統(tǒng)的回答?;蛘?,用戶可能詢問系統(tǒng)諸如“when does my nearest gas stat1n close(我最近的加油站什么時(shí)候關(guān)門?)”這樣的問題,或者在準(zhǔn)備離開房屋時(shí)詢問“should I wear a coat today?(我今天應(yīng)該穿外套嗎?)”
[0003]此外,用戶可以詢問系統(tǒng)的查詢,和/或發(fā)出與用戶的個(gè)人信息有關(guān)的命令。例如,用戶可以詢問系統(tǒng)“when is my meeting with John?(我什么時(shí)候與John會(huì)面)”或者命令系統(tǒng)“remind me to call John when I get back home(當(dāng)我回到家時(shí)提醒我打電話給John),,。
[0004]在語音功能化環(huán)境中,將用戶與系統(tǒng)交互的方式設(shè)計(jì)為主要通過發(fā)音輸入的方式,如果不是專用方式的話。因此,有可能拾取環(huán)境中制造的所有話語包括那些并非指向系統(tǒng)的話語的系統(tǒng)必須具備一些方法來辨別例如相對(duì)于指向環(huán)境中存在的個(gè)體,任何給定的話語何時(shí)指向系統(tǒng)。完成這個(gè)任務(wù)的一種方法是使用“熱詞”(又稱為“關(guān)注詞”或“發(fā)音動(dòng)作啟動(dòng)命令”),熱詞通過協(xié)議被保留為講出來喚起系統(tǒng)注意的預(yù)定詞項(xiàng)。
[0005]在一個(gè)示例環(huán)境中,用來喚起系統(tǒng)注意的熱詞是詞“Google”。因此,每次講出詞“Google”,它都被其中一個(gè)麥克風(fēng)拾取,并傳遞給系統(tǒng),該系統(tǒng)進(jìn)行語音識(shí)別技術(shù),以確定是否講出熱詞,并且如果是,則等候后續(xù)命令或查詢。因此,指向系統(tǒng)的話語采用一般形式[HOTWORD] [QUERY],其中,在本示例中“H0TW0RD”是“Google”,而“QUERY”可以是任何問題、命令、宣告、或者可以通過系統(tǒng)單獨(dú)地或者通過網(wǎng)絡(luò)與服務(wù)器結(jié)合來語音識(shí)別、解析和作用的其他請(qǐng)求。
【發(fā)明內(nèi)容】
[0006]根據(jù)本說明書中所述的主題內(nèi)容的一些創(chuàng)造性方案,系統(tǒng)可將預(yù)先計(jì)算的熱詞模型提供給移動(dòng)計(jì)算裝置,使得該移動(dòng)計(jì)算裝置能夠通過分析一部分話語的聲學(xué)特征,檢測與移動(dòng)計(jì)算裝置相關(guān)聯(lián)的用戶講出的候選熱詞,而不需要將該部分轉(zhuǎn)錄或進(jìn)行語義解釋。熱詞模型可以基于從講出包括組成候選熱詞的詞或子詞的多個(gè)詞或子詞的多個(gè)用戶獲得的音頻數(shù)據(jù)來生成。
[0007]在一些示例中,用戶希望令詞“start computer(打開電腦)”成為熱詞,以發(fā)起移動(dòng)計(jì)算裝置諸如智能電話上的“wake up(喚醒)”過程。用戶講出詞“start computer”,并且作為響應(yīng),系統(tǒng)可以識(shí)別與詞項(xiàng)“start computer”或者組成詞“start”和“computer”相關(guān)聯(lián)的預(yù)先計(jì)算的熱詞模型。系統(tǒng)可將預(yù)先計(jì)算的熱詞模型提供給移動(dòng)計(jì)算裝置,使得移動(dòng)計(jì)算裝置能夠檢測進(jìn)一步的話音是否與熱詞“start computer”相對(duì)應(yīng),并相應(yīng)地喚醒移動(dòng)計(jì)算裝置。
[0008]本說明書中所述主題內(nèi)容的創(chuàng)造性方案可以在如下方法中具體實(shí)施,該方法包括如下動(dòng)作:對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出該詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù);對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于該詞或子詞的音頻數(shù)據(jù),訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型;從計(jì)算裝置接收候選熱詞;識(shí)別與該候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給計(jì)算裝置。
[0009]這些方案的其他實(shí)施例包括對(duì)應(yīng)的系統(tǒng)、設(shè)備和計(jì)算機(jī)程序,它們被配置為進(jìn)行計(jì)算機(jī)存儲(chǔ)裝置上編碼的這些方法的動(dòng)作。
[0010]這些和其他實(shí)施例可分別選擇性地包括一個(gè)或多個(gè)以下特征。例如,識(shí)別所述一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型包括:獲得與候選熱詞相對(duì)應(yīng)的兩個(gè)或更多個(gè)子詞;以及對(duì)于與候選熱詞相對(duì)應(yīng)的兩個(gè)或更多個(gè)子詞中的每個(gè)子詞,獲得與子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。在對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型之后,從計(jì)算裝置接收候選熱詞。從計(jì)算裝置接收候選熱詞包括接收與候選熱詞相對(duì)應(yīng)的音頻數(shù)據(jù)。從計(jì)算裝置接收候選熱詞包括從計(jì)算裝置接收包括兩個(gè)或更多個(gè)詞的候選熱詞。識(shí)別與候選熱詞的兩個(gè)或更多個(gè)詞的每個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及將所識(shí)別的與候選熱詞的兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型提供給計(jì)算裝置。向計(jì)算裝置提供指令,該指令限定所識(shí)別的與候選熱詞的兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的處理例程。該指令包括依次處理所識(shí)別的與候選熱詞的兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的指令。該指令包括依次處理所識(shí)別的與候選熱詞的兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的處理順序。
[0011]這些特征例如還包括:動(dòng)態(tài)地創(chuàng)建與所述候選熱詞的兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型;以及將動(dòng)態(tài)地創(chuàng)建的與候選熱詞的兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型提供給計(jì)算裝置。在從計(jì)算裝置接收候選熱詞之后,動(dòng)態(tài)地創(chuàng)建與候選熱詞的兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型。對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型進(jìn)一步包括:對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞:為多個(gè)用戶中的每個(gè)用戶獲得講出詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄;為多個(gè)用戶中的每個(gè)用戶將講出詞或子詞的用戶的音頻數(shù)據(jù)與講出詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄相關(guān)聯(lián);以及基于(i)與講出詞或子詞的多個(gè)用戶中的每個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù)以及(ii)與對(duì)應(yīng)于講出詞或子詞的多個(gè)用戶中的每個(gè)用戶的音頻數(shù)據(jù)相關(guān)聯(lián)的轉(zhuǎn)錄,生成與詞或子詞相對(duì)應(yīng)的特定的預(yù)先計(jì)算的熱詞模型。
[0012]在以下附圖和描述中給出本說明書所述主題內(nèi)容的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。根據(jù)描述、附圖和權(quán)利要求書,主題內(nèi)容的其他潛在特征、方案和優(yōu)點(diǎn)將變得顯而易見。
【附圖說明】
[0013]圖1描繪用于提供熱詞模型的示例系統(tǒng)。
[0014]圖2描繪用于識(shí)別用戶提供的熱詞的示例圖形用戶界面。
[0015]圖3描繪用于提供熱詞模型的示例流程圖。
[0016]圖4描繪可用于實(shí)施本文所述技術(shù)的計(jì)算機(jī)裝置和移動(dòng)計(jì)算機(jī)裝置。
[0017]在附圖中,相同的附圖標(biāo)記始終表示相同的元素。
【具體實(shí)施方式】
[0018]圖1描繪用于提供預(yù)先計(jì)算的熱詞模型的系統(tǒng)100。在一些示例中,系統(tǒng)100包括移動(dòng)計(jì)算裝置102、104、106,語音識(shí)別引擎108,詞匯數(shù)據(jù)庫110,以及熱詞配置引擎112。在一些示例中,移動(dòng)計(jì)算裝置102、104、106中的任何一個(gè)都可以是便攜式計(jì)算機(jī)、智能電話、平板計(jì)算裝置、或者可穿戴計(jì)算裝置。移動(dòng)計(jì)算裝置102、104、106中的每一個(gè)與相應(yīng)用戶114、116、118相關(guān)聯(lián)。移動(dòng)計(jì)算裝置102、104、106可包括任何音頻檢測器件,例如麥克風(fēng),用于檢測來自相應(yīng)關(guān)聯(lián)用戶114、116、118的話語。移動(dòng)計(jì)算裝置102和104例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)與語音識(shí)別引擎108通信,而移動(dòng)計(jì)算裝置106例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)與熱詞配置引擎112通信。
[0019]在一些實(shí)施方式中,在操作(A)期間,語音識(shí)別引擎108對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞獲得與講出該詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù)。具體而言,語音識(shí)別引擎108例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)從移動(dòng)計(jì)算裝置102和104獲得音頻數(shù)據(jù),該移動(dòng)計(jì)算裝置102和104各自對(duì)應(yīng)于講出詞或子詞的用戶114和116。在一些示例中,用戶114和116分別說出移動(dòng)計(jì)算裝置102和移動(dòng)計(jì)算裝置104各自檢測的一個(gè)或多個(gè)詞。在一些示例中,用戶114和116各自在與移動(dòng)計(jì)算裝置102和104任何交互期間講出詞或子詞,例如,提交對(duì)于發(fā)音命令的發(fā)音查詢。在一些示例中,除了獲得與講出詞或子詞的用戶114和116相關(guān)聯(lián)的音頻數(shù)據(jù)之外,語音識(shí)別引擎108還從移動(dòng)計(jì)算裝置102和104獲得用戶114和116的地點(diǎn)。該地點(diǎn)可包括用戶講出詞或子詞時(shí)的近似當(dāng)前位置,或者與用戶的簡檔相關(guān)聯(lián)的位置。
[0020]例如,用戶114說出“start my car (啟動(dòng)我的車)”的話語150,且用戶116說出“where do I buy a computer?(我在哪買電腦)”的話語152。移動(dòng)計(jì)算裝置102檢測“startmy car”的話語150,以生成表示被檢測的話語150的波形數(shù)據(jù)120;且移動(dòng)計(jì)算裝置104檢測“where do I buy a computer?”的話語152,以生成表示被檢測的話語152波形數(shù)據(jù)122。移動(dòng)計(jì)算裝置102和104例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)將波形120和122各自傳輸給語音識(shí)別引擎108。
[0021]在一些示例中,在操作(B)期間,語音識(shí)別引擎108對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,為多個(gè)用戶中的每個(gè)用戶獲得講出詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄。具體而言,語音識(shí)別引擎108處理所接收的音頻數(shù)據(jù),包括生成與音頻數(shù)據(jù)相關(guān)聯(lián)的詞或子詞的話語的轉(zhuǎn)錄。生成講出詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄可包括將話語轉(zhuǎn)錄為文本或文本相關(guān)數(shù)據(jù)。換言之,語音識(shí)別引擎108可以按照與音頻數(shù)據(jù)相關(guān)聯(lián)的話語的書面形式提供自然語言的表示。例如,語音識(shí)別引擎108將如分別從移動(dòng)計(jì)算裝置102和104接收的波形120和122轉(zhuǎn)錄。也就是說,語音識(shí)別引擎108將波形120轉(zhuǎn)錄,生成“start my car”的轉(zhuǎn)錄124,且將波形 122轉(zhuǎn)錄,生成 “where do I buy a computer?” 的轉(zhuǎn)錄 126。
[0022]在一些示例中,在操作(C)期間,語音識(shí)別引擎108對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,為多個(gè)用戶中的每個(gè)用戶將講出該詞或子詞的用戶的音頻數(shù)據(jù)與講出該詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄相關(guān)聯(lián)。例如,語音識(shí)別引擎108將波形160與轉(zhuǎn)錄124相關(guān)聯(lián),且將波形162與轉(zhuǎn)錄126相關(guān)聯(lián)。在一些示例中,波形160實(shí)際上與波形120相同,且波形162實(shí)際上與波形122相同。在一些示例中,波形160是波形120經(jīng)過處理的版本(例如通過語音識(shí)別引擎108),且波形162是波形122經(jīng)過處理的版本(例如通過語音識(shí)別引擎108)。
[0023]在一些示例中,語音識(shí)別引擎108將波形160的一部分與轉(zhuǎn)錄124的對(duì)應(yīng)部分相關(guān)聯(lián)。也就是說,對(duì)于波形160的每個(gè)詞或子詞,語音識(shí)別引擎108將轉(zhuǎn)錄124的對(duì)應(yīng)部分與詞或子詞相關(guān)聯(lián)。例如,語音識(shí)別引擎108將波形160用于每個(gè)詞“start”、“my”、“car”的部分與轉(zhuǎn)錄124的對(duì)應(yīng)部分相關(guān)聯(lián)。類似地,語音識(shí)別引擎108將波形162用于每個(gè)詞“where”、“do”、T、“buy”、“a”、“computer,,的部分與轉(zhuǎn)錄126的對(duì)應(yīng)部分相關(guān)聯(lián)。在一些示例中,語音識(shí)別引擎108將波形160用于每個(gè)詞的每個(gè)子詞例如音素或三音素等級(jí))(例如詞“start”的“st-ah-rt”)的部分與轉(zhuǎn)錄的對(duì)應(yīng)部分相關(guān)聯(lián)。類似地,在一些示例中,語音識(shí)別引擎108將波形16 2用于每個(gè)詞的每個(gè)子詞(例如音素或三音素等級(jí))(例如詞“computer”的“kom-pyu-1er”)的部分與轉(zhuǎn)錄的對(duì)應(yīng)部分相關(guān)聯(lián)。
[0024]在一些示例中,將講出詞或子詞的用戶的音頻數(shù)據(jù)與講出詞或子詞的用戶的音頻數(shù)據(jù)的轉(zhuǎn)錄相關(guān)聯(lián)包括將關(guān)聯(lián)存儲(chǔ)在數(shù)據(jù)庫或表中。具體而言,語音識(shí)別引擎108將轉(zhuǎn)錄124和波形160提供給詞匯數(shù)據(jù)庫110,使得詞匯數(shù)據(jù)庫110存儲(chǔ)波形160與轉(zhuǎn)錄124之間的關(guān)聯(lián)。類似地,語音識(shí)別引擎108將轉(zhuǎn)錄126和波形162提供給詞匯數(shù)據(jù)庫110,使得詞匯數(shù)據(jù)庫110存儲(chǔ)波形162與轉(zhuǎn)錄126之間的關(guān)聯(lián)。
[0025]在一些示例中,語音識(shí)別引擎108將與轉(zhuǎn)錄124的詞或子詞相關(guān)聯(lián)的地點(diǎn)(例如用戶114的地點(diǎn))提供給詞匯數(shù)據(jù)庫110,使得詞匯數(shù)據(jù)庫110附加地存儲(chǔ)波形160、轉(zhuǎn)錄124與相應(yīng)地點(diǎn)之間的關(guān)聯(lián)。類似地,語音識(shí)別引擎108將與轉(zhuǎn)錄126的詞或子詞相關(guān)聯(lián)的地點(diǎn)(例如用戶116的地點(diǎn))提供給詞匯數(shù)據(jù)庫110,使得詞匯數(shù)據(jù)庫110附加地存儲(chǔ)波形162、轉(zhuǎn)錄126與相應(yīng)地點(diǎn)之間的關(guān)聯(lián)。
[0026]在一些示例中,詞匯數(shù)據(jù)庫110指示波形160的一部分與轉(zhuǎn)錄124的對(duì)應(yīng)部分之間的關(guān)聯(lián)。也就是說,對(duì)于波形160的每個(gè)詞或子詞,詞匯數(shù)據(jù)庫110存儲(chǔ)波形160的一部分與具有該詞或子詞的轉(zhuǎn)錄124的對(duì)應(yīng)部分的關(guān)聯(lián)。例如,詞匯數(shù)據(jù)庫110存儲(chǔ)波形160用于每個(gè)詞“start”、“my”、“car”的部分與轉(zhuǎn)錄124的對(duì)應(yīng)部分的關(guān)聯(lián)。類似地,詞匯數(shù)據(jù)庫110存儲(chǔ)波形162用于每個(gè)詞“where”、“do”、“I”、“buy”、“a”、“computer”的部分與轉(zhuǎn)錄126的對(duì)應(yīng)部分的關(guān)聯(lián)。
[0027]在一些實(shí)施方式中,在操作(D)期間,熱詞配置引擎112對(duì)于多個(gè)詞或子詞的每個(gè)詞或子詞訓(xùn)練用于詞或子詞的預(yù)先計(jì)算的熱詞模型。具體而言,熱詞配置引擎112與詞匯數(shù)據(jù)庫110通信,并對(duì)于詞匯數(shù)據(jù)庫110存儲(chǔ)的每個(gè)詞或子詞獲得講出該詞或子詞的多個(gè)用戶的每個(gè)用戶的音頻數(shù)據(jù)以及音頻數(shù)據(jù)的關(guān)聯(lián)轉(zhuǎn)錄。例如,熱詞配置引擎112從詞匯數(shù)據(jù)庫110獲得波形160和關(guān)聯(lián)轉(zhuǎn)錄124,并且還獲得波形162和關(guān)聯(lián)的轉(zhuǎn)錄126。
[0028]在一些示例中,對(duì)于詞匯數(shù)據(jù)庫110存儲(chǔ)的每個(gè)詞或子詞,熱詞配置引擎112生成與該詞或子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。具體而言,基于(i)與講出該詞或子詞的多個(gè)用戶中的每個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù);以及(ii)與對(duì)應(yīng)于講出該詞或子詞的多個(gè)用戶中的每個(gè)用戶的音頻數(shù)據(jù)相關(guān)聯(lián)的轉(zhuǎn)錄,熱詞配置引擎112生成用于每個(gè)詞或子詞的預(yù)先計(jì)算的熱詞模型。在一些示例中,預(yù)先計(jì)算的熱詞模型可以是分類器,諸如神經(jīng)網(wǎng)絡(luò)、或支持向量機(jī)(SVM)。
[0029]例如,熱詞配置引擎112生成與波形160和162的每個(gè)詞或子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。在一些示例中,對(duì)于波形160的詞“start”,熱詞配置引擎112基于(i)與講出詞“start”的用戶114相對(duì)應(yīng)的音頻數(shù)據(jù)(例如,波形160與講出詞“start”的用戶114相對(duì)應(yīng)的部分);以及(ii)與對(duì)應(yīng)于講出詞“start”的用戶114的音頻數(shù)據(jù)相關(guān)聯(lián)的轉(zhuǎn)錄,生成用于詞的預(yù)先計(jì)算的熱詞模型。此外,熱詞配置引擎112可以對(duì)于波形160的剩余詞“my”和“car”以及波形160的(每個(gè)詞的)每個(gè)子詞,例如,詞“start”的“st-ah-rt”,生成預(yù)先計(jì)算的熱詞模型。
[0030]此外,在一些示例中,對(duì)于波形162的詞“computer”,熱詞配置引擎112基于(i)與講出詞“computer”的用戶116相對(duì)應(yīng)的音頻數(shù)據(jù)(例如,波形162與講出詞“computer”的用戶116相對(duì)應(yīng)的部分);以及(ii)與對(duì)應(yīng)于講出詞“computer”的用戶116的音頻數(shù)據(jù)相關(guān)聯(lián)的轉(zhuǎn)錄,生成用于詞的預(yù)先計(jì)算的熱詞模型。此外,熱詞配置引擎112可以對(duì)于波形162的剩余詞“where”、“do”、“I”、“buy”和“a”以及波形160的每個(gè)子詞,例如,詞“computer”的“kom-pyu-ter”,生成預(yù)先計(jì)算的熱詞模型。
[0031]在對(duì)于詞匯數(shù)據(jù)庫110存儲(chǔ)的一個(gè)或多個(gè)詞預(yù)先計(jì)算熱詞模型之后,熱詞配置引擎112將預(yù)先計(jì)算的熱詞模型128提供給詞匯數(shù)據(jù)庫110,使得詞匯數(shù)據(jù)庫110存儲(chǔ)或者指示詞或子詞與對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128之間的關(guān)聯(lián)。也就是說,對(duì)于波形160和162的每個(gè)詞或子詞,詞匯數(shù)據(jù)庫110存儲(chǔ)(例如波形160和162的)每個(gè)詞或子詞與對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128之間的關(guān)聯(lián)。在一些示例中,對(duì)于波形160和162的每個(gè)詞或子詞,詞匯數(shù)據(jù)庫110存儲(chǔ)(i)波形與詞或子詞相對(duì)應(yīng)的部分;(ii)波形這一部分的對(duì)應(yīng)轉(zhuǎn)錄;以及(iii)對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型之間的關(guān)聯(lián)。例如,對(duì)于波形160的詞“start”,詞匯數(shù)據(jù)庫110存儲(chǔ)⑴波形160與詞“start”相對(duì)應(yīng)的部分;(i i)轉(zhuǎn)錄124與詞“start”相對(duì)應(yīng)的部分;以及(i i i)對(duì)于詞“s tar t”的預(yù)先計(jì)算的熱詞模型的關(guān)聯(lián)。
[0032]在一些實(shí)施方式中,在操作(E)期間,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收候選熱詞129。具體而言,熱詞配置引擎112例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)接收來自移動(dòng)計(jì)算裝置106的數(shù)據(jù),該移動(dòng)計(jì)算裝置106與提供候選熱詞129的用戶118相對(duì)應(yīng)。在一些示例中,移動(dòng)計(jì)算裝置106向用戶118提供圖形用戶界面180,該圖形用戶界面180提供文本182的顯示,以提示用戶118提供熱詞。例如,文本182包括“Please say your desired Hotword(請(qǐng)說出您期望的熱詞)”。作為響應(yīng),用戶118說出移動(dòng)計(jì)算裝置106所檢測的候選熱詞129,并傳輸給熱詞配置引擎112。例如,用戶118說出與候選熱詞129相對(duì)應(yīng)的“start computer (打開電腦)”的話語170。移動(dòng)計(jì)算裝置106檢測“start computer”的話語170并生成表示所檢測的話語170波形130。移動(dòng)計(jì)算裝置106例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)將波形130傳輸給熱詞配置引擎 112。
[0033]在一些示例中,用戶118例如經(jīng)由對(duì)應(yīng)于候選熱詞129的移動(dòng)計(jì)算裝置106的圖形用戶界面將基于文本的輸入提供給移動(dòng)計(jì)算裝置106。例如,用戶118經(jīng)由虛擬或觸覺的鍵盤輸入“start computer”的文本。移動(dòng)計(jì)算裝置106例如通過一個(gè)或多個(gè)網(wǎng)絡(luò),將“startcomputer”的基于文本的候選熱詞129傳輸給熱詞配置引擎112。
[0034]在一些示例中,在對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型之后,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收候選熱詞。具體而言,在熱詞配置引擎112生成與詞匯數(shù)據(jù)庫110存儲(chǔ)的每個(gè)詞或子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128之后,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收候選熱詞129。例如,在對(duì)于波形160和162的多個(gè)詞或子詞中的每個(gè)詞或子詞訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型128之后,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收“start computer”的候選熱詞129。
[0035]在一些示例中,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收包括兩個(gè)或更多個(gè)詞的候選熱詞129。例如,熱詞配置引擎112接收包括兩個(gè)詞(例如,“start”和“computer” )的“start computer”的候選熱詞129。在一些示例中,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收包括單個(gè)詞的候選熱詞129。
[0036]在一些示例中,熱詞配置引擎112獲得與候選熱詞129相對(duì)應(yīng)的兩個(gè)或更多個(gè)子詞。也就是說,熱詞配置引擎112處理候選熱詞129,以識(shí)別候選熱詞129的子詞。例如,對(duì)于“start computer”的候選熱詞129,熱詞配置引擎112可以獲得用于候選熱詞129的詞“start”的子詞“st-ah-rt”,還可以獲得用于候選熱詞129的詞“computer”的子詞“kom-pyu_ter”。
[0037]在一些實(shí)施方式中,在操作(F)中,熱詞配置引擎112識(shí)別與候選熱詞129相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型。具體而言,熱詞配置引擎112訪問詞匯數(shù)據(jù)庫110,以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的并且與候選熱詞129相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128中的一個(gè)或多個(gè)。熱詞配置引擎112例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)從詞匯數(shù)據(jù)庫110檢索預(yù)先計(jì)算的熱詞模型128。在一些示例中,熱詞配置引擎112識(shí)別與候選熱詞129的詞或子詞相關(guān)聯(lián)的預(yù)先計(jì)算的熱詞模型128。熱詞配置引擎112可通過將候選熱詞129的詞或子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的詞或子詞相匹配來識(shí)別預(yù)先計(jì)算的熱詞模型128。
[0038]在一些示例中,熱詞配置引擎112識(shí)別與用戶118提供的候選熱詞129的話語170相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。也就是說,熱詞配置引擎112基于波形130來識(shí)別一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128,該波形130代表所檢測的候選熱詞129的話語170。在示出的示例中,熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、與“start computer”的話語170相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128。
[0039]在一些示例中,當(dāng)候選熱詞包括兩個(gè)或更多個(gè)詞時(shí),熱詞配置引擎112識(shí)別與兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。也就是說,候選熱詞129的兩個(gè)或更多個(gè)詞中的每個(gè)詞對(duì)應(yīng)于詞匯數(shù)據(jù)庫110存儲(chǔ)的預(yù)先計(jì)算的熱詞模型128。例如,候選熱詞129包括兩個(gè)詞,例如“start”和“computer”。為此,熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、與詞“start”相對(duì)應(yīng)的第一預(yù)先計(jì)算的熱詞模型128,以及詞匯數(shù)據(jù)庫110存儲(chǔ)的、與詞“computer”相對(duì)應(yīng)的第二預(yù)先計(jì)算的熱詞模型128。在一些示例中,熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、與兩個(gè)詞“start computer”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。
[0040]在一些示例中,熱詞配置引擎112通過將波形130的至少一部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形的至少一部分相匹配,識(shí)別與候選熱詞129的話語170相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128。將波形130與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形相匹配可包括在波形130與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形之間進(jìn)行基于音頻的比較,以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的與波形130匹配的波形。在一些示例中,波形130與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形之間基于音頻的比較可通過音頻處理引擎來進(jìn)行,該音頻處理引擎例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)與熱詞配置引擎112通信。為此,在熱詞配置引擎112在識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的與波形130匹配的波形時(shí),熱詞配置引擎112識(shí)別與匹配波形相關(guān)聯(lián)的預(yù)先計(jì)算的熱詞模型128。
[0041]在一些示例中,通過將詞匯數(shù)據(jù)庫110存儲(chǔ)的預(yù)先計(jì)算的熱詞模型128中的一個(gè)或多個(gè)應(yīng)用于話語170,熱詞配置引擎112識(shí)別與候選熱詞129的話語170相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128,從而識(shí)別相對(duì)于剩余預(yù)先計(jì)算的熱詞模型128與最高置信度得分相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。置信度得分指示所識(shí)別的預(yù)先計(jì)算的熱詞模型128與話語170相對(duì)應(yīng)的可能性。
[0042]例如,熱詞配置引擎112可將波形130與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形160和162中的一個(gè)或多個(gè)的一部分相匹配。具體而言,熱詞配置引擎112可將波形130對(duì)應(yīng)于詞“start”的部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形160對(duì)應(yīng)于詞“start”的部分相匹配?;谶@種匹配,熱詞配置引擎112可以識(shí)別與波形160用于詞“start”的部分相關(guān)聯(lián)的對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。類似地,熱詞配置引擎112可將波形130對(duì)應(yīng)于詞“computer”的部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形162對(duì)應(yīng)于詞“computer”的部分相匹配?;谶@種匹配,熱詞配置引擎112可以識(shí)別與波形162用于詞“computer”的部分相關(guān)聯(lián)的對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。
[0043]在一些示例中,熱詞配置引擎112通過將波形130的轉(zhuǎn)錄的至少一部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄的至少一部分相匹配,識(shí)別與候選熱詞129的話語相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128。具體而言,熱詞配置引擎112可將波形130提供給語音識(shí)別引擎,例如語音識(shí)別引擎108,使得語音識(shí)別引擎108能夠轉(zhuǎn)錄波形130。為此,將波形130的轉(zhuǎn)錄與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄相匹配可包括將波形130的轉(zhuǎn)錄與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄相比較,以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的與波形130匹配的轉(zhuǎn)錄。為此,在熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的與波形130的轉(zhuǎn)錄匹配的轉(zhuǎn)錄時(shí),熱詞配置引擎112識(shí)別與匹配的轉(zhuǎn)錄相關(guān)聯(lián)的預(yù)先計(jì)算的熱詞模型128。
[0044]例如,熱詞配置引擎112可將波形130的轉(zhuǎn)錄與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄124和126中的一個(gè)或多個(gè)的一部分相匹配。具體而言,熱詞配置引擎112可將波形130的轉(zhuǎn)錄對(duì)應(yīng)于詞“start”的部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄124對(duì)應(yīng)于詞“start”的部分相匹配?;谶@種匹配,熱詞配置引擎112可以識(shí)別與轉(zhuǎn)錄124用于詞“start”的部分相關(guān)聯(lián)的對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。類似地,熱詞配置引擎112可將波形130的轉(zhuǎn)錄對(duì)應(yīng)于詞“computer”的部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄126對(duì)應(yīng)于詞“computer”的部分相匹配。基于這種匹配,熱詞配置引擎112可以識(shí)別與轉(zhuǎn)錄126用于詞“computer”的部分相關(guān)聯(lián)的對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。
[0045]在一些示例中,將候選熱詞129的詞或子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的詞或子詞相匹配可包括確定候選熱詞129的詞或子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的詞或子詞之間的完全匹配。在一些示例中,將候選熱詞129的詞或子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的詞或子詞相匹配可包括確定候選熱詞129的詞或子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的詞或子詞之間的部分匹配。
[0046]在一些示例中,熱詞配置引擎112獲得用于與候選熱詞129相對(duì)應(yīng)的子詞的預(yù)先計(jì)算的熱詞模型128。如上所述,對(duì)于“start computer”的候選熱詞129,熱詞配置引擎112識(shí)別用于候選熱詞129的詞“start”的子詞“st-ah-rt”,并且進(jìn)而識(shí)別用于候選熱詞129的詞“computer”的子詞“kom-pyu-ter”。為此,熱詞配置引擎112訪問詞匯數(shù)據(jù)庫110,以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的并且與候選熱詞129的子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。熱詞配置引擎112可通過將候選熱詞129的子詞與詞匯數(shù)據(jù)庫110存儲(chǔ)的并且關(guān)聯(lián)于預(yù)先計(jì)算的熱詞模型128的子詞相匹配來識(shí)別預(yù)先計(jì)算的熱詞模型128。例如,熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、與用于候選熱詞129的詞“start”的每個(gè)子詞“st-ah-rt”以及用于候選熱詞129的詞“computer”的每個(gè)子詞“kom-pyu-ter”相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型128。
[0047]在一些實(shí)施方式中,在操作(G)中,熱詞配置引擎112將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給移動(dòng)計(jì)算裝置106。具體而言,熱詞配置引擎112例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)將對(duì)應(yīng)于候選熱詞129的預(yù)先計(jì)算的熱詞模型134,例如預(yù)先計(jì)算的熱詞模型128的子集,提供給移動(dòng)計(jì)算裝置106。例如,熱詞配置引擎112可將對(duì)應(yīng)于“start computer”的候選熱詞129的預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。
[0048]在一些示例中,熱詞配置引擎112將所識(shí)別的與候選熱詞129的兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。例如,候選熱詞129包括兩個(gè)詞,例如“start”和“computer”,并且熱詞配置引擎112提供與每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134。也就是說,熱詞配置引擎112將對(duì)應(yīng)于詞“start”的第一預(yù)先計(jì)算的熱詞模型134以及對(duì)應(yīng)于詞“computer”的第二預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。
[0049]在一些示例中,基于移動(dòng)計(jì)算裝置106的類型將所識(shí)別的預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。例如,低端或低處理能力的移動(dòng)計(jì)算裝置更適合于接收適當(dāng)版本的預(yù)先計(jì)算的熱詞模型134(例如更小的神經(jīng)網(wǎng)絡(luò)),使得移動(dòng)計(jì)算裝置能夠適當(dāng)?shù)靥幚眍A(yù)先計(jì)算的熱詞模型134。
[0050]在一些示例中,移動(dòng)計(jì)算裝置106可以響應(yīng)于來自用戶118的命令(或查詢),接收兩個(gè)或更多個(gè)預(yù)先計(jì)算的熱詞模型134。也就是說,用戶118可以向移動(dòng)計(jì)算裝置106提供諸如“navigate to coffee house(導(dǎo)航到咖啡屋)”這樣的命令。作為響應(yīng),移動(dòng)計(jì)算裝置106可以接收與接近用戶118當(dāng)前位置的咖啡屋的兩個(gè)不同位置相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134。例如,移動(dòng)計(jì)算裝置106可以接收用于“Palo Alto”的預(yù)先計(jì)算的熱詞模型135以及用于“Mountain View”的預(yù)先計(jì)算的熱詞模型134。移動(dòng)計(jì)算裝置106可將這兩個(gè)位置選項(xiàng)都提供給用戶118(例如經(jīng)由聲音或者移動(dòng)計(jì)算裝置106的圖形用戶界面)。用戶118可以提供移動(dòng)計(jì)算裝置106可經(jīng)由所接收的預(yù)先計(jì)算的熱詞模型134檢測的位置中的一個(gè)的話語,如上所述。
[0051]在一些示例中,通過生成預(yù)先計(jì)算的熱詞模型128以及將其提供給詞匯數(shù)據(jù)庫110,該預(yù)先計(jì)算的熱詞模型例如通過移動(dòng)計(jì)算裝置106立即可用于(或者幾乎立即可用于)根據(jù)話語識(shí)別熱詞。例如,移動(dòng)計(jì)算裝置106能夠立即獲得與詞“start”和“computer”相對(duì)應(yīng)的熱詞模型,使得移動(dòng)計(jì)算裝置106能夠在臨近檢測話語170時(shí)適當(dāng)?shù)靥幚碓捳Z170。
[0052]在一些示例中,通過生成關(guān)于不可用于移動(dòng)計(jì)算裝置106的其他用戶(例如用戶114和116)的話語所訓(xùn)練的預(yù)先計(jì)算的熱詞模型128,移動(dòng)計(jì)算裝置106用來處理話語170的預(yù)先計(jì)算的熱詞模型128,與關(guān)于僅由用戶118提供的話語所訓(xùn)練的熱詞模型128相比,可以更加強(qiáng)健。
[0053]在一些示例中,熱詞配置引擎112向移動(dòng)計(jì)算裝置106提供指令136,該指令136限定預(yù)先計(jì)算的熱詞模型134的處理例程。也就是說,指令136限定移動(dòng)計(jì)算裝置106怎樣適當(dāng)處理預(yù)先計(jì)算的熱詞模型134。在一些示例中,預(yù)先計(jì)算的熱詞模型134基于對(duì)輸入話語(例如話語170)的基本聲學(xué)特征(例如Mel頻率倒譜系數(shù))的分析來檢測(例如話語的)熱詞。
[0054]在一些示例中,指令136包括依次處理熱詞模型134的指令,還包括熱詞模型134的處理順序。例如,指令136可包括最初處理與詞“start”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134,隨后處理與詞“computer”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134的指令。在一些示例中,指令136包括并行處理多個(gè)熱詞模型134的指令。例如,指令136可包括并行例如基本上同時(shí)處理與詞“start”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134以及處理與詞“computer”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134的指令。在一些示例中,指令136包括處理熱詞模型134,使得僅當(dāng)?shù)谝粺嵩~模型134檢測熱詞“start”時(shí)才處理與詞“computer”相對(duì)應(yīng)的第二熱詞模型134的指令。換言之,在通過第一熱詞模型134檢測詞“computer”時(shí),移動(dòng)計(jì)算裝置106觸發(fā)與詞“computer”相對(duì)應(yīng)的第二熱詞模型134的處理。
[0055]移動(dòng)計(jì)算裝置106例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)接收預(yù)先計(jì)算的熱詞模型134,并且在一些示例中,從熱詞配置引擎112接收指令136。移動(dòng)計(jì)算裝置106將預(yù)先計(jì)算的模型134存儲(chǔ)在移動(dòng)計(jì)算裝置106的存儲(chǔ)器中。因此,在以后通過用戶118檢測話語時(shí)(例如在接收預(yù)先計(jì)算的熱詞模型134之后),移動(dòng)計(jì)算裝置106可以根據(jù)預(yù)先計(jì)算的熱詞模型134適當(dāng)?shù)靥幚碓捳Z,以確定該話語是否與候選熱詞129相對(duì)應(yīng)。
[0056]在一些其他實(shí)施方式中,熱詞配置引擎112動(dòng)態(tài)地創(chuàng)建與候選熱詞129相對(duì)應(yīng)的熱詞模型中的一個(gè)或多個(gè)。也就是說,響應(yīng)于從移動(dòng)計(jì)算裝置106接收候選熱詞129,熱詞配置引擎112動(dòng)態(tài)地創(chuàng)建與候選熱詞129的一個(gè)或多個(gè)詞相對(duì)應(yīng)的熱詞模型。在一些示例中,熱詞配置引擎112基于(i)波形130;以及(ii)例如從語音識(shí)別引擎108獲得的波形130的轉(zhuǎn)錄,動(dòng)態(tài)地創(chuàng)建用于候選熱詞129的熱詞模型。例如,對(duì)于波形130的詞“start”,熱詞配置引擎112基于(i)波形130與講出詞“start”的用戶118相對(duì)應(yīng)的部分;以及(i i)與對(duì)應(yīng)于講出詞“start”的用戶118的波形130相關(guān)聯(lián)的轉(zhuǎn)錄,動(dòng)態(tài)地創(chuàng)建用于詞的熱詞模型。
[0057]在一些示例中,如上所述,熱詞配置引擎112將波形130的至少一部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的波形的至少一部分相匹配。在匹配時(shí),熱詞配置引擎112可以進(jìn)一步識(shí)別與詞匯數(shù)據(jù)庫110存儲(chǔ)的匹配波形相關(guān)聯(lián)的對(duì)應(yīng)轉(zhuǎn)錄的一部分。為此,熱詞配置引擎112基于(i)匹配波形;以及(ii)與匹配波形相關(guān)聯(lián)的對(duì)應(yīng)轉(zhuǎn)錄,動(dòng)態(tài)地創(chuàng)建與候選熱詞129相對(duì)應(yīng)的熱詞模型。例如,熱詞配置引擎112可以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、波形160與詞“start”相對(duì)應(yīng)的部分,并且進(jìn)而識(shí)別波形160包括詞“start”的部分的對(duì)應(yīng)轉(zhuǎn)錄124。熱詞配置引擎112可以基于(i)詞匯數(shù)據(jù)庫110存儲(chǔ)的、波形160與詞“start”相對(duì)應(yīng)的部分;以及(ii)包括詞“start”的對(duì)應(yīng)轉(zhuǎn)錄124,動(dòng)態(tài)地創(chuàng)建用于候選熱詞129的詞“start”的熱詞模型。
[0058]在一些示例中,如上所述,熱詞配置引擎112將波形130的轉(zhuǎn)錄的至少一部分與詞匯數(shù)據(jù)庫110存儲(chǔ)的轉(zhuǎn)錄的至少一部分相匹配。在匹配時(shí),熱詞配置引擎112可以進(jìn)一步識(shí)別與詞匯數(shù)據(jù)庫110存儲(chǔ)的匹配轉(zhuǎn)錄相關(guān)聯(lián)的對(duì)應(yīng)波形。為此,熱詞配置引擎112基于(i)匹配轉(zhuǎn)錄;以及(ii)與匹配轉(zhuǎn)錄相關(guān)聯(lián)的對(duì)應(yīng)波形,動(dòng)態(tài)地創(chuàng)建與候選熱詞129相對(duì)應(yīng)的熱詞模型。例如,熱詞配置引擎112可以識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、轉(zhuǎn)錄124與詞“start”相對(duì)應(yīng)的部分,并且進(jìn)而識(shí)別波形160包括詞“start”的對(duì)應(yīng)部分。熱詞配置引擎112可以基于(i)詞匯數(shù)據(jù)庫110存儲(chǔ)的、轉(zhuǎn)錄124與詞“start”相對(duì)應(yīng)的部分;以及(ii)波形160包括詞“start”的對(duì)應(yīng)部分,動(dòng)態(tài)地創(chuàng)建用于候選熱詞129的詞“start”的熱詞模型。
[0059]在一些示例中,熱詞配置引擎112例如通過一個(gè)或多個(gè)網(wǎng)絡(luò)將動(dòng)態(tài)創(chuàng)建的熱詞模型提供給移動(dòng)計(jì)算裝置106。例如,熱詞配置引擎112可將與候選熱詞“start computer”的詞“start”相對(duì)應(yīng)的動(dòng)態(tài)創(chuàng)建的熱詞模型134提供給移動(dòng)計(jì)算裝置106。在一些示例中,熱詞配置引擎112可將(i)與候選熱詞129 “start computer”的詞“start”相對(duì)應(yīng)的動(dòng)態(tài)創(chuàng)建的熱詞模型;以及(ii)與候選熱詞129 “start computer”的詞“computer”相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。
[0060]在一些示例中,熱詞配置引擎112在從移動(dòng)計(jì)算裝置106接收候選熱詞129之后,動(dòng)態(tài)地生成與候選熱詞129相對(duì)應(yīng)的熱詞模型。例如,熱詞配置引擎112在從移動(dòng)計(jì)算裝置106接收候選熱詞129之后,動(dòng)態(tài)地生成與“start computer”的候選熱詞129相對(duì)應(yīng)的熱詞模型。
[0061]圖2圖示出移動(dòng)計(jì)算裝置204的示例圖形用戶界面(GUI)202,用于識(shí)別用戶提供的熱詞。移動(dòng)計(jì)算裝置204可以類似于圖1的移動(dòng)計(jì)算裝置106。為此,移動(dòng)計(jì)算裝置204向關(guān)聯(lián)于移動(dòng)計(jì)算裝置204的用戶206提供第一GUI 202a,該第一GUI 202a提供用以將用戶提供的熱詞識(shí)別為與動(dòng)作相關(guān)聯(lián)(例如,至少部分地通過移動(dòng)計(jì)算裝置204進(jìn)行的過程)的過程的發(fā)起以顯示。在一些示例中,第一⑶I 202a包括向用戶206指示提供熱詞的文本208。例如,文本208包括“What would you like your Hotword to be to initiate a web search?(您希望發(fā)起web搜索的熱詞是什么)”用戶206提供移動(dòng)計(jì)算裝置204檢測的話語210。例如,用戶206說出用戶206希望成為熱詞的“go gadget go”的話語210,以發(fā)起web搜索。
[0062]響應(yīng)于檢測話語210,移動(dòng)計(jì)算裝置204向用戶206提供第二⑶I 202b,該第二⑶I202b提供所檢測的話語210的被提議的轉(zhuǎn)錄以顯示。在一些示例中,第二⑶I 202b包括向用戶206指示確認(rèn)或拒絕話語210的轉(zhuǎn)錄的文本212。例如,文本212包括“我們認(rèn)為您說了‘Gogadget go,ο如果是,請(qǐng)按確認(rèn)按鈕。如果不是,請(qǐng)按拒絕按鈕,并重新講出熱詞?!睘榇耍诙荌 202b還包括可選擇按鈕214和216,用戶206能夠選擇它們來指示是確認(rèn)該轉(zhuǎn)錄正確,還是拒絕該轉(zhuǎn)錄。例如,在用戶206選擇可選擇按鈕214時(shí),移動(dòng)計(jì)算裝置204接收“Gogadget go”的轉(zhuǎn)錄與話語210相對(duì)應(yīng)的確認(rèn)。此外,例如,在用戶206選擇可選擇按鈕216時(shí),移動(dòng)計(jì)算裝置204接收與話語210相對(duì)應(yīng)的轉(zhuǎn)錄(例如錯(cuò)誤或不準(zhǔn)確的轉(zhuǎn)錄)的拒絕。在一些示例中,所檢測的話語210的被提議的轉(zhuǎn)錄并非經(jīng)由第二GUI 202b提供給用戶206。
[0063]響應(yīng)于接收轉(zhuǎn)錄正確的確認(rèn),移動(dòng)計(jì)算裝置204向用戶206提供第三⑶I202c,該第三GUI 202c提供所檢測的話語210的轉(zhuǎn)錄的確認(rèn)以顯示。在一些示例中,第三GUI 202c包括向用戶206指示用戶206已經(jīng)確認(rèn)話語210的轉(zhuǎn)錄正確的文本218。例如,文本218包括“我們已經(jīng)確認(rèn)您的熱詞是‘Go gadget go’”。因此,詞“Go gadget go”已經(jīng)被確立為與熱詞相關(guān)聯(lián),并且進(jìn)而與發(fā)起web搜索的動(dòng)作相關(guān)聯(lián)。
[0064]在通過用戶206確立熱詞之后,例如在識(shí)別用戶提供的熱詞之后,用戶206例如可以經(jīng)由話語或文本輸入將熱詞220提供給移動(dòng)計(jì)算裝置206。例如,熱詞220可包括詞“Gogadget go”。因此,響應(yīng)于接收“Go gadget go”的熱詞220,移動(dòng)計(jì)算裝置206使得一個(gè)或多個(gè)動(dòng)作進(jìn)行,包括發(fā)起web搜索,并向用戶206提供第四⑶I 202d,該第四⑶I 202d提供與接收熱詞220相關(guān)聯(lián)的要采取的動(dòng)作的描述以顯示。在一些示例中,第四GUI 202d包括“開始搜索…”的文本222。
[0065]圖3描繪用于提供熱詞模型的示例過程300的流程圖。示例過程300可以使用一個(gè)或多個(gè)計(jì)算裝置來執(zhí)行。例如,可以使用移動(dòng)計(jì)算裝置102、104、106,語音識(shí)別引擎108,以及熱詞配置引擎112來執(zhí)行示例過程500。
[0066]對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出該詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù)(302)。例如,語音識(shí)別引擎208從移動(dòng)計(jì)算裝置102和104各自獲得波形120和122,該移動(dòng)計(jì)算裝置102和104對(duì)應(yīng)于講出“start my car”的話語150的用戶114和講出“where do I buy a computer”的話語152的用戶116。對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于詞或子詞的音頻訓(xùn)練用于該詞或子詞的預(yù)先計(jì)算的熱詞模型(304)。例如,熱詞配置引擎112基于波形120和122訓(xùn)練用于每個(gè)詞或子詞的預(yù)先計(jì)算的熱詞模型。從移動(dòng)計(jì)算裝置接收候選熱詞(306)。例如,熱詞配置引擎112從移動(dòng)計(jì)算裝置106接收“startc omp u t e r”的候選熱詞12 9。識(shí)別與該候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型(308)。例如,熱詞配置引擎112識(shí)別詞匯數(shù)據(jù)庫110存儲(chǔ)的、與“start computer”的候選熱詞129相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型128。將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給移動(dòng)計(jì)算裝置(310)。例如,熱詞配置引擎112將預(yù)先計(jì)算的熱詞模型134提供給移動(dòng)計(jì)算裝置106。
[0067]圖4示出一般計(jì)算機(jī)裝置400和一般移動(dòng)計(jì)算裝置450的示例,可通過本文所述技術(shù)來使用它們。計(jì)算裝置400意欲表示各種形式的數(shù)字計(jì)算機(jī),諸如膝上型、桌上型、工作站、個(gè)人數(shù)字助理、服務(wù)器、刀片服務(wù)器、主機(jī)、以及其他適當(dāng)?shù)挠?jì)算機(jī)。計(jì)算裝置450意欲表示各種形式的移動(dòng)裝置,諸如個(gè)人數(shù)字助理、蜂窩電話、智能電話、以及其他類似的計(jì)算裝置。本文所示的組件、它們的連接和關(guān)系、以及它們的功能只是作為示例,并非要限制本文獻(xiàn)所述和/或所要求保護(hù)的發(fā)明的實(shí)施方式。
[0068]計(jì)算裝置400包括處理器402、存儲(chǔ)器404、存儲(chǔ)裝置406、連接存儲(chǔ)器404和高速擴(kuò)展端口410的高速接口408、以及連接低速總線414和存儲(chǔ)裝置406的低速接口412。組件402、404、406、408、410和412中的每個(gè)組件使用各種總線互連,并且可以安裝在公共主板上,或者視情況以其他方式安裝。處理器402可以處理在計(jì)算裝置400中執(zhí)行的指令,包括存儲(chǔ)器404中或者存儲(chǔ)裝置406上存儲(chǔ)的指令,從而在外部輸入/輸出裝置諸如耦接到高速接口 408的顯示器416上顯示用于GUI的圖形信息。在其他實(shí)施方式中,可以視情況連同多個(gè)存儲(chǔ)器和多種存儲(chǔ)器一起使用多個(gè)處理器和/或多個(gè)總線。此外,可將多個(gè)計(jì)算裝置400與提供必要操作部分的每個(gè)裝置相連接(例如,作為服務(wù)器群、刀片服務(wù)器群、或者多處理器系統(tǒng))。
[0069]存儲(chǔ)器404將信息存儲(chǔ)在計(jì)算裝置400中。在一個(gè)實(shí)施方式中,存儲(chǔ)器404是易失性存儲(chǔ)器單元或多個(gè)單元。在另一個(gè)實(shí)施方式中,存儲(chǔ)器404是非易失性存儲(chǔ)器單元或多個(gè)單元。存儲(chǔ)器404也可以是其他形式的計(jì)算機(jī)可讀介質(zhì),諸如磁盤或光盤。
[0070]存儲(chǔ)裝置406能夠?yàn)橛?jì)算裝置400提供大容量存儲(chǔ)。在一個(gè)實(shí)施方式中,存儲(chǔ)裝置406可以是計(jì)算機(jī)可讀介質(zhì)或包含計(jì)算機(jī)可讀介質(zhì),諸如軟盤裝置、硬盤裝置、光盤裝置、或磁帶裝置、閃存或其他類似的固態(tài)存儲(chǔ)器裝置,或者裝置的陣列,包括存儲(chǔ)區(qū)域網(wǎng)絡(luò)或其他配置中的裝置??梢栽谛畔⑤d體中有形地具體實(shí)施計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī)程序產(chǎn)品也可以包含指令,該指令在執(zhí)行時(shí)進(jìn)行諸如上述的一個(gè)或多個(gè)方法。信息載體是計(jì)算機(jī)可讀介質(zhì)或機(jī)器可讀介質(zhì),諸如存儲(chǔ)器404、存儲(chǔ)裝置406、或處理器402上的存儲(chǔ)器。
[0071]高速控制器408管理用于計(jì)算裝置400的帶寬密集型操作,而低速控制器412管理較低的帶寬密集型操作。這種功能分配只是示例性的。在一個(gè)實(shí)施方式中,高速控制器408耦接到存儲(chǔ)器404、顯示器416(例如通過圖形處理器或加速器),并耦接到高速擴(kuò)展端口410,該高速擴(kuò)展端口410可接受各種擴(kuò)展卡(未示出)。在該實(shí)施方式中,低速控制器412耦接到存儲(chǔ)裝置406和低速擴(kuò)展端口414??砂ǜ鞣N通信端口(例如,USB、藍(lán)牙、以太網(wǎng)、無線以太網(wǎng))的低速擴(kuò)展端口可以例如通過網(wǎng)絡(luò)適配器耦接到一個(gè)或多個(gè)輸入/輸出裝置,諸如鍵盤、點(diǎn)擊裝置、掃描儀、或網(wǎng)絡(luò)裝置,諸如交換機(jī)或路由器。
[0072]計(jì)算裝置400可通過多種不同形式實(shí)施,如圖所示。例如,可將其實(shí)施為標(biāo)準(zhǔn)服務(wù)器420,或者在這種服務(wù)器的群組中實(shí)施多次。也可將其實(shí)施為機(jī)架服務(wù)器系統(tǒng)424的一部分。此外,可將其實(shí)施在個(gè)人計(jì)算機(jī)中,諸如膝上型計(jì)算機(jī)422ο或者,可將來自計(jì)算裝置400的組件與移動(dòng)裝置中的其他組件(未示出)組合,諸如裝置450。這些裝置中的每個(gè)裝置都可包含計(jì)算裝置400、450中的一個(gè)或多個(gè),并且整個(gè)系統(tǒng)可以由相互通信的多個(gè)計(jì)算裝置400、450組成。
[0073]除了其他組件之外,計(jì)算裝置450包括處理器452、存儲(chǔ)器464、輸入/輸出裝置諸如顯示器454、通信接口 466、以及收發(fā)器468。也可以向裝置450提供存儲(chǔ)裝置,諸如微型驅(qū)動(dòng)器或其他裝置,以提供額外的存儲(chǔ)。組件450、452、464、454、466和468中的每個(gè)組件使用各種總線互連,并且可將若干組件安裝在公共主板上,或者視情況以其他方式安裝。
[0074]處理器452可以執(zhí)行計(jì)算裝置640中的指令,包括存儲(chǔ)器464中存儲(chǔ)的指令??蓪⑻幚砥鲗?shí)施為芯片的芯片組,包括獨(dú)立的多個(gè)模擬處理器和數(shù)字處理器。例如,處理器可以提供裝置450的其他組件的協(xié)調(diào),諸如用戶界面的控制、裝置450運(yùn)行的應(yīng)用、以及裝置450的無線通信。
[0075]處理器452可通過控制接口 648以及耦接到顯示器454的顯示接口 456與用戶通信。顯示器454例如可以是TFT IXD(薄膜晶體管液晶顯示器)或OLED(有機(jī)發(fā)光二極管)顯示器,或其他適當(dāng)?shù)娘@示器技術(shù)。顯示接口 456可包括用于驅(qū)動(dòng)顯示器454的適當(dāng)電路,以向用戶呈現(xiàn)圖形信息和其他信息??刂平涌?458可接收來自用戶的命令并將它們轉(zhuǎn)化,用于提交給處理器452。此外,可提供外部接口 462與處理器452通信,從而實(shí)現(xiàn)裝置450與其他裝置的近區(qū)域通信。外部接口 462例如在一些實(shí)施方式中提供有線通信,在其他實(shí)施方式中提供無線通信,并且還可以使用多個(gè)接口。
[0076]存儲(chǔ)器464將信息存儲(chǔ)在計(jì)算裝置450中??蓪⒋鎯?chǔ)器464實(shí)施為計(jì)算機(jī)可讀介質(zhì)或媒體、易失性存儲(chǔ)器單元或多個(gè)單元、或者非易失性存儲(chǔ)器單元或多個(gè)單元中的一個(gè)或多個(gè)。此外,可提供擴(kuò)展存儲(chǔ)器454并通過擴(kuò)展接口 452連接到裝置450,該擴(kuò)展接口 452例如可包括SIMM(單列直插式內(nèi)存模塊)卡接口。這種擴(kuò)展存儲(chǔ)器454可以為裝置450提供額外的存儲(chǔ)空間,或者還可以存儲(chǔ)用于裝置450的應(yīng)用或其他信息。具體而言,擴(kuò)展存儲(chǔ)器454可包括執(zhí)行或補(bǔ)充上述過程的指令,并且還可包括安全信息。因此,例如,可以提供擴(kuò)展存儲(chǔ)器454作為用于裝置450的安全模塊,并且可通過允許安全使用裝置450的指令編程。此外,可經(jīng)由SIMM卡連同附加信息一起提供安全應(yīng)用,諸如按照不可破解的方式將識(shí)別信息放入SIMM 卡。
[0077]存儲(chǔ)器例如可包括閃存和/或NVRAM存儲(chǔ)器,如下所述。在一個(gè)實(shí)施方式中,在信息載體中有形地具體實(shí)施計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī)程序產(chǎn)品包含指令,該指令在執(zhí)行時(shí)進(jìn)行如上所述的一個(gè)或多個(gè)方法。信息載體是計(jì)算機(jī)可讀介質(zhì)或機(jī)器可讀介質(zhì),例如存儲(chǔ)器464、擴(kuò)展存儲(chǔ)器454、處理器452上的存儲(chǔ)器、或者例如可通過收發(fā)器468或外部接口 462接收的傳播信號(hào)。
[0078]裝置450可通過通信接口 466無線地通信,在必要時(shí)候通信接口 466可包括數(shù)字信號(hào)處理電路。除了別的之外,通信接口 466可以在各種模式或協(xié)議下提供通信,諸如GSM語音呼叫、SMS、EMS、或MMS消息、CDMA、TDMA、I3DC、WCDMA、CDMA2000或GPRS。這種通信例如可通過射頻收發(fā)器468發(fā)生。此外,短距通信諸如可使用藍(lán)牙、WiF1、或其他這種收發(fā)器(未示出)發(fā)生。此外,GPS(全球定位系統(tǒng))接收器模塊450可將附加的導(dǎo)航數(shù)據(jù)以及位置相關(guān)無線數(shù)據(jù)提供給裝置450,它們可以視情況通過裝置450上運(yùn)行的應(yīng)用來使用。
[0079]裝置450也可使用音頻編譯碼器460有聲地通信,該音頻編譯碼器460可以接收來自用戶的說出的信息,并將其轉(zhuǎn)化為可用的數(shù)字信息。同樣,音頻編譯碼器460可以為用戶生成可聽的聲音,諸如通過揚(yáng)聲器,例如在裝置450的耳機(jī)中。這種聲音可包括來自話音電話呼叫的聲音,可包括記錄的聲音(例如話音消息、音樂文件等等),還可包括通過裝置450上操作的應(yīng)用所生成的聲音。
[0080]可通過多種不同形式來實(shí)施計(jì)算裝置450,如圖所示。例如,可將其實(shí)施為蜂窩電話480 ο也可將其實(shí)施為智能電話482、個(gè)人數(shù)字助理、或其他類似移動(dòng)裝置的一部分。
[0081]本文所述系統(tǒng)和技術(shù)的各種實(shí)施方式可以在數(shù)字電子電路、集成電路、特別設(shè)計(jì)的ASIC(專用集成電路)、計(jì)算機(jī)硬件、固件、軟件、和/或它們的組合中實(shí)現(xiàn)。這些不同的實(shí)施方式可包括一個(gè)或多個(gè)計(jì)算機(jī)程序中的實(shí)施方式,該計(jì)算機(jī)程序在可編程系統(tǒng)中可執(zhí)行和/或可解釋,該可編程系統(tǒng)包括至少一個(gè)可編程處理器、至少一個(gè)輸入裝置、以及至少一個(gè)輸出裝置,該可編程處理器可以是專用處理器,也可以是通用處理器,其被耦接以從存儲(chǔ)系統(tǒng)接收數(shù)據(jù)和指令,以及向存儲(chǔ)系統(tǒng)傳輸數(shù)據(jù)和指令。
[0082]這些計(jì)算機(jī)程序(又稱為程序、軟件、軟件應(yīng)用或代碼)包括用于可編程處理器的機(jī)器指令,并且可以以高級(jí)程序語言和/或面向?qū)ο蟮木幊陶Z言和/或匯編/機(jī)器語言實(shí)施。如同本文使用的,術(shù)語“機(jī)器可讀介質(zhì)”、“計(jì)算機(jī)可讀介質(zhì)”表示用于將機(jī)器指令和/或數(shù)據(jù)提供給可編程處理器的任何計(jì)算機(jī)程序產(chǎn)品、設(shè)備和/或裝置(例如,磁盤、光盤、存儲(chǔ)器、可編程邏輯器件(PLD)),包括接收機(jī)器指令作為機(jī)器可讀信號(hào)的機(jī)器可讀介質(zhì)。術(shù)語“機(jī)器可讀信號(hào)”表示用于將機(jī)器指令和/或數(shù)據(jù)提供給可編程處理器的任何信號(hào)。
[0083]為了提供與用戶的交互,可以在計(jì)算機(jī)上實(shí)施本文所述系統(tǒng)和技術(shù),該計(jì)算機(jī)具有用于向用戶顯示信息的顯示裝置(例如CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器)以及用戶由其向計(jì)算機(jī)提供輸入的鍵盤和點(diǎn)擊裝置(例如鼠標(biāo)和軌跡球)。也可以使用其他類型的裝置來提供與用戶的交互;例如,向用戶提供的反饋可以是任何形式的感覺反饋(例如,視覺反饋、聽覺反饋、或觸覺反饋);并且可以按照任何形式接收來自用戶的輸入,包括聲學(xué)、語音、或觸覺輸入。
[0084]可以在計(jì)算系統(tǒng)中實(shí)施本文所述系統(tǒng)和技術(shù),該計(jì)算系統(tǒng)包括后端組件(例如作為數(shù)據(jù)服務(wù)器),或者包括中間件組件(例如應(yīng)用服務(wù)器),或者包括前端組件(例如具有圖形用戶界面或web瀏覽器的客戶端計(jì)算機(jī),用戶由其可與本文所述系統(tǒng)和技術(shù)的實(shí)施方式交互),或者包括這些后端組件、中間件組件、或前端組件的任何組合。系統(tǒng)的組件可通過任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信(例如通信網(wǎng)絡(luò))來互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“LAN” )、廣域網(wǎng)(“WAN”)及互聯(lián)網(wǎng)。
[0085]計(jì)算系統(tǒng)可包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常相互遠(yuǎn)離,且一般通過通信網(wǎng)絡(luò)來交互??蛻舳伺c服務(wù)器的關(guān)系由于在相應(yīng)計(jì)算機(jī)上運(yùn)行并且相互具有客戶端-月艮務(wù)器關(guān)系的計(jì)算機(jī)程序而出現(xiàn)。
[0086]雖然本公開包括一些特例,但是這些特例不應(yīng)解釋為對(duì)本公開的范圍或者要求保護(hù)的范圍的限制,而是作為對(duì)本公開的示例實(shí)施方式的特征的描述。在獨(dú)立實(shí)施方式的背景下本公開所述的某些特征也可以在單個(gè)實(shí)施方式中組合提供。相反,在單個(gè)實(shí)施方式的背景下描述的不同特征也可以單獨(dú)地或者按照任何合適的子組合在多個(gè)實(shí)施方式中提供。此外,雖然上面可將特征描述為在某些組合中起作用,甚至一開始就這樣要求保護(hù),但是在有些情況下可將來自所要求保護(hù)的組合的一個(gè)或多個(gè)特征從組合中刪除,并且所要求保護(hù)的組合可以指向子組合或者子組合的變型。
[0087]類似地,雖然按照特定順序在附圖中描繪了操作,但是這不應(yīng)理解為要求按照所示特定順序或者按照依次順序進(jìn)行這些操作,或者要求進(jìn)行全部所示的操作,以實(shí)現(xiàn)期望的結(jié)果。在某些情況下,多任務(wù)和并行處理可能是有利的。此外,在上述實(shí)施方式中各種系統(tǒng)組件的分離不應(yīng)理解為在所有實(shí)施方式中都要求這種分離,并且應(yīng)當(dāng)理解,所述程序組件和系統(tǒng)通??梢约稍趩蝹€(gè)軟件產(chǎn)品中或者封裝在多個(gè)軟件產(chǎn)品中。
[0088]因此,描述了本公開的特定實(shí)施方式。其他實(shí)施方式落入所附權(quán)利要求書的范圍內(nèi)。例如,權(quán)利要求中列舉的動(dòng)作可以按照不同的順序進(jìn)行,并且仍然實(shí)現(xiàn)期望的結(jié)果。描述了多個(gè)實(shí)施方式。但是應(yīng)當(dāng)理解,在不脫離本公開精神和范圍的情況下可以進(jìn)行各種修改。例如,可以使用上述流程的各種形式,將步驟重新排序,增加步驟,或去除步驟。因此,其他實(shí)施方式也落入所附權(quán)利要求書的范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種計(jì)算機(jī)實(shí)施的方法,包括: 對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出所述詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù); 對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于所述詞或子詞的所述音頻數(shù)據(jù),訓(xùn)練用于所述詞或子詞的預(yù)先計(jì)算的熱詞模型; 從計(jì)算裝置接收候選熱詞; 識(shí)別與所述候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及 將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給所述計(jì)算裝置。2.根據(jù)權(quán)利要求1所述的方法,其中,識(shí)別所述一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型包括: 獲得與所述候選熱詞相對(duì)應(yīng)的兩個(gè)或更多個(gè)子詞;以及 對(duì)于與所述候選熱詞相對(duì)應(yīng)的所述兩個(gè)或更多個(gè)子詞中的每個(gè)子詞,獲得與所述子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。3.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括:在對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞訓(xùn)練用于所述詞或子詞的所述預(yù)先計(jì)算的熱詞模型之后,從所述計(jì)算裝置接收所述候選熱詞。4.根據(jù)權(quán)利要求1所述的方法,其中,從所述計(jì)算裝置接收所述候選熱詞包括接收與所述候選熱詞相對(duì)應(yīng)的音頻數(shù)據(jù)。5.根據(jù)權(quán)利要求1所述的方法,其中,從所述計(jì)算裝置接收所述候選熱詞包括從所述計(jì)算裝置接收包括兩個(gè)或更多個(gè)詞的所述候選熱詞。6.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括: 識(shí)別與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及 將所識(shí)別的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型提供給所述計(jì)算裝置。7.根據(jù)權(quán)利要求6所述的方法,進(jìn)一步包括: 向所述計(jì)算裝置提供指令,所述指令限定所識(shí)別的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的處理例程。8.根據(jù)權(quán)利要求7所述的方法,其中,所述指令包括依次處理所識(shí)別的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的指令。9.根據(jù)權(quán)利要求8所述的方法,其中,所述指令進(jìn)一步包括依次處理所識(shí)別的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型的處理順序。10.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括: 動(dòng)態(tài)地創(chuàng)建與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型;以及 將動(dòng)態(tài)地創(chuàng)建的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型提供給所述計(jì)算裝置。11.根據(jù)權(quán)利要求10所述的方法,進(jìn)一步包括:在從所述計(jì)算裝置接收所述候選熱詞之后,動(dòng)態(tài)地創(chuàng)建與所述候選熱詞中的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的所述一個(gè)或多個(gè)熱詞模型。12.根據(jù)權(quán)利要求1所述的方法,其中,對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞,訓(xùn)練用于所述詞或子詞的所述預(yù)先計(jì)算的熱詞模型進(jìn)一步包括: 對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞: 為所述多個(gè)用戶中的每個(gè)用戶獲得講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)的轉(zhuǎn)錄; 為所述多個(gè)用戶中的每個(gè)用戶將講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)與講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)的所述轉(zhuǎn)錄相關(guān)聯(lián);以及 基于(i)與講出所述詞或子詞的所述多個(gè)用戶中的每個(gè)用戶相對(duì)應(yīng)的所述音頻數(shù)據(jù)以及(ii)與對(duì)應(yīng)于講出所述詞或子詞的所述多個(gè)用戶中的每個(gè)用戶的所述音頻數(shù)據(jù)相關(guān)聯(lián)的所述轉(zhuǎn)錄,生成與所述詞或子詞相對(duì)應(yīng)的特定的預(yù)先計(jì)算的熱詞模型。13.—種系統(tǒng),包括: 一個(gè)或多個(gè)計(jì)算機(jī)以及一個(gè)或多個(gè)存儲(chǔ)裝置,所述存儲(chǔ)裝置存儲(chǔ)能操作的指令,所述指令在通過所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí)使得所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,所述操作包括: 對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出所述詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù); 對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于所述詞或子詞的所述音頻數(shù)據(jù),訓(xùn)練用于所述詞或子詞的預(yù)先計(jì)算的熱詞模型; 從計(jì)算裝置接收候選熱詞; 識(shí)別與所述候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及 將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給所述計(jì)算裝置。14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,識(shí)別所述一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型包括: 獲得與所述候選熱詞相對(duì)應(yīng)的兩個(gè)或更多個(gè)子詞;以及 對(duì)于與所述候選熱詞相對(duì)應(yīng)的所述兩個(gè)或更多個(gè)子詞中的每個(gè)子詞,獲得與所述子詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型。15.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,從所述計(jì)算裝置接收所述候選熱詞包括從所述計(jì)算裝置接收包括兩個(gè)或更多個(gè)詞的所述候選熱詞。16.根據(jù)權(quán)利要求15所述的系統(tǒng),所述操作進(jìn)一步包括: 識(shí)別與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及 將所識(shí)別的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的每個(gè)詞相對(duì)應(yīng)的預(yù)先計(jì)算的熱詞模型提供給所述計(jì)算裝置。17.根據(jù)權(quán)利要求15所述的系統(tǒng),所述操作進(jìn)一步包括: 動(dòng)態(tài)地創(chuàng)建與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型;以及 將動(dòng)態(tài)地創(chuàng)建的與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的一個(gè)或多個(gè)熱詞模型提供給所述計(jì)算裝置。18.根據(jù)權(quán)利要求17所述的系統(tǒng),所述操作進(jìn)一步包括:在從所述計(jì)算裝置接收所述候選熱詞之后,動(dòng)態(tài)地創(chuàng)建與所述候選熱詞的所述兩個(gè)或更多個(gè)詞中的一個(gè)或多個(gè)詞相對(duì)應(yīng)的所述一個(gè)或多個(gè)熱詞模型。19.根據(jù)權(quán)利要求13所述的系統(tǒng),其中,對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞,訓(xùn)練用于所述詞或子詞的所述預(yù)先計(jì)算的熱詞模型進(jìn)一步包括: 對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞: 為所述多個(gè)用戶中的每個(gè)用戶獲得講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)的轉(zhuǎn)錄; 為所述多個(gè)用戶中的每個(gè)用戶將講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)與講出所述詞或子詞的所述用戶的所述音頻數(shù)據(jù)的轉(zhuǎn)錄相關(guān)聯(lián);以及 基于(i)與講出所述詞或子詞的所述多個(gè)用戶中的每個(gè)用戶相對(duì)應(yīng)的所述音頻數(shù)據(jù)以及(ii)與對(duì)應(yīng)于講出所述詞或子詞的所述多個(gè)用戶中的每個(gè)用戶的所述音頻數(shù)據(jù)相關(guān)聯(lián)的所述轉(zhuǎn)錄,生成與所述詞或子詞相對(duì)應(yīng)的特定的預(yù)先計(jì)算的熱詞模型。20.—種存儲(chǔ)軟件的非短暫性計(jì)算機(jī)可讀介質(zhì),所述軟件包括能通過一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行的指令,所述指令通過這樣的執(zhí)行使得所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,所述操作包括: 對(duì)于多個(gè)詞或子詞中的每個(gè)詞或子詞,獲得與講出所述詞或子詞的多個(gè)用戶相對(duì)應(yīng)的音頻數(shù)據(jù); 對(duì)于所述多個(gè)詞或子詞中的每個(gè)詞或子詞,基于用于所述詞或子詞的所述音頻數(shù)據(jù),訓(xùn)練用于所述詞或子詞的預(yù)先計(jì)算的熱詞模型; 從計(jì)算裝置接收候選熱詞; 識(shí)別與所述候選熱詞相對(duì)應(yīng)的一個(gè)或多個(gè)預(yù)先計(jì)算的熱詞模型;以及 將所識(shí)別的預(yù)先計(jì)算的熱詞模型提供給所述計(jì)算裝置。
【文檔編號(hào)】G10L15/06GK106062868SQ201580010535
【公開日】2016年10月26日
【申請(qǐng)日】2015年5月13日
【發(fā)明人】馬修·謝里菲
【申請(qǐng)人】谷歌公司