專利名稱:自動語音識別方法
技術領域:
本發(fā)明涉及一種自動識別語音的方法。具體地說,本發(fā)明涉及一種從話語中識別關鍵字的方法。
自動語音識別方法,即識別話語中一個或多個關鍵字的方法,通常成為關鍵字定位(keyword spotting)。對于待識別的每個關鍵字,訓練并存儲關鍵字模型。每個關鍵字模型是為與講話者相關的語音識別或與講話者無關的語音識別而訓練的,它表示例如一個單詞或一個詞組。當話語本身或其中一部分與任何之前創(chuàng)建并存儲的關鍵字模型最匹配時,就找到該話語中的一個關鍵字。
近年來,這種語音識別方法已用于移動設備中,例如用于移動電話中。采用這種技術,移動設備可以部分或全部通過語音命令來加以控制,而不是使用鍵盤。這種方法最適用于禁用鍵盤處理電話的車載免提設備。由此,一從話語中識別出關鍵字,就立刻激活移動電話。隨后,移動電話監(jiān)聽其它話語,并在其中某部分與任一存儲的關鍵字模型最匹配時將其評定為待識別的關鍵字。
關鍵字識別的正確程度隨使用移動設備的聲音環(huán)境或用戶特性如發(fā)音而不同。例如,如果話語的某部分與存儲的關鍵字模型之一匹配,但卻不是所需要的待識別關鍵字時,則評定可能是錯誤的。因此,相對于話語關鍵字總數(shù)的正確識別的關鍵字數(shù)量,即命中率極其依賴于聲音環(huán)境和用戶特性。
從現(xiàn)有技術已知的自動語音識別方法經(jīng)常采用所謂的垃圾模型及關鍵字模型(參見Jean Marc Boite所著的“一種新的關鍵字定位方法”(an new approaeh towards Keyword Spotting,Jean Marc Boite,EUROSPEFCH Berlin,1993,pp.1273-1276))。為此,創(chuàng)建了多個垃圾模型。一些垃圾模型表示例如非關鍵字語音,如咂嘴聲、呼吸聲或補白單詞“aeh”,或“em”,。其它垃圾模型創(chuàng)建來表示背景噪聲。垃圾模型例如有音素、音素覆蓋類(phoneme cover class)或完整的單詞。利用這些垃圾模型,降低了每時間單位錯誤識別的關鍵字數(shù)量,即虛警率。這是因為可以直接將包括非關鍵字語音的話語的若干部分映射到存儲的垃圾模型之一。但采用這種方法時,命中率下降了,因為部分話語可能與一個或多個垃圾模型的匹配程度比關鍵字模型本身的匹配程度高。例如,如果語音識別過程中聲音環(huán)境差,則部分話語可能與表示這種聲音環(huán)境的垃圾模型匹配。因此,將該部分評定為非關鍵字語音,這當然是不希望的結(jié)果。
因此,本發(fā)明的目的是提供一種語音識別方法,這種方法可提高命中率,并避免已知現(xiàn)有技術的缺點。
此目的是通過權(quán)利要求1的方法來解決的。根據(jù)本發(fā)明,提供了一種利用至少一個關鍵字模型和多個垃圾模型識別話語中的關鍵字的方法,其中如果一部分話語與所述關鍵字模型或某個垃圾序列模型最匹配,則將該部分話語評定為待識別的關鍵字;并且所述垃圾序列模型是來自所述多個垃圾模型的一系列連續(xù)垃圾模型。
本質(zhì)上,本發(fā)明的方法還在一部分話語與所述垃圾序列模型最匹配時將該部分話語評定為待識別的關鍵字。于是,作為本發(fā)明的優(yōu)點,提高了命中率。這是因為采用兩個模型,即關鍵字模型和垃圾序列模型來從話語中識別關鍵字。這里,在本發(fā)明上下文中,部分話語是任意時間間隔的輸入話語。時間間隔的長度可以是完整的話語或只是其中的一小段序列。
有利的是,根據(jù)本發(fā)明的方法在存在比關鍵字模型本身更匹配話語的多個連續(xù)垃圾模型時避免命中率下降。因此,本自動語音識別方法比已知的現(xiàn)有技術語音識別方法更穩(wěn)健。
最好這樣確定所述垃圾序列模型將表示待識別關鍵字的關鍵字話語與所述多個垃圾模型進行比較,并檢測與所述關鍵字最匹配的連續(xù)垃圾模型序列。采用這種方法可根據(jù)已用于現(xiàn)有技術語音識別方法的現(xiàn)有垃圾模型容易地創(chuàng)建所述垃圾序列模型。所述現(xiàn)有技術方法例如基于有限狀態(tài)語法,其中,將一個或多個關鍵字模型和多個垃圾模型用于識別任何話語中的關鍵字。于是根據(jù)本發(fā)明,用有限狀態(tài)語法創(chuàng)建垃圾序列模型,此垃圾序列模型只包括多個垃圾模型,而不包括關鍵字模型。將作為關鍵字話語且表示關鍵字的輸入話語與存儲的多個垃圾模型進行比較。然后,將來自所述多個垃圾模型的一系列連續(xù)垃圾模型確定為最適合表示所述關鍵字的垃圾序列模型。根據(jù)本發(fā)明,隨后將此垃圾序列模型用于識別話語中的關鍵字,條件是所述話語的所述部分與關鍵字模型或該垃圾序列模型匹配。
根據(jù)本發(fā)明的方法,所確定的垃圾序列模型享有相對于通過所述多個垃圾模型的任何其它路徑的特權(quán)。本質(zhì)上,所確定的垃圾序列模型享有相對于任何包括相同連續(xù)垃圾模型序列的路徑的特權(quán)。這就規(guī)定將所述話語中的該部分評定為待識別關鍵字,即便存在通過所述多個垃圾模型的類似路徑。因此,命中率得以提高,因為,將所述話語的所述部分評定為待識別關鍵字更可取。
根據(jù)本發(fā)明的第一方面,本發(fā)明還包括確定亦表示待識別關鍵字的若干個其它垃圾序列模型;并且如果所述話語的該部分與所述若干個垃圾序列模型中的任何一個序列模型最匹配,則將所述部分話語評定為待識別關鍵字。隨后將所有垃圾序列模型和關鍵字模型用于識別所述關鍵字。采用這種方法便可提高命中率,因為質(zhì)量稍差的話語也可能與任一所述其它垃圾序列模型匹配,并因此而被評定為關鍵字。
最好通過如下方式來確定所有垃圾序列模型計算每個垃圾序列模型所對應的概率值;并選擇其概率值高于閾值的那些垃圾序列模型,從而得到所有垃圾序列模型。計算模型概率值的這種計算是常用的。因此,以經(jīng)驗方式確定這里用于將垃圾序列模型分類為表示關鍵字或不表示關鍵字的模型的預定義概率值。
根據(jù)本發(fā)明的第二方面,還包括-檢測與所述話語的部分最匹配的通過所述多個垃圾模型的路徑,-計算所述垃圾序列模型包含在該路徑中的概率值;并且-為將所述話語的所述部分評定為待識別關鍵字,在所述概率值高于閾值時,將通過所述多個垃圾模型的該路徑假定為所述垃圾序列模型。
為此,需要一個垃圾序列模型,它最適合表示所述關鍵字。在識別階段之前事先確定并存儲此垃圾序列模型。如果在識別階段,檢測到通過所述多個垃圾模型且與所述話語的部分最匹配的路徑,則執(zhí)行后續(xù)處理步驟。在后續(xù)處理步驟中,確定所述預定義垃圾序列模型包含在該路徑中的概率值。如果該概率值高于閾值,則假定該路徑或其中一部分為所述垃圾序列模型。利用該假設,將所述話語的所述部分評定為待識別關鍵字。因為僅需存儲一個垃圾序列模型,因此根據(jù)本發(fā)明的識別方法所需要的存儲器容量較小,并因此可在存儲器容量受限時,例如在移動電話中得到利用。有利的是,因為可以隨時根據(jù)需要調(diào)整閾值,因此根據(jù)所述第二方面的識別方法還具有很高的靈活性。
最好根據(jù)所確定的垃圾序列模型、檢測到的通過所述多個垃圾模型的路徑和垃圾模型混淆矩陣來計算所述概率,其中,所述垃圾模型混淆矩陣包含假定垃圾模型j給定時識別出垃圾模型i的概率P(i|j)。
有利的是,所述至少一個垃圾序列模型是在創(chuàng)建針對待識別新關鍵字的關鍵字模型時被確定的。因此,根據(jù)本發(fā)明第一和第二方面的語音識別方法是靈活的,因為只要一創(chuàng)建新關鍵字便可確定垃圾序列模型。這是與講話者相關的識別方法的優(yōu)點,其中,根據(jù)一個講話者(通常為用戶)發(fā)出的一段或多端話語創(chuàng)建關鍵字。于是,一由用戶創(chuàng)建了關鍵字便可應用本方法。
本發(fā)明的另一方面涉及一種含程序代碼組件的計算機程序產(chǎn)品,當所述產(chǎn)品在計算裝置中運行時所述程序代碼組件用于執(zhí)行根據(jù)本發(fā)明的識別方法。
所述計算機程序產(chǎn)品最好存儲在計算機可讀記錄介質(zhì)上。
通過結(jié)合附圖閱讀如下優(yōu)選實施例的詳細說明,便可清楚本發(fā)明的各種優(yōu)點,附圖中
圖1說明根據(jù)本發(fā)明第一方面,用于關鍵字定位的有限狀態(tài)語法;圖2說明根據(jù)本發(fā)明的用于確定垃圾序列模型的有限狀態(tài)語法;圖3說明根據(jù)本發(fā)明的第二方面,一條通過多個垃圾模型的路徑到一個垃圾序列模型的映射;圖4說明用于現(xiàn)有技術關鍵字定位的有限狀態(tài)語法;圖5顯示移動設備中自動語音識別裝置的方框圖。
自動語音識別用于識別一段話語中的關鍵字。因此,所用的識別方法表示成有限狀態(tài)語法。圖4說明用于識別一個關鍵字的現(xiàn)有技術有限狀態(tài)語法。這種有限狀態(tài)語法將輸入話語的任何部分與表示待識別關鍵字的模型進行比較。在圖4中,為待識別關鍵字創(chuàng)建的關鍵字模型表示為一條路徑。還顯示了多個垃圾模型gi,其中i是整數(shù)。例如,一些垃圾模型表示語音事件,如補白的暫停音“em”或咂嘴聲。其它垃圾模型表示其它非語音事件,如背景噪聲。為了預定義垃圾模型gi,重要的是要知道關鍵字集、采用語音識別的聲環(huán)境以及所述垃圾模型所涵蓋的語音事件。此外,所示有限狀態(tài)語法中還包括另一條路徑,它被命名為SIL模型,表示典型的靜音期。只要一激活識別,便會將每段輸入話語或輸入話語的任何部分與有限狀態(tài)語法中的存儲模型進行比較。為此,在有限狀態(tài)語法中,要確定一條通過任一預定義關鍵字模型、SIL模型和垃圾模型且與輸入話語最匹配的路徑。這里,一條路徑可只包括所述模型之一或一系列所述模型。如果關鍵字模型本身包括在該路徑中,則識別出關鍵字。
根據(jù)本發(fā)明的原理,創(chuàng)建亦表示關鍵字的垃圾序列模型。隨后利用此垃圾序列模型語音將輸入話語或其一部分評定為待識別關鍵字,條計是該垃圾序列模型與輸入話語或其一部分最匹配。所述垃圾序列模型在本發(fā)明中定義為一系列連續(xù)垃圾模型gi。這種垃圾序列模型最好根據(jù)如圖2所述的有限狀態(tài)語法來創(chuàng)建。這里,用于確定垃圾序列模型的有限狀態(tài)語法只包括一個SIL模型和多個垃圾模型gi。SIL模型是可選的。垃圾模型gi與正常識別過程中有限狀態(tài)語法中所用的一樣。為了確定垃圾序列模型,將圖2所示的有限狀態(tài)語法應用于表示待識別關鍵字的關鍵字話語。然后選擇通過多個垃圾模型gi且與該關鍵字話語最匹配的那條路徑。所確定的這一路徑是一系列連續(xù)垃圾模型gi,它隨后在語音識別過程中用于將話語中的任何部分識別為待識別關鍵字。根據(jù)本發(fā)明的垃圾序列模型創(chuàng)建方式可用于與講話者相關和與講話者無關的語音識別。對于與講話者相關的語音識別,表示所需關鍵字的關鍵字話語是從一個講話者那里收集的語音。該講話者通常是其中實現(xiàn)了語音識別方法的移動設備的用戶。對于與講話者無關的語音識別,關鍵字話語是從若干講話者中抽取的樣本那里收集的語音?;蛘?,關鍵字語音可以是已訓練好并已存儲的參考模型。
現(xiàn)在通過如圖1所示的示例描述根據(jù)本發(fā)明第一方面的方法。這里,有限狀態(tài)語法具有一個關鍵字模型、一個SIL模型(靜音模型)和多個垃圾模型gi。同樣地,只采用了一個根據(jù)本發(fā)明創(chuàng)建的垃圾序列模型。在本示例中,垃圾序列模型由一系列連續(xù)垃圾模型g7-g3-g0-g2-g1-g5構(gòu)成,這些垃圾模型是根據(jù)圖2所示的語法確定的。隨后將如圖1所示的有限狀態(tài)語法應用到輸入話語上。利用這種方法,提高了命中率,因為可在話語的某部分與關鍵字模型或所確定的垃圾序列模型最匹配時識別出關鍵字。雖然根據(jù)本發(fā)明第一方面的方法是根據(jù)如圖1所示的有限狀態(tài)語法(其中只有一個垃圾序列模型)來描述的,但本發(fā)明不限于該示例。當然,對應每個待識別關鍵字,可以存在其它N個垃圾序列模型。利用這其它N個垃圾序列模型及首先確定的垃圾序列模型,可進一步提高命中率。根據(jù)N+1個垃圾序列模型中的每個垃圾序列模型表示關鍵字的概率,總數(shù)N是有限的。因此,針對所確定的每個垃圾序列模型,計算一個概率值。然后,選擇其概率值高于某個閾值的那些垃圾序列模型,從而得到總共N+1個垃圾序列模型。典型的閾值假設為90%的最大可得概率值,其中,最大可得概率值是最佳垃圾序列模型的概率值。為了將垃圾序列模型的總數(shù)N+1限制為某個可用數(shù)量,應該限制所用垃圾序列模型的總數(shù)最大為10。
有利的是,所確定的垃圾序列模型享有相對于通過所述多個垃圾模型的任何路徑的特權(quán)。具體地說,確定該垃圾序列模型的連續(xù)垃圾模型序列的權(quán)重總是高于來自所述多個垃圾模型的相同系列的連續(xù)垃圾模型。于是命中率提高了,因為只要某一系列的連續(xù)垃圾模型與話語的某部分最匹配,便選定了垃圾序列模型,并將該話語部分評定為待識別關鍵字。雖然本發(fā)明是基于一個關鍵字的有限狀態(tài)語法來進行說明的,但本發(fā)明適用于一個以上的關鍵字。為了使該垃圾序列模型享有特權(quán),針對來自所述多個垃圾模型的垃圾模型定義了罰分(penalty)。這會導致該垃圾序列模型比通過所述多個垃圾模型的完全相同的系列具有更高的概率。
圖3說明由一條通過多個垃圾模型的路徑到預定義的垃圾序列模型的映射。這里,在橫坐標上,顯示了所確定的與關鍵字模型最匹配的垃圾序列模型g7-g3-g0-g2-g1-g5。時間軸t上顯示了一條檢測到的通過所述多個垃圾模型的路徑,它與輸入話語的所示部分最匹配。所確定的垃圾序列模型已經(jīng)預先定義好,這是根據(jù)例如圖2所示的有限狀態(tài)語法來完成的。但與根據(jù)第一方面的方法相反,該垃圾序列模型不直接用于將話語的一部分評定為待識別關鍵字。而是為了識別目的,采用類似圖4所示的現(xiàn)有技術有限狀態(tài)語法。在第一步驟中,檢測通過所述多個垃圾模型的與話語最匹配的一條路徑。然后,在后處理步驟中,將該檢測到的路徑與預定義的垃圾序列模型進行比較。由此計算出預定義垃圾序列模型包含在該檢測路徑中的概率。最后,當此概率高于某個閾值時將該路徑假定為垃圾序列模型。當把該路徑假定為垃圾序列模型時,隨之將該話語的相應部分評定為待識別的關鍵字。此外,根據(jù)本發(fā)明第二方面的方法提高了命中率。與根據(jù)第一方面的方法相反,此方法更靈活,但需要更多的計算工作。這里,對于每個關鍵字模型,只需存儲一個垃圾序列模型,并且識別處理是后處理計算。現(xiàn)在根據(jù)圖3更詳細地描述評定關鍵字的后處理計算。可通過計算垃圾序列模型包含在檢測到的通過所述多個垃圾模型的路徑中的概率來進行軟比較。這種概率例如可通過采用動態(tài)編程方法[參見Dynamicprogramming;BELLman,R.E.;Princeton University Press;1972]和垃圾模型混淆矩陣來計算。在圖3所示的每個網(wǎng)格點,計算描述所確定的路徑與預定垃圾序列模型匹配的可能性的概率。因此,將從垃圾混淆矩陣得知的概率P(i|j)(其中,i≠j且均為整數(shù))用作發(fā)射概率(emission probability)?;蛘?,也可以采用更高階的統(tǒng)計模型。由時刻t的垃圾模型gi轉(zhuǎn)移到離散時刻t+1的垃圾模型gj的轉(zhuǎn)移概率對所有i、j、t為常數(shù),因此在搜索中不必考慮。而且,允許垃圾序列模型在從t到g+1時保留在同一垃圾模型中,或者轉(zhuǎn)移到下一個垃圾模型,或者跳過某個垃圾模型。因此,如果未正好在該路徑中找到垃圾序列模型,則動態(tài)編程搜索會給出從t0到(t0+M)的時間間隔中垃圾序列的最好概率,如圖3所示。在后處理步驟中,計算通過格型網(wǎng)的所有可能路徑,然后將具有最高概率的路徑用于評定步驟。在最后一個步驟中,如果動態(tài)編程給出比預定義閾值高的概率,則將話語的該部分判定為待識別關鍵字。同樣,根據(jù)本發(fā)明第二方面的方法不限于只識別一個關鍵字。對于一個以上的關鍵字,本方法適用于多個關鍵字中的每一個。
根據(jù)本發(fā)明原理的方法提高了命中率。利用所述的本發(fā)明的兩個方面,還可進一步提高命中率。根據(jù)本發(fā)明第一方面的方法容易實現(xiàn),需要較少的計算。而根據(jù)本發(fā)明第二方面的方法則更靈活。當應用結(jié)合了本發(fā)明的第一和第二方面特征的方法時,還可以進一步提高命中率。于是,當根據(jù)第一方面,路徑直接與一個或多個預定義的垃圾序列模型最匹配時,將話語的相應部分評定為關鍵字;或者當根據(jù)第二方面,假定路徑為垃圾序列模型時,將話語的相應部分評定為關鍵字。這樣,本發(fā)明的語音識別方法具有靈活性,且可適應移動設備的局限性,例如實施所述方法的移動設備的有限存儲器容量。
圖5顯示了移動設備如移動電話中的自動語音識別裝置100的方框圖。語音識別裝置100配置成幾個部分(如圖所示)或一個中心部分,其主要部分為模式匹配器120、存儲器部分130和控制器部分140。模式匹配器120與存儲器部分130相連,存儲器部分130可存儲關鍵字模型、垃圾模型、SIL模型和垃圾序列模型。根據(jù)熟知的現(xiàn)有技術創(chuàng)建關鍵字模型、SIL模型和垃圾模型。如上所述根據(jù)本發(fā)明確定垃圾序列模型??刂破鞑糠?40連接到模式匹配器120和存儲器部分130。控制器部分140、模式匹配器120和存儲器部分130是主要部分,它們執(zhí)行本發(fā)明的任何一種自動語音識別方法。移動設備用戶講出的話語經(jīng)麥克風210轉(zhuǎn)換成模擬信號。此模擬信號隨后由模數(shù)轉(zhuǎn)換器220轉(zhuǎn)換成數(shù)字信號。此數(shù)字信號隨后由預處理器部分110轉(zhuǎn)換成參數(shù)描述。預處理器部分110連接到控制器部分140和模式匹配器120?;诟鶕?jù)本發(fā)明的有限狀態(tài)語法,模式匹配器120將該話語的參數(shù)描述與存儲在存儲器部分130中的模型進行比較。如果該話語的至少一部分的參數(shù)模型與存儲在存儲器部分130中的存儲模型之一匹配,則向用戶提供所評定的識別結(jié)果指示。所指示的識別結(jié)果通過移動設備的揚聲器300或顯示屏(未顯示)傳遞給用戶。
與根據(jù)現(xiàn)有技術的已知語音識別裝置相反,根據(jù)本發(fā)明的自動語音識別裝置還在話語的任何部分與所確定的存儲在存儲器部分中的垃圾序列模型中的至少一個最匹配時將該部分判定為待識別關鍵字。于是,提高了命中率。
權(quán)利要求
1.一種利用至少一個關鍵字模型和多個垃圾模型識別話語中的關鍵字的方法,其中如果一部分話語與所述關鍵字模型或某個垃圾序列模型最匹配,則將該部分話語評定為待識別的所述關鍵字;以及所述垃圾序列模型是來自所述多個垃圾模型的一系列連續(xù)垃圾模型。
2.如權(quán)利要求1所述的方法,其特征在于所述垃圾序列模型通過下列步驟來確定-將表示待識別的所述關鍵字的關鍵字話語與所述多個垃圾模型進行比較;以及-檢測所述多個垃圾模型中與待識別的所述關鍵字最匹配的所述系列的連續(xù)垃圾模型。
3.如權(quán)利要求1或2所述的方法,其特征在于-所述確定的垃圾序列模型享有相對于通過所述多個垃圾模型的任何路徑的特權(quán)。
4.如權(quán)利要求1-3中任意一項所述的方法,其特征在于還包括-確定亦表示待識別的所述關鍵字的若干(N)個其它垃圾序列模型;以及-如果所述一部分話語與所述若干(N)個垃圾序列模型中的任何一個序列模型最匹配,則將所述部分話語評定為待識別的所述關鍵字。
5.如權(quán)利要求4所述的方法,其特征在于按下述方式確定所述總數(shù)(N+1)個垃圾序列模型-計算每個垃圾序列模型所對應的概率值;并且-選擇其概率值高于預定值的那些垃圾序列模型,從而得到所述總數(shù)(N+1)個垃圾序列模型。
6.如權(quán)利要求1-5中任意一項所述的方法,其特征在于還包括-檢測通過所述多個垃圾模型的與所述話語最匹配的路徑,-針對該路徑,計算所述垃圾序列模型包含在該路徑中的概率值,并且-為將所述話語的部分評定為待識別的所述關鍵字,在所述概率高于閾值時,將通過所述多個垃圾模型的該路徑假定為所述垃圾序列模型。
7.如權(quán)利要求6所述的方法,其特征在于-所述概率是根據(jù)所確定的垃圾序列模型和所檢測到的通過所述多個垃圾模型的垃圾以及垃圾模型混淆矩陣來計算的,以及-所述垃圾模型混淆矩陣包含假定垃圾模型j給定時識別出垃圾模型i的概率P(i|j)。
8.如權(quán)利要求7所述的方法,其特征在于所述概率是周動態(tài)編程技術來計算的。
9.如權(quán)利要求1-8中任意一項所述的方法,其特征在于所述至少一個垃圾序列模型是在針對待識別的新關鍵字的關鍵字模型被創(chuàng)建時被確定的。
10.如權(quán)利要求1-9中任意一項所述的方法,其特征在于所述關鍵字話語是從一個講話者那里收集的語音。
11.如權(quán)利要求1-9中任意一項所述的方法,其特征在于所述關鍵字話語是從若干講話者抽取的樣本那里收集的語音。
12.如權(quán)利要求1-9中任意一項所述的方法,其特征在于所述關鍵字話語是參考模型。
13.一種含程序代碼組件的計算機程序產(chǎn)品,所述程序代碼組件在所述產(chǎn)品在計算裝置中運行時用于執(zhí)行如權(quán)利要求1至12之一所述的步驟。
14.如權(quán)利要求13所述的含程序代碼組件的計算機程序產(chǎn)品,其特征在于所述計算機程序產(chǎn)品存儲在計算機可讀介質(zhì)上。
15.一種實施如權(quán)利要求1-12中任意一項所述方法的自動語音識別裝置100,包括-預處理部分(110),其中,可以將來自話語的數(shù)字信號轉(zhuǎn)換成參數(shù)描述,所述話語送入麥克風(210)并在模數(shù)轉(zhuǎn)換器220中進行轉(zhuǎn)換;-模式匹配器(120),其中,所述話語的參數(shù)描述可與所存儲的關鍵字模型、SIL模型、垃圾模型和垃圾序列模型進行比較;-控制器部分(140),其中,結(jié)合所述模式匹配器(120)和所述存儲器部分(130),可執(zhí)行用于自動語音識別的所述方法。
16.一種具有如權(quán)利要求15所述的自動語音識別裝置的移動設備,其中所述移動設備是移動電話。
全文摘要
一種根據(jù)至少一個關鍵字模型和多個垃圾模型識別話語中的關鍵字的方法。隨后,如果一部分話語與該關鍵字模型或某個垃圾序列模型最匹配,則將該部分話語評定為待識別關鍵字。這里,垃圾序列模型是來自所述多個垃圾模型的一系列連續(xù)垃圾模型。
文檔編號G10L15/183GK1639768SQ02829378
公開日2005年7月13日 申請日期2002年8月1日 優(yōu)先權(quán)日2002年8月1日
發(fā)明者R·施萊弗, A·基伊斯林格, H·-G·希斯奇 申請人:艾利森電話股份有限公司