語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法

文檔序號：2820231閱讀：285來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法
技術(shù)領(lǐng)域：
本發(fā)明是有關(guān)在語音識(shí)別系統(tǒng)中，對誤識(shí)別單詞或文章進(jìn)行取消處理的一種語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法的技術(shù)。
(2)背景技術(shù)作為HCI的核心技術(shù)，語音識(shí)別技術(shù)與信息化時(shí)代同步發(fā)展，其必要性正逐漸加大，并開始廣泛使用于很多應(yīng)用領(lǐng)域中。
從產(chǎn)業(yè)方面觀之，在信息通信產(chǎn)業(yè)、信息處理產(chǎn)業(yè)、家電產(chǎn)業(yè)、汽車產(chǎn)業(yè)等多種產(chǎn)業(yè)領(lǐng)域中，語音識(shí)別技術(shù)正逐漸發(fā)展成為下一代用戶界面的基礎(chǔ)技術(shù)，其本身的市場規(guī)模，也將急速擴(kuò)大，而且對其它產(chǎn)業(yè)領(lǐng)域創(chuàng)造高附加值，也將做出不可磨滅的貢獻(xiàn)。
隨著最近語音識(shí)別技術(shù)逐漸趨于實(shí)用化，作為可信值高的語音識(shí)別核心技術(shù)，取消非識(shí)別相應(yīng)詞匯，并對識(shí)別相應(yīng)文章，也能取消誤識(shí)別結(jié)果的發(fā)音驗(yàn)證技術(shù)，其重要性逐漸得到廣泛認(rèn)可，而對該技術(shù)的研究也在得以廣泛開展。目前在韓國，對語音識(shí)別技術(shù)的研究活動(dòng)也在緊鑼密鼓地進(jìn)行，各大學(xué)以及企業(yè)正在對連接數(shù)字識(shí)別技術(shù)和發(fā)音驗(yàn)證技術(shù)進(jìn)行廣泛的研究，但其研究成果仍落后于其他發(fā)展國家。
由于當(dāng)前水準(zhǔn)的語音識(shí)別性能尚達(dá)不到100％，因此經(jīng)常會(huì)導(dǎo)致誤識(shí)別的結(jié)果。假如允許通過上述那些誤差，那么實(shí)用語音識(shí)別系統(tǒng)的用戶，便會(huì)對使用裝置的性能感到不滿，這將直接導(dǎo)致語音市場的競爭力下跌。為了解決上述問題，研究出來的結(jié)果便是發(fā)音驗(yàn)證技術(shù)。
上述發(fā)音驗(yàn)證技術(shù)利用某一特定的可信值，對接受或拒絕語音識(shí)別的結(jié)果進(jìn)行判斷。在此，可信值是衡量語音識(shí)別結(jié)果是否可信的尺度。如果可信值越高，便認(rèn)定識(shí)別結(jié)果可以信賴，并應(yīng)接受該識(shí)別結(jié)果。相反，可信值越低，那么認(rèn)定識(shí)別結(jié)果不可信賴，并應(yīng)拒絕識(shí)別結(jié)果。
根據(jù)實(shí)際語音識(shí)別的測試結(jié)果，大部分的誤差出自于用戶的發(fā)音模糊所致。因此，不使用發(fā)音驗(yàn)證的識(shí)別系統(tǒng)，在用戶發(fā)出模糊音的情況下，也會(huì)將誤識(shí)別的結(jié)果直接放行。
使用發(fā)音驗(yàn)證方法是指，并非將上述誤識(shí)別的結(jié)果直接傳送給系統(tǒng)裝置，而是通過某種可信值測定，判斷語音識(shí)別系統(tǒng)的誤識(shí)別與否的問題，在判定是正常識(shí)別的結(jié)果時(shí)，放行上述識(shí)別結(jié)果，否則將其取消的機(jī)械裝置。
上述發(fā)音驗(yàn)證方法有模式分類(pattern classification)和統(tǒng)計(jì)假設(shè)的驗(yàn)證方法。其中，模式分類方法的目的是指，在設(shè)有任意觀測值O＝{O1，O2，...，OT}的情況下，判定0屬于哪種級別，即決定C(O)∈{Ck，；k＝1，2，··，K}。假設(shè)附帶條件概率P(O/Ck)和詞典概率P(Ck)已確定，那么降低分類誤差至最小的最佳分類級別(optimalclass decision)C(o)，就相當(dāng)于數(shù)學(xué)式1中將后驗(yàn)概率最大化的Bayes decisionrule。
數(shù)學(xué)式1C(O)＝argmaxP(Ck/O)＝argmaxP(O/Ck)P(Ck)相反，在統(tǒng)計(jì)假設(shè)驗(yàn)證中，對已確定的觀測值0為識(shí)別結(jié)果的假設(shè)H1，將驗(yàn)證0為正確識(shí)別結(jié)果的虛假設(shè)H0。假設(shè)虛假設(shè)和假設(shè)的概率已確定，那么在通過Neyman-Pearson Lemma，最佳驗(yàn)證法便為數(shù)學(xué)式2時(shí)，將采用虛假設(shè)的方法測定類似值。
數(shù)學(xué)式2LR(k)=Pk(O/H0)Pk(O/H1)>τk]]>在此，Pk(O/H0)代表虛假設(shè)的概率密度函數(shù)，Pk(O/H1)代表假設(shè)的概率密度函數(shù)，τk是指臨界極限(critical threshold)。在基于HMM的語音識(shí)別系統(tǒng)中，H0根據(jù)如何定義，在電話(phone)中顯示文章級別的Ck，而H1則顯示與其不同的級別{Cj}。在此，級別Ck的參數(shù)λk是指狀態(tài)轉(zhuǎn)移概率、狀態(tài)觀測值概率和狀態(tài)初步概率。
為將發(fā)音驗(yàn)證適用于HMM基礎(chǔ)上的語音識(shí)別方法中，需要推算P(O/H0)和P(O/H1)，而這些概率中應(yīng)假定事先設(shè)定的假設(shè)分布和附帶條件概率分布的參數(shù)。上述假設(shè)因不充分的數(shù)據(jù)而有可能導(dǎo)致真值與推算出的分布之間產(chǎn)生誤差。
上述統(tǒng)計(jì)假設(shè)驗(yàn)證性能大致通過兩個(gè)誤差率得以評估。其一、在虛假設(shè)為真值時(shí)，將其取消的誤拒絕(false rejection)(Type Iα)，其二、在虛假設(shè)為虛值時(shí)，采用該假設(shè)的誤接受(false acceptance)〔Type II或誤警告(falsealarmβ)〕。根據(jù)如何選擇α和β，τk值也會(huì)有所不同。在此，可利用τk值選擇α＝β的equal error rate(EER)，還可選擇兩個(gè)誤差率之和為最小的α+β。下面將參照附圖1中的柱狀圖，對發(fā)音驗(yàn)證中最合適的τk。
圖1是現(xiàn)有技術(shù)中可信值的柱狀圖。
如圖1所示，兩個(gè)柱狀圖分別指相應(yīng)于Ck的所有訓(xùn)練數(shù)據(jù)和不相應(yīng)于Ck的所有訓(xùn)練數(shù)據(jù)的類似柱狀圖。在圖1中，τk的右側(cè)部分〔類型(Type)II)〕代表β的量，而左側(cè)部分〔類型(Type)I〕則代表α的量。
如上所述，在測定可信值后，將測定的可信值和臨界值進(jìn)行比較，并以此判定相應(yīng)語音的誤識(shí)別與否問題。下面將參照附圖2，對該方法進(jìn)行簡單說明。
圖2是現(xiàn)有式語音識(shí)別方法的流程圖。
S200、S202，如圖2所示，一旦接收到用戶輸入的語音識(shí)別命令，語音識(shí)別系統(tǒng)便將檢測語音末端，并只提取語音存在的部分。
S204、S206，然后，語音識(shí)別系統(tǒng)將從上述提取的語音部分中，提取語音識(shí)別所需的特征，并對上述提取的語音數(shù)據(jù)，經(jīng)過維特比搜索過程，進(jìn)行語音識(shí)別。
S208，然后，語音識(shí)別系統(tǒng)針對上述語音識(shí)別的語音數(shù)據(jù)，計(jì)算可信值，并進(jìn)行發(fā)音驗(yàn)證。
S210，最后，語音識(shí)別系統(tǒng)確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值。
S212，根據(jù)上述判斷結(jié)果，假如可信值大于臨界值，那么識(shí)別系統(tǒng)將判定識(shí)別相應(yīng)語音成功。
S214，根據(jù)第210步驟的判斷結(jié)果，假如可信值不大于上述臨界值，那么語音識(shí)別系統(tǒng)將取消相應(yīng)語音的識(shí)別結(jié)果。
但具有如上特點(diǎn)的現(xiàn)有式發(fā)音驗(yàn)證方式，雖然對輸入的語音進(jìn)行正常識(shí)別與否的問題進(jìn)行判斷，但這一方式很難從實(shí)際上充分體現(xiàn)多樣化的語音，而且在汽車等雜音很重的環(huán)境中，很難確保系統(tǒng)的正常性能。
此外在發(fā)音模糊的情況下，假設(shè)可信值小于特定取消率，那么將其判定為誤識(shí)別的結(jié)果，并對其予以取消處理，但也有可能判定其為正常發(fā)音的誤識(shí)別結(jié)果。
(3)發(fā)明內(nèi)容本發(fā)明的目的是為了解決上述問題，提供一種可使用戶不受識(shí)別系統(tǒng)性能的影響，在不受環(huán)境限制的范圍內(nèi)，輕松使用識(shí)別系統(tǒng)的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法。
本發(fā)明的另一目的是，提供一種可在語音識(shí)別系統(tǒng)中添加錄音重放的功能，以使每在進(jìn)行語音識(shí)別時(shí)，均可確認(rèn)是否正常進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法。
為了實(shí)現(xiàn)上述目的，本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法包括第一步驟，在接收到用戶輸入的語音命令后，將檢測相應(yīng)語音的末端，并提取語音存在的部分；第二步驟，在上述提取的語音部分中，繼續(xù)提取需要進(jìn)行語音識(shí)別的特征，并通過維特比搜索，進(jìn)行語音識(shí)別；第三步驟，然后求出上述識(shí)別出的語音數(shù)據(jù)的可信值；第四步驟，并確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值；第五步驟，根據(jù)上述判斷結(jié)果，假如求出的可信值大于臨界值，那么將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令；第六步驟，并在未接到用戶輸入的ACK命令時(shí)，將更新上述臨界值。
在接收到用戶輸入的ACK命令后，本發(fā)明將判定語音識(shí)別成功。
根據(jù)上述判斷結(jié)果，如果可信值不大于臨界值，那么將重新向用戶提出語音命令。
上述可信值將通過下面的數(shù)學(xué)式求出S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>在更新臨界值時(shí)，上述臨界值將利用(1+α)*舊臨界值進(jìn)行更新，而α是0和1之間的值。
本發(fā)明的效果如上所述，通過本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，所有相應(yīng)詞匯的臨界值并非擁有某一特定值，而是取決于用戶的發(fā)音方法或發(fā)音態(tài)度，以防誤識(shí)別的結(jié)果被誤認(rèn)為是正確識(shí)別的結(jié)果。
此外，通過本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，用戶在使用語音識(shí)別系統(tǒng)時(shí)，音較低的語音識(shí)別性能，而經(jīng)常會(huì)碰到不必要的麻煩，而本發(fā)明中的發(fā)音驗(yàn)證方法，恰能解決上述問題，并在產(chǎn)品生產(chǎn)以及產(chǎn)品測試時(shí)，能夠自動(dòng)更新調(diào)諧參數(shù)，因此無需對每個(gè)儀器都進(jìn)行調(diào)諧，這給開發(fā)商帶來了多方面的便利。
為進(jìn)一步說明本發(fā)明的上述目的、結(jié)構(gòu)特點(diǎn)和效果，以下將結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)的描述。
(4)

圖1是現(xiàn)有技術(shù)中可信值的柱狀圖，圖2是現(xiàn)有的語音識(shí)別方法的流程圖，圖3是在本發(fā)明的實(shí)施例中，語音識(shí)別系統(tǒng)的結(jié)構(gòu)模塊概略圖，圖4是在本發(fā)明的實(shí)施例中，發(fā)音驗(yàn)證方法的流程圖，圖5是在本發(fā)明的實(shí)施例中，false acceptance error的示意圖。
附圖中主要部分的符號說明300語音檢測器 310特征提取器
320維特比搜索器330發(fā)音詞典340音素模型數(shù)據(jù)庫 350發(fā)音驗(yàn)證器360半音素模型數(shù)據(jù)庫(5)具體實(shí)施方式
下面將參照附圖，對本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法的實(shí)施例進(jìn)行詳細(xì)說明。
圖3是在本發(fā)明的實(shí)施例中，語音識(shí)別系統(tǒng)的結(jié)構(gòu)模塊概略圖。
如圖3所示，本發(fā)明中的語音識(shí)別系統(tǒng)由如下結(jié)構(gòu)組成即，檢測輸入語音區(qū)間的語音檢測器300；從上述語音檢測器300中提取特征的特征提取器310；對從上述特征提取器310中提取的信號和發(fā)音詞典進(jìn)行維特比搜索的維特比搜索器320；從維特比搜索器320中識(shí)別關(guān)鍵詞，并參照半音素模型數(shù)據(jù)庫360，驗(yàn)證發(fā)音的發(fā)音驗(yàn)證器350。
也就是說，在輸入語音信息后，將在語音檢測器300中，搜索除了語音前后區(qū)間的語音區(qū)間。此后，特征提取器310將從上述語音區(qū)間的語音信號中，提取語音特征。
然后，在維特比搜索器320中，利用語音特征值，對由音素模型數(shù)據(jù)庫340組成的發(fā)音詞典330中的單詞，選定類似值最相近的單詞。
最后，由發(fā)音驗(yàn)證器350利用在維特比搜索器320中選定的單詞，將特征區(qū)間劃分為音素單位，并利用半音素模型360，求出音素單位的類似可信值。
在由可變詞匯識(shí)別器，對定義為域名的名簽進(jìn)行發(fā)音驗(yàn)證時(shí)，加入每個(gè)語音的模型已設(shè)定為Λ＝λi，那么虛假設(shè)Pk(O/H0)和Pk(O/H1)假設(shè)的類似值，即gk(O；Λ)和Gk(O；Λ)將分別通過數(shù)學(xué)式3和數(shù)學(xué)式4來計(jì)算。
數(shù)學(xué)式3gk(O;Λ)=1Tlog[P(O/λk)]]]>數(shù)學(xué)式4
Gk(O;Λ)=log[1N-1Σexp{kgk(O/Λ)}]]]>在此，gj(O;Λ)=1Tjlog[P(O/λj)].]]>在上述計(jì)算公式中，N代表音素模型的總個(gè)數(shù)，通常有46個(gè)左右。
在此，k是任意的正數(shù)，而Tk是分配到數(shù)字k中的幀數(shù)。假如k等于1，半音素模型便為45個(gè)，即這是除了自己以外的其它音素的所有個(gè)數(shù)，當(dāng)k為無限值時(shí)，半音素模型的個(gè)數(shù)為1，即顯示最有可能與自己的音素混淆的音素。為了基于上述計(jì)算出的類似值，判斷是否取消音素的問題，可在數(shù)學(xué)式5中，使用音素列基礎(chǔ)的可信值，進(jìn)行發(fā)音驗(yàn)證。
數(shù)學(xué)式5S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>在此，LRq(O，Λ)是第q個(gè)個(gè)別音素的LLR，其中的η是與k相等的常數(shù)。
然后，上述發(fā)音驗(yàn)證器對上述求出的可信值與臨界值進(jìn)行比較。此時(shí)，假如可信值大于臨界值，那么就識(shí)別語言，向用戶傳送確認(rèn)命令，并在接收到用戶輸入的ACK回應(yīng)后，將接受識(shí)別的結(jié)果。在此，假如未接到用戶的ACk回應(yīng)，那么發(fā)音驗(yàn)證器將利用數(shù)學(xué)式6，對上述臨界值進(jìn)行更新處理。
數(shù)學(xué)式6新臨界值＝(1+α)舊臨界值在此，α等于0和1之間的值。上述舊臨界值是更新前的臨界值，新臨界值意味著在用戶輸入語音命令后，得出誤識(shí)別的結(jié)果時(shí)，所更新的臨界值。
如圖5所示，在更新臨界值后，接受誤差(acceptance error)將逐漸減少。
假如上述可信值小于臨界值，那么發(fā)音驗(yàn)證器將向用戶提出重新輸入語音命令的請求，并拒絕識(shí)別的結(jié)果。
圖4是在本發(fā)明的實(shí)施例中，發(fā)音驗(yàn)證方法的流程圖。
S400、S402，如圖4所示，一旦接收到用戶輸入的語音識(shí)別命令，上述語音識(shí)別系統(tǒng)便將檢測語音的末端，并只提取語音存在的部分。
S404、S406，然后，上述語音識(shí)別系統(tǒng)在提取的語音部分中，提取語音識(shí)別所需的特征，并經(jīng)過維特比搜索過程，對提取的語音數(shù)據(jù)進(jìn)行語音識(shí)別。
S408，然后，上述語音識(shí)別系統(tǒng)將對語音識(shí)別的語音數(shù)據(jù)，計(jì)算可信值，并進(jìn)行發(fā)音驗(yàn)證。
S410，最后，上述語音識(shí)別系統(tǒng)將判斷求出的可信值是否大于事先設(shè)定的臨界值。
S412，根據(jù)S410步驟的判斷結(jié)果，假如上述可信值大于事先設(shè)定的臨界值，那么語音識(shí)別系統(tǒng)將就識(shí)別出的語言，向用戶傳送確認(rèn)命令。例如，上述語音識(shí)別系統(tǒng)將向用戶傳送“XXX是否正確？”等形式的確認(rèn)命令。
上述用戶將針對確認(rèn)命令，發(fā)送ACk、NAK等回應(yīng)。
S414，此后，上述語音識(shí)別系統(tǒng)將判斷是否接收到用戶輸入的ACK回應(yīng)的問題。
S416，根據(jù)S414步驟的判斷結(jié)果，一旦接收到用戶輸入的ACK回應(yīng)，上述語音識(shí)別系統(tǒng)便判定語音識(shí)別成功。
S418，根據(jù)S414步驟的判斷結(jié)果，假如未接收到用戶輸入的ACk回應(yīng)，那么上述語音識(shí)別系統(tǒng)將對臨界值進(jìn)行更新處理。
S420，然后，上述語音識(shí)別系統(tǒng)將向用戶提出重新輸入語音命令的請求。此后，上述語音識(shí)別系統(tǒng)將從S400步驟開始重新進(jìn)行操作。
例如，在用戶輸入“音頻”的命令時(shí)，假如上述語音識(shí)別系統(tǒng)進(jìn)行正常識(shí)別，并發(fā)送“是音頻嗎？”的信息，那么無需再對臨界值進(jìn)行更新處理。
但在上述語音識(shí)別系統(tǒng)做出誤識(shí)別，如用戶輸入了“音頻”的命令，而語音識(shí)別系統(tǒng)卻發(fā)出“無線電廣播”的信息時(shí)，語音識(shí)別系統(tǒng)就會(huì)斷定，使用該系統(tǒng)的用戶所輸入的“音頻”，經(jīng)常會(huì)被誤識(shí)別為“無線電廣播”。
因此，上述語音識(shí)別系統(tǒng)要求用戶輸入正確的發(fā)音，同時(shí)為確保不出現(xiàn)誤識(shí)別的現(xiàn)象，而經(jīng)常更新臨界值，以提高取消率。據(jù)此，假如下次重新輸入語音命令，語音識(shí)別系統(tǒng)便對誤識(shí)別的語言，只有在比更新可信值的取消率時(shí)，才會(huì)將其視作正常識(shí)別的結(jié)果。
在此，由于用戶輸入的發(fā)音模糊，故其可信值較低，因此對該發(fā)音，就會(huì)本能地做出正確的發(fā)音，那么可信值自然就會(huì)提高。此外，取消也為減少falseacceptance error而被提高，因此可有效排除誤識(shí)別的結(jié)果，并由于每個(gè)詞匯的臨界值都不同，所以從整體上給使用語音識(shí)別系統(tǒng)的用戶帶來了極大的方便。
圖5是在本發(fā)明的實(shí)施例中，誤接受誤差(false acceptance error)的示意圖。
如圖5所示，圖中的黑色部分便是誤接受誤差(false acceptance error)。
假如增加上述臨界值，接受誤差(acceptance error)就會(huì)減少。
本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到，以上的實(shí)施例僅是用來說明本發(fā)明，而并非用作為對本發(fā)明的限定，只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi)，對以上所述實(shí)施例的變化、變型都將落在本發(fā)明權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1.一種語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于由如下幾個(gè)步驟組成第一步驟、在接收到用戶輸入的語音命令后，將檢測相應(yīng)語音的末端，并提取語音存在的部分；第二步驟、在上述提取的語音部分中，繼續(xù)提取需要進(jìn)行語音識(shí)別的特征，并通過維特比搜索，進(jìn)行語音識(shí)別；第三步驟、求出上述識(shí)別出的語音數(shù)據(jù)的可信值；第四步驟、確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值；第五步驟、根據(jù)上述判斷結(jié)果，假如求出的可信值大于臨界值，那么將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令；第六步驟、在未接到用戶輸入的ACK命令時(shí)，將更新上述臨界值。
2.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于還包括一旦接收到用戶輸入的ACK命令，語音識(shí)別系統(tǒng)便應(yīng)判定語音識(shí)別成功。
3.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于還包括根據(jù)所述的判斷結(jié)果，假如可信值不大于臨界值，便向用戶提出重新輸入語音命令的請求。
4.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于所述的可信值應(yīng)通過下面的數(shù)學(xué)式計(jì)算。S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>
5.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于在更新所述的臨界值時(shí)，應(yīng)利用臨界值(1+α)*舊臨界值的方式予以更新。
6.如權(quán)利要求5所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，其特征在于所述的α應(yīng)是0和1之間的值。
全文摘要
本發(fā)明是有關(guān)語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法，包括一旦接收到用戶輸入的語音命令，就會(huì)檢測相應(yīng)語音的末端，并提取語音存在的部分；在提取的語音部分中，繼續(xù)提取需要進(jìn)行語音識(shí)別的特征，并通過維特比搜索，進(jìn)行語音識(shí)別；然后求出識(shí)別出的語音數(shù)據(jù)的可信值；并確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值；根據(jù)判斷結(jié)果，求出的可信值大于臨界值，將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令，并在未接到用戶輸入的ACK命令時(shí)，將更新上述臨界值。本發(fā)明使所有相應(yīng)詞匯的臨界值并非擁有某一特定值，而是取決于用戶的發(fā)音方法或發(fā)音態(tài)度，以防誤識(shí)別的結(jié)果被誤認(rèn)為是正確識(shí)別的結(jié)果。
文檔編號G10L15/00GK1811916SQ20051003300
公開日2006年8月2日申請日期2005年1月24日優(yōu)先權(quán)日2005年1月24日
發(fā)明者鄭斗景申請人:樂金電子(惠州)有限公司

完整全部詳細(xì)技術(shù)資料下載