專利名稱:語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法
技術(shù)領(lǐng)域:
本發(fā)明是有關(guān)在語音識(shí)別系統(tǒng)中,對誤識(shí)別單詞或文章進(jìn)行取消處理的一種語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法的技術(shù)。
(2)背景技術(shù)作為HCI的核心技術(shù),語音識(shí)別技術(shù)與信息化時(shí)代同步發(fā)展,其必要性正逐漸加大,并開始廣泛使用于很多應(yīng)用領(lǐng)域中。
從產(chǎn)業(yè)方面觀之,在信息通信產(chǎn)業(yè)、信息處理產(chǎn)業(yè)、家電產(chǎn)業(yè)、汽車產(chǎn)業(yè)等多種產(chǎn)業(yè)領(lǐng)域中,語音識(shí)別技術(shù)正逐漸發(fā)展成為下一代用戶界面的基礎(chǔ)技術(shù),其本身的市場規(guī)模,也將急速擴(kuò)大,而且對其它產(chǎn)業(yè)領(lǐng)域創(chuàng)造高附加值,也將做出不可磨滅的貢獻(xiàn)。
隨著最近語音識(shí)別技術(shù)逐漸趨于實(shí)用化,作為可信值高的語音識(shí)別核心技術(shù),取消非識(shí)別相應(yīng)詞匯,并對識(shí)別相應(yīng)文章,也能取消誤識(shí)別結(jié)果的發(fā)音驗(yàn)證技術(shù),其重要性逐漸得到廣泛認(rèn)可,而對該技術(shù)的研究也在得以廣泛開展。目前在韓國,對語音識(shí)別技術(shù)的研究活動(dòng)也在緊鑼密鼓地進(jìn)行,各大學(xué)以及企業(yè)正在對連接數(shù)字識(shí)別技術(shù)和發(fā)音驗(yàn)證技術(shù)進(jìn)行廣泛的研究,但其研究成果仍落后于其他發(fā)展國家。
由于當(dāng)前水準(zhǔn)的語音識(shí)別性能尚達(dá)不到100%,因此經(jīng)常會(huì)導(dǎo)致誤識(shí)別的結(jié)果。假如允許通過上述那些誤差,那么實(shí)用語音識(shí)別系統(tǒng)的用戶,便會(huì)對使用裝置的性能感到不滿,這將直接導(dǎo)致語音市場的競爭力下跌。為了解決上述問題,研究出來的結(jié)果便是發(fā)音驗(yàn)證技術(shù)。
上述發(fā)音驗(yàn)證技術(shù)利用某一特定的可信值,對接受或拒絕語音識(shí)別的結(jié)果進(jìn)行判斷。在此,可信值是衡量語音識(shí)別結(jié)果是否可信的尺度。如果可信值越高,便認(rèn)定識(shí)別結(jié)果可以信賴,并應(yīng)接受該識(shí)別結(jié)果。相反,可信值越低,那么認(rèn)定識(shí)別結(jié)果不可信賴,并應(yīng)拒絕識(shí)別結(jié)果。
根據(jù)實(shí)際語音識(shí)別的測試結(jié)果,大部分的誤差出自于用戶的發(fā)音模糊所致。因此,不使用發(fā)音驗(yàn)證的識(shí)別系統(tǒng),在用戶發(fā)出模糊音的情況下,也會(huì)將誤識(shí)別的結(jié)果直接放行。
使用發(fā)音驗(yàn)證方法是指,并非將上述誤識(shí)別的結(jié)果直接傳送給系統(tǒng)裝置,而是通過某種可信值測定,判斷語音識(shí)別系統(tǒng)的誤識(shí)別與否的問題,在判定是正常識(shí)別的結(jié)果時(shí),放行上述識(shí)別結(jié)果,否則將其取消的機(jī)械裝置。
上述發(fā)音驗(yàn)證方法有模式分類(pattern classification)和統(tǒng)計(jì)假設(shè)的驗(yàn)證方法。其中,模式分類方法的目的是指,在設(shè)有任意觀測值O={O1,O2,...,OT}的情況下,判定0屬于哪種級別,即決定C(O)∈{Ck,;k=1,2,··,K}。假設(shè)附帶條件概率P(O/Ck)和詞典概率P(Ck)已確定,那么降低分類誤差至最小的最佳分類級別(optimalclass decision)C(o),就相當(dāng)于數(shù)學(xué)式1中將后驗(yàn)概率最大化的Bayes decisionrule。
數(shù)學(xué)式1C(O)=argmaxP(Ck/O)=argmaxP(O/Ck)P(Ck)相反,在統(tǒng)計(jì)假設(shè)驗(yàn)證中,對已確定的觀測值0為識(shí)別結(jié)果的假設(shè)H1,將驗(yàn)證0為正確識(shí)別結(jié)果的虛假設(shè)H0。假設(shè)虛假設(shè)和假設(shè)的概率已確定,那么在通過Neyman-Pearson Lemma,最佳驗(yàn)證法便為數(shù)學(xué)式2時(shí),將采用虛假設(shè)的方法測定類似值。
數(shù)學(xué)式2LR(k)=Pk(O/H0)Pk(O/H1)>τk]]>在此,Pk(O/H0)代表虛假設(shè)的概率密度函數(shù),Pk(O/H1)代表假設(shè)的概率密度函數(shù),τk是指臨界極限(critical threshold)。在基于HMM的語音識(shí)別系統(tǒng)中,H0根據(jù)如何定義,在電話(phone)中顯示文章級別的Ck,而H1則顯示與其不同的級別{Cj}。在此,級別Ck的參數(shù)λk是指狀態(tài)轉(zhuǎn)移概率、狀態(tài)觀測值概率和狀態(tài)初步概率。
為將發(fā)音驗(yàn)證適用于HMM基礎(chǔ)上的語音識(shí)別方法中,需要推算P(O/H0)和P(O/H1),而這些概率中應(yīng)假定事先設(shè)定的假設(shè)分布和附帶條件概率分布的參數(shù)。上述假設(shè)因不充分的數(shù)據(jù)而有可能導(dǎo)致真值與推算出的分布之間產(chǎn)生誤差。
上述統(tǒng)計(jì)假設(shè)驗(yàn)證性能大致通過兩個(gè)誤差率得以評估。其一、在虛假設(shè)為真值時(shí),將其取消的誤拒絕(false rejection)(Type Iα),其二、在虛假設(shè)為虛值時(shí),采用該假設(shè)的誤接受(false acceptance)〔Type II或誤警告(falsealarmβ)〕。根據(jù)如何選擇α和β,τk值也會(huì)有所不同。在此,可利用τk值選擇α=β的equal error rate(EER),還可選擇兩個(gè)誤差率之和為最小的α+β。下面將參照附圖1中的柱狀圖,對發(fā)音驗(yàn)證中最合適的τk。
圖1是現(xiàn)有技術(shù)中可信值的柱狀圖。
如圖1所示,兩個(gè)柱狀圖分別指相應(yīng)于Ck的所有訓(xùn)練數(shù)據(jù)和不相應(yīng)于Ck的所有訓(xùn)練數(shù)據(jù)的類似柱狀圖。在圖1中,τk的右側(cè)部分〔類型(Type)II)〕代表β的量,而左側(cè)部分〔類型(Type)I〕則代表α的量。
如上所述,在測定可信值后,將測定的可信值和臨界值進(jìn)行比較,并以此判定相應(yīng)語音的誤識(shí)別與否問題。下面將參照附圖2,對該方法進(jìn)行簡單說明。
圖2是現(xiàn)有式語音識(shí)別方法的流程圖。
S200、S202,如圖2所示,一旦接收到用戶輸入的語音識(shí)別命令,語音識(shí)別系統(tǒng)便將檢測語音末端,并只提取語音存在的部分。
S204、S206,然后,語音識(shí)別系統(tǒng)將從上述提取的語音部分中,提取語音識(shí)別所需的特征,并對上述提取的語音數(shù)據(jù),經(jīng)過維特比搜索過程,進(jìn)行語音識(shí)別。
S208,然后,語音識(shí)別系統(tǒng)針對上述語音識(shí)別的語音數(shù)據(jù),計(jì)算可信值,并進(jìn)行發(fā)音驗(yàn)證。
S210,最后,語音識(shí)別系統(tǒng)確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值。
S212,根據(jù)上述判斷結(jié)果,假如可信值大于臨界值,那么識(shí)別系統(tǒng)將判定識(shí)別相應(yīng)語音成功。
S214,根據(jù)第210步驟的判斷結(jié)果,假如可信值不大于上述臨界值,那么語音識(shí)別系統(tǒng)將取消相應(yīng)語音的識(shí)別結(jié)果。
但具有如上特點(diǎn)的現(xiàn)有式發(fā)音驗(yàn)證方式,雖然對輸入的語音進(jìn)行正常識(shí)別與否的問題進(jìn)行判斷,但這一方式很難從實(shí)際上充分體現(xiàn)多樣化的語音,而且在汽車等雜音很重的環(huán)境中,很難確保系統(tǒng)的正常性能。
此外在發(fā)音模糊的情況下,假設(shè)可信值小于特定取消率,那么將其判定為誤識(shí)別的結(jié)果,并對其予以取消處理,但也有可能判定其為正常發(fā)音的誤識(shí)別結(jié)果。
(3)發(fā)明內(nèi)容本發(fā)明的目的是為了解決上述問題,提供一種可使用戶不受識(shí)別系統(tǒng)性能的影響,在不受環(huán)境限制的范圍內(nèi),輕松使用識(shí)別系統(tǒng)的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法。
本發(fā)明的另一目的是,提供一種可在語音識(shí)別系統(tǒng)中添加錄音重放的功能,以使每在進(jìn)行語音識(shí)別時(shí),均可確認(rèn)是否正常進(jìn)行識(shí)別的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法包括第一步驟,在接收到用戶輸入的語音命令后,將檢測相應(yīng)語音的末端,并提取語音存在的部分;第二步驟,在上述提取的語音部分中,繼續(xù)提取需要進(jìn)行語音識(shí)別的特征,并通過維特比搜索,進(jìn)行語音識(shí)別;第三步驟,然后求出上述識(shí)別出的語音數(shù)據(jù)的可信值;第四步驟,并確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值;第五步驟,根據(jù)上述判斷結(jié)果,假如求出的可信值大于臨界值,那么將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令;第六步驟,并在未接到用戶輸入的ACK命令時(shí),將更新上述臨界值。
在接收到用戶輸入的ACK命令后,本發(fā)明將判定語音識(shí)別成功。
根據(jù)上述判斷結(jié)果,如果可信值不大于臨界值,那么將重新向用戶提出語音命令。
上述可信值將通過下面的數(shù)學(xué)式求出S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>在更新臨界值時(shí),上述臨界值將利用(1+α)*舊臨界值進(jìn)行更新,而α是0和1之間的值。
本發(fā)明的效果如上所述,通過本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,所有相應(yīng)詞匯的臨界值并非擁有某一特定值,而是取決于用戶的發(fā)音方法或發(fā)音態(tài)度,以防誤識(shí)別的結(jié)果被誤認(rèn)為是正確識(shí)別的結(jié)果。
此外,通過本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,用戶在使用語音識(shí)別系統(tǒng)時(shí),音較低的語音識(shí)別性能,而經(jīng)常會(huì)碰到不必要的麻煩,而本發(fā)明中的發(fā)音驗(yàn)證方法,恰能解決上述問題,并在產(chǎn)品生產(chǎn)以及產(chǎn)品測試時(shí),能夠自動(dòng)更新調(diào)諧參數(shù),因此無需對每個(gè)儀器都進(jìn)行調(diào)諧,這給開發(fā)商帶來了多方面的便利。
為進(jìn)一步說明本發(fā)明的上述目的、結(jié)構(gòu)特點(diǎn)和效果,以下將結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)的描述。
(4)
圖1是現(xiàn)有技術(shù)中可信值的柱狀圖,圖2是現(xiàn)有的語音識(shí)別方法的流程圖,圖3是在本發(fā)明的實(shí)施例中,語音識(shí)別系統(tǒng)的結(jié)構(gòu)模塊概略圖,圖4是在本發(fā)明的實(shí)施例中,發(fā)音驗(yàn)證方法的流程圖,圖5是在本發(fā)明的實(shí)施例中,false acceptance error的示意圖。
附圖中主要部分的符號說明300語音檢測器 310特征提取器
320維特比搜索器330發(fā)音詞典340音素模型數(shù)據(jù)庫 350發(fā)音驗(yàn)證器360半音素模型數(shù)據(jù)庫(5)具體實(shí)施方式
下面將參照附圖,對本發(fā)明的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法的實(shí)施例進(jìn)行詳細(xì)說明。
圖3是在本發(fā)明的實(shí)施例中,語音識(shí)別系統(tǒng)的結(jié)構(gòu)模塊概略圖。
如圖3所示,本發(fā)明中的語音識(shí)別系統(tǒng)由如下結(jié)構(gòu)組成即,檢測輸入語音區(qū)間的語音檢測器300;從上述語音檢測器300中提取特征的特征提取器310;對從上述特征提取器310中提取的信號和發(fā)音詞典進(jìn)行維特比搜索的維特比搜索器320;從維特比搜索器320中識(shí)別關(guān)鍵詞,并參照半音素模型數(shù)據(jù)庫360,驗(yàn)證發(fā)音的發(fā)音驗(yàn)證器350。
也就是說,在輸入語音信息后,將在語音檢測器300中,搜索除了語音前后區(qū)間的語音區(qū)間。此后,特征提取器310將從上述語音區(qū)間的語音信號中,提取語音特征。
然后,在維特比搜索器320中,利用語音特征值,對由音素模型數(shù)據(jù)庫340組成的發(fā)音詞典330中的單詞,選定類似值最相近的單詞。
最后,由發(fā)音驗(yàn)證器350利用在維特比搜索器320中選定的單詞,將特征區(qū)間劃分為音素單位,并利用半音素模型360,求出音素單位的類似可信值。
在由可變詞匯識(shí)別器,對定義為域名的名簽進(jìn)行發(fā)音驗(yàn)證時(shí),加入每個(gè)語音的模型已設(shè)定為Λ=λi,那么虛假設(shè)Pk(O/H0)和Pk(O/H1)假設(shè)的類似值,即gk(O;Λ)和Gk(O;Λ)將分別通過數(shù)學(xué)式3和數(shù)學(xué)式4來計(jì)算。
數(shù)學(xué)式3gk(O;Λ)=1Tlog[P(O/λk)]]]>數(shù)學(xué)式4
Gk(O;Λ)=log[1N-1Σexp{kgk(O/Λ)}]]]>在此,gj(O;Λ)=1Tjlog[P(O/λj)].]]>在上述計(jì)算公式中,N代表音素模型的總個(gè)數(shù),通常有46個(gè)左右。
在此,k是任意的正數(shù),而Tk是分配到數(shù)字k中的幀數(shù)。假如k等于1,半音素模型便為45個(gè),即這是除了自己以外的其它音素的所有個(gè)數(shù),當(dāng)k為無限值時(shí),半音素模型的個(gè)數(shù)為1,即顯示最有可能與自己的音素混淆的音素。為了基于上述計(jì)算出的類似值,判斷是否取消音素的問題,可在數(shù)學(xué)式5中,使用音素列基礎(chǔ)的可信值,進(jìn)行發(fā)音驗(yàn)證。
數(shù)學(xué)式5S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>在此,LRq(O,Λ)是第q個(gè)個(gè)別音素的LLR,其中的η是與k相等的常數(shù)。
然后,上述發(fā)音驗(yàn)證器對上述求出的可信值與臨界值進(jìn)行比較。此時(shí),假如可信值大于臨界值,那么就識(shí)別語言,向用戶傳送確認(rèn)命令,并在接收到用戶輸入的ACK回應(yīng)后,將接受識(shí)別的結(jié)果。在此,假如未接到用戶的ACk回應(yīng),那么發(fā)音驗(yàn)證器將利用數(shù)學(xué)式6,對上述臨界值進(jìn)行更新處理。
數(shù)學(xué)式6新臨界值=(1+α)舊臨界值在此,α等于0和1之間的值。上述舊臨界值是更新前的臨界值,新臨界值意味著在用戶輸入語音命令后,得出誤識(shí)別的結(jié)果時(shí),所更新的臨界值。
如圖5所示,在更新臨界值后,接受誤差(acceptance error)將逐漸減少。
假如上述可信值小于臨界值,那么發(fā)音驗(yàn)證器將向用戶提出重新輸入語音命令的請求,并拒絕識(shí)別的結(jié)果。
圖4是在本發(fā)明的實(shí)施例中,發(fā)音驗(yàn)證方法的流程圖。
S400、S402,如圖4所示,一旦接收到用戶輸入的語音識(shí)別命令,上述語音識(shí)別系統(tǒng)便將檢測語音的末端,并只提取語音存在的部分。
S404、S406,然后,上述語音識(shí)別系統(tǒng)在提取的語音部分中,提取語音識(shí)別所需的特征,并經(jīng)過維特比搜索過程,對提取的語音數(shù)據(jù)進(jìn)行語音識(shí)別。
S408,然后,上述語音識(shí)別系統(tǒng)將對語音識(shí)別的語音數(shù)據(jù),計(jì)算可信值,并進(jìn)行發(fā)音驗(yàn)證。
S410,最后,上述語音識(shí)別系統(tǒng)將判斷求出的可信值是否大于事先設(shè)定的臨界值。
S412,根據(jù)S410步驟的判斷結(jié)果,假如上述可信值大于事先設(shè)定的臨界值,那么語音識(shí)別系統(tǒng)將就識(shí)別出的語言,向用戶傳送確認(rèn)命令。例如,上述語音識(shí)別系統(tǒng)將向用戶傳送“XXX是否正確?”等形式的確認(rèn)命令。
上述用戶將針對確認(rèn)命令,發(fā)送ACk、NAK等回應(yīng)。
S414,此后,上述語音識(shí)別系統(tǒng)將判斷是否接收到用戶輸入的ACK回應(yīng)的問題。
S416,根據(jù)S414步驟的判斷結(jié)果,一旦接收到用戶輸入的ACK回應(yīng),上述語音識(shí)別系統(tǒng)便判定語音識(shí)別成功。
S418,根據(jù)S414步驟的判斷結(jié)果,假如未接收到用戶輸入的ACk回應(yīng),那么上述語音識(shí)別系統(tǒng)將對臨界值進(jìn)行更新處理。
S420,然后,上述語音識(shí)別系統(tǒng)將向用戶提出重新輸入語音命令的請求。此后,上述語音識(shí)別系統(tǒng)將從S400步驟開始重新進(jìn)行操作。
例如,在用戶輸入“音頻”的命令時(shí),假如上述語音識(shí)別系統(tǒng)進(jìn)行正常識(shí)別,并發(fā)送“是音頻嗎?”的信息,那么無需再對臨界值進(jìn)行更新處理。
但在上述語音識(shí)別系統(tǒng)做出誤識(shí)別,如用戶輸入了“音頻”的命令,而語音識(shí)別系統(tǒng)卻發(fā)出“無線電廣播”的信息時(shí),語音識(shí)別系統(tǒng)就會(huì)斷定,使用該系統(tǒng)的用戶所輸入的“音頻”,經(jīng)常會(huì)被誤識(shí)別為“無線電廣播”。
因此,上述語音識(shí)別系統(tǒng)要求用戶輸入正確的發(fā)音,同時(shí)為確保不出現(xiàn)誤識(shí)別的現(xiàn)象,而經(jīng)常更新臨界值,以提高取消率。據(jù)此,假如下次重新輸入語音命令,語音識(shí)別系統(tǒng)便對誤識(shí)別的語言,只有在比更新可信值的取消率時(shí),才會(huì)將其視作正常識(shí)別的結(jié)果。
在此,由于用戶輸入的發(fā)音模糊,故其可信值較低,因此對該發(fā)音,就會(huì)本能地做出正確的發(fā)音,那么可信值自然就會(huì)提高。此外,取消也為減少falseacceptance error而被提高,因此可有效排除誤識(shí)別的結(jié)果,并由于每個(gè)詞匯的臨界值都不同,所以從整體上給使用語音識(shí)別系統(tǒng)的用戶帶來了極大的方便。
圖5是在本發(fā)明的實(shí)施例中,誤接受誤差(false acceptance error)的示意圖。
如圖5所示,圖中的黑色部分便是誤接受誤差(false acceptance error)。
假如增加上述臨界值,接受誤差(acceptance error)就會(huì)減少。
本技術(shù)領(lǐng)域中的普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,以上的實(shí)施例僅是用來說明本發(fā)明,而并非用作為對本發(fā)明的限定,只要在本發(fā)明的實(shí)質(zhì)精神范圍內(nèi),對以上所述實(shí)施例的變化、變型都將落在本發(fā)明權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1.一種語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于由如下幾個(gè)步驟組成第一步驟、在接收到用戶輸入的語音命令后,將檢測相應(yīng)語音的末端,并提取語音存在的部分;第二步驟、在上述提取的語音部分中,繼續(xù)提取需要進(jìn)行語音識(shí)別的特征,并通過維特比搜索,進(jìn)行語音識(shí)別;第三步驟、求出上述識(shí)別出的語音數(shù)據(jù)的可信值;第四步驟、確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值;第五步驟、根據(jù)上述判斷結(jié)果,假如求出的可信值大于臨界值,那么將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令;第六步驟、在未接到用戶輸入的ACK命令時(shí),將更新上述臨界值。
2.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于還包括一旦接收到用戶輸入的ACK命令,語音識(shí)別系統(tǒng)便應(yīng)判定語音識(shí)別成功。
3.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于還包括根據(jù)所述的判斷結(jié)果,假如可信值不大于臨界值,便向用戶提出重新輸入語音命令的請求。
4.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于所述的可信值應(yīng)通過下面的數(shù)學(xué)式計(jì)算。S(O;Λ)=-log[1jΣexp{-η·LRq(O;Λ)}]1η]]>
5.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于在更新所述的臨界值時(shí),應(yīng)利用臨界值(1+α)*舊臨界值的方式予以更新。
6.如權(quán)利要求5所述的語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,其特征在于所述的α應(yīng)是0和1之間的值。
全文摘要
本發(fā)明是有關(guān)語音識(shí)別系統(tǒng)的發(fā)音驗(yàn)證方法,包括一旦接收到用戶輸入的語音命令,就會(huì)檢測相應(yīng)語音的末端,并提取語音存在的部分;在提取的語音部分中,繼續(xù)提取需要進(jìn)行語音識(shí)別的特征,并通過維特比搜索,進(jìn)行語音識(shí)別;然后求出識(shí)別出的語音數(shù)據(jù)的可信值;并確認(rèn)求出的可信值是否大于事先設(shè)定的臨界值;根據(jù)判斷結(jié)果,求出的可信值大于臨界值,將向用戶傳送識(shí)別出的語音數(shù)據(jù)的確認(rèn)命令,并在未接到用戶輸入的ACK命令時(shí),將更新上述臨界值。本發(fā)明使所有相應(yīng)詞匯的臨界值并非擁有某一特定值,而是取決于用戶的發(fā)音方法或發(fā)音態(tài)度,以防誤識(shí)別的結(jié)果被誤認(rèn)為是正確識(shí)別的結(jié)果。
文檔編號G10L15/00GK1811916SQ20051003300
公開日2006年8月2日 申請日期2005年1月24日 優(yōu)先權(quán)日2005年1月24日
發(fā)明者鄭斗景 申請人:樂金電子(惠州)有限公司