專(zhuān)利名稱(chēng):一種應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及ー種語(yǔ)音識(shí)別方法,尤其是一種通過(guò)語(yǔ)音識(shí)別機(jī)器來(lái)進(jìn)行語(yǔ)音識(shí)別的方法。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的發(fā)達(dá),使用ー個(gè)輸入/輸出裝置來(lái)控制由網(wǎng)絡(luò)連接在一起的遠(yuǎn)程機(jī)器的系統(tǒng)也隨之上市。 不僅如此,以語(yǔ)音指令來(lái)控制由網(wǎng)絡(luò)所連接的機(jī)器的系統(tǒng)也日益
以往技術(shù)中的語(yǔ)音識(shí)別系統(tǒng)存在雜音影響機(jī)器控制及特定語(yǔ)音者語(yǔ)音識(shí)別率降低等缺陷和極限。就特定語(yǔ)音者語(yǔ)音識(shí)別率降低這一點(diǎn)來(lái)說(shuō),雖然可以通過(guò)適應(yīng)化來(lái)彌補(bǔ)這ー缺陷,但給用戶(hù)帶來(lái)諸多的不便。不僅如此,為了通過(guò)語(yǔ)音來(lái)控制多個(gè)機(jī)器,需要在每個(gè)機(jī)器內(nèi)儲(chǔ)存不同的指令,從而導(dǎo)致指令過(guò)多、過(guò)于繁瑣,致使識(shí)別率降低。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供ー種應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,語(yǔ)音識(shí)別方法通過(guò)語(yǔ)音識(shí)別來(lái)控制由網(wǎng)絡(luò)連接的機(jī)器,可隨時(shí)輸入語(yǔ)音,無(wú)需其他特別準(zhǔn)備,即可通過(guò)語(yǔ)音識(shí)別即時(shí)準(zhǔn)確地識(shí)別指令及非指令的其他聲音,從而減少錯(cuò)誤識(shí)別的頻率,并自動(dòng)適應(yīng)語(yǔ)音者的語(yǔ)音;不僅如此,還可以提高特定語(yǔ)音者的語(yǔ)音識(shí)別率,同時(shí)可實(shí)現(xiàn)多個(gè)機(jī)器的控制指令統(tǒng)ー化,并提高語(yǔ)音識(shí)別的準(zhǔn)確率。本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下語(yǔ)音識(shí)別方法,包括即時(shí)接收語(yǔ)音輸入的階段SI ;測(cè)定上述SI階段中所輸入的所述語(yǔ)音的強(qiáng)弱及持續(xù)時(shí)間的階段S2 ;將所述S2階段中所測(cè)定的所述語(yǔ)音的強(qiáng)弱及持續(xù)時(shí)間與任意值相比,并按默音、弱音、強(qiáng)音對(duì)所述語(yǔ)音進(jìn)行分類(lèi)的階段S3 ;根據(jù)所述S3階段中的分類(lèi),若為默音,則計(jì)算默音的持續(xù)時(shí)間,并持續(xù)維持語(yǔ)音輸入待機(jī)狀態(tài),若為弱音或強(qiáng)音,則進(jìn)行語(yǔ)音識(shí)別處理的階段S4 ;根據(jù)所述S4階段進(jìn)行的語(yǔ)音識(shí)別處理,進(jìn)行制定單位語(yǔ)音識(shí)別處理的階段S5 ;根據(jù)所述S5階段的結(jié)果,決定是否對(duì)整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別處理,并進(jìn)行處理準(zhǔn)備的階段S6 ;根據(jù)所述S6階段,若決定執(zhí)行整體語(yǔ)音的語(yǔ)音識(shí)別處理,則對(duì)整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別處理的階段S7 ;根據(jù)所述S7階段的結(jié)果,決定是否認(rèn)證語(yǔ)音識(shí)別處理的結(jié)果,并控制機(jī)器,進(jìn)行識(shí)別語(yǔ)音適應(yīng)化的階段S8 ;在所述S6階段中,不對(duì)所述整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別時(shí),或根據(jù)所述S8階段,不認(rèn)證所述語(yǔ)音的識(shí)別結(jié)果時(shí),則根據(jù)所述S3階段中所決定的語(yǔ)音分類(lèi),若為弱音時(shí),則轉(zhuǎn)換為噪音模式,若為強(qiáng)音吋,則轉(zhuǎn)換為拒絕模式的階段S9。進(jìn)一歩,最好還包括在所述S3階段中,根據(jù)事先制定的強(qiáng)弱,可將所述語(yǔ)音分為三個(gè)等級(jí),在所述S2階段中所測(cè)定的語(yǔ)音音量若為最低的第一等級(jí)時(shí),則所述語(yǔ)音分到默音類(lèi);若所述語(yǔ)音的音量屬于高于所述第一等級(jí)的第二等級(jí),且所述語(yǔ)音的音長(zhǎng)為任意值吋,則所述語(yǔ)音分到弱音類(lèi);若所述語(yǔ)音的音量為最高的第三等級(jí),且所述語(yǔ)音的音長(zhǎng)滿(mǎn)足任意值時(shí),則所述語(yǔ)音分到強(qiáng)音類(lèi)的SlO階段。
進(jìn)一歩,最好還包括在所述S5階段的所述制定単位的語(yǔ)音識(shí)別處理進(jìn)行的過(guò)程中,若識(shí)別關(guān)鍵字時(shí),將所述關(guān)鍵字最末音素傳向虛擬機(jī)的對(duì)數(shù)似然比與各自的聲學(xué)模型對(duì)比,記憶具有最高值的聲學(xué)模型的階段S11。最好還包括在所述S6階段中,所述語(yǔ)音識(shí)別結(jié)果與已存指令一致,并決定對(duì)所述整體語(yǔ)音進(jìn)行第二次識(shí)別的階段S12。最好還包括在所述S12階段中,決定進(jìn)行所述第二次語(yǔ)音識(shí)別時(shí),將所述Sll階段中所記憶的所述聲學(xué)模型換為第二次識(shí)別模式的準(zhǔn)備階段S13。最好還包括在所述S13階段中,將所述已準(zhǔn)備的聲學(xué)模型用于數(shù)據(jù)庫(kù),并進(jìn)行第二次語(yǔ)音識(shí)別的階段S14。最好還包括在所述S8階段中,若所述第二次語(yǔ)音識(shí)別結(jié)果被認(rèn)證,根據(jù)所述認(rèn)證結(jié)果控制機(jī)器的階段S15 ;及在所述S8階段中,儲(chǔ)存語(yǔ)音,并進(jìn)行所儲(chǔ)存語(yǔ)音的適應(yīng)化作 業(yè),更新具有發(fā)音的語(yǔ)音者的音色特征的聲學(xué)模型的階段S16。進(jìn)一歩,最好還包括在所述S16階段中,檢查是否有具有所述語(yǔ)音者音色特征的數(shù)據(jù)庫(kù)的階段S17 ;及在所述S16階段中,若未有所述音色的數(shù)據(jù)庫(kù)時(shí),在所述語(yǔ)音適應(yīng)化的作業(yè)中,更新所述已識(shí)別的語(yǔ)音音色數(shù)據(jù)庫(kù)的階段S18。最好還包括在所述S17階段中,檢查所述Sll階段中,與所述各自的聲學(xué)模型對(duì)比后,是否存在具有最高值的所述聲學(xué)模型的階段S19 ;及在所述S19階段中,若檢查到在所有的聲學(xué)模型中不存在具有最高值的所述聲學(xué)模型吋,記錄沒(méi)有具有與所述SI階段中所輸入的所述語(yǔ)音類(lèi)似音色的聲學(xué)模型的階段S20。最好還包括在所述S15階段的所述機(jī)器控制中,將事前語(yǔ)音識(shí)別所設(shè)置的區(qū)域用戶(hù)名記為控制區(qū)域用戶(hù)名的階段S21 ;及判斷在所述S8階段中,所認(rèn)證的所述識(shí)別結(jié)果是區(qū)域選擇指令還是機(jī)器控制指令的階段S22 ;以及在所述S22階段中,若判定為區(qū)域選擇指令吋,將所述區(qū)域用戶(hù)名變更記為所述控制區(qū)域用戶(hù)名的階段S23 ;及在所述S22階段中,若判定為機(jī)器控制指令時(shí),控制所述控制區(qū)域用戶(hù)名所屬區(qū)域機(jī)器的階段S24。進(jìn)一歩,最好還包括在所述S23階段中,在變更記憶所述控制區(qū)域用戶(hù)名后,在一定時(shí)間后,將所述所設(shè)置的區(qū)域用戶(hù)名復(fù)原為所述控制區(qū)域用戶(hù)名的階段S25。進(jìn)一歩,最好還包括在所述S9階段中,在不認(rèn)證所述S8階段中的所述識(shí)別結(jié)果時(shí),根據(jù)所述Sio階段所分類(lèi)的語(yǔ)音種類(lèi)另行劃分計(jì)算點(diǎn),増加各種類(lèi)所述計(jì)算點(diǎn)的階段S26 ;及在所述S26階段中,若各個(gè)計(jì)算點(diǎn)先到達(dá)所定的任意值時(shí),識(shí)別機(jī)的狀態(tài)若為所述弱音時(shí)則變更為噪音模式,若為所述強(qiáng)音時(shí)則變更為拒絕模式的階段S27 ;以及在所述S4階段中,若所述默音計(jì)算點(diǎn)先到達(dá)所定臨限值時(shí),變?yōu)榛灸J降碾A段S28。最好還包括根據(jù)所述S28階段所變更的模式,若為拒絕模式時(shí),拒絕除所述基本模式變換指令外的所有指令的識(shí)別,若為噪音模式時(shí),人為地降低所輸入語(yǔ)音的強(qiáng)弱,控制所述SlO階段中的屬于第二等級(jí)的噪音,若為基本模式時(shí),進(jìn)行正常識(shí)別的階段S29 ;及在所述S8階段的所述拒絕模式狀態(tài)下,若先定的基本模式復(fù)原指令的識(shí)別被認(rèn)證時(shí),將所述語(yǔ)音識(shí)別機(jī)的模式變更為所述基本模式的階段S30。本發(fā)明的有益效果是語(yǔ)音識(shí)別機(jī)的模式可根據(jù)周邊狀況進(jìn)行變更,即時(shí)處理語(yǔ)音識(shí)別,降低對(duì)非指令語(yǔ)音的錯(cuò)誤識(shí)別,在噪音環(huán)境中提高指令的識(shí)別率,可自動(dòng)適應(yīng)語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)中未有的語(yǔ)音者的音色,記錄聲學(xué)模型并對(duì)其進(jìn)行識(shí)別,從而提高識(shí)別率,可統(tǒng)ー多個(gè)區(qū)域中的同種指令,減少繁多的指令,使語(yǔ)音識(shí)別的準(zhǔn)確率大大提高,同時(shí)有效地減少錯(cuò)誤識(shí)別。
圖I是本發(fā)明實(shí)施方式的家庭網(wǎng)絡(luò)系統(tǒng)的概述結(jié)構(gòu)圖;圖2是本發(fā)明實(shí)施方式的語(yǔ)音識(shí)別方法的整體流程圖;圖3是圖2的語(yǔ)音識(shí)別處理過(guò)程的詳細(xì)流程圖;
圖4是圖2的第一次識(shí)別結(jié)果處理過(guò)程的詳細(xì)流程圖;圖5是圖2的第二次識(shí)別結(jié)果處理進(jìn)行過(guò)程的詳細(xì)流程圖;圖6是圖2的模式轉(zhuǎn)換處理過(guò)程的詳細(xì)流程圖;圖7是本發(fā)明實(shí)施方式的根據(jù)控制用戶(hù)名變更的機(jī)器控制過(guò)程的流程圖。
具體實(shí)施例方式以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。圖I是本發(fā)明實(shí)施方式的家庭網(wǎng)絡(luò)系統(tǒng)的概述結(jié)構(gòu)圖。如圖I所示,本發(fā)明的語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)系統(tǒng)可在每個(gè)區(qū)域設(shè)置語(yǔ)音識(shí)別機(jī)器,每個(gè)語(yǔ)音識(shí)別機(jī)器通過(guò)有線(xiàn)或無(wú)線(xiàn)與控制照明等裝置的控制機(jī)連接。控制機(jī)根據(jù)用戶(hù)的操作來(lái)控制機(jī)器,分析由語(yǔ)音識(shí)別機(jī)所傳送的指令,從而來(lái)控制機(jī)器。各區(qū)域的語(yǔ)音識(shí)別機(jī)具有固有的位置用戶(hù)名,控制機(jī)分析上述用戶(hù)名,并控制所屬區(qū)域內(nèi)所設(shè)置的相應(yīng)語(yǔ)音識(shí)別機(jī)位置上的機(jī)器。圖2是本發(fā)明實(shí)施方式的語(yǔ)音識(shí)別方法的整體流程圖。如圖2所示,系統(tǒng)開(kāi)始運(yùn)作后,語(yǔ)音識(shí)別機(jī)可即時(shí)持續(xù)地接收所輸入的語(yǔ)音200。語(yǔ)音識(shí)別機(jī)將持續(xù)輸入的語(yǔ)音201的強(qiáng)弱和音長(zhǎng)與既定的任意值進(jìn)行比較,并按照默音、弱音、強(qiáng)音三個(gè)種類(lèi)進(jìn)行分類(lèi)202。語(yǔ)音識(shí)別機(jī)根據(jù)所分類(lèi)的語(yǔ)音種類(lèi),對(duì)于默音不進(jìn)行處理,對(duì)于弱音及強(qiáng)音進(jìn)行語(yǔ)音識(shí)別處理。語(yǔ)音識(shí)別機(jī)進(jìn)行識(shí)別處理時(shí),可分為第一次識(shí)別203和第二次識(shí)別205。在進(jìn)行第一次識(shí)別203后,對(duì)其識(shí)別結(jié)果進(jìn)行處理204,若第一次識(shí)別203的識(shí)別結(jié)果與既定的條件相符時(shí),則進(jìn)行第二次識(shí)別205 ;若不相符,則停止識(shí)別,并轉(zhuǎn)換為語(yǔ)音輸入待機(jī)階段200。第一次識(shí)別結(jié)果滿(mǎn)足條件,進(jìn)行第二次識(shí)別205,且根據(jù)第二次識(shí)別結(jié)果控制機(jī)器或?qū)⒄Z(yǔ)音識(shí)別模式轉(zhuǎn)換為基本模式206,在對(duì)語(yǔ)音進(jìn)行分類(lèi)的階段202中,根據(jù)所分類(lèi)的語(yǔ)音,將語(yǔ)音識(shí)別機(jī)的狀態(tài)轉(zhuǎn)換為噪音模式或拒絕模式207。圖3是圖2的語(yǔ)音識(shí)別處理過(guò)程的詳細(xì)流程圖。圖3詳細(xì)圖示了對(duì)于語(yǔ)音輸入待機(jī)200中所輸入的語(yǔ)音,按種類(lèi)分類(lèi),井根據(jù)種類(lèi)判斷是否進(jìn)行語(yǔ)音識(shí)別處理的處理過(guò)程。圖2中的語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)系統(tǒng)中的語(yǔ)音識(shí)別機(jī)可即時(shí)接收所輸入的語(yǔ)音200,井根據(jù)語(yǔ)音的強(qiáng)弱和音長(zhǎng)進(jìn)行分類(lèi)201。如圖3所示,就語(yǔ)音種類(lèi)分類(lèi)處理過(guò)程進(jìn)行詳細(xì)說(shuō)明。首先測(cè)定語(yǔ)音的強(qiáng)弱301和語(yǔ)音的音長(zhǎng)302。語(yǔ)音識(shí)別機(jī)將所測(cè)定的語(yǔ)音音量及音長(zhǎng)與既定任意值進(jìn)行比較,并按默音、弱音、強(qiáng)音三個(gè)種類(lèi)對(duì)語(yǔ)音進(jìn)行分類(lèi)303。舉例說(shuō)明,若所測(cè)定的語(yǔ)音音量未滿(mǎn)50dB吋,將該語(yǔ)音種類(lèi)分至默音類(lèi);若所測(cè)定的語(yǔ)音音量為50至60dB,語(yǔ)音的音長(zhǎng)在2秒以上時(shí),該語(yǔ)音分至弱音類(lèi);若語(yǔ)音音量在60dB以上,且音長(zhǎng)超過(guò)2秒時(shí),該語(yǔ)音分至強(qiáng)音類(lèi)。
語(yǔ)音的種類(lèi)分為默音、弱音、強(qiáng)音。根據(jù)語(yǔ)音的種類(lèi),若為默音則無(wú)需進(jìn)行語(yǔ)音識(shí)別處理,在增加默音計(jì)算點(diǎn)306的同時(shí),持續(xù)維持語(yǔ)音輸入待機(jī)狀態(tài)200。若所増加的默音計(jì)算點(diǎn)到達(dá)既定的任意值307時(shí),語(yǔ)音識(shí)別機(jī)確認(rèn)目前的語(yǔ)音識(shí)別模式,若為基本模式吋,則在默音計(jì)算點(diǎn)初始化310后,維持語(yǔ)音輸入待機(jī)狀態(tài);若為噪音模式308或拒絕模式309吋,將語(yǔ)音識(shí)別模式變更為基本模式311,在默音計(jì)算點(diǎn)初始化310后,維持語(yǔ)音輸入待機(jī)狀態(tài)200。若語(yǔ)音的種類(lèi)判斷為弱音類(lèi)或強(qiáng)音類(lèi)時(shí),在默音計(jì)算點(diǎn)初始化310后進(jìn)行第一次識(shí)別304。圖4是圖2的第一次識(shí)別結(jié)果處理204過(guò)程的詳細(xì)流程圖。如圖4所示,進(jìn)行第一次識(shí)別203后,所識(shí)別的結(jié)果非拒絕詞語(yǔ)或拒絕語(yǔ)句,且屬于既定指令時(shí),與在第一次識(shí)別處理中所記憶的各聲學(xué)模型的對(duì)數(shù)似數(shù)比進(jìn)行對(duì)比,分辨出具有最高值的聲學(xué)模型402。記憶在第一次識(shí)別203中所使用的聲學(xué)模型的對(duì)數(shù)似數(shù)比的過(guò)程具體如下首先在語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)系統(tǒng)開(kāi)始前,在內(nèi)存容量限度范圍內(nèi),根據(jù)語(yǔ)音者的人數(shù)復(fù)制多個(gè)聲學(xué)模型,并準(zhǔn)備多個(gè)聲學(xué)模型;接下來(lái),在開(kāi)始操作語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)系統(tǒng)后,在進(jìn)行第一次識(shí)別203的過(guò)程中,在識(shí)別特定詞語(yǔ)后,記憶傳向虛擬機(jī)的所屬模式的對(duì)數(shù)似數(shù)比。
舉例來(lái)說(shuō),在語(yǔ)音識(shí)別過(guò)程中,在識(shí)別各詞語(yǔ)后,經(jīng)過(guò)虛擬節(jié)點(diǎn)(du_y node)后再擴(kuò)張為其他詞語(yǔ)。如“baobao”一 dummy 主臥”一dummy — “開(kāi)燈”。在各虛擬節(jié)點(diǎn)上,分別計(jì)算向著各自方向的所有詞語(yǔ)的概率值,并將具有最高概率值的詞語(yǔ)記為識(shí)別候選對(duì)象。在此過(guò)程中,在語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)系統(tǒng)開(kāi)始操作前,若復(fù)制3個(gè)聲學(xué)模型并事先準(zhǔn)備的話(huà),在虛擬節(jié)點(diǎn)上則存在著自“baobao”、“baobao2”、“baobao3”的結(jié)尾音素,如“ao-b+ao”,“ao2-b2-ao2”,“ao3-b3-ao3”向著各虛擬節(jié)點(diǎn)的節(jié)點(diǎn),并計(jì)算有關(guān)上述各節(jié)點(diǎn)的對(duì)數(shù)似數(shù)比,并記住此時(shí)所計(jì)算的對(duì)數(shù)似數(shù)比。第一次識(shí)別203的結(jié)果屬于既定指令,如上述舉例所說(shuō)明的過(guò)程,在所被記憶的對(duì)數(shù)似數(shù)比中,含具有最高值的聲學(xué)模型被確定402時(shí),在第二次識(shí)別數(shù)據(jù)庫(kù)中具有最高對(duì)數(shù)似數(shù)比的數(shù)據(jù)庫(kù)被登入內(nèi)存403。在403的過(guò)程中對(duì)登入的數(shù)據(jù)庫(kù)進(jìn)行第二次識(shí)別205。若第一次識(shí)別203的結(jié)果非既定指令時(shí),語(yǔ)音識(shí)別機(jī)則放棄第二次識(shí)別,井清除內(nèi)存,同時(shí)轉(zhuǎn)換到語(yǔ)音輸入待機(jī)狀態(tài)200,進(jìn)行相關(guān)作業(yè)。圖5是圖2的第二次識(shí)別結(jié)果處理206進(jìn)行過(guò)程的詳細(xì)流程圖。如圖5所示,在第二次識(shí)別進(jìn)行的過(guò)程中,如圖4所述,在第一次識(shí)別過(guò)程中所計(jì)算的各聲學(xué)模型的對(duì)數(shù)似數(shù)比中,具有最高值的聲學(xué)模型被登入,并用于第二次識(shí)別的數(shù)據(jù)庫(kù)。如上所述,結(jié)束第二次識(shí)別后,在處理識(shí)別結(jié)果時(shí),首先檢查識(shí)別結(jié)果是否屬于既定指令,并檢查其是否屬于拒絕詞語(yǔ)或語(yǔ)句501。若識(shí)別結(jié)果屬于拒絕詞語(yǔ)或語(yǔ)句,在清除內(nèi)存后回到語(yǔ)音輸入待機(jī)狀態(tài)200。若識(shí)別結(jié)果屬于指令,則判斷是否存在與語(yǔ)音者音色類(lèi)似的數(shù)據(jù)庫(kù)502。若所有的語(yǔ)音數(shù)據(jù)庫(kù)的聲學(xué)模型都一祥,則判定無(wú)與語(yǔ)音者音色類(lèi)似的語(yǔ)音數(shù)據(jù),若存在具有最高值的聲學(xué)模型吋,則判定存在與語(yǔ)音者音色類(lèi)似的語(yǔ)音數(shù)據(jù)。若識(shí)別結(jié)果屬于指令吋,儲(chǔ)存語(yǔ)音503,并使用所儲(chǔ)存的語(yǔ)音,同時(shí)因在第二次識(shí)別205中進(jìn)行對(duì)聲學(xué)模型的適應(yīng)化504,從而進(jìn)ー步更新與語(yǔ)音者的音色近似的聲學(xué)模型505。圖6是圖2的模式轉(zhuǎn)換處理207過(guò)程的詳細(xì)流程圖。如圖6所示,在第二次識(shí)別結(jié)果處理206階段,判斷是否認(rèn)證識(shí)別結(jié)果601。若不認(rèn)證識(shí)別結(jié)果,則在判別語(yǔ)音種類(lèi)的階段202判別所分類(lèi)的語(yǔ)音屬于弱音還是強(qiáng)音。若語(yǔ)音屬于弱音,則判別語(yǔ)音識(shí)別機(jī)當(dāng)前的模式是否為噪音模式610,若為噪音模式,則清除使用的內(nèi)存,進(jìn)入語(yǔ)音輸入待機(jī)處理200階段。若所輸入的語(yǔ)音為弱音,但當(dāng)前語(yǔ)音識(shí)別機(jī)的模式非噪音模式時(shí),則增加噪音計(jì)算點(diǎn)611,并判別所増加的計(jì)算點(diǎn)是否到達(dá)既定的任意值612,若到達(dá)任意值時(shí),則將語(yǔ)音識(shí)別機(jī)的狀態(tài)變更為噪音狀態(tài)613。若語(yǔ)音識(shí)別機(jī)變更為噪音模式,語(yǔ)音識(shí)別機(jī)調(diào)節(jié)所輸入的音量,將一定音量大小的語(yǔ)音視為默音,并對(duì)超出上述一定音量大小的語(yǔ)音進(jìn)行處理。另外,在第二次識(shí)別結(jié)果未被認(rèn)證,且語(yǔ)音的種類(lèi)為強(qiáng) 音吋,則確認(rèn)當(dāng)前語(yǔ)音識(shí)別機(jī)的模式是否為拒絕模式614。若為拒絕模式時(shí),則清除語(yǔ)音識(shí)別機(jī)中所使用的內(nèi)存,并進(jìn)行語(yǔ)音輸入待機(jī)處理200。若非拒絕模式時(shí),則增加拒絕計(jì)算點(diǎn)615。檢查所増加的拒絕計(jì)算點(diǎn)是否到達(dá)既定任意值616,若到達(dá)即定任意值,則將語(yǔ)音識(shí)別機(jī)的模式轉(zhuǎn)換為拒絕模式617。當(dāng)語(yǔ)音識(shí)別機(jī)變更為拒絕模式吋,第一次識(shí)別結(jié)果處理階段204及第二次識(shí)別結(jié)果處理階段中的機(jī)器控制指令則不被識(shí)別認(rèn)證,同時(shí)進(jìn)入拒絕階段。第二次識(shí)別結(jié)果處理階段206中的識(shí)別結(jié)果被認(rèn)證時(shí),如圖6所示,在識(shí)別結(jié)果被認(rèn)證時(shí),確認(rèn)當(dāng)前語(yǔ)音識(shí)別機(jī)的模式是否為拒絕模式602。若為拒絕模式,檢查當(dāng)前所識(shí)別的指令是否為轉(zhuǎn)換基本模式的指令603。若當(dāng)前所識(shí)別的指令為轉(zhuǎn)換基本模式的指令吋,則將當(dāng)前模式變更為基本模式604,并進(jìn)入語(yǔ)音輸入待機(jī)處理階段200。若第二次識(shí)別結(jié)果被認(rèn)證,但當(dāng)前模式非拒絕模式時(shí),確認(rèn)所識(shí)別的指令是機(jī)器控制指令,還是場(chǎng)所變換指令605,607。若為機(jī)器控制指令吋,則控制相關(guān)機(jī)器606,并回到語(yǔ)音輸入待機(jī)處理階段200。若為場(chǎng)所變換指令吋,識(shí)別作業(yè)中的語(yǔ)音識(shí)別機(jī)的控制區(qū)域用戶(hù)名變更記到所定場(chǎng)所用戶(hù)名上608。如上所變更的控制區(qū)域用戶(hù)名經(jīng)過(guò)一定時(shí)間后,再?gòu)?fù)原到設(shè)置區(qū)域的用戶(hù)名上。圖7是本發(fā)明實(shí)施方式的根據(jù)控制用戶(hù)名變更的機(jī)器控制過(guò)程的流程圖。如圖7所示,在語(yǔ)音識(shí)別家庭網(wǎng)絡(luò)開(kāi)始啟動(dòng)時(shí),在進(jìn)行語(yǔ)音識(shí)別過(guò)程前,將所設(shè)置的區(qū)域用戶(hù)名記為控制區(qū)域用戶(hù)名701,例如,語(yǔ)音識(shí)別機(jī)上所記的控制區(qū)域用戶(hù)名如表I所示進(jìn)行設(shè)定。[表 I]
權(quán)利要求
1.一種應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法包括即時(shí)接收語(yǔ)音輸入的階段Si ;測(cè)定上述SI階段中所輸入的所述語(yǔ)音的強(qiáng)弱及持續(xù)時(shí)間的階段S2;將所述S2階段中所測(cè)定的所述語(yǔ)音的強(qiáng)弱及持續(xù)時(shí)間與任意值相比,并按默音、弱音、強(qiáng)音對(duì)所述語(yǔ)音進(jìn)行分類(lèi)的階段S3;根據(jù)所述S3階段中的分類(lèi),若為默音,則計(jì)算默音的持續(xù)時(shí)間,并持續(xù)維持語(yǔ)音輸入待機(jī)狀態(tài),若為弱音或強(qiáng)音,則進(jìn)行語(yǔ)音識(shí)別處理的階段S4;根據(jù)所述S4階段進(jìn)行的語(yǔ)音識(shí)別處理,進(jìn)行制定單位語(yǔ)音識(shí)別處理的階段S5;根據(jù)所述S5階段的結(jié)果,決定是否對(duì)整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別處理,并進(jìn)行處理準(zhǔn)備的階段S6;根據(jù)所述S6階段,若決定執(zhí)行整體語(yǔ)音的語(yǔ)音識(shí)別處理,則對(duì)整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別處理的階段S7;根據(jù)所述S7階段的結(jié)果,決定是否認(rèn)證語(yǔ)音識(shí)別處理的結(jié)果,并控制機(jī)器,進(jìn)行識(shí)別語(yǔ)音適應(yīng)化的階段S8;在所述S6階段中,不對(duì)所述整體語(yǔ)音進(jìn)行語(yǔ)音識(shí)別時(shí),或根據(jù)所述S8階段,不認(rèn)證所述語(yǔ)音的識(shí)別結(jié)果時(shí),則根據(jù)所述S3階段中所決定的語(yǔ)音分類(lèi),若為弱音時(shí),則轉(zhuǎn)換為噪音模式,若為強(qiáng)音時(shí),則轉(zhuǎn)換為拒絕模式的階段S9。
2.根據(jù)權(quán)利要求I所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S3階段中,根據(jù)事先制定的強(qiáng)弱,將所述語(yǔ)音分為三個(gè)等級(jí),在所述S2階段中所測(cè)定的語(yǔ)音音量若為最低的第一等級(jí)時(shí),則所述語(yǔ)音分到默音類(lèi);若所述語(yǔ)音的音量屬于高于所述第一等級(jí)的第二等級(jí),且所述語(yǔ)音的音長(zhǎng)為任意值時(shí),則所述語(yǔ)音分到弱音類(lèi);若所述語(yǔ)音的音量為最高的第三等級(jí),且所述語(yǔ)音的音長(zhǎng)滿(mǎn)足任意值時(shí),則所述語(yǔ)音分到強(qiáng)音類(lèi)的SlO階段。
3.根據(jù)權(quán)利要求I所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S5階段的所述制定單位的語(yǔ)音識(shí)別處理進(jìn)行的過(guò)程中,若識(shí)別關(guān)鍵字時(shí),將所述關(guān)鍵字最末音素傳向虛擬機(jī)的對(duì)數(shù)似然比與各自的聲學(xué)模型對(duì)比,記憶具有最高值的聲學(xué)模型的階段Sll ;及 在所述S6階段中,所述語(yǔ)音識(shí)別結(jié)果與已存指令一致,并決定對(duì)所述整體語(yǔ)音進(jìn)行第二次識(shí)別的階段S12 ;及 在所述S12階段中,決定進(jìn)行所述第二次語(yǔ)音識(shí)別時(shí),將所述Sll階段中所記憶的所述聲學(xué)模型換為第二次識(shí)別模式的準(zhǔn)備階段S13 ;及 在所述S13階段中,將所述已準(zhǔn)備的聲學(xué)模型用于數(shù)據(jù)庫(kù),并進(jìn)行第二次語(yǔ)音識(shí)別的階段S14。
4.根據(jù)權(quán)利要求I所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S8階段中,若所述第二次語(yǔ)音識(shí)別結(jié)果被認(rèn)證,根據(jù)所述認(rèn)證結(jié)果控制機(jī)器的階段S15 ;及 在所述S8階段中,儲(chǔ)存所述語(yǔ)音,并進(jìn)行所儲(chǔ)存語(yǔ)音的適應(yīng)化作業(yè),更新具有發(fā)音的語(yǔ)音者的音色特征的聲學(xué)模型的階段S16。
5.根據(jù)權(quán)利要求4所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S16階段中,檢查是否有具有所述語(yǔ)音者音色特征的數(shù)據(jù)庫(kù)的階段S17 ;及 在所述S16階段中,若未有所述音色的數(shù)據(jù)庫(kù)時(shí),在所述語(yǔ)音適應(yīng)化的作業(yè)中,更新所述已識(shí)別的語(yǔ)音音色數(shù)據(jù)庫(kù)的階段S18。
6.根據(jù)權(quán)利要求5所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S17階段中,檢查所述Sll階段中,與所述各自的聲學(xué)模型對(duì)比后,是否存在具有最高值的所述聲學(xué)模型的階段S19;及 在所述S19階段中,若檢查到在所有的聲學(xué)模型中不存在具有最高值的所述聲學(xué)模型時(shí),記錄沒(méi)有具有與所述SI階段中所輸入的所述語(yǔ)音類(lèi)似音色的聲學(xué)模型的階段S20。
7.根據(jù)權(quán)利要求4所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S15階段的所述機(jī)器控制中,將事前語(yǔ)音識(shí)別機(jī)所設(shè)置的區(qū)域用戶(hù)名記為控制區(qū)域用戶(hù)名的階段S21 ;及 判斷在所述S8階段中,所認(rèn)證的所述識(shí)別結(jié)果是區(qū)域選擇指令還是機(jī)器控制指令的階段S22;以及在所述S22階段中,若判定為區(qū)域選擇指令時(shí),將所述區(qū)域用戶(hù)名變更記為所述控制區(qū)域用戶(hù)名的階段S23;及 在所述S22階段中,若判定為機(jī)器控制指令時(shí),控制所述控制區(qū)域用戶(hù)名所屬區(qū)域機(jī)器的階段S24。
8.根據(jù)權(quán)利要求4所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S23階段中,在變更記憶所述控制區(qū)域用戶(hù)名后,在一定時(shí)間后,將所述所設(shè)置的區(qū)域用戶(hù)名復(fù)原為所述控制區(qū)域用戶(hù)名的階段S25。
9.根據(jù)權(quán)利要求I所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S9階段中,在不認(rèn)證所述S8階段中的所述識(shí)別結(jié)果時(shí),根據(jù)所述SlO階段所分類(lèi)的語(yǔ)音種類(lèi)另行劃分計(jì)算點(diǎn),增加各種類(lèi)所述計(jì)算點(diǎn)的階段S26;及 在所述S26階段中,若各個(gè)計(jì)算點(diǎn)先到達(dá)所定的任意值時(shí),識(shí)別機(jī)的狀態(tài)若為所述弱音時(shí)則變更為噪音模式,若為所述強(qiáng)音時(shí)則變更為拒絕模式的階段S27;以及在所述S4階段中,若所述默音計(jì)算點(diǎn)先到達(dá)所定臨限值時(shí),變?yōu)榛灸J降碾A段S28。
10.根據(jù)權(quán)利要求9所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括根據(jù)所述S28階段所變更的模式,若為拒絕模式時(shí),拒絕除所述基本模式變換指令外的所有指令的識(shí)別,若為噪音模式時(shí),人為地降低所輸入語(yǔ)音的強(qiáng)弱,控制所述SlO階段中的屬于第二等級(jí)的噪音,若為基本模式時(shí),進(jìn)行正常識(shí)別的階段S29。
11.根據(jù)權(quán)利要求I所述的應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,其特征在于,所述語(yǔ)音識(shí)別方法還包括在所述S8階段的所述拒絕模式狀態(tài)下,若先定的基本模式復(fù)原指令的識(shí)別被認(rèn)證時(shí),將所述語(yǔ)音識(shí)別機(jī)的模式變更為所述基本模式的階段S30。
全文摘要
本發(fā)明涉及一種應(yīng)用于家庭網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法,尤其是一種應(yīng)用于家庭網(wǎng)絡(luò)的通過(guò)語(yǔ)音識(shí)別機(jī)器來(lái)進(jìn)行語(yǔ)音識(shí)別的方法。在本發(fā)明中,因語(yǔ)音識(shí)別機(jī)的模式可根據(jù)周邊狀況進(jìn)行變更,即時(shí)處理語(yǔ)音識(shí)別,降低對(duì)非指令語(yǔ)音的錯(cuò)誤識(shí)別,因此可在噪音環(huán)境中提高指令的識(shí)別率,可自動(dòng)適應(yīng)語(yǔ)音識(shí)別數(shù)據(jù)庫(kù)中未有的語(yǔ)音者的音色,記錄聲學(xué)模型并對(duì)其進(jìn)行識(shí)別,從而提高識(shí)別率,還可統(tǒng)一多個(gè)區(qū)域中的同種指令,減少過(guò)于繁多的指令,使語(yǔ)音識(shí)別的準(zhǔn)確率大大提高,同時(shí)有效地減少錯(cuò)誤識(shí)別。
文檔編號(hào)G10L15/08GK102682767SQ201110065918
公開(kāi)日2012年9月19日 申請(qǐng)日期2011年3月18日 優(yōu)先權(quán)日2011年3月18日
發(fā)明者方英奎, 林東伸 申請(qǐng)人:株式公司Cs