一種雙模語(yǔ)音身份識(shí)別系統(tǒng)的制作方法
【專利摘要】本實(shí)用新型公開(kāi)了一種雙模語(yǔ)音身份識(shí)別系統(tǒng),包括:一采集單元,所述采集單元對(duì)采集的聲波進(jìn)行語(yǔ)音識(shí)別處理,以獲得短句或者單詞;一音頻解碼器,所述音頻解碼器用于對(duì)采集單元的語(yǔ)音信號(hào)進(jìn)行提取,并進(jìn)行A/D轉(zhuǎn)換成數(shù)字信號(hào);一與音頻解碼器連接的語(yǔ)音識(shí)別處理單元,所述語(yǔ)音識(shí)別處理單元包括DSP芯片和存儲(chǔ)器,所述存儲(chǔ)器與所述DSP芯片相連接。大大提高了以單一說(shuō)話人聲紋特征識(shí)別的鑒別系統(tǒng)的穩(wěn)定性,增加了這類系統(tǒng)的實(shí)用價(jià)值,提高了識(shí)別系統(tǒng)安全性。通過(guò)雙重判定,能夠在一定程度上克服由于模仿導(dǎo)致的說(shuō)話人識(shí)別系統(tǒng)誤判的缺點(diǎn),又能克服單一語(yǔ)音密碼鑒別系統(tǒng)密碼容易泄露的缺點(diǎn)。
【專利說(shuō)明】
【技術(shù)領(lǐng)域】
[0001] 本實(shí)用新型涉及語(yǔ)音識(shí)別技術(shù),具體涉及一種雙模語(yǔ)音身份識(shí)別系統(tǒng)。 一種雙模語(yǔ)音身份識(shí)別系統(tǒng)
【背景技術(shù)】
[0002] 目前,語(yǔ)音識(shí)別技術(shù)已廣泛應(yīng)用于通信、汽車電子、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域,高 智能化電子產(chǎn)品已逐步占領(lǐng)市場(chǎng)。
[0003] 基于說(shuō)話人識(shí)別的身份確認(rèn)技術(shù)已經(jīng)開(kāi)始運(yùn)用到智能門禁系統(tǒng)中來(lái)。但是,由于 語(yǔ)音信號(hào)的不確定性以及人聲的可模仿性,單純基于說(shuō)話人特征的識(shí)別系統(tǒng)很難在實(shí)際的 應(yīng)用中保持良好的魯棒性。 實(shí)用新型內(nèi)容
[0004] 考慮到孤立詞識(shí)別在對(duì)單詞和短語(yǔ)識(shí)別上出色的性能,本實(shí)用新型提供了一種以 單詞或者短語(yǔ)為語(yǔ)音密碼,將其識(shí)別作為身份識(shí)別系統(tǒng)的判別元素之一,然后結(jié)合說(shuō)話人 聲紋特征進(jìn)行身份權(quán)限判定。
[0005] 本實(shí)用新型解決上述技術(shù)問(wèn)題的方案是:
[0006] 一種雙模語(yǔ)音身份識(shí)別系統(tǒng),包括:
[0007] -采集單元,所述采集單元對(duì)采集的聲波進(jìn)行語(yǔ)音識(shí)別處理,以獲得短句或者單 詞;
[0008] -音頻解碼器,所述音頻解碼器用于對(duì)采集單元的語(yǔ)音信號(hào)進(jìn)行提取,并進(jìn)行A/D 轉(zhuǎn)換成數(shù)字信號(hào);
[0009] -與音頻解碼器連接的語(yǔ)音識(shí)別處理單元,所述語(yǔ)音識(shí)別處理單元包括DSP芯片 和存儲(chǔ)器,所述存儲(chǔ)器與所述DSP芯片相連接。
[0010] 優(yōu)選的,所述采集單元包括ARMS3C44B0X處理器、FlashROM、SDRAM內(nèi)存、 Nand-flash存儲(chǔ)器、語(yǔ)音采集及播放電路、網(wǎng)絡(luò)通信電路、JTAG調(diào)試接口電路、電源和時(shí)鐘 電路。
[0011] 優(yōu)選的,所述采集單元的語(yǔ)音進(jìn)行預(yù)處理,并提取語(yǔ)音密碼特征,對(duì)符合要求的語(yǔ) 音密碼特征和聲紋特征保存至Nand-flash存儲(chǔ)器。
[0012] 通過(guò)以上技術(shù)方案,本實(shí)用新型的技術(shù)效果:
[0013] 本實(shí)用新型大大提高了以單一說(shuō)話人聲紋特征識(shí)別的鑒別系統(tǒng)的穩(wěn)定性,增加了 這類系統(tǒng)的實(shí)用價(jià)值,提高了識(shí)別系統(tǒng)安全性。通過(guò)雙重判定,能夠在一定程度上克服由于 模仿導(dǎo)致的說(shuō)話人識(shí)別系統(tǒng)誤判的缺點(diǎn),又能克服單一語(yǔ)音密碼鑒別系統(tǒng)密碼容易泄露的 缺點(diǎn)。
【專利附圖】
【附圖說(shuō)明】
[0014] 圖1為本實(shí)用新型的工作原理圖。
[0015] 圖2為本實(shí)用新型的采集單元的框圖。
【具體實(shí)施方式】
[0016] 為了使本實(shí)用新型實(shí)現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下 面結(jié)合具體圖示,進(jìn)一步闡述本實(shí)用新型。
[0017] 參照?qǐng)D1和圖2,一種雙模語(yǔ)音身份識(shí)別系統(tǒng),包括:一采集單元,所述采集單元對(duì) 采集的聲波進(jìn)行語(yǔ)音識(shí)別處理,以獲得短句或者單詞;所述采集單元的語(yǔ)音進(jìn)行預(yù)處理,并 提取語(yǔ)音密碼特征,對(duì)符合要求的語(yǔ)音密碼特征和聲紋特征保存至Nand-flash存儲(chǔ)器。
[0018] 一音頻解碼器,所述音頻解碼器用于對(duì)采集單元的語(yǔ)音信號(hào)進(jìn)行提取,并進(jìn)行A/D 轉(zhuǎn)換成數(shù)字信號(hào);
[0019] 一與音頻解碼器連接的語(yǔ)音識(shí)別處理單元,所述語(yǔ)音識(shí)別處理單元包括DSP芯片 和存儲(chǔ)器,所述存儲(chǔ)器與所述DSP芯片相連接。存儲(chǔ)器內(nèi)存儲(chǔ)語(yǔ)音信號(hào)的語(yǔ)音密碼特征信 息和聲紋特征信息。其中聲紋特征信息包括16-128個(gè)用戶碼本,每個(gè)用戶碼本對(duì)應(yīng)一個(gè)用 戶。
[0020] 所述采集單元包括ARMS3C44B0X處理器、FlashROM、SDRAM內(nèi)存、Nand-flash存儲(chǔ) 器、語(yǔ)音采集及播放電路、網(wǎng)絡(luò)通信電路、JTAG調(diào)試接口電路、電源和時(shí)鐘電路。
[0021] 本實(shí)用新型所要求保護(hù)的技術(shù)方案中,其中該硬件結(jié)構(gòu)中所包括的各個(gè)功能模塊 均能夠?qū)?yīng)于集成電路結(jié)構(gòu)中的具體硬件電路,因此這些模塊和單元僅利用硬件電路結(jié)構(gòu) 就可以實(shí)現(xiàn)。
[0022] 其中語(yǔ)音識(shí)別處理單元主要分為"訓(xùn)練"和"識(shí)別"兩個(gè)階段,當(dāng)訓(xùn)練成功后,進(jìn)入 語(yǔ)音識(shí)別階段,首先初始化語(yǔ)音識(shí)別器,播放提示音,此時(shí)可以對(duì)控制系統(tǒng)發(fā)出語(yǔ)音命令, 然后將采集的語(yǔ)音進(jìn)行處理并與存儲(chǔ)器中的語(yǔ)音樣本進(jìn)行比較,根據(jù)比較結(jié)果產(chǎn)生相應(yīng)的 控制信號(hào)。
[0023] 將DSP芯片處理后的結(jié)果分別送至存儲(chǔ)器的語(yǔ)音信號(hào)的語(yǔ)音密碼特征信息和聲 紋特征信息,對(duì)提取的聲紋特征與聲紋特征庫(kù)進(jìn)行匹配;兩者均匹配成功后,才顯示成功。
[0024] 本實(shí)用新型大大提高了以單一說(shuō)話人聲紋特征識(shí)別的鑒別系統(tǒng)的穩(wěn)定性,增加了 這類系統(tǒng)的實(shí)用價(jià)值,提高了識(shí)別系統(tǒng)安全性。通過(guò)雙重判定,能夠在一定程度上克服由于 模仿導(dǎo)致的說(shuō)話人識(shí)別系統(tǒng)誤判的缺點(diǎn),又能克服單一語(yǔ)音密碼鑒別系統(tǒng)密碼容易泄露的 缺點(diǎn)。
[0025] 以上顯示和描述了本實(shí)用新型的基本原理和主要特征和本實(shí)用新型的優(yōu)點(diǎn)。本行 業(yè)的技術(shù)人員應(yīng)該了解,本實(shí)用新型不受上述實(shí)施例的限制,上述實(shí)施例和說(shuō)明書(shū)中描述 的只是說(shuō)明本實(shí)用新型的原理,在不脫離本實(shí)用新型精神和范圍的前提下,本實(shí)用新型還 會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本實(shí)用新型范圍內(nèi)。本實(shí)用新型 要求保護(hù)范圍由所附的權(quán)利要求書(shū)及其等效物界定。
【權(quán)利要求】
1. 一種雙模語(yǔ)音身份識(shí)別系統(tǒng),其特征在于,包括: 一采集單元,所述采集單元對(duì)采集的聲波進(jìn)行語(yǔ)音識(shí)別處理,以獲得短句或者單詞; 一音頻解碼器,所述音頻解碼器用于對(duì)采集單元的語(yǔ)音信號(hào)進(jìn)行提取,并進(jìn)行A/D轉(zhuǎn) 換成數(shù)字信號(hào); 一與音頻解碼器連接的語(yǔ)音識(shí)別處理單元,所述語(yǔ)音識(shí)別處理單元包括DSP芯片和存 儲(chǔ)器,所述存儲(chǔ)器與所述DSP芯片相連接;所述采集單元包括ARM S3C44B0X處理器、Flash ROM、SDRAM內(nèi)存、Nand-flash存儲(chǔ)器、語(yǔ)音采集及播放電路、網(wǎng)絡(luò)通信電路、JTAG調(diào)試接口 電路、電源和時(shí)鐘電路。
2. 根據(jù)權(quán)利要求1所述的一種雙模語(yǔ)音身份識(shí)別系統(tǒng),其特征在于,所述采集單元 的語(yǔ)音進(jìn)行預(yù)處理,并提取語(yǔ)音密碼特征,對(duì)符合要求的語(yǔ)音密碼特征和聲紋特征保存至 Nand-flash 存儲(chǔ)器。
【文檔編號(hào)】G10L15/26GK203849994SQ201420035796
【公開(kāi)日】2014年9月24日 申請(qǐng)日期:2014年1月21日 優(yōu)先權(quán)日:2014年1月21日
【發(fā)明者】曾向陽(yáng), 鄧剛, 王志剛 申請(qǐng)人:西安遠(yuǎn)聲電子科技有限公司