頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備的制造方法

文檔序號(hào)：10770047閱讀：791來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備的制造方法
【專利摘要】本實(shí)用新型公開了一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備，該語音識(shí)別系統(tǒng)包括：采集語音信號(hào)的語音輸入設(shè)備；存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫；以及語音識(shí)別芯片，與語音輸入設(shè)備和數(shù)據(jù)庫相連接，其中，語音識(shí)別芯片包括：對語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路，與語音輸入設(shè)備相連接；對頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路，與頻譜分析電路相連接；及將提取到的語音特征參數(shù)與數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路，與數(shù)據(jù)庫和特征提取電路相連接。采用上述技術(shù)方案，避免了采用手觸操控方式給用戶帶來的不便，從而有效提高了用戶體驗(yàn)。
【專利說明】
頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備
技術(shù)領(lǐng)域
[0001]本實(shí)用新型涉及通信領(lǐng)域，尤其涉及頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備。
【背景技術(shù)】
[0002]隨著電子設(shè)備的微型化，頭戴式智能設(shè)備，例如智能眼鏡，已經(jīng)逐步投入市場。對于頭戴式智能設(shè)備而言，手觸操控的方式會(huì)給用戶帶來一些不便，例如，當(dāng)用戶操作比較頻繁而需要把手持續(xù)上抬動(dòng)作，這樣會(huì)給用戶一些不好的體驗(yàn)效果。
[0003]因此，提供一種非手觸操控方式，能夠方便地對設(shè)備發(fā)出指令，實(shí)現(xiàn)所需的各個(gè)功能，是目前亟待解決的問題。
【實(shí)用新型內(nèi)容】
[0004]本實(shí)用新型的目的是提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備，用于解決現(xiàn)有技術(shù)中手觸操控的方式會(huì)給用戶帶來一些不便的問題。
[0005]根據(jù)本實(shí)用新型的一個(gè)方面，提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)，該語音識(shí)別系統(tǒng)包括:采集語音信號(hào)的語音輸入設(shè)備;存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫；以及語音識(shí)別芯片，與上述語音輸入設(shè)備和上述數(shù)據(jù)庫相連接，其中，上述語音識(shí)別芯片包括:對上述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路，與上述語音輸入設(shè)備相連接;對上述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路，與上述頻譜分析電路相連接;及將提取到的語音特征參數(shù)與上述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路，與上述數(shù)據(jù)庫和上述特征提取電路相連接。
[0006]進(jìn)一步地，上述語音識(shí)別系統(tǒng)還包括:連接于上述語音輸入設(shè)備和上述語音識(shí)別芯片之間的語音活動(dòng)檢測器。
[0007]進(jìn)一步地，語音識(shí)別系統(tǒng)還包括:連接于上述語音輸入設(shè)備和上述語音識(shí)別芯片之間的定時(shí)開關(guān)。
[0008]進(jìn)一步地，上述語音識(shí)別系統(tǒng)還包括:從上述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元(MCU)，其中，上述MCU與上述語音識(shí)別芯片的輸出端及上述數(shù)據(jù)庫的輸入端相連接。
[0009]進(jìn)一步地，上述語音輸入設(shè)備為麥克風(fēng)輸入設(shè)備。
[0010]進(jìn)一步地，上述語音識(shí)別芯片為LD3320芯片。
[0011]根據(jù)本實(shí)用新型的另一個(gè)方面，提供一種頭戴智能設(shè)備，并采用如下技術(shù)方案:該頭戴智能設(shè)備包括上述的頭戴智能設(shè)備。
[0012]進(jìn)一步地，上述頭戴智能設(shè)備可以為智能眼鏡。
[0013]采用本實(shí)用新型的技術(shù)方案，只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令，便可以實(shí)現(xiàn)所需的功能，避免了采用手觸操控方式給用戶帶來的不便，從而有效提高了用戶體驗(yàn)。
【附圖說明】
[0014]為了更清楚地說明本申請實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實(shí)施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本實(shí)用新型中記載的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1為本實(shí)用新型實(shí)施例的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖；
[0016]圖2為本實(shí)用新型優(yōu)選實(shí)施例一的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖；
[0017]圖3為本實(shí)用新型優(yōu)選實(shí)施例二的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0018]本實(shí)用新型的核心是提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備，用于解決現(xiàn)有技術(shù)中手觸操控的方式會(huì)給用戶帶來一些不便等問題。
[0019]為了使本領(lǐng)域的技術(shù)人員更好地理解本實(shí)用新型的技術(shù)方案，下面將結(jié)合附圖對本實(shí)用新型作進(jìn)一步的詳細(xì)介紹。
[0020]根據(jù)本發(fā)明實(shí)施例，提供了一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)。
[0021]圖1為本實(shí)用新型實(shí)施例的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖。如圖1所示，該語音識(shí)別系統(tǒng)包括:采集語音信號(hào)的語音輸入設(shè)備10;存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫12;以及語音識(shí)別芯片14，與上述語音輸入設(shè)備10和上述數(shù)據(jù)庫12相連接，其中，上述語音識(shí)別芯片14包括:對上述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路140，與上述語音輸入設(shè)備10相連接;對上述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路142，與上述頻譜分析電路140相連接;及將提取到的語音特征參數(shù)與上述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路144，與上述數(shù)據(jù)庫12和上述特征提取電路142相連接。
[0022]采用圖1所示的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)，只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令，便可以實(shí)現(xiàn)所需的功能，避免了采用手觸操控方式給用戶帶來的不便，從而有效提高了用戶體驗(yàn)。
[0023]其中，上述語音輸入設(shè)備可以為麥克風(fēng)(MIC)輸入設(shè)備。頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的工作原理是:將通過MIC輸入的聲音進(jìn)行頻譜分析;提取語音特征;和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對比匹配;找出得分最高(即匹配度最高)的關(guān)鍵詞語作為識(shí)別結(jié)果輸出。
[0024]優(yōu)選地，如圖2所示，上述語音識(shí)別系統(tǒng)還可以包括:連接于上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間的語音活動(dòng)檢測器16。
[0025]優(yōu)選地，如圖3所示，語音識(shí)別系統(tǒng)還可以包括:連接于上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間的定時(shí)開關(guān)18。
[0026]需要說明的是，語音識(shí)別芯片能在兩種情況下給出識(shí)別結(jié)果:
[0027]第一種:外部送入預(yù)定時(shí)間的語音數(shù)據(jù)后(比如5秒鐘的語音數(shù)據(jù))，芯片對這些語音數(shù)據(jù)運(yùn)算分析后，給出識(shí)別結(jié)果。即可以在上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間設(shè)置定時(shí)開關(guān)18。
[0028]對于第一種情況，可以理解為預(yù)先設(shè)定一個(gè)時(shí)間(比如5秒鐘)，定時(shí)開關(guān)18在5秒鐘后關(guān)斷，停止把聲音送入語音識(shí)別芯片，并且根據(jù)已送入語音識(shí)別芯片的語音數(shù)據(jù)計(jì)算出一個(gè)識(shí)別結(jié)果。
[0029]第二種:外部送入語音數(shù)據(jù)流，語音識(shí)別芯片通過語音活動(dòng)檢測器VADUoiceactivity detect1n)進(jìn)行端點(diǎn)檢測，檢測出用戶停止說話，把用戶開始說話到停止說話之間的語音數(shù)據(jù)進(jìn)行運(yùn)算分析后，給出識(shí)別結(jié)果。即可以在上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間設(shè)置語音活動(dòng)檢測器16。
[0030]對于第二種情況，需要了解VAD的工作原理:VAD技術(shù)是在一段語音數(shù)據(jù)流中，判斷出哪個(gè)時(shí)間點(diǎn)是人聲的開始，哪個(gè)時(shí)間點(diǎn)是人聲的結(jié)束。判斷的依據(jù)是，在背景聲音的基礎(chǔ)上有了語音發(fā)音，則視為聲音的開始。而后，檢測到一段持續(xù)時(shí)間的背景音(比如600毫秒)，則視為人聲說話結(jié)束。
[0031]通過VAD判斷出人聲說話的區(qū)域后，語音識(shí)別芯片會(huì)把這期間的聲音數(shù)據(jù)進(jìn)行識(shí)別處理后，計(jì)算出識(shí)別結(jié)果。
[0032]需要說明的是，除了以上兩種情況外，語音識(shí)別算法無法〃主動(dòng)〃地判斷出是否識(shí)別出了一個(gè)結(jié)果。這是因?yàn)?，在?jì)算的過程中的任何時(shí)刻，語音識(shí)別器都會(huì)對已送入識(shí)別芯片的聲音數(shù)據(jù)進(jìn)行分析，并根據(jù)匹配程度為識(shí)別列表中的關(guān)鍵詞語進(jìn)行打分，最匹配的打分最高。
[0033]但是，由于識(shí)別算法不知道用戶后面是否還繼續(xù)說語音，所以無法〃主動(dòng)〃地判斷已經(jīng)識(shí)別出一個(gè)結(jié)果。比如，識(shí)別列表中有兩個(gè)關(guān)鍵詞語分別是"李曉"和"李曉明〃，當(dāng)用戶說到〃曉〃這個(gè)音節(jié)時(shí)，在識(shí)別芯片內(nèi)部是〃李曉〃的得分最高，但此時(shí)識(shí)別芯片是無法給出識(shí)別結(jié)果。隨著用戶說出〃明〃音節(jié)后，〃李曉明〃則成為得分最高。此時(shí)，用戶停止說話，或者是定時(shí)錄音已到，使得識(shí)別芯片可以判斷出用戶已經(jīng)停止說話了，才能給出識(shí)別結(jié)果是〃李曉明"。
[0034]優(yōu)選地，如圖2和圖3所示，上述語音識(shí)別系統(tǒng)還可以包括:從上述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元(MCU)20，其中，上述MCU 20與上述語音識(shí)別芯片的輸出端及上述數(shù)據(jù)庫的輸入端相連接。
[0035]語音識(shí)別系統(tǒng)中的MCU還可以對數(shù)據(jù)庫中的關(guān)鍵詞語音特征進(jìn)行維護(hù)，每次識(shí)別后，MCU根據(jù)語音識(shí)別芯片的輸出結(jié)果中提取拼音串，并動(dòng)態(tài)更新關(guān)鍵詞列表中的語音特征
?目息O
[0036]優(yōu)選地，上述語音識(shí)別芯片可以采用LD3320芯片。
[0037]根據(jù)本發(fā)明實(shí)施例，還提供了一種頭戴智能設(shè)備。該頭戴智能設(shè)備包括上述的語首識(shí)別系統(tǒng)。
[0038]優(yōu)選地，上述頭戴智能設(shè)備可以為智能眼鏡。
[0039]綜上所述，借助本發(fā)明提供的上述實(shí)施例，只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令，便可以實(shí)現(xiàn)所需的功能，避免了采用手觸操控方式給用戶帶來的不便，從而有效提高了用戶體驗(yàn)。
[0040]以上只通過說明的方式描述了本實(shí)用新型的某些示范性實(shí)施例，毋庸置疑，對于本領(lǐng)域的普通技術(shù)人員，在不偏離本實(shí)用新型的精神和范圍的情況下，可以用各種不同的方式對所描述的實(shí)施例進(jìn)行修正。因此，上述附圖和描述在本質(zhì)上是說明性的，不應(yīng)理解為對本實(shí)用新型權(quán)利要求保護(hù)范圍的限制。
【主權(quán)項(xiàng)】
1.一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)，其特征在于，包括: 采集語音信號(hào)的語音輸入設(shè)備；存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫;及語音識(shí)別芯片，與所述語音輸入設(shè)備和所述數(shù)據(jù)庫相連接，其中，所述語音識(shí)別芯片包括: 對所述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路，與所述語音輸入設(shè)備相連接；對所述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路，與所述頻譜分析電路相連接;及將提取到的語音特征參數(shù)與所述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路，與所述數(shù)據(jù)庫和所述特征提取電路相連接。2.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)，其特征在于，所述語音識(shí)別系統(tǒng)還包括:連接于所述語音輸入設(shè)備和所述語音識(shí)別芯片之間的語音活動(dòng)檢測器。3.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)，其特征在于，語音識(shí)別系統(tǒng)還包括:連接于所述語音輸入設(shè)備和所述語音識(shí)別芯片之間的定時(shí)開關(guān)。4.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)，其特征在于，所述語音識(shí)別系統(tǒng)還包括:從所述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元MCU，其中，所述MCU與所述語音識(shí)別芯片的輸出端及所述數(shù)據(jù)庫的輸入端相連接。5.如權(quán)利要求1所述的語音識(shí)別系統(tǒng)，其特征在于，所述語音輸入設(shè)備為麥克風(fēng)輸入設(shè)備。6.如權(quán)利要求1至5中任一項(xiàng)所述的語音識(shí)別系統(tǒng)，其特征在于，所述語音識(shí)別芯片為LD3320芯片。7.—種頭戴智能設(shè)備，其特征在于，包括權(quán)利要求1至6中任一項(xiàng)所述的語音識(shí)別系統(tǒng)。8.如權(quán)利要求7所述的頭戴智能設(shè)備，其特征在于，所述頭戴智能設(shè)備為智能眼鏡。
【文檔編號(hào)】G10L15/22GK205451769SQ201521101160
【公開日】2016年8月10日
【申請日】2015年12月25日
【發(fā)明人】葉晨光
【申請人】北京帕羅奧圖科技有限公司

完整全部詳細(xì)技術(shù)資料下載