頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備的制造方法
【專利摘要】本實(shí)用新型公開了一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備,該語音識(shí)別系統(tǒng)包括:采集語音信號(hào)的語音輸入設(shè)備;存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫;以及語音識(shí)別芯片,與語音輸入設(shè)備和數(shù)據(jù)庫相連接,其中,語音識(shí)別芯片包括:對語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路,與語音輸入設(shè)備相連接;對頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路,與頻譜分析電路相連接;及將提取到的語音特征參數(shù)與數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路,與數(shù)據(jù)庫和特征提取電路相連接。采用上述技術(shù)方案,避免了采用手觸操控方式給用戶帶來的不便,從而有效提高了用戶體驗(yàn)。
【專利說明】
頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備
技術(shù)領(lǐng)域
[0001]本實(shí)用新型涉及通信領(lǐng)域,尤其涉及頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備。
【背景技術(shù)】
[0002]隨著電子設(shè)備的微型化,頭戴式智能設(shè)備,例如智能眼鏡,已經(jīng)逐步投入市場。對于頭戴式智能設(shè)備而言,手觸操控的方式會(huì)給用戶帶來一些不便,例如,當(dāng)用戶操作比較頻繁而需要把手持續(xù)上抬動(dòng)作,這樣會(huì)給用戶一些不好的體驗(yàn)效果。
[0003]因此,提供一種非手觸操控方式,能夠方便地對設(shè)備發(fā)出指令,實(shí)現(xiàn)所需的各個(gè)功能,是目前亟待解決的問題。
【實(shí)用新型內(nèi)容】
[0004]本實(shí)用新型的目的是提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備,用于解決現(xiàn)有技術(shù)中手觸操控的方式會(huì)給用戶帶來一些不便的問題。
[0005]根據(jù)本實(shí)用新型的一個(gè)方面,提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng),該語音識(shí)別系統(tǒng)包括:采集語音信號(hào)的語音輸入設(shè)備;存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫;以及語音識(shí)別芯片,與上述語音輸入設(shè)備和上述數(shù)據(jù)庫相連接,其中,上述語音識(shí)別芯片包括:對上述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路,與上述語音輸入設(shè)備相連接;對上述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路,與上述頻譜分析電路相連接;及將提取到的語音特征參數(shù)與上述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路,與上述數(shù)據(jù)庫和上述特征提取電路相連接。
[0006]進(jìn)一步地,上述語音識(shí)別系統(tǒng)還包括:連接于上述語音輸入設(shè)備和上述語音識(shí)別芯片之間的語音活動(dòng)檢測器。
[0007]進(jìn)一步地,語音識(shí)別系統(tǒng)還包括:連接于上述語音輸入設(shè)備和上述語音識(shí)別芯片之間的定時(shí)開關(guān)。
[0008]進(jìn)一步地,上述語音識(shí)別系統(tǒng)還包括:從上述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元(MCU),其中,上述MCU與上述語音識(shí)別芯片的輸出端及上述數(shù)據(jù)庫的輸入端相連接。
[0009]進(jìn)一步地,上述語音輸入設(shè)備為麥克風(fēng)輸入設(shè)備。
[0010]進(jìn)一步地,上述語音識(shí)別芯片為LD3320芯片。
[0011]根據(jù)本實(shí)用新型的另一個(gè)方面,提供一種頭戴智能設(shè)備,并采用如下技術(shù)方案:該頭戴智能設(shè)備包括上述的頭戴智能設(shè)備。
[0012]進(jìn)一步地,上述頭戴智能設(shè)備可以為智能眼鏡。
[0013]采用本實(shí)用新型的技術(shù)方案,只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令,便可以實(shí)現(xiàn)所需的功能,避免了采用手觸操控方式給用戶帶來的不便,從而有效提高了用戶體驗(yàn)。
【附圖說明】
[0014]為了更清楚地說明本申請實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本實(shí)用新型中記載的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0015]圖1為本實(shí)用新型實(shí)施例的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖;
[0016]圖2為本實(shí)用新型優(yōu)選實(shí)施例一的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖;
[0017]圖3為本實(shí)用新型優(yōu)選實(shí)施例二的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0018]本實(shí)用新型的核心是提供一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)及頭戴智能設(shè)備,用于解決現(xiàn)有技術(shù)中手觸操控的方式會(huì)給用戶帶來一些不便等問題。
[0019]為了使本領(lǐng)域的技術(shù)人員更好地理解本實(shí)用新型的技術(shù)方案,下面將結(jié)合附圖對本實(shí)用新型作進(jìn)一步的詳細(xì)介紹。
[0020]根據(jù)本發(fā)明實(shí)施例,提供了一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng)。
[0021]圖1為本實(shí)用新型實(shí)施例的頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的結(jié)構(gòu)框圖。如圖1所示,該語音識(shí)別系統(tǒng)包括:采集語音信號(hào)的語音輸入設(shè)備10;存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫12;以及語音識(shí)別芯片14,與上述語音輸入設(shè)備10和上述數(shù)據(jù)庫12相連接,其中,上述語音識(shí)別芯片14包括:對上述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路140,與上述語音輸入設(shè)備10相連接;對上述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路142,與上述頻譜分析電路140相連接;及將提取到的語音特征參數(shù)與上述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路144,與上述數(shù)據(jù)庫12和上述特征提取電路142相連接。
[0022]采用圖1所示的頭戴智能設(shè)備的語音識(shí)別系統(tǒng),只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令,便可以實(shí)現(xiàn)所需的功能,避免了采用手觸操控方式給用戶帶來的不便,從而有效提高了用戶體驗(yàn)。
[0023]其中,上述語音輸入設(shè)備可以為麥克風(fēng)(MIC)輸入設(shè)備。頭戴智能設(shè)備的語音識(shí)別系統(tǒng)的工作原理是:將通過MIC輸入的聲音進(jìn)行頻譜分析;提取語音特征;和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對比匹配;找出得分最高(即匹配度最高)的關(guān)鍵詞語作為識(shí)別結(jié)果輸出。
[0024]優(yōu)選地,如圖2所示,上述語音識(shí)別系統(tǒng)還可以包括:連接于上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間的語音活動(dòng)檢測器16。
[0025]優(yōu)選地,如圖3所示,語音識(shí)別系統(tǒng)還可以包括:連接于上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間的定時(shí)開關(guān)18。
[0026]需要說明的是,語音識(shí)別芯片能在兩種情況下給出識(shí)別結(jié)果:
[0027]第一種:外部送入預(yù)定時(shí)間的語音數(shù)據(jù)后(比如5秒鐘的語音數(shù)據(jù)),芯片對這些語音數(shù)據(jù)運(yùn)算分析后,給出識(shí)別結(jié)果。即可以在上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間設(shè)置定時(shí)開關(guān)18。
[0028]對于第一種情況,可以理解為預(yù)先設(shè)定一個(gè)時(shí)間(比如5秒鐘),定時(shí)開關(guān)18在5秒鐘后關(guān)斷,停止把聲音送入語音識(shí)別芯片,并且根據(jù)已送入語音識(shí)別芯片的語音數(shù)據(jù)計(jì)算出一個(gè)識(shí)別結(jié)果。
[0029]第二種:外部送入語音數(shù)據(jù)流,語音識(shí)別芯片通過語音活動(dòng)檢測器VADUoiceactivity detect1n)進(jìn)行端點(diǎn)檢測,檢測出用戶停止說話,把用戶開始說話到停止說話之間的語音數(shù)據(jù)進(jìn)行運(yùn)算分析后,給出識(shí)別結(jié)果。即可以在上述語音輸入設(shè)備10和上述語音識(shí)別芯片14之間設(shè)置語音活動(dòng)檢測器16。
[0030]對于第二種情況,需要了解VAD的工作原理:VAD技術(shù)是在一段語音數(shù)據(jù)流中,判斷出哪個(gè)時(shí)間點(diǎn)是人聲的開始,哪個(gè)時(shí)間點(diǎn)是人聲的結(jié)束。判斷的依據(jù)是,在背景聲音的基礎(chǔ)上有了語音發(fā)音,則視為聲音的開始。而后,檢測到一段持續(xù)時(shí)間的背景音(比如600毫秒),則視為人聲說話結(jié)束。
[0031]通過VAD判斷出人聲說話的區(qū)域后,語音識(shí)別芯片會(huì)把這期間的聲音數(shù)據(jù)進(jìn)行識(shí)別處理后,計(jì)算出識(shí)別結(jié)果。
[0032]需要說明的是,除了以上兩種情況外,語音識(shí)別算法無法〃主動(dòng)〃地判斷出是否識(shí)別出了一個(gè)結(jié)果。這是因?yàn)?,在?jì)算的過程中的任何時(shí)刻,語音識(shí)別器都會(huì)對已送入識(shí)別芯片的聲音數(shù)據(jù)進(jìn)行分析,并根據(jù)匹配程度為識(shí)別列表中的關(guān)鍵詞語進(jìn)行打分,最匹配的打分最高。
[0033]但是,由于識(shí)別算法不知道用戶后面是否還繼續(xù)說語音,所以無法〃主動(dòng)〃地判斷已經(jīng)識(shí)別出一個(gè)結(jié)果。比如,識(shí)別列表中有兩個(gè)關(guān)鍵詞語分別是"李曉"和"李曉明〃,當(dāng)用戶說到〃曉〃這個(gè)音節(jié)時(shí),在識(shí)別芯片內(nèi)部是〃李曉〃的得分最高,但此時(shí)識(shí)別芯片是無法給出識(shí)別結(jié)果。隨著用戶說出〃明〃音節(jié)后,〃李曉明〃則成為得分最高。此時(shí),用戶停止說話,或者是定時(shí)錄音已到,使得識(shí)別芯片可以判斷出用戶已經(jīng)停止說話了,才能給出識(shí)別結(jié)果是〃李曉明"。
[0034]優(yōu)選地,如圖2和圖3所示,上述語音識(shí)別系統(tǒng)還可以包括:從上述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元(MCU)20,其中,上述MCU 20與上述語音識(shí)別芯片的輸出端及上述數(shù)據(jù)庫的輸入端相連接。
[0035]語音識(shí)別系統(tǒng)中的MCU還可以對數(shù)據(jù)庫中的關(guān)鍵詞語音特征進(jìn)行維護(hù),每次識(shí)別后,MCU根據(jù)語音識(shí)別芯片的輸出結(jié)果中提取拼音串,并動(dòng)態(tài)更新關(guān)鍵詞列表中的語音特征
?目息O
[0036]優(yōu)選地,上述語音識(shí)別芯片可以采用LD3320芯片。
[0037]根據(jù)本發(fā)明實(shí)施例,還提供了一種頭戴智能設(shè)備。該頭戴智能設(shè)備包括上述的語首識(shí)別系統(tǒng)。
[0038]優(yōu)選地,上述頭戴智能設(shè)備可以為智能眼鏡。
[0039]綜上所述,借助本發(fā)明提供的上述實(shí)施例,只需要用戶通過語音對頭戴智能設(shè)備發(fā)出指令,便可以實(shí)現(xiàn)所需的功能,避免了采用手觸操控方式給用戶帶來的不便,從而有效提高了用戶體驗(yàn)。
[0040]以上只通過說明的方式描述了本實(shí)用新型的某些示范性實(shí)施例,毋庸置疑,對于本領(lǐng)域的普通技術(shù)人員,在不偏離本實(shí)用新型的精神和范圍的情況下,可以用各種不同的方式對所描述的實(shí)施例進(jìn)行修正。因此,上述附圖和描述在本質(zhì)上是說明性的,不應(yīng)理解為對本實(shí)用新型權(quán)利要求保護(hù)范圍的限制。
【主權(quán)項(xiàng)】
1.一種頭戴智能設(shè)備的語音識(shí)別系統(tǒng),其特征在于,包括: 采集語音信號(hào)的語音輸入設(shè)備; 存儲(chǔ)有多個(gè)關(guān)鍵詞的數(shù)據(jù)庫;及 語音識(shí)別芯片,與所述語音輸入設(shè)備和所述數(shù)據(jù)庫相連接,其中,所述語音識(shí)別芯片包括: 對所述語音輸入設(shè)備采集到的語音流進(jìn)行頻譜分析的頻譜分析電路,與所述語音輸入設(shè)備相連接; 對所述頻譜分析電路輸出的結(jié)果提取語音特征參數(shù)的特征提取電路,與所述頻譜分析電路相連接;及 將提取到的語音特征參數(shù)與所述數(shù)據(jù)庫中關(guān)鍵詞的語音特征參數(shù)進(jìn)行匹配的匹配電路,與所述數(shù)據(jù)庫和所述特征提取電路相連接。2.如權(quán)利要求1所述的語音識(shí)別系統(tǒng),其特征在于,所述語音識(shí)別系統(tǒng)還包括:連接于所述語音輸入設(shè)備和所述語音識(shí)別芯片之間的語音活動(dòng)檢測器。3.如權(quán)利要求1所述的語音識(shí)別系統(tǒng),其特征在于,語音識(shí)別系統(tǒng)還包括:連接于所述語音輸入設(shè)備和所述語音識(shí)別芯片之間的定時(shí)開關(guān)。4.如權(quán)利要求1所述的語音識(shí)別系統(tǒng),其特征在于,所述語音識(shí)別系統(tǒng)還包括:從所述語音識(shí)別芯片的輸出結(jié)果中提取拼音串的微控制單元MCU,其中,所述MCU與所述語音識(shí)別芯片的輸出端及所述數(shù)據(jù)庫的輸入端相連接。5.如權(quán)利要求1所述的語音識(shí)別系統(tǒng),其特征在于,所述語音輸入設(shè)備為麥克風(fēng)輸入設(shè)備。6.如權(quán)利要求1至5中任一項(xiàng)所述的語音識(shí)別系統(tǒng),其特征在于,所述語音識(shí)別芯片為LD3320芯片。7.—種頭戴智能設(shè)備,其特征在于,包括權(quán)利要求1至6中任一項(xiàng)所述的語音識(shí)別系統(tǒng)。8.如權(quán)利要求7所述的頭戴智能設(shè)備,其特征在于,所述頭戴智能設(shè)備為智能眼鏡。
【文檔編號(hào)】G10L15/22GK205451769SQ201521101160
【公開日】2016年8月10日
【申請日】2015年12月25日
【發(fā)明人】葉晨光
【申請人】北京帕羅奧圖科技有限公司