欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于圓形麥克風(fēng)陣列的智能交互方法及系統(tǒng)的制作方法

文檔序號(hào):9220256閱讀:761來源:國知局
基于圓形麥克風(fēng)陣列的智能交互方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音信號(hào)處理領(lǐng)域,具體涉及一種基于圓形麥克風(fēng)陣列的智能交互方 法及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的突飛猛進(jìn)式發(fā)展,越來越多的智能交互產(chǎn)品問世。語音作為人類 信息最自然、最便捷的交互方式,是現(xiàn)今智能交互產(chǎn)品最主流的交互方式。
[0003] 現(xiàn)有常見的智能交互產(chǎn)品中,多是以特定的喚醒詞識(shí)別觸發(fā)交互系統(tǒng),即智能系 統(tǒng)實(shí)時(shí)獲取用戶喚醒詞語音信號(hào)。然而,由于現(xiàn)實(shí)環(huán)境較為復(fù)雜,存在環(huán)境噪聲、混響及 其他說話人的人聲干擾,需要進(jìn)行語音降噪以提高智能系統(tǒng)獲取用戶喚醒詞語音信號(hào)的能 力。
[0004] 傳統(tǒng)的語音降噪系統(tǒng)多是基于單個(gè)麥克風(fēng)采用譜減法或維納濾波等技術(shù)來抑制 噪聲;或基于線性麥克風(fēng)陣列利用麥克風(fēng)空間位置差異提取期望方向信號(hào),抑制其余方向 信號(hào),從而實(shí)現(xiàn)降噪。然而,線性麥克風(fēng)陣列受到陣列形狀的限制,只能對(duì)陣列法線方向進(jìn) 行較好的拾音,而對(duì)于軸線方向的拾音效果較差,使得智能交互產(chǎn)品存在準(zhǔn)確性和穩(wěn)定性 較差的缺點(diǎn)。
[0005] 為此,現(xiàn)有技術(shù)中提出了基于圓陣的語音增強(qiáng)方法,設(shè)計(jì)結(jié)構(gòu)為陣元均勻排列于 圓形或圓弧上,使用相位、幅度加權(quán)的方法,按照陣列需要處理的音頻信號(hào)的中心頻率計(jì)算 出各個(gè)陣元的加權(quán)值以及某一弧度范圍內(nèi)入射方向?qū)?yīng)的加權(quán)向量,并利用循環(huán)移位操作 得到整個(gè)圓陣或部分圓陣其他方向的加權(quán)向量,最后對(duì)各個(gè)陣元的信號(hào)按加權(quán)值進(jìn)行加權(quán) 求和。該方案采用延時(shí)-相加〇)elay-and-Sum)形式的波束形成方法,這種方法得到的信 號(hào)對(duì)其他方向干擾抑制有限,導(dǎo)致其余方向信號(hào)泄漏過多,波束指向性較差。另外,由于麥 克風(fēng)陣元存在幅度誤差和相位誤差,當(dāng)輸入信號(hào)中的噪聲較大時(shí),麥克風(fēng)陣列波束輸出的 語音信號(hào)的信噪比較低,影響語音識(shí)別。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明實(shí)施例提供一種基于圓形麥克風(fēng)陣列的智能交互方法及系統(tǒng),以解決現(xiàn)有 智能交互產(chǎn)品存在的因噪聲影響語音識(shí)別效果而帶來的系統(tǒng)準(zhǔn)確性及穩(wěn)定性較差的問題。
[0007] 為此,本發(fā)明實(shí)施例提供如下技術(shù)方案:
[0008] -種基于圓形麥克風(fēng)陣列的智能交互方法,包括:
[0009] 通過圓形麥克風(fēng)陣列接收用戶語音信號(hào);
[0010] 對(duì)所述語音信號(hào)進(jìn)行去噪處理,得到去噪后的語音信號(hào);
[0011] 對(duì)去噪后的不同波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別,并選擇識(shí)別得分最高的語音信 號(hào)的波束方向作為目標(biāo)說話人方向,對(duì)后續(xù)在所述目標(biāo)說話人方向上去噪后的語音信號(hào)進(jìn) 行語音識(shí)別,得到語音識(shí)別結(jié)果;
[0012] 根據(jù)所述語音識(shí)別結(jié)果執(zhí)行操作。
[0013] 可選的,所述對(duì)所述語音信號(hào)進(jìn)行去噪處理,得到去噪后的語音信號(hào)包括:
[0014] 將所述語音信號(hào)轉(zhuǎn)換為頻域信號(hào);
[0015] 計(jì)算所述頻域信號(hào)的優(yōu)化參數(shù),所述優(yōu)化參數(shù)包括:指向性參數(shù)和白噪聲增益,所 述指向性參數(shù)是指期望信號(hào)相對(duì)于全向噪聲的輸入信噪比和麥克風(fēng)的輸入信噪比的比值, 所述白噪聲增益是指所述圓形麥克風(fēng)陣列輸出信噪比與輸入信噪比的比值;
[0016] 根據(jù)所述優(yōu)化參數(shù)對(duì)所述頻域信號(hào)進(jìn)行優(yōu)化,得到去噪后的語音信號(hào)。
[0017] 可選的,所述根據(jù)所述優(yōu)化參數(shù)對(duì)所述頻域信號(hào)進(jìn)行優(yōu)化還包括:
[0018] 在根據(jù)所述優(yōu)化參數(shù)對(duì)所述頻域信號(hào)進(jìn)行優(yōu)化時(shí),對(duì)期望方向以外的其它方向波 束陷零。
[0019] 可選的,所述方法還包括:
[0020] 從去噪后的語音信號(hào)的波束中選擇能量大于設(shè)定閾值的波束作為優(yōu)選波束;
[0021] 所述對(duì)去噪后的不同波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別包括:
[0022] 對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別。
[0023] 可選的,所述對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別包括:
[0024] 對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行語音識(shí)別和/或聲紋識(shí)別,得到特定命令詞 和/或特定說話人。
[0025] 可選的,所述對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別包括:
[0026] 對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
[0027] -種基于圓形麥克風(fēng)陣列的智能交互系統(tǒng),包括:
[0028] 接收模塊,用于通過圓形麥克風(fēng)陣列接收用戶語音信號(hào);
[0029] 去噪模塊,用于對(duì)所述語音信號(hào)進(jìn)行去噪處理,得到去噪后的語音信號(hào);
[0030] 識(shí)別模塊,用于對(duì)去噪后的不同波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別,并選擇識(shí)別得 分最高的語音信號(hào)的波束方向作為目標(biāo)說話人方向,對(duì)后續(xù)在所述目標(biāo)說話人方向上去噪 后的語音信號(hào)進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果;
[0031] 交互處理模塊,用于根據(jù)所述識(shí)別模塊的語音識(shí)別結(jié)果執(zhí)行操作。
[0032] 可選的,所述去噪模塊包括:
[0033] 信號(hào)轉(zhuǎn)換單元,用于將所述語音信號(hào)轉(zhuǎn)換為頻域信號(hào);
[0034] 計(jì)算單元,用于計(jì)算所述頻域信號(hào)的優(yōu)化參數(shù),所述優(yōu)化參數(shù)包括:指向性參數(shù) 和白噪聲增益,所述指向性參數(shù)是指期望信號(hào)相對(duì)于全向噪聲的輸入信噪比和麥克風(fēng)的輸 入信噪比的比值,所述白噪聲增益是指所述圓形麥克風(fēng)陣列輸出信噪比與輸入信噪比的比 值;
[0035] 第一優(yōu)化單元,用于根據(jù)所述優(yōu)化參數(shù)對(duì)所述頻域信號(hào)進(jìn)行優(yōu)化,得到去噪后的 語音信號(hào)。
[0036] 可選的,所述去噪模塊還包括:
[0037] 第二優(yōu)化單元,用于在所述第一優(yōu)化單元根據(jù)所述優(yōu)化參數(shù)對(duì)所述頻域信號(hào)進(jìn)行 優(yōu)化時(shí),對(duì)期望方向以外的其它方向波束陷零。
[0038] 可選的,所述系統(tǒng)還包括:
[0039] 篩選模塊,用于從去噪后的語音信號(hào)的波束中選擇能量大于設(shè)定閾值的波束作為 優(yōu)選波束;
[0040] 所述識(shí)別模塊,具體用于對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行預(yù)識(shí)別,以確定目 標(biāo)說話人方向。
[0041] 可選的,所述識(shí)別模塊,具體用于對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行語音識(shí)別, 在識(shí)別到特定命令詞后,選擇識(shí)別得分最高的語音信號(hào)的波束方向作為目標(biāo)說話人方向, 并對(duì)后續(xù)在所述目標(biāo)說話人方向上去噪后的語音信號(hào)進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
[0042] 可選的,所述識(shí)別模塊包括:聲紋識(shí)別單元和語音識(shí)別單元;所述聲紋識(shí)別單元 對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行聲紋識(shí)別,得到特定說話人,并選擇識(shí)別得分最高的 語音信號(hào)的波束方向作為目標(biāo)說話人方向,并觸發(fā)所述語音識(shí)別單元對(duì)后續(xù)在所述目標(biāo)說 話人方向上去噪后的語音信號(hào)進(jìn)行語音識(shí)別,得到語音識(shí)別結(jié)果。
[0043] 可選的,所述識(shí)別模塊,具體用于對(duì)所述優(yōu)選波束方向的語音信號(hào)進(jìn)行語音識(shí)別, 在得到語音識(shí)別結(jié)果后,選擇識(shí)別得分最高的語音信號(hào)的波束方向作為目標(biāo)說話人方向, 并對(duì)后續(xù)在所述目標(biāo)說話人方向上去噪后的語音信號(hào)進(jìn)行語音識(shí)別,得到后續(xù)語音信號(hào)的 語音識(shí)別結(jié)果。
[0044] 可選的,所述圓形麥克風(fēng)陣列中的多個(gè)麥克風(fēng)為均勾分布或非均勾分布。
[0045] 可選的,所述圓形麥克風(fēng)陣列的中心還設(shè)有一個(gè)麥克風(fēng)。
[0046] 本發(fā)明實(shí)施例提供的基于圓形麥克風(fēng)陣列的智能交互方法及系統(tǒng),首先,通過圓 形麥克風(fēng)陣列接收用戶語音信號(hào),然后對(duì)語音信號(hào)進(jìn)行去
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安化县| 海南省| 安新县| 观塘区| 大同市| 文化| 如东县| 略阳县| 枣强县| 沛县| 仪征市| 马边| 台东市| 洪雅县| 汝城县| 隆化县| 乡城县| 恩平市| 临邑县| 肇东市| 麻栗坡县| 晋江市| 玉树县| 扎赉特旗| 孝感市| 祁连县| 山东| 安平县| 简阳市| 九龙县| 株洲县| 吴桥县| 昌乐县| 永和县| 丹寨县| 桦川县| 云梦县| 德惠市| 宽城| 永兴县| 绥中县|