技術(shù)特征:1.一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,步驟1包括:
3.根據(jù)權(quán)利要求1所述的一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,步驟2包括:
4.根據(jù)權(quán)利要求3所述的一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,步驟3包括:
5.根據(jù)權(quán)利要求4所述的一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,改進(jìn)的時(shí)序網(wǎng)絡(luò)seqnet(·)開始位置包括一個(gè)輸出通道數(shù)為b的線性瓶頸層,則狀態(tài)空間方程對(duì)應(yīng)的幀級(jí)各通道自適應(yīng)波速形成器的權(quán)值被估計(jì)為:
6.根據(jù)權(quán)利要求1所述的一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,其特征在于,在步驟4中波束形成網(wǎng)絡(luò)各通道系統(tǒng)響應(yīng)為:
技術(shù)總結(jié)本發(fā)明公開了一種基于麥克風(fēng)陣列的低時(shí)延語(yǔ)音增強(qiáng)方法,該方法包括:設(shè)置一組初始極點(diǎn)參數(shù),利用人工神經(jīng)網(wǎng)絡(luò)優(yōu)化初始極點(diǎn)參數(shù),得到實(shí)數(shù)極點(diǎn);利用實(shí)數(shù)極點(diǎn)構(gòu)建麥克風(fēng)陣列各通道的正交基函數(shù)模型,并計(jì)算各階濾波器響應(yīng);對(duì)麥克風(fēng)陣列接收信號(hào)進(jìn)行分幀和時(shí)域特征提取,并利用改進(jìn)的時(shí)序網(wǎng)絡(luò)估計(jì)正交基函數(shù)模型構(gòu)成的自適應(yīng)波束形成器權(quán)值;根據(jù)濾波器響應(yīng)和波束形成器權(quán)值計(jì)算波束形成網(wǎng)絡(luò)各通道系統(tǒng)響應(yīng),獲得增強(qiáng)后的完整語(yǔ)音信號(hào)。本發(fā)明通過使用正交基結(jié)構(gòu)波束形成網(wǎng)絡(luò),可以靈活調(diào)節(jié)極點(diǎn),提升網(wǎng)絡(luò)自由度,縮短濾波器長(zhǎng)度,降低網(wǎng)絡(luò)時(shí)延;在濾波器長(zhǎng)度更短的情況下,達(dá)到更好的語(yǔ)音增強(qiáng)效果。
技術(shù)研發(fā)人員:陳華偉,李妍文
受保護(hù)的技術(shù)使用者:南京航空航天大學(xué)
技術(shù)研發(fā)日:技術(shù)公布日:2025/1/2