技術(shù)總結(jié)
本發(fā)明公開(kāi)一種音視頻信息融合的麥克風(fēng)陣列語(yǔ)音增強(qiáng)系統(tǒng)及方法。所述系統(tǒng)包括視頻采集模塊、麥克風(fēng)陣列接收模塊、音視頻來(lái)波方向聯(lián)合估計(jì)模塊、麥克風(fēng)陣列語(yǔ)音增強(qiáng)模塊和音視頻聯(lián)合語(yǔ)音增強(qiáng)模塊,視頻采集模塊用于采集應(yīng)用場(chǎng)景中說(shuō)話人的視頻信號(hào);麥克風(fēng)陣列接收模塊用于接收說(shuō)話人的音頻信號(hào);音視頻來(lái)波方向聯(lián)合估計(jì)模塊利用音視頻信息聯(lián)合估計(jì)說(shuō)話人音頻的來(lái)波方向;麥克風(fēng)陣列語(yǔ)音增強(qiáng)模塊利用麥克風(fēng)陣列接收模塊接收到的陣列語(yǔ)音信號(hào)來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行增強(qiáng);音視頻聯(lián)合語(yǔ)音增強(qiáng)模塊利用語(yǔ)音和視頻信號(hào)聯(lián)合對(duì)語(yǔ)音進(jìn)行二次增強(qiáng)處理。本發(fā)明能顯著提高麥克風(fēng)陣列語(yǔ)音增強(qiáng)系統(tǒng)的性能,能廣泛應(yīng)用于視頻會(huì)議、車(chē)載電話、移動(dòng)視頻通話終端等場(chǎng)合。
技術(shù)研發(fā)人員:張軍;陳鑫源;寧更新;馮義志;季飛;余華;陳芳炯
受保護(hù)的技術(shù)使用者:華南理工大學(xué)
文檔號(hào)碼:201610698586
技術(shù)研發(fā)日:2016.08.22
技術(shù)公布日:2017.01.11