欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻解碼、編碼方法、裝置、電子設備及存儲介質(zhì)與流程

文檔序號:40613417發(fā)布日期:2025-01-07 20:59閱讀:13來源:國知局
音頻解碼、編碼方法、裝置、電子設備及存儲介質(zhì)與流程

本申請涉及通信,尤其涉及一種音頻解碼、編碼方法、裝置、電子設備及存儲介質(zhì)。


背景技術(shù):

1、由于語音通信的便利性和及時性,語音通話的應用越來越廣泛,例如在網(wǎng)絡會議的會議參與方之間傳輸音頻信號(例如語音信號)。而在語音通話中,語音信號可能會被混有噪聲等聲學干擾,語音信號中所混有的噪聲會導致通話質(zhì)量變差,從而極大地影響了用戶的聽覺體驗。

2、然而,對于如何對語音信號進行增強處理以抑制噪聲部分,相關(guān)技術(shù)尚無有效的解決方案。


技術(shù)實現(xiàn)思路

1、本申請實施例提供一種音頻解碼、編碼方法、裝置、電子設備、計算機可讀存儲介質(zhì)及計算機程序產(chǎn)品,能夠有效抑制音頻信號中的聲學干擾,進而提高重建得到的音頻信號的質(zhì)量。

2、本申請實施例的技術(shù)方案是這樣實現(xiàn)的:

3、本申請實施例提供一種音頻解碼方法,包括:

4、獲取碼流,其中,所述碼流是對音頻信號進行編碼得到的;

5、對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值;

6、對所述特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,其中,所述標簽信息向量的維度與所述特征向量的預測值的維度相同;

7、基于所述特征向量的預測值和所述標簽信息向量進行信號重建;

8、將通過所述信號重建得到的所述音頻信號的預測值,作為所述碼流的解碼結(jié)果。

9、本申請實施例提供一種音頻解碼裝置,包括:

10、獲取模塊,用于獲取碼流,其中,所述碼流是對音頻信號進行編碼得到的;

11、解碼模塊,用于對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值;

12、標簽提取模塊,用于對所述特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,其中,所述標簽信息向量的維度與所述特征向量的預測值的維度相同;

13、重建模塊,用于基于所述特征向量的預測值和所述標簽信息向量進行信號重建;

14、確定模塊,用于將通過所述信號重建得到的所述音頻信號的預測值,作為所述碼流的解碼結(jié)果。

15、本申請實施例提供一種音頻編碼方法,包括:

16、獲取音頻信號;

17、對所述音頻信號進行編碼處理,得到碼流,其中,所述碼流用于供電子設備執(zhí)行本申請實施例提供的音頻解碼方法。

18、本申請實施例提供一種音頻編碼裝置,包括:

19、獲取模塊,用于獲取音頻信號;

20、編碼模塊,用于對所述音頻信號進行編碼處理,得到碼流,其中,所述碼流用于供電子設備執(zhí)行本申請實施例提供的音頻解碼方法。

21、本申請實施例提供一種電子設備,包括:

22、存儲器,用于存儲可執(zhí)行指令;

23、處理器,用于執(zhí)行所述存儲器中存儲的可執(zhí)行指令時,實現(xiàn)本申請實施例提供的音頻編解碼方法。

24、本申請實施例提供一種計算機可讀存儲介質(zhì),存儲有可執(zhí)行指令,用于被處理器執(zhí)行時,實現(xiàn)本申請實施例提供的音頻編解碼方法。

25、本申請實施例提供一種計算機程序產(chǎn)品,包括計算機程序或指令,用于被處理器執(zhí)行時,實現(xiàn)本申請實施例提供的音頻編解碼方法。

26、本申請實施例具有以下有益效果:

27、通過對解碼得到的特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,并結(jié)合特征向量的預測值和標簽信息向量進行信號重建,如此,相較于僅僅基于特征向量的預測值進行信號重建,結(jié)合特征向量的預測值和標簽信息向量進行信號重建,相當于增加了音頻信號中核心成分所占的比例,減小了噪聲等聲學干擾所占的比例,從而可以有效抑制編碼端采集的音頻信號中包括的噪聲成分,進而提高了重建得到的音頻信號的質(zhì)量。



技術(shù)特征:

1.一種音頻解碼方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:

4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對所述特征向量的預測值和所述標簽信息向量進行融合處理,得到融合向量,包括:

5.根據(jù)權(quán)利要求3所述的方法,其特征在于,

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值,包括:

7.根據(jù)權(quán)利要求1所述的方法,其特征在于,

8.根據(jù)權(quán)利要求7所述的方法,其特征在于,

9.根據(jù)權(quán)利要求8所述的方法,其特征在于,

10.根據(jù)權(quán)利要求7至10任一項所述的方法,其特征在于,所述基于所述特征向量的預測值和所述標簽信息向量進行信號重建,包括:

11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述對所述n個子帶信號分別對應的特征向量的預測值、以及所述n個標簽信息向量進行一一對應的融合處理,得到n個融合向量,包括:

12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述基于第j融合向量調(diào)用第j合成網(wǎng)絡進行信號重建,得到第j子帶信號的預測值,包括:

13.根據(jù)權(quán)利要求12所述的方法,其特征在于,

14.一種音頻編碼方法,其特征在于,所述方法包括:

15.一種處理碼流的方法,其特征在于,所述碼流基于權(quán)利要求1至13任一項所述的音頻解碼方法進行解碼,或者根據(jù)權(quán)利要求14所述的音頻編碼方法產(chǎn)生。

16.一種處理碼流的方法,其特征在于,在計算機可讀存儲介質(zhì)上存儲所述碼流,所述碼流基于權(quán)利要求1至13任一項所述的音頻解碼方法進行解碼,或者根據(jù)權(quán)利要求14所述的音頻編碼方法產(chǎn)生。

17.一種音頻解碼裝置,其特征在于,所述裝置包括:

18.一種音頻編碼裝置,其特征在于,所述裝置包括:

19.一種計算機可讀存儲介質(zhì),存儲有可執(zhí)行指令,其特征在于,所述可執(zhí)行指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至13任一項所述的音頻解碼方法或權(quán)利要求14所述的音頻編碼方法。

20.一種計算機程序產(chǎn)品,包括計算機程序或指令,其特征在于,所述計算機程序或指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至13任一項所述的音頻解碼方法或權(quán)利要求14所述的音頻編碼方法。


技術(shù)總結(jié)
本申請?zhí)峁┝艘环N音頻解碼、編碼方法、裝置、電子設備及存儲介質(zhì),可以應用于車載場景;音頻解碼方法包括:獲取碼流,其中,所述碼流是對音頻信號進行編碼得到的;對所述碼流進行解碼處理,得到所述音頻信號的特征向量的預測值;對所述特征向量的預測值進行標簽提取處理,得到用于信號增強的標簽信息向量,其中,所述標簽信息向量的維度與所述特征向量的預測值的維度相同;基于所述特征向量的預測值和所述標簽信息向量進行信號重建;將通過所述信號重建得到的所述音頻信號的預測值,作為所述碼流的解碼結(jié)果。通過本申請,能夠有效抑制音頻信號中的聲學干擾,進而提高重建得到的音頻信號的質(zhì)量。

技術(shù)研發(fā)人員:史裕鵬,肖瑋,王蒙,康迂勇,黃慶博
受保護的技術(shù)使用者:騰訊科技(深圳)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
新巴尔虎右旗| 兴海县| 永昌县| 车险| 永福县| 伽师县| 孝昌县| 青川县| 许昌市| 汶川县| 安庆市| 娄烦县| 深水埗区| 闵行区| 宁陕县| 江都市| 通渭县| 南平市| 望城县| 札达县| 合水县| 淳化县| 枣强县| 锡林浩特市| 盐山县| 贺兰县| 德钦县| 滕州市| 上杭县| 东兴市| 宜州市| 中山市| 固原市| 射洪县| 龙海市| 新乐市| 富顺县| 肇庆市| 仁布县| 泰和县| 南宁市|