本申請(qǐng)涉及音頻信號(hào)處理,特別是涉及一種音頻降噪方法、電子設(shè)備以及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在線上語音通話場(chǎng)景中,必不可少的需要進(jìn)行音頻降噪(ans,audio?noisesuppression)等處理。
2、傳統(tǒng)音頻降噪以噪聲平穩(wěn)性作為假設(shè),去除環(huán)境中的穩(wěn)態(tài)噪聲。降噪算法往往基于播放音源與近端語音均為說話聲進(jìn)行參數(shù)設(shè)置。隨著使用場(chǎng)景的不斷豐富,音頻信號(hào)中包括但不僅限于說話聲或非說話聲音源。例如音樂課遠(yuǎn)程教學(xué)場(chǎng)景,往往音頻信號(hào)中包括非說話聲音源比如音樂類音源。其中,音樂類音源的頻譜特性相較于說話聲差異性較為明顯,采用音源為說話聲的參數(shù)設(shè)計(jì)好降噪算法。但是,此種僅根據(jù)說話聲參數(shù)設(shè)計(jì)好的降噪算法來對(duì)包括音樂類音源的音頻信號(hào)進(jìn)行降噪,會(huì)導(dǎo)致降噪算法將會(huì)對(duì)音樂聲造成極大的音質(zhì)損傷,使得降噪后的音頻數(shù)據(jù)的音質(zhì)低。
3、針對(duì)現(xiàn)有的技術(shù)缺陷,如何提供一種使得降噪后的音頻數(shù)據(jù)的音質(zhì)更高的方案,是本領(lǐng)域技術(shù)人員亟待解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)至少提供一種音頻降噪方法、電子設(shè)備以及存儲(chǔ)介質(zhì)。
2、本申請(qǐng)?zhí)峁┝艘环N音頻降噪方法,包括:獲取目標(biāo)音頻特征,目標(biāo)音頻特征是對(duì)目標(biāo)音頻進(jìn)行特征提取得到,目標(biāo)音頻是待降噪音頻或與待降噪音頻相關(guān)的參考音頻;將目標(biāo)音頻特征作為場(chǎng)景檢測(cè)模型的輸入,得到目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型;選擇與目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型相匹配的降噪方式對(duì)待降噪音頻進(jìn)行處理,得到降噪后的音頻數(shù)據(jù)。
3、本申請(qǐng)?zhí)峁┝艘环N音頻降噪裝置,包括:獲取模塊、場(chǎng)景檢測(cè)模塊以及處理模塊;獲取模塊,用于獲取目標(biāo)音頻特征,目標(biāo)音頻特征是對(duì)目標(biāo)音頻進(jìn)行特征提取得到,目標(biāo)音頻是待降噪音頻或與待降噪音頻相關(guān)的參考音頻;場(chǎng)景檢測(cè)模塊,用于將目標(biāo)音頻特征作為場(chǎng)景檢測(cè)模型的輸入,得到目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型;處理模塊,用于選擇與目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型相匹配的降噪方式對(duì)待降噪音頻進(jìn)行處理,得到降噪后的音頻數(shù)據(jù)。
4、本申請(qǐng)?zhí)峁┝艘环N電子設(shè)備,包括存儲(chǔ)器和處理器,處理器用于執(zhí)行存儲(chǔ)器中存儲(chǔ)的程序指令,以實(shí)現(xiàn)上述音頻降噪方法。
5、本申請(qǐng)?zhí)峁┝艘环N計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序指令,程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述音頻降噪方法。
6、上述方案,獲取目標(biāo)音頻特征,目標(biāo)音頻特征是對(duì)目標(biāo)音頻進(jìn)行特征提取得到,目標(biāo)音頻是待降噪音頻或與待降噪音頻相關(guān)的參考音頻,將經(jīng)過特征提取得到的目標(biāo)音頻特征作為場(chǎng)景檢測(cè)模型的輸入,得到目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型,使得確定到的目標(biāo)音頻的場(chǎng)景類型較為準(zhǔn)確,目標(biāo)音頻的場(chǎng)景類型所匹配的降噪方式為待降噪音頻更適配的降噪方式,進(jìn)而通過待降噪音頻更適配的降噪方式對(duì)待降噪音頻進(jìn)行處理得到的降噪后的音頻數(shù)據(jù),能夠提高降噪后的音頻數(shù)據(jù)音質(zhì)。
7、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,而非限制本申請(qǐng)。
1.一種音頻降噪方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述將所述目標(biāo)音頻特征作為場(chǎng)景檢測(cè)模型的輸入,得到所述目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)所述目標(biāo)音頻對(duì)應(yīng)的融合特征進(jìn)行分類處理,得到所述目標(biāo)音頻對(duì)應(yīng)的場(chǎng)景類型,包括:
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,在所述獲取目標(biāo)音頻特征之前,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述確定所述目標(biāo)音頻對(duì)應(yīng)的倒譜系數(shù),包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述歷史音頻特征包括第一歷史音頻特征和第二歷史音頻特征,所述第二歷史音頻特征對(duì)應(yīng)的目標(biāo)音頻的采集時(shí)間先于第一歷史音頻特征對(duì)應(yīng)的目標(biāo)音頻的采集時(shí)間,
7.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,所述參考音頻包括音頻采集設(shè)備從對(duì)端設(shè)備處接收到的音頻數(shù)據(jù),所述待降噪音頻是所述音頻采集設(shè)備采集到的,所述降噪后的音頻數(shù)據(jù)包括回聲消除后的音頻數(shù)據(jù),
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,將所述回聲消除后的音頻數(shù)據(jù)作為待處理音頻,所述降噪后的音頻數(shù)據(jù)還包括對(duì)所述待處理音頻進(jìn)行降噪處理得到的目標(biāo)降噪數(shù)據(jù),在所述按照所述回聲消除方式,對(duì)所述待降噪音頻進(jìn)行回聲消除處理,得到所述回聲消除后的音頻數(shù)據(jù)之后,所述方法還包括:
9.根據(jù)權(quán)利要求1至3中任意一項(xiàng)所述的方法,其特征在于,所述方法還包括對(duì)所述場(chǎng)景檢測(cè)模型的訓(xùn)練步驟,所述訓(xùn)練步驟包括:
10.一種電子設(shè)備,其特征在于,包括:存儲(chǔ)器和處理器,其中,所述存儲(chǔ)器存儲(chǔ)有程序指令,所述處理器從所述存儲(chǔ)器調(diào)取所述程序指令以執(zhí)行如權(quán)利要求1-9任一項(xiàng)所述的方法。
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有程序指令,其特征在于,包括:存儲(chǔ)有程序文件,所述程序文件被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如權(quán)利要求1-9任一項(xiàng)所述的方法。