本技術(shù)涉及信號(hào)處理,尤其涉及一種pop音抑制方法、設(shè)備、可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、pop音也被稱為爆音。產(chǎn)生pop音的原因有很多,例如數(shù)據(jù)丟包、風(fēng)噪溢出、短促的敲擊聲、錄音停止時(shí)還存在外界聲音,在信號(hào)尾部錄入了較大的外界聲音、錄音停止時(shí)將按下停止鍵的按鍵聲音錄入音頻文件作為音頻的一部分等等。pop音會(huì)降低信號(hào)的聽感以及質(zhì)量,甚至可能會(huì)對(duì)用戶的耳朵造成潛在傷害。由此,需要抑制信號(hào)中的pop音。
2、然而,傳統(tǒng)的降噪算法通常利用語(yǔ)音的間歇性和噪聲的平穩(wěn)性之假設(shè)來(lái)估計(jì)噪聲的功率譜,進(jìn)而估計(jì)含噪語(yǔ)音信號(hào)的信噪比,并據(jù)此來(lái)進(jìn)行噪聲抑制,然而pop音具有很強(qiáng)的非平穩(wěn)性,傳統(tǒng)的降噪算法無(wú)法有效抑制pop音。
3、因此,如何有效的抑制信號(hào)中的pop音是本技術(shù)領(lǐng)域亟待解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的主要目的在于提供一種pop音抑制方法、設(shè)備、可讀存儲(chǔ)介質(zhì)及計(jì)算機(jī)程序產(chǎn)品,旨在如何有效的抑制信號(hào)中的pop音的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本技術(shù)提供一種pop音抑制方法,所述pop音抑制方法包括:
3、獲取待降噪的預(yù)設(shè)數(shù)量幀原始信號(hào),獲取與所述原始信號(hào)關(guān)聯(lián)的關(guān)聯(lián)信號(hào),確定所述原始信號(hào)與所述關(guān)聯(lián)信號(hào)為目標(biāo)信號(hào),其中,所述關(guān)聯(lián)信號(hào)包括與所述原始信號(hào)相鄰的至少一幀信號(hào);
4、計(jì)算所述原始信號(hào)的第一能量方差,和/或計(jì)算所述目標(biāo)信號(hào)的第二能量方差;
5、若所述第一能量方差小于預(yù)設(shè)閾值和/或所述第二能量方差大于預(yù)設(shè)閾值,則基于所述第一能量方差和/或所述第二能量方差確定增益因子,其中,所述增益因子與所述第一能量方差正相關(guān),和/或所述增益因子與所述第二能量方差負(fù)相關(guān);
6、基于所述增益因子對(duì)所述原始信號(hào)進(jìn)行降噪處理,得到降噪處理結(jié)果。
7、在一實(shí)施中,所述計(jì)算所述原始信號(hào)的第一能量方差的步驟,包括:
8、確定所述原始信號(hào)中在預(yù)設(shè)頻率范圍內(nèi)的信號(hào)頻點(diǎn)為第一信號(hào)頻點(diǎn),計(jì)算各所述第一信號(hào)頻點(diǎn)的第一信號(hào)幅值;
9、計(jì)算所有所述第一信號(hào)幅值的方差,確定所有所述第一信號(hào)幅值的方差為第一能量方差。
10、在一實(shí)施例中,所述計(jì)算所述目標(biāo)信號(hào)的第二能量方差的步驟,包括:
11、確定所述目標(biāo)信號(hào)中在預(yù)設(shè)頻率范圍內(nèi)的信號(hào)頻點(diǎn)為第二信號(hào)頻點(diǎn);
12、對(duì)于每一預(yù)設(shè)頻點(diǎn)組,計(jì)算所述預(yù)設(shè)頻點(diǎn)組中的所有所述第二信號(hào)頻點(diǎn)的第二信號(hào)幅值,計(jì)算所有所述第二信號(hào)幅值的方差,確定所有所述第二信號(hào)幅值的方差為第三能量方差,其中,每一所述預(yù)設(shè)頻點(diǎn)組中包含各所述第二信號(hào)頻點(diǎn)中索引相同的第二信號(hào)頻點(diǎn);
13、計(jì)算所有所述第三能量方差的平均值,確定所有所述第三能量方差的平均值為第二能量方差。
14、在一實(shí)施例中,所述基于所述第一能量方差和所述第二能量方差確定增益因子的步驟,包括:
15、對(duì)于所述原始信號(hào)中的每一信號(hào)頻點(diǎn),基于所述第二能量方差獲取所述信號(hào)頻點(diǎn)對(duì)應(yīng)的第三能量方差;
16、確定所述第三能量方差為第四能量方差,或者,確定所述第三能量方差與預(yù)設(shè)偏置因子的和為第四能量方差;
17、計(jì)算所述第一能量方差與所述第四能量方差之間的方差比值,計(jì)算所述方差比值與預(yù)設(shè)調(diào)整系數(shù)之間的乘積;
18、計(jì)算所述乘積與預(yù)設(shè)固定增益因子之間的和值,基于所述和值確定所述信號(hào)頻點(diǎn)對(duì)應(yīng)增益因子。
19、在一實(shí)施例中,所述基于所述和值確定所述信號(hào)頻點(diǎn)對(duì)應(yīng)的增益因子的步驟,包括:
20、若所述和值小于或等于預(yù)設(shè)下限增益值,則確定所述信號(hào)頻點(diǎn)對(duì)應(yīng)的增益因子為所述預(yù)設(shè)下限增益值;
21、若所述和值大于或等于預(yù)設(shè)上限增益值,則確定所述信號(hào)頻點(diǎn)對(duì)應(yīng)的增益因子為所述預(yù)設(shè)上限增益值;
22、若所述和值小于所述預(yù)設(shè)上限增益值且大于所述預(yù)設(shè)下限增益值,則確定所述和值為所述信號(hào)頻點(diǎn)對(duì)應(yīng)的增益因子。
23、在一實(shí)施例中,所述基于所述增益因子對(duì)所述原始信號(hào)進(jìn)行降噪處理,得到降噪處理結(jié)果的步驟,包括:
24、對(duì)于所述原始信號(hào)中的每一信號(hào)頻點(diǎn),獲取所述信號(hào)頻點(diǎn)對(duì)應(yīng)的增益因子;
25、以各所述信號(hào)頻點(diǎn)對(duì)應(yīng)的所述增益因子對(duì)應(yīng)所述原始信號(hào)進(jìn)行降噪處理,得到降噪處理結(jié)果。
26、在一實(shí)施例中,所述計(jì)算所述原始信號(hào)的第一能量方差,和/或計(jì)算所述目標(biāo)信號(hào)的第二能量方差的步驟,包括:
27、計(jì)算所述原始信號(hào)的第一能量方差,若所述第一能量方差小于預(yù)設(shè)閾值,則計(jì)算所述目標(biāo)信號(hào)的第二能量方差;或者,
28、計(jì)算所述目標(biāo)信號(hào)的第二能量方差,若所述第二能量方差大于預(yù)設(shè)閾值,則計(jì)算所述原始信號(hào)的第一能量方差。
29、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提供一種pop音抑制設(shè)備,所述pop音抑制設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序配置為實(shí)現(xiàn)如上所述的pop音抑制方法的步驟。
30、此外,為實(shí)現(xiàn)上述目的,本技術(shù)還提供一種可讀存儲(chǔ)介質(zhì),所述可讀存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有實(shí)現(xiàn)pop音抑制方法的程序,所述實(shí)現(xiàn)pop音抑制方法的程序被處理器執(zhí)行以實(shí)現(xiàn)如上所述pop音抑制方法的步驟。
31、本技術(shù)還提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述的pop音抑制方法的步驟。
32、本技術(shù)提出的一個(gè)或多個(gè)技術(shù)方案,至少具有以下技術(shù)效果:
33、獲取待降噪的預(yù)設(shè)數(shù)量幀原始信號(hào),獲取與原始信號(hào)關(guān)聯(lián)的關(guān)聯(lián)信號(hào),確定原始信號(hào)與關(guān)聯(lián)信號(hào)為目標(biāo)信號(hào),其中,關(guān)聯(lián)信號(hào)包括與原始信號(hào)相鄰的至少一幀信號(hào);計(jì)算原始信號(hào)的第一能量方差,和/或計(jì)算目標(biāo)信號(hào)的第二能量方差;若第一能量方差小于預(yù)設(shè)閾值和/或第二能量方差大于預(yù)設(shè)閾值,則基于第一能量方差和/或第二能量方差確定增益因子,其中,增益因子與第一能量方差正相關(guān),和/或增益因子與第二能量方差負(fù)相關(guān);基于增益因子對(duì)原始信號(hào)進(jìn)行降噪處理,得到降噪處理結(jié)果??紤]到pop音通常具有短時(shí)性且能量分布均勻的特點(diǎn),而語(yǔ)音因其具有明顯諧波結(jié)構(gòu),故而能量分布并不均勻,同時(shí)在長(zhǎng)時(shí)域上呈現(xiàn)平穩(wěn)性(也即長(zhǎng)時(shí)穩(wěn)定性),如此,本技術(shù)實(shí)施例中計(jì)算原始信號(hào)的第一能量方差,和/或計(jì)算目標(biāo)信號(hào)的第二能量方差,而容易理解地是,第一能量方差為預(yù)設(shè)數(shù)量幀原始信號(hào)的能量方差,由此第一能量方差可以表征原始信號(hào)自身在頻段上的能量分布差異,而第二能量方差為原始信號(hào)以及與原始信號(hào)相鄰的關(guān)聯(lián)信號(hào)的能量方差,由此,第二能量方差可以表征原始信號(hào)與關(guān)聯(lián)信號(hào)之間的能量分布差異,也即原始信號(hào)在時(shí)段上的能量分布差異,而pop音短時(shí)且能量分布均勻的特點(diǎn),其第一能量方差較小,而第二能量方差較大,語(yǔ)音能量分布并不均勻且長(zhǎng)時(shí)穩(wěn)定性的特點(diǎn),其第一能量方差較大,而第二能量方差較小?;诖?,第一能量方差小于預(yù)設(shè)閾值和/或第二能量方差大于閾值時(shí),說(shuō)明原始信號(hào)中可能存在pop音,此時(shí)基于第一能量方差和/或第二能量方差確定增益因子,并基于增益因子對(duì)原始信號(hào)進(jìn)行降噪處理,從而可以有效抑制信號(hào)中的pop音。并且在軟件層面實(shí)現(xiàn)了pop音的抑制,無(wú)需增加額外的硬件電路,且只需計(jì)算能量方差,計(jì)算量少,計(jì)算復(fù)雜度低,降低了pop音的實(shí)現(xiàn)成本,以及便于嵌入式部署。