本發(fā)明涉及語音信號處理,具體涉及用于詐騙信號識別的語音信號處理方法及系統(tǒng)。
背景技術(shù):
1、隨著手機等可移動終端設(shè)備的迅速普及,使得個人身份信息暴露于互聯(lián)網(wǎng)中。電話號碼被泄露獲取后,通過電話、短信等通訊形式實現(xiàn)電話騷擾,騙取用戶信任,對正常通訊環(huán)境造成了嚴(yán)重的破壞。
2、通過ai語音識別算法模型可以有效地對詐騙騷擾電話快速鑒別,遏制不良電話通信的發(fā)生頻率。但現(xiàn)有語音識別算法模型中受限于詐騙騷擾電話音頻數(shù)據(jù)樣本質(zhì)量,其識別精度在噪聲場景下出現(xiàn)較大波動。在電話音頻信號去噪處理過程中,通過設(shè)定固定小波閾值進行去噪,導(dǎo)致電話音頻信號噪聲干擾較大,極大地影響了詐騙音頻的準(zhǔn)確識別。
技術(shù)實現(xiàn)思路
1、為了解決以上的技術(shù)問題,本發(fā)明的目的在于提供用于詐騙信號識別的語音信號處理方法及系統(tǒng)。
2、根據(jù)本技術(shù)實施例的第一方面,本技術(shù)提供的用于詐騙信號識別的語音信號處理方法,所采用的技術(shù)方案具體如下:方法包括:
3、采集用戶輸入的語音信號,將所述語音信號轉(zhuǎn)換為語音模擬信號,對所述語音模擬信號進行emd分解,獲得多個imf分量;
4、對每個所述imf分量進行數(shù)據(jù)分段,獲得數(shù)據(jù)段,分析所述imf分量中所有數(shù)據(jù)段的波動特征,獲得所述數(shù)據(jù)段的波動系數(shù);
5、根據(jù)所述波動系數(shù),結(jié)合噪聲數(shù)據(jù)的波動特征,獲得所述imf分量中的疑似噪聲數(shù)據(jù)段;
6、分析所述imf分量中所述疑似噪聲數(shù)據(jù)段的占比情況,獲得所述imf分量的噪聲貢獻度;
7、根據(jù)所述噪聲貢獻度,調(diào)整小波去噪中所述imf分量的小波系數(shù)閾值,確定所述imf分量的自適應(yīng)小波系數(shù)閾值;
8、根據(jù)所述自適應(yīng)小波系數(shù)閾值,對所述imf分量進行小波變換去除噪聲數(shù)據(jù),將去噪后的imf分量進行疊加重構(gòu),得到去噪語音模擬信號。
9、在本發(fā)明的一些實施例中,分析所述imf分量中所有數(shù)據(jù)段的波動特征,獲得所述數(shù)據(jù)段的波動系數(shù),包括:
10、分析所述數(shù)據(jù)段中所有相鄰特征點的特征值的差異特征,獲得相鄰特征點平均差異;
11、分析所述數(shù)據(jù)段中所有特征點的特征值與所有特征點的特征值均值的差異,獲得所述數(shù)據(jù)段中特征點的離散程度;
12、對所述數(shù)據(jù)段中所有特征點進行stl殘差分解,獲得所述數(shù)據(jù)段中所有特征點的stl殘差均值;
13、根據(jù)所述相鄰特征點平均差異、所述離散程度、所述stl殘差均值,獲得所述數(shù)據(jù)段的波動系數(shù)。
14、在本發(fā)明的一些實施例中,所述波動系數(shù)的計算公式為:
15、
16、式中,表示第個imf分量中第個數(shù)據(jù)段的波動系數(shù),表示第個imf分量中第個數(shù)據(jù)段中第個特征點的特征值大小,表示第個imf分量中第個數(shù)據(jù)段中第個特征點的特征值大小,表示第個imf分量中第個數(shù)據(jù)段中特征點的個數(shù),表示第個imf分量中第個數(shù)據(jù)段中所有特征點的特征值大小均值,表示第個imf分量中第個數(shù)據(jù)段中第個特征點的stl殘差值,表示歸一化函數(shù)。
17、在本發(fā)明的一些實施例中,根據(jù)所述波動系數(shù),結(jié)合噪聲數(shù)據(jù)的波動特征,獲得所述imf分量中的疑似噪聲數(shù)據(jù)段,包括:
18、分析所述imf分量中一個數(shù)據(jù)段的波動系數(shù)與其他所有數(shù)據(jù)段的波動系數(shù)的差異特征,獲得所述數(shù)據(jù)段的波動差異;
19、通過ampd方法檢測所述數(shù)據(jù)段中的極值點,統(tǒng)計所述極值點的數(shù)量,根據(jù)所述極值點的數(shù)量,結(jié)合所述數(shù)據(jù)段的持續(xù)時間與對應(yīng)的所述imf分量中所有數(shù)據(jù)段的持續(xù)時間的最小值的差值,獲得所述數(shù)據(jù)段的波動頻繁性;
20、分析所述數(shù)據(jù)段的極差與對應(yīng)的所述imf分量中所有數(shù)據(jù)段的極差均值的關(guān)系,獲得所述數(shù)據(jù)段的相對極差;
21、根據(jù)所述波動差異、所述波動頻繁性、所述相對極差,獲得所述數(shù)據(jù)段的噪聲可能性;
22、根據(jù)所述噪聲可能性,獲得所述imf分量中的疑似噪聲數(shù)據(jù)段。
23、在本發(fā)明的一些實施例中,所述噪聲可能性的計算公式為:
24、
25、式中,表示第個imf分量中第個數(shù)據(jù)段的噪聲可能性,表示第個imf分量中第個數(shù)據(jù)段的波動系數(shù),表示第個數(shù)據(jù)段所處的第個imf分量的其他數(shù)據(jù)段中第個數(shù)據(jù)段的波動系數(shù),表示第個imf分量中存在的數(shù)據(jù)段數(shù)量,表示第個imf分量的第個數(shù)據(jù)段中存在的極值點的個數(shù),表示第個imf分量中第個數(shù)據(jù)段的持續(xù)時間,表示第個imf分量中所有數(shù)據(jù)段持續(xù)時間的最小值,表示第個imf分量中第個數(shù)據(jù)段的極差大小,表示第個imf分量中所有數(shù)據(jù)段極差的平均值,表示歸一化函數(shù)。
26、在本發(fā)明的一些實施例中,所述數(shù)據(jù)段的極差為所述數(shù)據(jù)段中所有特征點的特征值的最大值與最小值的差值。
27、在本發(fā)明的一些實施例中,所述imf分量的噪聲貢獻度為:所述imf分量中所有疑似噪聲數(shù)據(jù)段的持續(xù)時長之和與所述imf分量的總持續(xù)時長的比值。
28、在本發(fā)明的一些實施例中,所述自適應(yīng)小波系數(shù)閾值為,根據(jù)所述imf分量中最大的小波系數(shù)與最小的小波系數(shù)差值,將所述imf分量的噪聲貢獻度作為所述小波系數(shù)差值的權(quán)重值,確定所述imf分量的自適應(yīng)小波系數(shù)閾值。
29、根據(jù)本技術(shù)實施例的第二方面,提供的用于詐騙信號識別的語音信號處理系統(tǒng),所述系統(tǒng)包括:存儲器和處理器,其中:
30、所述存儲器,用于存儲程序代碼;
31、所述處理器,用于讀取所述存儲器中存儲的程序代碼,并執(zhí)行任一項所述的方法。
32、在本發(fā)明的一些實施例中,所述處理器包括:
33、語音識別模塊,用于采集用戶輸入的語音信號,將所述語音信號轉(zhuǎn)換為語音模擬信號,對所述語音模擬信號進行emd分解,獲得多個imf分量;
34、波動系數(shù)模塊,用于對每個所述imf分量進行數(shù)據(jù)分段,獲得數(shù)據(jù)段,分析所述imf分量中所有數(shù)據(jù)段的波動特征,獲得所述數(shù)據(jù)段的波動系數(shù);
35、疑似噪聲數(shù)據(jù)段模塊,用于根據(jù)所述波動系數(shù),結(jié)合噪聲數(shù)據(jù)的波動特征,獲得所述imf分量中的疑似噪聲數(shù)據(jù)段;
36、噪聲貢獻度模塊,用于分析所述imf分量中所述疑似噪聲數(shù)據(jù)段的占比情況,獲得所述imf分量的噪聲貢獻度;
37、自適應(yīng)小波系數(shù)閾值模塊,用于根據(jù)所述噪聲貢獻度,調(diào)整小波去噪中所述imf分量的小波系數(shù)閾值,確定所述imf分量的自適應(yīng)小波系數(shù)閾值;
38、去噪語音模擬信號模塊,用于根據(jù)所述自適應(yīng)小波系數(shù)閾值,對所述imf分量進行小波變換去除噪聲數(shù)據(jù),將去噪后的imf分量進行疊加重構(gòu),得到去噪語音模擬信號。
39、相較于現(xiàn)有技術(shù),本發(fā)明提供的用于詐騙信號識別的語音信號處理方法及系統(tǒng),具有如下有益效果:
40、本發(fā)明通過采集用戶輸入的語音信號,將所述語音信號轉(zhuǎn)換為語音模擬信號,對所述語音模擬信號進行emd分解,獲得多個imf分量;對每個所述imf分量進行數(shù)據(jù)分段,獲得數(shù)據(jù)段,分析所述imf分量中所有數(shù)據(jù)段的波動特征,獲得所述數(shù)據(jù)段的波動系數(shù);根據(jù)所述波動系數(shù),結(jié)合噪聲數(shù)據(jù)的波動特征,獲得所述imf分量中的疑似噪聲數(shù)據(jù)段;分析所述imf分量中所述疑似噪聲數(shù)據(jù)段的占比情況,獲得所述imf分量的噪聲貢獻度;根據(jù)所述噪聲貢獻度,調(diào)整小波去噪中所述imf分量的小波系數(shù)閾值,確定所述imf分量的自適應(yīng)小波系數(shù)閾值;根據(jù)所述自適應(yīng)小波系數(shù)閾值,對所述imf分量進行小波變換去除噪聲數(shù)據(jù),將去噪后的imf分量進行疊加重構(gòu),得到去噪語音模擬信號。本發(fā)明優(yōu)化了現(xiàn)有采用的固定小波閾值去噪時由于閾值選取不合適導(dǎo)致噪聲去除不準(zhǔn)確的問題,通過對模擬信號進行emd分解得到多個分量,使得噪聲信號在每個分量中更直觀的表現(xiàn)出來,然后對每個分量分析其數(shù)據(jù)波動情況確定可能存在的噪聲數(shù)據(jù)并計算噪聲貢獻度,根據(jù)噪聲貢獻度的大小自適應(yīng)確定小波系數(shù)的閾值,從而更準(zhǔn)確的去除可能的噪聲,為詐騙電話的精準(zhǔn)識別提供了高質(zhì)量的語音信號。