專利名稱:用于減少對(duì)非期望消息的接收的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通過應(yīng)用特征模板來減少對(duì)非期望消息的接收的方法和系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)電話(VoiceoverIP,網(wǎng)絡(luò)電話,簡稱VoEP)的普及,VoIP用戶M^越多地暴露于所謂SPIT之下(SPIT: SPAM over Internet Telephony,垃圾
網(wǎng)絡(luò)電話)。目前,打往傳統(tǒng)PSTN用戶(PSTN:公眾交換電話網(wǎng))的廣告電話,通??偸怯芍鹘蟹街Ц顿M(fèi)用。而基于不同的計(jì)費(fèi)模式,主叫方可以幾乎免費(fèi)地呼叫VoEP用戶,這在未來可能引發(fā)大量的SPIT來電。尤其是,批量發(fā)送錄帝附的語音文件這種可能性,對(duì)于廣告運(yùn)營方來說是有吸引力的。可以由此推斷,涉及到的VoIP用戶將要求他們相應(yīng)的VoIP供應(yīng)商采取適當(dāng)措施,以防止非期望的來電。
作為對(duì)抗SPIT的措施,首先使用所謂的白名單(英語White lists)和黒名單(英語Blacklists)。對(duì)于用戶X來說,白名單包括時(shí)定于用戶的信息,該信息是關(guān)于在通信網(wǎng)絡(luò)中其他那些被分級(jí)為可靠的、并且因此被許可呼叫用戶X的用戶Y的。與此相反,黒名單包括特定于用戶的信息,該信息是關(guān)于在通信網(wǎng)絡(luò)中其i魁陛被分級(jí)為不可靠的、并且因此不被許可呼叫用戶X的用戶Y的。
然而,借助白名單和黒名單幫助的SPIT保護(hù),在未知用戶第一次進(jìn)行呼叫的情況下是無效的,這是因?yàn)樵谶@種情況下該未知用戶的特定于用戶的數(shù)據(jù)既不可能包括在被呼叫用戶的白名單中也不可能包括在黒名單中。
此外可以考慮,基于消息與之前被識(shí)別為SPIT消息的相似性,該消息也可以被歸類為SPIT。如果一個(gè)消息經(jīng)常出現(xiàn),另卩么這同樣是對(duì)于非期望消息的強(qiáng)烈標(biāo)志。
然而在此,精確的比較,例如以在代表了待比較的消息的比特流層面上的純粹比較的方式,并不能達(dá)到目標(biāo),這是因?yàn)楸缓艚蟹讲荒苈牭降妮p微改變,例如通過重新編碼或者在消息開始時(shí)的偶然延遲,可能會(huì)導(dǎo)致被比較的消息之
4間的差別。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是,構(gòu)造一種方法和一種系統(tǒng),使得減少在通信網(wǎng)絡(luò)中對(duì)不期望消息的接收。
該技術(shù)問S131權(quán)利要求1和6在方法方面的特征以及通過權(quán)利要求7在系統(tǒng)方面的特征來解決。在從屬權(quán)利要求中規(guī)定了本發(fā)明的改進(jìn)實(shí)施方式。
本發(fā)明的主題是用來確定語音消息的特征模板的方法,其中,所述語音消息以M掃描產(chǎn)生的經(jīng)過數(shù)字編碼的音頻信號(hào)的形式存在。該方法至少包括下列用于基于所述經(jīng)過數(shù)字編碼的音劍言號(hào)來確定特征模板的步驟在第一步驟中,在對(duì)音頻信號(hào)應(yīng)用適當(dāng)?shù)男盘?hào)濾波器的過程中,尤其是在應(yīng)用帶通濾波器
的過程中,m濾除不重要的頻率范圍來抑制音鵬號(hào)的非語音部分。
在第二步驟中,應(yīng)用映射規(guī)則(SQR)以倒每所述經(jīng)過數(shù)字編碼的音頻信號(hào)的所有成分都映射到正數(shù)的范圍內(nèi)。
在第三步驟中,對(duì)音頻信號(hào)的表征所述掃描的掃描率進(jìn)行匹配。
在第四步驟中,關(guān)于最大值和平均值對(duì)通過匹配該掃描率產(chǎn)生的新的值域進(jìn)行標(biāo)準(zhǔn)化,所述值域是經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分的值域。
此外,本發(fā)明還涉及一種用于執(zhí)行所述方法的系統(tǒng)以及設(shè)備和相應(yīng)的通信網(wǎng)絡(luò)。
本發(fā)明帶來了這樣的優(yōu)點(diǎn),即 >了對(duì)非期望消息的接收。
在圖中示出本發(fā)明的一個(gè)實(shí)施例,下面詳細(xì)說明該實(shí)施例。附圖中
圖1示出用于為消息M產(chǎn)生特征模板FP的框亂
圖2示出借助附加的微分器DA來產(chǎn)生特征模板FP的變形方式;圖3示出借助附加的閾值熗波器SWF和樣本計(jì)數(shù)器SZ來產(chǎn)生特征模板FP的變形方式;
圖4示出對(duì)兩個(gè)消息Ml 、 M2的兩個(gè)待征模板FP1 、 FP2的比較。
具體實(shí)施例方式
根據(jù)本發(fā)明,針對(duì)消息M確定特征模板FP。消息M在此是通信網(wǎng)絡(luò)、例如網(wǎng)絡(luò)電話通信網(wǎng)絡(luò)中的語音消息。在此,消息M表現(xiàn)為M掃描產(chǎn)生的經(jīng)過數(shù)字編碼的音頻信號(hào)的形式。本發(fā)明的方法的特征在于多個(gè)步驟,在執(zhí)行這些步驟的過程中,基于經(jīng)過數(shù)字編碼的音劍言號(hào)來確定特征模板FP。在此,對(duì)特
征模板FP的確定是不可逆的,因此基于特征模板FP不能重建消息M。
所確定的特征模板FP例如可以被存儲(chǔ),和/或?yàn)榱吮乓徊教幚矶粋鬏數(shù)轿?br>
于通信網(wǎng)絡(luò)之內(nèi)或之外的部件。此外,可以將所確定的特征模板FP與第二消息
M的第二特征,M FP進(jìn)行比較,并確定這兩個(gè)消息在內(nèi)容方面是否是相同的。圖1示出用于根據(jù)消息M產(chǎn)生特征模板FP的框圖。下面闡述在框圖中示
出的步驟。
首先,在第一步驟中,在向音頻信號(hào)應(yīng)用適當(dāng)?shù)男盘?hào)濾波器的過程中,通過濾除不重要的頻率范圍來抑制音頻信號(hào)糊瞎音部分。在此,尤其有利的是應(yīng)用帶通濾波器BPF,這是因?yàn)閹V波器BPF主要是不會(huì)改變對(duì)于語音重要的頻率范圍,然而卻盡可能地濾除了非語音部分。
在第二步驟中,應(yīng)用映射規(guī)則SQR來將經(jīng)過數(shù)字編碼的音頻信號(hào)(英語samples (樣本))的所有成分都Wt到正數(shù)的范圍內(nèi)。映射指令SQR itt表現(xiàn)為例如平方值模i央或者絕對(duì)值模塊在平方值模塊的情況下,經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分都將被平方,而在纟M值模塊的情況下,針對(duì)經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分形成相應(yīng)的絕對(duì)值。
在第三步驟中, <昔助加法模塊AS "音頻信號(hào)的表征掃描的掃描率進(jìn)行匹配。加法模塊AS逐步地將經(jīng)過數(shù)字編碼的音頻信號(hào)中的一些成分組合起來,從而導(dǎo)致了音頻〗言號(hào)的掃描率被改變。每秒鐘組合的樣本數(shù)量n是可調(diào)節(jié)的。
在第四步驟中,借助標(biāo)準(zhǔn)化器(Nomiierer) RA,關(guān)于最大值和平均值對(duì)通過匹配掃描率所產(chǎn)生的新的值域進(jìn)行標(biāo)準(zhǔn)化,所述值域是經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分的值域。標(biāo)準(zhǔn)化器RA ttW音頻信號(hào)的樣本進(jìn)行線性變換,使得標(biāo)準(zhǔn)化到最大值為1而平均值為0。
在所示方法之后緊接著輸出經(jīng)過數(shù)字編碼的音頻信號(hào)的所有經(jīng)過改變的成分。所示方法的結(jié)果是在-1和1之間的數(shù)字序列,這,字表示消息M的特征模板FP。
上述步驟的次序是可以改變的,并不限于所示的次序。尤其是步驟可以被省略、重排次序或者多次執(zhí)行。
在本發(fā)明的另一表現(xiàn)形式中,在附加的限制步驟中,所述音頻信號(hào)的持續(xù)
6時(shí)間郷艮偉贓預(yù)定范圍內(nèi),其中,所述限制步驟肯嫩在所述方法的任意位置被執(zhí)行。這種長度限制m在這些步驟的次序中盡早地實(shí)現(xiàn),以便將后續(xù)步驟中的計(jì)算開銷最小化。
在本發(fā)明的另一表現(xiàn)形式中,在應(yīng)用帶通濾波器BPF之前先去除音zMt號(hào)
的直流分量(Gleichanteil),其中,該直流分量表現(xiàn)為該音頻信號(hào)的長時(shí)間平均值。
圖2示出用附力啲微分器DA來產(chǎn)生特征模板FP的變形方式。微分器DA針對(duì)樣本序列Xi, H、 2、 ...、 N,提供第二樣本序列ypxj+l-xi, H、 2、 ...N-l。通過這種方式,代替使用單個(gè)時(shí)間段內(nèi)的能量,將一個(gè)時(shí)間段內(nèi)的能量相對(duì)于下一個(gè)時(shí)間段內(nèi)能量的改變用作評(píng)估參數(shù)(Bewertungsgr5i3e)。通過應(yīng)用微分器DA,有利地得到了抵抗疊加干擾的魯棒性,所述疊加干擾例如是音量恒定的干擾信號(hào)。如圖2所示,微分器的應(yīng)用優(yōu)選是在加法模塊AS的應(yīng)用之后或者是在標(biāo)準(zhǔn)化器RA的應(yīng)用之后。
圖3示出用附加的閾值濾波器SWF和樣本計(jì)數(shù)器SZ來產(chǎn)生特征l嫩FP的一種變形方式。ilil應(yīng)用閾值濾波器SWF把低于臨界值的所有樣本it;人音頻信號(hào)中濾出。樣本計(jì)數(shù)器SZ的應(yīng)用保證了,產(chǎn)生特征模板的樣本數(shù)量是正確的。通過這種方式,例如可以將音頻信號(hào)的非常低聲的部分濾出??梢栽谇笆龇椒ǖ娜我馕恢锰帒?yīng)用閾值濾波器SWF和樣本計(jì)數(shù)器SZ。閾值濾波器SWF的應(yīng)用tm是在帶通濾波器BPF的應(yīng)用之后并且在標(biāo)準(zhǔn)化器RA的應(yīng)用之前以及在可能的微分器DA的應(yīng)用之前。
圖4示出對(duì)兩個(gè)消息M1、 M2的兩個(gè)待征模板FP1、 FP2的比較。本發(fā)明的方法使得基于計(jì)算得出的第一特征模板FP1的第一消息M1可以與第二消息M2的第二特征模板FP2進(jìn)行比較。M這種方式可以確定這兩個(gè)消息Ml、M2在內(nèi)容方面是否相同或者是否近似相同。
對(duì)于將第二消息M2的第二特征模板FP2與第一消息Ml的第""^寺征模板FP1比較而言,可以確定這兩^hf寺征模板的互相關(guān)函數(shù)c(k)。對(duì)于這兩個(gè)數(shù)列sl(i)和s2(j)來說,按照下述方式來定義函數(shù)c(k),其中這兩個(gè)數(shù)列分別te^第一消息和第二消息的樣本如果相關(guān)函數(shù)c(k)的結(jié)果fMl了預(yù)定的閾值,那么這些消息就被歸類為相
同的消息。否則,這些消息被評(píng)定為不相同的消息。
在本發(fā)明的另一表現(xiàn)形式中,可以根據(jù)c(k)的最大值推導(dǎo)得到這兩個(gè)消息Ml、 M2的連續(xù)的或者是多級(jí)的一致性程度。在這里,連續(xù)的一致性程度具有無窮多的中間級(jí),而多級(jí)的一致性程度只具有有限數(shù)量的中間級(jí)。
在本發(fā)明的另一表現(xiàn)形式中,為了確定兩個(gè)消息M1、 M2的一致性程度,也可以使用在互相關(guān)函數(shù)c(k)的最大值和自相關(guān)函數(shù)(第一消息Ml的特征模板與其自身相關(guān))的最大值C0之間的比值C1/C0。
在本發(fā)明的另一表現(xiàn)形式中,可以從系統(tǒng)中存儲(chǔ)的其他消息的自相關(guān)函數(shù)和互相關(guān)函數(shù)中確定出與相關(guān)函數(shù)c(k)有關(guān)的預(yù)定閾值或者用于多級(jí)分類的參考值。
本發(fā)明的方法是有效的,這是因?yàn)橄的特征模板FP僅包含較小的數(shù)據(jù)量。ffiil這種方式,基于消息M的特征空間被大幅度縮減。每個(gè)特征模板FP的較小的數(shù)據(jù)量允許例如非常有效地在通信系統(tǒng)內(nèi)存儲(chǔ)和/劍每特征模板FP繼
續(xù)傳輸。與逐個(gè)比特地比較消息m或者比m:接從消息m的音頻信號(hào)推導(dǎo)出
的值例如哈希值不同,本發(fā)明的方法皿合用于比較被彼此不相關(guān)地一例如在經(jīng)由模擬語音網(wǎng)絡(luò)傳輸之后或者在對(duì)消息重新編碼之后一數(shù)字化的消息。此外,根據(jù)本發(fā)明的方法在消息M的各種變形方式中對(duì)一定程度疊加的干擾噪聲是不敏感的。育^安全且魯棒地識(shí)別內(nèi)容相同或近似相同的消息M。即使是在兩個(gè)消息M1、 M2差別較小的情況下,例如不同的稱呼或者在這兩個(gè)消息M1、 M2的一個(gè)消息中插入很小的個(gè)性化部分,也能夠可靠地識(shí)別出在內(nèi)容方面基本相同的消息。因此該方法肖,確定這兩個(gè)消息M1、 M2很可能攜帶相同的語音信息。在此,可以通過匹配數(shù)據(jù)率以及通過限制音頻信號(hào)的長度來影響得到的特征模板FP1、 FP2的大小。
本發(fā)明的另一個(gè)優(yōu)點(diǎn)在于,盡管消息Ml的特征模板FP1適合于與第二消息M2的第二特征模板FP2進(jìn)行比較,但是人們根據(jù)特征模板FP1 、 FP2無法再逆運(yùn)算得到原始的語音消息。只有這樣該方法才能在分布式分析系統(tǒng)中使用,在該分布式分析系統(tǒng)中,以比較為目的在通信網(wǎng)絡(luò)中傳輸特征模板,而不會(huì)出現(xiàn)接收方能夠由此獲得原》維音消息的情況。
在本發(fā)明的一個(gè)表現(xiàn)形式中,本發(fā)明的方法是由語音信箱服務(wù)器執(zhí)行的。在本發(fā)明的另一表現(xiàn)形式中,本發(fā)明的方法是在通信網(wǎng)絡(luò)中由至少一個(gè)客 戶端和至少一個(gè)服務(wù)器執(zhí)行的,其中該客戶端執(zhí)行對(duì)消息M的特征模板FP的
確定,而該服務(wù)^^行對(duì)不同消息M的特征模板FP的比較。在此,客戶端例 如是基于網(wǎng)絡(luò)的語音信箱系統(tǒng)或者諸如呼叫應(yīng)答機(jī)的終端設(shè)備。該服務(wù)器例如 由網(wǎng)絡(luò)運(yùn)營商在電話答錄* 務(wù)范圍內(nèi)來提供。可替換地,該服務(wù)器也可以由 獨(dú)立的運(yùn)營商來提供。
9
權(quán)利要求
1. 一種用于確定語音消息(M)的特征模板(FP)的方法,其中,所述語音消息(M)以通過掃描產(chǎn)生的經(jīng)過數(shù)字編碼的音頻信號(hào)的形式存在,其特征在于,該方法至少包括以下用于基于所述經(jīng)過數(shù)字編碼的音頻信號(hào)來確定所述特征模板(FP)的步驟-在第一步驟中在對(duì)音頻信號(hào)應(yīng)用適當(dāng)?shù)男盘?hào)濾波器的過程中,尤其是在應(yīng)用帶通濾波器(BPF)的過程中,通過濾除不重要的頻率范圍來抑制音頻信號(hào)的非語音部分;-在第二步驟中應(yīng)用映射規(guī)則(SQR)以便將所述經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分都映射到正數(shù)的范圍內(nèi);-在第三步驟中對(duì)音頻信號(hào)的表征所述掃描的掃描率進(jìn)行匹配;-在第四步驟中關(guān)于最大值和平均值對(duì)通過匹配掃描率所產(chǎn)生的新的值域進(jìn)行標(biāo)準(zhǔn)化,所述值域是經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分的值域。
2. 根據(jù)權(quán)利要求1所述的方法, 其特征在于,-所述這些步驟的7:^是可變的;禾口/或 -倉,瑕撾或者重復(fù)應(yīng)用一個(gè)或多個(gè)步驟;禾口/或 -對(duì)所述特征模板(FP)的確定是不可逆的。
3. 根據(jù)權(quán)禾腰求l或2所述的方法,其特征在于,在附加的限制步驟中,將所述音頻信號(hào)的持續(xù)時(shí)間被限制在預(yù)定范圍內(nèi), 其中,所述限制步驟能夠在所述方法的任意位置被執(zhí)行。
4. 根據(jù)前面任何一項(xiàng)權(quán)利要求所述的裝置,其特征在于,在附加的求微分步驟中,借助微分器DA針對(duì)代表音頻信號(hào)的樣本序列Xi, H、 2、…、N確定出第二樣本序列y產(chǎn)xw-x,, i=l、 2、 ...N-l,從而代替音^f言 號(hào)的所述絕對(duì)樣本值,而使用兩個(gè)連續(xù)的樣本值之間的差來確定所述特征模板 (FP),其中,所述求微分步驟育,在所述方法的任意位置執(zhí)行。
5. 根據(jù)前面任何一項(xiàng)權(quán)利要求所述的裝置, 其特征在于,在抑制音Mt號(hào)的非語音部分之前,將該音劍言號(hào)的直流分量去除,其中, itt流分量^該音頻信號(hào)的長時(shí)間平均值。
6. —種在內(nèi)容方面比較語音消息(Ml、 M2)的方法,-在該方法中,在第一步驟中,按照權(quán)利要求1為第一語音消息(Ml)確定 第一特征模板(FPO;并且-在該方法中,在第二步驟中,按照權(quán)利要求1為第二語音消息(M2)確定 第二特征模板(FP2);并且-在該方法中,借助互相關(guān)函數(shù)(c(k))來對(duì)所述第一特征模板和第二特征 模板(FP1、 FP2)進(jìn)行比較;-其中,當(dāng)所述互相關(guān)函數(shù)(c(k))的結(jié)果集合中的至少一個(gè)OT過了預(yù)定 閾值時(shí),所述第一語音消息和第二語音消息(M、 M2)就它們的內(nèi)容而言被評(píng) 定為是相同的。
7. —種用于識(shí)別近似相同的語音消息(Ml、 M2)的系統(tǒng),所述系統(tǒng)具有用 于按照權(quán)利要求6的方法在內(nèi)容方面對(duì)所述語音消息(M、 M2)進(jìn)行比較的裝 置。
8. —種通信網(wǎng)絡(luò),所m信網(wǎng)絡(luò)具有至少一個(gè)根據(jù)權(quán)利要求7所述的系統(tǒng)。
9. 根據(jù)權(quán)利要求8所述的通信網(wǎng)絡(luò),其中,所艦信網(wǎng)絡(luò)是網(wǎng)絡(luò)電話通信 網(wǎng)絡(luò)。
10. —種語音信箱服務(wù)器,所述的語音信箱服務(wù)器具有用于執(zhí)行根據(jù)權(quán)利要 求l所述的方法的裝置。
11. 一種客戶端,所述客戶端具有用于根據(jù)權(quán)利要求1來確定消息(M)的 特征模板(FP)的體。
12. —種服務(wù)器,所述服務(wù)器具有用于根據(jù)權(quán)利要求6在內(nèi)容方面對(duì)語音消 息(M、 M2)進(jìn)行比較的裝置。
13. —種根據(jù)權(quán)利要求6所述的方法在通信網(wǎng)絡(luò)中的應(yīng)用。
14. —種根據(jù)權(quán)利要求6所述的方法在VoIP通信網(wǎng)絡(luò)中的應(yīng)用。
全文摘要
本發(fā)明的主題是一種用來確定語音消息的特征模板的方法,其中所述語音消息以通過掃描產(chǎn)生的經(jīng)過數(shù)字編碼的音頻信號(hào)的形式存在。為了基于所述經(jīng)過數(shù)字編碼的音頻信號(hào)來確定特征模板,該方法至少包括下列步驟在第一步驟中,在對(duì)音頻信號(hào)應(yīng)用適當(dāng)?shù)男盘?hào)濾波器的過程中,尤其是在應(yīng)用帶通濾波器的過程中,通過濾除不重要的頻率范圍來抑制音頻信號(hào)的非語音部分。在第二步驟中,應(yīng)用映射規(guī)則(SQR)以便將所述經(jīng)過數(shù)字編碼的音頻信號(hào)的所有成分都映射到正數(shù)的范圍內(nèi)。在第三步驟中,匹配音頻信號(hào)的表征所述掃描的掃描率。在第四步驟中,關(guān)于最大值和平均值對(duì)通過匹配掃描率所產(chǎn)生的新的值域進(jìn)行標(biāo)準(zhǔn)化,所述值域是經(jīng)過數(shù)字編碼的音頻信號(hào)的全部成分的值域。此外,本發(fā)明還涉及一種用于執(zhí)行所示方法的系統(tǒng)以及設(shè)備和相應(yīng)的通信網(wǎng)絡(luò)。
文檔編號(hào)G10L21/02GK101490742SQ200780026502
公開日2009年7月22日 申請(qǐng)日期2007年7月13日 優(yōu)先權(quán)日2006年7月13日
發(fā)明者J·查辛斯基 申請(qǐng)人:諾基亞西門子通信有限責(zé)任兩合公司