多格式音頻感知哈希認證的特征值提取及認證方法
【專利摘要】多格式音頻感知哈希認證的特征值提取及認證方法,主要解決現(xiàn)有音頻認證算法認證音頻格式單一、認證算法不通用、認證效率低的問題;本發(fā)明基于雙樹復(fù)小波變換(DT-CWT)原理,首先對預(yù)處理后的音頻信號進行全局雙數(shù)復(fù)小波變換(DT-CWT),提取音頻信號的實小波系數(shù);接著對實小波系數(shù)進行二次差分、分幀,計算幀系數(shù)自然對數(shù)下的和值,作為音頻信號的特征向量;最后對特征向量進行哈希構(gòu)造,生成感知哈希摘要序列,通過哈希匹配實現(xiàn)了對音頻內(nèi)容的快速認證。
【專利說明】多格式音頻感知哈希認證的特征值提取及認證方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于多媒體信息安全領(lǐng)域,具體涉及一種基于雙樹復(fù)小波變換(Dual Tree Complex Wavelet Transform,DT-CWT)的多格式音頻感知哈希認證的特征值提取及認證方 法。
【背景技術(shù)】
[0002] 音頻多媒體通信是多媒體通信技術(shù)的重要組成部分,音頻信息往往包含一些敏感 內(nèi)容和重要信息。然而,無線以及網(wǎng)絡(luò)等通信信道的開放性和多媒體專業(yè)軟件的廣泛使用 使得音頻多媒體信息的內(nèi)容真實性難以得到保證,不真實的信息內(nèi)容越來越難以被證偽。 因此,為保證音頻多媒體信息的可靠通信和內(nèi)容安全,有必要對音頻內(nèi)容真實性和完整性 進行驗證。
[0003] 音頻感知哈希(Audio Perceptual Hashing)認證技術(shù)通過驗證多媒體信息的內(nèi) 容完整性及真實性來保護多媒體信息,它可以檢測出接收到的音頻數(shù)據(jù)在傳送過程中有沒 有經(jīng)過第三方的惡意編輯和篡改,使得多媒體音頻信息服務(wù)更加安全可靠,能較好地實現(xiàn) 對音頻、寬帶音頻等信號的檢索和內(nèi)容完整性認證。
[0004] 目前,音頻感知哈希的研究尚在起步階段,音頻內(nèi)容認證的研究相對較少,應(yīng)用在 音頻通信終端實時認證的設(shè)計更是少之又少。音頻感知哈希認證技術(shù)的關(guān)鍵步驟是感知特 征值提取,它是以人類感知模型為基礎(chǔ),分析提取音頻多媒體對象對于各種內(nèi)容保持操作 的不變量。
[0005] 感知特征值是音頻信號的數(shù)字摘要表達形式,代表音頻信號的數(shù)據(jù),因而所 提取特征值的水平嚴重影響音頻感知哈希的認證。Chen等人(見文獻Chen N, Wan W. Robust Speech Hash Function[J]· ETRI journal, 2010, 32(2):345-347)提 出基于頻率聲道模型參數(shù)的算法Jiao等人(見文獻Jiao Y,Li M,Li Q,et al. Key-dependent compressed domain audio hashing[C]. Intelligent Systems Design and Applications, 2008. ISDA'08. Eighth International Conference on. IEEE, 2008,3: 29-32.)對壓縮域音頻信號的MDCT系數(shù)做處理;Gaikwad等人(見文獻Gaikwad. S. , Gawali, B. , Yannawar, P. , et al. Feature extraction using fusion MFCC for continuous marathi speech recognition[C]. India Conference (INDIC0N), 2011 Annual IEEE,16-18 Dec. 2011,1-5.)提取音頻信號的梅爾倒譜頻率系數(shù)作為特征集; Lotia 等人(見文獻 Lotia P, Khan D M R. Significance of Complementary Spectral Features for Speaker Recognition[J]· IJRCCT, 2013, 2(8): 579-588.)應(yīng)用線性預(yù) 測對音頻信號進行分析。這些感知哈希摘要提取算法都具有一定區(qū)分性和魯棒性,但認 證效率偏低,不能滿足移動通信終端音頻通信的實時性要求。Huang等人(見文獻Huang Y, Zhang Q, Yuan Z. Perceptual Speech Hashing Authentication Algorithm Based on Linear Prediction Analysis[J]. TELK0MNIKA Indonesian Journal of Electrical Engineering, 2014,12 (4) : 3214-3223.)提出E+LPC算法,該算法認證效率高,能滿足移 動通信終端音頻通信的實時性要求,但魯棒性較弱。不僅如此,上述所有音頻認證算法只是 針對單一音頻格式,不具有通用性,且不能實現(xiàn)小范圍篡改檢測。
[0006] DT-CWT保持了傳統(tǒng)的離散小波變換的時頻局部化分析能力,克服了離散小波變換 的缺陷,是一種高計算效率的小波變換形式。音頻信號經(jīng)過DT-CWT所獲得小波系數(shù)受音頻 格式影響較小,在提高時-頻分辨率的同時,其互補性和完整性也使原始信號的信息得到 完整保留。因此,音頻信號的特征信息可由小波系數(shù)完整表達,從而有效而又正確地表現(xiàn)語 音波形及其頻譜的性質(zhì)。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的解決現(xiàn)有音頻認證算法認證音頻格式單一、認證算法不通用、認證 效率低的問題。
[0008] 本發(fā)明是多格式音頻感知哈希認證的特征值提取及認證方法,其步驟為: (1) 對音頻信號^進行預(yù)加重處理; (2) 對預(yù)加重后的信號進行3級DT-CWT,提取樹A的實小波系數(shù); (3) 對實小波系數(shù)< 進行二階差分,獲得差分信號; (4) 對差分信號進行不重疊分幀,幀長為2. 5ms ; (5) 計算幀系數(shù)自然對數(shù)下的和值萬
【權(quán)利要求】
1. 多格式音頻感知哈希認證的特征值提取及認證方法,其步驟為: (1) 對音頻信號^進行預(yù)加重處理; (2) 對預(yù)加重后的信號進行3級DT-CWT,提取樹A的實小波系數(shù); (3) 對實小波系數(shù)< 進行二階差分,獲得差分信號; (4) 對差分信號進行不重疊分幀,幀長為2. 5ms ; (5) 計算幀系數(shù)自然對數(shù)下的和值萬
其中,13;^.是第J幀第i個小波系數(shù),#是實小波系數(shù)的分幀總幀數(shù),#是幀長度; (6) 生成音頻信號特征向量//,開=|;1;五;|;其中,|是序列1的中值; (7) 對向量"進行量化處理,生成感知哈希序列A ; (8) 哈希匹配:按上述步驟先從原始音頻信號中提取出哈希特征向量,將其轉(zhuǎn)換為感知 哈希認證序列A,用同樣的方法計算待測音頻信號感知哈希認證序列F,再將兩者進行匹 配,匹配結(jié)果與閾值相比較; 兩段感知內(nèi)容相同音頻信號的BER值小于匹配閾值,認證通過;相反,感知不同語音的 BER應(yīng)大于匹配閾值,則認證不通過。
2. 根據(jù)權(quán)利要求1所述的多格式音頻感知哈希認證的特征值提取及認證方法,其特征 在于DT-CWT的步驟為: (1) 音頻信號^進行預(yù)加重處理,獲得信號S h ; (2) 信號S h經(jīng)過Q-Shift雙樹濾波器,進行3級DT-CWT,得到樹A的實小波系數(shù)和樹 B的復(fù)小波系數(shù);其中,DT-CWT采用(13, 19)-Tap和(14, 14)-Tap奇/偶濾波器組;
(3) 提取樹A的實小波系數(shù)ψ ^ C? h),記作A。
3. 根據(jù)權(quán)利要求1所述的多格式音頻感知哈希認證的特征值提取及認證方法,其特征 在于,權(quán)利要求1中步驟(4)的分幀和步驟(5)幀特征值計算按如下步驟進行: (1)確定實小波系數(shù)的分幀總幀數(shù)#和幀長度#;實小波系數(shù)< 經(jīng)過二次差分、加窗分 幀處理后,得到的第J'幀的信號為A ^ 為窗函數(shù),則A ^ (?)滿足:
(2)第7幀的特征值萬C/)為:
4. 根據(jù)權(quán)利要求1所述的多格式音頻感知哈希認證的特征值提取及認證方法,其特征 在于感知哈希特征序列生成的步驟為: (1) 計算幀系數(shù)自然對數(shù)下的和值&獲取特征值序列的中值J:,生成哈希特征向量仏 H = [ S'; .£"]; (2) 將音頻信號的特征向量//進行量化處理,生成感知哈希序列A,量化規(guī)則為:
5. 根據(jù)權(quán)利要求1所述的多格式音頻感知哈希認證的特征值提取及認證方法,其特征 在于哈希匹配的步驟為: (1) 計算原始音頻信號的哈希序列,記做A ; (2) 計算待測音頻信號的哈希序列,記做F ; (3) 計算A和F的歸一化漢明距離0(:,:),記做BER:
(4) 設(shè)置匹配閾值τ ; (5) 如果BER小于匹配閾值τ,則原始音頻信號與待測音頻信號感知內(nèi)容相同,認證通 過;否則,不通過。
6. 根據(jù)權(quán)利要求1所述的多格式音頻感知哈希認證的特征值提取及認證方法,其特征 在于小范圍篡改檢測方法的步驟為: (1) 計算原始音頻信號的哈希序列,記做A ; (2) 計算待測音頻信號的哈希序列,記做F ; (3 )計算A和F的失真距離如,
(4) 對失真距離如分塊,塊長度為慫,塊數(shù)為鳥; (5) 計算塊總失真距離切.·
(6) 求取切的最大值ifer,并獲得其鄰近兩個塊總失真距離,記做iferl和ifer2 ; (7) 計算兩個音頻信號的總失真度5?.·
(8) 設(shè)置總失真度匹配閾值切τ,如果測得原始音頻信號與待測音頻信號的總失真度 大于閾值,待測音頻信號為篡改音頻信號;否則,為未篡改音頻信號。
【文檔編號】G06F21/32GK104091104SQ201410312292
【公開日】2014年10月8日 申請日期:2014年7月2日 優(yōu)先權(quán)日:2014年7月2日
【發(fā)明者】張秋余, 省鵬飛, 黃羿博, 楊仲平, 任占偉, 余爽 申請人:蘭州理工大學(xué)