欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

“指紋”的提取的制作方法

文檔序號:2821118閱讀:1566來源:國知局
專利名稱:“指紋”的提取的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及從媒體信號中提取“指紋”的方法和裝置。
背景技術(shù)
“指紋”,一般也稱作簽名或者雜亂的信號,是從多媒體內(nèi)容,比如歌曲,圖象圖片,一個視頻片斷等中提取的比特序列。多媒體“指紋”特別是在鑒別領(lǐng)域,在需要時可以用來識別所接收到的內(nèi)容是否為原始內(nèi)容,或者探測內(nèi)容是否被篡改。“指紋”也常常被用來識別媒體內(nèi)容。一個在不遠的將來即將流行的服務就是音頻識別。從一段未知的音樂中提取的“指紋”被發(fā)送到一個可以查閱音樂的名稱,音樂家的名字和其他元數(shù)據(jù)的數(shù)據(jù)庫,然后再返回的消費者。
一個已知的從媒體信號中提取指紋的方法在申請人的編號為WO02/065782國際專利申請中被披露。這一現(xiàn)有技術(shù)的方法顯示在

圖1中。這個媒體信號(這里的是一首歌)被分成疊加的幀(101)。每一幀的頻譜表示通過一個快速傅里葉變換(102)而獲得。子頻帶中對數(shù)間隔的音頻信號的能量隨后被計算出來(103)。在300-200赫茲范圍內(nèi)的頻帶是可感知的最相關(guān)范圍。該33的能量級構(gòu)成了一相應音頻信號幀的可感知特性樣本的一個序列。為了相對音頻信號的絕對音量不變化和阻止一個主單音頻為連續(xù)幀生成相同序列,一個簡單的2維濾波器(104)被用于在獲得32個差分特性樣本前的頻譜圖上。該序列隨后被一個適當?shù)拈撝挡僮?105)轉(zhuǎn)換成一些比特串(105)。更具體的,一個特定幀的一個子頻帶,如果與相鄰子頻帶的能量差不同大于與它相鄰的前面一幀中子頻帶的能量差,則被分配比特“1”。否則,指紋比特是“0”。
該已知的方法為每一個音頻幀生成一個32比特的字符串(約等于0.4秒)。這些幀最好重疊(例如系數(shù)31/32),因此比特串隨著時間緩慢改變。這樣指紋的提取不會隨著時間偏移和幀邊界定位的變化而變化。具有代表性的,256個重疊幀的塊,即256×32=8192b比特(約等于3秒的音頻)被用來識別一首歌。
現(xiàn)有技術(shù)的指紋提取方法相對于所有普遍使用的音頻處理步驟已經(jīng)非常穩(wěn)固,如MP3編碼,抽樣率的變換,數(shù)字與模擬間的轉(zhuǎn)換,均衡。但是,它相對速度變化卻不穩(wěn)固。廣播電臺加快幾個百分點的播放速度是很普遍的。這樣做應該有兩個原因。第一,歌曲的播放時間會更短,因此可以讓他們能播放更多的商業(yè)內(nèi)容。第二,這些歌曲的節(jié)拍會快一些,而且聽眾看起來喜歡這樣。這種速度的變化一般在0-4%之間。
發(fā)明目的和概述本發(fā)明的目的之一是提供一個改進的從媒體信號中提取指紋的方法和裝置。
根據(jù)本發(fā)明,為了實現(xiàn)這個目的,提取方法包含從媒體信號獲得信號的給定的可感知特性的樣本序列;將特性樣本施加一個自動相關(guān)函數(shù),以獲得一自動相關(guān)值序列;把這個自動相關(guān)值與各自的閾值比較;通過各自的指紋比特表現(xiàn)這個比較的結(jié)果。
本發(fā)明的提取方法與現(xiàn)有技術(shù)的指紋提取方法不同,本發(fā)明的指紋比特不是從信號的可感知特性上獲得,而是從所述特性的自動相關(guān)獲得的。本發(fā)明是根據(jù)一種認知,即音頻信號的速度變化導致子頻帶中的能量級從一個子頻帶轉(zhuǎn)移到另一個子頻帶,并且利用了自動相關(guān)函數(shù)偏移不變的特性。
該自動相關(guān)函數(shù)在一個持續(xù)的時間域內(nèi)是眾所周知的。但是,我們這里要解決的是有限的特性值序列(如能量水平)。因此,根據(jù)本發(fā)明的方法的一個實際應用的具體實施例,預期的自動相關(guān)是通過將一個特性樣本子序列和特性樣本的完整序列相關(guān)來近似的。
該自動相關(guān)函數(shù)最好是通過大量的大于預期指紋比特量的特性樣本量被計算出的。被計算出的自動相關(guān)函數(shù)的下采樣被用來獲得預期的自動相關(guān)數(shù)值。
附圖簡述圖1示意性地顯示現(xiàn)有技術(shù)從音頻信號提取指紋的方案。
圖2示意性地現(xiàn)實根據(jù)本發(fā)明從音頻信號中提取指紋的方案。
具體實施例一個音頻信號的速度變化導致時間和頻域的失調(diào)。關(guān)于時間的失調(diào),一個音頻摘錄2%的速率改變導致這個摘錄第250個指紋被從原摘錄的第255個指紋處提取到。幸而,為了位移的不變,指紋是這樣被構(gòu)建的,它沿著時間軸具有相關(guān)性。因此,原始摘錄和速度改變的相同摘錄之間的BFR(比特錯誤率)不會由于時間的失調(diào)而大大增加。
因此速度大量改變所引起的的主要問題是頻率失調(diào)。在圖1所示的現(xiàn)有方案中,2%的提速將會導致由傅里葉變換獲得一個頻譜的頻率軸縮放。例如,一個500赫茲的音調(diào)導致一個510赫茲的音調(diào)和一個1000赫茲的音調(diào)導致一個1020赫茲的音調(diào)。在計算頻譜后,對數(shù)間隔頻帶里的能量被確定了。因為頻帶被對數(shù)地間隔,速度的變化導致的能量從一個頻帶改變到了下一個頻帶。從一個頻帶到下一個頻帶的能量偏移越大,提取指紋的比特錯誤的可能性越大。這是因為,該指紋的比特是被相鄰頻帶的能量差異所決定的。
已經(jīng)建議用強制的途徑去識別顯著速率變化的音頻。強制途徑包括在數(shù)據(jù)庫中存儲在多種速度下提取的指紋,或者在數(shù)據(jù)庫中查尋在多種速度下提取的指紋。這種方法的缺點是,搜索的速度和/或儲存的規(guī)格被提高系數(shù)N,N即在具體應用中所需的不同速率數(shù)。
圖2顯示的一個根據(jù)本發(fā)明從一個音頻信號中提取指紋的裝置。在該圖中,相同的參數(shù)被用作在圖1已經(jīng)討論過的同一的或相似的步驟。更具體的,該音頻信號被分為重疊的幀(101)和每一幀的頻譜被計算(102)。
一個自動相關(guān)的步驟(202)是取得更好的速度變化復原能力的基本步驟。一個速度變化導致被計算出的能量矢量的移位。自動相關(guān)有位移不變的特性。就像一般的所知,一個連續(xù)函數(shù)f(t)的自動相關(guān)p(x)是ρ(x)=∫-∞∞f(t)f(t+x)dt]]>但是,我們在這里并不涉及一個無限的連續(xù)函數(shù)f(t),而是一個有限的特性樣本(能量)序列。為了從統(tǒng)計的大量的特性樣本中計算出自動相關(guān),512個子頻帶的能量被計算(201),而不是33個子頻帶。該頻帶仍然是對數(shù)的而且仍在300赫茲到2000赫茲的范圍內(nèi)。因而該頻帶有一個較小的帶寬。該自動相關(guān)被通過將能量的一個子序列和完整的序列相關(guān)來近似。更具體的,如下從子頻帶能量樣本E(j)計算出自動相關(guān)ρ[x]ρ[x]=Σj=1ME(K+j)E(x+j)forx=1,2,··,N-M]]>其中N表示整個能量矢量的長度(這里N=512),M表示子序列的長度和K表示子序列在該完整序列中開始的位置。M和K的典型設(shè)置分別是64和96。為了提高穩(wěn)固性,該產(chǎn)生出的自動相關(guān)值被選擇性地低通濾波(203)。該低通濾波的自動相關(guān)具有512-64=448個值,而在執(zhí)行該閱值操作前,需要33個輸入值,以用于2維濾波器(104)。因此,該448個自動相關(guān)值在一個下抽樣器里被向下采樣到33個值(204)。所產(chǎn)生出的指紋是一個每一幀的32比特字符串。
雖然已經(jīng)參考音頻指紋提取描述了本發(fā)明的方法和裝置的實施例,但是本發(fā)明并不限于此。申請人已經(jīng)提到的國際專利申請WO02/065782揭示了視頻指紋的提取方法,其中指紋是從每個圖像被劃分成的圖象塊的平均亮度值獲得的。根據(jù)本發(fā)明,每個圖像被分成大量的圖塊,圖塊的一個子集(一個“超級圖塊”)對于所述超級塊的一些位置被與該整個圖像相關(guān)。該獲得的自動相關(guān)值的序列不隨視頻圖像的位移而變化。該序列被選擇性地低通濾波,隨后被向下取樣。
本發(fā)明可以被總結(jié)如下。指紋是被從媒體信號(如一個音頻或視頻片斷)中提取的比特字符串,用以識別所述媒體信號。典型的,他們被從信號的可感知特性獲得,例如,一個音頻片斷的頻譜能量分布或者一個視頻圖像的亮度分布。這里揭示的是一個相對于可感知的特性位移穩(wěn)固的提取指紋的方法和裝置。這種位移發(fā)生在指紋從一個音頻信號的對數(shù)映射的頻譜的能量分布獲得時的,所述音頻信號有速度的改變。根據(jù)本發(fā)明,該指紋不是被從可感知特性提取的,而是通過它的自動相關(guān)函數(shù)提取的。
權(quán)利要求
1.一種從媒體信號提取指紋的方法,包含從所述的媒體信號中提取信號的給定的可感知特性的樣本序列,和從所述序列獲得構(gòu)成所述指紋的一個二進制序列的步驟,其中所述方法包含如下步驟給特性樣本序列施加一個自動相關(guān)函數(shù)(202),以獲得一個自動相關(guān)值的序列;比較(105)所述的自動相關(guān)值與各自的閾值;通過指紋的各個比特表示出所述比較的結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其中給特性樣本序列施加自動相關(guān)函數(shù)的所述步驟包括,將特性樣本的一個子序列和特性樣本的完整序列相關(guān)。
3.根據(jù)權(quán)利要求1所述的方法,其中給特性樣本序列施加自動相關(guān)函數(shù)的所述步驟進一步包括,對自動相關(guān)值下采樣(204),以獲得所需個數(shù)的自動相關(guān)值。
4.根據(jù)權(quán)利要求1所述的方法,其中從所述媒體信號獲取可感知特性值的序列的步驟包括,將一個音頻信號劃分成子頻帶并且計算所述音頻子頻帶的能量。
5.根據(jù)權(quán)利要求1所述的方法,其中從所述媒體信號獲取一個可感知特性序列的步驟包括,將圖象劃分成塊并計算所述圖象塊的亮度。
6.一種用于從媒體信號提取指紋的設(shè)備,包括用于從所述媒體信號獲取信號的給定可感知特性樣本序列的裝置,用于從所述序列獲取構(gòu)成所述指紋的二進制序列的裝置,其特征在于,所述設(shè)備包括裝置,用于給特性樣本序列施加一個自動相關(guān)函數(shù),以獲得一個自動相關(guān)值序列;裝置,用于比較所述自動相關(guān)值和相應的閾值;和用指紋的相應比特表示所述比較的結(jié)果。
7.一個計算機程序,包括使可編程設(shè)備執(zhí)行以下步驟的指令從接收的媒體信號獲取信號的給定可感知特性的樣本序列;給特性樣本施加一個自動相關(guān)函數(shù),以獲得一個自動相關(guān)值序列;比較所述自動相關(guān)值和相應的閾值;通過相應的指紋比特表示所述比較的結(jié)果。
全文摘要
“指紋”是指從媒體信號(例如一個音頻或視頻片斷)中提取的位串,用以識別所述媒體信號。具體講,他們是通過信號的可感知性被收集到的,例如,一個音頻片斷的頻譜能量分配或者一個視頻圖像的亮度分布。這里揭示的是一種相對于可感知性的偏移穩(wěn)固的提取“指紋”的方法和裝置。尤其當“指紋”是源自一個音頻信號的對數(shù)映射的頻譜能量分配,并且該音頻信號是處在速度變化之中時會發(fā)生這種偏移。根據(jù)本發(fā)明,指紋不是源自前面講的媒體信號的可感知性,而是來自它的自動相關(guān)功能。
文檔編號G10L19/018GK1685703SQ03823392
公開日2005年10月19日 申請日期2003年8月11日 優(yōu)先權(quán)日2002年9月30日
發(fā)明者J·A·海特斯馬 申請人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
莱阳市| 琼中| 绥宁县| 上栗县| 紫金县| 通化县| 改则县| 上栗县| 大姚县| 江川县| 池州市| 渝北区| 松潘县| 高平市| 东平县| 夏河县| 三穗县| 都昌县| 丰镇市| 鄯善县| 多伦县| 杭州市| 罗江县| 巴里| 盐津县| 高尔夫| 梓潼县| 高州市| 会昌县| 如皋市| 安丘市| 随州市| 徐闻县| 镇赉县| 兖州市| 德兴市| 民乐县| 砀山县| 饶平县| 宽甸| 崇礼县|