專利名稱:基于音頻特征的收視率調(diào)查系統(tǒng)及收視信息檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于音頻特征的收視率調(diào)查系統(tǒng)及收視信息檢索方法。
背景技術(shù):
目前收視率調(diào)查的作用已日漸凸顯,它不僅有利于幫助電視臺更好的編排廣告、 評估節(jié)目選題及制作效果,還有利于電視臺更有針對性的進(jìn)行欄目規(guī)劃和設(shè)計,最大效益、 高效地利用節(jié)目的時間和音/視頻資源,實現(xiàn)電視臺、觀眾以及廣告商多方的信息傳播、經(jīng) 濟(jì)效益和收視效果。以往的收視率統(tǒng)計方法存在頻道信息采集設(shè)備專用、編碼標(biāo)準(zhǔn)復(fù)雜,受 地域限制,應(yīng)用推廣中設(shè)備通用性差、統(tǒng)計數(shù)據(jù)有局限等缺點。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了解決上述問題,提供一種不受地區(qū)、國界限制,具有廣泛適
用性和推廣性等優(yōu)點的基于音頻特征的收視率調(diào)查系統(tǒng)及收視信息檢索方法。 為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案 —種基于音頻特征的收視率調(diào)查系統(tǒng),它主要由用戶端數(shù)據(jù)采集系統(tǒng)和中心端數(shù)
據(jù)處理系統(tǒng)兩大部分構(gòu)成,用戶端數(shù)據(jù)采集系統(tǒng)包括音頻采集模塊、特征提取模塊、數(shù)據(jù)編
碼存儲模塊及發(fā)送模塊,其中音頻采集模塊采集電視機AV端子的音頻信號,音頻采集模塊
與特征提取模塊連接,特征提取模塊對音頻信號進(jìn)行譜能量特征提取,提取的數(shù)據(jù)經(jīng)編碼
打包送入數(shù)據(jù)存儲模塊,數(shù)據(jù)存儲模塊再通過發(fā)送模塊定期發(fā)送數(shù)據(jù)到中心端數(shù)據(jù)處理系
統(tǒng);中心端數(shù)據(jù)處理系統(tǒng)包括相應(yīng)的接收模塊和數(shù)據(jù)處理模塊,數(shù)據(jù)處理模塊根據(jù)采集的
音頻信號與標(biāo)準(zhǔn)音頻庫中各收視臺的標(biāo)準(zhǔn)音頻信號進(jìn)行比對,搜索出與采集的音頻信號相
匹配的標(biāo)準(zhǔn)音頻信號所對應(yīng)的收視臺碼信息,據(jù)此統(tǒng)計電視臺的收視率。 —種基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法, 1)采集電視機AV端口的音頻數(shù)據(jù);采集音頻數(shù)據(jù)時,利用用戶遙控器發(fā)出的頻道 切換碼作為每個頻道音頻數(shù)據(jù)采集的起始計時標(biāo)記,并按固定采集包長TC跟蹤記錄用戶 收看頻道的音頻數(shù)據(jù)的頭包和尾包或只有頭包。根據(jù)收看時長不同,有以下幾種情況
收看時長〈一個包長TC,不予記錄數(shù)據(jù)
TC < =收看時長< 2WC,只記錄頭包 收看時長>=2WC,記錄頭包+尾包(注尾包要不斷跟蹤、刷新,是切換臺碼前 最近時刻的尾包)。 2)對采集到的音頻數(shù)據(jù)提取其譜能量特征作為音頻特征矢量,提取時將兩次頻道 切換間采集的第一個有效收視時長(設(shè)為包長TC)的音頻數(shù)據(jù)作為頭包,并繼續(xù)按有效包 長不斷采集并刷新第二個數(shù)據(jù)包的起始時刻和采集數(shù)據(jù),以此作為尾包,并將頭包或尾包 的屬性、各包對應(yīng)的起始時刻和相應(yīng)的音頻特征矢量數(shù)據(jù)編碼打包,加以存儲;若用戶收看 某頻道的收視時長達(dá)不到一個有效收視時長(即包長),則作為無效收視,不予記錄存儲; 若用戶收看某頻道的收視時長大于一個包長而小于兩個包長,則只記錄存儲頭包的數(shù)據(jù),即單包情況;若用戶收看某頻道的收視時長大于等于兩個包長,期間不論長短,尾包始終跟蹤記錄切換頻道或斷電前的最后一個有效包長的起始時刻和音頻數(shù)據(jù),并以兩個數(shù)據(jù)包(頭包+尾包)的形式加以記錄存儲,即雙包情況。這樣,基于音頻特征的用戶收視頻道音頻數(shù)據(jù)便以一系列的"頭包+尾包"或僅有"頭包"的形式按頻道切換時間順序依次存儲起來。 譜能量特征提取方法為,逐幀對指定通帶上對應(yīng)頻譜幅度值的能量做統(tǒng)計平均,即將采集的每個包長音頻數(shù)據(jù)按幀長依次截取,每幀經(jīng)P點(P為2的整次冪)FFT變換,在頻域上將采樣覆蓋的整個頻率范圍劃分成指定的M個通帶,算出各通帶對應(yīng)的譜能量,其中去除因電視機的高/低音響變化導(dǎo)致譜能量特征值出現(xiàn)較大波動的通帶;同時,對選定通帶上的幅值做能量歸一,以避免同一音段因音量變化導(dǎo)致譜能量特征值大小不一的情況。 3)上述音頻特征數(shù)據(jù)存儲到數(shù)據(jù)編碼存儲模塊,并定期自動上傳到中心端數(shù)據(jù)處理系統(tǒng); 4)中心端數(shù)據(jù)處理系統(tǒng)對接收的音頻數(shù)據(jù)判斷其是頭包還是尾包,然后從中心端
數(shù)據(jù)處理系統(tǒng)的各頻道音頻標(biāo)準(zhǔn)庫中提取各頻道與頭包或尾包對應(yīng)時刻的標(biāo)準(zhǔn)音頻數(shù)據(jù)
段,并對其按照步驟2)中提取譜能量特征相同的計算方法提取各標(biāo)準(zhǔn)臺對應(yīng)音頻段譜能
量特征,組成標(biāo)準(zhǔn)音頻特征矢量集,將頭包音頻特征矢量和尾包音頻特征矢量分別與標(biāo)準(zhǔn)
音頻特征矢量集做距離比對,距離最小者的標(biāo)準(zhǔn)音頻所對應(yīng)的頻道臺號,即為相應(yīng)的頭包
的臺號X或尾包的臺號Y ;比對臺號X與臺號Y是否相等,如兩者相等,則該臺號即為檢索
出的正確臺號;如兩者不相等,則進(jìn)行二次檢索,二次檢索后得到的臺號即為正確臺號; 二次檢索過程為,將接收的頭包音頻特征矢量和尾包音頻特征矢量組成一個測試
聯(lián)合特征矢量,同時將初判得出的頭包和尾包不同頻道號對應(yīng)的標(biāo)準(zhǔn)庫對應(yīng)時段的候選音
頻也分別按對應(yīng)順序組成候選聯(lián)合特征矢量,將測試聯(lián)合特征矢量與兩個候選聯(lián)合特征矢
量再分別作距離計算,取其中距離最小者,其對應(yīng)臺號即為最終檢索出的頻道號。 5)中心端數(shù)據(jù)處理系統(tǒng)以得到的正確臺號為基礎(chǔ)作收視率統(tǒng)計。 本發(fā)明提出了一種通用的音頻特征低比特收視信息編碼和檢索方法,用于收視率
調(diào)查系統(tǒng)用戶端數(shù)據(jù)采集設(shè)備和中心端數(shù)據(jù)處理頻道檢索,以改變目前收視率調(diào)查裝置不
通用問題。本發(fā)明利用電視機AV端口的音頻信號作頻道信息采集點,通過對指定頻帶上音
頻譜能量特征的編碼壓縮,在標(biāo)準(zhǔn)音頻庫中搜索出相應(yīng)的頻道號。收視頻道號檢索中,采用
搜索步長加時間余量的定位搜索方法將用戶端設(shè)備與中心端設(shè)備的時鐘誤差降至最低;通
過適當(dāng)劃分和選擇音頻數(shù)據(jù)的通帶、并對譜能量作歸一,可適應(yīng)用戶各種電視機音頻在音
量和頻響上的改變,以提高收視頻道號檢索的魯棒性;采用二次檢索算法,對初次檢索匹配
有歧義的數(shù)據(jù)包再作細(xì)判,以保證頻道號檢索的一致性;對用戶其它非常規(guī)收視(如看錄
像)的音頻數(shù)據(jù),通過設(shè)定匹配距離門限值,對非標(biāo)準(zhǔn)庫音頻數(shù)據(jù)予以剔出。 本發(fā)明的有益效果是音頻信號取自AV端口 ,不受收視用戶背景音干擾,具有很
強的抗擾性;端口通用,設(shè)備接插、安裝方便;用戶端系統(tǒng)構(gòu)成簡單,制造成本低;數(shù)據(jù)壓縮
率高,傳輸數(shù)據(jù)快捷、費用低;檢索方法可靠、效率高,錯誤率低;不依賴任何編碼或解碼標(biāo)
準(zhǔn),可不受地區(qū)、甚至國界限制,系統(tǒng)有廣泛適用性和推廣性。
圖1為本發(fā)明的整個系統(tǒng)結(jié)構(gòu)及組成框圖; 圖2為本發(fā)明中心端和用戶端數(shù)據(jù)收/發(fā)中數(shù)據(jù)包的記錄或傳輸格式示意圖; 圖3為本發(fā)明中心端數(shù)據(jù)處理系統(tǒng)檢索算法中二次檢索過程流程圖; 圖4為本發(fā)明用戶端數(shù)據(jù)采集模塊中音頻數(shù)據(jù)采集流程框圖; 圖5為本發(fā)明用戶端特征提取模塊中計算音頻特征矢量流程框圖; 圖6本發(fā)明中心端數(shù)據(jù)處理系統(tǒng)對任意待測包(頭包或尾包)檢索頻道號算法流
程框圖; 圖7a為不同音量下同一頻道音頻特征矢量各參量分布圖; 圖7b為能量歸一后不同音量下同一頻道音頻特征矢量各參量分布圖; 圖7c為頻帶優(yōu)化且能量歸一后頻道2增強低音的實驗結(jié)果; 圖7d為頻帶優(yōu)化且能量歸一后頻帶2增強高音的實驗結(jié)果。 其中,l.音頻采集模塊,2.特征提取模塊,3.數(shù)據(jù)編碼存儲模塊,4.發(fā)送模塊, 5.接收模塊,6.數(shù)據(jù)處理模塊。
具體實施例方式
下面結(jié)合附圖與實施例對本發(fā)明做進(jìn)一步說明。 圖1中,它主要由用戶端數(shù)據(jù)采集系統(tǒng)和中心端數(shù)據(jù)處理系統(tǒng)兩大部分構(gòu)成,用 戶端數(shù)據(jù)采集系統(tǒng)包括音頻采集模塊1、特征提取模塊2、數(shù)據(jù)編碼存儲模塊3及發(fā)送模塊 4,其中音頻采集模塊1采集電視機AV端子的音頻信號,音頻采集模塊1與特征提取模塊2 連接,特征提取模塊2對音頻信號進(jìn)行特征提取、編碼打包后送入數(shù)據(jù)編碼存儲模塊3,數(shù) 據(jù)編碼存儲模塊3再通過發(fā)送模塊4定期發(fā)送數(shù)據(jù)到中心端數(shù)據(jù)處理系統(tǒng);中心端數(shù)據(jù)處 理系統(tǒng)包括相應(yīng)的接收模塊5和數(shù)據(jù)處理模塊6,數(shù)據(jù)處理模塊6根據(jù)采集的音頻信號與標(biāo) 準(zhǔn)音頻庫中各收視臺的標(biāo)準(zhǔn)音頻信號進(jìn)行比對,搜索出采集的音頻信號所匹配的標(biāo)準(zhǔn)音頻
信號所對應(yīng)的收視臺碼信息,據(jù)此統(tǒng)計電視臺的收視率。
本發(fā)明的檢索方法為 第一步,進(jìn)行取自AV端口的音頻數(shù)據(jù)采集;利用用戶遙控器發(fā)出的頻道切換碼作 為音頻數(shù)據(jù)采集的起始計時標(biāo)記,并按數(shù)據(jù)包長TC跟蹤記錄用戶收看頻道的音頻特征;根 據(jù)聲音特征具有短時平穩(wěn)性的特點,其中音頻特征數(shù)據(jù)按幀長FL逐幀作FFT頻譜變換、提 取指定頻帶的M個譜能量特征,并作能量歸一,構(gòu)成音頻特征矢量ET = [ET1, ET2, . . . , ETM], 此處下標(biāo)T表示測試包特征,并將頭包或尾包的屬性、各包對應(yīng)的起始時刻和相應(yīng)的音頻 特征矢量數(shù)據(jù)編碼打包,加以存儲。 第二步,對采集到的音頻數(shù)據(jù)提取其譜能量特征作為音頻特征矢量,提取時將兩 次頻道切換間采集的第一個有效收視時長(即包長TC)的音頻數(shù)據(jù)作為頭包,并繼續(xù)按包 長不斷采集并刷新第二個數(shù)據(jù)包的起始時刻和采集數(shù)據(jù),以此作為尾包,并將頭包或尾包 的屬性、各包對應(yīng)的起始時刻和相應(yīng)的音頻特征矢量數(shù)據(jù)編碼打包,加以存儲;若用戶收看 某頻道的收視時長達(dá)不到一個包長,則作為無效收視,不予記錄存儲;若用戶收看某頻道的 收視時長大于一個包長而小于兩個包長,則只記錄存儲頭包的數(shù)據(jù),即單包情況;若用戶收 看某頻道的收視時長大于等于兩個包長,則不論時間長短,尾包始終跟蹤記錄切換頻道或斷電前的最后一個有效包長的起始時刻和音頻數(shù)據(jù),并以兩個數(shù)據(jù)包(頭包+尾包)的形式加以記錄存儲,即雙包情況。這樣,基于音頻特征的用戶收視頻道音頻數(shù)據(jù)便以一系列的"頭包+尾包"或僅有"頭包"的形式按頻道切換時間順序依次存儲起來。該數(shù)據(jù)采集處理流程框圖見圖4,特征提取處理流程框圖見圖5。按上述記錄方法獲得該戶收視頻道音頻特征數(shù)據(jù)包的收/發(fā)數(shù)據(jù)格式,如圖2所示。用戶端設(shè)備將已存儲在存儲模塊中的數(shù)據(jù)定期
自動上傳數(shù)據(jù)處理中心端。 下面給出一種方案實施例情況。 數(shù)據(jù)采樣頻率為16KHz,幀長=30毫秒,包長=3秒,分幀做P = 29 = 512點FFT變換,對應(yīng)信號有效頻帶范圍0—8KHz,劃分成16個等分通帶,經(jīng)優(yōu)選,去掉第1至第4對高/低音響敏感的通帶,選定第5到第16通帶為指定M個通帶,即M = 12。按圖5所示特征提取流程計算譜能量特征,得到相關(guān)實驗結(jié)果,如圖7a、圖7b、圖7c和圖7d所示。
第三步,數(shù)據(jù)處理中心端對收視臺號進(jìn)行檢索設(shè)收到的每個數(shù)據(jù)包為測試包,根據(jù)測試數(shù)據(jù)包中的屬性碼和時間碼可知該包時間段(Ti,Ti+TC),在所有頻道(設(shè)總共有N個頻道)標(biāo)準(zhǔn)音庫中選出對應(yīng)的N個候選音段;鑒于用戶端和數(shù)據(jù)處理中心端的時鐘可能存在偏差,引入時間余量方法,即將選出的N段候選音段的時間范圍均擴大時長TK,則N個擴大的候選音段時間范圍變?yōu)?Ti-TK,Ti+TC+TK);設(shè)搜索步長為TS,在擴大的N段候選音段中按照搜索步長TS推移、逐一截取包長TC數(shù)據(jù)段,對截取的一系列標(biāo)準(zhǔn)音庫中的音段按如圖6所示檢索算法提取候選音段譜能量特征矢量,得到NXL個候選音段的特征矢量集:
<formula>formula see original document page 7</formula>
其中該集內(nèi)任意元素為一個M維矢量,即En,! = (Enll, Enl2, . . . , EnlM),是頻道號n在擴大音段第1個搜索步長起始的候選段的譜能量特征,n = 1,2,. . . ,N為標(biāo)準(zhǔn)頻道編號,N為總頻道數(shù),L為各頻道擴大音段按搜索步長推移按包長截取的總音段數(shù),即
<formula>formula see original document page 7</formula>
1 = 0, 1, 2, . . . , L-l,為某標(biāo)準(zhǔn)頻道按搜索步長TS截取包長TC的候選音段序號。
設(shè)某測試數(shù)據(jù)包的特征矢量為ET = (ET1,ET2,... ,ETM),其中,M為包內(nèi)音頻特征矢量中參數(shù)個數(shù),即選定通帶個數(shù)。將ET與標(biāo)準(zhǔn)候選音段特征矢量集中每個矢量Ena進(jìn)行距離計算,
(式中n = 1,2, . , N ;1 = 0, 1,2, . , L-l) 比較這N禮個距離值,取其中距離值最小者對應(yīng)的頻道號n,即為檢索出的臺號,
同時通過此時的1可確定中心端與用戶端設(shè)備之間的時間偏差TD情況,即TD = TK-1*TS,
兩端時間校準(zhǔn)可參照以下情況 TD = 0 ,兩端時鐘對準(zhǔn) TD > 0,中心端時鐘快于用戶端 TD < 0,中心端時鐘慢于用戶端
上述檢索處理流程在圖1、圖6中加以說明。 第四步,如果頭包和尾包檢索出的臺號X和Y相等,則臺號檢索完成;否則,需進(jìn)行 二次判決(其流程見圖3),以得出最終的頻道號。 第五步,在用戶收視音頻數(shù)據(jù)包全部被檢索出來的基礎(chǔ)上,數(shù)據(jù)處理中心便可對
頻道欄目內(nèi)容或時段等收視信息作后續(xù)統(tǒng)計處理,例如,廣告時段收視率統(tǒng)計。 所述第一步中,跟蹤記錄過程為設(shè)定兩個包長數(shù)據(jù)采集工作緩沖區(qū),并順序由
AV端口采集兩段音頻信號,進(jìn)行時域到頻域的實時變換處理,時域到頻域的轉(zhuǎn)換采用逐幀
對聲音信號進(jìn)行快速傅立葉變換(即FFT),其傅立葉變換所用點數(shù)P可根據(jù)幀長FL確定,
具體取值必須是2的整數(shù)冪。 譜能量特征提取方法為 設(shè)數(shù)據(jù)采集中某包的起始時刻為Ti,這里i表示來自用戶端的任意一個數(shù)據(jù)包 (其序號無實際意義,因為每個包前端有頭尾包標(biāo)志),在(Ti, Ti+TC)時段內(nèi)逐幀截取音頻 采樣值;設(shè)幀長為FL,幀移為FD,通常FD《1*FL,每幀作P點FFT變換,得到若干離散頻率 點的幅度值,按選定的M個頻帶劃分求出各對應(yīng)通帶的平均能量,構(gòu)成一幀譜能量特征矢 量& = (ekl,ek2,... ,ekM) (k= 1,2,…,K),其中K為每個數(shù)據(jù)包中包含的總幀數(shù),即K二 TC/FD (或TC/FL,當(dāng)FD = FL),將K幀特征矢量按對應(yīng)通帶幅值求統(tǒng)計平均,得到數(shù)據(jù)包特 征矢量Em' = (ET1' ,ET2' ,...,Etm')。設(shè)E^為整個數(shù)據(jù)包選定通帶中的最大平均能 量幅值,其能量歸一化過程為
五 ' £rm ="^" (m = 1, 2, , M) 這樣,得到該數(shù)據(jù)包的歸一化譜能量特征ETi = (ET1, ET2, . . . , ETM)。
所述第四步中,二次判決過程為將被測的頭包特征矢量(ET1, ET2, . . . , ETM)和尾 包特征矢量(EW1, EW2, . . . , EJ組成一個測試聯(lián)合特征矢量ECT = (ET1, ET2, . . . , ETM, EW1, EW2, . . . , EJ ,這里下標(biāo)CT表示二次檢索時待測頭、尾包構(gòu)成聯(lián)合測試特征,其中尾包特征 矢量中各參數(shù)與頭包的相同,下標(biāo)W以示區(qū)別來自尾包。同時將初判得出的頭包和尾包不 同頻道號對應(yīng)的標(biāo)準(zhǔn)音庫對應(yīng)時段的候選音段也分別按對應(yīng)順序組成候選聯(lián)合特征矢量 Ecx — (Exti, Ext" , Extm, E皿,EXW2 , , EXWM) , ECY — (EYn, EYT2, , EYTM, EYWi, E,, , E麗), 其中各參數(shù)來自標(biāo)準(zhǔn)音庫候選X臺和Y臺對應(yīng)測試頭尾包時段的候選特征參量。被測數(shù)據(jù) 包的聯(lián)合特征矢量ECT與標(biāo)準(zhǔn)音庫對應(yīng)音段擴大后按搜索步長TS截取的若干包長的兩音段 的聯(lián)合特征矢量E^和EcY再分別進(jìn)行距離計算,取其中距離最小者,其對應(yīng)頻道號即為最終 檢索出的臺號,該處理流程見圖3 。 對于標(biāo)準(zhǔn)音庫以外的音頻(例如看錄像),通過設(shè)置匹配距離門限值,當(dāng)檢索得出 最小匹配距離超出距離門限,則判此音頻數(shù)據(jù)為非標(biāo)準(zhǔn)音庫音,予以剔除。對于"新聞聯(lián)播" 這類多頻道同時聯(lián)播情況,參照標(biāo)準(zhǔn)音庫多臺聯(lián)播固定時間表,將測試數(shù)據(jù)包中對應(yīng)該時 段相關(guān)數(shù)據(jù)截出處理,不再做音頻檢索和收視信息統(tǒng)計。
8
權(quán)利要求
一種基于音頻特征的收視率調(diào)查系統(tǒng),其特征是,它主要由用戶端數(shù)據(jù)采集系統(tǒng)和中心端數(shù)據(jù)處理系統(tǒng)兩大部分構(gòu)成,用戶端數(shù)據(jù)采集系統(tǒng)包括音頻采集模塊、特征提取模塊、數(shù)據(jù)編碼存儲模塊及發(fā)送模塊,其中音頻采集模塊采集電視機AV端子的音頻信號,音頻采集模塊與特征提取模塊連接,特征提取模塊對采集的音頻信號進(jìn)行譜能量特征提取,提取的數(shù)據(jù)經(jīng)編碼打包后送入數(shù)據(jù)編碼存儲模塊,數(shù)據(jù)編碼存儲模塊再通過發(fā)送模塊定期發(fā)送數(shù)據(jù)到中心端數(shù)據(jù)處理系統(tǒng);中心端數(shù)據(jù)處理系統(tǒng)包括相應(yīng)的接收模塊和數(shù)據(jù)處理模塊,數(shù)據(jù)處理模塊根據(jù)用戶端采集的音頻信號與標(biāo)準(zhǔn)音頻庫中各收視臺的標(biāo)準(zhǔn)音頻信號進(jìn)行比對,搜索出采集的音頻信號所匹配的標(biāo)準(zhǔn)音頻信號所對應(yīng)的收視臺碼信息,據(jù)此統(tǒng)計電視臺的收視率。
2. —種權(quán)利要求1所述基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法,其特征是,1) 采集電視機AV端口的音頻數(shù)據(jù);2) 對采集到的音頻數(shù)據(jù)提取其譜能量特征作為音頻特征矢量,提取時將兩次頻道切換間采集的第一個有效收視時長數(shù)據(jù)包作為頭包,并按包長不斷采集并刷新第二個數(shù)據(jù)包的起始時刻和采集數(shù)據(jù),以此作為尾包,并將頭包或尾包屬性、各包對應(yīng)的起始時刻和相應(yīng)的音頻特征矢量數(shù)據(jù)編碼打包,加以存儲;若用戶收看某頻道的收視時長達(dá)不到一個有效收視時長即包長,則作為無效收視,不予記錄存儲;若用戶收看某頻道的收視時長大于一個包長而小于兩個包長,則只記錄存儲頭包的數(shù)據(jù),即單包情況;若用戶收看某頻道的收視時長大于兩個包長,期間不論長短,尾包始終跟蹤記錄換頻道或斷電前的最后一個有效包長的起始時刻和音頻數(shù)據(jù),并以兩個數(shù)據(jù)包即"頭包+尾包"的形式加以記錄存儲,即雙包情況;這樣,基于音頻特征的用戶收視記錄數(shù)據(jù)便以一系列的"頭包+尾包"或僅有"頭包"的形式按頻道切換時間順序編碼存儲;3) 上述音頻特征數(shù)據(jù)存儲到數(shù)據(jù)編碼存儲模塊,并定期自動上傳到中心端數(shù)據(jù)處理系統(tǒng);4) 中心端數(shù)據(jù)處理系統(tǒng)對接收的音頻數(shù)據(jù)判斷其是頭包還是尾包,然后從中心端數(shù)據(jù)處理系統(tǒng)包含所有頻道音頻的標(biāo)準(zhǔn)音庫中截取各頻道與頭包或尾包對應(yīng)時刻的標(biāo)準(zhǔn)音頻數(shù)據(jù)段,并對其按照與步驟2)提取譜能量特征的相同處理方法計算出各標(biāo)準(zhǔn)音頻譜能量特征,并作為標(biāo)準(zhǔn)音頻特征矢量集,將頭包音頻特征矢量和尾包音頻特征矢量分別與標(biāo)準(zhǔn)音頻特征矢量集做距離比對,距離最小者的標(biāo)準(zhǔn)音頻所對應(yīng)的頻道臺號,即為相應(yīng)的頭包的臺號X或尾包的臺號Y ;比對臺號X與臺號Y是否相等,如兩者相等,則該臺號即為檢索出的正確臺號;如兩者不相等,則進(jìn)行二次檢索,二次檢索后得到的臺號即為正確臺號;5) 中心端數(shù)據(jù)處理系統(tǒng)以得到的正確臺號為基礎(chǔ)作收視率統(tǒng)計。
3. 如權(quán)利要求2所述的基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法,其特征是,所述步驟1)中,采集音頻數(shù)據(jù)時,利用用戶遙控器發(fā)出的頻道切換碼作為音頻數(shù)據(jù)采集的起始計時標(biāo)記,并按有效收視時長跟蹤記錄用戶收看頻道的音頻數(shù)據(jù)。
4. 如權(quán)利要求2所述的基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法,其特征是,所述步驟2)中,譜能量特征提取方法為,逐幀對指定通帶上對應(yīng)頻譜幅度值的能量做統(tǒng)計平均,即將采集的每個包長音頻數(shù)據(jù)按幀長截取,經(jīng)FFT變換,在頻域上將每幀數(shù)據(jù)覆蓋的整個頻率范圍劃分成指定的M個通帶,算出各頻帶對應(yīng)的譜能量,其中去除了因電視機的高/低音響變化導(dǎo)致譜能量特征值出現(xiàn)波動的通帶;同時,對選定通帶上的幅值做 能量歸一,以避免同一音段因音量變化導(dǎo)致譜能量特征值大小不一的情況。
5. 如權(quán)利要求2所述的基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法,其特征 是,所述步驟4)中,數(shù)據(jù)處理中心端對收視臺號進(jìn)行檢索時,鑒于用戶端和數(shù)據(jù)處理中心 端的時鐘可能存在偏差,引入時間余量方法,即將選出的各候選音段的時間范圍均擴大時 長,并在各擴大的候選音段中按照搜索步長推移、逐一截取數(shù)據(jù)包長,對截取的一系列標(biāo)準(zhǔn) 音庫中的音段按步驟2)的方法提取候選譜能量特征矢量,得到候選音段特征矢量集。
6. 如權(quán)利要求2所述的基于音頻特征的收視率調(diào)查系統(tǒng)的收視信息檢索方法,其特征 是,所述步驟4)中二次檢索過程為,將接收的頭包音頻特征矢量和尾包音頻特征矢量組成 一個測試聯(lián)合特征矢量,同時將初判得出的頭包和尾包不同頻道號對應(yīng)的標(biāo)準(zhǔn)庫對應(yīng)音段 的候選音頻也分別按對應(yīng)順序組成候選聯(lián)合特征矢量,將測試聯(lián)合特征矢量與兩個候選聯(lián) 合特征矢量再分別作距離計算,取其中距離最小者,其對應(yīng)臺號即為最終檢索出的頻道號。
全文摘要
本發(fā)明涉及一種基于音頻特征的收視率調(diào)查系統(tǒng)及收視信息檢索方法。它具有不受地區(qū)、國界限制,不依賴任何編碼標(biāo)準(zhǔn)、不受環(huán)境噪聲、音量及頻響變化的影響、有廣泛適用性和推廣性等優(yōu)點,其結(jié)構(gòu)為用戶端包括音頻采集、特征提取、數(shù)據(jù)存儲及發(fā)送模塊,數(shù)據(jù)處理中心包括接收模塊和通用微機或小型機處理模塊。音頻采集模塊與電視機的AV端連接,采集后的音頻信號送入特征提取模塊提取指定通帶特征、并做能量歸一處理,處理后的數(shù)據(jù)經(jīng)編碼打包存入存儲模塊,最后,通過發(fā)送模塊定期/定時(如每月初)以有線或無線方式上傳記錄的收視用戶頻道音頻特征數(shù)據(jù)。數(shù)據(jù)處理中心端對接收到的數(shù)據(jù)采用本發(fā)明提出的音頻檢索方法對收視信息作統(tǒng)計處理。
文檔編號G10L15/00GK101720048SQ20091025831
公開日2010年6月2日 申請日期2009年12月4日 優(yōu)先權(quán)日2009年12月4日
發(fā)明者王曉霞, 田嵐, 趙靜 申請人:山東大學(xué)