專利名稱:內(nèi)容識別和質(zhì)量監(jiān)測的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及內(nèi)容識別和質(zhì)量監(jiān)測。更具體地說,本發(fā)明實施例涉及基于媒 體內(nèi)容指紋的內(nèi)容識別和質(zhì)量控制。
背景技術(shù):
媒體內(nèi)容對應(yīng)于靜止圖像、音頻媒體、視頻媒體或音頻/可視(AV)媒體的片段, 并且包括通過至少一個媒介被包含的、存儲的、發(fā)送的、接收的、處理的或另外使用的信 息。常用媒體內(nèi)容格式包括FLV格式(flash視頻)、Windows Media Video、RealMedia、 Quicktime、MPEG、MP3、DivX、JPEG、以及位圖。如在此使用,術(shù)語“媒體剪輯”、“媒體內(nèi)容”、 “信息內(nèi)容”以及“內(nèi)容”可以互換地使用。媒體內(nèi)容被制作、處理、并且發(fā)送給消費者。然而,在制作之后,處理和/或發(fā)送可 能導(dǎo)致媒體內(nèi)容的質(zhì)量劣化。因此,現(xiàn)今的廣播裝置持續(xù)受到這樣的挑戰(zhàn),即平衡操作員的 數(shù)量與用于在媒體內(nèi)容正被廣播給消費者時媒體內(nèi)容的質(zhì)量控制OiC)以及連續(xù)監(jiān)測的人 工處理的數(shù)量。這種挑戰(zhàn)歸因于這樣的事實現(xiàn)今的很多網(wǎng)絡(luò)和運營商還跨越不同的媒介 范圍鞏固他們的運營并且擴展他們的節(jié)目廣播可用性,并同時控制他們的進行這種運作的 成本。很多廣播裝置已經(jīng)變得依賴于某類的處理(或多種處理),以確保既在播送之前(例 如在QC期間)又在正被播送的同時滿足他們自己(一般是主觀的)準則。處理通常包括 在沿著從制作到廣播的鏈條的很多不同步驟的QC檢查,并且可以包含操作員在每一步驟 驗證質(zhì)量。該部分中描述的方法是可被實行的方法,但不一定是先前已被構(gòu)思或者實行的方 法。因此,除非另外指示,否則不應(yīng)僅僅由于在該部分中描述的任何方法包含于此部分中而 假設(shè)它們?yōu)楝F(xiàn)有技術(shù)。相似地,除非另外指示,不應(yīng)基于此部分而認為關(guān)于一個或多個方法 被識別的問題已經(jīng)在任何現(xiàn)有技術(shù)中被認出。
附圖中以示例的方式而非限制的方式示出本發(fā)明,并且在附圖中相同的附圖標(biāo)記 指代相同的元件,其中圖1描述根據(jù)本發(fā)明的一個實施例的質(zhì)量監(jiān)測邏輯的示例;圖2描述根據(jù)本發(fā)明的一個實施例的用于確定在處理鏈中不同點處的媒體內(nèi)容 之間的質(zhì)量劣化的示例方法;圖3A-圖;3B描述根據(jù)本發(fā)明實施例的使用用于檢測質(zhì)量劣化的指紋比較以及用 于減少質(zhì)量劣化的校正動作的系統(tǒng)的示例;
圖4描述根據(jù)本發(fā)明的一個實施例的示例;圖5描述示出可在其上實現(xiàn)本發(fā)明的一個實施例的計算機系統(tǒng)的框圖;以及圖6描述根據(jù)本發(fā)明的一個實施例的示例IC器件。
具體實施例方式在此描述的示例實施例涉及用于媒體內(nèi)容的基于指紋的質(zhì)量控制。在以下描述 中,為了解釋的目的,闡述大量具體細節(jié)以提供本發(fā)明的透徹理解。然而,本領(lǐng)域技術(shù)人員 應(yīng)清楚,可以在沒有這些具體細節(jié)的情況下實行本發(fā)明。在其它情況下,公知結(jié)構(gòu)和設(shè)備被 以框圖形式示出以免不必要地模糊本發(fā)明。在此根據(jù)以下大綱描述示例實施例1.0 —般概述2.0架構(gòu)和功能概述3.0示例流程圖4.0示例系統(tǒng)示圖5. 0實現(xiàn)機制-硬件概述6. 0等同物、擴展、替換以及其它1. 0 一般概述在一個可能的實施例中,從第一媒體內(nèi)容得出第一指紋。處理第一媒體內(nèi)容以生 成第二媒體內(nèi)容,并且從第二媒體內(nèi)容得出第二指紋。然后比較第一指紋與第二指紋,以確 定以下中的一個或多個指示第二媒體內(nèi)容被從第一媒體內(nèi)容生成的第一指紋與第二指紋 之間的相似性,或者用于識別第一媒體內(nèi)容與第二媒體內(nèi)容之間的質(zhì)量劣化的第一指紋與 第二指紋之間的差異。第一媒體內(nèi)容與第二媒體內(nèi)容之間的質(zhì)量劣化可與第一指紋與第二指紋之間的 不同比特的數(shù)量成比例。此外,可以修改第一媒體內(nèi)容的處理,以減少從第一媒體內(nèi)容到 第二媒體內(nèi)容的質(zhì)量劣化。該修改可以基于是否滿足質(zhì)量劣化閾值。質(zhì)量劣化閾值可以 基于從第一指紋到第二指紋的漢明距離(hamming distance)、信噪比(SNR)、峰值信噪比 (PSNR)、視頻質(zhì)量的感知評價(PEVQ)、第一媒體內(nèi)容與第二媒體內(nèi)容之間的結(jié)構(gòu)相似性 (SSIM)、通用質(zhì)量索引(UQI)、視頻質(zhì)量度量(VQM)、音頻頻率響應(yīng)、總諧波失真(THD)、通道 隔離、立體聲相位相關(guān)性、有效均方根(rms)功率、響度、加權(quán)功率、采樣大小、實際峰值、采 樣比特深度、采樣排列順序(endiarmess)、或者音頻數(shù)據(jù)猝發(fā)間隔(burst spacing)。在一個可能的實施例中,處理第一媒體內(nèi)容以生成第二媒體內(nèi)容包括將多個處 理模塊應(yīng)用于第一媒體內(nèi)容??梢宰R別該多個處理模塊中的導(dǎo)致從第一媒體內(nèi)容到第二媒 體內(nèi)容的質(zhì)量劣化的一個處理模塊。此后,可以移除、替換或者校正該被識別的導(dǎo)致從第一 媒體內(nèi)容到第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì)量劣化。質(zhì)量劣化可以包括以下中的一個或多個在第二媒體內(nèi)容中丟失第一媒體內(nèi)容的 至少一部分、媒體通道重排序、媒體內(nèi)容序列重排序、或者第一媒體內(nèi)容中的分量的相對對 準(alignment)與第二媒體內(nèi)容中的對應(yīng)分量的相對對準之間的差異。此外,第一媒體內(nèi) 容中的分量的相對對準與第二媒體內(nèi)容中的對應(yīng)分量的相對對準之間的差異在通過第一 媒體內(nèi)容中的多個通道創(chuàng)建的空間效果和通過第二媒體內(nèi)容中的對應(yīng)多個通道創(chuàng)建的空間效果中產(chǎn)生差異。在從第一媒體內(nèi)容得出第一指紋之前,可以驗證第一媒體內(nèi)容的質(zhì)量。可以基于 從第二媒體內(nèi)容得出的第二指紋驗證與第二媒體內(nèi)容的廣播關(guān)聯(lián)的播送時間。在一個可能的實施例中,獲得從第一媒體內(nèi)容得出的第一指紋包括在處理第一 媒體內(nèi)容之前,并行獲得來自第一媒體內(nèi)容的音頻部分的第一音頻指紋以及來自第一媒體 內(nèi)容的對應(yīng)視頻部分的第一視頻指紋,確定第一媒體內(nèi)容的音頻部分相對于第一媒體內(nèi)容 的視頻部分的對準,在處理第一媒體內(nèi)容之后,并行獲得來自第二媒體內(nèi)容的音頻部分的 第二音頻指紋以及來自第一媒體內(nèi)容的對應(yīng)視頻部分的第二視頻指紋,以及基于第一媒體 內(nèi)容的音頻部分相對于第二媒體內(nèi)容的視頻部分的對準驗證第二媒體內(nèi)容的音頻部分相 對于第二媒體內(nèi)容的視頻部分的對準。本發(fā)明其它實施例可以包括具有用于執(zhí)行上述步驟的功能性的系統(tǒng)和計算機可 讀介質(zhì)。2. 0架構(gòu)和功能概述在此描述與用于媒體內(nèi)容的質(zhì)量控制有關(guān)的可能的實施例的示例。在以下描述 中,為了解釋的目的,闡述大量具體細節(jié)以提供本發(fā)明的透徹理解。然而,應(yīng)理解,可以在沒 有這些具體細節(jié)的情況下實行本發(fā)明。在其它情況下,沒有詳盡地詳細描述公知結(jié)構(gòu)和設(shè) 備,以免不必要地使本發(fā)明遮蔽、模糊、或者混亂。圖1示出根據(jù)一個實施例的質(zhì)量監(jiān)測邏輯100的示例。在實施例中,質(zhì)量監(jiān)測邏 輯100包括媒體處理單元104、指紋得出單元108、指紋比較單元110、處理校正單元112。質(zhì) 量監(jiān)測邏輯100還可以包括用于發(fā)送媒體內(nèi)容的廣播單元。這些組件中的每一個在下文被描述,并且可以位于相同設(shè)備(例如服務(wù)器、大型 機、臺式PC、膝上計算機、PDA、電視、分線盒、衛(wèi)星盒、信息站(kiosk)、電話、移動電話等) 上,或者可以位于通過具有有線和/或無線部分的網(wǎng)絡(luò)(例如互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)、局域 網(wǎng)(LAN)、廣域網(wǎng)(WAN)等)耦合的分離設(shè)備上。在本發(fā)明一個或多個實施例中,使用客戶 機-服務(wù)器拓撲實現(xiàn)質(zhì)量監(jiān)測邏輯100。質(zhì)量監(jiān)測邏輯100自身可以是在一個或多個服務(wù) 器上運行的企業(yè)應(yīng)用,并且在某些實施例中可以是對等系統(tǒng),或者駐留在單個計算系統(tǒng)上。 此外,可從其它機器使用一個或多個接口、web門戶、或用于訪問質(zhì)量監(jiān)測邏輯100的任何 其它工具訪問質(zhì)量監(jiān)測邏輯100。在一個或多個實施例中,一個或多個用戶可通過網(wǎng)絡(luò)連接 (例如互聯(lián)網(wǎng))訪問質(zhì)量監(jiān)測邏輯100。也可以通過網(wǎng)絡(luò)連接存儲并且訪問質(zhì)量監(jiān)測邏輯 100提供的信息和/或服務(wù)。在此可以參照包括靜止圖像、視頻、和/或音頻媒體的一個或多個示例媒體描述 媒體內(nèi)容(例如媒體內(nèi)容A 102和媒體內(nèi)容B 106)。在此描述中的示例媒體的選擇可以是 為了簡化并且簡明統(tǒng)一而進行,并且除非明顯相反地聲明,否則不應(yīng)理解為將實施例限制 于特定媒體,這是因為本發(fā)明實施例良好地適合于對靜止圖像、音頻媒體、或視頻媒體起作 用。此外,本發(fā)明實施例良好地適合于對可以表現(xiàn)兩個或三個空間維度的與音頻和視頻媒 體對應(yīng)的圖像起作用。在一個可能的實施例中,媒體內(nèi)容處理單元104對應(yīng)于用于處理媒體內(nèi)容的軟件 和/或硬件,其接收媒體內(nèi)容A 102作為輸入并且提供媒體內(nèi)容B 106作為輸出。媒體內(nèi) 容處理單元104可指的是應(yīng)用于媒體內(nèi)容A 102的單個處理模塊或一組處理模塊。用于音頻內(nèi)容的處理模塊的示例包括針對環(huán)繞聲編碼、均衡、慢速播放、動態(tài)處理、增益改變、通道 交換、延遲等的模塊。用于視頻內(nèi)容的處理模塊的示例包括針對代碼轉(zhuǎn)換、圖形的添加和覆 蓋、降噪等的各模塊。在一個可能的實施例中,指紋得出單元108對應(yīng)于用于從媒體內(nèi)容得出(例如提 取、生成、確定、計算等)媒體指紋(“指紋”與“簽名”可互換地并且等同地使用)的軟件 和/或硬件。可以從媒體內(nèi)容的一部分內(nèi)的信息或包括媒體內(nèi)容的一部分的信息得出媒體 內(nèi)容的某些指紋。媒體指紋體現(xiàn)(embody)或者捕獲對應(yīng)媒體的媒體內(nèi)容的本質(zhì),并且可唯 一地與其聯(lián)系在一起??梢詮囊曨l剪輯的圖像或幀得出視頻指紋??梢詮木哂星度氲囊纛l 信息的圖像(例如聲譜圖)得出音頻指紋。指紋得出單元108還可以被配置為使用本領(lǐng)域 已知的任何其它方法從媒體內(nèi)容得出指紋。此外,術(shù)語媒體指紋可指的是媒體指紋與其關(guān) 聯(lián)并且被從其得出媒體內(nèi)容的低比特率表示。指紋得出單元108可以被配置為從媒體內(nèi)容 A 102或媒體內(nèi)容B 106得出指紋。此外,指紋得出單元108還可以被配置為在媒體內(nèi)容A 102的處理期間的任何點(例如,沿著從媒體內(nèi)容A 102到媒體內(nèi)容B 106的處理鏈的任何 時間)得出指紋。指紋得出單元108也可以被配置為從選擇的媒體內(nèi)容得出多個指紋。例 如,指紋得出單元108可以被配置為使用不同的指紋得出技術(shù)從相同媒體內(nèi)容得出多個指 紋(例如,具有變化的針對改變的強健性或敏感性的等級的指紋得出技術(shù))。此外,指紋得 出單元108也可以被配置為對于媒體內(nèi)容的不同部分單獨地得出指紋。例如,可以使用多 路分解器將音頻/視頻媒體內(nèi)容分為分離的分量(例如音頻分量和視頻分量),并且可以對 于每一分量單獨地得出指紋。指紋得出單元108可以位于媒體內(nèi)容處理單元104中的每一 處理模塊處,用于在處理模塊之前或者之后的指紋得出。指紋得出單元108也可以是居中 定位的,其中,媒體內(nèi)容被從處理點發(fā)送到指紋得出單元108,以用于得出指紋。在可能的實施例中,指紋比較單元110對應(yīng)于用于比較從沿著從媒體內(nèi)容A 102 到媒體內(nèi)容B 106的處理鏈的兩個或更多個點得出的指紋的硬件和/或軟件。例如,指紋 比較單元110可以被配置為比較從媒體內(nèi)容A 102得出的指紋與從媒體內(nèi)容B 106得出的 指紋,如圖1所示。指紋比較單元110也可以被配置為比較沿著從媒體內(nèi)容A 102到媒體 內(nèi)容B 106的處理鏈的任何其它指紋。在示例中,指紋可以包括1秒和0秒的集合,其中, 指紋比較單元110可以比較該指紋并且確定哪些比特是不同的以及哪些是匹配的。指紋比較單元110可以基于各媒體內(nèi)容的指紋之間的相似性確定一媒體內(nèi)容是 否是從另一媒體內(nèi)容得出的。例如,如果在指紋之間發(fā)現(xiàn)預(yù)定數(shù)量的匹配數(shù)字(或在指紋 中使用的其它字符、號碼、符號等),則可以確定各媒體內(nèi)容是相關(guān)的(例如,第一媒體內(nèi)容 被處理以生成第二媒體內(nèi)容)。還可以其它技術(shù)以確定一媒體內(nèi)容是否是從另一媒體內(nèi)容 (例如文件命名慣例、時間戳等)得出的?;谄ヅ鋽?shù)字(或在指紋中使用的其它字符、號碼、符號等)的數(shù)量,指紋比較單 元110可以確定與比較的指紋對應(yīng)的媒體內(nèi)容之間的質(zhì)量劣化。例如,如果媒體內(nèi)容A 102 的10個指紋比特中的8個與媒體內(nèi)容B 106的指紋比特匹配,其中,每一比特被以百分之 十相等地加權(quán),則指紋比較單元可以確定百分之八十的相似度,或者反之,百分之二十的質(zhì) 量劣化。在其它實施例中,各比特可被不同地加權(quán)。例如,可以將不太可能隨處理反轉(zhuǎn)的一 些比特分類為強比特,并且可以將更可能隨處理反轉(zhuǎn)的比特分類為弱比特。被分配給各比 特以確定相似程度或質(zhì)量劣化程度的百分比強度可以與比特的強度成比例。
在一個實施例中,指紋比較單元110可以比較比特(或構(gòu)成指紋的其它字符、號 碼、符號等)的序列,以確定比特組的重排序。例如,指紋比較單元110可以確定第一指紋中 的兩個比特組在第二指紋中互換或者移位?;诨Q的組,指紋比較單元110可以確定錯 誤。由指紋比較單元110通過指紋比較識別的錯誤的示例包括但不限于媒體通道重排序、 媒體內(nèi)容序列重排序、或第一媒體內(nèi)容中的分量的相對對準與第二媒體內(nèi)容中的對應(yīng)分量 的相對對準之間的差異。相對對準中的差異可以進一步用于識別與媒體內(nèi)容關(guān)聯(lián)的元數(shù)據(jù) (例如隱藏字幕)的空間效果中的或不適當(dāng)對準中的差異。元數(shù)據(jù)也可以包括關(guān)于對應(yīng)媒 體內(nèi)容的質(zhì)量相關(guān)信息。例如,可以在各質(zhì)量保證點處修改元數(shù)據(jù),以記錄在該質(zhì)量保證點 處的媒體內(nèi)容的質(zhì)量。如圖4所示,可以按通道分離媒體內(nèi)容,并且可以對于每一部分單獨 地得出指紋,或者可以對于沿著媒體內(nèi)容的處理鏈的兩個點確定與每一通道對應(yīng)的組合指 紋的一部分并將其存儲在指紋服務(wù)器中。此后,可以按組驗證與不同通道對應(yīng)的各簽名比 特組的順序和相對偏移。相對偏移中的差異可被用于識別作為處理鏈中的處理的結(jié)果的媒 體內(nèi)容的通道信息的交換。因此,指紋比較單元110可以被配置為基于對應(yīng)媒體內(nèi)容的指 紋的比較,檢測沿著處理鏈的各點處的媒體內(nèi)容之間的媒體內(nèi)容相似性、媒體內(nèi)容質(zhì)量劣 化、上文指定的錯誤、或其它差異。在實施例中,處理校正單元112對應(yīng)于被配置為基于指紋比較單元110識別的質(zhì) 量劣化給媒體內(nèi)容處理單元104提供校正動作的硬件和/或軟件。例如,處理校正單元112 可以移除、替換或校正導(dǎo)致從媒體內(nèi)容A 102到媒體內(nèi)容B 106的質(zhì)量劣化的一個或多個 處理模塊。處理校正單元112還可以包括用于取回或恢復(fù)丟失的媒體內(nèi)容的一個或多個部 分(例如數(shù)據(jù)包、媒體內(nèi)容通道、剪輯的一部分等)的功能性。處理校正單元112可以連接 到接口,從而用戶可以選擇校正選項。處理校正單元112也可以是完全自動化的,從而選擇 耗時最少或成本最低校正選項。例如,當(dāng)檢測到通道切換錯誤時,媒體內(nèi)容處理單元104可 被提供以備用處理模塊替換出錯處理模塊的校正動作。處理校正單元112也可以提供用于 出錯處理模塊的校正的指令,導(dǎo)致通道切換錯誤的校正。在一個實施例中,可以使用除了出 錯模塊之外的不同模塊抵抗誤差。例如,如果出錯處理模塊切換兩個通道,則后續(xù)處理模塊 可以被配置為將這兩個通道切換回原狀,得到原始配置。在實施例中,如果滿足預(yù)定質(zhì)量劣化閾值,則可以激活處理校正單元112。例如, 檢測到的質(zhì)量劣化可被使用預(yù)先定義的度量量化,或者被分配與質(zhì)量劣化的量成比例的數(shù) 值。此后,可以比較質(zhì)量劣化與預(yù)定質(zhì)量劣化閾值。如果質(zhì)量劣化符合或者超過質(zhì)量劣化閾 值,則可以采取校正動作。如果未符合質(zhì)量劣化,則不采取校正動作,并且仍將質(zhì)量劣化看 作是滿意的。質(zhì)量劣化閾值可以是靜態(tài)的、用戶定義的、或基于一個或多個因素是動態(tài)的。 例如,質(zhì)量劣化閾值可以基于正被測試的各媒體內(nèi)容指紋之間的漢明距離。在該示例中,正 比較的媒體內(nèi)容兩個指紋之間的漢明距離越大,質(zhì)量劣化閾值就越大,因為預(yù)期的是,漢明 距離越大,質(zhì)量劣化量就越大。3. 0示例流程2示出用于確定在處理鏈中的不同點處媒體內(nèi)容之間的質(zhì)量劣化的一個示例 方法。圖2中所示的一個或多個步驟可被修改、重新排列、或者一起省略。在該示例中,一開始,獲得第一媒體內(nèi)容(步驟20 。在一個實施例中,可以從節(jié) 目、過程或用戶接收第一媒體內(nèi)容。第一媒體內(nèi)容可以對應(yīng)于緊接在制作之后的內(nèi)容,或者可以是從處理鏈內(nèi)的中間點獲得的。可以使用自動化裝置或人工檢查(例如用戶觀看或者 收聽)來驗證第一媒體內(nèi)容的質(zhì)量。接下來,從第一媒體內(nèi)容得出第一指紋(步驟204)??梢允褂帽绢I(lǐng)域已知的任何 方法得出指紋。如果已經(jīng)驗證了第一媒體內(nèi)容的質(zhì)量,或者如果直接從制作者(其可以已 經(jīng)驗證了質(zhì)量)獲得第一媒體內(nèi)容,則可以將第一指紋分類為主指紋。第一指紋可以用于 與在沿著處理鏈的下游取得的任何指紋比較。如上所述,第一指紋可對應(yīng)于全部媒體內(nèi)容、 或媒體內(nèi)容的一部分(例如音頻部分或視頻部分)。接下來,處理第一媒體內(nèi)容以生成第二媒體內(nèi)容(步驟206)。在媒體內(nèi)容處理單 元104包括多個處理模塊的示例中,處理模塊可以串行地應(yīng)用于第一媒體內(nèi)容以生成第二 媒體內(nèi)容。處理模塊也可以并行地應(yīng)用于第一媒體內(nèi)容。例如,音頻處理模塊可以應(yīng)用于 第一媒體內(nèi)容的音頻部分,同時視頻處理模塊可以應(yīng)用于第一媒體內(nèi)容的視頻部分。并行 處理可進一步了解沿著處理鏈的某些點處測量的質(zhì)量,并且可導(dǎo)致改進的質(zhì)量監(jiān)測(例如 在音頻與視頻之間的同步方面)。在一個實施例中,從第二媒體內(nèi)容得出第二指紋(步驟208)。可以通過步驟204 中的上文所述的任何方式得出第二指紋。在一個實施例中,可以沿著處理鏈得出許多不同 的指紋并且將它們存儲在指紋服務(wù)器中。可以使用時間戳或另一合適的機制識別主指紋或 最早得出的指紋。此后,根據(jù)一個實施例,可以比較第一指紋與第二指紋以確定以下中的一個或多 個(1)指示從第一媒體內(nèi)容得出第二媒體內(nèi)容的指紋之間的相似性,或⑵指紋之間的差 異以及從第一媒體內(nèi)容到第二媒體內(nèi)容的質(zhì)量劣化(步驟210)。第一指紋與第二指紋之 間的比較可以包括用于確定匹配比特和不同比特的這兩個指紋的各比特的簡單比較。如上 所述,比較也可以包括用于識別兩個指紋之間的互換的或轉(zhuǎn)變的比特組以檢測錯誤的更復(fù) 雜的比較。當(dāng)比較多于兩個的指紋時,可以識別差異的趨勢或模式。例如,可以與處理鏈中 的緊接在前面的點相比較地或與另一點(例如由與主指紋對應(yīng)的用戶對于質(zhì)量控制進行 驗證的處理鏈中的初始點)相比較地分析各點處的質(zhì)量劣化,以確定質(zhì)量劣化的趨勢。例 如,在處理模塊的第一集合中的每一個處的質(zhì)量劣化可以是一致的可接受的百分比。然而, 在沿著處理鏈的某一點之后,質(zhì)量劣化可能開始以指數(shù)速率增加??梢曰谮厔葑R別質(zhì)量 劣化的改變速率明顯增加的點,并且可以識別發(fā)起指數(shù)質(zhì)量劣化的一個或多個處理模塊。 也可以使用其它媒體內(nèi)容質(zhì)量度量確定質(zhì)量劣化。媒體內(nèi)容質(zhì)量度量的示例包括信噪比 (SNR)、峰值信噪比(PSNR)、視頻質(zhì)量的感知評價(PEVQ)、結(jié)構(gòu)相似性(SSIM) ,Czenakowski 距離(CZD)、通用質(zhì)量索引(UQI)、視頻質(zhì)量度量(VQM)、音頻頻率響應(yīng)、總諧波失真(THD)、 通道隔離、立體聲相位相關(guān)性、有效均方根功率、響度、加權(quán)功率、采樣大小、實際峰值、采樣 比特深度、采樣排列順序、音頻數(shù)據(jù)猝發(fā)間隔等。如上所述,造成質(zhì)量劣化的處理模塊可以通過比較該處理模塊前后的媒體內(nèi)容的 指紋而被識別。然而,在具有大量處理模塊的大處理鏈結(jié)束時檢測到質(zhì)量劣化的情況下,可 以使用用于出錯處理模塊的更快速檢測的算法。例如,如果在第1處理模塊與第50處理模 塊之間某處檢測到質(zhì)量劣化,則指紋得出單元108可以首先獲得在中間點(例如第25處理 模塊)前后的指紋,以確定是否已出現(xiàn)質(zhì)量劣化。如果已經(jīng)出現(xiàn)了質(zhì)量劣化,則指紋得出單 元108可以得出在第1處理模塊與第25處理模塊之間的一處理模塊前后的指紋。如果尚未出現(xiàn)質(zhì)量劣化,則指紋得出單元108可以得出在第25處理模塊與第50處理模塊之間的 一處理模塊前后的指紋。指紋得出單元108可以按上述方式遞歸地選擇處理模塊,并且直 到識別導(dǎo)致質(zhì)量劣化的處理模塊。也可以重復(fù)該處理以識別導(dǎo)致質(zhì)量劣化的另外的處理模 塊。除了質(zhì)量劣化之外,指紋也可以用于驗證媒體資產(chǎn)(media asset)是否已經(jīng)成功地全 部穿過系統(tǒng)(例如從幀和/或采樣0到資產(chǎn)的末端)。術(shù)語“成功地”可以定義為已經(jīng)通過 單個或多個分析點/節(jié)點驗證視頻和/或音頻的每一幀。在另一應(yīng)用中,可以基于媒體內(nèi) 容指紋執(zhí)行播放列表驗證。例如,可以比較根據(jù)播放列表播出的音頻/視頻文件的指紋與 期待根據(jù)播放列表播出的指紋。這允許驗證歌曲/視頻標(biāo)題從播放列表到實際內(nèi)容文件的 映射。在識別到質(zhì)量劣化的情況下,可以修改處理鏈以減少質(zhì)量劣化(步驟212)。在一 個可能的實施例中,可以用備用處理模塊簡單地替換導(dǎo)致質(zhì)量劣化的出錯處理模塊。也可 以校正或者移除出錯處理模塊。在一個可能的實施例中,可以使用另一處理模塊來抵消質(zhì) 量劣化。質(zhì)量劣化的識別可以用于自適應(yīng)地觸發(fā)內(nèi)部或外部質(zhì)量校正處理和/或動作。如 果在某一處理模塊或節(jié)點處識別到質(zhì)量劣化,則可以向校正質(zhì)量劣化的不同處理模塊發(fā)送 通知消息。例如,如果在某一節(jié)點處識別很多幀失落(frame drop),則可將誤差校正方案應(yīng) 用于音頻/視頻流,其減輕幀丟失的影響。此外,可以從先前版本等恢復(fù)、取回失落的幀、失 落的通道、內(nèi)容內(nèi)丟失的剪輯、或媒體內(nèi)容的任何其它丟失部分。如果當(dāng)前路徑被檢測為阻 塞,則也可以在不同網(wǎng)絡(luò)路徑上重新路由多媒體流。在使用多協(xié)議標(biāo)識交換(MPLS)網(wǎng)絡(luò)的 情況下,這可以通過MPLS擴展或MPLS重新路由機制實現(xiàn)。相似地,在通用IP網(wǎng)絡(luò)中,可以 通過改變在開放式最短路徑優(yōu)先(OSPF)協(xié)議中分配的權(quán)重實現(xiàn)在不同網(wǎng)絡(luò)路徑上的重新 路由。此外,在Diffserv框架中可以給予通知消息最高優(yōu)先級。在一個實施例中,如下文 結(jié)合圖3A-圖;3B所述,當(dāng)檢測到出錯處理模塊時可以使用備用處理模塊。4.0示例系統(tǒng)示3A-圖;3B示出根據(jù)實施例的使用用于檢測質(zhì)量劣化的指紋比較以及用于減少 質(zhì)量劣化的校正動作的系統(tǒng)的示例。在示例系統(tǒng)內(nèi),可以存在用于音頻處理的串行布置的N個不同處理模塊以及用于 視頻處理的串行布置的M個不同視頻處理模塊。在這種架構(gòu)中,可以在每一處理塊之后或 者在處理塊的一部分之后檢查音頻/視頻的質(zhì)量。使用指紋的內(nèi)容識別可以使得能夠進行 質(zhì)量的自動驗證,并且可以消除對在每一處理塊之后進行人工質(zhì)量檢查的需要。在廣播處 理或內(nèi)容制作鏈的前端,可以檢查、驗證或者證實輸入的音頻部分和輸入的視頻部分的質(zhì) 量,以確保滿足質(zhì)量控制度量。在一個可能的實施例中,可以得出原始音頻/視頻的指紋并且存儲在相應(yīng)的指紋 服務(wù)器(其也可以實現(xiàn)為單個服務(wù)器)中。在每一處理塊之后,從經(jīng)處理的音頻/視頻再次 提取指紋,并且將其發(fā)送到指紋服務(wù)器。指紋服務(wù)器可從原始音頻/視頻指紋數(shù)據(jù)庫返回 匹配指紋的時間戳。因此,可以基于時間戳與音頻/視頻處理點關(guān)聯(lián)地識別內(nèi)容和指紋。一 旦完成識別,就可將經(jīng)處理的媒體內(nèi)容的質(zhì)量與來自先前處理點的先前媒體內(nèi)容或接收的 原始媒體內(nèi)容相比較。在該示例中,發(fā)現(xiàn)音頻處理模塊I(A)和視頻處理模塊2(A)出錯,導(dǎo) 致質(zhì)量劣化。因此,如圖3B的處理鏈所示,以音頻處理模塊1 (B)替換音頻處理模塊1 (A), 并且以視頻處理模塊2 (B)替換視頻處理模塊2 (A)。由此,減少質(zhì)量劣化。
5. 0實現(xiàn)方式機制圖5描述示出了可在其上實現(xiàn)本發(fā)明實施例的計算機系統(tǒng)500的框圖。計算機系 統(tǒng)500包括總線502或用于傳送信息的其它通信機制、以及與總線502耦合的用于處理信 息的處理器504。計算機系統(tǒng)500還包括耦合到總線502的主存儲器506 (諸如隨機存取存 儲器(RAM)或其它動態(tài)存儲設(shè)備),其用于存儲待由處理器504執(zhí)行的指令以及信息。主存 儲器506還可以用于存儲在待由處理器504執(zhí)行的指令的執(zhí)行期間的臨時變量或其它中間 信息。計算機系統(tǒng)500還包括耦合到總線502的用于存儲用于處理器504的靜態(tài)信息和指 令的只讀存儲器(ROM) 508或其它靜態(tài)存儲設(shè)備。存儲設(shè)備510(例如磁盤或光盤)被提供 并且耦合到總線502,以用于存儲信息和指令。計算機系統(tǒng)500可以經(jīng)由總線502耦合到用于將信息顯示給計算機用戶的顯示器 512(例如陰極射線管(CRT)、液晶顯示器(IXD)、等離子體屏幕顯示器等)。包括字母數(shù)字 (或不基于字母表的寫入系統(tǒng)和/或不基于阿拉伯?dāng)?shù)字的)和其它鍵的輸入設(shè)備514耦合 到總線502,以用于將信息和命令選擇傳送到處理器504。另一類型的用戶輸入設(shè)備是光標(biāo) 控制器516 (例如鼠標(biāo)、軌跡球、或光標(biāo)方向鍵),以用于將方向信息和命令選擇傳送到處理 器504,并且控制顯示器512上的光標(biāo)移動。該輸入設(shè)備典型地在兩個軸——第一軸(例如 χ軸)和第二軸(例如y軸)——中具有兩個自由度,這樣允許設(shè)備指定平面中的位置。實施例可以涉及用于實現(xiàn)在此描述的技術(shù)的計算機系統(tǒng)500的使用。根據(jù)本發(fā) 明的一個實施例,響應(yīng)于處理器504執(zhí)行主存儲器506中包括的一個或多個指令的一個或 多個序列,由計算機系統(tǒng)500執(zhí)行這樣的技術(shù)??梢詮牧硪粰C器可讀介質(zhì)(例如存儲設(shè)備 510)將這樣的指令讀入到主存儲器506。主存儲器506中包含的指令序列的執(zhí)行使得處理 器504執(zhí)行在此描述的處理步驟。在替換實施例中,可以使用硬件實現(xiàn)電路來取代軟件指 令或者與軟件指令進行組合以實現(xiàn)本發(fā)明。因此,本發(fā)明實施例不限于硬件電路和軟件的 任何具體組合。在此使用的術(shù)語“機器可讀介質(zhì)”指的是參與提供使得機器以特定方式操作的數(shù) 據(jù)的任何存儲介質(zhì)。在使用計算機系統(tǒng)500實現(xiàn)的實施例中,例如,各種機器可讀介質(zhì)涉及 將指令提供給處理器504以便執(zhí)行。這樣的介質(zhì)可以采用很多形式,包括但不限于存儲介 質(zhì)和傳輸介質(zhì)。存儲介質(zhì)包括非易失性介質(zhì)和易失性介質(zhì)兩者。非易失性介質(zhì)包括例如光 盤或磁盤,諸如存儲設(shè)備510。易失性介質(zhì)包括動態(tài)存儲器,諸如主存儲器506。傳輸介質(zhì) 包括同軸線纜、銅線和光纖,包括包含總線502的線。傳輸介質(zhì)也可以采用諸如在無線電波 和紅外以及其它光學(xué)數(shù)據(jù)通信期間生成的聲波或電磁波的形式。這樣的介質(zhì)是有形的,以 使得能夠通過物理機構(gòu)檢測該介質(zhì)承載的指令,該物理機構(gòu)將指令讀入機器。機器可讀介質(zhì)的通常形式包括例如軟盤、柔性盤、硬盤、磁帶或任何其它磁介質(zhì)、 CD-ROM、任何其它光學(xué)介質(zhì)、穿孔卡、紙帶、其它遺留介質(zhì)、或具有孔或暗斑的圖案的任何其 它物理介質(zhì)、RAM、PR0M、以及EPR0M、FLASH-EPR0M、任何其它存儲器芯片或盒、下文中描述的 載波、或計算機可以讀取的任何其它介質(zhì)。各種形式的機器可讀介質(zhì)可以涉及將一個或多個指令的一個或多個序列運送至 處理器504以便執(zhí)行。例如,可最初在遠程計算機的磁盤上承載指令。遠程計算機可以將 指令加載到其的動態(tài)存儲器,并且使用調(diào)制解調(diào)器在電話線路上發(fā)送指令。計算機系統(tǒng)500 的本地調(diào)制解調(diào)器可以在電話線路上接收該數(shù)據(jù),并且使用紅外發(fā)射機將數(shù)據(jù)轉(zhuǎn)換為紅外信號。紅外檢測器可以接收紅外信號中承載的數(shù)據(jù),并且適當(dāng)?shù)碾娐房梢詫?shù)據(jù)置于總線 502上。總線502將數(shù)據(jù)運送到主存儲器506,處理器504從主存儲器506檢索并且執(zhí)行指 令。主存儲器506接收的指令可任選地在由處理器504執(zhí)行之前或者之后被存儲在存儲設(shè) 備510上。計算機系統(tǒng)500還可以包括耦合到總線502的通信接口 518。通信接口 518提供 與連接到本地網(wǎng)絡(luò)522的網(wǎng)絡(luò)鏈路520的雙向數(shù)據(jù)通信耦合。例如,通信接口 518可以是用 于提供與對應(yīng)類型的電話線路的數(shù)據(jù)通信連接的綜合業(yè)務(wù)數(shù)字網(wǎng)絡(luò)(ISDN)卡或數(shù)字用戶 線路(DSL)或線纜調(diào)制解調(diào)器(傳統(tǒng)地,調(diào)制器/解調(diào)器)。作為另一示例,通信接口 518 可以是提供與兼容LAN的數(shù)據(jù)通信連接的局域網(wǎng)(LAN)卡。也可以實現(xiàn)無線鏈路。在任何 這樣的實現(xiàn)方式中,通信接口 518發(fā)送并且接收承載表示各種類型的信息的數(shù)字數(shù)據(jù)流的 電、電磁或光信號。網(wǎng)絡(luò)鏈路520典型地提供通過一個或多個網(wǎng)絡(luò)到其它數(shù)據(jù)設(shè)備的數(shù)據(jù)通信。例 如,網(wǎng)絡(luò)鏈路520可以提供通過本地網(wǎng)絡(luò)522到主機計算機5M或到互聯(lián)網(wǎng)服務(wù)提供商 (ISP) 5 操作的數(shù)據(jù)設(shè)備的連接。ISP 5 進而通過遍及世界的分組數(shù)據(jù)通信網(wǎng)絡(luò)(現(xiàn)在 通常稱為“互聯(lián)網(wǎng)”)5 提供數(shù)據(jù)通信服務(wù)。本地網(wǎng)絡(luò)522和互聯(lián)網(wǎng)528皆使用承載數(shù)字 數(shù)據(jù)流的電、電磁或光信號。承載去往以及來自計算機系統(tǒng)500的數(shù)字數(shù)據(jù)的通過各種網(wǎng) 絡(luò)的信號以及在網(wǎng)絡(luò)鏈路520上并且通過通信接口 518的信號是傳遞信息的載波的示例性 形式。計算機系統(tǒng)500可以通過網(wǎng)絡(luò)、網(wǎng)絡(luò)鏈路520和通信接口 518發(fā)送消息并且接收 數(shù)據(jù),包括程序代碼。在互聯(lián)網(wǎng)示例中,服務(wù)器530可以通過互聯(lián)網(wǎng)528、ISP 526、本地網(wǎng) 絡(luò)522和通信接口 518發(fā)送對于應(yīng)用程序的請求代碼。被接收的代碼可在其被接收到時由處理器504執(zhí)行,并且/或者被存儲在存儲設(shè) 備510或其它非易失性存儲器中以用于稍后執(zhí)行。這樣,計算機系統(tǒng)500可獲得載波的形 式的應(yīng)用代碼。圖6描述可通過其實現(xiàn)本發(fā)明可能的實施例的示例IC器件600。IC器件600可 以具有輸入/輸出(I/O)部件601。I/O部件601接收輸入信號,并且經(jīng)由路由選擇結(jié)構(gòu) 610將它們路由到中央處理單元(CPU)602,CPU 602通過存儲器603起作用。I/O部件601 還接收來自IC器件600的其它組件部件的輸出信號,并且可以控制在路由選擇結(jié)構(gòu)610上 的信號流的一部分。數(shù)字信號處理(DSP)部件至少執(zhí)行與數(shù)字信號處理有關(guān)的功能。接口 605存取外部信號,并且將它們路由到I/O部件601,并且允許IC器件600輸出信號。路由 選擇結(jié)構(gòu)610在IC器件600的各組件部件之間路由信號和功率。諸如邏輯門陣列的可配置和/或可編程處理元件(CPPE) 611可以執(zhí)行IC器件600 的專用功能,其在一個實施例中可涉及得出并且處理通常與媒體內(nèi)容對應(yīng)的媒體指紋。存 儲器612為CPPE 611貢獻足夠存儲單元以高效運作。CPPE可以包括一個或多個專用DSP 部件614。本發(fā)明實施例可與以下列舉的示例實施例中的一個或多個有關(guān)。7.0等同物、擴展、改動及其他在前面說明書中,已經(jīng)參照可隨實現(xiàn)方式而變化的大量具體細節(jié)描述了本發(fā)明實 施例。因此,本發(fā)明是什么以及本發(fā)明的申請人所預(yù)期的唯一且排他的指示符是以權(quán)利要求提出的具體形式從該申請?zhí)岢龅臋?quán)利要求的集合,包括任何后續(xù)改正。對于這些權(quán)利要 求中所包含的術(shù)語在此明確闡述的任何定義應(yīng)囊括如權(quán)利要求中所使用的這些術(shù)語的意 義。因此,權(quán)利要求中未明確陳述的限制、元素、特性、特征、優(yōu)點或?qū)傩圆粦?yīng)以任何方式來 限制所述權(quán)利要求的范圍。相應(yīng)地,說明書和附圖是說明性的,而非限制的意義。
權(quán)利要求
1.一種方法,包括獲得從第一媒體內(nèi)容得出的第一指紋,其中,所述第一媒體內(nèi)容被處理以生成第二媒 體內(nèi)容;獲得從所述第二媒體內(nèi)容得出的第二指紋;以及 比較所述第一指紋與所述第二指紋以確定以下中的一個或多個 指示所述第二媒體內(nèi)容是從所述第一媒體內(nèi)容生成的所述第一指紋與所述第二指紋 之間的相似性;或者用于識別所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的質(zhì)量劣化的所述第一指紋與 所述第二指紋之間的差異。
2.如列舉的示例實施例1中陳述的方法,其中,所述第一媒體內(nèi)容與所述第二媒體內(nèi) 容之間的質(zhì)量劣化與所述第一指紋與所述第二指紋之間的不同比特的數(shù)量成比例。
3.如列舉的示例實施例1中陳述的方法,還包括修改所述第一媒體內(nèi)容的處理,以減少從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì) 量劣化。
4.如列舉的示例實施例1中陳述的方法,還包括 將質(zhì)量劣化與質(zhì)量劣化閾值相比較;以及如果滿足所述質(zhì)量劣化閾值,則修改所述第一媒體內(nèi)容的處理,以減少從所述第一媒 體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化。
5.如列舉的示例實施例4中陳述的方法,其中,所述質(zhì)量劣化閾值基于以下中的一個 或多個從所述第一指紋到所述第二指紋的漢明距離; 信噪比(SNI ); 峰值信噪比(PSNR); 視頻質(zhì)量的感知評價(PEVQ);所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的結(jié)構(gòu)相似性(SSIM);通用質(zhì)量索引(UQI);視頻質(zhì)量度量(VQM);音頻頻率響應(yīng);總諧波失真(THD);通道隔離;立體聲相位相關(guān)性;有效均方根(RMS)功率;響度;加權(quán)功率;采樣大??;實際峰值;采樣比特深度;采樣排列順序;或者音頻數(shù)據(jù)猝發(fā)間隔。
6.如列舉的示例實施例1中陳述的方法,其中,通過將多個處理模塊應(yīng)用于所述第一 媒體內(nèi)容處理所述第一媒體內(nèi)容以生成所述第二媒體內(nèi)容。
7.如列舉的示例實施例6中陳述的方法,還包括識別所述多個處理模塊中的導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣 化的處理模塊。
8.如列舉的示例實施例7中陳述的方法,還包括以下中的一個或多個移除導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化;以備用處理模塊替換導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處 理模塊,以減少質(zhì)量劣化;或者校正導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化。
9.如列舉的示例實施例1中陳述的方法,其中,質(zhì)量劣化包括以下中的一個或多個所述第一媒體內(nèi)容的至少一部分在所述第二媒體內(nèi)容中丟失;媒體通道重排序;媒體內(nèi)容序列重排序;或者所述第一媒體內(nèi)容中的分量的相對對準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對 準之間的差異。
10.如列舉的示例實施例9中陳述的方法,其中,所述第一媒體內(nèi)容中的分量的相對對 準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對準之間的差異在通過所述第一媒體內(nèi)容中 多個通道創(chuàng)建的空間效果與通過所述第二媒體內(nèi)容中對應(yīng)的多個通道創(chuàng)建的空間效果中 造成差異。
11.如列舉的示例實施例1中陳述的方法,還包括在從所述第一媒體內(nèi)容得出所述第 一指紋之前,驗證所述第一媒體內(nèi)容的質(zhì)量。
12.如列舉的示例實施例1中陳述的方法,其中,基于從所述第二媒體內(nèi)容得出的第二 指紋驗證與所述第二媒體內(nèi)容的廣播關(guān)聯(lián)的播放時間。
13.如列舉的示例實施例1中陳述的方法,其中,獲得從第一媒體內(nèi)容得出的第一指紋 包括在處理所述第一媒體內(nèi)容之前,并行地從所述第一媒體內(nèi)容的音頻部分獲得第一音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第一視頻指紋;以及確定所述第一媒體內(nèi)容的音頻部分相對于所述第一媒體內(nèi)容的視頻部分的對準;其中,獲得從第二媒體內(nèi)容得出的第二指紋包括在處理所述第一媒體內(nèi)容之后,并行地從所述第二媒體內(nèi)容的音頻部分獲得第二音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第二視頻指紋;以及其中,確定所述第一指紋與所述第二指紋之間的差異包括基于所述第一媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準,驗證 所述第二媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準。
14.一種具有編碼的指令的計算機可讀存儲介質(zhì)產(chǎn)品,所述編碼的指令在由一個或多 個處理器執(zhí)行時使得所述一個或多個處理器執(zhí)行以下步驟獲得從第一媒體內(nèi)容得出的第一指紋,其中,所述第一媒體內(nèi)容被處理以生成第二媒 體內(nèi)容;獲得從所述第二媒體內(nèi)容得出的第二指紋;以及 比較所述第一指紋與所述第二指紋以確定以下中的一個或多個 指示所述第二媒體內(nèi)容是從所述第一媒體內(nèi)容生成的所述第一指紋與所述第二指紋 之間的相似性;或者用于識別所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的質(zhì)量劣化的所述第一指紋與 所述第二指紋之間的差異。
15.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,所述第一媒體內(nèi)容 與所述第二媒體內(nèi)容之間的質(zhì)量劣化與所述第一指紋與所述第二指紋之間的不同比特的 數(shù)量成比例。
16.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,所述編碼的指令當(dāng) 由一個或多個處理器執(zhí)行時使得所述一個或多個處理器進一步執(zhí)行修改所述第一媒體內(nèi) 容的處理以減少從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的步驟。
17.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,所述編碼的指令當(dāng) 由一個或多個處理器執(zhí)行時使得所述一個或多個處理器進一步執(zhí)行以下步驟將質(zhì)量劣化與質(zhì)量劣化閾值相比較;以及如果滿足所述質(zhì)量劣化閾值,則修改所述第一媒體內(nèi)容的處理,以減少從所述第一媒 體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化。
18.如列舉的示例實施例17中陳述的計算機可讀存儲介質(zhì),其中,所述質(zhì)量劣化閾值 基于以下中的一個或多個從所述第一指紋到所述第二指紋的漢明距離; 信噪比(SNR); 峰值信噪比(PSNR); 視頻質(zhì)量的感知評價(PEVQ);所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的結(jié)構(gòu)相似性(SSIM);通用質(zhì)量索引(UQI);視頻質(zhì)量度量(VQM);音頻頻率響應(yīng);總諧波失真(THD);通道隔離;立體聲相位相關(guān)性;有效RMS功率;響度;加權(quán)功率;采樣大小;實際峰值;采樣比特深度;采樣排列順序;或者音頻數(shù)據(jù)猝發(fā)間隔。
19.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,通過將多個處理模 塊應(yīng)用于所述第一媒體內(nèi)容處理所述第一媒體內(nèi)容以生成所述第二媒體內(nèi)容。
20.如列舉的示例實施例19中陳述的計算機可讀存儲介質(zhì),其中,所述編碼的指令當(dāng) 由一個或多個處理器執(zhí)行時使得所述一個或多個處理器進一步執(zhí)行識別所述多個處理模 塊中的導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊的步驟。
21.如列舉的示例實施例20中陳述的計算機可讀存儲介質(zhì),其中,所述編碼的指令當(dāng) 由一個或多個處理器執(zhí)行時,使得所述一個或多個處理器進一步執(zhí)行以下步驟中的一個或 多個移除導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化;以備用處理模塊替換導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處 理模塊,以減少質(zhì)量劣化;或者校正導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化。
22.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,質(zhì)量劣化包括以下 中的一個或多個所述第一媒體內(nèi)容的至少一部分在所述第二媒體內(nèi)容中丟失;媒體通道重排序;媒體內(nèi)容序列重排序;或者所述第一媒體內(nèi)容中的分量的相對對準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對 準之間的差異。
23.如列舉的示例實施例22中陳述的計算機可讀存儲介質(zhì),其中,所述第一媒體內(nèi)容 中的分量的相對對準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對準之間的差異在通過所 述第一媒體內(nèi)容中多個通道創(chuàng)建的空間效果與通過所述第二媒體內(nèi)容中對應(yīng)的多個通道 創(chuàng)建的空間效果中造成差異。
24.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),還包括在從所述第一媒體內(nèi)容得出所述第一指紋之前,驗證所述第一媒體內(nèi)容的質(zhì)量。
25.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,基于從所述第二媒 體內(nèi)容得出的第二指紋驗證與所述第二媒體內(nèi)容的廣播關(guān)聯(lián)的播放時間。
26.如列舉的示例實施例14中陳述的計算機可讀存儲介質(zhì),其中,獲得從第一媒體內(nèi) 容得出的第一指紋包括在處理所述第一媒體內(nèi)容之前,并行地從所述第一媒體內(nèi)容的音頻部分獲得第一音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第一視頻指紋;以及確定所述第一媒體內(nèi)容的音頻部分相對于所述第一媒體內(nèi)容的視頻部分的對準;其中,獲得從第二媒體內(nèi)容得出的第二指紋包括在處理所述第一媒體內(nèi)容之后,并行地從所述第二媒體內(nèi)容的音頻部分獲得第二音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第二視頻指紋;以及其中,確定所述第一指紋與所述第二指紋之間的差異包括基于所述第一媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準,驗證 所述第二媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準。
27.—種系統(tǒng),包括 處理器;指紋得出單元,所述指紋得出單元包括用于以下操作的功能性 獲得從第一媒體內(nèi)容得出的第一指紋,其中,所述第一媒體內(nèi)容被處理以生成第二媒 體內(nèi)容;和獲得從所述第二媒體內(nèi)容得出的第二指紋;以及 指紋比較單元,所述指紋比較單元包括用于以下操作的功能性 比較所述第一指紋與所述第二指紋以確定以下中的一個或多個 指示所述第二媒體內(nèi)容是從所述第一媒體內(nèi)容生成的所述第一指紋與所述第二指紋 之間的相似性;或者用于識別所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的質(zhì)量劣化的所述第一指紋與 所述第二指紋之間的差異。
28.如列舉的示例實施例27中陳述的系統(tǒng),其中,所述第一媒體內(nèi)容與所述第二媒體 內(nèi)容之間的質(zhì)量劣化與所述第一指紋與所述第二指紋之間的不同比特的數(shù)量成比例。
29.如列舉的示例實施例27中陳述的系統(tǒng),還包括處理校正單元,所述處理校正單元 包括用于修改所述第一媒體內(nèi)容的處理以減少從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容 的質(zhì)量劣化的功能性。
30.如列舉的示例實施例27中陳述的系統(tǒng),還包括處理校正單元,所述處理校正單元 包括用于以下操作的功能性比較質(zhì)量劣化與質(zhì)量劣化閾值;以及如果滿足所述質(zhì)量劣化閾值,則修改所述第一媒體內(nèi)容的處理,以減少從所述第一媒 體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化。
31.如列舉的示例實施例30中陳述的系統(tǒng),其中,所述質(zhì)量劣化閾值基于以下中的一 個或多個從所述第一指紋到所述第二指紋的漢明距離; 信噪比(SNI ); 峰值信噪比(PSNR); 視頻質(zhì)量的感知評價(PEVQ);所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的結(jié)構(gòu)相似性(SSIM);通用質(zhì)量索引(UQI);視頻質(zhì)量度量(VQM);音頻頻率響應(yīng);總諧波失真(THD);通道隔離;立體聲相位相關(guān)性;有效RMS功率;響度;加權(quán)功率; 采樣大小; 實際峰值; 采樣比特深度; 采樣排列順序;或者 音頻數(shù)據(jù)猝發(fā)間隔。
32.如列舉的示例實施例27中陳述的系統(tǒng),其中,通過將多個處理模塊應(yīng)用于所述第 一媒體內(nèi)容處理所述第一媒體內(nèi)容以生成所述第二媒體內(nèi)容。
33.如列舉的示例實施例32中陳述的系統(tǒng),還包括處理校正單元,所述處理校正單元 包括用于以下操作的功能性識別所述多個處理模塊中的導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣 化的處理模塊。
34.如列舉的示例實施例33中陳述的系統(tǒng),其中,所述處理校正單元還包括用于以下 操作的功能性移除導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化;以備用處理模塊替換導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處 理模塊,以減少質(zhì)量劣化;或者校正導(dǎo)致從所述第一媒體內(nèi)容到所述第二媒體內(nèi)容的質(zhì)量劣化的處理模塊,以減少質(zhì) 量劣化。
35.如列舉的示例實施例27中陳述的系統(tǒng),其中,所述質(zhì)量劣化包括以下中的一個或 多個所述第一媒體內(nèi)容的至少一部分在所述第二媒體內(nèi)容中丟失;媒體通道重排序;媒體內(nèi)容序列重排序;或者所述第一媒體內(nèi)容中的分量的相對對準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對 準之間的差異。
36.如列舉的示例實施例35中陳述的系統(tǒng),其中,所述第一媒體內(nèi)容中的分量的相對 對準與所述第二媒體內(nèi)容中的對應(yīng)分量的相對對準之間的差異在通過所述第一媒體內(nèi)容 中多個通道創(chuàng)建的空間效果與通過所述第二媒體內(nèi)容中對應(yīng)的多個通道創(chuàng)建的空間效果 中造成差異。
37.如列舉的示例實施例27中陳述的系統(tǒng),其中,基于從所述第二媒體內(nèi)容得出的第 二指紋,驗證與所述第二媒體內(nèi)容的廣播關(guān)聯(lián)的播放時間。
38.如列舉的示例實施例27中陳述的系統(tǒng),其中,獲得從第一媒體內(nèi)容得出的第一指 紋包括在處理所述第一媒體內(nèi)容之前,并行地從所述第一媒體內(nèi)容的音頻部分獲得第一音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第一視頻指紋;以及確定所述第一媒體內(nèi)容的音頻部分相對于所述第一媒體內(nèi)容的視頻部分的對準; 其中,獲得從第二媒體內(nèi)容得出的第二指紋包括在處理所述第一媒體內(nèi)容之后,并行地從所述第二媒體內(nèi)容的音頻部分獲得第二音頻 指紋以及從所述第一媒體內(nèi)容的對應(yīng)視頻部分獲得第二視頻指紋;以及 其中,確定所述第一指紋與所述第二指紋之間的差異包括基于所述第一媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準,驗證 所述第二媒體內(nèi)容的音頻部分相對于所述第二媒體內(nèi)容的視頻部分的對準。
39.一種方法,包括獲得從第一媒體內(nèi)容得出的第一指紋,其中,所述第一媒體內(nèi)容被處理以生成第二媒 體內(nèi)容;獲得從所述第二媒體內(nèi)容得出的第二指紋;以及確定所述第一指紋與所述第二指紋之間的差異,以識別所述第一媒體內(nèi)容與所述第二 媒體內(nèi)容之間的質(zhì)量劣化。
40.一種方法,包括獲得從第一媒體內(nèi)容得出的第一指紋; 獲得從第二媒體內(nèi)容得出的第二指紋;比較所述第一指紋與所述第二指紋,以確定指示所述第二媒體內(nèi)容是被從所述第一媒 體內(nèi)容生成的相似性;以及比較所述第一媒體內(nèi)容與所述第二媒體內(nèi)容,以識別所述第一媒體內(nèi)容與所述第二媒 體內(nèi)容之間的質(zhì)量劣化。
41.一種具有編碼的指令的計算機可讀存儲介質(zhì)產(chǎn)品,所述編碼的指令當(dāng)由一個或多 個處理器執(zhí)行時,使得所述一個或多個處理器執(zhí)行如列舉的示例實施例39或40中的一個 或多個中陳述的步驟。
42.一種系統(tǒng),包括用于獲得從第一媒體內(nèi)容得出的第一指紋的裝置,其中,所述第一媒體內(nèi)容被處理以 生成第二媒體內(nèi)容;用于獲得從所述第二媒體內(nèi)容得出的第二指紋的裝置;以及用于確定用于識別所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的質(zhì)量劣化的所述第 一指紋與所述第二指紋之間的差異的裝置。
43.一種系統(tǒng),包括 用于以下操作的裝置獲得從第一媒體內(nèi)容得出的第一指紋; 獲得從第二媒體內(nèi)容得出的第二指紋;比較所述第一指紋與所述第二指紋,以確定指示所述第二媒體內(nèi)容是被從所述第一媒 體內(nèi)容生成的相似性;以及比較所述第一媒體內(nèi)容與所述第二媒體內(nèi)容,以識別所述第一媒體內(nèi)容與所述第二媒 體內(nèi)容之間的質(zhì)量劣化。
44.一種計算機系統(tǒng)的使用,包括執(zhí)行在列舉的示例實施例1_13、39或40中的至少一個中陳述的處理步驟中的一個或 多個。
45.一種系統(tǒng),包括用于獲得從第一媒體內(nèi)容得出的第一指紋的裝置,其中,所述第一媒體內(nèi)容被處理以 生成第二媒體內(nèi)容;用于獲得從所述第二媒體內(nèi)容得出的第二指紋的裝置;以及 用于比較所述第一指紋與所述第二指紋以確定以下中的一個或多個的裝置 指示所述第二媒體內(nèi)容是從所述第一媒體內(nèi)容生成的所述第一指紋與所述第二指紋 之間的相似性;或者用于識別所述第一媒體內(nèi)容與所述第二媒體內(nèi)容之間的質(zhì)量劣化的所述第一指紋與 所述第二指紋之間的差異。
全文摘要
提供內(nèi)容識別和質(zhì)量監(jiān)測。該方法包括獲得從第一媒體內(nèi)容得出的第一指紋,處理第一媒體內(nèi)容以生成第二媒體內(nèi)容,獲得從第二媒體內(nèi)容得出的第二指紋,以及比較第一指紋與第二指紋以確定以下中的一個或多個指示第二媒體內(nèi)容是從第一媒體內(nèi)容生成的第一指紋與第二指紋之間的相似性;或者用于識別第一媒體內(nèi)容與第二媒體內(nèi)容之間的質(zhì)量劣化的第一指紋與第二指紋之間的差異。
文檔編號H04N17/00GK102132574SQ200980132514
公開日2011年7月20日 申請日期2009年8月21日 優(yōu)先權(quán)日2008年8月22日
發(fā)明者C·鮑爾, J·C·瑞德米勒爾, R·拉達克里希南, 蔣文宇 申請人:杜比實驗室特許公司