專利名稱:視頻質(zhì)量測量的制作方法
技術(shù)領(lǐng)域:
本發(fā)明 涉及視頻質(zhì)量測度,尤其是在已經(jīng)使用壓縮算法進(jìn)行編碼的視頻信號的情 況下。
背景技術(shù):
當(dāng)要從一個位置向另一個位置傳輸視頻信號時,已知使用編碼算法來編碼或壓縮 信號,使得可以使用比未編碼情況下將需要的帶寬更低的帶寬來傳輸編碼后的信號。一旦 接收到該信號,就對該編碼后的信號進(jìn)行解碼以取回原始信號。在很多編碼技術(shù)中,執(zhí)行二 維余弦變換,產(chǎn)生大小被量化的一系列變換系數(shù)。所以可以有效地分配帶寬,允許改變量化 間隔尺寸,即,步長。編碼和解碼視頻序列的過程可能引入失真或以其他方式降低信號質(zhì)量。測量失真 橫向的一種方法涉及記錄觀看者對于失真視頻序列中可覺察失真的橫向的意見,并且對結(jié) 果進(jìn)行求平均,以獲得平均意見分?jǐn)?shù)(M0S:Mean Opinion Score) 0但是,這可能是耗時的 過程。因此,可以期望的是,預(yù)測觀看者會在視頻序列中覺察到的質(zhì)量損失。盡管通過參照 原始序列可以獲得由于編碼/解碼和傳輸過程而引起的視頻質(zhì)量的下降,但是這樣的方法 常常是不方便的。在預(yù)測編碼中,可以傳輸實際信號和預(yù)測信號之間的差,該差被稱為“預(yù)測殘 差”(prediction residual) 0更通常地,傳輸其量化后的版本。根據(jù)我們共同未決的國際專利申請W02007/066066,提供了一種生成代表多個幀
的視頻信號的質(zhì)量測度的方法,該視頻信號具有原始形式;編碼形式,在編碼形式中使用 壓縮算法已經(jīng)對視頻信號進(jìn)行編碼,該壓縮算法利用可變量化器步長使得編碼后的信號具 有相關(guān)聯(lián)的量化器步長參數(shù);以及解碼形式,在解碼形式中編碼后的視頻信號已經(jīng)至少部 分地被再轉(zhuǎn)換成原始形式,該方法包括以下步驟a)生成作為所述量化器步長參數(shù)的函數(shù) 的第一質(zhì)量測度;b)生成第二質(zhì)量測度,該第二質(zhì)量測度是由解碼形式的視頻信號所表示 的幀的至少一部分的空間復(fù)雜度的函數(shù);以及c)組合第一測度和第二測度。在預(yù)測編碼中,可以傳輸實際信號與預(yù)測信號之間的差,該差被稱為“預(yù)測殘差”。 更通常地,傳輸其量化后的版本。
發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供了一種生成表示多個幀的視頻信號的質(zhì)量測度的方法,該視頻 信號具有原始形式;編碼形式,在編碼形式中已經(jīng)使用壓縮算法對視頻信號進(jìn)行了編碼, 該壓縮算法利用可變量化器步長使得編碼后的信號具有與該可變量化器步長相關(guān)聯(lián)的量 化器步長參數(shù),并且利用差分編碼使得編碼后的信號含有信號的預(yù)測殘差的表示;以及解 碼形式,在解碼形式中編碼后的視頻信號已經(jīng)至少部分地被再轉(zhuǎn)換成原始形式,該方法包 括以下步驟a)生成根據(jù)預(yù)定關(guān)系取決于所述量化器步長參數(shù)的第一質(zhì)量測度;
b)生成掩蔽測度,該掩蔽測度根據(jù)預(yù)定關(guān)系取決于由所述解碼形式的所述視頻信號所表示的幀的至少一部分的所述空間復(fù)雜度;以及c)生成混合測度,該混合測度根據(jù)預(yù)定關(guān)系取決于所述第一測度和所述掩蔽測 度;其中,所述方法還包括生成根據(jù)預(yù)定關(guān)系取決于所述信號的預(yù)測殘差的第二測度;識別所述圖像中所述第二測度超過閾值的一個或更多個區(qū)域;并且其中所述掩蔽測度根據(jù)預(yù)定關(guān)系取決于識別出的區(qū)域的所述空間復(fù)雜度。在權(quán)利要求書中指明了本發(fā)明的其他方面。
現(xiàn)在將參照附圖以示例的方式進(jìn)一步描述本發(fā)明的一些實施方式,其中圖1是以功能術(shù)語示出了用于估計視頻序列的質(zhì)量的裝置的框圖;圖Ia示出了如何計算圖像中的像素的橫向?qū)Ρ榷葴y度;圖Ib示出了如何計算圖Ia的圖像中的像素縱向?qū)Ρ榷葴y度;以及圖2至圖11是示出了圖1的系統(tǒng)的測試結(jié)果的圖。
具體實施例方式下面描述的實施方式涉及基于解碼器的無參考的視頻質(zhì)量評價工具。用于該工具 的算法可以在視頻解碼器內(nèi)部工作,使用各解碼后的宏塊的量化器步長參數(shù)(通常是輸入 的編碼后的視頻流中所包括的變量)和來自各解碼后圖像的像素強(qiáng)度值,以估計解碼后視 頻的主觀質(zhì)量。對各幀的解碼像素執(zhí)行滑動窗口平均像素強(qiáng)度差(像素對比度測度)計算, 并且所得到的平均值(CWS)用作視頻的噪聲掩蔽特征的測度。然后,使質(zhì)量估計作為步長 參數(shù)的平均值和CWS參數(shù)二者的函數(shù)。函數(shù)通過對之前獲得的關(guān)于序列的主觀分?jǐn)?shù)以及特 征解碼序列的訓(xùn)練數(shù)據(jù)庫的多個回歸分析來預(yù)先確定。使用一方面步長并且另一方面估計 復(fù)雜度的滑動窗口平均像素強(qiáng)度差測度的組合,提供了良好的主觀質(zhì)量估計。原則上,所使用的測量過程通??梢詰?yīng)用到已經(jīng)使用利用變換編碼并且具有可 變量化器步長的壓縮技術(shù)編碼的視頻信號。但是,要描述的版本被設(shè)計為與根據(jù)H. 262 和H. 264標(biāo)準(zhǔn)編碼的信號一起使用。(盡管其也應(yīng)用到其他基于DCT的標(biāo)準(zhǔn)編解碼器,如 H. 26I、H. 263、MPEG-2 (基于幀)等。)測量方法是非侵入式或“無參考”式,S卩,其不需要使用原始信號的副本。該方法 被設(shè)計為在適合的解碼器中使用,由于其要求使用來自編碼后的比特流和解碼后的視頻圖 像二者的參數(shù)。作為第一步,應(yīng)當(dāng)解釋的是,用于訓(xùn)練和測試技術(shù)的視頻數(shù)據(jù)庫由十八個不同的 8-秒序列構(gòu)成,所有序列都具有625-行廣播格式。六個序列來自VQEG階段I的數(shù)據(jù)庫7,而剩余的源自其他地方。由于質(zhì)量參數(shù)基于各序列的持續(xù)時間期間的平均值,因此重 要的是,選擇具有運動和細(xì)節(jié)的一致特征的內(nèi)容。表1中示出序列的細(xì)節(jié)。
權(quán)利要求
1.一種生成表示多個幀的視頻信號的質(zhì)量測度的方法,所述視頻信號具有原始形 式;編碼形式,在該編碼形式中已經(jīng)使用壓縮算法對所述視頻信號進(jìn)行了編碼,該壓縮算法 利用可變量化器步長使得編碼后的信號具有與該可變量化器步長相關(guān)聯(lián)的量化器步長參 數(shù),并且利用了差分編碼使得編碼后的信號含有所述信號的預(yù)測殘差的表示;以及解碼形 式,在該解碼形式中編碼后的視頻信號已經(jīng)至少部分地被再轉(zhuǎn)換成所述原始形式,所述方 法包括以下步驟a)生成根據(jù)預(yù)定關(guān)系取決于所述量化器步長參數(shù)的第一質(zhì)量測度;b)生成掩蔽測度,該掩蔽測度根據(jù)預(yù)定關(guān)系取決于由所述解碼形式的所述視頻信號所 表示的幀的至少一部分的空間復(fù)雜度;以及c)生成混合測度,該混合測度根據(jù)預(yù)定關(guān)系取決于所述第一測度和所述掩蔽測度;其中所述方法還包括以下步驟生成根據(jù)預(yù)定關(guān)系取決于所述信號的所述預(yù)測殘差的第二測度;識別圖像中所述第二測度超過閾值的一個或更多個區(qū)域;并且其中所述掩蔽測度根據(jù)預(yù)定關(guān)系取決于識別出的區(qū)域的所述空間復(fù)雜度。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述預(yù)測殘差的表示是像素域預(yù)測殘差的二維 變換的系數(shù),并且根據(jù)所述系數(shù)來計算所述第二測度。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述變換是離散余弦變換。
4.根據(jù)權(quán)利要求2或權(quán)利要求3所述的方法,其中,所述第二測度是非零變換系數(shù)的個 數(shù)的計數(shù)。
5.根據(jù)權(quán)利要求2或權(quán)利要求3所述的方法,其中,所述第二測度取決于所述變換系數(shù) 的大小。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述第二測度是解碼后系數(shù)的能量和的函數(shù)。
7.根據(jù)在前權(quán)利要求中任一項所述的方法,其中,所述掩蔽測度是以下各項的所述空 間復(fù)雜度的函數(shù)(a)所述圖像中所述第二測度超過閾值的、識別出的區(qū)域;以及(b)所述圖像中的所述第二測度未超過所述閾值但是所述空間復(fù)雜度超過了第二閾值 的一個區(qū)域或多個區(qū)域。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述第二閾值動態(tài)地改變,所述第二閾值是針對 所述識別出的區(qū)域所計算的空間復(fù)雜度的函數(shù)。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述第二閾值等于針對所述識別出的區(qū)域所計 算的空間復(fù)雜度的平均值。
10.根據(jù)在前權(quán)利要求中任一項所述的方法,其中,僅根據(jù)所述圖像中得出所述掩蔽測 度的那些部分得出所述第一質(zhì)量測度。
11.根據(jù)在前權(quán)利要求中任一項所述的方法,其中,通過確定幀中多個位置處的局部對 比度測度,來測量所述空間復(fù)雜度。
12.根據(jù)權(quán)利要求11所述的方法,其中,各幀包括多個像素,并且其中對于給定幀的至 少一些像素,對像素附近的相鄰區(qū)域執(zhí)行比較功能,以獲得關(guān)于該像素的比較值。
13.根據(jù)在前權(quán)利要求中任一項所述的方法,其中,在多個幀上對所述第二測度進(jìn)行平 均化。
全文摘要
本發(fā)明涉及視頻質(zhì)量測量方法,尤其所述視頻信號具有原始形式;編碼形式,在編碼形式中已經(jīng)使用壓縮算法對視頻信號進(jìn)行了編碼,該壓縮算法利用可變量化器步長使得編碼后的信號包括量化器步長參數(shù);以及解碼形式,在解碼形式中編碼后的視頻信號已經(jīng)至少部分地被再轉(zhuǎn)換成原始形式。該方法包括下列步驟a)生成作為所述量化器步長參數(shù)的函數(shù)的第一質(zhì)量測度;b)生成掩蔽測度;以及c)混合所述第一和第二測度。所述掩蔽測度是由解碼形式的視頻信號所表示的幀的一些部分的空間復(fù)雜度的函數(shù),通過生成作為預(yù)測殘差的函數(shù)的第二測度以及識別圖像中第二測度超過閾值的一個或更多個區(qū)域來選擇這些部分。
文檔編號H04N17/00GK102084660SQ200980126237
公開日2011年6月1日 申請日期2009年4月23日 優(yōu)先權(quán)日2008年7月7日
發(fā)明者安德魯·戈登·戴維斯 申請人:英國電訊有限公司