公開了一種用于將視頻編碼為比特流的方法和裝置。還公開了相應的解碼方法和裝置。至少一些實施例進一步涉及視頻壓縮方案中的幀間編碼塊的雙預測(bi-prediction)。
背景技術:
1、一個或多個實現方式的技術領域主要涉及視頻壓縮。為了實現高壓縮效率,圖像和視頻編碼方案通常采用預測和變換以利用視頻內容中的空間和時間冗余。通常,幀內或幀間預測用于利用幀內或幀間相關性,然后對原始塊與預測塊之間的差(其通常被表示為預測誤差或預測殘差)進行變換、量化和熵編碼。為了重構所述視頻,通過與所述熵編碼、量化、變換和預測相對應的逆處理來對所述壓縮數據進行解碼。在hevc視頻壓縮標準(也稱為推薦itu-th.265)中,幀間預測中使用的雙預測過程包括對2個單向預測信號求平均。圖1示出了hevc中的雙預測過程。如圖1所示,2個單向預測的平均是以比輸入比特深度或內部比特深度更高的精度進行的。雙預測公式如方程式1所示,其中偏移(offset)和移位(shift)用于將最終預測值(predictor)歸一化到輸入比特深度:
2、pbidir=(pl0+pl1+offset)>>shift???方程式1
3、由于在中間級中沒有舍入,hevc內插濾波器允許某些實現方式優(yōu)化。
4、視頻壓縮技術的最新補充包括各種工業(yè)標準、各種版本的參考軟件和/或文檔,例如由jvet(聯合視頻探索團隊)組開發(fā)的聯合探索模型(jem)和后來的vtm(通用視頻編碼(vvc)測試模型)。目標是對現有hevc(高效視頻編碼)標準做進一步改進。例如,在視頻編解碼器的更新近的方法中,多個權重被用于對2個單向預測進行平均以獲得雙向預測。通常,所使用的權重是{-1/4,5/4},{3/8,5/8}或{1/2,1/2}({1/2,1/2}是在hevc中實現的權重),并且所述雙預測公式如方程式2中那樣被修改。對于整個塊只使用一個權重。
5、pbidir=((1-w1)*pl0+w1*pl1+offset)>>shift???方程式2
6、在視頻編解碼器的另一方法中,在合并模式中使用三角形預測。圖2示出了將編碼單元cu分割成兩個三角形預測單元。如圖2中所示,在沿著對角線邊緣的對角線或逆對角線方向上,將cu分割成兩個三角形預測單元pu0和pu1。cu中的每一三角形預測單元是使用其自身的運動向量和從合并候選列表導出的參考幀索引而被幀間預測的。在此上下文中,將自適應加權過程應用于所述兩個三角形預測單元之間的對角線或逆對角線邊緣,以導出整個cu的最終預測。圖3示出了對所述兩個三角形預測單元之間的對角線邊緣的加權過程。所述三角形預測單元模式僅應用于跳過或合并模式中的cu。當將所述三角形預測單元模式應用于所述cu時,用信號發(fā)送指示一將所述cu分割成兩個三角形預測單元的方向的索引以及所述兩個三角形預測單元的運動向量。對于兩個預測單元,可導出具有5個單向預測值的公共列表,檢查與經典合并過程中相同的空間和時間位置,但是僅使用單向向量。如果沒有足夠的候選,則不將冗余運動向量添加到所述列表中,并且在所述列表的末尾添加零運動向量。對于給定的預測單元,運動向量預測值的數量是5,對于每個對角線,測試20個組合(5*4=20,相同的運動向量預測值不能用于兩個pu)。所述索引的范圍從0到39,并且參見表2,使用該查找表來從所述索引中導出每個pu的分割方向和運動向量。給定三元組的第一元素給出了對角線方向,第二和第三元素分別給出了pu0和pu1的預測值索引。索引語法如表1所示。
7、
8、表1:三角形分區(qū)和對應的合并索引語法
9、
10、表2:用于確定對角線方向和預測值的查找表
11、圖4示出了根據特定壓縮方案的用于三角形分區(qū)的子塊運動向量存儲。在一種實現方式中,為每個4×4子塊存儲運動向量。當三角形分區(qū)用于cu時,用于每一分區(qū)的運動向量以相同方式針對每一子塊而被存儲,但對于邊緣上的子塊,僅存儲來自一個pu的運動向量,如圖4中所示。
12、幀間編碼塊的雙預測與三角形分區(qū)的組合引發(fā)實施問題。因此,需要一種用于雙預測的較少計算的方法。因此,揭示若干實施例以改進關于幀間編碼塊的雙預測。
技術實現思路
1、根據本公開的一方面,公開了一種用于對圖片進行編碼的方法。此方法包括:使用第一參考圖片獲得所述圖片的塊的第一預測值;使用第二參考圖片獲得所述圖片的所述塊的第二預測值;使用所述第一預測值及所述第二預測值來形成用于雙預測幀間預測中的所述圖片的所述塊的第三預測值,其中所述第三預測值是作為所述第一預測值與所述第二預測值的加權平均值而被獲得的;并且其中所述第三預測值的樣本通過將第一權重應用于所述第一預測值的樣本并且通過將第二權重應用于所述第二預測值的樣本來獲得;所述第三預測值的所述樣本、所述第一預測值的所述樣本和所述第二預測值的所述樣本共享所述塊中的相同位置;并且第一權重和第二權重取決于所述樣本在所述塊中的所述位置。
2、根據本公開的另一方面,公開了一種用于對圖片進行編碼的裝置。用于使用第一參考圖片獲得所述圖片的塊的第一預測值的裝置;用于使用第二參考圖片獲得所述圖片的所述塊的第二預測值的裝置;用于使用所述第一預測值及所述第二預測值在雙預測幀間預測中形成所述圖片的所述塊的第三預測值的裝置,其中所述第三預測值是作為所述第一預測值與所述第二預測值的加權平均值而被獲得的;并且其中所述第三預測值的樣本通過將第一權重應用于所述第一預測值的樣本并且通過將第二權重應用于所述第二預測值的樣本來獲得;所述第三預測值的所述樣本、所述第一預測值的所述樣本和所述第二預測值的所述樣本共享所述塊中的相同位置;并且第一權重和第二權重取決于所述樣本在所述塊中的所述位置。.
3、根據本公開的一方面,提供了一種用于對圖片進行編碼的裝置,該裝置包括處理器和耦合到處理器的至少一個存儲器,該處理器被配置為實現所述編碼方法的任何變型。
4、根據本公開的另一方面,公開了一種用于對視頻進行解碼的方法。該方法包括:在比特流中接收經編碼的視頻數據,且針對運動補償,使用第一參考圖片獲得所述圖片的塊的第一預測值;使用第二參考圖片獲得所述圖片的所述塊的第二預測值;使用所述第一預測值及所述第二預測值來形成用于雙預測幀間預測中的所述圖片的所述塊的第三預測值,其中所述第三預測值是作為所述第一預測值與所述第二預測值的加權平均值而被獲得的;并且其中所述第三預測值的樣本通過將第一權重應用于所述第一預測值的樣本并且通過將第二權重應用于所述第二預測值的樣本來獲得;所述第三預測值的所述樣本、所述第一預測值的所述樣本和所述第二預測值的所述樣本共享所述塊中的相同位置;并且其中第一權重和第二權重取決于所述樣本在所述塊中的所述位置。
5、根據本公開的另一方面,公開了一種用于對視頻進行解碼的裝置。此裝置包括:用于在比特流中接收經編碼的視頻數據的裝置和用于處理運動補償的裝置,所述用于處理運動補償的裝置進一步包括用于使用第一參考圖片獲得圖片的塊的第一預測值的裝置;用于使用第二參考圖片獲得所述圖片的所述塊的第二預測值的裝置;用于使用所述第一預測值及所述第二預測值在雙預測幀間預測中形成所述圖片的所述塊的第三預測值的裝置,其中所述第三預測值是作為所述第一預測值與所述第二預測值的加權平均值而被獲得;其中所述第三預測值的樣本通過將第一權重應用于所述第一預測值的樣本并且通過將第二權重應用于所述第二預測值的樣本來獲得;所述第三預測值的所述樣本、所述第一預測值的所述樣本和所述第二預測值的所述樣本共享所述塊中的相同位置;并且其中第一權重和第二權重取決于所述樣本在所述塊中的所述位置。
6、根據本公開的一方面,提供了一種用于解碼視頻的裝置,該裝置包括處理器和耦合到處理器的至少一個存儲器,該處理器被配置為在比特流中接收所編碼的視頻數據并且實現所述解碼方法的任何變型。
7、本公開還提供了一種信號,該信號包括根據前述說明中的任一項的方法或裝置生成的視頻數據。本發(fā)明實施例還提供了一種包括指令的計算機程序產品,當由計算機執(zhí)行時,所述指令使計算機執(zhí)行所描述的方法。
8、本公開還提供了一種計算機可讀存儲介質,其上存儲有根據上述方法生成的比特流。本公開還提供了一種用于發(fā)送根據上述方法生成的比特流的方法和裝置。
9、以上給出了本主題的簡化概述,以便提供對本主題實施例的一些方面的基本理解。本概述不是對本主題的詳盡綜述。其并非旨在標識各實施例的關鍵/重要元素或描繪本主題的范圍。其唯一目的是以簡化形式呈現本主題的一些概念,作為稍后呈現的更詳細描述的序言。
10、從以下參照附圖進行的對說明性實施例的詳細描述中,本公開的附加特征和優(yōu)點將變得顯而易見