專利名稱:Rho-域量度的制作方法
RHO-域量度相關(guān)申請的交叉引用本申請涉及同時提交的題為“Video Classification Systems and Methods (視頻分類系統(tǒng)和方法)”、“Video Analytics for Security Systems and Methods (用于安全系統(tǒng)和方法的視頻分析學(xué))”以及“Systems And Methods for Video ContentAnalysis (用于視頻內(nèi)容分析的系統(tǒng)和方法)”的專利申請,這些文獻專門通過援引包含于此。附圖
簡述圖I示出幀的一個示例,該示例表現(xiàn)出宏塊中非零系數(shù)(NZ)的存在。圖2是示出NZ(P)和量化參數(shù)的指數(shù)關(guān)系的例子的圖表。圖3是不出作為理論值和實際值之間的遞歸加權(quán)差的P _域偏移量度Θ的圖表。圖4是示出視頻產(chǎn)生系統(tǒng)的簡化方框圖。圖5是示出視頻質(zhì)量量化參數(shù)之間的線性關(guān)系的圖表。圖6是根據(jù)本發(fā)明某些方面的模式判決算法視頻編碼的過程的流程圖。圖7是示出在本發(fā)明某些實施例中采用的處理系統(tǒng)的簡化方框示意圖。發(fā)明的詳細描述現(xiàn)在參照附圖對本發(fā)明的實施例作詳細描述,這些附圖作為解說性示例提供以使本領(lǐng)域內(nèi)技術(shù)人員能夠?qū)崿F(xiàn)本發(fā)明。顯然,下面的附圖和示例不旨在將本發(fā)明的范圍限制在單個實施例,而是可通過互換所述或所示要素的一些或全部而令其它實施例變得可能。只要是適宜的,在所有附圖中將使用相同的附圖標記來表示相同或相似的部件。在這些實施例的某些要素可使用已知組件部分或全部實現(xiàn)的情形下,僅對這些已知組件中對理解本發(fā)明而言必要的那些部分進行描述,并省去對這些已知組件的其它部分的詳細說明以不至于使本發(fā)明晦澀難懂。在本說明書中,示出單一組件的實施例不應(yīng)當(dāng)視為限制;相反,本發(fā)明旨在涵蓋包含多個同一組件的其它實施例,反之亦然,除非在本文中明確聲明其它情形。此外,申請人不打算使說明書或權(quán)利要求書中的任一術(shù)語歸結(jié)于一個不常見或特殊的含 義,除非明確如此闡述。此外,本發(fā)明涵蓋本文中通過解說引述的部件的所有目前和將來知道的等效物。本發(fā)明的某些實施例提供一種創(chuàng)新的P-域量度Θ以及應(yīng)用該量度的系統(tǒng)和方法。在一些實施例中,P-域中的P的定義可以認為是在視頻編碼過程中轉(zhuǎn)換和量化之后的非零系數(shù)的數(shù)目。另外,在這里使用術(shù)語“NZ”來表征P,其中NZ可理解為表示在例如H. 264視頻標準等視頻標準下量化每個16 X 16像素宏塊(MB)之后的非零系數(shù)的數(shù)目。描述NZ計算的一個示例示出于圖I中。已通過理論和實驗證實P與視頻文本編碼位速率具有線性關(guān)系??偟貋碚f,所提出的P-域源模型和模型將位速率R看作P的函數(shù),P是經(jīng)量化的系數(shù)中O所占的百分比。可以理解,P隨著量化步長QP而單調(diào)遞增,這意味著在兩者之間存在一一映射關(guān)系。因此,某些實施例提供基于這些特性的幀級速率控制算法。一些實施例可利用能改善對R-P函數(shù)準確估算的多種適合算法中的任何一種??赏ㄟ^指數(shù)方程對NZ(P)和QP的關(guān)系進行建模,如圖2所示。虛線22表征來自編碼的實際幀級NZ相對于QP點的關(guān)系,而實線23表征指數(shù)函數(shù)模型化。可從該指數(shù)模型中獲得NZ相對于QP的關(guān)系表。在某些實施例中,P -域偏移量度Θ可定義為理論NZ_QP曲線和實際NZ_QP曲線之間的遞歸加權(quán)比,如圖3中所示。一曲線33代表理論NZ_QP曲線而第二曲線32代表在編碼過程中測得的實際的NZ相對于QP的曲線。曲線32、33之間的一種差異可表示為偏移量度Θ,偏移Θ是視頻編碼中的一個重要量度,并被用來確定序列的運動復(fù)雜度,從而確定經(jīng)編碼的視頻質(zhì)量、確定短場景剪切和確定用于最好地滿足預(yù)定義位速率預(yù)算的實際QP。利用P-域偏移量度Θ的視頻產(chǎn)生系統(tǒng)及其應(yīng)用的一個示例中的諸要素的相互配合和相互作用示出于圖4中。所采用的硬件和軟件的結(jié)合一般是根據(jù)場合需要而確定的,且只是為了便于描述而給出圖4中描繪的配置。視頻編碼器400 —般就每個MB和/或每個幀產(chǎn)生多個非零系數(shù)(NZ),作為其視頻編碼過程的副產(chǎn)物。處理NZ信息,并將P-域偏移量度Θ計算作為元數(shù)據(jù)402,以饋送給各種感興趣的算法。偏移Θ的優(yōu)勢在某些實施例中,多個特征可與P域偏移量度Θ關(guān)聯(lián),并能從這些特征中得到某些優(yōu)勢。此外,可優(yōu)化硬件、軟件和各算法以使所得到的優(yōu)勢最大化。在某些實施例中,可使用Θ對視頻運動復(fù)雜度進行分類。一種模式判決系統(tǒng)404可利用P-域量度Θ來獲得優(yōu)化的判決過程??蓪⑵痞ǘx為理論NZ_QP曲線與從編碼過程獲得的實際曲線的加權(quán)差。經(jīng)歸一化的Θ在值I. O周圍波動。小于I的θ值表不實際編碼的位速率大于預(yù)期的位速率,這暗示著已遇到更復(fù)雜的運動背景內(nèi)容。大于I. O的Θ值表示較少的NZ被編碼,這暗示著已遇到較平滑的運動內(nèi)容。在一些實施例中,可使用Θ來計算經(jīng)編碼的視頻質(zhì)量曲線Lq。經(jīng)編碼的視頻質(zhì)量Q與在例如圖4所示的編碼過程中使用的量化參數(shù)QP具有線性關(guān)系。線性模型Q_QP可從實驗數(shù)據(jù)獲得。Q_QP線性模型可基于偏移Θ來調(diào)整S卩,質(zhì)量和QP關(guān)系是擬編碼的視頻內(nèi)容的運動復(fù)雜度的函數(shù)。經(jīng)調(diào)整的0_0 模型可充當(dāng)視頻內(nèi)容的目標質(zhì)量曲線。如果設(shè)定了目標質(zhì)量,則實際QP是偏移Θ的函數(shù),并能得到QP和Θ的關(guān)系表。目標質(zhì)量視頻編碼算法可使用簡單的查表操作來實現(xiàn)。在某些實施例中,可使用Θ來確定視頻場景的變化。從實驗可以看出,非零系數(shù)(NZ)的數(shù)目在場景變化P-幀中增加了多倍,這是因為在場景變化幀及其基準幀之間缺乏臨時關(guān)聯(lián)。因此,某些實施例利用偏移Θ以良好的強健度和非常低的計算復(fù)雜度來確定場
景變化。某些實施例將Θ和NZ_QP曲線結(jié)合以獲得更準確的位速率。可調(diào)整NZ_QP曲線以反映對于給定視頻序列的更準確的編碼位速率。因此,可在偏移量度Θ的輔助下達到更準確的速率控制編碼。示例恒定位速率(CBR)控制某些實施例基于涉及視頻場景變化的前述偏移Θ特征并整合Θ和NZ_QP曲線,使用高效且準確的恒定位速率控制方法和算法406。為了闡述的目的,將一組圖象(GOP)定義為從內(nèi)部編碼的幀(“I-幀”)開始并隨后是多個內(nèi)部預(yù)測幀(“P/B-幀”)的一組圖象??筛鶕?jù)每個GOP的目標位速率,將目標位預(yù)算賦予每個I幀或P/B幀?;谶f歸加權(quán)偏移Θ的經(jīng)調(diào)整的NZ-QP表可反映基于更準確內(nèi)容的NZ-QP關(guān)系??蓪M編碼的當(dāng)前幀適應(yīng)性、地估算預(yù)測的NZ值,并可從NZ_QP曲線計算出量化參數(shù)QP以控制當(dāng)前幀的位速率。如果偏移Θ突然改變至閾值之上,則可指出場景變化的檢測結(jié)果,并可重置速率控制算法。通過利用偏移Θ,可設(shè)計和實現(xiàn)成本有效且強健的CBR算法。示例質(zhì)量約束的可變位速率(VBR)控制在CBR狀況涉及視頻運動和不定復(fù)雜度的某些實施例中,每個幀可被賦予相同位速率并以該位速率編碼,這導(dǎo)致視頻質(zhì)量的臨時差異。人類視覺系統(tǒng)理論建議人類的視覺對運動變化(時間方向)和紋理復(fù)雜度(空間視頻內(nèi)容)敏感。因此,可通過將更多的位分配給處于時間和空間變化的視頻幀,并通過將較少的位分配給平滑的運動和文本簡單的視頻幀同時利用量度Θ仍然維持一目標最低視頻質(zhì)量(質(zhì)量約束),來提供一質(zhì)量約束的可變位速率算法408。如前所述,可使用對視頻運動復(fù)雜度作出分類的算法和方法來對運動/文本變化的幀作出分類。如前面進一步描述的,可使用9_(^表以及QP和Θ的關(guān)系表用預(yù)定義的最低質(zhì)量約束平滑的幀和紋理簡單的幀。可使用有關(guān)視頻場景變化的前述的偏移Θ特征并整合Θ和NZ_QP曲線來將經(jīng)編碼的位控制至目標位速率。 示例網(wǎng)絡(luò)適應(yīng)性可變幀速率控制當(dāng)回放通過網(wǎng)絡(luò)傳輸?shù)囊曨l流時,網(wǎng)絡(luò)波動會嚴重地影響用戶的感受質(zhì)量(QOP)。為了適應(yīng)網(wǎng)絡(luò)波動,可在rho-域量度Θ的輔助下設(shè)計網(wǎng)絡(luò)適應(yīng)性可變幀速率算法410??刹捎媚承┣笆龅南到y(tǒng)和方法來獲得適當(dāng)?shù)目勺儙俾?VFR)算法,如圖6所示。在步驟600,網(wǎng)絡(luò)提供反饋,該反饋包括用戶定義的最低視頻質(zhì)量、視頻信道優(yōu)先級以及網(wǎng)絡(luò)帶寬可用性。在步驟602,基于偏移Θ及其對應(yīng)的速率控制實現(xiàn)來計算量化參數(shù)QP。在步驟604并基于偏移Θ,可因此相應(yīng)地對視頻運動復(fù)雜度作分類,并可計算相對于最低質(zhì)量需求的新的量化參數(shù)QP_1。在步驟606,計算QP和QP_1之間的量化參數(shù)差Diff_QP?;贒iff_QP和預(yù)先計算出的Diff_QP相對于幀速率的關(guān)系表,可獲得擬編碼的新幀速率。在某些實施例中,高優(yōu)先級信道的幀速率盡可能地維持不變。如果遇到較大的Diff_QP,可推薦和/或執(zhí)行編碼圖象分辨率的規(guī)模下調(diào)(downsizing)(例如從 Dl 至 CIF)。系統(tǒng)描述現(xiàn)在轉(zhuǎn)向圖7,本發(fā)明的某些實施例利用一處理系統(tǒng),該處理系統(tǒng)包括被部署成執(zhí)行前述某些步驟的至少一個計算系統(tǒng)70。計算系統(tǒng)70可以是市面上可購得的系統(tǒng),該系統(tǒng)執(zhí)行例如Microsoft Windows , UNIX或其變體、Linux、實時操作系統(tǒng)和/或私人操作系統(tǒng)等市面上可購得的操作系統(tǒng)。可調(diào)整、配置和/或設(shè)計計算系統(tǒng)的架構(gòu),以將其整合入處理系統(tǒng)中、嵌入到圖象捕獲系統(tǒng)、通信設(shè)備和/或圖形處理系統(tǒng)中的一個或多個中。在一個示例中,計算系統(tǒng)70包括總線702和/或用來在處理器之間通信的其他機制,不管這些處理器是與計算系統(tǒng)70集成的處理器(例如704、705)還是位于不同的、可能是物理上分離的計算系統(tǒng)700中的處理器。一般來說,處理器704和/或705包括CISC或RISC計算處理器和/或一個或多個數(shù)字信號處理器。在一些實施例中,處理器704和/或705可實現(xiàn)在定制設(shè)備中和/或作為可配置的定序器來執(zhí)行。設(shè)備驅(qū)動器703可提供輸出信號,該輸出信號用來控制內(nèi)部和外部組件并在處理器704、705之間通信。計算系統(tǒng)70 —般還包括存儲器706,該存儲器706可包括隨機存取存儲器(RAM)、靜態(tài)存儲器、高速緩沖存儲器、閃存和任何其他合適類型的能耦合至總線702的存儲設(shè)備中的一種或多種。存儲器706可用來存儲指令和數(shù)據(jù),該指令和數(shù)據(jù)能使一個或多個處理器704、705執(zhí)行所需的過程。主存儲器706可用于存儲瞬時數(shù)據(jù)和/或臨時數(shù)據(jù),例如在由處理器704或705執(zhí)行指令期間產(chǎn)生和/或使用的變量和中間信息。計算系統(tǒng)70 —般還包括非易失性存儲設(shè)備,例如只讀存儲器(ROM) 708、閃存、存儲卡或類似物;非易失性存儲設(shè)備可連接至總線702,但也可等同地使用耦合至總線702的高速通用串行總線(USB)、防火墻或其它這類總線進行連接。非易失性存儲設(shè)備可用于存儲配置、以及其它信息,所述其它信息包括由處理器704和/或705執(zhí)行的指令。非易失性存儲設(shè)備也可包括海量存儲設(shè)備710,例如磁盤、光盤、閃存盤,該海量存儲設(shè)備710可直接或間接地耦合至總線702,并用來存儲擬由處理器704和/或705執(zhí)行的指令,以及其它信息。在一些實施例中,計算系統(tǒng)70可按通信方式耦合至例如IXD平板顯示器等顯示系統(tǒng)712,包括觸摸屏顯示器、場致發(fā)光顯示器、等離子體顯示器、陰極射線管,或能夠被配置和適配成接收信息并將信息顯示給計算系統(tǒng)70使用者的其它顯示設(shè)備。一般來說,設(shè)備驅(qū)動器703可包括顯示驅(qū)動器、圖形適配器,和/或維持顯示的數(shù)字表示并將該數(shù)字表示轉(zhuǎn)換成用于驅(qū)動顯示系統(tǒng)712的信號的其它模塊。顯示系統(tǒng)712也可包括從由系統(tǒng)700提供的信號中生成顯示的邏輯或軟件。在這一點上,顯示器712可作為遠程終端來提供,或在會議 期間在一不同的計算系統(tǒng)70上提供。輸入設(shè)備714 —般在本地提供或通過遠程系統(tǒng)提供,且一般提供字母數(shù)字輸入以及光標控制716輸入(例如鼠標、跟蹤球等)。應(yīng)當(dāng)理解,可將輸入和輸出提供給例如PDA、薄箋式電腦等無線設(shè)備,或經(jīng)適當(dāng)配置用以顯示圖像并提供用戶輸入的其它系統(tǒng)。根據(jù)本發(fā)明的一個實施例,所描述的本發(fā)明的一些部分可通過計算系統(tǒng)70來實現(xiàn)。處理器704執(zhí)行一個或多個指令序列。例如,在已經(jīng)從例如存儲設(shè)備710等計算機可讀介質(zhì)接收到指令之后,這些指令可存儲在主存儲器706內(nèi)。執(zhí)行主存儲器706中包含的指令序列使處理器704根據(jù)本發(fā)明的某些方面執(zhí)行過程步驟。在某些實施例中,可由執(zhí)行專項功能的嵌入式計算系統(tǒng)來提供功能,其中嵌入式系統(tǒng)采用硬件和軟件的定制組合來執(zhí)行一組預(yù)定義的任務(wù)。因此,本發(fā)明的實施例不限于硬件電路和軟件的任何特定的組合。術(shù)語“計算機可讀介質(zhì)”用來定義能夠存儲指令和其它數(shù)據(jù)并將其提供至處理器704和/或705的任何介質(zhì),尤其在所述指令將由處理器704和/或705執(zhí)行,和/或由處理系統(tǒng)的其它外圍設(shè)備執(zhí)行的情形下。這種介質(zhì)可包括非易失性存儲設(shè)備、易失性存儲設(shè)備以及傳輸媒體。非易失性存儲設(shè)備可體現(xiàn)為例如光盤或磁盤(包括DVD、CD-ROM和藍光盤)之類的媒體。存儲設(shè)備可在本地提供并實體靠近處理器704、705,或者一般通過使用網(wǎng)絡(luò)連接來遠程地提供。非易失性存儲設(shè)備可從計算系統(tǒng)704中移去,如同那些使用包括USB等標準接口而能方便地連接于計算機或從計算機斷開的藍光、DVD或⑶存儲器或記憶卡或者記憶棒那樣。因此,計算機可讀媒體可包括軟盤、柔性盤、硬盤、磁帶、任何其它磁性介質(zhì)、CD-ROM、DVD、藍光、任何其它光學(xué)介質(zhì)、穿孔卡片、紙帶、具有孔圖案的任何其它物理介質(zhì)、RAM、PROM、EPROM、FLASH/EEPR0M、任何其它存儲器芯片或磁帶盒,或者計算機可從中讀取內(nèi)容的任意其它介質(zhì)。傳輸媒體可用來連接處理系統(tǒng)的部件和/或計算系統(tǒng)70的組件。該媒體可包括雙絞線、同軸電纜、銅線和光纖。傳輸媒體也可包括無線媒體,例如無線電波、聲波和光波。在特定的無線電頻率(RF)下,可使用光纖和紅外(IR)數(shù)據(jù)通信。各種形式的計算機可讀媒體可參與提供指令和數(shù)據(jù)以供處理器704和/或705執(zhí)行。例如,最初可從遠端計算機的磁盤中撿取指令,并通過網(wǎng)絡(luò)或調(diào)制解調(diào)器將指令傳輸至計算系統(tǒng)70。指令可選擇地在執(zhí)行前或執(zhí)行期間存儲在不同的存儲設(shè)備中或存儲在存儲設(shè)備的不同部分中。計算系統(tǒng)70可包括通信接口 718,該通信接口 718提供在網(wǎng)絡(luò)720上的雙向數(shù)據(jù)通信,網(wǎng)絡(luò)720可包括局域網(wǎng)722、廣域網(wǎng)或兩者的某些組合。例如,綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)可結(jié)合局域網(wǎng)(LAN)予以使用。在另一示例中,LAN可包括無線鏈路。網(wǎng)絡(luò)鏈路720 —般提供通過一個或多個網(wǎng)絡(luò)至其它數(shù)據(jù)設(shè)備的數(shù)據(jù)通信。例如,網(wǎng)絡(luò)鏈路720可提供通過局域網(wǎng)722至主計算機724或至例如互聯(lián)網(wǎng)728等廣域網(wǎng)的連接。局域網(wǎng)722和互聯(lián)網(wǎng)728兩者均可使用攜帶數(shù)字數(shù)據(jù)流的電信號、電磁信號或光信號。計算系統(tǒng)70可使用一個或多個網(wǎng)絡(luò)來發(fā)送消息和數(shù)據(jù),包括程序碼和其它信息。在互聯(lián)網(wǎng)的示例中,服務(wù)器730可通過互聯(lián)網(wǎng)728發(fā)送對一應(yīng)用程序的請求碼,并可作為響應(yīng)接收一下載的應(yīng)用,該下載的應(yīng)用提供或增添如前面示例中描述的那些功能性模塊。接收的碼可由處理器704和/或705執(zhí)行。 本發(fā)明某些方面的附加說明本發(fā)明的前述說明是解說性而非限定性的。例如,本領(lǐng)域內(nèi)技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明可通過前述功能和能力的各種組合來實現(xiàn),并可包括比前述更少或更多的部件。下面闡述本發(fā)明的某些附加方面和特征,并且這些附加方面和特征可使用前面更詳細描述的功能和部件來獲得,如本領(lǐng)域內(nèi)技術(shù)人員在受到本公開教示后所能理解的那樣。本發(fā)明的某些實施例提供視頻編碼器、系統(tǒng)和方法,用于表征視頻變化過程。一些這樣的實施例包括維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個非零系數(shù)與視頻編碼過程中使用的一個或多個量化參數(shù)相關(guān)聯(lián)。一些這樣的實施例包括在宏塊的視頻編碼期間產(chǎn)生實際的非零系數(shù)。一些這樣的實施例包括計算偏移量度,該偏移量度表示實際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差。一些這樣的實施例包括使用偏移量度來調(diào)整視頻編碼過程。在一些這樣的實施例中,視頻編碼過程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。在一些這樣的實施例中,使用偏移量度調(diào)整視頻編碼過程包括基于偏移量度的歸一化值來調(diào)整量化參數(shù)。在一些這樣的實施例中,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運動復(fù)雜度的函數(shù)。在一些這樣的實施例中,歸一化偏移量度值在值I. O周圍變動。在一些這樣的實施例中,大于I. O的歸一化偏移量度值指示大于預(yù)期的編碼位速率。在一些這樣的實施例中,歸一化偏移量度值的增加指示運動背景內(nèi)容的復(fù)雜度的增加。在一些這樣的實施例中,量化參數(shù)是偏移量度的函數(shù)。在一些這樣的實施例中,使用偏移量度來調(diào)整視頻編碼過程包括使用偏移量度來選擇量化參數(shù)以對一表格作出索引。一些這樣的實施例包括使用偏移量度選擇編碼模式的步驟。在一些這樣的實施例中,選擇編碼模式以為幀編碼維持恒定位速率。一些這樣的實施例包括基于幀序列之間的時間和空間變化,將多個位分配給多個幀的步驟。在一些這樣的實施例中,位被分配以維持目標最低視頻質(zhì)量。本發(fā)明的某些實施例提供視頻編碼器和相關(guān)的方法。一些這樣的實施例包括存儲設(shè)備,該存儲設(shè)備配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個非零系數(shù)與視頻編碼過程中所用的一個或多個量化參數(shù)相關(guān)聯(lián)。一些這樣的實施例包括編碼器,該編碼器配置成接收視頻幀序列并對這些視頻幀內(nèi)的宏塊進行編碼。在一些這樣的實施例中,編碼器在宏塊的視頻編碼期間產(chǎn)生實際的非零系數(shù)。一些這樣的實施例包括受編碼器控制的量化參數(shù)的表。在一些這樣的實施例中,編碼器使用偏移量度來選擇當(dāng)前宏塊的量化參數(shù),其中所述偏移量度表示實際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差。在一些這樣的實施例中,視頻編碼過程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。在一些這樣的實施例中,量化參數(shù)是使用偏移量度的歸一化值選擇的。在一些這樣的實施例中,選擇量化參數(shù)以達到目標視頻編碼質(zhì)量。在一些這樣的實施例中,視頻編碼質(zhì)量和量化參數(shù)是通過視頻幀序列的運動復(fù)雜度的函數(shù)關(guān)聯(lián)的。在一些這樣的實施例中,該方法是由視頻編碼器中被配置成執(zhí)行一個或多個計算機程序模塊的處理器實現(xiàn)的。盡管已參照特定示例性實施例對本發(fā)明進行了描述,然而本領(lǐng)域內(nèi)普通技術(shù)人員 顯然知道,可對這些實施例作出各種修改和變化而不脫離本發(fā)明較寬的精神和范圍。因此,說明書和附圖被認為是解說性而非限制性意義。
權(quán)利要求
1.一種用于表征視頻編碼過程的方法,包括下列步驟 維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個非零系數(shù)與視頻編碼過程中使用的一個或多個量化參數(shù)相關(guān)聯(lián); 在所述宏塊的視頻編碼期間,產(chǎn)生實際的非零系數(shù); 計算偏移量度,其中所述偏移量度表示所述實際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差; 使用所述偏移量度調(diào)整所述視頻編碼過程,其中所述視頻編碼過程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
2.如權(quán)利要求I所述的方法,其特征在于,使用偏移量度調(diào)整視頻編碼過程的所述步驟包括基于所述偏移量度的歸一化值調(diào)整所述量化參數(shù)。
3.如權(quán)利要求2所述的方法,其特征在于,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運動復(fù)雜度的函數(shù)。
4.如權(quán)利要求2或3所述的方法,其特征在于,所述歸一化偏移量度值在值I.O周圍變動,其中大于I. O的歸一化偏差量度值指示大于預(yù)期的編碼位速率。
5.如權(quán)利要求2或3所述的方法,其特征在于,所述歸一化偏移量度值的增加指示運動背景內(nèi)容的復(fù)雜度的增加。
6.如權(quán)利要求2-5中任何一項所述的方法,其特征在于,所述量化參數(shù)是所述偏移量度的函數(shù)。
7.如權(quán)利要求2-6中任何一項所述的方法,其特征在于,使用偏移量度來調(diào)整視頻編碼過程的所述步驟包括使用偏移量度來選擇量化參數(shù)以對表格作出索引。
8.如權(quán)利要求1-7中任何一項所述的方法,其特征在于,還包括使用所述偏移量度來選擇編碼模式的步驟,其中選擇所述編碼模式以為幀編碼維持恒定位速率。
9.如權(quán)利要求1-7中任何一項所述的方法,其特征在于,還包括基于幀序列之間的時間和空間變化將多個位分配給多個幀的步驟,其中分配所述多個位以維持目標最低視頻質(zhì)量。
10.一種視頻編碼器,包括 存儲設(shè)備,所述存儲設(shè)備配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個非零系數(shù)與視頻編碼過程中使用的一個或多個量化參數(shù)相關(guān)聯(lián);編碼器,所述編碼器配置成接收視頻幀序列并對所述視頻幀內(nèi)的宏塊進行編碼,其中所述編碼器在所述宏塊的視頻編碼期間產(chǎn)生實際的非零系數(shù); 受編碼器控制的量化參數(shù)表,其中所述編碼器使用偏移量度來選擇當(dāng)前宏塊的量化參數(shù),其中所述偏移量表示所述實際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差,所述視頻編碼過程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
11.如權(quán)利要求10所述的視頻編碼器,其特征在于,所述量化參數(shù)是使用所述偏移量度的歸一化值來選擇的。
12.如權(quán)利要求10或11所述的視頻編碼器,其特征在于,選擇所述量化參數(shù)以達到目標視頻編碼質(zhì)量。
13.如權(quán)利要求12所述的視頻編碼器,其特征在于,視頻編碼質(zhì)量和量化參數(shù)是通過視頻幀序列的運動復(fù)雜度的函數(shù)關(guān)聯(lián)的。
14.一種視頻編碼的方法,所述方法由視頻編碼器中被配置成執(zhí)行一個或多個計算機程序模塊的處理器執(zhí)行,所述方法包括下列步驟 在處理器上執(zhí)行一個或多個計算機程序模塊,所述一個或多個計算機程序模塊配置成維持信息,其中所述信息將從宏塊的量化中預(yù)期得到的多個非零系數(shù)與視頻編碼過程中使用的一個或多個量化參數(shù)相關(guān)聯(lián); 在處理器上執(zhí)行一個或多個計算機程序模塊,所述一個或多個計算機程序模塊配置成在所述宏塊的視頻編碼期間產(chǎn)生實際的非零系數(shù); 在處理器上執(zhí)行一個或多個計算機程序模塊,所述一個或多個計算機程序模塊配置成計算表示所述實際的非零系數(shù)和所述預(yù)期的非零系數(shù)之間的加權(quán)差的偏移量度; 在處理器上執(zhí)行一個或多個計算機程序模塊,所述一個或多個計算機程序模塊配置成使用所述偏移量度調(diào)整視頻編碼過程,其中所述視頻編碼過程被調(diào)整,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。
15.如權(quán)利要求14所述的方法,其特征在于,使用偏移量度調(diào)整視頻編碼過程的所述步驟包括基于所述偏移量度的歸一化值來調(diào)整所述量化參數(shù)。
16.如權(quán)利要求15所述的方法,其特征在于,視頻編碼質(zhì)量和量化參數(shù)之間的關(guān)系是擬編碼的視頻幀序列的運動復(fù)雜度的函數(shù)。
17.如權(quán)利要求15或16所述的方法,其特征在于,所述歸一化偏移量度值在值I.O周圍變動,其中大于I. O的歸一化偏差量度值指示大于預(yù)期的編碼位速率。
18.如權(quán)利要求15或16所述的方法,其特征在于,所述歸一化偏移量度值的增加指示運動背景內(nèi)容的復(fù)雜度的增加。
全文摘要
記載了視頻編碼器、系統(tǒng)和方法,所述視頻編碼器、系統(tǒng)和方法表征了使用ρ-域偏移量度的視頻編碼過程。偏移量度表示實際的非零系數(shù)和預(yù)期的非零系數(shù)之間的加權(quán)差,所述實際系數(shù)和預(yù)期系數(shù)對應(yīng)于視頻幀的視頻編碼期間對該視頻幀內(nèi)的宏塊的量化。通過基于偏移量度的歸一化值來選擇量化參數(shù),用所述偏移量度調(diào)整視頻編碼過程,以便為所需的視頻編碼質(zhì)量獲得優(yōu)化的編碼位速率。量化參數(shù)可從使用偏移量度來索引的表中選擇。
文檔編號H04N7/26GK102714722SQ201080061990
公開日2012年10月3日 申請日期2010年9月2日 優(yōu)先權(quán)日2010年9月2日
發(fā)明者F·尤, F·施, 吳琦, 王標, 鮑鎧 申請人:英特賽爾美國股份有限公司