用于發(fā)送可縮放的視頻比特流的方法和設備的制作方法

文檔序號：7609980閱讀：232來源：國知局

專利名稱：用于發(fā)送可縮放的視頻比特流的方法和設備的制作方法
技術領域：
本發(fā)明涉及一種用于發(fā)送可縮放的(scalable)視頻流的方法和設備，具體上涉及一種用于通過按照用戶的發(fā)送請求處理可縮放的比特流而提供適合于網(wǎng)絡和用戶的環(huán)境的視頻內(nèi)容的方法和設備。
背景技術：
隨著包括因特網(wǎng)的信息通信技術的發(fā)展，視頻通信以及文本和語音通信已經(jīng)得到爆炸性的增長。
因為多媒體數(shù)據(jù)的數(shù)量通常較大，所以多媒體數(shù)據(jù)需要大容量存儲媒體和用于傳輸?shù)膶拵?。因此，需要一種壓縮編碼方法來發(fā)送包括文本、視頻和音頻的多媒體數(shù)據(jù)。
數(shù)據(jù)壓縮的基本原則在于消除數(shù)據(jù)冗余?？梢酝ㄟ^下述方式來壓縮數(shù)據(jù)通過消除空間冗余、時間冗余或考慮到人的視力和對高頻的有限感知的心理視覺冗余(mental visual redundancy)，其中在所述空間冗余中，在圖像中重復同一顏色或?qū)ο?，在所述時間冗余中，在運動圖像中的相鄰幀之間有很小的改變，或在音頻中重復同一聲音。
數(shù)據(jù)壓縮可以按照源數(shù)據(jù)是否丟失而分類成有損/無損壓縮、按照是否獨立地壓縮各個幀而分類成幀內(nèi)/幀間壓縮、按照壓縮所需要的時間是否與恢復所需要的時間相同而分類成對稱/不對稱壓縮。
當壓縮/恢復時延不超過50毫秒時，數(shù)據(jù)壓縮被定義為實時壓縮，當幀具有不同的分辨率時，數(shù)據(jù)壓縮被定義為可伸縮的壓縮。
對于文本或醫(yī)療數(shù)據(jù)，通常使用無損壓縮。對于多媒體數(shù)據(jù)，通常使用有損壓縮。
同時，通常使用幀內(nèi)壓縮來消除空間冗余，而通常使用幀間壓縮來消除時間冗余。
用于多媒體的不同類型的傳輸媒體具有不同的性能。
當前使用的傳輸媒體具有各種傳輸率。例如，超高速通信網(wǎng)絡可以傳輸每秒幾十兆比特的數(shù)據(jù)，而移動通信網(wǎng)絡具有每秒384千比特的傳輸率。
在諸如運動圖像專家組(MPEG)-1、MPEG-2、H.263和H.264之類的傳統(tǒng)視頻編碼方法中，通過基于運動估計和補償?shù)倪\動補償來消除時間冗余，而通過變換編碼來消除空間冗余。
這些方法具有滿意的壓縮率，但是它們不具有實際的可伸縮比特流的靈活性，這是因為它們在主要算法中使用自反手段(reflexive approach)。
因此，為了支持具有各種速度的傳輸媒體或以適合于傳輸環(huán)境的數(shù)據(jù)率來發(fā)送多媒體，諸如子波視頻編碼和子帶視頻編碼之類的、具有可伸縮性的數(shù)據(jù)編碼方法可適合于多媒體環(huán)境。
可伸縮性表示部分解碼單個壓縮比特流的能力。可伸縮性包括空間可伸縮性，用于表示視頻分辨率；信噪比(SNR)可伸縮性，用于表示視頻質(zhì)量級；時間可伸縮性，用于表示幀速率；及其組合。
可伸縮的視頻編碼涉及壓縮原始圖像，并且將其轉(zhuǎn)換為具有期望質(zhì)量的視頻信號以發(fā)送到解碼器。解碼器解壓縮和重放所接收的視頻信號。

發(fā)明內(nèi)容
技術問題通常，因為消費者在購買之前需要知道內(nèi)容是否是他/她所需要的，因此消費者需要預覽所述內(nèi)容的細節(jié)。在這種情況下，內(nèi)容提供者為預覽的目的向用戶提供內(nèi)容的低質(zhì)量版本，而在購買時提供內(nèi)容的高質(zhì)量版本。當需要以各種分辨率來發(fā)送或接收單個內(nèi)容時，可以使用可伸縮的視頻編碼方法。
但是，傳統(tǒng)的可伸縮視頻編碼方法具有缺陷由于總是在不考慮用戶請求的情況下提供用于表示原始內(nèi)容的各種質(zhì)量的高質(zhì)量內(nèi)容比特流，使得傳輸速度下降。
另一個缺陷是所述傳統(tǒng)方法需要用于從所接收的比特流提取期望質(zhì)量的內(nèi)容的單獨處理。
技術方案本發(fā)明提供適合于用戶的各種需要和內(nèi)容提供者的商業(yè)目的的內(nèi)容。
本發(fā)明也通過下述方式以高傳輸率向用戶提供期望質(zhì)量的內(nèi)容，而不需要任何額外的處理通過按照由用戶的發(fā)送請求確定的質(zhì)量來處理內(nèi)容。
在查看了下面的說明、附圖和所附的權利要求后，本發(fā)明的上述目的以及其他目的、特征和優(yōu)點對于本領域技術人員來說，將變得清楚。
按照本發(fā)明的一個方面，提供了一種用于發(fā)送可伸縮視頻流的設備，包括可伸縮比特流的源，它包含用戶請求的視頻內(nèi)容；控制器，用于根據(jù)用戶請求和用戶概況信息(user profile information)來確定所述視頻內(nèi)容的質(zhì)量；以及預解碼器，用于按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流。
按照本發(fā)明的另一個方面，提供了一種用于發(fā)送可伸縮視頻流的方法，包括確定包含用戶請求的視頻內(nèi)容的可伸縮比特流；以及按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流。
所述比特流的質(zhì)量的確定可以包括執(zhí)行用戶鑒別，確定所選擇的視頻內(nèi)容的用戶請求，以及根據(jù)用戶請求和用戶概況信息來確定要發(fā)送的比特流的質(zhì)量。
用戶請求可以是對視頻內(nèi)容的預覽或購買，而用戶概況信息可以是關于視頻內(nèi)容的費用支付的信息。

通過參照附圖來詳細說明本發(fā)明的例證實施例，本發(fā)明的上述和其他特征和優(yōu)點將變得更清楚，其中圖1是按照本發(fā)明的一個實施例的編碼器的示意方框圖；圖2是按照本發(fā)明的一個實施例的解碼器的示意方框圖；圖3是按照本發(fā)明的一個實施例的、用于發(fā)送可伸縮視頻流的設備的方框圖；圖4是圖解用于發(fā)送可伸縮視頻流的方法的流程圖；圖5示意性地圖解了按照本發(fā)明的一個實施例的、在基于運動補償時間濾波(MCTF)的可伸縮視頻編碼和解碼中的時間分割處理(temporaldecomposition process)；圖6示意性地圖解了按照本發(fā)明的一個實施例的、用于通過子波變換(wavelet transform)而將輸入圖像或幀分解為子帶的處理；以及圖7是圖解按照本發(fā)明的另一個實施例的、用于發(fā)送可伸縮視頻流的方法的流程圖。
具體實施例方式
可以通過參照下面對于例證實施例的詳細說明和附圖來更容易地明白本發(fā)明的優(yōu)點和特征以及用于實現(xiàn)所述優(yōu)點和特征的方法。但是，本發(fā)明可以以不同形式來體現(xiàn)，并且不應當被理解為限于在此給出的實施例。而且，提供這些實施例以便本公開是徹底和完整的，以及向本領域技術人員全面地傳輸本發(fā)明的思想，本發(fā)明僅僅由所附的權利要求來限定。在說明書中，相同的附圖標號表示相同的元件。
現(xiàn)在說明按照本發(fā)明的一個實施例的，用于發(fā)送可伸縮視頻流的設備的配置和操作。為了幫助明白本發(fā)明，下面依序說明可伸縮視頻編碼器，用于執(zhí)行支持可伸縮性的視頻編碼；解碼器，用于解碼從所述編碼器接收的視頻比特流；以及用于通過處理要發(fā)送到解碼器的、從編碼器接收的視頻比特流來發(fā)送可伸縮視頻流的裝置。
圖1是按照本發(fā)明的一個實施例的編碼器的示意方框圖。
參見圖1，按照本發(fā)明的一個實施例的編碼器100包括分段單元101、運動估計單元102、時間變換單元103、空間變換單元104、嵌入量化單元105和熵編碼單元106。
分段單元101將輸入的視頻劃分為基本編碼單元，即圖像組(GOP)。
運動估計單元102對于在每個GOP中包含的幀進行運動估計，由此獲得運動向量?？梢允褂弥T如分層可變尺寸塊匹配(Hierarchical Variable Size BlockMatching，HVSBM)之類的分層方法來實現(xiàn)所述運動估計。
時間變換單元103使用由運動估計單元102獲得的運動向量來在時間方向上將幀分解為低頻和高頻幀，由此減少時間冗余。
例如，可以將幀的平均值定義為低頻分量，并且可以將在兩個幀之間的差的一半定義為高頻分量。以GOP為單位來分解幀。
可以通過不使用運動向量而比較在兩個幀中相同位置的像素來將幀分解為高頻和低頻幀。但是，不使用運動向量的方法在降低時間冗余上不如使用運動向量的方法有效。
換句話說，當在第二幀中移動第一幀的一部分時，可以通過運動向量來表示運動量。將所述第一幀的所述部分與將所述第一幀的所述部分相同位置上的、所述第二幀的一部分移動所述運動向量而至的一部分相比較，即補償時間運動。其后，將第一和第二幀分解為低頻和高頻幀。
對于時間濾波，可以使用運動補償時間濾波(MCTF)。
空間變換單元104從已經(jīng)消除時間冗余的幀中去除空間冗余，并且建立變換系數(shù)。對于空間變換，本發(fā)明使用子波變換。在此，使用子波變換來將一個幀分解為低頻和高頻子帶，并且確定變換系數(shù)，即相應子帶的子波系數(shù)。
具體上，所述幀被分解為四個部分。在所述幀的左上部分中顯示與整個圖像類似的四分之一大小的圖像(L圖像)，并且在其他三個部分中顯示用于從所述L圖像重建整個圖像所需要的信息(H圖像)。以相同的方式，可以將所述L圖像分解為四分之一大小的LL圖像和重建所述L圖像所需要的信息。
使用子波變換的圖像壓縮被應用于JPEG 2000標準，并且消除在幀之間的空間冗余。而且，與離散余弦變換(DCT)方法相反，所述子波變換使得原始圖像信息能夠被存儲在作為原始圖像的縮小版本的變換圖像中，由此允許通過使用縮小的圖像來提供空間可伸縮性的視頻編碼。
但是，在本發(fā)明中，子波變換僅僅是被提供來用于說明的。在不必然意欲實現(xiàn)空間可伸縮性的情況下，可以使用DCT方法，所述DCT方法已經(jīng)傳統(tǒng)上被廣泛地用于運動圖像壓縮中(就像在MPEG-2中)。
嵌入量化單元105對于每個子波塊的、由空間變換單元104獲得的子波系數(shù)執(zhí)行嵌入的量化，并且按照重要性而重新布置所述量化系數(shù)。可以使用嵌入零樹子波算法(Embedded Zerotrees Wavelet，EZW)、在分層樹中的設置分區(qū)(Set Partitioning in Hierarchical Trees，SPIHT)和嵌入的零塊編碼(EmbeddedZeroBlock Coding，EZBC)來作為以這種方式對于每個子波塊的子波系數(shù)執(zhí)行嵌入量化。
這些算法良好地使用在本發(fā)明中使用的子波域中的像素之間的空間關系，因此適合于用在按照本發(fā)明的嵌入量化處理中。
以樹的形狀來表達在像素之間的空間關系。可以使用下述事實來執(zhí)行有效的編碼當在樹中的根是0時，在樹中的子孫具有為0的高概率。當正在掃描與在L帶中的像素相關聯(lián)的像素時，執(zhí)行多種算法。
熵編碼單元106將由嵌入量化單元105量化的子波系數(shù)和由運動估計單元102產(chǎn)生的關于運動向量的信息和首標信息轉(zhuǎn)換為適合于傳輸或存儲的壓縮比特流。可以使用預測編碼、可變長度編碼(例如霍夫曼編碼)、算術編碼等來執(zhí)行所述熵編碼。
本發(fā)明可以應用于運動視頻以及靜止視頻(圖像)。與運動視頻類似地，輸入靜止圖像在通過空間變換單元104、嵌入量化單元105和熵編碼單元106之后可被轉(zhuǎn)換成比特流。
圖2是按照本發(fā)明的一個實施例的解碼器的示意方框圖。
解碼器300包括熵解碼單元301、逆嵌入量化單元302、逆空間變換單元303和逆時間變換單元304。
解碼器300以與編碼器100基本上相反的方向運行。但是，當已經(jīng)由編碼器100的運動估計單元102執(zhí)行了運動估計以確定運動向量時，解碼器300不執(zhí)行逆運動估計處理，因為解碼器300僅僅接收運動估計單元102以使用。
像在編碼器100中那樣，按照本發(fā)明的一個實施例的解碼器300的操作可以被應用于運動視頻以及靜止圖像。與運動視頻類似，從編碼器100接收的比特流可以在通過熵解碼單元301、逆嵌入量化單元302、逆空間變換單元303和逆時間變換單元304后被往回轉(zhuǎn)換成輸出圖像。
圖3示出了按照本發(fā)明的一個實施例的用于發(fā)送可伸縮視頻流的設備200。所述設備200包括可伸縮比特流源210、用戶概況220、用戶鑒別器230、用戶信號輸入240和控制器250。
可伸縮比特流源210從可伸縮視頻編碼器100接收被編碼以具有時間、空間和信噪比(SNR)可伸縮性的可伸縮比特流。所述比特流是通過以高質(zhì)量壓縮原始圖像而被產(chǎn)生的，并且可以被劃分為具有各種質(zhì)量的信號。
可伸縮比特流也可以在可伸縮視頻編碼器100中編碼后由外部視頻內(nèi)容提供器發(fā)送。
用戶概況220包含用戶概況信息，諸如關于視頻內(nèi)容使用和支付的細節(jié)。
用戶鑒別器230確定用戶是否被授權使用與期望的視頻內(nèi)容相關聯(lián)的服務，即通過檢查是否已經(jīng)進行了對于適當?shù)谋忍亓髻|(zhì)量的支付。
用戶信號輸入240接收表示視頻內(nèi)容的期望質(zhì)量的信號。低質(zhì)量信號僅僅是為預覽目的而被發(fā)送的，而在購買所述內(nèi)容時發(fā)送高質(zhì)量信號。通過關于嵌入比特流的幀速率、分辨率、圖像質(zhì)量的信息來確定質(zhì)量。
控制器250按照從用戶鑒別器230接收的信息來確定用戶的可靠性，并且根據(jù)從用戶信號輸入240接收的信息來確定期望視頻內(nèi)容的比特流的質(zhì)量。
預編碼器260由控制器250控制，并且提取和處理可伸縮比特流，所述可伸縮比特流包含要發(fā)送到用戶的、關于所需要的幀速率、分辨率和圖像質(zhì)量的信息。
圖4是圖解按照本發(fā)明的一個實施例的用于發(fā)送可伸縮視頻流的方法的流程圖。
參見圖3和4，所述方法主要包括確定包含由用戶請求的視頻內(nèi)容的可伸縮比特流的質(zhì)量(步驟S1)，并且按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流(步驟S2)。
用于確定比特流的質(zhì)量的步驟S1包括執(zhí)行用戶鑒別(步驟S10)，確定用戶請求(步驟S12)，分析用戶請求和用戶概況信息(步驟S14)，并且確定要發(fā)送的比特流的質(zhì)量(步驟S16)。
在步驟S10，根據(jù)在用戶鑒別器230中記錄的用戶鑒別信息而確定用戶是否被授權能夠被提供視頻內(nèi)容。
為了實施用戶鑒別，每個用戶可以被分配唯一的用戶ID或密碼，在每次他/她被提供視頻內(nèi)容時，必須輸入所述唯一的用戶ID或密碼。對于付費的用戶鑒別，僅僅對預付用戶分配用戶ID或密碼?；蛘?，可以首先向每個用戶分配用戶ID或密碼，然后對于從菜單選擇的期望視頻內(nèi)容支付費用。在這種情況下，在用戶概況220中記錄所述費用的支付。
為了在步驟S12中確定用戶請求，用戶信號輸入240分析所接收的用戶請求，其中所述用戶請求包含對于期望視頻或視頻內(nèi)容的質(zhì)量要求，諸如分辨率、圖像質(zhì)量和幀速率。在此，所述幀速率確定所接收的視頻流被重放的速度，所述分辨率確定圖像的銳度和清楚程度，而所述圖像質(zhì)量確定諸如色調(diào)和亮度之類的圖像的質(zhì)量。
例如，為了在從菜單選擇電影之前觀看電影的預覽，用戶可以請求具有低分辨率和低圖像質(zhì)量的視頻內(nèi)容以減少要發(fā)送的比特流的數(shù)量，因為所述預覽僅僅需要提供選擇電影所需的信息。所述視頻內(nèi)容也可以具有高速重放所需要的高幀速率，以迅速地搜索期望電影的菜單。在這種情況下，向用戶信號輸入240發(fā)送由用戶請求的關于分辨率、圖像質(zhì)量和幀速率的信息以備在處理具有可伸縮性的比特流的過程中使用。
同時，所述用戶請求可以是關于像在所述說明性實施例中那樣的視頻內(nèi)容的一個質(zhì)量的信息或關于所述視頻內(nèi)容的多個質(zhì)量的信息。當用戶請求具有多個質(zhì)量的視頻內(nèi)容時，因為高質(zhì)量視頻內(nèi)容具有大尺寸，所以期望在網(wǎng)絡的容量和用戶環(huán)境超過預定水平時開始發(fā)送視頻內(nèi)容。
在步驟S14分析用戶請求和用戶概況信息后獲得的結(jié)果用于控制器250以確定視頻內(nèi)容的質(zhì)量。
例如，對于頻繁使用已經(jīng)付費的電影內(nèi)容的用戶，所述用戶概況信息可以包含關于電影內(nèi)容的使用和支付的細節(jié)以及包含提供給用戶的、對于內(nèi)容使用和支付的獎勵(incentive)的加權信息。所述獎勵可以包括對于10次使用付費電影內(nèi)容或總支付10％的累積而對圖像質(zhì)量的一個級別的升級。
在步驟S16，控制器250根據(jù)從用戶信號輸入240接收的用戶請求信號和從用戶概況220接收的用戶概況信息來確定要發(fā)送的可伸縮比特流的質(zhì)量。
即，在來自用戶的對于任意電影的內(nèi)容的預覽版本的請求時，發(fā)送低質(zhì)量信號，而僅僅當在請求高質(zhì)量內(nèi)容時根據(jù)搜索在用戶概況220中記錄的信息的結(jié)果而確定適合于發(fā)送高質(zhì)量信號時發(fā)送高質(zhì)量信號。預解碼器260根據(jù)所確定的質(zhì)量來調(diào)整要發(fā)送的比特流的數(shù)量。
按照確定的發(fā)送質(zhì)量來處理可伸縮比特流的步驟S2可以被劃分為兩個分步驟按照所確定的質(zhì)量來處理可伸縮比特流(步驟S20)，和向用戶發(fā)送所提取的比特流(步驟S22)。
在步驟S20中，通過刪節(jié)比特流的不必要部分而根據(jù)所確定的質(zhì)量處理可伸縮比特流。所述可伸縮比特流是指具有可伸縮性并且由可伸縮視頻編碼器100編碼的視頻信號。視頻內(nèi)容提供者或外部提供者可以執(zhí)行在可伸縮視頻編碼器100中的視頻內(nèi)容編碼。在后一種情況下，可以通過獨立的裝置來執(zhí)行視頻內(nèi)容編碼和比特流處理。
現(xiàn)在說明用于處理可伸縮比特流的方法。
為了確定諸如幀速率、分辨率和圖像質(zhì)量之類的比特流的質(zhì)量，可以通過提取或去除比特流的預定部分來執(zhí)行由可伸縮視頻編碼器100編碼可伸縮比特流以具有時間、空間和SNR伸縮性。因此，現(xiàn)在結(jié)合由圖1的可伸縮視頻編碼器100執(zhí)行的編碼處理來說明用于處理可伸縮比特流的方法。
現(xiàn)在說明用于通過MCTF方法來處理被編碼以具有時間可伸縮性的比特流和調(diào)整幀速率的處理。
首先，將說明基于運動補償時間濾波(MCTF)的可伸縮視頻編碼和解碼。
如圖5中所示，在編碼處理中，在低時間級的幀的對(pair of frame)被時間濾波，并且然后被分解成在更高時間級的L幀和H幀的對，并且，L幀的對被再次時間濾波和分解為在更高時間級的幀。編碼器對于在最高時間級的一個L幀和多個H幀執(zhí)行子波變換，并且產(chǎn)生比特流。在此，L幀是對應于幀的平均值的低頻幀，而H幀是對應于在幀之間的差的高頻幀。
換句話說，編碼器100編碼從低時間級到高時間級的幀，而解碼器對于從高級到低級的、通過加陰影而指示和通過逆子波變換而獲得的幀執(zhí)行與編碼器100相逆的操作以重建。
在時間級3的L和H幀用于重建在時間級2上的兩個L幀，在時間級2上的所述兩個L幀和兩個H幀用于重建在時間級1上的四個L幀。最后，在時間級1上的四個L幀和四個H幀用于重建8個幀。
現(xiàn)在說明用于通過處理根據(jù)MCTF方法而編碼的可伸縮視頻流來調(diào)整幀速率的方法。
例如，當在選擇預覽時需要調(diào)整時間可伸縮性以用于發(fā)送內(nèi)容的低質(zhì)量版本時，僅僅在圖像組(GOP)中的一些幀可以被切除以用于發(fā)送。即，當僅僅發(fā)送對應于被稱為GOP的8個幀中的兩個的比特流時，因為以低的幀速率來解碼所述比特流，所以重放低質(zhì)量視頻。
雖然已經(jīng)參照使用基于MCTF的視頻編碼方案的說明性實施例而示出和說明了本發(fā)明，但是本領域技術人員將明白，可以在其中進行在形式和細節(jié)上的各種改變。即，本發(fā)明可以實現(xiàn)各種模塊，所述各種模塊被設計成通過解碼按照提供時間可伸縮性的MCTF、UMCTF或其他視頻編碼方案編碼的可伸縮視頻流來改變幀速率，通過按照適合于設置的屏幕尺寸的幀速率來調(diào)整時間級，所述時間可伸縮性是可能的。
在此，提供時間可伸縮性的其他視頻編碼方案可以使用在有限的時間級上執(zhí)行時間變換的連續(xù)時間近似和引用(Successive Temporal Approximationand Referencing，STRAR)，以在盡可能保持時間可伸縮性的同時控制延遲時間。
接著，現(xiàn)在結(jié)合圖6來說明用于通過處理被以子波變換編碼以具有空間可伸縮性的比特流來調(diào)整分辨率的方法。
圖6圖解了按照本發(fā)明的一個實施例的、通過在空間變換單元104中的兩層子波變換而將輸入圖像或幀分解為子帶的處理。
參見圖6，所述幀被分解為在幀的左上四分之一的被稱為低-低(LL)(1)的一個低頻子帶和被稱為低-高(LH)(1)的三個高頻子帶。子帶LL(1)還被第二級子波變換分解為三個高頻子帶LH(2)和一個低頻子帶LL(2)。
可以通過從以子波變換編碼的比特流去除除了必要子帶之外的信息而實現(xiàn)所述用于調(diào)整分辨率的所述方法。
例如，需要在選擇預覽功能后以作為由視頻提供者提供的屏幕的分辨率的四分之一的分辨率來發(fā)送視頻流，預解碼器260由控制器240控制以從要發(fā)送到用戶的比特流中去除除了子帶LL(1)之外的信息。而且，當用戶請求具有為1/16的屏幕分辨率的分辨率的視頻流以便使用畫中畫(PIP)功能時，可以在發(fā)送之前從所述比特流中去除除了子帶LL(2)之外的信息。
現(xiàn)在說明用于處理可伸縮比特流以便調(diào)整被編碼為具有信噪比(SNR)的比特流的質(zhì)量級的方法。
SNR可伸縮性通過下述方式來執(zhí)行嵌入的量化通過僅僅編碼具有大于預定門限值的值的像素，在編碼后減小所述門限值，并且重復上述處理。可以通過所述門限值來確定所述質(zhì)量級。
因此，對于要使用被編碼以具有SNR可伸縮性的比特流來產(chǎn)生預定質(zhì)量的比特流的用戶，必須提取包含關于具有大于給定門限值的值的像素的信息的比特流。
例如，當用戶請求具有低分辨率的視頻內(nèi)容時，視頻內(nèi)容提供者根據(jù)用戶的請求分配低質(zhì)量視頻所需的門限值，并且然后去除包含關于具有大于所述門限值的值的像素的信息的、不需要的比特流。即，僅僅提取包含關于具有大于所分配門限值的值的像素的信息的比特流以將其提供到用戶。
圖7是圖解按照本發(fā)明的另一個實施例的、用于使用視頻點播(VOD)方案來發(fā)送可伸縮視頻流的方法的流程圖。
通過在進行請求之前向用戶發(fā)送視頻內(nèi)容的低質(zhì)量版本和在支付之后提供內(nèi)容的高質(zhì)量版本來實現(xiàn)所述VOD方案。
參見圖3和7，首先，在步驟S100，向用戶提供視頻內(nèi)容的預覽屏幕。可以在用戶的請求下或在視頻內(nèi)容提供者的推薦下提供預覽屏幕。
然后，在觀看了視頻內(nèi)容的預覽屏幕后，用戶在步驟S102確定是否購買內(nèi)容。
所述內(nèi)容可以包含由編碼器(圖1的100)編碼的整個比特流，或者具有比預覽版本好的視頻質(zhì)量。所述內(nèi)容也可以根據(jù)購買它的價格而具有各種質(zhì)量。
在支付后購買內(nèi)容的情況下，視頻內(nèi)容提供者在步驟S104向用戶發(fā)送視頻內(nèi)容。在執(zhí)行此處理的同時，關于所選擇的視頻內(nèi)容和支付費用的信息被記錄在用戶概況220中。所述用戶概況信息被視頻內(nèi)容提供者用于推薦視頻內(nèi)容。所述信息也可以被用作用于提供諸如圖像質(zhì)量升級或價格折扣的獎勵的材料。
產(chǎn)業(yè)上的應用按照本發(fā)明的用于發(fā)送可伸縮視頻流的方法和設備能夠提供適合于用戶的各種需要和內(nèi)容提供者的商業(yè)目的的內(nèi)容。本發(fā)明也可以通過按照由用戶請求確定的質(zhì)量而處理內(nèi)容來以高傳輸速度提供內(nèi)容的期望質(zhì)量，而不需要另外的處理。
在結(jié)束詳細說明后，本領域技術人員可以明白，在基本上不脫離本發(fā)明的精神的情況下，可以對于例證實施例進行許多改變和修改。因此，本發(fā)明的所公開的例證實施例僅僅在上位和描述性含義上被使用，而不用于限制的目的。
權利要求
1.一種用于發(fā)送可伸縮視頻流的方法，包括確定包含由用戶請求的視頻內(nèi)容的可伸縮比特流的質(zhì)量；以及按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流。
2.按照權利要求1的方法，其中，通過分辨率、圖像質(zhì)量或幀速率來確定所述可伸縮比特流的質(zhì)量。
3.按照權利要求1的方法，其中，所述比特流的質(zhì)量的確定包括執(zhí)行用戶鑒別；確定視頻內(nèi)容的用戶請求；以及根據(jù)用戶請求和用戶概況信息來確定要發(fā)送的比特流的質(zhì)量。
4.按照權利要求3的方法，其中，所述用戶請求是對視頻內(nèi)容的預覽或購買。
5.按照權利要求3的方法，其中，所述用戶概況信息是關于視頻內(nèi)容的費用支付的信息。
6.一種用于發(fā)送可伸縮視頻流的設備，包括可伸縮比特流的源，它包含用戶請求的視頻內(nèi)容；控制器，用于根據(jù)用戶請求和用戶概況信息而確定所述視頻內(nèi)容的質(zhì)量；以及預解碼器，用于按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流。
7.按照權利要求6的設備，其中，通過分辨率、圖像質(zhì)量或幀速率來確定所述比特流的質(zhì)量。
8.按照權利要求6的設備，其中，所述控制器包括用戶鑒別器，用于執(zhí)行用戶鑒別；用戶信號輸入，用于接收對于視頻內(nèi)容的用戶請求；以及用戶概況，包含關于用戶的信息。
9.按照權利要求6的設備，其中，所述用戶概況包含關于視頻內(nèi)容的費用支付的信息。
全文摘要
本發(fā)明提供了一種方法和設備，用于通過按照用戶請求而處理可伸縮比特流來發(fā)送適合于用戶請求的可伸縮視頻流。所述設備包括可伸縮比特流的源，包含用戶請求的視頻內(nèi)容；控制器，用于根據(jù)用戶請求和用戶概況信息而確定所述視頻內(nèi)容的質(zhì)量；以及預解碼器，用于按照所確定的發(fā)送質(zhì)量來處理所述可伸縮比特流。
文檔編號H04N7/173GK1906938SQ200480041092
公開日2007年1月31日申請日期2004年12月30日優(yōu)先權日2004年1月28日
發(fā)明者申成撤, 李培根申請人:三星電子株式會社

完整全部詳細技術資料下載