專(zhuān)利名稱(chēng):用于對(duì)結(jié)構(gòu)化文檔進(jìn)行編碼的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于對(duì)結(jié)構(gòu)化文檔進(jìn)行編碼的方法、 一種解碼方法和一種相應(yīng)的編碼或者解碼裝置,其中結(jié)構(gòu)化文檔、尤其是基于XML 的文檔(XML-可擴(kuò)展標(biāo)記語(yǔ)言)的二進(jìn)制表示借助于一種方案被編碼 和/或被解碼。例如在關(guān)于MPEG-7標(biāo)準(zhǔn)的文獻(xiàn)、尤其是在文檔[l]中描述了這種 編碼和解碼方法。這些方法能夠借助于編碼數(shù)據(jù)流中的比特模式來(lái)確 定文檔的內(nèi)容、尤其是元素和/或?qū)傩院?或數(shù)據(jù)類(lèi)型.在此情況下, 編碼內(nèi)容以所謂的FUU (FUU-片段更新單元)的形式被存儲(chǔ),其中在 FUU中不必包含所述元素和/或?qū)傩院?或數(shù)據(jù)類(lèi)型的全部?jī)?nèi)容。該元素 和/或?qū)傩院?或數(shù)據(jù)類(lèi)型的部分可以在隨后的FUU中被編碼。經(jīng)常在接收器中對(duì)XML文檔的內(nèi)容進(jìn)行進(jìn)一步處理,例如準(zhǔn)備用 于顯示。為此,通常從該XML文檔中只濾出確定的元素和/或?qū)傩院? 或數(shù)據(jù)類(lèi)型。該過(guò)濾過(guò)程例如可以在所謂的XSLT (XSLT-XML樣式單 語(yǔ)言轉(zhuǎn)換)中被指定。根據(jù)現(xiàn)有技術(shù),在用于處理XML文檔的應(yīng)用中已證明是不利的是, 為了濾出內(nèi)容,整個(gè)文檔從比特流中被解碼,并且然后才被過(guò)濾???以利用從現(xiàn)有技術(shù)中已知的技術(shù)通過(guò)不對(duì)FUU進(jìn)行解碼來(lái)加速過(guò)濾, 其中基于FUU的所謂的上下文路徑中所包含的信息,所述FUU可以不包 含要過(guò)濾的內(nèi)容。當(dāng)然,借助于該上下文路徑不能可靠地確定,哪些 FUU實(shí)際包含所尋找的內(nèi)容.因此,本發(fā)明的任務(wù)是創(chuàng)建一種用于對(duì)結(jié)構(gòu)化文檔進(jìn)行編碼的方 法,該方法能夠更簡(jiǎn)單并且更快速地從文檔中過(guò)濾出內(nèi)容.該任務(wù)通過(guò)獨(dú)立權(quán)利要求來(lái)解決。本發(fā)明的改進(jìn)方案由從屬權(quán)利 要求得出。在用于對(duì)結(jié)構(gòu)化文檔、尤其是XML文檔進(jìn)行編碼的本發(fā)明方法中, 文檔的內(nèi)容被轉(zhuǎn)換為二進(jìn)制表示。該二進(jìn)制表示被分成構(gòu)成編碼數(shù)據(jù) 流的編碼單元,其中可從該編碼數(shù)據(jù)流中讀出所述編碼單元。在此情 況下,編碼數(shù)據(jù)流包含配置數(shù)據(jù),利用所述配置數(shù)據(jù)在讀出一個(gè)或者 多個(gè)編碼單元之前可讀出關(guān)于把二進(jìn)制表示分成編碼單元的配置信4息。因此,為了從文檔中濾出確定的內(nèi)容,不再需要對(duì)整個(gè)編碼數(shù)據(jù) 流進(jìn)行解碼,而是已經(jīng)可以根據(jù)該編碼數(shù)據(jù)流確定,單個(gè)編碼單元包 含哪些內(nèi)容。因此,可以顯著地加速結(jié)構(gòu)化文檔的過(guò)濾。在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,配置信息尤其是關(guān)于預(yù)先確定 的編碼單元中丟失的內(nèi)容的信息。因此,根據(jù)編碼數(shù)據(jù)流可以確定, 在編碼單元中丟失哪些內(nèi)容,因此如果在過(guò)濾時(shí)恰恰尋找該丟失的內(nèi) 容,那么不必對(duì)該編碼單元進(jìn)行解碼。在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,編碼數(shù)據(jù)流包含對(duì)丟失的內(nèi)容 在編碼數(shù)據(jù)流中所處的位置和/或?qū)Π瑏G失的內(nèi)容的編碼單元的索引。因此,如果在過(guò)濾時(shí)得出確定的FUU不包含所尋找的內(nèi)容,那么 立即對(duì)所尋找的內(nèi)容所處的位置進(jìn)行索引。由此可以再次顯著地加速過(guò)濾。在另一優(yōu)選實(shí)施方案中,配置信息本身在編碼數(shù)據(jù)流中被編碼, 由此提高編碼效率。在本發(fā)明的一個(gè)實(shí)施方案中,所述配置數(shù)據(jù)是配置信息,其中該 配置信息被添加到編碼數(shù)據(jù)流中。尤其是,所述配置信息可以以XML 文檔的形式被文本編碼。替代地,所述配置信息可利用MPEG編碼方法 來(lái)進(jìn)行編碼.在一個(gè)實(shí)施方案中,所述配置數(shù)據(jù)是對(duì)配置信息的索引,利用該 索引從所存儲(chǔ)的配置信息中選出配置信息,因此,不必再傳輸全部的 配置信息,而是該信息可被存儲(chǔ)在解碼器可訪問(wèn)的存儲(chǔ)區(qū)中。優(yōu)選地,要編碼的文檔是MPEG描述流、尤其是MPEG-7描述流或 MPEG-21描述流,其中所述編碼單元是片段更新單元,該片段更新單 元又構(gòu)成接入單元,編碼標(biāo)準(zhǔn)MPEG-21的說(shuō)明例如位于文檔[2]中。 在此情況下,所存儲(chǔ)的配置信息優(yōu)選地被包含在MPEG標(biāo)準(zhǔn)、尤其是 MPEG-7或者M(jìn)PEG-21標(biāo)準(zhǔn)的配置文件中。在一個(gè)特別優(yōu)選的實(shí)施方案中,所述結(jié)構(gòu)化文檔是XML文檔,該 XML文檔包括元素和/或?qū)傩院?或數(shù)據(jù)類(lèi)型.在所述配置信息是關(guān)于 丟失的內(nèi)容的信息的情況下,所述丟失的內(nèi)容尤其是至少包括一個(gè)元 素和/或一個(gè)屬性和/或一個(gè)數(shù)據(jù)類(lèi)型。除了用于對(duì)數(shù)據(jù)流進(jìn)行編碼的上述方法之外,本發(fā)明另外還包括 用于對(duì)編碼數(shù)據(jù)流進(jìn)行解碼的方法,其中該方法如此被設(shè)計(jì),以致利用本發(fā)明編碼方法所編碼的數(shù)據(jù)流被解碼,在此情況下,所述配置信 息優(yōu)選地從所述編碼數(shù)據(jù)流中被讀出。另外,本發(fā)明還涉及用于對(duì)數(shù)據(jù)流進(jìn)行編碼和解碼的方法,該方 法包括上述的本發(fā)明編碼方法和上述的本發(fā)明解碼方法。本發(fā)明另外還包括編碼裝置和解碼裝置,其中所述編碼裝置如此被設(shè)計(jì),以致本發(fā)明編碼方法可被執(zhí)行,而所述解碼裝置如此被i殳計(jì), 以致本發(fā)明解碼方法可被執(zhí)行。另外,本發(fā)明還包括編碼和解碼裝置, 所述編碼和解碼裝置包括本發(fā)明編碼裝置和本發(fā)明解碼裝置。下面,借助于附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行更詳細(xì)的描述.其中
圖1示出編碼和解碼系統(tǒng)的示意圖,在該編碼和解碼系統(tǒng)中本發(fā) 明編碼和解碼方法被執(zhí)行;圖2示出FUU的結(jié)構(gòu)的示意圖;圖3示出XML文檔的語(yǔ)法的例子,其中應(yīng)從該XML文檔中濾出信息;圖4示出用于從圖3的XML文檔的二進(jìn)制表示中濾出確定信息的過(guò)濾器說(shuō)明的例子;和圖5示出在本發(fā)明方法中可使用的被格式化為XML文檔的編碼配 置的示例性表示。在圖1中示例性地示出具有編碼器ENC和解碼器DEC的編碼和解 碼系統(tǒng),其中利用該編碼器和解碼器對(duì)XML文檔D0C進(jìn)行編碼或者解 碼。不僅編碼器而且解碼器兩者都具有所謂的方案S,在該方案中用于 通信的XML文檔的元素和類(lèi)型被聲明并被定義。在編碼器和解碼器中, 根據(jù)該方案S通過(guò)相應(yīng)的方案編譯SC產(chǎn)生代碼表CT.如果XML文檔 D0C被編碼,則二進(jìn)制代碼通過(guò)代碼表被分配給該XML文檔的內(nèi)容。接 下來(lái),在編碼器中,代碼被分成所謂的片段更新單元FUU,該片段更新 單元將參照?qǐng)D2被進(jìn)一步描述。將代碼分成FUU取決于編碼器的配置。 因此,文檔DOC被轉(zhuǎn)換為二進(jìn)制編碼格式BDOC,該二進(jìn)制編碼格式接 下來(lái)被傳輸?shù)浇獯a器上,并且在那里又借助于代碼表CT被解碼,因此 原始文檔DOC被重新生成。本發(fā)明方法的特征在于,在傳輸XML文檔的二進(jìn)制表示之前或者 與傳輸XML文檔的二進(jìn)制表示并行地傳輸關(guān)于由編碼器ENC將XML文檔的內(nèi)容分成FUU的信息EC.在圖2中示出了片段更新單元FUU的組成部分,該片段更新單元 是MPEG-7描述流的二進(jìn)制格式。這種單元包含片段更新命令,在該片 段更新命令中指定應(yīng)該在XML文檔描述樹(shù)的節(jié)點(diǎn)中進(jìn)行哪種操作.另 外,該單元還包含片段更新上下文,該片段更新上下文其中包含所謂 的上下文路徑,利用該上下文路徑來(lái)指定在該文檔的描述樹(shù)中到節(jié)點(diǎn) 的路徑,其中在該節(jié)點(diǎn)上應(yīng)執(zhí)行片段更新命令.通過(guò)該上下文路徑來(lái) 確定,在FUU中最大可包含哪些信息.最后,該FUU還包含片段更 新有效負(fù)荷,即在相應(yīng)的節(jié)點(diǎn)中要處理的編碼信息。為了更準(zhǔn)確地描 述FUU的結(jié)構(gòu),請(qǐng)參閱文檔[3]。編碼數(shù)據(jù)流包括大量的這種片段 更新單元,其中這些FUU又被組合成所謂的接入單元,在這里所述的 本發(fā)明方法實(shí)施方案中,在編碼數(shù)據(jù)流中除了 FUU之外還將說(shuō)明如何 將XML文檔分成了 FUU的配置信息EC也傳輸?shù)浇獯a器。在圖3中再現(xiàn)了要編碼的XML文檔的內(nèi)容的例子,該文檔其中包 括四個(gè)被稱(chēng)作"gBSDUnit"的元素,其中這些元素中的兩個(gè)包含所謂 的標(biāo)記屬性。在圖4中示出了過(guò)濾器說(shuō)明,應(yīng)根據(jù)該過(guò)濾器說(shuō)明對(duì)圖3 中的利用本發(fā)明方法編碼的文檔進(jìn)行過(guò)濾。該過(guò)濾器說(shuō)明規(guī)定,應(yīng)尋 找包含具有標(biāo)記屬性的元素gBSDUnit的上下文路徑。在現(xiàn)有情況 下,該說(shuō)明對(duì)應(yīng)于比特模式"11010"。為了以盡可能少的解碼花費(fèi)將該信息從編碼信息流中濾出,將圖5 中以XML格式示出的解碼器的配置信息傳輸?shù)浇獯a器。這里指定,接 入單元只包括gBSDUnit (第四行,d抑type-"gBSDlinim )。另外規(guī)定,一個(gè)接入單元包含兩個(gè)片段更新單元,其中第一片段更新單元分別包 含gBSDUnit的標(biāo)記屬性(第八行怖lectorref="./@nwriw"></Mtector> ),而第二片段更新單元分別包含gBSDUnit,其中在gBSDUnit包含標(biāo)記屬性的 情況下,該屬性沒(méi)有被存儲(chǔ)在該片段更新單元中(第十六行 <eXceptref="./@marker"/>)。通過(guò)將圖5中所示的信息傳輸?shù)浇獯a器DEC,可以顯著更快地尋找確定的標(biāo)記屬性,因?yàn)?該解碼器已知,標(biāo)記屬性不包含在包含gBSDUnit的FUU中,并 且在片段更新有效負(fù)荷中所包含的gBSDUnit不必為此被解碼,-該解碼器只須對(duì)FUU進(jìn)行解碼,其中所述FUU的上下文路徑(參 見(jiàn)圖4)具有到標(biāo)記屬性的上下文路徑的比特模式。因?yàn)榕c對(duì)片段更新有效負(fù)荷進(jìn)行解碼相比可以明顯更快地執(zhí)行比 特模式的比較,所以可以通過(guò)傳輸編碼器的配置信息來(lái)明顯加速過(guò)濾。文獻(xiàn)目錄[1〗 Text of ISO/IECFCD 15938-1 Information Technology-Multimedia Content Description Interface - Partl, Sys tems[2〗Text of ISO/IEC CD 21000-7 Information Technology -Multimedia Framework - Part 7, Digital Item Adaptation[3〗J. Heuer, C. Thienot, M. Wollborn, "Binary Format", in "Introduction to MPEG - 7,,,編者B. S. Manjunath, P. Salembier, T. Sikora, John Wiley & Sons, West Sussex, 2002,第 61 — 80頁(yè).
權(quán)利要求
1. 用于對(duì)結(jié)構(gòu)化文檔(DOC)、尤其是XML文檔進(jìn)行編碼的方法,其中-所述文檔(DOC)的內(nèi)容被轉(zhuǎn)換成二進(jìn)制表示;-所述二進(jìn)制表示被分成編碼單元(FUU),所述編碼單元構(gòu)成編碼數(shù)據(jù)流(BDOC)并且可以從該編碼數(shù)據(jù)流(BDOC)中被讀出;-所述編碼數(shù)據(jù)流包含配置數(shù)據(jù),利用所述配置數(shù)據(jù)可以在讀出一個(gè)或者多個(gè)編碼單元(FUU)之前讀出關(guān)于將所述二進(jìn)制表示分成編碼單元(FUU)的配置信息(EC)。
2. 按照權(quán)利要求l所述的方法,其中所述配置信息(EC)包含關(guān) 于預(yù)先確定的編碼單元(FUU)中丟失的內(nèi)容的信息,
3. 按照權(quán)利要求2所述的方法,其中所述編碼數(shù)據(jù)流(BDOC)包 含對(duì)所述丟失的內(nèi)容在所述編碼數(shù)據(jù)流(BDOC)中所處的位置和/或 對(duì)包含所述丟失的內(nèi)容的編碼單元(FUU)的索引。
4. 按照上述權(quán)利要求之一所述的方法,其中對(duì)所述配置數(shù)據(jù)進(jìn)行編碼 。
5. 按照上述權(quán)利要求之一所述的方法,其中所述配置數(shù)據(jù)是所述 配置信息(EC),并且被添加到所述編碼數(shù)據(jù)流(BDOC)中。
6. 按照權(quán)利要求5所述的方法,其中所述配置信息(EC)以XML 文檔的形式被文本編碼。
7. 按照權(quán)利要求5所述的方法,其中所述配置信息(EC)利用MPEG 編碼方法來(lái)進(jìn)行編碼,
8. 按照權(quán)利要求1至5之一所述的方法,其中所述配置數(shù)據(jù)是對(duì) 配置信息(EC)的索引,利用該索引從所存儲(chǔ)的配置信息中選出配置 信息。
9. 按照上述權(quán)利要求之一所述的方法,其中所述文檔(DOC)是 MPEG描述流、尤其是MPEG7或者M(jìn)PEG-21描述流,其中所述編碼單元(FUU)是片段更新單元,所述片段更新單元又構(gòu)成接入單元.
10. 按照權(quán)利要求8和9所述的方法,其中所存儲(chǔ)的配置信息(EC) 被包含在MPEG標(biāo)準(zhǔn)、尤其是MPEG-7或者M(jìn)PEG-21標(biāo)準(zhǔn)的配置文件中。
11. 按照上述權(quán)利要求之一所述的方法,其中所述結(jié)構(gòu)化文檔是 XML文檔,該XML文檔包括元素和/或?qū)傩院?或數(shù)據(jù)類(lèi)型。
12. 按照權(quán)利要求2和11所述的方法,其中所述丟失的內(nèi)容至少 包括一個(gè)元素和/或一個(gè)屬性和/或一個(gè)數(shù)據(jù)類(lèi)型。
13. 用于對(duì)編碼數(shù)據(jù)流進(jìn)行解碼的方法,其中該方法如此被設(shè)計(jì), 以致利用上述權(quán)利要求所述的方法所編碼的數(shù)據(jù)流(BD0C)被解碼.
14. 按照權(quán)利要求13所述的方法,其中所述配置信息(EC)被讀出。
15. 用于對(duì)數(shù)據(jù)流進(jìn)行編碼和解碼的方法,包括按照權(quán)利要求1 至12之一所述的方法和按照權(quán)利要求13或者14所述的方法。
16. 編碼裝置,其如此被設(shè)計(jì),以致按照權(quán)利要求1至12之一所 述的方法能夠被執(zhí)行.
17. 解碼裝置,其如此被設(shè)計(jì),以致按照權(quán)利要求13或者14所 述的方法能夠被執(zhí)行。
18. 編碼和解碼裝置,包括按照權(quán)利要求16所述的編碼裝置和按 照權(quán)利要求17所述的解碼裝置。
全文摘要
本發(fā)明涉及用于對(duì)結(jié)構(gòu)化文檔(DOC)、尤其是XML文檔進(jìn)行解碼的方法,其中所述文檔(DOC)的內(nèi)容被轉(zhuǎn)換成二進(jìn)制表示,所述二進(jìn)制表示被分成編碼單元(FUU),所述編碼單元構(gòu)成編碼數(shù)據(jù)流(BDOC)并且從所述編碼數(shù)據(jù)流中可被讀出,并且所述編碼數(shù)據(jù)流包含配置數(shù)據(jù),利用該配置數(shù)據(jù)在讀出一個(gè)或者多個(gè)編碼單元(FUU)之前可讀出關(guān)于將所述二進(jìn)制表示分成編碼單元(FUU)的配置信息(EC)。
文檔編號(hào)H04N7/24GK101278285SQ200480012117
公開(kāi)日2008年10月1日 申請(qǐng)日期2004年2月27日 優(yōu)先權(quán)日2003年3月4日
發(fā)明者A·哈特爾, A·科夫勒·福格特, J·霍伊爾 申請(qǐng)人:西門(mén)子公司