專(zhuān)利名稱(chēng):具有用于管理文字字幕數(shù)據(jù)再現(xiàn)的數(shù)據(jù)結(jié)構(gòu)的記錄介質(zhì)及其相關(guān)方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及記錄介質(zhì)以及對(duì)記錄介質(zhì)進(jìn)行記錄和再現(xiàn)的方法和裝置。
背景技術(shù):
光盤(pán)已被廣泛地用作記錄大量數(shù)據(jù)的光記錄介質(zhì)。最近,引入了藍(lán)光 (blu-ray)光盤(pán)(BD)用作高密度數(shù)字視盤(pán)(HD"DVD),用來(lái)記錄長(zhǎng)達(dá)許多小時(shí)的高 清晰度視頻數(shù)據(jù)和優(yōu)質(zhì)聲音質(zhì)量的音頻數(shù)據(jù)。
BD已經(jīng)成為下一代HDH)VD的關(guān)注焦點(diǎn),作為下一代光記錄解決方案,用來(lái) 存儲(chǔ)比傳統(tǒng)DVD更多的數(shù)據(jù)。BD的標(biāo)準(zhǔn)化技術(shù)規(guī)范正在發(fā)展。
因此,基于BD的技術(shù)規(guī)范,已經(jīng)發(fā)展了一種用于BD的光記錄裝置。然而 在發(fā)展用于BD的光記錄裝置中有許多困難,因?yàn)锽D的技術(shù)規(guī)范還沒(méi)有完全標(biāo)準(zhǔn) 化。
為了有效地再現(xiàn)記錄在BD中的數(shù)據(jù)和/或?yàn)榱朔奖阌脩?hù),許多諸如文本字 幕信息的輔助數(shù)據(jù)(AUXi^)可伴隨主AV數(shù)據(jù)同時(shí)被提供。同樣,必須有效地管 理信息來(lái)再現(xiàn)主AV數(shù)據(jù)和次要或輔助數(shù)據(jù)。
然而,諸如文本字幕的輔助數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)還沒(méi)有被完全提供。因此,在 發(fā)展用于BD的光記錄裝置中有許多障礙。
發(fā)明內(nèi)容
本發(fā)明部分涉及具有用于管理文本字幕數(shù)據(jù)再現(xiàn)的數(shù)據(jù)結(jié)構(gòu)的記錄介質(zhì)。 在一個(gè)實(shí)施例中,示例性記錄介質(zhì)的記錄區(qū)域存儲(chǔ)文本字幕流,文本字幕 流包括對(duì)話樣式片段及至少一個(gè)和對(duì)話樣式片段關(guān)聯(lián)的對(duì)話顯像片段。所述對(duì) 話樣式片段包括最少一組樣式信息。每組樣式信息提供了用于在圖像中定位區(qū) 域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息。所述對(duì)話
顯像片段包括至少一個(gè)區(qū)域字幕信息。區(qū)域字幕信息包括文本字幕數(shù)據(jù)(例如, 樣式數(shù)據(jù)和/或文本串?dāng)?shù)據(jù))和區(qū)域樣式標(biāo)識(shí)符,而區(qū)域樣式標(biāo)識(shí)符識(shí)別對(duì)話 樣式片段中的樣式信息組中的一組,以應(yīng)用于文本字幕數(shù)據(jù)。
區(qū)域定位信息可提供圖像中的區(qū)域的左上角的水平位置和垂直位置。
在一個(gè)實(shí)施例中,每組樣式信息可進(jìn)一步包括區(qū)域尺寸信息(指出區(qū)域的 高度和區(qū)域的寬度)或區(qū)域背景色的指示符。
在一個(gè)實(shí)施例中,每組樣式信息包括用戶(hù)可改變信息,指出用戶(hù)可移動(dòng)區(qū) 域的水平方向、以及用戶(hù)可移動(dòng)區(qū)域的垂直方向。
在另一個(gè)實(shí)施例中,文本框定位信息提供了區(qū)域中的文本框的左上角的水 平位置和垂直位置。
同樣,在進(jìn)一步的實(shí)施例中,每組樣式信息可進(jìn)一步包括指出文本框的高 度和文本框的寬度的文本框尺寸信息、指出文本框中采用的文本字幕數(shù)據(jù)的字 符行進(jìn)的文本滾動(dòng)信息、指出如何在文本框中排列文本字幕數(shù)據(jù)的文本排列信 息、指出文本框中文本字幕數(shù)據(jù)行之間的間距的行間距信息、標(biāo)識(shí)記錄在記錄 介質(zhì)上用于在文本框中再現(xiàn)文本字幕數(shù)據(jù)的字體文件的字體標(biāo)識(shí)符、指出用于 文本框中的文本字幕數(shù)據(jù)的字體字形的字體字形指示符、指出用于文本框中的 文本字幕數(shù)據(jù)的字體尺寸的字體尺寸信息,指出用于文本框中的文本字幕數(shù)據(jù) 的顏色的字體顏色信息。
在此實(shí)施例中,每組樣式信息可包括用戶(hù)可改變信息,指出用戶(hù)可移動(dòng)區(qū) 域的水平方向、用戶(hù)可移動(dòng)區(qū)域的垂直方向、用戶(hù)是否可增大或減小字體尺寸、 用戶(hù)可移動(dòng)文本框的水平方向、用戶(hù)可移動(dòng)文本框的垂直方向、用戶(hù)是否可增 大或減小文本框的高度、用戶(hù)是否可增大或減小文本框的寬度、或用戶(hù)是否可 增大或減小文本框中文本字幕數(shù)據(jù)行之間的間距。
在本發(fā)明的又一個(gè)實(shí)施例中,記錄介質(zhì)的記錄區(qū)存儲(chǔ)文本字幕流,文本字 幕流包括至少一組樣式信息以及和多組樣式信息之一相關(guān)的文本字幕數(shù)據(jù)。每 組樣式信息提供了用于在圖像中定位區(qū)域的區(qū)域定位信息、以及區(qū)域背景顏色 指示符。
本發(fā)明還部分涉及與所述記錄介質(zhì)相關(guān)的方法和裝置。
在根據(jù)本發(fā)明的用于在記錄介質(zhì)上記錄用于管理文本字幕數(shù)據(jù)的數(shù)據(jù)結(jié)
構(gòu)的方法的一個(gè)實(shí)施例中,文本字幕流被記錄在記錄介質(zhì)上。文本字幕流包括 對(duì)話樣式片段以及至少一個(gè)與該對(duì)話樣式片段關(guān)聯(lián)的對(duì)話顯像片段。對(duì)話樣式 片段包括至少一組樣式信息。每組樣式信息提供了用于在圖像中定位區(qū)域的區(qū) 域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息。對(duì)話顯像片段包 括至少一個(gè)區(qū)域字幕信息。區(qū)域字幕信息包括文本字幕數(shù)據(jù)(例如,樣式數(shù)據(jù) 和/或文本串?dāng)?shù)據(jù))和區(qū)域樣式標(biāo)識(shí)符,而區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)了用于文本字 幕數(shù)據(jù)的對(duì)話樣式片段中的多組樣式信息之一。
在另一個(gè)實(shí)施例中,用于解碼文本字幕數(shù)據(jù)的裝置包括解碼文本字幕流的 字幕解碼單元,而相關(guān)方法包括解碼文本字幕流。文本字幕流包括對(duì)話樣式片
段以及至少一個(gè)與該對(duì)話樣式片段關(guān)聯(lián)的對(duì)話顯像片段。對(duì)話樣式片段包括至 少一組樣式信息。每組樣式信息提供了用于在圖像中定位區(qū)域的區(qū)域定位信息 以及用于在區(qū)域中定位文本框的文本框定位信息。對(duì)話顯像片段包括至少一個(gè) 區(qū)域字幕信息。區(qū)域字幕信息包括文本字幕數(shù)據(jù)(例如,樣式數(shù)據(jù)和/或文本 串?dāng)?shù)據(jù))和區(qū)域樣式標(biāo)識(shí)符,而區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)了用于文本字幕數(shù)據(jù)的對(duì) 話樣式片段中的多組樣式信息之一。
在又一個(gè)實(shí)施例中,用于解碼文本字幕數(shù)據(jù)的裝置包括解碼文本字幕流的 字幕解碼單元,而相關(guān)方法包括解碼文本字幕流。文本字幕流包括至少一組樣
式信息以及和多組樣式信息之一關(guān)聯(lián)的文本字幕數(shù)據(jù)。每組樣式信息提供了用 于在圖像中定位區(qū)域的區(qū)域定位信息和用于在區(qū)域中定位文本框的文本框定 位信息、以及區(qū)域背景顏色指示符。
附圖,提供了對(duì)于本發(fā)明的進(jìn)一步理解,被結(jié)合作為本申請(qǐng)的一部分,示 出了本發(fā)明的實(shí)施例,并和說(shuō)明書(shū)一起闡述了本發(fā)明的原理。在圖中
圖1示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的高密度光盤(pán)的文件結(jié)構(gòu); 圖2示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例記錄在高密度光盤(pán)中的文件結(jié)
構(gòu)以及相關(guān)信息的構(gòu)成;
圖3示出了在單個(gè)視頻幀中和主AV流同時(shí)顯示的文本字幕流;
圖4是示出具有文件信息的文件結(jié)構(gòu)的視圖,用于闡明根據(jù)本發(fā)明的一個(gè)
示例性實(shí)施例的管理文本字幕再現(xiàn)的方法;
圖5A到5C示出了顯示在顯示器上的帶有相關(guān)字幕的再現(xiàn)主AV流,用于 闡述記錄在文本字幕流中的管理信息;
圖6示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的文本字幕流文件結(jié)構(gòu);
圖7示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例包含在文本字幕流中的對(duì)話樣
式單元(DSU)以及對(duì)話顯像單元(DPU);
圖8和圖9示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的文本字幕流的句法; 圖10A到12C示出了根據(jù)本發(fā)明的第一實(shí)施例的文本字幕流中的對(duì)話樣式
單元的句法;
圖13A和13B示出了根據(jù)本發(fā)明的第二實(shí)施例的文本字幕流中的對(duì)話樣式 單元的句法;
圖14A到14G示出了根據(jù)本發(fā)明的第一實(shí)施例的文本字幕流中的對(duì)話樣式 單元的句法;
圖15示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例記錄在文本字幕流中的數(shù)據(jù) 結(jié)構(gòu);
圖16示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例具有文本字幕流的光盤(pán)再現(xiàn) 裝置的解碼單元;
圖17示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的文本字幕流解碼器;以及 圖18示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例再現(xiàn)文本字幕流的方法。
具體實(shí)施例方式
現(xiàn)在詳細(xì)參考附圖所示的本發(fā)明的示例性實(shí)施例。在所有的附圖中,將盡 可能使用相同的附圖標(biāo)記表示同樣或類(lèi)似的部分。
在本發(fā)明中,主數(shù)據(jù)是記錄在光盤(pán)中的標(biāo)題信息,包括視頻和音頻數(shù)據(jù), 由盤(pán)的作者提供給用戶(hù)。通常,視頻和音頻數(shù)據(jù)是基于MPEG2格式記錄的,并被 稱(chēng)為主AV流或主數(shù)據(jù)。
輔助數(shù)據(jù)代表和主數(shù)據(jù)相關(guān)的數(shù)據(jù),提供給用戶(hù)以便方便地再現(xiàn)主數(shù)據(jù)。 輔助數(shù)據(jù)包括字幕信息、交互式圖形流、顯像圖形流、聲音信息和具有可瀏覽 的幻燈播放的附加音頻數(shù)據(jù)。根據(jù)輔助數(shù)據(jù)的特征,輔助數(shù)據(jù)基于MPEG2格式通
過(guò)和主AV流多路復(fù)用而被錄制,或者輔助數(shù)據(jù)作為獨(dú)立于主AV流的流文件基于 MPEG2或其它合適的格式而被錄制。
字幕作為輔助數(shù)據(jù)通常是和再現(xiàn)主AV數(shù)據(jù)產(chǎn)生的視頻圖像一起顯示在顯 示器的預(yù)定區(qū)域的閉合標(biāo)題。當(dāng)用戶(hù)希望用所需語(yǔ)言的字幕再現(xiàn)主AV數(shù)據(jù)時(shí), 通過(guò)在光盤(pán)提供的多種語(yǔ)言的字幕中選擇字幕的語(yǔ)言,將字幕的語(yǔ)言和視頻圖 像一起顯示在顯示器的一個(gè)區(qū)域。因此,可能以多種格式提供字幕。特別地, 以文本數(shù)據(jù)記錄的字幕為文本字幕。
接下來(lái),結(jié)合圖1和2,詳細(xì)闡述光盤(pán)中記錄的主數(shù)據(jù)和包括文本字幕數(shù) 據(jù)的輔助數(shù)據(jù)的記錄格式,以及用于管理主數(shù)據(jù)和輔助數(shù)據(jù)的文件結(jié)構(gòu)。
圖l示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例管理盤(pán)上的各種數(shù)據(jù)的文件結(jié) 構(gòu)。如所示,至少一個(gè)BD目錄B麗存在于一個(gè)根目錄下。在BD目錄B羅中,包 含了作為通用文件(上部文件)信息以確保和用戶(hù)互動(dòng)的索引文件index.bdmv和 對(duì)象文件MovieObject.bdmv。此外,BD目錄B麗中包含播放列表目錄PLAYLIST、剪 輯信息目錄CLIPINF、流目錄ST國(guó)、以及輔助數(shù)據(jù)目錄ALKDATA。
用于被稱(chēng)為"主AV流"的視頻和音頻流的文件按照特定格式記錄在盤(pán)中, 而諸如文本字幕(下面稱(chēng)為文本字幕流)的輔助流獨(dú)立存在于流目錄STREAM中。 由于文本字幕流文件和AV流文件以MPEG2格式(如MPEG2傳輸信息包)記錄,'*.m2ts' 用作為每個(gè)流文件的擴(kuò)展名(例如,01000.m2ts、 02000.m2ts和10001.m2ts)??商娲?地,例如,在文本字幕流文件的情況下,'*.txtst'可被用作擴(kuò)展名,因?yàn)槲谋?字幕流具有和主AV流不同的輔助數(shù)據(jù)特征。
在BD規(guī)范中,AV流可被稱(chēng)作剪輯流文件。涉及本發(fā)明,文本字幕數(shù)據(jù)將以 和AV流文件分開(kāi)的文件的形式存在。例如在圖1中,文本字幕數(shù)據(jù)作為文本字 幕流文件10001. m2ts或10001. txtst存在。
剪輯信息目錄CLIPINF包括剪輯信息文件tclpi,每個(gè)剪輯信息文件和流文 件一一對(duì)應(yīng)。剪輯信息文件^clpi具有所對(duì)應(yīng)的流文件的屬性信息和定時(shí)信息, 并用作管理文件。更明確地,剪輯信息文件中的信息包括映射信息,使顯像時(shí) 間戳(PTS)映射到對(duì)應(yīng)流文件中的源信息包的源信息包號(hào)(SPN)。該映射被稱(chēng)為 入口點(diǎn)映射或"EP_MAP"。
流文件和對(duì)應(yīng)的剪輯信息文件可被共同稱(chēng)作"剪輯"。因此,在剪輯信息
9
目錄CLIPINF中的文件"01000. clpi"具有流目錄STREAM中的文件'401000. m2ts"的屬性 信息和定時(shí)信息,"01000. clpi"和't)1000. m2ts"構(gòu)成 一 個(gè)剪輯。
播放列表目錄PLAYLIST包括播放列表文件^mpls,每個(gè)播放列表文件具有至 少一個(gè)播放項(xiàng)目Playltem,指出某一剪輯的播放間隔。播放項(xiàng)目Playltem包括關(guān) 于用于回放的某一剪輯的播放開(kāi)始時(shí)間In-Time和播放結(jié)束時(shí)間Out-Time的定時(shí) 信息,并通過(guò)在剪輯信息文件名字段中提供剪輯信息文件名標(biāo)識(shí)剪輯。利用在 In-Time和Out-Time信息中的PTS信息,指定的剪輯信息文件的EP映射允許搜 索并獲得對(duì)應(yīng)流文件的特定流地址或位置(例如,SPN),使得對(duì)播放項(xiàng)目的再 現(xiàn)導(dǎo)致了剪輯的再現(xiàn)。
播放列表文件Ampls用作基礎(chǔ)管理文件,通過(guò)提供至少一個(gè)播放項(xiàng)目 Playltem來(lái)播放希望的剪輯。此外,播放列表文件*.mpls也可提供子播放項(xiàng)目 SubPlayltem用來(lái)管理例如補(bǔ)充數(shù)據(jù)的再現(xiàn),所述補(bǔ)充數(shù)據(jù)可與播放項(xiàng)目Playltem 同步或不同步(例如,可瀏覽的幻燈播放)地再現(xiàn)。例如,在包含子播放項(xiàng)目 用于回放文本字幕的情況下,對(duì)應(yīng)的子播放項(xiàng)目和播放項(xiàng)目同步回放數(shù)據(jù)。然 而,在包含子播放項(xiàng)目用于回放可瀏覽的幻燈播放的音頻數(shù)據(jù)的情況下,對(duì)應(yīng) 的子播放項(xiàng)目和播放項(xiàng)目不同步。
在本發(fā)明的一個(gè)實(shí)施例中,包括文本字幕在內(nèi)的輔助數(shù)據(jù)是通過(guò)例如子播 放項(xiàng)目SubPlayltems管理的,下面將詳細(xì)闡述。
輔助數(shù)據(jù)目錄AUXDATA是用于單獨(dú)記錄用于回放的輔助數(shù)據(jù)文件的區(qū)域。例 如,為了支持用戶(hù)更友好的回放,在其中記錄了用于提供點(diǎn)擊聲的聲音文件 Sound.bmdv、和文本字幕回放一起使用的字體文件*. font或*. otf等等。
因此,文本字幕流10001.nfits,作為一種輔助數(shù)據(jù),可被記錄在輔助數(shù)據(jù)目 錄AUXDATA中。
此夕卜,上述BD目錄B麗中,索引文件index.bdmv以及對(duì)象文件MovieObject.bdmv 作為通用文件而存在,以確保和用戶(hù)互動(dòng)。索引文件index.bdmv具有索引表,提 供用戶(hù)可選擇的菜單信息和標(biāo)題信息。MovieObject.bdmv提供導(dǎo)航命令,例如,執(zhí) 行播放列表,并可通過(guò)索引表中做出的選擇被調(diào)用。
圖2示出了記錄在光盤(pán)中的文件結(jié)構(gòu)以及相關(guān)信息的格式。光盤(pán)包括文件 系統(tǒng)信息區(qū)、數(shù)據(jù)庫(kù)區(qū)和流區(qū)。用于管理文件的系統(tǒng)信息記錄在文件系統(tǒng)信息
區(qū)中。在數(shù)據(jù)庫(kù)區(qū)中,記錄了用于再現(xiàn)記錄的流文件(*.m2ts)的播放列表文件 (承.ni2ts)以及剪輯信息文件0Kclpi)、索引文件(index.bdmv)、和對(duì)象文件 (MovieObject.bdmv)。同樣,主數(shù)據(jù)和輔助數(shù)據(jù)記錄在流區(qū)中。如前所述,主數(shù) 據(jù)包括音頻、視頻和圖形數(shù)據(jù),而輔助數(shù)據(jù)包括文本字幕。同樣,輔助數(shù)據(jù)在 流區(qū)中作為獨(dú)立文件和主數(shù)據(jù)分開(kāi)記錄。即,輔助數(shù)據(jù)記錄在流區(qū)中而不和主 數(shù)據(jù)多路復(fù)用。相應(yīng)地,用戶(hù)決定基于存儲(chǔ)在數(shù)據(jù)庫(kù)區(qū)和流區(qū)中的信息再現(xiàn)主 數(shù)據(jù)和輔助數(shù)據(jù)的方法。
接下來(lái),將詳細(xì)描述文本字幕流文件的文件結(jié)構(gòu)。此外,將詳細(xì)描述定義 用于再現(xiàn)文本字幕的管理信息的方法、用于構(gòu)建包括定義的管理信息的文本字 幕流文件的文件結(jié)構(gòu)的方法、以及用于再現(xiàn)流文件的方法和裝置。
圖3示出了一個(gè)顯示器,將文本字幕流和主AV流在一個(gè)視頻幀上同時(shí)顯示。 即,它示出了文本字幕隨通過(guò)再現(xiàn)主AV流產(chǎn)生的單個(gè)視頻幀而顯示,并在時(shí)間
上將文本字幕和所產(chǎn)生的視頻幀適時(shí)同步。
圖4是根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的具有文件信息的文件結(jié)構(gòu)的視 圖,用于闡明管理文本字幕的再現(xiàn)的方法。文本字幕由播放列表中的子播放項(xiàng) 目管理,并且一個(gè)子播放項(xiàng)目管理多個(gè)文本字幕剪輯的再現(xiàn)。
如所示,播放列表文件包括至少一個(gè)或多個(gè)管理主AV剪輯的再現(xiàn)的播放項(xiàng) 目。在有一個(gè)或多個(gè)文本字幕與主AV數(shù)據(jù)相關(guān)聯(lián)的情況下,文本字幕按照子播 放項(xiàng)目被管理。例如,圖4示出了在播放列表文件中的英語(yǔ)文本字幕剪輯l和 韓語(yǔ)字幕剪輯2,并示出了字幕剪輯1和字幕剪輯2是和主AV數(shù)據(jù)在時(shí)間上同 步的。即,字幕剪輯和主AV數(shù)據(jù)在目標(biāo)顯像時(shí)間一起顯示。
因此,提供關(guān)于目標(biāo)顯像時(shí)間、字幕的位置和尺寸的管理信息用來(lái)再現(xiàn)文 本字幕。接下來(lái),詳細(xì)闡述用來(lái)再現(xiàn)文本字幕的管理信息。
圖5A到5C示出了顯示在顯示器上的帶有相關(guān)文本字幕的再現(xiàn)的主AV流, 用于闡述記錄在文本字幕流中的管理信息。圖5A示出了對(duì)話信息,圖5B示出 了區(qū)域信息以及圖5C示出了樣式信息。
圖5A示出了用于管理文本字幕的再現(xiàn)的管理信息的對(duì)話信息。對(duì)話信息 是用于在顯像時(shí)間管理至少一個(gè)或多個(gè)文本數(shù)據(jù)。
艮P,顯像時(shí)間是再現(xiàn)相應(yīng)字幕的時(shí)間,被表述為PTS。通過(guò)將在PTS顯示的
文本字幕限定為對(duì)話,方便地管理字幕再現(xiàn)。
例如,如果文本字幕在PTS(k)和PTS(k+l)顯示為兩行,文本字幕限定為同 一個(gè)對(duì)話。在一個(gè)實(shí)施例中,在一個(gè)對(duì)話中的文本字幕數(shù)據(jù)少于ioo個(gè)字符碼。
圖5B示出了管理信息中的區(qū)域信息。該區(qū)域?yàn)殛P(guān)于在顯像時(shí)間構(gòu)造對(duì)話
的信息。同樣,該區(qū)域表示單個(gè)視頻幀中同樣地應(yīng)用了全局樣式信息的區(qū)域。 在一個(gè)實(shí)施例中,單個(gè)對(duì)話有至多兩個(gè)區(qū)域。即,在這個(gè)實(shí)施例中,對(duì)話可用
單個(gè)或兩個(gè)區(qū)域構(gòu)建。
在單個(gè)對(duì)話中限定至多兩個(gè)區(qū)域的理由是當(dāng)文本字幕再現(xiàn)時(shí)調(diào)節(jié)解碼的
工作負(fù)荷。然而,在其它實(shí)施例中區(qū)域的數(shù)量可以被限定為最大n (n>=2)。
圖5C示出了管理信息的樣式信息。樣式信息是關(guān)于指定用于顯示文本字 幕的方法的信息,并包括諸如字幕的位置、尺寸和背景顏色之類(lèi)的樣式信息。 文本排列或文本滾動(dòng)可以作為樣式信息。
在本發(fā)明的一個(gè)實(shí)施例中,樣式信息被分為全局樣式信息和局部樣式信息 用于以不同方式顯示文本字幕。
全局樣式信息是同樣地應(yīng)用于各區(qū)域的樣式信息,且它包括每個(gè)區(qū)域的位 置和每個(gè)區(qū)域的尺寸。這個(gè)信息被稱(chēng)為區(qū)域樣式(region—style)。圖5C示出了 兩個(gè)不同的區(qū)域樣式信息應(yīng)用于兩個(gè)區(qū)域(region ftl和tt2)。"位置1、尺寸1、 顏色=藍(lán)色"的區(qū)域樣式應(yīng)用于區(qū)域1 (regionttl)。"位置2、尺寸2、顏色= 紅色"的區(qū)域樣式應(yīng)用于區(qū)域2 (regionft2)。
局部樣式信息是根據(jù)區(qū)域中的每個(gè)文本數(shù)據(jù)行或每個(gè)文本數(shù)據(jù)字符而應(yīng) 用的樣式信息。該信息可被稱(chēng)為內(nèi)聯(lián)樣式"inline—style"。即,內(nèi)聯(lián)樣式可以 是當(dāng)區(qū)域樣式改變時(shí)為文本數(shù)據(jù)定義的樣式信息。
例如,在圖5C中,"內(nèi)聯(lián)樣式信息(inline—style)"應(yīng)用到區(qū)域#1,不同 的內(nèi)聯(lián)樣式應(yīng)用到在文本數(shù)據(jù)中的"mountain"。
圖6示出了文本字幕流文件結(jié)構(gòu)。例如,圖6示出了圖1的文本字幕流文 件"10001. m2ts"的結(jié)構(gòu)。
在這個(gè)實(shí)施例中,文本字幕流按照MPEG2傳輸流構(gòu)建。該傳輸流包括多個(gè)傳 輸信息包,而同一信息包標(biāo)識(shí)符(PID)被分配到這些傳輸信息包(TP)諸如 "PEKM8xx"。因此,光盤(pán)再現(xiàn)方法或裝置通過(guò)只提取分配有"PIIMM8xx"的
傳輸信息包,有效地從輸入流中提取文本字幕流。
單個(gè)信息包基本流(PES)包括多個(gè)傳輸信息包TP。在這個(gè)實(shí)施例中,每個(gè) 對(duì)話形成單個(gè)PES,從而有效地再現(xiàn)對(duì)話。
文本字幕流中的第一個(gè)信息包基本流(PES)包括含有一組區(qū)域樣式的對(duì)話 樣式單元DSU (可替換地稱(chēng)為對(duì)話樣式片段DSS)。并且,第二個(gè)和隨后的信息 包基本流中的每以個(gè)基本流都包括含有真正的對(duì)話信息的對(duì)話顯像單元DPU(可 替換地稱(chēng)為對(duì)話顯像片段DPS)。
因此,圖5A到5C中定義的對(duì)話信息包括DPU,以及對(duì)話信息的樣式信息 包括內(nèi)聯(lián)樣式信息(內(nèi)聯(lián)樣式)以及鏈接到DSU中限定的各種區(qū)域樣式之一的 鏈接信息(region—style—id)。
在一個(gè)實(shí)施例中,對(duì)話樣式單元包括最大數(shù)量的區(qū)域樣式組。例如,對(duì)話 樣式單元包括最多60個(gè)區(qū)域樣式組,并且它們通過(guò)分配到每個(gè)區(qū)域樣式組的 唯一的區(qū)域樣式標(biāo)識(shí)(region_style—id)來(lái)區(qū)分。
圖7示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例包含在文本字幕流中的對(duì)話樣 式單元(DSU)以及對(duì)話顯像單元(DPU)。文本字幕流的句法后面將結(jié)合圖8進(jìn)行 闡述。
在此實(shí)施例中,對(duì)話樣式單元(DSU)包括最多60個(gè)區(qū)域樣式組且區(qū)域樣式 組通過(guò)區(qū)域樣式標(biāo)識(shí)(region一stylejd)來(lái)區(qū)分。區(qū)域樣式組包括各種區(qū)域樣式和 用戶(hù)可變樣式組,且區(qū)域樣式組根據(jù)區(qū)域樣式標(biāo)識(shí)來(lái)記錄。區(qū)域樣式信息和用 戶(hù)可變樣式組的句法將后面將結(jié)合圖IOA進(jìn)行闡述。
對(duì)話顯像單元(DPU)包括文本數(shù)據(jù)和PTS組,是文本數(shù)據(jù)的一組顯像時(shí)間。 DPU還包括應(yīng)用于每個(gè)區(qū)域的樣式信息。因此,DSU包括用于將區(qū)域樣式信息鏈 接到對(duì)應(yīng)區(qū)域的region一style一id。
如圖7所示,DPW1包括單個(gè)區(qū)域的對(duì)話顯像信息。因?yàn)镈PUttl包括用于將 DPU#1鏈接到對(duì)應(yīng)區(qū)域樣式組的region—style—id=k,所以應(yīng)用于文本數(shù)據(jù)ttl的區(qū) 域樣式是DPU中的區(qū)域樣式組妝。DPUft2包括兩個(gè)區(qū)域。文本數(shù)據(jù)ttl的第一個(gè)區(qū) 域指向區(qū)域樣式組ttk (Region—style—id=k)。又,因?yàn)镈PUtt2的區(qū)域2的區(qū)域樣式 鏈接信息是Region—style—id=n,所以區(qū)域樣式ttn應(yīng)用于第二區(qū)域的文本數(shù)據(jù)tt2。 類(lèi)似地,區(qū)域樣式組to和區(qū)域樣式組ttra分別應(yīng)用于DPUtt3和DPU糾。
由region—style—id鏈接的樣式信息作為全局樣式信息被同樣地應(yīng)用于相應(yīng) 區(qū)域中的文本數(shù)據(jù)。在文本數(shù)據(jù)中的文本串根據(jù)特定樣式信息改變的情況下, 局部樣式信息應(yīng)用于相應(yīng)的文本串。
接下來(lái),將闡述DSU和DPU的句法。
圖8示出了根據(jù)一個(gè)示例性實(shí)施例的文本字幕流(Text—Subtitle—stream())的 句法。如圖8所示,該文本字幕流(Text—Subtitle—streamO)包括定義了樣式信息組 的單個(gè)DSU ( dialog—style—unit0 )以及包含了對(duì)話信息的多個(gè)DPU (dialog_presentation—unit 0 )。 艮卩,函數(shù) Text—Subtitle—stream()包J舌了函數(shù) dialog—style—unit ()禾卩函數(shù) dialog_presentation—unit()。 文本字幕流用函數(shù) Text—Subtitle_stream()記錄,且記錄的文本字幕流利用由函數(shù)dialog—style_unit 0定 義的單個(gè)DSU和由函數(shù)dialog_presentation—unit ()定義的多個(gè)DPU構(gòu)建。
圖9示出了對(duì)話樣式單元(DSU)的句法。如前所述,DSU由函數(shù) dialog—style—unit ()定義,而圖9示出了函數(shù)dialog—style—unit ()的詳細(xì)結(jié)構(gòu)。如圖 9所示,該dialog—style—unit ()包J舌函數(shù)dialog^styleset ()。 函數(shù)dialog—styleset ()定 義了與對(duì)話相對(duì)應(yīng)的樣式信息組。因此,DSU包括具有用于相應(yīng)對(duì)話的各種樣式 信息的樣式信息組。
接下來(lái),將闡述本發(fā)明定義樣式信息組(dialog一styleset())的各種實(shí)施例。 這些實(shí)施例根據(jù)定義文本數(shù)據(jù)的標(biāo)準(zhǔn)位置和對(duì)話尺寸的方法來(lái)劃分。圖IOA到 12C展示了描述第一實(shí)施例的函數(shù)和視圖,圖13A到13C示出了描述第二實(shí)施 例的函數(shù)和視圖,以及圖14A到14G描繪了描述第三實(shí)施例的函數(shù)和視圖。
圖10A到12C展示了描述了根據(jù)本發(fā)明的第一實(shí)施例用于通過(guò)函數(shù) dialog—styleset()定義對(duì)話的樣式信息組的函數(shù)和視圖。定義樣式信息組的第一 實(shí)施例,通過(guò)定義給區(qū)域中文本數(shù)據(jù)指定尺寸以及參考位置的文本框信息,來(lái) 描述其特征。
圖10A示出了根據(jù)本發(fā)明的第一實(shí)施例,圖9的函數(shù)dialog—style—unit()中 定義的dialog—styleset()句法的詳細(xì)結(jié)構(gòu)。在函數(shù)dialog—styleset()中,除了函數(shù) 區(qū)域樣式region—style()之外,還提供了播放器樣式標(biāo)記player—style一flag、區(qū)域樣 式數(shù)number—of—region—styles、用戶(hù)樣式數(shù)number_of—user—styles、用戶(hù)可變樣式組函 數(shù)user—changeable—styleset ()以及函數(shù)palette(),用于定義對(duì)話的區(qū)域樣式信息。
標(biāo)記player—style—flag指出是否允許用戶(hù)改變樣式信息,而函數(shù) user—changeable—styleset()提供了樣式信息改變范圍。函數(shù)palette0提供了顏色信 息。
如上所述,區(qū)域樣式信息是根據(jù)每個(gè)區(qū)域定義的全局樣式信息。唯一的標(biāo) 識(shí)(region—style—id)被分配到每一個(gè)區(qū)域樣式信息。因此,基于與分配的標(biāo)識(shí) region—style—idX寸應(yīng)的樣式信息組提供對(duì)話的區(qū)域樣式信息。
因此,通過(guò)記錄應(yīng)用到DPU中的對(duì)話的標(biāo)識(shí)region—style—id,對(duì)話可通過(guò)應(yīng) 用基于創(chuàng)作對(duì)話時(shí)dialog—stylesetO中同樣的region—style_id定義的樣式信息組得 到再現(xiàn)。
接下來(lái),將闡述根據(jù)region一style一id提供的樣式信息組中包含的樣式信息 (Style Info)。
首先,作為用于定義圖像幀相應(yīng)區(qū)域的位置和尺寸的信息,提供了區(qū)域水 平位置region—horizontal_position、 區(qū)域垂直位置region—vertical_position、 區(qū)域?qū)?度region—width和區(qū)域高度region—height 。還提供了區(qū)域背景顏色標(biāo)識(shí) region—bg_C0lor—entry—id用于定義相應(yīng)區(qū)域的背景色。
其次,提供了用于代表相應(yīng)區(qū)域中的文本框尺寸的文本框信息。文本框表 示相應(yīng)區(qū)域中顯示文本數(shù)據(jù)的區(qū)域。
文本框的尺寸通過(guò)文本框?qū)挾萾ext—box—width和文本框高度text—box—height來(lái) 表示。區(qū)域中相應(yīng)文本框的原點(diǎn)由文本框水平位置text—box—horizontal_position和 文本框垂直4立置text—box—verticaljDosition來(lái)提〈共。
此外,定義文本滾動(dòng)text_fl0W來(lái)定義顯示文本的方向,定義文本排列 text—alignment來(lái)定義排列文本的方向,諸如右、左和中間。在text—flow的情況下, 當(dāng)為了防止用戶(hù)搞混而在對(duì)話中有多個(gè)區(qū)域時(shí),將相應(yīng)對(duì)話中的每個(gè)區(qū)域定義 為具有同樣的text一flow。
通過(guò)參見(jiàn)圖IIA到12C,下面將詳細(xì)闡述根據(jù)text—flow和text—alignment的 文本框信息的規(guī)定。
作為包含在樣式信息組中的樣式信息,定義了行間距l(xiāng)ine—space用于控制相 應(yīng)區(qū)域中行之間的間距。又,定義字體標(biāo)識(shí)font—id、字體樣式font—style、字體 尺寸font—size和字體色彩標(biāo)識(shí)font—color_entry—id作為控制相應(yīng)區(qū)域中的文本數(shù)
據(jù)的字體信息。
在dialog—styleset()中的player_Style—flag是表示再現(xiàn)裝置的樣式信息是否可 用的信息。例如,如果player一style—flag被設(shè)為lb (player—style一flag二lb),則允 許除了使用dialog—styleset()中定義樣式信息之外,使用再現(xiàn)裝置的樣式信息來(lái) 再現(xiàn)文本字幕。如果player—style—flag被設(shè)為Ob (player—style—flag=0b),則文本 字幕只通過(guò)使用由dialog—styleset()定義的樣式信息再現(xiàn)。
圖10B示出了圖10A中的函數(shù)"dialog—styleset()"中定義的函數(shù) "user—changeable—styleset 0 ,,。
通過(guò)參見(jiàn)圖10B,函數(shù)user一changeable一styleset()定義了可被用戶(hù)改變的樣式 信息的類(lèi)型和改變范圍。因此,函數(shù)"user—changeable一styleset()"是用來(lái)讓用戶(hù) 方便地改變文本字幕數(shù)據(jù)的樣式信息的。
然而,在這個(gè)實(shí)施例中,用戶(hù)可變的樣式信息限于字體尺寸和區(qū)域位置。 因此,在函數(shù) user—changeable—stylesetO中定義了 區(qū)域tK平位置方向 region—horizontal_position—direction 、 區(qū) 域 水 平 位 置 增 量 region—horizontal_position—delta、 !^!^盲位詈方向region—vertical_position—direction、區(qū) J^官位Wi^量region—vertical_position—delta、 ^yc小i誠(chéng)font—size—inc—dec禾口 ^^大小增 量font—size一delta。由于文本框位置和行間距離根據(jù)字體尺寸的增加/減少而改 變,在函數(shù)user—changeable—stylesetO中定義了用于定義行間距和文本框位置的變
如上所述,函數(shù)user—changeable_styleset ()是根據(jù)region—style—id定義的,而多 個(gè)用戶(hù)可變樣式信息(user—style—id)是在函數(shù)user—changeable—styleset()中定義的。 例如,如果函數(shù)user一changeable—styleset ()根據(jù)region—styl e_i d=k定義,在本示例 性實(shí)施例中定義的函數(shù)user—changeable—stylesetO中定義最多25種用戶(hù)可變樣式 信息。
提供region_horizontal_posit ion—direct ion禾口 region—vertical_posit ion—direction用 于定義region—horizontaljx)sition禾G region—vertical_position的移動(dòng)方向,可根據(jù)用 戶(hù)樣式標(biāo)識(shí) user—style—id改變。同樣,提供 region—horizontal_position—delta禾口 region—vertical_position—delta用于以像素為單位的改變量定義在每個(gè)方向移動(dòng)區(qū) 域的一次改變。
例如,如果region_horizontalj30sition—direction定義為0,相應(yīng)區(qū)域向右移動(dòng)。 如果region—horizontaLposition一direction定義為1,相應(yīng)區(qū)域向左移動(dòng)。又,如果 region_vertical_position_direction定義為 0, 相應(yīng)區(qū)域向下移動(dòng)。如果 region_vertical_position—direction定義為1, 相應(yīng)區(qū)域向上移動(dòng)。
又,提供font—size—inc一dec用于定義字體尺寸的增加/減少的方向,可根據(jù) user—style一id而改變;以及提供font—size一delta用于以像素為單位指定字體尺寸 font—size的一次改變量。
例如,如果font—size—inc_dec定義為0 ,說(shuō)明增加font—size ,而如果 font—size_inc—dec定義為l, 說(shuō)明減少font—size。
更進(jìn)一步,提供文本框水平位置text_box—horizontaLposition和文本框垂直位 置textJx)x_vertical_position,用于定義根據(jù)font—size的增加/減少而變化的文本 框的參考位置。text—box—horizontal_position禾口 text—box—vertical_position可由提供 region—horizontal_position禾口 region— —verticaljDosition同樣的方法來(lái)定義。例如,記 錄text—box—horizontal_position禾口 text_box—vertical_position用于指定改變方向,以 及記錄文本框水平增量 text—box—horizontal—delta和文本框垂直增量 text—box—vertical—delta用于以像素為單位指定 一 次改變量。
又,可以和上面font—size所述的情況同樣地提供根據(jù)font一size敝曾加/減少 而改變的文本框?qū)挾萾ext—box—width和文本框高度text—box_height。例如,記錄文 本框?qū)挾仍鰷ptext—box—width_inc—dec和文本框高度增減text—box一height一inc一dec用于 指定增加/減少的方向,以及文本框?qū)挾仍隽縯ext—box—width一delta和文本框高度 增量text—box—height—delta用于以像素為單位指定一次改變量。
此外,根據(jù)font—size附曾加/減少的文本行間距(line—space)的增加/減少, 可用和定義font_size的增加/減少的同樣的方法來(lái)定義。即,記錄行間距增減 line—space—inc_ —dec禾卩行間距增量line— —space—delta。
圖11A和11B示出了依照根據(jù)圖10A所示的本發(fā)明的第一實(shí)施例定義的 text—box—horizontal_position、 text—box—vertical_position禾口 text—flow顯不文本框的范例。
艮卩,圖IIA不出了定義text—box—horizontal_position、 text—box—vertical_position 和text—flow用來(lái)參照區(qū)域的原點(diǎn)顯示文本數(shù)據(jù)(例如,離開(kāi)區(qū)域原點(diǎn)的偏移量),而不參照text_fl0W。在此情況,文本數(shù)據(jù)的原點(diǎn)變成文本框的左頂點(diǎn)(left-top) (同樣也稱(chēng)為左上角)而無(wú)需參照文本排列或text—flow。
圖11B示出了當(dāng)text—flow是從上至(J下時(shí),根據(jù)text_box—horizontal_position、 text—box—vertical_position禾口 text—flow顯示文本框中的文本數(shù)據(jù)。
如圖IIA的前一實(shí)施例一樣,文本框參照區(qū)域的原點(diǎn)定義。在此情況,文 本數(shù)據(jù)的原點(diǎn)變成文本框的左頂點(diǎn)而無(wú)需參照文本排列。
圖12A到12C示出了依照根據(jù)圖10A的本發(fā)明的第一實(shí)施例定義的 text—box一horizontaljx)sition、 text—box—vertical_position禾口 text—flow顯不文本框的另
一個(gè)范例。
艮卩,圖12A示出了當(dāng)text—flow是從左到右時(shí),定義text—box—horizontaljDOsition、 text—box—verticaljosition禾卩text—flow用來(lái)在左頂點(diǎn)顯示文本數(shù)據(jù)。圖12B示出了 當(dāng) text—flow 是從右至U 左時(shí),定義text_box—horizontal_position 、 text—boxjerticaljx)sition禾卩text—flow用來(lái)在右頂點(diǎn)顯示文本數(shù)據(jù)。圖12C示出了 當(dāng) text—flow 是從上至U 下日寸,定義 text—box—horizontal_position 、 text—box—vertical_position禾口 text—flow用來(lái)在右頂點(diǎn)顯示文本數(shù)據(jù)。
如圖12A到12C所示,文本數(shù)據(jù)的原點(diǎn)根據(jù)text—flow而從左頂點(diǎn)變到右頂點(diǎn), 無(wú)需參照文本排列。
圖13A示出了根據(jù)本發(fā)明的第二實(shí)施例在函數(shù)dialog—style一unit()中定義的 函數(shù)dialog—styleset () 。 dialog—style—unit ()的第二實(shí)施例記錄了文本填充信息而不是文本框信息。S卩,為了定義區(qū)域中文本數(shù)據(jù)的尺寸,記錄文本填充信息作為 區(qū)域樣式信息。文本填充信息包括填充頂部padding—top、填充底部padding—bottom、 填充左端padding—left,以及填充右端padding一right。通過(guò)文本填充信息,可確定
區(qū)域中的文本數(shù)據(jù)的總尺寸。
除了文本填充信息以外的信息和第一實(shí)施例中的相同。因此,省略詳細(xì)描述。
圖13B示出了區(qū)域中具有文本填充信息的文本數(shù)據(jù)的位置。根據(jù)第二實(shí)施 例中的 dialog—styleset 0定義的 padding—top 、 padding—bottcm、 padding—left , 以及 padding—right確定區(qū)域中文本數(shù)據(jù)的位置。
圖14A示出了根據(jù)本發(fā)明的第三實(shí)施例在函數(shù)dialog_Style—unit()中定義的
函數(shù)dialog—styleset () 。 dialog—styleset ()的第三實(shí)施例記錄了文本水平位置 text—horizontal_position禾口文本垂直位置text—vertical_position而不是文本框^f言息禾口 文本填充信息,且text—horizontal_position禾卩text—vertical_position根據(jù)文本排歹U text—alignment而改變。
艮卩,記錄text—horizontal_position禾口 text_vertical_position用來(lái)代表區(qū)i或中文 本數(shù)據(jù)的參照位置。參照位置被定義成根據(jù)text—alignment而改變,諸如左、中 和右。
除了 text—horizontaljxisition禾卩text—vertical_position以夕卜的信息禾卩第一實(shí)施 例中的相同。因此,省略詳細(xì)描述。
圖14B到14D示出了如果文本滾動(dòng)是左到右或右到左,且text一alignment被 定義為左(圖14B)、中(圖14C)或右(圖14D),文本數(shù)據(jù)的位置。
即,如果text—alignment被定義為如圖14B所示的左,則把 text—horizontal_position禾口 text—vertical_position定義為指定文本數(shù)據(jù)的第——行開(kāi)始 處位于左端位置。如果text—alignment被定義為如圖14C所示的中,則把 text—horizontalj)Osition禾口 text—vertical_position定義成指定文本數(shù)據(jù)的第——行開(kāi)始 處位于中間位置。如果text—alignment被定義為如圖14D所示的右,貝U把 text—horizontaljiosition禾口 text—verticaljx)sition定義成指定文本數(shù)據(jù)的第——《亍結(jié)束 處位于右端位置。
圖14E到14G示出了,如果文本滾動(dòng)是上到下,且text一alignment被定義為 上(圖14E)、中(圖14F)或下(圖14G)時(shí),文本數(shù)據(jù)的位置。
如果text—alignment被定義為如圖14E所示的上,則把text—horizontal_position 和text—verticaljx)sition定義成指定文本數(shù)據(jù)的第一行開(kāi)始處位于上部位置。如 果text—alignment被定義為如圖14F所示的中,則把text—horizontaljDOsition禾口 text—verticaljwsition定義成指定文本數(shù)據(jù)的第一行開(kāi)始處位于中間位置。如果 text—alignment被定義為如圖 14G所示的下,貝U把text—horizontal_position禾口 text—vertical josition定義成指定文本數(shù)據(jù)的第一行結(jié)束處位于下部位置。
如上所述,根據(jù)第一、第二和第三實(shí)施例之一,通過(guò)定義記錄文本數(shù)據(jù)框 或文本數(shù)據(jù)的參照位置來(lái)將文本數(shù)據(jù)與主AV流一起顯示。
接下來(lái),參照?qǐng)D15到18,闡述再現(xiàn)上述文本字幕流文件和顯示再現(xiàn)的文
本字幕流文件的方法。
圖15是示出了包括在對(duì)話顯像單元(DPU)和對(duì)話樣式信息單元(DSU)中的 信息的視圖。如上所述,DSU包括了一組用于每個(gè)對(duì)話中的每個(gè)區(qū)域的區(qū)域樣 式信息,而DPU包括了對(duì)話文本信息及顯像信息。
所述對(duì)話文本信息包括區(qū)域樣式標(biāo)識(shí)符,定義了用于每個(gè)區(qū)域的樣式信 息、文本串以及用于文本串的內(nèi)聯(lián)樣式信息。區(qū)域樣式標(biāo)識(shí)符是用于將相應(yīng)區(qū) 域鏈接到對(duì)話樣式信息單元(DSU)中的區(qū)域樣式信息的信息。
DPU中的顯像信息包括用于顯示每個(gè)對(duì)話的顯像時(shí)間戳(PTS)開(kāi)始時(shí)間 (PTS—start)和顯像時(shí)間戳結(jié)束時(shí)間(PTS一end)、用于在對(duì)話顯示過(guò)程中改變所用 顏色的調(diào)色板更新信息(palette一update一flag)、以及當(dāng)有顏色改變時(shí)的改變的調(diào) 色板信息(用來(lái)更新的調(diào)色板)。
即,文本字幕流由DSU中的對(duì)話樣式信息和DPU中的對(duì)話顯像信息來(lái)構(gòu)建。 并且,DSU和DPU中包含的信息根據(jù)信息的功能被分為三類(lèi)信息。換句話說(shuō), 信息被分為包括文本串的對(duì)話文本信息;包括用于顯示的時(shí)間、對(duì)話位置和顏 色改變的合成信息;以及將文本信息轉(zhuǎn)換為圖形信息的渲染信息。
如上所述,DSU中的信息被用作合成信息及渲染信息。如圖15所示,信息 "區(qū)域水平位置"和"區(qū)域垂直位置"被用作合成信息,因?yàn)?區(qū)域水平位置" 和"區(qū)域垂直位置"代表了顯示圖像中的區(qū)域的位置。同樣,信息"區(qū)域?qū)挾?和高度"、"字體和背景色"、"文本滾動(dòng)和排列",以及"字體名稱(chēng)、樣式 和尺寸"被用作渲染信息,因?yàn)檫@些信息用來(lái)根據(jù)每個(gè)對(duì)話的每個(gè)區(qū)域表達(dá)文 本。同樣,信息"文本位置",諸如文本框信息、文本填充信息和文本水平/ 垂直參考位置信息都包括在渲染信息中。
接下來(lái),將闡述用于再現(xiàn)包含再現(xiàn)管理信息的文本字幕的方法和裝置。
圖16是示出根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的用于再現(xiàn)文本字幕的包含 解碼單元40的光盤(pán)再現(xiàn)裝置的視圖。
如圖16所示,光盤(pán)再現(xiàn)裝置包括微型計(jì)算機(jī)3、系統(tǒng)解碼器4、 PID過(guò)濾 器5、音頻解碼單元10、視頻解碼單元20、圖形解碼單元30、字幕解碼單元 40、選擇單元6和混合單元50。系統(tǒng)解碼器4在微型計(jì)算機(jī)3的控制下將從光 盤(pán)再現(xiàn)的信號(hào)解碼為AV流(例如,MPEG流)。雖然為了清楚起見(jiàn)沒(méi)有示出,但
是微型計(jì)算機(jī)3還根據(jù)從用戶(hù)(例如,通過(guò)裝置上的控制按鈕或遙控器)接收 到的輸入以及如上所述從光盤(pán)再現(xiàn)的管理信息,來(lái)控制裝置的其它元件。PID 過(guò)濾器5接收AV流,并根據(jù)如MPEG流的傳輸信息包中的信息包標(biāo)識(shí)符(PID) 從系統(tǒng)解碼器4提取出存在的分離流,如視頻流、音頻流、圖形流和文本字幕 流。視頻解碼單元20從PID過(guò)濾器5接收提取出的視頻流,并解碼該提取出的 視頻流用來(lái)再現(xiàn)該提取出的視頻流。音頻解碼單元10從PID過(guò)濾器5接收提取 出的音頻流,并解碼該提取出的音頻流用來(lái)再現(xiàn)該提取出的音頻流。圖形解碼 單元30從PID過(guò)濾器5接收提取出的圖形流,并解碼該提取出的圖形流用來(lái)再 現(xiàn)該提取出的圖形流。同樣,文本字幕解碼單元40從PID過(guò)濾器5接收提取出 的文本字幕流,并解碼該提取出的文本字幕流用來(lái)再現(xiàn)該提取出的文本字幕 流。
光盤(pán)再現(xiàn)裝置還可以或另外從外部源接收文本字幕。因此本實(shí)施例的光盤(pán) 再現(xiàn)裝置可進(jìn)一步包括選擇單元6,用于為文本字幕解碼單元40選擇輸入源。
如果文本字幕和主數(shù)據(jù)一起基于MPEG格式記錄,輸入源就是PID過(guò)濾器5。 因此選擇單元6選擇PID過(guò)濾器5作為文本字幕流的輸入源,且選擇單元6將 提取自PID過(guò)濾器5的文本字幕流傳遞到文本字幕解碼單元40,如圖16的A所 示。如果光盤(pán)再現(xiàn)裝置從外部源接收文本字幕,選擇單元6將外部源選擇作為 文本字幕流的輸入源,且選擇單元6將來(lái)自外部源的文本字幕流傳遞到文本字 幕解碼單元40,如圖16的B所示。
視頻解碼單元20、音頻解碼單元10和圖形解碼單元30,每個(gè)分別包含傳 輸緩沖器11、 21、 31,用于緩沖視頻、音頻和圖形流。視頻解碼單元20還包 括視頻解碼器22和視頻平面23用于讀取傳輸緩沖器21中存儲(chǔ)的提取出的視 頻流、解碼提取出的視頻流并基于解碼的視頻數(shù)據(jù)產(chǎn)生視頻平面,即顯示在顯 示器上的單個(gè)視頻圖像幀。圖形解碼單元30還包括圖形解碼器32和圖形平面 33用于解碼存儲(chǔ)在傳輸緩沖器31中的提取出的圖形流并基于解碼的圖形數(shù)據(jù) 產(chǎn)生圖形平面,即和產(chǎn)生的視頻平面一起顯示的單個(gè)圖形圖像幀。圖形解碼單 元30還進(jìn)一步包括顏色査詢(xún)表(CLUr)34。 CLUT34包括用于控制顏色的槽(vale) 以及產(chǎn)生的圖形平面的透明度,用于將圖形平面和視頻平面重疊。
文本字幕解碼單元40包括預(yù)載緩沖器41、 T)CT-ST解碼器42、圖形平面(GP) 43和ai/T44。文本字幕解碼單元40從選擇單元6接收文本字幕數(shù)據(jù),且所接 收到的文本字幕數(shù)據(jù)被預(yù)載到預(yù)載緩沖器41中。通常,包括再現(xiàn)管理信息在 內(nèi)的單個(gè)文本字幕數(shù)據(jù)的大小為0.5M字節(jié)。因此,預(yù)載緩沖器41的容量應(yīng)大 于0.5M字節(jié)。為了提供無(wú)縫再現(xiàn),預(yù)載緩沖器41的容量應(yīng)比0.5M字節(jié)大得 多。例如,預(yù)載緩沖器41的大小可以通過(guò)考慮文本字幕數(shù)據(jù)的尺寸而標(biāo)準(zhǔn)化。 文本字幕數(shù)據(jù)被預(yù)載到預(yù)載緩沖器41是基于以下原因。由于整個(gè)文本字
幕的尺寸相對(duì)比較小,文本字幕數(shù)據(jù)可以被記錄在單獨(dú)的文件中。通過(guò)提供文 本字幕的單獨(dú)文件,它可以被容易地讀取并有效地用于再現(xiàn)文本字幕。另外,
通過(guò)將整個(gè)字幕數(shù)據(jù)預(yù)載到預(yù)載緩沖器41,控制緩沖器更加方便。
文本字幕(TXr-ST)解碼器42讀取存儲(chǔ)在預(yù)載緩沖器41中的文本字幕數(shù)據(jù) 并解碼該文本字幕數(shù)據(jù)。圖形平面43通過(guò)使用解碼的文本字幕數(shù)據(jù),產(chǎn)生字 幕圖形平面,即和圖形平面及視頻平面一起顯示的單個(gè)字幕圖像幀。字幕圖形 平面的顏色和透明度根據(jù)CLUT44中的值控制,用于將字幕圖形平面和圖形平面 及視頻平面重疊。
光盤(pán)再現(xiàn)裝置的混合單元50包括兩個(gè)加法器52和53,用于將來(lái)自視頻解 碼單元20、圖形解碼單元30和文本字幕解碼單元40的信號(hào)混合,并用于產(chǎn)生 具有相應(yīng)圖形平面和字幕的視頻圖像幀。S卩,混合單元50接收視頻解碼單元 20產(chǎn)生的圖像平面,圖形解碼單元30產(chǎn)生的圖形平面和文本字幕解碼單元40 產(chǎn)生的字幕平面,并通過(guò)重疊視頻平面、圖形平面和字幕圖形平面,產(chǎn)生帶有 相應(yīng)字幕的單個(gè)視頻圖像幀?;旧希曨l平面成為單個(gè)視頻圖像幀的背景。 圖形平面和字幕圖形平面重疊在視頻平面上。重疊的順序是根據(jù)圖形平面和字 幕圖形平面的特征來(lái)決定的。例如,如果圖形平面是顯像圖形,圖形平面首先 由混合單元50中的加法器52重疊在視頻平面上。由文本字幕解碼單元40產(chǎn) 生的字幕圖形平面由混合單元50中的加法器53重疊在加法器52的輸出上。 反過(guò)來(lái),如果來(lái)自圖形解碼單元30的圖形平面是交互式圖形,字幕圖形平面 首先由混合單元50中的加法器52重疊在視頻平面上,然后圖形平面由混合單 元50中的加法器53重疊在加法器52的輸出上。
接下來(lái),將詳細(xì)闡述通過(guò)利用基于文本字幕解碼器42的文本字幕解碼單 元40再現(xiàn)文本字幕的方法。
圖17是示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例的文本字幕解碼單元40的 視圖。圖16和17的相同附圖標(biāo)記代表同樣的功能塊。
接下來(lái),結(jié)合圖1到16以及圖17,詳細(xì)闡述根據(jù)本發(fā)明的一個(gè)實(shí)施例再
現(xiàn)一個(gè)標(biāo)題。
當(dāng)光盤(pán)載入后,光盤(pán)再現(xiàn)裝置讀取并存儲(chǔ)用于再現(xiàn)和管理信息的再現(xiàn)的文 件信息。當(dāng)用戶(hù)請(qǐng)求再現(xiàn)光盤(pán)中記錄的一個(gè)標(biāo)題時(shí),光盤(pán)再現(xiàn)裝置再現(xiàn)與該標(biāo)
題相關(guān)的播放列表。例如,如果再現(xiàn)了如圖4所示的播放列表,該光盤(pán)再現(xiàn)裝 置通過(guò)使用視頻和音頻解碼單元10和20再現(xiàn)由播放項(xiàng)目管理的主AV數(shù)據(jù)。 由子播放項(xiàng)目管理的文本字幕流存儲(chǔ)在預(yù)載緩沖器41中,且根據(jù)文本字幕流 所指定的字體信息,將字體文件從光盤(pán)中提取出來(lái)。已提取的字體文件存儲(chǔ)在 字體預(yù)載緩沖器410中。例如,如果用戶(hù)從由子播放項(xiàng)目管理的文本字幕流中 選擇韓語(yǔ)字幕,"文本字幕剪輯2"存儲(chǔ)在預(yù)載緩沖器41中。同時(shí),根據(jù)"文 本字幕剪輯2"的剪輯信息中指定的字體信息提取字體文件aaaaa.font,且把 aaaaafont存儲(chǔ)于字體預(yù)載緩沖器410中。在提取并存儲(chǔ)相應(yīng)文本字幕流后,文 本字幕解碼單元40解碼文本字幕流用于產(chǎn)生字幕圖形平面,并將此字幕圖形 平面?zhèn)魉偷交旌蠁卧?0,用于和由處理播放項(xiàng)目管理的主視頻數(shù)據(jù)而產(chǎn)生的視 頻圖像幀一起顯示該字幕。
文本字幕流的解碼分為三步。第一步,根據(jù)目的將文本字幕流拆分。艮口, 從文本字幕流中拆分出合成信息、渲染信息和對(duì)話文本信息。拆分?jǐn)?shù)據(jù)的動(dòng)作
通常稱(chēng)為解析。
第二步,通過(guò)使用渲染信息將對(duì)話文本信息中包含的文本數(shù)據(jù)渲染為位圖 數(shù)據(jù)。這叫做渲染。
第三步,基于合成信息將渲染的文本數(shù)據(jù)加入圖形平面。即,位圖數(shù)據(jù)加 入圖形平面,用于再現(xiàn)文本字幕。這叫做合成。
為了執(zhí)行解析步驟,文本字幕解碼器42包括了文本字幕(TXT—ST)處理器 421,文本字幕處理器421在對(duì)話合成緩沖器(DCB) 425中存儲(chǔ)拆分了的合成信 息和渲染信息,以及在對(duì)話緩沖器(DB) 422中存儲(chǔ)拆分了的對(duì)話文本信息。
為了執(zhí)行渲染步驟,文本字幕解碼器42包括了文本渲染器423和對(duì)話顯 像控制器(DP) 426。如前面所討論的,在這一步,拆分了的對(duì)話文本信息中的
文本數(shù)據(jù)被渲染為位圖數(shù)據(jù)。文本渲染器423從字體預(yù)載緩沖器410中接收用 于文本數(shù)據(jù)的字體信息,以及從DP控制器426中接收用于文本數(shù)據(jù)的渲染信 息。然后,文本渲染器423通過(guò)使用用于文本數(shù)據(jù)的每個(gè)文本串的內(nèi)聯(lián)樣式信 息將文本數(shù)據(jù)渲染為位圖數(shù)據(jù)。渲染后,位圖數(shù)據(jù)存儲(chǔ)于位圖對(duì)象緩沖器(BOB) 424中。
存儲(chǔ)在BOB 426中的"對(duì)象"是已被轉(zhuǎn)換成位圖的對(duì)話中的每個(gè)區(qū)域的文 本數(shù)據(jù)。
又,渲染步驟可以用至少兩種方法執(zhí)行。作為第一種方法,文本數(shù)據(jù)可在 確認(rèn)原點(diǎn)后渲染,原點(diǎn)就是根據(jù)圖IOA到14G所示的用于確定文本數(shù)據(jù)在區(qū)域 中的位置的第一、第二和第三實(shí)施例之一要顯示文本數(shù)據(jù)的位置。作為第二種 方法,文本數(shù)據(jù)首先被渲染,然后渲染的文本數(shù)據(jù)相對(duì)于根據(jù)圖IOA到14G所 示的第一、第二和第三實(shí)施例之一的區(qū)域的原點(diǎn)排列。
對(duì)于合成步驟,包括DP控制器426的文本字幕解碼器42根據(jù)合成信息, 將BOB 424中存儲(chǔ)的位圖對(duì)象排列在圖形平面43中。合成信息中的調(diào)色板信 息輸入CLUT 44中并用于控制顏色和透明度的改變。接著,產(chǎn)生的字幕圖形平 面被傳送到圖16中的混合單元50,用于將字幕圖形平面和視頻平面混合產(chǎn)生 帶有字幕的視頻圖像幀。
如前所述,用戶(hù)可以在渲染步驟和合成步驟中改變樣式信息。在此情況, DP控制器426接收用戶(hù)輸入并根據(jù)用戶(hù)輸入執(zhí)行渲染和合成。然而,最好限制 要由用戶(hù)改變的樣式信息,因?yàn)槿绻?用戶(hù)改變了所有的樣式信息,文本字幕可 能不能正確再現(xiàn)。sp,要由用戶(hù)改變的樣式信息可限于區(qū)域位置和字體尺寸。
圖18示出了根據(jù)本發(fā)明的一個(gè)示例性實(shí)施例,通過(guò)解析步驟、渲染步驟 和合成步驟解碼文本字幕的視圖。
艮卩,渲染步驟是通過(guò)使用解析步驟中拆分出的渲染信息和對(duì)話文本信息來(lái) 執(zhí)行的,而執(zhí)行合成步驟用于通過(guò)使用解析步驟中拆分出的合成信息來(lái)排列由 渲染步驟產(chǎn)生的位圖對(duì)象。
如上所述,文本字幕流文件依據(jù)在本發(fā)明的高密度光盤(pán)中構(gòu)建文本字幕流 文件的方法,以標(biāo)準(zhǔn)化信息的方式記錄在光盤(pán)中。又,記錄在光盤(pán)中的文本字 幕根據(jù)本發(fā)明再現(xiàn)文本字幕的方法和裝置有效地被再現(xiàn)。
雖然本發(fā)明通過(guò)有限數(shù)量的實(shí)施例來(lái)揭示,本領(lǐng)域技術(shù)人員,得益于此揭 示,將理解大量的以此為基礎(chǔ)的改變和變化。例如,當(dāng)在若干情況下,考慮藍(lán)
光ROM光盤(pán)進(jìn)行描述,本發(fā)明不限于此標(biāo)準(zhǔn)光盤(pán)或光盤(pán)。所有這些改變和變化
都落入本發(fā)明的精神和范圍中。
權(quán)利要求
1、一種再現(xiàn)文本字幕流的方法,所述方法包括從外部源接收至少一個(gè)文本字幕流,每一個(gè)文本字幕流包括樣式片段以及至少一個(gè)和樣式片段關(guān)聯(lián)的顯像片段,所述樣式片段包括至少一組樣式信息,每組樣式信息提供了用于在圖像中定位區(qū)域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息,以及所述顯像片段包括至少一個(gè)區(qū)域字幕信息,所述區(qū)域字幕信息包括文本字幕數(shù)據(jù)及區(qū)域樣式標(biāo)識(shí)符,所述區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)樣式信息片段中的樣式信息組之一以應(yīng)用于文本字幕數(shù)據(jù),用包含區(qū)域定位信息和文本框定位信息的樣式信息解碼文本字幕流。
2、 如權(quán)利要求1所述方法,其特征在于,所述區(qū)域定位信息包含圖像中 區(qū)域的左上角的水平位置和垂直位置。
3、 如權(quán)利要求2中的所述方法,其特征在于,所述區(qū)域定位信息提供圖像中的區(qū)域的左上角的水平位置和垂直位置;每一組樣式信息進(jìn)一步包括指出區(qū)域的高度和區(qū)域的寬度的區(qū)域尺寸信息,且每一組樣式信息進(jìn)一步包括區(qū)域背景色指示符。
4、 如權(quán)利要求l所述方法,其特征在于,所述文本框定位信息包括圖像中 文本框的左上角的位置。
5、 如權(quán)利要求4所述方法,其特征在于,所述文本框定位信息提供圖像 中的文本框的左上角的水平位置和垂直位置;以及每一組樣式信息進(jìn)一步包括指出文本框的高度和文本框的寬度的文本框尺寸 信息,指出文本框中使用的文本字幕數(shù)據(jù)的字符行進(jìn)的文本滾動(dòng)信息,指出如何 在文本框中排列文本字幕數(shù)據(jù)的文本排列信息,指出文本框中文本字幕數(shù)據(jù)行 之間使用的間距的行間距信息,標(biāo)識(shí)記錄在記錄介質(zhì)上用于在文本框中再現(xiàn)文 本字幕數(shù)據(jù)的字體文件的字體標(biāo)識(shí)符,指出用于文本框中的文本字幕數(shù)據(jù)的字 體樣式的字體樣式指示符,指出用于文本框中的文本字幕數(shù)據(jù)的字體尺寸的字 體尺寸信息,指出用于文本框中的文本字幕數(shù)據(jù)的顏色的字體顏色信息。
6、 如權(quán)利要求l所述方法,其特征在于,每組樣式信息進(jìn)一步包括用戶(hù)可 變信息,所述用戶(hù)可變信息指出用戶(hù)可移動(dòng)區(qū)域的水平方向、用戶(hù)可移動(dòng)區(qū)域的垂 直方向、用戶(hù)是否可增加或減小字體尺寸、用戶(hù)可移動(dòng)文本框的水平方向、用戶(hù)可 移動(dòng)文本框的垂直方向、用戶(hù)是否是增加或減小文本框高度、用戶(hù)是否可增加或減 小文本框?qū)挾?、以及用?hù)是否可增加或減小文本框中文本字幕數(shù)據(jù)行之間使用的間 距。
7、 一種記錄文本字幕流的方法,所述方法包括從外部源接收至少一個(gè)文本字幕流,每一個(gè)文本字幕流包括樣式片段以及 至少一個(gè)和樣式片段關(guān)聯(lián)的顯像片段,所述樣式片段包括至少一組樣式信息,每組樣式信息提供了用于在圖像中 定位區(qū)域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息,以 及所述顯像片段包括至少一個(gè)區(qū)域字幕信息,所述區(qū)域字幕信息包括文本字 幕數(shù)據(jù)及區(qū)域樣式標(biāo)識(shí)符,所述區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)樣式信息片段中的樣式信 息組之一以應(yīng)用于文本字幕數(shù)據(jù),將接收到的文本字幕流記錄在記錄介質(zhì)上。
8、 一種再現(xiàn)文本字幕流的方法,所述方法包括從外部源或記錄介質(zhì)選擇至少一個(gè)文本字幕流,每一個(gè)文本字幕流包括樣 式片段以及至少一個(gè)和樣式片段關(guān)聯(lián)的顯像片段,所述樣式片段包括至少一組樣式信息,每組樣式信息提供了用于在圖像中 定位區(qū)域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息,以 及所述顯像片段包括至少一個(gè)區(qū)域字幕信息,所述區(qū)域字幕信息包括文本字 幕數(shù)據(jù)及區(qū)域樣式標(biāo)識(shí)符,所述區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)樣式信息片段中的樣式信 息組之一以應(yīng)用于文本字幕數(shù)據(jù),用包含區(qū)域定位信息和文本框定位信息的樣式信息解碼文本字幕流。
9、 一種用于再現(xiàn)文本字幕流的裝置,所述裝置包括解碼器,用于從外部源解碼文本字幕流,所述文本字幕流包括樣式片段以 及至少一個(gè)和樣式片段關(guān)聯(lián)的顯像片段,所述樣式片段包括至少一組樣式信息,每組樣式信息提供了用于在圖像中 定位區(qū)域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息,以 及所述顯像片段包括至少一個(gè)區(qū)域字幕信息,所述區(qū)域字幕信息包括文本字 幕數(shù)據(jù)及區(qū)域樣式標(biāo)識(shí)符,所述區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)樣式信息片段中的樣式信 息組之一以應(yīng)用于文本字幕數(shù)據(jù),控制器,配置用于控制所述解碼器從接收器接收文本字幕流,并用區(qū)域定 位信息和文本框定位信息解碼文本字幕流。
全文摘要
示例性記錄介質(zhì)的記錄區(qū)存儲(chǔ)文本字幕流,其中包括對(duì)話樣式片段以及至少一個(gè)和對(duì)話類(lèi)型片段關(guān)聯(lián)的對(duì)話顯像片段。對(duì)話樣式片段包括至少一組樣式信息。每組樣式信息提供了用于在圖像中定位區(qū)域的區(qū)域定位信息以及用于在區(qū)域中定位文本框的文本框定位信息。對(duì)話顯像片段包括至少一個(gè)區(qū)域字幕信息。區(qū)域字幕信息包括文本字幕數(shù)據(jù)(例如,樣式數(shù)據(jù)和/或文本串?dāng)?shù)據(jù))及區(qū)域樣式標(biāo)識(shí)符,且區(qū)域樣式標(biāo)識(shí)符標(biāo)識(shí)對(duì)話樣式片段中的樣式信息組之一,以應(yīng)用于文本字幕數(shù)據(jù)。
文檔編號(hào)H04N9/804GK101114498SQ200710142720
公開(kāi)日2008年1月30日 申請(qǐng)日期2005年5月2日 優(yōu)先權(quán)日2004年5月3日
發(fā)明者劉齊鏞, 徐康洙, 金柄辰 申請(qǐng)人:Lg電子株式會(huì)社