專利名稱:包含字幕的信息存儲介質(zhì)及其處理設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息存儲介質(zhì),更具體地講,涉及一種包含可被分開顯 示的多個字幕的信息存儲介質(zhì)及其處理設(shè)備。
背景技術(shù):
傳統(tǒng)的字幕是包括在音視頻(AV)流中的位像。因此,不方便制作這 類字幕,并且由于用戶不能夠選擇由字幕制作者定義的字幕的各種屬性,所 以沒有選擇只能不作修改以字幕目前的形式來讀取該字幕。即,由于諸如字 體、字符大小和字符顏色的屬性被預(yù)定義并作為位像被包括在AV流中, 所以用戶不能夠隨意改變所述屬性。
另外,由于在AV流中字幕被壓縮并被編碼,所以字幕的輸出開始時間 和輸出結(jié)束時間被清楚地指定以與AV流相應(yīng),并且輸出字幕的再現(xiàn)時間不 應(yīng)該重疊。即,在特定時間應(yīng)該僅輸出一種字幕。
然而,由于字幕的輸出開始時間和輸出結(jié)束時間由字幕制作者指定并與 AV流分開記錄在信息存儲介質(zhì)上,所以多個字幕的輸出開始時間和輸出結(jié)束 時間可能互相重疊。換句話講,由于在特定時間段內(nèi)可能輸出多于兩種的字 幕,所以解決這個問題的方法是必要的。
發(fā)明內(nèi)容
技術(shù)方案
在本發(fā)明的一方面中,本發(fā)明提供了一種將盡管互相重疊但分開顯示的 多個文本字幕記錄在其上的信息存儲介質(zhì),以及一種再現(xiàn)該信息存儲介質(zhì)的 設(shè)備。
有益的效果
根據(jù)本發(fā)明的實施例,可容易地制作字幕文件,并能夠以多種形式輸出
用于AV流的字幕。
圖1示出文本字幕文件的結(jié)構(gòu);
圖2是再現(xiàn)其上記錄有文本字幕的信息存儲介質(zhì)的設(shè)備的方框圖3是圖2的文本字幕處理單元的詳細(xì)方框圖4是示出不利用表現(xiàn)引擎而產(chǎn)生位圖的參考方框圖5是示出組成信息、位置信息、對象信息和顏色信息記錄在其中的結(jié) 構(gòu)之間的相互關(guān)系的示圖6A至6C是示出通過使用 一個組成信息數(shù)據(jù)和一個位置信息數(shù)據(jù)產(chǎn)生
用于多個字幕的圖像的過程的示圖7A至7C是示出通過使用 一個組成信息數(shù)據(jù)和多個位置信息數(shù)據(jù)產(chǎn)生
用于多個字幕的圖像的過程的示圖;和
圖8A至8C是示出通過以下方式產(chǎn)生圖像的過程的示圖,即通過對多個 字幕分配多個組成信息數(shù)據(jù)來將一個圖4象對象包括在一個組成信息數(shù)據(jù)中;
最佳方式
根據(jù)本發(fā)明的一方面,提供了一種信息存儲介質(zhì),該信息存儲介質(zhì)包括 AV數(shù)據(jù);和字幕數(shù)據(jù),在該字幕數(shù)據(jù)中以文本格式存儲至少一個字幕文本數(shù) 據(jù)或用于指定字幕文本的輸出形式的輸出樣式信息。
在本發(fā)明的一方面,輸出樣式信息包含多條信息,以便輸出樣式信息被 不同地應(yīng)用于字幕文本。
在本發(fā)明的一方面,當(dāng)存在多個字幕數(shù)據(jù)時,所述多個字幕數(shù)據(jù)被分開 渲染,渲染的圖像分別包括多個頁。
根據(jù)本發(fā)明的另一方面,提供了一種文本字幕處理設(shè)備,該文本字幕處 理設(shè)備包括文本字幕解析器,分別從文本字幕數(shù)據(jù)提取用于渲染文本字幕 數(shù)據(jù)中的文本的渲染信息和用于表現(xiàn)渲染的文本的控制信息;和文本布局/字 體渲染器,通過根據(jù)提取的渲染信息渲染字幕文本來產(chǎn)生字幕文本的位像。
在本發(fā)明的一方面,文本布局/字體渲染器通過將不同樣式應(yīng)用于字幕文 本數(shù)據(jù)來渲染至少 一個字幕文本數(shù)據(jù),并組成具有多個渲染的圖像的多頁。
具體實施例方式
現(xiàn)在將詳細(xì)描述本發(fā)明的實施例,其示例將在附圖中示出,其中,相同 的標(biāo)號始終表示相同的部件。以下將參照附圖來描述所述實施例以解釋本發(fā) 明。
圖1示出文本字幕文件100的結(jié)構(gòu)。參照圖1,文本字幕文件100包括 對話信息110、表現(xiàn)信息120和元數(shù)據(jù)130a和130b。
對話信息110包括字幕文本、字幕文本的輸出開始時間、字幕文本的輸 出結(jié)束時間、用于渲染字幕文本的樣式組或樣式信息、諸如淡入和淡出的文 本改變效果信息、和字幕文本的格式代碼。格式代碼包括一個或多個用粗體 字符顯示文本的代碼、用斜體顯示文本的代碼、指示下劃線的代碼或指示換 行的代碼。
表現(xiàn)信息120包括用于渲染字幕文本的樣式信息,并包括多個樣式組。 樣式組是一簇樣式,在其上記錄樣式信息。所述樣式包括用于渲染和顯示字 幕文本的信息。該信息包括,例如, 一個或多個樣式名、字體、文本顏色、 背景顏色、文本大小、行高、文本輸出區(qū)域、文本輸出開始位置、輸出方向 或?qū)R方法。
作為運動畫面的附加信息的元數(shù)據(jù)130a和130b包括用于執(zhí)行除了字幕 輸出功能之外的附加功能所需的信息。例如,所述附加功能可以是對于針對 成年觀眾的節(jié)目在屏幕上顯示諸如'TV-MA,的TV家長指導(dǎo)。
圖2是再現(xiàn)信息存儲介質(zhì)的設(shè)備的方框圖,在該信息存儲介質(zhì)上記錄文 本字幕文件。應(yīng)該理解,該設(shè)備還可將文本字幕文件記錄到該信息存儲介質(zhì)。
參照圖2,文本字幕處理單元220渲染字幕文本以處理文本字幕文件。 文本字幕處理單元220包括文本字幕解析器221,從文本字幕文件提取表 現(xiàn)信息和對話信息;和文本布局/字體渲染器222,根據(jù)提取的表現(xiàn)信息渲染 字幕文本來產(chǎn)生輸出圖像。
圖1中示出的文本字幕文件IOO可被記錄在再現(xiàn)設(shè)備包括的存儲器中或 信息存儲介質(zhì)上。在圖2中,其上記錄有文本字幕的信息存儲介質(zhì)或存儲器被稱為字幕信息存儲單元200。
從字幕信息存儲單元200讀取與正在再現(xiàn)的運動畫面相對應(yīng)的文本字幕 文件以及用于渲染所述字幕的字體數(shù)據(jù),并將其存儲在緩沖器210中。將緩 沖器210中存儲的文本字幕文件發(fā)送到文本字幕解析器221,該文本字幕解 析器221對渲染文本字幕文件所需的信息進(jìn)行解析。將字幕文本、字體信息 和渲染樣式信息發(fā)送到文本布局/字體渲染器222,將字幕文本的控制信息發(fā) 送到表現(xiàn)引擎230的組成緩沖器(composition buffer)233??刂菩畔?即,用于 顯示具有字幕文本的屏幕的信息)包括輸出區(qū)域和輸出開始位置。
文本布局/字體渲染器222通過使用從文本字幕解析器221發(fā)送的文本渲 染信息和從緩沖器210發(fā)送的字體數(shù)據(jù)渲染字幕文本來產(chǎn)生位像,通過 指定每個字幕文本的輸出開始時間和輸出結(jié)束時間來組成一個字幕頁,并將 位像和字幕頁發(fā)送到表現(xiàn)引擎230的對象緩沖器234。
從字幕信息存儲單元200讀取的位像形式的字幕被輸入到編碼的數(shù) 據(jù)緩沖器231,并由表現(xiàn)引擎230中的圖形處理單元232來處理。因此,圖 形處理單元232產(chǎn)生位像。將產(chǎn)生的位像發(fā)送到對象緩沖器234, 將該位像的控制信息發(fā)送到組成緩沖器233??刂菩畔⒂糜谥付▽ο缶?沖器234中存儲的位像被輸出到圖形面板器(graphic planer)240的時間和 位置,并用于指定顏色查找表(CLUT)250,在該顏色查找表250中記錄將被 應(yīng)用于輸出到圖形面板器240的位像的顏色信息。組成緩沖器233接收 從文本字幕解析器221發(fā)送的對象組成信息和由圖形處理單元232處理的位 圖字幕數(shù)據(jù),并將用于將字幕輸出到屏幕上的控制信息發(fā)送到圖形控制器 235。圖形控制器235控制對象緩沖器234以將由圖形處理單元232處理的位 圖字幕數(shù)據(jù)和從文本布局/字體渲染器222接收的渲染的文本對象數(shù)據(jù)組合, 并控制圖形面板器240根據(jù)組合的數(shù)據(jù)產(chǎn)生圖形面板,圖形控制器235參照 CLUT 250將該圖形面板輸出到顯示單元(未示出)。
圖3是圖2的文本字幕處理單元220的詳細(xì)方框圖。參照圖3,將作為 文本字幕文件信息的字幕輸入到文本字幕解析器221。文本字幕解析器221 將從字幕解析的字幕控制信息發(fā)送到表現(xiàn)引擎230,并將從字幕解析的文本 渲染信息發(fā)送到文本布局/字體渲染器222。文本布局/字體渲染器222從文本 字幕解析器221接收文本渲染信息,將字幕文本的控制信息存儲在元素控制 數(shù)據(jù)緩沖器2卯中,將字幕文本數(shù)據(jù)存儲在文本數(shù)據(jù)緩沖器291中,將用于
渲染字幕文本數(shù)據(jù)的樣式信息存儲在樣式數(shù)據(jù)緩沖器292中。另外,文本布 局/字體渲染器222將用于文本渲染的字體數(shù)據(jù)存儲在字幕數(shù)據(jù)緩沖器293 中。
元素控制數(shù)據(jù)緩沖器290中存儲的控制信息可以是格式代碼。格式代碼 包括一個或多個用粗體字符顯示文本的代碼、用斜體顯示文本的代碼、指示 下劃線的代碼或指示換行的代碼。文本數(shù)據(jù)緩沖器291中存儲的字幕文本數(shù) 據(jù)是將被輸出為字幕的文本數(shù)據(jù)。樣式數(shù)據(jù)緩沖器292中存儲的樣式數(shù)據(jù)可 以是一個或多個數(shù)據(jù),例如字體、文本顏色、背景顏色、文本大小、行高、 文本輸出區(qū)域、文本輸出開始位置、輸出方向或?qū)R方法。文本渲染器294 參照記錄在每個緩沖器中的信息產(chǎn)生字幕圖像,并將該字幕圖像發(fā)送到表現(xiàn) 引擎230。
圖4是示出不利用表現(xiàn)引擎230而產(chǎn)生位像的參考方框圖。
即,圖4示出包括文本字幕控制器410而不是表現(xiàn)引擎230的文本字幕 處理單元220的操作的另 一 實施例。
參照圖4,文本布局/字體渲染器222產(chǎn)生組成信息、位置信息、對象信 息和顏色信息,并在組成信息、位置信息、對象信息和顏色信息的基礎(chǔ)上產(chǎn) 生位像。文本字幕控制器410從文本字幕解析器221接收對象組成信息, 并控制文本布局/字體渲染器222將由文本布局/字體渲染器222產(chǎn)生的位 像直接輸出到圖形面板器240和CLUT 250。
圖5是示出其中記錄有組成信息、位置信息、對象信息和顏色信息的結(jié) 構(gòu)之間的相互關(guān)系的示圖。
被輸出到屏幕上的字幕由多個頁單元組成。每頁還可包括用于除字幕之 外的其他目的的數(shù)據(jù)。組成信息表示包含用于組成一頁的信息的信息。組成 信息包括指示頁輸出時間的輸出時間信息、指示輸出圖像對象的對象信息參 考值、指示對象輸出位置的位置信息參考值和指示對象顏色信息的顏色信息 參考值。
圖5中顯示的信息結(jié)構(gòu)之間的相互關(guān)系是組成信息的一部分,并且還可 以以與圖5不同的形式來組成位置信息、對象信息和顏色信息之間的相互關(guān) 系。
參照圖5, 一頁可包括用于將圖像輸出到屏幕上的至少一個區(qū)域。該至 少一個區(qū)域才艮據(jù)位置信息參考值來分類。位置信息表示記錄的組成所述至少一個區(qū)域以輸出圖像所需的信息的結(jié)構(gòu)。位置信息包括每個區(qū)域的水平和垂 直坐標(biāo)、區(qū)域的寬度和區(qū)域的高度的信息。對象信息包括將被顯示在屏幕上 的對象數(shù)據(jù)。另外,對象信息包括與對象數(shù)據(jù)相應(yīng)的對象數(shù)據(jù)類型信息。
將作為示例來描述文本字幕處理單元220的操作。文本字幕處理單元220 產(chǎn)生將被輸出到屏幕上的每個渲染的字幕圖像的組成信息、位置信息、對象 信息和顏色信息以提供字幕文本。將產(chǎn)生的組成信息、位置信息、對象信息 和顏色信息發(fā)送到表現(xiàn)引擎230。
如上所述,當(dāng)包含以文本形式產(chǎn)生的字幕的信息存儲介質(zhì)被再現(xiàn)時,存 在同時輸出多于一個字幕的多種示例性方法。
在第 一種方法中,文本字幕處理單元220產(chǎn)生用于文本輸出時間重疊的 多個字幕的新的圖像,并將由對象組成的字幕發(fā)送到表現(xiàn)引擎230,其中, 產(chǎn)生的對象將被輸出到 一個組成信息中的 一個位置信息。
存在組成字幕的第二種方法以便文本輸出時間重疊的字幕具有不同的位 置信息。即,文本字幕處理單元220通過^f吏用一個組成信息中的不同的位置 信息來產(chǎn)生文本輸出時間重疊的多個字幕的圖像,并將產(chǎn)生的圖像發(fā)送到表 現(xiàn)引擎230。
存在通過使用不同的組成信息來產(chǎn)生文本輸出時間重疊的字幕的第三種 方法。即,文本字幕處理單元220對文本輸出時間重疊的多個字幕產(chǎn)生不同 的組成信息,以便僅一個對象被包括在一個組成信息數(shù)據(jù)中。
將參照圖6A至8C來詳細(xì)描述這三種方法。
圖6A至6C是示出通過使用 一個組成信息數(shù)據(jù)和一個位置信息數(shù)據(jù)來為
多個字幕產(chǎn)生圖像的過程示圖。
在圖6A中,樣式'Script,被定義為用于字幕文本渲染的樣式信息。參照 圖6A,樣式'Script,使用字體'Arial.ttf,、文本顏色'black,、背景顏色'white,、 字符大小'16pt,、文本參考位置的坐標(biāo)(x,y),對齊方法'center'、輸出方向 'left-to-right-top-to-bottom,、 文本輸出區(qū)i或'left, top, width, height'和行高 '40px,。
在圖6B中,定義通過使用樣式'Script,渲染的字幕文本610、 620和630。 參照圖6B,從'00:10:00,到'00:15:00,輸出字幕文本Hello 610,從'00:12:00,到 '00:17:00,輸出字幕文本Subtitle 620,從'00:14:00,到'00:19:00,輸出字幕文本 World 630。因此,在'00:12:00,和'00:17:00,之間輸出兩個或三個字幕文本。這
里,'〈br/〉,指示換行。盡管使用一個樣式,可通過使用〈br/〉來防止多個字幕 在一個區(qū)域上重疊。
圖6C顯示輸出在圖6A和6B中定義的字幕的結(jié)果。參照圖6C,將詳細(xì) 地描述在每個示出的時間窗口中文本字幕處理單元220的每個緩沖器中存儲 的數(shù)據(jù)。
在'00:10:00,之前當(dāng)輸出的組成信息包括空字幕圖像時,文本布局/字體 渲染器222包括
元素控制數(shù)據(jù)緩沖器空;
文本數(shù)據(jù)緩沖器空;
樣式數(shù)據(jù)緩沖器
樣式信息'Script';和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf'。
從'00:10:00,到'00:12:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 610的圖4象時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器
字幕文本Hello 610的控制信息;
文本數(shù)據(jù)緩沖器'Hello';
樣式數(shù)據(jù)緩沖器樣式信息'Script';和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf'。
從'00:12:00,到'00:14:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 610和字幕文本Subtitle 620的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello 610和字幕文本Subtitle 620的控 制信息;
文本數(shù)據(jù)緩沖器'Hello'和'<br/>Subtitle';
樣式數(shù)據(jù)緩沖器樣式信息'Script';和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf'。
從'00:14:00,到'00:15:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 610、字幕文本Subtitle 620和字幕文本W(wǎng)orld 630的圖像時,文本布局/ 字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello 610、
字幕文本Subtitle 620和
字幕 文本W(wǎng)orld 630的控制信息;
文本數(shù)據(jù)緩沖器'Hello'、 '〈br/〉Subtitle,和'〈br/xbr/〉World,;
樣式數(shù)據(jù)緩沖器樣式信息'Script';和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
,人'00:15:00,到'00:17:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Subtitle 620和字幕文本W(wǎng)orld 630的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Subtitle 620和字幕文本W(wǎng)orld 630的控 制信息;
文本數(shù)據(jù)緩沖器'〈br/〉Subtitle,和'〈br/xbr/〉World,; 樣式數(shù)據(jù)緩沖器樣式信息'Script,;和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:17:00,到'00:19:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 World 630的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本W(wǎng)orld 630的控制信息; 文本數(shù)據(jù)緩沖器'<br/><br/>World,; 樣式數(shù)據(jù)緩沖器樣式信息'Script';和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
在'00:19:00,之后當(dāng)輸出的組成信息包括空字幕圖像時,文本布局/字體 渲染器222包括
元素控制數(shù)據(jù)緩沖器空; 文本數(shù)據(jù)緩沖器空;
樣式數(shù)據(jù)緩沖器樣式信息'Script';和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
如上所示的字幕輸出過程,在第一種方法中,通過將相同樣式應(yīng)用到具 有重疊輸出時間的多個字幕文本來產(chǎn)生一個字幕圖像,產(chǎn)生包括所述一個字 幕圖像的一個組成信息數(shù)據(jù),并將產(chǎn)生的組成信息數(shù)據(jù)發(fā)送到表現(xiàn)引擎230。 此時,用于指示發(fā)送的組成信息從屏幕消失的時間的page—time—out表示在具 有重疊的輸出時間的多個字幕中最后輸出到屏幕的字幕的消失時間,或者添 加新的字幕的時間。
考慮到在文本字幕處理單元220中對字幕執(zhí)行解碼所花費的時間Tdee。ding 和將渲染的字幕從對象緩沖器234輸出到圖形面板器240所花費的時間 Tc。mp。siti。n,必須快速執(zhí)行對輸出字幕的文本字幕處理。當(dāng)Tstart指示從再現(xiàn)設(shè) 備的文本字幕處理單元220輸出字幕的時間時,以及當(dāng)Tamval指示字幕到達(dá)文 本字幕處理單元220的時間時,將通過方程1來計算這些時間之間的關(guān)系。
方程l
<formula>complex formula see original document page 13</formula>
參照方程l,可知道必須多快0處理文本字幕。這里,Tdee。d呵指示渲染 將被輸出的字幕、產(chǎn)生包括渲染的對象的組成信息、并將產(chǎn)生的組成信息發(fā) 送到對象緩沖器234所花費的時間。需要輸出時間Tstw的字幕必須至少在通 過將Tdec。ding和Tc。呵。sit咖相加獲得的時間之前開始被處理。通過將TrendermJ。 Tcomposition information generation
相加來獲得時間Tdec。ding,其中,T咖dering是渲染字幕文 本和將渲染的字幕文本發(fā)送到對象緩沖器234所花費的時間, Tc。mp。sltl。n infomati。n generati。n是產(chǎn)生包括渲染的對象的組成信息并將該組成信息發(fā)
送到圖形面板器240所花費的時間。時間TchM是渲染一個字符所花費的時間。 因此,通過將渲染所有字符所花費的時間相加來獲得Trendenng。
對象緩沖器234的大小必須等于或者大于對象的大小。這里,通過將對 象的每個字符數(shù)據(jù)的大小相加來獲得對象的大小。因此,組成一個字幕的字 符的個數(shù)限于可存儲在對象緩沖器234中的字符的個數(shù)。另外,由于對象緩 沖器234可存儲多個字幕,所以組成多個字幕的字符的個數(shù)也限于可存儲在 對象緩沖器234中的字符的個數(shù)。
圖7A至7C是示出通過使用 一個組成信息數(shù)據(jù)和多個位置信息數(shù)據(jù)來為 多個字幕產(chǎn)生圖像的過程的示圖。
在圖7A中,樣式'Scriptl'、 'Script2,和'Script3,被定義為用于字幕文本 渲染的樣式信息。參照圖7A,三個樣式的每一個都使用字體'Arial.ttf,、文本 顏色'black,、背景顏色'white,、字符大小'16pt,、對齊方法'center'、輸出方向 'left-to-right-top-to-bottom,和行高'40px,。作為字幕文本參考位置,'Scriptl , 具有坐標(biāo)(xl,yl), 'Script2,具有坐標(biāo)(x2,y2), 'Script3,具有坐標(biāo)(x3, y3)。作為 文本輸出區(qū)域,'Scriptl,具有'leftl, topl, widthl, heightl', 'Script2,具有'left2, top2, width2, height2,, 'Script3,具有'left3, top3, width3, height3,。
在圖7B中,定義了通過使用樣式'Scriptl'、 'Script2,和'Script3,渲染的 字幕文本710、 720和730。參照圖7B,字幕文本Hello 710使用樣式'Scriptl,, 并從'00:10:00,到'00:15:00,輸出,字幕文本Subtitle 720使用樣式'Script2,,并從'00:12:00,到'00:17:00,輸出,字幕文本W(wǎng)orld 730使用樣式'Script3,,并從 '00:14:00,到'00:19:00,輸出。因此,在'00:12:00,和'00:17:00,之間輸出了兩個 或三個字幕文本。由于使用了不同的腳本(script),所以換行標(biāo)簽〈br/〉是不必 要的。
圖7C顯示輸出在圖7A和7B中定義的字幕的結(jié)果。參照圖7C,將詳細(xì) 描述每個示出的時間窗口中文本字幕處理單元220的每個緩沖器中存儲的數(shù) 據(jù)。
在'00:10:00,之前當(dāng)輸出的組成信息包括空字幕圖像時,文本布局/字體 渲染器222包括
元素控制數(shù)據(jù)緩沖器空;
文本數(shù)據(jù)緩沖器空;
樣式數(shù)據(jù)緩沖器空;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:10:00,到'00:12:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 710的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello710的控制信息;
文本數(shù)據(jù)緩沖器'Hello';
樣式數(shù)據(jù)緩沖器樣式信息'Scriptl';和
字體數(shù)據(jù)緩沖器
字體信息'Arial.ttf'。
從'00:12:00,到'00:14:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 710和字幕文本Subtitle 720的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello 710和字幕文本Subtitle 720的控 制信息;
文本數(shù)據(jù)緩沖器'Hello,和'Subtitle,;
樣式數(shù)據(jù)緩沖器樣式信息'Scriptl'和'Script2';和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf'。
從'00:14:00,到'00:15:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Hello 710、字幕文本Subtitle 720和字幕文本W(wǎng)orld 730的圖像時,文本布局/ 字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello 710、字幕文本Subtitle 720和字幕 文本W(wǎng)orld 730的控制信息;
文本數(shù)據(jù)緩沖器'Hello'、 'Subtitle,和'World,;
樣式數(shù)據(jù)緩沖器樣式信息'Scriptl, 、 'Script2,和'Script3,;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:15:00,到'00:17:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 Subtitle 720和字幕文本W(wǎng)orld 730的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Subtitle 720和字幕文本W(wǎng)orld 730的控 制信息;
文本數(shù)據(jù)緩沖器'Subtitle'和'World'; 樣式數(shù)據(jù)緩沖器樣式信息'Script2,和'Script3,;和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:17:00,到'00:19:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本 World 730的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本W(wǎng)orld730的控制信息; 文本數(shù)據(jù)緩沖器'World'; 樣式數(shù)據(jù)緩沖器樣式信息'Script3';和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
在'00:19:00,之后當(dāng)輸出的組成信息包括空字幕圖像時,文本布局/字體 渲染器222包括
元素控制數(shù)據(jù)緩沖器空; 文本數(shù)據(jù)緩沖器空; 樣式lt據(jù)緩沖器空;和 字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
在上述第二種方法中,通過將不同的樣式應(yīng)用到具有重疊輸出時間的多 個字幕文本來為字幕文本產(chǎn)生字幕圖像,產(chǎn)生包括所述字幕圖像的一個組成 信息數(shù)據(jù),并將產(chǎn)生的組成信息數(shù)據(jù)發(fā)送到表現(xiàn)引擎230。文本字幕處理時 間與第一種方法的文本字幕處理時間相同。即,考慮到在文本字幕處理單元
220中對字幕執(zhí)行解碼所花費的時間Tdec。dmg和將渲染的字幕從對象緩沖器
234輸出到圖形面板器240所花費的時間Te。mp。sltl。n,必須快速執(zhí)行對輸出字 幕的文本字幕處理。然而,在該方法中,由于存在多個對象,所以通過將渲 染各對象所花費的時間相加來獲得渲染時間。即,方程2計算渲染時間。
方程2
<formula>complex formula see original document page 16</formula>
在第二種方法中可存儲到對象緩沖器234中的字幕文本的字符的個數(shù)所 受到的限制和第 一種方法中 一樣。
圖8A至8C是示出通過為多個字幕分配多個組成信息數(shù)據(jù)以生成圖像以 使將一個圖像對象包括在一個組成信息數(shù)據(jù)中的過程的示圖。
在圖8A中,樣式'Scriptl, 、 'Script2,和'Script3,被定義為用于字幕文本 渲染的樣式信息。參照圖8A,所述三個樣式的每一個都使用字體'Arial.ttf,、 文本顏色'black,、背景顏色'white,、字符大小'16pt,、對齊方法'center,、輸出 方向'left-to-right-top-to-bottom,和行高'40px,。
作為字幕文本參考位置, 'Scriptl,具有坐標(biāo)(xl, yl), 'Script2,具有坐標(biāo)(x2, y2), 'Script3,具有坐標(biāo)(x3, y3)。作為文本輸出區(qū)域,'Scriptl,具有'leftl,topl, widthl,heightl,, 'Script2, 具有'left2, top2, width2, height2,, 'Script3,具有'left3, top3, width3, height3,。
在圖8B中,定義了通過使用樣式'Scriptr、 'Script2,和'Script3,渲染的 字幕文本810、 820和830。參照圖8B,字幕文本Hello 810使用樣式'Scriptl,, 并從'00:10:00,到'00:15:00,被輸出,字幕文本Subtitle 820使用樣式'Script2,, 并從'00:12:00,到'00:17:00,被輸出,字幕文本W(wǎng)orld 830使用樣式'Script3,, 并從'00:14:00,到'00:19:00,被輸出。因此,在'00:12:00,和'00:17:00,之間輸出 了兩個或三個字幕文本。
圖8C顯示輸出在圖8A和8B中定義的字幕的結(jié)果。參照圖8C,將詳細(xì) 描述每個示出的時間窗口中的文本字幕處理單元220的每個緩沖器中存儲的 數(shù)據(jù)。
從'00:10:00,當(dāng)輸出的組成信息包括空字幕圖像時,文本布局/字體渲染 器222包括
元素控制數(shù)據(jù)緩沖器空;
文本數(shù)據(jù)緩沖器空;
樣式數(shù)據(jù)緩沖器空;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:10:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本Hello 810 的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Hello 810的加載控制信息;
文本數(shù)據(jù)緩沖器'Hello';
樣式數(shù)據(jù)緩沖器樣式信息'Scriptl,;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:12:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本Hello 810 和字幕文本Subtitle 820的圖像時,文本布局/字體渲染器222包括
元素控制數(shù)據(jù)緩沖器字幕文本Subtitle 820的加載控制信息;
文本數(shù)據(jù)緩沖器'Subtitle';
樣式數(shù)據(jù)緩沖器樣式信息'Script2,;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf,。
從'00:14:00,當(dāng)輸出的組成信息包括在其中渲染了字幕文本Hello 810、 字幕文本Subtitle 820和字幕文本W(wǎng)orld 830的圖像時,文本布局/字體渲染器 222包括
元素控制數(shù)據(jù)緩沖器字幕文本W(wǎng)orld830的加載控制信息;
文本數(shù)據(jù)緩沖器'World';
樣式數(shù)據(jù)緩沖器樣式信息'Script3,;和
字體數(shù)據(jù)緩沖器字體信息'Arial.ttf'。
'00:15:00,之后在準(zhǔn)備在'00:19:00,之后將被輸出的后面的字幕文本的輸 出之前,文本字幕處理單元220不執(zhí)行任何操作。因此,通過表現(xiàn)引擎230 控制從文本字幕處理單元220接收的字幕'Hello'、 'Subtitle,和'World'的組成 信息來執(zhí)行'00:15:00,和'00:19:00,之間的字幕輸出的改變。
即,在'00:15:00',表現(xiàn)引擎230從組成緩沖器233和對象緩沖器234刪 除字幕'Hello,的組成信息和位像對象,僅將字幕'Subtitle,和'World'的組 成信息輸出到屏幕上。在'00:17:00',表現(xiàn)引擎230從組成緩沖器233和對象 緩沖器234刪除字幕'Subtitle,的組成信息和位圖對象,僅將字幕'World,的組 成信息輸出到屏幕上。另外,在'00:19:00',表現(xiàn)引擎230從組成緩沖器233
和對象緩沖器234刪除字幕'World,的組成信息和位圖對象,并且不再將字幕 輸出到屏幕上。
在上述第三種方法中,通過將不同的樣式應(yīng)用到具有重疊輸出時間的多 個字幕文本來為每個字幕文本產(chǎn)生一個字幕圖像,為每個字幕圖像產(chǎn)生一個 組成信息數(shù)據(jù),并將產(chǎn)生的多個組成信息數(shù)據(jù)發(fā)送到表現(xiàn)引擎230。文本字 幕處理時間與第 一種方法的文本字幕處理時間相同。由于在第 一種和第二種 方法中用于具有重疊輸出時間的多個字幕文本的一個組成信息數(shù)據(jù)被組成并 被輸出,所以在第一種方法和第二種方法中僅考慮一個組成信息數(shù)據(jù)的處理 時間,由于在第三種方法中每個字幕文本組成獨立的組成信息數(shù)據(jù),所以在 第三種方法中產(chǎn)生并輸出多個組成信息數(shù)據(jù)。因此,對于第三種方法的字幕 文本處理開始時間,必須考慮最壞的情況,即,用于具有相同的輸出開始時 間的多個字幕的多個組成信息數(shù)據(jù)被同時產(chǎn)生并被輸出的情況。這由方程3 來描述。
方程3
<formula>complex formula see original document page 18</formula>
通過將每一個字幕的組成信息產(chǎn)生時間Tc。mp。slti。n inf。腿ti。n加在一起來獲得 產(chǎn)生多個組成信息數(shù)據(jù)所花費的時間Tc。mp。slti。n lnfomati。n generati。n。通過將每一個 字幕的渲染時間ToBJ加在一起來獲得通過渲染多個字幕產(chǎn)生多個對象所花費 的時間Trendering。通過將每一個相關(guān)字幕中包括的每個字符的渲染時間Tchar
加在一起來獲得渲染一個字幕所花費的時間T0BJ。參照方程3,為了同時輸
出多個包括多個字符的字幕,渲染在所述字幕中包括的所有字符所花費的時 間、組成多個組成信息數(shù)據(jù)、并且輸出所述多個組成信息所花費的時間的總
和必須小于文本字幕處理單元220的字幕輸出時間和字幕處理開始時間之間 的差。
在第三種方法中可存儲到對象緩沖器234中的字幕文本的字符的個數(shù)所 受到的限制和第一種方法和第二種方法中一樣。
如第三種方法所述,在信息存儲介質(zhì)和用支持同時輸出多個組成信息數(shù) 據(jù)的結(jié)構(gòu)構(gòu)成的再現(xiàn)設(shè)備中,可將文本字幕和另一位像同時輸出到屏幕 上。
在AV流中被壓縮和編碼的數(shù)據(jù)包括視頻數(shù)據(jù)、音頻數(shù)據(jù)、基于位圖的 字幕和其他非字幕的位像。為了指示是針對超過14歲的人的TV節(jié)目而 顯示在屏幕的右上方的圖像'TV-14,是非字幕位像的示例。在傳統(tǒng)方法 中,由于在一個時間點僅一個組成信息數(shù)據(jù)被顯示在屏幕上,所以為了同時 輸出位圖字幕和非字幕位像,需要在組成信息中分開定義用于輸出位圖 字幕的區(qū)域和用于輸出非字幕位像的區(qū)域。
因此,當(dāng)用戶由于不需要字幕的輸出而關(guān)閉字幕的輸出時,解碼器僅停 止對字幕解碼。因此,由于不將字幕數(shù)據(jù)發(fā)送到對象緩沖器,所以字幕從屏 幕上消失,僅非字幕位像被連續(xù)輸出到屏幕上。
當(dāng)文本字幕處理單元220通過使用一個組成信息數(shù)據(jù)為字幕產(chǎn)生圖像并 將該組成信息數(shù)據(jù)發(fā)送到表現(xiàn)引擎230以輸出該字幕時,如果字幕的輸出被 關(guān)閉,則在AV流中記錄的非字幕位圖也不被輸出。因此,在如本發(fā)明的第 三種方法中所述的可將多個組成信息數(shù)據(jù)同時輸出到屏幕上的情況下,當(dāng)選 擇了文本字幕而非位圖字幕時,可連續(xù)輸出AV流中包括的組成信息數(shù)據(jù)中 的除位圖字幕之外的圖像,并可通過使用由字幕處理單元220產(chǎn)生的組成信 息來輸出文本字幕。即,可將文本字幕和其他非字幕位像同時輸出到屏
幕上o
在通用計算機中可通過從計算機可讀介質(zhì)運行程序來實現(xiàn)本發(fā)明,所述
計算機可讀介質(zhì)包括但不限于存儲介質(zhì),例如磁性存儲介質(zhì)(ROM、 RAM、 軟盤、磁盤等)、光學(xué)可讀介質(zhì)(CD-ROM、 DVD等)和載波(通過互聯(lián)網(wǎng)的傳 輸)。為了使經(jīng)網(wǎng)絡(luò)連接的幾個計算機系統(tǒng)實現(xiàn)分布式處理,本發(fā)明可被實現(xiàn) 為包括計算機可讀程序代碼單元的計算機可讀介質(zhì)??捎杀景l(fā)明所屬領(lǐng)域的 程序員容易地推出用于實現(xiàn)本發(fā)明的函數(shù)程序、代碼和代碼段。
盡管已經(jīng)顯示和描述了本發(fā)明的一些實施例,但是本領(lǐng)域的技術(shù)人員應(yīng) 該理解,在不脫離由權(quán)利要求及其等同物限定其范圍的本發(fā)明的原則和精神 的情況下,可對這些實施例進(jìn)行改變。
權(quán)利要求
1、一種文本字幕處理設(shè)備,包括文本字幕解析器,從字幕數(shù)據(jù)分開地提取用于渲染文本字幕數(shù)據(jù)中的文本的渲染信息和用于表現(xiàn)渲染的文本的控制信息;和文本布局/字體渲染器,根據(jù)提取的渲染信息渲染由文本字幕解析器提取的字幕文本來產(chǎn)生所述字幕文本的位像。
2、 如權(quán)利要求l所述的設(shè)備,其中,所述文本字幕解析器提取控制信息 以便所述控制信息適合于預(yù)定的信息結(jié)構(gòu)格式,并將所述控制信息發(fā)送到表 現(xiàn)引擎。
3、 如權(quán)利要求l所述的設(shè)備,還包括文本字幕控制器,通過使用從用于處理位圖字幕數(shù)據(jù)的表現(xiàn)引擎分離的 控制信息來控制由文本布局/字體渲染器產(chǎn)生的位像被直接輸出到屏幕 上。
4、 如權(quán)利要求l所述的設(shè)備,其中,所述字幕數(shù)據(jù)是具有重疊輸出時間 的多個字幕數(shù)據(jù)。
5、 如權(quán)利要求1所述的設(shè)備,其中,所述文本布局/字體渲染器通過產(chǎn) 生與具有重疊輸出時間的多個字幕數(shù)據(jù)相應(yīng)的一個組成信息數(shù)據(jù)、 一個位置 信息數(shù)據(jù)和一個對象信息數(shù)據(jù)來產(chǎn)生位圖,并輸出該位圖。
6、 如權(quán)利要求1所述的設(shè)備,其中,所述文本布局/字體渲染器通過產(chǎn) 生與具有重疊輸出時間的多個字幕數(shù)據(jù)相應(yīng)的一個組成信息數(shù)據(jù)、 一個位置 信息數(shù)據(jù)和多個對象信息數(shù)據(jù)來產(chǎn)生位圖,并輸出該位圖。
7、 如權(quán)利要求1所述的設(shè)備,其中,所述文本布局/字體渲染器通過產(chǎn) 生與具有重疊輸出時間的多個字幕數(shù)據(jù)相應(yīng)的多個組成信息數(shù)據(jù)、 一個位置 信息數(shù)據(jù)和一個相應(yīng)于每一組成信息數(shù)據(jù)的對象信息數(shù)據(jù)來產(chǎn)生位圖,并輸 出該位圖。
8、 如權(quán)利要求1所述的設(shè)備,其中,所述文本布局/字體渲染器通過將 相同的輸出樣式應(yīng)用于多個丈本字幕數(shù)據(jù)來渲染所述多個文本字幕數(shù)據(jù)的一 個圖像,并產(chǎn)生包括所述一個圖像的一頁。
9、 如權(quán)利要求1所述的設(shè)備,其中,所述文本布局/字體渲染器通過將 不同的輸出樣式應(yīng)用于多個文本字幕數(shù)據(jù)的每一個來渲染所述多個文本字幕 數(shù)據(jù)的圖像,并產(chǎn)生包括所述多個渲染的圖像的一頁。
10、 如權(quán)利要求l所述的設(shè)備,其中,所述文本布局/字體渲染器通過將 不同的輸出樣式應(yīng)用于多個文本字幕數(shù)據(jù)的每一個來渲染所述多個文本字幕 數(shù)據(jù)的圖像,并產(chǎn)生包括所述多個渲染的圖像的多頁。
11、 一種文字字幕處理方法,包括從字幕數(shù)據(jù)分開地提取用于渲染文本字幕數(shù)據(jù)中的文本的渲染信息和用 于表現(xiàn)渲染的文本的控制信息;和根據(jù)提取的渲染信息渲染字幕文本來產(chǎn)生提取的字幕文本的位像。
12、 如權(quán)利要求11所述的方法,其中,提取控制信息以便所述控制信息 適合于預(yù)定的信息結(jié)構(gòu)格式,并將所述控制信息發(fā)送到表現(xiàn)引擎。
13、 如權(quán)利要求11所述的方法,還包括通過使用從用于處理位圖字幕數(shù)據(jù)的表現(xiàn)引擎分離的控制信息來控制產(chǎn) 生的位像被直接輸出到屏幕上。
14、 如權(quán)利要求11所述的方法,其中,所述字幕數(shù)據(jù)是具有重疊輸出時間的多個字幕數(shù)據(jù)。
15、 如權(quán)利要求11所述的方法,其中,通過產(chǎn)生與具有重疊輸出時間的 多個字幕數(shù)據(jù)相應(yīng)的 一個組成信息數(shù)據(jù)、 一個位置信息數(shù)據(jù)和一個對象信息 數(shù)據(jù)來產(chǎn)生位圖,并輸出該位圖。
16、 如權(quán)利要求11所述的方法,其中,通過產(chǎn)生與具有重疊輸出時間的 多個字幕數(shù)據(jù)相應(yīng)的一個組成信息數(shù)據(jù)、 一個位置信息數(shù)據(jù)和多個對象信息 數(shù)據(jù)來產(chǎn)生位圖,并輸出該位圖。
17、 如權(quán)利要求11所述的方法,其中,通過產(chǎn)生與具有重疊輸出時間的 多個字幕數(shù)據(jù)相應(yīng)的多個組成信息數(shù)據(jù)、 一個位置信息數(shù)據(jù)和一個相應(yīng)于每 一組成信息數(shù)據(jù)的對象信息數(shù)據(jù)來產(chǎn)生位圖,并輸出該位圖。
18、 如權(quán)利要求11所述的方法,其中,通過將相同的輸出樣式應(yīng)用于多 個文本字幕數(shù)據(jù)來渲染所述多個文本字幕數(shù)據(jù)的一個圖像,并產(chǎn)生包括所述 一個圖像的一頁。
19、 如權(quán)利要求11所述的方法,其中,通過將不同的輸出樣式應(yīng)用于多 個文本字幕數(shù)據(jù)的每一個來渲染所述多個文本字幕數(shù)據(jù)的圖像,并產(chǎn)生包括 所述多個渲染的圖像的一頁。
20、 如權(quán)利要求11所述的方法,其中,通過將不同的輸出樣式應(yīng)用于多 個文本字幕數(shù)據(jù)的每一個來渲染所述多個文本字幕數(shù)據(jù)的圖像,并產(chǎn)生包括 所述多個渲染的圖像的多頁。
全文摘要
一種包含字幕的信息存儲介質(zhì)和一種字幕處理設(shè)備,其中,所述信息存儲介質(zhì)包括音視頻(AV)數(shù)據(jù);和字幕數(shù)據(jù),在所述字幕數(shù)據(jù)中以文本格式存儲至少一個字幕文本數(shù)據(jù)和用于指定所述至少一個字幕文本數(shù)據(jù)的輸出形式的輸出樣式。從而,在文本字幕數(shù)據(jù)中包括的字幕文本的輸出時間可能重疊,可容易地產(chǎn)生字幕文本,并且可用各種形式輸出AV流的字幕。
文檔編號G11B27/34GK101197173SQ200710166800
公開日2008年6月11日 申請日期2004年11月10日 優(yōu)先權(quán)日2003年11月10日
發(fā)明者姜滿錫, 文誠辰, 鄭鉉權(quán) 申請人:三星電子株式會社