專利名稱:一種實(shí)時(shí)顯示電視節(jié)目字幕的方法、裝置及其電視機(jī)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電視機(jī)技術(shù)領(lǐng)域,具體地說,是一種實(shí)時(shí)顯示電視節(jié)目字幕的方法及 可以實(shí)時(shí)顯示電視節(jié)目字幕的電視機(jī)。
背景技術(shù):
電視機(jī)已經(jīng)成為人們生活中必不可少的家用電器,現(xiàn)有的電視機(jī)只能根據(jù)電視臺(tái) 發(fā)送的節(jié)目直接播放,對(duì)于有些節(jié)目由于各種條件限制,用戶在收看電視節(jié)目時(shí)聽到的電 視伴音效果不是很理想。例如中國(guó)地域十分廣闊,各地的方言口音也各不相同,當(dāng)有方言節(jié) 目時(shí),很多其它地方的觀眾無法聽懂節(jié)目語言,進(jìn)一步也會(huì)影響對(duì)電視節(jié)目?jī)?nèi)容的理解。公開號(hào)為CN1870728,
公開日為2006年11月29,名稱為“自動(dòng)加配字幕的方法和 系統(tǒng)”的中國(guó)發(fā)明專利中公開了一種為電視節(jié)目加配字幕的方法及系統(tǒng),其針對(duì)非現(xiàn)場(chǎng)直 播類型的影視節(jié)目和現(xiàn)場(chǎng)直播型電視節(jié)目,利用字幕自動(dòng)識(shí)別模塊自動(dòng)識(shí)別影視作品中與 視頻流相對(duì)應(yīng)的字幕腳本;利用字幕輔助校對(duì)模塊進(jìn)行字幕校對(duì);利用字幕大段對(duì)齊模塊 將得到的音頻和字幕腳本在時(shí)間尺度上按照一定的語言單元自動(dòng)對(duì)齊,在播放影視節(jié)目時(shí) 可以同步顯示相應(yīng)字幕。但該技術(shù)實(shí)現(xiàn)起來十分復(fù)雜,不利于實(shí)際應(yīng)用,尤其不適用于在電 視終端由用戶自主選擇進(jìn)行字幕的添加。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種可以實(shí)時(shí)為電視節(jié)目加上對(duì)應(yīng)字幕的方法 及其裝置,其實(shí)現(xiàn)簡(jiǎn)單,技術(shù)難度低,尤其適用于在電視機(jī)終端上使用。本發(fā)要解決的另一技術(shù)問題是提供一種可以實(shí)時(shí)地顯示電視節(jié)目字幕的電視機(jī)。為了解決上述技術(shù)問題,本發(fā)明提供了一種實(shí)時(shí)顯示電視節(jié)目字幕的方法,包 括將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);從所述數(shù)字音頻信號(hào)中提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;將所述字符疊加到電視節(jié)目的視頻信號(hào)中,得到帶有字幕的視頻信號(hào)。進(jìn)一步地,所述將字符疊加到視頻信號(hào)中的步驟包括設(shè)置定時(shí)器,并對(duì)所述定時(shí)器進(jìn)行初始化;清中斷,接收地址碼;判斷所接收到的地址碼是否為本機(jī)地址碼,如果不是,繼續(xù)接收地址碼;如果是, 回送本機(jī)地址碼;接收一組所述字符數(shù)據(jù),并將該字符數(shù)據(jù)寫入閃存,發(fā)送OAAH ;判斷所接收的字符數(shù)據(jù)是否是最后一組,若不是,繼續(xù)接收一下組數(shù)據(jù)并進(jìn)行處 理;若是,結(jié)束本流程。本發(fā)明還提供了一種實(shí)時(shí)顯示電視節(jié)目字幕的裝置,包括模數(shù)轉(zhuǎn)換模塊,用于將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);
電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便 能提取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到電視節(jié)目的視頻 信號(hào)中,得到帶有字幕的視頻信號(hào)。進(jìn)一步地,所述驅(qū)動(dòng)字線模塊包括人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。進(jìn)一步地,還包括設(shè)置模塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換模 塊和/或視頻字符疊加模塊,所述設(shè)置信息包括電視節(jié)目的語種信息、方言信息、添加字幕 的開始時(shí)間信息、結(jié)束時(shí)間信息、在屏幕上添加字幕的位置信息中的一種或任意組合。本發(fā)明還提供了一種可以實(shí)時(shí)顯示電視節(jié)目字幕的電視機(jī),包括模數(shù)轉(zhuǎn)換模塊, 用于將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便 能提取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到電視節(jié)目的視頻 信號(hào)中,得到帶有字幕的視頻信號(hào)。進(jìn)一步地,所述驅(qū)動(dòng)字線模塊包括人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。進(jìn)一步地,還包括設(shè)置模塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換模 塊和/或視頻字符疊加模塊,所述設(shè)置信息包括電視節(jié)目的語種信息、方言信息、添加字幕 的開始時(shí)間信息、結(jié)束時(shí)間信息、在屏幕上添加字幕的位置信息中的一種或任意組合。本發(fā)明還提供了一種視頻裝置,可以實(shí)時(shí)顯示視頻字幕,包括模數(shù)轉(zhuǎn)換模塊,用于將視頻的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便 能提取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到視頻中,得到帶 有字幕的視頻信號(hào)。上述驅(qū)動(dòng)字線模塊包括人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。上述視頻裝置還包括設(shè)置模塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換 模塊和/或視頻字符疊加模塊,所述設(shè)置信息包括視頻的語種信息、方言信息、添加字幕的 開始時(shí)間信息、結(jié)束時(shí)間信息、在屏幕上添加字幕的位置信息中的一種或任意組合。上述視頻裝置還包括存儲(chǔ)裝置,提前存儲(chǔ)字符,所述驅(qū)動(dòng)字線模塊從所述存儲(chǔ)裝 置中提取字符。
5
本發(fā)明通過將從所述數(shù)字音頻信號(hào)中提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字 符,并將所述字符疊加到電視節(jié)目的視頻信號(hào)中,得到帶有字幕的視頻信號(hào)。即可簡(jiǎn)單的實(shí) 現(xiàn)了為電視節(jié)目添加上字幕,其技術(shù)難度低,尤其適用于在電視機(jī)終端上使用。
圖1是本發(fā)明實(shí)施例的電視機(jī)的硬件結(jié)構(gòu)圖;圖2是本發(fā)明實(shí)時(shí)地顯示電視節(jié)目字幕的方法實(shí)施例的流程圖;圖3是本發(fā)明實(shí)時(shí)地顯示電視節(jié)目字幕的裝置實(shí)施例的系統(tǒng)方框圖;圖4是本發(fā)明實(shí)時(shí)地顯示電視節(jié)目字幕的方法中為視頻疊加字符實(shí)施例的流程 圖。
具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明,以使本領(lǐng)域的技術(shù)人員可以 更好的理解本發(fā)明并能予以實(shí)施,但所舉實(shí)施例不作為對(duì)本發(fā)明的限定。如圖1所示,本發(fā)明的可以實(shí)時(shí)地顯示電視節(jié)目字幕的電視機(jī),其主體部分的硬 件構(gòu)成包括主CPU,為電視機(jī)的核心,負(fù)責(zé)執(zhí)行、運(yùn)算各種指令、代碼等;顯示部分,用于將 經(jīng)主CPU處理后的視頻信號(hào)顯示到電視機(jī)屏幕上;主CPU還可以通過遙控裝置接收用戶的 設(shè)置、操作指令等;存儲(chǔ)模塊,用于存儲(chǔ)用戶的設(shè)置等信息。如圖2所示,本發(fā)明的實(shí)時(shí)地顯示電視節(jié)目字幕的方法包括以下步驟將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);從所述數(shù)字音頻信號(hào)中提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;將所述字符疊加到電視節(jié)目的視頻信號(hào)中,得到帶有字幕的視頻信號(hào)。如圖3所示,本發(fā)明的實(shí)時(shí)地顯示電視節(jié)目字幕的裝置包括模數(shù)轉(zhuǎn)換模塊,用于將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便 能提取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到電視節(jié)目的視頻 信號(hào)中,得到帶有字幕的視頻信號(hào)。其中,電平轉(zhuǎn)換模塊包括人聲提取單元,用于從所述數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。作為對(duì)本發(fā)明的實(shí)時(shí)地顯示電視節(jié)目字幕的裝置的一種優(yōu)化,該裝置還可以包括 設(shè)置模塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換模塊和/或視頻字符疊加模 塊,所述設(shè)置信息包括電視節(jié)目的語種信息、方言信息、添加字幕的開始時(shí)間信息、結(jié)束時(shí) 間信息、在屏幕上添加字幕的位置信息等中的一種或任意組合。如圖4所示,本發(fā)明中,進(jìn)行視頻字符疊加的步驟包括視頻字符疊加主要由CPU控制單元、同步識(shí)別、字符存儲(chǔ)器控制單元、模擬開關(guān)以 及時(shí)鐘振蕩器部分完成。程序控制框圖如圖4:
設(shè)置一定時(shí)器,并對(duì)所述定時(shí)器進(jìn)行初始化;清中斷,接收地址碼;判斷所接收到的地址碼是否為本機(jī)地址碼,如果不是,繼續(xù)接收地址碼;如果是, 回送本機(jī)地址碼;接收一組所述字符數(shù)據(jù),并將該字符數(shù)據(jù)寫入閃存,發(fā)送OAAH ;判斷所接收的字符數(shù)據(jù)是否是最后一組,若不是,繼續(xù)接收一下組數(shù)據(jù)并進(jìn)行處 理;若是,結(jié)束本流程。以上所述實(shí)施例僅是為充分說明本發(fā)明而所舉的較佳的實(shí)施例,本發(fā)明可以應(yīng)用 至目前的視頻裝置中,例如車載電視、手機(jī)電視、3G廣播或3G電視接收器等視頻設(shè)備中,實(shí) 現(xiàn)視頻裝置實(shí)時(shí)顯示視頻字幕的功能。這樣視頻設(shè)備包括模數(shù)轉(zhuǎn)換模塊,用于將視頻的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便 能提取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到視頻中,得到帶 有字幕的視頻信號(hào)。所述驅(qū)動(dòng)字線模塊包括人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。所述視頻裝置還包括設(shè)置模塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換 模塊和/或視頻字符疊加模塊,所述設(shè)置信息包括視頻的語種信息、方言信息、添加字幕的 開始時(shí)間信息、結(jié)束時(shí)間信息、在屏幕上添加字幕的位置信息中的一種或任意組合。所述視 頻裝置還包括存儲(chǔ)裝置,提前存儲(chǔ)字符,所述驅(qū)動(dòng)字線模塊從所述存儲(chǔ)裝置中提取字符。驅(qū) 動(dòng)字線模塊通過提前設(shè)定的調(diào)取協(xié)議或IIC從存儲(chǔ)裝置中提取字符。本發(fā)明的保護(hù)范圍不限于此。本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明基礎(chǔ)上所作的等同 替代或變換,均在本發(fā)明的保護(hù)范圍之內(nèi)。本發(fā)明的保護(hù)范圍以權(quán)利要求書為準(zhǔn)。
權(quán)利要求
1. 一種實(shí)時(shí)顯示電視節(jié)目字幕的方法,其特征在于,包括 將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);從所述數(shù)字音頻信號(hào)中提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符; 將所述字符疊加到電視節(jié)目的視頻信號(hào)中,得到帶有字幕的視頻信號(hào)。
2.根據(jù)權(quán)利要求1所述的實(shí)時(shí)顯示電視節(jié)目字幕的方法,其特征在于,所述將字符疊 加到視頻信號(hào)中的步驟包括設(shè)置定時(shí)器,并對(duì)所述定時(shí)器進(jìn)行初始化; 清中斷,接收地址碼;判斷所接收到的地址碼是否為本機(jī)地址碼,如果不是,繼續(xù)接收地址碼;如果是,回送 本機(jī)地址碼;接收一組所述字符數(shù)據(jù),并將該字符數(shù)據(jù)寫入閃存,發(fā)送OAAH ; 判斷所接收的字符數(shù)據(jù)是否是最后一組,若不是,繼續(xù)接收一下組數(shù)據(jù)并進(jìn)行處理;若 是,結(jié)束本流程。
3.一種實(shí)時(shí)顯示電視節(jié)目字幕的裝置,其特征在于,包括模數(shù)轉(zhuǎn)換模塊,用于將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào); 電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便能提 取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符; 視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到電視節(jié)目的視頻信號(hào) 中,得到帶有字幕的視頻信號(hào)。
4.根據(jù)權(quán)利要求3所述的實(shí)時(shí)顯示電視節(jié)目字幕的裝置,其特征在于,所述驅(qū)動(dòng)字線 模塊包括人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音; 語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。
5.根據(jù)權(quán)利要求3所述的實(shí)時(shí)顯示電視節(jié)目字幕的裝置,其特征在于,還包括設(shè)置模 塊,用于接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換模塊和/或視頻字符疊加模塊,所述 設(shè)置信息包括電視節(jié)目的語種信息、方言信息、添加字幕的開始時(shí)間信息、結(jié)束時(shí)間信息、 在屏幕上添加字幕的位置信息中的一種或任意組合。
6.一種電視機(jī),其特征在于,所述電視機(jī)可以實(shí)時(shí)顯示電視節(jié)目字幕,包括權(quán)利要求 3-5任意一項(xiàng)權(quán)利要求所述的裝置。
7.一種視頻裝置,其特征在于,可以實(shí)時(shí)顯示視頻字幕,包括 模數(shù)轉(zhuǎn)換模塊,用于將視頻的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);電平轉(zhuǎn)換模塊,用于從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便能提 取字符信息;驅(qū)動(dòng)字線模塊,用于提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符; 視頻字符疊加模塊,用于將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到視頻中,得到帶有字 幕的視頻信號(hào)。
8.根據(jù)權(quán)利要求7所述的視頻裝置,其特征在于,所述驅(qū)動(dòng)字線模塊包括 人聲提取單元,用于從編碼后的數(shù)字音頻信號(hào)中提取出人聲,去除其它聲音;語音識(shí)別單元,用于將所述人聲提取單元提取出的人聲識(shí)別為字符。
9.根據(jù)權(quán)利要求7所述的視頻裝置,其特征在于,所述視頻裝置還包括設(shè)置模塊,用于 接收用戶的設(shè)置信息并提供給所述電平轉(zhuǎn)換模塊和/或視頻字符疊加模塊,所述設(shè)置信息 包括視頻的語種信息、方言信息、添加字幕的開始時(shí)間信息、結(jié)束時(shí)間信息、在屏幕上添加 字幕的位置信息中的一種或任意組合。
10.根據(jù)權(quán)利要求7至9任一所述的視頻裝置,其特征在于,所述視頻裝置還包括存儲(chǔ) 裝置,提前存儲(chǔ)字符,所述驅(qū)動(dòng)字線模塊從所述存儲(chǔ)裝置中提取字符。
全文摘要
本發(fā)明公開了一種實(shí)時(shí)顯示電視節(jié)目字幕的方法、裝置及其電視機(jī)。其是利用模數(shù)轉(zhuǎn)換模塊將電視節(jié)目的模擬音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻信號(hào);然后利用電平轉(zhuǎn)換模塊從所述模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)換后的數(shù)字音頻信號(hào)進(jìn)行編碼,以便能提取字符信息;再后利用驅(qū)動(dòng)字線模塊提取出人聲,并將所述人聲識(shí)別轉(zhuǎn)換為字符;最后利用視頻字符疊加模塊將所述驅(qū)動(dòng)字線模塊輸出的字符疊加到電視節(jié)目的視頻信號(hào)中,得到帶有字幕的視頻信號(hào)。本發(fā)明通過簡(jiǎn)單的方法即實(shí)現(xiàn)了為電視節(jié)目添加上字幕,其技術(shù)難度低,尤其適用于在電視機(jī)終端上使用。
文檔編號(hào)H04N5/00GK102148939SQ20101011060
公開日2011年8月10日 申請(qǐng)日期2010年2月9日 優(yōu)先權(quán)日2010年2月9日
發(fā)明者張文 申請(qǐng)人:佛山市南海平板顯示技術(shù)中心, 佛山市南海海信多媒體技術(shù)有限公司