專(zhuān)利名稱:處理兩個(gè)音頻輸入信號(hào)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于處理至少兩個(gè)包含音頻信息、還可能包含視頻信息的輸入信號(hào)的方法,在該方法中處理第一輸入信號(hào)的音頻信息和可能還有的視頻信息,用于聲音和可能的視聽(tīng)再現(xiàn)。
本發(fā)明還涉及一種用于處理至少兩個(gè)包含音頻信息、還可能包含視頻信息的輸入信號(hào)的裝置,該裝置包括用于再現(xiàn)第一輸入信號(hào)的再現(xiàn)裝置。
除了電視節(jié)目的音頻和視頻信息外,已知還可提供帶文本的電視信號(hào),這種文本包括例如標(biāo)題、證券交易數(shù)據(jù)或其它最新消息。在顯示屏的一個(gè)小區(qū)域內(nèi)光學(xué)再現(xiàn)第二電視信號(hào)也是已知的。在所謂的PIP(畫(huà)中畫(huà))方法中這個(gè)另外的電視信號(hào)的音頻信號(hào)是不被再現(xiàn)的。光學(xué)再現(xiàn)所述被再現(xiàn)電視信號(hào)的音頻信號(hào)的插入文本至少在一定程度上對(duì)那些耳聾或聽(tīng)力有障礙的人是有益的,這也是已知的。
美國(guó)專(zhuān)利5557338A公開(kāi)了一種電視系統(tǒng),其中圖像包括主圖像和輔助圖像,并且其中在主圖像中還再現(xiàn)了小標(biāo)題形式的文本信息,該文本信息涉及輔助圖像中再現(xiàn)的廣播。發(fā)射機(jī)則必須與輔助圖像的信息一起發(fā)送該文本信息。這個(gè)系統(tǒng)構(gòu)成所謂的PIP(畫(huà)中畫(huà))方法的擴(kuò)展,其中除了輔助圖像外,還再現(xiàn)文本信息。
本發(fā)明的一個(gè)目的是提供一種前述類(lèi)型的方法和裝置,由此除了被再現(xiàn)的輸入信號(hào)外,還可再現(xiàn)至少一個(gè)另外的輸入信號(hào)。這樣,無(wú)論是否已接收聲音或視聽(tīng)輸入信號(hào),都可能接收至少一個(gè)另外的聲音或視聽(tīng)輸入信號(hào)。應(yīng)當(dāng)也能夠在由于過(guò)量環(huán)境噪聲而無(wú)法進(jìn)行輸入信號(hào)的聲音接收的位置使用該方法。
關(guān)于本方法,根據(jù)本發(fā)明的目的是通過(guò)一種用于處理至少兩個(gè)包含音頻信息并且可能還包含視頻信息的輸入信號(hào)的方法來(lái)實(shí)現(xiàn)的,在該方法中,一個(gè)輸入信號(hào)的音頻信息和可能還有的視頻信息被處理,以便聲音和可能還有的視聽(tīng)再現(xiàn),至少一個(gè)第二輸入信號(hào)被加至語(yǔ)音識(shí)別裝置,包含在至少第二輸入信號(hào)中的關(guān)于音頻信息的文本信息通過(guò)語(yǔ)音識(shí)別裝置來(lái)確定,并且所確定的文本信息被光學(xué)地再現(xiàn)。
因此根據(jù)本發(fā)明的方法使不同的輸入信號(hào)能夠以這種方式處理,即,識(shí)別出現(xiàn)在其中的語(yǔ)音并將其轉(zhuǎn)換成光學(xué)再現(xiàn)的文本。例如,在接收電視廣播期間,這使不同電視廣播的文本能夠插入圖像中。這樣,在接收電視廣播期間,用戶可以獲知關(guān)于其它主題的信息。其語(yǔ)音被識(shí)別的輸入信號(hào)也可以來(lái)自不同的外部源,例如來(lái)源于收音機(jī)、錄像機(jī)或者也可能來(lái)源于電話線。在電視廣播的再現(xiàn)過(guò)程中,接收到的來(lái)自廣播站的音頻信號(hào)形式的信息能夠由此再現(xiàn)為文本。也可能光學(xué)上再現(xiàn)發(fā)送到電話答錄機(jī)的呼入電話,以便用戶能夠獲得有關(guān)電話的信息,并且例如決定是否接聽(tīng)。語(yǔ)音識(shí)別使實(shí)際處理包含音頻信息和可能還包含視頻信息的任何輸入信號(hào)并再現(xiàn)除第一輸入信號(hào)外的這類(lèi)輸入信號(hào)成為可能。
根據(jù)本發(fā)明的目的還通過(guò)用于處理至少兩個(gè)包含音頻信息、還可能包含視頻信息的輸入信號(hào)的裝置來(lái)實(shí)現(xiàn),該裝置包括用于再現(xiàn)輸入信號(hào)的再現(xiàn)裝置、用于確定包含在至少一個(gè)第二輸入信號(hào)的音頻信息中的文本信息的語(yǔ)音識(shí)別裝置以及用于再現(xiàn)已確定的文本信息的光學(xué)再現(xiàn)裝置。
語(yǔ)音識(shí)別裝置可以與一個(gè)輸入信號(hào)的再現(xiàn)裝置和用于再現(xiàn)已確定文本信息的光學(xué)再現(xiàn)裝置分開(kāi),或者集成在所述裝置之一中。將根據(jù)本發(fā)明的裝置的所有組件集成在一個(gè)設(shè)備、例如電視接收機(jī)中,這也是可能的。這種外部的或集成的語(yǔ)音識(shí)別裝置使得能夠處理至少一個(gè)第二輸入信號(hào)的音頻信息,并且除了第一輸入信號(hào)之外,還光學(xué)上再現(xiàn)從中確定的文本信息。
文本信息被有利地再現(xiàn)為流動(dòng)文本,流動(dòng)文本的速度自動(dòng)地適應(yīng)再現(xiàn)。緩存文本信息并以延遲方式再現(xiàn)也是可能的。例如,可在預(yù)定時(shí)刻通過(guò)語(yǔ)音識(shí)別裝置處理無(wú)線電廣播,并且已確定的文本信息、例如標(biāo)題可緩存起來(lái),并在輸入信號(hào)再現(xiàn)期間在預(yù)定時(shí)刻或在用戶選擇的時(shí)刻被光學(xué)再現(xiàn)。
在共用監(jiān)視器上有利地再現(xiàn)一個(gè)輸入信號(hào)的視頻信息和至少一個(gè)另外的輸入信號(hào)的文本信息。如果被再現(xiàn)的第一輸入信號(hào)不是視頻信號(hào),則可在專(zhuān)門(mén)為此目的設(shè)置或現(xiàn)有的適當(dāng)顯示器上再現(xiàn)至少一個(gè)另外的輸入信號(hào)的文本信息。例如,第一輸入信號(hào)可以是電話的聲音信號(hào),第二個(gè)呼入電話可以光學(xué)地再現(xiàn)在電話的顯示屏上。
第二輸入信號(hào)可有利地由用戶選擇。這樣用戶可以決定在再現(xiàn)輸入信號(hào)期間還把哪個(gè)文本信息以光學(xué)方式再現(xiàn)。
第二輸入信號(hào)的選擇可以根據(jù)存儲(chǔ)的信息來(lái)進(jìn)行。這個(gè)信息可以包括由用戶選擇的給定標(biāo)準(zhǔn)或者還可涉及自動(dòng)檢測(cè)的用戶習(xí)慣。
語(yǔ)音識(shí)別裝置的參數(shù)有利地根據(jù)第二輸入信號(hào)的文本信息來(lái)修改。結(jié)果,例如,語(yǔ)音識(shí)別裝置可以最優(yōu)地適應(yīng)第二輸入信號(hào),因?yàn)槔缤ㄟ^(guò)給定文本的識(shí)別來(lái)選擇適應(yīng)第二輸入信號(hào)的適當(dāng)庫(kù)或者語(yǔ)言。
當(dāng)確定的文本信息與存儲(chǔ)的文本相比較時(shí),并且當(dāng)獲得給定的比較結(jié)果時(shí)采取給定的步驟,這也是有利的。例如,文本信息的光學(xué)再現(xiàn)可以根據(jù)與存儲(chǔ)文本的對(duì)應(yīng)關(guān)系來(lái)實(shí)施。作為此特征的結(jié)果,插入僅滿足給定條件的文本是可能的。在這方面,例如,給定的關(guān)鍵字可以用作標(biāo)準(zhǔn)。
另外,它可被設(shè)置成在文本信息與給定的存儲(chǔ)文本之間對(duì)應(yīng)的情況下,再現(xiàn)第二輸入信號(hào)的音頻信息和可能還有的視頻信息,取代第一輸入信號(hào)的音頻信息和可能還有的視頻信息。例如,這樣可監(jiān)測(cè)至少一個(gè)另外的輸入信號(hào),使得例如在新聞廣播開(kāi)始時(shí)或體育廣播開(kāi)始時(shí),可以自動(dòng)切換到此輸入信號(hào)。
要再現(xiàn)的輸入信號(hào)有利地為電視信號(hào)。然而,各種其它輸入信號(hào),例如無(wú)線電信號(hào)、電話信號(hào)等都是可行的。
用于再現(xiàn)輸入信號(hào)的再現(xiàn)裝置和用于再現(xiàn)所確定的文本信息的再現(xiàn)裝置有利地由共用的監(jiān)視器構(gòu)成。
當(dāng)提供用于存儲(chǔ)所確定的文本信息的存儲(chǔ)裝置時(shí),可以存儲(chǔ)包含在至少一個(gè)另外的輸入信號(hào)的音頻信息中的文本信息,以便稍后或重復(fù)再現(xiàn)。
為了使用戶能夠從多個(gè)可獲得的輸入信號(hào)中選擇,根據(jù)本發(fā)明的另外特征,提供了控制裝置。這種控制裝置可連接到信息存儲(chǔ)器,以便可以根據(jù)存儲(chǔ)器中存儲(chǔ)的信息來(lái)選擇至少一個(gè)第二輸入信號(hào)。
當(dāng)提供用于切換語(yǔ)音識(shí)別裝置的參數(shù)的切換裝置時(shí),語(yǔ)音識(shí)別裝置的最優(yōu)適配可以根據(jù)第二輸入信號(hào)的文本信息來(lái)完成。例如,在識(shí)別第二輸入信號(hào)的語(yǔ)言后,語(yǔ)音識(shí)別裝置可以適應(yīng)這種語(yǔ)言并且可以啟動(dòng)相關(guān)的庫(kù)。
有利地提供了用于將文本信息與存儲(chǔ)文本相比較的比較單元。這提供了一系列其它選擇,例如文本信息等的文本相關(guān)再現(xiàn)。
為了實(shí)現(xiàn)第二輸入信號(hào)的文本信息的文本特定再現(xiàn),所述比較單元可以與光學(xué)再現(xiàn)單元相連。
此外,可提供用于切換輸入信號(hào)再現(xiàn)的切換單元;這種切換單元與比較單元相連。切換單元可以由用于選擇輸入信號(hào)的所述控制裝置來(lái)構(gòu)成。
用于再現(xiàn)輸入信號(hào)的再現(xiàn)裝置可由電視接收機(jī)構(gòu)成。
下面參照附圖詳細(xì)地描述本發(fā)明的實(shí)施例,然而這不是以任何方式限制本發(fā)明。
圖1示出用于處理至少兩個(gè)包含音頻信息且還可能包含視頻信息的輸入信號(hào)的裝置的實(shí)施例的框圖。
圖2示出用于輸入信號(hào)和所確定文本信息的再現(xiàn)裝置的例子。
圖3示出根據(jù)本發(fā)明的裝置的擴(kuò)展框圖。
圖4示出主控室形式的應(yīng)用的例子。
圖5示出有關(guān)電話機(jī)的另一個(gè)應(yīng)用。
圖1示出一個(gè)用于處理至少兩個(gè)包含音頻信息Ai和可能還包含視頻信息Vi的輸入信號(hào)Si的裝置的框圖。所示裝置用于處理兩個(gè)輸入信號(hào)S1,S2,但可以隨意地?cái)U(kuò)展到任意數(shù)目的輸入信號(hào)Si。該裝置包括用于再現(xiàn)輸入信號(hào)S1的再現(xiàn)裝置10,例如電視接收機(jī),它處理和再現(xiàn)輸入信號(hào)S1的音頻信息A1和可能還有的視頻信息V1。至少一個(gè)第二輸入信號(hào)S2施加至語(yǔ)音識(shí)別裝置11,其中確定包含在輸入信號(hào)S2的音頻信息A2中的文本信息T2。這個(gè)文本信息T2由光學(xué)再現(xiàn)裝置12來(lái)再現(xiàn)。因此,除了輸入信號(hào)S1以外,還可以再現(xiàn)包含在另外的輸入信號(hào)S2中的文本信息T2,也就是說(shuō),同時(shí)或時(shí)間上有偏移地再現(xiàn)。為了實(shí)現(xiàn)時(shí)間偏移地再現(xiàn),可提供用于存儲(chǔ)所確定的文本信息T2的存儲(chǔ)裝置14。根據(jù)輸入信號(hào)S1、S2的類(lèi)型,可以有利地將用于再現(xiàn)輸入信號(hào)S1的再現(xiàn)裝置10和用于再現(xiàn)所確定的文本信息T2的再現(xiàn)裝置12集成在一個(gè)共用的監(jiān)視器13或類(lèi)似裝置中。
圖2示出包括用于再現(xiàn)第一輸入信號(hào)S1、例如電視廣播的再現(xiàn)裝置10和用于所確定文本信息T2的光學(xué)再現(xiàn)裝置12的這種共用監(jiān)視器13的一個(gè)例子。這樣,文本信息T2以字幕的形式插入到輸入信號(hào)S1的電視圖像中。
圖3示出與圖1所示的相比擴(kuò)展了的用于處理多個(gè)輸入信號(hào)S1的裝置的框圖。多個(gè)包含音頻信息Ai和還可能包含視頻信息Vi的輸入信號(hào)Si施加到用于選擇輸入信號(hào)Si的控制裝置15。第一輸入信號(hào)S1則被適當(dāng)?shù)靥幚聿⒃谠佻F(xiàn)裝置10中再現(xiàn)。至少一個(gè)另外的輸入信號(hào)S2施加到語(yǔ)音識(shí)別裝置11,包含在輸入信號(hào)S2的音頻信息A2中的文本信息T2在這里被確定。文本信息T2可施加到用于切換語(yǔ)音識(shí)別裝置11的參數(shù)Pi的切換裝置17,這樣使語(yǔ)音識(shí)別裝置11最優(yōu)地適應(yīng)被處理的文本信息T2。此外,文本信息T2在光學(xué)再現(xiàn)之前可施加到比較單元18,然后文本信息T2與存儲(chǔ)在所述比較單元中的存儲(chǔ)器19中的文本TS相比較。作為比較單元18中這種比較的結(jié)果,例如,在光學(xué)再現(xiàn)裝置12中可進(jìn)行文本信息T2的文本特定再現(xiàn)。此外,比較單元18可連接到控制裝置15或其他切換單元(未示出),使得當(dāng)在文本信息T2中識(shí)別出給定的存儲(chǔ)文本TS時(shí),可切換到不同的輸入信號(hào)Si。存儲(chǔ)器16可用于存儲(chǔ)可能涉及例如給定用戶習(xí)慣的信息Ii。存儲(chǔ)器16有利地連接到控制裝置15,使得可根據(jù)存儲(chǔ)在存儲(chǔ)器16中的信息Ii來(lái)進(jìn)行輸入信號(hào)Si的選擇。用于再現(xiàn)輸入信號(hào)S1的再現(xiàn)裝置10和用于再現(xiàn)所確定文本信息T2的光學(xué)再現(xiàn)裝置12可以集成在共用的監(jiān)視器13中。此外,根據(jù)本發(fā)明的所有裝置可集成在一個(gè)設(shè)備中,例如一個(gè)電視接收機(jī)20中。
圖4示出本發(fā)明用于主控室的一個(gè)應(yīng)用,其中例如提供了多個(gè)監(jiān)視器21,用于再現(xiàn)八個(gè)輸入信號(hào)S1到S8的視頻信息V1到V8和音頻信號(hào)A1到A8。每次只可接收一個(gè)音頻信號(hào)Ai。輸入信號(hào)Si的其它音頻信號(hào)Ai或來(lái)自其它源的音頻信號(hào)、例如攝像師或伴音技師發(fā)出的音頻信號(hào),可以文本信息Ti到T8的形式顯示在監(jiān)視器21上,從而為導(dǎo)演提供進(jìn)一步信息以便選擇要廣播的信號(hào)Si。
圖5示出本發(fā)明在電話機(jī)22中的另一個(gè)應(yīng)用,其中,在接收電話呼叫期間,另一個(gè)電話呼叫的文本信息T2可另外地顯示在電話機(jī)中通常設(shè)置的顯示屏形式的光學(xué)顯示裝置12上。因而本發(fā)明使電話機(jī)22的用戶能夠同時(shí)接收被轉(zhuǎn)到例如電話答錄設(shè)備的另一電話呼叫。例如,用戶則可決定中斷第一個(gè)電話呼叫而轉(zhuǎn)成接聽(tīng)第二個(gè)電話呼叫。
本發(fā)明決不局限于所描述的實(shí)例,并且也可應(yīng)用于其它各種輸入信號(hào)。
權(quán)利要求
1.一種用于處理至少兩個(gè)包含音頻信息(Ai)并且可能還包含視頻信息(Vi)的輸入信號(hào)(Si)的方法,在所述方法中,第一輸入信號(hào)(S1)的音頻信息(A1)和可能還有的視頻信息(V1)經(jīng)過(guò)處理,以便聲音再現(xiàn)和可能還視聽(tīng)再現(xiàn),至少一個(gè)第二輸入信號(hào)(S2)被施加到語(yǔ)音識(shí)別裝置(11),通過(guò)所述語(yǔ)音識(shí)別裝置(11)確定關(guān)于包含在至少所述第二輸入信號(hào)(S2)中的音頻信息(A2)的文本信息(T2),所確定的文本信息(T2)被光學(xué)地再現(xiàn)。
2.如權(quán)利要求1所述的方法,其中所述文本信息(T2)被再現(xiàn)為流動(dòng)文本。
3.如權(quán)利要求1所述的方法,其中所述文本信息(T2)被緩存并以延遲方式再現(xiàn)。
4.如權(quán)利要求1所述的方法,其中所述一個(gè)輸入信號(hào)(S1)的所述視頻信息(V1)和所述文本信息(T2)被再現(xiàn)在共用的監(jiān)視器(13)上。
5.如權(quán)利要求1所述的方法,其中所述第二輸入信號(hào)(S2)是選取的。
6.如權(quán)利要求5所述的方法,其中所述第二輸入信號(hào)(S2)是根據(jù)所存儲(chǔ)的信息(I2)來(lái)選取的。
7.如權(quán)利要求1所述的方法,其中根據(jù)所述第二輸入信號(hào)(S2)的所述文本信息(T2)來(lái)修改所述語(yǔ)音識(shí)別裝置(11)的參數(shù)。
8.如權(quán)利要求1所述的方法,其中所述文本信息(T2)與所存儲(chǔ)的文本(TS)相比較。
9.如權(quán)利要求8所述的方法,其中如果所述文本信息(T2)與所存儲(chǔ)的文本(TS)對(duì)應(yīng),則再現(xiàn)所述文本信息(T2)。
10.如權(quán)利要求8所述的方法,其中在所述文本信息(T2)與所存儲(chǔ)的文本(TS)之間對(duì)應(yīng)的情況下,再現(xiàn)所述第二輸入信號(hào)(S2)的音頻信息(A2)和可能還有的視頻信息(V2),而不是所述第一輸入信號(hào)(S1)的音頻信息(A1)和可能還有的視頻信息(V1)。
11.如權(quán)利要求1所述的方法,其中所述輸入信號(hào)(S1,S2)是電視信號(hào)。
12.一種用于處理至少兩個(gè)包含音頻信息(Ai)并且可能還包含視頻信息(Vi)的輸入信號(hào)(Si)的裝置,所述裝置包括用于再現(xiàn)第一輸入信號(hào)(S1)的再現(xiàn)裝置(10)、用于確定包含在至少一個(gè)第二輸入信號(hào)(S2)的音頻信息(A2)中的文本信息(T2)的語(yǔ)音識(shí)別裝置(11)以及用于再現(xiàn)所確定的文本信息(T2)的光學(xué)再現(xiàn)裝置(12)。
13.如權(quán)利要求12所述的裝置,其中用于再現(xiàn)輸入信號(hào)(S1)的所述再現(xiàn)裝置(10)和用于再現(xiàn)所確定的文本信息(T2)的所述再現(xiàn)裝置(12)由共用的監(jiān)視器(13)構(gòu)成。
14.如權(quán)利要求12所述的裝置,其中提供了存儲(chǔ)裝置(14),用于存儲(chǔ)所確定的文本信息(T2)。
15.如權(quán)利要求12所述的裝置,其中提供了控制裝置(15),用于選擇所述輸入信號(hào)(Si)。
16.如權(quán)利要求15所述的裝置,其中為信息(Ii)提供了存儲(chǔ)器(16),所述存儲(chǔ)器(16)與所述控制裝置(15)以這樣的方式相連,以便根據(jù)存儲(chǔ)在所述存儲(chǔ)器(16)中的所述信息(Ii)來(lái)選擇所述輸入信號(hào)(Si)。
17.如權(quán)利要求12所述的裝置,其中提供了用于根據(jù)所述第二輸入信號(hào)(S2)的文本信息(T2)切換所述語(yǔ)音識(shí)別裝置(11)的參數(shù)(Pi)的切換裝置(17)。
18.如權(quán)利要求12所述的裝置,其中提供了用于將所述文本信息(T2)與所存儲(chǔ)的文本(TS)相比較的比較單元(18)。
19.如權(quán)利要求18所述的裝置,其中所述比較單元(18)與所述光學(xué)再現(xiàn)單元(12)相連。
20.如權(quán)利要求18所述的裝置,其中提供了用于切換所述輸入信號(hào)(S1,S2)的再現(xiàn)的切換單元,所述切換單元與所述比較單元(18)相連。
21.如權(quán)利要求12所述的裝置,其中用于再現(xiàn)輸入信號(hào)(S1)的所述再現(xiàn)單元(10)由電視接收器(20)構(gòu)成。
全文摘要
為了提供一種用于處理至少兩個(gè)包含音頻信息(Ai)并且可能也包含視頻信息(Vi)的輸入信號(hào)(Si)的方法和裝置,除了再現(xiàn)輸入信號(hào)(S1)之外還能再現(xiàn)至少一個(gè)另外的輸入信號(hào)(S2)的文本信息(T2),本發(fā)明提供用于再現(xiàn)輸入信號(hào)(S1)的再現(xiàn)裝置(10)、用于確定包含在至少一個(gè)第二輸入信號(hào)(S2)的音頻信息(A2)中的文本信息(T2)的語(yǔ)音識(shí)別裝置(11)以及用于再現(xiàn)所確定的文本信息(T2)的光學(xué)再現(xiàn)裝置(12)。再現(xiàn)裝置(10,12)可例如由共用的監(jiān)視器(13)構(gòu)成。
文檔編號(hào)H04N5/45GK1675924SQ03819443
公開(kāi)日2005年9月28日 申請(qǐng)日期2003年8月5日 優(yōu)先權(quán)日2002年8月12日
發(fā)明者L·米拉諾維 申請(qǐng)人:皇家飛利浦電子股份有限公司