專利名稱:音頻/數(shù)據(jù)/視頻信息選擇的方法和裝置的制作方法
背景技術(shù):
發(fā)明領(lǐng)域本發(fā)明一般地涉及音頻/數(shù)據(jù)/視頻信息的選擇系統(tǒng),更具體地涉及過濾如電視、數(shù)據(jù)、或基于互聯(lián)網(wǎng)的信號的音頻/數(shù)據(jù)/視頻信號流的系統(tǒng),且提供在各種內(nèi)容提取水平上的、基于用戶定義的參數(shù)的、已經(jīng)過濾了的信息。
背景信息隨著電視頻道的增加,電視觀眾有一困難的選擇,即看什么電視節(jié)目和當(dāng)看電視時怎樣最好的利用他的時間。由于從印好的和在熒屏上的電視節(jié)目單上不能準(zhǔn)確的判定每一電視節(jié)目的整個內(nèi)容,很多電視觀眾采取“頻道沖浪”來識別哪個電視節(jié)目或部分是“有趣的”。
經(jīng)常,電視觀眾花費大量的時間進(jìn)行頻道沖浪,希望確認(rèn)與他的興趣一致的電視節(jié)目。這會引起觀眾錯過很多他可能喜歡看的電視節(jié)目。例如,如果有廣告在正在“沖浪”的節(jié)目上播出,觀眾要確定正在沖浪的頻道上播出的電視節(jié)目將遇到拖延。因此,將花更多的時間來確定正在播出的節(jié)目是否有趣。結(jié)果,將錯過在其他頻道上播出的有趣的節(jié)目。如果觀眾找到了想要的電視節(jié)目,在播出過程中,他經(jīng)常遇到不感興趣的廣告,從而錯過了正在其他頻道上播出的有趣的節(jié)目。
電視觀眾通常疲于增加的電視頻道的數(shù)目,這些頻道只是在部分時間有有趣的節(jié)目,電視觀眾也厭倦了節(jié)目播出和作頻道沖浪時播出的眾多的廣告。從而,用于瀏覽、聰明地選擇和/或記錄觀眾感興趣播出電視和有線節(jié)目和/或信息的技術(shù)對未來的電視是基本的。
雖然通過使用新的捕捉板和快速處理器在數(shù)字視頻處理上取得的改進(jìn)是明顯的,如何能根據(jù)觀眾的需要來最好地恢復(fù)、分析、分類和傳遞由視頻數(shù)據(jù)傳送的信息這方面沒有什么進(jìn)展。
基于對提供給系統(tǒng)的觀眾信息的電子節(jié)目向?qū)?EPG)數(shù)據(jù)分析的系統(tǒng)近來得到了發(fā)展?;趯PG數(shù)據(jù)的分析,可以提供觀眾感興趣的電視節(jié)目表。然而EPG數(shù)據(jù)是有限的且,不可能對每一視頻畫面或每一電視節(jié)目的片段基于觀眾定義的參數(shù)進(jìn)行不同水平的內(nèi)容分析。
發(fā)明目的和概要本發(fā)明的一個目的是為音頻/數(shù)據(jù)/視頻信息的選擇、儲存和傳送提供一種方法和裝置,克服前面提到的現(xiàn)有技術(shù)的問題。
本發(fā)明的另一個目的是提供一種方法和裝置,該方法和裝置選擇、儲存和傳送音頻/數(shù)據(jù)/視頻信息,它監(jiān)視多個音頻/數(shù)據(jù)/視頻信號,識別個人感興趣的音頻/數(shù)據(jù)/視頻信息,使個人能夠采用經(jīng)過識別的音頻/數(shù)據(jù)/視頻信息。
本發(fā)明的另一目的是提供一種方法和裝置,該方法和裝置只選擇性的記錄與定義的參數(shù)相關(guān)的基于電視的和/或基于互聯(lián)網(wǎng)的信息的片段。
根據(jù)本發(fā)明的一種形式,選擇所需要的有趣的和反映個人在電視節(jié)目方面的愛好和趣味的音頻/數(shù)據(jù)/視頻的信息的方法,其所包含的步驟有確定觀眾的觀看愛好、接收第一多個音頻/數(shù)據(jù)/視頻信號、從第一多個音頻/數(shù)據(jù)/視頻信號中識別待監(jiān)視的第二多個音頻/數(shù)據(jù)/視頻信號,其中第二多個音頻/數(shù)據(jù)/視頻信號是第一多個音頻/數(shù)據(jù)/視頻信號的子集,將觀看愛好與第二多個音頻/數(shù)據(jù)/視頻信號進(jìn)行比較,識別所需要的音頻/數(shù)據(jù)/視頻信息,以及為所需要的音頻/數(shù)據(jù)/視頻信息提供存取。
根據(jù)本發(fā)明的另一方面,一種選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法包含的步驟有確定使用者的愛好、接收多個音頻/數(shù)據(jù)/視頻信號、將愛好與多個音頻/數(shù)據(jù)/視頻信號相比較以識別所需要的音頻/數(shù)據(jù)/視頻信息,并為所需要的音頻/數(shù)據(jù)/視頻信息提供存取。
根據(jù)本發(fā)明的另一方面,音頻/數(shù)據(jù)/視頻信息的選擇系統(tǒng)包括一用來提供觀眾的觀看愛好的輸入裝置和一個信息選擇器。信息選擇器接收第一多個音頻/數(shù)據(jù)/視頻信號,從第一多個音頻/數(shù)據(jù)/視頻信號中識別待監(jiān)視的第二多個音頻/數(shù)據(jù)/視頻信號,其中第二多個音頻/數(shù)據(jù)/視頻信號是第一多個音頻/數(shù)據(jù)/視頻信號的子集。信息選擇器還將觀看愛好與第二多個音頻/數(shù)據(jù)/視頻信號進(jìn)行比較,識別所需要的音頻/數(shù)據(jù)/視頻信息,以及為已識別的音頻/數(shù)據(jù)/視頻信息提供存取。
根據(jù)本發(fā)明的另一方面,這一音頻/數(shù)據(jù)/視頻信號的選擇系統(tǒng)包括一用來提供用戶的觀看愛好的輸入裝置和一個信息選擇器。信息選擇器接收多個音頻/數(shù)據(jù)/視頻信號,將比較愛好與多個音頻/數(shù)據(jù)/視頻信號來識別所需要的音頻/數(shù)據(jù)/視頻信號,并為已識別的音頻/數(shù)據(jù)/視頻信號提供存取。
本發(fā)明的以上和其他的目的、特性和優(yōu)點將容易的從下面的細(xì)節(jié)描述中顯現(xiàn)出來,將它與附圖結(jié)合在一起閱讀。
優(yōu)選實施例詳述本發(fā)明提供一音頻/數(shù)據(jù)/視頻信息選擇系統(tǒng)(“電視搜索系統(tǒng)”),它監(jiān)視多個電視的或基于互聯(lián)網(wǎng)的音頻/數(shù)據(jù)/視頻信號。系統(tǒng)選擇和記錄基于觀眾的觀看愛好的有趣的音頻/數(shù)據(jù)/視頻信息。例如,當(dāng)某人想看涉及一定主題的電視節(jié)目時,他不需要知道電視節(jié)目、播出時間和/或電視的頻道。更進(jìn)一步,他不需要在電視節(jié)目播出的時間在場。本發(fā)明的系統(tǒng)可為他想看的節(jié)目、人物、特征、主題和事件建立可編程的愿望表。而后系統(tǒng)對在愿望表中所列的項目,連續(xù)地監(jiān)視接收到的電視信號,記錄滿足愿望表中的判據(jù)的整個電視節(jié)目或其部分,使能夠存取所記錄的項目,以便觀眾在方便的時間觀看。
根據(jù)本發(fā)明的音頻/數(shù)據(jù)/視頻信號選擇系統(tǒng)可以包含在計算機或電視中,或它可以是與電視或計算機相連接的單獨的裝置,它在接收電視、廣播或基于互聯(lián)網(wǎng)的信號中“沖浪”并將所需要的節(jié)目片段記錄在本地的存儲裝置中。節(jié)目片段的選擇是基于廣播和有線電視或互聯(lián)網(wǎng)的信號的內(nèi)容數(shù)據(jù)。內(nèi)容數(shù)據(jù)可以包括封閉的字幕文字(closed-captioned text)、EPG數(shù)據(jù)(它可以是元-數(shù)據(jù)的形式)、音頻信息(如頻率、音調(diào)、音質(zhì)、音響和旋律)、視頻信息(例如顏色、運動、形狀、和2-維/3-維物體的外觀)和譯寫信息。
雖然本發(fā)明在此文描述的應(yīng)用與電視廣播信號相關(guān),可以預(yù)見,系統(tǒng)可采用可存取因特網(wǎng)的計算機以便搜索基于互聯(lián)網(wǎng)的信號的為觀眾感興趣的信息(例如作為互聯(lián)網(wǎng)爬蟲或電視網(wǎng)的入口),采用用于個性化的收音應(yīng)用的收音機以便搜索特定的形式音頻信號、信息網(wǎng)絡(luò)(如有私有權(quán)的網(wǎng)絡(luò)和個人的區(qū)域網(wǎng)絡(luò)),以及用于僅僅傳送數(shù)據(jù)信息的系統(tǒng)。
現(xiàn)在來看附
圖1,顯示的是音頻/數(shù)據(jù)/視頻信息的選擇裝置10。裝置優(yōu)選地與視頻監(jiān)視器12相連接,如電視機。裝置包括個人簡介的輸入裝置14(例如一個鍵區(qū),鍵盤,屏幕顯示,電視遙控,觸摸屏,口頭命令接收器或觸摸板),通過它,用戶可以輸入個人觀看愛好。觀看愛好與用戶想看(和/或以前看過的)的電視節(jié)目的特性相關(guān)。一些觀看愛好的實例包括運動隊(例如紐約Yankees),人物(例如,總統(tǒng)比爾·克林頓),地方(比如,白宮),動作(比如擊球手打出本壘打),以及主題(比如世界錦標(biāo)賽)?;谒杏脩籼峁┑臄?shù)據(jù),用戶觀看愛好的簡介產(chǎn)生了。如下面詳細(xì)解釋的,監(jiān)視電視信號至少用于得到與觀看愛好有關(guān)的廣播的片段。例如如果一觀看愛好是“紐約Yankees”,本發(fā)明將記錄整個紐約Yankees的棒球賽,而沒有廣告,除非廣告是與紐約Yankees有關(guān)的,任何涉及紐約Yankees的電影(例如“Yankees的驕傲”)和播出了前一夜的紐約揚基棒球比賽的精彩場面的新聞的體育部分/體育節(jié)目。
也可以預(yù)見該裝置具有儲存于存儲器中的個人的簡介,其具有多個主題,因此用戶不需要輸入特定的觀看愛好,而只需輸入與預(yù)定的觀看愛好典型相關(guān)的數(shù)字(例如,“1”代表體育,“2”代表地方新聞,“3”代表國內(nèi)新聞,“4”代表世界新聞,“5”代表政治,“6”代表科學(xué)小說,等等)。結(jié)果,用戶不需要為系統(tǒng)輸入大量的信息來提供寬范圍的需要的信息。
裝置還包括一個音頻/數(shù)據(jù)/視頻信號的接收器16,用于接收待分析的多個電視信號。不是過濾掉除電視機顯示的一個信號外的所有信號,接收器16有多個調(diào)諧器并保持所有信號以進(jìn)行分析。合適的音頻/數(shù)據(jù)/視頻信號接收器包括天線、衛(wèi)星碟形天線、機頂盒、互聯(lián)網(wǎng)連接、電纜等等。如本領(lǐng)域中公知的,提供給接收器的廣播和有線電視信號是復(fù)用的信號。
可操作地連接到音頻/數(shù)據(jù)/視頻信號接收器16輸出的是一個復(fù)用信號分離器18,用來分離由音頻/數(shù)據(jù)/視頻信號接收器接收的復(fù)用的多個電視信號。信號分離器分離多個信號且能單獨地分析多個電視信號的每一個,其細(xì)節(jié)在下面解釋。
在優(yōu)選實施方案中,裝置包括一個EPG(電子節(jié)目向?qū)?信號接收器20,用于接收與多個電視信號有關(guān)的電子節(jié)目向?qū)盘枴H绫绢I(lǐng)域中公知的,EPG信號包括大量種類的信息,這些信息是關(guān)于正播出的電視節(jié)目和待播出的電視節(jié)目。EPG信息的實例包括標(biāo)題、開始時間、結(jié)束時間、演員(如果適用)、主題、節(jié)目和種類及節(jié)目簡述。合適的EPG信號接收器包括天線,衛(wèi)星碟形天線、機頂盒、互聯(lián)網(wǎng)的連接等等。可以預(yù)見,EPG信號接收器和音頻/數(shù)據(jù)/視頻信號接收器可以結(jié)合在一個裝置里,其中結(jié)合在一起的裝置可在用于接收音頻/數(shù)據(jù)/視頻信號的第一種模式和用于接收EPG信號的第二種模式之間切換。另外,裝置可以同時接收音頻/數(shù)據(jù)/視頻信號和EPG信號。
該裝置也包括一音頻/數(shù)據(jù)/視頻信息選擇器22,它從EPG信號接收器20接收EPG信號、從信號分離器18接收經(jīng)過信號分離的電視信號和通過個人簡介輸入裝置14接收觀眾的愛好。音頻/數(shù)據(jù)/視頻信息選擇器分析經(jīng)過信號分離的基于它們的內(nèi)容數(shù)據(jù)(下面詳細(xì)解釋)的音頻/數(shù)據(jù)/視頻信號,用來識別用戶感興趣的電視廣播的相關(guān)的EPG信號和觀看愛好。信息可以是完整的電視節(jié)目或如果EPG數(shù)據(jù)指示僅是電視節(jié)目的片段與觀看愛好符合它可能只是電視節(jié)目的一個片段。重要的是注意音頻/數(shù)據(jù)/視頻信息選擇器是優(yōu)選地能夠同時分析每一個提供給它的電視信號,以便能并行地監(jiān)視電視信號,并將經(jīng)過音頻/數(shù)據(jù)/視頻信息選擇器識別的電視信號記錄在存儲器中??删幊虒崿F(xiàn)音頻/數(shù)據(jù)/視頻信息選擇器的功能的合適的裝置的實例是一個人計算機的CPU(例如,奔騰或MIPS),一特殊的可編程數(shù)字信號處理器(如三媒體)或一特殊配置的芯片結(jié)構(gòu)。后面將詳細(xì)解釋音頻/數(shù)據(jù)/視頻信息選擇器的工作。
可操作地與音頻/數(shù)據(jù)/視頻信息選擇器22相連接的是存儲器24(例如,RAM,硬盤記錄器,光學(xué)的存儲裝置,或DVHS,每一個都有數(shù)百千兆字節(jié)的存儲能力)用來記錄由音頻/數(shù)據(jù)/視頻信息選擇器22識別的與觀看愛好相一致的電視廣播或其部分。當(dāng)用戶要求時,音頻/數(shù)據(jù)/視頻信息選擇器可以存取儲存于存儲器中的音頻/數(shù)據(jù)/視頻信息,并提供信息到視頻監(jiān)視器12,以讓用戶回顧。
現(xiàn)在來看圖2,描述了用于音頻/數(shù)據(jù)/視頻信息選擇、儲存和傳送的裝置的工作。
開始,用戶通過個人的簡介輸入裝置14(步驟100)來輸入個人簡介。個人簡介與用戶的觀看愛好相關(guān),諸如觀眾想要看的特定形式的電視節(jié)目、人物或電視節(jié)目的觀點。信息可由多種方法提供,例如,信息可以通過個人簡介輸入裝置14輸入。另外,信息可以通過電視機上的一個屏上向?qū)л斎牖蛲ㄟ^視頻監(jiān)視器12借助傳統(tǒng)的電視遙控裝置上的箭頭鍵輸入。作為上面的替代,所有用戶的簡介信息可以自動地產(chǎn)生,其中個人簡介輸入裝置監(jiān)視用戶的觀看習(xí)慣,以及通過人工智能,“學(xué)習(xí)”個人的觀看愛好??梢灶A(yù)見用戶簡介可以基于用戶習(xí)慣或改變觀看興趣而得到發(fā)展。也可預(yù)見信息選擇器或輸入裝置監(jiān)視著用戶改變觀看習(xí)慣和自動地更新觀看愛好(步驟101)。例如,如果用戶以前只看體育事件,但最近已觀看經(jīng)濟新聞頻道,系統(tǒng)將修改原始的觀看愛好(體育事件)以把經(jīng)濟新聞包括進(jìn)去。個人簡介輸入裝置優(yōu)選地將“學(xué)來的”觀看習(xí)慣存儲到一內(nèi)部的存儲器中(未顯示)??商娲兀皩W(xué)來的”觀看習(xí)慣存在存儲器24中。也可預(yù)見用戶可選擇基于他的最相配的預(yù)-儲存的簡介中一個。
音頻/數(shù)據(jù)/視頻信號接收器16接收觀眾可用的音頻/數(shù)據(jù)/視頻電視信號(例如,那些需通過當(dāng)?shù)氐挠芯€電視或衛(wèi)星服務(wù)訂閱的頻道)(步驟102),該電視信號用信號分離器18進(jìn)行信號分離(步驟104)并提供給音頻/數(shù)據(jù)/視頻信息選擇器22(步驟106)。EPG信號通過EPG信號接收器20接收,然后,提供給音頻/數(shù)據(jù)/視頻信息選擇器22(步驟106)。
音頻/數(shù)據(jù)/視頻信息選擇器22對接收到的電視信號實施一初始的選擇過程。對每一接收到的電視信號,將其與EPG數(shù)據(jù)相關(guān)的部分與觀看愛好相比較,以決定哪些電視節(jié)目與觀看愛好根本無關(guān)(步驟108)。那些與觀看愛好無關(guān)的電視節(jié)目不受監(jiān)視。結(jié)果,接收到的電視信號的子集(電視節(jié)目)被保存下來,用于進(jìn)一步分析并與觀看參數(shù)相符合。EPG數(shù)據(jù)的使用只是過濾的第一級以消除那些明顯的與用戶的觀看愛好完全無關(guān)的電視節(jié)目。例如,當(dāng)正在播放“飄”時,如果一電視信號的EPG數(shù)據(jù)識別出相應(yīng)的電視頻道,而用戶的觀看愛好與“棒球”或“股市”有關(guān),就沒有必要當(dāng)這一頻道在播電影時監(jiān)視這一頻道??墒牵?dāng)正播報新聞時,如果另一電視信號的EPG數(shù)據(jù)識別出相應(yīng)的頻道,監(jiān)視這一頻道可能是恰當(dāng)?shù)?,因為可能將討論前一夜的棒球分?jǐn)?shù)和當(dāng)天的經(jīng)濟新聞。
應(yīng)該指出,如果沒有EPG數(shù)據(jù)可用來確定所接收到的待分析的電視信號子集,那么音頻/數(shù)據(jù)/視頻信息選擇器開始監(jiān)視一組在觀看愛好中識別出來的優(yōu)選的頻道或觀眾經(jīng)常觀看的頻道。如果對音頻/數(shù)據(jù)/視頻信息選擇器的計算資源沒有限制,那么所有可得到的頻道將同時被監(jiān)視。
還應(yīng)該指出,將周期性的檢查未被監(jiān)視的電視節(jié)目(即,回顧)以保證在相應(yīng)的頻道上的節(jié)目沒有變化和現(xiàn)在沒有播出與觀看愛好相符合的節(jié)目。
一旦電視頻道的子集被選擇,每一電視頻道的子集被連續(xù)地并行分析以確定目前播出節(jié)目的某一(如果任何)部分是否對應(yīng)于觀看愛好(每一電視節(jié)目被同時分析)。該分析包括從待分析的每一電視節(jié)目中(步驟110)提取封閉的字幕文字或譯寫的(tanscribed)文字。提取的封閉的字幕或譯寫的文字被編成索引(步驟112)。更明確地,如在本領(lǐng)域中公知的,編索引包括監(jiān)視文字中字的出現(xiàn)頻率以便為節(jié)目的主題事物提供指示。編索引解釋在由G.Salton和M.J.Mcgill所著,于McGraw-Hill,NY,NY,1983,題為“Introduction to ModernInformation Retrieval(現(xiàn)代信息檢索介紹)”;由James Allen所著,于The Benjamin/Cummings Publishing Company,Inc.,1995,題目為“Natural Language Understanding(自然語言理解)”;以及由Inderjeet Mani和Mark T.Maybury編輯,于MIT Press,Cambrige,MA,1999,題目為“Advances in Automatic TextSummarization(自動文字總結(jié)的進(jìn)步”,其整個公開內(nèi)容在此引入作為參考。分析索引的文字以決定特定的字是否在與觀看愛好相聯(lián)系的節(jié)目中頻繁使用(步驟114)。如果在電視節(jié)目中頻繁出現(xiàn)的字確實與觀看愛好是一致的,那么節(jié)目或相應(yīng)的片段應(yīng)該被標(biāo)記并進(jìn)行進(jìn)一步的分析或記錄。
在文字摘要和索引的同時,對電視節(jié)目中廣告的出現(xiàn)進(jìn)行監(jiān)視(步驟116)。如果觀看愛好不包括對廣告的興趣,當(dāng)廣告在正被分析頻道的其中一個播出時,本發(fā)明不分析廣告,因此系統(tǒng)的資源可以集中關(guān)注無廣告的電視的播出。另外如果需要廣告,可將所有廣告儲存在存儲器中以便以后分析。
該方法也包括電視信號的視頻部分的分割(步驟118),以分析電視節(jié)目的視頻畫面。在優(yōu)選實施方案中,每一正被監(jiān)視的節(jié)目的每一視頻畫面都被分析(即,在美國,每秒分析30個視頻畫面)。視頻分割在本領(lǐng)域是公知的且一般地解釋在由T.McGee和N.Dimitrova所著,于Proc.SPIE Conf.on Storage and Retrieval for Imageand Video Databases,pp.243-251,San Jose,CA,January,1999,題為“Parsing TV Programs For Identification and Removal ofNon-Story Segments”(用于識別和除去非-故事片段的電視節(jié)目分析)的出版物中;由N.Dimitrova,H.Elenbass和T.McGee所著,于SPIEConference on Multimedia Storage and Archiving SystemsIV,pp.2-10,September 1999,Boston,題目為“PNRS-Personal NewsRetrieval System”(PNRS-個人新聞檢索系統(tǒng));以及由A.Hauptmann和M.Smith所著,于AAAI Fall 1995 Symposium on ComputationalModels for Integrating Language and Vision 1995,題目為“Text,Speech,and Vision For Video SegmentationTheInfomedia Project”。其整個公開內(nèi)容在此引入作為參考。如果用戶的觀看愛好指示出愿意觀看關(guān)于John F.Kennedy為主題的事件,包括與John F.Kennedy相關(guān)的視頻(如面部)和/或文字信息的電視節(jié)目的視頻部分的任何片段將顯示目前的播出與觀眾的觀看愛好相關(guān)。如在本領(lǐng)域公知的,視頻分割包括,但也不限于切換(cut)檢測其中兩個連續(xù)的視頻畫面被比較,以便識別突然的場景變化(硬切換)或軟過渡(漸隱畫面,淡入、淡出)。切換檢測的解釋提供在由N.Dimitrova,T.McGee,H.Elenbaas所著,于Proc.ACM Conf.Knowledge and Information Management,pp.113-120,1997,題為“Video KeyframeExtraction and FilteringA Keyframe is Not a Keyframe to Everyone(視頻關(guān)鍵畫面的提取和過濾關(guān)鍵畫面并不對每個人都是關(guān)鍵畫面)”的出版物中,其整個公開內(nèi)容在此引入作為參考。
面部檢測其中包括皮膚-特性以及與橄欖形對應(yīng)視頻畫面區(qū)域被識別,在優(yōu)選實施方案中,一旦面部圖像被識別出來,即將該圖象與儲存在存儲器中的已知的面部的圖象的數(shù)據(jù)庫相比較,以確定顯示在電視畫面的面部的圖象是否與用戶的觀看愛好相關(guān)。面部檢測的解釋提供在由Gang Wei和Ishwar K.Sethi,所著,于PatternRecongnition Letters,Vol.20,No.11,November 1999,題為“FaceDetection for Image Annotation(用于圖象注釋的面部檢測)”的出版物中,其整個公開內(nèi)容在此引入作為參考。
文字檢測其中出現(xiàn)在視頻畫面中的文字例如被覆蓋或重疊的文字被識別并確定文字是否與用戶的觀看愛好相關(guān)。文字檢測的解釋提供在由作者L.Agnihotri和N.Dimitrova所著,于與IEEEConference on Computer Vision and pattern Recognition(計算機視覺和圖形識別大會)1999一起召開的Proceeding of IEEEWorkshop on CBAIVL,F(xiàn)ort Collins,Colorado,June 1999,題為“Text Detection in Video Segment(視頻片段中的文字檢測)”的文章中,其整個公開內(nèi)容在此引入作為參考。在優(yōu)選實施方案中,一旦文字被檢測到,在本領(lǐng)域公知的光學(xué)字符識別(OCR)被用在被檢測的區(qū)域,并且用儲存在存儲器中的查詢表來識別被檢測的文字。查詢表優(yōu)選地包括各種字之間的關(guān)聯(lián)。例如,“比爾·克林頓”可以與“美國總統(tǒng)”和“政治”、“白宮”、“莫妮卡萊溫斯基”和“白水”相關(guān)聯(lián)。
運動判斷/分割/檢測其中,確定在視頻序列中運動的物體以及分析運動物體的軌跡。為了確定在視頻序列中物體的運動,公知的操作如光流判斷、運動補償和運動分割被優(yōu)選地采用。運動判斷/分割/檢測的解釋提供在由作者Patrick Bouthemy和Francois Edouard所著,于International Journal of Computer Vision,Vol.10,No.2,pp.157-182,April 1993,題為“Motion Segmentationand Qualitative Dynamic Scene Analysis from an ImageSequence”(視頻序列的運動分割和定性動態(tài)場景分析)一文中,其整個公開內(nèi)容在此引入作為參考。
攝像機的運動其中使用了一組五(5)個萬向攝像機參數(shù),優(yōu)選的兩(2)個平移和三(3)個轉(zhuǎn)動。3-維攝像機運動被分成純追蹤(水平運動)、吊桿上下移攝像機(垂直運動)、攝影車移動(在深度方面的運動)、搖攝(繞垂直萬向軸的旋轉(zhuǎn))、傾斜(繞水平萬向軸的旋轉(zhuǎn))、和滾動(繞Z軸的旋轉(zhuǎn))或這些運動的組合。這一信息可被用來將視頻鏡頭分類成如“靜止的”、“變焦的”和/或“跨距”,而進(jìn)一步確定導(dǎo)演制作鏡頭的意圖。攝像機運動的信息被用來分類這樣以致于如果當(dāng)EPG數(shù)據(jù)不可用時,可以基于攝像機運動來確定節(jié)目的種類。攝像機運動檢測提供在由作者R.Y.Tasi和T.S.Huang所著,于IEEE Transaction on PAMI,Vol.6,number 1,pp.13-27,1994,題為“Uniqueness and Estimation of Three-DimensionalMotion Parameters of Rigid Objects with Curved Surfaces(具有曲線表面的剛性物體的三維運動參數(shù)的唯一性及判斷)”中,其整個公開內(nèi)容在此引入作為參考。
該方法也包括電視信號的音頻部分的分割(步驟120),其中電視廣播中的音頻部分被監(jiān)測以便監(jiān)測與觀看愛好相關(guān)的字/聲的出現(xiàn)。音頻分割包括以下電視節(jié)目分析類型語音到文字的轉(zhuǎn)換、音頻效果和事件檢測、說話者的識別、節(jié)目的識別、音樂分類和基于說話者識別的對話檢測。
音頻分割包括將音頻信號分離成語音和非語音部分。音頻分割的第一步涉及采用低-級的音頻特征如帶寬、能量和音調(diào)的片段分類。此后頻道分離被用來將同時發(fā)生的每一音頻成分(如音樂和語音)相互分離開,從而對每一個可單獨的加以分析。此后,電視節(jié)目的音頻部分用不同的方法進(jìn)行處理,如語音到文字的轉(zhuǎn)換、音頻的效果和事件的檢測以及說話者的識別。音頻分割在本領(lǐng)域是公知的,并且一般的解釋在由E.Wold和T.Blum所著,于IEEE Multimedia,pp.27-36,F(xiàn)all 1996,題為“Content-Based Classification,Search,and Retrieval of Audio”(基于內(nèi)容的音頻的分類、搜索、和檢索)的出版物中,其整個公開內(nèi)容在此引用作為參考。
一旦電視信號的音頻部分的語音片段從背景噪聲或音樂中被識別或隔離出來,就可以進(jìn)行語音到文字的轉(zhuǎn)換(本領(lǐng)域所公知的,例如,請看由P.Beyerlein,X.Aubert,R.Haeb-Umbach,D.klakow,M.Ulrich,A.Wendemuth和P.Wilcox所著,于DARPA Broadcast NewsTranscription and Understanding Workshop,VA,8-11,1998,題目是“Automatic Transcription of English Broadcast News(英語廣播新聞的自動譯寫)”的出版物,其整個公開內(nèi)容在此引用作為參考)。如果沒有封閉的字幕可用來提供電視節(jié)目的音頻部分的錄制,語音到文字的轉(zhuǎn)換就是重要的。語音到文字的轉(zhuǎn)換可以用于如關(guān)于觀看愛好的關(guān)鍵字的識別上。
音頻效果可以用來檢測事件(本領(lǐng)域公知的,例如見由T.Blum,D.Keislar,J.Wheaton,和E.Wold發(fā)表,于IntelligentMultimedia Information Retrieval,AAAI Press,Menlo Park,California,pp.113-135,1997,題為“Audio Databases withContent-Based Retrieval”(具有基于內(nèi)容的檢索的音頻數(shù)據(jù)庫)出版物,整個公開內(nèi)容在此引用作為參考)。事件可以由識別可能與特定事件相關(guān)的聲音而得到檢測。例如,在體育事件中一人大聲喊的“射門”可以被檢測到,如果觀看參數(shù)包括曲棍球或足球的射門重放,那么節(jié)目片段可以被紀(jì)錄在存儲器中。
說話者的識別(本領(lǐng)域公知的,例如見由Nilesh V.Patel和Ishwar K.Sethi發(fā)表,于IS&T SPIE ProceedingStorage andRetrieval for Image and Video Databases V,pp.218-225,SanJose,CA,F(xiàn)ebruary 1997,題為“Video Classification UsingSpeaker Identification”(利用說話者的識別的視頻分類)的出版物,其整個公開內(nèi)容在此引用作為參考)涉及分析出現(xiàn)在音頻信號中語音的的聲音特征,以確定正在說話的人的身份。說話者的識別可以被用來,例如,尋找喜歡的演員或政治人物的評論。
節(jié)目識別涉及分析音頻/數(shù)據(jù)/視頻信號的音頻部分來識別電視節(jié)目。這在節(jié)目的編寫目錄和編寫索引上特別有用。如果EPG信息是不可用的,這就是很重要的了。已被分析的音頻部分與節(jié)目特性庫去比較,以便識別節(jié)目以確定該節(jié)目是否與觀看參數(shù)一致。
音樂的分類涉及分析音頻信號的非-語音部分,以確定出現(xiàn)的音樂類型(古典、搖滾、爵士等等)。這通過分析例如音頻信號非-語音部分的頻率、音調(diào)、音色、聲響和旋律且將分析結(jié)果與特定音樂類型的已知特性進(jìn)行比較來實現(xiàn)。音樂分類在本領(lǐng)域是公知的,且一般解釋在由Eric D.Scheirer所著,于1999 IEEE Workshop onApplications of Signal Processing to Audio and Acoustics,NewPaltz,NY October 17-20,1999,題為“Towards Music UnderstandingWithout SeparationSegmenting Music With CorrelogramComodulation”(無分離的音樂理解采用相關(guān)圖共調(diào)制分割音樂)的文中。
在音頻和視頻信號分割之后,已被分割的音頻和視頻信號的不同部分被結(jié)合(步驟121),如果合適,確定目前的電視節(jié)目是否與觀看參數(shù)相符合。已被分割的音頻和視頻信號的結(jié)合對復(fù)雜的觀看參數(shù)是必要的。例如,如果觀眾想要看特定演員說一特定的臺詞,同時做一特定的手勢,不只是需要面部的識別(識別演員),而且也需要說話者的識別(保證屏幕上的演員正在說話)、語音到文字的轉(zhuǎn)換(保證演員說合適的詞)和運動判斷/分割/檢測(識別特定的演員的手勢)。
如以上所解釋的,同時存在的視頻和音頻的分割,已被分割的音頻和視頻信息被結(jié)合(如果適用)且與觀看愛好相比較(步驟122)。之后確定一特定頻道上的當(dāng)前的節(jié)目是否與觀看愛好一致。如果是,在優(yōu)選的實施方案中,依照與觀看愛好的一致性程度,節(jié)目被進(jìn)行分級(步驟123),且只要當(dāng)前的節(jié)目與用戶的觀看愛好一致即被記錄在存儲器中(步驟124)。分級涉及將與用戶最喜歡觀看參數(shù)一致的視頻的片段放在存儲器的第一位,以及將那些涉及最不喜歡的觀看愛好放在存儲器的最后。用這種方法,當(dāng)觀眾看錄下的節(jié)目片段時,最高級別的將被首先回顧。
如果在本發(fā)明正在工作的同時用戶在看另一電視演出,用戶可以被同時通知一個有趣的電視演出正在一特定的頻道上播出(步驟126)。一旦觀眾請求,錄下的節(jié)目片段可被檢索并提供給用戶觀看。(步驟128)。
如上面提到的,可以預(yù)見,音頻和視頻分割的部分(由核心AV模塊確定)可以利用中-級和高-級的模塊而結(jié)合(即,組合)以確定在電視節(jié)目中的特定事件。核心AV模塊包括提供獨立的音頻和視頻分析的視頻和文字模塊。這些模塊本身包括多個處理單元。核心AV模塊的主要目的是提取更低-級的特征,它們可用作給組合模塊(中-級和高-級工具)的輸入,用于推斷出與電視節(jié)目內(nèi)容的語義描述類似的較高-級的決定?;镜囊曨l屬性是顏色、運動、形狀和結(jié)構(gòu)。這些屬性的每一個由操作符的一個大的集合來描述,它們的范圍從局部操作符和區(qū)域/全局操作符。這些操作符是基本數(shù)據(jù)單元,因為它們各自相互獨立地被處理且它們是任務(wù)獨立的。這個中-級和高-級組合模塊的集合包括結(jié)合來自AV模塊不同元素的工具。組合模塊的目的是從內(nèi)容數(shù)據(jù)中提取高-級信息。這涉及更低-級特征的多模式組合。中-級工具(模塊)典型地用來描述目標(biāo)各部分與音頻/數(shù)據(jù)/視頻屬性之間的關(guān)系。高-級工具被用來識別/結(jié)合/處理目標(biāo)。這些模型可以是靜止的或動態(tài)的。動態(tài)模型是及時更新的。
高級信息與中-級信息的區(qū)別是,在循環(huán)中前者存在一個判定過程。這意味著,模塊的內(nèi)部,存在一個過程,用于決定用哪個核心AV模塊以及在什么樣的條件使用。高-級模塊典型的實例是動作、事件檢測/識別、故事分割和分類、節(jié)目分類、和環(huán)境(context)檢測。
如果觀看愛好是一個演員的一個特定的動作(例如,開門和進(jìn)入房間),中-級或高-級的模塊將被使用,因為不只是用到面部的檢測和/或音頻的識別被用到,而且,運動檢測被用來找出特定演員的動作的確切的位置來確定演員的動作是否與觀看參數(shù)相對應(yīng)。結(jié)果,使用多個判斷循環(huán)來分析電視節(jié)目。
可以預(yù)見本發(fā)明能夠發(fā)展出整個節(jié)目的視頻的概要,以使用戶看到的所記錄的片段可以在節(jié)目的環(huán)境中觀看到(即,一個“抓獲”功能)。視頻概要可用關(guān)鍵畫面圖象和封閉的字幕發(fā)展,以提供未被錄制的節(jié)目部分的指示。
也可以預(yù)見每當(dāng)一特定的用戶看電視時觀看愛好可以被自動的更新。這一點的實現(xiàn),是基于觀眾花在觀看一定的節(jié)目(節(jié)目的種類)的時間以及節(jié)目的視頻和其他的特性(如,動作、明亮的顏色)。父母的控制可以增加進(jìn)來,以基于節(jié)目的內(nèi)容過濾掉部分電視節(jié)目或整個節(jié)目。本發(fā)明可以檢測電視節(jié)目中有裸體、暴力或淫穢的詞的場面并防止節(jié)目的那些部分被未成年人觀看。
可以預(yù)見,當(dāng)觀眾正在看電視時,系統(tǒng)可以就對錄下的信息為觀眾提供更新。換句話,當(dāng)觀眾正在看另一電視頻道時,觀眾將被通知與觀看參數(shù)相匹配的電視片段已被記錄下來。也可以預(yù)見如果用戶正在看電視節(jié)目,而系統(tǒng)識別出某一個電視節(jié)目有趣,用戶將被實時通知檢測到有趣的節(jié)目。進(jìn)一步,可以預(yù)見系統(tǒng)可對存儲器執(zhí)行每天/每周的自動儲存清除功能,以便基于觀看愛好管理存儲空間。在優(yōu)選的實施方案中,系統(tǒng)也包括一種時間抓獲功能。具體地,當(dāng)某人正在進(jìn)行電視頻道的沖浪且碰到一個有趣的節(jié)目,他可以通過瀏覽“一個提取的海報”(或摘要,預(yù)告)“抓獲”有趣的節(jié)目。
本發(fā)明因此提供一“視頻搜索系統(tǒng)”,其中,當(dāng)某人想要觀看一定類型的電視節(jié)目或只是想看特定的信息時,本發(fā)明建立一種用于觀眾想看的節(jié)目、主題和事件的可編程的愿望表。
雖然本發(fā)明已討論了有關(guān)為觀眾位置上的觀眾尋找想要的電視節(jié)目和電視節(jié)目的片段/信息,一視頻經(jīng)紀(jì)行服務(wù)(brokerage houseservice〕可以被用來根據(jù)要求過濾和傳送特定的視頻片段。因此系統(tǒng)也許不放置在用戶端,但是,例如,在有線電視提供者端和系統(tǒng)可用于多個用戶同時操作。
本發(fā)明應(yīng)用和改進(jìn)現(xiàn)有的技術(shù),如視頻分割、視頻分析、語音識別、字符識別及目標(biāo)是別,用于在視頻流中發(fā)現(xiàn)線索,以提供一個性化的視頻信息識別系統(tǒng)。
還可以預(yù)見,可以本發(fā)明被采用來監(jiān)視和記錄觀眾對特定的節(jié)目的反饋和興趣。收集的信息對推出新的節(jié)目、新的產(chǎn)品、新的電影和特定事件的制作是有價值的。本發(fā)明能夠捕捉每個觀眾的興趣。由個人使用的裝置越多,就會更能夠適合于用戶的不同的興趣。本發(fā)明因此建立隨時間變化的關(guān)于個人興趣的信息模型,這種變化可以是用戶變化,也可是系統(tǒng)所需要的更多的關(guān)于用戶的信息。這種信息對廣告人和廣播公司是有用的。視頻過濾系統(tǒng)通過視頻分析處理,能夠生成完整的電影或電視節(jié)目的可瀏覽的編排。進(jìn)一步,本發(fā)明允許個人預(yù)看和預(yù)聽作為一多媒體的顯示的電視節(jié)目的內(nèi)容。這可通過分割視頻、分析它的內(nèi)容和提供給用戶由原始和合成的畫面構(gòu)成的可瀏覽的編排,以及重要的對話的片段來實現(xiàn)。
通過參考相關(guān)的附圖,描述了本發(fā)明的特定的優(yōu)選實施方案,應(yīng)當(dāng)理解本發(fā)明不限于那些精確的實施方案,其中本領(lǐng)域的普通的技術(shù)人員可實施各種變化和修改而不違背本發(fā)明所附帶的權(quán)利要求中所述范圍或精神。
權(quán)利要求
1.一種選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,包括的步驟有(a)確定觀眾的觀看愛好(100);(b)接收第一多個音頻/數(shù)據(jù)/視頻信號(102);(c)從第一多個音頻/數(shù)據(jù)/視頻信號中識別待監(jiān)視的第二多個音頻/數(shù)據(jù)/視頻信號,其中第二多個音頻/數(shù)據(jù)/視頻信號是第一多個音頻/數(shù)據(jù)/視頻信號的子集(108);(d)將所述觀看愛好與第二多個音頻/數(shù)據(jù)/視頻信號進(jìn)行比較,以識別所需要的音頻/數(shù)據(jù)/視頻信息(122);以及(e)為所需要的音頻/數(shù)據(jù)/視頻信息提供存取(124)。
2.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信號的方法,還包括的步驟有儲存所需要的音頻/數(shù)據(jù)/視頻信息(124);以及當(dāng)觀眾要求時檢索所需要的音頻/數(shù)據(jù)/視頻信息(128)。
3.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,步驟(d)包含的步驟有提取相應(yīng)于每一個所述第二多個音頻/數(shù)據(jù)/視頻信號的內(nèi)容數(shù)據(jù)(110);對所述已提取的內(nèi)容數(shù)據(jù)編寫索引(112);以及將所述索引的內(nèi)容數(shù)據(jù)與所述觀看愛好比較以識別所需要的音頻/數(shù)據(jù)/視頻信息(114)。
4.根據(jù)權(quán)利要求3的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,提取的內(nèi)容數(shù)據(jù)包括一封閉的字幕文字、EPG數(shù)據(jù)、音頻內(nèi)容信息、視頻內(nèi)容信息及譯寫的信息中的至少一種。
5.根據(jù)權(quán)利要求4的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,視頻內(nèi)容信息包括切換檢測、面部檢測、文字檢測、運動判斷/分割/檢測和攝像機運動中的至少一種。
6.根據(jù)權(quán)利要求4的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,音頻內(nèi)容信息包括語音到文字的轉(zhuǎn)換、音響效果和事件檢測、說話者的識別、節(jié)目的識別、音樂的分類和基于說話者的識別的對話檢測中的至少一種。
7.根據(jù)權(quán)利要求4的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,所述譯寫的信息包括自然語言處理和理解、話語分析、關(guān)鍵詞檢測和廣播分類中的至少一種。
8.根據(jù)權(quán)利要求4的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有將封閉的字幕文字、EPG數(shù)據(jù)、提取的音頻信息、提取的視頻信息,以及已提取的譯寫的信息中的至少兩種組合(121)。
9.根據(jù)權(quán)利要求8的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,所述組合的步驟提供事件和動作的檢測、故事分割、故事分類、節(jié)目分類以及環(huán)境檢測中的至少一種。
10.根據(jù)權(quán)利要求9的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中所述環(huán)境檢測包括人面部和背景檢測中的至少一種。
11.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中所述所需要的音頻/數(shù)據(jù)/視頻信息包括廣播和有線電視信號、基于互聯(lián)網(wǎng)的信號和數(shù)據(jù)信號中的至少一種。
12.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中步驟(c)包括的步驟有將用于每一個第一多個音頻/數(shù)據(jù)/視頻信息的電子節(jié)目向?qū)?EPG)數(shù)據(jù)與觀看愛好比較,以識別與觀看愛好相聯(lián)系的第二多個音頻/數(shù)據(jù)/視頻信息(108)。
13.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中步驟(a)包括的步驟有借助鍵區(qū)、鍵盤、屏上顯示、遙控、觸摸屏、口頭命令或觸摸板,輸入觀眾想看的音頻/數(shù)據(jù)/視頻信息的特性(100)。
14.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中步驟(a)包括的步驟有監(jiān)視觀眾的觀看習(xí)慣,制定與觀眾想看的音頻/數(shù)據(jù)/視頻信息的特性相應(yīng)的觀看愛好(101)。
15.根據(jù)權(quán)利要求14的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有每次觀眾存取電視廣播信號或基于互聯(lián)網(wǎng)的信號時自動更新觀看愛好(101)。
16.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有識別第二多個音頻/數(shù)據(jù)/視頻信號的廣告和非廣告部分(116)。
17.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有根據(jù)與所述觀看愛好的關(guān)聯(lián)性將音頻/數(shù)據(jù)/視頻信息分級(123)。
18.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中步驟(e)包括的步驟有在存儲器中儲存所述所需要的音頻/數(shù)據(jù)/視頻信息的至少一部分(124)。
19.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有通知觀眾,所需要的音頻/數(shù)據(jù)/視頻信息已被識別出來(126)。
20.根據(jù)權(quán)利要求19的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中當(dāng)觀眾正在與音頻/數(shù)據(jù)/視頻信息交互時,觀眾被通知。
21.根據(jù)權(quán)利要求1的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中所述方法對多個觀眾同時執(zhí)行。
22.選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,包括的步驟有a)確定用戶的愛好(100);b)接收多個音頻/數(shù)據(jù)/視頻信號(102);c)將所述愛好與多個音頻/數(shù)據(jù)/視頻信號比較,以識別所需要的音頻/數(shù)據(jù)/視頻信息(122);以及d)為所需要的音頻/數(shù)據(jù)/視頻信息提供存取(124)。
23.根據(jù)權(quán)利要求22的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,還包括的步驟有選擇多個音頻/數(shù)據(jù)/視頻信號的至少一個與所述愛好比較(108)。
24.根據(jù)權(quán)利要求23的選擇所需要的音頻/數(shù)據(jù)/視頻信息的方法,其中,多個音頻/數(shù)據(jù)/視頻信號中的至少一個的選擇是以隨機地、順序地、和周期地其中至少一種方式實現(xiàn)的。
25.一種音頻/數(shù)據(jù)/視頻信號選擇系統(tǒng),包括一個輸入裝置(14),用于提供觀眾的觀看愛好;以及一個信息選擇器(22)用于接收第一多個音頻/數(shù)據(jù)/視頻信號從第一多個音頻/數(shù)據(jù)/視頻信號中識別待監(jiān)視的第二多個音頻/數(shù)據(jù)/視頻信號,其中第二多個音頻/數(shù)據(jù)/視頻信號是第一多個音頻/數(shù)據(jù)/視頻信號的子集;將所述觀看愛好與第二多個音頻/數(shù)據(jù)/視頻信號比較,以識別所需要的音頻/數(shù)據(jù)/視頻信息;以及為識別的音頻/數(shù)據(jù)/視頻信息提供存取。
26.一種音頻/數(shù)據(jù)/視頻信號選擇系統(tǒng),包括一個輸入裝置(14),用于提供用戶的觀看愛好;和一個信息選擇器(22)用于接收第一多個音頻/數(shù)據(jù)/視頻信號將所述觀看愛好與第二多個音頻/數(shù)據(jù)/視頻信號比較,以識別所需要的音頻/數(shù)據(jù)/視頻信息;以及為已識別的音頻/數(shù)據(jù)/視頻信息提供存取。
27.根據(jù)權(quán)利要求26的音頻/數(shù)據(jù)/視頻信號選擇系統(tǒng),還包括一個存儲器(24),可操作地與信息選擇器連接,用于儲存所述所需要的音頻/數(shù)據(jù)/視頻信息的至少一部分。
全文摘要
一種用于選擇、儲存和運送所需要的音頻/數(shù)據(jù)/視頻信息的方法,其包括的步驟有確定觀眾的觀看愛好(100)和接收第一組音頻/數(shù)據(jù)/視頻信號(102),比如,廣播和有線電視信號或基于互聯(lián)網(wǎng)的信號?;诘谝唤M音頻/數(shù)據(jù)/視頻信號,作為第一組音頻/數(shù)據(jù)/視頻信號子集的第二組音頻/數(shù)據(jù)/視頻信號被識別(108)。第二組音頻/數(shù)據(jù)/視頻信號是基于與用于每一信號的EPG數(shù)據(jù)與觀眾的觀看愛好的聯(lián)系來選擇。而后內(nèi)容數(shù)據(jù)從第二組音頻/數(shù)據(jù)/視頻信號提取并與觀看愛好相比較(110,14)。內(nèi)容數(shù)據(jù)可包括,例如,封閉的字幕內(nèi)容、EPG數(shù)據(jù)、音頻信息、視頻信息、和譯寫信息?;趯牡诙M音頻/數(shù)據(jù)/視頻信號提取出的內(nèi)容數(shù)據(jù)與觀看愛好進(jìn)行比較,包含在第二組音頻/數(shù)據(jù)/視頻信號中對觀眾是有趣的音頻/數(shù)據(jù)/視頻信息被識別(122)并且被儲存起來以方便觀眾再看(124)。
文檔編號H04N5/00GK1408178SQ00805217
公開日2003年4月2日 申請日期2000年10月26日 優(yōu)先權(quán)日1999年11月18日
發(fā)明者N·迪米特羅瓦, T·麥吉, J·H·埃倫巴爾斯, L·阿尼霍特里, R·雅辛施, S·達(dá)塔斯, A·門德索恩 申請人:皇家菲利浦電子有限公司