欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于上下文的推薦系統(tǒng)的制作方法

文檔序號:6596035閱讀:317來源:國知局
專利名稱:基于上下文的推薦系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及向用戶推薦產(chǎn)品或服務(wù)的系統(tǒng)、方法、和計算機程序產(chǎn)品。
背景技術(shù)
在當今的信息社會里,知識正在以前所未有的驚人步伐從個體階段步入團體層面。信息——數(shù)字時代的珍貴原料從未如此容易地通過互聯(lián)網(wǎng)獲得、處理和傳播。然而,隨著數(shù)量巨大的信息呈現(xiàn)在用戶面前,當用戶需要時,以更好地滿足他們要求的方式找出他們想要的東西的難度迅速增大。推薦系統(tǒng)通過使用對特定對象或項目的評估對那個對象或項目作出推薦。它們被作為基于計算機的智能系統(tǒng)引入,以應(yīng)付信息和產(chǎn)品過量的問題。推薦系統(tǒng)的兩個基本實體是用戶和項目。用戶是利用向他提供有關(guān)各種項目的意見的推薦系統(tǒng)和從推薦系統(tǒng)接收有關(guān)新項目的推薦的人員。通常,推薦系統(tǒng)的目的是生成有關(guān)新項目的建議或預(yù)測特定項目對特殊用戶的實用性。推薦系統(tǒng)的輸出可以是,例如,預(yù)測或推薦。 將預(yù)測表達成代表特定項目的預(yù)期意見的數(shù)值??梢詫⑼扑]表達成預(yù)料活躍用戶最喜歡的項目列表。文件和用戶簡介可以用關(guān)鍵詞向量或列表來表示以便于比較和學(xué)習(xí)。如今,人們花費在看電視(TV)上的時間越來越少,而花費在瀏覽互聯(lián)網(wǎng)上的時間越來越多。以傳統(tǒng)方式廣播和在TV上觀看的視頻內(nèi)容現(xiàn)在越來越普遍地可從互聯(lián)網(wǎng)上獲得。同時,新的電視機和機頂盒使互聯(lián)網(wǎng)內(nèi)容可經(jīng)由電視機訪問。此外,已經(jīng)提出了使用戶能夠使用遙控器和他們的電視機訪問互聯(lián)網(wǎng)服務(wù)和瀏覽互聯(lián)網(wǎng)的能上網(wǎng) (internet-enabled)電視機。硬盤驅(qū)動器和數(shù)字視頻壓縮技術(shù)提供了時移電視直播和不必擔(dān)心磁帶或其它移動記錄媒體的可用性地高質(zhì)量記錄大量電視節(jié)目的可能性。同時,視聽信號的數(shù)字化使普通用戶的內(nèi)容源的數(shù)量成倍增加。使用例如簡單拋物面天線和數(shù)字接收器就可獲得數(shù)以百計的頻道。每天在互聯(lián)網(wǎng)上觸及各種服務(wù)地發(fā)布成千上萬個視頻片段,且所有主要內(nèi)容制作商都已經(jīng)使它們的整個內(nèi)容庫可在線獲得。每天廣播和可獲得數(shù)千個可能感興趣的節(jié)目,并且可以將它們記錄和存儲在本地以便于以后訪問。但是,雖然為普通用戶提供的內(nèi)容極大地增加了,但消耗在可用內(nèi)容上的時間已經(jīng)成為限制參數(shù)。因此,根據(jù)用戶需要和偏愛篩選出特定信息和選擇個別內(nèi)容已經(jīng)成為重要課題。推薦系統(tǒng)可以通過例如估計某個用戶對某個項目的喜歡程度,并自動排序內(nèi)容項來解決這些問題。這可以通過將內(nèi)容項的特點或特征與用戶簡介或用戶設(shè)置相比較來完成。因此,可以將推薦系統(tǒng)看作篩選出引起用戶注意的用戶特定內(nèi)容的工具或機構(gòu)。但是,在許多情況下,來自不同媒體或服務(wù)的內(nèi)容是分開處理的,從而將推薦系統(tǒng)的用戶引向既耗費時間又負載加重的操作。舉一個例子來說,互聯(lián)網(wǎng)瀏覽通常使用互聯(lián)網(wǎng)瀏覽器來完成,而TV接收器具有它們自己的傳統(tǒng)界面??删幊啼浵駲C(PVR)可以經(jīng)由顯示在TV上的電子節(jié)目指南(EPG)或經(jīng)由網(wǎng)頁來控制。EPG是按照例如歐洲電信標準協(xié)會 (ETSI)的EN 300707vl.2. 1標準規(guī)定的。EPG可以是存儲在產(chǎn)品中和用戶經(jīng)由屏幕菜單等訪問的數(shù)據(jù)庫。EPG的值將符合用戶觀看判據(jù)的大多數(shù)感興趣節(jié)目告知用戶?,F(xiàn)在,用戶可以看看在接著的幾天內(nèi)是否可獲得和在什么頻道上可獲得他選擇的節(jié)目?;蛘撸脩艨梢酝ㄟ^將信息提供者與節(jié)目數(shù)據(jù)相聯(lián)系的評價而選擇要被告知的最佳節(jié)目。可以包括像節(jié)目的語言、它的副標題和不適合孩子觀看的節(jié)目的音頻描述或指示那樣的類似屬性。因此,通過將數(shù)據(jù)作為數(shù)據(jù)庫存儲在電視機或錄像機中,將呈現(xiàn)或顯示信息的方式與發(fā)送數(shù)據(jù)的方式分開,允許觀眾按照他的偏愛有選擇地存儲信息,使用預(yù)定刷新序列以便使大多數(shù)關(guān)鍵信息總是可用,以及使用最終產(chǎn)品中的存儲設(shè)備以便觀眾即時訪問有關(guān)可用節(jié)目的信息和網(wǎng)絡(luò)運營商可以減小最佳性能所需的帶寬,EPG提供了觀眾選擇想觀看的節(jié)目所需的功能, 并且提供了將這個信息傳送到電視機或錄像機的便捷途徑。已經(jīng)為內(nèi)容用戶(例如,觀眾)建議了個人用戶平臺作為構(gòu)建他們自己的個人 (TV)簡介(例如,在“真正”頻道旁邊的個人TV頻道)的選項。這可以用幾種方式實現(xiàn)。 按照第一種選項,可以使用“種子”節(jié)目。在觀看節(jié)目(例如,BBC新聞)的同時,用戶可以通過在EPG中創(chuàng)建由特定內(nèi)容(例如,BBC新聞廣播)和有關(guān)其它相關(guān)新聞內(nèi)容的建議組成的個人頻道(叫做,例如,“我的新聞”),創(chuàng)建或修改個人(TV)簡介。這些建議可以基于過去觀看選擇的評價,包括用戶對系統(tǒng)認為相關(guān)的內(nèi)容所投的贊成和反對票。按照第二種選項,用戶可以通過輸入特定特點創(chuàng)建他們自己所希望的個人(TV)簡介(例如,個人頻道簡介),和系統(tǒng)可以按照觀眾的選擇和偏愛再次“學(xué)習(xí)”如何細調(diào)這個新個人(TV)簡介內(nèi)容。 按照第三種選項,用戶可以簡單地下載別人已經(jīng)創(chuàng)建好的個人(TV)簡介(例如,個人頻道簡介)。我們的想法是,最終可以提供充滿這樣觀眾可以相互推薦的簡介的網(wǎng)站。但是,上述互聯(lián)網(wǎng)瀏覽與TV服務(wù)的分離導(dǎo)致在瀏覽互聯(lián)網(wǎng)、閱讀博客、閱讀在線新聞、訪問社交網(wǎng)站上朋友的頁面時,用戶可能會偶然碰到與TV節(jié)目或電影有關(guān)的信息。 如果該信息是令人感興趣的,應(yīng)該按照新獲得信息改變個人TV簡介,或應(yīng)該將個人TV或 PVR編程成記錄與用戶在互聯(lián)網(wǎng)上找到的東西有關(guān)的節(jié)目或電影。這導(dǎo)致了經(jīng)由電視機的用戶界面進行相當多的和耗時的操作。在一些情況下,這樣的延遲可能是不恰當?shù)?,并且可能妨礙TV節(jié)目或電影或經(jīng)由互聯(lián)網(wǎng)瀏覽器檢測到的其它內(nèi)容項的及時記錄。

發(fā)明內(nèi)容
本發(fā)明的目的是提供能夠快速和可靠修改為用戶推薦的內(nèi)容項的推薦系統(tǒng)。這個目的是通過如權(quán)利要求1所要求的系統(tǒng)、如權(quán)利要求17所要求的方法和如權(quán)利要求18所要求的計算機程序產(chǎn)品實現(xiàn)的。按照本發(fā)明,提供了第一提取器,它適用于將第一特征提取算法應(yīng)用在內(nèi)容項上, 從而提取表征運行在特定裝置上的第一應(yīng)用程序處理的輸入數(shù)據(jù)的內(nèi)容的第一特征。另外,還提供了第二提取器,它適用于將第二特征提取算法應(yīng)用于運行在特定裝置或系統(tǒng)的另一個裝置上的第二應(yīng)用程序的數(shù)據(jù)庫的內(nèi)容,從而提取表征第二應(yīng)用程序的數(shù)據(jù)庫的內(nèi)容的第二特征。比較器可操作地與第一提取器和第二提取器連接,并適用于比較第一和第二特征,從而識別用于推薦的匹配項。于是,提供了當通過比較器檢測到或識別出與第一應(yīng)用程序的處理數(shù)據(jù)的匹配項時自動或響應(yīng)性地訪問第二應(yīng)用程序的設(shè)置(像,例如,個人電視設(shè)置等那樣)的便捷方式。可以將可以通過特定內(nèi)容表征的任何類型的輸入數(shù)據(jù)與可以包含可以作出推薦的任何類型產(chǎn)品和/或服務(wù)的第二應(yīng)用程序的數(shù)據(jù)庫的內(nèi)容相比較。因此,可以沒有明顯延遲和中斷其它應(yīng)用程序或過程地提供推薦和隨后修改進程。按照第一方面,可以提供由第一應(yīng)用程序觸發(fā)以便激活第二應(yīng)用程序的切換功能或切換進程。這個切換進程保證了推薦和隨后修改進程無縫地和自動地啟動,以便使處理延遲最小。按照可以與第一方面結(jié)合的第二方面,所述第一應(yīng)用程序可以包含互聯(lián)網(wǎng)瀏覽器,和輸入數(shù)據(jù)可以包含從互聯(lián)網(wǎng)下載的內(nèi)容信息。在一種特定實現(xiàn)中,內(nèi)容信息可以包含超文本標記語言(HTML)文檔。這樣的基于瀏覽器應(yīng)用程序提供了在用戶的瀏覽或沖浪活動期間可以提供第二應(yīng)用程序的推薦的優(yōu)點,其中可以突出顯示特定內(nèi)容項以便將有關(guān)推薦選項告知用戶。按照可以與上述第一和第二方面的至少一個方面結(jié)合的第三方面,所述第二應(yīng)用程序的數(shù)據(jù)庫可以包含電子節(jié)目指南信息。這里,在第一應(yīng)用程序中一檢測到電視相關(guān)信息,就可以在輸入數(shù)據(jù)的處理期間向用戶推薦電視訪問。按照可以與上述第一至第三方面的任何一個方面結(jié)合的第四方面,所述第二應(yīng)用程序的數(shù)據(jù)庫可以是電影數(shù)據(jù)庫。與上述第三方面類似,如果有的話,可以推薦與經(jīng)過第一應(yīng)用程序處理的輸入數(shù)據(jù)有關(guān)的電影數(shù)據(jù)庫當中的電影。按照可以與上述第一至第四方面的任何一個方面結(jié)合的第五方面,所述第一提取器可以適用于檢測輸入數(shù)據(jù)的內(nèi)容與電視節(jié)目有關(guān)還是與現(xiàn)有電影或電視作品有關(guān)。因此,經(jīng)過第一應(yīng)用程序處理的輸入數(shù)據(jù)中的相應(yīng)項目可以用于觸發(fā)到第二應(yīng)用程序的切換或切換進程,或為了推薦給用戶,可以突出顯示出來供用戶選擇,然后用戶單獨激活切換進程。按照可以與上述第一至第五方面的任何一個方面結(jié)合的第六方面,所述第一和第二特征提取算法可以適用于從輸入數(shù)據(jù)中除去標記和無用詞的至少一種。從而,可以從輸入數(shù)據(jù)中剝離與輸入數(shù)據(jù)的任何內(nèi)容無關(guān)或不指示輸入數(shù)據(jù)的任何內(nèi)容的信息。按照可以與上述第一至第六方面的任何一個方面結(jié)合的第七方面,所述比較器可以適用于根據(jù)第一和第二特征之間的重疊量識別匹配項。這種措施提供了可以預(yù)定決定足夠相似度或匹配度所需的預(yù)定重疊量的優(yōu)點。按照可以與上述第一至第七方面的任何一個方面結(jié)合的第八方面,所述第一和第二特征可以包含檢索詞頻率逆文檔頻率值的向量(vectors of term frequency inverse document frequency value)。這種手段保證捕獲到輸入數(shù)據(jù)的詞匯、文本文檔和特定類別之間的相關(guān)性。按照可以與上述第一至第八方面的任何一個方面結(jié)合的第九方面,所述比較器可以適用于應(yīng)用詞干抽取過程(word stemmer)、近似字符串匹配過程、和計算n-gram的過程的至少一種。從而,可以提供優(yōu)化所述第一和第二特征之間的比較的可替代或另外算法。按照可以與上述第一至第九方面的任何一個方面結(jié)合的第十方面,所述第一提取器可以包含網(wǎng)頁文本的自動關(guān)鍵詞標識器,其中將關(guān)鍵詞標記成用于做個人電視頻道的種子。因此,可以實現(xiàn)消費者根據(jù)所瀏覽網(wǎng)頁獲取電視內(nèi)容的簡單方式。按照可以與上述第一至第十方面的任何一個方面結(jié)合的第十一方面,所述第二特征可以包含設(shè)置在數(shù)據(jù)庫中的元數(shù)據(jù)。在一個特例中,所述比較器可以適用于將不同權(quán)重應(yīng)用于所述元數(shù)據(jù)。這種措施提供了可以將關(guān)鍵詞等的列表與內(nèi)容項相聯(lián)系,從而可以減少或防止生成關(guān)鍵詞的附加處理的優(yōu)點。按照可以與上述第一至第十一方面的任何一個方面結(jié)合的第十二方面,所述第二特征可以包含即時電視節(jié)目點播(TV-Anytime)功能的內(nèi)容引用標識符(CRID)。從而,可以提供內(nèi)容引用,以便允許內(nèi)容的地點無關(guān)引用。按照可以與上述第一至第十二方面的任何一個方面結(jié)合的第十三方面,可以為顯示匹配項和提供選擇匹配項的輸入功能提供用戶界面。因此,可以向用戶提供選擇或記錄匹配項的選項。注意,上述推薦系統(tǒng)可以根據(jù)含有分立硬件部件的至少一個分立硬件電路、至少一個集成芯片、一排芯片模塊、或受存儲在存儲器中的軟件例程或程序控制的至少一個信號處理設(shè)備或計算機設(shè)備或芯片來實現(xiàn)。


現(xiàn)在參考附圖,根據(jù)本發(fā)明的實施例舉例描述本發(fā)明,在附圖中圖1示出了按照第一實施例的能上網(wǎng)電視機的示意性方塊圖;以及圖2示出了各個實施例所涉及的處理步驟的示意圖流程圖。
具體實施例方式現(xiàn)在根據(jù)帶有基于個人電視的推薦技術(shù)的示范性能上網(wǎng)電視機描述本發(fā)明的實施例。圖1示出了按照第一實施例的能上網(wǎng)電視機的示意性方塊圖。該電視機包含可以施加瀏覽器(B) 20和TV接收器(TV) 40的輸出信號以便顯示在屏幕上的顯示單元或模塊 10。TV接收器40經(jīng)由可以是拋物面衛(wèi)星天線的天線60接收輸入信號。瀏覽器20與互聯(lián)網(wǎng)50連接,以便訪問互聯(lián)網(wǎng)內(nèi)容(網(wǎng)頁)或下載其它內(nèi)容信息。瀏覽器20可以通過用戶界面(UI)22控制,用戶界面(UI) 22可以包含鍵盤、指針設(shè)備、觸摸板等。另外,TV接收器 40可以與可編程錄像機(PVR)42連接,可編程錄像機(PVR)42可以經(jīng)由可以例如根據(jù)廣播或互聯(lián)網(wǎng)信息更新的存儲在數(shù)據(jù)庫32中的電子節(jié)目指南(EPG)來控制。另外,還提供了根據(jù)指示電視機的至少一個用戶的偏愛的用戶簡介表46推薦EPG 32當中的節(jié)目信息的推薦單元48。另外,提供了分析瀏覽器20處理的輸入數(shù)據(jù)以便提取表征經(jīng)過處理輸入數(shù)據(jù)的內(nèi)容的特征(例如,關(guān)鍵詞等)的確定單元或模塊30。確定單元30還訪問數(shù)據(jù)庫32,以便分析數(shù)據(jù)庫的內(nèi)容和提取表征可用節(jié)目數(shù)據(jù)的內(nèi)容的特征。根據(jù)所提取特征之間的所確定匹配,確定單元30控制可編程錄像機42和/或用戶簡介表46提供對與在瀏覽器20上處理的輸入數(shù)據(jù)有關(guān)的TV節(jié)目或作品的訪問。更新的用戶簡介表46影響或控制推薦單元48, 從而推薦的TV節(jié)目可以適用于被瀏覽的互聯(lián)網(wǎng)內(nèi)容。在一個特定實現(xiàn)例子中,確定單元30可以配置成識別與TV節(jié)目或電影作品有關(guān)的數(shù)據(jù)項,并且在顯示單元10的屏幕上突出顯示或標記這些數(shù)據(jù)項。然后,用戶可以使用用戶界面22激活或切換到確定單元30上的匹配過程。在上述實施例中,確定單元30可以實現(xiàn)成例如互聯(lián)網(wǎng)瀏覽器20的插件,用于分析例如HTML元素(例如,標題、鏈接、段落、表格單元格等),和自動檢測HTML文檔中的內(nèi)容與即將播放的TV節(jié)目有關(guān)還是與現(xiàn)有電影/TV作品有關(guān)。在這種情況下,向用戶提供了通過使用用戶界面22簡單地選擇上下文相關(guān)菜單等上的選項訪問他個人的TV設(shè)置的便捷方式 (上下文相關(guān)菜單可以例如當在突出顯示的HTML元素上進行鼠標右擊時出現(xiàn))。可以向用戶提供例如將即將播放的TV節(jié)目加入他的個人TV頻道之一中,或通過評價相關(guān)內(nèi)容(例如,“喜歡”/ “不喜歡”)更新他的簡介。按照第一實施例,當用戶正在使用瀏覽器20瀏覽互聯(lián)網(wǎng)時,他可能閱讀到有關(guān)某個話題或個人的在線新聞文章。確定單元30自動地或響應(yīng)正在運行瀏覽器應(yīng)用程序的激活而分析數(shù)據(jù)庫32中的EPG的文本和內(nèi)容,并自動檢測在特定TV頻道上,在晚上晚些時候是否安排了具有有關(guān)該話題或個人的信息的TV節(jié)目來播放。于是,確定單元30控制瀏覽器20顯示指示已經(jīng)在數(shù)據(jù)庫32的EPG中找到相關(guān)TV節(jié)目的圖標。另外,該系統(tǒng)可以顯示有關(guān)相關(guān)TV節(jié)目的信息(例如,元數(shù)據(jù))?,F(xiàn)在,用戶可以點擊或激活該圖標,和瀏覽器20可以指示與用戶當前正在閱讀的網(wǎng)頁有關(guān)的所檢索TV節(jié)目。用戶現(xiàn)在可以選擇將所檢索TV節(jié)目加入設(shè)置在他的用戶簡介表46中的個人新聞頻道中的選項。按照第二實施例,確定單元30訪問的數(shù)據(jù)庫32可以包含電影信息。當用戶正在瀏覽互聯(lián)網(wǎng),例如,正在閱讀有關(guān)特定電影的重拍的博客條目時,確定單元30(例如,瀏覽器插件)自動地或響應(yīng)正在運行瀏覽器應(yīng)用程序的激活而分析電影數(shù)據(jù)庫的文本和內(nèi)容, 并自動檢測與該電影相聯(lián)系的人物是否出現(xiàn)在各種TV和電影作品的元數(shù)據(jù)中。另外,出現(xiàn)在博客條目中的以上電影的標題詞組也可以出現(xiàn)在電影數(shù)據(jù)庫中。于是,確定單元30控制瀏覽器20顯示指示已經(jīng)找到相關(guān)電影/TV信息的圖標。用戶現(xiàn)在可以經(jīng)由用戶界面22點擊或激活該圖標,并且擁有通過評價所識別人物和所識別電影(例如,“喜歡”/ “不喜歡”) 更新用戶簡介表46中他的個人TV簡介的選項。注意,結(jié)合圖1所述的單元或模塊可以實現(xiàn)成分立硬件電路或功能,或?qū)崿F(xiàn)成控制處理器或計算設(shè)備(例如,中央處理單元(CPU)、PC、服務(wù)器等)的軟件例程。圖2示出了按照上述第一和第二實施例的基于上下文推薦過程的的示意圖流程圖。注意,本發(fā)明不局限于TV/電影作品或TV節(jié)目的推薦,而是可以為任何可推薦產(chǎn)品和服務(wù)實現(xiàn)。舉一個例子來說,上述瀏覽器應(yīng)用程序和TV應(yīng)用程序(例如,TV/DVR)可以適用于運行在經(jīng)由網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))連接的不同物理系統(tǒng)上。在更具體的例子中,互聯(lián)網(wǎng)瀏覽器可以用在與機頂盒應(yīng)用程序(例如,DVR)通信的移動電話上。一般說來,該系統(tǒng)和過程含有可以是經(jīng)過運行在處理系統(tǒng)上的相應(yīng)應(yīng)用程序處理 (例如,裝入瀏覽器20中和在瀏覽器20中得到處理)的任何文字文檔(例如,HTML文檔) 的輸入數(shù)據(jù)、和來自可用服務(wù)和/或產(chǎn)品(例如,EPG或電影數(shù)據(jù))的數(shù)據(jù)庫(DB)的另一種輸入數(shù)據(jù)。如上所述,推薦系統(tǒng)可以通過瀏覽器20的插件或直接訪問裝載和顯示在瀏覽器中的數(shù)據(jù)的任何其它例程或電路來控制。在圖2的過程的步驟S200中,通過特征提取算法分析經(jīng)過處理的輸入數(shù)據(jù)(例如,HTML文檔),以提取表征其內(nèi)容的(文字)特征。任何內(nèi)容分析和特征提取算法都可以用于此目的。舉一個例子來說,首先可以從輸入數(shù)據(jù)中剝離它的語言標記(例如,HTML文本),然后可以除去無用詞。無用詞是特定語言中像代詞、冠詞那樣不代表特定文檔的頻繁使用詞匯,以及像助動詞那樣的頻繁使用動詞。就英語而言,無用詞的進一步例子是 “about”、“actually”、“because”、“could”、“did”、“either”、“for”、“got”、“have,,、 “into”、“just”、“knoWn”、“l(fā)ess”、“me”、“not”、“of”、“put”、“rather”、“she”、“that,,、 “11壯1”、“%巧”、 狀”、和“7011”等。然后,可以將文檔中的其余詞匯用作代表該文檔的特征。也可以使用像描述在例如D. Munteanu等人的文章《文本文檔推薦系統(tǒng)中的分類過禾呈〉〉(D. Munteanu et al. “ Classification Process in a Text Document Recommender System" ),The Annals of" Dunarea D.Jos" University of Galatz,ISSN 1221-454X, 2005中那樣的其它分類算法,或在本文件或其它地方引用的參考文獻中提到的其它算法。類似地,在步驟SlOO中,以相似方式處理數(shù)據(jù)庫(例如,EPG或電影數(shù)據(jù))的內(nèi)容。如圖2中的虛線箭頭所指,步驟S100的處理可選地可以通過步驟S200的過程激活,例如,當步驟S200的分析開始時或當已經(jīng)檢測到輸入數(shù)據(jù)的預(yù)定類型或內(nèi)容時。然后,匯總標題、風(fēng)格、描述和其它元數(shù)據(jù),以創(chuàng)建內(nèi)容(例如,TV節(jié)目或電影)的文字描述??梢詫⑽淖置枋鲆曌鲉为毼臋n地處理它們。然后,可以通過關(guān)鍵詞的列表表示每個所提取或所剝離項目。然后,在比較步驟S300中比較在步驟S100和S200中提取的特征或項目以尋找匹配。例如,當在步驟S100和S200中提取的特征之間存在足夠大重疊時,可以認為找到匹配。 也可以使用其它類型的特征和計算匹配的其它方式,并應(yīng)該認為這些都在本發(fā)明的范圍之內(nèi)。例如,取代將簡單的數(shù)組提取項目(例如,關(guān)鍵詞等)用于代表文檔和數(shù)據(jù)庫項目,也可以使用檢索詞頻率逆文檔頻率(TFIDF)值的向量。這樣用于文本分類的TFIDF描述在,例如,張某等人的文章《用于文本分類的改進TF-IDF手段》(Slang et al. , ‘‘ An improved TF-IDF approach for text classification " ), Journal of Zhejiang University SCIENCE, ISSN 1009-3095 中。另外,可以通過使用詞庫(或本體)將同義詞和相關(guān)術(shù)語包括進來豐富該組提取項目(例如,關(guān)鍵詞)。另外或可替代地,為了方便匹配過程,可以使用像描述在,例如, S. Abdou等人的文章《用于基因組任務(wù)的詞根評估、詢問擴展和人工索引手段》(S. Abdou et al. , “ Evaluation of Stemming, Query Expansion and Manual Indexing Approaches for the Genomic Task" ,TREC-2005)中的那些那樣的詞干抽取過程將所提取項目(例如, 關(guān)鍵詞列表或特征組)中的項目縮減成它們的詞干??商娲?,除了在比較步驟S300中進行嚴格字符串匹配之外,也可以使用像描述在,例如,US 5,467,425或W. Litwin等人的文章《使用累積代數(shù)符號差的模式匹配和 n-gram 取樣》(W. Litwin et al. , “ Pattern Matching Using Cumulative Algebraic Signatures and η-gram Sampling",2006)中的那樣,基于自然語言處理的概率模型的近似字符串匹配或所謂“n-gram”的計算。在尋找步驟S100和S200的所提取項目或特征之間的匹配時,取決于從數(shù)據(jù)庫中檢索的數(shù)據(jù)的結(jié)構(gòu),也可以使用一些元數(shù)據(jù)。例如,在EPG數(shù)據(jù)庫的情況下,可以通過數(shù)據(jù)庫提供與一個項目相聯(lián)系的關(guān)鍵詞的列表,以便可以省略在步驟S100中生成附加關(guān)鍵詞。 或者,可替代地,可以將從數(shù)據(jù)庫32的內(nèi)容中提取的關(guān)鍵詞、特征或項目加入從已經(jīng)列在數(shù)據(jù)庫32中的元數(shù)據(jù)中導(dǎo)出的關(guān)鍵詞中。作為一個附加選項,在進行匹配時不同元數(shù)據(jù)可以具有不同權(quán)重。例如,從節(jié)目的標題中提取的關(guān)鍵詞可以具有比從梗概中提取的關(guān)鍵詞
高的權(quán)重。當在步驟S300中發(fā)現(xiàn)匹配時,在步驟S320中提取匹配項,并且可以在步驟S330 中通知用戶以便提供控制訪問。這可以使用圖形手段來實現(xiàn)(例如,顯示圖標,突出顯示文檔中已經(jīng)發(fā)現(xiàn)匹配的文本或段落)??商娲?,系統(tǒng)可以不干擾用戶,只有當用戶在用戶界面22上選擇特定選項時才顯示匹配結(jié)果,因此,步驟S330可以是一個可選步驟。在推薦TV節(jié)目或電影的情況下,控制訪問可以向用戶提供記錄EPG項目、將其加入他的個人頻道之一中、或評價它(例如,選擇“喜歡”或“不喜歡”)的選項。然后,確定單元30可以相應(yīng)地訪問可編程錄像機42或用戶簡介表46,以便開始修改內(nèi)容(步驟S340)。在上述第二實施例的電影數(shù)據(jù)庫情況下,可以使用與顯示在圖2中的那個相似的過程,差異在于,當在步驟S300中發(fā)現(xiàn)匹配時,如果已經(jīng)發(fā)現(xiàn)與EPG 32的附加匹配,則只能給出在可編程錄像機42上安排記錄的選項。注意,本發(fā)明不局限于HTML文檔或互聯(lián)網(wǎng)內(nèi)容,也可以應(yīng)用于任何類型的輸入數(shù)據(jù),例如,數(shù)字文字文檔。此外,本發(fā)明可以應(yīng)用于機頂盒、電視機、移動電話、個人數(shù)字助理 (PDA)、個人計算機(PC)和含有互聯(lián)網(wǎng)瀏覽器的所有設(shè)備。另外,本發(fā)明可以應(yīng)用于使用推薦從多種來源(例如,網(wǎng)絡(luò)電視)中收集、篩選、和向它們的用戶呈現(xiàn)內(nèi)容的服務(wù)。因此,本發(fā)明也不局限于TV/電影內(nèi)容的推薦,也可以應(yīng)用于音樂、話劇、圖書、和可以作出推薦的所有類型產(chǎn)品和服務(wù)。作為上述實施例的特定應(yīng)用,可以使用即時電視節(jié)目點播(TVA)系統(tǒng)的TVA功能。 這里,內(nèi)容引用標識符(CRID)允許內(nèi)容的地點無關(guān)引用。它可以由也具有將CRID轉(zhuǎn)化成地點的能力的權(quán)威機構(gòu)指定。CRID可以指向單個內(nèi)容或一系列其它CRID。它可以實現(xiàn)成指向可以通過注冊互聯(lián)網(wǎng)域名識別的權(quán)威機構(gòu)分配的數(shù)據(jù)或內(nèi)容的統(tǒng)一資源標識符(URI)。 從而,可以提供分配內(nèi)容的簡單機制??傊?,本發(fā)明涉及包含第一提取器和第二提取器的推薦系統(tǒng)和方法,第一提取器應(yīng)用第一特征提取算法提取表征運行在系統(tǒng)上的第一應(yīng)用程序(例如,互聯(lián)網(wǎng)瀏覽器)處理的輸入數(shù)據(jù)(例如,網(wǎng)頁、電子文檔等)的內(nèi)容的第一特征,而第二提取器應(yīng)用第二特征提取算法提取表征運行在系統(tǒng)上的第二應(yīng)用程序(例如,個人TV或電影訪問程序)的數(shù)據(jù)庫的內(nèi)容的第二特征。另外,還提供了比較第一和第二特征以便識別用于推薦的匹配項的比較器。雖然在附圖和上面的描述中詳細例示和描述了本發(fā)明,但這樣的例示和描述應(yīng)該被認為是例示性的或示范性的,而不是限制性的。本發(fā)明不局限于所公開的實施例。通過閱讀本公開,其它修改對于本領(lǐng)域的普通技術(shù)人員來說是顯而易見的。這樣的修改可能涉及在技術(shù)上已知的和可以用于取代本文已述的特征或除了本文已述的特征之外還可以使用的其它特征。本領(lǐng)域的普通技術(shù)人員可以通過研究附圖、本公開和所附權(quán)利要求書了解和實現(xiàn)所公開實施例的變種。在權(quán)利要求書中,詞匯“包含”并不排除其它元件或步驟,和不定冠詞“一個”或“一種”也不排除多個元件或步驟。單個處理器或其它單元可以根據(jù)相應(yīng)軟件例程至少完成圖2的功能。計算機程序可以存儲/分布在像與其它硬件一起或作為其它硬件的一部分供應(yīng)的光存儲媒體或固態(tài)媒體那樣的適當媒體上,但也可以像經(jīng)過互聯(lián)網(wǎng)或其它有線或無線遠程通信系統(tǒng)那樣,以其它形式分配。某些措施被闡述在相互不同從屬權(quán)利要求中的僅有事實并不指示不能使用這些措施的組合獲益。權(quán)利要求書中的任何標號都不應(yīng)該理解為限制本發(fā)明的范圍。
權(quán)利要求
1.一種為至少一個內(nèi)容項作出推薦的系統(tǒng),所述系統(tǒng)包含a)第一提取器(S200),用于應(yīng)用第一特征提取算法提取表征運行在所述系統(tǒng)上的第一應(yīng)用程序處理的輸入數(shù)據(jù)的內(nèi)容的第一特征;b)第二提取器(S100),用于應(yīng)用第二特征提取算法提取表征運行在所述系統(tǒng)上的第二應(yīng)用程序的數(shù)據(jù)庫(3 的內(nèi)容的第二特征;c)比較器(S300),用于比較所述第一和第二特征,以便識別用于所述推薦的匹配項,d)其中,所述第一提取器(S200)適用于檢測所述輸入數(shù)據(jù)的所述內(nèi)容與電視節(jié)目有關(guān)還是與現(xiàn)有電影或電視作品有關(guān)。
2.按照權(quán)利要求1所述的系統(tǒng),進一步包含由第一應(yīng)用程序觸發(fā)以便激活第二應(yīng)用程序的切換功能。
3.按照權(quán)利要求1所述的系統(tǒng),其中所述第一應(yīng)用程序包含互聯(lián)網(wǎng)瀏覽器(20),和所述輸入數(shù)據(jù)包含從互聯(lián)網(wǎng)下載的內(nèi)容信息。
4.按照權(quán)利要求3所述的系統(tǒng),其中所述內(nèi)容信息包含HTML文檔。
5.按照權(quán)利要求1所述的系統(tǒng),其中所述第二應(yīng)用程序的所述數(shù)據(jù)庫(32)包含電子節(jié)目指南信息。
6.按照權(quán)利要求1所述的系統(tǒng),其中所述第二應(yīng)用程序的所述數(shù)據(jù)庫(32)是電影數(shù)據(jù)庫。
7.按照權(quán)利要求1所述的系統(tǒng),其中所述第一和第二特征提取算法適用于從所述輸入數(shù)據(jù)中除去標記和無用詞的至少一種。
8.按照權(quán)利要求1所述的系統(tǒng),其中所述比較器(S300)適用于根據(jù)所述第一和第二特征之間的重疊量識別匹配項。
9.按照權(quán)利要求1所述的系統(tǒng),其中所述第一和第二特征包含檢索詞頻率逆文檔頻率值的向量。
10.按照權(quán)利要求1所述的系統(tǒng),其中所述比較器適用于應(yīng)用詞干抽取過程、近似字符串匹配過程、和計算n-gram的過程的至少一種。
11.按照權(quán)利要求1所述的系統(tǒng),其中所述第一提取器(S200)包含網(wǎng)頁文本的自動關(guān)鍵詞標識器,和其中將關(guān)鍵詞標記成用于做個人電視頻道的種子。
12.按照權(quán)利要求1所述的系統(tǒng),其中所述第二特征包含設(shè)置在所述數(shù)據(jù)庫(3 中的元數(shù)據(jù)。
13.按照權(quán)利要求12所述的系統(tǒng),其中所述比較器(S300)適用于將不同權(quán)重應(yīng)用于所述元數(shù)據(jù)。
14.按照權(quán)利要求1所述的系統(tǒng),其中所述第二特征包含即時電視節(jié)目點播功能的內(nèi)容引用標識符。
15.按照權(quán)利要求1所述的系統(tǒng),進一步包含提供選擇所述匹配項的輸入功能的用戶界面(22)。
16.一種為至少一個內(nèi)容項作出推薦的方法,所述方法包含a)應(yīng)用第一特征提取算法提取表征第一數(shù)據(jù)處理應(yīng)用程序處理的輸入數(shù)據(jù)的內(nèi)容的第一特征;b)應(yīng)用第二特征提取算法提取表征第二數(shù)據(jù)處理應(yīng)用程序的數(shù)據(jù)庫的內(nèi)容的第二特征;c)比較所述第一和第二特征,以便識別用于所述推薦的匹配項,d)其中,所述第一提取器(S200)適用于檢測所述輸入數(shù)據(jù)的所述內(nèi)容與電視節(jié)目有關(guān)還是與現(xiàn)有電影或電視作品有關(guān)。
17. 一種包含當運行在計算設(shè)備上時形成按照權(quán)利要求16所述的步驟的代碼模塊的計算機程序產(chǎn)品。
全文摘要
本發(fā)明涉及一種推薦系統(tǒng)和方法,其包含第一提取器(S200),用于應(yīng)用第一特征提取算法提取表征運行在所述系統(tǒng)上的第一應(yīng)用程序(例如,互聯(lián)網(wǎng)瀏覽器)處理的輸入數(shù)據(jù)(例如,網(wǎng)頁)的內(nèi)容的第一特征;以及第二提取器(S100),用于應(yīng)用第二特征提取算法提取表征運行在所述系統(tǒng)上的第二應(yīng)用程序(例如,個人TV或電影訪問程序)的數(shù)據(jù)庫的內(nèi)容的第二特征。另外,還提供了比較所述第一和第二特征以便識別用于推薦的匹配項的比較器(S300)。
文檔編號G06F17/30GK102265276SQ200980152202
公開日2011年11月30日 申請日期2009年12月15日 優(yōu)先權(quán)日2008年12月23日
發(fā)明者M.巴比里, S.P.P.普龍克 申請人:阿克塞爾斯普林格數(shù)字電視指導(dǎo)有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
宿州市| 廉江市| 抚远县| 炎陵县| 稻城县| 漠河县| 崇文区| 雷州市| 广河县| 新宾| 上虞市| 海口市| 固安县| 睢宁县| 嘉祥县| 库伦旗| 商河县| 定陶县| 且末县| 安丘市| 浏阳市| 琼结县| 毕节市| 东至县| 昔阳县| 绥滨县| 从江县| 裕民县| 小金县| 宜兴市| 老河口市| 息烽县| 南开区| 定日县| 吴堡县| 临沭县| 辉南县| 镇赉县| 滦平县| 基隆市| 靖远县|