對通過通信網(wǎng)絡(luò)的視頻內(nèi)容搜索的輔助的制作方法
【專利摘要】一種用于輔助用戶通過通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括:由所述用戶確定第一內(nèi)容項(xiàng)目(CZ)的步驟;從這個第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的步驟;根據(jù)語義數(shù)據(jù)針對至少一個服務(wù)自動生成查詢、使得能夠在這個服務(wù)或這些服務(wù)上檢索一個視頻集合的步驟;將該視頻內(nèi)容的集合呈現(xiàn)給用戶的步驟。
【專利說明】對通過通信網(wǎng)絡(luò)的視頻內(nèi)容搜索的輔助
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通過互聯(lián)網(wǎng)來訪問視頻內(nèi)容提供服務(wù)。這些服務(wù)是諸如“YouTube”、“Vimeo”、以及“DailyMotion”的多面手平臺,或者更專業(yè)的平臺(教育部門、醫(yī)療部門等)。
【背景技術(shù)】
[0002]這兩種類型的服務(wù)共有一個共同的特性:使得用戶能夠?qū)⑺麄冏约旱膬?nèi)容上傳到平臺。結(jié)果是,在所有這些服務(wù)上,有非常大量的視頻內(nèi)容可供使用。當(dāng)前,每分鐘大約有355小時的視頻上傳到“YouTube”服務(wù)上。
[0003]可用內(nèi)容上的這個激增的對應(yīng)事物是,大多數(shù)的內(nèi)容沒有接收到足夠的可見性。因此,只有40%的可用視頻內(nèi)容將被觀看多于300次。
[0004]這個低比率主要?dú)w因于如下事實(shí):對于用戶,在如此大量的內(nèi)容中識別使他們感興趣的視頻已經(jīng)變得極其困難。
[0005]視頻內(nèi)容與描述相關(guān)聯(lián),描述最經(jīng)常是文本的,這些描述通過自由文本字段或一組標(biāo)簽,使得能夠基于關(guān)鍵詞搜索。因此每個希望上傳一個新視頻的用戶被要求提供一個描述,該描述使得其他用戶 能夠使用并入到服務(wù)中的搜索引擎或者外部的搜索引擎(諸如“谷歌”、“必應(yīng)”,或“雅虎”)來找到他或她的視頻。
[0006]然而,這種解決方案是不夠的,因?yàn)檫@些描述由用戶提供,并且因此是完全主觀的。特別是,它們可能以各種語言說明了個人用戶的興趣,并且在一個給定的語言內(nèi),這些描述包含的關(guān)鍵詞的選擇包括若干可能的同義詞。為了找到一個視頻,用戶必須因此選擇合適的關(guān)鍵詞,而沒有工具用其來確定這些關(guān)鍵詞。一個人如何能知道上傳了該視頻的用戶所選擇的標(biāo)簽和詞匯呢?
[0007]由此產(chǎn)生的問題是雙重的:
[0008]_搜索不一定提供最相關(guān)的視頻內(nèi)容;
[0009]-一個視頻可能對進(jìn)行搜索的用戶不是足夠可見的。
【發(fā)明內(nèi)容】
[0010]本發(fā)明的目的是改善這種情形。
[0011]為了這樣做,本發(fā)明的第一個目標(biāo)是用于輔助用戶通過通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括:
[0012]?由所述用戶確定第一內(nèi)容項(xiàng)目的步驟;
[0013]?從這個第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的步驟;
[0014]?根據(jù)所述語義數(shù)據(jù)針對至少一個服務(wù)自動生成查詢、使得能夠在所述至少一個服務(wù)上檢索視頻集合的步驟;
[0015]?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
[0016]根據(jù)本發(fā)明的一個實(shí)施例,該方法還可以包括:根據(jù)第一內(nèi)容項(xiàng)目與關(guān)聯(lián)于這個集合中的視頻內(nèi)容的描述之間的語義接近度的標(biāo)準(zhǔn),從所述集合中選擇視頻子集的步驟。[0017]至少一個服務(wù)可以被確定為語義數(shù)據(jù)的函數(shù)。
[0018]這些步驟可以由在人機(jī)界面(WB)中選擇第一內(nèi)容項(xiàng)目(CZ)而觸發(fā),以及由選擇通過所述人機(jī)界面可訪問的軟件功能而觸發(fā)。
[0019]自動提取語義數(shù)據(jù)的步驟可以包括提取“主語-動詞-賓語”關(guān)系。可以基于所述關(guān)系構(gòu)建所生成的查詢。
[0020]本發(fā)明還具有如下目標(biāo):裝備有處理裝置的通信終端來實(shí)施如先前所描述的方法,以及裝備有編碼裝置的計(jì)算機(jī)程序來實(shí)施這個方法。
[0021]本發(fā)明還具有用于通信終端的人機(jī)界面的目標(biāo),該通信終端裝備有使得用戶能夠選擇第一內(nèi)容項(xiàng)目的裝置,以及使得能夠觸發(fā)以下步驟的裝置:
[0022]?從該第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的步驟;
[0023]?根據(jù)這些語義數(shù)據(jù)針對至少一個服務(wù)自動生成查詢、使得能夠在所述至少一個服務(wù)上檢索視頻集合的步驟;
[0024]?將該視頻內(nèi)容的 集合呈現(xiàn)給用戶的步驟。
[0025]以這種方式,基于第一內(nèi)容項(xiàng)目,一般是文本的內(nèi)容項(xiàng)目,本發(fā)明使得有可能消除或者至少減少用戶主觀性,以便提高視頻內(nèi)容的可見性和搜索的相關(guān)性。它使得有可能減少視頻內(nèi)容與搜索主題之間的語義差距。
【專利附圖】
【附圖說明】
[0026]參考所附的附圖,在以下描述中,本發(fā)明和它的益處將變得更加清楚地明顯。
[0027]圖1描繪了實(shí)施本發(fā)明的人機(jī)界面。
[0028]圖2是示意性地描繪根據(jù)本發(fā)明的方法的可能步驟鏈的流程圖。
[0029]圖3描繪了文本內(nèi)容的示例以及所提取的語義數(shù)據(jù)。
【具體實(shí)施方式】
[0030]圖1描繪了一個web瀏覽器,web瀏覽器使得用戶能夠從網(wǎng)頁的URL (統(tǒng)一資源定位符)訪問網(wǎng)頁。這個瀏覽器為用戶呈現(xiàn)人機(jī)界面或者“窗口"WB。這個窗口示出了若干部分,包括瀏覽器空間WP和菜單區(qū)域MZ,頁面被顯示在瀏覽器空間WP中(包括視頻內(nèi)容)。
[0031]這個菜單區(qū)域本身可以包括下拉菜單SM和圖標(biāo)頂。通過這個菜單區(qū)域MZ,瀏覽器為用戶提供對它的各種功能的訪問。一個給定的功能通過下拉菜單、圖標(biāo)、或者它們兩者也可以是可訪問的。這是由瀏覽器的開發(fā)者所做出的人機(jī)工程選擇。
[0032]此外,這些和/或其他的功能通過上下文菜單CM,對用戶也是可訪問的。典型地,在來自微軟公司的Windows (TM)操作系統(tǒng)下,這樣的上下文菜單用鼠標(biāo)上的右菜單按鈕打開,并且它的元素取決于鼠標(biāo)指針的位置和瀏覽器的狀態(tài)。
[0033]在圖1中的示例中,瀏覽器空間WP顯示文本內(nèi)容。人機(jī)界面WB使得有可能選擇這個文本內(nèi)容的全部或部分。這個選擇可以通過已知的方法,使用鼠標(biāo)或者任何其他定點(diǎn)設(shè)備,或者鍵盤等來做出。在所描述的示例中,只有CZ區(qū)域被選擇。
[0034]一旦這個第一內(nèi)容CZ被選擇,用戶能夠從人機(jī)接口 WB中的菜單選擇對應(yīng)于本發(fā)明的功能。這個功能可以從下拉菜單SM、圖標(biāo)IM或者上下文菜單CM來選擇。這種選擇可以包括點(diǎn)擊圖標(biāo)IM,或者從下拉菜單SM或上下文菜單CM選擇元素。[0035]本發(fā)明也可以應(yīng)用到不同于瀏覽器的軟件應(yīng)用程序。特別是,它可以應(yīng)用到文件顯示應(yīng)用程序。閱讀電子書籍(或“電子書”)或者閱讀來自Adobe公司的“PDF”格式的文件的用戶可以,如上面所描述的,選擇一個內(nèi)容區(qū)域以及基于所選擇的內(nèi)容從考慮中的軟件應(yīng)用程序中的菜單觸發(fā)該功能。
[0036]軟件應(yīng)用程序也可以是文字處理器,如來自微軟公司的“Word”軟件。
[0037]類似地,本發(fā)明可以應(yīng)用到不同于文本內(nèi)容的內(nèi)容。因此,有可能選擇圖像,聲音、或者視頻。
[0038]不同于用戶的選擇的機(jī)制來確定初始內(nèi)容可以是可能的。例如,確定(determination)可以作為所顯示的網(wǎng)頁、正在播放的視頻、正在閱讀的電子郵件的內(nèi)容等的函數(shù)而是自動的。
[0039]圖2中的步驟El描繪了這個確定第一內(nèi)容項(xiàng)目CZ的步驟。
[0040]對第一內(nèi)容項(xiàng)目CZ的選擇以及該適當(dāng)?shù)暮瘮?shù),觸發(fā)了從這個第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的第一算法步驟。
[0041]這個步驟被描繪為步驟E2。
[0042]這個步驟可以被細(xì)分成為若干子步驟。
[0043]第一子步驟E2a包括確定內(nèi)容的類型,這也就是說,該內(nèi)容是否是文本、視頻、圖
像、音頻等。
[0044]作為內(nèi)容類型的函數(shù),各種算法然后可以被用來提取語義數(shù)據(jù)。這些算法可以由分離的軟件模塊實(shí)施。
[0045]提取步驟E2之后的子步驟可以取決于內(nèi)容類型。
[0046]在文本內(nèi)容的情況下,第二子步驟E2b可以包括從內(nèi)容項(xiàng)目CZ提取原始語義數(shù)據(jù)。
[0047]這些原始語義數(shù)據(jù)可以逐句地提取或者逐個句子集團(tuán)(sentence bloc)地提取。
[0048]句子集團(tuán)的提取以人稱代詞的存在為條件,人稱代詞引用之前被識別的實(shí)體。一個人然后可以能夠說,每個句子的主語是相同的,并且因此識別了關(guān)于相同主題的、連貫的句子集團(tuán)。
[0049]并非所有的詞語可以被提取。一些詞語可以被省略,因?yàn)樗鼈儗τ诶斫馕谋臼菦]有用的。
[0050]該提取可在若干步驟中被執(zhí)行:
[0051]-刪除所謂的“停止詞”:并列連詞等。
[0052]-使用統(tǒng)計(jì)和自然的語言算法,來分析剩余的信息并且提取一組具有判別詞(discriminant)意義的關(guān)鍵詞。例如,在對一個人的描述中,詞語“眼睛”不是判別詞,因?yàn)槊總€人都具有眼睛。另一方面,詞語“獨(dú)眼的”是判別詞。為了這樣做,一個人能夠使用語料庫,語料庫給出了關(guān)于一組文檔中的詞語頻率的信息:頻率越低,詞語的先驗(yàn)重要性越大。
[0053]基于這些原始語義數(shù)據(jù),第三子步驟E2c使得有可能確定精煉的語義數(shù)據(jù)。這些精煉的語義數(shù)據(jù)可以是“概念”;人、公司、地點(diǎn)(城市、國家、地區(qū),等等)的名稱;日期;等
坐寸o
[0054]“概念”可以視為來自該組原始語義數(shù)據(jù)的基本語義數(shù)據(jù)。它們可以以各種方法來確定。例如,每個原始語義數(shù)據(jù)可以關(guān)聯(lián)于跨所有文本內(nèi)容CZ的出現(xiàn)計(jì)數(shù)器(occurrencecounter)。然后,這些概念是對應(yīng)于最高出現(xiàn)率的語義數(shù)據(jù)。
[0055]還有可能使用一種本體論,以便考慮同義詞和來自各種語義層次的原始數(shù)據(jù),并且特別是上位詞(這也就是說,更一般的原始語義數(shù)據(jù)涵蓋一個或多個更具體的語義數(shù)據(jù)項(xiàng)目)。
[0056]概念然后可以由原始語義數(shù)據(jù)的出現(xiàn)數(shù)量來確定,原始語義數(shù)據(jù)的出現(xiàn)數(shù)量基于同義詞和上位詞而被合計(jì)。例如,包含原始數(shù)據(jù)“橙子”、“葡萄”、“香蕉”等的出現(xiàn)的文本內(nèi)容,可以帶出概念“水果”。
[0057]有可能帶出最重要的概念,例如,與最強(qiáng)烈的出現(xiàn)(strongest occurrence)相關(guān)聯(lián)的概念,以便確定文本內(nèi)容CZ所屬的類別??紤]到先前所確定的概念的連續(xù)上位詞,這個類別可以被搜索。
[0058]可以從詞典確定人、公司、地點(diǎn)等的名稱。這個詞典對發(fā)明的軟件裝置可以是內(nèi)部的,或者它可以以web服務(wù)的形式或者任何其他技術(shù)設(shè)備(數(shù)據(jù)庫等)的形式遠(yuǎn)程地位于互聯(lián)網(wǎng)上。
[0059]圖3示出了文本內(nèi)容CZ的示例與所提取的語義數(shù)據(jù)之間的對應(yīng)關(guān)系。在這個示例中,文本內(nèi)容CZ是由用戶在瀏覽器空間WP上所顯示的網(wǎng)頁中選擇的區(qū)域。在該圖中,它被示出在灰色的背景上。
[0060]在觸發(fā)了本發(fā)明的功能后,一個“彈出”窗口 PW與最相關(guān)的視頻內(nèi)容VC以及其他相關(guān)的視頻內(nèi)容RVC—起被顯示。這個窗口 PW還顯示了“類別”、概念、人和地點(diǎn)(“州或國家”)的名稱以及原始語義數(shù)據(jù)(“標(biāo)簽”)。如果這個信息對用戶沒有多大的意義并且在內(nèi)部更有用,則它可以不被顯示。然而,在這里它被顯示,以使該解釋清楚易懂。
[0061]在這個示例中,類別“商業(yè)”(交易,貿(mào)易)基于所提取的概念來確定。因此,概念“廣告”和“銷售”具有上位詞“商業(yè)”。原始數(shù)據(jù),諸如“低價”、“市場”、“證券經(jīng)紀(jì)業(yè)務(wù)”、“先令”等的存在,進(jìn)一步加強(qiáng)了這個推斷。
[0062]通過這個語義域中若干概念的出現(xiàn),發(fā)明的方法然后可以自動地確定該文本內(nèi)容CZ涉及商業(yè)。
[0063]子步驟E2d包括對語義數(shù)據(jù)加權(quán)。作為每個語義數(shù)據(jù)及其同義詞和上位詞的出現(xiàn)數(shù)量的函數(shù),權(quán)重可以被指派以識別語義數(shù)據(jù)的重要性并且表現(xiàn)文本內(nèi)容CZ。
[0064]還可以指派更高的權(quán)重。
[0065]在實(shí)踐中,這個子步驟可以與子步驟E2c同時執(zhí)行。
[0066]它還可以包括對語義數(shù)據(jù)的過濾,來僅保存權(quán)重超過某個閾值的語義數(shù)據(jù),或者根據(jù)基于這些權(quán)重的排序的有限數(shù)量的語義數(shù)據(jù),這些語義數(shù)據(jù)將被使用在隨后的步驟中。
[0067]在本發(fā)明的一個實(shí)施例中,有可能對文本內(nèi)容CZ執(zhí)行語法分析,以便確定該語義數(shù)據(jù)的語法功能并且在它們之間構(gòu)建邏輯鏈接。
[0068]這種鏈接可以通過“主語-動詞-賓語”關(guān)系來形式化。
[0069]本發(fā)明的方法尋求在句子或詞組中識別“主語”、“動詞”、以及“賓語”功能,并且通過語義分析,在三個所提取的元素之間建立這樣的鏈接。自然地,各種方法都是可能的。
[0070]一種可能的方法可以包括:
[0071]?從句子或詞組提取主語。這個主語,動作的作者,可以被識別為個人、知名組織、真實(shí)位置等。詞典可以用于這樣的識別。
[0072]?檢測接近于所提取的主語的動詞。再次地,這里可以使用詞典來識別動詞形式。還可以規(guī)劃考慮給定動詞的變化形式和各種形式。取決于該形式,一個人可以提取附加語義信息來知道其是否涉及一個動作(動作動詞)或一種狀態(tài)(被動式、過去分詞)。
[0073]?提取接近于該動詞的關(guān)鍵詞和概念以識別該動作的“賓語”。
[0074]為了提高這個過程的效率,可以規(guī)劃僅考慮及物動詞。這些使得有可能構(gòu)建更貼近的“主語-動詞-賓語”關(guān)系。為了這樣做,用來提取動詞形式的詞典可以僅包含及物動
o
[0075]還可以規(guī)劃把對“主語-動詞-賓語”關(guān)系的創(chuàng)建從屬于對賓語的確定,賓語也屬于語料庫,而語料庫屬于詞典。接著“主語”的該示例,這個“賓語”可以是個人、知名組織、
真實(shí)位置等。
[0076]然后,步驟E3可以包括基于該語義數(shù)據(jù)來確定至少一個服務(wù)。
[0077]事實(shí)上,一些視頻內(nèi)容提供服務(wù)專業(yè)于一個主題(體育、新聞、藝術(shù)短片、教育等),并且取決于從文本內(nèi)容CZ所提取的語義數(shù)據(jù),其可能有關(guān)于把最相關(guān)的服務(wù)作為目標(biāo)。
[0078]多面手服務(wù),例如DailyMotion或YouTube也可被查詢,或者系統(tǒng)地被查詢,另外,或者如果沒有專業(yè)于所提取主題的服務(wù),或者如果它們是不足的,而偶爾地被查詢。
[0079]可替換地,這些服務(wù) 可以通過配置而被靜態(tài)地識別。
[0080]步驟E4包括基于語義數(shù)據(jù),為所識別的服務(wù)或多個服務(wù)自動生成查詢。
[0081]典型地,這可以包括構(gòu)建HTTP (超文本傳輸協(xié)議)查詢,HTTP查詢包含全部或部分的所提取語義數(shù)據(jù)作為參數(shù)。
[0082]這些數(shù)據(jù)可以用來構(gòu)建單個查詢或多個查詢。因此,有可能構(gòu)建與具有超出某個閾值的權(quán)重的語義數(shù)據(jù)一樣多的查詢。
[0083]同樣,在包括提取“主語-動詞-賓語”關(guān)系的實(shí)施方式中,可以有可能為每個關(guān)系構(gòu)建不同的查詢。
[0084]可以逐句地或者逐個詞語集團(tuán)地瀏覽所有的文本內(nèi)容CZ。對于每個句子或詞語集團(tuán),如果存在“主語-動詞-賓語”關(guān)系,則它們可以被用來構(gòu)建查詢;否則,查詢可以從原始語義數(shù)據(jù)來構(gòu)建。
[0085]這些查詢使得有可能檢索在所識別的服務(wù)或多個服務(wù)上可用的一組視頻。
[0086]這些視頻然后可以在人機(jī)界面WB中,并且更具體地,在瀏覽器空間WP中,被呈現(xiàn)給用戶。
[0087]在本發(fā)明的一個實(shí)施例中,有可能實(shí)施文本內(nèi)容CZ與檢索到的視頻之間的語義接近度的標(biāo)準(zhǔn)。
[0088]可以基于在先前的步驟中從文本內(nèi)容CZ所提取的語義數(shù)據(jù),以及與檢索到的視頻相關(guān)聯(lián)的語義內(nèi)容,來計(jì)算語義接近度。這些數(shù)據(jù)可以是由用戶:“標(biāo)簽”、域:“標(biāo)題”、“描述”等所保存的原始數(shù)據(jù)。
[0089]還有可能實(shí)施對檢索到的視頻的分析。
[0090]因此,有可能相當(dāng)容易地確定質(zhì)地(海、砂、冰等)和/或顏色。
[0091]還有可能實(shí)施形狀辨識算法。這些算法尋求從恒量(也就是說,不依賴于視角而改變的形狀的部分)來確定已知的外形。
[0092]各種方法可以一起使用以獲得協(xié)同效果:
[0093]-例如,通過形狀分析對海豹的確定,可能使得有可能確認(rèn)所檢測的質(zhì)地實(shí)際上是冰。一個人然后能夠減少誤差并且提高結(jié)果的可靠性。
[0094]-在另一個示例中,與對形狀的確定相關(guān)的對顏色的確定能夠使得有可能增加含義。一個人能夠因此確定“黑馬”的存在,比對馬的簡單確定更加有判別性的概念。
[0095]有可能對來自視頻的圖像(或一系列圖像)執(zhí)行全局分析。因此,一個人能夠分析環(huán)境光水平并且從它抽取語義信息。例如,如果一個人還已經(jīng)檢測到該屏幕是戶外,他可以確定是否是白天或者夜晚。
[0096]通過比較這個信息,特別是通過使用本體,有可能確定距離。
[0097]各種方法也有可能用于建立這樣的距離。
[0098]特別是:
[0099]-在給定的本體中的概念之間的啟發(fā)式度量(heuristicmetrics),基于圖形中將被覆蓋的距離。這個距離可以是圖形上節(jié)點(diǎn)的數(shù)量,其中節(jié)點(diǎn)是關(guān)鍵詞或概念。某些配對通過鏈接直接連接。鏈接可以是定向的或者對稱的。如果兩個詞語之間的鏈接是對稱的,則這兩個詞語之間的關(guān)系更強(qiáng)。例如,這個距離可以有可能量化兩個概念的相似性。它還可用于消除歧義的目的。
[0100]-TF-1DF(術(shù)語頻率-反向文檔頻率)方法是在彳目息搜索中以及特別是在文本比較中經(jīng)常使用的加權(quán)方法。這個統(tǒng)計(jì)測量使得有可能評價文檔中所包含的術(shù)語相對于集合或語料庫的重要性。該權(quán)重與該詞語在文檔中的出現(xiàn)次數(shù)成比例地增加。它還基于語料庫中的該詞語的頻率而變化。原始公式的替代公式經(jīng)常被使用在搜索引擎中,來評估一個文檔關(guān)于用戶的搜索標(biāo)準(zhǔn)的相關(guān)性。
[0101]例如,如果詞語“恐龍”在IDF語料庫中具有低出現(xiàn)率,這可能意味著它更重要,因?yàn)樗绕胀ǖ脑~語更有判別性;如果詞語出現(xiàn)在所提取的詞語的每個“TF”列表中(鏈接到從上下文提取的語料庫的列表以及鏈接到從視頻描述提取的語料庫的列表),基于它的出現(xiàn)數(shù)量,一個人可以給予它較高或較低的權(quán)重。在兩個列表上都發(fā)現(xiàn)該詞語的事實(shí),使得有可能基于IDF值來定義一個或強(qiáng)或弱的鏈接。
[0102]一個人還可以組合這兩種方法。例如,在從上下文提取的詞語的第一列表中,一個人發(fā)現(xiàn)了詞語“恐龍”,詞語“恐龍”在IDF語料庫中具有相對高的權(quán)重。在從視頻描述提取的第二列表中,一個人發(fā)現(xiàn)詞語“暴龍”。該圖形示出,存在具有兩跳(該圖形中的節(jié)點(diǎn)數(shù)量)的對稱鏈接。因此,一個人能夠考慮,這個視頻的上下文示出了與“IDF值/跳數(shù)”的相似性。
[0103]通過將這種算法應(yīng)用到每個詞語,一個人能夠因此計(jì)算出總體的相似性。
[0104]基于每個檢索到的視頻的距離,有可能對它們排序,以便于以最相關(guān)的方式將它們呈現(xiàn)給用戶:因此,具有與文本內(nèi)容CZ最接近的接近度的視頻,將在檢索到的其他相關(guān)視頻之前被呈現(xiàn)。
[0105]還有可能基于接近度標(biāo)準(zhǔn),來選擇檢索到的視頻的子集。
[0106]這可以包括:根據(jù)排序,僅選擇預(yù)定數(shù)量的視頻,該排序基于它們與文本內(nèi)容CZ的語義距離。[0107]它還可以包括僅選擇對應(yīng)于預(yù)定閾值之下的語義距離的視頻。如果沒有一個檢索到的視頻是足夠接近的,這個實(shí)施例可以因此不將任何視頻內(nèi)容示出給用戶。
[0108]對本領(lǐng)域的技術(shù)人員,其他替代方案和實(shí)施例也是可能的以及可得到的。本發(fā)明因此不能被理解為被限制于上面所描述的這些實(shí)施方式。
【權(quán)利要求】
1.一種用于輔助用戶通過通信網(wǎng)絡(luò)搜索視頻內(nèi)容的方法,包括: ?由所述用戶確定第一內(nèi)容項(xiàng)目(CZ)的步驟; ?從這個第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的步驟; ?根據(jù)所述語義數(shù)據(jù)針對至少一個服務(wù)自動生成查詢、使得能夠在所述至少一個服務(wù)上檢索一個視頻集合的步驟; ?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
2.根據(jù)前一個權(quán)利要求所述的方法,還包括:基于所述第一內(nèi)容與關(guān)聯(lián)于所述集合中的視頻的描述之間的語義接近度的標(biāo)準(zhǔn),從所述集合中選擇視頻子集的步驟。
3.根據(jù)前一個權(quán)利要求所述的方法,其中基于所述語義數(shù)據(jù)來確定所述至少一個服務(wù)。
4.根據(jù)前述權(quán)利要求之一所述的方法,其中所述步驟可以由在人機(jī)界面(WB)中選擇第一內(nèi)容項(xiàng)目(CZ)以及由選擇通過所述人機(jī)界面可訪問的軟件功能而被觸發(fā)。
5.根據(jù)前述權(quán)利要求之一所述的方法,其中所述自動提取語義數(shù)據(jù)的步驟包括提取“主語-動詞-賓語”關(guān)系。
6.根據(jù)前一個權(quán)利要求所述的方法,其中基于所述關(guān)系來構(gòu)建所生成的所述查詢。
7.一種通信終端,裝備有處理裝置以實(shí)施根據(jù)前述權(quán)利要求之一所述的方法。
8.一種計(jì)算機(jī)程序,裝備`有處理裝置以實(shí)施根據(jù)權(quán)利要求1-7之一所述的方法。
9.一種用于通信終端的人機(jī)界面(WB),裝備有使得用戶能夠選擇第一內(nèi)容項(xiàng)目(CZ)的裝置,以及使得能夠觸發(fā)以下步驟的裝置: ?從所述第一內(nèi)容項(xiàng)目自動提取語義數(shù)據(jù)的步驟; ?根據(jù)所述語義數(shù)據(jù)針對至少一個服務(wù)自動生成查詢、使得能夠在所述至少一個服務(wù)上檢索一個視頻集合的步驟; ?將所述視頻集合呈現(xiàn)給所述用戶的步驟。
【文檔編號】G06F17/30GK103562912SQ201280023863
【公開日】2014年2月5日 申請日期:2012年4月27日 優(yōu)先權(quán)日:2011年5月17日
【發(fā)明者】S·斯奎汀, A·范貝爾 申請人:阿爾卡特朗訊