專利名稱:視頻內(nèi)容的搜索裝置的制作方法
技術領域:
本發(fā)明涉及視頻內(nèi)容的搜索裝置。
背景技術:
隨著互聯(lián)網(wǎng)的發(fā)展,搜索引擎成為人們上網(wǎng)必不可少的工具之一。傳統(tǒng)的搜索引擎都是 基于文本搜索(Text Search),稱為是文本搜索引擎。其原理是搜索引擎服務器收集大量 的網(wǎng)頁;并根據(jù)已有的規(guī)則提取網(wǎng)頁中的文本并做分詞(Word Segmentation)處理,常見的 分詞方法,例如基于字符串匹配的分詞方法、基于理解的分詞方法和基于統(tǒng)計的分詞方法; 文本搜索引擎利用文本詞庫做索引表用于快速搜索。用戶在進行搜索的時候,將文本輸入到 服務器,服務器對該文本進行分詞處理后,根據(jù)索引表進行快速的搜索,然后返回結果。
目前,搜索引擎都是基于文本的,即使是一些搜索圖片或視頻的搜索引擎也是通過圖片 或視頻節(jié)目的名稱、說明、介紹、標簽等文本信息進行搜索的。搜索引擎還沒有直接通過視 視頻的信號內(nèi)容進行搜索的。這里,我們所說的視視頻是指視頻文件或者視頻文件。通常視 頻文件包含視頻信號流和視頻信號流。
視頻指紋(video fingerprinting)系統(tǒng)將每一幀(frame)或者幾幀轉化為很小的指紋 (例如32比特大小),然后進行檢索。例如國際專利號為TO2007/127590A2的"基于多分辨率, 多幀率和時域信號的數(shù)字視頻指紋處理方法和系統(tǒng)"(Method and system for fingerprinting digital video object based on multiresolution, multirate and temporal signatures)公開了一種將視頻信號的每幀轉化為84比特或132比特的視頻指紋處理方法。通 過這種方法一個視頻文件就可以被轉換成一個很小的指紋文件。
在視頻文件數(shù)目較少(例如l萬個)的情況下,可以將所有的指紋文件存入到計算機內(nèi)存 中,進行索引后,可方便地進行快速的檢索。上述"基于多分辨率,多幀率和時域信號的數(shù) 字視頻指紋處理方法和系統(tǒng)"即給出了這種方法的詳細步驟。然而,在實際情況下,視頻文 件的數(shù)目要遠遠超過一萬的數(shù)目。例如,目前在互聯(lián)網(wǎng)上出現(xiàn)的視頻文件數(shù)目超過一千萬數(shù) 目,而且數(shù)量在不斷增長。因此采用這種方法很難做出實用的搜索引擎。
發(fā)明內(nèi)容
為了解決上述技術問題,本發(fā)明提供一種視頻內(nèi)容的搜索裝置。本發(fā)明采用如下技術方案 一種音頻內(nèi)容的搜索裝置,包括
音頻指紋提取模塊,用于提取多個音頻文件的音頻指紋;
音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對提取的音頻指紋進行分詞; 索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結果生成音頻指紋索引; 搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻 文件。
進一步地,還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲模塊,用于存儲 音頻指紋、所述音頻指紋索引及其對應的音頻文件。
本發(fā)明通過采用文本搜索引擎中的分詞技術,在視視頻指紋文件上進行分詞處理,然后 采用文本搜索領域中的索引技術對視視頻指紋進行索引處理,索引處理完成后,搜索引擎可 以對用戶輸入的視視頻片段進行搜索。不但方便了用戶的搜索,而且提高了搜索的效率。
以下結合附圖及實施例進一步說明本發(fā)明。
圖1為本發(fā)明視頻內(nèi)容的搜索裝置實施例的流程示意圖。
具體實施例方式
如圖l所示, 一種視頻內(nèi)容的搜索裝置,包括 視頻指紋提取模塊,用于提取多個視頻文件的視頻指紋;
視頻指紋分詞模塊,與所述視頻指紋提取模塊相連接,用于對提取的視頻指紋進行分詞; 索引生成模塊,與所述視頻指紋分詞模塊相連接,用于根據(jù)分詞結果生成視頻指紋索引; 搜索模塊,與所述索引生成模塊相連接,用于提供利用該視頻指紋索引搜索匹配的視頻 文件。
搜索可采用根據(jù)輸入的需要檢索的視頻文件或視頻文件片段,通過所述視頻指紋提取模 塊提取其視頻指紋,并通過視頻指紋分詞模塊對該視頻指紋進行分詞,根據(jù)分詞結果在該視 頻指紋索引中搜索匹配的視頻文件;也可以直接根據(jù)用戶輸入視頻指紋,利用視頻指紋分詞 模塊對該視頻指紋進行分詞后,根據(jù)分詞結果在該視頻指紋索引中搜索匹配的視頻文件。
進一步地,還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲模塊,用于存儲 視頻指紋、所述視頻指紋索引及其對應的視頻文件。所述存儲模塊可以是服務器。上述實施例中的分詞方式可采用多種方式實現(xiàn),以下列舉幾種方式分別說明。 方式一
采用基于統(tǒng)計的中文分詞方法對視頻指紋進行分詞處理。首先將15000個視頻文件生成 寬度固定的指紋文件,其寬度可以是32比特或16比特,得到的每個指紋文件平均由約10000 個寬度固定的指紋組成。每個32比特或16比特的數(shù)據(jù)被看作是中文中的一個字。所有15000 個包含"字"的指紋文件被當作是15000篇"文章",而這些"文章"則作為中文分詞的語料 進行分詞。在統(tǒng)計過程中,對視頻語料中相鄰共現(xiàn)的每個"字"的組合的頻度進行統(tǒng)計。共 現(xiàn)頻度高的組合被認為是一個詞,稱為"指紋詞"。例如,頻度較高的7個連續(xù)的二進制 "00000000000000000000000000000000"的指紋的組合,和5個連續(xù)的二進制
"11111111111111111111111111111111"的指紋的組合被統(tǒng)計是頻度較高的指紋組合,他們 被作為"指紋詞"。 方式二
采用指紋寬度為16比特的視頻指紋提取方法。具體是將方式一中寬度為32比特的指紋 進行間隔采樣得到16比特的指紋。然后采用與方式一相同的基于統(tǒng)計的中文分詞方法進行視 頻指紋的分詞處理。
方式三
采用Job 0ostven等人在2002年發(fā)表在第五次視頻信息系統(tǒng)進展國際會議(Proceeding of the 5th International Conference on Recent Advances in Visual Information Systems.) 上發(fā)表的視頻指紋的特征提取和一種數(shù)據(jù)庫策略(Feature Extraction and a Database strategy for video fingerprinting.)的方法進行視頻指紋提取。然后將32比特的指紋經(jīng) 過間隔采樣后,得到16比特的視頻指紋文件。最后采用與方式一相同的基于統(tǒng)計的中文分詞 方法進行視頻指紋的分詞處理。
權利要求
1、一種音頻內(nèi)容的搜索裝置,其特征在于包括音頻指紋提取模塊,用于提取多個音頻文件的音頻指紋;音頻指紋分詞模塊,與所述音頻指紋提取模塊相連接,用于對提取的音頻指紋進行分詞;索引生成模塊,與所述音頻指紋分詞模塊相連接,用于根據(jù)分詞結果生成音頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該音頻指紋索引搜索匹配的音頻文件。
2、 根據(jù)權利要求l所述的音頻內(nèi)容的搜索裝置,其特征在于還包括連接于所述索引生成模塊與所述搜索模塊之間的存儲模塊,用于存儲音頻指紋、所述音頻指紋索引及其對應的音頻文件。
全文摘要
一種視頻內(nèi)容的搜索裝置,包括視頻指紋提取模塊,用于提取多個視頻文件的視頻指紋;視頻指紋分詞模塊,與所述視頻指紋提取模塊相連接,用于對提取的視頻指紋進行分詞;索引生成模塊,與所述視頻指紋分詞模塊相連接,用于根據(jù)分詞結果生成視頻指紋索引;搜索模塊,與所述索引生成模塊相連接,用于提供利用該視頻指紋索引搜索匹配的視頻文件。本發(fā)明通過采用文本搜索引擎中的分詞技術,在視頻指紋文件上進行分詞處理,然后采用文本搜索領域中的索引技術對視頻指紋進行索引處理,索引處理完成后,搜索引擎可以對用戶輸入的視頻片段進行搜索。不但方便了用戶的搜索,而且提高了搜索的效率。
文檔編號G06F17/30GK101673265SQ20081004285
公開日2010年3月17日 申請日期2008年9月12日 優(yōu)先權日2008年9月12日
發(fā)明者程建章, 連惠城 申請人:未序網(wǎng)絡科技(上海)有限公司