欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

視頻搜索方法、系統(tǒng)及建立視頻數(shù)據(jù)庫(kù)的方法

文檔序號(hào):6354117閱讀:483來(lái)源:國(guó)知局
專利名稱:視頻搜索方法、系統(tǒng)及建立視頻數(shù)據(jù)庫(kù)的方法
技術(shù)領(lǐng)域
本發(fā)明涉及視頻搜索領(lǐng)域,特別是涉及一種以視頻內(nèi)容作為搜索輸入條件來(lái)進(jìn)行視頻搜索的搜索方法、系統(tǒng)、及用于此視頻搜索方法的視頻數(shù)據(jù)庫(kù)建立方法。
背景技術(shù)
目前網(wǎng)絡(luò)上的搜索技術(shù),大多是以文字(Text)搜索為主的技術(shù),例如Google、 Yahoo、Youtube或是國(guó)內(nèi)的其他小站等等搜索引擎,都是以文字搜索為主。雖然各搜索引擎都希望能突破文字的限制,例如在相同關(guān)鍵詞下,可搜索繁體中文或是簡(jiǎn)體中文、甚至其它語(yǔ)言的內(nèi)容,但畢竟還是受到文字關(guān)鍵詞的限制。例如,若希望能搜索相關(guān)的多媒體數(shù)據(jù),包括聲音文件或是影像文件,常常因?yàn)闆](méi)有足夠的文字內(nèi)容可作為搜索的依據(jù),或是各國(guó)家采用不同的翻譯名稱,造成徒有關(guān)鍵詞卻無(wú)法找出正確或者更多相關(guān)的數(shù)據(jù)。搜索引擎Google在2009年4月份推出以照片找照片的服務(wù),是以照片內(nèi)容 (Content)找具有相關(guān)內(nèi)容(Content)數(shù)據(jù)的服務(wù)。例如,請(qǐng)參照?qǐng)D1A,當(dāng)在輸入框120輸入“apple”關(guān)鍵詞110時(shí),會(huì)出現(xiàn)跟“apple”有關(guān)的相關(guān)資料,但此時(shí)包括以蘋果造型所有的影像,以及商標(biāo)“Apple ”的相關(guān)產(chǎn)品手機(jī)“iPhone”。此時(shí),若再進(jìn)一步點(diǎn)選時(shí),就可以排除許多不適用數(shù)據(jù)。例如圖1B,使用者選取與蘋果造型相關(guān)的影像后,搜索引擎進(jìn)一步顯示與此類水果(蘋果)相關(guān)的影像。而又例如圖1C,使用者選取與商標(biāo)“Apple"”相關(guān)產(chǎn)品手機(jī)“iWione”影像后,則顯示與此產(chǎn)品相關(guān)的其它影像,更精確地找出使用者所要搜索的照片。但此技術(shù)很顯然是用影像(Image)內(nèi)容來(lái)搜索影像(Image),但僅限于相關(guān)照片圖檔的搜索,對(duì)于多媒體文件,并沒(méi)有任何方法可以搜索。為突破此限制,在活動(dòng)影像專業(yè)人員組織(Motion Picture Expert Group,以下簡(jiǎn)稱MPEG)制定的技術(shù)協(xié)議MPEG-7中,提出一種具有對(duì)內(nèi)容提供補(bǔ)充信息的標(biāo)準(zhǔn),特別是針對(duì)多媒體數(shù)字內(nèi)容。在此MPEG-7標(biāo)準(zhǔn)中,對(duì)于多媒體可以提供相關(guān)對(duì)應(yīng)的內(nèi)容描述 (Multimedia Content Description),而且可以獨(dú)立于其它的MPEG標(biāo)準(zhǔn),而此數(shù)字內(nèi)容描述甚至可以附加在模擬的電影文件中。對(duì)于每一個(gè)視聽內(nèi)容(Audio-visual Content)都可賦予對(duì)應(yīng)的內(nèi)容描述 (Content Description),此內(nèi)容描述主要是提出此視聽內(nèi)容的相關(guān)特征值。而其文件編排的方式,則是例如AV+Descript+AV+Desript+AV+Desript+···此“AV”即代表視聽內(nèi)容(Audio-visual Content),而“Desript”則是代表對(duì)應(yīng)的內(nèi)容描述(Content Description)。但這樣的架構(gòu)過(guò)于復(fù)雜,必須對(duì)于所有的多媒體文件進(jìn)行重新編排,不適合既有的文件與架構(gòu)。另外,雖然可以經(jīng)由特征值,借由類似關(guān)鍵詞的搜索,而找出相關(guān)的多媒體文件,但是,卻無(wú)法跳脫以文字搜索造成不同語(yǔ)言之間的隔閡。此外,隨著網(wǎng)絡(luò)與TV的結(jié)合日漸普及,在電視上要進(jìn)行視頻搜索將不可避免會(huì)碰到關(guān)鍵詞輸入的問(wèn)題。一般人看電視手頭上所握的都是一個(gè)遙控器,以遙控的大小與功能是無(wú)法取代鍵盤作為文字輸入的裝置,因此在網(wǎng)絡(luò)TV上利用遙控器來(lái)控制視頻搜索是未來(lái)此類應(yīng)用的一個(gè)問(wèn)題點(diǎn)所在。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種視頻搜索方法、系統(tǒng)及建立視頻數(shù)據(jù)庫(kù)的方法。其能夠建立一個(gè)以視頻內(nèi)容作為搜索條件的技術(shù),達(dá)到以視頻找視頻的搜索結(jié)果。為實(shí)現(xiàn)本發(fā)明的目的而提供一種視頻搜索方法,包括接收一查詢短片(Query Clip)的元數(shù)據(jù)(Meta-data),其中元數(shù)據(jù)包括一第一索引標(biāo)簽與一第一語(yǔ)意樣式。根據(jù)上述第一索引標(biāo)簽從至少一視頻數(shù)據(jù)庫(kù)中取得一或多個(gè)候選視頻短片。根據(jù)所述第一語(yǔ)意樣式逐一與每一候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì),而根據(jù)一比對(duì)結(jié)果將每一候選視頻短片標(biāo)示為可回傳視頻短片或不可回傳視頻短片。標(biāo)示為可回傳視頻短片的所述候選視頻短片則為符合查詢短片的查詢結(jié)果。對(duì)該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì)的方式包括計(jì)算該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式的語(yǔ)意長(zhǎng)度;以及與一臨界值進(jìn)行比較,若該語(yǔ)意長(zhǎng)度小于該臨界值,則將該候選視頻短片標(biāo)示為可回傳視頻短片,若該語(yǔ)意長(zhǎng)度大于該臨界值,則將該候選視頻短片標(biāo)示為不可回傳視頻短片。該查詢短片為使用者選擇一時(shí)間長(zhǎng)度的視頻文件。該查詢短片為經(jīng)由一使用者接口連結(jié)選擇一時(shí)間長(zhǎng)度的視頻文件。所接收的該查詢短片的元數(shù)據(jù),是在一使用者進(jìn)行一文字查詢后,取得一響應(yīng)視頻文件與其元數(shù)據(jù)后,根據(jù)該使用者選擇一時(shí)間長(zhǎng)度的部分該視頻文件,作為該查詢短片的元數(shù)據(jù)。所述的視頻搜索方法,更包括將該第一語(yǔ)意樣式與每一該候選視頻短片及與該候選視頻短片兩側(cè)鄰近的視頻短片進(jìn)行比對(duì)而得到該比對(duì)結(jié)果。為實(shí)現(xiàn)本發(fā)明的目的還提供一種建立可根據(jù)查詢短片(Query Clip)查詢視頻的視頻數(shù)據(jù)庫(kù)的方法。此視頻數(shù)據(jù)庫(kù)包括儲(chǔ)存多個(gè)視頻比特(bit)串流及該視頻比特串流的元數(shù)據(jù)(Meta-data)。每一所述元數(shù)據(jù)的建立方法包括對(duì)視頻比特串流以一分割偵測(cè)流程進(jìn)行分割處理,產(chǎn)生多個(gè)片段。對(duì)所述片段進(jìn)行索引的編排,而根據(jù)每一片段的內(nèi)容賦予對(duì)應(yīng)的一索引標(biāo)簽。根據(jù)每一所述片段的視頻特征(Video Feature)建立片段的語(yǔ)意樣式, 其中元數(shù)據(jù)至少包括所述片段所對(duì)應(yīng)的索引標(biāo)簽與語(yǔ)意樣式。對(duì)該視頻比特串流以該分割偵測(cè)流程進(jìn)行分割處理的流程包括根據(jù)場(chǎng)景變換點(diǎn)切割該視頻比特串流。該場(chǎng)景變換點(diǎn)的選擇是根據(jù)HSV長(zhǎng)條圖轉(zhuǎn)換所得結(jié)果判斷是否為該場(chǎng)景變換點(diǎn)。根據(jù)轉(zhuǎn)換所得結(jié)果是根據(jù)兩相鄰幀之間的HSV長(zhǎng)條圖轉(zhuǎn)換后,兩者的距離比較后所得到的結(jié)果。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的長(zhǎng)度賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的HSV色彩空間的色調(diào)Hue的角度賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向、該片段的長(zhǎng)度、每一該片段的HSV色彩空間的色調(diào)Hue的角度三者的任意組合而賦予對(duì)應(yīng)的該索引標(biāo)簽。為實(shí)現(xiàn)本發(fā)明的目的還提供一種視頻搜索系統(tǒng),包括一搜索引擎與至少一視頻數(shù)據(jù)庫(kù)。此搜索引擎用以接收一查詢短片(Query Clip)的元數(shù)據(jù)(Meta-data),其中所述元數(shù)據(jù)包括一第一索引標(biāo)簽與一第一語(yǔ)意樣式。此視頻數(shù)據(jù)庫(kù)包括多個(gè)視頻短片,其中搜索引擎根據(jù)第一索引標(biāo)簽從一視頻數(shù)據(jù)庫(kù)中取得一或多個(gè)候選視頻短片,并根據(jù)第一語(yǔ)意樣式逐一與每一候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì),而根據(jù)一比對(duì)結(jié)果將每一候選視頻短片標(biāo)示為可回傳視頻短片或不可回傳視頻短片,其中標(biāo)示為可回傳視頻短片的候選視頻短片則為符合查詢短片的查詢結(jié)果。該視頻數(shù)據(jù)庫(kù)儲(chǔ)存多個(gè)視頻比特串流及該視頻比特串流的元數(shù)據(jù),其中每一該元數(shù)據(jù)的建立包括對(duì)該視頻比特串流以一分割偵測(cè)流程進(jìn)行分割處理,產(chǎn)生多個(gè)片段;對(duì)該片段進(jìn)行索引的編排,而根據(jù)每一該片段的內(nèi)容賦予對(duì)應(yīng)的一索引標(biāo)簽;以及根據(jù)每一該片段的視頻特征建立該片段的語(yǔ)意樣式,其中該元數(shù)據(jù)至少包括該片段所對(duì)應(yīng)的該索引標(biāo)簽與該語(yǔ)意樣式。對(duì)該視頻比特串流以該分割偵測(cè)流程進(jìn)行分割處理的流程包括根據(jù)場(chǎng)景變換點(diǎn)切割該視頻比特串流。該場(chǎng)景變換點(diǎn)的選擇是根據(jù)HSV長(zhǎng)條圖轉(zhuǎn)換所得結(jié)果判斷是否為該場(chǎng)景變換點(diǎn)。根據(jù)轉(zhuǎn)換所得結(jié)果是根據(jù)兩相鄰幀之間的HSV長(zhǎng)條圖轉(zhuǎn)換后,兩者的距離比較后所得到的結(jié)果。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的長(zhǎng)度賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的HSV色彩空間的色調(diào)Hue的角度賦予對(duì)應(yīng)的該索引標(biāo)簽。對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向、該片段的長(zhǎng)度、每一該片段的HSV色彩空間的色調(diào)Hue的角度三者的任意組合而賦予對(duì)應(yīng)的該索引標(biāo)簽。所述的視頻搜索系統(tǒng),更包括一使用端,其中該查詢短片為該使用端選擇一時(shí)間長(zhǎng)度的視頻文件。所述的視頻搜索系統(tǒng),更包括一使用端,其中該查詢短片為經(jīng)由該使用端的一使用者界面連結(jié)選擇一時(shí)間長(zhǎng)度的視頻文件。對(duì)該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì)的方式包括計(jì)算該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式的語(yǔ)意長(zhǎng)度;以及與一臨界值進(jìn)行比較,若該語(yǔ)意長(zhǎng)度小于該臨界值,則將該候選視頻短片標(biāo)示為可回傳視頻短片,若該語(yǔ)意長(zhǎng)度大于該臨界值,則將該候選視頻短片標(biāo)示為不可回傳視頻短片。所接收的該查詢短片的元數(shù)據(jù),是在一使用者進(jìn)行一文字查詢后,取得一響應(yīng)視頻文件與其元數(shù)據(jù)后,根據(jù)該使用者選擇一時(shí)間長(zhǎng)度的部分該視頻文件,作為該查詢短片的元數(shù)據(jù)。該視頻數(shù)據(jù)庫(kù)配置于遠(yuǎn)程主機(jī),其中該搜索引擎可與該遠(yuǎn)程主機(jī)建立一通連管道,用以存取該視頻數(shù)據(jù)庫(kù)。所述的視頻搜索系統(tǒng),更包括將該第一語(yǔ)意樣式與每一該候選視頻短片及與該候選視頻短片兩側(cè)鄰近的視頻短片進(jìn)行比對(duì)而得到該比對(duì)結(jié)果。以下結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。


圖IA IC是現(xiàn)有的一種以文字名稱查找影像的搜索方法示意圖;圖2A與2B是說(shuō)明本發(fā)明一實(shí)施范例中,選擇一段視頻進(jìn)行搜索的流程示意圖;圖3是說(shuō)明本發(fā)明一實(shí)施范例中,建立視頻數(shù)據(jù)庫(kù)的建立步驟流程示意圖;圖4是說(shuō)明本發(fā)明一實(shí)施例中對(duì)于視頻比特串流建立元數(shù)據(jù)的方法示意圖;圖5A是說(shuō)明HSV色彩空間示意圖;圖5B是將HSV色彩空間經(jīng)由HSV長(zhǎng)條圖(HSV Histogram)剖析法轉(zhuǎn)換的分布圖;圖5C是將視頻文件HSV長(zhǎng)條圖(HSV Histogram)剖析法轉(zhuǎn)換產(chǎn)生長(zhǎng)條圖流程示意圖;圖6(a) (C)是說(shuō)明本發(fā)明一實(shí)施例中,將視頻文件切成幾個(gè)小片段后,對(duì)每一片段賦予索引標(biāo)簽(Index Tag)的不同選擇示意圖;圖7A 7D是說(shuō)明本發(fā)明一實(shí)施例中,產(chǎn)生語(yǔ)意樣式的示意圖;圖8是取得類似視頻短片的步驟流程示意圖;圖9是說(shuō)明本發(fā)明一實(shí)施例中,進(jìn)行查詢短片(Query Clip)與候選視頻短片的比較方法一實(shí)施例示意圖;圖10是說(shuō)明本發(fā)明一實(shí)施例中,從候選視頻短片中選擇可回傳給使用者的視頻片段示意圖。其中,附圖標(biāo)記110:關(guān)鍵詞120 輸入框210、230、232、234 影片220 搜索引擎(Search Engine)240、242、244 視頻數(shù)據(jù)庫(kù)310 視頻比特串流350 儲(chǔ)存系統(tǒng)
具體實(shí)施例方式本發(fā)明提出了一種新的視頻搜索技術(shù),突破目前以文字為主的搜索技術(shù),建立一個(gè)以視頻內(nèi)容作為搜索條件的技術(shù),達(dá)到以視頻找視頻的搜索結(jié)果。在本發(fā)明實(shí)施范例其中之一,是選擇其中一段視頻文件作為檢索信息(Query Message),此選擇方式不論是透過(guò)使用者選擇任一時(shí)間長(zhǎng)度的視頻文件,或是經(jīng)由使用者界面自動(dòng)選取其中一段固定或特定期間的視頻文件等等方式皆可運(yùn)用在此實(shí)施例中。上述的使用者選擇方式,在一實(shí)施例中,可內(nèi)建于控制影片播放的遙控裝置中,例如電視或是DVD的播放器等等。或是內(nèi)建于觸控顯示器或屏幕上的使用者界面,能讓使用者方便且簡(jiǎn)單的方式停住一段時(shí)間的影片作為檢索信息等,均屬本發(fā)明的應(yīng)用。針對(duì)選擇作為檢索條件的視頻文件,由于其名稱或是影片格式,甚至畫面大小與質(zhì)量可能有所不同,但若為同一部影片,其劇情是相同的。所以,只要針對(duì)所選擇的視頻文件,建立檢索索引Gearch Index),即可找出相同或是相似劇情的影片。例如對(duì)作為檢索條件的視頻文件以及欲進(jìn)行檢索的所有其它視頻文件,可先經(jīng)由格式轉(zhuǎn)換而轉(zhuǎn)換為具有相同格式的視頻文件。由于本實(shí)施例加入了時(shí)間軸(Time Domain)的特征,因此,可在所欲進(jìn)行檢索的所有其它視頻文件中找出相同時(shí)間軸區(qū)段的對(duì)應(yīng)視頻文件,而后,經(jīng)由運(yùn)算轉(zhuǎn)換為具有相同格式的視頻文件。在一實(shí)施例中,所有欲進(jìn)行檢索的其它視頻文件可以是存在局域網(wǎng)絡(luò)的主機(jī)、搜索引擎的主機(jī)數(shù)據(jù)庫(kù)、或是云端數(shù)據(jù)庫(kù)等等。而此格式轉(zhuǎn)換的運(yùn)算,可在個(gè)人主機(jī)、 在局域網(wǎng)絡(luò)的系統(tǒng)服務(wù)器、搜索引擎的主機(jī)或是云端運(yùn)算系統(tǒng)等進(jìn)行皆可。本發(fā)明所提出一種針對(duì)新的視頻搜索的方法,在多個(gè)實(shí)施例其中之一,請(qǐng)參照?qǐng)D 2A與圖2B所示。圖2A是說(shuō)明在一視頻影片中選擇其中一段的視頻文件作為檢索信息 (Query Message),以進(jìn)行所謂的內(nèi)容查詢(Content karch)。此選擇方式不論是透過(guò)使用者選擇任一時(shí)間長(zhǎng)度的視頻文件,或是經(jīng)由使用者界面自動(dòng)選取其中一段固定或特定期間的視頻文件等等方式皆可運(yùn)用在此實(shí)施例中。如圖2A為例,當(dāng)使用者在觀看影片名為“葉問(wèn)”時(shí),此影片210的相關(guān)特征為分辨率(Resolution)是 352 X 洲8 (像素)、幀速率(Frame-Rate)每秒 15 個(gè)幀(Frames per second)以及畫面的質(zhì)量(Quality)為低畫質(zhì)(Low)。在此影片中選擇其中一段的視頻文件作為檢索的條件,并且將此檢索信息(Query Message)傳回搜索引擎(karch Engine) 220, 以進(jìn)行所謂的內(nèi)容查詢(Content Search) 0在根據(jù)本實(shí)施例所建立的檢索索引Gearch Index)中進(jìn)行內(nèi)容檢索后,對(duì)于找到的影片文件,例如圖示中的影片230,為不符合條件的影片,因此不會(huì)回傳。但是,例如對(duì)于影片232與234而言,則是符合內(nèi)容檢索的條件,因此,會(huì)將影片 232與234回傳給使用者。而檢索得到的影片,例如圖示中的影片230、232與234,可具有不同的影片特征。例如影片230分辨率是10MX768、幀速率每秒30個(gè)幀以及畫面的質(zhì)量為低畫質(zhì)。影片232分辨率是1920X 1080、幀速率每秒15個(gè)幀以及畫面的質(zhì)量為高畫質(zhì) (High),以及234分辨率是1920X 1080、幀速率每秒30個(gè)幀以及畫面的質(zhì)量為高畫質(zhì)。上述得到的檢索結(jié)果,與原來(lái)的影片并不需要相同的影片特征。圖2B是說(shuō)明在根據(jù)一段視頻文件作為檢索信息,以進(jìn)行內(nèi)容查詢的流程示意圖。 首先,在步驟①中,使用者以文字搜索的方式輸入關(guān)鍵詞,并選擇某部影片來(lái)觀看,也就是說(shuō),使用者先根據(jù)關(guān)鍵詞(Key Words)進(jìn)行檢索,以便找到符合條件的影片。也就是,使用者一開始可以根據(jù)關(guān)鍵詞,完成以文字作為基礎(chǔ)的檢索。而后,在步驟②,搜索引擎220則回傳一個(gè)視頻比特串流(Vi deoBitstream)與其元數(shù)據(jù)(底下稱為Meta-Data)給使用者。 在步驟③中,使用者對(duì)影片中某段劇情有興趣,希望能觀看它不同分辨率及/或不同畫質(zhì)的版本。使用者可選擇視頻文件的其中一部分作為檢索的條件。而后,在步驟④中,可將選擇的視頻短片的Meta-Data數(shù)據(jù)傳回給搜索引擎220。如步驟⑤,搜索引擎220根據(jù)選擇的視頻短片,對(duì)所有可得到的視頻數(shù)據(jù)庫(kù)進(jìn)行檢索,如圖標(biāo)的視頻數(shù)據(jù)庫(kù)240、242與M4,而找出類似的視頻文件。并且接著如步驟⑥,將找出類似的視頻文件回傳給使用者,讓使用者選擇。對(duì)于視頻數(shù)據(jù)庫(kù)M0、242與244而言,在一實(shí)施例中,可以是存在遠(yuǎn)程的主機(jī)中, 例如局域網(wǎng)絡(luò)的主機(jī)、搜索引擎的主機(jī)數(shù)據(jù)庫(kù)、或是云端數(shù)據(jù)庫(kù)等等。而搜索引擎220或是格式轉(zhuǎn)換的運(yùn)算,可在個(gè)人主機(jī)、在局域網(wǎng)絡(luò)的系統(tǒng)服務(wù)器、搜索引擎的主機(jī)或是云端運(yùn)算系統(tǒng)等進(jìn)行皆可。上述搜索引擎220根據(jù)選擇的視頻短片(Video Clip),對(duì)所有可得到的視頻數(shù)據(jù)庫(kù)進(jìn)行檢索,而找出類似的視頻文件。而針對(duì)視頻短片進(jìn)行視頻數(shù)據(jù)庫(kù)的檢索,根據(jù)本發(fā)明多個(gè)實(shí)施例其中之一,需先對(duì)所儲(chǔ)存的所有視頻文件進(jìn)行Meta-Data的建立流程。而后才能進(jìn)行搜索并取得類似的視頻文件。也就是本發(fā)明多個(gè)實(shí)施例其中之一,類似影片搜索的方法,包括底下兩大步驟,首先,為視頻數(shù)據(jù)庫(kù)的建立步驟,其次為取得(Retrieving)類似視頻短片(Video Clip)的步
馬聚ο上述視頻數(shù)據(jù)庫(kù)的建立步驟則是至少包括(1)對(duì)視頻文件的分割(kgmentat ion)與建立索引(Indexing)包括將一個(gè)視頻文件分割為多個(gè)視頻短片(Video Clip),而后賦予每一個(gè)視頻短片一個(gè)索引標(biāo)簽(Index Tag) ; (2)語(yǔ)意樣式(Semantic Pattern)的建立借由視頻特征(Video Feature)建立每個(gè)視頻短片的語(yǔ)意樣式。上述取得(Retrieving)類似視頻短片的步驟至少包括(1)取得候選視頻短片 (Candidate Clips)根據(jù)所選擇一段視頻文件作為檢索條件的檢索短片(Query Clip)尋找具有相同或類似的索引標(biāo)簽(Index Tag)作為候選視頻短片(Candidate Clips) ; (2)語(yǔ)意樣式(Semantic Pattern)的比對(duì)計(jì)算檢索短片(Query Clip)與所有候選視頻短片的語(yǔ)意樣式距離(Semantic Distance),并與一臨界值(Threshold)比較后,判斷是否為類似視頻短片。在一實(shí)施例中,視頻數(shù)據(jù)庫(kù)的建立步驟請(qǐng)參照?qǐng)D3。視頻數(shù)據(jù)庫(kù)的建立流程300 中,針對(duì)所有影片的原始視頻比特串流310,除了將視頻文件全部?jī)?chǔ)存在儲(chǔ)存系統(tǒng)350 外,更加上對(duì)原始視頻比特串流310執(zhí)行視頻比特串流剖析(Parsing)步驟320、建立 Meta-data步驟330以及將所得到的對(duì)應(yīng)Meta-data儲(chǔ)存在儲(chǔ)存系統(tǒng)350。上述關(guān)于對(duì)視頻比特串流的剖析(Parsing)步驟,請(qǐng)參照2010年7月21日所提出美國(guó)第 12/804,477 號(hào),名稱為 “VIDEO SEARCH METHOD USING MOTION VECTORS AND APPARATUS THEREOF”的申請(qǐng)案內(nèi)容,或是2010年6月四日在中國(guó)提出名稱為“使用動(dòng)態(tài)向量的視頻搜索方法及其裝置”的第201010220461. 1號(hào)專利申請(qǐng)案)。上述關(guān)于視頻比特串流的剖析(Parsing)步驟,在一實(shí)施范例中,包括對(duì)一輸入檢索視頻文件與多個(gè)欲進(jìn)行檢索的視頻文件的比特流進(jìn)行剖析,而取出對(duì)應(yīng)的多個(gè)移動(dòng)向量。根據(jù)所述移動(dòng)向量在時(shí)間軸上建立多個(gè)對(duì)應(yīng)的移動(dòng)向量地圖。根據(jù)所述檢索視頻文件的移動(dòng)向量地圖與所述視頻文件的移動(dòng)向量地圖,得到相關(guān)(Correlation)程度,藉以根據(jù)此相關(guān)程度得到視頻搜尋的結(jié)果。在一實(shí)施范例中,提出一種視頻搜尋裝置,包括一串流剖析器、一 3D移動(dòng)向量地圖產(chǎn)生器與一 3D移動(dòng)向量地圖比較器。此串流剖析器用以對(duì)一個(gè)視頻文件的比特流進(jìn)行剖析(Parsing),并且根據(jù)不同比例取出位元流中的移動(dòng)向量(MV) 數(shù)據(jù)。此3D移動(dòng)向量地圖產(chǎn)生器,用以根據(jù)所述移動(dòng)向量建構(gòu)具有時(shí)間軸數(shù)據(jù)的一 3D移動(dòng)向量地圖(3D-MV Map)。而3D移動(dòng)向量地圖比較器用以根據(jù)所述3-D移動(dòng)向量地圖進(jìn)行運(yùn)算,根據(jù)運(yùn)算結(jié)果而找出視頻文件的相關(guān)(Correlation)程度,藉以根據(jù)相關(guān)程度得到視頻搜尋的結(jié)果。在一實(shí)施范例中,提出一種視頻播放裝置,具有一主機(jī)與一控制器。此主機(jī)具有一種視頻搜尋裝置,此視頻裝置包括一串流剖析器、一 3D移動(dòng)向量地圖產(chǎn)生器與一 3D移動(dòng)向量地圖比較器。此控制器具有一功能控制裝置,其中功能控制裝置用以使用者選擇主機(jī)播放的視頻數(shù)據(jù)中的其中一段,作為視頻搜尋裝置的一檢索視頻文件。對(duì)視頻比特串流的剖析(Parsing)步驟若是采用動(dòng)態(tài)向量(Motion Vector) 法時(shí),對(duì)所有視頻文件,通常為已經(jīng)過(guò)壓縮的數(shù)據(jù),對(duì)其比特串流(Bitstream)進(jìn)行剖析 (Parsing),可以選擇性的以一定比例(例如1 2、1 4、1 N,N為幀的數(shù)目)取得對(duì)應(yīng)幀的移動(dòng)向量(MV)值,其目的是為了彈性調(diào)整時(shí)間軸的取樣率。本實(shí)施例將所有視頻文件 (包括作為檢索條件的視頻文件)轉(zhuǎn)換為相同格式的用意,在于所有視頻文件內(nèi)圖框的移動(dòng)向量。也就是說(shuō),對(duì)所有壓縮的視頻文件取出其移動(dòng)向量,據(jù)以建立檢索索引。而對(duì)于不同分辨率的移動(dòng)向量,在本實(shí)施例中,可以利用上調(diào)取樣(Up-Sampling) 或是下調(diào)取樣(Down-Sampling)的方式進(jìn)行改變。例如,一般視頻文件是由很多依照時(shí)間軸順序連續(xù)排列的幀(Frame)所組成,而每個(gè)幀是由很多個(gè)宏區(qū)塊(macroblock,MB)編碼而成,而每個(gè)宏區(qū)塊MB為例如是16 X 16為單位,而對(duì)于每個(gè)宏區(qū)塊MB具有的移動(dòng)向量,有可能一個(gè),也可能具有16個(gè)(一個(gè)MB可再切割成16塊4X4的子方塊),因此不同格式的影片光一個(gè)MB中可能就有1 16個(gè)MV值在其中,對(duì)于后面的MV差值運(yùn)算會(huì)造成無(wú)法對(duì)應(yīng)運(yùn)算。所以,為了統(tǒng)一分辨率,則必須將每個(gè)宏區(qū)塊MB所具有的移動(dòng)向量數(shù)量調(diào)整成一致,在一實(shí)施例中,若是要將η個(gè)移動(dòng)向量調(diào)整成一個(gè),可以采用例如平均法,將η個(gè)移動(dòng)向量的值做一平均數(shù)的計(jì)算。另外,若是要將僅有1個(gè)移動(dòng)向量轉(zhuǎn)為具有η個(gè)移動(dòng)向量的作法,可以將1個(gè)移動(dòng)向量轉(zhuǎn)為η個(gè)相同值的移動(dòng)向量。另外,針對(duì)如何決定宏區(qū)塊MB所具有的移動(dòng)向量是一個(gè)轉(zhuǎn)η個(gè)或是η個(gè)轉(zhuǎn)一個(gè)的方式,可采用統(tǒng)計(jì)法完成。例如針對(duì)MPEG的視頻編碼格式,通常在架構(gòu)上會(huì)定義畫面群組 (Group of Pictures,GOP),例如在MPEG-4協(xié)議處理連續(xù)動(dòng)態(tài)影像時(shí),為達(dá)到比較好的壓縮效果,會(huì)定義此畫面群組(GOP),可以獲得影像數(shù)據(jù)內(nèi)的隨機(jī)存取動(dòng)作,例如在MPEG-4協(xié)議是包括九張畫面(一個(gè)I畫面、兩個(gè)向前預(yù)測(cè)的P畫面與六個(gè)雙向預(yù)測(cè)的B畫面)。因此, 若欲知道采用哪個(gè)移動(dòng)向量數(shù)量比較適合,則在一例子中,可以畫面群組(GOP)為基本單位,針對(duì)其宏區(qū)塊MB的移動(dòng)向量所屬的區(qū)塊大小(Block Size)所占的比率,以例如一臨界值(Threshold)來(lái)決定采用哪個(gè)數(shù)量的移動(dòng)向量進(jìn)行建立檢索索引。對(duì)視頻比特串流的剖析(Parsing)步驟在一實(shí)施例中,也可采用HSV長(zhǎng)條圖(HSV Histogram)剖析法。上述的HSV Histogram剖析法,底下將介紹其中一種實(shí)施范例加以說(shuō)明。請(qǐng)參照?qǐng)D4是說(shuō)明本發(fā)明一實(shí)施例中對(duì)于視頻比特串流建立Meta-data的方法。 對(duì)于一個(gè)視頻比特串流410進(jìn)行分割(kgmentation)后,成為分割視頻文件420。而此分割視頻文件420如圖所示,例如根據(jù)場(chǎng)景變換點(diǎn)(Scene Change Point)轉(zhuǎn)換為5個(gè)不同的片段。而后,則進(jìn)一步對(duì)這5個(gè)片段進(jìn)行索引的編排,成為具有不同索引標(biāo)簽(Index Tag) 的視頻短片430。如圖所示,這5個(gè)片段的索引例如a7b5Cl、^b3C2、a2b5ci、£i4b7c2、以及a3b3c2。 而后,借由視頻特征(Video Feature)建立每個(gè)視頻短片的語(yǔ)意樣式,如圖所示,5個(gè)片段的索引aAcphbfyaAcpi^lV^、以及a3b3c2轉(zhuǎn)換后的語(yǔ)意樣式440分別為“0000”、“ 10”、 “ 1-1-11 ”、“ 10001-101”、以及 “001”。底下將分別就視頻數(shù)據(jù)庫(kù)的Meta-Data建立步驟(1)分割(kgmentation) ; (2) 建立索引(Indexing);以及(3)語(yǔ)意樣式(Semantic Pattern)的產(chǎn)生進(jìn)行說(shuō)明。分割(Segmentation)對(duì)視頻文件進(jìn)行分割,需采用一致的方式。在一實(shí)施例中,對(duì)視頻文件的分割,采用所謂場(chǎng)景變換(Scene Change)的地方當(dāng)作切割視頻文件的點(diǎn),這樣讓每個(gè)切割出來(lái)片段有較高的相似性。以上述場(chǎng)景變換的點(diǎn)所切割出來(lái)的每個(gè)小段視頻文件,在此實(shí)施例中稱為片段(Shot)。而對(duì)于每個(gè)片段(Shot)的選擇,在多個(gè)實(shí)施例其中之一,是采用HSV長(zhǎng)條圖(HSV Histogram)剖析法。也就是,根據(jù)每個(gè)幀(Frame)之間的HSV Histogram的差距當(dāng)作判斷是否要把目前這個(gè)幀當(dāng)成片段邊緣(Shot Boundary)的依據(jù)。HSI色彩空間是從人的視覺(jué)系統(tǒng)出發(fā),用色調(diào)(Hue)、飽和度(Mturation或 Chroma)和亮度(Value、Intensity或Brightness)來(lái)描述色彩。HSV色彩空間可以用一個(gè)圓錐空間模型來(lái)描述,請(qǐng)參照?qǐng)D5A,H代表色調(diào)(Hue)、S代表飽和度(Saturation)、及V代表亮度(Value)。用這種描述色彩空間的圓錐模型相當(dāng)復(fù)雜,但卻是能把色調(diào)、亮度和飽和度的變化情形表現(xiàn)得很清楚。通常把色調(diào)和飽和度通稱為色度,用來(lái)表示顏色的類別與深淺程度。由于人的視覺(jué)對(duì)亮度的敏感程度強(qiáng)于對(duì)顏色濃淡的敏感程度,為了便于色彩處理和識(shí)別,人的視覺(jué)系統(tǒng)經(jīng)常采用HSV色彩空間,它比RGB色彩空間更符合人的視覺(jué)特性。而關(guān)于HSV長(zhǎng)條圖(HSV Histogram)轉(zhuǎn)換,請(qǐng)參照?qǐng)D5B,每個(gè)圖檔在經(jīng)過(guò) Histogram轉(zhuǎn)換后轉(zhuǎn)為三個(gè)分布圖,包括色調(diào)(Hue)分布圖520、飽和度(Saturation)分布圖522、及亮度(Value)分布圖524。而如圖示5C,為說(shuō)明經(jīng)由HSV Histogram轉(zhuǎn)換示意圖。根據(jù)所取得的HSV Histogram當(dāng)成特征,判斷是否要把目前這個(gè)幀當(dāng)成片段邊緣Ghot Boundary)的片段偵測(cè)演繹(Shot Detection Algorithm)方法。而依據(jù)此特征作為是否將這些幀當(dāng)成片段邊緣(Shot Boundary)的依據(jù)。例如,如圖5C所示,針對(duì)取樣幀(Sampling Frames),對(duì)每個(gè)幀進(jìn)行HSV轉(zhuǎn)換,例如對(duì)幀A進(jìn)行轉(zhuǎn)換后得到左側(cè)的HSV分布圖,而對(duì)幀進(jìn)行轉(zhuǎn)換后得到右側(cè)的HSV分布圖,而后,計(jì)算相鄰幀之間的距離(Distance,D),如圖所示D(fi; fi+1)。上述的HSV Histogram轉(zhuǎn)換與分割的可參考例如在IEEE ICIP 2002由Siamik Sural、Gang Qian 與 Sakti Pramanik 所發(fā)表名稱為 “SEGMENTATION AND HISTOGRAM GENERATION USING THE HSV COLOR SPACE F0RIMAGE RETRIEVAL” 的論文內(nèi)容,或是由 Te-Wei Chiang, Tienwei Tsai, Mann-Jung Hsiao 在"Performance Analysis of Color Components in Histogram-Based Image Retrieval,,所提出的距離量測(cè)(Distance Measurement)的方法。建立索引andexing)當(dāng)視頻文件切成幾個(gè)小片段之后,接著要對(duì)這些小片段標(biāo)上索引標(biāo)簽(IndexTag)。對(duì)每個(gè)片段(Shot)加上索引的方法,有許多種不同的實(shí)施例,在部分實(shí)施例中,可參照每個(gè)片段的動(dòng)態(tài)向量(Motion Vector,MV)、片段的長(zhǎng)度、色彩空間的分布(例如色調(diào)Hue 的角度)或其它的特征之一或其各種組合進(jìn)行索引的編輯。在一實(shí)施例中,請(qǐng)參照?qǐng)D6,是利用包括(a)動(dòng)態(tài)向量(Motion Vector)的方向分布、(b)片段的長(zhǎng)度、(c)色彩空間中的色調(diào)Hue的角度分布取得其對(duì)應(yīng)的索引值。如圖 6(a)中的MV的方向分布可分為八個(gè)象限(ai、£i2、a3、£i4、a5、£i6、a7、£i8),圖6(b)則是針對(duì)片段的長(zhǎng)度給予不同的索引值(bi、b2、b3、b4、…),而圖6(c)則是針對(duì)色調(diào)Hue的角度分布可分為三個(gè)象限(Cl、c2、c3)。語(yǔ)意樣式(Semantic Pattern)的產(chǎn)生為了快速的進(jìn)行視頻串流的相似性比較,必須把一段有大量數(shù)據(jù)量的影片轉(zhuǎn)化成具有意義的符號(hào),減少需要比對(duì)的信息,而這串符號(hào)稱為語(yǔ)意樣式(Semantic Pattern) 0 在具體驗(yàn)證的實(shí)例中,請(qǐng)參照?qǐng)D7A,分別找出QCIF-QP^格式影片、QCIF-QP32格式影片與 CIF-QP^格式影片的動(dòng)態(tài)向量(MV)的差異(Difference)加總值810、812、814。此通用圖像格式(Common Image Format, CIF) 一般大小為352 X 288像素,而QCIF則稱為四分之一通用圖像格式(Quarter Common Image Format, QCIF),一般大小為176X144像素。從圖示可以了解,兩段內(nèi)容相同的視頻,雖然有不同的質(zhì)量或是分辨率,但是所形成的動(dòng)態(tài)向量 (MV)差異(Difference)加總值仍會(huì)有高度的相似。建立語(yǔ)意樣式的方法,在多個(gè)實(shí)施例其中之一,可先從幀與幀間的動(dòng)態(tài)向量(MV) 做相減,再把相減完得到的向量取長(zhǎng)度,把這些長(zhǎng)度加總起來(lái)可以當(dāng)成幀與幀間的關(guān)聯(lián),透過(guò)預(yù)定表達(dá)式的轉(zhuǎn)換后,得到一個(gè)總合比目前的總合大Delta值,則得到“1”,小于Delta值則得到“-1”,其它情況則得到”0”,如圖7B與7C所示。經(jīng)過(guò)上述步驟可以把一段影片轉(zhuǎn)換成一串由1、0、-1組成的語(yǔ)意樣式。對(duì)于一個(gè)視頻串流而言,經(jīng)過(guò)上述的步驟后被分割為多個(gè)片段,而后,對(duì)每個(gè)片段產(chǎn)生特定的標(biāo)簽索引與語(yǔ)意樣式。如圖7D中,視頻串流710被分割為多個(gè)片段shot。、shot” shot2、…、shotn720 后,則具有不同的標(biāo)簽索引與語(yǔ)意樣式730。如片段Shotci則是具有標(biāo)簽索引^b1C1與語(yǔ)意樣式(1011-1-100),如標(biāo)號(hào)732所示。片段Shot1則是具有標(biāo)簽索引^b3C2與語(yǔ)意樣式 (-11000000),如標(biāo)號(hào)734所示。而此標(biāo)簽索引則例如圖6 (a)、(b)、(c)所示的標(biāo)簽索引值。取得(Retrieving)類似視頻短片對(duì)于取得(Retrieving)類似視頻短片的步驟至少包括(1)取得候選視頻短片 (Candidate Clips)根據(jù)所選擇一段視頻文件作為檢索條件的檢索短片(Query Clip)尋找具有相同或類似的索引標(biāo)簽(Index Tag)作為候選視頻短片(Candidate Clips) ; (2)語(yǔ)意樣式(Semantic Pattern)的比對(duì)計(jì)算檢索短片(Query Clip)與所有候選視頻短片的語(yǔ)意樣式距離(Semantic Distance),并與一臨界值(Threshold)比較后,判斷是否為類似視頻短片。上述取得類似視頻短片的步驟流程圖,請(qǐng)參照?qǐng)D8,首先,如步驟S810,開始進(jìn)行類似視頻短片的搜索。而步驟S820,則是接收查詢短片(Query Clip)的Meta-data。而后, 如步驟S830,借由索引標(biāo)簽(Index Tag)從視頻數(shù)據(jù)庫(kù)中取得候選視頻短片(假設(shè)具有X 個(gè)短片),也就是候選視頻短片與查詢短片具有相同的索引標(biāo)簽。步驟S840,則計(jì)算借由語(yǔ)意樣式查詢第i個(gè)候選視頻短片與查詢短片之間的語(yǔ)意長(zhǎng)度(Semantic Distance),并接著步驟S850,判斷候選視頻短片與查詢短片之間的語(yǔ)意長(zhǎng)度D的值是否小于臨界值,若否,則進(jìn)行下一個(gè)候選視頻短片i+Ι的比較。若是語(yǔ)意長(zhǎng)度D 的值小于臨界值,則此第i個(gè)候選視頻短片則屬于可以回傳給使用者的類似視頻短片。而步驟S870則是判斷是否完成這些X個(gè)候選視頻短片的比對(duì),若i < X,則繼續(xù)步驟S840,下一個(gè)候選視頻短片i+Ι的比較,若i = X,則如步驟S880,停止此流程。上述語(yǔ)意長(zhǎng)度(Semantic Distance)的比較方法,在一實(shí)施例中可采用底下的式
L
子運(yùn)算= — 其中,4為第i個(gè)候選視頻短片的第κ個(gè)語(yǔ)意樣式,而其數(shù)值
K=O,
可能為1、-1或是0。而%則是查詢短片(Query Clip)的第K個(gè)語(yǔ)意樣式。而L是查詢短片的長(zhǎng)度值。候選視頻短片與查詢短片具有相同或類似的索引標(biāo)簽前述揭露內(nèi)容中,對(duì)視頻文件進(jìn)行分割,采用場(chǎng)景變換(Scene Change)的地方當(dāng)作切割視頻文件的點(diǎn),這樣讓每個(gè)切割出來(lái)片段有較高的相似性。而場(chǎng)景變換的點(diǎn)所切割出來(lái)的每個(gè)小段視頻文件稱為片段(Shot)。而對(duì)于每個(gè)片段(Shot)的選擇,是根據(jù)每個(gè)幀之間的HSV Histogram的差距當(dāng)作判斷是否要把目前這個(gè)幀當(dāng)成片段邊緣Ghot Boundary)的依據(jù)。根據(jù)所取得的HSVHistogram當(dāng)成特征,判斷是否要把目前這個(gè)幀當(dāng)成片段邊緣(Shot Boundary)的片段偵測(cè)演繹(Shot Detection Algorithm)方法。對(duì)于此片段偵測(cè)的方法,可能因?yàn)橐曨l文件的分辨率(Resolution)或是畫質(zhì)(Quality)差異,造成會(huì)有不同的結(jié)果,如圖9所示,對(duì)于影片的質(zhì)量QP = 20的視頻與QP = 40的視頻在時(shí)間軸上會(huì)有所差異,為避免此種誤差,在進(jìn)行查詢短片(Query Clip)與候選視頻短片的比較時(shí),可以將查詢短片的語(yǔ)意樣式,與候選視頻短片與其兩側(cè)鄰近的視頻短片進(jìn)行比對(duì)。也就是,在時(shí)間軸上,將查詢短片的語(yǔ)意樣式從左側(cè)的視頻短片的語(yǔ)意樣式,類似滑動(dòng)比對(duì)的方式進(jìn)行比較,而到右側(cè)的鄰近的視頻短片,以避免產(chǎn)生誤差。如圖10所示,查詢短片QP = 26,語(yǔ)意樣式為010-11-1_11_11 -100011-1-10000000-1,而其中一個(gè)候選短片QP = 32,語(yǔ)意樣式為……
000-110-11-11-100011-1-10000000-1......,臨界值為(3X 查詢長(zhǎng)度)/10= (3X25)/10,
在此例中,查詢長(zhǎng)度為目前正在進(jìn)行比對(duì)的查詢短片(Query Clip)的長(zhǎng)度。計(jì)算后,最短距離=2,小于臨界值,屬類似的視頻文件,所以會(huì)回傳給使用者。而其中另一個(gè)候選短片
QP = 32,語(yǔ)意樣式為......10-1010000000001101-1-111-1-1-1-11......,計(jì)算后,最短距離=
19,大于臨界值,則不屬于類似的視頻文件,不可回傳或不會(huì)回傳給使用者。本發(fā)明的有益效果在于,提出了一種新的視頻搜索技術(shù),突破目前以文字為主的搜索技術(shù),建立一個(gè)以視頻內(nèi)容作為搜索條件的技術(shù),達(dá)到以視頻找視頻的搜索結(jié)果。在本發(fā)明實(shí)施范例其中之一,是選擇其中一段視頻文件作為檢索信息(Query Message),此選擇方式不論是透過(guò)使用者選擇任一時(shí)間長(zhǎng)度的視頻文件,或是經(jīng)由使用者界面自動(dòng)選取其中一段固定或特定期間的視頻文件等等方式皆可運(yùn)用在此實(shí)施例中。針對(duì)選擇作為檢索條件的視頻文件,由于其名稱或是影片格式,甚至畫面大小與質(zhì)量可能有所不同,但若為同一部影片,其劇情是相同的。所以,只要針對(duì)所選擇的視頻文件,建立檢索索引(karch Index),即可找出相同或是相似劇情的影片。例如對(duì)作為檢索條件的視頻文件以及欲進(jìn)行檢索的所有其它視頻文件,可先經(jīng)由格式轉(zhuǎn)換而轉(zhuǎn)換為具有相同格式的視頻文件。由于本實(shí)施例加入了時(shí)間軸(Time Domain)的特征,因此,可在所欲進(jìn)行檢索的所有其它視頻文件中找出相同時(shí)間軸區(qū)段的對(duì)應(yīng)視頻文件,而后,經(jīng)由運(yùn)算轉(zhuǎn)換為具有相同格式的視頻文件。在一實(shí)施例中,所有欲進(jìn)行檢索的其它視頻文件可以是存在局域網(wǎng)絡(luò)的主機(jī)、搜索引擎的主機(jī)數(shù)據(jù)庫(kù)、或是云端數(shù)據(jù)庫(kù)等等。而此格式轉(zhuǎn)換的運(yùn)算,可在個(gè)人主機(jī)、 在局域網(wǎng)絡(luò)的系統(tǒng)服務(wù)器、搜索引擎的主機(jī)或是云端運(yùn)算系統(tǒng)等進(jìn)行皆可。當(dāng)然,本發(fā)明還可有其它多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,熟悉本領(lǐng)域的技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。
權(quán)利要求
1.一種視頻搜索方法,其特征在于,包括接收一查詢短片的元數(shù)據(jù),其中該元數(shù)據(jù)包括一第一索引標(biāo)簽與一第一語(yǔ)意樣式;根據(jù)該第一索引標(biāo)簽從至少一視頻數(shù)據(jù)庫(kù)中取得一或多個(gè)候選視頻短片;以及根據(jù)該第一語(yǔ)意樣式逐一與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì),而根據(jù)一比對(duì)結(jié)果將每一該候選視頻短片標(biāo)示為可回傳視頻短片或不可回傳視頻短片,其中標(biāo)示為該可回傳視頻短片的該候選視頻短片則為符合該查詢短片的查詢結(jié)果。
2.根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,對(duì)該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì)的方式包括計(jì)算該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式的語(yǔ)意長(zhǎng)度;以及與一臨界值進(jìn)行比較,若該語(yǔ)意長(zhǎng)度小于該臨界值,則將該候選視頻短片標(biāo)示為可回傳視頻短片,若該語(yǔ)意長(zhǎng)度大于該臨界值,則將該候選視頻短片標(biāo)示為不可回傳視頻短片。
3.根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,該查詢短片為使用者選擇一時(shí)間長(zhǎng)度的視頻文件。
4.根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,該查詢短片為經(jīng)由一使用者接口連結(jié)選擇一時(shí)間長(zhǎng)度的視頻文件。
5.根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,所接收的該查詢短片的元數(shù)據(jù), 是在一使用者進(jìn)行一文字查詢后,取得一響應(yīng)視頻文件與其元數(shù)據(jù)后,根據(jù)該使用者選擇一時(shí)間長(zhǎng)度的部分該視頻文件,作為該查詢短片的元數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的視頻搜索方法,其特征在于,更包括將該第一語(yǔ)意樣式與每一該候選視頻短片及與該候選視頻短片兩側(cè)鄰近的視頻短片進(jìn)行比對(duì)而得到該比對(duì)結(jié)果。
7.一種視頻搜索系統(tǒng),其特征在于,包括一搜索引擎,用以接收一查詢短片的元數(shù)據(jù),其中該元數(shù)據(jù)包括一第一索引標(biāo)簽與一第一語(yǔ)意樣式;以及至少一視頻數(shù)據(jù)庫(kù),包括多個(gè)視頻短片,其中該搜索引擎根據(jù)該第一索引標(biāo)簽從至少一該視頻數(shù)據(jù)庫(kù)中取得一或多個(gè)候選視頻短片,并根據(jù)該第一語(yǔ)意樣式逐一與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì),而根據(jù)一比對(duì)結(jié)果將每一該候選視頻短片標(biāo)示為可回傳視頻短片或不可回傳視頻短片,其中標(biāo)示為該可回傳視頻短片的該候選視頻短片則為符合該查詢短片的查詢結(jié)果。
8.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,該視頻數(shù)據(jù)庫(kù)儲(chǔ)存多個(gè)視頻比特串流及該視頻比特串流的元數(shù)據(jù),其中每一該元數(shù)據(jù)的建立包括對(duì)該視頻比特串流以一分割偵測(cè)流程進(jìn)行分割處理,產(chǎn)生多個(gè)片段;對(duì)該片段進(jìn)行索引的編排,而根據(jù)每一該片段的內(nèi)容賦予對(duì)應(yīng)的一索引標(biāo)簽;以及根據(jù)每一該片段的視頻特征建立該片段的語(yǔ)意樣式, 其中該元數(shù)據(jù)至少包括該片段所對(duì)應(yīng)的該索引標(biāo)簽與該語(yǔ)意樣式。
9.根據(jù)權(quán)利要求8所述的視頻搜索系統(tǒng),其特征在于,對(duì)該視頻比特串流以該分割偵測(cè)流程進(jìn)行分割處理的流程包括根據(jù)場(chǎng)景變換點(diǎn)切割該視頻比特串流。
10.根據(jù)權(quán)利要求9所述的視頻搜索系統(tǒng),其特征在于,該場(chǎng)景變換點(diǎn)的選擇是根據(jù) HSV長(zhǎng)條圖轉(zhuǎn)換所得結(jié)果判斷是否為該場(chǎng)景變換點(diǎn)。
11.根據(jù)權(quán)利要求10所述的視頻搜索系統(tǒng),其特征在于,根據(jù)轉(zhuǎn)換所得結(jié)果是根據(jù)兩相鄰幀之間的HSV長(zhǎng)條圖轉(zhuǎn)換后,兩者的距離比較后所得到的結(jié)果。
12.根據(jù)權(quán)利要求8所述的視頻搜索系統(tǒng),其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。
13.根據(jù)權(quán)利要求8所述的視頻搜索系統(tǒng),其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的長(zhǎng)度賦予對(duì)應(yīng)的該索引標(biāo)簽。
14.根據(jù)權(quán)利要求8所述的視頻搜索系統(tǒng),其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的HSV色彩空間的色調(diào)Hue的角度賦予對(duì)應(yīng)的該索引標(biāo)簽。
15.根據(jù)權(quán)利要求8所述的視頻搜索系統(tǒng),其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向、該片段的長(zhǎng)度、每一該片段的HSV色彩空間的色調(diào)Hue的角度三者的任意組合而賦予對(duì)應(yīng)的該索引標(biāo)簽。
16.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,更包括一使用端,其中該查詢短片為該使用端選擇一時(shí)間長(zhǎng)度的視頻文件。
17.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,更包括一使用端,其中該查詢短片為經(jīng)由該使用端的一使用者界面連結(jié)選擇一時(shí)間長(zhǎng)度的視頻文件。
18.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,對(duì)該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì)的方式包括計(jì)算該第一語(yǔ)意樣式與每一該候選視頻短片的語(yǔ)意樣式的語(yǔ)意長(zhǎng)度;以及與一臨界值進(jìn)行比較,若該語(yǔ)意長(zhǎng)度小于該臨界值,則將該候選視頻短片標(biāo)示為可回傳視頻短片,若該語(yǔ)意長(zhǎng)度大于該臨界值,則將該候選視頻短片標(biāo)示為不可回傳視頻短片。
19.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,所接收的該查詢短片的元數(shù)據(jù),是在一使用者進(jìn)行一文字查詢后,取得一響應(yīng)視頻文件與其元數(shù)據(jù)后,根據(jù)該使用者選擇一時(shí)間長(zhǎng)度的部分該視頻文件,作為該查詢短片的元數(shù)據(jù)。
20.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,該視頻數(shù)據(jù)庫(kù)配置于遠(yuǎn)程主機(jī),其中該搜索引擎可與該遠(yuǎn)程主機(jī)建立一通連管道,用以存取該視頻數(shù)據(jù)庫(kù)。
21.根據(jù)權(quán)利要求7所述的視頻搜索系統(tǒng),其特征在于,更包括將該第一語(yǔ)意樣式與每一該候選視頻短片及與該候選視頻短片兩側(cè)鄰近的視頻短片進(jìn)行比對(duì)而得到該比對(duì)結(jié)果。
22.一種視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,包括在一數(shù)據(jù)庫(kù)儲(chǔ)存多個(gè)視頻比特串流;以及建立每一該視頻比特串流的元數(shù)據(jù),其中每一該元數(shù)據(jù)的建立方法包括對(duì)該視頻比特串流以一分割偵測(cè)流程進(jìn)行分割處理,產(chǎn)生多個(gè)片段;對(duì)該片段進(jìn)行索引的編排,而根據(jù)每一該片段的內(nèi)容賦予對(duì)應(yīng)的一索引標(biāo)簽;以及根據(jù)每一該片段的視頻特征建立該片段的語(yǔ)意樣式,其中該元數(shù)據(jù)至少包括該片段所對(duì)應(yīng)的該索引標(biāo)簽與該語(yǔ)意樣式。
23.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該視頻比特串流以該分割偵測(cè)流程進(jìn)行分割處理的流程包括根據(jù)場(chǎng)景變換點(diǎn)切割該視頻比特串流。
24.根據(jù)權(quán)利要求23所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,該場(chǎng)景變換點(diǎn)的選擇是根據(jù)HSV長(zhǎng)條圖轉(zhuǎn)換所得結(jié)果判斷是否為該場(chǎng)景變換點(diǎn)。
25.根據(jù)權(quán)利要求M所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,根據(jù)轉(zhuǎn)換所得結(jié)果是根據(jù)兩相鄰幀之間的HSV長(zhǎng)條圖轉(zhuǎn)換后,兩者的距離比較后所得到的結(jié)果。
26.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。
27.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的長(zhǎng)度賦予對(duì)應(yīng)的該索引標(biāo)簽。
28.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的HSV色彩空間的色調(diào)Hue的角度賦予對(duì)應(yīng)的該索引標(biāo)簽。
29.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向賦予對(duì)應(yīng)的該索引標(biāo)簽。
30.根據(jù)權(quán)利要求22所述的視頻數(shù)據(jù)庫(kù)的建立方法,其特征在于,對(duì)該片段進(jìn)行索引的編排,是采用每一該片段的動(dòng)態(tài)向量方向、該片段的長(zhǎng)度、每一該片段的HSV色彩空間的色調(diào)Hue的角度三者的任意組合而賦予對(duì)應(yīng)的該索引標(biāo)簽。
全文摘要
本發(fā)明公開了一種視頻搜索方法、系統(tǒng)及建立視頻數(shù)據(jù)庫(kù)的方法。所述視頻搜索方法,包括接收一查詢短片(Query Clip)的元數(shù)據(jù)(Meta-data),其中元數(shù)據(jù)包括一索引標(biāo)簽與一語(yǔ)意樣式。根據(jù)上述索引標(biāo)簽從至少一視頻數(shù)據(jù)庫(kù)中取得一或多個(gè)候選視頻短片。根據(jù)所述語(yǔ)意樣式逐一與每一候選視頻短片的語(yǔ)意樣式進(jìn)行比對(duì),而根據(jù)一比對(duì)結(jié)果將每一候選視頻短片標(biāo)示為可回傳視頻短片或不可回傳視頻短片。標(biāo)示為可回傳視頻短片的所述候選視頻短片則為符合查詢短片的查詢結(jié)果。更提出一種視頻搜索系統(tǒng)及建立視頻數(shù)據(jù)庫(kù)的方法。
文檔編號(hào)G06F17/30GK102486800SQ20111003264
公開日2012年6月6日 申請(qǐng)日期2011年1月27日 優(yōu)先權(quán)日2010年12月1日
發(fā)明者凃日升, 高榮揚(yáng) 申請(qǐng)人:財(cái)團(tuán)法人工業(yè)技術(shù)研究院
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
关岭| 长泰县| 崇文区| 阳山县| 珲春市| 建始县| 横峰县| 河北省| 都匀市| 黑龙江省| 虎林市| 恩平市| 原平市| 门头沟区| 比如县| 北流市| 大悟县| 河西区| 灵璧县| 乌拉特后旗| 林州市| 南澳县| 新密市| 洛浦县| 新密市| 西贡区| 天长市| 丰台区| 满洲里市| 平谷区| 永平县| 油尖旺区| 明水县| 远安县| 丹江口市| 东港市| 石泉县| 宁陵县| 灵石县| 大英县| 辽源市|