本發(fā)明涉及多媒體技術(shù)領(lǐng)域,特別是涉及一種視頻代表性圖片、片段確定方法和裝置。
背景技術(shù):
隨著多媒體技術(shù)的飛速發(fā)展,各種終端,如,個(gè)人電腦pc、平板電腦pad、智能手機(jī)已經(jīng)成為了人們生活中的重要組成部分。而通觀看視頻也成為了各種終端的主要用途。
目前,各種各樣的視頻提供平臺(tái)能夠?yàn)橛脩籼峁┐罅靠晒┯^看、下載的內(nèi)容,然而大量的內(nèi)容中,用戶除了根據(jù)平時(shí)獲取的一些信息來選擇觀看哪些視頻之外,就只能通過視頻提供平臺(tái)所提供的視頻信息,如:名稱、簡介等來對視頻內(nèi)容有一個(gè)大致的了解,從而對是否關(guān)注或觀看該視頻做出選擇,但是,這種方式仍然不夠直觀,用戶往往沒有充足時(shí)間逐個(gè)了解視頻的信息。
視頻提供平臺(tái)通常會(huì)在展示視頻資源時(shí),同時(shí)顯示視頻的代表性圖片、或者進(jìn)一步提供視頻的代表性片段供用戶查看,而大多數(shù)的用戶也會(huì)選擇通過這種直觀的方式來了解視頻內(nèi)容,并選擇是否觀看,因此,視頻的代表性圖片和片段的選擇很大程度上能夠影響一個(gè)視頻的點(diǎn)擊率。
申請?zhí)枮?01210006960.x的專利申請文件中公開了一種確定視頻代表性圖片(縮影)的方法,該方法通過結(jié)構(gòu)化視頻解析,在邏輯上將一部完整視頻按照故事情況分為多個(gè)片段,由用戶手動(dòng)根據(jù)自身理解來確定出視頻片段的一個(gè)或多個(gè)代表性圖片。
顯而易見的,上述方案在實(shí)現(xiàn)上需要借助人工操作來完成,費(fèi)時(shí)費(fèi)力,且主觀色彩強(qiáng),無法通過科學(xué)、易行的方法確定視頻的代表性圖片和片段。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)中無法通過科學(xué)、易行的方法確定視頻的代表性圖片 和片段的問題,本發(fā)明實(shí)施例期望提供一種視頻代表性圖片、片段確定方法和裝置。
依據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻代表性圖片確定方法,包括:根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
根據(jù)本發(fā)明的另一方面,提供了一種視頻代表性圖片確定裝置,包括:第一關(guān)鍵度確定模塊和代表性圖片確定模塊;其中,所述第一關(guān)鍵度確定模塊,用于根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;所述代表性圖片確定模塊,用于將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
根據(jù)本發(fā)明的又一方面,提供了一種視頻代表性片段確定方法,包括:根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
根據(jù)本發(fā)明的再一方面,提供了一種視頻代表性片段確定裝置,包括:第二關(guān)鍵度確定模塊和代表性片段確定模塊;其中,所述第二關(guān)鍵度確定模塊,用于根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;所述代表性片段確定模塊,用于將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
本發(fā)明實(shí)施例至少具備以下優(yōu)點(diǎn):
本發(fā)明實(shí)施例所提供的一種視頻代表性圖片、片段確定方法和裝置,根 據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略,將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片,這樣,能夠提供一種科學(xué)的方法來確定視頻的代表性圖片,即,完全以觀眾的需要出發(fā)來進(jìn)行視頻代表性圖片的確定,且在代表性圖片的確定過程中,并不要人工參與,避免了用戶主觀意見造成的偏見,且實(shí)現(xiàn)方式簡單、便捷。
附圖說明
圖1示出了本發(fā)明方法實(shí)施例一提供的一種視頻代表性圖片確定方法的步驟流程圖;
圖2示出了本發(fā)明方法實(shí)施例二提供的一種視頻代表性片段確定方法實(shí)的步驟流程圖;
圖3示出了本發(fā)明裝置實(shí)施例一提供的一種視頻代表性圖片確定裝置的結(jié)構(gòu)框圖;
圖4示出了本發(fā)明裝置實(shí)施例一提供的一種視頻代表性圖片確定裝置的一種優(yōu)選結(jié)構(gòu)框圖;
圖5示出了本發(fā)明裝置實(shí)施例一提供的一種視頻代表性圖片確定裝置的另一種優(yōu)選結(jié)構(gòu)框圖;
圖6示出了本發(fā)明裝置實(shí)施例二提供的一種視頻代表性片段確定裝置的基本結(jié)構(gòu)框圖;
圖7示出了本發(fā)明裝置實(shí)施例二提供的一種視頻代表性片段確定裝置的一種優(yōu)選結(jié)構(gòu)框圖;以及
圖8示出了本發(fā)明裝置實(shí)施例二提供的一種視頻代表性片段確定裝置的另一種優(yōu)選結(jié)構(gòu)框圖。
具體實(shí)施方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
方法實(shí)施例一
參照圖1,示出了本發(fā)明的一種視頻代表性圖片確定方法實(shí)施例的步驟流程圖,具體可以包括:
步驟101、根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;
這一步驟中,根據(jù)第一預(yù)設(shè)策略來確定視頻中每一幀圖片的關(guān)鍵度,因此,需要確定第一預(yù)設(shè)策略,而第一預(yù)設(shè)策略可以包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕策略;也就是,第一預(yù)設(shè)策略可以為上述三種策略其中之一、或任意策略之間的組合。在實(shí)際應(yīng)用中,如何應(yīng)用第一預(yù)設(shè)策略,其實(shí)可以根據(jù)視頻提供平臺(tái)的需要來進(jìn)行設(shè)置和調(diào)整。
顧名思義,關(guān)注度策略是由用戶對視頻的關(guān)注度來作為視頻中每一幀圖片的關(guān)鍵度的衡量標(biāo)準(zhǔn)的,具體是指,用戶對視頻中的人,如:演員或表演者的關(guān)注度;音頻分析策略,是由視頻中某些特定音頻,如,掌聲和/或尖叫聲的出現(xiàn)時(shí)間和音量大小來決定的;彈幕分析策略,是與視頻播放過程中用戶所發(fā)表的文字彈幕或聲音彈幕的出現(xiàn)時(shí)間和數(shù)量相關(guān)的。
按照第一預(yù)設(shè)策略所包含的以上三種策略的個(gè)數(shù),對于視頻中每一幀圖片的關(guān)鍵度的確定可以分為以下兩種情況:
第一種情況:當(dāng)所述第一預(yù)設(shè)策略包括所述策略其中之一時(shí),所述根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,包括:確定所述視頻中每一幀圖片在所述第一預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分確定為所述每一幀圖片的關(guān)鍵度。
第二種情況:當(dāng)所述第一預(yù)設(shè)策略包括所述策略中一種以上時(shí),所述根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,包括:確定每一幀圖片在所述第一預(yù)設(shè)策略中每一種策略下得分的加權(quán)和;將所述每一幀圖片的加權(quán)和確定為所述每一幀圖片的關(guān)鍵度。
針對第一種情況,又可以細(xì)分為三種情況,即,當(dāng)?shù)谝活A(yù)設(shè)策略僅包含關(guān)注度策略時(shí)、當(dāng)?shù)谝活A(yù)設(shè)策略僅包含音頻分析策略時(shí)、當(dāng)?shù)谝活A(yù)設(shè)策略僅 包含彈幕分析策略時(shí),也就是,第一預(yù)設(shè)策略為關(guān)注度策略、第一預(yù)設(shè)策略為音頻分析策略、第一預(yù)設(shè)策略為彈幕分析策略。
以上三種情況下可以分別通過以下方式確定每一幀圖片在相應(yīng)策略下的得分:
一、通過以下方式確定所述視頻中每一幀圖片在關(guān)注度策略下的得分:
確定所述視頻中每一幀圖片的關(guān)注度得分,將所述視頻中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的關(guān)注度得分,包括:
確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;
根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
在上述方法之前,需要確定視頻中每一個(gè)人物的關(guān)注度等級,通常需要考慮多種因素來確定每一個(gè)人物的關(guān)注度等級,一般情況下,關(guān)注度可以根據(jù)需要?jiǎng)澐譃槎鄠€(gè)等級,但是,關(guān)注度等級的劃分?jǐn)?shù)量不宜過多,通??梢詾槎了膫€(gè)。通常,在視頻中,主角的關(guān)注度等級可以設(shè)置為最高,主角的人數(shù)可以根據(jù)需要進(jìn)行設(shè)置,一般為一至三個(gè),配角則根據(jù)人氣的大小進(jìn)行等級劃分,每一個(gè)等級中的人數(shù)一般為一至三個(gè)。當(dāng)然不同人物的關(guān)注度等級也可以綜合考慮該人物的角色重要性及實(shí)時(shí)人氣和觀眾的喜愛程度來綜合進(jìn)行評定。
舉例來說,假設(shè)某視頻中,所有人物按照關(guān)注度劃分為三個(gè)等級,其中,一級為最高級,然后是二級、三級;其中,演員a、b為一級,記為3分;c為二級,記為2分;d為三級,記為1分;則通過人臉識(shí)別技術(shù)對視頻中每一幀圖片中的人物進(jìn)行識(shí)別,識(shí)別出包含a、b、c、d的圖片,則計(jì)算每一個(gè)圖片的關(guān)注度得分,圖片中a、b、c、d以外的人物不計(jì)入得分,這樣就可以得出每一幀圖片的關(guān)注度得分。
二、通過以下方式確定所述視頻中每一幀圖片在音頻分析策略下的得分:
確定所述視頻中每一幀圖片的音頻分析得分,將所述視頻中每一幀圖片 的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的音頻分析得分,包括:
判斷所述視頻中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;
當(dāng)所述視頻中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;
根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
該方法在實(shí)際實(shí)現(xiàn)中,通常提取視頻中所有包含鼓掌聲和/或尖叫聲的圖片,之后,確定鼓掌聲和/或尖叫聲的音量等級,每一個(gè)音量等級對應(yīng)一音量區(qū)間,該音量區(qū)間可以根據(jù)實(shí)際需要進(jìn)行確定,例如,可以將音量劃分為三個(gè)等級,一級為最高級,二級、三級次之;假設(shè)在一種劃分方式下,一級對應(yīng)的音量為:150-200分貝、二級對應(yīng)的音量為100-150分貝、三級對應(yīng)的音量為50-100分貝;另一種劃分方式下,一級對應(yīng)的音量區(qū)間為:200-220分貝、二級對應(yīng)的音量為180-200分貝、三級對應(yīng)的音量為160-180分貝。
相應(yīng)的,每一個(gè)等級都有其對應(yīng)的音頻分析得分,假設(shè),一級對應(yīng)3分、二級對應(yīng)2分、三級對應(yīng)3分。如果沒有提取到尖叫聲和/或鼓掌聲、或提取的尖叫聲和/或鼓掌聲不屬于以上三個(gè)區(qū)間,則記為0分。這樣,就可以確定出圖片音頻分析得分。
三、通過以下方式確定所述視頻中每一幀圖片在彈幕分析策略下的得分:
確定所述視頻中每一幀圖片的彈幕分析得分,將所述視頻中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的彈幕分析得分,包括:
判斷所述視頻中的圖片的播放時(shí)間內(nèi)用戶是否發(fā)送文字彈幕和/或聲音彈幕;
當(dāng)所述視頻中的圖片的播放時(shí)間內(nèi)用戶發(fā)送文字彈幕和/或聲音彈幕時(shí),確定所述文字彈幕和/或聲音彈幕的數(shù)量等級;
根據(jù)所述文字彈幕和/或聲音彈幕的數(shù)量等級確定所述圖片的彈幕分析得分。
具體的,在實(shí)際實(shí)現(xiàn)中,首先提取所有包含文字彈幕和/或聲音彈幕的圖片,并計(jì)算每一幀圖片所包含的文字彈幕和/或聲音彈幕的數(shù)量,按照數(shù)量等級確定圖片的彈幕分析得分。
在此之前,需要對彈幕數(shù)量劃分等級,假設(shè)將彈幕數(shù)量劃分為三個(gè)等級,其中,一級為最高級別,二級、三級次之。每一個(gè)等級都有其對應(yīng)的彈幕數(shù)量區(qū)間,假設(shè)一級對應(yīng)的彈幕數(shù)量為80-100,二級對應(yīng)的彈幕數(shù)量為60-80,三級對應(yīng)的彈幕數(shù)量為40-60,則可以確定每一幀圖片的彈幕數(shù)量等級,每一個(gè)等級都有其對應(yīng)的彈幕分析得分,假設(shè),一級對應(yīng)3分、二級對應(yīng)2分、三級對應(yīng)1分。這樣,就可以確定每一幀圖片的彈幕分析得分。
針對第二種情況,當(dāng)?shù)谝活A(yù)設(shè)策略包括所述三種策略中一種以上時(shí),視頻中的每一幀圖片在每一種策略下都可以計(jì)算得到一個(gè)得分,這時(shí),根據(jù)需要設(shè)置每一種策略的權(quán)值,從而得到每一幀圖片在各個(gè)策略下得分的加權(quán)和,而所述每一幀圖片在各個(gè)策略下得分的加權(quán)和記為所述圖片的關(guān)鍵度。
舉例來說,當(dāng)?shù)谝活A(yù)設(shè)策略包括:關(guān)注度策略和彈幕分析策略時(shí),假設(shè)關(guān)注度策略的權(quán)值為0.6、彈幕分析策略的權(quán)值為0.4,在這種方式下,優(yōu)選地,不同策略下取值的量化區(qū)間應(yīng)該相同、且所劃分的等級數(shù)量應(yīng)相同,舉例來說,關(guān)注度劃分為三級時(shí),彈幕數(shù)量也應(yīng)該被劃分為三個(gè)等級,每一個(gè)等級的得分應(yīng)該相同,即,關(guān)注度策略下一級得分為3分,則彈幕分析策略下一級的得分也應(yīng)該為3分,以此類推。假設(shè),圖片1的關(guān)注度得分為3分、彈幕分析得分為2分,圖片2的關(guān)注度得分為3分、彈幕分析得分為3分,圖片3的關(guān)注度得分為2分、彈幕分析得分為3分;
則根據(jù)第二種情況下每一幀圖片的關(guān)鍵度確定方法,圖片1的關(guān)鍵度為:3×0.6+2×0.4=2.6;圖片2的關(guān)鍵度為:3×0.6+3×0.4=3.0;圖片3的關(guān)鍵度為:2×0.6+3×0.4=2.4。
優(yōu)選地,為了計(jì)算方便,第一預(yù)設(shè)策略中所有策略的權(quán)值之和可以設(shè)置為1。
步驟102、將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
步驟101中確定了每一幀圖片的關(guān)鍵度之后,可以將關(guān)鍵度最高的圖片 確定為所述視頻的代表性圖片。
如果通過步驟101所確定的關(guān)鍵度最高的圖片為一個(gè)時(shí),可以直接將所述圖片確定為該視頻的代表性圖片。但在實(shí)際實(shí)現(xiàn)中,關(guān)鍵度最高的圖片通常會(huì)有很多,這時(shí),可以根據(jù)需要設(shè)置不同的規(guī)則來確定出一幀圖片作為代表性圖片。例如,可以從所確定的關(guān)鍵度最高的圖片中隨機(jī)選擇一張作為代表性圖片、或者按一特定順序?yàn)閳D片編號,并將某一特定編號的圖片確定為代表性圖片。當(dāng)然也可以在所述關(guān)鍵度最高的圖片中,依據(jù)一特定規(guī)則進(jìn)行進(jìn)一步的篩選,最終確定出某一幀圖片作為代表性圖片。
上述方案中,根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略,將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片,這樣,能夠提供一種科學(xué)的方法來確定視頻的代表性圖片,即,完全以觀眾的需要出發(fā)來進(jìn)行視頻代表性圖片的確定,且在代表性圖片的確定過程中,并不要人工參與,避免了用戶主觀意見造成的偏見,且實(shí)現(xiàn)方式簡單、便捷。
方法實(shí)施例二
在本發(fā)明實(shí)施例一所提供的視頻代表性圖片確定方法的基礎(chǔ)上,本發(fā)明實(shí)施例二提供了一種視頻代表性片段的確定方法。該方法的流程圖如圖2所示,具體可以包括:
步驟201、根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;
在該步驟之前需要確定第二預(yù)設(shè)策略,第二預(yù)設(shè)規(guī)則包括:關(guān)注度策略、音頻分析策略和彈幕分析策略其中之一。
與實(shí)施例一所不同的是,實(shí)施例一種第一預(yù)設(shè)策略的分析對象是視頻中的每一幀圖片,而實(shí)施例二所提供的方法中,第二預(yù)設(shè)策略的分析對象為視頻中一預(yù)設(shè)時(shí)長的視頻片段。這里的預(yù)設(shè)時(shí)長可以根據(jù)實(shí)際需要進(jìn)行設(shè)置, 而所取的預(yù)設(shè)時(shí)長的視頻片段是一連續(xù)視頻片段。
按照第一預(yù)設(shè)策略所包含的以上三種策略的個(gè)數(shù),對于視頻中一預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度的確定可以分為以下兩種情況:
第一種情況:當(dāng)所述第二預(yù)設(shè)策略包括所述策略其中之一時(shí),所述根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,包括:確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分之和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度。
第二種情況:當(dāng)所述第二預(yù)設(shè)策略包括所述策略中一個(gè)以上時(shí),所述根據(jù)第二預(yù)設(shè)策略確定所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,包括:確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略中每一種策略下得分之和;確定所述每一種策略下的得分之和的加權(quán)和;將所述加權(quán)和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度。
針對第一種情況,也可以細(xì)分為三種情況,即,第二預(yù)設(shè)策略僅包含關(guān)注度策略、或音頻分析策略、或彈幕分析策略。
以上三種情況下可以分別通過以下方式確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在相應(yīng)策略下的得分:
一、通過以下方式確定所述視頻中每一幀圖片在關(guān)注度策略下的得分:
確定所述視頻中每一幀圖片的關(guān)注度得分,將所述視頻中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的關(guān)注度得分,包括:
確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;
根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
該方法之前,需要確定視頻中人物的關(guān)注度等級,且確定不同關(guān)注度等級所對應(yīng)的得分。
二、通過以下方式確定所述視頻中每一幀圖片在音頻分析策略下的得分:
確定所述視頻中每一幀圖片的音頻分析得分,將所述視頻中每一幀圖片 的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的音頻分析得分,包括:
判斷所述視頻中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;
當(dāng)所述視頻中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;
根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
該方法之前,需要確定鼓掌聲和/或尖叫聲音量的等級,且確定不同音量等級所對應(yīng)的得分。
三、通過以下方式確定所述視頻中每一幀圖片在彈幕分析策略下的得分:
確定所述視頻中每一幀圖片的彈幕分析得分,將所述視頻中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
具體的,所述確定所述視頻中每一幀圖片的彈幕分析得分,包括:
判斷所述視頻中的圖片的播放時(shí)間內(nèi)用戶是否發(fā)送文字彈幕和/或聲音彈幕;
當(dāng)所述視頻中的圖片的播放時(shí)間內(nèi)用戶發(fā)送文字彈幕和/或聲音彈幕時(shí),確定所述文字彈幕和/或聲音彈幕的數(shù)量等級;
根據(jù)所述文字彈幕和/或聲音彈幕的數(shù)量等級確定所述圖片的彈幕分析得分。
在此之前,需要對彈幕數(shù)量劃分等級,并確定不同等級所對應(yīng)的得分
針對第二種情況,當(dāng)?shù)谝活A(yù)設(shè)策略包括所述三種策略中一種以上時(shí),視頻中的每一幀圖片在每一種策略下都可以通過上述方案計(jì)算得到一個(gè)得分,這時(shí),根據(jù)需要設(shè)置每一種策略的權(quán)值,從而得到每一幀圖片在各個(gè)策略下得分的加權(quán)和,而所述每一幀圖片在各個(gè)策略下得分的加權(quán)和記為所述圖片的關(guān)鍵度。
在本發(fā)明的一種可選實(shí)施例中,不同策略下取值的量化區(qū)間應(yīng)該相同、且所劃分的等級數(shù)量應(yīng)相同。
在本發(fā)明的一種可選實(shí)施例中,第一預(yù)設(shè)策略中所有策略的權(quán)值之和可 以設(shè)置為1。
步驟202、將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
步驟201中,確定了不同視頻片段的關(guān)鍵度之后,如果關(guān)鍵度最高的視頻片段個(gè)數(shù)為一個(gè),則可以直接將該視頻片段確定為該視頻的代表性片段,但是實(shí)際實(shí)現(xiàn)中,很可能會(huì)出現(xiàn)關(guān)鍵度最高的視頻片段的數(shù)量為多個(gè)的情況,這時(shí),可以根據(jù)需要設(shè)置不同的規(guī)則來確定出代表性片段。例如,可以從所確定的關(guān)鍵度最高的視頻片段中隨機(jī)選擇一個(gè)作為代表性片段、或者按一特定順序?yàn)樗x出的關(guān)鍵度最高的視頻片段編號,并將某一特定編號的視頻片段確定為代表性片段。當(dāng)然也可以在所述關(guān)鍵度最高的片段中,依據(jù)一特定規(guī)則進(jìn)行進(jìn)一步的篩選,最終確定出某一個(gè)片段作為該視頻的代表性片段。
上述方案中,根根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略,將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段,這樣,能夠完全以觀眾需要作為出發(fā)點(diǎn)來依據(jù)一種科學(xué)的方法確定視頻的代表性片段,而且,該方法在代表性片段的確定過程中,并不要人工參與,避免了用戶主觀意見造成的偏見,且實(shí)現(xiàn)方式簡單、便捷。
對于方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。
裝置實(shí)施例一
參照圖3,示出了本發(fā)明一種視頻代表性圖片確定裝置實(shí)施例的結(jié)構(gòu)框圖,所述裝置位于視頻服務(wù)器或任何具備數(shù)據(jù)處理能力的終端設(shè)備上,包 括:第一關(guān)鍵度確定模塊31和代表性圖片確定模塊32;其中,
所述第一關(guān)鍵度確定模塊31,用于根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;
所述代表性圖片確定模塊32,用于將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
具體的,所述第一關(guān)鍵度確定模塊31,用于當(dāng)所述第一預(yù)設(shè)策略包括所述策略其中之一時(shí),確定所述視頻中每一幀圖片在所述第一預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分確定為所述每一幀圖片的關(guān)鍵度;還用于,當(dāng)所述第一預(yù)設(shè)策略包括所述策略中一種以上時(shí),確定每一幀圖片在所述第一預(yù)設(shè)策略中每一種策略下得分的加權(quán)和,將所述每一幀圖片的加權(quán)和確定為所述每一幀圖片的關(guān)鍵度。
在本發(fā)明的一種可選實(shí)施例中,如圖4所示,所述第一關(guān)鍵度確定模塊31,包括:第一確定子模塊3101、第二確定子模塊3101及第三確定子模塊3103;其中,
所述第一確定子模塊3101,用于確定所述視頻中每一幀圖片的關(guān)注度得分,將所述視頻中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;
所述第二確定子模塊3102,用于確定所述視頻中每一幀圖片的音頻分析得分,將所述視頻中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;
所述第三確定子模塊3103,用于確定所述視頻中每一幀圖片的彈幕分析得分,將所述視頻中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
在本發(fā)明的一種可選實(shí)施例中,如圖5所示,所述第一確定子模塊3101,包括:
第一關(guān)注度等級確定單元310101,用于確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;
第一關(guān)注度得分確定單元310102,用于根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
所述第二確定子模塊3102,包括:
第一音頻判斷單元310201,用于判斷所述視頻中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;
第一音量等級確定單元310202,用于當(dāng)所述視頻中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;
第一音頻分析得分確定單元310203,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
所述第三確定單元3103,包括:
第一彈幕判斷單元310301,用于判斷所述視頻中的圖片的播放時(shí)間內(nèi)用戶是否發(fā)送文字彈幕和/或聲音彈幕;
第一數(shù)量等級確定單元310302,用于當(dāng)所述視頻中的圖片的播放時(shí)間內(nèi)用戶發(fā)送文字彈幕和/或聲音彈幕時(shí),確定所述文字彈幕和/或聲音彈幕的數(shù)量等級;
第一彈幕分析得分確定單元310303,用于根據(jù)所述文字彈幕和/或聲音彈幕的數(shù)量等級確定所述圖片的彈幕分析得分。
在具體實(shí)施過程中,上述第一關(guān)鍵度確定模塊31、代表性圖片確定模塊32、第一確定子模塊3101、第二確定子模塊3101及第三確定子模塊3103、第一關(guān)注度等級確定單元310101、第一關(guān)注度得分確定單元310102、第一音頻判斷單元310201、第一音量等級確定單元310202、第一音頻分析得分確定單元310203、第一彈幕判斷單元310301、第一數(shù)量等級確定單元310302及第一彈幕分析得分確定單元310303均可以由視頻服務(wù)器或任何具備數(shù)據(jù)處理能力的終端設(shè)備內(nèi)的中央處理器(cpu,centralprocessingunit)、微處理器(mpu,microprocessingunit)、數(shù)字信號處理器(dsp,digitalsignalprocessor)或可編程邏輯陣列(fpga,field-programmablegate array)來實(shí)現(xiàn)。
裝置實(shí)施例二
參照圖6,示出了本發(fā)明一種視頻代表性圖片、片段確定裝置實(shí)施例的結(jié)構(gòu)框圖,所述裝置位于視頻服務(wù)器或任何具備數(shù)據(jù)處理能力的終端設(shè)備上,包括:第二關(guān)鍵度確定模塊61和代表性片段確定模塊62;其中,
所述第二關(guān)鍵度確定模塊61,用于根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;
所述代表性片段確定模塊62,用于將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
具體的,所述第二關(guān)鍵度確定模塊61,用于當(dāng)所述第二預(yù)設(shè)策略包括所述策略其中之一時(shí),確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分之和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度;還用于,當(dāng)所述第二預(yù)設(shè)策略包括所述策略中一種以上時(shí),確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略中每一種策略下得分之和,確定所述每一種策略下的得分之和的加權(quán)和,將所述加權(quán)和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度。
本發(fā)明的一種可選實(shí)施例中,如圖7所示,所述第二關(guān)鍵度確定模塊61,包括:第四確定子模塊6101、第五確定子模塊6102和第六確定子模塊6103;其中,
所述第四確定子模塊6101,用于確定所述視頻片段中每一幀圖片的關(guān)注度得分,將所述視頻片段中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;
所述第五確定子模塊6102,用于確定所述視頻片段中每一幀圖片的音頻分析得分,將所述視頻片段中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;
所述第六確定子模塊6103,用于確定所述視頻片段中每一幀圖片的彈幕 分析得分,將所述視頻片段中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
本發(fā)明的一種可選實(shí)施例中,如圖8所示,所述第四確定子模塊6101,包括:
第二關(guān)注度等級確定單元610101,用于確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;
第二關(guān)注度得分確定單元610102,用于根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
所述第五確定子模塊6102,包括:
第二音頻判斷單元610201,用于判斷所述視頻片段中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;
第二音量等級確定單元610202,用于當(dāng)所述視頻片段中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;
第二音頻分析得分確定單元610203,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
所述第六確定子模塊6103,包括:
第二彈幕判斷單元610301,用于判斷所述視頻片段中的圖片播放時(shí)間內(nèi)是否包含鼓掌聲和/或尖叫聲;
第二數(shù)量等級確定單元610302,用于當(dāng)所述視頻片段中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;
第二彈幕分析得分確定單元610302,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
在具體實(shí)施過程中,上述第二關(guān)鍵度確定模塊61和代表性片段確定模塊62、第四確定子模塊6101、第五確定子模塊6102、第六確定子模塊6103、第二關(guān)注度等級確定單元610101、第二關(guān)注度得分確定單元610102、第二音頻判斷單元610201、第二音量等級確定單元610202、第二音頻分析得分確定單元610203、第二彈幕判斷單元610301、第二數(shù)量等級確定單元610302 及第二彈幕分析得分確定單元610303均可以由視頻服務(wù)器或具備數(shù)據(jù)處理能力的終端設(shè)備內(nèi)的cpu、mpu、數(shù)字dsp或fpga來實(shí)現(xiàn)。
對于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的 任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(dsp)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的一種視頻代表性圖片、片段確定方法和裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
本發(fā)明公開了a1、一種視頻代表性圖片的確定方法,包括:根據(jù)第一 預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
a2、如a1所述的方法,當(dāng)所述第一預(yù)設(shè)策略包括所述策略其中之一時(shí),所述根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,包括:確定所述視頻中每一幀圖片在所述第一預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分確定為所述每一幀圖片的關(guān)鍵度;當(dāng)所述第一預(yù)設(shè)策略包括所述策略中一種以上時(shí),所述根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,包括:確定每一幀圖片在所述第一預(yù)設(shè)策略中每一種策略下得分的加權(quán)和;將所述每一幀圖片的加權(quán)和確定為所述每一幀圖片的關(guān)鍵度。
a3、如a2所述的方法,通過以下方式確定所述視頻中每一幀圖片在關(guān)注度策略下的得分:確定所述視頻中每一幀圖片的關(guān)注度得分,將所述視頻中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;
通過以下方式確定所述視頻中每一幀圖片在音頻分析策略下的得分:確定所述視頻中每一幀圖片的音頻分析得分,將所述視頻中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;
通過以下方式確定所述視頻中每一幀圖片在彈幕分析策略下的得分:確定所述視頻中每一幀圖片的彈幕分析得分,將所述視頻中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
a4、如a3所述的方法,所述確定所述視頻中每一幀圖片的關(guān)注度得分,包括:確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
a5、如a3所述的方法,所述確定所述視頻中每一幀圖片的音頻分析得分,包括:判斷所述視頻中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;當(dāng)所述視頻中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
a6、如a3至a5所述的方法,所述確定所述視頻中每一幀圖片的彈幕分析得分,包括:判斷所述視頻中的圖片的播放時(shí)間內(nèi)用戶是否發(fā)送文字彈幕和/或聲音彈幕;當(dāng)所述視頻中的圖片的播放時(shí)間內(nèi)用戶發(fā)送文字彈幕和/或聲音彈幕時(shí),確定所述文字彈幕和/或聲音彈幕的數(shù)量等級;根據(jù)所述文字彈幕和/或聲音彈幕的數(shù)量等級確定所述圖片的彈幕分析得分。
b7、一種視頻代表性片段的確定方法,包括:根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
b8、如b7所述的方法,當(dāng)所述第二預(yù)設(shè)策略包括所述策略其中之一時(shí),所述根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,包括:確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分之和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度;
當(dāng)所述第二預(yù)設(shè)策略包括所述策略中一種以上時(shí),所述根據(jù)第二預(yù)設(shè)策略確定所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,包括:確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略中每一種策略下得分之和;確定所述每一種策略下的得分之和的加權(quán)和;將所述加權(quán)和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度。
b9、如b8所述的方法,通過以下方式確定所述視頻片段中每一幀圖片在關(guān)注度策略下的得分:確定所述視頻片段中每一幀圖片的關(guān)注度得分,將所述視頻片段中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;
通過以下方式確定所述視頻片段中每一幀圖片在音頻分析策略下的得分:確定所述視頻片段中每一幀圖片的音頻分析得分,將所述視頻片段中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;
通過以下方式確定所述視頻中每一幀圖片在彈幕分析策略下的得分:確定所述視頻片段中每一幀圖片的彈幕分析得分,將所述視頻片段中每一幀圖 片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
b10、如b9所述的方法,所述確定所述視頻片段中每一幀圖片的關(guān)注度得分,包括:確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
b11、如9所述的方法,所述確定所述視頻片段中每一幀圖片的音頻分析得分,包括:判斷所述視頻片段中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;當(dāng)所述視頻片段中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
b12、如b9至b11所述的方法,所述確定所述視頻片段中每一幀圖片的彈幕分析得分,包括:判斷所述視頻片段中的圖片播放時(shí)間內(nèi)是否包含鼓掌聲和/或尖叫聲;當(dāng)所述視頻片段中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
c13、一種視頻代表性圖片的確定裝置,所述裝置包括:第一關(guān)鍵度確定模塊和代表性圖片確定模塊;其中,
所述第一關(guān)鍵度確定模塊,用于根據(jù)第一預(yù)設(shè)策略確定視頻中每一幀圖片的關(guān)鍵度,所述第一預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;
所述代表性圖片確定模塊,用于將關(guān)鍵度最高的圖片確定為所述視頻的代表性圖片。
c14、如c13所述的裝置,所述第一關(guān)鍵度確定模塊,用于當(dāng)所述第一預(yù)設(shè)策略包括所述策略其中之一時(shí),確定所述視頻中每一幀圖片在所述第一預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分確定為所述每一幀圖片的關(guān)鍵度;還用于,當(dāng)所述第一預(yù)設(shè)策略包括所述策略中一種以上時(shí),確定每一幀圖片在所述第一預(yù)設(shè)策略中每一種策略下得分的加權(quán)和,將所述每一幀圖片 的加權(quán)和確定為所述每一幀圖片的關(guān)鍵度。
c15、如c14所述的裝置,所述第一關(guān)鍵度確定模塊,包括:第一確定子模塊、第二確定子模塊及第三確定子模塊;其中,所述第一確定子模塊,用于確定所述視頻中每一幀圖片的關(guān)注度得分,將所述視頻中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;所述第二確定子模塊,用于確定所述視頻中每一幀圖片的音頻分析得分,將所述視頻中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;所述第三確定子模塊,用于確定所述視頻中每一幀圖片的彈幕分析得分,將所述視頻中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
c16、如c15所述的裝置,所述第一確定子模塊,包括:第一關(guān)注度等級確定單元,用于確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;第一關(guān)注度得分確定單元,用于根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
c17、如c15所述的裝置,所述第二確定子模塊,包括:第一音頻判斷單元,用于判斷所述視頻中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;第一音量等級確定單元,用于當(dāng)所述視頻中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;第一音頻分析得分確定單元,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
c18、如c15至c17所述的裝置,所述第三確定單元,包括:第一彈幕判斷單元,用于判斷所述視頻中的圖片的播放時(shí)間內(nèi)用戶是否發(fā)送文字彈幕和/或聲音彈幕;第一數(shù)量等級確定單元,用于當(dāng)所述視頻中的圖片的播放時(shí)間內(nèi)用戶發(fā)送文字彈幕和/或聲音彈幕時(shí),確定所述文字彈幕和/或聲音彈幕的數(shù)量等級;第一彈幕分析得分確定單元,用于根據(jù)所述文字彈幕和/或聲音彈幕的數(shù)量等級確定所述圖片的彈幕分析得分。
d19、一種視頻代表性片段的確定裝置,所述裝置包括:第二關(guān)鍵度確 定模塊和代表性片段確定模塊;其中,所述第二關(guān)鍵度確定模塊,用于根據(jù)第二預(yù)設(shè)策略確定所述視頻中預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度,所述第二預(yù)設(shè)策略包括以下策略至少其中之一:關(guān)注度策略、音頻分析策略和彈幕分析策略;所述代表性片段確定模塊,用于將關(guān)鍵度最高的視頻片段確定為所述視頻的代表性片段。
c20、如c19所述的裝置,所述第二關(guān)鍵度確定模塊,用于當(dāng)所述第二預(yù)設(shè)策略包括所述策略其中之一時(shí),確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略下的得分,將所述每一幀圖片的得分之和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度;還用于,當(dāng)所述第二預(yù)設(shè)策略包括所述策略中一種以上時(shí),確定所述預(yù)設(shè)時(shí)長視頻片段中每一幀圖片在所述第二預(yù)設(shè)策略中每一種策略下得分之和,確定所述每一種策略下的得分之和的加權(quán)和,將所述加權(quán)和確定為所述預(yù)設(shè)時(shí)長視頻片段的關(guān)鍵度。
c21、如c20所述的裝置,所述第二關(guān)鍵度確定模塊,包括:第四確定子模塊、第五確定子模塊和第六確定子模塊;其中,所述第四確定子模塊,用于確定所述視頻片段中每一幀圖片的關(guān)注度得分,將所述視頻片段中每一幀圖片的關(guān)注度得分確定為所述每一幀圖片在關(guān)注度策略下的得分;所述第五確定子模塊,用于確定所述視頻片段中每一幀圖片的音頻分析得分,將所述視頻片段中每一幀圖片的音頻分析得分確定為所述每一幀圖片在音頻分析策略下的得分;所述第六確定子模塊,用于確定所述視頻片段中每一幀圖片的彈幕分析得分,將所述視頻片段中每一幀圖片的彈幕分析得分確定為所述每一幀圖片在彈幕分析策略下的得分。
c22、如c21所述的裝置,所述第四確定子模塊,包括:第二關(guān)注度等級確定單元,用于確定所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級;第二關(guān)注度得分確定單元,用于根據(jù)所述每一幀圖片中人物的個(gè)數(shù)和每個(gè)人物的關(guān)注度等級分別確定所述每一幀圖片的關(guān)注度得分。
c23、如c21所述的裝置,所述第五確定子模塊,包括:第二音頻判斷單元,用于判斷所述視頻片段中的圖片所對應(yīng)的音頻片段是否包含鼓掌聲和/或尖叫聲;第二音量等級確定單元,用于當(dāng)所述視頻片段中的圖片包含鼓掌 聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;第二音頻分析得分確定單元,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。
c24、如c21至c23所述的裝置,所述第六確定子模塊,包括:第二彈幕判斷單元,用于判斷所述視頻片段中的圖片播放時(shí)間內(nèi)是否包含鼓掌聲和/或尖叫聲;第二數(shù)量等級確定單元,用于當(dāng)所述視頻片段中的圖片包含鼓掌聲和/或尖叫聲時(shí),確定所述鼓掌聲和/或尖叫聲的音量等級;第二彈幕分析得分確定單元,用于根據(jù)所述鼓掌聲和/或尖叫的音量等級確定所述圖片的音頻分析得分。