本發(fā)明屬于計算機技術(shù)領(lǐng)域,尤其涉及一種視頻內(nèi)容查看方法及裝置。
背景技術(shù):
隨著計算機和互聯(lián)網(wǎng)的普及,學(xué)生越來越多地通過計算機和互聯(lián)網(wǎng)進行學(xué)習(xí),例如,通過網(wǎng)絡(luò)視頻或本地視頻文件進行學(xué)習(xí)。在學(xué)習(xí)時,用戶若要在學(xué)習(xí)視頻中找到自己想要學(xué)習(xí)或復(fù)習(xí)的內(nèi)容時,往往需要從視頻開頭看到結(jié)尾,或者通過快進或憑借印象將播放進度條拖動到視頻對應(yīng)位置,大多數(shù)情況下還是難以一次性找到想要的內(nèi)容,浪費了用戶的大量時間,從而極大地影響了用戶體驗。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種視頻內(nèi)容查看方法及裝置,旨在解決由于現(xiàn)有技術(shù)無法提供一種視頻內(nèi)容定點查看方法,導(dǎo)致視頻內(nèi)容定位、查看過程復(fù)雜、時間開銷過大的問題。
一方面,本發(fā)明提供了一種視頻內(nèi)容查看方法,所述方法包括下述步驟:
接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字;
根據(jù)所述內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索所述內(nèi)容關(guān)鍵字;
當(dāng)檢索到所述內(nèi)容關(guān)鍵字時,獲取所述內(nèi)容關(guān)鍵字在所述視頻時間軸上對應(yīng)的時間點;
將所述目標(biāo)視頻的播放進度條定位到所述時間點上,并播放所述目標(biāo)視頻。
另一方面,本發(fā)明提供了一種視頻內(nèi)容查看裝置,所述裝置包括:
關(guān)鍵字接收單元,用于接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字;
關(guān)鍵字檢索單元,用于根據(jù)所述內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索所述內(nèi)容關(guān)鍵字;
時間點獲取單元,用于當(dāng)檢索到所述內(nèi)容關(guān)鍵字時,獲取所述內(nèi)容關(guān)鍵字在所述視頻時間軸上對應(yīng)的時間點;以及
視頻定位播放單元,用于將所述目標(biāo)視頻的播放進度條定位到所述時間點上,并播放所述目標(biāo)視頻。
本發(fā)明在接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字后,根據(jù)內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索內(nèi)容關(guān)鍵字,當(dāng)檢索到內(nèi)容關(guān)鍵字時,獲取內(nèi)容關(guān)鍵字在視頻時間軸上對應(yīng)的時間點,將目標(biāo)視頻的播放進度條定位到時間點上,并播放目標(biāo)視頻,這樣用戶可通過要查看視頻的內(nèi)容關(guān)鍵字對要查看視頻內(nèi)容進行快速定位并播放,節(jié)約了查找、定位視頻內(nèi)容所需要的時間,提高了用戶觀看視頻的體驗。
附圖說明
圖1是本發(fā)明實施例一提供的視頻內(nèi)容查看方法的實現(xiàn)流程圖;
圖2是本發(fā)明實施例二提供的視頻內(nèi)容查看裝置的結(jié)構(gòu)示意圖;
圖3是本發(fā)明實施例二提供的視頻內(nèi)容查看裝置的結(jié)構(gòu)示意圖;
圖4是本發(fā)明實施例二提供的視頻內(nèi)容查看裝置中關(guān)鍵字獲取單元的結(jié)構(gòu)示意圖;以及
圖5是本發(fā)明實施例二提供的視頻內(nèi)容查看裝置中關(guān)鍵字獲取單元的結(jié)構(gòu)示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
以下結(jié)合具體實施例對本發(fā)明的具體實現(xiàn)進行詳細(xì)描述:
實施例一:
圖1示出了本發(fā)明實施例一提供的視頻內(nèi)容查看方法的實現(xiàn)流程,為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,詳述如下:
在步驟S101中,接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字。
本發(fā)明實施例適用于視頻播放設(shè)備或系統(tǒng),例如,學(xué)習(xí)機、移動終端或計算機。在本發(fā)明實施例中,當(dāng)用戶需要查看目標(biāo)視頻中的特定內(nèi)容時,可通過預(yù)設(shè)的一界面輸入待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字,該內(nèi)容關(guān)鍵字描述了用戶要查看或復(fù)習(xí)的視頻內(nèi)容。其中,待查看視頻可以為影視劇、學(xué)習(xí)視頻等。
在步驟S102中,根據(jù)內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索內(nèi)容關(guān)鍵字。
在本發(fā)明實施例中,需要預(yù)先為目標(biāo)視頻構(gòu)建視頻時間軸和關(guān)鍵字或內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系,即在視頻時間點的視頻內(nèi)容與內(nèi)容關(guān)鍵字的對應(yīng)關(guān)系基礎(chǔ)上,建立視頻時間軸上時間點與內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系,從而可根據(jù)內(nèi)容關(guān)鍵字確定對應(yīng)視頻內(nèi)容在視頻中的時間點或位置。
因此,在為目標(biāo)視頻構(gòu)建視頻時間軸和關(guān)鍵字或內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系之前,獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字,之后建立獲取的視頻內(nèi)容關(guān)鍵字與目標(biāo)視頻的視頻時間軸上時間點的對應(yīng)關(guān)系。
在本發(fā)明實施例中,在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字時,優(yōu)選地,首先從目標(biāo)視頻中提取對應(yīng)的音頻,對音頻進行語音識別,得到識別后的文本文件,然后根據(jù)預(yù)設(shè)的關(guān)鍵字提取算法從文本文件中獲取目標(biāo)視頻的內(nèi)容關(guān)鍵字,從而實現(xiàn)目標(biāo)視頻的內(nèi)容關(guān)鍵字的自動獲取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度。
具體地,從目標(biāo)視頻中提取對應(yīng)的音頻后,可對音頻進行噪音去除等預(yù)處理操作,以提高后續(xù)語音識別的準(zhǔn)確率。在對音頻進行語音識別時,可根據(jù)音頻文件中的停頓標(biāo)志將音頻文件劃分為多個音頻段,記錄每個音頻段對應(yīng)的開始時間和停止時間,進而對多個音頻段進行語音識別,得到多個音頻段對應(yīng)的文本文件。優(yōu)選地,對多個音頻段進行語音識別時,可在預(yù)先構(gòu)建的高頻語音識別庫中對待識別的音頻段進行匹配,當(dāng)對待識別的音頻段匹配成功時,獲取待識別的音頻段對應(yīng)的文本段,從而根據(jù)高頻語音識別庫中存儲的語音識別音頻和對應(yīng)識別結(jié)果的對應(yīng)關(guān)系,獲取音頻段對應(yīng)的識別結(jié)果,從而大大提高語音識別結(jié)果的準(zhǔn)確率。
在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字時,作為另一優(yōu)選方式,可對目標(biāo)視頻進行鏡頭分割,以得到組成目標(biāo)視頻的多個鏡頭,提取每個鏡頭下的關(guān)鍵幀,對關(guān)鍵幀對應(yīng)的幀圖像進行文字識別,進而根據(jù)每個鏡頭得到的文字識別結(jié)果,獲取目標(biāo)視頻每個鏡頭對應(yīng)的內(nèi)容關(guān)鍵字,從而實現(xiàn)目標(biāo)視頻的內(nèi)容關(guān)鍵字的自動獲取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度。
該優(yōu)選方式特別適用于視頻學(xué)習(xí)文件,例如,課件視頻等。在該優(yōu)選方式中,鏡頭是攝像機一次連續(xù)拍攝的一段視頻,由若干幀組成,每個鏡頭內(nèi)部的圖像內(nèi)容通常相同或相似。在將目標(biāo)視頻進行鏡頭分割后,可得到組成目標(biāo)視頻的多個鏡頭,進而提取每個鏡頭下的關(guān)鍵幀,通過對關(guān)鍵幀對應(yīng)的幀圖像進行文字識別,通過對文字進行關(guān)鍵字提取,得到目標(biāo)視頻中視頻段對應(yīng)的內(nèi)容關(guān)鍵字,進一步地,可將關(guān)鍵字與視頻段或視頻時間軸的時間點關(guān)聯(lián)起來。
在步驟S103中,當(dāng)檢索到內(nèi)容關(guān)鍵字時,獲取內(nèi)容關(guān)鍵字在視頻時間軸上對應(yīng)的時間點。
在步驟S104中,將目標(biāo)視頻的播放進度條定位到時間點上,并播放目標(biāo)視頻。
本發(fā)明實施例在接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字后,根據(jù)內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索內(nèi)容關(guān)鍵字,當(dāng)檢索到內(nèi)容關(guān)鍵字時,獲取內(nèi)容關(guān)鍵字在視頻時間軸上對應(yīng)的時間點,將目標(biāo)視頻的播放進度條定位到時間點上,并播放目標(biāo)視頻,這樣用戶可通過要查看視頻的內(nèi)容關(guān)鍵字對要查看視頻內(nèi)容進行快速定位并播放,節(jié)約了查找、定位視頻內(nèi)容所需要的時間,提高了用戶觀看視頻的體驗。
另外,在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字、建立視頻內(nèi)容關(guān)鍵字與目標(biāo)視頻的視頻時間軸上時間點的對應(yīng)關(guān)系時,采用對視頻中音頻的語音識別或視頻中鏡頭關(guān)鍵幀的圖像識別,實現(xiàn)了內(nèi)容關(guān)鍵字的自動提取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度,進而提高了用戶視頻內(nèi)容的查找或定位準(zhǔn)確度。
本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,所述的存儲介質(zhì),如ROM/RAM、磁盤、光盤等。
實施例二:
圖2示出了本發(fā)明實施例二提供的視頻內(nèi)容查看裝置的結(jié)構(gòu),為了便于說明,僅示出了與本發(fā)明實施例相關(guān)的部分,其中包括:
關(guān)鍵字接收單元21,用于接收用戶輸入的、待查看視頻內(nèi)容的內(nèi)容關(guān)鍵字;
關(guān)鍵字檢索單元22,用于根據(jù)內(nèi)容關(guān)鍵字在為目標(biāo)視頻預(yù)先構(gòu)建的視頻時間軸和關(guān)鍵字關(guān)聯(lián)關(guān)系中檢索內(nèi)容關(guān)鍵字;
時間點獲取單元23,用于當(dāng)檢索到內(nèi)容關(guān)鍵字時,獲取內(nèi)容關(guān)鍵字在視頻時間軸上對應(yīng)的時間點;以及
視頻定位播放單元24,用于將目標(biāo)視頻的播放進度條定位到時間點上,并播放目標(biāo)視頻。
在本發(fā)明實施例中,需要預(yù)先為目標(biāo)視頻構(gòu)建視頻時間軸和關(guān)鍵字或內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系,即在視頻時間點視頻內(nèi)容與內(nèi)容關(guān)鍵字對應(yīng)關(guān)系的基礎(chǔ)上,建立視頻時間軸上時間點與內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系,從而可根據(jù)內(nèi)容關(guān)鍵字確定對應(yīng)視頻內(nèi)容在視頻中的時間點或位置。
因此,在為目標(biāo)視頻構(gòu)建視頻時間軸和關(guān)鍵字或內(nèi)容關(guān)鍵字的關(guān)聯(lián)關(guān)系之前,獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字,之后建立獲取的視頻內(nèi)容關(guān)鍵字與目標(biāo)視頻的視頻時間軸上時間點的對應(yīng)關(guān)系。因此,優(yōu)選地,如圖3所示,視頻內(nèi)容查看裝置還包括:
關(guān)鍵字獲取單元31,用于獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字;以及
關(guān)系建立單元32,用于建立視頻內(nèi)容關(guān)鍵字與目標(biāo)視頻的視頻時間軸上時間點的對應(yīng)關(guān)系。
在本發(fā)明實施例中,在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字時,優(yōu)選地,首先從目標(biāo)視頻中提取對應(yīng)的音頻,對音頻進行語音識別,得到識別后的文本文件,然后根據(jù)預(yù)設(shè)的關(guān)鍵字提取算法從文本文件中獲取目標(biāo)視頻的內(nèi)容關(guān)鍵字,從而實現(xiàn)目標(biāo)視頻的內(nèi)容關(guān)鍵字的自動獲取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度。
具體地,從目標(biāo)視頻中提取對應(yīng)的音頻后,可對音頻進行噪音去除等預(yù)處理操作,以提高后續(xù)語音識別的準(zhǔn)確率。在對音頻進行語音識別時,可根據(jù)音頻文件中的停頓標(biāo)志將音頻文件劃分為多個音頻段,記錄每個音頻段對應(yīng)的開始時間和停止時間,進而對多個音頻段進行語音識別,得到多個音頻段對應(yīng)的文本文件。優(yōu)選地,對多個音頻段進行語音識別時,可在預(yù)先構(gòu)建的高頻語音識別庫中對待識別的音頻段進行匹配,當(dāng)對待識別的音頻段匹配成功時,獲取待識別的音頻段對應(yīng)的文本段,從而根據(jù)高頻語音識別庫中存儲的語音識別音頻和對應(yīng)識別結(jié)果的對應(yīng)關(guān)系,獲取音頻段對應(yīng)的識別結(jié)果,從而大大提高語音識別結(jié)果的準(zhǔn)確率。
因此,優(yōu)選地,如圖4所示,關(guān)鍵字獲取單元31可以包括:
語音識別單元311,用于從所述目標(biāo)視頻中提取對應(yīng)的音頻,對所述音頻進行語音識別,得到識別后的文本文件;以及
關(guān)鍵字提取單元312,用于根據(jù)預(yù)設(shè)的關(guān)鍵字提取算法從文本文件中獲取目標(biāo)視頻的內(nèi)容關(guān)鍵字。
在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字時,作為另一優(yōu)選方式,可對目標(biāo)視頻進行鏡頭分割,以得到組成目標(biāo)視頻的多個鏡頭,提取每個鏡頭下的關(guān)鍵幀,對關(guān)鍵幀對應(yīng)的幀圖像進行文字識別,進而根據(jù)每個鏡頭得到的文字識別結(jié)果,獲取目標(biāo)視頻每個鏡頭對應(yīng)的內(nèi)容關(guān)鍵字,從而實現(xiàn)目標(biāo)視頻的內(nèi)容關(guān)鍵字的自動獲取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度。
該優(yōu)選方式特別適用于視頻學(xué)習(xí)文件,例如,課件視頻等。在該優(yōu)選方式中,鏡頭是攝像機一次連續(xù)拍攝的一段視頻,由若干幀組成,每個鏡頭內(nèi)部的圖像內(nèi)容通常相同或相似。在將目標(biāo)視頻進行鏡頭分割后,可得到組成目標(biāo)視頻的多個鏡頭,進而提取每個鏡頭下的關(guān)鍵幀,通過對關(guān)鍵幀對應(yīng)的幀圖像進行文字識別,通過對文字進行關(guān)鍵字提取,得到目標(biāo)視頻中視頻段對應(yīng)的內(nèi)容關(guān)鍵字,進一步地,可將關(guān)鍵字與視頻段或視頻時間軸的時間點關(guān)聯(lián)起來。
因此,優(yōu)選地,如圖5所示,關(guān)鍵字獲取單元31也可以包括:
視頻分割單元313,用于對目標(biāo)視頻進行鏡頭分割,以得到組成目標(biāo)視頻的多個鏡頭;
文字識別單元314,用于提取每個鏡頭下的關(guān)鍵幀,對關(guān)鍵幀對應(yīng)的幀圖像進行文字識別;以及
關(guān)鍵字獲取子單元315,用于根據(jù)每個鏡頭得到的文字識別結(jié)果,獲取目標(biāo)視頻每個鏡頭對應(yīng)的內(nèi)容關(guān)鍵字。
本發(fā)明實施實施例在獲取目標(biāo)視頻的視頻內(nèi)容關(guān)鍵字、建立視頻內(nèi)容關(guān)鍵字與目標(biāo)視頻的視頻時間軸上時間點的對應(yīng)關(guān)系時,采用對視頻中音頻的語音識別或視頻中鏡頭關(guān)鍵幀的圖像識別,實現(xiàn)了內(nèi)容關(guān)鍵字的自動提取,提高了目標(biāo)視頻內(nèi)容關(guān)鍵字的提取準(zhǔn)確度,進而提高了用戶視頻內(nèi)容的查找或定位準(zhǔn)確度。
在本發(fā)明實施例中,視頻內(nèi)容查看裝置的各單元可由相應(yīng)的硬件或軟件單元實現(xiàn),各單元可以為獨立的軟、硬件單元,也可以集成為視頻播放設(shè)備或系統(tǒng)的一個軟、硬件單元,在此不用以限制本發(fā)明。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。