秒的線段。當(dāng)視頻截圖功能處于開啟狀態(tài)時(shí),可對(duì)時(shí)間軸上的點(diǎn)所對(duì)應(yīng)的視頻圖像進(jìn)行截取,還可對(duì)線段中所對(duì)應(yīng)的視頻圖像進(jìn)行截取,并生成相應(yīng)的圖片進(jìn)行存儲(chǔ)。當(dāng)視頻剪切功能處于開啟狀態(tài)時(shí),可對(duì)線段中所對(duì)應(yīng)的視頻內(nèi)容進(jìn)行剪切,隨后可生成相應(yīng)的剪切后的視頻文件進(jìn)行存儲(chǔ)。
[0032]進(jìn)一步的,在對(duì)目標(biāo)視頻進(jìn)行剪切操作時(shí),可獲取預(yù)設(shè)時(shí)間長(zhǎng)度,根據(jù)所獲取的時(shí)間點(diǎn)和預(yù)設(shè)時(shí)間長(zhǎng)度確定剪切區(qū)間,根據(jù)剪切區(qū)間對(duì)目標(biāo)視頻進(jìn)行剪切。示例性的,可根據(jù)預(yù)設(shè)算法得出預(yù)設(shè)時(shí)間長(zhǎng)度y,在時(shí)間點(diǎn)η處獲取到匹配的聲音,可將剪切區(qū)間確定為[n-y,n+y],對(duì)該剪切區(qū)間內(nèi)的視頻進(jìn)行剪切。例如,獲取到的預(yù)設(shè)時(shí)間長(zhǎng)度y為15秒,獲取的時(shí)間點(diǎn)η為I分20秒,則剪切區(qū)間為[I分5秒,I分35秒],對(duì)目標(biāo)視頻的I分5秒到I分35秒之間的視頻內(nèi)容進(jìn)行剪切。
[0033]進(jìn)一步的,可根據(jù)所獲取的時(shí)間點(diǎn)對(duì)目標(biāo)視頻進(jìn)行剪切,并生成多個(gè)子視頻,將多個(gè)子視頻拼接成為合成視頻。示例性的,當(dāng)目標(biāo)人物聲音在目標(biāo)視頻中出現(xiàn)多次時(shí),可根據(jù)所獲取的時(shí)間點(diǎn)對(duì)目標(biāo)視頻進(jìn)行多次剪切,每次剪切后生成一個(gè)對(duì)應(yīng)的子視頻。在對(duì)整個(gè)目標(biāo)視頻剪切完畢后,可按照時(shí)間點(diǎn)的順序?qū)⒍鄠€(gè)子視頻進(jìn)行拼接處理,形成合成視頻,可避免用戶日后查看子視頻時(shí)多次執(zhí)行打開視頻的操作。
[0034]優(yōu)選的,在對(duì)目標(biāo)視頻進(jìn)行截圖操作時(shí),如果目標(biāo)人物聲音在目標(biāo)視頻中出現(xiàn)次數(shù)較多或持續(xù)出現(xiàn)的時(shí)間較長(zhǎng),可獲取截圖頻率,并根據(jù)截圖頻率和所獲取的時(shí)間點(diǎn)對(duì)目標(biāo)視頻進(jìn)行截圖,從而控制截圖數(shù)量。其中,截圖頻率可由系統(tǒng)默認(rèn)設(shè)置或由用戶根據(jù)實(shí)際情況自行設(shè)定。例如,所獲取的截圖頻率為30秒一次,在目標(biāo)視頻的25分到25分40秒、30分到32分均出現(xiàn)了目標(biāo)人物聲音,則可在25分30秒處截取一張圖像,在30分30秒、31分、31分30秒及32分處分別截取一張圖像,共得到四張圖片。
[0035]在本實(shí)施例中,當(dāng)目標(biāo)人物的聲音出現(xiàn)時(shí)間比較集中時(shí),為了節(jié)省掃描匹配的時(shí)間,在執(zhí)行步驟102之前,可增加獲取目標(biāo)視頻的待掃描區(qū)間的步驟,并在執(zhí)行步驟102時(shí),根據(jù)聲紋信息掃描待掃描區(qū)間,并獲取待掃描區(qū)間中與聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn)。其中,所述掃描區(qū)間可由用戶進(jìn)行選定。具體的,可通過傳入相關(guān)的時(shí)間段或者通過在視頻的進(jìn)度中指定待掃描區(qū)間,如用戶可通過拉動(dòng)視頻播放進(jìn)度條從一個(gè)時(shí)間點(diǎn)到另外一個(gè)時(shí)間點(diǎn),將兩個(gè)時(shí)間點(diǎn)之間的區(qū)間作為待掃描區(qū)間。
[0036]本發(fā)明實(shí)施例一提供的視頻截圖或剪切的方法,根據(jù)采集到的聲音樣本中的聲紋信息來掃描目標(biāo)視頻,并獲取目標(biāo)視頻中與該聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn),根據(jù)獲取的時(shí)間點(diǎn)對(duì)目標(biāo)視頻進(jìn)行截圖或者剪切。通過采用上述技術(shù)方案,用戶在使用移動(dòng)設(shè)備進(jìn)行視頻截圖或剪切操作時(shí),可指定聲音樣本和目標(biāo)視頻,移動(dòng)設(shè)備就會(huì)自動(dòng)根據(jù)從該聲音樣本中采集的聲紋信息來掃描目標(biāo)視頻,將聲紋信息匹配處的視頻圖像或視頻內(nèi)容進(jìn)行截取,算法簡(jiǎn)單且截取準(zhǔn)確率高,可實(shí)現(xiàn)快速截取。整個(gè)操作過程簡(jiǎn)單快捷,無需用戶手動(dòng)選擇截取位置,滿足用戶需求。
[0037]實(shí)施例二
[0038]圖2為本發(fā)明實(shí)施例二提供的一種視頻截圖或剪切的方法的流程示意圖,本實(shí)施例以上述實(shí)施例為基礎(chǔ)進(jìn)行優(yōu)化,在本實(shí)施例中,對(duì)目標(biāo)視頻進(jìn)行分段掃描,并根據(jù)所獲取的時(shí)間點(diǎn)生成多個(gè)子時(shí)間軸,再根據(jù)多個(gè)子時(shí)間軸對(duì)目標(biāo)視頻進(jìn)行分段截圖或者剪切。
[0039]相應(yīng)的,本實(shí)施例的方法包括如下步驟:
[0040]步驟201、采集聲音樣本中的聲紋信息。
[0041]步驟202、根據(jù)聲紋信息對(duì)目標(biāo)視頻進(jìn)行分段掃描,并獲取目標(biāo)視頻中與聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn)。
[0042]示例性的,為了加快截圖或剪切進(jìn)程,可將目標(biāo)視頻中的音頻信息進(jìn)行提取,對(duì)所提取出來的音頻信息進(jìn)行基于聲紋信息的多線程式分段掃描??苫跁r(shí)間長(zhǎng)度將音頻信息平均分成N部分,同時(shí)對(duì)每個(gè)部分進(jìn)行掃描,并獲取音頻信息中與聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn)。例如,目標(biāo)視頻的時(shí)間長(zhǎng)度共30分鐘,可將提取出來的音頻信息按照0-10分鐘、10分鐘-20分鐘及20分鐘-30分鐘平均分成3個(gè)部分,對(duì)這3個(gè)部分同時(shí)進(jìn)行掃描匹配。
[0043]步驟203、根據(jù)所獲取的時(shí)間點(diǎn)生成多個(gè)子時(shí)間軸。
[0044]示例性的,根據(jù)音頻信息的每個(gè)部分所獲取的時(shí)間點(diǎn)生成N個(gè)子時(shí)間軸。進(jìn)一步的,生成一個(gè)子時(shí)間軸后,可對(duì)該子時(shí)間軸進(jìn)行存儲(chǔ)。
[0045]步驟204、根據(jù)多個(gè)子時(shí)間軸對(duì)目標(biāo)視頻進(jìn)行分段截圖或者剪切。
[0046]示例性的,由于音頻信息的每個(gè)部分中包含的與聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn)的數(shù)量很可能不同,包含時(shí)間點(diǎn)數(shù)量較多的部分在掃描匹配的過程中可能耗時(shí)相對(duì)長(zhǎng)一些,因此,每個(gè)子時(shí)間軸的生成時(shí)間也可能會(huì)不同。當(dāng)一個(gè)子時(shí)間軸先于其他部分的子時(shí)間軸被生成時(shí),便可基于該先生成的子時(shí)間軸對(duì)相應(yīng)的視頻部分進(jìn)行截圖或者剪切,而不必等所有子時(shí)間軸都生成后再執(zhí)行截圖或剪切操作。
[0047]在本實(shí)施例中,為了進(jìn)一步加快截圖或剪切進(jìn)程,也可在執(zhí)行步驟202之前,增加獲取目標(biāo)視頻的待掃描區(qū)間的步驟,并在執(zhí)行步驟202時(shí),根據(jù)聲紋信息對(duì)待掃描區(qū)間的視頻進(jìn)行分段掃描。其中,所述掃描區(qū)間可由用戶進(jìn)行選定。
[0048]下面提供一種應(yīng)用本發(fā)明實(shí)施例二的方法進(jìn)行視頻截圖的優(yōu)選【具體實(shí)施方式】:
[0049]例如,用戶需要對(duì)手機(jī)中的一個(gè)視頻A進(jìn)行視頻截圖,目的是截取包含人物B聲音的場(chǎng)景。用戶可先指定截取類型為截圖,然后確認(rèn)需要進(jìn)行截圖的目標(biāo)視頻是整個(gè)時(shí)長(zhǎng)的視頻A。用戶在手機(jī)中選取一個(gè)包含人物B聲音的文件(可為音頻文件或視頻文件),或者在視頻A中指定一個(gè)包含人物B聲音的場(chǎng)景作為聲音樣本,采集聲音樣本中的聲紋信息。將視頻A平均分成N段進(jìn)行多線程掃描匹配,每生成一個(gè)包含人物B聲紋信息的子時(shí)間軸時(shí),根據(jù)該子時(shí)間軸對(duì)該段視頻進(jìn)行截圖。截圖后生成的圖片文件以其在視頻A中的時(shí)間點(diǎn)命名并存入手機(jī)內(nèi)存。如果人物B出現(xiàn)的場(chǎng)景較多時(shí),為了控制截圖數(shù)量,可設(shè)置截圖頻率,如30s內(nèi)進(jìn)行一次截圖。
[0050]下面提供一種應(yīng)用本發(fā)明實(shí)施例二的方法進(jìn)行視頻剪切的優(yōu)選【具體實(shí)施方式】:
[0051]例如,用戶需要對(duì)視頻A進(jìn)行剪切,目的是剪切包括人物C聲音的場(chǎng)景。通過麥克風(fēng)錄制一段人物C說的話,生成聲音樣本,采集聲音樣本中的聲紋信息。用戶可先指定截取類型為視頻剪切,然后指定待掃描區(qū)間為30-60分鐘。將視頻A的待掃描區(qū)間30-60分鐘記為區(qū)間D,將區(qū)間D平均分成M段進(jìn)行多線程掃描匹配,每生成一個(gè)包含人物C聲紋信息的子時(shí)間軸時(shí),根據(jù)該子時(shí)間軸對(duì)相應(yīng)的視頻部分進(jìn)行剪切。假設(shè)分別在35-37、45-48、54-56分鐘這三個(gè)時(shí)間段包含人物C的聲紋特性,將會(huì)生成三個(gè)子視頻,可將這三個(gè)子視頻進(jìn)行拼接,生成一個(gè)稍大的合成視頻,并進(jìn)行存儲(chǔ)。
[0052]本發(fā)明實(shí)施例二提供的視頻截圖或剪切的方法,可根據(jù)聲紋信息對(duì)目標(biāo)視頻進(jìn)行多線程式的分段掃描、匹配及截圖或剪切,可大大縮短整個(gè)視頻截圖或剪切過程所對(duì)應(yīng)的時(shí)間,使用戶更快地得到想要截取的圖片或視頻,進(jìn)一步提升用戶的使用體驗(yàn)。
[0053]實(shí)施例三
[0054]圖3為本發(fā)明實(shí)施例三提供的一種視頻截圖或剪切的裝置的結(jié)構(gòu)框圖,該裝置可由軟件和/或硬件實(shí)現(xiàn),并一般集成于移動(dòng)設(shè)備中。如圖3所示,該裝置包括:聲紋信息采集模塊301,用于采集聲音樣本中的聲紋信息;視頻掃描模塊302,用于根據(jù)所述聲紋信息掃描目標(biāo)視頻,并獲取所述目標(biāo)視頻中與所述聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn);截圖或剪切模塊303,用于根據(jù)所獲取的時(shí)間點(diǎn)對(duì)所述目標(biāo)視頻進(jìn)行截圖或者剪切。
[0055]本發(fā)明實(shí)施例三提供的視頻截圖或剪切的裝置,由視頻掃描模塊302根據(jù)聲紋信息采集模塊301采集到的聲音樣本中的聲紋信息來掃描目標(biāo)視頻,并獲取目標(biāo)視頻中與該聲紋信息匹配的聲音出現(xiàn)的時(shí)間點(diǎn),由截圖或剪切模塊303根據(jù)獲取的時(shí)間點(diǎn)對(duì)目標(biāo)視頻進(jìn)行截圖或者剪切。通過采用上述技術(shù)方案,用戶在使用移動(dòng)設(shè)備進(jìn)行視頻截圖或剪切操作時(shí),可指定聲音樣本和目標(biāo)視頻,移動(dòng)設(shè)備就會(huì)自動(dòng)根據(jù)從該聲音樣本中采集的聲紋信息來掃描目標(biāo)視頻,將聲紋信息匹配處的視頻圖像或視頻內(nèi)容進(jìn)行截取,算法簡(jiǎn)單且截取準(zhǔn)確率高,可實(shí)現(xiàn)快速截取。整個(gè)操作過程簡(jiǎn)單