欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法

文檔序號:7812364閱讀:272來源:國知局
一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法
【專利摘要】本發(fā)明是一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法,包括以下步驟:(1)視頻場景分析,視頻場景分析分為兩個(gè)部分:i.通過視頻鏡頭分析,分析出子場景;ii.通過語音特征分析,對子場景聚類,聚類為大場景;對于連續(xù)出現(xiàn)的子場景,通過過零率和短時(shí)能量,區(qū)分出噪音和語音,然后,比較連續(xù)子場景的平均過零率和短時(shí)能量,當(dāng)差異在預(yù)先設(shè)定的閾值內(nèi),則這兩個(gè)子場景屬于一個(gè)大場景,對子場景進(jìn)行聚類,聚類為大場景;(2)場景里的語音時(shí)間軸切分;(3)整體視頻時(shí)間軸的切分;將不同場景所檢測得到的時(shí)間軸數(shù)據(jù)合并,即可得到整體的視頻時(shí)間軸。本發(fā)明的針對影視視頻的時(shí)間軸自動產(chǎn)生方法,可以自動提取出語音片段,產(chǎn)生字幕時(shí)間軸。
【專利說明】一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)軟件【技術(shù)領(lǐng)域】,尤指一種針對影視視頻的時(shí)間軸自動產(chǎn)生方 法。

【背景技術(shù)】
[0002] 影視類視頻的特點(diǎn)是:說話人眾多;環(huán)境噪音干擾大;存在片首曲、片尾曲和配音 的干擾。現(xiàn)有技術(shù)對影視類視頻的處理方法中,通常,影視類視頻長度為0.5-2小時(shí)。以1 小時(shí)的視頻為例,切分出時(shí)間軸,需要1-2小時(shí)的人工,需要投入比較大的人力,并且效率 工作效率較低?,F(xiàn)有技術(shù)中,通過視頻鏡頭分析,分析出子場景的方法很多,郭小川的2011 年復(fù)旦大學(xué)碩士論文《基于內(nèi)容的視頻場景分析方法研究》中也介紹了關(guān)于視頻場景分析 方法的研究。所以在這樣的一個(gè)現(xiàn)有技術(shù)的基礎(chǔ)上,結(jié)合其他時(shí)間軸的切分技術(shù),來實(shí)現(xiàn)自 動產(chǎn)生時(shí)間軸的方法顯得可行并且迫切。


【發(fā)明內(nèi)容】

[0003] 為了解決上述問題,本發(fā)明提供一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法,可以 自動提取出語音片段,產(chǎn)生字幕時(shí)間軸。
[0004] 本發(fā)明通過視頻分析得到子場景,再通過噪音特征聚類得到大場景;并且對大場 景進(jìn)行語音端點(diǎn)檢測得到時(shí)間軸,再進(jìn)行合并成整體時(shí)間軸。
[0005] 本發(fā)明是一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法,包括以下步驟: (1) 視頻場景分析,視頻場景分析分為兩個(gè)部分: i. 通過視頻鏡頭分析,分析出子場景; ii. 通過語音特征分析,對子場景聚類,聚類為大場景;對于連續(xù)出現(xiàn)的子場景,通過 過零率和短時(shí)能量,區(qū)分出噪音和語音,然后,比較連續(xù)子場景的平均過零率和短時(shí)能量, 當(dāng)差異在預(yù)先設(shè)定的閾值內(nèi),則這兩個(gè)子場景屬于一個(gè)大場景,對子場景進(jìn)行聚類,聚類為 大場景; (2) 場景里的語音時(shí)間軸切分; (3) 整體視頻時(shí)間軸的切分;將不同場景所檢測得到的時(shí)間軸數(shù)據(jù)合并,即可得到整體 的視頻時(shí)間軸。
[0006] 本發(fā)明的有益技術(shù)效果在于:本發(fā)明通過語音分析的方式,自動得到影視視頻的 時(shí)間軸,主要用于給影視視頻加配字幕時(shí)的預(yù)處理,省去了人工調(diào)制的過程。

【具體實(shí)施方式】
[0007] 下面結(jié)合實(shí)施例,對本發(fā)明的【具體實(shí)施方式】作進(jìn)一步詳細(xì)描述。
[0008] 本發(fā)明是一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法,本實(shí)施例做以下假設(shè):(1) 視頻由多個(gè)場景構(gòu)成的;(2)每個(gè)場景的環(huán)境噪音和配音是穩(wěn)定的。在此假設(shè)下,針對影 視視頻的時(shí)間軸自動產(chǎn)生方法包括以下步驟: (1)視頻場景分析,視頻場景分析分為兩個(gè)部分: i.通過視頻鏡頭分析,分析出子場景;通過視頻分析,將視頻分割為一個(gè)個(gè)的場景有 很多種方法。ii.通過語音特征分析,對子場景聚類,聚類為大場景。比如說,一副室內(nèi)劇, 劇里有幾個(gè)演員,鏡頭在幾個(gè)演員之間切換。通過分析鏡頭,可以將這樣的場景切分出來。 但是,這樣的場景過于細(xì),而我們需要的是"室內(nèi)"這個(gè)大場景,這個(gè)大場景的語音背景、配 音背景是一致的,所以,需要同歸語音特征分析,對這樣的場景進(jìn)行聚類。對于連續(xù)出現(xiàn)的 子場景,通過過零率和短時(shí)能量,區(qū)分出噪音和語音,然后,比較連續(xù)子場景的平均過零率 和短時(shí)能量,當(dāng)差異在預(yù)先設(shè)定的閾值內(nèi),則這兩個(gè)子場景屬于一個(gè)大場景,對子場景進(jìn)行 聚類,聚類為大場景。
[0009] (2)場景里的語音時(shí)間軸切分;對一個(gè)場景內(nèi),由于背景音和環(huán)境音比較單一,可 以使用傳統(tǒng)的方法進(jìn)行語音端點(diǎn)檢測,得到語音時(shí)間軸。比如,根據(jù)過零率和短時(shí)能量的雙 閾值端點(diǎn)檢測。
[0010] (3)整體視頻時(shí)間軸的切分;將不同場景所檢測得到的時(shí)間軸數(shù)據(jù)合并,即可得到 整體的視頻時(shí)間軸。
【權(quán)利要求】
1. 一種針對影視視頻的時(shí)間軸自動產(chǎn)生方法,其特征在于,包括以下步驟: (1) 視頻場景分析,視頻場景分析分為兩個(gè)部分: i. 通過視頻鏡頭分析,分析出子場景; ii. 通過語音特征分析,對子場景聚類,聚類為大場景;對于連續(xù)出現(xiàn)的子場景,通過 過零率和短時(shí)能量,區(qū)分出噪音和語音,然后,比較連續(xù)子場景的平均過零率和短時(shí)能量, 當(dāng)差異在預(yù)先設(shè)定的閾值內(nèi),則這兩個(gè)子場景屬于一個(gè)大場景,對子場景進(jìn)行聚類,聚類為 大場景; (2) 場景里的語音時(shí)間軸切分; (3) 整體視頻時(shí)間軸的切分;將不同場景所檢測得到的時(shí)間軸數(shù)據(jù)合并,即可得到整體 的視頻時(shí)間軸。
【文檔編號】H04N21/81GK104159152SQ201410423608
【公開日】2014年11月19日 申請日期:2014年8月26日 優(yōu)先權(quán)日:2014年8月26日
【發(fā)明者】程國艮, 袁翔宇, 王宇晨 申請人:中譯語通科技(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
汝南县| 枣阳市| 靖宇县| 舟曲县| 湖南省| 乌兰浩特市| 盐源县| 宁远县| 滦南县| 肥西县| 陆丰市| 桐柏县| 孟津县| 浦县| 千阳县| 洛南县| 颍上县| 交口县| 合作市| 东海县| 策勒县| 凤庆县| 亳州市| 格尔木市| 卫辉市| 宜兴市| 铜陵市| 汝州市| 曲沃县| 五原县| 措勤县| 洛扎县| 开化县| 拉萨市| 大冶市| 从江县| 黄石市| 广宗县| 财经| 措勤县| 高青县|