鏡頭分割方法
【專利摘要】本發(fā)明公開了一種鏡頭分割方法,包括步驟:A、提取視頻中每一幀的尺度不變特征轉(zhuǎn)換SIFT特征作為當(dāng)前幀的特征,將所有特征聚類得到包含第一預(yù)設(shè)數(shù)量特征詞的特征詞典;B、計(jì)算相鄰兩幀之間的距離最大值,所述兩幀之間的距離最大值大于預(yù)設(shè)閾值的位置為視頻鏡頭分割的邊界。應(yīng)用本發(fā)明所述的鏡頭分割方法,有效地實(shí)現(xiàn)了對(duì)一段視頻的鏡頭分割,較好的提取了視頻數(shù)據(jù)中的鏡頭邊界。
【專利說明】鏡頭分割方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理【技術(shù)領(lǐng)域】,特別涉及一種鏡頭分割方法。
【背景技術(shù)】
[0002]隨著信息傳播工具的迅速發(fā)展,視頻己經(jīng)漸漸取代文本、圖像成為人們?nèi)粘I钪蝎@取信息的一個(gè)主要途徑,如何對(duì)這些視頻進(jìn)行有效的檢索和識(shí)別已經(jīng)成為互聯(lián)網(wǎng)應(yīng)用的一個(gè)重要問題。由于視頻信息數(shù)據(jù)量大、分辨率統(tǒng)一、編碼多種多樣等特點(diǎn),制約著基于視頻內(nèi)容檢索的發(fā)展。因此,如何提高視頻內(nèi)容檢測的準(zhǔn)確度與效率,成為視頻內(nèi)容檢索關(guān)注的問題。
[0003]為了對(duì)視頻內(nèi)容進(jìn)行有效的組織,需要將視頻分解為一個(gè)個(gè)基本單元,而一般認(rèn)為視頻的基本物理單元是鏡頭,一個(gè)鏡頭由一組攝像機(jī)連續(xù)拍攝得到的時(shí)間上連續(xù)的若干幀圖像組成。鏡頭的自動(dòng)分割是視頻結(jié)構(gòu)化的基礎(chǔ),也是視頻分析和視頻檢索過程中的首要任務(wù),鏡頭分割在基于內(nèi)容的視頻分析與檢索的研究中具有重要地位,鏡頭分割的好壞將直接影響到更高一級(jí)的視頻結(jié)構(gòu)化以及后續(xù)視頻檢索的效果。
[0004]為了實(shí)現(xiàn)鏡頭分割,需要找出每個(gè)鏡頭邊界,但是鏡頭邊界之間存在突變型和連續(xù)漸變的情況,尤其對(duì)于連續(xù)漸變的情況難于處理。
[0005]因此亟需一種能夠準(zhǔn)確分割鏡頭的方法。
【發(fā)明內(nèi)容】
[0006](一)要解決的技術(shù)問題
[0007]本發(fā)明要解決的技術(shù)問題是,針對(duì)上述缺陷,如何提供一種鏡頭分割方法,其能夠準(zhǔn)確的分割視頻片段中的鏡頭。
[0008](二)技術(shù)方案
[0009]為解決上述技術(shù)問題,本發(fā)明提供了一種鏡頭分割方法,包括步驟:
[0010]A、提取視頻中每一幀的尺度不變特征轉(zhuǎn)換SIFT特征作為當(dāng)前幀的特征,將所有特征聚類得到包含第一預(yù)設(shè)數(shù)量特征詞的特征詞典;
[0011]B、計(jì)算相鄰兩幀之間的距離最大值,所述兩幀之間的距離最大值大于預(yù)設(shè)閾值的位置為視頻鏡頭分割的邊界。
[0012]其中,所述將所有特征聚類包括:
[0013]采用近鄰傳播算法將所有特征聚類。
[0014]其中,所述尺度不變特征轉(zhuǎn)換SIFT特征為128維的向量。
[0015]其中,所述相鄰兩幀之間的距離由當(dāng)前每個(gè)幀中的特征詞與相鄰幀特征詞的距離最小值之和的平均值來計(jì)算;所述相鄰兩個(gè)特征詞的距離由靜態(tài)距離和動(dòng)態(tài)距離構(gòu)成,
[0016]所述相鄰兩個(gè)特征詞的靜態(tài)距離sim (W1, W2)的計(jì)算公式為sim (W1, W2)=I W1-W2 |2,其中W1, W2分別為兩個(gè)特征詞;
[0017]所述相鄰兩個(gè)特征詞的動(dòng)態(tài)距離md(i,j)的計(jì)算公式為
【權(quán)利要求】
1.一種鏡頭分割方法,其特征在于,包括步驟: A、提取視頻中每一幀的尺度不變特征轉(zhuǎn)換SIFT特征作為當(dāng)前幀的特征,將所有特征聚類得到包含第一預(yù)設(shè)數(shù)量特征詞的特征詞典; B、計(jì)算相鄰兩幀之間的距離最大值,所述兩幀之間的距離最大值大于預(yù)設(shè)閾值的位置為視頻鏡頭分割的邊界。
2.根據(jù)權(quán)利要求1所述的鏡頭分割方法,其特征在于,所述將所有特征聚類包括: 采用近鄰傳播算法將所有特征聚類。
3.根據(jù)權(quán)利要求1所述的鏡頭分割方法,其特征在于,所述尺度不變特征轉(zhuǎn)換SIFT特征為128維的向量。
4.根據(jù)權(quán)利要求1所述的鏡頭分割方法,其特征在于,所述相鄰兩幀之間的距離由當(dāng)前每個(gè)幀中的特征詞與相鄰幀特征詞的距離最小值之和的平均值來計(jì)算;所述相鄰兩個(gè)特征詞的距離由靜態(tài)距離和動(dòng)態(tài)距離構(gòu)成, 所述相鄰兩個(gè)特征詞的靜態(tài)距離sim (WpW2)的計(jì)算公式為sim Cw1, w2) = W1-W2 |2,其中W1, W2分別為兩個(gè)特征詞; 所述相鄰兩個(gè)特征詞的動(dòng)態(tài)距離md(i,j)的計(jì)算公式為
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的鏡頭分割方法,其特征在于,所述計(jì)算相鄰兩幀之間的距離最大值具體包括: 將視頻中連續(xù)的第二預(yù)設(shè)數(shù)量的幀組成滑動(dòng)窗口,計(jì)算滑動(dòng)窗口中相鄰兩幀之間的距離最大值。
6.根據(jù)權(quán)利要求5所述的鏡頭分割方法,其特征在于,還包括步驟: C、移動(dòng)滑動(dòng)窗口,返回步驟B。
【文檔編號(hào)】G06T7/00GK103578094SQ201210254690
【公開日】2014年2月12日 申請(qǐng)日期:2012年7月20日 優(yōu)先權(quán)日:2012年7月20日
【發(fā)明者】劉永進(jìn), 郭文靜, 羅曦, 張金凱, 蘇舟 申請(qǐng)人:清華大學(xué)