一種視頻場(chǎng)景變換識(shí)別的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種視頻場(chǎng)景變換識(shí)別的方法及裝置。
【背景技術(shù)】
[0002]隨著科學(xué)技術(shù)的發(fā)展,視頻等多媒體格式的信息數(shù)據(jù)越來越豐富,且對(duì)于視頻數(shù)據(jù)編輯的精準(zhǔn)性要求越來越高。而視頻的場(chǎng)景變換識(shí)別需要避開背景混亂運(yùn)動(dòng)以及遮擋物的影響等現(xiàn)象的存在,將該視頻中該次場(chǎng)景的持續(xù)存在過程識(shí)別出來。在現(xiàn)有技術(shù)中,通常僅通過將相鄰兩視頻幀做整幀的比較,如果相鄰兩視頻幀的場(chǎng)景變化率超過預(yù)設(shè)閾值,則認(rèn)為場(chǎng)景發(fā)生變換。但是,在很多場(chǎng)合下該方案并不適用,比如,某人在戶外發(fā)言,期間發(fā)言人物不變,但是由于在戶外,有不停走動(dòng)的人群、車輛等移動(dòng)背景,因此該場(chǎng)合下的背景會(huì)迅速變化,那么對(duì)比得到的相鄰兩視頻幀的整幀場(chǎng)景變化率可能很高,但是事實(shí)上發(fā)言人物的場(chǎng)景并沒有變化,因此單純用相鄰兩視頻幀的場(chǎng)景變化率來判斷是不準(zhǔn)確的。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提供一種視頻場(chǎng)景變換識(shí)別的方法及裝置,用以準(zhǔn)確識(shí)別視頻中的場(chǎng)景變換,提高視頻場(chǎng)景識(shí)別的精準(zhǔn)度,提升用戶體驗(yàn)。
[0004]根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種視頻場(chǎng)景變換識(shí)別的方法,包括:
[0005]接收?qǐng)鼍白儞Q識(shí)別指令,檢測(cè)相鄰的兩視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值;
[0006]在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),在兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀,其中,N為整數(shù),且N>2 ;
[0007]將重新提取的各所述視頻幀均劃分為M個(gè)區(qū)域,并獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的M個(gè)區(qū)域的場(chǎng)景變化率,并根據(jù)所述場(chǎng)景變化率識(shí)別場(chǎng)景變換位置,其中,M為整數(shù),且M>1。
[0008]在一個(gè)實(shí)施例中,所述接收?qǐng)鼍白儞Q識(shí)別指令,檢測(cè)相鄰的兩所述視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值,包括:
[0009]接收?qǐng)鼍白儞Q識(shí)別指令,從視頻中提取指定時(shí)間范圍內(nèi)的視頻幀;
[0010]檢測(cè)相鄰的兩所述視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值;
[0011]在相鄰的兩所述視頻幀的場(chǎng)景變化率均未超過預(yù)設(shè)變化率閾值時(shí),完成本次場(chǎng)景變換識(shí)別操作。
[0012]在一個(gè)實(shí)施例中,所述在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),在兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀,其中,N為整數(shù),且N>2,包括:
[0013]在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),對(duì)超過預(yù)設(shè)變化率閾值的兩所述視頻幀的所屬時(shí)間范圍進(jìn)行標(biāo)記;
[0014]檢測(cè)已標(biāo)記的兩所述視頻幀所屬時(shí)間范圍;
[0015]在檢測(cè)到的兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀,其中,N為整數(shù),且 N>2。
[0016]在一個(gè)實(shí)施例中,所述將重新提取的各所述視頻幀均劃分為M個(gè)區(qū)域,并獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的M個(gè)區(qū)域的場(chǎng)景變化率,并根據(jù)所述場(chǎng)景變化率識(shí)別場(chǎng)景變換位置,其中,M為整數(shù),且M>1,包括:
[0017]將重新提取的N個(gè)視頻幀中各所述視頻幀均劃分為M個(gè)區(qū)域,獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的第M個(gè)區(qū)域的場(chǎng)景變化率;其中,M為整數(shù),且M>1 ;
[0018]對(duì)比所有相鄰兩視頻幀的第M個(gè)區(qū)域的場(chǎng)景變化率;
[0019]確定第M個(gè)區(qū)域的區(qū)域場(chǎng)景變換位置為第M個(gè)區(qū)域場(chǎng)景變化率最高的兩所述視頻幀之間。
[0020]在一個(gè)實(shí)施例中,所述將重新提取的各所述視頻幀均劃分為M個(gè)區(qū)域,并獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的M個(gè)區(qū)域的場(chǎng)景變化率,并根據(jù)所述場(chǎng)景變化率識(shí)別場(chǎng)景變換位置,其中,M為整數(shù),且M>1,還包括:
[0021]檢測(cè)M個(gè)區(qū)域分別對(duì)應(yīng)的區(qū)域場(chǎng)景變換位置,獲取區(qū)域場(chǎng)景變換位置中重合次數(shù)最多的位置;
[0022]確定所述區(qū)域場(chǎng)景變換位置中重合次數(shù)最多的位置為已標(biāo)記的兩所述視頻幀所屬時(shí)間范圍內(nèi)的場(chǎng)景變換位置。
[0023]根據(jù)本發(fā)明實(shí)施例的第二方面,還提供一種視頻場(chǎng)景變換識(shí)別的裝置,包括:
[0024]檢測(cè)模塊,用于接收?qǐng)鼍白儞Q識(shí)別指令,檢測(cè)相鄰的兩視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值;
[0025]重新提取模塊,用于在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),在兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀,其中,N為整數(shù),且N>2 ;
[0026]識(shí)別模塊,用于將重新提取的各所述視頻幀均劃分為M個(gè)區(qū)域,并獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的M個(gè)區(qū)域的場(chǎng)景變化率,并根據(jù)所述場(chǎng)景變化率識(shí)別場(chǎng)景變換位置,其中,M為整數(shù),且M>1。
[0027]在一個(gè)實(shí)施例中,所述檢測(cè)模塊包括:
[0028]提取子模塊,用于接收?qǐng)鼍白儞Q識(shí)別指令,從視頻中提取指定時(shí)間范圍內(nèi)的視頻幀;
[0029]第一檢測(cè)子模塊,用于檢測(cè)相鄰的兩所述視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值;
[0030]第一識(shí)別子模塊,用于在相鄰的兩所述視頻幀的場(chǎng)景變化率均未超過預(yù)設(shè)變化率閾值時(shí),完成本次場(chǎng)景變換識(shí)別操作。
[0031 ] 在一個(gè)實(shí)施例中,所述重新提取模塊包括:
[0032]標(biāo)記子模塊,用于在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),對(duì)超過預(yù)設(shè)變化率閾值的兩所述視頻幀的所屬時(shí)間范圍進(jìn)行標(biāo)記;
[0033]第二檢測(cè)子模塊,用于檢測(cè)已標(biāo)記的兩所述視頻幀所屬時(shí)間范圍;
[0034]重新提取子模塊,用于在檢測(cè)到的兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀,其中,N為整數(shù),且N>2。
[0035]在一個(gè)實(shí)施例中,所述識(shí)別模塊包括:
[0036]第一獲取子模塊,用于將重新提取的N個(gè)視頻幀中各所述視頻幀均劃分為M個(gè)區(qū)域,獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的第M個(gè)區(qū)域的場(chǎng)景變化率;其中,M為整數(shù),且 M>1 ;
[0037]對(duì)比子模塊,用于對(duì)比所有相鄰兩視頻幀的第M個(gè)區(qū)域的場(chǎng)景變化率;
[0038]第二識(shí)別子模塊,用于確定第M個(gè)區(qū)域的區(qū)域場(chǎng)景變換位置為第M個(gè)區(qū)域場(chǎng)景變化率最高的兩所述視頻幀之間。
[0039]在一個(gè)實(shí)施例中,所述識(shí)別模塊還包括:
[0040]第二獲取子模塊,用于檢測(cè)M個(gè)區(qū)域分別對(duì)應(yīng)的區(qū)域場(chǎng)景變換位置,獲取區(qū)域場(chǎng)景變換位置中重合次數(shù)最多的位置;
[0041]第三識(shí)別子模塊,用于確定所述區(qū)域場(chǎng)景變換位置中重合次數(shù)最多的位置為已標(biāo)記的兩所述視頻幀所屬時(shí)間范圍內(nèi)的場(chǎng)景變換位置。
[0042]本發(fā)明實(shí)施例提供的技術(shù)方案可產(chǎn)生以下有益效果:接收?qǐng)鼍白儞Q識(shí)別指令,檢測(cè)相鄰的兩視頻幀的場(chǎng)景變化率是否超過預(yù)設(shè)變化率閾值;在相鄰的兩所述視頻幀的場(chǎng)景變化率超過預(yù)設(shè)變化率閾值時(shí),在兩所述視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀;將重新提取的各所述視頻幀均劃分為M個(gè)區(qū)域,并獲取N個(gè)所述視頻幀中所有相鄰兩視頻幀的M個(gè)區(qū)域的場(chǎng)景變化率,并根據(jù)所述場(chǎng)景變化率識(shí)別場(chǎng)景變換位置。該方案通過在場(chǎng)景變化率超過預(yù)設(shè)變化率閾值的相鄰的兩視頻幀所屬時(shí)間范圍內(nèi)重新提取N個(gè)視頻幀并將各視頻幀劃均分為M個(gè)區(qū)域進(jìn)行分別對(duì)比,取其區(qū)域場(chǎng)景變化位置重合次數(shù)最高的位置作為最終的場(chǎng)景變換位置,從而提高了視頻場(chǎng)景識(shí)別的精準(zhǔn)度,準(zhǔn)確識(shí)別視頻中的場(chǎng)景變換,提升用戶體驗(yàn)。
[0043]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
[0044]下面通過附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說明】
[0045]附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。
[0046]在附圖中:
[0047]圖1為本發(fā)明根據(jù)一示例性實(shí)施例示出的一種視頻場(chǎng)景變換識(shí)別的方法的流程圖;
[0048]圖2為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的方法中步驟SlO的實(shí)施方式流程圖;
[0049]圖3為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的方法中步驟S20的實(shí)施方式流程圖;
[0050]圖4為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的方法中一種步驟S30的實(shí)施方式流程圖;
[0051]圖5為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的方法中另一種步驟S30的實(shí)施方式流程圖;
[0052]圖6為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的裝置的框圖;
[0053]圖7為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的裝置中檢測(cè)模塊61的框圖;
[0054]圖8為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的裝置中重新提取模塊62的框圖;
[0055]圖9為本發(fā)明根據(jù)一示例性實(shí)施例示出的視頻場(chǎng)景變換識(shí)別的裝置中一種識(shí)別模塊63的框圖;
[0056]圖10為本發(fā)明根據(jù)一示例性實(shí)施例