專(zhuān)利名稱(chēng)::一種描述和捕獲視頻對(duì)象的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及視頻技術(shù),特別涉及一種描述和捕獲視頻對(duì)象的方法及設(shè)備。
背景技術(shù):
:視頻監(jiān)控(VideoSurveillance)技術(shù)經(jīng)過(guò)多年的數(shù)字化發(fā)展,已逐步形成網(wǎng)絡(luò)化,為生產(chǎn)監(jiān)控,如生產(chǎn)線(xiàn)流程監(jiān)控、安全監(jiān)控,如火車(chē)站、地鐵站、飛機(jī)場(chǎng)的安全監(jiān)控,以及其它監(jiān)控如病人護(hù)理發(fā)揮了積極的作用,然而,隨著監(jiān)控對(duì)象的增多以及各對(duì)象屬性資料信息的更新和增加,如何對(duì)大量的視頻監(jiān)控資料進(jìn)行方便地管理、檢索、視頻人機(jī)交互、智能再處理,充分發(fā)揮網(wǎng)絡(luò)化視頻監(jiān)控系統(tǒng)的優(yōu)勢(shì),是目前視頻交互系統(tǒng)(InteractiveVideoSystem)需要解決的問(wèn)題。運(yùn)動(dòng)圖像專(zhuān)家組(MPEG,MovingPictureExpertsGroup),即國(guó)際標(biāo)準(zhǔn)化組織和國(guó)際電工委員會(huì)第一聯(lián)合技術(shù)組第29分委會(huì)第11工作組(ISO/IECJTC1/SC29/WG11),負(fù)責(zé)數(shù)字視頻、音頻和其他媒體的壓縮、解壓縮、處理和表示等國(guó)際技術(shù)標(biāo)準(zhǔn)的制定工作,從1996年IO月開(kāi)始研究多媒體內(nèi)容4笛述才妾口(MultimediaContentDescriptionInterface),也就是MPEG-7,于2002年形成了國(guó)際標(biāo)準(zhǔn)ISO/IEC15938,F(xiàn)irstedition,定義了100多個(gè)描述工具,用于描述各種多媒體信息,這些"描述"(包括描述子和描述模式)與其內(nèi)容關(guān)聯(lián),允許快速有效地搜索用戶(hù)感興趣的資料,帶有MPEG-7數(shù)據(jù)的資料可以包含靜止圖像、圖形、3D模型、音頻、語(yǔ)音、視頻,以及這些元素如何在多媒體表現(xiàn)中組合的信息,而且,這些通用數(shù)據(jù)類(lèi)型的特例還可以包含面部表情和個(gè)人化的特性。MPEG-7支持多種音頻和視覺(jué)的描述,并根據(jù)描述信息的抽象層次,提供一種描述多媒體的方法以便表示不同層次上的用戶(hù)對(duì)信息的需求。以視覺(jué)內(nèi)容為例,較低抽象層包括顏色、視覺(jué)對(duì)象、紋理、草圖、形狀、尺寸、體積、空間、運(yùn)動(dòng)(軌道)和位置關(guān)系等;高層將給出語(yǔ)義信息如"這是一個(gè)場(chǎng)景一個(gè)鴨子正躲藏在樹(shù)后并有一個(gè)汽車(chē)正在幕后通過(guò)"。抽象層特征一般以完全自動(dòng)的方式提取,而高層特征一般需要通過(guò)與用戶(hù)的交互來(lái)實(shí)現(xiàn)。MPEG-7特別適用于多媒體檢索,包括對(duì)視頻監(jiān)控材料的檢索,通過(guò)搜索引擎來(lái)匹配查詢(xún)數(shù)據(jù)和MPEG-7的音視頻描述,如對(duì)于圖形的查詢(xún)通過(guò)在屏幕上畫(huà)幾條線(xiàn)就能得到類(lèi)似圖形、標(biāo)識(shí)、表意文字(符號(hào))等的一組圖像;又如,對(duì)于運(yùn)動(dòng)的查詢(xún)對(duì)一組給定的物體,描述在物體之間的運(yùn)動(dòng)關(guān)系,就可以得到實(shí)現(xiàn)所描述的時(shí)空關(guān)系的動(dòng)畫(huà)列表。目前的隨機(jī)存取視頻系統(tǒng),比如光盤(pán)、硬盤(pán)等,具有"播放、停止、快進(jìn)、快退、暫停、拖動(dòng),,操作模式,可以根據(jù)視頻節(jié)目單來(lái)選擇需要觀看的視頻片段,也可以從指定的時(shí)間點(diǎn)來(lái)播放,并通過(guò)符合MPEG-7的對(duì)象描述可以播放檢索結(jié)果對(duì)應(yīng)的視頻片段。圖1為現(xiàn)有描述方法中使用的動(dòng)態(tài)視頻對(duì)象描述符示意圖,參見(jiàn)圖1,為每幀出現(xiàn)的每個(gè)對(duì)象建立視頻對(duì)象描述符(ObjectDescriptor),描述對(duì)象的各種屬性,在視頻對(duì)象描述符里說(shuō)明其形狀、尺寸、分層、持續(xù)時(shí)間、活動(dòng)、活動(dòng)參數(shù)以及其他對(duì)象特征。在圖1中,對(duì)于一個(gè)視頻序列,每個(gè)序列號(hào)為一幀,為每幀出現(xiàn)的每個(gè)對(duì)象建立一個(gè)視頻對(duì)象描述符,在視頻對(duì)象描述符里說(shuō)明對(duì)象的輪廓坐標(biāo)、對(duì)象編號(hào)、尺寸、分層、持續(xù)時(shí)間、活動(dòng)、活動(dòng)參數(shù)以及其他對(duì)象特征。逐幀的視頻對(duì)象描述符形成一個(gè)視頻對(duì)象描述文件。舉例來(lái)說(shuō),如果同一個(gè)活動(dòng)對(duì)象在N幀圖像中出現(xiàn),就建立N個(gè)視頻對(duì)象描述符來(lái)表示它的跟蹤關(guān)系;如果M個(gè)活動(dòng)對(duì)象在N幀圖象中出現(xiàn),就建立MxN個(gè)^L頻對(duì)象描述符來(lái)表示它的跟蹤關(guān)系;在每個(gè)視頻對(duì)象描述符里,記錄該對(duì)象的輪廓上所有像素點(diǎn)的輪廓坐標(biāo)、視頻對(duì)象身份編號(hào)、尺寸、分層、持續(xù)時(shí)間、活動(dòng)、活動(dòng)參數(shù)、身份照片、身份參數(shù)以及其他對(duì)象特征。在進(jìn)行重放視頻序列時(shí),系統(tǒng)從視頻對(duì)象描述符里恢復(fù)每個(gè)對(duì)象的輪廓坐標(biāo)與視頻序列的對(duì)應(yīng)關(guān)系,從而實(shí)現(xiàn)滿(mǎn)足視頻監(jiān)控所需要的人機(jī)交互功能。從圖1中可以看出,由于對(duì)每幀出現(xiàn)的每個(gè)對(duì)象建立一個(gè)視頻對(duì)象描述符,每個(gè)視頻對(duì)象描述符都需要描述對(duì)象的特征,因此,當(dāng)視頻序列較長(zhǎng),和/或視頻對(duì)象較多時(shí),用于描述視頻對(duì)象的視頻對(duì)象描述符的數(shù)量和尺寸是非常龐大的,對(duì)視頻資料的快速檢索造成了困難。由于圖1中在視頻對(duì)象描述符里使用輪廓坐標(biāo)對(duì)視頻對(duì)象進(jìn)行位置的定位,需要進(jìn)行較為復(fù)雜的運(yùn)算處理,占用較多的存儲(chǔ)資源,因此,一種改進(jìn)的方法是,利用視頻對(duì)象的"多邊形頂點(diǎn)坐標(biāo)"或"視頻對(duì)象窗口坐標(biāo)"取代"輪廓坐標(biāo)",壓縮視頻對(duì)象描述符的尺寸,但用視頻對(duì)象窗口坐標(biāo)或多邊形頂點(diǎn)坐標(biāo)近似描述對(duì)象輪廓坐標(biāo),在選擇視頻對(duì)象時(shí),如果選4奪的位置不準(zhǔn)確,容易造成操作失誤,而且,利用視頻對(duì)象窗口坐標(biāo)或多邊形頂點(diǎn)坐標(biāo)對(duì)一見(jiàn)頻對(duì)象進(jìn)行跟蹤和標(biāo)注,也顯得較粗糙,進(jìn)一步地,這種改進(jìn)的方法只能減少視頻對(duì)象描述符的尺寸,不能減少視頻對(duì)象描述符的數(shù)量,對(duì)視頻資料的快速檢索仍然不利。
發(fā)明內(nèi)容本發(fā)明實(shí)施例提供一種描述視頻對(duì)象的方法,減少視頻序列中視頻對(duì)象描述符的數(shù)量。本發(fā)明實(shí)施例還提供一種捕獲視頻對(duì)象的方法,提高視頻序列中視頻對(duì)象的檢索速度。本發(fā)明實(shí)施例還提供一種描述視頻對(duì)象的設(shè)備,減少視頻序列中視頻對(duì)象描述符的數(shù)量。本發(fā)明實(shí)施例還提供一種捕獲視頻對(duì)象的設(shè)備,提高視頻序列中視頻對(duì)象的4全索速度。為達(dá)到上述目的,本發(fā)明實(shí)施例的技術(shù)方案具體是這樣實(shí)現(xiàn)的一種描述視頻對(duì)象的方法,該方法包含捕獲視頻圖像,生成視頻序列,根據(jù)視頻序列生成視頻對(duì)象跟蹤序列;根據(jù)視頻對(duì)象跟蹤序列及視頻序列,生成視頻對(duì)象描述符。一種捕獲視頻對(duì)象的方法,該方法包括重放視頻對(duì)象,根據(jù)獲取的視頻對(duì)象跟蹤序列包括的信息對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤。一種描述視頻對(duì)象的設(shè)備,該設(shè)備包含視頻對(duì)象捕獲模塊、視頻對(duì)象跟蹤模塊及視頻對(duì)象分析模塊,其中,視頻對(duì)象捕獲模塊,用于捕獲視頻圖像,生成視頻序列,將視頻序列分別向視頻對(duì)象跟蹤模塊及視頻對(duì)象分析模塊輸出;視頻對(duì)象跟蹤模塊,用于根據(jù)接收的視頻序列生成視頻對(duì)象跟蹤序列,向視頻對(duì)象分析模塊輸出;視頻對(duì)象分析模塊,用于根據(jù)接收的視頻對(duì)象跟蹤模塊輸出的視頻對(duì)象跟蹤序列及視頻捕獲模塊輸出的視頻序列,生成視頻對(duì)象描述符。一種捕獲視頻對(duì)象的設(shè)備,該設(shè)備包含重放控制模塊、視頻疊加模塊及顯示模塊,其中,重放控制模塊,用于重放視頻對(duì)象,接收用戶(hù)選定的視頻對(duì)象,與視頻對(duì)象跟蹤序列中包含的視頻對(duì)象區(qū)域位圖進(jìn)行匹配,獲取跟蹤的視頻對(duì)象區(qū)域編號(hào),根據(jù)跟蹤的視頻對(duì)象區(qū)域編號(hào)查詢(xún)視頻對(duì)象區(qū)域索引獲取跟蹤的視頻對(duì)象區(qū)域跟蹤編號(hào),跟蹤后續(xù)幀中與視頻對(duì)象區(qū)域跟蹤編號(hào)相關(guān)的視頻對(duì)象區(qū)域編號(hào),向視頻疊加模塊輸出;視頻疊加模塊,用于根據(jù)接收信息中包含的視頻對(duì)象區(qū)域編號(hào),與視頻序列匹配獲取連續(xù)的視頻對(duì)象區(qū)域位圖,實(shí)時(shí)標(biāo)注視頻對(duì)象區(qū)域位圖,輸出至顯示模塊;顯示模塊,用于實(shí)時(shí)顯示標(biāo)注的視頻對(duì)象區(qū)域位圖。由上述技術(shù)方案可見(jiàn),本發(fā)明實(shí)施例的一種描述和捕獲視頻對(duì)象的方法及設(shè)備,通過(guò)捕獲視頻圖像,生成視頻序列,根據(jù)視頻序列確定視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào);根據(jù)視頻序列、視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào),生成視頻對(duì)象跟蹤序列;根據(jù)視頻對(duì)象跟蹤序列及視頻序列,生成視頻對(duì)象描述符。重放視頻對(duì)象,根據(jù)獲取的視頻對(duì)象跟蹤序列包括的信息對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤。由于在構(gòu)造的視頻對(duì)象跟蹤序列中,通過(guò)視頻對(duì)象區(qū)域跟蹤編號(hào)捕捉和跟蹤視頻對(duì)象,不需要逐幀為每個(gè)視頻對(duì)象建立視頻對(duì)象描述符,從而減少了視頻對(duì)象描述符的數(shù)量,既能很好地適應(yīng)智能視頻交互的應(yīng)用需求,又加快了視頻資料的檢索速度。圖1為現(xiàn)有描述方法中使用的動(dòng)態(tài)視頻對(duì)象描述符示意圖。圖2為本發(fā)明實(shí)施例實(shí)施例智能視頻生成設(shè)備結(jié)構(gòu)示意圖。圖3為本發(fā)明實(shí)施例視頻對(duì)象區(qū)域位圖Mk中不同視頻對(duì)象RID的生成示意圖。圖4為本發(fā)明實(shí)施例視頻對(duì)象區(qū)域位圖Mk局部位圖示意圖。圖5為本發(fā)明實(shí)施例視頻對(duì)象描述符的結(jié)構(gòu)示意圖。圖6為本發(fā)明實(shí)施例智能視頻重放設(shè)備結(jié)構(gòu)示意圖。圖7為本發(fā)明實(shí)施例智能視頻編輯設(shè)備結(jié)構(gòu)示意圖。圖8為本發(fā)明實(shí)施例一種描述視頻對(duì)象的方法流程示意圖。具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明作進(jìn)一步詳細(xì)說(shuō)明。本發(fā)明實(shí)施例是通過(guò)捕獲視頻圖像,生成視頻序列,根據(jù)視頻序列確定視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào);根據(jù)視頻序列、視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào),生成視頻對(duì)象跟蹤序列;根據(jù)視頻對(duì)象跟蹤序列及視頻序列,生成視頻對(duì)象描述符。為了實(shí)現(xiàn)上述目的,本發(fā)明提出了一種描述視頻對(duì)象的設(shè)備。圖2為本發(fā)明實(shí)施例智能視頻生成設(shè)備結(jié)構(gòu)示意圖。參見(jiàn)圖2,該智能視頻生成設(shè)備包含視頻捕獲模塊201、視頻對(duì)象檢測(cè)模塊202、視頻對(duì)象跟蹤模塊203、視頻對(duì)象分析模塊204及事件分析模塊205,其中,視頻捕獲模塊201,用于捕獲視頻圖像,生成視頻序列(VideoSequence)Pk,包含K幀連續(xù)的圖像,將視頻序列分別向視頻對(duì)象檢測(cè)模塊202、視頻對(duì)象跟蹤模塊203、視頻對(duì)象分析模塊204及事件分析模塊205輸出;視頻對(duì)象檢測(cè)模塊202,用于接收視頻捕獲模塊201輸出的視頻序列Pk,獲取視頻對(duì)象區(qū)域位圖(ObjectRegionMap)Mk,對(duì)Mk進(jìn)行檢測(cè),對(duì)檢測(cè)到的Mk中不同^L頻對(duì)象分配碎見(jiàn)頻對(duì)象區(qū)域編號(hào)(RID,RegionIdentificationNumber)RID,向?qū)ο蟾櫮K203輸出;下面對(duì)本發(fā)明實(shí)施例對(duì)象檢測(cè)模塊202獲取視頻對(duì)象區(qū)域位圖中不同對(duì)象的RID和相應(yīng)的TID進(jìn)行說(shuō)明。圖3為本發(fā)明實(shí)施例視頻對(duì)象區(qū)域位圖Mk中不同視頻對(duì)象RID的生成示意圖,參見(jiàn)圖3,假設(shè)視頻對(duì)象區(qū)域位圖Mk中包括3幀連續(xù)的圖像,分別為第k幀圖像、第k+l幀圖像和第k+2幀圖像,每幀圖像包括2個(gè)視頻對(duì)象,在第k幀圖像時(shí),當(dāng)4企測(cè)到一個(gè)視頻對(duì)象時(shí),系統(tǒng)給該視頻對(duì)象分配一個(gè)非零的RID,不同的視頻對(duì)象區(qū)域有不同的RID,沒(méi)有對(duì)象的區(qū)域RID的數(shù)值都為0,視頻對(duì)象區(qū)域位圖的生成方法是式中,(x,y)為Mk區(qū)域坐標(biāo)當(dāng)(x,y)處為背景圖像時(shí),MJxj)為零;當(dāng)(x,y)處為視頻對(duì)象區(qū)域時(shí),MJx,力等于j,其中,j為分配的RID。以圖3為例,對(duì)于第k幀圖像,系統(tǒng)檢測(cè)到2個(gè)視頻對(duì)象,給其中一個(gè)視頻對(duì)象分配的RID=3,表示RID=3的視頻對(duì)象區(qū)域其數(shù)值都為3,另外一個(gè)視頻對(duì)象分配的RID=5,表示RID=5的一見(jiàn)頻對(duì)象區(qū)域其數(shù)值都為5,不同的視頻對(duì)象區(qū)域分配不同的RID;不同幀圖像中分配給同一個(gè)視頻對(duì)象的RID可以不相同。實(shí)際應(yīng)用中,在同一Mk中,-f見(jiàn)頻對(duì)象區(qū)域里的數(shù)值也不一定等于RID,例如,分配的RID=2,而相應(yīng)浮見(jiàn)頻對(duì)象區(qū)域里的數(shù)值可以為3,也可以為4;而且,在同一視頻對(duì)象區(qū)域里的數(shù)值也不一定都相等,上述情況下,相應(yīng)視頻對(duì)象區(qū)域里的數(shù)值可通過(guò)其它方式與RID建立聯(lián)系。圖4為本發(fā)明實(shí)施例視頻對(duì)象區(qū)域位圖Mk局部位圖示意圖,參見(jiàn)圖4,包含RID=3和RID=5的兩個(gè)視頻對(duì)象區(qū)域,其它區(qū)域?yàn)镽ID=0的背景圖像。獲取視頻對(duì)象區(qū)域位圖及視頻對(duì)象區(qū)域后,對(duì)該視頻對(duì)象區(qū)域進(jìn)行統(tǒng)計(jì)分析就可以得到每個(gè)^L頻對(duì)象區(qū)域的窗口坐標(biāo)(Left,Bottom,Right,Top)和中心位置坐標(biāo)(CenterX,CenterY),計(jì)算方法如下Left為在Mk中RID為j的點(diǎn)中,最小的x(水平)坐標(biāo)值;Bottom為在Mk中RID為j的點(diǎn)中,最小的y(縱)坐標(biāo)值;Right為在Mk中RID為j的點(diǎn)中,最大的x(水平)坐標(biāo)值;Top為在Mk中RID為j的點(diǎn)中,最大的y(縱)坐標(biāo)值;CenterX為在Mk中RID為j的點(diǎn)中,平均的x(水平)坐標(biāo)值;CenterY為在Mk中RID為j的點(diǎn)中,平均的y(縱)坐標(biāo)值。視頻對(duì)象跟蹤模塊203,用于接收視頻對(duì)象檢測(cè)模塊202輸出的Mk及RID以及視頻捕獲模塊201輸出的Pk,通過(guò)對(duì)幀間不同視頻對(duì)象區(qū)域的視頻內(nèi)容進(jìn)行分析,得到視頻對(duì)象區(qū)域的跟蹤關(guān)系,為不同幀中具有跟蹤關(guān)系的視頻對(duì)象區(qū)域分配同一個(gè)視頻對(duì)象區(qū)域跟蹤編號(hào)(TID,RegionTracingNumber)TID;對(duì)于新出現(xiàn)的碎見(jiàn)頻對(duì)象區(qū)域,為該視頻對(duì)象區(qū)域分配一個(gè)新的TID;生成視頻對(duì)象跟蹤序列(ObjectTrackingSequence)(Mk,RIk),其中,RIk為第k(k=0,l,...,K-l)幀視頻對(duì)象區(qū)域索引(ObjectRegionIndex),包含RID和TID;向視頻對(duì)象分析才莫塊204輸出;仍以圖3為例,對(duì)于第k幀圖像中的RID=3、第k+l幀圖像中的RID=4和第k+2幀圖像中的RID=3,分配同一個(gè)TID-2,表示其跟蹤關(guān)系;對(duì)于第k幀圖像中的RID=5、第k+l幀圖像中的RID-2和第k+2幀圖像中的RID-4,分配同一個(gè)TID-3,表示其跟蹤關(guān)系。假設(shè)第k幀視頻圖像中RID=3的視頻對(duì)象區(qū)域,計(jì)算得到的窗口坐標(biāo)(Left,Bottom,Right,Top)和中心位置坐標(biāo)(CenterX,CenterY)分別為(180,2,234,56)和(210,28),RID=5的視頻對(duì)象區(qū)域,其窗口坐標(biāo)和中心位置坐標(biāo)分別為(235,24,255,36)和(246,29);第k+l幀圖像中RID=4的視頻對(duì)象區(qū)域,窗口坐標(biāo)和中心位置坐標(biāo)分別為(102,11,128,38)和(116,24),RID=2的視頻對(duì)象區(qū)域,其窗口坐標(biāo)和中心位置坐標(biāo)分別為(190,12,215,40)和(203,25);第k+2幀圖像中RID=3的視頻對(duì)象區(qū)域,窗口坐標(biāo)和中心位置坐標(biāo)分別為(27,24,46,35)和(37,28),RID=4的視頻對(duì)象區(qū)域,其窗口坐標(biāo)和中心位置坐標(biāo)分別為(65,3,115,58)和(92,29)。則視頻對(duì)象跟蹤序歹'J(Mk,RIk)中視頻對(duì)象區(qū)域索引RIk可以表示為表1所示。表1<table>tableseeoriginaldocumentpage13</column></row><table>視頻對(duì)象分析模塊204,用于接收視頻對(duì)象跟蹤模塊203輸出的視頻對(duì)象跟蹤序列(Mk,Rlk)以及視頻捕獲^t塊201輸出的Pk,根據(jù)Pk和(Mk,RIk),生成包含視頻對(duì)象身份編號(hào)(PID,PersonalIdentificationNumber)和視頻對(duì)象分類(lèi)編號(hào)(CID,ClassificationNumber)的視頻對(duì)象描述符ODj(j=0,l,...,J-l),其中,J為K幀連續(xù)圖像中包含的不同視頻對(duì)象的個(gè)數(shù)。圖5為本發(fā)明實(shí)施例視頻對(duì)象描述符的結(jié)構(gòu)示意圖,參見(jiàn)圖5,包括PID、TID、CID、身份照片鏈接、身份參數(shù)鏈接及其它特征。其中,PID和TID是視頻對(duì)象描述符中不可或缺的參數(shù),PID是標(biāo)志視頻對(duì)象的唯一編號(hào),代表視頻對(duì)象的身份,可以被其它的語(yǔ)義描述引用;TID為(Mk,RIk)中的視頻對(duì)象區(qū)域跟蹤編號(hào);CID為視頻對(duì)象的分類(lèi)編號(hào),可以被其它的語(yǔ)義描述所引用,身份照片鏈接及身份參數(shù)鏈接將身份照片及身份參數(shù)鏈接到其它位置,以減少視頻對(duì)象描述符的尺寸。還可以是利用壓縮編碼如變長(zhǎng)字節(jié)Haffman編碼對(duì)視頻對(duì)象跟蹤序列進(jìn)行壓縮處理后輸出。在生成初始的視頻對(duì)象描述符后,視頻對(duì)象分析模塊204不斷分析視頻對(duì)象區(qū)域的特征,如果視頻對(duì)象區(qū)域內(nèi)某視頻對(duì)象的特征,如視頻對(duì)象區(qū)域位圖、視頻對(duì)象輪廓位圖、視頻對(duì)象身份照片及視頻對(duì)象身份參數(shù)的置信度高于視頻對(duì)象描述符中對(duì)應(yīng)的該視頻對(duì)象特征,則將置信度較高的視頻對(duì)象特征更新到視頻對(duì)象描述符中,以及,視頻對(duì)象描述符中身份照片及身份參數(shù)對(duì)應(yīng)的鏈接照片和文件。事件分析模塊205,用于接收視頻捕獲模塊201及視頻對(duì)象分析模塊204的輸出,通過(guò)分析視頻對(duì)象檢測(cè)輸出、視頻對(duì)象跟蹤輸出、視頻對(duì)象分析輸出及視頻序列,生成基于語(yǔ)義的視頻對(duì)象事件描述(EventDescription)EDn,用于對(duì)視頻序列中發(fā)生的事件進(jìn)行語(yǔ)義描述,EDn可以引用ODj中的PID。圖6為本發(fā)明實(shí)施例智能視頻重放設(shè)備結(jié)構(gòu)示意圖。參見(jiàn)圖6,該智能視頻重放設(shè)備包含事件解釋模塊601、重放控制模塊602、視頻疊加模塊603、顯示模塊604及點(diǎn)擊模塊605,其中,事件解釋模塊601,用于對(duì)視頻序列中發(fā)生的事件進(jìn)行語(yǔ)義描述,根據(jù)EDn描述的視頻對(duì)象,通過(guò)EDn獲取相應(yīng)視頻對(duì)象對(duì)應(yīng)的PID,將PID信息輸出至重放控制模塊602;點(diǎn)擊模塊605,用于選取跟蹤的視頻對(duì)象,輸出至重放控制模塊602;重放控制模塊602,用于重放視頻對(duì)象,同步解釋視頻對(duì)象跟蹤序列(Mk,RIk),接收點(diǎn)擊模塊605輸出的視頻對(duì)象,與(Mk,RIk)中的Mk進(jìn)行匹配,如果與Mk中某視頻對(duì)象區(qū)域匹配成功,獲取跟蹤的視頻對(duì)象對(duì)應(yīng)的RID,根據(jù)RID查詢(xún)RIk獲取跟蹤的視頻對(duì)象對(duì)應(yīng)的TID,通過(guò)ODj搜索該跟蹤的視頻對(duì)象PID和視頻對(duì)象特征,跟蹤后續(xù)幀中與TID相關(guān)的RID,實(shí)現(xiàn)捕捉和跟蹤視頻對(duì)象;或者,接收事件解釋模塊601輸出的PID信息,根據(jù)PID信息確定該浮見(jiàn)頻對(duì)象的ODj,獲fl對(duì)應(yīng)的TID(—個(gè)PID可以對(duì)應(yīng)一個(gè)或多個(gè)TID),才艮據(jù)獲取的TID,在ODj中進(jìn)行檢索,獲取跟蹤的視頻對(duì)象的其它特征,例如身份照片、身份特征參數(shù)、底層特征、語(yǔ)義描述;或者,根據(jù)PID信息確定該視頻對(duì)象的ODj,在ODj中進(jìn)行檢索獲取對(duì)應(yīng)的TID,通過(guò)TID獲取跟蹤的視頻對(duì)象RIk,然后通過(guò)RIk可以跟蹤一見(jiàn)頻對(duì)象的位置和輪廓,向纟見(jiàn)頻疊加模塊603輸出;視頻疊加模塊603,用于接收重放控制模塊602輸出的信息,根據(jù)輸出信息中包含的RID,與視頻序列匹配獲取連續(xù)的視頻對(duì)象Mk,然后根據(jù)重放控制模塊602輸出的信息,對(duì)相應(yīng)的圖像區(qū)域進(jìn)行實(shí)時(shí)顯示標(biāo)注、提取對(duì)象照片等操作,并將操作的結(jié)果輸出至顯示模塊604;實(shí)際應(yīng)用中,顯示標(biāo)注的形式有多種,可以對(duì)選定的視頻對(duì)象進(jìn)行標(biāo)注,也可以對(duì)選定的視頻對(duì)象輪廓進(jìn)行標(biāo)注,還可以對(duì)選定的碎見(jiàn)頻對(duì)象的對(duì)象區(qū)域窗口坐標(biāo)進(jìn)行標(biāo)注,還可以對(duì)選定的所述視頻對(duì)象的對(duì)象區(qū)域中心坐標(biāo)進(jìn)行標(biāo)注,還可以對(duì)選定的所述視頻對(duì)象運(yùn)動(dòng)軌跡進(jìn)行標(biāo)注,還可以根據(jù)事件描述符引用的對(duì)象身份編號(hào)跟蹤或標(biāo)注視頻對(duì)象,也可以同時(shí)進(jìn)行一種或一種以上的標(biāo)注。顯示模塊604,用于將視頻疊加模塊603的輸出進(jìn)行顯示,如實(shí)時(shí)提取選定的視頻對(duì)象身份照片進(jìn)行顯示。實(shí)際應(yīng)用中,也可以是在智能視頻生成設(shè)備中增加重放控制模塊、視頻疊加模塊及顯示模塊,完成視頻對(duì)象重放顯示,查詢(xún)、跟蹤視頻序列中視頻對(duì)象,對(duì)相應(yīng)的圖像區(qū)域進(jìn)行實(shí)時(shí)顯示標(biāo)注以及將提取的身份照片顯示。視頻對(duì)象區(qū)域位圖可以為對(duì)象輪廓位圖,也可以為對(duì)象輪廓坐標(biāo)。圖7為本發(fā)明實(shí)施例智能視頻編輯設(shè)備結(jié)構(gòu)示意圖。參見(jiàn)圖7,該智能視頻編輯設(shè)備包含事件解釋模塊701、享放控制/編輯控制模塊702、視頻疊加模塊703、顯示模塊704及點(diǎn)擊模塊705,與圖6不同的是,智能視頻編輯設(shè)備在智能視頻重放設(shè)備的基礎(chǔ)上增加了編輯控制功能,用于根據(jù)用戶(hù)的要求對(duì)視頻對(duì)象進(jìn)行編輯、更新以及改變視頻對(duì)象跟蹤關(guān)系。重放控制/編輯控制模塊702,根據(jù)點(diǎn)擊模塊705輸出的用戶(hù)要求,手動(dòng)編輯與捕獲的視頻對(duì)象相關(guān)的事件描述,通過(guò)自動(dòng)或手動(dòng)更新RIk中的TID以及ODj中的TID來(lái)改變^L頻對(duì)象^J宗關(guān)系;通過(guò)手動(dòng)或自動(dòng)更新;現(xiàn)頻對(duì)象ODj中的視頻對(duì)象身份照片鏈接、身份參數(shù)鏈接、以及其它特征。實(shí)際應(yīng)用中,也可以將智能視頻生成設(shè)備和智能視頻重放設(shè)備,或?qū)⒅悄芤曨l生成設(shè)備和智能視頻編輯設(shè)備組合成為復(fù)合設(shè)備??梢詰?yīng)用于視頻監(jiān)控,也可以應(yīng)用于例如視頻會(huì)議、工業(yè)、醫(yī)療、新聞、電影以及攝像機(jī)、錄像機(jī)、光碟機(jī)、電腦播放器,視頻圖像的編碼形式可以采用MPEG-1、MPEG-2、MPEG-4、H.263、H.264、WMV9、AVS、JPEG,只要是連續(xù)的視頻圖像,都可以利用視頻對(duì)象跟蹤序列,實(shí)現(xiàn):規(guī)頻交互。圖8為本發(fā)明實(shí)施例一種描述視頻對(duì)象的方法流程示意圖。參見(jiàn)圖8,該流程包含步驟801,捕獲視頻圖像;本步驟中,將捕獲的K幀連續(xù)的圖像作為一個(gè)視頻序列Pk。步驟802,構(gòu)造^L頻對(duì)象跟蹤序列(Mk,RIk);本步驟中,根據(jù)視頻序列Pk,獲取視頻對(duì)象區(qū)域位圖Mk,對(duì)Mk進(jìn)行檢測(cè),對(duì)檢測(cè)到的Mk中不同視頻對(duì)象分配RID,同一Mk中視頻對(duì)象區(qū)域數(shù)值等于RID,根據(jù)Mk及RID,獲取每個(gè)RID的窗口坐標(biāo)(Left,Bottom,Right,Top)和中心位置坐標(biāo)(CenterX,CenterY);為不同幀中具有跟蹤關(guān)系的^L頻對(duì)象區(qū)域分配同一個(gè)TID;對(duì)于新出現(xiàn)的視頻對(duì)象區(qū)域,為該視頻對(duì)象區(qū)域分配一個(gè)新的TID;才艮據(jù)RID、TID、窗口坐標(biāo)及中心位置坐標(biāo)生成RIk。實(shí)際應(yīng)用中,在同一Mk中,視頻對(duì)象區(qū)域里的數(shù)值也不一定等于RID,例如,分配的RID=2,而相應(yīng)視頻對(duì)象區(qū)域里的數(shù)值可以為3,也可以為4;而且,在同一視頻對(duì)象區(qū)域里的數(shù)值也不一定都相等,上述情況下,相應(yīng)視頻對(duì)象區(qū)域里的數(shù)值可通過(guò)其它方式與RID建立聯(lián)系。此外,視頻對(duì)象區(qū)域位圖Mk也可以是視頻對(duì)象輪廓位圖,還可以是視頻對(duì)象輪廓坐標(biāo),也可以是將視頻對(duì)象區(qū)域位圖、視頻對(duì)象輪廓位圖及視頻對(duì)象輪廓坐標(biāo)進(jìn)行壓縮。生成的(Mk,RIk)與現(xiàn)存的視頻碼流如MPEG-1、MPEG-2、MPEG-4、H.264兼容,也與MPEG-7的視頻視頻對(duì)象描述符兼容;(Mk,RI0可以與相關(guān)的視頻碼流、MPEG-7的描述元素一起存放,也可以單獨(dú)存放在其它位置。而且,生成的RIk可以只包含TID和RID。步驟803,根據(jù)Pk和生成的(Mk,RIk),生成和更新視頻視頻對(duì)象描述符ODj;本步驟中,根據(jù)Pk和生成的(Mk,RIk),分析視頻對(duì)象區(qū)域特征,如果視頻對(duì)象區(qū)域圖像特征的置信度高于視頻對(duì)象描述符中視頻對(duì)象區(qū)域圖像特征,則將置信度較高的圖像特征更新到視頻對(duì)象描述符中,以及,將質(zhì)量最好的身份照片更新到相應(yīng)的描述鏈接文件中。本實(shí)施例中,為了減少視頻對(duì)象描述符的尺寸,將視頻對(duì)象描述符中有關(guān)對(duì)象身份照片、身份參數(shù)等通過(guò)鏈接保存在另外的文件里,進(jìn)一步減少了視頻對(duì)象描述符的尺寸。步驟804,根據(jù)Pk、(Mk,RIk)和ODj,生成基于語(yǔ)義的視頻對(duì)象事件描述ED。;本步驟中,EDn用于對(duì)視頻序列中發(fā)生的事件進(jìn)行語(yǔ)義描述,EDn可以引用ODj中的PID。步驟805,重》t:規(guī)頻序列Pk;本步驟中,在重放視頻序列Pk,同步解釋(Mk,RIk),根據(jù)用戶(hù)選取的圖像信息,與Mk進(jìn)行匹配,如果與Mk中某視頻對(duì)象區(qū)域匹配成功,獲取該視頻對(duì)象RID,然后通過(guò)一見(jiàn)頻對(duì)象RIk查詢(xún),獲取該一見(jiàn)頻對(duì)象TID,通過(guò)ODj搜索該視頻對(duì)象PID和對(duì)象特征,實(shí)現(xiàn)捕捉和跟蹤視頻對(duì)象;也可以對(duì)EDn進(jìn)行解釋?zhuān)鶕?jù)EDn引用的PID,檢索ODj,獲取對(duì)應(yīng)的TID,然后通過(guò)RIk查詢(xún)獲取RID。步驟806,編輯視頻序列Pk。本步驟中,根據(jù)用戶(hù)的要求自動(dòng)或手動(dòng)更新RIk中的TID及ODj中的TID,更新視頻對(duì)象跟蹤關(guān)系;手動(dòng)或自動(dòng)更新視頻對(duì)象的身份照片、身份參數(shù)、其它特征以及手動(dòng)編輯與捕捉到的視頻對(duì)象相關(guān)的事件描述;根據(jù)用戶(hù)的要求對(duì)捕捉和跟蹤到的視頻對(duì)象進(jìn)行標(biāo)注顯示、照片顯示及跟蹤關(guān)系顯示。由上述實(shí)施例可見(jiàn),本發(fā)明實(shí)施例的一種描述視頻對(duì)象的方法及設(shè)備,將每幀所有視頻對(duì)象的輪廓坐標(biāo)作為一個(gè)完整的視頻元素形成逐幀的Mk,并通過(guò)逐幀的RIk與Pk建立聯(lián)系。通過(guò)捕獲視頻圖像,構(gòu)造視頻對(duì)象跟蹤序列(Mk,RIk),根據(jù)Pk和(Mk,RIk),分析視頻對(duì)象區(qū)域特征,根據(jù)分析結(jié)果更新視頻對(duì)象描述符ODj,根據(jù)Pk、(Mk,RIk)和ODj,生成基于語(yǔ)義的視頻對(duì)象事件描述EDn;在重放視頻序列Pk時(shí),根據(jù)用戶(hù)選取的圖像信息,與Mk進(jìn)行匹配,獲取該視頻對(duì)象RID,然后通過(guò)視頻對(duì)象RIk查詢(xún),獲取該視頻對(duì)象TID,通過(guò)ODj搜索該視頻對(duì)象PID和對(duì)象特征,實(shí)現(xiàn)捕捉和跟蹤浮見(jiàn)頻對(duì)象,并可在重放時(shí)編輯:規(guī)頻序列Pk。對(duì)于連續(xù)的活動(dòng)一見(jiàn)頻對(duì)象,通過(guò)構(gòu)造(Mk,RIk),不需要逐幀為每個(gè)視頻對(duì)象建立視頻對(duì)象描述符,減少了視頻對(duì)象描述符的數(shù)量,而且,將視頻對(duì)象描述符中的身份照片、身份參數(shù)通過(guò)鏈接保存在另外的文件里,減少了視頻對(duì)象描述符的尺寸,既能很好地適應(yīng)智能視頻交互的應(yīng)用需求,又加快了視頻資料的檢索速度。以上舉較佳實(shí)施例,對(duì)本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)進(jìn)行了進(jìn)一步詳細(xì)說(shuō)明,所應(yīng)理解的是,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。權(quán)利要求1.一種描述跟蹤序列的方法,其特征在于,該方法包括捕獲視頻圖像,生成視頻序列,根據(jù)視頻序列生成視頻對(duì)象跟蹤序列;根據(jù)視頻對(duì)象跟蹤序列及視頻序列,生成視頻對(duì)象描述符。2、如權(quán)利要求l所述的方法,其特征在于,所述根據(jù)視頻序列生成視頻對(duì)象跟蹤序列包括根據(jù)視頻序列確定視頻對(duì)象區(qū)域編號(hào);根據(jù)視頻序列確定視頻對(duì)象區(qū)域跟蹤編號(hào);根據(jù)視頻序列、視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào),生成視頻對(duì)象跟蹤序列。3、如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)視頻序列確定視頻對(duì)象區(qū)域編號(hào)包括根據(jù)視頻序列獲取視頻對(duì)象區(qū)域位圖,對(duì)視頻對(duì)象區(qū)域位圖中的不同的視頻對(duì)象區(qū)域進(jìn)行編號(hào)。4、如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)視頻序列確定視頻對(duì)象區(qū)域跟蹤編號(hào)包括根據(jù)視頻序列獲取視頻對(duì)象區(qū)域位圖,對(duì)視頻對(duì)象區(qū)域位圖中的不同的視頻對(duì)象區(qū)域進(jìn)行分析,得到視頻對(duì)象區(qū)域跟蹤編號(hào)。5、如權(quán)利要求2所述的方法,其特征在于,所述視頻對(duì)象跟蹤序列包括視頻對(duì)象區(qū)域位圖和視頻對(duì)象區(qū)域索引。6、如權(quán)利要求5所述的方法,所述視頻對(duì)象區(qū)域索引包括視頻對(duì)象區(qū)域編號(hào)和視頻對(duì)象區(qū)域跟蹤編號(hào)。7、如權(quán)利要求6所述的方法,其特征在于,所述視頻對(duì)象區(qū)域索引進(jìn)一步包括對(duì)象區(qū)域窗口坐標(biāo)和對(duì)象區(qū)域中心坐標(biāo)。8、如權(quán)利要求6或7所述的方法,其特征在于,所述視頻對(duì)象描述符包括視頻對(duì)象身份編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào)鏈接,所述視頻對(duì)象區(qū)域跟蹤編號(hào)鏈接視頻對(duì)象的動(dòng)態(tài)屬性。9、如權(quán)利要求8所述的方法,其特征在于,所述視頻對(duì)象描述符進(jìn)一步包括身份照片鏈接或身份參數(shù)鏈接,用于根據(jù)獲取的跟蹤對(duì)象照片的質(zhì)量,確定當(dāng)前幀跟蹤對(duì)象照片質(zhì)量好于視頻對(duì)象描述符身份照片鏈接對(duì)應(yīng)的照片,用當(dāng)前幀跟蹤對(duì)象照片更新視頻對(duì)象描述符身份照片鏈接對(duì)應(yīng)的照片。10、如權(quán)利要求9所述的方法,其特征在于,所述用當(dāng)前幀跟蹤對(duì)象照片更新視頻對(duì)象描述符身份照片鏈接對(duì)應(yīng)的照片的步驟進(jìn)一步包括更新所述跟蹤對(duì)象的身份參數(shù)鏈接對(duì)應(yīng)的文件。11、如權(quán)利要求17、9、IO任一項(xiàng)所迷的方法,其特征在于,所述方法進(jìn)一步包括根據(jù)視頻對(duì)象描述符及視頻序列,生成事件描述,所述事件描述引用視頻對(duì)象描述符中的對(duì)象身份編號(hào)。12、如權(quán)利要求3~7、9、IO任一項(xiàng)所述的方法,其特征在于,所述視頻對(duì)象區(qū)域位圖為視頻對(duì)象輪廓位圖或視頻對(duì)象輪廓坐標(biāo)。13、如權(quán)利要求37、9、IO任一項(xiàng)所述的方法,其特征在于,對(duì)所述視頻對(duì)象跟蹤序列使用變長(zhǎng)字節(jié)Haffman編碼進(jìn)行壓縮處理。14、一種捕獲^f見(jiàn)頻對(duì)象的方法,其特征在于,該方法包括重放視頻對(duì)象,根據(jù)獲取的視頻對(duì)象跟蹤序列包括的信息對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤。15、如權(quán)利要求14所述的方法,其特征在于,所述對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤的步驟包括將用戶(hù)點(diǎn)擊輸出的視頻對(duì)象,與視頻對(duì)象跟蹤序列包括的視頻對(duì)象區(qū)域位圖進(jìn)行匹配,確定與視頻對(duì)象區(qū)域位圖中某視頻對(duì)象區(qū)域匹配成功,獲取跟蹤的視頻對(duì)象對(duì)應(yīng)的視頻對(duì)象區(qū)域編號(hào),根據(jù)視頻對(duì)象區(qū)域編號(hào)查詢(xún)視頻對(duì)象區(qū)域索引,獲取跟蹤的視頻對(duì)象對(duì)應(yīng)的視頻對(duì)象區(qū)域跟蹤編號(hào),通過(guò)視頻對(duì)象描述符搜索跟蹤的視頻對(duì)象身份編號(hào)和視頻對(duì)象特征,跟蹤后續(xù)幀中與視頻對(duì)象區(qū)域跟蹤編號(hào)相應(yīng)的視頻對(duì)象區(qū)域編號(hào)。16、如權(quán)利要求15所述的方法,其特征在于,所述對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤的步驟進(jìn)一步包括對(duì)下述之一或任意組合進(jìn)行標(biāo)注視頻對(duì)象輪廓、視頻對(duì)象的對(duì)象區(qū)域窗口坐標(biāo)、視頻對(duì)象的對(duì)象區(qū)域中心坐標(biāo)、視頻對(duì)象運(yùn)動(dòng)軌跡。17、如權(quán)利要求14或15或16所述的方法,其特征在于,實(shí)時(shí)提取選定的視頻對(duì)象身份照片進(jìn)行顯示。18、如權(quán)利要求14或15或16所述的方法,其特征在于,根據(jù)事件描述符引用的對(duì)象身份編號(hào)跟蹤或標(biāo)注視頻對(duì)象。19、如權(quán)利要求14或15或16所述的方法,其特征在于,所述方法進(jìn)一步包括對(duì)捕獲和跟蹤的視頻對(duì)象進(jìn)行編輯,通過(guò)自動(dòng)或手動(dòng)更新視頻對(duì)象區(qū)域索引中的視頻對(duì)象區(qū)域跟蹤編號(hào)及視頻對(duì)象描述符中的視頻對(duì)象區(qū)域跟蹤編號(hào),或通過(guò)自動(dòng)或手動(dòng)更新視頻對(duì)象描述符中包含的身份照片、身份參數(shù)鏈接及其它特征,或通過(guò)手動(dòng)編輯與捕捉到的對(duì)象相關(guān)的事件描述。20、—種描述視頻對(duì)象的設(shè)備,其特征在于,該設(shè)備包含視頻對(duì)象捕獲模塊、視頻對(duì)象跟蹤模塊及視頻對(duì)象分析模塊,其中,視頻對(duì)象捕獲模塊,用于捕獲視頻圖像,生成視頻序列,將視頻序列分別向視頻對(duì)象跟蹤模塊及視頻對(duì)象分析模塊輸出;視頻對(duì)象跟蹤模塊,用于根據(jù)接收的視頻序列生成視頻對(duì)象跟蹤序列,向視頻對(duì)象分析模塊輸出;視頻對(duì)象分析模塊,用于根據(jù)接收的視頻對(duì)象跟蹤模塊輸出的視頻對(duì)象跟蹤序列及視頻捕獲模塊輸出的視頻序列,生成視頻對(duì)象描述符。21、如權(quán)利要求20所述的設(shè)備,其特征在于,所述設(shè)備進(jìn)一步包括視頻對(duì)象檢測(cè)模塊,用于根據(jù)接收的視頻序列確定視頻對(duì)象區(qū)域編號(hào)及視頻對(duì)象區(qū)域跟蹤編號(hào),向視頻對(duì)象跟蹤模塊輸出;視頻對(duì)象跟蹤模塊,用于根據(jù)接收的視頻序列確定視頻對(duì)象區(qū)域跟蹤編號(hào),根據(jù)視頻對(duì)象區(qū)域跟蹤編號(hào)以及接收的視頻對(duì)象區(qū)域編號(hào)及視頻序列,生成視頻對(duì)象跟蹤序列,向視頻對(duì)象分析模塊輸出。22、如權(quán)利要求20所述的設(shè)備,其特征在于,所述設(shè)備進(jìn)一步包括事件分析模塊,用于接收視頻對(duì)象捕獲模塊輸出的視頻序列及視頻對(duì)象分析模塊輸出的視頻對(duì)象描述符,生成事件描述,所述事件描述引用視頻對(duì)象描述符中的對(duì)象身份編號(hào)。23、—種捕獲視頻對(duì)象的設(shè)備,其特征在于,該設(shè)備包含重放控制模塊、視頻疊加模塊及顯示模塊,其中,重放控制模塊,用于重放視頻對(duì)象,接收用戶(hù)選定的視頻對(duì)象,與視頻對(duì)象跟蹤序列中包含的視頻對(duì)象區(qū)域位圖進(jìn)行匹配,獲取跟蹤的視頻對(duì)象區(qū)域編號(hào),根據(jù)跟蹤的視頻對(duì)象區(qū)域編號(hào)查詢(xún)視頻對(duì)象區(qū)域索引獲取跟蹤的視頻對(duì)象區(qū)域跟蹤編號(hào),跟蹤后續(xù)幀中與視頻對(duì)象區(qū)域跟蹤編號(hào)相關(guān)的視頻對(duì)象區(qū)域編號(hào),向視頻疊加模塊輸出;視頻疊加模塊,用于根據(jù)接收信息中包含的視頻對(duì)象區(qū)域編號(hào),與視頻序列匹配獲取連續(xù)的視頻對(duì)象區(qū)域位圖,實(shí)時(shí)標(biāo)注視頻對(duì)象區(qū)域位圖,輸出至顯示模塊;顯示模塊,用于實(shí)時(shí)顯示標(biāo)注的視頻對(duì)象區(qū)域位圖。24、如權(quán)利要求23所述的設(shè)備,其特征在于,所述設(shè)備進(jìn)一步包括重放控制/編輯控制模塊,對(duì)捕獲和跟蹤的視頻對(duì)象進(jìn)行編輯,通過(guò)自動(dòng)或手動(dòng)更新視頻對(duì)象區(qū)域索引中的視頻對(duì)象區(qū)域跟蹤編號(hào)及視頻對(duì)象描述符中的視頻對(duì)象區(qū)域跟蹤編號(hào),或通過(guò)自動(dòng)或手動(dòng)更新視頻對(duì)象描述符中包含的身份照片、身份參數(shù)鏈接及其它特征,或通過(guò)手動(dòng)編輯與捕捉到的對(duì)象相關(guān)的事件描述。全文摘要本發(fā)明公開(kāi)了一種描述和捕獲視頻對(duì)象的方法及設(shè)備,通過(guò)捕獲視頻圖像,生成視頻序列,根據(jù)視頻序列生成視頻對(duì)象跟蹤序列;根據(jù)視頻對(duì)象跟蹤序列及視頻序列,生成視頻對(duì)象描述符。重放視頻對(duì)象,根據(jù)獲取的視頻對(duì)象跟蹤序列包括的信息對(duì)視頻對(duì)象進(jìn)行捕獲和跟蹤。應(yīng)用本發(fā)明,由于在構(gòu)造的視頻對(duì)象跟蹤序列中,通過(guò)視頻對(duì)象區(qū)域跟蹤編號(hào)捕捉和跟蹤視頻對(duì)象,不需要逐幀為每個(gè)視頻對(duì)象建立視頻對(duì)象描述符,從而減少了視頻對(duì)象描述符的數(shù)量,既能很好地適應(yīng)智能視頻交互的應(yīng)用需求,又加快了視頻資料的檢索速度。文檔編號(hào)G06T7/00GK101420595SQ20071016561公開(kāi)日2009年4月29日申請(qǐng)日期2007年10月23日優(yōu)先權(quán)日2007年10月23日發(fā)明者趙光耀申請(qǐng)人:華為技術(shù)有限公司