專利名稱:表示出現(xiàn)在圖像中的目標(biāo)的方法、設(shè)備和計(jì)算機(jī)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及例如出現(xiàn)在諸如在多媒體數(shù)據(jù)庫中所存儲(chǔ)的圖像之 類的靜止或視頻圖像中的目標(biāo)的表示,并且特別地涉及這樣一種表示 的編碼。
背景技術(shù):
在諸如圖像或視頻文庫之類的應(yīng)用中,希望的是對(duì)于出現(xiàn)在靜 止或視頻圖像中的目標(biāo)或目標(biāo)各個(gè)部分的輪廓或形狀具有一種有效 表示和存儲(chǔ)。基于形狀的索引和重現(xiàn)(retrieval)的一種已知技術(shù) 使用曲率縮放空間(CSS) (Curvature Scale Space)表示。CSS表示的 細(xì)節(jié)可以在文件"Robust and Efficient Shape Indexing through Curvature Scale Space"(通過曲率縮放空間的強(qiáng)大并有效的形狀索 引)Proc. British Machine Vision conference, 第 53 - 62頁, Edinburgh, UK, 1996和 "Indexing an Image Database by Shape Content using Curvature Scale Space"(通過形狀內(nèi)容使用曲率 縮放空間來索引 一個(gè)圖4象數(shù)據(jù)庫)Proc. IHE Colloquium on Intelligent Databases, London 1996,中找到。兩篇文章都是F. Mokhtarian、 S. Abbasi和J. KiUler的,將其內(nèi)容引用在此供參 考。
發(fā)明內(nèi)容
CSS表示使用目標(biāo)輪廓的一個(gè)曲率函數(shù),從該輪廓上的一個(gè)任意 點(diǎn)開始。因?yàn)檩喞螤畋皇剐螤钇交囊幌盗惺д嫠葑児恃芯壳?函數(shù)。更明確地,計(jì)算以高斯濾波器系列旋轉(zhuǎn)的曲率函數(shù)的導(dǎo)數(shù)的零 交叉。將該零交叉被繪制在一個(gè)曲線圖上,通稱為曲率縮放空間,在 此X軸是該曲線的標(biāo)準(zhǔn)化弧長而Y軸是演變參數(shù),更明確地,是所應(yīng) 用的濾波器的參數(shù)。曲線圖上的曲線環(huán)繞成輪廓特性。目標(biāo)輪廓的每 一凸形或凹形部分對(duì)應(yīng)于該CSS圖像中的一個(gè)環(huán)路。CSS圖像中的最凸 出的環(huán)路的峰值坐標(biāo)被使用作為該輪廓的一個(gè)表示。
為了搜索與輸入目標(biāo)形狀匹配的儲(chǔ)存在數(shù)據(jù)庫中的圖像中的目 標(biāo),計(jì)算出一個(gè)輸入形狀的CSS表示。通過使用匹配算法來比較在各個(gè)css圖像中的峰值的位置和高度,從而確定輸入形狀和儲(chǔ)存形狀之 間的相似性。
表示一個(gè)描述符中的輪廓形狀性質(zhì)所需要的比特?cái)?shù)目應(yīng)該盡可 能小以便進(jìn)行有效儲(chǔ)存和傳輸。
按照本發(fā)明,提供了一種通過處理與圖像對(duì)應(yīng)的信號(hào)來表示出現(xiàn)
在靜止或視頻圖像中的目標(biāo)的方法,所述方法包括導(dǎo)出表示所述目 標(biāo)的形狀的多組坐標(biāo)值并且量化所述坐標(biāo)值來導(dǎo)出該形狀的編碼表 示,其中,對(duì)于第一組坐標(biāo)值的給定坐標(biāo)值小于第二組坐標(biāo)值中的對(duì) 應(yīng)坐標(biāo)值,向所述第一組值的給定坐標(biāo)值的量化表示分配的比特?cái)?shù)目 少于向所述第二組值的對(duì)應(yīng)坐標(biāo)值的量化表示分配的比特?cái)?shù)目。
本發(fā)明能夠提供一個(gè)非常簡(jiǎn)潔的表示(根據(jù)用于存儲(chǔ)的比特?cái)?shù)目) 而在重現(xiàn)性能中沒有任何顯著的惡化。
下面將參考附圖描述的本發(fā)明的實(shí)施例,附圖中
圖l是一個(gè)視頻數(shù)據(jù)庫系統(tǒng)的框圖2是一個(gè)輪廓的CSS表示;
圖3是說明CSS表示的坐標(biāo)值編碼的圖表。
具體實(shí)施例方式
圖l示出了根據(jù)本發(fā)明實(shí)施例的一個(gè)計(jì)算機(jī)化的視頻數(shù)據(jù)庫系 統(tǒng)。該系統(tǒng)包括計(jì)算機(jī)形式的一個(gè)控制單元2,監(jiān)視器形式的一個(gè)顯 示單元4,鼠標(biāo)形式的一個(gè)定點(diǎn)設(shè)備6,包括儲(chǔ)存的靜止和視頻圖像 的一個(gè)圖像數(shù)據(jù)庫8以及一個(gè)描述符數(shù)據(jù)庫IO,該描述符數(shù)據(jù)庫10 存儲(chǔ)出現(xiàn)在儲(chǔ)存在圖像數(shù)據(jù)庫8中的圖像中的目標(biāo)或目標(biāo)各個(gè)部分 的描述符。
出現(xiàn)在圖像數(shù)據(jù)庫中的圖像中每一感興趣目標(biāo)的形狀描述符被 控制單元2導(dǎo)出并且被儲(chǔ)存在描述符數(shù)據(jù)庫10中??刂茊卧?導(dǎo)出 在執(zhí)行如下所述方法的一個(gè)適當(dāng)程序控制下操作的描述符。
首先,對(duì)于一個(gè)給定目標(biāo)輪廓,輪廓的一個(gè)CSS表示被導(dǎo)出。使 用在上面提及的文件之一中描述的已知方法來執(zhí)行之。
更明確地,該輪廓通過一個(gè)表示W(wǎng)- ((x(u), y(u), ue [ 0 , 1〗}來表示,在此,u是一個(gè)標(biāo)準(zhǔn)化弧長參數(shù)而(x,y)是目標(biāo)輪廓上 的點(diǎn)的坐標(biāo)。該輪廓通過用Gaussan核心g (u , cr)或類似的核心旋轉(zhuǎn)平而被 平滑,并且演變的曲線的曲率零交叉被檢查作為a變量。使用曲率的 下列表達(dá)式來識(shí)別零交叉。
W" 一 Xu (", cr)乙(",QP - X仙(",(",刊 , (xu(",o02 + };(w,o02)3'2
在此 和
Xu - (") * gB (", cr)L (", cO=* " (", cr)
在上面,*表示巻積、而下才示表示導(dǎo)數(shù)。
曲率零交叉的數(shù)目改變?yōu)镃J變量,并且當(dāng)cr十分高時(shí),¥成為沒 有零交叉的一個(gè)凸形曲線。
零交叉(u, a)被繪制在一曲線圖上,通稱CSS圖像空間。這導(dǎo) 致原始輪廓的多個(gè)曲線特性。特性曲線的峰值被識(shí)別并且相應(yīng)的坐標(biāo) 被提取和儲(chǔ)存。在一般的術(shù)語中,這給出了一組n個(gè)坐標(biāo)對(duì) [(xl,yl), (x2,y2) (xn,yn)〗,在此,n是峰值數(shù)目,而xi是第i個(gè)峰 值的弧長位置并且yi是峰值高度。
特性曲線的順序和位置以及它們出現(xiàn)在CSS圖像空間中的相應(yīng) 峰值取決于如上所述的曲率函數(shù)的起始點(diǎn)。峰值坐標(biāo)被重新排列,如 下所述。
讓我們假定從中提取參數(shù)的輪廓有n個(gè)峰值,峰值參數(shù)形成一組 (( ,y1), (x2, y2), ...(xn,yn)},如圖2所示。然后根據(jù)高度按照 遞增或遞減的順序排列峰值Ux!,yJ, (x2,y2), (xn,yn)}(下標(biāo)表示在 排序之后的峰值序號(hào))。讓我們假定按照遞減的順序排列峰值,所以 最高峰值是第一個(gè)(x^),并且每一后續(xù)峰值低于或等于該組中的它 的前者(圖3)。
這些重新排列的峰值坐標(biāo)形成目標(biāo)輪廓的描述符的基礎(chǔ)。諸如環(huán) 狀C、偏心率E和緊密度D之類的另外的形狀參數(shù)(其中某些從所謂 的"原型輪廓形狀"中被提取)還可以被計(jì)算并儲(chǔ)存來使用在如共同 懸而未決的申請(qǐng)no. GB 9916684. 5中所述的匹配處理中,該申請(qǐng)的內(nèi)容在此被參考結(jié)合。
接下來,執(zhí)行峰值高度的粗略量化。對(duì)于每個(gè)峰值,執(zhí)行量化的 范圍是不同的,并且取決于較高的峰值(例如,在作為被排列組中的 前者的那些峰值的高度)。
參見圖3,第一峰值在范圍11= [ 0, Y陋]上被量化,在此,Ynax 是對(duì)某一類形狀所期待的峰值的最大值。每一剩余峰值被量化到該范 圍,這取決于一個(gè)或好幾個(gè)早先峰值的數(shù)值。例如,峰值y2在間隔 12= [ 0,yi ]上被量化,(圖3)峰值y3在間隔
上被量化。
在這個(gè)實(shí)施例中,使用7比特把第一峰值量化在間隔
上并且在適當(dāng)?shù)母鱾€(gè)范圍上把剩余峰值量化到比特3。假如第一峰值 的高度是893,則說,那么使用3比特在范圍
上把y;量 化,等等。因此,對(duì)于峰值h到y(tǒng)5,量化間隔被降低,盡管使用較少 的比特,但給出更大的精確度。每個(gè)峰值的X坐標(biāo)被量化到在[O,l] 間隔上均勻分布的6比特。x值可以是原始X值,例如如圖2所示, 或者在沿著x軸偏移一個(gè)數(shù)量之后,如此以使最高峰值的x值在0 處。
讓我們檢查從本發(fā)明中的獲益。在傳統(tǒng)解決方案中,每一峰值需 要兩個(gè)浮點(diǎn)數(shù),每一個(gè)是4字節(jié)。因此,對(duì)于具有9個(gè)峰值的一個(gè)典 型形狀,存儲(chǔ)規(guī)格是9*2*4=72字節(jié)(576比特)。在建議的實(shí)施例的應(yīng) 用之后,第一峰值需要7個(gè)比特,假定x值被作為零來對(duì)待,并且每 個(gè)連續(xù)峰值6+3比特,因此總共為79比特。
代替一個(gè)范圍[O,yi], 一個(gè)范圍(O,R(yi))可以被使用,在此, R(yi)是在反量化之后的值yi的重建。
具有類似效果的另一個(gè)實(shí)施例通過各個(gè)早先峰值的數(shù)值劃分每 一峰值{y2,y3,...,yn}(除最高一個(gè)之外)的高度。在此操作之后, 所有yi的范圍是來自組(O,l ]中。這允許對(duì)于所有的yi使用許多粗 略量化。
在任一示例中,可以通過對(duì)于所有剩余峰值的最高峰值加4或3 比特量化來使用7或6比特量化從而獲得優(yōu)良的結(jié)果。也可以使用其 它數(shù)目的比特。
上面的操作還可以在坐標(biāo)值已經(jīng)蒙受一個(gè)副法線和一個(gè)非線性 變換之后被執(zhí)行,正如在共同懸而未決的申請(qǐng)no. GB9915699. 4中所述,該申請(qǐng)的內(nèi)容在此被參考結(jié)合。代替或者像y值一樣,可以沿著 如上所述的線路來編碼x坐標(biāo)。
通過適當(dāng)?shù)男薷?,該結(jié)果值可以被儲(chǔ)存,例如用來使用在一個(gè)適 當(dāng)?shù)钠ヅ涑绦蛑?,比如在我們的共同懸而未決的申請(qǐng)GB9915699. 4, GB9915698.6和GB9916684. 5中所描述的,例如在執(zhí)行匹配之前對(duì),皮 儲(chǔ)存描述符執(zhí)行反量化。
權(quán)利要求
1.一種通過處理與圖像對(duì)應(yīng)的信號(hào)來表示出現(xiàn)在靜止或視頻圖像中的目標(biāo)的方法,所述方法包括導(dǎo)出表示所述目標(biāo)的形狀的多組坐標(biāo)值并且量化所述坐標(biāo)值來導(dǎo)出該形狀的編碼表示,其中,對(duì)于第一組坐標(biāo)值的給定坐標(biāo)值小于第二組坐標(biāo)值中的對(duì)應(yīng)坐標(biāo)值,向所述第一組值的給定坐標(biāo)值的量化表示分配的比特?cái)?shù)目少于向所述第二組值的對(duì)應(yīng)坐標(biāo)值的量化表示分配的比特?cái)?shù)目。
2. 如權(quán)利要求l所述的方法,其中,第一組坐標(biāo)值的給定坐標(biāo) 值的量化范圍至少基于第二組坐標(biāo)值的對(duì)應(yīng)坐標(biāo)值。
3. 如權(quán)利要求2所述的方法,其中,對(duì)于遞減的坐標(biāo)值的序列, 每一坐標(biāo)值的量化范圍是基于以它們存在的一個(gè)或多個(gè)先前的、較高 的坐標(biāo)值。
4. 如權(quán)利要求1到3的任何一項(xiàng)所述的方法,其中,在所述給定 坐標(biāo)值被量化的范圍對(duì)于第一組坐標(biāo)值比對(duì)于第二組坐標(biāo)值小。
5. 如權(quán)利要求1到3的任何一項(xiàng)所述的方法,其中,向第一組值 的給定坐標(biāo)值的量化表示分配的比特?cái)?shù)目與向第二組值的對(duì)應(yīng)坐標(biāo) 值的量化表示分配的比特?cái)?shù)目相同。
6. 如前面權(quán)利要求的任何一項(xiàng)所述的方法,其中,這些坐標(biāo)組 是坐標(biāo)對(duì),并且對(duì)于每一對(duì)坐標(biāo)值的至少一個(gè)坐標(biāo)值,所述量化范圍 是變化的。
7. 如權(quán)利要求6所述的方法,其中,所述坐標(biāo)對(duì)對(duì)應(yīng)于形狀的 CSS表示中的峰值的位置。
8. 如權(quán)利要求7所述的方法,其中,變化的量化范圍用于與峰值高度對(duì)應(yīng)的坐標(biāo)值。
9. 如前面權(quán)利要求的任何一項(xiàng)所述的方法,其中,對(duì)于多個(gè)坐 標(biāo)值,該量化范圍是相同的。
10. 如前面權(quán)利要求的任何一項(xiàng)所述的方法,包括按照遞減或遞 增的大小對(duì)坐標(biāo)值進(jìn)行排序的步驟。
11. 一種通過處理與圖像對(duì)應(yīng)的信號(hào)來搜索靜止或視頻圖像中 的目標(biāo)的方法,所述方法包括輸入查詢目標(biāo),導(dǎo)出所述查詢目標(biāo)的 表示,把所述表示與使用如前面權(quán)利要求任何一項(xiàng)所導(dǎo)出的表示進(jìn)行 比較,并且選擇和顯示其表示指示了與所述查詢的相似程度的那些目標(biāo)。
12. —種編程為執(zhí)行權(quán)利要求l至ll中所述的任一種方法的控制 設(shè)備。
13. —種設(shè)備,包括用于執(zhí)行權(quán)利要求l至ll中所述的任一種方法 的裝置。
14. 如權(quán)利要求13的設(shè)備,包括權(quán)利要求12中的控制設(shè)備和用于 存儲(chǔ)圖像和/或圖像表示的存儲(chǔ)裝置。
15. —種用于實(shí)現(xiàn)權(quán)利要求1至10中任一種方法的計(jì)算機(jī)程序, 或一種存儲(chǔ)這種計(jì)算機(jī)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),或一種編程為根 據(jù)權(quán)利要求1至10中任一項(xiàng)進(jìn)行操作的計(jì)算機(jī)系統(tǒng)。
全文摘要
表示出現(xiàn)在圖像中的目標(biāo)的方法、設(shè)備和計(jì)算機(jī)系統(tǒng)。一種通過處理與圖像對(duì)應(yīng)的信號(hào)來表示出現(xiàn)在靜止或視頻圖像中的目標(biāo)的方法,所述方法包括導(dǎo)出表示所述目標(biāo)的形狀的多組坐標(biāo)值并且量化所述坐標(biāo)值來導(dǎo)出該形狀的編碼表示,其中,對(duì)于第一組坐標(biāo)值的給定坐標(biāo)值小于第二組坐標(biāo)值中的對(duì)應(yīng)坐標(biāo)值,向所述第一組值的給定坐標(biāo)值的量化表示分配的比特?cái)?shù)目少于向所述第二組值的對(duì)應(yīng)坐標(biāo)值的量化表示分配的比特?cái)?shù)目。
文檔編號(hào)G06K9/48GK101539997SQ20091013282
公開日2009年9月23日 申請(qǐng)日期2001年2月27日 優(yōu)先權(quán)日2000年2月29日
發(fā)明者M·波貝爾 申請(qǐng)人:三菱電機(jī)株式會(huì)社