專利名稱:街面監(jiān)控視頻中搜索指定特征人像方法
技術(shù)領(lǐng)域:
本發(fā)明涉及地理信息系統(tǒng)、視頻監(jiān)控系統(tǒng)、視頻服務器系統(tǒng),尤其涉及視頻傳輸及圖像識別方法。
背景技術(shù):
先簡單描述一些與本發(fā)明有關(guān)的一些概念地理信息系統(tǒng)是地理數(shù)據(jù)輸入、管理、分析和輸出的計算機系統(tǒng)。英語Geographic Information System,縮寫為GIS。
數(shù)字視頻監(jiān)控系統(tǒng)是視頻數(shù)據(jù)采集、存儲、管理的計算機系統(tǒng)。
數(shù)字視頻服務器系統(tǒng)是視頻數(shù)據(jù)采集、存儲、管理、傳輸?shù)挠嬎銠C系統(tǒng)。
數(shù)字視頻數(shù)據(jù)將視頻的模擬信號數(shù)字化,并壓縮存儲成視頻數(shù)據(jù)。
圖像識別系統(tǒng)在現(xiàn)有圖像中將需要的圖像部分找出并與指定的圖像進行比對的計算機系統(tǒng)。
GIS作為一種信息系統(tǒng),是以現(xiàn)實世界為研究目標,以計算機內(nèi)部的二進制數(shù)字世界為存儲載體的。它將人們對于客觀世界的理解,經(jīng)過一系列處理后變成數(shù)字形式儲存于計算機之中,并對儲存的數(shù)據(jù)進行各種分析,挖掘出人們關(guān)心和有用的信息,并以直觀的方式進行展現(xiàn)。目前,GIS技術(shù)已經(jīng)越來越廣泛的應用在各種領(lǐng)域,特別是GIS空間分析中的地理編碼和最短路徑分析技術(shù),使用更是非常廣泛,比如超市網(wǎng)點送貨管理系統(tǒng)等,就是使用了客戶地址實時定位以及送貨最短路徑搜索等技術(shù)。
數(shù)字視頻監(jiān)控系統(tǒng)是將攝像頭拍攝的模擬視頻信號轉(zhuǎn)化為數(shù)字視頻存儲在計算機內(nèi)部的二進制數(shù)字載體的。它將人們看到的客觀世界,經(jīng)過處理后變成數(shù)字形式儲存于計算機中,并可以方便的展現(xiàn)。目前隨著計算機存儲體的大量普及和降價,以及數(shù)字存儲安全不易丟失等特點,數(shù)字視頻監(jiān)控系統(tǒng)越來越普遍的代替原有的默認監(jiān)控系統(tǒng)應用于道路、小區(qū)、樓宇、工廠等。
數(shù)字視頻服務器系統(tǒng)是將數(shù)字視頻數(shù)據(jù)壓縮、分包,并通過網(wǎng)絡傳輸?shù)饺藗冃枰^看的地點,實現(xiàn)分布式多點傳輸。隨著網(wǎng)絡基礎(chǔ)建設(shè)的完善,目前的網(wǎng)絡設(shè)施已經(jīng)可以滿足視頻傳輸?shù)囊?,因此人們開始越來越多的應用網(wǎng)絡,來達到可以在任意地點進行監(jiān)控的目的。
圖像識別系統(tǒng)是以人們看到的圖像世界為研究目標,采用智能圖像比對技術(shù),達到自動識別出相識或相近的部分,為人眼識別提供輔助,減少人類識別的工作量、并能夠很好的克服人類易疲勞等缺點。隨著安防形勢的變化,目前指紋識別、掌紋識別、瞳孔識別、字體識別等已經(jīng)被大量應用,面部識別由于技術(shù)仍然不夠成熟以及計算機速度的影響等,還沒有大量應用。
目前,在重要路口、人群聚集處以及重要企事業(yè)部門的主要門口安裝有高清晰監(jiān)控頭,在基層公安機關(guān)建立監(jiān)控指揮中心,負責監(jiān)控指揮下轄的各監(jiān)控點,在上級公安機關(guān)也建立指揮中心,與下屬各部門指揮中心聯(lián)網(wǎng),實現(xiàn)跨區(qū)域協(xié)作指揮,通過數(shù)字光纖技術(shù),組建光纖網(wǎng)絡,專用于監(jiān)控視頻信號的傳輸,實現(xiàn)上述各監(jiān)控點及各指揮中心間的高清晰視頻信號的多點互傳及互相操作,將分布在各個視頻監(jiān)視點的單臺獨立的攝像機組建成具有相互配合的攝像機網(wǎng)絡,從而發(fā)揮攝像機群的強大成懾力和捕捉第一時間現(xiàn)場的多種優(yōu)勢。
但是,目前的街面監(jiān)控圖像中,現(xiàn)有的攝像機大都配有水平(355°)垂直(90°)云臺和變倍鏡頭或高速球型攝像機,但是在路口同一時間只能看到的有效范圍只有全方位的1/6甚至更少。雖然各指揮中心都配置了專人守候在指揮中心的大屏幕前,但人的疲勞和心理狀態(tài)決定了無法有效的全程監(jiān)控,看似場面很宏大、壯觀但是其實際的作用是極為有限的,無法主動的從圖像上發(fā)現(xiàn)誰是犯罪分子以及突發(fā)事件發(fā)生的地點。
由于只能采取一種守株待兔的錄像方式,無法及時的捕捉到案發(fā)現(xiàn)場的清晰圖像,即使有幸錄到了,錄像由于受到光線、視角以及現(xiàn)場環(huán)境的影響其清晰度及有效性已經(jīng)大為降低。目前使用的錄像資料大都體現(xiàn)不出其實用價值。在實際辦案中只能處于極為被動的地位。
在目前的街面視頻圖像中,要應用面部識別仍然存在如下不足1視頻景象過遠,只有比較高級的攝像頭才可以有效高速的撲捉面部圖像;2使用者面部的位置與周圍的光環(huán)境都可能影響系統(tǒng)的精確性;3大部分研究生物識別的人公認面部識別最不準確,也最容易被欺騙;4面部識別技術(shù)的改進有賴于提取特征與比對技術(shù)的提高,采集圖像的設(shè)備比技術(shù)昂貴得多;
5對于因人體面部的如頭發(fā),飾物,變老以及其他的變化需要通過人工智能補償,機器學習功能必須不斷地將以前得到的圖像和現(xiàn)在的得到的進行比對;以改進核心數(shù)據(jù)和彌補微小的差別;6很難進一步降低成本,必需以昂貴的費用去賣高質(zhì)量的設(shè)備。
基于上述問題,目前雖然已經(jīng)將各處的視頻進行了聯(lián)網(wǎng)傳輸和控制,但流行的監(jiān)控視頻系統(tǒng)中,都還沒有使用圖像識別。
總之,目前的街面監(jiān)控圖像中,普遍存在可視范圍小、圖像模糊、人體圖像過小、無法有效識別的問題,很多情況下,人眼也無法識別,而在目前的面部識別技術(shù)較不成熟的狀況下,自動識別更是困難重重。
發(fā)明內(nèi)容
本發(fā)明的目的在于在目前的技術(shù)水平、計算機速度及視頻質(zhì)量基礎(chǔ)上,提出一種實用的智能比對方法。
在街面實時視頻及歷史視頻數(shù)據(jù)中,利用需要搜索對象的衣著特征、發(fā)型特征、以及體態(tài)特征等,在實時視頻中找到該對象,或者在某段時間的歷史視頻中搜索,以便發(fā)現(xiàn)該對象的活動區(qū)域、時間等信息。
本方法的特征是比對時不再局限于面部,而是以人體的各種特征為參考依據(jù),根據(jù)人體的衣著特征、發(fā)型特征、以及體態(tài)特征進行比對。
圖1是發(fā)明中的算法用到的是HSV顏色空間示意圖。
具體實施例方式
在各監(jiān)控指揮中心的數(shù)字視頻服務器系統(tǒng)中建立按指定攝像頭及時間段傳輸?shù)臋C制,將街面攝像頭地理信息、控制信息、連接方式等存入關(guān)系型數(shù)據(jù)庫,在GIS中加入街面攝像頭地理信息,并在此基礎(chǔ)上建立視頻圖像的人像搜索系統(tǒng)。
人像搜索系統(tǒng)的實施方法說明如下1、顏色空間及顏色距離一般來說,視頻的截圖是BMP格式的,象素由RGB值來表達。視頻解碼出的圖片是32位位圖,除了R,G,B三個通道外,還有一個未用到。RGB空間的顏色相似度(距離)通常是由歐氏距離來表達,如D=(R1-R2)*(R1-R2)+(G1-G2)*(G1-G2)+(B1-B2)*(B1-B2)。當距離小于某個閾值時,認為兩種顏色相似。缺點在于,此顏色空間的顏色相似性與人的視覺系統(tǒng)有一定的差異,即人眼覺得相似的,但可能歐氏距離會很大;歐氏距離小的,人眼感覺并不相似。在圖像的檢索中若用到直方圖,可能RGB空間會比較適用。
因此本發(fā)明中的算法用到的是HSV顏色空間。此空間的特點是,考慮到了人眼的視覺感受同顏色相似的關(guān)聯(lián)。參見圖1Hue代表色度,Sature代表色飽和度,Value為亮度。
因此需要將RGB空間轉(zhuǎn)換到HSV空間。有固定的轉(zhuǎn)換公式。
v=max(r,g,b)s=[v-min(r,g,b)]/vh=5+b′if r=max(r,g,b)and g=min(r,g,b)1-g′if r=max(r,g,b)and g≠min(r,g,b)1+r′if g=max(r,g,b)and b=min(r,g,b)3-b′if g=max(r,g,b)and b≠min(r,g,b)3+g′if b=max(r,g,b)and r=min(r,g,b)5-r′otherwiser′=[v-r]/[v-min(r,g,b)]g′=[v-g]/[v-min(r,g,b)]b′=[v-b]/[v-min(r,g,b)]]]>其中r,g,b∈
,h∈
,and s,v∈
。
顏色距離1真彩色的圖像有成千上萬種顏色值,在實際的計算中沒有必要對具體精確的值來處理。另外,人眼的感知有個模糊性,所以先做量化是比較好的選擇。實際的HSV空間的量化有幾種選擇,這里選擇量化成72級。量化算法如下
if(h<=20||h>315)h=0;if(h>20&&h<=40)h=1;if(h>40&&h<=75)h=2; if(s<=0.2)s=0;if(h>75&&h<=155)else if(s>0.2&&s<=0.7)h=3; s=1;else if(s>0.7&&s<=1.0)if(h>15&&h<=190)s=2;h=4;if(h>190&&h<=270)h=5;if(v<=0.2)if(h>270&&h<=295) v=0;h=6; else if(v>0.2&&v<=0.7)v=1;if(h>295&&h<=315) else if(v>0.7&&v<=1.0)h=7; v=2;h量化8級,s和v量化成3級。最后化為一個顏色矢量來代表此種顏色值。
I=9*h+3*s+v;得到矢量后,就要考慮顏色的矢量距離以刻畫相似程度?;舅悸肥莾煞N顏色的矢量值相減得到絕對值差,然后與大的矢量值相除得到歸一化的距離d1=|I1-I2|/max(I1,I2)。此值在一定程度上能表示兩種顏色的距離。
顏色距離2顏色距離1提到的HSV空間的量化,會造成一定的誤差和漏檢。這里的第2種顏色距離采用的是HSV空間標準的歐氏距離的一個變化形式。
d2=[(vi-vj)2+(sicos(hi)-sjcos(hj))2+(sisin(hi)-sjsin(hj))2]1/2/5]]>其中i和j代表兩種不同的顏色。
距離合成顏色的量化是為了考慮到用戶主觀判斷的模糊性,以及屏蔽這種主觀差異。而實際上又要保持一定的顏色差的精確度。解決方法是將兩種距離合成在一起,并根據(jù)實際的需要賦予不同的權(quán)值。D=w1*d1+w2*d2。取w1=0.8,w2=0.2。得到合成后的距離,可以作為顏色相似程度的度量。搜索圖片制定區(qū)域的所有象素,設(shè)定一個閾值T,如果距離D(Ci,C),即指定要檢索的顏色和象素的顏色差別小于閾值,就認為是同種顏色,在調(diào)試時,可以將對應的象素點值置為255,而大于閾值的點置為0,得到二值化圖像。
結(jié)果輸出根據(jù)經(jīng)驗值,累計的顏色相似象素點超過區(qū)域象素點的某個比率時,認為檢測到具有該顏色特征的目標。目前此比率取為0.09。
2、背景處理背景的影響是不可忽視的。實驗表明,當背景點的象素值與指定的顏色值很相似時,算法沒有辦法予以區(qū)分。
由于是監(jiān)控視頻流圖像,因此總是假定初始的幾幀圖像是不包含運動目標的。但是,隨著時間的推移,光照的變化,攝像頭的移動,背景組成的變化等因素的影響,需考慮背景的更新。目前采取的是背景平均法。即在處理當前幀圖片時,將當前圖片于前面計算得到的背景圖片象素值相加取二者的均值,這樣會得到一定誤差,但是只要閾值適當,誤差可以部分消除。
B(i)=(B(i-1)+Ti)/2。Bi為背景,Ti為當前幀。計算圖像區(qū)域內(nèi)每個象素點的灰度值,并與背景對應點的灰度值相減的到絕對差值,設(shè)定一個閾值T,當灰度差小于此閾值時,認為當前點是背景點,在相似象素點集合中予以剔除,反之保留。
下面以典型的公安處理報警的過程為例,詳細說明如下在接到報警后,警員將嫌疑目標出現(xiàn)時間、位置,以及嫌疑目標的特征輸入搜索系統(tǒng),搜索系統(tǒng)根據(jù)GIS空間分析的結(jié)果,可以確定嫌疑目標下一時間可能出現(xiàn)的位置,以及上一時間可能的位置,從而確定要搜索的指定時間及指定地點的監(jiān)控點的視頻。
在實時視頻中搜索嫌疑目標,如果找到嫌疑目標,則將實時圖像提供給警員,供警員轉(zhuǎn)動攝像頭方位及縮放圖像,以便于確認及得到更清晰的圖像,并通知巡邏民警和跟蹤嫌疑目標,更可以根據(jù)目標的位置預測嫌疑目標將來可能的移動方向,并控制攝像頭轉(zhuǎn)向較好的攝像角度,調(diào)度相應的出警。
在歷史數(shù)據(jù)中搜索,將搜索結(jié)果圖像標出,為以后在供目擊人員辨認及到嫌疑位置調(diào)查等提供證據(jù)。
本發(fā)明是將圖像識別與數(shù)字視頻數(shù)據(jù)結(jié)合,提供了一種較為節(jié)省資源的識別方法,以此來在現(xiàn)有網(wǎng)絡資源及計算機能力的基礎(chǔ)上達到最好的智能處理方法。
權(quán)利要求
1.一種在街面監(jiān)控視頻中搜索指定特征對象的方法,其特征是比對時不再局限于面部,而是以人體的各種特征為參考依據(jù),根據(jù)人體的衣著特征、發(fā)型特征、以及體態(tài)特征進行比對。實現(xiàn)在目前的技術(shù)水平、計算機速度及視頻質(zhì)量基礎(chǔ)上,完成智能識別。
全文摘要
本發(fā)明提供在街面監(jiān)控視頻中搜索指定特征對象的方法,其特征是比對時不再局限于面部,而是以人體的各種特征為參考依據(jù),根據(jù)人體的衣著特征、發(fā)型特征、以及體態(tài)特征進行比對。實現(xiàn)在目前的技術(shù)水平、計算機速度及視頻質(zhì)量基礎(chǔ)上,完成智能識別。
文檔編號G06K9/00GK1916931SQ20051002893
公開日2007年2月21日 申請日期2005年8月19日 優(yōu)先權(quán)日2005年8月19日
發(fā)明者張憲民, 井祥元, 陳林波 申請人:上海正電科技發(fā)展有限公司