專利名稱:一種智能人臉識(shí)別視頻監(jiān)控系統(tǒng)及其實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻智能 監(jiān)控系統(tǒng)及其實(shí)現(xiàn)方法,尤其涉及一種智能人臉識(shí)別視頻監(jiān)控系統(tǒng)及其實(shí)現(xiàn)方法。
背景技術(shù):
人臉識(shí)別的技術(shù)和方法很多,各自有自己的優(yōu)缺點(diǎn),有基于模型的小波、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、子空間等方法。目前針對(duì)視頻的人臉識(shí)別在安防領(lǐng)域有巨大的市場(chǎng)需求,然而真正基于視頻的人臉識(shí)別應(yīng)用產(chǎn)品還處在發(fā)展階段。實(shí)際上人臉識(shí)別的目的就是從圖像或視頻中根據(jù)人臉的特征來(lái)確定是否有人臉或驗(yàn)證人的身份。人臉識(shí)別研究的內(nèi)容很多,涉及計(jì)算機(jī)技術(shù)、圖像技術(shù)、識(shí)別技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、法律倫理、光學(xué)器件、神經(jīng)科學(xué)、精神物理等。目前人臉識(shí)別研究不僅包括樣本采集, 還有信息加工以及實(shí)際應(yīng)用。隨著研究的深入其應(yīng)用的市場(chǎng)在不斷擴(kuò)大。如安防視頻監(jiān)控、 銀行監(jiān)控、自動(dòng)柜員機(jī)、邊境檢查、人臉數(shù)據(jù)庫(kù)比對(duì)、犯罪嫌疑人照片的存儲(chǔ)和比對(duì)、智能家庭、智能會(huì)議中心、門(mén)禁考勤、電子商務(wù)、娛樂(lè)等能用到人臉識(shí)別技術(shù)產(chǎn)品和系統(tǒng)。特別在目前的安防視頻監(jiān)控系統(tǒng)中如何提高其智能化程度,使監(jiān)控報(bào)警事后處理為事前預(yù)警,減少事故范圍是人們十分關(guān)心的問(wèn)題。現(xiàn)在傳統(tǒng)的監(jiān)控大多是實(shí)時(shí)錄像以便事后查詢,由于一般監(jiān)控場(chǎng)景是固定的,而監(jiān)控錄像對(duì)其固定的場(chǎng)景重復(fù)的記錄存儲(chǔ)下來(lái)以備查詢,其查詢要人工進(jìn)行,費(fèi)時(shí)費(fèi)力,而且還要占用大量磁盤(pán)空間。實(shí)際上在安防視頻監(jiān)控中人們關(guān)心的是被監(jiān)控的場(chǎng)景中的人的活動(dòng)情況或是誰(shuí)在活動(dòng)、活動(dòng)地點(diǎn)、活動(dòng)時(shí)間等信息就足夠了 .因此就提出安防監(jiān)控智能化的要求,然而視頻人臉識(shí)別監(jiān)控正是解決這一問(wèn)題的主要技術(shù)之一。總之,目前安防視頻監(jiān)控還只是實(shí)時(shí)場(chǎng)景重復(fù)存儲(chǔ)的和簡(jiǎn)單的入侵報(bào)警,還沒(méi)有從根本上改變繁瑣的人工事后查詢的工作量,已經(jīng)不能滿足人們的需求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種具有視頻監(jiān)控功能的智能人臉識(shí)別監(jiān)控系統(tǒng),能夠從根本上改變繁瑣的人工事后查詢,提高了處理運(yùn)算速度,便于硬件系統(tǒng)維護(hù)和量產(chǎn),解決現(xiàn)有技術(shù)的缺憾。本發(fā)明采用如下技術(shù)方案實(shí)現(xiàn)一種智能人臉視頻監(jiān)控系統(tǒng),包括視頻監(jiān)控采集單元,用于采集被監(jiān)控場(chǎng)所的視頻模擬信息;數(shù)字信號(hào)處理單元,用于實(shí)現(xiàn)對(duì)系統(tǒng)的控制、數(shù)字視頻人臉識(shí)別算法運(yùn)算、系統(tǒng)自檢處理和人臉圖像編碼打包傳給網(wǎng)絡(luò)模塊;顯示輸出單元,用于顯示輸出運(yùn)算結(jié)果;視頻解碼模塊,用于將視頻模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào);視頻解碼模塊,用于將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào);
串口輸出模塊,用于實(shí)現(xiàn)模塊間的通信;網(wǎng)絡(luò)接口模塊,用于實(shí)現(xiàn)數(shù)字信號(hào)處理單元與上位機(jī)控制單元之間的網(wǎng)絡(luò)連接通信;上位機(jī)控制單元,用于接收被控單元發(fā)送的數(shù)字信號(hào)和/或發(fā)出控制命令,進(jìn)行通道選擇、人臉場(chǎng)景疊加、配置IP地址;所述視頻監(jiān)控采集單元通過(guò)視頻解碼模塊與數(shù)字信號(hào)處理單元相連接,所述數(shù)字信號(hào)處理單元通過(guò)網(wǎng)絡(luò)接口模塊與上位機(jī)控制單元相連,所述數(shù)字信號(hào)處理單元通過(guò)視頻解碼模塊和串口輸出模塊與顯示輸出單元相連;其特征在于所述數(shù)字信號(hào)處理單元包括數(shù)字信號(hào)處理器,用于進(jìn)行人臉識(shí)別算法運(yùn)算;由于視頻監(jiān)控系統(tǒng)的巨大工作量和系統(tǒng)復(fù)雜性 ,在硬件設(shè)計(jì)中采用高性能的數(shù)字信號(hào)處理器DSP TI6000系列,其最高運(yùn)算速度可達(dá)每秒百萬(wàn)條指令,可以滿足復(fù)雜算法的實(shí)時(shí)處理要求。同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器,用于存儲(chǔ)數(shù)字信號(hào)處理器內(nèi)部程序;閃速存儲(chǔ)器,用于存儲(chǔ)應(yīng)用程序和人臉識(shí)別算法代碼;復(fù)雜可編程邏輯器,用于數(shù)據(jù)和地址總線擴(kuò)展和處理、控制外部信號(hào);所述數(shù)字信號(hào)處理器分別與同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器、閃速存儲(chǔ)器和復(fù)雜可編程邏輯器相連。進(jìn)一步地,所述視頻監(jiān)控采集單元為兩個(gè)攝像頭,該兩個(gè)攝像頭通過(guò)同軸電纜與視頻解碼模塊相連,用于將采集到的視頻模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。一種實(shí)現(xiàn)智能人臉視頻監(jiān)控系統(tǒng)的方法,該方法包括如下步驟A)通過(guò)視頻監(jiān)控裝置采集被監(jiān)控場(chǎng)所的視頻模擬信號(hào);B)通過(guò)視頻解碼裝置將上一步采集到的視頻模擬信號(hào)進(jìn)行模_數(shù)轉(zhuǎn)換變?yōu)閿?shù)字信號(hào);C)對(duì)A)、B)兩步采集到的數(shù)字信號(hào)傳送至數(shù)字信號(hào)處理單元,對(duì)數(shù)字信號(hào)進(jìn)行人臉識(shí)別運(yùn)算;D)將運(yùn)算處理完畢的數(shù)字信號(hào)傳送至顯示輸出單元和網(wǎng)絡(luò)單元;E)利用顯示輸出單元顯示運(yùn)算結(jié)果,網(wǎng)絡(luò)單元上傳采集人臉圖像結(jié)果;其特征在于,在步驟B)中還包括如下步驟Bi)從同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器中調(diào)用存儲(chǔ)數(shù)字信號(hào)處理器的內(nèi)部程序;B2)從閃速存儲(chǔ)器中調(diào)用人臉識(shí)別算法代碼。進(jìn)一步地,步驟A)所述通過(guò)視兩個(gè)攝像頭采集被監(jiān)控場(chǎng)所的視頻模擬信號(hào),然后將采集到的視頻模擬信號(hào)通過(guò)同軸電纜傳送給視頻解碼裝置。本發(fā)明具有如下有益技術(shù)方案在硬件設(shè)計(jì)中采用高性能的數(shù)字信號(hào)處理器DSP TI6000系列,并配合以合適的外圍電路,包括同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器SDRAM,閃速存儲(chǔ)器FLASH,復(fù)雜可編程邏輯器CPLD,增加了整體系統(tǒng)運(yùn)行的效率,提高了處理運(yùn)算速度,并采用模塊化設(shè)計(jì),以DSP數(shù)字信號(hào)處理系統(tǒng)為核心模塊和接口模塊組成,以便對(duì)硬件系統(tǒng)維護(hù)和量產(chǎn)。
圖1是本發(fā)明的總體結(jié)構(gòu)框圖。圖2是本發(fā)明的硬件總體架構(gòu)圖。圖3是本發(fā)明的軟件總體流程圖。圖4是本發(fā)明的數(shù)字處理器DSP人臉識(shí)別算法流程圖。圖5是本發(fā)明上位機(jī)控制單元的流程圖。
具體實(shí)施例方式
通過(guò)下面對(duì)實(shí)施例的描述,將更加有助于公眾理解本發(fā)明,但不能也不應(yīng)當(dāng)將中請(qǐng)人所給出的具體的實(shí)施例視為對(duì)本發(fā)明技術(shù)方案的限制,任何對(duì)部件或技術(shù)特征的定義進(jìn)行改變和/或?qū)φw結(jié)構(gòu)作形式的而非實(shí)質(zhì)的變換都應(yīng)視為本發(fā)明的技術(shù)方案所限定的保護(hù)范圍。如圖1所示本發(fā)明的總體結(jié)構(gòu)框圖,視頻監(jiān)控采集單元101用于采集被監(jiān)控場(chǎng)所的視頻模擬信息,數(shù)字信號(hào)處理單元102用于實(shí)現(xiàn)對(duì)系統(tǒng)的控制、數(shù)字視頻人臉識(shí)別算法運(yùn)算、系統(tǒng)自檢處理,顯示輸出單元103用于顯示輸出運(yùn)算結(jié)果,視頻監(jiān)控采集單元101、數(shù)字信號(hào)處理單元102和顯示輸出單元103順序連接。如圖2所示本發(fā)明的硬件總體架構(gòu)圖,視頻監(jiān)控采集單元101中包括兩個(gè)攝像頭, 兩個(gè)攝像頭分別與通過(guò)同軸電纜與兩個(gè)視頻解碼模塊連接,用于在監(jiān)視被監(jiān)控場(chǎng)所時(shí)采集圖形信號(hào),這些圖形信號(hào)中可能只包括場(chǎng)景,也可能包括了場(chǎng)景與人物,攝像頭將這些模擬信號(hào)傳遞給視頻解碼模塊,將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)處理器DSP可以處理的數(shù)字信號(hào)。 數(shù)字信號(hào)處理器DSP接收到這些經(jīng)過(guò)處理的數(shù)字信號(hào)后即開(kāi)始進(jìn)行人臉識(shí)別運(yùn)算。數(shù)字信號(hào)處理單元102中還包括有數(shù)字信號(hào)處理器的外圍電路,如圖中所示的201,同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器SDRAM用于存儲(chǔ)數(shù)字信號(hào)處理器內(nèi)部程序,閃速存儲(chǔ)器FLASH用于存儲(chǔ)應(yīng)用程序和人臉識(shí)別算法代碼,設(shè)置SDRAM和FLSAH可以節(jié)省數(shù)字信號(hào)處理器DSP的內(nèi)存字節(jié)并擴(kuò)展 DSP的功能,復(fù)雜可編程邏輯器CPLD用于數(shù)據(jù)和地址總線擴(kuò)展和處理、控制外部信號(hào),當(dāng)數(shù)字信號(hào)處理器DSP的管腳不夠用或數(shù)據(jù)需要進(jìn)行分時(shí)復(fù)用時(shí)CPLD便可以發(fā)揮作用。由于在外圍電路設(shè)置了 SDRAM、FLASH和CPLD,所以提高了數(shù)字信號(hào)處理器DSP的運(yùn)算能力及視頻監(jiān)控系統(tǒng)的綜合處理運(yùn)算能力。如圖中202所示,JTAG仿真接口,是DSP與外部連接的接口,通過(guò)一個(gè)微型開(kāi)關(guān)控制,實(shí)現(xiàn)下載或上傳應(yīng)用程序、調(diào)試系統(tǒng)或燒程序。網(wǎng)絡(luò)接口模塊,用于實(shí)現(xiàn)數(shù)字信號(hào)處理單元與上位機(jī)控制單元之間的網(wǎng)絡(luò)連接通信;上位機(jī)控制單元, 用于接收被控單元發(fā)送的數(shù)字信號(hào)和/或發(fā)出控制命令,進(jìn)行通道選擇、人臉場(chǎng)景疊加、配置IP地址。如圖3所示本發(fā)明的軟件總體流程圖,包括如下步驟通過(guò)視頻監(jiān)控裝置采集被監(jiān)控場(chǎng)所的視頻模擬信號(hào);通過(guò)視頻解碼裝置將上一步采集到的視頻模擬信號(hào)進(jìn)行模_數(shù)轉(zhuǎn)換變?yōu)閿?shù)字信號(hào);對(duì)上兩步采集到的數(shù)字信號(hào)傳送至數(shù)字信號(hào)處理單元,對(duì)數(shù)字信號(hào)進(jìn)行人臉識(shí)別運(yùn)算;將運(yùn)算處理完畢的數(shù)字信號(hào)傳送至顯示輸出單元,實(shí)現(xiàn)編碼網(wǎng)絡(luò)輸出和網(wǎng)絡(luò)控制;
顯示輸出單元顯示運(yùn)算結(jié)果;數(shù)字信號(hào)處理器DSP將調(diào)用應(yīng)用程序并與上位機(jī)控制單元進(jìn)行網(wǎng)絡(luò)傳輸交換數(shù)據(jù);如圖4所示本發(fā)明數(shù)字處理器DSP人臉識(shí)別算法流程圖,即圖2中的201,顯示單元采集視頻模擬信號(hào)并通過(guò)視頻解碼模塊將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)并輸入至數(shù)字信號(hào)處理單元,數(shù)字信號(hào)處理單元提取A通道和B通道的矩陣信息,進(jìn)行人臉識(shí)別算法的運(yùn)算, 運(yùn)算的方法步驟如下=Gabor特征轉(zhuǎn)換PCA降維,歸一化處理人臉,人臉定位特征提取和選取,SVM支持向量分類器人臉識(shí)別,最后在上位機(jī)控制單元的控制下將人臉圖像編碼打包進(jìn)行網(wǎng)絡(luò)上傳。數(shù)字信號(hào)處理單元進(jìn)行人臉識(shí)別處理的詳細(xì)原理如下DSP的人臉識(shí)別算法采用基于Gabor小波、PCA(主成分分析)和SVM(支持向量機(jī)分類器)的算法,算法使用灰度圖像中的Haar特征和Boosting分類器檢測(cè)人臉,通過(guò) Gabor小波抽取特征,PCA降維處理和SVM支持向量機(jī)分類進(jìn)行人臉識(shí)別。人臉檢測(cè)是人臉識(shí)別的前提,準(zhǔn)確的人臉檢測(cè)有助于提高人臉識(shí)別率。Gabor小波人臉特征提取算法提出將 Gabor特征空間轉(zhuǎn)換到PCA空間來(lái)降低特征維數(shù)以便人臉識(shí)別。與經(jīng)典的特征臉和Fisher 臉中用像素灰度值作為特征相比,Gabor小波特征包含更多的判別信息,從而對(duì)光照、姿態(tài)等因素的影響有更好的魯棒性。Gabor小波可以在空間和頻域獲得最佳的分辨率;Gabor小
波可以很好的模擬哺乳動(dòng)物視覺(jué)神經(jīng)簡(jiǎn)單模型,其小波算法模型
權(quán)利要求
1.一種智能人臉識(shí)別視頻監(jiān)控系統(tǒng),包括視頻監(jiān)控采集單元,用于采集被監(jiān)控場(chǎng)所的視頻模擬信息;數(shù)字信號(hào)處理單元,用于實(shí)現(xiàn)對(duì)系統(tǒng)的控制、數(shù)字視頻人臉識(shí)別算法運(yùn)算、系統(tǒng)自檢處理和人臉圖像編碼打包傳給網(wǎng)絡(luò)模塊;顯示輸出單元,用于顯示輸出運(yùn)算結(jié)果; 視頻解碼模塊,用于將視頻模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào); 視頻解碼模塊,用于將數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào); 串口輸出模塊,用于實(shí)現(xiàn)模塊間的通信;網(wǎng)絡(luò)接口模塊,用于實(shí)現(xiàn)數(shù)字信號(hào)處理單元與上位機(jī)控制單元之間的網(wǎng)絡(luò)連接通信; 上位機(jī)控制單元,用于接收被控單元發(fā)送的數(shù)字信號(hào)和/或發(fā)出控制命令,進(jìn)行通道選擇、人臉場(chǎng)景疊加、配置IP地址;所述視頻監(jiān)控采集單元通過(guò)視頻解碼模塊與數(shù)字信號(hào)處理單元相連接,所述數(shù)字信號(hào)處理單元通過(guò)網(wǎng)絡(luò)接口模塊與上位機(jī)控制單元相連,所述數(shù)字信號(hào)處理單元通過(guò)視頻解碼模塊和串口輸出模塊與顯示輸出單元相連;其特征在于 所述數(shù)字信號(hào)處理單元包括 數(shù)字信號(hào)處理器,用于進(jìn)行人臉識(shí)別算法運(yùn)算; 同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器,用于存儲(chǔ)數(shù)字信號(hào)處理器內(nèi)部程序; 閃速存儲(chǔ)器,用于存儲(chǔ)應(yīng)用程序和人臉識(shí)別算法代碼; 復(fù)雜可編程邏輯器,用于數(shù)據(jù)和地址總線擴(kuò)展和處理、控制外部信號(hào); 所述數(shù)字信號(hào)處理器分別與同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器、閃速存儲(chǔ)器和復(fù)雜可編程邏輯器相連。
2.根據(jù)權(quán)利要求1所述的智能人臉識(shí)別視頻監(jiān)控系統(tǒng),其特征在于,所述視頻監(jiān)控采集單元為兩個(gè)攝像頭,該兩個(gè)攝像頭通過(guò)同軸電纜與視頻解碼模塊相連,用于將采集到的視頻模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)。
3.一種實(shí)現(xiàn)智能人臉識(shí)別視頻監(jiān)控系統(tǒng)的方法,該方法包括如下步驟A)通過(guò)視頻監(jiān)控裝置采集被監(jiān)控場(chǎng)所的視頻模擬信號(hào);B)通過(guò)視頻解碼裝置將上一步采集到的視頻模擬信號(hào)進(jìn)行模-數(shù)轉(zhuǎn)換變?yōu)閿?shù)字信號(hào);C)對(duì)A)、B)兩步采集到的數(shù)字信號(hào)傳送至數(shù)字信號(hào)處理單元,對(duì)數(shù)字信號(hào)進(jìn)行人臉識(shí)別運(yùn)算;D)將運(yùn)算處理完畢的數(shù)字信號(hào)傳送至顯示輸出單元和網(wǎng)絡(luò)單元;E)利用顯示輸出單元顯示運(yùn)算結(jié)果,網(wǎng)絡(luò)單元上傳采集人臉圖像結(jié)果,其特征在于,在步驟B)中還包括如下步驟B1)從同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器中調(diào)用存儲(chǔ)數(shù)字信號(hào)處理器的內(nèi)部程序; B2)從閃速存儲(chǔ)器中調(diào)用人臉識(shí)別算法代碼。
4.根據(jù)權(quán)利要求3所述的實(shí)現(xiàn)智能人臉識(shí)別視頻監(jiān)控系統(tǒng)的方法,其特征在于,步驟 A)所述通過(guò)視兩個(gè)攝像頭采集被監(jiān)控場(chǎng)所的視頻模擬信號(hào),然后將采集到的視頻模擬信號(hào)通過(guò)同軸電纜傳送給視頻解碼裝置。
全文摘要
本發(fā)明公開(kāi)了一種智能人臉識(shí)別視頻監(jiān)控系統(tǒng)及其實(shí)現(xiàn)方法,該系統(tǒng)中視頻監(jiān)控采集單元、數(shù)字信號(hào)處理單元、顯示輸出單元相連,數(shù)字信號(hào)處理單元與上位機(jī)控制單元相連,數(shù)字信號(hào)處理單元中包括DSP、SDRAM、FLASH和CPLD,該實(shí)現(xiàn)方法為視頻監(jiān)控采集單元采集視頻模擬信號(hào),DSP進(jìn)行人臉識(shí)別運(yùn)算并由顯示輸出單元輸出,同時(shí)數(shù)字信號(hào)處理器單元進(jìn)行人臉采集打包并自動(dòng)上傳人臉圖片,上位機(jī)控制單元調(diào)用內(nèi)部程序自動(dòng)接收采集的人臉圖片生存人臉圖片庫(kù)供進(jìn)行人臉識(shí)別對(duì)比查詢,并進(jìn)行控制配置。與現(xiàn)有技術(shù)相比,本發(fā)明從根本上減輕了人工查詢的工作量,同時(shí)還提供了人臉圖片庫(kù)供識(shí)別比對(duì)和其他監(jiān)控應(yīng)用程序調(diào)用,大大提高了視頻監(jiān)控系統(tǒng)的智能化程度和綜合處理能力。
文檔編號(hào)H04N7/30GK102223520SQ20111009479
公開(kāi)日2011年10月19日 申請(qǐng)日期2011年4月15日 優(yōu)先權(quán)日2011年4月15日
發(fā)明者王靜 申請(qǐng)人:北京易子微科技有限公司