本發(fā)明涉及計算機視覺領(lǐng)域,具體涉及基于OpenCV圖像庫和Qt框架中的QImage圖像類的對于視頻處理、圖像中指定檢測和分割以及結(jié)果的可視化顯示。
背景技術(shù):
隨著科技的進(jìn)步,監(jiān)控攝像頭已經(jīng)遍布大街小巷,形成了一個巨大的監(jiān)控網(wǎng)絡(luò),這些攝像頭拍攝的監(jiān)控視頻可為公安部門提供偵破諸如商場盜竊、聚眾斗毆等重大刑事案件的線索;同時也可為交通協(xié)管部門提供實時交通路況信息,方便其對交通進(jìn)行監(jiān)管。每當(dāng)有情況發(fā)生時,目標(biāo)對象一定會在移動過程中在各個攝像頭下出現(xiàn),有關(guān)部門需要在數(shù)量巨大的視頻文件中找到所需的目標(biāo)對象。很多時候,查看監(jiān)控錄像的目的就是從其中發(fā)現(xiàn)目標(biāo)對象。目前,監(jiān)控系統(tǒng)大多采用實時攝像加人工監(jiān)控的方式進(jìn)行監(jiān)看,負(fù)責(zé)查看錄像屏幕的人員必須長時間留意視頻中事件場景的變化,這對工作人員來說是很大的挑戰(zhàn)。研究表明,人在2小時的長時間注意力高度集中后大腦會疲勞,工作效率會降低。如果一些重要的信息被有關(guān)人員所遺漏忽略,將會嚴(yán)重影響了整個監(jiān)控系統(tǒng)的作用。所以,行人再識別的研究應(yīng)運而生。
行人再識別是從沒有任何重區(qū)域的不同攝像頭的視頻中識別出同一個人,可以用于刑偵、尋找失蹤人員等工作。在一定時間內(nèi),一個行走的行人可能會經(jīng)過相鄰的若干個攝像頭,如何識別出在不同攝像頭下出現(xiàn)的同一個人,并繪制出該目標(biāo)走過的路徑,是行人再識別所研究的重點。目前行人再識別的輸入源是圖像中的行人。
傳統(tǒng)的行人檢測的方法只是在圖片或者視頻中標(biāo)出行人,這樣的處理方式對于行人再識別系統(tǒng)來說沒有很大的幫助,在進(jìn)行再識別的過程中還需要消耗大量的計算資源,不利于工作效率的提高。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提高行人再識別系統(tǒng)的工作效率,在傳統(tǒng)的OpenCV庫上實現(xiàn)創(chuàng)新,提出了一種檢測視頻中的行人,并且保存檢測出的行人圖片的一種方法。此方法不僅可以實現(xiàn)可視地觀察檢測的效果,而且可以把截取的圖片輸入到行人再識別的程序中,大幅度減少計算資源,并且顯著提高行人再識別程序的工作效率。實驗結(jié)果表明,對于同一個行人再識別程序,輸入一組完整的圖片需要19.18秒才能完成檢測過程,而輸入經(jīng)過該發(fā)明截取之后的圖片只需要5.62秒即可完成檢測,并且再識別的結(jié)果也相同。同時,該發(fā)明也可以根據(jù)需要的精度以及計算機的性能,自行選擇分類器,方便不同用戶的使用。
本發(fā)明采用的技術(shù)方案如下:一種跨平臺的對視頻中行人檢測并保存檢測結(jié)果的方法,包括加載待檢測視頻,對視頻中的行人進(jìn)行檢測、對檢測結(jié)果進(jìn)行保存和可視化界面;具體的步驟如下:
1)使用OpenCV庫中的函數(shù)加載視頻,并且自動觸發(fā)檢測分類器的檢測函數(shù);
在檢測分類器的使用上,使用Hog特征或者Haar特征的分類器,該分類器能夠自行訓(xùn)練,或者采用已有的分類器,降低使用難度;在加載視頻方面,運用OpenCV的視頻加載函數(shù),該函數(shù)將逐幀播放視頻;
2)使用detectMultiScale開始檢測過程;
首先把視頻中的彩色圖像使用OpenCV庫中的cvtColor函數(shù)轉(zhuǎn)化為灰階圖像,再使用equalizeHist函數(shù)進(jìn)行直方圖均衡化;
在核心內(nèi)容檢測、截取和保存方面,運用OpenCV中的detectMultiScale檢測方法進(jìn)行多尺度檢測,提高檢測的準(zhǔn)確率;
運用rectangle函數(shù)在檢測的視頻中框出行人;rectangle函數(shù)在設(shè)置中,需要框出坐標(biāo)為detectMultiScale中得到的具有目標(biāo)對象的矩形坐標(biāo);同理,OpenCV中的cvSetImageROI函數(shù)和cvSaveImage函數(shù)針對的也是detectMultiScale中獲得的坐標(biāo);
3)使用cvSetImageROI函數(shù),通過檢測過程中detectMultiScale級聯(lián)分類器確定的坐標(biāo),截取出目標(biāo)圖像;
運用OpenCV中的cvSetImageROI函數(shù),通過步驟2)中的detectMultiScale確定的坐標(biāo),把在檢測過程中用矩形框出的部分截圖,用cvSaveImage函數(shù)把截圖保存在指定文件夾中;如果需要,用戶可以到指定的文件夾中去提取所截取的圖片;
4)使用編寫的Mat2QImage函數(shù),把OpenCV庫中的Mat圖像類型轉(zhuǎn)化為Qt框架中的QImage類型,把檢測的過程和截取的結(jié)果都顯示在該發(fā)明的可視化界面上。
進(jìn)一步,所述步驟2中,運用rectangle函數(shù)在檢測的視頻中框出行人時,設(shè)置縮放圖像的大小為原圖的1.1倍,設(shè)置每一個進(jìn)行檢測的矩形最多有15個鄰接的矩形,設(shè)置標(biāo)志位為0,規(guī)定最小的目標(biāo)大小為26*74,最大的目標(biāo)大小為70*174,超過該尺寸的目標(biāo)不予檢測。
進(jìn)一步,所述步驟4的具體過程為:在可視化方面,由于OpenCV的界面不美觀,需要編寫了一個Mat2QImage函數(shù),將OpenCV庫加載的視頻圖像轉(zhuǎn)為為Qt框架中QImage類,用于可視化顯示;在編寫Mat2QImage函數(shù)中,同樣采用cvtColor函數(shù),將OpenCV視頻加載函數(shù)得到的Mat類型的圖像的BGR色彩空間轉(zhuǎn)化為Qt中的QImage所采用的RGB色彩空間;然后根據(jù)圖像是彩色圖像或者灰階圖像,初始化QImage的顏色編碼為Format_RGB888或者Format_Indexed8;步驟2)中使用的rectangle函數(shù)框出的區(qū)域也會在可視化界面上實時顯示,位置位于檢測視頻的右側(cè),方便使用者實時觀察運行的情況,避免遺漏重要的信息。
進(jìn)一步,還包括從選擇待檢測的視頻文件,到檢測的過程,再到截取的過程全程可視,方便使用者觀察。
本發(fā)明是一個基于OpenCV圖像庫和Qt中的QImage圖像類的行人檢測并截取和保存檢測結(jié)果的方法,相對于目前已存在的主流的行人檢測程序,其主要創(chuàng)新點有以下幾部分:
1、提出“把檢測出的結(jié)果部分自動截圖保存到指定文件夾中”這一概念并實現(xiàn),去除待檢測視頻中不必要的內(nèi)容,大大提高后續(xù)的行人再識別的工作效率。
2、采用OpenCV庫和Qt框架兩個跨平臺的技術(shù),可以在包括手機系統(tǒng)在內(nèi)的多種不同操作系統(tǒng)平臺下運行。發(fā)明成果界面可視化,包括加載視頻的過程、檢測的過程以及截取的部分全部清晰可見。截取的部分顯示在待檢測視頻的右側(cè),方便使用者觀察是否有漏檢,以免錯過重要的信息。
3、采用OpenCV庫和Qt框架編寫該發(fā)明,可以在包括手機系統(tǒng)在內(nèi)的多種操作系統(tǒng)平臺運行,具有強大的可移植性。
附圖說明
下面結(jié)合附圖和具體實施方式對本發(fā)明進(jìn)一步詳細(xì)說明。
圖1是本發(fā)明的實現(xiàn)原理流程圖。
圖2為本發(fā)明的界面圖。
圖3為發(fā)明運行完成后保存的圖片。
具體實施方式
以下結(jié)合附圖對發(fā)明的實施做進(jìn)一步說明。
圖1為本發(fā)明的實現(xiàn)流程圖。本發(fā)明的基本思想就是運用OpenCV進(jìn)行視頻加載、行人檢測以及結(jié)果截取,運用Qt實現(xiàn)全程可視化操作,將視頻中有價值的目標(biāo)部分進(jìn)行保存,去除視頻中不必要的部分;同時可以在包括手機系統(tǒng)在內(nèi)的多種操作系統(tǒng)平臺運行,并且檢測和截取的全程可視化,方便使用者監(jiān)控檢測結(jié)果,避免遺漏關(guān)鍵信息。其中,加載視頻、檢測目標(biāo)和截取結(jié)果使用的是OpenCV庫中的函數(shù)來自行調(diào)整參數(shù)。
首先綜合考慮計算機性能和需要的精度,選擇檢測要用的分類器。然后點擊檢測按鈕,系統(tǒng)將會自動跳出文件夾對話框供使用者選擇需要檢測的視頻。使用者選擇完視頻后,將會自動開始檢測的過程,使用者可以在界面直觀感受檢測的過程,并且看到截取的部分。檢測完成后,使用者可以到相應(yīng)文件夾中找到截取的圖片,以便進(jìn)一步利用。界面如圖2所示,點擊檢測按鈕,在彈出的文件夾對話框中選擇需要檢測的視頻并打開。點擊檢測按鈕之后,本發(fā)明將彈出文件對話框,可供用戶選擇需要檢測是視頻文件,并點擊打開待檢測的文件。
具體步驟如下:
1)該發(fā)明將會使用OpenCV庫中的函數(shù)加載視頻,并且自動觸發(fā)檢測的函數(shù)。
在檢測分類器的使用上,可以使用Hog特征或者Haar特征的分類器,該分類器可以自行訓(xùn)練,或者采用已有的分類器,降低使用難度。在加載視頻方面,運用OpenCV的視頻加載函數(shù),該函數(shù)將逐幀播放視頻。
2)使用detectMultiScale開始檢測過程。
在該過程中,該發(fā)明首先把視頻中的彩色圖像使用OpenCV庫中的cvtColor函數(shù)轉(zhuǎn)化為灰階圖像,再使用equalizeHist函數(shù)進(jìn)行直方圖均衡化。equalizeHist的原理是計算輸入圖片的直方圖H,進(jìn)行歸一化后得再計算直方圖積分,最后采用H’作為查詢表,dst(x,y)=H’(src(x,y))進(jìn)行圖像變換。在核心內(nèi)容檢測、截取和保存方面,運用OpenCV中的detectMultiScale檢測方法進(jìn)行多尺度檢測,提高檢測的準(zhǔn)確率;運用rectangle函數(shù)在檢測的視頻中框出行人;detectMultiScale是一種級聯(lián)分類器類,用于對輸入的圖片進(jìn)行多尺度檢測。在本發(fā)明中,設(shè)置縮放圖像的大小為原圖的1.1倍,設(shè)置每一個進(jìn)行檢測的矩形最多有15個鄰接的矩形,設(shè)置標(biāo)志位為0,規(guī)定最小的目標(biāo)大小為26*74,最大的目標(biāo)大小為70*174(超過該尺寸的目標(biāo)不予檢測)。實驗結(jié)果表明該參數(shù)的設(shè)置可以使得檢測的準(zhǔn)確率達(dá)到92%左右。rectangle函數(shù)中,設(shè)置需要框出的頂點坐標(biāo)為detectMultiScale中得到的具有目標(biāo)對象的矩形坐標(biāo)。同理,cvSetImageROI函數(shù)和cvSaveImage函數(shù)針對的也是detectMultiScale中獲得的坐標(biāo)。
3)使用cvSetImageROI函數(shù),通過檢測過程中detectMultiScale級聯(lián)分類器類確定的坐標(biāo),截取出目標(biāo)圖像。
運用OpenCV中的cvSetImageROI函數(shù),通過步驟2)中的detectMultiScale確定的坐標(biāo),把在檢測過程中用矩形框出的部分截圖,用cvSaveImage函數(shù)把保存在指定文件夾中。如果需要,用戶可以到指定的文件夾中去提取所截取的圖片,如圖3所示。
4)使用編寫的Mat2QImage函數(shù),把OpenCV庫中的Mat圖像類型轉(zhuǎn)化為Qt框架中的QImage類型,把檢測的過程和截取的結(jié)果都顯示在該發(fā)明的可視化界面上。
在可視化方面,由于OpenCV的界面不美觀,本發(fā)明編寫了一個Mat2QImage函數(shù),將OpenCV庫加載的視頻圖像轉(zhuǎn)為為Qt框架中QImage類,用于可視化顯示。在Mat2QImage中,同樣采用cvtColor函數(shù),將OpenCV視頻加載函數(shù)得到的Mat類型的圖像的BGR色彩空間轉(zhuǎn)化為Qt中的QImage所采用的RGB色彩空間。然后根據(jù)圖像是彩色圖像或者灰階圖像,初始化QImage的顏色編碼為Format_RGB888或者Format_Indexed8。步驟2)中使用的rectangle函數(shù)框出的區(qū)域也會在可視化界面上實時顯示,如圖2所示,位置位于檢測視頻的右側(cè),方便使用者實時觀察運行的情況,避免遺漏重要的信息。
在本說明書的描述中,參考術(shù)語“一個實施例”、“一些實施例”、“示意性實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點可以在任何的一個或多個實施例或示例中以合適的方式結(jié)合。
盡管已經(jīng)示出和描述了本發(fā)明的實施例,本領(lǐng)域的普通技術(shù)人員可以理解:在不脫離本發(fā)明的原理和宗旨的情況下可以對這些實施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由權(quán)利要求及其等同物限定。