專利名稱:一種基于巴氏相似性的目標視覺感知方法
技術領域:
本發(fā)明屬于計算機視覺感知技術領域,具體來說是一種基于巴氏相似性的目標視覺感知方法。
背景技術:
在一些特定場景視頻監(jiān)控場合,需要對感興趣區(qū)域的目標進行感知,感知的結果可用于目標檢測,目標統(tǒng)計以及報警等用途。然而,目前基于視覺的主流方法都是以基于目標跟蹤技術的檢測或者基于目標運動的檢測,該系列方法不穩(wěn)定,且不適用于只允許靜態(tài)圖像傳輸?shù)膽脠龊?。然而除了利用目標運動信息,還可以利用感興趣區(qū)域當前目標與背景的相似性度量作為目標視覺感知的另一種方法。這種方法不僅適用于視頻監(jiān)控場合,也同樣適用于僅有靜態(tài)圖像傳送的監(jiān)控場合,同時進一步融入感知區(qū)域的自適應更新策略,使得本方法更加符合人類對目標的視覺感知方式。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于巴氏相似性的目標視覺感知方法,融合巴氏相似性度量對目標進行感知,其結果更加符合人類對目標的視覺感知方式。一種基于巴氏相似性的目標視覺感知方法,包括
(I)根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記。(2)建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型。(3)利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù)。(4)用(3)算得的巴氏相似性系數(shù)進行巴氏相似性目標視覺感知。(5)對感知區(qū)域進行自適應背景更新。所述的根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記包括以下步驟
I)利用鼠標選擇矩形框區(qū)域的方式或手工輸入矩形框左上角與右下角Cr,_7)坐標的方式,對場景的感知區(qū)域進行設置。2)利用I)獲取的矩形框左上角與右下角Cr,_F)坐標,在每幀視頻圖像中對感知區(qū)域進行標記。3)存儲感知區(qū)域的當前視頻圖像數(shù)據(jù),初始化感知區(qū)域自適應背景。所述的建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型包括以下步驟
I)讀入感知區(qū)域當前視頻圖像數(shù)據(jù),讀入感知區(qū)域自適應背景視頻圖像數(shù)據(jù)。2)初始化感知區(qū)域當前直方圖模型,初始化感知區(qū)域自適應背景直方圖模型。3)將感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型劃分為互不重疊的512個區(qū)間。4)將每個視頻圖像像素的R取值、G取值和B取值,由原來的
取值區(qū)間共256個取值,壓縮至
取值區(qū)間共8個取值。5)根據(jù)壓縮后的每個視頻圖像像素新的R取值、G取值和B取值建立感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。所述的利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù)包括以下步驟
I)輸入已建立的感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。2)利用巴氏相似性計算公式,結合1),算得巴氏相似性系數(shù)。所述的用(3)算得的巴氏相似性系數(shù)進行巴氏相似性目標視覺感知包括以下步驟
I)如果巴氏相似性系數(shù)大于上閾值Thkh (Thiot=O. 85)則上閾值標記TA=1,下閾值標記T7=O。2)如果巴氏相似性系數(shù)低于下閾值Tot (Tlow=O. 7)則下閾值標記T7=l。3)當上閾值標記Ta與下閾值標記T7均等于I時,則感知到目標,否則未感知到目標。4)當上閾值標記Ta與下閾值標記T7均等于I時,上閾值標記Ta與下閾值標記T7均復位為O。
`
所述的對感知區(qū)域進行自適應背景更新包括以下步驟
I)獲得感知區(qū)域的背景差視頻圖像2)根據(jù)給定的閾值T6 ( Τα=4 ),將背景差視頻圖像Fc6 二值化為Fa。3)判斷Fa每個像素的取值,如果Fa的某個像素的灰度值為0,則當前感知區(qū)域?qū)c的R、G、B像素值拷貝至感知區(qū)域自適應背景視頻圖像對應點的R、G、B像素值。本發(fā)明的有益效果
本發(fā)明提供了一種基于巴氏相似性的目標視覺感知方法。該方法除了利用目標運動信息,還融合了感知區(qū)域目標與背景直方圖模型的相似性度量對目標進行視覺感知。這種方法不僅適用于視頻監(jiān)控場合,也適用于僅有靜態(tài)圖像傳送的監(jiān)控場合。同時,這種方法進一步融入感知區(qū)域的自適應更新策略,使得本方法更加符合人類對目標的視覺感知方式,有著廣泛的應用前景。
圖1為本發(fā)明的方法流程 圖2為感知區(qū)域設置圖。
具體實施例方式以下結合附圖對本發(fā)明作進一步說明。如圖1所示,一種基于巴氏相似性的目標視覺感知方法,包括
(I)根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記。
(2)建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型。(3)利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù)。(4)用(3)算得的巴氏相似性系數(shù)進行巴氏相似性目標視覺感知。;
(5)對感知區(qū)域進行自適應背景更新。根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記的具體過程包括以下步驟
I)利用鼠標選擇矩形框區(qū)域的方式或手工輸入矩形框左上角與右下角Cr,_7)坐標的方式,對場景的感知區(qū)域進行設置。如圖2所示,通過鼠標選擇或手工輸入的方式獲得左上角坐標(Ltopx, Ltopy)與右下角坐標(Rtopx, Rtopy)。2)利用I)獲取的矩形框左上角與右下角Cr,r)坐標,在每幀視頻圖像中對感知區(qū)域進行標記。如圖2中所示,對每個視頻圖像,利用左上角坐標(Ltopx,Ltopy)與右下角坐標(Rtopx, Rtopy),在視頻圖像中疊加如圖2中所示的虛線框,并實時顯示感知區(qū)域的位置。3)存儲感知區(qū)域的當前視頻圖像數(shù)據(jù),初始化感知區(qū)域自適應背景。開辟內(nèi)容 空間,存儲當前感知區(qū)域的視頻圖像數(shù)據(jù);并將首次獲取的感知區(qū)域視頻圖像數(shù)據(jù)用做感知區(qū)域的自適應背景,以完成感知區(qū)域自適應背景的初始化。建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型的具體過程包括以下步驟
I)讀入感知區(qū)域當前視頻圖像數(shù)據(jù),讀入感知區(qū)域自適應背景視頻圖像數(shù)據(jù)。2)初始化感知區(qū)域當前直方圖模型,初始化感知區(qū)域自適應背景直方圖模型。a)定義感知區(qū)域當前直方圖模型,為一單精度浮點型的數(shù)組floathistogramcur[HISTOGRAM_LENGTH] (HIST0GRAM_LENGTH=512)。b)定義感知區(qū)域自適應背景直方圖模型,為一單精度浮點型的數(shù)組floatphistogrammodel [HIST0GRAM_LENGTH] (HIST0GRAM_LENGTH=512)。c)將兩個單精度浮點型的數(shù)組空間清零。3)將感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型劃分為互不重疊的512個區(qū)間。在2)中,已經(jīng)將數(shù)組長度指定為512,則相當于8X8X8種可能,對應于壓縮后的R、G、B的512種可能取值。4)將每個視頻圖像像素的R取值、G取值和B取值,由原來的
取值區(qū)間共256個取值,壓縮至
取值區(qū)間共8個取值。將R值、G值、B值分別除于32,過程如下
R — R / 32
G — G / 32 G — G / 32
5)根據(jù)壓縮后的每個視頻圖像像素新的R取值、G取值和B取值建立感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。
a) 建立感知區(qū)域當前直方圖模型histogramcur [16XR + 8XG +B] — hi stogramcur [16 X R + 8XG + B] +1。b)建立感知區(qū)域自適應背景直方圖模型phistogrammodel [16XR + 8XG +B] — phistogrammodel [16XR + 8XG + B] +1。c)歸一化感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù)的具體過程包括以下步驟
I)輸入已建立的感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。2)利用巴氏相似性計算公式,結合I),算得巴氏相似性系數(shù)。使用巴氏相似性系數(shù)(Bhattacharyya系數(shù))作為相似性函數(shù),其計算公式為
巴氏相似性系數(shù)
權利要求
1.一種基于巴氏相似性的目標視覺感知方法,其特征在于該方法包括如下步驟 步驟(I)根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記; 步驟(2)建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型; 步驟(3)利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù); 步驟(4)用巴氏相似性系數(shù)進行巴氏相似性目標視覺感知; 步驟(5)對感知區(qū)域進行自適應背景更新。
2.根據(jù)權利要求1所述的一種基于巴氏相似性的目標視覺感知方法,其特征在于步驟⑴包括以下步驟 1)利用鼠標選擇矩形框區(qū)域的方式或手工輸入矩形框左上角與右下角Cr,_F)坐標的方式,對場景的感知區(qū)域進行設置; 2)利用I)獲取的矩形框左上角與右下角Cr,_F)坐標,在每幀視頻圖像中對感知區(qū)域進行標記; 3)存儲感知區(qū)域的當前視頻圖像數(shù)據(jù),初始化感知區(qū)域自適應背景。
3.根據(jù)權利要求1所述的一種基于巴氏相似性的目標視覺感知方法,其特征在于步驟(2)的具體過程如下 1)讀入感知區(qū)域當前視頻圖像數(shù)據(jù),讀入感知區(qū)域自適應背景視頻圖像數(shù)據(jù); 2)初始化感知區(qū)域當前直方圖模型,初始化感知區(qū)域自適應背景直方圖模型; 3)將感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型劃分為互不重疊的512個區(qū)間; 4)將每個視頻圖像像素的R取值、G取值和B取值,由原來的[O,255]取值區(qū)間共256個取值,壓縮至[O,7]取值區(qū)間共8個取值; 5)根據(jù)壓縮后的每個視頻圖像像素新的R取值、G取值和B取值建立感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型。
4.根據(jù)權利要求1所述的一種基于巴氏相似性的目標視覺感知方法,其特征在于步驟⑶包括以下步驟 1)輸入已建立的感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型; 2)利用巴氏相似性計算公式,結合I),算得巴氏相似性系數(shù)。
5.根據(jù)權利要求1所述的一種基于巴氏相似性的目標視覺感知方法,其特征在于步驟⑷包括以下步驟 1)如果巴氏相似性系數(shù)大于上閾值Thiot,則上閾值標記1=1,下閾值標記T7=O; 2)如果巴氏相似性系數(shù)低于下閾值Tm,則下閾值標ET7=I; 3)當上閾值標記Ta與下閾值標記T7均等于I時,則感知到目標,否則未感知到目標; 4)當上閾值標記Ta與下閾值標記T7均等于I時,上閾值標記Ta與下閾值標記T7均復位為O。
6.根據(jù)權利要求1所述的一種基于巴氏相似性的目標視覺感知方法,其特征在于步驟(5)包括以下步驟 I)獲得感知區(qū)域的背景差視頻圖像F& ;2)根據(jù)給定的閾值Ta,將背景差視頻圖像Fc6二值化為Fa ; 3)判斷Fa每個像素的取值,如果Fa的某個像素的灰度值為O,則當前感知區(qū)域?qū)c的R、G、B像素值拷貝至感知區(qū)域自適應背景視頻圖像對應點的R、G、B像素值。
全文摘要
本發(fā)明公開了一種基于巴氏相似性的目標視覺感知方法,包括以下步驟(1)根據(jù)輸入的視頻圖像序列,通過手動方式對場景的感知區(qū)域進行設置,并在視頻圖像序列中對感知區(qū)域進行標記;(2)建立感知區(qū)域當前直方圖模型,建立感知區(qū)域自適應背景直方圖模型;(3)利用巴氏相似性計算公式,結合感知區(qū)域當前直方圖模型和感知區(qū)域自適應背景直方圖模型,計算感知區(qū)域直方圖模型巴氏相似性系數(shù);(4)用算得的巴氏相似性系數(shù)進行巴氏相似性目標視覺感知;(5)對感知區(qū)域進行自適應背景更新。本發(fā)明方法不僅適用于視頻監(jiān)控場合,也適用于僅有靜態(tài)圖像傳送的監(jiān)控場合,更加符合人類對目標的視覺感知方式,有著廣泛的應用前景。
文檔編號G06T7/00GK103065316SQ201210582688
公開日2013年4月24日 申請日期2012年12月28日 優(yōu)先權日2012年12月28日
發(fā)明者孫志海, 周文暉, 王云建, 吳以凡, 徐翀 申請人:杭州電子科技大學