1.一種基于區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)的人體目標(biāo)檢測(cè)方法,其特征在于,包括以下步驟:
(1)、采集不同監(jiān)控場(chǎng)景、不同角度的人體目標(biāo)圖像,然后對(duì)于每一張采集的人體目標(biāo)圖像,標(biāo)定人體目標(biāo)上半身的所在位置作為人體目標(biāo)的標(biāo)定框,標(biāo)定了人體目標(biāo)標(biāo)定框的人體目標(biāo)圖像構(gòu)成訓(xùn)練;
人體目標(biāo)圖像不僅包含單一人體目標(biāo)的簡(jiǎn)單場(chǎng)景,也包含一些遮擋較為嚴(yán)重,人員數(shù)量較多的復(fù)雜情景;
(2)、設(shè)置五個(gè)不同的圖像尺度,對(duì)于訓(xùn)練集中的每一幅人體目標(biāo)圖像,隨機(jī)選擇一個(gè)圖像尺度,將人體目標(biāo)圖像的短邊縮放到該尺度下之后輸入到殘差網(wǎng)絡(luò)(Residual Network)進(jìn)行卷積運(yùn)算,得到卷積特征;
(3)、將卷積特征輸入到區(qū)域候選網(wǎng)絡(luò)(Region Proposal Network,簡(jiǎn)稱RPN),生成區(qū)域候選框;其中,生成區(qū)域候選框時(shí)所需錨(anchors),選用{0.8,1.2}兩個(gè)不同比例的寬高比和{48,96,144,192,240}五個(gè)不同比例尺度作為生成anchors的規(guī)則;
(4)、根據(jù)卷積特征、區(qū)域候選框,計(jì)算位置敏感得分圖,得到區(qū)域候選框?yàn)檎蜻x框的概率Si以及負(fù)候選框的概率Sj;同時(shí),根據(jù)人體目標(biāo)標(biāo)定框,得到區(qū)域候選框的真實(shí)類別概率S;其中,區(qū)域候選框與真實(shí)的人體目標(biāo)標(biāo)定框的交并比大于等于0.5時(shí),判定區(qū)域候選框?yàn)檎蜻x框樣本,真實(shí)類別概率S為1;當(dāng)候選框與真實(shí)的人體目標(biāo)標(biāo)定框的交并比小于0.5時(shí),判定區(qū)域候選框?yàn)樨?fù)候選框樣本,真實(shí)類別概率S為0;
(5)、采用區(qū)域候選框的交叉熵?fù)p失值作為區(qū)域候選框的分類損失值Lcls,其具體計(jì)算公式如下:
采用區(qū)域候選框的一階平滑損失值作為區(qū)域候選框的回歸損失值Lreg,其具體計(jì)算公式如下:
Lreg=smoothL1(x*-x)+smoothL1(y*-y)+smoothL1(w*-w)+smoothL1(h*-h) (2),
其中,x和y表示區(qū)域候選框的左上位置坐標(biāo),w和h分別表示區(qū)域候選框的寬和高,x*和y*表示真實(shí)的人體目標(biāo)標(biāo)定框的左上位置坐標(biāo);
其中,一階平滑函數(shù)smoothL1計(jì)算公式下:
其中,σ根據(jù)具體監(jiān)控場(chǎng)景確定,一般取3.0,z為公式(2)中括號(hào)內(nèi)的差值;
(6)、對(duì)于每一個(gè)區(qū)域候選框,計(jì)算出其損失值,其計(jì)算公式如下:
其中,λ是分類損失與回歸損失之間的平衡因子;
(6)、對(duì)人體目標(biāo)圖像,根據(jù)步驟(4)、(5),得到每一個(gè)區(qū)域候選框計(jì)算損失值,將區(qū)域候選框損失值進(jìn)行排序,選擇損失值最大的前B個(gè)區(qū)域候選框作為難例樣本,然后將這些難例樣本的損失值,反饋到區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)模型中,使用隨機(jī)梯度下降法更新區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù);
(7)、對(duì)于每一幅人體目標(biāo)圖像,根據(jù)步驟(2)~(6)不斷更新區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)的參數(shù),從而得到人體目標(biāo)檢測(cè)的區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)模型,用于監(jiān)控場(chǎng)景下采集的圖像的人體目標(biāo)檢測(cè)。