本發(fā)明涉及圖像處理和計(jì)算機(jī)視覺領(lǐng)域,特別是涉及一種基于深度信息的人體檢測(cè)窗口快速提取方法。
背景技術(shù):
人體檢測(cè)技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向,有著廣泛的應(yīng)用前景。在智能監(jiān)控、輔助駕駛、人機(jī)交互等領(lǐng)域,其智能化程度都與人體檢測(cè)技術(shù)的發(fā)展密切相關(guān)。而人體檢測(cè)窗口的提取是人體檢測(cè)技術(shù)中一個(gè)非常重要的步驟,檢測(cè)窗口提取的準(zhǔn)確性和所需時(shí)間對(duì)整個(gè)人體檢測(cè)的準(zhǔn)確性和響應(yīng)時(shí)間有很大的影響。
在實(shí)際人體檢測(cè)過程中,人體可能會(huì)以各種姿態(tài)出現(xiàn)在圖像中的任意位置,并且,由于成像時(shí)距離相機(jī)的遠(yuǎn)近不一,人體在圖像中的大小也不盡相同。檢測(cè)時(shí),為了不漏掉圖像中任何一個(gè)人體目標(biāo),需要在圖像所有位置考慮人體出現(xiàn)的可能性。經(jīng)典的人體檢測(cè)算法使用圖像尺度空間搜索方法解決這個(gè)問題。圖像尺度空間搜索方法對(duì)圖像做不同尺度的縮放,并以等距為步長(zhǎng),采用固定大小的窗口在每層圖像上滑動(dòng),從而得到一系列的檢測(cè)窗口,在每個(gè)窗口上進(jìn)行人體特征的提取與分類。圖像尺度空間搜索方法兼顧了圖像上人體的大小和位置的不確定性,最大程度上降低了漏檢率。但是,在搜索過程中會(huì)產(chǎn)生大量檢測(cè)窗口,后續(xù)的檢測(cè)操作將對(duì)每個(gè)檢測(cè)窗口都進(jìn)行特征提取與分類等運(yùn)算,其計(jì)算代價(jià)很大。
因此,當(dāng)前需要一種基于深度信息的快速提取人體檢測(cè)窗口的技術(shù)方案來解決上述問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于深度信息的人體檢測(cè)窗口快速提取方法,解決傳統(tǒng)人體檢測(cè)技術(shù)中的圖像尺度空間搜索方法需要對(duì)人體目標(biāo)可能出現(xiàn)的位置進(jìn)行窮舉,產(chǎn)生大量檢測(cè)窗口,導(dǎo)致整個(gè)人體檢測(cè)過程成本高、效率低的問題。
為了解決上述問題,本發(fā)明提供了一種基于深度信息的人體檢測(cè)窗口快速提取方法,將圖像中的深度信息加入到人體檢測(cè)窗口提取中,并計(jì)算其深度頻率的極值,從而實(shí)現(xiàn)人體檢測(cè)窗口的快速提取,包括以下步驟:包括:
1)對(duì)待檢測(cè)深度圖像中像素的深度值進(jìn)行頻率統(tǒng)計(jì),計(jì)算深度值的頻率極值,并根據(jù)得到的頻率極值對(duì)應(yīng)的深度值,提取該待檢測(cè)深度圖像的多個(gè)區(qū)域;
2)根據(jù)得到的深度圖區(qū)域,采用自適應(yīng)深度圖像分層方法,分別計(jì)算得到各區(qū)域中地面和天花板與其它區(qū)域的分界線,從而計(jì)算區(qū)域中不屬于地面和天花板的區(qū)域的幾何中心,作為該深度圖區(qū)域的中心位置;
3)根據(jù)得到的各深度圖區(qū)域中心位置的深度值和所建立的人體深度值與人體成像高度的關(guān)系,計(jì)算得到各檢測(cè)窗口的高度,將檢測(cè)窗口高度的一半作為其寬度,從而得到各檢測(cè)窗口的尺寸;
4)根據(jù)得到的各深度圖區(qū)域的中心位置和所述檢測(cè)窗口的尺寸信息,完成對(duì)多個(gè)人體檢測(cè)窗口的提取。
作為優(yōu)選,步驟1)為:首先,計(jì)算待檢測(cè)深度圖像中像素深度值的頻率極值,需要從得到的深度值頻率極大值中篩選出大物體最可能對(duì)應(yīng)的深度值頻率;然后,對(duì)每個(gè)篩選后的頻率極值對(duì)應(yīng)的深度值,取待檢測(cè)深度圖上所有深度值在該深度值附近的像素點(diǎn)組成不同的區(qū)域。
作為優(yōu)選,步驟2)具體為:
2.1)依次對(duì)每個(gè)得到的深度圖區(qū)域,從深度圖中隨機(jī)選取一列,分別從該列最下方元素向上遍歷,以及從該列最上方元素向下遍歷,在遍歷過程中分別記錄第一個(gè)深度值在該區(qū)域深度值附近的像素點(diǎn)的y軸坐標(biāo);
2.2)重復(fù)m次上述步驟,在向上和向下兩個(gè)方向上分別得到了m個(gè)y軸坐標(biāo)值,分別對(duì)兩列坐標(biāo)值排序,然后選取中間s個(gè)值,計(jì)算其均值,將其均值分別作為該區(qū)域中地面和天花板與其他區(qū)域的分界線。
2.3)依次遍歷該區(qū)域中的像素點(diǎn),記錄其y軸坐標(biāo)在天花板和地面與其他區(qū)域的分界線間的像素點(diǎn),將這些像素點(diǎn)的橫坐標(biāo)均值和縱坐標(biāo)均值,作為該深度圖區(qū)域中心的坐標(biāo)。
作為優(yōu)選,步驟2)具體為:
依次對(duì)得到的深度圖區(qū)域,從深度圖中隨機(jī)選取一列,分別從該列最下方元素向上遍歷,以及從該列最上方元素向下遍歷;
在向上和向下遍歷過程中分別記錄第一個(gè)滿足
如果沒有找到滿足上述條件的像素點(diǎn)p,則分別記錄該列上深度值最大的像素點(diǎn)的y軸坐標(biāo)值;
重復(fù)m次上述步驟,在向上和向下兩個(gè)方向上分別得到m個(gè)y軸坐標(biāo)值,記為
分別對(duì)兩列坐標(biāo)值從小到大進(jìn)行排序,然后選取中間的s個(gè)值,計(jì)算其均值,將其均值分別作為該區(qū)域中地面和天花板與其他區(qū)域的分界線
依次遍歷該區(qū)域中的像素點(diǎn),記錄其y軸坐標(biāo)在天花板和地面與其他區(qū)域的分界線間的像素點(diǎn),將這些像素點(diǎn)的橫坐標(biāo)均值和縱坐標(biāo)均值,作為該深度圖區(qū)域中心的坐標(biāo)。
本發(fā)明提供了一種基于深度信息的人體檢測(cè)窗口快速提取方法。該方法計(jì)算待檢測(cè)深度圖像中深度值的頻率極值,通過頻率極值對(duì)應(yīng)深度值區(qū)域的幾何中心確定檢測(cè)窗口候選位置的中心,并進(jìn)一步基于深度值和人體高度間的關(guān)系,確定檢測(cè)窗口的尺寸,從而完成快速提取一系列人體檢測(cè)窗口。本發(fā)明提供的自適應(yīng)圖像分層算法,能有效解決檢測(cè)窗口中心漂移的問題,對(duì)檢測(cè)窗口中心的計(jì)算過程自動(dòng)進(jìn)行糾正。應(yīng)用本發(fā)明,解決了傳統(tǒng)人體檢測(cè)技術(shù)中的圖像尺度空間搜索方法需要對(duì)人體目標(biāo)可能出現(xiàn)的位置進(jìn)行窮舉的問題。應(yīng)用本發(fā)明不僅能大大減少人體檢測(cè)過程生成檢測(cè)窗口的數(shù)量,縮短檢測(cè)消耗時(shí)間,并且準(zhǔn)確率較高,能夠提高人體檢測(cè)的效率。
附圖說明
圖1是本發(fā)明基于深度信息的人體檢測(cè)窗口快速提取方法的流程圖。
圖2是本發(fā)明基于深度信息的自適應(yīng)深度圖像分層方法操作示例。
具體實(shí)施方式
本發(fā)明提供了一種基于深度信息的人體檢測(cè)窗口快速提取方法。該方法計(jì)算待檢測(cè)深度圖像中深度值的頻率極值,通過頻率極值對(duì)應(yīng)深度值區(qū)域的幾何中心確定檢測(cè)窗口候選位置的中心,并進(jìn)一步基于深度值和人體高度間的關(guān)系,確定檢測(cè)窗口的尺寸,從而完成快速提取一系列人體檢測(cè)窗口。本發(fā)明適用于基于深度信息的人體檢測(cè)窗口提取,減少人體檢測(cè)過程生成檢測(cè)窗口的數(shù)量,縮短檢測(cè)消耗時(shí)間,并且準(zhǔn)確率較高,能夠提高人體檢測(cè)的效率。
如圖1所示,本發(fā)明包括以下步驟:
1)在對(duì)kinect深度圖進(jìn)行人體檢測(cè)前,為了提高kinect深度圖對(duì)實(shí)際距離描述的準(zhǔn)確性,對(duì)深度圖進(jìn)行校正;
2)對(duì)待檢測(cè)深度圖像中像素的深度值進(jìn)行頻率統(tǒng)計(jì),計(jì)算深度值的頻率極值,并根據(jù)得到的頻率極值對(duì)應(yīng)的深度值,提取該待檢測(cè)深度圖像的多個(gè)區(qū)域;
2.1)深度圖中的物體成像面積與其對(duì)應(yīng)的深度值頻率大小成正比關(guān)系。所以,深度值頻率較高的位置有很大可能性是大物體或者背景區(qū)域??紤]到一般場(chǎng)景中,人體在可辨識(shí)的情況下,都可以算作是成像面積較大的物體,其對(duì)應(yīng)的深度值的出現(xiàn)頻率也會(huì)相對(duì)高些?;谶@一特性,本發(fā)明提出一種基于深度信息的人體檢測(cè)窗口快速提取方法,將待檢測(cè)圖像中深度值頻率極大值對(duì)應(yīng)的區(qū)域作為人體檢測(cè)的候選區(qū)域。
首先,對(duì)待檢測(cè)深度圖像中像素的深度值進(jìn)行頻率統(tǒng)計(jì),然后,計(jì)算深度值頻率的極大值,最后,從深度值頻率的極大值中篩選出大物體最可能對(duì)應(yīng)的深度值頻率。
2.2)分別對(duì)每個(gè)篩選后得到的頻率極值對(duì)應(yīng)的深度值,從待檢測(cè)深度圖上選取所有深度值在該深度值附近的像素點(diǎn)組成不同的區(qū)域。
3)根據(jù)得到的深度圖區(qū)域,采用自適應(yīng)深度圖像分層方法,分別計(jì)算得到各區(qū)域中地面和天花板與其它區(qū)域的分界線,從而計(jì)算區(qū)域中不屬于地面和天花板的區(qū)域的幾何中心,作為該深度圖區(qū)域的中心位置;
計(jì)算深度圖區(qū)域的中心位置的具體步驟為:
3.1)依次對(duì)每個(gè)得到的深度圖區(qū)域,從深度圖中隨機(jī)選取一列,分別從該列最下方元素向上遍歷,以及從該列最上方元素向下遍歷;
3.2)在向上和向下遍歷過程中分別記錄第一個(gè)深度值在該區(qū)域深度值附近的像素點(diǎn)的y軸坐標(biāo);
3.3)重復(fù)m次上述步驟,在向上和向下兩個(gè)方向上分別得到m個(gè)y軸坐標(biāo)值;
3.4)分別對(duì)兩列坐標(biāo)值從小到大進(jìn)行排序,然后選取中間的s個(gè)值,計(jì)算其均值,將其均值分別作為該區(qū)域中地面和天花板與其他區(qū)域的分界線。
3.5)依次遍歷該區(qū)域中的像素點(diǎn),記錄其y軸坐標(biāo)在天花板和地面與其他區(qū)域的分界線間的像素點(diǎn),將這些像素點(diǎn)的橫坐標(biāo)均值和縱坐標(biāo)均值,作為該深度圖區(qū)域中心的坐標(biāo)。
4)根據(jù)得到的各深度圖區(qū)域中心位置的深度值和所建立的人體深度值與人體成像高度的關(guān)系,計(jì)算得到各檢測(cè)窗口的高度,將檢測(cè)窗口高度的一半作為其寬度,從而得到各檢測(cè)窗口的尺寸;
計(jì)算個(gè)檢測(cè)窗口的具體步驟為:
4.1)根據(jù)得到的各深度圖區(qū)域中心位置的深度值和所建立的人體深度值與人體成像高度的關(guān)系,計(jì)算得到各檢測(cè)窗口的高度;
4.2)將檢測(cè)窗口高度的一半作為其寬度,從而得到各檢測(cè)窗口的尺寸。
5)根據(jù)得到的各深度圖區(qū)域的中心位置和所述檢測(cè)窗口的尺寸信息,完成對(duì)多個(gè)人體檢測(cè)窗口的提取。
本發(fā)明在計(jì)算機(jī)視覺領(lǐng)域有著廣泛的應(yīng)用,例如:智能監(jiān)控、輔助駕駛、人機(jī)交互等等。如圖2所示,對(duì)本發(fā)明進(jìn)行詳盡的描述。
1)為了提高kinect深度圖對(duì)實(shí)際距離描述的準(zhǔn)確性,對(duì)深度圖進(jìn)行校正;
2)對(duì)待檢測(cè)深度圖像中像素的深度值進(jìn)行頻率統(tǒng)計(jì),并計(jì)算深度值頻率的極大值;
3)設(shè)計(jì)算得到n個(gè)深度值頻率的極大值,給定頻率閾值為tf,對(duì)n個(gè)深度值頻率的極大值frequencyi(i=2,3,...,n-1)依次判斷:如果
4)分別對(duì)每個(gè)篩選后得到的頻率極值對(duì)應(yīng)的深度值di,從待檢測(cè)深度圖上選取所有滿足|dp-di|<6的像素點(diǎn)組成不同的區(qū)域,其中,dp表示像素點(diǎn)p的深度值,并將di作為該區(qū)域的深度值;
5)依次對(duì)得到的深度圖區(qū)域,采用自適應(yīng)深度圖像分層方法,分別計(jì)算其中心位置。
5.1)依次對(duì)得到的深度圖區(qū)域,從深度圖中隨機(jī)選取一列,分別從該列最下方元素向上遍歷,以及從該列最上方元素向下遍歷;
5.2)在向上和向下遍歷過程中分別記錄第一個(gè)滿足
5.3)如果沒有找到滿足上述條件的像素點(diǎn)p,則分別記錄該列上深度值最大的像素點(diǎn)的y軸坐標(biāo)值;
5.4)重復(fù)m次5.1)至5.3)步驟,在向上和向下兩個(gè)方向上分別得到m個(gè)y軸坐標(biāo)值,記為
5.5)分別對(duì)兩列坐標(biāo)值從小到大進(jìn)行排序,然后選取中間的s個(gè)值,計(jì)算其均值,將其均值分別作為該區(qū)域中地面和天花板與其他區(qū)域的分界線
5.6)依次遍歷該區(qū)域中的像素點(diǎn),記錄其y軸坐標(biāo)在天花板和地面與其他區(qū)域的分界線間的像素點(diǎn),將這些像素點(diǎn)的橫坐標(biāo)均值和縱坐標(biāo)均值,作為該深度圖區(qū)域中心的坐標(biāo);
5.7)為了提高后續(xù)人體檢測(cè)的查全率,以四個(gè)像素為偏移步長(zhǎng),在每個(gè)求得的中心附近再取八個(gè)點(diǎn),將它們也看作對(duì)應(yīng)區(qū)域的中心點(diǎn)。
6)根據(jù)得到的各深度圖區(qū)域中心位置的深度值和所建立的人體深度值與人體成像高度的關(guān)系,計(jì)算得到各檢測(cè)窗口的高度,將檢測(cè)窗口高度的一半作為其寬度,從而得到各檢測(cè)窗口的尺寸;
7)根據(jù)得到的各深度圖區(qū)域的中心位置和所述檢測(cè)窗口的尺寸信息,完成對(duì)多個(gè)人體檢測(cè)窗口的提取。
本發(fā)明提供了一種基于深度信息的人體檢測(cè)窗口快速提取方法,適用于基于深度信息的人體檢測(cè)窗口提取,減少人體檢測(cè)過程生成檢測(cè)窗口的數(shù)量,縮短檢測(cè)消耗時(shí)間,并且準(zhǔn)確率較高,能夠提高人體檢測(cè)的效率。