基于稀疏表示lbp和hog融合的行人檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于模式識別下的行人檢測領(lǐng)域,具體設(shè)及一種基于稀疏表示LBP和HOG融 合的行人檢測方法。
【背景技術(shù)】
[0002] 行人檢測可定義為:判斷輸入圖片(或視頻帖)是否包含行人,如果有,給出位置信 息.。行人檢測系統(tǒng)(PDS-Pedeshian Detection System)旨在行進(jìn)的汽車上建立一個自 主、智能的行人檢測、智能輔助駕駛系統(tǒng),具有提高駕駛安全性、保障行人生命財(cái)產(chǎn)安全的 重要意義和實(shí)用價值。在行人檢測系統(tǒng)中,通常包括感興趣區(qū)域提取、特征提取、目標(biāo)識別, Ξ個階段。
[0003] 行人檢測通常提取的簡單特征有,目標(biāo)的長寬比、占空比、物體的相對移動速度 等,相對復(fù)雜些的特征有haa;r-l;Lke、hog、sift、shape let、LBP特征。
[0004] 對于行人檢測而言,沒有一個單獨(dú)的特征提取算法的性能優(yōu)于HOG算法。HOG特征 描述了行人目標(biāo)區(qū)域梯度強(qiáng)度和梯度方向的分布情況,能很好地表征行人的外觀和形狀, 而且對光照不敏感。但當(dāng)背景覆蓋凌亂的噪聲邊緣時,冊G處理效果很差。
[0005] 由于單一類型的特征僅能從某一方面刻畫行人特征,描述能力較弱,因此組合應(yīng) 用多種底層特征的越來越具有應(yīng)用價值。LBP紋理特征在圖像處理和模式識別領(lǐng)域是主要 的特征之一,它可W過濾出噪聲,結(jié)合了邊緣/局部形狀信息還有紋理信息,能夠很好的捕 捉到人的外表。且不受背景顏色和光照的影響將冊G特征和紋理特征聯(lián)合起來共同表征行 人,運(yùn)樣在獲取了行人的梯度信息的同時,還獲得了描述行的紋理特征,運(yùn)對復(fù)雜環(huán)境中的 行人檢測有良好的改善效果。
[0006] 但是標(biāo)準(zhǔn)的LBP直方圖大多都是針對圖像中的各個分區(qū)分別計(jì)算的,對于一個普 通大小的分塊區(qū)域,標(biāo)準(zhǔn)LBP算子得到的二進(jìn)制模式數(shù)目較多,而實(shí)際位于該分塊區(qū)域中的 像素?cái)?shù)目去相對較少,運(yùn)將會得到一個過于稀疏的直方圖,從而使直方圖失去統(tǒng)計(jì)意義。
[0007] 多特征融合技術(shù)使得行人檢測的識別率有了進(jìn)一步的提升,但同時過高的維度也 會增加計(jì)算的復(fù)雜度,給后續(xù)的分類問題帶來負(fù)擔(dān)。實(shí)際上維數(shù)過高的特征向量對于分類 性能(識別率)也會造成很多負(fù)面影響。需要進(jìn)一步的對特征進(jìn)行降維等處理。
【發(fā)明內(nèi)容】
[000引本發(fā)明提出了基于稀疏表示LBP和冊G融合的行人檢測的方法,解決單個冊G算法 對行人描述不足的缺點(diǎn)、采用統(tǒng)一化LBP算子解決了傳統(tǒng)LBP直方圖過于稀疏的問題,采用 稀疏表示解決了融合特征中直接將特征融合造成維度過高的問題,在降低維度的同時也提 高了識別率。結(jié)合說明書附圖,本發(fā)明的技術(shù)方案如下:
[0009] -種基于稀疏表示LBP和HOG融合的行人檢測方法,該方法首先利用訓(xùn)練樣本訓(xùn)練 分類器模型,然后利用分類器模型識別檢測樣本,其特征在于:
[0010] 所述利用訓(xùn)練樣本訓(xùn)練分類器模型的具體步驟如下:
[0011] Al:輸入訓(xùn)練樣本組圖片;
[0012] A2:判斷訓(xùn)練樣本組圖片是否為灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0013] A3:提取訓(xùn)練樣本圖片的LBP特征,并進(jìn)行歸一化處理;
[0014] A4:獲得訓(xùn)練樣本組圖片的LBP特征;
[0015] A5:選取歸一化后的K個訓(xùn)練樣本的LBP特征矩陣作為初始矩陣D,利用K-SVD算法 進(jìn)行字典學(xué)習(xí),得到更新后的字典D;
[0016] A6:利用字典D對步驟A4中歸一化的訓(xùn)練樣本組圖片的LBP特征進(jìn)行稀疏表示,得 到稀疏系數(shù);
[0017] A7:提取訓(xùn)練樣本組圖片的冊G特征,獲得供分類使用的特征向量;
[0018] A8:將步驟A7中得到的冊G特征與步驟A6中得到的稀疏系數(shù)進(jìn)行融合,串聯(lián)形成融 合特征向量;
[0019] A9:使用SVM算法訓(xùn)練得出SVM分類器模型,并保存SVM分類器模型;
[0020] 所述利用分類器模型識別檢測樣本的具體步驟如下:
[0021] B1:輸入檢測樣本圖片;
[0022] B2:判斷檢測樣本圖片是否為灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0023] B3:提取檢測樣本圖片的LBP特征,并進(jìn)行歸一化處理;
[0024] B4:利用字典D對歸一化的檢測樣本圖片的LBP特征進(jìn)行稀疏表示,得到稀疏系數(shù); [002引 B5:提取檢測樣本的HOG特征,獲得特征向量;
[0026] B6:將HOG特征向量與稀疏系數(shù)進(jìn)行融合,串聯(lián)形成融合特征向量;
[0027] B7:利用步驟A9中所述的SVM分類器模型對檢測樣本的融合特征進(jìn)行分類,判別檢 測樣本是否為行人;
[00%]所述步驟A3與B3中提取圖片的LBP特征,并進(jìn)行歸一化處理的步驟如下:
[0029] 第一步:圖像分割,將圖像分割為圖像塊;
[0030] 第二步:求取每個圖像塊LBP特征直方圖,針對每塊圖像塊,根據(jù)LBP82算子求取圖 像的紋理特征,得到特征向量,再將特征向量進(jìn)行提取轉(zhuǎn)化;
[0031] 第Ξ步:歸一化直方圖,采用L2-范式
巧得歸一化后向 量,
[0032] 其中:S為待歸一化向量,ε為避免分母為零的常量,為歸一化后的向量;
[003引第四步:獲得單幅圖像LBP特征,得到腺隹LBP向量。
[0034] 所述步驟A4中獲得訓(xùn)練樣本組圖片的LBP特征的具體方法為:使用m個正樣本和η 個負(fù)樣本,將單個圖像形成的Ν維向量形成一行,共得到(m+n)XN維特征向量,其中前m個 LBP特征為正樣本特征,后η個為負(fù)樣本特征。
[0035] 所述步驟Α5中得到字典D的具體步驟為:
[0036] 第一步:選取歸一化后的Κ個行人樣本的LBP特征矩陣作為初始矩陣D;
[0037] 第二步:固定字典D,通過正交匹配追蹤算法確定稀疏矩陣X,且
[0038] 第Ξ步:將j從1循環(huán)至Κ,通過式
[0039]
[0040] 計(jì)算護(hù)^,并對E/j進(jìn)行SVD分解,更新字典D第j列dj;
[0041] 其中,稀疏矩陣X的第j行為χ/j,樣本Y與DX的差異為E,E/徒示去掉原子dj后在所 有樣本中造成的誤差
[0042] 第四步:循環(huán)步驟二和步驟Ξ,直到
最終得到更新后的字典 D。
[0043] 所述步驟A6和B4中稀疏表示的具體步驟為:
[0044] 根據(jù)稀疏表示模型
[0045] Y = DX
[0046] 其中,Y是需要稀疏表示的LBP行人特征,D為步驟A6中得出的字典,X為稀疏系數(shù)。
[0047] 所述步驟A7和B5中提取HOG特征的具體步驟為:
[004引第一步:采用Gamma校正法對輸入圖像進(jìn)行顏色空間的標(biāo)準(zhǔn)化;
[0049] 第二步:計(jì)算圖像每個像素的梯度,包括大小和方向;
[0050] 第Ξ步:將圖像劃分為若干個單元
[0051] 第四步:統(tǒng)計(jì)每個單元的梯度直方圖,即可形成每個單元的特征;
[0052] 第五步:將若干個單元平均劃分組成若干個塊,將每個塊內(nèi)所述有的單元特征串 聯(lián)起來獲得該塊的HOG特征;
[0053] 第六步:將圖像內(nèi)所有的塊的HOG特征串聯(lián)起來得到該圖像的HOG特征,即供分類 使用的特征向量。
[0054] 所述步驟A9中采用LIBSVM算法,用+巧日-1作為類別標(biāo)簽來標(biāo)記由步驟A8得到的行 人檢測的訓(xùn)練數(shù)據(jù),+1標(biāo)記正樣本,-1標(biāo)記負(fù)樣本,將類別標(biāo)簽和訓(xùn)練樣本送入分類器,得 出分類器模型,并保存分類器模型。
[0055] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0056] 1、本發(fā)明使用基于稀疏表示LBP和HOG融合特征來進(jìn)行行人檢測,克服了單一行人 特征描述能力不足的缺點(diǎn);結(jié)合了梯度特征和紋理特征,加強(qiáng)了對圖像邊緣的描述能力,很 好的捕捉到行人的外表,在復(fù)雜背景下的行人檢測獲得了較好的效果。且在背景顏色和光 照較為復(fù)雜的情況下,該算法的融合特征要優(yōu)于HOG特征。
[0057] 本算法使用統(tǒng)一模式的LBP特征,且針對各個分區(qū)圖像進(jìn)行計(jì)算的,克服了統(tǒng)一模 式的LBP特征過于稀疏從而導(dǎo)致失去統(tǒng)計(jì)意義的缺點(diǎn),采用的分區(qū)描述方法加強(qiáng)了對圖像 結(jié)構(gòu)信息的描述。本算法雖然采用融合特征的方法使得識別率獲得了進(jìn)一步的提高,但由 于采用對LBP特征進(jìn)行稀疏表示的方法使得特征維度得到很大降低。大大縮短了檢測的時 間,并且提高了魯棒性,由于采用稀疏表示的方法,使得在行人遮擋的情況下檢測效果較 好。
【附圖說明】
[005引圖1為本發(fā)明中利用訓(xùn)練樣本訓(xùn)練分類器模型的過程框圖;
[0059]圖2為本發(fā)明中利用分類器模型識別檢測樣本的過程框圖
[0060] 圖3為本發(fā)明與HOG+SVM行人檢測方法的實(shí)驗(yàn)效果對比圖。
【具體實(shí)施方式】
[0061] 為了進(jìn)一步闡述本發(fā)明的技術(shù)方案,結(jié)合說明書附圖,本發(fā)明的【具體實(shí)施方式】如 下:
[0062] 本發(fā)明公開了一種基于稀疏表示LBP和冊G融合的行人檢測方法,該方法首先利用 訓(xùn)練樣本訓(xùn)練分類器模型,然后利用分類器模型識別檢測樣本。其中:
[0063] 如圖1所示,利用訓(xùn)練樣本訓(xùn)練分類器模型的具體步驟如下:
[0064] A1 :輸入訓(xùn)練樣本組圖片Itrain;
[0065] A2:由于LBP特征的提取過程是基于灰度圖像的,所W判斷訓(xùn)練樣本組圖片是否為 灰度圖像,若不是,將其轉(zhuǎn)化為灰度圖像;
[0066] A3:提取訓(xùn)練樣本圖片的LBP特征,并進(jìn)行歸一化處理;具體步驟如下:
[0067] 第一步:圖像分割,本實(shí)施例中采用的圖像尺寸為128X64,將其按照8X8的尺寸 分割,分割為128個圖像塊;
[0068] 第二步:求取每個圖像塊LBP特征直方圖,針對每塊8 X 8的圖像,根據(jù)LBP82算子求 取圖像的紋理特征,得到256維特征向量,再將256維特征向量轉(zhuǎn)化為59維特征向量;
[0069] 第Ξ步:歸一化直方圖,為了提高特征向量的魯棒性,克服一些噪聲的干擾,同HOG 特征類似,需要對提取的59維特征向量按塊進(jìn)行歸一化操作。根據(jù)實(shí)驗(yàn)對比各種歸一化因 子,最終采用L2-范式化2-norm)歸一化因子取得的效果最好。
[0070] L2-范式為:
[0071]
C1)
[0072] 其中:S為待歸一化向量,ε為一個很小的常亮值用來避免分母為零,s/為歸一化后 的向量;
[0073] 第四步:獲得單幅圖像LBP特征,本實(shí)施例圖像為64X128,檢測窗口分為128個單 元(ce 11 ),每個ce 11的特征向量為59維,最終得到7552維的LBP特征向量。
[0074] A4:獲得訓(xùn)練樣本組圖片的LBP特征;
[0075] 本實(shí)施例中使用820個正樣本和820個負(fù)樣本,將單個圖像形成的7552向量形成一 行,共得到1640 X 7552維特征向量,其中前820個LBP特征為正樣本特征,后820個位負(fù)樣本 特征。
[0076] A5:選取歸一化后的K個訓(xùn)練樣本的LBP特征矩陣作為初始矩陣D,利用K-SVD算法 進(jìn)行字典學(xué)習(xí),得到字典D;具體步驟如下:
[0077] 第一步:選取歸一化后的K個行人樣本的LBP特征矩陣作為初始矩陣D;
[0078] 第二步:固定字典D,通過正交匹配追蹤(0