本發(fā)明的技術(shù)方案涉及圖像數(shù)據(jù)處理中的圖像識(shí)別方法,具體地說是基于特征融合的奶牛個(gè)體識(shí)別方法。
背景技術(shù):
互聯(lián)網(wǎng)的興起使得現(xiàn)今各行業(yè)逐漸朝著工業(yè)化、智能化發(fā)展,其中奶業(yè)發(fā)展是農(nóng)業(yè)發(fā)展中國(guó)家十分關(guān)注的問題。農(nóng)業(yè)現(xiàn)代化步伐不斷加快,規(guī)模化、信息化奶牛養(yǎng)殖場(chǎng)得到了廣泛應(yīng)用,我國(guó)已基本形成高密度、集中化的奶牛養(yǎng)殖體系。視頻分析技術(shù)已越來越多的應(yīng)用于檢測(cè)奶牛行為以給出養(yǎng)殖管理決策,基于圖像處理的奶牛個(gè)體身份識(shí)別算法能夠進(jìn)一步提高奶牛行為視頻分析的自動(dòng)化程度。個(gè)體識(shí)別作為奶牛信息化管理的基礎(chǔ),成為當(dāng)前畜牧業(yè)發(fā)展的一個(gè)研究熱點(diǎn)。因此迫切需要一種基于圖像處理的高精度自動(dòng)奶牛個(gè)體識(shí)別方法,以提高行為檢測(cè)的自動(dòng)化程度并使得成本不是太高,進(jìn)一步提高視頻分析技術(shù)在奶牛行為感知領(lǐng)域的重大實(shí)用性。
早期針對(duì)奶牛個(gè)體識(shí)別問題主要采取人工觀察方式,但該方法受主觀影響大、標(biāo)準(zhǔn)不統(tǒng)一,誤識(shí)別率很高;之后發(fā)展為采用標(biāo)簽識(shí)別的方法,分別為每頭奶牛耳朵上佩戴唯一的標(biāo)識(shí)號(hào)碼,但是依然存在人工量大、工作繁瑣的缺點(diǎn),此外,標(biāo)簽容易破損、對(duì)奶牛造成了過多日常干擾,可能降低奶牛產(chǎn)奶量,從而影響牛場(chǎng)的經(jīng)濟(jì)效益。目前畜牧業(yè)比較流行的無(wú)線射頻識(shí)別技術(shù)(rfid),但該方法無(wú)法實(shí)現(xiàn)遠(yuǎn)距離識(shí)別,同時(shí)精密度和成本比較高。隨著計(jì)算機(jī)視覺的發(fā)展,結(jié)合奶牛特有的黑白條紋信息,應(yīng)用圖像處理算法實(shí)現(xiàn)奶牛個(gè)體識(shí)別逐步引起國(guó)內(nèi)外相關(guān)學(xué)者的關(guān)注。ahmeds等人在ieee計(jì)算機(jī)學(xué)會(huì)上發(fā)表的《muzzle-basedcattleidentificationusingspeeduprobustfeatureapproach》論文中提出了運(yùn)用加速魯棒特征算子(surf)提取奶牛嘴部紋理特征點(diǎn),然后應(yīng)用支持向量機(jī)(svm)分類器對(duì)奶牛個(gè)體進(jìn)行分類識(shí)別的方法,但是該方法對(duì)于采集數(shù)據(jù)的位置比較敏感,奶牛嘴部數(shù)據(jù)獲取具有一定的難度。cn105260750a公開了一種奶牛個(gè)體識(shí)別方法,該方法通過將捕捉到的奶牛實(shí)時(shí)圖像與事先建立好的模板圖像庫(kù)進(jìn)行匹配,將能夠成功匹配的模板庫(kù)中的奶牛個(gè)體的標(biāo)簽作為待識(shí)別奶牛的類別,但是該方法效率較低,每次匹配過程需要遍歷模板的數(shù)量可能很大。kim等人發(fā)表的《recognitionofindividualholsteincattlebyimagingbodypatterns》論文中設(shè)計(jì)了一個(gè)基于奶牛身體圖像特征的計(jì)算機(jī)圖像系統(tǒng)以識(shí)別奶牛個(gè)體,該系統(tǒng)使用純色背景,提取奶牛的身體區(qū)域圖像,二值化后對(duì)圖像進(jìn)行分塊處理得到100個(gè)特征值,構(gòu)建100*16*8結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),用49幅圖像訓(xùn)練網(wǎng)絡(luò),10幅圖像測(cè)試網(wǎng)絡(luò)性能,雖然該方法證明識(shí)別奶牛是可行的,但是構(gòu)建的神經(jīng)網(wǎng)絡(luò)結(jié)點(diǎn)數(shù)眾多,訓(xùn)練樣本少,易產(chǎn)生多學(xué)習(xí),系統(tǒng)對(duì)于環(huán)境光變化、圖像平移與畸變的魯棒性低。圖像距離量度法和尺度不變特征匹配算法(sift)可用于奶牛個(gè)體身份識(shí)別,但是圖像距離量度法依賴于圖像的特征提取,對(duì)光線變化較為敏感,不適合于露天養(yǎng)殖的奶牛,在有前景遮擋的情況下,sift方法匹配準(zhǔn)確率會(huì)受到影響。cn201710000628.5公開了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的奶牛個(gè)體識(shí)別方法,是針對(duì)奶牛的紋理特征進(jìn)行的奶牛個(gè)體識(shí)別,該方法模型參數(shù)設(shè)置需要較高的技巧性,需要反復(fù)實(shí)驗(yàn)進(jìn)行訓(xùn)練和測(cè)試,并沒有統(tǒng)一參照的標(biāo)準(zhǔn),模型的建立較困難。cn201710269440.0公開了一種奶牛個(gè)體識(shí)別的方法,是針對(duì)奶牛黑白花紋的形狀及分布進(jìn)行的奶牛個(gè)體識(shí)別,該方法存在旋轉(zhuǎn)魯棒性差、易受光照影響、噪聲大的缺陷。
雖然我國(guó)在借鑒國(guó)外先進(jìn)技術(shù)的基礎(chǔ)上也在畜牧業(yè)取得了一些成績(jī),但是目前研究都是針對(duì)農(nóng)業(yè)養(yǎng)殖過程中的管理自動(dòng)化研究,只是根據(jù)奶牛的某些特征進(jìn)行聚類分析,分類識(shí)別尚不是很好,對(duì)于最直觀的視覺信息應(yīng)用的少,故需要提供一種在奶牛的實(shí)際養(yǎng)殖環(huán)境下,基于圖像處理的非接觸、低成本尤其針對(duì)奶牛個(gè)體特點(diǎn)的奶牛個(gè)體識(shí)別方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是:提出基于特征融合的奶牛個(gè)體識(shí)別方法,是應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提取和主成分分析方法結(jié)合使用進(jìn)行奶牛個(gè)體識(shí)別的方法,克服了早先奶牛個(gè)體識(shí)別技術(shù)中旋轉(zhuǎn)魯棒性差、易受光照影響、噪聲大的缺陷。
lbp-hog算法的中文含義是局部二值模式與方向梯度直方圖融合算法。
本發(fā)明解決該技術(shù)問題所采用的技術(shù)方案是:基于特征融合的奶牛個(gè)體識(shí)別方法,是應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提取和主成分分析方法結(jié)合使用進(jìn)行奶牛個(gè)體識(shí)別的方法,進(jìn)一步說是依據(jù)不同奶牛個(gè)體頭部的鼻鏡和額部位存在明顯差異的特點(diǎn),使用改進(jìn)的hog進(jìn)行邊緣特征提取,得到奶牛頭部的輪廓特征,與之后lbp局部紋理特征提取進(jìn)行特征融合,再與主成分分析方法結(jié)合使用進(jìn)行奶牛個(gè)體識(shí)別,具體步驟如下:
第一步,奶牛視頻數(shù)據(jù)采集:
初始數(shù)據(jù)采用奶牛頭部視頻,視頻采集自一個(gè)規(guī)范奶牛養(yǎng)殖場(chǎng)數(shù)量>300頭的奶牛頭部視頻,應(yīng)用攝像設(shè)備錄制,視頻采集時(shí)間集中在奶牛進(jìn)食階段,每次錄制20頭奶牛,每頭奶牛錄制時(shí)間為1分鐘,幀速29幀/s,分別采集每頭奶牛的抬頭、偏頭、低頭和進(jìn)食這幾種狀態(tài),包含了奶牛頭部的鼻鏡和額部位差異明顯的特點(diǎn),至此完成奶牛視頻數(shù)據(jù)采集;
第二步,視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理:
分別將上述第一步采集的20頭奶牛頭部的視頻數(shù)據(jù)轉(zhuǎn)化成圖片序列,初始圖片大小為1920×1080像素,將彩色圖片序列轉(zhuǎn)為灰度圖像,并使用photoshop軟件的批量處理功能截取奶牛頭部圖像,然后通過高通濾波處理原圖像,使模糊的圖像更清晰,圖像邊緣紋理增強(qiáng),最后將圖片進(jìn)行尺寸歸一化到128*128,并將20頭奶牛從1到20編號(hào),表示20個(gè)待識(shí)別的不同個(gè)體,每頭奶牛保留1000張有效圖片,至此完成視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理;
第三步,應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提?。?/p>
(3.1)求得圖像的特征向量h1=[h11,h12,h13]:
設(shè)上述第二步得到的圖片的圖像中某個(gè)3*3局部區(qū)域的任意像素為f(xa,ya),其中心像素點(diǎn)為ga,根據(jù)lbp編碼得到圖像的紋理特征t(xa,ya);對(duì)窗口的鄰域像素值進(jìn)行二值化處理,得到圖像的紋理特征t(xb,yb),計(jì)算過程如下式(1)所示:
式(1)中,g0、g1……g7為鄰域像素值,t(xb,yb)為圖像的紋理信息,s(x)是鄰域像素進(jìn)行二值化處理后的值,通過比較t(xa,ya)、t(xb,yb),得到改進(jìn)后的lbp編碼為t(xc,yc),計(jì)算過程如下式(2)所示:
對(duì)像素的不同位置進(jìn)行加權(quán)求和,得圖像的lbp值為lbp(xc,yc),計(jì)算過程如下式(3)所示:
將lbp值lbp(xc,yc)與循環(huán)移動(dòng)后的一位進(jìn)行位“與”操作,計(jì)算二進(jìn)制為1的個(gè)數(shù),標(biāo)記小于等于2的為等價(jià)模式,其余的為混合模式,選擇等價(jià)模式中l(wèi)bp值lbp(xc,yc)最小的為等價(jià)模式中的代表值,更新lbp值lbp(xc,yc);最后將lbp特征譜以6*6子窗口掃描整個(gè)圖像,得到直方圖h11,在以4*4子窗口掃描整個(gè)圖像,得到直方圖h12,最后以2*2子窗口掃描整個(gè)圖像,得到直方圖h13,將不同尺度下的lbp直方圖級(jí)聯(lián)起來得到圖像的特征向量h1=[h11,h12,h13];
(3.2)求得改進(jìn)lbp-hog算法的特征向量h:
用[-1,0,1]梯度算子對(duì)原圖像做卷積運(yùn)算,得到x方向的梯度分量gx(x,y),用[-1,0,1]t梯度算子對(duì)原圖像做卷積運(yùn)算,得到y(tǒng)方向的梯度分量gy(x,y),再用公式(4)計(jì)算該像素點(diǎn)的梯度大小,用如下式(5)計(jì)算該像素點(diǎn)的梯度方向:
式(4)中g(shù)(x,y)是像素點(diǎn)的梯度大小,式(5)中α(x,y)是像素點(diǎn)的梯度方向;
把[0,2π]的梯度方向劃分成9個(gè)區(qū)間,計(jì)算每個(gè)像素點(diǎn)在不同區(qū)間的梯度幅值,將圖像分割成cell單元,根據(jù)梯度方向和梯度幅值求得每個(gè)單元的梯度方向直方圖,即每個(gè)單元的梯度累加和;然后將多個(gè)臨近的cell組合成block,求得梯度方向直方圖向量并對(duì)其進(jìn)行l(wèi)2-norm歸一化操作,最后block相連得到圖像的hog特征向量h2,通過級(jí)聯(lián)特征向量h1、h2得到改進(jìn)lbp-hog算法的特征向量h;
至此完成應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提??;
第四步,應(yīng)用主成分分析方法進(jìn)行特征降維:
通過princomp函數(shù)初步求得特征向量、訓(xùn)練集數(shù)組和特征值數(shù)組,通過以下公式(6)計(jì)算特征值的累計(jì)貢獻(xiàn)率,選擇前95%的特征值對(duì)應(yīng)的特征向量,通過以下公式(7)得到最終訓(xùn)練集數(shù)組、測(cè)試集數(shù)組:
式(6)中,latent為特征值數(shù)組,α為每個(gè)特征值的貢獻(xiàn)率,α(n)為第n個(gè)特征值的貢獻(xiàn)率,α(n-1)為第n-1個(gè)特征值的貢獻(xiàn)率,β為特征值的累計(jì)貢獻(xiàn)率,γ為符合條件的特征值;
式(7)中,x0為訓(xùn)練集原始數(shù)據(jù),
第五步,將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集:
由于每頭奶牛保留下1000張有效圖片,在經(jīng)過上述處理步驟之后具有相應(yīng)的1000個(gè)特征向量,分別將每頭奶牛的1000個(gè)特征向量以隨機(jī)方式劃分成800個(gè)訓(xùn)練數(shù)據(jù)和200個(gè)測(cè)試數(shù)據(jù),最終組成包含16000個(gè)特征向量的訓(xùn)練矩陣和包含4000個(gè)特征向量的測(cè)試矩陣,至此完成圖像數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集;
第六步,svm訓(xùn)練:
通過線性核函數(shù)的多分類libsvm進(jìn)行訓(xùn)練,將第五步處理好的奶牛訓(xùn)練集數(shù)據(jù)送入svm進(jìn)行建模訓(xùn)練,得到訓(xùn)練好的模型,至此完成svm訓(xùn)練;
第七步,svm測(cè)試:
將第五步中處理好的奶牛測(cè)試集數(shù)據(jù)送入第六步完成svm訓(xùn)練的模型中進(jìn)行測(cè)試,得出預(yù)測(cè)結(jié)果,至此完成svm測(cè)試;
第八步,實(shí)現(xiàn)對(duì)奶牛個(gè)體的有效識(shí)別:
根據(jù)第七步測(cè)試過程得到相應(yīng)的預(yù)測(cè)結(jié)果,輸出測(cè)試集中各特征向量對(duì)應(yīng)的奶牛不同個(gè)體的標(biāo)號(hào),得到奶牛個(gè)體類別,至此實(shí)現(xiàn)對(duì)奶牛個(gè)體的有效識(shí)別。
上述基于特征融合的奶牛個(gè)體識(shí)別方法,其中所述lbp編碼、卷積運(yùn)算、l2-norm歸一化、princomp函數(shù)和libsvm工具箱都是公知的。
本發(fā)明的有益效果如下:
與現(xiàn)有技術(shù)相比,本發(fā)明具有如下突出的實(shí)質(zhì)性特點(diǎn):
(1)本發(fā)明應(yīng)用改進(jìn)的lbp-hog算法特征提取和主成分分析方法進(jìn)行奶牛個(gè)體識(shí)別,前者通過對(duì)圖像局部特征進(jìn)行分析,分別從圖像紋理以及圖像邊緣提取了奶牛的有效特征,由于改進(jìn)的lbp算法使用不同的尺度獲取lbp直方圖、hog特征提取過程中有大量的冗余信息,故結(jié)合上面兩點(diǎn)引入主成分分析方法進(jìn)行特征降維處理,在簡(jiǎn)化特征的同時(shí)進(jìn)一步提取奶牛適于分類的有效信息,從而提取到有效的奶牛個(gè)體特征。
(2)每個(gè)奶牛頭部的鼻鏡和額部位的寬窄是有所不同的,可作為奶牛頭部識(shí)別差異性的一個(gè)識(shí)別點(diǎn)。本發(fā)明的奶牛數(shù)據(jù)采集主要采集奶牛的抬頭、偏頭、低頭和進(jìn)食這幾種狀態(tài),其中低頭、抬頭這兩種狀態(tài)采集的數(shù)據(jù)包含了鼻鏡和額的面貌特征;偏頭和進(jìn)食過程中奶牛面貌特征會(huì)有些扭轉(zhuǎn)。之所以采集這幾種狀態(tài)使得訓(xùn)練數(shù)據(jù)更全面,使用hog特征提取的時(shí)候,主要側(cè)重對(duì)邊緣特征的提取,得到的奶牛頭部的輪廓特征識(shí)別更精準(zhǔn)。
(3)本發(fā)明方法在特征提取之后,采用主成分分析進(jìn)行降維,把原來的n個(gè)特征用數(shù)目更少的m個(gè)特征取代,降低了噪聲,提高了分類時(shí)間,m個(gè)特征表示的是奶牛頭部輪廓特征與局部紋理特征相融合之后的特征。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下顯著的進(jìn)步:
(1)本發(fā)明將改進(jìn)的lbp-hog算法和主成分分析方法結(jié)合使用,對(duì)奶牛頭部進(jìn)行了特征提取和降維,提高了分類的準(zhǔn)確性。
(2)本發(fā)明對(duì)傳統(tǒng)的lbp算法進(jìn)行改進(jìn),傳統(tǒng)lbp比較鄰域像素與中心像素,受光照影響,噪聲大;本發(fā)明改進(jìn)的lbp不僅比較鄰域像素與中心像素,還比較了各鄰域像素的差異值,采用等價(jià)模式降低二進(jìn)制模式種類,特征向量維數(shù)降低,同時(shí)采用多尺度計(jì)算lbp直方圖,分類更精確。
(3)本發(fā)明對(duì)傳統(tǒng)的hog算法進(jìn)行優(yōu)化,奶牛的頭部圖像主要是黑白兩色,由于顏色信息的作用不大,所以直接在灰度圖像上進(jìn)行一系列操作,采用邊緣強(qiáng)度加權(quán)投票,省去了三線性差值的步驟,在不影響準(zhǔn)確率的情況下大大縮短了特征提取的時(shí)間。
(4)lbp特征提取側(cè)重點(diǎn)在紋理的提取,不能有效的進(jìn)行邊緣和方向的特征提??;hog特征提取能很好的描述圖像的邊緣信息,描述圖像局部的形狀變化,本發(fā)明將這兩種方法進(jìn)行特征融合,形成lbp-hog特征提取,從而能得到更加完整的圖像信息。
(5)本發(fā)明使用主成分分析對(duì)特征向量進(jìn)行降維,一方面降低維數(shù),使之后的svm分類時(shí)間更短,另一方面去除多余信息,使得分類更精確。
(6)本發(fā)明是一種特征融合的奶牛個(gè)體識(shí)別方法,這種方法通過奶牛頭部的輪廓特征與局部紋理特征相結(jié)合,對(duì)奶牛頭部信息特征提取更全面,相比于現(xiàn)有技術(shù)中通用的方法,本發(fā)明的識(shí)別率更高,識(shí)別率達(dá)到99%以上。
附圖說明
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明進(jìn)一步說明。
圖1是本發(fā)明方法的流程示意圖。
圖2是本發(fā)明方法中應(yīng)用高通濾波以及尺寸歸一化進(jìn)行視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理所得到的一頭奶牛頭部的效果圖,其中:
圖2(a)是一頭奶牛頭部的原始圖;
圖2(b)是經(jīng)過預(yù)處理后的一頭奶牛頭部的示例效果圖。
具體實(shí)施方式
圖1所示實(shí)施例表明,本發(fā)明奶牛個(gè)體識(shí)別方法的流程是:s1:奶牛視頻數(shù)據(jù)采集;s2:視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理;s3:應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提取;s4:應(yīng)用主成分分析方法進(jìn)行特征降維;s5:將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集;s6:svm訓(xùn)練;s7:svm測(cè)試;s8:實(shí)現(xiàn)對(duì)奶牛個(gè)體的有效識(shí)別。
圖2顯示本發(fā)明方法中應(yīng)用高通濾波以及尺寸歸一化進(jìn)行視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理所得到的一頭奶牛頭部的效果圖。
圖2(a)顯示的是一頭奶牛頭部的原始圖;
圖2(b)顯示的是經(jīng)過預(yù)處理后的一頭奶牛頭部的示例效果圖,通過圖像可以明顯看出奶牛頭部的各典型區(qū)域的紋理更清晰。
實(shí)施例1
第一步,奶牛視頻數(shù)據(jù)采集:
初始數(shù)據(jù)采用奶牛頭部視頻,視頻采集自一個(gè)規(guī)范奶牛養(yǎng)殖場(chǎng)數(shù)量>300頭的奶牛頭部視頻,應(yīng)用攝像設(shè)備錄制,視頻采集時(shí)間集中在奶牛進(jìn)食階段,每次錄制20頭奶牛,每頭奶牛錄制時(shí)間為1分鐘,幀速29幀/s,分別采集每頭奶牛的抬頭、偏頭、低頭和進(jìn)食這幾種狀態(tài),包含了奶牛頭部的鼻鏡和額部位差異明顯的特點(diǎn),至此完成奶牛視頻數(shù)據(jù)采集;
第二步,視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理:
分別將20頭奶牛頭部的視頻數(shù)據(jù)轉(zhuǎn)化成圖片序列,初始圖片大小為1920×1080像素,將彩色圖片序列轉(zhuǎn)為灰度圖像,并使用photoshop軟件的批量處理功能截取奶牛頭部圖像,然后通過高通濾波處理原圖像,使模糊的圖像更清晰,圖像邊緣紋理增強(qiáng),最后將圖片進(jìn)行尺寸歸一化到128*128,并將20頭奶牛從1到20編號(hào),表示20個(gè)待識(shí)別的不同個(gè)體,每頭奶牛保留1000張有效圖片,至此完成視頻轉(zhuǎn)化圖片并進(jìn)行預(yù)處理;
第三步,應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提?。?/p>
(3.1)求得圖像的特征向量h1=[h11,h12,h13]:
設(shè)上述第二步得到的圖片的圖像中某個(gè)3*3局部區(qū)域的任意像素為f(xa,ya),其中心像素點(diǎn)為ga,根據(jù)lbp編碼得到圖像的紋理特征t(xa,ya);對(duì)窗口的鄰域像素值進(jìn)行二值化處理,得到圖像的紋理特征t(xb,yb),計(jì)算過程如下式(8)所示:
式(8)中,g0、g1……g7為鄰域像素值,t(xb,yb)為圖像的紋理信息,s(x)是鄰域像素進(jìn)行二值化處理后的值,通過比較t(xa,ya)、t(xb,yb),得到改進(jìn)后的lbp編碼為t(xc,yc),計(jì)算過程如下式(9)所示:
對(duì)像素的不同位置進(jìn)行加權(quán)求和,得圖像的lbp值為lbp(xc,yc),計(jì)算過程如下式(10)所示:
將lbp值lbp(xc,yc)與循環(huán)移動(dòng)后的一位進(jìn)行位“與”操作,計(jì)算二進(jìn)制為1的個(gè)數(shù),標(biāo)記小于等于2的為等價(jià)模式,其余的為混合模式,選擇等價(jià)模式中l(wèi)bp值lbp(xc,yc)最小的為等價(jià)模式中的代表值,更新lbp值lbp(xc,yc);最后將lbp特征譜以6*6子窗口掃描整個(gè)圖像,得到直方圖h11,在以4*4子窗口掃描整個(gè)圖像,得到直方圖h12,最后以2*2子窗口掃描整個(gè)圖像,得到直方圖h13,將不同尺度下的lbp直方圖級(jí)聯(lián)起來得到圖像的特征向量h1=[h11,h12,h13];
(3.2)求得改進(jìn)lbp-hog算法的特征向量h:
用[-1,0,1]梯度算子對(duì)原圖像做卷積運(yùn)算,得到x方向的梯度分量gx(x,y),用[-1,0,1]t梯度算子對(duì)原圖像做卷積運(yùn)算,得到y(tǒng)方向的梯度分量gy(x,y),再用公式(11)計(jì)算該像素點(diǎn)的梯度大小,用如下式(12)計(jì)算該像素點(diǎn)的梯度方向:
式(11)中g(shù)(x,y)是像素點(diǎn)的梯度大小,式(12)中α(x,y)是像素點(diǎn)的梯度方向;
把[0,2π]的梯度方向劃分成9個(gè)區(qū)間,計(jì)算每個(gè)像素點(diǎn)在不同區(qū)間的梯度幅值,將圖像分割成cell單元,根據(jù)梯度方向和梯度幅值求得每個(gè)單元的梯度方向直方圖,即每個(gè)單元的梯度累加和;然后將多個(gè)臨近的cell組合成block,求得梯度方向直方圖向量并對(duì)其進(jìn)行l(wèi)2-norm歸一化操作,最后block相連得到圖像的hog特征向量h2,通過級(jí)聯(lián)特征向量h1、h2得到改進(jìn)lbp-hog算法的特征向量h;
至此完成應(yīng)用改進(jìn)的lbp-hog算法進(jìn)行特征提?。?/p>
第四步,應(yīng)用主成分分析方法進(jìn)行特征降維:
通過princomp函數(shù)初步求得特征向量、訓(xùn)練集數(shù)組和特征值數(shù)組,通過以下公式(13)計(jì)算特征值的累計(jì)貢獻(xiàn)率,選擇前95%的特征值對(duì)應(yīng)的特征向量,通過以下公式(14)得到最終訓(xùn)練集數(shù)組、測(cè)試集數(shù)組:
式(13)中,latent為特征值數(shù)組,α為每個(gè)特征值的貢獻(xiàn)率,α(n)為第n個(gè)特征值的貢獻(xiàn)率,α(n-1)為第n-1個(gè)特征值的貢獻(xiàn)率,β為特征值的累計(jì)貢獻(xiàn)率,γ為符合條件的特征值;
式(14)中,x0為訓(xùn)練集原始數(shù)據(jù),
第五步,將圖像特征數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集:
由于每頭奶牛保留下1000張有效圖片,在經(jīng)過上述處理步驟之后具有相應(yīng)的1000個(gè)特征向量,分別將每頭奶牛的1000個(gè)特征向量以隨機(jī)方式劃分成800個(gè)訓(xùn)練數(shù)據(jù)和200個(gè)測(cè)試數(shù)據(jù),最終組成包含16000個(gè)特征向量的訓(xùn)練矩陣和包含4000個(gè)特征向量的測(cè)試矩陣,至此完成圖像數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集;
第六步,svm訓(xùn)練:
通過線性核函數(shù)的多分類libsvm進(jìn)行訓(xùn)練,將第五步處理好的奶牛訓(xùn)練集數(shù)據(jù)送入svm進(jìn)行建模訓(xùn)練,得到訓(xùn)練好的模型,至此完成svm訓(xùn)練;
第七步,svm測(cè)試:
將第五步中處理好的奶牛測(cè)試集數(shù)據(jù)送入第六步完成svm訓(xùn)練的模型中進(jìn)行測(cè)試,得出預(yù)測(cè)結(jié)果,至此完成svm測(cè)試;
第八步,實(shí)現(xiàn)對(duì)奶牛個(gè)體的有效識(shí)別:
根據(jù)第七步測(cè)試過程得到相應(yīng)的預(yù)測(cè)結(jié)果,輸出測(cè)試集中各特征向量對(duì)應(yīng)的奶牛不同個(gè)體的標(biāo)號(hào),得到奶牛個(gè)體類別,至此實(shí)現(xiàn)對(duì)奶牛個(gè)體的有效識(shí)別。
實(shí)施例2
對(duì)20頭奶牛個(gè)體的20000張圖片,按照上述實(shí)施例1中的步驟計(jì)算出奶牛個(gè)體的識(shí)別正確率和識(shí)別時(shí)間,并與同樣條件下采用“改進(jìn)lbp+hog算法”、“改進(jìn)lbp算法”、“傳統(tǒng)lbp算法”、“優(yōu)化hog算法”、“傳統(tǒng)hog算法”或“gabor算法”計(jì)算得到的奶牛個(gè)體的識(shí)別正確率和識(shí)別時(shí)間進(jìn)行對(duì)比試驗(yàn),結(jié)果如表1所示。
表1.不同算法的奶牛個(gè)體的識(shí)別正確率和識(shí)別時(shí)間的對(duì)比實(shí)驗(yàn)結(jié)果
對(duì)表1中的數(shù)據(jù)的說明如下:
序號(hào)1實(shí)驗(yàn)和序號(hào)2實(shí)驗(yàn)都是采用本發(fā)明方法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,二者選擇的特征值累計(jì)貢獻(xiàn)率不同,序號(hào)1采用特征值是98%的累計(jì)貢獻(xiàn)率,得到的最小特征維數(shù)45,序號(hào)2采用特征值是99%的累計(jì)貢獻(xiàn)率,得到的最小特征維數(shù)378,由序號(hào)1實(shí)驗(yàn)和序號(hào)2實(shí)驗(yàn)可以看到,選擇不同的特征值累計(jì)貢獻(xiàn)率,最后得到的最小特征維數(shù)、識(shí)別準(zhǔn)確率和分類識(shí)別時(shí)間是有差異的,在對(duì)奶牛個(gè)體進(jìn)行識(shí)別中將根據(jù)情況的需要選擇適合的特征值累計(jì)貢獻(xiàn)率。
序號(hào)2實(shí)驗(yàn)為采用本發(fā)明的改進(jìn)的lbp-hog算法和主成分分析方法結(jié)合使用的方法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,序號(hào)3實(shí)驗(yàn)為僅采用本發(fā)明的改進(jìn)的lbp-hog算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,數(shù)據(jù)結(jié)果顯示,在相同的測(cè)試樣本中,序號(hào)2實(shí)驗(yàn)分類識(shí)別時(shí)間大大減少,同時(shí)識(shí)別率有所增加,因?yàn)橹鞒煞址治?,將特征向量中的多余信息去除,保證了信息提取的準(zhǔn)確性。
序號(hào)3實(shí)驗(yàn)為采用本發(fā)明的改進(jìn)的lbp-hog算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,序號(hào)4實(shí)驗(yàn)為僅采用本發(fā)明的改進(jìn)的lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,數(shù)據(jù)結(jié)果顯示,在相同的測(cè)試樣本中,采用本發(fā)明的改進(jìn)的lbp-hog算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別的識(shí)別正確率明顯高于僅采用本發(fā)明的改進(jìn)的lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別的識(shí)別正確率,因?yàn)楸景l(fā)明的改進(jìn)的lbp+hog算法將lbp中的紋理特征提取與hog邊緣特征提取進(jìn)行了融合,二者互補(bǔ)大大提高了識(shí)別效率,保證了特征提取的信息完整性。
序號(hào)4實(shí)驗(yàn)為采用本發(fā)明的改進(jìn)的lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,序號(hào)5實(shí)驗(yàn)為采用傳統(tǒng)的lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,數(shù)據(jù)結(jié)果顯示,在測(cè)試樣本相同的條件下,采用本發(fā)明的改進(jìn)的lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別的識(shí)別正確率明顯高于傳統(tǒng)lbp算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別的識(shí)別正確率,因?yàn)楸景l(fā)明的改進(jìn)的lbp算法不僅考慮了鄰域像素與中心像素的關(guān)系,還考慮了鄰域像素之間的關(guān)系,采用等價(jià)模式降低二進(jìn)制模式種類,特征向量維數(shù)降低,大大減少了高頻噪聲的影響,同時(shí)采用多尺度劃分區(qū)域,分別統(tǒng)計(jì)各區(qū)域的lbp直方圖,提取到了更加豐富和準(zhǔn)確的信息。
序號(hào)6實(shí)驗(yàn)為采用本發(fā)明的優(yōu)化的hog算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,序號(hào)7實(shí)驗(yàn)為采用傳統(tǒng)的hog算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,數(shù)據(jù)結(jié)果顯示,在測(cè)試樣本相同的條件下,采用本發(fā)明的優(yōu)化的hog算法的特征提取的時(shí)間明顯優(yōu)于傳統(tǒng)的hog算法的特征提取的時(shí)間,因?yàn)閮?yōu)化的hog算法直接在灰度圖上進(jìn)行梯度的大小和方向計(jì)算,采用邊緣強(qiáng)度加權(quán)投票,省去了傳統(tǒng)hog算法的三線性差值計(jì)算,在保證識(shí)別率未降低的情況下大大縮短了特征提取的時(shí)間。
序號(hào)8實(shí)驗(yàn)采用gabor算法對(duì)奶牛個(gè)體進(jìn)行識(shí)別,數(shù)據(jù)結(jié)果顯示,在測(cè)試樣本相同的條件下,與本發(fā)明方法相比,gabor算法分類識(shí)別時(shí)間雖短,但是識(shí)別率較低,主要是因?yàn)間abor濾波的通道有限,用一個(gè)中心頻率不能描述能量在多頻率的紋理信息,因此得到的效果不理想。
總之,從表1可見,本發(fā)明實(shí)施例1的基于特征融合的奶牛個(gè)體識(shí)別方法與其它幾種現(xiàn)有奶牛個(gè)體識(shí)別方法相比,奶牛個(gè)體的識(shí)別正確率最高,svm分類識(shí)別時(shí)間最短。
上述實(shí)施例中,其中所述lbp編碼、卷積運(yùn)算、l2-norm歸一化、princomp函數(shù)、libsvm工具箱、hog算法、svm分類和gabor算法都是公知的。