基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法

文檔序號(hào)：10512744閱讀：595來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法
【專(zhuān)利摘要】本發(fā)明提出了一種基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，主要解決現(xiàn)有技術(shù)的計(jì)算復(fù)雜、實(shí)時(shí)性差的問(wèn)題。其實(shí)現(xiàn)方案是：1)輸入交通路口中高清拍照設(shè)備拍下的待檢測(cè)圖片；2)對(duì)待檢測(cè)圖片使用選擇性搜索獲取候選區(qū)域；3)對(duì)候選區(qū)域進(jìn)行篩選，獲得車(chē)標(biāo)候選區(qū)域；4)構(gòu)建并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)CNN，將車(chē)標(biāo)候選區(qū)域輸入到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)CNN中進(jìn)行測(cè)試，得到車(chē)標(biāo)識(shí)別結(jié)果。本發(fā)明有效地減少了計(jì)算量，能快速地獲取車(chē)標(biāo)候選區(qū)域，而且卷積神經(jīng)網(wǎng)絡(luò)CNN自學(xué)習(xí)的特征對(duì)環(huán)境變化具有更高的魯棒性，提高了車(chē)標(biāo)識(shí)別率，可用于高速公路入口、停車(chē)場(chǎng)地對(duì)車(chē)輛的快速檢測(cè)。
【專(zhuān)利說(shuō)明】
基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域，更進(jìn)一步涉及一種車(chē)標(biāo)識(shí)別方法，可用于高速公路入口、停車(chē)場(chǎng)地對(duì)車(chē)輛的快速檢測(cè)。
【背景技術(shù)】
[0002] 隨著社會(huì)經(jīng)濟(jì)水平的不斷提高和車(chē)輛的普及，規(guī)模不斷擴(kuò)大的交通事業(yè)對(duì)更加智能化的技術(shù)和系統(tǒng)的需求更大，智能交通系統(tǒng)已經(jīng)成為社會(huì)生活的熱點(diǎn)問(wèn)題。車(chē)輛識(shí)別系統(tǒng)作為智能交通系統(tǒng)的重要組成部分，在高速公路入口、停車(chē)場(chǎng)無(wú)人管理、違章車(chē)輛自動(dòng)記錄等領(lǐng)域都有著廣泛的應(yīng)用，它的實(shí)現(xiàn)具有很大的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義。
[0003] 車(chē)標(biāo)識(shí)別是車(chē)輛識(shí)別的一個(gè)重要方面。車(chē)標(biāo)識(shí)別技術(shù)是指以數(shù)字圖像或視頻信號(hào) 流為對(duì)象，通過(guò)圖像處理與自動(dòng)識(shí)別方法，獲得機(jī)動(dòng)車(chē)輛品牌信息的一種實(shí)用技術(shù)。車(chē)標(biāo)識(shí) 別系統(tǒng)包括車(chē)標(biāo)的定位和車(chē)標(biāo)識(shí)別二項(xiàng)關(guān)鍵技術(shù)。由于車(chē)標(biāo)本身具有的多樣性以及不同環(huán) 境條件下的差異性等特點(diǎn)，加上人為拍攝獲得的圖片信息中車(chē)標(biāo)的位置不確定性，因此找到一種優(yōu)秀的車(chē)標(biāo)定位和識(shí)別的方法一個(gè)多學(xué)科交叉且富有挑戰(zhàn)性的技術(shù)問(wèn)題。
[0004] 現(xiàn)有的車(chē)標(biāo)定位的方法，大多采用邊緣檢測(cè)和灰度直方圖模板匹配的方法，由于車(chē)標(biāo)小，這類(lèi)方法容易受到背景環(huán)境的影響。已經(jīng)有一部分車(chē)標(biāo)識(shí)別的方法被提出，特別是目前使用較多的基于方向梯度直方圖H0G特征和支持向量機(jī)SVM分類(lèi)器的識(shí)別方法，大部分都是基于車(chē)牌和車(chē)標(biāo)的相對(duì)位置確定車(chē)標(biāo)位置，然后提取車(chē)標(biāo)的方向梯度直方圖H0G特征，利用支持向量機(jī)SVM訓(xùn)練成分類(lèi)器進(jìn)行車(chē)標(biāo)識(shí)別。在車(chē)標(biāo)識(shí)別中，方向梯度直方圖H0G加支持向量機(jī)SVM算法由于采用了方向梯度直方圖H0G特征，方向梯度直方圖H0G描述子生成過(guò) 程冗長(zhǎng)，導(dǎo)致速度慢，實(shí)時(shí)性差，由于梯度的性質(zhì)，該描述子對(duì)噪點(diǎn)相當(dāng)敏感?，F(xiàn)有的大部分車(chē)標(biāo)識(shí)別算法，過(guò)程復(fù)雜，計(jì)算量太大，識(shí)別率不高，容易受到環(huán)境條件的影響，所以需要新的研究方法的提出。
[0005] 近年來(lái)，隨著大數(shù)據(jù)、深度學(xué)習(xí)研究的發(fā)展，卷積神經(jīng)網(wǎng)絡(luò)CNN已成為當(dāng)前語(yǔ)音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)，它的權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)使之更類(lèi)似于生物神經(jīng)網(wǎng)絡(luò)，降低了網(wǎng)絡(luò)模型的復(fù)雜度，減少了權(quán)值的數(shù)量。該優(yōu)點(diǎn)在網(wǎng)絡(luò)的輸入是多維圖像時(shí)表現(xiàn)的更為明顯，使圖像可以直接作為網(wǎng)絡(luò)的輸入，避免了傳統(tǒng)識(shí)別算法中復(fù)雜的特征提取和數(shù)據(jù)重建過(guò)程。卷積網(wǎng)絡(luò)是為識(shí)別二維形狀而特殊設(shè)計(jì)的一個(gè)多層感知器，這種網(wǎng)絡(luò)結(jié)構(gòu)對(duì)平移、比例縮放、傾斜或者共他形式的變形具有高度不變性。
[0006] D.F.Llorca，R.Ar;royo，M.A.Sotelo在其發(fā)表的論文"Vehicle logo recognition in traffic images using HOG features and SVM"（Proceedings of the 16th International IEEE Annual Conference on Intelligent Transportation Systems， 2013)中提出了一套基于方向梯度直方圖HOG和支持向量機(jī)SVM的車(chē)標(biāo)識(shí)別的方法。該方法首先進(jìn)行車(chē)牌定位，利用車(chē)標(biāo)處于車(chē)牌正上方的先驗(yàn)知識(shí)，在車(chē)牌上方使用滑動(dòng)窗口提前候選目標(biāo)區(qū)域，然后提取候選區(qū)域的的方向梯度直方圖H0G特征，最后利用支持向量機(jī)SVM 訓(xùn)練的分類(lèi)器進(jìn)行車(chē)標(biāo)分類(lèi)。該方法存在的不足之處是，其一，由于該方法采用了方向梯度直方圖HOG特征，方向梯度直方圖HOG描述子生成過(guò)程冗長(zhǎng)，導(dǎo)致速度慢，實(shí)時(shí)性差。其二，由于該方法梯度的性質(zhì)，方向梯度直方圖HOG描述子對(duì)噪點(diǎn)相當(dāng)敏感，容易受到噪聲的干擾。
[0007] 佳都新太科技股份有限公司申請(qǐng)的專(zhuān)利"一種基于模式識(shí)別的車(chē)標(biāo)自動(dòng)定位與識(shí) 別方法"（專(zhuān)利申請(qǐng)?zhí)枺篊N201410367377,公開(kāi)號(hào)：CN104182728A)中提出了一種基于模式識(shí) 別的車(chē)標(biāo)自動(dòng)定位與識(shí)別方法。該方法首先利用車(chē)牌檢測(cè)技術(shù)，獲取車(chē)牌的大小與位置，從而根據(jù)車(chē)牌與車(chē)標(biāo)的相對(duì)位置，進(jìn)行車(chē)標(biāo)的初定位，其次利用基于哈爾Haar特征的強(qiáng)分類(lèi) 器Adaboost算法進(jìn)行車(chē)標(biāo)的二次定位，得到若干疑似車(chē)標(biāo)的區(qū)域，再次利用基于方向梯度直方圖H0G特征的支持向量機(jī)SVM算法對(duì)疑似車(chē)標(biāo)區(qū)域進(jìn)行篩選，選取具有最大置信度的區(qū) 域作為車(chē)標(biāo)定位結(jié)果，最后利用基于H0G特征的支持向量機(jī)SVM算法進(jìn)行車(chē)標(biāo)的識(shí)別。該方法存在的不足之處是，在定位流程中采用了基于哈爾Haar特征的強(qiáng)分類(lèi)器Adaboost算法和基于方向梯度直方圖H0G特征的支持向量機(jī)SVM算法，在車(chē)標(biāo)識(shí)別流程中采用了基于方向梯度直方圖H0G特征的支持向量機(jī)SVM算法，總共采用了三個(gè)分類(lèi)器，大大增加了計(jì)算復(fù)雜度。而且H0G描述子生成過(guò)程耗時(shí)長(zhǎng)，導(dǎo)致速度慢，實(shí)時(shí)性差。
[0008] 上海交通大學(xué)申請(qǐng)的專(zhuān)利"車(chē)標(biāo)自動(dòng)識(shí)別方法及系統(tǒng)"（專(zhuān)利申請(qǐng)?zhí)枺?CN201310170528,公開(kāi)號(hào):CN103279738A)中提出一種車(chē)標(biāo)自動(dòng)識(shí)別方法，包括離線訓(xùn)練子系統(tǒng)和在線識(shí)別子系統(tǒng)。該方法根據(jù)密集尺度不變特征變換dense-SIFT和視覺(jué)詞的相關(guān) 性，將密集尺度不變特征變換dense-SIFT映射成所有視覺(jué)詞表示，增加特征描述性。采用支持向量機(jī)訓(xùn)練車(chē)標(biāo)分類(lèi)器，實(shí)現(xiàn)車(chē)標(biāo)識(shí)別。該方法存在的不足之處是，由于采用了密集尺度不變特征變換dense-SIFT特征算子，維數(shù)高，計(jì)算時(shí)間長(zhǎng)，實(shí)時(shí)性差。

【發(fā)明內(nèi)容】

[0009] 本發(fā)明的目的是針對(duì)上述現(xiàn)有技術(shù)存在的不足，提出一種基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，以減小計(jì)算量，提高實(shí)時(shí)性和識(shí)別的準(zhǔn)確度。
[0010] 為實(shí)現(xiàn)上述目的，本發(fā)明實(shí)現(xiàn)技術(shù)方案包括如下：
[0011] (1)輸入交通路口中通過(guò)高清拍照設(shè)備獲取的車(chē)標(biāo)待檢測(cè)圖片；
[0012] (2)使用選擇性搜索獲取車(chē)標(biāo)待檢測(cè)圖片的候選區(qū)域：
[00?3] (2a)利用基于圖的圖形分割，得至I」初始化的區(qū)域R= {η，Γ2，…，ri，…，rn}，其中ri 是第i個(gè)初始區(qū)域，i e [1，n]，η為初始化區(qū)域個(gè)數(shù)；
[0014] (2b)計(jì)算出每個(gè)初始化相鄰區(qū)域的綜合相似性s(ri，rj)，組成集合S，其中ie[l， n]，je[i+l，n];
[0015] (2c)找出集合S中相似性最大的二個(gè)區(qū)域ra，rb，即max⑶= s(ra，rb);
[0016] (2d)合并rjPrb，獲得新的區(qū)域rt，即rt = raU η，然后在S和R中均去掉相似性最大的二個(gè)區(qū)域ra，n，得到新的相似性集合S'和新的初始化區(qū)域f ;
[0017] (2e)計(jì)算新的區(qū)域rt與所有與它相鄰的區(qū)域r*之間的綜合相似性St(rt，r*);
[0018] (2f)將st(rt，r*)和rt分別添加到相似性集合S'和初始化區(qū)域f中，得到加入相似性st(rt，r*)后的集合S"和加入新的區(qū)域rt后的初始化區(qū)域R";
[0019] (2g)重復(fù)(2c)到(2f)的操作，直到相似性集合為空，獲得最終候選區(qū)域；
[0020] (3)利用車(chē)標(biāo)區(qū)域的先驗(yàn)條件對(duì)候選區(qū)域進(jìn)行篩選，獲得車(chē)標(biāo)候選區(qū)域；
[0021] (4)構(gòu)建并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)CNN:
[0022] (4a)構(gòu)建含有7層的卷積神經(jīng)網(wǎng)絡(luò)CNN，這7層依次是卷積層Convl，池化層P〇〇12，卷積層Conv3，空間金字塔池化層SPP4，全連接層Fc5，全連接層Fc6，分類(lèi)層Softmax7;
[0023] (4b)輸入已標(biāo)記并灰度化的車(chē)標(biāo)區(qū)域樣本圖片和非車(chē)標(biāo)區(qū)域樣本圖，訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)CNN，直到輸出層的損失函數(shù)J(0H 0.0001，得到車(chē)標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)CNN;
[0024] (5)車(chē)標(biāo)識(shí)別：
[0025] (5a)對(duì)車(chē)標(biāo)候選區(qū)域圖進(jìn)行灰度化操作；
[0026] (5b)將灰度化的車(chē)標(biāo)候選區(qū)域圖輸入到車(chē)標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)CNN，輸出車(chē)標(biāo) 的識(shí)別結(jié)果。
[0027] 本發(fā)明與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn)：
[0028] 第一、由于本發(fā)明采用選擇性搜索算法獲取車(chē)標(biāo)候選區(qū)域，克服了現(xiàn)有技術(shù)中直接提取車(chē)標(biāo)易受背景環(huán)境影響，不能被準(zhǔn)確提取出來(lái)的問(wèn)題，不僅流程較為簡(jiǎn)單，實(shí)現(xiàn)方便，而且能準(zhǔn)確地從復(fù)雜背景環(huán)境中提取出車(chē)標(biāo)候選區(qū)域。
[0029]第二、由于本發(fā)明采用基于卷積神經(jīng)網(wǎng)絡(luò)CNN的車(chē)標(biāo)識(shí)別方法，通過(guò)卷積神經(jīng)網(wǎng)絡(luò) CNN中多層的網(wǎng)絡(luò)自學(xué)習(xí)特征，避免了傳統(tǒng)識(shí)別算法中需要人工設(shè)計(jì)特征的過(guò)程，而且卷積神經(jīng)網(wǎng)絡(luò)CNN自學(xué)習(xí)的特征對(duì)環(huán)境變化具有更高的魯棒性，使得本發(fā)明具有較高的識(shí)別率和魯棒性，對(duì)復(fù)雜背景具有更強(qiáng)的適應(yīng)性。
【附圖說(shuō)明】
[0030]圖1是本發(fā)明的實(shí)現(xiàn)流程圖；
[0031 ]圖2是本發(fā)明獲得車(chē)標(biāo)候選區(qū)域的示意圖；
[0032]圖3是本發(fā)明中的卷積神經(jīng)網(wǎng)絡(luò)CNN結(jié)構(gòu)圖；
[0033]圖4是本發(fā)明標(biāo)記的部分車(chē)標(biāo)圖。
【具體實(shí)施方式】
[0034]下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)描述。
[0035]參照?qǐng)D1，本發(fā)明實(shí)現(xiàn)的步驟如下：
[0036] 步驟1，輸入交通路口中高清拍照設(shè)備拍下的車(chē)標(biāo)待檢測(cè)圖片。
[0037] 車(chē)標(biāo)待檢測(cè)圖片是正對(duì)車(chē)頭或者車(chē)尾的包含清晰可見(jiàn)的車(chē)標(biāo)的圖片，圖片像素大小為500X500,如圖2(a)所示。
[0038] 步驟2,使用選擇性搜索獲取候選區(qū)域。
[0039] (2a)基于圖的圖形分割，得到初始化的區(qū)域R:
[0040] (2al)將照片用加權(quán)圖抽象化表示，其中加權(quán)圖是由節(jié)點(diǎn)集V和邊集E組成，表示為 G = (V，E)，節(jié)點(diǎn)集V= {vi, V2,…，Vi,…，Vn}，其中i e [1，n]，n為節(jié)點(diǎn)個(gè)數(shù)，邊集E= {〇1， 02,…，〇w，···，〇m}，其中we[l，m]，m為邊的條數(shù)；
[0041 ] (2a2)將m條邊按照權(quán)重值以非遞減方式排序；
[0042] (2a3)將最初的分割區(qū)域集合記為R(())，即每一個(gè)節(jié)點(diǎn)屬于一個(gè)區(qū)域；
[0043] (2&4)記第9條邊連接的兩個(gè)節(jié)點(diǎn)為￥：1和￥」，即〇(1=(>：1，￥」），其中(1￡[1，111]，記第9次分割區(qū)域集合為R(<rl)，初始時(shí)q=l，R(<rl)為R(<))為最初分割區(qū)域集合，如果在R (<rl)中Vi和Vj 是分別屬于兩個(gè)區(qū)域并且第q條邊的權(quán)重w(〇q)大于兩個(gè)區(qū)域的區(qū)域內(nèi)間距，則重新選擇新的邊，反之，進(jìn)行(2b5);
[0044] (2a5)合并二個(gè)區(qū)域，在中去掉這兩個(gè)區(qū)域再加入新合并的區(qū)域變成新的分害慪域集合R (q)，返回（2b4)，直到q=m，得到初始化的區(qū)域R = R(m);
[0045] (2b)計(jì)算出每個(gè)初始化相鄰區(qū)域的綜合相似性s(ri，rj):
[0046] (2bl)從每個(gè)初始區(qū)域中得到一個(gè)一維的灰度分布直方圖，該直方圖共有25個(gè)區(qū) 間，按照下式計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域rj的灰度特征相似性Sc^ri，!·」）：
[0048] 其中，<表示第i個(gè)初始區(qū)域以第1^個(gè)區(qū)間的灰度分布直方圖特征，< 表示第j個(gè)初始區(qū)域r j第k個(gè)區(qū)間的灰度分布直方圖特征，i e [ 1，n ]，j e [ i+1，n ]，n為初始化區(qū)域個(gè)數(shù)，k e[l，25];
[0049] (2b2)對(duì)每個(gè)初始區(qū)域，在8個(gè)方向上計(jì)算方差為1的高斯微分，每個(gè)方向用10個(gè)區(qū) 間的紋理直方圖來(lái)描述，按照下式計(jì)算第i個(gè)初始區(qū)域η與第j個(gè)初始區(qū)域^的紋理相似性 St(ri,rj)：
[0051] 其中，鮮表示第i個(gè)初始區(qū)域〇第1!個(gè)區(qū)間的紋理直方圖特征，￥表示第j個(gè)初始區(qū) 域r j第u個(gè)區(qū)間的紋理直方圖特征，u e [ 1，80 ];
[0052] (2b3)按照下式計(jì)算第i個(gè)初始區(qū)域Γι與第j個(gè)初始區(qū)域巧的面積相似性S e(ri，rj):
[0054] 其中，Size(ri)表示初始區(qū)域的像素?cái)?shù)目，siZe(n)表示初始區(qū)域〇內(nèi)的像素數(shù)目，si Ze(im)表示車(chē)標(biāo)待檢測(cè)圖片內(nèi)的像素?cái)?shù)目；
[0055] (2b4)按照下式計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域rj的相交相似性Sf(ri，rj):
[0057]其中，表示初始區(qū)域Γι和初始區(qū)域〇的最小外包區(qū)域的像素?cái)?shù)目；
[0058] (2b5)根據(jù)步驟(2bl)到(2b4)的結(jié)果，計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域rj的綜合相似性S(ri，rj):
[0059] S(ri,rj) = Sc(ri,rj)+St(ri,rj)+Se(ri,rj)+Sf(ri,rj)〇
[0060] 將計(jì)算出的每個(gè)初始化相鄰區(qū)域的綜合相似性S(ri，n)，組成集合S。
[0061 ] (2c)找出集合S中相似性最大的二個(gè)區(qū)域ra，rb，即max(S) = s(ra，rb);
[0062] (2d)合并rjPrb，獲得新的區(qū)域rt，即rt = raU η，然后在S和R中均去掉相似性最大的二個(gè)區(qū)域ra，n，得到新的相似性集合S'和新的初始化區(qū)域f ;
[0063] (2e)計(jì)算新的區(qū)域rt與所有與它相鄰的區(qū)域r*之間的綜合相似性st(r t，r*);
[0064] (2f)將st(rt，r*)和rt分別添加到相似性集合S'和初始化區(qū)域f中，得到加入相似性st(r t，r*)后的集合S"和加入新的區(qū)域rt后的初始化區(qū)域R";
[0065] (2g)重復(fù)(2c)到(2f)的操作，直到相似性集合為空，獲得最終候選區(qū)域
[0066] 按照上述步驟獲得候選區(qū)域如圖2(b)所示。
[0067] 步驟3,利用車(chē)標(biāo)區(qū)域的先驗(yàn)條件對(duì)候選區(qū)域進(jìn)行篩選，從而獲得車(chē)標(biāo)候選區(qū)域。
[0068] 所述先驗(yàn)條件，包括如下兩個(gè)條件：
[0069] 第一先驗(yàn)條件是:將車(chē)標(biāo)候選區(qū)域的中心設(shè)在車(chē)標(biāo)待檢測(cè)圖片的中心區(qū)域，候選區(qū)域的坐標(biāo)為&，7)，0.2511〇〈0.7511，0.25￥〈7〈0.75￥，其中11，￥分別為車(chē)標(biāo)待檢測(cè)圖片的高和寬；
[0070] 第二先驗(yàn)條件是:將車(chē)標(biāo)候選區(qū)域長(zhǎng)寬比設(shè)為r，l〈r〈3;
[0071] 對(duì)步驟2所得的候選區(qū)域，先利用第一先驗(yàn)條件選取在車(chē)標(biāo)待檢測(cè)圖片中心區(qū)域的車(chē)標(biāo)候選區(qū)域，得到初始的篩選區(qū)域;然后利用第二先驗(yàn)條件在初始的篩選區(qū)域中選擇車(chē)標(biāo)候選區(qū)域長(zhǎng)寬比適合的候選區(qū)域，得到最終篩選的車(chē)標(biāo)候選區(qū)域。
[0072] 按照步驟3,對(duì)候選區(qū)域進(jìn)行篩選得到結(jié)果如圖2(c)所示，圖2(d)為保存的對(duì)圖2 (c)中框出的區(qū)域截圖。
[0073] 步驟4，構(gòu)建含有7層的卷積神經(jīng)網(wǎng)絡(luò)CNN。
[0074] (4a)將38X38像素大小的車(chē)標(biāo)區(qū)域圖輸入卷積層Convl，對(duì)其進(jìn)行塊大小為5X5 像素和步長(zhǎng)為1個(gè)像素的卷積操作，總共用32個(gè)卷積核，得到32張34X34像素大小的特征圖；
[0075] (4b)將卷積層Convl輸出的32張?zhí)卣鲌D輸入到池化層P〇〇12,對(duì)其進(jìn)行最大池化操作，池化塊的大小為2 X 2像素，步長(zhǎng)為1個(gè)像素，得到32張分辨率為17 X 17像素的特征圖； [0076] (4c)將池化層Pool2輸出的32張?zhí)卣鲌D輸入卷積層Conv3,對(duì)其進(jìn)行塊大小為5X5 像素和步長(zhǎng)為1個(gè)像素的卷積操作，總共用64個(gè)卷積核，得到64張分辨率為13X13像素的特征圖；
[0077] (4d)將卷積層Conv3輸出的64張?zhí)卣鲌D輸入空間金字塔池化層SPP4,對(duì)其進(jìn)行多尺度的最大池化操作，需要得到64張分辨率為(4 X 4+2 X 2+1 X 1)像素的特征圖，池化塊大
，其中表示a = 13，n分別取4、2、1;
[0078] (4e)將池化層SPP4輸出的64張?zhí)卣鲌D輸入全連接層Fc5，按照下式，對(duì)其中每一個(gè) 像素點(diǎn)進(jìn)行激活，得到激活后的特征圖的像素點(diǎn)的值，將激活后的特征圖以列的順序排列成1維向量，得到1 X 1344維的特征向量：
[0080]其中，f(x)表示激活后的特征圖的像素點(diǎn)的值，X表示激活前特征圖的像素點(diǎn)的值，e表示一個(gè)無(wú)限不循環(huán)的自然常數(shù)，取值為2.7182;
[0081 ] (4f)將全連接層Fc5輸出的特征向量輸入全連接層Fc6，構(gòu)成一般神經(jīng)網(wǎng)絡(luò)，輸出為IX 500維的特征向量；
[0082] (4g)將全連接層Fc6輸出的特征向量輸入分類(lèi)層Softmax7,得到車(chē)標(biāo)區(qū)域圖的分類(lèi)標(biāo)簽，該層會(huì)計(jì)算出每種分類(lèi)標(biāo)簽的概率，并將最大概率的標(biāo)簽輸出，其中softmax分類(lèi) 的期望函數(shù)表示如下：
[0084] 其中，a(i)表示卷積神經(jīng)網(wǎng)絡(luò)CNN中全連接層Fc6輸出的特征向量，β(υ表示與卷積神經(jīng)網(wǎng)絡(luò)CNN中全連接層Fc6輸出的特征向量α(1)相對(duì)應(yīng)的標(biāo)簽，k表示類(lèi)別數(shù)，i表示樣本，i e[l，m]，m表示車(chē)標(biāo)區(qū)域圖樣本的數(shù)量，Θ表示模型參數(shù)，softmax分類(lèi)損失函數(shù)如下：
[0086]按照上述步驟構(gòu)造的7層卷積神經(jīng)網(wǎng)絡(luò)CNN結(jié)構(gòu)如圖3。
[0087] 步驟5,車(chē)標(biāo)識(shí)別。
[0088] 對(duì)車(chē)標(biāo)候選區(qū)域圖進(jìn)行灰度化操作，將灰度化的車(chē)標(biāo)候選區(qū)域圖輸入車(chē)標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)CNN，最終輸出車(chē)標(biāo)的識(shí)別結(jié)果。
[0089] 下面結(jié)合仿真實(shí)驗(yàn)對(duì)本發(fā)明的效果做進(jìn)一步的詳細(xì)描述。
[0090] 1、仿真實(shí)驗(yàn)條件：
[0091] 本發(fā)明所用的數(shù)據(jù)庫(kù)為收集并制作的一組包含10類(lèi)車(chē)標(biāo)共計(jì)25200張的車(chē)標(biāo)、其中23100張用于訓(xùn)練，2100用于測(cè)試，還有非車(chē)標(biāo)區(qū)域的數(shù)據(jù)樣本，共計(jì)9900張負(fù)樣本，其中 9000張用于訓(xùn)練，900張用于測(cè)試。負(fù)樣本采用從含有車(chē)標(biāo)的圖中截取非車(chē)標(biāo)區(qū)域的圖獲得，大小為38 X 38，圖4是本發(fā)明中用于訓(xùn)練的車(chē)標(biāo)圖中標(biāo)記的部分車(chē)標(biāo)圖。
[0092] 本實(shí)驗(yàn)采用深度學(xué)習(xí)框架是基于ubuntul4.04操作系統(tǒng)，8G內(nèi)存，酷睿i7-4720HQ CPU的運(yùn)行環(huán)境。實(shí)驗(yàn)設(shè)置參數(shù)迭代15000次停止。
[0093] 2、實(shí)驗(yàn)內(nèi)容與結(jié)果：
[0094]本發(fā)明的仿真實(shí)驗(yàn)是將數(shù)據(jù)集中用于訓(xùn)練的車(chē)標(biāo)圖輸入到一個(gè)7層的卷積神經(jīng)網(wǎng) 絡(luò)CNN中，利用高斯隨機(jī)初始化網(wǎng)絡(luò)的權(quán)值，對(duì)該卷積神經(jīng)網(wǎng)絡(luò)CNN進(jìn)行訓(xùn)練，直到卷積神經(jīng) 網(wǎng)絡(luò)CNN最后一層分類(lèi)層之后的輸出損失函數(shù)J(0H 0.0001為止或者迭代15000次為止。再將用于測(cè)試的車(chē)標(biāo)圖，輸入到訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測(cè)試，測(cè)試的總的識(shí)別率，結(jié)果如下表： [0095]識(shí)別結(jié)果表

【主權(quán)項(xiàng)】
1. 一種基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，包括： (1) 輸入交通路口中通過(guò)高清拍照設(shè)備獲取的車(chē)標(biāo)待檢測(cè)圖片； (2) 使用選擇性搜索獲取車(chē)標(biāo)待檢測(cè)圖片的候選區(qū)域： (2a)利用基于圖的圖形分割，得到初始化的區(qū)域1?={^^2，"_，^，"_而}，其中^是第1 個(gè)初始區(qū)域，i e [ 1，η ]，η為初始化區(qū)域個(gè)數(shù)； (2b)計(jì)算出每個(gè)初始化相鄰區(qū)域的綜合相似性S(ri，^)，組成集合S，其中ie[l， n]，j e[i+1,η]； (2(：)找出集合5中相似性最大的二個(gè)區(qū)域1'￡1，11)，即11^(5) = 8(1'￡1，；1^); (2(1)合并1'￡1和11)，獲得新的區(qū)域1'1；，即：1^ = 1'￡111；1^，然后在3和1?中均去掉相似性最大的二個(gè)區(qū)域ra，n，得到新的相似性集合S'和新的初始化區(qū)域f ; (2e)計(jì)算新的區(qū)域rt與所有與它相鄰的區(qū)域r*之間的綜合相似性st (rt，r*); (2f)將st(rt，r*)和rt分別添加到相似性集合S'和初始化區(qū)域f中，得到加入相似性s t (rt，r*)后的集合S"和加入新的區(qū)域rt后的初始化區(qū)域R"; (2g)重復(fù)(2c)到(2f)的操作，直到相似性集合為空，獲得最終候選區(qū)域； (3) 利用車(chē)標(biāo)區(qū)域的先驗(yàn)條件對(duì)候選區(qū)域進(jìn)行篩選，獲得車(chē)標(biāo)候選區(qū)域； (4) 構(gòu)建并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)CNN: (4a)構(gòu)建含有7層的卷積神經(jīng)網(wǎng)絡(luò)CNN，這7層依次是卷積層Convl，池化層P〇〇12,卷積層Conv3，空間金字塔池化層SPP4，全連接層Fc5，全連接層Fc6，分類(lèi)層Softmax7; (4b)輸入已標(biāo)記并灰度化的車(chē)標(biāo)區(qū)域樣本圖片和非車(chē)標(biāo)區(qū)域樣本圖，訓(xùn)練卷積神經(jīng)網(wǎng) 絡(luò)CNN，直到輸出層的損失函數(shù)J(0H 0.0001，得到車(chē)標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)CNN; (5) 車(chē)標(biāo)識(shí)別： (5a)對(duì)車(chē)標(biāo)候選區(qū)域圖進(jìn)行灰度化操作； (5b)將灰度化的車(chē)標(biāo)候選區(qū)域圖輸入到車(chē)標(biāo)識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)CNN，輸出車(chē)標(biāo)的識(shí) 別結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，其特征在于:步驟(2a)中利用基于圖的圖形分割，得到初始化的區(qū)域R，按如下步驟進(jìn)行： (2bl)將照片用加權(quán)圖抽象化表示，其中加權(quán)圖是由節(jié)點(diǎn)集V和邊集E組成，表示為G = (V，E)，節(jié)點(diǎn)集V= {vi，V2，···，Vi，···，Vn}，其中i e [1，n]，n為節(jié)點(diǎn)個(gè)數(shù)，邊集E= {〇1，〇2,…，〇w,…，〇m}，其中we [1，m]，m為邊的條數(shù)； (2b2)將m條邊按照權(quán)重值以非遞減方式排序； (2b3)將最初的分割區(qū)域集合記為R(())，即每一個(gè)節(jié)點(diǎn)屬于一個(gè)區(qū)域； (2a4)記第q條邊連接的兩個(gè)節(jié)點(diǎn)為Vi和Vj，即〇q= (Vi，Vj)，其中qe [1，m]，記第q次分割區(qū)域集合為R(<rl)，初始時(shí)q=l，R(<rl)為R(<))為最初分割區(qū)域集合，如果在R (<rl)中Vi和Vj是分別屬于兩個(gè)區(qū)域并且第q條邊的權(quán)重w(〇q)大于兩個(gè)區(qū)域的區(qū)域內(nèi)間距，則重新選擇新的邊，反之，進(jìn)行(2b5); (2a5)合并二個(gè)區(qū)域，在中去掉這兩個(gè)區(qū)域再加入新合并的區(qū)域變成新的分割區(qū) 域集合R(q)，返回（2b4)，直到q=m，得到初始化的區(qū)域R = R(m)。3. 根據(jù)權(quán)利要求1所述的基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，其特征在于:步驟(2b)中計(jì)算出每個(gè)初始化相鄰區(qū)域的綜合相似性s(ri，rj)，按如下步驟進(jìn)行： (2bl)從每個(gè)初始區(qū)域中得到一個(gè)一維的灰度分布直方圖，該直方圖共有25個(gè)區(qū)間，按照下式計(jì)算第i個(gè)初始區(qū)域ri與第i個(gè)初始IX域ri的灰度特征相似性Sc(ri，rj):其中，4表示第i個(gè)初始區(qū)域〇第1^個(gè)區(qū)間的灰度分布直方圖特征，4表示第j個(gè)初始區(qū) 域r j第k個(gè)區(qū)間的灰度分布直方圖特征，i e [ 1，n ]，j e [ i +1，n ]，n為初始化區(qū)域個(gè)數(shù)，k e [1,25]； (2b2)對(duì)每個(gè)初始區(qū)域，在8個(gè)方向上計(jì)算方差為1的高斯微分，每個(gè)方向用10個(gè)區(qū)間的紋理直方圖來(lái)描述，按照下式計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域rj的紋理相似性St (ri,rj)：u = i 其中，￥表示第i個(gè)初始區(qū)域。第1!個(gè)區(qū)間的紋理直方圖特征，％表示第j個(gè)初始區(qū)域第u個(gè)區(qū)間的紋理直方圖特征，ue[l，80]; (2b3)按照下式計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域rj的面積相似性Sjri，!·」）：其中，Size(ri)表示初始區(qū)域的像素?cái)?shù)目，siZe(n)表示初始區(qū)域^內(nèi)的像素?cái)?shù)目， siZe(im)表示車(chē)標(biāo)待檢測(cè)圖片內(nèi)的像素?cái)?shù)目； (2b4)按照下式計(jì)算第i個(gè)初始區(qū)域ri與第j個(gè)初始區(qū)域r j的相交相似性Sf (ri，r j):其中，表示初始區(qū)域Γι和初始區(qū)域〇的最小外包區(qū)域的像素?cái)?shù)目；（2b5) 根據(jù)步驟(2bl)到（2b4)的結(jié)果，計(jì)算第i個(gè)初始區(qū)域Γι與第j個(gè)初始區(qū)域^的綜合相似性S(ri，rj): S(ri，rj) = Sc(;ri，;rj)+St(:ri，;rj)+Se(;ri，;rj)+Sf(;ri，;rj) 〇4. 根據(jù)權(quán)利要求1所述的基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，其特征在于:步驟(3)中的先驗(yàn)條件，包括如下兩個(gè)條件：第一先驗(yàn)條件是：將車(chē)標(biāo)候選區(qū)域的中心設(shè)在車(chē)標(biāo)待檢測(cè)圖片的中心區(qū)域，候選區(qū)域的坐標(biāo)為&，7)，0.2511〇〈0.7511，0.25￥〈7〈0.75￥，其中11，￥分別為車(chē)標(biāo)待檢測(cè)圖片的高和寬；第二先驗(yàn)條件是:將車(chē)標(biāo)候選區(qū)域長(zhǎng)寬比設(shè)為r，l〈r〈3。5. 根據(jù)權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，其特征在于:步驟(4a)構(gòu) 建含有7層的卷積神經(jīng)網(wǎng)絡(luò)CNN，按如下步驟進(jìn)行： (4al)將38X38像素大小的車(chē)標(biāo)區(qū)域圖輸入卷積層Convl，對(duì)其進(jìn)行塊大小為5 X 5像素和步長(zhǎng)為1個(gè)像素的卷積操作，總共用32個(gè)卷積核，得到32張34 X 34像素大小的特征圖； (4a2)將卷積層Convl輸出的32張?zhí)卣鲌D輸入到池化層P〇〇12,對(duì)其進(jìn)行最大池化操作，池化塊的大小為2 X 2像素，步長(zhǎng)為1個(gè)像素，得到32張分辨率為17 X 17像素的特征圖； (4a3)將池化層Poo 12輸出的32張?zhí)卣鲌D輸入卷積層Conv3，對(duì)其進(jìn)行塊大小為5 X 5像素和步長(zhǎng)為1個(gè)像素的卷積操作，總共用64個(gè)卷積核，得到64張分辨率為13X13像素的特征圖； (4a4)將卷積層Conv3輸出的64張?zhí)卣鲌D輸入空間金字塔池化層SPP4,對(duì)其進(jìn)行多尺度的最大池化操作，需要得到64張分辨率為(4X4+2X2+1 XI)像素的特征圖，池化塊大小為 -和步長(zhǎng)為一.，其中表不a = 13，n分別取4、2、1; η [_η_ (4a5)將池化層SPP4輸出的64張?zhí)卣鲌D輸入全連接層Fc5,按照下式，對(duì)其中每一個(gè)像素點(diǎn)進(jìn)行激活，得到激活后的特征圖的像素點(diǎn)的值，將激活后的特征圖以列的順序排列成1 維向量，得到1 X 1344維的特征向量：其中，f(x)表示激活后的特征圖的像素點(diǎn)的值，X表示激活前特征圖的像素點(diǎn)的值，e表示一個(gè)無(wú)限不循環(huán)的自然常數(shù)，取值為2.7182; (4a6)將全連接層Fc5輸出的特征向量輸入全連接層Fc6，構(gòu)成一般神經(jīng)網(wǎng)絡(luò)，輸出為1 X 500維的特征向量； (4a7)將全連接層Fc6輸出的特征向量輸入分類(lèi)層Softmax7,得到車(chē)標(biāo)區(qū)域圖的分類(lèi)標(biāo) 簽，該層會(huì)計(jì)算出每種分類(lèi)標(biāo)簽的概率，并將最大概率的標(biāo)簽輸出，其中softmax分類(lèi)的期望函數(shù)表示如下：其中，α(1)表示卷積神經(jīng)網(wǎng)絡(luò)CNN中全連接層Fc6輸出的特征向量，β(1)表示與卷積神經(jīng) 網(wǎng)絡(luò)CNN中全連接層Fc6輸出的特征向量α(1 >相對(duì)應(yīng)的標(biāo)簽，k表示類(lèi)別數(shù)，i表示樣本，ie [1，m]，m表示車(chē)標(biāo)區(qū)域圖樣本的數(shù)量，Θ表示模型參數(shù)，softmax分類(lèi)損失函數(shù)如下：6.根據(jù)權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法，其特征在于:步驟(4b)中訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)CNN，步驟如下： (4bl)在向前傳播階段，從樣本集中取一個(gè)樣本，信息從卷積神經(jīng)網(wǎng)絡(luò)CNN輸入層經(jīng)過(guò) 逐級(jí)的變換，傳送到卷積神經(jīng)網(wǎng)絡(luò)CNN輸出層，得到相應(yīng)的實(shí)際輸出； (4b2)在向后傳播階段，計(jì)算卷積神經(jīng)網(wǎng)絡(luò)CNN實(shí)際輸出與樣本標(biāo)簽對(duì)應(yīng)的理想輸出的差，按極小化誤差的方法，反向傳播調(diào)整卷積神經(jīng)網(wǎng)絡(luò)CNN的權(quán)值； (4b3)重復(fù)(4bl)和(4b2)的操作，直到卷積神經(jīng)網(wǎng)絡(luò)CNN分類(lèi)層Softmax7之后的輸出損失函數(shù)J(9H 0.0001為止或者迭代15000次為止。
【文檔編號(hào)】G06K9/62GK105868774SQ201610172526
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2016年3月24日
【發(fā)明人】韓紅, 程素華, 張鼎, 衣亞男, 何蘭, 江津
【申請(qǐng)人】西安電子科技大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：韓紅;程素華;張鼎;衣亞男;何蘭;江津;
技術(shù)所有人：西安電子科技大學(xué);
我是此專(zhuān)利的發(fā)明人

上一篇：基于pso算法的不平衡樣本分類(lèi)方法
上一篇：一種基于層次隨機(jī)森林的多標(biāo)簽分類(lèi)方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

卷積神經(jīng)網(wǎng)絡(luò)人臉識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)圖像識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)手寫(xiě)識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)車(chē)牌識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)數(shù)字識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)文字識(shí)別相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)識(shí)別相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于選擇性搜索和卷積神經(jīng)網(wǎng)絡(luò)的車(chē)標(biāo)識(shí)別方法