實(shí)時(shí)圖像提取識(shí)別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及無(wú)人車圖像識(shí)別領(lǐng)域,尤其涉及一種基于卷積伸進(jìn)網(wǎng)絡(luò)的試試圖像物體提取識(shí)別方法及裝置。
【背景技術(shù)】
[0002]無(wú)人車在行駛過(guò)程中,需要根據(jù)路況進(jìn)行決策。路況包括了無(wú)人車決策需要考慮的范圍內(nèi),所有可能影響決策的物體。比如各種動(dòng)態(tài)物體(轎車/公交車/卡車/摩托車、自行車、行人),靜態(tài)需要注意的物體(路標(biāo)/交通燈)以及可以忽略的物體。對(duì)這些物體進(jìn)行快速準(zhǔn)確的識(shí)別是無(wú)人駕駛系統(tǒng)一個(gè)重要的環(huán)節(jié)。無(wú)人車需要對(duì)周圍這些可能影響到自身行駛的物體進(jìn)行完整的偵測(cè)、識(shí)別/分類才能準(zhǔn)確的推測(cè)它們可能的行為,避免碰撞,實(shí)現(xiàn)安全駕駛。
[0003]對(duì)于物體的識(shí)別分類主要有幾種方法:1、基于激光雷達(dá)掃描的物體速度/尺寸模型推測(cè)法;2、基于視覺(jué)的方法;3、基于其他類別傳感器的方法,如微波雷達(dá)或聲納等。視覺(jué)物體檢測(cè)與識(shí)別,比起激光或者其他模態(tài)的傳感器的最大的潛在優(yōu)勢(shì)就是在于圖像中豐富的多的信息含量。然而,豐富的圖像信息也增加了信息的提取和分析的難度,本文通過(guò)卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)模仿人類視覺(jué)神經(jīng)對(duì)于圖像的信息數(shù)據(jù)分析,從而使得無(wú)人車能夠識(shí)別所處環(huán)境中各物體的分類。
[0004]卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種由輸入到輸出的映射,模型能夠通過(guò)大量的學(xué)習(xí)樣本數(shù)據(jù)輸入和輸出間的映射關(guān)系,而不需要對(duì)其作出精確的數(shù)學(xué)表達(dá)式,繼而能運(yùn)用學(xué)習(xí)到的映射模式來(lái)分辨物體種類。其優(yōu)點(diǎn)在于,一是卷積神經(jīng)網(wǎng)絡(luò)對(duì)幾何變換、形變、光照具有一定程度的不變性,二是通過(guò)權(quán)值共享和并行運(yùn)算,訓(xùn)練過(guò)的卷積神經(jīng)網(wǎng)絡(luò)可以用較小的計(jì)算代價(jià)掃描整幅待檢測(cè)圖像,因此,被廣泛應(yīng)用于目標(biāo)檢測(cè)。
【發(fā)明內(nèi)容】
[0005]為此,需要提供一種實(shí)時(shí)圖像提取識(shí)別的方法,解決車輛行駛過(guò)程中快速實(shí)時(shí)圖像提取識(shí)別的問(wèn)題。
[0006]為實(shí)現(xiàn)上述目的,發(fā)明人提供了
[0007]—種實(shí)時(shí)圖像提取識(shí)別方法,包括如下步驟:對(duì)整體圖像進(jìn)行切分,劃分區(qū)域標(biāo)的;
[0008]針對(duì)整體圖片需要提取的特征,設(shè)計(jì)相應(yīng)的濾波器,用所述濾波器對(duì)所有區(qū)域標(biāo)的進(jìn)行卷積,然后添加一個(gè)偏置,得到特征矢量的卷積層;
[0009]對(duì)圖像上不同位置的圖像特征進(jìn)行聚合統(tǒng)計(jì),得到采樣層;
[0010]構(gòu)建包括輸入層、卷積層、采樣層、輸出層的第一卷積神經(jīng)模型;
[0011]用隨機(jī)梯度下降算法訓(xùn)練第一卷積神經(jīng)模型參數(shù)。
[0012]具體地,所述第一卷積神經(jīng)模型包括第一卷積層、第二采樣層、第三卷積層、第四采樣層、第五采樣層、第六連接層、第七連接層;
[0013]所述第一卷積層用于對(duì)整體圖片進(jìn)行過(guò)濾得到第一特征矢量圖;
[0014]所述第二采樣層用于對(duì)第一特征矢量圖進(jìn)行壓縮,再通過(guò)加權(quán)、增加偏置或激活函數(shù)得到壓縮后的第二特征映射圖;
[0015]所述第三卷積層用于對(duì)第二特征映射圖進(jìn)行過(guò)濾得到第三特征矢量圖;
[0016]所述第四采樣層用于對(duì)第三特征矢量圖進(jìn)行壓縮采樣,得到第四特征映射圖;
[0017]所述第五卷積層用于對(duì)第四特征映射圖進(jìn)行過(guò)濾,得到第五特征矢量圖;
[0018]所述第六連接層用于對(duì)第五特征矢量圖進(jìn)行加權(quán)、偏置或半波校正得到第六特征矢量圖;
[0019]所述第七連接層用于對(duì)第六特征矢量圖進(jìn)行加權(quán)、偏置或半波校正得到第七特征矢量圖。
[0020]進(jìn)一步地,“用隨機(jī)梯度下降算法訓(xùn)練第一卷積神經(jīng)模型參數(shù)”后還包括步驟:對(duì)樣本進(jìn)行篩選,設(shè)定區(qū)域標(biāo)的的1U激活函數(shù)閾值,若1U激活函數(shù)值高于閾值則選用該區(qū)域標(biāo)的,否則不選用該區(qū)域標(biāo)的。
[0021 ]優(yōu)選地,還包括步驟,將所述隨機(jī)梯度下降算法中隨機(jī)梯度下降值設(shè)為0.01。
[0022]進(jìn)一步地,還包括反卷積步驟:利用特征過(guò)濾器卷積特征矢量圖,得到輸入圖像。
[0023]—種實(shí)時(shí)圖像提取識(shí)別裝置,包括切分模塊、卷積層設(shè)計(jì)模塊、采樣層設(shè)計(jì)模塊、模型構(gòu)建模塊、訓(xùn)練模塊:
[0024]所述切分模塊用于對(duì)整體圖像進(jìn)行切分,劃分區(qū)域標(biāo)的;
[0025]所述卷積層設(shè)計(jì)模塊用于針對(duì)整體圖片需要提取的特征,設(shè)計(jì)相應(yīng)的濾波器,用所述濾波器對(duì)所有區(qū)域標(biāo)的進(jìn)行卷積,然后添加一個(gè)偏置,得到特征矢量的卷積層;
[0026]所述采樣層設(shè)計(jì)模塊用于對(duì)圖像上不同位置的圖像特征進(jìn)行聚合統(tǒng)計(jì),得到采樣層;
[0027]模型構(gòu)建模塊用于構(gòu)建包括輸入層、卷積層、采樣層、輸出層的第一卷積神經(jīng)模型;
[0028]訓(xùn)練模塊用于用隨機(jī)梯度下降算法訓(xùn)練第一卷積神經(jīng)模型參數(shù)。
[0029]具體地,所述第一卷積神經(jīng)模型包括第一卷積層、第二采樣層、第三卷積層、第四采樣層、第五采樣層、第六連接層、第七連接層;
[0030]所述第一卷積層用于對(duì)整體圖片進(jìn)行過(guò)濾得到第一特征矢量圖;
[0031]所述第二采樣層用于對(duì)第一特征矢量圖進(jìn)行壓縮,再通過(guò)加權(quán)、增加偏置或激活函數(shù)得到壓縮后的第二特征映射圖;
[0032]所述第三卷積層用于對(duì)第二特征映射圖進(jìn)行過(guò)濾得到第三特征矢量圖;
[0033]所述第四采樣層用于對(duì)第三特征矢量圖進(jìn)行壓縮采樣,得到第四特征映射圖;
[0034]所述第五卷積層用于對(duì)第四特征映射圖進(jìn)行過(guò)濾,得到第五特征矢量圖;
[0035]所述第六連接層用于對(duì)第五特征矢量圖進(jìn)行加權(quán)、偏置或半波校正得到第六特征矢量圖;
[0036]所述第七連接層用于對(duì)第六特征矢量圖進(jìn)行加權(quán)、偏置或半波校正得到第七特征矢量圖。
[0037]進(jìn)一步地,還包括參數(shù)設(shè)定模塊,所述參數(shù)設(shè)定模塊用于對(duì)樣本進(jìn)行篩選,設(shè)定區(qū)域標(biāo)的的1U激活函數(shù)閾值,若1U激活函數(shù)值高于閾值則選用該區(qū)域標(biāo)的,否則不選用該區(qū)域標(biāo)的。
[0038]進(jìn)一步地,所述參數(shù)設(shè)定模塊還用于將所述隨機(jī)梯度下降算法中隨機(jī)梯度下降值設(shè)為0.01。
[0039]具體地,還包括反卷積模塊,所述反卷積模塊用于進(jìn)行反卷積,利用特征過(guò)濾器卷積特征矢量圖,得到輸入圖像。
[0040]區(qū)別于現(xiàn)有技術(shù),上述技術(shù)方案通過(guò)劃分區(qū)塊設(shè)計(jì)卷積神經(jīng)模型,進(jìn)行訓(xùn)練,達(dá)到了識(shí)別實(shí)時(shí)圖像的技術(shù)效果。
【附圖說(shuō)明】
[0041 ]圖1為本發(fā)明【具體實(shí)施方式】所述的實(shí)時(shí)圖像提取識(shí)別方法流程圖;
[0042]圖2為本發(fā)明【具體實(shí)施方式】所述的實(shí)時(shí)圖像提取識(shí)別裝置模塊圖;
[0043]圖3為本發(fā)明【具體實(shí)施方式】所述的分割區(qū)域標(biāo)的示意圖;
[0044]圖4為本發(fā)明【具體實(shí)施方式】所述的經(jīng)過(guò)縮放調(diào)整后的訓(xùn)練圖片示意圖;
[0045]圖5為本發(fā)明【具體實(shí)施方式】所述的分割區(qū)域標(biāo)的示意圖;
[0046]圖6為本發(fā)明【具體實(shí)施方式】所述的卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)造的簡(jiǎn)易圖;
[0047]附圖標(biāo)記說(shuō)明:
[0048]200、切分模塊;
[0049]202、卷積層設(shè)計(jì)模塊;
[0050]204、采樣層設(shè)計(jì)模塊;
[0051 ]206、模型構(gòu)建模塊;
[0052]208、訓(xùn)練模塊;
[0053]210、參數(shù)設(shè)定模塊;
[0054]212、反卷積模塊。
【具體實(shí)施方式】
[0055]為詳細(xì)說(shuō)明技術(shù)方案的技術(shù)內(nèi)容、構(gòu)造特征、所實(shí)現(xiàn)目的及效果,以下結(jié)合具體實(shí)施例并配合附圖詳予說(shuō)明。
[0056]1、本文總體思路
[0057]如圖3所示,本文中的模型在進(jìn)行物體檢測(cè)時(shí),先將輸入圖片分割成小塊的區(qū)域標(biāo)的,在其中選出2000個(gè)區(qū)域標(biāo)的作為模型的輸入值,而后對(duì)圖片格式進(jìn)行縮放調(diào)整后輸入模型,在模型中,這些區(qū)域標(biāo)的作為層級(jí)結(jié)構(gòu)中的最底層的輸入,信息通過(guò)各層的濾波器,選出圖片檢測(cè)數(shù)據(jù)中最顯著的特征,最后再通過(guò)分類器得出圖像物體的分類結(jié)果。
[0058]模型流程
[0059]—般來(lái)說(shuō),卷積神經(jīng)網(wǎng)絡(luò)通常是由輸入、卷積層、子采樣層、全連接層、分類層、輸出這些基本要素來(lái)組成的,具體的模型設(shè)計(jì)應(yīng)該要根據(jù)實(shí)際的應(yīng)用需求或者特定針對(duì)的問(wèn)題,來(lái)決定要用多少卷積層和子采樣層、采用什么分類器等等。當(dāng)確定好了卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)以后,一般采用向前傳播和向后傳播的方法來(lái)訓(xùn)練模型,從而得出相應(yīng)的參數(shù)值。如上圖所示,第一步是將設(shè)計(jì)好結(jié)構(gòu)的模型通過(guò)大量的分類樣本圖片數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,得出各參數(shù)值。第二步才是將訓(xùn)練好的模型運(yùn)用于具體的目標(biāo)圖片任務(wù),從而得出圖片中各物體的分類結(jié)果。圖片中的模型結(jié)構(gòu)設(shè)計(jì)只是個(gè)示例,本文主要是在Alex模型的基礎(chǔ)上做了一些改進(jìn)措施。
[0060]用卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行圖像物體檢測(cè)
[0061]圖像物體檢測(cè)系統(tǒng)包括三個(gè)主要步驟。第一步是對(duì)整體圖片進(jìn)行切分,劃分出區(qū)域標(biāo)的,這些區(qū)域標(biāo)的包含了能被檢測(cè)出來(lái)的所有信息。第二部是運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)來(lái)從每個(gè)區(qū)域標(biāo)的中提取固定長(zhǎng)度的特征矢量。最后,是通過(guò)就特征信息數(shù)據(jù)進(jìn)行各物體分類的線性分析和閥值判斷得出物體分類結(jié)果。
[0062]2、用卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行圖像物體檢測(cè)
[0063]I)劃分區(qū)域標(biāo)的
[0064]請(qǐng)參閱圖1,為本發(fā)明實(shí)時(shí)圖像提取識(shí)別方法流程示意圖,