本發(fā)明涉及計(jì)算機(jī)視覺技術(shù)領(lǐng)域,尤其涉及一種目標(biāo)檢測(cè)輔助的場景識(shí)別方法。
背景技術(shù):
場景識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要問題,由計(jì)算機(jī)自動(dòng)判斷該圖像或照片是屬于何種具體的場景,尤其是在視頻監(jiān)控、社交網(wǎng)絡(luò)用戶行為挖掘等方面發(fā)揮著重要的作用。
然而,由于場景本身的復(fù)雜性以及光照、遮擋、尺度變化等因素,現(xiàn)有的場景識(shí)別方法仍無法很好的區(qū)分的場景類別,例如一張圖片有一群人,計(jì)算機(jī)就很難把圖片分類到商場或車站或集會(huì)游行等場景,這樣便降低了給場景識(shí)別的準(zhǔn)確率。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種目標(biāo)檢測(cè)輔助的場景識(shí)別方法,以實(shí)現(xiàn)目標(biāo)檢測(cè)輔助場景識(shí)別的方法,以減少場景識(shí)別方法中對(duì)場景區(qū)分錯(cuò)誤的問題。
本發(fā)明提供一種目標(biāo)檢測(cè)輔助的場景識(shí)別方法,包括:
獲取待識(shí)別圖片,對(duì)所述待識(shí)別圖片進(jìn)行采樣,得到預(yù)設(shè)數(shù)量和預(yù)設(shè)大小的樣本,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景;
獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖,根據(jù)所述區(qū)域建議和所述待識(shí)別圖片,獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分;其中,所述區(qū)域建議用于指示包含至少一個(gè)目標(biāo)的至少部分的區(qū)域,所述區(qū)域建議為區(qū)域建議網(wǎng)絡(luò)對(duì)第二特征圖進(jìn)行處理得到的,所述第一特征圖和所述第二特征圖為fastr-cnn網(wǎng)絡(luò)中對(duì)所述待識(shí)別圖片進(jìn)行卷積處理得到的;
根據(jù)所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景和各所述目標(biāo)的分類得分,得到所述待識(shí)別圖片對(duì)應(yīng)的場景。
可選地,在所述根據(jù)卷積網(wǎng)絡(luò)模型對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景之前,還包括:
獲取訓(xùn)練圖片以及所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,所述標(biāo)簽用于指示所述訓(xùn)練圖片對(duì)應(yīng)的場景;
根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)模型和所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,獲取各所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù);
所述根據(jù)卷積網(wǎng)絡(luò)模型對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景,包括:
根據(jù)各所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。
可選地,所述根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)模型和所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,獲取各所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),包括:
對(duì)所述訓(xùn)練圖片進(jìn)行分割采樣,得到擴(kuò)增后的訓(xùn)練圖片;
根據(jù)第一預(yù)設(shè)訓(xùn)練參數(shù),對(duì)所述擴(kuò)增后的訓(xùn)練圖片進(jìn)行預(yù)設(shè)處理,得到預(yù)設(shè)數(shù)量的第三特征圖,所述預(yù)設(shè)處理包括卷積、池化、歸一化處理;
對(duì)所述預(yù)設(shè)數(shù)量的第三特征圖進(jìn)行多次全連接處理,得到所述訓(xùn)練圖片對(duì)應(yīng)的場景概率;
根據(jù)所述場景概率和所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,對(duì)所述第一預(yù)設(shè)訓(xùn)練參數(shù)進(jìn)行調(diào)整,得到所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
可選地,所述獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖,包括:
通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述待識(shí)別圖片進(jìn)行卷積處理,得到共享卷積層;
從所述共享卷積層提取所述第二特征圖,根據(jù)所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),通過所述區(qū)域建議網(wǎng)絡(luò)對(duì)所述第二特征圖進(jìn)行區(qū)域建議處理,得到各目標(biāo)區(qū)域的區(qū)域得分,根據(jù)所述區(qū)域得分,得到所述區(qū)域建議;
將所述共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到所述第一特征圖,所述特有卷積層包含的卷積層的個(gè)數(shù)大于所述共享卷積層包含的卷積層的個(gè)數(shù)。
可選地,所述根據(jù)所述區(qū)域建議和所述待識(shí)別圖片,獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分,包括:
根據(jù)所述區(qū)域建議,對(duì)所述第一特征圖進(jìn)行區(qū)域標(biāo)記處理,得到所述區(qū)域標(biāo)記處理后的第一特征圖;
通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述區(qū)域標(biāo)記處理后的第一特征圖進(jìn)行池化處理,得到池化處理后的第一特征圖;
對(duì)所述池化處理后的第一特征圖進(jìn)行全連接處理;
根據(jù)所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分。
可選地,在所述獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖之前,還包括:
獲取訓(xùn)練圖片以及所述訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,所述目標(biāo)區(qū)域用于指示完整的目標(biāo)在所述訓(xùn)練圖片中的位置;
根據(jù)所述fastr-cnn網(wǎng)絡(luò)、所述區(qū)域建議網(wǎng)絡(luò)以及所述訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,獲取各所述目標(biāo)的所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)和所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
可選地,所述根據(jù)所述fastr-cnn網(wǎng)絡(luò)、所述區(qū)域建議網(wǎng)絡(luò)以及所述訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,獲取各所述目標(biāo)的所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)和所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),包括:
通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述訓(xùn)練圖片進(jìn)行卷積處理,得到共享卷積層;
從所述共享卷積層提取所述第二特征圖,根據(jù)第二預(yù)設(shè)訓(xùn)練參數(shù),通過所述區(qū)域建議網(wǎng)絡(luò)對(duì)所述第二特征圖進(jìn)行區(qū)域建議處理,得到所述區(qū)域得分,根據(jù)所述區(qū)域得分,得到所述區(qū)域建議;
將所述共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到所述第一特征圖,所述特有卷積層包含的卷積層的個(gè)數(shù)大于所述共享卷積層包含的卷積層的個(gè)數(shù);
根據(jù)所述區(qū)域建議,對(duì)所述第一特征圖進(jìn)行區(qū)域標(biāo)記處理,得到所述區(qū)域標(biāo)記處理后的第一特征圖;
通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述區(qū)域標(biāo)記出后的第一特征圖進(jìn)行池化處理,得到池化處理后的第一特征圖;
對(duì)所述池化處理后的第一特征圖進(jìn)行全連接處理,根據(jù)第三預(yù)設(shè)訓(xùn)練參數(shù),獲取所述訓(xùn)練圖片中的各目標(biāo)的分類得分;
根據(jù)所述區(qū)域建議、所述訓(xùn)練圖片中的各目標(biāo)的分類得分以及所述目標(biāo)區(qū)域,調(diào)整所述第二預(yù)設(shè)訓(xùn)練參數(shù)和所述第三預(yù)設(shè)訓(xùn)練參數(shù),得到所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)和所述各所述目標(biāo)的所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法,通過根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)各待識(shí)別圖片采樣得到的樣本進(jìn)行場景識(shí)別,得到待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。再通過待識(shí)別圖片的區(qū)域建議和待識(shí)別圖片對(duì)應(yīng)的第一特征圖,獲取待識(shí)別圖片中的各目標(biāo)的分類得分完成目標(biāo)檢測(cè)過程。最后通過待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景和各目標(biāo)的分類得分,得到待識(shí)別圖片對(duì)應(yīng)的場景。本發(fā)明通過fastr-cnn網(wǎng)絡(luò)和區(qū)域建議網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法輔助場景識(shí)別方法,使得場景識(shí)別方法的準(zhǔn)確率提高。其中,區(qū)域建議網(wǎng)絡(luò)向fastr-cnn網(wǎng)絡(luò)提供了有目標(biāo)區(qū)域的區(qū)域建立,大大降低了fastr-cnn網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)的時(shí)間,提高了fastr-cnn網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)的速率。
附圖說明
圖1為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖一;
圖2為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖二;
圖3為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖三;
圖4為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖四;
圖5為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法中alexnet模型的訓(xùn)練過程示意圖;
圖6為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖五;
圖7為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法中fastr-cnn網(wǎng)絡(luò)和區(qū)域建議網(wǎng)絡(luò)的訓(xùn)練過程示意圖。
具體實(shí)施方式
圖1為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖一,圖2為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖二,圖3為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖三,如圖1所示,本實(shí)施例的目標(biāo)檢測(cè)輔助的場景識(shí)別方法包括:
步驟101、獲取待識(shí)別圖片,對(duì)所述待識(shí)別圖片進(jìn)行采樣,得到預(yù)設(shè)數(shù)量和預(yù)設(shè)大小的樣本,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。
具體地,本實(shí)施例中待識(shí)別圖片的尺寸可根據(jù)具體選擇卷積神經(jīng)網(wǎng)絡(luò)模型的網(wǎng)絡(luò)選定,待識(shí)別圖片的數(shù)量可根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練學(xué)習(xí)過程中對(duì)不同質(zhì)量數(shù)據(jù)情況進(jìn)行調(diào)整,本實(shí)施例對(duì)此不做具體限定。且卷積神經(jīng)網(wǎng)絡(luò)模型可選用alexnet、vgg16、vgg19、resnet等模型,本實(shí)施例對(duì)此也不做限定。
進(jìn)一步地,本實(shí)施例中可對(duì)每一張待識(shí)別圖片通過剪裁切割取樣的方法,將一張待識(shí)別圖片擴(kuò)增多倍,得到預(yù)設(shè)數(shù)量和預(yù)設(shè)大小的樣本,以防止過擬合,從而提高每張待識(shí)別圖片的場景識(shí)別的準(zhǔn)確性。本實(shí)施例中對(duì)預(yù)設(shè)數(shù)量和預(yù)設(shè)大小不做限定,只需待識(shí)別圖片擴(kuò)增后的數(shù)量能夠滿足卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練需求學(xué)習(xí)即可。
例如,為了方便說明,本實(shí)施例選用alexnet模型舉例進(jìn)行說明??煞謩e從一張待識(shí)別圖片和該張水平翻轉(zhuǎn)后的待識(shí)別圖片對(duì)應(yīng)的左上、右上、左下、右下、中間位置進(jìn)行剪裁采樣,那么一張待識(shí)別圖片便獲得到了10個(gè)樣本,將這10個(gè)樣本均輸入到alexnet模型中進(jìn)行場景識(shí)別,得到對(duì)應(yīng)的10個(gè)場景識(shí)別的結(jié)果,這里可將場景識(shí)別的結(jié)果通過矩陣進(jìn)行表示,其中矩陣的行數(shù)為一行,列數(shù)為場景類型,各個(gè)矩陣值為0至1之間的小數(shù),且各個(gè)矩陣值相加之和為1。再對(duì)這10個(gè)樣本對(duì)應(yīng)的矩陣相加取平均值作為該待識(shí)別圖片的場景識(shí)別概率矩陣,取其中概率最大值所對(duì)應(yīng)的場景,即為待識(shí)別圖片的最終識(shí)別的場景結(jié)果。其余的待識(shí)別圖片均按照上述方式進(jìn)行場景識(shí)別,得到對(duì)應(yīng)的場景識(shí)別的結(jié)果。
進(jìn)一步地,對(duì)于車站和集會(huì)游行等難以區(qū)別的場景,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)對(duì)待識(shí)別圖片進(jìn)行的場景識(shí)別將無法識(shí)別,得到的場景識(shí)別的結(jié)果可能將車站的圖片識(shí)別成集會(huì)游行,將集會(huì)游行的圖片識(shí)別成車站,這樣待識(shí)別圖片很有可能會(huì)對(duì)應(yīng)的至少兩個(gè)場景。
步驟102、獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖,根據(jù)所述區(qū)域建議和所述待識(shí)別圖片,獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分。
其中,所述區(qū)域建議用于指示包含至少一個(gè)目標(biāo)的至少部分的區(qū)域,所述區(qū)域建議為區(qū)域建議網(wǎng)絡(luò)對(duì)第二特征圖進(jìn)行處理得到的,所述第一特征圖和所述第二特征圖為快速版基于區(qū)域建議網(wǎng)絡(luò)的目標(biāo)識(shí)別方法(fastregion-basedconvolutionalnetworkmethod,fastr-cnn)網(wǎng)絡(luò)中對(duì)所述待識(shí)別圖片進(jìn)行卷積處理得到的。
具體地,本實(shí)施例中對(duì)待識(shí)別圖片進(jìn)行目標(biāo)檢測(cè),可將待識(shí)別圖片中的目標(biāo)識(shí)別出來。
一方面,如圖2所示,本實(shí)施例中獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖,包括:
步驟201、通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述待識(shí)別圖片進(jìn)行卷積處理,得到共享卷積層。
步驟202、從所述共享卷積層提取所述第二特征圖,根據(jù)所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),通過所述區(qū)域建議網(wǎng)絡(luò)對(duì)所述第二特征圖進(jìn)行區(qū)域建議處理,得到各目標(biāo)區(qū)域的區(qū)域得分,根據(jù)所述區(qū)域得分,得到所述區(qū)域建議。
具體地,本實(shí)施例中將待識(shí)別圖片輸入到fastr-cnn網(wǎng)絡(luò)中進(jìn)行卷積處理,得到共享卷積層,從共享卷積層中提取一層對(duì)應(yīng)的第二特征圖,輸入到區(qū)域建議網(wǎng)絡(luò)中進(jìn)行區(qū)域建議處理,便可得到區(qū)域得分。其中,區(qū)域建議處理為對(duì)待識(shí)別圖片進(jìn)行滑窗處理并進(jìn)行多次卷積或全連接處理,區(qū)域得分是用以表達(dá)該區(qū)域是否存在目標(biāo)和目標(biāo)的概率大小。
步驟203、將所述共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到所述第一特征圖,所述特有卷積層包含的卷積層的個(gè)數(shù)大于所述共享卷積層包含的卷積層的個(gè)數(shù)。
具體地,為了不丟失其他信息,fastr-cnn網(wǎng)絡(luò)在共享卷積層的基礎(chǔ)上還會(huì)繼續(xù)進(jìn)行卷積處理,使得信息更加完整,即可將共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到第一特征圖。本實(shí)施例中對(duì)預(yù)設(shè)層數(shù)不做具體限定。例如,從共享卷積層提取第5層對(duì)應(yīng)的第二特征圖傳送給區(qū)域建議網(wǎng)絡(luò),將共享卷積層的第9層對(duì)應(yīng)的第一特征圖作為特有卷積層。
另一方面,如圖3所示,本實(shí)施例所述根據(jù)所述區(qū)域建議和所述待識(shí)別圖片,獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分,包括:
步驟301、根據(jù)所述區(qū)域建議,對(duì)所述第一特征圖進(jìn)行區(qū)域標(biāo)記處理,得到所述區(qū)域標(biāo)記處理后的第一特征圖。
具體地,本實(shí)施例中可選出區(qū)域得分較高的若干區(qū)域,將這些區(qū)域?qū)?yīng)在待識(shí)別圖片的具體位置作為區(qū)域建議傳輸給fastr-cnn網(wǎng)絡(luò),fastr-cnn網(wǎng)絡(luò)便根據(jù)區(qū)域建議可將第一特征圖進(jìn)行區(qū)域標(biāo)記處理,這樣fastr-cnn網(wǎng)絡(luò)只需對(duì)標(biāo)記區(qū)域進(jìn)行各目標(biāo)的分類得分過程,對(duì)于沒有目標(biāo)的區(qū)域則無需進(jìn)行分類得分的過程,從而節(jié)省了對(duì)待識(shí)別圖片的目標(biāo)檢測(cè)時(shí)間。
步驟302、通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述區(qū)域標(biāo)記處理后的第一特征圖進(jìn)行池化處理,得到池化處理后的第一特征圖。
進(jìn)一步地,由于區(qū)域標(biāo)記處理后的第一特征圖的尺寸大小不一致,則需要經(jīng)過池化處理將其尺寸標(biāo)準(zhǔn)化,得到池化處理后的第一特征圖。
步驟303、對(duì)所述池化處理后的第一特征圖進(jìn)行全連接處理。
具體地,由于池化處理后的第一特征圖有很多張全方位的圖,經(jīng)過全連接處理,可降低其維度,便于分類得分的操作。
步驟304、根據(jù)所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分。
具體地,本實(shí)施例中分類得分不僅能夠說明待識(shí)別圖片中是否有目標(biāo),還能說明待識(shí)別圖片中有各種目標(biāo)的概率大小。且fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)是fastr-cnn網(wǎng)絡(luò)訓(xùn)練得到的最優(yōu)化參數(shù),能夠準(zhǔn)確得將待識(shí)別圖片中的目標(biāo)檢測(cè)出來。這樣通過獲取所述待識(shí)別圖片中的各目標(biāo)的分類得分便可判斷出某種目標(biāo)是否在待識(shí)別圖片中。
此處需要說明的是,步驟101的順序可在步驟102之前,步驟102的順序可在步驟101之前,步驟101和步驟102的順序可同時(shí)進(jìn)行。本實(shí)施例中對(duì)步驟101和步驟102的先后順序不做限定。
步驟103、根據(jù)所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景和各所述目標(biāo)的分類得分,得到所述待識(shí)別圖片對(duì)應(yīng)的場景。
具體地,步驟101可將待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景識(shí)別出來,這樣變縮小了場景選擇的范圍,比如可能將車站和集會(huì)游行這樣人數(shù)較多的場景對(duì)應(yīng)待識(shí)別圖片的場景。步驟102能夠?qū)⒋R(shí)別圖片中各所述目標(biāo)的分類得分檢測(cè)出來,比如,集會(huì)游行的場景大多會(huì)有橫幅的存在,可將橫幅作為目標(biāo)。這樣將待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景和各目標(biāo)的分類得分結(jié)合起來,以識(shí)別出待識(shí)別圖片對(duì)應(yīng)的場景。例如,若待識(shí)別圖片中有橫幅,則該待識(shí)別圖片對(duì)應(yīng)的場景便為集會(huì)游行。若待識(shí)別圖片中沒有橫幅,則該待識(shí)別圖片對(duì)應(yīng)的場景便為車站。
本實(shí)施例提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法,通過根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)各待識(shí)別圖片采樣得到的樣本進(jìn)行場景識(shí)別,得到待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。再通過待識(shí)別圖片的區(qū)域建議和待識(shí)別圖片對(duì)應(yīng)的第一特征圖,獲取待識(shí)別圖片中的各目標(biāo)的分類得分完成目標(biāo)檢測(cè)過程。最后通過待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景和各目標(biāo)的分類得分,得到待識(shí)別圖片對(duì)應(yīng)的場景。本實(shí)施例中通過fastr-cnn網(wǎng)絡(luò)和區(qū)域建議網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法輔助場景識(shí)別方法,使得場景識(shí)別方法的準(zhǔn)確率提高。其中,區(qū)域建議網(wǎng)絡(luò)向fastr-cnn網(wǎng)絡(luò)提供了有目標(biāo)區(qū)域的區(qū)域建立,大大降低了fastr-cnn網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)的時(shí)間,提高了fastr-cnn網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)的速率。
圖4為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖四,如圖4所示,在所述根據(jù)卷積網(wǎng)絡(luò)模型對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景之前,本實(shí)施例的方法還包括:
步驟401、獲取訓(xùn)練圖片以及所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,所述標(biāo)簽用于指示所述訓(xùn)練圖片對(duì)應(yīng)的場景。
具體地,本實(shí)施例中訓(xùn)練圖片可通過數(shù)據(jù)庫中獲得,也可通過手動(dòng)獲得,本實(shí)施例對(duì)此不做限定,只需保證每一種場景對(duì)應(yīng)的訓(xùn)練圖片的數(shù)量能夠達(dá)到千張即可。若是手動(dòng)獲取的訓(xùn)練圖片,可通過水平翻轉(zhuǎn)和裁剪采樣的方式對(duì)訓(xùn)練圖進(jìn)行樣本擴(kuò)充。且若卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)訓(xùn)練圖片的尺寸大小有要求,可通過裁剪取樣的方式將訓(xùn)練圖片變成統(tǒng)一的尺寸,本實(shí)施例中可根據(jù)卷積神經(jīng)網(wǎng)絡(luò)模型的具體模型進(jìn)行是否需要剪裁取樣過程的判斷。同時(shí),本實(shí)施例中還需要獲取訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,其標(biāo)簽為訓(xùn)練圖片對(duì)應(yīng)的場景類別。
步驟402、根據(jù)所述卷積神經(jīng)網(wǎng)絡(luò)模型和所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,獲取各所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
具體地,將訓(xùn)練圖片和其對(duì)應(yīng)的標(biāo)簽輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中,卷積神經(jīng)網(wǎng)絡(luò)模型便可進(jìn)行訓(xùn)練學(xué)習(xí)的過程。由于訓(xùn)練圖片和訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽都是已知的,可通過動(dòng)態(tài)調(diào)整第一預(yù)設(shè)訓(xùn)練參數(shù),使得卷積神經(jīng)網(wǎng)絡(luò)模型能夠?qū)W習(xí)到各種類別的場景,進(jìn)而將不同場景區(qū)分開來。具體方法如下:
步驟4021、對(duì)所述訓(xùn)練圖片進(jìn)行分割采樣,得到擴(kuò)增后的訓(xùn)練圖片。
具體地,通過分割采樣的過程將一種場景類別的訓(xùn)練圖片變成數(shù)倍統(tǒng)一尺寸大小、同一場景的訓(xùn)練圖片,擴(kuò)增了訓(xùn)練圖片的數(shù)量,操作簡單,且為卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練學(xué)習(xí)提供了更多的參考。
步驟4022、根據(jù)第一預(yù)設(shè)訓(xùn)練參數(shù),對(duì)所述擴(kuò)增后的訓(xùn)練圖片進(jìn)行預(yù)設(shè)處理,得到預(yù)設(shè)數(shù)量的第三特征圖,所述預(yù)設(shè)處理包括卷積、池化、歸一化處理。
具體地,隨機(jī)設(shè)定卷積神經(jīng)網(wǎng)絡(luò)模型的參數(shù)為第一預(yù)設(shè)訓(xùn)練參數(shù),對(duì)擴(kuò)增后的訓(xùn)練圖片進(jìn)行卷積、池化、歸一化處理后,便可得到預(yù)設(shè)數(shù)量、能夠清晰表達(dá)訓(xùn)練圖片對(duì)于場景的第三特征圖。
步驟4023、對(duì)所述預(yù)設(shè)數(shù)量的第三特征圖進(jìn)行多次全連接處理,得到所述訓(xùn)練圖片對(duì)應(yīng)的場景概率。
具體地,由于預(yù)設(shè)處理后的第三特征圖有很多張全方位的圖,經(jīng)過多次全連接處理,便可到訓(xùn)練圖片對(duì)應(yīng)的場景概率。其中,多次全連接處理可降低第三特征圖的維度,不會(huì)損失過多信息,有效保證分類效果。
步驟4024、根據(jù)所述場景概率和所述訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽,對(duì)所述第一預(yù)設(shè)訓(xùn)練參數(shù)進(jìn)行調(diào)整,得到所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
具體地,通過對(duì)比場景概率和訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽是否一致,動(dòng)態(tài)調(diào)整第一預(yù)設(shè)訓(xùn)練參數(shù),使得場景概率與訓(xùn)練圖片對(duì)應(yīng)的標(biāo)簽一致,便可將此時(shí)的第一預(yù)設(shè)訓(xùn)練參數(shù)作為場景對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
步驟403、根據(jù)各所述場景對(duì)應(yīng)的所述卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),對(duì)各所述樣本進(jìn)行場景識(shí)別,得到所述待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。
具體地,由于場景對(duì)應(yīng)的卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)所建立的卷積神經(jīng)網(wǎng)絡(luò)模型能夠?qū)鼍拜^好地識(shí)別出來,對(duì)待識(shí)別圖片對(duì)應(yīng)的樣本進(jìn)行場景識(shí)別,便可得到待識(shí)別圖片對(duì)應(yīng)的至少兩個(gè)場景。
圖5為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法中alexnet模型的訓(xùn)練過程示意圖,在一個(gè)具體的實(shí)施例中,以alexnet模型為例,需要先對(duì)alexnet模型訓(xùn)練學(xué)習(xí),再進(jìn)行對(duì)待識(shí)別圖片進(jìn)行場景識(shí)別,如圖5所示。
首先,將三通道的256*256大小的訓(xùn)練圖片輸入到alexnet模型中,alexnet模型能夠檢測(cè)訓(xùn)練圖片的標(biāo)簽,且經(jīng)過分割采樣后得到三通道的256*256大小的圖片,經(jīng)過卷積計(jì)算并激活處理,其中激活處理采樣了激活函數(shù),如修正線性單元(rectifiedlinearunit,relu,relu)。其中,relu的數(shù)學(xué)表達(dá)式為:f(x)=max(0,x),其中x代表輸入信號(hào),f(x)代表輸出信號(hào)。當(dāng)輸入信號(hào)小于0時(shí),輸出信號(hào)為0;若輸入信號(hào)等于或大于0時(shí),輸出信號(hào)等于輸入信號(hào)。可知,使用relu得到隨機(jī)梯度下降(stochasticgradientdescent,sgd)方法的收斂速度會(huì)比其他函數(shù)(如傳統(tǒng)方法中的激活函數(shù)sigmoid/tanh)要快很多。由于relu是線性的,relu只需要一個(gè)閾值就可以得到激活值,而不用去算一大堆復(fù)雜的運(yùn)算。因此,能夠優(yōu)化卷積過程,從而得到96張55*55大小的特征圖,再進(jìn)行池化和歸一化處理,得到96張27*27大小的特征圖,再次經(jīng)過卷積計(jì)算并激活處理,得到256張27*27大小的特征圖,又進(jìn)行池化和歸一化處理,得到256張13*13大小的特征圖,又進(jìn)行池化和歸一化處理,得到384張13*13大小的特征圖,又經(jīng)過卷積計(jì)算并激活處理,得到256張13*13大小的特征圖,又進(jìn)行池化處理,得到256張6*6大小的特征圖,接著進(jìn)行三次全連接處理并進(jìn)行激活處理,便可得到訓(xùn)練圖片對(duì)應(yīng)場景的結(jié)果,即訓(xùn)練圖片對(duì)應(yīng)的場景概率。再根據(jù)訓(xùn)練圖片的標(biāo)簽,調(diào)整上述整個(gè)過程,即改變了alexnet模型的第一預(yù)設(shè)訓(xùn)練參數(shù),直至訓(xùn)練圖片對(duì)應(yīng)的場景概率與訓(xùn)練圖片的標(biāo)簽一致,且所alexnet模型訓(xùn)練收斂到一定區(qū)間,損失值控制在可以接受的范圍內(nèi),此時(shí)停止訓(xùn)練。將此時(shí)的第一預(yù)設(shè)訓(xùn)練參數(shù)作為場景對(duì)應(yīng)的alexnet模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。這樣,便完成了alexnet模型訓(xùn)練學(xué)習(xí)的全過程。
接著,向alexnet模型輸入一張待識(shí)別圖片進(jìn)行場景識(shí)別時(shí),由于上述的訓(xùn)練學(xué)習(xí)的過程將alexnet模型的場景對(duì)應(yīng)的alexnet模型對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)確定,便可將這張待識(shí)別圖片對(duì)應(yīng)的場景識(shí)別出來。
圖6為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法的流程圖五,如圖6所示,在所述獲取所述待識(shí)別圖片的區(qū)域建議和所述待識(shí)別圖片對(duì)應(yīng)的第一特征圖之前,本實(shí)施例的方法還包括:
步驟601、獲取訓(xùn)練圖片以及所述訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,所述目標(biāo)區(qū)域用于指示完整的目標(biāo)在所述訓(xùn)練圖片中的位置。
具體地,本實(shí)施例中訓(xùn)練圖片可通過數(shù)據(jù)庫中獲得,也可通過手動(dòng)獲得,本實(shí)施例對(duì)此不做限定。由于fastr-cnn網(wǎng)絡(luò)的輸入圖片的尺寸沒有限定,則無需對(duì)訓(xùn)練圖片進(jìn)行分割取樣處理。同時(shí),本實(shí)施例中還需要獲取訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,其目標(biāo)區(qū)域用于指示完整的目標(biāo)在訓(xùn)練圖片中的實(shí)際位置。
步驟602、根據(jù)所述fastr-cnn網(wǎng)絡(luò)、所述區(qū)域建議網(wǎng)絡(luò)以及所述訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域,獲取各所述目標(biāo)的所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)和所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
具體地,將訓(xùn)練圖片和其對(duì)應(yīng)的目標(biāo)區(qū)域輸入到fastr-cnn網(wǎng)絡(luò)中,fastr-cnn網(wǎng)絡(luò)和區(qū)域建議網(wǎng)絡(luò)便可進(jìn)行訓(xùn)練學(xué)習(xí)的過程。由于訓(xùn)練圖片和訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域都是已知的,可通過動(dòng)態(tài)調(diào)整第二預(yù)設(shè)訓(xùn)練參數(shù),使得區(qū)域建議網(wǎng)絡(luò)能夠?qū)W習(xí)到各種目標(biāo)是否在訓(xùn)練圖片中存在,得到目標(biāo)存在的區(qū)域建議,將區(qū)域建議傳送給fastr-cnn網(wǎng)絡(luò),可減少fastr-cnn網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測(cè)的實(shí)時(shí)間,提高效率。同時(shí),也可通過動(dòng)態(tài)調(diào)整第三預(yù)設(shè)訓(xùn)練參數(shù),使得fastr-cnn網(wǎng)絡(luò)能夠?qū)W習(xí)到各種訓(xùn)練圖片中各類目標(biāo),進(jìn)而將訓(xùn)練圖片中各類目標(biāo)區(qū)分開來。具體方法如下:
步驟6021、通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述訓(xùn)練圖片進(jìn)行卷積處理,得到共享卷積層。
具體地,本實(shí)施例中將訓(xùn)練圖片輸入到fastr-cnn網(wǎng)絡(luò)中進(jìn)行卷積處理,得到共享卷積層。
步驟6022、從所述共享卷積層提取所述第二特征圖,根據(jù)第二預(yù)設(shè)訓(xùn)練參數(shù),通過所述區(qū)域建議網(wǎng)絡(luò)對(duì)所述第二特征圖進(jìn)行區(qū)域建議處理,得到所述區(qū)域得分,根據(jù)所述區(qū)域得分,得到所述區(qū)域建議。
具體地,從共享卷積層中提取一層對(duì)應(yīng)的第二特征圖,輸入到區(qū)域建議網(wǎng)絡(luò)中進(jìn)行區(qū)域建議處理,便可得到區(qū)域得分。其中,區(qū)域建議處理為對(duì)訓(xùn)練圖片進(jìn)行滑窗處理并進(jìn)行多次卷積或全連接處理。區(qū)域得分是用以表達(dá)該區(qū)域是否存在目標(biāo)和目標(biāo)的概率大小。
步驟6023、將所述共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到所述第一特征圖,所述特有卷積層包含的卷積層的個(gè)數(shù)大于所述共享卷積層包含的卷積層的個(gè)數(shù)。
具體地,為了不丟失其他信息,fastr-cnn網(wǎng)絡(luò)在共享卷積層的基礎(chǔ)上還會(huì)繼續(xù)進(jìn)行卷積處理,使得信息更加完整,即可將共享卷積層疊加預(yù)設(shè)層數(shù)的卷積層作為特有卷積層,得到第一特征圖。本實(shí)施例中對(duì)預(yù)設(shè)層數(shù)不做具體限定。例如,從共享卷積層提取第5層對(duì)應(yīng)的第二特征圖傳送給區(qū)域建議網(wǎng)絡(luò),將共享卷積層的第9層對(duì)應(yīng)的第一特征圖作為特有卷積層。
步驟6024、根據(jù)所述區(qū)域建議,對(duì)所述第一特征圖進(jìn)行區(qū)域標(biāo)記處理,得到所述區(qū)域標(biāo)記處理后的第一特征圖。
具體地,本實(shí)施例中可選出區(qū)域得分較高的若干區(qū)域,將這些區(qū)域?qū)?yīng)在訓(xùn)練圖片的具體位置作為區(qū)域建議傳輸給fastr-cnn網(wǎng)絡(luò),fastr-cnn網(wǎng)絡(luò)便根據(jù)區(qū)域建議可將第一特征圖進(jìn)行區(qū)域標(biāo)記處理,使得fastr-cnn網(wǎng)絡(luò)只需對(duì)標(biāo)記區(qū)域進(jìn)行各目標(biāo)的分類得分過程,對(duì)于沒有目標(biāo)的區(qū)域則無需進(jìn)行分類得分的過程,從而節(jié)省了對(duì)訓(xùn)練圖片的目標(biāo)檢測(cè)時(shí)間。
步驟6025、通過所述fastr-cnn網(wǎng)絡(luò)對(duì)所述區(qū)域標(biāo)記出后的第一特征圖進(jìn)行池化處理,得到池化處理后的第一特征圖。
具體地,由于區(qū)域標(biāo)記處理后的第一特征圖的尺寸大小不一致,則需要經(jīng)過池化處理將其尺寸標(biāo)準(zhǔn)化,得到池化處理后的第一特征圖。
步驟6026、對(duì)所述池化處理后的第一特征圖進(jìn)行全連接處理,根據(jù)第三預(yù)設(shè)訓(xùn)練參數(shù),獲取所述訓(xùn)練圖片中的各目標(biāo)的分類得分。
具體地,由于池化處理后的第一特征圖有很多張全方位的圖,經(jīng)過全連接處理,可降低其維度,便于分類得分的操作。
步驟6027、根據(jù)所述區(qū)域建議、所述訓(xùn)練圖片中的各目標(biāo)的分類得分以及所述目標(biāo)區(qū)域,調(diào)整所述第二預(yù)設(shè)訓(xùn)練參數(shù)和所述第三預(yù)設(shè)訓(xùn)練參數(shù),得到所述區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)和所述各所述目標(biāo)的所述fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
具體地,由于目標(biāo)區(qū)域?yàn)橐阎?,便可根?jù)目標(biāo)區(qū)域動(dòng)態(tài)調(diào)整第三預(yù)設(shè)訓(xùn)練參數(shù),使得目標(biāo)檢測(cè)根據(jù)準(zhǔn)確,從而將第三預(yù)設(shè)訓(xùn)練參數(shù)作為各目標(biāo)的fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。同時(shí),還可再根據(jù)區(qū)域建議和目標(biāo)區(qū)域,動(dòng)態(tài)調(diào)整第二預(yù)設(shè)訓(xùn)練參數(shù),使得區(qū)域得分對(duì)應(yīng)的區(qū)域建議更加準(zhǔn)確,變減少了fastr-cnn網(wǎng)絡(luò)對(duì)訓(xùn)練圖片進(jìn)行目標(biāo)檢測(cè)的時(shí)間,從而將第二預(yù)設(shè)訓(xùn)練參數(shù)作為區(qū)域建議網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。
圖7為本發(fā)明提供的目標(biāo)檢測(cè)輔助的場景識(shí)別方法中fastr-cnn網(wǎng)絡(luò)和rpn網(wǎng)絡(luò)的訓(xùn)練過程示意圖,在一個(gè)具體的實(shí)施例中,需要先對(duì)fastr-cnn網(wǎng)絡(luò)和區(qū)域建議網(wǎng)絡(luò)(regionproposalnetworks,rpn)一起對(duì)訓(xùn)練圖片進(jìn)行訓(xùn)練學(xué)習(xí),再進(jìn)行待識(shí)別圖片的場景識(shí)別過程,如圖7所示。
首先,將任意大小的訓(xùn)練圖片輸入到fastr-cnn網(wǎng)絡(luò)中,獲取訓(xùn)練圖片對(duì)應(yīng)的目標(biāo)區(qū)域。通過fastr-cnn網(wǎng)絡(luò)對(duì)訓(xùn)練圖片進(jìn)行卷積處理,得到共享卷積層。rpn網(wǎng)絡(luò)從共享卷積層提取第二特征圖,對(duì)第二特征圖進(jìn)行滑窗處理,再進(jìn)行兩次卷積處理或全連接處理后,即每個(gè)滑窗內(nèi)的像素點(diǎn)都形成9個(gè)不同大小的區(qū)域,分別與目標(biāo)區(qū)域進(jìn)行比較,根據(jù)第二預(yù)設(shè)訓(xùn)練參數(shù),得到對(duì)應(yīng)的區(qū)域得分,選取得分最高的300個(gè)區(qū)域作為區(qū)域建議,傳送給fastr-cnn網(wǎng)絡(luò)中。再將共享卷積層疊加若干層數(shù)的卷積層作為特有卷積層,便可得到第一特征圖。本實(shí)施例中可根據(jù)區(qū)域建議,對(duì)第一特征圖進(jìn)行區(qū)域標(biāo)記處理,得到區(qū)域標(biāo)記處理后的第一特征,再通過fastr-cnn網(wǎng)絡(luò)對(duì)區(qū)域標(biāo)記出后的第一特征圖進(jìn)行池化處理,得到池化處理后的第一特征圖。再對(duì)池化處理后的第一特征圖進(jìn)行全連接處理,根據(jù)第三預(yù)設(shè)訓(xùn)練參數(shù),獲取所述訓(xùn)練圖片中的各目標(biāo)的分類得分。此時(shí),判斷第三預(yù)設(shè)訓(xùn)練參數(shù)與目標(biāo)區(qū)域是否一致。若不一致,動(dòng)態(tài)調(diào)整第三預(yù)設(shè)訓(xùn)練參數(shù),同時(shí)也根據(jù)區(qū)域建議以及目標(biāo)區(qū)域,調(diào)整第二預(yù)設(shè)訓(xùn)練參數(shù),直至第三預(yù)設(shè)訓(xùn)練參數(shù)與目標(biāo)區(qū)域一致,且fastr-cnn網(wǎng)絡(luò)和rpn網(wǎng)絡(luò)訓(xùn)練收斂到一定區(qū)間,損失值控制在可以接受的范圍內(nèi),此時(shí)停止訓(xùn)練。將此時(shí)的第二預(yù)設(shè)訓(xùn)練參數(shù)作為rpn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù),且將此時(shí)的第三預(yù)設(shè)訓(xùn)練參數(shù)做為fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)。這樣,便完成了fastr-cnn網(wǎng)絡(luò)和rpn網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)的全過程。
接著,向fastr-cnn網(wǎng)絡(luò)輸入一張待識(shí)別圖片進(jìn)行目標(biāo)檢測(cè)時(shí),由于上述的訓(xùn)練學(xué)習(xí)的過程將fastr-cnn網(wǎng)絡(luò)的目標(biāo)對(duì)應(yīng)的fastr-cnn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)確定,rpn網(wǎng)絡(luò)的目標(biāo)對(duì)應(yīng)的rpn網(wǎng)絡(luò)對(duì)應(yīng)的網(wǎng)絡(luò)參數(shù)也確定,便可將這張待識(shí)別圖片對(duì)應(yīng)的目標(biāo)識(shí)別出來,且還能節(jié)省rpn網(wǎng)絡(luò)的區(qū)域建議還節(jié)省了fastr-cnn網(wǎng)絡(luò)的檢測(cè)時(shí)間。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。