本技術(shù)屬于人工智能,具體涉及一種對(duì)象識(shí)別方法、對(duì)象識(shí)別裝置、計(jì)算機(jī)可讀介質(zhì)、電子設(shè)備以及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、目標(biāo)跟蹤是指在給定視頻幀中的目標(biāo)對(duì)象的初始化狀態(tài),估計(jì)后續(xù)視頻幀中的目標(biāo)對(duì)象的狀態(tài)。作為計(jì)算機(jī)視覺(jué)最具挑戰(zhàn)性的領(lǐng)域之一,被廣泛應(yīng)用在例如人臉識(shí)別、智能監(jiān)控和自動(dòng)駕駛等場(chǎng)景。目前目標(biāo)跟蹤主要分為傳統(tǒng)的基于相關(guān)濾波的跟蹤算法和基于深度學(xué)習(xí)的跟蹤算法。
2、傳統(tǒng)的目標(biāo)跟蹤方法通常依賴于手工設(shè)計(jì)的特征(灰度特征、顏色特征和形狀特征等)和模型更新策略,為了設(shè)計(jì)這些手工特征和更新模型導(dǎo)致整體跟蹤算法十分復(fù)雜且過(guò)分依賴于人工設(shè)計(jì)的特征。除此以外,這些特征的表征能力有限(特征數(shù)量有限且都是淺層特征),在面對(duì)復(fù)雜場(chǎng)景時(shí)往往效果有限。
3、基于深度學(xué)習(xí)的目標(biāo)跟蹤方法依賴于卷積神經(jīng)網(wǎng)絡(luò)(cnn)和訓(xùn)練大量數(shù)據(jù),cnn通過(guò)卷積層、池化層等結(jié)構(gòu),能夠逐層提取圖像中的特征。從低級(jí)的邊緣、紋理特征,到高級(jí)的形狀、語(yǔ)義特征,cnn能夠形成層次化的特征表示。這種層次化特征提取使得cnn能夠捕捉到圖像中更復(fù)雜的模式和結(jié)構(gòu),再經(jīng)過(guò)大量數(shù)據(jù)進(jìn)行訓(xùn)練,從而具有更強(qiáng)的表征能力,能夠更有效地處理復(fù)雜場(chǎng)景下的跟蹤難題。
4、在基于深度學(xué)習(xí)的目標(biāo)跟蹤方法中,一般通過(guò)卷積操作進(jìn)行圖像特征提取,由于卷積操作具有局部性,每個(gè)卷積核只處理其覆蓋的局部區(qū)域,導(dǎo)致捕捉全局上下文信息能力較差。為了增大圖像特征提取的感受野,可以在卷積操作之后添加池化操作。然而,池化操作容易丟失圖像細(xì)節(jié)信息,受到噪聲或異常值干擾,使得圖像變得模糊,導(dǎo)致對(duì)象識(shí)別跟蹤準(zhǔn)確性差的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種對(duì)象識(shí)別方法、對(duì)象識(shí)別裝置、計(jì)算機(jī)可讀介質(zhì)、電子設(shè)備以及計(jì)算機(jī)程序產(chǎn)品,目的在于提高對(duì)象識(shí)別跟蹤的準(zhǔn)確性。
2、本技術(shù)的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然,或部分地通過(guò)本技術(shù)的實(shí)踐而習(xí)得。
3、根據(jù)本技術(shù)實(shí)施例的一個(gè)方面,提供一種對(duì)象識(shí)別方法,該方法包括:獲取待識(shí)別圖像,并對(duì)所述待識(shí)別圖像進(jìn)行邊緣像素檢測(cè),得到所述待識(shí)別圖像中的邊緣像素點(diǎn)和非邊緣像素點(diǎn);所述邊緣像素點(diǎn)是在所述待識(shí)別圖像中位于內(nèi)容對(duì)象的邊緣區(qū)域的像素點(diǎn),所述非邊緣像素點(diǎn)是在所述待識(shí)別圖像中位于所述內(nèi)容對(duì)象的非邊緣區(qū)域的像素點(diǎn);根據(jù)所述邊緣像素點(diǎn)在池化區(qū)域內(nèi)的分布比例,從多種候選池化算法中選取與所述池化區(qū)域相匹配的目標(biāo)池化算法;所述池化區(qū)域是由具有預(yù)設(shè)尺寸的池化核在所述待識(shí)別圖像上移動(dòng)采集的局部圖像區(qū)域;根據(jù)所述目標(biāo)池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到所述待識(shí)別圖像對(duì)應(yīng)的特征圖;根據(jù)所述特征圖定位待識(shí)別的目標(biāo)對(duì)象在所述待識(shí)別圖像中的分布位置。
4、根據(jù)本技術(shù)實(shí)施例的一個(gè)方面,提供一種對(duì)象識(shí)別裝置,該裝置包括:
5、檢測(cè)模塊,被配置為獲取待識(shí)別圖像,并對(duì)所述待識(shí)別圖像進(jìn)行邊緣像素檢測(cè),得到所述待識(shí)別圖像中的邊緣像素點(diǎn)和非邊緣像素點(diǎn);所述邊緣像素點(diǎn)是在所述待識(shí)別圖像中位于內(nèi)容對(duì)象的邊緣區(qū)域的像素點(diǎn),所述非邊緣像素點(diǎn)是在所述待識(shí)別圖像中位于所述內(nèi)容對(duì)象的非邊緣區(qū)域的像素點(diǎn);
6、選取模塊,被配置為根據(jù)所述邊緣像素點(diǎn)在池化區(qū)域內(nèi)的分布比例,從多種候選池化算法中選取與所述池化區(qū)域相匹配的目標(biāo)池化算法;所述池化區(qū)域是由具有預(yù)設(shè)尺寸的池化核在所述待識(shí)別圖像上移動(dòng)采集的局部圖像區(qū)域;
7、池化模塊,被配置為根據(jù)所述目標(biāo)池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到所述待識(shí)別圖像對(duì)應(yīng)的特征圖;
8、定位模塊,被配置為根據(jù)所述特征圖定位待識(shí)別的目標(biāo)對(duì)象在所述待識(shí)別圖像中的分布位置。
9、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述選取模塊包括:
10、第一統(tǒng)計(jì)模塊,被配置為統(tǒng)計(jì)所述邊緣像素點(diǎn)在所述待識(shí)別圖像中的分布比例,得到所述邊緣像素點(diǎn)的整體區(qū)域占比;
11、第二統(tǒng)計(jì)模塊,被配置為統(tǒng)計(jì)所述邊緣像素點(diǎn)在池化區(qū)域內(nèi)的分布比例,得到所述邊緣像素點(diǎn)的局部區(qū)域占比;
12、算法選取模塊,被配置為根據(jù)所述整體區(qū)域占比與所述局部區(qū)域占比的數(shù)值關(guān)系,從多種候選池化算法中選取與所述池化區(qū)域相匹配的目標(biāo)池化算法。
13、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述候選池化算法包括最大池化算法、平均池化算法和混合池化算法,所述混合池化算法是由所述最大池化算法和所述平均池化算法組合形成的池化算法;所述算法選取模塊進(jìn)一步被配置為:當(dāng)所述局部區(qū)域占比大于所述整體區(qū)域占比時(shí),選取所述最大池化算法作為與所述池化區(qū)域相匹配的目標(biāo)池化算法;當(dāng)所述局部區(qū)域占比小于所述整體區(qū)域占比且大于零時(shí),選取所述混合池化算法作為與所述池化區(qū)域相匹配的目標(biāo)池化算法;當(dāng)所述局部區(qū)域占比等于零時(shí),選取所述平均池化算法作為與所述池化區(qū)域相匹配的目標(biāo)池化算法。
14、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述池化模塊進(jìn)一步被配置為:根據(jù)所述最大池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到第一池化特征值;根據(jù)所述均勻池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到第二池化特征值;以所述局部區(qū)域占比作為加權(quán)系數(shù),對(duì)所述第一池化特征值和所述第二池化特征值進(jìn)行加權(quán)運(yùn)算,得到所述池化區(qū)域的混合池化特征值。
15、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述池化模塊進(jìn)一步被配置為:根據(jù)所述最大池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到第一池化特征值;根據(jù)所述均勻池化算法對(duì)所述池化區(qū)域進(jìn)行池化處理,得到第二池化特征值;以所述局部區(qū)域占比作為選取概率,從所述第一池化特征值和所述第二池化特征值中隨機(jī)選取一個(gè)特征值作為所述池化區(qū)域的混合池化特征值。
16、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述定位模塊包括:
17、模板獲取模塊,被配置為獲取與待識(shí)別的目標(biāo)對(duì)象相對(duì)應(yīng)的特征模板;
18、特征融合模塊,被配置為將所述特征模板與所述特征圖中的候選區(qū)域進(jìn)行特征融合處理,得到所述候選區(qū)域的響應(yīng)圖,所述響應(yīng)圖用于表示所述候選區(qū)域與所述特征模板的相似度;
19、對(duì)象定位模塊,被配置為根據(jù)所述響應(yīng)圖將與所述特征模板相似度最高的候選區(qū)域定位為所述目標(biāo)對(duì)象在所述待識(shí)別圖像中的分布位置。
20、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述特征模板包括預(yù)先配置的靜態(tài)模板和在對(duì)象識(shí)別過(guò)程中動(dòng)態(tài)更新的動(dòng)態(tài)模板;所述特征融合模塊進(jìn)一步被配置為:將所述靜態(tài)模板與所述特征圖中的候選區(qū)域進(jìn)行特征融合處理,得到具有空間信息的第一融合特征;將所述動(dòng)態(tài)模板與所述特征圖中的候選區(qū)域進(jìn)行特征融合處理,得到具有時(shí)間信息的第二融合特征;對(duì)所述第一融合特征和所述第二融合特征進(jìn)行卷積運(yùn)算,得到所述候選區(qū)域的響應(yīng)圖。
21、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述對(duì)象識(shí)別裝置還包括更新模塊,被配置為:根據(jù)所述目標(biāo)對(duì)象在所述待識(shí)別圖像中的分布位置,從所述特征圖中裁剪得到目標(biāo)特征;獲取所述目標(biāo)特征與所述靜態(tài)模板的特征相似度;根據(jù)所述特征相似度更新所述動(dòng)態(tài)模板。
22、在本技術(shù)的一些實(shí)施例中,基于以上技術(shù)方案,所述特征相似度包括各個(gè)像素點(diǎn)處的相似度值;根據(jù)所述特征相似度更新所述動(dòng)態(tài)模板,所述更新模塊還被配置為:以各個(gè)相似點(diǎn)處的相似度值作為權(quán)重,對(duì)所述動(dòng)態(tài)模板的各個(gè)像素值進(jìn)行加權(quán)運(yùn)算,得到更新后的動(dòng)態(tài)模板。
23、根據(jù)本技術(shù)實(shí)施例的一個(gè)方面,提供一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如以上技術(shù)方案中的對(duì)象識(shí)別方法。
24、根據(jù)本技術(shù)實(shí)施例的一個(gè)方面,提供一種電子設(shè)備,該電子設(shè)備包括:處理器;以及存儲(chǔ)器,用于存儲(chǔ)所述處理器的可執(zhí)行指令;其中,所述處理器被配置為執(zhí)行所述可執(zhí)行指令來(lái)實(shí)現(xiàn)如以上技術(shù)方案中的對(duì)象識(shí)別方法。
25、根據(jù)本技術(shù)實(shí)施例的一個(gè)方面,提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如以上技術(shù)方案中的對(duì)象識(shí)別方法。
26、在本技術(shù)實(shí)施例提供的技術(shù)方案中,通過(guò)精細(xì)的邊緣像素檢測(cè)和智能池化算法選擇,有效地提升了圖像識(shí)別的準(zhǔn)確性和效率。首先,通過(guò)邊緣像素檢測(cè)區(qū)分出圖像中的內(nèi)容對(duì)象邊緣和非邊緣區(qū)域,為后續(xù)處理提供了精確的區(qū)域劃分。接著,根據(jù)邊緣像素在池化區(qū)域內(nèi)的分布比例,智能選擇最合適的池化算法,確保了特征提取的針對(duì)性和有效性。最后,通過(guò)池化處理生成的特征圖,能夠準(zhǔn)確定位目標(biāo)對(duì)象在圖像中的位置,從而實(shí)現(xiàn)了高效準(zhǔn)確的圖像識(shí)別。本技術(shù)實(shí)施例提供的技術(shù)方案尤其適用于復(fù)雜場(chǎng)景下的目標(biāo)檢測(cè),能夠顯著提高識(shí)別的準(zhǔn)確率和處理速度。
27、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本技術(shù)。