欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖片中目標(biāo)物的定位方法及裝置與流程

文檔序號(hào):12748867閱讀:245來(lái)源:國(guó)知局
圖片中目標(biāo)物的定位方法及裝置與流程

本公開(kāi)涉及圖像處理技術(shù)領(lǐng)域,尤其涉及一種圖片中目標(biāo)物的定位方法及裝置。



背景技術(shù):

當(dāng)通過(guò)已訓(xùn)練的全卷積神經(jīng)網(wǎng)絡(luò)(Full Convolutional Neural Networks,簡(jiǎn)稱(chēng)為FCN)模型對(duì)圖片中的人臉進(jìn)行檢測(cè)時(shí),通過(guò)該FCN模型得到一熱度圖(heat map),通過(guò)在熱度圖中識(shí)別目標(biāo)物(例如,人臉)所在區(qū)域的概率,然后在原始圖片中進(jìn)行全圖掃描,由于需要在原始圖片中搜索目標(biāo)物的位置,導(dǎo)致數(shù)據(jù)處理量大,識(shí)別效率低下。



技術(shù)實(shí)現(xiàn)要素:

為克服相關(guān)技術(shù)中存在的問(wèn)題,本公開(kāi)實(shí)施例提供一種圖片中目標(biāo)物的定位方法及裝置,用以降低圖片處理過(guò)程中的數(shù)據(jù)量,提高識(shí)別目標(biāo)物的效率。

根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種圖片中目標(biāo)物的定位方法,包括:

根據(jù)已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片;

將所述第一圖片輸入到所述第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第一熱度圖,所述第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上計(jì)算出的概率值;

基于所述第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域;

將所述候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第二全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理后,輸出第二熱度圖,所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第二全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上的概率值;

基于所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域。

在一實(shí)施例中,所述基于所述第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域,可包括:

在所述第一熱度圖上,確定是否存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

當(dāng)存在所述概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),確定所述概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述方法還可包括:

當(dāng)不存在所述概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),根據(jù)所述第一全卷積神經(jīng)網(wǎng)絡(luò)的第二預(yù)設(shè)縮放比例對(duì)所述原始圖片進(jìn)行縮放處理,所述第二預(yù)設(shè)縮放比例大于所述第一預(yù)設(shè)縮放比例,得到第二圖片;

將所述第二圖片輸入到所述第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第三熱度圖,所述第三熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上計(jì)算出的概率值;

當(dāng)所述第三熱度圖上存在概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),通過(guò)所述第三熱度圖確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述通過(guò)所述第三熱度圖確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域,可包括:

確定所述第三熱度圖上概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

確定所述概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述基于所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域,可包括:

在所述第二熱度圖上,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

確定所述概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域。

根據(jù)本公開(kāi)實(shí)施例的第二方面,提供一種圖片中目標(biāo)物的定位裝置,包括:

第一縮放模塊,被配置為根據(jù)已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片;

第一處理模塊,被配置為將所述第一縮放模塊縮放處理后的所述第一圖片輸入到所述第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第一熱度圖,所述第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上計(jì)算出的概率值;

第一確定模塊,被配置為基于所述第一處理模塊得到的所述第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域;

第二處理模塊,被配置為將所述第一確定模塊確定的所述候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第二全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理后,輸出第二熱度圖,所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第二全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上的概率值;

第二確定模塊,被配置為基于所述第二處理模塊處理得到的所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域。

在一實(shí)施例中,所述第一確定模塊可包括:

第一確定子模塊,被配置為在所述第一熱度圖上,確定是否存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第二確定子模塊,被配置為當(dāng)所述第一確定子模塊確定存在所述概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),確定所述概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第三確定子模塊,被配置為基于所述第二確定子模塊確定的在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述裝置還可包括:

第二縮放模塊,被配置為當(dāng)所述第一確定子模塊確定不存在所述概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),根據(jù)所述第一全卷積神經(jīng)網(wǎng)絡(luò)的第二預(yù)設(shè)縮放比例對(duì)所述原始圖片進(jìn)行縮放處理,所述第二預(yù)設(shè)縮放比例大于所述第一預(yù)設(shè)縮放比例,得到第二圖片;

第一處理模塊,還被配置為將所述第二圖片輸入到所述第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第三熱度圖,所述第三熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上計(jì)算出的概率值;

第三確定模塊,被配置為當(dāng)所述第一處理模塊處理得到的所述第三熱度圖上存在概率值大于所述第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),通過(guò)所述第三熱度圖確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述第三確定模塊可包括:

第四確定子模塊,被配置為確定所述第一處理模塊處理得到的所述第三熱度圖上概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第五確定子模塊,被配置為確定所述第四確定子模塊確定的所述概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第六確定子模塊,被配置為基于所述第五確定子模塊確定的在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域。

在一實(shí)施例中,所述第二確定模塊可包括:

第七確定子模塊,被配置為在所述第二熱度圖上,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第八確定子模塊,被配置為確定所述第七確定子模塊確定的所述概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第九確定子模塊,被配置為基于所述第八確定子模塊確定的所述在所述原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域。

根據(jù)本公開(kāi)實(shí)施例的第三方面,提供一種圖片中目標(biāo)物的定位裝置,包括:

處理器;

用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;

其中,所述處理器被配置為:

根據(jù)已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片;

將所述第一圖片輸入到所述第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第一熱度圖,所述第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上計(jì)算出的概率值;

基于所述第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定所述目標(biāo)物在所述原始圖片中的候選區(qū)域;

將所述候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)所述第二全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理后,輸出第二熱度圖,所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為所述第二全卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)物在所述原始圖片上的概率值;

基于所述第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定所述目標(biāo)物在所述原始圖片中的位置區(qū)域。

本公開(kāi)的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:

通過(guò)第一FCN對(duì)應(yīng)的第一熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域,再將候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到第二FCN中,得到第二熱度圖,通過(guò)第二熱度圖識(shí)別目標(biāo)物在原始圖片中的位置區(qū)域,從而實(shí)現(xiàn)了通過(guò)第一FCN粗定位和第二FCN精細(xì)定位,由于第一FCN只需要在原始圖片中找到目標(biāo)物所在的候選區(qū)域,因此能夠快速確定目標(biāo)物在原始圖片中的大致范圍,通過(guò)第二FCN對(duì)候選區(qū)域中的圖像內(nèi)容進(jìn)行識(shí)別掃描,大大降低了第二FCN處理圖像的數(shù)據(jù)量,提高了目標(biāo)物的識(shí)別效率,實(shí)現(xiàn)了在小區(qū)域內(nèi)精準(zhǔn)定位目標(biāo)物在原始圖片中的位置。

應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。

附圖說(shuō)明

此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本發(fā)明的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本發(fā)明的原理。

圖1A是根據(jù)一示例性實(shí)施例示出的圖片中目標(biāo)物的定位方法的流程圖。

圖1B是根據(jù)一示例性實(shí)施例示出的圖片中目標(biāo)物的定位方法的場(chǎng)景圖。

圖2是根據(jù)一示例性實(shí)施例一示出的圖片中目標(biāo)物的定位方法的流程圖。

圖3是根據(jù)一示例性實(shí)施例二示出的圖片中目標(biāo)物的定位方法的流程圖。

圖4是根據(jù)一示例性實(shí)施例三示出的訓(xùn)練第一全卷積神經(jīng)網(wǎng)絡(luò)的流程圖。

圖5是根據(jù)一示例性實(shí)施例示出的一種圖片中目標(biāo)物的定位裝置的框圖。

圖6是根據(jù)一示例性實(shí)施例示出的另一種圖片中目標(biāo)物的定位裝置的框圖。

圖7是根據(jù)一示例性實(shí)施例示出的一種適用于圖片中目標(biāo)物的定位裝置的框圖。

具體實(shí)施方式

這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說(shuō)明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書(shū)中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。

圖1A是根據(jù)一示例性實(shí)施例示出的圖片中目標(biāo)物的定位方法的流程圖,圖1B是根據(jù)一示例性實(shí)施例示出的圖片中目標(biāo)物的定位方法的場(chǎng)景圖;該圖片中目標(biāo)物的定位方法可以應(yīng)用在電子設(shè)備(例如:智能手機(jī)、平板電腦)上,可以通過(guò)在電子設(shè)備上安裝應(yīng)用的方式實(shí)現(xiàn),如圖1A所示,該圖片中目標(biāo)物的定位方法包括以下步驟101-105:

在步驟101中,根據(jù)已訓(xùn)練的第一FCN的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片。

在一實(shí)施例中,可以為第一FCN設(shè)置一系列的預(yù)設(shè)縮放比例(Scale),例如,Scale=[0.3,0.5,0.7,1],第一預(yù)設(shè)縮放比例可以為該一系列的預(yù)設(shè)縮放比例中的最小值,例如第一預(yù)設(shè)縮放比例為0.3,如圖1B所示,原始圖片111的分辨率為1000*1200時(shí),預(yù)處理模塊11可以將原始圖片按照0.3的比例進(jìn)行縮放,得到的第一圖片的分辨率為300*360,第一圖片例如為圖1B中所示的輸入到第一FCN11的圖片。

在步驟102中,將第一圖片輸入到第一FCN中,通過(guò)第一FCN進(jìn)行卷積處理,輸出第一熱度圖,第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一FCN對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值。

在一實(shí)施例中,第一熱度圖的大小可以由第一FCN最后一個(gè)卷基層的輸出維度確定,例如,第一FCN最后一個(gè)卷基層的輸出維度為10*12,第一熱度圖的大小為為10*12。在一實(shí)施例中,第一熱度圖對(duì)應(yīng)的同一顏色的不同深度或者不同的顏色可以表示對(duì)應(yīng)位置是否為目標(biāo)物的概率值,如圖1B,第一熱度圖112上,顏色越深,表示該點(diǎn)對(duì)應(yīng)的區(qū)域?yàn)槟繕?biāo)物的概率值越大。在一實(shí)施例中,目標(biāo)物可以為任何具有設(shè)定特征的物體,例如,人臉、車(chē)牌號(hào)、動(dòng)物頭像等等,圖1B以目標(biāo)物為人臉為例進(jìn)行示例性說(shuō)明。

在步驟103中,基于第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,當(dāng)?shù)谝粺岫葓D上存在坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值符合目標(biāo)物的識(shí)別條件時(shí),可以將該坐標(biāo)點(diǎn)映射到原始圖片上,例如,第一熱度圖上的【5,6】、【5,5】、【6,5】等坐標(biāo)點(diǎn)符合目標(biāo)物的識(shí)別條件,則可以將【5,6】、【5,5】、【6,5】在第一熱度圖上的區(qū)域映射到原始圖片上,得到候選區(qū)域,候選區(qū)域例如圖1B中所示的原始圖片111中標(biāo)號(hào)10所示的區(qū)域,該區(qū)域的大小在縮放處理后的第一圖片上為30*40,對(duì)30*40除以第一預(yù)設(shè)縮放比例0.3,可得到該候選區(qū)域在原始圖片111的大小為100*133。

在步驟104中,將候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二FCN中,通過(guò)第二FCN進(jìn)行卷積處理后,輸出第二熱度圖,第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第二FCN對(duì)目標(biāo)物在原始圖片上的概率值。

在一實(shí)施例中,將標(biāo)號(hào)10對(duì)應(yīng)的大小為100*133的圖像內(nèi)容輸入到第二FCN12,得到第二熱度圖113。在一實(shí)施例中,第二熱度圖113的大小可以由第二FCN13最后一個(gè)卷基層的輸出維度確定,例如,第二FCN13最后一個(gè)卷基層的輸出維度為3*4,第二熱度圖113的大小為3*4。在一實(shí)施例中,第二熱度圖對(duì)應(yīng)的同一顏色的不同深度或者不同的顏色可以表示對(duì)應(yīng)位置是否為目標(biāo)物的概率值,如圖1B,第二熱度圖113上,顏色越深,表示該點(diǎn)對(duì)應(yīng)的區(qū)域?yàn)槟繕?biāo)物的概率值越大。

在步驟105中,基于第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定目標(biāo)物在原始圖片中的位置區(qū)域。

在一實(shí)施例中,當(dāng)?shù)诙岫葓D上存在坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值符合目標(biāo)物的識(shí)別條件時(shí),可以將該坐標(biāo)點(diǎn)映射到原始圖片上,例如,第二熱度圖上的【3,2】、【2,2】、【2,3】等坐標(biāo)點(diǎn)符合目標(biāo)物的識(shí)別條件,則可以將【3,2】、【2,2】、【2,3】在第二熱度圖上的區(qū)域映射到原始圖片上,得到目標(biāo)物在原始圖片111的位置區(qū)域,例如,標(biāo)號(hào)13對(duì)應(yīng)的位置區(qū)域,對(duì)應(yīng)一個(gè)人臉,類(lèi)似的方式,可以得到標(biāo)號(hào)14對(duì)應(yīng)的位置區(qū)域,對(duì)應(yīng)另一個(gè)人臉。

本實(shí)施例中,通過(guò)第一FCN對(duì)應(yīng)的第一熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域,再將候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到第二FCN中,得到第二熱度圖,通過(guò)第二熱度圖識(shí)別目標(biāo)物在原始圖片中的位置區(qū)域,從而實(shí)現(xiàn)了通過(guò)第一FCN粗定位和第二FCN精細(xì)定位,由于第一FCN只需要在原始圖片中找到目標(biāo)物所在的候選區(qū)域,因此能夠快速確定目標(biāo)物在原始圖片中的大致范圍,通過(guò)第二FCN對(duì)候選區(qū)域中的圖像內(nèi)容進(jìn)行識(shí)別掃描,大大降低了第二FCN處理圖像的數(shù)據(jù)量,提高了目標(biāo)物的識(shí)別效率,實(shí)現(xiàn)了在小區(qū)域內(nèi)精準(zhǔn)定位目標(biāo)物在原始圖片中的位置。

在一實(shí)施例中,基于第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定目標(biāo)物在原始圖片中的候選區(qū)域,可包括:

在第一熱度圖上,確定是否存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

當(dāng)存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,圖片中目標(biāo)物的定位方法進(jìn)一步還包括:

當(dāng)不存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),根據(jù)第一全卷積神經(jīng)網(wǎng)絡(luò)的第二預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,第二預(yù)設(shè)縮放比例大于第一預(yù)設(shè)縮放比例,得到第二圖片;

將第二圖片輸入到第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第三熱度圖,第三熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值;

當(dāng)?shù)谌裏岫葓D上存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),通過(guò)第三熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,通過(guò)第三熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域,可包括:

確定第三熱度圖上概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,基于第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定目標(biāo)物在原始圖片中的位置區(qū)域,可包括:

在第二熱度圖上,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的位置區(qū)域。

在一實(shí)施例中,圖片中目標(biāo)物的定位方法進(jìn)一步還包括:

在得到已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)之前,確定需要對(duì)未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的第一設(shè)定數(shù)量的第一樣本圖片,第一設(shè)定數(shù)量的第一樣本圖片中的每一個(gè)樣本圖片中均包含目標(biāo)物,目標(biāo)物位于相應(yīng)第一樣本圖片的中心位置,目標(biāo)物在第一樣本圖片中的比例位于第一設(shè)定范圍內(nèi);

將第一設(shè)定數(shù)量的第一樣本圖片縮放到第一設(shè)定分辨率后,通過(guò)縮放到設(shè)定分辨率的樣本圖片對(duì)未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò);

修改已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)的全連接層,得到已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)。

在一實(shí)施例中,圖片中目標(biāo)物的定位方法進(jìn)一步還包括:

在得到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)之前,確定需要對(duì)未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的第二設(shè)定數(shù)量的第二樣本圖片,第二設(shè)定數(shù)量的第二樣本圖片中的每一個(gè)樣本圖片中均包含目標(biāo)物,目標(biāo)物位于相應(yīng)第二樣本圖片的中心位置,目標(biāo)物在第二樣本圖片中的比例位于第二設(shè)定范圍內(nèi);

將第二設(shè)定數(shù)量的第二樣本圖片縮放到第二設(shè)定分辨率后,通過(guò)縮放到第二設(shè)定分辨率的樣本圖片對(duì)未訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò);

修改已訓(xùn)練的第二卷積神經(jīng)網(wǎng)絡(luò)的全連接層,得到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)。

如何定位圖片中目標(biāo)物的,請(qǐng)參考后續(xù)實(shí)施例。

至此,本公開(kāi)實(shí)施例提供的上述方法,可以快速確定目標(biāo)物在原始圖片中的大致范圍,大大降低處理圖像的數(shù)據(jù)量,提高目標(biāo)物的識(shí)別效率,實(shí)現(xiàn)在小區(qū)域內(nèi)精準(zhǔn)定位目標(biāo)物在原始圖片中的位置。

下面以具體實(shí)施例來(lái)說(shuō)明本公開(kāi)實(shí)施例提供的技術(shù)方案。

圖2是根據(jù)一示例性實(shí)施例一示出的圖片中目標(biāo)物的定位方法的流程圖;本實(shí)施例利用本公開(kāi)實(shí)施例提供的上述方法,以如何基于第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值確定出目標(biāo)物在原始圖片中的候選區(qū)域?yàn)槔⒔Y(jié)合圖1B進(jìn)行示例性說(shuō)明,如圖2所示,包括如下步驟:

在步驟201中,在第一熱度圖上,確定是否存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn),當(dāng)存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),執(zhí)行步驟202,當(dāng)不存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),執(zhí)行步驟204。

在一實(shí)施例中,概率值越大,表示概率值所在的坐標(biāo)點(diǎn)為目標(biāo)物的概率越大,可以通過(guò)不同的顏色來(lái)表示不同的概率值。如圖1B所示,在第一熱度圖112的大小為10*12,對(duì)應(yīng)120個(gè)概率值,可以將該120個(gè)概率值順次與第一預(yù)設(shè)閾值進(jìn)行比較,確定第一熱度圖上是否存在大于該第一預(yù)設(shè)閾值的概率值。

在步驟202中,當(dāng)存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn)。

在一實(shí)施例中,可以根據(jù)第一熱度圖與縮放處理后的第一圖片的映射關(guān)系,確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),該映射關(guān)系可以通過(guò)相關(guān)技術(shù)中的映射公式來(lái)表示,本公開(kāi)不再詳述。

在步驟203中,基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域,流程結(jié)束。

如圖1B所示,由于在第一熱度圖桑的每一個(gè)點(diǎn)對(duì)應(yīng)原始圖片中的一片區(qū)域,對(duì)于第一熱度圖中的坐標(biāo)點(diǎn)【5,6】、【5,5】、【6,5】,可在原始圖片11上對(duì)應(yīng)三個(gè)區(qū)域,基于三個(gè)區(qū)域的交集或者并集可以確定出目標(biāo)物所在的候選區(qū)域,例如,候選區(qū)域的中心坐標(biāo)為【500,400】,候選區(qū)域的寬度為100,長(zhǎng)度為133,即:候選區(qū)域的大小為100*133。

在步驟204中,當(dāng)不存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),根據(jù)第一全卷積神經(jīng)網(wǎng)絡(luò)的第二預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,第二預(yù)設(shè)縮放比例大于第一預(yù)設(shè)縮放比例,得到第二圖片。

在一實(shí)施例中,第一FCN可以對(duì)應(yīng)一系列的預(yù)設(shè)縮放比例,當(dāng)原始圖像通過(guò)第一預(yù)設(shè)縮放比例縮放后,通過(guò)第一FCN得到的第一熱度圖上找不到大于第一預(yù)設(shè)閾值的概率值時(shí),表示原始圖片111由于被過(guò)度縮小導(dǎo)致目標(biāo)物不能被識(shí)別出來(lái),因此可以通過(guò)比第一預(yù)設(shè)縮放比例更大的第二預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理。

在步驟205中,將第二圖片輸入到第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第三熱度圖,第三熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值。

本步驟中的描述可以參考上述對(duì)第一FCN12對(duì)第一圖片的處理,在此不再詳述。

在步驟206中,當(dāng)?shù)谌裏岫葓D上存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),通過(guò)第三熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域,流程結(jié)束。

在一實(shí)施例中,可以確定第三熱度圖上概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn),確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域,其中,具體的舉例,可以參見(jiàn)上述關(guān)于如何通過(guò)第二熱度圖確定原始圖片中的候選區(qū)域的描述。

本領(lǐng)域技術(shù)人員可以理解的是,當(dāng)通過(guò)第三熱度圖仍識(shí)別不出人臉時(shí),則可以通過(guò)類(lèi)似上述的過(guò)程,通過(guò)比第二預(yù)設(shè)縮放比例更大的預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,直至能夠通過(guò)對(duì)應(yīng)的熱度圖識(shí)別出原始圖片上的目標(biāo)物即可。

本實(shí)施例中,通過(guò)從小到大的預(yù)設(shè)縮放比例對(duì)原始圖像進(jìn)行縮放處理,可以確保第一FCN能夠在識(shí)別到目標(biāo)物的基礎(chǔ)上,對(duì)原始圖片的較低分辨率對(duì)應(yīng)的圖片進(jìn)行處理,從而大大降低了第一FCN處理的數(shù)據(jù)量并快速在原始圖片上定位到目標(biāo)物的大致范圍。

圖3是根據(jù)一示例性實(shí)施例二示出的圖片中目標(biāo)物的定位方法的流程圖;本實(shí)施例利用本公開(kāi)實(shí)施例提供的上述方法,以如何基于第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定目標(biāo)物在原始圖片中的位置區(qū)域?yàn)槔M(jìn)行示例性說(shuō)明,如圖3所示,包括如下步驟:

在步驟301中,在第二熱度圖上,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)。

在步驟302中,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn)。

在步驟303中,基于在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在所述原始圖片中的位置區(qū)域。

在一實(shí)施例中,當(dāng)?shù)诙岫葓D上存在坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值符合目標(biāo)物的識(shí)別條件時(shí),可以將該坐標(biāo)點(diǎn)映射到原始圖片上,例如,第二熱度圖上的【3,2】、【2,2】、【2,3】等坐標(biāo)點(diǎn)符合目標(biāo)物的識(shí)別條件,則可以將【3,2】、【2,2】、【2,3】在第二熱度圖上的區(qū)域映射到原始圖片上,得到目標(biāo)物在原始圖片111的位置區(qū)域,例如,標(biāo)號(hào)13對(duì)應(yīng)的位置區(qū)域,對(duì)應(yīng)一個(gè)人臉,類(lèi)似的方式,可以得到標(biāo)號(hào)14對(duì)應(yīng)的位置區(qū)域,對(duì)應(yīng)另一個(gè)人臉。具體映射方法可以參考相關(guān)技術(shù)中的描述,在此不再詳述。

本實(shí)施例中,通過(guò)從小到大的預(yù)設(shè)縮放比例對(duì)原始圖像進(jìn)行縮放處理,可以確保第一FCN能夠在識(shí)別到目標(biāo)物的基礎(chǔ)上,對(duì)原始圖片的較低分辨率對(duì)應(yīng)的圖片進(jìn)行處理,從而大大降低了第一FCN處理的數(shù)據(jù)量并快速在原始圖片上定位到目標(biāo)物的大致范圍。

圖4是根據(jù)一示例性實(shí)施例三示出的訓(xùn)練第一全卷積神經(jīng)網(wǎng)絡(luò)的流程圖;本實(shí)施例利用本公開(kāi)實(shí)施例提供的上述方法,以如何訓(xùn)練得到第一FCN為例進(jìn)行示例性說(shuō)明,如圖4所示,包括如下步驟:

在步驟401中,在得到已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)之前,確定需要對(duì)未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的第一設(shè)定數(shù)量的第一樣本圖片,第一設(shè)定數(shù)量的第一樣本圖片中的每一個(gè)樣本圖片中均包含目標(biāo)物,目標(biāo)物位于相應(yīng)第一樣本圖片的中心位置,目標(biāo)物在第一樣本圖片中的比例位于第一設(shè)定范圍內(nèi)。

在步驟402中,將第一設(shè)定數(shù)量的第一樣本圖片縮放到第一設(shè)定分辨率后,通過(guò)縮放到第一設(shè)定分辨率的樣本圖片對(duì)未訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)。

在步驟403中,修改已訓(xùn)練的第一卷積神經(jīng)網(wǎng)絡(luò)的全連接層,得到已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)。

在一示例性場(chǎng)景中,以目標(biāo)物為人臉進(jìn)行示例性說(shuō)明,采集的樣本圖片中,人臉區(qū)域放置在樣本圖片的中心,人臉大小占整個(gè)樣本圖片的比例在0.15-1之間,0.15-1為本公開(kāi)所述的第一設(shè)定范圍,從而可以確保訓(xùn)練出的第一FCN模型,在輸入圖片的維度為227*227時(shí),可以檢測(cè)到的人臉大概在34-227之間,從而實(shí)現(xiàn)多個(gè)尺度的人臉檢測(cè)。

將不同分辨率大小的樣本圖片縮放處理到256X256,256X256為本公開(kāi)中所述的第一設(shè)定分辨率,對(duì)縮放到第一設(shè)定分辨率的樣本圖片對(duì)未訓(xùn)練的第一CNN進(jìn)行訓(xùn)練。

以第一CNN為alexNet網(wǎng)絡(luò)進(jìn)行示例性說(shuō)明,將第一CNN的第一個(gè)全連接(fc6)修改為卷積層,在修改時(shí),fc6的卷積核大小需要和第五卷積層(conv5)的輸出的特征映射層(featuremap)的大小一致。修改后的第一個(gè)全連接對(duì)應(yīng)的卷積層fc6_conv的卷積大小為kernel_size=6,修改后的fc6的后續(xù)的全連接層fc7、fc8等的卷積核的大小為1,即:kernel_size=1,最終得到已訓(xùn)練的第一FCN。

本實(shí)施例中,由于第一FCN是通過(guò)對(duì)目標(biāo)物的大致范圍進(jìn)行訓(xùn)練后得到的,因此通過(guò)第一FCN可以快速地確定出目標(biāo)物在圖片中的大概范圍,從而可以通過(guò)已訓(xùn)練的第一FCN對(duì)目標(biāo)物在原始圖片上進(jìn)行粗定位。

對(duì)于第二FCN的訓(xùn)練過(guò)程,可以參考上述圖4所示實(shí)施例中對(duì)第一FCN的訓(xùn)練過(guò)程的描述,與上述第一FCN不同的是,第二FCN中的第二樣本圖片中的每一個(gè)樣本圖片中均包含目標(biāo)物,目標(biāo)物位于相應(yīng)第二樣本圖片的中心位置,目標(biāo)物在第二樣本圖片中的比例位于第二設(shè)定范圍內(nèi)。

在一示例性場(chǎng)景中,以目標(biāo)物為人臉進(jìn)行示例性說(shuō)明,采集的樣本圖片中,人臉區(qū)域放置在樣本圖片的中心,人臉大小占整個(gè)樣本圖片比例在0.5-1之間,0.5-1為本公開(kāi)所述的第二設(shè)定范圍,從而可以確保訓(xùn)練出的第二FCN模型,在輸入圖片的維度為227*227時(shí),可以檢測(cè)到的人臉大概在128-227之間,從而實(shí)現(xiàn)人臉的精確檢測(cè)。

由于第二FCN是通過(guò)對(duì)目標(biāo)物的精確范圍進(jìn)行訓(xùn)練后得到的,因此通過(guò)第二FCN可以定位目標(biāo)物在原始圖片中的精確范圍,從而可以通過(guò)已訓(xùn)練的第二FCN對(duì)目標(biāo)物在原始圖片上進(jìn)行精確定位。

圖5是根據(jù)一示例性實(shí)施例示出的一種圖片中目標(biāo)物的定位裝置的框圖,如圖5所示,圖片中目標(biāo)物的定位裝置包括:

第一縮放模塊51,被配置為根據(jù)已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片;

第一處理模塊52,被配置為將第一縮放模塊51縮放處理后的第一圖片輸入到第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第一熱度圖,第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值;

第一確定模塊53,被配置為基于第一處理模塊52得到的第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定目標(biāo)物在原始圖片中的候選區(qū)域;

第二處理模塊54,被配置為將第一確定模塊53確定的候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第二全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理后,輸出第二熱度圖,第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第二全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上的概率值;

第二確定模塊55,被配置為基于第二處理模塊54處理得到的第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定目標(biāo)物在原始圖片中的位置區(qū)域。

圖6是根據(jù)一示例性實(shí)施例示出的另一種圖片中目標(biāo)物的定位裝置的框圖,如圖6所示,在上述圖5所示實(shí)施例的基礎(chǔ)上,在一實(shí)施例中,第一確定模塊53可包括:

第一確定子模塊531,被配置為在第一熱度圖上,確定是否存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第二確定子模塊532,被配置為當(dāng)?shù)谝淮_定子模塊531確定存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),確定概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第三確定子模塊533,被配置為基于第二確定子模塊532確定的在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,圖片中目標(biāo)物的定位裝置還可包括:

第二縮放模塊56,被配置為當(dāng)?shù)谝淮_定子模塊531確定不存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),根據(jù)第一全卷積神經(jīng)網(wǎng)絡(luò)的第二預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,第二預(yù)設(shè)縮放比例大于第一預(yù)設(shè)縮放比例,得到第二圖片;

第一處理模塊57,還被配置為將第二縮放模塊56縮放得到的第二圖片輸入到第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第三熱度圖,第三熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值;

第三確定模塊58,被配置為當(dāng)?shù)谝惶幚砟K57處理得到的第三熱度圖上存在概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)時(shí),通過(guò)第三熱度圖確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,第三確定模塊58可包括:

第四確定子模塊581,被配置為確定第一處理模塊處理得到的第三熱度圖上概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第五確定子模塊582,被配置為確定第四確定子模塊581確定的概率值大于第一預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第六確定子模塊583,被配置為基于第五確定子模塊582確定的在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的候選區(qū)域。

在一實(shí)施例中,第二確定模塊55可包括:

第七確定子模塊551,被配置為在第二熱度圖上,確定概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn);

第八確定子模塊552,被配置為確定第七確定子模塊551確定的概率值大于第二預(yù)設(shè)閾值的坐標(biāo)點(diǎn)在原始圖片中各自對(duì)應(yīng)的像素點(diǎn);

第九確定子模塊553,被配置為基于第八確定子模塊552確定的在原始圖片中各自對(duì)應(yīng)的像素點(diǎn),確定目標(biāo)物在原始圖片中的位置區(qū)域。

關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說(shuō)明。

圖7是根據(jù)一示例性實(shí)施例示出的一種適用于圖片中目標(biāo)物的定位裝置的框圖。例如,裝置700可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。

參照?qǐng)D7,裝置700可以包括以下一個(gè)或多個(gè)組件:處理組件702,存儲(chǔ)器704,電源組件706,多媒體組件708,音頻組件710,輸入/輸出(I/O)的接口712,傳感器組件714,以及通信組件716。

處理組件702通??刂蒲b置700的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件702可以包括一個(gè)或多個(gè)處理器720來(lái)執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件702可以包括一個(gè)或多個(gè)模塊,便于處理組件702和其他組件之間的交互。例如,處理部件702可以包括多媒體模塊,以方便多媒體組件708和處理組件702之間的交互。

存儲(chǔ)器704被配置為存儲(chǔ)各種類(lèi)型的數(shù)據(jù)以支持在設(shè)備700的操作。這些數(shù)據(jù)的示例包括用于在裝置700上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器704可以由任何類(lèi)型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(ROM),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤(pán)或光盤(pán)。

電力組件706為裝置700的各種組件提供電力。電力組件706可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置700生成、管理和分配電力相關(guān)聯(lián)的組件。

多媒體組件708包括在所述裝置700和用戶(hù)之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來(lái)自用戶(hù)的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件708包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備700處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。

音頻組件710被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件710包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置700處于操作模式,如呼叫模式、記錄模式和語(yǔ)音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器704或經(jīng)由通信組件716發(fā)送。在一些實(shí)施例中,音頻組件710還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。

I/O接口712為處理組件702和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤(pán),點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁(yè)按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。

傳感器組件714包括一個(gè)或多個(gè)傳感器,用于為裝置700提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件714可以檢測(cè)到設(shè)備700的打開(kāi)/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置700的顯示器和小鍵盤(pán),傳感器組件714還可以檢測(cè)裝置700或裝置700一個(gè)組件的位置改變,用戶(hù)與裝置700接觸的存在或不存在,裝置700方位或加速/減速和裝置700的溫度變化。傳感器組件714可以包括接近傳感器,被配置用來(lái)在沒(méi)有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件714還可以包括光傳感器,如CMOS或CCD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件714還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。

通信組件716被配置為便于裝置700和其他設(shè)備之間有線或無(wú)線方式的通信。裝置700可以接入基于通信標(biāo)準(zhǔn)的無(wú)線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件716經(jīng)由廣播信道接收來(lái)自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件716還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來(lái)實(shí)現(xiàn)。

在示例性實(shí)施例中,裝置700可以被一個(gè)或多個(gè)應(yīng)用專(zhuān)用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。

在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器704,上述指令可由裝置700的處理器720執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤(pán)和光數(shù)據(jù)存儲(chǔ)設(shè)備等。

處理器720被配置為:

根據(jù)已訓(xùn)練的第一全卷積神經(jīng)網(wǎng)絡(luò)的第一預(yù)設(shè)縮放比例對(duì)原始圖片進(jìn)行縮放處理,得到第一圖片;

將第一圖片輸入到第一全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第一全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理,輸出第一熱度圖,第一熱度圖上每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第一全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上計(jì)算出的概率值;

基于第一熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的概率值,確定目標(biāo)物在原始圖片中的候選區(qū)域;

將候選區(qū)域?qū)?yīng)的圖像內(nèi)容輸入到已訓(xùn)練的第二全卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)第二全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行卷積處理后,輸出第二熱度圖,第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值為第二全卷積神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)物在原始圖片上的概率值;

基于第二熱度圖上的每一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)的值,確定目標(biāo)物在原始圖片中的位置區(qū)域。

本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的公開(kāi)后,將容易想到本公開(kāi)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限制。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
镇平县| 威远县| 荃湾区| 含山县| 江津市| 泸溪县| 四平市| 武定县| 安国市| 文登市| 湘乡市| 团风县| 博湖县| 永兴县| 沙坪坝区| 印江| 宁安市| 中宁县| 涞水县| 双柏县| 右玉县| 博野县| 太谷县| 南丰县| 枣庄市| 蓬莱市| 北碚区| 颍上县| 锦州市| 基隆市| 措勤县| 桑日县| 高平市| 宁国市| 赤水市| 马边| 开远市| 自贡市| 金门县| 丹凤县| 建昌县|