欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種圖像識別方法和裝置與流程

文檔序號:12035118閱讀:175來源:國知局
一種圖像識別方法和裝置與流程

本發(fā)明涉及圖像識別領(lǐng)域,特別是涉及一種圖像識別方法,以及,一種圖像識別裝置。



背景技術(shù):

目前的圖像識別技術(shù)中,主要是針對圖像中一個完整而且常規(guī)姿態(tài)的對象的整體特征進(jìn)行識別。例如,如果在圖像中存在一個正面的完整人體,則可以識別該圖像包含有人物圖像。

然而在實(shí)際應(yīng)用中,圖像中人體可能并不完整。例如,某些圖像中的人體被景物或靜物部分遮擋,僅可見人體側(cè)面或部分肢體;又或者,下蹲的人體僅可見頭部和手臂,而采用目前的圖像識別技術(shù),由于圖像中的人體不完整或姿態(tài)不規(guī)則,無法識別出圖像中存在人體對象。對于動物、靜物等其他物體對象的識別中,也存在著無法針對不完整、不規(guī)則的對象進(jìn)行分類識別的問題。

因此,目前的圖像識別方法存在著識別準(zhǔn)確率較低的問題。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述的圖像識別準(zhǔn)確率較低的問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種圖像識別方法和一種圖像識別裝置。

根據(jù)本發(fā)明的一個方面,提供了一種圖像識別方法,所述方法包括:

采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;

利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;

根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

可選地,所述方法還包括:

若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像;

將放大的當(dāng)前圖像劃分成多個子圖像;

采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

可選地,所述將放大的當(dāng)前圖像劃分成多個子圖像包括:

在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;

針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

可選地,所述完整目標(biāo)對象的圖像包括完整目標(biāo)對象在多個視角的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括部分目標(biāo)對象在多個視角的圖像中的一種或多種。

可選地,所述目標(biāo)對象為人體,所述完整目標(biāo)對象的圖像包括人體的正面、側(cè)面、背面的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括人體軀干、肢體的正面、側(cè)面、背面的圖像中的一種或多種。

根據(jù)本發(fā)明的另一個方面,提供了一種圖像識別裝置,所述裝置包括:

預(yù)測數(shù)據(jù)集合訓(xùn)練模塊,用于采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;

圖像分類識別模塊,用于利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;

圖像類別判定模塊,用于根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

可選地,所述裝置還包括:

圖像放大模塊,用于若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像;

子圖像劃分模塊,用于將放大的當(dāng)前圖像劃分成多個子圖像;

子圖像分類識別模塊,用于采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

可選地,所述子圖像劃分模塊包括:

窗口移動子模塊,用于在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;

子圖像獲取子模塊,用于針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

根據(jù)本發(fā)明的另一個方面,提供了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時實(shí)現(xiàn)上述圖像識別方法的任意一項(xiàng)所述方法的步驟。

根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時實(shí)現(xiàn)上述圖像識別方法的任意一項(xiàng)所述方法的步驟。

根據(jù)本發(fā)明實(shí)施例,通過基于完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像對預(yù)測數(shù)據(jù)集合進(jìn)行訓(xùn)練,在利用預(yù)測數(shù)據(jù)集合進(jìn)行圖像分類識別時,解決了因圖像中存在不完整的目標(biāo)對象或目標(biāo)對象不規(guī)則而無法識別為目標(biāo)圖像類別的問題,從而提升了圖像識別的準(zhǔn)確率。

根據(jù)本發(fā)明實(shí)施例,通過按照一定尺寸比例放大當(dāng)前圖像并劃分為多個子圖像,針對子圖像進(jìn)行圖像分類識別,避免了無法識別出尺寸較小的目標(biāo)對象的問題,進(jìn)一步提升了圖像分類識別的準(zhǔn)確性。

上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。

附圖說明

通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:

圖1是本發(fā)明實(shí)施例一的一種圖像識別方法的步驟流程圖;

圖2是本發(fā)明實(shí)施例二的一種圖像識別方法的步驟流程圖;

圖3是本發(fā)明實(shí)施例三中的一種圖像識別裝置的結(jié)構(gòu)框圖;

圖4是本發(fā)明實(shí)施例四中的一種圖像識別裝置的結(jié)構(gòu)框圖;

圖5是本發(fā)明實(shí)施例的一種機(jī)器訓(xùn)練的訓(xùn)練過程流程圖;

圖6是本發(fā)明實(shí)施例的一種機(jī)器訓(xùn)練的測試過程流程圖。

具體實(shí)施方式

下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施例。雖然附圖中顯示了本公開的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

實(shí)施例一

詳細(xì)介紹本發(fā)明實(shí)施例提供的一種圖像識別方法。

參照圖1,示出了本發(fā)明實(shí)施例一的一種圖像識別方法的步驟流程圖。

步驟101,采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別。

具體實(shí)現(xiàn)中,可以采用用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合對圖像的類別進(jìn)行預(yù)測。通常,上述的預(yù)測數(shù)據(jù)集合也稱為圖像分類模型。圖像分類模型可以根據(jù)所輸入圖像的圖像特征計(jì)算該圖像屬于各個圖像類別的概率值,根據(jù)概率值對圖像進(jìn)行分類。圖像分類模型具體可以有多種,例如,圖像分類模型可以具體包括決策樹模型、神經(jīng)網(wǎng)絡(luò)分類模型、貝葉斯模型等。

為了提升圖像分類的準(zhǔn)確性,可以采用圖像樣本對預(yù)測數(shù)據(jù)集合進(jìn)行機(jī)器訓(xùn)練。

在本發(fā)明實(shí)施例中,可以預(yù)先收集完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,作為圖像樣本以對預(yù)測數(shù)據(jù)集合進(jìn)行機(jī)器訓(xùn)練。其中,完整目標(biāo)對象的圖像和部分目標(biāo)對象的圖像可以作為正例訓(xùn)練樣本,不包含目標(biāo)對象的圖像可以作為負(fù)例訓(xùn)練樣本。采用正例訓(xùn)練樣本可以訓(xùn)練預(yù)測數(shù)據(jù)集合識別包含目標(biāo)對象的圖像,采用負(fù)例訓(xùn)練樣本可以訓(xùn)練預(yù)測數(shù)據(jù)集合識別不包含目標(biāo)對象的圖像。

例如,針對于以人體作為目標(biāo)對象,完整目標(biāo)對象的圖像可以包括人體的正面、側(cè)面、背面的圖像中的一種或多種,部分目標(biāo)對象的圖像可以包括人體軀干、肢體的正面、側(cè)面、背面的圖像中的一種或多種,不包含目標(biāo)對象的圖像可以為包含其他物體但沒有人體存在的圖像。

其中,可以將包含目標(biāo)對象的圖像分類為目標(biāo)圖像類別,將不包含目標(biāo)對象的圖像分類為非目標(biāo)圖像類別。

需要說明的是,目標(biāo)對象可以是人體、動物、甚至各種特定物件等的對象。本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要設(shè)置目標(biāo)對象,本發(fā)明實(shí)施例對具體的目標(biāo)對象不作限制。

在采用圖像樣本對預(yù)測數(shù)據(jù)集合進(jìn)行機(jī)器訓(xùn)練時,通常是提取圖像樣本的圖像特征,采用不同圖像類別的圖像特征構(gòu)建不同的圖像類別的特征集合,將多個特征集合構(gòu)成預(yù)測數(shù)據(jù)集合。

具體的機(jī)器訓(xùn)練方法可以包括監(jiān)督訓(xùn)練、非監(jiān)督訓(xùn)練、半監(jiān)督訓(xùn)練等訓(xùn)練方法,本領(lǐng)域技術(shù)人員可以根據(jù)實(shí)際需要采用不同的機(jī)器訓(xùn)練方法。例如,在針對神經(jīng)網(wǎng)絡(luò)分類模型的預(yù)測數(shù)據(jù)集合進(jìn)行機(jī)器訓(xùn)練時,可以采用前向傳播和反向傳播相結(jié)合的方式。更具體地,可以首先初始化神經(jīng)網(wǎng)絡(luò)分類模型的神經(jīng)網(wǎng)絡(luò)權(quán)重。然后可以根據(jù)初始化的神經(jīng)網(wǎng)絡(luò)權(quán)重分別計(jì)算圖像樣本的圖像特征歸屬于不同圖像類別的特征集合的概率值,作為圖像分類預(yù)測結(jié)果。根據(jù)圖像分類預(yù)測結(jié)果初步判定圖像的圖像類別。在初步判定圖像類別后,可以根據(jù)判定結(jié)果的準(zhǔn)確性,相應(yīng)調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)重,采用調(diào)整后的神經(jīng)網(wǎng)絡(luò)權(quán)重重新進(jìn)行分類識別,通過反向傳播的方式校正分類預(yù)測結(jié)果,經(jīng)過多次的校正最終得到準(zhǔn)確的分類預(yù)測結(jié)果。

步驟102,利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果。

具體實(shí)現(xiàn)中,可以獲取到當(dāng)前的圖像,預(yù)測當(dāng)前圖像的圖像特征歸屬于預(yù)測數(shù)據(jù)集合中不同特征集合的多個概率值??梢詫⒍鄠€預(yù)測的概率值作為圖像分類預(yù)測結(jié)果。

步驟103,根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

具體實(shí)現(xiàn)中,若當(dāng)前圖像歸屬于預(yù)測數(shù)據(jù)集合中某個特征集合的概率值較大,可以將該特征集合所對應(yīng)的圖像類別作為當(dāng)前圖像的圖像類別。針對于判斷當(dāng)前圖像是否包含有特定目標(biāo)對象的應(yīng)用場景,可以根據(jù)圖像分類預(yù)測結(jié)果判定當(dāng)前圖像屬于包含目標(biāo)對象的目標(biāo)圖像類別,或者,屬于不包含目標(biāo)對象的非目標(biāo)圖像類別。

根據(jù)本發(fā)明實(shí)施例,通過基于完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像對預(yù)測數(shù)據(jù)集合進(jìn)行訓(xùn)練,在利用預(yù)測數(shù)據(jù)集合進(jìn)行圖像分類識別時,解決了因圖像中存在不完整的目標(biāo)對象或目標(biāo)對象不規(guī)則而無法識別為目標(biāo)圖像類別的問題,從而提升了圖像識別的準(zhǔn)確率。

實(shí)施例二

詳細(xì)介紹本發(fā)明實(shí)施例提供的一種圖像識別方法。

參照圖2,示出了本發(fā)明實(shí)施例二的一種圖像識別方法的步驟流程圖。

步驟201,采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別。

步驟202,利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果。

步驟203,根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

步驟204,若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像。

步驟205,將放大的當(dāng)前圖像劃分成多個子圖像。

步驟206,采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

在具體實(shí)現(xiàn)中,在判定當(dāng)前圖像屬于非目標(biāo)圖像類別時,可以先針對當(dāng)前圖像進(jìn)行放大處理。具體地,可以按照一定的尺寸比例對當(dāng)前圖像進(jìn)行放大。例如將224*224像素的圖像調(diào)整至448*448像素的圖像。針對放大的圖像,可以將其劃分成多個尺寸較小的子圖像,從而可以基于多個子圖像進(jìn)行圖像分類識別。例如將擴(kuò)大成448*448像素的圖像分成多個224*224像素的圖像。

可選地,所述步驟205包括:

子步驟s11,在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;

子步驟s12,針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

實(shí)際應(yīng)用中,可以通過滑窗識別的方式實(shí)現(xiàn)上述的圖像劃分處理。具體地,可以設(shè)置一個具有設(shè)定范圍的圖像標(biāo)記窗口,例如一個224*224像素的滑動窗口。采用該窗口在當(dāng)前圖像上按照設(shè)定的滑動幅度進(jìn)行移動。例如,按照112*112像素/次的幅度進(jìn)行滑動。

窗口每次移動后均可以標(biāo)記出部分圖像,將標(biāo)記的部分圖像作為子圖像進(jìn)行識別,多次移動后則可以得到對應(yīng)于當(dāng)前圖像的多個較小尺寸的子圖像。

在實(shí)際應(yīng)用中,也可以無須判定當(dāng)前圖像屬于非目標(biāo)圖像類別時才進(jìn)行上述的圖像放大和滑窗識別處理,而直接針對當(dāng)前圖像進(jìn)行放大和滑窗識別處理。

在針對圖像分類的應(yīng)用場景中,需要對圖像是否包含目標(biāo)對象進(jìn)行判斷。如果圖像中的目標(biāo)對象相對于圖像較小,可能無法準(zhǔn)確識別。例如,拍攝遠(yuǎn)處人物后得到的照片中,人體相對于照片較小,目前的識別技術(shù)可能無法準(zhǔn)確識別出圖像中包含有人體。在本發(fā)明實(shí)施例中,當(dāng)通過原有方式無法識別出圖像是否包含目標(biāo)對象時,通過將當(dāng)前圖像放大和劃分成多個子圖像,并針對各個子圖像分別進(jìn)行分類識別,從而可以識別出放大的對象為目標(biāo)對象,提升了圖像識別的準(zhǔn)確性。

可選地,所述完整目標(biāo)對象的圖像包括完整目標(biāo)對象在多個視角的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括部分目標(biāo)對象在多個視角的圖像中的一種或多種。

具體實(shí)現(xiàn)中,包含有目標(biāo)對象的圖像中,既可以包括一個完整目標(biāo)對象在不同視角的圖像,還可以包括部分的目標(biāo)對象在不同視角的圖像。例如,人物在跑步、跳躍、下蹲、扭頭等各種姿態(tài)下的正面、側(cè)面、背面、仰視面、俯視面等視角的圖像,人體臉部、頭部、軀干或四肢在各種姿態(tài)下的正面、側(cè)面、背面圖像等。不同目標(biāo)對象的整體或部分在不同姿態(tài)不同視角下存在著多種可能的擴(kuò)展圖像,本領(lǐng)域技術(shù)人員可以根據(jù)本發(fā)明實(shí)施例提供的技術(shù)思路,采用多種對象在多種姿態(tài)下的多種視角的圖像作為擴(kuò)展圖像,在此不再一一列舉。

可選地,所述目標(biāo)對象為人體,所述完整目標(biāo)對象的圖像包括人體的正面、側(cè)面、背面的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括人體軀干、肢體的正面、側(cè)面、背面的圖像中的一種或多種。

實(shí)際應(yīng)用中,本發(fā)明實(shí)施例可以應(yīng)用于對不同目標(biāo)對象的分別識別,例如,動物、特定的物件等。

實(shí)際應(yīng)用中,若判定當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別,則可以直接標(biāo)記該圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別,無須針對圖像中的目標(biāo)對象的具體區(qū)域進(jìn)行標(biāo)記。例如,識別出圖像中包含有人體彎曲的手臂,則可以針對整個圖像標(biāo)記為人物圖像。

在圖像分類的應(yīng)用場景中,根據(jù)圖像是否包含目標(biāo)對象對整個圖像標(biāo)記目標(biāo)圖像類別或非目標(biāo)圖像類別,無須針對圖像中各個目標(biāo)對象和非目標(biāo)對象分別進(jìn)行標(biāo)記,提升了對圖像的標(biāo)記速度和圖像分類的效率。

根據(jù)本發(fā)明實(shí)施例,通過按照一定尺寸比例放大當(dāng)前圖像并劃分為多個子圖像,針對子圖像進(jìn)行圖像分類識別,避免了無法識別出尺寸較小的目標(biāo)對象的問題,進(jìn)一步提升了圖像分類識別的準(zhǔn)確性。

為了便于本領(lǐng)域技術(shù)人員深入理解本發(fā)明實(shí)施例,以下將結(jié)合圖5和圖6的具體實(shí)施示例進(jìn)行說明。

實(shí)際應(yīng)用中,針對基于神經(jīng)網(wǎng)絡(luò)分類模型而構(gòu)建的圖像分類模型的機(jī)器訓(xùn)練可以分為兩個過程:訓(xùn)練過程和測試過程。圖5示出了本發(fā)明實(shí)施例的一種機(jī)器訓(xùn)練的訓(xùn)練過程流程圖,圖6示出了本發(fā)明實(shí)施例的一種機(jī)器訓(xùn)練的測試過程流程圖。

從圖5中可見,在進(jìn)行機(jī)器訓(xùn)練的訓(xùn)練過程中,可以首先輸入訓(xùn)練樣本,訓(xùn)練樣本可以包括正例訓(xùn)練樣本和負(fù)例訓(xùn)練樣本,正例訓(xùn)練樣本可以包括整個目標(biāo)對象或部分目標(biāo)對象在各個視角的圖像,負(fù)例訓(xùn)練樣本可以包括不包含目標(biāo)對象或只包含非目標(biāo)對象的圖像。然后可以針進(jìn)行圖像預(yù)處理,具體可以為調(diào)整訓(xùn)練樣本的尺寸,將全部圖像統(tǒng)一調(diào)整至224*224像素,以符合圖像分類器所能接受的輸入格式。在訓(xùn)練之前,可以對圖像分類器的神經(jīng)網(wǎng)絡(luò)進(jìn)行初始化。具體地,可以利用在圖像數(shù)據(jù)集上預(yù)先訓(xùn)練的nin(networkinnetwork,互連型神經(jīng)網(wǎng)絡(luò))網(wǎng)絡(luò)初始化神經(jīng)網(wǎng)絡(luò)權(quán)重。在訓(xùn)練時,可以采用前向傳播的方式,具體為根據(jù)初始化的神經(jīng)網(wǎng)絡(luò)權(quán)重計(jì)算訓(xùn)練樣本的圖像特征值并識別出目標(biāo)對象,根據(jù)目標(biāo)對象確定所屬類別,輸出識別結(jié)果。根據(jù)識別結(jié)果的準(zhǔn)確性,可以通過反向傳播的方式校正圖像分類器,具體為調(diào)整神經(jīng)網(wǎng)絡(luò)權(quán)重,采用調(diào)整后的神經(jīng)網(wǎng)絡(luò)權(quán)重重新計(jì)算圖像特征值和識別目標(biāo)對象,重復(fù)該步驟直到得到滿意的識別結(jié)果。

從圖6中可見,在進(jìn)行機(jī)器訓(xùn)練的測試過程中,可以輸入測試圖像,針對輸入的測試圖像進(jìn)行將全部圖像統(tǒng)一調(diào)整至224*224像素的圖像預(yù)處理,以及神經(jīng)網(wǎng)絡(luò)權(quán)重初始化的處理。針對輸入的測試圖像采用前向傳播的方式進(jìn)行識別,當(dāng)識別出目標(biāo)對象后則輸出識別結(jié)果。其中,識別結(jié)果可以包括圖像中所包含目標(biāo)對象的所屬類別的類別標(biāo)簽。當(dāng)無法識別出目標(biāo)對象時,可以將測試圖像放大至448*448像素,采用224*224的滑窗以112*112像素的滑動幅度在圖像上滑動,逐一識別滑窗中是否包含目標(biāo)對象。

需要說明的是,對于前述的方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作并不一定是本發(fā)明所必需的。

實(shí)施例三

詳細(xì)介紹本發(fā)明實(shí)施例提供的一種圖像識別裝置。

參照圖3,示出了本發(fā)明實(shí)施例三中的一種圖像識別裝置的結(jié)構(gòu)框圖。

所述裝置可以包括:

預(yù)測數(shù)據(jù)集合訓(xùn)練模塊301,用于采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;

圖像分類識別模塊302,用于利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;

圖像類別判定模塊303,用于根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

根據(jù)本發(fā)明實(shí)施例,通過基于完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像對預(yù)測數(shù)據(jù)集合進(jìn)行訓(xùn)練,在利用預(yù)測數(shù)據(jù)集合進(jìn)行圖像分類識別時,解決了因圖像中存在不完整的目標(biāo)對象或目標(biāo)對象不規(guī)則而無法識別為目標(biāo)圖像類別的問題,從而提升了圖像識別的準(zhǔn)確率。

實(shí)施例四

詳細(xì)介紹本發(fā)明實(shí)施例提供的一種圖像識別裝置。

參照圖4,示出了本發(fā)明實(shí)施例四中的一種圖像識別裝置的結(jié)構(gòu)框圖。

所述裝置可以包括:

預(yù)測數(shù)據(jù)集合訓(xùn)練模塊401,用于采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;

圖像分類識別模塊402,用于利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;

圖像類別判定模塊403,用于根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

圖像放大模塊404,用于若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像;

子圖像劃分模塊405,用于將放大的當(dāng)前圖像劃分成多個子圖像;

子圖像分類識別模塊406,用于采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

可選地,所述子圖像劃分模塊405包括:

窗口移動子模塊,用于在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;

子圖像獲取子模塊,用于針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

根據(jù)本發(fā)明實(shí)施例,通過按照一定尺寸比例放大當(dāng)前圖像并劃分為多個子圖像,針對子圖像進(jìn)行圖像分類識別,避免了無法識別出尺寸較小的目標(biāo)對象的問題,進(jìn)一步提升了圖像分類識別的準(zhǔn)確性。

對于上述文字識別裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。

實(shí)施例五

詳細(xì)介紹本發(fā)明實(shí)施例提供的一種計(jì)算機(jī)設(shè)備和一種計(jì)算機(jī)可讀存儲介質(zhì)。

所述計(jì)算機(jī)設(shè)備包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時實(shí)現(xiàn)以下步驟:

采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

可選地,所述處理器執(zhí)行所述程序時還可以實(shí)現(xiàn)以下步驟:

若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像;將放大的當(dāng)前圖像劃分成多個子圖像;采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

可選地,所述處理器執(zhí)行所述程序時還可以實(shí)現(xiàn)以下步驟:

在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

可選地,所述完整目標(biāo)對象的圖像包括完整目標(biāo)對象在多個視角的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括部分目標(biāo)對象在多個視角的圖像中的一種或多種。

可選地,所述目標(biāo)對象為人體,所述完整目標(biāo)對象的圖像包括人體的正面、側(cè)面、背面的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括人體軀干、肢體的正面、側(cè)面、背面的圖像中的一種或多種。

所述計(jì)算機(jī)可讀存儲介質(zhì)存儲有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時可以實(shí)現(xiàn)如下步驟:

采用預(yù)先收集的圖像樣本訓(xùn)練用于預(yù)測圖像分類的預(yù)測數(shù)據(jù)集合;其中,所述圖像樣本包括完整目標(biāo)對象的圖像、部分目標(biāo)對象的圖像和不包含目標(biāo)對象的圖像,所述圖像分類包括包含目標(biāo)對象的目標(biāo)圖像類別和不包含目標(biāo)對象的非目標(biāo)圖像類別;利用所述預(yù)測數(shù)據(jù)集合對當(dāng)前圖像進(jìn)行圖像分類識別,獲得圖像分類預(yù)測結(jié)果;根據(jù)所述圖像分類預(yù)測結(jié)果判定所述當(dāng)前圖像屬于目標(biāo)圖像類別或非目標(biāo)圖像類別。

可選地,該程序被處理器執(zhí)行時還可以實(shí)現(xiàn)如下步驟:

若判定所述當(dāng)前圖像屬于非目標(biāo)圖像類別,則按照預(yù)設(shè)尺寸比例放大所述當(dāng)前圖像;將放大的當(dāng)前圖像劃分成多個子圖像;采用所述預(yù)測數(shù)據(jù)集合基于各個子圖像進(jìn)行圖像分類識別。

可選地,該程序被處理器執(zhí)行時還可以實(shí)現(xiàn)如下步驟:

在放大的當(dāng)前圖像上按照設(shè)定滑動幅度移動至少一個具有設(shè)定范圍的圖像標(biāo)記窗口;針對每次移動,將處于圖像標(biāo)記窗口內(nèi)的部分圖像作為一個子圖像,并在多次移動后,得到所述當(dāng)前圖像對應(yīng)的多個子圖像。

可選地,所述完整目標(biāo)對象的圖像包括完整目標(biāo)對象在多個視角的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括部分目標(biāo)對象在多個視角的圖像中的一種或多種。

可選地,所述目標(biāo)對象為人體,所述完整目標(biāo)對象的圖像包括人體的正面、側(cè)面、背面的圖像中的一種或多種,所述部分目標(biāo)對象的圖像包括人體軀干、肢體的正面、側(cè)面、背面的圖像中的一種或多種。

本說明書中的各個實(shí)施例均采用遞進(jìn)的方式描述,每個實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個實(shí)施例之間相同相似的部分互相參見即可。

本領(lǐng)域技術(shù)人員易于想到的是:上述各個實(shí)施例的任意組合應(yīng)用都是可行的,故上述各個實(shí)施例之間的任意組合都是本發(fā)明的實(shí)施方案,但是由于篇幅限制,本說明書在此就不一一詳述了。

在此提供的基于移動終端的電話舉報(bào)方案不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造具有本發(fā)明方案的系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。

在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。

類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實(shí)施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域那些技術(shù)人員可以理解,可以對實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實(shí)施例不同的一個或多個設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。

本發(fā)明的各個部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個或者多個處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號處理器(dsp)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的文字識別方案中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。

應(yīng)該注意的是上述實(shí)施例對本發(fā)明進(jìn)行說明而不是對本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
虞城县| 隆尧县| 宁乡县| 靖州| 萝北县| 来宾市| 镇平县| 芜湖市| 滦南县| 乐东| 铜鼓县| 华容县| 南陵县| 许昌市| 扶风县| 历史| 怀宁县| 岗巴县| 荥经县| 上杭县| 沁源县| 彭阳县| 津南区| 黎平县| 万载县| 老河口市| 无极县| 辽中县| 九龙坡区| 建瓯市| 尼木县| 炎陵县| 莱芜市| 永顺县| 芜湖市| 丽江市| 光山县| 和平区| 游戏| 获嘉县| 宁波市|