本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,特別是涉及一種圖像識(shí)別處理裝置、系統(tǒng)及方法。
背景技術(shù):
當(dāng)前的深度學(xué)習(xí)算法已經(jīng)在圖像識(shí)別領(lǐng)域達(dá)到很高的準(zhǔn)確率,但由于能夠精確識(shí)別圖像的深度學(xué)習(xí)網(wǎng)絡(luò)需要大量的計(jì)算資源,所以以當(dāng)前的計(jì)算機(jī)技術(shù),必須把深度學(xué)習(xí)網(wǎng)絡(luò)部署在云端,而本地設(shè)備由于CPU處理能力有限,無(wú)法很好的識(shí)別圖像。
然而把大型深度學(xué)習(xí)網(wǎng)絡(luò)放在云端,有兩大缺陷:首先,因?yàn)樵贫撕捅镜赜布且粚?duì)多的關(guān)系,當(dāng)本地硬件同時(shí)有云端處理請(qǐng)求時(shí),則對(duì)云端的計(jì)算資源要求很高;其次,對(duì)云端的網(wǎng)絡(luò)接口帶寬也要求很高,因?yàn)閳D像的傳送需要很大的帶寬。
技術(shù)實(shí)現(xiàn)要素:
為克服上述現(xiàn)有技術(shù)存在的不足,本發(fā)明之目的在于提供一種圖像識(shí)別處理裝置、系統(tǒng)及方法,以減輕云端處理器的處理負(fù)荷和網(wǎng)絡(luò)接口帶寬。
為達(dá)上述目的,本發(fā)明提出一種圖像識(shí)別處理裝置,該圖像識(shí)別處理裝置部署有小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),利用圖像獲取單元獲取圖像,并利用小型深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行識(shí)別處理以識(shí)別是否存在人臉,于識(shí)別出存在人臉圖像時(shí)將獲取的圖像傳送至云端處理器。
進(jìn)一步地,該圖像識(shí)別處理裝置包括:
圖像獲取單元,用于獲取圖像;
人臉識(shí)別單元,用于利用該小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)該圖像獲取單元獲取的圖像進(jìn)行人臉識(shí)別處理,以識(shí)別獲取的圖像中是否存在人臉;
判斷單元,用于判斷該人臉識(shí)別單元的識(shí)別結(jié)果是否存在人臉,并于判斷出該人臉識(shí)別單元的識(shí)別結(jié)果存在人臉時(shí),啟動(dòng)傳輸單元;
傳輸單元,用于將該圖像獲取單元獲取的存在人臉的圖像傳送至云端處理器。
進(jìn)一步地,所述小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)采用二分類網(wǎng)絡(luò),以識(shí)別圖像是否存在人臉。
進(jìn)一步地,該圖像識(shí)別處理裝置為本地智能硬件,該圖像獲取單元為攝像頭。
為達(dá)到上述目的,本發(fā)明還提供一種圖像識(shí)別處理系統(tǒng),包括:
圖像識(shí)別處理裝置,其上部署有小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),利用圖像獲取單元獲取圖像,并利用小型深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行識(shí)別處理以識(shí)別是否存在人臉,于識(shí)別出存在人臉圖像時(shí)將獲取的圖像傳送至云端處理器;
云端處理器,用于接收該圖像識(shí)別處理設(shè)置傳送的圖像,利用大型深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行人臉識(shí)別,識(shí)別出人臉類型。
進(jìn)一步地,該云端處理器具有深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模塊,將預(yù)先訓(xùn)練錄入的人臉視頻或圖像,轉(zhuǎn)化為人臉數(shù)據(jù),將人臉數(shù)據(jù)與該人臉數(shù)據(jù)的其他信息進(jìn)行對(duì)應(yīng),將對(duì)應(yīng)后的結(jié)果以信息中的某一特征為標(biāo)簽,分類保存至人員信息數(shù)據(jù)庫(kù)中,以上述標(biāo)簽生成深度學(xué)習(xí)網(wǎng)絡(luò)中的各層級(jí)參數(shù),形成提取特征參數(shù)予以保存。
進(jìn)一步地,該云端處理器于獲取圖像進(jìn)行人臉識(shí)別時(shí),從獲取的圖像中提取人臉的數(shù)據(jù),查找人員信息數(shù)據(jù)庫(kù)中已經(jīng)保存的人臉數(shù)據(jù)并進(jìn)行匹配識(shí)別,輸出匹配識(shí)別結(jié)果。
為達(dá)到上述目的,本發(fā)明還提供一種圖像識(shí)別處理方法,包括如下步驟:
步驟一,圖像識(shí)別處理裝置利用圖像獲取單元獲取圖像;
步驟二,利用小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行圖像識(shí)別,以確定獲取的圖像中是否存在人臉;
步驟三,于判斷獲取的圖像中存在人臉時(shí),將獲取的圖像傳送至云端處理器;
步驟四,該云端處理器利用大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行人臉識(shí)別,識(shí)別出人臉類型。
進(jìn)一步地,該小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)為二分類網(wǎng)絡(luò),僅把獲得的圖像分成有人臉和沒有人臉兩類。
進(jìn)一步地,該大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)為復(fù)雜的多分類網(wǎng)絡(luò)。
與現(xiàn)有技術(shù)相比,本發(fā)明一種圖像識(shí)別處理裝置、系統(tǒng)及方法通過(guò)于本地的圖像識(shí)別處理裝置上部署小型深度學(xué)習(xí)網(wǎng)絡(luò),于云端處理器上部署大型深度學(xué)習(xí)網(wǎng)絡(luò),利用該小型深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)獲取的圖像識(shí)別以判斷是否存在人臉,于判斷出存在人臉后才將獲取的圖像發(fā)送至云端處理器,以利用云端處理器的大型深度學(xué)習(xí)網(wǎng)絡(luò)識(shí)別出人臉類型,大大減輕了云端處理器的處理負(fù)荷和網(wǎng)絡(luò)接口帶寬。
附圖說(shuō)明
圖1為本發(fā)明一種圖像識(shí)別處理裝置的系統(tǒng)架構(gòu)圖;
圖2為本發(fā)明一種圖像識(shí)別處理系統(tǒng)的系統(tǒng)架構(gòu)圖;
圖3為本發(fā)明具體實(shí)施例采用的圖像識(shí)別處理系統(tǒng)的系統(tǒng)架構(gòu)圖;
圖4為本發(fā)明具體實(shí)施例的圖像識(shí)別處理過(guò)程示意圖;
圖5為本發(fā)明一種圖像識(shí)別處理方法的步驟流程圖。
具體實(shí)施方式
以下通過(guò)特定的具體實(shí)例并結(jié)合附圖說(shuō)明本發(fā)明的實(shí)施方式,本領(lǐng)域技術(shù)人員可由本說(shuō)明書所揭示的內(nèi)容輕易地了解本發(fā)明的其它優(yōu)點(diǎn)與功效。本發(fā)明亦可通過(guò)其它不同的具體實(shí)例加以施行或應(yīng)用,本說(shuō)明書中的各項(xiàng)細(xì)節(jié)亦可基于不同觀點(diǎn)與應(yīng)用,在不背離本發(fā)明的精神下進(jìn)行各種修飾與變更。
圖1為本發(fā)明一種圖像識(shí)別處理裝置的系統(tǒng)架構(gòu)圖。本發(fā)明一種圖像識(shí)別處理裝置,部署一小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),利用圖像獲取單元獲取圖像,并利用小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行識(shí)別處理以識(shí)別是否存在人臉,于識(shí)別出存在人臉圖像時(shí)將獲取的圖像傳送至云端處理器,如圖1所示,本發(fā)明之圖像識(shí)別處理裝置包括:圖像獲取單元101、人臉識(shí)別單元102、判斷單元103以及傳輸單元104。
其中,圖像獲取單元101,用于獲取圖像,在本發(fā)明具體實(shí)施例中,圖像獲取單元101可為攝像裝置,例如攝像機(jī)的攝像鏡頭或智能手機(jī)的攝像頭;人臉識(shí)別單元102,利用該小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)圖像獲取單元101獲取的圖像進(jìn)行人臉識(shí)別處理,以識(shí)別獲取的圖像中是否存在人臉,由于這里的人臉識(shí)別采用的是現(xiàn)有技術(shù),在此不予贅述;判斷單元103,用于判斷人臉識(shí)別單元102的識(shí)別結(jié)果是否存在人臉,并于判斷出人臉識(shí)別單元102的識(shí)別結(jié)果存在人臉時(shí),啟動(dòng)傳輸單元104;傳輸單元104,用于將圖像獲取單元101獲取的存在人臉的圖像傳送至云端處理器。
圖2為本發(fā)明一種圖像識(shí)別處理系統(tǒng)的系統(tǒng)架構(gòu)圖。如圖2所示,本發(fā)明一種圖像識(shí)別處理系統(tǒng),包括:圖像識(shí)別處理裝置20以及云端處理器30。
其中,圖像識(shí)別處理設(shè)置20設(shè)置于本地端,其上部署有一小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),圖像識(shí)別處理設(shè)置20利用圖像獲取單元獲取圖像,并利用所部署的小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行人臉識(shí)別處理以識(shí)別是否存在人臉,于識(shí)別出存在人臉圖像時(shí)將獲取的圖像傳送至云端處理器30。
云端處理器30,用于接收?qǐng)D像識(shí)別處理設(shè)置20傳送的圖像,利用大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行人臉識(shí)別,識(shí)別出人臉類型。具體地說(shuō),云端處理器30具有深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練模塊,將預(yù)先訓(xùn)練錄入的人臉視頻或圖像,轉(zhuǎn)化為人臉數(shù)據(jù),將人臉數(shù)據(jù)與該人臉數(shù)據(jù)的其他信息(例如媽媽、爸爸或爺爺、奶奶)進(jìn)行對(duì)應(yīng),將對(duì)應(yīng)后的結(jié)果以信息中的某一特征為標(biāo)簽,分類保存至人員信息數(shù)據(jù)庫(kù)中,以上述標(biāo)簽生成深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中的各層級(jí)參數(shù),形成提取特征參數(shù)予以保存,當(dāng)云端處理器30獲取圖像進(jìn)行人臉識(shí)別時(shí),從獲取的圖像中提取人臉的數(shù)據(jù),查找人員信息數(shù)據(jù)庫(kù)中已經(jīng)保存的人臉數(shù)據(jù)并進(jìn)行匹配識(shí)別,輸出匹配識(shí)別結(jié)果。
以下將通過(guò)一具體實(shí)施例來(lái)進(jìn)一步說(shuō)明本發(fā)明:在本發(fā)明具體實(shí)施例中,其解決的場(chǎng)景是在實(shí)際視頻中識(shí)別出人臉并進(jìn)行定位,例如說(shuō)作為圖像識(shí)別處理裝置的智能攝像機(jī)放在家中,需要在攝像頭取到的視頻流中自動(dòng)辨認(rèn)出爸爸、媽媽、爺爺、奶奶、兒子,為了保證系統(tǒng)的實(shí)時(shí)性,假設(shè)本實(shí)施例中要求硬件的處理能力達(dá)到2幀/秒。
若采用現(xiàn)有技術(shù)的方案,智能攝像機(jī)每秒鐘捕獲2幀圖像,然后通過(guò)Internet傳送到云端處理器,由云端處理器處理識(shí)別出人臉的類型,當(dāng)然圖像中有可能有人臉,也可能沒有人臉,如果有的話,必須鑒別出是爸爸、媽媽還是其他人。假設(shè)云端處理器必須同時(shí)為1萬(wàn)臺(tái)智能硬件服務(wù),則他的處理能力必須達(dá)到20000幀/秒。
圖3為本發(fā)明具體實(shí)施例采用的圖像識(shí)別處理系統(tǒng)的系統(tǒng)架構(gòu)圖。在本發(fā)明具體實(shí)施例中,于智能攝像機(jī)上部署小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),在云端處理器上部署大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),這里的小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)只能辨別圖像中有沒有人臉。即把圖像分成兩類,有人臉和沒有人臉,即簡(jiǎn)單的二分類網(wǎng)絡(luò);大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)可以辨別出是否是爸爸還是媽媽或其他人的臉,即復(fù)雜的多分類網(wǎng)絡(luò)。以下為本發(fā)明具體實(shí)施例的圖像識(shí)別處理過(guò)程(如圖4所示):
1、智能攝像機(jī)的圖像獲取單元以實(shí)時(shí)的30frame/s收集圖像數(shù)據(jù);
2、圖像數(shù)據(jù)傳給智能攝像機(jī)的人臉識(shí)別單元;
3、智能攝像機(jī)上建有小型神經(jīng)網(wǎng)絡(luò),為二分類網(wǎng)絡(luò),可分別人或非人。(由于智能攝像機(jī)上的CPU處理能力有限,只有建立小型神經(jīng)網(wǎng)絡(luò))
4、人臉識(shí)別單元利用二分類網(wǎng)絡(luò)確定所獲得的圖像為非人時(shí),判別終止,不再傳給云端處理器做進(jìn)一步判別。
5、當(dāng)人臉識(shí)別單元利用二分類網(wǎng)絡(luò)確定所獲得的圖像是人時(shí),進(jìn)一步傳給云端處理器做進(jìn)一步判別,。
6、云端處理器于接收到智能攝像機(jī)傳送的圖像時(shí),利用大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)一步進(jìn)行人臉識(shí)別,以確定對(duì)象是誰(shuí),例如圖像中的人是爸爸、媽媽、爺爺、奶奶還是兒子。
在本發(fā)明具體實(shí)施例中,攝像頭獲取的圖像為30frames/s,所以小型神經(jīng)網(wǎng)絡(luò)處理的速率為30fps,由于絕大部分圖像都是“非人”,所以云上的大型神經(jīng)網(wǎng)絡(luò)處理的圖像速率要遠(yuǎn)遠(yuǎn)小于30fps。
可見,本發(fā)明中,當(dāng)智能硬件(例如攝像機(jī))捕獲圖像時(shí),智能硬件(例如攝像機(jī))首先通過(guò)本地的小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)辨別是否有人臉存在,如果有,則發(fā)送圖像到云端處理器,如果沒有,則丟棄圖像,因?yàn)樵谡R曨l中,有人臉出現(xiàn)的場(chǎng)景并不多,這樣傳送到云端處理器的圖像則大大減少,可大大減輕云端處理器的處理負(fù)荷和網(wǎng)絡(luò)接口帶寬。
圖5為本發(fā)明一種圖像識(shí)別處理方法的步驟流程圖。如圖5所示,本發(fā)明一種圖像識(shí)別處理方法,包括如下步驟:
步驟501,圖像識(shí)別處理裝置利用圖像獲取單元獲取圖像,在本發(fā)明中,圖像識(shí)別處理裝置為本地設(shè)備,圖像獲取單元采用攝像頭。
步驟502,利用小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行圖像識(shí)別,以確定獲取的圖像中是否存在人臉。在本發(fā)明具體實(shí)施例中,該小型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)為簡(jiǎn)單的二分類網(wǎng)絡(luò),即僅把圖像分成兩類,有人臉和沒有人臉。
步驟503,于判斷獲取的圖像中存在人臉時(shí),將獲取的圖像傳送至云端處理器。
步驟504,云端處理器利用大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)獲取的圖像進(jìn)行人臉識(shí)別,識(shí)別出人臉類型。本發(fā)明具體實(shí)施例中,該大型深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)為復(fù)雜的多分類網(wǎng)絡(luò),即可以識(shí)別出圖像中的人臉的類型,例如是爸爸還是媽媽或其他人的臉。
綜上所述,本發(fā)明一種圖像識(shí)別處理裝置、系統(tǒng)及方法通過(guò)于本地的圖像識(shí)別處理裝置上部署小型深度學(xué)習(xí)網(wǎng)絡(luò),于云端處理器上部署大型深度學(xué)習(xí)網(wǎng)絡(luò),利用該小型深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)獲取的圖像識(shí)別以判斷是否存在人臉,于判斷出存在人臉后才將獲取的圖像發(fā)送至云端處理器,以利用云端處理器的大型深度學(xué)習(xí)網(wǎng)絡(luò)識(shí)別出人臉類型,大大減輕了云端處理器的處理負(fù)荷和網(wǎng)絡(luò)接口帶寬。
任何本領(lǐng)域技術(shù)人員均可在不違背本發(fā)明的精神及范疇下,對(duì)上述實(shí)施例進(jìn)行修飾與改變。因此,本發(fā)明的權(quán)利保護(hù)范圍,應(yīng)如權(quán)利要求書所列。