本發(fā)明涉及圖像處理技術(shù)領(lǐng)域,具體涉及一種圖像處理方法及裝置。
背景技術(shù):
現(xiàn)有技術(shù)中,人臉識(shí)別系統(tǒng)的研究始于20世紀(jì)60年代,80年代后隨著計(jì)算機(jī)技術(shù)和光學(xué)成像技術(shù)的發(fā)展得到提高,而真正進(jìn)入初級(jí)的應(yīng)用階段則在90年后期,并且以美國(guó)、德國(guó)和日本的技術(shù)實(shí)現(xiàn)為主。
目前來(lái)看,人臉檢測(cè)是指在輸入圖像中判斷是否存在人臉區(qū)域,并進(jìn)一步確定人臉的位置,大小,姿態(tài)等信息。該技術(shù)已經(jīng)發(fā)展了幾十年,目前以采用深度學(xué)習(xí)的人工智能算法最為普及,但是,這種算法最大的瓶頸是需要大量的參數(shù)用于計(jì)算,因而,存儲(chǔ)器的限制成為算法應(yīng)用的瓶頸。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供了一種圖像處理方法及裝置,以期以減少存儲(chǔ)器的需求,從而降低硬件帶來(lái)的限制。
本發(fā)明實(shí)施例第一方面提供了一種圖像處理方法,包括:
S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,所述當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),所述M為大于1的整數(shù);
S2、獲取分段掃描參數(shù)P,所述P為所述當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,所述P、所述Q和所述N均為大于1的整數(shù);
S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù);
S4、根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù);
S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值;
S6、根據(jù)所述索引值計(jì)算門限值的第三地址和查找表在所述存儲(chǔ)器的第四地址,并從所述第三地址獲取門限值數(shù)據(jù)和從所述第四地址獲取查找表數(shù)據(jù);
S7、比較所述門限值數(shù)據(jù)和所述查找表數(shù)據(jù);
S8、在所述查找表數(shù)據(jù)小于所述門限值數(shù)據(jù)時(shí),退出針對(duì)所述當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10;
S9、在所述查找表數(shù)據(jù)大于所述門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了所述Q次步驟S3-S7,若否,返回步驟S3,若是,記錄所述人臉圖像的圖像信息;
S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到所述N次,若是,得到所述人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的所述人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。
結(jié)合本發(fā)明實(shí)施例第一方面,在第一方面的第一種可能實(shí)施方式中,所述根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值,包括:
通過(guò)指定人臉檢測(cè)算法,對(duì)所述像素?cái)?shù)據(jù)進(jìn)行計(jì)算,得到索引值。
結(jié)合本發(fā)明實(shí)施例第一方面,在第一方面的第二種可能實(shí)施方式中,所述圖像信息為以下至少一種:
人臉位置、人臉大小和人臉的角度。
結(jié)合本發(fā)明實(shí)施例第一方面或第一方面的第一種或第二種可能實(shí)施方式,在第一方面的第三種可能實(shí)施方式中,所述根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,包括:
按照所述樹(shù)形碼數(shù)據(jù)與像素之間的對(duì)應(yīng)的關(guān)系計(jì)算所述像素在所述存儲(chǔ)器中的所述第二地址。
結(jié)合本發(fā)明實(shí)施例第一方面或第一方面的第一種或第二種可能實(shí)施方式,在第一方面的第四種可能實(shí)施方式中,在所述S10之后,還包含如下步驟:
S11、判斷所述M個(gè)掃描窗口都已經(jīng)掃描結(jié)束;若是,得到所述人臉圖像的目標(biāo)圖像信息。
本發(fā)明實(shí)施例第二方面提供了一種圖像處理裝置,包括:
獲取單元,用于執(zhí)行S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,所述當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),所述M為大于1的整數(shù);
所述獲取單元,還具體用于執(zhí)行S2、獲取分段掃描參數(shù)P,所述P為所述當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,所述P、所述Q和所述N均為大于1的整數(shù);
計(jì)算單元,用于執(zhí)行S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù);
所述計(jì)算單元,還具體用于執(zhí)行S4、根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù);S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值;S6、根據(jù)所述索引值計(jì)算門限值的第三地址和查找表在所述存儲(chǔ)器的第四地址,并從所述第三地址獲取門限值數(shù)據(jù)和從所述第四地址獲取查找表數(shù)據(jù);
比較單元,用于執(zhí)行S7、比較所述門限值數(shù)據(jù)和所述查找表數(shù)據(jù);
處理單元,用于執(zhí)行S8、在所述查找表數(shù)據(jù)小于所述門限值數(shù)據(jù)時(shí),退出針對(duì)所述當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10;
所述處理單元,還具體用于執(zhí)行S9、在所述查找表數(shù)據(jù)大于所述門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了所述Q次步驟S3-S7,若否,返回步驟S3,若是,記錄所述人臉圖像的圖像信息;
判斷單元,用于執(zhí)行S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到所述N次,若是,由所述獲取單元得到所述人臉圖像的目標(biāo)圖像信息,若否,由所述獲取單元在步驟S9中得到的所述人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。
結(jié)合本發(fā)明實(shí)施例第二方面,在第二方面的第一種可能實(shí)施方式中,所述計(jì)算單元根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值的具體實(shí)現(xiàn)方式為:
通過(guò)指定人臉檢測(cè)算法,對(duì)所述像素?cái)?shù)據(jù)進(jìn)行計(jì)算,得到索引值。
結(jié)合本發(fā)明實(shí)施例第二方面,在第二方面的第二種可能實(shí)施方式中,所述圖像信息為以下至少一種:
人臉位置、人臉大小和人臉的角度。
結(jié)合本發(fā)明實(shí)施例第二方面或第二方面的第一種或第二種可能實(shí)施方式,在第二方面的第三種可能實(shí)施方式中,所述計(jì)算單元根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址的具體實(shí)現(xiàn)方式為:
按照所述樹(shù)形碼數(shù)據(jù)與像素之間的對(duì)應(yīng)的關(guān)系計(jì)算所述像素在所述存儲(chǔ)器中的所述第二地址。
結(jié)合本發(fā)明實(shí)施例第二方面或第二方面的第一種或第二種可能實(shí)施方式,在第二方面的第四種可能實(shí)施方式中,所述判斷單元還具體用于:在所述S10執(zhí)行完之后,判斷所述M個(gè)掃描窗口都已經(jīng)掃描結(jié)束;若所述判斷單元的判斷結(jié)果為是,得到所述人臉圖像的目標(biāo)圖像信息。
實(shí)施本發(fā)明實(shí)施例,具有如下有益效果:
通過(guò)本發(fā)明實(shí)施例,S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),M為大于1的整數(shù),S2、獲取分段掃描參數(shù)P,P為當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,P、Q和N均為大于1的整數(shù),S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù),S4、根據(jù)樹(shù)形碼數(shù)據(jù)計(jì)算像素在存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù),S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)像素?cái)?shù)據(jù)計(jì)算索引值,S6、根據(jù)索引值計(jì)算門限值的第三地址和查找表在存儲(chǔ)器的第四地址,并從第三地址獲取門限值數(shù)據(jù)和從第四地址獲取查找表數(shù)據(jù),S7、比較門限值數(shù)據(jù)和查找表數(shù)據(jù),S8、在查找表數(shù)據(jù)小于門限值數(shù)據(jù)時(shí),退出針對(duì)當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10,S9、在查找表數(shù)據(jù)大于門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了Q次步驟S3-S7,若否,返回步驟S3,若是,記錄人臉圖像的圖像信息,S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到N次,若是,得到人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。如此,可實(shí)現(xiàn)對(duì)待處理圖像進(jìn)行人臉識(shí)別,從而,以減少存儲(chǔ)器的需求,從而降低硬件帶來(lái)的限制。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種圖像處理方法的實(shí)施例流程示意圖;
圖2是本發(fā)明實(shí)施例提供的一種圖像處理裝置的第一實(shí)施例結(jié)構(gòu)示意圖;
圖3是本發(fā)明實(shí)施例提供的一種圖像處理裝置的第二實(shí)施例結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及所述附圖中的術(shù)語(yǔ)“第一”、“第二”、“第三”和“第四”等是用于區(qū)別不同對(duì)象,而不是用于描述特定順序。此外,術(shù)語(yǔ)“包括”和“具有”以及它們?nèi)魏巫冃?,意圖在于覆蓋不排他的包含。例如包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備沒(méi)有限定于已列出的步驟或單元,而是可選地還包括沒(méi)有列出的步驟或單元,或可選地還包括對(duì)于這些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
在本文中提及“實(shí)施例”意味著,結(jié)合實(shí)施例描述的特定特征、結(jié)構(gòu)或特性可以包含在本發(fā)明的至少一個(gè)實(shí)施例中。在說(shuō)明書(shū)中的各個(gè)位置展示該短語(yǔ)并不一定均是指相同的實(shí)施例,也不是與其它實(shí)施例互斥的獨(dú)立的或備選的實(shí)施例。本領(lǐng)域技術(shù)人員顯式地和隱式地理解的是,本文所描述的實(shí)施例可以與其它實(shí)施例相結(jié)合。
本發(fā)明實(shí)施例所描述圖像處理裝置可以包括智能手機(jī)(如Android手機(jī)、iOS手機(jī)、Windows Phone手機(jī)等)、平板電腦、掌上電腦、筆記本電腦、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID,Mobile Internet Devices)或穿戴式設(shè)備等,上述僅是舉例,而非窮舉,包含但不限于上述圖像處理裝置。
需要說(shuō)明的是,通常情況下,人臉抓拍系統(tǒng)包括圖像攝取、人臉定位、圖像預(yù)處理、以及人臉跟蹤(身份確認(rèn)或者身份查找)。系統(tǒng)輸入一般是一張圖像,而其輸出則是人臉圖像的位置信息,大小信息,以及人臉信息的得分值(表示該人臉與真實(shí)人臉的接近度)。本發(fā)明實(shí)施例中可采用的是改進(jìn)型的級(jí)聯(lián)分類算法(cascade classifier algorithm)
現(xiàn)有技術(shù)中,已經(jīng)的實(shí)施方式,均采用純軟件實(shí)現(xiàn)和現(xiàn)場(chǎng)可編程門陣列Field-Programmable Gate Array,F(xiàn)PGA)加速。軟件實(shí)現(xiàn)都很慢。如果是640*480的圖片size,一般耗時(shí)需要一兩秒左右很常見(jiàn)。
現(xiàn)有的FPGA加速,一般速度很慢(<10fps)。能達(dá)到實(shí)時(shí)的FPGA人臉抓拍系統(tǒng),都是用到很高端的FPGA芯片(如virtex FPGA)。常見(jiàn)的FPGA實(shí)現(xiàn),是將當(dāng)前幀所有的參數(shù)(樹(shù)形碼、門限值、查找表)和圖像都載入到片內(nèi)存儲(chǔ)中,然后運(yùn)行硬件加速算法,等待出結(jié)果后,載入下一幀圖像繼續(xù)計(jì)算。由于處理器從內(nèi)存器中讀取的數(shù)據(jù)量非常龐大,因而,會(huì)導(dǎo)致處理器符合過(guò)重。
當(dāng)然,本發(fā)明實(shí)施例中所涉及到的圖像處理裝置的處理器不僅可以是FPGA處理器,還可以是DSP處理器,還可以是Intel處理器等等。當(dāng)然,本發(fā)明實(shí)施例里中待處理圖像可對(duì)其進(jìn)行編碼,得到對(duì)應(yīng)的樹(shù)形碼,因而,樹(shù)形碼和待處理圖像的像素之間存在對(duì)應(yīng)關(guān)系。在內(nèi)存器中可采用不同的區(qū)域存儲(chǔ)樹(shù)形碼,像素,門限值,查找表等。
請(qǐng)參閱圖1,為本發(fā)明實(shí)施例提供的一種圖像處理方法的實(shí)施例流程示意圖。本實(shí)施例中所描述的圖像處理方法,包括以下步驟:
S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,所述當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),所述M為大于1的整數(shù)。
其中,待處理圖像可為包含人臉圖像的圖像。掃描窗口的尺寸大小為X*X,X為多個(gè)像素點(diǎn)之間的間距。當(dāng)然,待處理圖像中可包含多個(gè)掃描窗口,在執(zhí)行掃描過(guò)程中,可一個(gè)一個(gè)地進(jìn)行掃描,直到所有的掃描窗口掃描完,可得到最后的人臉圖像的圖像信息。
S2、獲取分段掃描參數(shù)P,所述P為所述當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,所述P、所述Q和所述N均為大于1的整數(shù)。
其中,上述分段掃描參數(shù)P、上述預(yù)設(shè)循環(huán)參數(shù)Q以及上述N均可由用戶指定,其均為大于1的整數(shù)。
S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù)。
其中,本發(fā)明實(shí)施例中的內(nèi)存器中存儲(chǔ)有樹(shù)形碼的地址、像素?cái)?shù)據(jù)的地址(該像素?cái)?shù)據(jù)為待處理圖像的像素?cái)?shù)據(jù)),門限值的地址,索引值的地址。
進(jìn)一步地,樹(shù)形碼存儲(chǔ)在存儲(chǔ)器中,每次循環(huán)中,可分配不同的樹(shù)形碼,如此,可按照樹(shù)形碼與地址之間的對(duì)應(yīng)關(guān)系,可確定在本次循環(huán)中得到的樹(shù)形碼在存儲(chǔ)器中的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù)。
例如,第一地址與樹(shù)形碼之間的映射關(guān)系可按照如下方式進(jìn)行表示,例如:
y=f(x)
其中,y表示第一地址,x表示樹(shù)形碼,f表示用樹(shù)形碼與第一地址之間的映射關(guān)系。上述y=f(x)可為線性函數(shù)或者非線性函數(shù)。
S4、根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù)。
可選地,上述計(jì)算單元根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址的具體實(shí)現(xiàn)方式為:
按照所述樹(shù)形碼數(shù)據(jù)與像素之間的對(duì)應(yīng)的關(guān)系計(jì)算所述像素在所述存儲(chǔ)器中的所述第二地址。
具體地,樹(shù)形碼數(shù)據(jù)與像素在內(nèi)存器中的第二地址存在對(duì)應(yīng)關(guān)系,因而,可在確定了樹(shù)形碼數(shù)據(jù)之后,可得到像素在存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù)。
S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值。
可選地,上述步驟S5中,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值,可按照如下方式實(shí)現(xiàn):
通過(guò)指定人臉檢測(cè)算法,對(duì)所述像素?cái)?shù)據(jù)進(jìn)行計(jì)算,得到索引值。
當(dāng)然,還可以采用如下人臉檢測(cè)算法實(shí)現(xiàn),上述指定人臉檢測(cè)可采用如下至少一種人臉檢測(cè)算法實(shí)現(xiàn):NPD人臉檢測(cè)算法、Boosting分類器、HAAR人臉檢測(cè)器、DPM(Deformable Part Model)人臉檢測(cè)器、ACF(Aggregated Channel Feature)和PICO(Pixel Intensity Comparison Object Detector)人臉檢測(cè)器等等。
下面列舉幾種常見(jiàn)的人臉檢測(cè)算法。
Boosting分類器,boosting可以認(rèn)為是一種特征篩選算法,由于其簡(jiǎn)單和泛化能力強(qiáng)等特點(diǎn),在很多領(lǐng)域都有著非常廣的應(yīng)用。具體來(lái)講,boosting將原始交織在一起的特征空間,通過(guò)特征挑選和加強(qiáng)錯(cuò)分樣本的權(quán)重來(lái)逐步將樣本空間分開(kāi)。
HAAR人臉檢測(cè)器,HAAR人臉檢測(cè)器是最早將人臉檢測(cè)提升至應(yīng)用級(jí)別的算法之一。算法主要分為三個(gè)部分,特征生成、boosting挑選弱分類器特征以及強(qiáng)分類器構(gòu)建。特征生成主要是構(gòu)建許多黑白相間的矩形塊,通過(guò)比較黑白矩形的像素和的差值來(lái)生成特征,取名也是由于其計(jì)算過(guò)程和HAAR小波的計(jì)算過(guò)程類似,矩形塊的像素和可以基于積分圖來(lái)計(jì)算,計(jì)算速度和開(kāi)銷相當(dāng)可觀;特征挑選是通過(guò)boosting算法進(jìn)行的;最后將挑選出來(lái)的弱分類器特征通過(guò)特征組合來(lái)生成許多強(qiáng)分類器。
DPM人臉檢測(cè)器,DPM將剛性或非剛性的物體分成許多子部件,通過(guò)對(duì)各子部件進(jìn)行描述來(lái)最終表達(dá)所要識(shí)別檢測(cè)的物體,各部件和子部件通過(guò)HOG進(jìn)行特征描述。通過(guò)優(yōu)化算法來(lái)求解每個(gè)部分的響應(yīng)濾波器。由于其計(jì)算相對(duì)比較復(fù)雜,限制了其在許多領(lǐng)域的應(yīng)用。
ACF人臉檢測(cè)器,ACF是ICF(Integral Channel Feature)的一種擴(kuò)展,相當(dāng)于在ICF的基礎(chǔ)上做了一個(gè)子采樣,這樣做的好處是一方面降低特征的維度,兩一方面可以增加對(duì)形變的抵御能力。ACF最早應(yīng)用于行人檢測(cè)領(lǐng)域,之后有人將其應(yīng)用與人臉檢測(cè)領(lǐng)域也取得了不錯(cuò)的效果。但是由于其計(jì)算開(kāi)銷仍然比較大,特征存在較大冗余,改進(jìn)空間也很大。
PICO人臉檢測(cè)器,PICO是一種基于統(tǒng)計(jì)特性的特征描述算法,其特征描述與Ferns比較類似,由于其計(jì)算的簡(jiǎn)單性和較強(qiáng)的描述能力,被應(yīng)用在很多計(jì)算機(jī)視覺(jué)領(lǐng)域如物體檢測(cè)、目標(biāo)識(shí)別、目標(biāo)跟蹤等領(lǐng)域。最近有人將其應(yīng)用在人臉檢測(cè)領(lǐng)域,精度比較一般,但是計(jì)算速度非常快。究其原因還是特征表達(dá)過(guò)于簡(jiǎn)單,有比較大的提升空間。
S6、根據(jù)所述索引值計(jì)算門限值的第三地址和查找表在所述存儲(chǔ)器的第四地址,并從所述第三地址獲取門限值數(shù)據(jù)和從所述第四地址獲取查找表數(shù)據(jù)。
其中,上述門限值的地址可由循環(huán)次數(shù)和索引值共同決定,即處于不同的循環(huán)次數(shù)中,得到的第三地址,同樣地,可根據(jù)索引值確定對(duì)應(yīng)的查找表的第四地址,進(jìn)而,從第三地址獲取門限值數(shù)據(jù)和第四地址獲取查找表數(shù)據(jù)。
S7、比較所述門限值數(shù)據(jù)和所述查找表數(shù)據(jù)。
S8、在所述查找表數(shù)據(jù)小于所述門限值數(shù)據(jù)時(shí),退出針對(duì)所述當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10。
S9、在所述查找表數(shù)據(jù)大于所述門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了所述Q次步驟S3-S7,若否,返回步驟S3,若是,記錄所述人臉圖像的圖像信息;
可選地,查找表數(shù)據(jù)大于門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了Q次步驟S3-S7,那么,則返回步驟S3,則可重新執(zhí)行S3-S7。若當(dāng)前執(zhí)行了Q次步驟S3-S7,則記錄人臉圖像的圖像信息。
可選地,上述人臉圖像的圖像信息可包括但不僅限于:人臉位置、人臉大小和人臉的角度,上述人臉的角度可包括但不僅限于:水平轉(zhuǎn)動(dòng)角度、俯仰角或者傾斜度。例如,可定義人臉圖像數(shù)據(jù)要求兩眼間距不小于30像素,建議60像素以上。水平轉(zhuǎn)動(dòng)角度不超過(guò)±30°、俯仰角不超過(guò)±20°、傾斜角不超過(guò)±45°。建議水平轉(zhuǎn)動(dòng)角度不超過(guò)±15°、俯仰角不超過(guò)±10°、傾斜角不超過(guò)±15°。
例如,還可對(duì)人臉圖像是否被其他物體遮擋進(jìn)行篩選,通常情況下,飾物不應(yīng)遮擋臉部主要區(qū)域,飾物如深色墨鏡、口罩和夸張首飾等,當(dāng)然,也有可能攝像頭上面布滿灰塵,導(dǎo)致人臉圖像被遮擋。本發(fā)明實(shí)施例中的待處理圖像的圖片格式可包括但不僅限于:BMP,JPEG,JPEG2000,PNG等等。
S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到所述N次,若是,得到所述人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的所述人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。
可選地,在步驟S9中得到的人臉圖像的圖像信息中確定下一個(gè)掃描窗口,如此,可對(duì)人臉圖像的圖像信息進(jìn)行層層篩選。
進(jìn)一步可選地,在所述S10之后,還包含如下步驟:
S11、判斷所述M個(gè)掃描窗口都已經(jīng)掃描結(jié)束;若是,得到所述人臉圖像的目標(biāo)圖像信息。
即在所有的掃描窗口結(jié)束后,可輸入最后的人臉圖像的圖像信息,即人臉圖像的目標(biāo)圖像信息。
可以看出,通過(guò)本發(fā)明實(shí)施例,S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),M為大于1的整數(shù),S2、獲取分段掃描參數(shù)P,P為當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,P、Q和N均為大于1的整數(shù),S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù),S4、根據(jù)樹(shù)形碼數(shù)據(jù)計(jì)算像素在存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù),S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)像素?cái)?shù)據(jù)計(jì)算索引值,S6、根據(jù)索引值計(jì)算門限值的第三地址和查找表在存儲(chǔ)器的第四地址,并從第三地址獲取門限值數(shù)據(jù)和從第四地址獲取查找表數(shù)據(jù),S7、比較門限值數(shù)據(jù)和查找表數(shù)據(jù),S8、在查找表數(shù)據(jù)小于門限值數(shù)據(jù)時(shí),退出針對(duì)當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10,S9、在查找表數(shù)據(jù)大于門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了Q次步驟S3-S7,若否,返回步驟S3,若是,記錄人臉圖像的圖像信息,S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到N次,若是,得到人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。如此,可實(shí)現(xiàn)對(duì)待處理圖像進(jìn)行人臉識(shí)別,從而,以減少存儲(chǔ)器的需求,從而降低硬件帶來(lái)的限制。
進(jìn)一步地,實(shí)施本發(fā)明實(shí)施例,若在FPGA上完成本發(fā)明實(shí)施例,可大大減少了硬件資源尤其是存儲(chǔ)資源的需求,對(duì)于FPGA選型更加便捷,不需要受限于存儲(chǔ)資源。而且不需要受限于循環(huán)次數(shù),可以通過(guò)拆分,達(dá)到實(shí)現(xiàn)的目的。
與上述一致地,以下為實(shí)施上述圖像處理方法的裝置,具體如下:
請(qǐng)參閱圖2,為本發(fā)明實(shí)施例提供的一種圖像處理裝置的第一實(shí)施例結(jié)構(gòu)示意圖。本實(shí)施例中所描述的圖像處理裝置,包括:獲取單元201、計(jì)算單元202、比較單元203、處理單元204和判斷單元205,具體如下:
獲取單元201,用于執(zhí)行S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,所述當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),所述M為大于1的整數(shù);
所述獲取單元201,還具體用于執(zhí)行S2、獲取分段掃描參數(shù)P,所述P為所述當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,所述P、所述Q和所述N均為大于1的整數(shù);
計(jì)算單元202,用于執(zhí)行S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù);
所述計(jì)算單元202,還具體用于執(zhí)行S4、根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù);S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值;S6、根據(jù)所述索引值計(jì)算門限值的第三地址和查找表在所述存儲(chǔ)器的第四地址,并從所述第三地址獲取門限值數(shù)據(jù)和從所述第四地址獲取查找表數(shù)據(jù);
比較單元203,用于執(zhí)行S7、比較所述門限值數(shù)據(jù)和所述查找表數(shù)據(jù);
處理單元204,用于執(zhí)行S8、在所述查找表數(shù)據(jù)小于所述門限值數(shù)據(jù)時(shí),退出針對(duì)所述當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10;
所述處理單元204,還具體用于執(zhí)行S9、在所述查找表數(shù)據(jù)大于所述門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了所述Q次步驟S3-S7,若否,返回步驟S3,若是,記錄所述人臉圖像的圖像信息;
判斷單元205,用于執(zhí)行S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到所述N次,若是,由所述獲取單元得到所述人臉圖像的目標(biāo)圖像信息,若否,由所述獲取單元在步驟S9中得到的所述人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。
可選地,所述計(jì)算單元202根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值的具體實(shí)現(xiàn)方式為:
通過(guò)指定人臉檢測(cè)算法,對(duì)所述像素?cái)?shù)據(jù)進(jìn)行計(jì)算,得到索引值。
可選地,所述圖像信息為以下至少一種:
人臉位置、人臉大小和人臉的角度。
可選地,所述計(jì)算單元202根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址的具體實(shí)現(xiàn)方式為:
按照所述樹(shù)形碼數(shù)據(jù)與像素之間的對(duì)應(yīng)的關(guān)系計(jì)算所述像素在所述存儲(chǔ)器中的所述第二地址。
可選地,所述判斷單元205還具體用于:在所述S10執(zhí)行完之后,判斷所述M個(gè)掃描窗口都已經(jīng)掃描結(jié)束;若所述判斷單元205的判斷結(jié)果為是,得到所述人臉圖像的目標(biāo)圖像信息。
可以看出,通過(guò)本發(fā)明實(shí)施例所描述的圖像處理裝置,可執(zhí)行如下步驟;S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),M為大于1的整數(shù),S2、獲取分段掃描參數(shù)P,P為當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,P、Q和N均為大于1的整數(shù),S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù),S4、根據(jù)樹(shù)形碼數(shù)據(jù)計(jì)算像素在存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù),S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)像素?cái)?shù)據(jù)計(jì)算索引值,S6、根據(jù)索引值計(jì)算門限值的第三地址和查找表在存儲(chǔ)器的第四地址,并從第三地址獲取門限值數(shù)據(jù)和從第四地址獲取查找表數(shù)據(jù),S7、比較門限值數(shù)據(jù)和查找表數(shù)據(jù),S8、在查找表數(shù)據(jù)小于門限值數(shù)據(jù)時(shí),退出針對(duì)當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10,S9、在查找表數(shù)據(jù)大于門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了Q次步驟S3-S7,若否,返回步驟S3,若是,記錄人臉圖像的圖像信息,S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到N次,若是,得到人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。如此,可實(shí)現(xiàn)對(duì)待處理圖像進(jìn)行人臉識(shí)別,從而,以減少存儲(chǔ)器的需求,從而降低硬件帶來(lái)的限制。
與上述一致地,請(qǐng)參閱圖3,為本發(fā)明實(shí)施例提供的一種圖像處理裝置的第二實(shí)施例結(jié)構(gòu)示意圖。本實(shí)施例中所描述的圖像處理裝置,包括:至少一個(gè)輸入設(shè)備1000;至少一個(gè)輸出設(shè)備2000;至少一個(gè)處理器3000,例如CPU;和存儲(chǔ)器4000,上述輸入設(shè)備1000、輸出設(shè)備2000、處理器3000和存儲(chǔ)器4000通過(guò)總線5000連接。
其中,上述輸入設(shè)備1000具體可為觸控面板、物理按鍵或者鼠標(biāo)。
上述輸出設(shè)備2000具體可為顯示屏。
上述存儲(chǔ)器4000可以是高速RAM存儲(chǔ)器,也可為非易失存儲(chǔ)器(non-volatile memory),例如磁盤存儲(chǔ)器。上述存儲(chǔ)器4000用于存儲(chǔ)一組程序代碼,上述輸入設(shè)備1000、輸出設(shè)備2000和處理器3000用于調(diào)用存儲(chǔ)器4000中存儲(chǔ)的程序代碼,執(zhí)行如下操作:
上述處理器3000,用于:
S1、獲取包含人臉圖像的待處理圖像中的當(dāng)前掃描窗口,所述當(dāng)前掃描窗口為M個(gè)掃描窗口中的任一個(gè),所述M為大于1的整數(shù);
S2、獲取分段掃描參數(shù)P,所述P為所述當(dāng)前掃描窗口的預(yù)設(shè)循環(huán)參數(shù)Q的1/N,所述P、所述Q和所述N均為大于1的整數(shù);
S3、計(jì)算樹(shù)形碼在存儲(chǔ)器中存儲(chǔ)的第一地址,并從該第一地址獲取對(duì)應(yīng)的樹(shù)形碼數(shù)據(jù);
S4、根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,并從該第二地址獲取對(duì)應(yīng)的像素?cái)?shù)據(jù);
S5、在執(zhí)行步驟S3-S4達(dá)到預(yù)設(shè)次數(shù)后,根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值;
S6、根據(jù)所述索引值計(jì)算門限值的第三地址和查找表在所述存儲(chǔ)器的第四地址,并從所述第三地址獲取門限值數(shù)據(jù)和從所述第四地址獲取查找表數(shù)據(jù);
S7、比較所述門限值數(shù)據(jù)和所述查找表數(shù)據(jù);
S8、在所述查找表數(shù)據(jù)小于所述門限值數(shù)據(jù)時(shí),退出針對(duì)所述當(dāng)前掃描窗口的掃描工作,并進(jìn)入步驟S10;
S9、在所述查找表數(shù)據(jù)大于所述門限值數(shù)據(jù)時(shí),判斷當(dāng)前是否執(zhí)行了所述Q次步驟S3-S7,若否,返回步驟S3,若是,記錄所述人臉圖像的圖像信息;
S10、判斷是否執(zhí)行了步驟S2的次數(shù)達(dá)到所述N次,若是,得到所述人臉圖像的目標(biāo)圖像信息,若否,在步驟S9中得到的所述人臉圖像的圖像信息中獲取下一個(gè)掃描窗口,執(zhí)行步驟S2。
可選地,上述處理器3000根據(jù)所述像素?cái)?shù)據(jù)計(jì)算索引值,包括:
通過(guò)指定人臉檢測(cè)算法,對(duì)所述像素?cái)?shù)據(jù)進(jìn)行計(jì)算,得到索引值。
可選地,所述圖像信息為以下至少一種:
人臉位置、人臉大小和人臉的角度。
可選地,上述處理器3000,根據(jù)所述樹(shù)形碼數(shù)據(jù)計(jì)算像素在所述存儲(chǔ)器中的第二地址,包括:
按照所述樹(shù)形碼數(shù)據(jù)與像素之間的對(duì)應(yīng)的關(guān)系計(jì)算所述像素在所述存儲(chǔ)器中的所述第二地址。
可選地,上述處理器3000,在所述S10之后,還用于執(zhí)行步驟:
S11、判斷所述M個(gè)掃描窗口都已經(jīng)掃描結(jié)束;若是,得到所述人臉圖像的目標(biāo)圖像信息。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其中,該計(jì)算機(jī)存儲(chǔ)介質(zhì)可存儲(chǔ)有程序,該程序執(zhí)行時(shí)包括上述方法實(shí)施例中記載的任何一種圖像處理方法的部分或全部步驟。
盡管在此結(jié)合各實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,然而,在實(shí)施所要求保護(hù)的本發(fā)明過(guò)程中,本領(lǐng)域技術(shù)人員通過(guò)查看所述附圖、公開(kāi)內(nèi)容、以及所附權(quán)利要求書(shū),可理解并實(shí)現(xiàn)所述公開(kāi)實(shí)施例的其他變化。在權(quán)利要求中,“包括”(comprising)一詞不排除其他組成部分或步驟,“一”或“一個(gè)”不排除多個(gè)的情況。單個(gè)處理器或其他單元可以實(shí)現(xiàn)權(quán)利要求中列舉的若干項(xiàng)功能。相互不同的從屬權(quán)利要求中記載了某些措施,但這并不表示這些措施不能組合起來(lái)產(chǎn)生良好的效果。
本領(lǐng)域技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、裝置(設(shè)備)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。計(jì)算機(jī)程序存儲(chǔ)/分布在合適的介質(zhì)中,與其它硬件一起提供或作為硬件的一部分,也可以采用其他分布形式,如通過(guò)Internet或其它有線或無(wú)線電信系統(tǒng)。
本發(fā)明是參照本發(fā)明實(shí)施例的方法、裝置(設(shè)備)和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
盡管結(jié)合具體特征及其實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,顯而易見(jiàn)的,在不脫離本發(fā)明的精神和范圍的情況下,可對(duì)其進(jìn)行各種修改和組合。相應(yīng)地,本說(shuō)明書(shū)和附圖僅僅是所附權(quán)利要求所界定的本發(fā)明的示例性說(shuō)明,且視為已覆蓋本發(fā)明范圍內(nèi)的任意和所有修改、變化、組合或等同物。顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。