欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種關(guān)鍵點(diǎn)的定位方法及終端與流程

文檔序號(hào):12365538閱讀:442來源:國(guó)知局
一種關(guān)鍵點(diǎn)的定位方法及終端與流程

本發(fā)明涉及計(jì)算機(jī)視覺領(lǐng)域中的圖像識(shí)別定位技術(shù),尤其涉及一種關(guān)鍵點(diǎn)的定位方法及終端。



背景技術(shù):

用戶采集目標(biāo)對(duì)象時(shí)會(huì)進(jìn)行各種識(shí)別,比如以人臉識(shí)別為例,計(jì)算機(jī)人臉識(shí)別將根據(jù)人臉來辨別未知人物身份的能力賦予了計(jì)算機(jī)系統(tǒng),使得計(jì)算機(jī)系統(tǒng)基于已知的人臉樣本庫,利用計(jì)算機(jī)分析和模式識(shí)別技術(shù)從靜態(tài)或者動(dòng)態(tài)的場(chǎng)景中,識(shí)別或驗(yàn)證一個(gè)或多個(gè)人臉,該技術(shù)已經(jīng)被廣泛的應(yīng)用于公共安全,身份識(shí)別等場(chǎng)合。人臉識(shí)別系統(tǒng)包括有人臉檢測(cè)、人臉關(guān)鍵點(diǎn)定位、識(shí)別和跟蹤等步驟,而人臉關(guān)鍵點(diǎn)檢測(cè)以及跟蹤是人臉識(shí)別中非常重要的一環(huán),也是人臉驗(yàn)證,人臉識(shí)別,以及各種3D人臉建模,人臉的美化、疲勞和分神的判斷等應(yīng)用的基礎(chǔ),因此,人臉關(guān)鍵點(diǎn)的檢測(cè)及跟蹤精度至關(guān)重要。

現(xiàn)有技術(shù)中,提出了一種使用多個(gè)人臉參數(shù)模型的人臉關(guān)鍵點(diǎn)定位方法,具體的,根據(jù)人臉的姿態(tài),或者其他一些特征對(duì)人臉進(jìn)行分類,并針對(duì)每一個(gè)人臉的類別進(jìn)行學(xué)習(xí)以通過建模得到一個(gè)單獨(dú)的人臉參數(shù)模型,也就是說,對(duì)于多個(gè)類別就需要設(shè)計(jì)多個(gè)人臉參數(shù)模型,最后通過判斷人臉類別,選擇一個(gè)相應(yīng)的人臉參數(shù)模型來確定人臉關(guān)鍵點(diǎn)的坐標(biāo)。

然而,當(dāng)檢測(cè)到非人臉區(qū)域或人臉關(guān)鍵點(diǎn)定位結(jié)果較差時(shí),終端無法自動(dòng)規(guī)避這類錯(cuò)誤,這時(shí)終端需要引入額外的判定方式進(jìn)行這類錯(cuò)誤的判定,而且在具體處理時(shí),勢(shì)必占用更多的內(nèi)存存儲(chǔ)空間,導(dǎo)致進(jìn)行人臉關(guān)鍵點(diǎn)的過程復(fù)雜且低效。



技術(shù)實(shí)現(xiàn)要素:

為解決上述技術(shù)問題,本發(fā)明實(shí)施例期望提供一種關(guān)鍵點(diǎn)的定位方法及終端,能夠在使用較小的內(nèi)存占用量的前提下,判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度,提高人臉關(guān)鍵點(diǎn)的跟蹤的處理速度。

本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:

本發(fā)明實(shí)施例提供了一種關(guān)鍵點(diǎn)的定位方法,包括:

采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在所述目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域;

將所述目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度;

當(dāng)所述第一置信度大于等于預(yù)設(shè)閾值時(shí),獲取所述目標(biāo)檢測(cè)區(qū)域中的所述第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像;

將所述第二目標(biāo)圖像輸入所述預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度,并根據(jù)所述第二置信度判定所述第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度;

當(dāng)所述第二置信度大于等于預(yù)設(shè)準(zhǔn)確度時(shí),確定所述第一人臉關(guān)鍵點(diǎn)的位置為所述目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

本發(fā)明實(shí)施例提供了一種終端,包括:

生成單元,用于采集單元采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在所述目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域;

輸出單元,用于將所述目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度;

獲取單元,用于當(dāng)所述第一置信度大于等于預(yù)設(shè)閾值時(shí),獲取所述目標(biāo)檢測(cè)區(qū)域中的所述第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像;

所述輸出單元,還用于將所述第二目標(biāo)圖像輸入所述預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度,

判斷單元,用于根據(jù)所述第二置信度判定所述第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度;

確定單元,用于當(dāng)所述第二置信度大于等于預(yù)設(shè)準(zhǔn)確度時(shí),確定所述第一人臉關(guān)鍵點(diǎn)的位置為所述目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

本發(fā)明實(shí)施例提供了一種關(guān)鍵點(diǎn)的定位方法及終端,通過采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域;將目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度;當(dāng)?shù)谝恢眯哦却笥诘扔陬A(yù)設(shè)閾值時(shí),獲取目標(biāo)檢測(cè)區(qū)域中的第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像;將第二目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度,并根據(jù)第二置信度判定第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度;當(dāng)?shù)诙眯哦却笥诘扔陬A(yù)設(shè)準(zhǔn)確度時(shí),確定第一人臉關(guān)鍵點(diǎn)的位置為目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。采用上述技術(shù)實(shí)現(xiàn)方案,由于終端在采用預(yù)設(shè)的第一模型集合進(jìn)行人臉關(guān)鍵點(diǎn)定位的時(shí)候可以同時(shí)確定該人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度,在減少了后續(xù)重新再進(jìn)行準(zhǔn)確度評(píng)判的時(shí)間和占用的空間的情況下可以判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度,從而提高人臉關(guān)鍵點(diǎn)的跟蹤的處理速度。

附圖說明

圖1為本發(fā)明實(shí)施例中進(jìn)行信息交互的各種硬件實(shí)體的示意圖;

圖2為本發(fā)明實(shí)施例提供的一種關(guān)鍵點(diǎn)的定位方法的框架示意圖;

圖3為本發(fā)明實(shí)施例提供的人臉關(guān)鍵點(diǎn)的示意圖;

圖4為本發(fā)明實(shí)施例提供的標(biāo)注目標(biāo)檢測(cè)區(qū)域的示意圖;

圖5a為本發(fā)明實(shí)施例提供的正常人臉圖像的第一目標(biāo)圖像在目標(biāo)檢測(cè)區(qū)域的示意圖;

圖5b為本發(fā)明實(shí)施例提供的非人臉圖像的第一目標(biāo)圖像在目標(biāo)檢測(cè)區(qū)域的示意圖;

圖5c為本發(fā)明實(shí)施例提供的非正常人臉圖像的第一目標(biāo)圖像在目標(biāo)檢測(cè)區(qū)域的示意圖;

圖6為本發(fā)明實(shí)施例提供的正常人臉圖像的第一人臉關(guān)鍵點(diǎn)的位置效果圖;

圖7為本發(fā)明實(shí)施例提供的非正常人臉圖像的第一人臉關(guān)鍵點(diǎn)的位置效果圖;

圖8為本發(fā)明實(shí)施例提供的正常人臉圖像的第二目標(biāo)圖像在目標(biāo)檢測(cè)區(qū)域的示意圖;

圖9為本發(fā)明實(shí)施例提供的一種模型的訓(xùn)練過程示意圖一;

圖10為本發(fā)明實(shí)施例提供的一種模型的訓(xùn)練過程示意圖二;

圖11為本發(fā)明實(shí)施例提供的預(yù)設(shè)的第一模型集合的結(jié)構(gòu)示意圖;

圖12為本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖一;

圖13為本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖二;

圖14為本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖三;

圖15為本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖四。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。

終端:指移動(dòng)電子設(shè)備,也被稱為行動(dòng)裝置(英語:Mobile device)、流動(dòng)裝置、手持裝置(handheld device)、可穿戴設(shè)備等,是一種基于嵌入式芯片的計(jì)算設(shè)備,通常有一個(gè)小的顯示螢?zāi)?,觸控輸入,或是小型的鍵盤。

機(jī)器學(xué)習(xí):依托概率論,統(tǒng)計(jì)學(xué),神經(jīng)傳播等理論,使計(jì)算機(jī)能夠模擬人類的學(xué)習(xí)行為,以獲取新的知識(shí)或者技能,重新組織已有知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。

模型訓(xùn)練:將人工選擇的樣本輸入給機(jī)器學(xué)習(xí)系統(tǒng),通過不斷調(diào)整模型參數(shù),使最終模型對(duì)樣本識(shí)別的準(zhǔn)確率達(dá)到最優(yōu)。

如圖1所示,為本發(fā)明實(shí)施例中進(jìn)行信息交互的系統(tǒng)架構(gòu)中的各種硬件實(shí)體的示意圖,圖1中包括:一個(gè)或多個(gè)服務(wù)器41~4n、終端設(shè)備21-25及網(wǎng)絡(luò)31,網(wǎng)絡(luò)31中包括路由器,網(wǎng)關(guān)等等網(wǎng)絡(luò)實(shí)體,圖1中并未體現(xiàn)。終端設(shè)備21-25通過有線網(wǎng)絡(luò)或者無線網(wǎng)絡(luò)與服務(wù)器41~4n進(jìn)行業(yè)務(wù)產(chǎn)品信息交互,以便從終端21-25獲取通過用戶行為產(chǎn)生相關(guān)數(shù)據(jù)并傳輸至服務(wù)器41~4n。終端設(shè)備的類型如圖1所示,包括手機(jī)(終端23)、平板電腦或PDA(終端25)、臺(tái)式機(jī)(終端22)、PC機(jī)(終端24)、一體機(jī)(終端21)等類型。其中,終端設(shè)備中安裝有各種用戶所需的應(yīng)用功能模塊,比如具備娛樂功能的應(yīng)用(如視頻應(yīng)用,音頻播放應(yīng)用,游戲應(yīng)用,閱讀軟件),又如具備服務(wù)功能的應(yīng)用(如地圖導(dǎo)航應(yīng)用、團(tuán)購(gòu)應(yīng)用、拍攝應(yīng)用等),再者比如設(shè)置應(yīng)用等系統(tǒng)功能。

基于上述圖1所示的系統(tǒng),以用戶所需的應(yīng)用為拍攝應(yīng)用為例,在進(jìn)行人臉識(shí)別時(shí),終端設(shè)備21-25通過網(wǎng)絡(luò)31從服務(wù)器11~1n中按照需求下載相機(jī)應(yīng)用和/或拍攝應(yīng)用更新數(shù)據(jù)包和/或與采集功能應(yīng)用相關(guān)的數(shù)據(jù)信息或業(yè)務(wù)信息,采用本發(fā)明實(shí)施例,在終端設(shè)備上開啟拍攝應(yīng)用,進(jìn)行目標(biāo)對(duì)象的采集工作,采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域;將目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度;當(dāng)?shù)谝恢眯哦却笥诘扔陬A(yù)設(shè)閾值時(shí),獲取目標(biāo)檢測(cè)區(qū)域中的第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像;將第二目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度,并根據(jù)第二置信度判定第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度;當(dāng)?shù)诙眯哦却笥诘扔陬A(yù)設(shè)準(zhǔn)確度時(shí),確定第一人臉關(guān)鍵點(diǎn)的位置為目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。采用上述技術(shù)實(shí)現(xiàn)方案,由于終端在采用預(yù)設(shè)的第一模型集合進(jìn)行人臉關(guān)鍵點(diǎn)定位的時(shí)候可以同時(shí)確定該人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度,在減少了后續(xù)重新再進(jìn)行準(zhǔn)確度評(píng)判的時(shí)間和占用的空間的情況下可以判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度,從而提高人臉關(guān)鍵點(diǎn)的跟蹤的處理速度。

上述圖1的例子只是實(shí)現(xiàn)本發(fā)明實(shí)施例的一個(gè)系統(tǒng)架構(gòu)實(shí)例,本發(fā)明實(shí)施例并不限于上述圖1所述的系統(tǒng)結(jié)構(gòu),基于該系統(tǒng)架構(gòu),提出本發(fā)明各個(gè)實(shí)施例。

實(shí)施例一

本發(fā)明實(shí)施例提供了一種關(guān)鍵點(diǎn)的定位方法,如圖2所示,該方法可以包括:

S101、采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域。

本發(fā)明實(shí)施例中,關(guān)鍵點(diǎn)的定位方法指的是人臉關(guān)鍵點(diǎn)的定位方法,人臉關(guān)鍵點(diǎn)的定位是指通過算法精確找出人臉關(guān)鍵點(diǎn)的位置。其中,人臉關(guān)鍵點(diǎn)是臉部一些表征能力強(qiáng)的關(guān)鍵點(diǎn),比如眼睛、鼻子、嘴巴和臉部輪廓等。

可選的,如圖3所示的人臉圖像的初始關(guān)鍵點(diǎn)位置的示意圖,本發(fā)明實(shí)施例中的關(guān)鍵點(diǎn)可以有49個(gè)關(guān)鍵點(diǎn)。

需要說明的是,本發(fā)明實(shí)施例中提供的關(guān)鍵點(diǎn)的定位方法的應(yīng)用場(chǎng)景為:進(jìn)行人臉識(shí)別定位、人臉圖像處理、人臉追蹤或人臉3D建模等情形中。

可選的,本發(fā)明實(shí)施例中的目標(biāo)檢測(cè)區(qū)域?yàn)檫M(jìn)行目標(biāo)對(duì)象檢測(cè)而設(shè)定的監(jiān)測(cè)區(qū)域,例如,人臉檢測(cè)框等,該人臉檢測(cè)框可以為矩形、圓形或橢圓等形狀,本發(fā)明實(shí)施例可以根據(jù)實(shí)際應(yīng)用設(shè)計(jì)目標(biāo)檢測(cè)區(qū)域,并不限制該目標(biāo)監(jiān)測(cè)區(qū)域的形式或形狀。

進(jìn)一步地,本發(fā)明實(shí)施例中的預(yù)設(shè)配置是指目標(biāo)檢測(cè)框的大小,該預(yù)設(shè)配置可以隨著每次人臉關(guān)鍵點(diǎn)的定位的準(zhǔn)確度進(jìn)行調(diào)整,以達(dá)到最佳的尺寸用于人臉關(guān)鍵點(diǎn)的定位。其中,預(yù)設(shè)配置可以自動(dòng)按照一定規(guī)則進(jìn)行調(diào)整,也可以用戶進(jìn)行手動(dòng)設(shè)置的變動(dòng),實(shí)際的預(yù)設(shè)配置的調(diào)整大小本發(fā)明實(shí)施例不作限制。

可選的,本發(fā)明實(shí)施例中的終端可以為手機(jī)、平板及電腦等支持人臉識(shí)別定位技術(shù)的電子設(shè)備,且具有采集信息的功能。

具體的,終端支持人臉識(shí)別定位技術(shù),在進(jìn)行人臉關(guān)鍵點(diǎn)的定位時(shí),首先要采集到待識(shí)別的目標(biāo)對(duì)象(目標(biāo)圖像),該終端可以按照預(yù)設(shè)配置在目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域并進(jìn)行標(biāo)注,使得標(biāo)注過后的目標(biāo)檢測(cè)區(qū)域顯示在人臉圖像上,以進(jìn)行人臉關(guān)鍵點(diǎn)的定位。

進(jìn)一步地,目標(biāo)圖像的目標(biāo)檢測(cè)區(qū)域的位置可以初始默認(rèn)位置為目標(biāo)圖像的中心位置,例如,將人臉檢測(cè)框(目標(biāo)檢測(cè)區(qū)域)歸一化為長(zhǎng)度為1時(shí),標(biāo)注中心在(0,0)的標(biāo)準(zhǔn)人臉檢測(cè)框。通過后面進(jìn)行預(yù)設(shè)的第一模型集合的確定而得到的人臉關(guān)鍵點(diǎn)的位置來決定。

可選的,本發(fā)明實(shí)施例中的采集目標(biāo)對(duì)象時(shí),終端可以采用終端上設(shè)置的攝像頭進(jìn)行目標(biāo)對(duì)象的圖像信息采集。

具體的,為了便于用戶使用,在有前置攝像頭的情況下,終端可以啟動(dòng)前置攝像頭進(jìn)行當(dāng)前的目標(biāo)對(duì)象的信息采集工作;在沒有前置攝像頭的情況下,終端可以啟動(dòng)后置攝像頭,采集當(dāng)前的目標(biāo)對(duì)象的圖像信息。

需要說明的是,本發(fā)明實(shí)施例中采集的目標(biāo)對(duì)象的信息可能是人臉圖像,也可能是其他的風(fēng)景或動(dòng)物的圖像,因此,在采集目標(biāo)對(duì)象之后,終端可以通過預(yù)設(shè)的第一模型集合的置信度分支最后檢測(cè)圖像的類別,當(dāng)該終端采集的目標(biāo)對(duì)象為人臉圖像時(shí),預(yù)設(shè)第一模型集合就可以輸出人臉關(guān)鍵點(diǎn)的定位了。

可以理解的是,在本發(fā)明實(shí)施例中,由于用戶的生物特征信息是一個(gè)特征相同或者相似的用戶的可能性很小。因此,采用用戶生物特征信息中的人臉特征是不易被盜用或冒用的,因此,采用人臉識(shí)別的方式進(jìn)行各種應(yīng)用的保密性非常好。

示例性的,如圖4所示,假設(shè)手機(jī)A采用人臉進(jìn)行了加密,當(dāng)使用該手機(jī)A時(shí),按鍵啟動(dòng)后,手機(jī)A的前置攝像頭采集使用者的圖像信息,當(dāng)該手機(jī)A按照預(yù)設(shè)配置在人臉圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域B并標(biāo)注為矩形框。

S102、將目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度。

終端按照預(yù)設(shè)配置在目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域之后,由于目標(biāo)檢測(cè)區(qū)域標(biāo)注了一個(gè)區(qū)域的人臉圖像,因此,將該目標(biāo)檢測(cè)區(qū)域標(biāo)注的人臉檢測(cè)區(qū)域中的人臉圖像稱為第一目標(biāo)圖像。本發(fā)明實(shí)施例進(jìn)行人臉識(shí)別(人臉關(guān)鍵點(diǎn)的定位)的時(shí)候,該終端將第一目標(biāo)圖像輸入用于進(jìn)行人臉識(shí)別的預(yù)設(shè)的第一模型集合,這樣的話,該預(yù)設(shè)的第一模型集合就可以輸出第一人臉關(guān)鍵點(diǎn)的位置等信息了。

需要說明的是,本發(fā)明實(shí)施例中的預(yù)設(shè)的第一模型集合用于表征人臉圖像與第一人臉關(guān)鍵點(diǎn)的位置、置信度的關(guān)系模型的集合,因此,終端在將第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合之后,該終端通過該預(yù)設(shè)的第一模型集合還輸出(計(jì)算出)了表征第一目標(biāo)圖像是否為人臉的準(zhǔn)確度的數(shù)值,即第一置信度。

可以理解的是,本發(fā)明實(shí)施例中,目標(biāo)圖像可能為人臉圖像或非人臉圖像,或大小不正常的人臉圖像等多種情況,在這樣的情況下,終端對(duì)目標(biāo)圖像中的第一目標(biāo)圖像的選取是否正好選取到了人臉圖像,以及是否選取的人臉圖像的五官大小剛好全部選取到了是通過預(yù)設(shè)的第一模型集合可以判斷的,該終端將第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合輸出的第一置信度就可以判斷出目標(biāo)檢測(cè)區(qū)域選取的第一目標(biāo)圖像為大小剛好的人臉圖像的準(zhǔn)確度是多少。

需要說明的是,本發(fā)明實(shí)施例中的目標(biāo)檢測(cè)區(qū)域的默認(rèn)位置可以為圖像的中心(也可以是其他設(shè)置方式,本發(fā)明實(shí)施例不作限制),這時(shí),當(dāng)終端采集到的目標(biāo)圖像不是人臉圖像或者采集到的人臉圖像的位置比較偏的情況時(shí),終端得到的第一目標(biāo)圖像對(duì)應(yīng)的第一置信度的數(shù)值就比較小,反之,當(dāng)?shù)谝荒繕?biāo)圖像的選取的人臉圖像越全面和完整,那么第一目標(biāo)圖像對(duì)應(yīng)的第一置信度的數(shù)值就比較高了。

進(jìn)一步地,當(dāng)目標(biāo)檢測(cè)區(qū)域的位置可以為終端的顯示屏幕的中心為其中心時(shí),本發(fā)明實(shí)施例中目標(biāo)圖像的正常人臉圖像的大小可以為終端的顯示屏幕的大小,這樣的話,終端采集到的目標(biāo)圖像為非人臉圖像或者采集到的人臉圖像在顯示屏幕上占據(jù)的位置比較偏上、偏下、偏左或偏右時(shí),都可能導(dǎo)致目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像扣取的人臉無關(guān)或人臉部位的不完整或扣取不到,從而導(dǎo)致終端通過預(yù)設(shè)的第一模型集合得到的第一置信度的數(shù)據(jù)較低。

可選的,本發(fā)明實(shí)施例中的第一置信度的值為0-1之間的數(shù)值。1表征準(zhǔn)確度最高,0表征準(zhǔn)確度最低。

示例性的,如圖5所示,圖5a中為終端采集到的比較正常的人臉圖像(目標(biāo)圖像),圖5b中為終端采集到的非人臉圖像(目標(biāo)圖像),而圖5c中為終端采集到的尺寸較小的人臉圖像(目標(biāo)圖像),終端的目標(biāo)檢測(cè)區(qū)域?yàn)榫匦慰?,第一目標(biāo)圖像為矩形框1框起來的圖像,由圖5可知,終端在圖5a中扣取的第一目標(biāo)圖像為人臉圖像且人臉部位較為完整,而圖5b的第一目標(biāo)圖像扣取的沒有人臉部位,圖5c扣取的第一目標(biāo)圖像的人臉部位不完整,因此,終端將第一目標(biāo)圖像輸入到預(yù)設(shè)的第一模型集合,輸出的第一置信度的結(jié)果可以為:圖5a型的圖像輸出的第一置信度可以為:0.99,圖5b型的圖像輸出的第一置信度可以為:0,圖5c型的圖像輸出的第一置信度可以為:0.45。而終端將第一目標(biāo)圖像輸入到預(yù)設(shè)的第一模型集合,輸出的第一人臉關(guān)鍵點(diǎn)的位置(定位的結(jié)果),其中,圖5a對(duì)應(yīng)的第一人臉關(guān)鍵點(diǎn)的位置,具體的為人臉部位定位的人臉五官(眼睛、鼻子、嘴巴、眉毛等)的坐標(biāo)點(diǎn)的輸出,體現(xiàn)在人臉部位上的效果可以為圖6所示,而圖5b由于第一目標(biāo)圖像為非人臉圖像,因此,終端定位不出人臉五官關(guān)鍵點(diǎn)的坐標(biāo),也就是說通過預(yù)設(shè)的第一模型集合的輸出可以為無結(jié)果或者第一特征的結(jié)果表征沒有關(guān)鍵點(diǎn)定位的坐標(biāo)的結(jié)果,而圖5c經(jīng)過預(yù)設(shè)的第一模型集合的輸出結(jié)果可能為部分五官關(guān)鍵點(diǎn)的定位的坐標(biāo)點(diǎn)的輸出,體現(xiàn)在人臉部位上的效果可以為圖7所示。

需要說明的是,本發(fā)明實(shí)施例中的預(yù)設(shè)的第一模型集合是通過訓(xùn)練數(shù)據(jù)訓(xùn)練出來的,詳細(xì)的訓(xùn)練過程將在后續(xù)的實(shí)施例中進(jìn)行說明。

具體的,本發(fā)明實(shí)施例中的預(yù)設(shè)的第一模型集合可以由多任務(wù)型的CNN網(wǎng)絡(luò)框架訓(xùn)練而得到,多任務(wù)是指人臉關(guān)鍵點(diǎn)定位任務(wù)和置信度任務(wù)。

需要說明的是,預(yù)設(shè)的第一模型集合包括:公共分支、關(guān)鍵點(diǎn)定位分支和置信度分支,該關(guān)鍵點(diǎn)定位分支和置信度分支分別與公共分支級(jí)聯(lián),該公共分支的輸入為第一模型集合的輸入分支,關(guān)鍵點(diǎn)定位分支和置信度分支為第一模型集合的兩個(gè)輸出分支,該公共分支為預(yù)設(shè)的第一模型集合建立過程中的圖像特征的數(shù)據(jù)模型。

具體的,終端將第一目標(biāo)圖像輸入公共分支的模型,提取出第一圖像特征,及將第一圖像特征輸入關(guān)鍵點(diǎn)定位分支的模型,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置,以及將第一圖像特征輸入關(guān)置信度分支的模型,計(jì)算出第一置信度。

S103、當(dāng)?shù)谝恢眯哦却笥诘扔陬A(yù)設(shè)閾值時(shí),獲取目標(biāo)檢測(cè)區(qū)域中的第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像。

終端在獲取或得到第一目標(biāo)圖像的第一置信度之后,由于該第一置信度可以表征第一目標(biāo)圖像或者說是目標(biāo)圖像的具體類型,例如是正常的人臉圖像還是非人臉圖像等,因此,當(dāng)終端通過第一置信度判斷出基本上為正常人臉圖像的概率很小的情況時(shí),基本上可以認(rèn)為能定位出人臉關(guān)鍵點(diǎn)的可能性很小,于是,終端可以就直接停止或結(jié)束此次的人臉關(guān)鍵點(diǎn)的定位,以節(jié)約計(jì)算成本和工作量,并提高了工作效率。而當(dāng)?shù)谝恢眯哦鹊臄?shù)值較大時(shí),可以認(rèn)為人臉關(guān)鍵點(diǎn)的定位是可以定位出人臉部位的,因此,終端可以對(duì)得到的第一人臉關(guān)鍵點(diǎn)的位置描述出的人臉五官的圖形,即第二目標(biāo)圖像。

需要說明的是,本發(fā)明實(shí)施例中的根據(jù)第一置信度的數(shù)值進(jìn)行確定是否能獲取第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像可以由預(yù)設(shè)閾值與第一置信度的對(duì)比結(jié)果來決定,當(dāng)?shù)谝恢眯哦鹊臄?shù)值大于等于上述預(yù)設(shè)閾值時(shí),終端就可以獲取目標(biāo)檢測(cè)區(qū)域中的第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像。

可選的,本發(fā)明實(shí)施例中的預(yù)設(shè)閾值可以為0.5。預(yù)設(shè)閾值的設(shè)定可以是經(jīng)過試驗(yàn)或數(shù)據(jù)訓(xùn)練得到的合理的數(shù)值,也可以為用戶自行設(shè)置的合理的一個(gè)數(shù)值,本發(fā)明實(shí)施例不限制該預(yù)設(shè)閾值的取值及取值方式。

進(jìn)一步地,終端輸出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度之后,當(dāng)?shù)谝恢眯哦刃∮陬A(yù)設(shè)閾值時(shí),該終端確定該第一人臉關(guān)鍵點(diǎn)的位置定位失敗,結(jié)束此次人臉關(guān)鍵點(diǎn)的定位。

示例性的,假設(shè)預(yù)設(shè)閾值為0.5,終端將第一目標(biāo)圖像輸入到預(yù)設(shè)的第一模型集合,輸出的第一置信度的結(jié)果可以為:圖5a型的圖像輸出的第一置信度可以為:0.99,圖5b型的圖像輸出的第一置信度可以為:0,圖5c型的圖像輸出的第一置信度可以為:0.45,由于0.99大于0.5,因此,如圖8所示,終端可以獲取到圖5a的目標(biāo)檢測(cè)區(qū)域中的第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像。而0小于0.5,0.45小于0.5,因此,終端確定對(duì)圖5b和圖5c的第一人臉關(guān)鍵點(diǎn)的位置定位失敗,結(jié)束此次人臉關(guān)鍵點(diǎn)的定位。

可以理解的是,由于在進(jìn)行關(guān)鍵點(diǎn)定位的過程中,終端可以根據(jù)第一置信度對(duì)目標(biāo)圖像進(jìn)行初次篩選,能夠篩選掉一些非人臉圖像或人臉圖像,這樣,終端就只對(duì)篩選后剩下的目標(biāo)圖像進(jìn)行進(jìn)一步的人臉關(guān)鍵點(diǎn)定位了,從而減少了人臉關(guān)鍵點(diǎn)定位的工作量和占用的空間,進(jìn)而提高了人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度。

S104、將第二目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度,并根據(jù)該第二置信度判定第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度。

終端在獲取到第二目標(biāo)圖像的情況下,該終端可以對(duì)第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度進(jìn)行判斷,于是,該終端可以將該第二目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,輸出第二置信度,以根據(jù)該第二置信度的數(shù)值的大小來判定第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度。

具體的,終端將第二目標(biāo)圖像輸入公共分支的模型,提取出第二圖像特征,以及將第二圖像特征輸入關(guān)置信度分支的模型,計(jì)算出第二置信度。

可以理解的是,第二置信度的數(shù)值越大,表征第一人臉關(guān)鍵點(diǎn)的位置定位的越準(zhǔn)確。

可選的,本發(fā)明實(shí)施例中的第二置信度的值為0-1之間的數(shù)值。1表征準(zhǔn)確度最高,0表征準(zhǔn)確度最低。

S105、當(dāng)?shù)诙眯哦却笥诘扔陬A(yù)設(shè)準(zhǔn)確度時(shí),確定第一人臉關(guān)鍵點(diǎn)的位置為目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

終端輸出第二置信度之后,由于該第二置信度可以表征第二目標(biāo)圖像或者說是對(duì)目標(biāo)圖像的進(jìn)行第一人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度的,當(dāng)終端根據(jù)第二置信度的數(shù)據(jù)判斷出第一人臉關(guān)鍵點(diǎn)的位置較為準(zhǔn)確時(shí),該終端將該第一人臉關(guān)鍵點(diǎn)的位置確定為目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

需要說明的是,本發(fā)明實(shí)施例中的根據(jù)第二置信度的數(shù)值進(jìn)行確定是否能將第一人臉關(guān)鍵點(diǎn)的位置作為最終的關(guān)鍵點(diǎn)定位結(jié)果是,可以由預(yù)設(shè)準(zhǔn)確度與第二置信度的對(duì)比結(jié)果來決定,當(dāng)?shù)诙眯哦鹊臄?shù)值大于等于上述預(yù)設(shè)準(zhǔn)確度時(shí),終端就可以將確定第一人臉關(guān)鍵點(diǎn)的位置為目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

可選的,本發(fā)明實(shí)施例中的預(yù)設(shè)準(zhǔn)確度可以為0.9。預(yù)設(shè)準(zhǔn)確度的設(shè)定可以為用戶根據(jù)自己所需的準(zhǔn)確度自行設(shè)置的合理的一個(gè)數(shù)值,也可以為終端根據(jù)所應(yīng)用的不同場(chǎng)景或需求自動(dòng)調(diào)整的一個(gè)數(shù)值,本發(fā)明實(shí)施例不限制該預(yù)設(shè)準(zhǔn)確度的取值及取值方式。

進(jìn)一步地,終端輸出第二置信度之后,當(dāng)?shù)诙眯哦刃∮陬A(yù)設(shè)準(zhǔn)確度時(shí),表征終端確定該第一人臉關(guān)鍵點(diǎn)的位置定位失敗或誤差較大,因此,終端需要重新對(duì)目標(biāo)圖像進(jìn)行調(diào)整或者進(jìn)行目標(biāo)圖像的重新采集和關(guān)鍵點(diǎn)定位,并提示用戶重新拍照的信息,可以通過顯示屏幕顯示給用戶知曉。

具體的,終端可以通過調(diào)整目標(biāo)檢測(cè)區(qū)域的大小(目標(biāo)檢測(cè)區(qū)域的邊長(zhǎng))來重新進(jìn)行人臉關(guān)鍵點(diǎn)的定位,該終端還可以通過顯示請(qǐng)重新拍照等信息給用戶,以重新進(jìn)行目標(biāo)圖像的采集,從而對(duì)該重新采集的目標(biāo)圖像進(jìn)行人臉關(guān)鍵點(diǎn)的重新定位。

可以理解的是,由于終端可以通過第二置信度重新對(duì)目標(biāo)圖像進(jìn)行調(diào)整或者進(jìn)行目標(biāo)圖像的重新采集和關(guān)鍵點(diǎn)定位,因此,采用本發(fā)明實(shí)施例的關(guān)鍵點(diǎn)定位方法最終得到的人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度可以很高。

需要說明的是,由于本發(fā)明實(shí)施例的人臉關(guān)鍵點(diǎn)的定位的方法是應(yīng)用在人臉識(shí)別技術(shù)的各類應(yīng)用中的,因此,在終端對(duì)目標(biāo)圖像的人臉關(guān)鍵點(diǎn)的位置確定的情況下,就可以進(jìn)行相應(yīng)的應(yīng)用了,例如,采用圖像處理軟件,識(shí)別出人臉五官的位置后,為目標(biāo)圖像的人臉五官進(jìn)行裝扮,生成個(gè)性化圖像,以滿足用戶的需求。

在本發(fā)明實(shí)施例中,由于預(yù)設(shè)的第一模型集合中融合了對(duì)置信度的計(jì)算,因此,終端在采用預(yù)設(shè)的第一模型集合進(jìn)行人臉關(guān)鍵點(diǎn)定位的時(shí)候可以通過計(jì)算出的置信度來確定該人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度,在減少了后續(xù)重新再進(jìn)行準(zhǔn)確度評(píng)判的時(shí)間和占用的空間的情況下,實(shí)現(xiàn)了判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度,從而提高了人臉關(guān)鍵點(diǎn)的跟蹤的處理速度。

實(shí)施例二

本發(fā)明實(shí)施例提供了一種關(guān)鍵點(diǎn)的定位方法,基于實(shí)施例一的關(guān)鍵點(diǎn)的定位方法,在進(jìn)行實(shí)際的人臉關(guān)鍵點(diǎn)的定位之前,首先終端需要進(jìn)行預(yù)設(shè)的第一模型集合的設(shè)置過程,即預(yù)設(shè)的第一模型集合的訓(xùn)練過程,該預(yù)設(shè)的第一模型集合包括:公共分支、關(guān)鍵點(diǎn)定位分支和置信度分支,該關(guān)鍵點(diǎn)定位分支和置信度分支分別與公共分支級(jí)聯(lián),該公共分支的輸入為第一模型集合的輸入分支,關(guān)鍵點(diǎn)定位分支和置信度分支為第一模型集合的兩個(gè)輸出分支,該公共分支為預(yù)設(shè)的第一模型集合建立過程中的圖像特征的數(shù)據(jù)模型,因此,基于實(shí)施例一的技術(shù)方案的基礎(chǔ)上,終端進(jìn)行預(yù)設(shè)的第一模型集合的訓(xùn)練過程如圖9所示,包括:

S201、獲取人臉關(guān)鍵點(diǎn)定位的第一訓(xùn)練數(shù)據(jù),該第一訓(xùn)練數(shù)據(jù)包括人臉圖像與預(yù)標(biāo)定關(guān)鍵點(diǎn)坐標(biāo)的對(duì)應(yīng)關(guān)系。

S202、根據(jù)第一訓(xùn)練數(shù)據(jù),進(jìn)行公共分支和關(guān)鍵點(diǎn)定位分支的模型參數(shù)的訓(xùn)練,訓(xùn)練出公共分支的模型和關(guān)鍵點(diǎn)定位分支的模型。

S203、獲取置信度的第二訓(xùn)練數(shù)據(jù),該第二訓(xùn)練數(shù)據(jù)為目標(biāo)圖像的分類集合。

S204、根據(jù)第二訓(xùn)練數(shù)據(jù),進(jìn)行置信度分支的模型參數(shù)的訓(xùn)練,訓(xùn)練出置信度分支的模型。

S205、將訓(xùn)練好的關(guān)鍵點(diǎn)定位分支、置信度分支分別與公共分支進(jìn)行級(jí)聯(lián),成為預(yù)設(shè)的第一模型的集合。

需要說明的是,本發(fā)明實(shí)施例中,對(duì)于關(guān)鍵點(diǎn)定位分支、置信度分支分別與公共分支的模型,首先要先建立各自模型的連接,然后通過數(shù)據(jù)訓(xùn)練過程找到各自連接關(guān)系處的模型參數(shù)。

可選的,本發(fā)明實(shí)施例可以選擇CNN網(wǎng)絡(luò)進(jìn)行預(yù)設(shè)的第一模型集合的搭建,因此,上述參數(shù)可以為關(guān)鍵點(diǎn)定位分支、置信度分支分別與公共分支的模型各自連接處的權(quán)重值。

具體的,終端對(duì)于關(guān)鍵點(diǎn)定位分支和公共分支的模型訓(xùn)練是一起進(jìn)行的,該終端獲取人臉圖像與預(yù)標(biāo)定關(guān)鍵點(diǎn)坐標(biāo)的對(duì)應(yīng)關(guān)系,其中與標(biāo)定關(guān)鍵點(diǎn)坐標(biāo)為人工對(duì)人臉圖像進(jìn)行關(guān)鍵點(diǎn)標(biāo)定出的坐標(biāo),在本發(fā)明實(shí)施例中終端通過采集多個(gè)樣本(多個(gè)人臉圖像與預(yù)標(biāo)定關(guān)鍵點(diǎn)坐標(biāo))進(jìn)行關(guān)鍵點(diǎn)定位分支和置信度分支的模型訓(xùn)練。并且,終端還通過采集人臉圖像的分類集合的第二訓(xùn)練數(shù)據(jù)進(jìn)行置信度分支的模型參數(shù)的訓(xùn)練,最終將訓(xùn)練好的關(guān)鍵點(diǎn)定位分支、置信度分支分別與公共分支進(jìn)行級(jí)聯(lián),成為預(yù)設(shè)的第一模型的集合,該終端采集到的目標(biāo)圖像的分類集合可以包括目標(biāo)圖像和其對(duì)應(yīng)的人臉圖像的標(biāo)簽,其中,人臉圖像的標(biāo)簽可以為人臉類別的標(biāo)簽,例如,正常大小的人臉圖像的人臉標(biāo)簽為1,非人臉圖像或過大過小的人臉圖像為0,具體的人臉標(biāo)簽的設(shè)置本發(fā)明實(shí)施例不作限制。

需要說明的是,終端在進(jìn)行公共分支和關(guān)鍵點(diǎn)定位分支的模型訓(xùn)練時(shí),該終端建立的置信度分支的模型參數(shù)是保持不變的,而終端在進(jìn)行置信度分支的模型的訓(xùn)練時(shí),上述公共分支和關(guān)鍵點(diǎn)定位分支的模型參數(shù)是保持不變的。

需要說明的是,本發(fā)明實(shí)施例中的模型訓(xùn)練的過程都可以是通過機(jī)器學(xué)習(xí)來實(shí)現(xiàn)的輸入與輸出的簡(jiǎn)單映射關(guān)系。

基于上面實(shí)施例中的描述,本發(fā)明實(shí)施例一置信度分支模型的模型訓(xùn)練為例,對(duì)一種基于引入機(jī)器學(xué)習(xí)技術(shù)的置信度分支的模型。在形成置信度分支的模型的初期,仍然需要人工挑選盡可能多維度的特征供機(jī)器學(xué)習(xí)模型訓(xùn)練,根據(jù)特征對(duì)訓(xùn)練結(jié)果的區(qū)分度決定選用哪些特征擦描述,這里基本不存在人工干預(yù)選擇參數(shù)的問題,機(jī)器學(xué)習(xí)可以自己學(xué)習(xí)出合適的參數(shù)來;由于特征含義相比沒有意義的參數(shù)看來更為直觀,結(jié)合特征的分布,解釋起來也比較容易理解;首先基于機(jī)器學(xué)習(xí)模型的人臉圖像,人臉關(guān)鍵點(diǎn)定位涉及到置信度相關(guān)的綜合考慮,提高了上述人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確性。另外由于模型自身具有進(jìn)化學(xué)習(xí)的功能。即使輸入值發(fā)生更新或刪減,通過簡(jiǎn)單的重新進(jìn)行模型訓(xùn)練(有時(shí)候需要對(duì)特征進(jìn)行微調(diào)),即可以識(shí)別新的輸入的確定并進(jìn)行置信度分支的模型的調(diào)整,使置信度結(jié)果保持準(zhǔn)確性。

機(jī)器學(xué)習(xí)技術(shù)在置信度中的應(yīng)用可以自由的分享和傳播,因?yàn)闄C(jī)器學(xué)習(xí)置信度全面且可以自我進(jìn)化,不針對(duì)特定某種圖像,因此,甚至對(duì)同一終端的不同圖像一樣可以公開基于機(jī)器學(xué)習(xí)模型的置信度做法?;谇笆龅膶?shí)施例,本發(fā)明實(shí)施例提供一種訓(xùn)練置信度分支的模型的方法,如圖10所示,該方法包括:

S301、按照預(yù)設(shè)的配置比例獲取正樣本和負(fù)樣本,該正樣本和負(fù)樣本為已采集的目標(biāo)圖像和對(duì)應(yīng)的人臉圖像的標(biāo)簽。

這里,在實(shí)際操作的過程中,目標(biāo)圖像的標(biāo)簽為人臉圖像和非人臉圖像為會(huì)存在一定的比例,這個(gè)比例即為配置比例,在形成置信度分支的模型時(shí),終端對(duì)訓(xùn)練數(shù)據(jù)的配置(已采集到的目標(biāo)圖像和對(duì)應(yīng)的人臉圖像的標(biāo)簽)也需要按照該配置比例進(jìn)行設(shè)置。

S302、提取正樣本的特征和負(fù)樣本的特征。

需要說明的是,本發(fā)明實(shí)施例中的服務(wù)器對(duì)正樣本和負(fù)樣本的體征提取和第一實(shí)體的第一特征的構(gòu)造原理相同。

可以理解的是,本發(fā)明實(shí)施例中的正樣本和負(fù)樣本涉及的允許范圍越完整,后續(xù)的置信度是越準(zhǔn)確的。

S303、將正樣本或負(fù)樣本的特征輸入至設(shè)置的第一置信度分支模型,得到第一訓(xùn)練結(jié)果。

S304、持續(xù)檢測(cè)第一置信度分支模型,直至第一訓(xùn)練結(jié)果滿足預(yù)設(shè)條件。

S305、將第一訓(xùn)練結(jié)果滿足預(yù)設(shè)條件的第一置信度分支模型確定為最終的置信度分支的模型。

本發(fā)明實(shí)施例中,不管采用何種訓(xùn)練模型,在開始訓(xùn)練之時(shí),該訓(xùn)練模型的輸入包括上述不同維度的特征,經(jīng)過多次試驗(yàn)如果該特征不對(duì)訓(xùn)練結(jié)果產(chǎn)生有利影響或者分錯(cuò)的時(shí)候,就降低該特征的權(quán)重,如果該特征對(duì)訓(xùn)練結(jié)果產(chǎn)生有利影響時(shí)候,就提高該特征的權(quán)重,如果一個(gè)參數(shù)的權(quán)重降低為0,那么在訓(xùn)練模型中該特征將不起任何作用了。經(jīng)過本發(fā)明實(shí)施例的最終試驗(yàn),上述不同的維度的特征最終對(duì)訓(xùn)練結(jié)果能夠產(chǎn)生積極影響的是長(zhǎng)期特征(即第一特征,人臉特征)。下面假設(shè)不同維度的特征只包括第一特征(即已經(jīng)將其他的不符的特征都剔除掉了),那么上述的置信度分支的模型的形成過程大致包括:將正樣本或負(fù)樣本的第一特征輸入第一置信度分支模型,從第一置信度分支模型獲得第一訓(xùn)練結(jié)果;其中進(jìn)行構(gòu)造的第一置信度分支模型以第一特征,且每一個(gè)特征具有對(duì)應(yīng)的權(quán)值(預(yù)設(shè)優(yōu)先權(quán));持續(xù)監(jiān)測(cè)第一訓(xùn)練結(jié)果直至滿足預(yù)設(shè)條件時(shí),則將第一模型作為最終的置信度分支的模型。

可選的,本發(fā)明實(shí)施例中的預(yù)設(shè)條件可以為置信度的準(zhǔn)確率達(dá)到預(yù)設(shè)閾值,該預(yù)設(shè)閾值可以為90%,具體的預(yù)設(shè)閾值的確定可設(shè)置,本發(fā)明實(shí)施例不作限制,但是,預(yù)設(shè)閾值設(shè)置的越高,達(dá)到該預(yù)設(shè)閾值或預(yù)設(shè)條件的置信度分支的模型就越精確。

從以上流程可以看出,1)本發(fā)明實(shí)施例引入了各種不同種類目標(biāo)圖像的與人臉圖像的標(biāo)簽來對(duì)訓(xùn)練模型進(jìn)行訓(xùn)練,根據(jù)訓(xùn)練結(jié)果確定最終核實(shí)的置信度,如此提升了置信度的準(zhǔn)確性。2)本發(fā)明實(shí)施例采用的置信度分支的模型的一個(gè)顯著特點(diǎn)是模型可以自我進(jìn)化,根據(jù)置信度評(píng)價(jià)行為的變換自動(dòng)進(jìn)行特征權(quán)值的調(diào)整,避免基于規(guī)則的人工頻繁介入調(diào)整參數(shù)。

具體的,終端通過預(yù)設(shè)的第一模型集合輸出關(guān)鍵點(diǎn)定位分支的模型和置信度分支的模型之前(模型訓(xùn)練中),該終端還可以將關(guān)鍵點(diǎn)定位分支的模型和置信度分支的模型分別根據(jù)預(yù)設(shè)策略進(jìn)行誤差修正(即模型的訓(xùn)練),確定出修正后的關(guān)鍵點(diǎn)定位分支的模型和置信度分支的模型,以進(jìn)行人臉關(guān)鍵點(diǎn)定位和置信度的確定。

示例性的,在進(jìn)行關(guān)鍵點(diǎn)定位分支的模型的修正時(shí)可以采用歐式損失函數(shù)(EuclideanLoss)來實(shí)現(xiàn);在進(jìn)行置信度分支的模型的修正時(shí)可以采用損失函數(shù)(Softmaxloss)實(shí)現(xiàn)。

示例性的,如圖11所示為預(yù)設(shè)的第一模型集合的構(gòu)造結(jié)構(gòu),采用該預(yù)設(shè)的第一模型集合進(jìn)行實(shí)施例一的關(guān)鍵點(diǎn)的定位方法時(shí),如圖11所示,終端采集將采集到的目標(biāo)圖像1中的目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的圖像輸入到預(yù)設(shè)的第一模型集合中后,最終輸出了對(duì)于目標(biāo)圖像1進(jìn)行人臉關(guān)鍵點(diǎn)后的位置,定位效果為圖11最右側(cè)的圖像的關(guān)鍵點(diǎn)定位結(jié)果,且這次人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度(第二置信度)為0.999。

可以理解的是,在本發(fā)明實(shí)施例中,相比于現(xiàn)有技術(shù)的準(zhǔn)確度的獨(dú)立處理,由于終端在采用預(yù)設(shè)的第一模型集合進(jìn)行人臉關(guān)鍵點(diǎn)定位的時(shí)候可以同時(shí)確定該人臉關(guān)鍵點(diǎn)定位的準(zhǔn)確度,在減少了后續(xù)重新再進(jìn)行準(zhǔn)確度評(píng)判的時(shí)間和占用的空間的情況下可以判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度,從而提高人臉關(guān)鍵點(diǎn)的跟蹤的處理速度。

實(shí)施例三

如圖12所示,本發(fā)明實(shí)施例提供了一種終端1,該終端1可以包括:

生成單元10,用于采集單元11采集目標(biāo)圖像時(shí),按照預(yù)設(shè)配置在所述目標(biāo)圖像上生成用于人臉識(shí)別定位的目標(biāo)檢測(cè)區(qū)域。

輸出單元12,用于將所述目標(biāo)檢測(cè)區(qū)域?qū)?yīng)的第一目標(biāo)圖像輸入預(yù)設(shè)的第一模型集合,計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度。

獲取單元13,用于當(dāng)所述第一置信度大于等于預(yù)設(shè)閾值時(shí),獲取所述目標(biāo)檢測(cè)區(qū)域中的所述第一人臉關(guān)鍵點(diǎn)的位置對(duì)應(yīng)的第二目標(biāo)圖像。

所述輸出單元12,還用于將所述第二目標(biāo)圖像輸入所述預(yù)設(shè)的第一模型集合,計(jì)算出第二置信度。

判斷單元14,用于根據(jù)所述第二置信度判定所述第一人臉關(guān)鍵點(diǎn)的位置的準(zhǔn)確度。

確定單元15,用于當(dāng)所述第二置信度大于等于預(yù)設(shè)準(zhǔn)確度時(shí),確定所述第一人臉關(guān)鍵點(diǎn)的位置為所述目標(biāo)圖像的最終人臉關(guān)鍵點(diǎn)的位置。

可選的,所述預(yù)設(shè)的第一模型集合包括:公共分支、關(guān)鍵點(diǎn)定位分支和置信度分支,所述關(guān)鍵點(diǎn)定位分支和置信度分支分別與所述公共分支級(jí)聯(lián),所述公共分支的輸入為所述第一模型集合的輸入分支,所述關(guān)鍵點(diǎn)定位分支和所述置信度分支為所述第一模型集合的兩個(gè)輸出分支,所述公共分支為所述預(yù)設(shè)的第一模型集合建立過程中的圖像特征的數(shù)據(jù)模型。

可選的,基于圖12,如圖13所示,所述終端1還包括:連接單元16。

所述獲取單元13,還用于獲取人臉關(guān)鍵點(diǎn)定位的第一訓(xùn)練數(shù)據(jù),所述第一訓(xùn)練數(shù)據(jù)包括人臉圖像與預(yù)標(biāo)定關(guān)鍵點(diǎn)坐標(biāo)的對(duì)應(yīng)關(guān)系。

所述輸出單元12,還用于根據(jù)所述第一訓(xùn)練數(shù)據(jù),進(jìn)行所述公共分支和所述關(guān)鍵點(diǎn)定位分支的模型參數(shù)的訓(xùn)練,訓(xùn)練出所述公共分支的模型和所述關(guān)鍵點(diǎn)定位分支的模型。

所述獲取單元13,還用于獲取置信度的第二訓(xùn)練數(shù)據(jù),所述第二訓(xùn)練數(shù)據(jù)為目標(biāo)圖像的分類集合。

所述輸出單元12,還用于根據(jù)所述第二訓(xùn)練數(shù)據(jù),進(jìn)行所述置信度分支的模型參數(shù)的訓(xùn)練,訓(xùn)練出所述置信度分支的模型。

所述連接單元16,用于將訓(xùn)練好的所述關(guān)鍵點(diǎn)定位分支的模型、所述置信度分支的模型分別與所述公共分支的模型進(jìn)行級(jí)聯(lián),成為所述預(yù)設(shè)的第一模型的集合。

可選的,所述輸出單元12,具體用于將所述第一目標(biāo)圖像輸入所述公共分支的模型,提取出第一圖像特征;將所述第一圖像特征輸入所述關(guān)鍵點(diǎn)定位分支的模型,計(jì)算出所述第一人臉關(guān)鍵點(diǎn)的位置;將所述第一圖像特征輸入所述關(guān)置信度分支的模型,計(jì)算出所述第一置信度。

可選的,所述輸出單元12,具體用于將所述第二目標(biāo)圖像輸入所述公共分支的模型,提取出第二圖像特征;將所述第二圖像特征輸入所述關(guān)置信度分支的模型,計(jì)算出所述第二置信度。

可選的,基于圖13,如圖14所示,所述終端1還包括:修正單元17。

所述修正單元17,用于所述訓(xùn)練出所述關(guān)鍵點(diǎn)定位分支的模型和所述置信度分支的模型之前,將所述關(guān)鍵點(diǎn)定位分支的模型和所述置信度分支的模型分別根據(jù)預(yù)設(shè)策略進(jìn)行誤差修正,確定出修正后的所述關(guān)鍵點(diǎn)定位分支的模型和所述置信度分支的模型,以進(jìn)行人臉關(guān)鍵點(diǎn)定位和置信度的確定。

可選的,所述確定單元15,還用于所述計(jì)算出第一人臉關(guān)鍵點(diǎn)的位置和第一置信度之后,當(dāng)所述第一置信度小于預(yù)設(shè)閾值時(shí),確定所述第一人臉關(guān)鍵點(diǎn)的位置定位失敗,結(jié)束此次人臉關(guān)鍵點(diǎn)的定位。

如圖15所示,在實(shí)際應(yīng)用中,上述生成單元10、獲取單元13、確定單元15、判斷單元14、連接單元16、修正單元17、輸出單元12可由位于終端1上的處理器18實(shí)現(xiàn),具體為中央處理器(CPU)、微處理器(MPU)、數(shù)字信號(hào)處理器(DSP)或現(xiàn)場(chǎng)可編程門陣列(FPGA)等實(shí)現(xiàn),采集單元11由攝像頭19實(shí)現(xiàn),該終端1還可以包括存儲(chǔ)介質(zhì)110,該存儲(chǔ)介質(zhì)110可以通過系統(tǒng)總線111與處理器18連接,其中,存儲(chǔ)介質(zhì)110用于存儲(chǔ)可執(zhí)行程序代碼,該程序代碼包括計(jì)算機(jī)操作指令,存儲(chǔ)介質(zhì)110可能包含高速RAM存儲(chǔ)器,也可能還包括非易失性存儲(chǔ)器,例如,至少一個(gè)磁盤存儲(chǔ)器。

需要說明的是,圖1中的終端與終端1為相同的終端。

可以理解的是,在本發(fā)明實(shí)施例中,由于預(yù)設(shè)的第一模型集合進(jìn)行人臉關(guān)鍵點(diǎn)定位的時(shí)候可以同時(shí)確定該人臉關(guān)鍵點(diǎn)定位的置信度,減少了重新再進(jìn)行準(zhǔn)確度評(píng)判的時(shí)間,可以判定人臉關(guān)鍵點(diǎn)的跟蹤的準(zhǔn)確度和處理速度。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用硬件實(shí)施例、軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。

這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。

這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。

以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
子长县| 宁明县| 商都县| 都匀市| 竹溪县| 上饶市| 牟定县| 兴隆县| 宿迁市| 垫江县| 肥城市| 新宾| 仪征市| 南平市| 崇文区| 玉龙| 北流市| 额尔古纳市| 乡宁县| 合水县| 高密市| 天峻县| 祥云县| 安康市| 嵊泗县| 灵璧县| 林西县| 夏邑县| 泽普县| 房产| 朝阳区| 昭平县| 阳谷县| 灵川县| 栖霞市| 海兴县| 赣榆县| 铜川市| 延吉市| 三台县| 西盟|