本發(fā)明涉及圖像處理技術領域,尤其是一種人臉圖像處理方法及裝置。
背景技術:
圖像、視頻數(shù)據(jù)作為信息的主要載體,由于其視覺上的直觀性和表達的生動性,越來越受到人們的關注。目前,用戶不僅僅滿足于獲取更加高品質的圖像視頻(由于視頻可以看作是多幀圖像的組合,以下討論中以圖像代替圖像和視頻),也對圖像的趣味性、美觀性等提出了更高的要求。
以往,要對圖像進行修飾、處理,都需要專業(yè)技術人員來操作完成,普通用戶很難根據(jù)自己喜好去調整圖像內容。而現(xiàn)在,通過設置好的圖像處理算法對圖像內容進行修飾已經(jīng)成為一種常見的手段,由于算法自動完成,不用進行過多用戶交互,因此不需要用戶掌握圖像處理技巧、簡單方便,因而越來越受大眾歡迎。諸如現(xiàn)在流行的人像美顏、膚色調整等方法;除此之外,通過在人臉上加入額外內容(例如頭盔、面具)來更改圖像內容,也會使圖像更加生動有趣,達到娛樂效果。
技術實現(xiàn)要素:
為此,本發(fā)明提供了一種人臉圖像處理方法及裝置,以力圖解決或者至少緩解上面存在的至少一個問題。
根據(jù)本發(fā)明的一個方面,提供了一種人臉圖像處理方法,包括步驟:對當前圖像幀做人臉檢測,生成人臉基準區(qū)域;對人臉基準區(qū)域進行關鍵點檢測,識別出人臉關鍵點;根據(jù)人臉關鍵點從人臉基準區(qū)域中劃分出該圖像幀中初始人臉皮膚區(qū)域;結合人臉基準區(qū)域及先驗知識計算出該圖像幀中的初始頭發(fā)區(qū)域;利用混合高斯模型對初始皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點特征向量進行概率分布估計;根據(jù)概率分布估計的結果對該圖像幀進行圖像分割,得到該圖像幀的人頭區(qū)域;以及利用插值算法放大人頭區(qū)域,得到處理后的圖像幀。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,根據(jù)人臉關鍵點從人臉基準區(qū)域中劃分出圖像幀中的初始人臉皮膚區(qū)域的步驟包括:將人臉基準區(qū)域中除了預定區(qū)域之外的區(qū)域劃分為人臉的皮膚區(qū)域,其中,預定區(qū)域由預定關鍵點確定,預定關鍵點包括眼睛、眉毛、嘴巴。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,結合人臉基準區(qū)域及先驗知識計算出該圖像幀中的初始頭發(fā)區(qū)域的步驟包括:將位于人臉基準區(qū)域上方預定比例、且為連通區(qū)域的區(qū)域初步判定為初始頭發(fā)區(qū)域。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,混合高斯模型定義為:
其中,
為第k個高斯模型的概率密度函數(shù),且K為高斯模型的個數(shù),πk為第k個模型的權重,x為某個像素的特征向量,N為特征向量的維度,μk為均值向量,Ck為N*N的協(xié)方差矩陣。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,利用混合高斯模型對初始人臉皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點特征向量進行概率分布估計的步驟還包括:計算混合高斯模型的參數(shù),其中參數(shù)包括每個模型的權重πk、均值向量μk、協(xié)方差矩陣Ck。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,根據(jù)概率分布估計結果對該圖像幀進行圖像分割的步驟還包括:通過分割算法、利用概率分布估計結果和像素點間顏色的相似性,分割出圖像中的人頭區(qū)域。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,在分割得到人頭區(qū)域后,還包括步驟:提取所分割得到的人頭區(qū)域的邊緣;以及對邊緣進行平滑處理。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,利用插值算法放大人頭區(qū)域的步驟包括:以特定的關鍵點為基準點,對該人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域,并將放大后的人頭區(qū)域的基準點和原來的基準點對齊。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,特定的關鍵點包括鼻尖點、嘴中心點。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,還包括步驟:以當前圖像幀的混合高斯模型的參數(shù)為初始值,利用EM算法估計下一圖像幀中混合高斯模型中的參數(shù)。
可選地,在根據(jù)本發(fā)明的人臉圖像處理方法中,還包括步驟:若檢測到當前圖像幀中有多個人臉基準區(qū)域,則分割出多個人頭區(qū)域;以及利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系。
根據(jù)本發(fā)明的另一個方面,提供了一種人臉圖像處理裝置,包括:檢測單元,適于對當前圖像幀做人臉檢測,生成人臉基準區(qū)域;識別單元,適于對人臉基準區(qū)域進行關鍵點檢測,識別出人臉關鍵點;區(qū)域分割單元,適于根據(jù)人臉關鍵點從人臉基準區(qū)域中劃分出該圖像幀中的初始人臉皮膚區(qū)域、且結合人臉基準區(qū)域及先驗知識計算出該圖像幀中的初始頭發(fā)區(qū)域;計算單元,適于利用混合高斯模型對初始人臉皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點特征向量進行概率分布估計;區(qū)域分割單元還適于根據(jù)概率分布估計的結果對該圖像幀進行圖像分割,得到該圖像幀的人頭區(qū)域;處理單元,適于利用插值算法放大人頭區(qū)域,得到處理后的圖像幀。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,區(qū)域分割單元包括:第一子單元,適于將人臉基準區(qū)域中除了預定區(qū)域之外的區(qū)域劃分為人臉的皮膚區(qū)域,其中,預定區(qū)域根據(jù)所述預定關鍵點確定,預定關鍵點包括眼睛、眉毛、嘴巴。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,區(qū)域分割單元還包括:第二子單元,適于將位于人臉基準區(qū)域上方預定比例的、且為連通區(qū)域的區(qū)域初步判定為初始頭發(fā)區(qū)域。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,混合高斯模型定義為:
其中
為第k個高斯模型的概率密度函數(shù),且K為高斯模型的個數(shù),πk為第k個模型的權重,x為某個像素的特征向量,N為特征向量的維度,μk為均值向量,Ck為N*N的協(xié)方差矩陣。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,計算單元還適于計算混合高斯模型的參數(shù),其中參數(shù)包括每個模型的權重πk、均值向量μk、協(xié)方差矩陣Ck。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,區(qū)域分割單元還包括:第三子單元,適于通過分割算法、利用概率分布估計結果和像素點間顏色的相似性,分割出圖像中的人頭區(qū)域。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,還包括:邊緣處理單元,適于對經(jīng)區(qū)域分割單元分割中的人頭區(qū)域進行邊緣平滑處理。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,處理單元還適于以特定的關鍵點為基準點,對該人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域,并將放大后的人頭區(qū)域的基準點和原來的基準點對齊。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,特定的關鍵點包括鼻尖點、嘴中心點。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,計算單元還適于以當前圖像幀的混合高斯模型的參數(shù)為初始值,利用EM算法估計下一圖像幀中混合高斯模型中的參數(shù)。
可選地,在根據(jù)本發(fā)明的人臉圖像處理裝置中,區(qū)域分割單元還適于在檢測單元檢測到多個人臉基準區(qū)域時,分割出多個人頭區(qū)域;計算單元還適于利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系。
根據(jù)本發(fā)明的人臉圖像處理方案,首先通過圖像檢測等算法確定出圖像幀中的初始皮膚區(qū)域和初始頭發(fā)區(qū)域,然后利用概率建模,對初始皮膚區(qū)域和初始頭發(fā)區(qū)域進行聚類,再結合聚類結果、利用圖像分割算法自動分割出圖像幀中的人頭區(qū)域,對人頭區(qū)域進行插值運算,輸出放大人頭的圖像幀。
進一步地,考慮到視頻中圖像幀與幀之間相互關聯(lián),當要處理具有連續(xù)多幀圖像的視頻時,不是對單幀圖像分別進行分割處理,而是采用參數(shù)估計的方式,將上一幀圖像的參數(shù)值作為下一幀圖像的初始值,以保證視頻中圖像幀之間分割得一致性,在避免出現(xiàn)單幀跳變現(xiàn)象的同時,也提高了算法中的建模速度。另外,當圖像幀中存在多個人頭區(qū)域時,利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系,從而保證了GMM參數(shù)更新的準確性。
附圖說明
為了實現(xiàn)上述以及相關目的,本文結合下面的描述和附圖來描述某些說明性方面,這些方面指示了可以實踐本文所公開的原理的各種方式,并且所有方面及其等效方面旨在落入所要求保護的主題的范圍內。通過結合附圖閱讀下面的詳細描述,本公開的上述以及其它目的、特征和優(yōu)勢將變得更加明顯。遍及本公開,相同的附圖標記通常指代相同的部件或元素。
圖1示出了根據(jù)本發(fā)明一個實施例的人臉圖像處理方法100的流程圖;
圖2A示出了根據(jù)本發(fā)明一個實施例的人臉圖像處理裝置200的示意圖;以及
圖2B示出了根據(jù)本發(fā)明另一實施例的人臉圖像處理裝置200的示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。
圖1示出了根據(jù)本發(fā)明一個實施例的人臉圖像處理方法100的流程圖。根據(jù)本發(fā)明的實現(xiàn)方式,本方法100可以在移動終端中執(zhí)行,也可以在諸如PC的計算設備中執(zhí)行,只要在終端安裝有具有人臉圖像處理裝置200(下面將詳細介紹)的應用即可。本方法100能夠自動分割出人臉圖像中的人頭區(qū)域,然后通過插值方式放大人頭區(qū)域,以增加圖像的趣味性。
該方法100始于步驟S110。在步驟S110中,對當前圖像幀做人臉檢測,生成人臉基準區(qū)域。簡單來講,人臉檢測(Face detection)就是判斷一幀圖像中是否包含人臉區(qū)域,若包含人臉則返回人臉的大小、位置等信息。人臉檢測技術相關的算法有很多,例如膚色檢測、運動檢測、邊緣檢測等等,相關的模型也有很多,本發(fā)明對此不作限制,任何人臉檢測算法都可以與本發(fā)明的實施例相結合,以完成人臉圖像處理。另外,若檢測到當前圖像幀中有多個人臉,那對每個人臉都生成一個人臉基準區(qū)域。
隨后在步驟S120中,對上一步中檢測到的人臉基準區(qū)域進行關鍵點檢測,識別出每個人臉的各個部位的關鍵點位置。例如眉毛、鼻子、眼角、嘴巴、臉外輪廓等。在本實施例中,一般提取出的人臉關鍵點數(shù)目在50-100之間。
隨后在步驟S130中,根據(jù)識別出的人臉關鍵點的位置從人臉基準區(qū)域中劃分出該圖像幀中的初始人臉皮膚區(qū)域。根據(jù)一種實現(xiàn)方式,將人臉基準區(qū)域中除了預定關鍵點(眼睛、眉毛、嘴巴)所對應的預定區(qū)域之外的區(qū)域劃分為初始人臉皮膚區(qū)域。
隨后在步驟S140中,結合人臉基準區(qū)域及先驗知識計算出該圖像幀中初始的頭發(fā)區(qū)域??蛇x地,根據(jù)先驗知識將頭發(fā)區(qū)域定義為:
a).位于人臉區(qū)域正上方的連通區(qū)域
b).顏色分布均勻,且顏色偏暗
c).紋理不雜亂、且具有較強的方向性
根據(jù)以上三點,在識別頭發(fā)區(qū)域時,將位于人臉基準區(qū)域之上、且為連通區(qū)域的區(qū)域初步判定為初始頭發(fā)區(qū)域;
隨后在步驟S150中,根據(jù)步驟S130確定的初始人臉皮膚區(qū)域和步驟S140確定的初始頭發(fā)區(qū)域,對皮膚區(qū)域和頭發(fā)區(qū)域同時進行概率建模,換句話說,利用聚類算法對初始皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點的特征向量進行聚類(特征向量包括顏色特征和紋理特征),這里的聚類算法可以選擇混合高斯模型(Gaussian Mixture Model,GMM),對頭發(fā)顏色和皮膚顏色在三維顏色空間的概率分布進行估計。本發(fā)明對顏色空間不作限制,可以是在RGB顏色空間進行處理,也可以是HSV、HSI等其他空間。
其中,每個GMM由K個Gaussian分布組成,每個Gaussian稱為一個分量(Component),這些Component線性加成在一起就組成了GMM的概率密度函數(shù):
其中,
表示第k個高斯模型的概率密度函數(shù),
模型的個數(shù)K在本實施例中為2,即頭發(fā)區(qū)域的模型和皮膚區(qū)域的模型,πk為第k個模型的權重,x為某個像素的特征向量,N為特征向量的維度,μk為均值向量,Ck為N*N的協(xié)方差矩陣。
可選地,在根據(jù)像素點分布推算出每個分量的概率密度(即,計算出每個分量的概率密度函數(shù)p(x))后,還要計算混合高斯模型的參數(shù),如上所述,參數(shù)為每個模型的權重πk、均值向量μk、協(xié)方差矩陣Ck。這里作參數(shù)估計,有助于以當前圖像幀的混合高斯模型的參數(shù)為初始值,估計出下一圖像幀中混合高斯模型中的參數(shù),以便于保證圖像幀與幀之間分割條件的一致性,防止每一幀單獨處理造成前后幀分割出來的頭部區(qū)域發(fā)生跳變的情況。根據(jù)本發(fā)明的一個實施例,在做參數(shù)估計時,最常采用的方法是最大似然法,如可以選取EM(Expectation-Maximization)算法進行參數(shù)估計。
隨后在步驟S160中,根據(jù)概率分布估計的結果對該圖像幀進行圖像分割,得到該圖像幀的人頭區(qū)域,人頭區(qū)域包括由皮膚區(qū)域確定出的人臉區(qū)域以及頭發(fā)區(qū)域。具體地,根據(jù)上一步驟中計算出的概率密度分布結果、通過分割算法標記該圖像幀中的像素,其中,像素點在混合高斯模型中輸出的概率值與其處于人頭區(qū)域的可能性正相關,通俗來講,就是將上一步中輸入概率值大的像素點標記為label=1,反之為label=0,那么,label=1的像素點就構成了人頭區(qū)域,根據(jù)這樣的像素標記結果就可以分割出該圖像幀中的人頭區(qū)域。
另外,在本實施例的分割算法中,相鄰像素點的顏色相似度越高,其label值相同的可能性也就越高,可以通過提取圖像的邊緣信息衡量相鄰像素之間的顏色相似度。
可選地,對于分割算法可以采用任意的連續(xù)或離散的能量優(yōu)化算法,如maxflow/min-cut算法、total variation minimization算法等,根據(jù)像素標記結果分割出該圖像幀的人頭區(qū)域。
隨后在步驟S170中,利用插值算法放大分割出的人頭區(qū)域,得到處理后的圖像幀,也就是放大了人頭的圖像。
可選地,在經(jīng)步驟S160分割得到人頭區(qū)域后、插值放大人頭區(qū)域之前,還可以先對人頭區(qū)域的邊緣進行平滑處理:對所分割得到的人頭區(qū)域進行邊緣提取,然后對提取的邊緣作平滑處理。可選地,本實施例中采用alpha matting方法對圖像邊緣做平滑處理,可以將人頭區(qū)域看作是圖像前景,將其他區(qū)域看作是圖像背景。當然,平滑處理也可以采用圖像形態(tài)學處理方式(如,膨脹腐蝕)等,本發(fā)明對此不做限制。
在平滑處理后,以特定的關鍵點為基準點,對分割出的人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域,并保證放大后的人頭區(qū)域的基準點與原來的基準點對齊。例如以鼻尖點作為基準點,保持鼻尖點位置不變,插值放大人頭區(qū)域;也可以以嘴中心點作為基準點,總之,保證放大后的人頭區(qū)域和原始人頭區(qū)域基準位置不變。
經(jīng)過上述步驟,首先通過圖像檢測等算法確定出圖像幀中的皮膚區(qū)域和頭發(fā)區(qū)域,然后利用概率建模,對皮膚區(qū)域和頭發(fā)區(qū)域進行聚類,再結合聚類結果、利用圖像分割算法自動分割出圖像幀中的人頭區(qū)域,對人頭區(qū)域進行插值運算,輸出放大人頭的圖像幀。
可選地,當圖像幀中存在多個人頭區(qū)域時,利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系,保證GMM參數(shù)更新的準確性。
考慮到視頻中圖像幀與幀之間相互關聯(lián),當要處理具有連續(xù)多幀圖像的視頻時,不是對單幀圖像分別進行分割處理,而是采用參數(shù)估計的方式,將上一幀圖像的參數(shù)值作為下一幀圖像的初始值,以保證視頻中圖像幀之間分割得一致性,在避免出現(xiàn)單幀跳變現(xiàn)象的同時,也提高了算法中的建模速度。
圖2A示出了根據(jù)本發(fā)明一個實施例的用于執(zhí)行方法100的人臉圖像處理裝置200的示意圖。該裝置200包括:檢測單元210、識別單元220、區(qū)域分割單元230、計算單元240、以及處理單元250。
檢測單元210適于對當前圖像幀做人臉檢測,生成人臉基準區(qū)域。當判斷當前圖像幀中包含人臉區(qū)域時,則返回人臉的大小、位置等信息,如用一個矩形框圈出圖像中的人臉區(qū)域。人臉檢測技術相關的算法有很多,例如膚色檢測、運動檢測、邊緣檢測等等,相關的模型也有很多,本發(fā)明對此不作限制,任何人臉檢測算法都可以與本發(fā)明的實施例相結合,以完成人臉圖像處理。另外,檢測單元210還適于在檢測到當前圖像幀中有多個人臉時,對每個人臉都生成一個人臉基準區(qū)域。
識別單元220適于對由檢測單元210檢測出人臉基準區(qū)域進行關鍵點檢測,識別出人臉中各個部位的關鍵點位置,例如眉毛、鼻子、眼角、嘴巴、臉外輪廓等。在本實施例中,一般提取出的人臉關鍵點數(shù)目在50-100之間。
區(qū)域分割單元230適于分割出該圖像幀中的初始人臉皮膚區(qū)域、初始頭發(fā)區(qū)域、以及人頭區(qū)域。具體地,根據(jù)區(qū)域分割單元230的處理過程,其包含:分割出初始人臉皮膚區(qū)域的第一子單元232、分割出初始頭發(fā)區(qū)域的第二子單元234、和分割人頭區(qū)域的第三子單元236,如圖2B所示。
可選地,第一子單元232適于根據(jù)人臉關鍵點從人臉基準區(qū)域中劃分出該圖像幀中的初始人臉皮膚區(qū)域。根據(jù)本發(fā)明的一個實施例,將人臉基準區(qū)域中除了由預定關鍵點所確定的預定區(qū)域之外的區(qū)域劃分為人臉的皮膚區(qū)域,預定關鍵點包括眼睛、眉毛、嘴巴。
可選地,第二子單元234適于結合人臉基準區(qū)域及先驗知識計算出該圖像幀中的頭發(fā)區(qū)域。
根據(jù)先驗知識將頭發(fā)區(qū)域定義為:
a).位于人臉區(qū)域正上方的連通區(qū)域
b).顏色分布均勻,且顏色偏暗
c).紋理不雜亂、且具有較強的方向性
根據(jù)以上3點,第二子單元適于將位于人臉基準區(qū)域上方預定比例的、且為連通區(qū)域的區(qū)域初步判定為初始頭發(fā)區(qū)域。
在經(jīng)第一子單元和第二子單元確定出圖像幀的初始人臉皮膚區(qū)域和初始頭發(fā)區(qū)域后,計算單元240適于利用混合高斯模型對初始皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點特征向量進行概率分布估計。即,利用聚類算法對初始人臉皮膚區(qū)域和初始頭發(fā)區(qū)域的像素點的特征向量進行聚類,這里的聚類算法可以選擇混合高斯模型(Gaussian Mixture Model,GMM),對頭發(fā)顏色和皮膚顏色在三維顏色空間的概率分布進行估計。本發(fā)明對顏色空間不作限制,可以是在RGB顏色空間進行處理,也可以是HSV、HSI等其他空間。
其中,每個GMM由K個Gaussian分布組成,每個Gaussian稱為一個分量(Component),這些Component線性加成在一起就組成了GMM的概率密度函數(shù):
其中,第k個高斯模型的概率密度函數(shù)為:
K為高斯模型的個數(shù),πk為第k個模型的權重,x為某個像素的特征向量,N為特征向量的維度,μk為均值向量,Ck為N*N的協(xié)方差矩陣
模型的個數(shù)K在本實施例中為2,即頭發(fā)區(qū)域的模型和皮膚區(qū)域的模型,πk為第k個模型的權重。
計算單元240還適于在根據(jù)像素點分布推算出每個分量的概率密度(即,計算出每個分量的概率密度函數(shù)p(x))后,計算混合高斯模型的參數(shù),其中參數(shù)包括每個模型的πk、μk、σk。
這里作參數(shù)估計,有助于以當前圖像幀的混合高斯模型的參數(shù)為初始值,估計出下一圖像幀中混合高斯模型中的參數(shù),以便于保證圖像幀與幀之間分割條件的一致性,防止每一幀單獨處理造成分割出來的頭部區(qū)域發(fā)生跳變的情況。根據(jù)本發(fā)明的一個實施例,在做參數(shù)估計時,最常采用的方法是最大似然法,如可以選取EM(Expectation-Maximization)算法進行參數(shù)估計。
區(qū)域分割單元240還適于根據(jù)概率分布估計的結果對該圖像幀進行圖像分割,得到該圖像幀的人頭區(qū)域,由第三子單元236執(zhí)行如下操作,以分割出人頭區(qū)域。
第三子單元236適于通過分割算法、根據(jù)概率分布估計的結果標記該圖像幀中的像素,且根據(jù)像素標記結果分割出該圖像幀中的人頭區(qū)域,其中,像素點在混合高斯模型中輸出的概率值與其處于人頭區(qū)域的可能性正相關。通俗來講,就是將上一步中輸入概率值大的像素點標記為label=1,反之為label=0,那么,label=1的像素點就構成了人頭區(qū)域,根據(jù)這樣的像素標記結果就可以分割出該圖像幀中的人頭區(qū)域。
另外,第三子單元236還適于通過分割算法根據(jù)相鄰像素的顏色相似度標記該圖像幀中的像素,其中,相鄰像素的顏色相似度值與其像素標記結果一致的可能性正相關。
可選地,對于分割算法可以采用任意的連續(xù)或離散的能量優(yōu)化算法,如maxflow/min-cut算法、total variation minimization算法等,根據(jù)像素標記結果分割出該圖像幀的人頭區(qū)域。
處理單元250適于利用插值算法放大人頭區(qū)域,得到處理后的圖像幀。
如圖2B所示,根據(jù)本發(fā)明的一個實施例,裝置200還包括邊緣處理單元260。邊緣處理單元260適于對經(jīng)區(qū)域分割單元230分割出的人頭區(qū)域進行邊緣平滑處理:對所分割得到的人頭區(qū)域進行邊緣提取,然后對提取的邊緣作平滑處理??蛇x地,本實施例中采用alpha matting方法對圖像邊緣做平滑處理,將人頭區(qū)域看作是圖像前景,將其他區(qū)域看作是圖像背景。當然,平滑處理也可以采用圖像形態(tài)學處理方式(如,膨脹腐蝕)等,本發(fā)明對此不做限制。
處理單元250還適于在得到經(jīng)由邊緣處理單元260處理的人頭區(qū)域后,以特定的關鍵點為基準點,對該人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域,并保證放大后的人頭區(qū)域的基準點與原來的基準點對齊。特定的關鍵點例如可以是鼻尖點或嘴中心點??傊?,保證放大后的人頭區(qū)域和原始人頭區(qū)域基準位置不變。
根據(jù)本發(fā)明的實施例,區(qū)域分割單元230還適于在檢測單元210檢測到多個人臉基準區(qū)域時,分割出多個人頭區(qū)域。
同樣地,計算單元240還適于利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系,從而保證GMM參數(shù)更新的準確性。
應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權利要求中所明確記載的特征更多特征。更確切地說,如下面的權利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權利要求書由此明確地并入該具體實施方式,其中每個權利要求本身都作為本發(fā)明的單獨實施例。
本領域那些技術人員應當理解在本文所公開的示例中的設備的模塊或單元或組件可以布置在如該實施例中所描述的設備中,或者可替換地可以定位在與該示例中的設備不同的一個或多個設備中。前述示例中的模塊可以組合為一個模塊或者此外可以分成多個子模塊。
本領域那些技術人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
本發(fā)明還公開了:
A6、如A1-5中任一項所述的方法,其中根據(jù)概率分布估計的結果對該圖像幀進行圖像分割的步驟還包括:通過分割算法、利用概率分布估計結果和像素點間顏色的相似性,分割出圖像中的人頭區(qū)域。
A7、如A1-6中任一項所述的方法,其中在分割得到人頭區(qū)域后,還包括步驟:提取所分割得到的人頭區(qū)域的邊緣;以及對邊緣進行平滑處理。
A8、如A7所述的方法,其中,利用插值算法放大人頭區(qū)域的步驟包括:以特定的關鍵點為基準點,對該人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域;并將放大后的人頭區(qū)域的基準點和原來的基準點對齊。
A9、如A8所述的方法,其中特定的關鍵點包括:鼻尖點、嘴中心點。
A10、如A5-9中任一項所述的方法,還包括步驟:以當前圖像幀的混合高斯模型的參數(shù)為初始值,利用EM算法估計下一圖像幀中混合高斯模型中的參數(shù)。
A11、如A1-10中任一項所述的方法,還包括步驟:若檢測到當前圖像幀中有多個人臉基準區(qū)域,則分割出多個人頭區(qū)域;以及利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系。
B17、如B12-16中任一項所述的裝置,其中區(qū)域分割單元還包括:第三子單元,適于通過分割算法、利用概率分布估計結果和像素點間顏色的相似性,分割出圖像中的人頭區(qū)域。
B18、如B12-17中任一項所述的裝置,還包括:邊緣處理單元,適于對經(jīng)區(qū)域分割單元分割出的人頭區(qū)域進行邊緣平滑處理。
B19、如B18所述的裝置,其中,處理單元還適于以特定的關鍵點為基準點,對該人頭區(qū)域作插值處理,得到放大后的人頭區(qū)域,并將放大后的人頭區(qū)域的基準點和原來的基準點對齊。
B20、如B19所述的裝置,其中特定的關鍵點包括鼻尖點、嘴中心點。
B21、如B16-20中任一項所述的裝置,其中,計算單元還適于以當前圖像幀的混合高斯模型的參數(shù)為初始值,利用EM算法估計下一圖像幀中混合高斯模型中的參數(shù)。
B22、如B12-21中任一項所述的裝置,其中,區(qū)域分割單元還適于在檢測單元檢測到多個人臉基準區(qū)域時,分割出多個人頭區(qū)域;以及計算單元還適于利用多目標跟蹤算法分別計算下一圖像幀中人頭區(qū)域與當前圖像幀中人頭區(qū)域之間的對應關系。
此外,本領域的技術人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內并且形成不同的實施例。例如,在下面的權利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
此外,所述實施例中的一些在此被描述成可以由計算機系統(tǒng)的處理器或者由執(zhí)行所述功能的其它裝置實施的方法或方法元素的組合。因此,具有用于實施所述方法或方法元素的必要指令的處理器形成用于實施該方法或方法元素的裝置。此外,裝置實施例的在此所述的元素是如下裝置的例子:該裝置用于實施由為了實施該發(fā)明的目的的元素所執(zhí)行的功能。
如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞“第一”、“第二”、“第三”等等來描述普通對象僅僅表示涉及類似對象的不同實例,并且并不意圖暗示這樣被描述的對象必須具有時間上、空間上、排序方面或者以任意其它方式的給定順序。
盡管根據(jù)有限數(shù)量的實施例描述了本發(fā)明,但是受益于上面的描述,本技術領域內的技術人員明白,在由此描述的本發(fā)明的范圍內,可以設想其它實施例。此外,應當注意,本說明書中使用的語言主要是為了可讀性和教導的目的而選擇的,而不是為了解釋或者限定本發(fā)明的主題而選擇的。因此,在不偏離所附權利要求書的范圍和精神的情況下,對于本技術領域的普通技術人員來說許多修改和變更都是顯而易見的。對于本發(fā)明的范圍,對本發(fā)明所做的公開是說明性的,而非限制性的,本發(fā)明的范圍由所附權利要求書限定。