專利名稱:自適應感興趣特征顏色模型參數(shù)估計的方法和設備的制作方法
技術領域:
本發(fā)明總體上涉及視頻編碼,更具體地,涉及一種自適應感興趣特征顏色模型參 數(shù)估計的方法和設備。
背景技術:
人類膚色像素的顏色分量傾向于在顏色空間中的有限區(qū)域中出現(xiàn),并且可以用特 定統(tǒng)計模型(這里被稱作皮膚顏色模型)來近似。魯棒且精確的皮膚顏色模型對于需要皮 膚檢測和皮膚分類的應用是必要的,例如,手掌跟蹤、臉部識別、圖像和視頻數(shù)據(jù)索引和獲 取、圖像和視頻壓縮等等。在圖像和視頻壓縮算法的情況下,可以首先檢測膚色像素,然后 向該膚色像素分配較高編碼優(yōu)先級,以實現(xiàn)較高視覺質量。在手掌跟蹤和臉部識別的情況 下,可以首先檢測膚色像素,然后該膚色像素用作另一精細檢測和識別的候選。使用這種統(tǒng)計皮膚模型的典型應用通常假定皮膚顏色模型的模型參數(shù)在時間和 空間上是不變的。這種假定由于許多原因而不能在實際應用中成立。例如,不同的圖像和 視頻中會存在目標皮膚的更大變化,或者會存在圖像和視頻獲取條件的更大變化。一個這 樣的示例是在捕獲圖像或視頻時的不同照明條件。皮膚顏色模型參數(shù)的這種失配可以引起 非常不精確或錯誤的檢測結果,其中膚色像素被分類為非膚色像素,反之亦然??梢岳妙伾臻g中的特定統(tǒng)計分布來建模人類膚色的顏色分量。當使用許多顏 色空間來建模時,已經發(fā)現(xiàn)顏色空間的選擇對模型的精度有限制影響。出于示意的目的,以 下討論涉及YUV顏色空間。典型的皮膚顏色模型將人類皮膚顏色分量視為2-D高斯分布, 2-D高斯分布可以由如下的顏色分量U和V的均值和協(xié)方差矩陣來定義μ = (Op1F)
γ _ “"
rW crF
(1)其中,μ和Σ是2-D高斯概率密度函數(shù)ρ (χ)的均值和協(xié)方差矩陣, 7和廠分別是 U和V顏色分量的均值,4和M分別是U和V顏色分量的方差,以及σ uv是U和V顏色分量 的協(xié)方差。具有顏色分量的像素χ = (u, ν)是膚色的概率表示如下
POO
(2) 其中d(x)被稱作馬氏距離,并且可以表示如下
Xly
3
-
C
T
Σ
F
V/ -
- 典型地,在對皮膚數(shù)據(jù)庫進行訓練之后,估計皮膚模型參數(shù)μ和Σ。與上述公式 (1)相對應的以下參數(shù)廣泛用于視頻會議應用
權利要求
一種用于顏色檢測的設備,包括估計器(210),用于從圖像中提取像素集合,所述像素集合與感興趣特征相對應,所述估計器(210)利用統(tǒng)計模型對像素集合中的像素的顏色分量進行建模,并且基于已建模的顏色分量來估計參數(shù),以獲得估計的感興趣特征顏色模型;以及檢測器(220),使用估計的顏色模型從像素集合中檢測像素。
2.根據(jù)權利要求1所述的設備,其中,圖像是視頻的一部分。
3.根據(jù)權利要求1所述的設備,其中,所述估計器(210)估計參數(shù)也獲得非感興趣特征 顏色模型,將非感興趣特征顏色模型建模為高斯混合。
4.根據(jù)權利要求1所述的設備,其中,將估計的感興趣特征顏色模型建模為高斯分布。
5.根據(jù)權利要求4所述的設備,其中,與被建模為高斯分布的估計的感興趣特征顏色 模型相對應的參數(shù)由預選范圍中的像素來估計。
6.根據(jù)權利要求5所述的設備,其中,預選范圍基于感興趣特征數(shù)據(jù)庫中預定的感興 趣特征像素的百分比。
7.根據(jù)權利要求6所述的設備,其中,基于估計的V顏色分量與估計的U顏色分量之間 的最小差值來選擇參數(shù)。
8.根據(jù)權利要求1所述的設備,其中,使用高斯混合模型來估計參數(shù)。
9.根據(jù)權利要求1所述的設備,其中,使用多個模型參數(shù)估計方法來估計參數(shù)。
10.根據(jù)權利要求9所述的設備,其中,使用多個模型參數(shù)估計方法聯(lián)合地估計參數(shù), 以獲得最后估計參數(shù)。
11.根據(jù)權利要求10所述的設備,其中,所述估計器(210)使用算術加權來對最后估計 參數(shù)的均值進行加權。
12.根據(jù)權利要求10所述的設備,其中,所述估計器(210)使用幾何加權來對最后估計 參數(shù)的均值進行加權。
13.根據(jù)權利要求1所述的設備,其中,所述設備在視頻編碼器(250、300)中使用。
14.根據(jù)權利要求13所述的設備,其中,所述視頻編碼器(250、300)將多個區(qū)域編碼成 與國際標準化組織/國際電工委員會(IS0/IEC)運動圖像專家組-4的第10部分高級視頻 編碼標準/國際電信聯(lián)盟電信部(ITU-T)H. 264推薦標準符合的比特流。
15.根據(jù)權利要求13所述的設備,其中,所述視頻編碼器(250、300)將多個區(qū)域編碼成 與電影電視工程師協(xié)會視頻編解碼器-1標準符合的比特流。
16.根據(jù)權利要求1所述的設備,其中,感興趣特征包括皮膚、草地和天空中的至少一個。
17.一種用于顏色檢測的方法,包括 從圖像中提取(410)像素集合,利用統(tǒng)計模型對像素集合的顏色分量進行建模(420),以產生已建模的顏色分量; 基于已建模的顏色分量來估計(425)參數(shù),以獲得第一顏色模型; 以及使用第一顏色模型從像素集合中檢測(430)像素。
18.根據(jù)權利要求17所述的方法,其中,所述估計步驟還包括步驟對參數(shù)進行估計以獲得第二顏色模型,將第二顏色模型建模為高斯混合。
19.根據(jù)權利要求17所述的方法,其中,將第一顏色模型建模(620-635)為高斯分布。
20.根據(jù)權利要求19所述的方法,其中,利用預選范圍中的像素來估計(520)參數(shù)。
21.根據(jù)權利要求20所述的方法,其中,預選范圍基于感興趣特征數(shù)據(jù)庫中感興趣特 征像素的預定百分比(520)。
22.根據(jù)權利要求21所述的方法,其中,基于估計的V顏色分量與估計的U顏色分量之 間的最小差值來選擇(520)所述參數(shù)。
23.根據(jù)權利要求17所述的方法,其中,使用高斯混合模型來估計(620-635)感興趣特 征顏色模型參數(shù)。
24.根據(jù)權利要求17所述的方法,其中,使用多個模型參數(shù)估計方法來估計(725)感興 趣特征顏色模型參數(shù)。
25.根據(jù)權利要求24所述的方法,其中,使用多個模型參數(shù)估計方法聯(lián)合地估計感興 趣特征顏色模型參數(shù),以獲得最后估計參數(shù)(735)。
26.根據(jù)權利要求24所述的方法,其中,使用算術加權來對最后估計參數(shù)的均值進行 加權(735)。
27.根據(jù)權利要求24所述的方法,其中,使用幾何加權來對最后估計參數(shù)的均值進行 加權(735)。
28.根據(jù)權利要求17所述的方法,其中,方法在視頻編碼器(400)中使用。
29.根據(jù)權利要求28所述的方法,其中,所述視頻編碼器將多個區(qū)域編碼成與國際標 準化組織/國際電工委員會(IS0/IEC)運動圖像專家組-4的第10部分高級視頻編碼標準 /國際電信聯(lián)盟電信部(ITU-T)H. 264推薦標準符合的比特流。
30.根據(jù)權利要求28所述的方法,其中,所述視頻編碼器將多個區(qū)域編碼成與電影電 視工程師協(xié)會視頻編解碼器-1標準符合的比特流。
31.根據(jù)權利要求17所述的方法,其中,所述像素包括皮膚、草地和天空中的至少一個。全文摘要
提供了一種自適應感興趣特征顏色模型參數(shù)估計的方法設設備。該設備包括感興趣特征顏色模型參數(shù)估計器和感興趣特征檢測器。感興趣特征顏色模型參數(shù)估計器用于從至少一個圖像中提取至少一個像素集合。至少一個像素集合與感興趣特征相對應。對于至少一個像素集合中的每一個,感興趣特征顏色模型參數(shù)估計器利用統(tǒng)計模型對至少一個集合中的像素的顏色分量進行建模,并且基于已建模的顏色分量來估計感興趣特征顏色模型參數(shù),以獲得至少一個感興趣特征顏色模型。感興趣特征檢測器用于使用至少一個估計的感興趣特征顏色模型,從所述至少一個像素集合中檢測感興趣特征像素。
文檔編號G06T9/00GK101960491SQ200880127889
公開日2011年1月26日 申請日期2008年3月18日 優(yōu)先權日2008年3月18日
發(fā)明者克里斯蒂娜·戈米拉, 李 真, 陸曉安 申請人:湯姆森許可貿易公司