時間面部序列的制作方法
【專利摘要】一種用于找出時間面部序列(412)的方法包括:用物理計算系統(tǒng)(100),分析視頻內(nèi)的鏡頭中的幀,對幀應(yīng)用面部檢測功能(404),以及響應(yīng)于在幀之一內(nèi)檢測到面部,貫穿該鏡頭中的幀向后和向前追蹤與該面部關(guān)聯(lián)的人。然后,將時間面部序列(412)限定為一系列幀,該系列幀包括該鏡頭內(nèi)在該人顯現(xiàn)時涉及的幀。
【專利說明】時間面部序列
【背景技術(shù)】
[0001]存在允許用戶查看、編輯、分析以及分類數(shù)字視頻文件的許多應(yīng)用。這些應(yīng)用還可以包括自動地識別視頻內(nèi)出現(xiàn)的面部并將那些面部與它們所屬的人關(guān)聯(lián)的特征。組織從一組圖像或視頻中識別的一組人的一種方法是將相似的面部放到面部集群(cluster)中。因此,面部集群是由面部檢測功能確定的相似的面部的集合。
[0002]在數(shù)字視頻內(nèi)使用這樣的面部檢測功能可能是困難的,因為特定人可能在視頻內(nèi)以他/她的面部處于不可由面部識別功能作用的角度出現(xiàn)。此外,人經(jīng)常會在鏡頭(shot)期間中途出現(xiàn),或在鏡頭期間中途離開。鏡頭指由單個攝像機拍攝的連續(xù)視頻片段。鏡頭由一系列幀組成,這一系列幀在快速連續(xù)地顯示時給出視頻的表現(xiàn)。通過分析視頻鏡頭內(nèi)的幀,面部檢測功能能夠用來識別視頻內(nèi)出現(xiàn)的面部。
【專利附圖】
【附圖說明】
[0003]附圖圖示本文描述的原理的各示例并且是說明書的一部分。附圖僅是示例且不限制權(quán)利要求的范圍。
[0004]圖1是根據(jù)本文描述的原理的一個示例示出說明性物理計算系統(tǒng)的圖。
[0005]圖2是根據(jù)本文描述的原理的一個示例示出說明性鏡頭時間軸的圖。
[0006]圖3A和圖3B是根據(jù)本文描述的一個示例示出包括人的面部的說明性幀的圖。
[0007]圖4是根據(jù)本文描述的原理的一個示例示出說明性時間面部序列形成的圖。
[0008]圖5是根據(jù)本文描述的原理的一個示例示出說明性面部聚類的圖。
[0009]圖6是根據(jù)本文描述的原理的一個示例示出用于使用時間面部序列化進行視頻面部聚類的說明性方法的流程。
[0010]在各附圖中,相同的附圖標(biāo)記表不相似但不一定相同的要素。
【具體實施方式】
[0011]本說明書公開用于使用時間面部序列化(temporal face sequencing)進行視頻面部聚類的方法及系統(tǒng)。時間面部序列是視頻內(nèi)的時間范圍,特定人在該時間范圍內(nèi)是可見的。該時間范圍期間,面部可能不是一直可由面部檢測功能識別的。例如,人可能將他或她的面部離開相機放置。本文描述的方法和系統(tǒng)允許,不管人面向離開相機時的情況如何,都能確定時間面部序列。此外,這些時間面部序列能夠與面部聚類功能一起使用,面部聚類功能將具有相似面部的時間面部序列放入視頻面部集群中。
[0012]根據(jù)特定說明性示例,對視頻內(nèi)的鏡頭逐幀地進行分析。將面部檢測功能施加至每個被分析的幀,直至發(fā)現(xiàn)面部。如果發(fā)現(xiàn)面部,則向前及向后追蹤與該幀關(guān)聯(lián)的人,直至該人不再位于幀內(nèi)。通過在形成該視頻的幀序列中向前和向后追蹤與面部關(guān)聯(lián)的人,能夠確定人位于鏡頭內(nèi)的時間范圍。該時間范圍被稱為用于與所檢測的面部關(guān)聯(lián)的人的時間面部序列。
[0013]能夠?qū)为毜臅r間面部序列進行分析,以找出每個序列中的一個或多個最佳幀。最佳幀是對面部聚類功能用途而言具有對象面部的最好視圖的幀。然后,面部聚類功能將來自每個面部時間序列的代表性面部進行比較,并且將匹配面部放入面部集群中。因此,特定面部集群可以包括與同一人關(guān)聯(lián)的多個時間面部序列。這些多個時間面部序列可以來自多個鏡頭。這些面部集群可以用于多種視頻編輯、標(biāo)注(tagging)或分類應(yīng)用。
[0014]通過使用包含本文描述的原理的方法和系統(tǒng),可以對視頻進行自動分析及索引,使得可以容易地識別視頻中包括特定人的視頻片段。這樣的特征具有許多消費者應(yīng)用、企業(yè)應(yīng)用、娛樂應(yīng)用以及安全應(yīng)用。
[0015]在下面的描述中,為了進行解釋,闡述了許多具體細(xì)節(jié),以便提供本系統(tǒng)和方法的全面理解。然而,將對本領(lǐng)域技術(shù)人員而言顯而易見的是,可以在沒有這些具體細(xì)節(jié)的情況下實踐本裝置、系統(tǒng)和方法。在本說明書中對“示例”或類似語言的引用指如所描述那樣包括與該示例有關(guān)描述的特定特征、結(jié)構(gòu)或特性,但是在其它示例中可能不包括該特定特征、結(jié)構(gòu)或特性。
[0016]現(xiàn)在參考附圖,圖1是示出能夠用來管理、索引以及編輯視頻文件的說明性物理計算系統(tǒng)(100)的圖。根據(jù)特定說明性示例,物理計算系統(tǒng)(100)包括存儲器(102),存儲器(102)具有在該存儲器上存儲的機器可讀指令(104)和數(shù)據(jù)(106)。物理計算系統(tǒng)(100)還包括處理器(108)和用戶接口(110)。
[0017]有許多類型的存儲器可用。一些類型的存儲器(如固態(tài)驅(qū)動器)被設(shè)計用于存儲。這些類型的存儲器典型地具有大的存儲容積,但具有相對慢的性能。其它類型的存儲器(如用于隨機存取存儲器(RAM)的那些存儲器)針對速度進行了優(yōu)化,并且通常稱為“工作存儲器”。各種形式的存儲器可以以機器可讀指令(104)和數(shù)據(jù)(106)的形式存儲信息。
[0018]物理計算系統(tǒng)(100)還包括處理器(108),處理器(108)用于運行機器可讀指令
(104)以及使用或更新在存儲器(102)中存儲的數(shù)據(jù)(106)。機器可讀指令(104)可以包括操作系統(tǒng)。操作系統(tǒng)允許其它應(yīng)用程序與該物理計算系統(tǒng)的硬件正確地交互。這樣的其它應(yīng)用程序可以包括上面描述的、允許用戶分析并索引視頻文件的那些應(yīng)用。能夠執(zhí)行本文描述的與時間面部序列化和面部聚類相關(guān)的功能的應(yīng)用,被稱為視頻聚類應(yīng)用。
[0019]用戶接口(110)可以提供用于用戶(112)與物理計算系統(tǒng)(100)交互的手段。用戶接口可以包括用于與人類用戶(112)交互的設(shè)備的任意集合。例如,用戶接口(110)可以包括像鍵盤或鼠標(biāo)這樣的輸入設(shè)備,以及像監(jiān)視器這樣的輸出設(shè)備。
[0020]圖2是示出說明性鏡頭時間軸的圖。如上面提到的,鏡頭指具有由攝像機拍攝的連續(xù)記錄的視頻片段。隨著鏡頭時間軸(200)推進,各種人可以進入和離開幀內(nèi)的視野。在一些情況下,鏡頭內(nèi)可以僅出現(xiàn)一個人。在一些情況下,在特定時間處,在鏡頭內(nèi)可以出現(xiàn)多個人。
[0021]在圖2示出的示例鏡頭時間軸(200)中,與面部1(204)關(guān)聯(lián)的第一人首先在點A(210)處出現(xiàn)在鏡頭內(nèi)。在點B(212)處,面部3(208)進入鏡頭。在點C(214)處,面部2(206)也進入鏡頭。在該點處,總共三個面部位于鏡頭內(nèi)。在點D (216)處,面部1(204)離開鏡頭。在點E (218)處,面部2 (206)也離開鏡頭。在點F (220)處,面部2 (206)重新進入鏡頭并保持在該鏡頭內(nèi)直至點H(224)。在點G(222)處,面部3(208)離開鏡頭。
[0022]能夠自動地分析視頻文件并識別誰出現(xiàn)以及在什么時間出現(xiàn),對于多種應(yīng)用可能是有用的。例如,拍攝家庭視頻的消費者可能想要按照誰在視頻片段中出現(xiàn)來自動地對視頻片段進行分類。當(dāng)編輯這樣的視頻片段時,準(zhǔn)確地知道什么時間人進入鏡頭以及什么時間人離開鏡頭可能是有幫助的。在另一示例中,使用監(jiān)控視頻的安全操作可能想要分析大量的安全腳本錄像(footage)并且容易地識別什么時間人進入和離開用安全相機拍攝的各種鏡頭。
[0023]典型地,使用關(guān)鍵幀方法分析視頻文件。使用這樣的方法,識別視頻內(nèi)的面部,并且將面部與關(guān)鍵幀關(guān)聯(lián)。關(guān)鍵幀是用于面部檢測功能用途的包括面部的優(yōu)異視角的幀。確定人出現(xiàn)的全部視頻序列的一個挑戰(zhàn)在于:在特定時間,人的面部可能被放置為面向離開相機的位置??商娲兀彰骺赡苁沟萌说拿娌渴遣豢捎擅娌繖z測功能容易地識別的。
[0024]圖3A和圖3B是示出包括人的面部的說明性幀的圖。圖3A是示出具有人的幀的圖,此人正面向與相機正朝向的方向大體垂直的方向。在這樣的位置中,面部檢測功能檢測該面部的面部特征可能是困難的。
[0025]圖3B是示出具有正面向相機的人的幀的圖。當(dāng)人正面向大體朝向相機方向的方向時,面部檢測功能能夠更好地檢測此人的面部特征。隨著視頻鏡頭推進,特定人可能改變它們正面對的方向。然而,為了確定此人在鏡頭內(nèi)出現(xiàn)的全部時間范圍,此人的面部可由面部檢測功能檢測的幀的簡單分析是不夠的。鑒于這一問題及其它問題,本說明書公開了時間面部序列的使用,該時間面部序列可以用于視頻面部聚類。
[0026]圖4是示出說明性時間面部序列形成(400)的圖。如上面提到的,時間面部序列是一系列幀,在這一些列幀中人在鏡頭內(nèi)出現(xiàn),而無論他或她的面部是否能由面部檢測功能檢測。然后,從視頻中確定的時間面部序列可以置于視頻面部集群中。視頻面部集群是屬于同一人的一組時間面部序列。
[0027]根據(jù)特定說明性示例,貫穿鏡頭時間軸(402)逐步地進行面部檢測掃描(404)。在一些情況下,該面部檢測掃描可以順序地分析視頻中的每個幀,以便確定是否能夠檢測任意面部,。在一些情況下,面部檢測掃描(404)可以分析每第η幀,其中η是由缺省定義的或由用戶設(shè)置的數(shù)字。
[0028]當(dāng)面部檢測掃瞄(404)推進時,可能出現(xiàn)一點,在此點處,面部檢測功能能夠檢測足夠的面部特征,以能夠?qū)⑦@些特征聲明為面部。該面部被稱為目標(biāo)對象。該點被稱為面部檢測瞬間(408)。關(guān)于確定為了將一組被分析的特征聲明為面部應(yīng)出現(xiàn)多少面部特征,各種面部檢測功能可能具有不同標(biāo)準(zhǔn)。
[0029]從面部檢測瞬間(408)起,時間面部序列化功能執(zhí)行向后追蹤操作,以確定與被檢測的面部關(guān)聯(lián)的人什么時間進入該鏡頭。此外,時間面部序列化應(yīng)用執(zhí)行向前追蹤操作,以確定與所檢測的面部關(guān)聯(lián)的人什么時間進入該鏡頭。追蹤功能可以使用諸如顏色特征及紋理特征之類的各種特征來對目標(biāo)對象進行建模。追蹤功能可以涉及各種方法,如粒子過濾法。此外,追蹤功能可以使用各種附加特征,如頭肩模型,以幫助追蹤目標(biāo)對象。追蹤功能貫穿全部幀序列向后或向前跟隨人,即便該人的面部不能由面部檢測功能識別。
[0030]例如,頭肩檢測模型可以用于篩選出面部檢測和面部跟蹤中的假警報。這可以通過用預(yù)訓(xùn)練的頭肩模型驗證所檢測的面部或所追蹤的面部的候選區(qū)域來進行。如果該候選區(qū)域不匹配頭肩模型,那么丟棄該候選區(qū)域,并且可以繼續(xù)其它候選區(qū)域。
[0031]各種技術(shù)可以用于頭肩檢測模型。在一個實例中,頭肩檢測可以使用方向梯度直方圖(HOG)技術(shù)。HOG技術(shù)對圖像的局部部分中的梯度方向的出現(xiàn)進行計算。這能夠被設(shè)計為,為了跟蹤目的查找頭肩模型。在進一步的示例中,類哈爾(Haar-1ike)特征可以用來識別頭肩特征。這樣的技術(shù)考慮檢測窗口中特定位置處的相鄰矩形區(qū)域。然后,將那些區(qū)域中的像素強度相加,并且計算那些區(qū)域之間的差異。這些差異能夠用來幫助檢測頭肩特征。在進一步的示例中,使用類哈爾特征和HOG技術(shù)的頭肩模型能夠以任意順序級聯(lián),以形成更復(fù)雜的模型。
[0032]在鏡頭沿場景移動的情況中,隨著鏡頭移動,人可能移動到幀內(nèi)或幀外。如果人移動到幀外,則可以設(shè)置向前追蹤功能來追蹤人,直至他或她的面部完全移出幀外。在一些情況下,可以設(shè)置追蹤功能來追蹤人,直至他或她的面部的實質(zhì)部分移出幀外。如果在鏡頭期間人移動到幀內(nèi),那么向后追蹤功能可以追蹤人回到那個人的一部分初次進入鏡頭的點。在一些情況下,向后追蹤功能可以僅追蹤人回到那個人的大部分出現(xiàn)在幀內(nèi)的點。情況還可能是,當(dāng)人仍然位于幀中間時,鏡頭開始或結(jié)束。在這樣的情況下,向前或向后追蹤人到鏡頭的開始或結(jié)束。此外,在向后追蹤期間,確定向后追蹤結(jié)果是否正在與之前的面部序列輸出重疊可能是有用的。在這種情況下,能夠停止向后追蹤功能。
[0033]當(dāng)追蹤功能逐幀向前或向后移動來追蹤人時,可以將追蹤功能設(shè)置為每η個幀再應(yīng)用面部檢測功能。數(shù)量η可以被設(shè)置為缺省值或由用戶手動設(shè)置。例如,如果η是15,那么追蹤功能每15個幀再應(yīng)用面部檢測功能。如果由面部檢測功能檢測的最后一個面部位于追蹤位置附近,那么其可以用于分析隨后的幀時的參照物。面部檢測功能的該再應(yīng)用能夠減少追蹤期間的漂移影響。面部檢測功能的再應(yīng)用還能夠用于檢測鏡頭內(nèi)的新面部。
[0034]在向后追蹤(408)過程和向前追蹤(410)過程已經(jīng)確定時間面部序列(412)以后,可以分析時間面部序列來確定最佳幀。在一些情況下,對特定時間面部序列(412)可以確定多個最佳幀。在一些情況下,可以找出單個最優(yōu)幀。如上面提到的,最佳幀是用于在面部聚類過程期間比較人的面部用途的、最佳地代表人的面部的幀。 [0035]多組標(biāo)準(zhǔn)可以用來選擇時間面部序列內(nèi)的最佳幀。最佳幀確定功能(414)可能考慮各種因素,如面部與相機的角度、眼睛定位和大小,以及面部的照明條件和面部/眼睛檢測置信值。例如,如果面部太小(即,占用少于200個像素),那么該面部不是關(guān)于最佳幀的好候選者。在一些情況下,時間面部序列內(nèi)找出的一組最佳幀可以包括具有不同姿態(tài)的高質(zhì)量面部圖像。
[0036]圖5是示出說明性面部聚類(500)的圖。如上面提到的,面部集群是已經(jīng)被識別為與同一人關(guān)聯(lián)的一組時間面部序列。與視頻面部聚類應(yīng)用關(guān)聯(lián)的面部聚類功能可以執(zhí)行將時間面部序列放到集群中的過程。在一個示例中,面部聚類功能可以是凝聚的聚類功能。下面的示例說明這種凝聚的聚類功能。然而,其它面部聚類功能可以與本文描述的時間面部序列原理結(jié)合使用。
[0037]在此示例中,存在總共七個面部,每個面部與時間面部序列關(guān)聯(lián)。面部被標(biāo)號有1-7。該聚合功能是迭代功能。對于每次迭代,將兩個最強的匹配組合在一起。
[0038]在第一次迭代(522)中,面部聚類功能確定一組面部內(nèi)任意兩個面部之間的最強相似性是面部I (502)和面部3 (506)。因此,將這兩個面部組合在一起。在第二次迭代(524)期間,確定面部2(504)和面部5(510)是最強的匹配。因此,將那兩個面部組合。
[0039]當(dāng)執(zhí)行隨后的迭代時,情況可能是:正被比較的集群中的一個或兩個集群包含一個以上的面部。例如,面部1 (502)和面部3(506)的組合可以與面部2(504)進行比較。在這樣的情況下,對兩個集群中的每對面部進行匹配,并且為每對生成相似性分?jǐn)?shù)。在一些情況下,最大得分的面部對能夠用來代表這兩個集群之間的分?jǐn)?shù)。在一些情況下,最小得分的面部對能夠用來代表這兩個集群之間的分?jǐn)?shù)。在一些情況下,全部面部對的平均分?jǐn)?shù)可以用來代表這兩個集群之間的分?jǐn)?shù)。在一些情況下,可以根據(jù)其它因素(如,面部姿態(tài))對相似性分?jǐn)?shù)進行加權(quán)。特別地,具有相似姿態(tài)的兩個面部可以被給予更大的權(quán)重。
[0040]返回參考圖5的示例,在第三次迭代(526)期間,確定之前組合的面部I (502)和面部3(506)的組與面部4(508)最匹配。因此,將面部4(508)填加到該組面部。在此情況下,第三次迭代(526)是最終迭代。如果這些面部或面部組中的任一面部或任一面部組與任何其它面部或面部組都不匹配(即,任何一對集群之間的相似性分?jǐn)?shù)低于預(yù)定閾值),則可以確定不需執(zhí)行進一步的迭代。
[0041]在此示例中,面部集群功能的最終結(jié)果是面部I (502)、面部3 (506)和面部4 (508)已經(jīng)被組在一起來形成面部集群1(516)。此外,面部2(504)和面部5(510)已經(jīng)被組在一起來形成面部集群2 (518)。面部6 (512)不與任何其它面部匹配,因此形成其自己的面部集群——面部集群3 (520)。
[0042]前面的示例是七個面部的簡化情況。實際的面部集群功能可以與數(shù)百個時間面部序列一起工作,以形成大的視頻集群。情況可能是:為了獲得全部及完整的列表,執(zhí)行數(shù)百次迭代。在一些情況下,用戶可以手動地挨個檢查面部集群,并且將應(yīng)該被匹配但未匹配的任意集群匹配在一起。
[0043]在一些示例中,面部集群功能可以在多個約束下操作。例如,如果兩個面部來自時間上重疊的時間面部序列,那么能夠有把握地確定那些面部不是同一人。這兩個面部可以被匹配為“不能鏈接”的對。然后,面部聚類功能可以在不能鏈接約束下操作。在使用來自單個時間面部序列的多個最佳幀時,那些面部能夠根據(jù)“必須鏈接”約束彼此相匹配。在集群過程開始時,面部聚類功能將來自同一時間面部序列的這樣的面部自動地組在一起。
[0044]圖6是示出用于使用時間面部序列化進行視頻面部聚類的說明性方法的流程。根據(jù)特定說明性示例,該方法包括:用物理計算系統(tǒng),分析(框602)視頻內(nèi)的鏡頭中的幀;用該物理計算系統(tǒng),對幀應(yīng)用(框604)面部檢測功能;用該物理計算系統(tǒng),響應(yīng)于在幀之一內(nèi)檢測到面部,貫穿該鏡頭中的幀向后和向前追蹤(框606)與該面部關(guān)聯(lián)的人;以及用該物理計算系統(tǒng),識別(框608)包括該鏡頭內(nèi)在該人顯現(xiàn)時涉及的幀的時間面部序列。
[0045]綜上所述,通過使用對人在鏡頭內(nèi)出現(xiàn)的全部時期段進行識別的時間面部序列,實現(xiàn)用于組織和編輯數(shù)字視頻的更有用工具。還可以對這樣的時間面部序列進行聚類。因此,視頻編輯或分析應(yīng)用的用戶可以快速地找出特定人出現(xiàn)的視頻內(nèi)片段。
[0046]提供前面的描述,僅為了說明和描述所描述的原理的示例。該描述不意圖是全面的或?qū)⑦@些原理限制于所公開的任何精確形式。根據(jù)上面的教導(dǎo),許多修改和改變是可能的。
【權(quán)利要求】
1.一種用于找出時間面部序列(412)的方法,所述方法包括: 用物理計算系統(tǒng)(100),分析視頻內(nèi)的鏡頭中的幀; 用所述物理計算系統(tǒng)(100),對所述幀應(yīng)用面部檢測功能(404); 用所述物理計算系統(tǒng),響應(yīng)于在所述幀之一內(nèi)檢測到面部,貫穿所述鏡頭中的幀向后和向前追蹤與所述面部關(guān)聯(lián)的人;以及 用所述物理計算系統(tǒng),識別包括所述鏡頭內(nèi)在所述人顯現(xiàn)時涉及的幀的時間面部序列(412)。
2.根據(jù)權(quán)利要求1所述的方法,進一步包括:用所述物理計算系統(tǒng)(100),確定所述時間面部序列(412)內(nèi)的最佳幀,所述最佳幀包括要被用于面部聚類的所述面部的最佳圖像。
3.根據(jù)權(quán)利要求2所述的方法,進一步包括:用所述物理計算系統(tǒng)(100),對來自所述視頻的多個鏡頭的多個時間面部序列(412)應(yīng)用面部聚類功能(500)。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述面部聚類功能(500)包括凝聚的面部聚類功倉泛。
5.根據(jù)權(quán)利要求3 所述的方法,其中,所述面部聚類功能(500)受制于以下至少之一:必須鏈接約束和不能鏈接約束。
6.根據(jù)權(quán)利要求1所述的方法,其中,追蹤所述人包括頭肩模型的使用。
7.根據(jù)權(quán)利要求1所述的方法,其中,追蹤所述人包括每設(shè)定數(shù)量的幀再應(yīng)用所述面部檢測功能(404)。
8.一種計算系統(tǒng)(100),包括: 至少一個處理器(108); 存儲器(102),能通信地聯(lián)接至所述至少一個處理器(108),所述存儲器(102)包括計算機可運行指令,所述計算機可運行指令在由所述至少一個處理器(108)運行時引起所述至少一個處理器(108): 分析視頻內(nèi)的鏡頭中的幀, 對所述幀應(yīng)用面部檢測功能(404), 響應(yīng)于在所述幀之一內(nèi)檢測到面部,貫穿所述鏡頭中的幀向后和向前追蹤與所述面部關(guān)聯(lián)的人,以及 識別包括所述鏡頭內(nèi)在所述人顯現(xiàn)時涉及的幀的時間面部序列(412)。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其中,所述計算機可讀程序代碼進一步包括計算機可運行指令,所述計算機可運行指令在被運行時引起所述處理器(108)確定所述時間面部序列(412)內(nèi)的最佳幀,所述最佳幀包括要被用于面部聚類的所述面部的最佳圖像。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述計算機可讀程序代碼進一步包括計算機可運行指令,所述計算機可運行指令在被運行時引起所述處理器(108)對來自所述視頻的多個鏡頭的多個時間面部序列(412)應(yīng)用面部聚類功能(500)。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述面部聚類功能(500)包括凝聚的面部聚類功能。
12.根據(jù)權(quán)利要求10所述的系統(tǒng),其中,所述面部聚類功能(500)受制于以下至少之一:必須鏈接約束和不能鏈接約束。
13.根據(jù)權(quán)利要求8所述的系統(tǒng),其中,追蹤所述人包括頭肩模型的使用。
14.根據(jù)權(quán)利要求8所述的系統(tǒng),其中,追蹤所述人包括每設(shè)定數(shù)量的幀再應(yīng)用所述面部檢測功能(404)。
15.一種用于視頻面部聚類的方法,所述方法包括: 用物理計算系統(tǒng)(100),對視頻內(nèi)的鏡頭的一系列幀應(yīng)用面部檢測功能(404); 用所述物理計算系統(tǒng),響應(yīng)于在所述幀之一內(nèi)檢測到面部,貫穿所述鏡頭中的幀向后和向前追蹤與所述面部關(guān)聯(lián)的人并且限定時間面部序列(412),所述時間面部序列(412)對所述人顯現(xiàn)的幀的子集進行識別; 用所述物理計算系統(tǒng)(100),確定所述時間面部序列內(nèi)的一組最佳幀,所述最佳幀包括要被用于面部聚類的所述面部的最佳圖像;以及 用所述物理計算系統(tǒng)(100),對來自所述視頻的多個鏡頭的多個時間面部序列(412)應(yīng)用面部聚類功 能(500)。
【文檔編號】G06K9/00GK104025117SQ201180074519
【公開日】2014年9月3日 申請日期:2011年10月31日 優(yōu)先權(quán)日:2011年10月31日
【發(fā)明者】張同, 文迪, 丁曉慶 申請人:惠普發(fā)展公司,有限責(zé)任合伙企業(yè)