專利名稱:動態(tài)狀態(tài)估計(jì)的制作方法
技術(shù)領(lǐng)域:
本公開涉及一種動態(tài)狀態(tài)估計(jì)。
背景技術(shù):
動態(tài)系統(tǒng)是指系統(tǒng)狀態(tài)隨時(shí)間而改變的系統(tǒng)。雖然狀態(tài)可以是表示系統(tǒng) 的特征的一組任意選擇的變量,但是狀態(tài)經(jīng)常包括感興趣的變量。例如,動 態(tài)系統(tǒng)可以被構(gòu)建為表示足球比賽視頻的特征,并且狀態(tài)可以被選擇為球的 位置。因?yàn)榍虻奈恢秒S時(shí)間而改變,所以該系統(tǒng)是動態(tài)的。估計(jì);f見頻的新幀 中該系統(tǒng)的狀態(tài)(即,球的位置)是感興趣的。
發(fā)明內(nèi)容
根據(jù)一實(shí)現(xiàn)方式,提供了用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位(location)的 一組粒子(particle)。應(yīng)用局部才莫式搜索機(jī)制(local-mode seeking mechanism ) 以移動該組粒子中的一個(gè)或多個(gè)粒子,并且修改該組粒子中的粒子的數(shù)目。 使用該組粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位。
在附圖和下面的描述中闡明了一個(gè)或多個(gè)實(shí)現(xiàn)方式的細(xì)節(jié)。例如,實(shí)現(xiàn) 方式可以被執(zhí)行為方法,或被實(shí)施為被配置來執(zhí)行一組操作的設(shè)備、或存儲 了用于執(zhí)行一組操作的指令的設(shè)備。結(jié)合附圖和權(quán)利要求來考慮以下詳細(xì)描 述,其他方面和特征將變得明顯。
圖1包括了狀態(tài)估計(jì)器的框圖。
6圖2包括了用于基于由圖1的狀態(tài)估計(jì)器估計(jì)的狀態(tài)來對數(shù)據(jù)進(jìn)行編碼 的系統(tǒng)的框圖。
圖3包括了用于基于由圖1的狀態(tài)估計(jì)器估計(jì)的狀態(tài)來處理數(shù)據(jù)的系統(tǒng) 的框圖。
圖4包括了示意地描繪了由圖1的狀態(tài)估計(jì)器的實(shí)現(xiàn)方式執(zhí)行的各種函 數(shù)的圖。
圖5包括了用于實(shí)現(xiàn)粒子濾波器的處理的流程圖。
圖6包括了用于實(shí)現(xiàn)圖5的粒子濾波器的處理并且進(jìn)一步包括局部模式
搜索機(jī)制的流程圖。
圖7包括了用于實(shí)現(xiàn)局部模式搜索機(jī)制的偽代碼列表。
圖8包括了用于實(shí)現(xiàn)圖6的粒子濾波器的處理并且進(jìn)一步包括庫爾貝克
-萊布勒距離(Kullback-Leibler-distance )采樣處理的流程圖。 圖9包括了描繪將粒子插入到KD樹的圖示。 圖10包括了用于使用粒子來估計(jì)系統(tǒng)狀態(tài)的處理的流程圖。
具體實(shí)施例方式
作為簡要介紹,具體實(shí)現(xiàn)方式提供了使用粒子濾波("PF")的動態(tài)狀態(tài) 估計(jì),對于該動態(tài)狀態(tài)估計(jì),使用基于均值偏移分析(mean-shift analysis) 的局部模式搜索算法來修改粒子的定位(每個(gè)粒子給出潛在的狀態(tài)候選,為 了簡單,該潛在的狀態(tài)候選在這里經(jīng)常被稱為粒子在狀態(tài)空間中的定位或位 置),并且使用庫爾貝克-萊布勒距離("KLD")采樣處理來調(diào)整粒子的數(shù)目。 均值偏移分析嘗試改善粒子的位置,并且由此減少PF經(jīng)常遭遇的退化 (degeneracy)問題。KLD采樣處理嘗試減少在PF中使用的粒子的數(shù)目,并 由此減少PF的計(jì)算復(fù)雜性,而沒有犧牲太多的PF估計(jì)能力的質(zhì)量。該實(shí)現(xiàn)
方式可用于應(yīng)對非線性和非高斯系統(tǒng)。
參考圖1,在一實(shí)現(xiàn)方式中,系統(tǒng)100包括例如可以在計(jì)算機(jī)上實(shí)現(xiàn) 的狀態(tài)估計(jì)器110。該狀態(tài)估計(jì)器110包括粒子算法模塊120、局部模式模 塊130、和數(shù)目適配器模塊140。粒子算法模塊120執(zhí)行用于估計(jì)動態(tài)系統(tǒng)狀 態(tài)的、基于粒子的算法(例如,PF)。局部模式模塊130例如通過對PF的粒 子執(zhí)行均值偏移分析來應(yīng)用局部模式搜索機(jī)制。數(shù)目適配器模塊140例如通 過將KLD采樣處理應(yīng)用于PF的粒子來修改在基于粒子的算法中使用的粒子的數(shù)目。將關(guān)于圖4-10來描述實(shí)現(xiàn)^t塊120-140的實(shí)現(xiàn)方式的搡作。例如, 可以單獨(dú)地實(shí)現(xiàn)模塊120-140,或者將模塊120-140集成到單一算法中。
狀態(tài)估計(jì)器110訪問作為輸入的初始狀態(tài)150和數(shù)據(jù)輸入160兩者,并 提供所估計(jì)的狀態(tài)170作為輸出。例如,可以通過初始狀態(tài)檢測器或通過人 工處理來確定初始狀態(tài)150。通過考慮以下系統(tǒng)來提供更具體的示例,對于 該系統(tǒng)來說,狀態(tài)是視頻中對象的定位。在這種系統(tǒng)中,例如可以通過使用 邊緣檢測和模板比較的自動對象檢測處理、或人工地通過用戶觀看該視頻, 來確定初始對象定位。例如,數(shù)據(jù)輸入160可以是一見頻畫面序列。例如,所 估計(jì)的狀態(tài)17 0可以是具體視頻畫面中球的位置的估計(jì)。
所估計(jì)的狀態(tài)170可以用于各種目的。為了提供進(jìn)一步的背景,使用圖 2和3來描述幾個(gè)應(yīng)用。
參考圖2,在一實(shí)現(xiàn)方式中,系統(tǒng)200包括耦合到傳送/存儲裝置220的 編碼器210。例如,可以在計(jì)算機(jī)或通信編碼器上實(shí)現(xiàn)編碼器210和傳送/存 儲裝置220。編碼器210訪問由圖1中的系統(tǒng)IOO的狀態(tài)估計(jì)器110提供的 所估計(jì)的狀態(tài)170,并且訪問由狀態(tài)估計(jì)器IIO使用的數(shù)據(jù)輸入160。編碼器 210根據(jù)各種編碼算法中的一種或多種來對數(shù)據(jù)輸入160進(jìn)行編碼,并向傳 送/存儲裝置220提供編碼后的數(shù)據(jù)輸出230。
此外,編碼器210使用所估計(jì)的狀態(tài)170來有差別地對數(shù)據(jù)輸入160的 不同部分進(jìn)行編碼。例如,如果狀態(tài)表示視頻中對象的位置,則編碼器210 可以使用第一編碼算法來對與所估計(jì)的位置相對應(yīng)的、視頻的部分進(jìn)行編碼, 并且可以使用第二編碼算法來對與所估計(jì)的位置不相對應(yīng)的、視頻的另一部 分進(jìn)行編碼。例如,第一算法可以比第二編碼算法提供更多的編碼冗余度, 使得將預(yù)期以比視頻的其他部分有更多的細(xì)節(jié)和更高的分辨率來再現(xiàn)該對象 的所估計(jì)的位置(并且可希望為對象本身)。
因而,例如,通常的低分辨率傳送可以為正被跟蹤的對象提供更高的分 辨率,例如這允許用戶更容易地觀看高爾夫球比賽中的高爾夫球。 一種如此 的實(shí)現(xiàn)方式允許用戶通過低帶寬(低數(shù)據(jù)速率)鏈路在移動裝置上觀看高爾 夫球比賽。移動裝置例如可以是蜂窩電話或個(gè)人數(shù)字助理。通過以低數(shù)據(jù)速 率來對高爾夫球比賽的視頻進(jìn)行編碼、但是使用附加比特來對高爾夫球進(jìn)行 編碼,而使數(shù)據(jù)速率保持為低。
傳送/存儲裝置220可以包括存儲裝置或傳送裝置中的一個(gè)或多個(gè)。相應(yīng)地,傳送/存儲裝置220訪問編碼后的數(shù)據(jù)230,并且傳送數(shù)據(jù)230或存儲數(shù) 據(jù)230。
參考圖3,在一實(shí)現(xiàn)方式中,系統(tǒng)300包括耦合到顯示器320的處理裝 置310。處理裝置310訪問由圖1中的系統(tǒng)100的狀態(tài)估計(jì)器110提供的所 估計(jì)的狀態(tài)170,并且訪問由狀態(tài)估計(jì)器IIO使用的數(shù)據(jù)輸入160。處理裝置 310使用所估計(jì)的狀態(tài)170來增強(qiáng)數(shù)據(jù)輸入160,并且提供增強(qiáng)后的數(shù)據(jù)輸出 330。顯示器320訪問增強(qiáng)后的數(shù)據(jù)輸出330,并且在顯示器320上顯示增強(qiáng) 后的數(shù)據(jù)。
各種實(shí)現(xiàn)方式例如通過突出對象來增強(qiáng)數(shù)據(jù)。 一種如此的實(shí)現(xiàn)方式通過 將球的顏色改變?yōu)轷r橙色來突出該球(對象)。另外,各種實(shí)現(xiàn)方式基于所估 計(jì)的對象位置來判斷是否增強(qiáng)數(shù)據(jù)。在一種如此的實(shí)現(xiàn)方式中,處理裝置310 使用所估計(jì)的足球位置來確定足球是否已經(jīng)進(jìn)入球門。如果足球已經(jīng)進(jìn)入球 門,則處理裝置310在視頻中插入詞語"進(jìn)球",以提醒正在收看足球比賽的 用戶。處理裝置310可以通過例如訪問關(guān)于足球相對于球場的位置的信息來 做出這樣的確定,并且例如可以從攝像機(jī)的已知位置和方位來確定這種信息。
例如,系統(tǒng)300的實(shí)現(xiàn)方式可以被定位在通信鏈路的傳送側(cè)或接收側(cè)。 在一實(shí)現(xiàn)方式中,系統(tǒng)300和狀態(tài)估計(jì)器IIO位于接收側(cè),并且在接收和解 碼數(shù)據(jù)后,對系統(tǒng)估計(jì)狀態(tài)。在另一實(shí)現(xiàn)方式中,系統(tǒng)300和狀態(tài)估計(jì)器110 處于傳送側(cè),在編碼和傳送之前增強(qiáng)數(shù)據(jù),并且為傳送側(cè)處的操作員提供增 強(qiáng)后的數(shù)據(jù)的顯示。在另一實(shí)現(xiàn)方式中,系統(tǒng)300處于接收側(cè),而狀態(tài)估計(jì) 器110處于傳送所估計(jì)的狀態(tài)170和數(shù)據(jù)輸入160的傳送側(cè)。如應(yīng)清楚的那 樣,處理裝置310可以被配置為編碼器210,而有差別地編碼后的數(shù)據(jù)為增 強(qiáng)后的數(shù)據(jù)。
參考圖4,圖400包括動態(tài)系統(tǒng)的狀態(tài)的概率分布函數(shù)410。圖400示意 地描繪了由狀態(tài)估計(jì)器110的實(shí)現(xiàn)方式執(zhí)行的各種函數(shù)。圖400表示級別A、 B、 C、和D中的每個(gè)級別處的一個(gè)或多個(gè)函數(shù)。
級別A描繪了通過PF生成四個(gè)粒子Al、 A2、 A3、和A4。為了方便, 單獨(dú)的垂直虛線指示了四個(gè)粒子Al、 A2、 A3、和A4中的每個(gè)粒子的概率分 布函數(shù)410的位置。
級別B描繪了通過基于均值偏移分析的局部模式搜索算法將四個(gè)粒子 A1-A4偏移到對應(yīng)粒子B1-B4。為了方便,實(shí)垂直線指示了四個(gè)粒子B1、 B2、
9B3、和B4中的每個(gè)粒子的概率分布函數(shù)410的位置。通過對應(yīng)箭頭MS1-MS4 圖示性地示出了粒子Al-A4中的每個(gè)的偏移,所述對應(yīng)箭頭MS1-MS4分別 指示了從由粒子Al-A4指示的位置到由粒子Bl-B4指示的位置的粒子移動。
級別C描繪了分別與粒子B2-B4具有相同位置的加權(quán)后的(weighted) 粒子C2-C4。粒子C2-C4具有變化的大小,所述變化的大小指示了已經(jīng)為PF 中的粒子B2-B4確定的加權(quán)。級別C還反映了根據(jù)KLD采樣處理減少了粒 子的凄t目,在該處理中粒子B1已經(jīng)凈皮丟棄。
級別D描繪了在重新采樣處理期間生成的三個(gè)新粒子。在級別D中生成 的粒子的數(shù)目與級別C中的粒子的數(shù)目相同,如箭頭R(R代表重新采樣) 所指示的那樣。
關(guān)于圖8來進(jìn)一步描述由級別A-D表示的每個(gè)處理。
參考圖5, —實(shí)現(xiàn)方式使用處理500來估計(jì)系統(tǒng)的狀態(tài)。雖然處理500 是被PF用來估計(jì)狀態(tài)的處理的示例,但是其他實(shí)現(xiàn)方式將不同地操作。雖然 在描述處理500之前提供PF的簡短綜述,但是讀者被指向關(guān)于PF的大量文 獻(xiàn)以尋求進(jìn)一步的細(xì)節(jié)。
PF提供了方便的貝葉斯(Bayesian)濾波架構(gòu),以用于與隱含分布 (underlying distribution)和給定系統(tǒng)無關(guān)地估計(jì)和擴(kuò)散(propagate )狀態(tài)變 量的密度(density )。由狀態(tài)空間中的粒子表示密度。 一般來說,將動態(tài)系統(tǒng) 用公式表述為
=g(^,),
其中,A表示狀態(tài)向量,Z,是測量向量,/和g是兩個(gè)向量求值函數(shù)(分別 為動態(tài)模型和測量模型),^和《分別表示處理(動態(tài))和測量噪聲。基于動 態(tài)系統(tǒng)的特性來確定動態(tài)模型和測量模型兩者。
PF提出用于根據(jù)噪聲測量Z,來遞歸地估計(jì)狀態(tài)A的方法。利用PF,通 過由加權(quán)后的粒子組成的離散隨機(jī)測量來近似狀態(tài)分布,其中所述粒子是來 自狀態(tài)空間的未知狀態(tài)的樣本,并且通過貝葉斯理論來計(jì)算粒子權(quán)重。通過 根據(jù)動態(tài)模型來擴(kuò)散每個(gè)粒子,從而描述粒子組的演化。
再次參考圖5,處理500包括訪問來自前一狀態(tài)的一組初始粒子和累積 權(quán)重因子510。累積權(quán)重因子可以從一組粒子權(quán)重生成,并且典型地允許更 快的處理。注意,在首次進(jìn)行處理500時(shí),前一狀態(tài)將為初始狀態(tài),并且將需要生成該組初始粒子和權(quán)重(累積權(quán)重因子)。例如,初始狀態(tài)可以被提供 為初始狀態(tài)150。
在515初始化循環(huán)控制變量"it",并且在確定當(dāng)前狀態(tài)之前重復(fù)地執(zhí)行 循環(huán)520。循環(huán)520使用循環(huán)控制變量"it",并且執(zhí)行"迭代"次數(shù)。在循 環(huán)520內(nèi),在循環(huán)525中單獨(dú)地對待該組初始粒子中的每個(gè)粒子。在一個(gè)實(shí) 現(xiàn)方式中,將PF應(yīng)用到網(wǎng)球比賽的視頻中以用于跟蹤網(wǎng)球,并且對于每個(gè)新 幀執(zhí)行預(yù)定次(循環(huán)迭代變量"迭代"的值)循環(huán)520。預(yù)期循環(huán)520的每 次迭代都改善粒子的位置,使得當(dāng)對于每幀估計(jì)網(wǎng)球的位置時(shí),假定該估計(jì) 是基于良好粒子的。
循環(huán)525包括基于累積權(quán)重因子來選擇粒子530。如已知的那樣,這是 一種用于選擇具有最大權(quán)重的剩余粒子定位的方法。注意,許多粒子可以處 于相同的定位,在該情況下對于每個(gè)定位典型地僅需要執(zhí)行循環(huán)525 —次。 循環(huán)525然后包括通過對于所選擇的粒子預(yù)測在狀態(tài)空間中的新位置來更新 粒子535。該預(yù)測使用PF的動態(tài)模型。
循環(huán)525然后包括使用PF的測量模型來確定所更新的粒子的權(quán)重540。 如已知的那樣,確定權(quán)重包括分析所觀察/測量的數(shù)據(jù)(例如,當(dāng)前幀中的視 頻數(shù)據(jù))。繼續(xù)網(wǎng)球比賽實(shí)現(xiàn)方式,將由粒子指示的定位處的、來自當(dāng)前幀的 數(shù)據(jù)與來自網(wǎng)球的最后定位的數(shù)據(jù)進(jìn)行比較。該比較可以包括例如分析色彩 直方圖或執(zhí)行邊緣檢測。為粒子確定的權(quán)重基于該比較的結(jié)果。操作540還 包括對于粒子位置確定累積權(quán)重因子。
循環(huán)525然后包括確定是否有更多的粒子要處理542。如果有更多的粒 子要處理,則重復(fù)循環(huán)525,并且處理500跳到操作530。在對初始(或"從 前的(old)")粒子組中的每個(gè)粒子執(zhí)行了循環(huán)525之后,已生成了一組完整 的更新后的粒子。
循環(huán)525然后包括使用重新采樣算法來生成"新的"粒子組和新累積權(quán) 重因子545。重新采樣算法基于粒子的權(quán)重,因而集中于具有較大權(quán)重的粒 子。雖然重新采樣算法產(chǎn)生每個(gè)粒子具有相同的各自權(quán)重的一組粒子,但某 些定位典型地具有位于那些定位的許多粒子。因而,粒子定位典型地具有不 同的累積權(quán)重因子。
重新采樣典型地還有助于減少在PF中常見的退化問題。存在用于重新 采樣的許多方式,諸如,多項(xiàng)式(multinomial )、殘余(residual )、分層(stratified )、
ii和系統(tǒng)重新采樣。 一實(shí)現(xiàn)方式使用殘余重新采樣,這是因?yàn)闅堄嘀匦虏蓸訉?于粒子順序不敏感。
通過遞增循環(huán)控制變量"it" 550并且將"it"與迭代變量"迭代"進(jìn)行 比較555,來繼續(xù)循環(huán)520。如果需要進(jìn)行循環(huán)520的另一迭代,則使得新粒 子組和其累積權(quán)重因子可用560。
在將循環(huán)520執(zhí)行了 "迭代"次之后,預(yù)期粒子組為"良好"粒子組, 并且確定當(dāng)前狀態(tài)565。如已知的那樣,通過對新粒子組中的粒子求平均來 確定新狀態(tài)。
參考圖6, 一實(shí)現(xiàn)方式使用處理600來估計(jì)系統(tǒng)狀態(tài)。處理600是將PF 與基于均值偏移分析的局部模式搜索算法組合的處理的示例,但是其他實(shí)現(xiàn) 方式將不同地操作。雖然在下面結(jié)合圖7來提供局部模式搜索算法和均值偏 移分析的簡要描述,但是讀者被指向關(guān)于使用均值偏移分析的局部模式搜索 的大量文獻(xiàn)以尋求進(jìn)一步的細(xì)節(jié)。
均值偏移算法是用于分析復(fù)雜的多模態(tài)狀態(tài)空間并且用于在狀態(tài)空間中 繪制(delineate)任意形狀的聚類(cluster)的一般非參數(shù)技術(shù)。均值偏移算 法提供了用于克服在PF中常見的退化問題的范例。
再次參考圖6,處理600包括許多與處理500相同的操作,并且將不在 處理600的描述中進(jìn)一步描述所述重復(fù)操作。然而,處理600包括使用均值 偏移分析來執(zhí)行局部模式搜索算法610的附加操作。處理600還包括循環(huán)620 和循環(huán)625,循環(huán)620和625除了進(jìn)一步包括執(zhí)行局部模式搜索算法610之 外分別與循環(huán)520和525相同。局部模式搜索算法基于梯度原理進(jìn)行操作, 并且沿著梯度有可能迭代地將給定粒子移動到局部最大值。這種移動產(chǎn)生了 基于測量數(shù)據(jù)修改的粒子,并且該修改可改善系統(tǒng)狀態(tài)的預(yù)測。
在算法中引用的"局部模式,,是為給定粒子定位確定的值。例如,可以 基于所測量或觀察的數(shù)據(jù)來計(jì)算"局部模式"。
參考圖7,偽代碼列表700提供了用于使用均值偏移分析來執(zhí)行局部模 式搜索算法的處理的示例。在偽代碼列表700中
陽f。表示粒子的當(dāng)前位置,
-A表示粒子的下一位置,
-i表示給定粒子的前一位置處的局部模式,其中"u"是局部模式的面 元(bin)索引,-A表示當(dāng)前粒子位置處的局部模式,以及
-p表示Bhattacharyya (巴塔卡亞)系數(shù)("B系數(shù)")。 通過假設(shè)粒子前一位置處的局部模式可用705,而開始偽代碼列表700, 并且該局部模式是指在前一時(shí)間處估計(jì)的測量空間中的狀態(tài)模式。然后,偽 代碼列表700在逐粒子的基礎(chǔ)上前進(jìn)710。對于每一粒子,偽代碼列表700 確定當(dāng)前位置處的局部模式,其中該局部模式是指似然分布中的局部最大值, 并且然后確定與所述局部模式相關(guān)聯(lián)的B系數(shù)720。
偽代碼列表700然后確定均值偏移權(quán)重(不同于粒子濾波架構(gòu)中的粒子 權(quán)重),以用于偏移粒子730。偽代碼列表700然后確定粒子的下一位置740, 計(jì)算下一位置處粒子的局部模式750,并且計(jì)算與下一局部模式相關(guān)聯(lián)的B 系數(shù)750。
偽代碼列表700然后比較當(dāng)前B系數(shù)與下一B系數(shù)760。如果下一B系 數(shù)等于或大于當(dāng)前B系數(shù),則列表700前進(jìn)以確定是否需要更多的迭代770。 該確定基于位置的改變是否大于閾值(epsilon (小的正數(shù)))。只要位置的改 變大于閾值就執(zhí)行附加的迭代770。
如果下一B系數(shù)小于當(dāng)前B系數(shù),則通過因子二來減少位置的改變,直 到下一B系數(shù)不小于當(dāng)前B系數(shù)為止760。然后,評估位置的改變以確定是 否要執(zhí)行另一迭代770。
參考圖8, —實(shí)現(xiàn)方式使用處理800來估計(jì)系統(tǒng)狀態(tài)。雖然處理800是 將PF與(1 )基于均值偏移分析的局部模式搜索算法、和(2) KLD采樣處 理兩者組合的處理的示例,但是其他實(shí)現(xiàn)方式將不同地操作。雖然在下面結(jié) 合圖8-9來提供包括KD樹的KLD采樣處理的筒要描述,但是讀者被指向關(guān) 于KLD釆樣處理和KD樹的大量文獻(xiàn)以尋求進(jìn)一步的細(xì)節(jié)。
KLD采樣處理是一種用于通過在狀態(tài)估計(jì)處理期間適配粒子組的大小 來增加PF效率的統(tǒng)計(jì)方法。關(guān)鍵思想在于綁定(bind)由PF的基于樣本 的表示引入的近似誤差。因而,如果密度集中在狀態(tài)空間中的一小部分上, 則PF可以選擇較少量的樣本,而如果狀態(tài)不確定性高,則選擇較大量的樣本。
在處理800中描述并使用的KLD采樣處理基于KD樹結(jié)構(gòu),其中e(epsilon) 是誤差邊界(error bound ), 1 - 3是KLD 'J、于"epsilon)的概率,而是標(biāo)準(zhǔn)正 態(tài)分布的上面的(l-c5)分位數(shù)(quantile)。 1-<5和Zl—,兩者可從正態(tài)分布的標(biāo)準(zhǔn) 統(tǒng)計(jì)表格中得到。通常,U在KLD采樣處理中是固定的,而"epsilon)可在逐情況的基礎(chǔ)上調(diào)整。
KD樹是用于存儲有限的k維數(shù)據(jù)點(diǎn)組的二叉樹。KD樹的目的在于分 級地將空間分解為相對少量的單元(面元),使得沒有單元包含太多的輸入數(shù) 據(jù)點(diǎn)。在處理800中,KD樹結(jié)構(gòu)用于計(jì)算用于KLD采樣的面元的數(shù)目(等 于KD樹的大小)。
通過使用KLD采樣處理,該實(shí)現(xiàn)方式避免了具有固定數(shù)目的粒子。這典
并且這導(dǎo)致了較低的計(jì)算復(fù)雜性。另外,該適配性可允許該實(shí)現(xiàn)方式在需要 增加粒子的數(shù)目的某些情況下增加粒子的數(shù)目。另一方面,如果需要額外的 粒子,則沒有足夠粒子的非適配系統(tǒng)將被預(yù)期為無法估計(jì)狀態(tài)。例如,對象 跟蹤器將無法跟蹤對象。因而,該實(shí)現(xiàn)方式的適配性允許了 PF適配于所估計(jì) 的狀態(tài)空間的特性,并且在解決復(fù)雜動態(tài)系統(tǒng)中的非線性和非高斯問題上變 得更為有效。
再次參考圖8,處理800包括許多與處理600的操作相同的操作,并且 在處理800的描述中將不再進(jìn)一步描述所述重復(fù)處理。然而,處理800包括 在下面描述的多個(gè)額外操作。
處理800包括訪問來自前一狀態(tài)的一組初始粒子和累積;f又重因子810, 以及訪問例如可由用戶提供的誤差邊界和面元大小810。初始化循環(huán)控制變 量"it"和粒子計(jì)數(shù)器"n",并且復(fù)位KD樹815。
在確定當(dāng)前狀態(tài)之前,重復(fù)地執(zhí)行循環(huán)820。循環(huán)820使用循環(huán)控制變 量"it",并且t丸行"迭代"次。在循環(huán)820內(nèi),在循環(huán)825中單獨(dú)地對待該 組初始粒子中的粒子。循環(huán)820和825分別與循環(huán)620和625相似,但具有 用于提供KLD采樣處理的修改。
循環(huán)825包括將所選擇的粒子插入到KD樹中830,遞增"n" 840,并 且確定KD樹的當(dāng)前大小k840。在圖9中圖示了將粒子插入到KD樹中和確 定KD樹的大小的操作。
參考圖9,圖示900描繪了將七個(gè)二維粒子插入到KD樹中。圖示900 包括示出了具有0和0.99之間的歸一化值、并且具有量化值的七個(gè)粒子的表 格910。通過將歸一化值乘以面元的數(shù)目并且舍棄(truncate)小數(shù),或等效 地通過將歸一化值除以面元的大小并且舍棄小數(shù),來確定量化值。所期望的 面元的數(shù)目為5,其與0.2的面元大小(fli殳相等大小的面元)相對應(yīng)。例如,舍五入(round up or round down),而不是舍棄。
該圖示900還包括其中已經(jīng)插入了七個(gè)量化粒子的KD樹920。在插入 處理期間,按順序來取得量化粒子。第一量化粒子被分配到KD樹920的根 節(jié)點(diǎn)。要插入的每個(gè)其他量化粒子將其x坐標(biāo)與根節(jié)點(diǎn)粒子(3, 4)的x坐 標(biāo)相比較?;谠摫容^,(1)如果隨后的量化粒子的x坐標(biāo)小于3,則其將 到樹中的左邊;(2)如果隨后的量化粒子的x坐標(biāo)大于3,則其將到樹中的 右邊,或者(3)如果隨后的量化粒子的x坐標(biāo)等于3,則其將被丟棄。因而, 在嘗試插入剩余量化粒子時(shí),以下事件發(fā)生
-第二量化粒子(0, 1)到根節(jié)點(diǎn)的左邊并且被分配到節(jié)點(diǎn)A,這是因 為0小于3。
-第三量化粒子(3, 1)在根節(jié)點(diǎn)處被丟棄,這是因?yàn)閤坐標(biāo)為3。盡 管丟棄了第三量化粒子,但是我們認(rèn)為第三量化粒子已被插入到KD樹中。
-第四量化粒子(1, 3)到根節(jié)點(diǎn)的左邊,這是因?yàn)?小于3。因?yàn)閮H 將一個(gè)粒子分配到任何給定節(jié)點(diǎn),所以現(xiàn)在在節(jié)點(diǎn)A處必須將第四量化粒子 與第二量化粒子(O, l)進(jìn)行比較。在樹中的節(jié)點(diǎn)A級別處,比較發(fā)生在y 坐標(biāo)上。因此,由于3大于1,所以第四量化粒子到節(jié)點(diǎn)A的右邊,并被分 配到節(jié)點(diǎn)C。將關(guān)于x坐標(biāo)來進(jìn)行與節(jié)點(diǎn)C以及樹中該級別處的任何其他節(jié) 點(diǎn)的比較。在KD樹920中,將與節(jié)點(diǎn)相關(guān)聯(lián)的粒子示出為具有一個(gè)被添加 有下劃線的坐標(biāo),以指示在所述節(jié)點(diǎn)處被比較的坐標(biāo)。例如,在根節(jié)點(diǎn)處在 粒子(3, 4)中對3添加下劃線。
-第五量化粒子(4, 2)到根節(jié)點(diǎn)的右邊并且被分配到節(jié)點(diǎn)B,這是因 為4大于3。
-第六量化粒子(2, 2)到根節(jié)點(diǎn)的左邊,這是因?yàn)?小于3;到節(jié)點(diǎn)A 的右邊,這是因?yàn)?大于1;并且到節(jié)點(diǎn)C的右邊并且被分配到節(jié)點(diǎn)D,這 是因?yàn)?大于1。
-第七量化粒子(l, 3)到根節(jié)點(diǎn)的左邊,這是因?yàn)?小于3;到節(jié)點(diǎn)A 的右邊,這是因?yàn)?大于1;并且在節(jié)點(diǎn)C處被丟棄,這是因?yàn)閘等于l。
樹的大小k等于節(jié)點(diǎn)的數(shù)目。KD樹的節(jié)點(diǎn)是根節(jié)點(diǎn)和節(jié)點(diǎn)A-D。因而, k = 5。
其他實(shí)現(xiàn)方式將多個(gè)粒子與給定節(jié)點(diǎn)相關(guān)聯(lián),而不是丟棄所述粒子。 循環(huán)825還包括使用已知等式來估計(jì)獲取誤差邊界(epsilon)所需要的
15粒子的數(shù)目850。該估計(jì)Na取決于樹的大小k。如果k^,則假設(shè)Na-2。當(dāng) k>l時(shí),使用在操作850中所示的等式來確定Na。循環(huán)825然后在操作860 中分析"n",以確定(1) "n,,是否小于Ps,所述Ps是在循環(huán)825中要處理 的粒子的最小數(shù)目;以及(2) "n"是否小于Na和Pr中的最小值,其中Pr 是在循環(huán)825中要處理的粒子的最大數(shù)目。如果"n"小于Ps或者上面的最 小值,則對于另一粒子重復(fù)循環(huán)825。當(dāng)"n"足夠大時(shí),如由判斷操作860 所確定的,處理800退出循環(huán)825,并且進(jìn)行圖8所示的并且已經(jīng)被描述過 的剩余操作。
再次參考圖4,可看出,處理800包括用于在級別A-D中的每個(gè)級別處 生成粒子的操作。例如,處理800至少包括(1)用于生成圖400的級另'J A 處的粒子Al-A4的操作810和545; ( 2 )用于將粒子Al-A4偏移到級別B處 的粒子Bl-B4的位置的局部模式搜索操作610; ( 3 )用于確定粒子B2-B4的 權(quán)重的、得出級別C處的粒子C2-C4的權(quán)重計(jì)算操作540; (4)用于減少粒 子數(shù)目的、導(dǎo)致在級別C處丟棄粒子Bl的循環(huán)825;以及(5 )用于在級別 D處生成重新采樣的粒子的重新采樣操作545。
參考圖10,基于粒子的算法的一實(shí)現(xiàn)方式實(shí)現(xiàn)了用于使用粒子來估計(jì)系 統(tǒng)狀態(tài)的處理1000。處理1000包括提供用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的 一組粒子1010,其可以通過例如操作810和545之一來實(shí)現(xiàn)。應(yīng)用局部模式 搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子1020,其可以通過例如局部模 式搜索操作610來實(shí)現(xiàn)。修改該組粒子中的粒子的數(shù)目1030,其可以通過例 如才喿作830、 840、 850、和860的組合來實(shí)現(xiàn)。使用該組粒子中的粒子來估 計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位1040,其可以通過例如求平均操作565來實(shí)現(xiàn)。處 理1000在各方面類似于處理800,并且省略了處理800中的許多操作,清楚 地示出了那些操作的可選擇性。實(shí)際上,處理1000中的許多操作也是可選的。
此外,處理IOOO是沒有說明使用PF、均值偏移分析、或KLD采樣處理 的廣泛處理。相反地,處理IOOO需要粒子(1010 )、局部模式搜索機(jī)制(1020)、 以及粒子數(shù)目的修改(1030)。除了 PF之外的基于粒子的算法包括例如蒙特 卡洛(Monte Carlo)方法。局部模式搜索機(jī)制可基于除了均值偏移分析之外 的分析,例如,考慮了源自測量的邊緣或梯度信息而不是(色彩)直方圖信 息。除了KLD采樣處理之外,用于修改粒子數(shù)目的算法包括例如對權(quán)重之和 設(shè)定閾值的算法。清楚地,可以通過使用PF、使用均值偏移分析執(zhí)行局部模式搜索機(jī)制、
并且使用KLD釆樣處理修改粒子數(shù)目的實(shí)現(xiàn)方式,來執(zhí)行處理1000。
各種實(shí)現(xiàn)方式還使用包括多個(gè)運(yùn)動模型(例如,隨機(jī)行走(walk)模型
和自回歸("AR")模型)的組合的PF的動態(tài)模型。PF的若干種如此實(shí)現(xiàn)方
式包括以下動態(tài)模型,所述動態(tài)模型在PF的給定迭代處(l)使用第一運(yùn)動
模型來更新第 一部分的粒子,并且(2 )使用與第 一運(yùn)動模型不同的第二運(yùn)動
模型來更新第二部分的粒子。在用于跟蹤視頻中的對象的一具體實(shí)現(xiàn)方式中,
第一運(yùn)動模型是隨機(jī)行走模型,而第二運(yùn)動模型是二階AR模型。該具體的
對象跟蹤實(shí)現(xiàn)方式通過修改操作535使得交替所述兩個(gè)運(yùn)動模型,來使用處
理500。例如,可以通過對于奇數(shù)粒子使用隨機(jī)行走模型而對于偶數(shù)粒子使
用二階AR模型來提供這種交替。
通過使用包括多個(gè)運(yùn)動模型的動態(tài)模型,PF可以提供具有增加的分集性
(added diversity)的一組粒子,并且因此可以產(chǎn)生對當(dāng)前狀態(tài)的更好估計(jì)。
另外,使用多個(gè)運(yùn)動模型可以提供更靈敏(agile)的狀態(tài)估計(jì),包括更靈敏
的對象跟蹤。因?yàn)榭赡馨l(fā)生通過單一模型沒有很好地建模的狀態(tài)改變,所以
可能出現(xiàn)增加的靈敏性。例如,非預(yù)期的狀態(tài)改變(例如,籃球在籃板上沿
上的非預(yù)期反彈)可能呈現(xiàn)不符合所述狀態(tài)的運(yùn)動模型的行為。
各種實(shí)現(xiàn)方式還在測量模型中使用多種類型的數(shù)據(jù)。相應(yīng)地,在各種PF
實(shí)現(xiàn)方式中,多種類型的數(shù)據(jù)被用于在處理500的操作540中計(jì)算粒子權(quán)重。
在一個(gè)用于跟蹤視頻中的對象的這種PF中,多種類型的數(shù)據(jù)包括色彩直方圖
數(shù)據(jù)和梯度數(shù)據(jù)(例如,邊界(boundary)和邊緣(edge))。將粒子位置處的
當(dāng)前視頻畫面(或幀)的色彩直方圖與系統(tǒng)前一狀態(tài)的色彩直方圖進(jìn)行比較。
此外,從粒子位置處的當(dāng)前視頻畫面收集梯度數(shù)據(jù),并且分析所述梯度數(shù)據(jù)
來確定例如球的部分是否看起來處于所述粒子位置處??紤]色彩直方圖數(shù)據(jù)
和梯度數(shù)據(jù)兩者可以被稱為融合多個(gè)線索(cue)。
可以在各實(shí)現(xiàn)方式中組合多個(gè)運(yùn)動模型和融合多個(gè)線索。例如,對象跟
蹤實(shí)現(xiàn)方式可以組合這些特征,如下所述。
在一實(shí)現(xiàn)方式中,"從前的"粒子的初始分布為白高斯或均勻分布。初始 粒子權(quán)重被設(shè)置為相等。動態(tài)模型取決于對象狀態(tài)向量
Z = (X,少,i,少,W,/ ,^,/2),
其中,分別地,(x,力是對象窗口中心,(Jt,i0是其速度,(w,/z)是窗口大小,而(A力)是窗口縮放(scaling)速度。為了使得跟蹤器更加適合于靈敏的運(yùn)動, 將粒子劃分為兩群。第一群中的粒子利用"隨機(jī)行走"模型擴(kuò)散,而通過二 階AR模型來偏移(drift)第二群中的粒子。
在對于每個(gè)粒子的均值偏移分析中,窗口大小不改變。所以僅對部分狀 態(tài)向量應(yīng)用均值偏移迭代(即,盡管假設(shè)狀態(tài)包括窗口大小和窗口位置兩者, 但僅更新窗口位置),而通過對象色彩直方圖來用公式表示測量空間中的局部 模式。
測量模型是色彩和邊緣信息的兩個(gè)對象線索的組合。由于運(yùn)動模糊
(motion blur)和混亂背景情況中的色彩特征的魯棒性,所以給予色彩特征較
高的優(yōu)先級。兩個(gè)特征的似然(粒子權(quán)重)為
/^,)=尸柳,)尸(豐), 其中,z'={Z/,Zf},假設(shè)色彩測量z,。和邊緣測量z;獨(dú)立。
色彩直方圖用于對對象的出現(xiàn)進(jìn)行建模。其距離度量是等于1 - M》(夕。),4] 的Bhattacharyya距離,其中/7[》0)0),《]是Bhattacharyya系數(shù),所以色彩測量似 然是
f(Z,c|Z,) = ^^exp(—^%)。
如現(xiàn)在更詳細(xì)地解釋的,邊緣似然來自由對象狀態(tài)定義的橢圓周圍的邊 緣信息。對象形狀(例如,對象可以是球、眼睛、頭、手)被近似地建模為 由矩形窗口緊緊包圍的橢圓,所述矩形窗口可以由對象狀態(tài)向量來確定。通
過沿著K個(gè)均勻采樣的橢圓點(diǎn)(例如,〖=48 )上的每條橢圓法線的邊緣檢 測,來獲得源自該橢圓的測量。沿著每條法線,基于Sobel/Canny (索貝爾/ Canny)算子而找到具有最大邊緣亮度(intensity)的像素。記錄其在所述法 線上與橢圓點(diǎn)的距離。因?yàn)樗鼈兊木禐椤?2,,/尺,所以通過下式來計(jì)算 邊緣似然
P(Z/|z() = ^^exp(-^4)。
各實(shí)現(xiàn)方式可以很好地適用于運(yùn)動(sport)視頻中的對象跟蹤。然而, 所公開的構(gòu)思和實(shí)現(xiàn)方式可能應(yīng)用于動態(tài)系統(tǒng)中的各種狀態(tài)估計(jì)問題,所述 應(yīng)用例如包括自動目標(biāo)識別、跟蹤、無線通信、導(dǎo)航(guidance )、噪聲消 除、和金融建模。具體來說,作為非線性和/或非高斯的(例如,具有多模態(tài)
18分布的)系統(tǒng)可以受益于所公開的構(gòu)思和實(shí)現(xiàn)方式。
例如,可以單獨(dú)地、或在包括電路或其他組件的集成硬件單元中實(shí)現(xiàn)模
塊120-140。另外,可以在被配置為執(zhí)行用于執(zhí)行模塊120-140中的一個(gè)或多 個(gè)的操作的指令序列的處理裝置上實(shí)現(xiàn)模塊120-140。類似地,可以至少部分 地在被配置為執(zhí)行用于執(zhí)行所述組件的操作的指令序列的處理裝置上實(shí)現(xiàn)編 碼器210、傳送/存儲裝置220、和處理裝置230。可以在處理裝置或另一存儲 裝置中存儲這些指令。
如在該應(yīng)用中所使用的,"耦合"包括沒有中間元件的直接耦合、和通過 一個(gè)或多個(gè)中間元件的間接耦合。相應(yīng)地,如果串聯(lián)連接一組裝置D1-D4, 則D1和D4是耦合的,即使插入了裝置D2和D3。
可以在各種不同裝備(equipment)或應(yīng)用(具體地,例如,與視頻傳送 相關(guān)聯(lián)的裝備或應(yīng)用)中實(shí)施在這里描述的各種處理和特征的實(shí)現(xiàn)方式。裝 備的示例包括視頻編碼器、視頻解碼器、視頻編解碼器、網(wǎng)絡(luò)服務(wù)器、蜂 窩電話、便攜式數(shù)字助理("PDA")、機(jī)頂盒、筆記本、以及個(gè)人計(jì)算機(jī)。如 根據(jù)這些示例應(yīng)清楚的,可在例如包括無線或有線通路、因特網(wǎng)、電纜電視 線、電話線、和以太網(wǎng)連接之類的各種通路上發(fā)送編碼。另外,如應(yīng)清楚的, 該裝備可以是移動的,并且甚至可以安裝在移動交通工具中。
盡管上面描述沒有參考一具體方式或僅使用一方式,但是可以以各種方 式中的一種或多種來實(shí)現(xiàn)各種方面、實(shí)現(xiàn)方式和特征。例如,可以使用例如 以下方式的一種或多種來實(shí)現(xiàn)各種方面、實(shí)現(xiàn)方式和特征,所述方式為(1) 方法(也稱為處理)、(2)設(shè)備、(3)用于執(zhí)行方法的設(shè)備或處理裝置、(4) 用于執(zhí)行一種或多種方法的程序或另一組指令、(5)包括程序或一組指令的 設(shè)備、以及(6)處理器可讀介質(zhì)。
諸如狀態(tài)估計(jì)器110、編碼器210、傳送/存儲裝置220、以及處理裝置 310的組件或設(shè)備可以包括例如分立的或集成的硬件、固件、和/或軟件。作 為一示例,組件或設(shè)備例如可包括例如處理器,所述處理器是指包括例如微 處理器、集成電路、或可編程邏輯器件的一般的處理裝置。作為另一示例, 設(shè)備可以包括具有用于實(shí)施一個(gè)或多個(gè)處理的指令的一個(gè)或多個(gè)處理器可讀 介質(zhì)。
處理器可讀介質(zhì)可以包括例如軟件載體或諸如硬盤、致密盤、隨機(jī)存取 存儲器("RAM,,)、或只讀存儲器("ROM")的其他存儲裝置。處理器可讀
19介質(zhì)還可以包括例如用于編碼或傳送指令的已被安排格式(formatted)的電 磁波。指令可以位于例如硬件、固件、軟件、或電;茲波中。例如可以在操作 系統(tǒng)、單個(gè)應(yīng)用程序、或所述兩者的組合中找到指令。因此,例如可以將處 理器的特性表示為被配置為實(shí)施處理的裝置、和包括了具有用于實(shí)施處理的 指令的處理器可讀介質(zhì)的裝置。
已經(jīng)描述了多個(gè)實(shí)現(xiàn)方式。不過,將理解可以做出各種修改。例如,可 以組合、補(bǔ)充、修改、或去除不同實(shí)現(xiàn)方式的元件以產(chǎn)生其他實(shí)現(xiàn)方式。另 外,本領(lǐng)域的普通技術(shù)人員將理解其他結(jié)構(gòu)和處理可以替換那些所公開的
本相同的功能,以便實(shí)現(xiàn)與所公開的實(shí)現(xiàn)方式至少基本相同的結(jié)果。相應(yīng)地, 通過該應(yīng)用來設(shè)想這些和其他實(shí)現(xiàn)方式,并且所述實(shí)現(xiàn)方式在以下權(quán)利要求 的范圍內(nèi)。
權(quán)利要求
1. 一種方法,包括提供用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的一組粒子(1010);應(yīng)用局部模式搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子(1020);修改該組粒子中的粒子的數(shù)目(1030);以及使用該組粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位(1040)。
2. 如權(quán)利要求l所述的方法,其中,該基于粒子的算法包括粒子濾波算法。
3. 如權(quán)利要求l所述的方法,其中,該局部模式搜索機(jī)制包括均值偏移 分析處理。
4. 如權(quán)利要求l所述的方法,其中,適配粒子的數(shù)目包括使用庫爾貝克 -萊布勒距離("KLD")采樣處理。
5. 如權(quán)利要求4所述的方法,進(jìn)一步包括使用KD樹結(jié)構(gòu)來估計(jì)KLD 釆樣處理中的面元的數(shù)目。
6. 如權(quán)利要求5所述的方法,其中,使用KD樹結(jié)構(gòu)包括將粒子插入到 KD樹中,所述粒子包括尺寸,并且將粒子插入包括量化給定粒子的尺寸,以產(chǎn)生給定粒子的量化值,通過將給定粒子與KD樹中的節(jié)點(diǎn)相關(guān)聯(lián)來將給定粒子插入KD樹中,量化不同粒子的尺寸,以產(chǎn)生不同粒子的量化值,將給定粒子的量化值與該不同粒子的量化值進(jìn)行比較,以及基于將兩個(gè)量化值進(jìn)行比較的結(jié)果來確定是否丟棄該不同粒子。
7. 如權(quán)利要求6所述的方法,其中,確定是否丟棄該不同粒子包括如 果該不同粒子的量化值與該給定粒子的量化值相同,則丟棄該不同粒子。
8. 如權(quán)利要求l所述的方法,其中 基于粒子的算法包括粒子濾波算法,該機(jī)制包括均值偏移分析處理,以及適配粒子的數(shù)目包括使用庫爾貝克-萊布勒距離("KLD")采樣處理。
9. 如權(quán)利要求l所述的方法,其中,在應(yīng)用該機(jī)制以移動粒子之后,進(jìn) 行適配粒子的數(shù)目。
10. 如權(quán)利要求l所述的方法,其中基于粒子的算法包括粒子濾波算法,以及 使用多種類型的數(shù)據(jù)來計(jì)算粒子權(quán)重。
11. 如權(quán)利要求IO所述的方法,其中 將該粒子濾波算法用于跟蹤視頻中的對象,以及 該多種類型的數(shù)據(jù)包括色彩直方圖數(shù)據(jù)和梯度數(shù)據(jù)。
12. 如權(quán)利要求l所述的方法,其中 該基于粒子的算法包括粒子濾波算法,以及該粒子濾波算法包括動態(tài)模型,在該粒子濾波算法的給定迭代處,所述 動態(tài)模型(1)使用第一運(yùn)動模型來更新第一部分的粒子,并且(2)使用與 第一運(yùn)動模型不同的第二運(yùn)動模型來更新第二部分的粒子。
13. 如權(quán)利要求12所述的方法,其中 將該粒子濾波算法用于跟蹤視頻中的對象, 該第一運(yùn)動模型包括隨機(jī)行走模型,以及 該第二運(yùn)動模型包括二階自回歸模型。
14. 如權(quán)利要求l所述的方法,其中,該基于粒子的算法使用數(shù)據(jù)的測量。
15. 如權(quán)利要求l所述的方法,其中,將該基于粒子的算法用于跟蹤視 頻中的對象,該動態(tài)系統(tǒng)的狀態(tài)包括對象的位置,并且該方法進(jìn)一步包括向編碼器提供所估計(jì)的對象位置,使用第 一編碼算法來對與所估計(jì)的位置相對應(yīng)的、視頻的部分進(jìn)行編碼,以及使用第二編碼算法來對與所估計(jì)的位置不相對應(yīng)的、視頻的另一部分進(jìn) 行編碼。
16. 如權(quán)利要求l所述的方法,其中,將該基于粒子的算法用于跟蹤視 頻中的對象,該動態(tài)系統(tǒng)的狀態(tài)包括對象的位置,并且該方法進(jìn)一步包括向處理裝置提供所估計(jì)的對象位置,處理裝置使用所估計(jì)的對象位置來修改該視頻,以使能對象的增強(qiáng)顯示。
17. 如權(quán)利要求16所述的方法,其中,該增強(qiáng)顯示包括在視頻中突出對象。
18. 如權(quán)利要求l所述的方法,進(jìn)一步包括在應(yīng)用局部模式搜索機(jī)制 之前,通過使用動態(tài)模型來更新一個(gè)或多個(gè)粒子,從而移動該組粒子中的一個(gè)或多個(gè)粒子。
19. 如權(quán)利要求l所述的方法,進(jìn)一步包括在修改粒子的數(shù)目之后以 及在估計(jì)狀態(tài)的定位之前,通過對該組粒子進(jìn)行重新采樣來移動該組粒子中 的一個(gè)或多個(gè)粒子。
20. —種包括處理裝置的設(shè)備(110),該處理裝置被配置為 提供用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的一組粒子(1010), 應(yīng)用局部模式搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子(1020), 修改該組粒子中的粒子的數(shù)目(1030 ),以及 使用該組粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位(1040)。
21. 如權(quán)利要求20所述的設(shè)備,其中該處理裝置進(jìn)一步被配置為(l)跟蹤視頻中的對象,該動態(tài)系統(tǒng)的狀態(tài) 包括對象的位置,并且(2)提供所估計(jì)的對象位置,以及該設(shè)備進(jìn)一步包括編碼器,所述編碼器被配置為(l)從處理裝置接收所 估計(jì)的對象位置,(2)使用第一編碼算法來對與所估計(jì)的位置相對應(yīng)的、視 頻的部分進(jìn)行編碼,并且(3 )使用第二編碼算法來對與所估計(jì)的位置不相對 應(yīng)的、#見頻的另 一部分進(jìn)行編碼。
22. 如權(quán)利要求20所述的設(shè)備,其中該處理裝置進(jìn)一步被配置為(1 )跟蹤視頻中的對象,該動態(tài)系統(tǒng)的狀態(tài) 包括對象的位置,并且(2)提供所估計(jì)的對象位置,以及該設(shè)備進(jìn)一步包括后處理裝置,所述后處理裝置被配置為(l)從處理裝 置接收所估計(jì)的對象位置,并且(2)使用所估計(jì)的對象位置來修改該視頻, 以使能對象的增強(qiáng)顯示。
23. —種設(shè)備(110),包括用于提供用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的一組粒子(1010)的部件; 用于應(yīng)用局部模式搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子(1020) 的部件;用于修改該組粒子中的粒子的數(shù)目(1030)的部件;以及 用于使用該組粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位(1040)的 部件。
24. —種包括處理器可讀介質(zhì)的設(shè)備(110),在該處理器可讀介質(zhì)上已 存儲了用于使得一個(gè)或多個(gè)處理裝置執(zhí)行以下步驟的指令提供用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的一組粒子(1010); 應(yīng)用局部模式搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子(1020); 修改該組粒子中的粒子的數(shù)目(1030);以及 使用該紐粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位(1040)。
全文摘要
根據(jù)一實(shí)現(xiàn)方式,提供了用于估計(jì)動態(tài)系統(tǒng)的狀態(tài)的定位的一組粒子(1010)。應(yīng)用局部模式搜索機(jī)制以移動該組粒子中的一個(gè)或多個(gè)粒子(1020),并且修改該組粒子中的粒子的數(shù)目(1030)。使用該組粒子中的粒子來估計(jì)該動態(tài)系統(tǒng)的狀態(tài)的定位(1040)。另一實(shí)現(xiàn)方式提供了使用粒子濾波器的動態(tài)狀態(tài)估計(jì)(565),對于該動態(tài)狀態(tài)估計(jì),使用基于均值偏移分析的局部模式搜索算法來修改粒子定位(610),并且對于該動態(tài)狀態(tài)估計(jì),使用庫爾貝克-萊布勒距離采樣處理來調(diào)整粒子的數(shù)目(830-860)。該均值偏移分析可以減少粒子中的退化,并且該采樣處理可以減少粒子濾波器的計(jì)算復(fù)雜度。該實(shí)現(xiàn)方式可用于非線性和非高斯系統(tǒng)。
文檔編號G06F17/50GK101512528SQ200680055978
公開日2009年8月19日 申請日期2006年12月19日 優(yōu)先權(quán)日2006年9月29日
發(fā)明者瓊·利亞克, 宇 黃 申請人:湯姆森特許公司