相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)案要求2015年2月18日申請(qǐng)的標(biāo)題是“對(duì)象檢測(cè)期間的自適應(yīng)邊緣狀特征選擇(adaptiveedge-likefeatureselectionduringobjectdetection)”的第14/625,588號(hào)美國(guó)專利申請(qǐng)案的優(yōu)先權(quán),所述美國(guó)專利申請(qǐng)案以引用的方式并入本文中。
本發(fā)明大體上涉及基于計(jì)算機(jī)視覺(jué)的對(duì)象識(shí)別應(yīng)用程序,且特定地但非排他地,涉及選擇用以與用于對(duì)象檢測(cè)的特征數(shù)據(jù)庫(kù)比較的經(jīng)提取特征。
背景技術(shù):
在移動(dòng)電話或其它移動(dòng)平臺(tái)上實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)(ar)的一個(gè)難題是實(shí)時(shí)地檢測(cè)并追蹤對(duì)象的問(wèn)題。用于ar應(yīng)用程序的對(duì)象檢測(cè)具有非??量痰囊螅浩浔仨毺峁┩暾牧鶄€(gè)自由度,產(chǎn)生相對(duì)于給定坐標(biāo)系的絕對(duì)測(cè)量值,非常穩(wěn)固并且實(shí)時(shí)地運(yùn)行。所關(guān)注的是用以使用基于計(jì)算機(jī)視覺(jué)(cv)的方法來(lái)計(jì)算相機(jī)位置和定向(姿勢(shì))的方法,基于cv的方法首先依賴于檢測(cè),且隨后依賴于追蹤相機(jī)視圖內(nèi)的對(duì)象。在一個(gè)方面中,檢測(cè)操作包含檢測(cè)數(shù)字圖像內(nèi)含有的一組特征,以便將那些特征與對(duì)應(yīng)于現(xiàn)實(shí)世界對(duì)象的已知特征的數(shù)據(jù)庫(kù)進(jìn)行比較。特征可指數(shù)字圖像中的一個(gè)區(qū)域,這個(gè)區(qū)域的屬性(例如亮度或顏色)與所述區(qū)域周圍的區(qū)域相比是不同的。在一個(gè)方面中,特征是數(shù)字圖像中的一個(gè)區(qū)域,在這個(gè)區(qū)域中一些屬性是恒定的或者在規(guī)定的值范圍內(nèi)變化。
特征可部分地基于其形狀而被視為斑點(diǎn)狀或邊緣狀。斑點(diǎn)狀特征可在對(duì)象上高度局部化,因此使特征的相關(guān)聯(lián)更容易,而邊緣狀特征不必是局部化的。一些類型的特征檢測(cè)算法嘗試濾除被視為過(guò)于邊緣狀特征以便縮減處理時(shí)間。舉例來(lái)說(shuō),尺度不變特征變換(sift)算法計(jì)算每一特征的赫斯的本征值。接著,比較每一特征的本征值的比與固定閾值。如果比高于固定閾值,那么將特征視為過(guò)于邊緣狀且舍棄特征。
然而,當(dāng)試圖使用相同檢測(cè)器以檢測(cè)特征豐富的對(duì)象和非特征豐富的對(duì)象兩者時(shí),問(wèn)題會(huì)出現(xiàn)。非特征豐富的對(duì)象(例如標(biāo)識(shí))主要包含邊緣狀特征,且包含極少斑點(diǎn)狀特征(如果存在)。這是因?yàn)榇蟛糠謽?biāo)識(shí)是人造的,且有意避免銳角和非平滑斑點(diǎn)。如果特征檢測(cè)器“松弛”以放入更多邊緣狀特征,那么后續(xù)特征豐富的目標(biāo)對(duì)象可產(chǎn)生比處理可合理地允許更多的特征。也就是說(shuō),移動(dòng)電話cpu的有限計(jì)算能力使得難以(如果有可能的話)檢測(cè)包含過(guò)多特征的圖像中的對(duì)象。
技術(shù)實(shí)現(xiàn)要素:
本文中所揭示的實(shí)施例可涉及一種識(shí)別圖像中的關(guān)注對(duì)象的方法。所述方法可包含從所述圖像內(nèi)提取第一組特征并確定包含于所述第一組特征中的每一特征是斑點(diǎn)狀特征還是邊緣狀特征。所述方法還可包含確定從所述第一組取得的第二組特征,其中包含于所述第二組特征中的所述邊緣狀特征的數(shù)目是基于包含于所述第一組特征中的邊緣狀特征與斑點(diǎn)狀特征的相對(duì)數(shù)目。所述方法可進(jìn)一步包含根據(jù)所述第二組特征而確定所述關(guān)注對(duì)象是否在所述圖像內(nèi)存在。
本文中所揭示的實(shí)施例可涉及一種用于識(shí)別圖像中的關(guān)注對(duì)象的裝置。所述裝置可包含用于從所述圖像內(nèi)提取第一組特征并確定包含于所述第一組特征中的每一特征是斑點(diǎn)狀特征還是邊緣狀特征的指令。所述裝置還可包含用于確定從所述第一組取得的第二組特征的指令,其中包含于所述第二組特征中的所述邊緣狀特征的數(shù)目是基于包含于所述第一組特征中的邊緣狀特征與斑點(diǎn)狀特征的相對(duì)數(shù)目。所述裝置可進(jìn)一步包含用于根據(jù)所述第二組特征而確定所述關(guān)注對(duì)象是否在所述圖像內(nèi)存在的指令。
本文中所揭示的實(shí)施例可涉及一種包含存儲(chǔ)于其上的用于識(shí)別圖像中的關(guān)注對(duì)象的程序代碼的計(jì)算機(jī)可讀媒體。所述媒體可包含用于從所述圖像內(nèi)提取第一組特征的代碼和用于確定包含于所述第一組特征中的每一特征是斑點(diǎn)狀特征還是邊緣狀特征的代碼。所述媒體還可包含用于確定從所述第一組取得的第二組特征的代碼,其中包含于所述第二組特征中的所述邊緣狀特征的數(shù)目是基于包含于所述第一組特征中的邊緣狀特征與斑點(diǎn)狀特征的相對(duì)數(shù)目。所述媒體可進(jìn)一步包含用于根據(jù)所述第二組特征而確定所述關(guān)注對(duì)象是否在所述圖像內(nèi)存在的代碼。
本文中所揭示的實(shí)施例可涉及一種用于識(shí)別圖像中的關(guān)注對(duì)象的設(shè)備。所述設(shè)備可包含用于從所述圖像內(nèi)提取第一組特征的裝置和用于確定包含于所述第一組特征中的每一特征是斑點(diǎn)狀特征還是邊緣狀特征的裝置。所述設(shè)備還可包含用于確定從所述第一組取得的第二組特征的裝置,其中包含于所述第二組特征中的所述邊緣狀特征的數(shù)目是基于包含于所述第一組特征中的邊緣狀特征與斑點(diǎn)狀特征的相對(duì)數(shù)目。所述設(shè)備可進(jìn)一步包含用于根據(jù)所述第二組特征而確定所述關(guān)注對(duì)象是否在所述圖像內(nèi)存在的裝置。
本發(fā)明的上述以及其它方面、目標(biāo)和特征將從結(jié)合附圖給出的各種實(shí)施例的以下描述中變得顯而易見(jiàn)。
附圖說(shuō)明
參見(jiàn)以下圖式描述本發(fā)明的非限制性和非窮盡性實(shí)施例,其中除非另有指定,否則各圖中相同的參考標(biāo)號(hào)指代相同的部件。
圖1是說(shuō)明一個(gè)實(shí)施例中的斑點(diǎn)狀特征和邊緣狀特征的圖式。
圖2a是包含多個(gè)斑點(diǎn)狀特征和多個(gè)邊緣狀特征的實(shí)例特征豐富的圖像。
圖2b是包含極少斑點(diǎn)狀特征(如果存在)的實(shí)例非特征豐富的圖像。
圖3是說(shuō)明一個(gè)實(shí)施例中的識(shí)別圖像中的關(guān)注對(duì)象的過(guò)程的流程圖。
圖4是說(shuō)明另一實(shí)施例中的識(shí)別圖像中的關(guān)注對(duì)象的過(guò)程的流程圖。
圖5是說(shuō)明一個(gè)實(shí)施例中的將經(jīng)提取特征分類成斑點(diǎn)狀或邊緣狀的過(guò)程的流程圖。
圖6是一個(gè)實(shí)施例中的說(shuō)明應(yīng)用于邊緣與斑點(diǎn)比r以便計(jì)算因數(shù)α的實(shí)例函數(shù)f()的圖式。
圖7是說(shuō)明一個(gè)實(shí)施例中的圖像的網(wǎng)格分類的圖式。
圖8是能夠執(zhí)行本文中論述的過(guò)程的示范性移動(dòng)平臺(tái)的功能框圖。
圖9是示范性對(duì)象識(shí)別系統(tǒng)的功能框圖。
具體實(shí)施方式
貫穿本說(shuō)明書(shū)對(duì)“一個(gè)實(shí)施例”、“一實(shí)施例”、“一個(gè)實(shí)例”或“一實(shí)例”的參考意味著結(jié)合實(shí)施例或?qū)嵗枋龅奶囟ㄌ卣?、結(jié)構(gòu)或特性包含在本發(fā)明的至少一個(gè)實(shí)施例中。因此,貫穿本說(shuō)明書(shū)在不同位置中出現(xiàn)短語(yǔ)“在一個(gè)實(shí)施例中”或“在一實(shí)施例中”未必都是指同一個(gè)實(shí)施例。此外,在一或多個(gè)實(shí)施例中,特定特征、結(jié)構(gòu)或特性可以任何合適方式組合。在本文中所說(shuō)明的任何實(shí)例或?qū)嵤├粦?yīng)被理解為比其它實(shí)例或?qū)嵤├齼?yōu)選或有利。
在一個(gè)實(shí)施例中,移動(dòng)平臺(tái)或裝置通過(guò)首先俘獲或接收對(duì)象的數(shù)字圖像來(lái)實(shí)時(shí)地檢測(cè)目標(biāo)對(duì)象。舉例來(lái)說(shuō),集成到移動(dòng)平臺(tái)中的相機(jī)可俘獲數(shù)字圖像,或圖像可由單獨(dú)平臺(tái)俘獲且發(fā)送到移動(dòng)平臺(tái)用于進(jìn)行如本文中所描述的處理。接著從數(shù)字圖像內(nèi)提取第一組特征。在一個(gè)實(shí)例中,特征提取包含應(yīng)用基于高斯拉普拉斯(log)或高斯差分(dog)的特征檢測(cè)器,例如尺度不變特征變換(sift)算法。在其它實(shí)施例中,可根據(jù)來(lái)自加速片段測(cè)試的特征(fast)、高效密集型描述符(daisy)或其它算法而確定特征。特征可包含關(guān)注點(diǎn)或“關(guān)鍵點(diǎn)”,和對(duì)包圍關(guān)注點(diǎn)的區(qū)域的描述。描述可用以確定特征的“斑點(diǎn)性(blobness)”;也就是說(shuō),特征是更斑點(diǎn)狀的還是邊緣狀的。圖1說(shuō)明兩個(gè)實(shí)例特征;斑點(diǎn)狀特征102和邊緣狀特征104。如圖1中所展示,斑點(diǎn)狀特征可被視為較圓的一個(gè)特征,而邊緣狀特征更橢圓。在一個(gè)實(shí)例中,為每一特征計(jì)算赫斯矩陣的本征值。最大本征值與最小本征值的比可用作特征的斑點(diǎn)性的量度。舉例來(lái)說(shuō),可根據(jù)等式1來(lái)計(jì)算本征值比(e_ratio),如下:
因此,如圖1中所展示,特征102包含本征值λ1和本征值λ2,其中本征值比大致等于一(1.0)。本征值比越接近1.0,特征越是斑點(diǎn)狀的。相反,本征值比越大于一,特征越是邊緣狀的。舉例來(lái)說(shuō),特征104具有比1.0大得多的本征值,且因此被視為邊緣狀特征。
因此,本發(fā)明的實(shí)施例包含確定每一經(jīng)提取特征是斑點(diǎn)狀特征還是邊緣狀特征。在一個(gè)實(shí)施例中,可比較本征值比與閾值。在一個(gè)實(shí)施例中,閾值可以是大于1.0的固定閾值。在其它實(shí)施例中,閾值可以是基于圖像、圖像的集合或其它數(shù)據(jù)的動(dòng)態(tài)閾值。舉例來(lái)說(shuō),多程系統(tǒng)可計(jì)算關(guān)于所有特征所計(jì)算的本征值??蓹z測(cè)到邊緣狀特征的本征值與斑點(diǎn)狀特征的本征值之間的分離,且可根據(jù)分離的面積而確定閾值。在閾值的動(dòng)態(tài)更新的不同實(shí)例中,提供清晰分離的值可用作先前所使用的閾值的加權(quán)值。其本征值比小于閾值的特征被確定為斑點(diǎn)狀的,但其本征值比大于閾值的特征被確定為邊緣狀的。
一旦特征分類為邊緣狀或斑點(diǎn)狀,那么計(jì)算邊緣與斑點(diǎn)比。也就是說(shuō),如下計(jì)算邊緣狀特征的數(shù)目nedge與斑點(diǎn)狀特征的數(shù)目nblob的比(r):
邊緣與斑點(diǎn)比(r)接著用以確定待保持用于進(jìn)一步處理的邊緣狀特征的數(shù)目。在一個(gè)實(shí)例中,邊緣狀特征的相對(duì)數(shù)目越大,所保持的經(jīng)提取邊緣狀特征的百分比越大。類似地,邊緣狀特征的相對(duì)數(shù)目越小,所保持的經(jīng)提取邊緣狀特征的百分比越小。
這個(gè)過(guò)程允許可變數(shù)目個(gè)邊緣狀特征用于基于圖像的豐富度而檢測(cè)對(duì)象。舉例來(lái)說(shuō),圖2a說(shuō)明含有多個(gè)斑點(diǎn)狀特征和多個(gè)邊緣狀特征的特征豐富的圖像202。圖2a的圖像202含有足夠的斑點(diǎn)狀特征,使得需要極少到無(wú)邊緣狀特征以便有效地且有效率地檢測(cè)目標(biāo)對(duì)象(即,豹)。如果不小于1.0,那么圖像(例如圖像202)的所計(jì)算邊緣與斑點(diǎn)比r可接近1.0。因此,大量經(jīng)提取邊緣狀特征(如果不是所有經(jīng)提取邊緣狀特征)可被舍棄,且不用于進(jìn)一步對(duì)象檢測(cè)。
相對(duì)比地,圖2b說(shuō)明含有極極少斑點(diǎn)狀特征(如果存在)的非特征豐富的圖像203。然而,圖像203的確含有多個(gè)邊緣狀特征。因此,邊緣與斑點(diǎn)比可以是極高的(例如,4.0或更大)。在此狀況下,保持較大大百分比的提取邊緣狀特征來(lái)用于對(duì)目標(biāo)對(duì)象(即,殘疾人標(biāo)識(shí))的檢測(cè)中。
圖3是說(shuō)明一個(gè)實(shí)施例中的識(shí)別圖像中的關(guān)注對(duì)象的過(guò)程300的流程圖。過(guò)程300在過(guò)程框305處開(kāi)始以從圖像內(nèi)提取第一組特征。舉例來(lái)說(shuō),特征提取包含將基于log或dog的特征檢測(cè)器應(yīng)用于圖像以便提取第一組特征。如上文所介紹,在一些實(shí)施例中,可通過(guò)sift、fast、daisy或其它特征檢測(cè)算法來(lái)確定特征檢測(cè)器。
過(guò)程300在框310處接著確定包含于第一組特征中的每一特征是斑點(diǎn)狀特征還是邊緣狀特征。確定特征是斑點(diǎn)狀特征還是邊緣狀特征可包含:計(jì)算特征的第一本征值和第二本征值、計(jì)算第一本征值與第二本征值的比、和比較所述比與閾值。
過(guò)程300在框315處接著確定從第一組取得的第二組特征,其中包含于第二組特征中的邊緣狀特征的數(shù)目是基于包含于第一組特征中的邊緣狀特征與斑點(diǎn)狀特征的相對(duì)數(shù)目。包含于第二組特征中的邊緣狀特征的數(shù)目可以是包含于第一組特征中的邊緣狀特征的數(shù)目與斑點(diǎn)狀特征的數(shù)目的比的函數(shù)。在一些實(shí)施例中,函數(shù)是分段函數(shù),使得包含于第二組特征中的邊緣狀特征的數(shù)目在所述比小于下閾值時(shí)是零,且第一組中的所有邊緣狀特征在所述比大于上閾值時(shí)包含于第二組中。包含于第二組特征中的邊緣狀特征的數(shù)目可在所述比介于下閾值與上閾值之間時(shí)以線性方式增大。舉例來(lái)說(shuō),隨著所述比的值在下閾值和上閾值的范圍內(nèi)增大而以線性方式增大。在下文關(guān)于圖4更詳細(xì)地描述與確定第二組特征相關(guān)的其它細(xì)節(jié)。
過(guò)程300在框320處接著根據(jù)第二組特征而確定關(guān)注對(duì)象是否存在于圖像內(nèi)。確定關(guān)注對(duì)象是否存在可包含使用第二組特征來(lái)查詢特征數(shù)據(jù)庫(kù)。在一些實(shí)施例中,過(guò)程300將圖像分段成多個(gè)區(qū)域,并從第一組選擇待包含于第二組特征中的特征,使得第二組特征分布于多個(gè)區(qū)域當(dāng)中。在一些實(shí)施例中,通過(guò)相機(jī)俘獲圖像,且過(guò)程300響應(yīng)于確定關(guān)注對(duì)象在圖像中而更新相機(jī)的姿勢(shì)。
圖4是說(shuō)明另一實(shí)施例中的識(shí)別圖像中的關(guān)注對(duì)象的過(guò)程400的流程圖。過(guò)程400在過(guò)程框405處開(kāi)始,過(guò)程框405包含俘獲或以其它方式獲取可含有或可不含有關(guān)注對(duì)象的數(shù)字圖像。在一個(gè)實(shí)施例中,數(shù)字圖像由執(zhí)行過(guò)程400的平臺(tái)或裝置俘獲。在其它實(shí)施例中,數(shù)字圖像由外部平臺(tái)或裝置產(chǎn)生,且發(fā)送到執(zhí)行過(guò)程400的平臺(tái)或由其接收。舉例來(lái)說(shuō),過(guò)程400可由使得可處理并顯示從被單獨(dú)地實(shí)施的相機(jī)接收的圖像平臺(tái)或裝置執(zhí)行。過(guò)程框410接著包含從圖像提取第一組特征。如上文所提及,可通過(guò)利用sift、fast、daisy或其它算法來(lái)提取第一組特征。接下來(lái),在過(guò)程框415中將第一組中的經(jīng)提取特征分類成斑點(diǎn)狀或邊緣狀。
圖5是說(shuō)明將經(jīng)提取特征分類成斑點(diǎn)狀或邊緣狀的實(shí)例過(guò)程500的流程圖。過(guò)程500是圖4的過(guò)程框415的一個(gè)可能實(shí)施方案。在過(guò)程框505中,選擇第一組中的經(jīng)提取特征中的一者。接下來(lái),在過(guò)程框510中,為所選特征計(jì)算本征值比(e_ratio)。如上文所提及,計(jì)算本征值比可首先計(jì)算所選特征的赫斯矩陣的本征值,并接著通過(guò)等式1計(jì)算本征值比。決策框515接著比較計(jì)算出的本征值比與閾值。在一個(gè)實(shí)施例中,比是固定的且大于1.0。如果計(jì)算出的本征值比小于閾值,那么過(guò)程框520將所選特征分類成斑點(diǎn)狀。然而,如果計(jì)算出的本征值比大于閾值,那么過(guò)程框525將所選特征分類成邊緣狀。
一旦對(duì)所選特征進(jìn)行了分類,那么過(guò)程500前進(jìn)到?jīng)Q策框530,決策框530確定分類是否完成。在一個(gè)實(shí)施例中,如果已對(duì)第一組中的經(jīng)提取特征中的每一者進(jìn)行分類,那么分類完成。如果是,那么過(guò)程500在535框處完成。然而,如果在決策框530中確定了此處仍存在待進(jìn)行分類的經(jīng)提取特征,那么過(guò)程500返回到過(guò)程框505,其中選擇下一經(jīng)提取特征進(jìn)行分類。
替代地,或除了過(guò)程500以外,用于對(duì)經(jīng)提取特征進(jìn)行分類的過(guò)程可包含計(jì)算每一經(jīng)提取特征的本征值比,并接著基于其計(jì)算處的本征值比而按順序(例如,列表)對(duì)特征進(jìn)行分類。因此,斑點(diǎn)狀特征可以是經(jīng)分類列表中的其本征值比低于閾值的所有那些特征,而邊緣狀特征是其本征值比高于閾值的那些特征。
現(xiàn)返回參看圖4的過(guò)程400,一旦過(guò)程框415將特征分類為邊緣狀或斑點(diǎn)狀,那么過(guò)程框420計(jì)算邊緣與斑點(diǎn)比。也就是說(shuō),計(jì)算邊緣狀特征的數(shù)目nedge與斑點(diǎn)狀特征的數(shù)目nblob的比(r)。在一個(gè)實(shí)施例中,基于上文的等式2而計(jì)算邊緣與斑點(diǎn)比r。過(guò)程框425接著包含基于邊緣與斑點(diǎn)比r而確定因數(shù)α。因數(shù)α表示待保持用于在嘗試檢測(cè)目標(biāo)對(duì)象的過(guò)程中進(jìn)一步處理的經(jīng)提取邊緣狀特征的百分比。
圖6說(shuō)明應(yīng)用于邊緣與斑點(diǎn)比r以便計(jì)算因數(shù)α的實(shí)例函數(shù)f()。如圖6中所展示,函數(shù)f(r)可以是分段函數(shù)。也就是說(shuō),可如下計(jì)算α:
其中thlower是下閾值,且thupper是上閾值。在一個(gè)實(shí)施例中,thlower大致等于1.0且thupper大致等于4.0。
因此,如圖6中所展示,如果邊緣與斑點(diǎn)比r小于下閾值thlower(即,圖像是特征豐富的,其具有大量斑點(diǎn)狀特征),那么α是零(即,0.0%),且沒(méi)有經(jīng)提取邊緣狀特征用于后續(xù)對(duì)象檢測(cè)中。相反,如果邊緣與斑點(diǎn)比r大于上閾值thupper,那么α是1.0(即,100%),且保持所有經(jīng)提取邊緣狀特征。在閾值之間,α對(duì)著比r的增大而增大。圖6說(shuō)明在比r介于臨限值之間時(shí)α根據(jù)曲線而增大。在一個(gè)實(shí)施例中,α在比r朝向上閾值thupper增大時(shí)二次地增大。在另一實(shí)施例中,α在比r介于閾值之間時(shí)以線性方式增大(即,α與r成比例)。
再次返回參看圖4的過(guò)程400,一旦確定了因數(shù)α,那么如上文所描述,過(guò)程框430從第一組取得數(shù)個(gè)邊緣狀特征并將所述特征添加到第二組特征。待增加到第二組特征的邊緣狀特征的數(shù)目由計(jì)算出的因數(shù)α確定,且可被計(jì)算為因數(shù)α乘以經(jīng)提取邊緣狀特征的數(shù)目(即,α·nedge)。
接下來(lái),過(guò)程框435包含將數(shù)個(gè)斑點(diǎn)狀特征添加到第二組特征。在一個(gè)實(shí)施例中,添加所有經(jīng)提取斑點(diǎn)狀特征。因此,待從所提取第一組取得且將在第二組特征中包含的特征的總數(shù)目ntot可表達(dá)為:
ntot=nblob+α·nedge等式4
在一個(gè)實(shí)施例中,具有最低本征值比的邊緣狀特征係添加到第二組特征的邊緣狀特征。因此,可舍棄且不進(jìn)一步使用具有更高本征值比的超過(guò)α·nedge的經(jīng)提取邊緣狀特征(即,大部分邊緣狀特征)。
接下來(lái),過(guò)程400包含網(wǎng)格分類的任選過(guò)程框440。在一個(gè)實(shí)施例中,根據(jù)可配置nmax值而界定待使用的特征的最大數(shù)目。舉例來(lái)說(shuō),一些基于特征的檢測(cè)系統(tǒng)基于可用處理時(shí)間和系統(tǒng)的期望響應(yīng)時(shí)間中的一或多者而確定所分配特征預(yù)算(即,nmax值)。因此,如圖7中所展示,圖像702可分段成若干區(qū)域704,其中選擇包含于第二組特征中的所選特征,使得特征706分布在若干區(qū)域當(dāng)中,直到達(dá)到特征的最大數(shù)目nmax為止。雖然圖7說(shuō)明分段成十六(16)個(gè)區(qū)域的圖像702,但是根據(jù)本發(fā)明的實(shí)施例,圖像702可分段成任何數(shù)目個(gè)(包含2個(gè)或更多個(gè))區(qū)域。
接下來(lái),在過(guò)程400的過(guò)程框445中,使用第二組特征來(lái)查詢特征數(shù)據(jù)庫(kù)。通過(guò)拍攝已知目標(biāo)對(duì)象的樣本圖像來(lái)在運(yùn)行時(shí)間前建構(gòu)存儲(chǔ)于數(shù)據(jù)庫(kù)中的特征。如果第二組中的經(jīng)提取特征中的至少一些與存儲(chǔ)于數(shù)據(jù)庫(kù)中的特征匹配,那么確定已在圖像中檢測(cè)到關(guān)注對(duì)象。在一個(gè)實(shí)施例中,可接著更新相機(jī)姿勢(shì)。
圖8是能夠執(zhí)行本文中論述的過(guò)程的移動(dòng)平臺(tái)800的功能框圖。在一個(gè)實(shí)施例中,移動(dòng)平臺(tái)800是能夠使用本文中所描述的過(guò)程(例如圖3的過(guò)程300、圖4的過(guò)程400和圖5的過(guò)程500)進(jìn)行對(duì)象識(shí)別的計(jì)算機(jī)。移動(dòng)平臺(tái)800可任選地包含相機(jī)802以及包含顯示器822的任選用戶接口806。顯示器822能夠顯示由相機(jī)802俘獲的圖像或從其它來(lái)源接收的圖像。用戶接口806還可包含用戶可借以將信息輸入到移動(dòng)平臺(tái)800的小鍵盤824或其它輸入裝置。如果需要,那么可通過(guò)將虛擬小鍵盤集成到具有觸摸傳感器的顯示器822中來(lái)消除小鍵盤824。用戶接口806還可包含麥克風(fēng)826和揚(yáng)聲器828。
移動(dòng)平臺(tái)800還包含控制單元804,控制單元804連接到相機(jī)802和用戶接口806(如果存在的話)并且與其通信??刂茊卧?04接受并處理從相機(jī)802和/或從網(wǎng)絡(luò)適配器816接收的圖像??刂茊卧?04可以通過(guò)處理單元808和相關(guān)聯(lián)存儲(chǔ)器814、硬件810、軟件815和固件812來(lái)提供。
控制單元804可進(jìn)一步包含圖形引擎820,圖形引擎820可以(例如)是游戲引擎以在期望時(shí)在顯示器822中渲染期望的數(shù)據(jù)。出于清楚起見(jiàn)分開(kāi)說(shuō)明處理單元808和圖形引擎820,但是處理單元808和圖形引擎820可以是單個(gè)單元,和/或基于在處理單元808中運(yùn)行的軟件815中的指令而實(shí)施于處理單元808中。處理單元808以及圖形引擎820可能(但不需要必然)包含一或多個(gè)微處理器、嵌入式處理器、控制器、專用集成電路(asic)、數(shù)字信號(hào)處理器(dsp)等等。術(shù)語(yǔ)“處理器”和“處理單元”描述通過(guò)系統(tǒng)而非特定硬件所實(shí)施的功能。此外,如本文中所使用,術(shù)語(yǔ)“存儲(chǔ)器”指代任何類型的計(jì)算機(jī)存儲(chǔ)媒體,包含與移動(dòng)平臺(tái)800相關(guān)聯(lián)的長(zhǎng)期、短期或其它存儲(chǔ)器,且并不限于任何特定類型的存儲(chǔ)器或特定數(shù)個(gè)的存儲(chǔ)器,或特定類型的其上存儲(chǔ)有存儲(chǔ)器的媒體。
本文所描述的方法,包含過(guò)程300、400和500,可取決于應(yīng)用通過(guò)各種裝置來(lái)予以實(shí)施。舉例來(lái)說(shuō),這些過(guò)程可以在硬件810、固件812、軟件815或其任何組合中予以實(shí)施。對(duì)于硬件實(shí)施方案,處理單元可實(shí)施于一或多個(gè)專用集成電路(asic)、數(shù)字信號(hào)處理器(dsp)、數(shù)字信號(hào)處理裝置(dspd)、可編程邏輯裝置(pld)、現(xiàn)場(chǎng)可編程門陣列(fpga)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計(jì)以執(zhí)行本文中所描述功能的其它電子單元,或其組合內(nèi)。
對(duì)于固件和/或軟件實(shí)施方案,可使用執(zhí)行本文中所描述的功能的模塊(例如進(jìn)程、功能等等)來(lái)實(shí)施所述過(guò)程。任何有形地體現(xiàn)指令的計(jì)算機(jī)可讀媒體可用于實(shí)施本文中所描述的過(guò)程。舉例來(lái)說(shuō),程序代碼可存儲(chǔ)于存儲(chǔ)器814中且由處理單元808執(zhí)行。存儲(chǔ)器可在處理單元808內(nèi)或外部得以實(shí)施。
如果以固件和/或軟件實(shí)施,那么可將所述功能作為一或多個(gè)指令或代碼存儲(chǔ)在計(jì)算機(jī)可讀媒體上。實(shí)例包含經(jīng)編碼有數(shù)據(jù)結(jié)構(gòu)的非暫時(shí)性計(jì)算機(jī)可讀媒體和經(jīng)編碼有計(jì)算機(jī)程序的計(jì)算機(jī)可讀媒體。計(jì)算機(jī)可讀媒體包含物理計(jì)算機(jī)存儲(chǔ)媒體。存儲(chǔ)媒體可以是可由計(jì)算機(jī)存取的任何可用的媒體。作為實(shí)例而非限制,此計(jì)算機(jī)可讀媒體可包括ram、rom、快閃存儲(chǔ)器、eeprom、cd-rom或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置,或可用于存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)形式的所要程序代碼且可由計(jì)算機(jī)存取的任何其它媒體;如本文中所使用的磁盤和光盤包含壓縮光盤(cd)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(dvd)、軟盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上各項(xiàng)的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
圖9是對(duì)象識(shí)別系統(tǒng)900的功能框圖。如圖所示,對(duì)象識(shí)別系統(tǒng)900包含實(shí)例移動(dòng)平臺(tái)902,移動(dòng)平臺(tái)902包含能夠俘獲對(duì)象914的圖像的相機(jī)(當(dāng)前視圖中未圖示),將通過(guò)與特征數(shù)據(jù)庫(kù)912進(jìn)行比較來(lái)識(shí)別對(duì)象914。
移動(dòng)平臺(tái)902可包含用以展示由相機(jī)俘獲或從另一來(lái)源接收的圖像的顯示器。移動(dòng)平臺(tái)902還可用于(例如)基于使用來(lái)自衛(wèi)星定位系統(tǒng)(sps)(sps包含衛(wèi)星載具906)或用于確定位置的任何其它適當(dāng)來(lái)源(包含蜂窩塔904或無(wú)線通信接入點(diǎn)905)的信號(hào)確定其經(jīng)緯度來(lái)進(jìn)行導(dǎo)航。移動(dòng)平臺(tái)902還可包含可用于確定移動(dòng)平臺(tái)902的定向的定向傳感器,例如數(shù)字指南針、加速計(jì)或陀螺儀。
如本文所使用,移動(dòng)平臺(tái)指代裝置,例如蜂窩式或其它無(wú)線通信裝置、個(gè)人通信系統(tǒng)(pcs)裝置、個(gè)人導(dǎo)航裝置(pnd)、個(gè)人信息管理器(pim)、個(gè)人數(shù)字助理(pda)、膝上型計(jì)算機(jī),或能夠接收無(wú)線通信和/或?qū)Ш叫盘?hào)(例如導(dǎo)航定位信號(hào))的其它合適的移動(dòng)裝置。術(shù)語(yǔ)“移動(dòng)平臺(tái)”還意圖包含(例如)通過(guò)短程無(wú)線、紅外線、有線連接或其它連接與個(gè)人導(dǎo)航裝置(pnd)通信的裝置,而不管裝置處或pnd處是否發(fā)生衛(wèi)星信號(hào)接收、輔助數(shù)據(jù)接收和/或定位相關(guān)處理。并且,“移動(dòng)平臺(tái)”意圖包含能夠(例如)經(jīng)由因特網(wǎng)、wifi或其它網(wǎng)絡(luò)與服務(wù)器通信的所有裝置,包含無(wú)線通信裝置、計(jì)算機(jī)、筆記本電腦等,且不管是在裝置處、在服務(wù)器處還是在與網(wǎng)絡(luò)相關(guān)聯(lián)的另一裝置處發(fā)生衛(wèi)星信號(hào)接收、輔助數(shù)據(jù)接收和/或位置相關(guān)處理。另外,“移動(dòng)平臺(tái)”還可包含能夠支持增強(qiáng)現(xiàn)實(shí)(ar)、虛擬現(xiàn)實(shí)(vr)和/或混合現(xiàn)實(shí)(mr)應(yīng)用程序的所有電子裝置。以上各項(xiàng)的任何可操作組合也被視為“移動(dòng)平臺(tái)”。
衛(wèi)星定位系統(tǒng)(sps)通常包含發(fā)射器的系統(tǒng),其經(jīng)定位以使得實(shí)體能夠至少部分基于從發(fā)射器接收的信號(hào)確定其在地球上或上方的位置。此發(fā)射器通常發(fā)射標(biāo)記有經(jīng)設(shè)定數(shù)目的碼片的重復(fù)偽隨機(jī)噪聲(pn)碼的信號(hào)且可以位于基于地面的控制站、用戶設(shè)備和/或宇宙飛船上。在特定實(shí)例中,此些發(fā)射器可位于地球軌道人造衛(wèi)星(sv)906上。舉例來(lái)說(shuō),全球?qū)Ш叫l(wèi)星系統(tǒng)(gnss)群集(例如,全球定位系統(tǒng)(gps)、伽利略(galileo)、格洛納斯(glonass)或指南針)中的sv可發(fā)射經(jīng)標(biāo)記有pn碼的信號(hào),所述pn碼可區(qū)別于由群集中的其它sv發(fā)射的pn碼(例如,如在gps中,對(duì)于每一衛(wèi)星使用不同pn碼,或如在glonass中,在不同頻率上使用相同碼)。
根據(jù)某些方面,本文中所提出的技術(shù)并不限于用于sps的全球系統(tǒng)(例如,gnss)。舉例來(lái)說(shuō),本文中所提供的技術(shù)可應(yīng)用于各種地區(qū)性系統(tǒng)或以其它方式經(jīng)啟用以用于在各種地區(qū)性系統(tǒng)中使用,例如,日本上方的準(zhǔn)天頂衛(wèi)星系統(tǒng)(qzss)、印度上方的印度地區(qū)性導(dǎo)航衛(wèi)星系統(tǒng)(irnss)、中國(guó)上方的北斗衛(wèi)星等,和/或可與一或多個(gè)全球和/或地區(qū)性導(dǎo)航衛(wèi)星系統(tǒng)相關(guān)聯(lián)或以其它方式經(jīng)啟用以供一或多個(gè)全球和/或地區(qū)性導(dǎo)航衛(wèi)星系統(tǒng)使用的各種增強(qiáng)系統(tǒng)(例如,基于衛(wèi)星的增強(qiáng)系統(tǒng)(sbas))。舉例來(lái)說(shuō)但非限制,sbas可包含提供完整性信息、差分校正等的增強(qiáng)系統(tǒng),例如,廣域增強(qiáng)系統(tǒng)(waas)、歐洲地球同步導(dǎo)航重疊服務(wù)(egnos)、多功能衛(wèi)星增強(qiáng)系統(tǒng)(msas)、gps輔助地理增強(qiáng)導(dǎo)航或gps和地理增強(qiáng)導(dǎo)航系統(tǒng)(gagan),和/或類似者。因此,如本文中所使用,sps可以包含一或多個(gè)全球和/或區(qū)域性導(dǎo)航衛(wèi)星系統(tǒng)和/或增強(qiáng)系統(tǒng)的任何組合,且sps信號(hào)可包含sps、類sps和/或與此些一或多個(gè)sps相關(guān)聯(lián)的其它信號(hào)。
移動(dòng)平臺(tái)902不限于與用于位置確定的sps一起使用,這是因?yàn)槲恢么_定技術(shù)可以配合多種無(wú)線通信網(wǎng)絡(luò)實(shí)施,無(wú)線通信網(wǎng)絡(luò)包含蜂窩塔904并且來(lái)自無(wú)線通信接入點(diǎn)905,例如無(wú)線廣域網(wǎng)(wwan)、無(wú)線局域網(wǎng)(wlan)、無(wú)線個(gè)域網(wǎng)(wpan)。另外,移動(dòng)平臺(tái)902可使用各種無(wú)線通信網(wǎng)絡(luò)經(jīng)由蜂窩塔904且從無(wú)線通信接入點(diǎn)905,或使用人造衛(wèi)星906(必要時(shí))來(lái)接入一或多個(gè)服務(wù)器908以從數(shù)據(jù)庫(kù)912獲得數(shù)據(jù),例如參考圖像和參考特征。術(shù)語(yǔ)“系統(tǒng)”與“網(wǎng)絡(luò)”常??苫Q使用。wwan可以是碼分多址(cdma)網(wǎng)絡(luò)、時(shí)分多址(tdma)網(wǎng)絡(luò)、頻分多址(fdma)網(wǎng)絡(luò)、正交頻分多址(ofdma)網(wǎng)絡(luò)、單載波頻分多址(sc-fdma)網(wǎng)絡(luò)、長(zhǎng)期演進(jìn)(lte)等等。cdma網(wǎng)絡(luò)可實(shí)施一或多個(gè)無(wú)線電接入技術(shù)(rat),例如cdma2000、寬帶cdma(w-cdma)等等。cdma2000包含is-95、is-2000和is-856標(biāo)準(zhǔn)。tdma網(wǎng)絡(luò)可以實(shí)施全球移動(dòng)通信系統(tǒng)(gsm)、數(shù)字高級(jí)移動(dòng)電話系統(tǒng)(d-amps)或某種其它rat。來(lái)自名為“第三代合作伙伴計(jì)劃”(3gpp)的聯(lián)盟的文獻(xiàn)中描述了gsm和w-cdma。來(lái)自名為“第三代合作伙伴計(jì)劃2”(3gpp2)的聯(lián)盟的文獻(xiàn)中描述了cdma2000。3gpp和3gpp2文獻(xiàn)是公開(kāi)可獲得的。wlan可以是ieee802.11x網(wǎng)絡(luò),且wpan可以是藍(lán)牙網(wǎng)絡(luò)、ieee802.15x或某種其它類型的網(wǎng)絡(luò)。所述技術(shù)還可結(jié)合wwan、wlan和/或wpan的任何組合來(lái)予以實(shí)施。
如圖9中所展示,系統(tǒng)900包含移動(dòng)平臺(tái)902,移動(dòng)平臺(tái)902俘獲將通過(guò)與特征數(shù)據(jù)庫(kù)912進(jìn)行比較來(lái)識(shí)別的對(duì)象914的圖像。如所說(shuō)明,移動(dòng)平臺(tái)902可(例如)經(jīng)由蜂窩塔904或無(wú)線通信接入點(diǎn)905接入網(wǎng)絡(luò)910(例如無(wú)線廣域網(wǎng)(wwan)),網(wǎng)絡(luò)910耦合到服務(wù)器908,服務(wù)器908連接到數(shù)據(jù)庫(kù)912,數(shù)據(jù)庫(kù)912存儲(chǔ)與目標(biāo)對(duì)象和其圖像相關(guān)的信息。雖然圖9展示了一個(gè)服務(wù)器908,但是應(yīng)理解,可使用多個(gè)服務(wù)器以及多個(gè)數(shù)據(jù)庫(kù)912。移動(dòng)平臺(tái)902可通過(guò)從服務(wù)器908獲得數(shù)據(jù)庫(kù)912的至少一部分并將所下載數(shù)據(jù)存儲(chǔ)于移動(dòng)平臺(tái)902內(nèi)部的本地?cái)?shù)據(jù)庫(kù)中來(lái)執(zhí)行對(duì)象檢測(cè)自身,如圖9中所說(shuō)明,在一些實(shí)施例中,代替或除了來(lái)自服務(wù)器908的數(shù)據(jù)庫(kù)912以外,移動(dòng)平臺(tái)902還維持本地特征數(shù)據(jù)庫(kù)。從服務(wù)器908獲得的數(shù)據(jù)庫(kù)的部分可以基于如通過(guò)移動(dòng)平臺(tái)的定位系統(tǒng)確定的移動(dòng)平臺(tái)的地理位置。此外,從服務(wù)器908獲得的數(shù)據(jù)庫(kù)的部分可取決于需要移動(dòng)平臺(tái)902上的數(shù)據(jù)庫(kù)的特定應(yīng)用程序。移動(dòng)平臺(tái)902可從所俘獲查詢圖像提取特征,如上文在過(guò)程400中所描述,且匹配第二組中的特征與存儲(chǔ)于本地?cái)?shù)據(jù)庫(kù)中的特征。查詢圖像可以是來(lái)自相機(jī)的預(yù)覽幀中的圖像或由相機(jī)俘獲的圖像,或從視頻序列提取的幀。對(duì)象檢測(cè)可以至少部分地基于每一查詢特征的確定置信級(jí),所述置信級(jí)可接著用于移除離群值。通過(guò)基于移動(dòng)平臺(tái)的地理位置而下載數(shù)據(jù)庫(kù)912的較小部分并在移動(dòng)平臺(tái)902上執(zhí)行對(duì)象檢測(cè),可避免網(wǎng)絡(luò)等待時(shí)間問(wèn)題,且空中(ota)帶寬使用連同客戶端(即,移動(dòng)平臺(tái))側(cè)上的存儲(chǔ)器要求減小。然而,如果期望的話,那么可以通過(guò)服務(wù)器908(或其它服務(wù)器)執(zhí)行對(duì)象檢測(cè),其中移動(dòng)平臺(tái)902將查詢圖像本身或從查詢圖像經(jīng)提取的特征提供到服務(wù)器908。
過(guò)程框中的一些或全部在上文所論述的每一過(guò)程中出現(xiàn)的順序不應(yīng)當(dāng)被認(rèn)為是限制性的。而是,得益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將理解,可以未說(shuō)明的多種順序執(zhí)行過(guò)程框中的一些。
所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解,結(jié)合本文中所揭示的實(shí)施例描述的各種說(shuō)明性邏輯塊、模塊、引擎、電路和算法步驟可實(shí)施為電子硬件或設(shè)備、計(jì)算機(jī)軟件或兩者的組合。為了清楚地說(shuō)明硬件與軟件的這個(gè)互換性,上文已大體上關(guān)于其功能性而描述了各種說(shuō)明性組件、塊、模塊、發(fā)動(dòng)機(jī)、電路和步驟。此功能性是實(shí)施為硬件還是軟件取決于特定應(yīng)用和強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)限制。熟練的技術(shù)人員可以針對(duì)每一特定應(yīng)用以不同方式來(lái)實(shí)施所描述功能性,但此些實(shí)施決策不應(yīng)被解釋為會(huì)導(dǎo)致脫離本發(fā)明的范圍。
所屬領(lǐng)域的技術(shù)人員將容易了解對(duì)本文中所揭示的實(shí)施例的各種修改,且可在不脫離本發(fā)明的精神或范圍的情況下將本文定義的一般原理應(yīng)用到其它實(shí)施例。因此,本發(fā)明并不希望限于本文中所展示的實(shí)施例,而應(yīng)符合與本文中所揭示的原理和新穎特征相一致的最廣范圍。