專利名稱:利用壓縮梯度直方圖來代表和標(biāo)識特征描述符的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的實(shí)施例一般地涉及圖像處理和特征識別,并且更具體地涉及生成和標(biāo)識代表圖像內(nèi)的預(yù)定義特征的特征描述符。
背景技術(shù):
在諸多應(yīng)用中,已經(jīng)變得希望能夠標(biāo)識圖像內(nèi)的特征。例如,可以捕獲包括特色建筑物、地標(biāo)等的圖像,并且可能希望以自動化的方式標(biāo)識建筑物、地標(biāo)等。就這一點(diǎn)而言,在計(jì)算機(jī)視覺和圖像檢索應(yīng)用中利用對圖像內(nèi)的特征的標(biāo)識并且越來越多地用于實(shí)時(shí)對象識別、三維重建、全景拼接、機(jī)器人映射和視頻跟蹤。例如,圖像可以由諸如移動電話、數(shù)字相機(jī)等移動設(shè)備捕獲。移動設(shè)備然后可以向網(wǎng)絡(luò)實(shí)體如應(yīng)用服務(wù)器發(fā)送圖像或者代表圖像的各種特征的特征描述符。網(wǎng)絡(luò)實(shí)體然后可以比較圖像或者代表圖像的特征描述符與多個(gè)預(yù)定義圖像或者多個(gè)預(yù)定義圖像的特征描述符。通過標(biāo)識最接近的匹配,網(wǎng)絡(luò)實(shí)體可以標(biāo)識圖像內(nèi)的諸如特色建筑物、地標(biāo)等特征。
發(fā)明內(nèi)容
因此根據(jù)一個(gè)實(shí)施例提供一種用于生成可以由數(shù)目相對少的位代表的多個(gè)壓縮特征描述符、由此有助于發(fā)送和存儲特征描述符的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。也根據(jù)本發(fā)明的另一實(shí)施例提供一種用于允許比較特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的多個(gè)壓縮表示的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。通過允許利用特征描述符的壓縮表示來執(zhí)行比較,可以標(biāo)識相應(yīng)特征描述符而無需先解壓特征描述符,由此潛在地增加可以標(biāo)識特征描述符的效率。在一個(gè)實(shí)施例中,提供一種用于生成包括數(shù)目相對少的位的特征描述符的方法。 就這一點(diǎn)而言,該方法可以針對圖像的多個(gè)單元中的各單元確定多個(gè)梯度。該方法也可以向多個(gè)倉中的相應(yīng)倉分配針對相應(yīng)單元的梯度,由此量化梯度。然后可以確定多個(gè)特征描述符而各特征描述符包括在相應(yīng)單元的多個(gè)倉之間的梯度分布的表示。然后可以比如通過利用樹編碼來壓縮多個(gè)特征描述符。通過以這一方式確定特征描述符、然后比如通過利用樹編碼來壓縮所得特征描述符,可以用數(shù)目相對少的位代表特征描述符,由此有助于發(fā)送、 存儲和/或處理特征描述符。在另一實(shí)施例中,提供一種用于基于特征描述符的壓縮表示來標(biāo)識特征的方法。 就這一點(diǎn)而言,可以比較特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的多個(gè)壓縮表示?;谠摫容^,可以標(biāo)識特征描述符的壓縮表示以代表預(yù)定義特征而無需先解壓特征描述符。通過允許比較和標(biāo)識而無需解壓特征描述符,標(biāo)識過程可以用高效方式進(jìn)行。在本發(fā)明的其他實(shí)施例中,可以提供一種對應(yīng)處理器和一種對應(yīng)計(jì)算機(jī)程序產(chǎn)品。就這一點(diǎn)而言,一個(gè)實(shí)施例的一種裝置可以包括配置成執(zhí)行各前述功能的處理器。在其他實(shí)施例中,可以提供一種包括至少一個(gè)計(jì)算機(jī)可讀存儲介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,該介質(zhì)具有存儲于其中的計(jì)算機(jī)可執(zhí)行程序代碼指令,而計(jì)算機(jī)可執(zhí)行程序代碼指令包括配置成執(zhí)行各前述功能的程序代碼指令。這樣,該方法、裝置和計(jì)算機(jī)程序產(chǎn)品的實(shí)施例可以允許比如與配置成標(biāo)識特定特征的應(yīng)用結(jié)合以減少發(fā)送和/或存儲的位數(shù)這樣的方式限定和壓縮特征描述符。該方法、裝置和計(jì)算機(jī)程序產(chǎn)品的其他實(shí)施例可以提供基于與特征描述符的壓縮標(biāo)識進(jìn)行的比較來標(biāo)識預(yù)定義特征,由此有助于高效標(biāo)識特征而無需解壓特征描述符。
已經(jīng)這樣用一般性的術(shù)語描述本發(fā)明,現(xiàn)在將參照未必按比例繪制的附圖,附圖中圖1圖示了根據(jù)本發(fā)明實(shí)施例的用于支持生成、發(fā)送和標(biāo)識特征描述符的系統(tǒng)的示意框圖;圖2是根據(jù)本發(fā)明實(shí)施例的用于生成特征描述符的裝置的示意框圖;圖3是根據(jù)本發(fā)明另一實(shí)施例的用于標(biāo)識特征描述符的壓縮表示的裝置的示意框圖;圖4是圖示了根據(jù)本發(fā)明一個(gè)實(shí)施例的用于生成多個(gè)特征描述符的操作序列的流程圖;圖5a和圖5b分別代表大量單元的x、y梯度聯(lián)合分布和聯(lián)合x、y梯度分布的等值繪圖;圖6a_圖6d代表為了包括圖5a的x、y梯度聯(lián)合分布而可能與其他單元的分布組合的四個(gè)不同個(gè)別單元的χ、y梯度分布。圖7a-圖7e圖示了可以根據(jù)本發(fā)明實(shí)施例利用的五個(gè)不同倉配置;圖8描繪了相對于標(biāo)度不變特征變換(SIFT)所提供的近似值的接收器操作特征曲線而言根據(jù)本發(fā)明實(shí)施例的圖7a_圖7d中描繪的四個(gè)不同倉配置所提供的近似值的接收器操作特征曲線;圖9a代表單元的梯度分布,而圖9b代表圖9a中所示分布在未壓縮形式下以及根據(jù)本發(fā)明實(shí)施例在Gagie和霍夫曼樹編碼之后的梯度直方圖;圖10是可以構(gòu)造成具有四片葉子的Gagie樹和霍夫曼樹的表示;圖11圖示了根據(jù)本發(fā)明實(shí)施例的兩個(gè)單元的梯度直方圖的霍夫曼樹編碼以及在成對梯度分布之間的距離的預(yù)先計(jì)算;以及圖12是圖示了根據(jù)本發(fā)明另一實(shí)施例的用于標(biāo)識特征描述符的壓縮表示的另一操作序列的流程圖。
具體實(shí)施例方式現(xiàn)在下文將參照其中示出了本發(fā)明的一些但是并非所有實(shí)施例的附圖來更完全地描述本發(fā)明的一些實(shí)施例。實(shí)際上,本發(fā)明的各種實(shí)施例可以用許多不同形式來實(shí)施而不應(yīng)理解為限于這里闡述的實(shí)施例;實(shí)際上,提供這些實(shí)施例使得本公開內(nèi)容將滿足適用法律要求。相似參考標(biāo)號通篇指代相似要素。如這里所用,術(shù)語“數(shù)據(jù)”、“內(nèi)容”、“信息”和相似術(shù)語可以互換地用來指代能夠根據(jù)本發(fā)明實(shí)施例來發(fā)送、接收和/或存儲的數(shù)據(jù)。另外,提供這里所用術(shù)語“示例”并非為了告知任何定性估定,而代之以僅為了告知對示例的說明。因此,對任何這樣的術(shù)語的使用不應(yīng)理解為限制本發(fā)明實(shí)施例的精神實(shí)質(zhì)和范圍。現(xiàn)在參照圖1描繪可以從本發(fā)明的實(shí)施例中受益的系統(tǒng)。如圖所示,該系統(tǒng)包括可以相互通信并且經(jīng)由網(wǎng)絡(luò)12與各種網(wǎng)絡(luò)實(shí)體通信的一個(gè)或者多個(gè)通信終端10。盡管出于示例的目的而圖示并且下文描述通信終端的實(shí)施例,但是其他類型的終端(比如便攜數(shù)字助理(PDA)、尋呼機(jī)、移動電視、移動電話、游戲設(shè)備、膝上型計(jì)算機(jī)、相機(jī)、錄像機(jī)、音頻/ 視頻播放器、無線電、全球定位系統(tǒng)(GPS)設(shè)備或者前述終端的任何組合)以及其他類型的語音和文字通信系統(tǒng)可以運(yùn)用本發(fā)明的實(shí)施例。另外,非移動的通信終端也可以運(yùn)用本發(fā)明的實(shí)施例。此外,網(wǎng)絡(luò)可以是配置成支持在各種通信終端與各種網(wǎng)絡(luò)實(shí)體之間通信的任一類有線或者無線網(wǎng)絡(luò)。例如,網(wǎng)絡(luò)可以包括可以經(jīng)由對應(yīng)有線和/或無線接口相互通信的各種不同節(jié)點(diǎn)、設(shè)備或者功能(如應(yīng)用服務(wù)器14)的匯集。雖然并不必要,但是在一些實(shí)施例中,網(wǎng)絡(luò)可以能夠支持根據(jù)多個(gè)第一代(IG)、第二代(2G)、2. 5G、第三代(3G)、3. 5G、 3. 9G、第四代(4G)移動通信協(xié)議、長期演進(jìn)(LTE)等中的任何一項(xiàng)或者多項(xiàng)的通信。根據(jù)本發(fā)明的一個(gè)實(shí)施例,通信終端10可以捕獲圖像,比如圖1的描繪中的紀(jì)念教堂圖像。如下文所述,一個(gè)實(shí)施例的通信終端然后可以生成和壓縮代表圖像內(nèi)的各種特征的多個(gè)特征描述符。通信終端然后可以經(jīng)由網(wǎng)絡(luò)12向網(wǎng)絡(luò)實(shí)體(比如如圖1中所示應(yīng)用服務(wù)器14)傳達(dá)壓縮的特征描述符。這一實(shí)施例的服務(wù)器然后可以比較通信設(shè)備捕獲的圖像的壓縮特征描述符與代表各種預(yù)定義特征的壓縮特征描述符的數(shù)據(jù)庫。服務(wù)器然后可以標(biāo)識具有與通信終端捕獲的圖像的特征描述符最相似的特征描述符的預(yù)定義特征,并且如果特征描述符充分相似,則服務(wù)器可以標(biāo)識圖像內(nèi)的諸如建筑物、地標(biāo)等特征與數(shù)據(jù)庫存儲的預(yù)定義特征相同。服務(wù)器然后可以與通信終端通信以提供標(biāo)識圖像內(nèi)的一個(gè)或者多個(gè)特征的信息, 并且在一些實(shí)例中可以提供與特征有關(guān)的諸如它的名稱、地址、歷史信息、市場信息等附加 fn息ο雖然可以用各種方式配置通信終端10,但是在圖示了移動臺20的圖2的框圖中描繪了可以從本發(fā)明的實(shí)施例中受益的通信終端的一個(gè)示例。盡管將出于示例的目的而圖示并且下文描述通信終端的一個(gè)實(shí)施例,但是其他類型的通信終端(比如便攜數(shù)字助理 (PDA)、尋呼機(jī)、移動電視、游戲設(shè)備、所有類型的計(jì)算機(jī)(例如膝上型或者移動計(jì)算機(jī))、相機(jī)、音頻/視頻播放器、無線電、全球定位系統(tǒng)(GPS)設(shè)備或者前述通信終端的組合)以及其他類型的通信設(shè)備可以運(yùn)用本發(fā)明的實(shí)施例。如描述的那樣,通信終端可以包括用于根據(jù)本發(fā)明的實(shí)施例執(zhí)行一個(gè)或者多個(gè)功能的各種裝置(包括這里更具體示出和描述的裝置)。然而,應(yīng)當(dāng)理解通信終端可以包括用于執(zhí)行一個(gè)或者多個(gè)類似功能的替代裝置而不脫離本發(fā)明的精神實(shí)質(zhì)和范圍。所示實(shí)施例的移動臺20可以包括與發(fā)送器34和接收器36可操作通信的一個(gè)天線32(或者多個(gè)天線)。移動臺還可以包括分別向發(fā)送器提供信號和從接收器接收信號的裝置,比如處理器40。信號可以包括根據(jù)適用蜂窩系統(tǒng)空中接口標(biāo)準(zhǔn)的信令信息和/或也可以包括與用戶話音、接收的數(shù)據(jù)和/或用戶生成的數(shù)據(jù)對應(yīng)的數(shù)據(jù)。就這一點(diǎn)而言,移動臺可以能夠根據(jù)一個(gè)或者多個(gè)空中接口標(biāo)準(zhǔn)、通信協(xié)議、調(diào)制類型和接入類型操作。舉例而言,移動臺可以能夠根據(jù)第一、第二、第三和/或第四代通信協(xié)議等中的任何通信協(xié)議操作。例如,移動臺可以能夠根據(jù)第二代(2G)無線通信協(xié)議IS-136、全球移動通信系統(tǒng)(GSM)和IS-95或者根據(jù)第三代(3G)無線通信協(xié)議(比如通用移動電信系統(tǒng)(UMTS)、碼分多址 2000 (CDMA2000)、寬帶CDMA (WCDMA)和時(shí)分-同步碼分多址(TD-SCDMA))、3. 9G無線通信協(xié)議(比如E-UTRAN(演進(jìn)-UMTS地面無線電接入網(wǎng)絡(luò)))、根據(jù)第四代0G)無線通信協(xié)議等操作。理解裝置如處理器40可以包括實(shí)施移動臺20的音頻和邏輯功能以及其他功能的電路??梢杂枚喾N不同方式實(shí)施處理器。處理器可以實(shí)施為各種處理裝置,比如處理單元、 協(xié)處理器、控制器或者各種其他處理設(shè)備(包括如例如ASIC(專用集成電路)、FPGA(現(xiàn)場可編程門陣列)、硬件加速器等集成電路)。在一個(gè)示例實(shí)施例中,處理器可以被配置成執(zhí)行存儲器設(shè)備中存儲的或者以別的方式可由處理器訪問的指令。這樣,處理器可以被配置成執(zhí)行下文參照圖4和圖12更具體討論的過程或者至少其部分。處理器也可以包括用于在調(diào)制和發(fā)送之前對消息和數(shù)據(jù)卷積編碼和交織的功能。處理器還可以包括內(nèi)部語音編碼器并且可以包括內(nèi)部數(shù)據(jù)調(diào)制解調(diào)器。移動臺20也可以包括可以耦合到處理器40的用戶接口(包括輸出設(shè)備(比如耳機(jī)或者揚(yáng)聲器44、振鈴器42、麥克風(fēng)46、顯示器48)和用戶輸入接口)。允許移動臺接收數(shù)據(jù)的用戶輸入接口可以包括允許移動臺接收數(shù)據(jù)的多種設(shè)備中的任何設(shè)備,比如小鍵盤 50、觸摸顯示器(未示出)或者其他輸入設(shè)備。在包括小鍵盤的實(shí)施例中,小鍵盤可以包括數(shù)字(0-9)和有關(guān)鍵(#、*)以及用于操作移動終端10的其他硬鍵和軟鍵。取而代之,小鍵盤可以包括常規(guī)QWERTY小鍵盤布置。小鍵盤也可以包括具有關(guān)聯(lián)功能的各種軟鍵。除此之外或者取而代之,移動臺可以包括接口設(shè)備,比如操縱桿或者其他用戶輸入接口。移動臺還可以包括用于向用來操作移動臺以及可選地提供機(jī)械振動作為可覺察輸出的各種電路供電的電池54,比如振動電池組。移動臺20還可以包括可以通稱為智能卡的用戶標(biāo)識模塊(UIM)58。UIM可以是具有內(nèi)置處理器的存儲器設(shè)備。UIM可以例如包括用戶標(biāo)識模塊(SIM)、通用集成電路卡 (UICC)、通用用戶標(biāo)識模塊(USIM)、可拆卸用戶標(biāo)識模塊(R-UIM)或者任何其他智能卡。 UIM可以存儲與移動用戶有關(guān)的信元。除了 UIM之外,移動臺可以配備有存儲器。例如,移動臺可以包括易失性存儲器60(比如易失性隨機(jī)存取存儲器(RAM)(包括用于暫時(shí)存儲數(shù)據(jù)的高速緩存區(qū)))。移動臺也可以包括可以嵌入和/或可以拆卸的其他非易失性存儲器62。 除此之外或者取而代之,非易失性存儲器可以包括電可擦除可編程只讀存儲器(EEPROM)、 閃存等。存儲器可以存儲移動臺用來實(shí)施移動臺功能的多條信息和數(shù)據(jù)中的任何信息和數(shù)據(jù)。例如,存儲器可以包括能夠唯一標(biāo)識移動臺的標(biāo)識符,比如國際移動設(shè)備標(biāo)識(IMEI) 代碼。盡管通信終端(在圖2中描繪了其一個(gè)示例)可以根據(jù)本發(fā)明的實(shí)施例生成一個(gè)或者多個(gè)特征描述符的壓縮表示,但是與通信終端通信的諸如應(yīng)用服務(wù)器14等網(wǎng)絡(luò)實(shí)體也可以運(yùn)用本發(fā)明的實(shí)施例以基于對特征描述符的壓縮表示的分析來標(biāo)識圖像內(nèi)的特征。 例如參照圖3,根據(jù)本發(fā)明的一個(gè)實(shí)施例示出了能夠作為服務(wù)器14等操作的網(wǎng)絡(luò)實(shí)體68的框圖。網(wǎng)絡(luò)實(shí)體可以包括用于根據(jù)本發(fā)明的實(shí)施例執(zhí)行一個(gè)或者多個(gè)功能的各種裝置(包括這里更具體示出和描述的裝置)。然而應(yīng)當(dāng)理解,網(wǎng)絡(luò)實(shí)體可以包括用于執(zhí)行一個(gè)或者多個(gè)相似功能的替代裝置而不脫離本發(fā)明的精神實(shí)質(zhì)和范圍。如圖所示,網(wǎng)絡(luò)實(shí)體68可以包括比如用于執(zhí)行或者控制它的各種功能的處理器70這樣的裝置。可以用多種不同方式實(shí)施處理器。例如,處理器可以實(shí)施為各種處理裝置, 比如處理單元、協(xié)處理器、控制器或者各種其他處理設(shè)備(包括如例如ASIC、FPGA、硬件加速器等集成電路)。在一個(gè)示例實(shí)施例中,處理器可以被配置成執(zhí)行存儲器中存儲的或者以別的方式可由處理器訪問的指令。這樣,處理器可以被配置成執(zhí)行下文參照圖12更具體討論的過程或者至少其部分。在一個(gè)實(shí)施例中,處理器70可以與存儲內(nèi)容、數(shù)據(jù)等的存儲器72(比如易失性和/ 或非易失性存儲器)通信或者包括存儲器72。例如,存儲器可以存儲從網(wǎng)絡(luò)實(shí)體發(fā)送和/ 或由網(wǎng)絡(luò)實(shí)體接收的內(nèi)容。又例如,存儲器可以存儲用于處理器根據(jù)本發(fā)明的實(shí)施例執(zhí)行與網(wǎng)絡(luò)實(shí)體68的操作關(guān)聯(lián)的功能的軟件應(yīng)用、指令等。具體而言,存儲器可以存儲用于處理器執(zhí)行上文和下文參照圖12描述的操作的軟件應(yīng)用、指令等,這些操作用于基于對特征描述符的壓縮表示的分析來標(biāo)識圖像內(nèi)的特征。除了存儲器72之外,處理器70也可以連接到至少一個(gè)接口或者用于發(fā)送和/或接收數(shù)據(jù)、內(nèi)容等的其他裝置。就這一點(diǎn)而言,接口可以包括至少一個(gè)通信接口 74或者用于比如在網(wǎng)絡(luò)實(shí)體68與通信終端10之間和/或在網(wǎng)絡(luò)實(shí)體12與網(wǎng)絡(luò)12的其余部分之間發(fā)送和/或接收數(shù)據(jù)、內(nèi)容等的其他裝置。在操作中并且如圖4中所示,為了用適當(dāng)特征描述符代表圖像內(nèi)的特征,通信終端10和在一個(gè)實(shí)施例中該通信終端的處理器40可以將圖像劃分成多個(gè)圖像片,比如在興趣點(diǎn)周圍的規(guī)范片。參見操作80。然后可以比如通過規(guī)范化相應(yīng)片的像素值的平均和標(biāo)準(zhǔn)偏差以補(bǔ)償像素強(qiáng)度I的仿射變換al+b來規(guī)范化各片以在仿射強(qiáng)度改變之下實(shí)現(xiàn)不變。 參見操作82。然后可以比如根據(jù)平滑參數(shù)為σ (比如在一個(gè)實(shí)施例中為2. 7個(gè)像素)的高斯平滑來模糊或者平滑各片。然后可以將各片劃分成多個(gè)更小單元。參見操作84。如下文所述,單元可以有各種尺寸,其中標(biāo)度不變特征變換(SIFT)技術(shù)和加速穩(wěn)健特征(SURF)技術(shù)利用4x4方形網(wǎng)格配置而梯度位置和定向直方圖(GLOH)技術(shù)使用大型極坐標(biāo)網(wǎng)格配置。一旦已經(jīng)將片劃分成更小單元,通信終端10的處理器40可以比如通過使用居中微分模板[-1,0,1]來確定各單元內(nèi)的X和y梯度。參見圖4的操作86。可以用各種方式確定梯度。例如,可以通過SIFT技術(shù)確定梯度,其中將各單元內(nèi)的梯度定向量化成八位并且將沿著各方向的梯度量值求和。取而代之,與在沿著角度方向?qū)⑻荻热雮}的SIFT中的梯度量化對照,可以根據(jù)SURF技術(shù)針對各單元用包括Σ dx.E dy.E dx和Σ |dy|的SURF 描述符確定梯度。另外,可以根據(jù)GLOH技術(shù)確定梯度。雖然梯度將根據(jù)圖像和用來確定梯度的技術(shù)變化,但是在圖fe中描繪了一個(gè)示例的大量單元的χ、y梯度聯(lián)合分布,而在圖恥中描繪了這一聯(lián)合χ、y梯度分布的等值繪圖。作為參照,圖5的聯(lián)合χ、y梯度分布包括多個(gè)單元的個(gè)別分布,在圖6a_圖6d中描繪了其中四個(gè)單元的個(gè)別分布用于圖示其間潛在差異的目的。在相應(yīng)單元中的聯(lián)合x、y梯度
分布(比如圖6a_圖6d中描繪的梯度分布)可以限定為PDx, dy (Dx, Dy),而N為單
元中的像素?cái)?shù)目。如圖4的塊88中所示,然后可以量化梯度。然而在一些實(shí)施例中,高斯窗可以在量化和最終確定對應(yīng)特征描述符之前將單元內(nèi)的梯度加權(quán)。為了量化梯度,可以向多個(gè)倉中的相應(yīng)倉分配梯度。然而在這一分配過程之前,可以選擇倉配置以便準(zhǔn)確且高效地代表聯(lián)合x、y梯度分布。參見圖4的操作90和92。為了按照倉數(shù)目以及倉的χ、y位置選擇倉配置以便適當(dāng)且高效地代表聯(lián)合χ、y梯度分布,用最
8普遍標(biāo)識的χ、y梯度對以及該分布的任何偏斜考慮比如圖fe中所示聯(lián)合χ、y梯度分布。 參照圖fe的聯(lián)合x、y梯度分布,在(0,0)的x、y梯度對出現(xiàn)概率最高,并且該分布如圖恥中所示沿著y軸有些偏斜。為了近似該梯度分布,可以用圖7a-圖7e中所示七種示例倉配置限定多個(gè)倉。在一個(gè)實(shí)施例中,倉配置具有在概率最大的位置定位的倉并且在與分布本身相同的方向或者定向上偏斜。例如,圖7a_圖7e中所示各示例倉配置具有在(0,0)的倉、 對稱或者在y軸的方向上略微偏斜并且在0° -360°內(nèi)等角度隔開。為了量化梯度,向最近的倉分配用于單元中的各像素的dx、dy梯度對。為了增加量化過程的效率,可能希望具有數(shù)目相對少的倉。然而,也可能希望具有數(shù)目充分的倉使得聯(lián)合X、y梯度分布的所得近似充分準(zhǔn)確。舉例而言但是并非限制,按照圖7a-圖7d中所示分別具有3、5、7和9個(gè)倉的四種不同倉配置的接收器操作特征曲線、通過比較針對四種不同倉配置中的各配置的正確肯定率比對錯(cuò)誤肯定率與SIFT提供的正確肯定率比對錯(cuò)誤肯定率來比較這些倉配置與圖fe的聯(lián)合χ、y梯度分布的近似結(jié)合提供的準(zhǔn)確性。分別如圖8中所示,如圖7b中所示利用五個(gè)倉的近似在一種示例場景中可以基本上匹配SIFT的性能,而如圖7c中所示具有7個(gè)倉的聯(lián)合χ、y梯度分布的近似可以賦予相對于SIFT的改進(jìn)性能,雖然以效率比圖7b的五個(gè)倉的配置所賦予的效率略低的方式?;诹炕ㄐ沤K端10和在一個(gè)實(shí)施例中該通信終端的處理器40可以生成多個(gè)特征描述符Diaroe,其中值的范圍從1至K的i限定為針對其計(jì)算描述符的片的索引而K為在圖像中檢測到的片數(shù)目。參見圖4的塊94。在一個(gè)實(shí)施例中,可以針對相應(yīng)單元按照多個(gè)倉之間的梯度分布并且為了包括該梯度分布、例如通過概率分布限定各特征描述符。在一個(gè)實(shí)施例中,多個(gè)特征描述符可以限定為=Diraroe = (Pi1, Pi2,. . . PiJ,其中Pi1,... Pin代表描述符為i的單元1... η中的梯度分布。各描述符的維數(shù)可以限定為η χ B,其中η為單元數(shù)目而B為倉數(shù)目。直接按照梯度分布(例如概率分布)限定特征描述符可以是有利的。就這一點(diǎn)而言,通過針對各單元將梯度信息表示為概率分布,可以通過基于χ、y梯度的概率最大位置并且基于聯(lián)合χ、y梯度分布的偏斜如上文所述有選擇地布置倉中心來有利地利用基礎(chǔ)梯度分布的統(tǒng)計(jì)。此外,可以使用距離測量(比如Kullback-Leiblier(KL)散度和推土機(jī)距離(EMD))比L-2范數(shù)更有效地比較概率分布。另外,如下文所述可以高效壓縮概率分布以創(chuàng)建位速率低的描述符。一旦已經(jīng)確定梯度分布并且已經(jīng)計(jì)算特征描述符,通信終端10和在一個(gè)實(shí)施例中該通信終端的處理器40可以壓縮由相應(yīng)單元中的梯度分布構(gòu)成的特征描述符。參見圖 4的操作96。例如,可以通過樹編碼(比如如在T. feigie的〃 Compressing Probability Distributions" (Inf. Process. Lett.,Vol. 97,No. 4,pp. 133-37(2006))中描述的 Gagie 樹編碼或者霍夫曼樹編碼)來壓縮梯度分布(并且又壓縮包括梯度分布的特征描述符)。 為了考慮這些樹編碼方式,令P = P1, P2,...隊(duì)為原有分布,而Q = q1 q2,...qn為針對相同樣本空間限定的有損壓縮概率分布。在利用霍夫曼樹編碼的實(shí)施例中,通過針對該分布構(gòu)造霍夫曼樹并且存儲各符號的霍夫曼代碼來構(gòu)造P,由此確保在兩個(gè)分布(P與Q)之間的KL散度DjPD(PllQ) < 1,并且需要Ofclogn)位空間。如果長度固定的代碼用來存儲各符號在霍夫曼樹中的深度,則可以用(n-1) [log(n-l)]位存儲霍夫曼樹。取而代之,如果利用Gagie樹編碼,則可以構(gòu)造分布Q使得D (P Il Q) < 1呢2 0+23_k),其中可以用確切kn-2位存儲Q??梢酝ㄟ^考慮Gagie和霍夫曼樹本身來理解在feigie與霍夫曼樹之間的不同。就這一點(diǎn)而言,Gagie樹有序,因此樹本身存儲整個(gè)分布P的信息。另一方面,霍夫曼樹無序, 因?yàn)榉柛怕试跇錁?gòu)建過程中被分類。因此,霍夫曼樹獲得1的更低D(P Il Q),但是與用于 Gagie樹的2n-2位比較需要更多位數(shù)(n_l) [log(n-l)]。與各單元中的梯度分布壓縮結(jié)合,位速率對于Gagie和霍夫曼樹而言均隨著倉數(shù)目增加而增加,特征描述符的性能也是如此。舉例而言但是并非限制,在圖9a中描繪了一個(gè)單元的梯度分布。在利用如圖7b中配置的五個(gè)倉的量化之后,在圖9b中描繪了所得直方圖。然后用霍夫曼和(iagie樹單獨(dú)壓縮這一直方圖而所得分布如圖9b中所示。對于相同初始分布P和相同所得壓縮分布Q,下面示出了 feigie(上)和霍夫曼(下)樹編碼方案
權(quán)利要求
1.一種方法,包括針對圖像的多個(gè)單元中的各單元確定多個(gè)梯度; 向多個(gè)倉中的相應(yīng)倉分配用于相應(yīng)單元的所述梯度;確定多個(gè)特征描述符,其中各特征描述符包括在相應(yīng)單元的所述多個(gè)倉之間的梯度分布的表示;以及壓縮所述多個(gè)特征描述符。
2.根據(jù)權(quán)利要求1所述的方法,還包括對所述多個(gè)特征描述符的壓縮表示進(jìn)行熵編碼。
3.根據(jù)權(quán)利要求1所述的方法,還包括提供所述多個(gè)特征描述符的壓縮表示的發(fā)送或存儲的至少一個(gè)。
4.根據(jù)權(quán)利要求1所述的方法,還包括在向相應(yīng)倉分配所述梯度之前選擇倉配置,其中選擇倉配置包括選擇具有在與概率最大的所述梯度重合的位置定位的倉并且在與所述梯度分布共同的方向上偏斜的倉配置。
5.根據(jù)權(quán)利要求1所述的方法,還包括在確定所述多個(gè)梯度之前將所述圖像劃分成多個(gè)單元。
6.根據(jù)權(quán)利要求1所述的方法,其中壓縮所述多個(gè)特征描述符包括利用樹編碼以壓縮所述多個(gè)特征描述符。
7.一種裝置,包括至少一個(gè)處理器和存儲計(jì)算機(jī)程序代碼的至少一個(gè)存儲器,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起配置成使所述裝置至少針對圖像的多個(gè)單元中的各單元確定多個(gè)梯度; 向多個(gè)倉中的相應(yīng)倉分配用于相應(yīng)單元的所述梯度;確定多個(gè)特征描述符,其中各特征描述符包括在相應(yīng)單元的所述多個(gè)倉之間的梯度分布的表示;以及壓縮所述多個(gè)特征描述符。
8.根據(jù)權(quán)利要求7所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起還配置成對所述多個(gè)特征描述符的壓縮表示進(jìn)行熵編碼。
9.根據(jù)權(quán)利要求7所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起還配置成提供所述多個(gè)特征描述符的壓縮表示的發(fā)送或存儲的至少一個(gè)。
10.根據(jù)權(quán)利要求7所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起還配置成在向相應(yīng)倉分配所述梯度之前通過選擇具有在與概率最大的所述梯度重合的位置定位的倉并且在與所述梯度分布共同的方向上偏斜的倉配置來選擇倉配置。
11.根據(jù)權(quán)利要求7所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起還配置成在確定所述多個(gè)梯度之前將所述圖像劃分成多個(gè)單兀。
12.根據(jù)權(quán)利要求7所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起配置成通過利用樹編碼以壓縮所述多個(gè)特征描述符來壓縮所述多個(gè)特征描述符。
13.一種方法,包括比較特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的多個(gè)預(yù)定壓縮表示;以及基于比較結(jié)果來標(biāo)識特征描述符的所述壓縮表示以代表預(yù)定義特征而不先解壓所述特征描述符。
14.根據(jù)權(quán)利要求13所述的方法,其中比較特征描述符的壓縮表示包括確定在特征描述符的所述壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的各預(yù)定壓縮表示之間的距離。
15.根據(jù)權(quán)利要求14所述的方法,其中標(biāo)識特征描述符的所述壓縮表示包括標(biāo)識由與特征描述符的所述壓縮表示隔開的距離比預(yù)定義閾值更少的特征描述符的所述預(yù)定壓縮表示代表的所述預(yù)定義特征。
16.根據(jù)權(quán)利要求13所述的方法,還包括提供關(guān)于所述預(yù)定義特征的信息。
17.一種裝置,包括至少一個(gè)處理器和存儲計(jì)算機(jī)程序代碼的至少一個(gè)存儲器,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起配置成使所述裝置至少比較特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的多個(gè)預(yù)定壓縮表示;以及基于比較結(jié)果來標(biāo)識特征描述符的所述壓縮表示以代表預(yù)定義特征而不先解壓所述特征描述符。
18.根據(jù)權(quán)利要求17所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起配置成通過確定在特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的各預(yù)定壓縮表示之間的距離來比較特征描述符的所述壓縮表示。
19.根據(jù)權(quán)利要求18所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起配置成通過標(biāo)識由與特征描述符的所述壓縮表示隔開的距離比預(yù)定義閾值更少的特征描述符的所述預(yù)定壓縮表示代表的所述預(yù)定義特征來標(biāo)識特征描述符的所述壓縮表示。
20.根據(jù)權(quán)利要求17所述的裝置,其中所述至少一個(gè)存儲器和存儲的計(jì)算機(jī)程序代碼與所述至少一個(gè)處理器一起還配置成提供關(guān)于所述預(yù)定義特征的信息。
全文摘要
可以提供一種用于生成可以由數(shù)目相對少的位代表的多個(gè)壓縮特征描述符、由此有助于發(fā)送和存儲特征描述符的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。也可以提供一種用于允許比較特征描述符的壓縮表示與相應(yīng)預(yù)定義特征的特征描述符的多個(gè)壓縮表示的方法、裝置和計(jì)算機(jī)程序產(chǎn)品。通過允許利用特征描述符的壓縮表示來執(zhí)行比較,可以標(biāo)識相應(yīng)特征描述符而無需先解壓特征描述符,由此潛在地增加可以標(biāo)識特征描述符的效率。
文檔編號G06T9/00GK102246165SQ200980150124
公開日2011年11月16日 申請日期2009年11月12日 優(yōu)先權(quán)日2008年11月12日
發(fā)明者B·吉羅德, G·塔卡斯, R·格澤茨克祖克, V·錢德拉塞克哈 申請人:斯坦福大學(xué), 諾基亞公司