專利名稱:用于使用局部原碼執(zhí)行特征提取的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的實施方式總體上涉及支持無線通信的機制,并且更具體地,涉及一種用于使用局部原碼執(zhí)行特征提取的方法和裝置。
背景技術(shù):
由于使用數(shù)字?jǐn)z影技術(shù)捕獲的圖像文件的數(shù)字特性,已經(jīng)開發(fā)了多種用于分析所捕獲圖像文件的機制。例如,已經(jīng)開發(fā)出包括臉部識別在內(nèi)的各種用于對象識別的技術(shù),用于從圖像文件中提取有意義的信息。許多對象識別技術(shù)依賴于特征提取來建立待標(biāo)識的對象的模型。用于對象識別的技術(shù)的一個常見示例經(jīng)由homo-Gaussian導(dǎo)數(shù)來使用局部二值模式(LBP)。雖然這些技術(shù)提供了用于對象識別的機制,但是包括LBP方法在內(nèi)的許多技術(shù)經(jīng)常涉及圖像文件的大量計算和處理用以執(zhí)行特征提取。另外,許多技術(shù)可能易受所捕獲圖像中噪聲的影響,從而導(dǎo)致被降級的識別性能。
發(fā)明內(nèi)容
所描述的方法和裝置用于使用局部原碼(LPC)來執(zhí)行特征提取。根據(jù)本發(fā)明的各種示例性實施方式,用于標(biāo)識圖像中基元(primitive)的特征提取可以基于LPC操作符來執(zhí)行,所述LPC操作符包括圖像中的原點塊和一個或多個弧塊。根據(jù)某些示例性實施方式, 原點塊可以包括圖像的一個或多個像素,并且某些或所有弧塊可以包括相同圖像的一個或多個像素。原點塊可以被確定為圖像中的一個或多個像素的任意塊。原點塊可以與所確定的弧、原點塊與該弧之間的距離以及弧定向相關(guān)聯(lián)?;谠摼嚯x和弧定向,可以確定該弧的位置?;K可以被確定位于該弧上。例如,弧可以具有位于預(yù)定位置的弧塊,諸如沿該弧位于相對等距的位置??梢源_定原點塊的灰度值和弧塊的灰度值并且進行比較以確定特征值。在某些示例性實施方式中,原點塊灰度值與弧塊灰度值之間的某些或所有比較可以標(biāo)識二進制數(shù)?;叶戎档谋容^可以用于結(jié)合弧塊的排序以組合二進制數(shù)來確定特征值。特征值可以表示圖像中標(biāo)識的基元,并且特征值可以用于促進對象識別。在此描述了本發(fā)明的各種示例性實施方式。一個示例性實施方式是一種用于使用局部原碼進行特征提取的方法。該示例方法包括確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。原點塊可以包括圖像的一個或多個像素。該示例方法還包括確定至少一個弧塊。對此,某些或所有弧塊可以包括一個或多個像素并且可以位于所述弧上,并且所述弧可以基于弧定向和距離、相對于原點塊進行定位。該示例方法還包括基于原點塊和至少一個弧塊的屬性來確定至少一個特征值。另一示例性實施方式是用于使用局部原碼進行特征提取的示例裝置。該示例裝置包括至少一個處理器以及包括計算機程序代碼的至少一個存儲器。所述至少一個存儲器和計算機程序代碼可以配置用于結(jié)合所述至少一個處理器使得該示例裝置或另一裝置執(zhí)行各種功能。例如,該示例裝置或其他裝置可以用于執(zhí)行確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。原點塊可以包括圖像的一個或多個像素。該示例裝置或另一裝置還可以用于執(zhí)行確定至少一個弧塊。對此,某些或所有弧塊可以包括一個或多個像素并且可以位于所述弧上,并且所述弧可以基于弧定向和距離、相對于原點塊進行定位。該示例裝置或另一裝置還用于執(zhí)行基于原點塊和至少一個弧塊的屬性來確定至少一個特征值。另一示例性實施方式是用于使用局部原碼進行特征提取的示例計算機程序產(chǎn)品。 該示例計算機程序產(chǎn)品包括至少一個其中存儲有可執(zhí)行的計算機可讀程序代碼指令的計算機可讀存儲介質(zhì)。該示例計算機程序產(chǎn)品的計算機可讀程序代碼指令配置用于確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。原點塊可以包括圖像的一個或多個像素。該示例計算機程序產(chǎn)品的計算機可讀程序代碼指令還配置用于確定至少一個弧塊。對此,某些或所有弧塊可以包括一個或多個像素并且可以位于所述弧上,并且所述弧可以基于弧定向和距離、相對于原點塊進行定位。該示例計算機程序產(chǎn)品的計算機可讀程序代碼指令進一步配置用于基于原點塊和至少一個弧塊的屬性來確定至少一個特征值。另一示例性實施方式是用于使用局部原碼進行特征提取的設(shè)備。該示例設(shè)備包括用于確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離的裝置。原點塊可以包括圖像的一個或多個像素。該示例設(shè)備還包括用于確定至少一個弧塊的裝置。對此,某些或所有弧塊可以包括一個或多個像素并且可以位于所述弧上,并且所述弧可以基于弧定向和距離、相對于原點塊進行定位。該示例設(shè)備還包括用于基于原點塊和至少一個弧塊的屬性來確定至少一個特征值的裝置。
已經(jīng)總體如此描述了本發(fā)明,現(xiàn)在將參考附圖,附圖并非一定是按比例描繪的,并且其中圖1圖示了根據(jù)本發(fā)明各種示例性實施方式的示例局部原碼操作符;圖2圖示了根據(jù)本發(fā)明各種示例性實施方式的用于實現(xiàn)局域原碼操作符以執(zhí)行特征提取的方法;圖3圖示了根據(jù)本發(fā)明各種示例性實施方式的附加局域原碼操作符;圖4圖示了根據(jù)本發(fā)明各種示例性實施方式的用于執(zhí)行臉部識別的示例方法;圖5圖示了根據(jù)本發(fā)明各種示例性實施方式的用于使用局域原碼進行特征提取的示例裝置的框圖;以及圖6圖示了根據(jù)本發(fā)明各種示例性實施方式的用于使用局域原碼進行特征提取的示例方法。
具體實施例方式現(xiàn)在,將在下文中參考附圖更全面地描述本發(fā)明的示例實施方式,附圖中示出了本發(fā)明的某些而不是所有實施方式。實際上,本發(fā)明可以體現(xiàn)為很多不同的形式并且不應(yīng)當(dāng)解釋為限于在此闡明的實施方式;相反,提供這些實施方式從而使得本公開內(nèi)容將滿足適用的法律要求。貫穿說明書,類似的參考標(biāo)號指代類似的元素。根據(jù)本發(fā)明的某些示例實施方式,術(shù)語“數(shù)據(jù)”、“內(nèi)容”、“信息”以及類似的術(shù)語可以可互換地使用以指代能夠被傳送、接收、操作和/或存儲的數(shù)據(jù)。根據(jù)本發(fā)明的示例性實施方式,在圖像(諸如數(shù)字圖像)上執(zhí)行經(jīng)由局域原碼(LPC)的特征提取以促進快速準(zhǔn)確的對象識別。根據(jù)各種示例性實施方式,LPC特征提取將對稱和/或非對稱LPC操作符應(yīng)用于圖像的區(qū)域,并且基于該區(qū)域中像素塊或像素的屬性以及與該操作符相關(guān)聯(lián)的方向順序關(guān)系可以確定特征值。LPC操作符因此可以用于以可能不同的比例和定向?qū)D像區(qū)域的局部紋理進行編碼以生成以二進制代碼形式出現(xiàn)的特征值。通過向圖像應(yīng)用多個LPC操作符,可以生成具有互補信息的多個經(jīng)過濾的特征圖,并且可以融合從特征圖得到的信息。所融合的特征圖可以用于促進高效的對象識別。本發(fā)明的示例性實施方式還可以用于執(zhí)行臉部識別。相對于依賴于 homo-Gaussian導(dǎo)數(shù)的臉部識別方案,本發(fā)明的示例性實施方式減少了計算成本并且增強了識別能力。減少的計算成本可以促進本發(fā)明的示例性實施方式在移動設(shè)備(諸如移動終端)上的應(yīng)用。本發(fā)明的示例性實施方式還提供了一種更具魯棒性的解決方案,該解決方案可以獲得更豐富的特征圖,所述特征圖對圖像噪聲具有改進的順應(yīng)力。可以經(jīng)由各種比例和定向的LPC操作符生成特征圖,并且該特征圖可以提供互補信息用于促進更加準(zhǔn)確的臉部識別。根據(jù)各種示例性實施方式,使用LPC操作符的特征提取可以用于執(zhí)行圖像的集合內(nèi)的臉部識別,繼而允許基于在所述圖像中識別的臉部對圖像進行排序。例如,可以考慮數(shù)字相冊,該數(shù)字相冊包括描述各種個體的集合中的照片集。本發(fā)明的示例性實施方式可以針對某些或所有照片執(zhí)行臉部識別和臉部校準(zhǔn)。對于某些或所有臉部而言,可以執(zhí)行使用 LPC操作符的特征提取。基于特征提取的結(jié)果,可以執(zhí)行臉部識別以標(biāo)識具有共同個體的照片。如此,照片集可以按照特定個體進行排序以生成只包括描述該特定個體的圖片的子集。如上文所述,本發(fā)明的示例性實施方式可以應(yīng)用于對象識別以及臉部識別(對象識別的一種)。雖然下文以及這里總體上所述的本發(fā)明的示例性實施方式可以在臉識別的上下文中進行描述,但是應(yīng)當(dāng)理解所述示例性實施方式同樣可應(yīng)用于一般的對象識別。根據(jù)本發(fā)明的示例性實施方式,臉部識別可以包括注冊和識別操作。針對注冊,可以經(jīng)由特征提取來收集和分析個體的臉部圖像。臉部圖像可以包括相關(guān)聯(lián)個體的各種代表示例。對此,隨著所考慮的圖像數(shù)目的增加,可以改進臉部識別能力。針對某些或所有臉部圖像,可以結(jié)合臉部檢測和臉部校準(zhǔn)過程將臉部標(biāo)準(zhǔn)化成預(yù)定大小。然后可以從標(biāo)準(zhǔn)化的臉部圖像中提取特征,并將其存儲到與身份相關(guān)聯(lián)的庫中。針對識別,可以從包括未知臉部的圖像中提取特征。該特征可以使用相似性評估器與注冊庫中的某些或所有特征進行比較。示例相似性評估器可以考慮各種距離度量之間的比較,諸如歐氏(Euclidean)距離度量(例如,Ll距離和/或L2距離)、最近歐氏距離或用于確定臉部相似度的其他距離度量。無論使用何種相似性評估器,都可以經(jīng)由特征提取生成所考慮的信息。如此,特征提取的質(zhì)量可以在生成準(zhǔn)確的臉部識別方面扮演重要的角色。根據(jù)各種示例性實施方式, 經(jīng)由LPC的特征提取可以從圖像中挖掘固有的個人信息,其可以允許使用用于識別的相對簡單的距離度量。結(jié)果,提高的時間和計算效率可以用于臉部識別以及提高識別準(zhǔn)確度。如上所述,經(jīng)由LPC操作符的特征提取可以涉及考慮像素屬性,其中像素基于經(jīng)由操作符確定的方向順序關(guān)系進行確定。根據(jù)各種示例性實施方式,可以評估像素塊的屬性。圖1描繪了示例LPC操作符50。LPC操作符50可以針對原點塊55、弧65、距離70和弧定向75進行定義。原點塊55可以包括一個或多個像素。不止一個像素的原點塊55可
6以采取任意形狀,諸如正方形、矩形、三角形、圓形等。原點塊陽可以位于圖像中的任意位置(例如,中心),并且可以針對相關(guān)聯(lián)的位置執(zhí)行特征提取。在某些示例性實施方式中,原點塊陽可以位于圖像中該原點塊陽中心的像素處,在該像素上執(zhí)行特征提取。還可以確定LPC操作符的參數(shù)。對此,可以確定弧65,該弧65可以關(guān)于原點塊55對稱或者可以關(guān)于原點塊陽非對稱。此外,還可以確定距離70和弧定向75。弧定向75可以由參考點與該弧上的點之間的角度值來表示?;诮?jīng)由確定參數(shù)的LPC操作符50的構(gòu)造,可以定義弧塊 60 (例如,弧塊60a和60b)。類似于原點塊55,弧塊60可以包括一個或多個像素并且弧塊 60可以是任意形狀。在某些示例性實施方式中,弧塊60可以位于沿弧65的預(yù)定位置,諸如位于沿弧65的等距位置。還可以確定弧塊的數(shù)目。例如,給定LPC操作符可以具有一個弧塊或多個弧塊。根據(jù)各種示例性實施方式,還可以定義弧塊60的順序從而定義弧塊60與原點塊55之間的順序關(guān)系。例如,可以確定逆時針順序,從而使得弧塊60a的順序在弧塊 60b之前。圖2描繪了用于實現(xiàn)示例LPC操作符來進行特征提取的示例過程。在100,考慮臉部圖像104并且示例LPC操作符105已經(jīng)被應(yīng)用于臉部圖像104中的確定位置。根據(jù)各種示例性實施方式,臉部檢測、校準(zhǔn)和標(biāo)準(zhǔn)化已經(jīng)預(yù)先執(zhí)行以生成臉部圖像104。在101,已經(jīng)確定原點塊110和弧塊11 和11 的灰度值(由圓圈內(nèi)表示像素的數(shù)目指示)。對此,在原點塊110只包括單個像素并且弧塊11 和11 只包括單個像素的示例性實施方式中,所述塊的相應(yīng)灰度值可以是包括在塊中的像素的灰度值。在原點塊110和/或弧塊115包括不止一個像素的示例性實施方式中,包括在每個相應(yīng)塊中像素的灰度值可以進行組合。例如,特定塊的像素的灰度值可以進行總和、平均或者可以使用灰度值的某些其他組合。在102,某些或所有弧塊的灰度值可以與原點塊110的灰度值進行比較。圖2的示例實現(xiàn)了二進制解決方案,從而如果弧塊的灰度值大于或等于原點塊的灰度值,則可以將該弧塊指派為1。另一方面,如果弧塊的灰度值小于原點塊的灰度值,則可以將該弧塊指派為0。針對在圖2的102描繪的情景,弧塊11 和11 兩者均具有大于原點塊 110的灰度值。如此,弧塊11 和11 兩者均被指派為1。注意,雖然本發(fā)明的某些示例性實施方式可以在塊的比較中使用灰度值,但是還可以使用包括在塊中的像素的其他屬性 (例如,紅、綠、藍(lán)值等)。在103,基于弧塊的定義逆時針順序,將弧塊的指派值連接起來。在103描繪的示例情景中,連接來自弧塊11 和11 中的1以生成二進制數(shù)“11”。根據(jù)各種示例實施方式,結(jié)果二進制數(shù)可以被轉(zhuǎn)換為十進制數(shù),在此情況中為數(shù)目“3”。經(jīng)轉(zhuǎn)換的數(shù)目可以指針對特征提取過程實例的特征值。根據(jù)圖2中所描繪的示例,特征值是與指派并連接的二進制數(shù)相關(guān)聯(lián)的經(jīng)轉(zhuǎn)換的十進制數(shù)。然而,本領(lǐng)域技術(shù)人員容易理解可以使用灰度值比較結(jié)果的任意類型的編號方案或表示以生成特征值。根據(jù)各種示例性實施方式,針對圖2描述的特征提取過程可以通過確定或選擇針對原點塊的不同位置以及以重復(fù)方式使用相同LPC操作符來進行重復(fù)。如此,可以針對給定圖像中的某些或所有位置(例如,中心像素)執(zhí)行特征提取。此外,可以修改LPC操作符 (例如,經(jīng)由確定不同的弧、不同的距離、不同的弧定向、不同大小的原點塊和/或弧塊以及 /或者不同數(shù)目或順序的弧塊),并且經(jīng)修改的LPC操作符可以用于生成圖像的不同特征提取。LPC操作符能夠?qū)w現(xiàn)在LPC操作符的可變圓半徑中的圖像像素或圖像塊(例如,原點塊和弧塊)之間的順序關(guān)系進行編碼。較大圖像塊之間的比較可以用于從圖像中挖掘更穩(wěn)定的特征而不是更細(xì)微的特征。圖3中描繪了不同LPC操作符的示例。沿著圖3的水平軸,可改變比較中圖像塊的數(shù)目以及LPC操作符的定向以獲得各種局部結(jié)果。沿著垂直軸, 可改變LPC操作符的半徑以用于從圖像中挖掘低頻特征或高頻特征。此外,還描繪了不同大小的原點塊和弧塊。另外,可以使用不同的弧(諸如,非圓形或非對稱的弧)。根據(jù)某些示例性實施方式,非對稱弧可以用于不規(guī)則的圖像基元紋理。如上所述,由于特征提取處理可以利用二進制對附近的塊或像素(當(dāng)此距離相對小時)的順序關(guān)系進行編碼,因此針對光線變化和圖像噪聲而言可以認(rèn)為該特征值具有魯棒性。具體地,由于減少了每個提取中所考慮塊或像素的數(shù)目,因此相對于LBP解決方案 (其涉及8個像素的比較)而言,不太可能將噪聲引入特征值。此外,由于經(jīng)由LPC操作符的特征提取可以沿著某些確定的弧定向提取圖像模式,因此可以針對特定定向獲得與特定通道相關(guān)聯(lián)的基元。對此,通道可以是圖像信息檢索器,例如經(jīng)由LPC操作符,其能夠輸出特定特征圖。來自不同通道的圖可以是互補信息。如此,由于經(jīng)由LPC操作符的特征提取可以沿著某一確定的弧定向提取圖像模式,因此可以針對特定定向獲得基元以檢索某些特定的圖像信息。結(jié)果,可以針對某些或所有定向來執(zhí)行特征提取以獲得關(guān)于圖像的互補信息。另外,由于所執(zhí)行的比較的數(shù)目受限于弧塊的數(shù)目(尤其當(dāng)塊包括單個像素時),特征提取可以在計算上花費較少并且需要較少的存儲器資源。結(jié)果,可以實現(xiàn)更快速的臉部識別解決方案。圖4圖示了根據(jù)本發(fā)明的各種示例性實施方式的示例臉部識別方法。如圖4所示, 基于LPC的臉部識別可以被分成三個操作,所述操作包括基于LPC的特征提取、關(guān)于LPC特征的直方圖統(tǒng)計以及判別子空間學(xué)習(xí)和融合。如上文所述,可以通過使用一個或多個LPC操作符以靈活的方式執(zhí)行基于LPC的特征提取,用于提取并標(biāo)識局部圖像紋理和結(jié)構(gòu)。此外,使用不同的LPC操作符可以生成關(guān)于給定圖像的信息池。對此,在140可以使用各種LPC操作符在圖像上執(zhí)行特征提取。特征值可以針對圖像中的某些或所有位置或像素獲得。例如,針對每個LPC操作符可以確定特征值,其中圖像的每個像素對應(yīng)于原點塊的位置。該結(jié)果在145可以被繪制為特征圖。對此,每個LPC操作符可以用于生成相應(yīng)的特征圖。例如,如果I個LPC操作符被用于給定情景,則LPC操作符Li (其中1 < i < I)可以用于生成特征值Di,其可以被繪制為特征圖。特征圖可以描述通過特征提取捕獲的圖像紋理。例如,由于LPC操作符的弧定向中的差異,每個特征圖可以提供與該圖像相關(guān)聯(lián)的互補信息。每個特征圖可以提供針對特定信息挖掘的統(tǒng)一用處。例如,通過特定比例和定向,可以在相關(guān)聯(lián)的通道中獲得圖像的局部圖像基元。在155,可以實現(xiàn)直方圖統(tǒng)計策略以進一步改進噪聲容差并且減少臉部校準(zhǔn)誤差。 此外,為了避免通過應(yīng)用直方圖策略損失臉部空間信息,特征圖01可以被分成J個圖塊(諸如在155所示),并且可以針對某些或所有圖塊來確定直方圖值。為了確定針對每個圖塊 P^其中1 < j < J)的直方圖值,可以確定圖塊Pj中出現(xiàn)特征值的計數(shù),并且可以生成相關(guān)聯(lián)的直方圖值~??梢詫⑨槍δ承┗蛩袌D塊的直方圖值連接至具有臉部空間信息的直方圖特征向量Hi = Ο^ ν··”。結(jié)果,針對某些或所有對應(yīng)的特征圖Di (其中1 < i < I) 可以生成直方圖特征向量Hi (其中1 < i < I)。因此,可以將基于圖塊的局部圖像信息編譯成直方圖特征向量。
基于直方圖特征值,可以在160執(zhí)行判別子空間學(xué)習(xí)和融合。對此,針對不止一個臉部圖像,判別方法(諸如線性判別分析(LDA))可以用于標(biāo)識和學(xué)習(xí)類別內(nèi)變化并且最大化類別間分離以改進臉部識別能力,其中類別包括給定個體的臉部圖像的集合。給出特定的LPC操作符,類別內(nèi)變化為類別中任意兩個臉部圖像的特征差異,并且類別間變化是來自任意兩個類別的任意兩個圖像的特征差異。對此,假設(shè)N個個體與用于注冊目的的M個臉部圖像相關(guān)聯(lián)。針對LPC操作符Li, 可以生成NXM直方圖特征向量??梢詫⒅狈綀D特征向量輸入至LDA學(xué)習(xí)機以獲得判別子空間S”考慮上述示例,如果存在I個LPC操作符,則可以生成I個子空間165。所生成的子空間可以在判別信息中互補,并且子空間的融合可以很大程度上改進臉部識別能力。根據(jù)各種示例性實施方式,求和融合規(guī)則可以用于決策層以組合所有子空間的識別得分。例如,給定臉部圖像t和子空間Si (其中1 < i < I),其子空間系數(shù)Vti通過向該子空間投射直方圖特征向量H來計算。針對子空間Si中獲得的任意兩個特征Vli和V2i,類似的得分Wi 可以通過使用某些距離度量(例如,歐氏距離)來進行估計。基于融合理論,當(dāng)不同的Si學(xué)習(xí)了不同的判別信息時,所有化(其中1 < i < I)的融合可以很大程度上改進臉部識別能力。在上面和此處總體上提供的描述說明了用于提取特征和執(zhí)行對象(例如,臉部) 識別的示例方法、示例裝置以及示例計算機程序產(chǎn)品。圖5以示例裝置200的形式圖示了本發(fā)明的示例性實施方式,示例裝置200被配置為執(zhí)行在此描述的本發(fā)明的各方面。裝置 200還可以被配置為執(zhí)行本發(fā)明的示例方法,諸如參考圖2、圖4和圖6而描述的那些。現(xiàn)在參考圖5,在某些示例性實施方式中,裝置200可以但不是必須體現(xiàn)為具有有線或無線通信能力的通信設(shè)備,或者裝置200作為具有有線或無線通信能力的通信設(shè)備的組件而被包括。在某些示例性實施方式中,裝置200可以包括計算機或移動終端或者被包括在計算機或移動終端內(nèi),諸如移動電話、便攜式數(shù)字助理(PDA)、尋呼機、移動電視、游戲設(shè)備、移動計算機、筆記本計算機、相機、錄像機、音頻/視頻播放器、無線電、和/或全球定位系統(tǒng)(GPQ設(shè)備、上述各項的任何組合等。示例裝置200包括以下各項或者以其他方式與以下各項進行通信處理器205、存儲器設(shè)備210、操作符參數(shù)選擇器235和特征值生成器M0。在某些實施方式中,示例裝置 200可以可選地包括通信接口 215、包括圖像捕獲設(shè)備的用戶接口 225和/或?qū)ο髽?biāo)識器。 處理器205可以體現(xiàn)為實現(xiàn)本發(fā)明示例實施方式的各種功能性的各種裝置,包括例如微處理器、協(xié)處理器、控制器、諸如ASIC(專用集成電路)、FPGA(現(xiàn)場可編程門陣列)、或硬件加速器之類的專用集成電路、處理電路等。根據(jù)一個示例實施方式,處理器205可以代表協(xié)調(diào)操作的多個處理器。處理器205可以但并非必須包括一個或多個伴隨的數(shù)字信號處理器。 在某些示例實施方式中,處理器205被配置為執(zhí)行存儲在存儲器設(shè)備210中的指令或者處理器205可以用其他方式訪問的指令。這樣,無論是配置為硬件還是經(jīng)由存儲在計算機可讀存儲介質(zhì)上的指令或者通過其組合進行配置,當(dāng)進行了相應(yīng)配置時,處理器205都可以是能夠執(zhí)行根據(jù)本發(fā)明實施方式的操作的實體。因此,在處理器205體現(xiàn)為ASIC、FPGA等的示例實施方式中,處理器205是被特別配置的、用于實施在此描述的操作的硬件。備選地,在處理器205體現(xiàn)為對存儲在計算機可讀存儲介質(zhì)上的指令的執(zhí)行者的示例實施方式中,這些指令將處理器205特別地配置為執(zhí)行在此描述的算法和操作。在某些示例實施方式中,處理器205是特定設(shè)備(例如移動終端)的處理器,其中通過經(jīng)由所執(zhí)行的指令將處理器205進一步配置用于執(zhí)行在此描述的算法和操作來將該特定設(shè)備配置用于采用本發(fā)明的示例實施方式。存儲器設(shè)備210可以是可以包括易失性存儲器和/或非易失性存儲器的一個或多個計算機可讀存儲介質(zhì)。在某些示例實施方式中,存儲器設(shè)備210包括隨機存取存儲器 (RAM),包括動態(tài)和/或靜態(tài)RAM、片上或片外高速緩存存儲器等等。進一步,存儲器設(shè)備210 可以包括非易失性存儲器,其可以是嵌入式的和/或可移除的,并且可以包括例如只讀存儲器、閃速存儲器、磁存儲設(shè)備(例如硬盤、軟盤驅(qū)動器、磁帶等)、光盤驅(qū)動器和/或介質(zhì)、 非易失性隨機存取存儲器(NVRAM)等等。存儲器設(shè)備210可以包括用于臨時存儲數(shù)據(jù)的高速緩存區(qū)域。對此,某些或所有存儲器設(shè)備210可以包括在處理器205內(nèi)。進一步,存儲器設(shè)備210可以被配置為存儲用于使得處理器205和示例裝置200 能夠執(zhí)行根據(jù)在此描述的本發(fā)明示例實施方式的各種功能的信息、數(shù)據(jù)、應(yīng)用、計算機可讀程序代碼指令等。例如,存儲器設(shè)備210可以被配置為對用于由處理器205處理的輸入數(shù)據(jù)進行緩沖。附加地或備選地,存儲器設(shè)備210可以被配置為存儲用于由處理器205執(zhí)行的指令。通信接口 215可以是以硬件、計算機程序產(chǎn)品或硬件和計算機程序產(chǎn)品的結(jié)合而實現(xiàn)的任何設(shè)備和裝置,被配置為從/向與示例性設(shè)備200通信的網(wǎng)絡(luò)和/或任何其他設(shè)備或模塊接收和/或發(fā)送數(shù)據(jù)。處理器205還可以被配置為通過例如控制包括在通信接口 215內(nèi)的硬件來促進經(jīng)由通信接口的通信。對此,通信接口 215可以包括例如一個或多個天線、發(fā)射器、接收器、收發(fā)器和/或支持硬件,包括用于實現(xiàn)與網(wǎng)絡(luò)220的通信的處理器。經(jīng)由通信接口 215和網(wǎng)絡(luò)220,示例裝置200可以用設(shè)備到設(shè)備的方式以及/或者通過經(jīng)由基站、接入點、服務(wù)器、網(wǎng)關(guān)、路由器等的間接通信與各種其他網(wǎng)絡(luò)實體通信。通信接口 215可以被配置為根據(jù)任何有線或無線通信標(biāo)準(zhǔn)提供通信。通信接口 215可以被配置為支持諸如多輸入多輸出(MIMO)環(huán)境之類的多天線環(huán)境中的通信。進一步,通信接口 215可以被配置為支持正交頻分復(fù)用(OFDM)信令。在某些示例實施方式中, 該通信接口 215可以被配置為根據(jù)各種技術(shù)進行通信,這些技術(shù)諸如第二代QG)無線通信協(xié)議IS-136 (時分多址(TDMA))、GSM(全球移動通信系統(tǒng))、IS-95 (碼分多址(CDMA))、第三代(3G)無線通信協(xié)議(諸如通用移動電信系統(tǒng)(UMTS)、CDMA2000、寬帶CDMA (WCDMA)以及時分-同步CDMA(TD-SCDMA))、3. 9代(3. 9G)無線通信協(xié)議(諸如演進的通用陸地?zé)o線接入網(wǎng)絡(luò)(E-UTRAN)),以及第四代GG)無線通信協(xié)議、先進國際移動電信(IMT-Advanced) 協(xié)議、包括LTE-advanced的長期演進(LTE)協(xié)議等。進一步,通信接口 215可以被配置為根據(jù)如下技術(shù)提供通信,這些技術(shù)諸如射頻(RF)、紅外(IrDA)或者多種不同的無線聯(lián)網(wǎng)技術(shù)中的任何一種,包括諸如 IEEE 802. 11(例如 802. Ila,802. lib,802. Ilg,802. Iln 等)之類的WLAN技術(shù)、無線局域網(wǎng)(WLAN)協(xié)議、諸如IEEE 802. 16之類的微波接入全球互操作性(WiMAX)技術(shù)以及/或者諸如IEEE 802. 15、藍(lán)牙(BT)、BT的低功率版本、超寬帶(UWB)、 Wibree、Zigbee等等之類的無線個域網(wǎng)絡(luò)(WPAN)技術(shù),等等。通信接口 215還可以被配置為可能地經(jīng)由因特網(wǎng)協(xié)議(IP)來支持網(wǎng)絡(luò)層處的通信。用戶接口 225可以與處理器205通信以經(jīng)由用戶接口 225接收用戶輸入以及/或者將輸出作為例如可聽的、視覺的、機械的或者其他輸出指示呈現(xiàn)給用戶。用戶接口 225可以包括例如鍵盤、鼠標(biāo)、操縱桿、顯示器(例如觸摸屏顯示器)、麥克風(fēng)、揚聲器或者其他輸入/輸出機制。根據(jù)各種示例性實施方式,用戶接口 225可以包括硬件和/或軟件用于支持圖像捕獲設(shè)備(諸如,相機模塊)的操作。圖像捕獲設(shè)備可以配置用于捕獲可以根據(jù)本發(fā)明的示例性實施方式起作用的圖像。示例裝置200的操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符245 可以是任何如下裝置或設(shè)備,其部分地或整體地體現(xiàn)為硬件、計算機程序產(chǎn)品或者硬件和計算機程序產(chǎn)品的組合,諸如實現(xiàn)所存儲的指令以配置示例裝置200的處理器205,或者硬件配置的處理器205,其被配置為執(zhí)行在此描述的操作符參數(shù)選擇器235、特征值生成器 240和/或?qū)ο髽?biāo)識符245的功能。在示例性實施方式中,處理器205包括或控制操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符M5。操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符245可以部分地或整體地體現(xiàn)為類似于處理器205但與處理器205分立的處理器。對此,操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符 245可以與處理器205通信。在各種示例實施方式中,操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符245可以部分地或整體地駐留在不同的裝置上,從而使得操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符245的某些或所有功能性可以由第一裝置執(zhí)行,并且操作符參數(shù)選擇器235、特征值生成器240和/或?qū)ο髽?biāo)識符M5的其余功能性可以由一個或多個其他裝置執(zhí)行。操作符參數(shù)選擇器235可以配置用于使得裝置200或另一裝置執(zhí)行各種功能。對此,操作符參數(shù)選擇器235可以配置用于可能經(jīng)由選擇來確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。原點塊可以包括圖像的一個或多個像素。在某些示例性實施方式中,選定的弧可以是非對稱弧。操作符參數(shù)選擇器235還可以配置用于可能經(jīng)由選擇來確定至少一個弧塊。某些或所有弧塊可以包括一個或多個像素并且可以被確定使得某些或所有弧塊位于該弧上。此外,該弧可以基于弧定向和距離而相對于原點塊來定位。特征值生成器240可以配置用于使得裝置200或另一裝置執(zhí)行各種功能。對此, 特征值生成器240可以配置用于基于原點塊和至少一個弧塊的屬性來確定至少一個特征值。對此,根據(jù)某些示例性實施方式,原點塊和至少一個弧塊的屬性可以是與塊相關(guān)聯(lián)的灰度值。特征值生成器240因此可以配置用于確定針對原點塊的原點塊灰度值以及針對至少一個弧塊的至少一個弧塊灰度值,并且基于原點塊灰度值與至少一個弧塊灰度值之間的比較確定特征值。該特征值還可以基于至少一個弧塊的預(yù)定順序來確定。根據(jù)某些示例性實施方式,特征值生成器240還可以配置用于組合或聚集一個或多個特征值。對此,特征值生成器240可以配置用于包括特征圖中的至少一個特征值。特征圖可以包括多個特征值。特征值生成器240還可以配置用于將特征圖劃分成多個圖塊。 針對某些或所有圖塊,特征值生成器240可以配置用于基于相應(yīng)圖塊中出現(xiàn)共同特征值的數(shù)目來確定相應(yīng)的圖塊直方圖值。在生成針對某些或所有圖塊的圖塊直方圖值之后,特征值生成器240可以配置用于連接圖塊直方圖值以生成直方圖特征向量。在某些示例性實施方式中,特征值生成器240可以進一步配置用于基于直方圖特征向量通過執(zhí)行線性判別分析來生成至少一個子空間。對象標(biāo)識符245可以配置用于使得裝置200或另一裝置執(zhí)行各種功能。對此,對象標(biāo)識符245可以配置用于確定對象的身份。在某些示例性實施方式中,待標(biāo)識的對象可以是個體的臉部。對象可以通過將多個生成的特征值與特征值庫進行比較從而找到匹配來進行標(biāo)識。圖2、圖4和圖6圖示了根據(jù)本發(fā)明示例實施方式的示例系統(tǒng)、方法和/或計算機程序產(chǎn)品的一個或多個流程圖。應(yīng)當(dāng)理解,流程圖的每個塊或操作和/或流程圖中的塊或操作的組合可以由各種裝置來實現(xiàn)。用于實現(xiàn)流程圖的每個塊或操作、流程圖中的塊或操作的組合或者在此描述的本發(fā)明示例實施方式的其他功能性的裝置可以包括硬件和/或計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)具有存儲在其中的一個或多個計算機程序代碼指令、程序指令或者可執(zhí)行計算機可讀程序代碼指令。對此,程序代碼指令可以存儲在示例裝置(諸如示例裝置200)的存儲器設(shè)備(諸如存儲器設(shè)備210)上并且由處理器(諸如處理器20 執(zhí)行。應(yīng)當(dāng)意識到,可以從計算機可讀存儲介質(zhì)將任何這種程序代碼指令加載到計算機或其他可編程裝置(例如處理器205、 存儲器設(shè)備210)上以產(chǎn)生特定機器,從而使得該特定機器變?yōu)橛糜趯崿F(xiàn)在流程圖的塊或操作中指定的功能的裝置。這些程序代碼指令還可以存儲在計算機可讀存儲介質(zhì)中,該計算機可讀存儲介質(zhì)能夠引導(dǎo)計算機、處理器或者其他可編程裝置以特定方式運轉(zhuǎn)從而生成特定機器或特定制品。存儲在計算機可讀存儲介質(zhì)中的指令可以產(chǎn)生制品,其中該制品成為用于實現(xiàn)在流程圖的塊或操作中指定的功能的裝置。程序代碼指令可以從計算機可讀存儲介質(zhì)獲取并且加載到計算機、處理器或者其他可編程裝置中以將計算機、處理器或者其他可編程裝置配置為執(zhí)行要在計算機、處理器或者其他可編程裝置上執(zhí)行或者要由計算機、處理器或者其他可編程裝置執(zhí)行的操作。程序代碼指令的獲取、加載和執(zhí)行可以順序地執(zhí)行,從而使得一次獲取、加載和執(zhí)行一條指令。在某些示例實施方式中,獲取、加載和/或執(zhí)行可以并行地執(zhí)行,從而使得一起獲取、加載和/或執(zhí)行多個指令。程序代碼指令的執(zhí)行可以產(chǎn)生計算機實現(xiàn)的處理,從而使得由計算機、處理器或者其他可編程裝置執(zhí)行的指令提供用于實現(xiàn)在流程圖的塊或操作中指定的功能的操作。相應(yīng)地,由處理器執(zhí)行與流程圖的塊或操作相關(guān)聯(lián)的指令或者在計算機可讀存儲介質(zhì)中存儲與流程圖的塊或操作相關(guān)聯(lián)的指令支持用于執(zhí)行指定功能的操作的組合。還應(yīng)當(dāng)理解,流程圖的一個或多個塊或操作以及流程圖中的塊或操作的組合可以由執(zhí)行指定功能的基于專用硬件的計算機系統(tǒng)和/或處理器或者專用硬件和程序代碼指令的組合來實現(xiàn)。圖6描繪了使用局部原碼進行特征提取的示例方法的一個或多個流程圖。一個示例方法包括在300,可能經(jīng)由選擇來確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。原點塊可以包括圖像的一個或多個像素。在某些示例性實施方式中,弧可以是非對稱弧。示例方法還可以包括在305,可能經(jīng)由選擇來確定至少一個弧塊。某些或所有弧塊可以包括一個或多個像素并且可以被確定使得某些或所有弧塊位于該弧上。此外,該弧可以基于弧定向和距離、相對于原點塊進行定位。在310,該示例方法可以包括基于原點塊和至少一個弧塊的屬性來確定至少一個特征值。對此,根據(jù)某些示例性實施方式,原點塊和至少一個弧塊的屬性可以是與塊相關(guān)聯(lián)的灰度值。為了確定該至少一個特征值,該示例方法可以包括確定針對原點塊的原點塊灰度值以及針對至少一個弧塊的至少一個弧塊灰度值,并且基于原點塊灰度值與至少一個弧塊灰度值之間的比較確定特征值。該特征值還可以基于至少一個弧塊的預(yù)定順序來確定。
根據(jù)某些示例性實施方式,該示例方法還可以包括組合或聚集一個或多個特征值。對此,在315,該至少一個特征值可以包括在特征圖中。特征圖可以包括多個特征值。 在320,特征圖被劃分成多個圖塊。針對某些或所有圖塊,在325,基于相應(yīng)圖塊中出現(xiàn)共同特征值的數(shù)目來確定相應(yīng)的圖塊直方圖值。在生成針對某些或所有圖塊的圖塊直方圖值之后,在330,可以連接圖塊直方圖值以生成直方圖特征向量。在某些示例性實施方式中,在 335,基于直方圖特征向量通過執(zhí)行線性判別分析來生成至少一個子空間。此外,在一些示例性實施方式中,示例性方法可以包括在340,確定對象的身份。 在一些示例性實施方式中,將要被標(biāo)識的對象可以是個體的臉部??梢酝ㄟ^將多個特征值與特征值庫進行比較以找到匹配來標(biāo)識對象。本領(lǐng)域技術(shù)人員可以想到在此闡明的本發(fā)明的很多修改和其他實施方式,對于這些修改和實施方式,所附的本發(fā)明具有在前述描述和相關(guān)聯(lián)的附圖中呈現(xiàn)的啟示的權(quán)益。 因此,應(yīng)當(dāng)理解,本發(fā)明不應(yīng)當(dāng)限于所公開的特定實施方式并且修改和其他實施方式旨在包括在所附權(quán)利要求書的范圍內(nèi)。另外,雖然前述描述和相關(guān)聯(lián)的附圖在元素和/或功能的特定示例組合的上下文中描述了示例實施方式,但應(yīng)當(dāng)意識到,在不脫離所附權(quán)利要求書的范圍的情況下,可以通過備選實施方式提供元素和/或功能的不同組合。對此,例如, 還考慮了上面明確描述的那些組合以外的元素和/或功能的不同組合,正如可能在所附的某些權(quán)利要求中闡明的那樣。雖然在此采用了特定術(shù)語,但它們僅僅是在一般性和描述性的意義上被使用的,而并非出于限制的目的。
1權(quán)利要求
1.一種方法,包括確定圖像中的原點塊、弧、弧定向以及所述原點塊與所述弧之間的距離,所述原點塊包括所述圖像的一個或多個像素;確定至少一個弧塊,所述弧塊位于所述弧上,并且所述弧基于所述弧定向和所述距離、 相對于所述原點塊進行定位,所述至少一個弧塊包括所述圖像的一個或多個像素;以及基于所述原點塊和所述至少一個弧塊的屬性來經(jīng)由處理器確定至少一個特征值。
2.根據(jù)權(quán)利要求1所述的方法,其中確定所述至少一個特征值包括確定針對所述原點塊的原點塊灰度值以及針對所述至少一個弧塊的至少一個弧塊灰度值;以及基于所述原點塊灰度值與所述至少一個弧塊灰度值之間的比較和所述至少一個弧塊的順序來確定所述特征值。
3.根據(jù)權(quán)利要求1所述的方法,進一步包括將所述至少一個特征值包括到特征圖中,所述特征圖包括多個特征值; 將所述特征圖劃分成多個圖塊;基于相應(yīng)圖塊中出現(xiàn)共同特征值的數(shù)目來確定相應(yīng)塊直方圖值;以及連接所述塊直方圖值以生成直方圖特征向量。
4.根據(jù)權(quán)利要求3所述的方法,進一步包括基于所述直方圖特征向量通過執(zhí)行線性判別分析來生成至少一個子空間。
5.根據(jù)權(quán)利要求1所述的方法,其中確定所述弧包括確定非對稱的弧。
6.根據(jù)權(quán)利要求1所述的方法,進一步包括通過將包括所述特征值的多個特征值與特征值庫進行比較以找到匹配來確定對象的身份。
7.一種裝置,其包括至少一個處理器以及包括計算機程序代碼的至少一個存儲器,所述至少一個存儲器和所述計算機程序代碼配置用于結(jié)合所述至少一個處理器使得所述裝置或其他裝置至少執(zhí)行以下功能確定圖像中的原點塊、弧、弧定向以及所述原點塊與所述弧之間的距離,所述原點塊包括所述圖像的一個或多個像素;確定至少一個弧塊,所述弧塊位于所述弧上,并且所述弧基于所述弧定向和所述距離、 相對于所述原點塊進行定位,所述至少一個弧塊包括所述圖像的一個或多個像素;以及基于所述原點塊和所述至少一個弧塊的屬性來確定至少一個特征值。
8.根據(jù)權(quán)利要求7所述的裝置,其中使得所述裝置或所述其他裝置執(zhí)行確定至少一個特征值包括使得其執(zhí)行如下功能確定針對所述原點塊的原點塊灰度值以及針對所述至少一個弧塊的至少一個弧塊灰度值;以及基于所述原點塊灰度值與所述至少一個弧塊灰度值之間的比較和所述至少一個弧塊的順序來確定所述特征值。
9.根據(jù)權(quán)利要求7所述的裝置,其中進一步使得所述裝置或所述其他裝置執(zhí)行 將所述至少一個特征值包括到特征圖中,所述特征圖包括多個特征值;將所述特征圖劃分成多個圖塊;基于相應(yīng)圖塊中出現(xiàn)共同特征值的數(shù)目來確定相應(yīng)塊直方圖值;以及連接所述塊直方圖值以生成直方圖特征向量。
10.根據(jù)權(quán)利要求9所述的裝置,其中進一步使得所述裝置或所述其他裝置執(zhí)行基于所述直方圖特征向量通過執(zhí)行線性判別分析來生成至少一個子空間。
11.根據(jù)權(quán)利要求7所述的裝置,其中使得所述裝置或所述其他裝置執(zhí)行確定所述弧包括使得其執(zhí)行確定非對稱的弧。
12.根據(jù)權(quán)利要求7所述的裝置,其中使得所述裝置或所述其他裝置進一步執(zhí)行通過將包括所述特征值的多個特征值與特征值庫進行比較以找到匹配來確定對象的身份。
13.根據(jù)權(quán)利要求7所述的裝置,其中進一步使得所述裝置或所述其他裝置執(zhí)行捕獲所述圖像。
14.根據(jù)權(quán)利要求7所述的裝置,其中所述裝置或所述其他裝置包括移動終端。
15.—種包括至少一個計算機可讀存儲介質(zhì)的計算機程序產(chǎn)品,所述計算機可讀存儲介質(zhì)中存儲有可執(zhí)行的計算機可讀程序代碼指令,所述計算機可讀程序代碼指令配置用于確定圖像中的原點塊、弧、弧定向以及所述原點塊與所述弧之間的距離,所述原點塊包括所述圖像的一個或多個像素;確定至少一個弧塊,所述弧塊位于所述弧上,并且所述弧基于所述弧定向和所述距離、 相對于所述原點塊進行定位,所述至少一個弧塊包括所述圖像的一個或多個像素;以及基于所述原點塊和所述至少一個弧塊的屬性來確定至少一個特征值。
16.根據(jù)權(quán)利要求15所述的計算機程序產(chǎn)品,所述計算機可讀程序代碼指令配置用于確定至少一個特征值,包括配置用于確定針對所述原點塊的原點塊灰度值以及針對所述至少一個弧塊的至少一個弧塊灰度值;以及基于所述原點塊灰度值與所述至少一個弧塊灰度值之間的比較和所述至少一個弧塊的順序來確定所述特征值。
17.根據(jù)權(quán)利要求15所述的計算機程序產(chǎn)品,其中所述計算機可讀程序代碼指令進一步配置用于將所述至少一個特征值包括到特征圖中,所述特征圖包括多個特征值;將所述特征圖劃分成多個圖塊;基于相應(yīng)圖塊中出現(xiàn)共同特征值的數(shù)目來確定相應(yīng)塊直方圖值;以及連接所述塊直方圖值以生成直方圖特征向量。
18.根據(jù)權(quán)利要求17所述的計算機程序產(chǎn)品,其中所述計算機可讀程序代碼指令進一步配置用于基于所述直方圖特征向量通過執(zhí)行線性判別分析來生成至少一個子空間。
19.根據(jù)權(quán)利要求15所述的計算機程序產(chǎn)品,其中所述計算機可讀程序代碼指令配置用于確定所述弧包括配置用于確定非對稱的弧。
20.根據(jù)權(quán)利要求15所述的計算機程序產(chǎn)品,其中所述計算機可讀程序代碼指令進一步配置用于通過將包括所述特征值的多個特征值與特征值庫進行比較以找到匹配來確定對象的身份。
全文摘要
提供了用于使用局部原碼進行特征提取的各種方法。一個示例方法包括確定圖像中的原點塊、弧、弧定向以及原點塊與弧之間的距離。對此,原點塊可以包括所述圖像的一個或多個像素。該示例方法還包括確定至少一個弧塊。對此,該弧塊可以位于該弧上,并且該弧可以基于弧定向和距離、相對于原點塊進行定位。某些或所有至少一個弧塊可以包括圖像的一個或多個像素。該示例方法還包括基于原點塊和所述至少一個弧塊的屬性來確定至少一個特征值。同樣提供了類似和相關(guān)的示例方法和示例裝置。
文檔編號G06K9/62GK102439606SQ201080022544
公開日2012年5月2日 申請日期2010年5月17日 優(yōu)先權(quán)日2009年5月22日
發(fā)明者徐磊, 李江偉, 汪孔橋 申請人:諾基亞公司