欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

旋轉(zhuǎn)不變對(duì)象特征辨識(shí)的制作方法

文檔序號(hào):12612446閱讀:280來(lái)源:國(guó)知局
旋轉(zhuǎn)不變對(duì)象特征辨識(shí)的制作方法與工藝

本發(fā)明大體上涉及對(duì)象和特征檢測(cè),且更特定來(lái)說(shuō)涉及旋轉(zhuǎn)不變對(duì)象特征辨識(shí)。



背景技術(shù):

隨著相機(jī)和其它監(jiān)視裝置變得越來(lái)越便宜,這些裝置在增殖。隨著這些裝置增殖,相機(jī)和裝置用于所捕獲圖像和視頻中的對(duì)象和特征檢測(cè)。



技術(shù)實(shí)現(xiàn)要素:

揭示一種方法。所述方法可包含接收?qǐng)D像數(shù)據(jù)且確定指示所述圖像數(shù)據(jù)中的多個(gè)塊中的每一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述塊包含主塊和外塊且所述外塊圍繞所述主塊。在一個(gè)實(shí)施例中,所述塊中的每一者包含大于一個(gè)的奇數(shù)個(gè)像素,且每一塊中的像素的奇數(shù)數(shù)目是相同的。在一個(gè)實(shí)施例中,每一塊以像素的中心為中心。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的每一者之間的外部像素,其中所述外部像素不貢獻(xiàn)于指示所述塊中的任一者的平均強(qiáng)度的值。所述方法可包含將指示所述主塊的平均強(qiáng)度的值與指示所述外塊中的每一者的平均強(qiáng)度的每一值進(jìn)行比較,且通過(guò)基于所述比較產(chǎn)生特性數(shù)字而量化由所述圖像數(shù)據(jù)表示的特征。

此方法可使得例如相機(jī)等裝置能夠以有限的處理能力(例如相機(jī)的有限處理能力)檢測(cè)或辨識(shí)圖像和/或視頻中的特征或?qū)ο?。如果?duì)象辨識(shí)由相機(jī)執(zhí)行,那么此方法可通過(guò)在壓縮和/或編碼且發(fā)射到不同裝置之前使用由相機(jī)捕獲的圖像數(shù)據(jù)(例如,來(lái)自圖像處理管線中任何地方的圖像數(shù)據(jù))用于較好的特征定量來(lái)改善檢測(cè)。如果對(duì)象辨識(shí)不由相機(jī)執(zhí)行而是由服務(wù)器或更有力的計(jì)算機(jī)執(zhí)行,那么此方法允許服務(wù)器更快速地處理更多圖像。

在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述塊中的兩個(gè)塊內(nèi)的共同內(nèi)部像素,且所述共同內(nèi)部像素貢獻(xiàn)于指示所述兩個(gè)塊中的每一者的平均強(qiáng)度的每一值。此實(shí)施例(例如,塊和像素的配置)允許所述方法在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),一個(gè)實(shí)施例(例如,塊和像素的配置)可允許所述方法對(duì)塊執(zhí)行較少的計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在一個(gè)實(shí)施例中,所述方法可包含接收?qǐng)D像數(shù)據(jù)且確定指示所述圖像數(shù)據(jù)中的多個(gè)塊中的每一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述塊包含主塊和外塊且所述外塊圍繞所述主塊。在一個(gè)實(shí)施例中,所述外塊中的每一者具有三個(gè)、五個(gè)或多于五個(gè)像素。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的至少一者之間的外部像素,其中所述外部像素不貢獻(xiàn)于指示所述塊中的任一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述塊中的兩個(gè)塊內(nèi)的共同內(nèi)部像素,其中所述共同內(nèi)部像素貢獻(xiàn)于指示所述塊中的所述兩個(gè)塊的平均強(qiáng)度的值。所述方法可包含將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值進(jìn)行比較,且通過(guò)基于所述比較產(chǎn)生特性數(shù)字而量化由所述圖像數(shù)據(jù)表示的特征。

在一個(gè)實(shí)施例中,每一塊包含奇數(shù)個(gè)像素且以像素的中心為中心。在一個(gè)實(shí)施例中,每一塊包含偶數(shù)個(gè)像素且僅覆蓋完整像素。這些實(shí)施例(例如,塊和像素的配置)允許所述方法在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),所述方法可對(duì)塊執(zhí)行較少計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以定量特征。

在一個(gè)實(shí)施例中,所述方法包含量化由圖像數(shù)據(jù)表示的特征。所述方法可進(jìn)一步包含接收?qǐng)D像數(shù)據(jù)且確定指示所述圖像數(shù)據(jù)中的多個(gè)塊中的每一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述塊包含主塊和外塊,所述外塊圍繞所述主塊,所述外塊中的每一者具有大于一個(gè)的奇數(shù)個(gè)像素,每一塊在像素上位于中心,每一塊中的像素的所述奇數(shù)數(shù)目是相同的,且所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的每一者之間的外部像素,其中所述外部像素不貢獻(xiàn)于指示所述主塊的平均強(qiáng)度的值且不貢獻(xiàn)于指示所述外塊中的任一者的平均強(qiáng)度的值。所述方法可包含將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值進(jìn)行比較,且通過(guò)基于所述比較產(chǎn)生特性數(shù)字而量化由所述圖像數(shù)據(jù)表示的特征。

此方法可使得例如相機(jī)等裝置能夠以有限的處理能力(例如相機(jī)的有限處理能力)檢測(cè)或辨識(shí)圖像和/或視頻中的特征或?qū)ο?。如果?duì)象辨識(shí)由相機(jī)執(zhí)行,那么此方法可通過(guò)在壓縮和/或編碼且發(fā)射到不同裝置之前使用由相機(jī)捕獲的圖像數(shù)據(jù)(例如,來(lái)自圖像處理管線中任何地方的圖像數(shù)據(jù))用于較好的特征定量來(lái)改善檢測(cè)。如果對(duì)象辨識(shí)不由相機(jī)執(zhí)行而是由服務(wù)器或更有力的計(jì)算機(jī)執(zhí)行,那么此方法允許服務(wù)器例如更快速地處理更多圖像。

在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述塊中的兩個(gè)塊內(nèi)的共同內(nèi)部像素,其中所述共同內(nèi)部像素貢獻(xiàn)于指示所述塊中的所述兩個(gè)塊的平均強(qiáng)度的值。這些實(shí)施例(例如,塊和像素的配置)允許所述方法在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),一個(gè)實(shí)施例(例如,塊和像素的配置)可允許所述方法對(duì)塊執(zhí)行較少的計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在另一實(shí)施例中,所述方法可包含接收?qǐng)D像數(shù)據(jù)且確定指示所述圖像數(shù)據(jù)中的多個(gè)塊中的每一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述塊包含主塊和外塊且所述外塊圍繞所述主塊。所述外塊中的每一者可具有三個(gè)、五個(gè)或多于五個(gè)像素。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的至少一者之間的外部像素,其中所述外部像素不貢獻(xiàn)于指示所述主塊的平均強(qiáng)度的值且不貢獻(xiàn)于指示所述外塊的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述塊中的兩個(gè)塊內(nèi)的共同內(nèi)部像素,其中所述共同內(nèi)部像素貢獻(xiàn)于指示所述塊中的所述兩個(gè)塊的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述方法包含將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值進(jìn)行比較,且通過(guò)基于所述比較產(chǎn)生特性數(shù)字而量化由所述圖像數(shù)據(jù)表示的特征。

在一個(gè)實(shí)施例中,每一塊包含奇數(shù)個(gè)像素且以像素的中心為中心。在一個(gè)實(shí)施例中,每一塊包含偶數(shù)個(gè)像素且僅覆蓋完整像素。在一個(gè)實(shí)施例中,每一塊中的像素的數(shù)目是相同的。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的每一者之間的外部像素,且所述外部像素不貢獻(xiàn)于指示所述塊中的任一者的平均強(qiáng)度的值。這些實(shí)施例(例如,塊和像素的配置)允許所述方法在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),一個(gè)實(shí)施例(例如,塊和像素的配置)可允許所述方法對(duì)塊執(zhí)行較少的計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在一個(gè)實(shí)施例中,量化所述特征可包含將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值中的每一者進(jìn)行比較且以二進(jìn)制值表示比較。

在一個(gè)實(shí)施例中,所述方法可包含通過(guò)使外塊與主塊間隔一段距離以避免主塊與所述外塊中的至少一者鄰接來(lái)確定圍繞主塊的外塊的位置。在一個(gè)實(shí)施例中,所述方法可包含確定圍繞主塊的外塊的位置以使得所述外塊中的每一者以像素的中心為中心。這些實(shí)施例(例如,塊和像素的配置)允許所述方法在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),一個(gè)實(shí)施例(例如,塊和像素的配置)可允許所述方法對(duì)塊執(zhí)行較少的計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在一個(gè)實(shí)施例中,所述主塊涵蓋主位置,且所述方法可包含確定與所述圖像數(shù)據(jù)相關(guān)聯(lián)的在所述主位置周?chē)姆较?,以及基于所述方向確定圍繞所述主塊的外塊的位置。在一個(gè)實(shí)施例中,確定所述方向可包含確定在所述主位置附近的所述圖像數(shù)據(jù)的強(qiáng)度的梯度方向。這些實(shí)施例可允許所述方法(例如,特征的確定)為“旋轉(zhuǎn)不變的”。

還揭示一種裝置。在一個(gè)實(shí)施例中,所述裝置可包含用以存儲(chǔ)圖像數(shù)據(jù)的存儲(chǔ)器。所述裝置可包含處理器以確定指示所述圖像數(shù)據(jù)中的多個(gè)塊中的每一者的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述塊包含主塊和外塊,所述外塊圍繞所述主塊,所述外塊中的每一者具有三個(gè)、五個(gè)或多于五個(gè)像素。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)可描述位于所述主塊與所述外塊中的至少一者之間的外部像素。所述外部像素可不貢獻(xiàn)于指示所述主塊的平均強(qiáng)度的值且不貢獻(xiàn)于指示所述外塊的平均強(qiáng)度的值。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)可描述位于所述塊中的兩個(gè)塊內(nèi)的共同內(nèi)部像素,其中所述共同內(nèi)部像素貢獻(xiàn)于指示所述塊中的所述兩個(gè)塊的平均強(qiáng)度的值。所述處理器可經(jīng)配置以將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值進(jìn)行比較,且通過(guò)基于所述比較產(chǎn)生特性數(shù)字而量化所述圖像數(shù)據(jù)內(nèi)表示的對(duì)象的特征。

如果所述裝置是相機(jī),那么所述相機(jī)可能夠在一個(gè)實(shí)施例中以所述相機(jī)中存在的有限處理能力來(lái)檢測(cè)或辨識(shí)圖像和/或視頻中的特征或?qū)ο?。如果?duì)象辨識(shí)由相機(jī)執(zhí)行,那么此方法可通過(guò)在壓縮和/或編碼且發(fā)射到不同裝置之前使用由相機(jī)捕獲的圖像數(shù)據(jù)(例如,來(lái)自圖像處理管線中任何地方的圖像數(shù)據(jù))用于較好的特征定量來(lái)改善檢測(cè)。如果所述裝置是具有更有力的處理器的服務(wù)器,那么所述服務(wù)器可更快速地處理更多圖像。

在一個(gè)實(shí)施例中,每一塊包含奇數(shù)個(gè)像素且以像素的中心為中心。在一個(gè)實(shí)施例中,每一塊包含偶數(shù)個(gè)像素且僅覆蓋完整像素。在一個(gè)實(shí)施例中,每一塊中的像素的數(shù)目是相同的。在一個(gè)實(shí)施例中,所述圖像數(shù)據(jù)描述位于所述主塊與所述外塊中的每一者之間的外部像素。在一個(gè)實(shí)施例中,所述外部像素不貢獻(xiàn)于指示所述塊中的任一者的所述平均強(qiáng)度的所述值。這些實(shí)施例(例如,塊和像素的配置)允許所述裝置在一些情形中利用硬件優(yōu)化。舉例來(lái)說(shuō),所述裝置可對(duì)塊執(zhí)行較少計(jì)算(例如,無(wú)需外插)。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在一個(gè)實(shí)施例中,所述處理器經(jīng)配置以將指示所述主塊的平均強(qiáng)度的值與指示所述外塊的平均強(qiáng)度的值中的每一者進(jìn)行比較且以二進(jìn)制值表示比較。

在一個(gè)實(shí)施例中,所述處理器經(jīng)配置以通過(guò)使所述外塊與所述主塊間隔一段距離以避免所述主塊與所述外塊中的至少一者鄰接來(lái)確定圍繞所述主塊的所述外塊的位置。在一個(gè)實(shí)施例中,所述處理器經(jīng)配置以確定圍繞主塊的外塊的位置以使得所述外塊中的每一者以像素的中心為中心。這些實(shí)施例(例如,塊和像素的配置)允許所述裝置在一些情形中利用硬件優(yōu)化。此實(shí)施例(例如,塊和像素的配置)允許所述裝置在一些情形中利用硬件優(yōu)化。作為另一實(shí)例,實(shí)施例使塊的配置較好地匹配于對(duì)應(yīng)特征以較好地定量特征。

在一個(gè)實(shí)施例中,所述主塊涵蓋主位置,且所述處理器經(jīng)配置以確定與所述圖像數(shù)據(jù)相關(guān)聯(lián)的在所述主位置周?chē)姆较颉K鎏幚砥骺山?jīng)配置以基于所述方向確定圍繞所述主塊的外塊的位置。在一個(gè)實(shí)施例中,所述處理器經(jīng)配置以通過(guò)確定在所述主位置附近的所述圖像數(shù)據(jù)的強(qiáng)度的梯度方向而確定所述方向。這些實(shí)施例可允許所述裝置確定特征以便為“旋轉(zhuǎn)不變的”。

附圖說(shuō)明

圖1A說(shuō)明在一個(gè)實(shí)施例中監(jiān)視具有對(duì)象的區(qū)域的示范性監(jiān)視裝置(例如,相機(jī));

圖1B說(shuō)明其中可實(shí)施本文所描述的實(shí)施例的另一示范性環(huán)境;

圖2是說(shuō)明在一個(gè)實(shí)施例中的監(jiān)視裝置(例如,相機(jī))的示范性組件的框圖;

圖3是在一個(gè)實(shí)施例中的計(jì)算模塊的示范性組件的框圖;

圖4A是說(shuō)明圖2的相機(jī)110的示范性功能組件的框圖;

圖4B是說(shuō)明圖1B的訓(xùn)練裝置的示范性功能組件的框圖;

圖5A說(shuō)明具有像素的圖像的示范性部分;

圖5B說(shuō)明在一個(gè)實(shí)施例中的示范性算子;

圖5C說(shuō)明在另一個(gè)實(shí)施例中的示范性算子;

圖5D說(shuō)明與平均強(qiáng)度值相關(guān)聯(lián)的圖5A的示范性算子;

圖5E說(shuō)明與二進(jìn)制閾值強(qiáng)度值相關(guān)聯(lián)的圖5B的示范性算子;

圖5F說(shuō)明具有用于確定梯度方向的區(qū)域的圖5A的示范性算子;

圖6是用于確定用于量化圖像的特征的算子的示范性過(guò)程的流程圖;以及

圖7A說(shuō)明根據(jù)一個(gè)實(shí)施例的梯度方向的確定;

圖7B、7C、7D和7E說(shuō)明圖5B的算子中的主塊和外塊的位置的確定;

圖7F說(shuō)明在一個(gè)實(shí)施例中用于量化圖像的特征的算子;

圖8說(shuō)明在另一個(gè)實(shí)施例中的示范性算子;

圖9A將圖5B的算子與更理想化的算子進(jìn)行比較;

圖9B將圖8的算子與更理想化的算子進(jìn)行比較;

圖10A說(shuō)明在另一個(gè)實(shí)施例中的示范性算子;

圖10B將圖10A的算子與更理想化的算子進(jìn)行比較;

圖11A說(shuō)明在另一個(gè)實(shí)施例中的示范性算子;

圖11B將圖11A的算子與更理想化的算子進(jìn)行比較;

圖12A說(shuō)明在另一個(gè)實(shí)施例中的示范性算子;以及

圖12B將圖12A的算子與更理想化的算子進(jìn)行比較。

具體實(shí)施方式

以下詳細(xì)描述參考附圖。不同附圖中的相同參考標(biāo)號(hào)識(shí)別相同或相似元件。

包含已經(jīng)部署的傳統(tǒng)相機(jī)的相機(jī)可能具有有限處理能力來(lái)執(zhí)行圖像處理(例如對(duì)象檢測(cè)或辨識(shí)、對(duì)比度增強(qiáng)等)。相機(jī)的有限處理能力使得對(duì)象和特征辨識(shí)(例如,由相機(jī)對(duì)由圖像數(shù)據(jù)表示的特征和/或?qū)ο蟮谋孀R(shí))與處理能力不是限制因素的情況相比更具挑戰(zhàn)性。雖然服務(wù)器計(jì)算機(jī)可能具有比相機(jī)更多的處理能力,但在一些情況下服務(wù)器可能并不良好地適合于執(zhí)行對(duì)象辨識(shí)。即,服務(wù)器可能遠(yuǎn)離相機(jī)定位,且相機(jī)與服務(wù)器之間的帶寬可能是有限的。另外,在將圖像或視頻發(fā)射到另一裝置之前,相機(jī)可更改圖像數(shù)據(jù)(例如,解馬賽克和/或有損壓縮)以節(jié)省帶寬。如果相機(jī)將圖像數(shù)據(jù)(經(jīng)壓縮或從圖像處理管線中的任何地方)發(fā)射到服務(wù)器用于對(duì)象辨識(shí),那么所述數(shù)據(jù)發(fā)射花費(fèi)時(shí)間,且這樣做會(huì)增加在捕獲圖像后辨識(shí)對(duì)象所花費(fèi)的時(shí)間。因此,服務(wù)器可能不能容易存取由相機(jī)捕獲的最佳圖像數(shù)據(jù),且可能不具有最佳數(shù)據(jù)來(lái)執(zhí)行對(duì)象或特征辨識(shí)??稍黾酉鄼C(jī)的處理能力以用于增強(qiáng)的對(duì)象辨識(shí)(例如,與服務(wù)器相當(dāng)),或者服務(wù)器可放置為靠近相機(jī),但這樣做增加了相機(jī)的成本且/增加了安裝系統(tǒng)的復(fù)雜性。然而,上述這些次最優(yōu)解決方案可使用且并入到本文所描述的方法和系統(tǒng)用于改進(jìn)的性能。

下文描述的方法和系統(tǒng)使得相機(jī)能夠在一個(gè)實(shí)施例中以相機(jī)的有限處理能力來(lái)檢測(cè)或辨識(shí)圖像和/或視頻中的特征或?qū)ο?。此外,如果辨識(shí)由相機(jī)執(zhí)行,那么所述方法和系統(tǒng)可在例如壓縮且發(fā)射到不同裝置之前使用由相機(jī)捕獲的圖像數(shù)據(jù)。即使下文描述的實(shí)施例使得具有有限處理能力的相機(jī)能夠檢測(cè)圖像中的特征,下文所描述的方法也可由除相機(jī)外的具有更有力的處理器的裝置使用,例如服務(wù)器。在此情況下,下文描述的方法和系統(tǒng)可允許服務(wù)器例如以給定處理能力更快速地處理更多圖像。服務(wù)器也可以更適合于處理以具有極高分辨率(例如,超高清)的傳感器獲取的圖像。

圖1A是示范性環(huán)境100A的圖,其可包含監(jiān)視具有對(duì)象102的區(qū)域106的監(jiān)視裝置110(例如,相機(jī))。對(duì)象102可包含人、動(dòng)物、交通工具、交通工具上的牌照等。由監(jiān)視裝置110捕獲的對(duì)象102的圖像可包含允許識(shí)別或辨識(shí)對(duì)象102的特征。在圖1A的實(shí)例中的監(jiān)視裝置110是具有外殼108的相機(jī)(其可被稱(chēng)為相機(jī)110)。

監(jiān)視裝置110(例如,相機(jī))可包含用于捕獲受監(jiān)視區(qū)域106的圖像的一或多個(gè)裝置。監(jiān)視裝置110可包含(例如)使用可見(jiàn)光、紅外光和/或其它不可見(jiàn)電磁輻射(例如,用于雷達(dá)成像的雷達(dá))捕獲圖像數(shù)據(jù)的攝像機(jī)。所捕獲圖像數(shù)據(jù)可包含連續(xù)圖像序列(例如,視頻)、有限圖像序列、靜態(tài)圖像和/或其組合。監(jiān)視裝置110可包含用于捕獲且數(shù)字化圖像的數(shù)碼相機(jī)和/或用于捕獲圖像且以模擬格式存儲(chǔ)圖像數(shù)據(jù)的模擬相機(jī)。

監(jiān)視裝置110可辨識(shí)所捕獲的那些對(duì)象的圖像中的對(duì)象的特征。監(jiān)視裝置110可基于所捕獲圖像是否具有匹配于例如與對(duì)象相關(guān)聯(lián)的“表征特征”的特征而辨識(shí)對(duì)象。所述表征特征可在“訓(xùn)練”期間確定,且所述表征特征可存儲(chǔ)在監(jiān)視裝置110中。雖然圖1A中未圖示,但表征特征的產(chǎn)生(即,訓(xùn)練)可由與監(jiān)視裝置110分開(kāi)的訓(xùn)練裝置執(zhí)行。圖1B是包含訓(xùn)練裝置140的另一示范性環(huán)境100B的框圖。

如圖1B中所示,環(huán)境100B可包含監(jiān)視裝置110、網(wǎng)絡(luò)120以及訓(xùn)練裝置140。環(huán)境100B還可包含管理站130。裝置110可包含裝置110-A到110-N(共同地稱(chēng)為“裝置110”及個(gè)別地稱(chēng)為“裝置110”)。如上所述,監(jiān)視裝置110可包含可產(chǎn)生布置成一或多個(gè)二維陣列的數(shù)據(jù)(例如,圖像數(shù)據(jù)或視頻數(shù)據(jù))的傳感器。監(jiān)視裝置110及其傳感器可包含相機(jī)(例如熱傳感相機(jī))、雷達(dá)(例如,用于雷達(dá)成像)等。在另一實(shí)施例中,裝置110可包含控制器以及連接到所述控制器的一或多個(gè)外圍設(shè)備(例如相機(jī))。監(jiān)視裝置110可例如在物理門(mén)禁系統(tǒng)(PACS)中使用以識(shí)別嘗試進(jìn)入安全區(qū)域的人。

網(wǎng)絡(luò)120可使得環(huán)境100B中的裝置能夠彼此通信。舉例來(lái)說(shuō),裝置110可與彼此和管理站130通信,和/或管理站130可與裝置110中的任一者通信。網(wǎng)絡(luò)120可包含一或多個(gè)電路交換網(wǎng)絡(luò)和/或包交換網(wǎng)絡(luò)。舉例來(lái)說(shuō),網(wǎng)絡(luò)120可包含局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、城域網(wǎng)(MAN)、公共交換電話網(wǎng)絡(luò)(PSTN)、特用網(wǎng)絡(luò)、無(wú)線網(wǎng)狀網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)、因特網(wǎng)、基于光纖的網(wǎng)絡(luò)、無(wú)線網(wǎng)絡(luò),和/或這些或其它類(lèi)型的網(wǎng)絡(luò)的組合。

裝置110可通過(guò)網(wǎng)絡(luò)120將數(shù)據(jù)發(fā)送到管理站130。舉例來(lái)說(shuō),相機(jī)110可將圖像或視頻流式傳輸?shù)焦芾碚?30用于人在顯示器上觀看。管理站130和訓(xùn)練裝置140還可通過(guò)網(wǎng)絡(luò)120將數(shù)據(jù)發(fā)送到裝置110。舉例來(lái)說(shuō),訓(xùn)練裝置140可將表征特征發(fā)送到相機(jī)110以用于檢測(cè)與那些表征特征相關(guān)聯(lián)的對(duì)象。

管理站130和訓(xùn)練裝置140可包含經(jīng)配置以用于與裝置110通信的任何計(jì)算裝置。舉例來(lái)說(shuō),管理站130和訓(xùn)練裝置140可包含個(gè)人計(jì)算機(jī)或工作站(例如,具有監(jiān)視器、鍵盤(pán)、鼠標(biāo)等)、服務(wù)器裝置、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、便攜式通信裝置(例如,移動(dòng)電話、智能電話和/或另一類(lèi)型的無(wú)線裝置)、服務(wù)器裝置,和/或具有計(jì)算和通信能力的任何類(lèi)型的裝置。

訓(xùn)練裝置140可包含計(jì)算機(jī)以輸入圖像和/或視頻且確定圖像和/或圖像中的對(duì)象的表征特征。相機(jī)110可使用所述表征特征用于檢測(cè)受監(jiān)視區(qū)域106的圖像或視頻中的那些對(duì)象或特征。舉例來(lái)說(shuō),訓(xùn)練裝置140可接收具有牌照的交通工具的數(shù)千個(gè)圖像且確定牌照的表征特征。相機(jī)110可使用這些表征特征以確定牌照(例如,交通工具上)何時(shí)已進(jìn)入受監(jiān)視區(qū)域106。表征特征還可描述牌照上的數(shù)位。因此,在相機(jī)110確定牌照在圖像中之后,相機(jī)110還可例如確定出現(xiàn)在牌照上的字符。

雖然圖1A和1B展示環(huán)境100A及100B的示范性組件,但在其它實(shí)施方案中,環(huán)境100A及100B可包含與圖1A和1B中所描繪的情況相比更少的組件、不同的組件、不同布置的組件或額外的組件。另外或替代地,任何一個(gè)裝置(或任何裝置群組)可執(zhí)行描述的如由一或多個(gè)其它裝置執(zhí)行的功能。舉例來(lái)說(shuō),相機(jī)110或管理站130也可執(zhí)行訓(xùn)練(即,描述為由訓(xùn)練裝置140執(zhí)行)。

圖2是說(shuō)明在一個(gè)實(shí)施例中實(shí)施為相機(jī)110的監(jiān)視裝置的示范性組件的圖。如圖2中所示,相機(jī)110可包含光學(xué)元件鏈210、傳感器陣列240、信號(hào)處理器250以及控制器260。

光學(xué)元件鏈210可包含罩殼,其將入射輻射(例如,光、可見(jiàn)光、紅外波、毫米波等)引導(dǎo)到傳感器陣列240以基于入射輻射捕獲圖像。光學(xué)元件鏈210可包含透鏡230以及傳感器陣列240。透鏡230可將來(lái)自受監(jiān)視區(qū)域106的入射輻射收集且聚焦到傳感器陣列240上。

傳感器陣列240可包含用于記錄、感測(cè)和測(cè)量入射或下落到傳感器陣列240上的輻射(例如,光)的傳感器的陣列。所述輻射可在可見(jiàn)光波長(zhǎng)范圍、紅外波長(zhǎng)范圍或其它波長(zhǎng)范圍中。傳感器陣列240可包含例如電荷耦合裝置(CCD)陣列和/或有源像素陣列(例如,互補(bǔ)型金屬氧化物半導(dǎo)體(CMOS)傳感器陣列)。傳感器陣列240還可包含微測(cè)輻射熱計(jì)(例如,當(dāng)相機(jī)110包含熱傳感相機(jī)或檢測(cè)器時(shí))。

傳感器陣列240輸出指示(例如,描述性質(zhì)或特性)入射在傳感器陣列240上的輻射(例如,光)的數(shù)據(jù)。舉例來(lái)說(shuō),從傳感器陣列240輸出的數(shù)據(jù)可包含例如入射在傳感器陣列240中的一或多個(gè)像素上的光的強(qiáng)度(例如,明度)、顏色等信息。入射在傳感器陣列240上的光可為“圖像”,因?yàn)樗龉饪捎捎谕哥R230而聚焦。傳感器陣列240可視為“圖像傳感器”,因?yàn)槠涓袦y(cè)下落在傳感器陣列240上的圖像。在本文使用所述術(shù)語(yǔ)時(shí),“圖像”包含指示入射在傳感器陣列240上的輻射(例如,描述光的性質(zhì)或特性)的數(shù)據(jù)。因此,術(shù)語(yǔ)“圖像”也可用以意味著“圖像傳感器數(shù)據(jù)”或描述圖像的任何數(shù)據(jù)。此外,“像素”可意味著傳感器陣列240的對(duì)于其進(jìn)行輻射測(cè)量(例如,指示入射在傳感器陣列240上的光的測(cè)量值)的任何區(qū)或區(qū)域。像素可對(duì)應(yīng)于傳感器陣列240中的一或多個(gè)(或少于一個(gè))傳感器。

信號(hào)處理器250對(duì)由傳感器陣列240捕獲的圖像數(shù)據(jù)執(zhí)行信號(hào)處理操作。控制器260可控制信號(hào)處理器250以及相機(jī)110的其余部分的操作??刂破?60(例如,與信號(hào)處理器250結(jié)合)可對(duì)圖像執(zhí)行信號(hào)處理,例如對(duì)象辨識(shí)。下文更詳細(xì)地描述控制器260和/或信號(hào)處理器250的操作。

雖然圖2展示相機(jī)110的示范性組件,但在其它實(shí)施方案中,相機(jī)110可包含與圖2中所描繪的情況相比更少的組件、不同的組件、不同布置的組件或額外的組件。另外或替代地,相機(jī)110的一或多個(gè)組件可執(zhí)行描述的如由相機(jī)110的一或多個(gè)其它組件執(zhí)行的功能。舉例來(lái)說(shuō),控制器260可執(zhí)行描述的如由信號(hào)處理器250執(zhí)行的功能,且反之亦然。

圖3是說(shuō)明在一個(gè)實(shí)施例中計(jì)算模塊300的示范性組件的框圖。相機(jī)110中的控制器260和/或信號(hào)處理器250可包含計(jì)算模塊300。管理站130和訓(xùn)練裝置140還可包含計(jì)算模塊300。如圖3中所展示,計(jì)算模塊300可包含總線310、處理器320、存儲(chǔ)器330和通信接口340。在一些實(shí)施方案中,計(jì)算模塊300還可包含輸入裝置370和輸出裝置380。

總線310包含準(zhǔn)許計(jì)算模塊300的組件或其它裝置之間的通信的路徑。處理器320可包含解譯且執(zhí)行指令的任何類(lèi)型的單核處理器、多核處理器、微處理器、基于鎖存器的處理器和/或處理邏輯(或處理器、微處理器和/或處理邏輯的系列)。在其它實(shí)施例中,處理器320可包含專(zhuān)用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)和/或另一類(lèi)型的集成電路或處理邏輯。處理器320可包含硬件加速器322,例如圖形處理單元(GPU)。在一些實(shí)施例中,硬件加速器322可包含ASIC、FPGA、另一類(lèi)型的集成電路、一或多個(gè)專(zhuān)用集成電路(例如,具有硬接線數(shù)字和/或模擬電路)等。硬件加速器322可實(shí)施于與處理器320不同的芯片上或作為處理器320的部分。

存儲(chǔ)器330可包含存儲(chǔ)信息及/或指令的任何類(lèi)型的易失性和/或非易失性存儲(chǔ)裝置。存儲(chǔ)器330可包含隨機(jī)存取存儲(chǔ)器(RAM)或任何類(lèi)型的動(dòng)態(tài)存儲(chǔ)裝置、只讀存儲(chǔ)器(ROM)裝置或任何類(lèi)型的靜態(tài)存儲(chǔ)裝置、內(nèi)容可尋址存儲(chǔ)器(CAM)、磁性或光學(xué)記錄存儲(chǔ)器裝置及其對(duì)應(yīng)驅(qū)動(dòng)器,或可裝卸式存儲(chǔ)器裝置。存儲(chǔ)器330可存儲(chǔ)信息和指令(例如,應(yīng)用程序334和操作系統(tǒng)332)和數(shù)據(jù)(例如,應(yīng)用程序數(shù)據(jù)336)供處理器320使用。

存儲(chǔ)器330可存儲(chǔ)指令用于由處理器320和/或硬件加速器322執(zhí)行。軟件指令可從另一計(jì)算機(jī)可讀媒體或從另一裝置讀取到存儲(chǔ)器330中。包含于存儲(chǔ)器330中的軟件指令可致使處理器320執(zhí)行本文所描述的方法。替代地,硬接線電路(例如,邏輯)可以代替軟件指令或與軟件指令結(jié)合而實(shí)施本文所描述的方法。因此,本文所描述的實(shí)施方案不限于硬件電路和軟件的任何特定組合。

操作系統(tǒng)332可包含用于管理計(jì)算模塊300的硬件和軟件資源的軟件指令。舉例來(lái)說(shuō),操作系統(tǒng)332可包含Linux、Windows、OS X、安卓、嵌入式操作系統(tǒng)等。取決于特定計(jì)算模塊300存在于其中的裝置,應(yīng)用程序334和應(yīng)用程序數(shù)據(jù)336可提供網(wǎng)絡(luò)服務(wù)或包含應(yīng)用程序。

通信接口340可包含使得計(jì)算模塊300能夠與其它組件、裝置和/或系統(tǒng)通信的收發(fā)器(例如,發(fā)射器和/或接收器)。通信接口340可經(jīng)由無(wú)線通信(例如,射頻、紅外等)、有線通信或其組合而通信。通信接口340可包含將基帶信號(hào)轉(zhuǎn)換為射頻(RF)信號(hào)或反之亦然的收發(fā)器,且可耦合到天線。

通信接口340可包含邏輯組件,其包含輸入和/或輸出端口、輸入和/或輸出系統(tǒng)和/或促進(jìn)向其它裝置的數(shù)據(jù)發(fā)射的其它輸入和輸出組件。舉例來(lái)說(shuō),通信接口340可包含用于有線通信的網(wǎng)絡(luò)接口卡(例如,以太網(wǎng)卡)或用于無(wú)線通信的無(wú)線網(wǎng)絡(luò)接口(例如,WiFi)卡。

計(jì)算模塊300(例如,相機(jī)110、管理站130和/或訓(xùn)練裝置140中的控制器260和/或信號(hào)處理器250)可執(zhí)行與圖像中的對(duì)象的檢測(cè)及檢測(cè)圖像中的對(duì)象相關(guān)的操作。舉例來(lái)說(shuō),訓(xùn)練裝置140可確定對(duì)象的表征特征,且相機(jī)110可搜索圖像是否有那些表征特征以識(shí)別對(duì)象。計(jì)算模塊300(作為相機(jī)110或訓(xùn)練裝置140的部分)可響應(yīng)于處理器320執(zhí)行包含于計(jì)算機(jī)可讀媒體(例如存儲(chǔ)器330)中的軟件指令而執(zhí)行這些操作。

例如訓(xùn)練裝置140或管理站130等一些裝置還可包含輸入裝置370和輸出裝置380。輸入裝置370可使得用戶能夠?qū)⑿畔⑤斎氲接?jì)算模塊300中。輸入裝置370可包含鍵盤(pán)、鼠標(biāo)、筆、麥克風(fēng)、相機(jī)、觸摸屏顯示器等。輸出裝置380可向用戶輸出信息。輸出裝置380可包含顯示器、打印機(jī)、揚(yáng)聲器等。輸入裝置370和輸出裝置380可使得用戶能夠與由計(jì)算模塊300執(zhí)行的應(yīng)用程序進(jìn)行交互。

計(jì)算模塊300可包含有助于接收、發(fā)射和/或處理數(shù)據(jù)的其它組件(未圖示)。此外,計(jì)算模塊300中的組件的其它配置是可能的。在其它實(shí)施方案中,計(jì)算模塊300可包含與圖3中所描繪的情況相比更少的組件、不同的組件、額外的組件或不同布置的組件。另外或替代地,計(jì)算模塊300的一或多個(gè)組件可執(zhí)行描述的如由計(jì)算模塊300的一或多個(gè)其它組件執(zhí)行的一或多個(gè)任務(wù)。

圖4A是說(shuō)明相機(jī)110的示范性功能組件(例如,控制器260和/或信號(hào)處理器250)的框圖。相機(jī)110的功能組件可例如在計(jì)算機(jī)模塊300(即,使用來(lái)自存儲(chǔ)器330的數(shù)據(jù)(例如,應(yīng)用程序數(shù)據(jù)336)執(zhí)行指令(例如,應(yīng)用程序334)的處理器320和/或硬件加速器322)中實(shí)施。

如圖4A所示,相機(jī)110可包含對(duì)象辨識(shí)邏輯450和存儲(chǔ)層480。對(duì)象辨識(shí)邏輯450對(duì)圖像傳感器數(shù)據(jù)(例如,作為輸入)操作且執(zhí)行對(duì)象辨識(shí)(例如,確定圖像數(shù)據(jù)是否包含與對(duì)象相關(guān)聯(lián)的特征)。存儲(chǔ)層480可采用存儲(chǔ)器330,且對(duì)象辨識(shí)可采用處理器320和/或硬件加速器322。對(duì)象辨識(shí)邏輯450使用存儲(chǔ)層480存儲(chǔ)與對(duì)象相關(guān)聯(lián)的圖像數(shù)據(jù)482和表征特征數(shù)據(jù)庫(kù)(DB)486。對(duì)象辨識(shí)邏輯450可采用算子邏輯460、方向邏輯470、強(qiáng)度邏輯475和閾值邏輯477來(lái)檢測(cè)圖像數(shù)據(jù)中的特征,如下所述。相機(jī)110還可使用搜索邏輯465以系統(tǒng)地在圖像或視頻中搜索特征和/或?qū)ο蟆?/p>

如上文所論述,對(duì)象辨識(shí)邏輯450對(duì)圖像數(shù)據(jù)(例如,作為輸入)操作。圖5A說(shuō)明以像素503(單一地“像素503”)表示的示范性圖像502(或圖像的部分502)。對(duì)象辨識(shí)邏輯450可對(duì)圖像502執(zhí)行計(jì)算。在此實(shí)例中,圖像502包含299個(gè)像素(即,13像素乘23像素矩形)。圖像502(或圖像的部分502)可更大或更小。圖5A中的虛線對(duì)應(yīng)于像素503之間的邊界。

像素503可對(duì)應(yīng)于傳感器陣列240的針對(duì)其記錄輻射的測(cè)量(例如,指示入射在傳感器陣列240上的光的測(cè)量值)的任何區(qū)或區(qū)域。像素503還可對(duì)應(yīng)于傳感器陣列240中的一或多個(gè)(或少于一個(gè))傳感器。像素503可對(duì)應(yīng)于單色傳感器區(qū)。像素503可對(duì)應(yīng)于從一或多個(gè)單色傳感器外插的全色區(qū)。即,像素503可為由傳感器陣列240捕獲的圖像數(shù)據(jù)的抽象(例如,原始圖像數(shù)據(jù)或來(lái)自圖像處理管線中的任何地方)。

像素503還可對(duì)應(yīng)于圖像數(shù)據(jù)的可尋址單元(例如,最小可尋址單元),硬件加速器322(或執(zhí)行本文論述的操作的其它電路)經(jīng)優(yōu)化以對(duì)所述可尋址單元執(zhí)行操作。在一個(gè)實(shí)施例中,硬件加速器322可經(jīng)優(yōu)化以對(duì)單色傳感器數(shù)據(jù)執(zhí)行計(jì)算(例如,再現(xiàn)計(jì)算),這可能需要比全色(例如,外插像素)更多的處理,但此優(yōu)化可增加對(duì)象辨識(shí)性能。在此情況下(其可被稱(chēng)為子像素分析),硬件加速器322可使用傳感器幾何形狀的知識(shí)來(lái)單獨(dú)地操縱有色子像素。

返回到圖4A,對(duì)象辨識(shí)邏輯450可采用用于支持“算子”的邏輯,其可量化、描述或界定例如圖像502的圖像中的特征。算子是在圖像502的一或多個(gè)區(qū)域內(nèi)的一或多個(gè)像素上發(fā)生的過(guò)程(例如,計(jì)算、確定或邏輯構(gòu)造)。支持算子的邏輯可被稱(chēng)為算子邏輯460。算子邏輯460可在量化特征的過(guò)程中使用“塊”(例如,圖像的區(qū)域)。如圖5A中所示,塊505界定圖像502的區(qū)域。由塊505界定的區(qū)域可覆蓋多于一個(gè)像素503、少于一個(gè)像素503,和/或可覆蓋與像素503相關(guān)聯(lián)的區(qū)域的僅一部分。舉例來(lái)說(shuō),塊505-1是圖像502的覆蓋九個(gè)完整像素503的區(qū)域(即,三乘三正方形)。塊505-2是圖像502的覆蓋十六個(gè)完整像素503的區(qū)域(即,四乘四正方形)。塊505-3是圖像502的覆蓋十五個(gè)完整像素503的區(qū)域(即,三乘五矩形)。塊505-4是圖像502的覆蓋四個(gè)完整像素503和十二個(gè)其它像素503的部分的區(qū)域。塊505-5是覆蓋四個(gè)完整像素503且不覆蓋任何其它像素503的部分的區(qū)域。塊505-7是對(duì)稱(chēng)且以像素的中心為中心的區(qū)域。塊505-8是正方形的區(qū)域,但包含相對(duì)于像素503的底層?xùn)鸥癫淮怪被蛩降倪吘?。塊505-8是不“筆直”的塊的實(shí)例。在本文使用所述術(shù)語(yǔ)時(shí),“筆直”塊是包含全部水平或垂直(例如,相對(duì)于像素503的底層?xùn)鸥?的邊緣的塊。圖5A中所示的其它塊(即,塊505-1到505-7)是筆直的塊的實(shí)例。

在一些實(shí)施方案中,與其它類(lèi)型的塊505相比,硬件加速器322經(jīng)更優(yōu)化以對(duì)一些類(lèi)型的塊505執(zhí)行計(jì)算。舉例來(lái)說(shuō),硬件加速器322可經(jīng)優(yōu)化以對(duì)以像素為中心和/或覆蓋完整像素的正方形塊執(zhí)行計(jì)算,例如塊505-1和塊505-2。硬件加速器322可經(jīng)優(yōu)化以對(duì)覆蓋完整像素的塊執(zhí)行計(jì)算,例如塊505-1、塊505-2、塊505-3和塊505-5(例如,無(wú)論所述塊是否以像素503的中心為中心)。在一個(gè)實(shí)施例中,硬件加速器322可經(jīng)優(yōu)化以對(duì)對(duì)稱(chēng)的塊執(zhí)行計(jì)算,例如塊505-6和塊505-7。在一個(gè)實(shí)施例中,硬件加速器322可經(jīng)優(yōu)化以對(duì)以像素中心為中心的對(duì)稱(chēng)塊執(zhí)行計(jì)算,例如塊505-7。

在一個(gè)實(shí)施例中,硬件加速器322可較少經(jīng)優(yōu)化以對(duì)非正方形塊(例如塊505-3)和/或僅部分地覆蓋與像素相關(guān)聯(lián)的區(qū)域的塊(例如塊505-4)執(zhí)行計(jì)算。在一個(gè)實(shí)施例中,與具有偶數(shù)個(gè)像素的塊(例如塊505-5和505-2)相比,硬件加速器322可更經(jīng)優(yōu)化以對(duì)具有奇數(shù)個(gè)像素的塊(例如塊505-1)執(zhí)行計(jì)算。替代地,與具有奇數(shù)個(gè)像素的塊(例如塊505-1)相比,硬件加速器322可更經(jīng)優(yōu)化以對(duì)具有偶數(shù)個(gè)像素的塊(例如塊505-5)執(zhí)行計(jì)算。在一個(gè)實(shí)施例中,無(wú)論塊是具有偶數(shù)還是奇數(shù)個(gè)像素,硬件加速器322都可經(jīng)優(yōu)化以對(duì)所述塊執(zhí)行計(jì)算。

與筆直塊相比,硬件加速器322也可以較少經(jīng)優(yōu)化以對(duì)不是“筆直”的塊(例如,具有相對(duì)于像素503不垂直或不水平的邊緣的塊)執(zhí)行計(jì)算。

因?yàn)橛布铀倨?22可更經(jīng)優(yōu)化以例如對(duì)覆蓋完整像素的塊和/或筆直的塊執(zhí)行計(jì)算,所以移動(dòng)、定位、放置和/或旋轉(zhuǎn)塊的過(guò)程可導(dǎo)致較少經(jīng)優(yōu)化的塊(例如,非筆直塊或不覆蓋完整像素的塊,但旋轉(zhuǎn)塊仍為正方形)。在一些情況下,如果塊被移動(dòng)、放置、定位或旋轉(zhuǎn)(例如,除90°或其倍數(shù)外),那么所得塊可能不視為“筆直”,因?yàn)樗脡K將不具有不水平或垂直的邊緣。換句話說(shuō),在一些情況下放置、定位或旋轉(zhuǎn)針對(duì)硬件加速器322優(yōu)化的塊可導(dǎo)致也針對(duì)硬件加速器322優(yōu)化的另一塊。硬件加速器322可具有上文所列的優(yōu)化的全部、無(wú)任一者、或任何組合。

圖5B是在一個(gè)實(shí)施例中的示范性算子500A的圖。對(duì)象辨識(shí)邏輯450可當(dāng)界定圖像中的特征時(shí)采用算子500A。算子500A展示為疊加在圖像的部分502上。算子500A包含主塊504和若干(例如,八個(gè)或任何數(shù)目)外塊506(外塊506-1到外塊506-8)。如同圖5A,虛線對(duì)應(yīng)于底層圖像的像素之間的邊界,所述底層圖像在圖5B的實(shí)例中包含169個(gè)像素(13x13正方形)。外塊506圍繞主塊504。在當(dāng)前實(shí)例中,外塊506全部是相同大小(例如,覆蓋九個(gè)像素)。并且,主塊504在此實(shí)例中與外塊506是相同大小(例如,九個(gè)像素)。其它算子可包含不同數(shù)目的外塊506(例如,2、4、16、32或任何整數(shù)數(shù)目)。

主塊504和/或外塊506涵蓋、包含或覆蓋若干像素(例如,一個(gè)或多于一個(gè))的區(qū)域。如以算子500A所示,算子500A中的主塊504包含九個(gè)像素(如由虛線識(shí)別)。外塊506也各自包含九個(gè)像素。在一個(gè)實(shí)施例中,主塊504和/或外塊506(例如,外塊506中的每一者)各自包含大于一個(gè)的奇數(shù)個(gè)像素。外塊506中的每一者中的像素的數(shù)目可相同(例如,大于一的奇數(shù))。此外,主塊504中的像素的數(shù)目可與外塊506中的像素的數(shù)目相同(例如,大于一的奇數(shù))。在另一實(shí)施例中,主塊504和/或外塊506可包含大于四個(gè)(例如,六個(gè)、八個(gè)等)的偶數(shù)個(gè)像素。在另一實(shí)施例中,主塊504和/或外塊506包含大于一個(gè)的奇數(shù)個(gè)像素或大于四個(gè)的偶數(shù)個(gè)像素。即,主塊504和/或外塊506包含三個(gè)或多于四個(gè)像素(例如,三個(gè)、五個(gè)或多于五個(gè))。

如算子500A中所示,圖像包含(即,圖像數(shù)據(jù)描述)位于主塊504與外塊506中的至少一者之間的像素508。舉例來(lái)說(shuō),像素508位于主塊504與外塊506-1之間、主塊504與外塊506-3之間、主塊504與外塊506-5之間、主塊504與外塊506-7之間。盡管較不顯而易見(jiàn),但一或多個(gè)像素508還可位于主塊504與其它外塊506(即,外塊506-2、外塊506-4、外塊506-6和外塊506-8)之間。

位于主塊504與外塊506之間的像素508在算子的其它實(shí)例和配置中較顯而易見(jiàn)。舉例來(lái)說(shuō),圖5C說(shuō)明在另一實(shí)施例中的示范性算子500B。算子500B展示為疊加于圖像(例如圖像502,其在圖5C中未展示)的一部分上。類(lèi)似算子500A,算子500B包含主塊504和若干(例如,八個(gè)或任何數(shù)目)外塊506。圖像后方算子500B(即,由圖像數(shù)據(jù)所描述)包含位于主塊504與外塊506中的每一者之間的像素508。也就是說(shuō),外塊506可與主塊504間隔,使得外塊506中的至少一者(或更多)離主塊504一距離以避免主塊504與外塊506相鄰。為方便起見(jiàn),位于塊504/506之間的像素508被稱(chēng)作“省略”或“外部”像素508。另一方面,位于塊504/506內(nèi)的像素被稱(chēng)作“包含”或“內(nèi)部”像素。

在其它實(shí)施例中,主塊504的大小可不同于一或多個(gè)外塊506和/或外塊506的大小可彼此不同。在其它實(shí)施例中,塊504/506可包含一個(gè)像素或大于一的偶數(shù)個(gè)像素。然而,這些其它實(shí)施例可未必最佳用于最大化硬件加速器322的性能(取決于硬件加速器322的架構(gòu))。然而,硬件加速器322可針對(duì)這些其它實(shí)施例優(yōu)化。如果塊504/506中的像素?cái)?shù)目為偶數(shù)且塊為正方形,則所述塊可覆蓋整數(shù)個(gè)像素(例如,經(jīng)移動(dòng)或放置以使得塊在四個(gè)像素之間均勻居中,例如塊505-5)。在一些實(shí)施例中,如下文較詳細(xì)描述,外塊506中的像素?cái)?shù)目是偶數(shù)還是奇數(shù)可取決于算子的大小。舉例來(lái)說(shuō),較大算子在外塊506中可具有偶數(shù)個(gè)像素;而較小算子在外塊506中可具有奇數(shù)個(gè)像素。在其它實(shí)施例中,塊504/506可能并非直線,這是因?yàn)閴K具有相對(duì)于像素503并不水平或垂直的邊緣。

因此,算子500A和500B為算子邏輯460可使用以量化圖像中的特征的算子實(shí)例。如下文較詳細(xì)描述,在量化特征之前,算子邏輯470可變更、移動(dòng)、扣合(snap)或旋轉(zhuǎn)算子中的塊中的所有或一些。算子邏輯470可基于數(shù)個(gè)因素(例如,例如主塊504的中心處的強(qiáng)度的梯度方向)變更、移動(dòng)、扣合或旋轉(zhuǎn)塊中的所有或一些。

為確定是否和如何變更、移動(dòng)、扣合或旋轉(zhuǎn)算子(例如,圖5B中的算子500A)中的塊中的所有或一些,算子邏輯460可出于此目的利用方向邏輯470。方向邏輯470對(duì)與圖像區(qū)域(例如,塊)相關(guān)聯(lián)的圖像數(shù)據(jù)進(jìn)行操作(例如,輸入),且可計(jì)算所提取特征(例如圖像區(qū)域的中心處的強(qiáng)度的梯度)的方向或定向。舉例來(lái)說(shuō),方向邏輯470可輸入圖像502的梯度區(qū)域520(參見(jiàn)圖5F),并輸出關(guān)于區(qū)域520的中心的梯度方向522(例如,135°,或在塊506-4的中心的方向上)。在這些實(shí)例中,逆時(shí)針表示為正方向且順時(shí)針表示為負(fù)方向。也可(一致性)使用相反表示。在這些實(shí)例中,零度被視作在主位置524作為起點(diǎn)的坐標(biāo)系統(tǒng)中的x軸的方向上。針對(duì)零度方向的其它定義是可能的。

在此實(shí)例中,區(qū)域520(白色)大于主塊504(圖5E中未展示)。區(qū)域520還包含像素508(位于主塊504與外塊506之間)和外塊506的部分。在梯度區(qū)域520居中于主塊504上的情況下,區(qū)域520的中心被稱(chēng)作主位置524。也就是說(shuō),主塊504可涵蓋主位置524(例如,主塊504的中心)。因此,算子邏輯460可通過(guò)確定主位置處的圖像的強(qiáng)度的梯度方向來(lái)量化方向。如下文較詳細(xì)描述,算子邏輯460可基于方向邏輯470布置塊(例如,外塊506)。

在一個(gè)實(shí)施例中,方向邏輯470可模糊其中心周?chē)奶荻葏^(qū)域520。為獲得較穩(wěn)定方向,方向邏輯470可確定多于一個(gè)梯度方向(例如,居中于靠近主位置524的略微不同位置處)。一旦確定充分?jǐn)?shù)目個(gè)梯度方向,方向邏輯470可取其平均值以獲得用于由算子邏輯460使用的較穩(wěn)定梯度方向。在一個(gè)實(shí)施例中,通過(guò)確定梯度區(qū)域520中的有限差(例如,強(qiáng)度值差)計(jì)算梯度方向。在此實(shí)施例中,方向邏輯470可計(jì)算算子中心周?chē)南嚓P(guān)區(qū)域中的相鄰像素之間的許多有限差。這些計(jì)算(例如,有限差)可存儲(chǔ)于直方圖(例如,表示直方圖的數(shù)據(jù)結(jié)構(gòu))中。方向邏輯470可確定對(duì)應(yīng)于角度間隔(例如,對(duì)應(yīng)于方向的近似角度)的一定區(qū)間(例如,一定有限差)處的峰值。在一個(gè)實(shí)施例中,梯度區(qū)域520在計(jì)算梯度(例如,有限差)以確定較穩(wěn)定方向(例如,直方圖中的相異峰值)之前被模糊。執(zhí)行梯度計(jì)算的其它方式是可能的。

另外,計(jì)算方向或定向的其它方式是可能的。舉例來(lái)說(shuō),方向或定向可基于顏色。確定梯度方向的方法可基于檢測(cè)到的對(duì)象的特征。也就是說(shuō),一些對(duì)象和特征基于顏色而非僅強(qiáng)度可較適于一定向。

為增加性能,可在硬件加速器322中實(shí)施方向邏輯470。如果實(shí)施于硬件加速器322中,則強(qiáng)度邏輯475可經(jīng)優(yōu)化以執(zhí)行對(duì)居中于整個(gè)像素上的塊的計(jì)算。強(qiáng)度邏輯475可經(jīng)優(yōu)化以執(zhí)行對(duì)為正方形的塊的計(jì)算。硬件加速器322也可經(jīng)優(yōu)化以執(zhí)行對(duì)僅包含整個(gè)像素且并不包含整個(gè)像素的部分的塊的計(jì)算。硬件加速器322可經(jīng)優(yōu)化以執(zhí)行對(duì)具有奇數(shù)個(gè)像素的塊的計(jì)算。在另一實(shí)施例中,方向邏輯470可替代地實(shí)施于純硅中(例如,固線于芯片中)、專(zhuān)用特定處理器上、ASIC中、FPGA中、與固線式電路組件實(shí)施、與數(shù)字和/或模擬電路實(shí)施、以軟件實(shí)施或軟件與硬件的組合實(shí)施。

如所提到,算子邏輯460可確定主塊504和外塊506的定位、位置或布局。在一個(gè)實(shí)施例中,算子邏輯460可定位外塊506(或外塊506中的每一者)和/或主塊504以便居中于像素上(例如,“扣合”像素上的塊)。在一個(gè)實(shí)施例中,算子邏輯460將外塊506(或每一外塊506)塑形為正方形(即,在高度和寬度上具有相同整數(shù)個(gè)像素)和/或具有奇數(shù)個(gè)像素。算子邏輯460還可塑形塊504/506以使得其為正方形且居中于像素上(且算子邏輯460可針對(duì)每一塊506如此操作)。在一個(gè)實(shí)施例中,算子邏輯460確保算子中的塊中的一或多者保持直線(例如,通過(guò)并不圍繞塊自身的起點(diǎn)旋轉(zhuǎn)塊)或定向?yàn)橹本€。

算子邏輯460可通過(guò)使外塊506離主塊504間隔一距離(或半徑)來(lái)確定環(huán)繞主塊504的外塊506的位置。在一個(gè)實(shí)施例中,外塊506圍繞主塊504分布以使得外塊506中的每一者居中于像素上。在一個(gè)實(shí)施例中,算子邏輯460可通過(guò)使外塊506離主塊504間隔一距離以避免主塊504與外塊506中的至少一者相鄰來(lái)確定環(huán)繞主塊504的外塊506的位置。在一個(gè)實(shí)施例中,算子邏輯460可圍繞主塊504間隔外塊506以使得外塊等距或大約等距。

扣合或以其它方式定位外塊506以使得外塊506居中于像素上可導(dǎo)致一些(例如,至少兩個(gè))外塊506重疊以便包含同一像素(例如,共用內(nèi)部或包含像素)。在一些情況下,重疊可在并未進(jìn)行扣合情況下發(fā)生。舉例來(lái)說(shuō),算子可具有較小半徑(或外塊506和/或主塊504可足夠大),使得外塊506彼此重疊和/或與主塊504重疊(以便包含同一像素)。在這些情況下,當(dāng)算子邏輯460計(jì)算指示兩個(gè)此類(lèi)外塊506的強(qiáng)度的值(如下文較詳細(xì)描述)時(shí),所述兩個(gè)外塊506的強(qiáng)度可是基于所述同一像素(例如,共用內(nèi)部像素)的強(qiáng)度。另外,算子邏輯460可基于梯度方向確定環(huán)繞主塊的外塊的位置。換句話說(shuō),算子邏輯460使用梯度方向確定外塊的位置。

如下文較詳細(xì)描述,在以算子500A和135°的梯度方向(例如由方向邏輯470確定)操作情況下,算子邏輯460可將算子500A旋轉(zhuǎn)135°。圖7F為示范性算子700F的圖式,所述算子為旋轉(zhuǎn)135°的算子500A。在此實(shí)例中,(算子500A的)主塊504和外塊506繞主位置524旋轉(zhuǎn)135°(以帶來(lái)算子700F)。如圖7F中所示,舉例來(lái)說(shuō),外塊506-1到506-8(分別展示為外塊716-1到716-8)基于旋轉(zhuǎn)處于不同位置中。盡管主塊504(在圖7F中展示為主塊704)具有主位置524處的同一中心,但其也經(jīng)旋轉(zhuǎn)且不再為直線,這是因?yàn)槠浒鄬?duì)于圖像502的底層像素503并不水平或垂直的邊緣。同樣地,外塊716相對(duì)于圖像502的底層像素503也非直線。然而,如所提到,外塊716和主塊704的位置對(duì)于一些硬件可較不佳(但其當(dāng)然也可用于一些環(huán)境并針對(duì)其它硬件潛在優(yōu)化)。因此,算子邏輯460可移動(dòng)、扣合、旋轉(zhuǎn)和/或變更算子700F中的一些塊。

如所提到,因?yàn)樗阕?00F中的塊并非直線,所以算子700F可能未優(yōu)化用于一些硬件加速器322。因此,可對(duì)算子700F中的塊進(jìn)行扣合(例如,扣合到像素的中心)和拉直(例如,繞特定塊的中心旋轉(zhuǎn))。圖5D說(shuō)明示范性算子500A',其類(lèi)似算子700F為旋轉(zhuǎn)135°的算子500A但具有經(jīng)扣合和直線塊。在此實(shí)例中,(算子500A的)主塊504和外塊506繞主位置524旋轉(zhuǎn)135°。然而,如圖5D中所示,塊506-1到塊506-8(分別展示為塊506-1'到506-8')不僅處于不同位置中而且已經(jīng)扣合和拉直(相比于算子700F)。另外,主塊504'也已經(jīng)拉直(相比于主塊714)。相比于算子500A考慮算子500A'的另一方式為主塊504尚未經(jīng)旋轉(zhuǎn)且盡管外塊506的中心定位已繞主位置524旋轉(zhuǎn),但外塊506的定向尚未變更。因此,術(shù)語(yǔ)“扣合”還可包含確保經(jīng)扣合塊保持或變?yōu)橹本€。

因?yàn)樗阕?00A'的實(shí)例中的梯度方向?yàn)?35°,所以經(jīng)旋轉(zhuǎn)算子500A'即使不相同于算子500A也大體上類(lèi)似于算子500A。然而,如果梯度方向?yàn)?0°,則經(jīng)旋轉(zhuǎn)算子將不同。圖8說(shuō)明示范性算子500A",其為具有經(jīng)扣合和直線塊的旋轉(zhuǎn)10°的算子500A。在算子500A"情況下,外塊506包含重疊像素(例如,共用內(nèi)部像素)。

返回到圖4A,一旦確定主塊504和外塊506的位置(例如,可能在算子邏輯460旋轉(zhuǎn)所有塊或一些塊之后),算子邏輯460可利用強(qiáng)度邏輯475和閾值邏輯477以基于塊504和506的位置量化圖像502中的特征。作為一實(shí)例,假定算子邏輯460使用圖5D中的算子500A'以量化底層圖像的特征。在算子500A'情況下,外塊506-1'到506-8'對(duì)應(yīng)于塊506-1到506-8,但其旋轉(zhuǎn)135°且經(jīng)扣合(并保持為直線)。同樣地,主塊504'對(duì)應(yīng)于塊504(但保持為直線)。

在一個(gè)實(shí)施例中,算子邏輯460利用強(qiáng)度邏輯475以確定指示塊(例如主塊504'或外塊506')的強(qiáng)度(例如,平均強(qiáng)度)的值。強(qiáng)度邏輯475對(duì)與塊相關(guān)聯(lián)的圖像數(shù)據(jù)(例如,作為輸入)進(jìn)行操作,且可計(jì)算指示對(duì)應(yīng)于塊的圖像的平均強(qiáng)度的值。舉例來(lái)說(shuō),強(qiáng)度邏輯475可輸入與主塊504'(參見(jiàn)圖5D)相關(guān)聯(lián)的圖像數(shù)據(jù),并輸出主塊504'中的像素的平均強(qiáng)度。如圖5D中所示,強(qiáng)度邏輯475將‘9’的值輸出為與主塊504'相關(guān)聯(lián)的圖像數(shù)據(jù)的平均強(qiáng)度(展示為疊加于主塊504'上的圓圈中的‘9’)。同樣地,強(qiáng)度邏輯475可輸入與外塊506-1'到506-8'相關(guān)聯(lián)的圖像數(shù)據(jù)并分別輸出以下值:19、11、12、8、7、8、6和20(展示為疊加于圖5D中的各別外塊506'上的圓圈中的強(qiáng)度值)。

在此實(shí)例中,因?yàn)橄袼?08位于主塊504'與外塊506'之間,所以像素508并不有助于指示主塊504'的平均強(qiáng)度的值,和/或并不有助于指示外塊506'的平均強(qiáng)度的值。換句話說(shuō),在一個(gè)實(shí)施例中,外部或省略像素508并不有助于任何塊(例如,主塊504'或外塊506')的平均強(qiáng)度(或指示平均強(qiáng)度的值)。也就是說(shuō),強(qiáng)度邏輯475并不基于外部或省略像素508計(jì)算或確定指示平均強(qiáng)度的值。另一方面,強(qiáng)度邏輯475基于包含或內(nèi)部像素(例如,由主塊504或外塊506覆蓋)計(jì)算或確定指示平均強(qiáng)度的值。

為增加性能,可在硬件加速器322中實(shí)施強(qiáng)度邏輯475。如果實(shí)施于硬件加速器322中,則強(qiáng)度邏輯475可經(jīng)優(yōu)化以執(zhí)行對(duì)居中于像素上(例如,居中于像素的中心上)的塊的計(jì)算。強(qiáng)度邏輯475可經(jīng)優(yōu)化以執(zhí)行對(duì)為正方形和/或直線的塊的計(jì)算。硬件加速器322也可經(jīng)優(yōu)化以執(zhí)行對(duì)僅包含整個(gè)像素且并不包含整個(gè)像素的部分的塊的計(jì)算。硬件加速器322可經(jīng)優(yōu)化以執(zhí)行對(duì)具有奇數(shù)個(gè)像素的塊的計(jì)算。硬件加速器322也可經(jīng)優(yōu)化以執(zhí)行對(duì)關(guān)于一點(diǎn)對(duì)稱(chēng)的塊的計(jì)算。算子邏輯460(和/或下文所描述的算子邏輯420)可根據(jù)這些優(yōu)化選擇塊形狀和大小(例如,居中于像素的中心上的塊;為正方形或矩形的塊;包含整個(gè)像素且并不包含整個(gè)像素的部分的塊;具有奇數(shù)個(gè)像素的塊;關(guān)于一點(diǎn)對(duì)稱(chēng)的塊)。在另一實(shí)施例中,強(qiáng)度邏輯475可能不實(shí)施于硬件加速器322中。

在一個(gè)實(shí)施例中,強(qiáng)度邏輯475可替代地實(shí)施于純硅中(例如,固線于芯片中)、專(zhuān)用特定處理器上、ASIC中、FPGA中、與固線式電路組件實(shí)施、與數(shù)字和/或模擬電路實(shí)施、以軟件實(shí)施或軟件與硬件的組合實(shí)施為增加性能,強(qiáng)度邏輯475可輸出像素的強(qiáng)度的總和(而非平均值)。舉例來(lái)說(shuō),當(dāng)塊504'的大小相同于外塊506'中的每一者時(shí)可使用此實(shí)施例。在此情況下,像素的強(qiáng)度的總和仍指示平均值,這是因?yàn)樗隹偤蜑榘幢壤{(diào)整平均值且所有塊經(jīng)類(lèi)似按比例調(diào)整。無(wú)論強(qiáng)度邏輯475輸出總和還是平均值(或指示平均值的不同值)可都不影響算子邏輯460的結(jié)果。

算子邏輯460可利用閾值邏輯477以量化圖像中的特征。閾值邏輯477對(duì)主塊504和外塊506的強(qiáng)度值(例如,指示平均強(qiáng)度值的值)(例如,作為輸入)進(jìn)行操作并比較所述值。閾值邏輯477可比較主塊504'的強(qiáng)度值與外塊506'的強(qiáng)度值中的每一者。在一個(gè)實(shí)施例中,如果外塊506'的強(qiáng)度值大于主塊504',則閾值邏輯477輸出一個(gè)值或符號(hào)(例如,‘1’)并使其與對(duì)應(yīng)外塊相關(guān)聯(lián)。另一方面,如果外塊506'的強(qiáng)度值小于(或等于)主塊504'的強(qiáng)度值,則閾值邏輯477輸出不同值或符號(hào)(例如,‘0’)并使其與對(duì)應(yīng)外塊相關(guān)聯(lián)。如圖5E中所示,閾值邏輯477使‘1’與外塊506-1'(19>9)、塊506-2'(11>9)、塊506-8'(20>9)和塊506-3'(12>9)相關(guān)聯(lián)。

另外,只要閾值邏輯477就此來(lái)說(shuō)一致,則閾值邏輯477可在強(qiáng)度值(即,相等強(qiáng)度值)之間使“打平(tie)”與任一值或另一值(例如,在上文的實(shí)例中為‘0’)相關(guān)聯(lián)。閾值邏輯477可使用任何值、符號(hào)、符號(hào)群組或表示(例如,除了‘0’和‘1’)以表示強(qiáng)度值比較的輸出。舉例來(lái)說(shuō),閾值邏輯477可輸出例如TRUE和FALSE或A和B的其它二進(jìn)制值而非‘0’和‘1’。另外,符號(hào)可互換(但應(yīng)保持一致)。舉例來(lái)說(shuō),‘0’值和‘1’值可互換(相比于上文實(shí)例)。在此實(shí)例中,如果外塊506的強(qiáng)度值大于主塊504,則閾值邏輯477可輸出‘0’(而非先前實(shí)例中的‘1’)并使其與對(duì)應(yīng)外塊相關(guān)聯(lián)。另一方面,如果外塊506的強(qiáng)度值小于(或等于)主塊504的強(qiáng)度值,則閾值邏輯477可替代地輸出‘1’(而非先前實(shí)例中的‘0’)并使其與對(duì)應(yīng)外塊相關(guān)聯(lián)。

在一個(gè)實(shí)施例中,閾值邏輯477實(shí)施于硬件加速器322中以增加性能。在另一實(shí)施例中,閾值邏輯477并不實(shí)施于硬件加速器322中。如果主塊504的大小相同于每一外塊506,則閾值邏輯477的輸出將相同,不論從強(qiáng)度邏輯475輸出的強(qiáng)度值是平均值還是總和都如此。在一個(gè)實(shí)施例中,閾值邏輯477可替代地實(shí)施于純硅中(例如,固線于芯片中)、專(zhuān)用特定處理器上、ASIC中、FPGA中、與固線式電路組件實(shí)施、與數(shù)字和/或模擬電路實(shí)施、以軟件實(shí)施或軟件與硬件的組合實(shí)施。

閾值邏輯477可基于主塊的平均強(qiáng)度與外塊的平均強(qiáng)度中的每一者的比較產(chǎn)生數(shù)目或值(例如,表征和量化特征)。舉例來(lái)說(shuō),如圖5E中所示,表示經(jīng)量化特征的特性數(shù)目為‘11100001’。在一個(gè)實(shí)施例中,表征特征的最高有效位可為與未旋轉(zhuǎn)算子(例如,算子500A)的任意外塊506(例如外塊506-1(例如,在零度方向上的外塊))相關(guān)聯(lián)的閾值邏輯477的輸出。因此,在此實(shí)施例中,與算子500A'中的塊506-1'(其對(duì)應(yīng)于已根據(jù)梯度方向旋轉(zhuǎn)的算子500A中的外塊506-1)相關(guān)聯(lián)的輸出值被選定為最高有效位。剩余位可在正(即,逆時(shí)針)方向上定義(即,外塊506-2)。在替代實(shí)施例中,剩余位也可在順時(shí)針(即,負(fù))方向上定義。

搜索邏輯465可系統(tǒng)地搜索如表征特征DB 486中定義的對(duì)象特征的圖像數(shù)據(jù)482。搜索邏輯465可計(jì)算、確定和/或輸入居中于圖像或視頻的不同部分中的具有不同大小和形狀的算子(例如算子500A)。當(dāng)搜索邏輯465確定圖像數(shù)據(jù)482包含匹配表征特征(表征特征DB 486中)的特征(或特征的閾值)時(shí),辨識(shí)出一對(duì)象并對(duì)其進(jìn)行標(biāo)記。下文關(guān)于圖6較詳細(xì)描述搜索邏輯465。

圖4B為訓(xùn)練裝置140的功能組件(例如,訓(xùn)練裝置140中的應(yīng)用程序334和應(yīng)用程序數(shù)據(jù)336)的框圖。應(yīng)用程序334可包含訓(xùn)練邏輯410、算子邏輯420、方向邏輯430、強(qiáng)度邏輯435和閾值邏輯437。應(yīng)用程序數(shù)據(jù)336可包含圖像數(shù)據(jù)440、經(jīng)檢測(cè)特征DB442和表征特征DB 444。應(yīng)用程序334和應(yīng)用程序數(shù)據(jù)336可包含較多、較少或不同布置的組件。

訓(xùn)練邏輯410可輸入與對(duì)象相關(guān)聯(lián)的許多圖像(例如,來(lái)自圖像數(shù)據(jù)440的數(shù)千圖像)并確定那些圖像的特征。為確定特征,訓(xùn)練邏輯410可利用算子邏輯420、方向邏輯430、強(qiáng)度邏輯435和閾值邏輯437。算子邏輯420、方向邏輯430、強(qiáng)度邏輯435和閾值邏輯437可相同或類(lèi)似于相機(jī)110中的那些對(duì)應(yīng)組件(例如,算子邏輯460、強(qiáng)度邏輯475、方向邏輯470和閾值邏輯477)。

一旦訓(xùn)練邏輯410確定或檢測(cè)到特征,其將這些所確定特征存儲(chǔ)于經(jīng)檢測(cè)特征DB 442中。舉例來(lái)說(shuō),如果經(jīng)檢測(cè)特征DB 442中的一特征反復(fù)出現(xiàn),則訓(xùn)練邏輯410可在表征特征DB 444中將所述特征存儲(chǔ)為與對(duì)象相關(guān)聯(lián)的表征特征。舉例來(lái)說(shuō),存儲(chǔ)于經(jīng)檢測(cè)特征DB 442和/或表征特征DB 444中的表征特征可為:‘11100001’(關(guān)于圖5E所描述)。在一個(gè)實(shí)施例中,如果(例如)僅一個(gè)圖像可用于訓(xùn)練邏輯410分析對(duì)象或特征,則經(jīng)檢測(cè)特征可被視為僅出現(xiàn)一次的表征特征。在另一實(shí)施例中,訓(xùn)練邏輯410通過(guò)比較已知具有對(duì)象的圖像(或多個(gè)圖像)的所確定特征與已知不具有對(duì)象的圖像(或多個(gè)圖像)的所確定特征來(lái)確定表征特征。在已知具有對(duì)象的圖像集合中反復(fù)出現(xiàn)但在已知不具有對(duì)象的圖像集合中不出現(xiàn)的所確定特征可被視為表征特征。

表征特征DB 444還可使表征特征識(shí)別的對(duì)象的名稱(chēng)相關(guān)聯(lián)。另外,表征特征DB 444可存儲(chǔ)與特征(例如,主塊504的大小、與算子相關(guān)聯(lián)的半徑、外塊506的大小和數(shù)目,和/或梯度區(qū)域520的大小和形狀)相關(guān)聯(lián)的算子(例如,算子500A)。所存儲(chǔ)其它信息可包含典型半徑、典型梯度方向和外塊506相對(duì)于主塊504的放置。所存儲(chǔ)其它信息還可包含圖像502(或其部分)中的算子的中心(例如算子500A的主位置524)的坐標(biāo)(位置)。舉例來(lái)說(shuō),此位置信息可識(shí)別表征特征在正搜索圖像中(例如,相機(jī)110中)的預(yù)期定位。使用此位置信息,相機(jī)110可在圖像中預(yù)期出現(xiàn)臉部的位置處搜索臉部(例如,使用臉部圖像中的典型暗亮變化,例如靠近眼睛的暗點(diǎn)和靠近鼻子的亮區(qū))。作為另一實(shí)例,相機(jī)110可使用位置信息以在圖像中預(yù)期出現(xiàn)汽車(chē)上的牌照的位置處搜索牌照(例如,使用以典型或預(yù)期半徑開(kāi)始的算子)。相機(jī)110可通過(guò)以具有典型或預(yù)期梯度方向的位置開(kāi)始來(lái)進(jìn)一步限制搜索區(qū)域。同樣地,一旦檢測(cè)到牌照(例如,使用粗略搜索),相機(jī)110可在圖像中預(yù)期出現(xiàn)字母和數(shù)字的位置處搜索字母和/或數(shù)字(例如,在所識(shí)別牌照內(nèi)使用更精細(xì)搜索)。當(dāng)搜索表征特征時(shí),此額外信息可減少相機(jī)110上的處理負(fù)載。

如所示,算子(例如,算子500A、500B)可具有不同形狀和大小。具體來(lái)說(shuō),算子500B具有比算子500A大的半徑。結(jié)果,算子500B也具有位于主塊504與外塊506之間的較多像素508。靈活使用具有合適(例如,可變)半徑的算子而非固定或僅小型算子允許算子邏輯460使用(或選擇)較好匹配對(duì)應(yīng)特征或?qū)ο蟮乃阕?例如,在訓(xùn)練期間)。舉例來(lái)說(shuō),算子邏輯460可使用(或選擇)具有匹配兩個(gè)暗眼睛和一個(gè)亮鼻尖的定位的大小的算子(算子圓圈間具有一些變化)。眼睛與鼻尖之間的強(qiáng)度可不相關(guān)(或特征性),且可對(duì)應(yīng)于位于主塊504(例如,對(duì)應(yīng)于亮鼻尖)與外塊506(例如,對(duì)應(yīng)于暗眼睛)之間的像素508。經(jīng)適當(dāng)大小設(shè)定的算子(例如,500B)接著可存儲(chǔ)于表征特征DB 444(訓(xùn)練裝置140中)中、發(fā)射到相機(jī)110并用作表征特征DB 486以搜索由相機(jī)110捕獲(且存儲(chǔ)于傳感器數(shù)據(jù)482中)的圖像中的那些特征(對(duì)應(yīng)于對(duì)象)。

圖6為在一個(gè)實(shí)施例中用于確定算子和量化圖像的特征的示范性過(guò)程600的流程圖。過(guò)程600可執(zhí)行于相機(jī)110(例如,搜索特征期間)或訓(xùn)練裝置140(例如,訓(xùn)練期間)中。在一個(gè)實(shí)施例中,出現(xiàn)于圖6的右側(cè)的過(guò)程600的部分(例如,步驟606、616和618)由硬件加速器322執(zhí)行,而其它過(guò)程框并不由所述硬件加速器執(zhí)行。在其它實(shí)施例中,所有過(guò)程600執(zhí)行于通用處理器中(例如,以軟件)而無(wú)需使用硬件加速器322。在使用硬件加速器322的實(shí)施例中,可由加速器322執(zhí)行比下文所描述多或少的操作。過(guò)程600是關(guān)于算子500A、500A'和500B(例如,圖5B到5F)和圖7A到7F描述。

過(guò)程600以接收?qǐng)D像或圖像的一部分開(kāi)始(步驟602)。在此實(shí)例中,算子邏輯460/420接收?qǐng)D像部分502(參見(jiàn)圖5F和7A),所述圖像部分可為較大圖像的部分。在一個(gè)實(shí)施例中,訓(xùn)練裝置140接收?qǐng)D像部分502以用于訓(xùn)練(例如,以產(chǎn)生表征特征DB 486)。在另一實(shí)施例中,相機(jī)110中的對(duì)象辨識(shí)邏輯450接收?qǐng)D像部分502以作為搜索的部分來(lái)辨識(shí)對(duì)象。在過(guò)程600的論述中,描述為由算子邏輯460、強(qiáng)度邏輯475、方向邏輯470和閾值邏輯477(相機(jī)110中)執(zhí)行的內(nèi)容可同樣適用于算子邏輯420、強(qiáng)度邏輯435、方向邏輯430和閾值邏輯437(訓(xùn)練裝置140中)。

確定算子的主塊的位置(例如,中心或主位置)(步驟604)。在此實(shí)例中,算子邏輯460/420確定或接收識(shí)別主塊504的中心位置的數(shù)據(jù)。如果開(kāi)始搜索圖像的特征(例如,相機(jī)110中),則算子邏輯460可基于所搜索特征的預(yù)期位置(如存儲(chǔ)于表征特征DB 444中)選擇主塊504的中心。如果繼續(xù)搜索圖像的特征,則算子邏輯460可基于圖像掃描或搜索中的下一點(diǎn)或像素選擇主塊504的中心。如果進(jìn)行訓(xùn)練(例如,訓(xùn)練裝置140中),則算子邏輯420可基于圖像部分502中的對(duì)象的一般位置(或預(yù)期位置)(且也可基于訓(xùn)練期間的掃描中的下一點(diǎn)或像素)選擇主塊504的主位置。在一個(gè)實(shí)施例中,可在圖像502內(nèi)自由放置主位置。如圖5F和7A中所示,算子邏輯460/420選擇(或接收)對(duì)應(yīng)于圖5B中所示的算子500A中的主塊504的中心的主位置524。在一個(gè)實(shí)施例中,如果主位置524并不居中于整個(gè)像素上,則可將主位置524的位置扣合到最接近的像素中心。

過(guò)程600以基于圖像數(shù)據(jù)確定方向(例如,定向)繼續(xù)(步驟606)。在一個(gè)實(shí)施例中,所述方向?yàn)榭拷魑恢?例如,靠近主塊504的中心)的圖像502的區(qū)域的強(qiáng)度的梯度方向。如本文中所描述,外塊506的放置或位置(例如,用于確定量化值)可是基于梯度方向(例如,在此情況下為定向)。因而,梯度方向允許算子“恒定旋轉(zhuǎn)”。

算子邏輯460/420可依賴(lài)于方向邏輯470/430來(lái)確定梯度方向。用于確定梯度方向的圖像部分502的區(qū)域可相同或不同(例如,較大或較小)于主塊504的區(qū)域。在當(dāng)前實(shí)例中,如圖5F和7A中所示,用于確定梯度方向的區(qū)域(梯度區(qū)域520)的中心可具有相同于主塊504的中心(例如,主位置524)的中心。在圖5F和7A的實(shí)例中,方向邏輯470將關(guān)于主位置524的梯度方向522確定為135°。

在一個(gè)實(shí)施例中,可通過(guò)算子邏輯460/420和/或方向邏輯470/430來(lái)選擇梯度區(qū)域520的形狀、位置和大小,以?xún)?yōu)化硬件加速器322(或執(zhí)行本文所論述的功能和運(yùn)算的電路)的性能。舉例來(lái)說(shuō),如果可將梯度區(qū)域520調(diào)整為正方形、筆直、矩形和/或?qū)ΨQ(chēng)的;那么可調(diào)整梯度區(qū)域520以覆蓋整個(gè)像素503而不是局部像素;和/或可調(diào)整梯度區(qū)域520以覆蓋偶數(shù)和/或奇數(shù)數(shù)目個(gè)像素503。就是說(shuō),可將面積中心520扣入為在整個(gè)像素503的中心上方,和/或區(qū)域520的大小可為使得區(qū)域520僅覆蓋整個(gè)像素503。區(qū)域520還可選擇為正方形,和/或僅覆蓋奇數(shù)數(shù)目個(gè)像素。在一個(gè)實(shí)施例中,梯度區(qū)域520與對(duì)應(yīng)算子一樣大。

過(guò)程600繼續(xù)確定算子的特征,例如所述算子的塊大小和/或形狀(步驟608)。舉例來(lái)說(shuō),主塊504和外塊506的大小可取決于正檢測(cè)到的特征的大小(例如對(duì)象的大小)。大特征(相對(duì)于像素的大小)可具有較大塊大小,而較小特征可具有較小塊大小。當(dāng)訓(xùn)練時(shí),算子邏輯420可嘗試不同的塊大小和形狀,來(lái)尋找很好表征特征的組合。當(dāng)搜索時(shí),算子邏輯470可輸入來(lái)自表征特征DB 486(如先前在訓(xùn)練期間所確定)的塊大小和形狀(例如定義所述算子)。所確定(或輸入)的塊的大小和/或形狀可為本文所論述的那些大小和/或形狀中的任一者(例如在圖5A中)。

在當(dāng)前實(shí)例中,假定主塊504的大小如圖5B中針對(duì)算子500A示出(即,九個(gè)像素)。還假定每一外塊506的大小還如圖5B中針對(duì)算子500A示出(即,九個(gè)像素)。在此實(shí)例中,主塊504的大小與外塊506的大小相同。如果過(guò)程600正在相機(jī)110中執(zhí)行,那么可從表征特征DB 486輸入塊大小,作為與檢索的表征特征相關(guān)聯(lián)的一個(gè)可能塊大小。

為了利用硬件加速度,可確定(或接收或輸入)(主塊504或外塊506的)塊大小,以具有以下特性中的一或多者:所述塊大小可具有奇數(shù)數(shù)目個(gè)像素;所述塊大小可具有多于一個(gè)像素;所述塊大小可具有大于一的奇數(shù)數(shù)目個(gè)像素;所述塊可為正方形、矩形或?qū)ΨQ(chēng)的;所述塊可定中心在像素上(例如定中心在整個(gè)像素的中心上);所有外塊可為相同大小(例如具有相同數(shù)目個(gè)像素);所述外塊可具有與主塊相同的大小(例如具有相同數(shù)目個(gè)像素);所述塊可覆蓋整數(shù)個(gè)像素;所述塊可不覆蓋像素的任何非完整部分;所述塊可關(guān)于點(diǎn)對(duì)稱(chēng);所述外塊可為相同大??;所述外塊可為不同大小;所述主塊可為與所有所述外塊或其中的任一者不同的大小。塊的大小的這些特性可允許硬件加速器(例如硬件加速器322或執(zhí)行本文所述的運(yùn)算的電路)執(zhí)行對(duì)所述塊的計(jì)算,而不外插像素。然而,一些實(shí)施例可仍然以外插來(lái)對(duì)所述塊執(zhí)行計(jì)算。

過(guò)程600繼續(xù)確定算子的特征,例如所述算子的半徑和/或塊的數(shù)目(步驟610)(例如如從主位置測(cè)量)。當(dāng)訓(xùn)練時(shí),算子邏輯420可嘗試不同的半徑,來(lái)尋找很好表征特征的半徑(例如以與塊大小的組合)。另外,當(dāng)訓(xùn)練時(shí),算子邏輯420可嘗試不同數(shù)目的外塊,來(lái)尋找很好表征特征的數(shù)目(例如,以與塊大小和半徑的組合)。當(dāng)搜索時(shí),算子邏輯460可輸入來(lái)自表征特征DB 486的半徑(如先前在訓(xùn)練期間確定)。另外,當(dāng)搜索時(shí),算子邏輯460可輸入來(lái)自表征特征DB 486的塊的數(shù)目(如先前在訓(xùn)練期間確定)。

可最后基于在圖像中正檢測(cè)到的特征或?qū)ο蟮拇笮『?或形狀來(lái)確定所述算子的半徑。舉例來(lái)說(shuō),為了檢測(cè)費(fèi)里斯(Ferris)輪的特征,所述算子的半徑可對(duì)應(yīng)于所述圖像中的費(fèi)里斯輪的預(yù)期大小。作為上文所述的另一實(shí)例,為了檢測(cè)面部的特征,所述算子的半徑可對(duì)應(yīng)于明亮的鼻子與每一深色的眼睛之間的預(yù)期距離。

外塊506的數(shù)目還可取決于正檢測(cè)的特征或?qū)ο蟮拇笮『?或形狀。舉例來(lái)說(shuō),具有較高數(shù)目的外塊的算子可與具有較高頻率的強(qiáng)度變化的特征相關(guān)聯(lián)。同樣地,具有較小數(shù)目的外塊的算子可與具有較低頻率的強(qiáng)度變化的特征相關(guān)聯(lián)??墒褂么罅康耐鈮K,因?yàn)檩^多的外塊可在所確定的半徑R1處配合在主塊504周?chē)?/p>

在當(dāng)前實(shí)例中,如圖7A中示出,確定半徑為R1(其從主位置524測(cè)得),且確定外塊的數(shù)目為八個(gè)。因此,在當(dāng)前實(shí)例中,由于步驟608和610,算子(例如為訓(xùn)練而選擇或從用于搜索的表征特征DB 486檢索)是圖5B中示出為算子500A的算子。

過(guò)程600繼續(xù)確定所述塊的位置(步驟612)。換句話說(shuō),算子邏輯460/420基于定向(例如在步驟604中確定的梯度方向)來(lái)使在步驟608和610中描述或確定的算子旋轉(zhuǎn)。舉例來(lái)說(shuō),過(guò)程600可確定主塊504周?chē)耐鈮K506的間距。

假定在步驟608和610中描述或確定的算子是算子500A,且方向邏輯470/430確定梯度方向135°。在一個(gè)實(shí)施例中,例如,使算子500A旋轉(zhuǎn)135°產(chǎn)生算子700F,如圖7F中示出。在另一實(shí)施例中,利用硬件加速器322的可能優(yōu)化,使算子中的塊保持筆直(例如使得塊并不包含相對(duì)于像素503水平或垂直的邊緣)。因此,使算子500A的外塊506-1在梯度方向(135°)(在步驟606處確定)上在距主位置524半徑R1處保持筆直,塊506-1'的中心降低到像素702的中心(見(jiàn)圖7A)。如果梯度方向上半徑R1(從主位置524測(cè)得)的端點(diǎn)并不落在像素的中心上,那么算子邏輯460/420可將所述半徑和/或梯度方向調(diào)整或扣入到最近像素503的中心。如上所述,主位置524還可能已扣入到最近像素503的中心。如果相機(jī)110執(zhí)行過(guò)程600,那么算子邏輯460可輸入距表征特征DB 486的半徑(例如作為與所檢索的表征特征相關(guān)聯(lián)的半徑)。

相對(duì)于當(dāng)前實(shí)例中的主塊504,算子邏輯460/420確定主塊504的位置將在主位置524處(如圖7B中示出),如在過(guò)程600中在604處確定或接收。在一個(gè)實(shí)施例中,算子邏輯460/420選擇或調(diào)整主塊504的位置,以?xún)?yōu)化硬件加速器322(或執(zhí)行本文所述的運(yùn)算的電路)的性能。舉例來(lái)說(shuō),算子邏輯460/420可將主塊504的中心定在整個(gè)像素503的中心上方。就是說(shuō),算子邏輯460/420可將主塊504的中心扣入為在整個(gè)像素503的中心上方。主塊504的中心還可扣入以覆蓋整數(shù)個(gè)像素503。

相對(duì)于當(dāng)前實(shí)例中的外塊506(圖5B中所示),算子邏輯460/420將外塊506放置成通常以距主位置一半徑(例如R1)環(huán)繞主塊504,且等距間隔。

所述塊的放置可取決于梯度方向(例如在步驟606中確定)。舉例來(lái)說(shuō),外塊506的放置可使得其根據(jù)梯度方向圍繞主位置(例如所述算子的中心或主塊504的中心)旋轉(zhuǎn)。圖7B中示出將外塊506-1'放置在算子500A'中。在此實(shí)例中,外塊506-1'(圖7B中所示)的中心在梯度方向上距主位置524半徑R1的距離處。如果梯度方向是135°,那么使外塊506-1(圖5B中所示)圍繞將定中心在像素702(圖7A和7B中示出的塊506-1')的中心上方的主位置524旋轉(zhuǎn)。在一個(gè)實(shí)施例中,如果梯度方向上距主位置524的半徑R1的端點(diǎn)并不落在像素(例如像素702)的中心上,那么外塊506-4的位置可扣入,使得其定中心在所述像素上方(例如最近像素中心,例如像素702的中心)。如果梯度方向是零度,那么塊506-1將看起來(lái)像在圖5B中作為算子500A那樣。在此情況下(具有零度梯度方向),因?yàn)榘霃絉1比像素的中心延伸得稍遠(yuǎn),所以塊506-1稍微朝內(nèi)扣入。

圖7C中示出外塊506中的四者的放置。在此實(shí)例中,算子邏輯460將外塊506-1'、塊506-3'、塊506-5'和506-7'各自放置在距主位置524半徑R1處,且各自旋轉(zhuǎn)135°(相對(duì)于圖5B中所示的位置)。另外,塊506-1'、506-3'和506-5'以及506-7'的中心定中心在像素503上方。如果外塊506-1'、506-3'、506-5'和506-7'中的任一者的中心不在像素503的中心上方,那么算子邏輯460可扣入塊506-1'、506-3'、506-5'和506-7',使得它們(例如定中心在最近像素上方)。

如果算子具有四個(gè)外塊(即,塊506-1、506-3、506-5和506-7;而非塊506-2、506-4、506-6和506-8),而不是八個(gè)外塊;以及如果所述塊(相對(duì)于圖5B中所示的位置)旋轉(zhuǎn)135°,那么所述算子的塊放置(一旦圍繞主位置524旋轉(zhuǎn))可如圖7C中所示。

返回到具有八個(gè)外塊506的算子500A的實(shí)例,圖7D(相對(duì)于圖7C)中示出其余外塊的放置。在此情況下,算子邏輯460可將外塊706-2、706-4、706-6和706-8(其分別對(duì)應(yīng)于外塊506-2、506-4、506-6和506-8)的中心712放置在距主位置524半徑R1處。如圖7D中所示,外塊706-2、706-4、706-6和706-8的中心不定中心在整個(gè)像素503上方。因此,在一個(gè)實(shí)施例中,算子邏輯460/420扣入外塊706-2、706-4、706-6和706-8,使得其中心在整個(gè)像素的中心上方。圖7E示出具有朝內(nèi)扣入(且分別示出為塊506-2'、506-4'、506-6'和506-8')的塊706-2、706-4、706-6和706-8的所得算子500A'。

在算子邏輯460/420朝內(nèi)扣入塊706(如圖7E中示出)之后,塊506-6'的中心不再位于遠(yuǎn)離主位置524的半徑R1處。實(shí)際上,塊506-6'的中心在距主位置524半徑R1內(nèi)(即,從主位置524到塊506-2、506-4、506-6和506-8的中心的半徑小于半徑R1)。同樣地,塊506-4'的中心在半徑R1內(nèi),塊506-2'的中心在半徑R1內(nèi),且塊506-8'的中心在半徑R1內(nèi)。

在一個(gè)實(shí)施例中,確定主塊周?chē)耐鈮K的位置可包含使外塊506與主塊504間隔一段距離(例如半徑R1),以避免主塊504與所述外塊中的至少一者連續(xù)。就是說(shuō),如圖5B中示出,算子邏輯460可將外塊506放置成使得所述圖像數(shù)據(jù)描述位于主塊504與外塊506中的至少一者之間的像素508。作為另一實(shí)例,如圖5C中示出,算子邏輯460可確定大于半徑R1的半徑R2,不留下與主塊504連續(xù)的外塊506。

可量化對(duì)應(yīng)于所述算子的特征(步驟614)。為了這樣做,算子邏輯460可轉(zhuǎn)到強(qiáng)度邏輯475/435,以確定指示每一外塊506和主塊504的強(qiáng)度(例如指示平均強(qiáng)度)的值(步驟616)。舉例來(lái)說(shuō),指示強(qiáng)度的值或指示平均強(qiáng)度的值可包含塊中的像素的平均強(qiáng)度或所述塊中的像素的強(qiáng)度的總和。如上文所論述,在其中主塊504具有與每一外塊506相同的大小的情況下,強(qiáng)度總和可充分指示與所述塊相關(guān)聯(lián)的強(qiáng)度。歸因于主塊504和外塊506的位置的確定,例如硬件加速器322(或執(zhí)行這些運(yùn)算的電路)可能夠非??焖俚卮_定平均強(qiáng)度。指示強(qiáng)度(例如指示平均強(qiáng)度)的所計(jì)算的值可分別為圖5D中所示的那些值:對(duì)于主塊504為9,且對(duì)于外塊506-1到506-8為19、11、12、8、7、8、6和20。在一個(gè)實(shí)施例中,位于主塊與外塊之間的像素508(即,所述塊不包含的像素)在此實(shí)施例中并不促成所述塊的平均強(qiáng)度值。

算子邏輯460/420還可轉(zhuǎn)到閾值邏輯477/437,以將指示主塊504的強(qiáng)度的值與指示外塊506中的每一者的強(qiáng)度的每一值進(jìn)行比較(步驟618)。所述比較的結(jié)果可用值(例如二進(jìn)制數(shù))來(lái)表示。如果外塊506的強(qiáng)度值大于主塊504,那么閾值邏輯477/437輸出“1”,并使其與對(duì)應(yīng)的外塊相關(guān)聯(lián)。另一方面,如果外塊506的強(qiáng)度值小于(或等于)主塊504的強(qiáng)度值,閾值邏輯477/437輸出“0”,并使其與對(duì)應(yīng)的外塊相關(guān)聯(lián)。上文描述此方法的替代方案。所述強(qiáng)度值可為塊中的像素的平均強(qiáng)度或塊中的像素的強(qiáng)度的總和(如上文所描述)。就是說(shuō),如果塊大小全部相同,那么閾值邏輯477/437可將主塊的強(qiáng)度值的總和與外塊的強(qiáng)度值的總和進(jìn)行比較。在一個(gè)實(shí)施例中,最高有效位是基于任意外塊(例如外塊506-1)的位置,其位置可基于梯度方向而改變。舉例來(lái)說(shuō),所述序列的記錄可以外塊506-1開(kāi)始(按梯度方向旋轉(zhuǎn)),且逆時(shí)針進(jìn)行。

如圖5E中所示,閾值邏輯477/437使‘0’與外塊506-6'(8<9)、塊506-7'(6<9)、塊506-5'(7<9)和塊506-4'(8<9)相關(guān)聯(lián)。因此,閾值邏輯477可基于主塊的強(qiáng)度值與外塊的強(qiáng)度值中的每一者的比較而產(chǎn)生值。舉例來(lái)說(shuō),如圖5E中所示,表示經(jīng)量化特征的值是“11100001”??蛇x擇最高有效位(產(chǎn)生于主塊504與外塊506-1'的比較)開(kāi)始于相同外塊504-1(例如來(lái)自算子500A),其已基于梯度方向522圍繞主位置524旋轉(zhuǎn)。在一個(gè)實(shí)施例中,下一有效位是正或逆時(shí)針?lè)较蛏系南乱煌鈮K(因此在當(dāng)前實(shí)例中產(chǎn)生“11100001”)?;谌绨刺荻确较蛐D(zhuǎn)的相同外塊506來(lái)選擇最高有效位允許以旋轉(zhuǎn)不變方式來(lái)識(shí)別所述特征。

可能連同算子的參數(shù)一起記錄所述特征(步驟620)。在訓(xùn)練過(guò)程期間,例如如果訓(xùn)練裝置140確定經(jīng)量化特征是表征特征,那么訓(xùn)練裝置140可將經(jīng)量化特征(“11100001”)連同算子的參數(shù)(例如主塊504和外塊506的大小和位置)存儲(chǔ)在表征特征DB 486中。在搜索過(guò)程期間,舉例來(lái)說(shuō),相機(jī)110可將經(jīng)量化特征(在搜索期間提取)與存儲(chǔ)在表征特征DB 486中的表征特征(先前在訓(xùn)練期間提取)進(jìn)行比較。

如上所述,扣入外塊506使得外塊506定中心在像素上可導(dǎo)致外塊506中的一些重疊,以便包含相同像素(例如共用內(nèi)部像素)。當(dāng)算子邏輯460計(jì)算兩此類(lèi)外塊506的強(qiáng)度時(shí),那兩個(gè)外塊506的強(qiáng)度可基于相同像素(例如共用內(nèi)部像素)的強(qiáng)度。圖8說(shuō)明另一個(gè)實(shí)施例中具有重疊塊(例如具有共用內(nèi)部像素的塊)的另一算子500A"。

在圖8的實(shí)例中,方向邏輯470/430確定梯度方向?qū)?0°,且半徑將為R1。然而,以10°距主位置524距離R1不在像素503的中心。因此,算子邏輯460/420將外塊506-1"扣入到如圖8中示出的位置。同樣地,算子邏輯460/420將外塊506-2"扣入到如圖8中示出的位置。因此,外塊506-1"和外塊506-2"兩者均在同一像素(以黑色示出)中包含一。同樣地,外塊506-3"和外塊506-4"共享像素;外塊506-5"和外塊506-6"共享像素;以及外塊506-7"和506-8"共享像素(所有共享的像素以黑色示出)。在算子500A"的實(shí)例中,強(qiáng)度邏輯475/435可使用同一像素來(lái)確定指示兩個(gè)不同外塊的強(qiáng)度的值。

在算子500A"的實(shí)例中,與外塊506-1"相關(guān)聯(lián)的閾值可被定義為經(jīng)量化特征的最高有效位(例如外塊506-1"的位置是基于梯度向量)。與外塊506-2"相關(guān)聯(lián)的值變?yōu)榈诙罡哂行В驗(yàn)槠湓趶耐鈮K506-1"開(kāi)始的正方向上。

如結(jié)合過(guò)程600所示,在一個(gè)實(shí)施例中,算子可由主位置524、從主位置到主要塊506的中心(例如在扣入主要塊506之前或之后)的距離(例如半徑)、外塊506的數(shù)目,和/或所述塊(即,主塊504和外塊506中的每一者)的形狀和大小。取決于這些因素,圖像502可描述位于主塊504與外塊506之間的像素;和/或外塊506中的兩個(gè)或更多個(gè)可重疊(例如以便具有共用內(nèi)部像素)。或者,取決于那些因素(例如塊的距離和大小),主塊504可與外塊506中的一或多者重疊;和/或外塊506中的兩個(gè)或更多個(gè)可重疊。換句話說(shuō),主塊504和外塊506可共享共用內(nèi)部像素;和/或兩個(gè)外塊506可共享共用內(nèi)部像素。外塊506的重疊可在具有或不具有不同于零度的方向的確定的情況下出現(xiàn)。

圖9A將圖5A的算子500A與更理想化的算子(以白色圓圈示出)進(jìn)行比較。盡管圖9A中的理想化算子可提供較準(zhǔn)確的結(jié)果,算子500A對(duì)于相機(jī)110(或其它硬件)來(lái)說(shuō)可更容易執(zhí)行(例如需要較少的處理能力、較少的電池電力等)。圖9B將圖8的算子500A"與較理想化的算子(也以白色圓圈示出)進(jìn)行比較。盡管圖9B中的理想化算子可提供較準(zhǔn)確的結(jié)果,但對(duì)于相機(jī)110來(lái)說(shuō),算子500A"可更容易執(zhí)行。圖9B的理想化算子的外區(qū)域尚未“扣入”,從而使其更理想化。即使圖9B的理想化算子的外區(qū)域扣入,其仍可為比算子500A"“更理想化”,歸因于外區(qū)域的形狀(即,圓形并非正方形)?!案硐牖钡乃阕涌梢?yàn)槠浣?jīng)理想化而較準(zhǔn)確,即其可不具有(例如算子500A、500A'或500A")的近似對(duì)稱(chēng)性中的一些,且可更“旋轉(zhuǎn)不變”。這些“更理想化”的算子可仍實(shí)施本文所述的特征,例如重疊外區(qū)域(甚至重疊圓形區(qū)域);與主要區(qū)域(甚至圓形區(qū)域)重疊的外區(qū)域;或扣入的外/主要區(qū)域。

圖10A說(shuō)明在另一個(gè)實(shí)施例中的算子1000。就是說(shuō),算子邏輯460或420可確定塊大小、塊形狀、半徑等,使得算子如圖10A中所示出現(xiàn)。在一個(gè)實(shí)施例中,算子1000包含主塊504-4(定中心在主位置524-4)上方,其覆蓋三乘三正方形中的九個(gè)像素。外塊506(即,四個(gè),包含外塊506-42、506-44、506-46和506-48)以大約半徑R4環(huán)繞主塊504-4。算子1000中的外塊506也覆蓋各自在三乘三正方形中的九個(gè)像素。就是說(shuō),算子1000包含主塊504-4,其具有與每一外塊506相同的大小。另外,算子1000使得主塊504-4定中心在像素503的中心上方,且外塊506中的每一者定中心在圖像502中的像素503的中心上方。

然而,對(duì)于算子1000,圖像502并不描述位于主塊504-4與外塊506之間的任何像素(例如外部像素)。實(shí)際上,算子1000中的主塊504-4與外塊506-42重疊(一個(gè)共用內(nèi)部像素)、與外塊506-44重疊(一個(gè)像素)、與外塊506-46重疊(一個(gè)像素),且與外塊506-48重疊(一個(gè)共用內(nèi)部像素)。明確地說(shuō),主塊504-4的四個(gè)拐點(diǎn)像素中的每一者與算子1000中的外塊506中的一者重疊。主塊504的這些拐點(diǎn)像素(即,共用內(nèi)部像素)以黑色加陰影。然而,圖10A中的圖像502的確描述位于外塊506之間的像素508(即,位于外塊506-42與外塊506-44之間;外塊506-44與外塊506-46之間;外塊506-46與外塊506-48之間;以及外塊506-48與外塊506-42之間的外部或省略的像素)。

圖10B將圖10A的算子1000與更理想化的算子(以白色圓圈示出)進(jìn)行比較。盡管圖10B中的理想化算子可提供較準(zhǔn)確的結(jié)果,但對(duì)于相機(jī)110(或任何硬件),算子1000可更容易執(zhí)行(例如需要較少的處理能力、較少的電池電力等)。

圖11A說(shuō)明在另一個(gè)實(shí)施例中的算子1100。就是說(shuō),算子邏輯460或420可確定塊大小、塊形狀、半徑等,使得算子如圖10A中所示出現(xiàn)。算子1100包含主塊504-5(定中心在主位置524-5上方),其覆蓋三乘三正方形中的九個(gè)像素。外塊506(即,外塊506-51到506-58)以大約半徑R5環(huán)繞主塊504-5。算子1100中的外塊506也覆蓋各自在三乘三正方形中的九個(gè)像素。就是說(shuō),算子1100包含主塊504-5,其具有與每一外塊506相同的大小。另外,主塊504-5定中心在像素503的中心上方,且外塊506中的每一者定中心在算子1100中的像素503的中心上方。

對(duì)于算子1000,圖11A中的圖像502并不描述位于主塊504-5與外塊506之間的任何像素(例如外部像素)。實(shí)際上,算子1100中的主塊504-5與外塊506-52重疊(一個(gè)共用內(nèi)部像素)、與外塊506-54重疊(一個(gè)共用內(nèi)部像素)、與外塊506-56重疊(一個(gè)共用內(nèi)部像素),且與外塊506-58重疊(一個(gè)共用內(nèi)部像素)。明確地說(shuō),主塊504-5的四個(gè)拐點(diǎn)像素中的每一者與算子1100中的外塊506中的一者重疊。主塊504的這些拐點(diǎn)像素以黑色加陰影。

不同于算子1000,算子1100中的外塊506彼此重疊(例如包含共用內(nèi)部像素)。如圖11A中所示,外塊506-51與外塊506-52重疊(兩個(gè)像素);外塊506-52與外塊506-53重疊(兩個(gè)像素);外塊506-53與外塊506-54重疊(兩個(gè)像素);外塊506-54與外塊506-55重疊(兩個(gè)像素);外塊506-55與外塊506-56重疊(兩個(gè)像素);外塊506-56與外塊506-57重疊(兩個(gè)像素);外塊506-57與外塊506-58重疊(兩個(gè)像素);且外塊506-58與外塊506-51重疊(兩個(gè)像素)。算子1100中的外塊506的重疊部分以黑色加陰影。

圖11B將圖11A的算子1100與更理想化的算子(以白色圓圈示出)進(jìn)行比較。盡管圖11B中的理想化算子可提供較準(zhǔn)確的結(jié)果,但對(duì)于相機(jī)110來(lái)說(shuō),算子1100可更容易執(zhí)行(例如需要較少的處理能力、較少的電池電子等)。

圖12A說(shuō)明在另一個(gè)實(shí)施例中的算子1200。就是說(shuō),算子邏輯460或420可確定塊大小、塊形狀、半徑等,使得算子如圖12A中所示出現(xiàn)。算子1200包含主塊504-6(定中心在主位置524-6上方),其覆蓋三乘三正方形中的九個(gè)像素。在圖12A中,主塊504-6具有陰影,以增加可見(jiàn)度。外塊506(即,外塊506-61到506-68)以大約半徑R6環(huán)繞主塊504-5。算子1200中的外塊506也覆蓋各自在三乘三正方形中的九個(gè)像素。就是說(shuō),算子1200包含主塊504-6,其具有與每一外塊506相同的大小。另外,主塊504-6定中心在像素503的中心上方,且外塊506中的每一者定中心在算子1200中的像素503的中心上方。

類(lèi)似于算子1000(圖10)和1100(圖11),相對(duì)于算子1200(圖12),圖像502并不描述位于主塊504-6與外塊506之間的任何像素(例如外部像素)。實(shí)際上,算子1200中的主塊504-6與外塊506-62重疊(一個(gè)共用內(nèi)部像素)、與外塊506-64重疊(一個(gè)共用內(nèi)部像素)、與外塊506-66重疊(一個(gè)共用內(nèi)部像素),且與外塊506-68重疊(一個(gè)共用內(nèi)部像素)。明確地說(shuō),主塊504-6的四個(gè)拐點(diǎn)像素中的每一者與算子1200中的外塊506中的一者重疊。主塊504的這些拐點(diǎn)像素以黑色加陰影。

對(duì)于算子1100,算子1200中的外塊506彼此重疊(例如具有共用內(nèi)部像素)。如圖12A中所示,外塊506-61與外塊506-52重疊(四個(gè)像素);外塊506-62與外塊506-63重疊(四個(gè)像素);外塊506-63與外塊506-64重疊(四個(gè)像素);外塊506-64與外塊506-65重疊(四個(gè)像素);外塊506-65與外塊506-66重疊(四個(gè)像素);外塊506-66與外塊506-67重疊(四個(gè)像素);外塊506-67與外塊506-68重疊(四個(gè)像素);且外塊506-68與外塊506-61重疊(四個(gè)像素)。算子1200中的外塊506的重疊部分以黑色加陰影。

圖12B將圖12A的算子1200與更理想化的算子(以白色圓圈示出)進(jìn)行比較。盡管圖12B中的理想化算子可提供較準(zhǔn)確的結(jié)果,但對(duì)于相機(jī)110來(lái)說(shuō),算子1200可更容易執(zhí)行(例如需要較少的處理能力、較少的電池電子等)。

在先前說(shuō)明書(shū)中,已參考附圖描述各種實(shí)施例。然而,將明白,在不脫離所附權(quán)利要求中所陳述的本發(fā)明的更廣范圍的情況下,可對(duì)其進(jìn)行各種修改和變化,且可實(shí)施額外實(shí)施例。因此,本說(shuō)明書(shū)和附圖應(yīng)在說(shuō)明性意義上而非限制性意義上看待。舉例來(lái)說(shuō),雖然已相對(duì)于過(guò)程600和圖6描述了塊系列,但在其它實(shí)施方案中,可修改塊和/或信號(hào)流的次序。另外,非相依塊和/或信號(hào)流可并行執(zhí)行。

將明白,如上文所描述,系統(tǒng)和/或方法可在圖中所說(shuō)明的實(shí)施方案中的許多不同形式的軟件固件和硬件中實(shí)施。用以實(shí)施這些系統(tǒng)和方法的實(shí)際軟件代碼或?qū)S每刂朴布幌拗茖?shí)施例。因此,不參看特定軟件代碼來(lái)描述所述系統(tǒng)和方法的操作和行為,應(yīng)了解,可將軟件和控制硬件設(shè)計(jì)成基于本文描述來(lái)實(shí)施所述系統(tǒng)和方法。

另外,可將上文所述的某些部分實(shí)施為執(zhí)行一或多個(gè)功能的組件。如本文所使用,組件可包含硬件,例如處理器、ASIC或FPGA,或硬件與軟件的組合(例如執(zhí)行軟件的處理器)。

如本文所使用,術(shù)語(yǔ)“邏輯”可指經(jīng)配置以執(zhí)行存儲(chǔ)在一或多個(gè)存儲(chǔ)器裝置中的指令的一或多個(gè)處理器的組合,可指硬連線電路,和/或可指其組合。此外,邏輯可包含于單個(gè)裝置中,或可跨多個(gè)且可能遠(yuǎn)程裝置分布。

應(yīng)強(qiáng)調(diào),如本文所使用,術(shù)語(yǔ)“包括”指定所陳述的特征、整數(shù)、步驟或組件的存在,但不排除一或多個(gè)其它特征、整數(shù)、步驟、組件或其群組的存在或添加。另外,術(shù)語(yǔ)“示范性”(例如“示范性實(shí)施例”、“示范性配置”等)表示“作為一實(shí)例”(例如“實(shí)例中的實(shí)施例”、“一個(gè)實(shí)例中的配置”等)。

用于本申請(qǐng)案中的元件、動(dòng)作或指令不應(yīng)被解釋為對(duì)實(shí)施例來(lái)說(shuō)是重要的或基本的,除非明確如此描述。并且,如本文所使用,冠詞“一”既定包含一個(gè)或多個(gè)項(xiàng)目。另外,除非另外明確陳述,否則短語(yǔ)“基于”希望表示“至少部分地基于”。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
佛坪县| 崇信县| 鹤峰县| 梧州市| 聂拉木县| 太仆寺旗| 吉首市| 麻栗坡县| 泰州市| 泸西县| 临安市| 南昌县| 江西省| 丰城市| 云霄县| 兴山县| 新密市| 余干县| 平度市| 康乐县| 湖州市| 上林县| 昔阳县| 栾川县| 忻州市| 肥城市| 乡城县| 准格尔旗| 岳普湖县| 进贤县| 喀喇沁旗| 杭锦后旗| 海淀区| 沙湾县| 上饶市| 新兴县| 遂宁市| 钟山县| 石泉县| 渝中区| 西峡县|