效查找。
[0083] 以下稱樣本圖像信息為索引信息,即預(yù)先建立索引信息,并存儲(chǔ)該索引信息。
[0084] 索引信息可以包括:類別、圖像標(biāo)識(shí)和圖像標(biāo)識(shí)出現(xiàn)次數(shù),還可以包括與類別一一 對應(yīng)的聚類中心向量。具體地,可以收集多張樣本圖像,對這些樣本圖像進(jìn)行特征向量提 取、聚類等處理,然后對處理得到的參數(shù)進(jìn)行整理,得到索引信息。
[0085] 具體地,可以通過以下步驟建立索引信息:
[0086] Sl:記錄多張樣本圖像的圖像標(biāo)識(shí),分別對每張樣本圖像均提取多個(gè)樣本圖像特 征向量,并記錄圖像標(biāo)識(shí)與多個(gè)樣本圖像特征向量的對應(yīng)關(guān)系。
[0087] 例如,N張樣本圖像,圖像標(biāo)識(shí)為數(shù)字編號(hào)1~N,對每張樣本圖像均提取81個(gè)樣 本圖像特征向量,那么,會(huì)記錄編號(hào)1對應(yīng)81個(gè)樣本圖像特征向量,編號(hào)2對應(yīng)81個(gè)樣本 圖像特征向量。
[0088] 為了更加有效地提取表征樣本圖像的特征向量,可以在樣本圖像上裁剪出識(shí)別區(qū) 域,并將識(shí)別區(qū)域的像素尺寸調(diào)整到預(yù)定像素尺寸,對識(shí)別區(qū)域進(jìn)行特征提取。例如,樣本 圖像為一圓形的金屬幣,圖像一般為矩形,該金屬幣的圖像中在圓形金屬幣區(qū)域之外,會(huì)包 含噪聲(例如,拍攝該圖像時(shí)的背景),沿著該圓形金屬幣的邊緣裁剪出識(shí)別區(qū)域,可以去 除背景噪聲的影響;并且,調(diào)整識(shí)別區(qū)域的像素尺寸,使得圖像更加清晰,從而得到的特征 向量可以較好地表征樣本圖像。
[0089] 需要說明的是,提取樣本圖像特征向量的方法,與上述實(shí)施例中提取待識(shí)別圖像 的特征向量的方法相同,此處不再贅述。提取的待識(shí)別圖像的特征向量個(gè)數(shù)與樣本圖像特 征向量的個(gè)數(shù)相同,例如,對每張樣本圖像提取64個(gè)特征向量,則對待識(shí)別圖像也提取64 個(gè)特征向量。如果需要調(diào)整像素尺寸,則調(diào)整后的待識(shí)別圖像的像素尺寸與調(diào)整后的樣本 圖像的像素尺寸相同。
[0090] S2:對多張樣本圖像對應(yīng)的全部樣本圖像特征向量進(jìn)行聚類,得到預(yù)定個(gè)數(shù)的類 別及與類別一一對應(yīng)的聚類中心向量。
[0091] 聚類可以簡單理解為分類,同一類別中的特征相似度較高。聚類方法有多種,例 如,K-MEANS算法、K-MED0IDS算法、CLARANS算法等。下面以K-MEANS算法為例進(jìn)彳丁說明。
[0092] 對NX81個(gè)樣本圖像特征向量進(jìn)行K-MEANS聚類,聚類過程如下:
[0093] (1)從NX81個(gè)樣本圖像特征向量中隨機(jī)選擇M個(gè)樣本圖像特征向量,作為初始 聚類中心向量,并將選擇的每個(gè)樣本圖像特征向量標(biāo)記為一個(gè)類別,類別號(hào)可以是數(shù)字,例 如,0、1、2......M-I0
[0094] (2)在NX81個(gè)樣本圖像特征向量中,針對每個(gè)樣本圖像特征向量,分別計(jì)算其與 每個(gè)初始聚類中心向量的距離,并將與該樣本圖像特征向量距離最近的初始聚類中心向量 的類別作為該樣本圖像特征向量的類別。即將NX81個(gè)樣本圖像特征向量進(jìn)行分類,分成 M個(gè)類別。
[0095] (3)分別計(jì)算每個(gè)類別中所有樣本圖像特征向量的均值,并將該均值作為該類別 的新的聚類中心向量。
[0096](4)重復(fù)步驟(2)、⑶直到M個(gè)聚類中心向量均收斂(即對于同一類別,新的聚 類中心向量與上一次的聚類中心向量的差值小于一預(yù)定經(jīng)驗(yàn)值,變化差異較小),保存收斂 的M個(gè)聚類中心向量。
[0097] S3 :建立長度為預(yù)定個(gè)數(shù)的哈希索引結(jié)構(gòu),哈希索引結(jié)構(gòu)包括:類別、圖像標(biāo)識(shí)及 圖像標(biāo)識(shí)出現(xiàn)次數(shù)。
[0098] 預(yù)定個(gè)數(shù)是步驟S2中對所有樣本圖像特征向量進(jìn)行聚類得到的類別個(gè)數(shù)M。哈希 索引結(jié)構(gòu)的查找鍵值可以是步驟S2中生成的類別號(hào),即0、1、2……M-1。圖4示出了哈希 索引結(jié)構(gòu)的示意圖,節(jié)點(diǎn)包括:圖像標(biāo)識(shí)與圖像標(biāo)識(shí)出現(xiàn)次數(shù)兩個(gè)變量。
[0099] S4 :將全部樣本圖像特征向量插入哈希索引結(jié)構(gòu),得到索引信息。
[0100] 具體地,可以對每個(gè)樣本圖像特征向量均執(zhí)行如下操作以插入哈希索引結(jié)構(gòu):
[0101] (1)確定與待插入樣本圖像特征向量距離最近的聚類中心向量所對應(yīng)的類別,并 將該類別標(biāo)記為待插入樣本圖像特征向量的類別。
[0102] 在步驟S2的聚類過程中,通過計(jì)算距離,最終得到M個(gè)聚類中心向量,且在此過 程中,已經(jīng)對全部樣本圖像特征向量進(jìn)行了分類,可以在聚類結(jié)束后,將分類的信息進(jìn)行存 儲(chǔ)。因此,可以直接通過讀取數(shù)據(jù)確定與待插入樣本圖像特征向量距離最近的聚類中心向 量對應(yīng)的類別,無需重新計(jì)算,提高效率。
[0103] (2)在哈希索引結(jié)構(gòu)中查找待插入樣本圖像特征向量的類別的位置,并遍歷待插 入樣本圖像特征向量的類別下的所有圖像標(biāo)識(shí)。
[0104] 如果待插入樣本圖像特征向量對應(yīng)的圖像標(biāo)識(shí)未存在于待插入樣本圖像特征向 量的類別下,則添加新節(jié)點(diǎn),其中,新節(jié)點(diǎn)的圖像標(biāo)識(shí)設(shè)置為待插入樣本圖像特征向量對應(yīng) 的圖像標(biāo)識(shí),新節(jié)點(diǎn)的圖像標(biāo)識(shí)出現(xiàn)次數(shù)設(shè)置為1。
[0105] 如果待插入樣本圖像特征向量對應(yīng)的圖像標(biāo)識(shí)存在于待插入樣本圖像特征向量 的類別下,則將該圖像標(biāo)識(shí)對應(yīng)的圖像標(biāo)識(shí)出現(xiàn)次數(shù)加1。
[0106] 通過上述步驟Sl至步驟S4,可以得到索引信息。
[0107] 通過本發(fā)明上述實(shí)施方式的圖像識(shí)別方法,有效提取多個(gè)特征來表征待識(shí)別圖 像,提取的特征不受圖像中物體的特性所影響,能夠?qū)崿F(xiàn)對圖像的有效識(shí)別,適用范圍廣; 且通過計(jì)算樣本圖像分?jǐn)?shù)的方式得到識(shí)別結(jié)果,綜合考慮了特征的重要性,能夠獲得較好 的識(shí)別精度。
[0108] 示例件設(shè)備
[0109] 在介紹了本發(fā)明示例性實(shí)施方式的方法之后,接下來,參考圖5對本發(fā)明示例性 實(shí)施方式的圖像識(shí)別裝置進(jìn)行介紹。該圖像識(shí)別裝置解決問題的原理與上述圖像識(shí)別方法 相似,因此該裝置的實(shí)施可以參見上述圖像識(shí)別方法的實(shí)施,重復(fù)之處不再贅述。
[0110] 如圖5所示,該圖像識(shí)別裝置包括:特征提取單元51、第一確定單元52、計(jì)算單元 53、累加單元54和第二確定單元55。下面對該裝置中的各個(gè)單元進(jìn)行具體描述。
[0111] 特征提取單元51,用于對待識(shí)別圖像進(jìn)行特征提取,得到多個(gè)特征向量。
[0112] 第一確定單元52,用于確定每個(gè)特征向量對應(yīng)的類別。
[0113] 計(jì)算單元53,用于針對每個(gè)特征向量,分別計(jì)算其所對應(yīng)的類別下各樣本圖像的 分?jǐn)?shù)。
[0114] 累加單元54,用于將計(jì)算得到的同一樣本圖像的分?jǐn)?shù)累加,得到該同一樣本圖像 的分值。
[0115] 第二確定單元55,用于將分值最高的樣本圖像對應(yīng)的圖像標(biāo)識(shí)作為待識(shí)別圖像的 識(shí)別結(jié)果。
[0116] 具體地,上述第一確定單元52可以包括:第一計(jì)算模塊和確定模塊。其中,第一計(jì) 算模塊可以用于分別計(jì)算特征向量與預(yù)先存儲(chǔ)的多個(gè)聚類中心向量的距離,其中,聚類中 心向量與類別--對應(yīng);確定模塊可以用于確定與該特征向量距離最近的聚類中心向量對 應(yīng)的類別為該特征向量對應(yīng)的類別。
[0117] 上述計(jì)算單元53可以被設(shè)置為按照以下公式計(jì)算樣本圖像的分?jǐn)?shù):
[0119] 其中,S表示當(dāng)前樣本圖像的分?jǐn)?shù),A表示平均每個(gè)類別下的樣本圖像特征向量個(gè) 數(shù),B表示當(dāng)前樣本圖像所屬的類別下的所有圖像標(biāo)識(shí)出現(xiàn)次數(shù)之和,C表示當(dāng)前樣本圖像 所屬的類別下,當(dāng)前樣本圖像對應(yīng)的圖像標(biāo)識(shí)出現(xiàn)次數(shù),D表示放縮因子,可以為預(yù)設(shè)常數(shù), 例如0. 5。
[0120] 具體地,上述特征提取單元51可以包括:遍歷模塊和第二計(jì)算模塊。其中,遍歷 模塊,用于利用滑動(dòng)窗口遍歷待識(shí)別圖像;第二計(jì)算模塊,用于針對滑動(dòng)窗口所處的每個(gè)區(qū) 域,計(jì)算該區(qū)域的特征向量。
[0121] 遍歷模塊可以被設(shè)置為:在待識(shí)別圖像上,利用滑動(dòng)窗口按照預(yù)設(shè)方向每隔固定 個(gè)數(shù)的像素進(jìn)行滑動(dòng),直到遍歷整個(gè)待識(shí)別圖像。例如,按行遍歷或者按列遍歷。
[0122] 第二計(jì)算模塊可以按照以下方式計(jì)算滑動(dòng)窗口所處的區(qū)域的特征向量:將該區(qū)域 劃分為多個(gè)大小相同的細(xì)胞單元,其中,每個(gè)細(xì)胞單元之間不重疊;針對每個(gè)細(xì)胞單元,計(jì) 算其中各像素的梯度方向值,將梯度方向值在預(yù)設(shè)的投影區(qū)間內(nèi)進(jìn)行投影生成梯度方向投 影向量;將各像素的梯度方向投影向量求和,得到該細(xì)胞單元的梯度方向直方圖;將該區(qū) 域內(nèi)所有細(xì)胞單元的梯度方向直方圖進(jìn)行串聯(lián)作為該區(qū)域的特征向量。
[0123] 上述特征提取單元51可以被設(shè)置為:在待識(shí)別圖像上裁剪出