景僅是為了便于理解本發(fā)明的精神和原理而示出,本 發(fā)明的實(shí)施方式在此方面不受任何限制。相反,本發(fā)明的實(shí)施方式可以應(yīng)用于適用的任何 場(chǎng)景。
[0040] 如圖2所示,該圖像識(shí)別方法可以包括:
[0041] 步驟S201,對(duì)待識(shí)別圖像進(jìn)行特征提取,得到多個(gè)特征向量。
[0042] 步驟S202,確定每個(gè)特征向量對(duì)應(yīng)的類別。
[0043] 步驟S203,針對(duì)每個(gè)特征向量,分別計(jì)算其所對(duì)應(yīng)的類別下各樣本圖像的分?jǐn)?shù)。
[0044] 步驟S204,將計(jì)算得到的同一樣本圖像的分?jǐn)?shù)累加,得到該同一樣本圖像的分值。
[0045] 步驟S205,將分值最高的樣本圖像對(duì)應(yīng)的圖像標(biāo)識(shí)作為待識(shí)別圖像的識(shí)別結(jié)果。 其中,圖像標(biāo)識(shí)可以是圖像的名稱、編號(hào)或者其他能夠唯一標(biāo)識(shí)該圖像的信息。
[0046] 在一個(gè)實(shí)施例中,可以利用滑動(dòng)窗口遍歷待識(shí)別圖像,針對(duì)滑動(dòng)窗口所處的每個(gè) 區(qū)域,計(jì)算該區(qū)域的特征向量,由此得到表征該待識(shí)別圖像的多個(gè)特征向量。本發(fā)明對(duì)滑動(dòng) 窗口的像素尺寸不做限定。較優(yōu)的,待識(shí)別圖像的像素?cái)?shù)能被滑動(dòng)窗口的像素?cái)?shù)整除,這樣 能夠更有效地提取特征向量。
[0047] 利用滑動(dòng)窗口遍歷待識(shí)別圖像時(shí),在待識(shí)別圖像上,滑動(dòng)窗口可以按照預(yù)設(shè)方向 每隔固定個(gè)數(shù)的像素進(jìn)行滑動(dòng),直到遍歷整個(gè)待識(shí)別圖像。例如,按行遍歷或者按列遍歷。
[0048] 具體地,可以通過以下步驟計(jì)算滑動(dòng)窗口所處的區(qū)域的特征向量:
[0049] (1)將該區(qū)域劃分為多個(gè)大小相同的細(xì)胞單元,其中,每個(gè)細(xì)胞單元之間不重疊。
[0050] (2)針對(duì)每個(gè)細(xì)胞單元,計(jì)算其中各像素的梯度方向值,將梯度方向值在預(yù)設(shè)的投 影區(qū)間內(nèi)進(jìn)行投影生成梯度方向投影向量;將各像素的梯度方向投影向量求和,得到該細(xì) 胞單元的梯度方向直方圖。
[0051] 需要說明的是,梯度方向值包括:梯度方向和梯度幅值。梯度方向直方圖是個(gè)向 量。
[0052] (3)將該區(qū)域內(nèi)所有細(xì)胞單元的梯度方向直方圖進(jìn)行串聯(lián)作為該區(qū)域的特征向 量。串聯(lián)指的是將多個(gè)向量首尾相接。
[0053] 下面結(jié)合一個(gè)具體實(shí)施例說明提取特征向量的過程。在實(shí)際應(yīng)用中,各像素尺寸、 細(xì)胞單元的個(gè)數(shù)等數(shù)值可以根據(jù)具體情況進(jìn)行設(shè)置。
[0054] 待識(shí)別圖像的像素尺寸為96X96,滑動(dòng)窗口的像素尺寸為32X32。以按行遍歷為 例,在待識(shí)別圖像上,滑動(dòng)窗口從左往右每隔8個(gè)像素進(jìn)行滑動(dòng),當(dāng)滑動(dòng)窗口滑動(dòng)到最右端 時(shí),將滑動(dòng)窗口移動(dòng)到最左端,并向下移動(dòng)8個(gè)像素,再次完成從左往右的滑動(dòng)操作,重復(fù) 以上滑動(dòng)操作,直到遍歷整個(gè)待識(shí)別圖像,共滑動(dòng)81次。
[0055] 針對(duì)滑動(dòng)窗口所處的每個(gè)區(qū)域,計(jì)算該區(qū)域的特征向量,共得到81個(gè)特征向量。 其中,每個(gè)區(qū)域的像素尺寸均為32X32。
[0056] 具體地,計(jì)算區(qū)域的特征向量包括:
[0057] 1)將當(dāng)前區(qū)域劃分為16個(gè)不重疊的細(xì)胞單元,每個(gè)細(xì)胞單元的像素尺寸均為 8X8。
[0058] 2)針對(duì)每個(gè)細(xì)胞單元,計(jì)算其中各像素的梯度方向值(包括梯度方向和梯度幅 值),將梯度方向值在預(yù)設(shè)的投影區(qū)間內(nèi)進(jìn)行投影生成梯度方向投影向量。具體地,可以對(duì) 灰度圖像的像素進(jìn)行計(jì)算。例如,計(jì)算得到的某一像素的梯度方向值如下:梯度方向?yàn)?25 度,梯度幅值為20 ;預(yù)設(shè)的投影區(qū)間為0~120度、120~240度、240~360度三區(qū)間;該梯 度方向值投影到上述三區(qū)間時(shí),形成三維的梯度方向投影向量(〇,20,0);由此可看出,梯 度方向決定三維向量中哪個(gè)元素不為〇,梯度幅值決定該不為〇的元素的具體數(shù)值)。對(duì)當(dāng) 前細(xì)胞單元中的每個(gè)像素依次做上述操作,得到各個(gè)像素的梯度方向投影向量,進(jìn)行求和, 得到該細(xì)胞單元的梯度方向直方圖(仍然是三維向量)。例如,求和得到的梯度方向直方圖 為(100, 50, 50),為方便后續(xù)數(shù)據(jù)的處理,可以對(duì)該梯度方向直方圖進(jìn)行歸一化處理,例如, 把該三維向量中三個(gè)元素的和作為除數(shù),得到(0. 5,0. 25,0. 25)。
[0059] 3)將當(dāng)前區(qū)域內(nèi)所有細(xì)胞單元的梯度方向直方圖進(jìn)行串聯(lián)作為該區(qū)域的特征向 量。一共16個(gè)細(xì)胞單元,每個(gè)細(xì)胞單元的梯度方向直方圖均為三維向量,串聯(lián)得到該區(qū)域 的48維特征向量。
[0060] 由此,對(duì)于待識(shí)別圖像,得到了 81個(gè)48維的特征向量。
[0061] 步驟S202中確定每個(gè)特征向量對(duì)應(yīng)的類別,可以通過以下步驟實(shí)現(xiàn):分別計(jì)算特 征向量與預(yù)先存儲(chǔ)的多個(gè)聚類中心向量的距離,其中,聚類中心向量與類別--對(duì)應(yīng);確定 與該特征向量距離最近的聚類中心向量對(duì)應(yīng)的類別為該特征向量對(duì)應(yīng)的類別。結(jié)合上述應(yīng) 用場(chǎng)景,可以從存儲(chǔ)設(shè)備200中讀取存儲(chǔ)的樣本圖像信息中的類別和聚類中心向量。
[0062] 在一個(gè)實(shí)施例中,可以按照以下公式計(jì)算樣本圖像的分?jǐn)?shù):
[0064] 其中,S表示當(dāng)前樣本圖像的分?jǐn)?shù),A表示平均每個(gè)類別下的樣本圖像特征向量個(gè) 數(shù),B表示當(dāng)前樣本圖像所屬的類別下的所有圖像標(biāo)識(shí)出現(xiàn)次數(shù)之和,C表示當(dāng)前樣本圖像 所屬的類別下,當(dāng)前樣本圖像對(duì)應(yīng)的圖像標(biāo)識(shí)出現(xiàn)次數(shù),D表示放縮因子,可以為預(yù)設(shè)常數(shù), 例如0. 5。
[0065] 下面結(jié)合一個(gè)具體實(shí)施例說明計(jì)算樣本圖像分?jǐn)?shù)以及確定識(shí)別結(jié)果的過程。
[0066] 先對(duì)已存儲(chǔ)的樣本圖像信息進(jìn)行說明。
[0067] 假設(shè)有3個(gè)樣本圖像I、J、K,每個(gè)樣本圖像提取2個(gè)樣本圖像特征向量,樣本圖像 的特征向量共3個(gè)類別X、Y、Z,此時(shí),平均每個(gè)類別下的樣本圖像特征向量個(gè)數(shù)為2,即A= 2〇
[0068] 類別X下,樣本圖像I出現(xiàn)次數(shù)為0,樣本圖像J出現(xiàn)次數(shù)為1,樣本圖像K出現(xiàn)次 數(shù)為1 ;類別Y下,樣本圖像I出現(xiàn)次數(shù)為2,樣本圖像J出現(xiàn)次數(shù)為1,樣本圖像K出現(xiàn)次 數(shù)為〇 ;類別Z下,樣本圖像I出現(xiàn)次數(shù)為0,樣本圖像J出現(xiàn)次數(shù)為0,樣本圖像K出現(xiàn)次 數(shù)為1。樣本圖像信息的示意圖如圖3所示,同一樣本圖像在不同類別下的出現(xiàn)次數(shù)之和即 為提取的該樣本圖像的特征向量個(gè)數(shù)。為方便理解,此處樣本圖像信息以表格的形式為例, 本發(fā)明并不限于此,還可以其他能夠表明各因素對(duì)應(yīng)關(guān)系的方式進(jìn)行存儲(chǔ)。
[0069] 需要識(shí)別某一待識(shí)別圖像時(shí),對(duì)待識(shí)別圖像進(jìn)行特征提取,得到2個(gè)特征向量。
[0070] 假設(shè)其中一個(gè)特征向量對(duì)應(yīng)類別X,則分別計(jì)算類別X下的樣本圖像I、J、K的分 數(shù):
[0078] 累加樣本圖像I的分?jǐn)?shù),得到樣本圖像I的分值I. 58 ;累加樣本圖像J的分?jǐn)?shù),得 到樣本圖像J的分值1. 53 ;累加樣本圖像K的分?jǐn)?shù),得到樣本圖像K的分值1. 45。由此,將 分值最高的樣本圖像I的圖像標(biāo)識(shí)作為待識(shí)別圖像的識(shí)別結(jié)果,即待識(shí)別圖像為樣本圖像 Io
[0079] 圖像識(shí)別主要是根據(jù)待識(shí)別圖像不同于其他圖像的特性進(jìn)行識(shí)別,采用計(jì)算樣本
表示當(dāng)前樣本圖像所屬的類別下的所有圖像標(biāo)識(shí)出現(xiàn)次數(shù)之和,即該類別下所有樣本圖像 的特征向量的個(gè)數(shù),B越大,表明這個(gè)類別中的特征越不重要;C表示當(dāng)前樣本圖像所屬的 類別下,當(dāng)前樣本圖像對(duì)應(yīng)的圖像標(biāo)識(shí)出現(xiàn)次數(shù),C越大,表明該樣本圖像中的相似特征越 多,這些特征不是圖像獨(dú)有的特性,則這些特征越不重要。
[0080] 為了更加有效地提取表征待識(shí)別圖像的特征向量,可以在待識(shí)別圖像上裁剪出識(shí) 別區(qū)域,并將識(shí)別區(qū)域的像素尺寸調(diào)整到預(yù)定像素尺寸(例如500X500),對(duì)識(shí)別區(qū)域進(jìn)行 特征提取。例如,待識(shí)別圖像為一圓形的金屬幣,圖像一般為矩形,該金屬幣的圖像中在圓 形金屬幣區(qū)域之外,會(huì)包含噪聲(例如,拍攝該圖像時(shí)的背景),沿著該圓形金屬幣的邊緣 裁剪出識(shí)別區(qū)域,可以去除背景噪聲的影響;并且,調(diào)整識(shí)別區(qū)域的像素尺寸,使得圖像更 加清晰,從而得到的特征向量可以較好地表征待識(shí)別圖像。調(diào)整像素尺寸的方法為現(xiàn)有技 術(shù),此處不做詳細(xì)介紹。
[0081] 下面對(duì)樣本圖像信息進(jìn)行詳細(xì)說明。
[0082] 在對(duì)圖像進(jìn)行識(shí)別之前,可以預(yù)先建立樣本圖像信息,并存儲(chǔ)該樣本圖像信息,以 根據(jù)該樣本圖像信息進(jìn)行圖像識(shí)別過程中的類別確定和分?jǐn)?shù)計(jì)算,提高圖像識(shí)別的效率。 較優(yōu)的,樣本圖像信息可以哈希(Hash)索引的形式存儲(chǔ),便于按照鍵值查找其中的信息, 能夠高效地進(jìn)行查找操作,且查找速度不會(huì)隨樣本圖像的增加而呈線性增加,即使在圖像 特征維度較高的情況下,也可以高