圖像識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明的實(shí)施方式涉及圖像識別技術(shù)領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及一 種圖像識別方法和裝置。
【背景技術(shù)】
[0002] 本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的 描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
[0003] 隨著智能技術(shù)的發(fā)展,圖像識別的使用和需求也在迅速發(fā)展。所謂的圖像識別主 要有:從圖像中識別出目標(biāo)物體,或者是識別出圖像中的某個(gè)物體所屬的類別等等。可以將 其理解為近似于人面對一副圖像或者一個(gè)場景時(shí),通過肉眼和大腦實(shí)現(xiàn)對圖像或者場景中 所出現(xiàn)的物品進(jìn)行區(qū)分和辨別。
[0004] 目前,常用的圖像識別(這里主要指識別圖像中的某個(gè)物體所屬的類別)方法主 要有以下幾種:1)基于神經(jīng)網(wǎng)絡(luò);2)基于Hu不變距特征搜索;3)基于SIFT特征點(diǎn)匹配搜 索;4)基于Gabor圖像特征搜索。
[0005] 然而,上述幾種方式也存在不同程度的問題,具體的:
[0006] 1)基于神經(jīng)網(wǎng)絡(luò),一般采用人工設(shè)計(jì)的圖像特征算子作為輸入,然而,目前人工設(shè) 計(jì)的特征算子對某些圖像的識別并不適用,例如硬幣識別,而且神經(jīng)網(wǎng)絡(luò)多為淺層結(jié)構(gòu),難 以學(xué)習(xí)到有效的高層抽象的特征。
[0007] 2)基于Hu不變距特征搜索,一般利用物體的形狀特征,但是有些不同類別的物體 之間形狀差異很小,因此Hu不變距特征搜索的方式難以有效地捕獲上述物體的形狀特征, 難以實(shí)現(xiàn)有效識別。
[0008] 3)基于SIFT特征點(diǎn)匹配搜索,對于紋理特征較多為剛性紋理特征(例如硬幣上字 的邊角)的圖像,提取出的有效SIFT特征點(diǎn)較少,且錯(cuò)誤匹配現(xiàn)象嚴(yán)重。
[0009] 4)基于Gabor圖像特征搜索,表面凸起的物體,光線打上去不是整體變化,Gabor 特征難以有效地捕捉物體圖像的邊緣信息。
【發(fā)明內(nèi)容】
[0010] 如前所述,現(xiàn)有的圖像識別技術(shù)對于某些圖像難以有效捕獲特征信息,進(jìn)而難以 實(shí)現(xiàn)對圖像的有效識別,識別精度低。
[0011] 有鑒于此,非常需要一種改進(jìn)的圖像識別方法,以有效提取圖像特征,提高識別精 度。
[0012] 在本發(fā)明實(shí)施方式的第一方面中,提供了一種圖像識別方法,包括:對待識別圖像 進(jìn)行特征提取,得到多個(gè)特征向量;確定每個(gè)特征向量對應(yīng)的類別;針對所述每個(gè)特征向 量,分別計(jì)算其所對應(yīng)的類別下各樣本圖像的分?jǐn)?shù);將計(jì)算得到的同一樣本圖像的分?jǐn)?shù)累 加,得到該同一樣本圖像的分值;將分值最高的樣本圖像對應(yīng)的圖像標(biāo)識作為所述待識別 圖像的識別結(jié)果。
[0013] 在本發(fā)明實(shí)施方式的第二方面中,提供了一種圖像識別裝置,包括:特征提取單 元,用于對待識別圖像進(jìn)行特征提取,得到多個(gè)特征向量;第一確定單元,用于確定每個(gè)特 征向量對應(yīng)的類別;計(jì)算單元,用于針對所述每個(gè)特征向量,分別計(jì)算其所對應(yīng)的類別下各 樣本圖像的分?jǐn)?shù);累加單元,用于將計(jì)算得到的同一樣本圖像的分?jǐn)?shù)累加,得到該同一樣本 圖像的分值;第二確定單元,用于將分值最高的樣本圖像對應(yīng)的圖像標(biāo)識作為所述待識別 圖像的識別結(jié)果。
[0014] 通過本發(fā)明實(shí)施方式的圖像識別方法和裝置,有效提取多個(gè)特征來表征待識別圖 像,提取的特征不受圖像中物體的特性所影響,能夠?qū)崿F(xiàn)對圖像的有效識別,適用范圍廣; 且通過計(jì)算樣本圖像分?jǐn)?shù)的方式得到識別結(jié)果,綜合考慮了特征的重要性,能夠獲得較好 的識別精度。
【附圖說明】
[0015] 通過參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實(shí)施方式的上述以及其他目 的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若 干實(shí)施方式,其中:
[0016] 圖1示意性地示出了根據(jù)本發(fā)明實(shí)施方式的應(yīng)用場景示意圖;
[0017] 圖2示意性地示出了根據(jù)本發(fā)明實(shí)施例的圖像識別方法的流程圖;
[0018] 圖3示意性地示出了根據(jù)本發(fā)明實(shí)施例的樣本圖像信息的示意圖;
[0019] 圖4示意性地示出了根據(jù)本發(fā)明實(shí)施例的哈希索引結(jié)構(gòu)的示意圖;
[0020] 圖5示意性地示出了根據(jù)本發(fā)明一實(shí)施例的圖像識別裝置的結(jié)構(gòu)框圖;
[0021] 圖6示意性地示出了根據(jù)本發(fā)明另一實(shí)施例的圖像識別裝置的結(jié)構(gòu)框圖;
[0022] 在附圖中,相同或?qū)?yīng)的標(biāo)號表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0023] 下面將參考若干示例性實(shí)施方式來描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這 些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何 方式限制本發(fā)明的范圍。相反,提供這些實(shí)施方式是為了使本公開更加透徹和完整,并且能 夠?qū)⒈竟_的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
[0024] 本領(lǐng)域技術(shù)技術(shù)人員知道,本發(fā)明的實(shí)施方式可以實(shí)現(xiàn)為一種系統(tǒng)、裝置、設(shè)備、 方法或計(jì)算機(jī)程序產(chǎn)品。因此,本公開可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件、完全的軟 件(包括固件、駐留軟件、微代碼等),或者硬件和軟件結(jié)合的形式。
[0025] 根據(jù)本發(fā)明的實(shí)施方式,提出了一種圖像識別方法和裝置。
[0026] 需要說明的是,附圖中的任何元素?cái)?shù)量均用于示例而非限制,以及任何命名都僅 用于區(qū)分,而不具有任何限制含義。
[0027] 下面參考本發(fā)明的若干代表性實(shí)施方式,詳細(xì)闡釋本發(fā)明的原理和精神。
[0028] 發(fā)明概沐
[0029] 現(xiàn)有的圖像識別技術(shù)對于某些圖像難以有效捕獲特征信息,進(jìn)而難以實(shí)現(xiàn)對圖像 的有效識別,識別精度低。
[0030] 為此,本發(fā)明提供了一種圖像識別方法,通過該方法進(jìn)行圖像識別的過程可以包 括:對待識別圖像進(jìn)行特征提取,得到多個(gè)特征向量;確定每個(gè)特征向量對應(yīng)的類別;針對 每個(gè)特征向量,分別計(jì)算其所對應(yīng)的類別下各樣本圖像的分?jǐn)?shù);將計(jì)算得到的同一樣本圖 像的分?jǐn)?shù)累加,得到該同一樣本圖像的分值;將分值最高的樣本圖像對應(yīng)的圖像標(biāo)識作為 待識別圖像的識別結(jié)果。這樣有效提取多個(gè)特征來表征待識別圖像,提取的特征不受圖像 中物體的特性所影響,能夠?qū)崿F(xiàn)對圖像的有效識別,適用范圍廣;且通過計(jì)算樣本圖像分?jǐn)?shù) 的方式得到識別結(jié)果,綜合考慮了特征的重要性,能夠獲得較好的識別精度。
[0031] 在本例中,圖像標(biāo)識可以是圖像的名稱、編號或者其他能夠唯一標(biāo)識該圖像的信 息。
[0032] 在介紹了本發(fā)明的基本原理之后,下面具體介紹本發(fā)明的各種非限制性實(shí)施方 式。
[0033] 應(yīng)用場景總覽
[0034] 首先參考圖1,其示出了本發(fā)明的實(shí)施方式可以在其中實(shí)施的應(yīng)用場景。處理設(shè) 備100可以是一臺計(jì)算機(jī)、一組計(jì)算機(jī)集群、或者是一臺單一的處理器等,只要是能夠?qū)崿F(xiàn) 對數(shù)據(jù)進(jìn)行分析和處理的設(shè)備都是可以的,存儲設(shè)備200可以是一個(gè)常規(guī)的存儲器、云存 儲器,甚至也可以是互聯(lián)網(wǎng),只要是能夠?qū)崿F(xiàn)圖像、數(shù)據(jù)、信息的獲取和存儲的設(shè)備都是可 以的。處理設(shè)備100與存儲設(shè)備200之間可以通過例如移動互聯(lián)網(wǎng)、物理排線等方式進(jìn)行 通信連接。
[0035] 利用本發(fā)明實(shí)施例提供的圖像識別方法,處理設(shè)備100對待識別圖像進(jìn)行特征提 取,得到多個(gè)特征向量,根據(jù)存儲設(shè)備200中存儲的信息,確定每個(gè)特征向量對應(yīng)的類別, 并針對每個(gè)特征向量,分別計(jì)算其所對應(yīng)的類別下各樣本圖像的分?jǐn)?shù);將同一樣本圖像的 分?jǐn)?shù)累加,得到該同一樣本圖像的分值;將分值最高的樣本圖像對應(yīng)的圖像標(biāo)識作為待識 別圖像的識別結(jié)果。樣本圖像的分值越高,表示待識別圖像與該樣本圖像越相似。
[0036] 此外,處理設(shè)備100可以從存儲設(shè)備200中獲取大量樣本圖像,基于獲取的樣本圖 像建立樣本圖像信息,并將該樣本圖像信息存儲到存儲設(shè)備200中,以備后續(xù)在具體的圖 像識別過程中使用。其中,樣本圖像信息可以包括:類別、圖像標(biāo)識、計(jì)算分?jǐn)?shù)所需的參數(shù) 等。可以根據(jù)圖像的種類分別建立對應(yīng)的樣本圖像信息,并存儲該樣本圖像信息,例如,針 對金屬幣圖像,建立對應(yīng)的樣本圖像信息,金屬幣可以是一種具有流通價(jià)值、紀(jì)念價(jià)值或收 藏價(jià)值的幣種;又如,針對服裝圖像,建立對應(yīng)的樣本圖像信息。
[0037] 示例件方法
[0038] 下面結(jié)合圖1的應(yīng)用場景,參考圖2至圖4對本發(fā)明的圖像識別方法進(jìn)行介紹。
[0039] 需要注意的是,上述應(yīng)用場