圖像識別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像識別領(lǐng)域,尤其涉及一種圖像識別方法及系統(tǒng)。
【背景技術(shù)】
[0002] 目前,計算機(jī)軟件在進(jìn)行字符識別時通常是使用標(biāo)準(zhǔn)OCR(光學(xué)字符識別)或者模 板進(jìn)行匹配,這些方案都只能處理標(biāo)準(zhǔn)字符,而且需要提供大量的樣本庫文件,無法對具有 縮放、旋轉(zhuǎn)、重疊和扭曲的字符進(jìn)行識別,這使得現(xiàn)有技術(shù)對變形字或手寫體字符等特殊字 符的識別存在很大難度,并且缺少準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中對變形字或手寫體字符等特殊 字符的識別不準(zhǔn)確的缺陷,提供一種圖像識別方法及系統(tǒng)。
[0004] 本發(fā)明是通過以下技術(shù)方案解決上述技術(shù)問題的:
[0005] 本發(fā)明提供一種圖像識別方法,其特點是,該圖像識別方法包括:
[0006] S1、從待識別的圖片中獲取該圖片包含的圖像;
[0007] S2、將該圖像切分成若干切片,每個切片包含一個字符;
[0008] S3、根據(jù)每一切片的像素點,分別計算每一切片對應(yīng)的形狀上下文;
[0009] S4、根據(jù)形狀上下文的特征值進(jìn)行搜索,找到與切片所包含的字符最接近的樣本 作為識別結(jié)果。
[0010] 本技術(shù)方案基于形狀上下文自動識別圖片中的字符,具有很高的識別準(zhǔn)確性,同 時,本技術(shù)方案還不需要預(yù)存大量的樣本文件,能夠減少的樣本文本的存儲量,提高識別效 率。
[0011] 較佳地,步驟S1包括:
[0012] Sn、將待識別的圖片進(jìn)行灰度處理;
[0013] S12、將灰度處理后的圖片進(jìn)行二值化處理;
[0014] S13、對二值化處理后的圖片包含的圖像進(jìn)行描邊處理;
[0015] S14、去除該圖像中孤立的像素點;
[0016] S15、補(bǔ)齊該圖像的邊緣。
[0017] 本技術(shù)方案對待識別的圖片進(jìn)行了預(yù)處理,預(yù)處理主要是為了方便后續(xù)的切分和 減少后續(xù)識別中的干擾因素,其中,步驟S 15能夠去除干擾因素,提高識別的準(zhǔn)確率。
[0018] 較佳地,S2包括:
[0019] S21、根據(jù)聯(lián)通分量將該圖像切分成X個切片,X為正整數(shù);
[0020] S22、若X等于該圖像包含的字符數(shù),則執(zhí)行S3,若X小于該圖像包含的字符數(shù),則根 據(jù)橫向投影將該X個切片切分成若干個切片。
[0021] 本技術(shù)方案可以更準(zhǔn)確的切分,保證待識別的字符完整性,提高重疊字符識別的 準(zhǔn)確率。
[0022] 較佳地,S3包括對每一切片分別執(zhí)行以下步驟:
[0023] S31、將切片中每一像素點分別轉(zhuǎn)換成對數(shù)極坐標(biāo);
[0024] S32、將每一對數(shù)極坐標(biāo)分別轉(zhuǎn)換為一維矩陣;
[0025] S33、將所有的一維矩陣合并成一 m*n的二維矩陣,m為切片的像素點數(shù),η為一維 矩陣的長度,該m*n的二維矩陣為切片對應(yīng)的形狀上下文。
[0026] 其中,極坐標(biāo)的使用可以忽略字符的旋轉(zhuǎn)對識別字符造成的影響,提高識別的準(zhǔn) 確性。
[0027] 較佳地,S31包括:
[0028] S311、將待轉(zhuǎn)換為對數(shù)極坐標(biāo)的像素點作為極坐標(biāo)的圓心,半徑為切片中像素點之 間的最大距離,并對半徑進(jìn)行歸一化處理。
[0029] 其中,對極坐標(biāo)進(jìn)行歸一化處理可以將轉(zhuǎn)換成極坐標(biāo)的集合等比例壓縮在半徑為 1的極坐標(biāo)集合中,忽略字符的縮放對識別字符造成的影響,提高識別的準(zhǔn)確性。
[0030] 較佳地,S32通過以下步驟將對數(shù)極坐標(biāo)轉(zhuǎn)換為一維矩陣:
[0031] S321、將極坐標(biāo)圓的半徑和角度進(jìn)行等量劃分;
[0032] S322、根據(jù)劃分后每個區(qū)域內(nèi)的像素點數(shù)得出二維矩陣;
[0033] S323、將S322得到的二維矩陣轉(zhuǎn)化成一維矩陣;
[0034] S324、將一維矩陣進(jìn)行一維傅里葉變換。
[0035] 其中,S324可以忽略字符的扭曲變形對識別字符造成的影響,提高識別的準(zhǔn)確性。
[0036] 較佳地,S4包括:
[0037] S41、根據(jù)形狀上下文的特征值在樣本庫中進(jìn)行搜索,利用匈牙利算法進(jìn)行二分圖 匹配,找到距離最近的樣本作為識別結(jié)果。
[0038] 傳統(tǒng)的匹配算法是簡單的根據(jù)每個點的比較去進(jìn)行匹配,存在一對多的匹配,而 且無法區(qū)分具有包含關(guān)系的字符,如:6和9, 3和8等。而本技術(shù)方案使用的匈牙利算法保 證只存在一對一匹配,而且通過極坐標(biāo)的半徑和角度的奇數(shù)劃分可以輕松的區(qū)分具有包含 關(guān)系的字符,提尚字符識別的準(zhǔn)確率。在本技術(shù)方案中,匈牙利算法既可以提尚準(zhǔn)確率,還 可以減少識別的時間(時間復(fù)雜度為O(VE)),提高效率。
[0039] 本發(fā)明還提供一種圖像識別系統(tǒng),其特點是,該圖像識別系統(tǒng)包括:
[0040] -獲取單元,用于從待識別的圖片中獲取該圖片包含的圖像;
[0041] -切分單元,用于將該圖像切分成若干切片,每個切片包含一個字符;
[0042] -計算單元,用于根據(jù)每一切片的像素點,分別計算每一切片對應(yīng)的形狀上下 文;
[0043] -識別單元,用于根據(jù)形狀上下文的特征值進(jìn)行搜索,找到與切片所包含的字符 最接近的樣本作為識別結(jié)果。
[0044] 較佳地,該獲取單元包括:
[0045] -灰度處理模塊,用于將待識別的圖片進(jìn)行灰度處理;
[0046] -二值化處理模塊,用于將灰度處理后的圖片進(jìn)行二值化處理;
[0047] 一描邊模塊,用于對二值化處理后的圖片包含的圖像進(jìn)行描邊處理;
[0048] -去除模塊,用于去除該圖像中孤立的像素點;
[0049] -圖像生長模塊,用于補(bǔ)齊該圖像的邊緣。
[0050] 較佳地,該切分單元包括:
[0051] -切片模塊,用于根據(jù)聯(lián)通分量將該圖像切分成X個切片,X為正整數(shù);
[0052] -比較模塊,用于在X等于該圖像包含的字符數(shù)時調(diào)用該計算單元,以及在X小于 該圖像包含的字符數(shù)時根據(jù)橫向投影將該X個切片切分成若干個切片。
[0053] 較佳地,該計算單元用于對每一切片分別調(diào)用以下模塊:
[0054] 一坐標(biāo)轉(zhuǎn)換模塊,用于將切片中每一像素點分別轉(zhuǎn)換成對數(shù)極坐標(biāo);
[0055] -矩陣轉(zhuǎn)換模塊,用于將每一對數(shù)極坐標(biāo)分別轉(zhuǎn)換為一維矩陣;
[0056] -矩陣合并模塊,用于將所有的一維矩陣合并成一 m*n的二維矩陣,m為切片的像 素點數(shù),η為一維矩陣的長度,該m*n的二維矩陣為切片對應(yīng)的形狀上下文。
[0057] 較佳地,該坐標(biāo)轉(zhuǎn)換模塊還用于將待轉(zhuǎn)換為對數(shù)極坐標(biāo)的像素點作為極坐標(biāo)的圓 心,半徑為切片中像素點之間的最大距離,并對半徑進(jìn)行歸一化處理。
[0058] 較佳地,該矩陣轉(zhuǎn)換模塊包括:
[0059] -劃分模塊,用于將極坐標(biāo)圓的半徑和角度進(jìn)行等量劃分;
[0060] -二維矩陣生成模塊,用于根據(jù)劃分后每個區(qū)域內(nèi)的像素點數(shù)得出二維矩陣;
[0061] --維矩陣生成模塊,用于將該二維矩陣生成模塊得到的二維矩陣轉(zhuǎn)化成一維矩 陣;
[0062] -傅里葉變換模塊,用于將一維矩陣進(jìn)行一維傅里葉變換。
[0063] 較佳地,該識別單元包括:
[0064] -匹配模塊,用于根據(jù)形狀上下文的特征值在樣本庫中進(jìn)行搜索,利用匈牙利算 法進(jìn)行二分圖匹配,找到距離最近的樣本作為識別結(jié)果。
[0065] 在符合本領(lǐng)域常識的基礎(chǔ)上,上述各優(yōu)選條件,可任意組合,即得本發(fā)明各較佳實 例。
[0066] 本發(fā)明的積極進(jìn)步效果在于:對具有縮放、旋轉(zhuǎn)、重疊和扭曲的手寫體字符或變形 字符等特殊字符進(jìn)行準(zhǔn)確地識別,減少所需的樣本文件,減少識別所需的時間,提高識別效 率。
【附圖說明】
[0067] 圖1為本發(fā)明的實施例的圖像識別方法的流程圖。