一種基于稀疏編碼的手寫體數(shù)字識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于字體識(shí)別技術(shù),具體涉及一種基于稀疏編碼的手寫體數(shù)字識(shí)別方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)和經(jīng)濟(jì)的高速發(fā)展,選擇網(wǎng)上購(gòu)物和銀行卡支付的人越來越多,電子 商務(wù)的業(yè)務(wù)量大增,人們對(duì)物流的需求也隨之增加。因此,如何大量郵件進(jìn)行正確而高效的 分揀變得至關(guān)重要?,F(xiàn)在郵政部門大多采用電子設(shè)備來幫助完成分揀工作,郵件的自動(dòng)分 揀通常是通過計(jì)算機(jī)對(duì)郵件上六位數(shù)的郵政編碼進(jìn)行分類得以實(shí)現(xiàn)。雖然郵政編碼只有十 個(gè)數(shù)字,但由于每個(gè)人的手寫體會(huì)因個(gè)人寫字習(xí)慣的不同有很大的差異,所以手寫數(shù)字的 識(shí)別對(duì)于郵件的自動(dòng)分揀非常重要。
[0003] 手寫體數(shù)字在統(tǒng)計(jì)報(bào)表、郵政編碼、各種票據(jù)上都可以見到,它的電子識(shí)別有著廣 闊的應(yīng)用前景。
[0004] 稀疏編碼作為近年來的計(jì)算機(jī)領(lǐng)域的一個(gè)研究熱點(diǎn),在人臉識(shí)別等分類問題上已 經(jīng)有十分良好的表現(xiàn)。充實(shí)的理論基礎(chǔ)和大量應(yīng)用成果都說明稀疏編碼有足夠潛力解決手 寫體識(shí)別問題。手寫體的研宄涉及數(shù)字圖像的處理、人工智能、模式識(shí)別、特征提取、組合數(shù) 學(xué)等多個(gè)穎域,現(xiàn)在已經(jīng)取得了一些成績(jī)。很多手機(jī)和平板電腦都能支持手寫輸入,但由于 技術(shù)原因是還常會(huì)出現(xiàn)手寫體不能識(shí)別或者識(shí)別錯(cuò)誤的情況,這使得還只能限于人們要求 不高的生活和娛樂方面,要想在工業(yè)和財(cái)務(wù)、物流上大規(guī)模使用還需要做更多的研究工作。
[0005] 本申請(qǐng)正是要提供一種基于稀疏編碼的手寫體數(shù)字識(shí)別方法,具有識(shí)別正確率 尚,能夠提尚了手與數(shù)字的錄入速度,提尚識(shí)別效率。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明為了解決現(xiàn)有手寫郵政編碼由于每個(gè)人寫字習(xí)慣的不同而導(dǎo)致的識(shí)別效 率低的問題,而提供一種基于稀疏編碼的手寫體數(shù)字識(shí)別方法,具有識(shí)別效率高的問題,能 夠準(zhǔn)確的識(shí)別不同人書寫的數(shù)字,提高識(shí)別效率。
[0007] 本發(fā)明為解決上述技術(shù)問題所采用的技術(shù)方案是:
[0008] -種基于稀疏編碼的手寫體數(shù)字識(shí)別方法,其特征在于,包括以下步驟,
[0009] 1)讀入訓(xùn)練集,將訓(xùn)練集組或一個(gè)字典;
[0010] 2)讀入測(cè)試?yán)?,?duì)測(cè)試?yán)M(jìn)行特征提取;
[0011] 3)通過稀疏編碼算法將測(cè)試?yán)糜?xùn)練集字典進(jìn)行稀疏表達(dá);
[0012] 4)通過分類器進(jìn)行分類識(shí)別。
[0013] 所述的讀入訓(xùn)練集的方法為將手寫體數(shù)據(jù)庫(kù)中的含有0-9的訓(xùn)練集以圖像的形 式錄入系統(tǒng)中,每張圖片的灰度為8,每張圖片大小為28*28。
[0014] 所述的將訓(xùn)練集組成一個(gè)字典的方法為:將每個(gè)訓(xùn)練集的圖片數(shù)據(jù)作為一列,然 后把這些列全部接順序拼接起來,經(jīng)特征提取之后即是所需要的字典;采用隨機(jī)映射對(duì)訓(xùn) 練集進(jìn)行圖片特征提取;隨機(jī)映射算法最主要的部分就是用于降維的矩陣的生成,利用 _j= random Gaussian產(chǎn)一個(gè)降維用的矩陣Rkxd,該矩陣的元素滿足高斯分布;同時(shí)使用式 子於tv。Uixv進(jìn)行降維,其中Rkxd矩陣使用Matlab的randn(k,d)函數(shù)來產(chǎn)生,該函 數(shù)的功能正是產(chǎn)生一個(gè)高斯分布的kXd大小的隨機(jī)矩陣;在生成R kxd矩陣后對(duì)于字典使 用Rkxd進(jìn)行特征提?。粚⒂?xùn)練集的字典X dXN維數(shù)降至樣k表示降維后的維度,系統(tǒng)實(shí)現(xiàn) 時(shí)k作為一個(gè)變量,以方便后面的實(shí)驗(yàn),調(diào)整k的大小,通過實(shí)驗(yàn)得到一個(gè)合適的k,讓識(shí)別 正確率比時(shí)間取得一個(gè)合適的值,最終再確定k的取值。
[0015] 對(duì)于測(cè)試?yán)捎秒S機(jī)映射對(duì)測(cè)試?yán)M(jìn)行圖片特征提取。
[0016] 所述的通過稀疏編碼算法將測(cè)試?yán)糜?xùn)練集字典進(jìn)行稀疏表達(dá)為:將訓(xùn)練集作 為字典矩陣A,把測(cè)試?yán)鳛閥,然后求解y = Ax的稀疏解,對(duì)測(cè)試?yán)齳進(jìn)行稀疏表達(dá);具 體為將每個(gè)訓(xùn)練集的數(shù)據(jù)作為一個(gè)列向量V1G R"1,那么訓(xùn)練集可以表示為六=^^^… VJ e RmXn,A為訓(xùn)練集的字典矩陣,將特證提取后的測(cè)試?yán)鳛榱邢蛄縴 e Rm,解y = Ax, X e 1??個(gè)欠定性方程組,并且滿足min I I X I I。,即min I I X I I。s. t. Ax = y,根據(jù)BP原理I1 范數(shù)約束與1。范數(shù)約束有等效的解,因此min| |x| |i s.t. Ax = y;解出來的X GRn向量表 示訓(xùn)練集對(duì)測(cè)試?yán)谋硎?,即?xùn)練集的線性組合表達(dá)出測(cè)試?yán)齳。
[0017] 所述采用分類器進(jìn)行分類識(shí)別的方法為:采用式虧
對(duì) 測(cè)試?yán)M(jìn)行分類:
[0018] 定義爲(wèi)。邊瑪泰$已知A矩罔
和向量::
[0019] 定義V1= [Ahl…Ani,Jt,也就是訓(xùn)練集里面的第i個(gè)數(shù)據(jù)的向量,那么選t這個(gè) 數(shù)字的所有訓(xùn)練集的列向量定義為M t= [V1-Vj],其中[i. . j]表示t這個(gè)數(shù)字的所有訓(xùn)練 樣本的圖像的列向量的編號(hào);定義焉,.其中對(duì)于相同的t的疼的[i. . j]范圍和Mt 相同;那么I =瑪:?要求出最小的一個(gè)Is- _i,這個(gè)測(cè)試?yán)褪菙?shù)字t。
[0020] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
[0021] 本發(fā)明的基于稀疏編碼的手寫體數(shù)字識(shí)別方法,在用測(cè)試集的各個(gè)列的線性來表 示測(cè)試?yán)臅r(shí)候充分利用了訓(xùn)練集每一個(gè)元素的性質(zhì),因此能夠提高手寫體數(shù)字的識(shí)別正 確率,識(shí)別的速度。
【具體實(shí)施方式】
[0022]下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述,所描述的實(shí)施Mim是本發(fā)明一部分 實(shí)施例,并不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域的普通技術(shù)人員在沒有做出 創(chuàng)造性勞動(dòng)前提下所獲得的其他所用實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。
[0023] 本發(fā)明的基于稀疏編碼的手寫體數(shù)字識(shí)別方法,包括以下步驟,
[0024] 1)讀入訓(xùn)練集,將訓(xùn)練集組成一個(gè)字典;
[0025] 2)讀入測(cè)試?yán)?,?duì)測(cè)試?yán)M(jìn)行特征提取;
[0026] 3)通過稀疏編碼算法將測(cè)試?yán)糜?xùn)練集字典進(jìn)行稀疏表達(dá);
[0027] 4)通過分類器進(jìn)行分類識(shí)別。
[0028] 所述的讀入訓(xùn)練集的方法為將手寫體數(shù)據(jù)庫(kù)中的含有0-9的訓(xùn)練集以圖像的形 式錄入系統(tǒng)中,每張圖片的灰度為8,每張圖片大小為28*28。
[0029] 所述的將訓(xùn)練集組成一個(gè)字典的方法為:將每個(gè)訓(xùn)練集的圖片數(shù)據(jù)作為一列,然 后把這些列全部按順序拼接起來,經(jīng)特征提取之后即是所需要的字典;對(duì)于這些列向量按 順序拼接,使用Matlab的reshape ()函數(shù)即可。
[0030] 采用隨機(jī)映射對(duì)訓(xùn)練集進(jìn)行圖片特征提?。浑S機(jī)映射(Random Projection,RP) 主要是將給定的mXn大小的矩陣X[26]。將它的數(shù)據(jù)維度降到低維(r維,r<<d)的子空 間,通過一組隨機(jī)項(xiàng)來確定這個(gè)映射。
[0031]
[0032] 隨機(jī)降維的思想基于Johnson-Lindenstrauss引理,對(duì)于任意0 < ε < 1和整數(shù) η,設(shè)r是一個(gè)正整數(shù),并且r滿足:
[0033]
[0034