欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別的方法_5

文檔序號:9433084閱讀:來源:國知局
字字符特征值 剩下,計數(shù)器counter I、counter2各自增1并將剩下的單個數(shù)字字符特征值進(jìn)行訓(xùn)練,若沒 有單個數(shù)字字符特征值剩下,轉(zhuǎn)到(6)判斷人工神經(jīng)網(wǎng)絡(luò)的輸出總誤差是否小于誤差門限 Unin; (6) 判斷人工神經(jīng)網(wǎng)絡(luò)的輸出總誤差,若U〈U_,則訓(xùn)練結(jié)束,否則繼續(xù)訓(xùn)練,令U = 0, counterl = 1,U為人工神經(jīng)網(wǎng)絡(luò)的輸出總誤差,Umin為誤差門限,counterl為模式計數(shù)器, counted為訓(xùn)練次數(shù)計數(shù)器,重新執(zhí)行步驟三二的(2); 步驟三三、初期神經(jīng)網(wǎng)絡(luò)訓(xùn)練后進(jìn)行初期識別 單個數(shù)字字符特征值進(jìn)行初期BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練后,初期神經(jīng)網(wǎng)絡(luò)對整個表格圖像中 的單個數(shù)字字符進(jìn)行識別; 經(jīng)過步驟三一處理后的圖像,先進(jìn)行表格中表頭特征提取與匹配,過程為: 提取表頭特征,將表頭特征與模板庫中的表頭特征進(jìn)行匹配,若表頭特征相同,則視為 有同樣的表頭,即表格與模版庫中的表格若有相同的表頭則匹配成功,若找不到,則將新的 表格中的行坐標(biāo)列坐標(biāo)信息添加的模版庫中;重復(fù)步驟三一得到單個數(shù)字字符的特征值后 送入已經(jīng)訓(xùn)練好的初期神經(jīng)網(wǎng)絡(luò)去進(jìn)行識別;識別后根據(jù)識別結(jié)果提取單元格字符串的整 體特征,訓(xùn)練整體識別的神經(jīng)網(wǎng)絡(luò),即后期BP神經(jīng)網(wǎng)絡(luò),重復(fù)執(zhí)行步驟三二,使用三層,輸 入層、隱含層、輸出層各一層,不同之處在于輸入特征值為粗網(wǎng)格特征值,粗網(wǎng)格特征值代 替單個數(shù)字字符特征值; 步驟三四、后初BP期神經(jīng)網(wǎng)絡(luò)訓(xùn)練后進(jìn)行后初期識別。5.根據(jù)權(quán)利要求4所述的一種基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別的方法,其 特征在于,所述步驟三三中的表頭特征提取與匹配的過程為: 首先要提取出表格表頭,過程為:表格表頭為η行,η為正整數(shù),當(dāng)掃描到前景點(diǎn)時記錄 其為第一行,記為Hl,繼續(xù)掃描,直到某一行全都為背景點(diǎn)時停止掃描,記錄其為第η行,記 為Ηη,在Hl行和Hn行之間搜索,表格表頭為η列,方向為從表格表頭的第1列到表格表頭 的第η列掃描,當(dāng)掃描到前景點(diǎn)時記錄其為第一列,記為L1,繼續(xù)掃描,直到某一列全都為 背景點(diǎn)時停止掃描,記錄其為第η列,記為Ln,即可提取出表頭; 利用表頭的harri s角點(diǎn)特征,若不同表格圖像的表頭的harri s角點(diǎn)特征相同,則表格 為同一類型的表格,當(dāng)掃描到同一類型的表格時,直接從表格圖像中各個單元格的行坐標(biāo) 和列坐標(biāo)位置的信息庫中找到表格的單元格位置信息,完成匹配; 表頭的harris角點(diǎn)特征的求取過程為: 設(shè)一個窗口的中心像素點(diǎn)為(X,y),其水平方向移動V1,垂直方向上移動v2,則其灰度 變化度量為:式中,Ex,y為窗口內(nèi)的灰度變化量;wx,y為窗口函數(shù),采用高斯窗U 11 e為 自然常數(shù),σ為常數(shù),用于調(diào)節(jié)高斯窗的衰減速度;I為數(shù)字化后字符圖像灰度矩陣,其中X為字符圖像矩陣的橫坐標(biāo),y為字符圖像矩陣的縱坐標(biāo),為水平方 向移動V 1,垂直方向上移動V2的窗口矩陣,V i為水平方向移動,V 2為垂直方向上移動,I x y為 未移動的窗口矩陣,為字符圖像灰度在水平方向的變化率,;^為字符圖像灰度在垂直 方向的變化率,為高階余量; 則:Harris的角點(diǎn)響應(yīng)函數(shù)CRF為: CRF (x, y) = det (M) -ks (trace (M))2 (14) 式中:det (M)為M的行列式,trace (M)為M的跡,閾值T為最大響應(yīng)函數(shù)的0.0 l倍,當(dāng) 圖像中像素點(diǎn)的角點(diǎn)響應(yīng)函數(shù)CRF大于T時,ks為常數(shù),取0. 04,則把該像素點(diǎn)選取為表頭 的harri s角點(diǎn)特征。6.根據(jù)權(quán)利要求5所述的一種基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別的方法,其 特征在于,所述步驟三一中得到單個數(shù)字字符特征,具體過程為: 包括統(tǒng)計特征和結(jié)構(gòu)特征; 統(tǒng)計特征包括傅立葉變換特征、重心重力矩特征; 結(jié)構(gòu)特征包括輪廓特征、粗網(wǎng)格特征以及投影特征; 傅立葉變換特征: 對步驟三一處理后的歸一化數(shù)字字符圖像進(jìn)行傅里葉變換,歸一化圖像可表示為 f (m,η),歸一化圖像進(jìn)行傅立葉變換后得到其傅立葉頻譜函數(shù):其中,u = 0,1,2……,M-Lv = 0,1,2……,Ν-1,M為圖像高度,N為圖像寬度,f(m,η) 為歸一化的字符圖像,f(m,η)的取值為0或I ;m為歸一化圖像的橫坐標(biāo),η為歸一化圖像 的縱坐標(biāo),u為變換后頻域頻譜圖的實軸,V為變換后頻域頻譜圖的虛軸,F(xiàn)(u,V)為歸一化 圖像的頻譜函數(shù),e為自然常數(shù),j為虛數(shù); M = N,M的取值為字符圖像的長,N的取值為字符圖像的寬,傅里葉變換的頻譜函數(shù)分 解為如下形式:在 F 矩陣的四個角區(qū)域的點(diǎn) F(0, 0),F(xiàn)(0, I),F(xiàn)(0, 2),F(xiàn)(0, 3),F(xiàn)(1,0),F(xiàn)(2, 0),F(xiàn)(3, 0), F (24, 0), F (25, 0), F (26, 0), F (27, 0), F (27, I), F (27, 2), F (27, 3), F (27, 24), F (27, 25), F (27, 26),F(xiàn) (27, 27),F(xiàn) (26, 27),F(xiàn) (25, 27),F(xiàn) (24, 27),F(xiàn) (0, 27),F(xiàn) (I, 27),F(xiàn) (2, 27),F(xiàn) (3, 27), F (0, 26),F(xiàn) (0, 25),F(xiàn) (0, 24)的幅值大于其他矩陣元素,選取F矩陣的四個角區(qū)域的點(diǎn)的幅 值作為傅里葉變換特征; 重心重力矩特征: 字符重心的位置為:為歸一化數(shù)字圖像第m行第η列的象素值,m為歸一化圖像橫坐標(biāo),η為歸一化圖 像縱坐標(biāo),w為重力力矩橫坐標(biāo),[為重力力矩縱坐標(biāo); 重心重力矩特征定義如下:其中,J1為橫坐標(biāo),i i為縱坐標(biāo),i i= 1,2 ;j 1,2 ; 為重心重力矩特征; 輪廓特征: 設(shè)L(ky)為數(shù)字圖像第ky行的左輪廓,R(ky)為數(shù)字圖像第ky行的右輪廓,則: L(ky) = jj。,jj。滿足 f(ky, jj。)= 1 且當(dāng) jj〈jj。,f(ky, jj) = O ;jj 為橫坐標(biāo),ii 為 縱坐標(biāo),j j。為左輪廓的橫坐標(biāo),f (ky, j j)為數(shù)字圖像第ky行第j j列的像素值,f (ky, j j。) 為數(shù)字圖像第ky行第jj。列的像素值,ky為縱坐標(biāo); R(ky) = j j!,j j!滿足 f(ky, j j J = 1 且當(dāng) j j>j jp f(ky, j jj = 0, j i 為右輪廓的橫 坐標(biāo),f (ky, j j)為數(shù)字圖像第ky行第j j列的像素值,f (ky, j jj為數(shù)字圖像第ky行第j ji 列的像素值 左右邊緣線的一階有限差分別為: Ldif (ky) = L(ky)-L(ky-1) (21) Rdif (ky) = R(ky)-R(ky-1) (22) 字符輪廓線最大值和最小值所在的位置 Lmax= {s I s = max (L (ky))} (23) Rmax= {s I s = max (R (ky))} (24) Rmin= {s|s = min(R(ky))} (25) Lmin= {s|s = min(L(ky))} (26) 式中,為右輪廓最大值,s為坐標(biāo)位置,Lnax為左輪廓最大值,R_為右輪廓最小值, 匕_為左輪廓最小值;R_、L_、R_、L_為輪廓特征; 字符左右邊緣線的正負(fù)峰為: Lpeak+= max{L dlf (ky)} (27) Rpeak+ = max {R dif (ky)} (28) Rpeak = min {R dlf (ky)} (29) Lpeak = min {L dlf (ky)} (30) 式中,Lpeak+為左邊緣正峰,R peak+為右邊緣正峰,Rpeak為右邊緣負(fù)峰,Lpeak為左邊緣負(fù) 峰; ^max 7 ^max 7 ^min 7 ? LpeaJi+ ? Rpeak+ 7 ^peak 7 ^peaJi 為重心重力矩特征的8個特征值; 粗網(wǎng)格特征: 是把字符圖像分成N個局部區(qū)域,統(tǒng)計局部區(qū)域的像素百分?jǐn)?shù),尋找局部區(qū)域的分布 規(guī)律,規(guī)律為粗網(wǎng)格特征;N為正整數(shù); 投影特征: 將數(shù)字字符圖像平均劃分成N個區(qū)域,得到N條相應(yīng)的邊線,將每個區(qū)域中的前景像素 點(diǎn)向最近的邊線投影,然后統(tǒng)計每條邊線上的投影長度,并用它作為特征值。
【專利摘要】一種基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別的方法,本發(fā)明涉及基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識別的方法。本發(fā)明的目的是為了解決現(xiàn)有方法表格識別率低的問題。通過以下技術(shù)方案實現(xiàn)的:步驟一、對表格圖像進(jìn)行預(yù)處理;步驟二、對預(yù)處理后的表格圖像中的數(shù)字字符進(jìn)行提取與分割;步驟三、對提取分割后的數(shù)字字符進(jìn)行識別。本發(fā)明應(yīng)用于表格數(shù)字字符串識別領(lǐng)域。
【IPC分類】G06K9/00
【公開號】CN105184265
【申請?zhí)枴緾N201510582707
【發(fā)明人】關(guān)宇東, 吳夢蝶, 朱瑞鋒, 提純利, 仲小挺
【申請人】哈爾濱工業(yè)大學(xué)
【公開日】2015年12月23日
【申請日】2015年9月14日
當(dāng)前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
福州市| 宁河县| 青海省| 囊谦县| 上思县| 纳雍县| 海口市| 东辽县| 东光县| 高安市| 郧西县| 鄂州市| 延吉市| 安西县| 调兵山市| 重庆市| 金沙县| 山西省| 剑川县| 濉溪县| 烟台市| 阜城县| 谢通门县| 民权县| 鄂托克旗| 吉隆县| 集贤县| 宁武县| 肇州县| 彭阳县| 济宁市| 宜川县| 桂平市| 娄烦县| 古蔺县| 济源市| 郴州市| 宜州市| 公主岭市| 柳州市| 新宁县|