欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于自學(xué)習(xí)的手寫表格數(shù)字字符串快速識(shí)別的方法_3

文檔序號(hào):9433084閱讀:來源:國知局
其為第η列,記為L(zhǎng)n, 得到表頭的左邊界LI和右邊界Ln,即可提取出表頭;如圖8所示:
[0102] 利用表頭的harri s角點(diǎn)特征,若不同表格圖像的表頭的harri s角點(diǎn)特征相同,則 表格為同一類型的表格,當(dāng)掃描到同一類型的表格時(shí),直接從表格圖像中各個(gè)單元格的行 坐標(biāo)和列坐標(biāo)位置的信息庫中找到表格的單元格位置信息,完成先先;
[0103] Harris角點(diǎn)檢測(cè)算法的基本原理采用窗口法,沿任意方向移動(dòng)窗口,計(jì)算窗口內(nèi) 中心像素點(diǎn)的灰度變化。
[0104] 表頭的harris角點(diǎn)特征的求取過程為:
[0105] 設(shè)一個(gè)窗口的中心像素點(diǎn)為(x,y),其水平方向移動(dòng)V1,垂直方向上移動(dòng)v 2,則其 灰度變化度量為:
[0107] 式中,Ε"為窗口內(nèi)的灰度變化量;wXiy為窗口函數(shù),采用高斯窗
e 為自然常數(shù),σ為常數(shù),用于調(diào)節(jié)高斯窗的衰減速度;I為數(shù)字化后字符圖像灰度矩陣,其 中
,X為字符圖像矩陣的橫坐標(biāo),y為字符圖像矩陣的縱坐標(biāo),為水平 方向移動(dòng)V1,垂直方向上移動(dòng)V2的窗口矩陣,V i為水平方向移動(dòng),V2為垂直方向上移動(dòng),I x y 為未移動(dòng)的窗口矩陣,
·為字符圖像灰度在水平方向的變化率,
為字符圖像灰度在垂 直方向的變化率,為高階余量;
[0108] 則:
[0109] ΕΧιΥ=Σ w XjY [Vi2(Ix)^v22 (Iy) ^v1V2IxIy] = Av12+2Cv1v2+Bv2 2 (11)

[0110] 式中,1,為 仁為 A、B、C為系數(shù); ., ?
[0111] 將Ex, y化為二次型有:
[0115] Harris的角點(diǎn)響應(yīng)函數(shù)CRF為:
[0116] CRF (x, y) = det (M) -ks (trace (M))2 (14)
[0117] 式中:det (M)為M的行列式,trace (M)為M的跡,閾值T為最大響應(yīng)函數(shù)的0.01 倍,當(dāng)圖像中像素點(diǎn)的角點(diǎn)響應(yīng)函數(shù)CRF大于T時(shí),ks為常數(shù),取0. 04,則把該像素點(diǎn)選取 為表頭的harris角點(diǎn)特征。
[0118] 其它步驟及參數(shù)與【具體實(shí)施方式】一、二、三或四相同。
[0119]
【具體實(shí)施方式】六、本實(shí)施方式與【具體實(shí)施方式】一、二、三、四或五不同的是,所述步 驟三一中得到單個(gè)數(shù)字字符特征,具體過程為:
[0120] 包括統(tǒng)計(jì)特征和結(jié)構(gòu)特征;
[0121] 統(tǒng)計(jì)特征包括傅立葉變換特征、重心重力矩特征;
[0122] 結(jié)構(gòu)特征包括輪廓特征、入網(wǎng)格特征以及投影特征;
[0123] 傅立葉變換特征:
[0124] 對(duì)步驟三一處理后的歸一化數(shù)字字符圖像進(jìn)行傅里葉變換,歸一化圖像可表示為 f (m,η),歸一化圖像進(jìn)行傅立葉變換后得到其傅立葉頻譜函數(shù):
[0126] 其中,u = 0,1,2……,M-l,V = 0,1,2……,N_l,M為圖像高度,N為圖像寬度, f(m,η)為歸一化的字符圖像,f(m,η)的取值為0或I ;m為歸一化圖像的橫坐標(biāo),η為歸一 化圖像的縱坐標(biāo),u為變換后頻域頻譜圖的實(shí)軸,V為變換后頻域頻譜圖的虛軸,F(xiàn)(u,V)為 歸一化圖像的頻譜函數(shù),e為自然常數(shù),j為虛數(shù);
[0127] M = N,M的取值為字符圖像的長(zhǎng),N的取值為字符圖像的寬,傅里葉變換的頻譜函 數(shù)分解為如下形式:
[0130] 在 F 矩陣的四個(gè)角區(qū)域的點(diǎn) F(0,0),F(xiàn)(0, 1),F(xiàn)(0,2),F(xiàn)(0,3),F(xiàn)(1,0),F(xiàn)(2,0), F (3, 0), F (24, 0), F (25, 0), F (26, 0), F (27, 0), F (27, I), F (27, 2), F (27, 3), F (27, 24), F(27, 25),F(xiàn)(27, 26),F(xiàn)(27, 27),F(xiàn)(26, 27),F(xiàn)(25, 27),F(xiàn)(24, 27),F(xiàn)(0, 27),F(xiàn)(l, 27), F (2, 27),F(xiàn) (3, 27),F(xiàn) (0, 26),F(xiàn) (0, 25),F(xiàn) (0, 24)的幅值大于其他矩陣元素,其他矩陣元素是 F矩陣的四個(gè)角區(qū)域外的點(diǎn),選取F矩陣的四個(gè)角區(qū)域的點(diǎn)的幅值作為傅里葉變換特征;
[0131] 重心重力矩特征:
[0132] 字符重心的位置為:
[0135] fnin為歸一化數(shù)字圖像第m行第η列的象素值,m為歸一化圖像橫坐標(biāo),η為歸一 化圖像縱坐標(biāo),5為重力力矩橫坐標(biāo),^為重力力矩縱坐標(biāo);
[0136] 重心重力矩特征定義如下: CN 105184265 A 說明書 9/10 頁
[0138] 其中,J1為橫坐標(biāo),i i為縱坐標(biāo),i 1,2 ;j 1,2 ; 為重心重力矩特征;
[0139] 輪廓特征:
[0140] 設(shè)L(ky)為數(shù)字圖像第ky行的左輪廓,R(ky)為數(shù)字圖像第ky行的右輪廓,則:
[0141] L(ky) = jj。,jj。滿足 f(ky,jj。)= 1 且當(dāng) jj〈jj。,f(ky,jj) = 0 ;jj 為橫坐 標(biāo),ii為縱坐標(biāo),jj。為左輪廓的橫坐標(biāo),f (ky,jj)為數(shù)字圖像第ky行第jj列的像素值, f(ky,j j。)為數(shù)字圖像第ky行第j j。列的像素值,ky為縱坐標(biāo);
[0142] R(ky) = jj!,jj!滿足 f(ky,jj !) = 1 且當(dāng) jj〉』」·!,f(ky,jj!) = 0,從為右輪廓 的橫坐標(biāo),f (ky,jj)為數(shù)字圖像第ky行第jj列的像素值,f(ky,Jj1)為數(shù)字圖像第ky行 第Jj1列的像素值
[0143] 左右邊緣線的一階有限差分別為:
[0144] Ldif (ky) = L (ky)-L (ky-1) (21)
[0145] Rdif (ky) = R(ky)-R(ky-1) (22)
[0146] 字符輪廓線最大值和最小值所在的位置
[0147] Lmax= {s I s = max (L (ky))} (23)
[0148] Rmax= {s|s = max(R(ky))} (24)
[0149] Rmin= {s|s = min(R(ky))} (25)
[0150] Lmin= {s|s = min(L(ky))} (26)
[0151] 式中,Rmax為右輪廓最大值,s為坐標(biāo)位置,Lmax為左輪廓最大值,R min為右輪廓最小 值,L_S左輪廓最小值;R_、L_、R_、L_為輪廓特征;
[0152] 字符左右邊緣線的正負(fù)峰為:
[0153] Lpeak+= max{L dif(ky)} (27)
[0154] Rpeak+= max{R dif(ky)} (28)
[0155] Rpeak = min {R dif (ky)} (29)
[0156] Lpeak = min {L dif (ky)} (30)
[0157] 式中,Lpeak+為左邊緣正峰,R _k+為右邊緣正峰,R _k為右邊緣負(fù)峰,L peak為左邊 緣負(fù)峰;
[0158] Lmax,Rmax,Rmin,Lmin,L peak+,Rpeak+,Rpeak,Lpeak 為重七、重力矩特征的 8 個(gè)特征值;
[0159] 入網(wǎng)格特征:
[0160] 是把字符圖像分成N個(gè)局部區(qū)域,統(tǒng)計(jì)局部區(qū)域的像素百分?jǐn)?shù),尋找局部區(qū)域的 分布規(guī)律,規(guī)律為入網(wǎng)格特征,N為正整數(shù);
[0161] 單元格字符串特征采用入網(wǎng)格整體分布的特征;
[0162] 投影特征:
[0163] 將數(shù)字字符圖像平均劃分成N個(gè)區(qū)域,得到N條相應(yīng)的邊線,將每個(gè)區(qū)域中的前景 像素點(diǎn)向最近的邊線投影,然后統(tǒng)計(jì)每條邊線上的投影長(zhǎng)度,并用它作為特征值。
[0164] 實(shí)施例:
[0165] 本手寫表格數(shù)字字符串快速識(shí)別是基于VS平臺(tái)MFC編程,程序運(yùn)行平臺(tái)是 Windows7,機(jī)器的處理器是 AMD Athlon (tm) II P340Dual_Core Processor 2. 20GHZ,2G 的 內(nèi)存。整個(gè)程序界面簡(jiǎn)單,如圖11,方便用戶讀入圖片。
[0166] 點(diǎn)擊:文件_>打開就能打開圖片。本文中,掃描后的圖片格式統(tǒng)一為BMP位圖文 件格式。對(duì)隨機(jī)收取的20張樣本進(jìn)行測(cè)試后進(jìn)行統(tǒng)計(jì),每張表格是21 X 11的表格線,識(shí)別 一張樣本的時(shí)間平均為35秒,識(shí)別結(jié)果直接以excel的形式輸出,方便用戶進(jìn)行修改、排 序、保存等操作。識(shí)別結(jié)果對(duì)比如圖9和圖10所示:
[0167] 統(tǒng)計(jì)抽取的20個(gè)手寫表格樣本的識(shí)別正確率、識(shí)別錯(cuò)誤率及拒識(shí)率,見表1 :<
當(dāng)前第3頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
绥芬河市| 武功县| 温泉县| 巍山| 道真| 商都县| 华蓥市| 庆安县| 沙洋县| 成安县| 扎兰屯市| 德格县| 中西区| 西丰县| 兖州市| 和平县| 满洲里市| 福贡县| 南靖县| 舟曲县| 武威市| 津市市| 延寿县| 五华县| 邻水| 英德市| 息烽县| 商城县| 宜君县| 辽宁省| 扶余县| 水城县| 上杭县| 葫芦岛市| 长阳| 东阳市| 民权县| 隆回县| 榆树市| 宁蒗| 大渡口区|