欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種無線表格檢測方法及系統(tǒng)與流程

文檔序號:40655433發(fā)布日期:2025-01-10 19:05閱讀:4來源:國知局
一種無線表格檢測方法及系統(tǒng)與流程

本發(fā)明涉及圖像處理,尤其涉及一種無線表格檢測方法及系統(tǒng)。


背景技術:

1、隨著深度學習技術的發(fā)展,表格檢測技術已經廣泛應用到資質審核和合同審核的工作中,在審核過程中往往會涉及大量的對資質證書以及合同文檔內容進行審核的工作,而這類證書和合同上通常會蓋有樣式各異的表格。對表格的定位可以對后續(xù)的內容進行識別,包括字段識別等。

2、近年來,深度學習在圖像處理和自然語言處理領域取得了顯著進展,也推動了有線表格檢測技術的發(fā)展。基于深度學習的方法通常使用卷積神經網絡(cnn)等模型,通過大量的訓練數據來學習表格的復雜特征,并能夠在各種布局和格式的文檔中準確檢測表格。例如,一些研究提出了端到端的深度學習模型,能夠同時進行表格檢測和結構識別,從而提高了表格檢測的實用性和準確性。

3、現有的深度學習檢測技術可以較好的檢測有線表格。但是對無線表格的檢測效果一般,且無線表格形式多樣,布局變換較多,很難有太強的規(guī)律,雖然可以令深度學習學到其特征,但是伴隨大量的無線表格無法定位,無線表格的文檔表格內容識別和字段提取就成了很大的問題。


技術實現思路

1、鑒于此,本發(fā)明實施例提供了一種無線表格檢測方法及系統(tǒng),以消除或改善現有技術中存在的一個或更多個缺陷。

2、本發(fā)明的一個方面提供了一種無線表格檢測方法,該方法的步驟包括:

3、獲取待檢測的文檔頁面,將該文檔頁面構建為頁面圖像;

4、對所述頁面圖像進行至少一個判定標準的判定:

5、所述判定標準包括第一判定標準,所述第一判定標準的判定步驟包括:

6、將所述頁面圖像通過橫向劃分線平均劃分為多個縱向區(qū)域,將每個所述縱向區(qū)域采用縱向劃分線平均劃分為多個橫向區(qū)域,將所述橫向劃分線和縱向劃分線的交點作為判定點;

7、在所述判定點所在的位置沿縱向方向順序選取第一預設個數的像素點,并判定選取的第一預設個數的像素點的明度值的變化范圍與預設的變化區(qū)間相比較,判定該判定點是否為空點;

8、基于同一高度的空點的位置計算該高度的坐標中心點,判定同一高度的坐標中心點的個數是否大于1,若大于,則符合所述第一判定標準;

9、若所述頁面圖像符合全部的判定標準,則判定該頁面圖像對應的文檔頁面存在無線表格。

10、采用上述方案,本方案基于無線表格包括多列的數據,多列的數據之間存在無內容區(qū)域間隙的特點,首先均勻確定大量的判定點,在每個判定點的位置縱向選取多個像素點,通過該區(qū)域明度值的變化判定該縱向區(qū)域是否為無內容區(qū)域,將對應判定點確定為空點,基于橫向的連續(xù)空點計算坐標中心點,一個坐標中心點對應一個無內容區(qū)域間隙,通過上述方式確定一個行是否存在多個無內容區(qū)域間隙,確定該頁面圖像是否存在無線表格,一方面保證判定精準度,另一方面不需要進行大規(guī)模的模型訓練,提高處理速度。

11、在本發(fā)明的一些實施方式中,在基于同一高度的空點的位置計算該高度的坐標中心點的步驟中,將同一高度相鄰的空點劃分為一個坐標組,并計算每個坐標組的坐標中心點。

12、在本發(fā)明的一些實施方式中,在基于同一高度的空點的位置計算該高度的坐標中心點,判定同一高度的坐標中心點的個數是否大于1,若大于,則符合所述第一判定標準的步驟中,對于每個縱向區(qū)域,判定該縱向區(qū)域中是否符合所述第一判定標準。

13、在本發(fā)明的一些實施方式中,在判定該縱向區(qū)域中是否符合所述第一判定標準的步驟中,若該縱向區(qū)域符合第一判定標準,則對該縱向區(qū)域進行標記,并判定與該縱向區(qū)域相鄰的縱向區(qū)域是否符合第一判定標準,若該縱向區(qū)域相鄰的縱向區(qū)域同樣符合第一判定標準則對兩個縱向區(qū)域進行合并,得到合并區(qū)域,并進一步判定與所述合并區(qū)域相鄰的縱向區(qū)域是否符合第一判定標準,若符合,則進一步合并,更新所述合并區(qū)域。

14、在本發(fā)明的一些實施方式中,在判定選取的第一預設個數的像素點的明度值的變化范圍與預設的變化區(qū)間相比較,判定該判定點是否為空點的步驟中,若選取的第一預設個數的像素點的明度值的變化范圍小于或等于預設的變化區(qū)間,則判定對應的判定點為空點。

15、在本發(fā)明的一些實施方式中,對所述頁面圖像進行至少一個判定標準的判定的步驟之前還包括頁面圖像預判定,通過頁面圖像預判定確定內容起始列,所述頁面圖像預判定的步驟包括:

16、從頁面圖像的任一個角位置的像素開始判定,由頁面圖像的一個角的像素向縱向方向的另一個角的像素進行逐個像素的判定;

17、判定相鄰的兩個像素的明度差,若明度差大于預設的明度差閾值,則判定符合預設置圖像預判定標準,將該位置所在的列作為內容起始列。

18、在本發(fā)明的一些實施方式中,在從頁面圖像的任一個角位置的像素開始判定,由頁面圖像的一個角的像素向縱向方向的另一個角的像素進行逐個像素的判定的步驟中,當完成一個列的明度值的判定后,判定相鄰的另一個列。

19、在本發(fā)明的一些實施方式中,所述判定標準還包括第二判定標準,所述第二判定標準的判定步驟包括:

20、獲取通過頁面圖像預判定的步驟確定的內容起始列,由內容起始列的位置向遠離頁面圖像預判定的判定區(qū)域的方向進行橫向判定;

21、在進行橫向判定過程中,判定相鄰的兩個像素的明度差,若明度差大于預設的明度差閾值,將該像素所在的列作為第一判定區(qū)域的起始列;

22、基于第一判定區(qū)域的起始列向橫向判定的方向延伸第二預設個數個像素,將該像素所在的列位置作為第一判定區(qū)域的終止列;

23、將第一判定區(qū)域的所述終止列作為第二判定區(qū)域的起始列,基于第二判定區(qū)域的起始列向橫向判定的方向延伸第三預設個數個像素,該像素所在的列位置作為第二判定區(qū)域的終止列:

24、分別計算第一判定區(qū)域和第二判定區(qū)域的明度值的平均值的差值,并將該差值與預設的變化閾值相比較,確定是否符合第二判定標準。

25、在本發(fā)明的一些實施方式中,所述判定標準還包括第三判定標準,所述第三判定標準的判定步驟包括:

26、獲取通過頁面圖像預判定的步驟確定的內容起始列,由內容起始列的位置向遠離頁面圖像預判定的判定區(qū)域的方向進行橫向判定;

27、在進行橫向判定過程中,對于每一行判定相鄰的兩個像素的明度差,若明度差大于預設的明度差閾值,將該像素所在位置作為變化像素位置;

28、判定相鄰的多個行的變化像素位置所在的橫向范圍是否小于橫向判定閾值,確定是否符合第三判定標準。

29、本發(fā)明的第二方面還提供一種無線表格檢測系統(tǒng),該系統(tǒng)包括計算機設備,所述計算機設備包括處理器和存儲器,所述存儲器中存儲有計算機指令,所述處理器用于執(zhí)行所述存儲器中存儲的計算機指令,當所述計算機指令被處理器執(zhí)行時該系統(tǒng)實現如前所述方法所實現的步驟。

30、本發(fā)明的第三方面還提供一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時以實現前述無線表格檢測方法所實現的步驟。

31、本發(fā)明的附加優(yōu)點、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領域普通技術人員在研究下文后部分地變得明顯,或者可以根據本發(fā)明的實踐而獲知。本發(fā)明的目的和其它優(yōu)點可以通過在說明書以及附圖中具體指出并獲得。

32、本領域技術人員將會理解的是,能夠用本發(fā)明實現的目的和優(yōu)點不限于以上具體所述,并且根據以下詳細說明將更清楚地理解本發(fā)明能夠實現的上述和其他目的。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
通许县| 正宁县| 沂源县| 勃利县| 汝阳县| 河津市| 郴州市| 荔浦县| 肇庆市| 会昌县| 茶陵县| 泸水县| 和田市| 定西市| 长子县| 砚山县| 蒲江县| 平邑县| 图片| 贵阳市| 白山市| 富平县| 寿光市| 两当县| 维西| 榆社县| 山西省| 彰武县| 伊通| 隆尧县| 广宗县| 兴国县| 长治县| 邓州市| 正安县| 温宿县| 塔河县| 田东县| 武冈市| 浦江县| 波密县|