字符識別裝置和字符識別方法
【技術領域】
[0001]本發(fā)明涉及一種能夠高精度地識別票據(jù)(日語:帳票)等中寫入的手寫字符的字符識別裝置和字符識別方法,特別涉及一種能夠高精度且高速地識別以中國內地的簡體文字、中國臺灣的繁體文字寫入的漢字字符的字符識別裝置和字符識別方法。
【背景技術】
[0002]以光學方式讀取票據(jù)等中記載的手寫漢字來進行字符識別的字符識別裝置構成為:提取按每個字符切取出的字符圖形的特征,由于漢字構造是由位于漢字的左側的偏(日語九)、位于漢字構造的右側的旁(日語< <0 )、位于漢字構造的上側的冠(日語:扣九? <0 )、位于漢字構造的下側的腳(日語:? L )、位于包圍漢字構造整體的位置的構(日語:扣圭;I )、位于從漢字的上側下垂到下側的位置的垂(日語:/^扎)以及位于從漢字構造的左側沿著下側的位置的繞(日語i 3 )這樣的配置于多個區(qū)域的漢字要素的組合構成的,因此,判別用于分割各區(qū)域的分割區(qū)域,并且使用歐幾里德(Euclid)距離值來提取字符圖像的特征量,從而進行字符識別。
[0003]基于該以往技術的字符識別處理構成為通過由字符識別裝置的計算機執(zhí)行如圖18所示的以下步驟來進行字符識別:步驟S1801,提取字符圖像的特征;步驟S1802,基于通過該步驟S1801提取出的特征量來判定字符圖像是漢字還是非漢字;步驟S1804,計算通過該步驟S1802進行了判定的字符圖像的歐幾里德距離值;步驟S1803,判別漢字的字符圖像的部首等分割區(qū)域;步驟S1805,計算通過步驟S1803進行了區(qū)域判定的字符圖像的進行η分割得到的每個區(qū)域的余弦相似度;步驟S1806,將通過該步驟S1805計算出的相似度與同形字符表進行比較來選擇同形字符和相似字符候選;步驟S1807,基于通過上述步驟S1804計算出的歐幾里德距離以及通過步驟S1806選擇出的同形字符和相似字符候選來判定識別候選的字符;以及步驟S1808,輸出通過該步驟S1807判定出的字符候選的判定結果。另夕卜,上述同形字符表按共同的部首、旁等將漢字進行分類,并且按人目視時相像的字形將漢字進行分類。
[0004]通過上述步驟S1807,候選判定使用以下條件來進行識別字符候選的判定:(1)根據(jù)通過步驟S1802得到的漢字、非漢字結果來選擇候選;(2)選擇通過步驟S1804得到的歐幾里德距離值小的候選;(3)選擇通過步驟S1805得到的余弦相似度高的候選;(4)選擇在一部分分割區(qū)域中余弦相似度高的候選;以及(5)選擇余弦相似度大的字符類型(日語:字種)所屬的同形字符分類表,其中,通過圖22所示的公式來計算上述歐幾里德距離值和余弦相似度,其中,X為輸入圖案矢量,μ為平均圖案矢量。
[0005]S卩,以往的字符識別處理構成為通過將字符圖像的歐幾里德距離值、余弦相似度、區(qū)域分割以及同形字符表比較這樣的各種技術進行組合來決定識別字符候選。
[0006]此外,作為記載了基于以往技術的字符識別技術的文獻,可以列舉出下述的專利文獻1,在該專利文獻1中記載了如下技術:特征量提取部從由輸入部輸入的字符圖像提取字符圖像的特征量,匹配部在使用擬貝葉斯判別函數(shù)計算與辭典的相異度時,一邊根據(jù)字符圖像來調整擬貝葉斯判別函數(shù)要計算的主成分數(shù)(擬貝葉斯判別函數(shù)式的k) 一邊計算與辭典的相異度,由此減少對字符識別精度的提高的貢獻不穩(wěn)定的主成分校正項的計算,從而消除字符識別所不需要的小的特征量,并補充特征不足成分。作為記載了前述的分割部首來進行字符識別的技術的文獻,可以列舉出下述的專利文獻2,在該專利文獻2中記載了如下技術:區(qū)域合并部基于所輸入的手寫字符的各筆畫的坐標序列來判定該筆畫是否跨越了字符框內的分割區(qū)域,在跨越了的情況下合并相應的分割區(qū)域,部首切取部基于合并后的分割區(qū)域以部首為單位對上述手寫字符進行切取,部首識別部參照部首識別辭典對該切取出的各部首進行識別處理,字符結構部基于部首識別處理的結果和字符結構辭典來獲取手寫字符的識別結果,由此容易地進行部首切取來提高識別精度。作為記載了在字符識別中使用歐幾里德距離的技術的文獻,可以列舉出下述的專利文獻3,在該專利文獻3中記載了設置有以下單元的技術:標準化單元,其將字符圖像部分標準化成規(guī)定尺寸的矩形圖像;特征量計算單元,其計算將由該標準化單元標準化后的矩形圖像進行分割所得到的分割圖像各自的HOG (Histograms of Oriented Gradient:梯度方向直方圖)特征量;距離計算單元,其計算將HOG特征量空間中的各分割圖像的HOG特征量結合起來得到的圖像部分的HOG特征量與各規(guī)定字符圖像的HOG特征量的歐幾里德距離;比較單元,其比較由該距離計算單元計算出的距離;以及字符識別單元,其基于比較單元的比較結果來識別上述字符圖像部分中有可能包含的字符。
[0007]專利文獻1:日本特開2000-215272號公報
[0008]專利文獻2:日本特開平11-184971號公報
[0009]專利文獻3:日本特開2014-29608號公報
【發(fā)明內容】
[0010]發(fā)明要解決的問題
[0011]上述的基于以往技術的字符識別技術從作為識別對象的字符圖像提取大量的特征量來估計成為正確答案的類別(例如日語的“務” “亜”等),因此,若是漢字則會成為數(shù)千個類別,從而在進行高精度識別時處理時間變得冗長,特別是近年來,存在不僅對日語的漢字進行字符識別、還對中國內地的簡體文字、中國臺灣的繁體文字進行字符識別的需求,識別對象的漢字類型增加,因此招致處理時間變得更冗長的問題。
[0012]另外,對于字符識別裝置,存在即使精度比較低也要高速地對大量票據(jù)進行字符識別的顧客需求以及即使處理時間長也要高精度地對大量票據(jù)進行字符識別的顧客需求,但是基于以往技術的字符識別裝置存在難以根據(jù)顧客需求來調整處理速度和識別精度的問題。
[0013]并且,上述的專利文獻1所記載的技術是想要通過消除字符識別所不需要的小的特征量并補充特征不足成分來實現(xiàn)高速且高精度,但是存在高精度化根據(jù)所設定的閾值而有限度、從而導致容許一定數(shù)量的誤辨別的問題,其它專利文獻所記載的技術存在難以高速處理的問題。
[0014]本發(fā)明的第一目的在于解決前述的以往技術的問題,提供一種能夠進行高速高精度的漢字字符的識別的字符識別裝置和字符識別方法,第二目的在于提供一種能夠根據(jù)顧客需求來調整速度和識別精度的字符識別裝置和字符識別方法。_5] 用于解決問題的方案
[0016]為了達到上述的目的,本發(fā)明的第一發(fā)明是一種字符識別裝置,該字符識別裝置具備:輸入部,其以光學方式將包括漢字的字符讀取為字符圖像,該漢字由多個區(qū)域的漢字要素構成;圖像獲取部,其獲取使用該輸入部讀取的字符圖像;外部存儲部,其保存字符辨別用辭典和同形字符表,該字符辨別用辭典保存有多個標準字符圖像,該同形字符表用于按共同的部首、旁將漢字進行分類并且將目視時相像的相似和同形的漢字進行分類;以及運算部,其參照該字符辨別用辭典和同形字符表來控制字符圖像的字符識別,其中,該運算部參照字符辨別用辭典對輸入的字符圖像執(zhí)行字符識別處理,該字符識別裝置的特征在于,
[0017]上述運算部包括:
[0018]分割區(qū)域判定單元,判定按漢字要素對上述圖像獲取部所獲取的1個字符單位的字符圖像進行分割的分割區(qū)域;
[0019]余弦相似度計算單元,計算通過該分割區(qū)域判定單元進行了判定的字符圖像的同一區(qū)域位置處的漢字要素的余弦相似度;
[0020]歐幾里德距離值計算單元,計算通過上述分割區(qū)域判定單元進行了判定的字符圖像的同一區(qū)域位置處的漢字要素的歐幾里德距離值;
[0021]同形字符表制作單元,制作將以下字符圖像作為相似度高的同形字符進行分組而得到的同形字符表:基于通過上述分割區(qū)域判定單元判定出的分割區(qū)域的漢字結構相同且同一區(qū)域位置的漢字要素之間的基于通過上述余弦相似度計算單元計算出的余弦相似度的相似度高于規(guī)定值的字符圖像、以及漢字要素之間的通過上述歐幾里德距離值計算單元計算出的歐幾里德距離值小于規(guī)定值的字符圖像;以及
[0022]標準字符識別單元,將以下字符圖像之間的邏輯或的字符圖像作為候選字符來進行字符識別:通過上述余弦相似度計算單元計算出的余弦相似度大于規(guī)定的余弦相似度的字符圖像、通過上述歐幾里德距離值計算單元計算出的歐幾里德距離值小于規(guī)定值的字符圖像、以及通過上述同形字符表制作單元將同一區(qū)域位置的相似度高的字符圖像進行分組而得到的同形字符的字符圖像。
[0023]本發(fā)明的第二發(fā)明的特征在于,在第一發(fā)明的字符識別裝置中,上述運算部還包括高精度字符識別單元,該高精度字符識別單元基于從通過標準字符識別單元的邏輯或而得到的字符圖像中排除通過上述分割區(qū)域判定單元分割出的多個分割區(qū)域的結構不同的異種候選字符以及該異種候選字符所屬的組中包含的字符圖像后得到的候選字符,來進行字符識別。
[0024]本發(fā)明的第三發(fā)明的特征在于,在第一發(fā)明或第二發(fā)明的字符識別裝置中,上述運算部還包括高速字符識別單元,該高速字符識別單元將通過上述歐幾里德距離值計算單元計算出的歐幾里德距離值小于規(guī)定值的字符圖像作為候選字符來進行字符識別。
[0025]本發(fā)明的第四發(fā)明的特征在于,在第一發(fā)明至第三發(fā)明中的任一發(fā)明的字符識別裝置中,上述同形字符表制作單元包括分大組單元和分小組單元,該分大組單元將基于通過上述分割區(qū)域判定單元判定出的分割區(qū)域的漢字結構相同的字符圖像分為大組,該分小組單元將通過該分大組單元分組得到的大組內的、特定區(qū)域位置的漢字要素的余弦相似度高于規(guī)定值且歐幾里德距離值小于規(guī)定值的字符圖像分為小組,上述運算部將通過該分大組單元和該分小組單元分組得到的字符圖像保存在同形字符表中。
[0026]本發(fā)明的第五發(fā)明的特征在于,在第一發(fā)明至第四發(fā)明中的任一發(fā)明的字符識別裝置中,上述運算部具備對上述標準字符識別單元、上述高精度字符識別單元以及上述高速字符識別單元進行切換或調整的功能。
[0027]另外,本發(fā)明的第六發(fā)明是一種識別字符的字符識別裝置的字符識別方法,該字符識別裝置具備:輸入部,其以光學方式將包括漢字的字符讀取為字符圖像,該漢字由多個區(qū)域的漢字要素構成;圖像獲取部,其獲取使用該輸入部讀取的字符圖像;外部存儲部,其保存字符辨別用辭典和同形字