專利名稱:文書檢索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子保存并檢索·閱覽文書或圖面等圖像的文書檢索裝置,特別是涉及從通過識(shí)別記載在文書圖像或者圖面上的字符而生成·存儲(chǔ)的文書圖面數(shù)據(jù),使用任意的關(guān)鍵字進(jìn)行全文檢索的文書檢索裝置。
背景技術(shù):
為了把紙文書作為計(jì)算機(jī)可讀取的文書圖像進(jìn)行電子登錄·保存,檢索·顯示,以往,有在文書登錄時(shí),對(duì)于文書圖像人工添加關(guān)鍵字信息的方法,或者使OCR(光學(xué)文書讀取裝置)識(shí)別文書圖像中的字符,把所生成的文書文本與文書圖像一起保存的方法。
前者的方法在文書登錄時(shí)的關(guān)鍵字添加方面需要極多的勞力和時(shí)間。另一方面,后者的方法由于字符識(shí)別性能不完全因此不能避免誤識(shí)別,如果不修正通過字符識(shí)別得到的字符代碼,則在關(guān)鍵字檢索時(shí)具有作為檢索結(jié)果將發(fā)生不顯示所希望文書的「檢索遺落」,或者作為檢索結(jié)果顯示與檢索關(guān)鍵字不同的字符行的「檢索噪聲」這樣的問題。在用人工進(jìn)行的誤識(shí)別的修正方面與前者的方法一樣需要極多的勞力。
解決后者方法的問題的方法之一,有即使存在字符分割錯(cuò)誤·字符識(shí)別錯(cuò)誤,也能夠降低「字符遺落」,實(shí)現(xiàn)高精度的字符檢索的方法(特開2000-057315號(hào)公報(bào))。該方法是除去用字符行處理得到的字符代碼以外,從字符圖像生成·保持表現(xiàn)各字符形狀的特征量(形狀特征),在檢索時(shí)并用字符代碼與形狀特征進(jìn)行對(duì)照的方法。
參照
以往的文書檢索裝置。圖18示出例如在特開2000-057315號(hào)公報(bào)中示出的以往的文書檢索裝置的結(jié)構(gòu)。
圖18中,101是輸入裝置,102是控制裝置,103是字符識(shí)別裝置,104是特征生成裝置,105是顯示裝置,106是檢索裝置,107是特征對(duì)照判定裝置,108是檢索特征生成裝置,109是識(shí)別辭典,110是檢索數(shù)據(jù)存儲(chǔ)單元,111是形狀特征辭典。
下面,參照
以往的文書檢索裝置的動(dòng)作。
首先說明文書登錄。圖19(a)是登錄的文書圖像,把字符識(shí)別裝置103識(shí)別了圖19(a)的結(jié)果示于圖19(b)中。
然后,特征生成裝置104生成識(shí)別了的各字符的形狀特征。形狀特征如圖20所示,通過抽取把各文書圖像8分割了的各區(qū)域中的字符外部輪廓部分的水平,垂直,右上,右下的各方向成分而生成。其結(jié)果示與圖21中。
然后,使用圖22,說明關(guān)鍵字「字符識(shí)別」與檢索數(shù)據(jù)[文宇識(shí)別」的對(duì)照處理。
檢索裝置106首先進(jìn)行使用了字符代碼的對(duì)照。在圖22中,雖然輸入的關(guān)鍵字中的字符「文」「識(shí)」「別」與檢索數(shù)據(jù)一致,但是「字」不一致。
接著,檢索裝置106進(jìn)行基于不一致的字符之間的形狀特征的對(duì)照。具體地講,進(jìn)行不一致的關(guān)鍵字中的「字」的形狀特征122與輸出了檢索數(shù)據(jù)中的「宇」的識(shí)別結(jié)果的字符圖像的形狀特征123的對(duì)照。對(duì)于關(guān)鍵字中的字符「字」中的形狀特征,使用存儲(chǔ)在形狀特征辭典111中的標(biāo)準(zhǔn)圖形的特征值。
如果把字符代碼之間的距離記為C,把形狀特征之間的距離記為D,則用公式(1)表示關(guān)鍵字與檢索數(shù)據(jù)之間的距離。
Dist=(∑D+∑C)/關(guān)鍵字字符數(shù)公式(1)其中,在Cij=α(α常數(shù))時(shí),關(guān)鍵字的第i個(gè)字符與檢索數(shù)據(jù)的第j個(gè)字符的字符代碼不一致。在Cij=0時(shí),關(guān)鍵字的第i個(gè)字符與檢索數(shù)據(jù)的第j個(gè)字符的字符代碼一致。
D[dic(i),img(j)]=∑∑|Fdic(k1)-Fimg(k1)|公式(2)式中,第1個(gè)∑的范圍是k=1~K,第2個(gè)∑的范圍是1=1~L。
這里,F(xiàn)dic是存儲(chǔ)在形狀特征辭典111中的關(guān)鍵字的第i個(gè)字符的特征值,F(xiàn)img是檢索數(shù)據(jù)的第i個(gè)字符的特征值,K是方向成分?jǐn)?shù),L是每個(gè)方向成分的特征數(shù)。在滿足Dist<TH(TH閾值)的情況下,視為字符行與關(guān)鍵字一致,輸出為檢索結(jié)果。
進(jìn)行形狀特征對(duì)照的字符書在關(guān)鍵字與檢索數(shù)據(jù)不同的情況下,能夠通過使用動(dòng)態(tài)設(shè)計(jì)法進(jìn)行對(duì)照。由此,實(shí)現(xiàn)具有允許字符分割錯(cuò)誤·字符識(shí)別錯(cuò)誤的模糊性的對(duì)照。
在上述那樣的以往的文書檢索裝置中,為了實(shí)現(xiàn)允許字符識(shí)別錯(cuò)誤·字符分割錯(cuò)誤的檢索,進(jìn)行具有模糊性的對(duì)照。因此,例如如果對(duì)于在具有每個(gè)單字符的字符框(以下記為單字符框)的記入欄中寫入的字符等的不存在字符分割錯(cuò)誤的字符行進(jìn)行檢索,則與不允許字符分割錯(cuò)誤的檢索相比較存在著增加誤抽取(檢索噪聲)這樣的問題點(diǎn)。
另外,在沒有單字符框的字段中寫入的手寫字符與鉛字相比較,字符的大小或者字符間隔的分散性大,在字符識(shí)別中難以正確檢測(cè)1行中的字符的間隔。因此,手寫字符與鉛字相比較,增加了字符分割錯(cuò)誤,降低了識(shí)別率。其結(jié)果,如果從識(shí)別手寫字符生成的文書數(shù)據(jù)進(jìn)行檢索,則存在著檢索遺落增多的問題點(diǎn)。
這樣,根據(jù)有無字符框或者所寫的字符是鉛字還是手寫字符,字符識(shí)別中的錯(cuò)誤傾向不同,在文書檢索時(shí)如果不考慮這些方面則存在著不能夠?qū)崿F(xiàn)高精度的檢索這樣的問題。
發(fā)明內(nèi)容
本發(fā)明是為解決以上的問題點(diǎn)而產(chǎn)生的,目的在于獲得文書檢索裝置,該文書檢索裝置在文書登錄時(shí)與識(shí)別結(jié)果一起保存檢索輔助信息,在檢索時(shí)根據(jù)檢索輔助信息進(jìn)行對(duì)照,對(duì)應(yīng)于各文書數(shù)據(jù)能夠進(jìn)行高精度的檢索處理,由此,與不使用檢索輔助信息的情況相比較能夠削減檢索遺落·檢索噪聲。
本發(fā)明方案1的文書檢索裝置具備輸入文書的文書輸入裝置;識(shí)別由上述文書輸入裝置輸入的文書中所記載的字符的同時(shí),作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果和檢索輔助信息的文書存儲(chǔ)裝置;存儲(chǔ)上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對(duì)照時(shí),實(shí)施對(duì)應(yīng)于上述字符識(shí)別裝置抽取出的上述檢索輔助信息的對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
本發(fā)明方案2的文書檢索裝置把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
本發(fā)明方案3的文書檢索裝置中,上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個(gè)檢索用文書數(shù)據(jù)庫中所指定的對(duì)照方法進(jìn)行對(duì)照。
本發(fā)明方案4的文書檢索裝置具備輸入文書的輸入文書輸入裝置;保持對(duì)于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識(shí)別由上述文書輸入裝置輸入的文書中記載的字符的同時(shí),作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲(chǔ)裝置;存儲(chǔ)上述文書存儲(chǔ)裝置存儲(chǔ)的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對(duì)照時(shí),按照對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的對(duì)照方法實(shí)施對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
本發(fā)明方案5的文書檢索裝置把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
本發(fā)明方案6的文書檢索裝置中,上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進(jìn)行檢索處理,在與來自存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行不允許字符分割錯(cuò)誤的對(duì)照,在與來自不存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行允許字符分割錯(cuò)誤的對(duì)照。
本發(fā)明方案7的文書檢索裝置中,上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個(gè)檢索輔助信息以及字段信息的對(duì)照輸出檢索結(jié)果。
附圖的簡單說明圖1示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的結(jié)構(gòu)。
圖2是示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的文書登錄動(dòng)作的流程圖。
圖3是示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的文書檢索動(dòng)作的流程圖。
圖4是示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的文書檢索動(dòng)作的流程圖。
圖5示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的檢索輔助信息與對(duì)照方式的對(duì)應(yīng)關(guān)系。
圖6示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的文書登錄用紙。
圖7示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的文書登錄用紙的格式信息。
圖8示出由本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的手寫字符的記入例。
圖9示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的鉛字的記入例。
圖10示出圖8的文書數(shù)據(jù)。
圖11示出圖9的文書數(shù)據(jù)。
圖12示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的檢索輔助信息,字段信息與對(duì)照方式的對(duì)應(yīng)關(guān)系。
圖13示出圖8的字符數(shù)據(jù)的其它例子。
圖14示出圖9的字符數(shù)據(jù)的其它例子圖15示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的手寫文書的字符索引的例子。
圖16示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的印刷文書的沒有單字符框的字段的字符索引的例子。
圖17示出本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的印刷文書的具有單字符框的字段的字符索引的例子。
圖18示出以往的文書檢索裝置的結(jié)構(gòu)。
圖19示出以往的文書檢索裝置的字符圖形和字符識(shí)別結(jié)果。
圖20示出以往的文書檢索裝置中的生成形狀特征的區(qū)域。
圖21示出以往的文書檢索裝置的字符識(shí)別結(jié)果和形狀特征。
圖22用于說明以往的文書檢索裝置中的對(duì)照動(dòng)作。
發(fā)明的
具體實(shí)施例方式
實(shí)施形態(tài)1參照
本發(fā)明實(shí)施形態(tài)1的文書檢索裝置。圖1示出本發(fā)明實(shí)施形1的文書檢索裝置的結(jié)構(gòu)。另外,在各個(gè)圖中,相同的符號(hào)表示相同或者相當(dāng)?shù)牟糠帧?br>
圖1中,1是字符輸入裝置,2是識(shí)別文書輸入裝置1輸入的文書圖像中的字符并從字符代碼和字符圖形抽取出檢索輔助信息的字符識(shí)別裝置,3是存儲(chǔ)字符標(biāo)準(zhǔn)圖形的圖像特征的字符辭典,4是存儲(chǔ)字符識(shí)別裝置2輸出的字符識(shí)別結(jié)果和檢索輔助信息的文書存儲(chǔ)裝置,5是關(guān)鍵字輸入裝置,6是文書檢索裝置,7是存儲(chǔ)由字符存儲(chǔ)裝置4輸出的檢索文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫,8是檢索結(jié)果輸出裝置,9是格式定義文件。
接著,參照
本發(fā)明實(shí)施形態(tài)1的文書檢索裝置的動(dòng)作。
首先說明文書登錄處理。這里,使用圖6所示的定型紙進(jìn)行登錄。圖6中,202示出姓名字段,203示出住址字段,204示出電話號(hào)碼字段,205示出商品名字段。
圖7示出在圖6所示的表格紙的讀取時(shí)使用的格式定義文件的例子。圖7中,示出有無每個(gè)字段的單字符框,以及字段矩形坐標(biāo)。圖7所示的格式定義文件用人工生成。
圖2示出本實(shí)施形態(tài)1的文書檢索裝置的登錄處理的流程圖。
使用該圖2說明登錄處理。首先,在圖2的步驟S100中,文書輸入裝置1輸入文書圖像。該文書輸入裝置1能夠通過使用掃描儀把紙文書進(jìn)行光電變換而實(shí)現(xiàn)。另外,還能夠把已經(jīng)光電變換了的圖像經(jīng)過網(wǎng)絡(luò)的讀取而實(shí)現(xiàn)。圖8以及圖9示出由文書輸入裝置1讀入的文書圖像的例子。
接著,在圖2的步驟S200中,進(jìn)行字符識(shí)別。字符識(shí)別裝置2從文書輸入裝置1輸入的文書圖像出取出字符圖形,輸出對(duì)應(yīng)于各字符圖像的字符代碼。在本實(shí)施形態(tài)1中,字符識(shí)別裝置2使用眾所周知的圖像處理技術(shù)實(shí)現(xiàn)。首先,根據(jù)格式定義文件9的字段矩形坐標(biāo)和字符框信息,從文書圖像抽取出每個(gè)單字符的圖像。對(duì)于具有單字符框的字段,從圖像的直線成分進(jìn)行字符框抽取,把各字符框內(nèi)圖像分割為單字符進(jìn)行識(shí)別。對(duì)于沒有單字符框的字段,從矩形坐標(biāo)內(nèi)進(jìn)行字符行抽取,使用字符行的周邊分布按照每個(gè)單字符進(jìn)行分割。
接著,從各個(gè)單字符圖像抽取出字符識(shí)別中使用的特征,計(jì)算與字符辭典3內(nèi)各字符的標(biāo)準(zhǔn)圖形的圖像特征的距離,按照距離減小的順序把單字符以上輸出為識(shí)別候選字符。
具體地講,從具有單字符框的字段的字符框檢測(cè)從字段矩形區(qū)域檢測(cè)水平,垂直方向成分?jǐn)?shù)為一定值以上的直線成分,把在其交點(diǎn)被包圍的矩形作為單字符框。直線成分檢測(cè)使用眾所周知的圖像處理技術(shù)進(jìn)行。其結(jié)果把所得到的單字符框內(nèi)的字符作為單字符。對(duì)于沒有單字符框的字段進(jìn)行字符行抽取和字符分割。字符行抽取首先對(duì)于輸入圖像(白像素值=0,黑像素值=1的二值圖像)進(jìn)行歐幾里德距離為一定值以內(nèi)的黑像素之間的耦合處理。接著,進(jìn)行作為圖像處理方法的標(biāo)示處理,把各標(biāo)記的形狀是長方形的部分決定為字符行。
接著,從水平方向和垂直方向掃描各字符行,求黑像素?cái)?shù)的周邊分布,把黑體像素?cái)?shù)為極小的位置作為字符分割候選點(diǎn),把字符行分割到單字符圖像中。
字符識(shí)別處理,對(duì)于單字符圖像,作為字符的特征,例如使用縱8維×橫8維的網(wǎng)孔特征。具體地講,計(jì)算在8×8的圍棋盤網(wǎng)孔形的各小區(qū)域中存在的黑像素?cái)?shù),從字符辭典3內(nèi)的標(biāo)準(zhǔn)圖形特征與各維的差分的絕對(duì)值和求距離,按照其減小的順序,把1個(gè)或者多個(gè)字符輸出為識(shí)別候選字符。
接著,字符識(shí)別裝置2從識(shí)別的字符行的圖像特征抽取出檢索輔助信息。這里,判斷字符是鉛字還是手寫字符。其判斷方法,例如利用「1行中的手寫字符與鉛字相比較單字符的大小具有分散性,其分散性較大」這樣的知識(shí),計(jì)算1行內(nèi)的各字符的字符外接矩形大小的平均以及分散,與從學(xué)習(xí)用鉛字?jǐn)?shù)據(jù)以及手寫字符數(shù)據(jù)預(yù)先計(jì)算出的分散的閾值相比較,在分散比閾值大時(shí),判斷為是手寫字符,在閾值以下時(shí)判斷為是鉛字。另外,字符辭典3中保持鉛字和手寫字符的標(biāo)準(zhǔn)圖形,進(jìn)行從字符圖像抽取出的特征與手寫字符以及鉛字的標(biāo)準(zhǔn)圖形特征的距離計(jì)算,還能夠判斷與字符圖形距離最近的字符標(biāo)準(zhǔn)圖形是手寫字符還是鉛字。
最后,在步驟S300中,文書存儲(chǔ)裝置4保存識(shí)別候選字符并結(jié)束。這里,除去字符識(shí)別裝置2輸出的字符代碼以外還保存判斷手寫/印刷的檢索輔助信息。
圖10示出對(duì)于圖8所示的文書圖像的檢索用文書數(shù)據(jù),圖11示出對(duì)于圖9所示的文書圖像的檢索用文書數(shù)據(jù)。在圖10以及圖11的識(shí)別候選字符中用[ ]包圍的字符示出從單字符圖像輸出的多個(gè)識(shí)別候選字符。通過保持多個(gè)識(shí)別候選字符,使包含在字符行中的正解字符數(shù)增加,其結(jié)果能夠降低檢索遺落。把圖10,圖11所示的檢索用文書數(shù)據(jù)登錄在檢索用文書數(shù)據(jù)庫7中后結(jié)束。
其次,根據(jù)圖3,圖4的流程圖說明檢索處理的順序。
這里,在檢索關(guān)鍵字中使用「一郎」以及「一朗」進(jìn)行說明。首先,在圖3的步驟S1100中,關(guān)鍵字輸入裝置5輸入檢索關(guān)鍵字。該關(guān)鍵字輸入裝置5能夠用鍵盤或鼠標(biāo),筆或者復(fù)制品等實(shí)現(xiàn)。首先,作為檢索關(guān)鍵字輸入「一郎」。
接著,在步驟S1200中,文書檢索裝置6進(jìn)行檢索用文書數(shù)據(jù)庫7與輸入關(guān)鍵字的對(duì)照處理。使用圖4的流程圖說明對(duì)照處理的順序。
在圖4的步驟S1210中,從檢索用文書數(shù)據(jù)庫7抽取出1個(gè)檢索用文書數(shù)據(jù),把其檢索輔助信息和識(shí)別候選字符裝載到未圖示緩沖器中?,F(xiàn)在,在檢索用文書數(shù)據(jù)庫7中,存儲(chǔ)著圖10,圖11所示的2個(gè)文書。首先,把圖10所示的檢索用文書數(shù)據(jù)裝載到緩沖器中。
接著,在步驟S1220中,文書檢索裝置6進(jìn)行字段內(nèi)檢索。
字段內(nèi)檢索,如圖5所示那樣,進(jìn)行對(duì)應(yīng)于檢索輔助信息的檢索。在圖5中,在檢索輔助信息是手寫時(shí),進(jìn)行字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151,是鉛字時(shí),進(jìn)行字符分割錯(cuò)誤對(duì)應(yīng)檢索152。
首先,從圖10獲得字段號(hào)碼1(姓名)的檢索輔助信息。這里由于是「手寫」,因此進(jìn)行字符切割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151。為實(shí)現(xiàn)字符切割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151,既可以是通過并用以往例中所示的字符代碼和形狀特征允許字符切割·識(shí)別錯(cuò)誤的方法,也可以是把輸入關(guān)鍵字的字符代碼的部分一致視為對(duì)照成功,輸出為檢索結(jié)果,允許字符切割·識(shí)別錯(cuò)誤的方法。
這里示出后者的例子。在后者的情況下,從連續(xù)的字符行,計(jì)算出一致度=(關(guān)鍵字字符與檢索用文書數(shù)據(jù)中字符的一致字符數(shù))/(關(guān)鍵字字符數(shù)),在其為一定值(這里取為0.5)以上時(shí)輸出為檢索結(jié)果。識(shí)別候選字符「川上一[朗郎]」與關(guān)鍵字「一郎」的第1位識(shí)別候選字符「郎」與「朗」雖然相互不一致,但由于在第2位候選中有「郎」因此一致。這時(shí)的一致度由于是2/2=1.0,因此作為檢索結(jié)果輸出候選。
接著,進(jìn)入到步驟S1230,判斷是否處理了所有的字段。由于在圖10中還存在沒有進(jìn)行對(duì)照的字段因此進(jìn)入到步驟S1220,進(jìn)行與字段號(hào)碼2(住址)的字段內(nèi)對(duì)照。由于沒有字段號(hào)碼2的字符識(shí)別結(jié)果與關(guān)鍵字字符的一致字符,因此不存在輸出的檢索結(jié)果。
以下同樣反復(fù)進(jìn)行以上處理,如果全部字段內(nèi)檢索結(jié)束則進(jìn)入到步驟S1240,檢查在檢索用文書數(shù)據(jù)庫7中是否還存在沒有進(jìn)行對(duì)照處理的檢索文書數(shù)據(jù)。現(xiàn)在,由于圖11所示的檢索用文書數(shù)據(jù)存在于檢索用文書數(shù)據(jù)庫7中,因此進(jìn)入到步驟S1210,同樣進(jìn)行上述處理。
圖5所示的檢索用文書數(shù)據(jù)的檢索輔助信息由于是「鉛字」,因此進(jìn)行字符分割錯(cuò)誤對(duì)應(yīng)檢索152。所謂該字符分割錯(cuò)誤對(duì)應(yīng)檢索152,在這里限定為字符識(shí)別的結(jié)果錯(cuò)誤指的是錯(cuò)誤地分割了字符的情況,在關(guān)鍵字字符與檢索用文書數(shù)據(jù)中的識(shí)別候選第1位字符中進(jìn)行對(duì)照,設(shè)為即使在對(duì)照中存在部分不一致的字符,在相對(duì)應(yīng)的字符數(shù)不同時(shí)也視為對(duì)照成功的對(duì)照。
例如,在關(guān)鍵字「○×電機(jī)」與字符行「○酸機(jī)」的對(duì)照中,「○」以及「機(jī)」雖然相互一致,但是「×電」與「酸」不一致,字符數(shù)分別是「2」和「1」而不同。這種情況下,在字符分割錯(cuò)誤對(duì)應(yīng)檢索152中字符識(shí)別裝置2解釋為「×電」錯(cuò)誤,識(shí)別為「酸」而對(duì)照成功。進(jìn)而為了提高精度,也可以與以往例相同,通過對(duì)照「×電」與「酸」的形狀特征,檢測(cè)不一致字符的形狀,在判斷為形狀類似時(shí)作為對(duì)照成功。
圖11中,作為輸入關(guān)鍵字「一郎」和姓名字段的識(shí)別候選字符的「山田一[郎朗]」中,「一」以及「郎」由于相互一致因此輸出為檢索結(jié)果。以下直到?jīng)]有未對(duì)照的字段為止反復(fù)進(jìn)行步驟S1220到步驟S1240,如果與所有數(shù)據(jù)的對(duì)照結(jié)束則進(jìn)入到步驟S1250,進(jìn)行輸出結(jié)果生成。檢索結(jié)果輸出裝置8把圖10,圖11的檢索用文書數(shù)據(jù)的任一個(gè)輸出為檢索結(jié)果。最后,在圖3中進(jìn)入到步驟S1300,輸出檢索結(jié)果。
其次,用本方式使用關(guān)鍵字「一朗」進(jìn)行檢索。在使用了「一朗」的檢索中,圖10,11的檢索用文書數(shù)據(jù)的任一個(gè)都沒有輸出為檢索結(jié)果是理想的結(jié)果。首先,進(jìn)行圖10和字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151。圖10的「川上一[朗郎]」由于與關(guān)鍵字的某單字符一致因此對(duì)照成功。其結(jié)果,圖10的檢索用文書數(shù)據(jù)輸出為檢索結(jié)果,成為檢索噪聲。
其次,進(jìn)行圖11與字符切割錯(cuò)誤對(duì)應(yīng)檢索152。圖11的「山田一[郎朗]」雖然與關(guān)鍵字字符「一」一致,但是關(guān)鍵字字符「朗」與字符行中的第1位候選字符「郎」不一致,而且不一致字符數(shù)都同為「1」,因此與關(guān)鍵字的對(duì)照失敗。其結(jié)果,圖11的檢索用文書數(shù)據(jù)不作為檢索結(jié)果輸出。
根據(jù)以上處理,在本方法中,在關(guān)鍵字「一郎」中沒有檢索遺落,在關(guān)鍵字「一郎」中,檢索噪聲成為1個(gè)文書。
為了比較,對(duì)于圖10,11,考慮不使用檢索輔助條件,而用同一個(gè)方法進(jìn)行檢索的情況。如使用字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151,在關(guān)鍵字「一郎」中進(jìn)行檢索,則由于與圖10,11的任一個(gè)關(guān)鍵字字符都一致,因此對(duì)照成功。
同樣,如果使用關(guān)鍵字「一朗」進(jìn)行檢索,則圖10,圖11的任一個(gè)都與關(guān)鍵字字符一致,因此對(duì)照成功,成為檢索噪聲。其結(jié)果,在由字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151進(jìn)行的檢索中,雖然在關(guān)鍵字「一郎」中沒有檢索遺落,但是在「一朗」中檢索噪聲成為2個(gè)文書。
同樣,考慮不使用檢索輔助條件,而進(jìn)行字符分割錯(cuò)誤對(duì)應(yīng)檢索152的情況。在與關(guān)鍵字「一郎」的對(duì)照中,雖然與圖11對(duì)照成功,但是在與圖10的對(duì)照中,關(guān)鍵字字符「郎」與檢索用文書數(shù)據(jù)中的「朗」不一致,而且由于不一致字符數(shù)相同,因此對(duì)照不成功,成為檢索遺落。
另一方面,在基于關(guān)鍵字「一朗」的檢索中,雖然圖10對(duì)照成功成為檢索噪聲,然而在與圖11的對(duì)照中,關(guān)鍵字字符「一」一致,但是「朗」不一致,不作為檢索結(jié)果輸出。其結(jié)果,在字符分割錯(cuò)誤對(duì)應(yīng)檢索152中,在關(guān)鍵字「一郎」中檢索遺落成為1個(gè)文書,在關(guān)鍵字組「一朗」中檢索噪聲成為1個(gè)文書。
在使用了關(guān)鍵字「一郎」「一朗」的檢索中,本方法與僅用字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151的情況相比較,檢索噪聲減少到1個(gè)文書。另外,與僅用字符分割錯(cuò)誤對(duì)應(yīng)檢索152的情況相比較,字符遺落減少到1個(gè)文書。這樣,通過使用檢索輔助信息切換檢索方法,能夠減少檢索噪聲,實(shí)現(xiàn)高精度的檢索。
作為本實(shí)施形態(tài)1的第2實(shí)現(xiàn)方法,除去文書檢索裝置6進(jìn)行輔助檢索信息是「手寫」還是「鉛字」的不同對(duì)照以外,通過把格式定義文件中的字段信息也用作為檢索輔助信息,能夠進(jìn)行對(duì)應(yīng)于更詳細(xì)的條件的對(duì)照。
使用圖12,13,14示出其例子。在圖2的步驟S300中,文書存儲(chǔ)裝置4除去字符識(shí)別裝置2輸出的識(shí)別候選字符和檢索輔助信息以外,還把圖7的格式定義文件9中的有/無單字符框信息也作為檢索輔助信息加入到檢索用文書數(shù)據(jù)中,存儲(chǔ)到檢索用文書數(shù)據(jù)庫7中。
圖13,14示出其例子。在圖13,圖14中,檢索輔助信息1指的是手寫/鉛字信息,檢索輔助信息2指的是有/無單字符框信息。
在關(guān)鍵字與檢索用文書數(shù)據(jù)庫7的對(duì)照中,從印刷/手寫信息和有無單字符框信息的組合設(shè)定4種方法。圖12示出其例子。在與是鉛字而且具有單字符框的字段的文書數(shù)據(jù)的對(duì)照中,由于幾乎不存在字符識(shí)別錯(cuò)誤·字符分割錯(cuò)誤,因此設(shè)定為完全一致檢索154。這是僅在輸入關(guān)鍵字與檢索用文書數(shù)據(jù)中的字符行完全一致時(shí)作為檢索結(jié)果進(jìn)行輸出的方法。
在是鉛字但是沒有單字符框的情況下,采用與本發(fā)明實(shí)施形態(tài)1的第1實(shí)現(xiàn)方式相同的字符分割錯(cuò)誤對(duì)應(yīng)檢索152。
另外,在是手寫字符而且沒有單字符框的情況下,也采取與本實(shí)施情態(tài)1的第1實(shí)現(xiàn)方法相同的字符分割·識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151。
在是手寫字符而且具有單字符框的情況下,實(shí)施字符識(shí)別錯(cuò)誤對(duì)應(yīng)檢索153。該字符識(shí)別錯(cuò)誤對(duì)應(yīng)檢索153是允許輸入關(guān)鍵字與檢索用文書數(shù)據(jù)中的字符行中部分一致的檢索,在相互對(duì)應(yīng)的不一致字符的字符數(shù)相同時(shí)作為檢索成功。
例如,如果考慮輸入關(guān)鍵字「○×電機(jī)」與字符行「○×雷機(jī)」的對(duì)照,則「○」「×」「機(jī)」相互一致,對(duì)應(yīng)的「電」「雷」不一致。這時(shí)不一致的字符由于同為單字符,因此把「○×雷機(jī)」輸出為檢索結(jié)果。這樣,通過準(zhǔn)備對(duì)應(yīng)于檢索輔助信息的檢索方式,能夠?qū)崿F(xiàn)最佳地對(duì)應(yīng)了各個(gè)識(shí)別錯(cuò)誤的檢索方式。
在本實(shí)施形態(tài)1的第2實(shí)現(xiàn)方式中,在檢索中使用了檢索輔助信息與格式定義文件中的字段信息,然而并不限定于此,例如也能夠僅登錄格式信息在檢索中使用。
另外,在本實(shí)施形態(tài)1中,在輔助檢索輔助信息中使用了印刷·手寫的判斷,而檢索輔助信息并不限定于此,例如也能夠使用文書圖像的品質(zhì)(噪聲的多少),豎寫·橫寫,字體的種類,字符尺寸等。
另外,在本實(shí)施形態(tài)1中,在1個(gè)檢索用文書數(shù)據(jù)庫7中混合保持著手寫字符和鉛字等檢索用文書數(shù)據(jù),然而并不限定于此,也能夠按照手寫字符,鉛字等檢索輔助信息的不同獨(dú)立地生成檢索用文書數(shù)據(jù)庫7,以各個(gè)特定的檢索方式進(jìn)行檢索。在本實(shí)施形態(tài)1的第2實(shí)現(xiàn)方式中,在圖12中,在每個(gè)檢索輔助信息中示出4種檢索方式,而通過在各個(gè)檢索方式生成最佳的檢索用索引(字符位置索引信息)能夠?qū)崿F(xiàn)檢索的高速化。
這里,圖15,圖16,圖17示出檢索用索引。在各個(gè)索引中,作為索引信息保持字符代碼,字段號(hào)碼,字符位置。由此,能夠不把字符識(shí)別結(jié)果與關(guān)鍵字直接對(duì)照,高速地搜索存在于文書內(nèi)的關(guān)鍵字。
圖17是完全一致搜索154的檢索用索引,從檢索輔助信息是「鉛字」而且是「具有單字符框」的字段,即圖14的字段號(hào)碼3,4生成。例如,從作為字段號(hào)碼「4」的識(shí)別結(jié)果的「 」,「 」的字段號(hào)碼為4,字符位置從字段的起始數(shù)起,由于是單字符,因此成為「1」。同樣,「 」的字段號(hào)碼是4,字符位置是2。以下同樣地生成。另外,還生成與「 」的字符號(hào)碼4,字符位置1,「 」的字符號(hào)碼4,字符位置號(hào)碼2連接的2個(gè)字符的索引。由于越增加連接字符數(shù),越減少輸入關(guān)鍵字字符的索引的讀入和對(duì)照次數(shù),因此能夠?qū)崿F(xiàn)完全一致檢索154的高速化。
圖15是字符識(shí)別錯(cuò)誤對(duì)應(yīng)檢索153,以及字符分割·字符識(shí)別錯(cuò)誤對(duì)應(yīng)檢索151的檢索索引,從圖13的字符識(shí)別結(jié)果生成。同樣,圖16是字符分割對(duì)應(yīng)檢索152的檢索用索引的例子,從圖14的字段號(hào)碼1,2生成。圖15,圖16是具有模糊性的檢索方式的索引,為了防止起因于字符分割錯(cuò)誤·字符識(shí)別錯(cuò)誤的檢索遺落,僅使用單字符索引進(jìn)行檢索。由此,如圖17那樣與保持連接字符索引的情況相比較,能夠削減索引容量,而且實(shí)現(xiàn)高速檢索。在手寫·印刷中進(jìn)行同一檢索時(shí),還能夠把圖15,圖16所示的檢索用索引匯總為1個(gè)。
如以上所說明的那樣,如果依據(jù)本實(shí)施形態(tài)1,則在文書登錄時(shí)與識(shí)別結(jié)果一起保存檢索輔助信息,在檢索時(shí)通過根據(jù)檢索輔助信息進(jìn)行對(duì)照,能夠?qū)?yīng)于各文書數(shù)據(jù)進(jìn)行高精度的檢索處理。由此,與不使用檢索輔助信息的情況相比較能夠削減檢索遺落·檢索噪聲。
本發(fā)明方案1的文書檢索裝置如以上說明的那樣,由于具備輸入文書的文書輸入裝置;識(shí)別由上述文書輸入裝置輸入的文書中所記載的字符的同時(shí),作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果和檢索輔助信息的文書存儲(chǔ)裝置;存儲(chǔ)上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對(duì)照時(shí),實(shí)施對(duì)應(yīng)于上述字符識(shí)別裝置抽取出的上述檢索輔助信息的對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案2的文書檢索裝置以上所說明的那樣,由于把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案3的文書檢索裝置以上所說明的那樣,由于上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個(gè)檢索用文書數(shù)據(jù)庫中所指定的對(duì)照方法進(jìn)行對(duì)照,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案4的文書檢索裝置以上所說明的那樣,由于具備輸入文書的輸入文書輸入裝置;保持對(duì)于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識(shí)別由上述文書輸入裝置輸入的文書中記載的字符的同時(shí),作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲(chǔ)裝置;存儲(chǔ)上述文書存儲(chǔ)裝置存儲(chǔ)的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對(duì)照時(shí),按照對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的對(duì)照方法實(shí)施對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案5的文書檢索裝置以上所說明的那樣,由于把上述檢索輔助信息作為判斷上述輸入文書中記載的字符是手寫還是鉛字的信息,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案6的文書檢索裝置以上所說明的那樣,由于上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進(jìn)行檢索處理,在與來自存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行不允許字符分割錯(cuò)誤的對(duì)照,在與來自不存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行允許字符分割錯(cuò)誤的對(duì)照,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
本發(fā)明方案7的文書檢索裝置以上所說明的那樣,由于上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個(gè)檢索輔助信息以及字段信息的對(duì)照輸出檢索結(jié)果,因此具有能夠進(jìn)行高精度的檢索,能夠削減檢索遺落·檢索躁聲的效果。
權(quán)利要求
1.一種文書檢索裝置,其特征在于具備輸入文書的文書輸入裝置;識(shí)別由上述文書輸入裝置輸入的文書中所記載的字符的同時(shí),作為檢索輔助信息從輸入文書的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;作為檢索用文書數(shù)據(jù)存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果和檢索輔助信息的文書存儲(chǔ)裝置;存儲(chǔ)上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)庫中的檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對(duì)照時(shí),實(shí)施對(duì)應(yīng)于上述字符識(shí)別裝置抽取出的上述檢索輔助信息的對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
2.根據(jù)權(quán)利要求1所述的文書檢索裝置,其特征在于上述檢索輔助信息是判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
3.根據(jù)權(quán)利要求1所述的文書檢索裝置,其特征在于上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置按照在每個(gè)檢索用文書數(shù)據(jù)庫中所指定的對(duì)照方法進(jìn)行對(duì)照。
4.一種文書檢索裝置,其特征在于具備輸入文書的輸入文書輸入裝置;保持對(duì)于文書的區(qū)域信息以及區(qū)域的屬性信息所記述的字段信息的格式定義文件;使用上述格式定義文件識(shí)別由上述文書輸入裝置輸入的文書中記載的字符的同時(shí),作為檢索輔助信息從文書輸入的圖像抽取出有關(guān)字符的品質(zhì)或者狀態(tài)的信息的字符識(shí)別裝置;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典;存儲(chǔ)上述字符識(shí)別裝置的字符識(shí)別結(jié)果,檢索輔助信息以及在上述格式定義文件中記述的字段信息的文書存儲(chǔ)裝置;存儲(chǔ)上述文書存儲(chǔ)裝置存儲(chǔ)的檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字的對(duì)照時(shí),按照對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的對(duì)照方法實(shí)施對(duì)照的文書檢索裝置;輸出上述文書檢索裝置的檢索結(jié)果的檢索結(jié)果輸出裝置。
5.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述檢索輔助信息是判斷上述輸入文書中記載的字符是手寫還是鉛字的信息。
6.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述文書檢索裝置使用上述格式定義文件中的有無單字符框的信息進(jìn)行檢索處理,在與來自存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行不允許字符分割錯(cuò)誤的對(duì)照,在與來自不存在單字符框的字段的識(shí)別結(jié)果字符的對(duì)照時(shí)進(jìn)行允許字符分割錯(cuò)誤的對(duì)照。
7.根據(jù)權(quán)利要求4所述的文書檢索裝置,其特征在于上述文書存儲(chǔ)裝置在對(duì)應(yīng)于上述檢索輔助信息以及上述字段信息的檢索用文書數(shù)據(jù)庫中保持檢索用文書數(shù)據(jù),上述文書檢索裝置通過上述每個(gè)檢索輔助信息以及字段信息的對(duì)照輸出檢索結(jié)果。
全文摘要
以往,由于書寫的字符沒有考慮是鉛字還是手寫字符,因此存在著不能夠?qū)崿F(xiàn)高精度的檢測(cè)這樣的課題,本發(fā)明具備識(shí)別由文書輸入裝置1輸入的文書中記載的字符,從輸入文書的圖像作為檢索輔助信息抽取出有關(guān)字符的品質(zhì),狀態(tài)的信息的字符識(shí)別裝置2;存儲(chǔ)字符的標(biāo)準(zhǔn)圖形的特征的字符辭典3;作為檢索用文書數(shù)據(jù)存儲(chǔ)字符識(shí)別結(jié)果和檢索輔助信息的文書存儲(chǔ)裝置4;存儲(chǔ)上述檢索用文書數(shù)據(jù)的檢索用文書數(shù)據(jù)庫7;輸入文書檢索的關(guān)鍵字的關(guān)鍵字輸入裝置5;在上述檢索用文書數(shù)據(jù)與關(guān)鍵字字符的對(duì)照時(shí),實(shí)施對(duì)應(yīng)于上述字符識(shí)別裝置抽取出的上述檢索輔助信息的對(duì)照的文書檢索裝置6;輸出上述檢索結(jié)果的檢索結(jié)果輸出裝置8,由此能夠?qū)崿F(xiàn)高精度的檢索處理,能夠削減檢索遺落、檢索噪聲。
文檔編號(hào)G06K9/62GK1381799SQ0210571
公開日2002年11月27日 申請(qǐng)日期2002年4月15日 優(yōu)先權(quán)日2001年4月16日
發(fā)明者龜代泰三 申請(qǐng)人:三菱電機(jī)株式會(huì)社