專利名稱:票據(jù)定義數(shù)據(jù)生成方法以及票據(jù)處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及處理票據(jù)的技術(shù),特別是涉及在進(jìn)行文字識(shí)別處理時(shí)用來(lái)生成票據(jù)定義數(shù)據(jù)的技術(shù)。
背景技術(shù):
在識(shí)別票據(jù)的金額欄等文字列之際,用預(yù)先登錄了文字識(shí)別要求區(qū)域的位置和文字?jǐn)?shù)等的信息的票據(jù)定義數(shù)據(jù)來(lái)進(jìn)行文字識(shí)別。對(duì)于生成該票據(jù)定義數(shù)據(jù),迄今為止考慮了各種各樣的方法,這些方法主要著力于使工作量很大的定義數(shù)據(jù)的生成更加容易。
例如,在特開(kāi)2001-126010號(hào)公報(bào)(第8-9頁(yè)、圖7)里所記載的票據(jù)定義生成方法中,對(duì)于沒(méi)有記入數(shù)據(jù)的票據(jù),從格線抽取以及框抽取自動(dòng)抽取出定義數(shù)據(jù)。另外,通過(guò)識(shí)別預(yù)印刷的文字與預(yù)先登錄的關(guān)鍵詞詞典對(duì)照,就能夠設(shè)定沒(méi)有被格線圍住的文字記入框,或者設(shè)定存在于與關(guān)鍵詞對(duì)應(yīng)的位置的框的文字種類。進(jìn)一步,說(shuō)明了通過(guò)全面閱讀預(yù)印刷的文字,不用手工指定框,自動(dòng)地進(jìn)行與全部的定義生成相關(guān)的作業(yè)的方法。
但是,在上述的定義生成方法中,在指定框的場(chǎng)合,假如在指定框內(nèi)沒(méi)有預(yù)印刷的話,就不能生成文字種類等的定義數(shù)據(jù)。另外,要全面識(shí)別預(yù)印刷文字的話現(xiàn)狀是非常費(fèi)時(shí)從而不實(shí)用。再有,由于與關(guān)鍵詞相對(duì)應(yīng)的位置因票據(jù)而異,使關(guān)鍵詞詞典能對(duì)票據(jù)通用是不可能的。
發(fā)明內(nèi)容
因此,該揭示的主要觀點(diǎn)是解決涉及的課題,不管是特定的票據(jù)或者是已經(jīng)記入了還是沒(méi)記入,對(duì)各種各樣的票據(jù)都能自動(dòng)生成票據(jù)定義數(shù)據(jù)。
具體地說(shuō),例如,基于在被指定的讀取區(qū)域周圍或者內(nèi)部的預(yù)印刷文字、記入文字和定義圖像數(shù)據(jù)輸入時(shí)自動(dòng)抽取出的框、格線等的布局信息進(jìn)行定義數(shù)據(jù)的自動(dòng)生成。該定義數(shù)據(jù)生成方法即使不在讀取區(qū)域的內(nèi)部預(yù)印刷也能識(shí)別存在于讀取區(qū)域的周圍的文字列,并通過(guò)將該識(shí)別結(jié)果變換成定義數(shù)據(jù)來(lái)抽取出定義數(shù)據(jù)。另外,即使在讀取區(qū)域周圍存在多個(gè)文字列的場(chǎng)合,也能夠從文字列的位置或尺寸、框的有無(wú)、文字列大小相對(duì)于框大小的比例,將作為相對(duì)于讀取區(qū)域的關(guān)鍵詞(以下稱之為項(xiàng)目名稱)的妥當(dāng)性數(shù)值化,通過(guò)將最妥當(dāng)?shù)奈淖至械淖R(shí)別結(jié)果變換成定義數(shù)據(jù)來(lái)抽取出定義數(shù)據(jù)。
通過(guò)以上的處理,不管記入票據(jù)/未記入票據(jù)、相對(duì)于讀取區(qū)域的項(xiàng)目名稱的位置、指定區(qū)域內(nèi)部的預(yù)印刷的有無(wú),都可能自動(dòng)生成票據(jù)定義數(shù)據(jù)。
另外,還可以采取各種各樣的方式,例如,也可以作為上述的票據(jù)處理中的自動(dòng)定義數(shù)據(jù)生成方法來(lái)構(gòu)成,也可以作為使該功能在計(jì)算機(jī)上得以實(shí)現(xiàn)的計(jì)算機(jī)程序來(lái)構(gòu)成。在這里,作為記錄媒體可以利用軟盤、CD-ROM、DVD、光磁性盤、IC卡、IC芯片、ROM卡盒、打孔卡、印有條紋碼等符號(hào)的印刷品、計(jì)算機(jī)的內(nèi)部?jī)?chǔ)存裝置(RAM和ROM等存儲(chǔ)器)以及外部?jī)?chǔ)存裝置等光學(xué)的、磁性的、電氣的計(jì)算機(jī)可讀取的各種媒體。上述各種特征也可以組合起來(lái)。
圖1是票據(jù)處理裝置的概略構(gòu)成圖。
圖2是表示票據(jù)圖像以及票據(jù)定義數(shù)據(jù)的構(gòu)成的圖。
圖3是票據(jù)定義數(shù)據(jù)自動(dòng)生成處理的流程圖。
圖4是表示用于說(shuō)明票據(jù)定義數(shù)據(jù)生成的表示例的圖。
圖5是表示用于說(shuō)明票據(jù)定義數(shù)據(jù)生成的表示例的圖。
圖6是票據(jù)定義數(shù)據(jù)生成的項(xiàng)目名稱-定義數(shù)據(jù)變換處理的流程圖。
圖7是表示與票據(jù)定義數(shù)據(jù)生成中指定的定義區(qū)域相對(duì)應(yīng)的項(xiàng)目名稱的位置的圖。
圖8是表示票據(jù)定義數(shù)據(jù)生成中的項(xiàng)目名稱-定義數(shù)據(jù)變換詞典的一個(gè)例子的圖。
具體實(shí)施例方式
參照附圖對(duì)較佳的一個(gè)實(shí)施例分以下的項(xiàng)目進(jìn)行說(shuō)明。
A.系統(tǒng)構(gòu)成B.票據(jù)定義數(shù)據(jù)的構(gòu)成C.票據(jù)定義數(shù)據(jù)的生成C1.項(xiàng)目名稱-定義數(shù)據(jù)變換處理A.系統(tǒng)構(gòu)成圖1所示是協(xié)助票據(jù)定義數(shù)據(jù)生成的票據(jù)處理裝置的構(gòu)成的圖。還有,以下是以根據(jù)票據(jù)106的圖像數(shù)據(jù)來(lái)自動(dòng)生成新的票據(jù)定義數(shù)據(jù)的場(chǎng)合為例進(jìn)行說(shuō)明,但是,票據(jù)處理裝置也能夠在已經(jīng)生成的票據(jù)定義數(shù)據(jù)中追加登錄新的其它的讀取區(qū)域的定義數(shù)據(jù)。
如圖所示,該票據(jù)處理裝置作為硬件通過(guò)連接通用的個(gè)人計(jì)算機(jī)101以及顯示器102、鍵盤103、鼠標(biāo)104、掃描器105而構(gòu)成。在個(gè)人計(jì)算機(jī)101中,安裝有用于實(shí)現(xiàn)票據(jù)處理裝置的功能的應(yīng)用軟件。圖中表示的是作為票據(jù)處理裝置的功能塊107~113。這些功能塊由上述應(yīng)用軟件構(gòu)成。當(dāng)然,也可以由硬件構(gòu)成。
圖像輸入部107控制掃描器105、起輸入作為生成票據(jù)定義數(shù)據(jù)的樣本的票據(jù)106的圖像數(shù)據(jù)的作用。票據(jù)定義數(shù)據(jù)生成部108的作用是通過(guò)從鍵盤103和鼠標(biāo)104的輸入裝置指定定義區(qū)域,根據(jù)該圖像數(shù)據(jù)自動(dòng)抽取出票據(jù)定義數(shù)據(jù)。此時(shí),參照文字識(shí)別用詞典110、項(xiàng)目名稱參照用知識(shí)詞典111、項(xiàng)目名稱-定義信息變換詞典112等各數(shù)據(jù)庫(kù)。文字識(shí)別用詞典110是用于將圖像數(shù)據(jù)的形狀與文字以各文字單位進(jìn)行對(duì)照的詞典。項(xiàng)目名稱對(duì)照用知識(shí)詞典111是用于通過(guò)對(duì)照文字列和可能成為項(xiàng)目名的單詞,使文字識(shí)別率提高的詞典。項(xiàng)目名稱-定義信息變換詞典112是用于從通過(guò)上述項(xiàng)目名稱對(duì)照而得到的項(xiàng)目名稱變換成作為讀取對(duì)象的屬性或文字?jǐn)?shù)等的定義數(shù)據(jù)的詞典。
票據(jù)定義數(shù)據(jù)輸出部109輸出通過(guò)票據(jù)定義數(shù)據(jù)生成部108抽取出的定義數(shù)據(jù)。自動(dòng)生成的定義數(shù)據(jù)被登錄到票據(jù)定義數(shù)據(jù)用數(shù)據(jù)庫(kù)113。
B.票據(jù)定義數(shù)據(jù)的構(gòu)成圖2是表示票據(jù)圖像和票據(jù)定義數(shù)據(jù)的構(gòu)成的圖。用例子表示在圖的上方想要定義的票據(jù)圖像201,在下方表示定義數(shù)據(jù)202的構(gòu)成的一例。在票據(jù)圖像201中,左上角為原點(diǎn)、x、y軸定義為圖示的方向。
作為票據(jù)定義數(shù)據(jù)202的一個(gè)例子,由識(shí)別要求區(qū)域坐標(biāo)、框形狀、知識(shí)詞典種類、文字?jǐn)?shù)、手寫體/鉛字等所組成。例如,位于票據(jù)圖像201右上方的委托日的文字識(shí)別定義數(shù)據(jù)與位于定義數(shù)據(jù)202的左上方的定義數(shù)據(jù)相對(duì)應(yīng)。在定義數(shù)據(jù)中,對(duì)于該識(shí)別要求區(qū)域,應(yīng)該進(jìn)行文字識(shí)別處理的矩形范圍可以以左上(開(kāi)始位置)以及右下(結(jié)束位置)的各頂點(diǎn)的(x,y)坐標(biāo)來(lái)定義。在圖中的例子中,設(shè)定有左上的頂點(diǎn)為(1200,100),右下的頂點(diǎn)為(1400,150)。另外,由于存在框,以‘有框’來(lái)設(shè)定框形狀。關(guān)于知識(shí)詞典種類,由于讀取對(duì)象的屬性為日期,所以設(shè)定為‘日期’,文字?jǐn)?shù)設(shè)定為‘12文字’、作為文字的種類設(shè)定為‘鉛字’。
但是,這里所舉的定義數(shù)據(jù)只是一個(gè)例子,也可以將除此以外的各種信息設(shè)定成定義數(shù)據(jù)。例如,在事先知道識(shí)別要求區(qū)域?yàn)殂U字、文字間隔為一定的場(chǎng)合,將文字間隔設(shè)定為定義數(shù)據(jù),通過(guò)在文字識(shí)別時(shí)使用該信息可以提高識(shí)別率。
C.票據(jù)定義數(shù)據(jù)的生成圖3為定義數(shù)據(jù)自動(dòng)生成處理的流程圖。是計(jì)算機(jī)101的CPU根據(jù)使用者的指令來(lái)實(shí)行的處理。處理開(kāi)始后,CPU首先通過(guò)圖像輸入部107輸入票據(jù)的圖像數(shù)據(jù)(步驟S100),對(duì)票據(jù)全面進(jìn)行布局解析處理(步驟S200)。即,從被輸入的圖像數(shù)據(jù)中將表、框、格線等信息作為文字信息抽取出,同時(shí)將識(shí)別為文字行的部分也作為文字信息抽取出。
將通過(guò)該處理而得到的布局信息通過(guò)計(jì)算機(jī)101的顯示器102等顯示裝置提示給使用者。例如,在圖4(a)的例子中,將通過(guò)布局解析而得到的框抽取結(jié)果顯示在窗口405。在該例中為了簡(jiǎn)單而僅顯示框抽取結(jié)果,但是實(shí)際上可以通過(guò)按鈕和指令等切換到格線、文字行信息的顯示。
以下在定義的預(yù)定區(qū)域的格線或框誤抽取出的場(chǎng)合,使用者對(duì)誤抽取出的布局信息進(jìn)行修改(步驟S300)。修改處理利用計(jì)算機(jī)101的鼠標(biāo)104等指向裝置對(duì)顯示在顯示器102等顯示裝置的框和格線等來(lái)進(jìn)行。例如,在圖4(b)的例子中,由于經(jīng)布局解析而得到的框406被誤抽取出,啟動(dòng)修改按鈕401,通過(guò)用鼠標(biāo)104選擇修改框后進(jìn)行拖拉來(lái)修改框(407)。在CPU檢測(cè)到對(duì)布局信息進(jìn)行了修改處理后,CPU就基于修改后的信息再次進(jìn)行布局解析,正確地設(shè)定與定義的預(yù)定區(qū)域相關(guān)的布局信息。
該處理僅在定義區(qū)域框或格線等的布局信息中有誤抽取的場(chǎng)合才進(jìn)行。因此,在不能確認(rèn)誤抽取的場(chǎng)合,和在定義區(qū)域以外的部分有誤抽取的場(chǎng)合等,由于可以跳過(guò)該處理,所以能夠縮短定義數(shù)據(jù)生成時(shí)間。
布局信息的修改通過(guò)對(duì)框或格線等的布局信息進(jìn)行追加/刪除/修改/合并/分割等處理來(lái)進(jìn)行。另外,也可以通過(guò)變更在內(nèi)部保持的與布局信息抽取相關(guān)的閾值,一次修改布局信息。例如,通過(guò)變更在內(nèi)部保持的能夠抽取的框的最小尺寸/最大尺寸的閾值并再次進(jìn)行布局解析處理,就能夠一次抽取出在變更閾值前不能抽取出的框。
在通過(guò)該處理得到必要的布局信息后,接下來(lái),CPU進(jìn)行定義區(qū)域設(shè)定處理(步驟S400)。在該處理中,將所得到的布局信息通過(guò)顯示器102等顯示裝置提示給使用者,請(qǐng)求利用鼠標(biāo)104等指向裝置指定定義哪個(gè)區(qū)域。該處理也可以選擇所得到的框,在想定義沒(méi)框的區(qū)域的場(chǎng)合也可以用拖拉鼠標(biāo)等圍住區(qū)域來(lái)選擇書寫了讀取的文字列的部分。例如,在圖4(d)的例子中,以框408作為定義區(qū)域的場(chǎng)合,啟動(dòng)選擇按鈕402,通過(guò)用鼠標(biāo)104選擇框408來(lái)進(jìn)行定義區(qū)域的設(shè)定。
在使用者指定了定義區(qū)域后,CPU進(jìn)行布局信息-定義數(shù)據(jù)變換處理(步驟S500)。通過(guò)定義區(qū)域設(shè)定處理選擇被抽取出的框作為布局信息的場(chǎng)合,從布局信息表取得與所選擇的框相應(yīng)的信息,基于此變換成定義數(shù)據(jù)。在定義了無(wú)框的區(qū)域的場(chǎng)合,將圍住的框看成假想的框來(lái)生成定義數(shù)據(jù)。這里所謂的定義數(shù)據(jù)是指通過(guò)識(shí)別要求區(qū)域的矩形坐標(biāo)或框的有無(wú)等布局信息能夠抽取出的定義項(xiàng)目。
另外,如果在定義區(qū)域內(nèi)存在多個(gè)框并且從各框的長(zhǎng)/寬尺寸判斷為全框?yàn)閱挝淖挚虻脑挘湍軌蚋鶕?jù)框數(shù)來(lái)進(jìn)行文字?jǐn)?shù)的設(shè)定。例如,在金額欄被豎線劃分的單文字框存在的場(chǎng)合很多。在定義該區(qū)域時(shí),通過(guò)上述方法可以抽取出識(shí)別要求區(qū)域的矩形坐標(biāo)或框的有無(wú)、文字?jǐn)?shù)等的定義數(shù)據(jù)。
CPU在進(jìn)行該處理后,也進(jìn)行項(xiàng)目名稱-定義數(shù)據(jù)變換處理(步驟S600)。詳細(xì)的處理內(nèi)容將在后面敘述,在該處理中,通過(guò)識(shí)別指定的定義區(qū)域周圍的文字來(lái)抽取出讀取屬性或文字?jǐn)?shù)等的定義數(shù)據(jù)。
在通過(guò)這些處理得到定義數(shù)據(jù)后,接下來(lái)CPU整理定義數(shù)據(jù),通過(guò)顯示器等顯示裝置102向使用者提示定義數(shù)據(jù)。在提示的定義數(shù)據(jù)中有誤的場(chǎng)合或有沒(méi)有設(shè)定的項(xiàng)目的場(chǎng)合,使用者或者修改定義數(shù)據(jù),或者追加定義數(shù)據(jù)(步驟S700)。在向使用者提示定義數(shù)據(jù)時(shí),通過(guò)以顏色區(qū)分被自動(dòng)設(shè)定的項(xiàng)目和未設(shè)定的項(xiàng)目,就能夠讓使用者容易明白。另外,在自動(dòng)設(shè)定的項(xiàng)目中,同樣用顏色區(qū)分模糊性高的項(xiàng)目,能夠提起使用者的注意。在這里舉了向使用者提示定義數(shù)據(jù)的方法的一個(gè)例子,但也還可以考慮其它各種各樣的提示方法。
例如,在圖4(e)的例子中,整理從布局解析以及項(xiàng)目名稱中抽取出的定義數(shù)據(jù)并顯示在窗口409。使用者確認(rèn)被顯示的定義數(shù)據(jù),假如全部的定義數(shù)據(jù)都正確的話就不再對(duì)定義數(shù)據(jù)進(jìn)行修改,假如有錯(cuò)的話使用者就修改各定義數(shù)據(jù)并通過(guò)按OK按鈕410結(jié)束對(duì)框408的定義區(qū)域的設(shè)定。在沒(méi)有設(shè)定定義區(qū)域的場(chǎng)合通過(guò)按取消按鈕411,使選擇了的框的定義區(qū)域設(shè)定無(wú)效。
在圖4(d)的例子中,由于是表的形式,各框中的定義數(shù)據(jù)的屬性以列為單位都具有相同的值。例如,位于‘銀行名’的下方的框全部列入‘銀行名’的屬性,‘分行名’也同樣。這樣,通過(guò)在將定義數(shù)據(jù)的屬性以列為單位相同的區(qū)域作為定義區(qū)域設(shè)定的場(chǎng)合使用定義區(qū)域的復(fù)制功能,能夠有效地進(jìn)行定義作業(yè)(步驟S800)。
例如,在圖5(f)的例子中,在作為定義區(qū)域定義‘銀行名’、‘分行名’、‘帳號(hào)’的全區(qū)域的場(chǎng)合,按上述說(shuō)明的順序設(shè)定存在于各項(xiàng)目的正下方的區(qū)域412。接下來(lái)在按復(fù)制按鈕403后,如圖5(g)所示,把想要復(fù)制的區(qū)域413通過(guò)用鼠標(biāo)104進(jìn)行拖拉而包圍起來(lái)。CPU對(duì)想要復(fù)制的區(qū)域413進(jìn)行檢測(cè)設(shè)定完成的定義區(qū)域的處理及檢測(cè)和設(shè)定完成的定義區(qū)域412長(zhǎng)/寬相等的框的處理。在該處理中,對(duì)設(shè)定完成的定義區(qū)域412在想復(fù)制的區(qū)域413內(nèi)探索上下方向,檢測(cè)出長(zhǎng)/寬相等的框。接下來(lái),如圖5(h)所示,CPU將設(shè)定完成的定義屬性值復(fù)制到檢測(cè)出的框內(nèi)(414)。這里所謂的定義屬性值是指坐標(biāo)信息以外的文字?jǐn)?shù)或知識(shí)詞典種類等的定義數(shù)據(jù)。由于起始位置或結(jié)束位置等的坐標(biāo)信息在各框不同,因此這些定義數(shù)據(jù)從通過(guò)布局解析得到的框信息中抽取出。
在該例中,說(shuō)明了對(duì)列的復(fù)制,對(duì)行的復(fù)制也可以同樣地實(shí)現(xiàn)。另外,除此之外,也可以在檢測(cè)出長(zhǎng)/寬相等的框時(shí)通過(guò)顯示器102向使用者提示,使用者用鼠標(biāo)僅選擇想要進(jìn)行定義屬性復(fù)制的框,實(shí)行定義屬性復(fù)制。
通過(guò)以上處理,輸出被設(shè)定的票據(jù)定義數(shù)據(jù)(步驟S900),結(jié)束定義數(shù)據(jù)的自動(dòng)生成處理。生成的票據(jù)定義數(shù)據(jù),如以上說(shuō)明的,被儲(chǔ)存在票據(jù)處理裝置中,被靈活應(yīng)用于票據(jù)的文字識(shí)別。例如,在圖4的例子中,在確認(rèn)所有的票據(jù)定義數(shù)據(jù)已正確地設(shè)定后,可以通過(guò)按保存按鈕404保存票據(jù)定義數(shù)據(jù)。
C1.項(xiàng)目名稱-定義數(shù)據(jù)變換處理圖6是項(xiàng)目名稱-定義數(shù)據(jù)變換處理600的流程圖。在該處理中,對(duì)使用者指定的定義區(qū)域檢測(cè)出在上方向和左方向相鄰的框(步驟S601)。在此,CPU參照預(yù)先在票據(jù)全面抽取出的布局信息的框信息表,檢測(cè)出相應(yīng)的框信息。例如,在圖7的例子中,在將‘平成14年12月1日’這一區(qū)域705指定為定義區(qū)域的場(chǎng)合,與區(qū)域705相鄰的框相當(dāng)于區(qū)域706。
接下來(lái),CPU對(duì)存在于該相鄰的框內(nèi)的文字行進(jìn)行文字識(shí)別處理(步驟S602),進(jìn)行所得到的識(shí)別結(jié)果是否存在的檢查(步驟S603)。在這里,CPU參照前面說(shuō)明過(guò)的文字識(shí)別用詞典110,進(jìn)行提出的橫格圖像和文字的對(duì)照。另外,通過(guò)將所得到的文字列與項(xiàng)目名稱對(duì)照用知識(shí)詞典111對(duì)照實(shí)行作為單詞確定的知識(shí)對(duì)照處理。
例如,在圖7的例子中,參照文字識(shí)別用詞典110及項(xiàng)目名稱對(duì)照知識(shí)詞典111,對(duì)與指定的定義區(qū)域705相鄰的框706內(nèi)的文字行707進(jìn)行項(xiàng)目名稱識(shí)別結(jié)果得到‘存入指定日’。所謂所得到的識(shí)別結(jié)果不存在是指該相鄰的框沒(méi)有的場(chǎng)合和相鄰的框內(nèi)不存在文字行的場(chǎng)合,或者是雖然存在文字行但是在知識(shí)對(duì)照時(shí)失敗了的場(chǎng)合。例如,在圖7的例子中,與區(qū)域701相鄰的框不存在,只有相鄰的文字行702存在。另外,與區(qū)域703相鄰的框不存在,在區(qū)域703內(nèi)部存在文字行704。還有,在相鄰的框存在兩個(gè)以上,項(xiàng)目名稱識(shí)別結(jié)果存在兩個(gè)以上的場(chǎng)合,從文字識(shí)別處理得到的確信度高的一方優(yōu)先。另外,這時(shí),也可以通過(guò)向使用者提示來(lái)選擇正確的項(xiàng)目名稱。
在得到了對(duì)相鄰框內(nèi)的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,CPU將識(shí)別結(jié)果的項(xiàng)目名稱變換成定義數(shù)據(jù)(步驟S609)。在該處理中,通過(guò)參照前面說(shuō)明過(guò)的項(xiàng)目名稱-定義數(shù)據(jù)變換詞典111,變換成對(duì)項(xiàng)目名稱的定義數(shù)據(jù)。在圖8中給出了項(xiàng)目名稱-定義數(shù)據(jù)變換詞典111的一個(gè)例子。以圖7的區(qū)域706內(nèi)的‘存入指定日’為例來(lái)說(shuō)明的話,該項(xiàng)目名稱存在于項(xiàng)目名稱-定義數(shù)據(jù)變換詞典111,與該項(xiàng)目名稱相應(yīng)的知識(shí)詞典種類為‘日期’、文字?jǐn)?shù)為‘12個(gè)字’。這樣一來(lái),就從項(xiàng)目名稱中抽取出定義數(shù)據(jù)。還有,伴隨項(xiàng)目名稱的定義數(shù)據(jù)也可以與知識(shí)詞典種類和文字?jǐn)?shù)無(wú)關(guān)而設(shè)定成各種各樣的信息。例如,在知識(shí)詞典種類和文字?jǐn)?shù)以外可以考慮文字種類。
在步驟603,在得不到對(duì)相鄰的框的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,進(jìn)行指定的定義區(qū)域內(nèi)的文字行抽取處理。在此,CPU參照預(yù)先在票據(jù)全面抽出的布局信息的文字行信息表,檢測(cè)出存在于指定區(qū)域內(nèi)的文字行信息。對(duì)抽取出的文字行進(jìn)行文字識(shí)別處理(步驟S604),進(jìn)行所得到的識(shí)別結(jié)果是否存在的檢查(步驟S605)。在此,CPU和上面一樣,利用文字識(shí)別用詞典110和項(xiàng)目名稱對(duì)照用詞典111來(lái)進(jìn)行文字識(shí)別。
例如,在圖7的例子中,在指定‘委托日 年 月’這一區(qū)域703為定義區(qū)域時(shí),參照文字識(shí)別用詞典110和項(xiàng)目名稱對(duì)照用詞典111對(duì)存在于指定的定義區(qū)域703的內(nèi)部的文字列704進(jìn)行項(xiàng)目名稱識(shí)別結(jié)果得到‘委托日’。在得到了對(duì)內(nèi)部文字行的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,CPU就把識(shí)別結(jié)果的項(xiàng)目名稱變換成定義數(shù)據(jù)(步驟S609)。
在得不到對(duì)內(nèi)部文字行的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,就對(duì)指定的定義區(qū)域檢測(cè)出在上方向和左方向相鄰的文字行(步驟S606)。在此,CPU參照預(yù)先在票據(jù)全面抽取出的布局信息的框信息表來(lái)檢測(cè)出相應(yīng)的文字行信息。例如,在圖7的例子中,在指定‘____閣下’這一區(qū)域701為定義區(qū)域場(chǎng)合,與區(qū)域701相鄰的文字行相當(dāng)于區(qū)域702。
接下來(lái),CPU對(duì)該相鄰的文字行進(jìn)行文字識(shí)別處理(步驟S607),進(jìn)行所得到的識(shí)別結(jié)果是否存在的檢查(步驟S608)。在此,CPU和上面同樣,利用文字識(shí)別用詞典110和項(xiàng)目名稱對(duì)照用知識(shí)詞典111來(lái)進(jìn)行文字識(shí)別。例如,在圖7的例子中,參照文字識(shí)別用詞典110和項(xiàng)目名稱對(duì)照用知識(shí)詞典111對(duì)與指定的定義區(qū)域701相鄰的文字行702進(jìn)行項(xiàng)目名稱識(shí)別結(jié)果得到‘委托人’。
在得到了對(duì)相鄰的文字行的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,CPU把識(shí)別結(jié)果的項(xiàng)目名稱變換成定義數(shù)據(jù)(步驟S609)。在得不到對(duì)相鄰的文字行的項(xiàng)目名稱識(shí)別結(jié)果的場(chǎng)合,將指定的定義區(qū)域看作沒(méi)有項(xiàng)目名稱的區(qū)域,知識(shí)詞典種類和文字?jǐn)?shù)等的定義數(shù)據(jù)作為未設(shè)定而結(jié)束。
CPU對(duì)全部指定的定義區(qū)域?qū)嵭幸陨系奶幚怼_€有,在這次的項(xiàng)目名稱抽取處理中,按照相鄰框內(nèi)的文字行、指定定義區(qū)域內(nèi)的文字行、相鄰的文字行的順序設(shè)定了優(yōu)先級(jí),但是,也可以根據(jù)票據(jù)種類變更優(yōu)先級(jí)。另外,也可以不使用3個(gè)的文字行,而僅使用例如相鄰框內(nèi)的文字行。這樣一來(lái),項(xiàng)目名稱出現(xiàn)的位置被限定的票據(jù)等就能夠進(jìn)行更加正確的項(xiàng)目名稱抽取、定義數(shù)據(jù)生成。
如上所述,根據(jù)公開(kāi)的技術(shù),盡可能使票據(jù)定義數(shù)據(jù)的生成自動(dòng)化,不能自動(dòng)化處理的部分則通過(guò)部分地進(jìn)行人工介入,能夠更加順利地協(xié)助票據(jù)定義數(shù)據(jù)生成。
在使用者修改或者追加定義數(shù)據(jù)時(shí),通過(guò)以顏色在顯示裝置上區(qū)分被自動(dòng)設(shè)定的項(xiàng)目和未設(shè)定項(xiàng)目等,能夠以使用者易于理解的畫面來(lái)構(gòu)成。另外,在自動(dòng)設(shè)定的項(xiàng)目中,模糊性高的項(xiàng)目也同樣也通過(guò)顏色區(qū)分,能夠提起使用者的注意。
再有,不管特定的票據(jù)或者已經(jīng)記入、沒(méi)有記入,對(duì)于各種票據(jù)也都能自動(dòng)生成票據(jù)定義數(shù)據(jù)。
以上,公開(kāi)的技術(shù)并不限定于實(shí)施例,可以在不脫離其主旨的范圍內(nèi)采用各種各樣的構(gòu)成這是不言而喻的。例如,以上的控制處理以軟件來(lái)實(shí)現(xiàn)以外,還可以以硬件來(lái)實(shí)現(xiàn)。另外,也可以以票據(jù)處理裝置的文字識(shí)別裝置實(shí)施票據(jù)定義數(shù)據(jù)的生成而構(gòu)成。
根據(jù)公開(kāi)的技術(shù),不管特定的票據(jù)或者已經(jīng)記入、沒(méi)有記入,對(duì)于各種各樣的票據(jù)都能夠自動(dòng)生成票據(jù)定義數(shù)據(jù)。
權(quán)利要求
1.一種票據(jù)定義數(shù)據(jù)生成方法,其特征在于取得票據(jù)的圖像數(shù)據(jù);從該圖像數(shù)據(jù)中抽取出文字信息的布局信息;從與所指定的定義區(qū)域?qū)?yīng)的上述布局信息中抽取出與該定義區(qū)域的位置相關(guān)的第1定義數(shù)據(jù);識(shí)別存在于上述定義區(qū)域周邊或內(nèi)部的文字信息;將該識(shí)別結(jié)果變換成與該定義區(qū)域的屬性相關(guān)的第2定義數(shù)據(jù)。
2.如權(quán)利要求1所述的票據(jù)定義數(shù)據(jù)生成方法,其特征在于在上述定義區(qū)域的附近檢查上述文字信息的存在;檢查的結(jié)果,在上述定義區(qū)域的附近沒(méi)有檢查出文字信息的存在的場(chǎng)合,在該定義區(qū)域的內(nèi)部檢查文字信息的存在;檢查的結(jié)果,在上述定義區(qū)域的內(nèi)部也沒(méi)有檢查出文字信息的存在的場(chǎng)合,檢查該定義區(qū)域的上方向以及左方向的位置文字信息的存在。
3.如權(quán)利要求1所述的票據(jù)定義數(shù)據(jù)生成方法,其特征在于在上述定義區(qū)域沿列方向連續(xù)的場(chǎng)合,從與各定義區(qū)域?qū)?yīng)的上述布局信息中抽取出與該各定義區(qū)域的位置相關(guān)的第1定義數(shù)據(jù);將上述第2定義數(shù)據(jù)作為與上述各定義區(qū)域的屬性相關(guān)的第2定義數(shù)據(jù)復(fù)制下來(lái)。
4.如權(quán)利要求1所述的票據(jù)定義數(shù)據(jù)生成方法,其特征在于在上述布局信息有誤的場(chǎng)合,根據(jù)修改過(guò)的信息再度抽取出布局信息。
5.如權(quán)利要求1所述的票據(jù)定義數(shù)據(jù)生成方法,其特征在于通過(guò)從與上述定義區(qū)域?qū)?yīng)的上述布局信息中求出該定義區(qū)域內(nèi)的各框的縱橫比來(lái)判斷是否有文字框,判斷為文字框的場(chǎng)合,計(jì)算文字框的數(shù)目并抽取出文字?jǐn)?shù)的定義數(shù)據(jù)。
6.一種票據(jù)處理裝置,是根據(jù)票據(jù)的圖像數(shù)據(jù)生成進(jìn)行記入的內(nèi)容的文字識(shí)別處理時(shí)所使用的定義數(shù)據(jù)的票據(jù)處理裝置,其特征在于具有取得票據(jù)的圖像數(shù)據(jù)的裝置;對(duì)于上述圖像數(shù)據(jù),抽取出框、格線以及文字行等的布局解析信息的裝置;從與被指定的定義區(qū)域?qū)?yīng)的上述布局解析信息中抽取出與該定義區(qū)域的位置相關(guān)的定義數(shù)據(jù)的裝置;從存在于上述定義區(qū)域周圍或內(nèi)部的框以及文字行中抽取出該定義區(qū)域的項(xiàng)目名稱的裝置;進(jìn)行上述項(xiàng)目名稱的文字識(shí)別的裝置;將通過(guò)上述文字識(shí)別處理而得到的識(shí)別結(jié)果與項(xiàng)目名稱詞典對(duì)照的裝置;將從上述對(duì)照結(jié)果得到的項(xiàng)目名稱轉(zhuǎn)換成表示該定義區(qū)域的屬性的定義數(shù)據(jù)的裝置;整理上述定義數(shù)據(jù)并輸出到票據(jù)定義數(shù)據(jù)文件的裝置。
7.如權(quán)利要求6所述的票據(jù)處理裝置,其特征在于具有在上述布局解析信息有誤的場(chǎng)合,通過(guò)根據(jù)修改過(guò)的布局解析修改信息再度進(jìn)行布局解析處理來(lái)修改格線或框等的布局解析信息的裝置。
8.一種票據(jù)處理裝置,其具有讀取票據(jù)取得圖像數(shù)據(jù)的圖像輸入裝置、對(duì)來(lái)自該圖像輸入裝置的圖像數(shù)據(jù)進(jìn)行文字識(shí)別的文字識(shí)別裝置,其特征在于上述文字識(shí)別裝置從來(lái)自上述圖像輸入裝置的圖像數(shù)據(jù)中抽取出文字信息的布局信息,從與被指定的定義區(qū)域?qū)?yīng)的上述布局信息中抽取出與該定義區(qū)域的位置相關(guān)的第1定義數(shù)據(jù),識(shí)別存在于上述定義區(qū)域的周圍或內(nèi)部的文字信息,將該識(shí)別結(jié)果轉(zhuǎn)換成與該定義區(qū)域的屬性相關(guān)的第2定義數(shù)據(jù),將該第2定義數(shù)據(jù)與上述第1定義數(shù)據(jù)匯總起來(lái)保存。
9.如權(quán)利要求8所述的票據(jù)處理裝置,其特征在于上述定義區(qū)域沿列方向連續(xù)時(shí),上述文字識(shí)別裝置從與上述各定義區(qū)域相對(duì)應(yīng)的上述布局信息中抽取出與該各定義區(qū)域的位置相關(guān)的第1定義數(shù)據(jù),將上述第2定義數(shù)據(jù)作為與上述各定義區(qū)域的屬性相關(guān)的第2定義數(shù)據(jù)復(fù)制。
10.如權(quán)利要求8所述的票據(jù)處理裝置,其特征在于上述文字識(shí)別裝置通過(guò)從與上述定義區(qū)域?qū)?yīng)的上述布局信息中求出該定義區(qū)域內(nèi)的各框的縱橫比來(lái)判斷有無(wú)文字框,在判定為文字框的場(chǎng)合,計(jì)算文字框數(shù)并抽取出文字?jǐn)?shù)的定義數(shù)據(jù)。
全文摘要
本發(fā)明的目的在于提供票據(jù)定義數(shù)據(jù)生成方法以及票據(jù)處理裝置,減輕生成票據(jù)定義數(shù)據(jù)時(shí)使用者的負(fù)擔(dān)。票據(jù)處理裝置對(duì)使用者指定的區(qū)域抽取出布局信息(步驟200)以及與指定區(qū)域有關(guān)聯(lián)的項(xiàng)目名稱,通過(guò)將這些信息變換成定義數(shù)據(jù)(步驟500、步驟600)來(lái)自動(dòng)生成票據(jù)定義數(shù)據(jù)。這樣一來(lái),通過(guò)僅指定定義位置,由于定義數(shù)據(jù)被自動(dòng)生成,所以能夠減輕使用者設(shè)定票據(jù)定義數(shù)據(jù)的負(fù)擔(dān)。
文檔編號(hào)G06K9/20GK1525378SQ20041000066
公開(kāi)日2004年9月1日 申請(qǐng)日期2004年1月15日 優(yōu)先權(quán)日2003年2月24日
發(fā)明者淺野英輔, 新莊廣 申請(qǐng)人:株式會(huì)社日立制作所