字符識別系統(tǒng)、字符識別程序以及字符識別方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及字符識別系統(tǒng)。
【背景技術(shù)】
[0002]以往,提供了用于光學(xué)讀取被打印在紙上的字符而進行識別的光學(xué)字符識別系統(tǒng),例如,在下述專利文獻1、2中作了公開。
[0003]另一方面,如下述專利文獻3所公開的那樣,為了在系統(tǒng)之間或應(yīng)用程序之間進行數(shù)據(jù)的交接,需要借助通過畫面捕捉得到的圖像數(shù)據(jù),識別計算機的顯示器上顯示的字符。
[0004]現(xiàn)有技術(shù)文獻
[0005]專利文獻
[0006]專利文獻1:日本特開2008-305126號公報
[0007]專利文獻2:日本特開2010-26805號公報
[0008]專利文獻3:日本特開2011-81537號公報
【發(fā)明內(nèi)容】
[0009]發(fā)明所要解決的課題
[0010]但是,顯示器上的顯示字符與被打印在紙上的字符相比,點的分辨率粗,所以即使采用現(xiàn)有的光學(xué)字符識別的手法,有時候識別率也會大幅下降。尤其是對于為了增大顯示數(shù)據(jù)量而使用的小字符尺寸的字符而言,識別率極端地降低。
[0011]本發(fā)明就是鑒于上述課題而完成的,其目的在于提供一種字符識別系統(tǒng),其能夠以高的準確率識別顯示在計算機的顯示器上的字符。
[0012]用于解決課題的手段
[0013]為了解決上述課題,本發(fā)明的字符識別系統(tǒng)用于識別計算機的顯示器上顯示的字符,其特征在于,所述字符識別系統(tǒng)具有:存儲裝置,其針對規(guī)定的顯示字體和字符尺寸的組合,記錄有識別辭典,所述識別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點的配置的信息;以及字符識別部,其參照所述識別辭典,提取與關(guān)于所述顯示器上顯示的識別對象字符的構(gòu)成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0014]此外,本發(fā)明的字符識別程序用于使計算機識別顯示器上顯示的字符,其特征在于,所述字符識別程序使所述計算機執(zhí)行以下步驟:識別辭典生成步驟,針對規(guī)定的顯示字體和字符尺寸的組合,生成識別辭典,所述識別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點的配置的信息;以及字符識別步驟,參照所述識別辭典,提取與關(guān)于所述顯示器上顯示的識別對象字符的構(gòu)成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0015]此外,本發(fā)明的字符識別方法用于識別計算機的顯示器上顯示的字符,其特征在于,所述字符識別方法具有以下步驟:識別辭典生成步驟,針對規(guī)定的顯示字體和字符尺寸的組合,生成識別辭典,所述識別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點的配置的信息;以及字符識別步驟,參照所述識別辭典,提取與關(guān)于所述顯示器上顯示的識別對象字符的構(gòu)成點的配置的信息完全一致的字符,由此確定所述識別對象字符。
[0016]發(fā)明效果
[0017]根據(jù)本發(fā)明,即使是顯示在計算機的顯示器上的分辨率低的字符,也能夠高精度地進行字符識別。
【附圖說明】
[0018]圖1是概略地示出本發(fā)明的實施方式的字符識別系統(tǒng)的結(jié)構(gòu)的示意圖。
[0019]圖2是示出本發(fā)明的實施方式的識別辭典的內(nèi)容的圖。
[0020]圖3是概略地示出本發(fā)明的實施方式的字符識別系統(tǒng)的功能的框圖。
[0021]圖4是示出本發(fā)明的實施方式的識別辭典的生成處理的流程的流程圖。
[0022]圖5是示出本發(fā)明的實施方式的字符識別的處理的流程的流程圖。
[0023]圖6是用于說明本發(fā)明的實施方式的字符識別的處理的圖。
【具體實施方式】
[0024]下面,參照附圖詳細說明本發(fā)明的實施方式的字符識別系統(tǒng)。圖1是概略地示出本實施方式的字符識別系統(tǒng)的結(jié)構(gòu)的示意圖。圖2是示出本實施方式的識別辭典的內(nèi)容的圖。圖3是概略地示出本實施方式的字符識別系統(tǒng)的功能的框圖。
[0025]如圖1所示,字符識別系統(tǒng)I具有:計算機主體10 ;顯示器30,其是顯示來自計算機主體10的輸出信息的顯示裝置;以及鍵盤和鼠標(biāo)等輸入裝置32,其用于將信息輸入到計算機主體10。
[0026]本實施方式的字符識別系統(tǒng)I是用于識別顯示器30上顯示的字符的系統(tǒng),其特征在于,在進行字符識別時,不是利用光學(xué)字符識別,而是根據(jù)關(guān)于構(gòu)成字符的構(gòu)成點的配置的信息是否完全一致,來進行字符的確定。在本實施方式中,以識別應(yīng)用程序A在顯示器30上的顯示窗口內(nèi)的規(guī)定的識別對象區(qū)域中顯示的顯示字符的情況為例進行說明。
[0027]計算機主體10具有:用于進行各種運算的CPU(Central Processing Unit,中央處理單元)等運算裝置11 ;以及用于存儲各種信息的HDD (Hard Disc Drive,硬盤驅(qū)動器)和作為運算處理的工作區(qū)進行使用的RAM (Random Access Memory,隨機存取存儲器)等存儲裝置12。
[0028]存儲裝置12具有:程序保存部121,其保存有安裝于計算機主體10的OS (Operating System:操作系統(tǒng))、字符識別程序、識別辭典生成程序、字體檢查程序、應(yīng)用程序A等各種程序;識別辭典DB (數(shù)據(jù)庫)122,其保存有在進行字符識別時使用的識別辭典;用于字體檢查的字體檢查用辭典DB 123 ;以及視頻存儲器125,其臨時保持顯示器30上顯示的畫面內(nèi)容。
[0029]關(guān)于程序保存部121,字符識別程序是用于執(zhí)行后述的字符識別處理的程序,識別辭典生成程序是用于執(zhí)行后述的識別辭典的生成處理的程序。此外,字體檢查程序是用于在進行識別辭典的生成和字符識別時,取得識別對象字符的顯示字體和字符尺寸的信息的程序。
[0030]在識別辭典DB 122中,按照顯示字體和字符尺寸的每種組合,生成識別辭典并進行記錄。參照圖2來說明識別辭典的識別辭典記錄的內(nèi)容。識別辭典DB 122內(nèi)的各記錄具有“辭典ID”、“顯示字體”、“字符尺寸”、“字符代碼”、“外框內(nèi)點配置”、“外框尺寸”、“外框位置”的項目。
[0031]“辭典ID”是各識別辭典的識別符,如果是相同顯示字體和字符尺寸的組合,則為相同的識別符,如果顯示字體和字符尺寸的至少一個不同,則為不同的識別符。“顯示字體”、“字符尺寸”和“字符代碼”是作為該記錄的生成源的字符的字體、尺寸、字符代碼。
[0032]“外框內(nèi)點配置”是包含構(gòu)成辭典生成源的字符的全部構(gòu)成點的最小矩形外框內(nèi)的點配置位置的信息。例如,將配置有黑色點的位置設(shè)為“ I ”,將沒有配置的空白位置設(shè)為“0”,從矩形外框內(nèi)的左上朝向右下,按照每行以“00110101110000”的形式進行記錄。
[0033]“外框尺寸”是上述最小矩形外框的縱橫的尺寸信息(點的個數(shù))?!巴饪蛭恢谩笔菑幕€(標(biāo)準底線)到上述最小矩形外框的下邊的距離。在本實施方式中,“外框內(nèi)點配置”、“外框尺寸”、“外框位置”的項目相當(dāng)于關(guān)于字符的構(gòu)成點的配置的信息。
[0034]字體檢查用辭典DB 123內(nèi)記錄的字體檢查用辭典是用于在進行識別辭典的生成和字符識別時,取得識別對象字符的顯示字體和字符尺寸的信息的辭典。字體檢查用辭典僅針對例如“務(wù)U 3尤朽”等規(guī)定的檢查用的多種字符,具有與關(guān)于計算機主體10中安裝的全部字體的全部尺寸的上述識別辭典相同的信息。
[0035]接著,參照圖3來說明字符識別系統(tǒng)I的功能。如該圖所示,字符識別系統(tǒng)I具有:字體檢查部20,其具有識別顯示器30上顯示的顯示字符的顯示字體和字符尺寸的功能;辭典生成部21,其具有預(yù)先生成上述識別辭典的功能;以及字符識別部25,其具有進行字符識別的功能。
[0036]這各個部分的功能是使運算裝置11執(zhí)行程序保存部121中保存的字體檢查程序、識別辭典生成程序、字符識別程序來實現(xiàn)的。
[0037]接著,進一步參照圖4來說明識別辭典DB 122中記錄的識別辭典的生成處理的流程。圖4是示出本實施方式的識別辭典的生成處理的流程的流程圖。
[0038]識別辭典的生成是在后述的字符識別處理之前進行的,辭典生成部21生成針對之后待識別的識別對象字符的顯示字體和字符尺寸的組合的識別辭典。當(dāng)然,在已經(jīng)針對相同顯示字體和字符尺寸的組合生成了識別辭典的情況下,無需再次進行辭典的生成,只要使用已經(jīng)登記的識別辭典即可。
[0039]在識別辭典的生成時,在計算機主體10中執(zhí)行識別辭典生成程序。首先,在Sll中,進行生成識別辭典所需的顯示字體和字符尺寸的取得。該字符尺寸等的取得是啟動字體檢查程序而進行的。
[0040]這里生成的識別辭典是應(yīng)用程序A在顯示窗口內(nèi)的規(guī)定的識別對象區(qū)域內(nèi)顯示的識別對象字符的顯示字體和字符尺寸的組合的識別辭典,所以字體檢查程序參照記錄在字體檢查用辭典DB 123內(nèi)的字體檢查用辭典,自動確定該識別對象字符的顯示字體和字符尺寸。
[0041]具體而言,字體檢查部20通過畫面捕捉從視頻存儲器125取得識別對象字符的圖像數(shù)據(jù),一邊參照字體檢查用辭典DB 123,一邊提取與構(gòu)成識別對象字符的點的配置信息完全一致的字符。由此,確定與識別對象字符相同字體和相同尺寸的字符,能夠取得識別對象區(qū)域中顯示的字符的顯示字體和字符尺寸的信息。
[0042]另外,參照該字體檢查用辭典DB 123提取字符的處理與后述的字符識別的處理相同,所以省略詳細的說明。此外,字體檢查用辭典是僅針對檢查用的多種字符的辭典,所以在進行字體檢查時,操作員需要預(yù)先進行字符的輸入等作業(yè),以使該檢查用的字符作為識別對象字符顯示在識別對象區(qū)域內(nèi)。
[0043]與現(xiàn)有的光學(xué)字符識別不同,在本實施方式中,根據(jù)字符的構(gòu)成點的配置位置是否相同,進行字符的識別,如果顯示字體或字符尺寸不同,則會被識