專利名稱:字符識別裝置、字符識別方法、以及字符數據的制作方法
技術領域:
本發(fā)明涉及從光學掃描的文件的圖像數據中識別字符的字符識別裝置與字符識別方法、以及用于字符識別的字符數據。
背景技術:
存在常規(guī)字符識別技術,用來數字化在利用字處理器準備的原始文件的上打印的字符,并且在諸如計算機等信息處理裝備中利用這些數字化的字符。具體地,通過利用圖像掃描器等等讀取原件來識別字符,將所識別的字符轉換為拉丁字母字符、數字、日語雙字節(jié)字符(平假名、日本漢字等等)等等的字符代碼,并且保存字符代碼。
在常規(guī)字符識別裝置中,平均多種典型字體(gothic(哥特體)、minchou(明朝體)、serif(襯線)、sans-serif(無襯線)、單間距等等)的特征量,以創(chuàng)建識別字典,其包括用于識別字符的字符模式。但是,無法通過創(chuàng)建具有平均特征量的字符模式以足夠的精度識別字符。
相應地,人們已經提出了以下字符識別技術對于每種字體類型創(chuàng)建識別字典(例如參見專利文件1)。該技術涉及檢測在字處理器中包含的字體類型,并且為每種字體類型的每個字符創(chuàng)建參照模式,并且在識別字典中登記這些參照模式。所登記的參照模式用于識別掃描器等等讀取的圖像數據中的字符。
人們還提出另一種字符識別技術抽取掃描器等等讀取的圖像數據中的字符形狀的特征量,計算所抽取的特征量與各種字體類型的預定特征量之間的相似性,并且根據所計算的相似性識別字體類型(例如參見專利文件2)。在這一技術中,對于每種字體類型,字符輪廓線(profile line)信息是預定的。一旦識別了字體類型,就根據字符的輪廓線信息,糾正圖像數據中字符的形狀。然后存儲或顯示糾正后的字符。相應地,只有通過識別字體類型,才能避免錯誤識別字符,而不用進行字符識別。
專利文件1日本公開專利申請第2002-27935號專利文件2日本公開專利申請第H8-123904號但是,在專利文件1公開的字符識別方法中,雖然為每種字體類型都登記參照模式,但是不能以足夠的精度識別字符。這是因為用來識別字符的特征量是不規(guī)則的。專利文件1中描述的特征量包括字符線傾角、環(huán)的數目、線寬度、以及字符面積的那些特征量。但是,在某些情況下,單單這些不足以識別字符。如果為了提高識別率而增加特征量,則識別速度會下降。
另外,在專利文件2中,字符被保存為輪廓線信息。由此,可以與原紙件中相同的形狀獲取字符。但是,所獲取的字符信息不是字符代碼,由此難于在字處理軟件等等中進行再處理。
發(fā)明內容
本發(fā)明提供了字符識別裝置、字符識別方法、以及字符數據,其中消除了上述缺點中的一或多個。
本發(fā)明的優(yōu)選實施例提供了用于字符識別的字符識別裝置、字符識別方法、以及字符數據,利用其可以高精度與高速度識別字符。
本發(fā)明的一個實施例提供了一種字符識別裝置,用來識別通過以光學方式掃描原件而獲得的圖像數據中的字符,該裝置包括字體類型確定單元,被配置來確定所掃描的字符的字體類型;字體大小確定單元,被配置來確定所掃描的字符的字體大?。淮鎯ζ?,用來存儲用于識別對應于所掃描字符的字符代碼的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大??;以及字符識別單元,被配置來通過比較具有字體類型確定單元所確定的字體類型、以及字體大小確定單元所確定的字體大小的字符數據,識別對應于所掃描字符的字符代碼。
本發(fā)明的一個實施例提供了一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符的、按字符預定方向逐行計數的、在像素行中首先出現的黑像素的數目。
本發(fā)明的一個實施例提供了一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據對應于每個字符的、包括關于每個像素為黑還是白的信息的像素字符數據。
本發(fā)明的一個實施例提供了一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符中的多個像素對之間的多個距離。
本發(fā)明的一個實施例提供了一種字符識別方法,用來識別通過以光學方式掃描原件而獲得的圖像數據中的字符,該方法包括以下步驟(a)確定所掃描的字符的字體類型;(b)確定所掃描的字符的字體大小;(c)通過比較具有步驟(a)所確定的字體類型、以及步驟(b)所確定的字體大小的、包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小的字符數據,識別對應于所掃描字符的字符代碼。
根據本發(fā)明的一個實施例,提供了可以利用其以高精度與高速度識別字符的字符識別裝置、字符識別方法、以及用于字符識別的字符數據。
從以下參照附圖的詳細描述中,可以清楚本發(fā)明的其他目的、特征、以及優(yōu)點,其中圖1為包含字符識別裝置的字符識別系統(tǒng)的總體方框圖;圖2為字符識別裝置的硬件配置的例子;圖3為字符識別裝置的功能方框圖;圖4為日語雙字節(jié)字符“漢”的位圖數據的例子;圖5為字符數據的例子;圖6為字符尺度測度的例子;圖7為利用字符的區(qū)別部分的尺度的字符數據的例子;圖8為日語雙字節(jié)字符“合”的不同字體類型的位圖數據;圖9為由字符識別裝置執(zhí)行的字符識別過程的流程圖;圖10A、10B為傾斜方式下掃描的原件的例子;圖11為由字符識別裝置執(zhí)行的識別傾斜字符的過程的流程圖;
圖12為傾斜傾角θ的像素字符數據的例子;圖13為用于創(chuàng)建字符數據的系統(tǒng)的方框圖;圖14為通過使用由字符數據創(chuàng)建單元創(chuàng)建的字符數據來執(zhí)行的字符識別過程的流程圖。
具體實施例方式
以下參照附圖描述本發(fā)明的實施例。根據本發(fā)明的字符識別方法用于根據本發(fā)明的字符識別裝置的實施例;由此,與字符識別裝置的實施例一道描述字符識別方法的實施例。
<第一實施例>
圖1為包含根據本發(fā)明第一實施例的字符識別裝置的字符識別系統(tǒng)的總體方框圖。該字符識別系統(tǒng)包括字符識別裝置1、掃描器2、以及打印機3,其通過網絡4互連,從而相互通信。字符識別裝置1包括以后描述的字符數據5。字符識別裝置1可以與掃描器2集成配置、或者與掃描器2以及打印機3兩者集成配置。掃描器2可以具有傳真功能。
以下給出由字符識別裝置1執(zhí)行的字符識別方法的大概。字符識別裝置1包括字符數據5,其為各種字體類型(例如MS minchou,MS gothic,OSAKA)的每個字符的預定數字化位圖數據。字符數據5根據其字體大小(點數)存儲。
通過獲取每個像素的黑或白值來獲得位圖數據。如果確定了字符的字體類型與字體大小,則字符的位圖數據成為該字體類型與字體大小特有的二進制(黑與白)圖像。相應地,可以利用字符數據5,以非常高的精度識別字符。
掃描器2讀取以特定字體類型的字符打印的原件,并且將所讀取的信息送往字符識別裝置1。字符識別裝置1確定打印字符的字體類型與字體大小,并且通過參照字符數據5來進行字符識別。
掃描器2以光學手段掃描放置在曝光玻璃上的原件。光被照射在原件上,并且反射光被輸入到一維成像設備(例如CCD),由此被轉換為電信號。掃描器2控制光源以及紙傳送的移動速度,同時進行A/D轉換處理,以將電信號轉換為數字數據。通過進行常規(guī)的圖像處理,例如陰影處理、縮放處理、邊沿處理、伽碼處理、以及二進制化處理,從數字數據獲取圖像數據。掃描器2可以為平頭型、或者將文件遞送給固定光源的文件遞送型。
打印機3打印從字符識別裝置1或掃描器2接收的打印數據。由打印機3執(zhí)行的成像方法可以為激光方法、LED方法、液晶快門方法、噴墨方法等等。
圖2為字符識別裝置1的硬件配置的例子。字符識別裝置1例如被配置為計算機。字符識別裝置1包括CPU 11、輸入/輸出設備12、顯示設備13、驅動器設備14、主存儲器15、輔助存儲器16、以及通信設備17,這些通過總線B互連。
輸入輸出設備12處理用戶從鍵盤或者鼠標輸入的各種操作信號,并且控制從掃描器2接收的圖像數據的輸入與輸出、或者送往打印機3的打印數據的輸入與輸出。顯示設備13在顯示器屏幕上顯示GUI(圖形用戶界面),包括操作字符識別裝置1所必須的各種窗口與數據。通信設備17為用于連接到字符識別裝置1的接口,其例如由NIC(網絡接口卡)或者調制解調器實現。
用于操作字符識別裝置1的字符識別程序由記錄介質18(例如存儲卡或者CD-ROM)提供,或者通過網絡4下載。將記錄介質18插入驅動器設備14,并且通過驅動器設備14將數據與程序從記錄介質18安裝到輔助存儲器16中。
輔助存儲器16由硬盤設備或者存儲元件實現,并且保存OS(操作系統(tǒng))、字符數據、程序、文件等等。字符識別程序從輔助存儲器16加載到CPU 11中,并且CPU 11在主存儲器15中展開字符識別程序,以執(zhí)行該字符識別程序。
圖3為字符識別裝置1的功能方框圖。字符識別裝置1包括字體類型確定單元21、字體大小確定單元22、傾斜角度確定單元23、以及字符識別單元24。字體類型確定單元21確定通過掃描器2獲取的圖像數據中字符的字體類型。字體大小確定單元22確定圖像數據中字符的字體大小。傾斜角度確定單元23確定原件或圖像數據相對于主掃描方向的傾斜角度。字符識別單元24通過參照字符數據5,根據所確定的字符的字體類型與字體大小,確定字符的字符代碼。在另一實施例中,字符識別單元24還根據所確定的原件或圖像數據的傾斜角度來確定字符代碼。
字符識別程序使CPU 11發(fā)揮字體類型確定單元21、字體大小確定單元22、傾斜角度確定單元23、以及字符識別單元24的作用。
以下描述字符數據5。圖4為日語雙字節(jié)字符“漢”的位圖數據的例子。在圖4中,字體類型為MS minchou,字體大小為10.5點。位圖數據可以通過向每個像素分配黑與白來指示字符的形狀。因為字符數據5的字符以位圖數據的形式表示,所以可以進行字符識別。
例如,將所掃描原件的字符分為與字符數據5相同數目的像素,并且在所掃描的字符與字符數據5之間比較每個像素,從而確定顏色(黑或白)是否匹配。
在圖4中,像素的數目為256×256(為了簡化,圖4實際所示的像素數目為64×64);但是,當文件以英文編寫時,可以減少像素數目,或者字符可以諸如1024×1024等高清晰度顯示。在圖4中,為了解釋的目的,將左下頂點當作原點。將從原點向右的方向稱為X方向,將向上方向稱為Y方向。其相反方向分別稱為-X方向與-Y方向。
字符數據5的每個字符由不同的字符數據項表示。通過數字化從向左、向右、向上、或者向下方向首先在像素行中出現的黑像素的數目,來表示根據第一實施例的字符數據5的數據項。例如,對于字符“漢”,從左邊在X方向上,計數首先在每個像素行中出現的黑像素的數目,在第四像素行處出現三個黑像素X41、X42、X43。在第五像素行處,除像素X41、X42、X43之外,還出現另一個黑像素X51。黑像素的位置對于每個字符都不同;因此,使用給定方向(例如X方向)上每個像素行中首先出現的黑像素的數目,來確定像素數據項,從而每個字符數據項對應于每個字符特有的識別信息。根據第一實施例,在字符數據項的X方向上首先出現的像素行中的黑像素的數目為(0,0,0,3,1,1,...)。由此,第一實施例中每個字符數據項包括256個數目,每個數目表示首先出現的黑像素的數目。
也可以或者可替換地在Y方向、或者-X方向、或者-Y方向上,計數首先出現的黑像素的數目。例如,當在-Y方向對字符“漢”計數時,在第4像素行處首先出現四個黑像素-Y41、-Y42、-Y43、-Y44。在第5像素行處首先出現的黑像素為-Y51到-Y57。如上所述,可以從單個字符中抽取四個字符數據項,即對應于X方向、Y方向、-X方向、和/或-Y方向的任何方向的一或多個字符數據項。
因此,對于上述的字符數據項,可以從任何方向掃描字符,并且可以在掃描整個字符之前開始字符識別。在掃描整個字符之后,可以通過利用對應于所有四個方向的字符數據項或者對應于這些方向的任何一個或者組合的字符數據項,進行字符識別。
當進行字符識別時,不知道何時開始出現黑像素(換言之,不知道第一個黑像素位于256個像素行的何處)。因此,字符數據項從存在黑像素的像素行開始數字化黑像素的數目。在字符“漢”的情況下,從(0,0,0,3,1,1,...)中省略(0,0,0)。
當字符的字體大小不同時,位圖數據具有稍微不同的形狀,即使在外形字體(outline font)的情況下也如此。例如,相同字符的12點字體大小與10.5點字體大小是不可比的,因為黑像素出現的位置是不同的。在10.5點字體大小的情況下,可能在第四像素行出現一個黑像素,而在12點字體大小的情況下,可能在第四像素行出現兩個黑像素。根據第一實施例的字符數據5的字符數據項根據其字體大小存儲。字體大小可以為一般使用的清晰度,例如8、9、10、10.5、11、12、14、16、18、20點。
圖5為字符數據5的例子。在圖5中,與字體大小與字體類型相關聯(lián)地提供出現在四個方向上的黑像素的數目。可以理解,字符數據5還包括其他字體大小的數據。
在圖5中,計數從白反轉到黑的像素的數目;但是,可以計數從黑反轉到白的像素的數目,并且將其用于字符數據5。
字符識別裝置1根據字體大小進行字符識別,從而可以配置字符數據5以包括字符區(qū)別部分的尺度。圖6為字符尺度測度的例子。該例子中,垂直與水平尺度決定了字符的總體大小。
如圖6所示,可以由黑像素的連貫部分劃分字符的位圖數據。在字符“漢”的情況下,左部分具有三劃,即三個連貫部分,右部分在頂部與底部具有兩個連貫部分。從每個連貫部分中抽取相距最遠的兩個像素,其間的距離對應于字符數據。在圖6中,長度1至3指示左側三劃的每一個中相距最遠的兩個像素的尺度,長度4與5指示右頂部連貫部分以及右底部連貫部分中相距最遠的兩個像素的尺度。
可以使用連貫部分之間的間距,作為字符數據。例如,獲取連貫部分邊沿像素之間的間距。在圖6中,第一劃與第二劃的邊沿部分之間的間距為dis1與dis 3,第二劃與第三劃的邊沿部分之間的間距為dis 2,第一劃與第三劃的邊沿部分之間的間距為dis 4,第二劃與第三劃的邊沿部分之間的另一間距為dis 5。在圖6中,抽取連貫部分右側上的邊沿部分之間的間距、以及連貫部分左側上的邊沿部分之間的間距;但是,可以理解,可以抽取一個連貫部分右側與另一個連貫部分左側之間的間距。類似地,也可以抽取左側與右頂部連貫部分以及右底部連貫部分上每個筆劃之間的間距。另外,可以計算每個連貫部分的外切矩形,并且可以使用外切矩形的對角線作為字符數據。
另外,可以抽取垂直方向或水平方向中的兩個像素,并且可以使用這兩個像素之間的間距作為字符數據。在“漠”的位圖數據中,最左像素行包含三個黑像素,最右像素行包含兩個黑像素。從最左像素行與最右像素行中抽取像素,并且抽取其間的距離。在圖6中,最左像素行與最右像素行中兩個頂部像素之間的距離為LR1,最左像素行與最右像素行中兩個底部像素之間的距離為LR2。
另外,在“漠”的位圖數據中,最頂部像素行包含四個黑像素,最底部像素行包含六個黑像素。從最頂部像素行與最底部像素行中抽取像素,并且抽取其間的距離。在圖6中,抽取最頂部像素行與最底部像素行中最左像素,并且其間的距離為TB1,抽取最頂部像素行與最底部像素行中最右像素,并且其間的距離為TB2。
圖7為利用字符的區(qū)別部分的尺度的字符數據5的例子。字體類型與字體大小與圖5所示的相同。另外,存儲垂直方向、水平方向、連貫部分1至n(在“漢”的情況下,n=5)、垂直方向上的像素間距、以及水平方向上的像素間距的尺度。
在第一實施例中,可以用表示絕對距離的單位(例如mm,cm等等)而非像素數來指示尺度。根據第一實施例的字符數據5根據字體大小存儲。通過以絕對值表示字符連貫部分的尺度,可以高精度進行字符識別。
除圖6與7所示的尺度之外,或者可替換地,可以使用角度作為指示字符區(qū)別部分的參數。在圖6中,獲得連接兩個像素的直線來抽取尺度,因此,可以使用該直線與另一直線來獲得角度。例如,可以獲得由dis 1與dis 3形成的角度,或者由dis 1與length 5(長度5)形成的角度。因此,通過不僅使用尺度,而且使用由字符中區(qū)別部分的尺度形成的角度,可以更高的精度進行字符識別。
接著,描述確定在所掃描的原件上打印的字符的字體類型的方法。假設當確定字體大小時已經確定了字體大小。
圖8為日語雙字節(jié)字符“合”的不同字體類型的位圖數據。在圖8中,顯示字體類型MS minchou、MS gothic、以及HG楷書作為例子如圖8所示,線寬度、黑像素的比例、以及形狀在MS minchou、MS gothic、以及HG楷書之間顯著不同。字體類型確定單元21根據線寬度等等確定字體類型。
就線寬度與黑像素的比例而言,字體類型滿足以下條件MS minchou<HG楷書<MS gothic。在圖8中,在每種字體類型中指示四個部分作為線寬度??梢愿鶕鶔呙璧淖址胁煌€寬度的平均寬度確定字體類型。也可以根據不同字符的線寬度的平均寬度確定字體類型。
當使用黑像素的比例來確定字體類型時,檢測所掃描字符的外切矩形,并且根據相對于外切矩形的面積的黑像素比例,確定字體類型。黑像素比例對于每個字符都不同。字體類型確定單元21獲取例如一行或一頁中字符的黑像素比例,平均所獲得的這些比例,并且根據該平均比例確定字體類型。
字體類型確定單元21可以根據例如一個筆劃內線寬度的變化來確定字體類型。在MS gothic中,一個筆劃內線寬度基本恒定。但是,在HG楷書中,一個筆劃的線寬度有顯著變化。因此,可以通過計算從一個筆劃的開始點(例如A1、B1、C1)到結束點(例如A2、B2、C2)的線寬度變化率來確定字體類型。
字符數據5包括指示與字體大小與字體類型相關的線寬度、黑像素比例、以及線寬度變化率的信息。因此,一旦確定了字體大小,就可以容易地確定字體類型。
圖9為由具有上述配置的字符識別裝置1執(zhí)行的字符識別過程的流程圖。將原件置于掃描器2之上,以依次掃描,并且將圖像數據依次送往字符識別裝置1。
首先,掃描原件的第一行以確定字體大小與字體類型(步驟S11)。當檢測到沒有任何字符的行間(其指示已經掃描了第一行)時,字體大小確定單元22確定字體大小(步驟S12)??梢杂萌魏畏椒▉泶_定字體大小,例如通過獲得圍繞行中每個字符的外切矩形,并且根據(多個)外切矩形的大小來確定字體大小。外切矩形一般對每個字符不同,即使字體大小相同也如此。由此,獲得幾個字符的外切矩形的平均大小,并且根據平均大小來確定字體大小。已知原件的大小,因此,可以根據相對于原件大小的外切矩形大小來確定字體大小。另外,可以根據成像設備檢測的像素數目,通過檢測外切矩形,來確定字體大小。
字體類型確定單元21確定字體大小(步驟S13)。如上所述,一旦確定了字體大小,就可以根據在字符數據5中包含的諸如線寬度等信息確定字體類型。
字符識別裝置1確定原件的方向,即字符的走向(步驟S14)。在置于掃描器2中的原件上打印的字符的走向是未知的。字符識別裝置1根據字符的形狀,確定字符的走向。例如,根據每個字符的外切矩形的垂直/水平比例、直線的方向、以及線邊沿的方向等等,確定字符的走向。可以通過利用參照模式的任何模式匹配方法進行字符識、并且檢測其中可以識別字符的方向,來確定方向。
字符識別單元24通過利用字符數據5,對第一行中的字符進行字符識別(步驟S15)。字符識別單元24通過參照字符數據5,根據所確定的字體類型與字體大小,來識別字符。已經掃描了第一行。字符識別單元24可以使用圖5所示四個方向的字符數據項中的任何一個,和/或字符的尺度,例如間距和/或角度。
字符識別裝置1確定是否對所有行都完成了字符識別(步驟S16),如果沒有(步驟S16中的“否”),則字符識別裝置1掃描下一行(步驟S17),并且進行字符識別(步驟S18)。
已經在第一行的字符識別過程中確定了字體類型與字體大小,因此從第二行以及其后,可以在讀取整行之前開始字符識別。已知字符的走向,從而根據走向,對應于參照圖5所述的X方向、Y方向、-X方向、-Y方向中的任何一個抽取字符數據。因此,可以在主掃描方向上逐行地抽取字符識別的候選。例如,當在掃描的同時檢測到三個黑像素首先在一行中出現時,抽取字符數據項第一行處指示三個黑像素的字符作為候選。接著,當在掃描的同時檢測到出現五個黑像素時,從先前抽取的那些候選字符中,抽取在字符數據項第二行處指示五個黑像素的候選字符。根據第一實施例,可以在讀取整個字符之前開始字符識別,從而加速字符識別過程。當完成了所有行的字符識別時,圖9所示流程圖的處理結束。
當掃描整行后進行字符識別時,可以通過例如X方向、Y方向、-X方向、或-Y方向的字符數據中的任何一個來進行字符識別,或者可以組合地使用這些中的多個字符數據項。
在圖9的過程中,使用圖5所示的字符數據進行字符識別;但是,也可以除圖5所示的字符數據之外,或者作為其替換地使用圖6與7所示的字符的區(qū)別部分的尺度及其之間的角度來進行字符識別。當使用尺度時,優(yōu)選地是在掃描整行之后、然后使用尺度來進行字符識別;但是,可以在掃描整行之前,根據掃描區(qū)域中可用于抽取的尺度,逐步縮窄候選字符。
根據第一實施例,按照字體類型與字體大小,預先存儲字符數據。按照足夠水平清晰度上的每個像素,將字符數據與所掃描文件的字符比較。因此,可以非常高的精度識別字符。另外,預先存儲的字符數據只需要包含經常使用的字體類型(例如,MS minchou,MS gothic,HG楷書)以及經常使用的字體大小(例如,10.5點,12點),從而防止字符數據量過大。另外,在掃描第一行、并且確定字體大小與字體類型之后,可以在讀取整個字符之前,對每個字符開始進行字符識別,因此,可以加快識別速度。
<第二實施例>
第二實施例描述了即使當所掃描的字符是傾斜的時也能夠以與第一實施例相同的方式進行字符識別的字符識別裝置。根據第二實施例的字符數據具有與第一實施例不同的配置。根據第二實施例的字符識別裝置的系統(tǒng)配置與功能塊與第一實施例的相同。
在圖4所示的字符的位圖數據中,向256×256個像素的每一個分配黑或白(此后,“像素字符數據”)。通過利用像素字符數據本身作為用于字符識別的字符數據,可以進一步提高識別準確性。更具體地,確定位圖數據的原點在任意位置上,并且在256×256個像素的每一個中存儲為1(黑像素)或0(白像素)的比特。根據第二實施例的字符識別裝置1根據字體類型與字體大小存儲像素字符數據??梢栽谑褂弥敖鈮河糜谧址R別的像素字符數據。除此之外,還可以壓縮像素字符數據以減少文件量。
當所掃描的原件為傾斜時,如圖10A所示,讀取字符時其相對于一維成像設備的主掃描方向傾斜。圖10B為當所掃描的原件傾斜從而字符是傾斜的時的圖像數據的例子;這改變了其上首先出現黑像素的像素的位置。根據第二實施例的字符識別裝置檢測原件的傾斜角度,根據所檢測的傾斜角度傾斜字符數據的像素字符數據,并且進行字符識別。
圖11為由字符識別裝置1執(zhí)行的識別傾斜字符的過程的流程圖。與圖9所示相同的步驟以相同的步驟標號表示。
首先,掃描原件的第一行(步驟S11)。傾斜角度確定單元23根據對應于第一行的圖像數據,檢測傾斜角度(步驟S20)??梢匀魏畏椒z測傾斜角度。例如,傾斜角度確定單元23可以用假定基線的連接行中字符的基底部分(最底部部分),并且計算基線與主掃描方向之間的角度θ。如果檢測到原件插入的角度,則也可以獲取作為文件插入方向與主掃描方向之間角度的傾斜角度。
接著,字符識別裝置1按照傾斜角度θ糾正通過掃描原件的第一行而獲得的第一行的圖像數據的傾斜,并且例如以與第一實施例相同的方式確定字體大小、字體類型、以及字符走向(步驟S12至步驟S14),并且根據圖5或7所示的字符數據,對第一行中的字符進行字符識別(步驟S15)。也可以通過根據像素字符數據確定每個像素為黑還是白,來對第一行中的字符進行字符識別。
接著,字符識別單元24將字符數據傾斜傾斜角度θ(步驟S21)。例如,將圖12所示的實線中的像素字符數據傾斜傾斜角度θ,從而獲得虛線指示的虛框。通過對像素字符數據執(zhí)行該過程,即使當原件傾斜時,虛框的一側也會匹配主掃描方向,從而可以使用傾斜后的像素字符數據進行字符識別。
例如,如果虛框的側A匹配主掃描方向,則可以通過從側A開始、計數每行中出現的黑像素,以與第一實施例中的字符數據相同的方式使用像素字符數據。
步驟S21之后,執(zhí)行與圖9所示的相同的步驟。即,從第二行向后,字符識別單元24可以在掃描整個行之前開始進行字符識別。已經知道了字符走向與傾斜角度θ,因此可以根據傾斜了傾斜角度θ的像素字符數據,在主掃描方向上逐行地抽取用于字符識別的候選字符。
根據第二實施例,即使當原件是傾斜的時,也可以在讀取整個字符之前開始進行字符識別。因此,可以加速字符識別過程。當對所有行完成字符識別時,圖11所示的流程圖的過程結束。
在第二實施例中,獲得了與第一實施例相同的效果,另外,即使當原件是傾斜的時,也可以通過使字符數據符合傾斜角度,以高速進行字符識別。如果在掃描整行之后進行字符識別,則可以在字符識別之前糾正對應行的圖像數據的傾斜。在這種情況下,可以通過利用根據第一實施例的字符數據,或者通過利用沒有被傾斜的像素字符數據,來進行字符識別。
在使用像素字符數據的情況下,對于每個像素位置確定每個像素為黑還是白,這與確定黑像素出現的次數不同。因此,可以更高的精度進行字符識別。
<第三實施例>
在第一與第二實施例中,預先在字符識別裝置1中存儲字符數據或者像素字符數據。但是,可以根據待識別的字符的字體類型或者字體大小來生成字符數據。
圖13為用于創(chuàng)建字符數據的系統(tǒng)的方框圖。通過作為計算機的字符識別裝置1來實現該系統(tǒng)。
一般地,由OS提供的多個字體數據31項被存儲在對應于字符識別裝置1的個人計算機中。在字體數據31中,與字符代碼相關聯(lián)地存儲外形字體數據與位圖數據。還提供字符33的字體與走向以進行字符識別。
當應用軟件指定預定字符代碼的字符的字體類型與字體大小時,格柵化器32根據字符代碼、字體類型、以及字體大小,生成位圖數據34。
將位圖數據34分為預定像素(例如256×256),如圖4所示,其中在每個像素中分配黑或白。具體地,字符數據創(chuàng)建單元36將位圖數據34分為預定像素,并且向每個像素位置分配黑或白,由此生成像素字符數據。字符數據創(chuàng)建單元36也可以根據分為像素的位圖數據34或者像素字符數據,生成指示出現的黑像素的數目的字符數據。像素字符數據與字符數據由圖13中的35表示。
圖14為通過使用由字符數據創(chuàng)建單元36創(chuàng)建的字符數據來執(zhí)行字符識別過程的流程圖。與圖9所示相同的步驟以相同的步驟標號表示。
首先,根據通過掃描原件的第一行而獲得的圖像數據,確定字符的字體大小與走向(步驟S11、S12、S13),并且進行字符識別(步驟S30)。按照使用參照模式的模式匹配方法,進行步驟S30中的字符識別。相應地,第一行的字符識別的識別率為預定精度。
字體類型確定單元21確定第一行中字符的字體類型(步驟S31)。已經識別了第一行中的字符,從而格柵化器32可以生成對應于所識別的字符代碼的多種字體類型的字符的位圖數據。再次對第一行中字符進行模式匹配,這次使用不同字體類型的位圖數據。字體類型確定單元21確定與字符匹配的字體類型作為原件中使用的字體類型。
當確定了字體類型時,字符數據創(chuàng)建單元36創(chuàng)建對應于所確定的字體類型與字體大小的字符數據與像素字符數據(步驟S32)。因此,以與第一與第二實施例相同的方式獲取字符數據。
步驟S32之后,進行與第一實施例相同的那些步驟。即,利用所創(chuàng)建的字符數據進行字符識別(步驟S17、S18),直到對所有行完成了處理(步驟S16)。字符數據或像素字符數據指示每個像素為黑像素還是白像素,因此,可以非常高的精度識別字符。
根據第三實施例,即使當在原件上打印的字符是不常用的字體類型時,也可以識別字體類型并且創(chuàng)建字符數據。因此,可以非常高的精度識別許多種字體的字符。
本發(fā)明不限于具體公開的實施例,并且在不脫離本發(fā)明的范圍的前提下可以進行變動與修改。
本申請基于2005年10月28日提交的日本優(yōu)選權專利申請第2005-315074號,其全部內容通過引用融入本文。
權利要求
1.一種字符識別裝置,用來識別通過以光學方式掃描原件而獲得的圖像數據中的字符,該裝置包括字體類型確定單元,被配置來確定所掃描的字符的字體類型;字體大小確定單元,被配置來確定所掃描的字符的字體大小;存儲器,用來存儲用于識別對應于所掃描字符的字符代碼的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大??;以及字符識別單元,被配置來通過比較具有字體類型確定單元所確定的字體類型、以及字體大小確定單元所確定的字體大小的字符數據,識別對應于所掃描字符的字符代碼。
2.如權利要求1所述的裝置,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符的、按字符預定方向逐行計數的、在像素行中首先出現的黑像素的數目。
3.如權利要求2所述的裝置,其中所述預定方向為以下中的至少一個或者其組合向左方向、向右方向、向上方向、以及向下方向。
4.如權利要求1所述的裝置,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據對應于每個字符的、包括關于每個像素為黑還是白的信息的像素字符數據。
5.如權利要求1所述的裝置,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符中的多個像素對之間的多個距離。
6.如權利要求4所述的裝置,還包括傾斜角度確定單元,被配置來確定原件傾斜的傾斜角度;其中在根據由傾斜角度確定單元確定的傾斜角度將像素字符數據傾斜之后,字符識別單元識別對應于所掃描字符的字符代碼。
7.如權利要求1所述的裝置,還包括字符數據創(chuàng)建單元,被配置來基于從定義所掃描的字符的字體數據生成的位圖數據創(chuàng)建附加字符數據;其中字符數據創(chuàng)建單元基于表示其字體類型由字體類型確定單元確定的、并且其字體大小由字體大小確定單元確定的、所掃描的字符的位圖數據來創(chuàng)建附加字符數據;以及字符識別單元通過比較由字符數據創(chuàng)建單元以字體類型確定單元確定的字體類型、以及由字體大小確定單元確定的字體大小創(chuàng)建的字符數據,來識別對應于所掃描字符的字符代碼。
8.一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符的、按字符預定方向逐行計數的、在像素行中首先出現的黑像素的數目。
9.如權利要求8所述的字符數據,其中所述預定方向為以下中的至少一個或者其組合向左方向、向右方向、向上方向、以及向下方向。
10.一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據對應于每個字符的、包括關于每個像素為黑還是白的信息的像素字符數據。
11.一種用于識別通過以光學方式掃描原件而獲得的圖像數據中的所掃描字符的字符數據,該字符數據包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據包括每個字符中的多個像素對之間的多個距離。
12.一種字符識別方法,用來識別通過以光學方式掃描原件而獲得的圖像數據中的字符,該方法包括以下步驟(a)確定所掃描的字符的字體類型;(b)確定所掃描的字符的字體大??;(c)通過比較具有步驟(a)所確定的字體類型、以及步驟(b)所確定的字體大小的、包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小的字符數據,識別對應于所掃描字符的字符代碼。
13.如權利要求12所述的字符識別方法,其中所掃描字符由被分為預定數目的像素的位圖數據表示,并且字符數據對應于每個字符的、按字符預定方向逐行計數的、在像素行中首先出現的黑像素的數目,所述預定方向為以下中的至少一個或者其組合向左方向、向右方向、向上方向、以及向下方向,或者每個字符的、包括關于每個像素為黑還是白的信息的像素字符數據,或者每個字符中的多個像素對之間的多個距離。
全文摘要
公開了一種用來識別通過以光學方式掃描原件而獲得的圖像數據中的字符的技術。確定所掃描的字符的字體類型與字體大小。通過比較具有所確定的字體類型與字體大小的、包括與對應于字符的字符代碼相關聯(lián)地存儲的字體類型與字體大小的字符數據,識別對應于所掃描字符的字符代碼。
文檔編號G06K9/62GK1955981SQ20061014256
公開日2007年5月2日 申請日期2006年10月30日 優(yōu)先權日2005年10月28日
發(fā)明者鯉沼敦 申請人:株式會社理光