專利名稱:圖像處理裝置和圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置和圖像處理方法。
背景技術(shù):
在相關(guān)技術(shù)領(lǐng)域中,已經(jīng)知道從圖像中切出字符的技術(shù)。作為其中一項技術(shù),JP-A-62-190575披露了字符圖案切出裝置,該裝置從以字符接字符的形式寫在紙張上的字符串(例如文檔)中切出字符圖案。字符圖案切出裝置包括掃描單元、字符串圖案存儲單元、基本圖案區(qū)檢測單元、字形估算值計算單元、字符識別字典存儲單元、字符識別估算值計算單元、估算值加法單元、字符切出單元和輸出單元。掃描單元通過光掃描紙張上的字符串來進行光電轉(zhuǎn)換。字符串圖案存儲單元存儲光電轉(zhuǎn)換后的字符串的圖案。基本圖案區(qū)檢測單元基于通過沿著與字符串方向垂直的方向掃描字符串圖案而獲得的周圍分布值的連續(xù)性來分割字符串圖案,并且根據(jù)由分割而得到的基本圖案的左右端坐標和上下端坐標來確定參考圖案區(qū)。字形估算值計算單元根據(jù)基本圖案區(qū)的左右端坐標和上下端坐標,來計算單個基本圖案區(qū)的字形估算值和組合圖案區(qū)(如多個連續(xù)的基本圖案區(qū)的組合)的字形估算值。字符識別字典存儲單元存儲待讀取的字符的參考圖案。字符識別估算值計算單元基于與存儲在字符識別字典存儲單元中的參考圖案的匹配, 來獲得單個基本圖案的字符識別估算值和組合圖案(如多個連續(xù)的基本圖案的組合)的字符識別估算值。估算值加法單元通過將由字形估算值計算單元計算出的字形估算值與由字符識別估算值計算單元計算出的字符識別估算值相加,來計算與所有基本圖案和組合圖案對應(yīng)的字符估算值。字符切出單元基于基本圖案區(qū)的位置信息來獲取候選切出位置的所有可能的組合,基于由估算值加法單元獲得且與候選切出位置切出的基本圖案和組合圖案對應(yīng)的字符估算值來獲取候選切出位置的各個組合的切出估算值,并且基于切出估算值確定最佳字符切出位置的組合。輸出單元基于字符切出單元的結(jié)果,從存儲在字符串圖案存儲單元中的一行字符串圖案中,以字符接字符的形式切出并且輸出字符圖案。
發(fā)明內(nèi)容
本發(fā)明旨在提供以下圖像處理裝置和圖像處理方法,在識別圖像中的字符時,能夠防止被識別的字符串僅基于一個字符圖像的識別結(jié)果而被確定。[1]根據(jù)本發(fā)明的一方面,圖像處理裝置包括切出位置提取單元、候選字符提取單元、圖生成單元、鏈接值生成單元、路徑選擇單元和輸出單元。切出位置提取單元提取切出位置以從圖像中分割字符圖像。候選字符提取單元為每個由切出位置提取單元提取的切出位置所分割的各個字符圖像的識別每個字符,并且為各個被識別字符提取多個候選字符。 圖生成單元將由候選字符提取單元提取的多個候選字符中的每一個設(shè)定為節(jié)點,并且通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖。鏈接值生成單元基于字符串罩(hood)的值來生成鏈接值,所述字符串罩的值表示通過鏈接而連接的節(jié)點的候選字符之間的關(guān)系。 路徑選擇單元基于由鏈接值生成單元生成的鏈接值,來在由圖生成單元生成的圖中選擇路徑。輸出單元輸出所述路徑選擇單元選擇的路徑中的候選字符串,作為圖像處理裝置的字符識別結(jié)果。[2]在根據(jù)第[1]方面所述的圖像裝置中,在處理過程中,所述路徑選擇單元使用動態(tài)編程方法基于鏈接值之和來選擇路徑,同時刪除和減少路徑。[3]在根據(jù)第[1]方面或第[2]方面所述的圖像處理裝置中,鏈接值生成單元基于表示構(gòu)成鏈接的節(jié)點的字符罩的值,來生成鏈接值。[4]在根據(jù)第[1]方面至第[3]方面中任一方面所述的圖像處理裝置中,切出位置提取單元提取多個切出位置。圖生成單元將多個候選字符中的每一個設(shè)定為節(jié)點。為由切出位置提取單元提取的多個切出位置所分割的每個字符圖像識別出多個候選字符中的每一個候選字符。圖生成單元通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖。[5]根據(jù)本發(fā)明的另一方面,一種圖像處理方法包括提取切出位置以從圖像中分割字符圖像;為由所提取的切出位置分割的每個字符圖像的識別每個字符;為每個被識別的字符提取多個候選字符;將所提取的多個候選字符中的每一個設(shè)定為節(jié)點;通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖;基于字符串罩的值來生成鏈接值,所述字符串罩的值表示通過鏈接而連接的節(jié)點的候選字符之間的關(guān)系;基于所生成的鏈接值在所生成的圖中選擇路徑;輸出所選擇路徑中的候選字符串,作為所述圖像處理方法的字符識別結(jié)^ ο根據(jù)第[1]方面的圖像處理裝置,在識別圖像中的字符時,可以防止被識別的字符串僅基于一個字符圖像的識別結(jié)果而被確定。根據(jù)第[2]方面的圖像處理裝置,與不具有該構(gòu)造的圖像處理裝置相比,可以減少處理負擔。根據(jù)第[3]方面的圖像處理裝置,可以利用表示字符串罩的值和表示字符罩的值來生成鏈接值。根據(jù)第[4]方面的圖像處理裝置,可以輸出多個切出位置的字符識別結(jié)果。根據(jù)第[5]方面的圖像處理裝置,在識別圖像中的字符時,可以防止被識別的字符串僅基于一個字符圖像的識別結(jié)果而被確定。
將基于附圖詳細描述本發(fā)明示例性實施例,其中圖1是根據(jù)本實施例的構(gòu)造實例的概念性模塊構(gòu)造視圖;圖2是鏈接值生成模塊的構(gòu)造實例的概念性模塊構(gòu)造視圖;圖3是路徑選擇模塊的構(gòu)造實例的概念性模塊構(gòu)造視圖;圖4是示出根據(jù)本實施例的處理實例的流程圖;圖5是示出存在多個候選字符的圖的實例的說明性視圖;圖6是示出標號實例的說明性視圖;圖7是示出標號實例的說明性視圖;圖8是示出標號實例的說明性視圖;圖9是示出標號實例的說明性視圖;圖10是示出標號實例的說明性視圖11是示出利用內(nèi)節(jié)點信息的實例的說明性視圖;圖12A和圖12B是示出節(jié)點和鏈接的實例的說明性視圖;圖13是示出存在多個字符切出位置時的處理實例的說明性視圖;圖14是示出標號實例的說明性視圖;圖15是示出存在多個字符切出位置時的處理實例的說明性視圖;圖16A、圖16B、圖16C、圖16D、圖16E、圖16F和圖16G是示出加權(quán)實例的說明性視圖;圖17是示出加權(quán)確定模塊的模塊構(gòu)造實例的說明性視圖;圖18是示出加權(quán)實例的說明性視圖;圖19是示出權(quán)重實例的說明性視圖;圖20A、圖20B、圖20C、圖20D、圖20E、圖20F和圖20G是示出加權(quán)實例的說明性視圖;圖21是示出加權(quán)確定模塊的模塊構(gòu)造實例的說明性視圖;圖22是示出用計算機實現(xiàn)本實施例時的硬件配置的實例的框圖;圖23是示出字符串圖像的實例的說明性視圖;圖M是示出候選字符邊界的實例的說明性視圖;圖25是示出外接矩形的實例的說明性視圖;圖沈々、圖^B、圖26C和圖26D是示出字符切出結(jié)果的實例的說明性視圖;圖27是示出表示字符切出位置的圖解表述的實例的說明性視圖;圖觀是示出圖解表述的圖案的實例的說明性視圖;圖四是示出圖的實例的說明性視圖。
具體實施例方式本實施例涉及在包括字符串的圖像中確定字符識別的結(jié)果。在說明本實施例之前,首先對說明前提或使用本實施例的圖像處理裝置進行說明。本說明是為了使本實施例易于理解。例如,將對圖觀中所示的字符串圖像進行描述。首先,將該字符串分割成字符段。 文中所述的短語“字符段”涉及可能為字符本身或字符的一部分的字符部分。下面,將舉例說明圖觀中所示的橫向書寫的字符串圖像。用豎線(或大致豎直的線)將橫向書寫的圖像分割成字符段。例如,用圖M中所示的豎線(候選切分線MlO和候選切分線2420)將字符串圖像分割成3個字符段“〃 ”、“ t”和“學(xué)”。將圖M中所示的豎線稱為“候選切分線”。候選切分線2410分開“彳,,和“匕,,,候選切分線2420分開“匕,,和“學(xué)”。下面,如圖25所示,各個外接矩形(外接矩形2510、外接矩形2520和外接矩形 2530)提取出字符段。下面,舉例說明JP-A-62-190575中披露的技術(shù)內(nèi)容。盡管以下說明中使用的術(shù)語有時與JP-A-62-190575中使用的術(shù)語不一樣,但技術(shù)內(nèi)容與JP-A-62-190575的技術(shù)內(nèi)容相同。將上述字符段組合來確定字符圖像。在一些情況下,可以將多個字符段組合來形成一個字符圖像,或者在另外一些情況下,一個字符段可以形成一個字符。由于確定字符圖像相當于確定字符切出位置,因而,確定字符圖像有時可以稱為確定字符切出位置。存在多種字符段組合圖案。在這些圖案中,通過選擇具有最高字符圖像估算值的圖案來確定最終字符切出位置。圖26A至圖26D所示實例示出了圖25所示實例的所有字符切出圖案。具體而言, 圖2隊的實例作為第一圖案示出了三個字符圖像(外接矩形2510、外接矩形2520和外接矩形2530),圖^B的實例作為第二圖案示出了兩個矩形圖像(外接矩形2510和2520,以及外接矩形2530),圖^C的實例作為第三圖案示出了一個字符圖像(外接矩形2510、2520 和2530),以及圖^D的實例作為第四圖案示出了兩個字符圖像(外接矩形2510和外接矩形 2520 和 25030)。圖26A至圖^D的實例所示的多種切出圖案可以由描述字符切出位置的圖來表示。在圖27的實例中,圖包括四個節(jié)點起始節(jié)點2700、終點節(jié)點2790、中間節(jié)點2710(第一節(jié)點)和中間節(jié)點2720(第二節(jié)點),以及使節(jié)點之間相互連接的弧線(此處節(jié)點之間的連接線稱為弧線)。起始點與字符串圖像的左端點對應(yīng),并且終點與字符串圖像的右端點對應(yīng)。中間節(jié)點2710(第一節(jié)點)和中間節(jié)點2720(第二節(jié)點)表示各個候選字符段位置 (如圖M所示,分別為候選段MlO和候選段對20)。中間節(jié)點2710(第一節(jié)點)與候選段 2410對應(yīng),而中間節(jié)點2720 (第二節(jié)點)與候選切分線M20對應(yīng)。下文中將從起點經(jīng)過節(jié)點到達終點的路線稱為“路徑”。路徑包括一條或多條弧線。通常,存在多條路徑。圖26A至圖26D實例中示出的字符切出圖案與這些路徑對應(yīng)。例如,圖^B的實例中所示的第二圖案與圖28中用粗線所示的路徑(字符切出圖案2704和字符切出圖案2722)對應(yīng)。此處,一個候選字符圖像與一條弧線對應(yīng)。例如,字符圖像(字符切出圖案 2704) “化”與連接起始節(jié)點2700和中間節(jié)點2720(第二節(jié)點)的弧線對應(yīng)。對于與一條弧線對應(yīng)的字符,可以確定該字符的估算值。該估算值稱為“弧線估算值”。弧線估算值基于字形信息和字符識別精度等來計算。存在多種弧線估算值計算方法,例如(1) JP-A-9-185681、(2) JP-A-8-161432、(3) JP-A-10-154207、(4) JP-A-61-175878、 (5) JP-A-3-037782 和(6) JP-A-11_20;3406 等所披露的計算方法。一條路徑包括多個弧線。由弧線構(gòu)成的路徑的估算值可以基于多個弧線估算值來計算。文中稱為“路徑估算值”。從多條路徑中選擇具有最高路徑估算值的一條路徑來確定字符切出位置。路徑選擇允許確定字符切出位置和切出字符,同時可以確定被切出字符的識別結(jié)果(字符圖像)。例如,假定選擇了圖觀的實例中的粗線路徑。在該情況下,字符切出位置與三個節(jié)點對應(yīng),即起始節(jié)點2700、中間節(jié)點2720(第二節(jié)點)和終點節(jié)點2790。所確定的字符識別結(jié)果與“化”(字符切出圖案2704)和“學(xué)”(字符切出圖案2722)對應(yīng)。將對路徑估算值計算方法進行說明。基于弧線估算值的加權(quán)之和來大致計算路徑估算值。假定Vi表示第i條弧線的弧線估算值,Wi表示第i條弧線估算值的權(quán)重,N表示弧線數(shù)量,并且P表示路徑估算值,P由以下等式(1)表示。[等式1]
權(quán)利要求
1.一種圖像處理裝置,包括切出位置提取單元,其提取切出位置以從圖像中分割字符圖像; 候選字符提取單元,其為每個由所述切出位置提取單元提取的切出位置所分割的字符圖像識別每個字符,并且為每個被識別的字符提取多個候選字符;圖生成單元,其將由所述候選字符提取單元提取的多個候選字符中的每一個設(shè)定為節(jié)點,并且通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖;鏈接值生成單元,其基于字符串罩的值來生成鏈接值,所述字符串罩的值表示通過鏈接而連接的節(jié)點的候選字符之間的關(guān)系;路徑選擇單元,其基于由所述鏈接值生成單元生成的鏈接值在由所述圖生成單元生成的圖中選擇路徑;以及輸出單元,其輸出所述路徑選擇單元選擇的路徑中的候選字符串,作為所述圖像處理裝置的字符識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的圖像處理裝置,其中,在處理過程中,所述路徑選擇單元使用動態(tài)編程方法基于鏈接值之和來選擇路徑,同時刪除和減少路徑。
3.根據(jù)權(quán)利要求1或2所述的圖像處理裝置,其中,所述鏈接值生成單元基于表示構(gòu)成鏈接的節(jié)點的字符罩的值,來生成鏈接值。
4.根據(jù)權(quán)利要求1或2所述的圖像處理裝置,其中, 所述切出位置提取單元提取多個切出位置,所述圖生成單元將多個候選字符中的每一個設(shè)定為節(jié)點,為由所述切出位置提取單元提取的多個切出位置所分割的每個字符圖像識別出多個候選字符中的每一個候選字符;以及所述圖生成單元通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖。
5.一種圖像處理方法,包括提取切出位置以從圖像中分割字符圖像; 為由所提取的切出位置分割的每個字符圖像識別每個字符; 為每個被識別的字符提取多個候選字符; 將所提取的多個候選字符中的每一個設(shè)定為節(jié)點; 通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖;基于字符串罩的值來生成鏈接值,所述字符串罩的值表示通過鏈接而連接的節(jié)點的候選字符之間的關(guān)系;基于所生成的鏈接值在所生成的圖中選擇路徑;以及輸出所選擇路徑中的候選字符串,作為所述圖像處理方法的字符識別結(jié)果。
全文摘要
本發(fā)明公開了一種圖像處理裝置和圖像處理方法。所述圖像處理裝置包括切出位置提取單元、候選字符提取單元、圖生成單元、鏈接值生成單元、路徑選擇單元和輸出單元。切出位置提取單元提取切出位置。候選字符提取單元識別由所述切出位置所分割的各個字符圖像的每一個字符,并且為各個被識別字符提取多個候選字符。圖生成單元將提取的多個候選字符中的每一個設(shè)定為節(jié)點,并且通過在相鄰字符圖像的節(jié)點之間建立鏈接來生成圖。鏈接值生成單元基于表示候選字符之間的關(guān)系的字符串罩的值來生成鏈接值。路徑選擇單元基于鏈接值在圖中選擇路徑。輸出單元輸出所選路徑中的候選字符串。
文檔編號G06K9/72GK102479332SQ20111012921
公開日2012年5月30日 申請日期2011年5月18日 優(yōu)先權(quán)日2010年11月30日
發(fā)明者木村俊一 申請人:富士施樂株式會社