欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文檔圖像處理裝置、文檔圖像處理方法、及存儲計算機程序的命令的可計算機讀出的存儲介質(zhì)的制作方法

文檔序號:6354703閱讀:220來源:國知局
專利名稱:文檔圖像處理裝置、文檔圖像處理方法、及存儲計算機程序的命令的可計算機讀出的存儲介質(zhì)的制作方法
技術領域
本發(fā)明所說明的實施方式(多數(shù)形式)全部涉及文檔圖像處理裝置、文檔圖像處理方法、及存儲計算機程序的命令的可計算機讀出的存儲介質(zhì)。
背景技術
利用掃描儀等將帳票等文檔變換為數(shù)字數(shù)據(jù)時,由于使數(shù)據(jù)量減少等目的而多作為黑白圖像或灰色標度圖像保存。但是,近年由于彩色打印等的普及而彩色文檔變多,隨之,將其作為彩色圖像進行保存的必要性增多。彩色圖像因為相比黑白圖像或灰度標準圖像數(shù)據(jù)量龐大,所以,通常實施一些壓縮處理進行保存。作為一般的彩色圖像的壓縮方法,有JPEG(Jojnt Photgraphic Experts Group) 方式的壓縮。但是,已知,若增大包含文字等的文檔圖像的壓縮率,則由于方框噪聲而文字的邊緣部分產(chǎn)生模糊,可視性降低。作為其對策,首先可以列舉將圖像進行減色化進行壓縮的技術。當用掃描儀讀取文檔時,由于量子化誤差或讀取時的位置偏差,其色數(shù)成為龐大的數(shù)。在文檔圖像中,為了進行有效的壓縮處理,有效的是通過減少其色數(shù)的減色處理實現(xiàn)數(shù)據(jù)量的削減。該減色處理例如對色空間的頻率分布進行Hough變換或主成分分析決定色數(shù)。同時,求上述色空間的色的直線狀的分布,使用將其分布進行分類得到的數(shù)據(jù)族的數(shù)色進行減色化。另外,也可以列舉在準備了預先記入欄等的帳票中只取出用手寫等補記的圖像的技術。用掃描儀讀取帳票,在通過通信裝置向遠地發(fā)送該帳票圖像數(shù)據(jù)的情況下,若將讀取數(shù)據(jù)全部發(fā)送,則成為龐大的數(shù)據(jù)量浪費成本。通常,在帳票中,在將予設定的項目進行字或印刷的用紙中,多為人通過手寫等向項目欄記入內(nèi)容。但是,事前已知已經(jīng)進行了印字或印刷的圖像數(shù)據(jù)(以下,稱為預印數(shù)據(jù)),用手寫等補記的數(shù)據(jù)為重要的數(shù)據(jù)。從而,若從用掃描儀讀取的圖像只取出用手寫等補記的數(shù)據(jù)的圖像,將取出的圖像數(shù)據(jù)向遠地發(fā)送,則效率高。而且,在接收側(cè)合成接收的圖像數(shù)據(jù)和預準備的預印數(shù)據(jù),從而可以復原顯示和發(fā)送側(cè)相同的圖像數(shù)據(jù)。但是,文字的邊緣部分的圖像,特別是由于掃描時的彩色邊紋等多為與實際使用的墨水色分離。例如,受墨水色和底色的雙方的影響成為中間色。該情況下,因為與直線分布分離的色的處理不明,所以不能對應。另外,帳票等的文檔圖像中,存在通過設置為網(wǎng)點(網(wǎng)點)而意圖將特定的欄設為中間色的情況。而且,也存在在其網(wǎng)點(半色調(diào)點)上用和網(wǎng)點相同色的墨水印刷文字的情況。該情況下,若進行文檔圖像的色的置換處理,則文字和網(wǎng)點作為相同的色被識別,存在難以讀出文字的問題。另外,用同系色對文字、格線、其它圖像進行印字的帳票的讀取圖像數(shù)據(jù)難以分類。例如,在讀取對紅色的文字、格線進行印字,然后添加印章的蓋章的紅色的文檔的圖像的情況下,難以將紅色的文字、格線和紅色作為不同的顏色進行分類。

發(fā)明內(nèi)容
本發(fā)明實施方式的文檔圖像處理裝置具備取出部,其從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素;推定部, 其推定所述第一文檔要素各色空間的第一代表色和第二文檔要素各色空間的第二代表色; 算出部,其算出在所述色空間上分離各所述第一代表色的第一分離平面和在所述空間上分離各所述第二代表色的第二分離平面;置換部,其將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為分布于同所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為分布于同所述分離區(qū)域的所述第二代表色;生成部,其生成置換的各第一像素和置換的各第二像素的差分圖像。本發(fā)明其它實施方式的文檔圖像處理裝置,具備取出部,其從輸入文檔圖像取出文檔要素;推定部,其推定取出的所述文檔要素的色空間的代表色;算出部,其算出在所述色空間上分別分離所述代表色的分離平面;置換部,其將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為分布于同所述分離區(qū)域的所述代表色;生成部,其生成將各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已經(jīng)實施了所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像。本發(fā)明其它實施方式的文檔圖像處理方法,具備從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素的步驟;推定所述第一文檔要素各色空間的第一代表色和第二文檔要素各色空間的第二代表色的步驟; 算出在所述色空間上分離各所述第一代表色的第一分離平面和在所述空間上分離各所述第二代表色的第二分離平面的步驟;將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為分布于同所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為分布于同所述分離區(qū)域的所述第二代表色的步驟;生成置換的各第一像素和置換的各第二像素的差分圖像的步驟。本發(fā)明其它實施方式的文檔圖像處理方法,具備輸入輸入文檔圖像的步驟;從所述輸入文檔圖像的各像素取出文檔要素的步驟;推定取出的所述文檔要素的色空間的代表色的步驟;算出在所述色空間上分離所述代表色的分離平面的步驟;將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為分布于同所述分離區(qū)域的所述代表色的步驟;生成將各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已實施了所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像的步驟。本發(fā)明其它實施方式的存儲介質(zhì),其存儲對輸入文檔圖像進行減色處理的程序。 所述程序使計算機實施如下功能,即從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素的功能;推定各所述第一文檔要素的色空間的第一代表色和各所述第二文檔要素的色空間的第二代表色的功能;算出在所述色空間上分離各所述第一代表色的第一分離平面、在所述色空間上分離各所述第二代表色的第二分離平面的功能;將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為分布于同所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為分布于同所述分離區(qū)域的所述第二代表色的功能;生成置換的各第一像素和置換的各第二像素的差分圖像的功能。本發(fā)明其它實施方式的存儲介質(zhì),其存儲減色處理輸入文檔圖像的程序。所述程序使計算機實施以下功能,即從輸入文檔圖像的各像素取出文檔要素的功能;推定取出的所述文檔要素的色空間的代表色的功能;算出在所述色空間上分離所述代表色的分離平面的功能;將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為分布于同所述分離區(qū)域的所述代表色的功能;生成將所述各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已經(jīng)實施所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像的功能。本公開的實施方式通過讀以下的詳細說明及參照附圖可以明白。這些詳細的說明及附圖用于說明本發(fā)明實施方式而提供,并不限定于本發(fā)明范圍。


圖1是表示本發(fā)明一實施方式的文檔圖像處理裝置的構成的圖;圖2是表示圖1所示的第一實施方式的CPU的功能構成的圖;圖3是表示圖2所述的文檔圖像輸入部被輸入的輸入文檔圖像的一例的圖;圖4是表示根據(jù)圖2所示的文檔識別部2的識別處理的一例的流程圖;圖5是表示相對根據(jù)圖2所示的文檔識別部從存儲裝置取出的圖3的輸入文檔圖像的預印數(shù)據(jù)的一例的圖;圖6是表示圖2所示的減色處理部的功能構成的圖;圖7是表示圖6所示的文檔要素取出部的處理的一例的流程圖;圖8是表示對圖3所示的輸入文檔圖像進行二值化處理生成的二進制輸入文檔圖像的一例的圖;圖9是表示對圖8所示的二進制圖像只取出了判別為文字區(qū)域的黑像素的結果的一例的圖;圖10是表示對圖8所示的二進制圖像只取出了判別為格線區(qū)域的黑像素的結果的一例的圖;圖11是表示用于說明圖6所示的代表色推定部的處理的概念的頻率分布的一例的圖;圖12是表示在圖11所示的頻率分布中,加上了從底色的頻率分布到各頻率分布的各向量和二值化平面的頻率分布的一例的圖;圖13是表示用于說明分離平面算出部的處理的頻率分布的一例的圖;圖14是表示在圖13所示的頻率分布中,沿代表色間的向量投影了分布的頻率分布的一例的圖;圖15是表示用于說明求得多個分離平面的狀況的頻率分布的一例的圖;圖16是表示在預印數(shù)據(jù)中代表色推定部求得的頻率分布的圖17是表示在預印數(shù)據(jù)中在代表色推定部求得的頻率分布加上二值化平面的一例的圖;圖18是表示差分圖像生成部的差分圖像生成處理的一例的圖;圖19是表示根據(jù)對圖5所示的預印數(shù)據(jù)和圖3所示的輸入文檔圖像進行了差分圖像生成處理的結果作成的差分圖像的一例的圖;圖20是表示本發(fā)明第二實施方式的減色處理部的功能構成的圖;圖21是表示圖20所示的代表色統(tǒng)一部的代表色統(tǒng)一處理的流程圖。
具體實施例方式以下,參照

本發(fā)明實施方式。(第一實施方式的說明)圖1是表示本發(fā)明一實施方式的文檔圖像處理裝置10的構成的方框圖。文檔圖像處理裝置10由CPU11、CPU總線12、存儲裝置13、主存儲部14、數(shù)據(jù)輸入裝置15、輸入接口裝置16、輸出接口裝置17、圖像輸入裝置18、圖像輸出裝置19構成。CPU11、存儲裝置13、主存儲部14、數(shù)據(jù)輸入裝置15、輸入接口裝置16及輸出接口裝置17經(jīng)由CPU總線12分別被連接。存儲裝置13為CPUll的工作用存儲器。存儲裝置13由例如磁盤裝置或半導體存儲器等構成。主存儲部14具有程序存儲區(qū)域和暫存區(qū)域。在該程序存儲區(qū)域存儲控制該文檔圖像處理裝置10的程序等。另外,暫存區(qū)域作為CPUll的臨時存儲區(qū)域使用。主存儲部14由例如半導體存儲器等構成。本實施方式的文檔圖像處理程序存儲于存儲裝置13,并在啟動文檔圖像處理裝置10時,從存儲裝置13輸入主存儲部14。數(shù)據(jù)輸入裝置15由例如鍵盤或鼠標等構成,輸入對應操作員的操作的數(shù)據(jù)或指令。在輸入接口裝置16連接有圖像輸入裝置18。圖像輸入裝置18為讀取印刷有文字及文字以外的圖像(例如格線、圖形、相片)的文檔的掃描儀裝置。輸入接口裝置16輸入通過圖像輸入裝置18讀取的文檔圖像數(shù)據(jù)。該文檔圖像數(shù)據(jù)經(jīng)由CPU總線12輸送至存儲裝置 13,并在此進行存儲。在輸出接口裝置17連接有圖像輸出裝置19。輸出接口裝置17將存儲于存儲裝置13的文檔圖像數(shù)據(jù)經(jīng)由CPU總線12接收并向圖像輸出裝置19輸出。圖像輸出裝置19 為輸出來自輸出接口裝置17的文檔圖像數(shù)據(jù)的裝置(例如,顯示裝置、印刷裝置、文件裝置等)。CPUll控制文檔圖像處理裝置10的整體。圖2是表示圖1所示的第一實施方式的CPUll的功能構成的圖。CPUll具備文檔圖像輸入部1、文檔識別部2、減色處理部3、差分圖像生成部4。該文檔圖像輸入部1、文檔識別部2、減色處理部3、差分圖像生成部4為表示在CPUll執(zhí)行文檔圖像處理程序時進行動作的功能的單元。本實施方式中,參照圖3 圖19說明將預印數(shù)據(jù)從圖像輸入裝置18輸入且存儲裝置13將輸入的預印數(shù)據(jù)作為預先記錄預印數(shù)據(jù)(以下,簡稱為記錄預印數(shù)據(jù))存儲的文檔圖像處理裝置10的動作。另外,記錄預印數(shù)據(jù)和通過文檔識別部2取出的識別信息(后述)一同存儲于存儲裝置13。圖2所示的文檔圖像輸入部1作為接收文檔圖像數(shù)據(jù)的輸入部發(fā)揮功能。該文檔圖像數(shù)據(jù)為從掃描儀裝置讀取的彩色圖像數(shù)據(jù)。圖3表示通過圖2的文檔圖像輸入部1輸入的彩色文檔的圖像數(shù)據(jù)即文檔圖像的一例。圖3是表示通過文檔圖像輸入部1輸入的預先印字或向印刷的文檔進行補記及蓋章的輸入文檔圖像301的圖。輸入文檔圖像301設置其底色為白色,“申請書”的文字302為紅色,粗線框303為藍色,網(wǎng)點(半色調(diào)點)部304為淡藍色,“姓名”的文字305為藍色, 格線框306為黑色,蓋章處的“印”的文字307為黑色,記入文字“TARO YAMADA"308為淡黑色,蓋章309為紅色。另外,記入文字“TAR0YAMADA(山田夕口一)” 308設為由鉛筆記入。 另外,蓋章309設為相比其它顏色像素數(shù)小。圖2所示的文檔識別部2通過比較文檔圖像輸入部1接收到的輸入文檔圖像和存儲于存儲裝置13的記錄預印數(shù)據(jù)來識別相對上述輸入文檔圖像的記錄預印數(shù)據(jù)。圖4表示根據(jù)文檔識別部2的記錄預印數(shù)據(jù)的識別處理順序。圖4中,文檔識別部2取出文檔圖像輸入部1接收到的輸入文檔圖像301的識別信息(步驟S21)。識別信息為作為文檔尺寸、預印的格線或文字等文檔要素的屬性信息、其位置、形狀信息等。例如,在圖3所示的輸入文檔圖像301中,將輸入文檔圖像301的尺寸、 預印的文字即“申請書”302、“姓名”305、同樣進行預印的格線的粗線框303、格線框306等作為識別信息進行定義。識別信息的取出具體而言通過二值化處理、連結成分取出處理、特征量測定處理、屬性分類處理而進行。另外,通過二值化處理可以求得后述的二值化平面。 關于這些處理,在后述的文檔要素取出部的處理的說明進行詳細敘述。接下來,文檔識別部2比較存儲于記錄預印數(shù)據(jù)的識別信息DB30的記錄預印數(shù)據(jù)的識別信息和輸入文檔圖像301的識別信息(步驟S2》。而且,將一致的記錄預印數(shù)據(jù)或最類似的記錄預印數(shù)據(jù)識別為相對輸入文檔圖像301的記錄預印數(shù)據(jù)(步驟S2!3)。另外, 作為該文檔識別部2的文檔的識別技術,也可以使用特開2002-109469號公報開示的方法。 另外,本實施方式中也可以為將記錄預印數(shù)據(jù)的識別信息在預先記錄預印數(shù)據(jù)的識別信息 DB30進行記錄,或在取出輸入文檔圖像301的識別信息時取出記錄預印數(shù)據(jù)的識別信息的方法。圖5表示相對文檔識別部2識別的輸入文檔圖像301的記錄預印數(shù)據(jù)201。記錄預印數(shù)據(jù)201設為例如底色為白色,“申請書”的文字202為紅色,粗線框203為藍色,網(wǎng)點部204為淡藍色,“姓名”的文字205為藍色,格線框206為黑色,蓋章處的“印”的文字207 為黑色。圖2所示的減色處理部3對輸入的輸入文檔圖像301和取出的記錄預印數(shù)據(jù)201 分別進行減色處理。即,減色處理部3對文檔圖像取出文字、格線等文檔要素。然后,求得這些文檔要素的代表色及代表色間的分離平面。然后,以代表色置換由二值化平面和分離平面圍成的區(qū)域。由此,對文檔圖像進行特別的減色處理。圖6是表示減色處理部3的功能構成的圖。減色處理部3由文檔要素取出部101、 代表色推定部102、分離平面算出部103、色置換處理部104等構成。在此,對圖3所示例的輸入文檔圖像301通過圖6 圖15具體說明通過減色處理部3的減色處理的順序。文檔要素取出部101首先取出文檔圖像的文字、格線等文檔要素。圖7是表示文檔要素取出部101的處理的一例的流程圖。文檔要素取出部101進行二值化處理、連結成分取出處理、特征量測定處理及屬性分類處理。下面,使用圖8 圖10說明文檔要素取出部101對圖3所示的輸入文檔圖像301進行上述處理時的處理順序。二值化處理文檔要素取出部101作為前處理進行二值化處理(圖7的步驟S111)。通常,作為該文檔要素的判別,重要的部分為和基底可區(qū)別的深濃度的顏色。因此,根據(jù)在該文檔要素取出部101的二值化處理生成由除去噪聲或淡網(wǎng)點(半色調(diào)點)區(qū)域等的白像素和黑像素構成的二進制圖像。二進制圖像的生成可以使用例如在將深淡圖像進行二值化處理時求得最適閾值的判別分析法等通常已知的技法。圖8是表示對于圖3所示的輸入文檔圖像301進行二值化處理而生成的二進制輸入文檔圖像311之一例的圖。圖8中,二進制輸入文檔圖像311的黑像素312對應圖3所示的“申請書”的文字302。二進制輸入文檔圖像311的黑像素313對應粗線框303。二進制輸入文檔圖像311的黑像素315對應“姓名”的文字305。二進制輸入文檔圖像311的黑像素316對應格線框306。二進制輸入文檔圖像311的黑像素317對應蓋章處的“印”。二進制輸入文檔圖像311的黑像素318對應記入文字“TARO YAMADA(山田夕口一)”307。二進制輸入文檔圖像311的黑像素319對應蓋章308。但是,由于二值化處理,圖3所示的網(wǎng)點部304因為色濃度淡,因此成為白像素314。連結成分取出處理文檔要素取出部101對該通過二值化處理生成的二進制輸入文檔圖像311檢測黑像素312 319的連結性。而且,進行將連結的部分作為一塊取出的連結成分取出處理(圖 7的步驟Sl 12)。特征量測定處理文檔要素取出部101對該取出的各連結成分計量“大小”、“形狀”、“黑像素比率”、 “黑像素分布”等特征量(圖7的步驟S113)。例如,“大小”由連結成分的外接矩形的縱橫像素數(shù)測定?!靶螤睢庇嬃窟B結成分的外接矩形為正方形、沿橫方向細長的長方形、或沿縱方向細長的長方形等的形狀?!昂谙袼乇嚷省睘閷B結成分的外接矩形計量黑像素的比率的大小。“黑像素分布”計量在連結成分的外接矩形內(nèi)的黑像素的分布是有偏離、或者還是相同。屬性分類處理文檔要素取出部101使用該特征量測定處理的計量結果進行各連結成分為何種類的文檔要素的屬性分類(圖7的步驟S114)。例如,“大小”相比文檔圖像的大小、“形狀” 接近正方形、“黑像素比率”高的文檔要素判別為文字。另外,“大小”比文字大、內(nèi)部為空白且“黑像素比率”低、在“黑像素分布”只在連結成分的外接矩形附近存在黑像素的文檔要判別為格線框。另外,關于作為文字取出的連結成分,也可以只在周圍具有相同的連結成分的情況下判別為文字。由此,可以除去在二值化時產(chǎn)生的噪聲成分。圖9所示的文字圖像321是表示對圖8所示的二進制輸入文檔圖像311取出判別為文字區(qū)域的黑像素312、315、318的結果的圖。文檔要素取出部101將“申請書”的文字 322、“姓名”的文字325、“印”327、記入文字“TARO YAMADA(山田夕口一)”328、蓋章329作為文字圖像取出。但是,文字圖像321的框為方便地表示文檔圖像的整體的大小的部分,而不是文檔要素取出部101的取出結果。圖10所示的格線圖像331是表示對圖8所示的二進制輸入文檔圖像311取出判別為格線區(qū)域的黑圖像313、316的結果的圖。文檔要素取出部101將粗線框333和格線框
10336作為格線圖像331取出。和文字圖像321相同,格線圖像331的框為方便地表示文檔圖像的整體的大小的部分,不是文檔要素取出部101的取出結果。文檔要素取出部101作為根據(jù)上述輸入的文檔圖像的各像素而提取該文檔圖像的文檔要素的取出部發(fā)揮功能。如此,將由文檔要素取出部101取出的結果信息向代表色推定部102輸出。代表色推定部102利用顏色空間的頻率分布推定取出的所謂文字、格線的文檔要素的像素的顏色、基底等的像素的顏色。即,代表色推定部102對輸入文檔圖像301、將各像素的色值作為以RGB表現(xiàn)的值而求得三維的頻率分布。圖11是表示用于說明代表色推定部102的處理的頻率分布501的一例的圖。S卩,圖11的頻率分布501是關于圖3所示的輸入文檔圖像 301的各像素全部求得頻率分布且構繪成的結果。該頻率分布501包含例如白色底色的頻率分布(以下,稱為“底色的頻率分布”)502、藍色文字或/和格線的頻率分布503、淡藍色網(wǎng)點的頻率分布504、黑色文字或/ 和格線的頻率分布505、紅色文字的頻率分布506、用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布507、紅色蓋章的頻率分布508而構成。若將圖11的各頻率分布503 508用圖3的輸入文檔圖像302 309表示,則底色的頻率分布502對應于底色。另外,藍色文字或/和格線的頻率分布503對應于粗線框 303、“姓名”的文字305。另外,淡藍色的網(wǎng)點的頻率分布504對應于網(wǎng)點部304。另外,黑色文字或/和格線的頻率分布505對應于格線框306、蓋章處的“印”的文字307。另外,紅色文字的頻率分布506對應于“申請書”的文字302。另外,用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布507對應于記入文字“TARO YAMADA(山田夕口一)”308。另外,紅色的蓋章的頻率分布508對應于蓋章309。在底色的頻率分布502和各頻率分布503 508之間中間色的頻率分布寬廣。頻率分布501可以當做包含這些中間色的分布。但是,實際上,也存在具有頻率分布501的外側(cè)的RGB值的像素。后面對此進行敘述。各頻率分布503 508中心附近頻率最高。從而, 分別求得從底色的頻率分布502向各頻率分布503 508的向量,可以將其做為各頻率分布的代表色。另外,各頻率分布503 508可以只從作為文檔要素取出的區(qū)域求得頻率分布,該情況下,不產(chǎn)生如頻率分布501那樣具有展寬的區(qū)域。該代表色推定部102作為推定上述取出的文檔要素的顏色空間的代表色的推定部發(fā)揮功能。圖12是表示相加了從底色的頻率分布502向各頻率分布503 508的各向量 510 515和二值化平面520的頻率分布的一例的圖。另外,各頻率分布501 508和在圖11說明的分布相同。各向量510 515分別表示頻率分布503 508的代表向量。另外,頻率分布501通過二值化平面520分割為平面上部520U和平面下部520D。各代表向量510 515將各頻率分布501 508的頻率高的RGB值設為始點和終點。另外,二值化平面520在圖7的步驟Slll中也可以使用由通過文檔要素取出部101進行的二值化處理作成的二值化平面。本實施方式中,考慮通過文檔圖像的頻率分布501算出各代表向量510 515的情況。該情況下,通過調(diào)查各頻率分布503、505 508的極大值可以算出向各頻率分布的代表向量。但是,在如頻率分布504那樣中間色的情況下,頻率分布501向橫向展寬,且和頻率分布503的距離近。因此,頻率分布504承受頻率分布503的影響,存在不能正確算出代表向量511的問題。相反,頻率分布503的代表向量510的算出也由于頻率分布504的影響存在不能正確算出的問題。另外,紅色的蓋章的頻率分布508因為相比其它頻率分布502 507像素數(shù)小,所以,也存在由于來自底色的頻率分布502的展寬不能正確算出代表向量515的情況。若不能正確算出代表向量515,則在后述的分離平面算出部103不能求得正確的分離平面,結果成為可視性降低的圖像。于是,在本實施方式中,不是從頻率分布整體算出文字、格線這樣的重要的文檔要素的代表向量,而是區(qū)別底色和中間色進行決定。因此,本實施方式中,利用在文檔要素取出部101的二值化處理的結果、及文檔要素取出處理的結果。圖12中,通過二值化平面520將頻率分布501分割為平面上部520U和平面下部 520D表示RGB的顏色空間的二值化處理。即,該平面上部520U成為基底等濃度小的區(qū)域, 該平面下部520D成為包含文字、格線的文檔要素的濃度高的區(qū)域。在存在于該平面上部 520U的頻率分布中,底色的頻率分布502相比淡藍色的網(wǎng)點的頻率分布504頻率分布的極大值(RGB值)非常大。因此,可以推定為將底色的頻率分布502成為代表向量的基準的底色的代表色。推定的極大值成為底色,且成為其它代表向量的基準點。之后,求得被認為具有下一個極大值的淡藍色的網(wǎng)點部的頻率分布504的極大值,并設為頻率分布504的代表色。下面,對存在于二值化平面520的平面下部520D的各頻率分布503、505、506、507、 508同樣地求得極大值決定代表色。此時,不是根據(jù)頻率分布501的整體決定代表色,而是根據(jù)利用了文檔要素的取出結果的頻率分布進行決定。即,通過由藍色文字或/和格線的頻率分布503、淡藍色網(wǎng)點的頻率分布504、黑色文字或/和格線的頻率分布505、紅色文字的頻率分布506、用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布507、紅色的蓋章的頻率分布508求得,而不受分布的展寬的影響。因此,可以正確地決定代表色。另外,具體的代表向量的算出方法也可以使用在特開平5-61974號公報公開的方法。該方法中,當輸入文檔圖像的RGB數(shù)據(jù)時,作成濃度直方圖檢出極大點。而且,可以通過進行向?qū)⒌咨O為基準點的極大點的方向向量數(shù)據(jù)的變換實現(xiàn)。這樣,將由代表色推定部102推定的各代表色的信息向分離平面算出部103輸出。 分離平面算出部103尋求用于在色空間分離各代表色間的平面。圖13是表示用于說明分離平面算出部103的處理的頻率分布的一例。在該圖13中,在顏色空間存在頻率分布701, 并在其中包含頻率分布702和頻率分布703的雙色分布。例如,頻率分布702對應于圖11 的頻率分布504,頻率分布703對應于圖11的頻率分布503。這些頻率分布701 703的顏色為構成文字、格線的文檔要素的顏色。將這些頻率分布702、703的代表色分別設為代表色705、706,將底色的頻率分布的代表色設為代表色704。另外,底色的頻率分布例如可以假定圖11的頻率分布502。該例中,頻率分布702 和703分別為其它顏色,但是,如頻率分布701所示沒有完全分離。事實上,這樣頻率分布之間沒有完全分離的很多。該現(xiàn)象可以認為在例如在文字和格線為其它顏色時,或文字和格線接觸的情況等產(chǎn)生。這樣的狀態(tài)下,在由后述的色置換處理部104將各像素的顏色置換為代表色時,不判斷將其置換為何種顏色。因此,尋求雙色的頻率分布間的分離平面710。該具有分離平面710的上部的RGB值的像素可以全部向代C 表色705進行置換。同樣,具有分離平面710的下部的RGB值的像素可以全部向代表色706 進行置換。分離平面算出部103作為算出將上述推定的代表色在上述色空間上分別進行分離的分離平面710的算出部發(fā)揮功能。下面,說明具體的分離平面710的算出方法。首先,根據(jù)通過底色的代表色704和各頻率分布702、703的代表色705、706求得的雙色的代表向量707、708求雙色間的向量 709。將該向量709的方向向量設為(a、b、c)。分離平面710若設為和向量709垂直交叉的平面,則分離平面710的法線向量也成為(a、b、c)。從而,分離平面710的式(1)為ax 十 by 十 cz 十 d = 0··· (1)。下面,說明系數(shù)d的求出方法。圖14是表示在圖13所示的雙色間的分布中沿代表色間的向量投影分布的頻率分布的一例的圖。圖13的向量709對應于投影軸806。另外,圖13的代表色705和706若進行投影則分別對應于分布804和805。另外,圖13的頻率分布701 703分別對應于投影分布801 803。根據(jù)該投影分布801 803求分離平面807。作為算出方法,也可以使用和二值化處理同樣地通常已知的判別分析法。該結果, 算出分離平面807的投影軸806上的坐標值(α、β、Y )。通過將坐標值代入式(1)求系數(shù)d,算出圖17的色空間的分離平面710。S卩,系數(shù)d為d = - (a α +b β +c Y ) ο實際上,分離平面算出部103在各代表色間可以求得。即,在鄰接的代表色間算出各分離平面,在每個由其平面包圍的區(qū)域進行代表色間的分離。例如,在圖11的頻率分布 503、505、506、507、508相互間算出分離平面,在每個由各分離平面包圍的區(qū)域設定各代表色。在此,對分離平面定義正(+)側(cè)和負(一)側(cè),判斷某代表色的坐標值為正側(cè)還是為負側(cè)。例如若該代表色為正側(cè),則將存在于正側(cè)的顏色的坐標值全部求出。對各分離平面進行該處理,由這些分離平面包圍的區(qū)域成為該代表色的相應區(qū)域。此時,由于運算成本削減,算出代表色間的距離,在其距離離開預設的閾值以上的情況下也可以不進行分離平面的算出。圖15是用于說明求多個分離平面911、912、915 919的狀況的頻率分布的一例的圖。該圖15為從圖11的RGB軸的原點側(cè)、即黑側(cè)觀察的圖。S卩,具有藍色文字或/和格線的頻率分布901和其代表色906、黑色文字或/和格線的頻率分布902和其代表色907、 紅色文字的頻率分布903和其代表色908、用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布904和其代表色909、紅色的蓋章的頻率分布905和其代表色910。若用圖11的文檔圖像表現(xiàn)圖15,則藍色的頻率分布901為頻率分布503的區(qū)域。 另外,黑色的頻率分布902為頻率分布505的區(qū)域。另外,紅色的頻率分布903為頻率分布 506的區(qū)域。另外,用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布904為頻率分布 507的區(qū)域。另外,紅色的蓋章頻率分布905為頻率分布508的區(qū)域。在此,若考慮藍色的頻率分布901的分離,則可以通過頻率分布901和代表色906、 黑色的頻率分布902和代表色907求分離平面911。同樣,可以通過藍色的頻率分布901和代表色906、紅色的頻率分布903和代表色908求分離平面912。另外,可以藍色的頻率分布901和用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布904、及藍色的頻率分布901 和紅色的蓋章的頻率分布905間因為距離分離,所以不進行分離平面的算出。實際上,即使
13求頻率分布901和頻率分布904間的分離平面,也因為該分離平面從代表色906觀察成為分離平面911和912的外側(cè)。由該分離平面911及912包圍的區(qū)域913成為藍色區(qū)域A。另外,可以通過黑色的頻率分布902和代表色907、紅色的頻率分布903和代表色 908求分離平面915。另外,可以通過黑色的頻率分布902和代表色907、用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布904和代表色909求分離平面917。另外,通過黑色的頻率分布902和代表色907、紅色的頻率分布905和代表色910求分離面916。另外,可以通過紅色的頻率分布903和代表色908、紅色的頻率分布905和代表色910求分離平面918。 另外,可以通過用鉛筆記入的濃度稍淡的黑色的記入文字的頻率分布904和代表色909、紅色的頻率分布905和代表色910求分離平面919。通過黑色的頻率分布902的分離,在代表色907和其它3種代表色906、908、909、 910的距離為預定閾值以下的情況下,也可以分別求分離平面911、915、916,將各分離平面包圍的區(qū)域設定為黑色區(qū)域B。另外,雖然在圖15未進行圖示,但是,通過圖12的二值化平面520將白色側(cè)分離。從而,實際上,藍色區(qū)域A成為由求得的分離平面911、912及二值化平面520的3 個平面包圍的區(qū)域。同樣地,黑色區(qū)域B成為由求得的分離平面911、915、917及二值化平面520的4個平面包圍的區(qū)域。同樣地,紅色區(qū)域C成為由分離平面912、915、918及二值化平面520的4個平面包圍的區(qū)域。同樣地,用鉛筆記入的濃度稍淡的黑色的記入文字的區(qū)域D成為由分離平面916、919及二值化平面520的3個平面包圍的區(qū)域。同樣地,紅色區(qū)域E成為由分離平面918、919及二值化平面520的3個平面包圍的區(qū)域。這樣,將通過分離平面算出部103算出的分離平面的區(qū)域信息A E向色置換處理部104輸出。如通過圖15所說明,色置換處理部104將輸入的文檔圖像的各像素區(qū)域通過代表色推定部102進行推定并置換為代表色。即,色置換處理部104將各像素的RGB值做為色空間上的點,通過用分離平面算出處理算出的分離平面檢測分離為哪種代表色,并置換為檢測的代表色。色置換處理部104作為將分布于通過上述算出的各平面分離的上述色空間的分離區(qū)域的上述文檔要素的各像素區(qū)域的顏色置換為同樣分布于上述分離區(qū)域的上述代表色的置換部發(fā)揮功能。另外,在色置換處理部104進行分離平面的分離時,存在產(chǎn)生如圖15的區(qū)域914 所示的、任何代表色區(qū)域都不屬于的區(qū)域的情況。在該區(qū)域914存在像素的情況下,也可以不根據(jù)分離平面探求代表色,而通過調(diào)查置換結束后的文檔圖像的周圍的像素進行置換。 具體而言,在對象像素不屬于任何代表色的情況下,也可以調(diào)查其對象像素的周圍八方向 (上下左右、左斜上下、右斜上下的方向)的像素,將最多的代表色設為其像素的代表色。減色處理部3對圖5所示的記錄預印數(shù)據(jù)201也相同地進行減色處理。圖16表示代表色推定部102對記錄預印數(shù)據(jù)201求得的頻率分布401。另外,圖17表示在代表色推定部102對記錄預印數(shù)據(jù)201求得的頻率分布加上了二值化平面420的一例。圖17中, 和圖12同樣,表示向量410 413,即,用于求各頻率分布403 406的代表色的代表向量。減色處理部3對輸入的文檔圖像的全像素進行上述處理,進行分別的向代表色的置換(減色處理)。圖2所示的差分圖像生成部4通過減色處理部3進行減色處理的、記錄予印數(shù)據(jù)和輸入文檔圖像之間的差分運算取出記入文字。差分圖像生成部4將取出的記入文字作為差分圖像數(shù)據(jù)輸出。然后,通過圖18 圖19說明根據(jù)差分圖像生成部4的差分圖像的生成處理。圖18是表示根據(jù)差分圖像生成部4的差分圖像的生成處理順序的一例的流程圖。 首先,分別對減色處理部3進行了減色處理的記錄預印數(shù)據(jù)和輸入文檔圖像進行文檔圖像的傾斜量的算出(步驟S41)。然后,將算出的傾斜量補正為零(步驟S42)。通常,在由掃描儀讀入的圖像存在在圖像產(chǎn)生傾斜的問題。其傾斜量按照將讀取對象的文檔每次放置于掃描儀而不同。若使用存在傾斜的文檔圖像算出差分,則在預印的文字、格線等位置產(chǎn)生偏移。其結果,在作成的差分圖像產(chǎn)生噪聲。從而,為了削減在差分圖像產(chǎn)生的噪聲,進行算出文檔圖像的傾斜量并將算出的傾斜量設為零的傾斜補正。步驟S41的傾斜檢測處理通過例如公開于特開平5-174183號公報的方法可以實現(xiàn)。另外,步驟S42的傾斜補正處理使用已知的仿射變換可以實現(xiàn)。然后,通過將任一方的文檔圖像固定,將另一方的文檔圖像的平行移動量算出,從而進行文檔圖像間的移動量的算出(步驟S4!3)。即,將任一方的文檔圖像固定,使另一方的文檔圖像沿χ方向或y方向每次移動一個點,求各文檔圖像間的像素的像素值的差分和。因為雙方的文檔圖像越處于正確位置,差分和越小,所以,可以將差分和為最小的x、y的組合做為平行移動量。另外,步驟S43的移動量的算出處理也可以在文檔圖像整體上進行。但是,由于文檔的紙自體的伸縮或掃描時的偏移等,存在在文檔圖像整體不為均一的移動量的情況。該情況下,也可以將文檔圖像分割為網(wǎng)孔,對每個網(wǎng)孔算出移動量。另外,在紙的伸縮大的情況下,不只是移動量,也可以事先求放大縮小率,放大縮小圖像整體。接下來,計算雙方的文檔圖像間的像素的差分,使用計算結果生成文檔圖像間的差分圖像(步驟S44)。如上所述,因為已經(jīng)進行了減色處理,所以生成色數(shù)少的差分圖像。 具體而言,根據(jù)在步驟S43的移動量的算出處理算出的χ、y的移動量移動一方的圖像。由此,雙方的文檔圖像的位置正確重合。步驟S44中,比較雙方的文檔圖像的像素值,在相同的情況下,將對應的位置的差分圖像的值設為白。另一方面,在雙方的文檔圖像的像素值不同的情況下,將輸入的輸入文檔圖像的像素值設為差分圖像的值。由此,可以生成只表示在記錄預印數(shù)據(jù)補記的像素的差分圖像。該差分圖像保存于存儲裝置13或主存儲部14。圖19是作為對圖5所示的記錄預印數(shù)據(jù)201和圖3所示的輸入文檔圖像301進行了差分圖像的生成處理的結果表示作成的差分圖像601的一例的圖。即,為在進行了根據(jù)減色處理部3的減色處理的記錄預印數(shù)據(jù)201的各代表色的像素和輸入文檔圖像301的各代表色的像素之間,是進行了步驟S44的圖像間差分運算處理的結果的差分圖像。圖19 中,差分圖像601由在記錄預印數(shù)據(jù)補記的記入文字“TARO YAMADA”608、及蓋章609構成。對這樣作成、輸出的差分圖像通過實施壓縮處理等可以進一步削減數(shù)據(jù)量。其結果,帶來存儲量或通信量的削減。另外,本實施方式的文檔圖像處理裝置也可以具備使用記錄預印數(shù)據(jù)201的減色處理后的圖像和差分圖像602,再構成補記或蓋章的輸入文檔圖像301的減色處理后的文檔圖像的再構筑處理部。具體而言,以在生成差分圖像時算出的移動量為基礎,使差分圖像和記錄文檔圖像的位置重合。其結果,在差分圖像具有不是白的像素值的情況下,將記錄文檔圖像的其像素值置換為差分圖像的像素值。由此生成再構成圖像。
該情況下,因為可以只保存差分圖像和記錄文檔圖像就可以,所以,可以大幅削減存儲量。另外,本實施例中,比較雙方的文檔圖像的像素值,在相同的情況下,將對應的位置的差分圖像的值設為白,但是,也可以配合其背景色,也可以設為零(皿11)。(第二實施方式的說明)使用

本發(fā)明第二實施方式。圖20是表示本實施方式的減色處理部3的功能構成的圖。本實施方式中,減色處理部3還具有代表色統(tǒng)一部105。對于該代表色統(tǒng)一處理部105的代表色統(tǒng)一處理使用圖3、圖5、圖12、圖17、圖20、圖21進行說明。另外,省略說明和第一突施方式相同的動作的說明。因為圖5所示的記錄預印數(shù)據(jù)201為輸入文檔圖像301的預印部分的圖像,所以, 記錄預印數(shù)據(jù)201的RGB的三維頻率分布401和輸入文檔圖像301的RGB的三維頻率分布 501沒有較大改變。即,在圖12的頻率分布501中,頻率分布502 506和圖17所示的頻率分布402 406大致相同。但是,除去記入文字308引起的淡的黑色的頻率分布507和根據(jù)蓋章309引起的紅色的蓋章的頻率分布508。但是,在由掃描儀讀取圖3所示的輸入文檔圖像301及圖5所示的記錄預印數(shù)據(jù)201時,產(chǎn)生量子化誤差或位置偏移等。另外,即使是預印的顏色也產(chǎn)生顏色邊紋(偏移)。同樣地,圖17的代表向量410 413對應(類似)于圖12的代表向量510 513, 因為如上述那樣在頻率分布產(chǎn)生偏移,所以代表向量也不同。該偏移成為作成差分圖像時的噪聲。代表色統(tǒng)一部105具有削減該噪聲的功能。即,在圖12所示的輸入文檔圖像301 的代表向量510 515中,在存在對應(類似)于圖17所示的代表向量411 413的代表向量的情況下(本例中代表向量510 513),將其置換為圖17的代表向量411 413。 即,將對應于記錄預印數(shù)據(jù)201的代表色的輸入文檔圖像301的代表色置換為記錄預印數(shù)據(jù)201的代表色。圖21是表示圖20所示的代表色統(tǒng)一部105的代表色統(tǒng)一處理順序的流程圖。首先,計算從圖12所示的輸入文檔圖像301的底色的頻率分布502向各頻率分布 503 508的各代表向量510 515、從圖17所示的記錄預印數(shù)據(jù)201的底色的頻率分布 402向各頻率分布403 406的各代表向量410 413的距離。該各代表向量間的距離的計算可以使用歐幾里得距離計算?;谒愠龅木嚯x進行代表色是否類似的判定(步驟S51)。 即,在記錄預印數(shù)據(jù)201的代表向量和輸入文檔圖像301的代表向量的距離不足預定的閾值的情況下(步驟S52的Yes),判定為輸入文檔圖像301的代表向量和預印數(shù)據(jù)201的代表向量對應。另外,對輸入文檔圖像301的一個代表向量也存在多個距離不足閾值的記錄預印數(shù)據(jù)201的代表向量的情況。該情況下,判定為對應距離最近的記錄預印數(shù)據(jù)201的代表向量。而且,將輸入文檔圖像301的代表向量置換為判定為對應的記錄預印數(shù)據(jù)201 的代表向量(步驟S5!3)。即,將輸入文檔圖像301的代表色置換為記錄預印數(shù)據(jù)201的代表色。另一方面,在記錄預印數(shù)據(jù)201的代表向量和輸入文檔圖像301的代表向量的距離在預定閾值以上的情況下(步驟S52的No),輸入文檔圖像301的代表向量不能置換為預印數(shù)據(jù)201的代表向量。即,輸入文檔圖像301的代表色和記錄預印數(shù)據(jù)201的代表色的置換不能進行。在不能在輸入文檔圖像301和記錄預印數(shù)據(jù)201的全部的代表向量進行各代表向量間的距離的計算的情況下(步驟S54的No),返回步驟S51,反復進行步驟S51 步驟S54的處理。在輸入文檔圖像301和記錄預印數(shù)據(jù)201的全部的代表向量進行各代表向
16量間的距離的計算的情況下(步驟S54的ks),結束代表色的統(tǒng)一處理。對進行了代表色的統(tǒng)一處理的輸入文檔圖像301算出在第一實施方式說明的分離平面,通過進行色置換處理進行減色處理。另外,在求雙方的各代表向量距離時,關于成為各向量的基準的底色也可以將輸入文檔圖像的最大值置換為記錄預印數(shù)據(jù)的底色。這是因為通常將成為全部的頻率分布的最大值的顏色設為底色。根據(jù)第二實施方式,可以削減在差分圖像生成部4生成差分圖像時產(chǎn)生的噪聲, 同時進一步實現(xiàn)顏色數(shù)的削減。另外,本發(fā)明實施方式不限于上述的實施方式,在不脫離本發(fā)明宗旨的范圍內(nèi),可以進行設計變更。例如,本實施方式中,生成記錄預印數(shù)據(jù)和由文檔圖像輸入部101輸入的輸入文檔圖像的差分圖像,也可以由文檔圖像輸入部101輸入記錄預印數(shù)據(jù)和補記于記錄預印數(shù)據(jù)的輸入文檔圖像,使用輸入的文檔圖像數(shù)據(jù)生成差分圖像。另外,在事前記錄預印數(shù)據(jù)時,也可以記錄在進行根據(jù)減色處理部3的減色處理、根據(jù)差分圖像生成部4的傾斜檢測處理及傾斜補正處理后的文檔圖像。由此,可以實現(xiàn)差分圖像生成部4在預印數(shù)據(jù)和輸入文檔圖像之間進行差分圖像生成處理時的處理時間縮短。另外,可以做為淡藍色的網(wǎng)點的頻率分布404、504為從二值化平面存在于底色側(cè)的淡濃度的分布,作為文檔信息的重要性低,因此,不采用代表向量作為減色后的代表向量。即,也可以是殘留顏色。說明了本發(fā)明的幾種實施方式,但這些實施方式作為示例進行提示,意思不是限定發(fā)明范圍。這些新加入的實施方式可以以其它各種方式實施,在不脫離發(fā)明宗旨的范圍內(nèi),可以進行各種省略、置換、變更。這些實施方式或其變形包含于發(fā)明范圍或宗旨,同時, 包含于和記載于專利請求范圍的發(fā)明均等的范圍。
權利要求
1.一種文檔圖像處理裝置,其特征在于,具備取出部,其從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素;推定部,其推定所述第一文檔要素各色空間的第一代表色和第二文檔要素各色空間的第二代表色;算出部,其算出在所述色空間上分離各所述第一代表色的第一分離平面和在所述空間上分離各所述第二代表色的第二分離平面;置換部,其將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為同樣分布于所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為同樣分布于所述分離區(qū)域的所述第二代表色;生成部,其生成置換的各第一像素和置換的各第二像素的差分圖像。
2.如權利1所述的文檔圖像處理裝置,其特征在于,還具備代表色統(tǒng)一部,其在所述第一代表色和與其對應的所述第二代表色類似的情況下將所述第一代表色置換為所述第二代表色。
3.如權利1所述的文檔圖像處理裝置,其特征在于,還具備再構筑部,其使用將所述第二各相素的色置換為所述第二代表色的所述預印數(shù)據(jù)和所述差分圖像構筑所述輸入文檔圖像。
4.如權利1所述的文檔圖像處理裝置,其特征在于,還具備 存儲部,與識別信息對應地存儲所述預印數(shù)據(jù);識別部,其將和所述輸入文檔圖像的識別信息一致或類似的存儲于所述存儲部的所述預印數(shù)據(jù)識別為所述輸入文檔圖像的預印數(shù)據(jù)。
5.如權利1所述的文檔圖像處理裝置,其特征在于,還具備存儲部,其存儲將所述第二各像素的色置換為所述第二代表色的所述預印數(shù)據(jù),所述生成部使用置換的各第一像素和存儲于所述存儲部的各第二像素生成所述差分圖像。
6.一種文檔圖像處理裝置,其特征在于,具備 取出部,其從輸入文檔圖像取出文檔要素;推定部,其推定取出的所述文檔要素的色空間的代表色; 算出部,其算出在所述色空間上分別分離所述代表色的分離平面; 置換部,其將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為同樣分布于所述分離區(qū)域的所述代表色;生成部,其生成將各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已經(jīng)實施了所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像。
7.一種文檔圖像處理方法,其特征在于,具備從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素的步驟;推定所述第一文檔要素各色空間的第一代表色和第二文檔要素各色空間的第二代表色的步驟;算出在所述色空間上分離各所述第一代表色的第一分離平面和在所述空間上分離各所述第二代表色的第二分離平面的步驟;將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為同樣分布于所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為同樣分布于所述分離區(qū)域的所述第二代表色的步驟;生成置換的各第一像素和置換的各第二像素的差分圖像的步驟。
8.如圖7所述的文檔圖像處理方法,其特征在于,還具備在所述第一代表色和與其對應的所述第二代表色類似的情況下將所述第一代表色置換為所述第二代表色的步驟。
9.如圖7所述的文檔圖像處理方法,其特征在于,還具備使用將所述第二各相素的色置換為所述第二代表色的所述預印數(shù)據(jù)和所述差分圖像構筑所述輸入文檔圖像的步驟。
10.如圖7所述的文檔圖像處理方法,其特征在于,還具備 和識別信息對應地存儲所述預印數(shù)據(jù)的步驟;將和所述輸入文檔圖像的識別信息一致或類似的、所述存儲的預印數(shù)據(jù)識別為所述輸入文檔圖像的預印數(shù)據(jù)的步驟。
11.如圖7所述的文檔圖像處理方法,其特征在于,還具備存儲將所述第二各像素的色置換為所述第二代表色的所述預印數(shù)據(jù)的步驟, 使用置換的各第一像素和所述存儲的預印數(shù)據(jù)的各第二像素生成所述差分圖像。
12.—種文檔圖像處理方法,其特征在于,具備 輸入輸入文檔圖像的步驟;從所述輸入文檔圖像的各像素取出文檔要素的步驟; 推定取出的所述文檔要素的色空間的代表色的步驟; 算出在所述色空間上分離所述代表色的分離平面的步驟;將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為分布于同所述分離區(qū)域的所述代表色的步驟;生成將各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已實施了所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像的步驟。
13.一種存儲介質(zhì),其存儲對輸入文檔圖像進行減色處理的程序,其特征在于,所述程序使計算機實施如下功能,即從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素的功能;推定各所述第一文檔要素的色空間的第一代表色和各所述第二文檔要素的色空間的第二代表色的功能;算出在所述色空間上分離各所述第一代表色的第一分離平面、在所述色空間上分離各所述第二代表色的第二分離平面的功能;將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為同樣分布于所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為同樣分布于所述分離區(qū)域的所述第二代表色的功能;生成置換的各第一像素和置換的各第二像素的差分圖像的功能。
14.如權利要求13所述的程序,其特征在于,還具備在所述第一代表色和與其對應的所述第二代表色類似的情況下將所述第一代表色置換為所述第二代表色的功能。
15.如權利要求13所述的程序,其特征在于,還具備使用將所述第二各相素的色置換為所述第二代表色的所述預印數(shù)據(jù)和所述差分圖像構筑所述輸入文檔圖像的功能。
16.如權利要求13所述的程序,其特征在于,還具備和識別信息對應地存儲所述預印數(shù)據(jù)的功能;將和所述輸入文檔圖像的識別信息一致或類似的、存儲于所述存儲部的所述預印數(shù)據(jù)識別為所述輸入文檔圖像的預印數(shù)據(jù)的功能。
17.如權利要求13所述的程序,其特征在于,還具備存儲將所述第二各像素的色置換為所述第二代表色的所述預印數(shù)據(jù)的功能,使用置換的各第一像素和存儲于所述存儲部的各第二像素生成所述差分圖像。
18.一種存儲介質(zhì),其存儲減色處理輸入文檔圖像的程序,其特征在于,所述程序使計算機實施以下功能,即從輸入文檔圖像的各像素取出文檔要素的功能;推定取出的所述文檔要素的色空間的代表色的功能;算出在所述色空間上分離所述代表色的分離平面的功能;將分布于通過所述分離平面分離的所述色空間的分離區(qū)域的所述文檔要素的各像素的色置換為同樣分布于所述分離區(qū)域的所述代表色的功能;生成將所述各像素的色置換為所述代表色的所述輸入文檔圖像的各像素和對應已經(jīng)實施所述代表色的置換的所述輸入文檔圖像的預印數(shù)據(jù)的各像素的差分圖像的功能。
全文摘要
本實施方式提供一種文檔圖像處理裝置,具備取出部,其從輸入文檔圖像的像素取出第一文檔要素,從對應所述輸入文檔圖像的預印數(shù)據(jù)的像素取出第二文檔要素;推定部,其推定所述第一文檔要素各色空間的第一代表色和第二文檔要素各色空間的第二代表色;算出部,其算出在所述色空間上分離各所述第一代表色的第一分離平面和在所述空間上分離各所述第二代表色的第二分離平面;置換部,其將分布于通過所述第一分離平面分離的所述色空間的分離區(qū)域的所述第一文檔要素的各第一像素的色置換為分布于同所述分離區(qū)域的所述第一代表色,將分布于通過第二分離平面分離的所述色空間的分離區(qū)域的所述第二文檔要素的各第二像素的色置換為分布于同所述分離區(qū)域的所述第二代表色;生成部,其生成置換的各第一像素和置換的各第二像素的差分圖像。
文檔編號G06T9/00GK102194116SQ20111004184
公開日2011年9月21日 申請日期2011年2月22日 優(yōu)先權日2010年3月15日
發(fā)明者小平直朗 申請人:東芝解決方案株式會社, 株式會社東芝
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
布拖县| 大同县| 祥云县| 安陆市| 朔州市| 潼南县| 澄江县| 格尔木市| 洪湖市| 宣化县| 潜山县| 伊吾县| 甘肃省| 高要市| 潼关县| 明光市| 陇川县| 同江市| 永福县| 莆田市| 庆城县| 龙泉市| 将乐县| 定襄县| 舟山市| 涪陵区| 长垣县| 确山县| 武汉市| 合肥市| 仪征市| 朝阳市| 台安县| 黔南| 邻水| 岚皋县| 冀州市| 吕梁市| 洪洞县| 平乐县| 鸡泽县|