欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖案分離提取程序、圖案分離提取裝置和圖案分離提取方法

文檔序號:6457748閱讀:160來源:國知局
專利名稱:圖案分離提取程序、圖案分離提取裝置和圖案分離提取方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于從多個相互重疊的印刷圖案中分離并提取任何 一個印刷圖案的程序、裝置和方法。
背景技術(shù)
如每個人所知道的,文件是其上根據(jù)預定格式由標線形成有一些輸 入欄的一張紙。通過手寫或印刷將字符和符號填入輸入欄中,或者在其 中蓋印圖章。由個人向文件添加的諸如手寫字符、復寫字符或圖章蓋印 的圖案被稱為后印刷圖案。在個人添加后印刷圖案之前在文件上印刷的 例如標線、字符或符號的圖案被稱為預印刷圖案。近年來,可以對文件內(nèi)容進行數(shù)字化并將其存儲在盤單元中。因此, 不必為紙件文本保留存儲空間。數(shù)字化需要諸如掃描儀或數(shù)字像機的圖像數(shù)據(jù)生成裝置、以及OCR (Optical Character Reader光學字符閱讀器)。 OCR表示通過將處理目標圖像中所包括的字符圖案或字符特征與基 準字符圖案或基準字符特征進行比較,或者通過找到處理目標圖像中的 分布邊界來生成文本數(shù)據(jù)的裝置。除了用于生成文本數(shù)據(jù)的基本功能之 外,特定類型的OCR還設置有用于分析處理目標圖像中的版面以將被識 別為圖案或圖章蓋印的區(qū)域保存為圖像數(shù)據(jù)的功能,以及用于通過從處 理目標圖像提取標線和印刷字符來分析預印刷圖案的結(jié)構(gòu)以將其存儲為 可以壓縮和編輯的向量數(shù)據(jù)的功能。當這種OCR識別處理目標圖像中的手寫字符,存儲圖章蓋印作為圖 像數(shù)據(jù),或者存儲預印刷圖案存儲作為向量數(shù)據(jù)時,諸如手寫字符、圖 章蓋印、標線和印刷字符的印刷圖案的重疊對字符識別、版面分析和預 印刷圖案結(jié)構(gòu)分析的處理有不良影響。因此,OCR的操作者必須分離彼 此重疊的多個印刷圖案,以提取各個圖案作為各個處理的初步處理。日本未審專利公報2005-071134 (JP2005-071134A)公開了一種用于 分離彼此重疊的兩個印刷圖案的方法(參見0027段和圖5)。在該公報中 所公開的分離提取方法使用顏色信息提取一個印刷圖案并去除另一印刷 圖案。具體地說,上述公報中所公開的技術(shù)在與文件圖像(在該文件圖像 上通過在顏色空間坐標系統(tǒng)上繪制各個像素的顏色的坐標點而表示了標 線和手寫字符)相關(guān)的顏色空間坐標上形成標線的顏色分布和手寫字符 的顏色分布。然后,該技術(shù)建立單個邊界(在該公報中被稱為閾值),該 單個邊界分離文件圖像中的標線的顏色分布和手寫字符的顏色分布,并 使相對于該邊界在標線的顏色分布側(cè)的像素的亮度級別為零。因此,從 該文件圖像去除了標線,而剩下手寫字符。如果使用去除了標線的文件 圖像,則OCR可以執(zhí)行字符識別處理,而不受標線部分的影響。如上所述,雖然JP2005-071134A中公開的技術(shù)可以提取僅包括手寫 字符的印刷圖案,但是它不能同時分離并提取僅包括與手寫字符重疊的 標線的印刷圖案。當然,如果對彼此重疊的各個印刷圖案重復執(zhí)行該分離提取處理, 則可以單獨地生成僅包括字符的印刷圖案的圖像、僅包括標線的印刷圖 案的圖像以及其他印刷圖案的圖像。然而,由于該分離提取處理的重復 次數(shù)必須等于要提取的印刷圖案的數(shù)量,因此該操作變得非常復雜。發(fā)明內(nèi)容考慮到上述常規(guī)技術(shù)的問題而開發(fā)了本發(fā)明。本發(fā)明的目的是使得 能夠從文件圖像單獨地提取各個印刷圖案。開發(fā)了本發(fā)明的圖案分離提取程序以實現(xiàn)上述目的。該程序使計算 機執(zhí)行以下功能顯示功能,用于在顯示裝置上顯示包括多個印刷圖案 的文件圖像,所述印刷圖案包括一個后印刷圖案以及一個或更多個后印 刷圖案和/或一個或更多個預印刷圖案;接受功能,用于通過輸入裝置, 對每一個印刷圖案,接受包括通過顯示功能顯示的文件圖像中的背景顏色和所述印刷圖案之一的顏色的部分,作為顏色樣本;近似直線指定(specification)功能,用于在通過接受功能接受的各個指定所指定的每 個顏色樣本的指定中指定背景顏色以外的顏色在顏色空間中的分布的近 似直線;歸屬度計算功能,用于根據(jù)像素的顏色與通過近似直線指定功 能指定的各條近似直線之間的距離,計算文件圖像中的所有像素中的每 一個像素對于各個印刷圖案的歸屬度;歸屬目標確定功能,用于當文件 圖像中的所有像素中的每一個像素對于一印刷圖案的歸屬度超過預定閾值時,將該印刷圖像確定為像素的歸屬目標;生成功能,用于對通過歸屬目標確定功能確定為像素所屬的各個印刷圖案,根據(jù)屬于一個印刷圖案的像素,生成僅包括該印刷圖案的圖像的圖像數(shù)據(jù);以及輸出功能, 用于輸出與通過生成功能生成的各個印刷圖案相關(guān)的圖像數(shù)據(jù)。通過這種結(jié)構(gòu),計算機對于文件圖像中所包括的各個印刷圖案,生 成圖像數(shù)據(jù)。由此,從文件圖像中單獨地提取各個印刷圖案。當生成與各個印刷圖案相關(guān)的圖像數(shù)據(jù)時,計算機將文件圖像中的 對于多個印刷圖案具有高歸屬度的像素視為構(gòu)成這些印刷圖案的像素。 即,文件圖像中的像素不僅構(gòu)成一個印刷圖案圖像,而且在某些情況下 構(gòu)成多個印刷圖案圖像。因此,可以將所生成的各個印刷圖案圖像用作OCR的字符識別處理的目標,而不受缺少具有高歸屬度的像素等的影響。如上所述,根據(jù)本發(fā)明,可以從文件圖像單獨地提取各個印刷圖案。


圖1是表示根據(jù)本發(fā)明實施方式的圖案分離提取裝置的結(jié)構(gòu)的框圖,圖2表示根據(jù)文件圖像數(shù)據(jù)的文件圖像的示例, 圖3是表示圖案分離提取處理的流程圖, 圖4表示顏色樣本的選擇方法,圖5是表示前景顏色分布近似直線指定子例程的流程圖,圖6是其球形表面被分為預定數(shù)量的單位區(qū)域的單位球的示意圖,圖7表示第一工作表的數(shù)據(jù)結(jié)構(gòu)的示例,圖8表示第二工作表的數(shù)據(jù)結(jié)構(gòu)的示例,圖9A表示第一顏色樣本的前景像素的顏色分布, 圖9B表示第二顏色樣本的前景像素的顏色分布, 圖10表示以背景典型顏色的坐標為中心的單位球與近似直線之間 的關(guān)系,圖11是表示歸屬目標確定子例程的流程圖, 圖12表示第三工作表的數(shù)據(jù)結(jié)構(gòu)的示例, 圖13表示歸屬度的計算方法, 圖14A表示僅包括第一印刷圖案的圖像, 圖14B表示僅包括第二印刷圖案的圖像, 圖15表示歸屬度的計算方法的變型。
具體實施方式
下面參照附圖描述本發(fā)明的實施方式。首先,描述根據(jù)本實施方式的計算機網(wǎng)絡系統(tǒng)的硬件結(jié)構(gòu)和軟件結(jié)構(gòu)。圖1是表示本實施方式的圖案分離提取裝置的結(jié)構(gòu)的框圖。本實施方式的圖案分離提取裝置10是增加了圖案分離提取功能的 個人計算機。因此,圖案分離提取裝置10包括顯示裝置10a,例如液 晶顯示器;輸入裝置10b,例如鍵盤和鼠標;以及這些裝置10a和10b所 連接到的主體。該主體包括存儲裝置10c、 CPU (中央處理單元)10d和 DRAM (動態(tài)隨機存取存儲器)10e。存儲裝置10c存儲各種應用程序和數(shù)據(jù)。CPU 10d是根據(jù)存儲裝置 內(nèi)的程序進行處理的處理單元。DRAM 10e是易失性存儲裝置,其緩存 (cashed)程序,并且當CPU 10d進行處理時展開工作區(qū)。將文件圖像數(shù)據(jù)11和圖案分離提取工具軟件12安裝到圖案分離提 取裝置10的存儲裝置10c中。圖1表示將文件圖像數(shù)據(jù)11和圖案分離 提取工具軟件12展開到DRAM 10e上的狀態(tài)。文件圖像數(shù)據(jù)11是用于顯示文件圖像的數(shù)據(jù),并且是通過掃描儀對 文件的內(nèi)容進行數(shù)字化而生成的。文件是其上根據(jù)預定格式由標線形成有一些輸入欄的一張紙。通過手寫或印刷將字符和符號填入輸入欄,或 者在其中蓋印圖章。由個人向文件添加的諸如手寫字符、復寫字符或圖 章蓋印的圖案被稱為后印刷圖案。在個人添加后印刷圖案之前在文件上 印刷的諸如標線、字符或符號的圖案被稱為預印刷圖案。 圖2表示根據(jù)文件圖像數(shù)據(jù)11的文件圖像的示例。如圖2所示,在該實施方式中,文件圖像包含多個印刷圖案,這些印刷圖案包括一個后印刷圖案、以及一個或更多個后印刷圖案和/或預印刷圖案。這些圖案彼此重疊。具體地說,該文件圖像包含第一印刷圖 案,其包括四個印刷日本漢字字符;以及第二印刷圖案,其是包括矩形框和該框內(nèi)的日本漢字字符的圖章蓋印。第一印刷圖案的日本漢字字符表示姓名"山田太郎(Taro Yamada)"。第二印刷圖案的日本漢字字符表 示"印(seal)"。第二印刷圖案被設置為使得該第二印刷圖案的上半部分 與第一印刷圖案的最后一個日本漢字字符重疊。圖1的圖案分離提取工具軟件12根據(jù)如圖2所示的文件圖像,對每 個印刷圖案生成僅包括一個印刷圖案的圖像。以下描述由CPU 10d根據(jù) 圖案分離提取工具軟件12執(zhí)行的處理的內(nèi)容。接下來,描述由該實施方式的圖案分離提取裝置IO執(zhí)行的處理的流程。當操作者通過輸入裝置10b輸入預定操作時,CPU 10d啟動圖案分 離提取工具軟件12。然后,在圖案分離提取裝置10中開始圖案分離提取 處理。圖3是表示圖案分離提取處理的流程圖。在圖案分離提取處理的第一步驟S101中,CPU 10d通過輸入裝置 10b從操作者接受存儲裝置10c中的任何一條文件圖像數(shù)據(jù)11的指定。在下一步驟S102中,CPU 10d根據(jù)在步驟S101中接受的指定所指 定的文件圖像數(shù)據(jù)ll,將文件圖像顯示在顯示裝置10a上。步驟S102與 上述顯示功能相對應,執(zhí)行步驟S102的CPU 10d與顯示部分相對應。然 后,CPU10d使處理前進到步驟S103。在步驟S103中,CPU10d通過輸入裝置10b從操作者接受指定,該指定用于選擇在顯示裝置10a上顯示的文件圖像中的被拖動部分作為顏色樣本。此時,操作者必須選擇一部分,以使得從文件圖像選擇的部分 包含背景顏色和背景顏色以外的僅一種顏色。圖4表示用于選擇顏色樣本的方法。如圖4所示,由于第二印刷圖案不與第一印刷圖案的第一字符重疊, 所以操作者選擇包括第一字符的部分作為第一顏色樣本lla。因此,第一 顏色樣本lla僅包括背景顏色和第一印刷圖案的字符的顏色。然后,操 作者選擇不與第一印刷圖案的最后一個字符重疊的第二印刷圖案的下半 部分作為第二顏色樣本llb。因此,第二印刷圖案僅包括背景顏色和第二 印刷圖案的圖章蓋印的顏色。在下一步驟S104中,CPU 10d從文件圖像數(shù)據(jù)11中裁剪在步驟S103 中接受的指定所指定的部分,并將其作為顏色樣本數(shù)據(jù)存儲到DRAM 12 中。在下一步驟S105中,CPU 10d確定操作者是否指示結(jié)束顏色樣本的 指定。當操作者沒有指示結(jié)束顏色樣本的指定時,CPU 10d從步驟S105 對該處理進行分支,使該處理返回到步驟S103。另一方面,當操作者指 示結(jié)束顏色樣本的指定時,CPU 10d執(zhí)行第一處理循環(huán)Ll。步驟S103 到S105與上述接受功能相對應,執(zhí)行步驟S103到S105的CPU 10d與接 受部分相對應。在第一處理循環(huán)L1中,CPU 10d進而對在步驟S103中接受的指定所指定的各個顏色樣本執(zhí)行步驟S106。在步驟S106中,CPU 10d執(zhí)行前景顏色分布近似直線指定子例程。 圖5是表示前景顏色分布近似直線指定子例程的流程圖。 在前景顏色分布近似直線指定子例程的第一步驟S201中,CPU10d使用預定閾值對處理目標的顏色樣本的各個像素的亮度級進行二值化,并生成二值圖像。在下一步驟S202中,CPU 10d將在步驟S201中生成的二值圖像的像素分為作為前景像素的二進制亮度級為"1"的像素組以及作為背景像 素的二進制亮度級為"0"的像素組。在下一步驟S203中,CPU 10d通過計算文件圖像中的所有背景像素 的顏色分量的平均值,來指定背景典型顏色的分量值。在下一步驟S204中,CPU 10d在例如CIE 1931標準比色 (colorimetric)系統(tǒng)的顏色空間坐標系中,繪制在步驟S203中指定的背 景典型顏色的坐標點,并建立以該坐標點為中心的單位球。在下一步驟S205中,CPU 10d將在步驟S204建立的單位球的球形 表面分為預定數(shù)量的單位區(qū)域。圖6是其球形表面被分為預定數(shù)量的單位區(qū)域的單位球的示意圖。如圖6所示,通過多面體近似將該單位球等分為多個單位區(qū)域(單 位表面)。向每個單位區(qū)域賦予區(qū)域號,以單獨地識別它們。此外,生成 指定各個單位區(qū)域的位置的位置信息。該位置信息由單位區(qū)域的頂點的 坐標或其質(zhì)心坐標來定義。當在單位球上建立單位區(qū)域時,生成區(qū)域號 和位置信息,并在第一工作表中對區(qū)域號和位置信息進行管理。圖7表示第一工作表的數(shù)據(jù)結(jié)構(gòu)的示例。如圖7所示,第一工作表具有與在單位球上建立的單位區(qū)域一樣多 的記錄。每條記錄都具有"區(qū)域號"、"位置信息"和"頻度"的字段。"區(qū) 域號"字段存儲單位區(qū)域的區(qū)域號。"位置信息"字段存儲單位區(qū)域的位 置信息。"頻度"字段存儲連接處理目標前景像素的顏色的坐標點與單位 球的中心的直線當中的通過單位區(qū)域的直線的數(shù)量。在步驟S205時,將第一工作表中的各條記錄的"頻度"字段初始化為0。CPU 10d在如圖6所示的單位球上建立單位區(qū)域,并在DRAM 10e 上生成如圖7所示的第一工作表。然后,CPU 10d執(zhí)行圖5的第三處理 循環(huán)L3。在第三處理循環(huán)L3中,CPU10d進而對處理目標顏色樣本的每一個 前景像素執(zhí)行步驟S206和S207。在步驟S206中,CPU10d在顏色空間坐標系中,指定連接處理目標 前景像素的顏色的坐標點與上述單位球的中心的直線所通過的單位區(qū) 域。在下一步驟S207中,CPU10d在圖7的第一工作表中,使與在步驟 S206中指定的單位區(qū)域像對應的記錄的"頻度"字段中的值遞增。因此,當CPU 10d執(zhí)行與處理目標顏色樣本的所有前景像素相關(guān)的 步驟S206和S207時,可以對在步驟S205中在單位球上建立的每個單位 區(qū)域,對通過單位區(qū)域的直線的數(shù)量進行計數(shù)。在執(zhí)行第三處理循環(huán)L3之后,在下一步驟S208中,CPU10d指定 圖7的第一工作表中的"頻度"字段中的值最大的記錄。在下一步驟S209中,CPU 10d根據(jù)在步驟S204中建立的單位球的 中心坐標和在步驟S208中指定的記錄的"位置信息"字段中的值,來指 定連接單位球與單位區(qū)域的中心的直線。具體地說,通過確定直線的方 向向量和單位球的中心坐標,來指定直線。CPU 10d計算(Xg-Xo, Yg-Yo, Zg-Zo)來指定方向向量,其中所指定的單位區(qū)域的質(zhì)心坐標是(Xg,Yg, Zg)并且單位球的中心坐標是(Xo, Yo,Zo)。其后,CPU10d將由所指 定的方向向量和單位球的中心坐標定義的直線用作處理目標顏色樣本的 所有前景像素的顏色的分布的近似直線。在指定與處理目標顏色樣本的 所有前景像素的分布相關(guān)的近似直線時,CPU 10d將該近似直線的方向 向量和單位球的中心坐標存儲到第二工作表中。圖8表示第二工作表的數(shù)據(jù)結(jié)構(gòu)的示例。如圖8所示,第二工作表具有與顏色樣本一樣多的記錄。每條記錄 都具有"樣本"、"方向向量"和"單位球的中心坐標"的字段。"樣本"字段存儲顏色樣本號,該顏色樣本號用于識別在步驟S103中接受的顏色 樣本。"方向向量"字段存儲在步驟S209中計算的、與有關(guān)顏色樣本相 關(guān)的方向向量。"單位球的中心坐標"字段存儲在步驟S204中建立的單 位球的中心坐標。在將在步驟S209中指定的直線的方向向量和單位球的中心坐標記 錄到如圖8所示的第二工作表中之后,CPU 10d結(jié)束圖5的前景顏色分 布近似直線指定子例程,并對有關(guān)處理目標顏色樣本結(jié)束圖3中的第一 處理循環(huán)L1。當CPU 10d對在步驟S103中接受的指定所指定的所有顏色樣本執(zhí)行圖3的步驟S106 (圖5的前景顏色分布近似直線指定子例程)時,分 別對顏色樣本指定顏色空間坐標系上的近似直線,并將與顏色樣本相對 應的記錄存儲到圖8的第二工作表中。這里,將描述近似直線的細節(jié)。當將印刷在紙上的諸如字符、圖案 和圖章蓋印的內(nèi)容數(shù)字化為數(shù)字圖像時,代表背景(紙本身)的像素的 顏色和實際(solidly)填寫的區(qū)域以高斯(Gaussian)分布進行分布。另 一方面,代表諸如字符和圖章蓋印的線圖案的像素的顏色以線性分布進 行分布,由于墨水的不均勻性等,使得該線性分布的一個端點與背景的 顏色分布的中心一致。L. Todoran和M. Worring在1999年的關(guān)于文件分 析禾卩識另U的國際會議(International Conference on Document Analysis and Recognition (ICDAR))中報告了該現(xiàn)象。通過對線圖案的線性顏色分布 進行近似來獲得近似直線。圖9A和圖9B分別表示圖4的第一顏色樣本11a的前景像素的顏色 分布以及第二顏色樣本lib的前景像素的顏色分布。如圖9A和9B中的淺灰色的坐標點所示,在圖像中代表背景的像素 (背景像素)的顏色的坐標點表現(xiàn)出沒有方向性的塊狀分布(massive distribution)。另一方面,如圖9A和9B中的深灰色的坐標點所示,代表 諸如字符和蓋印的線圖案的像素(前景像素)的顏色的坐標點表現(xiàn)出線 性分布,該線性分布的一個端點與塊狀分布的中心一致。在圖9A和9B 表示的顏色分布中,示出了通過對代表線圖案的像素(前景像素)的顏 色分布進行近似而獲得的直線。圖10表示以背景典型顏色的坐標為中心的單位球與近似直線之間 的關(guān)系。如圖10所示,近似直線的一個端點與單位球的中心一致,并且該近 似直線穿過通過將像素的顏色坐標投影到單位球的球形表面上而形成的 分布的頂點。圖5的上述步驟S204到S208指定了通過將像素的顏色坐 標投影到球形表面上而形成的分布的頂點。在該實施方式中,根據(jù)通過 投影到球形表面上而形成的分布來指定近似直線。然而,也可以根據(jù)最 小二乘法來指定近似直線。在執(zhí)行第一處理循環(huán)Ll并獲得與各個顏色樣本相關(guān)的近似直線之后,CPU10d使處理前進到圖3的步驟S107。第一處理循環(huán)L1與上述近 似直線指定功能相對應,執(zhí)行第一處理循環(huán)Ll的CPU 10d與近似直線指 定部分相對應。在步驟S107中,CPU 10d通過使用預定閾值對文件圖像的像素的亮 度級進行二值化,來生成二值圖像。在下一步驟S108中,CPU 10d從在步驟S107中生成的二值圖像的 像素中提取二進制亮度級為"1"的像素組作為前景像素。然后,CPU 10d 執(zhí)行第二處理循環(huán)L2。在第二處理循環(huán)L2中,CPU 10d依次對文件圖像中的每一個前景像 素重復執(zhí)行步驟S109。在步驟S109中,CPU10d執(zhí)行歸屬目標確定子例程。圖11是表示歸屬目標確定子例程的流程圖。在歸屬目標確定子例程的第一步驟S301中,CPU10d計算從處理目 標前景像素到在步驟S106中指定的近似直線的距離,并將所計算的距離 記錄到第三工作表中,作為下述的歸屬度。圖12表示第三工作表的數(shù)據(jù)結(jié)構(gòu)的示例。如圖12所示,第三工作表具有與前景像素一樣多的記錄。每一條記 錄都具有"前景像素號"、"坐標"、"歸屬度"、"歸屬"以及"到近似平 面的距離"的字段。"前景像素號"字段存儲前景像素號,該前景像素號 用于從各個前景像素中單獨地識別前景像素。"坐標"字段存儲顏色空間 坐標系中的前景像素的坐標。"歸屬度"字段存儲與前景像素相關(guān)的對每 個印刷圖案的歸屬度的組合(下面說明)。"歸屬"字段存儲與前景像素 所屬的印刷圖案相對應的顏色樣本的數(shù)量。"到近似平面的距離"字段存 儲包含兩條近似直線的近似平面與有關(guān)前景像素之間的距離。存在與從 所有近似直線中選擇的兩條近似直線的組合一樣多的近似平面。"到近似 平面的距離"字段存儲與這些組合一樣多的距離。在執(zhí)行步驟S301時,第三工作表中的與處理目標前景像素相對應的 記錄的"歸屬"字段是空白的。圖13表示用于計算歸屬度的方法。圖13表示從背景像素的典型顏色的坐標點(從上述單位球的中心)延伸的兩條近似直線的示例。通常,前景像素的顏色的坐標點分布在近 似直線的周圍或它們之間。當前景像素的坐標點位于兩條近似直線之間,并且假設前景像素的坐標點與第一近似直線之間的距離是d,并且坐標點與第二近似直線之間的距離是d2時,將前景像素對于顏色坐標點分布在第一近似直線附近的第一印刷圖案的歸屬度m,表示為l-(d,/(d,+ d2》。 類似地,將前景像素對于顏色坐標點分布在第二近似直線附近的第二印刷圖案的歸屬度m2表示為l-(cy(山+d2》。根據(jù)這些公式可以看出,歸屬度位于0到1的范圍內(nèi)。更一般地說,特定像素對于與第i近似直線相對應的印刷圖案的歸屬度m由以下公式表示 m=l-( dj/Edi)其中di (1《i《N)是第i近似直線與像素的顏色的坐標之間的距離, 而N是近似直線的總數(shù)。在對每條近似直線計算這種歸屬度r^和m2時,CPU 10d將歸屬度 的組合存儲到與圖12的第三表格中的處理目標前景像素相對應的記錄的 "歸屬度"字段。然后,CPU 10d執(zhí)行圖11的第四處理循環(huán)L4。步驟 S301與上述歸屬度計算功能相對應,執(zhí)行步驟S302的CPU 10d與歸屬 度計算部分相對應。在第四處理循環(huán)L4中,CPU 10d對在步驟S301中對處理目標前景 像素計算的每一個歸屬度執(zhí)行步驟S302和S303。在步驟S302中,CPU 10d確定處理目標的歸屬度是否超過預定閾值。 例如,該預定閾值是0.3。當處理目標的歸屬度小于預定閾值時,CPU10d 從步驟S302對該處理進行分支,并結(jié)束第四處理循環(huán)L4中的針對處理 目標的歸屬度的處理。另一方面,當處理目標的歸屬度等于或大于預定 閾值時,CPU10d使處理前進到步驟S303。在步驟S303中,CPU10d采用處理目標前景像素作為與處理目標歸 屬度的近似直線相對應的圖案圖像的前景像素。即,CPU 10d另外將與印刷圖案相對應的顏色樣本的編號登記到圖12的第三工作表中的處理目 標前景像素的記錄的"歸屬"字段中。因此,當生成僅包括印刷圖案的 圖像的數(shù)據(jù)時,采用處理目標前景像素作為構(gòu)成圖像的像素。然后,CPU10d結(jié)束第四處理循環(huán)L4中的針對處理目標的歸屬度的處理。由于CPU 10d對在步驟S301中計算的每一個歸屬度執(zhí)行步驟S303 和S304的處理,所以確定了處理目標前景像素所屬的一個或更多個印刷 圖案。在執(zhí)行第四處理循環(huán)L4之后,CPU 10d使處理前進到步驟S304。在步驟S304中,CPU 10d計算包含兩條近似直線的近似平面與處理 目標前景像素之間的距離。對從在步驟S106中指定的所有近似直線中選 擇的兩條近似直線的組合中的每一個組合計算該距離。然后,CPU 10d 將所有計算出的距離記錄到圖12的第三工作表中的處理目標前景像素的 記錄的"到近似平面的距離"字段。在下一步驟S305中,CPU 10d確定在步驟S304中計算的所有距離 是否超過預定閾值。當在步驟S304中計算的所有距離超過預定閾值時,CPU 10d使處理 前進到步驟S306。在步驟S306中,CPU 10d取消處理目標前景像素在步驟S303中作 為印刷圖案的前景像素的應用。即,CPU10d從圖12的第三工作表中的 處理目標前景像素的記錄的"歸屬(imputed)"字段中刪除所有的值,并 使該字段空白。因此,如果到各近似平面的所有距離超過該閾值,則認為該處理目 標前景像素是噪聲,并且不再將其用于任何印刷圖案。在執(zhí)行步驟S306之后,CPU 10d結(jié)束與圖ll相關(guān)的歸屬目標確定 子例程,并結(jié)束圖3的第二處理循環(huán)L2中的對于處理目標前景像素的處 理。另一方面,當在步驟S305中,在步驟S304中計算的至少一個距離 小于預定閾值時,CPU10d從步驟S305對該處理進行分支,并結(jié)束與圖 11相關(guān)的歸屬目標確定子例程,而不執(zhí)行步驟S306。然后,CPU10d結(jié)束圖3的第二處理循環(huán)L2中的對于處理目標前景像素的處理。由于CPU 10d對文件圖像中的每一個前景像素執(zhí)行圖3的步驟S109 的處理(圖11的歸屬目標確定子例程),所以確定了處理目標前景像素 所屬的一個或更多個印刷圖案。第四處理循環(huán)L4與上述歸屬目標確定功 能相對應,執(zhí)行第四處理循環(huán)L4的CPU 1 Od與歸屬目標確定部分相對應。在執(zhí)行第二處理循環(huán)L2之后,在下一步驟S110中,CPU 10d根據(jù) 圖12的第三工作表,對文件圖像中的每個印刷圖案,生成包含屬于該印 刷圖案的前景像素的圖像的數(shù)據(jù)。因此,對每個印刷圖案生成包括一個 印刷圖案的圖像數(shù)據(jù)。步驟S110與上述生成功能相對應,執(zhí)行步驟SllO 的CPU 10d與生成部分相對應。在下一步驟S111中,CPU 10d輸出在步驟S110中生成的印刷圖案 圖像數(shù)據(jù)。將該數(shù)據(jù)輸出到盤裝置、顯示裝置10a、 OCR (光學字符閱讀 器)、網(wǎng)絡上的另一計算機等。在輸出印刷圖案圖像數(shù)據(jù)時,CPU10d結(jié) 束與圖3相關(guān)的處理。步驟Slll與上述輸出功能相對應,執(zhí)行步驟Slll 的CPU 10d與輸出部分相對應。接下來,將描述該實施方式的圖案分離提取裝置10的操作和效果。當圖案分離提取裝置10的操作者通過輸入裝置10b啟動圖案分離提 取工具12時,例如在顯示裝置10a上顯示輸入畫面。操作者可以通過該 輸入畫面選擇并指定存儲裝置10c內(nèi)的任何其中一個文件圖像數(shù)據(jù)(步 驟S101)。然后,將操作者選擇的文件圖像顯示在顯示裝置10a上(步驟S102)。 操作者可以在顯示裝置10a上顯示的文件圖像上通過拖動操作來選擇并 指定顏色樣本(步驟S103)。并且如果操作者在指定一些顏色樣本之后, 通過輸入裝置10b輸入結(jié)束指定顏色樣本的指定,則圖案分離提取裝置 10對操作者選擇的文件圖像中所包括的每個印刷圖案生成并輸出包括一 個印刷圖案的圖像數(shù)據(jù)。圖14A表示第一印刷圖案的一個示例,圖14B表示第二印刷圖案圖 像的一個示例。如圖14A和14B所示,分別提取出在重疊狀態(tài)下包含在圖2的文件圖像中的第一印刷圖案和第二印刷圖案并將其顯示為獨立圖像。當生成與各個印刷圖案相關(guān)的圖像數(shù)據(jù)時,計算機將文件圖像中的 對于多個印刷圖案具有高歸屬度的像素視為構(gòu)成這些印刷圖案的像素(步驟S303)。 g卩,文件圖像的像素可以不僅構(gòu)成一個印刷圖案,而且在某些情況下構(gòu)成多個印刷圖案。例如,當閾值是0.3時,對于第一印刷圖案和第二印刷圖案的歸屬 度的組合是(0.1, 0.9)的前景像素僅屬于第二印刷圖案。然而,如果組 合是(0.45, 0.55),則有關(guān)前景像素屬于第一印刷圖案和第二印刷圖案 兩者。因此,可以將所生成的各個印刷圖案圖像用作OCR的字符識別處 理的目標,而不受缺少具有高歸屬度的像素的影響等。在本實施方式中,對于任何近似直線使用公共閾值來確定歸屬度。 然而,本發(fā)明的范圍不限于此。例如,可以與近似直線相對應地改變閾 值。在本實施方式中,如圖13所示,根據(jù)前景像素的坐標點與各近似直 線之間的距離山和d2來計算歸屬度。然而,本發(fā)明的范圍不限于此。例 如,如圖15所示,可以根據(jù)在連接前景像素的坐標點與背景像素的典型顏色的坐標點的直線與各近似直線之間形成的內(nèi)角e,和e2,來計算歸屬度m)禾口 m2。艮P,將歸屬度rm表示為1-{ 9 ,/(9 ^0 2)},將歸屬度m2表示為 1-{92/(61+92)}。更一般地說,特定像素對于與第i近似直線相對應的印刷圖案的歸 屬度m由以下公式表示 m=l-(ei/E 0i),其中6 i (1《i《N)是在第i近似直線與連接背景顏色的坐標和像素 的顏色的坐標的直線之間形成的內(nèi)角,N是近似直線的總數(shù)。
權(quán)利要求
1、一種計算機可讀介質(zhì),該計算機可讀介質(zhì)包含圖案分離提取程序,該圖案分離提取程序控制計算機執(zhí)行包括以下的功能顯示功能,用于在顯示裝置上顯示包括多個印刷圖案的文件圖像,該多個印刷圖案包括一個后印刷圖案,以及一個或更多個后印刷圖案和/或一個或更多個預印刷圖案;接受功能,用于通過輸入裝置,對所述印刷圖案中的每一個,接受包括通過所述顯示功能顯示的文件圖像中的背景顏色和所述多個印刷圖案之一的顏色的部分,作為顏色樣本;近似直線指定功能,用于在通過所述接受功能接受的各個指定所指定的各個顏色樣本的指定中指定背景顏色以外的顏色在顏色空間中的分布的近似直線;歸屬度計算功能,用于根據(jù)像素的顏色與通過所述近似直線指定功能指定的各條近似直線之間的距離,來計算所述文件圖像中的所有像素中的每一個像素對于各個印刷圖案的歸屬度;歸屬目標確定功能,用于當所述文件圖像中的所有像素中的每一個像素對于一印刷圖案的歸屬度超過預定閾值時,將該印刷圖案確定為該像素的歸屬目標;生成功能,用于對通過所述歸屬目標確定功能確定為所述像素所屬的各個印刷圖案,根據(jù)屬于一個印刷圖案的像素,生成僅包括該印刷圖案的圖像的圖像數(shù)據(jù);以及輸出功能,用于輸出與通過所述生成功能生成的各個印刷圖案相關(guān)的圖像數(shù)據(jù)。
2、 根據(jù)權(quán)利要求l所述的計算機可讀介質(zhì),其中,所述近似直線指 定功能在所述顏色空間中的所述顏色樣本中,建立以所述背景顏色的坐 標點為中心的單位球,將所述單位球的球形表面等分為預定數(shù)量的單位 區(qū)域,并且其中,所述近似直線指定功能指定連接所述背景顏色的坐標 點和所述背景顏色以外的顏色的坐標點的最大數(shù)量的直線所通過的一個單位區(qū)域,并指定連接所述指定單位區(qū)域與所述背景顏色的所述坐標點 的直線作為所述近似直線。
3、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述歸屬度計算功能通過l-(d/Edi)來計算特定像素對于與第i近似直線相對應的印刷圖 案的歸屬度,其中di (1《i《N)是第i近似直線與該像素的顏色的坐標 之間的距離,而N是近似直線的總數(shù)。
4、 根據(jù)權(quán)利要求l所述的計算機可讀介質(zhì),其中,所述歸屬度計算 功能通過l-( e /E e i)來計算特定像素對于與第i近似直線相對應的印刷 圖案的歸屬度,其中6i (1《i《N)是在第i近似直線與連接所述背景顏 色的坐標和該像素的顏色的坐標的直線之間形成的內(nèi)角,而N是近似直 線的總數(shù)。
5、 根據(jù)權(quán)利要求l所述的計算機可讀介質(zhì),其中,所述歸屬目標確 定功能對于從通過所述近似直線指定功能指定的所有近似直線中選擇的 兩條近似直線的每一個組合,計算特定像素與包含兩條近似直線的近似 平面之間的距離,并且當所計算的所有距離都超過預定閾值時,取消采 用該特定像素,并且其中,所述歸屬目標確定功能對所述文件圖像中的 每一個像素執(zhí)行所述計算和取消。
6、 一種圖案分離提取裝置,該圖案分離提取裝置包括 顯示部分,用于在顯示裝置上顯示包括多個印刷圖案的文件圖像,該多個印刷圖案包括一個后印刷圖案,以及一個或更多個后印刷圖案和/ 或一個或更多個預印刷圖案;接受部分,用于通過輸入裝置,對所述印刷圖案中的每一個,接受 包括通過所述顯示部分顯示的文件圖像中的背景顏色和所述多個印刷圖 案之一的顏色的部分,作為顏色樣本;近似直線指定部分,用于在通過所述接受部分接受的各個指定所指 定的各個顏色樣本的指定中指定背景顏色以外的顏色在顏色空間中的分 布的近似直線;歸屬度計算部分,用于根據(jù)像素的顏色與通過所述近似直線指定部 分指定的各條近似直線之間的距離,來計算所述文件圖像中的所有像素中的每一個像素對于各個印刷圖案的歸屬度;歸屬目標確定部分,用于當所述文件圖像中的所有像素中的每一個 像素對于一印刷圖案的歸屬度超過預定閾值時,將該印刷圖案確定為該像素的歸屬目標;生成部分,用于對通過所述歸屬目標確定部分確定為所述像素所屬 的各個印刷圖案,根據(jù)屬于一個印刷圖案的像素,生成僅包括該印刷圖 案的圖像的圖像數(shù)據(jù);以及輸出部分,用于輸出與通過所述生成部分生成的各個印刷圖案相關(guān) 的圖像數(shù)據(jù)。
7、 根據(jù)權(quán)利要求6所述的圖案分離提取裝置,其中,所述近似直線 指定部分在所述顏色空間中的所述顏色樣本中,建立以所述背景顏色的 坐標點為中心的單位球,將所述單位球的球形表面等分為預定數(shù)量的單 位區(qū)域,并且其中,所述近似直線指定部分指定連接所述背景顏色的坐 標點和所述背景顏色以外的顏色的坐標點的最大數(shù)量的直線所通過的一 個單位區(qū)域,并指定連接所述指定單位區(qū)域與所述背景顏色的所述坐標 點的直線作為所述近似直線。
8、 根據(jù)權(quán)利要求6所述的圖案分離提取裝置,其中,所述歸屬度計 算部分通過l-(di/I]di)來計算特定像素對于與第i近似直線相對應的印刷 圖案的歸屬度,其中di (1《i《N)是第i近似直線與該像素的顏色的坐 標之間的距離,而N是近似直線的總數(shù)。
9、 根據(jù)權(quán)利要求6所述的圖案分離提取裝置,其中,所述歸屬度計 算部分通過l-( e /E e i)來計算特定像素對于與第i近似直線相對應的印 刷圖案的歸屬度,其中9i (Ki《N)是在第i近似直線與連接所述背景 顏色的坐標和該像素的顏色的坐標的直線之間形成的內(nèi)角,而N是近似 直線的總數(shù)。
10、 根據(jù)權(quán)利要求6所述的圖案分離提取裝置,其中,所述歸屬目 標確定部分對于從通過所述近似直線指定部分指定的所有近似直線中選 擇的兩條近似直線的每一個組合,計算特定像素與包含兩條近似直線的 近似平面之間的距離,并且當所計算的所有距離都超過預定閾值時,取消采用該特定像素,并且其中,所述歸屬目標確定部分對所述文件圖像 中的每一個像素執(zhí)行所述計算和取消。
11、 一種計算機執(zhí)行的圖案分離提取方法,該圖案分離提取方法包括顯示過程,用于在顯示裝置上顯示包括多個印刷圖案的文件圖像, 該多個印刷圖案包括一個后印刷圖案,以及一個或更多個后印刷圖案和/ 或一個或更多個預印刷圖案;接受過程,用于通過輸入裝置,對所述印刷圖案中的每一個,接受 包括通過所述顯示過程顯示的文件圖像中的背景顏色和所述多個印刷圖 案之一的顏色的部分,作為顏色樣本;近似直線指定過程,用于在通過所述接受過程接受的各個指定所指 定的各個顏色樣本的指定中指定背景顏色以外的顏色在顏色空間中的分布的近似直線;歸屬度計算過程,用于根據(jù)像素的顏色與通過所述近似直線指定過 程指定的各條近似直線之間的距離,來計算所述文件圖像中的所有像素 中的每一個像素對于各個印刷圖案的歸屬度;歸屬目標確定過程,用于當所述文件圖像中的所有像素中的每一個 像素對于一印刷圖案的歸屬度超過預定閾值時,將該印刷圖案確定為該 像素的歸屬目標;生成過程,用于對通過所述歸屬目標確定過程確定為所述像素所屬 的各個印刷圖案,根據(jù)屬于一個印刷圖案的像素,生成僅包括該印刷圖 案的圖像的圖像數(shù)據(jù);以及輸出過程,用于輸出與通過所述生成過程生成的各個印刷圖案相關(guān) 的圖像數(shù)據(jù)。
12、 根據(jù)權(quán)利要求ll所述的圖案分離提取方法,其中,所述近似直 線指定過程在所述顏色空間中的所述顏色樣本中,建立以所述背景顏色 的坐標點為中心的單位球,將所述單位球的球形表面等分為預定數(shù)量的 單位區(qū)域,并且其中,所述近似直線指定過程指定連接所述背景顏色的 坐標點和所述背景顏色以外的顏色的坐標點的最大數(shù)量的直線所通過的一個單位區(qū)域,并指定連接所述指定單位區(qū)域與所述背景顏色的所述坐 標點的直線作為所述近似直線。
13、 根據(jù)權(quán)利要求ll所述的圖案分離提取方法,其中,所述歸屬度計算過程通過l-(d/Edi)來計算特定像素對于與第i近似直線相對應的印 刷圖案的歸屬度,其中di (1《i《N)是第i近似直線與該像素的顏色的 坐標之間的距離,而N是近似直線的總數(shù)。
14、 根據(jù)權(quán)利要求ll所述的圖案分離提取方法,其中,所述歸屬度 計算過程通過l-( e 9 i)來計算特定像素對于與第i近似直線相對應的 印刷圖案的歸屬度,其中9j (1《i《N)是在第i近似直線與連接所述背 景顏色的坐標和該像素的顏色的坐標的直線之間形成的內(nèi)角,而N是近 似直線的總數(shù)。
15、 根據(jù)權(quán)利要求ll所述的圖案分離提取方法,其中,所述歸屬目 標確定過程對于從通過所述近似直線指定過程指定的所有近似直線中選 擇的兩條近似直線的每一個組合,計算特定像素與包含兩條近似直線的 近似平面之間的距離,并且當所計算的所有距離都超過預定閾值時,取 消釆用該特定像素,并且其中,所述歸屬目標確定過程對所述文件圖像 中的每一個像素執(zhí)行所述計算和取消。
全文摘要
本發(fā)明涉及一種圖案分離提取程序、圖案分離提取裝置和圖案分離提取方法。當操作者啟動圖案分離提取工具時,在顯示裝置上顯示輸入畫面。操作者可以通過該輸入畫面選擇并指定存儲裝置內(nèi)的任何一個文件圖像數(shù)據(jù)。將操作者選擇的文件圖像顯示在顯示裝置上。操作者可以在該顯示裝置上顯示的文件圖像上,通過拖動操作來選擇并指定顏色樣本。如果操作者在指定一些顏色樣本之后,通過輸入裝置輸入結(jié)束指定顏色樣本的指定,則圖案分離提取裝置對操作者選擇的文件圖像中所包括的每一個印刷圖案,生成并輸出包括一個印刷圖案的圖像數(shù)據(jù)。
文檔編號G06K9/36GK101226594SQ20081000305
公開日2008年7月23日 申請日期2008年1月18日 優(yōu)先權(quán)日2007年1月18日
發(fā)明者藤本克仁, 諏訪美佐子 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
中阳县| 精河县| 徐闻县| 平遥县| 呼和浩特市| 南充市| 太保市| 毕节市| 阿克苏市| 涞源县| 通江县| 石景山区| 六盘水市| 贺州市| 黎城县| 木兰县| 桑日县| 锦州市| 大化| 尤溪县| 始兴县| 海淀区| 邓州市| 蓬莱市| 牡丹江市| 历史| 浦东新区| 弥渡县| 玉林市| 公安县| 政和县| 嘉荫县| 桐乡市| 辉县市| 湘阴县| 临汾市| 临桂县| 金寨县| 洱源县| 抚松县| 陕西省|