專利名稱:圖像處理裝置的制作方法
技術領域:
本發(fā)明涉及圖像處理裝置。
背景技術:
日本特開(JP-A) 2001-358925號公報公開一種技術,該技術在文檔處理中根據(jù)輸入的多值圖像數(shù)據(jù)來創(chuàng)建二值圖像數(shù)據(jù),根據(jù)創(chuàng)建的二值圖像數(shù)據(jù)識別字符碼和字符位置,使用識別的字符位置數(shù)據(jù)從多值圖像中去除字符,并輸出其中在去除了字符的圖像數(shù)據(jù)上疊加了編碼后的字符數(shù)據(jù)的合成圖像。
發(fā)明內容
根據(jù)上述情形而作出本發(fā)明,本發(fā)明提供一種圖像處理裝置。根據(jù)本發(fā)明的第一方面,提供一種圖像處理裝置。該圖像處理裝置包括字符識別部件,其基于通過將包含其中混合了字符的構成要素的文檔作為圖像來讀取而獲取的圖像數(shù)據(jù),對混合在構成要素中的字符執(zhí)行字符識別;確定部件,當生成表示所述文檔并且包含第一數(shù)據(jù)和第二數(shù)據(jù)的文檔數(shù)據(jù)時,其中所述第一數(shù)據(jù)表示混合了所述字符的所述構成要素,所述第二數(shù)據(jù)包含由所述字符識別部件識別出的字符的字符碼數(shù)據(jù)并表示顯示該字符碼數(shù)據(jù)表示的所述字符的字符塊,該確定部件基于所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、所述構成要素中的所述字符的尺寸、或所述構成要素的類型中的至少一個,來確定在顯示由所述文檔數(shù)據(jù)表示的文檔時,是將所述第二數(shù)據(jù)表示的字符塊隱藏在所述第一數(shù)據(jù)表示的所述構成要素的后面,還是將所述第二數(shù)據(jù)表示的字符塊顯示在所述第一數(shù)據(jù)表示的所述構成要素的前面;以及生成部件,其生成所述文檔數(shù)據(jù),對于所述文檔數(shù)據(jù),已經(jīng)根據(jù)所述確定部件的確定結果而設置了當顯示所述文檔時在所述字符塊與所述構成要素之間的顯示的前/后關系。根據(jù)本發(fā)明的第二方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述構成要素的所述字符周圍的背景區(qū)域的亮度小于第一閾值、或者所述字符周圍的背景區(qū)域的亮度的分散度等于或大于第二閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。根據(jù)本發(fā)明的第三方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述構成要素中的所述字符的字符數(shù)量等于或大于第三閾值,或者如果所述構成要素中的所述字符的行數(shù)量等于或大于第四閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。根據(jù)本發(fā)明的第四方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述構成要素的所述字符的區(qū)域的亮度等于或大于第五閾值,則所述確定部件確定將所述字符塊顯示在所述構成要素的前面。
根據(jù)本發(fā)明的第五方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述字符識別部件的所述字符識別的精度小于第六閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。根據(jù)本發(fā)明的第六方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述構成要素中的所述字符的尺寸等于或大于第七閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。根據(jù)本發(fā)明的第七方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述構成要素的類型是被指定為隱藏所述字符塊的類型的類型,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。根據(jù)本發(fā)明的第八方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,所述確定部件基于所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、或所述構成要素中的所述字符的尺寸中的至少一個與對應的閾值的比較結果,來確定將所述字符塊隱藏在所述構成要素的后面還是將所述字符塊顯示在所述構成要素的前面,并且,如果所述構成要素的類型是被指定為隱藏所述字符塊的類型的類型,則預先改變所述閾值,使得與確定了所述構成要素的類型不是被指定為隱藏所述字符塊的類型的類型時的情況相比,確定將所述字符塊隱藏在所述構成要素的后面的概率高。根據(jù)本發(fā)明的第九方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,所述確定部件將所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、所述構成要素中的所述字符的尺寸、或所述構成要素的類型中的至少一個與存儲在存儲部件中的閾值或設置信息進行比較,并且基于比較結果來確定將所述字符塊隱藏在所述構成要素的后面還是將所述字符塊顯示在所述構成要素的前面。所述圖像處理裝置還包括第一改變部件,該第一改變部件根據(jù)來自用戶的指示而改變存儲在所述存儲部件中的所述閾值或所述設置信息,其中,改變所述閾值或所述設置信息的指示是從用戶經(jīng)由指示部件發(fā)出的。根據(jù)本發(fā)明的第十方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,如果所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面,則所述生成部件生成表示如下的字符塊的數(shù)據(jù)作為所述第二數(shù)據(jù)所述字符塊分別按照預定的字符顏色和背景顏色,來顯示所述字符碼數(shù)據(jù)表示的所述字符和所述字符周圍的背景區(qū)域,并且, 如果所述確定部件確定了將所述字符塊顯示在所述構成要素的前面,則所述生成部件生成表示如下的字符塊的數(shù)據(jù)作為所述第二數(shù)據(jù)所述字符塊分別按照與處于混合在所述構成要素中的狀態(tài)下的所述字符的字符顏色或者所述背景區(qū)域的背景顏色相同或相似的顏色, 來顯示所述字符碼數(shù)據(jù)表示的所述字符和所述字符周圍的背景區(qū)域。根據(jù)本發(fā)明的第十一方面,提供本發(fā)明的第十方面的圖像處理裝置。在該圖像處理裝置中,指定當所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面時所述字符塊的所述字符顏色和所述背景顏色的顏色指定信息預先存儲在所述存儲部件中;并且所述圖像處理裝置還包括第二改變部件,在所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面之后,在從用戶經(jīng)由指示部件發(fā)出了改變所述字符塊的所述字符顏色或所述背景顏色中的至少一個的指示的情況下,該第二改變部件根據(jù)來自用戶的指示而改變所述顏色指定信息。根據(jù)本發(fā)明的第十二方面,提供本發(fā)明的第一方面的圖像處理裝置。該圖像處理裝置還包括輸入接收部件,當所述確定部件的確定結果是特定的確定結果時,該輸入接收部件從用戶接收去除指示信息的輸入,所述去除指示信息指示從所述文檔數(shù)據(jù)中去除所述第二數(shù)據(jù)。在該圖像處理裝置中,當通過所述輸入接收部件接收到所述去除指示信息的輸入并且所述確定部件的確定結果與所述去除指示信息中設置的特定確定結果相匹配時,所述生成部件生成去除了所述第二數(shù)據(jù)的數(shù)據(jù)作為所述文檔數(shù)據(jù)。根據(jù)本發(fā)明的第十三方面,提供本發(fā)明的第十二方面的圖像處理裝置。在該圖像處理裝置中,當生成去除了所述第二數(shù)據(jù)的數(shù)據(jù)作為所述文檔數(shù)據(jù)時,所述生成部件生成將混合在所述構成要素中的狀態(tài)下的所述字符表示為圖像的字符圖像數(shù)據(jù),并且生成如下的數(shù)據(jù)作為所述文檔數(shù)據(jù)所述數(shù)據(jù)包含生成的所述字符圖像數(shù)據(jù),并將在顯示所述文檔時在表示所述字符圖像數(shù)據(jù)的字符圖像與所述構成要素之間的顯示的前/后關系設置為, 使得在顯示所述文檔時將所述字符圖像顯示在所述構成要素的前面。根據(jù)本發(fā)明的第十四方面,提供本發(fā)明的第一方面的圖像處理裝置。在該圖像處理裝置中,至少所述第一數(shù)據(jù)具有能夠設置任何信息作為所述構成要素的屬性信息的格式。所述圖像處理裝置還包括屬性設置部件,該屬性設置部件將由所述字符識別部件識別出的字符的字符碼數(shù)據(jù)設置到所述第一數(shù)據(jù),作為所述構成要素的屬性信息。
基于下面附圖,詳細地描述本發(fā)明的示例性實施方式,在附圖中圖1是示出根據(jù)示例性實施方式的計算機系統(tǒng)的概略構造的框圖;圖2是示出讀取/文件編制處理的內容的流程圖;圖3是示出前/后確定處理的內容的流程圖;圖4是文檔文件生成處理的內容的流程圖;圖5是示出設置改變處理的內容的流程圖;圖6是示出在字符識別處理中的字符顏色和背景顏色的確定的圖像的圖;圖7是示出基于混合了字符的對象的對象類型的字符框的前面/后面確定(閾值變化)的概念圖;圖8A和圖8B是示出基于字符識別的精度的字符框的前面/后面確定的概念圖;圖9是示出基于字符的字體尺寸的字符框的前面/后面確定的概念圖;圖IOA和圖IOB是基于字符數(shù)量/行數(shù)量的字符框的前面/后面確定的概念圖;圖11是示出基于字符的亮度的字符框的前面/后面確定的概念圖;以及圖12A至12D是示出基于字符的背景顏色的亮度和背景亮度的分散度的字符框的前面/后面確定的概念圖。
具體實施例方式下面參考附圖將詳細地描述本發(fā)明示例性實施方式的示例。圖1示出根據(jù)本示例性實施方式的計算機系統(tǒng)10的概略構造。計算機系統(tǒng)10由連接到由LAN等構成的網(wǎng)絡12 的圖像讀取/打印裝置14和由PC(個人計算機)等構成的多個終端裝置M構成。圖像讀取/打印裝置14可以由組合了作為復印機的功能、作為打印機的功能和作為掃描儀的功能的裝置構成,并包括本體控制器16,本體控制器16由微計算機等構成并包含CPU 16A、存儲器16B、非易失性存儲單元16C(由HDD(硬盤驅動器)、閃存等構成)和網(wǎng)絡接口單元16D。另外,圖像讀取器18光學讀取所設置的待讀取文檔(紙質原始文檔)并輸出讀取的圖像數(shù)據(jù),圖像打印單元20在記錄紙上打印由輸入的打印圖像數(shù)據(jù)表示的圖像,操作面板22設置有由LCD等構成的顯示單元22A和由數(shù)字鍵、觸摸板等構成的操作單元22B,它們各自連接到本體控制器16。本體控制器16的網(wǎng)絡接口單元16D連接到網(wǎng)絡12以控制經(jīng)由網(wǎng)絡與終端裝置M 的通信。通過控制圖像讀取/打印裝置14的各個單元的操作而向用戶提供各種服務(例如,文檔的復制和打印(從終端裝置M接收的文檔數(shù)據(jù)所表示的文檔的打印))的本體控制程序、以及用于由CPU 16A執(zhí)行稍后描述的讀取/文件編制處理的讀取/文件編制程序各自安裝在本體控制器16的存儲單元16C中,作為由CPU 16A執(zhí)行的程序。上述讀取/文件編制程序是根據(jù)本發(fā)明的示例性圖像處理程序,在本示例性實施方式中,通過由圖像讀取/打印裝置14的本體控制器16的CPU 16A執(zhí)行讀取/文件編制程序,圖像讀取/打印裝置14充當根據(jù)本發(fā)明的圖像處理裝置。各個終端裝置M包括CPU 24、存儲器MB、由HDD (硬盤驅動器)或閃存等構成的非易失性存儲單元24C以及網(wǎng)絡接口單元MD,并經(jīng)由網(wǎng)絡接口單元24D連接到網(wǎng)絡12。另外,顯示器26、鍵盤28和鼠標30連接到終端裝置對。下面,作為本示例性實施方式的操作,將參考圖2來描述通過由圖像讀取/打印裝置14的本體控制器16的CPU 16A執(zhí)行讀取/文件編制程序而實現(xiàn)的讀取/文件編制處理。 在待讀取的原始文檔(文檔)設置到圖像讀取器18時,當用戶經(jīng)由操作面板22的操作單元22B發(fā)出讀取原始文檔(文檔)并基于讀取結果生成/輸出原始文檔(文檔)的文檔文件(“掃描到文件”服務的執(zhí)行)的指示時,執(zhí)行讀取/文件編制處理。在讀取/文件輸出處理中,首先,在步驟S40,設置到圖像讀取器18的原始文檔 (文檔)由圖像讀取器18讀取為圖像,并且將表示通過讀取而獲得的文檔讀取結果的圖像數(shù)據(jù)(例如按照位圖格式的圖像數(shù)據(jù))存儲在存儲單元16C中。在隨后的步驟42中,執(zhí)行對象分離處理,所述對象分離處理基于存儲在存儲單元16C中的圖像數(shù)據(jù),從所讀取的文檔的圖像中分離/提取各種對象(構成要素),如字符、照片、圖例(CG)、表格和劃線。如日本特開(JP-A) 2006-203582號公報或特開(JP-A) 2006-203583號公報所公開的,對象分離處理例如可以通過應用如下的技術實現(xiàn)將圖像分為多個塊,基于針對各個塊創(chuàng)建的LW顏色空間中的?。粊V和b*的直方圖的形狀、或者各個塊的ΙΛ 和b*的方差或平均值,將各個塊分類為多種塊中的一種(例如,“彩色圖案塊”、“彩色字符和周邊基底塊”、 “單色圖案塊”、“單色字符和周邊基底塊”、“單色基底塊”和“未知屬性塊”),并將分為相同類的相鄰塊整合為單個區(qū)域,以將讀取的文檔的圖像分為類別相互不同的多個區(qū)域(構成要素)。在步驟44中,進行字符識別處理,所述字符識別處理通過搜索由步驟42的對象分離處理從讀取的文檔的圖像中分離出的多個個體對象中的一個對象中存在的字符、并對根據(jù)搜索而提取出的字符執(zhí)行模式匹配,從而確定所提取的字符的字符碼數(shù)據(jù)、字體類型、字體尺寸、位置等。因此,不僅識別出在對象類型為“字符”(對象僅由字符構成)的對象的對象類型“字符”中存在的字符,而且識別出在對象類型并非“字符”、例如為“照片”、“CG” 和“表格”的對象中混合的字符,從而確定它們的字符碼數(shù)據(jù)、字體類型、字體尺寸等。在字符識別處理中,如圖6所示,作為示例,也針對各個字符確定字符的顏色和背景區(qū)域的顏色 (包圍各個字符的矩形區(qū)域內的除了字符以外的區(qū)域的顏色)。在步驟46,基于在步驟44中的字符識別處理的結果,確定是否存在對象類型并非 “字符”并且混合了字符的對象(在字符識別處理中從其中提取了字符的對象)。如果該確定結果是否定的,則處理進行到步驟50,并且如果在步驟46中的確定結果是肯定的,則處理進行到步驟48。在該情況下,當顯示文檔文件表示的文檔時,在進行到步驟50之前,執(zhí)行前/后確定處理,該前/后確定處理確定混合了字符的對象和顯示在字符識別處理中識別出的字符的字符框(根據(jù)本發(fā)明的字符塊的示例)中的哪一個設置在前面。稍后將描述前/后確定處理。在步驟50,執(zhí)行文檔文件生成處理,該處理生成表示所讀取的文檔的文檔文件,稍后還將描述文檔文件生成處理。接著,在步驟52,在讀取/文件輸出處理終止之前,將在文檔文件生成處理中生成的文檔文件傳輸給用戶預先指定的傳輸目的地(例如由用戶操作的終端裝置24),或在附加到電子郵件之后發(fā)送輸出。順便提及,根據(jù)日本特開2001-358925號公報中描述的技術,執(zhí)行對混合在圖像中的字符的字符識別,并從圖像中去除這些字符,接著輸出如下的合成圖像其中,將通過字符識別而識別出的字符碼表示的字符設置在已經(jīng)從其中去除了字符的圖像的前面。但是,根據(jù)該技術,如果去除了字符的部分的圖像(混合了字符的對象)是照片圖像,則難以按照在照片圖像中不出現(xiàn)不自然的方式來設置去除了字符的部分的顏色和濃度,這使得混合了字符的對象(照片圖像)的可用性降低。而且,根據(jù)在圖像(混合了字符的對象)中混合的字符的尺寸、字符的數(shù)量、行的數(shù)量、或字符的字符識別的精度,設置在混合了字符的對象(照片圖像)的前面的字符和已經(jīng)去除混合了字符的對象(照片圖像)的字符的部分可能不對齊。在根據(jù)本示例性實施方式的前/后確定處理中,當顯示由文檔文件表示的文檔時,考慮上述情況來確定混合了字符的對象和字符框中的哪一個設置在前面,下面參考圖3 描述根據(jù)本示例性實施方式的前/后確定處理。首先,在步驟90,從在讀取/文件編制處理(圖幻的步驟42中的對象分離處理中從讀取的文檔分離/提取出的多個對象中,選擇作為混合了字符的對象(在文件編制處理(圖2、的步驟44中的字符識別處理中從其中提取了字符的對象)并且沒有執(zhí)行步驟90以及此后的處理的單個對象,作為混合了字符的處理對象。在隨后的步驟92中,確定混合了字符的處理對象是否為隱藏字符框的對象類型。 在本示例性實施方式中,表示在前/后確定處理中用于前/后確定(確定混合了字符的對象和字符框中的哪一個設置在前面)的確定標準的確定標準信息存儲在存儲單元16C中, 并且確定標準信息包含設置規(guī)則信息,該設置規(guī)則信息針對各個對象類型、針對字符框的設置位置,提供混合了字符的對象的后面和前面中的哪一個是所希望的。通過將混合了字符的處理對象的對象類型與設置規(guī)則信息進行核對,以確定對于混合了字符的處理對象的對象類型來說字符框的希望設置位置是否為“后面”,從而實現(xiàn)步驟92中的確定。
作為示例,如圖7所示,對象類型為“CG”的混合了字符的對象經(jīng)常具有單個顏色作為字符的背景顏色,并且,如果字符塊(例如,如圖7所示,顯示“2008/08/12”的字符串的字符塊和顯示“今天的主題”的字符串的字符塊)設置在該類型的混合了字符的對象的前面,則其外觀不會變差,由此,通過將字符塊設置在前面,在字符塊中顯示的字符串的字符碼數(shù)據(jù)的可再用性提高。另一方面,如類似地在圖7中所示的,對象類型為“照片”的混合了字符的對象具有各種顏色/亮度(濃度)作為字符的背景顏色,并且,如果字符塊(例如,如圖7所示,顯示“8月11日,在花園拍攝”的字符串的字符塊)設置在該類型的混合了字符的對象的前面,則其外觀將變差。因此,設置規(guī)則信息的初始值(缺省值)按照以下方式設置例如,對于對象類型為“CG”的混合了字符的對象,字符框的希望設置位置是“前面”,并且,對于對象類型為“照片”的混合了字符的對象,字符框的希望設置位置是“后面”。在本示例性實施方式中,設置規(guī)則信息的內容可以由用戶改變(稍后將描述細節(jié))。上述確定標準信息包含八種確定閾值thl至th8,如果在步驟92中的確定結果是否定的,處理進行到步驟94,以從存儲單元16C讀取確定閾值thl至th8,并在進行到步驟 98之前使得存儲器16B存儲確定閾值thl至th8。另一方面,如果在步驟92中的確定結果是肯定的,則處理進行到步驟96,以從存儲單元16C讀取確定閾值thl至th8,并使存儲器 16B存儲確定閾值thl至th8。接著,在進行到步驟98之前,將確定閾值thl至th8中的當一些參數(shù)的值等于或大于確定閾值時確定為“后面”的確定閾值的值減小,并且將當一些參數(shù)的值小于確定閾值時確定為“后面”的確定閾值的值增加。因此,改變確定閾值thl至 th8的值,使得字符框隱藏在混合了字符的處理對象的后面的概率高于當步驟92中的確定結果為否定時的情況。步驟92至步驟96是根據(jù)第八方面的由確定單元進行的處理的示例。替代上述步驟94和步驟96的處理,如果在設置規(guī)則信息中提供的字符框的希望設置位置是“后面”,則存儲在存儲單元16C中的確定閾值thl至th8可以按照原樣使用,而如果在設置規(guī)則信息中提供的字符框的希望設置位置是“前面”,則存儲在存儲單元16C中的確定閾值thl至th8 的值可以按照如下的方式改變使得字符框設置在混合了字符的處理對象的前面的概率變高,并且,如果在設置規(guī)則信息中提供的字符框的希望設置位置是“后面”和“前面”,則存儲在存儲單元16C中的確定閾值thl至th8的值可以分別地變化(在相反的方向上變化)。在步驟98,獲取對混合了字符的處理對象中混合的字符在字符識別處理(圖2中的步驟44)中計算出的字符識別的精度。字符識別的精度是針對各個字符分別計算的,因此,在步驟98,分別地獲取對混合了字符的處理對象中混合的全部字符的字符識別的精度, 接著,計算獲取的精度的平均值,或者計算獲取的精度的最小值,作為對混合了字符的處理對象的字符識別的精度。在隨后的步驟100,確定在步驟98中獲取的對混合了字符的處理對象的字符識別的精度是否小于在存儲器16B中存儲的8個確定閾值thl至th8中的與字符識別的精度相關的確定閾值th6。在示例性實施方式中,可選地,確定閾值th6也可以由用戶改變(稍后將描述細節(jié))。在字符塊中顯示字符識別處理中識別出的字符碼數(shù)據(jù)所表示的字符(串)的同時,如果在步驟100中的確定結果是肯定的,作為示例,如圖8B所示,在字符塊中顯示的字符(串)可能不同于混合了字符的處理對象中混合的字符(串)(在圖8B中示出的示例中,例如,在混合了字符的處理對象中混合了字符串“ABCDE”,而在字符塊中顯示字符串 “ARCDE”,這兩個字符串不同)。因此,如果在步驟100的確定結果是肯定的,則處理進行到步驟124,確定字符框的設置位置是混合了字符的處理對象的“后面”,之后進行到步驟 128。另一方面,如果在步驟100的確定結果是否定的,作為示例,如圖8A所示,在字符塊中顯示的字符(塊)很可能與混合了字符的處理對象中混合的字符(串)匹配,因此,處理進行到步驟102,而不確定字符框的設置位置是混合了字符的處理對象的“后面”。上述步驟98和100是根據(jù)第五方面的由確定單元進行的處理的示例。在步驟102,對混合在混合了字符的處理對象中的字符,獲取在字符識別處理(圖 2中的步驟44)中識別的字符的尺寸。也是針對各個字符分別地計算字符的尺寸,因此在步驟102,針對混合在混合了字符的處理對象中的全部字符,分別地獲取字符的尺寸,接著, 計算所獲取的尺寸中的最大尺寸,作為混合在混合了字符的處理對象中的字符的尺寸。在隨后的步驟104中,確定在步驟102中獲取的混合在混合了字符的處理對象中的字符的尺寸是否為存儲在存儲器16B中的8個確定閾值thl至th8中的與字符尺寸相關的確定閾值 (在大尺寸側的確定閾值)th7或更大。作為示例,如圖9所示,如果混合在混合了字符的處理對象中的字符的尺寸很大 (作為示例,如果為18pt或更大),則由于在字符識別處理中的識別結果的輕微偏差或字體類型的差別,在字符塊中顯示的字符(串)可能相對于混合在混合了字符的處理對象中的字符(串)不對齊。因此,如果在步驟104中的確定結果是肯定的,則處理進行到步驟124, 確定字符框的設置位置是混合了字符的處理對象的“后面”,之后進行到步驟128。步驟104 是根據(jù)第六方面的由確定單元進行的處理的示例。如果在步驟104中的確定結果是否定的,則處理進行到步驟106,確定在步驟102 中獲取的混合在混合了字符的處理對象中的字符的尺寸是否小于存儲在存儲器16B中的8 個確定閾值thl至th8中的與字符尺寸相關的確定閾值(小尺寸側的確定閾值)th8。作為示例,如圖9所示,如果混合在混合了字符的處理對象中的字符的尺寸很小(作為示例,如果為6pt或更小),則在字符塊中顯示的字符(串)不太可能相對于混合在混合了字符的處理對象中的字符(串)不對齊,因此,如果在步驟106中的確定結果是肯定的,則處理進行到步驟126,確定字符框的設置位置是混合了字符的處理對象的“前面”,之后進行到步驟 129。如果在步驟104和106中的確定結果都是否定的,則處理進行到步驟108。在本示例性實施方式中,可選地,確定閾值th7和th8也可以由用戶改變(稍后將描述細節(jié))。上述步驟102至106是根據(jù)第六方面的由確定單元進行的處理的示例。在步驟108,獲取在字符識別處理(圖2中的步驟44)中識別的、混合在混合了字符的處理對象中的字符的字符數(shù)量和行數(shù)量。在隨后的步驟Iio中,確定在步驟108獲取的、混合在混合了字符的處理對象中的字符的數(shù)量是否為存儲在存儲器16B中的8個確定閾值thl至th8中的與字符數(shù)量相關的確定閾值th3或更大。如果在步驟110中的確定結果是否定的,則處理進行到步驟112,確定在步驟108中獲取的、混合在混合了字符的處理對象中的字符的行數(shù)量是否為存儲在存儲器16B中的8個確定閾值thl至th8中的與行數(shù)量相關的確定閾值th4或更大。
作為示例,如圖IOA所示,如果混合在混合了字符的處理對象中的字符的字符數(shù)量和行數(shù)量很大(例如,如果字符的數(shù)量是50個字符或更大,或者行的數(shù)量是5行或更大),那么,由于在行間的字體尺寸或字體類型的輕微差別的影響,在字符塊中顯示的字符串的行的寬度或字符的寬度可能相對于混合在混合了字符的處理對象中的字符串不對齊, 并且,由于從混合了字符的處理對象的范圍偏離的字符塊與另一對象的部分重疊,所以這種不對齊可能導致外觀變差。因此,如果步驟110和112之一的確定結果是肯定的,則處理進行到步驟124,確定字符框的設置位置為混合了字符的處理對象的“后面”(也參見圖 10B),之后進行到步驟128。如果在步驟110和112中的確定結果都是否定的,則處理進行到步驟114。在本示例性實施方式中,可選地,確定閾值th3和th4也可以由用戶改變(稍后將描述細節(jié))。上述步驟108至112是根據(jù)第三方面的由確定單元進行的處理的示例。在步驟114,獲取在字符識別處理(圖2中的步驟44)中確定的混合在混合了字符的處理對象中的字符的字符顏色,并且基于獲取的字符顏色來計算混合在混合了字符的處理對象中的字符顏色的亮度。字符顏色的亮度可以在字符之間有所不同,因此在步驟114 中,針對混合在混合了字符的處理對象中的全部字符分別地計算字符顏色的亮度,并計算針對各個字符而計算的亮度的平均值,作為混合在混合了字符的處理對象中的字符顏色的亮度。在隨后的步驟116中,確定在步驟114中計算出的混合在混合了字符的處理對象中的字符顏色的亮度是否為存儲在存儲器16B中的8個確定閾值thl至th8中的與字符亮度相關的確定閾值th5或更大。作為示例,如圖11所示,如果在對象類型是CG的對象中混合的字符的矢量化中字符的亮度高于其背景的亮度,則由于損壞了字符邊緣的可再現(xiàn)性,例如字符邊緣上的缺口,所以外觀經(jīng)常變差。如果字符的背景顏色是單色,即,混合了字符的對象的對象類型是 “CG”,在字符識別中識別具有高亮度的字符,并且如果在步驟116中的確定結果是肯定的, 則可以確定混合在混合了字符的對象中的字符的邊緣的可再現(xiàn)性的概率高。因此,如果在步驟116中的確定結果是肯定的,則處理進行到步驟126,確定字符框的設置位置為混合了字符的處理對象的“前面”,之后進行到步驟128。如果在步驟116中的確定結果是否定的,則處理進行到步驟118。在本示例性實施方式中,可選地,確定閾值th5也可以由用戶改變(稍后將描述細節(jié))。上述步驟114和 116是根據(jù)第四方面的由確定單元進行的處理的示例。在步驟118,獲取在字符識別處理(圖2中的步驟44)中確定的、混合在混合了字符的處理對象中的字符的背景顏色,并且基于獲取的背景顏色,各自計算混合在混合了字符的處理對象中的字符的背景顏色的亮度及其分散度。背景顏色的亮度也可以隨字符而不同,因此在步驟118中,針對混合在混合了字符的對象中的全部字符分別地計算背景顏色的亮度,并計算針對各字符計算出的亮度的中值(當按照升序或降序重新排列各個字符的背景顏色的亮度時位于中間的亮度值),作為混合在混合了字符的處理對象中的字符的背景顏色的亮度。替代上述中值,還可以使用平均值。背景顏色的亮度的分散度例如可以通過使用下面的公式(1)來計算
權利要求
1.一種圖像處理裝置,該圖像處理裝置包括字符識別部件,其基于通過將包含其中混合了字符的構成要素的文檔作為圖像來讀取而獲取的圖像數(shù)據(jù),對混合在所述構成要素中的所述字符執(zhí)行字符識別;確定部件,當生成表示所述文檔并且包含第一數(shù)據(jù)和第二數(shù)據(jù)的文檔數(shù)據(jù)時,其中所述第一數(shù)據(jù)表示混合了所述字符的所述構成要素,所述第二數(shù)據(jù)包含由所述字符識別部件識別出的字符的字符碼數(shù)據(jù)并表示顯示所述字符碼數(shù)據(jù)表示的所述字符的字符塊,該確定部件基于所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、所述構成要素中的所述字符的尺寸、或所述構成要素的類型中的至少一項,來確定在顯示所述文檔數(shù)據(jù)表示的文檔時,是將所述第二數(shù)據(jù)表示的字符塊隱藏在所述第一數(shù)據(jù)表示的所述構成要素的后面,還是將所述第二數(shù)據(jù)表示的字符塊顯示在所述第一數(shù)據(jù)表示的所述構成要素的前面;以及生成部件,其生成所述文檔數(shù)據(jù),對于所述文檔數(shù)據(jù),已經(jīng)根據(jù)所述確定部件的確定結果而設置了在顯示所述文檔時在所述字符塊與所述構成要素之間的顯示的前/后關系。
2.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述構成要素的所述字符周圍的背景區(qū)域的亮度小于第一閾值、或者所述字符周圍的背景區(qū)域的亮度的分散度等于或大于第二閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。
3.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述構成要素中的所述字符的字符數(shù)量等于或大于第三閾值,或者如果所述構成要素中的所述字符的行數(shù)量等于或大于第四閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。
4.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述構成要素的所述字符的區(qū)域的亮度等于或大于第五閾值,則所述確定部件確定將所述字符塊顯示在所述構成要素的前
5.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述字符識別部件的所述字符識別的精度小于第六閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。
6.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述構成要素中的所述字符的尺寸等于或大于第七閾值,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。
7.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述構成要素的類型是被指定為隱藏所述字符塊的類型的類型,則所述確定部件確定將所述字符塊隱藏在所述構成要素的后面。
8.根據(jù)權利要求1所述的圖像處理裝置,其中,所述確定部件基于所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、或所述構成要素中的所述字符的尺寸中的至少一個與對應的閾值的比較結果,來確定是將所述字符塊隱藏在所述構成要素的后面還是將所述字符塊顯示在所述構成要素的前面,并且,如果所述構成要素的類型是被指定為隱藏所述字符塊的類型的類型,則預先改變所述閾值,使得與確定了所述構成要素的類型不是被指定為隱藏所述字符塊的類型的類型時的情況相比,將所述字符塊確定為隱藏在所述構成要素的后面的概率高。
9.根據(jù)權利要求1所述的圖像處理裝置,其中所述確定部件將所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度、 所述構成要素中的所述字符的字符數(shù)量或行數(shù)量、所述構成要素中的所述字符的區(qū)域的亮度、所述字符識別部件的所述字符識別的精度、所述構成要素中的所述字符的尺寸、或所述構成要素的類型中的至少一項與存儲在存儲部件中的閾值或設置信息進行比較,并且基于比較結果來確定是將所述字符塊隱藏在所述構成要素的后面還是將所述字符塊顯示在所述構成要素的前面;并且所述圖像處理裝置還包括第一改變部件,該第一改變部件根據(jù)來自用戶的指示而改變存儲在所述存儲部件中的所述閾值或所述設置信息,其中,改變所述閾值或所述設置信息的指示是從用戶經(jīng)由指示部件發(fā)出的。
10.根據(jù)權利要求1所述的圖像處理裝置,其中,如果所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面,則所述生成部件生成表示如下的字符塊的數(shù)據(jù)作為所述第二數(shù)據(jù)所述字符塊分別按照預定的字符顏色和背景顏色,來顯示所述字符碼數(shù)據(jù)表示的所述字符和所述字符周圍的背景區(qū)域,并且,如果所述確定部件確定了將所述字符塊顯示在所述構成要素的前面,則所述生成部件生成表示如下的字符塊的數(shù)據(jù)作為所述第二數(shù)據(jù)所述字符塊分別按照與處于混合在所述構成要素中的狀態(tài)下的所述字符的字符顏色或者所述背景區(qū)域的背景顏色相同或相似的顏色,來顯示所述字符碼數(shù)據(jù)表示的所述字符和所述字符周圍的背景區(qū)域。
11.根據(jù)權利要求10所述的圖像處理裝置,其中如下的顏色指定信息預先存儲在存儲部件中所述顏色指定信息指定在所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面時所述字符塊的所述字符顏色和所述背景顏色;并且所述圖像處理裝置還包括第二改變部件,在所述確定部件確定了將所述字符塊隱藏在所述構成要素的后面之后從用戶經(jīng)由指示部件發(fā)出了改變所述字符塊的所述字符顏色或所述背景顏色中的至少一個的指示的情況下,該第二改變部件根據(jù)來自用戶的指示而改變所述顏色指定信息。
12.根據(jù)權利要求1所述的圖像處理裝置,該圖像處理裝置還包括輸入接收部件,當所述確定部件的確定結果是特定的確定結果時,該輸入接收部件從用戶接收去除指示信息的輸入,所述去除指示信息指示從所述文檔數(shù)據(jù)中去除所述第二數(shù)據(jù),其中,當所述輸入接收部件接收到所述去除指示信息的輸入并且所述確定部件的確定結果與在所述去除指示信息中設置的特定的確定結果相匹配時,所述生成部件生成去除了所述第二數(shù)據(jù)的數(shù)據(jù)作為所述文檔數(shù)據(jù)。
13.根據(jù)權利要求12所述的圖像處理裝置,其中,當生成去除了所述第二數(shù)據(jù)的數(shù)據(jù)作為所述文檔數(shù)據(jù)時,所述生成部件生成將處于混合在所述構成要素中的狀態(tài)下的所述字符表示為圖像的字符圖像數(shù)據(jù),并且生成如下的數(shù)據(jù)作為所述文檔數(shù)據(jù)所述數(shù)據(jù)包含生成的所述字符圖像數(shù)據(jù),并將在顯示所述文檔時在表示所述字符圖像數(shù)據(jù)的字符圖像與所述構成要素之間的顯示的前/后關系設置為,使得在顯示所述文檔時將所述字符圖像顯示在所述構成要素的前面。
14.根據(jù)權利要求1所述的圖像處理裝置,其中至少所述第一數(shù)據(jù)具有能夠設置任何信息作為所述構成要素的屬性信息的格式;并且所述圖像處理裝置還包括屬性設置部件,該屬性設置部件將由所述字符識別部件識別出的字符的字符碼數(shù)據(jù)作為所述構成要素的屬性信息設置到所述第一數(shù)據(jù)。
全文摘要
本發(fā)明涉及圖像處理裝置。該圖像處理裝置包括字符識別部件、確定部件和生成部件。當生成包含第一數(shù)據(jù)和第二數(shù)據(jù)的文檔數(shù)據(jù)時,其中所述第一數(shù)據(jù)表示所述文檔并表示混合了所述字符的所述構成要素,所述第二數(shù)據(jù)包含由所述字符識別部件識別出的字符的字符碼數(shù)據(jù)并表示顯示該字符碼數(shù)據(jù)表示的所述字符的字符塊,確定部件基于所述構成要素的所述字符周圍的背景區(qū)域的亮度或亮度的分散度,來確定在顯示由所述文檔數(shù)據(jù)表示的文檔時,是將所述第二數(shù)據(jù)表示的字符塊隱藏在所述第一數(shù)據(jù)表示的所述構成要素的后面,還是將所述第二數(shù)據(jù)表示的字符塊顯示在所述第一數(shù)據(jù)表示的所述構成要素的前面。
文檔編號G06K9/40GK102375981SQ20111003693
公開日2012年3月14日 申請日期2011年2月12日 優(yōu)先權日2010年8月12日
發(fā)明者上條裕義, 大谷和宏, 安達真太郎, 小柳勝也, 松隈千紘 申請人:富士施樂株式會社