專(zhuān)利名稱(chēng):圖像處理裝置和圖像處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于存儲(chǔ)文檔圖像處理的結(jié)果的方法。
背景技術(shù):
近年來(lái),諸如互聯(lián)網(wǎng)的網(wǎng)絡(luò)廣泛普及,因此,通常以電子的方式分發(fā)文檔;然而,經(jīng) 常分發(fā)打印有電子文檔的紙。已考慮如下技術(shù)即使當(dāng)僅可得到紙文檔時(shí),也可以從該紙 獲取紙文檔的內(nèi)容作為可再用的數(shù)據(jù)。例如,在日本特開(kāi)平11-167532(1999)號(hào)公報(bào)中,公 開(kāi)了這樣一種技術(shù)將文檔圖像從終端發(fā)送至服務(wù)器,并且將在服務(wù)器上識(shí)別出的該文檔 圖像的數(shù)據(jù)轉(zhuǎn)換成可再用的格式并發(fā)送回至終端。此外,在日本特開(kāi)2005-346137號(hào)公報(bào) 中,公開(kāi)了這樣一種技術(shù)將文檔圖像分成與對(duì)象的類(lèi)型相對(duì)應(yīng)的區(qū)域,并且可以單獨(dú)輸出 數(shù)據(jù)。當(dāng)將通過(guò)掃描紙文檔所產(chǎn)生的文檔圖像轉(zhuǎn)換成電子文檔時(shí),用戶希望再使用的數(shù) 據(jù)格式根據(jù)環(huán)境而不同,但希望對(duì)文檔圖像的對(duì)象進(jìn)行布置以使用戶容易利用各個(gè)對(duì)象。 例如,對(duì)于希望作為表編輯并使用文檔圖像中的表的用戶,希望將該表布置在電子文檔上, 以使得可以將該表作為表對(duì)象進(jìn)行編輯。對(duì)于希望重印表并作為紙文檔使用該表的用戶, 期望對(duì)該表進(jìn)行布置,以使得根據(jù)文檔圖像盡可能精確地再現(xiàn)諸如表線的視覺(jué)信息。然而, 當(dāng)將圖像上的表轉(zhuǎn)換成表對(duì)象時(shí),根據(jù)電子文檔的格式的規(guī)范,可能不能完整再現(xiàn)文檔圖 像的表線。為了再現(xiàn)表的視覺(jué)信息,可以使用日本特開(kāi)2005-346137號(hào)公報(bào)中所公開(kāi)的方 法來(lái)作為矢量對(duì)象繪制表;然而,以這種方式,用戶不能將該表作為表進(jìn)行編輯,例如,不能 添加或去除行。如上所述,諸如在用戶希望將該表作為表進(jìn)行編輯的情況下以及在用戶希 望打印或顯示表以使用該表的情況下,最佳格式的規(guī)范根據(jù)目的而不同。因此,難以生成對(duì) 于電子文檔的許多目的均為最佳的格式規(guī)范的電子文檔。
發(fā)明內(nèi)容
根據(jù)本發(fā)明,提供一種圖像處理裝置,用于根據(jù)所輸入的圖像生成具有預(yù)定的格 式的電子文檔,所述圖像處理裝置包括區(qū)域判別單元,用于分析所述圖像并判別表區(qū)域; 表結(jié)構(gòu)分析單元,用于分析所判別出的表區(qū)域中的表結(jié)構(gòu)和格線,并創(chuàng)建包括與表的單元 格有關(guān)的信息的表結(jié)構(gòu)信息;判斷單元,用于判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié) 構(gòu)信息中包括的單元格的邊表示為表的格線;用于根據(jù)被判斷為能夠表示為格線的邊、創(chuàng) 建要根據(jù)所述格式表示的格線信息的單元;用于通過(guò)對(duì)被判斷為不能表示為格線的邊進(jìn)行 矢量轉(zhuǎn)換處理、創(chuàng)建矢量線對(duì)象的單元;以及電子文檔生成單元,用于根據(jù)所創(chuàng)建的表結(jié)構(gòu) 信息、所創(chuàng)建的格線信息和所創(chuàng)建的矢量線對(duì)象,生成所述電子文檔。根據(jù)本發(fā)明,提供一種圖像處理方法,用于根據(jù)所輸入的圖像生成具有預(yù)定的格 式的電子文檔,所述圖像處理方法包括區(qū)域判別步驟,用于分析所述圖像并判別表區(qū)域; 表結(jié)構(gòu)分析步驟,用于分析所判別出的表區(qū)域中的表結(jié)構(gòu)和格線,并創(chuàng)建包括與表的單元 格有關(guān)的信息的表結(jié)構(gòu)信息;判斷步驟,用于判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié)構(gòu)信息中包括的單元格的邊表示為表的格線;用于根據(jù)被判斷為能夠表示為格線的邊、創(chuàng) 建要根據(jù)所述格式表示的格線信息的步驟;用于通過(guò)對(duì)被判斷為不能表示為格線的邊進(jìn)行 矢量轉(zhuǎn)換處理、創(chuàng)建矢量線對(duì)象的步驟;電子文檔生成步驟,用于根據(jù)所創(chuàng)建的表結(jié)構(gòu)信 息、所創(chuàng)建的格線信息和所創(chuàng)建的矢量線對(duì)象,生成所述電子文檔。根據(jù)本發(fā)明,提供了生成對(duì)于電子文檔的多個(gè)目的均為最佳的格式規(guī)范的電子文 檔的圖像處理裝置和圖像處理方法。根據(jù)以下參考附圖對(duì)示例性實(shí)施例的描述,本發(fā)明的其他特征將變得顯而易見(jiàn)。
圖1是示出根據(jù)本發(fā)明的實(shí)施例的系統(tǒng)的配置示例的圖;圖2是示出在該實(shí)施例中的圖像處理裝置的操作的圖;圖3是示出在該實(shí)施例中的表結(jié)構(gòu)信息的圖;圖4是示出在該實(shí)施例中的表線判斷處理的流程圖;圖5是示出在該實(shí)施例中的表線生成處理的流程圖;圖6是示出在該實(shí)施例中的輸入圖像的示例的圖;圖7是示出在該實(shí)施例中的表結(jié)構(gòu)信息分析的結(jié)果示例的圖;圖8是示出在該實(shí)施例中的字符區(qū)域中的字符識(shí)別的結(jié)果的示例的圖;圖9是示出在該實(shí)施例中要轉(zhuǎn)換的工作薄文檔的規(guī)范的示例的圖;圖10是示出在該實(shí)施例中轉(zhuǎn)換后的工作薄文檔的示例的圖;圖11是示出在該實(shí)施例中在顯示/編輯程序中顯示工作薄文檔的示例的圖;圖12是示出在另一實(shí)施例中利用顯示/編輯程序編輯工作薄文檔的示例的圖;圖13是示出在另一實(shí)施例中的輸入圖像的示例的圖;圖14是示出在另一實(shí)施例中要轉(zhuǎn)換的工作薄文檔的規(guī)范的示例的圖;圖15是示出在另一實(shí)施例中的表線判斷處理的流程圖;以及圖16是示出在另一實(shí)施例中在顯示/編輯程序中顯示工作薄文檔的示例的圖。
具體實(shí)施例方式以下,將參考附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例。然而,本發(fā)明的范圍并不限于這 些實(shí)施例。實(shí)施例1圖1是示出在實(shí)施例1中所使用的系統(tǒng)的配置的示例的圖。附圖標(biāo)記100表示實(shí) 現(xiàn)本發(fā)明的圖像處理裝置的配置的示例。圖像處理裝置100包括掃描器101、CPU 102、存 儲(chǔ)器103、硬盤(pán)104和網(wǎng)絡(luò)I/F 105。掃描器101是用于將已讀取的文檔的紙上的信息轉(zhuǎn) 換成圖像數(shù)據(jù)的讀取裝置。CPU 102是用于執(zhí)行電子文檔生成程序的處理器,其中,該電子 文檔生成程序用于對(duì)圖像數(shù)據(jù)進(jìn)行本發(fā)明的處理。存儲(chǔ)器103用于例如當(dāng)執(zhí)行從硬盤(pán)104 等讀取的程序時(shí)臨時(shí)存儲(chǔ)工作存儲(chǔ)器或數(shù)據(jù)。硬盤(pán)104是用于存儲(chǔ)諸如電子文檔生成程序 的程序和數(shù)據(jù)的存儲(chǔ)裝置。網(wǎng)絡(luò)I/F 105是用于與外部裝置交換數(shù)據(jù)的接口。個(gè)人計(jì)算機(jī) (PC) 120是通過(guò)諸如LAN 110的網(wǎng)絡(luò)連接至圖像處理裝置100、并且接收從圖像處理裝置發(fā) 送來(lái)的數(shù)據(jù)的終端裝置。PC 102可以執(zhí)行允許在屏幕上顯示并編輯所接收到的電子文檔的顯示/編輯程序121。圖2是示出在實(shí)施例1中的圖像處理裝置100的操作的圖。通過(guò)CPU 102執(zhí)行 電子文檔生成程序來(lái)實(shí)現(xiàn)圖2中所示的各類(lèi)處理,但可以通過(guò)電路來(lái)實(shí)現(xiàn)一部分或整個(gè)處理。附圖標(biāo)記200表示從掃描器101輸入的輸入圖像。附圖標(biāo)記210表示用于根據(jù) 輸入圖像200生成電子文檔的電子文檔生成部。工作薄文檔220是由電子文檔生成部210 生成的電子文檔。針對(duì)工作薄文檔220定義預(yù)定格式規(guī)范。下文將描述格式規(guī)范的示例。 應(yīng)注意,在該實(shí)施例中的工作薄文檔的格式是在電子表格軟件(例如,Microsoft Office Excel)中可使用的一種電子表格,但不限于此???11至216示意性地表示由電子文檔生成部210進(jìn)行的各類(lèi)處理。附圖標(biāo)記211表示區(qū)域判別部,該區(qū)域判別部用于分析已輸入的文檔圖像并提取 諸如字符、表和自然圖像的區(qū)域。附圖標(biāo)記212表示表結(jié)構(gòu)分析部,該表結(jié)構(gòu)分析部用于分 析從區(qū)域判別部211提取的表區(qū)域上的表結(jié)構(gòu)和格線,并創(chuàng)建表結(jié)構(gòu)信息。圖3是以樹(shù)的形式示出從表結(jié)構(gòu)分析部212獲得的表結(jié)構(gòu)信息的圖。在該表結(jié)構(gòu) 信息中,樹(shù)結(jié)構(gòu)由行和表的最小構(gòu)成單位單元格形成,其中,單元格是通過(guò)將行分成列所獲 得的。單元格具有數(shù)據(jù)、矩形和格線的信息作為子元素。數(shù)據(jù)存儲(chǔ)通過(guò)識(shí)別單元格內(nèi)的字 符所獲得的結(jié)果。矩形由位置X和y以及尺寸W和h形成,并且存儲(chǔ)單元格在文檔內(nèi)的坐 標(biāo)。格線是圍繞單元格的線邊界的信息,并且由上邊、下邊、左邊和右邊形成;這些邊具有線 類(lèi)型信息和線顏色信息,其中,該線類(lèi)型信息是線厚度和圖樣(pattern)信息。角各自由左 上、右上、右下和左下形成,并且存儲(chǔ)角的曲率的信息。圖3所示的信息保存方法是一個(gè)示 例;可以反轉(zhuǎn)將行分成列的方法,并且可以以除了樹(shù)結(jié)構(gòu)外的任何結(jié)構(gòu)形成表結(jié)構(gòu)的信息。圖2所示的附圖標(biāo)記213表示對(duì)從表結(jié)構(gòu)分析部212提取的字符區(qū)域進(jìn)行字符識(shí) 別的字符識(shí)別部。將通過(guò)該識(shí)別獲得的結(jié)果存儲(chǔ)在表結(jié)構(gòu)信息的單元格元素內(nèi)的數(shù)據(jù)中。 附圖標(biāo)記214表示表線判斷部,該表線判斷部用于對(duì)照要轉(zhuǎn)換的工作薄文檔的格式規(guī)范來(lái) 檢查表線,并且判斷是否可以將表線表示為單元格的邊界線。附圖標(biāo)記215表示用于創(chuàng)建表的格線信息的表線生成部,并且創(chuàng)建由表線判斷部 214判斷為不能繪制為單元格的邊界線的表線的矢量線對(duì)象,并將該矢量線對(duì)象布置在適 當(dāng)位置。附圖標(biāo)記216表示工作薄文檔轉(zhuǎn)換部(電子文檔生成部),該工作薄文檔轉(zhuǎn)換部用 于將字符識(shí)別數(shù)據(jù)、矢量線對(duì)象和單元格的邊界線信息轉(zhuǎn)換成工作薄文檔220的格式。由工作薄文檔生成部210生成的工作薄文檔220具有表格221,并且可以通過(guò)由 PC 120保存的顯示/編輯程序121進(jìn)行編輯和顯示。表格221是以工作薄文檔內(nèi)的頁(yè)為單 位的表格的數(shù)據(jù),并且包括表信息222和格線矢量信息223。以下,將參考圖4的流程圖描述表線判斷部214的示例。在步驟S401,從由表結(jié)構(gòu)分析部212提取的表結(jié)構(gòu)樹(shù)的單元格元素中選擇未經(jīng)過(guò) 表線判斷處理的單元格區(qū)域。在步驟S402,準(zhǔn)備用于判斷是否矢量化單元格的邊元素的矢 量化標(biāo)記,并且將該矢量化標(biāo)記設(shè)置為假。將矢量化標(biāo)記中設(shè)置的信息存儲(chǔ)在諸如存儲(chǔ)器 103和硬盤(pán)104的存儲(chǔ)部中。這同樣適用于通過(guò)進(jìn)行下文描述的各類(lèi)處理獲得的結(jié)果的信 息。在步驟S403,示出對(duì)所有的{邊,鄰邊}即{上,右}、{右,下}、{下,左}和{左,上} 進(jìn)行重復(fù)處理的重復(fù)開(kāi)端。鄰邊是指在順時(shí)針?lè)较蛏辖雍详P(guān)注邊的邊。在步驟S404,判斷邊和鄰邊接合在一起的角的曲率是否落入要轉(zhuǎn)換的工作薄文檔的格式規(guī)范的范圍內(nèi)。如果 該曲率落入該范圍內(nèi),則處理進(jìn)入步驟S405,而如果該曲率落在該范圍之外,則處理進(jìn)入步 驟S408。在步驟S405,判斷邊的線顏色是否落入要轉(zhuǎn)換的工作薄文檔的格式規(guī)范的范圍 內(nèi)。如果該線顏色落入該范圍內(nèi),則處理進(jìn)入步驟S406,而如果該線顏色落在該范圍之外, 則處理進(jìn)入步驟S409。在步驟S406,判斷邊的線類(lèi)型是否落入要轉(zhuǎn)換的工作薄文檔的格 式規(guī)范的范圍內(nèi)。如果該線類(lèi)型落入該范圍內(nèi),則處理進(jìn)入步驟S407,而如果該線類(lèi)型落 在該范圍之外,則處理進(jìn)入步驟S409。步驟S407是從步驟S403開(kāi)始的重復(fù)的結(jié)束。如果 {邊,鄰邊}是{左,上},則重復(fù)完成,并且處理進(jìn)入步驟S410,而如果不是,則處理進(jìn)入步 驟S403。在步驟S408,將邊和鄰邊的矢量化標(biāo)記設(shè)置為真,并且處理進(jìn)入步驟S407。在步 驟S409,將邊的矢量化標(biāo)記設(shè)置為真,并且處理進(jìn)入步驟S407。在步驟S410,判斷是否存在 未處理的單元格。如果不存在未處理的單元格,則處理完成,而如果存在未處理的單元格, 則處理進(jìn)入步驟S401。通過(guò)圖4所示的上述處理,表線判斷部214判斷邊和鄰邊接合在一起的角的曲率、 邊的線顏色和邊的線類(lèi)型是否落入要轉(zhuǎn)換的工作薄文檔的格式規(guī)范的范圍內(nèi)。如果判斷為 它們未落入格式規(guī)范的范圍內(nèi),即,如果判斷為根據(jù)格式規(guī)范不能表示該邊,則將該邊的矢 量化標(biāo)記設(shè)置為真。用于判斷是否能夠表示該邊的方法并不限于該方法;還可以基于格式 規(guī)范的屬性進(jìn)行判斷。以下,將參考圖5的流程圖描述由表線生成部215進(jìn)行的處理的示例。在步驟S501,從由表結(jié)構(gòu)分析部212提取的表結(jié)構(gòu)信息的單元格信息中選擇未經(jīng) 過(guò)表線生成處理的單元格區(qū)域。在步驟S502,示出對(duì)一個(gè)單元格區(qū)域的上邊、右邊、下邊和 左邊重復(fù)進(jìn)行處理的重復(fù)開(kāi)端。在步驟S503,判斷是否已對(duì)邊進(jìn)行格線生成處理。如果未 進(jìn)行格線生成處理,則處理進(jìn)入步驟S504,而如果已進(jìn)行格線生成處理,則處理進(jìn)入步驟 S508。在步驟S504,判斷由表線判斷部214添加的矢量化標(biāo)記為真還是為假。如果該標(biāo)記為 真,則處理進(jìn)入步驟S505,而如果該標(biāo)記為假,則處理進(jìn)入步驟S509。在步驟S505,進(jìn)行用 于聯(lián)結(jié)鄰邊的矢量化邊的處理。如果鄰邊的矢量化標(biāo)記為真,則聯(lián)結(jié)矢量化邊,并且如果剩 余平行邊的矢量化標(biāo)記為真,則進(jìn)一步進(jìn)行聯(lián)結(jié)。如果鄰邊都為假,則不將這些邊聯(lián)結(jié)在一 起。在步驟S506,對(duì)在步驟S505中所聯(lián)結(jié)的矢量化邊進(jìn)行矢量化處理。也就是說(shuō),對(duì)所輸 入的文檔圖像中的目標(biāo)線區(qū)域進(jìn)行矢量轉(zhuǎn)換處理,以生成矢量線對(duì)象作為表線信息。在步 驟S507,將在步驟S506所創(chuàng)建的矢量線對(duì)象布置在單元格上。將單元格布置在如下位置 矢量線對(duì)象的外接矩形左上點(diǎn)坐標(biāo)和外接矩形右下點(diǎn)坐標(biāo)與對(duì)應(yīng)于矢量線對(duì)象的單元格 的左上坐標(biāo)的相對(duì)位置和該單元格的右下坐標(biāo)的相對(duì)位置一致。也就是說(shuō),創(chuàng)建將矢量線 對(duì)象布置在表區(qū)域的相對(duì)坐標(biāo)中的表線信息。步驟S508示出從步驟S502開(kāi)始的重復(fù)的結(jié) 束。如果邊為左邊(即,如果對(duì)一個(gè)單元格區(qū)域的所有上邊、右邊、下邊和左邊完成處理), 則處理進(jìn)入步驟S510,而如果沒(méi)有完成處理,則處理進(jìn)入步驟S502。在步驟S509,使用要轉(zhuǎn) 換的文檔格式的單元格的格線的規(guī)范,根據(jù)表結(jié)構(gòu)信息中的曲率、線類(lèi)型和線顏色的信息, 將單元格的邊界線信息設(shè)置為表線信息。在步驟S510,判斷是否存在未進(jìn)行表線生成處理 的單元格。如果存在未處理的單元格,則處理進(jìn)入步驟S501,而如果不存在未處理的單元 格,則處理完成。通過(guò)圖5中所示的上述處理,聯(lián)結(jié)矢量化標(biāo)記為真的鄰邊,并因此進(jìn)行矢量化處
7理,并且創(chuàng)建將所創(chuàng)建的矢量線對(duì)象布置在單元格上(即,在表區(qū)域的相對(duì)位置中)的表線 信息。對(duì)于矢量化標(biāo)記為假的邊,使用文檔格式的單元格的格線的規(guī)范(能夠以文檔中的 表的格式表示的格線)創(chuàng)建設(shè)置了單元格的邊界線信息的表線信息。作為輸入圖像200的示例,以下將描述工作薄文檔生成部210將圖6所示的圖像 600轉(zhuǎn)換成其本身格式的工作薄文檔220的處理示例。區(qū)域判別部211首先使用已知的圖像分析處理來(lái)提取輸入圖像中的字符區(qū)域和 表區(qū)域。例如,在日本特開(kāi)2004-086436號(hào)公報(bào)中提出了一個(gè)區(qū)域判別處理的示例。美國(guó) 專(zhuān)利第5,680,478號(hào)的說(shuō)明書(shū)公開(kāi)了提取文檔圖像中的黑像素與白像素的集合,并且基于 該集合的形狀、大小和狀態(tài)等,提取諸如字符、圖片和圖畫(huà)、表、框和線的特征區(qū)域。還存在 這樣一種方法在不使用區(qū)域判別處理的情況下,使用游程長(zhǎng)度方法等從圖像中提取原始 線信息。在圖像600的示例中,假設(shè)提取由虛線圍繞的區(qū)域601作為表區(qū)域,以及提取區(qū)域 602、603、604、605和606作為字符區(qū)域。然后,表結(jié)構(gòu)分析部212使用已知的表結(jié)構(gòu)分析技術(shù)來(lái)提取關(guān)于表內(nèi)的行、列的 結(jié)構(gòu)、格線的線顏色和線類(lèi)型、角部的曲率等的信息。在例如日本特開(kāi)2004-086436號(hào)公報(bào) 中提出了一個(gè)表結(jié)構(gòu)分析技術(shù)的示例。日本特開(kāi)2004-086436號(hào)公報(bào)公開(kāi)了,基于從兩個(gè) 方向上的各邊緣確定的直方圖,從表區(qū)域內(nèi)的白像素塊的邊界附近獲取格線信息。圖7是在表中示出由表結(jié)構(gòu)分析部212提取的信息的示例的圖。單元格1-1表示 從左上角起的第一行第一列的單元格。示出了在該單元格的外接矩形中,左上坐標(biāo)是(100, 200)(左上原點(diǎn),單位像素),尺寸是(200,70)(寬度,高度,單位像素)。示出了在該單元格 的各邊中,所有邊的線顏色是12位RGB的#000 (黑色),并且所有邊的線類(lèi)型為1。示出了 在該單元格的曲率中,左上角部的曲率為1/30(1/像素),并且其他角部的曲率為⑴(曲率 的半徑為零)。這里,線類(lèi)型的信息由格線圖樣的顯示區(qū)域和非顯示區(qū)域的長(zhǎng)度相對(duì)于厚度的圖 樣的重復(fù)來(lái)表示。例如,當(dāng)線類(lèi)型為1時(shí),僅示出顯示區(qū)域中的實(shí)線;當(dāng)線類(lèi)型是1-1時(shí),示 出重復(fù)顯示區(qū)域和寬度與厚度相同的非顯示區(qū)域的虛線。用于存儲(chǔ)線類(lèi)型的圖樣信息的方 法是一個(gè)示例;可以通過(guò)其他方法存儲(chǔ)該信息。單元格1-2表示從左上角起的第一行第二列的單元格。該單元格表示提取了這樣 的單元格信息單元格的外接矩形的左上坐標(biāo)為(300,200),尺寸為(400,70),所有邊的線 顏色為#000 (黑色),所有邊的線類(lèi)型為實(shí)線,右上角部的曲率為1/30,并且其他角部的曲 率為⑴(曲率的半徑為零)。單元格2-1表示從左上角起的第二行第一列的單元格。該單元格表示提取了這樣 的單元格信息單元格的外接矩形的左上坐標(biāo)為(100,270),尺寸為(200,70),所有邊的線 顏色為#000 (黑色),所有邊的線類(lèi)型為實(shí)線,左下角部的曲率為1/30,并且其他角部的曲 率為⑴(曲率的半徑為零)。單元格2-2表示從左上角起的第二行第二列的單元格。該單元格表示提取了這樣 的單元格信息;單元格的外接矩形的左上坐標(biāo)為(300,270),尺寸為(400,70),所有邊的線 顏色為#000 (黑色),所有邊的線類(lèi)型為實(shí)線,右下角部的曲率為1/30,并且其他角部的曲 率為⑴(曲率的半徑為零)。
字符識(shí)別部213使用已知的字符識(shí)別技術(shù)來(lái)識(shí)別各字符區(qū)域內(nèi)的字符,并且連同 字符大小一起生成字符碼數(shù)據(jù)和OCR顯示數(shù)據(jù)。將簡(jiǎn)要描述字符識(shí)別處理的示例。該描述 僅是一個(gè)示例;可以使用其他方法。在字符識(shí)別處理中,首先判斷在字符區(qū)域中寫(xiě)入方向是水平方向還是垂直方向, 即,判斷行的方向。這樣做的一種方式是,對(duì)圖像進(jìn)行二值化,獲取垂直方向和水平方向上 的投影,并且將投影分散低的方向判斷為行方向。然后,將圖像分成各個(gè)字符圖像。優(yōu)選地, 通過(guò)進(jìn)行以下處理將圖像分成字符圖像通過(guò)使用二值圖像在行方向上的投影來(lái)找到要切 割的線空間;從而,將圖像分成行圖像;而且,通過(guò)使用行和垂直方向上的投影來(lái)找到要切 割的行圖像的字符空間。然后,獲得各字符圖像的特征,從預(yù)先存儲(chǔ)所有類(lèi)型字符的特征的 字典中搜索最接近于該特征的特征信息,并且作為識(shí)別的結(jié)果,獲得由字典表示的字符碼。 可以作為在識(shí)別各個(gè)字符時(shí)所獲取的字符的大小的平均值,獲得字符的大??;也可以使用 其他方法。圖8是在表中示出圖6的示例中由區(qū)域判別部211和字符識(shí)別部213進(jìn)行的處理 的結(jié)果的示例。在該示例中,作為字符識(shí)別部的識(shí)別結(jié)果,從區(qū)域602、603、604、605和606 中分別提取字符串 “ApplicationForm”、“ID”、“1234567”、“name”和 “Maruko Taro,,。由于區(qū)域603在圖7所示的單元格1-1內(nèi),所以將區(qū)域603作為單元格1_1的數(shù) 據(jù)來(lái)存儲(chǔ)。由于區(qū)域604在單元格1-2內(nèi),所以將區(qū)域604作為單元格1-2的數(shù)據(jù)來(lái)存儲(chǔ)。 由于區(qū)域605在單元格2-1內(nèi),所以將區(qū)域605作為單元格2-1的數(shù)據(jù)來(lái)存儲(chǔ)。由于區(qū)域 606在單元格2-2內(nèi),所以將區(qū)域606作為單元格2_2的數(shù)據(jù)來(lái)存儲(chǔ)。將參考圖4的流程圖來(lái)描述表線判斷部214的處理。在步驟S401,選擇單元格1-1作為未經(jīng)過(guò)格線判斷的單元格。在步驟402,將矢量 化標(biāo)記定義為單元格1-1的上邊、下邊、左邊和右邊的信息,并且針對(duì)上邊、下邊、左邊和右 邊中的每一邊設(shè)置假信息。在步驟S403,將上的值代入邊的變量,將右的值代入鄰邊的變 量,并因而開(kāi)始重復(fù)處理。在步驟S404,判斷作為邊與鄰邊之間的角的右上角部的曲率是否落入規(guī)范的范圍 內(nèi)。將使用圖9來(lái)描述要轉(zhuǎn)換的工作薄文檔的規(guī)范。假設(shè)在這種情況下要轉(zhuǎn)換的工作薄文 檔是作為其本身XML格式的工作薄文檔的工作薄文檔A,其中,線顏色的規(guī)范是單色32位 顏色,線類(lèi)型的規(guī)范是實(shí)線和三個(gè)圖樣的虛線,并且角部的曲率為⑴。由于在單元格1-1的 右上角部中,該角部的曲率為⑴,即,該角部的曲率落入規(guī)范的范圍內(nèi),所以處理進(jìn)入步驟 S405。在步驟S405,判斷邊的線顏色是否落入線顏色的規(guī)范的范圍內(nèi)。由于線顏色是 RGB 12位單色并且可以被轉(zhuǎn)換成RGB 32位單色,即,線顏色落入規(guī)范的范圍內(nèi),則處理進(jìn) 入步驟S406。在步驟S406,判斷邊的線類(lèi)型是否落入線類(lèi)型的規(guī)范的范圍內(nèi)。由于線類(lèi)型 為1 (實(shí)線),即,線類(lèi)型落入該規(guī)范內(nèi),則處理進(jìn)入步驟S407。在步驟S407,由于未完成重復(fù)處理,則處理進(jìn)入步驟S403。在步驟S403,將右代 入邊,并且將下代入鄰邊,接著處理進(jìn)入步驟S404。同樣,{邊,鄰邊}相對(duì)于{右,下}和 {下,左}落入規(guī)范的范圍內(nèi),并且矢量化標(biāo)記仍然為假。最后,將{左,上}代入{邊,鄰 邊},并且處理進(jìn)入步驟S404。在步驟S404,由于作為邊與鄰邊之間的角的左上角部的曲率 為1/30,即,該曲率落在規(guī)范的范圍外,則處理進(jìn)入步驟S408。在步驟S408,將作為邊與鄰邊的左邊與上邊的矢量化標(biāo)記設(shè)置為真,并且處理進(jìn)入步驟S407。在步驟S407,判斷為完 成重復(fù)處理,并且處理進(jìn)入步驟S410。在步驟S410,未處理單元格1-2、2-1和2_2,因此,處 理進(jìn)入步驟S401。當(dāng)對(duì)單元格1-2、2_1和2-2進(jìn)行相同處理時(shí),在單元格1_2中將上邊和右邊的矢 量化標(biāo)記設(shè)置為真,在單元格2-1中將下邊和左邊的矢量化標(biāo)記設(shè)置為真,并且在單元格 2-2中將右邊和下邊的矢量化標(biāo)記設(shè)置為真。在步驟S410,對(duì)所有單元格完成矢量化判斷 處理,因此處理完成。將參考圖5的流程圖描述表線生成部215的處理。在步驟S501,選擇單元格1_1 作為未處理的單元格。在步驟S503,將上代入邊的變量,并且開(kāi)始重復(fù)處理。在步驟S503, 上邊是未處理矢量的邊,因而,處理進(jìn)入步驟S504。在步驟S504,根據(jù)由表線判斷部214存 儲(chǔ)的矢量化標(biāo)記,將單元格1-1的上邊判斷為真,因而,處理進(jìn)入步驟S505。在步驟S505, 由于左邊的矢量化標(biāo)記為真,因此聯(lián)結(jié)左邊,并且判斷為要進(jìn)行矢量化。在步驟S506,通過(guò)使用已知的矢量化技術(shù),根據(jù)輸入圖像,對(duì)于在步驟S505聯(lián)結(jié) 的目標(biāo)邊創(chuàng)建矢量線對(duì)象。作為矢量化技術(shù)的示例,存在日本專(zhuān)利第3026592號(hào)和日本特 開(kāi)2005-346137號(hào)公報(bào)中公開(kāi)的方法。例如,在日本專(zhuān)利第3026592號(hào)中,公開(kāi)了這樣一種 技術(shù)通過(guò)進(jìn)行以下操作,生成通過(guò)像素間的矢量的集合描述被稱(chēng)為輪廓矢量的聯(lián)結(jié)像素 數(shù)據(jù)的周?chē)男畔?。在?duì)圖像進(jìn)行光柵掃描時(shí),基于關(guān)注像素及其鄰近像素的狀態(tài),檢測(cè)在 水平方向和垂直方向上像素間的矢量;接著,基于像素間的這些矢量的連接狀態(tài)提取圖像 數(shù)據(jù)的輪廓。在日本特開(kāi)2005-346137號(hào)公報(bào)中,公開(kāi)了這樣一種技術(shù)通過(guò)利用直線、二 次或三次貝塞爾曲線近似輪廓矢量,生成雖然發(fā)生顯著縮放但高質(zhì)量的矢量描述的數(shù)據(jù)。在步驟S507,在步驟S506所創(chuàng)建的矢量線對(duì)象中,將矢量線對(duì)象外接矩形左上端 坐標(biāo)判斷為單元格左上端的相對(duì)坐標(biāo)。將矢量線對(duì)象外接矩形左下端坐標(biāo)判斷為單元格右 下端(或者右下單元格的左上端)的相對(duì)坐標(biāo)。判斷矢量線對(duì)象的布置坐標(biāo)值。在步驟 S508,沒(méi)有滿足用于完成重復(fù)處理的條件,因而,處理進(jìn)入步驟S502。在步驟S502,將右代 入邊的值。在步驟S503,由于還沒(méi)有矢量化右邊,所以處理進(jìn)入步驟S504。在步驟S504,由 于邊的矢量化標(biāo)記為假,因而處理進(jìn)入步驟S509。在步驟S509,將表結(jié)構(gòu)信息中的角部曲 率⑴、實(shí)線和#000的信息轉(zhuǎn)換成要轉(zhuǎn)換的工作薄文檔的單元格的邊界線格式。在步驟S508,沒(méi)有滿足用于完成重復(fù)處理的條件,因而,處理進(jìn)入步驟S502。在步 驟S502,將下代入邊的值,并重復(fù)處理。如同右邊一樣,將下邊轉(zhuǎn)換成單元格的邊界線格式。 最后,將左代入邊的值,并且處理進(jìn)入步驟S503。在步驟S503,由于左邊與上邊聯(lián)結(jié),并且 在處理上邊時(shí)完成了矢量化,所以處理進(jìn)入步驟S508。在步驟S508,完成重復(fù)處理,因而, 處理進(jìn)入步驟S510。在步驟S510,未處理單元格1-2、2-1和2_2,因而,處理進(jìn)入步驟S501。同樣,從步驟S501開(kāi)始對(duì)單元格1-2、2_1和2_2進(jìn)行處理,并因而,對(duì)于單元格 1-2,將上邊和右邊彼此聯(lián)結(jié)并轉(zhuǎn)換成矢量線對(duì)象,并且將下邊和左邊轉(zhuǎn)換成單元格的邊界 線格式。對(duì)于單元格2-1,將下邊和左邊彼此聯(lián)結(jié)并轉(zhuǎn)換成矢量線對(duì)象,并且將上邊和右邊 轉(zhuǎn)成單元格的邊界線格式。對(duì)于單元格2-2,將右邊和下邊彼此聯(lián)結(jié)并轉(zhuǎn)換成矢量線對(duì)象, 并且將上邊和左邊轉(zhuǎn)換成單元格的邊界線格式。在步驟S510,不存在未處理的單元格,并因 而完成處理。基于由表結(jié)構(gòu)分析部212創(chuàng)建的表結(jié)構(gòu)信息、由字符識(shí)別部213識(shí)別出的字符和
10由表線生成部215創(chuàng)建的表的格線信息,工作薄文檔轉(zhuǎn)換部216進(jìn)行到工作薄文檔格式的 電子文檔的轉(zhuǎn)換。圖10的電子文檔1000是為了描述本示例所作出的、根據(jù)虛擬XML格式的規(guī)范而 生成的工作薄文檔220的示例。符號(hào)1001是用于存儲(chǔ)表信息并對(duì)應(yīng)于由元素名稱(chēng)“Table”覆蓋的區(qū)域的部分。在 符號(hào)1001中,存儲(chǔ)了描述表的列信息的“Column”元素部分1003和描述行信息的“Row”元 素部分1004。根據(jù)一個(gè)大的表信息生成工作薄文檔的表格。在圖6的輸入圖像的示例中,圖像內(nèi)的行和列的數(shù)量為2X2,但添加了一行和一 列以表示表的上部和左部中的空白,從而形成3X3。因此,存在表示列的三個(gè)“Column”元 素部分1003和表示行的三個(gè)“Row”元素部分1004?!癈olumn”元素1003存儲(chǔ)列號(hào)“C”屬 性和各列寬度“width”屬性。在“Column”元素1003中,如在圖7的單元格的矩形信息中所示,由于表左部的寬 度為100 (也就是說(shuō),單元格1-1的位置的坐標(biāo)X為100),所以“Column”元素1003在c = 1時(shí)的“Column”元素的寬度為100。由于在圖7的第一表列中單元格的尺寸的寬度為200, 所以“Column”元素1003在c = 2時(shí)的“Column”元素的寬度為200。由于在圖7的第二表 列中單元格的尺寸的寬度為400,所以“Column”元素1003在c = 3時(shí)的“Column”元素的 寬度為400。在“Row”元素中,存儲(chǔ)有行號(hào)“r”屬性和各行高度“height”屬性;“Row”元素由 數(shù)量與列相對(duì)應(yīng)的單元格信息“Cell”元素組成。在“Row”元素部分1004中,如圖7的單元格的矩形信息中所示,由于表上部的高 度為200 (也就是說(shuō),單元格1-1的位置的y坐標(biāo)為200),所以“Row”元素在r = 1時(shí)的高 度“height”為200。由于第一表行的高度為70,則“Row”元素在r = 2時(shí)的高度“height” 為70。由于第二表行的高度為70,所以“Row”元素在r = 3時(shí)的高度“height”為70。由于在r = 1時(shí)的“Row”元素為空白并且不存在單元格信息,所以不存在子元素 “Cell”元素。由于在r = 2時(shí)的“Row”元素和在r = 3時(shí)的“Row”元素中的每一個(gè)元素中 存在兩個(gè)單元格信息,所以保存兩個(gè)“ Ce 11,,元素?!癈ell”元素存儲(chǔ)表示“Cell”元素本身為第c列的“C”屬性、表示在單元格中所描 述的數(shù)據(jù)類(lèi)型的“type”屬性和表示單元格中的數(shù)據(jù)值的“value”屬性;“Cell”元素由單 元格的邊界線信息“Line”形成。這里,根據(jù)圖8所示的字符識(shí)別結(jié)果,r = 2的“Row”元 素內(nèi)的c = 2的“Cell”元素存儲(chǔ)類(lèi)型=“sting”和值=“ID”。c = 3的“Cell”元素存儲(chǔ) 類(lèi)型=“sting”和值=“1234567”。r = 3的“Row”元素內(nèi)的c = 2的“Cell”元素存儲(chǔ)類(lèi) 型=“sting” 和值=“Name”。c = 3 的 “Cell” 元素存儲(chǔ)類(lèi)型=“sting” 和值=“Maruko Taro"ο“Line”元素存儲(chǔ)表示該元素對(duì)應(yīng)于四邊中的哪一邊的“position”屬性、表示線類(lèi) 型的“type”屬性和表示線顏色的“color”屬性。根據(jù)在圖5的流程圖中所創(chuàng)建的單元格的邊界線信息,針對(duì)r = 2的“Row”元素 內(nèi)的c = 2的“Cell”元素,設(shè)置位置為右和下的兩個(gè)“Line”元素。分別地,在“type”屬 性中存儲(chǔ)了表示實(shí)線的“solid”,以及在“color”屬性中存儲(chǔ)了表示黑色的#000000。針對(duì)r = 2的“Row”元素內(nèi)的c = 3的“Cell ”元素,設(shè)置位置為左和下的兩個(gè)“Line”元素。分別地,在“type”屬性中存儲(chǔ)了表示實(shí)線的“solid”,以及在“color”屬性 中存儲(chǔ)了表示黑色的#000000。針對(duì)r = 3的“Row”元素內(nèi)的c = 2的“Cell ”元素,設(shè)置位置為右和上的兩個(gè) “Line”元素。分別地,在“type”屬性中存儲(chǔ)了表示實(shí)線的“solid”,以及在“color”屬性 中存儲(chǔ)了表示黑色的#000000。針對(duì)r = 3的“Row”元素內(nèi)的c = 3的“Cell ”元素,設(shè)置位置為左和上的兩個(gè) “Line”元素。分別地,在“type”屬性中存儲(chǔ)了表示實(shí)線的“solid”,以及在“color”屬性 中存儲(chǔ)了表示黑色的#000000。符號(hào)1002隨意地布置在表上,并且是存儲(chǔ)有圖形信息的部分并對(duì)應(yīng)于由元素名 稱(chēng)“Shape”圍繞的區(qū)域。符號(hào)1002由描述圖形信息的多個(gè)“Shape”元素組成。“Shape”元素具有作為子元素的圖形對(duì)象,并且存儲(chǔ)關(guān)于繪制了圖形對(duì)象的位置 的信息作為屬性。這里,“Shape”元素對(duì)應(yīng)于一個(gè)矢量線對(duì)象。在符號(hào)1002中,包括了由 表示貝塞爾曲線的子元素“Path”形成的四個(gè)“Shape”元素1005、1006、1007和1008。在 本發(fā)明中,矢量線對(duì)象定義左上端和右下端作為單元格的相對(duì)坐標(biāo)。因此,“Shape”元素由 表示相對(duì)于左上端的目標(biāo)單元格的矩陣的fromCell的信息、表示相對(duì)坐標(biāo)的fromPos的信 息、表示相對(duì)于右下端的目標(biāo)單元格的矩陣的toCell的信息以及表示相對(duì)坐標(biāo)的toPos的 信息組成。將具體描述作為單元格1-1的左上邊的矢量線對(duì)象的“Shape”元素1005。在 “Shape”元素1005中,對(duì)于第二行第二列的單元格(fromCell =“22”),描述了在從左上端 (0,0) (fromPos ="00")到右下端的區(qū)域內(nèi)進(jìn)行繪制的位置以及尺寸信息。第二行第二列 的右下端對(duì)應(yīng)于第三行第三列(toCell =“33”)的左上端(0,0) (toPos = “00”)。同樣,作為單元格1-2的右上邊的矢量線對(duì)象的“Shape”元素1006如下。具體地, 對(duì)于第二行第三列的單元格(fromCell =“23”),描述了在從左上端(0,0) (fromPos = "0 0”)到右下端的區(qū)域中進(jìn)行繪制的位置以及尺寸信息。第二行第三列的右下端對(duì)應(yīng)于第三 行第四列(toCell =‘‘34”)的左上端(0,0) (toPos = "0 0”)。作為單元格2-1的左下邊的矢量線對(duì)象的“Shape”元素1007如下。具體地,對(duì)于 第三行第二列的單元格(fromCell =“3 3”),描述了在從左上端(0,0) (fromPos =“0 0”) 到右下端的區(qū)域內(nèi)進(jìn)行繪制的位置以及尺寸信息。第三行第二列的右下端對(duì)應(yīng)于第四行第 三列(toCell =“3 4”)的左上端(0,0) (toPos =“0 0”)。作為單元格2-2的右下邊的矢量線對(duì)象的“Shape”元素1008如下。具體地,對(duì)于 第三行第三列的單元格(fromCell =“3 3”),描述了在從左上端(0,0) (fromPos =“0 0”) 到右下端的區(qū)域內(nèi)進(jìn)行繪制的位置以及尺寸信息。第三行第三列的右下端對(duì)應(yīng)于第四行第 四列(toCell =“4 4,,)的左上端(0,0) (toPos = “0 0”)。“Path”元素具有關(guān)于對(duì)象的形狀的信息,并且在具有“canvasSize”屬性中設(shè)置的 尺寸的平面上,利用三次貝塞爾曲線描述“data”屬性中的曲線形狀。窗口 1101是由顯示/編輯程序121顯示的窗口,并且包括表格編輯窗口 1102。在表格編輯窗口 1102中,生成與工作簿文檔220中的表格信息221的內(nèi)容相對(duì)應(yīng) 的顯示。對(duì)于在本發(fā)明的實(shí)施例1中所示的圖10中的電子薄文檔1000,繪制表信息1001 和格線數(shù)據(jù)1002的內(nèi)容。對(duì)于不能由單元格的邊界線表示的角部具有曲率的表,按其輸入
12圖像的原樣生成表。在表格編輯窗口 1102中,用戶可以添加表的行,改變單元格的內(nèi)容,并且改變單 元格的尺寸。此外,用戶可以存儲(chǔ)已編輯的工作薄文檔,并且在紙上打印所顯示的表格編輯 窗口 1102的外觀。圖12示出通過(guò)用戶添加行和改變單元格尺寸而獲得的結(jié)果的示例。由于將矢量 線對(duì)象描述為相對(duì)于單元格的坐標(biāo),因此,即使進(jìn)行諸如用于改變單元格的尺寸和插入行 的操作,矢量線對(duì)象也會(huì)像單元格的邊界線一樣跟隨。如上所述,在本示例中,生成表示不能由格式的規(guī)范再現(xiàn)的格線、并可以作為表進(jìn) 行編輯的工作簿。利用顯示/編輯程序121,用戶可以通過(guò)菜單等容易地選擇并使用這樣生成的工 作薄。具體地,根據(jù)本實(shí)施例,可以提供格式適合于打印或在顯示器上顯示工作薄的目的和 編輯工作薄的表的目的中的任一目的或者適合于這兩個(gè)目的工作薄。實(shí)施例2盡管實(shí)施例1涉及變換不能簡(jiǎn)單地通過(guò)規(guī)范表示的格線的情況,但是可以變換由 于本身復(fù)雜的結(jié)構(gòu)而不能表示的格線。以下將描述圖13的圖像1300是輸入圖像以及圖14的表是轉(zhuǎn)換格式的規(guī)范的示 例中的處理。例如,當(dāng)通過(guò)區(qū)域判別部211處理圖像1300時(shí),假設(shè)提取區(qū)域1301和1302作為
表區(qū)域。通過(guò)表結(jié)構(gòu)分析部212對(duì)區(qū)域1301和1302進(jìn)行與實(shí)施例1中的處理相同的處理, 并因而提取表結(jié)構(gòu)信息,以及通過(guò)字符識(shí)別部213提取通過(guò)識(shí)別字符區(qū)域上的字符而獲得 的結(jié)果。將參考圖15的流程圖描述由表線判斷部214進(jìn)行的處理示例。在該實(shí)施例2中,由于增加了用于格線規(guī)范的標(biāo)準(zhǔn)的數(shù)量,所以將步驟S1501中用 于判斷表結(jié)構(gòu)本身的規(guī)范的處理添加到圖4所示的實(shí)施例1中的表線判斷的流程圖中。在步驟S1501,判斷是否滿足關(guān)于表本身的位置的規(guī)范的范圍。在該實(shí)施例中,如 果判斷的目標(biāo)表存在于另一個(gè)表內(nèi),則判斷為不滿足關(guān)于表本身的位置的規(guī)范。另一方面, 如果判斷的目標(biāo)表不存在于另一個(gè)表內(nèi),則判斷為滿足關(guān)于表本身的位置的規(guī)范。對(duì)于區(qū) 域1301,滿足關(guān)于表的位置的規(guī)范,因而,處理進(jìn)入步驟S1502。此后,進(jìn)行與實(shí)施例1中的 處理相同的處理,并且將第一行第一列的單元格的左邊和上邊的矢量化標(biāo)記設(shè)置為真,將 第一行第二列的單元格的右邊和上邊的矢量化標(biāo)記設(shè)置為真,并且將第三行第一列的單元 格的左邊、下邊和右邊的矢量化標(biāo)記設(shè)置為真。對(duì)于表區(qū)域1302,表的位置在表區(qū)域1301的單元格內(nèi),因而,處理進(jìn)入步驟 S1512。在步驟S1512,將表結(jié)構(gòu)的所有邊的矢量化標(biāo)記設(shè)置為真,并且還將內(nèi)部字符串表示 為圖形對(duì)象內(nèi)的文本?;诒砭€判斷部214的判斷結(jié)果,表線生成部215生成表線。對(duì)于區(qū)域1301,將第 一行第一列的單元格的左上邊轉(zhuǎn)換成矢量線對(duì)象,將第一行第二列的單元格的右上邊轉(zhuǎn)換 成矢量線對(duì)象,以及將第三行第一列的單元格的右下邊和左下邊轉(zhuǎn)換成矢量線對(duì)象。對(duì)于 區(qū)域1302,將所有邊轉(zhuǎn)換成矢量線對(duì)象。
基于字符識(shí)別部213和表線生成部215的結(jié)果,工作薄文檔轉(zhuǎn)換部216進(jìn)行用于 將字符識(shí)別數(shù)據(jù)、矢量線對(duì)象和單元格的邊界線信息轉(zhuǎn)換成工作薄文檔的處理。圖16是通過(guò)顯示/編輯程序121打開(kāi)通過(guò)轉(zhuǎn)換圖像1300得到的工作薄文檔的示 例。如圖16所示,可以再現(xiàn)由傳統(tǒng)規(guī)范不能表示的區(qū)域1302。根據(jù)本實(shí)施例,即使表的結(jié)構(gòu)本身復(fù)雜,也可以提供格式適合于打印或在顯示器 上顯示工作薄的目的和編輯工作薄的表的目的中的任一目的或者適合于這兩個(gè)目的工作薄。其他實(shí)施例還可以通過(guò)讀出并執(zhí)行存儲(chǔ)設(shè)備上所記錄的程序以執(zhí)行上述實(shí)施例的功能的系 統(tǒng)或設(shè)備的計(jì)算機(jī)(或者諸如CPU或MPU的裝置)以及通過(guò)以下方法來(lái)實(shí)現(xiàn)本發(fā)明的各方 面,其中,由系統(tǒng)或設(shè)備的計(jì)算機(jī)通過(guò)例如讀出并執(zhí)行存儲(chǔ)設(shè)備上所記錄的程序以執(zhí)行上 述實(shí)施例的功能,來(lái)執(zhí)行該方法的各步驟。為了該目的,例如,經(jīng)由網(wǎng)絡(luò)或者從用作存儲(chǔ)設(shè) 備的各種類(lèi)型的記錄介質(zhì)(例如,計(jì)算機(jī)可讀介質(zhì))向計(jì)算機(jī)提供該程序。盡管已經(jīng)參考典型實(shí)施例描述了本發(fā)明,但是應(yīng)該理解,本發(fā)明不限于所公開(kāi)的 典型實(shí)施例。所附權(quán)利要求書(shū)的范圍符合最寬的解釋?zhuān)园羞@類(lèi)修改、等同結(jié)構(gòu)和功 能。
權(quán)利要求
一種圖像處理裝置,用于根據(jù)所輸入的圖像生成具有預(yù)定的格式的電子文檔,所述圖像處理裝置包括區(qū)域判別單元,用于分析所述圖像并判別表區(qū)域;表結(jié)構(gòu)分析單元,用于分析所判別出的表區(qū)域中的表結(jié)構(gòu)和格線,并創(chuàng)建包括與表的單元格有關(guān)的信息的表結(jié)構(gòu)信息;判斷單元,用于判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié)構(gòu)信息中包括的單元格的邊表示為表的格線;用于根據(jù)被判斷為能夠表示為格線的邊、創(chuàng)建要根據(jù)所述格式表示的格線信息的單元;用于通過(guò)對(duì)被判斷為不能表示為格線的邊進(jìn)行矢量轉(zhuǎn)換處理、創(chuàng)建矢量線對(duì)象的單元;以及電子文檔生成單元,用于根據(jù)所創(chuàng)建的表結(jié)構(gòu)信息、所創(chuàng)建的格線信息和所創(chuàng)建的矢量線對(duì)象,生成所述電子文檔。
2.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述判斷單元基于邊和該邊的鄰邊接合在一起的角的曲率,判斷是否能夠根據(jù)所述格 式將所創(chuàng)建的表結(jié)構(gòu)信息中包括的單元格的該邊表示為表的格線。
3.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述判斷單元基于邊的線顏色,判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié)構(gòu)信息中 包括的單元格的該邊表示為表的格線。
4.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述判斷單元基于邊的線類(lèi)型,判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié)構(gòu)信息中 包括的單元格的該邊表示為表的格線。
5.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述判斷單元基于所創(chuàng)建的表結(jié)構(gòu)信息中包括的表的位置,判斷是否能夠根據(jù)所述格 式將所創(chuàng)建的表結(jié)構(gòu)信息中包括的單元格的邊表示為表的格線。
6.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述電子文檔生成單元?jiǎng)?chuàng)建將所述矢量線對(duì)象布置在根據(jù)所述表結(jié)構(gòu)信息的單元格 中的電子文檔。
7.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,還包括字符識(shí)別裝置,其中,所述區(qū)域判別單元判別字符區(qū)域,所述字符識(shí)別裝置從判別出的字符區(qū)域識(shí)別字符,以及所述電子文檔生成單元根據(jù)所創(chuàng)建的表結(jié)構(gòu)信息、所創(chuàng)建的格線信息、所創(chuàng)建的矢量 線對(duì)象和所識(shí)別出的字符,生成所述電子文檔。
8.根據(jù)權(quán)利要求1所述的圖像處理裝置,其特征在于,所述電子文檔的格式是電子表格的格式。
9.一種圖像處理方法,用于根據(jù)所輸入的圖像生成具有預(yù)定的格式的電子文檔,所述 圖像處理方法包括區(qū)域判別步驟,用于分析所述圖像并判別表區(qū)域;表結(jié)構(gòu)分析步驟,用于分析所判別出的表區(qū)域中的表結(jié)構(gòu)和格線,并創(chuàng)建包括與表的單元格有關(guān)的信息的表結(jié)構(gòu)信息;判斷步驟,用于判斷是否能夠根據(jù)所述格式將所創(chuàng)建的表結(jié)構(gòu)信息中包括的單元格的 邊表示為表的格線;用于根據(jù)被判斷為能夠表示為格線的邊、創(chuàng)建要根據(jù)所述格式表示的格線信息的步驟;用于通過(guò)對(duì)被判斷為不能表示為格線的邊進(jìn)行矢量轉(zhuǎn)換處理、創(chuàng)建矢量線對(duì)象的步 驟·’以及電子文檔生成步驟,用于根據(jù)所創(chuàng)建的表結(jié)構(gòu)信息、所創(chuàng)建的格線信息和所創(chuàng)建的矢 量線對(duì)象,生成所述電子文檔。
全文摘要
本發(fā)明提供了以對(duì)于電子文檔的許多目的為最佳的格式規(guī)范生成電子文檔的圖像處理裝置和圖像處理方法。根據(jù)輸入圖像判別表區(qū)域,并分析表區(qū)域中的表結(jié)構(gòu)。對(duì)所分析的表結(jié)構(gòu)進(jìn)行關(guān)于是否能夠以該格式表示各格線的表線判斷,并且根據(jù)該判斷結(jié)果創(chuàng)建格線信息和矢量線對(duì)象。所創(chuàng)建的格線信息和矢量線對(duì)象用于生成電子文檔。
文檔編號(hào)G06K9/20GK101944179SQ20101022127
公開(kāi)日2011年1月12日 申請(qǐng)日期2010年7月1日 優(yōu)先權(quán)日2009年7月1日
發(fā)明者榎本誠(chéng) 申請(qǐng)人:佳能株式會(huì)社