專利名稱::圖像處理設(shè)備及圖像處理方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種能夠生成能夠從文檔圖像中搜索對象的電子文檔數(shù)據(jù)的圖像處理設(shè)備、圖像處理方法及計算機程序。
背景技術(shù):
:傳統(tǒng)上,期望構(gòu)建一種能夠在文檔圖像中搜索字符以外的對象(例如圖片(picture)、圖形、線圖(linedrawing)和表格),使得能夠容易地使用這些對象的圖像處理系統(tǒng)。除非特別指出,否則在下面的說明中描述的對象是字符以外的對象。例如,圖像處理系統(tǒng)從文檔圖像中提取對象,并判斷在該對象附近是否存在注釋(caption)字符串(即解釋對象的字符串)。如果判斷為存在注釋字符串,則圖像處理系統(tǒng)將注釋字符串指定為與該對象相關(guān)聯(lián)的元數(shù)據(jù)(metadata),從而能夠基于元數(shù)據(jù)來搜索對象。然后,對與元數(shù)據(jù)相關(guān)聯(lián)的各個對象進行JPEG壓縮,并將其存儲為單個電子文檔。當應(yīng)用程序使用上述電子文檔時,應(yīng)用程序能夠使用元數(shù)據(jù)作為關(guān)鍵詞來進行搜索,以找到對象。此外,在鄰近對象的注釋是圖號(例如“圖1”)的情況下,一般的文檔圖像包括正文,在正文中描述代表相同圖號的字符串以解釋對象。更具體來說,可以在正文中找到與在注釋中描述的圖號相同的表達。如在日本特開平10-228473號公報中所討論的,存在一種傳統(tǒng)技術(shù),其能夠通過在注釋中的圖號和正文中的圖號之間自動生成鏈接,來形成超文本。例如,在鄰近對象的注釋包括圖號“圖1”并且正文包括語句“圖1是AAA。”的情況下,可以在注釋中的“圖1”和正文中的“圖1”之間生成超鏈接。此外,在上述現(xiàn)有技術(shù)中討論的技術(shù)可以通過在對象和相關(guān)正文之間自動生成鏈接來形成超文本。另一方面,多功能外圍設(shè)備(MFP,multifunctionperipheral)具有通過對掃描的輸入文檔圖像進行圖像處理和格式轉(zhuǎn)換處理來生成電子文檔的能力,并且具有經(jīng)由網(wǎng)絡(luò)將生成的電子文檔發(fā)送到個人計算機(PC)的發(fā)送功能。圖像處理包括通過對文檔圖像中包含的字符圖像進行字符識別處理來獲取字符代碼的處理。圖像處理還包括將文檔圖像中的圖形轉(zhuǎn)換為矢量數(shù)據(jù)的矢量化處理。在格式轉(zhuǎn)換處理中,將經(jīng)過上述圖像處理的數(shù)據(jù)轉(zhuǎn)換為預定電子文檔格式(例如便攜式文檔格式(PDF,portabledocumentformat)),以生成電子文檔文件。如在日本特開2009-009526號公報中討論的,存在一種傳統(tǒng)技術(shù),其用于將字符識別結(jié)果作為透明文本(即通過將透明顏色指定為描繪顏色而以隱形的狀態(tài)描繪的字符代碼)嵌入到圖像文件中,并將數(shù)據(jù)轉(zhuǎn)換為電子文檔格式(例如PDF或XPS)。當顯示以這種方式生成的電子文檔文件時,在文檔圖像的字符部分中描繪透明文本。在這種情況下,如果用戶進行關(guān)鍵詞搜索,則系統(tǒng)搜索透明文本。然而,用戶不能在視覺上識別透明文本本身。因此,用戶感覺好像搜索到了文檔圖像中的目標字符圖像部分。以這種方式,可以以強調(diào)的狀態(tài)顯示對應(yīng)于要搜索的關(guān)鍵詞的字符圖像部分。因此,用戶能夠有效地識別目標字符圖像部分。另一方面,在將注釋字符串作為元數(shù)據(jù)添加到字符以外的對象、使得可以在電子文檔中搜索該對象的情況下,希望強調(diào)在關(guān)鍵詞搜索中命中的搜索結(jié)果(即目標對象)。然而,在這種情況下要搜索的目標對象是顏色和形狀差別很大的圖片、圖形和表格對象中的任何一個。因此,強調(diào)顯示可能不帶來期望的效果。用戶不能識別在搜索中命中的目標對象。例如,在用紅色強調(diào)搜索到的對象的輪廓的情況下,如果搜索到的對象是在搜索到的對象附近或在整個區(qū)域的大部分中包括紅色部分的圖片對象,則搜索結(jié)果的強調(diào)顯示不是有效的。更具體來說,識別在搜索中命中的對象,對于用戶來說是非常困難的。此外,在通過網(wǎng)絡(luò)發(fā)送生成的電子文檔數(shù)據(jù)的情況下,希望減小電子文檔數(shù)據(jù)的數(shù)據(jù)大小。然而,如果對從文檔圖像中提取的各對象(例如圖片)進行獨立壓縮,并將壓縮后的圖像數(shù)據(jù)與背景圖像數(shù)據(jù)組合并作為單個電子文件存儲,則獲得的文件的大小與通過壓縮一個整體原始文檔圖像獲得的文件大小相比,趨于變大。更具體來說,在發(fā)送包含圖片的文檔圖像的情況下,通過壓縮包括圖片部分和背景的整個圖像來作為一個壓縮圖像數(shù)據(jù),而不是作為獨立的壓縮圖像數(shù)據(jù)來存儲提取的圖片對象和背景,可以有效地減小發(fā)送的圖像的總數(shù)據(jù)大小。一般來說,構(gòu)成上述數(shù)據(jù)的元素是圖像信息和壓縮頭信息。如果對象數(shù)據(jù)的數(shù)量增加,則針對各數(shù)據(jù)重復存儲頭信息。尤其,在高級圖像壓縮方法中,壓縮中需要的頭信息趨于變大。因此,在基于包括多個對象(例如圖片)的文檔圖像生成電子文檔文件的情況下,希望壓縮所有對象作為單個圖像,而不是分開壓縮各對象,以有效地減小總數(shù)據(jù)大小。例如,在將圖像數(shù)據(jù)存儲為JPEG壓縮流的情況下,各個流伴隨有700字節(jié)或更大的頭信息,其包括進行光柵化(rasterization)時使用的量化表和霍夫曼(Huffman)代碼。在一頁圖像包括100個圖片的情況下,與將背景和圖片分別壓縮為總共101個獨立圖像數(shù)據(jù)的情況相比較,通過將所有圖片和背景壓縮為一個圖像數(shù)據(jù),可以獲得相當于每一頁70K字節(jié)或更大的大小減小效果。然而,如果將對象和背景壓縮為一個圖像數(shù)據(jù),則以搜索目標對象與背景合并的狀態(tài)存儲電子文檔數(shù)據(jù)。因此,在搜索中難以識別和強調(diào)目標對象。
發(fā)明內(nèi)容根據(jù)本發(fā)明的一方面,本發(fā)明提供一種圖像處理設(shè)備,所述圖像處理設(shè)備包括區(qū)域分割單元,其配置成從輸入圖像中提取對象區(qū)域;確定單元,其配置成確定由所述區(qū)域分割單元提取的所述對象區(qū)域的屬性;元數(shù)據(jù)處理單元,其配置成獲取要與由所述區(qū)域分割單元提取的所述對象區(qū)域相關(guān)聯(lián)的元數(shù)據(jù);圖形描述生成單元,其配置成針對具有需要生成透明圖形描述的屬性的對象區(qū)域,生成所述透明圖形描述;以及電子文檔生成單元,其配置成將所述圖形描述生成單元生成的所述透明圖形描述與所述元數(shù)據(jù)相關(guān)聯(lián),并生成包括基于所述輸入圖像生成的圖像數(shù)據(jù)和與所述元數(shù)據(jù)相關(guān)聯(lián)的所述透明圖形描述的電子文檔。根據(jù)本發(fā)明的圖像處理設(shè)備能夠生成用戶容易在搜索操作中使用關(guān)鍵詞進行識別,以搜索電子文檔中包括的字符以外的對象,而不依賴于搜索目標對象的形狀和顏色、或者不依賴于圖像壓縮狀態(tài)的適合強調(diào)表示的電子文檔數(shù)據(jù)。從以下參照附圖對實施例的詳細描述,本發(fā)明的其它特征和方面將變得明顯。包括在說明書中并構(gòu)成說明書的一部分的附圖與本說明一起示出本發(fā)明的實施例、特征和方面,并且用于解釋本發(fā)明的原理。圖1是示出根據(jù)本發(fā)明的實施例的圖像處理系統(tǒng)的框圖。圖2是示出圖1所示的多功能外圍設(shè)備(MFP)100的框圖。圖3是示出圖2所示的數(shù)據(jù)處理單元218的示例配置的框圖。圖4是根據(jù)本發(fā)明的實施例的圖像處理系統(tǒng)執(zhí)行的處理的示例過程的流程圖。圖5是示出圖3所示的格式轉(zhuǎn)換單元305的示例配置的框圖。圖6示出提取區(qū)域的示例。圖7示出存儲在存儲單元211中的信息的示例。圖8A至圖8D是圖3所示的格式轉(zhuǎn)換單元305的對應(yīng)關(guān)系表(即控制信息)的示例。圖9示出根據(jù)本發(fā)明的實施例的輸入圖像數(shù)據(jù)的示例。圖10示出從圖9所示的示例圖像數(shù)據(jù)中提取的信息的示例。圖11示出根據(jù)本發(fā)明的實施例生成的電子文檔數(shù)據(jù)的示例。圖12是示出圖3所示的元數(shù)據(jù)處理單元304執(zhí)行的處理的示例過程的流程圖。圖13是示出圖3所示的格式轉(zhuǎn)換單元305執(zhí)行的處理的示例過程的流程圖。圖14A至圖14D示出由使得用戶能夠瀏覽和搜索電子文檔數(shù)據(jù)的應(yīng)用程序提供的顯示畫面的示例。圖15示出注釋區(qū)域中的錨定(anchor)字符串和元數(shù)據(jù)字符串的示例。圖16示出當輸入圖9所示的圖像數(shù)據(jù)的第一頁時生成的圖形數(shù)據(jù)的示例。圖17示出根據(jù)電子文檔格式的頁面描述的示例。圖18示出輸出的電子文檔數(shù)據(jù)的示例。圖19是示出根據(jù)本發(fā)明的第二實施例的圖3所示的格式轉(zhuǎn)換單元305執(zhí)行的處理的示例過程的流程圖。圖20示出根據(jù)本發(fā)明的第二實施例的與生成電子文檔數(shù)據(jù)的意圖相關(guān)的UI畫面的示例。圖21示出根據(jù)本發(fā)明的第三實施例的與透明框描述相關(guān)的UI畫面的示例。圖22是示出根據(jù)本發(fā)明的第四實施例的面部識別處理的示例配置的框圖。圖23是示出根據(jù)本發(fā)明的第四實施例的圖2所示的數(shù)據(jù)處理單元218的示例配置的框圖。圖24示出根據(jù)本發(fā)明的第四實施例的由使得用戶能夠瀏覽和搜索電子文檔數(shù)據(jù)的應(yīng)用程序提供的顯示的示例。具體實施例方式下面,參照附圖詳細描述本發(fā)明的各種實施例、特征和方面。下文中,參照附圖描述本發(fā)明的第一實施例。圖1是示出根據(jù)本發(fā)明的實施例的圖像處理系統(tǒng)的配置的框圖。在圖1中,多功能外圍設(shè)備(MFP)IOO連接到安裝在辦公室A中的局域網(wǎng)(LAN)102。MFP100是可以實現(xiàn)多個功能(例如復印功能、打印功能和傳輸功能)的多功能機。LAN102經(jīng)由代理服務(wù)器103連接到外部網(wǎng)絡(luò)104。客戶PC101可以經(jīng)由LAN102接收來自MFP100的傳輸數(shù)據(jù),并且可以使用MFP100的功能。例如,客戶PC101將打印數(shù)據(jù)傳送到MFP100,以使MFP100基于接收到的打印數(shù)據(jù)生成打印產(chǎn)品。圖1所示的配置僅僅是示例。各個具有類似于圖1所示的組成部分的多個辦公室可以經(jīng)由網(wǎng)絡(luò)104相互連接。網(wǎng)絡(luò)104是可以例如通過因特網(wǎng)、局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、電話電路、專用數(shù)字電路、ATM和幀中繼電路、通信衛(wèi)星電路、有線電視電路或數(shù)據(jù)廣播無線電路實現(xiàn)的通信網(wǎng)絡(luò)。網(wǎng)絡(luò)104可以由能夠?qū)崿F(xiàn)數(shù)據(jù)發(fā)送和接收的任何其它通信網(wǎng)絡(luò)構(gòu)成。客戶PC101和代理服務(wù)器103中的各個包括基本組成部分(例如中央處理單元(CPU)、隨機存取存儲器(RAM)、只讀存儲器(ROM)、硬盤、外部存儲裝置、網(wǎng)絡(luò)接口、顯示裝置、鍵盤和鼠標),它們與通用計算機中安裝的類似。圖2示出了根據(jù)本實施例的MFP(即圖像處理設(shè)備)100的詳細配置。MFP100包括可以作為圖像輸入裝置的掃描器單元201、可以作為圖像輸出裝置的打印機單元202、包括中央處理單元(CPU)205的控制單元204和可以作為用戶接口的操作單元203??刂茊卧?04是可以進行通過與掃描器單元201、打印機單元202和操作單元203的通信、以及與經(jīng)由局域網(wǎng)(LAN)219和公共線路(WAN)220可訪問的外部裝置的通信,來輸入和輸出圖像信息和裝置信息的處理的控制器。還將公共線路(WAN)220稱為普通電話電路。CPU205可以控制設(shè)置在控制單元204中的各種功能單元。隨機存取存儲器(RAM)206是在CPU205進行各種操作時作為能夠臨時存儲圖像數(shù)據(jù)的圖像存儲器的系統(tǒng)工作存儲器。只讀存儲器(ROM)210是可以存儲系統(tǒng)引導程序和其它程序的引導ROM。存儲單元211是可以存儲系統(tǒng)控制軟件程序和圖像數(shù)據(jù)的硬盤驅(qū)動器。操作單元I/F207是連接到操作單元(UI)203的接口單元。操作單元I/F207可以將圖像數(shù)據(jù)輸出到操作單元203。操作單元203顯示從操作單元I/F207接收到的圖像數(shù)據(jù)。此外,如果用戶經(jīng)由操作單元203將信息輸入到圖像處理設(shè)備,則操作單元I/F207可以將輸入信息傳送到CPU205。網(wǎng)絡(luò)I/F208將圖像處理設(shè)備連接到LAN219,以進行輸入和輸出包格式信息的處理。調(diào)制解調(diào)器209將圖像處理設(shè)備連接到公共電話電路220,以進行輸入和輸出信息的數(shù)據(jù)解調(diào)和調(diào)制處理。上述裝置經(jīng)由系統(tǒng)總線221相互連接。圖像總線接口212是連接系統(tǒng)總線221和圖像總線222的總線橋。圖像總線222可以快速傳輸圖像數(shù)據(jù)。圖像總線接口212可以轉(zhuǎn)換數(shù)據(jù)結(jié)構(gòu)。圖像總線222例如是PCI總線或IEEE1394。以下裝置經(jīng)由圖像總線222相互連接。光柵圖像處理器(RIP,rasterimageprocessor)213可以實現(xiàn)分析頁面描述語言(PDL,pagedescriptionlanguage)代碼并將PDL代碼光柵化為具有指定分辨率的位像的繪制(rendering)處理。當RIP213進行上述光柵化處理時,按像素或者按區(qū)域來添加屬性信息。通常將該處理稱為圖像區(qū)域確定處理。通過圖像區(qū)域確定處理,可以向各個像素或各個區(qū)域添加代表諸如字符(文本)、線、圖形或圖像的對象類型的屬性信息。例如,根據(jù)PDL代碼中的PDL描述的對象類型,從RIP213輸出圖像區(qū)域信號。與對應(yīng)于對象的像素或區(qū)域相關(guān)聯(lián)地存儲代表由信號值表示的屬性的屬性信息。因此,圖像數(shù)據(jù)伴隨有與圖像數(shù)據(jù)相關(guān)聯(lián)的屬性信息。裝置I/F單元214經(jīng)由信號線223將掃描器單元201(即圖像輸入裝置)連接到控制單元204。此外,裝置I/F單元214經(jīng)由信號線224將打印機單元202(即圖像輸出裝置)連接到控制單元204。裝置I/F單元214可以對圖像數(shù)據(jù)進行同步/異步轉(zhuǎn)換處理。掃描器圖像處理單元215可以對輸入的圖像數(shù)據(jù)進行修正、修改和編輯處理。打印機圖像處理單元216可以根據(jù)打印機單元202對要輸出到打印機單元202的打印輸出圖像數(shù)據(jù)進行修正和分辨率轉(zhuǎn)換處理。圖像旋轉(zhuǎn)單元217可以旋轉(zhuǎn)輸入的圖像數(shù)據(jù)以輸出豎立的圖像。數(shù)據(jù)處理單元218可以進行以下處理。接下來,參照圖3詳細描述數(shù)據(jù)處理單元218。數(shù)據(jù)處理單元218包括區(qū)域分割單元(或者區(qū)域提取單元)301、屬性信息添加單元302、字符識別單元303、元數(shù)據(jù)處理單元304和格式轉(zhuǎn)換單元305。數(shù)據(jù)處理單元218響應(yīng)于通過掃描圖像從掃描器單元輸入的圖像數(shù)據(jù)300,使各處理單元301至305進行處理。數(shù)據(jù)處理單元218作為電子文檔數(shù)據(jù)310輸出處理后的數(shù)據(jù)。區(qū)域分割單元301輸入由圖2所示的掃描器單元201掃描的圖像數(shù)據(jù)或者存儲在存儲單元211中的圖像數(shù)據(jù)(即文檔圖像)。區(qū)域分割單元301可以對數(shù)據(jù)的像素進行提取和分組處理,以提取對象區(qū)域(即諸如布置在頁面中的字符、圖片、圖形和表格的對象的區(qū)域)。在這種情況下,區(qū)域分割單元301可以使用傳統(tǒng)上已知的適當?shù)膮^(qū)域提取方法(即區(qū)域分割方法)。根據(jù)作為示例的方法,區(qū)域分割單元301將輸入圖像二值化以生成二值圖像,并且降低二值圖像的分辨率以生成稀疏(thin)的圖像(即縮小的圖像)。例如,為了生成1/(MXN)的稀疏圖像,區(qū)域分割單元301將二值圖像分割成多個組,每組包括MXN個像素。區(qū)域分割單元301判斷在各個MXN個像素的組中是否存在黑色像素。如果判斷為目標組包括黑色像素,則區(qū)域分割單元301將黑色像素設(shè)置為作為要生成的稀疏圖像的要生成的縮小圖像的對應(yīng)像素。另一方面,如果判斷為目標組不包括黑色像素,則區(qū)域分割單元301將白色像素設(shè)置為要生成的稀疏圖像。接下來,區(qū)域分割單元301從稀疏圖像中提取相連的黑色像素(即黑色像素連續(xù)排列的黑色相連成分),并生成外接相連的黑色像素的矩形。如果排列了與文檔圖像中的字符部分具有類似大小的矩形(每個對應(yīng)于一個字符),或者如果提取的矩形的垂直邊或水平邊的大小與字符圖像大小類似(即外接黑色像素相連的一些字符圖像的矩形)并且類似的矩形布置在其短邊處,則可以將其視為構(gòu)成一個字符行的字符圖像。在這種情況下,區(qū)域分割單元301通過連接矩形來獲得代表一個字符行的矩形。然后,可以將各個代表一個字符行的矩形的短邊長度基本相同并且在列方向上以相同的間隔排列的矩形的集合視為正文部分。因此,區(qū)域分割單元301通過連接這些矩形來提取正文區(qū)域。此外,區(qū)域分割單元301可以作為與字符圖像相比具有較大尺寸的連續(xù)相連的黑色像素部分來提取圖片區(qū)域、圖形區(qū)域和表格區(qū)域中的各個。結(jié)果,例如可以提取圖6所示的區(qū)域601至605。如下所述,可以基于各個區(qū)域的大小、長寬比、黑色像素密度或應(yīng)用到相連的黑色像素內(nèi)部存在的白色像素的輪廓跟蹤結(jié)果來確定其屬性。屬性信息添加單元302向區(qū)域分割單元301分割的各個區(qū)域添加屬性。例如,為了作為輸入圖像數(shù)據(jù)來處理圖6所示的示例圖像,屬性信息添加單元302進行以下處理。區(qū)域605具有構(gòu)成頁面中的段落的多行字符。因此,屬性信息添加單元302將屬性“正文”添加到區(qū)域605。然后,屬性信息添加單元302判斷其余區(qū)域是否包括與字符圖像具有類似大小的矩形。特別地,如果區(qū)域包括字符圖像,則在該區(qū)域中周期性地出現(xiàn)外接各個字符圖像的類似的矩形。因此,屬性信息添加單元302可以將該區(qū)域識別為包括字符的區(qū)域。結(jié)果,因為屬性信息添加單元302判斷為區(qū)域601和區(qū)域604包括字符,所以將屬性“字符區(qū)域”添加到這些區(qū)域中的各個。在這種情況下,區(qū)域601和區(qū)域604中的各個都不包括構(gòu)成段落的多行字符。因此,屬性信息添加單元302不向區(qū)域601和區(qū)域604中的各個添加屬性“正文”。另一方面,如果其它區(qū)域的區(qū)域大小非常小,則屬性信息添加單元302確定該區(qū)域是“噪聲”。此外,屬性信息添加單元302對具有較低像素密度的相連黑色像素內(nèi)部存在的白色像素進行輪廓跟蹤處理。如果白色像素輪廓的外接矩形整齊地排列,則屬性信息添加單元302確定識別的區(qū)域是“表格”。如果白色像素輪廓的外接矩形未整齊地排列,則屬性信息添加單元302確定識別的區(qū)域是“線圖”。此外,可以將具有較高像素密度的其余區(qū)域視為插圖或圖片。因此,屬性信息添加單元302將屬性“圖片”添加到這些區(qū)域。此外,如果在添加了“表格”、“線圖”或“圖片”屬性的區(qū)域附近(例如上面或下面)存在未識別為正文的字符區(qū)域,則屬性信息添加單元302確定識別的區(qū)域是解釋對應(yīng)的“表格”、“線圖”或“圖片”區(qū)域的字符區(qū)域。因此,屬性信息添加單元302將“注釋”屬性添加到該字符區(qū)域。屬性信息添加單元302將添加了屬性“注釋”的區(qū)域與識別伴隨區(qū)域(即表格、線圖、圖片區(qū)域)的信息相關(guān)聯(lián)地存儲,從而可以容易地識別“注釋”伴隨的區(qū)域。此外,如果區(qū)域大小大于正文部分的字符圖像,并且區(qū)域位置不同于正文部分的多列(multiplecolumn),則屬性信息添加單元302將屬性“標題”添加到識別的字符區(qū)域。此外,如果區(qū)域大小大于正文部分的字符圖像,并且區(qū)域位置在正文部分的多列之上,則屬性信息添加單元302將屬性“副標題”添加到識別的字符區(qū)域。此外,如果區(qū)域大小等于或小于正文部分的字符圖像,并且區(qū)域位置是原稿的上端部或下端部,則屬性信息添加單元302將屬性“頁”(或者“頁眉”或“頁腳”)添加到識別的字符區(qū)域。此外,如果識別的字符區(qū)域不是“正文”、“標題”、“副標題”、“注釋”和“頁”區(qū)域中的任何一個,則屬性信息添加單元302將屬性“字符”添加到識別的字符區(qū)域。如果對圖6所示的示例進行上述屬性信息添加處理,則向區(qū)域601添加屬性“標題”。向區(qū)域602添加屬性“表格”。向區(qū)域603添加屬性“圖片”。向區(qū)域604添加伴隨區(qū)域603的屬性“注釋”。向區(qū)域605添加屬性“正文”。字符識別單元303以傳統(tǒng)上已知的方式對添加了屬性“字符”、“正文”、“標題”、“副標題”或“注釋”的區(qū)域(即包括字符圖像的區(qū)域)執(zhí)行字符識別處理。字符識別單元303作為字符信息存儲得到的字符代碼行,并且將存儲的字符信息與處理后的區(qū)域相關(guān)聯(lián)。區(qū)域位置和大小、區(qū)域?qū)傩孕畔?、頁信息和字符代碼信息(即從字符識別處理得到的字符信息),即由區(qū)域分割單元301、屬性信息添加單元302和字符識別單元303提取的各種信息和數(shù)據(jù)存儲在存儲單元211中。圖7示出了可以通過對圖6所示的輸入圖像數(shù)據(jù)進行的處理而獲得的存儲在存儲單元211中的信息的示例。盡管在圖6和圖7中沒有詳細描述,但是希望將屬性“表格字符”添加到表格中的字符圖像區(qū)域并進行字符識別處理,以存儲如圖7所示的信息。元數(shù)據(jù)處理單元304將元數(shù)據(jù)(即搜索對象所需的信息)與屬性信息添加單元302檢測到的附有注釋的對象(例如圖片、線圖或表格對象)相關(guān)聯(lián),并將相關(guān)聯(lián)的數(shù)據(jù)存儲在存儲單元211中。在本實施例中,將在對象的注釋中描述的字符串與包含類似于注釋的字符的字符(或字)的正文的一部分(例如語句)彼此相關(guān)聯(lián),作為可用于搜索對象的元數(shù)據(jù)。本實施例使用注釋標識符來確定用作元數(shù)據(jù)的字符串。注釋標識符可以用于將附有注釋的對象與注釋和正文字符信息相關(guān)聯(lián)??梢詮母鞣N標識符(例如用于標識各個對象的標識信息(ID)、表示注釋和正文字符信息的存儲位置的位置信息(例如表示記錄位置的地址和指針)以及參照信息(例如XMLPath或URL))中選擇注釋標識符。本實施例使用可以在下面的輸入一頁或依次輸入多頁的處理中標識各個附有注釋的對象的ID信息。例如,可以使用各個頁的序號。首先,元數(shù)據(jù)處理單元304進行生成由屬性信息添加單元302檢測到的附有注釋的對象的注釋標識符(即標識信息)的處理。然后,元數(shù)據(jù)處理單元304將生成的注釋標識符添加到該對象。接下來,元數(shù)據(jù)處理單元304從字符識別單元303輸出的注釋和正文字符信息中提取對應(yīng)于該對象的元數(shù)據(jù)字符串(指南、關(guān)鍵詞等)。元數(shù)據(jù)處理單元304進行將提取的元數(shù)據(jù)字符串與對應(yīng)的注釋標識符相關(guān)聯(lián)并將相關(guān)聯(lián)的數(shù)據(jù)存儲在存儲單元211中的處理。在這種情況下,元數(shù)據(jù)處理單元304分配唯一的ID來表達附有注釋的對象和元數(shù)據(jù)字符串之間的對應(yīng)關(guān)系。以這種方式,元數(shù)據(jù)處理單元304可以將附有注釋的對象(即由屬性信息添加單元302檢測到的對象)與其元數(shù)據(jù)相關(guān)聯(lián),并且可以將相關(guān)聯(lián)的信息存儲在存儲單元211中。格式轉(zhuǎn)換單元305進行基于輸入圖像數(shù)據(jù)300將通過區(qū)域分割單元301、屬性信息添加單元302、字符識別單元303和元數(shù)據(jù)處理單元304進行的上述連續(xù)處理得到的信息(例如區(qū)域位置和大小信息、頁信息、區(qū)域?qū)傩?、區(qū)域字符信息和元數(shù)據(jù))轉(zhuǎn)換為具有預定格式(PDF、SVG、XPS,OfficeOpenXML等)的電子文檔的處理。通過上述格式轉(zhuǎn)換生成的電子文檔包括基于圖形的頁顯示信息(例如要顯示的圖像)和基于字符或其它含義描述的內(nèi)容信息(例如元數(shù)據(jù))。圖5是示出格式轉(zhuǎn)換單元305的配置的示例的框圖。圖像過濾單元501可以對輸入圖像數(shù)據(jù)進行過濾處理(例如平坦化、平滑化、邊緣加強、顏色量化以及二值化)。矢量轉(zhuǎn)換處理單元502可以將圖像數(shù)據(jù)(例如對應(yīng)于添加了線圖屬性的區(qū)域的部分的圖像)轉(zhuǎn)換為矢量路徑描述圖形數(shù)據(jù)(即矢量數(shù)據(jù))。矢量轉(zhuǎn)換處理單元502可以使用用于將圖像數(shù)據(jù)轉(zhuǎn)換為矢量數(shù)據(jù)的傳統(tǒng)技術(shù)。圖像切割處理單元503可以將圖像數(shù)據(jù)(例如對應(yīng)于添加了圖片屬性的區(qū)域的部分的圖像)切割為圖像部分圖形數(shù)據(jù)(例如JEPG數(shù)據(jù))。電子文檔描述處理單元504可以生成按照預定格式描述的電子文檔,電子文檔包括由矢量轉(zhuǎn)換處理單元502和圖像切割處理單元503生成的圖形數(shù)據(jù)以及由字符識別單元303和元數(shù)據(jù)處理單元304獲得的含義描述(例如字符信息和元數(shù)據(jù))。格式轉(zhuǎn)換控制單元505可以基于存儲在圖2所示的存儲單元211中的區(qū)域信息(例如位置、大小和屬性)511、區(qū)域字符信息512和元數(shù)據(jù)513將圖像數(shù)據(jù)300的各個區(qū)域分配到處理單元501至503中的適當?shù)囊粋€。格式轉(zhuǎn)換控制單元505可以對格式轉(zhuǎn)換單元305進行整體控制,使得電子文檔描述處理單元504可以適當?shù)丶蓮母魈幚韱卧敵龅臄?shù)據(jù)。圖像過濾處理單元501是可以對圖像進行圖像過濾處理(例如平坦化、平滑化、邊緣加強、顏色量化和二值化)的處理單元。當矢量轉(zhuǎn)換處理單元502和圖像切割處理單元503進行上述處理時,圖像過濾處理單元501根據(jù)需要進行圖像處理。盡管沒有詳細描述,圖像過濾處理單元501可以進行適合要進行的矢量轉(zhuǎn)換處理的圖像處理,并且可以進行適合要進行的圖像切割處理的圖像處理。矢量轉(zhuǎn)換處理單元502使用矢量路徑描述數(shù)據(jù),將構(gòu)成圖像區(qū)域(線圖、表格規(guī)定線等)的目標像素的集合轉(zhuǎn)換為使用矢量路徑描繪函數(shù)的圖形描繪表達,更具體來說,轉(zhuǎn)換為矢量路徑描述數(shù)據(jù)。下面描述矢量轉(zhuǎn)換處理的示例。首先,將轉(zhuǎn)換目標圖像轉(zhuǎn)換為二值圖像數(shù)據(jù)。例如,在轉(zhuǎn)換目標圖像是灰度級圖像(grayscaleimage)的情況下,進行使用圖像過濾處理單元501將各個像素的亮度與預定閾值比較以獲得二值數(shù)據(jù)的處理。如果轉(zhuǎn)換目標圖像包括多個顏色,則可以將各顏色分量分離,并生成各個顏色的二值數(shù)據(jù)。接下來,對二值數(shù)據(jù)中相互連接的黑色像素的集合進行輪廓跟蹤處理,以獲取各個集合的輪廓坐標點組。隨后,將輪廓坐標點組適當?shù)胤指顬槎鄠€區(qū)間,并且用線性函數(shù)或曲線函數(shù)來近似各個區(qū)間。曲線函數(shù)例如是樣條(spline)曲線或貝濟埃(Bezier)曲線。最后,將數(shù)據(jù)轉(zhuǎn)換為定義起點、直線和曲線以及終點的矢量路徑描述。獲得矢量的方法不限于上述方法??梢允褂萌魏纹渌m當?shù)姆椒?。例如,代替使用上述近似輪廓的函?shù),可以使用通過對線圖的核心線施加函數(shù)近似來獲得矢量的方法。圖像切割處理單元503僅基于輸入圖像的目標區(qū)域的像素數(shù)據(jù)來生成該區(qū)域的各圖像部分數(shù)據(jù)。在執(zhí)行上述處理時,可以考慮各個區(qū)域的特征來適當?shù)馗淖兿袼財?shù)據(jù)類型和壓縮方法。例如,如果目標區(qū)域是伴隨有“線圖”或“字符”屬性的區(qū)域,則圖像過濾處理單元501針對各個顏色將圖像數(shù)據(jù)轉(zhuǎn)換為一個或多個二值圖像。然后,使用MMR或其它傳統(tǒng)上已知的二值壓縮方法處理轉(zhuǎn)換后的數(shù)據(jù),以生成添加了對應(yīng)于各個二值圖像的顏色信息的數(shù)據(jù)。另一方面,如果目標區(qū)域是伴隨有“圖片”屬性的區(qū)域,則對圖像數(shù)據(jù)進行適合自然圖像的JPEG或JPEG2000壓縮??梢钥紤]各個區(qū)域的屬性,任意地省略由矢量轉(zhuǎn)換處理單元502進行的矢量轉(zhuǎn)換和由圖像切割處理單元503進行的圖像壓縮中的一個。作為選擇,期望使矢量轉(zhuǎn)換處理單元502進行矢量轉(zhuǎn)換處理并使圖像切割處理單元503進行圖像壓縮處理。此外,在字符識別結(jié)果中字符區(qū)域(例如正文、標題或注釋)具有較高相似性的情況下,可以通過描述字符識別結(jié)果中包括的字符代碼、字符大小信息和字符位置信息來再現(xiàn)字符區(qū)域部分的圖形。電子文檔描述處理單元504生成按照預定格式描述的電子文檔,電子文檔包括由矢量轉(zhuǎn)換處理單元502和圖像切割處理單元503生成的圖形數(shù)據(jù)以及由字符識別單元303和元數(shù)據(jù)處理單元304獲得的含義描述(例如字符信息和元數(shù)據(jù))。圖11示出了生成的電子文檔數(shù)據(jù)310的示例。圖11所示的示例是基于圖7所示的通過處理圖6所示的圖像數(shù)據(jù)300獲得的并存儲在存儲單元211中的數(shù)據(jù),按照可縮放矢量圖形(SVG,ScalableVectorGraphics)格式描述的數(shù)據(jù)。圖11所示的詳細描述1101至1105是分別對應(yīng)于圖6所示的區(qū)域601至605的圖形描述。圖形描述1101、1104和1105是基于字符代碼的字符描繪描述的示例。圖形描述1102是進行矢量轉(zhuǎn)換后的矢量路徑描述的示例。圖形描述1103是用于粘貼切割處理后的圖片圖像的描述的示例。具有值“1”的注釋標識符1107(即captionid)被添加到伴隨有注釋的圖片對象1103。在圖11所示的示例中,坐標值Xl和Yl代表實際描述的數(shù)值。圖11示出了元數(shù)據(jù)描述1106的示例。元數(shù)據(jù)描述1106包括基于注釋604的字符串和正文的字符串而提取的作為字符串1109的描述“AAA”。字符串“AAA”與類似于注釋標識符1107的標識符1108相關(guān)聯(lián)。根據(jù)圖11所示的示例,從包括字“圖1”的正文部分,也就是從語句“…圖1是AAA?!敝刑崛∽址癆AA”,并且將所提取的字“AAA”描述為元數(shù)據(jù)1109。然而,元數(shù)據(jù)不限于字??梢蕴砑尤我庹Z句(例如包括字符串“圖1”的語句)作為元數(shù)據(jù)。此外,圖11所示的元數(shù)據(jù)包括從正文中提取的字符串。另外,可以添加從注釋的字符串中提取的字作為元數(shù)據(jù)。盡管基于符合SVG格式的數(shù)據(jù)描述了本實施例,但是輸出格式不限于SVG。例如,可以使用PDF、XPS、OfficeOpenXML和其它PDL數(shù)據(jù)格式用于上述轉(zhuǎn)換。下面描述由格式轉(zhuǎn)換控制單元505進行的轉(zhuǎn)換處理控制的示例。由格式轉(zhuǎn)換單元305對各個區(qū)域進行的轉(zhuǎn)換處理方法依據(jù)各個區(qū)域的屬性而變化。例如,格式轉(zhuǎn)換控制單元505優(yōu)選對作為由單色或少量顏色構(gòu)成的圖形圖像的字符和線圖施加矢量轉(zhuǎn)換處理。另一方面,格式轉(zhuǎn)換控制單元505不優(yōu)選對圖片或其它漸變(gradational)的圖像區(qū)域施加矢量轉(zhuǎn)換處理。以這種方式,為了使得格式轉(zhuǎn)換控制單元505能夠根據(jù)各個區(qū)域的屬性適當?shù)剡M行轉(zhuǎn)換處理,希望預先設(shè)置多個對應(yīng)關(guān)系表,如圖8A至圖8D所示。例如,根據(jù)圖8A所示的設(shè)置,格式轉(zhuǎn)換控制單元505對具有“字符”、“線圖”和“表格”屬性的各區(qū)域進行矢量轉(zhuǎn)換處理。此外,格式轉(zhuǎn)換控制單元505對附有“圖片”屬性的區(qū)域進行圖像切割處理。此外,圖8A至圖8D所示的對應(yīng)關(guān)系表包括從圖像數(shù)據(jù)300中刪除區(qū)域的像素信息的處理的執(zhí)行。例如,在根據(jù)圖8A所示的設(shè)置將附有“字符”屬性的區(qū)域轉(zhuǎn)換為矢量路徑描述數(shù)據(jù)的情況下,格式轉(zhuǎn)換控制單元505根據(jù)刪除處理指令,進行利用周邊顏色標出圖像數(shù)據(jù)300的對應(yīng)于由轉(zhuǎn)換后的矢量路徑覆蓋的部分的像素的處理。類似地,在將附有“圖片”屬性的區(qū)域切割為矩形圖像部分的情況下,格式轉(zhuǎn)換控制單元505進行利用周邊顏色標出圖像數(shù)據(jù)300的對應(yīng)于各個切割的區(qū)域的像素的處理。進行上述刪除處理的目的是在對各個區(qū)域的處理完成后(即標出處理完成后)使用圖像數(shù)據(jù)300作為“背景”的圖像部分數(shù)據(jù)。背景的圖像數(shù)據(jù)(即背景圖像)包括通過區(qū)域分割處理提取的區(qū)域以外的剩余部分(例如圖像數(shù)據(jù)300的對應(yīng)于背景的像素)。因此,在電子文檔數(shù)據(jù)的描述中,格式轉(zhuǎn)換控制單元505可以通過在背景圖像部分數(shù)據(jù)(即背景圖像)上疊加由矢量轉(zhuǎn)換處理單元502和圖像切割處理單元503獲得的圖形數(shù)據(jù)并顯示獲得的合成圖像,來構(gòu)成不丟失背景像素(背景顏色)的任何信息的無冗余圖形數(shù)據(jù)。圖8B示出了對應(yīng)關(guān)系表的另一示例。根據(jù)圖8B所示的設(shè)置,格式轉(zhuǎn)換控制單元505對附有“字符”屬性的區(qū)域進行二值圖像切割處理,還對圖像數(shù)據(jù)300進行像素刪除處理。另一方面,格式轉(zhuǎn)換控制單元505不對附有其余屬性的區(qū)域進行矢量化處理和圖像切割處理。更具體來說,處理目標中不包括的像素(例如伴隨有“圖片”、“線圖”和“表格”屬性的區(qū)域的像素信息)保留在背景圖像部分數(shù)據(jù)中。因此,格式轉(zhuǎn)換控制單元505在背景圖像上疊加“字符”圖像部分。格式轉(zhuǎn)換控制單元505可以基于在圖8C和圖8D所示的另一對應(yīng)關(guān)系表中定義的設(shè)置進行類似的處理,下面詳細說明。此外,格式轉(zhuǎn)換控制單元505可以根據(jù)要輸出的電子文檔數(shù)據(jù)的用途(即使用目的)或者根據(jù)各個文檔的內(nèi)容,選擇如圖8A至圖8D所示的預先準備的多個對應(yīng)關(guān)系表中最佳的一個。例如,從圖8A所示的對應(yīng)關(guān)系表定義的設(shè)置得到的輸出圖像數(shù)據(jù)包括其大部分被轉(zhuǎn)換為矢量路徑描述的對象。因此,輸出圖像可以在放大/縮小處理中保持良好的圖像質(zhì)量,并且可以優(yōu)選地為圖形編輯器再利用。此外,圖8B所示的對應(yīng)關(guān)系表中定義的設(shè)置的用處在于通過針對字符圖像的各個字符顏色生成各二值圖像并且對各個二值圖像進行無損壓縮,可作為高質(zhì)量圖像來再現(xiàn)各個字符圖像部分,并且通過對作為背景圖像的其余部分進行JPEG壓縮,數(shù)據(jù)大小壓縮率可以保持在較高的水平。因此,圖8B所示的對應(yīng)關(guān)系表中定義的設(shè)置可以優(yōu)選用于生成包括即使壓縮率很高時也容易讀取的字符的圖像的輸出圖像。接下來,參照圖4所示的流程圖描述根據(jù)本實施例的圖像處理系統(tǒng)執(zhí)行的整個處理的示例。圖2所示的數(shù)據(jù)處理單元218(即圖3所示的各個處理單元)可以執(zhí)行圖4所示的流程圖的處理。在本實施例中,CPU205從存儲單元211(即計算機可讀存儲介質(zhì))中讀取計算機程序,并執(zhí)行讀取的程序,以實現(xiàn)數(shù)據(jù)處理單元218(即圖3所示的各個處理單元)的功能。然而,本發(fā)明不限于上述配置。例如,可以由電子電路或其它相當?shù)挠布渲脕韺崿F(xiàn)數(shù)據(jù)處理單元218(即圖3所示的各個處理單元)。圖4是示出由根據(jù)本發(fā)明的圖像處理系統(tǒng)執(zhí)行的用于將圖1所示的MFP100輸入的包括多個頁面的圖像數(shù)據(jù)轉(zhuǎn)換為包括多個頁面的電子文檔數(shù)據(jù)的處理的示例過程的流程圖。例如,可以輸入圖9所示的頁面圖像901至904作為包括多個頁面的圖像數(shù)據(jù)。圖9示出了包括4頁的文檔圖像的示例。圖像901至904分別對應(yīng)于第一至第四頁。下面詳細描述圖4所示的流程圖的各個處理。在步驟S401,區(qū)域分割單元301從一頁的輸入圖像數(shù)據(jù)中提取切割的區(qū)域。例如,區(qū)域分割單元301從圖9所示的圖像數(shù)據(jù)901(即第一頁)中提取兩個區(qū)域905和906。在步驟S402,屬性信息添加單元302向在步驟S401中切割的各個區(qū)域添加屬性。根據(jù)圖9所示的第一頁的示例,屬性信息添加單元302向區(qū)域905添加屬性“圖片”,還向區(qū)域906添加屬性“注釋”。在這種情況下,添加到注釋906的信息包括表示“區(qū)域”905伴隨有區(qū)域906的信息。在步驟S403,字符識別單元303對在步驟S402中添加了字符屬性(例如正文、注釋、標題或副標題)的區(qū)域執(zhí)行字符識別處理。字符識別單元303作為字符信息與目標區(qū)域相關(guān)聯(lián)地存儲各個處理結(jié)果。根據(jù)圖9所示的第一頁的示例,字符識別單元303對添加了字符屬性“注釋”的區(qū)域906執(zhí)行字符識別處理,并將獲得的字符信息“圖1”與區(qū)域906相關(guān)聯(lián)。在步驟S404,數(shù)據(jù)處理單元218判斷是否對所有頁面完成了步驟S401至S403中的信息提取處理。如果判斷為對所有頁面完成了步驟S401至S403中的信息提取處理(步驟S404中的“是”),則處理前進到步驟S405。如果判斷為沒有對所有頁面完成步驟S401至S403中的信息提取處理(步驟S404中的“否”),則圖像處理系統(tǒng)重復上述步驟S401至S403中的處理。圖10示出了作為對圖9所示的圖像901至904進行的步驟S401至S404的處理結(jié)果而獲得的提取的區(qū)域位置/大小信息、頁信息、區(qū)域?qū)傩院蛥^(qū)域字符信息的示例。在圖10中,區(qū)域907至909是從第二頁至第四頁中提取的“正文”屬性區(qū)域。將提取的信息存儲在存儲單元211中。在步驟S405,元數(shù)據(jù)處理單元304進行元數(shù)據(jù)提取處理和元數(shù)據(jù)添加處理。下面參照圖12所示的流程圖詳細描述步驟S405中由元數(shù)據(jù)處理單元304執(zhí)行的處理。在圖12的步驟S1201,元數(shù)據(jù)處理單元304從存儲在存儲單元211中的區(qū)域信息中選擇還沒有經(jīng)過元數(shù)據(jù)處理的添加了“注釋”屬性的區(qū)域中的一個。更具體來說,如果判斷為存在未處理的注釋區(qū)域(步驟S1201中的“是”),則元數(shù)據(jù)處理單元304選擇未處理的注釋區(qū)域作為處理目標。然后,處理前進到步驟S1202。如果判斷為不存在任何注釋區(qū)域,或者判斷為已經(jīng)完成了對所有區(qū)域的處理(步驟S1201中的“否”),則元數(shù)據(jù)處理單元304終止該處理。在輸入圖9所示的圖像901至904的情況下,元數(shù)據(jù)處理單元304選擇注釋區(qū)域906。在步驟S1202,元數(shù)據(jù)處理單元304向伴隨有處理目標注釋的對象添加注釋標識符。元數(shù)據(jù)處理單元304還在存儲單元211中確保元數(shù)據(jù)存儲區(qū)域,作為添加的注釋標識符專用的存儲區(qū)域。在本實施例中,元數(shù)據(jù)處理單元304將注釋標識符#1分配給伴隨有注釋906的圖片對象905,并在存儲單元211中確保注釋標識符#1專用的元數(shù)據(jù)存儲區(qū)域。在步驟S1203,元數(shù)據(jù)處理單元304從代表注釋區(qū)域中的字符識別結(jié)果的字符信息中提取錨定字符串和元數(shù)據(jù)字符串。錨定字符串是標識原始文檔中伴隨有注釋的對象的字符信息。元數(shù)據(jù)字符串是解釋對象的字符信息。圖15示出了作為注釋區(qū)域中的錨定字符串和元數(shù)據(jù)字符串的示例的錨定字符串1501和1502以及元數(shù)據(jù)字符串1503和1504。如從圖15了解到的,對象伴隨有錨定字符串和元數(shù)據(jù)字符串中的一個或者二者。在許多情況下,錨定字符串的表達是特定字符串(例如“圖”)和數(shù)字(或符號)的組合。因此,希望預先準備登記了多個特定字符串的錨定字符串詞典。在這種情況下,可以基于注釋字符串和詞典之間的比較來指定錨定部分(即錨定字符串+數(shù)字(或符號))。此外,可以將注釋區(qū)域中錨定部分以外的字符串標識為元數(shù)據(jù)字符串。在步驟S1204,元數(shù)據(jù)處理單元304判斷是否存在在步驟S1203的處理中從注釋區(qū)域中提取的任何元數(shù)據(jù)字符串。如果判斷為提取了元數(shù)據(jù)字符串(步驟S1204中的“是”),則處理前進到步驟S1205。如果判斷為沒有提取元數(shù)據(jù)字符串(步驟S1204中的“否”),則處理前進到步驟S1206。在步驟S1205,元數(shù)據(jù)處理單元304將從注釋區(qū)域中提取的元數(shù)據(jù)字符串存儲到在步驟S1202中添加的注釋標識符存儲區(qū)域中。然后,處理前進到步驟S1206。更具體來說,元數(shù)據(jù)處理單元304將從注釋區(qū)域中提取的元數(shù)據(jù)字符串與注釋標識符相關(guān)聯(lián)。在步驟S1206,元數(shù)據(jù)處理單元304判斷是否存在在步驟S1203的處理中從注釋區(qū)域中提取的任何錨定字符串。如果判斷為提取了錨定字符串(步驟S1206中的“是”),則處理前進到步驟S1207。另一方面,如果判斷為沒有提取錨定字符串(步驟S1206中的“否”),則處理返回到步驟S1201。在步驟S1201,元數(shù)據(jù)處理單元304判斷是否還有剩余的未處理的注釋區(qū)域。根據(jù)圖9所示的輸入圖像數(shù)據(jù),可以從注釋906中提取“圖1”作為錨定字符串。然而,無法提取元數(shù)據(jù)字符串。因此,處理從步驟S1204前進到步驟S1206和S1207。在步驟S1207,元數(shù)據(jù)處理單元304從存儲在存儲單元211中的“正文”區(qū)域的字符信息中檢測與提取的錨定字符串類似的字符串表達。如果判斷為檢測到類似的字符串表達(步驟S1207中的“是”),則處理前進到步驟S1208。如果判斷為沒有任何類似的字符串表達(步驟S1207中的“否”),則處理返回到步驟S1201,以判斷是否存在剩余的未處理的注釋區(qū)域。在步驟S1208,元數(shù)據(jù)處理單元304在步驟S1207的處理中從正文檢測到的錨定字符串的周圍區(qū)域中提取與對象的元數(shù)據(jù)相對應(yīng)的字符串。根據(jù)圖9所示的輸入圖像數(shù)據(jù),可以從正文區(qū)域909中檢測到字符串910作為類似于錨定字符串“圖1”906的字符串。因此,如果對相鄰的字符串“圖1是AAA?!边M行詞素(morpheme)分析,則可以提取字“AAA”作為元數(shù)據(jù)字符串。為了識別元數(shù)據(jù)字符串,可以在自然語言處理的詞素分析中使用字切割功能。在本實施例中,提取單個字作為元數(shù)據(jù)字符串。然而,元數(shù)據(jù)字符串的提取不限于上述示例。例如,可以使用包括錨定字符串的整個語句作為元數(shù)據(jù)字符串。在步驟S1209中,元數(shù)據(jù)處理單元304將在步驟S1208中提取的元數(shù)據(jù)字符串添加(存儲)到注釋標識符存儲區(qū)域。然后,處理返回到S1207。元數(shù)據(jù)處理單元304在正文的另一部分中重復上述檢測錨定字符串的描述的處理,如果檢測到錨定字符串,則繼續(xù)存儲檢測到的各個字符串。因此,可以將兩個或更多個元數(shù)據(jù)與一個注釋標識符相關(guān)聯(lián)?;氐綀D4,在步驟S406,格式轉(zhuǎn)換單元305基于圖像數(shù)據(jù)300和存儲在存儲單元211中的圖10的信息進行從圖像數(shù)據(jù)到電子文檔數(shù)據(jù)310的轉(zhuǎn)換。如圖5中所描述的,格式轉(zhuǎn)換單元305在格式轉(zhuǎn)換控制單元505的控制下,根據(jù)描述要對各個區(qū)域施加的轉(zhuǎn)換處理方法的對應(yīng)關(guān)系表,對圖5所示的圖像數(shù)據(jù)300中的區(qū)域執(zhí)行轉(zhuǎn)換處理。在本實施例中,下面參照圖13所示的流程圖描述使用圖8C所示的對應(yīng)關(guān)系表控制轉(zhuǎn)換的處理的示例。在步驟S1301,格式轉(zhuǎn)換控制單元505將處理頁數(shù)計數(shù)器“η”初始化為1。在步驟S1302,格式轉(zhuǎn)換控制單元505從圖5所示的區(qū)域信息511中的第η頁的數(shù)據(jù)中選擇未處理的區(qū)域,作為處理目標區(qū)域。在步驟S1303,格式轉(zhuǎn)換控制單元505根據(jù)處理目標區(qū)域的屬性和對應(yīng)關(guān)系表對該處理進行分支。在本實施例中,格式轉(zhuǎn)換控制單元505參照圖8C所示的對應(yīng)關(guān)系表判斷所選擇的處理目標區(qū)域的屬性是否是“字符”。更具體來說,如果判斷為所選擇的處理目標區(qū)域的屬性是“字符”(例如“正文”、“注釋”、“頁面”或“標題”)(步驟S1303中的“是”),則處理前進到步驟S1304。如果判斷為所選擇的處理目標區(qū)域的屬性是“圖片”、“線圖”或“表格”(步驟S1303中的“否”),則處理前進到步驟S1306。在步驟S1304,圖像切割處理單元503根據(jù)在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置,生成與圖像數(shù)據(jù)300中的附有字符屬性的區(qū)域(即處理目標)相對應(yīng)的部分的二值圖像(即二值圖像部分)??梢岳绺鶕?jù)PNG格式壓縮生成的二值圖像部分,并且可以將其存儲在圖2所示的存儲單元211中。在本實施例中,字符顏色信息被添加到二值圖像部分中對應(yīng)于字符線的像素??梢愿鶕?jù)圖像數(shù)據(jù)300中的字符像素的顏色來獲取字符顏色信息。同時,分配給其它像素的顏色信息是透明顏色。在步驟S1305,因為圖8C所示的對應(yīng)關(guān)系表中對字符區(qū)域設(shè)置了刪除處理指令,所以格式轉(zhuǎn)換控制單元505利用周邊像素的顏色進行標出圖5所示的圖像數(shù)據(jù)300中對應(yīng)于字符部分的像素的刪除處理。在步驟S1306,格式轉(zhuǎn)換控制單元505判斷是否存在附加到處理目標區(qū)域的注釋標識符。如果判斷為存在附加到處理目標區(qū)域的注釋標識符(步驟S1306中的“是”),則處理前進到步驟S1307。如果判斷為沒有注釋標識符附加到處理目標區(qū)域(步驟S1306中的“否”),則處理前進到步驟S1308。在步驟S1307,格式轉(zhuǎn)換控制單元505根據(jù)在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置,使矢量轉(zhuǎn)換處理單元502生成圍繞處理目標區(qū)域的框的矢量路徑描述數(shù)據(jù)??梢岳缁谠趫D5所示的區(qū)域信息511中登記的代表左上角的坐標值和大小(寬度和高度),利用定義處理目標區(qū)域的四條線,來描述圍繞處理目標區(qū)域的框的矢量路徑描述數(shù)據(jù)。在本實施例中,格式轉(zhuǎn)換控制單元505描述比處理目標區(qū)域的外接矩形稍大的矩形框。圍繞處理目標區(qū)域的框不限于矩形框。可以用具有圓角的框代替該框??蚓€可以加粗??梢匀我庑薷目虻男螤?。描述框形狀的另一方法包括從圖像數(shù)據(jù)300中的區(qū)域圖像中提取邊緣信息的輪廓(例如對象圖像的輪廓),并且使用矢量轉(zhuǎn)換處理單元502將提取的輪廓信息轉(zhuǎn)換為框的矢量路徑信息。此外,在步驟S1307,格式轉(zhuǎn)換控制單元505向生成的框的矢量路徑描述數(shù)據(jù)添加處理目標區(qū)域的注釋標識符。此外,格式轉(zhuǎn)換控制單元505分配透明顏色,作為用于框的矢量路徑描述數(shù)據(jù)的描繪顏色??梢詫⒁赃@種方式生成的矢量路徑描述數(shù)據(jù)存儲在圖2所示的存儲單元211中。在步驟S1308,格式轉(zhuǎn)換單元305判斷第η頁中是否存在未處理的區(qū)域。如果判斷為第η頁中存在未處理的區(qū)域(步驟S1308中的“是”),則處理返回到步驟S1302,重復上述步驟S1302至S1308的處理。如果判斷為完成了對第η頁中所有區(qū)域的處理(步驟S1308中的“否”),則處理前進到步驟S1309。在步驟S1309,格式轉(zhuǎn)換控制單元505通過利用周邊顏色標出圖5所示的圖像數(shù)據(jù)300中對應(yīng)于由圖像切割處理單元503切割出的區(qū)域的部分,來生成背景圖像部分。因為通過利用周邊顏色標出字符像素的處理刪除了構(gòu)成字符部分的像素,所以背景圖像部分不包括構(gòu)成在步驟S1305中從圖像數(shù)據(jù)300作為圖像部分切割出的字符部分的任何像素(例如對應(yīng)于字符線的像素)。另一方面,不伴隨字符屬性的區(qū)域仍未處理。在本實施例中,格式轉(zhuǎn)換控制單元505將背景圖像部分的分辨率減小到一半的水平,并根據(jù)JPEG壓縮方法將背景圖像部分壓縮成圖像數(shù)據(jù)??梢詫嚎s圖像數(shù)據(jù)存儲在圖2所示的存儲單元211中。然而,格式轉(zhuǎn)換控制單元505可以進行其它圖像處理(例如平滑處理),并根據(jù)另一格式壓縮處理后的數(shù)據(jù)。圖16示出了在對圖9所示的第一頁的圖像901進行上述步驟S1302至S1309的處理時可以生成的圖像部分和矢量路徑描述數(shù)據(jù)的示例。圖16所示的示例圖像1601包括在步驟S1309中生成的背景圖像部分。因為通過標出處理利用周邊顏色刪除了字符圖像部分,所以背景圖像部分圖像1601不包括任何字符圖像部分。在這方面,背景圖像部分圖像1601是包括作為該頁中的字符而提取的部分以外的所有部分的一個圖像。圖16所示的示例圖像1602包括在步驟S1304中生成的字符部分的二值圖像部分。在再現(xiàn)字符部分的二值圖像部分時,可以根據(jù)分開存儲的字符顏色信息,由字符顏色的像素構(gòu)成字符線部分,并且可以由透明顏色的像素構(gòu)成其余白色部分。盡管可以在圍繞字符部分的最小化的矩形區(qū)中定義實際圖像部分,但是表示圖像1602的外框的實線是為了方便。圖16所示的示例圖像1603包括在步驟S1307中生成的框的矢量路徑描述數(shù)據(jù)。盡管使用虛線來表示框的矢量路徑描述,但是因為矢量路徑描述使用透明顏色,所以實際的矢量路徑描述是不可見的。此外,表示圖像1603的外框的實線是為了方便,其不作為數(shù)據(jù)而存在。在步驟S1310,格式轉(zhuǎn)換控制單元505使電子文檔描述處理單元504根據(jù)要輸出的電子文檔數(shù)據(jù)的格式進行描述當前處理的頁來作為電子文檔頁的處理。圖17示出了根據(jù)本實施例的基于圖9所示的第一頁的圖像901可描述的電子文檔頁的示例。圖17所示的電子文檔頁1700是根據(jù)可縮放矢量圖形(SVG)格式描述的示例。電子文檔頁1700包括在步驟S1309中生成的背景圖像數(shù)據(jù)的描述1701、在步驟S1304中生成的字符部分的二值圖像部分描述1702和在步驟S1307中生成的框的矢量路徑描述1703(盡管框是用透明顏色描繪的)。在矢量路徑描述1703中,描述stroke=“transparent”表示框是用透明顏色描繪的線。更具體來說,描述d=“M440,608L2040,608L2040,1880L440,1880L440,608s”表示具有矢量路徑描述形狀的圖形是用透明顏色描繪的。如上所述,矢量路徑描述不限于矩形框的形狀??梢允褂萌我庑螤钣糜谑噶柯窂矫枋觯灰蕾囉谀繕藢ο蟮脑夹螤罨蛘邎D形描述中的配置。圖形描繪描述1701至1703分別對應(yīng)于圖16所示的圖像1601至1603。描述1701至1703定義了疊加的圖形數(shù)據(jù)的順序。更具體來說,作為最下層來描繪背景圖像。作為疊加在背景圖像上的中間層來描繪字符圖像。作為疊加在字符圖像上的上層來描繪透明框。透明矢量路徑描述(即圖形描述)1703包括注釋標識符1704。在步驟S1311,格式轉(zhuǎn)換控制單元505判斷當前處理的頁的頁號“η”是否是最后的頁號(即所有頁的總數(shù))。如果判斷為當前處理的頁的頁號“η”等于最后的頁號(步驟S1311中的“是”),則格式轉(zhuǎn)換控制單元505確定完成了對所有頁的轉(zhuǎn)換處理。處理前進到步驟S1313。如果判斷為當前處理的頁的頁號“η”小于所有頁的總數(shù)(步驟S1311中的“否”),則處理前進到步驟S1312。在步驟S1312,格式轉(zhuǎn)換控制單元505將頁號“η”加1(即η=η+1)。然后,處理返回到步驟S1302,針對下一頁重復上述處理。在步驟S1313,電子文檔描述處理單元504集合在步驟S1310中描述的所有電子文檔頁并添加元數(shù)據(jù)描述,以生成要輸出的電子文檔數(shù)據(jù)。圖18示出了要輸出的電子文檔的示例描述。電子文檔數(shù)據(jù)1800包括分別對應(yīng)于第一至第四頁的電子文檔頁面描述1801、1802、1803和1804。電子文檔數(shù)據(jù)1800還包括元數(shù)據(jù)描述1805。元數(shù)據(jù)描述1805包括與注釋標識符1807相關(guān)聯(lián)地描述的元數(shù)據(jù)字符串1806。注釋標識符1807與添加到第一頁的矢量路徑描述1809的注釋標識符1808相同。如上所述,元數(shù)據(jù)1806和透明框矢量路徑描述1809與注釋標識符1807彼此關(guān)聯(lián)(鏈接)。因此,如果通過輸入關(guān)鍵詞“AAA.”進行搜索處理,則可以找到透明框矢量路徑描述1809。上述實施例涉及根據(jù)本發(fā)明第一實施例的電子文檔數(shù)據(jù)生成處理。接下來,參照圖14描述在將上述元數(shù)據(jù)指定為進行搜索的關(guān)鍵詞時,從在上述第一實施例中生成的電子文檔數(shù)據(jù)中搜索對象的示例操作。圖14A至圖14D示出了由圖1所示的客戶PC101或其它客戶PC執(zhí)行的可用于搜索對象的應(yīng)用軟件提供的顯示畫面(⑶I)的示例。例如,AdobeReader是要生成的文檔的格式是PDF時可使用的應(yīng)用軟件。圖14A是應(yīng)用程序基于圖11所示的文檔顯示的示例畫面。輸入窗口1401使得用戶能夠輸入(指定)要搜索的字或短語。搜索執(zhí)行按鈕1402使得用戶能夠在輸入要搜索的字(或短語)之后指示執(zhí)行搜索。顯示圖像1403是根據(jù)圖11所示的電子文檔數(shù)據(jù)1100得到的示例。顯示內(nèi)容基于圖形描述1101至1105。圖14所示的應(yīng)用程序具有強調(diào)顯示功能,該功能用于在輸入窗口1401中作為要搜索的字(或短語)輸入的字符串與添加到當前顯示的電子文檔數(shù)據(jù)的元數(shù)據(jù)一致的情況下,強調(diào)包括與該元數(shù)據(jù)相關(guān)聯(lián)的注釋標識符的圖形描述。圖14B示出了基于指定為要搜索的字的“AAA”1404執(zhí)行的搜索的結(jié)果。在電子文檔數(shù)據(jù)1100中,元數(shù)據(jù)描述1106中的字符串1109和字符描繪描述1105中的字符串“AAA”與要搜索的字一致。因此,應(yīng)用程序進行在命中搜索的字時要進行的操作??梢愿鶕?jù)來自用戶的指令依次顯示搜索結(jié)果。當命中元數(shù)據(jù)描述1106中的字符串1109時,進行根據(jù)本實施例的示例操作。圖14所示的應(yīng)用程序從電子文檔1100中檢測到與要搜索的字(或短語)一致的元數(shù)據(jù)的注釋標識符1108。圖14所示的應(yīng)用程序進一步檢測到附加了相同的標識符1107的圖形描述1103。然后,圖14所示的應(yīng)用程序描繪目標圖形描述,使得可以在頁面顯示中強調(diào)對應(yīng)的部分。在本實施例中,圖形描述是圖像的粘貼。因此,圖14所示的應(yīng)用程序進行的顯示包括添加圍繞圖像對象的強調(diào)顏色(例如紅色)的框。圖14B所示的紅色框1405是表示作為執(zhí)行的搜索的結(jié)果而命中的對象的強調(diào)部分。強調(diào)顯示方法不限于上述示例。還可以使用其它框顏色??梢詫φ麄€區(qū)域加色。可以修改顏色??梢詫㈩伾崔D(zhuǎn)。此外,在命中的對象的描述不限于圖像的粘貼,而是還包括矢量路徑的情況下,可以使用不同于普通顏色的顏色或粗線來描繪矢量路徑。圖14C示出了通過基于圖8C所示的對應(yīng)關(guān)系表來進行圖13所示的流程圖的處理,而可以從圖9所示的四頁圖像轉(zhuǎn)換的圖18所示的電子文檔數(shù)據(jù)1800的第一頁。顯示內(nèi)容是第一頁的圖形描述1801的描繪結(jié)果,其相當于通過在圖16所示的背景部分圖像1601上疊加字符圖像1602可獲得的合成圖像??驁D像1603的矢量路徑描述包括透明顏色的指定。因此,框在普通狀態(tài)下是不可見的。圖14D示出了對圖14C所示的電子文檔數(shù)據(jù)1800執(zhí)行的搜索的結(jié)果。在輸入窗口1414中輸入要搜索的字“AAA”。在電子文檔數(shù)據(jù)1800中,元數(shù)據(jù)描述1805中的字符串“AAA”與要搜索的字一致。因此,應(yīng)用程序進行在命中搜索的字時進行的操作。更具體來說,與上述描述類似,應(yīng)用程序檢測到具有與元數(shù)據(jù)的注釋標識符1807相同的附加值的圖形描述。然后,應(yīng)用程序在頁面顯示中對命中部分進行強調(diào)顯示。在這種情況下,強調(diào)的目標是添加了注釋標識符1808的透明框矢量路徑描述1809。代替使用預先指定的透明顏色,應(yīng)用程序利用強調(diào)顏色(例如紅色)描繪對應(yīng)于矢量路徑描述1809的框。因此,作為疊加在背景圖像上的可視狀態(tài)的強調(diào)框,來顯示與通過搜索而命中的元數(shù)據(jù)對應(yīng)的變?yōu)榧t色的圖形描述1415。因此,用戶可以識別背景圖像中對應(yīng)于搜索命中部分的圖片部分。如上所述,當基于在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置,將文檔圖像轉(zhuǎn)換為電子文檔數(shù)據(jù)時,通過步驟S401至S405的處理,可以從提取自文檔圖像的區(qū)域?qū)ο笾斜舜讼嚓P(guān)聯(lián)地提取附有注釋的對象和搜索使用的元數(shù)據(jù)。此外,關(guān)于字符以外的對象,根據(jù)在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置,這些對象包括在背景圖像中。因此,通過步驟S406的處理(見圖13),代替要搜索的對象,通過基于透明顏色的矢量路徑描繪描述來添加在搜索中要強調(diào)的形狀。當用戶通過應(yīng)用程序瀏覽并搜索電子文檔數(shù)據(jù)時,基于透明顏色的矢量路徑描述是不可見的,因此直接顯示該頁的背景圖像。另一方面,如果在搜索中命中元數(shù)據(jù),則應(yīng)用程序利用強調(diào)顏色顯示透明顏色矢量路徑描述。在矢量路徑描述中可以指定任意的形狀,而不依賴于目標對象的原始形狀或圖形描述中的配置。因此,可以使用反映用戶在電子文檔數(shù)據(jù)的生成中的意圖的任意形狀進行強調(diào)顯示。例如,通過描述稍大于目標對象的外接矩形的矩形框,可以在搜索中用框包圍對應(yīng)于目標對象的部分。因此,用戶可以容易地識別目標對象。例如,如果在矢量路徑描述中指定具有圓角的框,則在搜索的顯示中可以用圓框來強調(diào)對應(yīng)于目標對象的部分。更具體來說,在生成使得用戶能夠指定字符以外的對象以進行關(guān)鍵詞搜索的電子文檔數(shù)據(jù)的處理中,本實施例可以生成用戶容易在搜索中識別的、而不依賴于搜索目標對象的形狀或數(shù)據(jù)狀態(tài)的適合強調(diào)表示的電子文檔數(shù)據(jù)。此外,即使在背景圖像中包括字符以外的對象的狀態(tài)下,根據(jù)上述實施例而實現(xiàn)的顯示可以帶來使用戶感覺好像在搜索中已經(jīng)命中目標對象的效果。在這種情況下,不必壓縮字符以外的各對象??梢詼p小數(shù)據(jù)量。在上述第一實施例中,根據(jù)圖8C所示的對應(yīng)關(guān)系表,在背景圖像中包括字符以外的所有對象(例如圖片、線圖和表格)。針對添加了注釋標識符的對應(yīng)對象生成透明矢量路徑描述。第二實施例與上述第一實施例的不同之處在于,在背景圖像中不包括伴隨有特定屬性的對象,并且作為部分來描述伴隨有特定屬性的對象。也就是說,第二實施例不將字符以外的所有對象合并到背景圖像中。此外,在第二實施例中,單獨生成用于強調(diào)顯示的透明矢量路徑描述。在第二實施例中,圖3所示的格式轉(zhuǎn)換單元305基于圖8D所示的對應(yīng)關(guān)系表進行如下控制處理。根據(jù)在圖8D所示的對應(yīng)關(guān)系表中定義的設(shè)置,格式轉(zhuǎn)換單元305進行圖像切割處理,以生成“圖片”對象的圖像部分描述。格式轉(zhuǎn)換單元305通過執(zhí)行矢量轉(zhuǎn)換,進一步生成“線圖”和“表格”對象的矢量路徑描述。另外,如果向?qū)ο筇砑恿俗⑨寴俗R符,則格式轉(zhuǎn)換單元305單獨添加透明框矢量路徑描述。因此,根據(jù)在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置,格式轉(zhuǎn)換單元305向各“圖片”對象的圖形描述添加注釋標識符,并向各“線圖”和“表格”對象的透明框描述添加注釋標識符。如果對經(jīng)過上述轉(zhuǎn)換的電子文檔數(shù)據(jù)進行搜索,則在各個矩形“圖片”區(qū)域中強調(diào)代表圖形描述本身的切割區(qū)的矩形區(qū)域,并且針對“線圖”和“表格”對象強調(diào)被描述為透明框的形狀。因此,可以使用由添加的透明矢量路徑描述定義的預定形狀來實現(xiàn)強調(diào)顯示,而不依賴于“線圖”或“表格”的形狀。這帶來了實現(xiàn)使得用戶能夠容易地識別在搜索中命中的部分的顯示的效果。此外,可以根據(jù)屬性來設(shè)置使用透明矢量路徑描述的對象的類型。此外,使得用戶能夠適當?shù)剡x擇針對基于從電子文檔數(shù)據(jù)切割搜索目標(“圖片”、“線圖”、“表格”等)的圖像部分描述以及向描述添加注釋標識符的最佳方法是有用的。例如,在要生成的電子文檔數(shù)據(jù)的數(shù)據(jù)大小優(yōu)先,并請求實現(xiàn)對象搜索的情況下,希望將“圖片”對象合并到“背景”中,并進行透明框描述以添加注釋標識符,如圖8C所示。這帶來了使用戶感到好像搜索到了圖像中的對象的效果??梢蕴岣邎D像數(shù)據(jù)的壓縮率。可以減小數(shù)據(jù)大小。此外,在另一文檔中再利用“圖片”和“線圖”對象的情況下,格式轉(zhuǎn)換單元305切割“圖片”圖像部分并增加圖像分辨率,如圖8A所示。格式轉(zhuǎn)換單元305還基于對“線圖”的矢量轉(zhuǎn)換進行矢量路徑描述,并向各個對象直接添加注釋標識符。此外,格式轉(zhuǎn)換單元305可以根據(jù)各個“圖片”對象的類型,進行更精確的轉(zhuǎn)換處理,如圖8D所示。在這種情況下,格式轉(zhuǎn)換單元305可以將搜索到的部分的信息復制到其它文檔,以再利用獲取的圖像信息,而不是無用地丟棄它。如上所述,格式轉(zhuǎn)換單元305適當?shù)剡x擇基于圖像切割的圖像部分描述方法,并適當?shù)剡x擇注釋標識符添加方法。因此,格式轉(zhuǎn)換單元305可以根據(jù)使用目的來生成電子文檔數(shù)據(jù)。因此,本實施例可以帶來提供用戶可容易地處理的電子文檔數(shù)據(jù)的效果。在本實施例中,代替允許用戶選擇喜好的方法,可以根據(jù)文檔中或者頁面中的“圖片”對象的數(shù)量,或者根據(jù)各個對象的大小或特征,自動選擇基于圖像切割的圖像部分描述方法和注釋標識符添加方法。此外,在這種情況下,可以針對各個文檔或各個頁面,自動選擇基于圖像切割的圖像部分描述方法和注釋標識符添加方法。下面,參照圖19所示的流程圖描述在處理電子文檔數(shù)據(jù)的“文檔大小優(yōu)先”模式和“可再利用性優(yōu)先”模式之間進行切換的示例方法,可以由數(shù)據(jù)處理單元218根據(jù)在圖8D所示的對應(yīng)關(guān)系表中定義的設(shè)置執(zhí)行該方法。在本實施例中,用相同的步驟編號表示與第一實施例中描述的步驟(見圖13)類似的步驟,并且不再重復這些步驟的詳細描述。在步驟S1901,數(shù)據(jù)處理單元218判斷是否選擇了“文件大小優(yōu)先”模式。圖20示出了使得用戶能夠輸入用于生成設(shè)置在圖1所示的MFP100中的圖2所示的操作單元203上顯示的電子文檔數(shù)據(jù)的意圖的用戶接口(UI)畫面的示例。圖20所示的UI畫面2001包括可被按下以減小電子文檔數(shù)據(jù)的文件大小的文件大小優(yōu)先按鈕2002和可被按下以使其它文檔再利用“圖片”和“線圖”對象的可再利用性優(yōu)先按鈕2003。UI畫面2001還包括可被按下以取消所選內(nèi)容的取消按鈕2004和可被按下以確定所選內(nèi)容的確定按鈕2005。在本實施例中,可以根據(jù)用戶在UI畫面2001上的操作來切換使用電子文檔數(shù)據(jù)的目的。然而,該系統(tǒng)可被配置成根據(jù)文檔中或頁面中的“圖片”對象或“線圖”對象的數(shù)量,或者根據(jù)頁面大小或數(shù)量,自動切換模式。如果判斷為所選模式是“文件大小優(yōu)先”模式(步驟S1901中的“是”),則處理前進到步驟S1902。在步驟S1902,數(shù)據(jù)處理單元218進行與圖13所示的流程圖中描述的處理類似的處理,以生成電子文檔數(shù)據(jù)。另一方面,如果判斷為所選模式是“可再利用性優(yōu)先”模式(步驟S1901中的“否”),則處理前進到圖19所示的步驟S1301,數(shù)據(jù)處理單元218根據(jù)在圖8D所示的對應(yīng)關(guān)系表中定義的設(shè)置進行處理。在圖19的步驟S1301至S1305中進行的處理與參照圖13所示的流程圖描述的處理類似。因此,不再重復這些步驟的詳細描述。如果判斷為所選的處理目標區(qū)域的屬性是“圖片”、“線圖”或“表格”(圖19中步驟S1303中的“否”),則在步驟S1903中,圖5所示的圖像切割處理單元503和矢量轉(zhuǎn)換處理單元502根據(jù)在圖8D所示的對應(yīng)關(guān)系表中定義的設(shè)置進行圖形描述。更具體來說,圖像切割處理單元503和矢量轉(zhuǎn)換處理單元502合作生成“圖片”對象的基于圖像切割的圖像部分描述,并生成“線圖”和“表格”對象的基于矢量轉(zhuǎn)換的矢量路徑描述。隨后,在步驟S1904中,圖5所示的格式轉(zhuǎn)換控制單元505根據(jù)圖8D所示的刪除處理指令,進行利用周邊像素的顏色標出對應(yīng)于圖像數(shù)據(jù)300上的“圖片”、“線圖”和“表格”對象的像素信息的刪除處理。在步驟S1306中,格式轉(zhuǎn)換控制單元505判斷是否存在附加到處理目標區(qū)域的注釋標識符。如果判斷為存在附加到處理目標區(qū)域的注釋標識符(步驟S1306中的“是”),則處理前進到步驟S1905。如果判斷為沒有注釋標識符附加到處理目標區(qū)域(步驟S1306中的“否”),則處理前進到步驟S1308。在步驟S1905,格式轉(zhuǎn)換控制單元505判斷所選的處理目標區(qū)域的屬性是否是“圖片”。如果判斷為所選的處理目標區(qū)域的屬性是“圖片”(步驟S1905中的“是”),則處理前進到步驟S1308,進行向區(qū)域?qū)ο蟊旧硖砑幼⑨寴俗R符的處理。另一方面,如果判斷為所選的處理對象區(qū)域的屬性是“線圖”或“表格”(步驟S1905中的“否”),則處理前進到步驟S1307,進行生成對應(yīng)于目標對象的透明矢量路徑描述的處理。在圖19的步驟S1307至S1313中進行的處理類似于參照圖13所示的流程圖描述的處理。因此,不再重復這些步驟的詳細描述。如上所述,第二實施例可以根據(jù)使用目的生成適當描述的電子文檔。此外,第二實施例使用透明矢量路徑描述來生成用戶在搜索中容易識別,而不依賴于搜索目標對象的形狀或數(shù)據(jù)狀態(tài)的適合強調(diào)表示的電子文檔數(shù)據(jù)。上述第一實施例描述了基于對象區(qū)域的位置/大小或者通過對對象施加的圖像處理可獲得的信息(例如邊緣信息)在對象區(qū)域中描繪的透明框。本發(fā)明的第三實施例提供一種使得用戶能夠自由設(shè)置要描繪的透明框的形狀和線寬度的系統(tǒng)。圖21示出了可以在設(shè)置在MFP100中的操作單元203上顯示的用戶接口(UI)畫面的示例。UI畫面2101包括可被操作以選擇透明框的基本形狀的按鈕2102、可被操作以選擇線寬度的按鈕2103以及可被操作以選擇強調(diào)顏色的按鈕2104。如果用戶通過操作UI畫面2101的選擇按鈕2102至2104選擇了透明框的描述方法,然后按下確定按鈕2106,則設(shè)置在數(shù)據(jù)處理單元218中的控制單元(未示出)將與用戶經(jīng)由UI畫面2101指定的透明框描述有關(guān)的信息發(fā)送到格式轉(zhuǎn)換單元305。如果按下了取消按鈕2105以取消用戶設(shè)置,則控制單元將默認設(shè)置信息發(fā)送到格式轉(zhuǎn)換單元305。在步驟S1307中,格式轉(zhuǎn)換單元305基于接收到的信息進行透明框的矢量描述。在這種情況下,為了確保識別對象,希望根據(jù)對象的大小來改變所選的基本形狀的大小。對透明框描述的設(shè)置不限于上述設(shè)置。例如,設(shè)置可以定義大小和線型(例如實線、虛線和雙線)。此外,如果顯示單元116是觸摸面板類型的,則可以將用戶在顯示單元116上描繪的形狀轉(zhuǎn)換為矢量路徑描述數(shù)據(jù),從而可以描述具有任意形狀的透明框。在上述第一實施例中,元數(shù)據(jù)處理單元304從字符識別單元303輸出的注釋和正文的字符信息中提取對應(yīng)于對象指南或關(guān)鍵詞的元數(shù)據(jù)字符串作為與對象區(qū)域相關(guān)的元數(shù)據(jù)的示例,。然而,元數(shù)據(jù)提取方法不限于上述方法。例如,元數(shù)據(jù)處理單元304可以提取根據(jù)對象區(qū)域的圖像識別結(jié)果獲得的與對象區(qū)域相關(guān)的元數(shù)據(jù)。在本公開的背景下,“圖像識另IJ”是指圖像識別技術(shù),例如傳統(tǒng)上已知的“面部識別”和“人名識別”。例如,在經(jīng)過圖像識別的對象區(qū)域是人的圖片的情況下,元數(shù)據(jù)處理單元304可以提取人名作為與對象區(qū)域相關(guān)的元數(shù)據(jù)。作為普通圖像識別方法的示例,圖22示出了用于識別上述圖片中的人的面部識別方法的示例。在本實施例中,可以使用圖22所示的配置,基于面部識別技術(shù)來提取人名作為元數(shù)據(jù)。以下處理是由CPU205實現(xiàn)的計算處理。在這種情況下,當如上面在第一實施例中所描述的,從圖片圖像中獲得圖像信息2201時,圖像輸入單元2202改變輸入圖像的大小和分辨率,使得面部識別引擎2203和人臉標識引擎2205可以處理輸入圖像。圖像輸入單元2202將處理后的圖像發(fā)送到面部識別引擎2203。面部識別引擎2203參照面部識別詞典2204進行識別面部區(qū)域的處理。可以預先準備面部識別詞典2204,并將其存儲在圖2所示的ROM210或存儲單元211中。此外,如果需要,可以將面部識別詞典2204復制到RAM206,使得CPU205可以快速訪問面部識別詞典2204。為了準備面部識別詞典2204,希望收集包括人臉的多個圖像,并且使學習機(例如支持矢量機(SupportVectorMachine))例如根據(jù)反向傳播方法(BackPropagationmethod)進行監(jiān)督學習,以獲得正確的面部區(qū)域確定信息作為監(jiān)控信息。如果圖2所示的CPU205判斷為存在面部區(qū)域,則面部識別引擎2203生成代表圖像中面部區(qū)域的左上點和右下點的坐標值作為面部區(qū)域信息。如果判斷為存在多個面部區(qū)域,則面部識別引擎2203相應(yīng)地生成多個面部區(qū)域信息。然后,面部識別引擎2203將面部區(qū)域信息與從圖像輸入單元2202接收到的輸入圖像一起發(fā)送到人臉標識引擎2205。人臉標識引擎2205參照預先準備的人臉標識詞典2206,進行識別人的機器學習處理??梢酝ㄟ^從要識別的面部的圖像信息中提取面部特征量信息(例如相對于整個面部區(qū)域的眼睛和鼻子距離),并將要識別的面部與人名相關(guān)聯(lián)作為監(jiān)控信息,來獲得人臉標識詞典2206。人臉標識引擎2205使圖2所示的CPU205從圖像輸入單元2202生成的圖像中剪切由面部識別引擎2203指示的面部區(qū)域。人臉標識引擎2205提取面部特征量作為面部圖像。然后,如果人臉標識詞典2206存儲了擁有類似的面部特征量的候選對象,則人臉標識引擎2205輸出擁有類似的面部特征量的面部的人名。如果存在從面部識別引擎2203生成的多個面部區(qū)域,則人臉標識引擎2205對各個面部區(qū)域進行上述處理。面部識別引擎2203將面部的人名與面部區(qū)域信息相關(guān)聯(lián),并輸出人名(即個人標識信息)2207。可以預先準備人臉標識詞典2206,并將其存儲在圖2所示的存儲單元211中。此夕卜,如果需要,可以將人臉標識詞典2206復制到RAM206,使得CPU205可以快速地訪問人臉標識詞典2206。如上所述,可以使用面部識別技術(shù)來獲得圖片中的面部區(qū)域和面部的人名信息。圖23示出了根據(jù)本實施例的包括能夠?qū)崿F(xiàn)圖22所示的面部識別的圖像識別單元的示例配置。圖23所示的框圖與圖3所示的框圖類似。在圖23中,用相同的附圖標記表示與圖3所示類似的功能單元,并且不再重復對它們的描述。在圖23中,圖像識別單元2301可以實現(xiàn)圖22所示的面部識別。因此,圖像識別單元2301帶來了使得該系統(tǒng)能夠使用圖片中的人的信息作為元數(shù)據(jù)的效果。特別地,不僅可以將透明框應(yīng)用于整個圖像(例如圖片),還可以將其應(yīng)用于圖像中的人的部分。此外,可以描述具有適合面部輪廓的任意形狀的透明框。因此,可以將元數(shù)據(jù)添加到圖片中的有限區(qū)域,如面部區(qū)域。如上面在第一實施例中所描述的,在許多情況下,將圖片部分作為一個圖像來處理。因此,如果將透明框應(yīng)用于圖像中的人的面部部分,并且添加對應(yīng)的人名作為元數(shù)據(jù),則可以基于人名檢測包括同一人的其它圖片。并且,可以指示其它圖片中的人的面部區(qū)域。圖24示出了通過執(zhí)行上述搜索可獲得的結(jié)果的示例。如圖24所示,在與圖14D所示的部分類似的輸入部分1413中指定要搜索的字“BBB”。在這種情況下,如果將作為元數(shù)據(jù)的字符串“BBB”(更具體來說是在面部識別中獲得的人名)添加到圖片2401中的面部區(qū)域部分2402中,則以與參照圖14D描述的方式相同的方式,要搜索的字與其一致。因此,應(yīng)用程序進行在命中搜索的詞時進行的操作。更具體來說,與上述描述類似,應(yīng)用程序檢測到具有與一致的元數(shù)據(jù)的注釋標識符相同的附加值的圖形描述。然后,應(yīng)用程序在頁面顯示中對命中部分進行強調(diào)顯示。在這種情況下,要強調(diào)的目標是添加了注釋標識符1808的透明框矢量路徑描述(即沿著面部區(qū)域2402的外圍的描述)。代替使用預先指定的透明顏色,應(yīng)用程序利用強調(diào)顏色(例如紅色)來描繪該框。因此,應(yīng)用程序可以實現(xiàn)包括圍繞在搜索中命中的對象部分2402的強調(diào)的框的顯示的有用頁面顯示。如上所述,本實施例使得該系統(tǒng)能夠搜索文檔圖像中的特定部分(例如包括在圖片區(qū)域中的有限部分)。此外,即使在根據(jù)在圖8C所示的對應(yīng)關(guān)系表中定義的設(shè)置將圖片區(qū)域合并到背景圖像中的情況下,本實施例也可以對圖片區(qū)域中的特定部分進行強調(diào)顯示。本發(fā)明的各方面還能夠通過讀出并執(zhí)行記錄在存儲裝置上的用于執(zhí)行上述實施例的功能的程序的系統(tǒng)或設(shè)備的計算機(或諸如CPU或MPU的裝置)、以及由系統(tǒng)或設(shè)備的計算機例如讀出并執(zhí)行記錄在存儲裝置上的用于執(zhí)行上述實施例的功能的程序來執(zhí)行步驟的方法來實現(xiàn)。鑒于此,例如經(jīng)由網(wǎng)絡(luò)或者從用作存儲裝置的各種類型的記錄介質(zhì)(例如計算機可讀介質(zhì))向計算機提供程序。在這種情況下,系統(tǒng)或設(shè)備以及存儲該程序的記錄介質(zhì)包括在本發(fā)明的范圍內(nèi)。雖然參照上述實施例對本發(fā)明進行了說明,但是應(yīng)當理解,本發(fā)明不限于所公開的實施例。所附權(quán)利要求的范圍符合最寬的解釋,以使其涵蓋所有變型、等同結(jié)構(gòu)及功能。權(quán)利要求一種圖像處理設(shè)備,所述圖像處理設(shè)備包括區(qū)域分割單元,其配置成從輸入圖像中提取對象區(qū)域;確定單元,其配置成確定由所述區(qū)域分割單元提取的所述對象區(qū)域的屬性;元數(shù)據(jù)處理單元,其配置成獲取要與由所述區(qū)域分割單元提取的所述對象區(qū)域相關(guān)聯(lián)的元數(shù)據(jù);圖形描述生成單元,其配置成針對具有需要生成透明圖形描述的屬性的對象區(qū)域,生成所述透明圖形描述;以及電子文檔生成單元,其配置成將所述圖形描述生成單元生成的所述透明圖形描述與所述元數(shù)據(jù)相關(guān)聯(lián),并生成包括基于所述輸入圖像生成的圖像數(shù)據(jù)和與所述元數(shù)據(jù)相關(guān)聯(lián)的所述透明圖形描述的電子文檔。2.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述元數(shù)據(jù)處理單元基于從具有注釋屬性的對象區(qū)域獲得的字符識別結(jié)果,來獲取與伴隨有具有所述注釋屬性的對象區(qū)域的對象區(qū)域相關(guān)聯(lián)的元數(shù)據(jù)。3.根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中,所述元數(shù)據(jù)處理單元基于從具有所述注釋屬性的對象區(qū)域獲得的所述字符識別結(jié)果和從具有正文屬性的對象區(qū)域獲得的字符識別結(jié)果,來獲取與伴隨有具有所述注釋屬性的對象區(qū)域的對象區(qū)域相關(guān)聯(lián)的所述元數(shù)據(jù)。4.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述電子文檔生成單元使用能夠?qū)⑺鐾该鲌D形描述與所述元數(shù)據(jù)相關(guān)聯(lián)的標識符。5.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,需要生成所述透明圖形描述的所述屬性是字符以外的屬性。6.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,需要生成所述透明圖形描述的所述屬性是基于用戶的指定從字符以外的屬性中選擇的屬性。7.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,基于所述輸入圖像生成的所述圖像數(shù)據(jù)包括所述對象區(qū)域合并到的背景圖像的圖像數(shù)據(jù)。8.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,基于所述輸入圖像生成的所述圖像數(shù)據(jù)包括所述對象區(qū)域的圖像部分數(shù)據(jù)或經(jīng)過矢量轉(zhuǎn)換的數(shù)據(jù)。9.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,所述圖像處理設(shè)備還包括設(shè)置單元,其配置成根據(jù)要生成的電子文檔的使用目的,來設(shè)置生成所述透明圖形描述的屬性。10.根據(jù)權(quán)利要求9所述的圖像處理設(shè)備,所述圖像處理設(shè)備還包括顯示單元,該顯示單元配置成顯示使得用戶能夠選擇要生成的電子文檔的使用目的的用戶界面。11.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,用圍繞所述對象區(qū)域的框來描述所述透明圖形描述。12.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,用預定的圖形形狀來描述所述透明圖形描述。13.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,用根據(jù)用戶指示的圖形形狀來描述所述透明圖形描述。14.根據(jù)權(quán)利要求13所述的圖像處理設(shè)備,所述圖像處理設(shè)備還包括顯示單元,其配置成顯示使得用戶能夠選擇所述透明圖形描述的圖形的形狀、線寬度和強調(diào)顏色中的至少一個的用戶界面。15.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,所述元數(shù)據(jù)處理單元基于對所述對象區(qū)域進行的圖像識別處理來獲取所述元數(shù)據(jù)。16.一種圖像處理方法,所述圖像處理方法包括使用區(qū)域分割單元從輸入圖像中提取對象區(qū)域;使用確定單元確定由所述區(qū)域分割單元提取的所述對象區(qū)域的屬性;使用元數(shù)據(jù)處理單元獲取要與由所述區(qū)域分割單元提取的所述對象區(qū)域相關(guān)聯(lián)的元數(shù)據(jù);使用圖形描述生成單元,針對具有需要生成透明圖形描述的屬性的對象區(qū)域,生成所述透明圖形描述;以及使用電子文檔生成單元,將所述圖形描述生成單元生成的所述透明圖形描述與所述元數(shù)據(jù)相關(guān)聯(lián),并生成包括基于所述輸入圖像生成的圖像數(shù)據(jù)和與所述元數(shù)據(jù)相關(guān)聯(lián)的所述透明圖形描述的電子文檔。全文摘要本發(fā)明涉及一種圖像處理設(shè)備及圖像處理方法。圖像處理設(shè)備從輸入圖像獲得對象區(qū)域(例如字符、圖片、線圖和表格)并且獲取與該對象相關(guān)聯(lián)的元數(shù)據(jù)。該圖像處理設(shè)備生成具有需要生成透明圖形描述的屬性的對象區(qū)域的透明圖形描述,并且在將該透明圖形描述與元數(shù)據(jù)相關(guān)聯(lián)的同時生成電子文檔。作為透明圖形描述,可以使用任意形狀的圖形。因此,該圖像處理設(shè)備可以生成適合強調(diào)表示的電子文檔數(shù)據(jù),用戶容易在使用關(guān)鍵詞的搜索操作中進行識別,以搜索電子文檔中包括的對象。文檔編號H04N1/00GK101820489SQ20101012284公開日2010年9月1日申請日期2010年2月26日優(yōu)先權(quán)日2009年2月27日發(fā)明者三沢玲司,小坂亮,相馬英智,金津知俊申請人:佳能株式會社