專利名稱:圖象處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖象處理技術(shù),更具體的說(shuō)就是,本發(fā)明涉及從通過(guò)掃描和數(shù)字照相機(jī)等讀取的原稿圖象中,提取出附加在該圖象中的手寫(xiě)信息的圖象處理技術(shù),以及將該讀取出的原稿圖象變換成可在諸如Word等等所謂的文檔生成應(yīng)用軟件中再次利用的矢量數(shù)據(jù)的圖象處理技術(shù)等等。
背景技術(shù):
近年來(lái)隨著環(huán)境問(wèn)題的日漸重視,辦公無(wú)紙化進(jìn)程正在急速推進(jìn),且已經(jīng)開(kāi)發(fā)出各種各樣處理電子文件的技術(shù)。
例如,日本特開(kāi)2001-358863號(hào)公報(bào)中,公開(kāi)了一種通過(guò)掃描儀對(duì)紙文檔進(jìn)行讀取,將其變換為電子文件格式(諸如JPEG和PDF等等),并存儲(chǔ)在圖象存儲(chǔ)裝置中的技術(shù)。
而且,日本特開(kāi)平8-147445號(hào)公報(bào)中,公開(kāi)了一種對(duì)包含在文本圖象內(nèi)各種屬性的區(qū)域進(jìn)行檢索,將每個(gè)區(qū)域作為內(nèi)容來(lái)對(duì)文檔進(jìn)行管理的文檔管理系統(tǒng)。
而且,日本特開(kāi)平10-063820號(hào)公報(bào)中,公開(kāi)了一種依據(jù)掃描的輸入圖象,識(shí)別相應(yīng)電子信息的技術(shù),而且還公開(kāi)了對(duì)該輸入圖象與電子信息間的差異信息進(jìn)行提取,并且將該提取出的差異信息與前述識(shí)別出的電子信息進(jìn)行合成處理的信息處理裝置。
而且,日本特開(kāi)平10-285378號(hào)公報(bào)中,公開(kāi)了一種對(duì)于數(shù)字復(fù)合設(shè)備(具有諸如復(fù)印功能、掃描功能、打印功能等等),可以確定在掃描獲得的圖象中是否存在表示頁(yè)面ID的圖形代碼,如果存在圖形代碼,則在數(shù)據(jù)庫(kù)中對(duì)該頁(yè)面ID進(jìn)行檢索。如果在數(shù)據(jù)庫(kù)中發(fā)現(xiàn)該頁(yè)面ID,則放棄目前獲得的掃描圖象,獲取出替代該信息用的、與頁(yè)面ID相關(guān)聯(lián)的印刷數(shù)據(jù),進(jìn)而通過(guò)打印操作生成印刷圖象并印刷在紙張上。在另一方面,對(duì)于該數(shù)據(jù)庫(kù)中沒(méi)有發(fā)現(xiàn)該頁(yè)面ID的場(chǎng)合,在進(jìn)行復(fù)印操作時(shí)將掃描圖象原樣復(fù)印在紙張上,在進(jìn)行傳真操作時(shí)和進(jìn)行文件整理操作時(shí),將PDL命令附加在掃描圖象上,并作為PDL格式進(jìn)行傳送。而且,在日本特開(kāi)平10-285378號(hào)公報(bào)公開(kāi)的技術(shù)中,采用的是功能擴(kuò)展了的記錄裝置、MFP(多功能復(fù)合設(shè)備),文字和圖象的原始數(shù)據(jù)文件存儲(chǔ)在圖象存儲(chǔ)裝置中,在將原始數(shù)據(jù)文件印刷并記錄在紙文檔上時(shí),可以將原始數(shù)據(jù)文件位于圖象存儲(chǔ)裝置之內(nèi)的指針信息,作為附加信息記錄在紙文檔的封面處和印刷信息中。采用這種方式,可以利用指針信息直接訪問(wèn)原始數(shù)據(jù)文件,進(jìn)而可以對(duì)原始數(shù)據(jù)文件進(jìn)行編輯、印刷等再次利用,減少紙文檔的保有數(shù)量。
然而,由日本特開(kāi)2001-358863號(hào)公報(bào)公開(kāi)的技術(shù),通過(guò)掃描儀讀取出的圖象可作為壓縮信息量的JPEG文件和PDF文件進(jìn)行保存的,但由于不能從打印文檔中檢索出所保存的文件,所以存在有重復(fù)進(jìn)行打印和掃描操作時(shí),可能會(huì)使所保存的文檔圖象惡化的問(wèn)題。而且,通過(guò)掃描儀讀取出的圖象可作為壓縮信息量的PDF文件進(jìn)行保存的,但由于不能從打印出的文檔中檢索出所保存的文件,所以還存在有難以對(duì)所保存的文檔進(jìn)行再次利用的問(wèn)題。而且,還存在有在變換至PDF文件的過(guò)程中,難以進(jìn)行其它處理的問(wèn)題。由日本特開(kāi)平8-147445號(hào)公報(bào)公開(kāi)的技術(shù),可以將圖象分割成多區(qū)域并可對(duì)各內(nèi)容進(jìn)行再次利用,但需通過(guò)用戶的命令,對(duì)內(nèi)容進(jìn)行檢索,進(jìn)而從其中確定出所使用的內(nèi)容,所以當(dāng)利用所存儲(chǔ)的內(nèi)容生成文檔時(shí),必須由用戶對(duì)所使用的內(nèi)容進(jìn)行確認(rèn),從而存在使用非常麻煩的問(wèn)題。
在日本特開(kāi)平10-063820號(hào)公報(bào)公開(kāi)的技術(shù)中,可以對(duì)與輸出用紙文檔相對(duì)應(yīng)的原始電子文件進(jìn)行檢索,提取出差異信息,所以可以對(duì)附加在紙文檔上的附加信息進(jìn)行保存,但由于原樣處理掃描圖象,從而存在前述差異信息增加了所需要的存儲(chǔ)容量的問(wèn)題。
由日本特開(kāi)平10-285378號(hào)公報(bào)公開(kāi)的技術(shù),對(duì)于沒(méi)有發(fā)現(xiàn)與紙文檔相對(duì)應(yīng)的原始電子文件的場(chǎng)合,可以將PDL命令附加在掃描圖象上以形成PDL格式,然而簡(jiǎn)單地將PDL命令附加在掃描圖象上以形成PDL格式時(shí),存在有文件尺寸比較大的問(wèn)題。而且,對(duì)于由原始數(shù)據(jù)文件沒(méi)有發(fā)現(xiàn)具有指針信息的文本文件的場(chǎng)合,也不能對(duì)原始數(shù)據(jù)文件進(jìn)行檢索。
發(fā)明內(nèi)容
本發(fā)明就是解決上述問(wèn)題用的發(fā)明,本發(fā)明的特征在于提供一種可以不損失紙文檔上的信息,將圖象惡化壓低至最小限度,并且可以減小所需要的存儲(chǔ)容量的圖象處理方法,以及圖象處理裝置等等。
而且,本發(fā)明的另一目的在于提供一種特征是為了能夠容易地對(duì)以紙文檔和圖象數(shù)據(jù)格式保存著的信息進(jìn)行再次利用,而將所輸入的圖象變換為矢量數(shù)據(jù)的技術(shù)。而且在本發(fā)明提供的一些實(shí)施方式中,還可以高效率地進(jìn)行矢量數(shù)據(jù)的變換處理。
為了能夠?qū)崿F(xiàn)上述目的,本發(fā)明提供的一種圖象處理方法,其特征在于,可以具有在輸入的圖象中確定矢量數(shù)據(jù)化區(qū)域用的確定步驟;以及對(duì)通過(guò)所述確定步驟確定出的矢量數(shù)據(jù)化區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化處理用的矢量化處理步驟。
而且,本發(fā)明提供的一種圖象處理系統(tǒng),其特征在于,可以具有在輸入的圖象中確定矢量數(shù)據(jù)化區(qū)域用的確定裝置;以及對(duì)通過(guò)所述確定裝置確定出的矢量數(shù)據(jù)化區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化處理用的矢量化處理裝置。
參考下面結(jié)合附圖進(jìn)行的說(shuō)明,可以更清楚的獲知本發(fā)明的其它特征和優(yōu)點(diǎn)。在各附圖中相同或相類似的部分,采用相同的參考標(biāo)號(hào)進(jìn)行表示。
在說(shuō)明書(shū)中引入的和構(gòu)成為說(shuō)明書(shū)一部分的附圖,與相應(yīng)的說(shuō)明部分一起對(duì)本發(fā)明的實(shí)施方式進(jìn)行了說(shuō)明,用以進(jìn)一步闡述本發(fā)明的基本原理。
圖1為表示可以應(yīng)用于實(shí)施方式1至4的一種圖象處理系統(tǒng)構(gòu)成實(shí)例用的示意圖。
圖2為表示可以應(yīng)用于實(shí)施方式1至4的一種MFP構(gòu)成實(shí)例用的示意圖。
圖3為表示作為實(shí)施方式1的整體圖象處理動(dòng)作用的示意性流程圖。
圖4為表示塊選擇處理的一個(gè)實(shí)例用的示意圖。
圖5為表示塊信息和輸入文件信息的一個(gè)構(gòu)成實(shí)例用的示意圖。
圖6為表示二維條形碼的一種解碼處理用的示意性流程圖。
圖7為表示附加有二維條形碼的一個(gè)原稿實(shí)例用的示意圖。
圖8為表示通過(guò)指針信息進(jìn)行文件檢索用的示意性流程圖。
圖9為表示限制尋址信息時(shí)的文件檢索用的示意性流程圖。
圖10A、圖10B為表示對(duì)文件進(jìn)行布局檢索處理用的示意性流程圖。
圖11為說(shuō)明矢量化處理實(shí)例1用的示意性說(shuō)明圖。
圖12為說(shuō)明矢量化處理實(shí)例2用的示意性說(shuō)明圖。
圖13為表示對(duì)矢量數(shù)據(jù)進(jìn)行組合處理用的示意性流程圖。
圖14為表示對(duì)圖形元素進(jìn)行檢測(cè)用的示意性流程圖。
圖15為表示DAOF型數(shù)據(jù)構(gòu)造形式用的示意圖。
圖16為表示變換應(yīng)用數(shù)據(jù)的處理用的示意性流程圖。
圖17為表示生成文檔結(jié)構(gòu)樹(shù)用的示意性流程圖。
圖18A、圖18B為說(shuō)明文檔結(jié)構(gòu)樹(shù)的生成步驟用的示意性說(shuō)明圖。
圖19為表示附加指針信息用的示意性流程圖。
圖20為表示差異提取處理用的示意性流程圖。
圖21為說(shuō)明差異提取處理用的示意圖。
圖22為表示對(duì)差異部分與原始電子文件進(jìn)行合成處理用的示意圖。
圖23為表示作為實(shí)施方式2的整體圖象處理動(dòng)作用的示意性流程圖。
圖24為表示作為實(shí)施方式3的整體圖象處理動(dòng)作用的示意性流程圖。
圖25為表示在進(jìn)行如圖24所示的處理之后的同時(shí)的矢量化處理用的示意性流程圖。
圖26為表示通過(guò)如圖24中的步驟S2407顯示在操作畫(huà)面中的一個(gè)畫(huà)面實(shí)例用的示意圖。
圖27為表示通過(guò)如圖24中的處理進(jìn)行生成的矢量化處理處理表用的示意圖。
圖28為表示依據(jù)如圖24中的指針信息進(jìn)行文件檢索處理用的示意性流程圖。
圖29為表示如圖24的文件檢索處理用的示意性流程圖。
圖30為表示對(duì)如圖24所示的文字區(qū)域進(jìn)行矢量化處理用的示意性流程圖。
圖31為表示進(jìn)行矢量化處理時(shí)角提取處理用的示意圖。
圖32為表示進(jìn)行矢量化處理時(shí)輪廓合并處理用的示意圖。
圖33為表示作為實(shí)施方式3的變形實(shí)例的圖象處理動(dòng)作概要用的示意性流程圖。
圖34為表示作為實(shí)施方式4的整體圖象處理動(dòng)作概要用的示意性流程圖。
圖35為表示作為實(shí)施方式4的變形實(shí)例1中的指定區(qū)域指定處理用的示意圖。
圖36為表示作為實(shí)施方式4的變形實(shí)例2中的指定區(qū)域指定處理用的示意圖。
具體實(shí)施例方式
A、實(shí)施方式1下面對(duì)本發(fā)明的實(shí)施方式進(jìn)行說(shuō)明。圖1為表示本發(fā)明提供的一種圖象處理系統(tǒng)構(gòu)成實(shí)例的示意性方框圖。這種圖象處理系統(tǒng)是通過(guò)由網(wǎng)絡(luò)104連接辦公室10和辦公室20的方式實(shí)現(xiàn)的。在辦公室10內(nèi)構(gòu)筑的LAN(局域網(wǎng)絡(luò))107中,對(duì)MFP(Multi Function Peripheral,數(shù)字式復(fù)合設(shè)備)100、控制該MFP100用的管理PC(計(jì)算機(jī))101、客戶端PC102、文檔管理服務(wù)器106、數(shù)據(jù)庫(kù)105以及代理服務(wù)器103進(jìn)行連接。LAN107和辦公室20內(nèi)的LAN108,通過(guò)代理服務(wù)器103與網(wǎng)絡(luò)104相連接。MFP100承擔(dān)對(duì)紙文檔進(jìn)行圖象讀取處理(掃描),以及對(duì)讀取出的圖象信號(hào)進(jìn)行圖象處理的一部分工作,圖象信號(hào)通過(guò)LAN109輸入至管理PC101。這種管理PC可以為常規(guī)的PC,在其內(nèi)部設(shè)置有圖象存儲(chǔ)裝置、圖象處理裝置、顯示裝置、輸入裝置等等,但其中一部分也可以與MFP100構(gòu)成為一體。
圖2為表示MFP100的示意性結(jié)構(gòu)圖。正如圖2所示,包含有自動(dòng)文件供給裝置(下面也稱為ADF)的圖象讀取部110可以用圖中未示出的光源對(duì)一疊或一張?jiān)鍒D象進(jìn)行照射,通過(guò)透鏡使原稿反射圖象在固體攝象元件處成象,得到由固體攝象元件給出的、呈光柵狀的圖象讀取信號(hào)作為諸如600DPI密度的圖象。作為常規(guī)形式的復(fù)印功能裝置,可以通過(guò)數(shù)據(jù)處理部115將該圖象信號(hào)圖象處理為記錄信號(hào),對(duì)需要復(fù)印多張的場(chǎng)合,可以暫時(shí)將記錄數(shù)據(jù)存儲(chǔ)保持在存儲(chǔ)裝置111處,隨后依次輸出至記錄裝置112以在紙張上形成圖象。
在另一方面,由客戶端PC102輸出的打印數(shù)據(jù),經(jīng)過(guò)LAN107傳送至網(wǎng)絡(luò)IF(網(wǎng)絡(luò)接口)114,再通過(guò)數(shù)據(jù)處理部115變換為可進(jìn)行記錄的光柵數(shù)據(jù)之后,通過(guò)所述記錄裝置在紙張上形成為記錄圖象。
給MFP100的操作者命令可以通過(guò)配置在MFP100上的按鍵操作部或管理PC的鍵盤和鼠標(biāo)等,由輸入裝置113處進(jìn)行輸入,而且這一系列動(dòng)作可以通過(guò)配置在數(shù)據(jù)處理部115之內(nèi)的圖中未示出的控制部進(jìn)行控制。
在另一方面,可以通過(guò)顯示裝置116對(duì)操作輸入進(jìn)行狀態(tài)顯示,并且可以對(duì)處理之中的圖象數(shù)據(jù)進(jìn)行顯示。存儲(chǔ)裝置111也可以由管理PC進(jìn)行控制,并且可以通過(guò)網(wǎng)絡(luò)IF117和直接連接的LAN109,進(jìn)行MFP與管理PC間的數(shù)據(jù)發(fā)送接收和控制操作。
而且,本發(fā)明也可以不使用如圖2所示的裝置,而是采用如圖1所示的系統(tǒng)進(jìn)行,舉例來(lái)說(shuō),存儲(chǔ)在如圖2所示的存儲(chǔ)裝置111處的可供計(jì)算機(jī)執(zhí)行的控制程序(對(duì)于這種場(chǎng)合,構(gòu)成本發(fā)明的控制程序可以存儲(chǔ)在存儲(chǔ)裝置111處,也可以通過(guò)通信回路等等從外部裝置處讀取并使用。存儲(chǔ)裝置并不僅限于內(nèi)置型硬盤,也可以為諸如可插拔型磁盤等等)也可以通過(guò)位于數(shù)據(jù)處理部115處的控制部(CPU),對(duì)如后所述的本發(fā)明處理操作的執(zhí)行進(jìn)行控制,而且上述數(shù)據(jù)處理裝置115中的整個(gè)控制部或其中一部分也可以由電氣回路的硬件構(gòu)成,并且可以通過(guò)該電氣回路對(duì)信號(hào)進(jìn)行處理的方式,進(jìn)行本發(fā)明的處理操作。
《處理操作)》下面通過(guò)圖3,對(duì)本發(fā)明的整體圖象處理操作進(jìn)行簡(jiǎn)要說(shuō)明。
正如圖3所示,可以首先使MFP100中的圖象讀取部110動(dòng)作,對(duì)一張?jiān)暹M(jìn)行光柵狀掃描,通過(guò)圖象輸入處理步驟S120,獲取600DPI-8比特的圖象信號(hào)。該圖象信號(hào)由數(shù)據(jù)處理部115進(jìn)行前處理,以頁(yè)面為單位將其作為圖象數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置111處。管理PC101中的CPU(中央處理器),可以首先從所存儲(chǔ)的圖象信號(hào)中,對(duì)文字/線條部分和半色調(diào)的圖象部分這兩部分區(qū)域進(jìn)行分離,隨后對(duì)文字部分進(jìn)一步按段落作為塊進(jìn)行組合而分離成一個(gè)個(gè)塊,對(duì)線條部分分離成一個(gè)個(gè)由線段構(gòu)成的表格、圖形,并分別進(jìn)行分段處理。在另一方面,將由半色調(diào)表示的圖象部分,分離成包含半色調(diào)圖象部分的、呈矩形形狀的塊,并且將每個(gè)塊作為獨(dú)立的對(duì)象進(jìn)行分割處理(步驟S121)。
在這時(shí),對(duì)作為附加信息的、記錄在原稿圖象中的二維條形碼,或是對(duì)應(yīng)于URL的對(duì)象進(jìn)行檢測(cè),對(duì)URL進(jìn)行字符識(shí)別處理(OCR),或是對(duì)由二維條形碼構(gòu)成的掩碼(mark)信息進(jìn)行解碼處理(OMR)(步驟S122),對(duì)存儲(chǔ)該原稿的原始電子文件用的存儲(chǔ)裝置內(nèi)的指針信息進(jìn)行檢測(cè)(步驟S123)。而且,對(duì)指針信息進(jìn)行附加方式可以是通過(guò)使文字與文字間的間隔產(chǎn)生微小變化而嵌入信息的方式,也可以是在半色調(diào)圖象中嵌入電子水印的方式等等。
對(duì)于檢測(cè)到指針信息的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S125,根據(jù)指針信息表示的地址檢測(cè)出原始電子文件。電子文件可以存儲(chǔ)在如圖1所示的管理PC內(nèi)的硬盤處,也可以存儲(chǔ)在由通過(guò)與辦公室10或辦公室20的LAN相連接的文檔管理服務(wù)器106進(jìn)行管理的數(shù)據(jù)庫(kù)105內(nèi),或是MFP100自身配置的存儲(chǔ)裝置111中,并且可以依據(jù)由步驟S123獲得的地址信息在這些存儲(chǔ)裝置內(nèi)進(jìn)行檢索。對(duì)于通過(guò)步驟S125未發(fā)現(xiàn)電子文件的場(chǎng)合,對(duì)于已經(jīng)發(fā)現(xiàn)但是為諸如以JPEG、PDF或tiff等等為代表的所謂圖象文件的場(chǎng)合,或是對(duì)于通過(guò)步驟S124確認(rèn)為指針信息自身不存在的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S126。對(duì)于通過(guò)步驟S125,依據(jù)指針信息發(fā)現(xiàn)有電子文件的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S129,對(duì)電子文件存儲(chǔ)的地址予以通知。
步驟S126為所謂的文件檢索處理例程。首先,從通過(guò)步驟S122對(duì)各文字塊進(jìn)行OCR處理的結(jié)果中提取出單詞,將其與包含在電子文件內(nèi)的單詞進(jìn)行比較以進(jìn)行全文檢索,或是通過(guò)對(duì)各對(duì)象的配列和各對(duì)象的屬性與電子文件中的對(duì)象配列和對(duì)象屬性進(jìn)行比較以進(jìn)行所謂的布局檢索。對(duì)于檢索結(jié)果表明發(fā)現(xiàn)有類似程度比較高的電子文件的場(chǎng)合,通過(guò)諸如縮略圖等等對(duì)作為候補(bǔ)的電子文件進(jìn)行顯示(步驟S127),而且在需要時(shí)可通過(guò)操作者的輸入操作,從作為候補(bǔ)的多個(gè)文件中由操作者選擇出指定的文件。而且,對(duì)于作為候補(bǔ)的文件為一份文件的場(chǎng)合,可以通過(guò)步驟S127自動(dòng)進(jìn)入至步驟S128,而且判斷為有電子文件,進(jìn)而沿程序分路進(jìn)入至步驟S129,并對(duì)預(yù)選文件的存儲(chǔ)地址予以通知。對(duì)于通過(guò)步驟S126的檢索處理未發(fā)現(xiàn)電子文件的場(chǎng)合,或是已經(jīng)發(fā)現(xiàn)但是為諸如以JPEG、PDF或tiff等等為代表的所謂圖形文件的場(chǎng)合,沿程序分路進(jìn)入至步驟S132。
這里,通過(guò)步驟S120輸入的圖象信息不僅可以通過(guò)如上所述的處理進(jìn)行檢索、對(duì)指定的電子文件原樣打印輸出,也可以在作為資料進(jìn)行打印輸出時(shí),由用戶在所獲得的資料上通過(guò)手寫(xiě)方式進(jìn)行寫(xiě)入操作,從而可以在指定的電子文件處附加上原先不存在的新信息。
在通過(guò)步驟S125或步驟S128選擇出指定電子文件時(shí),可以在對(duì)所輸入的圖象和指定電子文件間的差異信息進(jìn)行提取之后,提取出所附加上的新信息。換句話說(shuō)就是,通過(guò)在步驟S129對(duì)指定電子文件存在位置的地址予以通知,可以在步驟S130實(shí)際獲得電子文件,并通過(guò)步驟S131提取出所輸入的圖象與原始電子文件間的差異信息。
所提取出的差異信息通過(guò)步驟S132進(jìn)行的矢量化處理,由圖象數(shù)據(jù)變換為矢量數(shù)據(jù)。對(duì)于在差異信息上通過(guò)手寫(xiě)方式附加上文字信息等等的場(chǎng)合,可以通過(guò)OCR進(jìn)行編碼化或?qū)喞壽E進(jìn)行跟蹤以變換成輪廓化的矢量信息。將矢量化后的差異信息與原始的電子文件進(jìn)行合成,以生成新的電子文件。
對(duì)于沒(méi)有檢測(cè)出差異信息的場(chǎng)合,也可以類似地生成原始電子文件。
在另一方面,對(duì)于通過(guò)步驟S128的處理,為不能指定電子文件的場(chǎng)合,或是指定的電子文件為(完全不能進(jìn)行矢量化或文字編碼化的)圖象文件的場(chǎng)合,可以通過(guò)步驟S132,對(duì)所輸入的全部圖象信息進(jìn)行矢量化處理,將圖象數(shù)據(jù)變換為矢量化的電子文件。對(duì)于首先通過(guò)步驟S122進(jìn)行OCR處理后的文字塊,可以進(jìn)一步對(duì)文字尺寸、字型、字體進(jìn)行識(shí)別,按照與預(yù)先準(zhǔn)備出的文字種類(自身形狀、字型)的輪廓數(shù)據(jù)相對(duì)應(yīng)的方式,變換為視覺(jué)上忠實(shí)于由掃描原稿而獲得的文字的矢量數(shù)據(jù)。在另一方面,對(duì)由線構(gòu)成的表格、圖形塊進(jìn)行輪廓矢量化處理。對(duì)于諸如照片等等的自然圖象塊,將其作為圖象數(shù)據(jù)處理為單個(gè)的JPEG文件。而且,對(duì)于文字塊也可以不采用OCR處理結(jié)果,而是通過(guò)對(duì)文字圖象輪廓進(jìn)行識(shí)別,提取出沿著文字圖象輪廓的輪廓矢量的方式,對(duì)文字塊進(jìn)行矢量化處理。
對(duì)每個(gè)對(duì)象進(jìn)行這種矢量化處理,并且對(duì)各個(gè)對(duì)象的布局信息進(jìn)行保存,通過(guò)步驟S133將其變換成可通過(guò)常規(guī)應(yīng)用軟件進(jìn)行編輯處理的應(yīng)用數(shù)據(jù),進(jìn)而通過(guò)步驟S135將其作為電子文件存儲(chǔ)在存儲(chǔ)裝置111處。例如,通用的文件格式可以為將矢量數(shù)據(jù)和圖象數(shù)據(jù)變換為嵌入型RTF(Rich TextFormat)格式。進(jìn)行變換的應(yīng)用數(shù)據(jù)文件并不僅限于可嵌入對(duì)象的rtf格式,舉例來(lái)說(shuō),還可以變換為諸如SVG(Scarable Vector Grafics)格式等等的其他文件格式。
在這時(shí),可以通過(guò)步驟S134,將電子文件的存儲(chǔ)位置作為指針信息附加在所保存的電子文件上。采用這種方式,對(duì)于所保存的文件以后作為檢索對(duì)象時(shí),如果在進(jìn)行文件印刷時(shí)通過(guò)二維條形碼等等對(duì)指針信息進(jìn)行印刷,將可以容易地根據(jù)印刷文件來(lái)訪問(wèn)通過(guò)這種方式進(jìn)行保存的文件。
按照如上所述步驟獲得的電子文件,以可編輯形式全部包含原始電子信息或與其非常接近的矢量信息,以及隨后通過(guò)手寫(xiě)方式等等附加上的各種信息,而且可以對(duì)這些信息進(jìn)行直接加工、再次利用,或是進(jìn)行存儲(chǔ)、傳送、再印制等等操作。
由于和單純將輸入的整個(gè)圖象直接作為圖象數(shù)據(jù)進(jìn)行處理的場(chǎng)合相比,可以減少信息量,所以可以提高存儲(chǔ)效率,縮短傳送時(shí)間,而且在進(jìn)行顯示時(shí)可以作為高品位數(shù)據(jù)進(jìn)行非常良好的顯示。
下面對(duì)各處理塊進(jìn)行詳細(xì)說(shuō)明。
《塊選擇處理》首先,對(duì)步驟S121所示的塊選擇處理(區(qū)域分割處理)進(jìn)行說(shuō)明。
塊選擇處理可以將如圖4的右側(cè)所示的、通過(guò)步驟S120輸入的圖象數(shù)據(jù)(圖4的左側(cè)),作為各對(duì)象塊進(jìn)行識(shí)別,對(duì)各塊判定文字/圖象/照片/線段/表格等等屬性,并且對(duì)具有不同屬性的區(qū)域進(jìn)行分割處理。
下面,對(duì)塊選擇處理的一個(gè)實(shí)施例進(jìn)行說(shuō)明。
首先,對(duì)輸入圖象進(jìn)行黑白二值化處理,跟蹤黑色象素的輪廓線,將由黑色象素輪廓包圍著的象素塊提取出來(lái)。對(duì)于面積比較大的黑色象素塊,對(duì)應(yīng)于存在于內(nèi)部的白色象素地提取出進(jìn)行輪廓線跟蹤的白色象素塊,進(jìn)而在大于或等于一定面積的白色象素塊的內(nèi)部,遞歸地提取出黑色象素塊。
對(duì)于按照這種方式獲得的黑色象素塊,按照其大小和形狀進(jìn)行分類,劃分至具有不同屬性的區(qū)域中。例如,縱橫比接近1、大小位于一定范圍的塊可以作為與文字相當(dāng)?shù)南笏貕K,隨后將彼此接近的文字象素塊中可以整列良好、并可組化的區(qū)域作為文字區(qū)域,將扁平的象素塊作為線條區(qū)域,將至少為一定大小的、呈整列形式且內(nèi)部包含有呈四方形白色象素塊的黑色象素塊所占范圍作為表格區(qū)域,將分散有不定形狀象素塊的區(qū)域作為照片區(qū)域,將除此之外的其它任意形狀的象素塊作為圖象區(qū)域,如此等等。
與通過(guò)塊選擇處理獲得的各塊相對(duì)應(yīng)的塊信息以及對(duì)包含在輸入圖象中的塊進(jìn)行管理用的輸入文件信息可以如圖5所示。這些塊信息在下面的說(shuō)明中,是作為矢量化信息或檢索用信息而使用的。
《指針信息的檢測(cè)》下面,對(duì)從圖象信息中提取出文件存儲(chǔ)位置用的OCR/OMR處理(步驟S122)進(jìn)行說(shuō)明。
圖6表示的是對(duì)附加在原稿圖象中的二維條形碼(QR編碼符號(hào))進(jìn)行解碼,進(jìn)而輸出數(shù)據(jù)文字列的過(guò)程的示意性流程圖。附加有二維條形碼的原稿310的一個(gè)實(shí)例已經(jīng)示出在圖7中。
首先,通過(guò)CPU(圖中未示出)對(duì)表示存儲(chǔ)在數(shù)據(jù)處理部115內(nèi)的頁(yè)存儲(chǔ)器處的原稿310的圖象進(jìn)行掃描,由如上所述的塊選擇處理的結(jié)果,檢測(cè)出預(yù)定二維條形碼符號(hào)311的位置。QR編碼的位置檢測(cè)圖案,可由配置在符號(hào)四個(gè)角中的三個(gè)角處的同一位置檢測(cè)要素圖案構(gòu)成(步驟S300)。
隨后,復(fù)原與位置檢測(cè)圖案相鄰接的格式信息,以獲得可應(yīng)用于符號(hào)的~等級(jí)和掩碼(mask)圖案(步驟S301)。
在確定出符號(hào)的類型(步驟S302)之后,利用由格式信息獲得的掩碼(mask)圖案,對(duì)編碼區(qū)域比特圖案進(jìn)行XOR演算,以解除掩碼處理(步驟S303)。
依據(jù)與模式相對(duì)應(yīng)的配置規(guī)則,對(duì)符號(hào)特征進(jìn)行讀取,對(duì)消息數(shù)據(jù)和糾錯(cuò)碼詞進(jìn)行解碼(步驟S304)。
對(duì)解碼出的代碼進(jìn)行是否存在錯(cuò)誤的檢測(cè)(步驟S305),對(duì)于檢測(cè)出錯(cuò)誤的場(chǎng)合,沿程序分路進(jìn)入至步驟S306,對(duì)其進(jìn)行校正處理。
利用糾錯(cuò)后的數(shù)據(jù),依據(jù)模式指示符和文字?jǐn)?shù)指示符,將數(shù)據(jù)碼詞分段(segment)(步驟S307)。
最后,依據(jù)標(biāo)準(zhǔn)模式對(duì)數(shù)據(jù)文字進(jìn)行解碼,并輸出結(jié)果(步驟S308)。
組合在二維條形碼內(nèi)的數(shù)據(jù)表示的是相對(duì)應(yīng)的文件的地址信息,例如,可以由包含文件服務(wù)器名和文件名的路徑信息構(gòu)成?;蛘撸€可以由指向相對(duì)應(yīng)文件的URL構(gòu)成。
本實(shí)施例中的指針信息,是以使用二維條形碼進(jìn)行附加后的原稿310為例進(jìn)行說(shuō)明的,然而也可以采用通過(guò)文字列進(jìn)行記錄的指針信息。對(duì)于這種場(chǎng)合,可以通過(guò)預(yù)先的塊選擇處理,檢測(cè)出依據(jù)預(yù)定規(guī)則的文字列塊(比如說(shuō)位于預(yù)先確定位置處的文字塊),對(duì)表示該指針信息的文字列塊中的各文字進(jìn)行字符識(shí)別,進(jìn)而獲得原始文件的地址信息。
而且,對(duì)于如圖7所示的文件310中的文字塊312或文字塊313的文字列,還可以對(duì)相鄰接的文字和文字間的間隔等等施加微小調(diào)制,將信息嵌入在該文字間隔處以附加上指針信息,所以例如,當(dāng)進(jìn)行如后所述的字符識(shí)別處理時(shí),如果對(duì)各文字間隔進(jìn)行檢測(cè),將可以獲得指針信息。而且,還可以在自然圖畫(huà)314中附加上肉眼看不見(jiàn)的、作為電子水印的指針信息。
《通過(guò)指針信息進(jìn)行的文件檢索》下面利用如圖8所示的流程圖,對(duì)如圖3中步驟S125所示的、通過(guò)指針信息對(duì)電子文件進(jìn)行的檢索進(jìn)行說(shuō)明。
首先,依據(jù)包含在指針信息中的地址信息,確定出指定的文件服務(wù)器(步驟S400)。
這里的文件服務(wù)器,可以是客戶端PC102,內(nèi)裝有數(shù)據(jù)庫(kù)105的文檔管理服務(wù)器106,也可以是內(nèi)裝有存儲(chǔ)裝置111的MFP100自身。這里的地址,指的是URL,或包含服務(wù)器名和文件名的路徑信息等等。
在指定出指定文件服務(wù)器之后,可相對(duì)文件服務(wù)器發(fā)送出地址(步驟S401)。文件服務(wù)器在接收到地址時(shí),對(duì)相應(yīng)的文件進(jìn)行檢索(步驟S402)。對(duì)于文件不存在的場(chǎng)合(步驟S403-N),相對(duì)于MFP發(fā)出相應(yīng)的通知。
而對(duì)于文件存在的場(chǎng)合(步驟S403-Y),按照如圖3說(shuō)明的方式,對(duì)文件地址進(jìn)行通知(步驟S129),同時(shí)對(duì)MFP發(fā)送相應(yīng)數(shù)據(jù)文件以用于以后提取差異信息(步驟S408)。
《文件檢索處理》下面參考圖5、圖10A、圖10B,對(duì)如圖3中的步驟S126所示的文件檢索處理進(jìn)行詳細(xì)說(shuō)明。
如上所述,對(duì)于在步驟S124中輸入的原稿(輸入文件)中不存在指針信息的場(chǎng)合,或?qū)τ诓襟ES125中存在指針信息但未發(fā)現(xiàn)電子文件中,或是電子文件為圖象文件的場(chǎng)合,進(jìn)行步驟S126所示的處理。
這里,步驟S122的處理結(jié)果,所提取出的各塊和輸入文件,具有如圖5所示的信息(塊信息,輸入文件信息)。例如,信息內(nèi)容可以為屬性、坐標(biāo)位置、寬度和高度的尺寸、是否存在有OCR信息等等。屬性可以按照文字、線段、照片、圖形、表格、其它進(jìn)行分類。為了便于說(shuō)明,將各文字塊按照坐標(biāo)X從小到大的順序,即按照(比如說(shuō),X1<X2<X3<X4<X5<X6)命名為塊1、塊2、塊3、塊4、塊5、塊6。總塊數(shù)為輸入文件中的全部塊數(shù),對(duì)于圖10A、圖10B所示的場(chǎng)合,總塊數(shù)為6。利用這些信息,從數(shù)據(jù)庫(kù)中對(duì)與輸入文件相類似的文件進(jìn)行布局檢索用的流程圖如圖10A、圖10B所示。這里,是以存儲(chǔ)在數(shù)據(jù)庫(kù)中的文件具有與如圖5所示相同種類的信息(塊信息、文件信息)為前提的。
使用該程序?qū)斎胛募c數(shù)據(jù)庫(kù)中的文件依次進(jìn)行比較。首先通過(guò)步驟S510,對(duì)如后所述的相似性等等進(jìn)行初始化處理。隨后,通過(guò)步驟S511對(duì)總塊數(shù)進(jìn)行比較,對(duì)于比較結(jié)果為真的場(chǎng)合,進(jìn)一步對(duì)文件內(nèi)的塊信息依次進(jìn)行比較。通過(guò)這種塊信息比較,可以由步驟S513、515、518分別計(jì)算出屬性相似性、尺寸相似性、OCR相似性,并且可以通過(guò)步驟S522基于這些相似性計(jì)算出綜合相似性。各相似性的計(jì)算方法可以采用公知技術(shù)中的各種適用方法,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。如果步驟S523中綜合相似性高于預(yù)先設(shè)定的閾值Th時(shí),可通過(guò)步驟S524將該文件作為類似候補(bǔ)。在圖中,參考標(biāo)號(hào)N、W、H分別為輸入文件的總塊數(shù)、各塊寬度、各塊高度,參考標(biāo)號(hào)ΔN、ΔW、ΔH分別為以輸入文件的塊信息為基準(zhǔn)的誤差。參考標(biāo)號(hào)n、w、h分別為存儲(chǔ)在數(shù)據(jù)庫(kù)中的文件的總塊數(shù)、各塊寬度、各塊高度。雖然圖中未示出,在通過(guò)步驟S514進(jìn)行尺寸比較時(shí),也可以對(duì)位置信息XY等等進(jìn)行比較。
如上所述,對(duì)于檢索結(jié)果為相似性高于閾值Th時(shí)可以將其作為候補(bǔ)進(jìn)行保存的數(shù)據(jù)庫(kù)文件(步驟S524),可以通過(guò)縮略圖等等進(jìn)行顯示(步驟S127)。對(duì)于顯示有多個(gè)候補(bǔ)的場(chǎng)合,可以通過(guò)操作者的輸入操作,從這些文件中確定出指定文件。
《差異提取處理》
下面對(duì)如圖3中的步驟S131所示的差異提取處理進(jìn)行說(shuō)明。
圖20為表示差異提取處理用的示意性流程圖。
在圖20中,輸入圖象表示的是通過(guò)圖3中的步驟S120作為圖象信息進(jìn)行輸入的輸入圖象,電子文件表示的是通過(guò)圖3中的步驟S125或128獲得的原始電子文件。這里的輸入圖象,由于經(jīng)過(guò)了在圖3中的步驟S121、122、123中進(jìn)行塊選擇處理、OCR/OMR處理、指針信息的檢測(cè)處理,從而可以獲得如圖4所示的塊選擇處理后的塊地址、如圖5所示的塊信息和如圖7所示的指針信息。
圖21為說(shuō)明差異提取處理用的、表示電子文件和輸入圖象的圖象數(shù)據(jù)的內(nèi)容,以及塊選擇處理的一個(gè)實(shí)例的示意圖。
在圖21中,參考標(biāo)號(hào)2110表示的是電子文件的內(nèi)容,參考標(biāo)號(hào)2111表示的是對(duì)電子文件2110進(jìn)行塊選擇處理后的塊布局信息的模式圖。雖然在該圖中沒(méi)有示出,然而也可以通過(guò)其它方式構(gòu)成如圖5所示的塊信息。參考標(biāo)號(hào)2114表示的是表示指針信息的二維條形碼,參考標(biāo)號(hào)2115表示的是進(jìn)行塊選擇處理后的二維條形碼塊。
參考標(biāo)號(hào)2112表示的是輸入圖象的內(nèi)容,參考標(biāo)號(hào)2113表示的是對(duì)輸入圖象2112進(jìn)行塊選擇處理后的塊布局信息的模式圖。雖然在該圖中沒(méi)有示出,然而也可以通過(guò)其它方式構(gòu)成如圖5所示的塊信息。參考標(biāo)號(hào)2116表示的是表示指針信息的二維條形碼,參考標(biāo)號(hào)2117表示的是進(jìn)行塊選擇處理后的二維條形碼塊。與電子文件2110不同,在輸入圖象2112中還記載有手寫(xiě)文字2118,通過(guò)對(duì)其進(jìn)行塊選擇處理,可以在塊布局信息2113中生成手寫(xiě)文字塊2119。
下面參考圖20、圖21,對(duì)差異提取處理進(jìn)行說(shuō)明。本實(shí)施例是如圖3中的步驟S134所說(shuō)明的,指針信息是在印刷時(shí)作為圖象數(shù)據(jù)附加在電子文件上的,從而在如步驟S125所示的獲取電子文件階段,指針信息2114尚未附加在電子文件上。因此,首先通過(guò)步驟S2001,依據(jù)該電子文件的存儲(chǔ)地址,將作為指針信息的二維條形碼2114附加在電子文件2110上。
通過(guò)步驟S2002,對(duì)于將作為指針信息的二維條形碼2114作為圖象數(shù)據(jù)附加在其中的電子文件2110進(jìn)行塊選擇處理。這種塊選擇處理可以按照通過(guò)圖4說(shuō)明過(guò)的方式進(jìn)行。在圖4中,說(shuō)明了對(duì)于輸入圖象,將輸入圖象中的各對(duì)象識(shí)別為塊,按照文字/圖象/照片/線段/表格等屬性,對(duì)各塊進(jìn)行判定,并將其分割成具有不同屬性的區(qū)域的處理,但在步驟S2002對(duì)電子文件2110進(jìn)行同樣的處理。
通過(guò)步驟S2003,進(jìn)行與圖3中步驟S122同樣的處理,即對(duì)電子文件2110進(jìn)行塊選擇處理之后,對(duì)各個(gè)對(duì)象進(jìn)行已知的OCR/OMR處理。
通過(guò)步驟S2004,進(jìn)行與圖3中步驟S123同樣的處理,即從電子文件2110中,檢測(cè)出通過(guò)步驟S2001附加上的、作為指針信息的二維條形碼2114。
通過(guò)步驟S2005,依據(jù)從圖3中通過(guò)步驟S123檢測(cè)出的輸入圖象2112的塊布局信息2113中得到的作為指針信息的二維條形碼2117的坐標(biāo),以及從通過(guò)步驟S2004檢測(cè)出的電子文件2110的塊布局信息2111中得到的作為指針信息的二維條形碼2115的坐標(biāo),對(duì)輸入圖象2112與電子文件2110的方向、大小等等進(jìn)行比較。
步驟S2006依據(jù)步驟S2005的比較結(jié)果,在需要時(shí)對(duì)輸入圖象2112進(jìn)行諸如轉(zhuǎn)動(dòng)、放大縮小、傾斜校正等處理。這種處理不僅可以對(duì)輸入圖象2112進(jìn)行,也可以對(duì)進(jìn)行塊選擇處理后的塊布局信息2113(以及塊信息、指針信息)等等進(jìn)行。
關(guān)于塊布局信息、塊信息、指針信息,還可以通過(guò)對(duì)進(jìn)行過(guò)諸如旋轉(zhuǎn)、放大縮小、傾斜校正的輸入圖象2112再次進(jìn)行一系列的塊選擇處理、OCR/OMR處理、指針信息檢測(cè)處理等等,來(lái)進(jìn)行更新。
無(wú)論采用哪種方式,均可以通過(guò)步驟S2006,使輸入圖象2112按照電子文件2110的方向和大小進(jìn)行調(diào)整。在圖21所示的實(shí)例中,是以具有相同方向、相等倍率表示的,所以不再需要進(jìn)行這些處理。
通過(guò)步驟S2007,在作為輸入圖象2112和電子文件2110的各自塊選擇處理結(jié)果的塊布局信息2113和2111中,對(duì)分割后的塊逐塊判斷是否具有相同內(nèi)容。這種判斷可以通過(guò)各個(gè)塊布局信息、塊信息和OCR/OMR信息進(jìn)行。正如圖21所示,手寫(xiě)文字部分2118的塊2119在輸入圖象2112和電子文件2110中被判斷為不同的塊。
通過(guò)步驟S2008,進(jìn)行從輸入圖象中去除由步驟S2007判斷為相同的塊。正如圖21所示,可以將除了手寫(xiě)文字塊2119之外的塊去除掉。
可以通過(guò)步驟S2009,將在步驟S2008中未去除的殘余塊作為輸入圖象2112與電子文件2110間的差異圖象數(shù)據(jù)進(jìn)行提取。正如圖21所示,可以差異提取出與手寫(xiě)文字塊2119相對(duì)應(yīng)的圖象數(shù)據(jù)2118。
《矢量化處理》下面,對(duì)通過(guò)圖3中的步驟S132表示的矢量化處理進(jìn)行詳細(xì)說(shuō)明。
對(duì)于僅對(duì)按照上述方式提取出的差異信息進(jìn)行矢量化的場(chǎng)合,以及對(duì)于通過(guò)步驟128不能指定出指定電子文件而對(duì)整個(gè)圖象進(jìn)行矢量化處理的場(chǎng)合,可以假定為兩種處理形式,這里首先對(duì)為后者的、即對(duì)整個(gè)圖象進(jìn)行矢量化處理的場(chǎng)合進(jìn)行說(shuō)明。通過(guò)如上所述的塊選擇處理,可以將整個(gè)圖象分割為塊,并且可以對(duì)每個(gè)塊進(jìn)行矢量化處理。
《對(duì)文字塊進(jìn)行的矢量化處理》首先,對(duì)文字塊中的各文字進(jìn)行字符識(shí)別處理。字符識(shí)別部對(duì)于按文字單位切割出的圖象,利用圖案匹配方法進(jìn)行識(shí)別處理,獲得相對(duì)應(yīng)的文字編碼。這種識(shí)別處理可以是一種將由文字圖象獲得的特征變換為數(shù)十維的數(shù)值列而獲得的觀測(cè)特征矢量與由預(yù)先按文字種類求得的詞典特征矢量進(jìn)行比較,將距離最近的文字種類作為識(shí)別結(jié)果的處理??梢圆捎酶鞣N公知的方式進(jìn)行特征矢量的提取操作,比如說(shuō)可以采用將文字分割成篩網(wǎng)形狀,將各個(gè)篩網(wǎng)內(nèi)的文字線段沿不同方向作為線元素進(jìn)行計(jì)數(shù)的篩網(wǎng)多維矢量處理方式。
對(duì)于對(duì)通過(guò)塊選擇處理(步驟S121)提取出的文字區(qū)域進(jìn)行字符識(shí)別的場(chǎng)合,可以首先判定在該區(qū)域是否為橫向筆畫(huà)區(qū)域、縱向筆畫(huà)區(qū)域,按分別與其相對(duì)應(yīng)的方向切割成行,隨后對(duì)文字進(jìn)行切割以獲得文字圖象。對(duì)橫向筆畫(huà)區(qū)域、縱向筆畫(huà)區(qū)域進(jìn)行的判定,可以通過(guò)取得該區(qū)域內(nèi)應(yīng)于對(duì)象素值的水平/垂直投影,對(duì)于水平投影的分散程度比較大的場(chǎng)合判斷其為橫向筆畫(huà)區(qū)域,對(duì)于垂直投影的分散程度比較大的場(chǎng)合判斷其為縱向筆畫(huà)區(qū)域。對(duì)于文字列和文字的分解如下進(jìn)行如果為橫向筆畫(huà)區(qū)域可以利用沿水平方向的投影切割成行,然后再根據(jù)切割出的行沿垂直方向的投影,切割出文字。對(duì)于為縱向筆畫(huà)的文字區(qū)域,可以對(duì)水平和垂直的操作進(jìn)行反轉(zhuǎn)。而且,還可以在這時(shí)對(duì)文字尺寸進(jìn)行檢測(cè)。
隨后,可以對(duì)該文字塊內(nèi)的各文字的字體種類進(jìn)行識(shí)別??梢灶A(yù)先按照文字形狀種類即字體種類準(zhǔn)備多個(gè)在進(jìn)行字符識(shí)別時(shí)使用的文字種類等等的詞典特征矢量,在進(jìn)行匹配時(shí)同時(shí)輸出文字編碼和字體種類,從而可以對(duì)文字字體進(jìn)行識(shí)別。
利用通過(guò)所述字符識(shí)別和印刷字體識(shí)別獲得的文字編碼和字體信息,可以使用為各種文字編碼和字體預(yù)先準(zhǔn)備出的輪廓數(shù)據(jù),將文字部分的信息變換成矢量數(shù)據(jù)。而且,對(duì)于原稿為彩色文件的場(chǎng)合,還可以由彩色圖象中提取出各文字的顏色,并作為矢量數(shù)據(jù)進(jìn)行記錄。
采用如上所述的處理方式,可以將文字塊所屬的圖象忠實(shí)地按其形狀、大小、顏色變換成矢量數(shù)據(jù)。
《對(duì)線條塊、圖形塊等進(jìn)行的矢量化處理》以通過(guò)塊選擇處理(步驟S121)判定為線條、圖形或表格區(qū)域的區(qū)域作為對(duì)象,將由該區(qū)域中提取出的象素塊的輪廓變換為矢量數(shù)據(jù)。如果具體的講就是,可以在作為角的點(diǎn),對(duì)構(gòu)成輪廓的象素點(diǎn)列進(jìn)行分割,進(jìn)而將各區(qū)間近似為部分直線或曲線。角是曲率極大的點(diǎn),曲率為極大的點(diǎn)可以如圖11所示,當(dāng)由相對(duì)于任意點(diǎn)Pi沿左右方向離散的k個(gè)離散點(diǎn)Pi-k和點(diǎn)Pi+k間引出弦時(shí),作為該弦與點(diǎn)Pi間距離為極大的點(diǎn)進(jìn)行求解。而且,以(點(diǎn)Pi-k和點(diǎn)Pi+k間的弦長(zhǎng)/弧長(zhǎng))為R,可以將R值小于或等于閾值的點(diǎn)作為角。通過(guò)角進(jìn)行分割后的各區(qū)間,其直線可以采用相對(duì)于點(diǎn)列進(jìn)行的最小平方法等等,其曲線可以使用三次樣條函數(shù)等等進(jìn)行矢量化處理。
對(duì)于對(duì)象具有內(nèi)輪廓的場(chǎng)合,可以進(jìn)行白色象素的輪廓線跟蹤,使用所提取出的白色象素輪廓點(diǎn)列,同樣利用部分直線或曲線進(jìn)行近似處理。
如上所述,如果采用這種輪廓區(qū)分線近似處理方法,可以使任意形狀的圖形輪廓矢量化。對(duì)于原稿為彩色文件的場(chǎng)合,還可以由彩色圖象中提取出圖形顏色,并作為矢量數(shù)據(jù)進(jìn)行記錄。
而且,正如圖12所示,對(duì)于某一區(qū)間的外輪廓與內(nèi)輪廓或其它外輪廓相接近的場(chǎng)合,還可以將兩個(gè)輪廓合并在一起,用比較粗的線條表示。如果具體的講就是,由某一輪廓中的各點(diǎn)Pi到在其它輪廓上距離為最短的點(diǎn)Qi引線,如果各距離PQi的平均長(zhǎng)度小于或等于一定值時(shí),所關(guān)注區(qū)間的PQi中點(diǎn)可以作為點(diǎn)列通過(guò)直線或曲線進(jìn)行近似,其粗細(xì)為PQi的平均值。作為線與線的集合體的合并線,可以作為具有如前所述粗細(xì)的線的集合而進(jìn)行高效的矢量顯示。
而且,前面是使用相對(duì)文字塊進(jìn)行字符識(shí)別處理用的矢量化進(jìn)行的說(shuō)明,其字符識(shí)別結(jié)果采用的是與詞典距最小的文字作為識(shí)別結(jié)果的,但對(duì)于該距離大于等于預(yù)定值的場(chǎng)合,必然與原始文字不完全一致,所以往往會(huì)將其誤識(shí)別為是類似文字。因此,本實(shí)施方式對(duì)于這種文字,可以采用如上所述的方式,將該文字輪廓化,以進(jìn)行與一般的線段圖象相同的處理。換句話說(shuō)就是,即使對(duì)于利用在先技術(shù)中的字符識(shí)別處理引起錯(cuò)誤識(shí)別的文字,不對(duì)錯(cuò)誤的文字進(jìn)行矢量化處理,可以忠實(shí)地將可視圖象數(shù)據(jù)輪廓化,進(jìn)而再進(jìn)行矢量化處理。
對(duì)于判斷為照片的塊,本實(shí)施方式不進(jìn)行矢量化處理,將其直接作為圖象數(shù)據(jù)。
下面對(duì)按照如上所述方式,將任意形狀的圖形輪廓矢量化后,以各圖形對(duì)象為單位對(duì)這些矢量化區(qū)分線進(jìn)行組合的處理進(jìn)行說(shuō)明。
圖13為表示按各圖形對(duì)象對(duì)矢量數(shù)據(jù)進(jìn)行組合處理用的示意性流程圖。首先,對(duì)各矢量數(shù)據(jù)的始點(diǎn)、終點(diǎn)進(jìn)行計(jì)算(步驟700)。利用各矢量的始點(diǎn)、終點(diǎn)信息對(duì)圖形元素進(jìn)行檢測(cè)(步驟701)。對(duì)圖形元素的檢測(cè)是對(duì)構(gòu)成區(qū)分線的閉合圖形進(jìn)行的檢測(cè)。在進(jìn)行檢測(cè)時(shí),可以依據(jù)構(gòu)成閉合形狀的各矢量具有分別連接其兩端的矢量的原理進(jìn)行檢測(cè)。隨后,對(duì)圖形元素中存在的其它圖形元素,或是區(qū)分線進(jìn)行組合處理,形成一個(gè)圖形對(duì)象(步驟702)。對(duì)于不存在圖形元素中的其它圖形元素或區(qū)分線的場(chǎng)合,將圖形元素作為圖形對(duì)象。
圖14為表示對(duì)圖形元素進(jìn)行檢測(cè)用的示意性流程圖。首先,從矢量數(shù)據(jù)中將兩端未進(jìn)行連接的不需要的矢量去除,提取出閉合圖形構(gòu)成矢量(步驟710)。然后取閉合圖形構(gòu)成矢量中該矢量的始點(diǎn)作為開(kāi)始點(diǎn),沿順時(shí)針?lè)较蜃粉櫴噶?。一直到返回至開(kāi)始點(diǎn),將所通過(guò)的全部矢量作為構(gòu)成一個(gè)圖形元素的閉合圖形進(jìn)行組合處理(步驟711)。作為閉合圖形內(nèi)部的閉合圖形構(gòu)成矢量,也全部進(jìn)行組合處理。而且,將沒(méi)有進(jìn)行組合處理的矢量始點(diǎn)作為開(kāi)始點(diǎn),重復(fù)進(jìn)行同樣的操作。最后,由通過(guò)步驟710去除的不需要的矢量中,檢測(cè)出與在步驟711中作為閉合圖形而進(jìn)行組合的矢量連接的矢量,將其作為一個(gè)圖形元素進(jìn)行組合處理(步驟712)。
采用上述方式,還可以將圖形塊單獨(dú)作為可再次進(jìn)行利用的圖形對(duì)象進(jìn)一步使用。
《差異信息的矢量化處理》下面,對(duì)步驟S132的矢量化處理中,通過(guò)圖20所示方式提取出的差異信息進(jìn)行的矢量化處理進(jìn)行說(shuō)明。
對(duì)于差異信息中包含有文字圖象的場(chǎng)合,進(jìn)行與如上所述的、對(duì)文字塊進(jìn)行的矢量化處理相同的處理。采用這種方式,可以對(duì)手寫(xiě)的文字、比如說(shuō)如圖21所示的手寫(xiě)文字2118進(jìn)行字符識(shí)別之后,對(duì)文字進(jìn)行矢量化或字體化處理。
但是,對(duì)于有手寫(xiě)文字的場(chǎng)合,塊選擇處理的結(jié)果有時(shí)依據(jù)場(chǎng)合的不同,不將其識(shí)別為文本塊,而是通過(guò)對(duì)細(xì)線進(jìn)行的識(shí)別判斷為線段塊。對(duì)于這種場(chǎng)合,與上面說(shuō)明過(guò)的“對(duì)線條塊、圖形塊等進(jìn)行的矢量化處理”相類似,可以對(duì)輪廓進(jìn)行檢測(cè)以進(jìn)行輪廓化處理,忠實(shí)地將可視圖象數(shù)據(jù)輪廓化,進(jìn)而進(jìn)行矢量化處理。
而且,在圖21中是以手寫(xiě)文字2118為例進(jìn)行說(shuō)明的,然而對(duì)于手寫(xiě)的細(xì)線、圖畫(huà)等等也可以進(jìn)行類似處理,將線條和圖象等等輪廓化,進(jìn)而進(jìn)行矢量化處理。
《差異信息和電子文件的合成處理》圖22為表示對(duì)差異部分的矢量化處理結(jié)束后,與原始電子文件進(jìn)行合成時(shí)的一個(gè)實(shí)例用的示意圖,表示的是對(duì)圖21中的輸入圖象數(shù)據(jù)2112中的手寫(xiě)文字2118進(jìn)行矢量化處理后的形式用的示意圖。
圖22中的參考標(biāo)號(hào)2200表示的是在如圖21所示的電子文件2110中,與對(duì)手寫(xiě)文字2118進(jìn)行矢量化后的矢量文字2201進(jìn)行合成獲得的新的電子文件數(shù)據(jù)。
如圖22所示的手寫(xiě)文字2118被矢量化后,以和塊布局信息2113的坐標(biāo)處的手寫(xiě)文字最近似的字體和尺寸、作為矢量文字2201而合成到原始電子文件2110中。
如上所述,對(duì)于在所輸入的圖象中,包含有在手寫(xiě)文字和原始電子文件間不同的差異信息的場(chǎng)合,也可以對(duì)輸入圖象和電子文件間的差異信息進(jìn)行提取,對(duì)該差異部分進(jìn)行矢量化處理,與原始電子文件進(jìn)行合成、保存,并給出存儲(chǔ)地址的通知,從而可以對(duì)所輸入的圖象數(shù)據(jù)進(jìn)行電子文件化處理。
《向應(yīng)用數(shù)據(jù)的變換處理》但是,對(duì)輸入圖象數(shù)據(jù)進(jìn)行矢量化處理(步驟S132)后的結(jié)果,還需要變換成如圖15所示的中間數(shù)據(jù)格式的文件。這種數(shù)據(jù)格式被稱為文件分析輸出格式(DAOF)。
圖15為表示DAOF的數(shù)據(jù)結(jié)構(gòu)的示意圖。在圖15中,參考標(biāo)號(hào)791表示的是引導(dǎo)部分(Header),保存的是與作為處理對(duì)象的文字圖象數(shù)據(jù)相關(guān)的信息。布局描述數(shù)據(jù)部792保存的是按照文件圖象數(shù)據(jù)中的TEXT(文字)、TITLE(標(biāo)題)、CAPTION(目錄)、LINEART(線條)、PICTURE(自然圖象)、FRAME(框)、TABLE(表格)等各種屬性進(jìn)行識(shí)別的各塊屬性信息和其塊地址信息。字符識(shí)別描述數(shù)據(jù)部793保存的是對(duì)TEXT、TITLE、CAPTION等文本塊進(jìn)行字符識(shí)別獲得的字符識(shí)別結(jié)果。圖表描述數(shù)據(jù)部794存儲(chǔ)的是TABLE塊的詳細(xì)構(gòu)成信息。圖象描述數(shù)據(jù)部795保存的是從文檔圖象數(shù)據(jù)中切割出的、諸如PICTURE等塊的圖象數(shù)據(jù)。
這種DAOF不僅可以作為中間數(shù)據(jù),其自身也可以被文件化后進(jìn)行保存,但在這種文件化后的狀態(tài)下,不能通過(guò)所謂的一般文檔制作應(yīng)用程序,再次利用各對(duì)象。下面利用圖16,對(duì)從這種DAOF變換為應(yīng)用數(shù)據(jù)的處理(步驟S130)進(jìn)行詳細(xì)說(shuō)明。
通過(guò)步驟S8000進(jìn)行DAOF數(shù)據(jù)的輸入操作。
通過(guò)步驟S8002生成以應(yīng)用數(shù)據(jù)為基礎(chǔ)的文檔結(jié)構(gòu)樹(shù)。
通過(guò)步驟S8004以這種文檔結(jié)構(gòu)樹(shù)為基礎(chǔ),加入DAOF內(nèi)的實(shí)際數(shù)據(jù)以生成實(shí)際的應(yīng)用數(shù)據(jù)。
圖17為表示通過(guò)步驟S8002生成文檔結(jié)構(gòu)樹(shù)用的詳細(xì)流程圖,圖18為說(shuō)明文檔結(jié)構(gòu)樹(shù)的示意性說(shuō)明圖。作為進(jìn)行整體控制的基本規(guī)則,處理流程可以從微型塊(單體塊)向宏塊(塊的集合體)轉(zhuǎn)移。這里所稱的塊包括微型塊和宏塊。
通過(guò)步驟S8100,可以以塊為單位、基于縱向的相關(guān)性進(jìn)行再次組合處理。在開(kāi)始執(zhí)行之后以微型塊為單位進(jìn)行判斷。這里所稱的相關(guān)性可通過(guò)判斷距離接近、塊寬度(水平方向時(shí)為高度)大體是否相等等來(lái)進(jìn)行定義。而且,距離、寬度、高度等等信息,均可以參考DAOF進(jìn)行提取操作。
圖18(a)表示的是一個(gè)頁(yè)面構(gòu)成實(shí)例,圖18(b)表示的是該文檔結(jié)構(gòu)樹(shù)。步驟S8100的處理結(jié)果,為首先生成使塊T3、T4、T5位于同一層的組V1,以及使塊T6、T7位于同一層的組V2。
通過(guò)步驟S8102,檢查沿縱向是否存在有分割符。分割符諸如是在物理含義上、DAOF中具有線段屬性的對(duì)象。其邏輯含義為,在應(yīng)用中明確地對(duì)塊進(jìn)行分割的要素。對(duì)于檢測(cè)出分割符的場(chǎng)合,對(duì)同一層再次進(jìn)行分割。
步驟S8104利用組長(zhǎng)度,判定是否不存在如上所述的分割符。這里,對(duì)于沿縱向的組長(zhǎng)度為頁(yè)面高度(位于該頁(yè)面中的多個(gè)塊的最上側(cè)端部至最下側(cè)端部間的距離)的場(chǎng)合,結(jié)束文檔結(jié)構(gòu)樹(shù)的生成操作。如圖18所示的場(chǎng)合,在組V1、V2中不存在有分割符,由于塊的高度不等于頁(yè)面高度,所以進(jìn)入至步驟S8106。
步驟S8106以塊為單位依據(jù)沿橫向的相關(guān)性進(jìn)行再次組合處理。在這時(shí)的相關(guān)性和判定信息的定義均與沿縱向的場(chǎng)合相類似。
對(duì)于如圖18所示的場(chǎng)合,可以由塊T1、T2生成組H1,由V1、V2生成組H2。組H1和組H2為位于組V1、V2中1個(gè)之上的同一層中的組。
通過(guò)步驟S8108,檢查沿橫向是否存在有分割符。對(duì)于圖18所示的場(chǎng)合,存在有分割符S1,所以需要將其登錄在文檔結(jié)構(gòu)樹(shù)中,生成由H1、S1、H2構(gòu)成的層。
步驟S8110利用組長(zhǎng)度,判定是否不存在有如上所述的分割符。這里,對(duì)于沿橫向的組長(zhǎng)度為頁(yè)面寬度的場(chǎng)合,結(jié)束文檔結(jié)構(gòu)樹(shù)的生成操作。
對(duì)于存在分割符的場(chǎng)合,返回至步驟S8102,在上一層中重復(fù)進(jìn)行沿縱向相關(guān)性的檢查。
對(duì)于如圖18所示的場(chǎng)合,分割寬度等于頁(yè)面寬度(位于該頁(yè)面中的多個(gè)塊的最左側(cè)端部至最右側(cè)端部間的距離),所以結(jié)束處理操作,最后在文檔結(jié)構(gòu)樹(shù)上附加入表示整個(gè)頁(yè)面的最高層V0。
在完成文檔結(jié)構(gòu)樹(shù)之后,以該信息為基礎(chǔ),通過(guò)步驟S8004進(jìn)行應(yīng)用數(shù)據(jù)的生成操作。對(duì)于如圖18所示的場(chǎng)合,可以按照下述方式具體進(jìn)行。
換句話說(shuō)就是,組H1沿橫向具有兩個(gè)塊T1和T2,所以構(gòu)成為兩列,可以對(duì)塊T1的內(nèi)部信息(參考DAOF,諸如字符識(shí)別結(jié)果的文章,圖象等等)進(jìn)行輸出之后,換列對(duì)塊T2的內(nèi)部信息進(jìn)行輸出,隨后對(duì)S1進(jìn)行輸出。
組H2沿橫向具有兩個(gè)組V1和V2,從而作為兩列輸出,V1按照塊T3、T4、T5的順序?qū)ζ鋬?nèi)部信息進(jìn)行輸出,隨后進(jìn)行列變換,對(duì)組V2中塊T6、T7的內(nèi)部信息進(jìn)行輸出。
由于按照如上所述的輸出順序,進(jìn)行向應(yīng)用數(shù)據(jù)的變換處理,所以對(duì)于諸如文字區(qū)域的讀取順序等,可以按照正確的順序變換為應(yīng)用數(shù)據(jù)。
《指針信息的附加操作》下面,對(duì)于通過(guò)步驟S134附加在圖象數(shù)據(jù)上的指針信息,在進(jìn)行印制時(shí)的處理操作進(jìn)行說(shuō)明。
對(duì)于所存儲(chǔ)的文檔在紙張上進(jìn)行記錄處理的場(chǎng)合,通過(guò)依據(jù)指針信息對(duì)圖象數(shù)據(jù)進(jìn)行了附加和記錄,則當(dāng)再次使用該文件進(jìn)行各種處理時(shí),可以簡(jiǎn)單地獲取出原始文件數(shù)據(jù)。
圖19為表示對(duì)作為指針信息的數(shù)據(jù)文字列進(jìn)行編碼處理(圖象化處理)而變換成二維條形碼(QR編碼符號(hào)JIS X0510)311,進(jìn)而附加在圖象中的過(guò)程用的示意性流程圖。
組合在二維條形碼內(nèi)的數(shù)據(jù)為表示對(duì)應(yīng)文件的地址信息,例如,可以由包含有文件服務(wù)器名和文件名的路徑信息構(gòu)成?;蛘?,還可以由相應(yīng)文件的URL,以及在存儲(chǔ)有相應(yīng)文件的數(shù)據(jù)庫(kù)105內(nèi)或MFP100自身所具有的存儲(chǔ)裝置內(nèi)進(jìn)行管理用的文件ID等等構(gòu)成。
首先,為了對(duì)編碼后的各種不同文字進(jìn)行識(shí)別,對(duì)輸入數(shù)據(jù)列進(jìn)行分析。而且,可以對(duì)錯(cuò)誤檢測(cè)和~等級(jí)進(jìn)行選擇,并選擇可以容納輸入數(shù)據(jù)的最小容量型號(hào)(步驟S900)。
隨后,將輸入數(shù)據(jù)列變換為預(yù)定比特列,并且可以依據(jù)需要,附加上表示數(shù)據(jù)模式(數(shù)字、英文數(shù)字、8比特字節(jié)、漢字等等)用的指示符和終端圖案。進(jìn)而變換成預(yù)定的比特碼字(步驟S901)。
在這時(shí),為了能夠進(jìn)行糾錯(cuò),還可以按照型號(hào)和~等級(jí),將碼字列分割為預(yù)定數(shù)目的塊,對(duì)每個(gè)塊生成糾錯(cuò)碼字,并附加在比特碼字列之后(步驟S902)。
對(duì)通過(guò)步驟S902獲得的各塊的數(shù)據(jù)碼字進(jìn)行連接,并且可以將各塊的糾錯(cuò)碼字、以及根據(jù)需要將剩余碼字連接在其后面處(步驟S903)。
隨后,可以將位置檢測(cè)圖案、分離圖案、計(jì)時(shí)圖案和位置對(duì)準(zhǔn)圖案等等,與碼字模塊一并配置為矩陣(步驟S904)。
對(duì)于符號(hào)的編碼區(qū)域,選擇最佳掩碼圖案,并且可以通過(guò)XOR演算,將掩碼處理圖案變換至由步驟S904獲得的模塊中(步驟S905)。
最后,在通過(guò)步驟S905獲得的模塊中,生成格式信息和型號(hào)信息,完成二維條形碼符號(hào)(步驟S906)。
在以上的說(shuō)明中,對(duì)于將由客戶端PC102給出的電子文件作為打印數(shù)據(jù)在位于記錄裝置112處的紙張上形成記錄圖象的場(chǎng)合,組合了地址信息的二維條形碼可以在數(shù)據(jù)處理部115內(nèi)變換為可進(jìn)行記錄的光柵數(shù)據(jù)后,附加在光柵數(shù)據(jù)上的預(yù)定位置處,從而形成圖象。這里,對(duì)圖象形成后的紙張進(jìn)行布置的用戶可以通過(guò)由圖象讀取部110處進(jìn)行讀取的方式,從如上所述的步驟S123獲得的指針信息中,檢測(cè)出原始電子文件的存儲(chǔ)位置。
而且例如,對(duì)指針信息(地址信息)進(jìn)行附加的方法除了本實(shí)施例所說(shuō)明的二維條形碼之外,還可以采用通過(guò)直接文字列將指針信息附加在文件中的方法,對(duì)文件內(nèi)的文字列、特別是對(duì)文字與文字間的間隔進(jìn)行調(diào)制以嵌入信息的方法,以及諸如在文檔中的半色調(diào)圖象中嵌入信息的方法等等的通常稱為電子水印的方法。
(適用于實(shí)施方式1的其它變形形式)<涉及差異信息生成的其它具體實(shí)例>
在如上所述的說(shuō)明中,是以將所提取出的差異信息與原始電子文件進(jìn)行合成后保存的場(chǎng)合為例進(jìn)行說(shuō)明的,然而也可以利用對(duì)原始電子文件進(jìn)行差異提取用的參考數(shù)據(jù),將差異信息從輸入圖象分離,不與原始電子文件進(jìn)行合成而是作為其它文件進(jìn)行保存。而且,還可以將差異信息作為其它文件,按照與原始電子文件相關(guān)聯(lián)的方式進(jìn)行保存,在進(jìn)行印刷輸出時(shí)進(jìn)行合成輸出。
如果采用這種構(gòu)成形式,不需要改變電子信息,并且可以僅將剩余的差異信息作為電子數(shù)據(jù)進(jìn)行保存,從而可以生成內(nèi)容大體相同的多個(gè)電子數(shù)據(jù),由此避免其冗長(zhǎng)性。
<涉及差異信息合成的其它具體實(shí)例>
本實(shí)施方式是以所存儲(chǔ)的原始電子文件,不允許對(duì)應(yīng)于原始電子文件信息的追加/改變的場(chǎng)合為例進(jìn)行說(shuō)明的。然而,對(duì)于通過(guò)如圖3的步驟S125或步驟S128,指定出指定的原始電子文件的場(chǎng)合,也可以通過(guò)步驟S131,利用原始電子文件,從所輸入的圖象信息中提取出差異信息,并通過(guò)步驟S132判斷該原始電子文件是否禁止進(jìn)行信息的追加/改變,對(duì)于判斷結(jié)果為不禁止的場(chǎng)合,可以對(duì)差異信息進(jìn)行矢量化處理并與原始電子文件進(jìn)行合成處理,對(duì)于判斷結(jié)果為禁止的場(chǎng)合,對(duì)差異信息進(jìn)行矢量化處理,同時(shí)對(duì)輸入圖象信息中除差異信息之外的圖象部分也進(jìn)行矢量化處理和存儲(chǔ),在進(jìn)行輸出操作時(shí),再將差異信息與輸入圖象信息中除差異信息之外的圖象部分進(jìn)行合成處理。
對(duì)于這種場(chǎng)合,原始文件僅用作進(jìn)行差異信息提取時(shí)的參考文件,而且通過(guò)對(duì)輸入圖象矢量化而生成電子數(shù)據(jù)。對(duì)于這種場(chǎng)合,所追加的差異信息可以參考原始文件進(jìn)行可靠地提取,所以可以通過(guò)將差異信息作為獨(dú)立的對(duì)象進(jìn)行處理的方式,提高其在編輯、再次利用等方面的可使用性。
B、實(shí)施方式2作為本實(shí)施方式的圖象處理系統(tǒng)構(gòu)成實(shí)例和MFP的構(gòu)成形式,與實(shí)施方式1相類似,也采用的是如圖1和圖2所示的構(gòu)成形式,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。
《處理概要》下面通過(guò)圖23,對(duì)作為實(shí)施方式2的圖象處理全部操作進(jìn)行簡(jiǎn)要的整體說(shuō)明。在圖23中,由步驟S2300至步驟S2308間的處理,與圖3中由步驟S120至步驟S128間的處理相類似,然而為了理解容易,這里不僅僅對(duì)其中的一部分步驟,而且對(duì)全部步驟進(jìn)行了說(shuō)明。
正如圖23所示,首先在進(jìn)行圖象輸入處理的步驟S2300中,使MFP100(參見(jiàn)圖2)中的圖象讀取部110動(dòng)作,對(duì)一張?jiān)暹M(jìn)行光柵狀掃描,以獲得600DPI-8比特的圖象信號(hào)。該圖象信號(hào)由數(shù)據(jù)處理部115進(jìn)行前處理,將其作為1頁(yè)圖象數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置111處。管理PC101中的CPU首先從所存儲(chǔ)在圖象信號(hào)中,分離出文字/線條部分和灰度圖象部分這兩個(gè)區(qū)域,并且將文字部分進(jìn)一步分離為按段落作為塊進(jìn)行合并后的塊,將線條部分分離為按線段構(gòu)成的表格、圖形,隨后分別進(jìn)行分段處理。在另一方面,將通過(guò)半色調(diào)表示的圖象部分分離成包含半色調(diào)圖象部分的、呈矩形形狀的塊,并且將每個(gè)塊作為獨(dú)立的對(duì)象進(jìn)行分割處理(步驟S2301)。
在這時(shí),對(duì)作為附加信息記錄在原稿圖象中的二維條形碼,或是對(duì)應(yīng)于該URL的對(duì)象進(jìn)行檢測(cè),對(duì)URL進(jìn)行字符識(shí)別處理(OCR),或是對(duì)諸如二維條形碼等標(biāo)記信息進(jìn)行解碼處理(OMR)(步驟S2302),對(duì)存儲(chǔ)該原稿的原始電子文件用的存儲(chǔ)裝置內(nèi)的指針信息進(jìn)行檢測(cè)(步驟S2303)。而且,附加指針信息的方式可以是通過(guò)使文字與文字間的間隔產(chǎn)生微小變化而嵌入信息的方式,也可以是在半色調(diào)圖象中嵌入電子水印的方式。
對(duì)于檢測(cè)到指針信息的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S2305,根據(jù)指針信息表示的地址,檢測(cè)出原始電子文件。電子文件可以存儲(chǔ)在如圖1所示的管理PC內(nèi)的硬盤內(nèi),也可以存儲(chǔ)在由與辦公室10或辦公室20的LAN相連接的文檔管理服務(wù)器106進(jìn)行管理的數(shù)據(jù)庫(kù)105內(nèi),或是MFP100自身配置的存儲(chǔ)裝置111內(nèi),從而可以依據(jù)由步驟S2303獲得的地址信息,在這些存儲(chǔ)裝置內(nèi)進(jìn)行檢索。對(duì)于通過(guò)步驟S2305未發(fā)現(xiàn)電子文件的場(chǎng)合,對(duì)于已經(jīng)發(fā)現(xiàn)電子文件但是為JPEG、PDF或tiff等所謂的圖形文件的場(chǎng)合,或是對(duì)于通過(guò)步驟S2304確認(rèn)為指針信息自身不存在的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S2306。對(duì)于通過(guò)步驟S2305,依據(jù)指針信息發(fā)現(xiàn)電子文件的場(chǎng)合,可以沿程序分路進(jìn)入至步驟S2313,對(duì)存儲(chǔ)電子文件的地址進(jìn)行通知。
步驟S2306為所謂的文檔檢索處理例程。首先,通過(guò)步驟S2302從對(duì)各文字塊進(jìn)行OCR處理的結(jié)果中提取出單詞,將其與包含在電子文件內(nèi)的單詞進(jìn)行比較以進(jìn)行全文檢索,或是通過(guò)對(duì)各對(duì)象的配列和各對(duì)象的屬性與電子文件中的對(duì)象配列和對(duì)象屬性進(jìn)行比較以進(jìn)行所謂的布局檢索。對(duì)于檢索結(jié)果表明發(fā)現(xiàn)有類似程度比較高的電子文件的場(chǎng)合,利用縮略圖等等對(duì)作為候補(bǔ)的電子文件進(jìn)行顯示(步驟S2307),而且在需要時(shí)可通過(guò)操作者的輸入操作,在作為候補(bǔ)的多個(gè)文件中通過(guò)操作者的輸入而選擇出指定的文件。對(duì)于指定了電子文件的場(chǎng)合,進(jìn)入至步驟S2314,但對(duì)于指定的電子文件為JPEG、PDF或tiff等所謂的圖形文件的場(chǎng)合,進(jìn)入至步驟S2309。而且,對(duì)于作為候補(bǔ)的文件為一個(gè)文件的場(chǎng)合,可以通過(guò)步驟S2307自動(dòng)進(jìn)入至步驟S2308,判斷為有電子文件,沿程序分路進(jìn)入至步驟S2313,并對(duì)存儲(chǔ)地址進(jìn)行通知。對(duì)于通過(guò)步驟S2306的檢索處理未發(fā)現(xiàn)電子文件的場(chǎng)合,或是已經(jīng)發(fā)現(xiàn)但其為JPEG、PDF或tiff等所謂的圖形文件的場(chǎng)合,沿程序分路進(jìn)入至步驟S2309。
步驟S2309是從圖象數(shù)據(jù)向矢量數(shù)據(jù)的變換處理部,將圖象信息變換為矢量化處理后的電子文件。首先,對(duì)于通過(guò)步驟S2302進(jìn)行OCR處理后的文字塊,進(jìn)一步對(duì)文字尺寸、字型、字體進(jìn)行識(shí)別,并變換為視覺(jué)上忠實(shí)于通過(guò)對(duì)進(jìn)行原稿掃描獲得的文字的字體數(shù)據(jù)。在另一方面,對(duì)由線段構(gòu)成的表格、圖形塊進(jìn)行輪廓化處理。
對(duì)于諸如照片等等的自然圖象塊,將其作為圖象數(shù)據(jù)處理為單獨(dú)的JPEG文件。對(duì)每個(gè)對(duì)象進(jìn)行這種矢量化處理,并且作為各對(duì)象的布局信息進(jìn)行保存,通過(guò)步驟S2310將其變換成可通過(guò)常規(guī)應(yīng)用程序進(jìn)行編輯處理的應(yīng)用數(shù)據(jù),進(jìn)而通過(guò)步驟S2311將其作為電子文件存儲(chǔ)在存儲(chǔ)裝置111中。而且,為了在隨后進(jìn)行同樣的處理時(shí)能夠?qū)⑵渥鳛橹苯与娮游募z索出來(lái),還可以通過(guò)步驟S2312生成檢索使用的索引信息,并且附加在檢索用索引文件中。通過(guò)步驟S2313對(duì)存儲(chǔ)該電子文件用的地址進(jìn)行通知。另外,通過(guò)步驟S2310,作為通用文件格式,可以將矢量數(shù)據(jù)變換為例如嵌入型rtf(Rich Text Format)格式。進(jìn)行變換的應(yīng)用數(shù)據(jù)文件,并不僅限于可嵌入對(duì)象的rtf格式,例如,還可以變換為諸如SVG(Scarable Vector Grafics)格式等等的其他文件格式。
隨后通過(guò)步驟S2314,判斷目前將要進(jìn)行的處理是否為記錄處理(對(duì)紙張的印刷處理),對(duì)于判斷為依據(jù)用戶的命令進(jìn)行記錄處理的場(chǎng)合,沿程序分路進(jìn)入至步驟S2315,將表示存儲(chǔ)地址的指針信息(二維條形碼等等),作為圖象數(shù)據(jù)附加在文件上,進(jìn)而通過(guò)步驟S2316進(jìn)行印刷處理。在另一方面,可以通過(guò)步驟S2314,對(duì)于將要進(jìn)行的處理為記錄處理之外的處理(諸如圖象加工處理、對(duì)其它媒體的存儲(chǔ)處理、對(duì)其它裝置的傳送處理等等)的場(chǎng)合,不附加指針信息,直接進(jìn)入步驟S2316進(jìn)行該指定的處理操作。
如上所述,對(duì)于不能指定電子文件的場(chǎng)合,可以將圖象矢量化,并作為電子文件進(jìn)行存儲(chǔ),所以和對(duì)圖象數(shù)據(jù)原樣進(jìn)行存儲(chǔ)的場(chǎng)合相比,可以減少信息量。因此,可以提高存儲(chǔ)效率,縮短傳送時(shí)的傳送時(shí)間,而且在進(jìn)行記錄時(shí)可以作為高品位圖象進(jìn)行再現(xiàn)。
對(duì)各處理塊的詳細(xì)說(shuō)明,與實(shí)施方式1相同,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。如果具體的講就是,由步驟S2301進(jìn)行塊選擇處理,由步驟S2302進(jìn)行OCR/OMR處理(包含指針信息的檢測(cè)處理),由步驟S2305通過(guò)指針信息進(jìn)行文件檢索處理,由步驟S2306進(jìn)行文件檢索處理,由步驟S2309進(jìn)行矢量化處理,而且對(duì)文字塊進(jìn)行矢量化處理,對(duì)線條塊、圖形塊等進(jìn)行矢量化處理,向應(yīng)用數(shù)據(jù)的變換處理,指針信息的附加處理等等,均與實(shí)施方式1相同。
(同樣適用于實(shí)施方式1和實(shí)施方式2的其它變形形式)<涉及文件地址訪問(wèn)權(quán)的其它具體實(shí)例>
對(duì)于所提供的文檔文件,有時(shí)必須對(duì)第三方的再次利用進(jìn)行限制。在前述實(shí)施例中,是以存儲(chǔ)在文件服務(wù)器中的文件全部可以自由訪問(wèn),整個(gè)文件或文件中的一部分的對(duì)象均可以進(jìn)行再次利用為前提進(jìn)行說(shuō)明的。下面參考圖9,對(duì)通過(guò)前述實(shí)施例利用指針信息對(duì)文件進(jìn)行檢索時(shí),對(duì)檢索結(jié)果、即指定的指定文件存在訪問(wèn)權(quán)限制的另一實(shí)施例進(jìn)行說(shuō)明。直至步驟S403之前的處理均與前述實(shí)施例相同,所以省略了詳細(xì)說(shuō)明。對(duì)于通過(guò)步驟S403指定文件的場(chǎng)合,可通過(guò)步驟S404檢查文件服務(wù)器處對(duì)該文件地址的訪問(wèn)權(quán)信息,對(duì)于存在訪問(wèn)限制的場(chǎng)合,向MFP請(qǐng)求發(fā)送密碼(步驟S405)。
MFP提示用戶輸入密碼,并且將所輸入的密碼傳送至文件服務(wù)器處(步驟S406)。
文件服務(wù)器對(duì)傳送來(lái)的密碼進(jìn)行比較認(rèn)證(步驟S407),對(duì)于認(rèn)證成功的場(chǎng)合,如圖3所說(shuō)明過(guò)的那樣,對(duì)文件的地址進(jìn)行通知(步驟S129或步驟S2313),而且如果用戶希望進(jìn)行處理的圖象文件數(shù)據(jù)能夠被獲取到時(shí),還將文件傳送至MFP處(步驟S408)。
而且,對(duì)地址訪問(wèn)權(quán)進(jìn)行控制的認(rèn)證方法,并不僅限于如步驟S405、步驟S406所示的使用密碼認(rèn)證的方法,例如,還可以采用諸如指紋認(rèn)證等常規(guī)使用的人體認(rèn)證、通過(guò)卡進(jìn)行認(rèn)證等等各種各樣的認(rèn)證方法。
而且,在本具體實(shí)例中,是以通過(guò)附加在紙文檔上的指針信息對(duì)指定文件進(jìn)行指定的場(chǎng)合為例進(jìn)行說(shuō)明的,然而對(duì)于在如圖3中步驟S126至步驟S128所示的檢索處理中指定文件的場(chǎng)合,也可以按照相同方式對(duì)地址訪問(wèn)權(quán)進(jìn)行控制。
而且,對(duì)于通過(guò)圖3中步驟S129進(jìn)行說(shuō)明的矢量化處理,也可以設(shè)置限制處理權(quán)限。換句話說(shuō)就是,在從掃描紙文檔獲得的圖象中通過(guò)水印等檢測(cè)到對(duì)該文檔的訪問(wèn)限制時(shí),僅僅在認(rèn)證確認(rèn)的場(chǎng)合進(jìn)行矢量化處理,從而可以限制使用機(jī)密程度比較高的文檔。
<涉及指定文件的其它具體實(shí)例>
在前述實(shí)施例中,從通過(guò)對(duì)原稿進(jìn)行掃描獲得的圖象信息中指定原始文件數(shù)據(jù)的裝置如圖3所示,可以依據(jù)附加在文件中的指針信息進(jìn)行指定,也可以依據(jù)記載在文檔中的各對(duì)象信息對(duì)相應(yīng)的文件進(jìn)行檢索,但為了能夠更準(zhǔn)確地指定出原始文件,還可以對(duì)滿足這兩種方式的電子文件進(jìn)行指定。換句話說(shuō)就是,即使可以根據(jù)從原稿中獲得的指針信息檢索出原始文件,也進(jìn)一步使用該文件中的對(duì)象信息,對(duì)檢索出的文件進(jìn)行基于布局信息的布局檢索、通過(guò)字符識(shí)別后的關(guān)鍵詞進(jìn)行的全文檢索等,對(duì)于獲得高度一致的場(chǎng)合,才將該檢索出的文件正式指定為原文件。這里例如,對(duì)于指針信息的低位部分存在不確定內(nèi)容,并且即使進(jìn)行糾錯(cuò)也難以校正的場(chǎng)合,還可以對(duì)檢索范圍進(jìn)行進(jìn)一步縮小而指定文件,從而可以更快速且更準(zhǔn)確地指定文件。
<涉及矢量化處理的其它具體實(shí)例>
前述實(shí)施例對(duì)于檢索裝置未能指定原文件的場(chǎng)合,對(duì)整個(gè)圖象圖象進(jìn)行矢量化處理,然而對(duì)于諸如為一般性文檔的場(chǎng)合,也可以不新生成文檔中的全部對(duì)象,而是將其一部分對(duì)象生成為可以與其它文件共用。例如,背景對(duì)象(壁紙)通常可以通過(guò)文檔制作應(yīng)用程序預(yù)先準(zhǔn)備出幾種圖案,并且從其中進(jìn)行選擇使用。因此,采用這種對(duì)象存在于文檔文件數(shù)據(jù)庫(kù)中的其它文檔文件中的可能性相當(dāng)大,而且作為可再次利用的矢量數(shù)據(jù)而存在的可能性也相當(dāng)高。
因此,作為圖3中的矢量化處理步驟S129的另一具體實(shí)例,還可以對(duì)于通過(guò)塊選擇處理被分割為單獨(dú)對(duì)象的各對(duì)象,按該對(duì)象單位,從數(shù)據(jù)庫(kù)中檢索包含與其一致的對(duì)象的文件,對(duì)于與其一致的對(duì)象,可以個(gè)別地從該文件中按對(duì)象單位取得矢量數(shù)據(jù)。據(jù)此,可以對(duì)輸入文件進(jìn)行更高速的矢量化處理,并且可以防止由于矢量化處理造成的圖象質(zhì)量惡化。
在另一方面,對(duì)于通過(guò)圖3中的檢索處理步驟S126至步驟S128,可將原始文件作為PDF進(jìn)行指定的場(chǎng)合,有時(shí)該P(yáng)DF具有通過(guò)對(duì)該文檔的字符對(duì)象進(jìn)行字符識(shí)別而獲得的文字編碼,作為附加文件。在對(duì)這種PDF文件進(jìn)行矢量化處理時(shí),如果采用該文字編碼文件,則可以省略步驟S129以后的矢量化處理中的字符識(shí)別處理。換句話說(shuō)就是,可以更高速地實(shí)現(xiàn)矢量化處理。
通過(guò)如上所述的說(shuō)明可知,如果采用本發(fā)明,可以提取出輸入圖象信息和原始電子文件間的差異信息(不存在于原始文件中的追加信息)。
而且,通過(guò)將所提取出的追加信息與原始電子文件進(jìn)行合成保存的方式,還可以生成在原始數(shù)據(jù)中附加有追加信息的高品質(zhì)的電子文件。
而且,通過(guò)對(duì)附加的差異信息也進(jìn)行矢量化處理,包含附加信息在內(nèi),還可以大大提高再利用性、可編輯性,而且可以減少所需要的存儲(chǔ)容量。
而且如果采用本發(fā)明,對(duì)于沒(méi)有發(fā)現(xiàn)原始電子文件的場(chǎng)合,由于對(duì)輸入的圖象進(jìn)行矢量數(shù)據(jù)化處理后存儲(chǔ),所以具有容易進(jìn)行再次利用的技術(shù)效果。采用矢量數(shù)據(jù)化處理,還可以減少存儲(chǔ)容量。
而且,對(duì)于發(fā)現(xiàn)有原始電子文件的場(chǎng)合,可以使用該原始電子數(shù)據(jù),所以具有可以減少圖象質(zhì)量惡化的技術(shù)效果。
C、實(shí)施方式3圖象處理系統(tǒng)和MFP100可以采用與實(shí)施方式1相同的構(gòu)成形式,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。
《圖象處理方法的整體流程》依據(jù)本發(fā)明的圖象處理方法的實(shí)施方式3,可以通過(guò)圖24所示的各步驟實(shí)現(xiàn)。而且,在圖24中包含有與圖3所示流程圖中的處理相同的處理,為了容易理解,這里一并對(duì)它們進(jìn)行說(shuō)明。
步驟S2401使MFP100中的圖象讀取部110動(dòng)作,對(duì)一張?jiān)暹M(jìn)行光柵狀掃描,以獲得具有預(yù)定分辨率和預(yù)定濃度水平的圖象讀取信號(hào)。圖象讀取信號(hào)由數(shù)據(jù)處理部115進(jìn)行前處理,作為輸入圖象的一頁(yè)圖象數(shù)據(jù),存儲(chǔ)在存儲(chǔ)裝置111處。隨后進(jìn)入至步驟S2402。
步驟S2402(塊選擇步驟)通過(guò)管理PC101,將存儲(chǔ)在存儲(chǔ)裝置111處的圖象數(shù)據(jù)區(qū)域,分為包含文字或線條的文字·線條區(qū)域、半色調(diào)照片區(qū)域、不定形的圖形區(qū)域。隨后,將文字·線條區(qū)域進(jìn)一步分離成主要包含文字的文字區(qū)域,和主要包含表格、圖形等的線條區(qū)域,并且將線條區(qū)域分離成表格區(qū)域和圖形區(qū)域。本實(shí)施方式是對(duì)連結(jié)象素進(jìn)行檢測(cè),利用該連結(jié)象素的外接矩形區(qū)域的形狀、尺寸、象素密度等等,按屬性進(jìn)行各區(qū)域的分割,然而也可以采用其它的區(qū)域分割方法。
對(duì)于文字區(qū)域,可以將文字段落組合構(gòu)成塊作為塊分段為矩形塊(文字區(qū)域矩形塊),對(duì)于線條區(qū)域,可以按各表格、圖形等的對(duì)象(表格區(qū)域矩形塊,線條區(qū)域矩形塊)分段成矩形塊。
按半色調(diào)表示的照片區(qū)域,可以按圖象區(qū)域矩形塊、背景區(qū)域矩形塊等對(duì)象,分段成矩形塊。
這些矩形塊的信息被稱為“區(qū)域分割信息”。
步驟S2403判斷在輸入圖象中是否嵌入原始數(shù)據(jù)文件的指針信息,并進(jìn)行OCR、OMR處理。
對(duì)作為附加信息記錄在原稿圖象中的二維條形碼,或是與URL相當(dāng)?shù)膶?duì)象進(jìn)行檢測(cè),通過(guò)OCR對(duì)URL進(jìn)行字符識(shí)別處理,通過(guò)OMR對(duì)二維條形碼進(jìn)行解碼,以檢索出存儲(chǔ)有輸入圖象的原始數(shù)據(jù)文件的存儲(chǔ)裝置內(nèi)的指針信息。
附加指針信息的裝置并不僅限于二維條形碼,還可以采用嵌入作為相鄰文字列間隔變化的信息的方法,在半色調(diào)圖象中嵌入信息等、嵌入肉眼不能直接識(shí)別的所謂電子水印的方法等等。
步驟S2404(指針信息提取步驟)從在步驟S2403獲得的OCR、OMR或電子水印信息中,提取出指針信息。
步驟S2405判斷是否通過(guò)步驟S2404獲得了指針信息。當(dāng)獲得有指針信息時(shí),沿程序分路進(jìn)入至步驟S2406,以直接訪問(wèn)原始數(shù)據(jù)文件。
當(dāng)通過(guò)步驟S2404沒(méi)有提取出指針信息時(shí),進(jìn)入至步驟S2407。
步驟S2406當(dāng)提取出指針信息時(shí),利用該指針信息對(duì)原始數(shù)據(jù)文件(電子文件)進(jìn)行檢索。原始數(shù)據(jù)文件呈電子文件形式,存儲(chǔ)在諸如圖1所示的客戶端PC102的硬盤內(nèi),文檔管理服務(wù)器106的數(shù)據(jù)庫(kù)105內(nèi),或是設(shè)置在MFP100處的存儲(chǔ)裝置111中等,所以可以依據(jù)通過(guò)步驟S2406獲得的地址信息(指針信息),在這些存儲(chǔ)裝置內(nèi)進(jìn)行檢索。當(dāng)作為檢索結(jié)果,不能獲得原始數(shù)據(jù)文件,或是所提取出的原始數(shù)據(jù)文件為光柵型數(shù)據(jù)文件,或BMP、tiff等對(duì)光柵數(shù)據(jù)進(jìn)行編碼處理獲得的圖象數(shù)據(jù)文件時(shí),沿程序分路進(jìn)入至步驟S2407。對(duì)于可以提取出原始數(shù)據(jù)文件的場(chǎng)合,轉(zhuǎn)移至步驟S2416中。
步驟S2407、步驟S2408在操作畫(huà)面116中顯示出如圖26所示的畫(huà)面,并且向用戶詢問(wèn)是否進(jìn)行矢量化處理。在如圖26所示的畫(huà)面中,顯示有諸如“進(jìn)行矢量化處理?”等等的詢問(wèn)信息,以及諸如“馬上進(jìn)行”按鈕2601,“以后進(jìn)行”按鈕2602,“不進(jìn)行”按鈕2603。對(duì)于“馬上進(jìn)行”按鈕2601被壓下的場(chǎng)合,隨即進(jìn)行矢量化處理,該處理經(jīng)過(guò)步驟S2408,進(jìn)入至步驟S2409。對(duì)于“以后進(jìn)行”按鈕2602被壓下的場(chǎng)合,將狀態(tài)設(shè)為“LATER”并將暫時(shí)的存儲(chǔ)地址登錄在矢量化處理表中,隨后當(dāng)滿足諸如MFP100的負(fù)載減輕(包括全部作業(yè)均未進(jìn)行的狀態(tài))等等預(yù)定條件時(shí),進(jìn)行矢量化處理,而且在用戶不會(huì)注意到矢量化處理的等待時(shí)間的定時(shí),通過(guò)圖25所示的同時(shí)的矢量化處理來(lái)進(jìn)行矢量化。對(duì)于“不進(jìn)行”按鈕2603被壓下的場(chǎng)合,將狀態(tài)設(shè)置為“NO”并結(jié)束程序。
按鈕2601~2603的選擇被記錄在圖27所示的矢量處理表中。在后面將對(duì)該矢量處理表進(jìn)行詳細(xì)說(shuō)明。
步驟S2409執(zhí)行文件檢索例程。利用通過(guò)步驟S2403的OCR處理提取出的單詞,在數(shù)據(jù)庫(kù)105中進(jìn)行全文檢索,或是依據(jù)矩形塊的布局和對(duì)象的屬性,進(jìn)行布局檢索。
步驟S2410當(dāng)通過(guò)步驟S2409的檢索,提取出多個(gè)類似程度高的原始數(shù)據(jù)文件候補(bǔ)的場(chǎng)合,可以在顯示畫(huà)面116上通過(guò)縮略圖等等進(jìn)行顯示,以提示用戶進(jìn)行選擇。對(duì)于作為候補(bǔ)的原始數(shù)據(jù)文件為一個(gè)時(shí),可以由步驟S2411自動(dòng)轉(zhuǎn)移至步驟S2416,并且將所提取出的原始數(shù)據(jù)文件的地址,通知給MFP100。
步驟S2411判斷通過(guò)步驟S2409或步驟S2410是否指定出一個(gè)數(shù)據(jù)文件。當(dāng)指定出一個(gè)數(shù)據(jù)文件時(shí),轉(zhuǎn)移入步驟S2416,當(dāng)未提取出數(shù)據(jù)文件時(shí),或是提取出的數(shù)據(jù)文件為圖象數(shù)據(jù)文件時(shí),進(jìn)入至步驟S2412。
步驟S2412(矢量化步驟)對(duì)于未提取出指針信息的場(chǎng)合,轉(zhuǎn)移至矢量化處理,通過(guò)矢量化處理,可以將通過(guò)區(qū)域分割處理分割出的各區(qū)域內(nèi)的圖象數(shù)據(jù)變換為矢量數(shù)據(jù)。
矢量化處理方法可以包括下述方法(a)~方法(f)等等。
(a)當(dāng)區(qū)域?yàn)槲淖謪^(qū)域時(shí),進(jìn)一步通過(guò)OCR進(jìn)行文字圖象的編碼變換,或是對(duì)文字的尺寸、字型、字體進(jìn)行識(shí)別,變換為在視覺(jué)上忠實(shí)于通過(guò)掃描原稿而獲得的文字的字體數(shù)據(jù)。
(b)當(dāng)區(qū)域?yàn)槲淖謪^(qū)域,且不能通過(guò)OCR進(jìn)行識(shí)別時(shí),對(duì)文字輪廓進(jìn)行追蹤,并且變換為將輪廓信息(輪廓)表現(xiàn)為線段關(guān)系的形式。
(c)當(dāng)區(qū)域?yàn)閳D形區(qū)域時(shí),對(duì)圖形對(duì)象的輪廓進(jìn)行追蹤,并且變換為將輪廓信息表現(xiàn)為線段關(guān)系的形式。
(d)將方法(b)、方法(c)中線段形式的輪廓信息通過(guò)貝塞爾函數(shù)等變換為函數(shù)信息。
(e)根據(jù)方法(c)的圖形對(duì)象的輪廓信息,對(duì)圖形形狀進(jìn)行識(shí)別,變換成圓、矩形、多邊形等的圖形定義信息。
(f)當(dāng)區(qū)域?yàn)閳D形區(qū)域且對(duì)象為指定區(qū)域的表格格式時(shí),對(duì)間線和邊線進(jìn)行識(shí)別,并變換為預(yù)定格式的帳單格式信息。
除了上述方法之外,還可以使用將光柵數(shù)據(jù)置于預(yù)定的命令和編碼信息上的各種矢量化處理方法。而且,圖象區(qū)域也可以按諸如JPEG等格式處理。
步驟S2413原封不動(dòng)地使用步驟S2410給出的矢量數(shù)據(jù),將其變換成應(yīng)用數(shù)據(jù)格式并進(jìn)行輸出。一般說(shuō)來(lái),數(shù)據(jù)格式取決于所使用的應(yīng)用程序,有時(shí)需要變換為與使用目的相適應(yīng)的文件格式。
對(duì)于可進(jìn)行編輯等等再次利用的應(yīng)用數(shù)據(jù)格式,可以為諸如文字處理器、表格計(jì)算軟件等等應(yīng)用軟件,例如,可以為微軟公司出品的文字處理器WORD(注冊(cè)商標(biāo))和表格計(jì)算應(yīng)用軟件EXCEL(注冊(cè)商標(biāo))等。這些應(yīng)用程序的使用目的不同,可以相應(yīng)于使用目的對(duì)文件格式進(jìn)行定義,并以該格式對(duì)文件(數(shù)據(jù))進(jìn)行保存。
更為通用的文件格式還包括微軟公司的RTF(富文本格式)格式,近年來(lái)使用的SVG(Scarable Vector Grafics)格式,或是單純處理文本數(shù)據(jù)用的平面文本格式等等已知的格式,可在與其相對(duì)應(yīng)的應(yīng)用程序中通用。
步驟S2414將通過(guò)步驟S2413生成的數(shù)據(jù),作為電子文件存儲(chǔ)在存儲(chǔ)裝置111中。
步驟S2415將與存儲(chǔ)在數(shù)據(jù)庫(kù)105、存儲(chǔ)裝置111處的電子文件相關(guān)的檢索用索引信息存儲(chǔ)在索引文件中。因此,可以按照與通過(guò)步驟S2414新存儲(chǔ)的電子文件相關(guān)的方式,將通過(guò)步驟S2403獲得的字符識(shí)別結(jié)果的文本信息和布局信息等等,作為索引信息登錄在索引文件中。
采用這種方式,即使是掃描登錄的圖象,也能獲得與通過(guò)應(yīng)用軟件生成的文檔文件等相同的檢索性能,即使在不能使用指針信息的狀態(tài)下也能夠進(jìn)行檢索。
步驟S2416對(duì)表示數(shù)據(jù)存儲(chǔ)位置的地址進(jìn)行輸出。通過(guò)步驟S2414將數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置111中時(shí),對(duì)該存儲(chǔ)地址進(jìn)行輸出,在通過(guò)步驟S2406或步驟S2411提取出原始數(shù)據(jù)文件時(shí),通知原始數(shù)據(jù)文件的地址。
步驟S2417對(duì)于檢索出或生成的電子文件的內(nèi)容,由用戶確認(rèn)是否進(jìn)行諸如印刷等等的記錄操作,當(dāng)進(jìn)行記錄操作時(shí)進(jìn)入至步驟S2418,當(dāng)不進(jìn)行記錄操作時(shí)進(jìn)入至步驟S2419。
步驟S2418將指針信息附加在電子文件等中。指針信息的附加方法可以為將二維條形碼附加在輸出圖象上的方法、在文字列中和半色調(diào)圖象中嵌入電子水印的方法等各種公知的方法。
采用這種方式,在對(duì)印刷后的圖象進(jìn)行讀取時(shí),可以直接獲取出指針信息,進(jìn)而訪問(wèn)到原始數(shù)據(jù)文件。
步驟S2419利用通過(guò)如上所述處理獲得的電子文件,進(jìn)行文檔的加工、存儲(chǔ)、傳送、記錄等各種處理。生成的、或取得的電子文件與圖象數(shù)據(jù)文件相比可以壓縮數(shù)據(jù)尺寸,從而可以獲得提高存儲(chǔ)效率、縮短傳送時(shí)間、提高顯示和記錄品質(zhì)等技術(shù)效果。
圖27為表示矢量化處理表的示意圖,在文件ID處登錄有表示作為處理對(duì)象的輸入圖象的“1001”、“1002”等ID序號(hào)1010。在各文件ID的狀態(tài)1011中,登錄有“NO”、“LATER”、“PROCESSING”、“SEARCHING”、“DONE”、“SIMILAR”或“LINK”等。當(dāng)通過(guò)步驟S2407選擇為“以后進(jìn)行”(按鈕2602)時(shí),可以將“LATER”登錄在狀態(tài)中。當(dāng)選擇為“不進(jìn)行”(按鈕2603)時(shí),可以將“NO”寫(xiě)入至狀態(tài)中。
當(dāng)檢測(cè)到滿足諸如MFP100的負(fù)載減輕(包括沒(méi)有負(fù)載時(shí))等等預(yù)定條件時(shí),可以通過(guò)圖25所示的程序,進(jìn)行同時(shí)的矢量化處理。
步驟S2501將狀態(tài)1011的內(nèi)容改寫(xiě)為“PROCESSING”,執(zhí)行與圖24中的步驟S2402相同的塊選擇步驟。
步驟S2502隨后,執(zhí)行與圖24中的步驟S2403相同的OCR、OMR處理。
步驟S2503隨后,執(zhí)行與圖24中的步驟S2412相同的矢量化處理。
步驟S2504隨后,執(zhí)行與圖24中的步驟S2413相同的應(yīng)用數(shù)據(jù)變換處理。
步驟S2505執(zhí)行對(duì)生成的電子文件進(jìn)行存儲(chǔ)的處理程序。
步驟S2506隨后,執(zhí)行與圖3中的步驟S2515相同的索引生成處理。在上述步驟S2501~步驟S2506的處理過(guò)程中,一直保持為“PROCESSING”狀態(tài)。
步驟S2507將狀態(tài)改寫(xiě)為“SEARCHING”,執(zhí)行與圖24中的步驟S2409相同的、依據(jù)前述矢量化處理后的輸入圖象進(jìn)行文件檢索的處理。當(dāng)不能提取出該矢量化處理后的輸入圖象之外的電子文件時(shí),將狀態(tài)1011改寫(xiě)為“DONE”,將通過(guò)步驟S2505進(jìn)行存儲(chǔ)的矢量數(shù)據(jù)的地址信息寫(xiě)入指針信息1013。
步驟S2508當(dāng)由步驟2507提取到對(duì)該矢量化處理后的輸入圖象之外的電子文件時(shí),將狀態(tài)改寫(xiě)為“SIMILAR”,將電子文件的指針信息寫(xiě)入指針信息1013。
步驟S2509判斷對(duì)全部未處理輸入圖象的處理是否已經(jīng)結(jié)束,對(duì)于已經(jīng)結(jié)束的場(chǎng)合,結(jié)束處理。對(duì)于還存在有未處理的輸入圖象的場(chǎng)合,返回至步驟S2501。
下面對(duì)圖24中的主要步驟進(jìn)行詳細(xì)說(shuō)明。
《塊選擇步驟》在步驟S2402(塊選擇步驟)中,將作為如圖4中右半部所示圖象的輸入圖象按屬性分割成矩形塊。如上所述,矩形塊的屬性包括文本(TEXT)/圖形(PICTURE)/線條(Line)/表格(Table)/照片(PHOTO)等等。
在塊選擇處理步驟中,可以首先對(duì)輸入圖象進(jìn)行黑白二值化處理,提取出由黑色象素輪廓包繞著的象素塊。
對(duì)如此提取出的黑色象素塊的大小進(jìn)行估計(jì),當(dāng)其對(duì)位于大小大于或等于預(yù)定值的黑色象素塊內(nèi)部的白色象素塊進(jìn)行輪廓跟蹤。為了對(duì)白色象素塊的大小進(jìn)行估計(jì)和跟蹤內(nèi)部黑色象素塊,將內(nèi)部象素塊限定為大于或等于預(yù)定值,并遞歸地進(jìn)行內(nèi)部象素塊的提取、輪廓跟蹤。
象素塊的大小可以利用諸如象素塊的面積進(jìn)行估計(jì)。
生成與采用這種方式獲得的象素塊外接的矩形塊,并且依據(jù)該矩形塊的大小、形狀對(duì)其屬性進(jìn)行判定。
例如,縱橫比接近1、大小位于一定范圍的矩形塊具有作為文字區(qū)域矩形塊的可能性,從而將其作為文字相當(dāng)塊,當(dāng)彼此接近的文字相當(dāng)塊規(guī)則排列時(shí),可以將這些文字相當(dāng)塊合并在一起生成新的矩形塊,并且將新的矩形塊作為文字區(qū)域矩形塊。
而且,可以將扁平的象素塊作為線條區(qū)域矩形塊,將大于或等于一定大小的、呈四方形且在內(nèi)部規(guī)則地包含有白色象素塊的黑色象素塊作為表格區(qū)域矩形塊,將分散有不定形象素塊的區(qū)域作為照片區(qū)域矩形塊,將除此之外的其它不定形的象素塊作為圖象區(qū)域矩形塊。
通過(guò)塊選擇處理步驟,可以依據(jù)按照這種方式生成的塊,生成如圖5所示的、諸如屬性等等的塊信息和輸入文件信息。
在圖5中,塊信息包含各塊屬性、位置坐標(biāo)X、坐標(biāo)Y、寬度W、高度H、OCR信息??梢詫傩再x予數(shù)值1~5,并且使數(shù)值1表示文字區(qū)域矩形塊,使數(shù)值2表示圖象區(qū)域矩形塊,使數(shù)值3表示表格區(qū)域矩形塊,使數(shù)值4表示線條區(qū)域矩形塊,使數(shù)值5表示照片區(qū)域矩形塊。坐標(biāo)X、坐標(biāo)Y表示的是輸入圖象中各矩形塊的始點(diǎn)坐標(biāo)X、坐標(biāo)Y(左上角處的坐標(biāo))。寬度W、高度H表示的是矩形塊沿坐標(biāo)X方向的寬度,沿坐標(biāo)Y方向的高度,OCR信息表示的是在輸入圖象中是否存在有指針信息用的信息。
而且,還可以包含有作為輸入文件信息的、表示矩形塊個(gè)數(shù)的總塊數(shù)N。
這些塊中每一個(gè)的塊信息用于指定領(lǐng)域中的矢量化。依據(jù)這種塊信息,可以指定出指定領(lǐng)域與其它領(lǐng)域進(jìn)行合成時(shí)的相對(duì)位置關(guān)系,從而可以在不損壞輸入圖象布局的條件下,對(duì)矢量化領(lǐng)域和光柵數(shù)據(jù)領(lǐng)域進(jìn)行合成。
《指針信息提取步驟》步驟S2404(指針信息提取步驟)可以通過(guò)圖6所示的各步驟進(jìn)行。圖7表示的是作為指針信息提取步驟的處理對(duì)象的原稿310,該原稿310可以存儲(chǔ)在數(shù)據(jù)處理部115內(nèi)部的頁(yè)存儲(chǔ)器(圖中未示出)中。在原稿310中記錄有文字區(qū)域矩形塊312、313,照片區(qū)域矩形塊314,二維條形碼(QR編碼)的符號(hào)311。對(duì)于圖6中各步驟的處理,這里省略了詳細(xì)說(shuō)明(請(qǐng)參見(jiàn)實(shí)施方式1)。
組入二維條形碼中的數(shù)據(jù)表示的是原始數(shù)據(jù)文件的指針信息,可以由諸如由文件服務(wù)器名和文件名構(gòu)成的路徑信息構(gòu)成?;蛘?,可以由指向?qū)?yīng)文件的URL等或存儲(chǔ)文件的數(shù)據(jù)庫(kù)105內(nèi)或存儲(chǔ)裝置111內(nèi)的文件ID等等構(gòu)成。
本實(shí)施方式是以附加有二維條形碼形式的指針信息的原稿310為例進(jìn)行說(shuō)明的,然而也可以采用各種各樣的指針信息記錄形式。
例如,可以依據(jù)預(yù)定規(guī)則,通過(guò)文字列直接將指針信息記錄在文字列中,也可以通過(guò)塊選擇步驟對(duì)文字列的矩形塊進(jìn)行檢索。通過(guò)對(duì)檢索出的文字列進(jìn)行識(shí)別的方式,獲取出指針信息。
或者,在文字區(qū)域矩形塊312和文字區(qū)域矩形塊313中,可以按照難以通過(guò)肉眼識(shí)別的程度對(duì)相鄰文字列間的間隔進(jìn)行調(diào)制,利用該文字列間隔的調(diào)制信息表示出指針信息。通過(guò)這種方式形成的水印信息,在進(jìn)行如后所述的字符識(shí)別處理時(shí),可以通過(guò)對(duì)各文字間隔進(jìn)行檢測(cè)的方式將其檢測(cè)出來(lái),從而可以獲取到指針信息。而且,在照片區(qū)域矩形塊314中,也可以附加上作為電子水印的指針信息。
《利用指針信息進(jìn)行的電子文件檢索》在圖24的步驟S2408、步驟S2411中,可以利用圖28所示的各步驟,進(jìn)行利用指針信息進(jìn)行的電子文件檢索。
步驟S2801依據(jù)包含有指針信息的地址,指定文件服務(wù)器??梢詫⒖蛻舳薖C102、數(shù)據(jù)庫(kù)105、文檔管理服務(wù)器106、內(nèi)裝有存儲(chǔ)裝置111的MFP100中的至少一個(gè)作為文件服務(wù)器使用。地址可以是URL,或由服務(wù)器名和文件名組成的路徑信息。
步驟S2802相對(duì)通過(guò)步驟S2801指定的文件服務(wù)器,進(jìn)行地址傳送。
步驟S2803通過(guò)步驟S2801指定的文件服務(wù)器,對(duì)通過(guò)步驟S2802傳送來(lái)的地址進(jìn)行接收,進(jìn)而依據(jù)該地址對(duì)原始數(shù)據(jù)文件進(jìn)行檢索。
步驟S2804判斷通過(guò)步驟S2803進(jìn)行的文件檢索,能否提取出原始數(shù)據(jù)文件。當(dāng)可提取出文件時(shí)進(jìn)入至步驟S2805,當(dāng)不能提取出文件時(shí)進(jìn)入至步驟S2806。
步驟S2805按照參考圖24說(shuō)明過(guò)的那樣,將文件的地址通知至MFP100,當(dāng)用戶希望獲取到原始文件數(shù)據(jù)時(shí),還可以將原始數(shù)據(jù)文件傳送至MFP100處。由此結(jié)束處理。
步驟S2806當(dāng)通過(guò)步驟S2803不能提取出文件時(shí),將表示這一內(nèi)容的信息通知給MFP100,結(jié)束處理。
《文件檢索處理》對(duì)于輸入圖象未包含指針信息的場(chǎng)合,或是不能利用指針信息提取出電子文件的場(chǎng)合,執(zhí)行如圖24中的步驟S2409所示的文件檢索處理??梢酝ㄟ^(guò)組合使用諸如關(guān)鍵詞檢索處理、全文檢索處理、布局檢索處理、條件限制檢索處理等多種檢索方法,進(jìn)行這種文件檢索處理。
關(guān)鍵詞檢索處理是一種利用作為檢索對(duì)象的圖象數(shù)據(jù)的檢索關(guān)鍵詞,對(duì)按照將與數(shù)據(jù)庫(kù)內(nèi)的各電子文件相關(guān)聯(lián)的關(guān)鍵詞預(yù)先進(jìn)行登錄的索引文件進(jìn)行檢索(完全一致檢索或模糊一致檢索)的處理。
檢索關(guān)鍵詞可以包括通過(guò)步驟S2403的OCR處理從輸入圖象中提取出的文字單詞,嵌入在電子水印中的單詞等等。
全文檢索處理是一種利用關(guān)鍵詞檢索處理使用的檢索關(guān)鍵詞,對(duì)原始數(shù)據(jù)文件的全部文本信息進(jìn)行檢索的處理,并且判定所提取出的檢索關(guān)鍵詞數(shù)目越多,類似程度越高。
下面參考圖29,對(duì)布局檢索處理方法進(jìn)行說(shuō)明。
《布局檢索處理》可以通過(guò)如圖29所示的各步驟,進(jìn)行布局檢索處理。
這里,作為步驟S2402的結(jié)果的、所提取出的各矩形塊和輸入圖象數(shù)據(jù)具有如圖27所示的塊信息和輸入文件信息。
例如,在塊信息中矩形塊按照坐標(biāo)X從小到大的順序排列,即塊1、塊2、塊3、塊4、塊5、塊6的坐標(biāo)X滿足,X1≤X2≤X3≤X4≤X5≤X6的關(guān)系。使用這些信息,利用如圖29所示的各步驟,可以執(zhí)行從數(shù)據(jù)庫(kù)中檢索與輸入圖象類似的文件的布局檢索的處理。這里,以數(shù)據(jù)庫(kù)文件具有與圖26所示相同的信息為前提。利用該程序可以將塊信息和輸入文件信息與數(shù)據(jù)庫(kù)中的文件依次進(jìn)行比較。
步驟S2901對(duì)如后所述的相似性等等進(jìn)行初始化處理。
步驟S2902隨后,對(duì)與輸入圖象的總塊數(shù)N之間的差是否在預(yù)定值以內(nèi),即在位于數(shù)據(jù)庫(kù)內(nèi)的數(shù)據(jù)文件中,是否存在具有滿足N-ΔN<n<N+ΔN的n個(gè)總塊數(shù)的數(shù)據(jù)文件。如果可以檢索提取出滿足條件的數(shù)據(jù)文件,則進(jìn)入至步驟S2903,對(duì)該檢索提取出的數(shù)據(jù)文件內(nèi)的矩形塊信息和輸入圖象內(nèi)的塊依次進(jìn)行比較。在另一方面,當(dāng)總塊數(shù)的差比較大時(shí),進(jìn)入至步驟S2914。在對(duì)矩形塊進(jìn)行信息比較的過(guò)程中,可通過(guò)步驟S2903~步驟S2909,分別對(duì)屬性相似性、尺寸相似性、OCR相似性進(jìn)行計(jì)算,并且可以依據(jù)這些相似性,通過(guò)步驟S2911計(jì)算出作為該比較對(duì)象的數(shù)據(jù)文件的綜合相似性。
步驟S2903將輸入圖象的塊屬性和通過(guò)步驟S2902提取出的數(shù)據(jù)庫(kù)文件的塊屬性進(jìn)行比較。當(dāng)塊屬性一致時(shí)進(jìn)入至步驟S2904,當(dāng)塊屬性不一致時(shí)進(jìn)入至步驟S2910,判斷對(duì)輸入圖象中全部塊的比較操作是否已經(jīng)結(jié)束。
步驟S2904對(duì)于在步驟S2903比較的、關(guān)于塊信息的屬性的屬性相似性進(jìn)行更新。屬性相似性的計(jì)算方法,可以是在先技術(shù)所采用的各種方法。例如,可以依據(jù){(屬性一致的塊數(shù))/(總塊數(shù))}進(jìn)行計(jì)算。
步驟S2905將輸入圖象的塊信息中的尺寸(寬度W、高度H)和通過(guò)步驟S2902提取出的數(shù)據(jù)庫(kù)文件的尺寸(寬度w、高度h)進(jìn)行比較。判斷尺寸的差是否位于預(yù)定范圍內(nèi),即判斷是否滿足W-ΔW<w<W+ΔW和H-ΔH<h<H+ΔH。當(dāng)位于預(yù)定范圍內(nèi)時(shí)進(jìn)入至步驟S2906,當(dāng)未位于預(yù)定范圍內(nèi)時(shí)進(jìn)入至步驟S2910,判斷對(duì)輸入圖象中全部塊的比較處理是否已經(jīng)結(jié)束。
步驟S2906對(duì)于在步驟S2905中比較的塊信息的尺寸,對(duì)尺寸相似性進(jìn)行更新。尺寸相似性的計(jì)算方法可以采用現(xiàn)有的任意方法,例如,可以通過(guò){1-(尺寸差)/(輸入圖象數(shù)據(jù)中該塊尺寸)}求解出各塊的尺寸相似性,而且可以通過(guò)對(duì)該數(shù)據(jù)文件求解尺寸相似性平均值的方式進(jìn)行計(jì)算。
步驟S2907判斷在輸入圖象的塊信息以及通過(guò)步驟S2902提取出的數(shù)據(jù)文件的塊信息中的OCR信息是否為“有”。當(dāng)兩者的OCR信息均為“有”時(shí)進(jìn)入至步驟S2908,當(dāng)OCR信息為“無(wú)”時(shí)進(jìn)入至步驟S2910,判斷對(duì)輸入圖象中全部塊的比較處理是否已經(jīng)結(jié)束。
步驟S2908對(duì)輸入圖象的塊信息中的OCR信息和通過(guò)步驟S2902提取出的數(shù)據(jù)文件的OCR信息進(jìn)行比較。
步驟S2909對(duì)于在步驟S2908中比較的OCR信息,對(duì)OCR信息相似性進(jìn)行計(jì)算。OCR信息相似性的計(jì)算方法可以是在先技術(shù)所采用的各種方法。例如,可以對(duì)各塊的識(shí)別結(jié)果文字彼此進(jìn)行比較,通過(guò)求解識(shí)別結(jié)果一致率等方式進(jìn)行求解。
步驟S2910判斷包含在輸入圖象中的全部塊與數(shù)據(jù)文件中各塊的比較處理是否已經(jīng)結(jié)束。當(dāng)對(duì)全部塊的處理結(jié)束時(shí)進(jìn)入至步驟S2911,當(dāng)尚存在有未處理的塊時(shí),經(jīng)由步驟S2915,返回至進(jìn)行塊比較處理用的步驟S2903處。
步驟S2911依據(jù)屬性相似性、尺寸相似性、OCR相似性對(duì)綜合相似性進(jìn)行計(jì)算。例如,綜合相似性的計(jì)算方法,可以是對(duì)各相似性施加預(yù)定權(quán)重,進(jìn)而求和的計(jì)算方法。
步驟S2912判斷綜合相似性是否高于預(yù)先設(shè)定的閾值Th。如果綜合相似性高于閾值Th則進(jìn)入至步驟S2913,如果綜合相似性不高于閾值Th則進(jìn)入至步驟S2914。
步驟S2913將通過(guò)步驟S2912判斷為綜合相似性高于閾值的數(shù)據(jù)庫(kù)中的數(shù)據(jù)文件,作為類似候補(bǔ)進(jìn)行保存。
步驟S2914判斷對(duì)數(shù)據(jù)庫(kù)中的全部數(shù)據(jù)文件的處理是否已經(jīng)結(jié)束。當(dāng)全部數(shù)據(jù)庫(kù)文件的處理已經(jīng)結(jié)束時(shí),直接結(jié)束整個(gè)處理,當(dāng)尚殘存有未處理的數(shù)據(jù)庫(kù)文件時(shí),經(jīng)由步驟S2916返回至步驟S2901。
步驟S2915為了將數(shù)據(jù)文件中的每個(gè)塊信息與輸入圖象的全部塊信息進(jìn)行比較,使下一塊作為比較對(duì)象塊。
步驟S2916為了對(duì)數(shù)據(jù)庫(kù)中各數(shù)據(jù)文件進(jìn)行依次比較,取下一數(shù)據(jù)文件作為比較對(duì)象。
在圖29中,參考標(biāo)號(hào)N、W、H分別為輸入圖象的總塊數(shù)、各塊寬度、各塊高度,參考標(biāo)號(hào)ΔN、ΔW、ΔH分別為以輸入圖象的塊信息為基準(zhǔn)的允許范圍。參考標(biāo)號(hào)n、w、h分別為數(shù)據(jù)庫(kù)文件的總塊數(shù)、各塊寬度、各塊高度。
雖然圖中未示出,然而通過(guò)步驟S2905對(duì)尺寸進(jìn)行比較時(shí),也可以對(duì)坐標(biāo)X、坐標(biāo)Y的位置信息進(jìn)行比較等。
通過(guò)以上多種檢索方式獲得的檢索結(jié)果作為各種相似性分值而被數(shù)值化,最終的檢索結(jié)果為將各分值的加權(quán)和值作為綜合檢索相似性進(jìn)行估計(jì)。
將綜合檢索相似性與預(yù)定的閾值進(jìn)行比較,將分值高于閾值的電子文件作為檢索對(duì)象候補(bǔ)。當(dāng)提取出多個(gè)候補(bǔ)時(shí),可通過(guò)步驟S2410進(jìn)行候補(bǔ)的選擇處理。
《矢量化步驟》通過(guò)步驟S2412(矢量化步驟),當(dāng)文件服務(wù)器中不存在原始數(shù)據(jù)文件時(shí),對(duì)圖4中右半側(cè)的圖象數(shù)據(jù),按各矩形塊進(jìn)行矢量化處理。當(dāng)矩形塊為文字區(qū)域矩形塊時(shí),對(duì)矢量化處理后的各文字進(jìn)行字符識(shí)別處理。
可通過(guò)圖30中的各步驟進(jìn)行矢量化處理。
步驟S3001判斷指定區(qū)域是否為文字區(qū)域矩形塊,如果是文字區(qū)域矩形塊,進(jìn)入至步驟S3002以下的步驟,利用圖案匹配的方法進(jìn)行識(shí)別,以獲得相對(duì)應(yīng)的文字代碼。當(dāng)指定區(qū)域不是文字區(qū)域矩形塊時(shí),轉(zhuǎn)移至步驟S3012。
步驟S3002為了對(duì)指定區(qū)域進(jìn)行是橫向筆畫(huà)區(qū)域還是縱向筆畫(huà)區(qū)域的判定(布局方向的判定),取得相對(duì)于指定區(qū)域內(nèi)的象素值的水平、垂直投影。
步驟S3003對(duì)于步驟S3002取得的投影的分散程度進(jìn)行估計(jì)。對(duì)于水平投影的分散程度比較大的場(chǎng)合判斷其為橫向筆畫(huà)區(qū)域,對(duì)于垂直投影的分散程度比較大的場(chǎng)合判斷其為縱向筆畫(huà)區(qū)域。
步驟S3004依據(jù)步驟S3003的評(píng)價(jià)結(jié)果,判定布局方向,進(jìn)行行切割,隨后切割出文字以獲得文字圖象。
對(duì)文字列和文字的分解,如果為橫向筆畫(huà)區(qū)域可以利用沿水平方向的投影切割成行,并根據(jù)切割出的行沿垂直方向的投影切割出文字。對(duì)于為縱向筆畫(huà)的文字區(qū)域,可以對(duì)水平和垂直的操作進(jìn)行反轉(zhuǎn)。而且,還可以在對(duì)文字進(jìn)行切割時(shí),也對(duì)文字尺寸進(jìn)行檢測(cè)。
步驟S3005關(guān)于通過(guò)步驟S3004切割出的各文字,生成將從文字圖象獲得的特征變換為數(shù)十維數(shù)值列的觀測(cè)特征矢量??梢酝ㄟ^(guò)各種公知的方法進(jìn)行這種特征矢量的提取操作,例如,可以采用將文字分割成篩網(wǎng)形狀,將各個(gè)篩網(wǎng)內(nèi)的文字線段作為線段元素沿不同方向進(jìn)行計(jì)數(shù),并將獲得的篩網(wǎng)多維矢量作為特征矢量的方法。
步驟S3006將由步驟S3005獲得的觀測(cè)特征矢量與預(yù)先按各種文字種類準(zhǔn)備的詞典特征矢量進(jìn)行比較,對(duì)觀測(cè)特征矢量與詞典特征矢量間的距離進(jìn)行計(jì)算。
步驟S3007對(duì)通過(guò)步驟S3006計(jì)算出的距離進(jìn)行估計(jì),將距離最小的文字種類作為識(shí)別結(jié)果。
步驟S3008在步驟S3007的距離估計(jì)中,判斷最短距離是否大于預(yù)定值。對(duì)于該距離大于預(yù)定值的場(chǎng)合,被誤識(shí)別為詞典特征矢量中形狀類似的其它文字的可能性比較高。因此,對(duì)于該距離大于預(yù)定值的場(chǎng)合,不采用步驟S3007給出的識(shí)別結(jié)果,而是進(jìn)入步驟S3011進(jìn)行進(jìn)一步處理。當(dāng)該距離小于預(yù)定值時(shí),采用步驟S3007給出的識(shí)別結(jié)果,進(jìn)入步驟S3009。
步驟S3009(字體識(shí)別步驟)相對(duì)于文字形狀種類即字體種類,準(zhǔn)備多種在進(jìn)行字符識(shí)別時(shí)使用的、文字種類的詞典特征矢量,在進(jìn)行圖案匹配時(shí),可以與文字編碼一并輸出字體種類,以便能夠識(shí)別出文字字體。
步驟S3010利用通過(guò)字符識(shí)別和字體識(shí)別獲得的文字編碼和字體信息,利用預(yù)先準(zhǔn)備出的輪廓數(shù)據(jù)將各文字變換為矢量數(shù)據(jù)。對(duì)于輸入圖象為彩色的場(chǎng)合,還可以從彩色圖象中提取出各文字的顏色,作為矢量數(shù)據(jù)進(jìn)行記錄。
步驟S3011象常規(guī)線條一樣對(duì)文字進(jìn)行處理,將該文字輪廓化。即對(duì)于產(chǎn)生誤識(shí)別可能性比較高的文字,生成視覺(jué)上忠實(shí)于圖象數(shù)據(jù)的輪廓的矢量數(shù)據(jù)。
步驟S3012當(dāng)指定區(qū)域不是文字區(qū)域矩形塊時(shí),依據(jù)圖象輪廓進(jìn)行矢量化處理。
采用如上所述的處理方式,可以將文字區(qū)域塊所屬的圖象信息忠實(shí)地按其大致形狀、大小、顏色變換成矢量數(shù)據(jù)。
《對(duì)文字區(qū)域之外的其它區(qū)域進(jìn)行的矢量化處理》當(dāng)步驟S3012判斷為文字區(qū)域矩形塊之外的區(qū)域,即為圖形區(qū)域塊、線條區(qū)域矩形塊、表格區(qū)域矩形塊等時(shí),可以將由指定區(qū)域中提取出的黑色象素塊的輪廓變換為矢量數(shù)據(jù)。
在對(duì)文字區(qū)域之外的區(qū)域進(jìn)行矢量化處理時(shí),由于線條等等是由直線和/或曲線組合構(gòu)成的,所以對(duì)將曲線區(qū)分為多個(gè)區(qū)間(象素列)的“角”進(jìn)行檢測(cè)。角是曲率極大的點(diǎn),可以按照下述方式對(duì)圖31中曲線上的象素Pi是否為角進(jìn)行判斷。
即,以點(diǎn)Pi為起點(diǎn),通過(guò)線段L連接沿曲線從點(diǎn)Pi朝向兩個(gè)方向相距預(yù)定象素(k個(gè))的象素Pi-k和Pi+k。當(dāng)象素Pi-k和Pi+k間的距離取為d1,線段L與象素Pi間的距離取為d2,曲線上象素Pi-k和Pi+k間的弧長(zhǎng)取為A時(shí),如果d2非常大,或是比值(d1/A)小于或等于閾值時(shí),判斷象素Pi為角。
將通過(guò)角分割出的象素列近似為直線或曲線。向直線的近似可以通過(guò)最小平方法等等進(jìn)行,向曲線的近似可以利用三次樣條函數(shù)等等進(jìn)行。分割象素列的角的象素構(gòu)成為近似直線或近似直線中的始端或終端。
隨后,判斷在矢量化處理后的輪廓內(nèi)是否存在有白色象素塊的內(nèi)輪廓,當(dāng)存在有這種內(nèi)輪廓時(shí)對(duì)該輪廓進(jìn)行矢量化處理,當(dāng)內(nèi)輪廓中仍存在有內(nèi)輪廓,遞歸地對(duì)反轉(zhuǎn)象素的內(nèi)輪廓進(jìn)行矢量化處理。
通過(guò)如上所述的方式,采用輪廓的區(qū)分線近似線,可以對(duì)呈任意形狀的圖形的輪廓進(jìn)行矢量化處理。對(duì)于原稿為彩色的場(chǎng)合,還可以由彩色圖象中提取出圖形顏色,并作為矢量數(shù)據(jù)進(jìn)行記錄。
正如圖32所示,對(duì)于在某個(gè)關(guān)注區(qū)間的外輪廓PRj與內(nèi)輪廓PRj+1或其它外輪廓相接近的場(chǎng)合,還可以將兩個(gè)或多個(gè)輪廓線組合在一起,用比較粗的線條表示。例如,可以對(duì)從輪廓Pj+1上的各象素Pi至位于輪廓PRj上與其距離最短的象素Qi間的距離PiQi進(jìn)行計(jì)算,對(duì)于距離PiQi僅有比較小的出入的場(chǎng)合,可以沿著象素Pi、Qi的中點(diǎn)Mi構(gòu)成的點(diǎn)列,用直線或曲線對(duì)關(guān)注區(qū)間進(jìn)行近似。近似直線、近似曲線的粗細(xì),可以為距離PiQi的平均值。
作為線與線的集合體的表間線,可以通過(guò)具有比較粗的線集合構(gòu)成,從而可以高效率地表現(xiàn)出矢量。
對(duì)各輪廓處理結(jié)束后,結(jié)束全部處理操作。
而且,對(duì)于照片區(qū)域矩形塊,可以不進(jìn)行矢量化處理,原樣取為圖象數(shù)據(jù)。
《圖形識(shí)別》在以上線段圖形等的輪廓進(jìn)行矢量化處理之后,將矢量化的區(qū)分線按圖形對(duì)象進(jìn)行組合處理。這些圖形元素的組合處理與實(shí)施方式1相同,所以省略了詳細(xì)說(shuō)明。其詳細(xì)內(nèi)容可參見(jiàn)圖13和相應(yīng)的說(shuō)明。
《圖形元素的檢測(cè)》如步驟S1402(圖形元素的檢測(cè))所示的處理,也與實(shí)施方式1相同,所以省略了詳細(xì)說(shuō)明。其詳細(xì)內(nèi)容可參見(jiàn)圖14和相應(yīng)的說(shuō)明。
通過(guò)這種處理的圖形塊,還可以作為可再利用的單獨(dú)圖形對(duì)象而處理。
《向應(yīng)用數(shù)據(jù)的變換處理》在如圖24所示的塊選擇步驟(步驟S2402)之后,利用矢量化處理(步驟S2412)的結(jié)果數(shù)據(jù),通過(guò)步驟S2413進(jìn)行向應(yīng)用數(shù)據(jù)的變換處理。步驟S2412的矢量化處理結(jié)果按如圖15所示的中間數(shù)據(jù)格式,即所謂的文件分析輸出格式(DAOF)進(jìn)行保存。
在圖15中,DAOF由引導(dǎo)部分791、布局描述數(shù)據(jù)部792、字符識(shí)別描述數(shù)據(jù)部793、圖表描述數(shù)據(jù)部794、圖象描述數(shù)據(jù)部795構(gòu)成。對(duì)它們的說(shuō)明與實(shí)施方式1相同,所以省略了詳細(xì)說(shuō)明。
而且,向應(yīng)用數(shù)據(jù)的變換處理也可以采用實(shí)施方式1中如圖16和圖17所示的處理。
通過(guò)圖17中的各步驟,進(jìn)行步驟S8002所示的文檔結(jié)構(gòu)樹(shù)的生成處理。在圖17所示的處理中,作為進(jìn)行整體控制的基本規(guī)則,處理流程由微型塊(單一矩形塊)向宏塊(矩形塊的集合體)轉(zhuǎn)移。下面所稱的“矩形塊”,同時(shí)包括微型塊和宏塊。
步驟S8100按照塊單位,基于沿縱向的相關(guān)性,對(duì)塊進(jìn)行再次組合處理。是否重復(fù)進(jìn)行如圖17所示的處理,可以在開(kāi)始執(zhí)行之后以微型塊為單位進(jìn)行判斷。
這里所稱的相關(guān)性,是按照距離接近、塊寬度(在沿橫行方向設(shè)置時(shí)為高度)大體相等的方式進(jìn)行定義的。而且,參考DAOF提取諸如距離、寬度、高度等等信息。
在如圖18A所示的輸入圖象中,在最上部沿橫向并列設(shè)置有矩形塊T1、T2。在塊T1、T2之下設(shè)置有橫向分割符S1,在橫向分割符S1之下設(shè)置有矩形塊T3、T4、T5、T6、T7。
矩形塊T3、T4、T5在橫向分割符S1的下側(cè)區(qū)域的左半部中,從上至下縱向配置,塊T6、T7在橫向分割符S1的下側(cè)區(qū)域的右半部中上下配置。
依據(jù)步驟S8100給出的沿縱向的相關(guān)性,進(jìn)行組合處理。通過(guò)這種方式,可以將塊T3、T4、T5組合成一個(gè)組(矩形塊)V1,將矩形塊T6、T7組合成一個(gè)組(矩形塊)V2。組V1、V2屬于同一層。
步驟S8102檢查沿縱向是否存在有分割符。分割符是DAOF中具有線段屬性的對(duì)象,具有在應(yīng)用軟件中明確地對(duì)塊進(jìn)行分割的功能。當(dāng)檢查到分割符時(shí),在作為處理對(duì)象的層中,對(duì)輸入圖象區(qū)域以分割符為邊界,進(jìn)行左右分割。在圖18A所示的實(shí)例中不存在縱向分割符。
步驟S8104判斷縱向的組高度總計(jì)值是否與輸入圖象的高度相等。換句話說(shuō)就是,沿縱向(比如說(shuō)由上至下)移動(dòng)處理對(duì)象區(qū)域,同時(shí)沿橫向進(jìn)行組合處理,當(dāng)對(duì)輸入圖象的全部處理操作結(jié)束時(shí),利用組高度總計(jì)值成為輸入圖象高度,進(jìn)行對(duì)處理結(jié)束的判斷操作。當(dāng)組合處理結(jié)束時(shí)直接結(jié)束整個(gè)處理,當(dāng)組合處理未結(jié)束時(shí)進(jìn)入至步驟S8106。
步驟S8106進(jìn)行依據(jù)橫向的關(guān)聯(lián)位置的組合處理。通過(guò)這種方式,可以將矩形塊T1、T2組合成一個(gè)組(矩形塊)H1,將矩形塊V1、V2組合成一個(gè)組(矩形塊)H2。組H1、H2屬于同一層。而且這里,也是在處理開(kāi)始之后立刻以微型塊為單位進(jìn)行判定。
步驟S8108檢查沿橫向是否存在有分割符。當(dāng)檢查到分割符時(shí),在處理對(duì)象層中,將輸入圖象區(qū)域以分割符為邊界進(jìn)行上下分割。在圖18A所示的實(shí)例中存在橫向的分割符S1。
以上處理結(jié)果作為如圖18B所示的樹(shù)結(jié)構(gòu)而被登錄。
在圖18B中,輸入圖象V0具有位于最高層的組H1、H2、分割符S1,在組H1中形成有屬于第二層的矩形塊T1、T2。
在組H2中形成有屬于第二層的組V1、V2,在組V1中形成有屬于第三層的矩形塊T3、T4、T5,在組V2中形成有屬于第三層的矩形塊T6、T7。
步驟S8110判斷沿橫向的組長(zhǎng)度總計(jì)值是否與輸入圖象的寬度相等。采用這種方式,可以判斷橫向上的組合操作是否結(jié)束。對(duì)于沿橫向的組長(zhǎng)度為頁(yè)面寬度的場(chǎng)合,結(jié)束文檔結(jié)構(gòu)樹(shù)的生成處理。對(duì)于沿橫向的組長(zhǎng)度不為頁(yè)面寬度的場(chǎng)合,返回至步驟S8100,再次進(jìn)入至上一層,重復(fù)進(jìn)行縱向相關(guān)性的檢查操作。
通過(guò)如圖18A和圖18B所示的構(gòu)造樹(shù)型結(jié)構(gòu)的階段,可以使沿橫向的分割寬度等于頁(yè)面寬度,所以直接結(jié)束整個(gè)處理,最后將表示整個(gè)頁(yè)面的最高層的V0附加在文檔結(jié)構(gòu)樹(shù)中。
在文檔結(jié)構(gòu)樹(shù)的處理完成之后,依據(jù)該信息,通過(guò)步驟S1703生成應(yīng)用數(shù)據(jù)。
下面對(duì)利用依據(jù)圖18A和圖18B而獲得的應(yīng)用數(shù)據(jù)的應(yīng)用軟件的處理實(shí)例進(jìn)行說(shuō)明。
首先,組H1沿橫向具有兩個(gè)矩形塊T1、T2,所以構(gòu)成為兩列,參考T1的DAOF,對(duì)其內(nèi)部信息(諸如作為字符識(shí)別結(jié)果的文章,圖象等等)進(jìn)行輸出。隨后,進(jìn)行列變換,對(duì)T2的內(nèi)部信息進(jìn)行輸出,再對(duì)分割符S1進(jìn)行輸出。
隨后轉(zhuǎn)移至對(duì)組H2的處理。組H2沿橫向具有兩個(gè)矩形塊V1和V2,所以作為兩列進(jìn)行輸出。對(duì)于組V1,可以按照矩形塊T3、T4、T5的順序進(jìn)行內(nèi)部信息的輸出,隨后進(jìn)行列變換,對(duì)組V2中的矩形塊T6、T7的內(nèi)部信息進(jìn)行輸出。
采用上述方式,可以進(jìn)行向應(yīng)用數(shù)據(jù)的變換處理。
《指針信息的附加處理》由步驟S2418進(jìn)行的指針信息附加處理,是在對(duì)提取出或生成的文件進(jìn)行記錄時(shí),將指針信息附加在記錄紙張上的處理。通過(guò)參考指針信息的方式,可以容易地對(duì)電子文件進(jìn)行提取處理??梢酝ㄟ^(guò)實(shí)施方式1中如圖19所示的處理方式,進(jìn)行指針信息的附加處理。
下面參考圖19所示的流程圖,對(duì)附加二維條形碼(基于JISX0510的QR編碼符號(hào)等等)的指針信息處理方式進(jìn)行說(shuō)明。
二維條形碼包括表示獲取相對(duì)應(yīng)的電子文件的獲取位置的信息。
步驟S900對(duì)表示應(yīng)變換為QR編碼符號(hào)的指針信息的文字進(jìn)行識(shí)別,對(duì)指針信息進(jìn)行分析,同時(shí)對(duì)錯(cuò)誤檢測(cè)和~等級(jí)進(jìn)行設(shè)定,對(duì)可以容納指針信息的最小容量型號(hào)進(jìn)行選擇。
步驟S901將通過(guò)步驟S900進(jìn)行分析后的指針信息變換為預(yù)定比特列,并且可以依據(jù)需要,附加上表示指針信息模式(數(shù)字、英文數(shù)字、8比特字節(jié)、漢字等等)用的指示符和終端圖案。而且,還可以將通過(guò)這種方式獲得的數(shù)據(jù)變換成預(yù)定的比特碼字。
步驟S902按照型號(hào)和~等級(jí),將通過(guò)步驟S901生成的比特碼字列分割為預(yù)定數(shù)目的塊,對(duì)每個(gè)塊生成糾錯(cuò)碼字。而且,還可以將糾錯(cuò)碼字附加在比特碼字列之后。
步驟S903對(duì)通過(guò)步驟S903生成的各塊的比特碼字列進(jìn)行連接,將糾錯(cuò)碼字附加在各塊中。而且在需要時(shí),還可以在各塊的糾錯(cuò)碼字后附加上剩余碼字。采用上述方式,可以生成碼字模塊。
步驟S904將位置檢測(cè)圖案、分離圖案、定時(shí)圖案和位置合成圖案以及碼字模塊配置在預(yù)定的矩陣中。
步驟S905相對(duì)通過(guò)步驟S904生成的矩陣中的符號(hào)編碼區(qū)域,對(duì)最佳掩碼圖案進(jìn)行選擇,并且可以通過(guò)矩陣和掩碼圖案的XOR演算生成模塊步驟S906相對(duì)通過(guò)步驟S905生成的模塊,生成的格式信息和型號(hào)信息,從而完成一個(gè)QR編碼符號(hào)。
按照這種方式組合有地址信息的QR編碼符號(hào),還可以依據(jù)客戶端PC102的請(qǐng)求,在通過(guò)MFP112印刷電子文件時(shí),變換為可在數(shù)據(jù)處理部115內(nèi)進(jìn)行記錄的光柵數(shù)據(jù),并且可以在印刷圖象的預(yù)定位置處形成圖象。
由與圖24中步驟S2404相關(guān)的說(shuō)明可知,可以通過(guò)由圖象讀取裝置110讀取形成圖象后的印刷圖象,獲取出指針信息,進(jìn)而檢測(cè)出電子文件的存儲(chǔ)位置。
<實(shí)施方式3的變形實(shí)例>
下面參考附圖,對(duì)作為根據(jù)本發(fā)明的圖象處理方法的實(shí)施方式3的變形實(shí)例進(jìn)行說(shuō)明。圖24為表示實(shí)施方式3的一種變形實(shí)例的示意性流程圖。
正如圖24所示,通過(guò)涉及矢量化處理的步驟S2407而選擇了“以后進(jìn)行”(按鈕2602)的輸入圖象通過(guò)以后視MFP100的負(fù)載情況進(jìn)行矢量化處理,彈也可以通過(guò)將附加有指針信息的印刷輸出讀取至MFP100中,進(jìn)行同時(shí)的矢量化處理。
在矢量化處理表(參見(jiàn)圖27)中,當(dāng)對(duì)記載了在“LATER”狀態(tài)1011的輸入圖象進(jìn)行記錄(步驟S2417、步驟S2419)時(shí),可以將臨時(shí)設(shè)定的指針信息作為指針信息進(jìn)行記錄。
當(dāng)將記錄有這種臨時(shí)設(shè)定的指針信息的印刷輸出再次讀入至MFP100時(shí),MFP100可以參考各輸入圖象的狀態(tài),與狀態(tài)1011相對(duì)應(yīng)地執(zhí)行如圖33所示的各步驟。
步驟S3301對(duì)印刷輸出進(jìn)行再次讀入,并參照狀態(tài)1011。
步驟S3302當(dāng)通過(guò)步驟S3301參考的狀態(tài)1011為“DONE”時(shí),沿程序分路進(jìn)入至步驟S3303,當(dāng)狀態(tài)1011為“SIMILAR”時(shí),沿程序分路進(jìn)入至步驟S3305,當(dāng)狀態(tài)1011為“LATER”時(shí),沿程序分路進(jìn)入至步驟S3308。
步驟S3303臨時(shí)設(shè)定的指針信息被改寫(xiě)到指向新的矢量化處理結(jié)果的指針中,并進(jìn)入至步驟S3304。
步驟S3304生成附加有新的指針信息的印刷輸出。
步驟S3305按照與圖24中的步驟S2410相同的方式,進(jìn)行電子文件的候補(bǔ)顯示處理/選擇處理。
步驟S3306將選擇出的電子文件的指針信息登錄至矢量處理表中,并進(jìn)入至步驟S3307。
步驟S3307將狀態(tài)1011改寫(xiě)為“LINK”,并進(jìn)入至步驟S3304。
步驟S3308進(jìn)行與圖25中步驟S2501~步驟S2508相同的處理,并進(jìn)入至步驟S3304。
如上所述的實(shí)施方式3,是以對(duì)由圖象讀取部110等等輸入的輸入圖象的處理為例進(jìn)行說(shuō)明的,然而對(duì)于由存儲(chǔ)在存儲(chǔ)媒體中的光柵數(shù)據(jù)或由其編碼數(shù)據(jù)構(gòu)成的圖象數(shù)據(jù)、以及通過(guò)通信裝置供給的圖象數(shù)據(jù)等等輸入圖象之外的其它圖象數(shù)據(jù),也可以有效地應(yīng)用本發(fā)明。
如果采用根據(jù)實(shí)施方式3的發(fā)明,具有用戶不會(huì)意識(shí)到矢量化處理所花費(fèi)的處理的優(yōu)點(diǎn)。
D、實(shí)施方式4圖象處理系統(tǒng)和MFP100可以按照與實(shí)施方式1相類似的方式執(zhí)行,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。
《圖象處理方法的整體流程》根據(jù)實(shí)施方式4構(gòu)造的圖象處理方法,可以按照?qǐng)D34所示的各步驟進(jìn)行。
步驟S3401使MFP100中的圖象讀取部110動(dòng)作,對(duì)一張?jiān)暹M(jìn)行光柵狀掃描,以獲得具有預(yù)定分辨率和預(yù)定濃度水平的圖象讀取信號(hào)。圖象讀取信號(hào)由數(shù)據(jù)處理部115進(jìn)行前處理,并作為輸入圖象的一頁(yè)圖象數(shù)據(jù),存儲(chǔ)在存儲(chǔ)裝置111中。隨后進(jìn)入至步驟S3402。
步驟S3402(塊選擇(區(qū)域分割處理)步驟)通過(guò)管理PC101,將存儲(chǔ)在存儲(chǔ)裝置111處的圖象數(shù)據(jù)區(qū)域,分為包含文字或線條的文字·線條區(qū)域、半色調(diào)照片區(qū)域、不定形的圖形區(qū)域。隨后,將文字·線條區(qū)域進(jìn)一步分離成主要包含文字的文字區(qū)域,和主要包含表格、圖形等的線條區(qū)域,并且將線條區(qū)域分離成表格區(qū)域和圖形區(qū)域。本實(shí)施方式是對(duì)連結(jié)象素進(jìn)行檢測(cè),利用該連結(jié)象素的外接矩形區(qū)域的形狀、尺寸、象素密度等等,按屬性進(jìn)行各區(qū)域的分割,然而也可以采用其它的區(qū)域分割方法。
對(duì)于文字區(qū)域,可以將文字段落組合構(gòu)成塊作為塊分段為矩形塊(文字區(qū)域矩形塊),對(duì)于線條區(qū)域,可以按各表格、圖形等的對(duì)象(表格區(qū)域矩形塊,線條區(qū)域矩形塊)分段成矩形塊。
按半色調(diào)表示的照片區(qū)域,可以按圖象區(qū)域矩形塊、背景區(qū)域矩形塊等對(duì)象,分段成矩形塊。
這些矩形塊的信息被稱為“區(qū)域分割信息”。
步驟S3403對(duì)通過(guò)塊選擇步驟獲得的區(qū)域分割信息和輸入圖象進(jìn)行合成處理,并顯示在MFP100的顯示裝置116的操作畫(huà)面處。
顯示在顯示裝置116處的操作畫(huà)面的一個(gè)實(shí)例如圖4所示。
在該操作畫(huà)面中,左半部顯示的是作為輸入圖象的圖像41,右半部顯示的是表示由矩形塊構(gòu)成的區(qū)域分割信息的圖像42。
在圖像42中,簡(jiǎn)略顯示出了輸入圖象,同時(shí)以矩形形狀表示各矩形塊。
為了使矩形塊的概念容易理解,在各矩形塊中附加了表示其屬性的TEXT、PICTURE、LINE、TABLE等的顯示,然而在實(shí)際使用時(shí),并不顯示出這些屬性信息,而是通過(guò)邊線表示分割后的矩形區(qū)域。
TEXT、PICTURE、LINE、TABLE分別表示的是文字區(qū)域矩形塊、圖象區(qū)域矩形塊、線條區(qū)域矩形塊、表格區(qū)域矩形塊的屬性,還可以采用表示照片區(qū)域矩形塊的PHOTO及其它屬性表示。
在圖4中,是以輸入圖象和區(qū)域分割信息左右并列的方式進(jìn)行顯示的,然而還可以為在輸入圖象上重疊顯示分割后的矩形塊等等各種各樣的顯示方式。
步驟S3404(指定區(qū)域指定步驟)可以依據(jù)用戶的指示,對(duì)于在步驟S3403顯示出的區(qū)域分割信息,將應(yīng)作為矢量化處理對(duì)象的全部矩形塊指定為指定區(qū)域。
例如,對(duì)指定區(qū)域進(jìn)行指定的方法可以為用戶利用指示設(shè)備(圖中未示出),對(duì)圖像42中的一個(gè)或多個(gè)矩形塊進(jìn)行指定的方法。而且,可以采用將操作畫(huà)面116作為觸摸面板,用戶用手指指定所需要的矩形塊的方法等等各種各樣的方法。
步驟S3405將通過(guò)步驟S3404指定的指定區(qū)域作為圖象數(shù)據(jù)進(jìn)行切割,并且對(duì)切割出的圖象數(shù)據(jù)進(jìn)行以下處理。
步驟S3406進(jìn)行OCR、OMR處理,以判斷在指定區(qū)域中是否嵌入了原始數(shù)據(jù)文件的指針信息。
對(duì)作為附加信息記錄在原稿圖象中的二維條形碼,或是與URL相當(dāng)?shù)膶?duì)象進(jìn)行檢測(cè),通過(guò)OCR對(duì)URL進(jìn)行字符識(shí)別處理,通過(guò)OMR對(duì)二維條形碼進(jìn)行解碼,以檢索出存儲(chǔ)有輸入圖象的原始數(shù)據(jù)文件的存儲(chǔ)裝置內(nèi)的指針信息。
附加指針信息的裝置并不僅限于二維條形碼,還可以采用嵌入作為相鄰文字列間隔變化的信息的方法,在半色調(diào)圖象中嵌入信息等、嵌入肉眼不能直接識(shí)別的所謂電子水印的方法等等。
步驟S3407(指針信息提取步驟)從在步驟S3406獲得的OCR、OMR或電子水印信息中,提取出指針信息。
步驟S3408判斷是否獲得了指針信息。當(dāng)獲得有指針信息時(shí),沿程序分路進(jìn)入至步驟S3414以直接獲取原始數(shù)據(jù)文件。
原始數(shù)據(jù)文件呈電子文件形式,存儲(chǔ)在諸如圖1所示的客戶端PC102的硬盤內(nèi)、文檔管理服務(wù)器106的數(shù)據(jù)庫(kù)105內(nèi)、或是設(shè)置在MFP100處的存儲(chǔ)裝置111等等處,可以依據(jù)通過(guò)步驟S308獲得的地址信息(指針信息),在這些存儲(chǔ)裝置內(nèi)進(jìn)行檢索。
步驟S3409(矢量化處理步驟)對(duì)于沒(méi)有提取出指針信息的場(chǎng)合,可以轉(zhuǎn)移至矢量化處理,并通過(guò)矢量化處理將各指定區(qū)域的圖象數(shù)據(jù)變換為矢量數(shù)據(jù)。
矢量化處理方法與實(shí)施方式3相類似,可以包括下述的方法(a)~方法(f)等等。
(a)當(dāng)指定區(qū)域?yàn)槲淖謪^(qū)域時(shí),進(jìn)一步通過(guò)OCR進(jìn)行文字圖象的編碼變換,或是對(duì)文字的尺寸、字型、字體進(jìn)行識(shí)別,變換為在視覺(jué)上忠實(shí)于通過(guò)掃描原稿而獲得的文字的字體數(shù)據(jù)。
(b)當(dāng)指定區(qū)域?yàn)槲淖謪^(qū)域,且不能通過(guò)OCR進(jìn)行識(shí)別時(shí),對(duì)文字輪廓進(jìn)行追蹤,并且變換為將輪廓信息(輪廓)表現(xiàn)為線段關(guān)系的形式。
(c)當(dāng)指定區(qū)域?yàn)閳D形區(qū)域時(shí),對(duì)圖形對(duì)象的輪廓進(jìn)行追蹤,并且變換為將輪廓信息表現(xiàn)為線段關(guān)系的形式。
(d)將方法(b)、方法(c)中線段形式的輪廓信息通過(guò)貝塞爾函數(shù)等變換為函數(shù)信息。
(e)根據(jù)方法(c)的圖形對(duì)象的輪廓信息,對(duì)圖形形狀進(jìn)行識(shí)別,變換成圓、矩形、多邊形等的圖形定義信息。
(f)當(dāng)指定區(qū)域?yàn)閳D形區(qū)或且對(duì)象為指定區(qū)域的表格格式時(shí),對(duì)間線和邊線進(jìn)行識(shí)別,并變換為預(yù)定格式的帳單格式信息。
除了上述方法之外,還可以使用將圖象數(shù)據(jù)置于諸如編碼信息、圖形信息、函數(shù)信息等命令定義型信息中的各種矢量化處理方法。
步驟S3410(文件檢索步驟)當(dāng)未提取出指針信息時(shí),在管理PC101、客戶端PC102上的本機(jī)硬盤或文檔管理服務(wù)器106上的數(shù)據(jù)庫(kù)105中,對(duì)包含有通過(guò)步驟S3404(指定區(qū)域指定步驟)指定的指定區(qū)域信息的數(shù)據(jù)文件或其原始數(shù)據(jù)文件進(jìn)行檢索。
在文件檢索中,可以從通過(guò)步驟S3409(矢量化處理步驟)生成的矢量數(shù)據(jù)中的、依據(jù)對(duì)文字區(qū)域塊進(jìn)行OCR處理的結(jié)果中提取出重要單詞,進(jìn)而通過(guò)全文檢索提取出包含重要單詞的文檔。
或者,也可以從各矢量數(shù)據(jù)中的、諸如是否存在矩形或特殊圖形、是否存在表格格式數(shù)據(jù)、它們的位置關(guān)系和配置等信息中獲取出布局信息,進(jìn)行所謂的布局檢索。
步驟S3411對(duì)于提取出檢索結(jié)果類似度比較高的數(shù)據(jù)文件的場(chǎng)合,通過(guò)縮略圖等等將其作為提取結(jié)果的候補(bǔ)數(shù)據(jù)文件,顯示在顯示畫(huà)面116中。對(duì)于提取出多個(gè)候補(bǔ)數(shù)據(jù)文件等需要用戶進(jìn)行選擇的場(chǎng)合,可以通過(guò)用戶的輸入操作,從候補(bǔ)數(shù)據(jù)文件中指定出原始數(shù)據(jù)文件。對(duì)于候補(bǔ)數(shù)據(jù)文件只有1個(gè)的類似度較高的場(chǎng)合,步驟S3412構(gòu)成為一個(gè)旁路,且可以自動(dòng)地進(jìn)入至步驟S3412中。
步驟S3412判斷通過(guò)步驟S3411提取出的原始數(shù)據(jù)文件是光柵數(shù)據(jù)文件,還是以BMP、tiff為代表的、對(duì)光柵數(shù)據(jù)進(jìn)行編碼處理而獲得的圖象數(shù)據(jù)文件。當(dāng)所提取出的數(shù)據(jù)文件為圖象數(shù)據(jù)文件時(shí),該數(shù)據(jù)文件是與通過(guò)步驟S3401輸入的圖象數(shù)據(jù)相同的數(shù)據(jù)格式,所以在步驟S3413中,可以原樣利用通過(guò)步驟S3409獲得的矢量數(shù)據(jù)而變換為應(yīng)用數(shù)據(jù)格式。
所提取出的數(shù)據(jù)文件為諸如文字編碼和矢量數(shù)據(jù)等等可容易地再次利用的數(shù)據(jù)文件時(shí),可以通過(guò)步驟S3414獲取出數(shù)據(jù)文件。
而且,對(duì)于通過(guò)步驟S3411未選擇到原始數(shù)據(jù)文件的場(chǎng)合,進(jìn)入至步驟S3413,利用通過(guò)步驟S3409獲得的矢量數(shù)據(jù),進(jìn)行向應(yīng)用程序數(shù)據(jù)格式的變換處理。
步驟S3413利用通過(guò)步驟S3409獲得的矢量數(shù)據(jù),進(jìn)行向應(yīng)用程序數(shù)據(jù)格式的變換處理并進(jìn)行輸出。一般說(shuō)來(lái),數(shù)據(jù)格式與所使用的應(yīng)用程序相關(guān),必須變換成對(duì)應(yīng)于應(yīng)用目的的文件格式。
對(duì)于可進(jìn)行編輯等等再次利用的應(yīng)用數(shù)據(jù)格式,可以為諸如文字處理器、表格計(jì)算軟件等等應(yīng)用軟件,例如,可以為微軟公司出品的文字處理器WORD(注冊(cè)商標(biāo))和表格計(jì)算應(yīng)用軟件EXCEL(注冊(cè)商標(biāo))等。這些應(yīng)用程序的使用目的不同,可以相應(yīng)于使用目的對(duì)文件格式進(jìn)行定義,并以該格式對(duì)文件(數(shù)據(jù))進(jìn)行保存。
更為通用的文件格式還包括微軟公司的RTF(富文本格式)格式,近年來(lái)使用的SVG(Scarable Vector Grafics)格式,或是單純處理文本數(shù)據(jù)用的平面文本格式等等已知的格式,可在與其相對(duì)應(yīng)的應(yīng)用程序中通用。
步驟S3414當(dāng)通過(guò)步驟S3407獲取出指針信息時(shí),依據(jù)該指針信息獲取出原始數(shù)據(jù)文件。
在本實(shí)施方式中,可以將用戶指定的指定區(qū)域變換為矢量數(shù)據(jù),將除此之外的區(qū)域作為輸入圖象的圖象數(shù)據(jù),并通過(guò)對(duì)兩者進(jìn)行合成的方式變換為如上所述的應(yīng)用數(shù)據(jù)格式。這時(shí),可以對(duì)指定區(qū)域的輸入圖象中的位置信息進(jìn)行保存,以便可以對(duì)整個(gè)輸入圖象進(jìn)行再現(xiàn)。
如果采用如上所述的這種構(gòu)成形式,可以僅將用戶需要的區(qū)域變換為矢量數(shù)據(jù),并容易地進(jìn)行編輯等等的再次利用。而且,對(duì)于圖象區(qū)域等等未進(jìn)行矢量化處理的區(qū)域,還可以防止出現(xiàn)錯(cuò)誤矢量化處理的問(wèn)題。
下面,對(duì)圖34中的主要步驟進(jìn)行說(shuō)明。對(duì)于與實(shí)施方式1至3進(jìn)行相同處理的場(chǎng)合,為方便而省略了重復(fù)性的詳細(xì)說(shuō)明。
《塊選擇步驟》由塊選擇步驟S3402進(jìn)行的處理,與實(shí)施方式3相同。
《指針信息提取程序》由步驟S3407(指針信息提取步驟)進(jìn)行的處理,也與實(shí)施方式1至3相同。
對(duì)于指針信息的提取處理,本實(shí)施方式可以通過(guò)指定應(yīng)進(jìn)行矢量化處理的指定區(qū)域的方式,快速而準(zhǔn)確地獲取出指針信息。換句話說(shuō)就是,還可以通過(guò)由用戶指定嵌入有條形碼、電子水印等的矩形塊的方式,更高效率地進(jìn)行指針信息的提取處理。
與此相反,對(duì)于未進(jìn)行指定區(qū)域的指定的場(chǎng)合,必需對(duì)整個(gè)輸入圖象進(jìn)行條形碼、電子水印等的所在位置的檢索和提取處理,顯然會(huì)損壞整體的執(zhí)行性能。
《通過(guò)指針信息進(jìn)行的電子文件檢索》由圖34的步驟S3414進(jìn)行的、依據(jù)指針信息進(jìn)行的電子文件檢索,大體上與實(shí)施方式3相同。在下面,簡(jiǎn)單說(shuō)明其執(zhí)行方式。
首先,依據(jù)包含有指針信息的地址,指定文件服務(wù)器,并向文件服務(wù)器發(fā)送出地址。這里的文件服務(wù)器可以是客戶端PC102、內(nèi)裝有數(shù)據(jù)庫(kù)105的文檔管理服務(wù)器106、內(nèi)裝有存儲(chǔ)裝置111的MFP100等等。這里的地址指的是URL以及包含服務(wù)器名和文件名的路徑信息。
接收到地址的文件服務(wù)器依據(jù)該地址進(jìn)行原始數(shù)據(jù)文件的檢索。當(dāng)通過(guò)這種檢索提取出原始數(shù)據(jù)文件時(shí),將文件的地址通知給MFP100,如果用戶希望獲取到原始數(shù)據(jù)文件,將原始數(shù)據(jù)文件傳送至MFP100處。在另一方面,當(dāng)不能從文件服務(wù)器中提取到文件時(shí),將表示這一信息的通知傳送給MFP100。
《矢量化步驟》步驟S3410(矢量化步驟)可以通過(guò)圖30中的各步驟進(jìn)行。矢量化步驟對(duì)于通過(guò)步驟S3409不能從指定區(qū)域中提取出指針信息的場(chǎng)合,對(duì)該指定區(qū)域內(nèi)的圖象數(shù)據(jù)進(jìn)行矢量化處理。而且,這一處理與實(shí)施方式3相同,所以這里省略了對(duì)它們的詳細(xì)說(shuō)明。
采用這種矢量化處理方式,可以將屬于文字區(qū)域矩形塊的圖象信息忠實(shí)地按其大致形狀、大小、顏色變換成矢量數(shù)據(jù)。
《對(duì)文字區(qū)域之外的其它區(qū)域進(jìn)行的矢量化處理》當(dāng)步驟S3012判斷為文字區(qū)域矩形塊之外的區(qū)域,即為圖象區(qū)域矩形塊、線條區(qū)域矩形塊、表格區(qū)域矩形塊等時(shí),將由指定區(qū)域中提取出的黑色象素塊的輪廓變換為矢量數(shù)據(jù)。對(duì)這些文字區(qū)域之外的區(qū)域進(jìn)行的矢量化處理,與實(shí)施方式3相同,其具體說(shuō)明可以參考圖31、圖32和相應(yīng)的說(shuō)明。
《圖形識(shí)別》在對(duì)以上線條圖形等的輪廓進(jìn)行矢量化處理之后,對(duì)矢量化的區(qū)分線按圖形對(duì)象進(jìn)行組合處理。這些處理與實(shí)施方式1至3相同。
《圖形元素的檢測(cè)》而且,圖形識(shí)別處理中的圖形元素檢測(cè)處理,也與實(shí)施方式1至3相同。
這種矢量化處理通常對(duì)整個(gè)輸入圖象進(jìn)行的必要性比較低,而僅對(duì)用戶指定的指定區(qū)域進(jìn)行矢量化處理的場(chǎng)合比較多。
通過(guò)僅對(duì)用戶指定的指定區(qū)域進(jìn)行矢量化處理的方式,還可以提高處理的執(zhí)行性能,而且可以僅對(duì)用戶所希望部分高效率地進(jìn)行矢量化處理,從而提供了能夠在下一步驟的檢索處理中利用,或是僅對(duì)圖象信息中必要的部分進(jìn)行再次編輯和再次利用的效果。
《文件檢索處理》如圖34中步驟S3410所示的文件檢索處理,可以按照與實(shí)施方式3中的布局處理(參見(jiàn)圖29)相同的處理方式進(jìn)行。這里,作為步驟S3402的處理結(jié)果的、所提取出的各矩形塊和輸入圖象數(shù)據(jù)可以具有如圖5所示的塊信息和輸入文件信息,并且保持有指定區(qū)域內(nèi)的矢量化信息。
正如圖5所示,塊1~塊6這六個(gè)矩形塊中記錄有作為塊信息的屬性、坐標(biāo)位置、寬度、高度、是否存在有OCR信息等等信息,屬性可以按照文字、圖象、表格、線條、照片、其它進(jìn)行分類。作為輸入文件信息的總塊數(shù)為輸入圖象中全部塊數(shù),在圖6所示的實(shí)例中,總塊數(shù)N為6。
在塊信息中,例如矩形塊按照坐標(biāo)X從小到大的順序排列,對(duì)于坐標(biāo)X相同的矩形塊按照坐標(biāo)Y從小到大的順序排列。通過(guò)如圖29所示的各步驟,利用這些信息,從數(shù)據(jù)庫(kù)中對(duì)與輸入圖象類似的文件進(jìn)行布局檢索。這里,是以數(shù)據(jù)庫(kù)文件具有與圖6相同的信息為前提的。使用該程序?qū)K信息和輸入文件信息與數(shù)據(jù)庫(kù)中的文件依次進(jìn)行比較。對(duì)于圖29所示的布局檢索的詳細(xì)說(shuō)明,可以參考實(shí)施方式3中相應(yīng)的說(shuō)明。
以上檢索的結(jié)果是通過(guò)諸如縮略圖等顯示綜合相似性高于閾值Th、且作為候補(bǔ)保存的數(shù)據(jù)庫(kù)文件(步驟S2913)。當(dāng)操作者應(yīng)從多個(gè)候補(bǔ)中進(jìn)行選擇時(shí),可以通過(guò)操作者的輸入操作來(lái)指定文件。
在布局檢索處理中,相對(duì)用戶指定的指定區(qū)域,對(duì)通過(guò)步驟S3409生成的矢量化信息進(jìn)行保存,并作為可以在文件檢索處理(如圖34中步驟S3410、圖29所示)中利用的矢量化信息,具有通過(guò)OCR獲得的文字編碼信息和橫向筆畫(huà)/縱向筆畫(huà)的布局信息、通過(guò)圖形識(shí)別(參見(jiàn)圖13)獲得的圖形個(gè)數(shù)和配置以及通過(guò)字體識(shí)別(參見(jiàn)圖30)獲得的、使用在文檔中的文字處的字體信息等等。
本發(fā)明除了可以通過(guò)塊選擇步驟獲得的布局信息之外,還得以在數(shù)據(jù)庫(kù)文件檢索中的相似性計(jì)算中利用用戶所關(guān)注的指定區(qū)域的詳細(xì)矢量化信息,從而得以提高檢索精度。而且,在進(jìn)行數(shù)據(jù)庫(kù)文件檢索的過(guò)程中,還可以提高指定區(qū)域的矢量化信息權(quán)重,求出重視了用戶所關(guān)注部分的相似性,所以可以依據(jù)用戶的希望獲得相應(yīng)的檢索結(jié)果。
《向應(yīng)用數(shù)據(jù)的變換處理》在圖34中的塊選擇步驟(步驟S3402)之后,利用作為矢量化處理(步驟S3409)結(jié)果的數(shù)據(jù),通過(guò)步驟S3413進(jìn)行向應(yīng)用數(shù)據(jù)的變換處理。步驟S3409的矢量化處理結(jié)果可以按如圖15所示的中間數(shù)據(jù)格式,即所謂的文件分析輸出格式(DAOF)進(jìn)行保存。這種向應(yīng)用數(shù)據(jù)的變換處理,也與實(shí)施方式1和3相同。
《實(shí)施方式4的變形實(shí)例1》在實(shí)施方式4中,當(dāng)用戶指定作為矢量化處理對(duì)象的指定區(qū)域時(shí),利用輸入裝置等指定通過(guò)BS(塊選擇處理)自動(dòng)生成的矩形塊中的一個(gè)或多個(gè),然而本發(fā)明并不僅限于此。
正如圖35所示,也可以不通過(guò)BS(塊選擇處理)自動(dòng)生成矩形塊,而是將輸入圖象原樣顯示在MFP100的操作部畫(huà)面上,由用戶通過(guò)開(kāi)始坐標(biāo)、結(jié)束坐標(biāo)來(lái)指定所需要的區(qū)域。例如,通過(guò)開(kāi)始坐標(biāo)S1、結(jié)束坐標(biāo)E1指定指定區(qū)域B1,通過(guò)開(kāi)始坐標(biāo)S2、結(jié)束坐標(biāo)E2指定指定區(qū)域B2。開(kāi)始坐標(biāo)、結(jié)束坐標(biāo)的指定方法包括將操作畫(huà)面作為觸摸面板,進(jìn)而通過(guò)該觸摸面板進(jìn)行指定的方法,以及通過(guò)數(shù)字鍵等輸入坐標(biāo)的方法等等。
《實(shí)施方式4的變形實(shí)例2》對(duì)指定區(qū)域的指定方法,還可以不在MFP100中進(jìn)行,而是利用線段標(biāo)識(shí)等等直接記載在原稿上。
正如圖36所示,利用通過(guò)預(yù)定顏色的線段標(biāo)識(shí),在原稿上寫(xiě)入與指定區(qū)域相對(duì)應(yīng)的矩形區(qū)域RC1、RC2。MFP通過(guò)掃描對(duì)矩形區(qū)域RC1、RC2進(jìn)行檢測(cè),并且依據(jù)所檢測(cè)出的象素配置生成指定區(qū)域。對(duì)矩形區(qū)域RC1、RC2進(jìn)行檢測(cè)的方法,可以采用在先技術(shù)所公知的各種方法。
依據(jù)實(shí)施方式4,為了容易地對(duì)以紙文檔和圖象數(shù)據(jù)格式保存的信息進(jìn)行再次利用,可以將輸入的圖象變換為矢量數(shù)據(jù),所以可以高效率地進(jìn)行這種矢量數(shù)據(jù)的變換處理。
E、其它實(shí)施方式也可以將實(shí)施方式3所記載的、用于指示矢量化處理是“馬上進(jìn)行”還是“以后進(jìn)行”的接口,與實(shí)施方式1或?qū)嵤┓绞?組合應(yīng)用。對(duì)于這種場(chǎng)合,除了對(duì)所輸入的整個(gè)圖象進(jìn)行的矢量化處理之外,即使在差異信息的矢量化處理、由用戶指定的指定區(qū)域的矢量化處理中,也可以選擇是“馬上進(jìn)行”還是“以后進(jìn)行”。
實(shí)施根據(jù)本發(fā)明的圖象處理方法用的裝置,并不僅限于如圖1、圖2所示的圖象處理系統(tǒng),還可以采用諸如專用圖象處理裝置、通用計(jì)算機(jī)等等各種裝置。
當(dāng)通過(guò)通用計(jì)算機(jī)執(zhí)行這種圖象處理方法時(shí),可以將包括有在通用計(jì)算機(jī)中執(zhí)行圖象處理方法的各步驟用的程序代碼的計(jì)算機(jī)可執(zhí)行程序,讀入至通用計(jì)算機(jī)中。
通用計(jì)算機(jī)用于執(zhí)行圖象處理的程序可以從內(nèi)裝在通用計(jì)算機(jī)中的ROM和通用計(jì)算機(jī)可讀取的存儲(chǔ)媒體中讀入,也可以通過(guò)網(wǎng)絡(luò)從服務(wù)器等中進(jìn)行讀入。
本發(fā)明可以應(yīng)用于由一個(gè)單一設(shè)備的裝置,也可以應(yīng)用于由多格裝置構(gòu)成的系統(tǒng)。
而且,本發(fā)明還可以通過(guò)直接或間接向系統(tǒng)或裝置提供能夠?qū)崿F(xiàn)前述實(shí)施方式功能的軟件、利用所述系統(tǒng)或裝置的計(jì)算機(jī)讀取所提供的程序代碼并執(zhí)行這些程序代碼而實(shí)現(xiàn)。對(duì)于這種場(chǎng)合,只要系統(tǒng)或裝置具有這些程序的功能,實(shí)現(xiàn)的形式就不必拘泥于程序。
因此,由于本發(fā)明的功能通過(guò)計(jì)算機(jī)實(shí)現(xiàn),從而安裝在計(jì)算機(jī)中的程序代碼也實(shí)現(xiàn)了本發(fā)明。換句話說(shuō)就是,本發(fā)明的權(quán)利要求請(qǐng)求保護(hù)的范圍也包括能夠?qū)崿F(xiàn)本發(fā)明功能的計(jì)算機(jī)程序。
對(duì)于這種場(chǎng)合,只要系統(tǒng)和裝置具有這些程序的功能,該程序可以以諸如對(duì)象代碼、可以由解釋器執(zhí)行的程序或提供給操作系統(tǒng)的腳本數(shù)據(jù)等任何形式被執(zhí)行。
用來(lái)提供這種程序的存儲(chǔ)媒體例如包括軟盤、硬盤、光盤、磁光盤、CD-ROM、CD-R、CD-RW、磁帶、非易失型存儲(chǔ)卡、ROM、DVD(DVD-ROM和DVD-R)等等。
關(guān)于提供這些程序的方式,可以為利用客戶計(jì)算機(jī)的瀏覽器將客戶計(jì)算機(jī)連接至網(wǎng)絡(luò)上的某站點(diǎn),然后將本發(fā)明的計(jì)算機(jī)程序或該程序的可自動(dòng)安裝的壓縮文件下載到諸如硬盤等等的記錄媒體中。此外,本發(fā)明的程序還可以通過(guò)將構(gòu)成該程序的程序代碼分成多個(gè)文件,從不同的站點(diǎn)下載這些文件的方式進(jìn)行提供。換句話說(shuō)就是,通過(guò)計(jì)算機(jī)向大量用戶下載可實(shí)現(xiàn)本發(fā)明功能的程序文件的WWW(Worle Wide Wed)服務(wù)器也包含在本發(fā)明權(quán)利要求所請(qǐng)求保護(hù)的范圍之內(nèi)。
而且,還可以將本發(fā)明的程序加密并存儲(chǔ)在諸如CD-ROM等存儲(chǔ)媒體中,將該存儲(chǔ)媒體分發(fā)給用戶,允許符合條件的用戶通過(guò)網(wǎng)絡(luò)從站點(diǎn)下載解密密鑰信息,并允許用戶利用該解密密鑰信息對(duì)加密了程序進(jìn)行解密,進(jìn)而在用戶計(jì)算機(jī)上安裝該程序。
除了可以通過(guò)由計(jì)算機(jī)執(zhí)行該讀入程序的方式實(shí)現(xiàn)各實(shí)施方式描述的功能之外,還可以利用在計(jì)算機(jī)上執(zhí)行的操作系統(tǒng)或類似裝置,執(zhí)行實(shí)際處理的全部或一部分,通過(guò)這種執(zhí)行方式也可以獲得前述實(shí)施方式的功能。
而且,在將從存儲(chǔ)媒體讀入的程序?qū)懭胫敛迦氲接?jì)算機(jī)中的功能擴(kuò)展板或配置在與計(jì)算機(jī)相連接的功能擴(kuò)展單元中的存儲(chǔ)裝置中之后,可以由安裝在功能擴(kuò)展板或功能擴(kuò)展單元中的CPU或類似裝置來(lái)實(shí)際處理的全部或一部分,從而通過(guò)這種執(zhí)行方式獲得前述實(shí)施方式的功能。
而且,可以在不脫離本發(fā)明的構(gòu)思和范圍的前提下,通過(guò)各種不同的方式實(shí)施本發(fā)明,因此因此理解,本發(fā)明并不僅限于前述的各實(shí)施方式,本發(fā)明的保護(hù)范圍應(yīng)由權(quán)利要求限定。
權(quán)利要求
1.一種圖象處理方法,其特征在于,具有在輸入的圖象中確定矢量數(shù)據(jù)化區(qū)域的確定步驟;以及對(duì)在所述確定步驟中被確定為進(jìn)行矢量數(shù)據(jù)化的區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化的矢量化步驟。
2.如權(quán)利要求1所述的圖象處理方法,其特征在于,還進(jìn)一步具有根據(jù)據(jù)上述輸入的圖象,檢索存儲(chǔ)在存儲(chǔ)裝置中的原始電子數(shù)據(jù)的檢索步驟。
3.如權(quán)利要求2所述的圖象處理方法,其特征在于,在所述確定步驟中所確定的區(qū)域?yàn)橥ㄟ^(guò)比較在所述檢索步驟檢索出的原始電子數(shù)據(jù)與所述輸入的圖象而提取出差異信息的區(qū)域。
4.如權(quán)利要求3所述的圖象處理方法,其特征在于,還進(jìn)一步具有將所述矢量數(shù)據(jù)化后的差異信息與所述原始電子數(shù)據(jù)進(jìn)行合成的合成步驟。
5.如權(quán)利要求4所述的圖象處理方法,其特征在于,還進(jìn)一步具有將在合成步驟中合成后生成的新電子數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置中的存儲(chǔ)步驟。
6.如權(quán)利要求2所述的圖象處理方法,其特征在于,在所述檢索步驟中,識(shí)別附加在所述輸入圖象中的、表示所述原始電子數(shù)據(jù)存儲(chǔ)地址的標(biāo)識(shí)符,并根據(jù)對(duì)該標(biāo)識(shí)符的識(shí)別結(jié)果來(lái)檢索所述原始電子數(shù)據(jù)。
7.如權(quán)利要求1所述的圖象處理方法,其特征在于,在所述矢量化步驟中,依據(jù)對(duì)所述區(qū)域內(nèi)的圖象的字符識(shí)別結(jié)果來(lái)進(jìn)行矢量化。
8.如權(quán)利要求1所述的圖象處理方法,其特征在于,在所述矢量化步驟中,依據(jù)所述區(qū)域內(nèi)的圖象的輪廓進(jìn)行輪廓化后,進(jìn)行矢量化處理。
9.如權(quán)利要求3所述的圖象處理方法,其特征在于,還進(jìn)一步具有判斷是否對(duì)于所述檢索出的原始電子數(shù)據(jù)禁止信息改變的判斷步驟,在所述判斷步驟中判斷為不禁止的情況下,在所述矢量化步驟中對(duì)在所述提取步驟中提取出的差異信息進(jìn)行矢量數(shù)據(jù)化,在所述合成步驟中將該矢量數(shù)據(jù)化后的差異信息與所述原始電子數(shù)據(jù)進(jìn)行合成,而在所述判斷步驟判斷為禁止的情況下,在所述矢量化步驟中對(duì)在所述提取步驟中提取出的差異信息中和包含在所述輸入圖象中的除該差異信息之外的信息進(jìn)行矢量化。
10.如權(quán)利要求5所述的圖象處理方法,其特征在于,還進(jìn)一步具有向在所述存儲(chǔ)步驟中所存儲(chǔ)的電子數(shù)據(jù)附加表示該電子數(shù)據(jù)的存儲(chǔ)地址的信息并進(jìn)行打印輸出的打印控制步驟。
11.如權(quán)利要求4所述的圖象處理方法,其特征在于,還進(jìn)一步具有將所提取出的差異信息作為其它文件存儲(chǔ)在存儲(chǔ)裝置中的存儲(chǔ)步驟,所述作為其它文件的差異信息按照與所述原始電子數(shù)據(jù)相關(guān)聯(lián)的方式進(jìn)行存儲(chǔ),并且在印刷輸出時(shí)通過(guò)所述合成步驟而被合成輸出。
12.如權(quán)利要求4所述的圖象處理方法,其特征在于,還進(jìn)一步具有將在所述合成步驟中合成后生成的新電子數(shù)據(jù)變換為可用規(guī)定應(yīng)用程序處理的規(guī)定格式的格式變換步驟。
13.如權(quán)利要求2所述的圖象處理方法,其特征在于,在所述檢索步驟未能檢索到原始電子文件時(shí),在所述矢量化步驟中,對(duì)所述輸入的整個(gè)圖象進(jìn)行矢量化。
14.如權(quán)利要求1所述的圖象處理方法,其特征在于,還進(jìn)一步具有依據(jù)用戶的命令,判斷是立即對(duì)被確定為進(jìn)行所述矢量數(shù)據(jù)化的區(qū)域內(nèi)的圖象,進(jìn)行矢量數(shù)據(jù)化還是以后再進(jìn)行矢量數(shù)據(jù)化用的判斷步驟;對(duì)于在判斷步驟判斷為立即進(jìn)行矢量數(shù)據(jù)化的場(chǎng)合,在所述矢量化步驟中,對(duì)所述區(qū)域內(nèi)的圖象立即進(jìn)行矢量數(shù)據(jù)化,而在所述判斷步驟判斷為隨后再進(jìn)行矢量數(shù)據(jù)化的場(chǎng)合,在所述矢量化步驟中,在滿足預(yù)定條件時(shí),對(duì)所述區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化。
15.如權(quán)利要求14所述的圖象處理方法,其特征在于,所述的預(yù)定條件為圖象處理裝置的負(fù)載較輕時(shí)。
16.如權(quán)利要求14所述的圖象處理方法,其特征在于,在所述判斷步驟中,將依據(jù)用戶命令的狀態(tài)按照與該輸入圖象相關(guān)聯(lián)的形式登錄在矢量化處理表中。
17.如權(quán)利要求1所述的圖象處理方法,其特征在于,在所述確定步驟中,依據(jù)用戶的區(qū)域命令,確定對(duì)所述矢量數(shù)據(jù)化的區(qū)域。
18.如權(quán)利要求17所述的圖象處理方法,其特征在于,還進(jìn)一步具有將所述輸入的圖象按屬性來(lái)分割區(qū)域的區(qū)域分割步驟;在所述確定步驟中,將在所述區(qū)域分割步驟中分割的區(qū)域中、依據(jù)用戶的指示選擇出的區(qū)域確定為進(jìn)行所述矢量數(shù)據(jù)化的區(qū)域。
19.如權(quán)利要求1所述的圖象處理方法,其特征在于,還進(jìn)一步具有文件提取步驟,依據(jù)對(duì)在所述確定步驟中確定的區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化后獲得的矢量數(shù)據(jù),從登錄在數(shù)據(jù)庫(kù)中的原始數(shù)據(jù)文件中抽取出具有相同或相似內(nèi)容的原始數(shù)據(jù)文件。
20.如權(quán)利要求1所述的圖象處理方法,其特征在于,還進(jìn)一步具有輸入通過(guò)掃描原稿而獲得的所述輸入圖象的圖象輸入步驟。
21.如權(quán)利要求1所述的圖象處理方法,其特征在于,所述矢量化步驟還包含有將所述輸入圖象中的圖象數(shù)據(jù)變換為代碼信息、圖形信息、函數(shù)信息等命令定義型數(shù)據(jù)的步驟。
22.一種用于使計(jì)算機(jī)執(zhí)行如權(quán)利要求1至權(quán)利要求21中任一項(xiàng)所述的圖象處理方法中的各步驟的計(jì)算機(jī)程序。
23.一種對(duì)用于使計(jì)算機(jī)執(zhí)行如權(quán)利要求1至權(quán)利要求21中任一項(xiàng)所述的圖象處理方法中的各步驟的計(jì)算機(jī)程序進(jìn)行存儲(chǔ)的存儲(chǔ)媒體。
24.一種圖象處理系統(tǒng),其特征在于,具有在輸入的圖象中確定矢量數(shù)據(jù)化區(qū)域用的確定裝置;以及對(duì)通過(guò)所述確定裝置確定為進(jìn)行矢量數(shù)據(jù)化的區(qū)域內(nèi)的圖象進(jìn)行矢量數(shù)據(jù)化的矢量化裝置。
全文摘要
本發(fā)明提供一種圖象處理方法,依據(jù)輸入的圖象,檢索存儲(chǔ)在存儲(chǔ)裝置處的原始電子數(shù)據(jù),比較該檢索出的原始電子數(shù)據(jù)與輸入的圖象后提取出差異信息,將該差異信息與所述原始電子數(shù)據(jù)進(jìn)行合成。合成后將生成的電子數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置中?;谳斎氲膱D象,檢索存儲(chǔ)在存儲(chǔ)裝置中的原始電子數(shù)據(jù),沒(méi)有檢索出原始電子數(shù)據(jù)的場(chǎng)合,對(duì)所輸入的圖象進(jìn)行矢量數(shù)據(jù)化,將該矢量數(shù)據(jù)化后的圖象作為電子數(shù)據(jù)存儲(chǔ)在存儲(chǔ)裝置中。合成通過(guò)塊選擇步驟獲得的區(qū)域分割信息與輸入圖象,顯示在MFP的操作畫(huà)面上,并對(duì)于所顯示的區(qū)域分割信息,將應(yīng)作為矢量化處理對(duì)象的全部矩形塊指定為指定區(qū)域。例如,指定指定區(qū)域的方法為用戶利用指示設(shè)備,指定圖象中的一個(gè)或多個(gè)矩形塊。
文檔編號(hào)G06K9/20GK1607541SQ20041009590
公開(kāi)日2005年4月20日 申請(qǐng)日期2004年2月13日 優(yōu)先權(quán)日2003年2月13日
發(fā)明者太田健一, 谷岡宏, 宇佐美彰浩, 金田北洋, 伊藤裕彥, 加藤進(jìn)一, 秋庭朋宏, 金津知俊, 三澤玲司, 寺尾仁秀, 鵜澤充 申請(qǐng)人:佳能株式會(huì)社