欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文檔處理裝置、文檔處理方法及記錄其程序的存儲(chǔ)介質(zhì)的制作方法

文檔序號(hào):6539436閱讀:138來(lái)源:國(guó)知局
專利名稱:文檔處理裝置、文檔處理方法及記錄其程序的存儲(chǔ)介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于對(duì)紙件文檔進(jìn)行數(shù)字化并進(jìn)行存儲(chǔ)的技術(shù),更加具體地說(shuō)涉及這樣的對(duì)紙件文檔進(jìn)行數(shù)字化和存儲(chǔ)的技術(shù),其為每篇紙件文檔附加唯一的名稱。
背景技術(shù)
紙件文檔(此后也稱作“文檔”)是用于傳播和記錄信息的重要介質(zhì),但其具有的問題包括需要用于存儲(chǔ)的空間例如檔案庫(kù)。此外,當(dāng)將信息記錄在紙件文檔中并進(jìn)行存儲(chǔ)時(shí),如果日后需要記錄在那些紙件文檔中的信息,則必須在存儲(chǔ)于文檔庫(kù)和類似地方的多個(gè)紙件文檔中找出記錄有期望信息的紙件文檔。換句話說(shuō),從操作效率角度考慮,在紙件文檔中記錄和存儲(chǔ)信息是不理想的。
在這樣的背景下,對(duì)紙件文檔進(jìn)行數(shù)字化和存儲(chǔ)就變得非常普遍。具體地,使用掃描儀或類似裝置讀取與紙件文檔中的圖像相對(duì)應(yīng)的圖像、將與每個(gè)紙件文檔的圖像相應(yīng)的圖像數(shù)據(jù)(之后稱作“頁(yè)面圖像數(shù)據(jù)”)轉(zhuǎn)換成文件并將這些文件存儲(chǔ)在類似硬盤的存儲(chǔ)設(shè)備中已經(jīng)變得非常普遍。
然而,當(dāng)將文件寫入到類似硬盤的設(shè)備時(shí),需要為每個(gè)文件附加一個(gè)唯一的名稱(此后也稱作“文件名”),該過(guò)程一般是如下進(jìn)行的??筛鶕?jù)用戶預(yù)先指定的信息(例如,使用鍵盤或類似裝置輸入的信息,或者手工輸入的信息)確定文件名,可使用缺省的字符串加序列號(hào)例如“Scan1,Scan2,……”或者使用表示掃描日期或時(shí)間的字符串來(lái)產(chǎn)生文件名。
然而,如果用戶被迫預(yù)先確定文件名,則這將出現(xiàn)這樣的問題當(dāng)對(duì)大量紙件文檔成批數(shù)字化時(shí)將給用戶帶來(lái)非常大的負(fù)擔(dān)。另一方面,如果使用序列號(hào)、日期等自動(dòng)產(chǎn)生文件名,則即使在對(duì)大量紙件文檔進(jìn)行數(shù)字化時(shí)也將不會(huì)出現(xiàn)該問題。然而,因?yàn)橐赃@種方式附加的文件名并不表示(例如)與所述文件相對(duì)應(yīng)的紙件文檔的內(nèi)容,所以在日后檢索包含所需信息的文件時(shí)會(huì)發(fā)生需要檢查每個(gè)文件的內(nèi)容這樣的極大不便。

發(fā)明內(nèi)容
本發(fā)明就是鑒于上面的情形做出的,并提供了一種這樣的技術(shù),其允許根據(jù)其內(nèi)容為紙件文檔附加名稱,而且在對(duì)紙件文檔進(jìn)行數(shù)字化和保存時(shí)不會(huì)給用戶帶來(lái)負(fù)擔(dān)。
為了解決上述問題,本發(fā)明提供了一種文檔處理裝置,包括輸入單元,用于輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù);提取單元,其分析通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù),確定與該頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,并提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;產(chǎn)生單元,用于鏈接由提取單元提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔上的名稱的字符串;和寫入單元,其將由產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)和由輸入單元輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將名稱數(shù)據(jù)和頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
根據(jù)該文檔處理裝置,與文檔中的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)和與所述文檔的內(nèi)容相對(duì)應(yīng)的名稱數(shù)據(jù)被彼此關(guān)聯(lián)并被寫入到所述存儲(chǔ)裝置。


下面將根據(jù)附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施例,在附圖中圖1為表示根據(jù)本發(fā)明第一實(shí)施例的配有文檔處理裝置110的文檔數(shù)字化系統(tǒng)的整體結(jié)構(gòu)的一個(gè)示例的方框圖;圖2為表示文檔處理裝置110的硬件結(jié)構(gòu)的一個(gè)示例的示圖;圖3為表示通過(guò)文檔處理裝置110的控制單元200按照紙件文檔數(shù)字化軟件執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖;
圖4為表示由文檔處理裝置110提取的項(xiàng)目數(shù)據(jù)和根據(jù)該項(xiàng)目數(shù)據(jù)產(chǎn)生的名稱數(shù)據(jù)之間的關(guān)系的表;圖5為表示通過(guò)文檔處理裝置的控制單元200按照第二變型例執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖;圖6為表示按照第二變型例的文檔處理裝置的非易失性存儲(chǔ)單元220b中的目錄結(jié)構(gòu)的一個(gè)示例的視圖;圖7表示存儲(chǔ)在根據(jù)第三變型例的文檔處理裝置的非易失性存儲(chǔ)單元220b中的重要性等級(jí)表的一個(gè)示例;圖8為表示由根據(jù)第三變型例的文檔處理裝置的控制單元200執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖;圖9表示存儲(chǔ)在根據(jù)第四變型例的文檔處理裝置的非易失性存儲(chǔ)單元220b中的項(xiàng)目列表的一個(gè)示例;圖10為表示由依據(jù)第四變型例的文檔處理裝置的控制單元200執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖。
具體實(shí)施例方式
下面將參照

根據(jù)本發(fā)明的實(shí)施例。
A結(jié)構(gòu)圖1為表示根據(jù)本發(fā)明第一實(shí)施例的配有文檔處理裝置110的文檔數(shù)字化系統(tǒng)10的結(jié)構(gòu)的一個(gè)示例的方框圖。圖1中的圖像讀取裝置120例如是配有ADF(自動(dòng)文檔進(jìn)給器)或其它類型的自動(dòng)紙張進(jìn)給機(jī)構(gòu)的掃描儀裝置,其一次一頁(yè)地讀取設(shè)置在ADF中的紙件文檔并將與讀取的圖像相應(yīng)的頁(yè)面圖像數(shù)據(jù)通過(guò)通信線路130(例如LAN(局域網(wǎng)))傳送給文檔處理裝置110。注意,雖然在本實(shí)施例中描述了通信線路130為L(zhǎng)AN這樣一種情況,當(dāng)然它也可以包括WAN(廣域網(wǎng))、互聯(lián)網(wǎng),等等。還應(yīng)注意,雖然在本實(shí)施例中描述了將文檔處理裝置110和圖像讀取裝置120構(gòu)造為單獨(dú)的硬件部件,但它們當(dāng)然也可以構(gòu)造為單個(gè)的硬件部件。在這樣一個(gè)實(shí)施例中,通信線路130為連接單個(gè)硬件部件內(nèi)的文檔處理裝置110和圖像讀取裝置120的內(nèi)部總線。
圖1中的文檔處理裝置110用于將從圖像讀取裝置120傳送來(lái)的頁(yè)面圖像數(shù)據(jù)轉(zhuǎn)換成文件、對(duì)文件附加唯一的名稱、并存儲(chǔ)和積累文件,其具有如圖2所示的結(jié)構(gòu)。如圖2所示,文檔處理裝置110包括控制單元200、通信接口單元210、存儲(chǔ)單元220和總線230,所述總線230用于在這些組成部件之間對(duì)數(shù)據(jù)的傳送和接收起媒介作用。
控制單元200例如是CPU(中央處理單元),其通過(guò)執(zhí)行存儲(chǔ)在下述的存儲(chǔ)單元220中的各種軟件程序來(lái)控制文檔處理裝置110的各個(gè)單元。通信接口單元210通過(guò)通信線路130與圖像讀取裝置120相連接,并通過(guò)通信線路130接收從圖像讀取裝置120發(fā)送的頁(yè)面圖像數(shù)據(jù)并將它傳送給控制單元200。換句話說(shuō),通信接口單元210用作用于輸入從頁(yè)面讀取裝置120發(fā)送的頁(yè)面圖像數(shù)據(jù)的輸入單元。
如圖2所示,存儲(chǔ)單元220包括易失性存儲(chǔ)單元220a和非易失性存儲(chǔ)單元220b。易失性存儲(chǔ)單元220a例如是RAM(隨機(jī)存取存儲(chǔ)器),并被用作控制單元200的工作區(qū)域,所述控制單元按照后文將描述的各種軟件程序進(jìn)行操作,所述易失性存儲(chǔ)單元220a用作暫時(shí)存儲(chǔ)從通信接口單元210傳送來(lái)的頁(yè)面圖像數(shù)據(jù)的緩沖器。相反,非易失性存儲(chǔ)單元220b例如是硬盤,其將頁(yè)面圖像數(shù)據(jù)轉(zhuǎn)換成文件,并存儲(chǔ)和積聚那些文件。注意,在本實(shí)施例中描述了輸入給文檔處理裝置110的頁(yè)面圖像數(shù)據(jù)被寫入到設(shè)置在文檔處理裝置110中的存儲(chǔ)單元這樣一種情況,但也能夠?qū)㈨?yè)面圖像數(shù)據(jù)逐個(gè)文檔地轉(zhuǎn)換成文件,并將那些文件寫入到與文檔處理裝置110分立的存儲(chǔ)裝置上。使控制單元200實(shí)現(xiàn)根據(jù)本實(shí)施例的文檔處理裝置110的指定功能的軟件被存儲(chǔ)在非易失性存儲(chǔ)單元220b中。存儲(chǔ)在非易失性存儲(chǔ)單元220b中的軟件的示例包括使控制單元200能夠?qū)崿F(xiàn)操作系統(tǒng)(“OS”)的OS軟件和紙件文檔數(shù)字化軟件。紙件文檔數(shù)字化軟件為這樣的軟件其根據(jù)頁(yè)面圖像數(shù)據(jù)的內(nèi)容產(chǎn)生表示附加給包括與頁(yè)面圖像數(shù)據(jù)相應(yīng)的頁(yè)面的紙件文檔的名稱的名稱數(shù)據(jù),將該名稱數(shù)據(jù)和該頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián),并使控制單元200將其寫入到非易失性存儲(chǔ)單元200b中。下面說(shuō)明通過(guò)執(zhí)行這些軟件程序提供給控制單元200的功能。
當(dāng)文檔處理裝置110的電源(未示出)開啟時(shí),控制單元200首先從非易失性存儲(chǔ)單元220b讀取OS軟件。當(dāng)根據(jù)OS軟件進(jìn)行操作并實(shí)現(xiàn)OS時(shí),控制單元200被提供了控制文檔處理裝置110的各個(gè)單元的功能,從非易失性存儲(chǔ)單元220b讀取其它軟件并執(zhí)行的功能等等。根據(jù)本實(shí)施例,只要OS軟件的執(zhí)行完成并且OS被實(shí)現(xiàn)時(shí),控制單元200就從非易失性存儲(chǔ)單元220b讀取紙件文檔數(shù)字化軟件并執(zhí)行它。圖3為表示根據(jù)紙件文檔數(shù)字化軟件操作的控制單元200執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖。如圖3所示,為按照紙件文檔數(shù)字化軟件操作的控制單元200提供了下述三個(gè)功能。
第一個(gè)功能是用于分析通過(guò)通信接口單元210輸入的并存儲(chǔ)在易失性存儲(chǔ)單元220a中的頁(yè)面圖像數(shù)據(jù)的內(nèi)容并以字符串的形式提取項(xiàng)目數(shù)據(jù),所述字符串表示與所述頁(yè)面圖像數(shù)據(jù)相應(yīng)的頁(yè)面中所列舉的每個(gè)項(xiàng)目的內(nèi)容。第二個(gè)功能是產(chǎn)生功能,用于將通過(guò)提取功能提取的項(xiàng)目數(shù)據(jù)鏈接起來(lái)并以表示附加給頁(yè)面圖像數(shù)據(jù)的名稱的字符串的形式產(chǎn)生名稱數(shù)據(jù)。第三個(gè)功能是存儲(chǔ)功能,用于將產(chǎn)生功能產(chǎn)生的名稱數(shù)據(jù)與頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將它們寫入非易失性存儲(chǔ)單元220b來(lái)存儲(chǔ)該名稱數(shù)據(jù)和該頁(yè)面數(shù)據(jù)。
如上所述,根據(jù)本實(shí)施例的文檔處理裝置的硬件機(jī)構(gòu)與普通計(jì)算機(jī)裝置的結(jié)構(gòu)相同,并且控制單元200根據(jù)存儲(chǔ)在非易失性存儲(chǔ)單元220b中的各種軟件程序所進(jìn)行的操作實(shí)現(xiàn)了根據(jù)本發(fā)明的文檔處理裝置的特定功能。因此,雖然在本實(shí)施例中描述的是使用軟件模塊實(shí)現(xiàn)根據(jù)本發(fā)明的文檔處理裝置的特定功能這樣一種情況,但也可以使用提供這些功能的硬件模塊來(lái)構(gòu)造根據(jù)本發(fā)明的文檔處理裝置。具體地,可通過(guò)使用實(shí)現(xiàn)下述單元的功能的硬件模塊,并如圖3中所示的流程圖所示地聯(lián)合各硬件協(xié)同操作來(lái)構(gòu)造根據(jù)本發(fā)明的文檔處理裝置輸入單元,頁(yè)面圖像數(shù)據(jù)被從圖像讀取裝置120輸入到所述輸入單元中;提取單元,所述提取單元用于提供提取功能;產(chǎn)生單元,所述產(chǎn)生單元用于提供產(chǎn)生功能;和寫入單元,所述寫入單元使由產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)與輸入給輸入單元的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將其寫入硬盤或其它存儲(chǔ)裝置。
B操作下面將參照

用于說(shuō)明文檔處理裝置110的特征特性的那些操作。
首先,當(dāng)用戶在圖像讀取裝置120的ADF上放置紙件文檔并執(zhí)行預(yù)定的操作(例如按下設(shè)置在圖像讀取裝置120的操作單元上的開始按扭)時(shí),與紙件文檔中的頁(yè)面相對(duì)應(yīng)的圖像就被圖像讀取裝置120讀取,并且通過(guò)通信線路130將與該頁(yè)面的圖像相應(yīng)的頁(yè)面圖像數(shù)據(jù)從圖像讀取裝置120發(fā)送給文檔處理裝置110。
當(dāng)通過(guò)通信接口單元210輸入了頁(yè)面圖像數(shù)據(jù)時(shí),文檔處理裝置110的控制單元200通過(guò)以頁(yè)面圖像數(shù)據(jù)輸入的順序?qū)⑵鋵懭胍资源鎯?chǔ)單元220a來(lái)存儲(chǔ)該頁(yè)面圖像數(shù)據(jù),直到紙件文檔中的所有頁(yè)面的頁(yè)面圖像數(shù)據(jù)都被輸入。一旦輸入了所有頁(yè)面的頁(yè)面圖像數(shù)據(jù),控制單元200根據(jù)圖3中所示的流程圖通過(guò)產(chǎn)生表示將被附加給紙件文檔的名稱的名稱數(shù)據(jù)、使該名稱數(shù)據(jù)與存儲(chǔ)在易失性存儲(chǔ)單元220a中的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將其寫入到非易失性存儲(chǔ)單元220b來(lái)數(shù)字化所述紙件文檔。下面參照?qǐng)D3說(shuō)明由控制單元200執(zhí)行的操作。
圖3為表示由控制單元200執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖。如圖3所示,控制單元200通過(guò)執(zhí)行語(yǔ)言分析、版面分析(layoutanalysis)或類似操作來(lái)分析存儲(chǔ)在易失性存儲(chǔ)單元220a中的所有頁(yè)面圖像數(shù)據(jù)的內(nèi)容,然后提取表示與頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的頁(yè)面中包含的每個(gè)項(xiàng)目的內(nèi)容的項(xiàng)目數(shù)據(jù)(步驟SA1)。下面是對(duì)輸入了旅行費(fèi)用清單的紙件文檔(此后稱作“文檔A”)的一個(gè)頁(yè)面相應(yīng)的頁(yè)面圖像數(shù)據(jù)(此后稱作“頁(yè)面圖像數(shù)據(jù)A“)并且提取了圖4A中所示的項(xiàng)目數(shù)據(jù)的情況的說(shuō)明。
接著,控制單元200將在步驟SA1中提取的項(xiàng)目數(shù)據(jù)鏈接起來(lái)并產(chǎn)生表示將附加給文檔A的名稱的名稱數(shù)據(jù)(步驟SA2)。根據(jù)本實(shí)施例,因?yàn)閳D4A中所示的項(xiàng)目數(shù)據(jù)已經(jīng)在步驟SA1中進(jìn)行了提取,所以對(duì)于文檔A,在步驟SA2產(chǎn)生圖4B中所示的名稱數(shù)據(jù)。
然后,控制單元200將頁(yè)面圖像數(shù)據(jù)A與在步驟SA2中產(chǎn)生的名稱數(shù)據(jù)相關(guān)聯(lián)并將其寫入非易失性存儲(chǔ)單元220b來(lái)存儲(chǔ)數(shù)據(jù)(步驟SA3)。具體地說(shuō),控制單元200將頁(yè)面圖像數(shù)據(jù)A寫入非易失性存儲(chǔ)單元220b的空閑區(qū)域,與此同時(shí)將名稱數(shù)據(jù)與寫入了頁(yè)面圖像數(shù)據(jù)A的區(qū)域的開始地址或表示開始地址的數(shù)據(jù)(例如i-節(jié)點(diǎn)號(hào))相關(guān)聯(lián),并將名稱數(shù)據(jù)和開始地址寫入到預(yù)定的管理文件(例如路徑文件或i-節(jié)點(diǎn)表)中,由此存儲(chǔ)該頁(yè)面圖像數(shù)據(jù)。注意,雖然在本操作示例中說(shuō)明了將被數(shù)字化的紙件文檔包括一個(gè)頁(yè)面的情況,但在將被數(shù)字化的紙件文檔包括多個(gè)頁(yè)面的情況下,在被數(shù)字化之后,對(duì)應(yīng)于多個(gè)頁(yè)面的頁(yè)面圖像數(shù)據(jù)被寫入空閑區(qū)域中也是可能的。
如上所述,利用根據(jù)本實(shí)施例的文檔處理裝置110,在用戶沒有執(zhí)行任何特殊操作的情況下,就能使與紙件文檔中的頁(yè)面相應(yīng)的頁(yè)面圖像數(shù)據(jù)和與紙件文檔的內(nèi)容相應(yīng)的名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)起來(lái)。根據(jù)本實(shí)施例的文檔處理裝置110具有這樣的效果在數(shù)字化和保存紙件文檔時(shí),它能夠?qū)ξ臋n進(jìn)行數(shù)字化并根據(jù)文檔內(nèi)容對(duì)其附加名稱,同時(shí)減小用戶的負(fù)擔(dān)。
C變型例上面詳細(xì)說(shuō)明了本發(fā)明的一個(gè)實(shí)施例,但是當(dāng)然能夠如下所述地添加變化。
(C-1)第一變型例上面的實(shí)施例描述了在圖像讀取裝置120的ADF中放置單一紙件文檔的情況。然而,也可以在ADF中設(shè)置多個(gè)紙件文檔,附加與多個(gè)紙件文檔中的每一個(gè)的內(nèi)容相應(yīng)的名稱,并對(duì)這些文檔進(jìn)行數(shù)字化。這可通過(guò)讓文檔處理裝置110檢測(cè)每個(gè)紙件文檔之間的邊界并在檢測(cè)到邊界之前對(duì)存儲(chǔ)在易失性存儲(chǔ)單元220a中的紙件文檔進(jìn)行數(shù)字化處理(參見圖3)來(lái)實(shí)現(xiàn)。使文檔處理裝置110檢測(cè)文檔邊界的方法的示例包括插入表示文檔之間的文檔邊界的預(yù)定頁(yè)(此后稱作“邊界頁(yè)”)并根據(jù)那個(gè)邊界頁(yè)上的圖像來(lái)檢測(cè)文檔邊界的檢測(cè)文檔邊界的方法,以及表示最后頁(yè)面的標(biāo)記被附加至每個(gè)文檔最后頁(yè)面上的空白處并通過(guò)檢測(cè)與那個(gè)標(biāo)記相應(yīng)的圖像來(lái)檢測(cè)文檔邊界的檢測(cè)文檔邊界的方法。
(C-2)第二變型例在上述的實(shí)施例中,描述了通過(guò)頁(yè)面圖像數(shù)據(jù)分析獲得的所有項(xiàng)目數(shù)據(jù)都被鏈接并且產(chǎn)生表示附加給頁(yè)面圖像數(shù)據(jù)的名稱的名稱數(shù)據(jù)這樣一種情況。然而,也可以在排除了頁(yè)面圖像數(shù)據(jù)分析獲得的項(xiàng)目數(shù)據(jù)中的表示代表與頁(yè)面圖像數(shù)據(jù)相應(yīng)的文檔的類型的項(xiàng)目?jī)?nèi)容的項(xiàng)目數(shù)據(jù)(此后稱作“類型數(shù)據(jù)”)之后產(chǎn)生名稱數(shù)據(jù)。這可通過(guò)預(yù)先在存儲(chǔ)單元220中存儲(chǔ)類型數(shù)據(jù)、與此同時(shí)使控制單元200執(zhí)行如圖5中所示的紙件文檔數(shù)字化處理而不是圖3中所示的紙件文檔數(shù)字化處理來(lái)實(shí)現(xiàn)。
圖5中所示的紙件文檔數(shù)字化處理與圖3中所示的紙件文檔數(shù)字化處理的不同之處在于在步驟SB1中,將在步驟SA1中提取的項(xiàng)目數(shù)據(jù)中的與類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)排除之后才執(zhí)行步驟SA2中的處理并產(chǎn)生名稱數(shù)據(jù)。下面對(duì)此進(jìn)行詳細(xì)說(shuō)明,在圖5的步驟SB1中,控制單元200為在步驟SA1中提取的每個(gè)項(xiàng)目數(shù)據(jù)確定它是否與存儲(chǔ)在非易失性存儲(chǔ)單元220b中的類型數(shù)據(jù)相匹配并刪除相匹配的項(xiàng)目數(shù)據(jù)。這使得能夠在排除與類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)之后產(chǎn)生名稱數(shù)據(jù)。
在排除與類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)之后產(chǎn)生名稱數(shù)據(jù)的原因如下。相同類型的文檔總是包括相同的類型數(shù)據(jù),所以在名稱數(shù)據(jù)中包括這種類型數(shù)據(jù)并不會(huì)對(duì)辨別特性起作用。此外,這種類型數(shù)據(jù)一般用作文件夾名,用于在根據(jù)類型進(jìn)行分類和存儲(chǔ)文檔時(shí)執(zhí)行相關(guān)的分類,如圖6所示,所以在名稱數(shù)據(jù)中包括這種類型數(shù)據(jù)是多余的。該變型例具有這樣的效果,即其能夠排除對(duì)鑒別相同類型的文檔之間的特性不起作用的項(xiàng)目數(shù)據(jù)并產(chǎn)生無(wú)冗余的名稱數(shù)據(jù)。
(C-3)第三變型例在上述的實(shí)施例中,描述了鏈接由頁(yè)面圖像數(shù)據(jù)分析獲得的所有項(xiàng)目數(shù)據(jù)并且產(chǎn)生表示附加給頁(yè)面圖像數(shù)據(jù)的名稱的名稱數(shù)據(jù)。然而,因?yàn)槊總€(gè)OS一般都預(yù)先提供有關(guān)于可附加給文件的名稱的字符數(shù)量(字節(jié)數(shù))的上限值,所以在通過(guò)鏈接項(xiàng)目數(shù)據(jù)產(chǎn)生名稱數(shù)據(jù)時(shí)當(dāng)然能夠預(yù)先確定進(jìn)行鏈接的項(xiàng)目數(shù)據(jù)單元的數(shù)量。更加具體地說(shuō),可以確定文檔中的每個(gè)項(xiàng)目的重要等級(jí),并且通過(guò)按照重要性等級(jí)的升序或降序僅僅鏈接預(yù)定數(shù)量的通過(guò)頁(yè)面圖像數(shù)據(jù)分析所獲得的項(xiàng)目數(shù)據(jù)單元來(lái)產(chǎn)生名稱數(shù)據(jù)。這可如下地實(shí)現(xiàn)。
首先,將圖7中所示的重要性等級(jí)表存儲(chǔ)在文檔處理裝置的非易失性存儲(chǔ)單元220b中。表示文檔中的項(xiàng)目的重要性等級(jí)的重要性等級(jí)數(shù)據(jù)針對(duì)每個(gè)項(xiàng)目存儲(chǔ)在重要性等級(jí)表中,并且重要性等級(jí)數(shù)據(jù)值越高,那個(gè)項(xiàng)目就越重要。注意,在本實(shí)施例中描述了在非易失性存儲(chǔ)單元220b中預(yù)先存儲(chǔ)一個(gè)重要性等級(jí)表這樣一種情況,但是當(dāng)然也能夠針對(duì)不同類型的文檔存儲(chǔ)不同的重要性等級(jí)表。一個(gè)原因是對(duì)于不同類型的文檔,即使相同項(xiàng)目也可以有不同的重要性等級(jí)。
如果使控制單元200執(zhí)行圖8中所示的紙件文檔數(shù)字化處理,而不是圖3中所示的紙件文檔數(shù)字化處理,那么通過(guò)僅僅按照重要性等級(jí)降序地鏈接頁(yè)面圖像數(shù)據(jù)分析所獲得的預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)單元來(lái)產(chǎn)生名稱數(shù)據(jù)。圖8中的流程圖和圖3中的流程圖的不同之處在于提供步驟SC1,用于從在步驟SA1提取的項(xiàng)目數(shù)據(jù)中僅選擇預(yù)定數(shù)量的表示具有高重要性等級(jí)的項(xiàng)目?jī)?nèi)容的項(xiàng)目數(shù)據(jù)單元,并且通過(guò)在上述的步驟SA2中鏈接在步驟SC1中選擇的項(xiàng)目數(shù)據(jù)來(lái)產(chǎn)生名稱數(shù)據(jù)。該過(guò)程的更詳細(xì)的描述是,在圖7的步驟SC1中,控制單元200查閱存儲(chǔ)在重要性等級(jí)表(參見圖7)中的內(nèi)容,對(duì)在步驟SA1中提取的每個(gè)項(xiàng)目數(shù)據(jù)單元指定與該項(xiàng)目數(shù)據(jù)單元相應(yīng)的項(xiàng)目的重要等級(jí),并按照從最高重要性等級(jí)開始的順序僅提取預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)單元。例如,如果預(yù)定的數(shù)量是3,那么按照從最高重要性開始的順序鏈接三項(xiàng)數(shù)據(jù)單元來(lái)產(chǎn)生名稱數(shù)據(jù),所以如果提取了圖4A中所示的項(xiàng)目數(shù)據(jù),那么就產(chǎn)生了圖7B中所示的名稱數(shù)據(jù)。注意本變型例已經(jīng)特意描述了這樣一種情況,其中按照從相應(yīng)項(xiàng)目的最高重要性等級(jí)開始的順序僅提取了在步驟SA1中提取的項(xiàng)目數(shù)據(jù)單元中的預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)單元,但是當(dāng)然也可以按照從相應(yīng)項(xiàng)目的最低重要性等級(jí)開始的順序?qū)︻A(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)單元進(jìn)行提取。如此做使得可通過(guò)按照從最低重要性等級(jí)開始的順序僅鏈接在上面的步驟SA1中提取的項(xiàng)目數(shù)據(jù)單元中的預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)單元來(lái)產(chǎn)生名稱數(shù)據(jù)。
(C-4)第四變型例在上面的實(shí)施例中,描述了未預(yù)先將頁(yè)面圖像數(shù)據(jù)存儲(chǔ)在文檔處理裝置110的非易失性存儲(chǔ)單元220b中的情況。然而,當(dāng)然能夠?qū)㈨?yè)面圖像數(shù)據(jù)附加地寫入到已經(jīng)寫入頁(yè)面圖像數(shù)據(jù)的非易失性存儲(chǔ)單元220b中。然而,在這種情況下,需要確保已經(jīng)存儲(chǔ)在非易失性存儲(chǔ)單元220b中的頁(yè)面圖像數(shù)據(jù)的名稱與新存儲(chǔ)的頁(yè)面數(shù)據(jù)的名稱不同,這可通過(guò)如下地修改上述實(shí)施例中所述的文檔處理裝置來(lái)實(shí)現(xiàn)。
首先,圖9中所示的項(xiàng)目列表與每個(gè)頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并被存儲(chǔ)在非易失性存儲(chǔ)單元220b中。該項(xiàng)目列表與表示對(duì)應(yīng)于該項(xiàng)目列表的頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中的項(xiàng)目的數(shù)據(jù)(例如表示那個(gè)項(xiàng)目的名稱的字符串下面稱作為“項(xiàng)目識(shí)別符”)相對(duì)應(yīng)地存儲(chǔ)了這樣的數(shù)據(jù),該數(shù)據(jù)用于表明用以表示由項(xiàng)目識(shí)別符指示的項(xiàng)目的內(nèi)容的項(xiàng)目數(shù)據(jù)是否已經(jīng)用于產(chǎn)生名稱數(shù)據(jù),該數(shù)據(jù)例如為值為0或1的標(biāo)記(此后稱之為使用狀態(tài)標(biāo)記)。例如,在圖9所示的項(xiàng)目列表中,其使用狀態(tài)標(biāo)記值為0的項(xiàng)目識(shí)別符表明與這些項(xiàng)目標(biāo)識(shí)符的內(nèi)容相關(guān)聯(lián)的項(xiàng)目數(shù)據(jù)未被用于產(chǎn)生名稱數(shù)據(jù)。換句話說(shuō),通過(guò)查閱在項(xiàng)目列表中存儲(chǔ)的內(nèi)容,能夠知道對(duì)應(yīng)于與項(xiàng)目列表相關(guān)聯(lián)的頁(yè)面圖像數(shù)據(jù)的文檔中的哪些項(xiàng)或這些項(xiàng)的哪些內(nèi)容在頁(yè)面圖像數(shù)據(jù)的名稱中有所反映。
圖10為表示由根據(jù)該變型例的文檔處理裝置的控制單元200執(zhí)行的紙件文檔數(shù)字化處理的流程的流程圖。圖10中所示的紙件文檔數(shù)字化處理與圖3中所示的紙件文檔數(shù)字化處理的不同之處在于執(zhí)行了用于判斷在步驟SA2產(chǎn)生的名稱數(shù)據(jù)是否與已經(jīng)存儲(chǔ)在非易失性存儲(chǔ)單元220b中的名稱數(shù)據(jù)相匹配的處理(圖10步驟SD1),以及當(dāng)步驟SD1中的判斷結(jié)果為“是”時(shí)執(zhí)行用于重新生成在步驟SA2中產(chǎn)生的名稱數(shù)據(jù)的處理(圖10步驟SD2)。
下面更加詳細(xì)地描述該過(guò)程。在圖10的步驟SD2中,控制單元200查閱項(xiàng)目列表,該項(xiàng)目列表與在步驟SD1中被判斷為匹配的名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)在非易失性存儲(chǔ)單元220b中,并指出還未被用于產(chǎn)生該名稱數(shù)據(jù)的項(xiàng)(此后稱之為“未使用項(xiàng)”)。接著,控制單元200通過(guò)只鏈接在步驟SA1提取的項(xiàng)目數(shù)據(jù)中的表示未使用項(xiàng)的內(nèi)容的項(xiàng)目數(shù)據(jù)來(lái)重新生成名稱數(shù)據(jù)。這使得即使在頁(yè)面圖像數(shù)據(jù)已經(jīng)存儲(chǔ)在非易失性存儲(chǔ)單元220b中的情況下也能夠避免多次附加相同的名稱。注意,在本變型例中,表述了僅使用與未使用項(xiàng)目相對(duì)應(yīng)的項(xiàng)目數(shù)據(jù)來(lái)重新生成名稱數(shù)據(jù)的情況,但也能夠通過(guò)將與未使用項(xiàng)目相應(yīng)的項(xiàng)目數(shù)據(jù)加入到已產(chǎn)生的名稱數(shù)據(jù)中來(lái)重新生成名稱數(shù)據(jù),或者通過(guò)用與未使用項(xiàng)目相對(duì)應(yīng)的部分項(xiàng)目數(shù)據(jù)代替用于產(chǎn)生該名稱數(shù)據(jù)的部分項(xiàng)目數(shù)據(jù)來(lái)重新生成名稱數(shù)據(jù)。換句話說(shuō),任何事都是可能的,只要使用與未使用項(xiàng)目相應(yīng)的項(xiàng)目數(shù)據(jù)來(lái)重新生成名稱數(shù)據(jù)和產(chǎn)生與現(xiàn)有的名稱數(shù)據(jù)不同的名稱數(shù)據(jù)。在本變型例中,已經(jīng)描述了這樣一種情況,其中表示將被附加于新存儲(chǔ)的頁(yè)面圖像數(shù)據(jù)的名稱的名稱數(shù)據(jù)被重新生成,但也可以更新存儲(chǔ)在非易失性存儲(chǔ)器220b中的名稱數(shù)據(jù)(即,表示附加于已經(jīng)存儲(chǔ)在非易失性存儲(chǔ)單元220b中的頁(yè)面圖像數(shù)據(jù)的名稱的名稱數(shù)據(jù))。
(C-5)第五變型例在上述的實(shí)施例中,描述了這樣一種情況,即其中用于使控制單元200實(shí)現(xiàn)根據(jù)本發(fā)明的文檔處理裝置的特定功能的軟件被預(yù)先存儲(chǔ)在非易失性存儲(chǔ)單元220b中。然而,當(dāng)然也能夠?qū)⑺鲕浖鎯?chǔ)在計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)中,例如CD-ROM(光盤-只讀存儲(chǔ)器)和DVD(數(shù)字萬(wàn)用盤),并使用該存儲(chǔ)介質(zhì)將所述軟件安裝到普通的計(jì)算機(jī)裝置中。其具有這樣的效果,即其能夠使普通計(jì)算機(jī)裝置用作根據(jù)本發(fā)明的文檔處理裝置。
如上所述,本發(fā)明提供了一種文檔處理裝置,包括用于輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)的輸入單元;提取單元,其分析通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù),指明與該頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,并提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;產(chǎn)生單元,用于鏈接由提取單元提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔的名稱的字符串;和寫入單元,其將通過(guò)產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)與通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將該名稱數(shù)據(jù)和該頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
根據(jù)該文檔處理裝置,與文檔中的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)和與所述文檔的內(nèi)容相對(duì)應(yīng)的名稱數(shù)據(jù)被彼此關(guān)聯(lián)并被寫入到所述存儲(chǔ)裝置。
根據(jù)本發(fā)明的另一個(gè)實(shí)施例,所述文檔處理裝置進(jìn)一步包括存儲(chǔ)類型數(shù)據(jù)的類型數(shù)據(jù)存儲(chǔ)器,所述類型數(shù)據(jù)為表示文檔類型的字符串,并且所述產(chǎn)生單元從由提取單元提取的項(xiàng)目數(shù)據(jù)中排除與存儲(chǔ)在類型數(shù)據(jù)存儲(chǔ)器中的類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)來(lái)產(chǎn)生名稱數(shù)據(jù)。根據(jù)該實(shí)施例,名稱數(shù)據(jù)是在排除類型數(shù)據(jù)之后產(chǎn)生的,所述類型數(shù)據(jù)為在相同類型的文檔中共同列舉的并且是在將這些文檔與其它類型的文檔分類時(shí)所使用的項(xiàng)目的項(xiàng)目數(shù)據(jù)。其具有這樣的效果,即其能夠從名稱數(shù)據(jù)中排除在相同類型的文檔中所共同包含的項(xiàng)目的項(xiàng)目數(shù)據(jù),或者換句話說(shuō),能夠在排除缺少關(guān)于這些相同類型文檔的差別特性的項(xiàng)目數(shù)據(jù)之后產(chǎn)生名稱數(shù)據(jù)。
根據(jù)另一個(gè)實(shí)施例,所述文檔處理裝置進(jìn)一步包括重要數(shù)據(jù)存儲(chǔ)器,其用于存儲(chǔ)表示在文檔中出現(xiàn)的每個(gè)項(xiàng)目的重要等級(jí)的重要性等級(jí)數(shù)據(jù);以及產(chǎn)生單元,所述產(chǎn)生單元根據(jù)存儲(chǔ)在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中的重要性等級(jí)數(shù)據(jù)為與項(xiàng)目數(shù)據(jù)對(duì)應(yīng)的每個(gè)項(xiàng)目指定重要性等級(jí),并通過(guò)按照重要性等級(jí)升序或降序鏈接預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)來(lái)產(chǎn)生名稱數(shù)據(jù)。根據(jù)本實(shí)施例,產(chǎn)生了反映文檔中包含的每個(gè)項(xiàng)目的重要性等級(jí)的名稱數(shù)據(jù)。其具有這樣的效果,即通過(guò)查閱與頁(yè)面圖像數(shù)據(jù)相關(guān)存儲(chǔ)的名稱數(shù)據(jù)能夠知道在與頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中列舉的內(nèi)容的重要性等級(jí),并且還可以防止增加名稱數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度。
根據(jù)另一個(gè)實(shí)施例,所述文檔處理裝置還包括名稱數(shù)據(jù)存儲(chǔ)器,用于存儲(chǔ)由所述產(chǎn)生單元為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);如果根據(jù)由輸入單元輸入的頁(yè)面圖像數(shù)據(jù)產(chǎn)生的名稱數(shù)據(jù)與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的其它名稱數(shù)據(jù)相匹配,則所述產(chǎn)生單元根據(jù)與其它名稱數(shù)據(jù)相關(guān)聯(lián)的并被存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表指定表示未使用項(xiàng)目的內(nèi)容的項(xiàng)目數(shù)據(jù),所述未使用項(xiàng)目數(shù)據(jù)為由所述提取單元提取的且在產(chǎn)生其它名稱數(shù)據(jù)時(shí)未被使用的項(xiàng)目數(shù)據(jù),并且所述產(chǎn)生單元使用與所述未使用項(xiàng)目相對(duì)應(yīng)的項(xiàng)目數(shù)據(jù)重新生成名稱數(shù)據(jù)。該實(shí)施例具有這樣的效果,即其能夠確保被存儲(chǔ)的新頁(yè)面圖像數(shù)據(jù)所附加的名稱數(shù)據(jù)與附加給其頁(yè)面圖像數(shù)據(jù)已經(jīng)存儲(chǔ)在存儲(chǔ)單元中的其它文檔的名稱數(shù)據(jù)不同,或者換句話說(shuō),能夠避免附加給文檔的名稱數(shù)據(jù)產(chǎn)生重復(fù)。
根據(jù)另一實(shí)施例,所述文檔處理裝置進(jìn)一步包括名稱數(shù)據(jù)存儲(chǔ)器,用于存儲(chǔ)由所述產(chǎn)生單元為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);識(shí)別單元,用于識(shí)別由產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)是否為與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的任何一個(gè)名稱數(shù)據(jù)相匹配的重復(fù)名稱數(shù)據(jù);確定單元,用于在名稱數(shù)據(jù)已經(jīng)被識(shí)別單元識(shí)別為是重復(fù)名稱數(shù)據(jù)的情況下,根據(jù)與所述名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定未使用項(xiàng)目,所述未使用項(xiàng)目是在產(chǎn)生所述名稱數(shù)據(jù)時(shí)未使用的項(xiàng)目。和重寫單元,用于以使用由確定單元確定的未使用項(xiàng)的項(xiàng)目數(shù)據(jù)產(chǎn)生的新名稱數(shù)據(jù)重寫已經(jīng)由識(shí)別單元將其識(shí)別為是重復(fù)名稱數(shù)據(jù)的名稱數(shù)據(jù)。本實(shí)施例也具有這樣的效果,即其能夠沒有失敗地避免在附加給文檔的名稱數(shù)據(jù)中產(chǎn)生重復(fù)。
此外,本發(fā)明還提供了一種文檔處理方法,其包括輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù);分析輸入的頁(yè)面圖像數(shù)據(jù);確定與被分析的頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容;提取表示所述確定內(nèi)容的字符串的項(xiàng)目數(shù)據(jù);通過(guò)鏈接所提取的項(xiàng)目數(shù)據(jù)產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔的名稱的字符串;和將產(chǎn)生的名稱數(shù)據(jù)與輸入的頁(yè)面圖像數(shù)據(jù)彼此相關(guān)聯(lián)地寫入第一存儲(chǔ)器。
根據(jù)另一個(gè)實(shí)施例,所述文檔處理方法進(jìn)一步包括存儲(chǔ)類型數(shù)據(jù),所述類型數(shù)據(jù)為表示類型數(shù)據(jù)存儲(chǔ)器中的文檔類型的字符串,并且在產(chǎn)生名稱數(shù)據(jù)時(shí),不使用與存儲(chǔ)在類型數(shù)據(jù)存儲(chǔ)器中的類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)。
根據(jù)另一個(gè)實(shí)施例,所述文檔處理方法進(jìn)一步包括在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)重要性等級(jí)數(shù)據(jù),所述重要性等級(jí)數(shù)據(jù)表示文檔中出現(xiàn)的每個(gè)項(xiàng)目的重要性等級(jí),并且在產(chǎn)生名稱數(shù)據(jù)時(shí),根據(jù)存儲(chǔ)在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中的重要性等級(jí)數(shù)據(jù)確定與項(xiàng)目數(shù)據(jù)對(duì)應(yīng)的每個(gè)項(xiàng)目的重要性等級(jí),并按照重要性等級(jí)升序或降序鏈接預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)。
根據(jù)另一個(gè)實(shí)施例,所述文檔處理方法還包括在名稱數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);并且如果根據(jù)輸入的頁(yè)面圖像數(shù)據(jù)產(chǎn)生的名稱數(shù)據(jù)與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的其它名稱數(shù)據(jù)相匹配,則根據(jù)與其它名稱數(shù)據(jù)相關(guān)聯(lián)的并被存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是提取的項(xiàng)目數(shù)據(jù)并且表示在產(chǎn)生其它名稱數(shù)據(jù)時(shí)未被使用的項(xiàng)目,并使用與所述未使用項(xiàng)目相對(duì)應(yīng)的項(xiàng)目數(shù)據(jù)重新生成名稱數(shù)據(jù)。
根據(jù)另一實(shí)施例,所述文檔處理方法進(jìn)一步包括在名稱數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);確定所產(chǎn)生的名稱數(shù)據(jù)是否為與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的任何一個(gè)名稱數(shù)據(jù)相匹配的重復(fù)名稱數(shù)據(jù);當(dāng)確定所述名稱數(shù)據(jù)為重復(fù)名稱數(shù)據(jù)時(shí),根據(jù)與所述名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定未使用項(xiàng)目,這種未使用項(xiàng)目是在產(chǎn)生名稱數(shù)據(jù)時(shí)未使用的項(xiàng)目;和用使用被確定為未使用項(xiàng)目的項(xiàng)目數(shù)據(jù)產(chǎn)生的新名稱數(shù)據(jù)重寫已經(jīng)被確定為是重復(fù)名稱數(shù)據(jù)的名稱數(shù)據(jù)。
此外,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于記錄使計(jì)算機(jī)執(zhí)行以下功能的程序,所述功能包括當(dāng)輸入了與文檔中的頁(yè)面圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)時(shí),分析所述頁(yè)面圖像數(shù)據(jù),確定與頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;鏈接所提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)為表示將附加于所述文檔的名稱的字符串;和將所產(chǎn)生的名稱數(shù)據(jù)與已經(jīng)輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián),并將所述名稱數(shù)據(jù)和頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
對(duì)于該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),與文檔中的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)和與文檔的內(nèi)容相對(duì)應(yīng)的名稱數(shù)據(jù)被彼此相關(guān)地寫入所述存儲(chǔ)裝置。
為了解釋和說(shuō)明的目的,前面已經(jīng)給出了本發(fā)明的實(shí)施例的說(shuō)明。但這些實(shí)施例并不是窮舉的,也不是用于將本發(fā)明限制在所公開的精確形式。很明顯,許多修改和變化對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見的。所述各實(shí)施例是被選擇說(shuō)明的,以最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,以便由此能夠使本領(lǐng)域技術(shù)人員理解本發(fā)明的各個(gè)實(shí)施例及其各種修改,以適合于特定的預(yù)期應(yīng)用,本發(fā)明的范圍由下述的權(quán)利要求及其等同所限定。
本申請(qǐng)要求于2004年8月19日申請(qǐng)的日本專利申請(qǐng)第2004-239479號(hào)的優(yōu)先權(quán),其全部?jī)?nèi)容通過(guò)引用而被并入本文中。
權(quán)利要求
1.一種文檔處理裝置,包括輸入單元,用于輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù);提取單元,其分析通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù),確定與所述頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,并提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;產(chǎn)生單元,用于鏈接由所述提取單元提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔的名稱的字符串;和寫入單元,其將通過(guò)產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)與通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將所述名稱數(shù)據(jù)和頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
2.根據(jù)權(quán)利要求1所述的文檔處理裝置,進(jìn)一步包括類型數(shù)據(jù)存儲(chǔ)器,用于存儲(chǔ)類型數(shù)據(jù),所述類型數(shù)據(jù)為表示文檔類型的字符串;其中所述產(chǎn)生單元使用所述提取單元提取的項(xiàng)目數(shù)據(jù)中的與存儲(chǔ)在類型數(shù)據(jù)存儲(chǔ)器中的類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)之外的項(xiàng)目數(shù)據(jù)來(lái)產(chǎn)生名稱數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的文檔處理裝置,進(jìn)一步包括重要性等級(jí)數(shù)據(jù)存儲(chǔ)器,其用于存儲(chǔ)表示在文檔中出現(xiàn)的每個(gè)項(xiàng)目的重要性等級(jí)的重要性等級(jí)數(shù)據(jù);其中所述產(chǎn)生單元根據(jù)存儲(chǔ)在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中的重要性等級(jí)數(shù)據(jù)為與項(xiàng)目數(shù)據(jù)對(duì)應(yīng)的每個(gè)項(xiàng)目指定重要性等級(jí),并通過(guò)按照重要性等級(jí)的升序或降序鏈接預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)來(lái)產(chǎn)生名稱數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的文檔處理裝置,還包括名稱數(shù)據(jù)存儲(chǔ)器,用于存儲(chǔ)由所述產(chǎn)生單元為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉所述文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔的頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);其中,如果根據(jù)通過(guò)輸入單元輸入的頁(yè)面圖像數(shù)據(jù)產(chǎn)生的名稱數(shù)據(jù)與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的其它名稱數(shù)據(jù)相匹配,則所述產(chǎn)生單元根據(jù)與其它名稱數(shù)據(jù)相關(guān)聯(lián)的并被存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定表示未使用項(xiàng)目的內(nèi)容的項(xiàng)目數(shù)據(jù),所述未使用項(xiàng)目數(shù)據(jù)為由所述提取單元提取的且是在產(chǎn)生其它名稱數(shù)據(jù)時(shí)未被使用的項(xiàng)目數(shù)據(jù),并且所述產(chǎn)生單元使用與所述未使用項(xiàng)目相對(duì)應(yīng)的項(xiàng)目數(shù)據(jù)重新生成名稱數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的文檔處理裝置,進(jìn)一步包括名稱數(shù)據(jù)存儲(chǔ)器,用于存儲(chǔ)由所述產(chǎn)生單元為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);識(shí)別單元,用于識(shí)別由產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)是否是與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的任何一個(gè)名稱數(shù)據(jù)相匹配的重復(fù)名稱數(shù)據(jù);確定單元,用于在名稱數(shù)據(jù)已經(jīng)被所述識(shí)別單元識(shí)別為是重復(fù)名稱數(shù)據(jù)的情況下,根據(jù)與所述名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定未使用項(xiàng)目,所述未使用項(xiàng)目是在產(chǎn)生名稱數(shù)據(jù)時(shí)未使用的項(xiàng)目;和重寫單元,用于用使用由所述確定單元確定的未使用項(xiàng)目的項(xiàng)目數(shù)據(jù)產(chǎn)生的新的名稱數(shù)據(jù)來(lái)重寫已經(jīng)由識(shí)別單元將其識(shí)別為是重復(fù)名稱數(shù)據(jù)的名稱數(shù)據(jù)。
6.一種文檔處理方法,包括輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù);分析輸入的頁(yè)面圖像數(shù)據(jù);確定與所分析的頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容;提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所確定的內(nèi)容的字符串;通過(guò)鏈接所提取的項(xiàng)目數(shù)據(jù)產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔的名稱的字符串;和將所產(chǎn)生的名稱數(shù)據(jù)與輸入的頁(yè)面圖像數(shù)據(jù)彼此相關(guān)聯(lián)地寫入第一存儲(chǔ)器。
7.根據(jù)權(quán)利要求6所述的文檔處理方法,進(jìn)一步包括存儲(chǔ)類型數(shù)據(jù),所述類型數(shù)據(jù)為表示類型數(shù)據(jù)存儲(chǔ)器中的文檔類型的字符串;其中,在產(chǎn)生所述名稱數(shù)據(jù)時(shí),不使用與存儲(chǔ)在類型數(shù)據(jù)存儲(chǔ)器中的類型數(shù)據(jù)相匹配的項(xiàng)目數(shù)據(jù)。
8.根據(jù)權(quán)利要求6所述的文檔處理方法,進(jìn)一步包括在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)重要性等級(jí)數(shù)據(jù),所述重要性等級(jí)數(shù)據(jù)表示文檔中出現(xiàn)的每個(gè)項(xiàng)目的重要性等級(jí);其中在產(chǎn)生名稱數(shù)據(jù)時(shí),根據(jù)存儲(chǔ)在重要性等級(jí)數(shù)據(jù)存儲(chǔ)器中的重要性等級(jí)數(shù)據(jù)確定與項(xiàng)目數(shù)據(jù)對(duì)應(yīng)的每個(gè)項(xiàng)目的重要性等級(jí),并按照重要性等級(jí)的升序或降序鏈接預(yù)定數(shù)量的項(xiàng)目數(shù)據(jù)。
9.根據(jù)權(quán)利要求6所述的文檔處理方法,還包括在名稱數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);其中,如果根據(jù)輸入的頁(yè)面圖像數(shù)據(jù)產(chǎn)生的名稱數(shù)據(jù)與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的其它名稱數(shù)據(jù)相匹配,則根據(jù)與其它名稱數(shù)據(jù)相關(guān)聯(lián)的并被存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是提取的項(xiàng)目數(shù)據(jù)并且表示在產(chǎn)生其它名稱數(shù)據(jù)時(shí)未被使用的項(xiàng)目,并且使用與所述未使用項(xiàng)目相對(duì)應(yīng)的項(xiàng)目數(shù)據(jù)重新生成所述名稱數(shù)據(jù)。
10.根據(jù)權(quán)利要求6所述的文檔處理方法,進(jìn)一步包括在名稱數(shù)據(jù)存儲(chǔ)器中存儲(chǔ)為所述文檔產(chǎn)生的名稱數(shù)據(jù)和列舉所述文檔的每個(gè)頁(yè)面中包含的項(xiàng)目的項(xiàng)目列表,所述名稱數(shù)據(jù)和項(xiàng)目列表與對(duì)應(yīng)于文檔頁(yè)面的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ);確定所產(chǎn)生的名稱數(shù)據(jù)是否是與存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的任何一個(gè)名稱數(shù)據(jù)相匹配的重復(fù)名稱數(shù)據(jù);當(dāng)確定所述名稱數(shù)據(jù)為重復(fù)名稱數(shù)據(jù)時(shí),根據(jù)與所述名稱數(shù)據(jù)相關(guān)聯(lián)地存儲(chǔ)在名稱數(shù)據(jù)存儲(chǔ)器中的項(xiàng)目列表確定未使用項(xiàng)目,所述未使用項(xiàng)目是在產(chǎn)生名稱數(shù)據(jù)時(shí)未使用的項(xiàng)目;和用使用所確定的未使用項(xiàng)目的項(xiàng)目數(shù)據(jù)產(chǎn)生的新名稱數(shù)據(jù)來(lái)重寫已經(jīng)被確定為是重復(fù)名稱數(shù)據(jù)的所述名稱數(shù)據(jù)。
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于記錄使計(jì)算機(jī)執(zhí)行下列功能的程序,所述功能包括當(dāng)輸入與文檔中的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù)時(shí),分析所述頁(yè)面圖像數(shù)據(jù),確定與所述頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,并提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;鏈接所提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)為表示將附加于所述文檔的名稱的字符串;和將所產(chǎn)生的名稱數(shù)據(jù)與已經(jīng)輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián),并將所述名稱數(shù)據(jù)和所述頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
全文摘要
文檔處理裝置、文檔處理方法及記錄其程序的存儲(chǔ)介質(zhì)。本發(fā)明提供的文檔處理裝置包括輸入單元,用于輸入與文檔的頁(yè)面的圖像相對(duì)應(yīng)的頁(yè)面圖像數(shù)據(jù);提取單元,其分析所述輸入單元輸入的頁(yè)面圖像數(shù)據(jù),確定與該頁(yè)面圖像數(shù)據(jù)相對(duì)應(yīng)的文檔中包含的每個(gè)項(xiàng)目的內(nèi)容,并提取項(xiàng)目數(shù)據(jù),所述項(xiàng)目數(shù)據(jù)是表示所述內(nèi)容的字符串;產(chǎn)生單元,用于連接由提取單元提取的項(xiàng)目數(shù)據(jù)并產(chǎn)生名稱數(shù)據(jù),所述名稱數(shù)據(jù)是表示將被附加于所述文檔的名稱的字符串;和寫入單元,其將所述產(chǎn)生單元產(chǎn)生的名稱數(shù)據(jù)與由輸入單元輸入的頁(yè)面圖像數(shù)據(jù)相關(guān)聯(lián)并將所述名稱數(shù)據(jù)和頁(yè)面圖像數(shù)據(jù)寫入存儲(chǔ)器。
文檔編號(hào)G06F17/30GK1738352SQ20051005541
公開日2006年2月22日 申請(qǐng)日期2005年3月17日 優(yōu)先權(quán)日2004年8月19日
發(fā)明者佐藤直子, 田川昌俊, 田宗道弘, 伊藤篤, 田代潔, 增市博, 劉紹明, 石川恭輔 申請(qǐng)人:富士施樂株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
阿图什市| 西乌珠穆沁旗| 城步| 台湾省| 沅陵县| 沈阳市| 白朗县| 建瓯市| 衡阳市| 龙里县| 大同县| 扬中市| 宣恩县| 郧西县| 饶平县| 钟山县| 招远市| 麻城市| 无为县| 闽侯县| 宜宾市| 湖州市| 龙陵县| 浙江省| 扶沟县| 岢岚县| 临安市| 茂名市| 湄潭县| 林甸县| 小金县| 都匀市| 沽源县| 顺义区| 乌拉特后旗| 渭南市| 徐闻县| 信宜市| 桑日县| 富顺县| 中宁县|