欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

Word文件轉(zhuǎn)換成XML文件的系統(tǒng)及方法

文檔序號:6563487閱讀:1054來源:國知局
專利名稱:Word文件轉(zhuǎn)換成XML文件的系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種Word文件轉(zhuǎn)換成XML文件的系統(tǒng)及方法,尤 其涉及一種將Word文件中的公式轉(zhuǎn)換成XML文件的系統(tǒng)及方法。
背景技術(shù)
隨著電子信息化的加速,各國政府都在加速實(shí)現(xiàn)辦公電子化,以 節(jié)約時間和成本,提高工作效率。以專利申請為例,現(xiàn)在各國、各地 區(qū)都在推行電子送件形式。這種電子送件需要將Word文件轉(zhuǎn)換成 XML (Extensible Markup Language,可擴(kuò)展標(biāo)記語言)文件,然后傳 送給專利審查官方機(jī)構(gòu)。
目前從Word文件中讀取對象(如公式、圖形等)都要復(fù)制到系 統(tǒng)剪貼板,對于傳統(tǒng)的B/S (Browser/Server,瀏覽器/服務(wù)器)模式, 服務(wù)器塢不能處理這種將Word中公式復(fù)制到系統(tǒng)剪貼板的情況。因 此,當(dāng)Word文件中包含有公式時,服務(wù)器端不能將Word文件中的 公式轉(zhuǎn)換成XML格式。

發(fā)明內(nèi)容
鑒于以上內(nèi)容,有必要提供一種Word文件轉(zhuǎn)換成XML文件的 系統(tǒng),其可將Word文件中的公式轉(zhuǎn)換成XML字符串。
鑒于以上內(nèi)容,還有必要提供一種Word文件轉(zhuǎn)換成XML文件 的方法,其可將Word文件中的公式轉(zhuǎn)換成XML字符串。
一種Word文件轉(zhuǎn)換成XML文件的系統(tǒng),包括用戶計算機(jī)、文 件轉(zhuǎn)換服務(wù)器及文件服務(wù)器,所述文件服務(wù)器中包含有需要轉(zhuǎn)換成 XML文件的Word文件,所述文件轉(zhuǎn)換服務(wù)器包括文件載入模塊, 用于從文件服務(wù)器中載入需要轉(zhuǎn)換成XML文件的Word文件,調(diào)用 組件對象模型組件獲取Word文件中包含的公式;公式轉(zhuǎn)換模塊,用于循環(huán)讀取Word文件中的每一個公式,將每一個公式載入剪貼板并 轉(zhuǎn)換成圖片文件,然后保存在固定路徑下,將圖片文件路徑存儲在一 個數(shù)組中;圖片文件處理模塊,用于依次讀取數(shù)組中的每一個元素, 根據(jù)該數(shù)組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片,并對該圖片進(jìn) 行處理,記錄下處理后圖片的像素大??;文件轉(zhuǎn)換模塊,用于依次讀 取Word文件中的每一個段落,按照圖片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則, 將該段落中的公式和文本轉(zhuǎn)換成對應(yīng)的XML字符串,然后根據(jù)不同 的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。
一種Word文件轉(zhuǎn)換成XML文件的方法,包括如下步驟從文 件服務(wù)器中載入需要轉(zhuǎn)換成XML文件的Word文件;調(diào)用組件對象 模型組件獲取Word文件中包含的公式;循環(huán)讀取Word文件中的每 一個公式,將每一個公式載入剪貼板并轉(zhuǎn)換成圖片文件,然后保存在 固定路徑下,將圖片文件路徑存儲在一個數(shù)組中;依次讀取數(shù)組中的 每一個元素,根據(jù)該數(shù)組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片, 并對該圖片進(jìn)行處理,記錄下處理后圖片的像素大小;依次讀取Word 文件中的每一個段落,按照圖片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則,將該段落 中的公式和文本轉(zhuǎn)換成對應(yīng)的XML字符串;根據(jù)不同的文件轉(zhuǎn)換模 板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。
相較于現(xiàn)有技術(shù),所述的Word文件轉(zhuǎn)換成XML文件的系統(tǒng)及 方法,可以將Word文件中的公式轉(zhuǎn)換成XML字符串,提高了專利 電子送件的效率。


圖1是本發(fā)明Word文件轉(zhuǎn)換成XML文件的系統(tǒng)較佳實(shí)施例的 系統(tǒng)架構(gòu)圖。
圖2是圖1所示文件轉(zhuǎn)換服務(wù)器的功能模塊圖。
圖3是本發(fā)明Word文件轉(zhuǎn)換成XML文件的方法較佳實(shí)施例的
流程圖。
圖4是圖3中Word文件轉(zhuǎn)換成XML文件的具體流程圖。
具體實(shí)施例方式
如圖1所示,是本發(fā)明Word文件轉(zhuǎn)換成XML文件的系統(tǒng)較佳 實(shí)施例的系統(tǒng)架構(gòu)圖。該系統(tǒng)主要包括用戶計算機(jī)10、網(wǎng)絡(luò)20、文 件轉(zhuǎn)換服務(wù)器30及文件服務(wù)器40。所述用戶計算機(jī)10用于向文件 轉(zhuǎn)換服務(wù)器30發(fā)送Word文件轉(zhuǎn)換成XML文件的請求,所述文件轉(zhuǎn) 換服務(wù)器30用于處理用戶計算機(jī)10的文件轉(zhuǎn)換請求,將Word文件 轉(zhuǎn)換成XML文件,該文件轉(zhuǎn)換服務(wù)器30連接有文件服務(wù)器40,用 于存儲需要轉(zhuǎn)換成XML文件的Word文件。所述用戶計算機(jī)10和文 件轉(zhuǎn)換服務(wù)器30通過網(wǎng)絡(luò)20連接。
在將Word文件轉(zhuǎn)換成XML文件前,文件轉(zhuǎn)換服務(wù)器30先將 Word文件中的所有^^式轉(zhuǎn)換成圖片并保存下來。當(dāng)在進(jìn)行Word文 件轉(zhuǎn)換遇到公式時,按照圖片轉(zhuǎn)換規(guī)則,將公式對應(yīng)的圖片轉(zhuǎn)換成 XML字符串,遇到文本時,按照文本轉(zhuǎn)換規(guī)則,將文本直接轉(zhuǎn)換成 XML字符串。然后,根據(jù)不同的文件轉(zhuǎn)換模板,將該XML字符串 轉(zhuǎn)換成對應(yīng)的XML文件。所述文件轉(zhuǎn)換才莫板可以是申請文件中的摘 要及權(quán)利要求書等。
如圖2所示,是圖1所示文件轉(zhuǎn)換服務(wù)器30的功能模塊圖。所 迷文件轉(zhuǎn)換服務(wù)器30包括文件載入模塊310,公式轉(zhuǎn)換模塊311,圖 片文件處理模塊312及文件轉(zhuǎn)換模塊313。本發(fā)明所稱的模塊是完成 一特定功能的計算機(jī)程序段,比程序更適合于描述軟件在計算機(jī)中的 執(zhí)行過程,因此在本發(fā)明對軟件描述中都以模塊描述,以下描述將結(jié) 合圖l和圖2進(jìn)行。
首先,當(dāng)用戶需要將Word文件轉(zhuǎn)換成XML文件時,通過用戶 計算機(jī)10向文件轉(zhuǎn)換服務(wù)器30發(fā)送Word文件轉(zhuǎn)換成XML文件的 請求,文件轉(zhuǎn)換服務(wù)器30接收到該文件轉(zhuǎn)換請求后,文件載入模塊 3i0,從文件服務(wù)器40中載入需要轉(zhuǎn)換成XML文件的Word文件, 調(diào)用COM (Component Object Model,組件對象才莫型)組件獲取Word 文件中包含的公式。
然后,公式轉(zhuǎn)換模塊311循環(huán)讀取Word文件中的每一個公式, 先將第一個公式載入剪貼板并轉(zhuǎn)換成圖片文件,然后保存在固定路徑 下(如文件轉(zhuǎn)換服務(wù)器30的磁盤上某個文件夾中),并將該圖片文 件路徑存儲在一個數(shù)組中。接著,公式轉(zhuǎn)換模塊311讀取下一個公式, 執(zhí)行相同的操作,直到把Word文件中所有的公式都轉(zhuǎn)換成圖片文件, 并將圖片文件路徑存儲到數(shù)組中。所述公式轉(zhuǎn)換模塊311轉(zhuǎn)換成的圖 片文件格式為TIF (Tag Image File,標(biāo)簽圖像文件)格式。
圖片文件處理模塊312依次讀取數(shù)組中的每一個元素,根據(jù)該數(shù) 組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片,調(diào)整圖片的清晰度,并 將所述TIF文件格式的圖像文件轉(zhuǎn)換成JPEG (Joint Photographic Experts Group,聯(lián)合圖像專家組)壓縮圖片,記錄下壓縮后圖片的像 素大小。所述聯(lián)合圖像專家組是一個在國際標(biāo)準(zhǔn)化組織(ISO, International Organization for Standardization)下從事靜態(tài)圖像壓縮標(biāo) 準(zhǔn)制定的委員會。
文件轉(zhuǎn)換模塊313依次讀取Word文件中的每一個段落,按照圖 片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則,將該段落中的公式和文本轉(zhuǎn)換成對應(yīng)的 XML字符串,然后根據(jù)不同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換 成對應(yīng)的XML文件。
具體而言,文件轉(zhuǎn)換模塊313先讀取Word文件的第一段,判斷 該段內(nèi)容是否包含公式,如果整段內(nèi)容都不包含公式,則根據(jù)文本轉(zhuǎn) 換規(guī)則,將該段落中文本內(nèi)容直接轉(zhuǎn)換成對應(yīng)的XML字符串。如果 該段內(nèi)容中包含有公式,則逐步讀取該段內(nèi)容的每一個字符,如果該 字符是公式,則按照圖片轉(zhuǎn)換規(guī)則,根據(jù)數(shù)組中保存的該公式對應(yīng)的 圖片地址,獲取該公式對應(yīng)的圖片,將該圖片轉(zhuǎn)換成對應(yīng)的XML字 符串。如果該字符是文本內(nèi)容,則按照文本轉(zhuǎn)換規(guī)則,將該字符轉(zhuǎn)換 成對應(yīng)的XML字符串。接著,文件轉(zhuǎn)換模塊313判斷Word文件的 所有段落是否讀取完畢,如果沒有讀取完畢,則讀取Word文件的下 一段,執(zhí)行相同的操作,直到把Word文件都轉(zhuǎn)換成XML字符串。
當(dāng)Word文件的所有段落都讀取完畢,文件轉(zhuǎn)換模塊313根據(jù)不
同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。例如, 當(dāng)在轉(zhuǎn)換說明書摘要時,則根據(jù)說明書摘要的轉(zhuǎn)換模板,將說明書摘 要的XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。當(dāng)在轉(zhuǎn)換權(quán)利要求書時, 則根據(jù)權(quán)利要求書的轉(zhuǎn)換模板,將權(quán)利要求書的XML字符串轉(zhuǎn)換成 對應(yīng)的XML文件。
如圖3所示,是本發(fā)明Word文件轉(zhuǎn)換成XML文件的方法較佳 實(shí)施例的流程圖。首先,步驟S401,文件載入模塊310根據(jù)用戶的 請求從文件服務(wù)器40中載入需要轉(zhuǎn)換成XML文件的Word文件。
步驟S402,調(diào)用COM組件獲取Word文件中包含的公式。
步驟S403,公式轉(zhuǎn)換模塊311循環(huán)讀取Word文件中的每一個公 式,先將第一個公式載入剪貼板并轉(zhuǎn)換成圖片文件,然后保存在固定 路徑下(如文件轉(zhuǎn)換服務(wù)器30的磁盤上某個文件夾中),并將該圖 片文件路徑存儲在一個數(shù)組中。接著,公式轉(zhuǎn)換模塊311讀取下一個 公式,執(zhí)行相同的操作,直到把Word文件中所有的公式都轉(zhuǎn)換成圖 片文件,并將圖片文件路徑存儲到數(shù)組中。所述公式轉(zhuǎn)換模塊311轉(zhuǎn) 換成的圖片文件格式為TIF (Tag Image File,標(biāo)簽圖像文件)格式。
步驟S404,圖片文件處理模塊312依次讀取數(shù)組中的每一個元 素,根據(jù)該數(shù)組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片,調(diào)整圖片 的清晰度,并將所述TIF文件格式的圖像文件轉(zhuǎn)換成JPEG (Jomt Photographic Experts Group,聯(lián)合圖像專家組)壓縮圖片,記錄下壓 縮后圖片的像素大小。
步驟S405,文件轉(zhuǎn)換模塊313依次讀取Word文件中的每一個段 蕩-,按照圖片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則,將該段落中的公式和文本轉(zhuǎn) 換成對應(yīng)的XML字符串,然后根據(jù)不同的文件轉(zhuǎn)換模板,將XML 字符串轉(zhuǎn)換成對應(yīng)的XML文件。該步驟的具體流程圖如圖4所示。
如圖4所示,是圖3中Word文件轉(zhuǎn)換成XML文件的具體流程
虔l。其中,步驟S4051,文件轉(zhuǎn)換模塊313先讀取Word文件的第一段。
步驟S4052,判斷該段內(nèi)容是否包含公式。
步驟S4053,如果整段內(nèi)容都不包含公式,則根據(jù)文本轉(zhuǎn)換規(guī)則, 將該段落中文本內(nèi)容直接轉(zhuǎn)換成對應(yīng)的XML字符串。
步驟S4054,如果該段內(nèi)容中包含有公式,則逐步讀取該段內(nèi)容 的每一個字符,如果該字符是公式,則按照圖片轉(zhuǎn)換規(guī)則,根據(jù)數(shù)組
中保存的該公式對應(yīng)的圖片地址,獲取該公式對應(yīng)的圖片,將該圖片 轉(zhuǎn)換成對應(yīng)的XML字符串。如果該字符是文本內(nèi)容,則按照文本轉(zhuǎn) 換規(guī)則,將該字符轉(zhuǎn)換成對應(yīng)的XML字符串。
步驟S4055,判斷Word文件的所有段落是否讀取完畢,如果沒 有讀取完畢,則讀取Word文件的下一段,流程回到S4051。
步驟S4066,如果Word文件的所有段落都讀取完畢,文件轉(zhuǎn)換 模塊313根據(jù)不同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的 XML文件。例如,在轉(zhuǎn)換說明書摘要時,則根據(jù)說明書摘要的轉(zhuǎn)換 模板,將說明書摘要的XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。在轉(zhuǎn) 換權(quán)利要求書時,則根據(jù)權(quán)利要求書的轉(zhuǎn)換模板,將權(quán)利要求書的 XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。
權(quán)利要求
1.一種Word文件轉(zhuǎn)換成XML文件的系統(tǒng),包括用戶計算機(jī)、文件轉(zhuǎn)換服務(wù)器及文件服務(wù)器,所述文件服務(wù)器中包含有需要轉(zhuǎn)換成XML文件的Word文件,其特征在于,所述文件轉(zhuǎn)換服務(wù)器包括文件載入模塊,用于從文件服務(wù)器中載入需要轉(zhuǎn)換成XML文件的Word文件,調(diào)用組件對象模型組件獲取Word文件中包含的公式;公式轉(zhuǎn)換模塊,用于循環(huán)讀取Word文件中的每一個公式,將每一個公式載入剪貼板并轉(zhuǎn)換成圖片文件,然后保存在固定路徑下,將圖片文件路徑存儲在一個數(shù)組中;圖片文件處理模塊,用于依次讀取數(shù)組中的每一個元素,根據(jù)該數(shù)組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片,并對該圖片進(jìn)行處理,記錄下處理后圖片的像素大??;及文件轉(zhuǎn)換模塊,用于依次讀取Word文件中的每一個段落,按照圖片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則,將該段落中的公式和文本轉(zhuǎn)換成對應(yīng)的XML字符串,然后根據(jù)不同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。
2. 如權(quán)利要求1所述的Word文件轉(zhuǎn)換成XML文件的系統(tǒng),其 特征在于,所述公式轉(zhuǎn)換模塊轉(zhuǎn)換成的圖片文件格式為標(biāo)簽圖像文 件。
3. 如權(quán)利要求2所述的Word文件轉(zhuǎn)換成XML文件的系統(tǒng),其 特征在于,所述圖片文件處理模塊對圖片進(jìn)行處理是指調(diào)整圖片的清 晰度,并將所述標(biāo)簽圖像文件轉(zhuǎn)換成JPEG壓縮圖片。
4. 一種Word文件轉(zhuǎn)換成XML文件的方法,其特征在于,該方 法包括如下步驟從文件服務(wù)器中載入需要轉(zhuǎn)換成XML文件的Word文件; 調(diào)用組件對象模型組件獲取Word文件中包含的公式; 循環(huán)讀取Word文件中的每一個公式,將每一個公式栽入剪貼板 并轉(zhuǎn)換成圖片文件,然后保存在固定路徑下,將圖片文件路徑存儲在 —f數(shù)組中;依次讀取數(shù)組中的每一個元素,根據(jù)該數(shù)組元素對應(yīng)的圖片文件 路徑獲取對應(yīng)的圖片,并對該圖片進(jìn)行處理,記錄下處理后圖片的像 素大小;依次讀取Word文件中的每一個段落,按照圖片轉(zhuǎn)換規(guī)則和文本 轉(zhuǎn)換規(guī)則,將該段落中的公式和文本轉(zhuǎn)換成對應(yīng)的XML字符串;及根據(jù)不同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML 文件。
5. 如權(quán)利要求4所述的Word文件轉(zhuǎn)換成XML文件的方法,其 特征在于,所述圖片文件的格式為標(biāo)簽圖像文件。
6. 如權(quán)利要求5所述的Word文件轉(zhuǎn)換成XML文件的方法,其 特征在于,所述對圖片進(jìn)行處理的步驟包括調(diào)整圖片的清晰度,并 將所述標(biāo)簽圖像文件轉(zhuǎn)換成JPEG壓縮文件。
全文摘要
一種Word文件轉(zhuǎn)換成XML文件的系統(tǒng)及方法,該方法包括如下步驟載入需要轉(zhuǎn)換成XML文件的Word文件;調(diào)用COM組件獲取Word文件中包含的公式;循環(huán)讀取Word文件中的每一個公式,將每一個公式載入剪貼板并轉(zhuǎn)換成圖片文件,然后保存在固定路徑下,將圖片文件路徑存儲在一個數(shù)組中;依次讀取數(shù)組中的每一個元素,根據(jù)該數(shù)組元素對應(yīng)的圖片文件路徑獲取對應(yīng)的圖片,并對該圖片進(jìn)行處理,記錄下處理后圖片的像素大?。灰来巫x取Word文件中的每一個段落,按照圖片轉(zhuǎn)換規(guī)則和文本轉(zhuǎn)換規(guī)則,將該段落中的公式和文本轉(zhuǎn)換成對應(yīng)的XML字符串;根據(jù)不同的文件轉(zhuǎn)換模板,將XML字符串轉(zhuǎn)換成對應(yīng)的XML文件。利用本發(fā)明可以將Word文件中的公式轉(zhuǎn)換成XML字符串。
文檔編號G06F17/30GK101196886SQ20061015736
公開日2008年6月11日 申請日期2006年12月8日 優(yōu)先權(quán)日2006年12月8日
發(fā)明者張文鋒, 張琛琛, 李忠一, 林海洪, 謝德意 申請人:鴻富錦精密工業(yè)(深圳)有限公司;鴻海精密工業(yè)股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
鹤山市| 惠来县| 大洼县| 右玉县| 和政县| 嵩明县| 怀宁县| 祁连县| 临沭县| 科技| 弥勒县| 和静县| 诸城市| 镇江市| 江安县| 临泽县| 太仆寺旗| 龙门县| 华亭县| 江北区| 彭山县| 沭阳县| 青海省| 搜索| 讷河市| 慈利县| 永福县| 普洱| 高阳县| 竹山县| 神木县| 黎川县| 荥阳市| 防城港市| 二连浩特市| 屯留县| 白山市| 睢宁县| 开化县| 旌德县| 罗源县|