欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種機(jī)器輔助網(wǎng)頁翻譯方法及其系統(tǒng)的制作方法

文檔序號(hào):6382904閱讀:365來源:國知局
專利名稱:一種機(jī)器輔助網(wǎng)頁翻譯方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種機(jī)器輔助網(wǎng)頁翻譯方法及其系統(tǒng)。
背景技術(shù)
網(wǎng)頁翻譯系統(tǒng)的譯準(zhǔn)率長期徘徊在70%左右,譯文的可讀性、系統(tǒng)對(duì)語言現(xiàn)象的覆蓋面、系統(tǒng)的魯棒性尤其是開放性都不盡人意。社會(huì)迫切需要對(duì)真實(shí)文本(尤其是網(wǎng)上海量文本)進(jìn)行大規(guī)模的處理,而網(wǎng)頁翻譯系統(tǒng)同當(dāng)今社會(huì)對(duì)大規(guī)模真實(shí)文本處理的期望相差甚遠(yuǎn)。機(jī)器輔助翻譯(Computer Aided Translation,簡稱CAT)的思想就是在這樣的背景下產(chǎn)生的。與全自動(dòng)機(jī)器翻譯系統(tǒng)相比較,機(jī)器輔助翻譯系統(tǒng)是一種人機(jī)交互式系統(tǒng)。在這種翻譯模式中,計(jì)算機(jī)負(fù)責(zé)輔助翻譯人員的任務(wù),不僅給翻譯人員提供一些詞匯、術(shù)語、短語翻譯的知識(shí),而且從已翻譯過文本中查找相同或相似語句的譯文,使翻譯人員避免不必要的重復(fù)勞動(dòng),進(jìn)行高效率的翻譯工作。計(jì)算機(jī)輔助翻譯的重要思想(包括基于翻譯記憶技術(shù)和基于實(shí)例模式的翻譯技術(shù))是在翻譯記憶庫(雙語對(duì)齊庫)和實(shí)例模式庫中 搜索相同或相似的句子或短語,給出參考譯文。翻譯人員充分利用已有的翻譯資源,盡量避免重復(fù)勞動(dòng)。這種輔助翻譯機(jī)制特別適合于科技專著、科技文獻(xiàn)、產(chǎn)品說明書、使用手冊、聯(lián)合國文件等這種篇幅長、重復(fù)語言現(xiàn)象較多的文本類型的翻譯,能幫助翻譯人員消除重復(fù)的翻譯勞動(dòng),只需專注于新內(nèi)容的翻譯。機(jī)器翻譯記憶庫技術(shù)的機(jī)器輔助翻譯軟件基于這樣一個(gè)簡單的事實(shí)由于專業(yè)翻譯領(lǐng)域所涉及的翻譯資料數(shù)量巨大,而范圍相對(duì)狹窄,集中于某個(gè)或某幾個(gè)專業(yè),如政治、經(jīng)濟(jì)、軍事、航天、計(jì)算機(jī)、通訊等專業(yè)都有自己的專業(yè)翻譯公司或部門。這就必然帶來翻譯資料的不同程度的重復(fù)。據(jù)統(tǒng)計(jì),在不同行業(yè)和部門,這種資料的重復(fù)率達(dá)到209Γ70%不等。這就意味著譯者至少有20%以上的工作是無謂的重復(fù)勞動(dòng)。翻譯記憶技術(shù)就是從這里著手,首先致力于消除譯者的重復(fù)勞動(dòng),從而提高工作效率。網(wǎng)頁翻譯功能是指在不改變網(wǎng)頁格式的前提下,將瀏覽器顯示的網(wǎng)頁上的語言文字翻譯成使用者所需要的語言文字。目前常見的網(wǎng)頁翻譯技術(shù)多是針對(duì)以超文字標(biāo)記語言(Hyper Text Markup Language, HTML)所寫成的網(wǎng)頁進(jìn)行翻譯,其原理系先取得網(wǎng)頁之源文件(也就是HTML檔)的內(nèi)容,之后尋找網(wǎng)頁中需要翻譯的文字(即HTML卷標(biāo)之間的文字)進(jìn)行翻譯,然后將翻譯的結(jié)果替代原文,并生成新的網(wǎng)頁,再指示瀏覽器顯示新生成的網(wǎng)頁。

發(fā)明內(nèi)容
為了克服上述背景技術(shù)中的不足之處,本發(fā)明提供一種機(jī)器輔助網(wǎng)頁翻譯系統(tǒng),包括接收網(wǎng)頁模塊、讀取網(wǎng)頁模塊以及翻譯網(wǎng)頁模塊,所述的翻譯網(wǎng)頁模塊通過以下幾個(gè)步驟實(shí)現(xiàn)
第一步,翻譯過程,在翻譯新句子的時(shí)候,搜索翻譯記憶庫,對(duì)該句和記憶庫中翻譯單元進(jìn)行對(duì)比和匹配,挑出原文最接近的翻譯單元,給出參考譯文;
第二步,自動(dòng)建庫,自動(dòng)分析和匹配原文和譯文,以句子為單位將原文和譯文一一對(duì)應(yīng)然后自動(dòng)生成一個(gè)標(biāo)準(zhǔn)的翻譯記憶庫文件,用戶所有的資料都可以通過該工具得到回收;第三步,術(shù)語管理。對(duì)所有的術(shù)語進(jìn)行規(guī)范,一次性建立一個(gè)或多個(gè)標(biāo)準(zhǔn)術(shù)語列表,在使用翻譯記憶系統(tǒng)翻譯時(shí),打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,會(huì)自動(dòng)識(shí)別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文;
第四步,多語種之間進(jìn)行雙向互譯;
第五步,自動(dòng)排版,譯文自動(dòng)套用原文的格式,進(jìn)行自動(dòng)排版。根據(jù)一種采用上述方法的機(jī)器輔助網(wǎng)頁翻譯系統(tǒng),其包括接收網(wǎng)頁模塊、讀取網(wǎng)頁模塊以及翻譯網(wǎng)頁模塊,所述接收網(wǎng)頁模塊通過解析器對(duì)網(wǎng)頁進(jìn)行解析獲得文件對(duì)象模型,所述讀取網(wǎng)頁模塊讀取所述文件對(duì)象模型,所述翻譯網(wǎng)頁模塊對(duì)網(wǎng)頁進(jìn)行翻譯、建庫、術(shù)語管理以及雙向互譯和排版。


為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見,下面描述中的附圖僅僅是本發(fā)明的部分實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其它附圖。圖1示出了根據(jù)本發(fā)明的網(wǎng)頁翻譯流程。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。根據(jù)本發(fā)明的一個(gè)實(shí)施例,如圖1所示,一個(gè)機(jī)器輔助網(wǎng)頁翻譯系統(tǒng)包括接收網(wǎng)頁模塊、讀取網(wǎng)頁模塊以及翻譯網(wǎng)頁模塊,所述接收網(wǎng)頁模塊通過解析器對(duì)網(wǎng)頁進(jìn)行解析獲得文件對(duì)象模型,所述讀取網(wǎng)頁模塊讀取所述文件對(duì)象模型,所述翻譯網(wǎng)頁模塊對(duì)網(wǎng)頁進(jìn)行翻譯、建庫、術(shù)語管理以及雙向互譯和排版。在接收到網(wǎng)頁后,會(huì)由解析器對(duì)此網(wǎng)頁進(jìn)行解析而取得文件對(duì)象模型,此文件對(duì)象模型即儲(chǔ)存在接收模塊中。在本實(shí)施例中,解析器是與一般瀏覽器內(nèi)建的解析器(如微軟的MSXML)相似。讀取模塊是用以讀取文件對(duì)象模型的文字節(jié)點(diǎn)中的第一語言文字,并將其輸出至翻譯模塊。其中,讀取模塊是以指令碼(script)或程序來讀取文件對(duì)象模型中的信息,如Java script、VB script或是PHP等程序語言。其中的翻譯網(wǎng)頁通過以下幾個(gè)步驟實(shí)現(xiàn)翻譯過程、自動(dòng)建庫、術(shù)語管理、多語種間雙向互譯以及自動(dòng)排版
第一步,翻譯過程,在翻譯新句子的時(shí)候,搜索翻譯記憶庫,對(duì)該句和記憶庫中翻譯單元進(jìn)行對(duì)比和匹配,挑出原文最接近的翻譯單元,給出參考譯文;
第二步,自動(dòng)建庫,自動(dòng)分析和匹配原文和譯文,以句子為單位將原文和譯文一一對(duì)應(yīng)然后自動(dòng)生成一個(gè)標(biāo)準(zhǔn)的翻譯記憶庫文件,用戶所有的資料都可以通過該工具得到回收; 第三步,術(shù)語管理。對(duì)所有的術(shù)語進(jìn)行規(guī)范,一次性建立一個(gè)或多個(gè)標(biāo)準(zhǔn)術(shù)語列表,在使用翻譯記憶系統(tǒng)翻譯時(shí),打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,會(huì)自動(dòng)識(shí)別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文;
第四步,多語種之間進(jìn)行雙向互譯;
第五步,自動(dòng)排版,譯文自動(dòng)套用原文的格式,進(jìn)行自動(dòng)排版。具體描述為
翻譯記憶產(chǎn)品會(huì)自動(dòng)"記憶"住用戶翻譯的每一句翻譯,在翻譯新句子的時(shí)候,搜索翻譯記憶庫,對(duì)該句和記憶庫中翻譯單元進(jìn)行對(duì)比和匹配,挑出原文最接近的翻譯單元,給出參考譯文。用戶可以接受該譯文,也可以做一些修改,修改后的新譯文會(huì)自動(dòng)存入記憶庫,供以后使用。由于專業(yè)領(lǐng)域詞匯和句式相對(duì)固定,當(dāng)用戶積累了多個(gè)有一定規(guī)模的記憶庫后,遇到的重復(fù)句子會(huì)越來越多,翻譯工作也變得越來越輕松。一般的翻譯記憶產(chǎn)品還都支持網(wǎng)絡(luò)共享記憶庫功能。也就是說,當(dāng)多人同時(shí)進(jìn)行翻譯時(shí),可以通過局域網(wǎng)共享一個(gè)翻譯記憶庫,每個(gè)在線的翻譯人員都可以實(shí)時(shí)地調(diào)用他人的工作成果。對(duì)于在使用翻譯記憶產(chǎn)品前,已經(jīng)積累了大量翻譯資料的用戶,翻譯記憶產(chǎn)品會(huì)提供一個(gè)自動(dòng)建庫工具。該工具能自動(dòng)分析和匹配原文和譯文,以句子為單位將原文和譯文一一對(duì)應(yīng)。用戶做完一些調(diào)整和校對(duì)之后,該工具會(huì)自動(dòng)生成一個(gè)標(biāo)準(zhǔn)的翻譯記憶庫文件。用戶所有的資料都可以通過該工具得到回收,從而高效、快捷地建立起翻譯記憶庫。這些庫在不斷的使用過程中,又會(huì)得到進(jìn)一步補(bǔ)充和完善。翻譯記憶產(chǎn)品一般還提供一個(gè)非常重要的功能是術(shù)語管理。對(duì)于專業(yè)技術(shù)領(lǐng)域來說,幾乎每篇文檔都帶有大量的專業(yè)術(shù)語,術(shù)語譯文的前后一致,始終是校對(duì)的重要內(nèi)容之一。這項(xiàng)工作費(fèi)時(shí)費(fèi)力,還難保會(huì)有疏漏。翻譯記憶產(chǎn)品通過一個(gè)術(shù)語管理工具(一般是電子辭典),來規(guī)范所有的術(shù)語。用戶只需一次性建立一個(gè)或多個(gè)標(biāo)準(zhǔn)術(shù)語列表(表中包括術(shù)語原文和譯文),在使用翻譯記憶系統(tǒng)翻譯時(shí),打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,會(huì)自動(dòng)識(shí)別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文。由于翻譯記憶實(shí)現(xiàn)的是原文和譯文的比較和匹配,帶來了翻譯記憶的一個(gè)先天優(yōu)勢一支持多語種之間的雙向互譯。以翻譯記憶軟件廠商德國塔多思(TRADOS)公司為例,該公司的產(chǎn)品基于Unicode,支持55種語言,覆蓋了幾乎所有語言版本的Windows95/98/NT。換句話說,一套產(chǎn)品就可以實(shí)現(xiàn)各語種間的雙向互譯,這在機(jī)器翻譯中是難以想象的。人不愿做的事情又豈止是重復(fù)勞動(dòng)。電子文檔的排版工作也是讓翻譯人員頭痛的工作。尤其本地化行業(yè),對(duì)譯文的格式要求極為嚴(yán)格,必須和原文檔的格式保持一致。在這方面,翻譯記憶產(chǎn)品又遠(yuǎn)遠(yuǎn)地走在了前頭。目前的翻譯記憶產(chǎn)品一般都提供各種格式處理工具,支持流行文檔格式,如DOC、RTF、HTML、SGML、PPT等等。譯文會(huì)自動(dòng)套用原文的格式,翻譯人員不必費(fèi)心排版,只要全神貫注從事翻譯就可以了。需要說明的是,以上實(shí)施例僅是對(duì)本發(fā)明技術(shù)方案的示例性描述,而并不是對(duì)本發(fā)明的限制;盡管參照上面的實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,但是,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)可以完全理解的是,在不脫離由本發(fā)明的權(quán)利要求書限定的保護(hù)范圍已經(jīng)精神的前提下,可以對(duì)上述實(shí)施例所記載的技術(shù)方案進(jìn)行修改或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換,這些都應(yīng)該屬于本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種機(jī)器輔助網(wǎng)頁翻譯方法,其特征在于包括以下幾個(gè)步驟 第一步,翻譯過程,在翻譯新句子的時(shí)候,搜索翻譯記憶庫,對(duì)該句和記憶庫中翻譯單元進(jìn)行對(duì)比和匹配,挑出原文最接近的翻譯單元,給出參考譯文;第二步,自動(dòng)建庫,自動(dòng)分析和匹配原文和譯文,以句子為單位將原文和譯文一一對(duì)應(yīng)然后自動(dòng)生成一個(gè)標(biāo)準(zhǔn)的翻譯記憶庫文件,用戶所有的資料都可以通過該工具得到回收;第三步,術(shù)語管理,對(duì)所有的術(shù)語進(jìn)行規(guī)范,一次性建立一個(gè)或多個(gè)標(biāo)準(zhǔn)術(shù)語列表,在使用翻譯記憶系統(tǒng)翻譯時(shí),打開術(shù)語管理工具中相應(yīng)的術(shù)語列表,會(huì)自動(dòng)識(shí)別出當(dāng)前句子中有哪些詞是已定義的術(shù)語,并給出標(biāo)準(zhǔn)的術(shù)語譯文; 第四步,多語種之間進(jìn)行雙向互譯; 第五步,自動(dòng)排版,譯文自動(dòng)套用原文的格式,進(jìn)行自動(dòng)排版。
2.一種采用權(quán)利要求1所述方法的機(jī)器輔助網(wǎng)頁翻譯系統(tǒng),其特征在于包括接收網(wǎng)頁模塊、讀取網(wǎng)頁模塊以及翻譯網(wǎng)頁模塊,所述接收網(wǎng)頁模塊通過解析器對(duì)網(wǎng)頁進(jìn)行解析獲得文件對(duì)象模型,所述讀取網(wǎng)頁模塊讀取所述文件對(duì)象模型,所述翻譯網(wǎng)頁模塊對(duì)網(wǎng)頁進(jìn)行翻譯、建庫、術(shù)語管理以及雙向互譯和排版。
全文摘要
本發(fā)明公開了一種機(jī)器輔助網(wǎng)頁翻譯系統(tǒng),包括接收網(wǎng)頁模塊、讀取網(wǎng)頁模塊以及翻譯網(wǎng)頁模塊,所述接收網(wǎng)頁模塊通過解析器對(duì)網(wǎng)頁進(jìn)行解析獲得文件對(duì)象模型,所述讀取網(wǎng)頁模塊讀取所述文件對(duì)象模型,所述翻譯網(wǎng)頁模塊對(duì)網(wǎng)頁進(jìn)行翻譯、建庫、術(shù)語管理以及雙向互譯和排版。該系統(tǒng)可以有效消除譯者的重復(fù)勞動(dòng),從而提高工作效率。
文檔編號(hào)G06F17/28GK103020044SQ20121050563
公開日2013年4月3日 申請日期2012年12月3日 優(yōu)先權(quán)日2012年12月3日
發(fā)明者宗競 申請人:江蘇樂買到網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
饶平县| 朝阳市| 安西县| 鄂州市| 田东县| 仪陇县| 延川县| 文水县| 涞水县| 临漳县| 河池市| 和平区| 南投县| 合山市| 汉川市| 永和县| 东台市| 红原县| 兴和县| 微山县| 雅江县| 刚察县| 四子王旗| 贺州市| 八宿县| 库尔勒市| 开封县| 沂南县| 多伦县| 稻城县| 河间市| 勐海县| 砀山县| 榕江县| 龙江县| 哈尔滨市| 景东| 皋兰县| 恩平市| 大方县| 太和县|