欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語義約定全文翻譯系統(tǒng)和方法

文檔序號(hào):6587966閱讀:232來源:國(guó)知局
專利名稱:一種語義約定全文翻譯系統(tǒng)和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語義約定全文翻譯系統(tǒng)和方法,更確切地說是涉及一種采用多語通用語義約定統(tǒng)一編碼實(shí)現(xiàn)的全文翻譯系統(tǒng)和方法。
背景技術(shù)
開發(fā)出質(zhì)量可靠的全文機(jī)器翻譯技術(shù),一直是自然語言信息處理技術(shù)的夢(mèng)想與追求,但技術(shù)發(fā)展水平始終未能取得實(shí)質(zhì)性突破。其具體表現(xiàn)為全自動(dòng)翻譯質(zhì)量太差,不能滿足最基本的語義信息傳遞需求。輔助翻譯要求用戶必須懂得雙語,其應(yīng)用價(jià)值有限。語料庫(kù)翻譯只適合對(duì)相對(duì)固定文本提供內(nèi)容調(diào)整服務(wù),用戶需求面太窄。而以中間語言為基礎(chǔ)的多語翻譯技術(shù),則在中間語言設(shè)計(jì)原理和用戶學(xué)習(xí)成本方面均存在著實(shí)質(zhì)性問題,至今未見進(jìn)入實(shí)際應(yīng)用。
真正能夠進(jìn)入大規(guī)模實(shí)用的全文機(jī)器翻譯技術(shù)需要滿足以下基本要求第一,能夠保證語義信息傳遞質(zhì)量。第二,如果在翻譯過程中需要進(jìn)行人機(jī)交互,必須是用戶只需掌握一種語言(比如母語),而不是雙語。而要想在互聯(lián)網(wǎng)領(lǐng)域具有普遍應(yīng)用價(jià)值,還需要加上一條一次人機(jī)交互操作可自動(dòng)轉(zhuǎn)換為多種語言譯文,或者說,該技術(shù)應(yīng)該是一種多語通用的人機(jī)交互自然語言翻譯技術(shù)。
本發(fā)明的目的是設(shè)計(jì)一種可同時(shí)滿足以上三項(xiàng)要求的語義約定全文翻譯系統(tǒng)和方法。國(guó)際申請(qǐng)?zhí)枮镻CT/CN99/00046的“開放式全息模板式人機(jī)對(duì)話語言翻譯方法及全息語義標(biāo)注系統(tǒng)”已經(jīng)提出了此項(xiàng)技術(shù)的基本方法,本發(fā)明是對(duì)PCT/CN99/00046專利的補(bǔ)充。
自然語言的首要功能是語義通訊。實(shí)現(xiàn)語義通訊功能的基本前提,是通訊雙方對(duì)語言符號(hào)所代表的語義及語法功能具有相同的約定。因此,語義約定是一切語義信息傳遞的基本前提。
自然語言機(jī)器翻譯的首要功能也是語義通訊。機(jī)器翻譯不可能像人工翻譯一樣,根據(jù)上下文語言環(huán)境對(duì)句子中的多義詞語義和語法信息進(jìn)行準(zhǔn)確分析,因此,通過人機(jī)交互手段進(jìn)行原文語義約定,是保證原文語義求解質(zhì)量唯一可選擇的途徑。由于以句子為單元的原文語義分析結(jié)果即使完全正確,在轉(zhuǎn)換為線性排列的譯文符號(hào)后,也可能產(chǎn)生新增歧義。因此,只有在譯文端也提供以句子為單元的語義約定結(jié)果,才可能真正保證機(jī)器翻譯的語義信息傳遞質(zhì)量。
自然語言符號(hào)的語義具有自由約定特征任何人可以自由地創(chuàng)造新詞、舊詞新用法、甚至新語法(網(wǎng)絡(luò)語言發(fā)展之五花八門、日新月異,就是一個(gè)很好的例證)。因此,具有普遍應(yīng)用價(jià)值的機(jī)器翻譯方法,必須能夠保障用戶對(duì)符號(hào)語義的自由約定權(quán)利。
基于以上理由,人機(jī)交互語義約定技術(shù)實(shí)際上是機(jī)器翻譯的核心技術(shù),這種技術(shù)的功能目標(biāo)應(yīng)該是在保障用戶對(duì)符號(hào)語義自由約定權(quán)利的前提下,可將任意原文語義約定結(jié)果轉(zhuǎn)換為任意譯文的語義約定結(jié)果。

發(fā)明內(nèi)容
科學(xué)和技術(shù)的根本區(qū)別在于,科學(xué)的任務(wù)是發(fā)現(xiàn)客觀規(guī)律,而技術(shù)的任務(wù)是運(yùn)用客觀規(guī)律解決實(shí)際問題。因此,語義約定翻譯技術(shù)的設(shè)計(jì)原理來自于以下自然語言客觀規(guī)律遞歸約定正如朗曼英語詞典用一千多常用詞匯和標(biāo)準(zhǔn)語法對(duì)任意詞匯進(jìn)行語義約定一樣,各種自然語言的任意詞匯(包括表面語義與實(shí)際語義不符的各種固定搭配短語和句子)均可用其常用詞匯和標(biāo)準(zhǔn)語法對(duì)進(jìn)行語義約定。并且,一種自然語言的常用詞匯和標(biāo)準(zhǔn)語法,可以對(duì)任意其他語言的詞匯和語法進(jìn)行語義約定(如撰寫各種雙語詞典)。因此,遞歸約定是各種自然語言皆具有的語義約定基本規(guī)律。
循環(huán)約定各種自然語言常用基本詞匯的語義約定方法為循環(huán)約定(比如“好”表示使人滿意,“壞”的反義詞)。并且,基本詞匯與非基本詞匯之間也可進(jìn)行同義詞語義循環(huán)約定(比如美漂亮、美麗、好看、中看)。因此,語義循環(huán)約定也是各種自然語言皆具有的語義約定基本規(guī)律。
符號(hào)和概念冗余在不參照上下文語境的前提下,如果句子中缺損某個(gè)符號(hào)并不影響語義理解,并且讀者知道缺損的是什么符號(hào),那么,對(duì)于語義通訊而言,此符號(hào)屬于冗余符號(hào)(比如漢語句子“把那本書拿過來”中如果缺損“把”、“本”、“過”,寫成“那書拿來”,既不影響語義理解,讀者也知道缺損的是什么符號(hào))。對(duì)于實(shí)現(xiàn)自然語言的語義通訊功能而言,冗余符號(hào)(或者多義符號(hào)的冗余語義項(xiàng))不需要進(jìn)行語義約定。
語法冗余如果A語言中不存在的語法概念,在B語言中能夠正確添加,則對(duì)于語義通訊而言,此語法概念屬于冗余語法概念(比如漢語中不存在詞性概念,在翻譯為英語時(shí)卻能夠正確添加出各種詞性變化,說明缺損詞性概念并不影響語義理解,并且讀者知道缺損的是什么,否則無法無中生有地正確添加)。由于各種自然語言中的個(gè)性化語法概念均具有“在A語言中不存在,在B語言中能夠正確添加”的特征,故均屬于冗余語法概念。換句話說,雖然各種自然語言的語法體系和繁簡(jiǎn)程度有很大差別,但只有多語通用語法概念(不同語言語法概念交集)是組織句子語義的必要語法,因此只有多語通用語法概念需要進(jìn)行明確約定。
根據(jù)以上自然語言客觀規(guī)律,可以做出如下推論1、不同自然語言所有詞匯符號(hào)的語義,可由其有限基礎(chǔ)詞匯符號(hào)進(jìn)行遞歸約定;有限基礎(chǔ)詞匯符號(hào)的語義可用有限基礎(chǔ)詞匯符號(hào)+通用語法概念進(jìn)行循環(huán)約定。
2、如果一種自然語言詞匯符號(hào)(無論是基礎(chǔ)詞匯還是非基礎(chǔ)詞匯)的語義概念在另一種自然語言中沒有對(duì)應(yīng)符號(hào),對(duì)應(yīng)符號(hào)缺損方均可用該語言有限基礎(chǔ)詞匯符號(hào)+通用語法概念進(jìn)行語義描述。
3、各種自然語言有限基礎(chǔ)詞匯的語義概念并集和語法概念交集為有限集合,故可進(jìn)行統(tǒng)一的數(shù)字化編碼。并且該統(tǒng)一編碼結(jié)果,可對(duì)任意自然語言句子和符號(hào)的必要語義信息進(jìn)行遞推統(tǒng)一編碼。
根據(jù)以上原理,實(shí)現(xiàn)本發(fā)明的技術(shù)方案是這樣的一種語義約定全文翻譯系統(tǒng)和方法,其特征包括以下步驟A、提供以句子為單元的自然語言必要語義信息統(tǒng)一編碼方法;B、根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典;C、在語義約定人機(jī)交互模板上,用戶選擇自己熟悉的語言的以句子為單元進(jìn)行語義約定人機(jī)交互,語義約定結(jié)果自動(dòng)轉(zhuǎn)換為統(tǒng)一編碼;D、譯文轉(zhuǎn)換程序根據(jù)原文語義信息統(tǒng)一編碼結(jié)果和譯文轉(zhuǎn)換規(guī)則自動(dòng)生成不同自然語言譯文及譯文語義約定結(jié)果;E、譯文瀏覽器提供譯文轉(zhuǎn)換結(jié)果及譯文語義約定結(jié)果。
所述步驟A的以句子為單元的自然語言必要語義信息統(tǒng)一編碼方法負(fù)責(zé)對(duì)不同自然語言詞匯、固定搭配短語和句子符號(hào)中的必要語義信息進(jìn)行統(tǒng)一編碼;所述步驟B的不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典負(fù)責(zé)提供統(tǒng)一編碼及統(tǒng)一編碼所映射的不同自然語言詞匯符號(hào)和通用語法概念;所述步驟C的語義約定人機(jī)交互模板負(fù)責(zé)以句子為單元進(jìn)行語義約定人機(jī)交互以及將語義約定結(jié)果自動(dòng)轉(zhuǎn)換為統(tǒng)一編碼;所述步驟D的譯文轉(zhuǎn)換程序負(fù)責(zé)采用原文語義統(tǒng)一編碼結(jié)果調(diào)用譯文詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典中的映射對(duì)象,并根據(jù)譯文轉(zhuǎn)換規(guī)則自動(dòng)生成不同自然語言譯文;所述步驟E的譯文瀏覽器負(fù)責(zé)向譯文用戶提供譯文及譯文語義約定結(jié)果,以確保翻譯結(jié)果的語義信息傳遞質(zhì)量。
所述步驟A的以句子為單元的自然語言必要語義信息統(tǒng)一編碼方法包括1、對(duì)不同自然語言詞匯符號(hào)進(jìn)行語義概念統(tǒng)一編碼1)一級(jí)編碼a、取任意語言的基礎(chǔ)詞匯進(jìn)行基礎(chǔ)詞匯符號(hào)之間的語義循環(huán)描述,對(duì)多義詞的不同義項(xiàng)分別進(jìn)行語義循環(huán)描述。
b、根據(jù)符號(hào)語義循環(huán)描述結(jié)果將不同語言基礎(chǔ)符號(hào)的語義概念進(jìn)行匹配。如果不同語言的基礎(chǔ)詞匯之間出現(xiàn)語義概念不能對(duì)齊的詞匯符號(hào),則在排除冗余概念之后,用缺少對(duì)應(yīng)符號(hào)方的基礎(chǔ)符號(hào)以句子形式進(jìn)行語義描述。
c、給語義概念對(duì)齊的不同語言基礎(chǔ)概念建立語義統(tǒng)一編碼。
2)二級(jí)編碼a、以一級(jí)統(tǒng)一編碼為基礎(chǔ),以近義程度和語體、特指對(duì)象為坐標(biāo),對(duì)不同語言其它詞匯符號(hào)(可取2萬左右單詞)的所有語義項(xiàng)分別進(jìn)行二級(jí)統(tǒng)一編碼,多義項(xiàng)符號(hào)進(jìn)行多次編碼。
b、凡是不能獲得統(tǒng)一編碼的符號(hào)和義項(xiàng)的二級(jí)編碼對(duì)象,在排除冗余概念之后上升為一級(jí)編碼對(duì)象。
3)三級(jí)統(tǒng)一編碼對(duì)表面語義和實(shí)際語義不符的固定搭配短語、固定搭配句子,用已進(jìn)行一二級(jí)統(tǒng)一編碼的詞匯以句子形式進(jìn)行語義描述,實(shí)現(xiàn)三級(jí)統(tǒng)一編碼。
2、取任意自然語言的語法概念交集進(jìn)行統(tǒng)一編碼。
所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典的內(nèi)容包括不同語言表層符號(hào)、義項(xiàng)、上位語義、統(tǒng)一編碼;固定搭配短語及句子的統(tǒng)一編碼。
所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言通用語法詞典的內(nèi)容包括句法、時(shí)態(tài)、語態(tài)、語體。
所述步驟C的語義約定人機(jī)交互方法如下1、提供統(tǒng)一編碼的句子成分約定模板,供不同自然語言用戶對(duì)原文語料進(jìn)行句子成分約定人機(jī)交互。
2、提供統(tǒng)一編碼的不同語言詞匯符號(hào)語義約定模板,供不同自然語言用戶使用母語符號(hào)對(duì)原文語料符號(hào)進(jìn)行符號(hào)語義約定人機(jī)交互。
3、提供統(tǒng)一編碼的語法概念約定模板,供不同自然語言用戶使用母語符號(hào)對(duì)原文語料進(jìn)行語法概念約定人機(jī)交互。
所述步驟C的句子成分約定模板是一種空間定位句法約定模板,使用戶可通過在模板中拖動(dòng)句子符號(hào)的位置確定句子成分。(參見國(guó)際申請(qǐng)?zhí)枮镻CT/CN99/00046“開放式全息模板式人機(jī)對(duì)話語言翻譯方法及全息語義標(biāo)注系統(tǒng)”)所述步驟D的譯文轉(zhuǎn)換程序包括用統(tǒng)一編碼調(diào)用譯文詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典中所映射對(duì)象的程序及譯文轉(zhuǎn)換規(guī)則程序。
所述步驟E的譯文瀏覽器包括譯文瀏覽界面及供用戶查詢譯文語義約定結(jié)果的瀏覽界面。
所述步驟C的在語義約定模板上以句子為單元的語義約定,可以通過自動(dòng)檢索語義約定語料庫(kù)實(shí)現(xiàn);該語料庫(kù)通過以下方法自動(dòng)生成和調(diào)用1、每個(gè)用戶的原文語義約定結(jié)果(包括原文符號(hào)和統(tǒng)一編碼結(jié)果),通過該用戶終端的存儲(chǔ)設(shè)備存儲(chǔ),形成該用戶獨(dú)享的語義約定語料庫(kù)。
2、通過網(wǎng)絡(luò)瀏覽器進(jìn)行多語譯文轉(zhuǎn)換的原文語義約定結(jié)果,通過與該瀏覽器相連接的服務(wù)器存儲(chǔ)設(shè)備存儲(chǔ),形成用戶共享的語義約定語料庫(kù)。
3、所有用戶皆可用不同自然語言語料直接查詢其語義約定統(tǒng)一編碼結(jié)果。
所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典內(nèi)容更新方法是1、通過傳入譯文瀏覽器的原文統(tǒng)一編碼,自動(dòng)統(tǒng)計(jì)用戶新增詞匯符號(hào)(包括新增義項(xiàng))、固定搭配短語、句子的使用頻率。
2、根據(jù)新增詞匯符號(hào)(包括新增義項(xiàng))、固定搭配短語、句子的使用頻率統(tǒng)計(jì)結(jié)果,定期在不同語言版本的語義約定翻譯詞典中同時(shí)添加新詞(包括語義項(xiàng)更新)、固定搭配短語和句子。
具體實(shí)施例方式
下面結(jié)合實(shí)施例和附圖進(jìn)一步說明本發(fā)明的技術(shù)方案

圖1是詞匯符號(hào)語義約定統(tǒng)一編碼模板示意2是語義約定全文翻譯系統(tǒng)主流程框3是句子語義約定人機(jī)交互模板示意4是句子成分約定人機(jī)交互模板示意圖實(shí)施例參見圖1,如圖1-1所示,取漢語和英語的基礎(chǔ)詞匯進(jìn)行基礎(chǔ)詞匯語義循環(huán)描述漢語美麗使人看了感到快樂、舒服;英語beautyqualities that give pleasureto the senses or lift up the mind or spirit;給出語義統(tǒng)一編碼為0a01;如圖1-2所示,以近義程度和語體、特指對(duì)象為坐標(biāo),漢語“好看”的語義統(tǒng)一編碼為0a01C+1);英語“fair”的語義統(tǒng)一編碼為0a01E如圖1-3所示,對(duì)固定搭配短語“綠竹依依”,用已進(jìn)行一二級(jí)統(tǒng)一編碼的詞匯及通用語法進(jìn)行語義描述竹子的美態(tài)。
根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典內(nèi)容范例如下漢語表層符號(hào)好義項(xiàng)1使人滿意的....../上位語義(統(tǒng)一編碼)義項(xiàng)2贊許、同意....../上位語義(統(tǒng)一編碼)義項(xiàng)3友愛、和睦....../上位語義/(統(tǒng)一編碼)義項(xiàng)4容易....../上位語義(統(tǒng)一編碼)義項(xiàng)5非常、相當(dāng)....../上位語義(統(tǒng)一編碼)參見圖2,在圖2中,左側(cè)框圖的數(shù)字編碼的意義是系統(tǒng)主流程的基本步驟,右側(cè)框圖的數(shù)字編碼的意義是系統(tǒng)主流程運(yùn)行的相應(yīng)裝置。
執(zhí)行系統(tǒng)主流程1,調(diào)用系統(tǒng)裝置A(如PC、掌上電腦、移動(dòng)電話)中的用戶界面及語義約定翻譯系統(tǒng)應(yīng)用程序,輸入原文文字符號(hào);執(zhí)行系統(tǒng)主流程2,調(diào)用系統(tǒng)裝置B(如數(shù)據(jù)庫(kù)存儲(chǔ)器)中的原文固定搭配語義統(tǒng)一編碼詞典、詞匯語義統(tǒng)一編碼詞典、通用語法詞典及應(yīng)用程序,自動(dòng)進(jìn)行原文語義約定統(tǒng)一編碼;執(zhí)行系統(tǒng)主流程3,調(diào)用系統(tǒng)裝置C(如數(shù)據(jù)庫(kù)存儲(chǔ)器)中的原文語義約定人機(jī)交互模板(如圖3、4)、原文固定搭配語義統(tǒng)一編碼詞典、詞匯語義統(tǒng)一編碼詞典、通用語法詞典及應(yīng)用程序,供原文用戶對(duì)原文語義自動(dòng)約定結(jié)果進(jìn)行人機(jī)交互確認(rèn)及修改。
執(zhí)行系統(tǒng)主流程4,調(diào)用系統(tǒng)裝置D中的互聯(lián)網(wǎng)、蜂窩網(wǎng)數(shù)據(jù)傳輸設(shè)備進(jìn)行原文語義約定統(tǒng)一編碼傳輸,調(diào)用系統(tǒng)裝置D中的網(wǎng)絡(luò)服務(wù)器、PC存儲(chǔ)器、移動(dòng)通訊終端存儲(chǔ)器)存儲(chǔ)原文語義約定統(tǒng)一編碼;執(zhí)行系統(tǒng)主流程5,調(diào)用系統(tǒng)裝置E(如數(shù)據(jù)庫(kù)存儲(chǔ)器)中的譯文固定搭配語義統(tǒng)一編碼詞典、詞匯語義統(tǒng)一編碼詞典、通用語法詞典、譯文轉(zhuǎn)換規(guī)則及應(yīng)用程序進(jìn)行譯文和譯文語義約定結(jié)果自動(dòng)轉(zhuǎn)換;執(zhí)行系統(tǒng)主流程6,調(diào)用系統(tǒng)裝置F(如各種網(wǎng)絡(luò)通訊終端設(shè)備)中的語義約定翻譯瀏覽器供譯文用戶進(jìn)行譯文和語義約定結(jié)果瀏覽。
發(fā)明意義本發(fā)明以簡(jiǎn)潔可靠、難以淘汰的技術(shù)原理和人機(jī)交互方法,提供了只需母語交互即可保證語義信息傳遞質(zhì)量的全文機(jī)器翻譯通用技術(shù)。
本發(fā)明可用于提供短信翻譯、電子郵件翻譯、網(wǎng)頁信息翻譯、各類數(shù)據(jù)庫(kù)(比如數(shù)字圖書館)信息翻譯服務(wù),可提供電子商務(wù)多語洽談、多語交流專線、多語共享BBS,屬于網(wǎng)絡(luò)多語通訊領(lǐng)域的通用型應(yīng)用技術(shù)。
由于對(duì)于同一用戶而言,本發(fā)明的原文語義約定與譯文轉(zhuǎn)換調(diào)用的是同一語言的統(tǒng)一編碼詞庫(kù)和語法庫(kù),只需將相應(yīng)單語軟件裝入移動(dòng)電話中,即可以以短信通訊方式實(shí)現(xiàn)任意語言用戶之間的遠(yuǎn)程和面對(duì)面多語交流。
權(quán)利要求
1.一種語義約定全文翻譯系統(tǒng)和方法,其特征在于包括A、提供以句子為單元的自然語言必要語義信息統(tǒng)一編碼方法;B、根據(jù)自然語言必要語義信息統(tǒng)一編碼結(jié)果生成不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典;C、在語義約定人機(jī)交互模板上以句子為單元進(jìn)行原文語義約定人機(jī)交互,并將原文語義約定結(jié)果自動(dòng)轉(zhuǎn)換為語義信息統(tǒng)一編碼;D、根據(jù)原文語義信息統(tǒng)一編碼結(jié)果自動(dòng)生成不同自然語言譯文和譯文語義約定結(jié)果;E、譯文瀏覽器提供譯文及譯文語義約定結(jié)果瀏覽。
2.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟A的以句子為單元的自然語言必要語義信息統(tǒng)一編碼方法包括對(duì)不同自然語言詞匯符號(hào)語義概念進(jìn)行一、二、三級(jí)統(tǒng)一編碼;所述的一級(jí)編碼方法為取任意自然語言的基礎(chǔ)詞匯進(jìn)行該語言內(nèi)的基礎(chǔ)詞匯符號(hào)語義循環(huán)描述,多義詞不同義項(xiàng)分別進(jìn)行語義循環(huán)描述;根據(jù)基礎(chǔ)詞匯符號(hào)語義循環(huán)描述結(jié)果將不同語言的基礎(chǔ)符號(hào)的語義概念進(jìn)行語義匹配。如果A、B自然語言基礎(chǔ)符號(hào)的語義概念不能語義對(duì)齊,則在排除冗余概念之后,用缺少對(duì)應(yīng)概念符號(hào)方的基礎(chǔ)詞匯符號(hào)以句子形式進(jìn)行語義描述,并對(duì)不同語言語義概念對(duì)齊的基礎(chǔ)詞匯符號(hào)建立語義統(tǒng)一編碼;所述的二級(jí)編碼方法為以一級(jí)統(tǒng)一編碼結(jié)果為基礎(chǔ),以近義程度和語體、特指對(duì)象為坐標(biāo),對(duì)不同語言其它詞匯符號(hào)的所有語義項(xiàng)分別進(jìn)行二級(jí)統(tǒng)一編碼,多義項(xiàng)符號(hào)進(jìn)行多次編碼;凡是不能獲得二級(jí)統(tǒng)一編碼的詞匯符號(hào)和義項(xiàng),在排除冗余概念之后上升為一級(jí)編碼對(duì)象;所述的三級(jí)編碼方法為對(duì)固定搭配短語和句子,用已進(jìn)行一、二級(jí)語義統(tǒng)一編碼的詞匯符號(hào)及通用語法以句子形式進(jìn)行語義描述,實(shí)現(xiàn)三級(jí)統(tǒng)一編碼。
3.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟A的以句子為單元的自然語言必要語法信息統(tǒng)一編碼方法包括取任意自然語言的語法概念交集進(jìn)行語法概念統(tǒng)一編碼。
4.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典的內(nèi)容包括不同語言表層符號(hào)、義項(xiàng)描述、上位語義、統(tǒng)一編碼;固定搭配短語及句子的統(tǒng)一編碼。
所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言通用語法詞典內(nèi)容包括句法、時(shí)態(tài)、語態(tài)、語體。
5.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟C的語義約定人機(jī)交互方法包括提供統(tǒng)一編碼的句子成分約定模板,供不同自然語言用戶對(duì)原文語料進(jìn)行句子成分約定人機(jī)交互;提供統(tǒng)一編碼的不同語言詞匯符號(hào)語義約定模板,供不同自然語言用戶使用自己熟悉的語言符號(hào)對(duì)原文語料符號(hào)進(jìn)行語義約定人機(jī)交互;提供統(tǒng)一編碼的語法概念約定模板,供不同自然語言用戶使用自己熟悉的語言符號(hào)對(duì)原文語料進(jìn)行語法概念約定人機(jī)交互。
6.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟D的譯文轉(zhuǎn)換程序包括用統(tǒng)一編碼調(diào)用譯文詞匯符號(hào)語義統(tǒng)一編碼詞典和通用語法詞典中所映射對(duì)象的程序及譯文轉(zhuǎn)換規(guī)則程序。
7.根據(jù)權(quán)利要求1所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟E的譯文瀏覽器包括譯文瀏覽界面及供譯文用戶查詢的譯文語義約定結(jié)果瀏覽界面。
8.根據(jù)權(quán)利要求1和4所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟C的在語義約定模板上以句子為單元的自動(dòng)語義約定,可以通過自動(dòng)檢索語義約定語料庫(kù)實(shí)現(xiàn);該語料庫(kù)通過以下方法生成和調(diào)用每個(gè)用戶的原文語義約定統(tǒng)一編碼結(jié)果,通過該用戶的存儲(chǔ)設(shè)備存儲(chǔ),形成該用戶獨(dú)享的語義約定統(tǒng)一編碼語料庫(kù);通過語義約定翻譯瀏覽器進(jìn)行多語譯文轉(zhuǎn)換的原文語義約定統(tǒng)一編碼結(jié)果,通過與該瀏覽器相連接的服務(wù)器存儲(chǔ)設(shè)備存儲(chǔ),形成用戶共享的語義約定語料庫(kù);所有用戶皆可用不同自然語言語料直接查詢其語義約定統(tǒng)一編碼結(jié)果。
9.根據(jù)權(quán)利要求1和3所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟B的根據(jù)統(tǒng)一編碼結(jié)果生成為不同自然語言詞匯符號(hào)語義統(tǒng)一編碼詞典的內(nèi)容更新方法是通過傳入譯文瀏覽器的原文統(tǒng)一編碼,自動(dòng)統(tǒng)計(jì)用戶新增詞匯符號(hào)和新增義項(xiàng)、新增固定搭配短語、句子的使用頻率;根據(jù)新增詞匯符號(hào)和新增義項(xiàng)、新增固定搭配短語、句子的使用頻率,同時(shí)在不同語言版本的語義約定翻譯詞典中添加新詞(包括語義項(xiàng)更新)、固定搭配短語和句子。
10.根據(jù)權(quán)利要求1和2所述的語義約定全文翻譯系統(tǒng)和方法,其特征在于,所述步驟A的排除冗余符號(hào)的冗余標(biāo)準(zhǔn)是在不參照上下文語境的前提下,句子中缺損此概念表達(dá)符號(hào)不影響語義理解,并且讀者知道缺損的是什么符號(hào)。
全文摘要
本發(fā)明涉及一種語義約定全文翻譯系統(tǒng)和方法。該翻譯系統(tǒng)和方法作為一種多語通用的人機(jī)交互自然語言翻譯技術(shù)可以滿足以下要求保證語義信息傳遞質(zhì)量;人機(jī)交互只需使用母語;可自動(dòng)轉(zhuǎn)換為多種語言譯文。本發(fā)明可用于短信、電子郵件、網(wǎng)頁和各類數(shù)據(jù)庫(kù)(比如數(shù)字圖書館)信息翻譯,可提供電子商務(wù)多語洽談、多語交流專線、多語共享BBS,并且可以以短信通訊方式實(shí)現(xiàn)任意語言用戶之間的遠(yuǎn)程和面對(duì)面多語交流。
文檔編號(hào)G06F17/28GK1489086SQ0213141
公開日2004年4月14日 申請(qǐng)日期2002年10月10日 優(yōu)先權(quán)日2002年10月10日
發(fā)明者劉莎, 劉 莎 申請(qǐng)人:劉莎, 劉 莎
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
渭南市| 德安县| 南汇区| 德格县| 北票市| 三原县| 达孜县| 齐齐哈尔市| 太仓市| 镇康县| 华亭县| 墨竹工卡县| 阿克苏市| 会昌县| 禄丰县| 建阳市| 巴东县| 乌拉特中旗| 靖宇县| 共和县| 淮北市| 沙田区| 大同市| 常州市| 江都市| 山阳县| 团风县| 翼城县| 湟中县| 元谋县| 荥阳市| 濮阳县| 加查县| 沁阳市| 景谷| 犍为县| 南开区| 大厂| 长阳| 伊川县| 香港 |