欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于中文和東盟各國語言互譯的pda翻譯系統(tǒng)的制作方法

文檔序號:6378710閱讀:341來源:國知局
專利名稱:一種用于中文和東盟各國語言互譯的pda翻譯系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及翻譯技術(shù)領(lǐng)域,具體是一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)。
背景技術(shù)
翻譯機(jī)器技術(shù)經(jīng)過多年的發(fā)展,已經(jīng)形成了比較成熟的理論體系和應(yīng)用系統(tǒng)。目前國內(nèi)翻譯機(jī)器主要有兩類,一類是基于PC機(jī)上的翻譯軟件,如金山詞霸、金山快譯等;另一類是電子詞典,電子詞典在我國市場上己經(jīng)出現(xiàn)近十年,文曲星、快譯通、好記星等是國內(nèi)的知名品牌,隨著電子技術(shù)的進(jìn)步,消費(fèi)性信息家電的潮流已成為勢不可擋的趨勢,具有更強(qiáng)、更多功能的掌上電腦PDA已逐步取代電子詞典,掌上電腦轉(zhuǎn)型向智能手持機(jī)發(fā)展的趨勢也已經(jīng)越來越明顯。翻譯機(jī)器技術(shù)按照翻譯方法,可分為直接法(Direct)、基于規(guī)則的方法(Rule-Based)和基于語料庫的方法(Corpus—Based),其中基于語料庫的方法又可分為基于統(tǒng)計(jì)的方法(Statistics—Based)、基于實(shí)例的方法(Example-Based)和翻譯記憶的方法(Translation Memory’)。而這些單獨(dú)的翻譯機(jī)器策略,都因?yàn)楦鞣N原因存在著一些難以避免的弊端,語言的歧義、多義選擇、慣用表達(dá)等多種語言問題難以得到充分的解決。我國雖然已經(jīng)有一些商品化的翻譯機(jī)器系統(tǒng),但翻譯語種大多集中在英漢、日漢、俄漢等語言,目前在中國市場專注于小語種翻譯機(jī)器的生廠商很少,針對東盟國家的翻譯機(jī)器幾乎為空白。國內(nèi)現(xiàn)有翻譯機(jī)器存在以下不足I、我國雖然已經(jīng)有一些商品化的翻譯機(jī)器系統(tǒng),如文曲星等,但翻譯語種大多集中在英漢、日漢、俄漢等語言,針對漢語和東盟國家語言互譯的翻譯機(jī)器幾乎為空白。2.電子詞典存儲能力有限而且速度較慢,無操作系統(tǒng)或只有簡單的操作系統(tǒng),所有的程序都是固化在存儲器里,因而功能單一且不具有擴(kuò)充性。3.目前市場上的翻譯機(jī)采用芯片都是低端的8位、16位的CPU處理器,隨著網(wǎng)絡(luò)、通信、多媒體技術(shù)的發(fā)展,8位、16位的CPU在速度和內(nèi)存容量上己經(jīng)很難滿足這些領(lǐng)域的應(yīng)用需求,而且翻譯機(jī)無操作系統(tǒng)支持。4.電子詞典只能完成單詞的互譯,而基于PC機(jī)上的翻譯軟件雖然能完成文本的互譯,但是目前還沒有針對東盟國家的翻譯軟件。5.針對東盟國家的翻譯機(jī)器現(xiàn)在都缺少東盟語言的發(fā)音功能。

發(fā)明內(nèi)容
本發(fā)明的目的是針對上述現(xiàn)有翻譯機(jī)器存在的不足,提供一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),采用32位CPU處理器、內(nèi)嵌操作系統(tǒng)和彩色液晶觸摸屏,完成漢語和東盟四國語言的互譯,滿足與東盟四國交流中的語言互譯需求。本發(fā)明為了實(shí)現(xiàn)上述目的所采取的技術(shù)方案是一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),包括電池充電管理電路、電池電源、電源管理電路、CPU處理器、存儲器和液晶顯示系統(tǒng),所述的CPU處理器為32位CPU處理器,32位CPU處理器通過32位數(shù)據(jù)地址線與存儲器連接,存儲器包括中文字體庫和句子庫、英文字體庫和句子庫、越南文字體庫和句子庫以及泰國文字體庫和句子庫,存儲器還包括以下互譯詞典數(shù)據(jù)庫和語音庫中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫,中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫,中文和越南文互譯詞典數(shù)據(jù)庫與語音庫,中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫;所述的互譯詞典數(shù)據(jù)庫與語音庫中設(shè)置有索引,索引字段為定長字段型,索引對 應(yīng)的翻譯字段為變長字段型。所述的互譯詞典數(shù)據(jù)庫與語音庫中,中文按照拼音排序,馬來西亞文和印度尼西亞文按照字母排序,越南文和泰國文按照字母和聲調(diào)排序。所述的互譯詞典數(shù)據(jù)庫與語音庫中,存儲有詞條對應(yīng)的詞義,其中,中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫,每個馬來西亞文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的馬來西亞詞條;中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫中,每個印度尼西亞文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的印度尼西亞文詞條;中文和越南文互譯詞典數(shù)據(jù)庫與語音庫中,每個越南文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的越南文詞條;中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫中,每個泰國文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的泰國文詞條。所述的互譯詞典數(shù)據(jù)庫與語音庫中,還存儲有單詞的詞性。所述的互譯詞典數(shù)據(jù)庫與語音庫中,包括詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊。一種PDA翻譯設(shè)備,包括機(jī)殼,還包括上述用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)。所述的PDA翻譯設(shè)備,安裝有Windows CE或Windows Mobile操作系統(tǒng)。所述的PDA翻譯設(shè)備,還安裝有計(jì)算器模塊和記事本模塊。一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法,包括以下步驟(I)調(diào)用輸入法,輸入源語言句子;(2)對源語言進(jìn)行分詞處理,將句子處理成各單詞或短語的聯(lián)接組合;(3)確定源語言句子的詞性組合,并通過互譯詞典數(shù)據(jù)庫將分詞所得的單詞翻譯為目標(biāo)語言的詞匯;(4)查找目標(biāo)語言的句子庫,通過詞性、語義分類和原文匹配方式尋找與待翻譯部分匹配度最高的句子;(5)譯文生成輸出;(6)目標(biāo)語言的人員對輸出的譯文進(jìn)行人工判斷,譯文能正確理解即完成一次翻譯;目標(biāo)語言的人員對譯文不能理解,再對輸出的目標(biāo)語言句子的詞序和關(guān)鍵詞進(jìn)行調(diào)整后通過PDA將調(diào)整后的句子反饋給源語言的人員,源語言的人員判斷返回的譯文與原輸入的源語言句子表達(dá)一致,則完成翻譯;源語言的人員判斷返回的譯文與原輸入的源語言句子不一致,目標(biāo)語言的人員重新對輸出的譯文進(jìn)行人工判斷,至翻譯完成。所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法,步驟(4)中,利用詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊,通過詞匯或詞匯之間的調(diào)序,并依照句法結(jié)構(gòu)來抽取短語互譯對,或者按照短語互譯對的需要重新構(gòu)造一種基于句法的結(jié)構(gòu);將詞匯或短語調(diào)序關(guān)系和句法樹各個層次上節(jié)點(diǎn)的調(diào)序結(jié)合起來,通過詞對齊確定節(jié)點(diǎn)調(diào)序,然后計(jì)算短語對應(yīng)的句法結(jié)構(gòu)的調(diào)序概率,在翻譯記憶庫中查找完全相同的句子或相似的句子。本發(fā)明與現(xiàn)有的翻譯技術(shù)相比,具有以下有益效果( I)本發(fā)明通過建立互譯詞典數(shù)據(jù)庫及語音庫,并在數(shù)據(jù)庫選擇相應(yīng)的字段建立索引,通過選擇相應(yīng)的數(shù)據(jù)庫,再根據(jù)輸入的單詞相對應(yīng)的數(shù)據(jù)庫中建立的索引查詢到相對應(yīng)的外文單詞,通過分庫查詢來提高查詢的速度。(2)本發(fā)明根據(jù)數(shù)據(jù)庫中各個字段,設(shè)置數(shù)據(jù)庫中索引字段為定長字段型,而對應(yīng)的翻譯字段為變長字段型,使得既能保證查詢的速度,又能節(jié)省存貯的空間。(3)本發(fā)明針對東盟不同的國家安裝相應(yīng)的字庫文件,能夠解決東盟國家文字在PDA上顯示亂碼的問題,并根據(jù)不同國家文字的特定,編寫相應(yīng)的輸入法程序。 (4)本發(fā)明通過詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊,能夠顯著提高翻譯質(zhì)量;采用32位精簡指令的處理器、操作系統(tǒng)、數(shù)據(jù)庫進(jìn)行互譯PDA軟件開發(fā),能夠解決電子詞典查詢速度慢、詞典容量小的問題,并且PDA上的互譯軟件能夠應(yīng)用于智能手機(jī)上,通過手機(jī)的上網(wǎng)功能完成在PDA上無法實(shí)現(xiàn)的功能。


圖I是本發(fā)明所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的結(jié)構(gòu)示意圖。圖2是本發(fā)明所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法流程圖。
具體實(shí)施例方式以下結(jié)合附圖和實(shí)施例對本發(fā)明的技術(shù)方案做進(jìn)一步的說明。如圖I所示,一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),包括電池充電管理電路、電池電源、電源管理電路、CPU處理器、存儲器和液晶顯示系統(tǒng),所述的CPU處理器為32位CPU處理器,32位CPU處理器通過32位數(shù)據(jù)地址線與存儲器連接,存儲器包括中文字體庫和句子庫、英文字體庫和句子庫、越南文字體庫和句子庫、泰國文字體庫和句子庫、中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫、中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫、中文和越南文互譯詞典數(shù)據(jù)庫與語音庫以及中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫,四個互譯詞典數(shù)據(jù)庫與語音庫中均設(shè)置有索引,索引字段為定長字段型,索引對應(yīng)的翻譯字段為變長字段型。四個互譯詞典數(shù)據(jù)庫通過程序處理,生成兩種不同文字的排序的數(shù)據(jù)。即①中文和越南文互譯詞典數(shù)據(jù)庫。解決越南文和中文同義詞之間互譯。這個數(shù)據(jù)庫就利用現(xiàn)有的越中電子詞典的數(shù)據(jù)庫,并通過程序處理,自動生成按越南字母和聲調(diào)排序,和中文拼音排序的兩種不同文字的排序的數(shù)據(jù)。當(dāng)由越南文翻譯為中文時,通過程序就從越南文排序的數(shù)據(jù)中找出中文的同義詞,反之,當(dāng)由中文翻譯為越南文時,就從中文拼音排序的數(shù)據(jù)中找出越南文的同義詞。②中文和馬來西亞文互譯詞典數(shù)據(jù)庫、中文和印度尼西亞文互譯詞典數(shù)據(jù)庫。解決馬來文和中文、印尼文和中文之間的互譯,并通過程序處理,自動生成按馬來文、印尼文字母排序,和中文拼音排序的兩種不同文字的排序的數(shù)據(jù)。當(dāng)由馬來文翻譯為中文時,就從馬來文字母排序的數(shù)據(jù)中找出中文的同義詞,反之,當(dāng)由中文翻譯為馬來文時,就從中文拼音排序的數(shù)據(jù)中找出馬來文的同義詞。印尼文與中文的互譯也是進(jìn)行同樣的操作。③泰國文互譯詞典數(shù)據(jù)庫。解決泰國文和中文之間的互譯。并通過程序處理,自動生成按泰國文字母和聲調(diào)排序,和中文拼音排序的兩種不同文字的排序的數(shù)據(jù)。當(dāng)由泰國文翻譯為中文時,就從泰國文排序的數(shù)據(jù)中找出中文的同義詞,反之,當(dāng)由中文翻譯為泰國文時,就從中文拼音排序的數(shù)據(jù)中找出文的同義詞。開發(fā)泰國文、越南文、印尼文、馬來文、英文、中文、數(shù)字及符號的PDA字庫,由于馬來西亞文和印尼文詞匯字母的構(gòu)成與英文相同,因此馬來文和印尼文可以用英文字庫。馬來文和印尼文的輸入也采用英文的輸入來完成。越南文有33個字母,其中26個字母與英文字母相同,另外7個字母與英文不同,越南文中有12個元音,每個元音有6種聲調(diào),除平聲外,還有5個聲調(diào)符號。
泰文是在泰國用于書寫泰語和一些其他少數(shù)民族語言的字母,有44個輔音字母、21個元音字母、4個聲調(diào)符號、和一些標(biāo)點(diǎn)符號。泰語字母書寫水平從左至右,不分大寫和小寫。PDA翻譯系統(tǒng)的越南文輸入法,可直接輸入越南文。泰文輸入法可以完成泰國文的輸入。在存儲器中,建立一個兩種文字同義詞的數(shù)據(jù)庫。如為越南文翻譯為中文建立了一個數(shù)據(jù)庫。這個數(shù)據(jù)庫的特點(diǎn)是每一個越南文詞條,只對應(yīng)同義多個中文詞條,按多條同義詞條處理。同樣,中文有多個越南文釋義時,也要作為多個同義詞條處理,短語也作為一個詞條。而且,建立這樣的數(shù)據(jù)庫,如果我們基本是按越南文字母和聲調(diào)排序錄入的,錄入以后,還必需通過程序的處理,自動生成按中文拼音排序的數(shù)據(jù)。對中國與對應(yīng)國家建立相對應(yīng)的目標(biāo)語言和對應(yīng)的一個數(shù)據(jù)庫,生成了文字的排序后,雖然增加了存儲量,增加了詞典的成本,但提高了運(yùn)算速度,無論是越文翻譯為中文,還是中文翻譯為越文,速度都可以滿足使用的要求。詞庫中存儲的單詞除存儲有詞義外,還存儲有對應(yīng)的詞性如動詞(用V標(biāo)識等),當(dāng)輸入源語言后,首先對輸入的句子進(jìn)行分詞處理,將一句的文本分成各個單詞,然后在對應(yīng)的目標(biāo)語言詞庫中查找出現(xiàn)對應(yīng)的詞匯,并標(biāo)注出各個詞匯的詞性,將句子中各個單詞的連接轉(zhuǎn)換成各詞性的聯(lián)接并包含先后的聯(lián)接順序。四個互譯詞典數(shù)據(jù)庫中,還包括詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊。一種PDA翻譯設(shè)備,包括機(jī)殼和上述用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),并安裝有Windows CE或Windows Mobile操作系統(tǒng)、計(jì)算器模塊和記事本模塊。如圖2所示,用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法,具體步驟如下(I)調(diào)用輸入法,輸入源語言句子;(2)對源語言進(jìn)行分詞處理,將句子處理成各單詞或短語的聯(lián)接組合;(3)確定源語言句子的詞性組合,并通過互譯詞典數(shù)據(jù)庫將分詞所得的單詞翻譯為目標(biāo)語言的詞匯;
(4)根據(jù)源語言句子的詞性組合順序并結(jié)合查找所得的目標(biāo)語言的詞匯,并將源語言句子中除名詞以外的動詞、形容詞、副詞等詞匯作為關(guān)鍵詞在在目標(biāo)語言的句子庫中查找與句子中含源語言句子中關(guān)鍵詞匯對應(yīng)翻譯后的目標(biāo)語言詞匯并且與源語言詞性組合相同或相近的句子。通過建立詞匯和詞匯之間的調(diào)序模型實(shí)現(xiàn)調(diào)序,依照句法結(jié)構(gòu)來抽取短語互譯對,或者按照短語互譯對的需要重新構(gòu)造一種基于句法的結(jié)構(gòu)。依照詞匯、短語切分方式來考察句法樹相應(yīng)部分的調(diào)序關(guān)系,將詞匯、短語調(diào)序關(guān)系和句法樹各個層次上節(jié)點(diǎn)的調(diào)序結(jié)合起來,從而能夠克服詞匯、短語和句法樹結(jié)構(gòu)不一致帶來的困難。通過詞對齊確定節(jié)點(diǎn)調(diào)序,然后計(jì)算短語對應(yīng)的句法結(jié)構(gòu)的調(diào)序概率,并將調(diào)序概率作為所建立的線性模型中的一個特征,如果在翻譯記憶庫中找不到完全相同的句子,則進(jìn)行相似句的模糊查找,從而將句法特征融入詞匯、短語翻譯模型中。在句法分析樹的基礎(chǔ)上定義了一個新句法結(jié)構(gòu),并通過新的句法結(jié)構(gòu)建立了調(diào)序模型。所建立的句法結(jié)構(gòu)能夠和源語言句子的任意短語切分方式相對應(yīng),因此詞匯、短語抽取不受句法結(jié)構(gòu)約束,并且該模型對于翻譯過程中的詞匯、短語交叉現(xiàn)象不敏感,能夠較好 地和翻譯過程相結(jié)合。發(fā)明兼顧相同句的高效檢索和相似句的模糊檢索,在檢索過程中,對待翻譯句進(jìn)行分詞后,在翻譯詞庫中查找包含這些單詞的句子。在檢索到的句子中,通過相似程度的比較,計(jì)算出待翻譯句與例句的差異,這種方式除了能夠計(jì)算出相似度之外,還可以得到待翻譯句與例句中具體的差異,在輔助翻譯中給出這些差異可以使得用戶更高效地專注于這些不同之處的翻譯。該翻譯系統(tǒng)同時使用句法依存樹作為輸入進(jìn)行翻譯。原文匹配階段是翻譯系統(tǒng)的核心,其主要的技術(shù)即規(guī)則匹配的算法,模塊的思想為尋找句子中的主動詞,然后找到該主動詞相應(yīng)的配價模式,通過詞性、語義分類、原文匹配等方式尋找與待翻譯部分匹配度最高的句子。(5)譯文生成輸出在譯文生成階段中,首先根據(jù)匹配模式中的譯文模式生成匹配部分譯文,再利用默認(rèn)規(guī)則處理未能匹配的短語,最后將簡單句以特定的形式組裝、還原成為最終的譯文結(jié)果。此外,在該系統(tǒng)中,對否定詞、表示時態(tài)的助詞、副詞等內(nèi)容也進(jìn)行了相應(yīng)的處理,以便適應(yīng)中文與馬來文、印尼文、泰國文、越南文不同的表達(dá)方式。(6)翻譯結(jié)果的人工調(diào)整將句子使用目標(biāo)語言的文字在PDA屏幕上輸出后,目標(biāo)語言的人員閱讀翻譯后輸出的目標(biāo)語言句子,如果能準(zhǔn)確的理解句子的意思,就可以完成這一翻譯的過程,如果對翻譯的句子理解有歧義,就對輸?shù)哪繕?biāo)語言的句子進(jìn)行詞序的和關(guān)鍵詞進(jìn)行調(diào)整,并將調(diào)整后的句子通過PDA系統(tǒng)翻譯后反饋給源語言的輸入人員,源語言的人員閱讀后如果還有歧義就對句子進(jìn)行調(diào)整后再翻譯輸出,通過目標(biāo)語言和源語言兩方人員的調(diào)整和PDA的翻譯,最終獲得一個雙方都能理解的翻譯結(jié)果。
權(quán)利要求
1.一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),包括電池充電管理電路、電池電源、電源管理電路、CPU處理器、存儲器和液晶顯示系統(tǒng),其特征在于,所述的CPU處理器為32位CPU處理器,32位CPU處理器通過32位數(shù)據(jù)地址線與存儲器連接,存儲器包括中文字體庫和句子庫、英文字體庫和句子庫、越南文字體庫和句子庫以及泰國文字體庫和句子庫,存儲器還包括以下四個互譯詞典數(shù)據(jù)庫和語音庫 中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫, 中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫, 中文和越南文互譯詞典數(shù)據(jù)庫與語音庫, 中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫; 所述的四個互譯詞典數(shù)據(jù)庫與語音庫中均設(shè)置有索引,索引字段為定長字段型,索引對應(yīng)的翻譯字段為變長字段型。
2.根據(jù)權(quán)利要求I所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),其特征在于,所述的中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫中,中文按照拼音排序,馬來西亞文按照字母排序;所述的中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫中,中文按照拼音排序,印度尼西亞文按照字母排序;所述的中文和越南文互譯詞典數(shù)據(jù)庫與語音庫,中文按照拼音排序,越南文按照字母和聲調(diào)排序;所述的中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫中,中文按照拼音排序,泰國文按照字母和聲調(diào)排序。
3.根據(jù)權(quán)利要求2所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),其特征在于,所述的互譯詞典數(shù)據(jù)庫與語音庫中,存儲有詞條對應(yīng)的詞義和詞性,其中,中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫中,每個馬來西亞文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的馬來西亞詞條;中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫中,每個印度尼西亞文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的印度尼西亞文詞條;中文和越南文互譯詞典數(shù)據(jù)庫與語音庫中,每個越南文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的越南文詞條;中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫中,每個泰國文詞條只對應(yīng)同義的中文詞條,每個中文詞條只對應(yīng)同義的泰國文詞條。
4.根據(jù)權(quán)利要求3所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),其特征在于,所述的四個互譯詞典數(shù)據(jù)庫與語音庫中,均包括有詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊。
5.一種PDA翻譯設(shè)備,包括機(jī)殼,其特征在于,還包括權(quán)利要求1-4中任一項(xiàng)所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)。
6.根據(jù)權(quán)利要求5所述的PDA翻譯設(shè)備,其特征在于,所述的PDA翻譯設(shè)備,安裝有Windows CE 或 Windows Mobile 操作系統(tǒng)。
7.根據(jù)權(quán)利要求6所述的PDA翻譯設(shè)備,其特征在于,所述的PDA翻譯設(shè)備,還安裝有計(jì)算器模塊和記事本模塊。
8.一種適用于權(quán)利要求3所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法,其特征在于,包括以下步驟 (1)調(diào)用輸入法,輸入源語言句子; (2)對源語言進(jìn)行分詞處理,將句子處理成各單詞或短語的聯(lián)接組合; (3)確定源語言句子的詞性組合,并通過互譯詞典數(shù)據(jù)庫將分詞所得的單詞翻譯為目標(biāo)語言的詞匯;(4)查找目標(biāo)語言的句子庫,通過詞性、語義分類和原文匹配方式尋找與待翻譯部分匹配度最高的句子; (5)譯文生成輸出; (6)目標(biāo)語言的人員對輸出的譯文進(jìn)行人工判斷,譯文能正確理解即完成一次翻譯;目標(biāo)語言的人員對譯文不能理解,再對輸出的目標(biāo)語言句子的詞序和關(guān)鍵詞進(jìn)行調(diào)整后通過PDA將調(diào)整后的句子反饋給源語言的人員,源語言的人員判斷返回的譯文與原輸入的源語言句子表達(dá)一致,則完成翻譯;源語言的人員判斷返回的譯文與原輸入的源語言句子不一致,目標(biāo)語言的人員重新對輸出的譯文進(jìn)行人工判斷,至翻譯完成。
9.根據(jù)權(quán)利要求8所述的用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的翻譯方法,其特征在于,所述的步驟(4)中,利用詞匯或短語統(tǒng)計(jì)調(diào)序翻譯模塊,通過詞匯或詞匯之間的調(diào)序,并依照句法結(jié)構(gòu)來抽取短語互譯對,或者按照短語互譯對的需要重新構(gòu)造一種基于句法的結(jié)構(gòu);將詞匯或短語調(diào)序關(guān)系和句法樹各個層次上節(jié)點(diǎn)的調(diào)序結(jié)合起來,通過詞對齊確定節(jié)點(diǎn)調(diào)序,然后計(jì)算短語對應(yīng)的句法結(jié)構(gòu)的調(diào)序概率,在翻譯記憶庫中查找完全相同的句子或相似的句子。
全文摘要
一種用于中文和東盟各國語言互譯的PDA翻譯系統(tǒng),它的CPU處理器為32位CPU處理器,通過32位數(shù)據(jù)地址線與存儲器連接,存儲器包括中文字體庫和句子庫、英文字體庫和句子庫、越南文字體庫和句子庫、泰國文字體庫和句子庫、中文和馬來西亞文互譯詞典數(shù)據(jù)庫與語音庫、中文和印度尼西亞文互譯詞典數(shù)據(jù)庫與語音庫、中文和越南文互譯詞典數(shù)據(jù)庫與語音庫以及中文和泰國文互譯詞典數(shù)據(jù)庫與語音庫。安裝有中文和東盟各國語言互譯的PDA翻譯系統(tǒng)的PDA翻譯設(shè)備,通過輸入、分詞、詞匯互譯、查找句子、輸出和調(diào)整,最終實(shí)現(xiàn)中文和東盟各國語言的互譯,能夠解決東盟國家文字在PDA上顯示亂碼的問題,具有檢索查詢速度快和節(jié)省儲存空間的優(yōu)點(diǎn)。
文檔編號G06F17/28GK102929865SQ20121038724
公開日2013年2月13日 申請日期2012年10月12日 優(yōu)先權(quán)日2012年10月12日
發(fā)明者鄧力, 唐秋玲 申請人:廣西大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
定州市| 石渠县| 鄂伦春自治旗| 婺源县| 宁夏| 格尔木市| 永寿县| 鸡东县| 绵阳市| 连山| 弋阳县| 仁寿县| 郎溪县| 克山县| 奉新县| 确山县| 资溪县| 聂拉木县| 衡阳县| 沈阳市| 新郑市| 定远县| 蓝田县| 离岛区| 彭州市| 祁阳县| 沾化县| 桐庐县| 通辽市| 荔波县| 南川市| 富阳市| 西藏| 明光市| 双鸭山市| 江安县| 山阴县| 镇赉县| 微博| 商城县| 普兰店市|