欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

改進(jìn)型英漢翻譯機(jī)器的制作方法

文檔序號(hào):6656452閱讀:195來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):改進(jìn)型英漢翻譯機(jī)器的制作方法
一種基于分層自適應(yīng)選擇模板匹配替換算法的改進(jìn)型英漢翻譯機(jī)器,屬于G06F15/38類(lèi)計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域。
在專(zhuān)利英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中,已簡(jiǎn)要介紹過(guò)當(dāng)前實(shí)現(xiàn)機(jī)器翻譯的主要技術(shù)方案,并提出了基于模板匹配替換通用算法的新方案。
本發(fā)明的目的是提出分層自適應(yīng)選擇模板匹配替換算法,對(duì)專(zhuān)利英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)進(jìn)行改進(jìn),它可使系統(tǒng)的翻譯速度大大提高,翻譯實(shí)驗(yàn)表明可提高30至40倍。對(duì)于聯(lián)想PIII-550的機(jī)器,翻譯速度可以從原來(lái)的5-6個(gè)單詞/秒,提高到150-240個(gè)單詞/秒。
本發(fā)明的目的是通過(guò)以下方法實(shí)現(xiàn)的一種以邏輯運(yùn)算部件、存儲(chǔ)部件、視頻顯示部件和輸入部件為硬件基礎(chǔ)的改進(jìn)型英漢翻譯機(jī)器,其特征在于一.將英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)的模板翻譯規(guī)則庫(kù)按照一定的層次結(jié)構(gòu)分拆成多個(gè)規(guī)則庫(kù)(1)分拆的原則是層次相同的模板翻譯規(guī)則放在同一個(gè)規(guī)則庫(kù)文件中,結(jié)構(gòu)類(lèi)似的模板翻譯規(guī)則放在同一個(gè)規(guī)則庫(kù)文件中。
(2)在同一個(gè)規(guī)則庫(kù)文件中,所有起始項(xiàng)相同的規(guī)則按照項(xiàng)數(shù)多者在前的原則依相鄰順序組織在一起。
(3)在與源語(yǔ)言句子進(jìn)行匹配運(yùn)算時(shí),根據(jù)句子的類(lèi)型和結(jié)構(gòu)特征,即它是特殊疑問(wèn)句、一般疑問(wèn)句、反意疑問(wèn)句、陳述句還是感嘆句,以及是否可能帶有定語(yǔ)從句和賓語(yǔ)從句,從經(jīng)分拆得到的規(guī)則庫(kù)中選擇與句子可能相關(guān)的所有規(guī)則庫(kù),從而在規(guī)則庫(kù)層次上限制可能參與模板匹配運(yùn)算的規(guī)則總數(shù)。
(4)在與源語(yǔ)言句子進(jìn)行匹配運(yùn)算時(shí),按照先在可能相關(guān)的低層次規(guī)則庫(kù)中搜索,后在可能相關(guān)的高層次規(guī)則庫(kù)中搜索的順序,尋找可能與句子完全匹配模板翻譯規(guī)則。注明發(fā)明人在用VC++6.0進(jìn)行技術(shù)實(shí)現(xiàn)時(shí)將英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板翻譯規(guī)則庫(kù)分拆成41個(gè)規(guī)則庫(kù)。
二.利用“分層自適應(yīng)選擇模板匹配替換算法”,在可能相關(guān)的規(guī)則庫(kù)搜索尋找與待翻譯句子完全匹配的所有模板翻譯規(guī)則,代替英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)在整個(gè)規(guī)則庫(kù)中進(jìn)行搜索尋找的方案,可以使系統(tǒng)的翻譯速度大大提高,該算法的執(zhí)行流程是(1)從輸入部件輸入或者從存儲(chǔ)部件讀取要翻譯的源語(yǔ)言中的句子,并將它顯示在視頻顯示部件上。
(2)啟動(dòng)執(zhí)行算法的功能選項(xiàng),將句子分解并表示為以源語(yǔ)言中的詞匯、標(biāo)點(diǎn)等為基本單元的信息屬性結(jié)構(gòu),記錄句子長(zhǎng)度變量SentenceLength=基本單元的數(shù)目。
(3)對(duì)句子中的每個(gè)基本單元進(jìn)行形態(tài)分析,并記錄它的所有詞類(lèi)代碼和每個(gè)詞類(lèi)在目標(biāo)語(yǔ)言中的所有可能含義。
(4)確定句子的類(lèi)型和結(jié)構(gòu)特征,即它是特殊疑問(wèn)句、一般疑問(wèn)句、反意疑問(wèn)句、陳述句還是感嘆句,以及是否可能帶有定語(yǔ)從句和賓語(yǔ)從句。
(5)根據(jù)句子的類(lèi)型和結(jié)構(gòu)特征,從所有規(guī)則庫(kù)中選擇確定句子可能相關(guān)的規(guī)則庫(kù),并將這些規(guī)則庫(kù)按照從低層次到高層次的順序一一與句子按照(6)~(11)進(jìn)行自適應(yīng)選擇模板匹配替換運(yùn)算,令當(dāng)前規(guī)則庫(kù)為最低層次的規(guī)則庫(kù)。
(6)令句子當(dāng)前匹配位置變量CurrentPos=1。
(7)令當(dāng)前匹配原型變量CurrentProto=當(dāng)前匹配位置變量CurrentPos在句子中所指向單詞的原型,令當(dāng)前匹配類(lèi)型變量CurrentType=當(dāng)前匹配位置變量CurrentPos在句子中所指向單詞的第一個(gè)詞類(lèi)(或類(lèi)型)代碼,進(jìn)入(8)。
(8)根據(jù)當(dāng)前匹配原型變量CurrentProto所記錄的單詞原型,通過(guò)其索引數(shù)據(jù)在當(dāng)前規(guī)則庫(kù)中確定以該單詞原型為起始項(xiàng)的所有規(guī)則記錄,將這些規(guī)則記錄看作一個(gè)獨(dú)立規(guī)則庫(kù),利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中提出的模板匹配替換通用算法,將句子與該獨(dú)立規(guī)則庫(kù)進(jìn)行模板匹配替換運(yùn)算。如果匹配替換成功,記錄句子長(zhǎng)度變量SentenceLength=當(dāng)前句子的基本單元數(shù)目,若句子長(zhǎng)度變量SentenceLength=CurrentPos,進(jìn)入(11),否則令當(dāng)前匹配位置變量CurrentPos=CurrentPos+1,返回(7);如果匹配替換不成功,進(jìn)入(9)。
(9)根據(jù)當(dāng)前匹配類(lèi)型變量CurrentType所記錄的詞類(lèi)(或類(lèi)型)代碼,通過(guò)其索引數(shù)據(jù)在當(dāng)前規(guī)則庫(kù)中確定以該詞類(lèi)(或類(lèi)型)代碼為起始項(xiàng)的所有規(guī)則記錄,將這些規(guī)則記錄看作一個(gè)獨(dú)立規(guī)則庫(kù),利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中提出的模板匹配替換通用算法,將句子與該獨(dú)立規(guī)則庫(kù)進(jìn)行模板匹配替換運(yùn)算。如果匹配替換成功,記錄句子長(zhǎng)度變量SentenceLength=當(dāng)前句子的基本單元數(shù)目,若句子長(zhǎng)度變量SentenceLength=CurrentPos,進(jìn)入(11),否則令當(dāng)前匹配位置變量CurrentPos=CurrentPos+1,返回(7);如果匹配替換不成功,進(jìn)入(10)。
(10)如果當(dāng)前匹配類(lèi)型變量CurrentType記錄的已經(jīng)是當(dāng)前匹配位置變量CurrentPos在句子中所指向單詞的最后一個(gè)詞類(lèi)(或類(lèi)型)代碼,若句子長(zhǎng)度變量SentenceLength=CurrentPos,進(jìn)入(11),否則令當(dāng)前匹配位置變量CurrentPos=CurrentPos+1,返回(7);否則令當(dāng)前匹配類(lèi)型變量CurrentType=當(dāng)前匹配位置變量CurrentPos在句子中所指向單詞的下一個(gè)詞類(lèi)(或類(lèi)型)代碼,返回(9)。
(11)如果當(dāng)前規(guī)則庫(kù)已經(jīng)是可能相關(guān)的最高層次規(guī)則庫(kù),進(jìn)入(12);否則,令當(dāng)前規(guī)則庫(kù)為下一個(gè)層次的可能相關(guān)規(guī)則庫(kù),返回(6)。
(12)將句子的各項(xiàng)在目標(biāo)語(yǔ)言中的翻譯結(jié)果集取出,分別記為A1,A2,...,AL,其中翻譯結(jié)果集的個(gè)數(shù)L=句子長(zhǎng)度變量SentenceLength,如果句子完全匹配成功則應(yīng)有L=SentenceLength=1。利用這些翻譯結(jié)果集計(jì)算最終翻譯結(jié)果集Result={a1+a2+...+aL|ai∈Ai,i=1,2,...,L},其中“+”表示將字符串按順序連接起來(lái),進(jìn)入(13)。
(13)直接將最終翻譯結(jié)果集Result中的第一個(gè)翻譯結(jié)果顯示在視頻顯示部件上作為在(1)中句子的最終翻譯結(jié)果,或者將最終翻譯結(jié)果集中Result的字符串優(yōu)化排序后,將最可能的字符串作為在(1)中句子的最終翻譯結(jié)果;也可將最終翻譯結(jié)果集Result中的部分或所有字符串列舉在某個(gè)選擇框中,由用戶去選擇在(1)中句子的最終翻譯結(jié)果。注明附

圖1是對(duì)上述執(zhí)行流程的輔助說(shuō)明。通過(guò)結(jié)合英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9),發(fā)明人已經(jīng)用VC++6.0將該算法在聯(lián)想PIII-550計(jì)算機(jī)上編程實(shí)現(xiàn)。關(guān)于本發(fā)明的概念說(shuō)明(1)常項(xiàng),變項(xiàng),模板,模板翻譯規(guī)則和句子狀態(tài)的概念說(shuō)明,可以在已公開(kāi)專(zhuān)利英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中查閱。
(2)兩個(gè)模板規(guī)則層次相同,沒(méi)有嚴(yán)格的定義,主要是說(shuō)將它們?cè)谕粋€(gè)層次上與句子進(jìn)行匹配替換運(yùn)算在一般情況下不會(huì)產(chǎn)生結(jié)果沖突,例如下面兩個(gè)模板規(guī)則DET ADJ NOUN→NOUNDET ADJ NOUN;(模板規(guī)則I)DET NOUN→NOUNDET NOUN;(模板規(guī)則II)如果在規(guī)則庫(kù)中它們相鄰排列在一起,而且模板規(guī)則I排列在模板規(guī)則II之前,那么它們就具有相同的層次。
(3)兩個(gè)模板規(guī)則結(jié)構(gòu)類(lèi)似,也沒(méi)有嚴(yán)格的定義,主要是指它們具有類(lèi)似的句型結(jié)構(gòu),例如下面兩個(gè)模板規(guī)則there AUX be N→SAUX有N;there be N→S有N;在英語(yǔ)語(yǔ)法上都屬于“there+be”句型,所以具有類(lèi)似結(jié)構(gòu)。
(4)句子的類(lèi)型和結(jié)構(gòu)特征,主要決定于它是特殊疑問(wèn)句、一般疑問(wèn)句、反意疑問(wèn)句、陳述句還是感嘆句,以及是否可能帶有定語(yǔ)從句和賓語(yǔ)從句,句子類(lèi)型和從句類(lèi)型的概念與普通英語(yǔ)語(yǔ)法所描述的完全一致。
(5)在對(duì)英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)的規(guī)則庫(kù)進(jìn)行分拆的時(shí)候,層次相同的模板翻譯規(guī)則也可能由于它們的結(jié)構(gòu)不類(lèi)似或其它原因而放在兩個(gè)不同新規(guī)則庫(kù)文件中。本發(fā)明的優(yōu)點(diǎn)是它可以用來(lái)改進(jìn)在專(zhuān)利英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)基礎(chǔ)上開(kāi)發(fā)的系統(tǒng),使改進(jìn)后的系統(tǒng)比原來(lái)提高翻譯速度30至40倍。
翻譯實(shí)例如果要翻譯的英文句子是I began to like mathematics when I was a student.
那么下面7條模板翻譯規(guī)則將被使用(1)DET NOUN→NOUNDET NOUN;(DET表示限定詞,NOUN表示名詞)(2)be R→VI是R;(R表示代詞PRON或名詞NOUN)(3)VT R→VIVT R;(VT表示及物動(dòng)詞)(4)VI to VI→VIVI VI;(VI表示不及物動(dòng)詞)(5)R VI→SR VI;(6)S when S1→S當(dāng)S1的時(shí)候,S;(S和S1表示句子)(7)S.→SS。;為了后面敘述的方便,不妨假定這7條模板翻譯規(guī)則被分別存放在7個(gè)不同層次的規(guī)則庫(kù)中,分別命名為“以DET開(kāi)頭的基本名詞規(guī)則庫(kù)”,“以be開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以VT開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以VI開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以R開(kāi)頭的簡(jiǎn)單句規(guī)則庫(kù)”,“以S開(kāi)頭的復(fù)合句規(guī)則庫(kù)”“以S開(kāi)頭且以標(biāo)點(diǎn)結(jié)尾的句子規(guī)則庫(kù)”(在發(fā)明人實(shí)際實(shí)現(xiàn)的系統(tǒng)中并不一定這樣命名,甚至也不一定這樣分拆規(guī)則庫(kù))。利用基于分層自適應(yīng)選擇模板匹配替換算法,對(duì)上述例句的翻譯過(guò)程如下(1)將句子分解為基本單元并進(jìn)行形態(tài)分析,然后記錄句子長(zhǎng)度變量SentenceLength=基本單元的數(shù)目,即I{PRON我;}begin{VI開(kāi)始;V_Form=-1}to{PREP去,向;}like{VT喜歡;PREP象;ADJ相像的,相同的;}mathematics{NOUN數(shù)學(xué);}when{WHADV什么時(shí)候;CONJ當(dāng)…的時(shí)候;}I{PRON我;}was{AUX是;V_Form=-1}a{DET一;}student{NOUN學(xué)生,學(xué)者;}.{標(biāo)點(diǎn)。;}置句子長(zhǎng)度變量SentenceLength=11。其中V_Form=-1表示動(dòng)詞過(guò)去式,PREP表示介詞,ADJ表示形容詞,WHADV表示疑問(wèn)副詞,CONJ表示連詞,AUX表示助動(dòng)詞。
(2)由于句子結(jié)束時(shí)的標(biāo)點(diǎn)符號(hào)是“.”,可以直接判定句子為陳述句,因此句子中不可能包含特殊疑問(wèn)句規(guī)則、一般疑問(wèn)句規(guī)則,反意疑問(wèn)句規(guī)則和感嘆句規(guī)則;同時(shí)由于句子中不含有定語(yǔ)從句和賓語(yǔ)從句,因此也不可能包含定語(yǔ)從句規(guī)則和賓語(yǔ)從句規(guī)則。將剩余的其它規(guī)則庫(kù)都看作可能語(yǔ)句子相關(guān)的規(guī)則庫(kù),并將它們按照從低層到高層的順序排列,然后將它們按照同樣的次序一一與句子進(jìn)行匹配替換運(yùn)算。
(3)如果當(dāng)前規(guī)則庫(kù)不是“以DET開(kāi)頭的基本名詞規(guī)則庫(kù)”,“以be開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以VT開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以VI開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,“以R開(kāi)頭的簡(jiǎn)單句規(guī)則庫(kù)”,“以S開(kāi)頭的復(fù)合句規(guī)則庫(kù)”或者“以S開(kāi)頭且以標(biāo)點(diǎn)結(jié)尾的句子規(guī)則庫(kù)”,那么不可能從中找到與句子成功匹配替換的句子。
(4)如果當(dāng)前規(guī)則庫(kù)是“以DET開(kāi)頭的基本名詞規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“I”,CurrentType=“PRON”;此時(shí)在當(dāng)前規(guī)則庫(kù)中,即沒(méi)有以原型“I”開(kāi)頭的基本名詞規(guī)則,也沒(méi)有以詞類(lèi)代碼“PRON”開(kāi)頭的基本名詞規(guī)則;令CurrentPos=CurrentPos+1=2,從而可得CurrentProto=“begin”,CurrentType=“VI”,但此時(shí)在當(dāng)前規(guī)則庫(kù)中仍然沒(méi)有可以匹配替換的基本名詞規(guī)則;到CurrentPos=9時(shí),CurrentProto=“a”,CurrentType=“DET”,此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“a Student”成功與第一條規(guī)則“DET NOUN→NOUNDET NOUN;”匹配替換為NOUN{NOUN一學(xué)生,一學(xué)者;},同時(shí)令SentenceLength=10,簡(jiǎn)記新的句子狀態(tài)為“I begin to like mathematics when I was NOUN.”。
(5)如果當(dāng)前規(guī)則庫(kù)是“以be開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“I”,CurrentType=“PRON”;此時(shí)在當(dāng)前規(guī)則庫(kù)中,即沒(méi)有以原型“I”開(kāi)頭的動(dòng)詞規(guī)則,也沒(méi)有以詞類(lèi)代碼“PRON”開(kāi)頭的動(dòng)詞規(guī)則;令CurrentPos=CurrentPos+1=2,從而可得CurrentProto=“begin”,CurrentType=“VI”,但此時(shí)在當(dāng)前規(guī)則庫(kù)中仍然沒(méi)有可以匹配替換的動(dòng)詞規(guī)則;到CurrentPos=9時(shí),CurrentProto=“be”,CurrentType=“AUX”,此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“be NOUN”成功與第二條規(guī)則“be R→VI是R;”匹配替換為VI{VI是一學(xué)生,是一學(xué)者;},同時(shí)令SentenceLength=9,簡(jiǎn)記新的句子狀態(tài)為“I beginto like mathematics when I VI.”。
(6)如果當(dāng)前規(guī)則庫(kù)是“以VT開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“I”,CurrentType=“PRON”;此時(shí)在當(dāng)前規(guī)則庫(kù)中,即沒(méi)有以原型“I”開(kāi)頭的動(dòng)詞規(guī)則,也沒(méi)有以詞類(lèi)代碼“PRON”開(kāi)頭的動(dòng)詞規(guī)則;令CurrentPos=CurrentPos+1=2,從而可得CurrentProto=“begin”,CurrentType=“VI”,但此時(shí)在當(dāng)前規(guī)則庫(kù)中仍然沒(méi)有可以匹配替換的動(dòng)詞規(guī)則;到CurrentPos=4時(shí),CurrentProto=“l(fā)ike”,CurrentType=“VT”,此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“l(fā)ike mathematics”成功與第三條規(guī)則“VT R→VIVTR;”匹配替換為VI{VI喜歡數(shù)學(xué);},同時(shí)令SentenceLength=8,簡(jiǎn)記新的句子狀態(tài)為“I begin to VI when I VI.”。
(7)如果當(dāng)前規(guī)則庫(kù)是“以VI開(kāi)頭的動(dòng)詞規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“I”,CurrentType=“PRON”;此時(shí)在當(dāng)前規(guī)則庫(kù)中,即沒(méi)有以原型“I”開(kāi)頭的動(dòng)詞規(guī)則,也沒(méi)有以詞類(lèi)代碼“PRON”開(kāi)頭的動(dòng)詞規(guī)則;令CurrentPos=CurrentPos+1=2,從而可得CurrentProto=“begin”,CurrentType=“VI”,此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“begin to VI”成功與第四條規(guī)則“VIto VI→VIVI VI;”匹配替換為VI{VI開(kāi)始喜歡數(shù)學(xué);},同時(shí)令SentenceLength=6,簡(jiǎn)記新的句子狀態(tài)為“I VI when I VI.”。
(8)如果當(dāng)前規(guī)則庫(kù)是“以R開(kāi)頭的簡(jiǎn)單句規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“I”,CurrentType=“PRON”;此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“I VI”成功與第五條規(guī)則“R VI→SR VI;”匹配替換為S{S我開(kāi)始喜歡數(shù)學(xué);}。同時(shí)令SentenceLength=5,簡(jiǎn)記新的句子狀態(tài)為“S when I VI.”。匹配成功后令句子當(dāng)前匹配位置變量CurrentPos=CurrentPos+1=2,從而可得CurrentProto=“when”,CurrentType=“WHADV”或者“CONJ”;此時(shí)在當(dāng)前規(guī)則庫(kù)中,即沒(méi)有以原型“when”開(kāi)頭的動(dòng)詞規(guī)則,也沒(méi)有以詞類(lèi)代碼“WHADV”或“CONJ”開(kāi)頭的動(dòng)詞規(guī)則;令CurrentPos=CurrentPos+1=3,從而可得CurrentProto=“I”,CurrentType=“PRON”,此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“I VI”成功與第五條規(guī)則“R VI→SR VI;”匹配替換為S{S我是一學(xué)生,我是一學(xué)者;},同時(shí)令SentenceLength=4,簡(jiǎn)記新的句子狀態(tài)為“S when S.”。
(9)如果當(dāng)前規(guī)則庫(kù)是“以S開(kāi)頭的復(fù)合句規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“S”,CurrentType=“S”;此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“S when S”成功與第六條規(guī)則“S when S1→S當(dāng)S1的時(shí)候,S;”匹配替換為S{S(當(dāng)我是一學(xué)生的時(shí)候,我開(kāi)始喜歡數(shù)學(xué)),(當(dāng)我是一學(xué)者的時(shí)候,我開(kāi)始喜歡數(shù)學(xué));}同時(shí)令SentenceLength=2,簡(jiǎn)記新的句子狀態(tài)為“S.”。
(10)如果當(dāng)前規(guī)則庫(kù)是“以S開(kāi)頭且以標(biāo)點(diǎn)結(jié)尾的句子規(guī)則庫(kù)”,令句子當(dāng)前匹配位置變量CurrentPos=1,從而可得CurrentProto=“S”,CurrentType=“S”;此時(shí)利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中的模板匹配替換算法,可以將“S.”成功與第七條規(guī)則“S.→SS。;”匹配替換為S{S(當(dāng)我是一學(xué)生的時(shí)候,我開(kāi)始喜歡數(shù)學(xué)。),(當(dāng)我是一學(xué)者的時(shí)候,我開(kāi)始喜歡數(shù)學(xué)。);}同時(shí)令SentenceLength=1,簡(jiǎn)記新的句子狀態(tài)為“S”。
(11)因SentenceLength=1,所以不需再做其它匹配運(yùn)算,且所有可能的翻譯結(jié)果保存在句子的當(dāng)前狀態(tài)中,將它們另存到結(jié)果集Result中,并顯示Result中最可能的翻譯結(jié)果,或者列舉部分或所有翻譯結(jié)果由用戶選擇。翻譯過(guò)程結(jié)束。
權(quán)利要求
一種以邏輯運(yùn)算部件、存儲(chǔ)部件、視頻顯示部件和輸入部件為硬件基礎(chǔ)的改進(jìn)型英漢翻譯機(jī)器,其特征在于一.將英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)的模板翻譯規(guī)則庫(kù)按照一定的層次結(jié)構(gòu)分拆成多個(gè)規(guī)則庫(kù)(1)分拆的原則是層次相同的模板翻譯規(guī)則放在同一個(gè)規(guī)則庫(kù)文件中,結(jié)構(gòu)類(lèi)似的模板翻譯規(guī)則放在同一個(gè)規(guī)則庫(kù)文件中。(2)在同一個(gè)規(guī)則庫(kù)文件中,所有起始項(xiàng)相同的規(guī)則按照項(xiàng)數(shù)多者在前的原則依相鄰順序組織在一起。(3)在與源語(yǔ)言句子進(jìn)行匹配運(yùn)算時(shí),根據(jù)句子的類(lèi)型和結(jié)構(gòu)特征,從經(jīng)分拆得到的規(guī)則庫(kù)中選擇與句子可能相關(guān)的所有規(guī)則庫(kù),從而在規(guī)則庫(kù)層次上限制可能參與模板匹配運(yùn)算的規(guī)則總數(shù)。(4)在與源語(yǔ)言句子進(jìn)行匹配運(yùn)算時(shí),按照先在可能相關(guān)的低層次規(guī)則庫(kù)中搜索,后在可能相關(guān)的高層次規(guī)則庫(kù)中搜索的順序,尋找可能與句子完全匹配模板翻譯規(guī)則。
二.利用“分層自適應(yīng)選擇模板匹配替換算法”,在可能相關(guān)的規(guī)則庫(kù)搜索尋找與待翻譯句子完全匹配的所有模板翻譯規(guī)則,代替英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)在整個(gè)規(guī)則庫(kù)中進(jìn)行搜索尋找的方案,可以使系統(tǒng)的翻譯速度大大提高,該算法的執(zhí)行流程是(1)從輸入部件輸入或者從存儲(chǔ)部件讀取要翻譯的源語(yǔ)言中的句子,并將它顯示在視頻顯示部件上。(2)啟動(dòng)執(zhí)行算法的功能選項(xiàng),將句子分解并表示為以源語(yǔ)言中的詞匯、標(biāo)點(diǎn)等為基本單元的信息屬性結(jié)構(gòu),記錄“句子長(zhǎng)度變量”=基本單元的數(shù)目。(3)對(duì)句子中的每個(gè)基本單元進(jìn)行形態(tài)分析,并記錄它的所有詞類(lèi)代碼和每個(gè)詞類(lèi)在目標(biāo)語(yǔ)言中的所有可能含義。(4)確定句子的類(lèi)型和結(jié)構(gòu)特征,即它是特殊疑問(wèn)句、一般疑問(wèn)句、反意疑問(wèn)句、陳述句還是感嘆句,以及是否可能帶有定語(yǔ)從句和賓語(yǔ)從句。(5)根據(jù)句子的類(lèi)型和結(jié)構(gòu)特征,從所有規(guī)則庫(kù)中選擇確定與句子可能相關(guān)的規(guī)則庫(kù),并將這些規(guī)則庫(kù)按照從低層次到高層次的順序一一與句子按照(6)~(11)進(jìn)行自適應(yīng)選擇模板匹配替換運(yùn)算,令當(dāng)前規(guī)則庫(kù)為最低層次的規(guī)則庫(kù)。(6)令句子“當(dāng)前匹配位置變量”=1。(7)令“當(dāng)前匹配原型變量”=當(dāng)前匹配位置變量在句子中所指向單詞的原型,令“當(dāng)前匹配類(lèi)型變量”=當(dāng)前匹配位置變量在句子中所指向單詞的第一個(gè)詞類(lèi)(或類(lèi)型)代碼,進(jìn)入(8)。(8)根據(jù)“當(dāng)前匹配原型變量”所記錄的單詞原型,通過(guò)其索引數(shù)據(jù)在當(dāng)前規(guī)則庫(kù)中確定以該單詞原型為起始項(xiàng)的所有規(guī)則記錄,將這些規(guī)則記錄看作一個(gè)獨(dú)立規(guī)則庫(kù),利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中提出的模板匹配替換通用算法,將句子與該獨(dú)立規(guī)則庫(kù)進(jìn)行模板匹配替換運(yùn)算。如果匹配替換成功,記錄“句子長(zhǎng)度變量”=當(dāng)前句子的基本單元數(shù)目,若“句子長(zhǎng)度變量”=“當(dāng)前匹配位置變量”,進(jìn)入(11),否則令“當(dāng)前匹配位置變量”=“當(dāng)前匹配位置變量”+1,返回(7);如果匹配替換不成功,進(jìn)入(9)。(9)根據(jù)“當(dāng)前匹配類(lèi)型變量”所記錄的詞類(lèi)(或類(lèi)型)代碼,通過(guò)其索引數(shù)據(jù)在當(dāng)前規(guī)則庫(kù)中確定以該詞類(lèi)(或類(lèi)型)代碼為起始項(xiàng)的所有規(guī)則記錄,將這些規(guī)則記錄看作一個(gè)獨(dú)立規(guī)則庫(kù),利用英漢翻譯機(jī)器(專(zhuān)利號(hào)00109235.9)中提出的模板匹配替換通用算法,將句子與該獨(dú)立規(guī)則庫(kù)進(jìn)行模板匹配替換運(yùn)算。如果匹配替換成功,記錄“句子長(zhǎng)度變量”=當(dāng)前句子的基本單元數(shù)目,若“句子長(zhǎng)度變量”=“當(dāng)前匹配位置變量”,進(jìn)入(11),否則令“當(dāng)前匹配位置變量”=“當(dāng)前匹配位置變量”+1,返回(7);如果匹配替換不成功,進(jìn)入(10)。(10)如果當(dāng)前匹配類(lèi)型變量記錄的已經(jīng)是當(dāng)前匹配位置變量在句子中所指向單詞的最后一個(gè)詞類(lèi)(或類(lèi)型)代碼,若“句子長(zhǎng)度變量”=“當(dāng)前匹配位置變量”,進(jìn)入(11),否則令“當(dāng)前匹配位置變量”=“當(dāng)前匹配位置變量”+1,返回(7);否則令“當(dāng)前匹配類(lèi)型變量”=“當(dāng)前匹配位置變量”在句子中所指向單詞的下一個(gè)詞類(lèi)(或類(lèi)型)代碼,返回(9)。(11)如果當(dāng)前規(guī)則庫(kù)已經(jīng)是可能相關(guān)的最高層次規(guī)則庫(kù),進(jìn)入(12);否則,令當(dāng)前規(guī)則庫(kù)為下一個(gè)層次的可能相關(guān)規(guī)則庫(kù),返回(6)。(12)將句子的各項(xiàng)在目標(biāo)語(yǔ)言中的翻譯結(jié)果集取出,此時(shí)翻譯結(jié)果集的個(gè)數(shù)恰好與句子長(zhǎng)度變量相等,而且如果匹配完全成功,則翻譯結(jié)果集只有一個(gè),句子長(zhǎng)度變量等于1;將這些翻譯結(jié)果集中的字符串按順序連接起來(lái),得到最終翻譯結(jié)果集,進(jìn)入(13)。(13)直接將最終翻譯結(jié)果集中的第一個(gè)翻譯結(jié)果顯示在視頻顯示部件上作為在(1)中句子的最終翻譯結(jié)果,或者將最終翻譯結(jié)果集中的字符串優(yōu)化排序后,將最可能的字符串作為在(1)中句子的最終翻譯結(jié)果。也可將最終翻譯結(jié)果集中的部分或所有字符串列舉在某個(gè)選擇框中,由用戶去選擇在(1)中句子的最終翻譯結(jié)果。
全文摘要
一種基于分層自適應(yīng)選擇模板匹配替換算法的改進(jìn)型英漢翻譯機(jī)器,可大大提高英漢翻譯機(jī)器(專(zhuān)利號(hào):00109235.9)的翻譯速度。其特征是根據(jù)輸入句子的類(lèi)型和結(jié)構(gòu)特征,利用分層自適應(yīng)選擇模板匹配替換算法,可以高效地選擇所有可能相關(guān)的模板翻譯規(guī)則庫(kù)與句子進(jìn)行匹配運(yùn)算,同時(shí)利用起始項(xiàng)的相關(guān)索引數(shù)據(jù),將各個(gè)相關(guān)模板翻譯規(guī)則庫(kù)中可能與句子匹配的規(guī)則限定在一個(gè)較小的范圍內(nèi),從而大大減少匹配運(yùn)算次數(shù),提高翻譯速度。
文檔編號(hào)G06F17/28GK1380619SQ0111065
公開(kāi)日2002年11月20日 申請(qǐng)日期2001年4月16日 優(yōu)先權(quán)日2001年4月16日
發(fā)明者李玉 申請(qǐng)人:李玉
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
宾川县| 博客| 广安市| 石楼县| 临泽县| 承德市| 赣州市| 泉州市| 洛宁县| 桂林市| 大城县| 贵阳市| 灵宝市| 财经| 寿光市| 泸水县| 丹东市| 唐海县| 治县。| 岐山县| 昂仁县| 九寨沟县| 理塘县| 洞口县| 琼结县| 应城市| 武义县| 霍山县| 彰武县| 沅陵县| 普兰县| 民勤县| 界首市| 阿坝县| 大化| 霍山县| 大化| 格尔木市| 嘉黎县| 泽库县| 武城县|