專利名稱:模糊翻譯系統(tǒng)及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種翻譯系統(tǒng)及方法,尤其涉及一種可對來源語句進行才莫糊 翻譯的翻譯系統(tǒng)及方法。
背景技術(shù):
隨著信息科技的發(fā)展,信息的傳播已逐漸地從單一區(qū)域擴展到可在短時 間內(nèi)傳播到世界上的每一個角落,而講求國際化的今天, 一般人需要接觸到 外語的機會也大大增加,在網(wǎng)頁、報章雜志、商業(yè)信件等傳播4某介中,也往 往可以看到以外語形式出現(xiàn)的文件。由于一般大眾并非對所有外語都能精通, 因此出現(xiàn)了許多不同的翻譯軟件或是翻譯網(wǎng)頁,可以對所輸入的詞句進行語 言轉(zhuǎn)換,用戶僅需把外語的詞句輸入,通過翻譯軟件或是翻譯網(wǎng)頁便可以快 速地將文件中的外語文字轉(zhuǎn)換為自己可以讀懂的語言。
然而,由于使用者輸入詞句的過程中可能會出現(xiàn)部分的字符缺失或是字 詞拼寫錯誤,由此導(dǎo)致輸入詞句不完善的問題,而目前的翻譯系統(tǒng)及方法, 在翻譯時遇到翻譯不出來的詞句,會以原來的輸入詞句的文字出現(xiàn),從而造 成無法對詞句進行完整翻譯的問題。舉例來說,假設(shè)使用者在輸入的詞句
"Oh,whatasurpris!"中包含拼字錯誤的字詞"surpris",由于以往的翻譯系 統(tǒng)及方法無法辨識"surpris" —字,因此翻譯結(jié)果會呈現(xiàn)"喔, 一個怎樣的 surpris!",無法完成對原來輸入詞句的完整翻譯,這樣不僅造成可讀性降低, 翻譯效果也大打折扣。
綜上所述,可知現(xiàn)有技術(shù)中翻譯系統(tǒng)及方法長期以來一直存在著當(dāng)所輸 入的來源詞句輸入不完善時,容易造成無法完整翻譯的問題,因此有必要提 出改進的技術(shù)手段,來解決該問題
發(fā)明內(nèi)容
鑒于以上在現(xiàn)有技術(shù)中所提出以往的翻譯系統(tǒng)及方法中,當(dāng)所輸入的來 源詞句輸入不完善時,容易造成無法完整翻譯的現(xiàn)況,本發(fā)明目的在于提供 一種模糊翻譯系統(tǒng)及其方法,可以用來解決該問題。
本發(fā)明所提出的模糊翻譯系統(tǒng)包括數(shù)據(jù)庫,用于儲存至少一筆字詞數(shù) 據(jù)項及至少一筆翻譯數(shù)據(jù)項;讀取才莫塊,用于讀取來源詞句,該來源詞句是 由至少一字詞所組成,且各字詞是由至少一字符所組成;對比模塊,用于對 比來源詞句的各字詞是否存在萬用字符,及用于在各字詞不存在萬用字符時, 對比來源詞句的各字詞是否存在對應(yīng)的字詞數(shù)據(jù)項;搜尋才莫塊,用于在來源 詞句的各字詞存在萬用字符時,搜尋數(shù)據(jù)庫的字詞數(shù)據(jù)項以取得符合條件的 至少一替代字詞,及用于在對比4莫塊對比出來源詞句的各字詞不存在萬用字 詞,且來源詞句的各字詞對應(yīng)的字詞數(shù)據(jù)項不存在時,搜尋數(shù)據(jù)庫的字詞數(shù) 據(jù)項以取得至少一相似字詞;取代模塊,用于用搜尋才莫塊搜尋出的替代字詞 及相似字詞取代來源詞句中對應(yīng)的字詞;及翻譯模塊,用于根據(jù)取代后的該 來源詞句查找對應(yīng)的該些翻譯數(shù)據(jù)項,產(chǎn)生一目標(biāo)詞句。
本發(fā)明所提出的^^莫糊翻譯方法,其步驟包括建立數(shù)據(jù)庫,數(shù)據(jù)庫儲存 有至少一筆字詞數(shù)據(jù)項及至少一筆翻譯數(shù)據(jù)項;讀取來源詞句,該來源詞句 是由至少一字詞所組成,且各字詞是由至少一字符組成;對比來源詞句中的 各字詞是否具有萬用字符,其中當(dāng)各字詞具有萬用字符時,搜尋數(shù)據(jù)庫的 字詞數(shù)據(jù)項以取得符合條件的至少一替代字詞;及當(dāng)各字詞不具有萬用字符, 且對比出各字詞對應(yīng)的字詞數(shù)據(jù)項不存在時,搜尋數(shù)據(jù)庫的字詞數(shù)據(jù)項以取 得至少一相似字詞;用搜尋出的替代字詞及相似字詞取代來源詞句中對應(yīng)的 字詞;及根據(jù)取代后的該來源詞句查找對應(yīng)的該些翻譯數(shù)據(jù)項,產(chǎn)生一目標(biāo) 詞句。
通過上述的技術(shù)手段,本發(fā)明可以達成提高翻譯效果的技術(shù)功效。
圖1A是現(xiàn)有的翻譯系統(tǒng)及方法運作架構(gòu)示意圖。 圖1B是本發(fā)明所述的模糊翻譯系統(tǒng)的架構(gòu)圖。圖2是本發(fā)明所述的模糊翻譯方法的流程圖。
圖3是本發(fā)明對具有萬用字符的來源詞句進行才莫糊翻譯的示意圖。
圖4是本發(fā)明對具有未定義字詞的來源詞句進行才莫糊翻譯的示意圖。
具體實施例方式
下面將配合圖示及實施例來詳細說明本發(fā)明的實施方式,藉此對本發(fā)明 如何應(yīng)用先對比來源詞句中的字詞是否具有萬用字符,并以萬用字符搜尋出 符合條件的至少一替代字詞,并在來源詞句中的字詞不存在時,搜尋至少一 相似字詞,接著用替代字詞和相似字詞取代來源詞句中的字詞再進行翻譯, 從而解決以往使用者欲翻譯的來源詞句輸入不完善時,造成無法完整翻譯的 問題,并就達成提高翻譯效果的實現(xiàn)過程進行說明,以供充分理解并據(jù)以實 施。
下面,請先參考圖1A,將先說明現(xiàn)有的翻譯系統(tǒng)及方法的運作架構(gòu)。如 圖1A所示,現(xiàn)有的翻譯系統(tǒng)及方法的運作是通過數(shù)據(jù)庫101、讀取才莫塊102、 搜尋模塊103及翻譯模塊104來對來源詞句105進行翻譯。運作的過程中, 讀^f莫塊102讀取了來源詞句105之后,無論來源詞句105是否有拼寫錯誤 或字符缺失的字詞,搜尋模塊103均會對來源詞句105當(dāng)中的字詞進行搜尋 對應(yīng)的翻譯數(shù)據(jù),若來源詞句105當(dāng)中存在輸入不完善的部分無法辨識,僅 會將可辨識的部分通過翻譯才莫塊104翻譯為目標(biāo)詞句106。
以英翻中的翻譯為例,當(dāng)讀取漢塊102讀取到的來源詞句105為"Oh, what a surpris!",在來源詞句105當(dāng)中原應(yīng)為"surprise"的字詞因拼寫錯誤 而成為"surpris",而數(shù)據(jù)庫101所儲存的字詞數(shù)據(jù)項當(dāng)中不存在"surpris" 的字詞數(shù)據(jù)項,進而當(dāng)搜尋模塊103搜尋不到"surpris"的字詞數(shù)據(jù)項時,翻 譯模塊104便會將其余可搜尋到字詞數(shù)據(jù)項的字詞進行翻譯,而保留不存在 的字詞"surpris",產(chǎn)生"喔! 一個怎樣的surpris!"的目標(biāo)詞句106。
如圖IA中所示的現(xiàn)有翻譯系統(tǒng)雖然可對來源詞句105進行翻譯J旦是當(dāng) 輸入詞句不完善時,仍然無法完整翻譯來源詞句105,由此產(chǎn)生翻譯效果不 佳的情況。而本發(fā)明的才莫糊翻譯系統(tǒng)及方法則是針對現(xiàn)有技術(shù)中產(chǎn)生無法完整翻譯
的情況。請參考圖IB,為本發(fā)明模糊翻譯系統(tǒng)的架構(gòu)圖,將用于說明本發(fā)明 系統(tǒng)各組成才莫塊的運作。本發(fā)明的模糊翻譯系統(tǒng)包含數(shù)據(jù)庫111、讀取模塊 112、對比模塊113、搜尋模塊114、取代模塊115及翻譯模塊116。
數(shù)據(jù)庫111,現(xiàn)有技術(shù)儲存至少一筆字詞數(shù)據(jù)項及至少一筆翻譯數(shù)據(jù)項。 字詞數(shù)據(jù)項中可搜尋到的字詞即為定義過的字詞;相反地,所儲存的字詞數(shù) 據(jù)項中不存在的字詞,即為未經(jīng)定義的字詞。
數(shù)椐庫111所儲存的翻譯數(shù)據(jù)項,是不同語言之間的字詞數(shù)據(jù)項的對應(yīng)。 舉例來說,當(dāng)系統(tǒng)要將英文的來源詞句117翻譯為中文時,數(shù)據(jù)庫lll當(dāng)中 所儲存的數(shù)據(jù)便需要為英漢的翻譯數(shù)據(jù)項。
讀取模塊112,用于讀取來源詞句117,其中,讀取溪塊112所讀取的來 源詞句117均是由至少一字詞所組成,而每個字詞是由至少一字符組成。
對比模塊113,用于在讀取模塊112讀取到來源詞句117后,對比來源 詞句117當(dāng)中的每一個字詞是否具有萬用字符。這里所指的萬用字符,可以 是"*" 、 "#,, 、 " ,,或其他特定符號,是用于在輸入時取代至少一個字符
的。舉例來說,當(dāng)某一筆字詞當(dāng)中使用了 一個萬用字符,如"h*d",則"h*d" 相當(dāng)于"had" 、 "head" 、 "heard" …等字詞。雖然本發(fā)明在此以"*"作 為萬用字符進行說明,但實際上任何特定的字符均可用于作為萬用字符,并 不以"*"為限。
當(dāng)字詞中具有萬用字符時,搜尋模塊114將會搜尋與具有萬用字符的字 詞相符合的字詞作為替代字詞。搜尋模塊114在搜尋替代字詞時,是根據(jù)萬 用字符在字詞中的相對位置搜尋符合萬用字符的至少一個字符,然后用這些 字符取代萬用字符的位置,從而取得替代字詞。舉例來說,在"h*d"字詞當(dāng) 中,萬用字符位在"h"與"d"頭尾字符之間,因此搜尋模塊114便會搜尋 頭尾字符皆為"h,,與"d"的字詞,而"h" 與"d"之間則可包含一個以 上的字符數(shù),如"had" 、 "head" 、 "heard"…等。
特別注意的是,當(dāng)搜尋模塊114針對一個字詞進行替代字詞的搜尋時, 可能會發(fā)生同時找到兩個以上符合條件的替代字詞,以上段所述的"had"、 "head" 、 "heard"為例,此時會由搜尋模塊114自動產(chǎn)生一個選取接口 (圖中未繪出),將所有符合條件的替代字詞放入作為選項,供用戶直接選取所 需的替代字詞,作為后續(xù)取代使用。
當(dāng)對比模塊113對比出來源詞句117當(dāng)中各字詞都不具有萬用字符,同 時各字詞也不具有對應(yīng)的字詞數(shù)據(jù)項時,對比坤莫塊113 1"更會判定該字詞為未 定義過的字詞,此時,搜尋;f莫塊114將會搜尋數(shù)據(jù)庫111當(dāng)中是否具有相似 的字詞。搜尋模塊114搜尋相似字詞時,是根據(jù)各字詞中字符的排列順序依 序搜尋儲存的字詞數(shù)據(jù)項。
舉例來說,當(dāng)對比模塊113對比出"surpris"為未定義過的字詞時,此時 搜尋模塊114將會從以"s"字符為首的字詞數(shù)據(jù)項開始進行搜尋,找到"s" 字符為首的字詞數(shù)據(jù)項后,接著再搜尋是否有"su"為首的相似字詞,接著 搜尋"sur"為首的相似字詞,直到搜尋出最相似的為止。
.同樣須注意的是,當(dāng)搜尋才莫塊114針對一個未定義過的字詞進行相似字 詞的搜尋時,可能會發(fā)生同時找到兩個以上符合條件的相似字詞,例如輸入 的"beggn"屬于未定義過的字詞,而"begin" 、 "began"或"begun"都是 符合條件的相似字詞,此時同樣也會由搜尋模塊114自動產(chǎn)生一個選取接口 (圖中未繪出),將所有符合條件的相似字詞放入作為選項,供用戶直接選 取所需的相似字詞,作為后續(xù)取代使用。
當(dāng)搜尋模塊114取得替代字詞與相似字詞后,取代模塊115將會負責(zé)用 替代字詞取代來源詞句117當(dāng)中具有萬用字符的字詞,并用相似字詞取代來 源詞句117當(dāng)中不具有對應(yīng)的字詞數(shù)據(jù)項的字詞,接著通過翻譯模塊116根 據(jù)數(shù)據(jù)庫lll當(dāng)中的翻譯數(shù)據(jù)項對經(jīng)過取代模塊115處理過后的來源詞句117 進4亍翻譯,并產(chǎn)生目標(biāo)詞句118。
舉例來說,若來源詞句117為"Oh,whatasurpris!",搜尋模塊114擷取 出相似字詞"surprise",則取代模塊115將會將來源詞句117中的"surpris" 取代為"surprise",接著,翻譯模塊116將對"Oh, what a surprise!"進行翻 譯,而翻譯模塊116根據(jù)數(shù)據(jù)庫111當(dāng)中的翻譯數(shù)據(jù)項便可將"Oh, what a surprise!"翻譯為"喔,真是意想不到!"
本系統(tǒng)通過對比來源詞句117當(dāng)中的萬用字符及組成來源詞句117的字 詞是否具有對應(yīng)的字詞數(shù)據(jù)項,可實現(xiàn)先對來源詞句117進行校正,從而在來源詞句117輸入不完善時,仍然可以完整地將來源詞句117翻譯為目標(biāo)詞 句118,從而解決了以往的翻譯系統(tǒng)當(dāng)中容易產(chǎn)生目標(biāo)詞句當(dāng)中出現(xiàn)翻譯過 字詞與未翻譯過字詞參半的問題。
接下來,請參考圖2,為本發(fā)明所述的才莫糊翻譯方法的流程圖,將用于 說明本發(fā)明的實施步驟。
首先,建立儲存有至少一筆字詞數(shù)據(jù)項及至少一筆翻譯數(shù)據(jù)項的數(shù)據(jù)庫 (步驟201)。所儲存的字詞數(shù)據(jù)項相當(dāng)于字典,字詞數(shù)據(jù)項中可搜尋到的 字詞即為定義過的字詞;相反地,所儲存的字詞數(shù)據(jù)項中不存在的字詞,即 為未經(jīng)定義的字詞。
數(shù)據(jù)庫所儲存的翻譯數(shù)據(jù)項,是不同語言之間的字詞數(shù)據(jù)項的對應(yīng),舉 例來說,當(dāng)系統(tǒng)要將英文的來源詞句翻譯為中文時,預(yù)先建立的數(shù)據(jù)庫當(dāng)中 所儲存的數(shù)據(jù)便需為英漢的翻譯數(shù)據(jù)項。
接著,讀取模塊讀取來源詞句(步驟202),其中,讀取模塊所讀取的 每一筆來源詞句均是由至少一字詞所組成,而每個字詞是由至少一字符組成。
讀取模塊讀取來源詞句后,對比模塊將會對比來源詞句中各字詞中是否 具有萬用字符(步驟203 ),當(dāng)來源詞句當(dāng)中具有萬用字符時,搜尋模塊將 會根據(jù)來源詞句當(dāng)中萬用字符的相對位置搜尋數(shù)據(jù)庫的字詞數(shù)據(jù)項,以取得 符合條件的至少一替代字詞(步驟204)。
舉例來說,在"h*d"字詞當(dāng)中,萬用字符位在"h" 與"d"頭尾字符 之間,因此搜尋模塊便會搜尋頭尾字符皆為"h"與"d,,的字詞,而"h"與 "d"之間則可包含一個以上的字符數(shù),如"had" 、 "head" 、 "heard"…等。
當(dāng)對比模塊對比出來源詞句當(dāng)中不具有萬用字符時,若各字詞中具有拼 字錯誤的字詞,則搜尋模塊將搜尋數(shù)據(jù)庫的字詞數(shù)據(jù)項,以取得至少一相似 字詞(步驟205 )。
搜尋模塊搜尋相似字詞時,是根據(jù)各字詞中字符的排列順序依序搜尋儲 存的字詞數(shù)據(jù)項。舉例來說,當(dāng)對比模塊對比出"suipris"為未定義過的字詞 時,此時搜尋模塊將會從以"s"字符為首的字詞數(shù)椐項開始進行搜尋,搜尋時可以對來源詞句當(dāng)中無法辨識的字詞與數(shù)據(jù)庫當(dāng)中所儲存的字詞數(shù)據(jù)項的 相似度進行對比。
當(dāng)搜尋模塊搜尋出替代字詞與相似字詞后,取代模塊用搜尋出的替代字
詞及相似字詞取代來源詞句中對應(yīng)的字詞(步驟206),最后,根據(jù)取代后 的該來源詞句查找對應(yīng)的該些翻譯數(shù)據(jù)項,產(chǎn)生一目標(biāo)詞句(步驟207)。
如前所述,當(dāng)一個字詞有兩個以上符合條件的替代字詞或者相似字詞時, 會提供一個選取接口供用戶直接選取所需的替代字詞或者相似字詞,作為后 續(xù)取代使用。
舉例來說,若來源詞句為"Oh,whatasurpris!",搜尋才莫塊擷取出相似字 詞"surprise",則取代模塊將會將來源詞句中的"surpris"取代為"surprise", 接著,翻譯模塊將對"Oh, what a surprise!"進行翻譯,而翻譯才莫塊根據(jù)數(shù)據(jù) 庫當(dāng)中的翻譯數(shù)據(jù)項便可將"Oh, what a suiprise!"翻譯為"喔,真是意想不 到!"。
有對應(yīng)的字詞數(shù)據(jù)項,便可先對來源詞句進行校正,從而在來源詞句輸入不 完善時,仍然可以完整地將來源詞句翻譯為目標(biāo)詞句,從而解決以往的翻譯 系統(tǒng)中容易產(chǎn)生目標(biāo)詞句當(dāng)中出現(xiàn)翻譯過字詞與未翻譯過字詞參半的問題。
接下來,將以實施例配合本發(fā)明的圖示來說明本發(fā)明的做法。假設(shè)現(xiàn)有 一使用者使用具有本發(fā)明的英漢翻譯系統(tǒng),用戶可通過在輸入接口輸入文字 或是選取特定文字的方式來輸入欲翻譯的來源詞句。
如圖3所示,假設(shè)使用者原先欲輸入"Oh, what a surprise!"的欲翻譯詞 句,但由于遺忘了 "surprise"當(dāng)中的幾個字符,因此以萬用字符"*"替代遺 忘的字符在輸入接口輸入來源詞句301 "Oh,whatas*prise!"。
本發(fā)明的讀取才莫塊讀取到來源詞句301時,對比模塊首先會先對比來源 詞句"Oh, what a s*prise!"當(dāng)中是否具有萬用字符。由于來源詞句301中 "s*prise"字詞當(dāng)中具有萬用字符,因此搜尋模塊將會搜尋與"s*prise"相符 合的替代字詞。
搜尋時,搜尋模塊會搜尋數(shù)據(jù)庫當(dāng)中"s"與"prise"之間存在一個以上字符的字詞數(shù)據(jù)項,而由于"s"與"prise"之間僅具有一筆"surprise"的字 詞數(shù)據(jù)項與此搜尋條件相符,因此搜尋才莫塊將會以"surprise"作為替代字詞。
取代模塊以"surprise"取代"s*prise,,之后,翻譯模塊便可根據(jù)數(shù)據(jù)庫 當(dāng)中的至少一筆翻譯數(shù)據(jù)項將來源詞句301翻譯為"鬼,真是意想不到!"的 目標(biāo)詞句302,而不會產(chǎn)生詞句無法完全翻譯的情況。
請參考圖4,讀取模塊讀取來源詞句401后,對比模塊會先對比來源詞 句401當(dāng)中是否具有萬用字符,所輸入的來源詞句401 "Oh,whatasurprisee!" 當(dāng)中不具有萬用字符,且來源詞句當(dāng)中包含了 "surprisee"此種數(shù)據(jù)庫當(dāng)中無 法找到對應(yīng)的字詞數(shù)據(jù)項時,搜尋模塊便會依據(jù)"surprisee"字詞的字符排列 順序逐一對比相似度,以搜尋出與"surprisee"相似的字詞,如"surprise" 及"surprised"等。
取代模塊以"surprise"及"surprised"取代原本的"surprisee"后,翻譯 才莫塊便會將來源詞句401根據(jù)數(shù)據(jù)庫中的翻譯數(shù)據(jù)項來進行翻譯,產(chǎn)生至少 一個目標(biāo)詞句402,同樣地,經(jīng)本發(fā)明實施后所翻譯出的目標(biāo)詞句402,可以 解決以往來源詞句401當(dāng)中因無法辨識"surprisee",無法完整翻譯而翻譯出 "喔, 一個怎樣的surprisee!"的問題。
綜上所述,可知本發(fā)明與現(xiàn)有技術(shù)之間的差異在于具有先對比來源詞句 中的字詞是否具有萬用字符,并以萬用字符搜尋出符合條件的至少一替代字 詞,并在來源詞句中的字詞不存在時,搜尋至少一相似字詞,接著用替代字 詞和相似字詞取代來源詞句中的字詞再進行翻譯的技術(shù)手段,從而可以解決 以往使用者欲翻譯的來源詞句輸入不完善時,容易造成無法完整翻譯的問題, 進而達成提高翻譯效果的功效。
雖然本發(fā)明所提出的實施方式如上,但是所述的內(nèi)容并非用來直接限定 本發(fā)明的專利保護范圍。任何本發(fā)明所屬技術(shù)領(lǐng)域中具有通常技術(shù)知識的人 員,在不脫離本發(fā)明所提出的精神和范圍的前提下,可以在實施的形式上及 細節(jié)上作一些更改。本發(fā)明的專利保護范圍,仍須以所附的4又利要求書范圍 所界定為準(zhǔn)。
權(quán)利要求
1、一種模糊翻譯系統(tǒng),該系統(tǒng)包含一數(shù)據(jù)庫,用于儲存至少一筆字詞數(shù)據(jù)項及至少一筆翻譯數(shù)據(jù)項;一讀取模塊,用于讀取一來源詞句,該來源詞句是由至少一字詞所組成,且各該字詞是由至少一字符所組成;一對比模塊,用于對比該來源詞句的各該字詞是否存在一萬用字符;及用于在各該字詞不存在該萬用字符時,對比該來源詞句的各該字詞是否存在對應(yīng)的該字詞數(shù)據(jù)項;一搜尋模塊,用于在該來源詞句的各該字詞存在該萬用字符時,搜尋該數(shù)據(jù)庫的該些字詞數(shù)據(jù)項以取得符合條件的至少一替代字詞;及用于在該對比模塊對比出該來源詞句的各該字詞不存在該萬用字詞,且該來源詞句的各該字詞對應(yīng)的該字詞數(shù)據(jù)項不存在時,搜尋該數(shù)據(jù)庫的該些字詞數(shù)據(jù)項以取得至少一相似字詞;一取代模塊,用于用該搜尋模塊搜尋出的該些替代字詞或該些相似字詞取代該來源詞句中對應(yīng)的該字詞;及一翻譯模塊,用于根據(jù)取代后的該來源詞句查找對應(yīng)的該些翻譯數(shù)據(jù)項,產(chǎn)生一目標(biāo)詞句。
2、 如權(quán)利要求l所述的模糊翻譯系統(tǒng),其特征在于該萬用字符是用于在各該字詞中替代至少一個該些字符。
3、 如權(quán)利要求1所述的模糊翻譯系統(tǒng),其特征在于該搜尋模塊是4艮據(jù)該萬用字符位于各該字詞中的相對位置搜尋符合該萬用字符的至少一個該些字符以取得該些替代字詞。
4、 如權(quán)利要求l所述的模糊翻譯系統(tǒng),其特征在于該搜尋模塊是根據(jù)各該字詞的該些字符的排列順序依序搜尋儲存的該些字詞數(shù)據(jù)項。
5、 如權(quán)利要求1所述的模糊翻譯系統(tǒng),其特征在于該搜尋模塊還包含當(dāng)每一字詞搜尋到兩個以上的替代字詞或兩個以上的相似字詞時,生成一選取接口提供選取該些替代字詞之一或該些相似字詞之一,供該取代模塊用于取代該字詞。
6、 一種模糊翻譯方法,其特征在于,包含下列步驟建立 一數(shù)據(jù)庫,該數(shù)據(jù)庫儲存有至少 一筆字詞數(shù)據(jù)項及至少 一筆翻譯數(shù)據(jù)項;讀取一來源詞句,該來源詞句是由至少一字詞所組成,且各該字詞是由至少一字符組成;對比該來源詞句中的各該字詞是否具有一萬用字符,其中當(dāng)各該字詞具有該萬用字符時,搜尋該數(shù)據(jù)庫的該些字詞數(shù)據(jù)項以取得符合條件的至少一替代字詞;及當(dāng)各該字詞不具有該萬用字符,且對比出各該字詞對應(yīng)的該字詞數(shù)據(jù)項不存在時,搜尋該數(shù)據(jù)庫的該些字詞數(shù)據(jù)項以取得至少一相似字詞;以搜尋出的"j亥些替ft字詞或i亥些才目寸以子詞取4戈好該字詞;及根據(jù)取代后的該來源詞句查找對應(yīng)的該些翻譯數(shù)據(jù)項,產(chǎn)生一目標(biāo)詞句。
7、 如權(quán)利要求6所述的方法,其特征在于該萬用字符是用于在各該字詞中替代至少一個該些字符。
8、 如權(quán)利要求6所述的方法,其特征在于還根據(jù)該萬用字符位于各該字詞中的相對位置搜尋符合條件該萬用字符的至少一個該些字符以取得該些替代字詞。
9、 如權(quán)利要求6所述的方法,其特征在于還根據(jù)各該字詞的該些字符的排列順序依序搜尋儲存的該些字詞數(shù)據(jù)項。
10、如權(quán)利要求6所述的方法,其特征在于當(dāng)每一字詞搜尋到兩個以上的替代字詞或兩個以上的相似字詞時,還生成一選取接口提供選取該些替代字詞之一或該些相似字詞之一,用于取代該字詞。
全文摘要
一種模糊翻譯系統(tǒng)及其方法,用于解決以往欲翻譯的來源詞句輸入不完善時,造成的無法完整翻譯的問題。通過先對比來源詞句中的字詞是否具有萬用字符,以萬用字符搜尋出符合條件的至少一替代字詞,并當(dāng)來源詞句中的字詞不存在時,搜尋至少一相似字詞,以替代字詞和相似字詞取代來源詞句中的字詞后再進行翻譯,從而達到提高翻譯效果的技術(shù)功效。
文檔編號G06F17/28GK101673259SQ200810212309
公開日2010年3月17日 申請日期2008年9月8日 優(yōu)先權(quán)日2008年9月8日
發(fā)明者雋 羅, 邱全成 申請人:英業(yè)達股份有限公司