欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估方法和系統(tǒng)與流程

文檔序號(hào):40567106發(fā)布日期:2025-01-03 11:27閱讀:8來(lái)源:國(guó)知局
一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估方法和系統(tǒng)與流程

本發(fā)明涉及自然語(yǔ)言處理領(lǐng)域,更具體地,涉及一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估方法和系統(tǒng)。


背景技術(shù):

1、例如,在車輛全球化制造的大背景下,操作手冊(cè)、說(shuō)明書、內(nèi)部規(guī)范、設(shè)計(jì)文檔、工程圖紙等的專業(yè)文檔需要在不同的語(yǔ)言之間被準(zhǔn)確地翻譯,由此避免可能產(chǎn)生的技術(shù)偏差。為了能夠快速高效地對(duì)此類專業(yè)文檔進(jìn)行翻譯,產(chǎn)生了大量多語(yǔ)言翻譯文本對(duì)。這些翻譯文本對(duì)后續(xù)復(fù)用存在很大的商業(yè)價(jià)值。但是,由于目前產(chǎn)生的翻譯對(duì)來(lái)源多種因素,大多質(zhì)量參差不齊,所以翻譯質(zhì)量的評(píng)估在自然語(yǔ)言處理領(lǐng)域得到廣泛關(guān)注。人工對(duì)翻譯文本進(jìn)行質(zhì)量評(píng)估將會(huì)是非常巨大的工作量,并且多語(yǔ)言翻譯中涉及到不同語(yǔ)言的專業(yè)用法,就需要專業(yè)領(lǐng)域人員才能夠完成評(píng)估工作。

2、傳統(tǒng)的翻譯質(zhì)量評(píng)估較多使用bleu值,并且需要眾多的人類專業(yè)翻譯譯文。本質(zhì)上單獨(dú)的bleu質(zhì)量評(píng)估只能評(píng)估翻譯結(jié)果和參考譯文之間的大致文本相似度,但是忽略了語(yǔ)義和語(yǔ)法的特征,所以近義詞、譯文的長(zhǎng)度都會(huì)影響到翻譯評(píng)估的效果。

3、此外,現(xiàn)有翻譯質(zhì)量評(píng)估僅僅評(píng)估翻譯譯文和參考譯文之間的質(zhì)量得分,沒(méi)有對(duì)翻譯中出現(xiàn)的錯(cuò)誤因素進(jìn)行評(píng)估,缺少詳細(xì)的錯(cuò)誤因素分析,從而缺少一個(gè)全面的評(píng)估方法及標(biāo)準(zhǔn)。

4、因此,需要一種對(duì)翻譯譯文進(jìn)行全面自動(dòng)評(píng)估的方案。


技術(shù)實(shí)現(xiàn)思路

1、提供本
技術(shù)實(shí)現(xiàn)要素:
以便以簡(jiǎn)化形式介紹將在以下具體實(shí)施方式中進(jìn)一步的描述一些概念。本發(fā)明內(nèi)容并非旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于幫助確定所要求保護(hù)的主題的范圍。

2、根據(jù)本發(fā)明的一個(gè)方面,提供了一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估方法,包括:接收包括源語(yǔ)句和目標(biāo)語(yǔ)句的翻譯對(duì),其中所述源語(yǔ)句是用源語(yǔ)言撰寫的待翻譯的語(yǔ)句,并且所述目標(biāo)語(yǔ)句是與所述源語(yǔ)句相對(duì)應(yīng)的被翻譯成目標(biāo)語(yǔ)言的語(yǔ)句;在語(yǔ)義層級(jí)對(duì)所述翻譯對(duì)進(jìn)行評(píng)估,以得到所述翻譯對(duì)的語(yǔ)義評(píng)估得分;在多個(gè)因素層級(jí)對(duì)所述翻譯對(duì)進(jìn)行評(píng)估,以得到所述翻譯對(duì)的多因素評(píng)估得分,所述多個(gè)因素包括以下中的一者或多者:數(shù)字翻譯錯(cuò)誤因素、單位符號(hào)翻譯錯(cuò)誤因素、拼寫錯(cuò)誤因素;以及將所述翻譯對(duì)的所述語(yǔ)義評(píng)估得分和所述翻譯對(duì)的所述多因素評(píng)估得分相組合以得到所述翻譯對(duì)的綜合評(píng)估得分。

3、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,方法進(jìn)一步包括:對(duì)所述翻譯對(duì)進(jìn)行數(shù)據(jù)預(yù)處理,以判斷所述翻譯對(duì)中的所述目標(biāo)語(yǔ)句是否存在預(yù)定義的翻譯錯(cuò)誤,所述預(yù)定義的翻譯錯(cuò)誤包括以下中的一者:所述翻譯對(duì)中的所述目標(biāo)語(yǔ)句為空;或者所述目標(biāo)語(yǔ)句與所述源語(yǔ)句完全相等。

4、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,得到所述翻譯對(duì)的所述語(yǔ)義評(píng)估得分進(jìn)一步包括:采用經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò),結(jié)合bleu評(píng)價(jià)指標(biāo)來(lái)對(duì)所述翻譯對(duì)進(jìn)行語(yǔ)義翻譯質(zhì)量評(píng)估,以得到語(yǔ)義翻譯質(zhì)量評(píng)估得分,其中所述經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)能夠基于兩個(gè)語(yǔ)句的特征向量來(lái)評(píng)估這兩個(gè)語(yǔ)句之間的語(yǔ)義相似度;采用術(shù)語(yǔ)翻譯庫(kù)來(lái)對(duì)所述翻譯對(duì)進(jìn)行術(shù)語(yǔ)翻譯質(zhì)量評(píng)估,以得到術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分,所述術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分表示所述源語(yǔ)句中的術(shù)語(yǔ)是否被正確地翻譯;以及將所述語(yǔ)義翻譯質(zhì)量評(píng)估得分和所述術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分相組合來(lái)得到對(duì)所述翻譯對(duì)的所述語(yǔ)義評(píng)估得分。

5、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,得到所述語(yǔ)義翻譯質(zhì)量評(píng)估得分進(jìn)一步包括:經(jīng)由翻譯應(yīng)用程序接口來(lái)獲取針對(duì)所述翻譯對(duì)中的所述源語(yǔ)句的一個(gè)或多個(gè)參考譯文;將所述目標(biāo)語(yǔ)句和所述一個(gè)或多個(gè)參考譯文輸入所述經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)來(lái)得到句子嵌入網(wǎng)絡(luò)評(píng)估得分;計(jì)算所述目標(biāo)語(yǔ)句和所述一個(gè)或多個(gè)參考譯文的bleu評(píng)價(jià)指標(biāo)值;以及將所述句子嵌入網(wǎng)絡(luò)評(píng)估得分以及所述bleu評(píng)價(jià)指標(biāo)值相組合以得到所述語(yǔ)義翻譯質(zhì)量評(píng)估得分。

6、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,得到所述翻譯對(duì)的所述多因素評(píng)估得分進(jìn)一步包括:提取所述源語(yǔ)句和所述目標(biāo)語(yǔ)句中的數(shù)字詞組,以得到所提取的源語(yǔ)句數(shù)字詞組和所提取的目標(biāo)語(yǔ)句數(shù)字詞組,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個(gè)字符構(gòu)成;識(shí)別所述源語(yǔ)句數(shù)字詞組的數(shù)字詞組類別;基于所識(shí)別的數(shù)字詞組類別、所述源語(yǔ)言和所述目標(biāo)語(yǔ)言來(lái)對(duì)所述源語(yǔ)句數(shù)字詞組中的數(shù)字進(jìn)行格式轉(zhuǎn)換;將經(jīng)轉(zhuǎn)換的數(shù)字與所述目標(biāo)語(yǔ)句數(shù)字詞組中的數(shù)字進(jìn)行匹配;基于所述匹配的匹配結(jié)果來(lái)計(jì)算數(shù)字翻譯錯(cuò)誤因素評(píng)估得分。

7、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,得到所述翻譯對(duì)的所述多因素評(píng)估得分進(jìn)一步包括:識(shí)別所述目標(biāo)語(yǔ)句中的單位符號(hào)錯(cuò)誤以計(jì)算單位符號(hào)翻譯錯(cuò)誤因素評(píng)估得分;識(shí)別所述目標(biāo)語(yǔ)句中的拼寫錯(cuò)誤以計(jì)算拼寫錯(cuò)誤因素評(píng)估得分;以及基于計(jì)算出的數(shù)字翻譯錯(cuò)誤因素評(píng)估得分、單位符號(hào)翻譯錯(cuò)誤因素評(píng)估得分和拼寫錯(cuò)誤因素評(píng)估得分來(lái)計(jì)算所述多因素評(píng)估得分。

8、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,識(shí)別所述源語(yǔ)句數(shù)字詞組的數(shù)字詞組類別進(jìn)一步包括:通過(guò)經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)來(lái)獲取所述源語(yǔ)句數(shù)字詞組的源數(shù)據(jù)數(shù)字詞組特征向量,其中所述經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個(gè)數(shù)字詞組的特征向量來(lái)評(píng)估這兩個(gè)數(shù)字詞組之間的相似度;以及將所述源數(shù)據(jù)數(shù)字詞組特征向量與特征庫(kù)中的數(shù)字詞組特征向量進(jìn)行匹配,以將所述特征庫(kù)中最相似的數(shù)字詞組特征向量所對(duì)應(yīng)的數(shù)字詞組類別作為所述源數(shù)據(jù)數(shù)字詞組的數(shù)字詞組類別,其中所述特征庫(kù)記載一個(gè)或多個(gè)數(shù)字詞組的數(shù)字詞組特征向量以及對(duì)應(yīng)的數(shù)字詞組類別。

9、根據(jù)本發(fā)明的另一個(gè)方面,提供了一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估系統(tǒng),包括:經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò),所述經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)能夠基于兩個(gè)語(yǔ)句的特征向量來(lái)評(píng)估這兩個(gè)語(yǔ)句之間的語(yǔ)義相似度;經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò),所述經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個(gè)數(shù)字詞組的特征向量來(lái)評(píng)估這兩個(gè)數(shù)字詞組之間的相似度;語(yǔ)義評(píng)估模塊,所述語(yǔ)義評(píng)估模塊被配置成在語(yǔ)義層級(jí)對(duì)翻譯對(duì)進(jìn)行評(píng)估,以得到所述翻譯對(duì)的語(yǔ)義評(píng)估得分;多因素評(píng)估模塊,所述多因素評(píng)估模塊被配置成在多個(gè)因素層級(jí)對(duì)所述翻譯對(duì)進(jìn)行評(píng)估,以得到所述翻譯對(duì)的多因素評(píng)估得分,所述多個(gè)因素包括以下中的一者或多者:數(shù)字翻譯錯(cuò)誤因素、單位符號(hào)翻譯錯(cuò)誤因素、拼寫錯(cuò)誤因素;以及綜合評(píng)估模塊,所述綜合評(píng)估模塊被配置成將所述翻譯對(duì)的所述語(yǔ)義評(píng)估得分和所述翻譯對(duì)的所述多因素評(píng)估得分相組合以得到所述翻譯對(duì)的綜合評(píng)估得分。

10、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,系統(tǒng)進(jìn)一步包括:數(shù)據(jù)預(yù)處理模塊,所述數(shù)據(jù)預(yù)處理模塊被配置成對(duì)所述翻譯對(duì)進(jìn)行數(shù)據(jù)預(yù)處理,以判斷所述翻譯對(duì)中的所述目標(biāo)語(yǔ)句是否存在預(yù)定義的翻譯錯(cuò)誤,其中所述預(yù)定義的翻譯錯(cuò)誤包括以下中的一者:所述翻譯對(duì)中的所述目標(biāo)語(yǔ)句為空,或,所述目標(biāo)語(yǔ)句與所述源語(yǔ)句完全相等。

11、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述語(yǔ)義評(píng)估模塊被進(jìn)一步配置成:采用經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò),結(jié)合bleu評(píng)價(jià)指標(biāo)來(lái)對(duì)所述翻譯對(duì)進(jìn)行語(yǔ)義翻譯質(zhì)量評(píng)估,以得到語(yǔ)義翻譯質(zhì)量評(píng)估得分,其中所述經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)能夠基于兩個(gè)語(yǔ)句的特征向量來(lái)評(píng)估這兩個(gè)語(yǔ)句之間的語(yǔ)義相似度;采用術(shù)語(yǔ)翻譯庫(kù)來(lái)對(duì)所述翻譯對(duì)進(jìn)行術(shù)語(yǔ)翻譯質(zhì)量評(píng)估,以得到術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分,所述術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分表示所述源語(yǔ)句中的術(shù)語(yǔ)是否被正確地翻譯;以及將所述語(yǔ)義翻譯質(zhì)量評(píng)估得分和所述術(shù)語(yǔ)翻譯質(zhì)量評(píng)估得分相組合來(lái)得到對(duì)所述翻譯對(duì)的所述語(yǔ)義評(píng)估得分。

12、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,得到所述語(yǔ)義翻譯質(zhì)量評(píng)估得分進(jìn)一步包括:經(jīng)由翻譯應(yīng)用程序接口來(lái)獲取針對(duì)所述翻譯對(duì)中的所述源語(yǔ)句的一個(gè)或多個(gè)參考譯文;將所述目標(biāo)語(yǔ)句和所述一個(gè)或多個(gè)參考譯文輸入所述經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)來(lái)得到句子嵌入網(wǎng)絡(luò)評(píng)估得分;計(jì)算所述目標(biāo)語(yǔ)句和所述一個(gè)或多個(gè)參考譯文的bleu評(píng)價(jià)指標(biāo)值;以及將所述句子嵌入網(wǎng)絡(luò)評(píng)估得分以及所述bleu評(píng)價(jià)指標(biāo)值相組合以得到所述語(yǔ)義翻譯質(zhì)量評(píng)估得分。

13、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述多因素評(píng)估模塊被進(jìn)一步配置成:提取所述源語(yǔ)句和所述目標(biāo)語(yǔ)句中的數(shù)字詞組,以得到所提取的源語(yǔ)句數(shù)字詞組和所提取的目標(biāo)語(yǔ)句數(shù)字詞組,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個(gè)字符構(gòu)成;識(shí)別所述源語(yǔ)句數(shù)字詞組的數(shù)字詞組類別;基于所識(shí)別的數(shù)字詞組類別、所述源語(yǔ)言和所述目標(biāo)語(yǔ)言來(lái)對(duì)所述源語(yǔ)句數(shù)字詞組中的數(shù)字進(jìn)行格式轉(zhuǎn)換;將經(jīng)轉(zhuǎn)換的數(shù)字與所述目標(biāo)語(yǔ)句數(shù)字詞組中的數(shù)字進(jìn)行匹配;基于所述匹配的匹配結(jié)果來(lái)計(jì)算數(shù)字翻譯錯(cuò)誤因素評(píng)估得分。

14、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述多因素評(píng)估模塊被進(jìn)一步配置成:識(shí)別所述目標(biāo)語(yǔ)句中的單位符號(hào)錯(cuò)誤以計(jì)算單位符號(hào)翻譯錯(cuò)誤因素評(píng)估得分;識(shí)別所述目標(biāo)語(yǔ)句中的拼寫錯(cuò)誤以計(jì)算拼寫錯(cuò)誤因素評(píng)估得分;以及基于計(jì)算出的數(shù)字翻譯錯(cuò)誤因素評(píng)估得分、單位符號(hào)翻譯錯(cuò)誤因素評(píng)估得分和拼寫錯(cuò)誤因素評(píng)估得分來(lái)計(jì)算所述多因素評(píng)估得分。

15、根據(jù)本發(fā)明的又一個(gè)方面,提供了一種基于多因素及語(yǔ)義的翻譯自動(dòng)評(píng)估系統(tǒng),包括:離線訓(xùn)練子系統(tǒng),所述離線訓(xùn)練子系統(tǒng)被配置成采用不同語(yǔ)言的經(jīng)標(biāo)注句子對(duì)來(lái)訓(xùn)練語(yǔ)義級(jí)別的句子嵌入網(wǎng)絡(luò)以及采用不同語(yǔ)言的經(jīng)標(biāo)注數(shù)字詞組對(duì)來(lái)訓(xùn)練數(shù)字詞組嵌入網(wǎng)絡(luò),其中所述經(jīng)標(biāo)注句子對(duì)包括具有相同語(yǔ)義的經(jīng)標(biāo)注句子對(duì)以及具有不相同語(yǔ)義的經(jīng)標(biāo)注句子對(duì),并且所述經(jīng)標(biāo)注數(shù)字詞組對(duì)包括具有相同類別的經(jīng)標(biāo)注數(shù)字詞組對(duì)以及具有不相同類別的經(jīng)標(biāo)注數(shù)字詞組對(duì);以及在線評(píng)估子系統(tǒng),所述在線評(píng)估子系統(tǒng)包括如上所述的語(yǔ)義評(píng)估模塊、多因素評(píng)估模塊和綜合評(píng)估模塊。

16、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,經(jīng)訓(xùn)練的句子嵌入網(wǎng)絡(luò)能夠基于兩個(gè)語(yǔ)句的特征向量來(lái)評(píng)估這兩個(gè)語(yǔ)句之間的語(yǔ)義相似度,并且經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個(gè)數(shù)字詞組的特征向量來(lái)評(píng)估這兩個(gè)數(shù)字詞組之間的相似度。

17、通過(guò)閱讀下面的詳細(xì)描述并參考相關(guān)聯(lián)的附圖,這些及其他特點(diǎn)和優(yōu)點(diǎn)將變得顯而易見(jiàn)。應(yīng)該理解,前面的概括說(shuō)明和下面的詳細(xì)描述只是說(shuō)明性的,不會(huì)對(duì)所要求保護(hù)的各方面形成限制。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西吉县| 德格县| 九江县| 四川省| 宝鸡市| 滦平县| 黎城县| 吴旗县| 和平县| 杭锦后旗| 鲜城| 宝山区| 栖霞市| 大田县| 伊金霍洛旗| 宁阳县| 教育| 峡江县| 梨树县| 新巴尔虎右旗| 麻江县| 溧水县| 四川省| 密云县| 灵山县| 中阳县| 柘荣县| 汉寿县| 山西省| 崇礼县| 响水县| 苏尼特左旗| 龙海市| 陆川县| 徐水县| 石台县| 吉水县| 洮南市| 谢通门县| 安达市| 苏尼特左旗|