欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)字翻譯質(zhì)量評估方法和系統(tǒng)與流程

文檔序號:40567098發(fā)布日期:2025-01-03 11:27閱讀:10來源:國知局
一種數(shù)字翻譯質(zhì)量評估方法和系統(tǒng)與流程

本發(fā)明涉及自然語言處理領(lǐng)域,更具體地,涉及一種數(shù)字翻譯質(zhì)量評估方法和系統(tǒng)。


背景技術(shù):

1、例如,在車輛全球化制造的大背景下,操作手冊、說明書、內(nèi)部規(guī)范、設(shè)計(jì)文檔、工程圖紙等的專業(yè)文檔需要在不同的語言之間被準(zhǔn)確地翻譯。尤其,專業(yè)文檔中涉及的數(shù)字(例如,版本號、章節(jié)號、數(shù)量表示等)非常重要,細(xì)小的數(shù)字方面的差異就可能造成技術(shù)偏差。為了能夠快速高效地對此類專業(yè)文檔進(jìn)行翻譯,產(chǎn)生了大量多語言翻譯文本對。這些翻譯文本對后續(xù)復(fù)用存在很大的商業(yè)價值。但是,由于目前產(chǎn)生的翻譯對來源多種因素,大多質(zhì)量參差不齊,所以翻譯質(zhì)量的評估在自然語言處理領(lǐng)域得到廣泛關(guān)注。人工對翻譯文本進(jìn)行質(zhì)量評估將會是非常巨大的工作量,并且多語言翻譯中涉及到不同語言的專業(yè)用法,就需要專業(yè)領(lǐng)域人員才能夠完成評估工作。

2、此外,由于數(shù)字的表示方法在不同的語言中可能是不同的,因此,需要一種完全自動的針對數(shù)字的翻譯進(jìn)行評估的方法。


技術(shù)實(shí)現(xiàn)思路

1、提供本
技術(shù)實(shí)現(xiàn)要素:
以便以簡化形式介紹將在以下具體實(shí)施方式中進(jìn)一步的描述一些概念。本發(fā)明內(nèi)容并非旨在標(biāo)識所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于幫助確定所要求保護(hù)的主題的范圍。

2、根據(jù)本發(fā)明的一個方面,提供了一種數(shù)字翻譯質(zhì)量評估方法,包括:接收包括源語句和目標(biāo)語句的翻譯對,其中所述源語句是用源語言撰寫的待翻譯的語句,并且所述目標(biāo)語句是與所述源語句相對應(yīng)的被翻譯成目標(biāo)語言的語句;提取所述源語句和所述目標(biāo)語句中的數(shù)字詞組,以得到所提取的源語句數(shù)字詞組和所提取的目標(biāo)語句數(shù)字詞組;識別所述源語句數(shù)字詞組的數(shù)字詞組類別;基于所識別的數(shù)字詞組類別、所述源語言和所述目標(biāo)語言來對所述源語句數(shù)字詞組中的數(shù)字進(jìn)行格式轉(zhuǎn)換;將經(jīng)轉(zhuǎn)換的數(shù)字與所述目標(biāo)語句數(shù)字詞組中的數(shù)字進(jìn)行匹配;以及基于所述匹配的匹配結(jié)果來計(jì)算數(shù)字翻譯質(zhì)量評估得分。

3、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,方法進(jìn)一步包括:對所述翻譯對進(jìn)行數(shù)據(jù)預(yù)處理,以判斷所述翻譯對中的所述目標(biāo)語句是否存在預(yù)定義的翻譯錯誤。

4、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述預(yù)定義的翻譯錯誤包括以下中的一者:所述翻譯對中的所述目標(biāo)語句為空;或者所述目標(biāo)語句與所述源語句完全相等。

5、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個字符構(gòu)成。

6、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,識別所述源語句數(shù)字詞組的數(shù)字詞組類別進(jìn)一步包括:通過經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)來獲取所述源語句數(shù)字詞組的源數(shù)據(jù)數(shù)字詞組特征向量;以及將所述源數(shù)據(jù)數(shù)字詞組特征向量與特征庫中的數(shù)字詞組特征向量進(jìn)行匹配,以將所述特征庫中最相似的數(shù)字詞組特征向量所對應(yīng)的數(shù)字詞組類別作為所述源數(shù)據(jù)數(shù)字詞組的數(shù)字詞組類別。

7、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個數(shù)字詞組的特征向量來評估這兩個數(shù)字詞組之間的相似度。

8、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述特征庫記載一個或多個數(shù)字詞組的數(shù)字詞組特征向量以及對應(yīng)的數(shù)字詞組類別。

9、根據(jù)本發(fā)明的另一個方面,提供了一種數(shù)字翻譯質(zhì)量評估系統(tǒng),包括:經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)和數(shù)字翻譯質(zhì)量評估模塊;所述經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個數(shù)字詞組的特征向量來評估這兩個數(shù)字詞組之間的相似度;所述數(shù)字翻譯質(zhì)量評估模塊被配置成:接收包括源語句和目標(biāo)語句的翻譯對,其中所述源語句是用源語言撰寫的待翻譯的語句,并且所述目標(biāo)語句是與所述源語句相對應(yīng)的被翻譯成目標(biāo)語言的語句;提取所述源語句和所述目標(biāo)語句中的數(shù)字詞組,以得到所提取的源語句數(shù)字詞組和所提取的目標(biāo)語句數(shù)字詞組;識別所述源語句數(shù)字詞組的數(shù)字詞組類別;基于所識別的數(shù)字詞組類別、所述源語言和所述目標(biāo)語言來對所述源語句數(shù)字詞組中的數(shù)字進(jìn)行格式轉(zhuǎn)換;將經(jīng)轉(zhuǎn)換的數(shù)字與所述目標(biāo)語句數(shù)字詞組中的數(shù)字進(jìn)行匹配;以及基于所述匹配的匹配結(jié)果來計(jì)算數(shù)字翻譯質(zhì)量評估得分。

10、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,系統(tǒng)進(jìn)一步包括:數(shù)據(jù)預(yù)處理模塊,所述數(shù)據(jù)預(yù)處理模塊被配置成對所述翻譯對進(jìn)行數(shù)據(jù)預(yù)處理,以判斷所述翻譯對中的所述目標(biāo)語句是否存在預(yù)定義的翻譯錯誤。

11、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述預(yù)定義的翻譯錯誤包括以下中的一者:所述翻譯對中的所述目標(biāo)語句為空,或,所述目標(biāo)語句與所述源語句完全相等。

12、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,識別所述源語句數(shù)字詞組的數(shù)字詞組類別進(jìn)一步包括:通過經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)來獲取所述源語句數(shù)字詞組的源數(shù)據(jù)數(shù)字詞組特征向量;以及將所述源數(shù)據(jù)數(shù)字詞組特征向量與特征庫中的數(shù)字詞組特征向量進(jìn)行匹配,以將所述特征庫中最相似的數(shù)字詞組特征向量所對應(yīng)的數(shù)字詞組類別作為所述源數(shù)據(jù)數(shù)字詞組的數(shù)字詞組類別,所述特征庫記載一個或多個數(shù)字詞組的數(shù)字詞組特征向量以及對應(yīng)的數(shù)字詞組類別。

13、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個字符構(gòu)成。

14、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,所述特征庫記載一個或多個數(shù)字詞組的數(shù)字詞組特征向量以及對應(yīng)的數(shù)字詞組類別。

15、根據(jù)本發(fā)明的又一個方面,提供了一種數(shù)字翻譯質(zhì)量評估系統(tǒng),包括:離線訓(xùn)練子系統(tǒng),所述離線訓(xùn)練子系統(tǒng)被配置成采用不同語言的經(jīng)標(biāo)注數(shù)字詞組對來訓(xùn)練數(shù)字詞組嵌入網(wǎng)絡(luò),其中所述經(jīng)標(biāo)注數(shù)字詞組對包括具有相同類別的經(jīng)標(biāo)注數(shù)字詞組對以及具有不相同類別的經(jīng)標(biāo)注數(shù)字詞組對;以及在線評估子系統(tǒng),所述在線評估子系統(tǒng)包括如以上所述的數(shù)字翻譯質(zhì)量評估模塊。

16、根據(jù)本發(fā)明的進(jìn)一步實(shí)施例,經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個數(shù)字詞組的特征向量來評估這兩個數(shù)字詞組之間的相似度。

17、通過閱讀下面的詳細(xì)描述并參考相關(guān)聯(lián)的附圖,這些及其他特點(diǎn)和優(yōu)點(diǎn)將變得顯而易見。應(yīng)該理解,前面的概括說明和下面的詳細(xì)描述只是說明性的,不會對所要求保護(hù)的各方面形成限制。



技術(shù)特征:

1.一種數(shù)字翻譯質(zhì)量評估方法,包括:

2.如權(quán)利要求1所述的方法,進(jìn)一步包括:對所述翻譯對進(jìn)行數(shù)據(jù)預(yù)處理,以判斷所述翻譯對中的所述目標(biāo)語句是否存在預(yù)定義的翻譯錯誤。

3.如權(quán)利要求2所述的方法,其特征在于,所述預(yù)定義的翻譯錯誤包括以下中的一者:

4.如權(quán)利要求1所述的方法,其特征在于,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個字符構(gòu)成。

5.如權(quán)利要求4所述的方法,其特征在于,識別所述源語句數(shù)字詞組的數(shù)字詞組類別進(jìn)一步包括:

6.如權(quán)利要求5所述的方法,其特征在于,所述經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個數(shù)字詞組的特征向量來評估這兩個數(shù)字詞組之間的相似度。

7.如權(quán)利要求5所述的方法,其特征在于,所述特征庫記載一個或多個數(shù)字詞組的數(shù)字詞組特征向量以及對應(yīng)的數(shù)字詞組類別。

8.一種數(shù)字翻譯質(zhì)量評估系統(tǒng),包括:

9.如權(quán)利要求8所述的系統(tǒng),進(jìn)一步包括:

10.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述預(yù)定義的翻譯錯誤包括以下中的一者:所述翻譯對中的所述目標(biāo)語句為空,或,所述目標(biāo)語句與所述源語句完全相等。

11.如權(quán)利要求8所述的系統(tǒng),其特征在于,識別所述源語句數(shù)字詞組的數(shù)字詞組類別進(jìn)一步包括:

12.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述數(shù)字詞組由數(shù)字本身以及所述數(shù)字之前和/或之后的數(shù)個字符構(gòu)成。

13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述特征庫記載一個或多個數(shù)字詞組的數(shù)字詞組特征向量以及對應(yīng)的數(shù)字詞組類別。

14.一種數(shù)字翻譯質(zhì)量評估系統(tǒng),包括:

15.如權(quán)利要求14所述的系統(tǒng),其特征在于,經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)能夠基于兩個數(shù)字詞組的特征向量來評估這兩個數(shù)字詞組之間的相似度。


技術(shù)總結(jié)
本發(fā)明提供了一種數(shù)字翻譯質(zhì)量評估方法和系統(tǒng)。本發(fā)明提供的數(shù)字翻譯質(zhì)量評估方案主要涉及兩個階段,即離線訓(xùn)練階段和在線評估階段。其中,離線訓(xùn)練階段主要利用標(biāo)注數(shù)據(jù)來訓(xùn)練數(shù)字詞組嵌入網(wǎng)絡(luò),而在線評估階段主要利用經(jīng)訓(xùn)練的數(shù)字詞組嵌入網(wǎng)絡(luò)進(jìn)行數(shù)字詞組的向量提取,利用特征庫匹配方式進(jìn)行數(shù)字詞組類別的判斷,然后進(jìn)行數(shù)字翻譯格式轉(zhuǎn)換及翻譯結(jié)果評估。

技術(shù)研發(fā)人員:侍孝義,謝嘉偉
受保護(hù)的技術(shù)使用者:寶馬股份公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/2
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
读书| 东源县| 扬州市| 南昌市| 当雄县| 菏泽市| 比如县| 津南区| 中超| 郯城县| 伽师县| 通化市| 淅川县| 临沧市| 苗栗县| 绥中县| 三河市| 清原| 娱乐| 罗田县| 柳州市| 大悟县| 剑河县| 红原县| 韶山市| 信宜市| 桓台县| 贡嘎县| 门源| 胶南市| 谢通门县| 乌鲁木齐市| 赤城县| 洛宁县| 沛县| 手机| 德惠市| 淮安市| 醴陵市| 镇巴县| 保德县|