基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置的制造方法

文檔序號(hào)：9349932閱讀：417來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及機(jī)器翻譯技術(shù)領(lǐng)域，尤其涉及一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置。
【背景技術(shù)】
[0002] 近年來(lái)，循環(huán)神經(jīng)網(wǎng)絡(luò)（Recurrent Neural Network，RNN)技術(shù)被廣泛應(yīng)用于機(jī)器翻譯領(lǐng)域。與傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)相比，基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)能夠充分利用全局語(yǔ)義信息，翻譯質(zhì)量顯著提升。
[0003] 然而，基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)也存在著明顯的不足之處：
[0004] -、詞表受限。
[0005] 通常，RNN翻譯模型僅能使用一個(gè)數(shù)量有限的單詞詞表（通常三萬(wàn)單詞以?xún)?nèi)），導(dǎo) 致詞表外單詞（0ut-〇f-vocabulary，00V)無(wú)法翻譯。
[0006] 二、RNN翻譯模型僅支持雙語(yǔ)語(yǔ)句對(duì)進(jìn)行訓(xùn)練，難以利用可有效提高翻譯結(jié)果流利度的目標(biāo)語(yǔ)言單語(yǔ)語(yǔ)料進(jìn)行訓(xùn)練。
[0007] 三、無(wú)法增加或豐富更多的特征。
[0008] 具體來(lái)說(shuō)，傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯方法是基于多種特征執(zhí)行翻譯處理的，對(duì)于每一個(gè)翻譯單元（單詞、短語(yǔ)、翻譯規(guī)則等）均計(jì)算每個(gè)特征的得分，最終結(jié)合多個(gè)特征的得分來(lái)確定最優(yōu)翻譯結(jié)果。然而，這些能夠提高翻譯質(zhì)量的特征無(wú)法直接為RNN翻譯模型所用。
[0009] 四、漏詞現(xiàn)象嚴(yán)重，易生成較短翻譯結(jié)果，影響翻譯結(jié)果的可讀性。

【發(fā)明內(nèi)容】

[0010] 本發(fā)明實(shí)施例的目的在于，提供一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置，結(jié)合多種翻譯特征執(zhí)行翻譯，以提高翻譯結(jié)果的翻譯準(zhǔn)確性。
[0011] 為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明的實(shí)施例提供了一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法，包括：獲取源語(yǔ)言的語(yǔ)句；將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼，得到向量序列；基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞；根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ) 句，其中，在任一所述候選詞的預(yù)測(cè)處理中，從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，并且基于對(duì)數(shù)線(xiàn)性模型計(jì)算每個(gè)所述初選詞的翻譯概率，以根據(jù)所述翻譯概率從所述多個(gè)初選詞選取所述候選詞，所述對(duì)數(shù)線(xiàn)性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征建立的。
[0012] 優(yōu)選地，所述從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，并且基于對(duì)數(shù)線(xiàn)性模型計(jì)算每個(gè)所述初選詞的翻譯概率，以根據(jù)所述翻譯概率從所述多個(gè)初選詞選取所述候選詞的處理包括：從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞，M為正整數(shù)；根據(jù)所述向量序列和在獲取M個(gè)初選詞之前預(yù)測(cè)出的候選詞，計(jì)算每個(gè)所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征；計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征；根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征，結(jié)合所述對(duì)數(shù)線(xiàn)性模型計(jì)算每個(gè)所述初選詞的翻譯概率值；對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序，并將與前N位的翻譯概率值相應(yīng)的初選詞選取為所述候選詞，N為正整數(shù)，且N < M。
[0013] 優(yōu)選地，所述基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞的處理還包括：依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系，所述根據(jù)預(yù) 測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句的處理包括：根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0014] 優(yōu)選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征包括雙向單詞翻譯模型特征。
[0015] 優(yōu)選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還包括N元語(yǔ)言模型特征和/或詞懲罰特征。
[0016] 優(yōu)選地，所述將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列的處理包括：對(duì)源語(yǔ)言的語(yǔ)句進(jìn)行分詞，將分得的多個(gè)分詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量，由多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量序列。
[0017] 優(yōu)選地，所述獲取源語(yǔ)言的語(yǔ)句的處理包括以下處理之一：接收文本數(shù)據(jù)，并將所述文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句；接收語(yǔ)音數(shù)據(jù)，對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別得到經(jīng) 語(yǔ)音識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句；接收?qǐng)D片數(shù)據(jù)，對(duì)所述圖片數(shù)據(jù)進(jìn)行光學(xué)字符識(shí)別OCR得到經(jīng)OCR識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)OCR 識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句。
[0018] 本發(fā)明的實(shí)施例還提供了一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置，包括：語(yǔ)句獲取模塊，用于獲取源語(yǔ)言的語(yǔ)句；語(yǔ)句編碼模塊，用于將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列；候選詞預(yù)測(cè)模塊，用于基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞；語(yǔ)句生成模塊，用于根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句，其中，在任一所述候選詞的預(yù) 測(cè)處理中，從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，并且基于對(duì)數(shù)線(xiàn)性模型計(jì)算每個(gè)所述初選詞的翻譯概率，以根據(jù)所述翻譯概率從所述多個(gè)初選詞選取所述候選詞，所述對(duì)數(shù)線(xiàn)性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征建立的。
[0019] 優(yōu)選地，所述候選詞預(yù)測(cè)模塊包括：初選詞獲取單元，用于從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞，M為正整數(shù)；神經(jīng)網(wǎng)絡(luò)模型特征計(jì)算單元，用于根據(jù)所述向量序列和在獲取M個(gè)初選詞之前預(yù)測(cè)出的候選詞，計(jì)算每個(gè)所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征；統(tǒng)計(jì)機(jī)器模型特征計(jì)算單元，用于計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征；翻譯概率計(jì)算單元，用于根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī) 器翻譯模型的翻譯特征，結(jié)合所述對(duì)數(shù)線(xiàn)性模型計(jì)算每個(gè)所述初選詞的翻譯概率值；候選詞選取單元，用于對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序，并將與前N位的翻譯概率值相應(yīng) 的初選詞選取為所述候選詞，N為正整數(shù)，且N < M。
[0020] 優(yōu)選地，所述候選詞預(yù)測(cè)模塊還包括：候選詞關(guān)聯(lián)單元，用于依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系，所述語(yǔ)句生成模塊，用于根據(jù)具有關(guān) 聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0021] 優(yōu)選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征包括雙向單詞翻譯模型特征。
[0022] 優(yōu)選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還包括N元語(yǔ)言模型特征和/或詞懲罰特征。
[0023] 優(yōu)選地，所述語(yǔ)句編碼模塊用于對(duì)源語(yǔ)言的語(yǔ)句進(jìn)行分詞，將分得的多個(gè)分詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量，由多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量序列。
[0024] 優(yōu)選地，所述語(yǔ)句獲取模塊包括以下單元之一：文本數(shù)據(jù)接收單元，用于接收文本數(shù)據(jù)，并將所述文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句；語(yǔ)音數(shù)據(jù)接收及識(shí)別單元，用于接收語(yǔ)音數(shù)據(jù)，對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別得到經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句；圖片數(shù)據(jù)接收及識(shí)別單元，用于接收?qǐng)D片數(shù)據(jù)，對(duì)所述圖片數(shù)據(jù)進(jìn)行光學(xué)字符識(shí)別OCR得到經(jīng)OCR識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)OCR識(shí)別的文本數(shù) 據(jù)作為所述源語(yǔ)言的語(yǔ)句。
[0025] 本發(fā)明實(shí)施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置，對(duì)獲取到的源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列，再基于向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞，在任一所述候選詞的預(yù)測(cè)處理過(guò)程中，利用對(duì)數(shù)線(xiàn)性模型，將統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征引入神經(jīng)網(wǎng)絡(luò)翻譯模型，從而計(jì)算從預(yù)設(shè)的翻譯詞表中獲取的每個(gè)初選詞的翻譯概率，由此基于翻譯概率計(jì)算結(jié)果從多個(gè)初選詞中選取候選詞，最終根據(jù)預(yù)測(cè)的候選詞自動(dòng)地生成目標(biāo)語(yǔ)言的語(yǔ)句，極大地提高了翻譯的準(zhǔn)確性、可讀性及流暢性。同時(shí)，生成的翻譯結(jié)果長(zhǎng)度適宜，降低了漏詞率。
【附圖說(shuō)明】
[0026] 圖1是示出本發(fā)明實(shí)施例一的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法的流程圖；
[0027] 圖2是示出本發(fā)明實(shí)施例一的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法中神經(jīng)網(wǎng)絡(luò)翻譯模型的應(yīng)用場(chǎng)景示例性示意圖；
[0028] 圖3是示出本發(fā)明實(shí)施例一的基于神經(jīng)

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：何中軍;和為;吳華;王海峰;
技術(shù)所有人：百度在線(xiàn)網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專(zhuān)利的發(fā)明人

上一篇：一種修正實(shí)體詞識(shí)別的方法和裝置的制造方法
上一篇：平行語(yǔ)料的構(gòu)建方法及裝置的制造方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型相關(guān)技術(shù)

神經(jīng)網(wǎng)絡(luò)模型相關(guān)技術(shù)

人工神經(jīng)網(wǎng)絡(luò)模型相關(guān)技術(shù)

人工神經(jīng)元模型相關(guān)技術(shù)

神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相關(guān)技術(shù)

神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型相關(guān)技術(shù)

卷積神經(jīng)網(wǎng)絡(luò)模型相關(guān)技術(shù)

bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置的制造方法