讀性和流暢性,降低了漏詞率。
[0091 ] 在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所公開的裝置和方法,可以通過其 它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述模塊的劃分,僅 僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。
[0092] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一個(gè)處理模塊中,也可以 是各個(gè)模塊單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上模塊集成在一個(gè)模塊中。上述集成的模 塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能模塊的形式實(shí)現(xiàn)。
[0093] 上述以軟件功能模塊的形式實(shí)現(xiàn)的集成的模塊,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存 儲(chǔ)介質(zhì)中。上述軟件功能模塊存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算 機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā) 明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器 (Read-Only Memory,ROM)、隨機(jī)存取存儲(chǔ)器(Random Access Memory,RAM)、磁碟或者光盤 等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0094] 以上所述,僅為本發(fā)明的【具體實(shí)施方式】,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
【主權(quán)項(xiàng)】
1. 一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法,其特征在于,所述方法包括: 獲取源語(yǔ)言的語(yǔ)句; 將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼,得到向量序列; 基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞; 根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句, 其中,在任一所述候選詞的預(yù)測(cè)處理中,從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞,并且基 于對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率,以根據(jù)所述翻譯概率從所述多個(gè)初選詞 選取所述候選詞,所述對(duì)數(shù)線性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模 型的翻譯特征建立的。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選 詞,并且基于對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率,以根據(jù)所述翻譯概率從所述 多個(gè)初選詞選取所述候選詞的處理包括: 從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞,M為正整數(shù), 根據(jù)所述向量序列和在獲取M個(gè)初選詞之前預(yù)測(cè)出的候選詞,計(jì)算每個(gè)所述初選詞的 神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征, 計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征, 根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征,結(jié)合 所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率值, 對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序,并將與前N位的翻譯概率值相應(yīng)的初選詞選 取為所述候選詞,N為正整數(shù),且N < M。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于所述向量序列逐詞地預(yù)測(cè)目標(biāo) 語(yǔ)言中相應(yīng)的候選詞的處理還包括:依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選 詞之間的關(guān)聯(lián)關(guān)系, 所述根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句的處理包括: 根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征包括 雙向單詞翻譯模型特征。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還包 括N元語(yǔ)言模型特征和/或詞懲罰特征。6. 根據(jù)權(quán)利要求1~5中任一項(xiàng)所述的方法,其特征在于,所述將所述源語(yǔ)言的語(yǔ)句進(jìn) 行編碼得到向量序列的處理包括: 對(duì)源語(yǔ)言的語(yǔ)句進(jìn)行分詞, 將分得的多個(gè)分詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量, 由多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量序列。7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述獲取源語(yǔ)言的語(yǔ)句的處理包括以下 處理之一: 接收文本數(shù)據(jù),并將所述文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句, 接收語(yǔ)音數(shù)據(jù),對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別得到經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù),并將所述 經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句, 接收?qǐng)D片數(shù)據(jù),對(duì)所述圖片數(shù)據(jù)進(jìn)行光學(xué)字符識(shí)別OCR得到經(jīng)OCR識(shí)別的文本數(shù)據(jù),并 將所述經(jīng)OCR識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句。8. -種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置,其特征在于,所述裝置包括: 語(yǔ)句獲取模塊,用于獲取源語(yǔ)言的語(yǔ)句; 語(yǔ)句編碼模塊,用于將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列; 候選詞預(yù)測(cè)模塊,用于基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞; 語(yǔ)句生成模塊,用于根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句, 其中,在任一所述候選詞的預(yù)測(cè)處理中,從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞,并且基 于對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率,以根據(jù)所述翻譯概率從所述多個(gè)初選詞 選取所述候選詞,所述對(duì)數(shù)線性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模 型的翻譯特征建立的。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述候選詞預(yù)測(cè)模塊包括: 初選詞獲取單元,用于從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞,M為正整數(shù), 神經(jīng)網(wǎng)絡(luò)模型特征計(jì)算單元,用于根據(jù)所述向量序列和在獲取M個(gè)初選詞之前預(yù)測(cè)出 的候選詞,計(jì)算每個(gè)所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征, 統(tǒng)計(jì)機(jī)器模型特征計(jì)算單元,用于計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特 征, 翻譯概率計(jì)算單元,用于根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻 譯模型的翻譯特征,結(jié)合所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率值, 候選詞選取單元,用于對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序,并將與前N位的翻譯概 率值相應(yīng)的初選詞選取為所述候選詞,N為正整數(shù),且N < M。10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述候選詞預(yù)測(cè)模塊還包括:候選詞關(guān) 聯(lián)單元,用于依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系, 所述語(yǔ)句生成模塊,用于根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征包 括雙向單詞翻譯模型特征。12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還 包括N元語(yǔ)言模型特征和/或詞懲罰特征。13. 根據(jù)權(quán)利要求8~12中任一項(xiàng)所述的裝置,其特征在于,所述語(yǔ)句編碼模塊用于對(duì) 源語(yǔ)言的語(yǔ)句進(jìn)行分詞,將分得的多個(gè)分詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量,由 多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量序列。14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述語(yǔ)句獲取模塊包括以下單元之一: 文本數(shù)據(jù)接收單元,用于接收文本數(shù)據(jù),并將所述文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句, 語(yǔ)音數(shù)據(jù)接收及識(shí)別單元,用于接收語(yǔ)音數(shù)據(jù),對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別得到經(jīng) 語(yǔ)音識(shí)別的文本數(shù)據(jù),并將所述經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句, 圖片數(shù)據(jù)接收及識(shí)別單元,用于接收?qǐng)D片數(shù)據(jù),對(duì)所述圖片數(shù)據(jù)進(jìn)行光學(xué)字符識(shí)別OCR 得到經(jīng)OCR識(shí)別的文本數(shù)據(jù),并將所述經(jīng)OCR識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句。
【專利摘要】本發(fā)明實(shí)施例提供了一種基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置。其中,基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法包括:獲取源語(yǔ)言的語(yǔ)句;將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列;基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞;根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。本發(fā)明實(shí)施例的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置,能夠結(jié)合多種翻譯特征執(zhí)行翻譯,提高了翻譯結(jié)果的翻譯質(zhì)量、流利程度以及可讀性。
【IPC分類】G06N3/02, G06F17/28
【公開號(hào)】CN105068998
【申請(qǐng)?zhí)枴緾N201510455270
【發(fā)明人】何中軍, 和為, 吳華, 王海峰
【申請(qǐng)人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2015年11月18日
【申請(qǐng)日】2015年7月29日