0057] 這里,利用大規(guī)模單語語料庫通過N元語言模型特征優(yōu)化了翻譯結(jié)果局部的流利 程度。需要說明的是,N元語言模型中當(dāng)前詞出現(xiàn)的概率僅和其之前的N-I個詞有關(guān)系。例 如,當(dāng)N取值為2時,當(dāng)前詞的出現(xiàn)概率僅和其前一個詞有關(guān)系。具體地,可通過以下公式 (4)執(zhí)行所述計算每個所述初選詞的N元語言模型特征的處理:
[0059] 其中,hlni為N元語言模型特征,e ,為目標語言的語句中第j個初選詞,e , i,…,e] n+1 為獲取初選詞^之前預(yù)測出的前n-1個候選詞。
[0060] 最后,可通過以下公式(5)執(zhí)行所述根據(jù)計算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特 征和統(tǒng)計機器翻譯模型的翻譯特征,結(jié)合所述對數(shù)線性模型計算每個所述初選詞的翻譯概 率值的處理:
[0062] 其中,m為翻譯特征的個數(shù),hjfw)為第i個翻譯特征,A1為第i個翻譯特征對 應(yīng)的特征權(quán)重,e為所述初選詞,f為源語言的單詞,p (e I f)為初選詞e的翻譯概率。需要 說明的是,公式(5)中的'是求和函數(shù)中的臨時變量,和求和符號一起使用表示對所有的 初選詞求和。
[0063] 在具體的實現(xiàn)方式中,依據(jù)公式(1)至公式(4)分別計算得到的神經(jīng)網(wǎng)絡(luò)翻譯模 型的翻譯特征h_、統(tǒng)計機器翻譯模型的翻譯特征h tpl、htp2和h lni,將上述多個翻譯特征以及 各自對應(yīng)的特征權(quán)重代入公式(5),計算每個所述初選詞的得分(即翻譯概率值),就可以 采用得分排序方式從多個初選詞中選取候選詞。這里,翻譯特征不同,其對應(yīng)的特征權(quán)重所 起的作用也不同。在實際應(yīng)用中,由于源語言的單詞f?一旦給定,公式(5)中分母部分的計 算結(jié)果是一個常量,因此只需計算分子部分即可。
[0064] 在步驟S140,根據(jù)預(yù)測得到的候選詞生成目標語言的語句。
[0065] 為了能夠生成可讀性及流暢性強的語句,進一步地,步驟S130還可以包括:依據(jù) 所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標記所述候選詞之間的關(guān)聯(lián)關(guān)系。仍以圖2為例,由于 任一所述候選詞的預(yù)測處理均是基于神經(jīng)網(wǎng)絡(luò)翻譯模型的,而神經(jīng)網(wǎng)絡(luò)翻譯模型的重要特 點就是考慮上下文的關(guān)聯(lián)關(guān)系,使得翻譯結(jié)果更加流暢。圖2示出的候選詞之間的箭頭線 代表了候選詞之間的關(guān)聯(lián)關(guān)系。例如,位于第二位的候選詞taxi與位于第一位的候選詞 the是相關(guān)聯(lián)的。
[0066] 相應(yīng)地,根據(jù)本發(fā)明的示例性實施例,步驟S140包括:根據(jù)具有關(guān)聯(lián)關(guān)系的所有 候選詞生成目標語言的語句。例如,參照圖2,重復(fù)執(zhí)行前述候選詞的預(yù)測處理步驟,直至 預(yù)測到設(shè)定的結(jié)束詞(EOS)為止。圖2中使用棧的結(jié)構(gòu)描述候選詞及各個候選詞之間的 關(guān)系,第一個棧(Stack-I)中的詞語是位于目標語言的語句中第一位的候選詞,第i個棧 (Stack-i)的詞語是位于目標語言的語句中第i位的候選詞,依據(jù)圖2示出的候選詞之間的 箭頭線就可以查找到具有關(guān)聯(lián)關(guān)系的所有候選詞,從而生成目標語言的語句。
[0067] 本發(fā)明實施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法,在獲取源語言的語句之后, 對其進行編碼得到向量序列,再基于向量序列逐詞地預(yù)測目標語言中相應(yīng)的候選詞,在任 一所述候選詞的預(yù)測處理過程中,首先從預(yù)設(shè)的翻譯詞表中獲取多個初選詞,基于結(jié)合了 神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計機器翻譯模型的翻譯特征的對數(shù)線性模型,計算每個 所述初選詞的翻譯概率,根據(jù)翻譯概率計算結(jié)果從多個初選詞選取候選詞,最終,根據(jù)經(jīng)上 述預(yù)測處理得到候選詞,從而自動地生成長度適宜的目標語言語句,提高了翻譯結(jié)果的準 確度、可讀性和流暢性。同時,降低了漏詞率。
[0068] 實施例二
[0069] 圖4是示出本發(fā)明實施例二的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置的邏輯框圖??捎糜?執(zhí)行如圖1所示實施例的方法步驟。
[0070] 參照圖4,所述基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置包括語句獲取模塊410、語句編碼模 塊420、候選詞預(yù)測模塊430和語句生成模塊440。
[0071] 語句獲取模塊410用于獲取源語言的語句。
[0072] 進一步地,所述語句獲取模塊410可包括以下單元之一:
[0073] 文本數(shù)據(jù)接收單元(未示出)用于接收文本數(shù)據(jù),并將所述文本數(shù)據(jù)作為所述源 語言的語句。
[0074] 語音數(shù)據(jù)接收及識別單元(未示出)用于接收語音數(shù)據(jù),對所述語音數(shù)據(jù)進行語 音識別得到經(jīng)語音識別的文本數(shù)據(jù),并將所述經(jīng)語音識別的文本數(shù)據(jù)作為所述源語言的語 句。
[0075] 圖片數(shù)據(jù)接收及識別單元(未示出)用于接收圖片數(shù)據(jù),對所述圖片數(shù)據(jù)進行光 學(xué)字符識別OCR得到經(jīng)OCR識別的文本數(shù)據(jù),并將所述經(jīng)OCR識別的文本數(shù)據(jù)作為所述源 語言的語句。
[0076] 語句編碼模塊420用于將所述源語言的語句進行編碼得到向量序列。
[0077] 具體地,所述語句編碼模塊420用于對源語言的語句進行分詞,將分得的多個分 詞分別轉(zhuǎn)換成與每個所述分詞對應(yīng)的詞向量,由多個分詞各自對應(yīng)的詞向量得到所述向量 序列。
[0078] 候選詞預(yù)測模塊430用于基于所述向量序列逐詞地預(yù)測目標語言中相應(yīng)的候選 詞。其中,在任一所述候選詞的預(yù)測處理中,從預(yù)設(shè)的翻譯詞表中獲取多個初選詞,并且基 于對數(shù)線性模型計算每個所述初選詞的翻譯概率,以根據(jù)所述翻譯概率從所述多個初選詞 選取所述候選詞,所述對數(shù)線性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計機器翻譯模 型的翻譯特征建立的。
[0079] 根據(jù)本發(fā)明的示例性實施例,所述候選詞預(yù)測模塊430可包括:
[0080] 初選詞獲取單元(未示出)用于從預(yù)設(shè)的翻譯詞表中獲取M個詞語作為初選詞, M為正整數(shù)。
[0081] 神經(jīng)網(wǎng)絡(luò)模型特征計算單元(未示出)用于根據(jù)所述向量序列和在獲取M個初選 詞之前預(yù)測出的候選詞,計算每個所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征。
[0082] 統(tǒng)計機器模型特征計算單元(未示出)用于計算每個所述初選詞的統(tǒng)計機器翻譯 模型的翻譯特征。
[0083] 翻譯概率計算單元(未示出)用于根據(jù)計算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征 和統(tǒng)計機器翻譯模型的翻譯特征,結(jié)合所述對數(shù)線性模型計算每個所述初選詞的翻譯概率 值。
[0084] 候選詞選取單元(未示出)用于對計算得到的M個翻譯概率值進行排序,并將與 前N位的翻譯概率值相應(yīng)的初選詞選取為所述候選詞,N為正整數(shù),且N < M。
[0085] 為了優(yōu)化單詞互譯程度,提高翻譯質(zhì)量,優(yōu)選地,所述統(tǒng)計機器翻譯模型的翻譯特 征可包括雙向單詞翻譯模型特征。
[0086] 可選地,所述統(tǒng)計機器翻譯模型的翻譯特征還包括N元語言模型特征和/或詞懲 罰特征。通過N元語言模型特征優(yōu)化了翻譯結(jié)果局部的流利程度,結(jié)合詞懲罰特征,對過短 的翻譯結(jié)果進行懲罰,進而優(yōu)化翻譯結(jié)果長度。
[0087] 語句生成模塊440用于根據(jù)預(yù)測得到的候選詞生成目標語言的語句。
[0088] 為了能夠生成可讀性及流暢性強的語句,進一步地,所述候選詞預(yù)測模塊430還 可以包括:候選詞關(guān)聯(lián)單元(未示出)用于依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標記所 述候選詞之間的關(guān)聯(lián)關(guān)系。
[0089] 相應(yīng)地,所述語句生成模塊440用于根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標語 言的語句。
[0090] 本發(fā)明實施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置,在獲取源語言的語句之后, 對其進行編碼得到向量序列,再基于向量序列逐詞地預(yù)測目標語言中相應(yīng)的候選詞,在任 一所述候選詞的預(yù)測處理過程中,首先從預(yù)設(shè)的翻譯詞表中獲取多個初選詞,基于結(jié)合了 神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計機器翻譯模型的翻譯特征的對數(shù)線性模型,計算每個 所述初選詞的翻譯概率,根據(jù)翻譯概率計算結(jié)果從多個初選詞選取候選詞,最終,根據(jù)經(jīng)上 述預(yù)測處理得到候選詞,從而自動地生成長度適宜的目標語言的語句,顯著提升了翻譯質(zhì) 量,同時提高了翻譯結(jié)果的可