本技術涉及機器翻譯領域,且更為具體地,涉及一種醫(yī)學機器翻譯自學習方法、裝置和電子設備。
背景技術:
1、當前,全球藥品和醫(yī)療服務市場聯(lián)系空前緊密。醫(yī)療消費和臨床試驗標準上的提升,加大了醫(yī)學翻譯需求。醫(yī)學翻譯不僅要確保翻譯的準確性和流暢性,還要保證醫(yī)學術語的精確和適合臨床科研的閱讀習慣,以準確傳達原文信息,任何微小誤差都可能導致嚴重后果。然而,人工醫(yī)學翻譯依賴多領域專家協(xié)作,但因??撇町惔螅y以統(tǒng)一標準,易導致翻譯不準確。
2、對此,專利cn116629277a提出了一種基于強化學習的醫(yī)學機器翻譯方法,其通過構建平行語料庫、建立和預訓練機器翻譯模型、計算翻譯質(zhì)量評分、構建強化學習訓練集及精調(diào)機器翻譯模型等步驟,提高了傳統(tǒng)人工醫(yī)學專業(yè)內(nèi)容的翻譯精度和效率。
3、在上述專利中對第一語言文本進行翻譯是通過transformer架構的模型得到第二語言的翻譯文本。具體地,該transformer架構采用了多頭注意力機制和卷積神經(jīng)網(wǎng)絡來捕捉文本句子的上下文信息。盡管transformer模型的自注意力機制和卷積模型能夠捕捉局部的上下文信息,但對于長距離的全局依賴關系的捕捉能力有限,尤其在處理醫(yī)學文本這類含有大量專業(yè)術語和復雜句式結構的句子時,仍可能因為注意力機制和卷積網(wǎng)絡中固定的卷積核的局限性而無法完全捕捉到所有重要關鍵的上下文信息,這可能導致翻譯結果可能出現(xiàn)關鍵信息的遺漏或錯誤解讀,進而影響臨床決策。
4、因此,期望一種優(yōu)化的醫(yī)學機器翻譯自學習方案。
技術實現(xiàn)思路
1、本技術針對現(xiàn)有技術中的缺點,提供了一種醫(yī)學機器翻譯自學習方法、裝置和電子設備。
2、根據(jù)本技術的一個方面,提供了一種醫(yī)學機器翻譯自學習方法,其包括:步驟1:建立醫(yī)學機器翻譯模型;步驟2:獲取第一初始平行語料,所述第一初始平行語料由第一語言、第一語言文本、第二語言和第二語言文本組成;步驟3:基于所述第一初始平行語料的第一語言和第二語言,使用所述醫(yī)學機器翻譯模型對所述第一語言文本進行翻譯以生成第二語言翻譯文本;步驟4:計算所述第二語言翻譯文本和所述第二語言文本之間的翻譯質(zhì)量評分;步驟5:基于所述翻譯質(zhì)量評分,確定是否將所述第一初始平行語料納入為訓練語料對所述醫(yī)學機器翻譯模型進行自學習優(yōu)化以調(diào)整所述醫(yī)學機器翻譯模型的模型參數(shù);其中,所述步驟3,包括:分別對所述第一語言和所述第二語言進行嵌入編碼以得到第一語言嵌入特征和第二語言嵌入特征;對所述第一語言文本進行詞粒度語義分析以得到第一語言文本詞粒度語義特征的序列;對所述第一語言文本詞粒度語義特征的序列進行場效序列語義特征增強以得到第一語言文本全局詞粒度語義增強特征;對所述第一語言文本全局詞粒度語義增強特征、所述第一語言嵌入特征和所述第二語言嵌入特征進行語義響應融合以得到第二語言翻譯文本語義表征,并基于所述第二語言翻譯文本語義表征,得到所述第二語言翻譯文本。
3、在上述醫(yī)學機器翻譯自學習方法中,分別對所述第一語言和所述第二語言進行嵌入編碼以得到第一語言嵌入特征和第二語言嵌入特征,包括:通過第一語言嵌入矩陣對所述第一語言進行嵌入編碼以得到第一語言嵌入編碼向量作為所述第一語言嵌入特征,并通過第二語言嵌入矩陣對所述第二語言進行嵌入編碼以得到第二語言嵌入編碼向量作為所述第二語言嵌入特征。
4、在上述醫(yī)學機器翻譯自學習方法中,對所述第一語言文本進行詞粒度語義分析以得到第一語言文本詞粒度語義特征的序列,包括:將所述第一語言文本進行分詞處理后通過基于bert模型的第一語言文本語義編碼器以得到第一語言文本詞粒度語義特征向量的序列作為所述第一語言文本詞粒度語義特征的序列。
5、在上述醫(yī)學機器翻譯自學習方法中,對所述第一語言文本詞粒度語義特征的序列進行場效序列語義特征增強以得到第一語言文本全局詞粒度語義增強特征,包括:使用語義重構器對所述第一語言文本詞粒度語義特征向量的序列中的各個第一語言文本詞粒度語義特征向量進行特征重構以得到重構第一語言文本詞粒度語義特征向量的序列;基于所述重構第一語言文本詞粒度語義特征向量的序列,對所述第一語言文本詞粒度語義特征的序列進行深度隱含語義全局增強以得到第一語言文本全局詞粒度語義增強特征向量作為所述第一語言文本全局詞粒度語義增強特征。
6、在上述醫(yī)學機器翻譯自學習方法中,基于所述重構第一語言文本詞粒度語義特征向量的序列,對所述第一語言文本詞粒度語義特征的序列進行深度隱含語義全局增強以得到第一語言文本全局詞粒度語義增強特征向量,包括:計算所述重構第一語言文本詞粒度語義特征向量的序列中的各個重構第一語言文本詞粒度語義特征向量的語義深度隱含表征值以得到第一語言文本詞粒度語義深度隱含表征值的序列;基于所述第一語言文本詞粒度語義深度隱含表征值的序列的排序,對所述第一語言文本詞粒度語義特征向量的序列進行重新排序以得到第一語言文本詞粒度語義特征向量的更新序列;對所述第一語言文本詞粒度語義特征向量的更新序列分別進行雙向全局語義編碼融合以得到所述第一語言文本全局詞粒度語義增強特征向量。
7、在上述醫(yī)學機器翻譯自學習方法中,對所述第一語言文本詞粒度語義特征向量的更新序列分別進行雙向全局語義編碼融合以得到所述第一語言文本全局詞粒度語義增強特征向量,包括:將所述第一語言文本詞粒度語義特征向量的更新序列輸入基于前向lstm模型的第一語義編碼器以得到前向全局第一語言文本詞粒度語義編碼特征向量;將所述第一語言文本詞粒度語義特征向量的更新序列輸入基于后向lstm模型的第一語義編碼器以得到后向全局第一語言文本詞粒度語義編碼特征向量;融合所述前向全局第一語言文本詞粒度語義編碼特征向量和所述后向全局第一語言文本詞粒度語義編碼特征向量以得到所述第一語言文本全局詞粒度語義增強特征向量。
8、在上述醫(yī)學機器翻譯自學習方法中,對所述第一語言文本全局詞粒度語義增強特征、所述第一語言嵌入特征和所述第二語言嵌入特征進行語義響應融合以得到第二語言翻譯文本語義表征,并基于所述第二語言翻譯文本語義表征,得到所述第二語言翻譯文本,包括:將所述第一語言文本全局詞粒度語義增強特征向量、所述第一語言嵌入編碼向量和所述第二語言嵌入編碼向量通過語義翻譯響應融合器以得到第二語言翻譯文本語義表征向量作為所述第二語言翻譯文本語義表征;將所述第二語言翻譯文本語義表征向量通過翻譯文本生成器以得到所述第二語言翻譯文本。
9、在上述醫(yī)學機器翻譯自學習方法中,所述翻譯文本生成器為基于aigc的翻譯文本生成器。
10、根據(jù)本技術的另一個方面,提供了一種醫(yī)學機器翻譯自學習裝置,用于執(zhí)行如上所述的醫(yī)學機器翻譯自學習方法,其中,所述醫(yī)學機器翻譯自學習裝置,包括:語言嵌入編碼模塊,用于分別對所述第一語言和所述第二語言進行嵌入編碼以得到第一語言嵌入特征和第二語言嵌入特征;語言文本詞粒度語義分析模塊,用于對所述第一語言文本進行詞粒度語義分析以得到第一語言文本詞粒度語義特征的序列;語義特征增強模塊,用于對所述第一語言文本詞粒度語義特征的序列進行場效序列語義特征增強以得到第一語言文本全局詞粒度語義增強特征;第二語言翻譯文本生成模塊,用于對所述第一語言文本全局詞粒度語義增強特征、所述第一語言嵌入特征和所述第二語言嵌入特征進行語義響應融合以得到第二語言翻譯文本語義表征,并基于所述第二語言翻譯文本語義表征,得到所述第二語言翻譯文本。
11、根據(jù)本技術的又一方面,提供了一種電子設備,包括存儲器和處理器,其中,所述處理器被配置為基于存儲在所述存儲器的指令,執(zhí)行如上任一項所述的醫(yī)學機器翻譯自學習方法。
12、本技術由于采用了以上的技術方案,具有顯著的技術效果:本技術提供的醫(yī)學機器翻譯自學習方法、裝置和電子設備,其采用基于人工智能和機器翻譯模型的語言處理和翻譯技術來對第一語言和第二語言進行嵌入編碼,對第一語言文本進行分詞和語義編碼,接著對各個第一語言文本詞粒度語義特征進行場效全局語義增強,以此根據(jù)第一語言文本全局詞粒度語義增強特征、第一語言嵌入特征和第二語言嵌入特征之間的響應融合表征來自動地生成第二語言翻譯文本。這樣,可以在更大范圍內(nèi)捕捉上下文信息,特別是在處理長句子和復雜結構時,能夠更好地理解句子間的邏輯關系和長距離依賴關系,并通過場效全局語義增強,可以減少關鍵信息的遺漏,確保翻譯結果的完整性和準確性。