欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

醫(yī)學機器翻譯方法、裝置和電子設備與流程

文檔序號:40428931發(fā)布日期:2024-12-24 15:02閱讀:13來源:國知局
醫(yī)學機器翻譯方法、裝置和電子設備與流程

本發(fā)明涉及翻譯,具體而言,涉及醫(yī)學機器翻譯方法、裝置和電子設備。


背景技術:

1、翻譯指的是將一種語言翻譯成另一種語言的過程。目前市面上已經有多款熱門且成熟的翻譯軟件。但是,醫(yī)學領域存在較多的專業(yè)術語和文檔,其與通常接觸的領域的差別巨大,現(xiàn)有的通用型翻譯軟件尚不能做到對醫(yī)學領域的相關資料的準確翻譯,給用戶的使用帶來諸多不便,而且,如果出現(xiàn)了翻譯錯誤,很有可能會帶來嚴重后果。

2、所以,如何提升對醫(yī)學領域的資料的準確翻譯性,是目前亟需解決的技術問題。


技術實現(xiàn)思路

1、對此,本發(fā)明提供了一種醫(yī)學機器翻譯方法、裝置、電子設備、計算機存儲介質及計算機程序產品,以解決上述技術問題。

2、本發(fā)明提供了一種醫(yī)學機器翻譯方法,所述方法包括如下步驟:接收待翻譯的醫(yī)學原文數據,對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞;其中,所述目標領域包括醫(yī)藥領域、醫(yī)療器械領域;根據所述目標領域調取對應的垂直翻譯模型,使用所述垂直模型對對應的分詞進行翻譯,獲得分詞譯文;其中,所述垂直翻譯模型包括醫(yī)藥領域翻譯模型、醫(yī)療器械領域翻譯模型;將所述醫(yī)學原文數據和各所述分詞譯文輸入通用醫(yī)學翻譯模型,所述通用醫(yī)學翻譯模型輸出醫(yī)學譯文數據;將所述醫(yī)學譯文數據展示給操作人員。

3、在一些實施例中,所述接收待翻譯的醫(yī)學原文數據,包括:接收攝像模組和/或文本輸入模組和/或文件輸入模組輸入的所述醫(yī)學原文數據。

4、在一些實施例中,所述對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞,包括:使用基于雙編碼器的分詞模型對所述醫(yī)學原文數據進行分詞處理,以獲得若干分詞;其中,所述分詞模型包括主編碼器和輔助編碼器,所述輔助編碼器用于為所述主編碼器提供關于醫(yī)學專有術語的粗粒度表示信息,所述主編碼器根據所述粗粒度表示信息確定分詞跨度;對各所述分詞進行語義分析,并根據語義分析結果與預設的各目標領域的語義含義進行匹配分析,根據匹配分析結果確定其屬于的目標領域。

5、在一些實施例中,所述根據匹配分析結果確定其屬于的目標領域,包括:根據匹配分析結果確定其屬于的目標領域的目標子領域;則所述根據所述目標領域調取對應的垂直翻譯模型,包括:根據各所述目標子領域調取對應的垂直翻譯模型;以及,所述通用醫(yī)學翻譯模型是基于預訓練語言模型構建得到的。

6、在一些實施例中,所述輔助編碼器用于為所述主編碼器提供關于醫(yī)學專有術語的粗粒度表示信息,包括:所述輔助編碼器判斷輸入的所述醫(yī)學原文數據中是否包含標題內容,若是,則從所述標題內容中提取得出醫(yī)學專有術語,基于所述醫(yī)學專有術語預測得出與所述醫(yī)學原文數據對應的醫(yī)學詞匯單體長度;根據所述醫(yī)學詞匯單體長度確定得出所述粗粒度表示信息。

7、在一些實施例中,所述將所述譯文文本數據展示給操作人員,包括:對操作人員的針對該醫(yī)學原文數據的語言適配能力進行評估,獲得語言適配能力等級;若所述語言適配能力等級高于能力等級閾值,則將所述譯文文本數據和所述原文文本數據展示頁面同時展示給操作人員;若所述語言適配能力等級不高于能力等級閾值,則僅將所述譯文文本數據在展示頁面展示給操作人員。

8、本發(fā)明還公開了一種醫(yī)學機器翻譯裝置,所述裝置包括分詞模塊、調取模塊、翻譯模塊、輸出模塊;所述分詞模塊,用于接收待翻譯的醫(yī)學原文數據,對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞;其中,所述目標領域包括醫(yī)藥領域、醫(yī)療器械領域;所述調取模塊,用于根據所述目標領域調取對應的垂直翻譯模型,使用所述垂直模型對對應的分詞進行翻譯,獲得分詞譯文;其中,所述垂直翻譯模型包括醫(yī)藥領域翻譯模型、醫(yī)療器械領域翻譯模型;所述翻譯模塊,用于將所述醫(yī)學原文數據和各所述分詞譯文輸入通用醫(yī)學翻譯模型,所述通用醫(yī)學翻譯模型輸出醫(yī)學譯文數據;所述輸出模塊,用于將所述醫(yī)學譯文數據展示給操作人員。

9、本發(fā)明還提供了一種電子設備,包括:至少一個處理器、存儲器以及存儲在所述存儲器中并可在所述至少一個處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序以實現(xiàn)如前任一項所述的方法。

10、本發(fā)明還提供了一種計算機存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執(zhí)行以實現(xiàn)如前任一所述的方法。

11、本發(fā)明還提供了一種計算機程序產品,當計算機程序產品被電子設備的處理器運行時,實現(xiàn)如前述實施例所述的方法。

12、本發(fā)明的有益效果在于:本發(fā)明將通用醫(yī)學翻譯模型和垂直翻譯模型進行了有機結合,使用垂直翻譯模型對醫(yī)藥領域、醫(yī)療器械領域的專業(yè)詞匯進行準確翻譯,同時再使用通用醫(yī)學翻譯模型將原文文本數據轉換為流暢、通順的譯文,從而實現(xiàn)了對醫(yī)學內容的準確翻譯,而且可以顯著提高通用醫(yī)學翻譯模型的翻譯速率。



技術特征:

1.一種醫(yī)學機器翻譯方法,其特征在于,所述方法包括如下步驟:接收待翻譯的醫(yī)學原文數據,對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞;其中,所述目標領域包括醫(yī)藥領域、醫(yī)療器械領域;根據所述目標領域調取對應的垂直翻譯模型,使用所述垂直模型對對應的分詞進行翻譯,獲得分詞譯文;其中,所述垂直翻譯模型包括醫(yī)藥領域翻譯模型、醫(yī)療器械領域翻譯模型;將所述醫(yī)學原文數據和各所述分詞譯文輸入通用醫(yī)學翻譯模型,所述通用醫(yī)學翻譯模型輸出醫(yī)學譯文數據;將所述醫(yī)學譯文數據展示給操作人員。

2.根據權利要求1所述的一種醫(yī)學機器翻譯方法,其特征在于:接收待翻譯的醫(yī)學原文數據,包括:接收攝像模組和/或文本輸入模組和/或文件輸入模組輸入的所述醫(yī)學原文數據。

3.根據權利要求2所述的一種醫(yī)學機器翻譯方法,其特征在于:對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞,包括:使用基于雙編碼器的分詞模型對所述醫(yī)學原文數據進行分詞處理,以獲得若干分詞;其中,所述分詞模型包括主編碼器和輔助編碼器,所述輔助編碼器用于為所述主編碼器提供關于醫(yī)學專有術語的粗粒度表示信息,所述主編碼器根據所述粗粒度表示信息確定分詞跨度;對各所述分詞進行語義分析,并根據語義分析結果與預設的各目標領域的語義含義進行匹配分析,根據匹配分析結果確定其屬于的目標領域。

4.根據權利要求3所述的一種醫(yī)學機器翻譯方法,其特征在于:根據匹配分析結果確定其屬于的目標領域,包括:根據匹配分析結果確定其屬于的目標領域的目標子領域;則所述根據所述目標領域調取對應的垂直翻譯模型,包括:根據各所述目標子領域調取對應的垂直翻譯模型;以及,所述通用醫(yī)學翻譯模型是基于預訓練語言模型構建得到的。

5.根據權利要求4所述的一種醫(yī)學機器翻譯方法,其特征在于:所述輔助編碼器用于為所述主編碼器提供關于醫(yī)學專有術語的粗粒度表示信息,包括:所述輔助編碼器判斷輸入的所述醫(yī)學原文數據中是否包含標題內容,若是,則從所述標題內容中提取得出醫(yī)學專有術語,基于所述醫(yī)學專有術語預測得出與所述醫(yī)學原文數據對應的醫(yī)學詞匯單體長度;根據所述醫(yī)學詞匯單體長度確定得出所述粗粒度表示信息。

6.根據權利要求5所述的一種醫(yī)學機器翻譯方法,其特征在于:所述將所述譯文文本數據展示給操作人員,包括:對操作人員的針對該醫(yī)學原文數據的語言適配能力進行評估,獲得語言適配能力等級;若所述語言適配能力等級高于能力等級閾值,則將所述譯文文本數據和所述原文文本數據展示頁面同時展示給操作人員;若所述語言適配能力等級不高于能力等級閾值,則僅將所述譯文文本數據在展示頁面展示給操作人員。

7.一種醫(yī)學機器翻譯裝置,所述裝置包括分詞模塊、調取模塊、翻譯模塊、輸出模塊;其特征在于:所述分詞模塊,用于接收待翻譯的醫(yī)學原文數據,對所述醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞;其中,所述目標領域包括醫(yī)藥領域、醫(yī)療器械領域;所述調取模塊,用于根據所述目標領域調取對應的垂直翻譯模型,使用所述垂直模型對對應的分詞進行翻譯,獲得分詞譯文;其中,所述垂直翻譯模型包括醫(yī)藥領域翻譯模型、醫(yī)療器械領域翻譯模型;所述翻譯模塊,用于將所述醫(yī)學原文數據和各所述分詞譯文輸入通用醫(yī)學翻譯模型,所述通用醫(yī)學翻譯模型輸出醫(yī)學譯文數據;所述輸出模塊,用于將所述醫(yī)學譯文數據展示給操作人員。

8.一種電子設備,包括:至少一個處理器、存儲器以及存儲在所述存儲器中并可在所述至少一個處理器上運行的計算機程序,其特征在于:所述處理器執(zhí)行所述計算機程序以實現(xiàn)如權利要求1-6任一所述的方法。

9.一種計算機存儲介質,所述計算機存儲介質存儲有計算機程序,其特征在于:所述計算機程序被處理器執(zhí)行以實現(xiàn)如權利要求1-6任一所述的方法。

10.一種計算機程序產品,包括存儲于非暫時性計算機可讀介質上的計算機程序,其特征在于:當計算機程序產品被電子設備的處理器運行時,實現(xiàn)如權利要求1-6任一所述的方法。


技術總結
本發(fā)明屬于翻譯技術領域。提供了醫(yī)學機器翻譯方法、裝置和電子設備。所述方法包括:接收待翻譯的醫(yī)學原文數據,對醫(yī)學原文數據進行分詞處理,并識別其屬于目標領域的分詞;根據目標領域調取對應的垂直翻譯模型,使用垂直模型對對應的分詞進行翻譯,獲得分詞譯文;將醫(yī)學原文數據和各分詞譯文輸入通用醫(yī)學翻譯模型,通用醫(yī)學翻譯模型輸出醫(yī)學譯文數據;將醫(yī)學譯文數據展示給操作人員。本發(fā)明使用垂直翻譯模型對醫(yī)藥領域、醫(yī)療器械領域的專業(yè)詞匯進行準確翻譯,同時再使用通用醫(yī)學翻譯模型將原文文本數據轉換為流暢、通順的譯文,從而實現(xiàn)了對醫(yī)學內容的準確翻譯,而且可以顯著提高通用醫(yī)學翻譯模型的翻譯速率。

技術研發(fā)人員:宋蒙蒙,楊瑞鋒,林景行,傅智勇,孫立建
受保護的技術使用者:杭州泰雅語言科技有限責任公司
技術研發(fā)日:
技術公布日:2024/12/23
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
清流县| 武宁县| 河南省| 托克托县| 卫辉市| 井研县| 房产| 定边县| 遵义市| 德江县| 嘉鱼县| 玛沁县| 报价| 淄博市| 峡江县| 咸宁市| 会昌县| 科技| 剑河县| 常德市| 长治县| 连州市| 彩票| 襄垣县| 错那县| 宜兰县| 舟山市| 靖安县| 伊金霍洛旗| 河源市| 波密县| 湘乡市| 达日县| 山阴县| 赣榆县| 聊城市| 佛冈县| 体育| 浏阳市| 杭锦后旗| 阜新市|