本申請涉及人工智能,尤其涉及一種病歷文本推薦方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著電子病歷系統(tǒng)的普及,相似病歷在疾病診斷、治療方案選擇和藥物選擇中發(fā)揮著越來越重要的作用,相似病歷匹配可以減少重復(fù)勞動,也為訓(xùn)練新進醫(yī)生提供有效渠道和幫帶途徑。目前相似病歷通過語義相似度計算的方式進行查詢,或者通過預(yù)設(shè)語義模型進行識別,但是目前訓(xùn)練語言模型通常在大規(guī)模文本數(shù)據(jù)上進行預(yù)訓(xùn)練,可能存在無法充分捕獲特定領(lǐng)域的知識,導(dǎo)致模型在特定領(lǐng)域任務(wù)上的性能受限,進而使得相似病歷的查詢誤差較大,其次,目前的預(yù)設(shè)語義模型無法從病歷文本中查詢出各個實體的關(guān)系。
2、因此,如何準(zhǔn)確地查詢到病歷文本的相似病歷文本和各個實體的關(guān)系是目前亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本申請的主要目的在于提供一種病歷文本推薦方法、裝置、設(shè)備及存儲介質(zhì),旨在提高相似病歷文本推薦的效率和準(zhǔn)確性。
2、第一方面,本申請?zhí)峁┮环N病歷文本推薦方法,所述病歷文本推薦方法包括以下步驟:
3、獲取樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集包括多個樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括樣本病例文本、多個第一病例文本以及多個第二病例文本,每個所述第一病例文本均與所述樣本病例文本相似,每個所述第二病例文本均與所述樣本病例文本不相似;
4、獲取預(yù)設(shè)知識數(shù)據(jù)庫,所述預(yù)設(shè)知識數(shù)據(jù)庫包括多個實體中的每個所述實體的嵌入表示以及多個所述實體之間的每種關(guān)系的嵌入表示;
5、對預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型進行初始化,得到病歷文本推薦模型,并從所述樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù);
6、將所述目標(biāo)樣本數(shù)據(jù)和所述預(yù)設(shè)知識數(shù)據(jù)庫輸入至所述病歷文本推薦模型進行訓(xùn)練,得到各所述第一病例文本和各所述第二病例文本與所述樣本病例文本的模型輸出結(jié)果;
7、根據(jù)所述模型輸出結(jié)果、所述目標(biāo)樣本數(shù)據(jù)中樣本病例文本與第一病例文本和所述第二病例文本的相似類別,確定所述病歷文本推薦模型是否收斂;
8、若所述病歷文本推薦模型未收斂時,更新所述病歷文本推薦模型的模型參數(shù),并繼續(xù)執(zhí)行從所述樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù)的步驟,直至所述病歷文本推薦模型收斂;
9、獲取待推薦的病歷文本,通過所述病歷文本推薦模型對所述待推薦的病歷文本進行識別,得到多個相似病歷文本和所述待推薦的病歷文本中多個實體關(guān)系信息。
10、第二方面,本申請還提供一種病歷文本推薦裝置,所述病歷文本推薦裝置包括獲取模塊、模型初始化模塊、模型訓(xùn)練模塊、確定模塊和生成模塊,其中:
11、所述獲取模塊,用于獲取樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集包括多個樣本數(shù)據(jù),所述樣本數(shù)據(jù)包括樣本病例文本、多個第一病例文本以及多個第二病例文本,每個所述第一病例文本均與所述樣本病例文本相似,每個所述第二病例文本均與所述樣本病例文本不相似;
12、所述獲取模塊,還用于獲取預(yù)設(shè)知識數(shù)據(jù)庫,所述預(yù)設(shè)知識數(shù)據(jù)庫包括多個實體中的每個所述實體的嵌入表示以及多個所述實體之間的每種關(guān)系的嵌入表示;
13、所述模型初始化模塊,用于對預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型進行初始化,得到病歷文本推薦模型;
14、所述獲取模塊,還用于從所述樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù);
15、所述模型訓(xùn)練模塊,用于將所述目標(biāo)樣本數(shù)據(jù)和所述預(yù)設(shè)知識數(shù)據(jù)庫輸入至所述病歷文本推薦模型進行訓(xùn)練,得到各所述第一病例文本和各所述第二病例文本與所述樣本病例文本的模型輸出結(jié)果;
16、所述確定模塊,用于根據(jù)所述模型輸出結(jié)果、所述目標(biāo)樣本數(shù)據(jù)中樣本病例文本與第一病例文本和所述第二病例文本的相似類別,確定所述病歷文本推薦模型是否收斂;
17、所述生成模塊,用于若所述病歷文本推薦模型未收斂時,更新所述病歷文本推薦模型的模型參數(shù),并繼續(xù)執(zhí)行從所述樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù)的步驟,直至所述病歷文本推薦模型收斂;
18、所述獲取模塊,還用于獲取待推薦的病歷文本;
19、所述生成模塊,還用于通過所述病歷文本推薦模型對所述待推薦的病歷文本進行識別,得到多個相似病歷文本和所述待推薦的病歷文本中多個實體關(guān)系信息。
20、第三方面,本申請還提供一種計算機設(shè)備,所述計算機設(shè)備包括處理器、存儲器、以及存儲在所述存儲器上并可被所述處理器執(zhí)行的計算機程序,其中所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)如上述的病歷文本推薦方法的步驟。
21、第四方面,本申請還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,其中所述計算機程序被處理器執(zhí)行時,實現(xiàn)如上述的病歷文本推薦方法的步驟。
22、本申請?zhí)峁┮环N病歷文本推薦方法、裝置、設(shè)備及存儲介質(zhì),本申請通過獲取樣本數(shù)據(jù)集,樣本數(shù)據(jù)集包括多個樣本數(shù)據(jù),樣本數(shù)據(jù)包括樣本病例文本、多個第一病例文本以及多個第二病例文本,每個第一病例文本均與所述樣本病例文本相似,每個所述第二病例文本均與所述樣本病例文本不相似;獲取預(yù)設(shè)知識數(shù)據(jù)庫,所述預(yù)設(shè)知識數(shù)據(jù)庫包括多個實體中的每個所述實體的嵌入表示以及多個所述實體之間的每種關(guān)系的嵌入表示;對預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)模型進行初始化,得到病歷文本推薦模型,并從樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù);將目標(biāo)樣本數(shù)據(jù)和預(yù)設(shè)知識數(shù)據(jù)庫輸入至病歷文本推薦模型進行訓(xùn)練,得到各第一病例文本和各第二病例文本與樣本病例文本的模型輸出結(jié)果;根據(jù)模型輸出結(jié)果、目標(biāo)樣本數(shù)據(jù)中樣本病例文本與第一病例文本和第二病例文本的相似類別,確定病歷文本推薦模型是否收斂;若病歷文本推薦模型未收斂時,更新病歷文本推薦模型的模型參數(shù),并繼續(xù)執(zhí)行從樣本數(shù)據(jù)集中選取一個樣本數(shù)據(jù)作為目標(biāo)樣本數(shù)據(jù)的步驟,直至病歷文本推薦模型收斂;獲取待推薦的病歷文本,通過病歷文本推薦模型對待推薦的病歷文本進行識別,得到多個相似病歷文本和待推薦的病歷文本中多個實體關(guān)系信息。本申請通過訓(xùn)練病歷文本推薦模型,再基于病歷文本推薦模型對病歷文本進行識別,能夠準(zhǔn)確地得到推薦的病歷文本,極大地提高了病歷文本推薦的效率和準(zhǔn)確性。
1.一種病歷文本推薦方法,其特征在于,包括:
2.如權(quán)利要求1所述的病歷文本推薦方法,其特征在于,所述病歷文本推薦模型包括預(yù)處理層、融合層和輸出層;所述將所述目標(biāo)樣本數(shù)據(jù)和所述預(yù)設(shè)知識數(shù)據(jù)庫輸入至所述病歷文本推薦模型進行訓(xùn)練,得到各所述第一病例文本和各所述第二病例文本與所述樣本病例文本的模型輸出結(jié)果,包括:
3.如權(quán)利要求2所述的病歷文本推薦方法,其特征在于,所述通過所述融合層對每個所述實體的嵌入表示、多個所述實體之間的每種關(guān)系的嵌入表示與所述第一目標(biāo)詞嵌入矩陣進行融合,得到第二目標(biāo)詞嵌入矩陣,包括:
4.如權(quán)利要求3所述的病歷文本推薦方法,其特征在于,所述確定所述第一目標(biāo)詞嵌入矩陣中各元素與所述每種關(guān)系的嵌入表示的相關(guān)性權(quán)重,得到多個相關(guān)性權(quán)重系數(shù),包括:
5.如權(quán)利要求3所述的病歷文本推薦方法,其特征在于,所述根據(jù)所述第一目標(biāo)詞嵌入矩陣、所述預(yù)設(shè)的超參數(shù)、相關(guān)性權(quán)重系數(shù)矩陣和所述每種關(guān)系的嵌入表示進行融合,得到第二目標(biāo)詞嵌入矩陣,包括:
6.如權(quán)利要求2所述的病歷文本推薦方法,其特征在于,所述根據(jù)所述模型輸出結(jié)果、所述目標(biāo)樣本數(shù)據(jù)中樣本病例文本與第一病例文本和所述第二病例文本的相似類別,確定所述病歷文本推薦模型是否收斂,包括:
7.如權(quán)利要求6所述的病歷文本推薦方法,其特征在于,所述根據(jù)所述模型輸出結(jié)果、所述目標(biāo)樣本數(shù)據(jù)中樣本病例文本與第一病例文本和所述第二病例文本的相似類別,確定所述病歷文本推薦模型的損失值,包括:
8.一種病歷文本推薦裝置,其特征在于,所述病歷文本推薦裝置包括獲取模塊、模型初始化模塊、模型訓(xùn)練模塊、確定模塊和生成模塊,其中:
9.一種計算機設(shè)備,其特征在于,所述計算機設(shè)備包括處理器、存儲器、以及存儲在所述存儲器上并可被所述處理器執(zhí)行的計算機程序,其中所述計算機程序被所述處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1至7中任一項所述的病歷文本推薦方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,其中所述計算機程序被處理器執(zhí)行時,實現(xiàn)如權(quán)利要求1至7中任一項所述的病歷文本推薦方法的步驟。