本發(fā)明涉及醫(yī)療信息識別,具體涉及一種門急診診療信息頁的疾病編碼自動(dòng)轉(zhuǎn)換方法及介質(zhì)。
背景技術(shù):
1、門(急)診診療信息頁(以下簡稱“信息頁”,共72個(gè)字段)是醫(yī)院根據(jù)門(急)診病歷和患者在本院門(急)診就診期間產(chǎn)生的各項(xiàng)信息匯總形成的反映患者本次就診過程的信息摘要,包括患者基本信息、就診過程信息、診療信息以及費(fèi)用信息等。
2、信息頁中需要填寫疾病編碼,我國目前采用診斷相關(guān)組(diagnosis-relatedgroups,drgs)進(jìn)行醫(yī)保資金費(fèi)用分配與控制。在drgs方案中,疾病編碼是采用icd-10類型的分類編碼(以下簡稱icd編碼),而目前發(fā)布的新規(guī)定中,明確疾病編碼需要采用《疾病分類與代碼國家臨床版》類型的分類編碼(以下簡稱國標(biāo)編碼)。
3、目前醫(yī)院所采用的電子病歷系統(tǒng)中,對于疾病的分類所能接受編輯的分類編碼只能是icd編碼,因此,如何實(shí)現(xiàn)icd編碼從電子病歷系統(tǒng)讀取到信息頁時(shí)轉(zhuǎn)換為國標(biāo)編碼成為亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請要解決的技術(shù)問題是提供一種門急診診療信息頁的疾病編碼自動(dòng)轉(zhuǎn)換方法及介質(zhì),具有可以將疾病編碼從醫(yī)療信息系統(tǒng)讀取到信息頁時(shí)自動(dòng)將icd編碼轉(zhuǎn)換為國標(biāo)編碼的特點(diǎn)。
2、第一方面,一種實(shí)施例中提供一種門急診診療信息頁的疾病編碼自動(dòng)轉(zhuǎn)換方法,包括:
3、基于電子病歷系統(tǒng)獲取患者的第一醫(yī)療信息和第二醫(yī)療信息;所述第一醫(yī)療信息包括藥物信息、過敏史和主訴信息,所述第二醫(yī)療信息包括疾病名稱和icd編碼;將第二醫(yī)療信息中的疾病名稱作為第一疾病名稱,將第二醫(yī)療信息中的icd編碼作為第一icd編碼;
4、響應(yīng)于獲取的第一醫(yī)療信息和第二醫(yī)療信息,按照預(yù)設(shè)的第一識別規(guī)則進(jìn)行識別,將識別得到的疾病名稱作為第二疾病名稱,所述第一識別規(guī)則用于識別到國標(biāo)編碼及對應(yīng)的疾病名稱;
5、計(jì)算第一疾病名稱和第二疾病名稱的相似性作為第一相似性,若第一相似性達(dá)到第一相似性閾值,則基于第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯信息頁中的疾病編碼。
6、一種實(shí)施例中,所述的響應(yīng)于獲取的第一醫(yī)療信息和第二醫(yī)療信息,按照預(yù)設(shè)的第一識別規(guī)則進(jìn)行識別,包括:
7、響應(yīng)于獲取的第一醫(yī)療信息和第二醫(yī)療信息,基于國標(biāo)編碼識別模型識別到國標(biāo)編碼和對應(yīng)的疾病名稱;所述國標(biāo)編碼識別模型為結(jié)合損失函數(shù)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。
8、一種實(shí)施例中,所述國標(biāo)編碼識別模型的訓(xùn)練方法包括:
9、采集多個(gè)包含第一醫(yī)療信息和第二醫(yī)療信息的醫(yī)學(xué)文本數(shù)據(jù),并進(jìn)行國標(biāo)編碼和對應(yīng)疾病名稱的標(biāo)注;
10、將標(biāo)注好國標(biāo)編碼和對應(yīng)疾病名稱的多個(gè)醫(yī)學(xué)文本數(shù)據(jù)轉(zhuǎn)換為適合華佗大模型輸入的格式,得到標(biāo)注數(shù)據(jù);
11、將所述標(biāo)注數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集;
12、基于預(yù)設(shè)好的訓(xùn)練參數(shù),將訓(xùn)練集作為華佗大模型的輸入進(jìn)行訓(xùn)練,基于驗(yàn)證集在訓(xùn)練過程中評估華佗大模型的性能并調(diào)整超參數(shù),并基于測試集評估華佗大模型的泛化能力,從而得到訓(xùn)練好的改進(jìn)的華佗大模型;
13、將訓(xùn)練好的改進(jìn)的華佗大模型作為國標(biāo)編碼識別模型。
14、一種實(shí)施例中,所述的若第一相似性達(dá)到第一相似性閾值,則基于第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯信息頁中的疾病編碼,包括:
15、若第一相似性達(dá)到第一相似性閾值,則將第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯為信息頁中的疾病編碼。
16、一種實(shí)施例中,在獲取第二疾病名稱之前,還包括:響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,將識別得到的疾病名稱作為第三疾病名稱,將識別到的icd編碼作為第二icd編碼,所述第二識別規(guī)則用于識別到icd編碼及對應(yīng)的疾病名稱;
17、計(jì)算第一疾病名稱與第三疾病名稱的相似性作為第二相似性,若第二相似性達(dá)到第二相似性閾值,則再進(jìn)入獲取第二疾病名稱的步驟。
18、一種實(shí)施例中,還包括:響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,所述第二識別規(guī)則用于識別到icd編碼及對應(yīng)的疾病名稱,將識別得到的疾病名稱作為第三疾病名稱,將識別到的icd編碼作為第二icd編碼;
19、所述的若第一相似性達(dá)到第一相似性閾值,則基于第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯信息頁中的疾病編碼,包括:計(jì)算第一疾病名稱與第三疾病名稱的相似性作為第二相似性,若第二相似性達(dá)到第二相似性閾值,且第一相似性達(dá)到第一相似性閾值,則基于第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯信息頁中的疾病編碼。
20、一種實(shí)施例中,所述的響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,包括:
21、響應(yīng)于獲取的第一醫(yī)療信息,基于icd編碼識別模型識別到icd編碼和對應(yīng)的疾病名稱;所述icd編碼識別模型為結(jié)合損失函數(shù)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型。
22、一種實(shí)施例中,所述icd編碼識別模型的訓(xùn)練方法包括:
23、采集多個(gè)包含第一醫(yī)療信息的醫(yī)學(xué)文本數(shù)據(jù),并進(jìn)行icd編碼和對應(yīng)疾病名稱的標(biāo)注;
24、將標(biāo)注好icd編碼和對應(yīng)疾病名稱的多個(gè)醫(yī)學(xué)文本數(shù)據(jù)轉(zhuǎn)換為適合華佗大模型輸入的格式,得到標(biāo)注數(shù)據(jù);
25、將所述標(biāo)注數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測試集;
26、基于預(yù)設(shè)好的訓(xùn)練參數(shù),將訓(xùn)練集作為華佗大模型的輸入進(jìn)行訓(xùn)練,基于驗(yàn)證集在訓(xùn)練過程中評估華佗大模型的性能并調(diào)整超參數(shù),并基于測試集評估華佗大模型的泛化能力,從而得到訓(xùn)練好的改進(jìn)的華佗大模型;
27、將訓(xùn)練好的改進(jìn)的華佗大模型作為idc編碼識別模型。
28、一種實(shí)施例中,計(jì)算第一疾病名稱與第三疾病名稱的相似性,和/或,計(jì)算第一疾病名稱與第二疾病名稱的相似性,包括:
29、分別對需要計(jì)算相似性的兩個(gè)疾病名稱進(jìn)行向量化得到第一向量和第二向量;
30、分別計(jì)算第一向量的模長和第二向量的模長;
31、計(jì)算第一向量的模長和第二向量的模長的乘積作為第一乘積;
32、計(jì)算第一向量和第二向量的乘積作為第二乘積;
33、計(jì)算第二乘積與第一乘積的比值,比值越接近1,則相似性越高。
34、第二方面,一種實(shí)施例中提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述介質(zhì)中存儲有程序,所述程序能夠被處理器加載并執(zhí)行上述實(shí)施例中任意一項(xiàng)所述的疾病編碼自動(dòng)轉(zhuǎn)換方法。
35、本發(fā)明的有益效果是:
36、基于本申請方案,將icd編碼自動(dòng)轉(zhuǎn)換為國標(biāo)編碼以實(shí)現(xiàn)疾病編碼自動(dòng)轉(zhuǎn)換,且基于自動(dòng)轉(zhuǎn)換得到的國標(biāo)編碼編輯信息頁,以此提高了信息頁中國標(biāo)編碼和疾病名稱的填寫效率,且,通過計(jì)算第一疾病名稱和第二疾病名稱的相似性,提高了信息頁中填入國標(biāo)編碼及其對應(yīng)的疾病名稱的準(zhǔn)確性。
1.一種門急診診療信息頁的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,包括:
2.如權(quán)利要求1所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,所述的響應(yīng)于獲取的第一醫(yī)療信息和第二醫(yī)療信息,按照預(yù)設(shè)的第一識別規(guī)則進(jìn)行識別,包括:
3.如權(quán)利要求1所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,所述國標(biāo)編碼識別模型的訓(xùn)練方法包括:
4.如權(quán)利要求1所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,所述的若第一相似性達(dá)到第一相似性閾值,則基于第二疾病名稱所對應(yīng)的國標(biāo)編碼編輯信息頁中的疾病編碼,包括:
5.如權(quán)利要求1所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,在獲取第二疾病名稱之前,還包括:響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,將識別得到的疾病名稱作為第三疾病名稱,將識別到的icd編碼作為第二icd編碼,所述第二識別規(guī)則用于識別到icd編碼及對應(yīng)的疾病名稱;
6.如權(quán)利要求1所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,還包括:響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,所述第二識別規(guī)則用于識別到icd編碼及對應(yīng)的疾病名稱,將識別得到的疾病名稱作為第三疾病名稱,將識別到的icd編碼作為第二icd編碼;
7.如權(quán)利要求5或6所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,所述的響應(yīng)于獲取的第一醫(yī)療信息,按照預(yù)設(shè)的第二識別規(guī)則進(jìn)行識別,包括:
8.如權(quán)利要求7所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,所述icd編碼識別模型的訓(xùn)練方法包括:
9.如權(quán)利要求5或6所述的疾病編碼自動(dòng)轉(zhuǎn)換方法,其特征在于,計(jì)算第一疾病名稱與第三疾病名稱的相似性,和/或,計(jì)算第一疾病名稱與第二疾病名稱的相似性,包括:
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述介質(zhì)中存儲有程序,所述程序能夠被處理器加載并執(zhí)行如權(quán)利要求1到9中任意一項(xiàng)所述的疾病編碼自動(dòng)轉(zhuǎn)換方法。