本發(fā)明涉及醫(yī)療領(lǐng)域,特別涉及權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成方法及系統(tǒng)。
背景技術(shù):
1、在醫(yī)療領(lǐng)域,為患者制定準(zhǔn)確、個(gè)性化的診療方案是一項(xiàng)復(fù)雜且具有挑戰(zhàn)性的任務(wù)。傳統(tǒng)的診療方法主要依賴(lài)于醫(yī)生的經(jīng)驗(yàn)和專(zhuān)業(yè)知識(shí),但隨著醫(yī)學(xué)知識(shí)的迅速增長(zhǎng)和患者病情的日益復(fù)雜,醫(yī)生的知識(shí)和經(jīng)驗(yàn)可能無(wú)法覆蓋所有情況,從而影響診療決策的準(zhǔn)確性和效率。為了解決這一問(wèn)題,現(xiàn)有技術(shù)已提出了包括基于規(guī)則的專(zhuān)家系統(tǒng)、數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型等多種解決方案,但是但是上述公開(kāi)的解決方案存在一些不足之處,例如,針對(duì)基于規(guī)則的專(zhuān)家系統(tǒng)的解決方案,該系統(tǒng)通過(guò)編碼醫(yī)學(xué)規(guī)則和專(zhuān)家知識(shí),能夠根據(jù)患者的癥狀和體征,從預(yù)設(shè)的規(guī)則庫(kù)中推理出可能的診斷和治療建議,但這類(lèi)系統(tǒng)的缺點(diǎn)是規(guī)則的構(gòu)建和維護(hù)非常耗時(shí)和昂貴,同時(shí)規(guī)則的覆蓋面有限;又如,針對(duì)機(jī)器學(xué)習(xí)模型的解決方案,這些機(jī)器學(xué)習(xí)模型通過(guò)對(duì)大量患者數(shù)據(jù)進(jìn)行學(xué)習(xí),能夠識(shí)別出病情和治療反應(yīng)之間的潛在關(guān)聯(lián),從而為診療決策提供支持,但這些機(jī)器學(xué)習(xí)模型的解釋性和可信賴(lài)性較低,難以被醫(yī)生理解和接受。
2、為此,提出了權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成方法及系統(tǒng)。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成方法及系統(tǒng)。
2、根據(jù)本發(fā)明的第一方面,提供了權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成方法,包括:獲取與腦腫瘤相關(guān)的文本證據(jù)信息,并通過(guò)bert模型對(duì)文本證據(jù)信息進(jìn)行向量化處理,生成文本證據(jù)嵌入向量;基于文本證據(jù)信息和文本證據(jù)嵌入向量,構(gòu)建知識(shí)庫(kù);構(gòu)建并訓(xùn)練診療方案生成模型,得到目標(biāo)診療方案生成模型;構(gòu)建并訓(xùn)練方案打分模型,得到目標(biāo)方案打分模型;將目標(biāo)患者的病案文本信息通過(guò)bert模型進(jìn)行向量化處理,生成病案文本信息嵌入向量,將病案文本信息嵌入向量輸入至目標(biāo)診療方案生成模型中,得到模型輸出治療方案信息嵌入向量,并基于病案文本信息嵌入向量,采用余弦相似度技術(shù)對(duì)知識(shí)庫(kù)中所有的文本證據(jù)嵌入向量進(jìn)行相似度計(jì)算,并選取相似度排序第一的文本證據(jù)嵌入向量作為匹配病案文本信息嵌入向量,將病案文本信息嵌入向量和模型輸出治療方案信息嵌入向量、病案文本信息嵌入向量和匹配病案文本信息嵌入向量分別進(jìn)行拼接處理,構(gòu)造出第一拼接文本嵌入向量和第二拼接文本嵌入向量,并將第一拼接文本嵌入向量和第二拼接文本嵌入向量分別輸入至目標(biāo)方案打分模型,輸出兩個(gè)目標(biāo)方案打分分值,并選取分值排序第一的目標(biāo)方案打分分值對(duì)應(yīng)的治療方案信息作為腦腫瘤診療方案的推薦方案。
3、可選地,所述文本證據(jù)信息包括與腦腫瘤相關(guān)的醫(yī)學(xué)通用知識(shí)文本信息和腦腫瘤患者初始完結(jié)病案文本信息,所述與腦腫瘤相關(guān)的醫(yī)學(xué)通用知識(shí)文本信息包括與腦腫瘤相關(guān)的醫(yī)學(xué)診療指南文本信息、與腦腫瘤相關(guān)的診斷標(biāo)準(zhǔn)文本信息、與腦腫瘤相關(guān)的診療方案文本信息、與腦腫瘤相關(guān)的專(zhuān)家共識(shí)文本信息、與腦腫瘤相關(guān)的教科書(shū)文本信息以及與腦腫瘤相關(guān)的論文文本信息。
4、可選地,在所述通過(guò)bert模型對(duì)文本證據(jù)信息進(jìn)行向量化處理的步驟之前,還包括:對(duì)腦腫瘤患者初始完結(jié)病案文本信息進(jìn)行信息脫敏處理,得到脫敏完結(jié)病案文本信息;采用均值偏移算法對(duì)脫敏完結(jié)病案文本信息進(jìn)行聚類(lèi)處理,得到不同類(lèi)別病案集;將不同類(lèi)別病案集中的脫敏完結(jié)病案文本信息輸入至預(yù)設(shè)第一大模型中,輸出病案質(zhì)量打分分?jǐn)?shù),根據(jù)預(yù)定義的評(píng)分閾值,篩選出種子完結(jié)病案文本信息;基于預(yù)定義的人工評(píng)測(cè)標(biāo)準(zhǔn),對(duì)種子完結(jié)病案文本信息進(jìn)行人工審核,并篩選出保留完結(jié)病案文本信息,所述保留完結(jié)病案文本信息包括病史信息、癥狀描述信息、檢查結(jié)果信息、診斷信息和原病案的治療方案信息。
5、可選地,所述文本證據(jù)嵌入向量包括與腦腫瘤相關(guān)的醫(yī)學(xué)通用知識(shí)嵌入向量和保留完結(jié)病案嵌入向量,所述保留完結(jié)病案嵌入向量包括病史信息嵌入向量、癥狀描述信息嵌入向量、檢查結(jié)果信息嵌入向量、診斷信息嵌入向量和原病案的治療方案嵌入向量。
6、可選地,所述構(gòu)建并訓(xùn)練診療方案生成模型,得到目標(biāo)診療方案生成模型,包括:基于transformer模型構(gòu)建初始診療方案生成模型;將病史信息嵌入向量記為ep∈r|p|×h、癥狀描述信息嵌入向量記為es∈r|s|×h、檢查結(jié)果信息嵌入向量記為ee∈r|e|×h、診斷信息嵌入向量記為ed∈r|d|×h;其中,h表示生成的嵌入向量的維度,h為超參數(shù),r|p|、r|s|、r|e|和r|d|分別表示一個(gè)長(zhǎng)度為|p|的實(shí)數(shù)向量空間、一個(gè)長(zhǎng)度為|s|的實(shí)數(shù)向量空間、一個(gè)長(zhǎng)度為|e|的實(shí)數(shù)向量空間、一個(gè)長(zhǎng)度為|d|的實(shí)數(shù)向量空間,|p|、|s|、|e|和|d|分別表示病史信息的長(zhǎng)度、癥狀描述信息的長(zhǎng)度、檢查結(jié)果信息的長(zhǎng)度、診斷信息的長(zhǎng)度,ep、es、ee和ed分別表示一個(gè)|p|×h維的實(shí)數(shù)矩陣、一個(gè)|s|×h維的實(shí)數(shù)矩陣、一個(gè)|e|×h維的實(shí)數(shù)矩陣、一個(gè)|d|×h維的實(shí)數(shù)矩陣;將病史信息嵌入向量、癥狀描述信息嵌入向量、檢查結(jié)果信息嵌入向量和診斷信息嵌入向量進(jìn)行拼接處理,構(gòu)造出第一類(lèi)訓(xùn)練數(shù)據(jù);所述第一類(lèi)訓(xùn)練數(shù)據(jù)記為x(0)∈r|n|×h,其中,|n|=?|p+s+e+d|,|n|表示拼接后的嵌入向量的長(zhǎng)度,r|n|表示一個(gè)長(zhǎng)度為|n|的實(shí)數(shù)向量空間,x(0)表示一個(gè)|n|×h維的實(shí)數(shù)矩陣;將原病案的治療方案嵌入向量作為第一類(lèi)測(cè)試數(shù)據(jù);所述第一類(lèi)測(cè)試數(shù)據(jù)記為et∈r|t|×h,其中,|t|表示原病案的治療方案信息的長(zhǎng)度,r|t|表示一個(gè)長(zhǎng)度為|t|的實(shí)數(shù)向量空間,et表示一個(gè)|t|×h維的實(shí)數(shù)矩陣;根據(jù)第一類(lèi)訓(xùn)練數(shù)據(jù)和第一類(lèi)測(cè)試數(shù)據(jù)對(duì)初始診療方案生成模型進(jìn)行訓(xùn)練和優(yōu)化,輸出目標(biāo)診療方案生成模型。
7、可選地,所述構(gòu)建并訓(xùn)練方案打分模型,得到目標(biāo)方案打分模型,包括:基于transformer模型構(gòu)建初始方案打分模型;基于病史信息、癥狀描述信息、檢查結(jié)果信息和診斷信息,構(gòu)造出輸入文本片段a,基于原病案的治療方案信息或預(yù)設(shè)第一大模型輸出的治療方案信息,構(gòu)造出輸入文本片段b,根據(jù)預(yù)設(shè)的拼接輸入文本格式對(duì)輸入文本片段a和輸入文本片段b進(jìn)行拼接處理,構(gòu)造出拼接輸入文本,通過(guò)bert模型對(duì)拼接輸入文本進(jìn)行向量化處理,生成拼接輸入文本嵌入向量,并將拼接輸入文本嵌入向量拆分為第二類(lèi)訓(xùn)練數(shù)據(jù)和第二類(lèi)測(cè)試數(shù)據(jù),根據(jù)第二類(lèi)訓(xùn)練數(shù)據(jù)和第二類(lèi)測(cè)試數(shù)據(jù)對(duì)初始方案打分模型進(jìn)行訓(xùn)練和優(yōu)化,輸出目標(biāo)方案打分模型。
8、可選地,所述目標(biāo)患者的病案文本信息包括目標(biāo)患者的病史信息、目標(biāo)患者的癥狀描述信息、目標(biāo)患者的檢查結(jié)果信息和目標(biāo)患者的診斷信息。
9、根據(jù)本發(fā)明的第二方面,提供了權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成系統(tǒng),包括:數(shù)據(jù)獲取模塊,用于獲取與腦腫瘤相關(guān)的文本證據(jù)信息;數(shù)據(jù)處理模塊,用于通過(guò)bert模型對(duì)文本證據(jù)信息進(jìn)行向量化處理,生成文本證據(jù)嵌入向量;知識(shí)庫(kù)構(gòu)建模塊,用于基于文本證據(jù)信息和文本證據(jù)嵌入向量,構(gòu)建知識(shí)庫(kù);第一模型構(gòu)建和訓(xùn)練模塊,用于構(gòu)建并訓(xùn)練診療方案生成模型,得到目標(biāo)診療方案生成模型;第二模型構(gòu)建和訓(xùn)練模塊,用于構(gòu)建并訓(xùn)練方案打分模型,得到目標(biāo)方案打分模型;腦腫瘤診療方案推薦模塊,用于將目標(biāo)患者的病案文本信息通過(guò)bert模型進(jìn)行向量化處理,生成病案文本信息嵌入向量,將病案文本信息嵌入向量輸入至目標(biāo)診療方案生成模型中,得到模型輸出治療方案信息嵌入向量,并基于病案文本信息嵌入向量,采用余弦相似度技術(shù)對(duì)知識(shí)庫(kù)中所有的文本證據(jù)嵌入向量進(jìn)行相似度計(jì)算,并選取相似度排序第一的文本證據(jù)嵌入向量作為匹配病案文本信息嵌入向量,將病案文本信息嵌入向量和模型輸出治療方案信息嵌入向量、病案文本信息嵌入向量和匹配病案文本信息嵌入向量分別進(jìn)行拼接處理,構(gòu)造出第一拼接文本嵌入向量和第二拼接文本嵌入向量,并將第一拼接文本嵌入向量和第二拼接文本嵌入向量分別輸入至目標(biāo)方案打分模型,輸出兩個(gè)目標(biāo)方案打分分值,并選取分值排序第一的目標(biāo)方案打分分值對(duì)應(yīng)的治療方案信息作為腦腫瘤診療方案的推薦方案。
10、根據(jù)本發(fā)明的第三方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并且可以在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述方法的步驟。
11、根據(jù)本發(fā)明的第四方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述方法的步驟。
12、本發(fā)明的優(yōu)點(diǎn)及有益效果在于:本發(fā)明提供的權(quán)衡知識(shí)庫(kù)和模型結(jié)果的腦腫瘤診療方案生成方法及系統(tǒng),該方法通過(guò)獲取與腦腫瘤相關(guān)的文本證據(jù)信息并對(duì)文本證據(jù)信息進(jìn)行向量化處理,構(gòu)建與腦腫瘤相關(guān)且覆蓋知識(shí)范圍較廣的知識(shí)庫(kù),通過(guò)設(shè)置診療方案生成模型,將目標(biāo)患者的病案文本信息輸入至診療方案生成模型中,根據(jù)診療方案生成模型中的預(yù)測(cè)結(jié)果來(lái)提供第一種推薦方案,并利用余弦相似度技術(shù),從知識(shí)庫(kù)中篩選出與目標(biāo)患者的病案文本信息相似度最高的文本證據(jù)信息作為第二種推薦方案,通過(guò)將目標(biāo)患者的病案文本信息和第一種推薦方案、目標(biāo)患者的病案文本信息和第二種推薦方案分別進(jìn)行拼接和向量化處理,并輸入至方案打分模型中,比較方案打分模型輸出的兩個(gè)目標(biāo)方案打分分值,選取目標(biāo)方案打分分值最高對(duì)應(yīng)的治療方案信息作為腦腫瘤診療方案的推薦方案,該推薦方案通過(guò)權(quán)衡精確的知識(shí)庫(kù)和準(zhǔn)確的模型生成結(jié)果,同時(shí),利用推薦方案生成技術(shù)來(lái)動(dòng)態(tài)生成個(gè)性化的輔助診療方案,不僅提高了診療決策的準(zhǔn)確性和效率,還能夠?yàn)獒t(yī)務(wù)人員提供更好的決策支持。