本發(fā)明涉及醫(yī)療診斷技術(shù)領(lǐng)域,具體涉及一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法。
背景技術(shù):
當(dāng)前醫(yī)療的矛盾很大部分是有限的公立醫(yī)院資源與巨大的病人醫(yī)療需求之間的矛盾。同時,受制于頂層設(shè)計、醫(yī)保聯(lián)網(wǎng)、分級診療制度等不完善,一邊是優(yōu)質(zhì)醫(yī)療資源被“小病”占據(jù),另一邊卻是基層醫(yī)療資源長期閑置。為解決看病難喝看病貴的難題,世界各國在醫(yī)療建設(shè)方面投入了巨大的財力,旨在通過信息化技術(shù)提高醫(yī)療資源的利用率并克服醫(yī)療資源分布不均衡的形狀。對此,有業(yè)內(nèi)人士分析稱,如果能在“共享經(jīng)濟(jì)”模式下尋求突圍,醫(yī)療行業(yè)將迸發(fā)出巨大的生機(jī)。
隨著醫(yī)療信息化進(jìn)程的推進(jìn)和深入,醫(yī)療軟件在各大醫(yī)院廣泛的普及和使用,使得醫(yī)療領(lǐng)域積累的數(shù)據(jù)迅速增長,形成了豐富的醫(yī)療大數(shù)據(jù)資源,包括患者就診病歷、診斷相關(guān)的影像信息、制藥企業(yè)相關(guān)數(shù)據(jù)等等。充分利用這些豐富的醫(yī)療大數(shù)據(jù)資源,在不同的用戶群體間進(jìn)行醫(yī)療數(shù)據(jù)共享,根據(jù)用戶需求構(gòu)建新的醫(yī)療大數(shù)據(jù)服務(wù),對提高醫(yī)療水平、提高醫(yī)療資源的利用率并克服醫(yī)療資源分布不均衡具有重大意義。
在實際應(yīng)用中,目前,互聯(lián)網(wǎng)醫(yī)療行業(yè)商業(yè)模式并不清晰,想要對醫(yī)療大數(shù)據(jù)資源進(jìn)行管理并構(gòu)建醫(yī)療大數(shù)據(jù)服務(wù)必須解決幾方面問題,比如,醫(yī)療領(lǐng)域的軟件應(yīng)用由于基于不同的軟硬件平臺,在底層技術(shù)和業(yè)務(wù)流程方面存在廣泛的異構(gòu)性,使得在不同的醫(yī)療用戶群體之間實現(xiàn)數(shù)據(jù)共享非常困難(如電子病歷、醫(yī)學(xué)圖像等等)。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是為了解決現(xiàn)有技術(shù)中的上述缺陷,提供一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法。
本發(fā)明的目的可以通過采取如下技術(shù)方案達(dá)到:
一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法,所述方法包括下列步驟:
s1、分析基本自診斷服務(wù)對應(yīng)的應(yīng)用模式和在構(gòu)建疾病自診斷服務(wù)過程中涉及的大數(shù)據(jù)處理流程;
s2、基于大數(shù)據(jù)處理流程,將大數(shù)據(jù)處理任務(wù)分解至一組功能獨(dú)立的子任務(wù)集合,形成構(gòu)建疾病自診斷服務(wù)的任務(wù)規(guī)劃方案;
s3、基于任務(wù)規(guī)劃方案中各個子任務(wù)對計算資源和存儲資源的需求,使用可信組合評估方法,為疾病自診斷服務(wù)選擇qos最優(yōu)的云服務(wù)組合方案;
s4、對照任務(wù)規(guī)劃方案,在各個子任務(wù)對應(yīng)的云服務(wù)中實現(xiàn)疾病自診斷服務(wù)的大數(shù)據(jù)分析算法,完成疾病自診斷服務(wù)的部署和執(zhí)行。
進(jìn)一步地,所述步驟s2中將大數(shù)據(jù)處理任務(wù)分解至由三個子任務(wù)構(gòu)成的疾病自診斷服務(wù)的任務(wù)規(guī)劃方案t={t1,t2,t3},其中,t1表示電子病歷大數(shù)據(jù)存儲子任務(wù),t2表示電子病歷大數(shù)據(jù)的索引計算子任務(wù),t3表示電子病歷大數(shù)據(jù)處理分析的計算子任務(wù)。
進(jìn)一步地,對于子任務(wù)t1,使用云端的存儲服務(wù)來滿足電子病歷大數(shù)據(jù)的存儲需求;對于子任務(wù)t2,采用hadoop平臺云服務(wù),其中,maprdduce編程模型用于并行高效的建立索引,hdfs文件系統(tǒng)用于大規(guī)模索引文件的存儲;對于子任務(wù)t3,采用提供彈性伸縮虛擬機(jī)計算資源的云服務(wù)進(jìn)行在線的數(shù)據(jù)計算分析。
進(jìn)一步地,所述步驟s3具體包括:
s301、根據(jù)疾病自診斷服務(wù)的qos需求,從價格、性能參數(shù)指標(biāo)的角度,對各種云服務(wù)商進(jìn)行可信組合評估,以選取qos最優(yōu)的組合云服務(wù)方案,為疾病自診斷服務(wù)提供存儲和計算資源;
s302、電子病歷索引的建立,通過建立索引實現(xiàn)高效的在線電子病歷查詢檢索和處理分析功能;
s303、疾病自診斷模型的計算,根據(jù)檢索到的電子病歷,結(jié)合離線hadoop集群,運(yùn)用云中的虛擬機(jī)集群,執(zhí)行大數(shù)據(jù)分析以計算獲得疾病自診斷模型。
進(jìn)一步地,所述步驟s4具體包括:
s401、提前出電子病歷中疾病和癥狀,并建立二者之間的二元關(guān)系;
s402、根據(jù)疾病和癥狀之間的二元關(guān)系,計算出該二元關(guān)系對應(yīng)的“疾病-病癥”概念集合;
s403、定義“疾病-病癥”概念集合中概念之間的偏序關(guān)系,并使用哈斯圖將該偏序關(guān)系以概念格的形式可視化,生成疾病自診斷模型。
進(jìn)一步地,所述步驟s301具體包括:
s3011、根據(jù)存儲云服務(wù)、hadoop平臺云服務(wù)以及在線分析云服務(wù)及其qos歷史記錄,實例化選取效用函數(shù)的各項參數(shù);
s3012、計算其top-n個基于qos歷史記錄的最優(yōu)組合方案;
s3013、計算每一組服務(wù)組合方案的貢獻(xiàn)度值;
s3014、對每一組服務(wù)組合方案按其貢獻(xiàn)度值大小排序,選擇貢獻(xiàn)度值最大的組合方案作為qos最優(yōu)的組合云服務(wù),參與疾病自診斷服務(wù)的構(gòu)建和部署。
進(jìn)一步地,所述步驟s303具體包括:
s3031、接收用戶查詢,負(fù)載均衡器根據(jù)負(fù)載均衡算法,將用戶請求發(fā)送給分發(fā)器集群中的一個分發(fā)器節(jié)點(diǎn);被選中的分發(fā)器節(jié)點(diǎn)將從搜索集群中選擇一組搜索節(jié)點(diǎn),進(jìn)行用戶查詢請求的轉(zhuǎn)發(fā);
s3032、在線病歷檢索,從被選中的搜索節(jié)點(diǎn)將根據(jù)用戶的查詢請求,匹配倒排索引中跟用戶疾病癥狀一致的病歷,再根據(jù)過濾索引,過濾與用戶性別和年齡不一致的病歷,最后根據(jù)細(xì)節(jié)索引,將符合用戶查詢請求的病歷返回給分發(fā)器節(jié)點(diǎn);
s3033、實時數(shù)據(jù)分析,首先整合搜索結(jié)果,生成完整的滿足查詢請求的病歷集合;然后,將該病歷集合發(fā)送至數(shù)據(jù)分析集群,進(jìn)行電子病歷大數(shù)據(jù)的分析計算,生成疾病自診斷模型;
s3034、隱私信息過濾,在將疾病自診斷模型和病歷返回給用戶之前,分發(fā)器節(jié)點(diǎn)將用戶id信息發(fā)送至訪問控制集群的一個訪問控制節(jié)點(diǎn),該節(jié)點(diǎn)根據(jù)用戶id信息確定目標(biāo)用戶所屬的群組返回對用戶不可見的病歷關(guān)鍵字值;而分發(fā)器節(jié)點(diǎn)根據(jù)訪問控制節(jié)點(diǎn)的返回結(jié)果,過濾病歷中對用戶不可見的信息,再將疾病自診斷模型和病歷返回給用戶。
進(jìn)一步地,所述電子病歷由一個三元組表示:
emr=(基本信息,病史,就診記錄),
其中所述基本信息包括患者的姓名、性別、出生年月、聯(lián)系信息;所述病史為患者就醫(yī)的一個歷史總結(jié),包括疾病史、手術(shù)史、輸血史、以及過敏史信息;所述就診記錄為患者某次看病的詳細(xì)信息,包括患者的疾病特征、主訴、疾病詳細(xì)記錄、診斷結(jié)果、治療方案。
進(jìn)一步地,所述效用函數(shù)為
對于一個大數(shù)據(jù)服務(wù)的任務(wù)規(guī)劃t={t1,t2,…,tm},一個基于qos歷史記錄的組合方案可表示為:sc-rj={s1.r1,s2.r2,…,sm.rm},其中,si∈si(1≤i≤m),si.ri是指隸屬于si的一條qos歷史記錄;
假設(shè)大數(shù)據(jù)服務(wù)任務(wù)規(guī)劃t中的每個子任務(wù)ti對應(yīng)的候選服務(wù)集si中共有mi個服務(wù),其中,對于si中的每一個服務(wù)sij(1≤j≤mi),其包含的qos歷史記錄的個數(shù)為lij,其中,xij-h是一個指示器,xij-h=0表示sij不在組合方案中,而xij-h=1表示sij在組合方案中;
進(jìn)一步地,所述步驟s1之前,還包括:
s0、數(shù)據(jù)資源搜集,根據(jù)疾病自診斷服務(wù)的需求,搜集分布在云中各個醫(yī)院、診所和各醫(yī)療軟件應(yīng)用中本市市民的電子病歷數(shù)據(jù),形成電子病歷大數(shù)據(jù)資源,供后繼的電子病歷大數(shù)據(jù)檢索和分析計算。
本發(fā)明相對于現(xiàn)有技術(shù)具有如下的優(yōu)點(diǎn)及效果:
1)通過搜集獲得的電子病歷大數(shù)據(jù)進(jìn)行存儲和在線檢索和處理分析,使用戶可以通過在線調(diào)用疾病自診斷服務(wù),獲得疾病自診斷幫助。
2)利用海量的電子病歷,為用戶提供疾病自診斷幫助,然后通過自診斷服務(wù),患者可以檢索跟自己癥狀相同的病歷,并根據(jù)疾病自診斷模型獲得自我預(yù)診斷或疾病預(yù)防知識。
附圖說明
圖1是本發(fā)明公開的一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法的流程步驟圖。
具體實施方式
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
實施例
如附圖1所示,附圖1中公開了一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法的流程步驟圖,該方法具體包括下列步驟:
s1、分析基本自診斷服務(wù)對應(yīng)的應(yīng)用模式和在構(gòu)建疾病自診斷服務(wù)過程中涉及的大數(shù)據(jù)處理流程;
s2、基于大數(shù)據(jù)處理流程,將大數(shù)據(jù)處理任務(wù)分解至一組功能獨(dú)立的子任務(wù)集合,形成構(gòu)建疾病自診斷服務(wù)的任務(wù)規(guī)劃方案;
為了實現(xiàn)疾病自診斷服務(wù)的目的需為用戶提供病歷檢索和疾病分析功能,首先將搜集獲得的電子病歷大數(shù)據(jù)進(jìn)行存儲和在線檢索和處理分析,使用戶可通過在線調(diào)用疾病自診斷服務(wù),獲得疾病自診斷幫助;同時,為了支撐電子病歷的高效在線檢索和處理分析,需要對電子病歷大數(shù)據(jù)以離線的方式建立索引?;谏鲜龇治?,可獲得由三個子任務(wù)構(gòu)成的疾病自診斷服務(wù)的任務(wù)規(guī)劃方案t={t1,t2,t3},其中,t1表示電子病歷大數(shù)據(jù)存儲子任務(wù),t2表示電子病歷大數(shù)據(jù)的索引計算子任務(wù),t3表示電子病歷大數(shù)據(jù)處理分析的計算子任務(wù)。
s3、基于任務(wù)規(guī)劃方案中各個子任務(wù)對計算資源和存儲資源的需求,使用可信組合評估方法,為疾病自診斷服務(wù)選擇qos最優(yōu)的云服務(wù)組合方案。
對于子任務(wù)t1,使用云端的存儲服務(wù)來滿足電子病歷大數(shù)據(jù)的存儲需求;對于子任務(wù)t2,采用hadoop平臺云服務(wù),其中,maprdduce編程模型用于并行高效的建立索引,hdfs文件系統(tǒng)用于大規(guī)模索引文件的存儲;對于子任務(wù)t3,采用提供彈性伸縮虛擬機(jī)計算資源的云服務(wù)進(jìn)行在線的數(shù)據(jù)計算分析。
s301、根據(jù)疾病自診斷服務(wù)的qos需求,從價格、性能等參數(shù)指標(biāo)的角度,對各種云服務(wù)商進(jìn)行可信組合評估,以選取qos最優(yōu)的組合云服務(wù)方案,為疾病自診斷服務(wù)提供存儲和計算資源。
具體實施方式中,該步驟具體包括:
s3011、根據(jù)存儲云服務(wù)、hadoop平臺云服務(wù)以及在線分析云服務(wù)及其qos歷史記錄,實例化選取效用函數(shù)的各項參數(shù);
其中,效用函數(shù)為
對于一個大數(shù)據(jù)服務(wù)的任務(wù)規(guī)劃t={t1,t2,…,tm},一個基于qos歷史記錄的組合方案可表示為:sc-rj={s1.r1,s2.r2,…,sm.rm},其中,si∈si(1≤i≤m),si.ri是指隸屬于si的一條qos歷史記錄;
假設(shè)大數(shù)據(jù)服務(wù)任務(wù)規(guī)劃t中的每個子任務(wù)ti對應(yīng)的候選服務(wù)集si中共有mi個服務(wù),其中,對于si中的每一個服務(wù)sij(1≤j≤mi),其包含的qos歷史記錄的個數(shù)為lij,那么,對于si中包含的qos歷史記錄總個數(shù)為:mi=li1+li1+…+lmi,其中,xij-h是一個指示器,xij-h=0表示sij不在組合方案中,而xij-h=1表示sij在組合方案中;
s3012、對實例化后的效用函數(shù),計算其top-n個基于qos歷史記錄的最優(yōu)組合方案;
s3013、根據(jù)上述步驟中求解獲得的top-n個基于qos歷史記錄的最優(yōu)組合方案,為每一組服務(wù)組合方案計算其貢獻(xiàn)度值;
s3014、對每組服務(wù)組合方案按其貢獻(xiàn)度值大小排序,選擇貢獻(xiàn)度值最大的組合方案作為qos最優(yōu)的組合云服務(wù),參與疾病自診斷服務(wù)的構(gòu)建和部署。
s302、電子病歷索引的建立,通過建立索引實現(xiàn)高效的在線電子病歷查詢檢索和處理分析功能;
其中,電子病歷由一個三元組表示:emr=(基本信息,病史,就診記錄),其中基本信息包括患者的姓名、性別、出生年月、聯(lián)系信息等;病史包括患者就醫(yī)的一個歷史總結(jié),包括疾病史、手術(shù)史、輸血史、以及過敏史等信息;就診記錄包括患者某次看病的詳細(xì)信息,包括患者的疾病特征、主訴、疾病詳細(xì)記錄、診斷結(jié)果、治療方案。
其中,所述在線電子病歷查詢檢索具體為給定用戶的疾病癥狀描述,首先根據(jù)用戶疾病癥狀,從病歷集合中檢索與用戶疾病癥狀相同的病歷;然后,根據(jù)用戶的性別和年齡,過濾與用戶性別和年齡不一致的病歷。
為了支撐電子病歷的高效在線檢索和處理分析,需要對電子病歷大數(shù)據(jù)以離線的方式建立索引。
s303、疾病自診斷模型的計算,根據(jù)檢索到的電子病歷,結(jié)合離線hadoop集群,運(yùn)用云中的虛擬機(jī)集群,執(zhí)行大數(shù)據(jù)分析以計算獲得疾病自診斷模型。
具體實施方式中,該步驟具體包括:
s3031、接收用戶查詢,在接收到用戶查詢請求后,負(fù)載均衡器根據(jù)負(fù)載均衡算法,將用戶請求發(fā)送給分發(fā)器集群中的一個分發(fā)器節(jié)點(diǎn);被選中的分發(fā)器節(jié)點(diǎn)將從搜索集群中選擇一組搜索節(jié)點(diǎn),進(jìn)行用戶查詢請求的轉(zhuǎn)發(fā)。
s3032、在線病歷檢索,從分發(fā)器節(jié)點(diǎn)處接收到用戶的查詢請求后,從被選中的搜索節(jié)點(diǎn)將根據(jù)用戶的查詢請求,匹配倒排索引中跟用戶疾病癥狀一致的病歷,再根據(jù)過濾索引,過濾與用戶性別和年齡不一致的病歷,最后根據(jù)細(xì)節(jié)索引,將符合用戶查詢請求的病歷返回給分發(fā)器節(jié)點(diǎn)。
s3033、實時數(shù)據(jù)分析,分發(fā)器節(jié)點(diǎn)在接收到各搜索節(jié)點(diǎn)返回的病歷后,首先整合搜索結(jié)果,生成完整的滿足查詢請求的病歷集合;然后,將該病歷集合發(fā)送至數(shù)據(jù)分析集群,進(jìn)行電子病歷大數(shù)據(jù)的分析計算,生成疾病自診斷模型。
s3034、隱私信息過濾,在將疾病自診斷模型和病歷返回給用戶之前,分發(fā)器節(jié)點(diǎn)將用戶id信息發(fā)送至訪問控制集群的一個訪問控制節(jié)點(diǎn),該節(jié)點(diǎn)根據(jù)用戶id信息確定目標(biāo)用戶所屬的群組(如普通用戶、醫(yī)生等),返回對用戶不可見的病歷關(guān)鍵字值;而分發(fā)器節(jié)點(diǎn)根據(jù)訪問控制節(jié)點(diǎn)的返回結(jié)果,過濾病歷中對用戶不可見的信息,再將疾病自診斷模型和病歷返回給用戶。
s4、對照任務(wù)規(guī)劃方案,在各個子任務(wù)對應(yīng)的云服務(wù)中實現(xiàn)疾病自診斷服務(wù)的大數(shù)據(jù)分析算法,完成疾病自診斷服務(wù)的部署和執(zhí)行。
s401、提前出電子病歷中疾病和癥狀,并建立二者之間的二元關(guān)系;
s402、根據(jù)疾病和癥狀之間的二元關(guān)系,計算出該二元關(guān)系對應(yīng)的“疾病-病癥”概念集合;
s403、定義“疾病-病癥”概念集合中概念之間的偏序關(guān)系,并使用哈斯圖將該偏序關(guān)系以概念格的形式可視化,生成疾病自診斷模型。
在具體的實施方式,本實施例公開的一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法,在所述步驟s1之前,還包括:
s0、數(shù)據(jù)資源搜集,根據(jù)疾病自診斷服務(wù)的需求,搜集分布在云中各個醫(yī)院、診所和各醫(yī)療軟件應(yīng)用中本市市民的電子病歷數(shù)據(jù),形成電子病歷大數(shù)據(jù)資源,供后繼的電子病歷大數(shù)據(jù)檢索和分析計算。
綜上所述,本實施例通過基于可信組合評估的云服務(wù)選擇、電子病歷索引的建立、疾病自診斷服務(wù)框架的設(shè)計、疾病自診斷模型的計算過程闡述了一種大數(shù)據(jù)下基于可信組合評估的醫(yī)療自診斷服務(wù)設(shè)計方法,該方法通過搜集獲得的電子病歷大數(shù)據(jù)進(jìn)行存儲和在線檢索和處理分析,使用戶可以通過在線調(diào)用疾病自診斷服務(wù),獲得疾病自診斷幫助。
上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。