本發(fā)明涉及醫(yī)療信息,尤其涉及基于貢獻度評估的健康醫(yī)療數(shù)據(jù)要素收益分配方法及系統(tǒng)。
背景技術(shù):
1、在健康醫(yī)療領(lǐng)域,這一政策為數(shù)據(jù)要素的收益分配提供了指導(dǎo)原則,即應(yīng)基于對貢獻度的評估進行收益分配。
2、在數(shù)據(jù)交易中,作為數(shù)據(jù)提供方的醫(yī)療機構(gòu),掌握大量健康醫(yī)療數(shù)據(jù),但標準化、數(shù)據(jù)脫敏水平、數(shù)據(jù)價值評估能力相對不足,導(dǎo)致優(yōu)質(zhì)資源無法有效流通和共享,也無法獲得合理的收益。另一方面,作為數(shù)據(jù)獲取方和使用方的醫(yī)療機構(gòu),在開展醫(yī)療數(shù)據(jù)分析和輔助治療等工作時,缺乏獲取數(shù)據(jù)的渠道,并且難以獲得優(yōu)惠的購買價格。
3、目前醫(yī)療領(lǐng)域關(guān)于數(shù)據(jù)要素的收益分配方法較少,已有方法未充分考慮數(shù)據(jù)特征,未充分評估數(shù)據(jù)價值的貢獻度,不能夠靈活地進行貢獻度的評估和后續(xù)的收益分配?,F(xiàn)有的收益分配方法主要有shapley值法、供應(yīng)鏈契約協(xié)調(diào)法、公平熵法等。shapley值收益分配方法雖然能夠保障收益分配的公平性,也能求出唯一解,但實際使用中未考慮參與成員的風(fēng)險性、公益性等其他影響收益分配的因素。供應(yīng)鏈契約協(xié)調(diào)方法能夠激勵各機構(gòu)進行交易,但難以對分配方案進行量化。公平熵法在使用時,需要對數(shù)據(jù)進行一定程度的公開,與醫(yī)療數(shù)據(jù)的隱私性要求沖突,且醫(yī)療數(shù)據(jù)中包含很多非量化的指標,如患者滿意度、醫(yī)療服務(wù)質(zhì)量等,都難以用熵值進行量化和評估。
4、現(xiàn)有的醫(yī)療數(shù)據(jù)要素收益分配機制主要針對區(qū)塊鏈場景下,由于區(qū)塊鏈技術(shù)具有去中心化、不可篡改等特點,有些醫(yī)療機構(gòu)使用該技術(shù)來解決數(shù)據(jù)隱私和安全問題,但在使用過程中區(qū)塊鏈技術(shù)面臨著一些挑戰(zhàn),例如其不可篡改性導(dǎo)致數(shù)據(jù)一旦寫入系統(tǒng),就無法修改,數(shù)據(jù)交易靈活性相對較差。故現(xiàn)有的醫(yī)療數(shù)據(jù)要素收益分配機制存在以下缺點:
5、第一,數(shù)據(jù)價值評估困難,缺乏統(tǒng)一的評估體系,使數(shù)據(jù)的價值難以量化,并且評估不夠靈活,不能根據(jù)數(shù)據(jù)特征及時更新貢獻度評分,影響收益分配的公平性。
6、第二,隱私和安全問題,醫(yī)療健康數(shù)據(jù)包含敏感個人信息,隱私保護和數(shù)據(jù)安全問題突出,限制了數(shù)據(jù)的共享。
7、第三,缺乏激勵相容的分配機制,現(xiàn)行的分配機制不足以激勵數(shù)據(jù)提供方共享數(shù)據(jù),不足以激勵數(shù)據(jù)加工和分析方投入資源進行數(shù)據(jù)價值挖掘。。
8、針對上述技術(shù)問題,本發(fā)明提出了基于貢獻度評估的健康醫(yī)療數(shù)據(jù)要素收益分配方法及系統(tǒng)。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是針對現(xiàn)有技術(shù)的缺陷,提供了基于貢獻度評估的健康醫(yī)療數(shù)據(jù)要素收益分配方法及系統(tǒng)。
2、為了實現(xiàn)以上目的,本發(fā)明采用以下技術(shù)方案:
3、基于貢獻度評估的健康醫(yī)療數(shù)據(jù)要素收益分配方法,包括:
4、s1.建立數(shù)據(jù)要素貢獻評估體系:根據(jù)醫(yī)療機構(gòu)的數(shù)據(jù)建立多維度指標,基于xgboost機器學(xué)習(xí)模型和shap值對多維度指標進行評估,得到數(shù)據(jù)要素的貢獻度;
5、s2.建立收益分配模型:根據(jù)數(shù)據(jù)要素的貢獻度和評估的每個醫(yī)療機構(gòu)的貢獻度計算數(shù)據(jù)本身的價值,按照約定的收益分配比例進行每個醫(yī)療機構(gòu)總收益的分配;
6、s3.在動態(tài)評估機制下的收益分配方法:重新計算動態(tài)影響因子,根據(jù)動態(tài)影響因子的變化調(diào)整每個醫(yī)療機構(gòu)的數(shù)據(jù)要素貢獻度,進行收益分配的調(diào)整。
7、進一步的,所述步驟s1中建立的多維度指標包括數(shù)據(jù)稀缺性、數(shù)據(jù)完整性、數(shù)據(jù)一致性、數(shù)據(jù)結(jié)構(gòu)化程度、數(shù)據(jù)冗余度、數(shù)據(jù)量、數(shù)據(jù)時間跨度、數(shù)據(jù)質(zhì)量、數(shù)據(jù)可解釋性。
8、進一步的,所述步驟s1具體為:
9、s11.獲取與多維度指標相對應(yīng)的醫(yī)療數(shù)據(jù),并將獲取的醫(yī)療數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;
10、s12.構(gòu)建xgboost模型并調(diào)整xgboost模型的參數(shù),將訓(xùn)練數(shù)據(jù)集輸入至調(diào)整后的xgboost模型進行訓(xùn)練,并通過交叉驗證方法優(yōu)化xgboost模型,得到訓(xùn)練好的xgboost模型;
11、s13.采用訓(xùn)練好的xgboost模型輸出數(shù)據(jù)要素的貢獻度的預(yù)測結(jié)果;
12、s14.采用shap解釋器計算醫(yī)療數(shù)據(jù)對應(yīng)的shap值,根據(jù)shap值來解釋訓(xùn)練好的xgboost模型輸出的預(yù)測結(jié)果。
13、進一步的,所述步驟s12中對xgboost模型進行訓(xùn)練還包括采用聯(lián)邦學(xué)習(xí)技術(shù)對xgboost模型進行訓(xùn)練。
14、進一步的,所述步驟s2中每個醫(yī)療機構(gòu)總收益的分配,表示為:
15、;
16、其中,rh表示每個醫(yī)療機構(gòu)作為數(shù)據(jù)提供方時分配到的收益;ch表示該醫(yī)療機構(gòu)提供的數(shù)據(jù)要素的總貢獻度;ctotal表示所有數(shù)據(jù)提供方提供的數(shù)據(jù)要素的總貢獻度;cobtain表示作為數(shù)據(jù)獲取方的醫(yī)療機構(gòu)提供的每個數(shù)據(jù)要素貢獻度之和;rp表示數(shù)據(jù)提供方收益。
17、進一步的,所述步驟s3具體為:
18、s31.識別并量化影響數(shù)據(jù)價值變化的動態(tài)因素;
19、s32.定期重新計算動態(tài)影響因子;
20、s33.根據(jù)步驟s32中計算的動態(tài)影響因子重新調(diào)整每個醫(yī)療機構(gòu)的數(shù)據(jù)要素貢獻度;
21、s34.根據(jù)更新后的數(shù)據(jù)要素貢獻度,進行收益分配的調(diào)整。
22、相應(yīng)的,還提供基于貢獻度評估的健康醫(yī)療數(shù)據(jù)要素收益分配系統(tǒng),包括:
23、建立模塊,用于建立數(shù)據(jù)要素貢獻評估體系:根據(jù)醫(yī)療機構(gòu)的數(shù)據(jù)建立多維度指標,基于xgboost機器學(xué)習(xí)模型和shap值對多維度指標進行評估,得到數(shù)據(jù)要素的貢獻度;
24、分配模塊,用于建立收益分配模型:根據(jù)數(shù)據(jù)要素的貢獻度和評估的每個醫(yī)療機構(gòu)的貢獻度計算數(shù)據(jù)本身的價值,按照約定的收益分配比例進行每個醫(yī)療機構(gòu)總收益的分配;
25、第一調(diào)整模塊,用于在動態(tài)評估機制下的收益分配方法:重新計算動態(tài)影響因子,根據(jù)動態(tài)影響因子的變化調(diào)整每個醫(yī)療機構(gòu)的數(shù)據(jù)要素貢獻度,進行收益分配的調(diào)整。
26、進一步的,所述建立模塊包括:
27、獲取模塊,用于獲取與多維度指標相對應(yīng)的醫(yī)療數(shù)據(jù),并將獲取的醫(yī)療數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;
28、構(gòu)建模塊,用于構(gòu)建xgboost模型并調(diào)整xgboost模型的參數(shù),將訓(xùn)練數(shù)據(jù)集輸入至調(diào)整后的xgboost模型進行訓(xùn)練,并通過交叉驗證方法優(yōu)化xgboost模型,得到訓(xùn)練好的xgboost模型;
29、輸出模塊,用于采用訓(xùn)練好的xgboost模型輸出數(shù)據(jù)要素的貢獻度的預(yù)測結(jié)果;
30、分析模塊,用于采用shap解釋器計算醫(yī)療數(shù)據(jù)對應(yīng)的shap值,根據(jù)shap值來解釋訓(xùn)練好的xgboost模型輸出的預(yù)測結(jié)果。
31、進一步的,所述分配模塊中每個醫(yī)療機構(gòu)總收益的分配,表示為:
32、;
33、其中,rh表示每個醫(yī)療機構(gòu)作為數(shù)據(jù)提供方時分配到的收益;ch表示該醫(yī)療機構(gòu)提供的數(shù)據(jù)要素的總貢獻度;ctotal表示所有數(shù)據(jù)提供方提供的數(shù)據(jù)要素的總貢獻度;cobtain表示作為數(shù)據(jù)獲取方的醫(yī)療機構(gòu)提供的每個數(shù)據(jù)要素貢獻度之和;rp表示數(shù)據(jù)提供方收益。
34、進一步的,所述第一調(diào)整模塊包括:
35、識別模塊,用于識別并量化影響數(shù)據(jù)價值變化的動態(tài)因素;
36、計算模塊,用于定期重新計算動態(tài)影響因子;
37、第二調(diào)整模塊,用于根據(jù)計算的動態(tài)影響因子重新調(diào)整每個醫(yī)療機構(gòu)的數(shù)據(jù)要素貢獻度;
38、第三調(diào)整模塊,用于根據(jù)更新后的數(shù)據(jù)要素貢獻度,進行收益分配的調(diào)整。
39、與現(xiàn)有技術(shù)相比,本發(fā)明基于貢獻度評估,對參與機構(gòu)提供的健康醫(yī)療數(shù)據(jù)要素進行收益分配,包括三個部分:建立數(shù)據(jù)要素貢獻評估體系,建立收益分配模型,在動態(tài)評估機制下的收益分配方法。通過三大模塊,實現(xiàn)數(shù)據(jù)要素貢獻度的量化,對參與機構(gòu)的收益進行合理的分配,并通過動態(tài)評估機制來增加數(shù)據(jù)的靈活性。具體效果歸納如下:
40、1、本發(fā)明通過綜合考慮數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、稀缺性、時效性等多個關(guān)鍵指標,平臺建立了一個數(shù)據(jù)要素貢獻評估體系,不僅使數(shù)據(jù)價值得以量化,還促進了不同的數(shù)據(jù)共享和流通,加強了醫(yī)療機構(gòu)間的協(xié)作和數(shù)據(jù)資源的有效利用。
41、2、本發(fā)明采用了包括聯(lián)邦學(xué)習(xí)框架和機器學(xué)習(xí)模型在內(nèi)的先進數(shù)據(jù)處理技術(shù),這些技術(shù)允許模型在各個參與方之間持續(xù)迭代更新,能夠靈活地根據(jù)新的數(shù)據(jù)來調(diào)整全局模型,避免了對數(shù)據(jù)的重新收集和處理,提高了數(shù)據(jù)處理效率和模型的可拓展性。通過這種方式,模型能夠反映最新的數(shù)據(jù)價值變化,確保了平臺的時效性和準確性。
42、3、本發(fā)明提出了一種公平、合理的收益分配機制,旨在激勵醫(yī)療機構(gòu)加速信息化進程并提升數(shù)據(jù)質(zhì)量。通過評估各個參與方的貢獻度,進行收益分配,該機制促進了醫(yī)療機構(gòu)之間的公平競爭和合作,確保了收益分配的透明性和公正性,從而激勵各醫(yī)療機構(gòu)更積極地參與數(shù)據(jù)共享平臺,推動了醫(yī)療數(shù)據(jù)要素市場的健康發(fā)展。