1.基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,該方法包含以下步驟:
2.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s1所述的預(yù)處理為:
3.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s1所述的預(yù)處理為:步驟s2中所述具體計(jì)算為:
4.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s3中所述的矩陣分解方法具體為:
5.根據(jù)權(quán)利要求4所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟(2)所述的誤差為待評(píng)估矩陣mc所有已知元素與對(duì)應(yīng)位置m*元素差值的一范數(shù)、二范數(shù)或它們的線性組合。
6.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s6所述的比較q值得到當(dāng)前輪次最佳策略和最差策略,具體為:對(duì)任意的狀態(tài)s,計(jì)算狀態(tài)s以及動(dòng)作a下的輸出q值,即q(s,a),根據(jù)和選出q值最大和最小的策略,即最佳策略π*、最差策略π′;其中a為動(dòng)作空間。
7.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s7具體為:
8.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,所述的步驟s8具體為:
9.根據(jù)權(quán)利要求1所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s9所述的η極優(yōu)終止準(zhǔn)則具體為:設(shè)定一個(gè)超參數(shù)η≥1,如果通過(guò)步驟s8選擇的全局最佳策略和全局最差策略是在最近的η輪次之中得到的,則繼續(xù)下一輪q值模型的訓(xùn)練;否則就終止訓(xùn)練。
10.根據(jù)權(quán)利要求8所述的基于正態(tài)分布綜合評(píng)估的腎臟替代治療策略推薦方法,其特征在于,步驟s806所述的篩選全局最佳策略的方法可以通過(guò)引入臨時(shí)變量存儲(chǔ)全局最佳策略,只比較當(dāng)前輪次和臨時(shí)變量,進(jìn)而判斷出全局最佳策略。