欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于自動(dòng)產(chǎn)生分層樹網(wǎng)絡(luò)并且使用對(duì)于所述分層樹網(wǎng)絡(luò)的每個(gè)葉子優(yōu)化的兩種互補(bǔ)學(xué)習(xí)...的制作方法

文檔序號(hào):6656287閱讀:147來源:國知局
專利名稱:用于自動(dòng)產(chǎn)生分層樹網(wǎng)絡(luò)并且使用對(duì)于所述分層樹網(wǎng)絡(luò)的每個(gè)葉子優(yōu)化的兩種互補(bǔ)學(xué)習(xí) ...的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于產(chǎn)生分層樹網(wǎng)絡(luò)并且使用線性加非線性學(xué)習(xí)算法來形成關(guān)于成員的未來健康狀態(tài)的一致觀點(diǎn)的系統(tǒng)和方法。在所述分層樹網(wǎng)絡(luò)中的每個(gè)葉子在臨床特性、經(jīng)歷時(shí)段和可用數(shù)據(jù)資產(chǎn)上同質(zhì)(homogeneous)。對(duì)于每個(gè)葉子執(zhí)行優(yōu)化,以便可以對(duì)于每個(gè)葉子專有的本地特性定制(tailor)特征和學(xué)習(xí)算法。

發(fā)明內(nèi)容
本發(fā)明用于一種用于預(yù)測人的未來健康狀態(tài)的方法。所述方法包括步驟一種用于預(yù)測人的未來健康狀態(tài)的方法。所述方法包括步驟a.建立作為多個(gè)層化變量的函數(shù)的分層樹網(wǎng)絡(luò),對(duì)于多個(gè)成員,所述分層樹網(wǎng)絡(luò)把每個(gè)成員分配到多個(gè)節(jié)點(diǎn)中的至多僅一個(gè);b.對(duì)于所述多個(gè)成員和用于每個(gè)所述成員,向基于計(jì)算機(jī)的系統(tǒng)提供成員人口數(shù)據(jù)(demographic data)、可得的成員醫(yī)療索賠數(shù)據(jù)和可得的成員醫(yī)藥索賠數(shù)據(jù);c.對(duì)于所述多個(gè)節(jié)點(diǎn)的每個(gè)執(zhí)行特征選擇,以對(duì)于每個(gè)節(jié)點(diǎn)標(biāo)識(shí)來自包括下述項(xiàng)的至少一些的集合的特征的最佳子集針對(duì)于被分配到該所述節(jié)點(diǎn)的所有成員的所述成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)、所述可得的成員醫(yī)藥索賠數(shù)據(jù);d.使用下述項(xiàng)的至少一些來訓(xùn)練MVLR算法和BRN算法所述成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)、所述可得的成員醫(yī)藥索賠數(shù)據(jù),并且在數(shù)據(jù)庫中存儲(chǔ)所學(xué)習(xí)的參數(shù)以建立所學(xué)習(xí)的參數(shù)的數(shù)據(jù)庫;e.使用所述所學(xué)習(xí)的參數(shù)的數(shù)據(jù)庫,以及對(duì)于至少一個(gè)所述成員,使用該至少一個(gè)所述成員的成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)和所述可得的成員醫(yī)藥索賠數(shù)據(jù),使用所述MVLR算法來計(jì)算MVLR未來健康狀態(tài)分?jǐn)?shù)以及使用所述BRN算法來計(jì)算BRN未來健康狀態(tài)分?jǐn)?shù),計(jì)算所述MVLR未來健康狀態(tài)分?jǐn)?shù)和所述BRN未來健康狀態(tài)分?jǐn)?shù)的算術(shù)平均值以確定最終分?jǐn)?shù)。
所述層化變量可以包括成員的入會(huì)持續(xù)時(shí)間,例如小于6個(gè)月或至少6個(gè)月;災(zāi)難狀況的存在與否;糖尿病的存在與否;醫(yī)藥觸發(fā)或住院準(zhǔn)入觸發(fā)(trigger)的存在;醫(yī)療和醫(yī)藥索賠數(shù)據(jù)兩者的存在、僅僅醫(yī)藥索賠數(shù)據(jù)的存在或僅僅醫(yī)療索賠數(shù)據(jù)的存在。
所述方法還可以包括報(bào)告步驟,其中,關(guān)于成員的信息與所計(jì)算的最終分?jǐn)?shù)被提供。例如,成員信息可以包括入會(huì)/合格信息、臨床狀況信息——包括狀態(tài)、觸發(fā)類型和觸發(fā)日期——以及醫(yī)藥索賠和/或醫(yī)療索賠的隨著時(shí)間的成員成本的表示。


通過下面結(jié)合附圖的說明,可以更好地理解本發(fā)明,其中圖1示出了N維向量空間,它被處理和映射以支持特征優(yōu)化和學(xué)習(xí)以及各種學(xué)習(xí)算法的相對(duì)優(yōu)點(diǎn)和弱點(diǎn)的討論。
圖2示出了分層樹網(wǎng)絡(luò)生成、特征優(yōu)化、學(xué)習(xí)和打分(scoring)的整體流程圖。
圖3A-3H示出了運(yùn)轉(zhuǎn)中的兩個(gè)所選擇的學(xué)習(xí)算法(多變量線性回歸和貝葉斯正則化網(wǎng)絡(luò)的組合)。
圖4A-4B示出了對(duì)于多層感知器的記憶效果的一瞥。
圖5示出了當(dāng)兩種學(xué)習(xí)算法貝葉斯正則化網(wǎng)絡(luò)(BRN)和多變量線性回歸(MVLR)總體上一致時(shí),通過遠(yuǎn)離表示完美一致的直線的眾多散點(diǎn)可以看出,在一些情況下,它們提供了不同的回答。
圖6A-6F示出了一年未來成本的平方根對(duì)各種協(xié)變量(covariate)的繪圖。這些簡單的繪圖提過了許多有用的視點(diǎn)。如果存在簡單的線性關(guān)系,則可以看到直的單向增加的線。不幸的是,我們未看到具有這些特征的任何一個(gè)的這樣的明顯趨勢,這指示沒有簡單的線性視點(diǎn)(insight)。
具體實(shí)施例方式
作為背景,健康保險(xiǎn)業(yè)中所使用的預(yù)測模型視圖預(yù)測成員的未來健康狀態(tài)。它們可以被部署在精算核保和高風(fēng)險(xiǎn)成員的標(biāo)識(shí)中以用于搶先的醫(yī)療干預(yù)。
構(gòu)造預(yù)測模型包含兩個(gè)階段首先,將索賠數(shù)據(jù)(claims data)轉(zhuǎn)換為一組臨床特征,第二,使用歷史索賠數(shù)據(jù)來學(xué)習(xí)在臨床特征(x)和未來健康狀態(tài)(y)之間的關(guān)系。典型的臨床特征包括二進(jìn)制臨床標(biāo)記。注意,IHCIS使用超過幾百個(gè)二進(jìn)制臨床標(biāo)記作為在預(yù)測模型中的協(xié)變量。二進(jìn)制標(biāo)記的示例是最后3個(gè)月期間的入院病人事件、過去一年的冠狀動(dòng)脈旁路移植術(shù)(coronaryartery bypass graft,CABG)過程、過去一年的心臟病、年齡、性別、過去的處方成本(Rx cost)、過去的醫(yī)療成本、住院時(shí)間長度、急診室(ER)門診的數(shù)量、處方與醫(yī)療(Rx-to-med)的成本比率等等。
現(xiàn)今采用的學(xué)習(xí)算法涵蓋基于規(guī)則的專家系統(tǒng)(Active Health)、線性回歸(IHCIS、Ingenix、DxCG、Active Health和Biosignia)、多層感知器(McKesson、分類和回歸樹(CART)(醫(yī)學(xué)家))、各種基于實(shí)例的學(xué)習(xí)機(jī),諸如k近鄰或判別自適應(yīng)最近鄰(Hastie和Tibshirani,1996)(MedAI)。學(xué)習(xí)算法試圖通過優(yōu)化由各種形式的誤差項(xiàng)——諸如L-1(絕對(duì)誤差)、L-2(均方誤差)和L-∞(最大誤差)范數(shù)——支配的目標(biāo)函數(shù)而找到輸入和輸出之間的關(guān)系。
在概念上,特征提取和優(yōu)化通過找到可以充分捕獲在原始數(shù)據(jù)中存在的所有有用信息的最小特征維數(shù)以便利學(xué)習(xí)。學(xué)習(xí)類似于找到在最佳特征和期望輸出之間的映射函數(shù)。學(xué)習(xí)算法可以被大致分類為參數(shù)的、非參數(shù)的和邊界確定類型(Kil和Shin,1996)。
參數(shù)算法關(guān)于數(shù)據(jù)分布進(jìn)行強(qiáng)參數(shù)假設(shè),諸如線性高斯分布。簡單參數(shù)假設(shè)——相應(yīng)地具有小數(shù)量的模型參數(shù)要調(diào)整——可以是雙刃劍。如果實(shí)際數(shù)據(jù)分布比初始假設(shè)復(fù)雜得多,則參數(shù)學(xué)習(xí)者遭受巨大的模型不匹配,當(dāng)學(xué)習(xí)算法不足以捕獲x和y之間的高度非線性關(guān)系時(shí)發(fā)生這種情況。相矛盾地,在存在大數(shù)據(jù)不匹配——這頻繁發(fā)生在真實(shí)數(shù)據(jù)與用于調(diào)整模型的訓(xùn)練數(shù)據(jù)相當(dāng)不同時(shí)——的情況下,簡單參數(shù)算法趨向于勝過它們的非參數(shù)對(duì)手。
非參數(shù)和邊界確定學(xué)習(xí)算法試圖從數(shù)據(jù)學(xué)習(xí)數(shù)據(jù)分布。一般,神經(jīng)網(wǎng)絡(luò)和非參數(shù)學(xué)習(xí)算法,在擅于最小化模型不匹配誤差同時(shí),趨向于是深?yuàn)W和遲鈍的。沒有簡單的方式來說明輸入和輸出之間的關(guān)系。人們不能斷言說,較高的先前年份的醫(yī)療成本導(dǎo)致較高的未來成本,因?yàn)闆]有簡單的線性關(guān)系。
這些學(xué)習(xí)算法具有大量的可調(diào)整的參數(shù),它們可以幫助捕獲復(fù)雜、非線性的關(guān)系。不幸的是,這樣的精細(xì)調(diào)整也可以導(dǎo)致過擬和(overfit)或記憶,這在存在數(shù)據(jù)不匹配時(shí)是危險(xiǎn)的。而且,眾所周知,非線性算法當(dāng)運(yùn)行在訓(xùn)練空間之外時(shí)趨向于產(chǎn)生混亂結(jié)果。即,當(dāng)人們預(yù)期現(xiàn)實(shí)數(shù)據(jù)和調(diào)整了所述模型的訓(xùn)練數(shù)據(jù)之間的大差異時(shí),它們是不合適的。
隱馬爾可夫(Markov)模型在對(duì)于時(shí)間過渡建模上有用。在現(xiàn)實(shí)應(yīng)用中,頻繁地觀察到在計(jì)算代價(jià)高昂的Baum-Welch優(yōu)化次于分段k均值(segmentalk-means,SKM),雖然前者具有更高的被宣傳的精度。原因是在模型和數(shù)據(jù)不匹配之間的折中(trade off)。在我所看到的大多數(shù)現(xiàn)實(shí)問題中,數(shù)據(jù)不匹配遠(yuǎn)比模型不匹配重要。
從左到右,為了演示特征優(yōu)化和學(xué)習(xí)的核心思想,圖1示出了原始數(shù)據(jù)跨越的初始N維向量空間,隨著大量重疊貝信號(hào)處理并且特征被排序(rank)而產(chǎn)生由特征優(yōu)化后所確定的良好特征跨越的M維向量空間,其中M<<N,在右部的映射示出了由分類器建立的最后的一維決策空間。下面總結(jié)了各種學(xué)習(xí)算法的相對(duì)優(yōu)點(diǎn)和弱點(diǎn)。參數(shù)學(xué)習(xí)算法的特性是它們對(duì)于潛在的類條件概率分布(class-conditional probability)進(jìn)行強(qiáng)參數(shù)假設(shè),非常易于訓(xùn)練,并且易于受到模型不匹配的影響。參數(shù)學(xué)習(xí)算法的示例是多變量高斯分類器、高斯混合模型和線性回歸。非參數(shù)學(xué)習(xí)算法的特性是它們不進(jìn)行參數(shù)假設(shè),從數(shù)據(jù)學(xué)習(xí)分布,在大多數(shù)情況下訓(xùn)練昂貴,并且易于受到在訓(xùn)練和測試數(shù)據(jù)集之間的數(shù)據(jù)不匹配的影響。非參數(shù)學(xué)習(xí)算法的示例是核(心Kernel)估計(jì)器、直方圖、函數(shù)形式和K-nearest。邊界確定學(xué)習(xí)算法的特性是它們構(gòu)造劃分多個(gè)類的(非)線性邊界函數(shù),訓(xùn)練昂貴,并且在大多數(shù)情況下啟發(fā)性地確定內(nèi)部參數(shù)。邊界確定學(xué)習(xí)算法的示例是多層感知器、判別神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)。
線性回歸的普及源于它的直觀力量。設(shè)y表示未來成本,x表示N維實(shí)空間(∈RN)的臨床特征或協(xié)變量。線性回歸使用下面的方程來估計(jì)yy^=a0+Σn=1Nanxn,]]>其中,an表示在xn和y之間的相關(guān)(correlation)的方向和強(qiáng)度。下面說明線性回歸的直觀特性。如果先前年份醫(yī)療成本的回歸系數(shù)a是+1.3,則可以推測在所有的其他輸入變量相同的情況下,未來成本有可能是先前年份的醫(yī)療成本的1.3倍。
雖然易于理解,但是線性回歸不能利用其簡單數(shù)學(xué)公式來對(duì)于復(fù)雜、非線性關(guān)系建模,這可以導(dǎo)致大的模型不匹配誤差。盡管如此,尚未回答的問題是,如何組合線性和非線性模型的優(yōu)勢,以便我們可以最小化數(shù)據(jù)和模型不匹配誤差兩者。
概括言之,建模的成功依賴于在模型不匹配和數(shù)據(jù)不匹配之間的折中。迫切需要找到一種在數(shù)據(jù)變換、所得到特征的提取、優(yōu)化和魯棒學(xué)習(xí)方面的集成的、互補(bǔ)的算法集。
對(duì)于本發(fā)明,不是試圖以一個(gè)重?fù)艚鉀Q整體問題,我們依賴于明智的、分而治之(divide-and-conquer)的手段。首先,我們使用分層樹網(wǎng)絡(luò)將問題空間劃分為多個(gè)邏輯子空間。所述分層樹網(wǎng)絡(luò)的每個(gè)葉子在臨床特性、經(jīng)歷時(shí)段和可用數(shù)據(jù)資產(chǎn)上同質(zhì)。而且,所述分層樹結(jié)構(gòu)方法很靈活足以容納另外的維數(shù),諸如用于表示成員的總體疾病負(fù)擔(dān)的臨床狀況分?jǐn)?shù)、先前經(jīng)歷特性(每個(gè)月的先前成本)、慢性病對(duì)總成本的比率和疾病軌跡(加重、減弱或隨著時(shí)間不變)。接下來在每個(gè)葉子進(jìn)行特征排序,以使用對(duì)預(yù)測有用的本地獨(dú)特的特性。最后,多個(gè)學(xué)習(xí)算法使用其本身的思考研究最佳特征子集和輸出之間的關(guān)系。圖2示出了分而治之手段的一個(gè)實(shí)施例。
現(xiàn)在,我們?cè)敿?xì)說明每個(gè)步驟。
分層樹網(wǎng)絡(luò)產(chǎn)生設(shè)計(jì)分層樹網(wǎng)絡(luò),其中,每個(gè)葉子包括共享類似Humana齡和數(shù)據(jù)標(biāo)記的臨床同質(zhì)聚類。在x軸上的臨床狀況分?jǐn)?shù)(Clinical ConditionScore,CCS)和在y軸上的每月先前成本的2維空間中執(zhí)行聚類。具有多個(gè)共病態(tài)(co-morbid)狀況的第m個(gè)成員的臨床狀況分?jǐn)?shù)被定義如下CCS(m)=Σk=1Nchr+1bk(m)pppm(k),]]>其中,bk(m)是第m個(gè)成員的第k個(gè)狀況存在/不存在標(biāo)記,并且pppm(k)表示具有第k個(gè)共病態(tài)疾病集的所有成員的平均每個(gè)月成本。在這個(gè)二維向量空間中,第一象限表示嚴(yán)重病態(tài)的群體,其具有高的每個(gè)月每個(gè)成員(per-member-per-month,PMPM)的先前成本。第三象限表示較為健康的群體,其具有低的PMPM。第二象限包含具有較小數(shù)量的臨界臨床狀況、但是具有大PMPM(也許行為問題)的成員。最后,第四象限表示具有眾多臨界臨床狀況、但是具有小的PMPM的成員,也許是因?yàn)樗麄兏玫刈晕夜芾硭麄兊臓顩r。
a.樹再分(subdivision)的指南前后的熵降低度量(即我們通過劃分獲得了什么東西嗎?),數(shù)據(jù)不匹配的水平(在全數(shù)據(jù)集訓(xùn)練和10折的交叉驗(yàn)證之間的MVLR性能差別)、最小群體規(guī)模300和必要性(加入持續(xù)時(shí)間和數(shù)據(jù)可用性)。
b.分支重新組合根據(jù)類似性量度諸如被定義如下的Kullback-Leibler散度與不同分支節(jié)點(diǎn)的重新組合DKL(i,j)=∫p(y|leaf=i)ln(p(y|leaf=i)p(y|leaf=i))dy-∫p(y|leaf=i)ln(p(y|leaf=i)p(y|leaf=i))dy]]>其中,p(y|leaf=j(luò))是與分層樹葉子j相關(guān)聯(lián)的所選輸出的概率。
c.近似在給出我們的數(shù)據(jù)的實(shí)體的情況下,我使用下面的5個(gè)特征來建立分層樹葉子1.Humana成員持續(xù)時(shí)間這指示成員已經(jīng)加入Humana多長時(shí)間,并且確定可得的索賠歷史的數(shù)量。這個(gè)字段對(duì)解釋健康保險(xiǎn)業(yè)中高周轉(zhuǎn)率的商業(yè)實(shí)體是必要的。
2.災(zāi)難狀況這個(gè)字段表示需要協(xié)調(diào)的健康管理和嚴(yán)格的臨床干預(yù)的昂貴慢性病狀態(tài)的存在。
3.糖尿病標(biāo)記因?yàn)閭€(gè)人看護(hù)程序著重于具有其他慢性病狀態(tài)的糖尿病患者的行為改變,因此獨(dú)立地標(biāo)記具有糖尿病但是沒有災(zāi)難狀況的成員。
4.觸發(fā)類型這個(gè)字段表示成員被帶入預(yù)測模型隊(duì)列中的原因。對(duì)于住院事件的那些成員需要關(guān)于他們?nèi)绾慰梢赃h(yuǎn)離進(jìn)一步的住院治療的特殊勸告和提醒消息。而且,他們對(duì)于行為干預(yù)消息更易于接受。
5.數(shù)據(jù)可用性不必說,模型必須考慮可用的數(shù)據(jù)資產(chǎn)。
特征子集選擇對(duì)于每個(gè)葉子,我們進(jìn)行特征優(yōu)化以在收益減小點(diǎn)選擇最佳的特征子集。
a.特征相關(guān)為了最小化冗余和特征維數(shù),我們使用主成分分析來組合高度相關(guān)的特征(ρ≥0.9),其中, b.特征排序特征排序的目的是研究每個(gè)特征對(duì)于整體的預(yù)測精度的貢獻(xiàn)水平。如果特征完全正交(即ρij=0,i≠j),則特征排序蛻化為使用多個(gè)適當(dāng)?shù)牧慷取T如Fisher的判定率、多模型重疊(multi-modal overlap,MOM)測量、散度、Bhattacharyya距離(Kil和Shin,1996)——邊緣的或一維的特征排序。如果特征不是正交的,則我們可以使用隨機(jī)或組合優(yōu)化算法。
學(xué)習(xí)學(xué)習(xí)可以采用回歸(連續(xù)因變量(dependent variable),諸如未來成本)或分類(離散因變量,諸如標(biāo)識(shí)在未來成本中的前20%的用戶)的形式。所述因變量可以臨床或面向保險(xiǎn)精算的。我們使用下面的學(xué)習(xí)算法a.多變量線性回歸(MVLR)y=a0+Σn=1Nanxn]]>b.貝葉斯正則化網(wǎng)絡(luò)(BRN)BRN可以用于回歸和分類兩者(Foresee和Hagan,1997)。
打分(scoring)使用所學(xué)習(xí)的參數(shù)數(shù)據(jù)庫,我們現(xiàn)在使用多個(gè)學(xué)習(xí)算法來對(duì)于未知的一批群體打分。
現(xiàn)在,我們探討如圖2中所示的一個(gè)這樣的實(shí)施例的學(xué)習(xí)和打分。對(duì)于圖2,使用下面的附圖標(biāo)號(hào)1-融合的特征的輸入,它們是所有可得的醫(yī)療和醫(yī)藥數(shù)據(jù)和人口數(shù)據(jù);2-特征子集選擇;3-學(xué)習(xí)或分?jǐn)?shù)決定?;4-學(xué)習(xí)路徑;5-MVLR學(xué)習(xí);6-BRN學(xué)習(xí);7-被學(xué)習(xí)的數(shù)據(jù)庫;8-分?jǐn)?shù)路徑;9-MVLR打分;10-BRN打分;11-平均值運(yùn)算符;12-臨床狀況總結(jié);13-最后的分?jǐn)?shù)和狀況報(bào)告。
詳細(xì)討論之前,下面的表提供了關(guān)于分層樹網(wǎng)絡(luò)中的30個(gè)節(jié)點(diǎn)的細(xì)節(jié)。


在上面的表格中,由1-15標(biāo)識(shí)的葉子形成入會(huì)少于6月的成員的第一節(jié)點(diǎn)集,葉子16-30形成入會(huì)大于等于6月的第二節(jié)點(diǎn)集。對(duì)于第一組節(jié)點(diǎn)1-15,葉子1-3形成第一子集,葉子4-15形成第二子集;葉子4-6形成第一子子集,葉子7-9形成第二子子集,葉子10-12形成第三子子集,葉子13-15形成第四子子集。對(duì)于第二節(jié)點(diǎn)集16-30,葉子16-18形成第一子集,葉子19-30形成第二子集;葉子19-21形成第一子子集,葉子22-24形成第二子子集,葉子25-27形成第三子子集,葉子28-30形成第四子子集。
1.為了所述預(yù)測模型處理每個(gè)可想象的情況,如上所示,我們建立了分層樹網(wǎng)絡(luò)作為下面5個(gè)層化(stratification)變量的函數(shù),產(chǎn)生30個(gè)節(jié)點(diǎn)或葉子入會(huì)持續(xù)時(shí)間成員加入Humana多長時(shí)間。如上所示,成員被劃分為已經(jīng)加入Humana 0-0.5年的成員和已經(jīng)加入Humana超過0.5年的成員。
災(zāi)難狀況成員具有高度嚴(yán)重(high-severity)臨床狀況嗎?如果成員具有下面的任何一個(gè),則種類標(biāo)記為是,否則為否。
癌癥。
晚期疾病(腎或肺衰竭)。
移植。
罕見疾病。
艾滋病。
CAD+CHF+高血壓。
糖尿病標(biāo)記,是或否。如果成員具有在上述的b中的災(zāi)難狀況,則它們?cè)谌~子1-3或16-18中,并且糖尿病標(biāo)記不影響。
觸發(fā)類型新的Rx索賠或住院準(zhǔn)入。
可獲得的數(shù)據(jù)僅僅Rx、僅僅醫(yī)療或兩者。
作為示例,從30個(gè)節(jié)點(diǎn)的上面的表格和上面的說明,我們看到如果JonhSmith已經(jīng)加入Humana 9個(gè)月并且具有災(zāi)難狀況,則如果他具有醫(yī)藥和醫(yī)療受益,則他將落入葉子#16中。另一方面,如果Nancy Doe已經(jīng)加入Humana12個(gè)月、沒有任何災(zāi)難狀況、但是是糖尿病患者并且具有住院觸發(fā),則假定她具有由Humana涵蓋的醫(yī)療和醫(yī)藥受益計(jì)劃,她將落入葉子#22中。也看出,只有那些具有災(zāi)難狀況或具有住院準(zhǔn)入觸發(fā)或處方觸發(fā)的成員才將被分配到所述30個(gè)節(jié)點(diǎn)之一。
對(duì)于每個(gè)葉子,我們使用附加組合優(yōu)化執(zhí)行特征優(yōu)化以找到最佳的子集。
在學(xué)習(xí)期間,我們訓(xùn)練多變量線性回歸(MVLR)和貝葉斯正則化網(wǎng)絡(luò)(BRN)算法兩者。所學(xué)習(xí)的參數(shù)被存儲(chǔ)在本地?cái)?shù)據(jù)庫中。所述兩種學(xué)習(xí)算法被選擇來處理在現(xiàn)實(shí)情況中通常遇到的數(shù)據(jù)不匹配或模型不匹配誤差兩者。模型不匹配誤差發(fā)生在當(dāng)學(xué)習(xí)算法太簡單以致不能適當(dāng)?shù)貙?duì)于在輸入和輸出之間的復(fù)雜關(guān)系建模時(shí)。另一方面,數(shù)據(jù)不匹配誤差發(fā)生在當(dāng)過分調(diào)整(super-tuned)的學(xué)習(xí)算法不能處理在訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)之間在數(shù)據(jù)特性上的差別時(shí)。
在打分期間,這兩個(gè)學(xué)習(xí)算法均提供了對(duì)于成員的未來健康狀態(tài)它們的估計(jì)。
簡單的算術(shù)平均值運(yùn)算符輸出最后的分?jǐn)?shù),然后將其與報(bào)告格式的成員臨床狀況總結(jié)組合。所述臨床狀況報(bào)告由前5個(gè)MCC條件構(gòu)成觸發(fā)類型、觸發(fā)日期、打分日期、個(gè)人密鑰、如果是糖尿病的胰島素、口服或這兩個(gè)代碼、懷孕標(biāo)記。
對(duì)于如上所述的每個(gè)葉子,對(duì)于屬于那個(gè)葉子的結(jié)構(gòu)上同質(zhì)的群體分段發(fā)生獨(dú)立的學(xué)習(xí)。例如,我們獲得用于葉子16-18的下面的統(tǒng)計(jì)1.以R2=1-var(y-y^)var(y)]]>測量的性能,其中,y和 分別指的是實(shí)際和預(yù)測的輸出,并且var(·)表示方差運(yùn)算符;a.Rx+med0.41/0.39(BRN/MVLR)b.僅僅Rx0.24/0.18c.僅僅med0.36/0.352.前五個(gè)特征如下a.Rx+medi.總的預(yù)付數(shù)量的平方根ii.其他住院設(shè)施的平均利用iii.隨著時(shí)間的預(yù)付數(shù)量上的趨勢iv.支付數(shù)量上的波動(dòng)——越一致,則越容易預(yù)測。
v.與罕見疾病諸如多發(fā)性腦脊髓硬化癥、血友病等相關(guān)聯(lián)的成本。
b.僅僅Rxi.非0Rx成本持續(xù)時(shí)間ii.服用的獨(dú)特藥的數(shù)量iii.Ace藥的成本iv.Rx慢性病成本對(duì)Rx總的成本的比率,所述比率越高,則越容易預(yù)測。
v.GPI藥分類IDc.僅僅medi.最近6月預(yù)付數(shù)量的平方根ii.其他住院設(shè)施的平均利用iii.在主要ICD-9中的獨(dú)特診斷的數(shù)量iv.每個(gè)月的主要臨床狀況(MCC)成本的平均值v.針對(duì)住院醫(yī)生的平均支付數(shù)量索賠3.在打分期間,我們計(jì)算每個(gè)成員的大量特征,找到她所屬的葉子#,過濾我們對(duì)于所選擇的葉子所需要的特征子集,加載與那個(gè)葉子的所述兩個(gè)學(xué)習(xí)算法相關(guān)聯(lián)的學(xué)習(xí)參數(shù),并且生成來自MVLR和BRN的兩個(gè)輸出。為了所述兩個(gè)學(xué)習(xí)算法之間的一致,我們采用算術(shù)平均值。對(duì)于MVLR,學(xué)習(xí)參數(shù)由標(biāo)準(zhǔn)化和回歸系數(shù)構(gòu)成。對(duì)于BRN,所述學(xué)習(xí)參數(shù)包括網(wǎng)絡(luò)架構(gòu)結(jié)構(gòu)、優(yōu)化函數(shù)和每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)和連接的加權(quán)/偏差值。
4.作為輸出,我們向所述平均分?jǐn)?shù)附加每個(gè)人的臨床狀況、氣象圖(weather map)、觸發(fā)信息和其他合格(eligibility)信息。成員氣象圖提供了對(duì)于該成員的醫(yī)藥和/或醫(yī)療索賠的特定時(shí)段上的成員成本的表示。通過映射ICD9代碼到主要臨床狀況,可以對(duì)于不同的主要臨床狀況種類(諸如,例如,冠狀動(dòng)脈病、充血性心力衰竭、其他心臟病、血循環(huán)、癌癥)及其子集和子子集(諸如,例如,主要臨床狀況冠狀動(dòng)脈疾病具有子類冠狀動(dòng)脈旁路移植術(shù)、經(jīng)皮經(jīng)管冠狀動(dòng)脈成形術(shù)、心肌梗塞、心絞痛、其他缺血性心臟病、冠狀動(dòng)脈粥樣硬化和血脂過多)示出醫(yī)療成本信息。藥代碼葉子被映射到各種主要臨床狀況及其子集和子子集。成員氣象圖也可以示出在同一指定時(shí)段上取代治療(諸如醫(yī)院住院、醫(yī)院急診室、醫(yī)生辦公室訪問)的成員利用和醫(yī)療索賠成本。
下面,我們提供另外的算法細(xì)節(jié)。
貝葉斯正則化網(wǎng)絡(luò)傳統(tǒng)的前向神經(jīng)網(wǎng)絡(luò)使用執(zhí)行加權(quán)算術(shù)求和和非線性激活的多個(gè)前向連接的神經(jīng)元來迭代地學(xué)習(xí)輸入和輸出之間的高度非線性關(guān)系。不幸的是,在存在數(shù)據(jù)不匹配——其有時(shí)被稱為“新穎”輸入——的情況下,已經(jīng)發(fā)現(xiàn)性能缺少魯棒性。這是正則化(regularization)扮演重要角色的機(jī)會(huì)。
正則化意味著找到有意義的逼近解決方案,而不是無意義的精確解決方案(Neumaier,1998)。線性代數(shù)中的著名正則化方法被稱為對(duì)角安裝(dialogonalloading)。它也被稱為Tikhonov正則化。
如果我們感興趣于找到在y=Ax中的解x,則公知的標(biāo)準(zhǔn)L-2解是x=(A′A)-1A′y。對(duì)于不適定(ill-posed)的問題——其中偽逆A+=(A′A)-1A′不存在(可以使用奇異值分解對(duì)此驗(yàn)證),有意義的、良好的、適當(dāng)解是x=(A′A+σ2I)-1A′y,其中,我們向每個(gè)對(duì)角項(xiàng)加上小數(shù)量以正則化。這個(gè)特征被內(nèi)置在我們的多變量高斯分類算法中。
類似地在學(xué)習(xí)中,取代使用最小化均方差(L-2范數(shù))的傳統(tǒng)目標(biāo)函數(shù),可以使用在概念上類似于貝葉斯信息標(biāo)準(zhǔn)(Bayesian Information Criterion,BIC)或最小描述長度(Rissanen,1989)的優(yōu)化函數(shù),它的形式是BIC≈logp(D|S,θ^s)-D/2logN,]]>其中,D和S分別指的是數(shù)據(jù)庫和模型結(jié)構(gòu)。N是數(shù)據(jù)的樣本大小,而d是模型S的參數(shù)的數(shù)量, 表示與給定的模型結(jié)構(gòu)相關(guān)聯(lián)的一組參數(shù)。直觀地,這個(gè)方程陳述了,可以通過最大化從數(shù)據(jù)學(xué)習(xí)的模型結(jié)構(gòu)的說明力量并且同時(shí)最小化模型復(fù)雜性來最大化所述目標(biāo)函數(shù)。
在BRN中,目標(biāo)函數(shù)J=αE||y-y^||+βE||ω||,]]>其中,α+β=1。在J中的第一項(xiàng)是公知的均方預(yù)測誤差,而第二項(xiàng)表示網(wǎng)絡(luò)加權(quán)的平方的和。如果β>>α則學(xué)習(xí)將在損害最小化預(yù)測誤差的情況下更多地著重于加權(quán)減少,結(jié)果產(chǎn)生的網(wǎng)絡(luò)響應(yīng)比其他更平滑。在高斯假設(shè)下,可以應(yīng)用貝葉斯規(guī)則以得到α和β的封閉(closed-form)解(Foresee和Hagan,1997)。
簡而言之,BRN依賴于使用貝葉斯正則化來避免在學(xué)習(xí)期間的過擬和,同時(shí)保留靈活性以學(xué)習(xí)和響應(yīng)于新穎的模式,在這種情況下,我們?cè)谀繕?biāo)函數(shù)中使用三個(gè)因素——誤差、網(wǎng)絡(luò)加權(quán)、就實(shí)際特征維數(shù)而言的模型復(fù)雜度——以用于獲得更大的魯棒性。
線性回歸函數(shù)y=a0+Σn=1Nanxn]]>可以被實(shí)現(xiàn)如下 a^=X\yora^=(X′X+σ2I)-1X′y]]>y^=Xa^]]>再一次,我們使用Tikhonov正則化來找到對(duì)于矩陣逆轉(zhuǎn)問題的魯棒解決方案。
我們接著總結(jié)我們?nèi)绾翁幚眙敯粜詥栴}。1.處理預(yù)測誤差、模型復(fù)雜性和模型參數(shù)的目標(biāo)函數(shù)。2.因變量的變換,以減少動(dòng)態(tài)范圍和定標(biāo)不可容忍的在外(outlier),即成本的平方根而不是線性成本。3.性能分析,包括5折或10折(fold)的交叉驗(yàn)證和全數(shù)據(jù)集訓(xùn)練。4.多模型組合。
實(shí)現(xiàn)示例假設(shè)人類疾病進(jìn)展的多樣性的情況下,我們預(yù)期大量的數(shù)據(jù)不匹配,意味著學(xué)習(xí)算法對(duì)于在訓(xùn)練期間未遇到的狀態(tài)必須魯棒。而且,我們預(yù)期所述問題像在大多數(shù)現(xiàn)實(shí)問題中那樣的非線性的。
在謹(jǐn)慎地考慮了多個(gè)學(xué)習(xí)算法后,我們選定多變量線性回歸和貝葉斯正則化網(wǎng)絡(luò)(BRN)的組合,以尋找兩者之間的一致。線性回歸被選擇,因?yàn)槠湓诖嬖跀?shù)據(jù)不匹配的情況下的魯棒性?;贚-1目標(biāo)函數(shù)的非參數(shù)和邊界判定學(xué)習(xí)算法在下列方面是很有名的,即當(dāng)被強(qiáng)制在它們的適當(dāng)區(qū)域之外運(yùn)行時(shí)產(chǎn)生狂亂的猜測(即在工程中取代內(nèi)插的外插)。
雖然有其相對(duì)于數(shù)據(jù)不匹配的魯棒性,但是線性回歸當(dāng)對(duì)于復(fù)雜、非線性關(guān)系建立模型時(shí)力不從心。為了掩蔽這個(gè)缺陷,我們將線性回歸與貝葉斯正則化網(wǎng)絡(luò)(BRN)組合。而且,為平衡正則化和BIC的概念,我們引入了附加的懲罰項(xiàng)來作為模型復(fù)雜度的函數(shù),以便我們折中在最小化在學(xué)習(xí)期間的預(yù)測誤差的期望和對(duì)于通過泛化(generalization)而相對(duì)于新穎的、未看見的數(shù)據(jù)的魯棒性的需要。
可以通過注意在隨機(jī)交叉驗(yàn)證和全數(shù)據(jù)集訓(xùn)練之間在性能上的差別來確定學(xué)習(xí)的魯棒性,全數(shù)據(jù)集訓(xùn)練一般在實(shí)時(shí)實(shí)現(xiàn)中優(yōu)選,因?yàn)槿藗兿M麑?duì)于盡可能多的數(shù)據(jù)建模。圖3A-H示出了對(duì)兩個(gè)不同的數(shù)據(jù)集運(yùn)行的兩種所選擇的學(xué)習(xí)算法。圖3A-B示出了對(duì)于第一數(shù)據(jù)集的線性回歸,圖3C-D示出了對(duì)于該數(shù)據(jù)集的BRN。圖3B和3D針對(duì)全數(shù)據(jù)集,圖3A和3C是交叉驗(yàn)證。圖3A圖示了在Rsq=0.86358的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3B圖示了在Rsq=0.83052的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3C圖示了在Rsq=0.91497的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3D圖示了在Rsq=0.92077的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3E-F示出了對(duì)于第二數(shù)據(jù)集的線性回歸,圖3G-H示出了對(duì)于該數(shù)據(jù)集的BRN。圖3E圖示了在Rsq=0.58165的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3F圖示了在Rsq=0.56736的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3G圖示了在Rsq=0.59826的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖3H圖示了在Rsq=0.59819的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。如預(yù)期的那樣,在兩個(gè)不同數(shù)據(jù)集上的全數(shù)據(jù)集訓(xùn)練和隨機(jī)交叉驗(yàn)證訓(xùn)練之間的性能差別小,甚至在一些情況下是負(fù)的,這是學(xué)習(xí)魯棒性的實(shí)證。圖4A圖示了在Rsq=0.90001的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。圖4B圖示了在Rsq=0.96846的情況下的預(yù)測(y軸)對(duì)實(shí)際(x軸)的輸出。在這種情況下,所述性能差別相當(dāng)顯著,并且如果使用魯棒的學(xué)習(xí)算法來觀察這種情況,則數(shù)據(jù)不匹配的水平很高。
如果學(xué)習(xí)算法僅僅記憶解決方案而不是泛化,則我們預(yù)期看到所述性能差別更大,如在圖4A-B中所示。圖4A-B示出了多層感知器的記憶效果。圖4B是基于使用最小化L-2函數(shù)的神經(jīng)網(wǎng)絡(luò)的全數(shù)據(jù)集訓(xùn)練的,而圖4A基于交叉驗(yàn)證。
圖5圖示了貝葉斯正則化網(wǎng)絡(luò)(BRN)預(yù)測(y軸)對(duì)多變量線性回歸(MVLR)預(yù)測(x軸),并且示出了在所述兩種學(xué)習(xí)算法一致的同時(shí),如遠(yuǎn)離代表完美一致的直線的多個(gè)散點(diǎn)所示,在一些情況下,它們提供不同的回答。在此,預(yù)測的變量等于使用先前9個(gè)月的索賠和人口數(shù)據(jù)的未來一年成本(醫(yī)療和醫(yī)藥兩者)的平方根。
概括一下,我們依賴于下面的標(biāo)準(zhǔn)來保證我們的解決方案既準(zhǔn)確又魯棒誤差最小化;模型復(fù)雜度最小化;模型加權(quán)最小化以獲得平滑、泛化的響應(yīng);特征排序,以找到收益遞減點(diǎn);在全數(shù)據(jù)集訓(xùn)練和5折/10折交叉驗(yàn)證之間的差別最小化;以及多模型組合。
作為具有葉子特定特征優(yōu)化的分層樹網(wǎng)絡(luò)的實(shí)現(xiàn)示例,我們現(xiàn)在探討一些葉子如何表現(xiàn)不同。
對(duì)于具有災(zāi)難狀況的成員,許多有用特征來自與慢性病狀況——諸如晚期/慢性腎病、癌癥和罕見疾病——相關(guān)聯(lián)的成本趨勢。另一個(gè)感興趣的特征涉及近來的醫(yī)院門診病人趨勢,其中,通常進(jìn)行血液透析。而且,醫(yī)療與Rx成本的比率是重要的,因?yàn)樵谶@個(gè)群體分段中較高Rx成本及對(duì)應(yīng)的低醫(yī)療成本通常歸于較好的健康管理。
有趣地,雖然對(duì)于具有醫(yī)療和Rx受益的那些成員不重要,但是對(duì)于那些對(duì)Humana僅僅具有Rx索賠的那些成員,醫(yī)藥索賠的數(shù)量和除以總的Rx成本的用于慢性病Rx藥療的成本的比率都是重要的。即,依賴于人們所具有的受益方案的類型,特征優(yōu)化算法自動(dòng)選擇最佳的子集。
另一方面,糖尿病成員具有多個(gè)成本驅(qū)動(dòng)器,諸如精神紊亂(近來被診斷慢性病的人們趨向于遭受抑郁和其他精神焦慮)、排瀉(vent)、充血性心力衰竭、內(nèi)分泌、消化和其他并發(fā)癥。一種這樣的指示是在過去9個(gè)月期間的不同的國際疾病分類(International Classification of Disease)代碼、或ICD代碼的編號(hào)。參見所述代碼的第9版本,ICD代碼經(jīng)常被稱為ICD9代碼。
盡管如此,沒有可以先驗(yàn)地用于猜測哪些特征將對(duì)于特定葉子更有效的明顯經(jīng)驗(yàn)法則。為了調(diào)查這個(gè)事項(xiàng),如圖6A-F中所示的,我們研究了一年未來成本的平方根對(duì)如下面的協(xié)變量的多個(gè)二維分散繪圖所服用的獨(dú)特藥的數(shù)量(圖6A);總的Rx成本(圖6B);年齡(圖6C);移植相關(guān)聯(lián)的成本(圖6D);慢性病成本(圖6E);以及冠狀動(dòng)脈病(CAD)成本(圖6F)。如果存在簡單的線性關(guān)系,則可以看到直的、單調(diào)上升的線。不幸的是,我們沒有看到關(guān)于這些特征的任何一個(gè)的這樣的明顯趨勢,這指示沒有簡單的線性視點(diǎn)。
被證明錯(cuò)誤的第一神話是人服用越多的藥,則他或她越可能在未來花費(fèi)更多。圖6A沒有示出這樣的關(guān)系。在圖6B中,總的Rx成本看起來更有可能,雖然我們看到在前半部分中的大點(diǎn)(超過90%的群體),其示出非結(jié)論性(less-than-conclusive)的畫面。圖6C示出了最有風(fēng)險(xiǎn)的年齡組看起來在年齡50-65附近。也可以在圖6C中看到年齡在預(yù)測未來成本上并不有用。對(duì)于在圖6E中的慢性病成本和在圖6F中的CAD成本獲得相同的觀察結(jié)果。即,具有多個(gè)慢性病共病態(tài)狀況不自動(dòng)導(dǎo)致不愉快的未來結(jié)果。這個(gè)觀察總結(jié)了在建立用于預(yù)測未來健康狀態(tài)的預(yù)測模型中固有的困難。
因此,不是將我們頻繁錯(cuò)誤的直覺強(qiáng)加于在預(yù)測模型上或者將所有(包括許多無用的噪聲)投入模型中,我們構(gòu)造分層樹網(wǎng)絡(luò),并且使得優(yōu)化算法大量的特征排序,并且選擇針對(duì)每個(gè)葉子的最佳子集。即,我們讓數(shù)據(jù)告訴我們對(duì)于每個(gè)葉子實(shí)現(xiàn)什么。
本發(fā)明包括基于計(jì)算機(jī)的系統(tǒng),用于預(yù)測人的未來健康狀態(tài),包括a.分層樹網(wǎng)絡(luò),它作為5個(gè)層化變量的函數(shù)將每個(gè)成員分配到30個(gè)節(jié)點(diǎn)之一;b.使用多個(gè)隨機(jī)的和組合優(yōu)化算法對(duì)于每個(gè)節(jié)點(diǎn)選擇特征子集;c.依賴于操作模式的獨(dú)立學(xué)習(xí)和打分模塊;d.算術(shù)平均運(yùn)算器,用于從兩個(gè)學(xué)習(xí)算法尋找一致;e.報(bào)告產(chǎn)生器,用于輸出永久參數(shù)以有助于臨床干預(yù)。在設(shè)計(jì)分層樹網(wǎng)絡(luò)使用5個(gè)有意義的層化變量,以便在數(shù)據(jù)和經(jīng)歷時(shí)段要求上提供全承包(turnkey)方案。即,我們不必?fù)?dān)心僅僅處理具有至少6個(gè)月的索賠經(jīng)歷外加醫(yī)療和Rx數(shù)據(jù)的成員。而且,兩種學(xué)習(xí)算法彼此互補(bǔ),以便我們運(yùn)行在包括模型不匹配對(duì)數(shù)據(jù)不匹配和模型靈活度對(duì)模型復(fù)雜度譜的向量空間的魯棒子空間中。
上面的詳細(xì)說明主要為了理解清楚而給出,不要理解為從其產(chǎn)生不必要的限制,因?yàn)楸绢I(lǐng)域內(nèi)的技術(shù)人員可以在讀取本公開后進(jìn)行修改,并且可以在不脫離本發(fā)明的精神的情況下進(jìn)行修改。
本申請(qǐng)要求2004年4月27日提交的美國臨時(shí)專利申請(qǐng)第60/565,579號(hào)——用于自動(dòng)產(chǎn)生分層樹網(wǎng)絡(luò)并且使用對(duì)于所述分層樹的每個(gè)葉子優(yōu)化的兩種互補(bǔ)學(xué)習(xí)算法的系統(tǒng)和方法——的權(quán)益,其通過引用被包含在此。
權(quán)利要求
1.一種用于預(yù)測人的未來健康狀態(tài)的方法,所述方法包括步驟a.建立作為多個(gè)層化變量的函數(shù)的分層樹網(wǎng)絡(luò),對(duì)于多個(gè)成員,所述分層樹網(wǎng)絡(luò)把每個(gè)成員分配到多個(gè)節(jié)點(diǎn)中的至多僅一個(gè);b.對(duì)于所述多個(gè)成員和對(duì)于每個(gè)所述成員,向基于計(jì)算機(jī)的系統(tǒng)提供成員人口數(shù)據(jù)、可得的成員醫(yī)療索賠數(shù)據(jù)和可得的成員醫(yī)藥索賠數(shù)據(jù);c.對(duì)于所述多個(gè)節(jié)點(diǎn)的每個(gè)執(zhí)行特征選擇,以對(duì)于每個(gè)所述節(jié)點(diǎn)標(biāo)識(shí)來自包括下述項(xiàng)的至少一些的集合的特征的最佳子集針對(duì)于被分配到該所述節(jié)點(diǎn)的所有成員的所述成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)、所述可得的成員醫(yī)藥索賠數(shù)據(jù);d.使用下述項(xiàng)的至少一些來訓(xùn)練MVLR算法和BRN算法所述成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)、所述可得的成員醫(yī)藥索賠數(shù)據(jù),并且在數(shù)據(jù)庫中存儲(chǔ)所學(xué)習(xí)的參數(shù)以建立所學(xué)習(xí)的參數(shù)的數(shù)據(jù)庫;e.使用所述所學(xué)習(xí)的參數(shù)的數(shù)據(jù)庫,以及對(duì)于至少一個(gè)所述成員,使用該至少一個(gè)所述成員的成員人口數(shù)據(jù)、所述可得的成員醫(yī)療索賠數(shù)據(jù)和所述可得的成員醫(yī)藥索賠數(shù)據(jù),使用所述MVLR算法來計(jì)算MVLR未來健康狀態(tài)分?jǐn)?shù)以及使用所述BRN算法來計(jì)算BRN未來健康狀態(tài)分?jǐn)?shù),計(jì)算所述MVLR未來健康狀態(tài)分?jǐn)?shù)和所述BRN未來健康狀態(tài)分?jǐn)?shù)的算術(shù)平均值以確定最終分?jǐn)?shù)。
2.按照權(quán)利要求1的用于預(yù)測人的未來健康狀態(tài)的方法,其中,在確定該最終分?jǐn)?shù)后,所述方法還包括步驟產(chǎn)生成員臨床狀況報(bào)告,所述成員臨床狀況報(bào)告包括成員標(biāo)識(shí)信息和所述最終分?jǐn)?shù)。
3.按照權(quán)利要求2的用于預(yù)測人的未來健康狀態(tài)的方法,其中,所述成員臨床狀況報(bào)告還包括所述成員的臨床狀況數(shù)據(jù)以及所述成員的醫(yī)療索賠信息和醫(yī)藥索賠信息的任何一個(gè)的至少一部分。
4.按照權(quán)利要求1的用于預(yù)測人的未來健康狀態(tài)的方法,其中,在所述建立分層樹網(wǎng)絡(luò)的步驟中,所述多個(gè)層化變量包括下述項(xiàng)的至少一些成員的入會(huì)持續(xù)時(shí)間、成員的存在或沒有災(zāi)難狀況、成員的存在或沒有糖尿病標(biāo)記、具有處方觸發(fā)或住院準(zhǔn)入觸發(fā)的成員、成員索賠數(shù)據(jù)。
5.按照權(quán)利要求4的用于預(yù)測人的未來健康狀態(tài)的方法,其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,則所述成員將被分配到第一節(jié)點(diǎn)集之一;如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,則所述成員將被分配到第二節(jié)點(diǎn)集之一。
6.按照權(quán)利要求5的用于預(yù)測人的未來健康狀態(tài)的方法,其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,并且如果所述成員存在災(zāi)難狀況,則所述成員將被分配到所述第一節(jié)點(diǎn)集的第一子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,則所述成員將被分配到不在所述第一節(jié)點(diǎn)集的所述第一子集中的所述第一節(jié)點(diǎn)集之一,所述不在所述第一節(jié)點(diǎn)集的所述第一子集中的所述第一節(jié)點(diǎn)集的所述之一包括所述第一節(jié)點(diǎn)集的第二子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員存在災(zāi)難條件,則所述成員將被分配到所述第二節(jié)點(diǎn)集的第一子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,則所述成員將被分配到不在所述第二節(jié)點(diǎn)集的所述第一子集中的所述第二節(jié)點(diǎn)集之一,所述不在所述第二節(jié)點(diǎn)集的所述第一子集中的所述第二節(jié)點(diǎn)集之一包括所述第二節(jié)點(diǎn)集的第二子集。
7.按照權(quán)利要求6的用于預(yù)測人的未來健康狀態(tài)的方法,其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員具有糖尿病標(biāo)記,并且如果所述成員具有處方觸發(fā),則所述成員被分配到所述第一節(jié)點(diǎn)集的所述第二子集的第一子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員具有糖尿病標(biāo)記,并且如果所述成員具有住院準(zhǔn)入觸發(fā),則所述成員被分配到所述第一節(jié)點(diǎn)集的所述第二子集的第二子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員沒有糖尿病標(biāo)記,并且如果所述成員具有處方觸發(fā),則所述成員被分配到所述第一節(jié)點(diǎn)集的所述第二子集的第三子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間小于6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員沒有糖尿病標(biāo)記,并且如果所述成員具有住院準(zhǔn)入觸發(fā),則所述成員被分配到所述第一節(jié)點(diǎn)集的所述第二子集的第四子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員具有糖尿病標(biāo)記,并且如果所述成員具有處方觸發(fā),則所述成員被分配到所述第二節(jié)點(diǎn)集的所述第二子集的第一子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員具有糖尿病標(biāo)記,并且如果所述成員具有住院準(zhǔn)入觸發(fā),則所述成員被分配到所述第二節(jié)點(diǎn)集的所述第二子集的第二子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員沒有糖尿病標(biāo)記,并且如果所述成員具有處方觸發(fā),則所述成員被分配到所述第二節(jié)點(diǎn)集的所述第二子集的第三子子集;其中,如果所述成員的入會(huì)持續(xù)時(shí)間是至少6個(gè)月,并且如果所述成員沒有災(zāi)難狀況,并且如果所述成員沒有糖尿病標(biāo)記,并且如果所述成員具有住院準(zhǔn)入觸發(fā),則所述成員被分配到所述第二節(jié)點(diǎn)集的所述第二子集的第四子子集。
8.按照權(quán)利要求7的用于預(yù)測人的未來健康狀態(tài)的方法,其中,所述第一節(jié)點(diǎn)集的所述第一子集、所述第一節(jié)點(diǎn)集的所述第二子集的所述第一子子集、所述第一節(jié)點(diǎn)集的所述第二子集的所述第二子子集、所述第一節(jié)點(diǎn)集的所述第二子集的所述第三子子集、所述第一節(jié)點(diǎn)集的所述第二子集的所述第四子子集、所述第二節(jié)點(diǎn)集的所述第一子集、所述第二節(jié)點(diǎn)集的所述第二子集的所述第一子子集、所述第二節(jié)點(diǎn)集的所述第二子集的所述第二子子集、所述第二節(jié)點(diǎn)集的所述第二子集的所述第三子子集、所述第二節(jié)點(diǎn)集的所述第二子集的所述第四子子集每個(gè)包括第一節(jié)點(diǎn),其中,所述成員具有醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者;第二節(jié)點(diǎn),其中,所述成員僅僅具有醫(yī)療索賠數(shù)據(jù);第三節(jié)點(diǎn),其中,所述成員僅僅具有醫(yī)藥索賠數(shù)據(jù)。
9.按照權(quán)利要求4的用于預(yù)測人的未來健康狀態(tài)的方法,其中,如果成員具有下述項(xiàng)的至少一個(gè),則所述成員將存在災(zāi)難狀況任何癌癥、晚期疾病、移植、罕見疾病、艾滋病、冠狀動(dòng)脈病外加慢性心臟病外加高血壓的組合。
10.按照權(quán)利要求1的用于預(yù)測人的未來健康狀態(tài)的方法,其中,所述分層樹網(wǎng)絡(luò)的所述多個(gè)節(jié)點(diǎn)包括30個(gè)節(jié)點(diǎn),a.第一節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;b.第二節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;c.第三節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;d.第四節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;e.第五節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;f.第六節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;g.第七節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;h.第八節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;i.第九節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;j.第十節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;k.第十一節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;l.第十二節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;m.第十三節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;n.第十四節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;o.第十五節(jié)點(diǎn),針對(duì)具有少于6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;p.第十六節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;q.第十七節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;r.第十八節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、存在災(zāi)難狀況以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;s.第十九節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;t.第二十節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;u.第二十一節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;v.第二十二節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;w.第二十三節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;x.第二十四節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、存在糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;y.第二十五節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;z.第二十六節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;aa.第二十七節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在處方觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員;bb.第二十八節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及醫(yī)藥和醫(yī)療索賠數(shù)據(jù)兩者的任何成員;cc.第二十九節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)藥索賠數(shù)據(jù)的任何成員;dd.第三十節(jié)點(diǎn),針對(duì)具有至少6個(gè)月的入會(huì)持續(xù)時(shí)間、沒有災(zāi)難狀況、沒有糖尿病觸發(fā)、存在住院準(zhǔn)入觸發(fā)以及僅僅醫(yī)療索賠數(shù)據(jù)的任何成員。
11.按照權(quán)利要求10的用于預(yù)測人的未來健康狀態(tài)的方法,其中,在確定最終分?jǐn)?shù)后,所述方法還包括步驟產(chǎn)生成員臨床狀況報(bào)告,所述成員臨床狀況報(bào)告包括成員標(biāo)識(shí)信息和所述最終分?jǐn)?shù)。
12.按照權(quán)利要求11的用于預(yù)測人的未來健康狀態(tài)的方法,其中,所述成員臨床狀況報(bào)告還包括所述成員的臨床狀況數(shù)據(jù)以及所述成員的醫(yī)療索賠信息和醫(yī)藥索賠信息的任何一個(gè)的至少一部分。
13.按照權(quán)利要求10的用于預(yù)測人的未來健康狀態(tài)的方法,其中,如果所述成員具有下述項(xiàng)的至少一個(gè),則所述成員將存在災(zāi)難狀況任何癌癥、晚期疾病、移植、罕見疾病、艾滋病、冠狀動(dòng)脈病外加慢性心臟病外加高血壓的組合。
全文摘要
一種系統(tǒng)和方法,用于產(chǎn)生分層樹網(wǎng)絡(luò),并且使用線性加非線性學(xué)習(xí)算法來形成關(guān)于成員的健康狀態(tài)的一致視圖。在所述分層樹網(wǎng)絡(luò)中的每個(gè)葉子在臨床特點(diǎn)、經(jīng)歷時(shí)段和可用數(shù)據(jù)資產(chǎn)上同質(zhì)。對(duì)于每個(gè)葉子執(zhí)行優(yōu)化,以便可以對(duì)于每個(gè)葉子特有的本地特點(diǎn)定制特征和學(xué)習(xí)算法。
文檔編號(hào)G06Q40/00GK101076825SQ200580021215
公開日2007年11月21日 申請(qǐng)日期2005年4月27日 優(yōu)先權(quán)日2004年4月27日
發(fā)明者戴維·H·基爾, 戴維·B·波特施米特 申請(qǐng)人:赫馬納股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
连云港市| 宝山区| 安平县| 明溪县| 禹城市| 盘锦市| 报价| 太白县| 沧源| 上杭县| 民乐县| 微山县| 丰台区| 青冈县| 西畴县| 香港| 郴州市| 库车县| 沂水县| 应城市| 许昌市| 进贤县| 新龙县| 襄汾县| 长葛市| 冕宁县| 儋州市| 双柏县| 朝阳市| 普陀区| 治多县| 乌恰县| 新昌县| 巴彦淖尔市| 民勤县| 饶阳县| 化州市| 洛阳市| 莱西市| 石台县| 库伦旗|