1.一種基于boruta算法的多層次老年人體能狀態(tài)量化等級(jí)計(jì)算方法,其特征在于,所述方法包括以下步驟:
步驟1,根據(jù)步速由高到低的順序?qū)夏耆诉M(jìn)行人群劃分,共分為四個(gè)子人群:前25%為較高步速人群(A人群)、中間狀態(tài)25%-75%為普通步速人群(B人群)、最后25%為較低步速人群(C人群)和未分層的全部人群,同時(shí)標(biāo)定各子人群;
步驟2,對(duì)步驟1獲得的四個(gè)子人群,應(yīng)用boruta算法,計(jì)算各屬性對(duì)老年人步速的影響程度,基于屬性重要性排序和專(zhuān)家經(jīng)驗(yàn)確定老年人步速的重要屬性;
步驟3,基于老年人步速的重要屬性,構(gòu)建A-B邏輯回歸模型和B-C邏輯回歸模型,計(jì)算不同人群體能狀態(tài)較好判別概率,并構(gòu)建老年人體能狀態(tài)量化等級(jí)計(jì)算模型;
步驟4,基于A-B邏輯回歸模型和B-C邏輯回歸模型,通過(guò)共同決策方法,完成老年人體能狀態(tài)等級(jí)評(píng)定,計(jì)算老年人體能狀態(tài)量化等級(jí)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述老年人體能狀態(tài)關(guān)鍵影響因素提取的步驟具體包括:
步驟1,根據(jù)人群劃分結(jié)果對(duì)各個(gè)子人群進(jìn)行標(biāo)定,其中較高步速人群標(biāo)為0,普通步速人群標(biāo)為1,較低步速人群標(biāo)為2,獲得標(biāo)定后的數(shù)據(jù)S;
步驟2,設(shè)定參數(shù),對(duì)步驟1獲得的數(shù)據(jù)集S創(chuàng)建混合副本屬性,并進(jìn)行重排,得到重組數(shù)據(jù)集S',為給定的數(shù)據(jù)集增加隨機(jī)性;
步驟3,在數(shù)據(jù)集S'的基礎(chǔ)上,采用bootstrap方式抽取樣本集D,未被抽取到的作為袋外數(shù)據(jù)D',構(gòu)建包含m棵樹(shù)的隨機(jī)森林;
步驟4,訓(xùn)練分類(lèi)回歸樹(shù),并計(jì)算每棵樹(shù)對(duì)應(yīng)袋外數(shù)據(jù)的均方殘差MSEt,其中t(0<t≤m),則m棵樹(shù)的原始袋外數(shù)據(jù)均方殘差向量可以表示為[MSE1,MSE2,...,MSEm];
步驟5,基于步驟3得到的原始袋外數(shù)據(jù)均方殘差向量[MSE1,MSE2,...,MSEm],計(jì)算對(duì)應(yīng)屬性的Z值,篩選Z值最大的副本屬性,以及比該屬性數(shù)值更大的屬性,融合得到重要屬性,將比該屬性數(shù)值小的屬性歸為非重要屬性,刪除非重要屬性及副本屬性;
步驟6,重復(fù)執(zhí)行步驟2.1至步驟2.4,到達(dá)到預(yù)設(shè)終止條件為止;
步驟7,根據(jù)boruta算法的計(jì)算結(jié)果,將針對(duì)各人群提取出的前30名重要屬性中出現(xiàn)兩次及以上的屬性作為該人群的重要屬性,依照一定規(guī)則并結(jié)合專(zhuān)家意見(jiàn)確定老年人步速的重要屬性。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述老年人體能狀態(tài)量化等級(jí)計(jì)算步驟具體包括:
步驟1,利用后驗(yàn)概率P(y=1|X)對(duì)m條n維的訓(xùn)練樣本進(jìn)行二元分類(lèi),構(gòu)建邏輯回歸模型,采用最大似然估計(jì)方法計(jì)算各屬性系數(shù),回歸方程如下:
f(x)=b0+b1x1+b2x2+...+bnxn
步驟2,以最大化敏感性與特異性之和為原則,參考理論最佳切點(diǎn),結(jié)合各重要屬性的系數(shù)、標(biāo)準(zhǔn)誤差、自由度、P值、OR值,確定各模型的最終切點(diǎn)值,提高該模型的擬合程度;
步驟3,采用邏輯回歸算法訓(xùn)練邏輯回歸模型,以A人群與B人群、B人群與C人群為訓(xùn)練集得到兩種回歸方程,即A-B邏輯回歸方程與B-C邏輯回歸方程,其中A-B邏輯回歸方程的輸出為某樣本判為A類(lèi)的概率,B-C邏輯回歸方程的輸出為某樣本判為B類(lèi)的概率;
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述老年人體能狀態(tài)量化等級(jí)評(píng)定的步驟具體包括:
步驟1,通過(guò)A-B邏輯回歸模型完成A人群的量化等級(jí)計(jì)算,將較高步速人群(A人群)分為較高步速人群中體能狀態(tài)較好人群(A1)和較高步速人群中體能狀態(tài)較差人群(A2);
步驟2,通過(guò)B-C邏輯回歸模型完成C人群的量化等級(jí)計(jì)算,將較低步速人群(C人群)分為較低步速人群中體能狀態(tài)較好人群(C1)和較低步速人群中體能狀態(tài)較差人群(C2);
步驟3,計(jì)算B人群的量化等級(jí)需要完成A-B邏輯回歸模型和B-C邏輯回歸模型共同決策,最終得到普通步速人群中體能狀態(tài)較好人群(B1)、普通步速人群中體能狀態(tài)一般人群(B2)和普通步速人群中體能狀態(tài)較差人群(B2)。