本發(fā)明涉及醫(yī)療保健信息,具體涉及一種中醫(yī)證候智能辨識(shí)方法、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、中醫(yī)理論中的證,也叫證候,是機(jī)體在疾病過程中某一階段或某一類型的病理概括,是中醫(yī)學(xué)中對(duì)疾病狀態(tài)的綜合描述。證候的辨識(shí)就是將中醫(yī)四診(望聞問切)所收集的癥狀和體征等。
2、相關(guān)技術(shù)中,基于隨機(jī)森林算法進(jìn)行決策樹構(gòu)建,并實(shí)現(xiàn)智能化的證候辨識(shí)效果,但由于隨機(jī)森林算法的原理是通過隨機(jī)抽樣的若干個(gè)樣本以及隨機(jī)組合的若干個(gè)特征訓(xùn)練多個(gè)決策樹,將多個(gè)決策樹組合起來構(gòu)成隨機(jī)森林。最終構(gòu)成的隨機(jī)森林中每個(gè)決策樹的對(duì)輸出結(jié)果的影響權(quán)重是相同的。但不同癥狀與證候的關(guān)聯(lián)性是不同的,而構(gòu)建隨機(jī)森林時(shí)每個(gè)決策樹的癥狀是隨機(jī)選取的,因此直接構(gòu)建決策樹并進(jìn)行證候辨識(shí)的準(zhǔn)確性與可靠性較低。
技術(shù)實(shí)現(xiàn)思路
1、為了解決相關(guān)技術(shù)中構(gòu)建決策樹并進(jìn)行證候辨識(shí)的準(zhǔn)確性與可靠性較低的技術(shù)問題,本發(fā)明提供一種中醫(yī)證候智能辨識(shí)方法、系統(tǒng)及存儲(chǔ)介質(zhì),所采用的技術(shù)方案具體如下:
2、本發(fā)明提出了一種中醫(yī)證候智能辨識(shí)方法,方法包括:
3、獲取被診斷者四診病歷的訓(xùn)練樣本數(shù)據(jù),確定所述訓(xùn)練樣本數(shù)據(jù)屬于目標(biāo)證候的目標(biāo)樣本數(shù)據(jù);獲取訓(xùn)練樣本數(shù)據(jù)中的癥狀表現(xiàn)類別,從所有所述癥狀表現(xiàn)類別中任選一種待分析癥狀;
4、針對(duì)任一目標(biāo)樣本數(shù)據(jù),根據(jù)所述目標(biāo)樣本數(shù)據(jù)中的其他證候種類,以及屬于其他證候的待分析癥狀的出現(xiàn)頻次,確定所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù);根據(jù)所述待分析癥狀在所述目標(biāo)樣本數(shù)據(jù)中出現(xiàn)的頻次,以及所有所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù),確定所述待分析癥狀的目標(biāo)相關(guān)系數(shù);確定待分析癥狀在構(gòu)建決策樹的信息增益指標(biāo);根據(jù)所述目標(biāo)相關(guān)系數(shù)和信息增益指標(biāo),對(duì)待分析癥狀進(jìn)行決策樹構(gòu)建;
5、根據(jù)訓(xùn)練樣本數(shù)據(jù)與目標(biāo)樣本數(shù)據(jù)中出現(xiàn)任意兩種癥狀表現(xiàn)類別的頻次,以及對(duì)應(yīng)兩種癥狀表現(xiàn)類別的目標(biāo)相關(guān)系數(shù),確定兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù);基于任一決策樹中任意兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù),以及所有癥狀針對(duì)目標(biāo)證候的目標(biāo)相關(guān)系數(shù),確定決策樹的決策權(quán)重;
6、根據(jù)所述決策權(quán)重對(duì)每一決策樹進(jìn)行決策加權(quán),構(gòu)建證候辨識(shí)模型,根據(jù)所述證候辨識(shí)模型進(jìn)行四診病歷的證候智能辨識(shí)。
7、進(jìn)一步地,確定所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù),包括:
8、確定其他證候中出現(xiàn)待分析癥狀的頻次和值;
9、將所述目標(biāo)樣本數(shù)據(jù)中的證候種類數(shù)量與頻次和值的乘積,將該乘積的相反數(shù)進(jìn)行歸一化處理,作為所述頻數(shù)調(diào)節(jié)參數(shù)。
10、進(jìn)一步地,根據(jù)所述待分析癥狀在所述目標(biāo)樣本數(shù)據(jù)中出現(xiàn)的頻次,以及所有所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù),確定所述待分析癥狀的目標(biāo)相關(guān)系數(shù),包括:
11、將所有所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù)的均值,作為待分析癥狀的整體調(diào)節(jié)參數(shù);
12、將所述待分析癥狀在所述目標(biāo)樣本數(shù)據(jù)中出現(xiàn)的頻次與整體調(diào)節(jié)參數(shù)的乘積歸一化處理,得到所述待分析癥狀的目標(biāo)相關(guān)系數(shù)。
13、進(jìn)一步地,確定待分析癥狀在構(gòu)建決策樹的信息增益指標(biāo),包括:
14、基于id3算法,將決策樹的訓(xùn)練集的熵,與給定待分析癥狀下決策樹的訓(xùn)練集的熵的差值,作為信息增益指標(biāo)。
15、進(jìn)一步地,根據(jù)所述目標(biāo)相關(guān)系數(shù)和信息增益指標(biāo),對(duì)待分析癥狀進(jìn)行決策樹構(gòu)建,包括:
16、計(jì)算所述目標(biāo)相關(guān)系數(shù)與信息增益指標(biāo)的乘積,歸一化處理作為決策樹中用于訓(xùn)練的待分析癥狀的劃分權(quán)重;
17、獲取待訓(xùn)練的決策樹中所有癥狀的劃分權(quán)重,將所有癥狀中劃分權(quán)重最大的作為第一層構(gòu)建決策樹,進(jìn)而計(jì)算除已經(jīng)參與構(gòu)建決策樹的剩下所有癥狀的劃分權(quán)重,將最大的作為第二層,以此類推完成決策樹的構(gòu)建。
18、進(jìn)一步地,所述確定兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù),包括:
19、將兩種癥狀表現(xiàn)類別的目標(biāo)相關(guān)系數(shù)的和值,作為第一相關(guān)影響指標(biāo);
20、基于兩種癥狀共同出現(xiàn)的頻次占比與單獨(dú)出現(xiàn)的頻次占比,確定兩種癥狀組合出現(xiàn)的第二相關(guān)影響指標(biāo);
21、計(jì)算所述第一相關(guān)影響指標(biāo)和第二相關(guān)影響指標(biāo)的乘積,進(jìn)行最大最小值歸一化處理得到組合相關(guān)系數(shù)。
22、進(jìn)一步地,所述第二相關(guān)影響指標(biāo)對(duì)應(yīng)的計(jì)算公式為:
23、式中,表示第i類癥狀與第v類癥狀的第二相關(guān)影響指標(biāo),表示第i類癥狀與第v類癥狀同時(shí)在所有目標(biāo)樣本數(shù)據(jù)出現(xiàn)的頻次,表示第i類癥狀與第v類癥狀同時(shí)在所有訓(xùn)練樣本數(shù)據(jù)出現(xiàn)的頻次,表示第i類癥狀在所有目標(biāo)樣本數(shù)據(jù)出現(xiàn)的頻次,表示第v類癥狀在所有目標(biāo)樣本數(shù)據(jù)出現(xiàn)的頻次,表示第i類癥狀在所有訓(xùn)練樣本數(shù)據(jù)出現(xiàn)的頻次,表示第v類癥狀在所有訓(xùn)練樣本數(shù)據(jù)出現(xiàn)的頻次。
24、進(jìn)一步地,所述基于任一決策樹中任意兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù),以及所有癥狀的目標(biāo)相關(guān)系數(shù),確定決策樹的決策權(quán)重,包括:
25、將同一決策樹中所有癥狀的目標(biāo)相關(guān)系數(shù)的均值,作為第一權(quán)重指標(biāo);
26、將同一決策樹中任意兩種癥狀的所有組合所對(duì)應(yīng)組合相關(guān)系數(shù)的均值,作為第二權(quán)重指標(biāo);
27、計(jì)算第一權(quán)重指標(biāo)與第二權(quán)重指標(biāo)的乘積,并基于premnmx函數(shù)將其映射至[-1,1]之間,得到?jīng)Q策權(quán)重。
28、另一方面,本發(fā)明還提供了一種中醫(yī)證候智能辨識(shí)系統(tǒng),所述系統(tǒng)包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如前述一種中醫(yī)證候智能辨識(shí)方法的步驟。
29、另一方面,本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)前述一種中醫(yī)證候智能辨識(shí)方法的步驟。
30、本發(fā)明具有如下有益效果:
31、本發(fā)明實(shí)施例中,針對(duì)相關(guān)技術(shù)中構(gòu)成的隨機(jī)森林中每個(gè)決策樹的對(duì)輸出結(jié)果的影響權(quán)重是相同的,進(jìn)而導(dǎo)致證候辨識(shí)的準(zhǔn)確性與可靠性較低的問題,本方案通過頻次分析確定每一癥狀對(duì)每一證候的目標(biāo)相關(guān)系數(shù),進(jìn)而實(shí)現(xiàn)決策樹構(gòu)建;而后,通過兩種癥狀的組合,以及決策樹中所有癥狀針對(duì)證候的目標(biāo)相關(guān)系數(shù),確定決策樹的決策權(quán)重,該決策權(quán)重即為對(duì)應(yīng)決策樹本身在進(jìn)行決策分析時(shí)的權(quán)重信息,通過決策權(quán)重對(duì)每一決策樹進(jìn)行決策加權(quán),構(gòu)建證候辨識(shí)模型,從而能夠?qū)Σ煌瑳Q策樹賦予不同權(quán)重,獲取更準(zhǔn)確的隨機(jī)森林輸出結(jié)果,以提升證候智能辨識(shí)的準(zhǔn)確性與可靠性。
1.一種中醫(yī)證候智能辨識(shí)方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,確定所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù),包括:
3.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,根據(jù)所述待分析癥狀在所述目標(biāo)樣本數(shù)據(jù)中出現(xiàn)的頻次,以及所有所述目標(biāo)樣本數(shù)據(jù)中待分析癥狀的頻數(shù)調(diào)節(jié)參數(shù),確定所述待分析癥狀的目標(biāo)相關(guān)系數(shù),包括:
4.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,確定待分析癥狀在構(gòu)建決策樹的信息增益指標(biāo),包括:
5.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,根據(jù)所述目標(biāo)相關(guān)系數(shù)和信息增益指標(biāo),對(duì)待分析癥狀進(jìn)行決策樹構(gòu)建,包括:
6.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,所述確定兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù),包括:
7.如權(quán)利要求6所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,所述第二相關(guān)影響指標(biāo)對(duì)應(yīng)的計(jì)算公式為:
8.如權(quán)利要求1所述的一種中醫(yī)證候智能辨識(shí)方法,其特征在于,所述基于任一決策樹中任意兩種癥狀表現(xiàn)類別的組合相關(guān)系數(shù),以及所有癥狀的目標(biāo)相關(guān)系數(shù),確定決策樹的決策權(quán)重,包括:
9.一種中醫(yī)證候智能辨識(shí)系統(tǒng),所述系統(tǒng)包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1~8任意一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1~8任意一項(xiàng)所述一種中醫(yī)證候智能辨識(shí)方法的步驟。