本發(fā)明屬于臨床及生物醫(yī)學(xué),具體涉及一種慢性阻塞性肺疾病重癥患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)及預(yù)判方法。
背景技術(shù):
1、慢性阻塞性肺疾病(慢阻肺,copd)是一種常見的慢性呼吸系統(tǒng)疾病,不僅患病率高且疾病負(fù)擔(dān)重。copd急性加重是copd發(fā)展過程中常見的急性事件,與copd患者肺功能的減退、生命質(zhì)量的下降、醫(yī)療支出的增加、死亡風(fēng)險的上升密切相關(guān)。因此,如何減少急性加重的發(fā)生和防止后續(xù)事件的影響被納入為copd重要的治療目標(biāo)之一。臨床上,多種下呼吸道感染(lrti)是copd急性加重發(fā)生的主要原因,其中細(xì)菌感染十分常見且影響巨大。因此,抗菌藥物在急性加重的治療中具有舉足輕重的地位。而長期使用抗菌藥物和糖皮質(zhì)類激素還容易引起真菌感染,因此,真菌也是copd患者lrti常見的微生物類型之一。
2、目前,臨床工作中對患者lrti進(jìn)行診斷、治療的首要任務(wù),就是要明確致病微生物的類型。細(xì)胞學(xué)樣本的微生物培養(yǎng)作為臨床常規(guī)檢測手段之一,常被作為檢測各類細(xì)菌與真菌感染的首要檢測方式。除罕見種類外,通過細(xì)胞學(xué)標(biāo)本檢測可準(zhǔn)確地診斷出絕大多數(shù)細(xì)菌和真菌感染。然而,各種細(xì)菌與真菌的生長速度從1-3天到2-3周不等,這在極大程度上影響了微生物培養(yǎng)的周轉(zhuǎn)時間(turn-around?time,tat)。對于重癥患者的臨床治療通常要在尚未明確判斷病原體的情況下,對lrti的初始治療做出快速決策。因此,在實(shí)際工作中,lrti的初始治療主要依靠臨床醫(yī)師的經(jīng)驗(yàn)性判斷。
3、但是,這種經(jīng)驗(yàn)性判斷常伴隨著抗菌藥物的不當(dāng)使用和/或過度使用,增加了感染、傳播多重耐藥菌的風(fēng)險。不僅會使copd患者的治療效果受到明顯的負(fù)面影響,還對其他人群的健康構(gòu)成普遍威脅,造成多方面、多水平的嚴(yán)重影響。對于病原體方面,抗菌藥物的不當(dāng)使用和/或過度使用會增加病原體的自然選擇壓力,導(dǎo)致病原體產(chǎn)生耐藥性并不斷增加,進(jìn)而出現(xiàn)被坊間稱為超級病菌(superbugs)的多重耐藥菌。對于治療方面,病原體耐藥性的不斷發(fā)展導(dǎo)致眾多一線藥物逐漸失效,抗感染治療面臨的挑戰(zhàn)日益增加,而新藥研發(fā)工作進(jìn)展緩慢。在患者個體水平,抗菌藥物的不當(dāng)使用和/或過度使用常伴隨著藥物不良事件的發(fā)生,包括累及皮膚及皮下組織等器官系統(tǒng)的過敏反應(yīng),以及正常菌群紊亂后以腸道癥狀為主的艱難梭菌感染等。
4、為了有效控制上述問題,實(shí)現(xiàn)對lrti的快速預(yù)判,學(xué)界眾多研究通常分為兩個方向。第一個方向是通過大量臨床實(shí)踐和研究,總結(jié)lrti的診斷與治療經(jīng)驗(yàn),不斷形成領(lǐng)域內(nèi)新的權(quán)威性共識,完善與更新專業(yè)知識體系。依靠循證醫(yī)學(xué)知識的臨床決策具有較高的準(zhǔn)確性,但是臨床經(jīng)驗(yàn)的產(chǎn)生常需要大量實(shí)踐和研究的積累,相關(guān)知識與共識往往需要通過半結(jié)構(gòu)化訪談、delphi調(diào)查等方法實(shí)現(xiàn)更新,過程中需要專家學(xué)者們付出大量的時間與精力,無法及時應(yīng)對病原體耐藥性的快速發(fā)展。隨著醫(yī)療衛(wèi)生大數(shù)據(jù)的不斷積累,以機(jī)器學(xué)習(xí)為核心的生物醫(yī)學(xué)預(yù)測技術(shù)日益成熟,利用感染預(yù)測模型輔助醫(yī)務(wù)人員實(shí)現(xiàn)臨床快速診斷的第二大方向應(yīng)運(yùn)而生。
5、但值得注意的是,臨床工作中對于lrti的經(jīng)驗(yàn)性治療(尤其是對重癥患者)多采用覆蓋多種感染類別的廣譜抗菌藥物。這使得病原體耐藥性不斷增加而一線抗感染藥物逐漸失效的風(fēng)險進(jìn)一步增加,亟需可以實(shí)現(xiàn)多種感染類別預(yù)判的輔助工具。然而,目前鮮有預(yù)測模型可實(shí)現(xiàn)對copd重癥患者多種lrti類別的同步快速預(yù)判。
6、目前,感染相關(guān)的預(yù)測模型通常具有如下特點(diǎn):(1)個性化的應(yīng)用場景:narayana等人開發(fā)的感染模型僅適用于預(yù)判復(fù)發(fā)型腎病綜合征患者感染的場景,li等人開發(fā)的模型僅適用于預(yù)判3歲以下患兒泌尿道感染的場景,zhang等人開發(fā)的模型僅適用于預(yù)判心血管術(shù)后患者繼發(fā)感染的場景;(2)聚焦于特定感染類別:eickelberg等人開發(fā)了危重患者細(xì)菌感染的預(yù)測模型,wei等人開發(fā)了呼吸科住院患者多重耐藥菌感染的預(yù)測模型,han等人開發(fā)了copd急性加重患者真菌感染的預(yù)測模型;(3)聚焦于特定種屬的病原體:shahin等人開發(fā)的模型用于預(yù)判危重癥患者是否感染念珠菌屬真菌,kim等人的研究聚焦于預(yù)判產(chǎn)生超廣譜β內(nèi)酰胺酶(esbl)的大腸桿菌和克雷伯氏菌。
7、因此,本領(lǐng)域亟需構(gòu)建多標(biāo)簽機(jī)器學(xué)習(xí)為基礎(chǔ)的交互式?jīng)Q策支持系統(tǒng),輔助臨床醫(yī)務(wù)人員進(jìn)行copd重癥患者下呼吸道多種類別感染的同步快速診斷。
技術(shù)實(shí)現(xiàn)思路
1、為此,本發(fā)明所要解決的技術(shù)問題在于提供一種慢性阻塞性肺疾病重癥患者下呼吸道感染臨床輔助預(yù)判系統(tǒng);
2、本發(fā)明所要解決的第二個技術(shù)問題在于提供一種慢性阻塞性肺疾病重癥患者下呼吸道感染臨床輔助預(yù)判方法。
3、為解決上述技術(shù)問題,本發(fā)明所述的一種copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),所述系統(tǒng)包括多標(biāo)簽臨床預(yù)測模型;
4、所述多標(biāo)簽臨床預(yù)測模型基于多模型多標(biāo)簽特征篩選(mmfs)開放式算法框架以及復(fù)合型多標(biāo)簽不平衡數(shù)據(jù)處理(cmidp)算法框架構(gòu)建的多標(biāo)簽臨床預(yù)測模型。
5、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),所述下呼吸道感染包括下呼吸道的革蘭氏陰性細(xì)菌(gnb)感染、革蘭氏陽性細(xì)菌(gpb)感染、多重耐藥菌(mdro)感染和/或真菌(fungi)感染。
6、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),所述多標(biāo)簽臨床預(yù)測模型的預(yù)測指標(biāo)包括年齡、白蛋白(alb)、bt、天門冬氨酸氨基轉(zhuǎn)移酶與丙氨酸氨基轉(zhuǎn)移酶比值(ast/alt)、嗜酸性粒細(xì)胞(eos)、中性粒細(xì)胞(neu)、堿性磷酸酶(alp)、白細(xì)胞(wbc)、天門冬氨酸氨基轉(zhuǎn)移酶(ast)、紅細(xì)胞比容(hct)、乳酸脫氫酶(ldh)、尿素氮(bun)、血糖(glu)、凝血酶原時間(pt)、血氯(cl-)、血鈣(ca2+)、sb、pao2、paco2、ph、tco2、氧飽和度(sao2)、體質(zhì)指數(shù)(bmi)、c-反應(yīng)蛋白(crp)和淋巴細(xì)胞(lym)。
7、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),所述多標(biāo)簽臨床預(yù)測模型的預(yù)測效果評價指標(biāo)包括基于示例(example-based)和基于標(biāo)簽(label-based)的兩類指標(biāo);其中,
8、基于示例的評價指標(biāo)包括hamming?loss、zero-one?loss、samples-precision、samples-recall、samples-f1?score;
9、基于標(biāo)簽的評價指標(biāo)包括micro-auc、macro-auc、micro-ap、macro-ap。
10、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),所述系統(tǒng)的預(yù)判結(jié)果包括對lrti類別的同步預(yù)判,并顯示相應(yīng)類別的陽性預(yù)判概率;
11、所述lrti類別包括下呼吸道的革蘭氏陰性細(xì)菌(gnb)感染、革蘭氏陽性細(xì)菌(gpb)感染、多重耐藥菌(mdro)感染和/或真菌(fungi)感染。
12、本發(fā)明還公開了一種如所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)的構(gòu)建方法,包括如下步驟:
13、(1)選取所述系統(tǒng)關(guān)注的感染類別并進(jìn)行不同感染類別間偏相關(guān)網(wǎng)絡(luò)分析;
14、(2)采集患者的臨床信息,并將患者劃分成開發(fā)樣本和驗(yàn)證樣本,進(jìn)行后續(xù)數(shù)據(jù)處理和建模分析;
15、(3)對全部患者數(shù)據(jù)進(jìn)行缺失情況分析與缺失值填補(bǔ),并采用多模型多標(biāo)簽特征篩選(mmfs)開放式算法框架對模型特征(即預(yù)測變量)進(jìn)行篩選,并確定用于預(yù)測的指標(biāo);
16、(4)在開發(fā)樣本基礎(chǔ)上采用復(fù)合型多標(biāo)簽不平衡數(shù)據(jù)處理(cmidp)算法框架進(jìn)行多標(biāo)簽類別不平衡數(shù)據(jù)處理,降低數(shù)據(jù)不平衡性從而得到優(yōu)化模型;
17、(5)基于所述優(yōu)化模型并結(jié)合shap個體可解釋性技術(shù)進(jìn)行模型構(gòu)建。
18、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)的構(gòu)建方法,所述步驟(2)中,患者的臨床信息包括一般情況、臨床診斷、體格檢查、實(shí)驗(yàn)室檢查和/或微生物培養(yǎng)信息。
19、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)的構(gòu)建方法,所述步驟(3)中:
20、所述缺失情況分析步驟采用little’s?mcar和偏相關(guān)分析檢驗(yàn)?zāi)P停?/p>
21、所述多模型多標(biāo)簽特征篩選(mmfs)開放式算法框架步驟基于scikit-learn利用python進(jìn)行搭建,并以遞歸特征消除(rfe)和排列特征重要性(pfi)算法為基礎(chǔ),對各標(biāo)簽計算所有特征的個性化特征重要性值,并將所有標(biāo)簽的加權(quán)個性化特征重要性值的均數(shù)作為共性化特征重要性值。
22、具體的,所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)的構(gòu)建方法,所述步驟(4)中,所述多標(biāo)簽類別不平衡處理步驟利用remedial、mlsmote、mltl三種基礎(chǔ)算法提出cmidp算法框架,并形成remlsmotl、remlsmote、remltl、mlsmotl四拓展算法。
23、本發(fā)明還公開了一種copd患者下呼吸道感染臨床輔助預(yù)判方法,包括采集待測患者的臨床信息的步驟,以及,利用所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng)進(jìn)行預(yù)測的步驟。
24、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),使用mimic-iv數(shù)據(jù)庫,納入符合納排標(biāo)準(zhǔn)的copd重癥住院患者,采集2008至2019年研究對象疑住院期間的臨床診療相關(guān)數(shù)據(jù)。研究中提出了多模型多標(biāo)簽特征篩選(multi-model?multi-label?featureselection,mmfs)開放式算法框架以及復(fù)合型多標(biāo)簽不平衡數(shù)據(jù)處理(compound?multi-label?imbalanced?data?processing,cmidp)算法框架,為解決多標(biāo)簽場景中特征選擇和類別不平衡問題提供技術(shù)支持。隨后將binary?relevance(br)、classifier?chain(cc)、label?powerset(lp)三種多標(biāo)簽框架分別與支持向量機(jī)(svm)、樸素貝葉斯(nb)、決策樹(dt)、隨機(jī)森林(rf)、lightgbm、xgboost、多層感知機(jī)(mlp)相結(jié)合,加上mlknn、haram兩種多標(biāo)簽算法共構(gòu)建23種預(yù)測模型,實(shí)現(xiàn)對真菌(fungi)、革蘭氏陰性菌(gnb)、革蘭氏陽性菌(gpb)、多重耐藥菌(mdro)4種lrti的預(yù)判。在開發(fā)樣本中對預(yù)測模型進(jìn)行開發(fā),在驗(yàn)證樣本中進(jìn)行模型效果的驗(yàn)證。最終選擇綜合性能最高的模型結(jié)合shap技術(shù)進(jìn)行輔助預(yù)判系統(tǒng)的搭建。本發(fā)明構(gòu)建的多標(biāo)簽決策支持系統(tǒng)較好地實(shí)現(xiàn)了copd重癥患者下呼吸道fungi感染、gnb感染、gpb感染、mdro感染的預(yù)判,能在一定程度上控制抗菌藥物的過度使用。系統(tǒng)較為充分的交互性和可解釋性,可以實(shí)時輔助臨床醫(yī)務(wù)人員進(jìn)行多種lrti類別的同步診斷。
25、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),為了實(shí)現(xiàn)多標(biāo)簽結(jié)局的預(yù)測,針對多標(biāo)簽任務(wù)場景,在預(yù)測模型的構(gòu)建過程中,分別在特征篩選階段和數(shù)據(jù)不平衡處理階段開發(fā)出mmfs和cmidp兩種算法框架,有效實(shí)現(xiàn)了預(yù)測模型的構(gòu)建。
26、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),以最優(yōu)多標(biāo)簽臨床預(yù)測模型為基礎(chǔ),結(jié)合shap可解釋模型和可交互的網(wǎng)頁前端技術(shù)形成,通過多標(biāo)簽臨床預(yù)測模型獲得感染類型的預(yù)測結(jié)果,并通過shap可解釋模型獲得預(yù)測結(jié)果的臨床解釋性決策曲線,并進(jìn)一步將上述內(nèi)容進(jìn)行可交互可視化呈現(xiàn)是通過網(wǎng)頁前端技術(shù)實(shí)現(xiàn)。
27、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),采用真實(shí)的臨床病歷數(shù)據(jù),訓(xùn)練與驗(yàn)證多種多標(biāo)簽?zāi)P停x擇最優(yōu)預(yù)測模型并結(jié)合shap可解釋性技術(shù)構(gòu)建可視化決策支持系統(tǒng),為copd重癥患者多種lrti類別的同步預(yù)判提供技術(shù)與工具支持,輔助臨床醫(yī)務(wù)人員有效控制抗菌藥物的不當(dāng)使用和(或)過度使用。
28、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),充分利用多種lrti類別間的關(guān)系,利用copd重癥住院患者的基本信息、化驗(yàn)指標(biāo)、血?dú)夥治龅葦?shù)據(jù)構(gòu)建同步預(yù)測多種感染類別的多標(biāo)簽臨床預(yù)測模型,并采用基于shapley?value的可加性全局解釋方法對開發(fā)出的預(yù)測模型進(jìn)行結(jié)果解釋。
29、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),考慮預(yù)測各感染類別的共性特征與個性特征,以排列重要性算法為基礎(chǔ),提出一種多模型多標(biāo)簽特征篩選(multi-model?multi-label?feature?selection,mmfs)開放式算法框架,為構(gòu)建多標(biāo)簽預(yù)測模型篩選更貼近臨床醫(yī)學(xué)場景的特征。
30、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),考慮到多數(shù)類標(biāo)簽與少數(shù)類標(biāo)簽耦合對多標(biāo)簽不平衡處理過程可能造成的影響,以及降低多標(biāo)簽任務(wù)中的類別不平衡對模型預(yù)測效果的影響,以remedial、mlsmote、mltl算法為基礎(chǔ),提出復(fù)合型多標(biāo)簽不平衡數(shù)據(jù)處理(compound?multi-label?imbalanced?data?processing,cmidp)算法框架,構(gòu)建remlsmotl、remlsmote、remltl、mlsmotl共4種多標(biāo)簽不平衡數(shù)據(jù)處理算法,為提高模型預(yù)測效果提供較充分的技術(shù)支持。
31、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判系統(tǒng),為方便預(yù)測模型在臨床環(huán)境中的推廣,滿足臨床診療中輔助診斷目標(biāo)患者lrti類別及時性、可解釋性的需求,利用streamlit搭建了一款在線交互式臨床輔助預(yù)判系統(tǒng),以期在臨床場景中的任何移動聯(lián)網(wǎng)終端均可實(shí)現(xiàn)感染類別的實(shí)時預(yù)判。
32、本發(fā)明通過構(gòu)建多標(biāo)簽決策支持系統(tǒng),實(shí)現(xiàn)copd重癥患者下呼吸道真菌、gnb、gpb、mdro感染4種類別的同步快速預(yù)判,有效控制抗菌藥物的過度使用。以cc-lightgbm為基礎(chǔ)的慢阻肺重癥患者lrti臨床輔助預(yù)判系統(tǒng)不僅具有顯著的預(yù)測性能,還可以使未感染患者的誤診率也保持在較低水平。研究同時發(fā)現(xiàn),bt、crp、alb和ldh同為4種lrti類別重要的預(yù)測指標(biāo),較小的bmi值在感染類別預(yù)判時有助于gnb、mdro感染的預(yù)判,較小alb值有助于fungi、gnb和mdro感染的預(yù)判。
33、本發(fā)明所述copd患者下呼吸道感染臨床輔助預(yù)判方法,具有如下幾方面的優(yōu)勢:(1)充分利用臨床常規(guī)檢查和臨床檢查等成本較低的指標(biāo),在醫(yī)療條件有限、診療壓力較大、微生物培養(yǎng)tat較長的條件下實(shí)現(xiàn)了copd重癥患者多種lrti類別的同步快速預(yù)判;(2)提出了mmfs開放式算法框架,實(shí)現(xiàn)在多標(biāo)簽任務(wù)中利用多種預(yù)測模型對各感染類別預(yù)判重要性較大的共性指標(biāo)和個性指標(biāo)進(jìn)行統(tǒng)一的分析挖掘;(3)提出了cmidp算法框架,形成了多種適用于多標(biāo)簽任務(wù)的類別不平衡處理算法,較充分地考慮數(shù)據(jù)中可能遇到標(biāo)簽耦合和標(biāo)簽不平衡的影響下游模型預(yù)測性能的情況;(4)對多標(biāo)簽領(lǐng)域兩大類框架下多種算法技術(shù)進(jìn)行了逐一考察,并結(jié)合shap可解釋性技術(shù)對最優(yōu)模型各指標(biāo)的重要性與意義進(jìn)行了可視化呈現(xiàn)與相應(yīng)解釋;(5)結(jié)合shap的個體可解釋性技術(shù),構(gòu)建交互式?jīng)Q策支持系統(tǒng),提高個性化預(yù)判結(jié)果的可解釋性以及模型在臨床應(yīng)用時的可推廣度,以臨床現(xiàn)有聯(lián)網(wǎng)設(shè)備為載體,實(shí)時在線輔助醫(yī)務(wù)人員進(jìn)行相關(guān)決策。