本發(fā)明涉及生物醫(yī)學,具體為一種癌化水平評估模型構建方法及裝置。
背景技術:
1、近年來,癌癥已成為全球主要的健康威脅之一,早期發(fā)現(xiàn)和及時干預被廣泛認為是提高癌癥治愈率的關鍵。然而,目前的癌癥診斷方法多依賴于傳統(tǒng)的影像學檢查和單一標志物的血液檢測,這些方法在早期癌癥的識別和癌化程度的評估上往往存在局限性。大多數(shù)情況下,傳統(tǒng)的腫瘤標志物如癌胚抗原(cea)和甲胎蛋白(afp)只能在腫瘤形成后才能顯著上升,而癌癥的發(fā)生是一個復雜的多步驟過程,涉及細胞的基因突變、蛋白質(zhì)表達變化、免疫逃逸等多種生物學機制。現(xiàn)有技術未能有效整合這些復雜信息,導致早期診斷和癌化水平評估的準確性不足。
2、此外,隨著對癌癥生物學的深入研究,越來越多的證據(jù)表明,腫瘤微環(huán)境中的免疫反應在癌癥的發(fā)展和進展中起著至關重要的作用。然而,傳統(tǒng)的診斷方法通常未能將免疫數(shù)據(jù)納入評估體系,未能全面反映腫瘤與宿主之間復雜的相互作用。這使得難以準確評估患者的癌化水平并制定個性化的治療方案。因此,迫切需要一種新的綜合評估方法,不僅要能同時考慮多種生物標志物和基因突變,還要將免疫反應納入評估體系,以便能更全面、準確地評估癌化水平,為臨床提供切實可行的決策支持。
3、現(xiàn)有技術中的,公開號為cn113943817b公開了宮頸癌癌化水平評估模型及構建方法,通過篩選現(xiàn)有宮頸癌基因及其甲基化區(qū)域,設計探針,從宮頸癌腫瘤組織中提取宮頸細胞dna;對宮頸細胞dna片段化后進行末端修復和連接接頭,構建宮頸細胞dna甲基化文庫,并進行文庫靶向富集;對處理后的宮頸細胞dna甲基化文庫進行生信分析,使用邏輯回歸算法構建評估模型,使用臨床樣本驗證評估模型;通過本評估模型對宮頸癌癌化評估,符合率可達92.5%,臨床敏感度0.888889,臨床特異度0.954545,auc為0.9271,可有效減少過度治療,以降低宮頸癌的發(fā)病率和死亡率,但是現(xiàn)有技術依舊存在缺陷,現(xiàn)有技術對癌化水平的評估只依賴單一的dna數(shù)據(jù),然而癌化是個復雜的過程,這個過程牽扯到身體多項數(shù)據(jù)的改變,這種單一維度的數(shù)據(jù)分析會導致評估結果的全面性和準確性不足。且癌化涉及dna數(shù)據(jù)的多個維度,該現(xiàn)有技術值針對甲基化進行分析數(shù)據(jù)挖掘深度不夠,得出的評估結果不夠可靠。
4、在所述背景技術部分公開的上述信息僅用于加強對本公開的背景的理解,因此它可以包括不構成對本領域普通技術人員已知的現(xiàn)有技術的信息。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供一種癌化水平評估模型構建方法及裝置,以解決上述背景技術中提出的問題。
2、為實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
3、一種癌化水平評估模型構建方法,具體步驟包括:
4、步驟1:對評估對象進行醫(yī)學檢測,對檢測結果進行處理,獲取評估對象的血清標志數(shù)據(jù)、基因突變數(shù)據(jù)、蛋白表達數(shù)據(jù)、遺傳數(shù)據(jù)和免疫數(shù)據(jù);
5、步驟2:對血清標志數(shù)據(jù)、基因突變數(shù)據(jù)和蛋白表達數(shù)據(jù)進行數(shù)學分析得到癌化狀態(tài)系數(shù),對遺傳數(shù)據(jù)進行數(shù)學分析得到抑癌受阻系數(shù),對抑癌受阻系數(shù)和癌化狀態(tài)系數(shù)進行數(shù)學分析,生成癌化程度系數(shù);
6、步驟3:對免疫數(shù)據(jù)進行特征提取得到細胞免疫系數(shù)和免疫因子修正系數(shù),根據(jù)細胞免疫系數(shù)和免疫因子修正系數(shù)生成抗癌指數(shù),通過抗癌指數(shù)和癌化程度系數(shù)生成癌化水平評估系數(shù);
7、步驟4:將癌化水平評估系數(shù)預設的閾值進行比較,根據(jù)比較結果將癌化分為輕微癌化,中等癌化和嚴重癌化。
8、進一步地,所述血清標志數(shù)據(jù)包括甲胚蛋白含量和癌胚抗原含量;所述基因突變數(shù)據(jù)包括kras突變評分和tp53突變評分;所述蛋白表達數(shù)據(jù)包括her2蛋白的ihc評級和p53蛋白的h-score評分,所述遺傳數(shù)據(jù)包括相關癌癥抑制基因的甲基化程度;所述抑癌基因包括:pten基因、rb1基因、cdkn2a基因和nf1基因;所述免疫數(shù)據(jù)包括免疫細胞數(shù)量數(shù)據(jù)和細胞因子數(shù)據(jù),所述免疫細胞數(shù)量數(shù)據(jù)包括腫瘤微環(huán)境的cd8+t細胞數(shù)量、cd4+t細胞數(shù)量、b細胞數(shù)量、自然殺傷細胞數(shù)量和癌細胞數(shù),所述細胞因子數(shù)據(jù)包括il-6水平、tnf-alpha水平和il-10水平;獲取her2蛋白的ihc評分所依據(jù)的具體邏輯為:將ihc評級變?yōu)閕hc評分,將0級設為1分;將1+級設為2分,將2+級設為3分,將3+級設為4分。
9、進一步地,獲取kras突變評分所依據(jù)的具體邏輯為:設定kras關鍵突變位置影響因子,將g12d位置發(fā)生突變的影響因子設定為1,將g12v位置發(fā)生突變的影響因子設定為2,將g13d位置發(fā)生突變的影響因子設定為3,從評估對象處采集一組樣本,將該組樣本中g12d位置、g12v位置和g13d位置發(fā)生突變的個數(shù)與g12d位置、g12v位置和g13d位置總個數(shù)的比值一一作為g12d位置、g12v位置和g13d位置的突變頻率,統(tǒng)計這組樣品中g12d位置、g12v位置和g13d位置基因突變的頻率,根據(jù)統(tǒng)計結果進行kras突變評分,進行kras突變評分所依據(jù)的具體公式為:
10、skrsa=fg12d+2fg12v+3fg13d
11、其中,skrsa為kras突變評分,fg12d為g12d位置突變頻率,fg12v為g12v位置突變頻率,fg13d為g13d位置突變頻率。
12、進一步地,獲取tp53突變評分所依據(jù)的具體邏輯為:設定tp53關鍵突變位置影響因子,將r175h位置發(fā)生突變的影響因子設定為1,將r248q位置發(fā)生突變的影響因子設定為2,將r273h位置發(fā)生突變的影響因子設定為3,從評估對象處采集一組樣本,將該組樣本中r175h位置、r248q位置和r273h位置發(fā)生突變的個數(shù)與r175h位置、r248q位置和r273h位置總個數(shù)的比值一一作為r175h位置、r248q位置和r273h位置的突變頻率,統(tǒng)計這組組樣品r175h位置、r248q位置和r273h位置基因突變頻率,根據(jù)統(tǒng)計結果進行tp53突變評分,進行tp53突變評分所依據(jù)的具體公式為:
13、stp53=fr175h+2fr248q+3fr273h
14、其中,stp53為tp53突變評分,fr175h為r175h位置突變頻率,fr248q為r248q位置突變頻率,fr273h為r273h位置突變頻率。
15、進一步地,生成癌化狀態(tài)系數(shù)所依據(jù)的具體邏輯為:對血清標志數(shù)據(jù)、基因突變數(shù)據(jù)和蛋白表達數(shù)據(jù)進行數(shù)學分析得到癌化狀態(tài)系數(shù),生成癌化狀態(tài)系數(shù)所依據(jù)的具體公式為:
16、
17、其中,az為癌化狀態(tài)系數(shù),cj為甲胚蛋白含量,ca為癌胚抗原含量,skrsa為kras突變評分,stp53為tp53突變評分,sher2為her2蛋白的ihc評分,sp53為p53蛋白的h-score評分。
18、進一步地,生成癌化程度系數(shù)所依據(jù)的具體邏輯為:統(tǒng)計抑癌基因的甲基化程度,所述抑癌基因包括:pten基因、rb1基因、cdkn2a基因和nf1基因;計算各種抑癌基因的甲基化程度與相應甲基化閾值的差值,并將小于零的差值設定為零以對差值進行處理,對處理后的差值進行數(shù)學分析生成抑癌受阻系數(shù),對抑癌受阻系數(shù)和癌化狀態(tài)系數(shù)進行數(shù)學分析,生成癌化程度系數(shù);生成抑癌受阻系數(shù)所依據(jù)的具體公式為:
19、
20、其中,ya為抑癌受阻系數(shù),kji為第i種抑癌基因所對應的處理后差值,m為抑癌基因總種類數(shù),i為抑癌基因種類的索引;
21、生成癌化程度系數(shù)所依據(jù)的具體公式為:
22、ac=az*eya
23、其中,ac為癌化程度系數(shù),az為癌化狀態(tài)系數(shù),ya為抑癌受阻系數(shù)。
24、進一步地,生成癌化水平評估系數(shù)所依據(jù)的具體邏輯為:對免疫數(shù)據(jù)進行特征提取得到細胞免疫系數(shù)和免疫因子修正系數(shù),根據(jù)細胞免疫系數(shù)和免疫因子修正系數(shù)生成抗癌指數(shù),通過抗癌指數(shù)和癌化程度系數(shù)生成癌化水平評估系數(shù);獲取細胞免疫系數(shù)所依據(jù)的具體公式為:
25、
26、其中,xm為細胞免疫系數(shù),ncd8+為cd8+t細胞數(shù)量,nnk為自然殺傷細胞數(shù)量,nb為b細胞數(shù)量,ncd4+為cd4+t細胞數(shù)量,na為癌細胞數(shù);
27、生成免疫因子修正系數(shù)所依據(jù)的具體公式為:
28、
29、其中,xy為免疫因子修正系數(shù),cil-6為il-6水平,ctnf為tnf-alpha水平,cil-10為il-10水平;
30、生成抗癌指數(shù)所依據(jù)的具體公式為:
31、
32、其中,ka為抗癌指數(shù),
33、生成癌化水平評估系數(shù)所依據(jù)的具體公式為:通過抗癌指數(shù)和癌化程度系數(shù)生成癌化水平評估系數(shù);
34、
35、其中,kh為癌化水平評估系數(shù),ac為癌化程度系數(shù)。
36、進一步地,將癌化水平進行分類評估所依據(jù)的具體邏輯為:
37、預設癌化水平評估閾值kh0,若kh<0.6kh0,則癌化水平為輕微癌化,若0.6kh0≤kh<kh0,則癌化水平為中等癌化,若kh≥kh0,則癌化水平為嚴重癌化。
38、本發(fā)明另外提供一種癌化水平評估模型構建裝置,所述裝置用于實現(xiàn)所述癌化水平評估模型構建方法,具體包括:
39、數(shù)據(jù)采集模塊:用于對評估對象進行醫(yī)學檢測,對檢測結果進行處理,獲取評估對象的血清標志數(shù)據(jù)、基因突變數(shù)據(jù)、蛋白表達數(shù)據(jù)、遺傳數(shù)據(jù)和免疫數(shù)據(jù);
40、程度評估模塊:用于對血清標志數(shù)據(jù)、基因突變數(shù)據(jù)和蛋白表達數(shù)據(jù)進行數(shù)學分析得到癌化狀態(tài)系數(shù),對遺傳數(shù)據(jù)進行數(shù)學分析得到抑癌受阻系數(shù),對抑癌受阻系數(shù)和癌化狀態(tài)系數(shù)進行數(shù)學分析,生成癌化程度系數(shù);
41、抵抗評估模塊:用于對免疫數(shù)據(jù)進行特征提取得到細胞免疫系數(shù)和免疫因子修正系數(shù),根據(jù)細胞免疫系數(shù)和免疫因子修正系數(shù)生成抗癌指數(shù),通過抗癌指數(shù)和癌化程度系數(shù)生成癌化水平評估系數(shù);
42、癌化評估模塊:用于將癌化水平評估系數(shù)預設的閾值進行比較,根據(jù)比較結果將癌化分為輕微癌化,中等癌化和嚴重癌化。
43、與現(xiàn)有技術相比,本發(fā)明的有益效果是:
44、本發(fā)明通過整合血清標志物、基因突變、蛋白質(zhì)表達、免疫反應及甲基化等多項生物數(shù)據(jù),構建了一種綜合評估模型。這種多維度的分析框架能夠全面反映癌化過程的復雜性,從而提高評估結果的全面性和準確性。
45、對于基因數(shù)據(jù)的挖掘,本發(fā)明不僅關注甲基化,還綜合考慮基因突變和相關蛋白質(zhì)基因的表達效果。這樣的綜合評估方式使得得出的評估結果更為可靠,從而能更好地指導臨床決策和制定個性化治療方案。