1.一種早期識別高危孕婦胎盤植入性疾病發(fā)生風險的分類器訓練系統(tǒng),其特征在于它包括:
2.根據(jù)權利要求1所述的系統(tǒng),其特征在于數(shù)據(jù)集劃分模塊中,將pas孕婦和未發(fā)生pas孕婦按照年齡、行nipt時孕周、胎兒性別及高危因素分布匹配,將主中心的樣本隨機劃分為訓練數(shù)據(jù)集與內(nèi)部驗證數(shù)據(jù)集,各分中心的樣本作為獨立的外部驗證數(shù)據(jù)集;從訓練數(shù)據(jù)集中依據(jù)行nipt時孕周與胎兒性別進行1:1匹配獲得發(fā)現(xiàn)數(shù)據(jù)集。
3.根據(jù)權利要求1所述的系統(tǒng),其特征在于影響因子提取模塊中,使用序列比對算法將nipt數(shù)據(jù)與人類參考基因組hg19比對,刪除pcr重復項,確定距轉錄起始位點tss上下1000bp的區(qū)域作為啟動子區(qū)域ptss,并計算ptss區(qū)域的原始讀取覆蓋率。
4.根據(jù)權利要求3所述的系統(tǒng),其特征在于影響因子提取模塊中,對ptss區(qū)域的原始讀取覆蓋率進行類tpm標準化,npc-tpm通過下式獲?。?/p>
5.根據(jù)權利要求1所述的系統(tǒng),其特征在于特征篩選模塊中,對發(fā)現(xiàn)數(shù)據(jù)集中發(fā)生與未發(fā)生pas的高危孕婦的影響因子進行deseq2、limma-voom及秩和檢驗分析,篩選三種差異分析方法算得p值均<0.05的影響因子作為特征因子。
6.根據(jù)權利要求1所述的系統(tǒng),其特征在于特征因子離散模塊中,為了增強分類器對不同測序平臺的普適性及臨床實用性,將每個特征因子的最佳截斷值設定為在訓練數(shù)據(jù)集中敏感性與特異性之和最大的npc-tpm值;當特征因子npc-tpm大于相應的最佳截斷值時,設為1;否則,設為0。
7.根據(jù)權利要求1所述的系統(tǒng),其特征在于模型獲取模塊中,使用多種機器學習算法逐步構建pas疾病預測分類器,分別選擇邏輯回歸lr、支持向量機svm的線性核及rbf核函數(shù)進行分類器訓練。
8.根據(jù)權利要求1所述的系統(tǒng),其特征在于模型獲取模塊中:
9.一種早期識別高危孕婦胎盤植入性疾病發(fā)生風險的分類器,其特征在于它通過權利要求1-8任一項所述的訓練系統(tǒng)獲得。
10.檢測abhd1、alg1l2、eys、fam157c、kdsr、krt5、lancl2、linc00390、linc00964、loc105371998、loc107987394、loc644090、lyzl2、mir184、mir4802、myt1l、ngdn、nsd2、pacrg.as3、sap30l.as1、slc16a12.as1、tada3、tmem147.as1基因表達的試劑在制備早期識別高危孕婦胎盤植入性疾病發(fā)生風險診斷試劑盒中應用。