無
技術(shù)領(lǐng)域:
本發(fā)明涉及生物醫(yī)學(xué)領(lǐng)域,且特別地涉及用于預(yù)測與微生物群有關(guān)的疾病,特別是類風(fēng)濕性關(guān)節(jié)炎(RA)的風(fēng)險(xiǎn)的生物標(biāo)記物和方法。
背景技術(shù):
:類風(fēng)濕性關(guān)節(jié)炎(RA)是影響全球數(shù)千萬人口的使人衰弱的自身免疫性疾病并增加了患有其心血管和其它全身性并發(fā)癥的患者的死亡率,但RA的病因仍不清楚。傳染性病原體一直與RA有牽連。然而,RA相關(guān)的病原體的特征和致病性很大程度上是不清楚的,而最近確定人體是寄宿數(shù)以萬億計(jì)的有益以及有害微生物的超級有機(jī)體(super-organism)使問題進(jìn)一步復(fù)雜化。盡管使用疾病緩解性抗風(fēng)濕藥(DMARD)成功減輕了許多RA患者的狀態(tài),但是對觸發(fā)或促進(jìn)疾病的因素的不充分認(rèn)識阻礙了開發(fā)特異性和更有效的治療方法。對微生物的調(diào)查研究也揭示了預(yù)防或減輕RA的益生菌。認(rèn)為在關(guān)節(jié)炎癥發(fā)病前RA在某些其它身體部位發(fā)起并潛伏了數(shù)年。腸道微生物群是人類健康的關(guān)鍵環(huán)境因素,在肥胖、糖尿病、結(jié)腸癌等中具有確定的作用。除了在營養(yǎng)和異生物代謝方面起作用外,末端腸道中的微生物還與神經(jīng)-免疫-內(nèi)分泌系統(tǒng)和血流相互作用以影響整個(gè)人體。腸微生物群與給定個(gè)體穩(wěn)定相關(guān),增加了其在疾病相關(guān)研究中的價(jià)值。人群中腸道微生物群的異質(zhì)性表明,疾病的治療應(yīng)該根據(jù)腸道微生物群個(gè)體化,其在藥物激活或失活、免疫調(diào)節(jié)等中的作用很大程度上仍然不清楚。與道微生物群相比,口腔微生物群相對地處于研究中,其中人類微生物群計(jì)劃(HMP)僅采集了約100名健康個(gè)體用于WGS(HumanMicrobiomeProjectConsortium.Aframeworkforhumanmicrobiomeresearch.Nature486,215–21(2012),通過引用并入本文)。盡管事實(shí)上牙齒和唾液樣本在門診治療中比糞便樣本更容易獲得,但是一直以來缺乏對口腔微生物群在疾病中作用的宏基因組分析糞便。還未知的是口腔和腸道微生物疾病標(biāo)記物在它們的特性或功能方面一致到何種程度。技術(shù)實(shí)現(xiàn)要素:本公開的實(shí)施方式旨在至少在一定程度上解決現(xiàn)有技術(shù)中存在的問題的至少之一。本發(fā)明是基于本發(fā)明人的以下發(fā)現(xiàn):腸道微生物的評估和表征已經(jīng)成為包括類風(fēng)濕性關(guān)節(jié)炎(RA)的人類疾病的主要研究領(lǐng)域。為了對RA患者的腸道微生物內(nèi)容物進(jìn)行分析,本發(fā)明人基于對來自212個(gè)個(gè)體的微生物DNA進(jìn)行深度鳥槍法測序進(jìn)行了宏基因組關(guān)聯(lián)分析(Metagenome-WideAssociationStudy,MGWAS)(Qin,J.等人.Ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.Nature490,55–60(2012),通過引用并入本文)的方案。本發(fā)明人基于RA-相關(guān)的基因標(biāo)記物通過隨機(jī)森林模型鑒定出并證實(shí)了腸道/牙齒/唾液標(biāo)記物組(29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG)。為了基于這些29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG直觀地評估RA疾病的風(fēng)險(xiǎn),本發(fā)明人基于訓(xùn)練集中的MLG標(biāo)記物的相對豐度譜通過隨機(jī)森林模型分別計(jì)算了疾病的概率。本發(fā)明人的數(shù)據(jù)提供了對與RA風(fēng)險(xiǎn)相關(guān)的腸道/牙齒/唾液宏基因組的特征的深入理解,對將來研究腸道/牙齒/唾液宏基因組在其它相關(guān)疾病中的病理生理學(xué)作用提供了范例,以及提供了基于微生物群的用于評估個(gè)體有風(fēng)險(xiǎn)患有這種疾病的方法的潛在用途。據(jù)認(rèn)為,由于以下原因,RA-相關(guān)的腸道微生物群(29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG)對在早期階段增加RA檢測是有價(jià)值的。第一,本發(fā)明的標(biāo)記物具有特異性和靈敏性。第二,糞便的分析保證準(zhǔn)確性、安全性、可負(fù)擔(dān)性和患者依從性。并且糞便的樣本是可運(yùn)輸?shù)??;诰酆厦告湻磻?yīng)(PCR)的試驗(yàn)舒適且無創(chuàng),所以人們會更容易參與給定的篩選程序。第三,本發(fā)明的標(biāo)記物還可以用作用于對RA患者進(jìn)行治療監(jiān)測的工具以檢測對治療的響應(yīng)。一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標(biāo)記物組,且根據(jù)本公開的實(shí)施方式,該生物標(biāo)記物組由腸道生物標(biāo)記物、牙齒生物標(biāo)記物、唾液生物標(biāo)記物或具有包括SEQIDNO:1至18238的至少部分序列的基因組DNA的微生物組成,其中腸道生物標(biāo)記物包括齒雙歧桿菌(Bifidobacteriumdentium)、RA-2633、腸球菌屬(Enterococcussp.)、RA-781、Gordonibacterpamelaeae、RA-3396、RA-6638、RA-2441、RA-527、梭狀芽孢桿菌屬(Clostridiumsp.)、RA-2637、檸檬酸桿菌屬(Citrobactersp.)、真桿菌屬(Eubacteriumsp.)、檸檬酸桿菌屬、RA-3215、Con-1722、Con-4360、Con-4212、Con-1261、兩歧雙歧桿菌(Bifidobacteriumbifidum)、肺炎克雷伯菌(Klebsiellapneumoniae)、Con-1423、韋榮氏球菌屬(Veillonellasp.)、Con-4095、Con-4103、Con-1735、Con-1710、Con-1832、Con-1170,牙齒生物標(biāo)記物包括RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757、Con-530,以及唾液生物標(biāo)記物包括RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌(Campylobacterrectus)、Con-1141、Con-20、鏈球菌屬(Streptococcussp.)、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌(Porphyromonasgingivalis)、乳球菌屬(Lactococcussp.),或者基因組DNA包含SEQIDNO:1至18238的至少部分序列的微生物。可選地,生物標(biāo)記物組由列于表4-2中的種屬中的至少一種種屬組成,優(yōu)選地由至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%的列于表4-2中的種屬組成。根據(jù)本公開的實(shí)施方式,唾液標(biāo)記物包括如表7中所述的SEQIDNO:1至18238的至少部分序列。根據(jù)本公開的實(shí)施方式,腸道生物標(biāo)記物包括齒雙歧桿菌JCVIHMP022、普氏菌CB7(PrevotellacopriCB7)、DSM18205、屎腸球菌E980(EnterococcusfaeciumE980)、卵形瘤胃球菌A2-162(RuminococcusobeumA2-162)、Gordonibacterpamelaeae7-10-1-bT、DSM19378、布氏瘤胃球菌L2-63(RuminococcusbromiiL2-63)、凸腹真桿菌ATCC27560(EubacteriumventriosumATCC27560)、產(chǎn)酸克雷伯菌KCTC1686(KlebsiellaoxytocaKCTC1686)、ClostridiumasparagiformeDSM15981、普氏菌CB7(PrevotellacopriCB7)、DSM18205、弗氏檸檬酸桿菌4_7_47CFAA(Citrobacterfreundii4_7_47CFAA)、真桿菌屬3_1_31(Eubacteriumsp.3_1_31)、檸檬酸桿菌屬30_2(Citrobactersp.30_2)、梭狀芽孢桿菌屬7_2_43FAA(Clostridiumsp.7_2_43FAA)、羅氏弧菌M50/1(RoseburiaintestinalisM50/1)、DialisterinvisusDSM15470、BacteroidesplebeiusM12、DSM17135、兩歧雙歧桿菌S17(BifidobacteriumbifidumS17)、肺炎克雷伯菌NTUH-K2044(KlebsiellapneumoniaeNTUH-K2044)、韋榮氏球菌屬口腔分類群158F0412(Veillonellasp.oraltaxon158F0412)、睪丸酮叢毛單胞菌KF-1(ComamonastestosteroniKF-1)、肺炎克雷伯菌NTUH-K2044(KlebsiellapneumoniaeNTUH-K2044)、非典型韋榮球菌ACS-134-V-Col7a(VeillonellaatypicaACS-134-V-Col7a)、澳大利亞鏈球菌ATCC700641(StreptococcusaustralisATCC700641)、ParabacteroidesmerdaeATCC43184,牙齒生物標(biāo)記物包括放線菌屬口腔分類群180F0310(Actinomycessp.oraltaxon180F0310)、粘滑羅斯菌DY-18(RothiamucilaginosaDY-18)、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、非典型韋榮球菌ACS-134-V-Col7a(VeillonellaatypicaACS-134-V-Col7a)、放線菌屬F0384(Actinomycessp.F0384)、放線菌屬口腔分類群848F0332(Actinomycessp.oraltaxon848F0332)、粘膜奈瑟菌M26(NeisseriamucosaM26)、ATCC25996、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、福賽斯坦納菌ATCC43037(TannerellaforsythensisATCC43037)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、桿狀奈瑟菌ATCCBAA-1200(NeisseriabacilliformisATCCBAA-1200)、互養(yǎng)菌門細(xì)菌SGP1(SynergistetesbacteriumSGP1)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、牙齦二氧化碳嗜纖維菌ATCC33624(CapnocytophagagingivalisATCC33624)、人心桿菌ATCC15826(CardiobacteriumhominisATCC15826)、牙齦二氧化碳嗜纖維菌ATCC33624(CapnocytophagagingivalisATCC33624)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、懶惰約翰森菌ATCC51276(JohnsonellaignavaATCC51276)、費(fèi)氏丙酸桿菌謝氏CIRM-BIA1(PropionibacteriumfreudenreichiishermaniiCIRM-BIA1)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、梭桿菌屬口腔分類群370F0437(Fusobacteriumsp.oraltaxon370F0437)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、侵蝕艾肯菌ATCC23834(EikenellacorrodensATCC23834)、有害新月形單胞菌ATCC43541(SelenomonasnoxiaATCC43541)、利氏卟啉單胞菌DSM23370(PorphyromonasleviiDSM23370)、BulleidiaextructaW1219,唾液生物標(biāo)記物包括溶血孿生球菌ATCC10379(GemellahaemolysansATCC10379)、非典型韋榮球菌ACS-049-V-Sch6(VeillonellaatypicaACS-049-V-Sch6)、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、文氏密螺旋體ATCC35580(TreponemavincentiiATCC35580)、澳大利亞鏈球菌ATCC700641(StreptococcusaustralisATCC700641)、直腸彎曲桿菌RM3267(CampylobacterrectusRM3267)、CCUG20446、放線菌屬口腔分類群171F0337(Actinomycessp.oraltaxon171F0337)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、血鏈球菌VMC66(StreptococcussanguinisVMC66)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、桿狀奈瑟菌ATCCBAA-1200(NeisseriabacilliformisATCCBAA-1200)、鼻疽伯克霍爾德氏菌PRL-20(BurkholderiamalleiPRL-20)、牙齦卟啉單胞菌TDC60(PorphyromonasgingivalisTDC60)、乳酸乳球菌乳亞種KF147(LactococcuslactislactisKF147)。在本公開的另一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標(biāo)記物組,根據(jù)本公開的實(shí)施方式,該生物標(biāo)記物組由腸道生物標(biāo)記物、牙齒生物標(biāo)記物和唾液標(biāo)記物組成,其中唾液標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。根據(jù)本公開的實(shí)施方式,疾病為類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了用于確定上述基因標(biāo)記物組的試劑盒,包括用于PCR擴(kuò)增和根據(jù)如下列出的DNA序列設(shè)計(jì)的引物:唾液標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。在本公開的另一方面,提供了用于確定上述基因標(biāo)記物組的試劑盒,包括一種以上根據(jù)如下所列出的基因設(shè)計(jì)的探針:唾液標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。在本公開的另一方面,提供了上述基因標(biāo)記物組用于預(yù)測待測受試者類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病的風(fēng)險(xiǎn)的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息,例如溶血孿生球菌ATCC10379、非典型韋榮球菌ACS-049-V-Sch6、齲齒放線菌ATCC17982、齲齒放線菌ATCC17982、齒垢密螺旋體ATCC35405、放線菌屬口腔分類群448F0400、文氏密螺旋體ATCC35580、澳大利亞鏈球菌ATCC700641、直腸彎曲桿菌RM3267、CCUG20446、放線菌屬口腔分類群171F0337、齒垢密螺旋體ATCC35405、血鏈球菌VMC66、放線菌屬口腔分類群448F0400、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、鼻疽伯克霍爾德氏菌PRL-20、牙齦卟啉單胞菌TDC60、乳酸乳球菌乳亞種KF147的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了上述基因標(biāo)記物在制備用于預(yù)測待測受試者類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病的風(fēng)險(xiǎn)的試劑盒的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,其中RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息,例如溶血孿生球菌ATCC10379、非典型韋榮球菌ACS-049-V-Sch6、齲齒放線菌ATCC17982、齲齒放線菌ATCC17982、齒垢密螺旋體ATCC35405、放線菌屬口腔分類群448F0400、文氏密螺旋體ATCC35580、澳大利亞鏈球菌ATCC700641(StreptococcusaustralisATCC700641)、直腸彎曲桿菌RM3267、CCUG20446、放線菌屬口腔分類群171F0337、齒垢密螺旋體ATCC35405、血鏈球菌VMC66、放線菌屬口腔分類群448F0400、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、鼻疽伯克霍爾德氏菌PRL-20、牙齦卟啉單胞菌TDC60、乳酸乳球菌乳亞種KF147的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了診斷受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風(fēng)險(xiǎn)發(fā)展與微生物群有關(guān)的異常狀態(tài)的方法,包括:確定來自受試者的樣本中的上述生物標(biāo)記物的相對豐度,和基于該相對豐度確定受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風(fēng)險(xiǎn)發(fā)展與微生物群有關(guān)的異常狀態(tài)。根據(jù)本公開的實(shí)施方式,該方法包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,其中RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息,例如溶血孿生球菌ATCC10379、非典型韋榮球菌ACS-049-V-Sch6、齲齒放線菌ATCC17982、齲齒放線菌ATCC17982、齒垢密螺旋體ATCC35405、放線菌屬口腔分類群448F0400、文氏密螺旋體ATCC35580、澳大利亞鏈球菌ATCC700641、直腸彎曲桿菌RM3267、CCUG20446、放線菌屬口腔分類群171F0337、齒垢密螺旋體ATCC35405、血鏈球菌VMC66、放線菌屬口腔分類群448F0400、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、鼻疽伯克霍爾德氏菌PRL-20、牙齦卟啉單胞菌TDC60、乳酸乳球菌乳亞種KF147的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。附圖說明本公開的這些和其它的方面和優(yōu)點(diǎn)從以下結(jié)合附圖的描述中將變得明顯和更容易理解,其中:圖1腸道或口腔MLG允許從健康對照中分類RA患者。(a,d,f)由未治療的RA病例和無關(guān)的正常對照組成的糞便(a)、牙齒(d)和唾液(f)的訓(xùn)練集的ROC曲線(對于糞便、牙齒和唾液樣本,分別為n=157,100,94)。圓點(diǎn)標(biāo)記了最佳閾值概率的假陽性率和真陽性率。(b)對由彼此具有血緣關(guān)系或不具有血緣關(guān)系的17個(gè)對照和17個(gè)RA病例組成的糞便測試集進(jìn)行分類。(c,e,g)對DMARD治療后的糞便(c)、牙齒(e)和唾液(g)的RA樣本進(jìn)行分類(對于糞便、牙齒和唾液樣本,分別為n=40,38,24)。根據(jù)歐洲抗風(fēng)濕聯(lián)盟(EULAR)標(biāo)準(zhǔn),DAS28<2.6表明癥狀緩解。所有樣本的分類結(jié)果列于表12。具體實(shí)施方式本文所使用的術(shù)語具有本發(fā)明相關(guān)領(lǐng)域的普通技術(shù)人員通常理解的含義。術(shù)語,如“一”、“一個(gè)”和“該”并非旨在僅指單數(shù)實(shí)體,而是包含采用具體實(shí)施方式來說明的一般類別。除了如在權(quán)利要求中概述的之外,本文中的術(shù)語用于描述本發(fā)明的具體實(shí)施方式,但是它們的用法不限制本發(fā)明。一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標(biāo)記物組,且根據(jù)本公開的實(shí)施方式,該生物標(biāo)記物組由腸道生物標(biāo)記物、牙齒生物標(biāo)記物和唾液生物標(biāo)記物組成,其中腸道生物標(biāo)記物包括齒雙歧桿菌、RA-2633、腸球菌屬、RA-781、Gordonibacterpamelaeae、RA-3396、RA-6638、RA-2441、RA-527、梭狀芽孢桿菌屬、RA-2637、檸檬酸桿菌屬、真桿菌屬、檸檬酸桿菌屬、RA-3215、Con-1722、Con-4360、Con-4212、Con-1261、兩歧雙歧桿菌、肺炎克雷伯菌、Con-1423、韋榮氏球菌屬、Con-4095、Con-4103、Con-1735、Con-1710、Con-1832、Con-1170,牙齒生物標(biāo)記物包括RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757、Con-530,以及唾液生物標(biāo)記物包括RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌、乳球菌屬。根據(jù)本公開的實(shí)施方式,腸道生物標(biāo)記物包括SEQIDNO:1至9319的至少部分序列。牙齒生物標(biāo)記物包括SEQIDNO:1至15843的至少部分序列。唾液生物標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。根據(jù)本公開的實(shí)施方式,腸道生物標(biāo)記物包括齒雙歧桿菌JCVIHMP022、普氏菌CB7、DSM18205、屎腸球菌E980、卵形瘤胃球菌A2-162、Gordonibacterpamelaeae7-10-1-bT、DSM19378、布氏瘤胃球菌L2-63、凸腹真桿菌ATCC27560、產(chǎn)酸克雷伯菌KCTC1686、ClostridiumasparagiformeDSM15981、普氏菌CB7、DSM18205、弗氏檸檬酸桿菌4_7_47CFAA、真桿菌屬3_1_31、檸檬酸桿菌屬30_2、梭狀芽孢桿菌屬7_2_43FAA、羅氏弧菌M50/1、DialisterinvisusDSM15470、BacteroidesplebeiusM12、DSM17135、兩歧雙歧桿菌S17、肺炎克雷伯菌NTUH-K2044、韋榮氏球菌屬口腔分類群158F0412、睪丸酮叢毛單胞菌KF-1、肺炎克雷伯菌NTUH-K2044、非典型韋榮球菌ACS-134-V-Col7a、澳大利亞鏈球菌ATCC700641、ParabacteroidesmerdaeATCC43184,牙齒生物標(biāo)記物包括放線菌屬口腔分類群180F0310、粘滑羅斯菌DY-18、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982、非典型韋榮球菌ACS-134-V-Col7a、放線菌屬F0384、放線菌屬口腔分類群848F0332、粘膜奈瑟菌M26、ATCC25996、放線菌屬口腔分類群448F0400、福賽斯坦納菌ATCC43037、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、互養(yǎng)菌門細(xì)菌SGP1、奇異口動菌ATCC51599、牙齦二氧化碳嗜纖維菌ATCC33624、人心桿菌ATCC15826、牙齦二氧化碳嗜纖維菌ATCC33624、奇異口動菌ATCC51599、懶惰約翰森菌ATCC51276、費(fèi)氏丙酸桿菌謝氏CIRM-BIA1、齒垢密螺旋體ATCC35405、梭桿菌屬口腔分類群370F0437、奇異口動菌ATCC51599、侵蝕艾肯菌ATCC23834、有害新月形單胞菌ATCC43541、利氏卟啉單胞菌DSM23370、BulleidiaextructaW1219,唾液生物標(biāo)記物包括溶血孿生球菌ATCC10379、非典型韋榮球菌ACS-049-V-Sch6、齲齒放線菌ATCC17982、齲齒放線菌ATCC17982、齒垢密螺旋體ATCC35405、放線菌屬口腔分類群448F0400、文氏密螺旋體ATCC35580、澳大利亞鏈球菌ATCC700641、直腸彎曲桿菌RM3267、CCUG20446、放線菌屬口腔分類群171F0337、齒垢密螺旋體ATCC35405、血鏈球菌VMC66、放線菌屬口腔分類群448F0400、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、鼻疽伯克霍爾德氏菌PRL-20、牙齦卟啉單胞菌TDC60、乳酸乳球菌乳亞種KF147。在本公開的另一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標(biāo)記物組,根據(jù)本公開的實(shí)施方式,該生物標(biāo)記物組由腸道生物標(biāo)記物、牙齒生物標(biāo)記物和唾液標(biāo)記物組成,其中腸道生物標(biāo)記物包括SEQIDNO:1至9319的至少部分序列。牙齒生物標(biāo)記物包括SEQIDNO:1至15843的至少部分序列。唾液生物標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。根據(jù)本公開的實(shí)施方式,疾病為類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了用于確定上述基因標(biāo)記物組的試劑盒,包括用于PCR擴(kuò)增和根據(jù)如下列出的DNA序列設(shè)計(jì)的引物:腸道生物標(biāo)記物包括SEQIDNO:1至9319的至少部分序列。牙齒生物標(biāo)記物包括SEQIDNO:1至15843的至少部分序列。唾液生物標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。在本公開的另一方面,提供了用于確定上述基因標(biāo)記物組的試劑盒,包括一種以上根據(jù)如下所列出的基因設(shè)計(jì)的探針:腸道生物標(biāo)記物包括SEQIDNO:1至9319的至少部分序列。牙齒生物標(biāo)記物包括SEQIDNO:1至15843的至少部分序列。唾液生物標(biāo)記物包括SEQIDNO:1至18238的至少部分序列。在本公開的另一方面,提供了上述基因標(biāo)記物組用于預(yù)測待測受試者類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病的風(fēng)險(xiǎn)的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表8-1、8-2、9-1、9-2、10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了上述基因標(biāo)記物在制備用于預(yù)測待測受試者類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病的風(fēng)險(xiǎn)的試劑盒的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表8-1、8-2、9-1、9-2、10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了診斷受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風(fēng)險(xiǎn)發(fā)展與微生物群有關(guān)的異常狀態(tài)的方法,包括:確定來自受試者的樣本中的上述生物標(biāo)記物的相對豐度,和基于該相對豐度確定受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風(fēng)險(xiǎn)發(fā)展與微生物群有關(guān)的異常狀態(tài)。根據(jù)本公開的實(shí)施方式,該方法包括(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物的相對豐度信息;(3)通過采用多元統(tǒng)計(jì)模型將待測受試者的各個(gè)生物標(biāo)記物的相對豐度信息與訓(xùn)練數(shù)據(jù)組進(jìn)行比較獲得類風(fēng)濕性關(guān)節(jié)炎的概率,其中類風(fēng)濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計(jì)模型基于多個(gè)患有類風(fēng)濕性關(guān)節(jié)炎的受試者和多個(gè)正常受試者的各個(gè)生物標(biāo)記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計(jì)模型為隨機(jī)森林模型。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的生物標(biāo)記物組的各個(gè)生物標(biāo)記物,各列表示樣本,各個(gè)單元表示樣本中的生物標(biāo)記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風(fēng)濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實(shí)施方式,RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌、Con-1141、Con-20、鏈球菌屬、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌和乳球菌屬中的每一個(gè)的相對豐度信息是根據(jù)SEQIDNO:1至18238的相對豐度信息獲得的。根據(jù)本公開的實(shí)施方式,訓(xùn)練數(shù)據(jù)集為表8-1、8-2、9-1、9-2、10-1和表10-2的至少之一,且類風(fēng)濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病或者有風(fēng)險(xiǎn)發(fā)展類風(fēng)濕性關(guān)節(jié)炎或相關(guān)疾病。本發(fā)明是基于本發(fā)明人的以下發(fā)現(xiàn):腸道微生物的評估和表征已經(jīng)成為包括類風(fēng)濕性關(guān)節(jié)炎(RA)的人類疾病的主要研究領(lǐng)域。為了對RA患者的腸道微生物內(nèi)容物進(jìn)行分析,本發(fā)明人基于對來自212個(gè)個(gè)體的微生物DNA進(jìn)行深度鳥槍法測序進(jìn)行了宏基因組關(guān)聯(lián)分析(Metagenome-WideAssociationStudy,MGWAS)(Qin,J.等人.Ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.Nature490,55–60(2012),通過引用并入本文)的方案。本發(fā)明人基于RA-相關(guān)的基因標(biāo)記物通過隨機(jī)森林模型鑒定并證實(shí)了腸道/牙齒/唾液標(biāo)記物組(29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG)。為了基于這29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG直觀地評估RA疾病的風(fēng)險(xiǎn),本發(fā)明人基于訓(xùn)練集中的MLG標(biāo)記物的相對豐度譜通過隨機(jī)森林模型分別計(jì)算了疾病的概率。本發(fā)明人的數(shù)據(jù)提供了對與RA風(fēng)險(xiǎn)相關(guān)的腸道/牙齒/唾液宏基因組的特征的深入理解,對將來研究腸道/牙齒/唾液宏基因組在其它相關(guān)疾病中的病理生理學(xué)作用提供了范例,以及提供了基于微生物群的用于評估個(gè)體有風(fēng)險(xiǎn)患有這種疾病的方法的潛在用途。據(jù)認(rèn)為,由于以下原因,RA-相關(guān)的腸道微生物群(29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG)對在早期階段增加RA檢測是有價(jià)值的。第一,本發(fā)明的標(biāo)記物酷游特異性和敏感性。第二,糞便的分析保證準(zhǔn)確性、安全性、可負(fù)擔(dān)性和患者依從性。并且糞便的樣本是可運(yùn)輸?shù)?。基于聚合酶鏈反?yīng)(PCR)的試驗(yàn)舒適且無創(chuàng),所以人們會更容易參與給定的篩選程序。第三,本發(fā)明的標(biāo)記物還可以用作用于在RA患者治療監(jiān)測的工具以檢測對治療的響應(yīng)。在以下的非限制性實(shí)施例中進(jìn)一步舉例說明本發(fā)明。除非另有說明,份數(shù)和百分比以重量計(jì)且度數(shù)為攝氏度。如本領(lǐng)域一個(gè)普通技術(shù)人員所明白的,這些實(shí)施例,雖然表明了本發(fā)明的優(yōu)選實(shí)施方式,但僅以說明的方式給出,并且試劑均是市售可獲得的。實(shí)施方式實(shí)施例1.鑒別和驗(yàn)證用于評估類風(fēng)濕性關(guān)節(jié)炎風(fēng)險(xiǎn)的生物標(biāo)記物1.材料和方法1.1樣本采集和DNA提取本發(fā)明人采集了一共212名個(gè)體的糞便樣本(表1-1,糞便樣本、牙菌斑樣本和唾液樣本),包含訓(xùn)練集(n=157,77個(gè)未治療的RA病例和80名健康對照)和測試集(對于相關(guān)病例-對照對,n=34,即8個(gè)有血緣關(guān)系的病例-對照對和9個(gè)不具有血緣關(guān)系的病例-對照對;對于DMARD-治療的RA患者,n=21)。糞便樣本是在北京協(xié)和醫(yī)院采集,冷凍運(yùn)輸并如前所述在BGI-深圳(深圳華大基因)進(jìn)行提取(Qin,J.等人.Ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.Nature490,55–60(2012),通過引用并入本文)。牙菌斑是用眼科鑷子從牙齒表面刮取的直到具有3μl的體積。將樣本轉(zhuǎn)移至200μl含有10mMTris、1mMEDTA、0.5%吐溫20和200μg/ml蛋白酶K(Fermentas)的1×裂解緩沖液并在55℃下孵育2小時(shí)。在95℃下孵育10分鐘終止裂解,并在運(yùn)輸前將樣本冷凍在-80℃。按照針對糞便樣本的方案進(jìn)行DNA提取。對于唾液,將100μl唾液加入到100μl的2×裂解緩沖液中,擦拭后咽壁并加入到同一試管中,然后如牙齒樣本一樣對樣品進(jìn)行裂解和提取。根據(jù)2010ACR/EULAR分類標(biāo)準(zhǔn)在北京協(xié)和醫(yī)院對RA進(jìn)行診斷。根據(jù)標(biāo)準(zhǔn)程序,在受試者到醫(yī)院初診時(shí)采集所有表型信息。招募18至65歲之間,疾病持續(xù)時(shí)間至少6周,至少1處關(guān)節(jié)腫脹和3處關(guān)節(jié)壓痛的RA患者。如果患者具有慢性嚴(yán)重感染史、任何當(dāng)前感染或任何類型的癌癥,則將他們排除在外。將孕婦或哺乳期婦女排除在外。告知所有患者具有不孕的風(fēng)險(xiǎn)并將想要孩子的患者排除在外。盡管一些患者已經(jīng)患RA多年,但他們是未用DMARD的,因?yàn)樗麄冊诰驮\北京協(xié)和醫(yī)院之前沒有在當(dāng)?shù)蒯t(yī)院被診斷患有RA,而且他們僅服用止痛藥來緩解RA癥狀。根據(jù)標(biāo)準(zhǔn)程序,在受試者到醫(yī)院初診時(shí)采集所有表型信息。212個(gè)用于腸道微生物基因目錄構(gòu)建的樣本中僅有21個(gè)來自DMARD-治療的患者的糞便樣本且在這篇文章中沒有進(jìn)行分析。這項(xiàng)研究得到了北京協(xié)和醫(yī)院和深圳華大基因的機(jī)構(gòu)審查委員會的批準(zhǔn)。表1-1.用于基因目錄構(gòu)建的樣本1.2宏基因組測序和組裝如前所述(Qin等人.2012,supra),在Illumina平臺上進(jìn)行雙末端宏基因組測序(插入片段350bp,序列長度100bp),對測序讀段進(jìn)行質(zhì)量控制并采用SOAPdenovov2.04將測序讀段重新組裝成重疊群(Luo,R.等人.SOAPdenovo2:anempiricallyimprovedmemory-efficientshort-readdenovoassembler.Gigascience1,18(2012).,通過引用并入本文)。宿主污染的平均率對糞便樣本來說為0.37%,對牙齒樣本來說為5.55%,對唾液樣本為40.85%。1.3基因目錄構(gòu)建利用GeneMarkv2.7d對經(jīng)過組裝的重疊群的基因進(jìn)行預(yù)測。采用BLAT(Kent,W.J.BLAT--theBLAST-likealignmenttool.GenomeRes.12,656–64(2002),通過引用并入本文)以90%重疊和95%同一性(不允許洞的存在)的閾值去除冗余基因,對于212個(gè)糞便樣本(含有21個(gè)DMARD-治療的樣本)形成3,800,011個(gè)基因的非冗余基因目錄,對于203個(gè)口腔樣品(105個(gè)牙菌斑樣本和98個(gè)唾液樣本)形成3,234,997個(gè)基因的目錄。利用BLAT(95%的同一性,90%重疊)將來自糞便樣本的基因目錄并入已有的包含430萬個(gè)基因的腸道微生物參考目錄中(Qin等人.2012,supra),形成包含590萬個(gè)基因的最終目錄。采用與出版的T2D論文(Qin等人,2012,同上)中相同的程序通過將高質(zhì)量測序讀段與腸道或口腔參考基因目錄進(jìn)行比對來確定基因的相對豐度。1.4分類注釋和豐度計(jì)算利用先前詳述的內(nèi)部流程(pipeline)(Qin等人,2012,同上)根據(jù)IMG數(shù)據(jù)庫(v400)對預(yù)測基因進(jìn)行分類分配,70%重疊和65%同一性分配至門,85%同一性分配至屬,95%同一性分配至物種。從分類群基因的相對豐度計(jì)算分類群的相對豐度。通過Wilcoxon秩和檢驗(yàn)(其中p<0.05)確定患者和健康對照之間分類群的相對豐度的顯著差異。1.5宏基因組關(guān)聯(lián)分析(MGWAS)對于糞便微生物群的病例-對照比較,去除在少于6個(gè)樣本(n=157)中檢測到的基因?qū)е戮哂?,110,085個(gè)基因的集。83,858個(gè)基因在對照和病例之間在相對豐度方面顯示出差異(p<0.01,Wilcoxon秩和檢驗(yàn),F(xiàn)DR=0.3285)。根據(jù)這些標(biāo)記物基因在所有樣本中的豐度變化將它們聚類成MLG(Qin等人,2012,同上)。對于構(gòu)建牙齒MLG,從2,247,835個(gè)基因(存在于至少6個(gè)樣本中,n=105)中選擇209820個(gè)標(biāo)記物基因(p<0.01,Wilcoxon秩和檢驗(yàn),F(xiàn)DR=0.072)。對于唾液MLG,本發(fā)明人從2,404,726個(gè)基因(存在于至少6個(gè)樣本中,n=98)中選擇206399個(gè)標(biāo)記物基因(p<0.01,Wilcoxon秩和檢驗(yàn),F(xiàn)DR=0.088)。如先前所述(Qin等人,2012,同上),根據(jù)分類學(xué)和它們的組成基因的相對豐度進(jìn)行分類分配和豐度分析。簡言之,分配到種需要將MLG中的超過90%的基因與種的基因組比對時(shí)具有超過95%的同一性,70%的查詢重疊。將MLG分配至屬要求其超過80%的基因與基因組比對,其中在DNA和蛋白序列中具有85%的同一性。示出與從所有基因計(jì)算的與基因組的平均同一性僅用于參考。根據(jù)MLG在所有樣本中的豐度之間的Kendall相關(guān)性而不管病例-對照狀態(tài)將MLG進(jìn)一步聚類,并且同現(xiàn)網(wǎng)絡(luò)通過Cytoscape3.0.2可視化。1.6基于MLG的分類器利用訓(xùn)練群組(表1-2)的MLG豐度譜對隨機(jī)森林模型(R.2.14,randomForest4.6-7軟件包)(Liaw,Andy&Wiener,Matthew.ClassificationandRegressionbyrandomForest,RNews(2002),第2/3期,第18頁,通過引用并入本文)進(jìn)行訓(xùn)練以選擇MLG標(biāo)記物的最佳集。在一個(gè)以上測試集上對該模型進(jìn)行測試并計(jì)算預(yù)測誤差。關(guān)于隨機(jī)森林模型,采用2.14版本的R中打包的“隨機(jī)森林4.6-7軟件包”,輸入為訓(xùn)練數(shù)據(jù)集(即訓(xùn)練樣本中選擇的MLG的相對豐度譜)、樣本疾病狀態(tài)(訓(xùn)練樣本的樣本疾病狀為向量,1代表RA,0代表對照)和測試集(只是測試集中選擇的MLG的相對豐度譜)。然后本發(fā)明人采用來自R軟件的隨機(jī)森林軟件包的隨機(jī)森林函數(shù)構(gòu)建分類,并采用預(yù)測函數(shù)來預(yù)測測試集。輸出為預(yù)測結(jié)果(患病概率,閾值為0.5,且如果患病概率≥0.5,則受試者有風(fēng)險(xiǎn)患有RA)。表1-2.訓(xùn)練集的樣本信息(選自表1-1中的用于基因目錄構(gòu)建的樣本)2.結(jié)果基于微生物群的RA患者的鑒定和驗(yàn)證為了進(jìn)一步說明RA相關(guān)的微生物群的診斷或預(yù)后價(jià)值,本發(fā)明人首先基于腸道MLG構(gòu)建隨機(jī)森林疾病分類器。采用來自對照和病例的85個(gè)腸道MLG標(biāo)記物(至少100個(gè)基因)中的29個(gè)腸道MLG標(biāo)記物的模型給出了訓(xùn)練集(n=157)(圖1a、表2-1、表2-2、表5、表8-1、表8-2)中最低的預(yù)測誤差和接受者操作特征(ROC)曲線下面積(AUC)為0.977。關(guān)于由具有血緣關(guān)系的病例-對照對和不具有血緣關(guān)系的病例-對照對(n=34,表1-3)組成的測試集,整體錯誤率為32%(圖1b,表11)且AUC為0.706。因此,基于腸道MLG的模型對訓(xùn)練集和適用情況下對測試集的效能堪比或超過現(xiàn)有的基于RA血清標(biāo)記物的分類器的效能(VanderHelm-vanMil,A.H.M.Riskestimationinrheumatoidarthritis-frombenchtobedside.Nat.Rev.Rheumatol.(2014).doi:10.1038/nrrheum.2013.215,通過引用并入本文)。類似地,選自171個(gè)牙齒MLG(至少100個(gè)基因)的28個(gè)MLG(表3-1,表3-2,表6,表9-1,表9-2)在訓(xùn)練集中給出0.864的AUC(圖1d)。選自142個(gè)唾液MLG(至少100個(gè)基因)的19個(gè)MLG(表4-1,表4-2,表7,表10-1,表10-2)給出0.898的AUC(圖1f)。這些結(jié)果表明糞便、牙齒和唾液微生物標(biāo)記物對診斷RA都非常有用。此外,對經(jīng)DMARD治療的患者樣本(表1-3)測試腸道和牙齒MLG分類器仍然將它們中的大部分鑒定為RA患者,而具有低疾病活性的牙齒樣本(DAS28)更常被歸類為健康的(圖1c,1e,表12),說明牙齒微生物群如實(shí)地表明了DMARD治療的效果。此外,來自經(jīng)DMARD治療的患者的唾液樣本通常被分類為對照,可能是由于DMARD對唾液微生物群的直接調(diào)節(jié)(圖1g,表12)??傊?,結(jié)果表明腸道和口腔MLG可以區(qū)分有效和無效治療并且促進(jìn)對治療策略的評估。表1-3測試集的樣本信息表5.29個(gè)腸道最佳標(biāo)記物的SEQIDMLGIDSEQIDNO:基因數(shù)mlg_id:24411~159159mlg_id:4103160~304145mlg_id:4212305~709405mlg_id:1047710~856147mlg_id:1735857~1536680mlg_id:43601537~1646110mlg_id:17961647~1798152mlg_id:33961799~2071273mlg_id:24722072~2309238mlg_id:12612310~2991682mlg_id:18322992~3093102mlg_id:66383094~3214121mlg_id:17223215~3353139mlg_id:14233354~3455102mlg_id:11703456~3558103mlg_id:32153559~3739181mlg_id:40953740~4381642mlg_id:26374382~4754373mlg_id:9054755~4885131mlg_id:41114886~67431858mlg_id:17106744~6862119mlg_id:26336863~7113251mlg_id:8197114~7425312mlg_id:41587426~7736311mlg_id:5277737~7854118mlg_id:7847855~8048194mlg_id:24738049~8758710mlg_id:7818759~8869111mlg_id:58870~9319450表6.28個(gè)牙齒最佳標(biāo)記物的SEQID表7.19個(gè)唾液最佳標(biāo)記物的SEQIDMLGIDSEQIDNO:基因數(shù)mlg_id:12381~126126mlg_id:1559127~231105mlg_id:6908232~360129mlg_id:1141361~519159mlg_id:6746520~697178mlg_id:1698~56804983mlg_id:276835681~5851171mlg_id:13745852~6032181mlg_id:136033~84822450mlg_id:10738483~95971115mlg_id:299598~10469872mlg_id:63610470~11246777mlg_id:965111247~11383137mlg_id:30511384~11485102mlg_id:1211486~142282743mlg_id:2014229~162392011mlg_id:283116240~176051366mlg_id:1362117606~18115510mlg_id:2761618116~18238123因此,本發(fā)明人給基于RA相關(guān)的基因標(biāo)記物通過隨機(jī)森林模型已經(jīng)鑒別出并驗(yàn)證了標(biāo)記物組(29個(gè)腸道MLG\28個(gè)牙齒MLG\19個(gè)唾液MLG)。并且本發(fā)明人已經(jīng)構(gòu)建出基于這些RA相關(guān)的腸道微生物群來評估RA疾病的風(fēng)險(xiǎn)的RA分類器。盡管已經(jīng)示出和描述了示例性實(shí)施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述實(shí)施例不能被解釋為限制本公開,并且可以在不脫離本公開的精神、原理和范圍的情況下對實(shí)施例進(jìn)行改變、替換和修改。當(dāng)前第1頁1 2 3