無
技術(shù)領(lǐng)域:
本發(fā)明涉及生物醫(yī)學領(lǐng)域,且特別地涉及用于預(yù)測與微生物群有關(guān)的疾病,特別是類風濕性關(guān)節(jié)炎(RA)的風險的生物標記物和方法。
背景技術(shù):
:類風濕性關(guān)節(jié)炎(RA)是影響全球數(shù)千萬人口的使人衰弱的自身免疫性疾病并增加了患有其心血管和其它全身性并發(fā)癥的患者的死亡率,但RA的病因仍不清楚。傳染性病原體一直與RA有牽連。然而,RA相關(guān)的病原體的特征和致病性很大程度上是不清楚的,而最近確定人體是寄宿數(shù)以萬億計的有益以及有害微生物的超級有機體(super-organism)使問題進一步復(fù)雜化。盡管使用疾病緩解性抗風濕藥(DMARD)成功減輕了許多RA患者的狀態(tài),但是對觸發(fā)或促進疾病的因素的不充分認識阻礙了開發(fā)特異性和更有效的治療方法。對微生物的調(diào)查研究也揭示了預(yù)防或減輕RA的益生菌。認為在關(guān)節(jié)炎癥發(fā)病前RA在某些其它身體部位發(fā)起并潛伏了數(shù)年。腸道微生物群是人類健康的關(guān)鍵環(huán)境因素,在肥胖、糖尿病、結(jié)腸癌等中具有確定的作用。除了在營養(yǎng)和異生物代謝方面起作用外,末端腸道中的微生物還與神經(jīng)-免疫-內(nèi)分泌系統(tǒng)和血流相互作用以影響整個人體。腸微生物群與給定個體穩(wěn)定相關(guān),增加了其在疾病相關(guān)研究中的價值。人群中腸道微生物群的異質(zhì)性表明,疾病的治療應(yīng)該根據(jù)腸道微生物群個體化,其在藥物激活或失活、免疫調(diào)節(jié)等中的作用很大程度上仍然不清楚。與道微生物群相比,口腔微生物群相對地處于研究中,其中人類微生物群計劃(HMP)僅采集了約100名健康個體用于WGS(HumanMicrobiomeProjectConsortium.Aframeworkforhumanmicrobiomeresearch.Nature486,215–21(2012),通過引用并入本文)。盡管事實上牙齒和唾液樣本在門診治療中比糞便樣本更容易獲得,但是一直以來缺乏對口腔微生物群在疾病中作用的宏基因組分析糞便。還未知的是口腔和腸道微生物疾病標記物在它們的特性或功能方面一致到何種程度。技術(shù)實現(xiàn)要素:本公開的實施方式旨在至少在一定程度上解決現(xiàn)有技術(shù)中存在的問題的至少之一。本發(fā)明是基于本發(fā)明人的以下發(fā)現(xiàn):腸道微生物的評估和表征已經(jīng)成為包括類風濕性關(guān)節(jié)炎(RA)的人類疾病的主要研究領(lǐng)域。為了對RA患者的腸道微生物內(nèi)容物進行分析,本發(fā)明人基于對來自212個個體的微生物DNA進行深度鳥槍法測序進行了宏基因組關(guān)聯(lián)分析(Metagenome-WideAssociationStudy,MGWAS)(Qin,J.等人.Ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.Nature490,55–60(2012),通過引用并入本文)的方案。本發(fā)明人基于RA-相關(guān)的基因標記物通過隨機森林模型鑒定出并證實了腸道/牙齒/唾液標記物組(29個腸道MLG\28個牙齒MLG\19個唾液MLG)。為了基于這些29個腸道MLG\28個牙齒MLG\19個唾液MLG直觀地評估RA疾病的風險,本發(fā)明人基于訓(xùn)練集中的MLG標記物的相對豐度譜通過隨機森林模型分別計算了疾病的概率。本發(fā)明人的數(shù)據(jù)提供了對與RA風險相關(guān)的腸道/牙齒/唾液宏基因組的特征的深入理解,對將來研究腸道/牙齒/唾液宏基因組在其它相關(guān)疾病中的病理生理學作用提供了范例,以及提供了基于微生物群的用于評估個體有風險患有這種疾病的方法的潛在用途。據(jù)認為,由于以下原因,RA-相關(guān)的腸道微生物群(29個腸道MLG\28個牙齒MLG\19個唾液MLG)對在早期階段增加RA檢測是有價值的。第一,本發(fā)明的標記物具有特異性和靈敏性。第二,糞便的分析保證準確性、安全性、可負擔性和患者依從性。并且糞便的樣本是可運輸?shù)??;诰酆厦告湻磻?yīng)(PCR)的試驗舒適且無創(chuàng),所以人們會更容易參與給定的篩選程序。第三,本發(fā)明的標記物還可以用作用于對RA患者進行治療監(jiān)測的工具以檢測對治療的響應(yīng)。一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標記物組,且根據(jù)本公開的實施方式,該生物標記物組由腸道生物標記物、牙齒生物標記物、唾液生物標記物或具有包括SEQIDNO:1至15843的至少部分序列的基因組DNA的微生物組成,其中腸道生物標記物包括齒雙歧桿菌(Bifidobacteriumdentium)、RA-2633、腸球菌屬(Enterococcussp.)、RA-781、Gordonibacterpamelaeae、RA-3396、RA-6638、RA-2441、RA-527、梭狀芽孢桿菌屬(Clostridiumsp.)、RA-2637、檸檬酸桿菌屬(Citrobactersp.)、真桿菌屬(Eubacteriumsp.)、檸檬酸桿菌屬、RA-3215、Con-1722、Con-4360、Con-4212、Con-1261、兩歧雙歧桿菌(Bifidobacteriumbifidum)、肺炎克雷伯菌(Klebsiellapneumoniae)、Con-1423、韋榮氏球菌屬(Veillonellasp.)、Con-4095、Con-4103、Con-1735、Con-1710、Con-1832、Con-1170,牙齒生物標記物包括RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757、Con-530,以及唾液生物標記物包括RA-27683、RA-9651、RA-13621、RA-27616、Con-6908、Con-305、Con-1559、Con-1374、Con-6746、直腸彎曲桿菌(Campylobacterrectus)、Con-1141、Con-20、鏈球菌屬(Streptococcussp.)、Con-1238、Con-1073、Con-636、Con-1、牙齦卟啉單胞菌(Porphyromonasgingivalis)、乳球菌屬(Lactococcussp.),或者基因組DNA包含SEQIDNO:1至15843的至少部分序列的微生物。可選地,生物標記物組由列于表3-2中的種屬中的至少一種種屬組成,優(yōu)選地由至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%的列于表3-2中的種屬組成。根據(jù)本公開的實施方式,牙齒生物標記物包括如表6中所述的SEQIDNO:1至15843的至少部分序列。根據(jù)本公開的實施方式,腸道生物標記物包括齒雙歧桿菌JCVIHMP022、普氏菌CB7(PrevotellacopriCB7)、DSM18205、屎腸球菌E980(EnterococcusfaeciumE980)、卵形瘤胃球菌A2-162(RuminococcusobeumA2-162)、Gordonibacterpamelaeae7-10-1-bT、DSM19378、布氏瘤胃球菌L2-63(RuminococcusbromiiL2-63)、凸腹真桿菌ATCC27560(EubacteriumventriosumATCC27560)、產(chǎn)酸克雷伯菌KCTC1686(KlebsiellaoxytocaKCTC1686)、ClostridiumasparagiformeDSM15981、普氏菌CB7(PrevotellacopriCB7)、DSM18205、弗氏檸檬酸桿菌4_7_47CFAA(Citrobacterfreundii4_7_47CFAA)、真桿菌屬3_1_31(Eubacteriumsp.3_1_31)、檸檬酸桿菌屬30_2(Citrobactersp.30_2)、梭狀芽孢桿菌屬7_2_43FAA(Clostridiumsp.7_2_43FAA)、羅氏弧菌M50/1(RoseburiaintestinalisM50/1)、DialisterinvisusDSM15470、BacteroidesplebeiusM12、DSM17135、兩歧雙歧桿菌S17(BifidobacteriumbifidumS17)、肺炎克雷伯菌NTUH-K2044(KlebsiellapneumoniaeNTUH-K2044)、韋榮氏球菌屬口腔分類群158F0412(Veillonellasp.oraltaxon158F0412)、睪丸酮叢毛單胞菌KF-1(ComamonastestosteroniKF-1)、肺炎克雷伯菌NTUH-K2044(KlebsiellapneumoniaeNTUH-K2044)、非典型韋榮球菌ACS-134-V-Col7a(VeillonellaatypicaACS-134-V-Col7a)、澳大利亞鏈球菌ATCC700641(StreptococcusaustralisATCC700641)、ParabacteroidesmerdaeATCC43184,牙齒生物標記物包括放線菌屬口腔分類群180F0310(Actinomycessp.oraltaxon180F0310)、粘滑羅斯菌DY-18(RothiamucilaginosaDY-18)、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、非典型韋榮球菌ACS-134-V-Col7a(VeillonellaatypicaACS-134-V-Col7a)、放線菌屬F0384(Actinomycessp.F0384)、放線菌屬口腔分類群848F0332(Actinomycessp.oraltaxon848F0332)、粘膜奈瑟菌M26(NeisseriamucosaM26)、ATCC25996、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、福賽斯坦納菌ATCC43037(TannerellaforsythensisATCC43037)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、桿狀奈瑟菌ATCCBAA-1200(NeisseriabacilliformisATCCBAA-1200)、互養(yǎng)菌門細菌SGP1(SynergistetesbacteriumSGP1)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、牙齦二氧化碳嗜纖維菌ATCC33624(CapnocytophagagingivalisATCC33624)、人心桿菌ATCC15826(CardiobacteriumhominisATCC15826)、牙齦二氧化碳嗜纖維菌ATCC33624(CapnocytophagagingivalisATCC33624)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、懶惰約翰森菌ATCC51276(JohnsonellaignavaATCC51276)、費氏丙酸桿菌謝氏CIRM-BIA1(PropionibacteriumfreudenreichiishermaniiCIRM-BIA1)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、梭桿菌屬口腔分類群370F0437(Fusobacteriumsp.oraltaxon370F0437)、奇異口動菌ATCC51599(LautropiamirabilisATCC51599)、侵蝕艾肯菌ATCC23834(EikenellacorrodensATCC23834)、有害新月形單胞菌ATCC43541(SelenomonasnoxiaATCC43541)、利氏卟啉單胞菌DSM23370(PorphyromonasleviiDSM23370)、BulleidiaextructaW1219,唾液生物標記物包括溶血孿生球菌ATCC10379(GemellahaemolysansATCC10379)、非典型韋榮球菌ACS-049-V-Sch6(VeillonellaatypicaACS-049-V-Sch6)、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、齲齒放線菌ATCC17982(ActinomycesodontolyticusATCC17982)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、文氏密螺旋體ATCC35580(TreponemavincentiiATCC35580)、澳大利亞鏈球菌ATCC700641(StreptococcusaustralisATCC700641)、直腸彎曲桿菌RM3267(CampylobacterrectusRM3267)、CCUG20446、放線菌屬口腔分類群171F0337(Actinomycessp.oraltaxon171F0337)、齒垢密螺旋體ATCC35405(TreponemadenticolaATCC35405)、血鏈球菌VMC66(StreptococcussanguinisVMC66)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、放線菌屬口腔分類群448F0400(Actinomycessp.oraltaxon448F0400)、桿狀奈瑟菌ATCCBAA-1200(NeisseriabacilliformisATCCBAA-1200)、鼻疽伯克霍爾德氏菌PRL-20(BurkholderiamalleiPRL-20)、牙齦卟啉單胞菌TDC60(PorphyromonasgingivalisTDC60)、乳酸乳球菌乳亞種KF147(LactococcuslactislactisKF147)。在本公開的另一方面,提供了用于預(yù)測受試者與微生物群有關(guān)的疾病的生物標記物組,根據(jù)本公開的實施方式,該生物標記物組由腸道生物標記物、牙齒生物標記物和唾液標記物組成,其中牙齒生物標記物包括SEQIDNO:1至15843的至少部分序列。根據(jù)本公開的實施方式,疾病為類風濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了用于確定上述基因標記物組的試劑盒,包括用于PCR擴增和根據(jù)如下列出的DNA序列設(shè)計的引物:牙齒生物標記物包括SEQIDNO:1至15843的至少部分序列。在本公開的另一方面,提供了用于確定上述基因標記物組的試劑盒,包括一種以上根據(jù)如下所列出的基因設(shè)計的探針:牙齒生物標記物包括SEQIDNO:1至15843的至少部分序列。在本公開的另一方面,提供了上述基因標記物組用于預(yù)測待測受試者類風濕性關(guān)節(jié)炎或相關(guān)疾病的風險的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物的相對豐度信息;(3)通過采用多元統(tǒng)計模型將待測受試者的各個生物標記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進行比較獲得類風濕性關(guān)節(jié)炎的概率,其中類風濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計模型基于多個患有類風濕性關(guān)節(jié)炎的受試者和多個正常受試者的各個生物標記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計模型為隨機森林模型。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物,各列表示樣本,各個單元表示樣本中的生物標記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實施方式,RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757和Con-530中的每一個的相對豐度信息,例如放線菌屬口腔分類群180F0310、粘滑羅斯菌DY-18、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982、非典型韋榮球菌ACS-134-V-Col7a、放線菌屬F0384、放線菌屬口腔分類群848F0332、粘膜奈瑟菌M26、ATCC25996、放線菌屬口腔分類群448F0400、福賽斯坦納菌ATCC43037、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、互養(yǎng)菌門細菌SGP1、奇異口動菌ATCC51599、牙齦二氧化碳嗜纖維菌ATCC33624、人心桿菌ATCC15826、牙齦二氧化碳嗜纖維菌ATCC33624、奇異口動菌ATCC51599、懶惰約翰森菌ATCC51276、費氏丙酸桿菌謝氏CIRM-BIA1、齒垢密螺旋體ATCC35405、梭桿菌屬口腔分類群370F0437、奇異口動菌ATCC51599、侵蝕艾肯菌ATCC23834、有害新月形單胞菌ATCC43541、利氏卟啉單胞菌DSM23370、BulleidiaextructaW1219的相對豐度是根據(jù)SEQIDNO:1至15843的相對豐度信息獲得的。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為表9-1和表9-2的至少之一,且類風濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了上述基因標記物在制備用于預(yù)測待測受試者類風濕性關(guān)節(jié)炎或相關(guān)疾病的風險的試劑盒的用途,包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物的相對豐度信息;(3)通過采用多元統(tǒng)計模型將待測受試者的各個生物標記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進行比較獲得類風濕性關(guān)節(jié)炎的概率,其中類風濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計模型基于多個患有類風濕性關(guān)節(jié)炎的受試者和多個正常受試者的各個生物標記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計模型為隨機森林模型。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物,各列表示樣本,各個單元表示樣本中的生物標記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實施方式,其中RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757和Con-530中的每一個的相對豐度信息,例如放線菌屬口腔分類群180F0310、粘滑羅斯菌DY-18、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982、非典型韋榮球菌ACS-134-V-Col7a、放線菌屬F0384、放線菌屬口腔分類群848F0332、粘膜奈瑟菌M26、ATCC25996、放線菌屬口腔分類群448F0400、福賽斯坦納菌ATCC43037、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、互養(yǎng)菌門細菌SGP1、奇異口動菌ATCC51599、牙齦二氧化碳嗜纖維菌ATCC33624、人心桿菌ATCC15826、牙齦二氧化碳嗜纖維菌ATCC33624、奇異口動菌ATCC51599、懶惰約翰森菌ATCC51276、費氏丙酸桿菌謝氏CIRM-BIA1、齒垢密螺旋體ATCC35405、梭桿菌屬口腔分類群370F0437、奇異口動菌ATCC51599、侵蝕艾肯菌ATCC23834、有害新月形單胞菌ATCC43541、利氏卟啉單胞菌DSM23370、BulleidiaextructaW1219的相對豐度是根據(jù)SEQIDNO:1至15843的相對豐度信息獲得的。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為表9-1和表9-2的至少之一,且類風濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。在本公開的另一方面,提供了診斷受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風險發(fā)展與微生物群有關(guān)的異常狀態(tài)的方法,包括:確定來自受試者的樣本中的上述生物標記物的相對豐度,和基于該相對豐度確定受試者是否具有與微生物群有關(guān)的異常狀態(tài)或者有風險發(fā)展與微生物群有關(guān)的異常狀態(tài)。根據(jù)本公開的實施方式,該方法包括:(1)從待測受試者中采集樣本;(2)確定步驟(1)中獲得的樣本中根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物的相對豐度信息;(3)通過采用多元統(tǒng)計模型將待測受試者的各個生物標記物的相對豐度信息與訓(xùn)練數(shù)據(jù)集進行比較獲得類風濕性關(guān)節(jié)炎的概率,其中類風濕性關(guān)節(jié)炎的概率大于閾值表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集是采用多元統(tǒng)計模型基于多個患有類風濕性關(guān)節(jié)炎的受試者和多個正常受試者的各個生物標記物的相對豐度信息構(gòu)建的,可選地,多元統(tǒng)計模型為隨機森林模型。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為矩陣,其中各行表示根據(jù)權(quán)利要求1至5中任一項所述的生物標記物組的各個生物標記物,各列表示樣本,各個單元表示樣本中的生物標記物的相對豐度譜,且樣本疾病狀態(tài)為向量,其中1表示類風濕性關(guān)節(jié)炎且0表示對照。根據(jù)本公開的實施方式,其中RA-10848、RA-9842、RA-9941、RA-9938、RA-10684、RA-9998、Con-7913、Con-20702、Con-11、Con-8169、Con-1708、Con-7847、Con-5233、Con-791、Con-5566、Con-4455、Con-13169、Con-6088、Con-5554、Con-14781、Con-2466、Con-483、Con-2562、Con-4701、Con-4824、Con-5030、Con-757和Con-530中的每一個的相對豐度信息,例如放線菌屬口腔分類群180F0310、粘滑羅斯菌DY-18、ActinomycesgraevenitziiC83、齲齒放線菌ATCC17982、非典型韋榮球菌ACS-134-V-Col7a、放線菌屬F0384、放線菌屬口腔分類群848F0332、粘膜奈瑟菌M26、ATCC25996、放線菌屬口腔分類群448F0400、福賽斯坦納菌ATCC43037、放線菌屬口腔分類群448F0400、桿狀奈瑟菌ATCCBAA-1200、互養(yǎng)菌門細菌SGP1、奇異口動菌ATCC51599、牙齦二氧化碳嗜纖維菌ATCC33624、人心桿菌ATCC15826、牙齦二氧化碳嗜纖維菌ATCC33624、奇異口動菌ATCC51599、懶惰約翰森菌ATCC51276、費氏丙酸桿菌謝氏CIRM-BIA1、齒垢密螺旋體ATCC35405、梭桿菌屬口腔分類群370F0437、奇異口動菌ATCC51599、侵蝕艾肯菌ATCC23834、有害新月形單胞菌ATCC43541、利氏卟啉單胞菌DSM23370、BulleidiaextructaW1219的相對豐度是根據(jù)SEQIDNO:1至15843的相對豐度信息獲得的。根據(jù)本公開的實施方式,訓(xùn)練數(shù)據(jù)集為表9-1和表9-2的至少之一,且類風濕性關(guān)節(jié)炎的概率為至少0.5表明待測受試者患有類風濕性關(guān)節(jié)炎或相關(guān)疾病或者有風險發(fā)展類風濕性關(guān)節(jié)炎或相關(guān)疾病。附圖說明本公開的這些和其它的方面和優(yōu)點從以下結(jié)合附圖的描述中將變得明顯和更容易理解,其中:圖1腸道或口腔MLG允許從健康對照中分類RA患者。(a,d,f)由未治療的RA病例和無關(guān)的正常對照組成的糞便(a)、牙齒(d)和唾液(f)的訓(xùn)練集的ROC曲線(對于糞便、牙齒和唾液樣本,分別為n=157,100,94)。圓點標記了最佳閾值概率的假陽性率和真陽性率。(b)對由彼此具有血緣關(guān)系或不具有血緣關(guān)系的17個對照和17個RA病例組成的糞便測試集進行分類。(c,e,g)對DMARD治療后的糞便(c)、牙齒(e)和唾液(g)的RA樣本進行分類(對于糞便、牙齒和唾液樣本,分別為n=40,38,24)。根據(jù)歐洲抗風濕聯(lián)盟(EULAR)標準,DAS28<2.6表明癥狀緩解。所有樣本的分類結(jié)果列于表12。具體實施方式實施例本文所使用的術(shù)語具有本發(fā)明相關(guān)領(lǐng)域的普通技術(shù)人員通常理解的含義。術(shù)語,如“一”、“一個”和“該”并非旨在僅指單數(shù)實體,而是包含采用具體實施方式來說明的一般類別。除了如在權(quán)利要求中概述的之外,本文中的術(shù)語用于描述本發(fā)明的具體實施方式,但是它們的用法不限制本發(fā)明。在以下的非限制性實施例中進一步舉例說明本發(fā)明。除非另有說明,份數(shù)和百分比以重量計且度數(shù)為攝氏度。如本領(lǐng)域一個普通技術(shù)人員所明白的,這些實施例,雖然表明了本發(fā)明的優(yōu)選實施方式,但僅以說明的方式給出,并且試劑均是市售可獲得的。實施例1.鑒別和驗證用于評估類風濕性關(guān)節(jié)炎風險的生物標記物1.材料和方法1.1樣本采集和DNA提取本發(fā)明人采集了一共212名個體的糞便樣本(表1-1,糞便樣本、牙菌斑樣本和唾液樣本),包含訓(xùn)練集(n=157,77治療空白的(為經(jīng)治療的)RA病例和80名健康對照)和測試集(對于相關(guān)病例-對照對,n=34,即8個有血緣關(guān)系的病例-對照對和9個不具有血緣關(guān)系的病例-對照對;對于DMARD-治療的RA患者,n=21)。糞便樣本是在北京協(xié)和醫(yī)院采集,冷凍運輸并如前所述在BGI-深圳(深圳華大基因)進行提取(Qin,J.等人.Ametagenome-wideassociationstudyofgutmicrobiotaintype2diabetes.Nature490,55–60(2012),通過引用并入本文)。牙菌斑是用眼科鑷子從牙齒表面刮取的直達具有3μl的體積。將樣本轉(zhuǎn)移至200μl含有10mMTris、1mMEDTA、0.5%吐溫20和200μg/ml蛋白酶K(Fermentas)的1×裂解緩沖液并在55℃下孵育2小時。通過在95℃下孵育10分鐘終止裂解,并在運輸前將樣本冷凍在-80℃。按照針對糞便樣本的方案進行DNA提取。對于唾液,將100μl唾液加入到100μl的2×裂解緩沖液中,擦拭后咽壁并加入到同一試管中,然后如牙齒樣本一樣對樣品進行裂解和提取。根據(jù)2010ACR/EULAR分類標準在北京協(xié)和醫(yī)院對RA進行診斷。根據(jù)標準程序,在受試者到醫(yī)院初診時采集所有表型信息。招募18至65歲之間,疾病持續(xù)時間至少6周,至少1處關(guān)節(jié)腫脹和3處關(guān)節(jié)壓痛的RA患者。如果患者具有慢性嚴重感染史、任何當前感染或任何類型的癌癥,則將他們排除在外。將孕婦或哺乳期婦女排除在外。告知所有患者具有不孕的風險并將想要孩子的患者排除在外。盡管一些患者已經(jīng)患RA多年,但他們是未用DMARD的,因為他們在就診北京協(xié)和醫(yī)院之前沒有在當?shù)蒯t(yī)院被診斷患有RA,而且他們僅服用止痛藥來緩解RA癥狀。根據(jù)標準程序,在受試者到醫(yī)院初診時采集所有表型信息。212個用于腸道微生物基因目錄構(gòu)建的樣本中僅有21個來自DMARD-治療的患者的糞便樣本且在這篇文章中沒有進行分析。這項研究得到了北京協(xié)和醫(yī)院和深圳華大基因的機構(gòu)審查委員會的批準。表1-1.用于基因目錄構(gòu)建的樣本1.2宏基因組測序和組裝如前所述(Qin等人.2012,supra),在Illumina平臺上進行雙末端宏基因組測序(插入片段350bp,序列長度100bp),對測序讀段進行質(zhì)量控制并采用SOAPdenovov2.04將測序讀段重新組裝成重疊群(Luo,R.等人.SOAPdenovo2:anempiricallyimprovedmemory-efficientshort-readdenovoassembler.Gigascience1,18(2012).,通過引用并入本文)。宿主污染的平均率對糞便樣本來說為0.37%,對牙齒樣本來說為5.55%,對唾液樣本為40.85%。1.3基因目錄構(gòu)建利用GeneMarkv2.7d對經(jīng)過組裝的重疊群的基因進行預(yù)測。采用BLAT(Kent,W.J.BLAT--theBLAST-likealignmenttool.GenomeRes.12,656–64(2002),通過引用并入本文)以90%重疊和95%同一性(不允許洞的存在)的閾值去除冗余基因,對于212個糞便樣本(含有21個DMARD-治療的樣本)形成3,800,011個基因的非冗余基因目錄,對于203個口腔樣品(105個牙菌斑樣本和98個唾液樣本)形成3,234,997個基因的目錄。利用BLAT(95%的同一性,90%重疊)將來自糞便樣本的基因目錄并入已有的包含430萬個基因的腸道微生物參考目錄中(Qin等人.2012,supra),形成包含590萬個基因的最終目錄。采用與出版的T2D論文(Qin等人,2012,同上)中相同的程序通過將高質(zhì)量測序讀段與腸道或口腔參考基因目錄進行比對來確定基因的相對豐度。1.4分類注釋和豐度計算利用先前詳述的內(nèi)部流程(pipeline)(Qin等人,2012,同上)根據(jù)IMG數(shù)據(jù)庫(v400)對預(yù)測基因進行分類分配,其中對于分配至門來說,重疊70%和同一性65%,對于分配至屬來說,同一性85%,對于分配至類來說,同一性95%。從分類群基因的相對豐度計算分類群的相對豐度。通過Wilcoxon秩和檢驗(其中p<0.05)確定患者和健康對照之間分類群的相對豐度的顯著差異。1.5宏基因組關(guān)聯(lián)分析(MGWAS)對于糞便微生物群的病例-對照比較,去除在少于6個樣本(n=157)中檢測到的基因?qū)е戮哂?,110,085個基因的集。83,858個基因在對照和病例之間在相對豐度方面顯示出差異(p<0.01,Wilcoxon秩和檢驗,F(xiàn)DR=0.3285)。根據(jù)這些標記物基因在所有樣本中的豐度變化將它們聚類成MLG(Qin等人,2012,同上)。對于構(gòu)建牙齒MLG,從2,247,835個基因(存在于至少6個樣本中,n=105)中選擇209820個標記物基因(p<0.01,Wilcoxon秩和檢驗,F(xiàn)DR=0.072)。對于唾液MLG,本發(fā)明人從2,404,726個基因(存在于至少6個樣本中,n=98)中選擇206399個標記物基因(p<0.01,Wilcoxon秩和檢驗,F(xiàn)DR=0.088)。如先前所述(Qin等人,2012,同上),根據(jù)分類學和它們的組成基因的相對豐度進行分類分配和豐度分析。簡言之,分配到種需要將MLG中的超過90%的基因與種的基因組比對時具有超過95%的同一性,70%的查詢重疊。將MLG分配至屬要求其超過80%的基因與基因組比對,其中在DNA和蛋白序列中具有85%的同一性。示出與從所有基因計算的與基因組的平均同一性僅用于參考。根據(jù)MLG在所有樣本中的豐度之間的Kendall相關(guān)性而不管病例-對照狀態(tài)將MLG進一步聚類,并且同現(xiàn)網(wǎng)絡(luò)通過Cytoscape3.0.2可視化。1.6基于MLG的分類器利用訓(xùn)練群組(表1-2)的MLG豐度譜對隨機森林模型(R.2.14,randomForest4.6-7軟件包)(Liaw,Andy&Wiener,Matthew.ClassificationandRegressionbyrandomForest,RNews(2002),第2/3期,第18頁,通過引用并入本文)進行訓(xùn)練以選擇MLG標記物的最佳集。在一個以上測試集上對該模型進行測試并計算預(yù)測誤差。關(guān)于隨機森林模型,采用2.14版本的R中打包的“隨機森林4.6-7軟件包”,輸入為訓(xùn)練數(shù)據(jù)集(即訓(xùn)練樣本中選擇的MLG的相對豐度譜)、樣本疾病狀態(tài)(訓(xùn)練樣本的樣本疾病狀為向量,1代表RA,0代表對照)和測試集(只是測試集中選擇的MLG的相對豐度譜)。然后本發(fā)明人采用來自R軟件的隨機森林軟件包的隨機森林函數(shù)構(gòu)建分類,并采用預(yù)測函數(shù)來預(yù)測測試集。輸出為預(yù)測結(jié)果(患病概率,閾值為0.5,且如果患病概率≥0.5,則受試者有風險患有RA)。表1-2.訓(xùn)練集的樣本信息(選自表1-1中的用于基因目錄構(gòu)建的樣本)2.結(jié)果基于微生物群的RA患者的鑒定和驗證為了進一步說明RA相關(guān)的微生物群的診斷或預(yù)后價值,本發(fā)明人首先基于腸道MLG構(gòu)建隨機森林疾病分類器。采用來自對照和病例的85個腸道MLG標記物(至少100個基因)中的29個腸道MLG標記物的模型給出了訓(xùn)練集(n=157)(圖1a、表2-1、表2-2、表5、表8-1、表8-2)中最低的預(yù)測誤差和接受者操作特征(ROC)曲線下面積(AUC)為0.977。關(guān)于由具有血緣關(guān)系的病例-對照對和不具有血緣關(guān)系的病例-對照對(n=34,表1-3)組成的測試集,整體錯誤率為32%(圖1b,表11)且AUC為0.706。因此,基于腸道MLG的模型對訓(xùn)練集和適用情況下對測試集的效能堪比或超過現(xiàn)有的基于RA血清標記物的分類器的效能(VanderHelm-vanMil,A.H.M.Riskestimationinrheumatoidarthritis-frombenchtobedside.Nat.Rev.Rheumatol.(2014).doi:10.1038/nrrheum.2013.215,通過引用并入本文)。類似地,選自171個牙齒MLG(至少100個基因)的28個MLG(表3-1,表3-2,表6,表9-1,表9-2)在訓(xùn)練集中給出0.864的AUC(圖1d)。選自142個唾液MLG(至少100個基因)的19個MLG(表4-1,表4-2,表7,表10-1,表10-2)給出0.898的AUC(圖1f)。這些結(jié)果表明糞便、牙齒和唾液微生物標記物對診斷RA都非常有用。此外,對經(jīng)DMARD治療的患者樣本(表1-3)測試腸道和牙齒MLG分類器仍然將它們中的大部分鑒定為RA患者,而具有低疾病活性的牙齒樣本(DAS28)更常被歸類為健康的(圖1c,1e,表12),說明牙齒微生物群如實地表明了DMARD治療的效果。此外,來自經(jīng)DMARD治療的患者的唾液樣本通常被分類為對照,可能是由于DMARD對唾液微生物群的直接調(diào)節(jié)(圖1g,表12)??傊Y(jié)果表明腸道和口腔MLG可以區(qū)分有效和無效治療并且促進對治療策略的評估。表1-3測試集的樣本信息表5.29個腸道最佳標記物的SEQIDMLGIDSEQIDNO:基因數(shù)mlg_id:24411~159159mlg_id:4103160~304145mlg_id:4212305~709405mlg_id:1047710~856147mlg_id:1735857~1536680mlg_id:43601537~1646110mlg_id:17961647~1798152mlg_id:33961799~2071273mlg_id:24722072~2309238mlg_id:12612310~2991682mlg_id:18322992~3093102mlg_id:66383094~3214121mlg_id:17223215~3353139mlg_id:14233354~3455102mlg_id:11703456~3558103mlg_id:32153559~3739181mlg_id:40953740~4381642mlg_id:26374382~4754373mlg_id:9054755~4885131mlg_id:41114886~67431858mlg_id:17106744~6862119mlg_id:26336863~7113251mlg_id:8197114~7425312mlg_id:41587426~7736311mlg_id:5277737~7854118mlg_id:7847855~8048194mlg_id:24738049~8758710mlg_id:7818759~8869111mlg_id:58870~9319450表6.28個牙齒最佳標記物的SEQID表7.19個唾液最佳標記物的SEQIDMLGIDSEQIDNO:基因數(shù)mlg_id:12381~126126mlg_id:1559127~231105mlg_id:6908232~360129mlg_id:1141361~519159mlg_id:6746520~697178mlg_id:1698~56804983mlg_id:276835681~5851171mlg_id:13745852~6032181mlg_id:136033~84822450mlg_id:10738483~95971115mlg_id:299598~10469872mlg_id:63610470~11246777mlg_id:965111247~11383137mlg_id:30511384~11485102mlg_id:1211486~142282743mlg_id:2014229~162392011mlg_id:283116240~176051366mlg_id:1362117606~18115510mlg_id:2761618116~15843123因此,本發(fā)明人給基于RA相關(guān)的基因標記物通過隨機森林模型已經(jīng)鑒別出并驗證了標記物組(29個腸道MLG\28個牙齒MLG\19個唾液MLG)。并且本發(fā)明人已經(jīng)構(gòu)建出基于這些RA相關(guān)的腸道微生物群來評估RA疾病的風險的RA分類器。盡管已經(jīng)示出和描述了示例性實施例,但是本領(lǐng)域技術(shù)人員應(yīng)當理解,上述實施例不能被解釋為限制本公開,并且可以在不脫離本公開的精神、原理和范圍的情況下對實施例進行改變、替換和修改。當前第1頁1 2 3