通過(guò)大規(guī)模平行rna測(cè)序分析母親血漿轉(zhuǎn)錄組的制作方法
【專利說(shuō)明】通過(guò)大規(guī)模平行RNA測(cè)序分析母親血漿轉(zhuǎn)錄組
[0001] 相關(guān)申請(qǐng)的交叉引用
[0002] 本申請(qǐng)要求2013年2月28日提交的題目為"通過(guò)大規(guī)模平行RNA測(cè)序分析母親 血漿轉(zhuǎn)錄組"的美國(guó)臨時(shí)專利申請(qǐng)?zhí)?1/770, 985的優(yōu)先權(quán),為了所有的目的將其通過(guò)引用 并入本文。
【背景技術(shù)】
[0003] 已經(jīng)報(bào)道了母親血漿中妊娠特異性的細(xì)胞外RNA分子i。它們已經(jīng)提供了通過(guò)簡(jiǎn) 單地使用來(lái)自母親的外周血液樣品用于胎兒評(píng)估和妊娠監(jiān)測(cè)的無(wú)創(chuàng)測(cè)試工具。迄今為止, 已經(jīng)使用母親血漿RNA開(kāi)發(fā)了許多有希望的產(chǎn)前診斷應(yīng)用2 8。研究人員已經(jīng)積極搜索另外 的RNA標(biāo)記物,以便在將應(yīng)用延伸在不同的胎兒病癥和妊娠病理學(xué)背景下。
[0004] 理論上,最直接的RNA標(biāo)記物鑒定方法是直接描述母親血漿中的細(xì)胞外RNA分子。 但是,該方法是不容易的,因?yàn)槌R?guī)的高通量篩選技術(shù),比如微陣列分析和基因表達(dá)的系列 分析(SAGE),具有有限的能力檢測(cè)通常低濃度的母親血漿中部分降解的細(xì)胞外RNA9。而是, 大部分報(bào)告的RNA標(biāo)記物篩選策略通過(guò)比較胎盤和母親血細(xì)胞的表達(dá)概況而間接操作' 僅僅表達(dá)在胎盤中比在母親血細(xì)胞中表達(dá)更高的轉(zhuǎn)錄體進(jìn)一步在母親血漿樣品中通過(guò)高 靈敏度但是低通量技術(shù),比如實(shí)時(shí)逆轉(zhuǎn)錄酶聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR)研究。迄今,通過(guò)該 間接方法鑒定的血漿RNA標(biāo)記物相對(duì)有限。該可能因?yàn)榛诮M織的挖掘策略未充分考慮影 響母親血漿中胎盤RNA水平的所有的生物因素。另外,由非胎盤組織響應(yīng)妊娠表達(dá)和釋放 的轉(zhuǎn)錄體可能不被該方法鑒定。所以非常期望允許直接概述母親血漿轉(zhuǎn)錄組的靈敏和高通 量方法。
[0005] 類似地,直接血漿RNA概述可用于有來(lái)自兩個(gè)個(gè)體的RNA分子的混合物的其他情 形,比如用于器官移植。移植接受者的循環(huán)包含來(lái)自供體和接受者的核酸分子。由供體或接 受者提供的RNA分子相關(guān)圖譜的改變可揭示移植器官或接受者的病理學(xué),比如移植排斥。
[0006] 發(fā)明概述
[0007] 提供方法、系統(tǒng)和裝置用于診斷妊娠相關(guān)的病癥,確定等位基因比,確定母親或胎 兒對(duì)循環(huán)轉(zhuǎn)錄體的貢獻(xiàn),和/或使用來(lái)自妊娠女性對(duì)象的樣品鑒定母親或胎兒標(biāo)記物。在 一些實(shí)施方式中,樣品是包含源自母親和胎兒的RNA分子的混合物的血液血漿。
[0008] 分析(例如,測(cè)序)RNA分子,以獲得多個(gè)讀數(shù),和鑒定參考序列中這些讀數(shù)的位置 (例如,通過(guò)序列比對(duì))。信息型基因座鑒定為對(duì)于母親或胎兒中的第一等位基因是純合 子,和對(duì)于母親和胎兒中另一個(gè)的第一等位基因和第二等位基因是雜合子。然后過(guò)濾信息 型基因座并且進(jìn)一步分析位于(例如,對(duì)齊)過(guò)濾信息型基因座的讀數(shù)。在一些實(shí)施方式 中,計(jì)算對(duì)應(yīng)第一等位基因和第二等位基因的讀數(shù)的比例并且與截取值比較,以診斷妊娠 相關(guān)的病癥。在一些實(shí)施方式中,使用位于信息型母親基因座的讀數(shù)測(cè)定胎兒起源的樣品 中的一部分RNA。在一些實(shí)施方式中,計(jì)算個(gè)體過(guò)濾信息型基因座的對(duì)應(yīng)第一等位基因和第 二等位基因的讀數(shù)的比例,并且比例與截取值比較,以指定基因座為母親或胎兒標(biāo)記物。
[0009] 本發(fā)明不限于產(chǎn)前診斷并且可施用至包含源自兩個(gè)個(gè)體的RNA分子混合物的任 何生物樣品。例如,可使用獲得自器官移植接受者的血液血漿樣品。移植器官中表達(dá)的轉(zhuǎn)錄 體反映供體的基因型并且在接收者的血液中以可檢測(cè)的水平出現(xiàn)。通過(guò)讀取這些轉(zhuǎn)錄體, 可鑒定在供體和接受者二者的基因中表達(dá)的信息型基因座,并且可測(cè)量來(lái)自每個(gè)個(gè)體的等 位基因的相對(duì)表達(dá)水平。僅僅由于供體或接受者等位基因的異常表達(dá)水平可用于診斷移植 相關(guān)的病癥。
[0010] 可用于本發(fā)明的生物樣品包括血液、血漿、血清、尿、唾液和組織樣品。例如,已經(jīng) 在妊娠女性的尿中檢測(cè)到胎兒核酸。腎移植接受者的尿已經(jīng)顯示包含無(wú)細(xì)胞核酸和來(lái)自移 植器官的細(xì)胞。在許多情況下已經(jīng)觀察到微嵌合。微嵌合指身體中存在來(lái)自另一人的細(xì)胞 或核酸來(lái)源,包括具體個(gè)體的器官和組織。在甲狀腺、肝、脾、皮膚、骨髓和其他組織的活組 織檢查中已經(jīng)觀察到微嵌合。微嵌合可由于之前的妊娠或輸血而出現(xiàn)。
[0011] 也提供了基因用于診斷妊娠女性對(duì)象中妊娠相關(guān)的病癥的用途?;虻谋磉_(dá)水平 與從每個(gè)孕育健康胎兒的一個(gè)或多個(gè)其他女性對(duì)象確定的對(duì)照值比較。本文解決的妊娠相 關(guān)的病癥包括先兆子癇、宮內(nèi)生長(zhǎng)限制、侵入性胎盤形成和早產(chǎn)。其他妊娠相關(guān)的病癥可以 是使胎兒處在胎兒死亡風(fēng)險(xiǎn)的病況,比如新生兒的溶血病、胎盤功能不足、胎兒水腫、胎兒 畸形。仍其他妊娠相關(guān)的疾病可以是妊娠期間導(dǎo)致并發(fā)癥的病況,比如母親的ffiLLP綜合 癥、系統(tǒng)性紅斑狼瘡和其他免疫疾病。
【附圖說(shuō)明】
[0012] 圖1顯示血漿中的等位基因比B/A與各自基因的相對(duì)表達(dá)水平之間的。
[0013] 圖2顯示總基因表達(dá)水平與基因的相對(duì)表達(dá)水平之間的關(guān)系。
[0014] 圖3是診斷妊娠相關(guān)病癥的方法的流程圖。
[0015] 圖4和5顯示RNA-seq讀取比對(duì)結(jié)果的總結(jié)。
[0016] 圖6顯示來(lái)自測(cè)序兩個(gè)個(gè)體的血液血漿RNA的數(shù)據(jù)。圖6A顯示從M9356P的 RNA-seq文庫(kù)(用Ribo-ZeroGold預(yù)處理)和M9415P(不用Ribo-ZeroGold預(yù)處理)測(cè) 序讀數(shù)的GC%分布。圖6B顯示M9356P和M9415P之間基因表達(dá)概況的相關(guān)性。
[0017] 圖7顯示母親血漿中不同RNA轉(zhuǎn)錄體的RNA-SNP等位基因比和總血漿濃度,針對(duì) 相對(duì)組織表達(dá)水平(胎盤/血細(xì)胞)繪圖。
[0018] 圖8顯示包含信息型SNP的不同基因的RNA-SNP等位基因比和總血漿水平,針對(duì) 相對(duì)組織表達(dá)水平(血細(xì)胞/胎盤)繪圖。
[0019] 圖9顯示母親血漿中胎兒特異性SNP等位基因的RNA-SNP等位基因比和包含這些 等位基因的RNA轉(zhuǎn)錄體的表達(dá)水平。
[0020] 圖10顯示母親血漿中母親特異性SNP等位基因的RNA-SNP等位基因比和包含這 些等位基因的RNA轉(zhuǎn)錄體的表達(dá)水平。
[0021] 圖11顯示先兆子癇和對(duì)照對(duì)象中母親特異性SNP等位基因的數(shù)據(jù)。圖11A顯示 病例5641 (第三個(gè)三個(gè)月晚發(fā)型先兆子癇)和病例7171 (對(duì)照)對(duì)包括母親特異性SNP等 位基因的信息型SNP的RNA-SNP等位基因比。圖11B顯示病例5641相對(duì)于7171 (對(duì)照) 的那些就包括母親特異性SNP等位基因的信息型SNP的RNA-SNP等位基因比和血漿水平的 倍數(shù)差異。
[0022] 圖12顯示先兆子癇和對(duì)照對(duì)象中母親特異性SNP等位基因的數(shù)據(jù)。圖12A顯示 病例5641 (第三個(gè)三個(gè)月晚發(fā)型先兆子癇)和病例9356 (對(duì)照)的包括母親特異性SNP等 位基因的信息型SNP的RNA-SNP等位基因比。圖12B顯示RNA-SNP等位基因比和病例5641 血漿水平相對(duì)于9356的那些,包括母親特異性SNP等位基因的信息型SNP的倍數(shù)差異。
[0023] 圖13顯示圖11表格形式的數(shù)據(jù)。
[0024] 圖14顯示圖12表格形式的數(shù)據(jù)。
[0025] 圖15是在來(lái)自女性對(duì)象孕育胎兒的樣品中確定胎兒起源的一部分RNA的方法的 流程圖。
[0026] 圖16顯示母親血漿轉(zhuǎn)錄組的信息型SNP分析的結(jié)果。
[0027] 圖17顯示晚期妊娠的母親血漿樣品中沒(méi)有過(guò)濾等位基因特異性表達(dá)的相對(duì)胎兒 和母親貢獻(xiàn)。
[0028] 圖18顯示母親血漿轉(zhuǎn)錄組中的胎兒和母親貢獻(xiàn)。圖18A顯示早期妊娠和晚期妊 娠的母親血漿中源自胎兒和母親的轉(zhuǎn)錄體的比例。圖18B顯示分娩之前和之后等位基因計(jì) 數(shù)和胎兒等位基因比。
[0029] 圖19比較在一個(gè)RNA-SNP對(duì)于先兆子癇病例和對(duì)照妊娠病例的部分胎兒和母親 貢獻(xiàn)。
[0030] 圖20是將基因組基因座指定為母親或胎兒標(biāo)記物的方法的流程圖。
[0031] 圖21是妊娠相關(guān)的基因的列表。
[0032] 圖22顯示與分娩前相比,分娩后對(duì)象中更低表達(dá)水平的妊娠相關(guān)的基因。
[0033] 圖23顯示使用131個(gè)妊娠相關(guān)的基因,血漿樣品的分級(jí)聚類。
[0034] 圖24顯示胎盤、母親血細(xì)胞和母親血漿中131個(gè)妊娠相關(guān)的基因的表達(dá)水平。圖 24A是兩個(gè)晚期妊娠病例的胎盤和母親血細(xì)胞以及分娩前和分娩后母親血漿的基因表達(dá)的 熱圖(log2(轉(zhuǎn)錄體水平))。131個(gè)妊娠相關(guān)的基因優(yōu)選在胎盤中表達(dá)。圖24B顯示胎盤 和血漿中131個(gè)基因的表達(dá)水平正相關(guān)(P〈0. 05,Spearman相關(guān)性)。
[0035] 圖25比較胎兒和母親對(duì)于用基于血漿和基于組織的方法鑒定的基因在血漿中 RNA的貢獻(xiàn)。
[0036] 圖26列舉了母親血漿中98個(gè)先兆子癇相關(guān)的RNA,如通過(guò)RNA-Seq鑒定。顯示了 從無(wú)并發(fā)癥妊娠女性和已經(jīng)發(fā)展先兆子癇的女人收集的血漿中的表達(dá)水平。
[0037] 圖27顯示對(duì)于病例9415,PAPPARNA中單核苷酸多態(tài)性(SNP)位點(diǎn)的RNA-測(cè)序讀 數(shù)計(jì)數(shù)。等位基因-A是共享等位基因和等位基因-G是胎兒特異性等位基因。
[0038] 圖28顯示對(duì)于病例9415,H19RNA中單核苷酸多態(tài)性(SNP)位點(diǎn)的RNA-測(cè)序讀數(shù) 計(jì)數(shù)。
[0039] 圖29顯示通過(guò)甲基化敏感的限制酶酶切檢測(cè)母親H19甲基化狀態(tài)。
[0040] 圖30顯示用于根據(jù)本發(fā)明的實(shí)施方式的系統(tǒng)和方法的示例性計(jì)算機(jī)系統(tǒng)3000的 方塊圖。
[0041] 發(fā)明詳述
[0042] I?介紹
[0043] 十年前已經(jīng)報(bào)道了母親血漿中存在無(wú)細(xì)胞胎兒RNA11。該發(fā)現(xiàn)之后,開(kāi)始進(jìn)行許多 研究,以檢測(cè)母親血漿中胎兒和胎盤起源的循環(huán)RNA1'%12。有趣地,發(fā)現(xiàn)血漿中胎盤特異性 轉(zhuǎn)錄體的表達(dá)水平與胎盤組織中的那些正相關(guān) ' 強(qiáng)調(diào)了血漿RNA分析作為無(wú)創(chuàng)工具的臨 床用途,以監(jiān)測(cè)胎盤或胎兒健康和發(fā)育。的確,母親循環(huán)RNA的檢查已經(jīng)發(fā)現(xiàn)臨床用于妊娠 相關(guān)的或胎盤相關(guān)的病癥,比如先兆子癇2'1315,宮內(nèi)生長(zhǎng)遲緩4和早產(chǎn) 8,以及用于無(wú)創(chuàng)測(cè)試 胎兒染色體非整倍性5'7'16。這樣的開(kāi)發(fā)突出了RNA生物標(biāo)記用于分子評(píng)估產(chǎn)前病癥的潛在 用途。
[0044] 盡管血漿RNA分析在產(chǎn)前測(cè)試中有希望的展望,迄今母親血漿中充分驗(yàn)證的妊娠 相關(guān)的或胎盤相關(guān)的轉(zhuǎn)錄體的數(shù)量仍有限。在這點(diǎn)上,使用逆轉(zhuǎn)錄酶(RT)-PCR進(jìn)行血漿中 1^八生物標(biāo)記的檢查1'4'8' 1°'12'13,其是每次分析通常靶向相對(duì)少量1^4種類的靈敏方法。重 要地,這些研究主要關(guān)注在妊娠相關(guān)的基因主要源自胎盤的前提下,與母親血細(xì)胞相比,胎 盤中具有相對(duì)高表達(dá)水平的基因。這樣的方法已經(jīng)鑒定了胎盤中高表達(dá)的妊娠相關(guān)的RNA 靶,但是可能錯(cuò)過(guò)其他重要的靶。此外,考慮血漿RNA的低濃度和差的完整性9'15,常規(guī)的高 通量方法比如基因表達(dá)的系列分析和微陣列分析可能對(duì)于直接檢查血漿轉(zhuǎn)錄組不夠剛健。
[0045] 通過(guò)RNA分析的大規(guī)模平行測(cè)序(MPS),即RNA-測(cè)序(RNA-seq),可潛在解決血漿 RNA分析的前述技術(shù)局限17'18??紤]改善的靈敏度和寬的動(dòng)態(tài)范圍,RNA-seq已經(jīng)用于檢查 許多人組織,包括胎盤中的基因表達(dá)19。通過(guò)其在直接概述健康的個(gè)體 2°和妊娠女性21'22中 血漿miRNA的可行性進(jìn)一步表明了MPS的優(yōu)勢(shì)。然而,血漿轉(zhuǎn)錄組的完整圖譜仍不清楚,其 可能由于血漿中與短miRNA相比長(zhǎng)RNA種類更低的穩(wěn)定性23。
[0046] 在該研究中,我們已經(jīng)顯示可在母親血漿中檢測(cè)源自胎兒和母親的轉(zhuǎn)錄體并且可 使用RNA-seq,通過(guò)檢查胎兒特異性和母親特異性單核苷酸多態(tài)性(SNP)評(píng)估它們的相對(duì) 貢獻(xiàn)。另外,可監(jiān)測(cè)母親血漿中胎盤的等位基因特異性表達(dá)模式。我們也已經(jīng)表明可通過(guò) 直接檢查分娩之前和之后母親血漿鑒定妊娠相關(guān)的轉(zhuǎn)錄體。
[0047] II.使用SNP等位基因比診斷妊娠相關(guān)的病癥的方法
[0048] 基因表達(dá)概況的分析用于檢測(cè)個(gè)體的疾病狀態(tài)。本發(fā)明的實(shí)施方式包括通過(guò)分析 來(lái)自兩個(gè)不同個(gè)體的RNA分子的混合物分析個(gè)體表達(dá)概況的方法。方法使用一個(gè)個(gè)體特異 的等位基因和兩個(gè)個(gè)體之間共享的等位基因的相對(duì)豐度?;诠蚕淼暮蛡€(gè)體特異性等位基 因的相對(duì)豐度,可測(cè)定兩個(gè)個(gè)體的基因表達(dá)概況。本發(fā)明一種可能的應(yīng)用是通過(guò)分析包含 來(lái)自胎兒和妊娠女性二者的RNA的母親血漿樣品中的RNA,分析胎兒基因表達(dá)概況。另一應(yīng) 用是從移植接受者收集的包含來(lái)自供體和接受者二者的RNA的血漿樣品中源自供體的RNA 的基因表達(dá)概況的分析。
[0049] 在包含來(lái)自兩個(gè)個(gè)體的RNA的混合物中,每個(gè)個(gè)體的表達(dá)概況不能基于混合物中 不同RNA轉(zhuǎn)錄體的總量分析而確定,因?yàn)殡y以確定每個(gè)個(gè)體對(duì)總RNA的相對(duì)貢獻(xiàn)。不同RNA 轉(zhuǎn)錄體的相對(duì)豐度可用于監(jiān)測(cè)個(gè)體的健康或檢測(cè)疾病狀態(tài)。
[0050] 在該方法中,可首先通過(guò)個(gè)體的直接基因分型或通過(guò)家族分析來(lái)確定兩個(gè)個(gè)體的 基因型。例如,如果父母具有基因型AA和TT,那么胎兒的基因型應(yīng)是AT。
[0051] 下述假設(shè)的例子圖解了該方法的原理。對(duì)于每個(gè)感興趣的的基因,編碼區(qū)域中存 在SNP,從而在不同基因的RNA轉(zhuǎn)錄體中可觀察多態(tài)性。假設(shè)胎兒和妊娠女性的基因型分 別是AB和AA。因此,B等位基因?qū)τ谔菏翘禺愋缘暮虯等位基因是胎兒和母親之間共享 的。胎盤和母親血細(xì)胞中不同基因的相對(duì)表達(dá)水平如表1中所顯示。
[0052] 在該例子中,我們假設(shè)胎盤和母親血細(xì)胞為母親血漿貢獻(xiàn)相對(duì)相等比例的每個(gè)它 們RNA轉(zhuǎn)錄體的2%。換句話說(shuō),如果基因的胎盤表達(dá)水平是10000,其將為母親血漿貢獻(xiàn) 200個(gè)該基因的RNA轉(zhuǎn)錄體。如圖1中所顯示,等位基因比B/A顯示與胎盤和母親血細(xì)胞中 各自基因的相對(duì)表達(dá)水平的良好正關(guān)系。相反,總基因表達(dá)水平受母親血細(xì)胞的表達(dá)波動(dòng) 的影響,并且因此與胎盤的表達(dá)較不相關(guān)(圖2)。
[0053] 表 1
[0054]
[0055] 使用等位基因比分析的另一優(yōu)勢(shì)是胎盤中具體基因的表達(dá)水平與母親血細(xì)胞的 表達(dá)水平歸一化。因?yàn)楸榧安煌幕蚝筒煌臉悠繁磉_(dá)水平可能非常不同,該歸一化使 得更穩(wěn)健比較不同的基因并且避免必須與參考基因,例如,管家基因比較。換句話說(shuō),在常 規(guī)的基因表達(dá)分析中,參考管家基因測(cè)量樣品中基因的表達(dá)水平或作為樣品的總RNA的 量。常規(guī)上,為了鑒定異?;虮磉_(dá),人們接著比較測(cè)試樣品與對(duì)照樣品的那些相對(duì)值。
[0056] 這里我們提出了新的方法,由此我們使用歸一化至母親相同基因的貢獻(xiàn)的胎兒貢 獻(xiàn)的相對(duì)量作為一種方式,以確定基因表達(dá)概況。在病理學(xué)狀態(tài)下,例如先兆子癇、早產(chǎn)、母 親疾病比如系統(tǒng)性紅斑狼瘡,由此胎盤或母親器官中基因的表達(dá)的被改變,該基因的胎兒 與母親比例當(dāng)與沒(méi)有這樣的病理學(xué)病況的妊娠比較時(shí)而改變。該方法可使用母親血漿中胎 兒特異性SNP等位基因相對(duì)于RNA轉(zhuǎn)錄體中共享的等位基因而實(shí)施。
[0057] 方法可也使用母親血衆(zhòng)中母親特異性SNP等位基因相對(duì)于RNA轉(zhuǎn)錄體中的共享等 位基因而實(shí)施。當(dāng)與對(duì)于非病理學(xué)狀態(tài)預(yù)期的比較,對(duì)于一個(gè)或多個(gè)RNA基因轉(zhuǎn)錄體的一 個(gè)或多個(gè)這樣的等位基因比改變時(shí),可鑒定病理學(xué)病況。遍及基因基因座或多個(gè)基因基因 座的這樣的等位基因比的模式可用于鑒定病理學(xué)狀態(tài)。非病理學(xué)狀態(tài)可由正常妊娠的等位 基因比表示,在當(dāng)妊娠不受病理學(xué)狀態(tài)影響測(cè)試之前或之后獲得的樣品的等位基因比表示 或來(lái)自先前獲得自正常妊娠的現(xiàn)有數(shù)據(jù),即源自先前參考范圍的等位基因比。
[0058] 可使用本方