7)的表達(dá)譜并且與妊娠女性相應(yīng)的胎盤和母親 血細(xì)胞比較。為這些樣品的每個(gè),使用IlluminaHiSeq2000工具進(jìn)行RNA的大規(guī)模平行測 序。使用外顯子組測序通過大規(guī)模平行測序?qū)μケP和母親血細(xì)胞基因分型。我們檢查了 NCBIdbSNPBuild135數(shù)據(jù)庫中的約一百萬個(gè)位于外顯子中的SNP,并且對其中母親是純合 子(基因型AA)和胎兒是雜合子(基因型AB)的信息型SNP分類。因此,A等位基因是母 親和胎兒之間共享的等位基因并且B等位基因是胎兒特異性的。
[0091] 針對相關(guān)組織表達(dá)水平對母親血漿中RNA-SNP等位基因比和不同RNA轉(zhuǎn)錄體的總 血漿濃度繪圖(胎盤/血細(xì)胞)(圖7)。我們可觀察到血漿中的RNA-SNP等位基因比與相 關(guān)組織表達(dá)水平正相關(guān)(SpearmanR= 0. 9731679,P= 1. 126e-09)。但是,總血漿水平與 組織表達(dá)不相關(guān)(SpearmanR= -0? 7285714,P= 0? 002927)。
[0092] 除了分析胎兒表達(dá),該方法可也用于概述母親表達(dá)。在該情況下,可使用母親是 雜合子(基因型AB)和胎兒是純合子(基因型AA)的信息型SNP。RNA-SNP等位基因比可 然后計(jì)算為母親特異性等位基因計(jì)數(shù)除以共享等位基因的計(jì)數(shù)。在圖8中,針對相關(guān)組織 表達(dá)水平(血細(xì)胞/胎盤),對RNA-SNP等位基因比和包含信息型SNP的不同基因的總血 漿水平繪圖。我們可觀察到母親血漿中組織表達(dá)水平與RNA-SNP等位基因比的良好正關(guān)系 (SpearmanR= 0? 9386,P〈2. 2e_16),而不是總血衆(zhòng)轉(zhuǎn)錄體水平(SpearmanR= 0? 0574,P =0. 7431) 〇
[0093] RNA轉(zhuǎn)錄體,它們的RNA-SNP等位基因比和它們的血漿水平列表在圖9和圖10中。
[0094] 2.先兆子癇和對照妊娠病例的母親血漿RNA-SNP等位基因比的比較
[0095] 對于兩個(gè)妊娠女性對象的情況,獲得平均117, 901,334個(gè)原始片段(表3A)。在 第三個(gè)三個(gè)月晚發(fā)型先兆子癇(PET)比例,5641,和其孕齡匹配的對照病例,7171之間比較 攜帶母親特異性SNP等位基因的循環(huán)轉(zhuǎn)錄體子集的RNA-SNP等位基因比。如圖11A中所顯 示,這些轉(zhuǎn)錄體的RNA-SNP等位基因比在PET和對照病例中描繪了不同的概況。重要地, RNA-SNP等位基因比概況與血漿轉(zhuǎn)錄體水平的概況不同,如圖11B中所顯示。這提示母親 血漿RNA-SNP等位基因比分析可用作另一度量標(biāo)準(zhǔn),以更好區(qū)分PET病例與正常妊娠病例。 隨著信息型SNP的數(shù)量增加信息轉(zhuǎn)錄體的數(shù)量可進(jìn)一步增加,例如PET病例,5641,和另一 正常妊娠對照病例,9356之間的比較(圖12A和12B)。圖11和圖12顯示的RNA-SNP等位 基因比和血漿的水平RNA轉(zhuǎn)錄體分別列表在圖13和圖14中。
[0096] 表3A:RNA_seq讀數(shù)比對結(jié)果的總結(jié)。
[0097]
[0098] a.去除高度重復(fù)的讀數(shù)之后保留的讀數(shù)。
[0099] b?原始讀數(shù)的%。
[0100] c.對于詳細(xì)分類見補(bǔ)充數(shù)據(jù)表2B。
[0101] d.預(yù)處理的讀數(shù)的%。
[0102] 表3B:RNA-seq讀數(shù)比對結(jié)果的總結(jié)
[0103]
[0104] a.過濾的讀數(shù)主要是細(xì)胞核和線粒體rRNAs和tRNAs。
[0105] b.可分析的讀數(shù)=總的可定位讀數(shù)-過濾的讀數(shù)。
[0106] c.與參考基因的外顯子和內(nèi)含子外部區(qū)域?qū)R的讀數(shù)的%。
[0107] III.確定胎兒或母親RNA貢獻(xiàn)的方法
[0108] A?方法
[0109] 顯示在圖15中的方法1500用于確定來自孕育胎兒的女性對象的樣品中是胎兒起 源的一部分RNA??扇缟蠟榉椒?00所討論獲得和制備樣品。
[0110] 在步驟1501中,接收多個(gè)序列讀數(shù)。在步驟1502中,序列讀數(shù)與參考序列對齊。 可如上為步驟301和302所描述進(jìn)行這些步驟。
[0111] 在步驟1503中,鑒定一個(gè)或多個(gè)信息型母親基因座。每個(gè)信息型母親基因座在胎 兒中對于第一等位基因是純合子和在妊娠女性對象中對于相應(yīng)的第一等位基因和相應(yīng)的 第二等位基因是雜合子。第一等位基因因此在母親和胎兒之間是共享的,并且第二等位基 因是母親特異性的??扇缟厦鏋椴襟E303所描述鑒定信息型母親基因座。
[0112] 在步驟1504中,如步驟304中過濾的信息型母親基因座,并且堅(jiān)定一個(gè)或多個(gè)過 濾的信息型母親基因座。然后,在步驟1505-1511中,在個(gè)體過濾的信息型母親基因座的水 平上操作序列讀數(shù)。在步驟1505和1506中,為每個(gè)過濾的信息型母親基因座確定第一數(shù)量 和第二數(shù)量。在步驟1505中測定第一數(shù)量,其作為與基因座對齊并且包含相應(yīng)的第一等位 基因的序列讀數(shù)的數(shù)量。在步驟1506中測定第二數(shù)量,其作為與基因座對齊并且包含相應(yīng) 的第二等位基因的序列讀數(shù)的數(shù)量。可與上面討論的步驟305和306類似地進(jìn)行步驟1505 和 1506。
[0113] 在步驟1507中,為每個(gè)信息型母親基因座計(jì)算第一數(shù)量和第二數(shù)量的和。和可等 于與基因座對齊的序列讀數(shù)的總數(shù)。在步驟1508中,用和除以第二數(shù)量計(jì)算母親比例。母 親比例提供與具體的包含第二(母親特異性)等位基因的基因座對齊的所有序列讀數(shù)的分 數(shù)。
[0114] 在步驟1509中,測定標(biāo)量。標(biāo)量表示妊娠女性對象中在過濾的信息型母親基因座 相對于相應(yīng)的第二等位基因表達(dá)的總表達(dá)水平。在一些實(shí)施方式中,妊娠女性對象中兩個(gè) 等位基因的表達(dá)已知或假設(shè)是對稱的情況下,標(biāo)量是約二。在其他實(shí)施方式中,標(biāo)量可偏離 二并且考慮不對稱的基因表達(dá)。因?yàn)榇蟛糠只蜃鶎ΨQ表達(dá),對稱性的假設(shè)是有效的。
[0115] 在步驟1510中,母親比例乘以標(biāo)量,以獲得母親貢獻(xiàn)。母親貢獻(xiàn)表示,在過濾的信 息型母親基因座處,母親貢獻(xiàn)的序列讀數(shù)部分(或,通延伸,樣品中RNA部分)。一減去母親 貢獻(xiàn)是胎兒貢獻(xiàn),或胎兒貢獻(xiàn)的序列讀數(shù)部分。在步驟1511中,為過濾的信息型母親基因 座計(jì)算胎兒貢獻(xiàn)。
[0116] 在步驟1512中,測定胎兒起源的樣品中RNA部分。該部分是對于過濾的信息型母 親基因座的胎兒貢獻(xiàn)的平均數(shù)。在一些實(shí)施方式中,該平均數(shù)加權(quán),例如通過為過濾的信息 型母親基因座計(jì)算的和。通過計(jì)算加權(quán)的平均數(shù),在步驟1512中測定部分可反映樣品中不 同基因座或基因的相對表達(dá)水平。
[0117] 可為獲得測序數(shù)據(jù)的一個(gè)過濾的信息型母親基因座,許多這樣的基因座,或所有 這樣的基因座計(jì)算胎兒起源的樣品中RNA部分。認(rèn)識到該部分反映具體的妊娠女性對象中 在獲取樣品時(shí)的循環(huán)轉(zhuǎn)錄組。如果樣品在妊娠過程的不同時(shí)間獲得自對象,方法1500中鑒 定的過濾的信息型母親基因座的一個(gè)樣品與下一個(gè)樣品不同,因?yàn)樵谶@些基因座胎兒起源 的RNA的部分可能不同。樣品中胎兒起源的RNA部分可也與接下來的一個(gè)對象不同,即使 當(dāng)控制妊娠階段或其他因素時(shí),并且可在具有妊娠相關(guān)的病癥的對象和健康的對象之間不 同。因此,可比較該部分與截取值,以診斷這樣的病癥。
[0118] 在一些實(shí)施方式中,通過使用來自一個(gè)或多個(gè)健康對象的樣品進(jìn)行方法1500測 定截取值。在一些實(shí)施方式中,如果該部分超過截取值或落在截取值之下任何量或某些量, 則作出診斷。比較可涉及計(jì)算差異或計(jì)算妊娠女性對象中胎兒起源的RNA部分和截取值之 間的比例。在一些實(shí)施方式中,比較涉及評估妊娠女性對象中胎兒起源的RNA部分與健康 的妊娠女性中在類似的妊娠時(shí)間看到的是否顯著不同。
[0119] 可也通過檢查信息型胎兒基因座測定胎兒起源的樣品中RNA部分。在每個(gè)信息型 胎兒基因座處,可通過首先計(jì)算胎兒比例評估該部分,所述胎兒比例是包含第二(胎兒特 異性)等位基因的序列讀數(shù)的數(shù)量除以序列讀數(shù)的總數(shù)。胎兒貢獻(xiàn)接著是胎兒比例乘以表 示胎兒中兩個(gè)等位基因相對表達(dá)水平的標(biāo)量。因此,可通過鑒定信息型胎兒基因座、過濾 這些基因組、計(jì)算每個(gè)過濾基因座的胎兒貢獻(xiàn),和使過濾基因座的胎兒貢獻(xiàn)平均,進(jìn)行方法 1500的變型。如果期望,通過方法1500測定胎兒起源的RNA部分可通過用為過濾的信息型 胎兒基因座計(jì)算的胎兒貢獻(xiàn)平均為過濾的信息型母親基因座計(jì)算的胎兒貢獻(xiàn)而增加。這里 計(jì)算的平均數(shù)可被加權(quán),以反映在不同基因座的序列讀數(shù)的數(shù)量的變化,以給予母親特異 性或胎兒特異性基因組,或以其他方式根據(jù)需要更多的權(quán)重。
[0120] B.實(shí)施例
[0121] 1.鑒定和評估母親血漿中源自胎兒和母親的轉(zhuǎn)錄體
[0122] 首先基于基因分型數(shù)據(jù)鑒定定義為具有至少一個(gè)信息型SNP的基因的信息基因。 在兩個(gè)早期妊娠病例中,6, 714和6, 753個(gè)信息基因的總數(shù)可分別用于檢查胎兒和母親貢 獻(xiàn)的相對比例(圖16和17)。在兩個(gè)晚期妊娠病例中,7, 788和7, 761個(gè)信息基因的總數(shù) 可分別用于檢查胎兒和母親貢獻(xiàn)的相對比例。為了測量母親血漿中胎兒貢獻(xiàn)的相對比例, 我們?yōu)镽NA轉(zhuǎn)錄體分類,其中通過母親血漿樣品中的至少一種RNA-seq讀數(shù)覆蓋胎兒特異 性等位基因。這樣胎兒起源的轉(zhuǎn)錄體的相對比例早期妊娠和晚期妊娠期間分別是3. 70%和 11. 28%。使用類似的方法,使用母親特異性SNP等位基因檢查的循環(huán)中母親貢獻(xiàn)的相對比 例評估為在早期妊娠和晚期妊娠期間分別是76. 90%和78. 32% (圖18A)。
[0123] 2.為PET和對照妊娠病例比較RNA-SNP部分胎兒和母親貢獻(xiàn)
[0124] 我們已經(jīng)檢查了對于GNAS轉(zhuǎn)錄體,部分胎兒和母親貢獻(xiàn),其是在PET比例,5641, 和其孕齡匹配的對照病例,7171中檢測。在GNAS轉(zhuǎn)錄體中,在病例5641中有在基因座 rs7121包括胎兒特異性SNP等位基因的信息型SNP位點(diǎn);在病例7171中相同SNP位點(diǎn), 有母親特異性SNP等位基因。病例5641中該SNP位點(diǎn)的部分胎兒和母親貢獻(xiàn)分別計(jì)算為 0. 09和0. 91。另一方面,對于病例7171中相同SNP位點(diǎn)部分胎兒和母親貢獻(xiàn)分別是0. 08 和0. 92 (圖19)。與對照病例7171比較,部分胎兒貢獻(xiàn)有12. 5%增加和該轉(zhuǎn)錄體中部分母 親貢獻(xiàn)有1. 09 %的下降。有趣地,與7171比較,在病例5641中,為該轉(zhuǎn)錄體檢測到FPKM的 21%增加。
[0125] IV.指定基因組基因座為母親或胎兒標(biāo)記物的方法
[0126] A?方法
[0127] 指定基因組基因座為母親或胎兒標(biāo)記物的方法2000顯示在圖20中。方法涉及分 析來自孕育胎兒的女性對象的樣品。樣品可以是母親血液血漿的并且包含源自母親和胎兒 的RNA分子的混合物??扇缟厦鏋榉椒?00所討論獲得和制備樣品。
[0128] 在步驟2001中,接收多個(gè)序列讀數(shù)。在步驟2002中,序列讀數(shù)與參考序列比對。 這些步驟可如上為步驟301和302所描述進(jìn)行。
[0129] 在步驟2003中,鑒定一個(gè)或多個(gè)信息型基因座。每個(gè)基因座在第一實(shí)體中對于相 應(yīng)的第一等位基因是純合子和在第二實(shí)體中對于相應(yīng)的第一等位基因和相應(yīng)的第二等位 基因是雜合子。第一實(shí)體是妊娠女性對象或胎兒,和第二實(shí)體是妊娠女性對象和胎兒中另 一個(gè)。信息型基因座可如上面為步驟303所描述鑒定。
[0130] 在步驟2004中,如在步驟304中過濾信息型基因座,并且鑒定一個(gè)或多個(gè)過濾的 信息型基因座。在一些實(shí)施方式中,僅僅考慮過濾表示SNP的信息型基因座。在方法的一 個(gè)例子中,過濾的信息型基因座包括母親血漿中具有"A"等位基因的至少一個(gè)序列讀數(shù)和 "B"等位基因的一個(gè)序列讀數(shù)的信息型SNP。
[0131] 然后在步驟2005-2008中,在個(gè)體過濾信息型基因座的水平上操作序列讀數(shù)。在 步驟2005和2006中,對于每個(gè)過濾的信息型基因座測定第一數(shù)量和第二數(shù)量。第一數(shù)量 在步驟2005中測定為與基因座對齊并且包含相應(yīng)的第一等位基因的序列讀數(shù)的數(shù)量。第 二數(shù)量在步驟2006中測定為與基因座對齊并且包含相應(yīng)的第二等位基因的序列讀數(shù)的數(shù) 量。步驟2005和2006可與上面討論的步驟305和306類似地進(jìn)行。
[0132] 在步驟2007中,為每個(gè)過濾的信息型基因座計(jì)算第一數(shù)量和第二數(shù)量的比例。該 比例表示序列讀數(shù)的相對豐度(和引申表示樣品中的轉(zhuǎn)錄體)包含第一等位基因和第二等 位基因。在一些實(shí)施方式中,比例簡單地計(jì)算為第一數(shù)量除以第二數(shù)量。這樣的計(jì)算產(chǎn)生 共享等位基因的序列讀數(shù)的數(shù)量作為母親特異性或胎兒特異性等位基因的多個(gè)序列讀數(shù)。 該比例,或其倒數(shù),可視為等位基因比,和對于SNP基因組,可視為RNA-SNP等位基因比。
[0133] 在一些實(shí)施方式中,對于包括母親特異性SNP等位基因的信息型SNP,對于每個(gè) SNP,RNA-SNP等位基因比計(jì)算為母親特異性等位基因:共享等位基因。另一方面,對于包 括胎兒特異性SNP等位基因的信息型SNP,RNA-SNP等位基因比可計(jì)算為胎兒特異性等位基 因:共享等位基因。不像基因表達(dá)分析,其中數(shù)據(jù)歸一化是必須的,RNA-SNP等位基因比分 析不需要數(shù)據(jù)歸一化并且引入較少的偏差。對于包含大于一個(gè)信息型SNP的轉(zhuǎn)錄體,可為 每個(gè)信息型SNP位點(diǎn)計(jì)算RNA-SNP等位基因比并且可計(jì)算每個(gè)轉(zhuǎn)錄體的平均RNA-SNP等位 基因比。
[0134] 在步驟2007中,比例可以可選地計(jì)算為第二數(shù)量除以第一數(shù)量和第二數(shù)量的和。 這里,比例提供母親特異性或胎兒特異性等位基因的序列讀數(shù)的數(shù)量為基因座的一部分所 有序列讀數(shù)。根據(jù)"A"和"B"等位基因,比例可表達(dá)為
[0135] B-等位基因比=B-等位基因計(jì)數(shù)/ (A-等位基因計(jì)數(shù)+B-等位基因計(jì)數(shù))
[0136] 理論上,對于僅僅由胎兒或母親貢獻(xiàn)的血漿轉(zhuǎn)錄體,B-等位基因比應(yīng)是0. 5,假設(shè) 沒有等位基因特異性表達(dá)。計(jì)算比例的其他方法對技術(shù)人員是顯而易見的。
[0137] 在步驟2008中,當(dāng)比例超過截取值時(shí),過濾的信息型基因座命名為標(biāo)記物。在一 些實(shí)施方式中,截取值是約0.2至約0.5。在一些實(shí)施方式中,截取值是0.4。在方法的一 個(gè)例子中,對于具有高胎兒或母親貢獻(xiàn)的RNA轉(zhuǎn)錄體,B-等位基因比截取值定義為多0. 4。 該截取值考慮RNA-seq讀數(shù)的泊松分布和隨機(jī)取樣。在一些實(shí)施方式中,當(dāng)比例超過截取 值時(shí),認(rèn)為"B"等位基因的貢獻(xiàn)是高的。
[0138] 在具體信息型基因座的高等位基因比可指示(i)第二或"B"等位基因在雜合子個(gè) 體中比"A"等位基因更高表達(dá)(即,等位基因表達(dá)不對稱),(ii)母親血漿中所有與基因座 對齊的RNA的更大共享由雜合子個(gè)體貢獻(xiàn),或(i)和(ii)。如果與信息型基因座相關(guān)的基 因是病理上過表達(dá)的,那么高等位基因比可也指示妊娠相關(guān)的病癥。因此,一些方法的實(shí)施 方式也包括基于過濾信息型基因座是否命名為第二實(shí)體(即,雜合子個(gè)體)的標(biāo)記物,診斷 妊娠相關(guān)的病癥。在進(jìn)行這樣的診斷時(shí),用于和等位基因比比較的截取值可基于獲得自健 康的妊娠對象的血漿樣品中的轉(zhuǎn)錄體水平。
[0139] 在一些實(shí)施方式中,方法2000可也用于評估樣品中在母親或胎兒起源的具體過 濾信息型基因座處的RNA部分。通過在步驟2007中計(jì)算的比例乘以標(biāo)量進(jìn)行評估。標(biāo)量 表示在基因座處相對于雜合子個(gè)體中第二等位基因的表達(dá)的總表達(dá)水平。
[0140] 為可闡釋,如果方法中計(jì)數(shù)的第二("B")等位基因是胎兒特異性,那么如上計(jì)算 的B-等位基因比表示該等位基因的序列讀數(shù)的數(shù)量,作為過濾的信息型基因座的一部分 或所有序列讀數(shù)。包含共享("A")等位基因的序