制備靶rna消除組合物的方法和試劑盒的制作方法
【專利說明】制備靶RNA消除組合物的方法和試劑盒 發(fā)明領(lǐng)域
[0001] 本發(fā)明提供了從初始的含RNA組合物制備靶RNA消除組合物的方法。本文公開的 方法能夠從分離的總RNA中有效地消除不需要的靶RNA,如rRNA。該方法特別適合于制備 用于下一代測序應(yīng)用,特別是轉(zhuǎn)錄組測序的RNA。此外,提供了適合實施本發(fā)明方法的試劑 盒。
[0002] 發(fā)明背景
[0003] 轉(zhuǎn)錄組學(xué)是表征從所研宄的特定基因組轉(zhuǎn)錄的RNA的科研領(lǐng)域?,F(xiàn)已開發(fā)了幾種 方法來分析轉(zhuǎn)錄的RNA,例如基因表達(dá)系列分析(SAGE)、Cap分析基因表達(dá)(cap analysis gene expression,CAGE)和大規(guī)模平行簽名測序。另一種方法是轉(zhuǎn)錄組測序。傳統(tǒng)上,測 序由Sanger測序進(jìn)行。
[0004] 在最近幾年,出現(xiàn)了根本性的轉(zhuǎn)變,從利用Sanger法進(jìn)行測序轉(zhuǎn)為所謂的"下一 代測序"(NGS)技術(shù)。在此,存在不同的NGS技術(shù)和方法,例如焦磷酸測序,合成測序或連接 測序。然而,大多數(shù)NGS平臺共享一個技術(shù)特征,即,克隆擴(kuò)增的或單個DNA分子的大規(guī)模 平行測序,所述DNA分子是在流動室中或通過產(chǎn)生油-水乳液而在空間上分離的。在NGS 中,測序是通過聚合酶介導(dǎo)的核苷酸延伸的重復(fù)循環(huán),或以一種格式,通過寡核苷酸連接的 迭代循環(huán)進(jìn)行。作為大規(guī)模平行處理,NGS在一次儀器運行中根據(jù)平臺的不同產(chǎn)生數(shù)百個 百萬堿基到十億堿基的核苷酸序列輸出。廉價地生產(chǎn)大量序列數(shù)據(jù)是其相比于傳統(tǒng)方法的 主要優(yōu)點。因此,NGS技術(shù)已經(jīng)成為遺傳學(xué)研宄的主要驅(qū)動力?,F(xiàn)已發(fā)現(xiàn)幾個NGS技術(shù)平 臺可廣泛使用,包括,例如,以下NGS平臺:羅氏(Roche)/454,Illumina Solexa基因組分析 儀,應(yīng)用生物系統(tǒng)公司的SOLiD?系統(tǒng),Ion Torrent TM半導(dǎo)體序列分析儀,PacBio?:實時 測序和Helicos?單分子測序(SMS)。NGS技術(shù)、NGS平臺和NGS技術(shù)的常規(guī)應(yīng)用/領(lǐng)域總 結(jié)于,例如 Voelkerding 等(Clinical Chemistry 55:4641-658,2009)和 Metzker (Nature Reviews/Genetics第11卷,2010年1月,第31-46頁)。除了 NGS技術(shù)中的測序是以大規(guī) 模平行方式進(jìn)行的特征,NGS技術(shù)平臺的共同之處在于它們需要制備適于大規(guī)模平行測序 的測序文庫。此類測序文庫例子包括片段文庫,末端配對文庫(mate-paired library)或 條形碼片段文庫(barcoded fragment library)。在儀器上"運行"前,大多數(shù)平臺采取略 作修改的常規(guī)文庫制備過程。此過程包括將可從cDNA獲得的DNA片段化(例如,通過機(jī)械 剪切,如聲波處理(sonification)、水力剪切、超聲波、霧化或酶促片段化),隨后進(jìn)行DNA 修復(fù)和末端拋光(end polishing,平端或A突出端),和,最后的,往往是平臺特異性適配體 連接。此類測序文庫的制備和設(shè)計也描述于Voelkerding,2009和Metzker,2010。
[0005] 這些新的高通量、下一代測序技術(shù)已經(jīng)在許多研宄領(lǐng)域獲得了快速和全面的結(jié) 果,包括但不限于診斷、癌癥、干細(xì)胞研宄、宏基因組學(xué)、群體遺傳學(xué)和醫(yī)學(xué)。當(dāng)今的NGS研 宄越來越依賴于從復(fù)雜樣品和有限的起始原料中獲得高質(zhì)量測序數(shù)據(jù)的能力。NGS也已用 于轉(zhuǎn)錄組測序。轉(zhuǎn)錄組測序也稱為"RNA-seq"和用于,例如生物學(xué)樣品的作圖和定量記錄 中。該技術(shù)已迅速用于癌癥等疾病的研宄中。憑借深覆蓋和基準(zhǔn)水平分辨率,下一代測序 提供基因的差異表達(dá)信息,包括等位基因和不同剪接轉(zhuǎn)錄物;非編碼RNA ;轉(zhuǎn)錄后突變或編 輯;和基因融合。可采用上述的各種平臺進(jìn)行轉(zhuǎn)錄組測序(RNA-seq)。進(jìn)行下一代測序所 必需的測序文庫的產(chǎn)生可能會在平臺之間有所不同,但各技術(shù)中也有共同性內(nèi)。轉(zhuǎn)錄組測 序的一個主要問題是存在干擾性RNA分子。例如,核糖體RNA(rRNA)是總RNA中最豐富的 分子,其中通常超過90%的總RNA為rRNA。然而,核糖體RNA提供的關(guān)于轉(zhuǎn)錄的信息很少。 在應(yīng)用中,如RNA測序(RNA-seq)時,最大程度提高從測序運行接收到的信息量是極其令人 感興趣的。如果文庫構(gòu)建涉及豐富的rRNA,大部分的測序能力將用于測序這些無所不在的 分子,從而減少研宄其余轉(zhuǎn)錄組可用的能力。因此,寶貴的測序資源被浪費。此外,存在核 糖體RNA可能會導(dǎo)致低信噪比,從而難以檢測感興趣的RNA種類。因此,除去rRNA和/或 其它不需要的RNA提高了下游測序的價值。為了提供不含rRNA或其它不需要的RNA種類 的測序文庫,現(xiàn)有技術(shù)中開發(fā)了幾種方法。
[0006] 根據(jù)該基于polyA富集的常用方法,polyA+RNA從總RNA獲得。PolyA RNA可采用 普通方法分離,例如利用以poly (T)寡核苷酸作官能化,從而可相應(yīng)捕獲PolyA RNA的磁性 珠。從polyA RNA制備測序文庫的優(yōu)點在于,不攜帶polyA尾的RNA,例如rRNA不會從總 RNA中回收,并且相應(yīng)地不會被帶入測序反應(yīng)。因此,從利用polyA RNA產(chǎn)生的測序文庫中 獲得的大多數(shù)序列對應(yīng)于確實攜帶polyA尾的蛋白編碼mRNA。然而,利用純化的polyA RNA 制備測序文庫也有缺點。有幾種類型的RNA不帶有polyA尾,并因此在polyA富集中丟失, 但仍是轉(zhuǎn)錄組測序所感興趣的。例如,polyA富集導(dǎo)致作為轉(zhuǎn)錄組重要組成部分的非聚腺苷 酸化mRNA序列損失。某些真核mRNA,例如那些編碼組蛋白的,也不攜帶polyA尾,其它攜帶 polyA尾太短,從而無法通過寡聚dT有效捕獲。此外,該方法不能用于原核mRNA,因為它們 未聚腺苷酸化。再一缺點是,polyA富集需要高品質(zhì)的完整的總RNA作為輸入材料。PolyA 富集對于降解的RNA樣本不可行,因為只有攜帶polyA尾的片段才能被捕獲。
[0007] 因為polyA富集相關(guān)的這些缺點,開發(fā)了替代方法。相比于基于polyA富集的方 法,這些方法的目的不是富集感興趣的RNA,而是著眼于消除和因此去除后續(xù)轉(zhuǎn)錄組分析不 感興趣的RNA類型,例如rRNA。相比于polyA富集,基于rRNA消除的方法保留了非腺苷酸 化、非編碼和調(diào)控RNA的信息,從而能研宄RNA調(diào)節(jié)、新生轉(zhuǎn)錄、RNA編輯和增加我們對轉(zhuǎn)錄 組復(fù)雜性理解的其它現(xiàn)象。在此,再次開發(fā)了不同的方法以消除不需要的靶RNA,以便制備 用于NGS的總RNA。一種方法是借助雜交在靶RNA全長上的長探針來消除不需要的靶RNA, 如核糖體RNA。市售可得的產(chǎn)品是RiboZero (Epicentre),它使用rRNA的生物素化長轉(zhuǎn)錄 物作為探針與初始RNA組合物中存在的rRNA雜交。得到的雜交體利用鏈霉親和素珠除去。 藉此獲得rRNA消除組合物。所用的探針是RNA探針,因此必須貯存于不便于處理的-70 至-80°C。相應(yīng)的技術(shù)描述于W0 2011/019993。所述方法的優(yōu)點是它即便在降解RNA的情 況下,也有效地去除了核糖體RNA。然而,所述方法對于不同生物的效率有所不同。此外,在 片段化rRNA的情況下,有效去除rRNA所必需的長探針也有缺點,即,它們可以與非靶RNA 交叉雜交,從而產(chǎn)生信息性RNA的非特異性消除。因此,該方法的缺點在于特異性。另一種 市售可得的rRNA消除方法/試劑盒是英杰公司(Invitrogen)的RliboMinus技術(shù)。在此, 生物素化鎖定核酸探針用于雜交不需要的靶RNA,利用鏈霉親和素珠結(jié)合并除去標(biāo)記的雜 交體。該方法使用較短的探針,因此效率明顯低于RiboZero方法,特別是在片段化RNA的 情況下消除rRNA的效率較低(也參見實施例)。此外,該現(xiàn)有技術(shù)帶來的風(fēng)險也在于rRNA 消除期間,因為rRNA探針和,例如mRNA序列之間的非特異性相互作用導(dǎo)致信息RNA的非特 異性消除。因此,需要這樣一種靶RNA消除方法,該方法在片段化的情況下的特異性改善, 而且能有效地消除不需要的靶RNA。
[0008] 無論是通過消除不需要的靶RNA或是富集想要的RNA類型,制備RNA組合物后,制 備得到的RNA以供NGS測序的典型方法涉及產(chǎn)生第一鏈cDNA,例如通過隨機(jī)六聚體引發(fā)的 逆轉(zhuǎn)錄,和隨后利用RNA酶H和DNA聚合酶產(chǎn)生第二鏈cDNA。例如,該cDNA可以片段化并 連接到NGS適配體。對于小RNA,例如微小RNA(miRNA)和短干擾RNA,通常采用經(jīng)由小RNA 富集方法的優(yōu)先分離、在電泳凝膠上作尺寸選擇,或這些方法的組合。RNA連接酶可用于連 接適配體序列與RNA ;該步驟后常是PCR擴(kuò)增步驟,然后進(jìn)行NGS處理。測序后,獲得的讀 取值可與參比基因組比對,與已知的轉(zhuǎn)錄物序列比較,或從頭組裝頭,以構(gòu)建基因組規(guī)模的 轉(zhuǎn)錄圖譜。
[0009] 從總RNA中消除不需要的RNA分子(如rRNA)的另一種方法描述于W001/32672。 將RNA與誘餌分子接觸,所述誘餌分子能夠與不需要的靶序列,例如rRNA形成復(fù)合物,由此 形成誘餌:靶復(fù)合物,從而可自初始組合物中除去??捎眯盘柌糠謽?biāo)記得到的rRNA消除組 合物,將之用于制備mRNA文庫,或者利用陣列雜交技術(shù)將之用于表達(dá)研宄。公開了幾種方 法用于除去誘餌:靶復(fù)合物,多種其他方法也是基于雜交體捕獲的方法。
[0010] 本發(fā)明的目的是提供適合于從總RNA中消除不需要的靶RNA,如rRNA,并能避免現(xiàn) 有技術(shù)方法中至少一個缺點的方法。具體地,該目的是提供用于制備總RNA以供下一代測 序應(yīng)用,特別是轉(zhuǎn)錄組測序的方法,該方法是有效的,特異性的,也可以用來從不同的樣品, 包括源自不同物種的樣品和降解樣品中消除不需要的靶RNA。
[0011] 發(fā)明概述
[0012] 本發(fā)明是基于以下發(fā)現(xiàn),即,將與待消除的靶RNA雜交的專門設(shè)計的探針分子與 雜交體捕獲聯(lián)用,提供從含有RNA的組合物中除去和由此消除不需要的靶RNA的顯著改進(jìn) 方法??衫迷摲椒ㄌ禺愋郧腋咝У貜目俁NA中消除rRNA,從而提供可用于NGS應(yīng)用,如轉(zhuǎn) 錄組測序的rRNA消除的RNA。
[0013] 根據(jù)第一方面,提供了從初始的含RNA組合物制備靶RNA消除組合物的方法,包 括:
[0014] a)使初始的含RNA組合物與一組或多組探針分子接觸并在靶RNA和探針分子之間 產(chǎn)生雙鏈雜交體,其中的探針分子組具有以下特征:
[0015] i)該組包括長度為l〇〇nt或更小的兩種或多種不同的探針分子;
[0016] ii)包含于所述組中的探針分子與靶RNA中存在的靶區(qū)域互補(bǔ);
[0017] iii)當(dāng)與所述靶區(qū)域雜交時,所述兩種或更多種不同的探針分子在形成的雙鏈雜 交體中處于彼此鄰近定位;
[0018] b)利用結(jié)合雙鏈雜交體的結(jié)合劑捕獲所述雙鏈雜交體,由此形成雜交體/結(jié)合劑 復(fù)合物;
[0019] C)從所述組合物中分離所述雜交體/結(jié)合劑復(fù)合物,從而提供靶RNA消除的組合 物。
[0020] 本發(fā)明采用專門設(shè)計的探針分子組,所述探針分子雜交并標(biāo)記不需要的靶RNA,例 如不同的rRNA物質(zhì)以便消除。各組探針分子靶向靶RNA中的特定區(qū)域,在此也稱為靶區(qū)域, 各組探針分子包括兩種或更多種不同的與所述靶區(qū)域雜交的短探針分子。當(dāng)雜交至其靶 區(qū)域時,一組的短探針分子在所形成的雙鏈雜交體中均位于彼此相鄰的位置并由此非常接 近。所形成的雙鏈雜交體跨越并由此覆蓋靶區(qū)域。然后包含一組短探針分子的所形成的雙 鏈雜交體與抗雜交體結(jié)合劑結(jié)合,從而形成雜交體/結(jié)合劑復(fù)合物。所述復(fù)合物可以從剩 余的組合物中容易地分離,從而去除不需要的靶RNA,由此提供靶RNA消除的組合物。如實 施例所示,與現(xiàn)有技術(shù)靶RNA消除方法相比,將專門設(shè)計的探針分子與雜交體捕獲技術(shù)聯(lián) 用顯著地提高了靶RNA去除的特異性和有效性。利用一種或多組包含與靶RNA內(nèi)特定靶區(qū) 域雜交的多個短探針分子,重要的優(yōu)點在于特異性的增加,因為與較長的探針分子相比,短 探針分子對錯配的耐受較低。如此在探針?biāo)浇档土伺c非靶RNA的非特異性結(jié)合。使用短 探針長度的額外優(yōu)點是生物信息學(xué)設(shè)計的自由度。探針分子越短,可設(shè)計的探針的可能非 重疊組合越多。如此能夠提供與非靶序列很少或甚至不交叉雜交的探針分子。由于進(jìn)行了 雜交體捕獲步驟,而使特異性得到第二級的提高。如果所述雜交體不包含或只含有很少的 錯配,抗雜交體結(jié)合劑,例如抗雜交抗體僅識別雙鏈雜交體。這有利于捕獲完美匹配,這通 常發(fā)生在探針分子與其靶RNA結(jié)合的情況下。此外,如果本發(fā)明方法特別利用長度為35nt 或更小,優(yōu)選30nt或更小的短探針分子,這會對特異性有額外的提高。如果長度為35nt 或更少的單個探針分子非特異性地雜交非靶RNA,抗雜交體結(jié)合劑通常不能很好地識別如 此形成的短的雙鏈雜交體。因此,非特異性地結(jié)合非靶RNA的相應(yīng)單個探針分子不能提供 足夠長的雙鏈雜交體,以便與抗雜交體結(jié)合劑有效結(jié)合,特別是在抗雜交體抗體的情況下。 此外,如果一種以上的抗雜交體結(jié)合劑,例如抗雜交體抗體能夠結(jié)合于待消除的雜交體,就 像如果一組的探針分子雜交于靶標(biāo)的情況下,捕獲和由此的消除效率得以提高?;谏鲜?理由,大多數(shù)非特異性結(jié)合事件將不會被抗雜交體結(jié)合劑捕獲,因此,非特異性結(jié)合的非靶 RNA不從含有RNA的組合物中消除。然而,如果一組的所有探針分子雜交到其靶區(qū)域,形成 明顯較長的雙鏈雜交體??闺s交體結(jié)合劑很好地識別不含錯配的所形成的長雙鏈雜交體, 從而確保有效的捕獲和去除。因此,當(dāng)與其靶區(qū)域雜交時,短探針分子組基本上模擬了長探 針分子的特征,改善了抗雜交體結(jié)合劑的捕獲情況。當(dāng)利用由此優(yōu)選的抗雜交體抗體時,尤 其能夠?qū)崿F(xiàn)特異性提高的這種有益效果。
[0021] 實施例證明了本發(fā)明方法的優(yōu)異效率和優(yōu)良的特異性,這些實施例尤其顯示了與 現(xiàn)有技術(shù)的方法相比,將多種相鄰的短探針分子與雜交體捕獲聯(lián)用顯著提高了靶RNA去除 的特異性,從而導(dǎo)致更少的感興趣RNA被非特異性地去除(具體參見圖6和7)。此外,即便 在片段化RNA的情況中,該方法實現(xiàn)超過99%的消除率,是高效的。因此,當(dāng)如本文所教導(dǎo) 采用包含兩種或更多種相鄰短探針分子的一組或多組探針分子時,與較長探針相比,靶RNA 的結(jié)合效率未受影響。然而,因為非特異性結(jié)合事件較少導(dǎo)致了特異性顯著提高,以及由于 抗雜交體結(jié)合劑(因此優(yōu)選抗雜交體抗體)捕獲正確形成的雙鏈雜交體而導(dǎo)致的額外的特 異性水平。因此,靶RNA消除組合物有利地保留了 RNA種類的多樣性,包括polyA mRNA、非 腺苷酸化mRNA、非編碼RNA和調(diào)節(jié)RNA。信噪比得到改善,并能夠檢測低豐度RNA。采用本 發(fā)明方法可以同時消除多種不需要的靶RNA。因此,本發(fā)明提供的方法顯著改善了現(xiàn)有的靶 RNA消除方法。靶RNA消除組合物可以用于許多下游應(yīng)用,包括但不限于微陣列分析、文庫 構(gòu)建、逆轉(zhuǎn)錄、擴(kuò)增、轉(zhuǎn)錄譜、表達(dá)分析和重要的測序應(yīng)用。
[0022] 根據(jù)第二方面,提供了對包含在樣品中的感興趣RNA分子進(jìn)行測序方法,包括:
[0023] a)獲得含RNA的組合物,優(yōu)選從樣品中分離總RNA ;
[0024] b)采用第一方面的方法,從該含RNA的組合物,優(yōu)選總RNA中消除不需要的靶 RNA,從而提供靶RNA消除的組合物;
[0025] c)任選除去未結(jié)合的探針分子;
[0026] d)對包含在靶RNA消除組合物中的RNA分子進(jìn)行測序。
[0027] 如上文所釋,第一方面的方法有效地從總RNA中除去不需要的靶RNA,如不同類型 的核糖體RNA(rRNA),同時確保回收不同物種,包括人、小鼠和大鼠的mRNA和非編碼RNA。通 過提高有用數(shù)據(jù)的比例,降低偏倚并保留非編碼RNA,該方法提供了特別適用于下一代測序 (NGS)應(yīng)用的高質(zhì)量RNA。通過將所述消除方法整合入常規(guī)的測序應(yīng)用,特別是NGS應(yīng)用, 例如轉(zhuǎn)錄組測序,為測序RNA分子提供了改進(jìn)的方法。
[0028] 根據(jù)第三方面,提供一種試劑盒,適合于從含有RNA的組合物中消除靶RNA,包括
[0029] a) -組或多組消除靶RNA的探針分子,其中,探針分子組具有以下特征:
[0030] i)該組包含長度為l〇〇nt或更小的兩種或多種不同的探針分子;
[0031] ii)包含在所述組中的探針分子與靶RNA的靶區(qū)域互補(bǔ);
[0032] iii)與所述靶區(qū)域雜交時,所述兩種或更多種不同的探針分子在形成的雙鏈雜交 體中彼此鄰近定位;
[0033] 和
[0034] b)適合與探針分子和靶RNA之間形成的雙鏈雜交體結(jié)合的結(jié)合劑。
[0035] 可利用相應(yīng)的試劑盒實施本發(fā)明第一方面的方法??蓪⒃噭┖兄兴玫母鹘M探 針分子設(shè)計成與多種不需要的靶RNA,如大(18S,28S),?。?S,5. 8S),與線粒體(12S,16S) rRNA特異性地雜交。每種靶RNA利用多種短寡核苷酸以確保,即使有降解靶RNA或突變的 存在,所述靶RNA也會被完全從樣品中除去。由于它們的長度短,可以仔細(xì)設(shè)計探針以確保 與非靶RNA分子的交叉反應(yīng)性最小。進(jìn)一步的優(yōu)點如上所述??蓪⒋嗽噭┖兄械奶结樤O(shè)計 成能夠除去不同物種,例如人、小鼠和大鼠的靶RNA。如實施例所示,本發(fā)明的試劑盒能夠從 總RNA中除去>99. 9%的靶RNA分子。因此,該試劑盒可用于高選擇性地有效除去不需要的 靶RNA,如不同類型的rRNA,以便用于下一代測序應(yīng)用。
[0036] 本領(lǐng)域技術(shù)人員從以下描述和所附權(quán)利要求會明白本申請的其它目的、特征、優(yōu) 點和各方面。然而,應(yīng)當(dāng)理解,雖然以下描述、所附的權(quán)利要求和具體的實施例顯示了本申 請的優(yōu)選實施方式,但這些僅是通過舉例說明的方式給出。本領(lǐng)域技術(shù)人員從閱讀下文不 難明白所公開的本發(fā)明構(gòu)思和范圍內(nèi)的各種變化和修改。
[0037] 發(fā)明詳述
[0038] 在第一方面,提供了從初始的含RNA組合物制備靶RNA消除組合物的方法,包括:
[0039] a)使初始的含RNA組合物與一組或多組探針分子接觸并在靶RNA和探針分子之間 產(chǎn)生雙鏈雜交體,其中的探針分子組具有以下特征:
[0040] i)該組包括長度為l〇〇nt或更小的兩種或多種不同的探針分子;
[0041] ii)包含于所述組中的探針分子與靶RNA的靶區(qū)域互補(bǔ);
[0042] iii)當(dāng)與所述靶區(qū)域雜交時,所述兩種或多種不同的探針分子在形成