本發(fā)明涉及RNA分析學(xué)方法,特別是轉(zhuǎn)錄子數(shù)量和類型估算測定。
背景技術(shù):
基因表達(dá)是來自基因的信息用于功能性基因產(chǎn)物合成的過程。這些產(chǎn)物是功能性RNA,其中很重要的一類由蛋白編碼信使RNA,mRNA組成,在該過程中其翻譯成各種蛋白,如酶、轉(zhuǎn)運(yùn)分子等。對mRNA內(nèi)容及其在細(xì)胞和組織中的加工階段的了解對于理解細(xì)胞起源、疾病發(fā)生、有機(jī)體的藥物響應(yīng)以及其他生物學(xué)過程至關(guān)重要。
細(xì)胞生物學(xué)過程受到各種內(nèi)部和外部因素影響。其中完整RNA特別是mRNA庫(轉(zhuǎn)錄組)起到重要作用。典型的哺乳動(dòng)物細(xì)胞含有10-30pg總RNA,相當(dāng)于平均3.6×105個(gè)mRNA分子。目前的人類基因組數(shù)據(jù)庫包含20769個(gè)編碼基因注解,48461個(gè)Genescan基因預(yù)測。雖然基因注解和基因預(yù)測的數(shù)目非常穩(wěn)定,但由于RNA分析學(xué)的改進(jìn)[Ensembl release 73,Sept.2013],注解的轉(zhuǎn)錄子數(shù)目(目前有195565個(gè)轉(zhuǎn)錄子)持續(xù)增加。許多研究主要集中在對蛋白編碼RNA、mRNA或轉(zhuǎn)錄子的定量。單個(gè)基因能表達(dá)多種不同的轉(zhuǎn)錄子,稱為剪接變體,其特征在于外顯子區(qū)的不同,和/或?qū)τ谡{(diào)控過程至關(guān)重要的非翻譯區(qū)起始和結(jié)尾位點(diǎn)的不同。
已經(jīng)開發(fā)了具有不同準(zhǔn)確程度的不同的方法測量mRNA或基因表達(dá)水平。
表達(dá)序列標(biāo)簽EST是cDNA的短子序列,來自克隆cDNA的單次測序。它們過去用于鑒定基因轉(zhuǎn)錄子。公共數(shù)據(jù)庫中提供上百萬的EST,其提供關(guān)于相應(yīng)基因表達(dá)條件的信息。EST使得能夠設(shè)計(jì)用于DNA微陣列的探針,測量基因表達(dá)。
例如微陣列雜交測定的經(jīng)典的基因表達(dá)測量方法,或者更近一些的方法例如大量同步測序或下一代測序(NGS)受限于這些方法內(nèi)在的不準(zhǔn)確性,其當(dāng)前只能通過更多的測量例如深度測序而在一定程度上彌補(bǔ),對于無法在高通量樣品規(guī)模上進(jìn)行的分析,這不可避免地在一定程度上增加成本。然而,測量中的準(zhǔn)確性以及成本是藥理學(xué)研究和大的臨床規(guī)模研究中的最重要的要求。微陣列僅能在外顯子或序列水平檢測基因,為此在實(shí)驗(yàn)前已經(jīng)設(shè)計(jì)了預(yù)先確定的序列探針。有限數(shù)目的這些雜交探針和錯(cuò)誤雜交經(jīng)常給高分辨率基因表達(dá)實(shí)驗(yàn)帶來含糊的結(jié)果。微陣列設(shè)計(jì)受限,因?yàn)樗鼈儍H能覆蓋一定數(shù)目的不同的3’UTR(3’非翻譯區(qū)),而不能鑒定新的3’UTR。
1996年末開始出現(xiàn)不同于當(dāng)時(shí)以Sanger命名的常規(guī)雙脫氧法的新的高通量測序技術(shù)(WO 98/44151),稱為下一代測序(NGS)。新測序技術(shù)的發(fā)展使得有可能嘗試對整個(gè)轉(zhuǎn)錄組進(jìn)行測序。NGS使用微型化和平行放置的流動(dòng)池對數(shù)百萬短的(長50-400個(gè)堿基)單個(gè)或成對末端讀段進(jìn)行測序。對空間分隔的、克隆化擴(kuò)增的DNA模板通過合成進(jìn)行測序,由此在單個(gè)核苷酸添加到互補(bǔ)鏈時(shí)進(jìn)行解碼。不同的微流體平臺(tái)中使用光掃描(Illumina systems from Illumina,Inc.,US;SOLiD systems from Life Technologies,US;Roche 454from 454Life Sciences,Roche Diagnostics Corp.,US)和通過排列的微芯片場效應(yīng)晶體管(Ion Torrent from Life Technologies,US)的pH微弱變化的檢測。數(shù)百萬的短讀段必須與已知序列匹配或從頭組裝。而對于RNA研究,情況更復(fù)雜,因?yàn)閬碜詥蝹€(gè)基因的序列在很大程度上重疊。之前發(fā)現(xiàn)的轉(zhuǎn)錄變體的注解提供框架,基于單個(gè)外顯子、外顯子-外顯子連接和覆蓋可能性指導(dǎo)后續(xù)轉(zhuǎn)錄子組裝。只有正確的轉(zhuǎn)錄子組裝允許將讀段分配到其親代RNA分子,以及進(jìn)一步的計(jì)算各個(gè)拷貝的數(shù)目。
與NGS技術(shù)無關(guān),同時(shí)確定序列和頻率信息是研究復(fù)雜序列混合物的一個(gè)主要問題。因?yàn)閮H其序列決定分子性質(zhì),看似重復(fù)測定與其豐度成比例的相同分子,計(jì)算其相應(yīng)的拷貝數(shù)是不可避免的。六個(gè)數(shù)量級(jí)的動(dòng)態(tài)范圍要求對數(shù)百萬相同的高峰度分子進(jìn)行重復(fù)測序,以獲得低豐度分子統(tǒng)計(jì)學(xué)可靠的數(shù)值。這些方式在測序和后續(xù)數(shù)據(jù)分析過程中消耗資源和時(shí)間。所需的讀段深度嚴(yán)重依賴于樣品的復(fù)雜性(Hopper,2010;Wendl,2009)。畢竟,一個(gè)主要的挑戰(zhàn)是將重疊讀段與各個(gè)基因中的多個(gè)重疊轉(zhuǎn)錄子注解匹配的糾結(jié)。讀段深度和計(jì)算的努力和成本巨大。因此,已經(jīng)開發(fā)出不同的方式,通過每個(gè)mRNA分子僅產(chǎn)生一個(gè)讀段,消除匹配重疊讀段的需求。對這些讀段的分組和計(jì)數(shù)簡化了mRNA和基因表達(dá)測量(WO02/059357)。
前體mRNA的聚腺苷酸化是真核基因表達(dá)和調(diào)控的一個(gè)重要步驟。許多基因產(chǎn)生具有可變聚腺苷酸化位點(diǎn)(APA)及不同的3’UTR的mRNA,所述mRNA可被差異化調(diào)控,或也可編碼不同的蛋白亞型。因此,為了將通過每個(gè)mRNA僅產(chǎn)生一個(gè)讀段來確定基因表達(dá)數(shù)值的簡便與聚腺苷酸化位點(diǎn)的準(zhǔn)確鑒定組合,開發(fā)了專門針對那些APA的方法。
一種該方法以基因組范圍和鏈特異性方式鑒定polyA位點(diǎn)(Wilkening,2013)。其中,NGS測序文庫如下制備:加熱使RNA樣品片段化,固相可逆化固定(SPRI),通過緩沖液更換而純化以防止進(jìn)一步片段化,用生物素化且錨定的polyT(V)-引物-接合體引導(dǎo)(priming)后逆轉(zhuǎn)錄,SPRI純化以去除所有不含polyA的片段并更換溶液,Rnase H處理降解RNA并用較小RNA片段作為第二鏈合成的隨機(jī)起始序列,其使用DNA聚合酶,產(chǎn)生最長的可能的雙鏈,因?yàn)樗衅渌麅?nèi)部延伸的引導(dǎo)位點(diǎn)將通過鏈置換被置換,SPRI純化,鏈霉親和素親和純合和結(jié)合,使得在后續(xù)3個(gè)步驟的每個(gè)之后進(jìn)行溶液更換,酶促末端修復(fù),單dA加尾,連接另一接合體,之后是富集PCR,以及SPRI純化。
產(chǎn)生的NGS文庫每個(gè)mRNA分子僅包含一個(gè)讀段,盡管每個(gè)mRNA一個(gè)讀段標(biāo)記了理論最大值。實(shí)踐中,由于文庫產(chǎn)生的諸多反應(yīng)步驟的每一步的效率均低于100%,結(jié)果是對轉(zhuǎn)錄子豐度的扭曲表示,并且是在期往實(shí)現(xiàn)中的等比例的扭曲表示。重要的是每個(gè)轉(zhuǎn)錄子種類的讀段數(shù)目與其拷貝數(shù)目而非其長度或任意其他序列特異性偏倚成比例。該勞動(dòng)力、化學(xué)制品及消費(fèi)密集型方法有利于基因表達(dá)測量,因?yàn)槠湓试S通過簡單的讀段計(jì)數(shù)對RNA豐度進(jìn)行定量,因?yàn)槊總€(gè)轉(zhuǎn)錄子僅產(chǎn)生一個(gè)讀段。該方法繼之以具體的NGS方案,其在真正的測序開始前默默地讀通引物-接合體的polyT區(qū)段。這部分名為3’T填充法。另外,polyA位點(diǎn)同種型的表達(dá)水平可以單核苷酸序列的分辨率,或在非常接近的polyA位點(diǎn)與相應(yīng)簇重合后進(jìn)行檢測和定量。除了在讀段產(chǎn)生中更好的質(zhì)量之外,該方案主要的改進(jìn)是引入所述3’T填充,其使得可以從轉(zhuǎn)錄子最末端進(jìn)行測序。
其他polyA位點(diǎn)富集方法之前已被開發(fā),但沒有前述3’T填充。由于缺少轉(zhuǎn)錄子變體的內(nèi)參,很難判斷這些方法的不同質(zhì)量。更簡單的一個(gè)方法是polyA連接序列的多重分析,MAPS[Fox-Walsh,2011]。其中,生物素化的含有接頭序列的oligo-dT(NV)用于引導(dǎo)cDNA合成。經(jīng)固相選擇,通過使用連接至另一接頭序列的隨機(jī)引物啟動(dòng)第二鏈的合成。最后,文庫從鏈霉親和素包被的珠釋放,并使用帶條碼的引物以及通用引物進(jìn)行擴(kuò)增。該方法同樣具有強(qiáng)力檢測基因表達(dá)的能力。盡管閱讀方向最初指向mRNA的3’端,并且僅有非常窄的大小的文庫選擇能讀入polyA位點(diǎn),但接頭(引物)序列的更換以及與上述3’T填充方法的組合也允許所有讀段的polyA位點(diǎn)的精確檢測。
該方法有幾個(gè)缺陷。其旨在合成全長cDNA,在cDNA與鏈霉親和素-珠表面結(jié)合之前用雙脫氧三磷酸核苷ddNTP保護(hù)cDNA的末端,通過這些方式純化cDNA,引導(dǎo)并用Taq DNA聚合酶延伸第二鏈。Taq DNA聚合酶通過5’->3’外切核酸酶活性降解任何遇到的下游鏈,并且已被選擇用于確保在通過上述親和結(jié)合方法純化雙鏈產(chǎn)物之前,每個(gè)cDNA僅產(chǎn)生一條第二鏈,其已經(jīng)從最遠(yuǎn)離polyA位點(diǎn)處引導(dǎo)。由于長cDNA,NGS文庫趨勢上較長,這會(huì)導(dǎo)致在后來的NGS簇產(chǎn)生中的長度偏倚。第二鏈合成發(fā)生在珠表面,其在朝向生物素化的第一引物序列的序列的界面區(qū)中尤其受阻。表面限定的反應(yīng)輔助的多個(gè)純合步驟在可靠的polyA位點(diǎn)讀段產(chǎn)生中引入一系列長度和序列偏倚。
另一種基于深度測序的方法是定量polyA位點(diǎn)測序,PAS-測序[Shepard,2011]。該方法以片段化步驟起始,以產(chǎn)生期望大小范圍的RNA片段。另外,第一接頭序列是錨定的oligo-dT(NV)引物的一部分。該方法利用逆轉(zhuǎn)錄酶的末端轉(zhuǎn)移酶活性。當(dāng)?shù)竭_(dá)mRNA片段的5’末端時(shí),MMLV-V逆轉(zhuǎn)錄酶向cDNA的3’端添加一些非模板化的脫氧胞苷。那些末端與包含三個(gè)G的序列的第二接頭雜交。逆轉(zhuǎn)錄酶持續(xù)轉(zhuǎn)換(switch)模板并合成mRNA片段的拷貝,其如今通過兩個(gè)接頭序列延伸。
這一非常簡單的方法的主要缺點(diǎn)是其僅1-10%的低效、模板轉(zhuǎn)換的偏倚和不精確。低效將導(dǎo)致低豐度轉(zhuǎn)錄子的損失。模板轉(zhuǎn)換并不專門與模板轉(zhuǎn)換引物偶聯(lián),并且人工融合轉(zhuǎn)錄子可以通過轉(zhuǎn)換到不同的RNA模板而產(chǎn)生。而且模板轉(zhuǎn)換引物必須大量過剩地提供,這使得在后續(xù)文庫擴(kuò)增之前的純化步驟成為必需。
Derti et al[2012]描述了另一種polyA-seq方法。該方案使用含有第一接頭序列的錨定的polyT引物進(jìn)行第一鏈合成,利用RNAse H處理消化RNA,之后用含有第二接頭序列的隨機(jī)引物引導(dǎo),以及Klenow延伸進(jìn)行第二鏈合成。盡管Klenow DNA聚合酶I片段缺少5’->3’外切核酸酶活性,但其含有持久的鏈置換活性。因此,每條第一鏈cDNA能產(chǎn)生幾條隨機(jī)引導(dǎo)的第二鏈。無法確保明確的一一映射的mRNA豐度和讀段計(jì)數(shù)的關(guān)聯(lián)。
US 6,406,891 B1涉及產(chǎn)生全長cDNA的方法,使用一種方法,包含在第一鏈合成期間在進(jìn)行性RT酶和熱穩(wěn)定RT酶之間來回循環(huán)。
EP 1371726 A1涉及第一和第二鏈合成方法。第一鏈合成使用固定在珠上的引物,第二鏈合成使用隨機(jī)六聚物。第二鏈合成使用Klenow混合物,其包含鏈置換活性。
Costa et al.[2010]涉及使用RNA-seq的轉(zhuǎn)錄組研究。
Mainul Hoque et al.[2012]涉及通過3’區(qū)域提取和深度測序?qū)x擇性切割和聚腺苷酸化的分析。
對于基因表達(dá)計(jì)數(shù),存在對可靠、有效、簡單和劃算的產(chǎn)生NGS文庫擴(kuò)增子的方法的需求,所述方法具有mRNA豐度與讀段計(jì)數(shù)之間的一一映射的關(guān)聯(lián)。
發(fā)明概述
本發(fā)明提供一種產(chǎn)生模板RNA分子的核酸產(chǎn)物的方法,包含-在任選獲得模板RNA之后-
a)使第一寡核苷酸引物在模板RNA的預(yù)先選定的核酸區(qū)域退火,
b)以模板特異性方式延伸第一寡核苷酸引物,由此獲得第一延伸鏈,其通常在包含模板RNA的雙鏈中,
c)至少從雙鏈中去除RNA模板,
d)使一或多個(gè)另外的寡核苷酸引物與第一延伸鏈退火,
e)以模板特異性方式延伸一或多個(gè)另外的寡核苷酸引物,1)不置換與第一延伸鏈退火的引物,或2)使用破壞被置換的鏈的聚合酶,由此產(chǎn)生另外的延伸產(chǎn)物,
f)分離和/或擴(kuò)增所述另外的延伸產(chǎn)物的延伸產(chǎn)物,其包含與所述第一寡核苷酸引物互補(bǔ)的延伸(或互補(bǔ))的核酸部分。
本發(fā)明還涉及試劑盒,其包含逆轉(zhuǎn)錄酶,dNTP,聚合酶所需的輔因子例如金屬離子優(yōu)選Mg2+的鹽,引物,優(yōu)選poly-T引物,無鏈置換活性的DNA聚合酶例如T7、Q5或T4DNA聚合酶或破壞被置換鏈的聚合酶例如全長Bst,大腸桿菌I DNA聚合酶,以及隨機(jī)寡核苷酸引物。所述試劑盒可適于根據(jù)任意實(shí)施方案以優(yōu)選特征的任意一個(gè)或組合進(jìn)行本發(fā)明的方法。
以下詳細(xì)公開涉及本發(fā)明的所有方面和實(shí)施方案。方法描述還涉及試劑盒,其可包含適于進(jìn)行所述方法的部分,試劑盒組件也可涉及方法,其可根據(jù)其功能實(shí)施或使用所述組件。
發(fā)明詳述
本發(fā)明涉及每個(gè)RNA分子產(chǎn)生(僅)一個(gè)擴(kuò)增產(chǎn)物的簡便劃算的方法,其通過如下實(shí)現(xiàn):第一鏈合成期間的引導(dǎo)反應(yīng)的3’端特異性(如果例如使用含有oligo-dT的引物)或者基因/轉(zhuǎn)錄子特異性(如果基因或轉(zhuǎn)錄子特異性序列被靶向),以及后續(xù)分離、選擇或擴(kuò)增這些產(chǎn)物,旨在獲得延伸產(chǎn)物,其包含與第一寡核苷酸引物互補(bǔ)的延伸(或互補(bǔ))的核酸部分(例如通過選擇序列標(biāo)簽或接頭序列或選擇引物的其他序列,例如與第一延伸鏈互補(bǔ)的序列)。通過防止與第一延伸鏈退火的引物的置換,或通過破壞被置換的鏈,僅獲得一個(gè)產(chǎn)物,即由步驟d)的與模板的預(yù)先選擇的區(qū)域結(jié)合最近的引物延伸,其滿足步驟f)的選擇、分離、擴(kuò)增或通常處理的標(biāo)準(zhǔn)。因此每個(gè)RNA模板種類(具有預(yù)先選定的序列)的濃度或拷貝數(shù)與由本發(fā)明方法最終獲得的延伸產(chǎn)物直接相關(guān)。該方法如上概述,并在權(quán)利要求中進(jìn)一步描述。該方法可在一個(gè)逐漸增加的體積或容器中進(jìn)行,特別是通過僅向反應(yīng)混合物中添加另外的試劑,不必通過從步驟a)-e)的混合物中分離組分而純化。另外的試劑某種程度上可中和或增加已經(jīng)在流體中存在的組分。該方式不僅簡化了處理而且增加了該方法的可靠性,因?yàn)樗兄虚g反應(yīng)產(chǎn)物總是保留在一貫的體相中。除了減輕手動(dòng)制備中相互之間的任何純化,這大大有助于該方法在適于自動(dòng)化的芯片或微流控上的實(shí)施。
通過如下測量基因表達(dá):將擴(kuò)增產(chǎn)物或讀段匹配和分組到基因注釋以及這些讀段的計(jì)數(shù),無需將讀段與轉(zhuǎn)錄子支架匹配,也不使用后續(xù)的轉(zhuǎn)錄子特異性標(biāo)準(zhǔn)化算法,其試圖排除某些長度和序列特異性偏倚,這對每個(gè)RNA分子多于一個(gè)讀段的方法是必需的。
本發(fā)明的方法的不足在于,其需要兩個(gè)引導(dǎo)事件,兩個(gè)聚合酶反應(yīng),一個(gè)中間體RNA水解,隨后是一個(gè)最終分離、擴(kuò)增或純化,旨在選擇對應(yīng)于RNA模板的預(yù)先選定的核酸區(qū)域的產(chǎn)物。
已知每個(gè)轉(zhuǎn)錄子僅一個(gè)讀段提供基因表達(dá)計(jì)數(shù)的更高準(zhǔn)確性。本發(fā)明方法的一個(gè)新的方面是由于存在的長度標(biāo)準(zhǔn)化,所需讀段深度的減少,因?yàn)閮H部分被分析,與全長cDNA相比長度有限。
將基因表達(dá)信號(hào)限制到mRNA預(yù)先選定的核酸區(qū)域使相對測序成本較低,目前預(yù)計(jì)約為常規(guī)全長測序的1/5,并且基因表達(dá)數(shù)值更加準(zhǔn)確,因?yàn)殚L度標(biāo)準(zhǔn)化發(fā)生在樣品準(zhǔn)備水平。因此,計(jì)算正確的FPKM值(每百萬映射讀段轉(zhuǎn)錄子的每千個(gè)堿基的片段)無需知曉轉(zhuǎn)錄子變體的長度。mRNA區(qū)域提供的信息內(nèi)容足以在大規(guī)模分析中對樣品進(jìn)行分類,因?yàn)楸M管其信息內(nèi)容少于完整規(guī)模的轉(zhuǎn)錄子分析,但能夠提供多于簡單基因表達(dá)的信息內(nèi)容。
產(chǎn)生的核酸產(chǎn)物也可被視為擴(kuò)增產(chǎn)物,因?yàn)槭褂昧撕怂釘U(kuò)增反應(yīng),但當(dāng)然模板RNA本身并不完整復(fù)制,因此不被該方法擴(kuò)增。該方法旨在“擴(kuò)增”或僅僅產(chǎn)生包含模板RNA區(qū)域的復(fù)制序列的多核苷酸。該復(fù)制序列是模板RNA的一部分,并位于用在引物結(jié)合步驟a)中的預(yù)先選定的核酸區(qū)域的5’方向。復(fù)制序列通常具有約25-2000個(gè)核苷酸,大約100、200、300、500或1000nt核苷酸的長度。精確值會(huì)有區(qū)別,并且受到操作者使用的參數(shù)和試劑的影響。實(shí)質(zhì)上,操作者可以定制獲得的區(qū)域長度,通過例如調(diào)整反應(yīng)中使用的引物,尤其是步驟d)的引物的量和組成,其可以是隨機(jī)引物。操作者可以定制對后續(xù)NGS或任意其他測序最優(yōu)化的平均的區(qū)域長度。
根據(jù)本發(fā)明的一種可能,與沿著整個(gè)轉(zhuǎn)錄子的多個(gè)讀段相比,當(dāng)每個(gè)轉(zhuǎn)錄子(模板RNA分子)或靶序列(預(yù)先選定的核酸區(qū)域,也可以是每個(gè)轉(zhuǎn)錄子兩個(gè)或更多個(gè))僅產(chǎn)生一個(gè)讀段,并且這些讀段可以均以相同的核苷酸開始或終止時(shí),可能會(huì)產(chǎn)生這些讀段是否來自轉(zhuǎn)錄子的不同拷貝或者它們是否來自PCR復(fù)制事件的疑惑。因此任選地,在第一延伸反應(yīng)期間可使用條碼標(biāo)記(加條碼)每個(gè)引導(dǎo)事件,以區(qū)分來自克隆PCR復(fù)制事件的多轉(zhuǎn)錄子拷貝,從而確定重采樣的真實(shí)程度(US 2011/0160078,并入本文作為參考)。理想情況下,這些條碼作為隨機(jī)條碼引入接頭序列。優(yōu)選它們不參與引導(dǎo)反應(yīng)。由此每個(gè)讀段(或延伸產(chǎn)物)將具有與其他讀段(延伸產(chǎn)物)不同的各自獨(dú)特的條碼。
成比例的PCR復(fù)制不會(huì)造成聲稱的更高的準(zhǔn)確度,但表明應(yīng)用的讀段深度超出了NGS文庫的復(fù)雜性,因此測序運(yùn)行開始對相同的插入片段拷貝再次測序(閱讀)。
PCR復(fù)制本身不是問題,但看到以相同序列起始和截止的讀段會(huì)使使用者認(rèn)為他測序太深,或文庫復(fù)雜性太低。由于來自轉(zhuǎn)錄子的所有讀段以臨近polyA尾的相同序列(或其他靶序列)起始,并且經(jīng)常在優(yōu)選序列處截至,所述讀段似乎更像是PCR復(fù)制子,盡管它們不是。
因此,在第一鏈合成期間導(dǎo)入特征例如隨機(jī)條碼使得能夠區(qū)分真正的單個(gè)讀段與復(fù)制子。
獲得或提供模板RNA的初步步驟是提供包含任意RNA的樣品,例如來自細(xì)胞的總RNA。還可以選擇專門的RNA碎片,例如mRNA碎片或以下RNA類型之一。盡管RNA優(yōu)選轉(zhuǎn)錄子或mRNA,特別優(yōu)選其包含polyA-位點(diǎn)或polyA-尾,但當(dāng)然可以使用和分析其他RNA分子,例如pre-miRNA、miRNA、pre-tRNA、tRNA、pre-rRNA或rRNA,其中任意一個(gè),單獨(dú)或與其他RNA類型組合均可包含在RNA中。優(yōu)選地,模板RNA包含polyA-位點(diǎn)或polyA-尾。如果尾本身在RNA種類中并不存在,可通過加尾反應(yīng)人工添加。當(dāng)然也可添加除polyA之外的其他尾,例如通過使用例如WO2007/062445中所述連接酶(試劑盒的任選組分)的連接反應(yīng)。步驟a)的第一引物繼而會(huì)與該(人工)尾的序列退火。在后續(xù)步驟中,優(yōu)選在本發(fā)明方法中通過使用DNA聚合酶,優(yōu)選RNA依賴的DNA聚合酶產(chǎn)生cDNA?;蛘?,在使用轉(zhuǎn)錄子特異性引物對RNA進(jìn)行最初的引導(dǎo)期間,可以針對感興趣的轉(zhuǎn)錄子,例如參與如癌癥、免疫缺陷疾病的產(chǎn)生的轉(zhuǎn)錄子的特異性區(qū)域。
RNA模板可以是任意長度,但優(yōu)選在20-100000nt(核苷酸)范圍內(nèi),尤其優(yōu)選30-50000nt,更優(yōu)選50-25000nt,75-10000nt或100-8000nt。
優(yōu)選使用末端轉(zhuǎn)移酶(試劑盒的任選組分)進(jìn)行3'末端的(任選)加尾。盡管還公開了其他加尾方法,比如尾序列連接,所述尾序列可例如是限定的預(yù)先選定的序列。末端轉(zhuǎn)移酶可以添加一定數(shù)量的核苷酸,優(yōu)選統(tǒng)一選自一種核苷酸類型。也可使用任何其他加尾、添加尾序列的方法,例如通過連接尾序列,其可以統(tǒng)一具有一種類型的核苷酸或具有不同核苷酸。該尾優(yōu)選是5-500個(gè)核苷酸的序列,更優(yōu)選少于400個(gè)、少于300個(gè)、少于200個(gè)、少于100個(gè)、少于50個(gè)或少于30個(gè)核苷酸。任意該尾(或其部分)可用作步驟a)中的預(yù)先選定的3’末端核酸區(qū)域,引物可與之退火。
本發(fā)明的方法特別適合分析具有不同核酸序列的不同RNA分子的復(fù)雜的混合物。優(yōu)選地,本發(fā)明方法中獲得和/或使用1、2、3、4、5、6、7、8、9、10或更多,尤其是至少20、至少30、至少40、至少50、至少75、至少100、至少200或更多的具有不同序列的不同RNA模板。
步驟a),使第一寡核苷酸引物在模板RNA的預(yù)先選定的核酸區(qū)域退火,包括提供第一引物,其在雜交條件(低于雙鏈的解鏈溫度)下與預(yù)先選定的區(qū)域退火或雜交。因此其包含用于退火反應(yīng)或雜交的足夠長度的互補(bǔ)序列。互補(bǔ)區(qū)可以是現(xiàn)有技術(shù)中通常使用的任意一種,例如長6-40nt,優(yōu)選至少6、7、8、9、10或更多nt。預(yù)先選定的區(qū)域是具有已知或預(yù)期序列的一個(gè),例如真核mRNA共有的polyA-尾。可以使用任意其他已知序列,例如基因或轉(zhuǎn)錄子特異性序列,其為一或多個(gè)感興趣的特異性靶標(biāo)而選擇。該一或多個(gè)靶序列可用于創(chuàng)建疾病特異性組,例如癌癥或免疫缺陷特異性組。預(yù)先選定的核酸區(qū)域可存在于一或多個(gè)感興趣的模板RNA上。這些感興趣的模板可以具有相同的性能,例如與特異性疾病或狀況相關(guān)。優(yōu)選感興趣的模板的組包含2、3、4、5、6、7、8、9、10或更多個(gè),例如至少15、至少20和期間任意范圍的模板,所述模板包含預(yù)先選定的核酸區(qū)域。在一個(gè)反應(yīng)(多重)中,多個(gè)第一引物可用于與該組退火。
優(yōu)選地,但不是必須地,其為模板RNA預(yù)先選定的3’末端區(qū)域,例如polyA-尾或上述加尾期間另外添加的尾。預(yù)先選定的區(qū)域可以具有感興趣的RNA類型特定的序列(例如如上公開的)。而且如上所述,預(yù)先選定的區(qū)域可以人工附著于RNA模板,例如通過連接或加尾。
引物可以包含一個(gè)區(qū)域,其具有與RNA模板退火的序列,例如通過堿基配對雜交的互補(bǔ)序列,以及任選地并不結(jié)合的區(qū)域,例如通過具有非互補(bǔ)序列和/或被寡核苷酸封閉的序列,所述寡核苷酸與該區(qū)域雜交而阻止進(jìn)一步的雜交。該非結(jié)合區(qū)域優(yōu)選包括(優(yōu)選隨機(jī))條碼,使多個(gè)轉(zhuǎn)錄子拷貝與PCR復(fù)制事件區(qū)分。優(yōu)選地,該條碼位于被封閉區(qū)域。退火區(qū)域例如可以是oligo-dT8至oligo-dT35區(qū)域,優(yōu)選oligo-dT15至oligo-dT30區(qū)域,例如oligo-dT10或oligo-dT25,其增加選擇性并減少內(nèi)部引導(dǎo)事件,其能在mRNA內(nèi)的內(nèi)部A富集位點(diǎn)發(fā)生,如果它們不是模板RNA的預(yù)期的預(yù)先選定的區(qū)域。
優(yōu)選第一引物是DNA引物,優(yōu)選如下述對隨機(jī)引物進(jìn)行修飾。
步驟b),以模板特異性方式延伸第一寡核苷酸引物,由此獲得第一延伸鏈,可用任意模板特異性寡核苷酸延伸反應(yīng)來進(jìn)行,優(yōu)選使用核苷酸聚合酶,優(yōu)選DNA聚合酶,尤其是以RNA為模板進(jìn)行逆轉(zhuǎn)錄的逆轉(zhuǎn)錄酶。第一延伸鏈繼而通常在包含作為互補(bǔ)鏈的模板RNA的雙鏈中。第一延伸鏈?zhǔn)呛罄m(xù)步驟中進(jìn)一步引物延伸反應(yīng)的模板??梢允褂萌我饽孓D(zhuǎn)錄酶,如下進(jìn)一步所述-有或無鏈置換活性-例如M-MLV RT進(jìn)行逆轉(zhuǎn)錄反應(yīng)。優(yōu)選地,至少存在一些鏈置換,以允許聚合酶解開RNA二級(jí)結(jié)構(gòu)。對于使用RNA模板的逆轉(zhuǎn)錄酶,在優(yōu)選的實(shí)施方案中,逆轉(zhuǎn)錄反應(yīng)在不允許RNA模板二級(jí)或三級(jí)結(jié)構(gòu)(RNA:RNA雜交)形成的條件下進(jìn)行,或在允許這些二級(jí)結(jié)構(gòu)被逆轉(zhuǎn)錄酶進(jìn)行鏈置換的條件下進(jìn)行。在延伸反應(yīng)期間使用的聚合酶可以是病毒聚合酶,并且可選自AMV RT(及其突變體例如Thermoscript RT)、M-MLV RT(及其突變體,包括但不限于Superscript I、II或III、Maxima RT、RevertAid、RevertAid Premium、Omniscript、GoScript)、HIV RT、RSV RT、EIAV RT、RAV2RT、Tth DNA聚合酶、C.hydrogenoformans DNA聚合酶、禽肉瘤白血病病毒(ASLV)及其RNase H-突變體??墒褂萌我膺@些聚合酶的混合物。特別地,可使用病毒聚合酶的混合物,例如M-MLV和ASLV的混合物,和/或可使用其RNase H減少或RNase H陰性的類似物。在任意這些方法和組合物中,可使用兩個(gè)或更多個(gè)聚合酶,包括上述任意聚合酶。
步驟c),至少從雙鏈去除RNA模板,意味著第一延伸鏈,至少在3’末端區(qū)域從RNA模板釋放。雙鏈可被解鏈,RNA模板通過純化去除或被消化,但該純化并不優(yōu)選,因?yàn)槠湓黾宇~外的繁瑣的步驟。消化可完全或部分進(jìn)行。短RNA部分可保留在第一延伸鏈上,因?yàn)楸景l(fā)明的方法不要求全長接近第一延伸鏈??墒褂肦Nase或加熱進(jìn)行消化,尤其是在另外的RNA去穩(wěn)定劑,例如堿性條件或二價(jià)陽離子例如Mn2+存在下進(jìn)行。優(yōu)選地,去除RNA模板包含酶促RNA消化,優(yōu)選通過RNase,堿性降解,優(yōu)選通過NaOH處理,或在二價(jià)陽離子例如Mn2+或Mg2+存在下加熱。
步驟e)中的反應(yīng)通過以下確保僅產(chǎn)生一個(gè)延伸產(chǎn)物:通過使用無鏈置換的條件,或通過破壞,即解聚被置換的鏈,例如通過使用適合的聚合酶,在此情況下會(huì)發(fā)生鏈置換。無鏈置換時(shí),僅預(yù)先選定區(qū)域的最3’-指向的引物成功延伸至對應(yīng)于第一引物的位置。為了防止RNA模板干擾該反應(yīng),優(yōu)選在逆轉(zhuǎn)錄后RNA被去除,優(yōu)選被水解,完全或至少僅保留短片段,其比接下來在第二鏈合成期間的第二引物具有更低的解鏈溫度。
如果二價(jià)陽離子存在,RNA在高溫下進(jìn)行自發(fā)降解。如果二價(jià)陽離子未被去除,其隨后可被螯合劑例如EDTA或EGTA屏蔽。如果樣品未通過沉淀或基于柱的純化方法進(jìn)一步純化,螯合劑的終濃度應(yīng)被平衡,以便防止降解任意之后的產(chǎn)品且不抑制后續(xù)酶促反應(yīng),該酶促反應(yīng)的活性也需要二價(jià)陽離子(例如Mg2+之于聚合酶)。RNA的快速水解發(fā)生在例如二價(jià)陽離子存在下,溫度至少70℃,例如75℃和/或不高于98℃。
RNA的水解優(yōu)選使用MnCl2和高溫進(jìn)行,其使得cDNA保持完整,但破壞RNA。該方法比使用RNase更為節(jié)約成本。堿性條件,例如通過NaOH添加也可用于水解RNA,但必須更加小心以防止cDNA也發(fā)生降解,例如使用較低溫度或較小的堿性pH,經(jīng)調(diào)整使得RNA降解,而cDNA不會(huì)。
步驟d),將一或多個(gè)寡核苷酸引物與第一延伸鏈退火,要求至少一個(gè)引物與第一延伸鏈結(jié)合。該步驟本質(zhì)上是根據(jù)與步驟a)中所述的第一引物退火相同的原則進(jìn)行。另外的引物的序列可以是對于感興趣的RNA模板已知或未知的序列。優(yōu)選使用隨機(jī)引物,其不要求知曉互補(bǔ)序列。對于上述步驟a),多重是可能的。還是在步驟d)中,多個(gè)另外的寡核苷酸引物是一種選擇,其任選與一或多個(gè)經(jīng)選擇的特定靶區(qū)域特異性退火,由此允許每一個(gè)另外的寡核苷酸引物特異性選擇一個(gè)模板RNA或其上的基因序列。
在隨機(jī)引導(dǎo)時(shí),具有隨機(jī)序列的寡核苷酸群,通常是隨機(jī)的五聚體、六聚體、7-mer、8-mer、9-mer、10-mer、11-mer、12-mer或更長的寡聚體序列用于在模板核酸鏈(本文是第一延伸鏈)中的任意位置引導(dǎo)延伸反應(yīng)。除了該隨機(jī)寡核苷酸序列外,引物當(dāng)然可以包含另外的核苷酸。任選地,額外的隨機(jī)條碼可用于區(qū)分多轉(zhuǎn)錄子拷貝與PCR復(fù)制事件。優(yōu)選地,另外的引物是DNA,任選如下所述修飾。
“隨機(jī)引物”應(yīng)被理解為具有不同引物序列部分的不同引物的混合物,由于隨機(jī)合成至少該引物序列的一部分而具有較高差異。隨機(jī)引物有可能覆蓋所述序列的完整的組合區(qū)。隨機(jī)引物的隨機(jī)序列引物部分可覆蓋1、2、3、4、5、6、7、8或更多隨機(jī)核苷酸或通用核苷酸。給定核苷酸位置的隨機(jī)核苷酸隨機(jī)選自A、G、C或T(U)。對于引物序列的雜交序列,T和U在本文中可互換使用。隨機(jī)序列部分的組合可能性是mn,其中m是所用的核苷酸類型的數(shù)目(優(yōu)選所有4種A、G、C、T(U)),n是隨機(jī)核苷酸的數(shù)目。因此,隨機(jī)六聚體,其中每種可能的序列均有體現(xiàn),由46=4096種不同的序列組成。隨機(jī)引物也可包含一或多個(gè)核苷酸,其不像A、T、C或G那樣特異性結(jié)合互補(bǔ)核苷酸。這些核苷酸也稱為“擺動(dòng)堿基”或“通用堿基”??墒褂镁哂型ㄓ脡A基的核苷酸,例如脫氧肌苷、3-硝基吡咯2'-脫氧核苷和5-硝基吲哚2'-脫氧核苷。通用堿基將與A、C、G、T(U)的任意一種核苷酸或其至少兩種或三種核苷酸堿基配對。該隨機(jī)引物不必囊括所有可能性。在某些實(shí)施方案中,隨機(jī)引物包含至少一種隨機(jī)核苷酸(如上所述在一個(gè)位置排列)和/或至少一種擺動(dòng)核苷酸。對于隨機(jī)引物或選擇序列的引物,使用至少10種、優(yōu)選至少20種、特別優(yōu)選至少100種不同的引物。
隨機(jī)引導(dǎo)的延伸中特別但不限于最優(yōu)的情況,引物可以以10nM-100μM,更優(yōu)選約1μM,但也可以是至少200nM的濃度存在。在優(yōu)選實(shí)施方案中,引物與模板核酸的比率(w/w)介于5:1至1:1000,優(yōu)選介于2:1至1:500,優(yōu)選介于1:1至1:300,優(yōu)選介于1:2至1:250,優(yōu)選介于1:5至1:150,優(yōu)選介于1:10至1:100,優(yōu)選介于1:12至1:50。引物與模板核酸的摩爾比可以介于100:1至1000000:1,優(yōu)選介于1000:1至1000000:1,介于10000:1至500000:1,或介于20000:1至300000:1。在一個(gè)實(shí)施例中,使用100ng的mRNA起始材料,并假定mRNA長度為500-5000nt,均值2000nt,添加1nmol引物,則引物以6800:1的摩爾過量存在。
另外的引物可以包含一個(gè)區(qū)域,其具有與第一延伸鏈退火的序列,以及任選并不結(jié)合的區(qū)域,例如通過具有非互補(bǔ)序列和/或被寡核苷酸封閉的序列,所述寡核苷酸與該區(qū)域雜交而阻止進(jìn)一步的雜交。該非結(jié)合區(qū)域也可包括條碼,優(yōu)選隨機(jī)條碼,使多個(gè)轉(zhuǎn)錄子拷貝與PCR復(fù)制事件區(qū)分。
步驟e)以模板特異性方式延伸一或多個(gè)另外的寡核苷酸引物而不置換與所述第一延伸鏈退火的引物,或使用破壞被置換的鏈的聚合酶,由此產(chǎn)生另外的延伸產(chǎn)物,其與步驟b)構(gòu)思類似。任何適于給定模板例如DNA的延伸方法均可使用。在優(yōu)選實(shí)施方案中,使用(如果模板是DNA,則是DNA依賴的,如果模板是RNA,則是RNA依賴的)聚合酶,優(yōu)選DNA聚合酶,如果另外的延伸產(chǎn)物將是DNA。
該步驟中防止引物置換可通過多種措施實(shí)現(xiàn),例如選擇無置換活性的聚合酶或提供對聚合酶置換具有抗性的引物,或使用破壞被置換的鏈的聚合酶。
由于DNA聚合酶可從DNA的模板鏈置換DNA寡核苷酸,至少與溶解二級(jí)或三級(jí)結(jié)構(gòu)相當(dāng),可以增強(qiáng)寡核苷酸的雜交以防止聚合酶的鏈置換。鏈置換活性特別強(qiáng)的DNA聚合酶是Klenow聚合酶(Klenow片段)??赏ㄟ^使用對寡核苷酸自身的修飾或通過使用穩(wěn)定寡核苷酸雜交或阻止聚合酶的添加劑,實(shí)現(xiàn)防止置換。降低或抑制聚合酶鏈置換活性的寡核苷酸修飾例如2’氟核苷酸、PNA、ZNA、G-Clamps(US 6,335,439,a cytosine analogue capable of Clamp Binding to Guanine)或LNA(US 2003/0092905;US7,084,125)。與無修飾的相同的寡核苷酸相比,這些修飾通常通過增加該寡核苷酸與模板RNA或DNA鏈的局部雜交能以增加該寡核苷酸的解鏈溫度,或使該寡核苷酸的糖-磷酸骨架變硬。有些還使糖-磷酸骨架變硬,其進(jìn)一步抑制聚合酶引起的鏈置換。用于鏈置換停止(SDS)的方式在WO 2013/038010A1(通過引用并入本文)中公開。
另外,引物與模板(例如第一延伸產(chǎn)物)的雜交可通過使用結(jié)合或嵌入核酸中的不同的添加劑而改變。例如,可使用溴化乙錠、SybrGreen(US5,436,134;US 5,658,751;US 6,569,627)或acricidine,優(yōu)選特異于RNA:DNA或DNA:DNA雜交的嵌入劑。可結(jié)合dsNA的其他化合物是放線菌素D和類似物、新霉素家族的氨基葡糖苷(新霉素、核糖霉素、巴龍霉素和弗氏菌絲素)。改變引物雜交性能的添加劑也可共價(jià)包含于引物結(jié)構(gòu)中。
通過添加核酸結(jié)合蛋白例如單鏈結(jié)合蛋白如TtH SSB或Tth RecA,可改變雜交能和動(dòng)力學(xué)以抑制聚合酶引起的鏈置換。
本領(lǐng)域技術(shù)人員知曉那些添加劑僅為示例,任意其他導(dǎo)致引物-模板雜交穩(wěn)定性增加的化合物、堿基修飾或酶均可用于增加Tm,并由此抑制鏈置換或抑制涉及的酶的鏈置換能力。
Tm的增加應(yīng)當(dāng)足夠強(qiáng)大以防止延伸聚合酶引起的與模板退火的引物區(qū)域的5’端核苷酸任意一個(gè)的置換。特別地,本發(fā)明的Tm增加防止與模板退火的引物區(qū)域的5’端下游的第三、第二和/或第一核苷酸置換(另外的非退火的5’核苷酸可能存在,例如接頭區(qū)域或條碼,其無需修飾)。
在本發(fā)明的某些實(shí)施方案中,鏈置換需要恰好停止在下游引物的第一5’核苷酸處。
因此,優(yōu)選寡核苷酸引物的結(jié)合在其與模板退火的區(qū)域的5’端特異性地發(fā)生Tm增強(qiáng),從而防止延伸聚合酶置換它們。修飾包括但不限于LNA、PNA、ZNA、吖啶或熒光團(tuán)。
在其5’端具有增加的Tm的寡核苷酸例如LNA-修飾的寡核苷酸使得恰好在下一引物起始處停止。本發(fā)明涵蓋了將以下進(jìn)行組合:通過使用LNA-修飾的寡核苷酸的鏈置換停止與無鏈置換活性的聚合酶,降低反應(yīng)溫度,以及使用不同的添加劑增加引物與模板的結(jié)合。
優(yōu)選地,C和/或G核苷酸被修飾。即便未被修飾,這些核苷酸具有比A或T更高的Tm,這緣于互補(bǔ)退火時(shí)增加的氫鍵形成。在優(yōu)選實(shí)施方案中,寡核苷酸引物包含至少1個(gè)、至少2個(gè)、至少3個(gè)、至少4個(gè)、至少5個(gè)、至少6個(gè)選自G或C的修飾的核苷酸。這些修飾的核苷酸優(yōu)選在引物序列的5’端,所述引物如上所述與模板退火。
最有效的鏈置換停止是由G或C堿基實(shí)現(xiàn)的,因?yàn)樗鼈冊黾右锘蛲V棺拥木植縏m。因此半隨機(jī)引物(六聚物、七聚物、八聚物、九聚物等)包含至少兩個(gè)、更優(yōu)選三個(gè)或更多個(gè)G或C或G和C的組合。最優(yōu)選這些G或C經(jīng)修飾以增加局部解鏈溫度,使用LNA修飾堿基時(shí)正是如此。最優(yōu)選至少1個(gè)、至少2個(gè)或至少3個(gè)LNA修飾的堿基用在退火的引物區(qū)域的5’端。因此,優(yōu)選使用任選自G或C的至少2個(gè)、至少3個(gè)修飾的核苷酸。
有幾種方式方法可確保當(dāng)延伸反應(yīng)到達(dá)與模板退火的額外引物位置時(shí),延伸反應(yīng)停止。該停止在本文中也被視為防止鏈置換。本發(fā)明防止聚合酶鏈置換已經(jīng)復(fù)制的多核苷酸部分的后續(xù)引物的步驟確保多核苷酸分子已經(jīng)復(fù)制的任意部分不再被復(fù)制,并且特別地,對應(yīng)于原始RNA模板最3’部分的第一延伸鏈的最5’-面向部分不再被復(fù)制。因此,多核苷酸的復(fù)制部分在第二鏈合成中均不超量,特別是所述最5’-面向的復(fù)制部分從每個(gè)合成的第一鏈模板僅合成一次。這種對鏈置換的抑制可通過不同方式實(shí)現(xiàn),例如降低反應(yīng)溫度、使用無鏈置換活性的聚合酶、增加引物:模板雜交的解鏈溫度或雜交能,或增加RNA或引物的剛性或穩(wěn)定螺旋。實(shí)際上,通常選擇這些方式的組合以實(shí)現(xiàn)無鏈置換的最佳反應(yīng)條件。本領(lǐng)域技術(shù)人員能夠選擇本文所述或本領(lǐng)域已知的適合的參數(shù),以適用于具體的模板和反應(yīng)條件。
一種選擇是調(diào)整反應(yīng)溫度。通常37℃以上,特別是70℃以上的反應(yīng)溫度在延伸過程中有利,從而更好地使模板中的二級(jí)結(jié)構(gòu)解散,其導(dǎo)致更有效的置換合成。在一個(gè)實(shí)施方案中,停止引物的鏈置換是通過降低反應(yīng)溫度實(shí)現(xiàn)的。低于37℃,以及低至25℃,并且進(jìn)一步低至4℃的反應(yīng)溫度用于減少鏈置換。然而,當(dāng)使用具有鏈置換活性的聚合酶和/或使用不具有改變其解鏈溫度的修飾的簡單停止子寡核苷酸時(shí),即使在更低的反應(yīng)溫度,鏈置換停止也不完全。優(yōu)選聚合在12℃-37℃進(jìn)行。
在作為替代,或除降低反應(yīng)溫度以在另外的引物或終止子的所述位置實(shí)現(xiàn)更好的延伸停止(并減少鏈置換)之外的一個(gè)實(shí)施方案中,可以使用缺乏鏈置換的聚合酶。對于DNA,DNA聚合酶,優(yōu)選T7、T4或Q5DNA聚合酶用于以模板特異性方式延伸一或多個(gè)寡核苷酸引物。T4DNA聚合酶尤其有效并在所有實(shí)施方案中優(yōu)選。
聚合酶可以是嗜常溫的或嗜熱的聚合酶,尤其是DNA聚合酶。
缺乏鏈置換的突變聚合酶在后續(xù)引物未被修飾時(shí)能夠置換多達(dá)3nt。本發(fā)明包括將通過降低反應(yīng)溫度的鏈置換停止與使用缺乏置換合成的突變體或鏈置換合成被破壞的任意其他聚合酶組合。
增加單價(jià)反離子的濃度也會(huì)穩(wěn)定任意模板-引物雜交(以及二級(jí)結(jié)構(gòu))。單價(jià)陽離子的濃度優(yōu)選至少20mM、至少30mM、至少40mM、至少50mM、至少60mM、至少70mM.
作為任意上述選項(xiàng)之一的替換或與其組合,群集劑優(yōu)選PEG的存在可增加對鏈置換的阻止。群集劑是惰性分子,可以高濃度使用并且可用于模擬細(xì)胞內(nèi)的大分子聚集的效果。實(shí)例有PEG(聚乙二醇)、PVP(聚乙烯吡咯烷酮)、海藻糖、聚蔗糖和右旋糖酐。群集劑例如在US 5,554,730或US8,017,339中公開。其他作為群集劑的添加劑是Tween-20、NP-40,可額外或替代PEG添加。在本發(fā)明的范圍內(nèi),優(yōu)選使用最終12%-25%的PEG-8000(v/v)??梢允褂貌煌腜EG分子量和化合物,本領(lǐng)域技術(shù)人員知曉添加劑的種類和濃度可變以最優(yōu)化結(jié)果。群集劑優(yōu)選在步驟e)中存在,以降低鏈置換的風(fēng)險(xiǎn)。作為替換或組合,它們也可在任意其他步驟,例如在純化,尤其是在沉淀步驟中存在。試劑盒可以包含群集劑,優(yōu)選在用于反應(yīng)步驟e)的緩沖液中,例如包含聚合酶的輔因子如Mg2+的緩沖液。之后,群集劑也可存在于沉淀緩沖液中,其中群集劑的濃度將增加到足以沉淀多核苷酸,尤其是延伸產(chǎn)物。
步驟f),分離和/或擴(kuò)增所述另外的延伸產(chǎn)物的延伸產(chǎn)物,其包含與所述第一寡核苷酸引物互補(bǔ)的延伸(或互補(bǔ))的核酸部分,該步驟選擇步驟e)正確的延伸產(chǎn)物,其對應(yīng)于原始模板RNA預(yù)先選定的核酸區(qū)域。由于步驟e)中的鏈置換被阻礙或防止,本質(zhì)上每個(gè)模板將僅有一個(gè)來自步驟e)的延伸產(chǎn)物(直接的第一延伸鏈,以及隱含的原始模板RNA),因?yàn)槠渌嘶鹨飳o法延伸至對應(yīng)于預(yù)先選定的核酸區(qū)域的區(qū)域,這是因?yàn)榭裳由熘恋谝灰锝Y(jié)合的所述預(yù)先選定的區(qū)域,并且可進(jìn)一步延伸到所述第一引物的完整序列的最3’引物的封閉作用。其他封閉事件可以是因?yàn)镽NA模板的剩余片段,如果步驟c)的去除留了一些與第一延伸鏈退火的短的降解產(chǎn)物,其應(yīng)該通過完全的RNA模板去除而避免發(fā)生,否則成功使最后的最3’引物延伸至期望的預(yù)先選定的區(qū)域的可能性也會(huì)降低。
該正確的另外的延伸產(chǎn)物(每一模板)的“選擇”可通過例如分離、純化或擴(kuò)增或通常任意特異于另外的延伸產(chǎn)物的處理來實(shí)現(xiàn),所述另外的延伸產(chǎn)物包含與第一寡核苷酸引物互補(bǔ)的延伸的核酸部分。分離可例如包含與固定化探針的結(jié)合。擴(kuò)增可用于獲得另外的延伸產(chǎn)物的互補(bǔ)鏈,其使用引物,將另外的延伸產(chǎn)物作為模板而選擇性產(chǎn)生。擴(kuò)增可以是PCR循環(huán),其包含另外的引物退火和鏈延伸反應(yīng)。對于分離或擴(kuò)增,已知序列可用作識(shí)別序列,尤其是用于寡核苷酸結(jié)合。該已知序列例如是與步驟a)的模板RNA的原始的預(yù)先選定的核酸區(qū)域相同的序列,因此對應(yīng)于第一引物的選擇性序列區(qū)域,或?qū)?yīng)于包含在第一引物中的任意其他區(qū)域,例如以下進(jìn)一步描述的接頭或條碼序列。
根據(jù)本發(fā)明任意實(shí)施方案的優(yōu)選,步驟a)的第一寡核苷酸引物和/或步驟d)的另外的寡核苷酸引物包含非退火序列標(biāo)簽或接頭序列。該序列標(biāo)簽或接頭可用于另一延伸,尤其是PCR反應(yīng)中的擴(kuò)增引物結(jié)合。序列標(biāo)簽或接頭也可包含每個(gè)引物或引物類型(尤其是對于隨機(jī)引物)的獨(dú)特的序列或普遍存在的序列標(biāo)識(shí),也稱作條碼或條碼序列。序列身份或標(biāo)識(shí)可確定特定實(shí)驗(yàn)或批次的引物(以及后續(xù)的延伸產(chǎn)物),或單個(gè)延伸產(chǎn)物或延伸產(chǎn)物的組。序列標(biāo)簽允許通過大量同步測序進(jìn)一步分析?!胺峭嘶稹笨扇缦聦?shí)現(xiàn):通過選擇不與其雜交模板(RNA模板,第一或另外的延伸鏈)退火的序列,和/或通過將非退火序列與另一寡核苷酸雜交,由此封閉引物的該部分并防治與模板的雜交。
也有可能在第一引物退火(步驟a中)之前的模板RNA是片段化的RNA,即例如獲自樣品的RNA經(jīng)處理進(jìn)行片段化以提供模板RNA。該片段化可使用本領(lǐng)域已知的任意方式進(jìn)行。片段化可以序列依賴性方式啟動(dòng),例如通過內(nèi)切核酸酶消化,或以序列非依賴性方式啟動(dòng),例如通過物理方式如超聲或剪切,或例如通過化學(xué)方式如水解。如果使用序列依賴性方法,例如限制性內(nèi)切核酸酶消化或序列特異性擴(kuò)增,片段末端會(huì)具有序列偏倚。一個(gè)優(yōu)選實(shí)施方案是通過如上述步驟c)所述的限制性降解或水解進(jìn)行片段化,例如在二價(jià)陽離子存在下加熱或在堿性條件下,但時(shí)間有限和/或溫度較低,以保留較大的RNA片段。此類片段例如可以具有約100-5000nt的平均長度,優(yōu)選300-3000nt,尤其優(yōu)選500-2000nt。片段需要保持多于50nt,優(yōu)選多于100nt,尤其優(yōu)選多于150nt的最小長度,以使被靶向的3’端片段中的選擇性序列部分保持完整,為步驟e)中的隨機(jī)引導(dǎo)提供足夠長的序列,并且在互補(bǔ)的第一和第二引物序列之間保留足夠長的序列插入,其可定位于基因組和/或轉(zhuǎn)錄組注釋。優(yōu)選序列插入多于10nt,多于15nt,優(yōu)選多于20nt長,其經(jīng)常被設(shè)定為生物信息NGS測序閱讀比對算法的最小長度要求。
優(yōu)選該方法包含在另外的延伸產(chǎn)物上使用特異于所述延伸產(chǎn)物的序列標(biāo)簽或接頭序列的引物(或引物對)進(jìn)行PCR。該接頭或序列標(biāo)簽可通過步驟a)中的引物和/或步驟d)中的引物導(dǎo)入。
另外的PCR的這些額外的引物可包含額外的序列標(biāo)簽或接頭序列,其可再次用于PCR擴(kuò)增。這些標(biāo)簽或接頭也可包含序列標(biāo)識(shí),例如用于首次提及的接頭或序列標(biāo)簽的上述條碼。
在優(yōu)選方式中,本發(fā)明的方法在步驟f)中還包含純化步驟e)的延伸產(chǎn)物。該純化可以是選擇具有對應(yīng)于步驟e)的延伸產(chǎn)物的預(yù)期長度,例如150-500nt長度的多核苷酸。步驟e)延伸產(chǎn)物的長度可以通過例如調(diào)整隨機(jī)引物的引物濃度來控制,即隨機(jī)引物越多,會(huì)導(dǎo)致第一鏈上越多的引導(dǎo)事件,并且因此在步驟f)中選擇的期望的延伸產(chǎn)物將更接近第一引導(dǎo)位點(diǎn),因此長度更短。可通過沉淀延伸產(chǎn)物,使長度例如小于100nt的短的多核苷酸保留在溶液中并去除溶液中的多核苷酸而進(jìn)行純化。50-100nt是包括兩個(gè)序列標(biāo)簽或接頭(一邊一個(gè))的引物-引物產(chǎn)物的典型長度。在優(yōu)選方式中,純化是去除長70nt或更短,或50nt或更短,或40nt或更短,或30nt或更短的短的多核苷酸。40-70nt是引物以及包括序列標(biāo)簽或接頭的引物的典型長度。優(yōu)選地,該方法包含固相可逆固定,其向固相表面如具有羥基的部分的表面,以及從該固相表面選擇性結(jié)合和釋放具有限定尺寸范圍的多核苷酸[Hawkins,1995]。尺寸依賴性多核苷酸沉淀可通過群集劑,優(yōu)選通過PEG實(shí)施,使用包括限定的鹽濃度和pH值的特異性緩沖條件。優(yōu)選地,在期望的較長的多核苷酸釋放到不包含或包含極少群集劑的新緩沖液中之前,待去除的短的多核苷酸不結(jié)合(例如沉淀)到包被的珠上,并隨上清液被去除。優(yōu)選此類珠包含磁核心[US 5705628]。其他純化方法包括尺寸依賴性色譜法例如體積排阻色譜。
可與每個(gè)其他實(shí)施方案結(jié)合的本發(fā)明的一個(gè)優(yōu)選實(shí)施方案是方法的步驟a)-e)在一個(gè)隨后增加的流體體積,例如一個(gè)池、一個(gè)容器或一個(gè)管子中進(jìn)行。所有反應(yīng)步驟均在所述一個(gè)溶液中進(jìn)行,自在分裝溶液中提供RNA后開始,直到分離或擴(kuò)增期望的延伸產(chǎn)物,所述延伸產(chǎn)物包含與第一寡核苷酸引物互補(bǔ)的延伸的核酸部分,逐漸地,其他反應(yīng)成分通過添加另外的溶液而添加。在流體中添加進(jìn)行本發(fā)明方法必需的試劑,例如起始物質(zhì)、酶和輔因子構(gòu)建了反應(yīng)混合物。本質(zhì)上,具有步驟a)-e)的方法可以沒有額外的純化步驟而進(jìn)行。由此步驟a)-e)采取的行動(dòng)本身不能被認(rèn)為是純化,尤其是步驟c)的RNA去除,因?yàn)镽NA降解后的降解產(chǎn)物可保留在溶液中。特別地,在一個(gè)增加的流體體積或一個(gè)容器中進(jìn)行的具有步驟a)-e)的本發(fā)明的方法優(yōu)選是不從反應(yīng)混合物去除流體的方法。該方法顯著簡化了處理過程。通過不純化中間產(chǎn)物以及分割反應(yīng)體積,其還有助于保留樣品和后續(xù)反應(yīng)產(chǎn)物。
本發(fā)明還提供試劑盒,其包含逆轉(zhuǎn)錄酶,dNTP,聚合酶所需輔因子或金屬離子優(yōu)選Mg2+的鹽,引物,優(yōu)選poly-T引物,無鏈置換活性的DNA聚合酶例如T7、Q5或T4DNA聚合酶,隨機(jī)寡核苷酸引物。試劑盒可適于進(jìn)行根據(jù)任意實(shí)施方案的本發(fā)明的方法,具有優(yōu)選特征的任意一個(gè)或組合。引物,優(yōu)選poly-T引物或多個(gè)基因或轉(zhuǎn)錄子特異性引物的一個(gè)或混合物適合步驟a),隨機(jī)引物適合用于步驟d)。這些引物或引物制備物的引物組成不同,優(yōu)選在不同容器,例如小瓶中提供。
試劑盒還可包含用于升溫RNA降解的RNA降解劑,例如酶或二價(jià)陽離子,和/或群集劑例如PEG。當(dāng)然上述任意組分均可用于替換的或更優(yōu)選的實(shí)施方案。
產(chǎn)生本發(fā)明的核酸產(chǎn)物所實(shí)現(xiàn)的另一個(gè)優(yōu)勢是長度標(biāo)準(zhǔn)化,所有另外的延伸產(chǎn)物獲得相似的長度或較窄的長度分布,其釋放了測序空間,由此可被讀段使用,所述讀段由完整且更長的轉(zhuǎn)錄子產(chǎn)生。被理解為節(jié)省測序空間但獲得關(guān)于基因表達(dá)和轉(zhuǎn)錄末端位點(diǎn)分布的收獲是轉(zhuǎn)錄子長度變化和樣品中轉(zhuǎn)錄子動(dòng)態(tài)或濃度范圍之間的關(guān)系。當(dāng)觀察兩個(gè)邊界條件時(shí),該關(guān)系得到最佳例證。i)如果所有轉(zhuǎn)錄子會(huì)具有相同的已知長度,例如所有轉(zhuǎn)錄子均1kb長并且所有產(chǎn)生的片段/讀段均獨(dú)特定位,則長度標(biāo)準(zhǔn)化,例如到100bp并無益處。因此,收獲并不取決于平均長度的降低,而是長度分布的降低。ii)如果所有轉(zhuǎn)錄子會(huì)具有不同和未知的長度,例如轉(zhuǎn)錄子已知長500bp-10000kb,并且許多產(chǎn)生的片段/讀段無法唯一確定,因?yàn)樗鼈兌ㄎ挥谕怙@子,其由來自相同基因的幾個(gè)轉(zhuǎn)錄子變體共用,則長度標(biāo)準(zhǔn)化,例如到100bp會(huì)有利于明確計(jì)數(shù)讀段,并確定與讀段總數(shù)相關(guān)的正確的基因表達(dá)值。因此,濃度加權(quán)的長度分布、序列注釋的正確性(預(yù)先了解)以及獨(dú)特地定位讀段(其可被毫無疑義地確定到正確的轉(zhuǎn)錄子)的能力是轉(zhuǎn)錄組復(fù)雜性的相關(guān)測量。該復(fù)雜性可被本發(fā)明的方法顯著降低。
本發(fā)明方法的商業(yè)機(jī)會(huì)可見于替換微陣列基因表達(dá)譜并提供次于全部mRNA轉(zhuǎn)錄組分析的中間分析工具。毒物基因組學(xué)(Toxicogenomic)和藥物基因組學(xué)是可能應(yīng)用的實(shí)例。通過在步驟a)和/或步驟d)中使用區(qū)域、基因或轉(zhuǎn)錄子特異性引物,靶向測序組成為可能。靶向(序列特異性,預(yù)先選定的/預(yù)先確定的)和非靶向(例如針對遍在序列如所有感興趣的RNA序列共有的序列,如polyA,或隨機(jī)序列)第一和第二引物的任意組合是可能的,例如a)靶特異性(=靶向)第一引物和非靶向第二引物;b)非靶向第一引物和靶向第二引物;c)靶向第一引物和靶向第二引物;d)非靶向第一引物和非靶向第二引物。當(dāng)然,在一個(gè)后續(xù)增加的流體體積中進(jìn)行本發(fā)明方法的益處適用于所有這些變體,尤其是無需流體去除/清洗。b)的用途例如是檢測3’側(cè)潛在的變異,例如選擇性剪接事件、選擇性的最后外顯子、選擇性PAA以及融合事件。a)的用途例如是檢測5’側(cè)潛在的變異,例如選擇性剪接事件、選擇性的第一外顯子以及融合事件。
無意于被本發(fā)明的這些實(shí)施方案限制,本發(fā)明進(jìn)一步在后續(xù)附圖和實(shí)施例中例證。
附圖
圖1:本發(fā)明方法的概覽。反應(yīng)通過后續(xù)添加反應(yīng)物進(jìn)行,并分為以下階段:a)cDNA合成通過引導(dǎo)至已經(jīng)存在(此處是mRNA的Poly(A))或在之前反應(yīng)中附著的已知區(qū)域或標(biāo)簽而起始。P1與所述已知區(qū)域互補(bǔ)并且在其5’端還包含作為通用標(biāo)簽的非互補(bǔ)特異性序列。b)RNA通過RNA依賴的聚合酶,即逆轉(zhuǎn)錄酶逆轉(zhuǎn)錄成cDNA。c)cDNA合成后,RNA模板被RNAse、pH變化(NaOH和加熱)或二價(jià)陽離子(Mn2+,Mg2+和加熱)水解或降解。d)然后單鏈cDNA被多個(gè)隨機(jī)引物P(n)、P(n+1)...P(n+n)引導(dǎo)。e)使用無鏈置換的DNA依賴的聚合酶合成第二鏈。f)缺少鏈置換確保僅最3’片段會(huì)包含兩個(gè)標(biāo)簽,一個(gè)來自cDNA合成引物,另一個(gè)來自第二鏈合成引物。該最3’片段被分離和/或擴(kuò)增。
圖2:在測定中存在的示例性核酸分子的示意圖。兩個(gè)寡核苷酸(Seq ID:2和Seq ID:3)與單鏈DNA模板(Seq ID:9)雜交。無鏈置換的聚合酶將產(chǎn)生由Seq ID:3延伸導(dǎo)致的65nt長的片段(Seq ID:4)以及由Seq ID:2延伸導(dǎo)致的85nt長的片段(Seq ID:5)。有鏈置換的聚合酶將產(chǎn)生由Seq ID:2延伸以及Seq ID:3置換導(dǎo)致的150nt長的片段(Seq ID:6)。另外會(huì)產(chǎn)生由Seq ID:3延伸導(dǎo)致的65nt長的片段(Seq ID:4),如果鏈置換效率低,會(huì)產(chǎn)生85nt(SeqID:5)和150nt(Seq ID:6)之間的產(chǎn)物。
圖3:不同反應(yīng)溫度有無鏈置換活性的聚合酶的比較。三種不同的聚合酶,T7和T4DNA聚合酶(均無鏈置換)以及Klenow片段3’-5’外切核酸酶(有鏈置換)在不同反應(yīng)溫度進(jìn)行測試。白色填充箭頭代表部分置換的鏈置換停止產(chǎn)物。黑色箭頭代表無變性步驟的單鏈模板的二級(jí)結(jié)構(gòu)。
圖4:有無鏈置換活性的聚合酶在不同反應(yīng)溫度的進(jìn)一步比較。對于T4,25℃比37℃更為推薦,因?yàn)樵?7℃,內(nèi)在的核酸外切酶主導(dǎo)反應(yīng)。
圖5:不同的RNA降解法的比較:使用MnCl2,僅升高溫度,NaOH處理或RNAse。分離自小鼠肝的總RNA摻入111nt的單鏈DNA(ssDNA)寡核苷酸(ID Seq ID:7),參見第1和10泳道。于95℃在標(biāo)準(zhǔn)RT緩沖液50mM Tris-HCl(25℃時(shí)pH 8.3),75mM KCl,3mM MgCl2和10mM DTT中熱處理30分鐘,然后在98℃5分鐘,98℃10分鐘,98℃20分鐘,以及98℃30分鐘,導(dǎo)致RNA降解,但未完全去除RNA。將RNA/ssDNA混合物與RNase H/A/T1混合物在25℃或在37℃孵育30分鐘,完全去除RNA而未降解單鏈DNA。在0.1N NaOH存在下于升高的溫度孵育10分鐘(55℃)降解RNA,盡管并不完全。在0.1N NaOH,95℃10分鐘后,RNA完全被去除,然而ssDNA也開始降解(泳道7-10)。向RNA/ssDNA/RT緩沖液混合物中添加10mM MnCl2并在98℃熱處理5、10、20和30分鐘導(dǎo)致RNA完全降解而未降解ssDNA。
圖6:初始RNA片段化對文庫大小和效率的影響。a)和b)在6mM MnCl2存在下片段化并最終擴(kuò)增14個(gè)PCR循環(huán),而c)和d)在4mM MnCl2存在下片段化并需要再多2個(gè)PCR循環(huán)。所有片段化均在85℃進(jìn)行3分鐘。
圖7:RT引物濃度和第二鏈合成引物濃度對文庫大小和產(chǎn)量的影響。a)50nM錨定的polydT(RT)引物(SEQ ID No:8)和1μM第二鏈合成寡核苷酸+rc(SEQ ID No:9和10),b)25nM錨定的polydT(RT)引物和0.5μM第二鏈合成寡核苷酸+rc,文庫在上樣前1:3稀釋,c)50nM錨定的polydT(RT)引物和0.5μM第二鏈合成寡核苷酸+rc,文庫在上樣前1:3稀釋,d)25nM錨定的polydT(RT)引物和0.1μM第二鏈合成寡核苷酸+rc。
圖8:RNA降解方法對NGS文庫質(zhì)量的影響。RNA通過以下降解:a)10mM MnCl2于95℃10分鐘,b)5000U RNAse H于37℃30分鐘,c)逆轉(zhuǎn)錄緩沖液于95℃10分鐘,d)100mM NaOH于95℃10分鐘,以及e)200mM MnCl2。ML,低分子量標(biāo)志物;MH,高分子量標(biāo)志物;P,剩余引物;LL,接頭-接頭片段。
圖9:第二鏈合成后的硅膠柱和SPRI純化的比較。a)SPRI純化,使用羥基修飾的磁珠和鹽-PEG緩沖液,以及b)硅膠柱純化,使用pH緩沖液系統(tǒng)。
圖10:核苷酸序列
實(shí)施例
實(shí)施例1:3’末端NGS文庫產(chǎn)生,用于Illumina測序平臺(tái)。
簡言之,主文庫產(chǎn)生如圖1所述進(jìn)行。a)cDNA合成通過引導(dǎo)至已經(jīng)存在(此處是mRNA的Poly(A))或在之前反應(yīng)中附著的已知區(qū)域或標(biāo)簽而起始。P1與所述已知區(qū)域互補(bǔ)并且在其5’端還包含作為通用標(biāo)簽的非互補(bǔ)特異性序列。b)RNA通過RNA依賴的聚合酶,即逆轉(zhuǎn)錄酶逆轉(zhuǎn)錄成cDNA。c)cDNA合成后,RNA模板被RNAse、pH變化(NaOH和加熱)或二價(jià)陽離子(Mn2+、Mg2+和加熱)水解或降解。d)然后單鏈cDNA被多個(gè)隨機(jī)引物P(n)、P(n+1)...P(n+n)引導(dǎo),以及e)使用無鏈置換的DNA依賴的聚合酶合成第二鏈。缺少鏈置換確保僅最3’片段會(huì)包含兩個(gè)標(biāo)簽,一個(gè)來自cDNA合成引物,另一個(gè)來自第二鏈合成引物。
以下更為詳細(xì)地描述各個(gè)反應(yīng)步驟。
文庫產(chǎn)生始于通過逆轉(zhuǎn)錄的第一鏈cDNA合成,其中在其5’端含有一個(gè)Illumina相容序列的oligodT引物與RNA雜交,之后發(fā)生逆轉(zhuǎn)錄。為此目的,對于一個(gè)單個(gè)的文庫的制備,5μl RNA與5μl第一鏈cDNA合成Mix 1混合,其包含逆轉(zhuǎn)錄必需的所有成分,包括在PCR板的一個(gè)孔中,或者在8孔板條的一個(gè)孔中,或在任意其他熱循環(huán)儀相容管中的oligo dT引物,但無酶。如果使用較小體積的RNA,則添加不含RNAse的水至總體積10μl。然后溶液孔通過用移液器吸取混合,并密封PCR板。密封緊密。板經(jīng)向下旋轉(zhuǎn)使所有液體匯集在孔的底部。然后在熱循環(huán)儀中于85℃使RNA/RT混合物變性3min,之后冷卻至37℃,允許RT引物a)雜交。在小心地移除密封膜之前向下旋轉(zhuǎn)板,以確保所有液體匯集到孔底部。
之后在板被再次密封之前,10μl逆轉(zhuǎn)錄酶稀釋液通過用移液器吸取混合至每個(gè)反應(yīng)中。液體需要向下旋轉(zhuǎn),并且在步驟b)中,板在37℃孵育15分鐘。
c)RNA模板被去除。在該步驟中,RNA模板被破壞,這對有效的第二鏈合成是必須的。在第一鏈合成反應(yīng)之后去除密封膜之前,板迅速向下旋轉(zhuǎn)以確保所有液體匯集在孔底部。將5μl RNA去除溶液直接添加至第一鏈合成反應(yīng)并混勻,使用新鮮膜再次密封板。板必須于95℃孵育10分鐘,之后冷卻至25℃,向下旋轉(zhuǎn)。現(xiàn)在小心地去掉密封膜,添加5μl去除溶液2(其基本上去除或中和隨去除溶液1添加的組分),再次將溶液混合均勻。
d)在后續(xù)的第二鏈合成期間,文庫轉(zhuǎn)變成dsDNA。第二鏈合成由在其5’端含有Illumina相容性接頭序列的隨機(jī)引物起始。反向補(bǔ)體防止接頭序列參與雜交。在該階段,推薦將純化珠(SPRI珠)置于室溫以給它們足夠的平衡時(shí)間。添加15μl第二鏈合成Mix 1(包含DNA依賴的聚合反應(yīng)必需的所有組分),通過用移液器吸取混合均勻,并將板密封?,F(xiàn)在,板在熱循環(huán)儀中于98℃孵育1分鐘,并通過設(shè)定每秒0.5℃的降溫速度緩慢冷卻至25℃,其對應(yīng)于許多熱循環(huán)儀最大降溫速度的10%。反應(yīng)于25℃孵育30分鐘,快速向下旋轉(zhuǎn),之后從板上去除密封膜。
e)添加5μl DNA依賴的聚合酶稀釋液。反應(yīng)于25℃孵育15分鐘。直至步驟e),整個(gè)反應(yīng)在一個(gè)持續(xù)增加的體積中進(jìn)行。反應(yīng)接著進(jìn)入選擇步驟f)。
f)使用磁珠純化雙鏈文庫,其仍含有不期望的不包含P1序列的雙鏈。純化珠(PB)在使用前應(yīng)當(dāng)在室溫平衡30分鐘。PB可能已經(jīng)沉淀,在加入到反應(yīng)中之前必須適當(dāng)重懸。之后,根據(jù)制造商(AMPure Beads;Agentcourt)的說明書進(jìn)行SPRI純化。文庫在20μl水或10mM Tris(pH 8.0)中洗脫,17μl具有文庫的清澈上清轉(zhuǎn)移至新的干凈的PCR板中。必須當(dāng)心不要將任意珠轉(zhuǎn)移到新板中。文庫可在-20℃儲(chǔ)存,用于后續(xù)擴(kuò)增。
通過PCR擴(kuò)增分離最3’片段。文庫也經(jīng)擴(kuò)增添加在NGS機(jī)器上進(jìn)行簇生成所需的完整的接頭,并產(chǎn)生用于質(zhì)控和后續(xù)泳道混合的足夠的材料。使用熱穩(wěn)定DNA聚合酶進(jìn)行標(biāo)準(zhǔn)PCR反應(yīng),之后產(chǎn)物通過最終純化(SPPRI純化,根據(jù)制造商的說明書)再次純化,其中形成的文庫從任意殘留的PCR組分中分離,其中所有輸入的不包含序列P1和Pn的DNA材料通過PCR的相對稀釋過程在整體上被完全置換。不含序列P1和Pn的剩余序列將無法在NGS過程中產(chǎn)生簇,因?yàn)榇禺a(chǎn)生使用從僅包含兩個(gè)序列的單分子起始的PCR擴(kuò)增。最終的文庫在20μl添加的EB中洗脫,珠在室溫下孵育2分鐘之前于EB中適當(dāng)重懸。板置于磁性板上收集珠5分鐘,或直到上清徹底清澈。將上清轉(zhuǎn)移至新的PCR板。此時(shí),文庫形成并可用于質(zhì)控、富集、簇生成和進(jìn)一步測序。
實(shí)施例2:在不同溫度比較具有鏈置換活性的非停止聚合酶(Klenow)和無鏈置換活性的停止聚合酶(T4and T7)(圖2、3和4)。
測定描述:
所建立測定的示意圖如圖2所示并描述。具有鏈置換(有和無破壞被置換的鏈的能力)的不同聚合酶和無鏈置換的聚合酶使用圖2中所述測定進(jìn)行評(píng)價(jià)。簡言之,Seq ID:1、Seq ID:2和Seq ID:3在不同聚合酶的相應(yīng)緩沖液中雜交。雜交后添加聚合酶(3U T4DNA聚合酶,10U T7DNA聚合酶,或5U Klenow片段(3'-5'外切核酸酶),反應(yīng)如圖3和圖4所示進(jìn)行。在指定溫度的反應(yīng)時(shí)間為10分鐘。之后通過硅膠柱純化反應(yīng),去除緩沖液組分和酶,而無任何尺寸選擇。將樣品上樣至10%PAA凝膠(與上樣染料混合并于95℃變性2分鐘)并在100V跑膠10分鐘,然后于58℃在180V跑膠120分鐘。用GYBR Gold染膠。
在圖3中,變性和緩慢退火步驟(從95℃以較慢的降溫梯度降至反應(yīng)溫度,耗時(shí)15分鐘)的重要性經(jīng)證實(shí),因?yàn)閷τ跓o鏈置換的聚合酶,模板中的二級(jí)結(jié)構(gòu)造成顯著障礙。白色填充箭頭代表部分被置換的鏈置換停止產(chǎn)物。黑色箭頭代表無變性步驟的單鏈模板的二級(jí)結(jié)構(gòu)。Klenow總是顯示鏈置換(尤其在更高溫度),此處阻止cDNA中的二級(jí)結(jié)構(gòu)的變性步驟并非必需,因?yàn)槊改苡闷鋬?nèi)在的鏈置換消除那些二級(jí)結(jié)構(gòu)(圖2)。
圖4證實(shí)5種不同的聚合酶的鏈置換。如上所述進(jìn)行測定,使用相應(yīng)的緩沖液、起始變性步驟,并在圖4所示反應(yīng)溫度進(jìn)行。具有鏈置換的聚合酶:8單位Bst DNA聚合酶,大片段,泳道2;5單位DNA聚合酶I,大(Klenow)片段,泳道7-8;200單位M-MLV,泳道11;以及無鏈置換的聚合酶,泳道3;3單位T4DNA聚合酶,泳道4-6;或破壞被置換的鏈的聚合酶例如5單位Bst DNA聚合酶,全長,泳道3;10單位E.coli DNA聚合酶I,泳道9-10。不同的反應(yīng)溫度如下:12℃,泳道4;25℃,泳道5、7、9;37℃,泳道2-3、6、8、10-11。T4DNA聚合酶含有外切核酸酶活性,該活性在37℃變得顯著。Seq ID:1、Seq ID:5、Seq ID:2和Seq ID:3的降解產(chǎn)物可見。對于Bst DNA聚合酶,大片段,DNA聚合酶I,大(Klenow)片段和M-MlV,有鏈置換并且Seq ID 6(全長產(chǎn)物)可見。另外,對于那些由部分鏈置換產(chǎn)生的聚合酶,大于Seq ID:5的產(chǎn)物可見。對于其他鏈置換聚合酶例如Bst DNA聚合酶,全長(泳道3)和E.coli DNA聚合酶I(泳道9-10),被置換的鏈也被破壞。T4DNA聚合酶并不包含鏈置換,且Seq ID 5清晰可見。對于T4,25℃比37℃更為推薦,因?yàn)樵?7℃,內(nèi)在的核酸外切酶主導(dǎo)反應(yīng)(圖4)。
實(shí)施例3:MnCl2、僅升高溫度、NaOH處理或RNAse引起的RNA降解(圖5)。RNA降解也依賴于緩沖液條件。
分離自小鼠肝的總RNA摻入111nt的單鏈DNA(ssDNA)寡核苷酸(IDSeq ID:7),參見泳道1和10??俁NA很長,因此膠上僅較小的RNA條帶可見,較長的RNA片段留在槽里。經(jīng)片段化,較長的RNA片段被降解并在聚丙烯酰胺膠上以彌散可見。
在標(biāo)準(zhǔn)RT緩沖液50mM Tris-HCl(25℃時(shí)pH 8.3)、75mM KCl、3mMMgCl2和10mM DTT于95℃熱處理30分鐘,然后在98℃5分鐘,98℃10分鐘,98℃20分鐘,以及98℃30分鐘,導(dǎo)致RNA降解,但未完全去除RNA。將RNA/ssDNA混合物與RNase H/A/T1混合物在25℃或在37℃孵育30分鐘,完全去除RNA而未降解單鏈DNA。在0.1N NaOH存在下于升高的溫度孵育10分鐘(55℃)降解RNA,盡管并不完全。在0.1N NaOH95℃10分鐘后,RNA完全被去除,然而ssDNA也開始降解(泳道7-10)。向RNA/ssDNA/RT緩沖液混合物中添加10mM MnCl2并在98℃熱處理5、10、20和30分鐘導(dǎo)致RNA完全降解而未降解ssDNA。將樣品上樣至10%PAA凝膠,未進(jìn)行純化(與上樣染料混合并于95℃變性2分鐘)并在100V跑膠10分鐘,然后于58℃在180V跑膠70分鐘。用GYBR Gold染膠。
實(shí)施例4:RNA降解方法對用無鏈置換的聚合酶合成的NGS文庫質(zhì)量的影響(圖6)。
500ng總RNA與Seq ID:8在20μl中的終濃度為25nM)并在10μl包含4μl 5x RT緩沖液的體積中加熱至85℃持續(xù)3分鐘。冷卻至37℃后,添加1μl 1mM dNTP,200單位M-MLV并于37℃孵育15分鐘。如圖6所示,隨后的RNA水解存在差異。在RT反應(yīng)緩沖液中的生物素-鏈霉親和素捕獲進(jìn)行20分鐘(于25℃,1250rpm的搖床上),使用NEB的5μg鏈霉親和素珠。用清洗緩沖液洗滌珠兩次,通過在10μl MB-H2O中加熱至80℃持續(xù)數(shù)分鐘,使樣品從珠釋放。使用磁鐵收集珠,清澈的上清轉(zhuǎn)移至不同的管子,在其中進(jìn)行第二鏈cDNA合成,使用3單位T4DNA聚合酶Seq ID:9和10(20μl中的終濃度為0.1μM),8%PEG,10mM MgCl2以及0.5mMdNTP,總體積為20μl。在添加聚合酶之前包括一個(gè)變性步驟,98℃,1分鐘,緩慢退火(15分鐘內(nèi)梯度降溫至25℃)。然后根據(jù)SENSE用戶指南對樣品進(jìn)行硅膠純化(第二鏈合成后的部分純化),并在25μl 10mM Tris pH 8中洗脫。10μl純化產(chǎn)物繼而根據(jù)SENSE mRNA Seq PCR進(jìn)行18個(gè)循環(huán)的擴(kuò)增,使用Seq ID:11和12作為PCR引物。然后根據(jù)SENSE用戶指南對樣品進(jìn)行硅膠純化(第二鏈合成后的部分純化),并在15μl 10mM Tris pH 8中洗脫。1μl純化的PCR產(chǎn)物根據(jù)制造商的說明書上樣于高靈敏度的DNA芯片(Agilent)上。
RNAse和MnCl2對RNA的降解導(dǎo)致比NaOH水解更高的產(chǎn)量,NaOH水解損壞cDNA或?qū)е聣A基修飾,使得cDNA無法擴(kuò)增。
實(shí)施例5:RNA在RT緩沖液中的初始片段化決定文庫的大小和方案的效率(圖6)。
RNA在其中變性的體積也影響變性期間存在的MgCl2濃度,并且這也決定由輕微片段化RNA產(chǎn)生的cDNA會(huì)有多長。
500ng總RNA與Seq ID:8混合(在20μl中的終濃度為25nM)并在10μl(a和b)或15μl(c和d)包含4μl 5x RT緩沖液的體積中加熱至85℃持續(xù)3分鐘。在冷卻至37℃后,添加1μl 1mM dNTP,200單位M-MLV并在37℃孵育15分鐘。在10mM MnCl2存在下通過加熱至98℃持續(xù)10分鐘使RNA水解。之后添加10mM EDTA。第二鏈合成通過如下進(jìn)行:向反應(yīng)中添加第二鏈合成組分,至終濃度10mM MgCl2,0.5mM dNTP,8%PEG,SEQ ID:9和10各100nM終濃度,以及3單位T4DNA聚合酶,總體積40μl。在加熱至98℃,1分鐘,緩慢退火(15分鐘內(nèi)梯度降溫至25℃)之后再次添加聚合酶。如實(shí)施例4中所述進(jìn)行純化、PCR擴(kuò)增和后續(xù)PCR純化以及生物分析儀操作。
實(shí)施例6:通過RT引物濃度和第二鏈合成寡核苷酸濃度調(diào)節(jié)文庫大小和產(chǎn)量(圖7)。
所有文庫進(jìn)行17個(gè)循環(huán)。所有操作條件均根據(jù)實(shí)施例5,濃度可變:a)逆轉(zhuǎn)錄(RT)步驟中50nM Seq ID:8,在第二鏈合成(SSS)中0.1μM Seq ID:9和10,b)RT中25nM Seq ID:8,SSS中0.5μM Seq ID:9和10,上樣前文庫1:3稀釋,c)RT中50nM Seq ID:8,SSS中0.5μM Seq ID:9和10,上樣前文庫1:3稀釋,d)RT中25nM Seq ID:8,SSS中0.1μM Seq ID:9和10。
實(shí)施例7:硅膠vs.SPRI純化(圖8)。
所有步驟如實(shí)施例6(c)中所述,純化方式不同。硅膠純化如實(shí)施例5中所述進(jìn)行,使用羥基修飾的磁珠和鹽-PEG緩沖液的SPRI純化根據(jù)制造商(來自Agentcourt的AMPure XP珠)的說明書進(jìn)行。
參考文獻(xiàn)
Costa V,et al.(2010)J Biomed Biotech 7(7):1299-20.
Derti A,et al.(2012)Genome Res.22(6):1173-83.
Fox-Walsh K,et al.(2011)Genomics.98(4):266-71.
Hawkins TL,et.al.(1995)Nucleic Acids Res.23:4742-4743.
Mainul Hoque et al.,(2012)Nature Methods 10(2):133-139.
Shepard PJ,et al.(2011)RNA 17:761-772.
Wendl MC and Wilson RK(2009)BMC Genomics 10:article 485.
Wilkening S,et al.(2013)Nucleic Acids Res.41(5):e65.
WO 98/044151
WO 02/059357
US 5705628
US 2011/0160078US 6406891 B1
EP 1371726 A1
WO 2013/038010 A2