欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于多重測序的方法和組合物的制作方法

文檔序號:5939279閱讀:351來源:國知局
專利名稱:用于多重測序的方法和組合物的制作方法
用于多重測序的方法和組合物
交叉引用本申請要求于2010年6月8日提交的美國臨時申請?zhí)?1/352,801的權(quán)益,該申請在此引入作為參考。
序列表本申請包含通過EFS-Web以ASCII格式提交的序列表,該序列表在此完整并入作為參考。所述ASCII副本創(chuàng)建于2011年6月8日,命名為25115-741-201.txt,大小為21Kb。
背景技術(shù)
對DNA的大規(guī)模序列分析可有助于理解與人類及許多重要的經(jīng)濟植物和動物的健康和疾病狀態(tài)有關(guān)的大量生物學(xué)現(xiàn)象,例如,參見Collins等(2003),Nature,422:835-847 !Service, Science,311:1544-1546(2006) ;Hirschhorn 等(2005),NatureReviews Genetics,6:95-108 ;National Cancer Institute,Report of Working Group onBiomedical Technology,“Recommendation for a Human Cancer Genome Project,,,(2005年 2 月);Tringe 等(2005), Nature Reviews Genetics, 6:805_814。對低成本高通量測序和再測序的需求已經(jīng)導(dǎo)致開發(fā)了幾種對很多靶DNA片段同時進行平行分析的新方法,例如 Margulies 等,Nature, 437:376-380 (2005) ;Shendure 等(2005), Science,309:1728-1732 ;Metzker (2005), Genome Research, 15:1767-1776 ;Shendure 等(2004),Nature Reviews Genetics, 5:335-344 ;Lapidus 等,美國專利公開號 US2006/0024711 ;Drmanac 等,美國專利公開號 US2005/0191656 ;Brenner 等,Nature Biotechnology, 18:630-634(2000);等等。 這些方法反映了用于增加靶多核苷酸密度和用于在特定序列檢測化學(xué)的每個循環(huán)中獲得數(shù)量增加的序列信息的多種解決方案。鑒于在給定反應(yīng)中序列混合物的復(fù)雜性,一般限于每個反應(yīng)室進行一個樣品的測序。然而,使用這些下一代測序技術(shù)在給定反應(yīng)中讀取的堿基數(shù)量可能遠遠大于獲得目標序列信息的實際需要,這實質(zhì)上屬于浪費測序空間。隨著對來自多個來源的樣品進行測序的需求越來越高,利用這些技術(shù)的費用可能很快會變得無法承受。測序運行也經(jīng)常受限于能夠平行運行的單獨反應(yīng)的數(shù)目,這進一步限制了可以處理大量樣品的效率。解決這些挑戰(zhàn)的一些方法涉及將額外的標識序列并入每個待分析的靶片段。在不同序列用于不同樣品時,對合并的樣品進行測序后,可以基于加入的序列將序列解析為對應(yīng)樣品來源的子集。然而,添加序列來解析樣品來源面臨著兩個挑戰(zhàn)。第一,當測序中的隨機錯誤發(fā)生在太短的附加序列中或發(fā)生在不足以與對應(yīng)于其他樣品的序列進行區(qū)分的附加序列中時,該隨機錯誤可能導(dǎo)致無法對附加的標識序列與其樣品來源進行正確地鑒別。第二,考慮到此類測序錯誤而加入的較長序列占據(jù)了可短至20個堿基的目標讀數(shù)的有價值測序空間。出于這些限制,需要增加下一代測序技術(shù)的效率,以便可以以較高的鑒別精度來測序較大數(shù)量的樣品,同時使可獲得的測序空間最大化。

發(fā)明內(nèi)容
一方面,本發(fā)明提供了用于多重測序的方法、組合物和試劑盒。在一個實施方式中,該方法包括在單一反應(yīng)室中對多個靶多核苷酸進行測序,其中所述靶多核苷酸來自兩個或多個不同樣品;以及基于所述靶多核苷酸的序列中含有的單一條碼(barcode),以至少95%的準確度對每個所述測序的靶多核苷酸所源自的樣品進行鑒定。在一些實施方式中,革G多核苷酸包含用于校正測序反應(yīng)的一個或多個序列。在一些實施方式中,每個條碼在至少三個核苷酸位點處不同于所有其它條碼。在一些實施方式中,在條碼中的核苷酸的突變或缺失后,樣品來源的鑒定仍然是準確的。另一方面,本發(fā)明提供了用于從多個獨立樣品中產(chǎn)生銜接體(adapter)標記的靶多核苷酸的方法、組合物和試劑盒。在一個實施方式中,該方法包括:(a)提供多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列;和(b)將至少一個所述第一銜接體寡核苷酸與每個所述樣品的所述靶多核苷酸連接,從而沒有條碼序列與多于一個所述樣品的所述靶多核苷酸連接。在一些實施方式中,該方法進一步包括(c)將多個第二銜接體寡核苷酸中的至少一個與來自步驟(b)的每個所述樣品的所述靶多核苷酸連接,從而至少一些所述靶多核苷酸在一端包含所述第一銜接體寡核苷酸,并在另一端包含所述第二銜接體寡核苷酸。本發(fā)明的一個或多個銜接體寡核苷酸可包含SEQ ID N0:1。本發(fā)明的一個或多個銜接體寡核苷酸可包含SEQID N0:2。一個或多個銜接體寡核苷酸可包含發(fā)夾結(jié)構(gòu)。一個或多個銜接體寡核苷酸可包含寡核苷酸雙鏈體。在一些實施方式中,所述條碼序列的長度為至少3個核苷酸。在一些實施方式中,所述多個條碼序列包括選自下組的序列:AAA、TTT、CCC和GGG。在一些實施方式中,所述多個條碼序列包括選自下組的序列:AAAA、CTGC、GCTG, TGCT, ACCC, CGTA, GAGT, TTAG, AGGG,CCAT, GTCA, TATC, ATTT, CACG, GGAC和TCGA。在一些實施方式中,所述多個條碼序列包括選自下組的序列:AAAAA、AACCC, AAGGG, AATTT, ACACG, ACCAT, ACGTA, ACTGC, AGAGT, AGCTG,AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTA A、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。在一些實施方式中,所述方法進一步包括合并來自步驟(C)的靶多核苷酸。靶多核苷酸可以基于其所連接的條碼序列進行合并,從而在合并池(pool)中沿著每個條碼的一個或多個位點處均勻呈現(xiàn)所有四種堿基。在一些實施方式中,靶多核苷酸包含片段化的樣品多核苷酸。片段化可包括對樣品多核苷酸進行超聲處理,和/或在適合一種或多種酶(其可以包括DNase 1、片段化酶及其變體)產(chǎn)生隨機雙鏈核酸斷裂(break)的條件下使用一種或多種酶處理樣品多核苷酸。在一些實施方式中,片段化包括使用一種或多種限制性內(nèi)切酶處理樣品多核苷酸。片段可以具有10-10,000個核苷酸的平均長度,例如100-2,500個核苷酸或50-500個核苷酸的平均長度。在一些實施方式中,樣品包含少于500ng的核酸。靶多核苷酸可包含基因組DNA、弓I物延伸反應(yīng)產(chǎn)生的DNA、cDNA、線粒體DNA、葉綠體DNA、質(zhì)粒DNA、細菌人工染色體、酵母人工染色體或其組合。
在一些實施方式中,所述方法進一步包括執(zhí)行使用一個或多個連接的銜接體寡核苷酸作為模板來延伸靶多核苷酸的一個或多個3’末端的步驟。在一些實施方式中,該方法進一步包括在延伸步驟后使用第一引物和第二引物擴增靶多核苷酸,其中第一引物含有能夠與一個或多個第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中第二引物含有能夠與一個或多個第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。擴增步驟中使用的一個或多個引物可包含SEQ ID N0:1。擴增步驟中使用的一個或多個引物可包含SEQ ID N0:2。在一些實施方式中,每個第二銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。第一和第二銜接體寡核苷酸對可包含相同或不同的條碼序列。在一些實施方式中,該方法進一步包括對來自獨立樣品的靶多核苷酸池中的一個或多個多核苷酸進行測序。測序可包含測序引物的延伸,該引物包括可與第一銜接體寡核苷酸和/或第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,測序引物含有SEQ ID NO:1或SEQ ID NO:2。在一些實施方式中,測序包括校正步驟,其中校正基于位于條碼序列中的一個或多個核苷酸位點處的每個核苷酸。在一些實施方式中,該方法進一步包括基于其連接的條碼序列鑒定靶多核苷酸所源自的樣品。另一方面,本發(fā)明提供了用于上述方法的組合物,其包含任何一個或多個在此描述的元件。一方面,本發(fā)明提供了用于多重測序的組合物。在一個實施方式中,組合物包含多個靶多核苷酸,每個靶多核苷酸包含選自多個條碼序列的一個或多個條碼序列,其中所述靶多核苷酸來自兩個或多個不同的樣品,并且進一步地,其中可在組合測序反應(yīng)中基于所述靶多核苷酸序列含有的單一條碼以至少95%的準確度鑒定每個所述靶多核苷酸所源自的樣品。另一方面,本發(fā)明提供了用于產(chǎn)生銜接體標記的靶多核苷酸的組合物,其包含任何一個或多個在此描述的元件。在一個實施方式中,組合物包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。在一些實施方式中,組合物進一步包含多個第二銜接體寡核苷酸。在一些實施方式中,靶多核苷酸包含于流動池中。第一銜接體寡核苷酸可按照四的倍數(shù)進行分組,從而在沿每個條碼的每個位點處均勻呈現(xiàn)所有四種堿基。在第二銜接體寡核苷酸包含條碼時,第一和第二銜接體寡核苷酸對可包含相同或不同的條碼序列。在一些實施方式中,組合物進一步包含第一引物和第二引物,其中所述第一引物含有可以與一個或多個所述第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中所述第二引物含有可以與一個或多個所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,組合物還包含測序引物,該測序引物含有可與所述第一銜接體寡核苷酸和/或所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,組合物包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列A’的3’端,并且進一步地,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA和5個或更多個末端DNA核苷酸。在一些實施方式中,組合物進一步包含多個第二銜接體寡核苷酸,其中每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。在另一方面,本發(fā)明提供了含有上述方法和組合物中公開的任何一個或多個元件的試劑盒。在一個方面,本發(fā)明提供了一種用于產(chǎn)生銜接體標記的靶多核苷酸的試劑盒。在一個實施方式中,該試劑盒包含多個第一銜接體寡核苷酸及其使用說明,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。在一些實施方式中,該試劑盒進一步包含多個第二銜接體寡核苷酸。在一些實施方式中,該試劑盒進一步包含第一引物和第二引物,其中所述第一引物含有可以與一個或多個所述第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中所述第二引物含有可以與一個或多個所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,該試劑盒還包含測序引物,該測序引物含有可與所述第一銜接體寡核苷酸和/或所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,該試劑盒進一步包含以下一個或多個:(a) DNA連接酶,(b)DNA依賴的DNA聚合酶,(c)RNA依賴的DNA聚合酶,(d)隨機引物,(e)在3’端包含至少4個胸苷的引物,(f) DNA核酸內(nèi)切酶,
(g)具有3’到5’核酸外切酶活性的DNA依賴的DNA聚合酶,(h)多個引物,每個引物具有多個選定序列之一,(i)DNA激酶,(j)DNA核酸外切酶,(k)磁珠,(I)具有RNase H活性的酶,(m)RNA連接酶,和(η)適合所述試劑盒中所包含的一個或多個元件的一種或多種緩沖液。在一些實施方式中,所述試劑盒包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列Α’的3’端,并且進一步地,其中A可與Α’雜交,A或Α’之一包含DNA,且A或Α’中的另一個包含RNA和5個或更多個末端DNA核苷酸。在一些實施方式中,所述試劑盒進一步包含多個第二銜接體寡核苷酸,其中每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。另一方面,本發(fā)明提供了一種用于產(chǎn)生銜接體標記的多核苷酸的方法。在一個實施方式中,該方法包括:(a)提供多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列A’的3’端,并且進一步地,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA和5個或更多個末端DNA核苷酸;以及,(b)將至少一個所述第一銜接體寡核苷酸與至少一個所述靶多核苷酸連接起來。每個所述第一銜接體寡核苷酸可以包含條碼序列。在一些實施方式中,該方法進一步包括用能夠從RNA-DNA異雙鏈體上裂解RNA的酶來裂解RNA的步驟。在一些實施方式中,該方法進一步包括使用所述一個或多個連接的銜接體寡核苷酸作為模板來延伸所述靶多核苷酸的一個或多個3’端的步驟。在一些實施方式中,該方法包括將多個第二銜接體寡核苷酸中的至少一個與來自步驟(b)的每個所述樣品的所述靶多核苷酸連接,從而至少一個所述靶多核苷酸在一端包含所述第一銜接體寡核苷酸,并在另一端包含所述第二銜接體寡核苷酸。在一些實施方式中,每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。在一些實施方式中,每個所述第二銜接體寡核苷酸包含條碼序列。
引用參考 本說明書中提及的所有出版物、專利和專利申請在此弓I入作為參考,如同每個單獨的出版物、專利或?qū)@暾埦刂傅睾蛦为毜刂该鞅灰胱鳛閰⒖家粯印?br>

本發(fā)明的新特征在隨附的權(quán)利要求中具體闡述。通過參考以下對在其中利用到本發(fā)明原理的說明性實施方式加以闡述的詳細描述和附圖,可獲得對本發(fā)明的特征和優(yōu)點的更好的理解,附圖如下:圖1顯示了本發(fā)明方法的一個實施方式的示意圖。圖2A顯示了根據(jù)本發(fā)明方法而獲得的用于與銜接體寡核苷酸(也被稱為“銜接體”)連接的靶多核苷酸的擴增產(chǎn)物的示例結(jié)果。圖2B顯示了來自圖2A的選定泳道的并列對比,以及關(guān)于連接反應(yīng)中所含元件的細節(jié)。圖3顯示了本發(fā)明方法的一個實施方式的示意圖,其中發(fā)夾銜接體在5’端包含RNA。圖4顯示了本發(fā)明方法的一個實施方式的示意圖,其中發(fā)夾銜接體在3’端包含RNA。圖5顯示了本發(fā)明方法的一個實施方式的示意圖,其中在3’端包含RNA的發(fā)夾銜接體與靶多核苷酸連接,并進一步將非發(fā)夾銜接體添加至未連接至發(fā)夾銜接體的靶多核苷酸的末端。圖6顯示了本發(fā)明方法的一個實施方式的示意圖。圖7顯示了多種銜接體設(shè)計、估算的連接效率和在瓊脂糖凝膠上分析的PCR擴增的連接產(chǎn)物。圖8顯示了含有靶多核苷酸、銜接體寡核苷酸和連接產(chǎn)物的瓊脂糖凝膠。圖9顯示了含有PCR擴增的連接產(chǎn)物的瓊脂糖凝膠。圖10顯示了本發(fā)明方法的一個實施方式的示意圖。
定義術(shù)語“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可交換使用。它們表示任意長度的聚合形式的核苷酸(脫氧核糖核苷酸或核糖核苷酸)或其類似物。多核苷酸可以具有任何三維結(jié)構(gòu),并可行使任何已知或未知的功能。以下是多核苷酸的非限制性例子:基因或基因片段的編碼或非編碼區(qū)、基因間DNA、連鎖分析定義的基因座、外顯子、內(nèi)含子、信使RNA(mRNA)、轉(zhuǎn)移RNA、核糖體RNA、短干擾RNA(siRNA)、短發(fā)夾RNA(shRNA)、微小RNA(miRNA)、小核仁RNA、核酶、cDNA、重組多核苷酸、分支多核苷酸、質(zhì)粒、載體、分離的任意序列的DNA、分離的任意序列的RNA、核酸探針和引物。多核苷酸可以包含修飾的核苷酸,例如甲基化核苷酸和核苷酸類似物。對核苷酸結(jié)構(gòu)的修飾,如果存在的話,可以在聚合物裝配之前或之后進行。核苷酸序列可以被非核苷酸成分中斷。聚合后,例如可以通過與標記成分綴合對多核苷酸進行進一步修飾。除非另有說明,否則提供的多核苷酸序列均以5’到3’的方向列出。在此使用的術(shù)語“靶多核苷酸”指具有靶序列的核酸分子起始群體中的核酸分子或多核苷酸,該靶序列的存在與否、數(shù)量和/或核苷酸序列或者這些方面的變化是需要進行測定的??偠灾?,靶多核苷酸是一種雙鏈核酸分子,且可以來自產(chǎn)生雙鏈核酸分子的任何來源或任何過程。在此使用的術(shù)語"靶序列"一般指單鏈核酸上的核酸序列。靶序列可以是基因的一部分、調(diào)控序列、基因組DNA、cDNA, RNA (包括mRNA、miRNA和rRNA)或其它。靶序列可以是來自樣品或第二目標例如擴增反應(yīng)產(chǎn)物的目標序列?!昂塑账崽结槨薄ⅰ疤结槨被颉皹撕灩押塑账帷敝赣糜谠陔s交反應(yīng)中檢測或鑒定其對應(yīng)的靶多核苷酸的多核苷酸。因此,標簽寡核苷酸可與一個或多個靶多核苷酸雜交。標簽寡核苷酸可以與樣品中的一個或多個靶多核苷酸完全互補,或含有與樣品中的一個或多個靶多核苷酸中對應(yīng)的核苷酸并不互補的一個或多個核苷酸?!半s交”和“退火”指一種反應(yīng),其中一個或多個多核苷酸發(fā)生反應(yīng)形成復(fù)合物,后者通過核苷酸殘基的堿基間的氫鍵結(jié)合來穩(wěn)定化。氫鍵結(jié)合可以通過Watson Crick堿基配對、Hoogstein結(jié)合或以任何其它序列特異性的方式發(fā)生。復(fù)合物可以包含形成雙鏈體結(jié)構(gòu)的兩條鏈、形成多鏈復(fù)合物的三條或更多鏈、單個自雜交鏈或其任意組合。雜交反應(yīng)可以構(gòu)成一個更大過程中的一步,例如構(gòu)成PCR或核酶酶促裂解多核苷酸的起始步驟。能夠通過與第二序列的核苷酸殘基的堿基進行氫鍵結(jié)合而被穩(wěn)定化的第一序列被稱為與所述第二序列“可雜交”。在該情況下,第二序列也可被稱為可與第一序列雜交。一般地,給定序列的“互補序列”是與該給定序列完全互補且可與其雜交的序列。一般而言,可與第二序列或第二序列集雜交的第一序列可特異性地或選擇性地與第二序列或第二序列集雜交,從而在雜交反應(yīng)中,相對于與非靶序列的雜交,其更傾向于與第二序列或第二序列集雜交(例如在給定的一系列條件下,例如本領(lǐng)域通常使用的嚴格條件下,熱動力學(xué)更加穩(wěn)定)。一般而言,可雜交序列在其各自長度的全部或部分上具有一定程度的序列互補性,例如25% -100%的互補性,包括至少約25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,91 %,92%,93%,94%,95%,96%,97%,98%、99%和100%的序列互補性。應(yīng)用于多核苷酸的術(shù)語“雜交的”指通過核苷酸殘基的堿基間的氫鍵結(jié)合而被穩(wěn)定化的復(fù)合體中的多核苷酸。氫鍵結(jié)合可以通過WatsonCrick堿基配對、Hoogstein結(jié)合或以任何其它序列特異性的方式發(fā)生。復(fù)合體可以包含形成雙鏈體結(jié)構(gòu)的兩條鏈、形成多鏈復(fù)合體的三條或更多鏈、單個自雜交鏈或其任意組合。雜交反應(yīng)可以構(gòu)成一個更大過程中的一步,例如構(gòu)成PCR反應(yīng)或核酶酶促裂解多核苷酸的起始步驟。與給定序列雜交的序列被稱為該給定序列的“互補序列”。在此使用的“表達”指多核苷酸被轉(zhuǎn)錄成mRNA的過程,和/或轉(zhuǎn)錄的mRNA(也被稱為“轉(zhuǎn)錄物”)繼而被翻譯成肽、多肽或蛋白質(zhì)的過程。轉(zhuǎn)錄物和編碼的多肽統(tǒng)稱為“基因產(chǎn)物”。如果多核苷酸來源于基因組DNA,則表達可包括真核細胞中mRNA的剪接。
發(fā)明詳述除非另有說明,否則本發(fā)明的實踐使用本領(lǐng)域公知的免疫學(xué)、生物化學(xué)、化學(xué)、分子生物學(xué)、微生物學(xué)、細胞生物學(xué)、基因組學(xué)和重組DNA的常規(guī)技術(shù)。參見Samtoook,F(xiàn)ritsch 和 Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,第二版(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F.M.Ausubel 等編,(1987));叢書 METHODSIN ENZYM0L0GY(Academic Press, Inc.):PCR2:APRACTICAL APPROACH(M.J.MacPherson,B.D.Hames和 G.R.Taylor編(1995)),Harlow和 Lane編(1988)ANTIBODIES,A LABORATORYMANUAL,以及 ANIMAL CELL CULTURE (R.1.Freshney 編(1987))?!矫妫景l(fā)明提供了一種多重測序方法。在一個實施方式中,該方法包括在單一反應(yīng)室中對多個靶多核苷酸進行測序,其中所述靶多核苷酸來自兩個或多個不同樣品;以及基于所述靶多核苷酸的序列中含有的單一條碼,以至少95%的準確度對每個所述測序的靶多核苷酸所源自的樣品進行鑒定。反應(yīng)室可以是本領(lǐng)域已知的用于容納測序反應(yīng)的任何區(qū)室,其非限制性的例子包括各種尺寸的管、多孔板的孔和流動池的通道。在一些實施方式中,革G多核苷酸包含一個或多個用于校正測序反應(yīng)的序列。在一些實施方式中,用于校正測序反應(yīng)的一個或多個序列在測序之前與靶多核苷酸連接。另一方面,本發(fā)明提供了一種從多個獨立樣品中產(chǎn)生銜接體標記的靶多核苷酸的方法。在一個實施方式中,該方法包括:(a)提供多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列;和(b)將至少一個所述第一銜接體寡核苷酸與每個所述樣品的所述靶多核苷酸連接,從而沒有條碼序列與多于一個所述樣品的所述祀多核苷酸連接。在一些實施方式中,該方法進一步包括(C)將多個第二銜接體寡核苷酸中的至少一個與來自步驟(b)的每個所述樣品的所述靶多核苷酸連接,從而至少一些所述靶多核苷酸在一端包含所述第一銜接體寡核苷酸,并在另一端包含所述第二銜接體寡核苷酸。第一和第二銜接體寡核苷酸可以是相同或不同的,不同銜接體寡核苷酸具有不同序列和/或不同長度的序列。第一銜接體寡核苷酸可包含一個或多個具有與第二銜接體寡核苷酸的一個或多個序列區(qū)相同的序列的序列區(qū),和一個或多個具有與第二銜接體寡核苷酸的一個或多個序列區(qū)不同的序列的序列區(qū)。銜接體寡核苷酸包括至少一部分序列為已知、且能與靶多核苷酸連接的任意寡核苷酸。銜接體寡核苷酸可包含DNA、RNA、核苷酸類似物、非規(guī)范核苷酸、標記的核苷酸、修飾的核苷酸或其組合。銜接體寡核苷酸可以是單鏈、雙鏈或部分雙鏈體。一般而言,部分雙鏈體銜接體包含一個或多個單鏈區(qū)和一個或多個雙鏈區(qū)。雙鏈銜接體可包含兩個相互雜交的單獨的寡核苷酸(也被稱為“寡核苷酸雙鏈體”),且雜交可留下一個或多個平端、一個或多個3’突出端、一個或多個5’突出端、一個或多個由于錯配的和/或未配對的核苷酸而產(chǎn)生的凸起,或其任意組合。在一些實施方式中,單鏈銜接體包含兩個或多個能夠相互雜交的序列。當單鏈銜接體中包含兩個這樣的可雜交的序列時,雜交產(chǎn)生發(fā)夾結(jié)構(gòu)(發(fā)夾銜接體)。當銜接體的兩個雜交區(qū)被非雜交區(qū)彼此分隔時,會產(chǎn)生“氣泡”結(jié)構(gòu)。含有“氣泡”結(jié)構(gòu)的銜接體可以由含有內(nèi)部雜交的單個銜接體寡核苷酸組成,或可以包括彼此雜交的兩個或多個銜接體寡核苷酸。內(nèi)部序列雜交,例如在一個銜接體中的兩個可雜交序列之間的內(nèi)部序列雜交,可以在單鏈銜接體寡核苷酸中產(chǎn)生雙鏈結(jié)構(gòu)。不同種類的銜接體可以組合使用,例如發(fā)夾銜接體和雙鏈銜接體,或不同序列的銜接體。發(fā)夾銜接體中的可雜交序列可以包括或可以不包括寡核苷酸的一個或兩個末端。當可雜交序列中不含有任何末端時,兩端為“游離的”或“突出的”。當只有一端可與銜接體中的另一序列雜交時,另一末端形成突出端,例如3’突出端或5’突出端。當可雜交序列中同時含有5’末端核苷酸和3’末端核苷酸,從而5’末端核苷酸和3’末端核苷酸彼此互補并雜交時,該末端被稱為“平端”。不同銜接體可以在相繼反應(yīng)中或同時與靶多核苷酸連接。例如,可將第一和第二銜接體添加至同一反應(yīng)。在與靶多核苷酸結(jié)合之前可以對銜接體進行操作。例如,可以添加或去除末端磷酸。在一些實施方式中,單鏈發(fā)夾銜接體中的一個可雜交序列包含RNA。例如,銜接體可包含含有序列A的5’端和含有序列A’的3’端,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA。類似地,銜接體可包含含有序列B的5’端和含有序列B’的3’端,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA。在一些實施方式中,A或A’之一完全由DNA組成,和/或A或A’之一完全由RNA組成。在一些實施方式中,B或B’之一完全由DNA組成,并且/或者B或B’之一完全由RNA組成。序列A可以與序列B和/或B’相同或不同。序列A’可以與序列B和/或B’相同或不同。在一些實施方式中,包含RNA (例如A、A’、B或B’ )的發(fā)夾的末端進一步包含一個或多個末端DNA殘基(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個或更多個末端0嫩殘基),從而包含RNA的序列的側(cè)翼為在兩端(即包含RNA的序列的5’末端和3’末端)的DNA殘基。包含RNA的序列與包含DNA的序列雜交會產(chǎn)生RNA-DNA雜雙鏈體。在一些實施方式中,通過能夠從RNA-DNA雜雙鏈體上裂解RNA的酶,例如具有核糖核酸酶活性的酶,將RNA裂解。優(yōu)選地,具有核糖核酸酶活性的酶裂解RNA/DNA雜雙鏈體中的核苷酸,而與待裂解的核糖核苷酸的相鄰核苷酸的身份和類型無關(guān)。優(yōu)選地,核糖核酸酶不依賴于序列身份進行裂解。適用于本發(fā)明的方法和組合物的具有核糖核酸酶活性的合適的酶的例子是本領(lǐng)域熟知的,包括核糖核酸酶H(RNase H)和具有RNase H活性的酶,例如,雜交酶(Hybridase)。在一些實施方式中,從RNA-DNA雜雙鏈體上裂解RNA會從單鏈發(fā)夾銜接體寡核苷酸上去除所有的雙鏈特征,從而使得用銜接體作為模板的經(jīng)由聚合酶的延伸不需要鏈置換步驟或鏈置換活性。在一些實施方式中,具有一個含RNA的末端的發(fā)夾銜接體的兩端與靶多核苷酸連接,從而RNA從RNA-DNA雜雙鏈體上的裂解產(chǎn)生5’突出端或3’突出端。在一些實施方式中,通過從RNA-DNA雜雙鏈體上裂解RNA而產(chǎn)生的具有5’突出端的末端被使用5’突出端作為模板對產(chǎn)生的3’末端的延伸所補平(fill in)。在具有含RNA的3’末端的發(fā)夾銜接體與雙鏈靶多核苷酸的兩個3’末端都連接的一些實施方式中,從RNA-DNA雜雙鏈體上裂解RNA后,寡核苷酸與在第一步驟中相連的銜接體序列雜交,并且雜交的寡核苷酸與雙鏈靶多核苷酸的5’末端連接,以產(chǎn)生在兩條鏈的兩個末端都含有非互補的、單鏈的突出端的靶多核苷酸。在兩條鏈的兩個末端都含有非互補的、單鏈的突出端的雙鏈靶多核苷酸的擴增可包括使用第一和第二引物,其中第一引物可與一個突出端雜交,而第二引物可與第一引物所雜交的鏈的另一末端的突出端的互補序列雜交。對在兩條鏈的兩個末端都含有非互補的、單鏈突出端的雙鏈靶多核苷酸的測序可包括使用可與一個或多個突出端或其互補序列雜交的一個或多個測序引物。圖5示出了產(chǎn)生在兩條鏈的兩個末端都含有非互補的、單鏈的突出端的雙鏈靶多核苷酸的說明性示例。銜接體可含有多種序列元件中的一個或多個,包括但不限于:一個或多個擴增引物退火序列或其互補序列;一個或多個測序引物退火序列或其互補序列;一個或多個條碼序列;在多種不同銜接體或不同銜接體的子集中共有的一個或多個通用序列;一個或多個限制性酶識別位點;與一個或多個靶多核苷酸突出端互補的一個或多個突出端;一個或多個探針結(jié)合位點(例如用于連接測序平臺,例如用于大量平行測序的流動池,例如由Illumina, Inc.開發(fā)的);一個或多個隨機或近隨機序列(例如在一個或多個位點處從一組兩個或多個不同核苷酸隨機選擇的一個或多個核苷酸,其中在一個或多個位點處選擇的每個不同核苷酸在包含該隨機序列的銜接體池中呈現(xiàn));及其組合。兩個或多個序列元件可以彼此不相鄰(例如由一個或多個核苷酸間隔)、彼此相鄰、部分重疊或完全重疊。例如,擴增引物退火序列也可以作為測序引物退火序列。序列元件可位于或靠近3’端、位于或靠近5’端、或位于銜接體寡核苷酸內(nèi)部。當銜接體寡核苷酸能夠形成二級結(jié)構(gòu),例如發(fā)夾時,序列元件可部分或完全位于二級結(jié)構(gòu)外部、部分或完全位于二級結(jié)構(gòu)內(nèi)部、或位于參與形成二級結(jié)構(gòu)的序列之間。例如,當銜接體寡核苷酸包含發(fā)夾結(jié)構(gòu)時,序列元件可部分或完全位于可雜交序列(“莖”)外部或內(nèi)部,包括位于可雜交序列之間的序列(“環(huán)”)中。在一些實施方式中,具有不同條碼序列的多個第一銜接體寡核苷酸中的第一銜接體寡核苷酸含有在所述多個第一銜接體寡核苷酸中的全部第一銜接體寡核苷酸之間共有的序列元件。在一些實施方式中,所有第二銜接體寡核苷酸含有在所有第二銜接體寡核苷酸之間共有的序列元件,該序列元件不同于由第一銜接體寡核苷酸所共有的共同序列元件。序列元件的差異可以為任意的,使得不同銜接體的至少一部分不完全對齊,例如,由于序列長度的改變、一個或多個核苷酸的缺失或插入、或在一個或多個核苷酸位點處的核苷酸組成的改變(例如堿基變化或堿基修飾)。在一些實施方式中,銜接體寡核苷酸包含與一個或多個靶多核苷酸互補的5’突出端、3’突出端、或此兩者?;パa性突出端的長度可以是一個或多個核苷酸,包括但不限于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15個或更多個核苷酸的長度?;パa性突出端可以包含固定的序列?;パa性突出端可以包含一個或多個核苷酸的隨機序列,從而一個或多個核苷酸在一個或多個位點處隨機選自一組兩個或多個不同核苷酸,其中在一個或多個位點處選擇的每個不同核苷酸在含有包含該隨機序列的互補性突出端的銜接體池中呈現(xiàn)。在一些實施方式中,銜接體突出端與通過限制性核酸內(nèi)切酶消化而產(chǎn)生的靶多核苷酸突出端互補。在一些實施方式中,銜接體突出端由腺嘌呤或胸腺嘧啶組成。在一些實施方式中,一個或多個銜接體寡核苷酸包含SEQ ID NO:1。在一些實施方式中,一個或多個銜接體寡核苷酸包含SEQ ID N0:2。在一些實施方式中,所有第一銜接體寡核苷酸之間共有的序列元件包含SEQ ID NO:1或SEQ ID NO:2。在一些實施方式中,所有第二銜接體寡核苷酸之間共有的序列元件包含SEQ ID NO:1或SEQ ID NO:2。在一些實施方式中,SEQ ID NO:1或SEQ ID NO:2之一是所有第一銜接體寡核苷酸之間共有的,而SEQ ID NO:1或SEQ ID NO:2中的另一個是所有第二銜接體寡核苷酸之間共有的。在一些實施方式中,一個或多個銜接體寡核苷酸包含SEQ ID N0:3。在一些實施方式中,一個或多個銜接體寡核苷酸包含SEQ ID N0:4。在一些實施方式中,SEQ ID NO:3和/或SEQ IDNO -A的最3’核苷酸之后為條碼序列的一個或多個核苷酸。在一些實施方式中,含有寡核苷酸雙鏈體的銜接體包含具有SEQ ID NO:86的寡核苷酸和/或具有SEQ ID N0:87的寡核苷酸。在一些實施方式中,含有寡核苷酸雙鏈體的銜接體包含具有SEQ ID NO:88的寡核苷酸和/或具有SEQ ID NO:89的寡核苷酸。
銜接體寡核苷酸可以具有任何合適的長度,其至少足以容納其包含的一個或多個序列兀件。在一些實施方式中,銜接體的長度為約、少于約或多于約10、15、20、25、30、35、
40、45、50、55、60、65、70、75、80、90、100、200個或更多個核苷酸。在一些實施方式中,發(fā)夾銜接體的莖的長度為約、少于約或多于約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、
30、35、40、45、50、75、100個或更多個核苷酸??梢允褂脤?dǎo)致發(fā)夾銜接體上的互補區(qū)之間的雜交的多種不同序列來設(shè)計莖,從而產(chǎn)生雙鏈DNA的局部區(qū)域。例如,可以使用具有相等的G:C和A:T堿基對呈現(xiàn)度的15-18個核苷酸長度的莖序列。預(yù)計這樣的莖序列能在低于其預(yù)測的解鏈溫度45°C時形成穩(wěn)定的dsDNA結(jié)構(gòu)。參與發(fā)夾莖的序列可以是完全互補的,從而莖上一個區(qū)域的每個堿基根據(jù)Watson-Crick堿基配對法則通過氫鍵結(jié)合與莖上另一區(qū)域的每個堿基雜交?;蛘撸o中的序列可以不完全互補。例如,在不遵循Watson-Crick堿基配對法則由相對堿基形成的莖結(jié)構(gòu)中可以存在錯配和/或凸起,和/或在莖的一個區(qū)域中存在一個或多個核苷酸其在參與該莖的另一個區(qū)域中不具有一個或多個相對應(yīng)的堿基位點。錯配的序列可以使用識別錯配的酶進行裂解。發(fā)夾的莖可包含DNA、RNA或DNA和RNA兩者。在一些實施方式中,發(fā)夾的莖和/或環(huán),或形成發(fā)夾的莖的一個或兩個可雜交序列,包含作為裂解(例如被酶裂解)的底物的核苷酸、鍵或序列,所述酶包括但不限于核酸內(nèi)切酶和糖基化酶。莖的組成可以使得只有一個形成莖的可雜交序列被裂解。例如,形成莖的序列之一可以含有RNA,而形成莖的另一序列由DNA組成,從而能裂解RNA-DNA雙鏈體中的RNA的酶例如RNase H所進行的裂解僅裂解含有RNA的序列。發(fā)夾的莖和/或環(huán)可包含非規(guī)范核苷酸(例如尿嘧啶),和/或甲基化核苷酸。在一些實施方式中,發(fā)夾銜接體莖的一條鏈包含SEQ ID NO:1或SEQ ID NO:2。在一些實施方式中,發(fā)夾銜接體的環(huán)序列的長度為約、少于約或多于約5、10、15、20、25、30、35、40、45、50個或更多核苷酸。在此使用的術(shù)語“條碼”指允許鑒定該條碼連接的多核苷酸的一些特征的已知核酸序列。在一些實施方式中,待鑒定的多核苷酸的特征是該多核苷酸所來源的樣品。在一些實施方式中,條碼的長度為至少3、4、5、6、7、8、9、10、11、12、13、14、15個或更多個核苷酸。在一些實施方式中,條碼的長度短于10、9、8、7、6、5或4個核苷酸。在一些實施方式中,與一些多核苷酸連接的條碼和與其它多核苷酸連接的條碼具有不同的長度。一般而言,條碼具有足夠的長度,并含有足夠不同從而允許基于連接樣品的條碼對樣品進行鑒定的序列。在一些實施方式中,可以在該條碼序列中的一個或多個核苷酸的突變、插入或缺失后,例如1、2、3、4、5、6、7、8、9、10個或更多個核苷酸的突變、插入或缺失之后,精確地鑒定條碼及與之相關(guān)的樣品來源。在一些實施方式中,多個條碼中的每一個都在至少三個核苷酸位點處,例如在至少3、4、5、6、7、8、9、10個或更多位點處不同于所述多個條碼的所有其它條碼。在一些實施方式中,第一銜接體和第二銜接體都包含多個條碼序列中的至少一個。在一些實施方式中,用于第二銜接體寡核苷酸的條碼獨立地選自用于第一銜接體寡核苷酸的條碼。在一些實施方式中,具有條碼的第一銜接體寡核苷酸和第二銜接體寡核苷酸配對,從而該對的銜接體包含相同或不同的一個或多個條碼。在一些實施方式中,本發(fā)明的方法進一步包括基于靶多核苷酸連接的條碼序列來鑒定靶多核苷酸所來源的樣品。一般而言,條碼含有一種核酸序列,當該核酸序列與靶多核苷酸連接時其作為靶多核苷酸所來源的樣品的標識。在一些實施方式中,從中選擇條碼序列的多個條碼序列包括選自下組的序列:AAA、TTT、CCC、GGG。在一些實施方式中,從中選擇條碼序列的多個條碼序列包括選自下組的序列:AAAA、CTGC、GCTG、TGCT、ACCC、CGTA、GAGT、TTAG、AGGG、CCAT、GTCA、TATC、ATTT、CACG、GGAC和TCGA。在一些實施方式中,從中選擇條碼序列的多個條碼序列包括選自下組的序列:AAAAA、AACCC、AAGGG、AATTT、ACACG、ACCAT、ACGTA、ACTGC、AGAGT、AGCTG、AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTAA、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。在此關(guān)于兩個多核苷酸例如銜接體寡核苷酸和靶多核苷酸使用的術(shù)語“連接(joining) ”和“連接(ligation) ”,指的是兩個單獨的多核苷酸的共價連接以產(chǎn)生具有連續(xù)骨架的單個更大的多核苷酸。用于連接兩個多核苷酸的方法是本領(lǐng)域已知的,且包括但不限于,酶促和非酶促(例如化學(xué))方法。非酶促的連接反應(yīng)的示例包括描述于美國專利號5,780, 613和5,476,930中的非酶促連接技術(shù),其在此引入作為參考。在一些實施方式中,通過連接酶例如DNA連接酶或RNA連接酶使銜接體寡核苷酸與靶多核苷酸連接。各自具有表征的反應(yīng)條件的多種連接酶是本領(lǐng)域已知的,且包括但不限于NAD+依賴的連接酶,包括tRNA連接酶、Taq DNA連接酶、Thermusfiliformis DNA連接酶、大腸桿菌DNA連接酶、TthDNA連接酶、Thermus scotoductus DNA連接酶(I和II)、熱穩(wěn)定連接酶、Ampligase熱穩(wěn)定DNA連接酶、VanC型連接酶、9° N DNA連接酶、Tsp DNA連接酶和通過生物勘探發(fā)現(xiàn)的新型連接酶;ATP依賴的連接酶,包括T4 RNA連接酶、T4 DNA連接酶、T3 DNA連接酶、T7 DNA連接酶、Pfu DNA連接酶、DNA連接酶1、DNA連接酶II1、DNA連接酶IV和通過生物勘探發(fā)現(xiàn)的新型連接酶;及其野生型、突變體同種型和遺傳工程變體。連接可在具有可雜交序列的多核苷酸例如互補性突出端之間發(fā)生。連接也可在兩個平端間發(fā)生。一般而言,5’磷酸在連接反應(yīng)使用。5’磷酸可以由靶多核苷酸、銜接體寡核苷酸或二者一起提供。5’磷酸可根據(jù)需要添加至待連接的多核苷酸,或從中去除。用于添加或去除5’磷酸的方法是本領(lǐng)域已知的,且包括但不限于酶促和化學(xué)過程??捎糜谔砑雍?或去除5’磷酸的酶包括激酶、磷酸酶和聚合酶。在一些實施方式中,連接反應(yīng)中連接的兩端(例如銜接體末端和靶多核苷酸末端)均提供5’憐酸,從而在兩個末端的連接中形成兩個共價鍵。在一些實施方式中,在連接反應(yīng)中連接的兩端中只有一端(例如僅銜接體末端和靶多核苷酸末端之一)提供5’磷酸,從而在兩個末端的連接中只形成一個共價鍵。在一些實施方式中,在靶多核苷酸的一個或兩個末端處只有一條鏈與銜接體寡核苷酸連接。在一些實施方式中,在靶多核苷酸的一個或兩個末端處兩條鏈都與銜接體寡核苷酸連接。在一些實施方式中,在連接之前去除3’磷酸。在一些實施方式中,銜接體寡核苷酸被添加至靶多核苷酸的兩個末端,其中在每個末端處的一條或兩條鏈與一個或多個銜接體寡核苷酸連接。當兩個末端處的兩條鏈都與銜接體寡核苷酸連接時,可在連接后進行裂解反應(yīng),該裂解反應(yīng)產(chǎn)生5’突出端,該5’突出端可以作為模板用于對應(yīng)的3’末端的延伸,該3’末端可以包括或可以不包括來源于銜接體寡核苷酸的一個或多個核苷酸。在一些實施方式中,靶多核苷酸在一端與第一銜接體寡核苷酸連接,而在另一端與第二銜接體寡核苷酸連接。在一些實施方式中,靶多核苷酸及與之連接的銜接體包含平端。在一些實施方式中,使用不同的第一銜接體寡核苷酸對每個樣品進行單獨的連接反應(yīng),該第一銜接體寡核苷酸含有至少一種針對每個樣品的條碼序列,使得沒有條碼序列與多于一種樣品的靶多核苷酸連接。連接有銜接體寡核苷酸的靶多核苷酸被認為是由所連接的銜接體進行了 “標記”。在一些實施方式中,銜接體與靶多核苷酸的連接產(chǎn)生多核苷酸連接產(chǎn)物,該產(chǎn)物具有包含來自銜接體的核苷酸序列的3’突出端。在一些實施方式中,包括與3’突出端的全部或一部分互補的序列的引物寡核苷酸與該突出端雜交,并使用DNA聚合酶進行延伸,以生產(chǎn)與該多核苷酸連接產(chǎn)物的一條鏈雜交的引物延伸產(chǎn)物。DNA聚合酶可以包含鏈置換活性,從而使連接產(chǎn)物多核苷酸的一條鏈在引物延伸期間被置換。在一些實施方式中,在將至少一種銜接體寡核苷酸連接到祀多核苷酸之后,使用一個或多個連接銜接體寡核苷酸作為模板進行一個或多個靶多核苷酸的3’末端的延伸。例如,含有兩個雜交寡核苷酸且僅與靶多核苷酸的5’末端連接的銜接體允許使用銜接體的連接鏈作為模板進行靶標的未連接的3’端的延伸,這與未連接鏈的置換同時進行,或在其之后進行。如果含有兩個雜交寡核苷酸的銜接體的兩條鏈都與靶多核苷酸連接,使得連接產(chǎn)物具有5’突出端,那么可以使用5’突出端作為模板延伸互補性3’端。作為進一步的示例,發(fā)夾銜接體寡核苷酸可與靶多核苷酸的5’末端連接。雖然在二級結(jié)構(gòu)中為雙鏈,但這樣的發(fā)夾銜接體維持單鏈,因此是添加到靶多核苷酸上的5’突出端(例如當發(fā)夾銜接體的5’末端未與靶多核苷酸連接時)。二級結(jié)構(gòu)的去除,無論是在聚合酶活性之前(例如熱變性或降解)或與之同時(例如鏈置換),都提供了用于延伸靶多核苷酸互補鏈3’末端的模板。在一些實施方式中,所延伸的靶多核苷酸的3’末端包含來自銜接體寡核苷酸的一個或多個核苷酸。對于銜接體連接至其兩個末端的靶多核苷酸,可以對具有5’突出端的雙鏈靶多核苷酸的兩個3’末端進行延伸。該3’末端延伸或“補平”反應(yīng),產(chǎn)生了針對與模板雜交的銜接體寡核苷酸模板的互補性序列或“互補物”,從而補平了 5’的突出端,產(chǎn)生雙鏈序列區(qū)域。當雙鏈靶多核苷酸的兩個末端都具有通過互補鏈的3’末端延伸所補平的5’突出端時,產(chǎn)物是完全雙鏈的。延伸可以通過本領(lǐng)域已知的任何合適的聚合酶實現(xiàn),例如DNA聚合酶,其中很多是商業(yè)可獲得的。DNA聚合酶可包含DNA依賴的DNA聚合酶活性、RNA依賴的DNA聚合酶活性或DNA依賴的和RNA依賴的DNA聚合酶活性。DNA聚合酶可以是熱穩(wěn)定或非熱穩(wěn)定的。DNA聚合酶的例子包括但不限于,Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、Pfutubo聚合酶、Pyrobest聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、Pho聚合酶、ES4聚合酶、VENT聚合酶、DEEPVENT聚合酶、EX-Taq聚合酶、LA-Taq聚合酶、Expand聚合酶、Platinum Taq聚合酶、H1-Fi聚合酶、Tbr聚合酶、Tfl聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tih聚合酶、Tfi聚合酶、Klenow片段及其變體、修飾產(chǎn)物和衍生物。3’端延伸可以在合并來自獨立樣品的靶多核苷酸之前或之后進行。在一些實施方式中,補平反應(yīng)之后使用第一引物和第二引物擴增一個或多個靶多核苷酸,或者作為該擴增的一部分進行補平反應(yīng),其中第一引物含有能與一個或多個第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中第二引物含有能與一個或多個第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。每個第一和第二引物可以是任何合適的長度,例如約、少于約或多于約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100個或更多個核苷酸,其任何部分或全部可以與對應(yīng)的靶序列(例如約、少于約或多于約5、10、15、20、25、30、35、40、45、50個或更多個核苷酸)互補。“擴增”是指使靶序列的拷貝數(shù)增加的任何過程。用于引物指導(dǎo)的靶多核苷酸擴增的方法是本領(lǐng)域已知的,且包括但不限于,基于聚合酶鏈反應(yīng)(PCR)的方法。有利于靶序列的PCR擴增的條件是本領(lǐng)域已知的,可以在過程中的多個步驟進行優(yōu)化,且取決于反應(yīng)中的元件的特征,例如靶標類型、靶標濃度、待擴增的序列長度、靶標和/或一個或多個引物的序列、引物長度、引物濃度、使用的聚合酶、反應(yīng)體積、一個或多個元件與一個或多個其它元件之比,以及其它,其中一些或全部可以改變。一般而言,PCR包括待擴增靶標的變性(如果是雙鏈的話)、一個或多個引物與靶標的雜交和通過DNA聚合酶進行引物延伸的步驟,其中重復(fù)(或“循環(huán)”)各步驟以擴增靶序列。可以針對多種結(jié)果,例如為了提高產(chǎn)率、減少假產(chǎn)物的形成和/或增加或降低引物退火的特異性,對該過程中的步驟進行優(yōu)化。優(yōu)化方法是本領(lǐng)域熟知的,包括對擴增反應(yīng)中的元件的類型和量和/或?qū)^程中給定步驟的條件(例如特定步驟的溫度、特定步驟的持續(xù)時間和/或循環(huán)數(shù))的調(diào)整。在一些實施方式中,擴增反應(yīng)包括至少5、10、15、20、25、30、35、50個或更多個循環(huán)。在一些實施方式中,擴增反應(yīng)包括不多于5、10、15、20、25、35、50個或更多個循環(huán)。循環(huán)可具有任意個數(shù)的步驟,例如1、2、3、4、5、6、7、8、9、10個或更多個步驟。各步驟可包含適于完成該給定步驟的目的的任意溫度或溫度梯度,包括但不限于,3’末端延伸(例如銜接體補平)、引物退火、引物延伸和鏈變性。各步驟可具有任何持續(xù)時間,包括但不限于約、短于約或長于約1、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90、100、120、180、240、300、360、420、480、540、600 秒或更多秒,包括不確定的持續(xù)時間,直至手工中斷。包括不同步驟的任意個數(shù)的循環(huán)可以任意順序組合。在一些實施方式中,將包括不同步驟的不同循環(huán)進行組合,使得該組合中的總循環(huán)數(shù)為約、少于約或多于約5、10、15、20、25、30、35、50個或更多個循環(huán)。在一些實施方式中,一個或多個引物含有SEQ ID ΝΟ:1。在一些實施方式中,一個或多個引物含有SEQ ID NO:2。在一些實施方式中,在補平反應(yīng)后進行擴增??梢栽趯碜元毩悠返陌卸嗪塑账徇M行合并之前或之后進行擴增。在一些實施方式中,在連接步驟后合并來自獨立樣品的靶多核苷酸。合并可以在連接步驟之后立即進行,或在連接和合并之間的一個或多個中間步驟之后立即進行。合并池可包含來自連接反應(yīng)的總靶多核苷酸的任何部分,包括整個反應(yīng)體積??梢跃鶆蚧虿痪鶆虻睾喜悠???梢栽诤喜⒅盎蛑筮M一步處理靶多核苷酸,例如用以純化期望的產(chǎn)物或去除不期望的產(chǎn)物。合并池可包含來自任意數(shù)目的獨立樣品,例如至少2、3、4、5、6、7、8、9、10、12、16、20、24、28、32、36、40、50、60、70、80、90、100、128、192、384、500、1000 個或更多個樣品的多核苷酸。在一些實施方式中,基于靶多核苷酸所連接的條碼合并靶多核苷酸。在一些實施方式中,合并來自獨立樣品的靶多核苷酸,從而使得在合并池所包含的條碼中,在沿著條碼的一個或多個位點處均勻呈現(xiàn)所有四種堿基。在一些實施方式中,合并來自獨立樣品的靶多核苷酸,從而使得在合并池所包含的條碼中,在沿著條碼的每個位點處均勻呈現(xiàn)所有四種堿基。在只有一個條碼與每個樣品的多核苷酸連接時,樣品可以按照4的倍數(shù)進行合并,從而在沿著條碼的一個或多個位點處均勻呈現(xiàn)所有四種堿基,例如4、8、12、16、20、24、28、32、36、40、44、48、52、56、60、64、96、128、192、256、384 等等。在對每個樣品的連接反應(yīng)中包含兩個條碼,例如兩個不同的第一銜接體寡核苷酸或一個第一銜接體寡核苷酸和一個第二銜接體寡核苷酸各自都具有條碼時,樣品可以按照2的倍數(shù)進行合并,從而在沿著條碼的一個或多個位點處均勻呈現(xiàn)所有四種堿基,例如2、4、6、8、10、12、14、16、18、20、22、24、48、64、96、128、256、384等等。本發(fā)明的方法涉及對來自每個樣品的靶多核苷酸的連接反應(yīng)中所包含的條碼數(shù)的所有組合,以及為了在沿著條碼的一個或多個位點處均勻呈現(xiàn)所有四種堿基而采用的樣品合并倍數(shù)。在一些實施方式中,合并靶多核苷酸之后對合并池中的一個或多個多核苷酸進行測序。測序過程一般為模板依賴的。當在模板介導(dǎo)的合成反應(yīng)例如引物延伸反應(yīng)過程中添加個體堿基或一組堿基時,利用模板依賴的合成的核酸序列分析對所述堿基進行鑒別,其中堿基的身份與合成過程中跟引物序列雜交的模板序列互補。其它這樣的過程包括連接驅(qū)動的過程,其中寡核苷酸或多核苷酸與潛在的模板序列復(fù)合,從而鑒定該序列中的核苷酸序列。一般地,此類過程是使用核酸聚合酶進行酶介導(dǎo)的,例如DNA聚合酶、RNA聚合酶、反轉(zhuǎn)錄酶等等,或其它酶類,例如對連接驅(qū)動的過程而言,例如,連接酶。使用模板依賴的合成的序列分析可以包括很多不同的過程。例如,在廣泛使用的四色Sanger測序方法中,使用一組模板分子產(chǎn)生一組互補性片段序列。在四種天然存在的核苷酸的存在下,用一個亞組的染料標記的終止子核苷酸例如雙脫氧核糖核苷酸進行引物延伸,其中每種類型的終止子(ddATP、ddGTP、ddTTP、ddCTP)包括不同的可檢測標記。結(jié)果產(chǎn)生了一組嵌套片段,其中片段在超出引物的序列中的每個核苷酸處終止,并以能夠鑒定終止核苷酸的方式進行標記。然后對嵌套片段群進行基于大小的分離,例如,使用毛細管電泳,并對連接每個不同大小的片段的標簽進行鑒定以確定終止核苷酸。結(jié)果,經(jīng)過分離系統(tǒng)中的檢測器移動的標簽的序列提供了對合成片段的序列信息的直接讀出,且根據(jù)互補性,也提供了對潛在的模板信息的直接讀出(例如,參見美國專利號5,171,534,其在此出于任何目的而全文引入作為參考)。模板依賴的測序方法的其它例子包括合成測序方法,其中個體核苷酸在被加至伸長的引物延伸產(chǎn)物時迭代地進行鑒定。焦磷酸測序是合成測序方法的一個例子,其通過分析得到的合成混合物中測序反應(yīng)副產(chǎn)物即焦磷酸的存在與否來鑒定核苷酸的引入。具體地,將引物/模板/聚合酶復(fù)合物與單一類型的核苷酸接觸。如果該核苷酸被引入,那么聚合反應(yīng)裂解三磷酸鏈的α和β磷酸之間的核苷三磷酸,從而釋放焦磷酸。然后使用化學(xué)發(fā)光酶報道系統(tǒng)鑒定釋放的焦磷酸的存在,所述化學(xué)發(fā)光酶報道系統(tǒng)將焦磷酸與AMP轉(zhuǎn)化為ΑΤΡ,然后通過使用螢光素酶產(chǎn)生可檢測的光信號來檢測ΑΤΡ。在檢測到光時,堿基引入,檢測不到光時,堿基不引入。在適當?shù)南礈觳襟E后,將多種堿基循環(huán)地與復(fù)合物接觸,以連續(xù)鑒定模板序列中隨后的堿基。例如,參見美國專利號6,210,891,其在此出于任何目的全文引入作為參考。在相關(guān)的方法中,引物/模板/聚合酶復(fù)合物被固定化于基質(zhì)上,且復(fù)合物與標記的核苷酸接觸。復(fù)合物的固定化可通過引物序列、模板序列和/或聚合酶來進行,且可以是共價的或非共價的。例如,復(fù)合物的固定化可通過聚合酶或引物和基質(zhì)表面之間的連接來實現(xiàn)。該附著可使用多種連接類型,例如,包括使用例如生物素-PEG-硅烷連接化學(xué)來提供生物素化的表面成分,繼而將待固定化的分子生物素化,然后通過例如鏈霉親和素橋進行連接。其它合成偶聯(lián)化學(xué)以及非特異性蛋白質(zhì)吸附也可用于固定化。在備選的構(gòu)型中,提供具有或不具有可去除的終止子基團的核苷酸。引入后,標簽與復(fù)合物偶聯(lián),從而是可檢測的。對于攜帶終止子的核苷酸,單獨攜帶可識別標簽的所有四種不同核苷酸與復(fù)合物進行接觸。由于終止子的存在,標記核苷酸的引入阻止了延伸,并將標簽加至復(fù)合物上。然后從引入的核苷酸上去除標簽和終止子,并在適當?shù)南礈觳襟E后,重復(fù)該過程。對于非終止的核苷酸,向復(fù)合物中加入單一類型的標記核苷酸,以確定其是否將被引入,如焦磷酸測序一樣。在去除核苷酸上的標記基團和適當?shù)南礈觳襟E后,該多種不同核苷酸在相同過程中通過反應(yīng)混合物進行循環(huán)。例如,參見美國專利號6,833,246,其在此以任何目的全文引入作為參考。例如,Illumina基因組分析儀系統(tǒng)基于WO 98/44151所描述的技術(shù),在此引入作為參考,其中DNA分子通過錨探針結(jié)合位點(也稱為流動池結(jié)合位點)與測序平臺(流動池)結(jié)合并在載玻片上原位擴增。然后DNA分子與測序引物退火并使用可逆終止子方法逐個堿基地平行測序。一般地,Illumina基因組分析儀系統(tǒng)利用8通道流動池,產(chǎn)生18-36個堿基長度的測序讀數(shù),每輪產(chǎn)生> 1.3Gbp的高質(zhì)量數(shù)據(jù)(參見www.1llumina.com)。在又另一合成測序方法中,進行模板依賴的合成時對不同標記的核苷酸的引入進行實時觀察。具體地,在引入熒光標記的核苷酸時觀察固定化的個體引物/模板/聚合酶復(fù)合物,從而在每個堿基加入時允許對每個加入的堿基進行實時鑒定。在該過程中,將標記基團連接到在引入過程中被裂解的核苷酸的一部分上。例如,通過將標記基團連接到在引入過程中被去除的磷酸鏈的一部分上,即核苷聚磷酸上的α、β、Y或其它末端磷酸基團上,該標記沒有被引入新生鏈中,而是相反,產(chǎn)生了天然DNA。對個體分子的觀察一般涉及將復(fù)合物光學(xué)限制在一個非常小的照明體積內(nèi)。通過光學(xué)限制該復(fù)合物,產(chǎn)生了監(jiān)控區(qū)域,在該區(qū)域中隨機擴散的核苷酸存在非常短的時間,而引入的核苷酸在觀察體積內(nèi)更久地保持,因為其正在被引入。這導(dǎo)致與引入事件相關(guān)聯(lián)的特征信號,其特征也在于所添加的堿基特有的信號譜。在相關(guān)方面,在聚合酶或復(fù)合物的其它部分和引入的核苷酸上提供相互作用的標記成分,例如熒光共振能量轉(zhuǎn)移(FRET)染料對,以便引入事件能夠使標記成分交互接近(interactive proximity),并產(chǎn)生特征信號,這同樣也是正在引入的堿基所特有的(例如,參見美國專利號 6,056,661,6, 917,726,7, 033,764,7, 052,847,7, 056,676,7, 170,050、7,361,466,7,416,844和公開的美國專利申請?zhí)?007-0134128,其全部公開內(nèi)容以任何目的在此全文引入作為參考)。在一些實施方式中,樣品中的核酸可以通過連接進行測序。該方法使用DNA連接酶來鑒定祀序列,例如,如在聚合酶克隆(polony)方法和SOLiD技術(shù)(AppliedBiosystems,現(xiàn)為Invitrogen)中使用的那樣。通常,提供一組所有可能的固定長度的寡核苷酸,根據(jù)測序的位點對其進行標記。將寡核苷酸退火和連接;通過DNA連接酶對匹配序列的優(yōu)先連接產(chǎn)生對應(yīng)于該位點處的互補序列的信號。在一些實施方式中,測序包括測序引物的延伸,該測序引物含有可與第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列。在一些實施方式中,測序包括測序引物的延伸,該測序引物含有可與第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。測序引物可以為任何適當?shù)拈L度,例如約、少于約或多于約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100個或更多個核苷酸,其任意部分或全部可以與對應(yīng)的靶序列互補(例如約、少于約或多于約5、10、15、20、25、30、35、40、45、50個或更多個核苷酸)。在一些實施方式中,測序引物含有SEQ ID NO:1或SEQ ID NO:2。在一些實施方式中,測序引物含有SEQ ID N0:5。在一些實施方式中,測序引物含有SEQ ID NO:6。在一些實施方式中,測序包括校正步驟,其中校正基于該條碼序列中一個或多個核苷酸位點處的每個核苷酸。校正可用于處理測序數(shù)據(jù),例如,通過促進或增加序列中給定位點處的堿基的鑒定準確性。在一些實施方式中,對于祀多核苷酸所源自的樣品的精確鑒定基于為祀多核苷酸獲得的序列的至少一部分,并且其精確度為至少90%、95%、96%、97%、98%、99%、99.5%,99.8%,99.85%,99.9%,99.95%,99.99%或更精確。在一些實施方式中,基于序列中所含的單一條碼對靶多核苷酸的樣品來源進行鑒定。在一些實施方式中,可以通過使用序列中含有的兩個或多個條碼鑒定靶多核苷酸的來源來提高精確度??梢酝ㄟ^將多個條碼引入靶多核苷酸所連接的單一銜接體中,和/或通過將具有一個或多個條碼的兩個或多個銜接體與靶多核苷酸連接,將多個條碼連接至靶多核苷酸。在一些實施方式中,可以使用其包含的僅一個條碼序列對含有兩個或多個條碼序列的靶多核苷酸的樣品來源的身份精確地進行鑒定。通常,對靶多核苷酸所源自的樣品的精確鑒定包括對來自合并池的兩個或多個樣品,例如合并池中的約、少于約或多于約2、3、4、5、6、7、8、9、10、12、16、20、24、28、32、36、40、50、60、70、80、90、100、128、192、384、500、1000個或更多個樣品的樣品來源進行正確鑒定。靶多核苷酸所源自的不同樣品可包括來自同一個體的多個樣品、來自不同個體的樣品或其組合。在一些實施方式中,樣品包含來自單一個體的多個多核苷酸。在一些實施方式中,樣品包含來自兩個或多個個體的多個多核苷酸。個體是靶多核苷酸可源自的任何有機體或其部分,其非限制性的例子包括植物、動物、真菌、原生生物、無核原生物、病毒、線粒體和葉綠體。樣品多核苷酸可分離自一個主體,例如源于該主體的細胞樣品、組織樣品或器官樣品,包括,例如培養(yǎng)的細胞系、活檢組織、血液樣品或含有細胞的流體樣品。主體可以是動物,包括但不限于諸如牛、豬、小鼠、大鼠、雞、貓、狗等動物,且通常為哺乳動物,例如人。樣品也可人工獲得,例如通過化學(xué)合成。在一些實施方式中,樣品包含DNA。在一些實施方式中,樣品包含基因組DNA。在一些實施方式中,樣品包含線粒體DNA、葉綠體DNA、質(zhì)粒DNA、細菌人工染色體、酵母人工染色體、寡核苷酸標簽或其組合。在一些實施方式中,樣品包含使用任何合適的引物組合和DNA聚合酶通過引物延伸反應(yīng)而產(chǎn)生的DNA,該反應(yīng)包括但不限于聚合酶鏈反應(yīng)(PCR)、反轉(zhuǎn)錄及其組合。當引物延伸反應(yīng)的模板為RNA時,反轉(zhuǎn)錄產(chǎn)物被稱為互補DNA(cDNA)。用于引物延伸反應(yīng)的引物可包含對于一個或多個靶標、隨機序列、部分隨機序列及其組合為特異性的序列。適合引物延伸反應(yīng)的反應(yīng)條件是本領(lǐng)域已知的。通常,樣品多核苷酸包含樣品中存在的任何多核苷酸,其可以包括或可以不包括靶多核苷酸。提取和純化核酸的方法是本領(lǐng)域熟知的。例如,可以通過用苯酚、酚/氯仿/異戊醇或包括TRIzoI和TriReagent在內(nèi)的類似試劑進行有機提取來純化核酸。提取技術(shù)的其它非限制性的示例包括:(I)有機提取后進行乙醇沉淀,例如,使用酚/氯仿有機試劑(Ausubel等,1993),其使用或不使用自動核酸提取儀,例如,可獲自AppliedBiosystems (Foster City, Calif.)的341型DNA提取儀;(2)固定相吸附法(美國專利號5,234,809 ;Walsh等,1991);和(3)鹽誘導(dǎo)的核酸沉淀法(Miller等,(1988),此類沉淀法一般稱為“鹽析”法。核酸分離和/或純化的另一例子包括使用可以特異性或非特異性結(jié)合核酸的磁性顆粒,繼而使用磁體分離磁珠,并從磁珠上洗滌和洗脫核酸(例如參見美國專利號5,705,628)。在一些實施方式中,上述分離方法之前可以為酶消化步驟以幫助消除樣品中不需要的蛋白質(zhì),例如用蛋白酶K或其它類似蛋白酶消化。例如,參見美國專利號7,001,724。如果需要的話,可以向裂解緩沖液中添加RNase抑制劑。對于某些細胞或樣品類型,可能需要在流程中加入蛋白質(zhì)變性/消化步驟。純化方法可涉及分離DNA、RNA或兩者。當在提取過程中或之后DNA和RNA被一起分離出來時,可以采用進一步的步驟來彼此分開地純化其中一種或兩種。也可產(chǎn)生所提取的核酸的子級分,例如,通過大小、序列或其它物理或化學(xué)特性進行純化。除了初始的核酸分離步驟外,還可以在本發(fā)明的方法中的任意步驟之后進行核酸的純化,例如用以去除過量的或不需要的試劑、反應(yīng)物或產(chǎn)物。在一些實施方式中,將樣品多核苷酸片段化為一群片段化的一個或多個特定大小范圍的插入DNA分子。在一些實施方式中,片段產(chǎn)生自至少約1、10、100、1000、10000、100000,300000,500000或更多基因組當量的起始DNA。片段化可通過本領(lǐng)域已知的方法實現(xiàn),包括化學(xué)、酶促和機械片段化。在一些實施方式中,片段具有約10至約10,000個核苷酸的平均長度。在一些實施方式中,片段具有約50至約2,000個核苷酸的平均長度。在一些實施方式中,片段具有約 100-2,500,10-1, 000、10-800、10-500、50-500、50-250 或 50-150個核苷酸的平均長度。在一些實施方式中,片段具有少于500個核苷酸,例如少于400個核苷酸、少于300個核苷酸、少于200個核苷酸或少于150個核苷酸的平均長度。在一些實施方式中,片段化以機械的方式完成,包括對樣品多核苷酸進行超聲處理。在一些實施方式中,片段化包括用一種或多種酶在適于該一種或多種酶產(chǎn)生雙鏈核酸斷裂的條件下處理樣品多核苷酸。用于產(chǎn)生多核苷酸片段的酶的例子包括序列特異性和非序列特異性的核酸酶。核酸酶的非限制性示例包括DNase 1、片段化酶、限制性核酸內(nèi)切酶、其變體及其組合。例如,在不存在Mg++和存在Mn++的情況下用DNase I消化可以誘導(dǎo)DNA中的隨機雙鏈斷裂。在一些實施方式中,片段化包括用一種或多種限制性核酸內(nèi)切酶處理樣品多核苷酸。片段化可以產(chǎn)生具有5’突出端、3’突出端、平端或其組合的片段。在一些實施方式中,例如當片段化包括使用一種或多種限制性核酸內(nèi)切酶時,樣品多核苷酸的裂解會產(chǎn)生具有可預(yù)測序列的突出端。在一些實施方式中,該方法包括通過標準方法例如柱純化或從瓊脂糖凝膠分離對片段進行大小選擇的步驟。在一些實施方式中,片段化DNA的5’和/或3’端核苷酸序列在與一個或多個銜接體寡核苷酸連接之前不進行修飾。例如,可以使用限制性核酸內(nèi)切酶片段化產(chǎn)生可預(yù)測的突出端,隨后與一個或多個含有與DNA片段上的可預(yù)測突出端互補的突出端的銜接體寡核苷酸連接。在另一個例子中,在用能夠產(chǎn)生可預(yù)測的平端的酶裂解之后,可以進行平端DNA片段與含有平端的銜接體寡核苷酸的連接。在一些實施方式中,在與銜接體連接之前對片段化的DNA分子進行平端補齊(blunt-end polish)(或“末端修復(fù)”)以產(chǎn)生具有平端的DNA片段??梢酝ㄟ^與合適的酶進行孵育來完成平端補齊步驟,該酶例如是同時具有3' -5'核酸外切酶活性和5' -3'聚合酶活性的DNA聚合酶,例如T4聚合酶。在一些實施方式中,末端修復(fù)之后添加 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20 個或更多核苷酸,例如一個或多個腺嘌呤、一個或多個胸腺嘧啶、一個或多個鳥嘌呤、或一個或多個胞嘧啶,以產(chǎn)生突出端。具有突出端的DNA片段可與具有互補性突出端的一個或多個銜接體寡核苷酸連接,例如在連接反應(yīng)中。例如,可使用不依賴于模板的聚合酶將單個腺嘌呤添加至末端修復(fù)的DNA片段的3’末端,隨后與一個或多個銜接體連接,每個銜接體都在3’端具有胸腺嘧啶。在一些實施方式中,銜接體寡核苷酸可與平端雙鏈DNA片段分子連接,所述平端雙鏈DNA片段分子已經(jīng)通過3’端延伸一個或多個核苷酸以及隨后的5’磷酸化而得到修飾。在一些情況下,可以在含有鎂的合適的緩沖液中,在一種或多種dNTP的存在下,使用聚合酶,例如Klenow聚合酶或在此提供的任意合適的聚合酶,或使用末端脫氧核苷酸轉(zhuǎn)移酶,進行3’末端的延伸。在一些實施方式中,具有平端的靶多核苷酸與含有平端的一個或多個銜接體連接??梢栽诤蠥TP和鎂的合適的緩沖液中使用例如T4多核苷酸激酶進行DNA片段分子的5’端的磷酸化??梢匀芜x地處理片段化的DNA分子以對5’端或3’端去磷酸,例如,通過使用本領(lǐng)域已知的酶,例如磷酸酶。在一些實施方式中,多個獨立樣品中的每一個都包含至少約lpg、10pg、100pg、lng、10ng、20ng、30ng、40ng、50ng、75ng、lOOng、150ng、200ng、250ng、300ng、400ng、500ng、1μ g、l.5μ g、2y g或更多的核酸材料。在一些實施方式中,多個獨立樣品中的每一個都包含少于約 lpg、10pg、lOOpg、lng、10ng、20ng、30ng、40ng、50ng、75ng、lOOng、150ng、200ng、250ng、300ng、400ng、500ng、I μ g、1.5 μ g、2 μ g 或更多的核酸。另一方面,本發(fā)明提供了可用于上述方法的組合物。本發(fā)明的組合物可包含任何一種或多種在此描述的元件。在一個實施方式中,組合物包含多個靶多核苷酸,每個靶多核苷酸包含選自多個條碼序列的一個或多個條碼序列,其中所述靶多核苷酸來自兩個或多個不同樣品,并且進一步地,其中可在組合測序反應(yīng)中基于所述靶多核苷酸的序列中所含的單一條碼以至少95%的準確度對每個所述多核苷酸所源自的樣品進行鑒定。在一些實施方式中,組合物包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。一方面,本發(fā)明提供了含有上述方法和組合物中公開的任何一種或多種元件的試劑盒。在一些實施方式中,試劑盒在一個或多個容器中包含本發(fā)明的組合物。在一些實施方式中,本發(fā)明提供了包含在此描述的銜接體、引物和/或其它寡核苷酸的試劑盒。在一些實施方式中,該試劑盒還包含以下一種或多種:(a) DNA連接酶,(b) DNA依賴的DNA聚合酶,(c)RNA依賴的DNA聚合酶,(d)隨機引物,(e)在3’端包含至少4個胸苷的引物,(f)DNA核酸內(nèi)切酶,(g)具有3’到5’核酸外切酶活性的DNA依賴的DNA聚合酶,(h)多個引物,每個引物具有多個選定序列之一,(i)DNA激酶,(j)DNA核酸外切酶,(k)磁珠,(I)具有RNaseH活性的酶,(m) RNA連接酶,和(η)適合所述試劑盒中包含的一種或多種元件的一種或多種緩沖液。銜接體、引物、其它寡核苷酸和試劑可以為但不限于任意上述公開的內(nèi)容。該試劑盒的元件還可以以上述任何量和/或組合(例如在同一試劑盒中或同一容器中)進行提供,但不限于此。該試劑盒可進一步包含額外的試劑,例如上述那些,以供根據(jù)本發(fā)明方法使用。該試劑盒元件可在任何合適的容器中提供,包括但不限于試管、小瓶、燒瓶、瓶子、安瓿、注射器等等。試劑可按照可以直接在本發(fā)明的方法中使用的方式提供,或按照使用之前需要準備的方式提供,例如以凍干劑的重構(gòu)形式。試劑可以以小份的方式提供,以用于單次應(yīng)用,或以大份(stock)的方式提供,可從其獲得多次應(yīng)用,例如在多個反應(yīng)中使用。在一個實施方式中,該試劑盒包含多個第一銜接體寡核苷酸及其使用說明,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。含有不同條碼序列的第一銜接體可單獨提供,或與一種或多種額外的具有不同條碼序列的第一銜接體組合提供。在一些實施方式中,該試劑盒進一步包含多個第二銜接體寡核苷酸。第二銜接體寡核苷酸可以單獨提供,或與一個或多個第一銜接體和/或一個或多個不同的第二銜接體組合提供。第一和第二銜接體的組合可以按照上述組合進行提供。
實施例下述實施例是出于描述本發(fā)明的多個實施方式的目的而給出的,并不意味著以任何方式限制本發(fā)明。這些實施例和在此描述的方法是優(yōu)選實施方式的現(xiàn)有代表,是示例性的,并不意味著對本發(fā)明的范圍進行限制。本領(lǐng)域技術(shù)人員將會想到包含在由權(quán)利要求范圍定義的本發(fā)明精神內(nèi)的改變和其它應(yīng)用。
實施例1:樣品核酸的片段化和修復(fù)本實施例中使用的包含靶多核苷酸的樣品(“樣品”)是人基因組DNA。為了將核酸片段化,將I μ g_5 μ g在120 μ L的TE中稀釋,并使用Covaris S系列聲波儀(Covaris,Inc.)對稀釋液進行機械片段化,其參數(shù)如下:工作周期=10,強度=5,循環(huán)/爆發(fā)=100,時間=10 分鐘,樣品體積=120 μ L。用 SPRI 珠(Beckman Coulter, Inc.),以 1: 1.8(樣品:珠)的比例純化片段化的核酸。用40μ L的TE從珠上洗脫DNA,并對其進行定量,例如通過使用Nanodrop、Quibit或類似DNA定量設(shè)備,或通過分光光度法。然后使用特異性消除突出端并將末端殘基恢復(fù)為合適的5’磷酸化和3’羥基構(gòu)型的酶混合物,對具有5’突出端、3’突出端、非磷酸化的3’端和/或磷酸化的3’端的片段化產(chǎn)物進行末端修復(fù)。對使用Quick Blunting 試劑盒(New England Biolabs, Inc.)的末端修復(fù)而言,將 100_200ng 片段化的DNA與1.25 μ LlOX快速平端緩沖液、1.25 μ LlmMdNTP混合物和水混合至終體積為12 μ L0將該組合進行充分混合,在管中旋轉(zhuǎn),并加入0.5 μ L的快速平端酶(Τ4 DNA聚合酶和Τ4多核苷酸激酶的組合),然后在室溫下孵育30分鐘,并于70°C滅活10分鐘。根據(jù)本實施例的方法制備的核酸可儲存在_20°C,或立即用于接下來的連接反應(yīng)以將靶多核苷酸片段與銜接體連接。該過程中的各步驟的圖示,包括片段化、末端修復(fù)、銜接體連接、銜接體補平、擴增和測序,在圖1中示出。
實施例2:靶多核苷酸與銜接體的比例對文庫構(gòu)建的影響本實施例考察了靶多核苷酸與銜接體的不同比例對構(gòu)建銜接體標記的靶多核苷酸集合(或“文庫”)的影響。本實施例中使用的包含靶多核苷酸的樣品(“樣品”)如實施例I所述制備。本實施例中的第一銜接體由SEQ ID NO:7組成。第二銜接體由SEQ ID NO:8組成。本實施例的擴增步驟中使用的引物之一由SEQ ID NO:9組成,而引物對中的另一個引物由SEQ ID N0:10組成。連接反應(yīng)物如此制備,使得每個含有10 μ L 2Χ連接緩沖液、4 μ L樣品核酸、4 μ L組合的銜接體、I μ L的水(在缺少樣品或銜接體的反應(yīng)中為5 μ L)和I μ L連接酶。除了緩沖液、水和連接酶外,檢測的反應(yīng)物還包括:無樣品(反應(yīng)1-4),20ng樣品(反應(yīng)5-8),和200ng樣品(反應(yīng)9-12)與(按照反應(yīng)順序)I μ M銜接體、0.2 μ M銜接體、0.04 μ M銜接體或0.008 μ M銜接體混合。除了緩沖液、水和連接酶外,另外的對照按反應(yīng)序號由以下組成:(13) 200ng的樣品不加銜接體,(14) 200ng的樣品只加I μ M第一銜接體,(15)200叩的樣品只加11^第二銜接體,(16)只有水,(17)只有I μ M第一銜接體,和(18)只有I μ M第二銜接體。連接反應(yīng)物于室溫下孵育10分鐘。然后對連接產(chǎn)物進行擴增步驟,其中每個擴增反應(yīng)含有3μ L水、2μ L5X PCR緩沖液、I μ L 25mM MgC12、I μ LlO μ M第一引物、I μ L 10μ M 第二引物、0.5μ L IOmM dNTP.0.5μΜ DMS0、0.1 μ L Expand 酶混合物、0.1 μ L Taq聚合酶和I μ L的一種連接反應(yīng)物。然后使擴增反應(yīng)混合物經(jīng)歷下述熱循環(huán)程序:72°C 2分鐘,95°C 2分鐘,I個循環(huán);95°C 30秒,60°C 30秒,72°C I分鐘,10個循環(huán);950C 30秒,60°C 30秒,72°C 70秒,20個循環(huán);72°C 7分鐘;在10°C下保持直至下一步。該過程的第一個循環(huán)可使用與5’末端連接的銜接體作為模板來延伸靶多核苷酸的3’末端(“補平”反應(yīng)),從而產(chǎn)生雙鏈DNA銜接體標簽。在熱循環(huán)的最后,往每個反應(yīng)中加入2 μ L的6Χ加樣染料,并將5 μ L所得到的混合物加樣至在TAE中的2 %瓊脂糖凝膠上。對凝膠成像,以顯示由連接和擴增產(chǎn)生的DNA產(chǎn)物。樣品結(jié)果示于圖2Α中。圖2Α的上半部分在自左至右的泳道中包含:分子量標準(ladder)、反應(yīng)1_9和分子量標準。圖2A的下半部分在自左至右的泳道中包含:分子量標準、反應(yīng)10-18和分子量標準。泳道1-4和13-18表明,兩種樣品核酸和兩種銜接體都是有效擴增靶多核苷酸所需要的。圖2B除了含有分子量標準的泳道外,還以自左至右的順序提供了反應(yīng)1-12的并排比較。結(jié)果表明,在這些條件下,可以使用第一和第二發(fā)夾銜接體來獲得擴增的文庫,較高的樣品量會降低引物二聚體的形成,且隨著銜接體輸入的減少,擴增產(chǎn)率維持相對恒定。
實施例3:條碼化的銜接體和樣品來源鑒定使用標準方法從來源于16名個體的樣品中分離核酸。分離的多核苷酸樣品獨立地按實施例1所述進行處理。然后如實施例2所述將銜接體連接到靶多核苷酸,其中每個樣品與具有不同條碼的第一銜接體和由SEQ ID NO:8組成的第二銜接體連接。第一銜接體被獨立地分配給每個樣品,并具有SEQ ID NO:11-26所提供的序列。然后如實施例2所述,通過使用銜接體序列作為模板進行3’末端延伸,對具有含銜接體序列的5’突出端的靶多核苷酸進行補平。然后同樣如實施例2所述,使用一對引物對靶多核苷酸進行PCR擴增,一條引物含有SEQ ID NO:84,而另一條引物含有SEQ ID NO:85。然后合并擴增產(chǎn)物,并按照Illumina的Solexa測序平臺對其進行測序(例如參見www.1llumina.com)。然后基于測序閱讀中所含的條碼對合并的測序數(shù)據(jù)進行剖析,產(chǎn)生16個箱元(bin)的測序數(shù)據(jù)。然后將各個箱元進行組裝,如同其各自是獨立運行的一樣,為來自單一合并的測序反應(yīng)的16個獨立樣品提供分類的和比對的測序數(shù)據(jù)。
實施例4:含有異雙鏈體的發(fā)夾銜接體的應(yīng)用在本實施例中使用的包含靶多核苷酸的樣品(“樣品”)如實施例1所述制備。具有涉及兩端、形成平端結(jié)構(gòu)的莖的第一和第二發(fā)夾銜接體寡核苷酸如實施例2所述與靶多核苷酸連接。對于只具有5’磷酸的靶多核苷酸,只有銜接體的3’端與靶標連接。如圖3所示,銜接體5’末端的可雜交區(qū)域包含RNA,而5’末端所雜交的序列則包含DNA。連接后,RNaseH裂解RNA-DNA雜雙鏈體的RNA,去除來自連接的銜接體的二級結(jié)構(gòu)。然后DNA聚合酶使用連接的銜接體剩下的序列作為模板延伸靶多核苷酸的3’末端,該步驟不需要任何鏈置換。按照實施例2所述進行該步驟,隨后也可以使用與來自銜接體的序列雜交的引物進行擴增步驟。然后使用與來自銜接體的序列雜交的測序引物對得到的銜接體標記的寡核苷酸進行測序。在圖3和圖4中,SI(莖I的一半)可與SI’(莖I的另一半)雜交,S2(莖2的一半)可與S2’(莖2的另一半)雜交,LI是第一銜接體寡核苷酸的環(huán)序列,L2是第二銜接體寡核苷酸的環(huán)序列。類似地,在圖5中,SI可與SI’雜交,LI是銜接體寡核苷酸的環(huán)序列。出于這些解釋的目的,序列S1、S1’、S2和S2’分別對應(yīng)于如上所述的序列A、A’、B 和 B,。
實施例5:對多種發(fā)夾銜接體設(shè)計的連接效率的評價在該實施例中,對具有不同核苷酸組成的發(fā)夾銜接體寡核苷酸與靶多核苷酸的連接效率進行了評價。每個連接反應(yīng)包括靶多核苷酸和一對銜接體,其中所述對中的每個成員都具有不同的序列,但是共享指定的特征。如圖7所示,該多種設(shè)計自左至右為:平端dU銜接體、胸腺嘧啶-突出端銜接體(與平端靶多核苷酸連接)、胸腺嘧啶-突出端銜接體(與末端修復(fù)的靶多核苷酸連接,所述靶多核苷酸經(jīng)修飾具有3’腺嘌呤單堿基突出端)、雙鏈體發(fā)夾銜接體和平端全DNA銜接體。平端dU銜接體在銜接體環(huán)的最5’端包括脫氧尿嘧啶核苷酸的二核苷酸(例如SEQ ID NO:27和SEQ ID NO:28)。使用UDG+APE1對連接材料的處理為接下來的補平反應(yīng)裂解了 U堿基并打開了環(huán)(剩下的莖在補平反應(yīng)所使用的72°C溫度下解離)。胸腺嘧啶-突出端銜接體包括具有單胸腺嘧啶核苷酸的3’突出端的全DNA序列(例如SEQ ID N0:35和SEQ ID N036)。雙鏈體發(fā)夾銜接體包括與短核苷酸(例如SEQID NO:39)雜交的具有莖和3’突出端的第一或第二發(fā)夾寡核苷酸(例如SEQ ID NO:37和SEQ ID NO:38),所述雜交包括短核苷酸的5’端與發(fā)夾寡核苷酸的3’端雜交以形成有效地具有單鏈斷裂的莖。平端全DNA銜接體由DNA組成,其內(nèi)部雜交形成平端發(fā)夾(例如SEQID NO:40和SEQ ID NO:41)。示例性的銜接體序列由SEQ ID NO:27-43提供。人基因組DNA按照實施例1進行片段化。為了對片段化的基因組DNA進行末端修復(fù),將52 μ L 191ng/μ L片段化的人基因組DNA與20 μ LlOX快速平端緩沖液、20 μ L IOXdNTP和100 μ L水混合,其在進一步添加8 μ L快速平端酶混合物之前進行混合。末端修復(fù)反應(yīng)在室溫下孵育30分鐘,75°C下20分鐘。為了與胸腺嘧啶-突出端銜接體連接,通過添力口 2 μ L IOmM dATP (終濃度為 0.2mM)和 8 μ L 的 Klenow(3,- > 5’ 外切陰性)并在 37°C下孵育30分鐘,然后75 °C 20分鐘,對100 μ L末端修復(fù)的DNA進行修飾,使其具有單腺嘌呤核苷酸的3’突出端(“加尾”)。連接反應(yīng)物的制備過程為合并10 μ L 2Χ連接緩沖液、4 μ L末端修復(fù)的DNA或加尾的DNA (共約200ng)、濃度為10 μ M的各0.2 μ L的成對的第一和第二銜接體和5 μ L水,然后進行混合,加入I μ L的T4DNA連接酶,并在室溫下孵育10分鐘。對于使用平端dU銜接體的連接反應(yīng),加入I μ L的尿嘧啶DNA糖基化酶(UDG)和無嘌呤核酸內(nèi)切酶(APE)的混合物,隨后在37°C下孵育10分鐘。連接并在標明的位置裂解后,準備兩個重復(fù)的反應(yīng),用于對每個銜接體類型的連接反應(yīng)通過3’末端延伸補平5’突出端。使用一對擴增引物(SEQ ID NO:42和SEQ ID NO:43)通過PCR進一步擴增每個重復(fù)補平反應(yīng)中的一個,而每個重復(fù)中的另一個則用于測定連接效率。每個補平/擴增反應(yīng)含有8μ L水、2 μ L IOX擴增緩沖液、2 μ L25mM MgCl2、濃度為10 μ M的2 μ L每種擴增引物、2 μ L的一種連接反應(yīng)物、I μ L DMSOUuL IOmM dNTP和0.2 μ L Taq聚合酶。補平/擴增反應(yīng)物在72°C下孵育2分鐘。擴增包括20個循環(huán)的94°C 30秒、60°C 30秒和72°C I分鐘。將擴增反應(yīng)物的等份在瓊脂糖凝膠上電泳,其結(jié)果在圖7中示出。通過定量PCR(qPCR)測定連接效率。連接效率定義為作為輸入被添加至文庫構(gòu)建的靶分子在最終擴增的文庫中的百分比。通過使用已存在的已知化合物及濃度的文庫作為標準對其進行測定。使用該文庫的稀釋液來產(chǎn)生qPCR反應(yīng)中的標準曲線。為了檢測未知物,在末端修復(fù)、連接和補平后去除了經(jīng)計算的部分靶輸入。將來自該樣品的qPCR信號標繪于標準曲線上,以確立正確連接的分子的量。測得的信號和已知輸入之間的差異確立了連接效率。qPCR反應(yīng)混合物包括12.5μ L 2Χ SYBR混合物(Clontech Laboratories,Inc.)、濃度為IOyM的0.5yL每種擴增引物、5yL模板(補平反應(yīng)物的1/10稀釋液、補平反應(yīng)物的1/100稀釋液、文庫標準或用于無模板對照的水)和6.5 μ L水。使用標準方法進行qPCR反應(yīng)物的擴增,每個銜接體設(shè)計的連接效率在圖7中在各自設(shè)計的說明的下方給出。簡而言之,對于平端dU銜接體、胸腺嘧啶-突出端銜接體(連接至平端的靶多核苷酸)、胸腺嘧啶-突出端銜接體(連接至末端修復(fù)的靶多核苷酸,該靶多核苷酸經(jīng)修飾具有3’腺嘌呤單堿基突出端)、雙鏈體發(fā)夾銜接體和平端全DNA銜接體,效率分別為約0.48%、0.0035%、0.20%,0.22%和0.22%。所有銜接體對都生成了可比的PCR擴增產(chǎn)物。通過瓊脂糖凝膠分析對連接產(chǎn)物的檢測表明存在很少或不存在銜接體二聚體。含有約為預(yù)期大小的靶插入片段的擴增產(chǎn)物也得到確認。圖8顯示了多種反應(yīng)物的樣品的凝膠,自左至右的泳道內(nèi)容物如下:末端修復(fù)的人基因組DNA、平端全DNA銜接體、末端修復(fù)的和A-加尾的DNA、胸腺嘧啶突出端銜接體、分子量標準、不含銜接體的連接的末端修復(fù)的DNA、與平端全DNA銜接體連接的末端修復(fù)的DNA、不連接銜接體的末端修復(fù)的和A-加尾的DNA、與胸腺嘧啶突出端銜接體連接的末端修復(fù)的和A-加尾的DNA、和分子量標準。在一些實施方式中,一對雙鏈體銜接體中的第一雙鏈體銜接體包括具有莖和3’突出端的第一發(fā)夾寡核苷酸,該3’突出端包含與短配偶寡核苷酸雜交的條碼,所述短配偶寡核苷酸包含與包括條碼的3’突出端的全部或一部分互補的序列。包括兩個寡核苷酸的雙鏈體銜接體可具有5’或3’突出端,或在雙鏈體中的兩個寡核苷酸雜交時可具有平末端。第一雙鏈體銜接體可以與第二雙鏈體銜接體配對,該第二雙鏈體銜接體與第一雙鏈體銜接體相同或不同,且第二雙鏈體銜接體可以含有或可以不含有條碼。一般而言,第二雙鏈體銜接體可以包括具有莖和與短核苷酸雜交的3’突出端的發(fā)夾寡核苷酸,從而雜交的寡核苷酸一起形成具有5’或3’突出端或平端的銜接體。包含具有條碼并與短配偶寡核苷酸配對的發(fā)夾寡核苷酸的第一雙鏈體銜接體的例子包括下述序列對:SEQ ID N0:44與SEQ ID NO:45、SEQ ID N0:46 與 SEQ ID NO:47、SEQ ID NO:48 與 SEQ ID NO:49、SEQ ID NO:50 與 SEQ IDNO:5USEQ ID NO:52 與 SEQ ID NO:53、SEQ ID N0:54 與 SEQ ID NO:55、SEQ ID NO:56 與SEQ ID NO:57、SEQ ID NO:58 與 SEQ ID NO:59、SEQ ID NO:60 與 SEQ ID NO:61、SEQ IDN0:62 與 SEQ ID NO:63、SEQ ID N0:64 與 SEQ ID NO:65、SEQ ID NO:66 與 SEQ ID NO:67、SEQ ID N0:68 與 SEQ ID NO:69、SEQ ID NO:70 與 SEQ ID NO:71、SEQ ID NO:72 與 SEQ IDN0:73和SEQ ID NO:74與SEQ ID NO:75。在這些序列中,通過雙鏈體銜接體中每對寡核苷酸的發(fā)夾寡核苷酸的3’端的四種堿基來呈現(xiàn)條碼,并通過雙鏈體銜接體中每對寡核苷酸的短配偶寡核苷酸的5’端的四種堿基來呈現(xiàn)條碼的互補序列。一般而言,一對中的每個發(fā)夾寡核苷酸與對應(yīng)的短配偶寡核苷酸以1:1的比例混合。
實施例6:對含有RNA的發(fā)夾銜接體的連接效率的評價在該實施例中,如實施例5所述,對具有不同核苷酸組成的發(fā)夾銜接體寡核苷酸與靶多核苷酸的連接效率進行了評價。每個連接反應(yīng)包括靶多核苷酸和一對銜接體,其中所述對中的每個成員都具有不同的序列,但是共享指定的特征。銜接體對包括平端全DNA銜接體和具有DNA = DNA末端的平端RNA銜接體。平端全DNA銜接體由DNA組成,其內(nèi)部雜交形成平端發(fā)夾(SEQ ID NO:76和SEQ ID NO:77)。具有DNA = DNA末端的平端RNA銜接體包括莖,其一條鏈在含5個5’末端DNA堿基的5’末端具有10個RNA堿基,該鏈與全DNA的第二鏈(SEQ ID NO:80和SEQ ID NO:81)雜交。使用一對擴增引物(SEQ ID NO:82和SEQ ID NO:83)進行使用這些銜接體的連接反應(yīng)物的擴增。銜接體和擴增引物序列的例子由 SEQ ID NO:76-83 提供。片段化的靶多核苷酸按照實施例5所述制備。片段化的DNA如實施例1所述進行末端修復(fù),其中對每個反應(yīng)合并4.2μ L 47.5ng/μ L片段化的基因組DNA、1.25 μ L IOX快速平端緩沖液、1.25 μ L ImM dNTP,5.3 μ L水,將其混合,并加入0.5 μ L快速平端酶。末端修復(fù)反應(yīng)然后在室溫(例如20°C -27°C )下孵育30分鐘,然后在70°C下孵育10分鐘。連接反應(yīng)準備一式兩份,使用全12.5 μ L的末端修復(fù)反應(yīng),合并12.5 μ L 2Χ快速連接酶緩沖液、濃度為10 μ M的各0.25 μ L銜接體對中的銜接體和1.25 μ L的快速連接酶。在擴增之前將連接反應(yīng)在室溫下孵育10分鐘。在開始擴增過程前,用擴增反應(yīng)混合物中的RNase H處理各重復(fù)中的一個連接反應(yīng)物。然后對用RNase H處理的和未處理的反應(yīng)物進行5’突出端補平和連接產(chǎn)物擴增。未用RNase H處理的樣品包括59 μ L水、10 μ L IOx PCR緩沖液、3μ L 50mM MgCl2、濃度為 10 μ M 的各 5 μ L 每種擴增引物、5 μ LDMS0、2 μ L 1mM dNTP U μ LTaq聚合酶和10 μ L連接的模板。接受RNase H處理的樣品包括58 μ L水、10 μ L IOx PCR緩沖液、3 μ L 50mMMgCl2、濃度為 10 μ M 的各 5 μ L 每種擴增引物、5 μ L DMS0、2 μ L IOmMdNTP、IyL Taq聚合酶、I μ I RNase H和10 μ L連接的模板。對于接受RNase H處理的樣品,在用于擴增的熱循環(huán)之前于37°C孵育10分鐘(用作定量基準的非擴增的、RNase H處理的樣品包括額外的72°C下2分鐘的步驟,和10°C的維持步驟)。然后使擴增反應(yīng)混合物經(jīng)歷下述熱循環(huán)程序以用于補平和擴增:72°C 2分鐘,I個循環(huán);94°C 45秒、55°C 30秒和72°C 90秒,20個循環(huán);72°C 7分鐘,I個循環(huán);和10°C維持。含有8 μ L PCR擴增反應(yīng)樣品的2%瓊脂糖凝膠在圖9中示出,其泳道自左至右對應(yīng)于具有DNA: DNA末端的平端RNA銜接體連接產(chǎn)物、平端全DNA銜接體連接產(chǎn)物、和DNA分子量標準。銜接體的3’末端與靶標的5’末端之間的連接、靶DNA在一個末端的RNase H處理(在適用情況下)、補平和擴增反應(yīng)的示意圖在圖10中提供。如實施例5所述,采用或不采用RNase H處理,檢測每對銜接體的連接效率。本實施例中的每個qPCR反應(yīng)包含5yL2X SYBR GreenMix、各0.4 μ L的每種擴增引物、2.2 μ L水和2 μ L稀釋的連接反應(yīng)物,每個qPCR反應(yīng)總體積為10 μ L。RNase H處理的平端全DNA銜接體、未經(jīng)RNase H處理的平端全DNA銜接體、RNase H處理的具有DNA = DNA末端的平端RNA銜接體和未經(jīng)RNase H處理的具有DNA = DNA末端的平端RNA銜接體的連接效率分別為0.20%,0.37%,0.28%和0.13%。成功連接和擴增的片段可用作下一代序列文庫。雖然在此展示和描述了本發(fā)明優(yōu)選的實施方式,但是對本領(lǐng)域技術(shù)人員而言顯然這些實施方式是僅以示例的方式給出的。本領(lǐng)域技術(shù)人員在不偏離本發(fā)明的情況下現(xiàn)在可以想到眾多的變化、改變和替換。應(yīng)當理解,在本發(fā)明的實踐中可以使用在此描述的本發(fā)明實施方式的很多替代方式。以下權(quán)利要求用于限定本發(fā)明的范圍,由此覆蓋了這些權(quán)利要求的范圍內(nèi)的方法和結(jié)構(gòu)及其等價物。
權(quán)利要求
1.一種多重測序方法,包括在單一反應(yīng)室中對多個靶多核苷酸進行測序,其中所述靶多核苷酸來自兩個或多個不同樣品;以及基于所述靶多核苷酸序列中含有的單一條碼,以至少95%的準確度對每個所述測序的靶多核苷酸所源自的樣品進行鑒定。
2.權(quán)利要求1的方法,其中所述祀多核苷酸包含用于校正測序反應(yīng)的一個或多個序列。
3.權(quán)利要求1的方法,其中每個條碼在至少三個核苷酸位點處不同于所有其它條碼。
4.權(quán)利要求1的方法,其中所述鑒定在所述條碼中的核苷酸的突變或缺失之后是精確的。
5.一種從多個獨立樣品中產(chǎn)生銜接體標記的靶多核苷酸的方法,該方法包括: a)提供多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列;和 b)將至少一個所述第一銜接體寡核苷酸與每個所述樣品的所述靶多核苷酸連接,從而沒有條碼序列與多于一個所述樣品的所述靶多核苷酸連接。
6.權(quán)利要求5的方法,進一步包括(c)將多個第二銜接體寡核苷酸中的至少一個與來自步驟(b)的每個所述樣品的所述靶多核苷酸連接,從而至少一些所述靶多核苷酸在一端包含所述第一銜接體寡核苷酸,并在另一端包含所述第二銜接體寡核苷酸。
7.權(quán)利要求6的方法,進一步包括合并來自步驟(c)的靶多核苷酸。
8.權(quán)利要求7的方法,進一步包括對所述合并池中的一個或多個所述多核苷酸進行測序。
9.權(quán)利要求8的方法,進一步包括基于其連接的條碼序列鑒定靶多核苷酸所源自的樣品O
10.權(quán)利要求5或6的方法,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:1。
11.權(quán)利要求5或6的方法,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:2。
12.權(quán)利要求5或6的方法,其中一個或多個所述銜接體寡核苷酸包含發(fā)夾結(jié)構(gòu)。
13.權(quán)利要求5或6的方法,其中一個或多個所述銜接體寡核苷酸包含寡核苷酸雙鏈體。
14.權(quán)利要求1或5的方法,其中所述條碼序列的長度為至少3個核苷酸。
15.權(quán)利要求1或7的方法,其中基于所述條碼序列合并所述靶多核苷酸,從而在合并池中所有四種堿基在沿著每個條碼的一個或多個位點處均勻呈現(xiàn)。
16.權(quán)利要求1或5的方法,其中所述祀多核苷酸包含片段化的樣品多核苷酸。
17.權(quán)利要求16的方法,其中所述片段化包括對所述樣品多核苷酸進行超聲處理。
18.權(quán)利要求16的方法,其中所述片段化包括用一種或多種限制性核酸內(nèi)切酶處理所述樣品多核苷酸。
19.權(quán)利要求16的方法,其中所述片段化包括在適合一種或多種酶產(chǎn)生隨機雙鏈核酸斷裂的條件下用所述一種或多種酶處理所述樣品多核苷酸。
20.權(quán)利要求19的方法,其中所述一種或多種酶選自:DNase1、片段化酶及其變體。
21.權(quán)利要求16的方法,其中所述片段具有10-10000個核苷酸的平均長度。
22.權(quán)利要求16的方法,其中所述片段具有100-2500個核苷酸的平均長度。
23.權(quán)利要求16的方法,其中所述片段具有50-500個核苷酸的平均長度。
24.權(quán)利要求12或13的方法,進一步包括執(zhí)行使用所述一個或多個連接的銜接體寡核苷酸作為模板來延伸所述靶多核苷酸的一個或多個3’末端的步驟。
25.權(quán)利要求24的方法,進一步包括在所述延伸步驟后使用第一引物和第二引物擴增所述靶多核苷酸,其中所述第一引物含有可以與一個或多個所述第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中所述第二引物含有可以與一個或多個所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
26.權(quán)利要求25的方法,其中一個或多個所述引物含有SEQID NO:1。
27.權(quán)利要求2 5的方法,其中一個或多個所述引物含有SEQID NO:2。
28.權(quán)利要求6的方法,其中每個所述第二銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。
29.權(quán)利要求28的方法,其中所述第一和第二銜接體寡核苷酸對包含不同的條碼序列。
30.權(quán)利要求28的方法,其中所述第一和第二銜接體寡核苷酸對包含相同的條碼序列。
31.權(quán)利要求1或5的方法,其中所述靶多核苷酸包含基因組DNA。
32.權(quán)利要求1或5的方法,其中所述靶多核苷酸包含線粒體DNA、葉綠體DNA、質(zhì)粒DNA、細菌人工染色體、酵母人工染色體,或其組合。
33.權(quán)利要求1或5的方法,其中所述靶多核苷酸包含cDNA。
34.權(quán)利要求1或5的方法,其中所述樣品包含由引物延伸反應(yīng)產(chǎn)生的靶多核苷酸。
35.權(quán)利要求8的方法,其中所述測序包括測序引物的延伸,所述測序引物含有可與所述第一銜接體寡核苷酸和/或所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
36.權(quán)利要求35的方法,其中所述測序引物含有SEQID NO:1或SEQ ID NO:2。
37.權(quán)利要求1或8的方法,其中所述測序包括校正步驟,其中所述校正基于所述條碼序列中的一個或多個核苷酸位點處的每個核苷酸。
38.權(quán)利要求1或5的方法,其中每個所述樣品包含少于500ng的核酸。
39.權(quán)利要求1或5的方法,其中所述多個條碼序列包括選自下組的序列:AAA、TTT、CCC 和 GGG。
40.權(quán)利要求1或5的方法,其中所述多個條碼序列包括選自下組的序列:AAAA、CTGC、GCTG、TGCT、ACCC、CGTA、GAGT、TTAG、AGGG、CCAT、GTCA、TATC、ATTT、CACG、GGAC 和 TCGA。
41.權(quán)利要求1或5的方法,其中所述多個條碼序列包括選自下組的序列:AAAAA、AACCC、AAGGG、AATTT、ACACG、ACCAT、ACGTA、ACTGC、AGAGT、AGCTG、AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTAA、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。
42.一種為多重測序配置的組合物,其包含:多個靶多核苷酸,每個靶多核苷酸包含選自多個條碼序列的一個或多個條碼序列,其中所述靶多核苷酸來自兩個或多個不同樣品,并且進一步地,其中可在組合測序反應(yīng)中基于所述靶多核苷酸的序列中所含的單一條碼以至少95%的準確度鑒定每個所述多核苷酸所源自的樣品。
43.權(quán)利要求42的組合物,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。
44.一種用于產(chǎn)生銜接體標記的靶多核苷酸的組合物,該組合物包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。
45.權(quán)利要求44的組合物,還包含多個第二銜接體寡核苷酸。
46.權(quán)利要求42或44的組合物,其中所述靶多核苷酸包含于流動池中。
47.權(quán)利要求44或45的組合物,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:1o
48.權(quán)利要求44或45的組合物,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:2。
49.權(quán)利要求44或45的組合物,其中一個或多個所述銜接體寡核苷酸包含發(fā)夾結(jié)構(gòu)。
50.權(quán)利要求44或45的組合物,其中一個或多個所述銜接體寡核苷酸包含寡核苷酸雙鏈體。
51.權(quán)利要求42或44的組合物,其中所述條碼序列的長度為至少3個核苷酸。`
52.權(quán)利要求44的組合物,其中所述第一銜接體寡核苷酸以4的倍數(shù)分組,從而在沿著每個條碼的每個位點處均勻呈現(xiàn)所有四種堿基。
53.權(quán)利要求45的組合物,其中每個所述第二銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。
54.權(quán)利要求53的組合物,其中所述第一和第二銜接體寡核苷酸對包含相同的條碼序列。
55.權(quán)利要求53的組合物,其中所述第一和第二銜接體寡核苷酸對包含不同的條碼序列。
56.權(quán)利要求49或50的組合物,還包含第一引物和第二引物,其中所述第一引物含有可以與一個或多個所述第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中所述第二引物含有可以與一個或多個所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
57.權(quán)利要求56的組合物,其中所述引物之一包含SEQID N0:1。
58.權(quán)利要求56的組合物,其中所述引物之一包含SEQID NO:2。
59.權(quán)利要求49或50的組合物,還包含測序引物,所述測序引物含有可與所述第一銜接體寡核苷酸和/或所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
60.權(quán)利要求42或44的組合物,其中所述多個條碼序列包括選自下組的序列:AAA、TTT、CCC 和 GGG。
61.權(quán)利要求42或44的組合物,其中所述多個條碼序列包括選自下組的序列:AAAA、CTGC、GCTG、TGCT、ACCC、CGTA、GAGT、TTAG、AGGG、CCAT、GTCA、TATC、ATTT、CACG、GGAC 和 TCGA。
62.權(quán)利要求42或44的組合物,其中所述多個條碼序列包括選自下組的序列:AAAAA、AACCC、AAGGG、AATTT、ACACG、ACCAT、ACGTA、ACTGC、AGAGT、AGCTG、AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTAA、GGAAG、GGCCT、GGGGA、GGTTC、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。
63.一種用于產(chǎn)生銜接體標記的靶多核苷酸的試劑盒,該試劑盒包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列;及其使用說明。
64.權(quán)利要求63的試劑盒,還包含多個第二銜接體寡核苷酸。
65.權(quán)利要求63或64的試劑盒,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:1
66.權(quán)利要求63或64的試劑盒,其中一個或多個所述銜接體寡核苷酸包含SEQID NO:2。
67.權(quán)利要求63或64的試 劑盒,其中一個或多個所述銜接體寡核苷酸包含發(fā)夾結(jié)構(gòu)。
68.權(quán)利要求63或64的試劑盒,其中一個或多個所述銜接體寡核苷酸包含寡核苷酸雙鏈體。
69.權(quán)利要求63的試劑盒,其中所述條碼序列的長度為至少3個核苷酸。
70.權(quán)利要求63的試劑盒,其中所述第一銜接體寡核苷酸以4的倍數(shù)分組,從而所有四種堿基沿著每個條碼在每個位點處均勻呈現(xiàn)。
71.權(quán)利要求64的試劑盒,其中每個所述第二銜接體寡核苷酸包含多個條碼序列中的至少一個,其中所述多個條碼序列中的每個條碼序列在至少三個核苷酸位點處不同于所述多個條碼序列中的所有其它條碼序列。
72.權(quán)利要求71的試劑盒,其中所述第一和第二銜接體寡核苷酸對包含相同的條碼序列。
73.權(quán)利要求71的試劑盒,其中所述第一和第二銜接體寡核苷酸對包含不同的條碼序列。
74.權(quán)利要求67或68的試劑盒,還包含第一引物和第二引物,其中所述第一引物含有可以與一個或多個所述第一銜接體寡核苷酸的互補序列的至少一部分雜交的序列,并且進一步地,其中所述第二引物含有可以與一個或多個所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
75.權(quán)利要求74的試劑盒,其中所述引物之一包含SEQID N0:1。
76.權(quán)利要求74的試劑盒,其中所述引物之一包含SEQID NO:2。
77.權(quán)利要求67或68的試劑盒,還包含測序引物,所述測序引物含有可與所述第一銜接體寡核苷酸和/或所述第二銜接體寡核苷酸的互補序列的至少一部分雜交的序列。
78.權(quán)利要求77的試劑盒,其中所述測序引物含有SEQID NO:1或SEQ ID NO:2。
79.權(quán)利要求63的試劑盒,還包含以下一個或多個:(a)DNA連接酶,(b)DNA依賴的DNA聚合酶,(c) RNA依賴的DNA聚合酶,(d)隨機引物,(e)在3’端包含至少4個胸苷的引物,(f)DNA核酸內(nèi)切酶,(g)具有3’到5’核酸外切酶活性的DNA依賴的DNA聚合酶,(h)多個引物,每個引物具有多個選定序列之一,(i)DNA激酶,(j)DNA核酸外切酶,(k)磁珠,(I)具有RNase H活性的酶,(m) RNA連接酶,和(η)適合所述試劑盒中包含的一個或多個元件的一種或多種緩沖液。
80.權(quán)利要求63的試劑盒,其中所述多個條碼序列包括選自下組的序列:AAA、TTT、CCC和 GGG。
81.權(quán)利要求63的試劑盒,其中所述多個條碼序列包括選自下組的序列:AAAA、CTGC、GCTG、TGCT、ACCC、CGTA、GAGT、TTAG、AGGG、CCAT、GTCA、TATC、ATTT、CACG、GGAC 和 TCGA。
82.權(quán)利要求63的試劑盒,其中所述多個條碼序列包括選自下組的序列:AAAAA、AACCC、AAGGG、AATTT、ACACG、ACCAT、ACGTA、ACTGC、AGAGT、AGCTG、AGGAC、AGTCA、ATATC、ATCGA、ATGCT、ATTAG、CAACT、CACAG、CAGTC、CATGA、CCAAC、CCCCA、CCGGT、CCTTG、CGATA、CGCGC、CGGCG、CGTAT、CTAGG、CTCTT、CTGAA、CTTCC、GAAGC、GACTA、GAGAT、GATCG、GCATT、GCCGG、GCGCC、GCTA A、GGAAG、GGCCT、GGGGA、GGTTG、GTACA、GTCAC、GTGTG、GTTTT、TAATG、TACGT、TAGCA、TATAC、TCAGA、TCCTC、TCGAG、TCTCT、TGACC、TGCAA、TGGTT、TGTGG、TTAAT、TTCCG、TTGGC 和 TTTTA。
83.—種產(chǎn)生銜接體標記的靶多核苷酸的方法,該方法包括: a)提供多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列A’的3’端,并且進一步地,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA和5個`或更多個末端DNA核苷酸;和, b)將至少一個所述第一銜接體寡核苷酸與至少一個所述靶多核苷酸連接。
84.權(quán)利要求83的方法,進一步包括使用能夠從RNA-DNA異雙鏈體上裂解RNA的酶來裂解RNA的步驟。
85.權(quán)利要求84的方法,進一步包括執(zhí)行使用所述一個或多個連接的銜接體寡核苷酸作為模板來延伸所述靶多核苷酸的一個或多個3’端的步驟。
86.權(quán)利要求83的方法,進一步包括將多個第二銜接體寡核苷酸中的至少一個與來自步驟(b)的每個所述樣品的所述靶多核苷酸連接,從而至少一個所述靶多核苷酸在一端包含所述第一銜接體寡核苷酸,并在另一端包含所述第二銜接體寡核苷酸。
87.權(quán)利要求86的方法,其中每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。
88.權(quán)利要求83的方法,其中每個所述第一銜接體寡核苷酸包含條碼序列。
89.一種用于產(chǎn)生銜接體標記的靶多核苷酸的組合物,該組合物包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列A’的3’端,并且進一步地,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA和5個或更多個末端DNA核苷酸。
90.權(quán)利要求89的組合物,還包括多個第二銜接體寡核苷酸,其中每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。
91.一種用于產(chǎn)生銜接體標記的靶多核苷酸的試劑盒,該試劑盒包含多個第一銜接體寡核苷酸,其中每個所述第一銜接體寡核苷酸包含含有序列A的5’端和含有序列A’的3’端,并且進一步地,其中A可與A’雜交,A或A’之一包含DNA,且A或A’中的另一個包含RNA和5個或更多個末端DNA核苷酸。
92.權(quán)利要求91 的試劑盒,還包含多個第二銜接體寡核苷酸,其中每個所述第二銜接體寡核苷酸包含含有序列B的5’端和含有序列B’的3’端,并且進一步地,其中B可與B’雜交,B或B’之一包含DNA,且B或B’中的另一個包含RNA和5個或更多個末端DNA核苷酸。
全文摘要
銜接體與靶多核苷酸連接以產(chǎn)生銜接體標記的多核苷酸。同時對銜接體標記的多核苷酸進行測序,并且基于條碼序列對樣品來源進行鑒定。
文檔編號G01N33/48GK103119439SQ201180038529
公開日2013年5月22日 申請日期2011年6月8日 優(yōu)先權(quán)日2010年6月8日
發(fā)明者克里斯多佛·萊蒙德, 努里斯·庫恩, 吉爾·馬格努斯 申請人:紐亙技術(shù)公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
苗栗市| 资阳市| 金塔县| 廉江市| 威宁| 若尔盖县| 江油市| 邵阳市| 金平| 天长市| 水富县| 定兴县| 长宁区| 沙洋县| 密云县| 南昌市| 宁武县| 垦利县| 镇平县| 麦盖提县| 象州县| 青岛市| 兴宁市| 会同县| 肥西县| 蒲城县| 油尖旺区| 高清| 屏南县| 大化| 绵竹市| 台中县| 武川县| 辰溪县| 惠安县| 原阳县| 昌黎县| 石泉县| 斗六市| 衢州市| 浮山县|