專利名稱:減少連接適配器的限制性片段中重復序列的方法
技術領域:
本發(fā)明涉及一種降低基因組中重復序列數(shù)量的方法,本發(fā)明涉及富集低拷貝序列樣本的方法。本發(fā)明進一步涉及基于復性動力學的分級在富集低拷貝序列的連接適配器的限制性片段中的應用。本發(fā)明進一步涉及雙鏈特異的核酸酶(DSN)在富集低拷貝序列的連接適配器的限制性片段中的應用。本發(fā)明進一步涉及富含低拷貝片段的樣本在指紋分析、 尋找SNP和標記開發(fā)中的應用。
背景技術:
很多的基因組,特別是植物基因組,含有重復序列,即,DNA的部分,無論大小,在基因組的多處重復。特別是當基因組的尺寸增加時并且特別是植物基因組中,其中基因組可以具有很大的尺寸(例如,擬南芥(Arabidopsis thaliana)單倍體基因組為130Mb,水稻 (Oryza sativa)單倍體基因組為430Mb,玉米(Zea Mays)單倍體基因組為MOOMb,大麥單倍體基因組為5300Mb,洋蔥單倍體基因組為15000Mb)。有些基因組如胡椒和玉米基因組被認為含有多達80%的重復序列。AFLP(EP534858,Vos等人1995)在技術上成功地開發(fā)了與特定的性狀(trait)或 QTL相關的標記以及SNP的鑒定。為了隨后開發(fā)這種AFLP標記或SNPs為PCR標記,所述PCR 標記為能夠用于一般PCR分析的標記,不得不轉(zhuǎn)換標記或SNP。這種轉(zhuǎn)換是艱辛的過程,很多情況下并不成功(Brugmans 等人.Nucleic Acids Research 2003 31(10) :e55),特別是由于基因組中存在重復序列。重復序列并不能提供與性狀或定量性狀位點(Quantitative trait locus,QTL)相關的有用標記或SNP。其自身并不一定產(chǎn)生問題,但是重復序列的存在阻礙了后來的AFLP標記向PCR標記的轉(zhuǎn)換。因此,有必要富集從DNA樣本中得到的低拷貝序列的限制性片段混合物,因為這能增加成功轉(zhuǎn)換至PCR標記的可能性,從而改善用于性狀的基因標記開發(fā)的效能。
發(fā)明內(nèi)容
本發(fā)明人現(xiàn)在發(fā)現(xiàn)了將AFLP技術、DNA再聯(lián)合動力學和DSN標準化的要素結合起來提供一種有效的并且可靠的富集DNA樣本低拷貝序列的方法。根據(jù)本發(fā)明,富集低拷貝的序列按如下方法實現(xiàn)使用第一種限制性內(nèi)切酶從DNA樣本中提供連接適配器的限制性片段,將所述連接適配器的限制性片段進行基于復性動力學的分級,將分級的部分暴露于 DSN,用第二種限制性內(nèi)切酶限制性消化剩余的片段,將第二種適配器連接到限制性內(nèi)切的片段上,從而得到初始DNA的富含低拷貝的部分。定義在以下的說明和實施例中,使用了一些術語。為了提供對說明書和權利要求書 (包括這些術語給予的范圍)的清楚和一致的理解,提供了以下定義。除非此處特別定義, 本文使用的所有技術和科學術語與本發(fā)明所屬的技術領域的一般技術人員一般理解的意思相同。所有公開出版物、專利申請、專利和其他參考文獻的內(nèi)容通過引用將其全文并入此處。AFLP =AFLP指一種選擇性擴增核酸的方法,其基礎是用一種或多種限制性內(nèi)切酶消化核酸以產(chǎn)生限制性片段,將適配器與限制性片段連接,用至少一個引物擴增連接適配器的限制性片段,所述引物與適配器(部分)互補、與限制性內(nèi)切酶的剩余部分(部分)互補且進一步在引物的3’末端含有至少一個隨機選自A、C、T或G(或者有些情況下為U)的核苷。AFLP并不需要任何在先的序列信息,并且可在任何起始DNA上進行。一般而言,AFLP 包括以下步驟(a)用一種或多種特異的限制性內(nèi)切酶消化核酸,特別是DNA或eDNA,將DNA片段化成一系列相應的限制性片段;(b)將因此獲得的限制性片段與雙鏈合成寡核苷酸適配器連接,該雙鏈合成寡核苷酸適配器的一端與限制性片段的一端或兩端相容,從而產(chǎn)生連接適配器的初始DNA的限制性片段;(C)在雜交條件下將連接適配器的限制性片段與一個或多個在其3’末端含有可選核苷的寡核苷酸引物接觸;(d)通過PCR或類似的技術擴增與引物雜交的連接適配器的限制性片段,從而使雜交引物沿著被引物雜交的初始DNA的限制性片段延伸;以及(e)檢測、鑒定或回收因此得到的被擴增或延長的DNA片段。因此,AFLP提供了可重現(xiàn)的連接適配器的片段亞類。AFLP在EP 534858, US 6045994 以及 Vos 等人 1995. AFLP :a new technique for DNA fingerprinting. Nucleic Acids Research 23(21) :4407-4414中被描述。關于AFLP進一步的詳情參見這些文獻。 AFLP通常被用作降低復雜性的技術以及DNA指紋技術。在AFLP作為指紋技術應用的情況下,開發(fā)了 AFLP標記的概念。AFLP標記AFLP標記是被擴增的連接適配器的限制性片段,其在使用AFLP(指紋)、使用引物的相同對擴增的兩種樣本間不同。這樣,存在或不存在該被擴增的連接適配器的限制性片段可被用作與性狀或表型相關的標記。通過應用傳統(tǒng)的平板凝膠電泳,AFLP 標記在凝膠中顯示為具有某種移動性的條帶。其他的電泳技術如毛細管電泳也許不能稱之為條帶,但概念是相同的,即,具有某種長度和移動性的核酸。條帶的存在或不存在可作為表型存在或不存在的指標(或相關聯(lián))。AFLP標記典型地在內(nèi)切酶(1型)或可選擇的核苷酸0型)的限制性位點包含多態(tài)性。偶爾的,AFLP標記在限制性片段中包含indel (插入-缺失突變)(3型)。可選擇的堿基或可選擇的核苷酸位于含有一個與適配器互補的部分和一個與限制性位點的剩余部分互補的引物的3’末端,可選擇性的堿基隨機地選自A、C、T或G(或者有些情況可以是U)。通過用可選擇的堿基延長引物,接下來的擴增將僅僅提供可重現(xiàn)的連接適配器的限制性片段亞類,即,僅僅是能被帶有可選擇的堿基的引物擴增的片段??蛇x擇的核苷酸可被加到引物的3’末端,數(shù)量是1到10之間。典型地,1-4個足夠。兩個引物都可含有不同數(shù)量的可選擇的堿基。每加入一個可選擇的堿基,亞類減少了亞類中被擴增的連接適配器的限制性片段的數(shù)量的因素大約為4。典型地,用于AFLP的可選擇堿基的數(shù)量用+N/+M表示,其中一個引物帶有N個可選擇的核苷酸,另一個引物帶有M個可選擇的核苷酸。因此,EcoRI/Msel+l/+2AFLP是用EcoRI和Msel消化初始DNA,連接適當?shù)倪m配器,用一個針對EcoRI限制性位點的帶一個選擇性堿基的引物和另一個針對Msel限制性位點的帶有2個選擇性核苷酸的引物擴增的速寫。用于AFLP的在3’末端帶有至少一個可選擇的核苷酸的引物也被稱為AFLP引物。在其3’末端不帶可選擇的核苷酸并且其實際上與適配器和限制性位點的剩余部分互補的引物有時被稱為AFLP+0引物。術語可選擇的核苷酸也被用于指位于臨近適配器部分并已通過使用選擇性引物識別從而使其核苷酸已知的靶序列的核苷酸。測序術語測序指測定核酸樣本(例如DNA或RNA)中核苷酸的順序(堿基序列)。 有很多技術可以應用,如Sanger測序以及高通量測序技術,如妨4技術(Roche Applied Science)、lllumina Inc.以及 AppliedBioSystems、Helicos 等提供的技術。限制性內(nèi)切酶限制性內(nèi)切酶或限制性酶是識別雙鏈DNA分子中特定核苷酸序列 (靶位點)的酶,其在每個靶位點或接近每個靶位點切斷DNA分子的雙鏈,留下一個平末端或一個粘末端。常見的切酶或稀少的切酶限制性酶典型地識別具有3、4(如Msel)至6 (EcoRI) 甚至是S(Notl)個不同數(shù)量的核苷酸的序列。使用的限制性酶可以是常見的或稀少的切酶。術語‘常見的’在這方面典型地與術語‘稀少的’相關使用。常見的切割內(nèi)切酶(aka常見的切酶)是具有相對短的識別序列的限制性內(nèi)切酶。常見的切酶典型地識別和隨后切斷 3-5個核苷酸。因此,常見的切酶平均每64-512個核苷酸切一次DNA序列。稀少的切酶是具有相對長的識別序列的限制性內(nèi)切酶。稀少的切酶典型地識別和隨后切斷6個或更多核苷酸。因此,一個稀少的6-切酶平均每IOM個核苷酸切一次DNA序列,產(chǎn)生較長的片段。再一次觀察到常見的和稀少的定義是彼此相對的,意思是當使用一個4bp的限制性酶如MseI 和一個具有5位切酶如Avail時,Avail被視為稀少的切酶而MSeI被視為常見的切酶。限制性片段用限制性內(nèi)切酶消化產(chǎn)生的DNA分子被稱為限制性片段。任何指定的基因組(或核酸,不考慮其起源)都可被特定的限制性內(nèi)切酶消化成分散的限制性片段組。通過限制性內(nèi)切酶切割得到的DNA片段可進一步被用于各種技術中,例如,通過凝膠電泳被檢測。連接在被連接酶催化的酶反應中雙鏈DNA分子被共價連接起來,這被稱為連接。 一般而言,DNA的兩條鏈都被共價連接到一起,但也可以通過化學地或酶法修飾鏈的一個末端從而阻止兩條鏈中的一條的連接。在那種情況下,共價連接僅發(fā)生在DNA雙鏈中的一條。合成的寡核苷酸具有優(yōu)選大約10至大約50個堿基的單鏈DNA分子,其可被化學合成,稱為合成的寡核苷酸。雖然也可以合成在核苷酸序列中的特異位點具有不同的核苷酸組成的且具有相關序列的分子家族,通常,這些合成的DNA分子被設計成具有獨特的或所要的核苷酸序列。術語合成的寡核苷酸被用于指具有設計的或所需的核苷酸序列的DNA 分子。適配器帶有限定數(shù)量的堿基對的短雙鏈DNA分子,例如,長度大約10至大約30 個堿基對,如此設計是為了其可被連接至限制性片段的末端。適配器通常由2個合成的寡核苷酸組成,其具有部分相互互補的核苷酸序列。當在適當?shù)臈l件下在溶液中混合2種合成的寡核苷酸時,它們彼此退火以形成雙鏈結構。退火后,適配器分子一端被設計以使其與限制性片段末端相容從而連接到其上;適配器的另一端也可以被設計以使其不能被連接, 但并不需要這樣(雙連接的適配器)。
連接適配器的限制性片段帶上適配器帽子的限制性片段。弓丨物一般而言,術語引物指能起始DNA合成的合成DNA分子。沒有引物,DNA聚合酶不能從新合成DNA 其僅能延長反應中存在的DNA,其中互補鏈被用作模板來指導被組裝的核苷酸的順序。我們把聚合酶鏈反應(PCR)中應用的合成的寡核苷酸分子稱為引物。DNA擴增術語DNA擴增典型地被用于指通過應用提供雙鏈DNA的PCR或提供單鏈DNA的如GenomiWii/R印IiG的其他擴增方法的DNA分子的體外擴增。應該注意還存在其他的擴增方法,其也可以不偏離本發(fā)明的要旨而被用于本發(fā)明。重復序列重復序列是在DNA或基因組中有多次、但至少是2次或更多次重復的序列。高重復序列高重復的序列是典型地在DNA或基因組中重復成百上千次的序列。例子如串聯(lián)重復,如衛(wèi)星DNA、小衛(wèi)星以及微衛(wèi)星,和散開的重復,如SINES (短散布元件)和 LINE (長散布元件),(反轉(zhuǎn)錄)轉(zhuǎn)座子。低拷貝序列,低拷貝數(shù)的序列,獨特的序列在基因組中僅發(fā)生有限拷貝數(shù)(或僅有一個拷貝)的序列,其可被用作與表型相關的標記。低拷貝部分其重復序列被減少因此富含低拷貝序列的DNA樣本的部分,即,重復序列被去除的部分。DSN (雙鏈特異的核酸酶)特異性切割雙鏈DNA序列的核酸酶(Siagin等人2002 Genome Research 12 1935-1945,Zhulidov 等人 2004 NAR 32 3 e37)?;趶托詣恿W的分級在DNA樣本中將低拷貝序列從高拷貝或重復序列中分離出來的技術。步驟包括加熱基因組DNA樣本至其變性為單鏈形式,然后將其慢慢冷卻,使得鏈重新配對。在樣本冷卻的時候,可以測量在每一溫度下有多少DNA堿基配對。通過減緩再組合的快速稀釋樣本、隨后將DNA結合至氫氧磷灰石柱來測量單鏈和雙鏈DNA的量。可洗脫柱,以先洗脫單鏈DNA、隨后洗脫雙鏈DNA。使用分光光度計測量這兩種溶液中DNA的量。由于單鏈DNA序列需要找到其互補鏈以再形成雙螺旋,一般序列比稀少序列復性更快。實際上,序列再結合的速率與DNA樣本中的序列拷貝數(shù)成比例。具有高重復序列的樣本復性快,而復雜序列復性慢??墒?,并不是簡單測量雙鏈DNA對時間的百分比,通常相對于Qt值測量復性的量。Qt值是Ctl (起始DNA濃度)、t (以秒計的時間)和一個取決于緩沖液中陽離子濃度的常數(shù)的產(chǎn)物。重復DNA以低CJ值復性,而復雜和獨特的DNA序列以高CJ值復性。C0t過濾=Qt過濾是應用DNA復性動力學的原理從“富含基因”的單/低拷貝序列中分離控制很多真核基因組的重復DNA序列的技術。這允許DNA測序,來濃縮最有信息性和最感興趣的基因組的部分,其將加速發(fā)現(xiàn)新的基因并使方法更有效(Peterson DG, Wessler SR, Paterson AH(2002). “ Efficient capture of unique sequences from eukaryotic genomes 〃 . Trends Genet. 18(11) :547-50, LLamoureux D,Peterson DG, Li W, Fellers JP, Gill BS(2005). “ The efficacy of Cot-based gene enrichment in wheat(Triticum aestivum L.) “ . Genome 48(6) :1120-6.,Yuan Y,SanMiguel PJ, Bennetzen JL (2003). “ High-Cot sequence analysis of the maize genome“ . Plant J. 34(2) :249-55o
圖1胡椒E33/M49和胡椒P14/M60的胡椒結果。
圖2玉米E35/M48和玉米P12/M50的玉米結果。圖 3CQt_DSN 方案。
具體實施例方式因此,發(fā)明的第一個具體實施方案涉及減少連接適配器的限制性片段中的重復序列(增加低拷貝序列的(相對)數(shù)量)的方法,其包括下列步驟a.用第一種限制性內(nèi)切酶限制性消化樣本中初始DNA,將第一適配器連接于限制性片段,來得到連接適配器的限制性片段;b.對步驟(a)中得到的連接適配器的限制性片段進行基于復性動力學的分級;c.將步驟(b)的復性部分加到雙鏈特異的核酸酶(DSN)中;d.用第二種限制性內(nèi)切酶限制性消化步驟(C)得到的限制性片段,將第二適配器連接至限制性片段;e.得到初始DNA的富含低拷貝的部分。根據(jù)本發(fā)明的方法結合了 AFLP的某些要素(使用限制性酶和適配器連接生成了連接適配器的限制性片段)和基于復性動力學的分級的某些要素(允許高拷貝序列復性以變成雙鏈,但低拷貝序列仍保持單鏈),使用DSN去除雙鏈序列,以及又一次的AFLP(用第二種限制性酶進一步生成連接適配器的限制性片段。結果是獲得了富含低拷貝序列并降低了高的重復序列的數(shù)目的初始DNA部分。在根據(jù)本發(fā)明的方法的步驟(a)中,用限制性內(nèi)切酶處理初始DNA。初始DNA可以是任何DNA,如基因組DNA、cDNA、BAC DNA、線粒體DNA、葉綠體DNA或含有線粒體和葉綠體 DNA的植物基因組DNA的混合物。第一限制性內(nèi)切酶消化初始DNA以生成限制性片段。第一限制性內(nèi)切酶優(yōu)選稀少的切酶,如生成典型的尺寸范圍為1-41Λ之間的限制性片段的六切酶,如EcoRI、EcoRII、BamHI、HindiII, Pstl,在如多數(shù)植物種的富含AT的有機體中使用如EcoRI (識別序列GAATTC)的富含AT內(nèi)切酶。將第一適配器連接到這些限制性片段上以生成連接適配器的限制性片段。在根據(jù)本發(fā)明的方法的步驟(b)中,將連接適配器的限制性片段進行基于復性動力學的分級。因此,加熱連接適配器的限制性片段直至其變性為單鏈形式,然后緩慢冷卻, 這樣鏈能重新配對在一起。由于使用了限制性內(nèi)切酶,連接適配器的限制性片段典型地在相同的長度范圍內(nèi),因此在可測定的時間內(nèi)重復序列再退火而低拷貝序列能更長時間地保持單鏈。在冷卻持續(xù)足夠長的時間后,再退火性被停止,例如通過強制冷卻。在本領域公開的基于復性動力學的分級中,通常通過減慢再組合的快速稀釋樣本、以及而后的將DNA結合至氫氧磷灰石柱上、然后洗脫單鏈和雙鏈DNA部分來測量單鏈和雙鏈DNA的量。在本發(fā)明一個優(yōu)選的具體實施方案中,可通過在方法的步驟(C)中使用雙鏈核酸酶(直接)處理樣本避免使用柱和將獲得實質(zhì)上分別含有單鏈或雙鏈DNA的部分的中間分離。雙鏈核酸酶特異地切割雙鏈DNA序列(Shagin等人2002 Genome Research 12 1935-1945,Zhulidov等人2004 NAR 32 3 e37)。由于大部分重復序列現(xiàn)在是雙鏈形式的, 減少了樣本中重復序列來源的連接適配器的限制性片段(或者增加了低拷貝或獨特序列來源的連接適配器的限制性片段)。無論在可選的步驟(C)中是否用DSN處理,都對步驟(b)的復性部分進行本發(fā)明方法的步驟(d),以用限制性內(nèi)切酶進行第二次消化,然后連接對應于內(nèi)切酶的適配器。在一個優(yōu)選的具體實施方案中,得到的連接適配器的限制性片段在限制性片段的每一端帶有一個不同的適配器。因此本發(fā)明的方法的結果是得到了一組富含低拷貝DNA的連接適配器的限制性片段(或顯著地降低了重復DNA的相對發(fā)生)??蓪⒌玫降倪B接適配器的限制性片段用于隨后的指紋技術中,如AFLP,用于SNP 探測等。因此,在一個具體實施方案中,得到的低拷貝DNA樣本可選擇地被擴增和指紋化以得到更高質(zhì)量的指紋。CQt方法學本身在cDNA庫的標準化中是熟知的,也與DSN聯(lián)合。典型地,以或多或少的隨機的方式通過剪切或片段化DNA得到Qt片段。在CJ分析之前,通常選擇片段的大小以減小不利于得到所需結果的大片段比小片段復性快的效果?,F(xiàn)在,通過在Qt處理前的第一內(nèi)切酶的限制性消化和適配器連接以及進一步的片段化,片段的大小更加可控并通常位于更加限定的大小范圍。在另一方面,使用兩種酶(因此2個適配器)進行內(nèi)切酶限制性消化將導致太大的長度擴展(在900-50的區(qū)域)。通過執(zhí)行具有第一限制性消化步驟、 然后的Qt處理以及隨后的限制性消化步驟的方法,Qt處理在一組連接適配器的限制片段上進行,其比含有寬范圍的巨大和小連接適配器的片段的片段混合物具有更均一的復性動力學。本發(fā)明的方法在增加AFLP標記(或其他標記)轉(zhuǎn)換為例如PCR標記以及在發(fā)現(xiàn)可被用于全基因組DNA分析的有用SNP中的成功率中特別有用。實施例現(xiàn)在用下面的實施例解釋本發(fā)明。應該明確本領域技術人員可能改變本方案而不偏離本發(fā)明的要旨。1、瓊脂糖凝膠為了 DNA質(zhì)量/完整性的檢測,將5 μ 1 DNA(RNA酶處理過的!)加樣于1 %瓊脂糖凝膠。2、Nanodrop 定量為了精確定量DNA,如果必要,干燥并重懸/真空加速濃縮DNA至lOOOng/μ 1(最低濃度IHng/μ 1)。3、EcoRI DNA 消化(60 μ g DNA)
試劑
60μ§ DNA EcoRI
One-Phor-All
BSA
DTT
MilliQ 水
總體積
濃度 1000ng/pL 50 U/pL IOx 10 mg/pL 1 M
樣本 60μ1 6 pL 60 μL 3 μ 3 μ . 在37°C下處理樣本6小時
權利要求
1 一種降低連接適配器的限制性片段中重復序列(增加低拷貝序列的(相對)數(shù)量) 的方法,包括以下步驟a.用第一種限制性內(nèi)切酶限制性消化樣本中的初始DNA,將第一種適配器連接至限制性片段,以得到連接適配器的限制性片段;b.對步驟(a)中得到的連接適配器的限制性片段進行基于復性動力學的分級;c.選擇地,將步驟(b)中的被復性的部分加于雙鏈特異性核酸酶(DSN);d.用第二種限制性內(nèi)切酶限制性消化步驟(b)或(c)得到的限制性片段,將第二種適配器連接至限制性片段;e.從初始DNA得到連接適配器的限制性片段的富含低拷貝部分。
2.根據(jù)權利要求1所述的方法,其中第一種限制性內(nèi)切酶是稀少的切酶。
3.根據(jù)權利要求1或2所述的方法,其中第二種限制性內(nèi)切酶是常見的切酶。
4.根據(jù)權利要求1-3所述的方法,其中基于復性動力學的分級是Qt。
5.根據(jù)權利要求4所述的方法,其中Qt的值是320。
6.根據(jù)權利要求1-5所述的方法,其中通過使用可選的在3’末端的具有1-10個選擇性核苷酸的針對適配器的引物擴增從初始DNA得到的連接適配器的限制性片段的低拷貝部分。
7.根據(jù)上述權利要求任一項所述的方法,其中初始DNA是基因組DNA、cDAN、BACDNA、 線粒體DNA、葉綠體DNA或具有線粒體DNA和葉綠體DNA的植物基因組DNA的混合物。
8.根據(jù)上述權利要求任一項所述的方法,其中通過使用包括雙鏈特異性核酸酶的處理進行DSN標準化。
9.根據(jù)權利要求1-8所述的方法在生成富含低拷貝序列的AFLP指紋中的應用。
10.根據(jù)權利要求1-8所述的方法作為標記轉(zhuǎn)換或?qū)ふ襍NP之前DNA樣本的處理的應
全文摘要
本發(fā)明涉及一種減少DNA樣本中重復序列(或者改善低拷貝序列)的方法,該方法組合了限制性內(nèi)切酶處理、隨后的適配器連接、基于復性動力學的分級以及任選地偶聯(lián)的雙鏈序列核酸酶及進一步的內(nèi)切酶處理,以及隨后的適配器連接。在進一步的DNA分析中可使用富集的低拷貝的部分。
文檔編號C12N15/00GK102239258SQ200980148710
公開日2011年11月9日 申請日期2009年11月25日 優(yōu)先權日2008年12月4日
發(fā)明者D·特雷比, M·J·T·范艾克 申請人:凱津公司