理以去除側(cè)翼(flap),隨后用連接酶修復平移的切口。
[0019]圖4顯示質(zhì)心、在參照基因組上的定位百分比,和在果繩(Drosophila)中經(jīng)歷以下處理的假陽性和假陰性率:1)用Nt.BspQI產(chǎn)生切口和PreCR修復,2)用Nb.BbVCI產(chǎn)生切口和PreCR修復。
[0020]圖5顯示用兩種酶進行雙色基因組作圖,包括IrysChip的布局(5A),納米通道中的線性化(5B),序列特異性位置處標記的分布(圖5C),共有序列圖譜的比對(5D),以及基于共有序列圖譜的重疊的基因組區(qū)域的圖譜(5E),如實施例4所述。
[0021]發(fā)明詳述
[0022]維持和恢復DNA鏈的完整性對獲得有利于復雜基因組作圖和信息密度的長標記分子是必不可少的。本文描述的方法提供了使脆性DNA位點的形成和DNA片段化最小化,使用切口方法(nicking approach)后恢復DNA的結(jié)構(gòu)完整性以及使DNA的信號含量最大化以生成高分辨率圖的方法。
[0023]本文描述的是可以與納米通道陣列結(jié)合使用以使DNA可再生且均勻地線性化的方法。除了改善的噪聲特性(例如,通過將DNA保留在溶液中而不是被粘附)之外,這些方法還需要通道加載和成像循環(huán)以產(chǎn)生高通量DNA讀數(shù)。在納米通道陣列上以單分子水平進行基因組作圖,克服了許多先前存在的技術(shù)的局限性,并深入地描述于Lam ET等(Genome mapping on nanochannel arrays for structural variat1n analysis andsequence assembly (用于結(jié)構(gòu)變化分析和序列組裝的納米通道陣列上的基因組作圖),NatB1technol 30:771-776, 2012)中,該文獻的全部內(nèi)容通過引用并入到本文中。本文描述的一些實施方案中,使用允許多個基序(motif)被不同顏色標記的基因組作圖方法,這顯著增加了信息密度。
[0024]在一些實施方案中,構(gòu)建了高分辨率物理圖。該物理圖可用于驗證或矯正使用另一方法如快照指紋分析技術(shù)(SNaPshot fingerprinting technology)生成的物理圖。在一些實施方案中,物理圖用于驗證組裝區(qū)域和糾正序列支架中的誤差。物理圖還可用于通過銷定序列支架(sequence scaffold)促進區(qū)域的序列從頭組裝。在一些實施方案中,物理圖用于產(chǎn)生高度準確的全序列組裝。
[0025]本文提供的一些實施方案中,切口標記用于制備用于分析的DNA。作為切口標記過程的一部分,切口可以彼此移動得更接近(如圖1A中所示)或離得更遠(如IB中所示)。在不被任一種理論限制的情況下,已發(fā)現(xiàn)當兩個切口在相反DNA鏈上相距〈1Kb時出現(xiàn)脆性位點。由于以下原因,脆性位點處發(fā)生片段化,例如:1)機械操作,2)標記需要的加熱,3)與標記和某些類型的修復有關(guān)的鏈延伸(例如利用聚合酶的核酸外切酶活性),或4)與使DNA分子線性化有關(guān)的剪切力。一般而言,切口之間的距離越短,片段化越頻繁,特別是如果標記減小了初始距離時更是如此(圖1A)。如本文中所述的,已發(fā)現(xiàn)修復切口可以改善DNA斷裂。因此,在一些實施方案中,在切口產(chǎn)生后修復DNA。然而,本文中也涉及在一些情況下,可在沒有修復切口的情況下,例如如果切口以非常低的頻率出現(xiàn),分析有切口且標記的DNA,從而使得產(chǎn)生脆性位點的可能性很低。因此,在一些實施方案中,在切口產(chǎn)生后不修復DNA,或在切口產(chǎn)生和標記后不修復DNA。
[0026]在一些實施方案中,本文描述的方法利用切口酶來產(chǎn)生序列特異性切口,之后該切口例如由熒光核苷酸類似物進行標記。在一些實施方案中,切口標記的DNA用嵌入染料(intercalating dye)著色,通過電場加載至納米流控芯片(nanofluidic chip),以及進行成像。在一些實施方案中,通過在納米通道陣列中的限制使DNA線性化,從而導致均勻的線性化并允許嚴格且精確地測量DNA分子上包含特征模式(signature pattern)的切口標記之間的距離。在一些實施方案中,可以自動化方式重復DNA加載和成像。在一些實施方案中,使用第二切口酶。在一些實施方案中,與第二標記色一起使用該第二切口酶??筛鶕?jù)本文中的實施方案使用的示例性切口酶包括但不限于Nb.BbvCI, Nb.BsmI, Nb.BsrDI,Nb.Bts1、Nt.Alwl、Nt.BbvC1、Nt.BspQ1、Nt.BstNBK Nt.CviPII 及其組合。在一些實施方案中,通過物理或化學方法例如暴露于電磁輻射(例如UV光)、一種或多種自由基等來產(chǎn)生斷裂(break)或切口。
[0027]在一些實施方案中,提供了減輕基于脆性位點的片段化的方法。在一些實施方案中,使用簡化的運行條件(reduced driving condit1n)以限制并入標記的速率,并因此最小化脆性位點處的片段化。在一些實施方案中,使用簡化的運行條件最小化與DNA伸長有關(guān)的剪切應力。在一些實施方案中,通過減小dNTP濃度,降低反應溫度,減小輔因子濃度,調(diào)節(jié)緩沖液和鹽濃度或其組合來簡化運行。還可以通過用高濃度dNTP刺激聚合酶的核酸外切酶活性,然后通過限制或省略至少一種核苷酸來限制延伸(可被稱為“靜止修復(choked repair) ”)而在修復水平簡化運行。在一個優(yōu)選實施方案中,在切口位點并入單一種類的dNTP(例如dATP),在沒有延伸的情況下,用側(cè)翼核酸酶去除側(cè)翼,并進行連接。
[0028]在一些實施方案中,使用用于嗜熱聚合酶的亞適溫來簡化運行條件。在一些實施方案中,反應溫度為約 35°C -約 75°C,如 35°C、36°C、37°C、38°C、39°C、40°C、41°C、42°C、43 °C、44°C、45 °C、46 °C、47 °C、48 °C、49 °C、50 °C、51 °C、52 °C、53 °C、54°C、55 °C、56 °C、57 °C、58 °C、59 °C、60 °C、61 °C、62 °C、63 °C、64 °C、65 °C、66 °C、67 °C、68 °C、69 °C、70 °C、71 °C、72 °C、73°C、74°C或75°C。在優(yōu)選的實施方案中,溫度為約50°C至約55°C、約55°C至約60°C、約60°C至約65°C或約50°C至約65 °C。
[0029]在一些實施方案中,本文使用的聚合酶是熱穩(wěn)定性的。在一些實施方案中,聚合酶是嗜溫的。在一些優(yōu)選的實施方案中,聚合酶沒有校正能力。在一些實施方案中,聚合酶具有鏈置換能力。在一些實施方案中,聚合酶具有5’ 一 3’核酸外切酶活性。在一些優(yōu)選的實施方案中,聚合酶沒有校正能力,但具有鏈轉(zhuǎn)換能力和5’ 一3’核酸外切酶活性。
[0030]在未被任一種理論限制的情況下,已發(fā)現(xiàn)切口平移標記期間,相反鏈上挨著的切口將彼此相對移動(導致片段化的“A型”不穩(wěn)定作用)或彼此遠離(隨著切口之間距離增加而引起的“B型”穩(wěn)定化作用)。在一些實施方案中,通過分別切口標記上游鏈(topstrand)和切口標記來自相同來源的對應DNA的下游鏈(bottom strand),將“A型”作用轉(zhuǎn)化為“B型”作用。在一些實施方案中,通過切口上游標記和切口下游標記來自相同來源的不同DNA,最小化脆性位點處的片段化。例如,可以在上游鏈上切口標記來自一個來源的第一份DNA,且可以在下游鏈上切口標記來自相同來源的第二份DNA。在一些實施方案中,用靶向相同序列基序但在相反鏈產(chǎn)生切口的切口酶靶向特異性DNA鏈,以使脆性位點的形成最小化。在一些實施方案中,已將切口酶修飾為僅與雙鏈DNA的一條鏈結(jié)合。在一些實施方案中,用切口酶靶向來自第一 DNA分子的單鏈和來自第二 DNA分子的單鏈。在這些實施方案中的一些實施方案中,通過第一切口酶靶向來自第一 DNA的單鏈,用與第一切口酶識別相同序列基序的第二切口酶靶向來自第二 DNA分子的互補鏈。在一些實施方案中,對于鏈中的一條,逆轉(zhuǎn)延伸的方向。例如,在一些實施方案中,對于第一 DNA分子而言,始于切口產(chǎn)生位點的延伸在一個方向發(fā)生,而對于第二 DNA分子而言,延伸在相反的方向上發(fā)生。在一些實施方案中,對于DNA分子的上游鏈而言,始于切口產(chǎn)生位點的延伸在一個方向上發(fā)生,而對于相同DNA分子下游鏈而言,則延伸在相反方向發(fā)生。
[0031 ] 在一些實施方案中,如本文所述,參照圖用于組裝。
[0032]在一些實施方案中,用多個切口酶最大化信息密度。在一些實施方案中,使用參照圖組裝被多個切口酶切口的分子。
[0033]在一些實施方案中,不只一個產(chǎn)生切口步驟(nicking step)用于使信息密度最大化。在一些實施方案中,使用參照圖組裝進行不只一個產(chǎn)生切口步驟的分子或多個分子。
[0034]在一些實施方案中,使DNA線性化。使DNA線性化的手段可包括使用液體流、毛管流、對流流的剪切力和電場、介電場、熱梯度、磁場、其組合(例如使用物理限制和電場)或本領域中技術(shù)人員已知的任何其它方法。在一些實施方案中,本文描述的通道具有微米級范圍的截面尺寸。在一些優(yōu)選實施方案中,通道具有納米范圍的截面尺寸。納米通道的實例和包括使用納米通道的方法提供于美國公開號2011/0171634和2012/0237936中,其全部公開內(nèi)容通過引入并入本文。
[0035]在一些實施方案中,研究了目的分子中的第二基序。在一些實施方案中,第二基序包括用于結(jié)合實體的至少一個結(jié)合位點,所述結(jié)合實體選自非切割限制酶、鋅指蛋白、抗體、轉(zhuǎn)錄因子、轉(zhuǎn)錄激活劑樣結(jié)構(gòu)域、DNA結(jié)合蛋白、聚酰胺、形成三股螺旋的寡核苷酸以及肽核酸。在一些實施方案中,用包含第二標記的結(jié)合實體實現(xiàn)第二基序的標記(labelling)或標記(tagging)。在一些實施方案中,用不切割或使DNA產(chǎn)生切口的標記進行標記。在一些實施方案中,用不切割或使DNA產(chǎn)生切口的標記進行標記。
[0036]在一些優(yōu)選的實施方案中,第二基序包括用于肽核酸的至少一個結(jié)合位點。在一些實施方案中,用包含第二標記的肽核酸實現(xiàn)標記。在其它實施方案中,第二基序包括用于甲基轉(zhuǎn)移酶的至少一種識別序列。在一些實施方案中,用甲基轉(zhuǎn)移酶進行標記。在一些實施方案中,用包含修飾的輔因子的甲基轉(zhuǎn)移酶進行加標簽,所述修飾的輔因子包括第二標記。
[0037]在一些實施方案中,使用修飾的輔因子。在一些實施方案中,修飾的輔因子含有作為與甲基轉(zhuǎn)移酶識別序列共價偶聯(lián)的可轉(zhuǎn)移標簽的第二標記。在其它實施方案中,修飾的輔因子含有與甲基轉(zhuǎn)移酶識別序列直接偶聯(lián)的第二標記。
[0038]在一些實施方案中,本文描述的標記選自焚光團、量子點、樹狀聚體、納米線、珠、半抗原、鏈霉親和素、抗生物素蛋白、中性親和素(neutravidin)、生物素或反應性基團。在一些優(yōu)選實施方案中,本文描述的第一和第二標記選自熒光團或量子點。
[0039]在一些實施方案中,本文描述的至少一種標記包括非光學標記。各種非光學標記可與本文的實施方案結(jié)合使用。在一些實施方案中,非光學標記包含電子標記。示例性電子標記包括但不限于具有強電荷的分子,例如離子諸如金屬離子、帶電氨基酸側(cè)鏈或其它陽離子或陰離子。當將標記置于檢測器中時,可例如通過導電性(或電阻率)來檢測電子標記。在一些實施方案中,納米通道包含電極,該電極被配置來通過測定通道中設置的物質(zhì)的導電性或電阻率來確定電子標記是否存在。在一些實施方案中,非光學標記包含金屬、金屬氧化物(例如金屬氧化物)或氧化硅部分。在一些實施方案中,非光學標記包含含金屬、金屬氧化物或其它氧化物的部分(例如納米顆粒)??梢岳缤ㄟ^核磁共振檢測特定金屬或氧化物部分的存在。在一些實施方案中,標記被配置為根據(jù)特定條件(例如,PH變化)釋放部分,例如質(zhì)子或陰離子,并檢測釋放的部分是存在還是不存在。
[0040]在一些實施方案中,兩種或多種標記是相同的。例如,如果標記和表征第一 DNA且標記和表征第二 DNA,可以用相同種類的標記例如相同焚光團、相同量子點或相同非光學標記來標記第一 DNA和第二 DNA。舉例來說,第一 DNA的特征在于第一納米通道,第二 DNA的特征在于第二納米通道,所以即使用相同標記部分標記各DNA時,也可將兩種DNA的標記模式區(qū)分開。在一些實施方案中,例如如果在兩種或多種不同基序標記單個DNA時,第一標記和第二標記是不同的。
[0041]具有可逆終止子的核苷酸能形成第一磷酸二酯鍵,但在終止子逆轉(zhuǎn)之前,不能形成(或具有有限能力以形成)第二磷酸二酯鍵。因此,具有可逆終止子的核苷酸可并入多核苷酸(例如在切口位點),但直到終止子逆轉(zhuǎn),該核苷酸才可形成下游磷酸二酯鍵??梢允褂帽绢I域技術(shù)人員已知的技術(shù)進行逆轉(zhuǎn)。例如,可通過能被切割的可切割連接子,例如通過電磁輻射,將終止子附著至核苷酸。如果使用包含3’可逆終止子的標記核苷酸進行切口修復,可將單個標記的核苷酸并入切口,但終止子可防止其它標記的核苷酸并入切口。因此,可將切口標記限于每一切口一個標記的核苷酸。將切口標記限制為每一切口一個標記部分,能使被并入相同切口的多個標記的潛在偏差最小化。例如,如果采取方法將標記限制為每一切口一個標記部分,基于來自標記的相對強信號可解析非常接近的兩個切口(即可以消除兩個標記簡單并入相同切口的可能性)。例如,如果