專利名稱:保持序列的dna轉化的制作方法
技術領域:
本發(fā)明涉及按照預定的核苷酸密碼轉化靶核酸分子的方法。隨后可將轉化的核酸用于測定靶分子的核苷酸序列。相關申請的交叉引用本申請根據(jù)35U. S.C. 119(e)的規(guī)定要求在2008年10月四日提交的美國臨時專利申請系列No =61/109, 298的權益,該專利申請的全部內容以引用的方式并入本文。
背景技術:
第一參考人類基因組序列的開創(chuàng)性成就(國際人類基因組測序組織 (International Human Genome Sequencing Consortium)Nature2001 ;490 :860-921 ; Venter JC, Adams MD, Myers Eff, Li Pff, Mural RJ, Sutton GG 等人 kience 2001 ;291 1304-51)標志了其中基因組變異直接影響藥物研發(fā)和藥物治療時代的開端。該新范例已滋生了對DNA測序的低成本且超快速的方法的需求。據(jù)認為,在不久的將來,執(zhí)業(yè)醫(yī)師將能夠在開藥方之前在臨床環(huán)境下對個體患者的DNA進行常規(guī)分析??蓪Ρ绕渲杏涗浟伺c任何藥物相關的基因組信息的在線數(shù)據(jù)文庫來檢查獲自個體的序列信息。此外,可支付得起的測序技術將改觀比較基因組學和分子生物學的研究,從而使得科學家快速測序來自細胞變異體的完整基因組。為了實現(xiàn)超快速且低成本的DNA測序, 需要革命性的技術來取代基于Sanger的“雙脫氧”方案(Shendure J,Mitra RD, Varma C, Church GM-Nat Rev Genet 2004 ;5 =335-44)的經(jīng)典方法?;赟anger法的現(xiàn)代測序通常產生具有低質量的前15至40個堿基、不超過700至900個堿基的高質量區(qū)域和接著質量快速變差的余下序列的序列。新型測序技術需要解決2個主要問題。第一,應當將樣品大小減小至最小,從而使得能夠從單個DNA分子或少量拷貝讀出序列。第二,與現(xiàn)有最新技術相比,應當使讀出速度增加數(shù)個數(shù)量級。近年來,納米孔已被廣泛用作靈敏的單生物分子檢測器。已顯示出,可電泳驅動單鏈DNA分子以單列的方式通過1.5-nm α-溶血素納米孔。該方法稱為DNA易位 (Kasianowicz J, Brandin E, Branton D, Deamer D.Proc Natl Acad Sci USA 1996 ;93 13770-3 ;Akeson M,Branton D,Kasianowicz J,Brandin Ε,Deamer D.Biophys J 1999 ;77 3227-33 ;Meller A,Nivon L,Brandin E,Golovchenko J,Branton D. Proc Natl Acad Sci USA 2000;97:1079-84)。該領域中的推動理念之一是納米孔可用于DNA序列的直接電子讀出(Deamer Dff, Akeson M. Tibtech 2000 ;18 :147-50.)。然而,早期研究已指出,在納米孔可被用于單分子測序之前必須解決若干突出的問題(Meller A等人(2000),同上Meller A, Nivon L, Branton D. Phys Rev Lett 2001 ;86 :3435-8)。具體來講,快速的 DNA 易位速度和4種堿基類型的電信號之間的低反差已阻礙了單個核苷酸的分化。納米孔測序的主要優(yōu)勢是可使用納米孔直接探測單個DNA分子而無需DNA分子的擴增,所述DNA分子的擴增是易錯的、低通量的并且成本高。然而,目前納米孔測序技術不具有單核苷酸分辨率。雖然已經(jīng)取得了很大的進展,但仍未明確地確定可通過納米孔分辨的最少堿基數(shù)目。我們的方法已將核酸序列轉化成可被轉化的更長的序列,以便序列得到保持。然后,更長的序列可通過納米孔直接地讀取。因此,進行轉化的方式必須是快速的、 高度可靠的和低成本的,并且需要開發(fā)進行該類轉化的新方法。發(fā)明概述本文描述了轉化靶單鏈DNA(ssDNA)以便每個核苷酸(或堿基)腺嘌呤㈧、胸腺嘧啶(T)、鳥嘌呤(G)和胞嘧啶(C)被轉化成預定的寡核苷酸密碼同時序列順序在轉化的 ssDNA中得以保持的低成本高通量的方法。還可通過適當?shù)母倪M以使得該方法適用于轉化RNA。所述方法涉及具有重復的連接和切割循環(huán)的寡核苷酸探針文庫的用途。在每個循環(huán)中,切割例如ssDNA的靶的一端(例如,5'末端或3'末端)上的一個或多個核苷酸,然后將其與該靶ssDNA的另一端上的相應寡核苷酸密碼連接。所述方法在循環(huán)過程中不需要使用DNA聚合酶,這消除了通過聚合酶將錯誤引入序列中(參見例如,T. Sjoblom等人, Science 314,268(2006)).本發(fā)明的一個實施方案允許在相對短的時間內(例如,數(shù)天以內,在一些實施方案中1天以內)測定例如完整人類基因組的序列。在一個實施方案中,通過可進一步結合分子信標的預定的寡核苷酸密碼來分隔被轉化的核苷酸。從而在一個實施方案中,可通過使用納米孔測定轉化的單鏈核酸分子(例如,ssDNA)的序列,其中當轉化的ssDNA鏈移動通過納米孔時每次除去一個結合的分子信標。除去分子信標產生閃光,該閃光翻譯成靶單鏈核酸分子的序列。由于更長的預定的寡核苷酸密碼(每個密碼對應于在例如靶ssDNA中的每個核苷酸A、C、T或G)被整合入靶 ssDNA分子,因此本文所描述的方法不需要在單個核苷酸水平上的檢測,從而克服了基于納米孔的測序的主要挑戰(zhàn)之一。本文所描述的本發(fā)明的方法允許利用在單分子水平上有用的任何測序方法快速測序(即,測序不限于納米孔測序)。本文所描述的方法的一個方面涉及DNA轉化。這涉及通過將雙鏈或T形探針與靶 ssDNA連接,利用II型限制性內切酶消化來形成包含靶單鏈DNA(ssDNA)的環(huán)狀分子,其中所述消化導致從靶ssDNA除去被轉化的堿基,同時加入代表所述轉化的核苷酸的更長的寡核苷酸標簽。此外,本文所描述的另一方面涉及寡核苷酸探針文庫(包含T形探針)用于轉化ssDNA分子的用途。本文所公開的本發(fā)明的一個方面涉及一種用于始于其3'末端轉化靶單鏈 DNA(ssDNA)分子以便將靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其5'-末端具有預先指定的序列5' -χ0, S1, S2, S3> S4, S5-3 ‘的靶 8勸嫩(其中 可以是4、(、6或11并且51、52、&、54、&是預定的寡核苷酸密碼(Xx)的前5 個位置中的序列)與包含多個寡核苷酸探針的探針文庫接觸,其中每個探針包含雙鏈DNA 部分以及第一和第二單鏈懸突,其中雙鏈DNA部分包含IIS型限制性內切酶的識別序列 (R' /R)和唯一地對應于靶ssDNA中的待轉化的核苷酸(χ)的預定的寡核苷酸密碼(X' J Xx),其中存在可特異性結合R' /R并且切割識別序列的外側至探針的第二單鏈懸突的5' 側的IIS型限制性內切酶,其中第一單鏈懸突包含與預定的寡核苷酸密碼的前5個位置中的序列(5' -SpSySpSp^-S')互補的序列 5' -S' 5、S' 4、S' 3>S' 2、S' i,緊接其后是由探針文庫中全部4種核苷酸代表的位置(η);其中具有序列5' -χ'、η、η、η、η、n-3'的第二單鏈懸突包含與待轉化的核苷酸(χ)互補的核苷酸(χ'),緊接其后是由探針文庫中全部4種核苷酸代表的5個位置,并且其中在允許文庫中的多個探針之一結合靶 ssDNA分子并且與其形成完全匹配的雙鏈體的條件下進行接觸;(b)利用連接酶將步驟(a)中結合的探針的更短的鏈的兩端與靶ssDNA連接,從而形成環(huán)狀探針-靶ssDNA復合物;(c)將步驟(b)中連接的分子與特異性識別存在于步驟(a)中探針的雙鏈DNA部分的序列(R' /R)的IIS型限制性內切酶接觸,其中所述酶切割待轉化的靶ssDNA的靶分子的3'末端上的至少一個核苷酸,從而從該靶ssDNA分子的3'末端除去該核苷酸;和(d)將在步驟(c)中被切割的探針-靶ssDNA復合物的雙鏈部分分離,并且從探針的未連接鏈上洗去寡核苷酸;其中步驟(a)-(d)產生在其5'末端包含5' -χ、Xx、R-3'的轉化的靶ssDNA分子,其中Xx是對應于靶ssDNA的被轉化的核苷酸χ的預定的寡核苷酸密碼。本文所公開的本發(fā)明的另一方面涉及一種用于始于其3'末端轉化靶單鏈 DNA(ssDNA)分子以便將靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟,概述如下(a)將在其5'末端具有預先指定的核苷酸序列(例如,5' -SpS2A3A4A5-S') 的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突;其中雙鏈DNA部分包含側翼連接有第一和第二單鏈懸突的 5' -3'核苷酸序列X',和與核苷酸序列X' x互補的核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的核苷酸; 并且其中探針的雙鏈部分包含IIS型限制性內切酶識別位點(R),其切割位點在探針與靶 ssDNA的3'末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中第一單鏈懸突位于X' 側,并且第二單鏈懸突位于X'側;其中Xx在其5'末端包含存在于靶ssDNA分子的5'末端上的預先指定的核苷酸序列,其中第二單鏈懸突在緊鄰X' x 的3'末端的位置上包含與待轉化的靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3 個隨機核苷酸;并且其中第一單鏈懸突在緊鄰X',的5'末端上的核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于靶ssDNA中的預先指定的序列互補的核苷酸序列; 并且其中在允許多個探針之一與靶ssDNA分子結合并且與其形成雙鏈體的條件下進行接觸;(b)將步驟(a)中結合的雙鏈寡核苷酸的兩端與靶ssDNA序列連接,從而形成環(huán)狀分子;(c)將步驟(b)中連接的分子與對應于存在于步驟(a)中的探針的雙鏈DNA部分中的IIS型限制性內切酶識別位點的IIS型限制性內切酶接觸,其中IIS型限制性內切酶在待轉化的靶SSDNA的3'末端上的至少一個核苷酸之后切割,從而從靶ssDNA分子的3' 末端除去待轉化的核苷酸。(d)將步驟(c)中連接的且被切割的探針的雙鏈部分與靶ssDNA分離并且洗去探針的未連接的鏈;其中步驟(a)-(d)產生轉化的靶ssDNA分子,其在其5'末端包含對應于靶ssDNA的被轉化的核苷酸(例如,χ)的Xx預定的寡核苷酸密碼(例如,x、Xx、R-3'),并且其中例如,Xx預定的寡核苷酸密碼在存在于轉化的靶ssDNA分子的5'末端上的被轉化的核苷酸
> . 、r -“每次可轉化一個或多個核苷酸(例如,可轉化一個核苷酸χ (其可以是A、T、G或 C),或可轉化代表A、T、C或G的任意組合的多個核苷酸(例如,ATG或GA等)。在本文所描述的另一個實施方案中,探針的雙鏈部分上的多個預定的寡核苷酸密碼中的每一個唯一地對應于被轉化的核苷酸(A、T、G或C)。在本文所描述的另一個實施方案中,所述寡核苷酸文庫包括T形探針。本文所公開的另一個方面是一種用于始于其5'末端轉化靶單鏈(ssDNA)靶分子以便將ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶ssDNA的核苷酸順序的方法,所述方法包括以下步驟(a)將在其3'末端具有預先指定的核苷酸序列的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突,其中雙鏈DNA部分包含側翼連接有第一和第二單鏈懸突的5' -3'核苷酸序列Xx'和與核苷酸序列Xx'互補的互補3' -5'核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、 G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的核苷酸;并且其中探針的雙鏈部分還包含IIS型限制性內切酶識別位點(R),其切割位點在探針與靶ssDNA的5'末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中Xx在其3'末端包含存在于靶 ssDNA分子的3'末端上的預先指定的核苷酸序列;其中第一單鏈懸突位于X',的3'側并且第二單鏈懸突位于X',的5’末端,其中第二單鏈懸突在緊鄰Xx'的5’末端上的核苷酸的位置上包含與待轉化的靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3個隨機核苷酸;并且其中第一單鏈懸突在緊鄰Xx'的3'末端上的核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于靶ssDNA中的預先指定的序列互補的核苷酸序列;并且其中在允許多個探針之一結合靶ssDNA分子的條件下進行接觸,從而形成環(huán)狀分子;(b)將步驟(a)中結合的雙鏈寡核苷酸的兩端與靶ssDNA序列連接,從而形成環(huán)狀分子;(c)將步驟(b)中連接的分子與對應于存在于步驟(a)的雙鏈DNA部分中的IIS 型限制性內切酶識別位點的IIS型限制性內切酶接觸,其中IIS型限制性內切酶在待轉化的靶ssDNA的5'末端上的至少一個核苷酸之后切割,從而從靶ssDNA分子的5'末端除去待轉化的核苷酸;和(d)將步驟(c)中連接的且被切割的探針的雙鏈部分與靶ssDNA分離,并且洗去探針的未連接的鏈;其中步驟(a)-(d)產生轉化的靶ssDNA分子,其在其3'末端包含對應于靶ssDNA 的被轉化的核苷酸的預定的寡核苷酸密碼,并且其中預定的寡核苷酸密碼在存在于轉化的靶ssDNA分子的3'末端上的被轉化的核苷酸之前。在本文所公開的該方面和所有其它方面的一個實施方案中,重復步驟(a)-(d)不
止一次。在本文所公開的該方面和所有其它方面的另一個實施方案中,將靶ssDNA分子固定在固體載體上或通過任何其它方法確保靶ssDNA在上述步驟(d)中不被洗去。在本文所公開的該方面和所有其它方面的另一個實施方案中,靶ssDNA分子上預先指定的序列還包括II型限制性內切酶識別位點(M)。在本文所公開的該方面和所有其它方面的另一個實施方案中,靶ssDNA上預先指定的序列(M)在約3個核苷酸至約12個核苷酸的范圍內。在一個實施方案中,懸突的長度根據(jù)在探針的第一懸突與靶ssDNA的一端之間形成特定的雙鏈體的所需的長度來確定。在本文所公開的該方面和所有其它方面的另一個實施方案中,IIS型限制性內切酶位點選自,但不限于AlwI、BccI、BsmAl、Earl、MlyI、PleI、BmrI、BsaI、BsmBl、FauI、 HpyAV、MnlI、SapI、BbsI、BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、Eci I、FokI、 BceAI、BsmFI、BtgZI、BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eaml1041、Ksp632I、 PpsI、SchI、BfiI、Bso31I、BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、 AsuHPI、Acc36I、LweI、AarI、BseMII、TspDTI、TspGWI、BseXI、BstVlI、Eco57I、Eco57MI、 GsuI、PsrI 或 MmeI 位點。在本文所公開的該方面和所有其它方面的另一個實施方案中,Xx包含第一核酸序列Xxl和第二核酸序列Xxll,其中Xxl和Xxll形成唯一地對應于任一核苷酸A、T、G或C的二進制的預先指定的寡核苷酸密碼。在本文所公開的該方面和所有其它方面的另一個實施方案中,限制性內切酶的識別序列(R)存在于5'-末端、3'末端或預定的寡核苷酸密碼(Xx)內的期望位置上。在本文所公開的該方面和所有其它方面的另一個實施方案中,Xxl和Xxll在長度上各自在約4個核苷酸至約30個核苷酸的范圍內。在本文所公開的該方面和所有其它方面的另一個實施方案中,Xxl和Xxll在長度上各自為12個核苷酸。在一個實施方案中,每個懸突的長度根據(jù)在探針的懸突與靶ssDNA的一端之間形成特定雙鏈體所必需的長度來確定,即,懸突可以是任何長度。在本文所公開的該方面和所有其它方面的另一個實施方案中,第一懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內,或在長度上在例如4個核苷酸至12個核苷酸、 4至11個核苷酸、或5至12個核苷酸、或5至11個核苷酸、或5至10個核苷酸等之間的任何范圍內。在本文所公開的該方面和所有其它方面的另一個實施方案中,第二懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內,或在長度上在例如4個核苷酸至12個核苷酸、 4至11個核苷酸、或5至12個核苷酸、或5至11個核苷酸、或5至10個核苷酸等之間的任何范圍內。在本文所公開的該方面和所有其它方面的另一個實施方案中,靶ssDNA在長度上在約5個核苷酸至約3,000, 000個核苷酸的范圍內。在本文所公開的該方面和所有其它方面的另一個實施方案中,同時轉化多個靶 ssDNA分子。在本文所公開的該方面和所有其它方面的另一個實施方案中,在包含靶ssDN核酸的不均勻混合物的樣品中進行轉化。在本文所公開的該方面和所有其它方面的另一個實施方案中,在該方法的任何步驟(a)-(d)中不使用聚合酶。在本文所公開的該方面和所有其它方面的另一個實施方案中,探針文庫具有在16 至1,048,576種不同寡核苷酸的范圍內的復雜度。在本文所公開的該方面和所有其它方面的另一個實施方案中,靶ssDNA分子來源于哺乳動物。在本文所公開的該方面和所有其它方面的另一個實施方案中,所述哺乳動物是人。在本文所公開的該方面和所有其它方面的另一個實施方案中,在單分子水平上測定轉化的ssDNA分子的序列。在本文所公開的該方面和所有其它方面的另一個實施方案中,測序包括一個或多個標記的分子信標。在本文所公開的該方面和所有其它方面的另一個實施方案中,標記的分子信標是熒光分子信標。在本文所公開的該方面和所有其它方面的另一個實施方案中,熒光分子信標結合轉化的ssDNA分子的Xx序列(例如,Xx、Xxl或Xxll)。在本文所公開的該方面和所有其它方面的另一個實施方案中,引導具有結合的熒光分子信標的轉化的ssDNA分子的Xx(例如,Xx、XxI、XxII)序列通過直徑小于2nm的納米孔, 其中當轉化的ssDNA分子通過納米孔時,熒光分子信標被除去,其中熒光分子信標的除去產生閃光,其中閃光的順序產生靶ssDNA序列的序列。本文所描述的另一個方面是一種可用于本文所描述的DNA轉化方法的包含T形探針的寡核苷酸探針文庫。本文所描述的另一個方面是用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便將靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許第一文庫中只有一種探針與靶ssDNA的5'末端雜交并且第二探針文庫中只有一種探針與靶ssDNA分子的3'末端雜交的條件下進行接觸;(b)將步驟(a)中雜交的探針與靶ssDNA序列連接;(c)將步驟(b)中連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸(blocking oligonucleotide)與第二探針文庫連接的探針分離;(d)將來自第一探針文庫的連接的探針的3'末端與第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子;(e)將步驟(d)中連接的分子與IIS型限制性內切酶接觸,其中IIS型限制性內切酶在待轉化的靶ssDNA的3'末端上的至少一個核苷酸之后切割,從而從靶ssDNA分子的 3'末端除去待轉化的核苷酸;和(f)將步驟(e)中每個連接的且被切割的探針的雙鏈部分與靶ssDNA分離,并且洗去探針的未連接的鏈;其中步驟(a)-(f)產生轉化的靶ssDNA分子,其在其5'末端包含來自第二探針文庫的探針的對應于靶ssDNA的被轉化的核苷酸的預定的寡核苷酸密碼和來自第一探針文庫的探針的不變的序列,并且其中預定的寡核苷酸密碼在存在于轉化的靶ssDNA分子的 5'末端上的被轉化的核苷酸之前。本文所描述的另一個方面涉及一種用于始于其5'末端轉化靶單鏈DNA(ssDNA) 分子以便將靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許第一文庫中只有一種探針與靶ssDNA的3'末端雜交并且第二探針文庫中只有一種探針與靶ssDNA分子的5’末端雜交的條件下進行接觸;(b)將步驟(a)中雜交的探針與所述靶ssDNA序列連接;(c)將步驟(b)中連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸與第二探針文庫的連接的探針分離;(d)將來自第一探針文庫的連接的探針的3'末端與第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子。(e)將步驟(d)中連接的分子與IIS型限制性內切酶接觸,其中IIS型限制性內切酶在待轉化的靶ssDNA的5'末端上的至少一個核苷酸之后切割,從而從靶ssDNA分子的 5'末端除去待轉化的核苷酸;和(f)將步驟(e)中每個連接的且被切割的探針的雙鏈部分與靶ssDNA分離,并且將其洗去;其中步驟(a)-(f)產生轉化的靶ssDNA分子,其在其3'末端包含來自第二探針文庫的探針的對應于靶ssDNA的被轉化的核苷酸的預定的寡核苷酸密碼和來自第一探針文庫的探針的不變的序列,并且其中預定的寡核苷酸密碼在存在于轉化的靶ssDNA分子的 3'末端上的被轉化的核苷酸之前。在本文所描述的該方面和所有其它方面的一個實施方案中,為了始于其3'末端轉化靶單鏈DNA分子,第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中雙鏈部分包含其5'末端未磷酸化的預先指定的核苷酸間隔區(qū)序列(P')和與間隔區(qū)序列互補的序列(P),其中第一單鏈懸突在緊鄰P'的5'末端的位置上包含A、T、G或C并且在緊鄰該位置的3'末端的位置上包含與存在于靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中第二單鏈懸突包含與第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的5'末端。在本文所描述的該方面和所有其它方面的另一個實施方案中,為了始于其3'末端轉化靶單鏈DNA分子,第二探針文庫包含多個寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中雙鏈部分包含側翼連接有第一和第二單鏈懸突的5' -3'核苷酸序列X' x和互補核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預先指定的寡核苷酸密碼,并且雙鏈核苷酸序列還包含IIS型限制性內切酶識別位點,其相應的切割位點在探針與待轉化的靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中Xx在其5'末端包含存在于靶ssDNA分子上的預先指定的序列;其中所述第一單鏈懸突包含與存在于靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中第二單鏈懸突在緊鄰X',的3'末端上的核苷酸的位置上包含與待轉化的靶ssDNA中的核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中第二探針文庫還包含含有與第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中封閉寡核苷酸的5'末端和第一單鏈懸突的5'末端未被磷酸化。在本文所描述的該方面和所有其它方面的另一個實施方案中,為了始于其5'末端轉化靶單鏈DNA分子,第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中雙鏈部分包含預先指定的核苷酸間隔區(qū)序列(P')和與間隔區(qū)序列互補的序列(P),其中第一單鏈懸突在緊鄰P'的 3 ‘末端的位置上包含A、T、G或C和與靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中第二單鏈懸突包含與第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的3'末端。在本文所描述的該方面和所有其它方面的另一個實施方案中,為了始于其5'末端轉化靶單鏈DNA分子,第二探針文庫包含多個寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中雙鏈部分包含側翼連接有第一和第二單鏈懸突的5' -3'核苷酸序列X' x和互補核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預先指定的寡核苷酸密碼,并且雙鏈核苷酸序列還包含IIS型限制性內切酶識別位點,其相應的切割位點在探針與待轉化的靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中Xx在其3'末端包含存在于靶ssDNA分子上的預先指定的序列;其中所述第一單鏈懸突包含與存在于靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中第二單鏈懸突在緊鄰X',的3'末端上的核苷酸的位置上包含與待轉化的靶ssDNA中的核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中第二探針文庫還包含含有與第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中封閉寡核苷酸的5'末端和第一單鏈懸突的5'末端未被磷酸化。
圖1.描述制備用于轉化靶ssDNA的模型的圖示。圖2.存在于用于I級轉化的探針文庫中的示例性寡核苷酸探針的圖示。圖3A-3D.用于I級轉化的步驟的示意圖;(圖3A)與其3 ‘末端待轉化的靶ssDNA 分子特異性雜交的示例性探針,(圖3B)在兩個位置上的連接以形成環(huán)狀分子并且洗去未結合的探針,(圖3C)示例性IIS型限制性內切酶,其結合R/R',并且在\(核苷酸正在轉化)的5'末端上精確地切割,(圖3D)分離雙鏈體并且洗去未結合的鏈。在該圖示中所得到的靶ssDNA分子已在其5'末端延長了 5' -Xl、Xx、R-3',并且在其3'末端縮短了一個核苷酸X1。圖4A-4B.用于II級轉化的存在于文庫I中的示例性寡核苷酸探針(圖4A)和存在于文庫II中的示例性寡核苷酸探針(圖4B)的圖示。圖5A-5G.用于II級轉化的步驟的示意圖;(圖5A)與一個靶ssDNA分子特異性雜交的兩個探針,每端上有一個探針,(圖5B)在兩個位置上連接并且洗去未結合的探針, (圖5C)低溫解鏈,其僅移走封閉寡核苷酸但不分離探針-靶ssDNA復合物的其它雙鏈部分,(圖5D)在一個位置上的連接以產生環(huán)狀分子,(圖5E)示例性IIS型限制性內切酶特異性,其特異性地結合R' /R并且在X1 (核苷酸正在轉化)的5'末端上精確地切割,(圖5F) 分離雙鏈體并且洗去未結合的鏈。所得到的靶ssDNA分子已在其5'末端延長了 5' -X1, Xx、R、q' ”q' 2、q' 3、q' 4、q' 5、P_3,并且在其3'末端縮短了 1個核苷酸X1,(圖5G) 第二轉化循環(huán)中的第一步驟。圖6.描述制備始于其5'末端用于轉化的靶ssDNA的模型的圖示。圖7A-7C.圖7A,顯示通用探針與模板的結合的凝膠。凝膠在泳道2至4中分別顯示上游和下游引物(TP和BP)以及ssDNA模板。泳道7顯示雜交后連接的靶形成。在連接酶不存在的情況下,未形成靶(泳道5和6)。圖7B,8%-尿素變性凝膠顯示模板環(huán)化。 8% -尿素變性凝膠顯示通用探針連接的ssDNA模板(133個堿基)在PNK激酶和連接酶存在的情況下被有效地環(huán)化(泳道10)。與對照實驗相比較,線性和環(huán)化的模板DNA的條帶位置顯示正確的DNA長度。使用TP20-20(作為引物)和相應的模板ΡΡ100和ΡΡ150的陽性對照實驗(泳道1-6)在相同的條件下也環(huán)化。圖7C,顯示消化BseGl之后以形成具有連接至其3'末端的2位序列的線性ssDNA模板的環(huán)狀DNA的線性化的凝膠。泳道1和2分別在消化之前和之后運行參照DNA,泳道4和5分別在消化之前和之后運行電泳樣品。圖8A-8B.圖8A,DNA轉化的基于RCA的驗證的示意圖。轉化的DNA用作相異于1 個堿基的引物的鎖式探針。(圖8B)在30分鐘的RCA后的0. 8%瓊脂糖凝膠。泳道1具有 Ikb DNA梯帶。泳道2和3分別是在連接酶存在和不存在的情況下使用對照模板和PhU9 DNA聚合酶的陰性和陽性反應。泳道4-7分別是利用中心堿基為A、T、C和G的4種引物的 RCA反應。僅對在連接的位點上具有正確堿基的引物看到產物(泳道7)。發(fā)明詳述本文描述了一種用于將靶單鏈核酸,例如DNA或RNA的每個核苷酸順序轉化成預定的密碼的方法,所述預定的密碼代表靶核酸序列的核苷酸腺嘌呤(A),胸腺嘧啶(T)/尿嘧啶(U)鳥嘌呤(G)和胞嘧啶(C)的順序。在轉化后,利用可進一步結合分子信標的已知序列(即,預定的寡核苷酸密碼序列)來分離靶序列(例如,靶ssDNA)的每個核苷酸。本文所描述的方法的一個方面涉及需要環(huán)狀分子的形成并且導致被轉化的堿基從ssDNA的一端移至另一端的DNA轉化。此外,本文所描述的另一方面涉及將寡核苷酸探針文庫(包含T形探針)用于轉化ssDNA分子的用途。在一個實施方案中,這樣的轉化允許通過使用鈉米孔測序來測定轉化的單鏈分子的序列。在該實施方案中,當轉化的鏈移動通過納米孔時,按序列順序一次除去一個結合的分子信標。除去分子信標產生閃光,所述閃光代表預定的密碼的順序,并且也翻譯成靶 ssDNA中核苷酸的順序。該系統(tǒng)具有若干優(yōu)勢(a)靶ssDNA的序列可以是未知的;(b)聚合酶或擴增步驟不是必需的;(c)凝膠分離系統(tǒng)不是實施本文所描述的方法所需的;和(d)可將系統(tǒng)自動化以進行快速測序。本文所描述的靶ssDNA的轉化方法允許在單分子水平上進行快速測序。在一個實施方案中,可在1周以內測定靶ssDNA的序列;優(yōu)選地在72小時以內、48小時以內、24小時以內、12小時以內、6小時以內、2小時以內或甚至1小時以內(例如,45分鐘、30分鐘、15分鐘等)測定靶ssDNA分子的序列。為方便起見,此處匯集了本文說明書、實施例和所附權利要求書中所使用的某些術語。除非另有聲明,或根據(jù)上下文暗示,否則下列術語和短語包括下文中提供的意義。除非另外明確地聲明,或根據(jù)上下文是顯而易見的,否則下文中的術語和短語不排除所述術語和短語在其所屬領域內所獲得的意義。提供定義以幫助描述具體的實施方案,并且無意于限定所要求保護的發(fā)明,因為本發(fā)明的范圍僅由權利要求進行限定。隨非另有定義,否則本文所用的全部技術和科學術語具有與本發(fā)明所屬領域內的技術人員通常理解的意義相同的意義。如本文所用,術語“轉化”用于描述替換代表給定的核苷酸的寡核苷酸密碼(例如以便所述密碼可用于進行進一步測序,從而測序方法無需在單核苷酸水平上進行讀取)的過程。術語“轉化”也旨在包括一次超過1個核苷酸的轉化(例如,一次轉化至少2個、至少3個、至少4個、至少5個、至少6個或更多個核苷酸)。術語“轉化的ssDNA”或“轉化的靶ssDNA”用于描述已以經(jīng)歷至少一輪轉化的DNA分子。用作轉化的ssDNA中每個給定的核苷酸的代表性寡核苷酸密碼在本文中也稱為“預定的寡核苷酸密碼”,其可包括本文中如在發(fā)明詳述中說明的二進制碼?!?級轉化”在本文中用于指只使用一個探針文庫的的轉化方法,而“2級”轉化在本文中用于指使用兩個不同探針文庫的轉化方法。2級轉化具有增加的轉化效率的優(yōu)勢,因為其防止探針與靶ssDNA分子的每端的結合和在1級轉化過程中可發(fā)生的減少的轉化。術語“探針”和“寡核苷酸探針”在本文中用于指合成地產生的寡核苷酸,其能夠與包含與探針互補的序列的核酸退火或與其特異性雜交。探針的確切長度將取決于許多因素,包括溫度、所使用的IIS型限制性內切酶、探針文庫中每個探針的拷貝數(shù)和所使用的方法。用于本文所描述的用于1級轉化的方法的寡核苷酸探針包括雙鏈部分(兩個側翼單鏈懸突各自在一條鏈的兩端)。此類探針在本文中也稱為‘轉化探針’。如本文所使用的,術語“探針文庫”是指混合在一起的多個不同寡核苷酸探針。探針文庫具有一定的“復雜度”,其在本文中用于描述探針文庫中不同寡核苷酸的數(shù)目。例如, 具有為47的復雜度的文庫包括47(即,16,384)種不同寡核苷酸探針。術語‘復雜度’并非描述每種不同寡核苷酸探針的超過1個拷貝的存在,而是描述文庫中獨特探針的數(shù)目。文庫的復雜度根據(jù)使用期望的模板探針序列產生的隨機(例如,簡并)核苷酸組合的數(shù)目來確定,其中η或&用于表示核苷酸A、T/U、C和G(注意,待轉化的核苷酸χ也可以是A、T/ U、C或G)中的每一個。例如,如果在探針序列中存在2個隨機核苷酸(稱為η或Xtl)并且對于每個η存在4種可能的DNA核苷酸(例如,A、T、C和G),那么文庫具有42或16種不同寡核苷酸的復雜度。因此,為了至少一個探針與靶ssDNA分子上的未知區(qū)域的特異性雜交 (即,靶ssDNA序列的知識不是本文所描述的方法所必需的),對于探針的一組長度,文庫包括A、T、C和G(和任選地不加區(qū)別的結合核苷酸,例如肌苷(I))的全部可能的組合。存在用于本文所描述的方法的3個探針文庫(a)用于1級轉化的探針文庫;(b)用于2級轉化的兩個文庫(在本文中稱為文庫I和文庫II ;參見發(fā)明詳述)。每個文庫中的示例性探針示于圖2和4中。應當指出,可從靶分子的3'末端或5'末端開始進行轉化。用于每種類型的轉化的示例性探針描述于關于1級轉化的發(fā)明詳述部分。應當理解,本領域的技術人員可改造用于1級(圖2)和2級(圖4)轉化的探針文庫以轉化靶分子的5'末端。術語“預先指定的核苷酸序列”用于描述被連接至待轉化的靶單鏈核酸,例如 ssDNA的一端的已知的核苷酸序列,其被連接至靶ssDNA分子的一端(例如,5'或3'末端)(例如,參見圖1,其中將被指定為5' -X0, 8^8^83^4,85-3'的預先指定的序列連接至靶ssDNA的5'末端)。預先指定的核苷酸序列與整合入每個探針的核苷酸序列互補并且是第一輪保持序列的DNA轉化所必需的。預先指定的核苷酸序列還可包括II型限制性內切酶識別位點(例如,參見圖1,M)。術語“靶ssDNA分子”在本文中用于描述待轉化的單鏈DNA。靶ssDNA分子可來源于已從其天然雙鏈體構象變性成單鏈構象的雙鏈DNA分子(例如,基因組DNA樣品)。術語“靴ssDNA分子”還包括ssDNA分子的片段或短ssDNA (例如,500bp、1Kb、Ib JKb、16Kb 等)。在本文中還考慮,可用本文所公開的方法轉化靶單鏈核酸,例如RNA。術語“靶單鏈核酸”還包括單鏈RNA。為了舉例說明的目的,在整個本說明書中將靶ssDNA分子用作本文所描述的方法的實例。如果需要,本領域的技術人員可容易地改造此類方法以用于RNA分子的轉化。術語“特異性雜交”是指在本領域通常使用的預定條件下允許這樣的雜交的充分互補的序列的兩條單鏈核酸分子之間的締合(有時稱為“大體上互補的”)。在一個實施方案中,使用至少中等的嚴格條件。在另一個實施方案中,使用高度的嚴格條件。特別地,所述術語是指寡核苷酸與本發(fā)明的單鏈DNA分子中包含的大體上互補的序列的雜交,是指基本上排除寡核苷酸與非互補序列的單鏈DNA的雜交?!盎パa的”是指兩個核酸鏈的區(qū)域之間或相同核酸鏈的兩個區(qū)域之間的序列互補性的廣義概念。例如,已知第一核酸區(qū)域的腺嘌呤殘基能夠與與第一區(qū)域反向平行的第二核酸區(qū)域的殘基(如果殘基是胸腺嘧啶或尿嘧啶)形成特定氫鍵(“堿基配對”)。類似地,已知第一核酸鏈的胞嘧啶殘基能夠與與第一鏈反向平行的第二核酸鏈的殘基(如果殘基是鳥嘌呤)堿基配對。核酸的第一區(qū)域與其第二區(qū)域或不同的核酸互補,如果當兩個區(qū)域以反向平行的方式排列時,那么第一區(qū)域的至少一個核苷酸殘基能夠與第二區(qū)域的殘基堿基配對。在一個實施方案中,第一區(qū)域包括第一部分并且第二區(qū)域包括第二部分,據(jù)此, 當?shù)谝缓偷诙糠忠苑聪蚱叫械姆绞脚帕袝r,那么第一部分的核苷酸殘基的至少約50%, 和至少約75%,至少約90%,或至少約95%,或至少約99%能夠與第二部分中的核苷酸殘基堿基配對。在一個實施方案中,第一部分的全部核苷酸殘基(例如,100%)能夠與第二部分中的核苷酸殘基堿基配對。如本文所使用的,短語“IIS型限制性內切酶切割位點在連接后完成”用于描述存在于寡核苷酸探針上的核苷酸的序列,其在IIS型酶的切割位點中缺失至少一個核苷酸, 從而與IIS型限制性內切酶的接觸不導致雙鏈體DNA的切割。切割位點在寡核苷酸探針與其互補靶ssDNA(其提供了缺失的核苷酸,并且形成雙鏈體DNA區(qū)域)結合后完成,從而允許切割在與IIS型限制性內切酶接觸時發(fā)生。IIS型限制性內切酶是識別雙鏈DNA分子上的不對稱位點并且在遠離其識別位點的位點上切割的限制性內切酶。如本文所使用的,術語“不變序列”用于描述在每一輪轉化中插入的并且不依賴于待轉化的核苷酸X的核苷酸序列。將不變序列整合入本文所使用的探針,以便在每一輪轉化后插入所述不變序列。不同的分子信標可結合不變序列,這允許在測序過程中評估預定的寡核苷酸密碼的“讀框(frame) ”。這在其中將二進制碼用于測序的實施方案中特別有用, 從而不變序列用作允許每個讀框與之前的讀框分離的“逗號(comma)”?!白x框”,例如,是指二進制碼讀出,其中對于每一輪轉化讀取兩個分子信標,以便如果只有一個分子信標在一輪中被讀取時,“移碼(frame shift) ”將發(fā)生。當在每一輪轉化過程中整合不變序列時,讀出可表明“移碼”是否發(fā)生。例如,二進制碼可以是00,11,01,01(注意,逗號用不變序列表示),然而如果在第3個位置發(fā)生移碼,那么在不變序列存在的情況下讀出將讀取00,1,01, 01。在不變序列不存在的情況下,讀出將為00,10,10,1,這可將錯誤引入序列的順序。因此,不變序列提供了減少轉化序列的讀出中的潛在錯誤的機制。為了方便查考,根據(jù)DNA鏈上末端磷酸基團和末端羥基的位置來標示雙鏈體DNA 分子的鏈。DNA鏈稱為5' -3'方向鏈并且利用5'磷酸基團和3'羥基來標示;該鏈在本文所示的圖中被描述為由S'、x'或q標示的“上”或“上游”鏈。5' -3'方向鏈的互補鏈從左至右標示為3' -5'方向鏈并且在本文所示的圖中被描述為由S、x或q'標示的“下” 或“下游”鏈。如本文所使用的,“嚴格條件”是允許大體上互補的寡核苷酸探針與待轉化的靶 ssDNA分子的特異性雜交,但不允許非互補寡核苷酸探針結合靶ssDNA分子的條件。雜交和洗滌緩沖液的嚴格度可通過改變溫育溫度或緩沖液組成(例如,鹽濃度、去垢劑、PH等) 來變更。根據(jù)寡核苷酸探針的長度和/或核酸組成,嚴格雜交條件可變化(例如,從小于約 1M,更常見地小于約500mM和優(yōu)選地小于約200mM的鹽濃度),并且雜交溫度可在一定的范圍內變化(例如,從低至0°C至高于22°C,高于約30°C和(最常見地)超過約37°C)。嚴格度可以例如通過在更高的溫度(例如,55°C或更優(yōu)選地60°C)下使用適當?shù)剡x擇的鈉濃度增加的洗滌介質(例如,1XSSPE,2XSSPE,5XSSPE等)進行洗滌來增加。如果交叉雜交問題仍然存在,那么還可選擇進一步升高溫度,例如通過在65°C、70°C、75°C或80°C下進行洗滌。更長的片段可能需要更高的雜交溫度來進行特異性雜交。本領域的技術人員知道, 可在雜交和洗滌過程中改變各種參數(shù),這將維持或改變嚴格條件(參見,例如,Sambrook, J. ,E. F. Fritsch 等)κ 1989" Molecular Cloning :a Laboratory Manual " ,H 2 片反,Cold Spring Harbor, NY, Cold Spring Harbor Laboratory Press,于 11. 45)。當幾個因素影口向雜交的嚴格度時,參數(shù)的組合比單個因素的絕對測量更重要。如本文所使用的,術語“包含”或“包括”用于指組合物、方法和其各自成分,這些對于本發(fā)明是必要的,但仍然包括未指定的元素(無論是必要的還是非必要的)。如本文所使用的,術語“基本上由......組成”是指給定的實施方案所需的那些
元素。該術語允許對本發(fā)明的實施方案的基本和新型或功能特征沒有實質影響的其它元素的存在。術語“由......組成”是指如本文所述的組合物、方法和其各自成分,其不包括未
在實施方案的描述中列舉的任何元素。如本說明書和所附權利要求中所使用的,除非上下文中明確地指出,否則單數(shù)形式“一個”、“一種”和“所述的”包括復數(shù)所指物。因此例如,提及“所述的方法”包括本文所述和或對閱讀本公開的本領域的技術人員而言將是顯而易見的一個或多個方法和/或步
驟類型等等。要理解,上述詳細的說明和下列實施例僅是舉例說明性的,并且不被用作對本發(fā)明的范圍的限制。對本領域技術人員顯而易見的是,在不脫離本發(fā)明的精神和范圍的情況下,可對公開的實施方案做出各種改變和修改。此外,確定的全部專利、專利申請和出版物明確地以引用的方式并入本文,用于描述和公開例如這些出版物中描述的可與本發(fā)明結合使用的方法。這些出版物僅是為了公開在本申請的申請日之前的出版物而提供的。在這點上任何信息都不能被解釋為本發(fā)明者因先前發(fā)明或任何其它原因而無權先于該公開的權利的認可。關于日期的所有聲明或關于這些文件的內容的表述是基于申請者可獲得的信息并且不構成對這些文件的日期或內容的正確性的任何承認。靶核酸模板來源本文所描述的方法預期用于轉化任何單鏈核酸分子包括,例如RNA和ssDNA。靶單鏈核酸可來源于多種來源,包括例如基因組DNA、雙鏈DNA、cDNA、mRNA、tRNA、rRNA、siRNA、 miRNA.shRNA或逆轉錄的DNA。單鏈DNA可從天然存在的雙鏈DNA,例如基因組DNA來制備, 或可選地可被工程改造,例如cDNA構建體。靶核酸分子不一定包含已知序列的區(qū)域,因為本文所描述的方法允許測定完全未知序列的序列。此外,靶核酸不必是完整的基因組序列或全長RNA分子,相反地靶核酸可以是更短的序列(即,50(^ 、1肪、2103、16103)。然而,本文還涉及完整基因組以及片段化的基因組DNA的轉化??蓪⒈疚乃枋龅霓D化方法用于,例如轉化已被片段化成更小片段的完整基因組,以便從不同片段序列重建初始DNA序列??衫帽绢I域技術人員已知的方法從任何物種分離靶核酸分子。靶核酸包括但不限于細菌、病毒、真菌、植物、動物等(包括人)包含的核酸。核酸樣品可來源于生物樣品。生物樣品的一些非限定性實例包括血液樣品、尿樣品、精液樣品、淋巴液樣品、腦脊液樣品、血漿樣品、血清樣品、膿樣品、羊膜液樣品、體液樣品、糞便樣品、活組織檢查樣品、針吸活組織檢查樣品、拭子樣品、漱口水樣品、癌癥樣品、腫瘤樣品、組織樣品、細胞樣品、細胞裂解物樣品、粗制細胞裂解物樣品、法醫(yī)樣品、環(huán)境樣品、 考古樣品、感染樣品、醫(yī)院內感染樣品、社區(qū)獲得性感染樣品、生物威脅樣品、生產樣品、藥物制備樣品、生物分子生產樣品、蛋白質制備樣品、脂質制備樣品、碳水化合物制備樣品或其任何組合。生物樣品的其它非限定性實例包括細菌菌落、細菌細胞、噬菌斑、噬菌體、病毒蝕斑、病毒、酵母集落、酵母細胞、桿狀病毒蝕斑、桿狀病毒、生物制劑、傳染性生物劑、真核細胞培養(yǎng)物、真核細胞、瞬時轉染的真核細胞的培養(yǎng)物或瞬時轉染的真核細胞。在一個實施方案中,靶DNA分子來源于需要快速測序分析的個體,例如有待在臨床醫(yī)生開藥之前進行遺傳多態(tài)性預檢的個體。在一個實施方案中,靶DNA分子來源于被感染的個體,例如考慮進行抗病毒治療的一個HIV陽性個體,對于所述治療需要測定大量HIV基因組的序列。靶ssDNA的制備在一個實施方案中,待轉化的核酸是DNA分子??梢砸远喾N方法制備用于轉化的單鏈DNA分子。在當以雙鏈形式獲得(例如,從生物樣品)靶DNA時的情況下,可將DNA片段化成更小的片段并且將其變性以產生單鏈片段。例如,可通過將靶ds DNA加熱至約95°C 來進行變性。此類技術對本領域技術人員來說是已知的。通過調整此類技術的參數(shù),可能調整靶DNA片段的平均大小。此類方法就其切割/斷裂DNA分子的位置而言是相對非特異性的,以便通常獲得在完整序列各處被切割/斷裂的DNA片段。預先指定的序列是本文所描述的轉化方法所必需的,并且在一個實施方案中可使用單鏈DNA連接酶諸如(圖1),例如jMRNA連接酶1 (NEB,Ipswich,MA)將其與靶ssDNA分子的任一末端連接。用于連接的方法對于本領域的技術人員來說是公知的。在可選的實施方案中,通過機械方法或酶切割來剪切基因組以產生片段化的 dsDNA。一些限制性內切酶諸如EcoRV(NEB,Ipswich,ΜΑ)切割產生平端??蛇x地,利用諸如大腸桿菌(E. coli) DNA聚合酶I大片段(Klenow片段)或T4DNA聚合酶的酶將dsDNA分子的末端轉化成平端。可將磷酸酶用于阻止dsDNA的自身連接。然后使用T4DNA連接酶將其一端(非連接末端)可被生物素化的預先指定的寡核苷酸標簽連接至靶dsDNA片段。然后處理(例如,通過加熱)DNA以分離兩條鏈并且產生具有生物素化末端的單鏈DNA片段。用于這些步驟的方法對于本領域的技術人員來說是公知的。固體載體在本發(fā)明的一個實施方案中,將靶核酸固定至固體載體。靶單鏈核酸的固定允許在轉化過程中除去未整合的探針和將待進行的酶處理與發(fā)生于其間的洗滌步驟分離而無靶單鏈核酸片段的大量損失。固定具有促進單個靶ssDNA分子的空間分離以便單個探針與僅一個ssDNA分子雜交的額外優(yōu)勢。在其最簡單的形式中,固體載體包括與生物素化的靶核酸序列結合的載玻片。在本發(fā)明的一個實施方案中,將靶單鏈核酸錨定至固相載體,諸如磁性顆粒、聚合物微球、過濾材料等,所述固相載體允許連續(xù)應用試劑而無需復雜且費時的純化步驟??墒褂迷S多種其它固體載體,包括但不限于下列固體載體纖維素、硝酸纖維素、 尼龍膜、可控孔度玻璃珠(controlled-pore glass bead)、丙烯酰胺凝膠、聚苯乙烯基質、 活化葡聚糖、抗生物素蛋白/鏈霉抗生物素蛋白包被的聚苯乙烯珠、瓊脂糖、聚乙烯、官能化塑料、玻璃、硅、鋁、鋼、鐵、銅、鎳和金、試管、孔、微量滴定板或孔、載玻片、圓盤、柱子、珠粒、膜、孔帶(well strip)、薄膜、芯片和其復合材料(composite)。在一個實施方案中,一部分固體載體的表面用化學官能團來包被以允許例如靶ssDNA與固體載體的表面共價結合。 具有已包含在表面上的官能團的固體載體是商購可得的。此外,可由從業(yè)人員將官能團加至固體基質。許多方法可用于將例如靶ssDNA偶聯(lián)至固體基質,包括但不限于共價化學連接;生物素-抗生物素蛋白/鏈霉抗生物素蛋白;和紫外線照射(參見例如,Conner等人, Proc. Natl Acad. Sci. 80(1) :278-282(1983) ;Lockley 等人,Nucleic Acids Res. 25(6) 1313-1314(1997),據(jù)此其全文通過引用并入本文)。靶核酸/固體基質連接可包括但不限于下列連接類型二硫化物、氨基甲酸酯、 腙、酯、(N)-官能化硫脲、官能化馬來酰亞胺、鏈霉抗生物素蛋白或抗生物素蛋白/生物素、 硫化汞、硫化金、酰胺、硫酯、偶氮、醚和氨基。如果固體基質由聚合體制造,那么其可從(不限于)任何下列單體丙烯酸、甲基丙烯酸、乙烯基乙酸、4-乙烯苯甲酸、衣康酸、烯丙基胺、烯丙基乙胺、4-氨基苯乙烯、2-氨乙基甲基丙烯酸酯、丙烯酰氯、甲基丙烯酰氯、氯苯乙烯、二氯苯乙烯、4-羥基苯乙烯、羥甲基苯乙烯、乙烯基苯甲醇、丙烯醇、2-羥乙基甲基丙烯酸酯、聚(乙二醇)甲基丙烯酸酯及其混合物與下列單體之一一起產生丙烯酸、丙烯酰胺、甲基丙烯酸、乙烯基乙酸、4-乙烯苯甲酸,衣康酸、烯丙基胺、烯丙基乙胺、4-氨基苯乙烯、2-氨乙基甲基丙烯酸酯、丙烯酰氯、 甲基丙烯酰氯、氯苯乙烯、二氯苯乙烯、4-羥基苯乙烯、羥甲基苯乙烯、乙烯基苯甲醇、丙烯醇、甲基丙烯酸2-羥基乙酯、聚(乙二醇)甲基丙烯酸酯、丙烯酸甲酯、甲基丙烯酸甲酯、丙烯酸乙酯、甲基丙烯酸乙酯、苯乙烯、1-乙烯基咪唑、2-乙烯吡啶、A-乙烯吡啶、二乙烯苯、 乙二醇二甲基丙烯酸酯、N,N'-亞甲基雙丙烯酰胺、N,N'-亞苯基二丙烯酰胺、3,5-雙 (丙烯酰氨基)苯甲酸、季戊四醇三丙烯酸酯、三羥甲基丙烷三甲基丙烯酸酯、季戊四醇四丙烯酸酯、三甲醇丙烷乙氧酯(14/3E0/0H)三丙烯酸酯、三甲醇丙烷乙氧酯(7/3E0/0H)三丙烯酸酯、三甲醇丙烷乙氧酯(1P0/0H)三丙烯酸酯、三甲醇丙烷乙氧酯(2P0/0H)三丙烯酸酯及其混合物。固體基質應當經(jīng)受住本文所描述的方法所必需的溫度變化以及酶促過程、緩沖系統(tǒng)和在方法中進行的反復洗滌步驟。當將例如靶ssDNA序列固定至基質時,靶ssDNA分子應當在固體載體上彼此間隔充分遠以防止單個探針與兩個靶ssDNA片段的連接。每個分子之間的距離取決于每個片段的大致長度并且可在從Inm至IOOOnm的范圍內變化。1級探針文庫本文描述了一種用于將靶ssDNA分子中的每個核苷酸順序轉入轉化的ssDNA分子的方法,其中每個被轉化的核苷酸由代表該核苷酸的已知序列來分離。在一個實施方案中,轉化方法包括下列步驟(a)通過將預先指定的序列與分子的一端連接并且將靶ssDNA 模板固定至固體載體上來制備片段化的靶模板;(b)在可允許特異性雜交的條件下將固定的靶ssDNA分子與包含多個不同寡核苷酸探針的寡核苷酸探針文庫接觸;(c)將雜交的靶 ssDNA/探針復合物與DNA連接酶接觸以形成靶ssDNA/探針反應環(huán)(reaction circle); (d)將靶ssDNA/探針環(huán)與期望的IIS型限制性內切酶接觸;(e)分離和洗去結合的探針的雙鏈部分,和(f)按要求重復步驟(a)-(e)。每個步驟由發(fā)生于其間的洗滌步驟分離。在本文更詳細地描述了轉化的示例性方法。用于本文所描述的進行1級轉化的方法的探針包含雙鏈部分和兩個單鏈懸突?!疤结樜膸臁卑喾N不同的寡核苷酸,每種不同的寡核苷酸在一種混合物中具有多個拷貝。不同寡核苷酸的數(shù)目決定了文庫的“復雜度”并且由每個探針中的隨機(例如,簡并)核苷酸的數(shù)目決定,以便在一個文庫中容納包含A、T/U、C和G的全部可能的組合的探針。僅為了舉例說明,參見圖2,該圖描述了用于1級轉化的探針文庫的示例性寡核苷酸探針。圖2中描述的探針用于從其3'末端轉化靶ssDNA分子,然而在本文中還預期利用類似的探針構型從其5'末端轉化靶ssDNA分子。每個探針具有側翼有兩個單鏈懸突的雙鏈區(qū)域。兩個懸突都包含在相同鏈(5' -3';即,上鏈)中,從而被探針的雙鏈部分的 5' -3'方向鏈分隔。在該實例中,存在于探針的第一單鏈懸突上的標記有5' -S' 5、S' 4、 S' 3>S' 2、S' r3'的核苷酸形成預先指定的序列,其與連接至靶ssDNA分子的一端的預先指定的序列互補。第一單鏈懸突還包含至少一個隨機(例如,簡并)核苷酸(注意,該懸突將具有4個不同的組合,每個核苷酸A、T/U、C或G—個組合)。探針的雙鏈部分的3'末端上的懸突包含6個隨機核苷酸(例如,對于給定的核苷酸序列,A、T/U、C、G的4096個可能的組合)。緊鄰雙鏈部分的核苷酸與待轉化的靶ssDNA的核苷酸互補,并且在圖2中被指定為χ'。每個懸突的長度可從少至3個核苷酸至多至12個核苷酸內變化。重要地是要指出,隨著探針上懸突長度的增加,探針文庫的復雜也增加。例如,具有12個核苷酸的3'懸突的探針需要具有為413(即,11個簡并核苷酸加上3'懸突上的χ;加5'懸突上的至少一個簡并核苷酸)的復雜度的文庫。用于1級轉化的寡核苷酸探針(圖2)包括具有IIS型限制性內切酶的識別序列(R' /R)和預定的寡核苷酸密碼(Xx)的雙鏈DNA部分。在一個實施方案中,R' /R在X' x/Xx內。將圖2顯示的示例性探針與結合(R' /R)并且切割其識別序列的外側至第二單鏈懸突的5'側(圖3c)的IIS型限制性內切酶接觸。在該實例中,第一單鏈懸突包含與靶ssDNA的預定的寡核苷酸密碼(5' -S1, S2, S3、S4、S5-3')的位置2_6中的序列互補的序列5' -S' 5、S' 4、S' 3、S' 2、S' r3',其后是由探針文庫中全部4種核苷酸代表的位置(η),所述4種核苷酸之一與靶ssDNA的預定的寡核苷酸的第一位置(X(l)互補;第二單鏈懸突(5' -χ'、n、n、n、n、n-3')包含與待轉化的核苷酸(χ)互補的序列,其后是由探針文庫中全部4種核苷酸代表的5個位置。圖3a顯示在允許文庫中多個探針之一與靶 ssDNA分子形成完全匹配的雙鏈體的條件下(注意,該實例中&是待轉化的核苷酸)探針與靶ssDNA雜交的一個實施方案。探針的雙鏈部分包含預定的被指定為x的已知序列和互補鏈Xx,如圖2中顯示的。在一個實施方案中,已知序列的互補序列結合指定的分子信標。探針的雙鏈部分還包含IIS型限制性內切酶識別位點。限制位點編碼于區(qū)域中以便限制性內切酶識別所述位點并且從靶SSDNA切割至少一個核苷酸(在圖3中指定為X1)(例如,待轉化的核苷酸)。因此,對于圖3中顯示的實例,靶ssDNA分子的3'末端核苷酸提供了完成限制性內切酶切割位點所必需的核苷酸。重要地是要考慮,根據(jù)識別位點的位置來選擇限制性內切酶的切割特征以便在每一輪中轉換期望數(shù)目的核苷酸。因此,如果期望轉化2個核苷酸,那么切割位點必需切割成以便將兩端核苷酸從靶ssDNA分子的一端轉移至另一端。因此,探針中識別位點的位置對于期望的酶應當具有適當?shù)木嚯x以獲得正確的切割位點。例如,如果使用的限制性內切酶是Mmel (其切割3' -5'鏈(即,本文圖中顯示的下鏈)上其識別位點的下游18個核苷酸),那么將識別位點置于由探針的雙鏈區(qū)包含的末端核苷酸的上游16個核苷酸序列,以同時轉化2個核苷酸(參見圖3)。在其識別位點與其切割位點之間具有短距離 (例如,3個核苷酸)的IIS型限制性內切酶要求限制識別序列靠近探針的雙鏈部分的3' 末端。相反地,在其識別位點與切割位點之間具有非常長的距離的IIS型限制性內切酶要求識別位點離探針的雙鏈部分的5'末端更近,并且在一些情況下,X' x/Xx的長度可能需要延長以確保正確數(shù)目的核苷酸存在于識別位點與切割位點之間。因此,利用的IIS型限制性內切酶可影響本文所描述的方法所需的探針的長度。Xx的5'末端還包含預先指定的靶序列,該序列與連接至用于第一輪轉化的靶 ssDNA分子的預先指定的靶序列相同(參見例如圖2,其中探針的下游鏈包含5' -S' ρ S' 2、S' 3>S' 4、S' 5-3'序列,和圖 1,其中靶 DNA 包含 5' -S” S2、&、S4、‘序列)。 這允許第二輪中第二寡核苷酸探針的結合和在每個相繼的轉化輪中其它的寡核苷酸探針的結合。重要地是要指出,結合的寡核苷酸在轉化過程中被消耗,從而對于每個相繼輪,必需使用新制備的等分試樣的探針文庫、酶混合物和洗滌緩沖液??衫帽绢I域技術人員已知的任何方法(例如,寡核苷酸合成器(oligosynthesizer))來合成探針,或可選地,可從商業(yè)來源例如IDT (可在因特網(wǎng)上在idtdna. com上獲得)、hvitrogen (Carlskid,CA)等來購買探針文庫。為了從其5'末端轉化靶ssDNA,利用下列變化來合成探針(1)互換第一和第二懸突以便探針以正確的取向轉化5'末端,(2)反轉IIS型限制性內切酶序列的識別位點序列(例如,在相反鏈上來編碼識別位點;即3' -5'方向鏈)以便切割靶ssDNA分子上的至少一個5'末端核苷酸,和C3)將IIS型限制性內切酶識別位點設計成以便適當數(shù)目的核苷酸存在于期望的限制性內切酶3'識別位點與5'切割位點之間。
在一個實施方案中,如果期望將模板切離結構支持物,例如以進行進一步的基于納米孔的測序,則其它的探針(在本文中也稱為“洗脫探針”;未示出)是轉化后必需的。例如,在一個實施方案中,使用還包含II型限制性內切酶識別位點的預先指定的序列(參見圖3,M)來最初地標記靶SSDNA ;然而靶SSDNA分子的單鏈性質不允許使用II型限制性內切酶的切割。因此,其它的單鏈探針是結合靶ssDNA分子的標記區(qū)域以完成雙鏈識別/切割位點所必需的。與洗脫探針接觸和進一步將系統(tǒng)與期望的II型限制性內切酶(例如, BamHI)的接觸允許將靶ssDNA分子切離支持物以按要求進行進一步測序。應當指出,除了核苷酸A、C、T和G外,探針的3'-末端中的核苷酸可以是肌苷(I) 或與腺嘌呤、胸腺嘧啶或胞嘧啶無差別地配對的其它核苷酸。這樣,可降低文庫的復雜度, 從而允許轉化效率的增加。這些位置不應當離連接位點太近,否則它們可干擾連接反應,然而,其可離連接位點近至第6個位置(S卩,圖3和圖4b中舉例說明的探針的3'末端位置可以是肌苷)。具有多個肌苷位置(例如,第6、第7、第8和第9位置)將不增加文庫的復雜度但將為連接酶提供更大的足跡以更有效地工作。本文所描述的方法的一個方面涉及包含T形探針的寡核苷酸探針文庫,其用于本文所描述的DNA轉化方法。2級轉化探針存在兩個用于2級轉化的探針文庫,在本文中稱為文庫I和文庫II。文庫I包含對應于A、C、T和G的4種不同寡核苷酸探針(即,4的復雜度)。探針包含雙鏈部分P' /P,其在本文中被稱為“預先指定的核苷酸間隔區(qū)序列”?!邦A先指定的核苷酸間隔區(qū)序列”包含至少3個核苷酸,但在長度上可變化,由本領域的技術人員酌情決定 (考慮諸如特定的雜交條件、解鏈溫度、針對文庫II的探針的非互補序列等的參數(shù))。文庫 I的探針包含第一和第二懸突,其中第一單鏈懸突與靶SSDNA上的預先指定的核苷酸序列互補并且第二單鏈懸突與文庫II的探針的一端互補。為了在靶分子的3'末端上的轉化, 第一單鏈懸突位于5' -3'上游鏈,而第二單鏈懸突位于3' -5'下游鏈。圖如顯示文庫I的示例性探針,其中P'在其5'末端上包含與連接至待轉化的靶ssDNA分子的預先指定的序列互補的序列和對應于A、C、T或G的位置(指定為η)。在該實例中,第二單鏈懸突位于P的5'末端上并且包含不變序列5' -q' ^q' 2、q' 3、q' 4、 q' 5-3'。在該實例中,如本文所定義的不變序列包含P,和第二單鏈懸突。在一個實施方案中,R' /R 在 X' x/XxR。文庫II包含與用于I級轉化的探針相似的探針。然而,對第一單鏈懸突進行設計以結合文庫I中的探針的第二單鏈懸突,而非直接結合靶核酸分子。圖4b顯示文庫II的示例性探針,其中該序列是5' -q5、q4、q3、q2、qi-3'。探針包含雙鏈部分(R'、X' x/Xx、R) 和與待轉化的靶ssDNA的末端結合的第二單鏈懸突;以與1級轉化中使用的探針相似的方式設計探針的這些部分。此外,文庫II還包含與第一 ssDNA懸突互補的封閉寡核苷酸,其中5'末端未被磷酸化。連接酶可通過酶促或化學方法實現(xiàn)連接?;瘜W連接法在本領域內是公知的,例如!^erris 等人,Nucleosides & Nucleotides,8 :407-414(1989) ;Shabarova 等人,Nucleic Acids Research, 19 :4247-4251(1991) ’等。然而,優(yōu)選地,在標準方案中使用連接酶來酶促進行連接。許多種連接酶是已知的并且適合用于本發(fā)明,例如Lehman,Science, 186 790-797(1974) ;Engler 等人,DNA Ligases,Boyer 第 3-30 頁,編者,The Enzymes,第 15B 卷 (Academic Press,New York, 1982)。優(yōu)選的連接酶包括iMDNA連接酶、T7DNA連接酶、大腸桿菌DNA連接酶、Taq連接酶、Pfu連接酶和Tth連接酶。其使用方案是公知的,例如Sambrook 等人;Barany, PCR Methods and Applications, 1 :5-16(1991) ;Marsh 等人,Strategies, 5 :73-76(199 。通常,連接酶要求存在5'磷酸基團以用于連接至鄰接鏈的3‘羥基。本文所使用的“連接酶”是指催化兩個核酸序列的糖-磷酸主鏈的連接的酶。因此,連接酶連接兩個獨立的DNA序列的主鏈以在該位點產生一個無縫DNA序列。兩種類型的連接酶可用于實施本文所描述的方法(a)RNA連接酶(例如,T4RNA連接酶)和(b)DNA 連接酶(例如,T4DNA連接酶)。也對單鏈DNA具有活性的RNA連接酶(例如,T4RNA連接酶)可用于將預先指定的序列標簽連接至靶ssDNA分子的一端。該序列標簽是在第一輪轉化中與寡核苷酸探針雜交所必需的。因為大多數(shù)DNA連接酶只對雙鏈DNA分子有活性,所以可通過使用RNA連接酶將預先指定的序列加至單鏈DNA分子。該連接酶也用于標記用于本文所描述的方法的靶 RNA分子。該酶的對單鏈DNA分了的活性比對單鏈RNA分子的活性低,因此必需更長的溫育時間來將標簽連接至靶ssDNA分子上。在可選的實施方案中,使用DNA連接酶將預先指定的核苷酸序列加至靶ssDNA分子的一端,然后將dsDNA變性成ssDNA,如在本文的“靶核酸模板”部分中所描述。DNA連接酶在本文中還用于將一個具有懸突的雙鏈DNA片段與一個單鏈DNA片段連接在一起,并且用于將寡核苷酸探針連接至靶ssDNA分子?;旧希瑢衧sDNA與寡核苷酸連接在一起以形成在探針區(qū)域包含雙鏈部分的連續(xù)環(huán)。由連接的寡核苷酸探針和靶 ssDNA分子產生的該環(huán)在本文中稱為“反應環(huán)”或“靶ssDNA/探針環(huán)”?!愕?,商業(yè)連接酶來源于T4噬菌體或大腸桿菌,然而也涉及來自其它來源的連接酶。在一個優(yōu)選的實施方案中,可使用耐熱連接酶,諸如Ampligase⑧。耐熱連接酶允許在更嚴格的溫度下進行連接,必要時可進行定制來允許不同寡核苷酸探針的特異性雜交。商業(yè)連接酶的反應條件可變化,并且使用方法由制造商提供。這些方法可由本領域的技術人員來進行,反應條件的改變(以提供用于本文所描述的方法的連接酶的最佳性能)完全在本領域的技術人員的能力范圍內。限制性內切酶如本文所使用的,術語DNA的“限制性內切酶消化”是指利用只在DNA中的某些位置上起作用的酶(即,限制性內切酶)的DNA序列的催化切割,通常每個特異性的位點被稱為限制位點。預期用于本文的各種限制性內切酶是商購可得的,并且使用由酶提供商確定的其反應條件、輔因子和其它要求。由制造商來指定用于特定限制性內切酶的適當?shù)木彌_液和底物量。溫育在37°C下通常采用為約1小時,但可按照提供商的說明書進行改變。兩種類型的限制性內切酶用于實踐本文所描述的方法(a) IIS型和(b) II型限制性內切酶。IIS型限制性內切酶用于切割待轉化的靶ssDNA分子的末端核苷酸。IIS型限制性內切酶(例如,F(xiàn)okl、AiwI、Mmel)切割其識別序列的外則至一側。這些酶識別連續(xù)且不對稱的序列。該切割模式通過酶上的兩個不同結構域(一個用于DNA結合,另一個用于DNA 切割)來實現(xiàn)。據(jù)認為,其通常以單體形式結合DNA,但通過鄰近酶分子的切割域的二聚化來協(xié)同地切割DNA。IIS型限制性內切酶的實例是Mmel,其識別不對稱序列TCCRAC并且切割5' -3'上游鏈上的下游20個核苷酸,從而在上游鏈上留下2個核苷酸的3'懸突。將 IIS型限制性識別位點整合入用于本文所描述的方法的探針。本質上,幾乎任何IIS型限制性內切酶,包括留下平端的酶可用于本文所描述的方法。重要地是將具有一致切割性質的限制性內切酶用于本文所描述的方法(例如,特定的切割位點)。在一些情況下,從靶ssDNA分子的3 ‘末端切割僅一個核苷酸,因而在其特定的切割位點上不一致地切割的酶將在轉化和任何隨后的測序過程中引起錯誤。重要地是還要考慮限制性內切酶用以大體上完成切割所耗費的時間長度。在一個實施方案中,選擇具有相對短的切割時間的IIS型限制性內切酶,其允許相繼的輪在相對短的時幀內發(fā)生(例如,以加速更長的靶ssDNA模板的轉化速率)。IIS型限制性內切酶可以是如由Roberts, RJ等人 O003) Nucleic Acids Research 31 (7) :1805-1812 (其通過引用全文引入本文)定義的任何IIS型限制性內切酶的任何公認的序列。此外,本文還預期,(a)自然界中新發(fā)現(xiàn)的;(b)重組產生的或(c)經(jīng)修飾的新型IIS型限制性內切酶也可用于本文所描述的方法。一些IIS型限制性內切酶在本文所描述的方法中是無用的,因此應當慎重選擇 IIS型限制性內切酶。例如,一些IIS型限制性內切酶在其識別序列(例如,PsrI, Ppil, Hin41、AIoI, BsaX, BcgI, CspCI, BaeI)的兩側切割DNA,從而應當避免用于本文描述的方法。如果未轉化的靶核酸分子的一端不包含完整的雙鏈切割位點,那么可能使用此類酶。此外,一些IIS型限制性內切酶具有需要特定末端核苷酸(例如,腺嘌呤)而不是簡并核苷酸(例如,η)以進行切割的切割位點。因此,這些類型的酶將只切割具有該特定末端核苷酸(例如,腺嘌呤)的靶ssDNA分子,因此具有其它末端核苷酸(例如,胸腺嘧啶、 胞嘧啶、鳥嘌呤)的任何靶ssDNA分子不被切割。由于靶ssDNA的核苷酸序列是未知的,因此不可能使用此類酶進行轉化過程。這些酶的一些實例包括BsmI、BbvCI, BssSI、BseYI, BpulOI,本文不考慮使用所述酶。為了從其固體載體切割轉化的ssDNA分子以使用例如基于納米孔的技術進一步測序,在本文所描述的方法中使用II型限制性內切酶。一些非限定性II型酶是在其回文識別序列內切割DNA的那些酶,諸如HhaI、HindIII、BamHI和NotI。切割在每個切口的一側留下3'-羥基和在另一側留下5'-磷酸。由于II型限制性識別位點和預先指定的標簽序列一起被連接至靶ssDNA分子,因此靶ssDNA分子被切割的區(qū)域在所有靶ssDNA片段中是一致的。靶ssDNA分子只有在加入間隔探針以完成回文雙鏈序列后才能被II型限制性內切酶切割。在本文涉及并且論述了設計用于該目的的洗脫探針。雜交條件核酸雜交涉及在其探針與其互補靶ssDNA可通過互補堿基配對形成穩(wěn)定的雜交雙鏈體的條件下將探針與靶ssDNA接觸。然后洗去不形成雜交雙鏈體的核酸,從而留下用于保持序列的DNA轉化的雜交的寡核苷酸。最佳雜交條件將隨探針的長度和適當?shù)奶结樈Y合所需條件的嚴格度而變化。一般而言,更低的溫度允許更大量的探針結合靶ssDNA(包括非特異性探針),而更高的溫度由于嚴格度的增加而允許更少量的探針結合靶ssDNA(例如,只有特異性雜交的探針才被允許在嚴格條件下結合靶ssDNA)。一般的雜交技術描述于 Hames 和 Higgins (1985) Nucleic Acid Hybridization, A Practical Approach, IRL Press ;Gall 禾口 Pardue (1969) Proc. Natl. AcacL Sci. USA 63:378-383 ;以及John等人(1969)Nature 223 :582-587中。優(yōu)化雜交條件的方法描述于,例如 Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology, 第 24 卷=Hybridization With Nucleic Acid Probes, Elsevier, N. Y.。用于 DNA 組成的促進退火的條件對于本領域的技術人員來說是已知的并且描述于Sambrook等人,(1989), Molecular Cloning :A Laboratory Manual,第 2 版,Cold SpringHarbor, N. Y.。二進制碼在本文所描述的方法的一個實施方案中,將靶ssDNA或靶RNA分子轉換成二進制碼。在該實施方案中,Xx包含第一核酸序列、和第二核酸序列Xxll。將Xxl和Xxll的序列設計成以便Xxl結合具有第一標記的分子信標,并且Xxll結合具有第二不同標記的分子信標。 Xxl和Xxll在大小上可根據(jù)本領域技術人員的需要在一定范圍內,例如Xxl和Xxll在長度上各自可在約4個核苷酸至約25個核苷酸的范圍內。在一個實施方案中,Xxl和Xxll在長度上各自為12個核苷酸。靶ssDNA至二進制碼的轉化基于簡單的想法用通過“O”或“1”標識的2單元碼 (unit code)替代構成DNA分子(即,A、T、C、G)或RNA分子的4種不同核苷酸(即,A、U、 C、G)中的每一個(參見,例如美國專利No. 6,723,513,該專利的全文通過引用并入本文)。 例如用2單元碼(0,0)替代原始序列中的腺嘌呤,用(0,1)替代胞嘧啶,用(1,0)替代鳥嘌呤以及用(1,1)替代胸腺嘧啶。二進制碼是反映原始DNA分子的堿基序列的2種類型的單元碼的連續(xù)串接。在一個實施方案中,這些單元碼被設計為4-25bp長的DNA區(qū)段(即,4、 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24 或 25)。例如,O 單元碼可以是ATT TAT TAG G,1單元碼可以是CGG GCG GCA A,但也可使用單元碼的任何其它序列。 值得注意地,該轉化導致,例如DNA長度增加約20倍,但不再需要分辨單個核苷酸。相反只需檢測單元碼的識別性(identity) (O或1)。因此該轉化極大地簡化了單分子(例如,基于納米孔的)測序的讀出過程。利用由LingVitae AS (美國專利No. 6,723,513)開發(fā)的生物化學轉化法進行雙鏈靶DNA分子的前述轉化。然而,LingVitae的方法受限于靶DNA的可能的最大長度,其利用雙鏈DNA靶,并且一些情況下需要聚合酶來擴增靶DNA分子。本文所描述的用于轉化的方法不受這些約束的限制。轉化靶ssDNA分子的示例性1級方法本文描述了用于將靶ssDNA分子的每個核苷酸順序轉入轉化的ssDNA分子的方法,其中每個轉化的核苷酸被代表該核苷酸的已知序列進行分離。所述已知序列本質上是包含預定的核苷酸組的密碼,該密碼代表每個核苷酸。該密碼可以是二進制碼。在本發(fā)明的方法中,靶ssDNA序列的順序得到保持,然而其是用于分子的進一步測序而非單個核苷酸分辨率水平上的測序的已知序列。例如,使用來源于寡核苷酸探針的已知序列的12聚體替代轉化的腺嘌呤核苷酸。為了舉例說明,下文描述了示例性方法,其中用預先指定的序列在5'末端上標記靶ssDNA分子,并且從3'末端來轉化該分子。本文還預期,可在其5'末端轉化靶ssDNA 分子和在3'末端標記所述分子。關于該轉化方法,在允許不同探針(例如,在探針文庫中的47種不同探針中,存在與靶ssDNA特異性雜交的探針;該不同的探針可存在,例如數(shù)千拷貝)的特異性雜交的條
28件下將片段化和固定的單鏈靶DNA分子與探針文庫接觸。優(yōu)選地,不同探針的懸突區(qū)域以 100%的互補性與待轉化的靶ssDNA分子特異性雜交。在雜交后,用適當?shù)南礈炀彌_液洗去未結合靶ssDNA分子的過量探針。通常,洗滌緩沖液包含具有最佳去垢劑或鹽成分的特定 PH的緩沖鹽水溶液。具有更高鹽或去垢劑濃度的洗滌緩沖液提高了洗滌的嚴格度,并將除去非特異性結合的探針。還可升高或降低PH以改變洗滌嚴格度。最佳條件將隨具體的緩沖液而變化,并且本領域的技術人員完全有能力制備和改變這類洗滌緩沖液。然后在可允許特異性雜交的探針與靶ssDNA的連接以形成環(huán)的條件下將固定的靶ssDNA與連接酶接觸,其中探針用作靶ssDNA分子的兩端之間的橋。圖北描述了利用連接酶將結合的探針的更短的鏈的兩端與靶ssDNA連接,從而形成環(huán)狀分子的實例。圖北中兩個球標示了連接的位置。在連接后,除去連接混合物,然后進行洗滌步驟。將固定的靶ssDNA/探針環(huán)與IIS型限制性內切酶(例如,Mmel)接觸,所述酶對應于探針的雙鏈部分上的IIS型限制性內切酶識別位點。限制性內切酶在離其識別位點數(shù)個核苷酸遠的位置上切割,以便將至少1個核苷酸(在圖3中被指定為X1)切離靶ssDNA的 3'末端并且保持該核苷酸被連接至在圖3中被指定為Xx的核苷酸序列。在該過程中線性化靶ssDNA/探針復合物,并且暴露新的3'末端核苷酸。圖3c顯示切割步驟的一個實施方案,其中將連接的分子與特異性識別存在于探針的雙鏈DNA部分中的序列(R' /R)的IIS型限制性內切酶接觸,其中所述酶切割待轉化的靶ssDNA的3'末端上的至少一個核苷酸,從而從靶ssDNA分子的3'末端除去待轉化的核苷酸。為了除去剩余的結合探針并且使復合物返回單鏈分子,可加熱(例如,95°C )和洗滌該系統(tǒng)。通過加熱將探針的滯留鏈(linger strand)的片段與靶ssDNA分離,并且將其洗去;因此探針不能重新使用?,F(xiàn)完成一輪轉化方法。本實例中3'末端轉化的靶ssDNA分子在其5'末端包含3'轉化的核苷酸X,和包含5' -SpSySySpS5-S'預先指定的序列的Xx以及來自寡核苷酸探針的其余Xx序列。洗去剩余的探針片段和緩沖液混合物?,F(xiàn)可按要求將系統(tǒng)用于下一輪的轉化。與第一輪相似地進行第二輪。重要地是要指出,將新制備的溶液等分試樣用于各相繼的輪,例如,在雜交階段使用新制備的探針等分試樣。在第二和隨后的重復輪中,不同于靶ssDNA的新暴露的3'和5'末端的寡核苷酸探針以相似于第一探針的方式結合。第一單鏈懸突結合靶ssDNA的5'末端上的其互補鏈并且第二單鏈懸突結合靶ssDNA的3'末端。將系統(tǒng)在用于雜交的條件下進行溫育,洗去過量的探針,并將系統(tǒng)與雙鏈DNA連接酶(例如,T4DNA連接酶)接觸以形成靶ssDNA/探針環(huán)。 再次洗滌該系統(tǒng),將其與IIS型限制性內切酶(例如,Mmel)接觸以線性化該分子并且將末端3'核苷酸轉移至正在生長的5'末端。加熱系統(tǒng)以使雙鏈區(qū)變性,并完成第二輪。以相似的方式進行更多輪直至完成基本上全部的靶ssDNA片段的轉化的長度(或基本上完成靶 ssDNA分子的期望部分的轉化)。本文還預期同時轉化多個核苷酸(例如,一次轉化至少2個、至少3個、至少4個、 至少5個、至少6個或更多個核苷酸)。這不改變文庫的復雜度,但將減少給定的靶的循環(huán)次數(shù)。將限制性內切酶識別位點R移至離切割位點所需的距離以允許在每輪轉化中切割期望數(shù)目的核苷酸。
本文所描述的方法用于在1周內轉化靶ssDNA分子并隨后測定靶ssDNA分子的序列。在一個實施方案中,本文所描述的方法可在1天內(例如,16小時、12小時、8小時、4 小時、2小時、1小時、30分鐘、15分鐘或其之間的任何整數(shù))轉化靶ssDNA分子。2級方法在本文所描述的DNA轉化的基本方法(稱為1級轉化)中,兩個獨立的探針可能同時結合一個靶ssDNA分子,其中一個探針結合靶ssDNA的5'末端并且第二探針結合其3‘ 末端。這可導致測序效率的降低。因此,在本文中還描述了更復雜的方法,稱為“2級DNA 轉化”。該方法還提供了在每個轉化循環(huán)之間加入預先指定的核苷酸間隔區(qū)序列(例如,12 聚體)的優(yōu)勢。該序列可用于雜交與已使用的顏色信標不同的顏色編碼的分子信標,以高度促進讀出過程并且避免潛在移碼錯誤。2級DNA轉化利用兩個探針文庫(例如,圖4),其中一個包含封閉寡核苷酸(例如, 5' -Q1'、q2‘、q3‘、q4‘、q5‘ ~3')。為了舉例說明,本文描述了用于轉化靶ssDNA分子的3'末端的方法,然而,本文還預期也可從5'末端轉化靶ssDNA分子。文庫1包含4種不同的探針。示例性探針示于圖如中,其包含雙鏈區(qū)以及第一和第二單鏈懸突,其中雙鏈區(qū)是預先指定的寡核苷酸間隔區(qū)(P' /P);其中第一單鏈懸突具有與用于1級轉化的文庫中的探針的第一單鏈懸突(示于圖2中)相同的組成。在該實例中,第一懸突具有序列5' -S' 5、S' 4、5' 3、5' 2、S' pn-3'并且第二單鏈懸突具有預先指定的序列5' -q' ^ q' 2、q' 3、q' 4、q' 5_3',其與文庫II中的封閉寡核苷酸相同,并且其中選擇 P' /P>5' -q' i、q' 2、q' 3、q' 4、q' 5"3'和 5' -S' 5、S' 4、S' 3、 S' 2、S' ^n-3'的序列以便沒有兩個序列或其互補序列可以以任何可觀察到的強度彼此雜交。文庫II的一個實施方案示于圖4b中,并且包含46或4096種不同的探針,每個探針具有雙鏈區(qū)以及第一和第二單鏈懸突。在該實例中,雙鏈區(qū)具有與I級轉化文庫中的探針的雙鏈區(qū)(示于圖2中)相同的組成,并且具有序列R'、V x/Xx、R,而第一單鏈懸突具有例如預先指定的序列5' -q5、q4、q3、q2、qi-3',其與封閉寡核苷酸5' -q' ^q' 2、q' 3、 q' 4、q' 5-3'互補并且被其封閉。在該實施方案中,第二單鏈懸突具有與1級轉化文庫中的探針的第二單鏈懸突相同的組成并且具有序列(5' -χ'、n、n、n、n、n-3'),其中封閉寡核苷酸的5'末端未被磷酸化,這阻止了通過連接酶將其與雙鏈區(qū)中的R的3'末端連接,其中可以不磷酸化第一單鏈懸突的5'末端以阻止連接,但這不是必需的。關于納米孔測序的具體應用,對于每輪轉化,可將不變序列(例如,5' _R、q' ^ q' 2、q' 3、q' 4、q' 5>P"3')整合入靶ssDNA。這可用于結合獨特的分子信標,其用作每個轉化的堿基之間的“逗號”,以便將其置于每個轉化的核苷酸之間(例如,和二制碼一起)。 關于對應于A、C、G和T的4種寡核苷酸密碼以兩位格式(two bit format) :XxI、XxII 0(xl和 Xxll為兩個預先指定的序列并且每個可通過經(jīng)標記以特定的頻率發(fā)射光的分子信標進行結合)存在的實施方案,如果經(jīng)標記以第三頻率發(fā)光,那么該信標可用于在讀出過程(例如, 二進制碼的讀出)中避免移碼。在本文所公開的該方面和所有其它方面的一個實施方案中,用于I級轉化的文庫的第一單鏈懸突的5' -S' 5、S' 4、S' 3、S' 2、S' r3'序列和用于II級轉化的文庫I 的第一單鏈懸突可具有不止1個預先指定的序列。在一個實施方案中,5' -S' 5、S' 4、S' 3> S' 2、S' r3'可以是4種不同的預選指定的序列,對應于A、C、G和Τ。在另一個實施方案中,其中寡核苷酸密碼以兩位格式(例如,ΧχΙ、ΧχΙΙ)存在,5' -S' 5、S' 4、S' 3、 S' 2、S' r3'可以是兩個不同的預先指定的序列,每個對應于兩種類型的核苷酸。這兩個實施方案可分別使對應文庫的復雜度增加4和2倍。代表2級轉化方法的一個實施方案的示意圖示于圖5中。圖5所描述的示例性方法包括下列步驟(a)以與上述1級轉化相同的方式制備靶ssDNA,然而將其與來自文庫I和文庫II 的探針(圖4)的混合物接觸,其中文庫I中僅有一個具有與靶ssDNA分子的5'末端互補的序列的探針可與其雜交并且來自完整的雙鏈體,其中文庫II中僅有一個具有與靶ssDNA 分子的3'末端互補的序列的探針可與其雜交并且來自完整的雙鏈體(圖fe);(b)利用連接酶將文庫I探針與靶ssDNA的5'末端連接并將文庫II探針與靶 ssDNA的3'末端連接,然后洗去未結合的探針(圖恥);(c)分離封閉寡核苷酸(例如,通過低溫解鏈)而不分離探針-靶ssDNA復合物的其它雙鏈區(qū),并洗去封閉寡核苷酸(圖5c);(d)讓文庫I探針的第二單鏈懸突與文庫II探針的第一單鏈懸突雜交以形成完整的雙鏈體(例如,通過冷卻),并且利用連接酶連接兩個探針;從而形成環(huán)狀分子(圖5d);(e)用特異性識別序列(R' /R)的IIS型限制性內切酶切割探針-靶ssDNA,其中所述酶在待轉化的靶ssDNA的3'末端上的至少一個核苷酸的5'末端處切割(圖k);(f)分離所有雙鏈區(qū)(例如,通過高溫解鏈)并且洗去未與靶ssDNA連接的探針的所有部分(圖5f);其中步驟(a)-(f)產生在其5'末端包含5' -X1, Xxl, q' ^ q' 2、 q' 3、q' 4、q' 5>P"3'的轉化的靶ssDNA分子,其中)(xl是對應于靶ssDNA的被轉化的核苷酸(圖5中的X1)的預先指定的寡核苷酸密碼。在本文所公開的該方面和所有其它方面的一個實施方案中,重復步驟(a)-(f)多于1次。圖5g舉例說明了第二循環(huán)的步驟(a)。重要地是要指出,文庫I對于本文所描述的2級轉化不是絕對必需的,即可利用用于1級轉化的文庫和4種封閉探針(例如,5' -A、S1, S2, S3> S4, S5-3'、5' -T、S1, S3> S3、 S4、S5-3'、5' -(^SpS2AS4J5-S'禾口 5' -GjS2^S4J5-S')來進行 2 級轉化,所述封閉探針的5'末端未被磷酸化。由于在轉化后一部分文庫I探針被整合入靶ssDNA分子,因此如果需要基于納米孔的測序,重要地是要考慮該整合的區(qū)域的長度。由于文庫I探針可將例如12個堿基加入 DNA分子,因此可能需要延長分子信標的長度以允許一個信標被其鄰近信標完全猝滅。在適當長度的分子信標不存在的情況下,信噪比可減小。加入許多堿基對的能力在本文中預期用于代表轉化的分子中的特定核苷酸的不同密碼的設計,從而可增加DNA轉化的應用。特別地,該不同序列可用于靶向第三顏色編碼的分子信標,其在轉化的DNA中每對密碼信標之后標志“逗號”。該方法可用于在讀出過程中避免潛在的“移碼”,因為第三顏色將總是標志著新讀框(或信標的兩個色序(color sequence))的起始,其對應于靶DNA中的某一核苷酸。本文還預期同時轉化多個核苷酸(例如,一次轉化至少2個、至少3個、至少4個、 至少5個、至少6個或更多個核苷酸)。這不改變文庫的復雜度,但將減少給定的靶的循環(huán)數(shù)。將限制性內切酶識別位點R移至離切割位點所需的距離以允許在每輪轉化中切割期望數(shù)目的核苷酸。將轉化的ssDNA模板從載體切離一旦靶ssDNA分子被轉化,在一些實施方案中必需將固定的分子從其表面載體除去以便可使用納米孔測序系統(tǒng)對其進一步測序。例如,預先指定的序列是(5' -X0, S1, S2, S3、S4、S5、M-3')并且包括特異性地結合M并且在該識別序列內切割(從而釋放已被轉化的靶ssDNA)(參見圖3和5)的II型限制性內切酶。在靶ssDNA的制備過程中被連接至模板分子的預先指定的序列包含雙鏈、回文、 限制性內切酶識別序列(例如,Bam HI)的單鏈。將包含至少預先指定的標簽序列的互補回文序列的單鏈寡核苷酸加至靶ssDNA片段并且在允許特異性雜交的條件下進行溫育。優(yōu)選地,洗脫探針包含互補回文序列和至少一部分預先指定的標簽序列,以便洗脫探針在優(yōu)選切割位點上而非在靶ssDNA分子的其它區(qū)域進行特異性雜交。洗去過量探針,將具有結合的寡核苷酸探針的靶ssDNA片段與特異于存在于預先指定的序列上的回文序列的限制性內切酶接觸。可收集固定的片段以使用納米孔進行測序。如果需要,可重復該過程以確保大體上所有靶ssDNA片段從載體完全洗脫。納米孔測序在一個實施方案中,用納米孔探測轉化的單鏈核酸以允許快速測序。納米孔光學讀出平臺的概念詳細地描述于美國專利No. 6,362,002中,其以引用的方式全文并入本文。通過生物化學方法將靶ssDNA轉化成二進制碼,其中原始靶ssDNA 序列中的每個堿基用2個二進制碼單元(分別地,以開圓和實心圈標記的0和1)的獨特組合來代表。將轉化的靶ssDNA與2種類型的與2個編碼單元互補的分子信標雜交。分子信標是具有內部猝滅熒光團的發(fā)夾形分子,當其結合互補靶核酸序列時其熒光恢復。溶液中(Tyagi等人,“Molecular Beacons =Probes that Fluoresce upon Hybridization, " Nature Biotech. 19 :365-370 (2001) ;Dubertret 等人, "Single-mismatch Detection Using Gold-quenched Fluorescent Oligonucleotides, “ Nature Biotech. 19 :365-370(2001))或固定在固體表面上 (Fang 等人’ “Designing a Novel Molecular Bacon for Surface-Immobilized DNA Hybridization Studies, “ J.Am.Chem. Soc. 121 :2921-2922 (1999) ;Wang 等人’ "Label Free Hybridization Detection of Single Nucleotide Mismatch by Immobilization of Molecular Beacons onAgorose Film, " Nucl. Acids. Res. 30 61(2002) ;Du 等人’ "Hybridization-based Unquenching of DNA Hairpins on Au Surfaces :Prototypical " Molecular Beacon " Biosensors, " J. Am. Chem. Soc. 125 4012 :4013 (2003) ;Fan 等人,"Electrochemical Interrogation of Conformational Changes as a Reagentless Method for the Sequence-specific Detection of DNA, “ Proc. Natl. Acad. Sci. USA 100 :9134-9137 (2003))的 DNA 發(fā)夾作為“分子信標”的用途(Broude, “ Stem-loop Oligonucleotides :a Robust Tool for Molecular Biology and Biotechnology, “ Trends Biotechnol. 20 :249-256 Q002)),已被證明是 DNA 片段的 “無標記”檢測的有用方法。分子信標由在一端用熒光基團并且在另一端具有猝滅劑官能化的DNA發(fā)夾組成。在其互補序列不存在的情況下,其以閉合的“暗(dark)”構象存在。當引入互補寡核苷酸時雜交發(fā)生,其伴隨地用力打開發(fā)夾,并允許熒光處于“發(fā)光”狀態(tài)。用于基于納米孔測序法的每個信標在其5'末端包含熒光基團并且在其3'末端包含猝滅劑或反之亦然,每組信標包含可區(qū)分的熒光基團(例如,結合二進制碼的0構型的信標和結合二進制碼的1構型的信標包含不同的熒光基團)。廣譜猝滅劑分子猝滅兩種熒光(例如,猝滅分子阻止莖環(huán)分子信標的熒光,或即使分子信標與其互補序列結合其仍可阻止相鄰分子信標的熒光)。2種不同顏色的熒光基團使得其可能區(qū)分2個信標。通常,分子信標在溶液中和在與其靶雜交后自猝滅,將分子信標設計成“照 (Tyagi S, Kramer FR. Nat Biotech 1996 ;14:303-8 ;Bonnet G, Tyagi S, Libchaber
A, Kramer FR. Proc Natl Acad Sci USA 1999;96:6171-66)。然而,在基于納米孔的測序方法中,這樣排列分子信標以便信標彼此相鄰,從而使鄰近信標上的猝滅劑可猝滅其鄰近信標的熒光發(fā)射,并且在連續(xù)地將單個編碼單元從DNA除去(不包括第一信標)之前DNA 將保持“暗”。該概念是納米孔-光學讀出法的主要特征;其顯著地減小了來自相鄰分子和來自溶液中游離信標的熒光背景,從而導致更高的信號背景比(Meller A, Mathe' J,Eid J.USA,2005)。當將分子引入納米孔時,信標以約5至10毫秒的時間延遲逐個地連續(xù)剝落。通過電場強度調節(jié)該時間以優(yōu)化信號-背景水平(Mathe' J,Visram H,Viasnoff V, Rabin Y,Meller A. Biophys J2004 ;87 :3205-12 ;McNaIIy,B. ,ffanunu,M.禾口MeIler,A. Nano Letters 2008 ;8 :3418-3422)。例如,每次除去新信標,新熒光基團被猝滅并且被定制的顯微鏡記錄。通過設計,釋放的信標被自動關閉,從而猝滅其自己的熒光,于是其擴散遠離孔的附近。第1信標剛一釋放,其相鄰信標的熒光基團將照亮。讀出時間據(jù)估計(單個孔) 在約1毫秒/堿基至10毫秒/堿基,或100個單元/秒至1000個單元/秒的范圍內或其之間的任何點,例如 2、3、4、5、6、7、8、9 或 10 毫秒 / 堿基或 150、200、250、300、;350、400、500、 600、750、800、900 或 1000 個單元 / 秒。在一個實施方案中,可將分子信標連接至另一個分子或化學藥品,這導致尺寸的增加,并且納米孔的直徑可大于2nm,只要其小至足以除去分子信標和連接的分子或化學藥品,同時允許ssDNA通過。DNA片段的序列組裝“序列組裝”是指對齊(aligning)和合并(merging)很長的DNA序列的許多片段以重建原始序列。一旦已通過納米孔測序積累了信號信息,可將計算機程序用于將序列片段組裝成靶ssDNA分子的原始序列。由于模板的片段化對于每個基因組DNA分子是隨機并且獨立的,因此來自不同基因組DNA分子的序列產生交疊。可使用計算軟件將這些交疊區(qū)域加在一起,所述軟件分析每個片段的測序結果,檢測來源于基因組DNA的區(qū)域的片段之間的交疊區(qū)域,并且提供來自獲得的樣品的基因組DNA的可能性高的序列。用于片段序列的組裝或重建的計算軟件可獲自多種來源。可在萬維網(wǎng)上獲得使用或購買的DNA組裝軟件的一些實例包括但不限于kquencher (genecodes. com)、 DNA baser aligner (dnabaser. com)、CAP3 (pbi 1. univ_lyonl. fr. cap3. php ;Huang, X.禾口 Madan A. (1999) CAP3 :A DNA sequence as sembly program Genome Research9 868-877)、AMOS (jcvs. org/cms/research/software/ttc614)、TIGR assembler (jcvs. org/cms/research/software/ttc614)、Celera assembler(jcvs. org/cms/research/ software/#c614)、Phrap (phrap. org)或 CIc bio Advanced contig assembly (clcbio.com)。用于從片段進行DNA序列組裝的方法對于本領域技術人員來說是已知的。測序自動化在一個實施方案中,使用自動化系統(tǒng)進行轉化過程,所述自動化系統(tǒng)可進行洗滌步驟、溫育步驟和轉化方法所必需的溫度的改變(例如,自動化系統(tǒng)可注射溶液,允許快速地進行多個轉化步驟,減少來自外部DNA源的污染和改變如由用戶輸入計算機程序的溫度)。所述系統(tǒng)可包括這樣的組件,諸如計算機、信息存儲裝置、機器人組件、熱循環(huán)儀、顯微注射系統(tǒng)、緩沖液和酶溶液貯存器等??捎杀绢I域的技術人員來設計和使用該類型的系統(tǒng), 并且這樣的系統(tǒng)預期用于本文所描述的方法。如本說明書和所附權利要求中所使用的,除非上下文明確地指出,否則單數(shù)形式 “一個”、“一種”和“所述的”包括復數(shù)所指物。因此,例如,閱讀本公開后對本領域的技術人員顯而易見的是,提及的“所述的方法”包括本文所描述類型的和/或一個或多個方法和/
或步驟,等等。應理解,上述詳細的說明和下列實施例僅是舉例說明性的并且不應理解為對本發(fā)明的范圍的限制。對本領域的技術人員顯而易見的是,在不脫離本發(fā)明的精神和范圍的情況下,可對本公開的實施方案做出各種改變和修改。此外,出于描述和公開的目的,確定的全部專利、專利申請和出版物明確地以引用的方式并入本文,例如,這些出版物中描述的方法可與本發(fā)明結合使用。這些出版物僅用于本申請的申請日之前的公開。在這點上任何信息都不能被解釋為本發(fā)明者因先前發(fā)明或因任何其它原因而無權先于這些公開的權利的認可。關于日期的所有聲明或關于這些文件的內容的表述基于申請者可獲得的信息,并且不構成對這些文件的日期或內容的正確性的任何認可。本發(fā)明可被定義為下列編號的段落的任一個。段落1 一種用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便所述靶ssDNA 分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)可被轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法,所述方法包括步驟 (a)將在其5'-末端具有預先指定的序列5' -X0^S1,S2,S3>S4,S5-3'的靴ssDNA(其中所述&可以是A、C、G或T并且SrS2JrS4J5是預定的寡核苷酸密碼OQ的前5個位置中的序列)與包含多個寡核苷酸探針的探針文庫接觸,其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突,其中所述雙鏈DNA部分包含IIS型限制性內切酶的識別序列(R' /R) 和唯一地對應于靶ssDNA中的待轉化的核苷酸(χ)的所述預定的寡核苷酸密碼(X' x/xx), 其中存在可特異性結合R' /R并且切割所述第二單鏈懸突中的所述識別序列的外側的IIS 型限制性內切酶,其中所述第一單鏈懸突包含與預定的寡核苷酸密碼的前5個位置中的序列(5' -SrSpSySpS5-S')互補的序列 5' -S' 5、S' 4、S' 3>S' 2、S':,其后是由探針文庫中全部4種核苷酸代表的位置(η);其中具有序列5' -χ'、η、η、η、η、η-3'的所述第二單鏈懸突包含與待轉化的核苷酸(χ)互補的核苷酸(x'),其后是由探針文庫中全部4 種核苷酸代表的5個位置,并且其中在允許文庫中的多個探針之一結合所述靶ssDNA分子并且與其形成完全匹配的雙鏈體的條件下進行接觸,(b)利用連接酶將步驟(a)中所述結合的探針的更短的鏈的兩端與靶ssDNA連接,從而形成環(huán)狀分子,(c)將步驟(b)中的所述連接的分子與特異性識別存在于步驟(a)中的探針的所述雙鏈DNA部分的序列(R' /R)的 IIS型限制性內切酶接觸,其中所述酶切割待轉化的靶ssDNA的靶分子的3'末端上的至少一個核苷酸,從而從所述靶ssDNA分子的3'末端除去所述核苷酸;和(d)分離在步驟(c) 中被切割的所述探針-靶ssDNA復合物的雙鏈部分,并且洗去來自所述探針的未連接鏈的寡核苷酸;其中步驟(a)-(d)產生在其5'末端包含5' -x、Xx、R-3'的轉化的靶ssDNA分子,其中所述Xx是對應于所述靶ssDNA的被轉化的核苷酸χ的預定的寡核苷酸密碼。段落2: —種用于始于其3'末端轉化靶單鏈DNA (ssDNA)分子以便將所述靶 ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法,所述方法包括步驟 (a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突;其中所述雙鏈DNA部分包含側翼有所述第一和第二單鏈懸突的5' -3'核苷酸序列X' x和與X',核苷酸序列互補的互補3' -5'核苷酸序列Xx,其中所述Xx包含唯一地對應于核苷酸A、T、 G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的所述核苷酸;并且其中所述探針的雙鏈部分包含IIS型限制性內切酶識別位點(R),其切割位點在探針與所述靶ssDNA的 3'末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中所述第一單鏈懸突位于X' 側,并且所述第二單鏈懸突位于X'側,其中所述Xx在其5'末端上包含存在于所述靶ssDNA分子的5'末端上的所述預先指定的核苷酸序列;其中所述第二單鏈懸突在X' 末端并且所述第一單鏈懸突在X' 之前;其中所述第二單鏈懸突在緊鄰X',的3'末端的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3個隨機核苷酸;并且其中所述第一單鏈懸突在緊鄰X' x的5'末端上的核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于所述靶ssDNA中的所述預先指定的序列互補的核苷酸序列;并且其中在允許多個探針之一與所述靶ssDNA分子結合并且與其形成雙鏈體的條件下進行所述接觸;(b)將步驟(a)中的結合的所述雙鏈寡核苷酸的兩端與所述靶ssDNA序列連接,從而形成環(huán)狀分子;(c)將步驟(b)中的連接的分子與對應于存在于步驟(a)中的所述雙鏈DNA部分中的所述IIS型限制性內切酶識別位點的IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA的3' 末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA分子的3'末端除去待轉化的所述核苷酸。(d)將步驟(c)中的所述連接且被切割的探針的所述雙鏈部分與所述靶ssDNA 分離并且洗去所述探針的未連接的鏈;其中步驟(a)-(d)產生轉化的靶ssDNA分子,其在其 5'末端包含對應于所述靶ssDNA的被轉化的核苷酸的所述Xx預定的寡核苷酸密碼,并且其中所述Xx預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的5'末端上的所述轉化的核苷酸之后。段落3 —種用于始于其5'末端轉化靶單鏈(ssDNA)靶分子以便將所述ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法,所述方法包括步驟(a)將在其3'末端具有預先指定的核苷酸序列的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突,其中所述雙鏈DNA部分包含側翼有所述第一和第二單鏈懸突的5' -3'核苷酸序列Xx'和與Xx'核苷酸序列互補的互補3' -5'核苷酸序列Xx,其中所述Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的所述核苷酸;并且其中所述探針的雙鏈部分還包含IIS型限制性內切酶識別位點(R),其切割位點在所述探針與所述靶ssDNA的5' 末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中所述Xx在其3'末端包含存在于所述靶ssDNA分子的3'末端上的所述預先指定的核苷酸序列;其中所述第一單鏈懸突位于X',的3'側并且所述第二單鏈懸突位于X' 5’側;其中所述第二單鏈懸突在緊鄰X' x的5’末端上的所述核苷酸的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3個隨機核苷酸;并且其中所述第一單鏈懸突在緊鄰X' x 的3'末端上的所述核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于所述靶 ssDNA中的所述預先指定的序列互補的核苷酸序列;并且其中在允許所述多個雙鏈寡核苷酸之一結合所述靶ssDNA分子的條件下進行所述接觸,從而形成環(huán)狀分子;(b)將步驟(a) 中的所述結合的探針與所述靶ssDNA序列連接;(c)將步驟(b)中的所述連接的分子與對應于存在于步驟(a)中的所述雙鏈DNA部分中的所述IIS型限制性內切酶識別位點的IIS 型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA的5'末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA分子的5'末端除去待轉化的所述核苷酸;和(d)將步驟(c)中的所述連接且被切割的探針的所述雙鏈部分與所述靶ssDNA分離, 并且洗去所述探針的未連接的鏈;其中步驟(a)-(d)產生轉化的靶ssDNA分子,其在其3' 末端包含對應于所述靶ssDNA的被轉化的核苷酸的所述Xx預定的寡核苷酸密碼,并且其中所述Xx預定的寡核苷酸密碼在存在于轉化的所述靶ssDNA分子的3'末端上的所述轉化的核苷酸之前。段落4 如段落1至3所述的方法,其中重復所述步驟a_d不止一次。段落5 如段落1至4所述的方法,其中將所述靶ssDNA分子固定在固體載體上。段落6 如段落1、2、4或5所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其3'末端包含限制性內切酶識別位點。段落7 如段落3至5所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其5'末端包含限制性內切酶識別位點。段落8 如段落1至7所述的方法,其中所述靶ssDNA上所述預先指定的序列M在約3個核苷酸至約12個核苷酸的范圍內。段落9 如段落1至8所述的方法,其中所述IIS型限制性內切酶選自AlwI、BCCI、 BsmAl、EarI、MlyI、PleI、BmrI、BsaI、BsmBl、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、HphI、 MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、BpuEI、 BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eamll04I、Ksp632I、PpsUchI、BfiI、Bso31I、BspTNI、 Eco31I、Esp3I、FauI、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、BseMII、 TspDTI、TspGffI、BseXI、BstVlI、Eco57I、Eco57MI、GsuI、PsrI 和 MmeI。段落10:如段落1至9所述的方法,其中所述I I S型限制性內切酶是Mmel。段落11 如段落1至10所述的方法,其中所述Xx包含第一核酸序列Xxl和第二核酸序列Xxll,其中所述)(xl和Xxll形成唯一地對應于核苷酸A、T、G或C的二進制的預先指定的寡核苷酸密碼。段落12 如段落1至11所述的方法,其中所述Xxl和)(xII在長度上各自在約4個核苷酸至約30個核苷酸的范圍內。段落13 如段落1至12所述的方法,其中所述、和Xxll在長度上各自為12個核苷酸。段落14 如段落1至13所述的方法,其中所述第一懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。段落15 如段落1至14所述的方法,其中所述第二懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。段落16 如段落1至15所述的方法,其中所述靶ssDNA在長度上在約5個核苷酸至約3,000, 000個核苷酸的范圍內。段落17 如段落1至16所述的方法,其中同時轉化多個靶ssDNA分子。段落18 如段落1至17所述的方法,其中在包含靶ssDNA核酸的不均勻混合物的樣品中進行所述轉化。段落19 如段落1至18所述的方法,其中在所述方法的任何步驟中不使用聚合酶。段落20 如段落1至19所述的方法,其中所述探針文庫具有在16至1,048,576種不同寡核苷酸的范圍內的復雜度。段落21 如段落1至20所述的方法,其中所述靶ssDNA分子來源于哺乳動物。段落22 如段落21所述的方法,其中所述哺乳動物是人。段落23 如段落1至22所述的方法,其中在單分子水平上測定所述轉化的ssDNA 分子的序列。段落M 如段落23所述的方法,其中所述測序包括標記的分子信標。段落25 如段落M所述的方法,其中所述標記的分子信標是熒光分子信標。段落沈如段落25所述的方法,其中所述熒光分子信標結合所述轉化的ssDNA分子的Xx序列。段落27 如段落沈所述的方法,其中引導具有結合的熒光分子信標的所述轉化的 ssDNA分子的所述Xx序列通過直徑小于2nm的納米孔,其中當所述轉化的ssDNA分子通過所述納米孔時,所述熒光分子信標被除去,其中所述熒光分子信標的除去產生閃光,其中所述閃光的順序產生所述靶ssDNA序列的所述序列。段落觀一種用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶 ssDNA分子的所述核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的所述核苷酸順序的方法,所述方法包括步驟(a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許所述第一文庫中只有一種探針與所述靶ssDNA的5'末端雜交并且所述第二探針文庫中只有一種探針與所述靶ssDNA分子的3'末端雜交的條件下進行所述接觸;(b)將步驟(a)中的所述雜交的探針與所述靶ssDNA序列連接;(c)將步驟 (b)中的所述連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸與所述第二探針文庫的所述連接的探針分離;(d)將來自所述第一探針文庫的所述連接的探針的3'末端與所述第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子。(e)將步驟(d)中的所述連接的分子與IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的靶ssDNA 的3'末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA分子的3'末端除去待轉化的所述核苷酸;和(f)將步驟(e)中的每個所述連接且被切割的探針的所述雙鏈部分與所述靶ssDNA分離,并且洗去每個探針的所述未連接的鏈;其中步驟(a)-(f)產生轉化的靶 ssDNA分子,其在其5'末端包含來自所述第二探針文庫的所述探針的對應于所述靶ssDNA 的所述轉化的核苷酸的預定的寡核苷酸密碼,和來自所述第一探針文庫的所述探針的不變序列,并且其中所述預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的5'末端上的所述轉化的核苷酸之前。段落四一種用于始于其5'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶 ssDNA分子的所述核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的所述核苷酸順序的方法,所述方法包括步驟(a)將在其3'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許在所述第一文庫中只有一種探針與所述靶ssDNA的3'末端雜交并且在所述第二探針文庫中只有一種探針與所述靶ssDNA分子的5’末端雜交的條件下進行所述接觸;(b)將步驟(a)中的所述雜交的探針與所述靶ssDNA序列連接;(c)將步驟(b)中的所述連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸與所述第二探針文庫的連接的探針分離;(d)將來自所述第一探針文庫的連接的探針的3'末端與所述第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子(e)將步驟(d)中的所述連接的分子與IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA 的5'末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA分子的5'末端除去待轉化的所述核苷酸;和(f)將步驟(e)中的每個所述連接且被切割的探針的所述雙鏈部分與所述靶ssDNA分離,并且洗去每個探針的所述未連接的鏈;其中步驟(a)-(f)產生轉化的靶 ssDNA分子,其在其3'末端包含來自所述第二探針文庫的所述探針的對應于所述靶ssDNA 的所述轉化的核苷酸的預定的寡核苷酸密碼,和來自所述第一探針文庫的所述探針的不變序列,并且其中所述預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的3'末端上的所述轉化的核苷酸之前。段落30 如段落觀所述的方法,其中所述第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含預先指定的核苷酸間隔區(qū)序列(P')和與所述間隔區(qū)序列互補的序列 (P),其中所述第一單鏈懸突在緊鄰P'的5'末端的位置上包含A、T、G或C和與所述靶 ssDNA分子上的所述預先指定的序列互補的核苷酸,并且其中所述第二單鏈懸突包含與所述第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的 5'末端。段落31 如段落觀或30所述的方法,為了轉化始于其3'末端的靶單鏈DNA分子, 所述第二探針文庫包含多個寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含側翼接有所述第一和第二單鏈懸突的5' -3'核苷酸序列X' x 和互補核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預定的寡核苷酸密碼,其中所述探針的所述雙鏈部分還包含IIS型限制性內切酶識別位點,其相應的切割位點在所述探針與待轉化的所述靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中X在其5'末端上包含存在于所述靶ssDNA分子上的所述預先指定的序列;其中所述第一單鏈懸突包含與存在于所述靶ssDNA分子上的所述預先指定的序列互補的核苷酸序列;并且其中所述第二單鏈懸突在緊鄰X',的3'末端上的核苷酸的位置上包含與待轉化的所述靶ssDNA中的所述核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中所述第二探針文庫還包含含有與所述第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中所述封閉寡核苷酸的5'末端和所述第一單鏈懸突的5'末端未被磷酸化。段落32 如段落四所述的方法,其中所述第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含預先指定的核苷酸間隔區(qū)序列(P')和與所述間隔區(qū)序列互補的序列 (P),其中所述第一單鏈懸突在緊鄰P'的3'末端的位置上包含A、T、G或C和與所述靶 ssDNA分子上的所述預先指定的序列互補的核苷酸,并且其中所述第二單鏈懸突包含與所述第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的 3'末端。段落33 如段落四或32所述的方法,其中所述第二探針文庫包含多個寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含側翼有所述第一和第二單鏈懸突的5' -3'核苷酸序列X' x和互補核苷酸序列Xx,其中所述Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預先指定的寡核苷酸密碼,其中所述探針的所述雙鏈部分還包含IIS型限制性內切酶識別位點,其相應的切割位點在所述探針與待轉化的所述靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中所述X在其3'末端包含存在于所述靶ssDNA分子上的所述預先指定的序列;其中所述第一單鏈懸突包含與存在于所述靶ssDNA分子上的所述預先指定的序列互補的核苷酸序列;并且其中所述第二單鏈懸突在緊鄰X',的5'末端上的所述核苷酸的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中所述第二探針文庫還包含含有與所述第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中所述封閉寡核苷酸的5'末端和所述第一單鏈懸突的5'末端未被磷酸化。段落34 如段落28至33所述的方法,其中重復所述步驟a_f不止一次。段落35 如段落28至34所述的方法,其中將所述靶ssDNA分子固定在固體載體上。段落36 如段落觀、30、31、34或35所述的方法,其中所述靶ssDNA分子上的所述預先指定的序列還在其3'末端包含限制性內切酶識別位點。段落37 如段落四、30、33、34或35所述的方法,其中所述靶ssDNA分子上的所述預先指定的序列還在其5'末端包含限制性內切酶識別位點。段落38 如段落觀至37所述的方法,其中所述靶ssDNA上的所述預先指定的序列在約3個核苷酸至約12個核苷酸的范圍內。段落39 如段落觀至38所述的方法,其中所述IIS型限制性內切酶位點選自 AlwI、BccI、BsmAl、Earl、MlyI、PleI、BmrI、BsaI、BsmBl、FauI、HpyAV、MnlI、SapI、BbsI、 BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、 BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eaml 1041、Ksp632I、PpsI、SchI、Bfil、 Bso31I、BspTNI、Eco31I、Esp3I、Faul、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I、 LweI、AarI、BseMII、TspDTI、TspGffI、BseXI、BstVlI、Eco57I、Eco57MI、GsuI、PsrI 或 MmeI 位點。段落40 :如段落28至39所述的方法,其中所述IIS型限制性內切酶位點是MmeI位點。 段落41 如段落觀至40所述的方法,其中所述Xx包含第一核酸序列Xxl和第二核酸序列Xxll,其中所述)(xl和Xxll形成唯一地對應于核苷酸A、T、G或C的二進制的預先指定的寡核苷酸密碼。段落42 如段落觀至41所述的方法,其中所述)(xI和Xxll在長度上各自在約4個核苷酸至約25個核苷酸的范圍內。段落43 如段落觀至42所述的方法,其中所述)(xI和Xxll在長度上各自為12個核苷酸。段落44 如段落觀至43所述的方法,其中所述第一懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。段落45 如段落觀至44所述的方法,其中所述第二懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。段落46 如段落28至45所述的方法,其中所述靶ssDNA在長度上在約5個核苷酸至約3,000, 000個核苷酸的范圍內。段落47 如段落28至46所述的方法,其中同時轉化所述多個靶ssDNA分子。段落48 如段落28至47所述的方法,其中在包含靶ssDNA核酸的不均勻混合物的樣品中進行所述轉化。段落49 如段落觀至48所述的方法,其中在所述方法中的任何步驟中不使用聚合酶。段落50 如段落28至49所述的方法,其中所述探針文庫具有在16至1,048,576 種不同寡核苷酸的范圍內的復雜度。段落51 如段落28至50所述的方法,其中所述靶ssDNA分子來源于哺乳動物。段落52 如段落49所述的方法,其中所述哺乳動物是人。段落53 如段落28至52所述的方法,其中在單分子水平上測定所述轉化的ssDNA 分子的序列。段落M 如段落51所述的方法,其中所述測序包括標記的分子信標。段落55 如段落M所述的方法,其中所述標記的分子信標是熒光分子信標。段落56 如段落55所述的方法,其中所述熒光分子信標結合所述轉化的ssDNA分子的Xx序列。段落57 如段落56所述的方法,其中引導具有結合的熒光分子信標的所述轉化的 ssDNA分子的所述Xx序列通過直徑小于2nm的納米孔,其中當所述轉化的ssDNA分子通過所述納米孔時,所述熒光分子信標被除去,其中所述熒光分子信標的除去產生閃光,其中所述閃光的順序產生所述靶ssDNA序列的序列。
實施例實施例1 環(huán)狀DNA轉化(⑶C)靶ssDNA靶分子始于其5'末端的轉化。在本實施例中(1)我們利用100個堿基長的DNA模板,將一個堿基轉化(胞嘧啶) 顯示為兩位(0,1),( 我們通過在探針文庫中使用‘肌苷’用于替代堿基配對顯示,探針文庫減小一個數(shù)量級而轉化的準確度或產率無損失,以及C3)我們不使用模板的表面固定或任何微流體方法顯示1個堿基轉化的高產率。由于本文所描述的方法與芯片實驗室技術完全相容,因此這些方法將使轉化的產率和效率增加許多數(shù)量級。CDC原理將三步法用于將模板DNA的核苷酸轉化成其相應的2位序列,如圖6中所舉例說明的。最初通過在5'末的端磷酸化并且在3'末端連接至對應于IIS型限制性內切酶的識別位點的6堿基生物素化寡核苷酸來修飾模板DNA。這是以前的修飾步驟,可同時對數(shù)千個不同模板進行該步驟,并且其在所有隨后的轉化循環(huán)中得到自我保留。將模板DNA表面固定至抗生蛋白鏈菌素涂覆的磁珠,在珠粒上具有仔細選擇的抗生蛋白鏈菌素濃度,以避免模板擁擠。使用的通用探針使用的通用探針是帶有仔細選擇的側翼序列文庫的一組4個2 位組合(2-bit combinations) (2 位組合(0,0)、(0,1)、(1,0)和(1,1))的超集。通用探針的上游引物(TP,33聚體)包含位于3'末端具有IIS型限制位點的期望的2位組合(紅色和藍色區(qū)域)的序列。下游引物(ΒΡ,45聚體)包含互補序列以及在3'末端側翼的6 個堿基(5個對應于限制位點的堿基(用磚式框(brick style box)表示)和1個脫氧核糖-肌苷(dl)堿基(用空白框表示))。在5'末端,使用13個堿基懸突,其對應于限制位點(7個堿基)、一個特定的核苷酸(用正方形斑點框(square speckled box)表示的A、T、 G或C)和5個隨機核苷酸(n,利用波形線框表示)。對于鄰近限制位點的每個特定的核苷酸,文庫包含5'末端上的5個核苷酸的全部可能的45個組合。總文庫大小將為下游引物的5'末端上6個堿基的46個組合。成批次的步驟I-步驟II的成功執(zhí)行在步驟I中,將修飾的模板DNA(100個堿基的ssDNA)與通用探針集雜交并且連接。模板DNA只與其中通用探針的特定核苷酸與模板的5'末端上的末端核苷酸互補的探針雜交和連接。利用連接酶對末端互補的該選擇性來獲得高特異性,以僅從文庫中挑選出正確的通用探針并且洗去其它非特異性探針。我們發(fā)現(xiàn),通過用肌苷堿基替代下游引物的 5'上的5個隨機堿基中的2個核苷酸(以“n-n-i-n-i”的形式),我們可將文庫大小從46 減小至44,仍然獲得極高的特異性、效率和產率。模板在3'末端不與任何探針連接,因為通用探針的5'末端未被磷酸化。這確保了模板DNA不因與非特異性通用探針的連接而發(fā)生損失(結果示于圖7A中)。在步驟II中,選擇的探針的5'被磷酸化并且連接以封閉環(huán)。使用T4多核苷酸激酶(T4PNK)來磷酸化上游引物的游離5'末端,然后連接酶將模板DNA的游離3'末端連接至通用探針,從而環(huán)化模板DNA (圖7B)。最后在步驟III中,與IIS型限制性內切酶的消化反應,接著dsDNA的解鏈,除去了下游引物,從而導致末端核苷酸從模板的5'末端的釋放以及特異性選擇的在其3'末端具有適當?shù)?位的探針的連接。限制性消化酶保留消化磷酸化的5'末端(圖7C)。在該步驟之后,模板再次準備好(無任何進一步的修飾)以經(jīng)歷下一輪結合如步驟I中的通用探針的新制備的緩沖液的轉化。正確⑶C的證明我們顯示模板DNA上單個胞嘧啶堿基(圖7)至其相應的為(0, 1)的2位序列的高產率轉化并且利用滾環(huán)擴增(RCA)測定對其進行確認。在完成步驟I至 III后,將終產物分入4個試管并且與僅相異于1個堿基的4種RCA引物雜交。末端胞嘧啶的正確轉化應當導致帶有上游引物(具有正確的2位序列)的單鏈DNA模板連接至以末端胞嘧啶加帽的模板的3'末端(圖8A)。 滾環(huán)擴增(RCA)測試測定將4種只具有一個特定的堿基差異的寡核苷酸設計為環(huán)化終產物的引物。RCA引物的32個堿基的序列從5'至3'末端包含8個與1位序列互補的堿基、8個與限制性內切酶識別位點互補的堿基、1個特定的堿基(A、T、G或C)和15個與原始100個堿基的模板的末端胞嘧啶之后的5'序列互補的堿基。將在中心具有1個堿基差異的4種RCA引物單獨地與CDC轉化的終產物混合,使用連接酶和進行性I^i29 DNA 聚合酶進行連接和擴增。對于擴增,RCA對末端堿基特性非常敏感,因此在此用作我們轉化方法的嚴格檢驗。如在圖8B中0. 8%瓊脂糖凝膠中所看到的,只有在中心具有正確的特定堿基的引物才導致擴增的DNA,從而為我們提供了由我們的三步CDC轉化法產生的胞嘧啶轉化的明確證明。作為對照實驗,與對照模板TP150完全互補的引物TP20-20,當與DNA聚合酶混合時,在連接酶存在的情況下(泳道幻顯示為擴增,在利用連接酶的模板環(huán)化不存在的情況無擴增產物(泳道2)。
權利要求
1.一種用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持靶s sDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其5'-末端具有預先指定的序列5'ι。、SpSySySpS5-S'的靴ssDNA與包含多個寡核苷酸探針的探針文庫接觸,其中&可以是A、C、G或T并且S” S2、S3> S4、S5是預定的寡核苷酸密碼(Xx)的前5個位置中的序列,其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突,其中所述雙鏈DNA部分包含IIS型限制性內切酶的識別序列(R' /R) 和唯一地對應于所述靶ssDNA中的待轉化的核苷酸(χ)的預定的寡核苷酸密碼(X' x/Xx), 其中存在可特異性結合R' /R并且切割所述第二單鏈懸突內的所述識別序列的外側的IIS 型限制性內切酶,其中所述第一單鏈懸突包含與預定的寡核苷酸密碼的前5個位置中的序列(5' -SpSySpSpS5-S')互補的序列 5' -S' 5、S' 4、S' 3、S' 2、S'丨,緊接其后是由所述探針文庫中全部4種核苷酸代表的位置(η);其中具有序列5' -χ'、η、η、η、η、 η-3'的所述第二單鏈懸突包含與待轉化的核苷酸(χ)互補的核苷酸(χ'),緊接其后是由探針文庫中全部4種核苷酸代表的5個位置,并且其中在允許所述文庫中的多個探針之一結合所述靶ssDNA分子并且與其形成完全匹配的雙鏈體的條件下進行接觸;(b)利用連接酶將步驟(a)中所述結合的探針的更短的鏈的兩端與所述靶ssDNA連接, 從而形成環(huán)狀分子;(c)將步驟(b)中所述連接的分子與特異性識別存在于步驟(a)中探針的所述雙鏈 DNA部分的序列(R' /R)的I I S型限制性內切酶接觸,其中所述酶切割待轉化的所述靶 ssDNA的靶分子的3'末端上的至少一個核苷酸,從而從所述靶ssDNA分子的3'末端除去所述核苷酸;和(d)將在步驟(c)中被切割的所述探針-靶ssDNA復合物的雙鏈部分分離,并且從所述探針的未連接鏈上洗去所述寡核苷酸;其中步驟(a)-(d)產生在其5'末端包含5' -x、Xx、R-3'的轉化的靶ssDNA分子,其中Xx是對應于所述靶ssDNA的被轉化的核苷酸χ的預定的寡核苷酸密碼。
2.一種用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突;其中所述雙鏈DNA部分包含側翼連接有所述第一和第二單鏈懸突的5' -3'核苷酸序列X' x和與核苷酸序列X' χ互補的互補3' -5'核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、 T、G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的核苷酸;并且其中所述探針的雙鏈部分包含IIS型限制性內切酶識別位點(R),其切割位點在所述探針與所述靶ssDNA 的3'末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中所述第一單鏈懸突位于X'側,并且所述第二單鏈懸突位于X'側;其中Xx在其5'末端包含存在于所述靶ssDNA分子的5'末端上的預先指定的核苷酸序列;其中所述第二單鏈懸突位于X'末端上并且所述第一單鏈懸突在X'末端之前;其中所述第二單鏈懸突在緊鄰X',的3'末端的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3個隨機核苷酸;并且其中所述第一單鏈懸突在緊鄰X' x的5'末端上的核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于所述靶ssDNA中的預先指定的序列互補的核苷酸序列;并且其中在允許多個探針之一與所述靶ssDNA分子結合并且與其形成雙鏈體的條件下進行所述接觸;(b)將步驟(a)中所述結合的雙鏈寡核苷酸的兩端與所述靶ssDNA序列連接,從而形成環(huán)狀分子;(c)將步驟(b)中所述連接的分子與對應于存在于步驟(a)中的所述雙鏈DNA部分中的IIS型限制性內切酶識別位點的IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA的3 ‘末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA 分子的3'末端除去待轉化的核苷酸;和(d)將步驟(c)中所述連接的且被切割的探針的雙鏈部分與所述靶ssDNA分離并且洗去所述探針的未連接的鏈;其中步驟(a)-(d)產生轉化的靶ssDNA分子,其在其5'末端包含對應于所述靶ssDNA 的被轉化的核苷酸的Xx預定的寡核苷酸密碼,并且其中Xx預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的5'末端上的被轉化的核苷酸之后。
3. 一種用于始于其5'末端轉化靶單鏈(ssDNA)靶分子以便將所述ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法,所述方法包括以下步驟(a)將在其3'末端具有預先指定的核苷酸序列的靶ssDNA分子與包含多個探針的寡核苷酸探針文庫接觸;其中每個探針包含雙鏈DNA部分以及第一和第二單鏈懸突,其中所述雙鏈DNA部分包含側翼連接有所述第一和第二單鏈懸突的5' -3'核苷酸序列Xx'和與核苷酸序列Xx'互補的互補3' -5'核苷酸序列k,其中k包含唯一地對應于核苷酸A、 T、G或C的一組順序的預定的寡核苷酸密碼,并且代表待轉化的核苷酸;并且其中所述探針的雙鏈部分還包含IIS型限制性內切酶識別位點(R),其切割位點在所述探針與所述靶 ssDNA的5'末端連接后完成,所述靶ssDNA的至少一個核苷酸有待轉化;其中k在其3' 末端包含存在于所述靶ssDNA分子的3'末端上的預先指定的核苷酸序列;其中所述第一單鏈懸突位于X' χ的3'側并且所述第二單鏈懸突位于X' χ的5’側;其中所述第二單鏈懸突在緊鄰W的5’末端上的核苷酸的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸并且還包含至少3個隨機核苷酸;并且其中所述第一單鏈懸突在緊鄰)(X'的 3'末端上的核苷酸的位置上包含至少一個隨機核苷酸并且還包含與存在于所述靶ssDNA 中的預先指定的序列互補的核苷酸序列;并且其中在允許多個雙鏈寡核苷酸之一結合所述靶ssDNA分子的條件下進行所述接觸,從而形成環(huán)狀分子;(b)將步驟(a)中所述結合的探針與所述靶ssDNA序列連接;(c)將步驟(b)中所述連接的分子與對應于存在于步驟(a)的雙鏈DNA部分中的IIS 型限制性內切酶識別位點的IIS型限制性內切酶接觸,其中IIS型限制性內切酶在待轉化的所述靶ssDNA的5'末端上的至少一個核苷酸之后切割,從而從所述靶ssDNA分子的5' 末端除去待轉化的核苷酸;和(d)將步驟(c)中所述連接的且被切割的探針的雙鏈部分與所述靶ssDNA分離,并且洗去所述探針的未連接的鏈;其中步驟(a)-(d)產生轉化的所述靶ssDNA分子,其在其3'末端包含對應于所述靶 ssDNA的被轉化的核苷酸的k預定的寡核苷酸密碼,并且其中k預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的3'末端上的被轉化的核苷酸之前。
4.如權利要求1至3中任一項所述的方法,其中重復步驟a_d不止一次。
5.如權利要求1至4中任一項所述的方法,其中將所述靶ssDNA分子固定在固體載體上。
6.如權利要求1、2、4或5中任一項所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其3'末端包含限制性內切酶識別位點。
7.如權利要求3至5中任一項所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其5'末端包含限制性內切酶識別位點。
8.如權利要求1至7中任一項所述的方法,其中所述靶ssDNA上所述預先指定的序列 M在約3個核苷酸至約12個核苷酸的范圍內。
9.如權利要求1至8中任一項所述的方法,其中所述IIS型限制性內切酶選自AlwI、 BccI、BsmAl、EarI、MlyI、PleI、BmrI、BsaI、BsmBl、FauI、HpyAV、MnlI、SapI、BbsI、BciVI、 HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、BpmI、 BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eamll04I、Ksp632I、PpsI、SchI、BfiI、Bso31I、 BspTNI、Eco31I、Esp3I、FauI、SmuI、BfuIJpiI、BpuAI、BstV2I、AsuHPI、Acc36I、LweI、AarI、 BseMII、TspDTI、TspGffI、BseXI、BstVlI、Eco57I、Eco57MI、GsuI、PsrI 和 MmeI。
10.如權利要求1至9中任一項所述的方法,其中所述IIS型限制性內切酶是Mmel。
11.如權利要求1至10中任一項所述的方法,其中Xx包含第一核酸序列Xxl和第二核酸序列Xxll,其中L和Xxll形成唯一地對應于核苷酸A、T、G或C的二進制的預先指定的寡核苷酸密碼。
12.如權利要求1至11中任一項所述的方法,其中Xxl和Xxll在長度上各自在約4個核苷酸至約30個核苷酸的范圍內。
13.如權利要求1至12中任一項所述的方法,其中Xxl和Xxll在長度上各自為12個核苷酸。
14.如權利要求1至13中任一項所述的方法,其中所述第一懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。
15.如權利要求1至14中任一項所述的方法,其中所述第二懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。
16.如權利要求1至15中任一項所述的方法,其中所述靶ssDNA在長度上在約5個核苷酸至約3,000, 000個核苷酸的范圍內。
17.權利要求1至16中任一項所述的方法,其中同時轉化多個靶ssDNA分子。
18.如權利要求1至17中任一項所述的方法,其中在包含靶ssDN核酸的不均勻混合物的樣品中進行所述轉化。
19.如權利要求1至18中任一項所述的方法,其中在所述方法的任何步驟中不使用聚合酶。
20.如權利要求1至19中任一項所述的方法,其中所述探針文庫具有在16至 1,048,576種不同寡核苷酸的范圍內的復雜度。
21.權利要求1至20中任一項所述的方法,其中所述靶ssDNA分子來源于哺乳動物。
22.如權利要求21所述的方法,其中所述哺乳動物是人。
23.如權利要求1至22中任一項所述的方法,其中在所述單分子水平上測定所述轉化的ssDNA分子的序列。
24.如權利要求23所述的方法,其中所述測序包括標記的分子信標。
25.如權利要求M所述的方法,其中所述標記的分子信標是熒光分子信標。
26.如權利要求25所述的方法,其中所述熒光分子信標結合所述轉化的ssDNA分子的 Xx序列。
27.如權利要求沈所述的方法,其中引導具有結合的熒光分子信標的所述轉化的 ssDNA分子的所述Xx序列通過直徑小于2nm的納米孔,其中當所述轉化的ssDNA分子通過所述納米孔時,所述熒光分子信標被除去,其中所述熒光分子信標的除去產生閃光,其中所述閃光的順序產生所述靶ssDNA序列的序列。
28.一種用于始于其3'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法,所述方法包括以下步驟(a)將在其5'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許所述第一文庫中只有一種探針與所述靶ssDNA的5'末端雜交并且所述第二探針文庫中只有一種探針與所述靶ssDNA分子的3'末端雜交的條件下進行所述接觸;(b)將步驟(a)中所述雜交的探針與所述靶ssDNA序列連接;(c)將步驟(b)中所述連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸與所述第二探針文庫的連接的探針分離;(d)將來自所述第一探針文庫的連接的探針的3'末端與所述第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子;(e)將步驟(d)中所述連接的分子與IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA的3'末端上的至少一個核苷酸之后切割,從而從所述靶 ssDNA分子的3'末端除去待轉化的核苷酸;和(f)將步驟(e)中每個連接的且被切割的探針的雙鏈部分與所述靶ssDNA分離,并且洗去每個探針的未連接的鏈;其中步驟(a)-(f)產生轉化的靶ssDNA分子,其在其5'末端包含來自所述第二探針文庫的所述探針的對應于所述靶ssDNA的被轉化的核苷酸的預定的寡核苷酸密碼和來自所述第一探針文庫的所述探針的不變的序列,并且其中所述預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的5'末端上的被轉化的核苷酸之前。
29.一種用于始于其5'末端轉化靶單鏈DNA(ssDNA)分子以便將所述靶ssDNA分子的核苷酸腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)或胸腺嘧啶(T)轉化成預定的寡核苷酸密碼并且在轉化過程中保持所述靶ssDNA的核苷酸順序的方法。所述方法包括以下步驟(a)將在其3'末端具有預先指定的核苷酸序列的靶ssDNA分子與第一探針文庫和第二探針文庫接觸,其中在允許所述第一文庫中只有一種探針與所述靶ssDNA的3'末端雜交并且所述第二探針文庫中只有一種探針與所述靶ssDNA分子的5’末端雜交的條件下進行所述接觸;(b)將步驟(a)中所述雜交的探針與所述靶ssDNA序列連接;(c)將步驟(b)中所述連接的分子暴露于低解鏈溫度,從而將封閉寡核苷酸與所述第二探針文庫的連接的探針分離;(d)將來自所述第一探針文庫的連接的探針的3'末端與所述第二探針文庫的連接的探針的5'末端雜交,從而形成環(huán)狀分子;(e)將步驟(d)中所述連接的分子與IIS型限制性內切酶接觸,其中所述IIS型限制性內切酶在待轉化的所述靶ssDNA的5'末端上的至少一個核苷酸之后切割,從而從所述靶 ssDNA分子的5'末端除去待轉化的核苷酸;和(f)將步驟(e)中每個連接的且被切割的探針的雙鏈部分與所述靶ssDNA分離,并且洗去每個探針的未連接的鏈;其中步驟(a)-(f)產生轉化的靶ssDNA分子,其在其3'末端包含來自所述第二探針文庫的所述探針的對應于所述靶ssDNA的被轉化的核苷酸的預定的寡核苷酸密碼和來自所述第一探針文庫的所述探針的不變的序列,并且其中所述預定的寡核苷酸密碼在存在于所述轉化的靶ssDNA分子的3'末端上的被轉化的核苷酸之前。
30.如權利要求觀所述的方法,其中所述第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含預先指定的核苷酸間隔區(qū)序列(P')和與所述間隔區(qū)序列互補的序列(P),其中所述第一單鏈懸突在緊鄰P'的5'末端的位置上包含A、T、G或C和與所述靶ssDNA分子上的預先指定的序列互補的核苷酸,并且其中所述第二單鏈懸突包含與所述第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的5'末端。
31.如權利要求觀或30所述的方法,為了始于其3'末端轉化靶單鏈DNA分子,所述第二探針文庫包含多個寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含側翼連接有所述第一和第二單鏈懸突的5' -3'核苷酸序列X',和互補核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預定的寡核苷酸密碼,其中所述探針的雙鏈部分還包含IIS型限制性內切酶識別位點,其相應的切割位點在所述探針與待轉化的所述靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中X在其5'末端包含存在于所述靶ssDNA分子上的預先指定的序列;其中所述第一單鏈懸突包含與存在于所述靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中所述第二單鏈懸突在緊鄰X',的3'末端上的核苷酸的位置上包含與待轉化的所述靶ssDNA 中的核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中所述第二探針文庫還包含含有與所述第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中所述封閉寡核苷酸的5'末端和所述第一單鏈懸突的5'末端未被磷酸化。
32.如權利要求四所述的方法,其中所述第一探針文庫包含多個由4種不同寡核苷酸探針組成的寡核苷酸探針,每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含預先指定的核苷酸間隔區(qū)序列(P')和與所述間隔區(qū)序列互補的序列(P),其中所述第一單鏈懸突在緊鄰P'的3'末端的位置上包含A、T、G或C和與所述靶ssDNA分子上的預先指定的序列互補的核苷酸,并且其中所述第二單鏈懸突包含與所述第二探針文庫的封閉寡核苷酸相同的第二預先指定的核苷酸序列并且被置于緊鄰P的3'末端。
33.如權利要求四或32所述的方法,其中所述第二探針文庫包含多個寡核苷酸探針, 每個探針包含雙鏈部分以及第一和第二單鏈懸突,其中所述雙鏈部分包含側翼連接有所述第一和第二單鏈懸突的5' -3'核苷酸序列X' x和互補核苷酸序列Xx,其中Xx包含唯一地對應于核苷酸A、T、G或C的一組順序的預先指定的寡核苷酸密碼,其中所述探針的雙鏈部分還包含IIS型限制性內切酶識別位點,其相應的切割位點在所述探針與待轉化的所述靶ssDNA分子的末端上的至少一個核苷酸連接后完成,其中X在其3 ‘末端包含存在于所述靶ssDNA分子上的預先指定的序列;其中所述第一單鏈懸突包含與存在于所述靶ssDNA分子上的預先指定的序列互補的核苷酸序列;并且其中所述第二單鏈懸突在緊鄰X',的5' 末端上的核苷酸的位置上包含與待轉化的所述靶ssDNA中的核苷酸互補的核苷酸,并且還包含至少3個隨機核苷酸,并且其中所述第二探針文庫還包含含有與所述第一單鏈懸突互補的3' -5'序列的封閉寡核苷酸,其中所述封閉寡核苷酸的5'末端和所述第一單鏈懸突的5'末端未被磷酸化。
34.如權利要求28至33中任一項所述的方法,其中重復步驟a_f不止一次。
35.如權利要求28至34中任一項所述的方法,其中將所述靶ssDNA分子固定在固體載體上。
36.如權利要求28至35中任一項所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其3'末端包含限制性內切酶識別位點。
37.如權利要求觀至36中任一項所述的方法,其中所述靶ssDNA分子上所述預先指定的序列還在其5'末端包含限制性內切酶識別位點。
38.如權利要求觀至37中任一項所述的方法,其中所述靶ssDNA上所述預先指定的序列在約3個核苷酸至約12個核苷酸的范圍內。
39.如權利要求觀至38中任一項所述的方法,其中所述IIS型限制性內切酶位點選自AlwI、BccI、BsmAl、EarI、MlyI、PleI、BmrI、BsaI、BsmBl、FauI、HpyAV、MnlI、SapI、BbsI、 BciVI、HphI、MboII、BfuaI、BspMI、SfaNI、HgaI、BbvI、EciI、FokI、BceAI、BsmFI、BtgZI、 BpmI、BpuEI、BsgI、AclWI、Alw26I、Bst6I、BstMAI、Eaml 1041、Ksp632I、PpsI、SchI、Bfil、 Bso31I、BspTNI、Eco31I、Esp3I、Faul、SmuI、BfuI、BpiI、BpuAI、BstV2I、AsuHPI、Acc36I, LweI、AarI、BseMII、TspDTI、TspGffI、BseXI、BstVlI、Eco57I、Eco57MI、GsuI、PsrI 或 MmeI 位點。
40.如權利要求觀至39中任一項所述的方法,其中所述IIS型限制性內切酶位點是 MmeI位點。
41.如權利要求觀至40中任一項所述的方法,其中Xx包含第一核酸序列Xxl和第二核酸序列Xxll,其中L和Xxll形成唯一地對應于核苷酸A、T、G或C的二進制的預先指定的寡核苷酸密碼。
42.如權利要求觀至41中任一項所述的方法,其中XxI*XxII在長度上各自在約4個核苷酸至約25個核苷酸的范圍內。
43.如權利要求觀至42中任一項所述的方法,其中)(xl和Xxll在長度上各自為12個核苷酸。
44.如權利要求觀至43中任一項所述的方法,其中所述第一懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。
45.如權利要求觀至44中任一項所述的方法,其中所述第二懸突在長度上在約3個核苷酸至約12個核苷酸的范圍內。
46.如權利要求28至45中任一項所述的方法,其中所述靶ssDNA在長度上在約5個核苷酸至約3,000, 000個核苷酸的范圍內。
47.如權利要求28至46中任一項所述的方法,其中同時轉化多個靶ssDNA分子。
48.如權利要求28至47中任一項所述的方法,其中在包含靶ssDNA核酸的不均勻混合物的樣品中進行所述轉化。
49.如權利要求觀至48中任一項所述的方法,其中在所述方法的任何步驟中不使用聚合酶。
50.如權利要求觀至49中任一項所述的方法,其中所述探針文庫具有在16至 1,048,576種不同寡核苷酸的范圍內的復雜度。
51.如權利要求28至50中任一項所述的方法,其中所述靶ssDNA分子來源于哺乳動物。
52.如權利要求49的方法,其中所述哺乳動物是人。
53.如權利要求觀至52中任一項所述的方法,其中在所述單分子水平上測定所述轉化的ssDNA分子的序列。
54.如權利要求51所述的方法,其中所述測序包括標記的分子信標。
55.如權利要求M所述的方法,其中所述標記的分子信標是熒光分子信標。
56.如權利要求55所述的方法,其中所述熒光分子信標結合所述轉化的ssDNA分子的 Xx序列。
57.如權利要求56所述的方法,其中引導具有結合的熒光分子信標的所述轉化的 ssDNA分子的所述Xx序列通過直徑小于2nm的納米孔,其中當所述轉化的ssDNA分子通過所述納米孔時,所述熒光分子信標被除去,其中所述熒光分子信標的除去產生閃光,其中所述閃光的順序產生所述靶ssDNA序列的序列。
全文摘要
本文描述了轉化靶單鏈DNA(ssDNA)以便每個核苷酸(或堿基)腺嘌呤(A)、胸腺嘧啶(T)、鳥嘌呤(G)和胞嘧啶(C)被轉化成預定的寡核苷酸密碼同時序列順序在轉化的ssDNA或RNA中得以保持的低成本高通量的方法。所述方法在循環(huán)過程中不需要使用DNA聚合酶并且涉及具有重復的連接和切割循環(huán)的寡核苷酸探針文庫的用途。在每個循環(huán)中,切割例如ssDNA的靶的一端(例如,5′末端或3′末端)上的一個或多個核苷酸,然后將其與所述靶ssDNA的另一端上的相應寡核苷酸密碼連接。
文檔編號C12Q1/68GK102257162SQ200980151070
公開日2011年11月23日 申請日期2009年10月29日 優(yōu)先權日2008年10月29日
發(fā)明者A·梅勒, 翁志萍 申請人:波士頓大學理事會