本發(fā)明涉及用于富集或分離包含已知核苷酸序列組分,即,編碼保守活性位點或結(jié)構(gòu)域的序列的復(fù)雜核苷酸片段的方法,該方法特別適用于含有已知序列組分的DNA片段的高通量篩選。
背景技術(shù):
DNA測序是遺傳學(xué)研究的一個主要驅(qū)動因素。隨著新的強大的高通量測序儀器變得可用,“下一代測序”技術(shù)革命正在蓄積勢頭。已經(jīng)開發(fā)出新的和改進的方法和方案以支持寬范圍的應(yīng)用,包括遺傳變異的分析。作為其一部分,已經(jīng)開發(fā)了旨在實現(xiàn)基因組亞區(qū)域如靶向的癌癥片組(caner panel)或完整人外顯子的靶向富集的方法。通過選擇性回收感興趣的基因座,與全基因組測序相比,可以顯著降低成本和勞力。
目前用于靶向富集的技術(shù)分為三類:雜交捕獲,選擇性環(huán)化和PCR擴增。在雜交捕獲技術(shù)中,將短片段庫(通常100-250個堿基對)特異性地與互補DNA片段雜交,使得可以物理捕獲和分離感興趣的序列。選擇性環(huán)化描述了其中形成包括靶序列的單鏈DNA環(huán),產(chǎn)生具有共同DNA元件的結(jié)構(gòu),然后將其用于靶序列的選擇性擴增的方法。最后,基于PCR擴增的富集通過平行進行多個長片段PCR反應(yīng)而指向靶區(qū)域。
當(dāng)前富集方法的共同點是,它們需要對靶序列的充分了解,相對純的樣品和大量的靶序列。
技術(shù)實現(xiàn)要素:
本發(fā)明提供了一種用于從混合的DNA分子的樣品中富集多種靶DNA分子中的一種的體外方法,包括以下步驟:a)提供包含一種或多種靶DNA分子的混合DNA分子和用于DNA整體擴增的試劑的液體樣品(401),
b)形成多個各自包含來自所述液體樣品的混合DNA分子的液滴(403),
c)在多個液滴中整體擴增混合DNA分子,其中每個液滴含有平均小于0.5個,優(yōu)選小于0.25個或更加優(yōu)選小于0.1個所述多個靶DNA分子中的一個(404),
d)特異性檢測包含至少一種所述靶DNA分子的液滴(405),以及
e)選擇含有至少一種所述靶DNA分子的液滴(406);其中與其在步驟(a)中的混合DNA分子樣品中的頻率相比,靶DNA分子的頻率增加0.1×(不含靶DNA的液滴數(shù))×(具有靶DNA的液滴數(shù))-1和10×(不含靶DNA的液滴數(shù))×(具有靶DNA的液滴數(shù))-1之間。
在進一步的實施方式中,本發(fā)明提供了一種用于從混合DNA分子的樣品中富集一種或多種靶DNA分子的裝置,該裝置包括用于以下的組件:
a)產(chǎn)生含有混合DNA分子的樣品的液滴,
b)等溫溫育,
c)將液滴與用于檢測一種或多種靶DNA分子的試劑混合,以及
d)特異性檢測和物理選擇包含至少一種靶DNA分子的液滴。
附圖說明
圖1:液滴排除富集與當(dāng)前的特異性DNA富集的方法的比較。實心黑線代表約10kb的DNA靶。虛線表示為了進行富集而預(yù)先需要的關(guān)于靶序列的核苷酸序列信息。NEEDLS所需的核苷酸序列信息可以位于DNA靶序列上的任何位置。
圖2:在一個反應(yīng)中多重的1、5和20個靶標顯示的1、2、3和4輪NEEDLS之后的靶DNA的富集(倍數(shù)),假設(shè)每個靶序列四個陽性液滴并且共20,000個液滴。
圖3:靶數(shù)、陽性液滴的平均數(shù)和得到的靶富集之間的相關(guān)性。此處使用一輪的NEEDLS,20,000個液滴和10個陽性液滴/靶標舉例說明。
圖4:用于實施NEEDLS的方案的概述
401:將含有一種或多種DNA靶的DNA樣品和用于整體擴增的試劑混合。
402:將產(chǎn)生液滴所需的組分加入到混合物中。
403:產(chǎn)生含有DNA和試劑的液滴。
404:在所有液滴上進行整體DNA擴增。
405:對在每個液滴上擴增的DNA進行特異性擴增以檢測一種或多種靶DNA。
406:使用用于物理選擇液滴的裝置分離檢測到特異性擴增的液滴。
圖5:用于進行如實施例1中描述的NEEDLS的方案的概述。
501:混合模板DNA、用于整體DNA擴增的試劑和產(chǎn)生液滴所需的組分。
502:將來自(501)的所有材料都轉(zhuǎn)化成每滴約1nL的液滴。
503:將所有液滴收集于一個管中。
504:將液滴在適于整體DNA擴增的條件下溫育。
505:將液滴對齊并且各自與包含用于選擇性靶DNA擴增的完整dUTP-PCR混合物的過量的液體結(jié)合,并且將所有液滴收集于PCR管中。
506:在PCR反應(yīng)條件下溫育PCR管。
507:收集其中發(fā)生特定擴增的液滴,并除去液滴產(chǎn)生組分(例如,油)??梢允褂媚蜞奏?DNA糖基化酶(UDG)處理以滅活引入尿嘧啶的所有PCR產(chǎn)生的DNA。通過乙醇沉淀純化DNA內(nèi)含物。
508:重新擴增沉淀的DNA(507)。
509:將重新擴增的DNA(508)用作最終分析的模板。
510:對(509)中產(chǎn)生的DNA進行DNA測序測序。
511:從(510)中檢索測序結(jié)果。
圖6:用于GAP-封閉的引物和缺口的示意圖。
水平黑線示出5712bp的DNA序列。GAP示出了期望的序列,其中序列數(shù)據(jù)不能從雙末端庫獲得。引物置于缺口的兩側(cè),且每組置于鄰近于GAP。設(shè)計引物以靶向DNA并產(chǎn)生50-100bp的片段。
圖7:如實施例2中描述的用于進行NEEDLS的方案的概述。
701:將DNA、用于整體擴增的試劑和油滴混合。
702:施加渦流混合液體并產(chǎn)生各種尺寸的液滴。
703:溫育液滴。
704:排除大液滴并丟棄。
705:將液滴與其中存在引物的子集的dUTP混合物合并。將#1-#4包括在圖中用于圖示說明目的,而在實施例中包括了10種不同的混合物。
706:進行PCR。
707:從混合物進行分選觀察到陽性PCR反應(yīng)的液滴。通過超聲處理隨后DNA純化而除去油滴。應(yīng)用UDG處理以分解所有含有尿嘧啶的DNA。然后通過乙醇沉淀純化DNA內(nèi)容物。
708:進行洗脫的DNA的再擴增而確保用于核苷酸測序(例如,NGS)的足量的DNA。
709:制備擴增的DNA用于測序。
710:測序完成的混合物,并將結(jié)果準備用于組裝。
711:將接收的序列的比對用于封閉基因組序列的缺口。
圖8:通過包含分配于葡萄球菌屬的16S rRNA和23S rRNA基因的序列[SEQ ID No.10]的NEEDLES識別出靶DNA片段
具體實施方式
本發(fā)明涉及一種體外方法,其中通過以下增加特異性靶DNA分子相對于樣品中的總DNA濃度的濃度:1)將樣品稀釋到多個亞區(qū)室如液滴(分離)中,2)在液滴內(nèi)非特異性擴增DNA(整體擴增),3)向液滴添加用于特異性檢測靶序列的試劑,4)檢測液滴內(nèi)的特異性靶序列以及,5)物理選擇含有靶序列的液滴(選擇)。
本發(fā)明基于如下原理:如果僅液滴的一部分含有靶序列,則與原始樣品中的濃度相比,在這些液滴中靶相對于總DNA的濃度更高。含有靶的液滴的分數(shù)決定了富集的程度;如果分數(shù)較低,則富集較高。
在本發(fā)明的上下文中,總DNA樣品或其稀釋液或液滴中靶DNA分子的存在或不存在通過樣品或其稀釋液或液滴中使用所選擇的檢測方法(例如,PCR)可檢測的靶DNA分子的存在來定義。
靶可以通過另外輪的選擇(如上)進一步富集,直到其可以通過標準方法如Sanger測序或焦磷酸測序(pyro sequencing)或類似的DNA序列檢測或通過PCR,雜交或其他檢測分析試驗來測序,或其可以直接從第一輪選擇中使用。
根據(jù)本發(fā)明擴增和分選的液滴包含含有用于檢測和識別的DNA序列的5-100kb的DNA片段。
出乎意料的是,根據(jù)本發(fā)明的富集需要很少的前DNA序列信息。與目前的富集技術(shù)相比,相比于分別對于基于雜交的和基于長程PCR的方法的至少5-8000和300堿基對相比,僅需要約40個核苷酸堿基對的特異性靶信息(圖1)。本領(lǐng)域已知的是,當(dāng)片段較短,例如100-250個堿基對時,會獲得最靈敏的PCR反應(yīng)。因此,當(dāng)樣品含有大量背景DNA時,設(shè)計以擴增長于250堿基對,例如500至5000個堿基對長度的DNA片段的長程PCR可能是不適用的。此外,基于雜交的方法要求樣品相對較純以避免非特異性雜交。因此,從混合樣品獲得序列信息的唯一方法可能是通過,例如,下一代測序方法來測序整個DNA樣品,并且雖然下一代測序方法的成本正在迅速下降,但對數(shù)千的基因組測序的成本仍然較高。
本發(fā)明的方法是出乎意料地很高效的,由此DNA測序的程度通過三輪的NEEDLS對于5重DNA靶可以降低超過10億的因數(shù),或使用兩輪的NEEDLS對于一個靶序列降低超過2500萬的因數(shù)(圖2)。
I:核苷酸序列的液滴排除富集
NEEDLS方法的基本步驟進一步描述如下:
a)提供包含一種或多種特異性靶DNA分子和用于DNA整體擴增的試劑的DNA樣品(401)
選擇已知包含靶DNA分子的混合DNA分子(即,DNA分子的混合群)用于進行NEEDLS。選擇位于靶DNA分子內(nèi)的至少10(或15)個核苷酸的一個或多個單一核苷酸序列,用于通過期望的方法如PCR檢測、用雜交探針的DNA檢測或類似方法篩選和檢測DNA分子。靶DNA分子可以含有多于一個的單一核苷酸序列,每個序列對應(yīng)于給定的遺傳標記物,例如,傳染原的第一遺傳標記序列診斷和耐抗生素基因的第二遺傳標記診斷。通常,混合DNA分子的樣品中的靶DNA分子的頻率小于10-2,其可以例如處于10-3和10-9之間(計算為靶序列的堿基對除以樣品中的總DNA的堿基對)。在擴增之前,將混合DNA分子的液體樣品以期望的稀釋倍數(shù)連續(xù)稀釋,直到在隨后的液滴形成步驟中產(chǎn)生和處理的每個液滴都含有混合DNA分子,但含有平均小于0.5個靶DNA分子,優(yōu)選平均小于0.25個或更加優(yōu)選小于0.1個特異性靶DNA分子。因此,如果將混合DNA分子的液體樣品分成100個液滴,每個均含有混合DNA分子,則靶DNA分子將平均存在于少于50個這些液滴中,優(yōu)選少于25個這些液滴,更加優(yōu)選少于10個這些液滴中。液滴中靶DNA分子的存在或不存在在本文中定義為,當(dāng)采用用于特異性檢測靶DNA分子的方法,如本申請中舉例說明的那些時,可檢測的靶DNA分子的存在或不存在。進行該稀釋以確保靶的富集;如果含有靶的液滴的平均數(shù)較低,則相對于液滴中的非靶分子的靶的頻率就較高?;旌螪NA樣品中靶DNA分子的頻率和豐度可以通過PCR,實時PCR,通過基于雜交的分試驗或通過檢測靶序列的RNA或蛋白質(zhì)產(chǎn)物的試驗確定。
b)形成多個含有所述DNA樣品的液滴(403),
使用任何液滴生成的方法生成含有稀釋的樣品混合DNA分子和DNA整體擴增所必需的試劑的液滴以將靶DNA序列分離在封閉區(qū)室中。用于液滴生成的合適方法包括如聲能噴射液滴,介電電泳(DEP)和電介質(zhì)上的電潤濕(EWOD)的主動方法,以及如T-形接頭(T-junction)和流動聚焦(flow focusing)的被動方法[1]。除了液滴之外,整體擴增可以發(fā)生于其它微量區(qū)室中,如微流體芯片中的反應(yīng)室內(nèi)。
c)整體擴增各自包含混合DNA分子和平均小于0.5,優(yōu)選小于0.25或更加優(yōu)選小于0.1個特異性靶DNA分子的多個液滴中的DNA分子(404)
使用任何總體DNA擴增方法擴增每個液滴中的DNA而增加每個樣品中的DNA的豐度。合適的擴增方法包括簡并寡核苷酸引物PCR(DOP-PCR),多重置換擴增(MDA)[4],隨機引物PCR等。
d)特異性檢測含有所述特異性靶DNA的液滴(405)
在步驟c)中總體DNA的整體擴增后,使用期望的檢測技術(shù)對于靶DNA分子的存在篩選液滴。在至少一個或多個顯示含有靶DNA分子的篩選的液滴中,與其在步驟(a)中的混合DNA分子的樣品中的頻率相比,靶DNA分子的頻率將會增加。頻率的增加通常在0.1×(無靶的液滴數(shù))×(具有靶的液滴數(shù))-1和10×(無靶的液滴數(shù))×(具有靶的液滴數(shù))-1之間??商鎿Q地,頻率的增加計算為處于0.1×(無靶的液滴數(shù))×(含DNA液滴的總數(shù))-1和10×(無靶的液滴數(shù))×(含DNA液滴的總數(shù))-1之間。含有靶的液滴的數(shù)目通常為每個靶序列2和100個之間。液滴的總數(shù)至少為1,000,但通常大于10,000。
液滴中的靶DNA分子的存在可以通過PCR,包括qPCR,通過基于雜交的試驗或通過檢測靶序列的RNA或蛋白質(zhì)產(chǎn)物的試驗來確定。用于特異性檢測的試劑可以含有dUTP,以使其可以在隨后的步驟中使用UDG選擇性地滅活、降解或去除檢測步驟中擴增的DNA。
e)物理選擇含有所述特異性靶DNA的液滴(406)
基于步驟d)中靶DNA的檢測,將液滴分選為至少兩種不同的流。當(dāng)在步驟d)中檢測多于一種特異性靶時,液滴可以分選為3、4、5個或更多個流。在包含其中檢測到靶DNA的液滴的流中,與步驟a)中的混合DNA分子的樣品相比,液滴中靶DNA相對于非靶DNA的豐度是富集的。
可選的步驟:
f)滅活、降解或去除產(chǎn)生用于特異性檢測靶DNA的DNA
當(dāng)富集的靶DNA用于另外輪的NEEDLS或其他應(yīng)用,其中檢測產(chǎn)物的存在會干擾這些進一步的處理時,則檢測步驟c)中的DNA擴增可以使用dUTP代替一種脫氧核糖核苷酸(dNTPs)來進行,其中然后可以可選地選擇性降解,滅活或除去該產(chǎn)物。這種滅活可以使用如尿嘧啶-DNA糖基化酶,也稱為UNG或UDG的酶來進行。
g)重復(fù)步驟(a)至(e)
將(e)中獲得的含有富集的靶DNA的液滴用于新的步驟(a)中,可以進一步富集靶DNA。
h)擴增富集的樣品
使用(d)中獲得的含有富集的靶DNA的液滴,則可以使用整體擴增如MDA或特異性擴增如PCR來進一步擴增靶DNA。
用于進行NEEDLS的方案
方案在圖4中概述。(401)測定混合DNA分子的原始DNA樣品中的靶DNA分子的濃度。稀釋樣品,直到含有靶分子的液滴(陽性液滴)的預(yù)期平均數(shù)小于0.5。如果相對于液滴中的非靶DNA,僅富集一種靶的豐度時,則陽性液滴的平均數(shù)應(yīng)該更小,導(dǎo)致更大的富集。理想地,液滴的整個樣品應(yīng)該含有2-100個,優(yōu)選3-50個且更優(yōu)選5-20個陽性液滴/靶。如果可以存在靶的多于一個序列變體,則每個變體計為單獨的靶DNA分子。圖3中顯示了使用一輪的NEEDLS、20,000個液滴和10個液滴/靶一個實例,靶數(shù)目、陽性液滴的平均數(shù)和NEEDLS后獲得的富集之間的相關(guān)性。
觀察到的富集可能高于圖3的預(yù)期富集,因為每個陽性液滴可能由于該擴增步驟的偏差而含有在整體擴增中擴增的不同量的DNA。在我們的經(jīng)驗中,得到的的富集可以至少高兩倍。此外,如果使用更小的液滴,使得獲得更多的獨立區(qū)室,則這將導(dǎo)致更大的富集。
向稀釋的原始樣品中加入用于多重置換擴增(MDA)的試劑;使DNA變性,使引物退火,并加入用于整體擴增的DNA聚合酶(例如,Φ29DNA聚合酶)。在加入聚合酶后,生成含有MDA就緒樣品的液滴,以便分離出獨立區(qū)室中的靶分子(403)。然后,通過在適于MDA的條件下溫育樣品而在液滴內(nèi)擴增靶(404)。
將用于檢測的試劑添加到液滴中,以允許檢測靶序列或樣品中的靶序列。這些可以與用于整體擴增(401)的試劑一起或在整體擴增(在404和405之間)之后加入。如果使用PCR進行檢測;則將擴增的液滴樣品轉(zhuǎn)移到PCR單元中并進行PCR擴增,而隨后根據(jù)靶分子的存在(陽性)或不存在(陰性)分選液滴。在使用熒光標記的PCR引物的情況下,使用熒光激活的液滴分選器(405和406)通過樣品的熒光檢測靶分子的存在。
一些陽性液滴會產(chǎn)生更高的熒光。當(dāng)使用截止值選擇具有最高熒光的液滴時,則這將選擇具有相應(yīng)的更大富集的液滴。確定靶DNA分子的豐度,并且如果這對于分析方法,例如測序足夠時,可以直接分析選擇的樣品;否則可以應(yīng)用額外輪的NEEDLS。
當(dāng)需要進行更多輪富集時,降解或除去在檢測步驟中生成的DNA可以是優(yōu)選的。在PCR試劑中使用dUTP可以是優(yōu)選的。然后使用標準dNTP進行MDA反應(yīng)。在液滴的檢測和物理選擇之后,可以講解在PCR中生成的DNA可以,并且處理的樣品可以用于以液滴中的稀釋和多重置換擴增開始的額外輪的富集。
當(dāng)使用NEEDLS達到足夠的富集時,是液滴合并。在合并的液滴中的富集的DNA也可以進一步純化,并可以分別使用整體或特異性擴增,例如MDA和PCR進一步擴增。
II:多重NEEDLS
可以使NEEDLS適用于進行多重NEEDLS。多重NEEDLS采用設(shè)計以通過用序列特異性引物擴增該第2連續(xù)序列以產(chǎn)生第2靶DNA分子來檢測所分析的混合DNA分子的樣品中至少10(或15)個核苷酸的第2連續(xù)序列的額外特征。如果幾滴液滴顯示了來自第1和第2連續(xù)序列兩者的特異性檢測(例如,通過熒光信號),則它們必須位于同一MDA擴增的靶DNA分子上。類似地,設(shè)想使用本發(fā)明的方法,可以通過采用特異性引物檢測每個不同特異性靶DNA分子來在DNA分子的混合樣品中檢測1至20個或更多個不同特異性靶DNA分子的單一序列。
因此,除了提供關(guān)于靶的共定位的信息之外,多重NEEDLS提供了高達數(shù)千個各自包含多于5,000個堿基對的不同的靶分子的同時純化??梢詫ⅹ毩z測分子提供至單獨的液滴或可以作為混合物添加。
III通過NEEDLS和多重NEEDLS分析的樣品
III.i混合DNA分子的樣品
NEEDLS可以應(yīng)用于已知包含靶DNA分子的混合DNA分子的樣品。包含DNA分子的群體(例如,染色體DNA分子或質(zhì)粒DNA分子)的混合DNA分子的樣品,其中群體中的單個DNA分子在它們的DNA中的至少10(或15)個核酸堿基對的已知連續(xù)序列內(nèi)相差至少一個核苷酸,使得包含已知的連續(xù)序列的靶分子不同于,并且可以區(qū)別于樣品中的非靶分子?;旌螪NA分子的樣品可以另外包含單鏈RNA或DNA多核苷酸?;旌螪NA樣品中的DNA分子的群體包含靶DNA分子。
靶DNA分子可以是線性或環(huán)狀形式。環(huán)狀DNA可以天然存在或可以通過將DNA克隆到質(zhì)粒,福斯質(zhì)粒(fosmid),粘粒,BAC克隆體中而獲得,或通過連接或通過Cre/LoxP介導(dǎo)的重組產(chǎn)生。
靶DNA分子包含至少10(或15)個核酸堿基對(或核苷酸)的一種或多種已知的單一連續(xù)序列。通過選擇包含至少10個核酸堿基對(或核苷酸)的這種單一連續(xù)序列的靶DNA分子,可以從混合DNA分子的樣品中選擇出靶DNA分子。還可以通過選擇包含至少兩個至少10個(或15個)核酸堿基對(或核苷酸)的單一連續(xù)序列的靶DNA分子,由混合DNA分子的樣品選擇靶DNA分子,其中兩個連續(xù)的序列包含于50至100,000個核酸堿基對,優(yōu)選150至3,000個核酸堿基對,更優(yōu)選150至1500個核酸堿基對的DNA分子中。
通常,混合DNA分子樣品中的靶DNA分子的頻率小于10-2,其可以例如處于10-3和10-9之間(計算為靶序列的堿基對除以樣品中總DNA的堿基對)。
本發(fā)明的方法特別適用于混合DNA分子樣品中的靶DNA分子的頻率小于10-2的情況。本發(fā)明的方法也適用于混合DNA分子樣品中靶DNA分子的頻率為10-4、10-5、10-6、10-7、10-8、10-9、10-10、10-11、或更低的情況。在許多情況下,混合DNA分子的樣品將源自包含基因組DNA的細胞群,而在其他情況下,樣品可以來源于其中DNA分子具有多種來源的樣品,例如收集自自然界的樣品。與其來源無關(guān),靶DNA分子的頻率都定義為特異性靶DNA堿基對的數(shù)目除以樣品中總堿基對的數(shù)目。通過制備一式三份的稀釋液系列,檢測靶的存在或不存在并使用,例如,最可能數(shù)目方法確定靶的數(shù)目來確定混合DNA分子樣品中靶DNA分子的頻率。靶分子的頻率也可以使用qPCR或數(shù)字液滴PCR來測定[2]。測量DNA的濃度,并通過將該濃度除以基因組的平均分子量而確定總基因組當(dāng)量的數(shù)目。
III.ii混合DNA樣品的來源
根據(jù)本發(fā)明的一個實施方式,靶DNA分子源自細胞的基因組,其中基因組可以是染色體或染色體外DNA。此外,靶DNA分子可以源自細胞,其中細胞選自微生物細胞,植物細胞,動物細胞或哺乳動物細胞。哺乳動物細胞可以是人細胞。微生物細胞可以是細菌細胞,酵母細胞或真菌細胞。此外,靶DNA分子可以源自真菌菌絲體或真菌孢子。
當(dāng)靶DNA分子是源自一種或多種細胞時,細胞可以是多細胞組織或多細胞生物體的部分。
此外,靶DNA分子可以源自一種或多種病毒顆粒,其中病毒具有RNA或DNA基因組??商鎿Q地,靶DNA分子可以源自包含來源于病毒的整合DNA的宿主基因組。靶DNA分子也可以源自噬菌體。
不論靶DNA或RNA分子的來源,靶DNA或RNA分子都存在于混合DNA分子的樣品中,其中混合DNA分子可以源自由自然收集的樣品,例如,土壤,水或空氣的樣品。或者,樣品可以源自多細胞生物體,如哺乳動物,例如,動物或人類受試者。當(dāng)樣品源自哺乳動物時,樣品(例如,活檢)可以源自體液(例如,血液,血漿,血清,淋巴和尿),源自糞便或源自身體組織或器官。樣品源自的多細胞生物體可以是活的或可以是死的生物體。
III.iii混合DNA的樣品的制備
包含靶DNA分子的混合DNA分子的樣品可以由從自然界或從生物體(例如,活檢)收集的樣品制備的。用于選擇性提取DNA分子的方法在本領(lǐng)域內(nèi)是已知的[3]。當(dāng)靶DNA分子源自細胞時,通常需要細胞破碎或細胞透化的步驟,以從細胞中釋放總的核酸分子(包括DNA或RNA),該步驟在選擇性提取DNA分子的后續(xù)步驟之前。
在靶DNA分子源自RNA基因組的情況下,首先逆轉(zhuǎn)錄RNA基因組或其部分以提供cDNA分子,其中cDNA的核苷酸序列對應(yīng)于RNA基因組(是其逆轉(zhuǎn)錄)。
III.iv液滴的生成
本發(fā)明的方法包括形成多個樣品液滴,其中液滴各自包含平均少于0.5個特異性靶分子。在優(yōu)選的實施方式中,特異性靶分子的分布遵循泊松分布。一些液滴可以以與靶分子相比10倍或更高的濃度包含非靶分子,而其他液滴可以僅包含靶分子。
通常而言,可以通過多種技術(shù),例如,在[4-6]中描述的那些形成液滴。本發(fā)明的方法可以涉及形成包括由不混溶的載體流體包圍的水性液滴的兩相體系。在優(yōu)選的實施方式中,通過制備含有樣品DNA、引物如隨機六聚體引物和緩沖溶液的混合物來制備液滴內(nèi)的水性樣品。使DNA混合物經(jīng)受導(dǎo)致DNA變性的條件,如約94℃的溫度1-10分鐘。將混合物快速冷卻并加入到含有dNTP和用于整體擴增的聚合酶如Phi29聚合酶的混合物中。所獲得的混合物在使用兩個不混溶液相的兩相液滴形成中用作水性樣品。水性液滴在具有用于在受控環(huán)境中在包含兩個不混溶液相的樣品中產(chǎn)生渦流/湍流的裝置的設(shè)備中生成,通過控制機械參數(shù)和以及由此的每個生成的液滴的液體體積在第2相液體中生成液體(相1)的液滴,或通過用于在第2不混溶液相中擠出一個液相的液滴的裝置生成,其中這樣形成的液滴保持離散,并且其中液滴的體積由用于液滴擠出的裝置的直徑控制。
載體流體是與樣品流體不混溶的載體流體。載體流體可以是非極性溶劑,癸烷,氟碳油,硅油或任何其它油(例如,礦物油)。
在某些實施方式中,載體流體包含一種或多種添加劑如增加、減少或以另外產(chǎn)生非牛頓表面張力(表面活性劑)和/或穩(wěn)定液滴對抗自發(fā)合并或接觸的試劑。
IV適用于NEEDLS的DNA的整體擴增的方法
對于DNA整體擴增已經(jīng)提出了一系列不同的方法,如隨機簡并引物PCR,接頭連接(linker ligation)PCR,或簡并寡核苷酸引物(DOP)PCR和多重置換擴增(MDA)。已證明MDA在即使非常少量的DNA的全基因組擴增(WGA)中也是有效的[7]。與更傳統(tǒng)的基于PCR的WGA方法相比,MDA產(chǎn)生具有更高分子量的DNA分子,具有更好的基因組覆蓋。MDA采用具有兩種酶活性的鏈置換聚合酶:DNA合成(聚合酶)和使單鏈DNA在3'至5'方向上降解的核酸外切活性,如噬菌體phi29DNA聚合酶,其屬于真核B-型DNA聚合酶(UniProtKB/TrEMBL:Q38545)舉例說明的。其它有用的聚合酶包括BstI聚合酶。
為了獲得根據(jù)本發(fā)明的富集,在液滴內(nèi)進行整體擴增。液滴用于將靶分子分離成與不含靶DNA的區(qū)室分隔的區(qū)室。在每個液滴中,例如,通過使用任何上述列出的DNA整體擴增方法進行擴增。在一些實施方式中,擴增在約30℃下進行1小時,優(yōu)選小于30分鐘。
V向液滴中加入檢測試劑的方法
在整體擴增后,可以將用于靶DNA分子檢測的試劑加入液滴中?;蛘撸糜跈z測的試劑可以在液滴生成之前添加。向液滴中添加試劑可以使用具有用于提供水性液體的等份(例如,包括PCR反應(yīng)或其它檢測混合物)的裝置,和用于使所述等份與懸浮于第2不混溶液體中的水性液體的液滴(例如,來自整體擴增步驟的液滴)融合的裝置,以及用于將懸浮于第二不混溶液體中的所述融合的液體遞送到進一步的區(qū)室的裝置的設(shè)備來進行。液滴融合或液滴注入技術(shù)的實例描述于[5,8]中。在本發(fā)明的某些實施方式中,添加到含有整體擴增的DNA的液滴中的試劑包括特異性引物或與待檢測的特異性靶DNA互補的特異性探針。當(dāng)加入特異性引物時,試劑包括DNA聚合酶如Taq聚合酶和dNTP。此外,試劑可以包含dUTP,使其可以隨后降解在檢測步驟中生成的DNA,和/或允許基于熒光檢測的核酸染料。在其他實施方式中,檢測基于來自標記的探針或引物的熒光。
VI檢測靶序列的方法
本發(fā)明的方法進一步涉及檢測包含使用整體擴增擴增的DNA的滴液內(nèi)的靶核酸分子。在某些實施方式中,檢測涉及擴增靶分子的一部分。適合于擴增核酸分子的擴增反應(yīng)包括聚合酶鏈反應(yīng),或包括或不包括探針如Taqman探針、蝎形探針、分子信標探針(Molecular Beacon probe)和由通過雜交的靶DNA序列的特異性識別起作用的任何其它探針的巢式聚合酶鏈反應(yīng),并在靶序列的擴增時導(dǎo)致熒光增加。
根據(jù)本發(fā)明的方法還包括其中檢測基于來自光學(xué)標記的探針如熒光標記的探針的熒光的方法,其中不在整體擴增后擴增靶。在這種情況下,通過例如將溫度升高至約95℃而變性DNA并且隨后允許探針退火至靶,導(dǎo)致探針或多個探針活化。這種光學(xué)標記的探針可以是分子信標,其中單鏈雙標記的熒光探針通過約4至6nt的互補干序列(stem sequence)保持在約20至25nt的發(fā)夾環(huán)構(gòu)象中。由于該環(huán)結(jié)構(gòu),連接到序列一端的期望的熒光染料緊密鄰接連接到另一端的光猝滅劑。當(dāng)結(jié)構(gòu)在變性期間釋放并隨后再退火時,探針退火至擴增的靶。當(dāng)退火時,發(fā)夾結(jié)構(gòu)不再保持,并且淬滅劑不再淬滅來自熒光染料的發(fā)射光。光學(xué)標記的探針也可以是FRET(熒光共振能量轉(zhuǎn)移)探針。
VII基于靶序列存在的物理選擇液滴的方法
為了從其中未檢測到靶的液滴中選擇性地分離包含可檢測靶DNA分子的液滴,可以采用用于物理選擇液滴或液滴分選的多種不同方法,包括引導(dǎo)(steering),加熱和聲波[5]。這種物理選擇可以使用具有用于接收懸浮于第2不混溶液體中的水性液體的液滴(例如,來自特異性檢測步驟的液滴)的裝置,和用于使每個液滴通過能夠檢測所述液滴中的可檢測組分的檢測單元的裝置,和用于由可檢測組分的存在或不存在確定對處理所述液滴用于遞送至選擇的區(qū)室的裝置,以及用于將所述液滴遞送至選擇的區(qū)室的裝置來進行。
VIII物理選擇液滴之后去除檢測信號分子的方法
在基于特異性靶序列的存在物理選擇液滴之后,可能在一些情況下需要去除檢測信號,例如PCR產(chǎn)物。用于去除這種信號的幾種方法在本領(lǐng)域內(nèi)是已知的。如果dUTP已用于檢測反應(yīng),則可以使用尿嘧啶-DNA N-糖基化酶去除檢測分子[9]。可替換地,由于整體擴增產(chǎn)生的分子顯著長于檢測分子,可以使用基于尺寸分離如基于小和大DNA對二氧化硅顆粒的差異性結(jié)合親合力的尺寸排阻的方法分離檢測分子[10]。這種二氧化硅表面對小于100bp的DNA片段具有有限的結(jié)合效率,而因此在應(yīng)用基于二氧化硅的純化時,僅將會有效地丟棄小于100bp的DNA片段。然而,在一些應(yīng)用中,可能不需要去除檢測分子。例如,由于Phi29和一些其它聚合酶對短于1000堿基對的DNA分子具有較低的活性,如果在NEEDLS富集之后的步驟是整體擴增,則可能就不必去除檢測分子,因為如果擴增,與實際靶向的較大DNA分子相比,檢測分子將僅擴增至有限的程度。
IX靶DNA分子的序列測定
通過NEEDLS的靶DNA分子的富集是基于對所述DNA分子中至少15個核苷酸的一種或多種單一連續(xù)序列的檢測。當(dāng)檢測基于PCR時,其中擴增一個或多個單一連續(xù)序列而產(chǎn)生靶DNA分子,可以確定該分子的核苷酸序列。此外,在5'和3'方向側(cè)接靶向DNA分子的核苷酸序列可以通過快速基因組步移(RGW)測定[11]。RGW是簡單的基于PCR的方法,用于確定較大DNA分子中從已知序列如靶DNA分子開始的上游或下游的序列。RGW允許使用PCR在大DNA分子中高達6kb的獨立擴增。序列可以簡單地通過使用基于先前循環(huán)中獲得的序列的新引物進行多個循環(huán)的RGW來延伸。通常,通過用四種不同的限制酶分別消化DNA并將產(chǎn)物連接到專門設(shè)計的適配子上而由較大的靶DNA分子的純化樣品構(gòu)建庫。然后,使用期望的DNA測序方法,例如Sanger測序,焦磷酸測序,通過合成、連接的測序,或雙堿基編碼測序(two-base coding sequencing)或類似方法,用退火至適配子或DNA內(nèi)已知的序列的引物測序連接的DNA[12]。
還可以使用例如Sanger測序,乳液PCR,鳥槍測序(shotgun sequencing),SOLiD測序,橋式PCR,Ion Torrent測序,Polony測序,焦磷酸測序,通過合成的測序,DNA納米球測序,Heliscope單分子測序,納米孔DNA測序(Nanopore DNA sequencing),隧道電流DNA測序,通過雜交的測序、使用質(zhì)譜的測序,透射電子顯微鏡DNA測序,RNAP(RNA聚合酶)測序或單分子實時測序來測序富集的靶DNA序列。
IX.i NEEDLS的研究和開發(fā)應(yīng)用
使用NEEDLS分離或富集從收集自天然的樣品或從臨床樣品提取的DNA分子的混合樣品中的靶DNA,提供了直接獲得由于樣品復(fù)雜性而不能通過其他方法分析的基因組或其部分。NEEDLS特別適用于分離或富集涉及遺傳性疾病、癌癥和傳染病的DNA分子。
多重NEEDLS特別適用于從包含幾個靶DNA序列的樣品,例如要對多于一種病毒、多于一種遺傳疾病或多于一種癌癥相關(guān)基因的DNA序列分析的樣品中同時分離或富集多于一種靶DNA。
NEEDLS也特別可用于從其中在富集之前只有少部分序列是已知的樣品中獲得靶DNA序列信息,因為該技術(shù)僅需要知曉靶DNA序列的小部分以進行檢測步驟并且還利用聚合酶(如Phi29)在MDA擴增中的高保真度生成高達100,000bp的較大的擴增DNA分子。
IX.ii用于測序的樣品制備
當(dāng)進行大DNA分子如基因組的測序時,所獲得的序列信息通常包含其中測序的分子不重疊或不能組裝的缺口。NEEDLS尤其有用于DNA序列的缺口封閉,因為NEEDLS將會圍繞小檢測區(qū)域恢復(fù)高達100,000bp的序列,并因此可以設(shè)計為覆蓋未知的缺口區(qū)域。
當(dāng)測序含有多于一種靶DNA序列變異體的樣品,如含有基因的兩個等位基因的染色體DNA時,NEEDLS也是特別有用的。在這種情況下,將包含每個檢測序列的液滴收集于單獨的區(qū)室中以確保僅存在序列的一個拷貝。隨后可以單獨條碼編碼液滴,以使得可以對靶DNA序列的每個變體單獨測序。
IX.iii NEEDLS的診斷應(yīng)用
NEEDLS可以用于分析源自多細胞生物體的樣品,如活組織檢查或從受試者(例如,人或動物受試者)獲得的體液或糞便樣品中的靶DNA,用于診斷或監(jiān)測醫(yī)學(xué)指征或疾病的進展。
診斷受試者中廣泛的醫(yī)學(xué)指征如由傳染原(例如,微生物或病毒)引起的疾病可以通過由NEEDLS或多重NEEDLS分離或富集和檢測源自傳染原的基因組的靶DNA或RNA分子來輔助,其中在源自活檢或從患者中獲得的體液樣品的混合DNA分子的樣品中檢測靶DNA分子。
在靶DNA分子分離中使用NEEDLS提供了另外的特征,即可以確定疾病的另外的診斷特征。例如,在傳染原的基因組包含賦予對某些治療劑的抗性的抗性基因的情況下,抗性基因的富集還可以恢復(fù)抗性基因周圍的區(qū)域,并可以提供關(guān)于攜帶抗性的特定傳染原的信息。
NEEDLS可以應(yīng)用于診斷,如檢測傳染原如原核生物體的存在和抗生素抗性。這種情況可以是金黃色葡萄球菌(SA)中的甲氧西林抗性(MR)的存在。(MRSA)的組合是醫(yī)院和類似設(shè)施中眾所周知的問題,而如果其不存在于SA中,則MR可能不會引起相當(dāng)?shù)膯栴}。如果應(yīng)用如雙重檢測的方法,則NEEDLS可以用于檢測MR和SA的共存。這種雙重檢測可以是雙報告檢測系統(tǒng),其中一個檢測系統(tǒng)用于監(jiān)測一個事件如MR的存在,而另一個檢測系統(tǒng)用于監(jiān)測另一個事件的存在,如同一液滴中SA的存在。當(dāng)MR和SA二者存在于相同的液滴中時,則兩個基因座可能位于相同的DNA片段上。此外,NEEDLS可以應(yīng)用于基于如MR或SA的基因的存在從宿主基因組選擇性地檢索另外的DNA序列。因此,其可以用于從傳染性生物體的基因組中提供另外的序列信息。
NEEDLS還可以用于輔助由受試者中的病毒劑的存在引起或起始的疾病的診斷。使用多重NEEDLS,通過跟蹤病毒DNA和整合位點DNA序列的共富集來確定已知整合位點處的病毒DNA的存在或不存在。
NEEDLS可以應(yīng)用于單個基因組內(nèi)或多個基因組內(nèi)的多個基因,其可以通過任何合適的分子檢測方法來檢測。如果需要,可以進行一系列多重PCR反應(yīng)并使用用于每個反應(yīng)的特異性染料來區(qū)分。這可以通過引入檢測系統(tǒng)如探針如Taqman探針、蝎形探針、分子信標探針等來完成。此外,NEEDLS也可以應(yīng)用于不必在檢測點區(qū)分的一系列基因??梢栽谛蛄袡z索之后使用如條碼編碼的PCR等的方法進行區(qū)分。
X NEEDLS和擴增中的偏差
NEEDLS基于特異性地選擇樣品,其中已發(fā)生了來自復(fù)雜的混合DNA樣品的期望的DNA區(qū)域的擴增。盡管已經(jīng)反復(fù)描述了基于Phi29的擴增(MDA)為目前可用的最可靠的基因組擴增,但其已知會引入顯著的偏差。Pan et al.[18]總體陳述了避免擴增偏差的復(fù)雜DNA池的高度特異性的全基因組擴增(WGA)仍然是挑戰(zhàn)。此外,用如DOP-PCR和隨機引物PCR的可替代的擴增方法看到了類似的觀察結(jié)果。這兩種擴增方法被描述為在再現(xiàn)基因座表達上效率低得多[19],導(dǎo)致甚至更偏離的擴增產(chǎn)物。雖然偏差似乎是不可避免的,但不管存在的反應(yīng)模板的量[20],在擴增期間引入的模板獨立產(chǎn)物(TIP)或偏差的量看起來與反應(yīng)中的DNA模板的量負相關(guān),并且在一些研究中已被記錄為代表總產(chǎn)量的70%-75%[18]。全基因組擴增用于在NEEDLS過程中擴增DNA,并因此預(yù)期與基因組擴增中的偏差有關(guān)的這些一般挑戰(zhàn)也將適用于NEEDLS。作為包括WGA的方法,因此預(yù)期應(yīng)當(dāng)觀察到針對靶DNA分子的顯著偏差。因此,如采用WGA的NEEDLS的方案并未被認為是能夠富集混合樣品中的DNA的特異性區(qū)域的方法。
出乎意料地,即使靶DNA分子的初始濃度非常低,在應(yīng)用NEEDLS技術(shù)時也沒有觀察到TIP/偏差的挑戰(zhàn)。在NEEDLS系統(tǒng)中觀察到的最小負TIP/偏差顯著低于從擴增過程獲得的總增益,而因此凈結(jié)果是靶DNA分子的充分富集。
該方法不需要稀釋的初始DNA模板,因為高濃度的DNA也可以有效地經(jīng)受NEEDLS。在這種情況下,僅需要通過WGA方法的幾倍擴增。
XI NEEDLS降低了分析負擔(dān)
NEEDLS提供了用于檢測和表征生物樣品的大基因組,例如,活檢的人類基因組中的DNA靶的高效分析工具。這可以用以下實例說明:
分析任務(wù)是檢測和確定包含具有30kb的平均大小的100,000個DNA分子的混合DNA片段的樣品中靶DNA分子的核苷酸序列,其中1個分子是靶DNA。該混合DNA片段的樣品對應(yīng)于具有30kb的平均DNA片段長度的約1個30億堿基對的人類基因組。在分析步驟開始時30kb靶DNA中僅有200個堿基對的核苷酸序列已知。
當(dāng)實施本發(fā)明的方法時,則
1.DNA等分入液滴中而使每個液滴含有混合DNA片段,并每個液滴平均存在5個DNA片段。因此,液滴的數(shù)量為100,000/5=20,000個液滴。20,000液滴中只有一個將會包含靶DNA分子(因此,每個液滴將含有小于0.1個靶DNA分子的拷貝)。
2.然后通過整體擴增復(fù)制所有液滴中的DNA,導(dǎo)致含有擴增DNA的20,000個液滴,且在同一液滴中(例如,通過PCR)特異性檢測靶DNA分子。物理選擇(分選)出含有靶DNA的液滴,并測序該DNA。應(yīng)注意包含一個靶DNA分子和(平均)4個非靶DNA分子的液滴的選擇對應(yīng)于2×103和100×103[即,0.1×(無靶液滴數(shù))×(含靶液滴數(shù))-1和10×(無靶液滴數(shù))×(含靶液滴數(shù))-1]范圍內(nèi)的頻率的增加(富集)。
3.因此,當(dāng)使用本發(fā)明的NEEDLS方法時,必須用擴增試劑(和檢測試劑)制備總共20,000個液滴,并且包含每個30kb(平均)的5個DNA分子(平均)(=150,000堿基對)的擴增產(chǎn)物的檢測的液滴必須單獨測序,以檢測和分析1個靶DNA分子。
當(dāng)分析混合DNA樣品的傳統(tǒng)方法用于這個分析任務(wù)時,分析負擔(dān)會增加許多倍,因為混合DNA樣品必須首先轉(zhuǎn)化為克隆的DNA片段或擴增的DNA片段的庫,其中必須分析每個成員,如下面列出的經(jīng)典程序說明的:
1.將混合DNA樣品在含有2個DNA分子的液滴的可能性較低,例如,0.1%對應(yīng)于p=0.001或更小的統(tǒng)計保守概率的條件下等分到液滴中。這種方法所需的液滴數(shù)是基于DNA分子的數(shù)目和在等份中找到<1分子的概率。這可以計算(近似)為在同一液滴中發(fā)現(xiàn)2個DNA分子的概率的平方根(即,0.03162)。
由于混合物DNA樣品具有100,000個DNA分子,則所需液滴數(shù)的保守估計(以確保一個液滴中2個DNA分子的可能性是統(tǒng)計上微小的)是100,000×1/0.03162或3.16×106個液滴(0.03162×0.03162=0.001)。然后,每個液滴中的DNA可以:1)通過整體擴增或克隆來復(fù)制,和/或2)通過PCR特異性擴增靶DNA。
2.然后,整體擴增所有3.16×106個液滴;其中100,000個液滴將含有擴增的DNA(其中1個滴將含有靶DNA)。將選擇包含擴增子的100,000個液滴,且隨后必須分析所有100,000個選擇的液滴以檢測靶DNA分子,因為使用這種方法沒有實現(xiàn)靶的富集(靶DNA/非靶DNA的比率增加)。
如果使用采用設(shè)計為擴增200個堿基對的已知序列(因為其余片段是未知的,其不能進行特異性擴增)的引物的PCR直接并特異性擴增3.16×106個液滴,則可以檢測和選擇出含靶DNA的1個液滴。然而,此處30kb中只有200個堿基對被擴增,而其旁側(cè)序列仍然是未知的。
因此,使用這種經(jīng)典方法,必須用擴增試劑制備至少316萬個液滴,并且必須通過PCR單獨篩選出至少100,000個含DNA的液滴的擴增產(chǎn)物以檢測和測序1個靶DNA分子。
表1
實施例
實施例1.對來自堆肥樣品的靶向酶活性編碼的完整操縱子
在該實施例中,顯示了如何應(yīng)用雙通道微流體系統(tǒng)分隔,擴增,識別,分離和再擴增靶向脂肪酶DNA分子。使包括相鄰DNA的靶向DNA可用于從原生宿主測序。該方法示意性地顯示于圖5中。
DNA提取和初始PCR
將來自堆肥堆(中心溫度38℃)的混合樣品用于檢索初始DNA樣品。使用如別處[13]描述的珠磨(bead-beating)法從5g樣品中提取DNA。最初對提取的DNA測試靶向的脂肪酶基因的存在,并發(fā)現(xiàn)含有足夠量的DNA用于應(yīng)用的PCR引物L(fēng)ip-Fw:5'-CTG AAT GGG GGA ATA ATG ACA AGC C-3'[SEQ ID 1]和Lip-Re:5'-CTA TAC TCT TCT TTT AAT TCC TCA GC-3'[SEQ ID 2]以產(chǎn)生約105bp.的PCR產(chǎn)物。PCR條件為94°,62.1°,72°(15秒/15秒/90秒),共40個循環(huán)。
液滴MDA/融合/分選(物理選擇)
如由Panet al.[14]描述的,制備100μL的Phi29反應(yīng)體積。在仍保持反應(yīng)混合物冷卻(最大+4℃)的同時,將Phi29混合物裝載到八通道一次性液滴發(fā)生器盒(Bio-Rad)中的孔中。其它孔遵循相同的步驟,以使用液滴盒的全部容量。然后,用液滴油(BioRad)填充剩余的通道。隨后將完全裝載的液滴發(fā)生器盒放入液滴發(fā)生器(Bio-Rad)中,用于在盒的所有反應(yīng)區(qū)室中全部反應(yīng)體積的液滴形成(502)。
在液滴形成完成后,將所有液滴手動轉(zhuǎn)移到1.5mL Eppendorf收集管中,并隨后將擴增反應(yīng)在30℃下置于Eppendorf恒溫振蕩器(Thermoshaker)中16小時(504)。溫育之后,通過將溫度升至65℃10分鐘而終止反應(yīng)。然后將整個反應(yīng)體積(仍然是在Eppendorf管內(nèi)部的單獨的液滴的形式)轉(zhuǎn)移到液滴融合裝置中(504),其中合并兩個單獨的流的融合以生成融合的液滴,其各自具有比原始的SampliPhi液滴大10倍的體積。
通過合并流(流1:其中發(fā)生了擴增的SampliPhi-液滴和存其中在用于PCR檢測的所有反應(yīng)組分的物流2:dUTP-PCR)施加體積增加。通過合并兩個流并進行關(guān)聯(lián)的PCR反應(yīng),使得可以監(jiān)測哪些合并的液滴包含期望的靶。流1由上述sampliPhi反應(yīng)的1nL單個液滴構(gòu)成,而由以下組成的混合物形成9nL液滴(流2):537μL H2O,220μL具有Mg++的PCR緩沖液(×5),110μL dNTP/dUTP混合物(2mM),110μL的每種引物(10pmol/μL),110μL BSA,1μL SybrGreen(1:10.000),22μL DreamTaq聚合酶(5U/μL)。
應(yīng)用10倍體積過量的dUTP-PCR確保MDA組分適當(dāng)稀釋,以避免dUTP-PCR擴增期間的PCR抑制并同時在以下篩選中建立周密的檢測基礎(chǔ)。
將融合的液滴收集于單個PCR-管中,并經(jīng)受與在對靶存在的初步篩選中描述的相同PCR條件(506)。在完成PCR之后,將10-11nL液滴在單獨的微流體室中排列,并且基于在用488nm激光束激發(fā)時熒光信號的525nm發(fā)射檢測并選擇性分離成功擴增的液滴(507)。
總共16個液滴(19.836個中)檢測為陽性,并使用在一個區(qū)室中的合并所有陽性液滴的微通道分選盒物理選擇。通過將20μL 5mM Tris加入微通道分選盒的收集區(qū)室中,將分選的液滴手動轉(zhuǎn)移至1.5mL Eppendorf-管中。通過加入SDS除去液滴浸沒油,并使用乙醇沉淀而純化擴增的產(chǎn)物。將純化的產(chǎn)物再懸浮于5μL無核酸酶的水中。
使用尿嘧啶-DNA糖基化酶(UDG)試劑盒(Life Technologies),在25μL的反應(yīng)體積中使5μL體積的包含初始模板的洗脫的dUTP-PCR產(chǎn)物經(jīng)受選擇性降解,僅留下初始模板完好無損。此后,使用SampliPhi擴增再擴增混合物(508),導(dǎo)致在20μL總反應(yīng)體積中200ng/μL的最終產(chǎn)物濃度。
使用與初始篩選相同的PCR來驗證期望的DNA靶分子的存在,并且RGW用于從基因和基因的5'和3'兩者中的DNA獲得序列以描述具有啟動子區(qū),Shine-Dalgarno序列和終止密碼子的完整基因(510和511)。
實施例2:-基因組的缺口封閉
該實施例描述了如何可以使用通過由傳統(tǒng)引物設(shè)計選擇性地選出感興趣的區(qū)域的單次NEEDLS將未完成的基因組序列“缺口封閉”。在該實施例中,在雙末端庫上實施缺口封閉,其在意大利嗜熱厭氧桿菌(Thermopernerobacteria italicus)的基因組中存在57個缺口(CP001936)。在本實施例中,缺口的大小為422bp至5,201bp范圍內(nèi)。一個單次NEEDLS隨后通過下一代測序(NGS)的再測序有效地封閉了否則未完成的基因組中的所有缺口。通過特異性選擇和測序其中已發(fā)生期望的區(qū)域的擴增的那些液滴來封閉缺口。通過如此進行,完成了選擇性靶向的再測序,并封閉所有缺口而產(chǎn)生完整的環(huán)狀基因組。
DNA制備。
如(BG10專利)中描述的制備2ml厭氧完全生長的細菌培養(yǎng)物,并使用Thermo Scientific Gene Jet DNA純化試劑盒如制造商描述的進行提取。洗脫、提的取DNA在100μL的最終體積中具有20ng/μL的濃度。
MDA液滴生成和液滴擴增。
將樣品DNA稀釋至5×10-4,并將1μL與退火緩沖液(SampliPhi)中的隨機Exo-抗性七聚體和Exo-抗性六聚體引物混合,并通過將溫度升至94℃3分鐘,并隨后使用BioRad MyCycler PCR機以5℃/分鐘的漸變率將溫度逐漸降低至20℃以使引物退火至模板。達到20℃的溫度后,將混合物轉(zhuǎn)移至冰中。向如實施例1中所述的混合物中加入Phi29反應(yīng)緩沖液、dNTP、水和Phi29聚合酶(701)。
將液滴生成油添加到反應(yīng)管中,并通過以3000RPM(Velp Scientifica)渦旋處理2分鐘生成液滴(702)。通過將整個體積泵送通過微反應(yīng)室中的漏斗,尺寸排阻巨型液滴,并僅允許小于5nL的液滴繼續(xù)擴增步驟。丟棄尺寸排阻的液滴(704)。
將成功通過尺寸排阻的液滴在30℃下溫育2小時,然后通過將溫度升高至65℃5分鐘來終止擴增過程。
引物設(shè)計。
在缺口的5'或3'方向上手動將引物設(shè)計于約100bp的靶位置。對于大于5000bp的缺口,如圖6所示,應(yīng)用兩組引物,其中缺口的每一側(cè)上一組引物。
引物1-GAP-Fw:5’-GAAGGGTGACAGGATTGATAC[SEQ ID No.5]
引物1-GAP-Re:5’-CGGATTTCCTCCTTTCTATTCC[SEQ ID No.6]
引物2-GAP-Fw:5’-GCCTTGCAAATTCTACATTGACAG[SEQ ID No.7]
引物2-GAP-Re:5’–CCAAGAAAATCATGGGAGATAGTTC[SEQ ID No.8]
液滴融合
從GAP填充的雙末端基因組序列在硅膠(silico)中培育出各自含有5-6對設(shè)計的引物(每個10pmol/μL)的dUTP反應(yīng)混合物的10個組合(#1-#10),并且每個組合含有10-12個引物。將引物組合保持于單獨的液體溶液中,并依次排列,然后如[15]中描述的通過合并液滴和PCR液體尺寸排阻與每個MDA液滴組合(705)。得到的最終液滴尺寸范圍在10-20nL之間。然后將所有合并的液滴收集于一個反應(yīng)管中,并如以下描述的開始dUTP-PCR反應(yīng)。
dUTP-PCR
在一個單管中對所有合并的液滴進行PCR擴增,用以下循環(huán)參數(shù)在MyCycler PCR機(BioRad)中作為兩階段PCR進行:94℃(15s),25個循環(huán),由15秒在94℃下的變性和在72℃下延伸15s組成(706)。PCR擴增后,分析了50,087個液滴,并如[15]中描述的使用微流體裝置選擇性分選1,807個液滴用于測量和分離(707)。
UDG處理
通過向反應(yīng)中加入SDS至10%(w/w)的最終濃度以除去液滴油,然后加入乙酸銨至2M的最終濃度。將溶液置于冰上5分鐘,然后通過在16.000G下在4℃下離心10分鐘沉淀。加入雙倍體積的7M胍-HCl,并使用凈化旋轉(zhuǎn)柱(clean-up spin column)(GeneJet DNA提取儀,Thermo Scientific)凈化混合物。使用包含于DNA提取試劑盒中的洗滌緩沖液實施一次洗滌程序。隨后如廠商描述的,用UDG(Thermo Scientific)處理20μL洗脫的DNA,并通過在95℃下熱滅活10分鐘以終止反應(yīng)。通過離心使獲得的產(chǎn)物乙醇沉淀,并隨后將DNA顆粒再懸浮于5μL(5mM)Tris緩沖液中。
預(yù)測序擴增和基因組組裝
將總體積5μL(UDG處理和沉淀的)DNA模板用作50μL的總體積中的SampliPhi再擴增中的模板以產(chǎn)生總共1μg的擴增的DNA(708)。總體積由Eurofins Genomic(Ebersberg,Germany)來核苷酸測序(710),并使用CLC Genomics Workbench版本6.0.4進行初始缺口填充基因組和獲得的GAP基因組數(shù)據(jù)的組裝,用于以默認參數(shù)的基因組組裝。最終結(jié)果顯示了基因組的完整組裝,并發(fā)現(xiàn)最終的環(huán)狀基因組序列具有總共2,451,061個核苷酸。封閉的GAP序列作為[SEQ ID NO:9]中的GAP給出。
實施例3-在混合物(葡萄球菌)中擴增特異性亞群。
本實施例說明了可以如何使用基于液滴的SampliPhi從混合樣品的特異性靶向亞組中分離出DNA,而同時仍保持樣品中的原始變異。在該實施例中,葡萄球菌由特異性引物靶向。分離出用這些引物選擇性擴增的液滴,且最后跨越完整16S rRNA保守序列的PCR、16S和23S rRNA之間的基因間轉(zhuǎn)錄間隔區(qū)(ITS)和保守的23S rRNA基因區(qū)用于分類以產(chǎn)生高分辨率的系統(tǒng)發(fā)育分析。
特異性引物設(shè)計
使用Primrose引物設(shè)計軟件[16]設(shè)計出靶向葡萄球菌的16S核糖體DNA的引物。16S基因的保守區(qū)由特異性引物Staph-Fw:5'-AGA CTG GGA TAA CTT CGG GA-3'[SEQ ID NO:3]和Staph-Re:5'-CGT CTT TCA CTT TTG AAC CAT GC-3'[SEQ ID NO:4]靶向,生成了76bp的PCR產(chǎn)物。
樣品制備。
將來自志愿者的假定感染組織的抽汲樣品作為模板,并使用GeneJet Genomic DNA純化(Thermo Scientific)提取DNA。使用初步PCR驗證靶DNA序列(金黃色葡萄球菌)的存在?;趤碜訰T-PCR分析的Cq值連同裂解曲線(melt curve)特性一起,使用10倍稀釋系列驗證數(shù)量。使用如Garcia-Armisen et al.[17]描述的MPN將獲得的PCR結(jié)果轉(zhuǎn)換成估算的靶數(shù)量。將總量約8,300個16S rRNA基因拷貝重新計算為1,709個靶向葡萄球菌/μL,因為每個細菌靶據(jù)估計具有平均5.5拷貝的16S rRNA基因(701)。
液滴形成
制備含有1μL DNA模板的20μL SampliPhi混合物,并加入到如實施例1描述的的液滴發(fā)生器中,生成約20,000個液滴,各自具有1nL的SampliPhi Phi29反應(yīng)混合物(502)。將反應(yīng)在30℃下溫育2小時(504),并隨后將溫度降至+4℃以終止反應(yīng)。
液滴融合。
在最終擴增后立即將每個液滴與9nL RT-PCR混合物合并而建立10nL的反應(yīng)體積,其中RT-混合物(SSO Advance Supermix,BioRad)提供所有所需的PCR反應(yīng)組分。如廠商描述的制備SSO Advance超混液,用特異性引物(Staph-F[SEQ ID NO:3]+Staph-R[SEQ ID NO:4])補充(505)。
合并的液滴(約10nL/滴)的總集合分至5個PCR管中,每個具有40μL的反應(yīng)體積,對應(yīng)于每個管中約5,000個液滴。然后在PCR機(BioRad Connect)中的五個PCR管各自中進行采用金黃色葡萄球菌特異性引物的特異性擴增,其中循環(huán)條件為:30個循環(huán)的(94℃,60℃,72℃),其中每個溫度間隔保持15s(506)。擴增后,如[18]中描述的,使用熒光激活液滴分選(FADS)對成功的反應(yīng)篩選液滴(507)。在所分析的總共20,238個液滴中,陽性反應(yīng)的數(shù)目為1,562,并且在單獨的反應(yīng)管中收集具有監(jiān)測的陽性反應(yīng)(SybrGreen熒光)的所有液滴。
凈化和再擴增。
使用如Yu et al.[19]描述的旋轉(zhuǎn)柱DNA提取程序提取分選的SampliPhi擴增液滴。這種程序主要導(dǎo)致大于100bp的產(chǎn)物純化,這是由于在凈化期間應(yīng)用的二氧化硅膜的尺寸依賴性結(jié)合效率所致。因此,在凈化期間主要純化尺寸>100bp的DNA產(chǎn)物。因此,接近所有PCR產(chǎn)物都從擴增中被移除,而Phi29擴增的DNA被容易地回收。通過將整個體積加入到50μL的SampliPhi反應(yīng)中來再擴增10μL的洗脫的DNA(由于PCR產(chǎn)物尺寸而不含PCR產(chǎn)物)(508)。最終產(chǎn)物測量為具有220ng/μL的濃度,對應(yīng)于11μg DNA的總量。確定了最終產(chǎn)物的核苷酸序列。
結(jié)果-實施例3
獲得的DNA的序列的16S rRNA克隆庫研究揭示了所有16S rRNA基因是相同的,并且它們可以歸屬于葡萄球菌屬,并由此可以推論,所研究的感染源自葡萄球菌的一個單一菌株(圖8)[SEQ ID:10]。此外,在該研究期間獲得的序列數(shù)據(jù)的分辨率增強了獲得的序列的系統(tǒng)發(fā)育相似性的程度,顯示出克隆分布而不是多重傳染培養(yǎng)物,因為所有獲得的序列都是100%相同的。即使在所分析的樣品中存在遠緣的細菌,其中16S rRNA和23S rRNA基因都存在的組合的分析結(jié)果提供了系統(tǒng)發(fā)育分組的高精度。另外,由于16S rRNA和23S rRNA基因之間的高度可變的ITS區(qū)域也包括于分析中,舉例說明的實施例還提供了區(qū)分即使極為近緣的菌株的信息。我們已經(jīng)使用該信息區(qū)分克隆源的傳染性疾病的爆發(fā)和由多種菌株引發(fā)的感染。
序列的組裝證明了接近完全消除了來自液滴篩選程序的生成的PCR產(chǎn)物。盡管小尺寸的PCR產(chǎn)物對基于二氧化硅的純化存在影響,但出乎意料的是,Phi29反應(yīng)也似乎也不會引發(fā)置換擴增,這可能是由于缺乏足夠大尺寸的模板。已知Phi29擴增在擴增大片的DNA時是有效的,而擴增76bp的DNA分子實際上是不可能的。
實施例4-從大腸桿菌和HeLa DNA的混合物擴增特異性大腸桿菌基因。
本實施例說明了如何使用基于液滴的SampliPhi從其中非靶背景(HeLa)DNA最初豐富的樣品中的特異性靶向DNA序列(來自大腸桿菌的ThrA基因)中分離出DNA。使用液滴生成芯片產(chǎn)生具有Phi29(Enzymatics)反應(yīng)組分的液滴,在氟碳載體油中產(chǎn)生約800-900pl的單分散液滴。將PCR成分加入到每個液滴中,并通過PCR擴增其中存在靶序列的那些液滴,隨后作為熒光液滴檢測,并使用用于分選的微流體裝置收集。
通過向總體積20μL的(×1Phi29反應(yīng)緩沖液,0.05mM dNTP,1μL(即用)×1隨機六聚體引物(Thermo Scientific),0.25μL Phi29聚合酶(Enzymatics)中加入1μL DNA模板來建立Phi反應(yīng)。然后使用微流體液滴裝置通過由氟碳油分離Phi反應(yīng)來將混合物分散于各自約700-800pl的水性液滴等份中。然后將液滴在30℃下溫育4小時。
在液滴形成和隨后溫育之后,將PCR成分的混合物合并到每個液滴中,并使用使用具有用作報道分子的分子信標的優(yōu)化PCR系統(tǒng)進行特異性檢測。在該實施例中,大腸桿菌天冬氨酸激酶(ThrA)由特異性引物(MB8fw1和MB8Re1)和設(shè)計為退火至兩個特異性引物之間的DNA序列的特異性分子信標(MB8.9)靶向。然后使用微流體裝置選擇性地去除其中未觀察到特異性擴增的那些液滴,并將所收集的液滴的內(nèi)容物再擴增,以達到允許測序的足量DNA。
特異性引物設(shè)計
手動設(shè)計靶向大腸桿菌的thrA區(qū)域的引物和信標。信標折疊結(jié)構(gòu)使用mFold軟件驗證[20]。
MB8fw1:5'-GACGGTAGATTCGAGGTAATGC-3'[SEQ ID:11]
MB8Re1:5'-TATGGCCGGCGTATTAGAAG-3'[SEQ ID:12]。
MB8.9:5'(HEX)-GCTTTGTGTTTTCGACCGGATCGATAACAGT AACG-3'(BHQ)[SEQ ID:13]。
樣品制備。
將來自大腸桿菌(Life Technologies)和HeLa(Promega)的DNA以1pg/μL大腸桿菌和4pg/μL Hela的最終濃度混合。由基于基因組尺寸的計算,該混合物含有約200個靶向基因(ThrA)的拷貝/μL,且實時PCR測量證實靶的初始量為200個靶拷貝/pg。
液滴形成
制備含有1μL DNA樣品的15μL Phi29混合物,并加入到如實施例1描述的液滴發(fā)生器中。該步驟產(chǎn)生約16,500個液滴,各自具有800-900pL的Phi29反應(yīng)混合物。在4℃下進行液滴生成以確保在液滴產(chǎn)生之前不會在系統(tǒng)中發(fā)生擴增。然后將反應(yīng)在30℃下溫育4小時。
液滴融合。
在最終擴增后立即將每個Phi29液滴與含有(×1PCR緩沖液,0.1mM dNTP,0.2mM Mg+,0.05U GoTaq2,0.025pmol/μL MB8-Fw1,0.025pmol/μL MB8-Re1,0.018pmol/μL MB8.9-BHQ-HEX)的4nL PCR混合物使用用于合并的x形接頭芯片合并。將合并的液滴的總集合(約5nL/液滴)泵送入用于產(chǎn)生具有80pl的平均尺寸的總計210,000個液滴的2個試劑液滴芯片(門尺寸:50μm)中。使用兩步擴增方案:95℃(2分鐘)+35個循環(huán)的94℃(3秒)+56℃(15秒),在標準PCR機(MyCycler,BioRad)中進行在每個合并且再形成液滴的液滴中的PCR擴增。那些其中靶模板最初已經(jīng)擴增的液滴產(chǎn)生容易地與那些其中沒有特異性靶存在的液滴區(qū)分開的強熒光信號。使用具有HEX-熒光發(fā)射源和檢測濾光器的標準熒光顯微鏡(Nikon)完成陽性和陰性液滴之間的辨別。
將擴增的液滴泵送通過用于分選的液滴生成芯片(100μm X形門,2個試劑液滴芯片)的檢測/收集部分,并通過對空通道施加足夠的抽吸以收集總共50個液滴以確保陽性液滴的隔離同時丟棄陰性液滴。
凈化和再擴增
通過重力流動從微流體裝置中回收收集的液滴,并將其收集于200μL的PCR管中進入50μL氟碳油中。向管中加入10μL水用于分離混合物的水相。然后,收集10μL樣品,并在使用與如在初始Phi擴增(Enzymatics)中提及的相同條件的后續(xù)再擴增中使用10μl的全部體積作為模板。
在20μL的總反應(yīng)體積中測量最終產(chǎn)物的濃度為330ng/μL。使用RT-PCR(SSO Advance,BioRad)和總DNA定量(Promega,BioFluorometer)測定富集,且最終量為3160靶拷貝/pg,對應(yīng)于靶增加×79。
擴增和靶向的核苷酸序列(97bp):GACGGTAGATTC GAGGTAATGCCCCACTGCCAGCAGTTTTTCGACCGGATCGATAACAG TAACGTTGTGACCGCGCGCTTCTAATACGCCGGCCATA[SEQ ID No:14]
從富集的產(chǎn)物中產(chǎn)生下一代測序(Illumina,150bp-雙末端庫),且結(jié)果顯示12.258bp,具有x4至x63的覆蓋范圍。最高的覆蓋位于靶向的序列(擴增和靶向的核苷酸序列,參見上文)而最低的覆蓋處于組件的最遠5'端。獲得的序列與參考基因組(登記號CP011324)在組件的整個范圍內(nèi)100%對齊。
參考文獻
1.Sharma,S.,et al.,Droplet-based microfluidics.Methods in Molecular Biology,2013.949:p.207-30.
2.Hindson,B.J.,et al.,High-throughput droplet digital PCR system for absolute quantitation of DNA copy number.Anal Chem,2011.83(22):p.8604-10.
3.Sambrook,J.and D.W.Russell,Molecular Cloning a laboratory manual2001:Cold Spring Harbor Laboratory Press.
4.Walter,N.G.,Single molecule tools:fluorescence based approaches,part A.Preface.Methods in Enzymology,2010.472:p.xxi-xxii.
5.Kintses,B.,et al.,Microfluidic droplets:new integrated workflows for biological experiments.Current Opinion in Chemical Biology,2010.14(5):p.548-55.
6.Rinke,C.,et al.,Obtaining genomes from uncultivated environmental microorganisms using FACS–based single-cell genomics.Nat.Protocols,2014.9(5):p.1038-1048.
7.Raghunathan,A.,et al.,Genomic DNA amplification from a single bacterium.Applied and Environmental Microbiology,2005.71(6):p.3342-3347.
8.Day,P.,Manz,A.,Zhang,Y.,Microdroplet Technology:Principles and Emerging Applications in Biology and Chemistry.Integrated analytical systems,ed.R.A.Potyrailo2012.
9.Longo,M.C.,M.S.Berninger,and J.L.Hartley,Use of uracil DNA glycosylase to control carry-over contamination in polymerase chain reactions.Gene,1990.93(1):p.125-8.
10.Prodělalová,J.,et al.,Isolation of genomic DNA using magnetic cobalt ferrite and silica particles.Journal of Chromatography A,2004.1056(1–2):p.43-48.
11.Kilstrup,M.and K.N.Kristiansen,Rapid genome walking:a simplified oligo-cassette mediated polymerase chain reaction using a single genome-specific primer.Nucleic Acids Res,2000.28(11):p.e55.
12.Liu,L.,et al.,Comparison of next-generation sequencing systems.J Biomed Biotechnol,2012.2012:p.251364.
13.Kvist,T.,et al.,Diversity of thermophilic and non-thermophilic crenarchaeota at 80 degrees C.FEMS Microbiol.Lett.,2005.244(1):p.61-68.
14.Pan,X.,et al.,A procedure for highly specific,sensitive,and unbiased whole-genome amplification.Proceedings of the National Academy of Sciences,2008.105(40):p.15499-15504.
15.Brouzes,E.,et al.,Droplet microfluidic technology for single-cell high-throughput screening.Proceedings of the National Academy of Sciences,2009.106(34):p.14195-14200.
16.Ashelford,K.E.,A.J.Weightman,and J.C.Fry,PRIMROSE:a computer program for generating and estimating the phylogenetic range of 16S rRNA oligonucleotide probes and primers in conjunction with the RDP-II database.Nucleic Acids Res.,2002.30(15):p.3481-3489.
17.Garcia-Armisen,T.and P.Servais,Enumeration of viable E.coli in rivers and wastewaters by fluorescent in situ hybridization.J Microbiol.Methods,2004.58(2):p.269-279.
18.Baret,J.C.,et al.,Fluorescence-activated droplet sorting(FADS):efficient microfluidic cell sorting based on enzymatic activity.Lab Chip,2009.9(13):p.1850-8.
19.Yu,Z.and W.Mohn,Killing two birds with one stone:simultaneous extraction of DNA and RNA from activated sludge biomass Canadian Journal of Microbiology,1999.45(3):p.269-272.
20.Zuker,M.,Mfold web server for nucleic acid folding and hybridization prediction.Nucleic Acids Res,2003.31(13):p.3406-15.
序列表
<110> 賽普有限責(zé)任公司(Samplix S.a.r.l)
<120> 通過液滴分選的核苷酸序列排除富集
(NEEDLS)
<130> P1912PC00
<150> PA201400307
<151> 2014-06-11
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 25
<212> DNA
<213> 細菌
<220>
<221> 引物結(jié)合
<222> (1)..(25)
<223> 用于細菌脂肪酶基因的Lip-Fw引物
<400> 1
ctgaatgggg gaataatgac aagcc 25
<210> 2
<211> 26
<212> DNA
<213> 細菌
<220>
<221> 引物結(jié)合
<222> (1)..(26)
<223> 用于細菌脂肪酶基因的Lip-Re引物
<400> 2
ctatactctt cttttaattc ctcagc 26
<210> 3
<211> 20
<212> DNA
<213> 葡萄球菌屬
<220>
<221> 引物結(jié)合
<222> (1)..(20)
<223> 用于葡萄球菌屬中16S rDNA的Staph-Fw引物
<400> 3
agactgggat aacttcggga 20
<210> 4
<211> 23
<212> DNA
<213> 葡萄球菌屬
<220>
<221> 引物_結(jié)合
<222> (1)..(23)
<223> 用于葡萄球菌屬中16S rDNA的Staph-Re引物
<400> 4
cgtctttcac ttttgaacca tgc 23
<210> 5
<211> 21
<212> DNA
<213> 意大利嗜熱厭氧桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(21)
<223> 用于意大利嗜熱厭氧桿菌的基因組的GAP-Fw-1引物
<400> 5
gaagggtgac aggattgata c 21
<210> 6
<211> 22
<212> DNA
<213> 意大利嗜熱厭氧桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(22)
<223> 用于意大利嗜熱厭氧桿菌的基因組的GAP-Re-1引物
<400> 6
cggatttcct cctttctatt cc 22
<210> 7
<211> 24
<212> DNA
<213> 意大利嗜熱厭氧桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(24)
<223> 用于意大利嗜熱厭氧桿菌的基因組的GAP-Fw-2引物
<400> 7
gccttgcaaa ttctacattg acag 24
<210> 8
<211> 25
<212> DNA
<213> 意大利嗜熱厭氧桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(25)
<223> 用于意大利嗜熱厭氧桿菌的基因組的GAP-Re-2引物
<400> 8
ccaagaaaat catgggagat agttc 25
<210> 9
<211> 5201
<212> DNA
<213> 意大利嗜熱厭氧桿菌
<220>
<221> 基因
<222> (1)..(5201)
<223> 意大利嗜熱厭氧桿菌基因組中的序列
<400> 9
ttgaaaatta ctctactatc tttaatgatt tttattatga tttttggagg aattacttcg 60
gcatacgctt acgacaaaat ccacgttgtt tcaaaaggtg agtcgctata tttaatagct 120
aaatggtatg gaagtgatgt aaatagccta aaagaggtaa atggaaaatg gagtgatttg 180
atatatcccg gtgaaaaatt agttgtgcca gtaaacgtaa acactgctta ttacaattat 240
cttgctgata gatatttaat tgcaaaaatg atttatgctg aagctcgagg agaaagcttg 300
gaaggccaag tagctgtagg tgcggtaatt ttgaatagag taaaaagtaa tattttccca 360
gatactgtag caggagttat atatcagtca gatgcttttg agtctataac aaatggcgag 420
tttttcaatc acgagcctga ccttacagct tttaaagcgg cagatttagc tttagctgga 480
tgggacccaa cgggtggagc actatacttt ttcaatccgg ctacttcaac ttcttggtgg 540
atatggacaa ggacagttac taatgtcata gggaaccact ggtttgcaat atagaaaggc 600
gtcctgcctt tctatattgc atgtatttta cattataaaa ttttactttt gtaaaagaat 660
aagaatagca ctaaaaatag gagctgatca tatggtatat atttttgtag gaggaagttc 720
ggaaaaaagt ttgcttataa gatttttatc ctactgtgta aattctaaag aaacagtaat 780
aggacagtta aaaaattata atgagagagc agatattttg attatttctg atattttaaa 840
cgaggaagat tttaacaagt taaaaaatta tatttatagc tttccaagca gtattataat 900
aacaaatgga gatgatgagc tatcaaataa actctttgca aaaggaataa attctaccct 960
tataacatgc ggtttgaatc caaaatcttc cattactgct tcttcaatat cctatgaaga 1020
agagggctat gaatttaatt attgcgtaca aagggctttt tttaatttaa agggtaaatt 1080
aatagaacca ttggaaatac ctgttgaaat aaaagtttct gaacagtata atatatatga 1140
ctcattgttt gtaataactg tattattgat tttaggaaat gaaataaaag atatacaaaa 1200
tgtagttaaa acctttaaag atagtggata gtggcaattt tttaaaaatt aattttagaa 1260
attacctttt actatctgtc ataaatgctt tctaatttta atatatattt ttagaagata 1320
cataagggga aggggagagt gaacacatgg caggcaactt tttggagaac aacgtagttg 1380
tagtggtggg gagaattttt actgatttag agtatagcca tcaactatat ggggaaaaat 1440
tttttaattt tattttggaa gttccaagat tgagtgagac gaaagattat cttcctgtca 1500
ctatttctaa ccgtttattt gaaggcatga atttagaggt tggtacaagg ataaagattg 1560
aagggcaatt aaggtcttac aataggaaat caccagaaga ggggaaaaat aagttgatat 1620
taaccatatt tgctcgagat ataatggcat tgtcagaaga ggaaatagta aaaaatccga 1680
atgaaatttt tttggatggc tttatttgta aaaaacctgt ttatagaact actcctttag 1740
gaagagaaat aaccgattta ttaattgctg taaataggcc ttataacaaa tctgattaca 1800
tacctgttat agcgtggggg agaaatgcga ggttttctga gaagttggaa ataggagatc 1860
gtatacgctt gtggggaaga gtacagagta gggaatatca gaaaaaactg ggcgatgaag 1920
tggctacaaa ggtagcttat gaggtttcta ttacaagaat ggaagtggtt gaaaaagaat 1980
tgcaaaagag ttagaatgga agtaacggag gacaaaagga ggaataaatt ttggaaagag 2040
gacttataca agtttatact ggagacggca aggggaagac taccgcttct attggtcttg 2100
gcataagggc agtgggaaga ggatttaaag tatatatggt acaattttta aaaggagcag 2160
atacaggaga acttcataca cttaagaata ttgaaaattt taaagttttt aggtttcagt 2220
ccacaaataa atttttttgg acattgacgg aagaagagaa aaaaatcctc gcggaagaca 2280
tgaaaaaagc ctatgatttt gtagtagagg tgcttaaaaa caaaaaatgt gatgtcctta 2340
ttttagatga gataatggcg gcaatatata gcaagatgta cactgtagag gatgtgttaa 2400
aattaataga tatgaaacct aaagagatgg aacttgtttt gacaggtaga agtgctcctc 2460
aagaaattat tgaaagggcg gatttggtta cagaaatgaa agcaattaaa catccatttg 2520
aaaagggaat accagcaaga tacggtatag aatactaaaa cacccgaaaa atcgggtgtt 2580
ttaattaacc tcttaagtct tccatgagtt ttgttttttc acgagttttg tcatctacta 2640
cttttacaat tttagctgga actcctgcga ctactgtgtt aggtggtaca tcttctgtca 2700
ccactgaacc tgctgctaca acagcgccat ggcctactct tactccttct aatatgactg 2760
catttgctcc gacaagtacg ttatcttcaa gcacaaccgg cacgctgcta ggaggttcca 2820
atacacctgc tattacagct ccagctccta catggacgtt tttgcctata attcctctag 2880
cgcctattac tgcgttcatg tctatcatag aattttcacc aatttctgca cctatattta 2940
tcactgctcc catcataatc acagcgtttt tgcctatttt gactttatct ctaattattg 3000
cccctggttc tattctcgcg tcaagatgct taatatccag taaaggaatt gcagagtttc 3060
tgcgatcata ctctagatga taatgtttta ttttatcttt gtttgcttca atcaattttt 3120
ccacgacatc tagttctcca aaaataactt taaagttatc acagccatat acttctaatt 3180
cttcggtttc tttaatttct atattccctt gtatgtaagc tctaacgggc gttgactttt 3240
ttgcctcttt aatgtatctt gcaatttcat aaggatttgt taaattatca tttgtactca 3300
aatactatca tcctttcttt acaaggtctt ccatgctgta taacccaggt ttttgaccta 3360
ttatgaattt tgcagcatgt agggcaccat agccaaaaat ttcgcgggat tgggcagagt 3420
gacttatggt gattacttca tcgtgaccag caaaaattac ttggtgctca cccacaattg 3480
tgcctcccct tactgcatgt atccctaatt cattcgtttt tctctgttca gttttagtat 3540
ggcgtccata cacgtattct tttttgtcat ttagtacttg gtttatgcta tctgcaatca 3600
ttaacgcagt gccacttgga gcatcttttt tcatattgtg atgtttctct attatttcta 3660
tgtcaaaatc ttgctgcaat atttttgcag cttcttttac aaggtttata agaatattca 3720
ctccaaggga catatttgca gatttgaaaa ttggtatttc ttttgatgca tgttttatga 3780
catttaattc ttcttcactg agtcctgttg tggcaatgac tacaggaagt ttcttttgta 3840
gagcggcttt tactaaatta ggtacagctt catggtatga aaagtcaatt actacatccg 3900
cttcttcttt tacatctttt aaatcgctgt aaacaggaaa gtcaagagga gagatgtttt 3960
tatctactcc tgctactatt ttaaaatcgg gactttctgc tgctaacttt gctacgactt 4020
ttcccatttt tccgttacag ccgtgaatta ttattctaat cattaatttg cctccttcaa 4080
taaaccgtat tttgaaagaa cagatttcag atattctaag tttttatcgc tcatttcaac 4140
aagtgggagg cgcaaaggtc ctacgttgaa tcccattaag ttcatagcag tttttacagg 4200
aatagggttt gtttctacga aaagtgcttt attcagaggg ttaagttcta attgcatgtt 4260
tcttgccttt tcaatgtccc catttaaata agcggttgtc atctcatgta tttttgccgg 4320
gattatattt gccgtgacag atattacgcc taagccccct aaagacatta ttggtattac 4380
ttggtcgtca tttcctgagt atatttcgaa agatttaccc ataatacggg caatttcagc 4440
tacttgtaca atgtcaccac tggcttcttt taccccaact acgttgtcta catgtttact 4500
taattcaaga taagtttctg gcaacatatt aagagatgtc ctgcttggga cattatagat 4560
aataataggt atatctacgt gtcttgctat ttcagtaaaa tgagccacta atcccttttg 4620
tgttgttttg ttgtaatatg gtgttataac taaaagagca tcagcacctg cagattgagc 4680
atattcactc atttcaacgg catgggctgt attgttagaa ccggtccctg caattattgg 4740
tattcttccg gcaacttttt caacggtaaa tttgattgcc gcttgttgct cttcttgtgt 4800
cattgtagag gcttcaccag tggtaccaca tatgatgatt gcatcagttc cttctttgat 4860
atgccattca ataagctcgc caagtttttc aaaatttacg ccctcttcat taaatggagt 4920
aacaatagcg acacctgacc ctttaaaaac aggcataatt attctccttt cacatatttt 4980
taattaaaag ttctgctatt tgaacggcgt ttgtagctgc cccttttctt atgttgtcag 5040
ctacaatcca catattaaga ccgctgtaaa ctgtctcatc tcgtcttatt ctacctacaa 5100
aaacttcatc ttttcctgtg gcataagttg caagaggata aatattattt tgaggatcgt 5160
cttgtacaac aactcctgga gcatgtttta agacctctat t 5201
<210> 10
<211> 4816
<212> DNA
<213> 葡萄球菌屬
<220>
<221> 基因
<222> (1)..(4816)
<223> 編碼rRNA的Staph 16S+ITS+23S基因
<400> 10
ttttatggag agtttgatcc tggctcagga tgaacgctgg cggcgtgcct aatacatgca 60
agtcgagcga acggacgaga agcttgcttc tctgatgtta gcggcggacg ggtgagtaac 120
acgtggataa cctacctata agactgggat aacttcggga aaccggagct aataccggat 180
aatattttga accgcatggt tcaaaagtga aagacggtct tgctgtcact tatagatgga 240
tccgcgctgc attagctagt tggtaaggta acggcttacc aaggcaacga tgcatagccg 300
acctgagagg gtgatcggcc acactggaac tgagacacgg tccagactcc tacgggaggc 360
agcagtaggg aatcttccgc aatgggcgaa agcctgacgg agcaacgccg cgtgagtgat 420
gaaggtcttc ggatcgtaaa actctgttat tagggaagaa catatgtgta agtaactgtg 480
cacatcttga cggtacctaa tcagaaagcc acggctaact acgtgccagc agccgcggta 540
atacgtaggt ggcaagcgtt atccggaatt attgggcgta aagcgcgcgt aggcggtttt 600
ttaagtctga tgtgaaagcc cacggctcaa ccgtggaggg tcattggaaa ctggaaaact 660
tgagtgcaga agaggaaagt ggaattccat gtgtagcggt gaaatgcgca gagatatgga 720
ggaacaccag tggcgaaggc gactttctgg tctgtaactg acgctgatgt gcgaaagcgt 780
ggggatcaaa caggattaga taccctggta gtccacgccg taaacgatga gtgctaagtg 840
ttagggggtt tccgcccctt agtgctgcag ctaacgcatt aagcactccg cctggggagt 900
acgaccgcaa ggttgaaact caaaggaatt gacggggacc cgcacaagcg gtggagcatg 960
tggtttaatt cgaagcaacg cgaagaacct taccaaatct tgacatcctt tgacaactct 1020
agagatagag ccttcccctt cgggggacaa agtgacaggt ggtgcatggt tgtcgtcagc 1080
tcgtgtcgtg agatgttggg ttaagtcccg caacgagcgc aacccttaag cttagttgcc 1140
atcattaagt tgggcactct aagttgactg ccggtgacaa accggaggaa ggtggggatg 1200
acgtcaaatc atcatgcccc ttatgatttg ggctacacac gtgctacaat ggacaataca 1260
aagggcagcg aaaccgcgag gtcaagcaaa tcccataaag ttgttctcag ttcggattgt 1320
agtctgcaac tcgactacat gaagctggaa tcgctagtaa tcgtagatca gcatgctacg 1380
gtgaatacgt tcccgggtct tgtacacacc gcccgtcaca ccacgagagt ttgtaacacc 1440
cgaagccggt ggagtaacct tttaggagct agccgtcgaa ggtgggacaa atgattgggg 1500
tgaagtcgta acaaggtagc cgtatcggaa ggtgcggctg gatcacctcc tttctaagga 1560
tatattcgga acatcttctt cagaagatgc ggaataacgt gacatattgt attcagtttt 1620
gaatgtttat ttaacattca aaaaaatggg cctatagctc agctggttag agcgcacgcc 1680
tgataagcgt gaggtcggtg gttcgagtcc acttaggccc accattattt gtacattgaa 1740
aactagataa gtaagtaaaa tatagatttt accaagcaaa accgagtgaa taaagagttt 1800
taaataagct tgaattcata agaaataatc gctagtgttc gaaagaacac tcacaagatt 1860
aataacgcgt ttcctgtagg atggaaacat agattaagtt attaagggcg cacggtggat 1920
gccttggcac tagaagccga tgaaggacgt tactaacgac gatatgcttt ggggagctgt 1980
aagtaagctt tgatccagag atttccgaat ggggaaaccc agcatgagtt atgtcatgtt 2040
atcgatatgt gaatacatag catatcagaa ggcacacccg gagaactgaa acatcttagt 2100
acccggagga agagaaagaa aattcgattc ccttagtagc ggcgagcgaa acgggaagag 2160
cccaaaccaa caagcttgct tgttggggtt gtaggacact ctatacggag ttacaaagga 2220
cgacattaga cgaatcatct ggaaagatga atcaaagaag gtaataatcc tgtagtcgaa 2280
aatgttgtct ctcttgagtg gatcctgagt acgacggagc acgtgaaatt ccgtcggaat 2340
ctgggaggac catctcctaa ggctaaatac tctctagtga ccgatagtga accagtaccg 2400
tgagggaaag gtgaaaagca ccccggaagg ggagtgaaat agaacctgaa accgtgtgct 2460
tacaagtagt cagagcccgt taatgggtga tggcgtgcct tttgtagaat gaaccggcga 2520
gttacgattt gatgcaaggt taagcagtaa atgtggagcc gtagcgaaag cgagtctgaa 2580
tagggcgttt agtatttggt cgtagacccg aaaccaggtg atctaccctt ggtcaggttg 2640
aagttcaggt aacactgaat ggaggaccga accgacttac gttgaaaagt gagcggatga 2700
actgagggta gcggagaaat tccaatcgaa cctggagata gctggttctc tccgaaatag 2760
ctttagggct agcctcaagt gatgattatt ggaggtagag cactgtttgg acgaggggcc 2820
cctctcgggt taccgaattc agacaaactc cgaatgccaa ttaatttaac ttgggagtca 2880
gaacatgggt gataaggtcc gtgttcgaaa gggaaacagc ccagaccacc agctaaggtc 2940
ccaaaatata tgttaagtgg aaaaggatgt ggcgttgccc agacaactag gatgttggct 3000
tagaagcagc catcatttaa agagtgcgta atagctcact agtcgagtga cactgcgccg 3060
aaaatgtacc ggggctaaac atattaccga agctgtggat tgtcctttgg acaatggtag 3120
gagagcgttc taagggcgtt gaagcatgat cgtaaggaca tgtggagcgc ttagaagtga 3180
gaatgccggt gtgagtagcg aaagacgggt gagaatcccg tccaccgatt gactaaggtt 3240
tccagaggaa ggctcgtccg ctctgggtta gtcgggtcct aagctgaggc cgacaggcgt 3300
aggcgatgga taacaggttg atattcctgt accacctata atcgttttaa tcgatggggg 3360
gacgcagtag gataggcgaa gcgtgcgatt ggattgcacg tctaagcagt aaggctgagt 3420
attaggcaaa tccggtactc gttaaggctg agctgtgatg gggagaagac attgtgtctt 3480
cgagtcgttg atttcacact gccgagaaaa gcctctagat agaaaatagg tgcccgtacc 3540
gcaaaccgac acaggtagtc aagatgagaa ttctaaggtg agcgagcgaa ctctcgttaa 3600
ggaactcggc aaaatgaccc cgtaacttcg ggagaagggg tgctctttag ggttaacgcc 3660
cagaagagcc gcagtgaata ggcccaagcg actgtttatc aaaaacacag gtctctgcta 3720
aaccgtaagg tgatgtatag gggctgacgc ctgcccggtg ctggaaggtt aagaggagtg 3780
gttagcttct gcgaagctac gaatcgaagc cccagtaaac ggcggccgta actataacgg 3840
tcctaaggta gcgaaattcc ttgtcgggta agttccgacc cgcacgaaag gcgtaacgat 3900
ttgggcactg tctcaacgag agactcggtg aaatcatagt acctgtgaag atgcaggtta 3960
cccgcgacag gacggaaaga ccccgtggag ctttactgta gcctgatatt gaaattcggc 4020
acagcttgta caggataggt aggagccttt gaaacgtgag cgctagctta cgtggaggcg 4080
ctggtgggat actaccctag ctgtgttggc tttctaaccc gcaccactta tcgtggtggg 4140
agacagtgtc aggcgggcag tttgactggg gcggtcgcct cctaaaaggt aacggaggcg 4200
ctcaaaggtt ccctcagaat ggttggaaat cattcataga gtgtaaaggc ataagggagc 4260
ttgactgcga gacctacaag tcgagcaggg tcgaaagacg gacttagtga tccggtggtt 4320
ccgcatggaa gggccatcgc tcaacggata aaagctaccc cggggataac aggcttatct 4380
cccccaagag ttcacatcga cggggaggtt tggcacctcg atgtcggctc atcgcatcct 4440
ggggctgtag tcggtcccaa gggttgggct gttcgcccat taaagcggta cgcgagctgg 4500
gttcagaacg tcgtgagaca gttcggtccc tatccgtcgt gggcgtagga aatttgagag 4560
gagctgtcct tagtacgaga ggaccgggat ggacatacct ctggtgtacc agttgtcgtg 4620
ccaacggcat agctgggtag ctatgtgtgg acgggataag tgctgaaagc atctaagcat 4680
gaagcccccc tcaagatgag atttcccaac ttcggttata agatccctca aagatgatga 4740
ggttaatagg ttcgaggtgg aagcatggtg acatgtggag ctgacgaata ctaatcgatc 4800
gaagacttaa tcaaaa 4816
<210> 11
<211> 22
<212> DNA
<213> 大腸桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(22)
<223> 用于thrA基因的MB8 fw1引物
<400> 11
gacggtagat tcgaggtaat gc 22
<210> 12
<211> 20
<212> DNA
<213> 大腸桿菌
<220>
<221> 引物_結(jié)合
<222> (1)..(20)
<223> 用于thrA基因的MB8 Re1引物
<400> 12
tatggccggc gtattagaag 20
<210> 13
<211> 35
<212> DNA
<213> 合成
<220>
<221> 莖環(huán)
<222> (1)..(35)
<223> ThrA引物的分子信標
<400> 13
cgtttgtgtt ttcgaccgga tcgataacag taacg 35
<210> 14
<211> 97
<212> DNA
<213> 大腸桿菌
<220>
<221> 基因
<222> (1)..(97)
<223> ThrA基因中的序列
<400> 14
gacggtagat tcgaggtaat gccccactgc cagcagtttt tcgaccggat cgataacagt 60
aacgttgtga ccgcgcgctt ctaatacgcc ggccata 97