帶標(biāo)簽dna片段的產(chǎn)生的制作方法【專利摘要】本發(fā)明涉及用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段和與其相關(guān)的核酸分子的新方法、試劑盒和用途。【專利說明】帶標(biāo)簽DNA片段的產(chǎn)生[0001]本發(fā)明涉及用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段和與其相關(guān)的核酸分子的新方法、試劑盒和用途。
技術(shù)領(lǐng)域:
[0002]本發(fā)明涉及分子生物學(xué)領(lǐng)域,更具體來說涉及DNA片段的產(chǎn)生,特別是涉及靶DNA的多個帶標(biāo)簽DNA片段或相應(yīng)的文庫的產(chǎn)生。【
背景技術(shù):
】[0003]對于現(xiàn)代分子生物學(xué)技術(shù)中的許多應(yīng)用來說,需要帶標(biāo)簽的DNA片段。例如,在諸如下一代測序(NGS)的應(yīng)用中,待測序的DNA必須以片段化形式提供,然后擴(kuò)增最終作為測序反應(yīng)的底物的簇。此外,必須向模板的兩個末端添加接頭序列,以確保標(biāo)引、片段的擴(kuò)增并提供對測序引物特異性的序列。[0004]目前,使用不同方法來處理模板并產(chǎn)生帶標(biāo)簽的DNA片段或其相應(yīng)的文庫。這些已知方法是基于核酸的物理或酶促消化以及隨后的酶反應(yīng)來制備適合用于測序的末端,例如片段的酶促末端修復(fù)、A添加和接頭連接。[0005]在本領(lǐng)域中描述了一種制備帶標(biāo)簽DNA片段的文庫的方法,所述方法包括在一個步驟中進(jìn)行酶促片段化和接頭連接。兩個反應(yīng)都由被稱為轉(zhuǎn)座酶的酶執(zhí)行,所述轉(zhuǎn)座酶使用小的dsDNA轉(zhuǎn)座子樣分子同時對模板或靶DNA進(jìn)行片段化和加標(biāo)簽。所述片段化和同時的接頭連接是基于轉(zhuǎn)座酶的使用。這種技術(shù)被公開在WO2010/048605A1中。它也是川uiWsi'Nextera?DNA試劑盒的主題。[0006]然而,使用轉(zhuǎn)座酶和dsDNA轉(zhuǎn)座子樣分子進(jìn)行片段化和同時的接頭連接具有幾個缺點。鏈轉(zhuǎn)移反應(yīng)隱含的切割和粘貼機(jī)制是復(fù)雜的。轉(zhuǎn)座酶反應(yīng)可引起dsDNA轉(zhuǎn)座子樣分子和靶DNA兩者的核苷酸序列的變化。因此,隨后的DNA測序反應(yīng)可能產(chǎn)生不正確的結(jié)果。此外,轉(zhuǎn)座酶的相對長的識別序列需要被包含在所述dsDNA轉(zhuǎn)座子樣分子中。這些序列或者被設(shè)計成測序引物的一部分并造成在與不同平臺和/或文庫索引一起使用中靈活性較低,或者作為每個測序模板的一部分被測序,造成測序能力的浪費。[0007]針對這一背景,本發(fā)明的目標(biāo)是提供一種產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的方法,在所述方法中與現(xiàn)有技術(shù)相關(guān)的問題可以被減少或避免。[0008]本發(fā)明滿足了這些以及其他需求。【
發(fā)明內(nèi)容】[0009]本發(fā)明提供了一種用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的方法,所述方法包括:[0010](i)將所述靶DNA與整合酶和包含整合酶識別位點的至少一種DNA接頭分子相接觸,以獲得反應(yīng)混合物,[0011](ii)將所述反應(yīng)混合物在所述整合酶催化所述至少一種接頭分子的3'加工和鏈轉(zhuǎn)移反應(yīng)的條件下溫育,其中[0012](a)所述靶DNA被片段化以產(chǎn)生多個靶DNA片段,并且[0013](b)所述至少一種DNA接頭分子被連接到所述多個靶DNA片段中的每個的至少一個末端,[0014]以產(chǎn)生所述靶DNA的多個帶標(biāo)簽DNA片段。[0015]本發(fā)明還提供了整合酶在產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的文庫中的用途。[0016]本發(fā)明人令人吃驚地認(rèn)識到,整合酶可用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段或產(chǎn)生由這些帶標(biāo)簽DNA片段構(gòu)成的文庫。與W02010/048605中所公開的基于轉(zhuǎn)座酶的片段化和同時的接頭連接相反,由于整合酶與轉(zhuǎn)座酶相比具有較低選擇性,本發(fā)明的方法提供了具有更好的覆蓋均勻度的解決方案。整合酶的酶反應(yīng)復(fù)雜性較低,并且DNA接頭分子的鏈轉(zhuǎn)移或整合不改變核苷酸序列,因此確保了隨后測序反應(yīng)中的高精度。整合酶識別位點比轉(zhuǎn)座酶識別位點短,使得帶標(biāo)簽DNA片段或其得到的文庫更加靈活。[0017]本發(fā)明的方法允許在僅僅一個步驟中產(chǎn)生多個帶標(biāo)簽DNA片段或文庫,并將工作時間從1天減少到1至2小時。獲得的帶標(biāo)簽DNA片段可用于不同NGS平臺中。[0018]當(dāng)在本文中使用時,"靶DNA"是指經(jīng)歷反應(yīng)混合物以產(chǎn)生其帶標(biāo)簽片段的任何目標(biāo)雙鏈DNA(dsDNA)。"靶DNA"可以源自于任何體內(nèi)或體外來源,包括源自于一個或多個細(xì)胞、組織、器官或生物體,不論是活的還是死的,是原核還是真核,或源自于任何生物來源或環(huán)境來源。通常但不是排他地,"靶DNA"是指核苷酸序列將通過測序例如下一代測序(NGS)來闡明的這種dsDNA。[0019]當(dāng)在本文中使用時,"DNA片段"是指靶DNA的一部分或片段或區(qū)段,其從更長的DNA分子切下或釋放出來或斷裂下來,使得它不再連接到母體分子。[0020]當(dāng)在本文中使用時,"整合酶"是指具有由反轉(zhuǎn)錄病毒例如HIV產(chǎn)生的反轉(zhuǎn)錄病毒整合酶的酶活性的蛋白質(zhì)。它能夠?qū)NA接頭分子優(yōu)選地經(jīng)由它的整合酶識別位點,通過DNA接頭分子或相應(yīng)的整合酶識別位點的3'加工整合到靶DNA中,并將所述DNA接頭分子轉(zhuǎn)移到所述靶DNA,由此產(chǎn)生所述靶DNA的帶標(biāo)簽DNA片段。[0021]當(dāng)在本文中使用時,"DNA接頭分子"是指被連接到靶DNA的片段的一個或兩個末端以便提供標(biāo)簽的dsDNA分子。通常,"DNA接頭分子"具有約5至100bp之間的長度。因此,"DNA接頭分子"不能等同于例如在WO2010/048605A1中所使用的dsDNA轉(zhuǎn)座子樣分子。[0022]當(dāng)在本文中使用時,"整合酶識別位點"是指dsDNA或相應(yīng)的DNA接頭分子的區(qū)段或序列,其被整合酶特異性且選擇性地識別和結(jié)合,從而允許所述DNA接頭分子整合和/或轉(zhuǎn)移到所述靶DNA。"整合酶識別位點"包括或可以體現(xiàn)為被稱為長末端重復(fù)序列(LTR)的核苷酸序列。[0023]當(dāng)在本文中使用時,"加標(biāo)簽"是指將DNA接頭分子連接到靶DNA分子的過程。經(jīng)歷加標(biāo)簽或含有標(biāo)簽的DNA被稱為"帶標(biāo)簽的",例如"帶標(biāo)簽DNA"。[0024]"催化所述至少一種DNA接頭分子的加工和鏈轉(zhuǎn)移反應(yīng)"的條件對于本領(lǐng)域技術(shù)人員來說是公知的。這種條件為整合酶提供了允許后者發(fā)揮其酶活性的環(huán)境。這種條件還確保整合酶、靶DNA和DNA接頭分子能夠相互作用以允許整合酶反應(yīng)。[0025]帶標(biāo)簽DNA片段或多個DNA片段的產(chǎn)生還包括產(chǎn)生帶標(biāo)簽片段的文庫的概念。[0026]本發(fā)明的方法遠(yuǎn)不是顯而易見的。[0027]到目前為止,將病毒核酸整合到宿主DNA中的原理僅僅被用于開發(fā)可用于測試整合酶的活性及其抑制劑的測定法。就此而言,可以參考下列關(guān)于1型HIV整合酶的出版物:Inayoshi等,(2010),轉(zhuǎn)錄因子YY1與反轉(zhuǎn)錄病毒整合酶相互作用并促進(jìn)莫羅尼鼠類白血病病毒cDNA在宿主染色體中的整合(TranscriptionfactorYY1interactswithretroviralintegrasesandfacilitatesintegrationofmoloneymurineleukemiaviruscDNAintothehostchromosomes),J.Virol.84(16),p.8250_8261;Goodarzi等,(1995),反轉(zhuǎn)錄病毒樣DNA被人類免疫缺陷病毒1型整合酶的協(xié)調(diào)整合(Concertedintegrationofretrovirus-likeDNAbyhumanimmunodeficiencyvirustypelintegrase),J.Virol.69(10),p.6090-6097;Ellison等,(1994),整合酶與病毒DNA末端之間的穩(wěn)定復(fù)合物介導(dǎo)人類免疫缺陷病毒的體外整合(AstablecomplexbetweenintegraseandviralDNAendsmediateshumanimmunodeficiencyvirusintegrationinvitro),Proc.Natl.Acad·Sci.USA91(15),p·7316-7320;Yoshinaga等,(1995),1型人類免疫缺陷病毒的整合信號序列內(nèi)的堿基在體外的不同作用(Differentrolesofbaseswithintheintegrationsignalsequenceofhumanimmunodeficiencyvirustype1invitro),J.Virol.69(5),p.3233-3236;Quashie等,(2012),革巴向HIV整合酶的新的治療策略(NoveltherapeuticstrategiestargetingHIVintegrase),BMCMed.10,p.34;Pruss等,(1994),人類免疫缺陷病毒整合酶引導(dǎo)向核小體核心內(nèi)嚴(yán)重DNA扭曲位點的整合(HumanimmunodeficiencyvirusintegrasedirectsintegrationtositesofsevereDNAdistortionwithinthenucleosomecore),Proc.Natl.Acad.Sci.USA91(13),p.5913-5917;Tsuruyama等,(2010),體外HIV-1選擇性整合到革巴序列中以及修飾序列的誘懼效應(yīng)(InvitroHIV-1selectiveintegrationintothetargetsequenceanddecoy-effectofthemodifiedsequence),PLoS0ne.5(ll),el3841;Hansen等,(1999),源自于HIV載體的用于體外快速測定法的整合復(fù)合物(IntegrationcomplexesderivedfromHIVvectorsforrapidassaysinvitro)?Nat.Biotechnol.17(6),p.578-582;Delelis等,(2008),整合酶和整合:HIV-1整合酶的生物化學(xué)活性(Integraseandintegration:biochemicalactivitiesofHIV-1integrase),Retrovirology5,p.114〇[0028]下面的出版物涉及AMV整合酶:NareZkina等,(2004),禽肉瘤病毒整合位點的基因組廣度的分析(Genome-wideanalysesofaviansarcomavirusintegrationsites),J.Virol.78(21),p.11656-11663;Yao等,(2003),禽反轉(zhuǎn)錄病毒整合酶增強(qiáng)的轉(zhuǎn)入基因在哺乳動物細(xì)胞DNA中的體內(nèi)整合(Avianretrovirusintegrase-enhancedtransgeneintegrationintomammaliancellDNAinvivo)?Biotechniques35(5),p·1072_1078〇[0029]下面的出版物聚焦于綿羊髓鞘脫落病毒的整合酶:Katzman等,(1994),純化的綿羊髓鞘脫落病毒整合酶的體外活性(Invitroactivitiesofpurifiedvisnavirusintegrase),J·Virol·68(6),p·3558-3569。[0030]下面的出版物涉及M-MuLV的整合酶:Dildine等,(1998),嵌合的Ty3/莫羅尼鼠類白血病病毒整合酶蛋白在體內(nèi)有活性(AchimericTy3/moloneymurineleukemiavirusintegraseproteinisactiveinvivo),J.Virol·72(5),p·4297_4307〇[0031]所謂的ZAM整合酶是下述出版物的主題:Faye等,(2008),由LTR-反轉(zhuǎn)錄轉(zhuǎn)座子編碼的高特異性整合酶的功能特征(FunctionalcharacteristicsofahighlyspecificintegraseencodedbyanLTR-retrotransposon),PLoSOne·3(9),e3185〇[0032]HIV、AMV、MuLV整合酶是下述出版物的主題:Dolan等,(2009),確定HIV-1整合酶上的DNA底物結(jié)合位點(DefiningtheDNAsubstratebindingsitesonHIV-1integrase),J.Mol.Biol.385(2),p.568-579〇[0033]然而,現(xiàn)有技術(shù)沒有提到將整合酶用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段或相應(yīng)地由其構(gòu)成的文庫。[0034]本發(fā)明隱含的目的由此得以完全解決。[0035]根據(jù)本發(fā)明的方法的另一種發(fā)展,在步驟(ii)(b)中,所述至少一種DNA接頭分子被連接到所述多個靶DNA片段中的每個的兩個末端。[0036]這種措施具有下述優(yōu)點:所述靶DNA的帶標(biāo)簽DNA片段將以準(zhǔn)備在后續(xù)反應(yīng)例如通過NGS的測序反應(yīng)中加工的方式提供。[0037]根據(jù)本發(fā)明的方法的優(yōu)選實施方式,所述至少一種DNA接頭分子還包含用于寡核苷酸、優(yōu)選為PCR引物和/或測序引物退火的位點("引物退火位點",PAS)。[0038]這種措施具有下述優(yōu)點:所述帶標(biāo)簽DNA片段已被提供成"準(zhǔn)備擴(kuò)增"或"準(zhǔn)備測序"的狀態(tài)。[0039]所述用于寡核苷酸退火的位點可以被構(gòu)造成使寡核苷酸引物退火以例如在下一代測序反應(yīng)(NGS)的情形中通過DNA聚合酶進(jìn)行延伸,或使寡核苷酸退火以進(jìn)行捕獲或連接反應(yīng)。所述DNA接頭分子可以包含與所述退火位點分隔開的整合酶識別位點或相應(yīng)的LTR,例如所述整合酶識別位點位于它的第一末端,所述退火位點位于它的第二末端。[0040]根據(jù)另一個實施方式,本發(fā)明的方法在步驟(ii)后還包括下述步驟:(iiZ對所述靶DNA的所述多個帶標(biāo)簽DNA片段進(jìn)行PCR,以向所述至少一種DNA接頭分子添加用于寡核苷酸退火的位點,優(yōu)選地所述用于寡核苷酸退火的位點被構(gòu)造成用于PCR引物和/或測序引物退火。[0041]通過這種可選方法,可以使用僅僅包含整合酶識別位點(IRS)的DNA接頭分子。在獲得所述帶標(biāo)簽DNA片段后,將后者與至少一對PCR引物溫育,所述至少一對PCR引物被構(gòu)造成在PCR反應(yīng)中向所述至少一種DNA接頭分子添加用于寡核苷酸例如PCR引物和/或測序引物退火的位點。所述PCR引物對的第一PCR引物也可以包含能夠雜交到所述DNA接頭分子的IRS的IRS。所述第一PCR引物還可以包含用于寡核苷酸例如PCR引物和/或測序引物退火的位點。然后,所述PCR引物對的第二PCR引物可以被構(gòu)造成雜交到所述第一PCR引物,優(yōu)選地雜交到所述用于寡核苷酸退火的位點。因此,所述PCR引物對的所述第一PCR引物可能長于所述第二PCR引物。對包含所述帶標(biāo)簽DNA片段和所述至少一對PCR引物(長和短PCR引物)的所述反應(yīng)混合物在適合于擴(kuò)增所述帶標(biāo)簽DNA片段的條件下進(jìn)行PCR,將導(dǎo)致所述帶標(biāo)簽DNA片段的富集。并行地,然后通過在所述PCR中添加用于寡核苷酸退火的位點來完成所述帶標(biāo)簽DNA片段的DNA接頭分子。[0042]根據(jù)本發(fā)明的方法的優(yōu)選實施方式,所述整合酶選自反轉(zhuǎn)錄病毒整合酶,包括HIV整合酶,以及源自于反轉(zhuǎn)錄病毒整合酶的整合酶。[0043]這種措施具有下述優(yōu)點:提供了已被證明能提供最佳結(jié)果的整合酶。其他適合的整合酶是AMV整合酶、綿羊髓鞘脫落病毒整合酶、MuLV整合酶、ZAM整合酶。[0044]當(dāng)在本文中使用時,"源自于反轉(zhuǎn)錄病毒整合酶的整合酶"是指一組具有反轉(zhuǎn)錄病毒整合酶的3'加工和鏈轉(zhuǎn)移活性的酶。根據(jù)本發(fā)明,源自于反轉(zhuǎn)錄病毒整合酶的整合酶也涵蓋包含催化整合所必需的所謂的DDE基序的這種整合酶。這些衍生的整合酶可能不含非功能性結(jié)構(gòu)域。這種衍生的整合酶的實例是已被本發(fā)明人使用的HIV-1來源的整合酶。它包含HIV-1整合酶的由50至212號氨基酸構(gòu)成的"核心",但是缺少初始的N端和最后的C端氨基酸。[0045]根據(jù)本發(fā)明的方法的另一個優(yōu)選發(fā)展,所述至少一種DNA接頭分子由包含互補的核苷酸序列并彼此特異性雜交的兩個核酸分子構(gòu)成,所述接頭分子選自:[0046]接頭1(SEQIDno.l+SEQIDηο·2),[0047]接頭2(SEQIDno.3+SEQIDηο·2),[0048]接頭3(SEQIDno.6+SEQIDηο·2),[0049]接頭4(SEQIDno.7+SEQIDηο·2),[0050]接頭5(SEQIDno.8+SEQIDηο·4),[0051]接頭6(SEQIDno.9+SEQIDηο·4),[0052]接頭7(SEQIDno.8+SEQIDηο·5),[0053]接頭8(SEQIDno.9+SEQIDηο·5),[0054]接頭9(SEQIDno.l4+SEQIDηο·15),[0055]接頭l〇(SEQIDηο.ΙΟ+SEQIDno.ll),[0056]接頭11(SEQIDno.l2+SEQIDno.13)。[0057]這種措施具有下述優(yōu)點:提供了特別適合于本發(fā)明方法的這種DNA接頭分子。[0058]已約定,括號中敘述的第一個序列是指dsDNA接頭序列的第一鏈,括號中敘述的第二個序列是dsDNA接頭分子的第二鏈。[0059]根據(jù)本發(fā)明方法的另一個發(fā)展,所述方法還包括:[0060](iii)純化該靶DNA的所述多個帶標(biāo)簽DNA片段。[0061]這種措施具有下述優(yōu)點:所述整合酶、非片段化靶DNA、靶DNA和接頭DNA的未帶標(biāo)簽的片段等通過例如使用QIAquick柱被除去,從而提供了帶標(biāo)簽DNA片段的純化的文庫以供進(jìn)一步使用。[0062]如果本發(fā)明的方法在一個反應(yīng)容器內(nèi)進(jìn)行,這將是優(yōu)選的。[0063]這種措施體現(xiàn)了"一步"法的原則。盡管本發(fā)明的方法被細(xì)分成(i)、(ii)和(iii),但這種細(xì)分僅僅旨在說明所述方法事件的時間順序。然而,所述方法的使用者只需在規(guī)定條件下產(chǎn)生反應(yīng)混合物,由此在一個步驟中自動生產(chǎn)所述靶DNA的多個帶標(biāo)簽DNA片段或帶標(biāo)簽DNA片段的文庫。[0064]本發(fā)明的另一個主題內(nèi)容涉及一種用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的試劑盒,所述試劑盒包含:[0065](i)整合酶,以及[0066](ii)包含整合酶識別位點的至少一種DNA接頭分子。[0067]就本發(fā)明的方法而言,所述至少一種DNA接頭分子還包含用于寡核苷酸退火、優(yōu)選地用于PCR引物和/或測序引物退火的位點。[0068]本發(fā)明的試劑盒中包含的整合酶選自:反轉(zhuǎn)錄病毒整合酶,包括HIV整合酶,源自于反轉(zhuǎn)錄病毒整合酶的整合酶。其他適合的整合酶是AMV整合酶、綿羊髓鞘脫落病毒整合酶、MuLV整合酶、ZAM整合酶。[0069]根據(jù)本發(fā)明的試劑盒的另一種發(fā)展,所述至少一種DNA接頭分子由包含互補的核苷酸序列并彼此特異性雜交的兩個核酸分子構(gòu)成,所述接頭分子選自:[0070]接頭1(SEQIDno.l+SEQIDηο·2),[0071]接頭2(SEQIDno.3+SEQIDηο·2),[0072]接頭3(SEQIDno.6+SEQIDηο·2),[0073]接頭4(SEQIDno.7+SEQIDηο·2),[0074]接頭5(SEQIDno.8+SEQIDηο·4),[0075]接頭6(SEQIDno.9+SEQIDηο·4),[0076]接頭7(SEQIDno.8+SEQIDηο·5),[0077]接頭8(SEQIDno.9+SEQIDηο·5),[0078]接頭9(SEQIDno.l4+SEQIDηο·15),[0079]接頭l〇(SEQIDηο.ΙΟ+SEQIDno.ll),[0080]接頭11(SEQIDno.l2+SEQIDno.13)。[0081]試劑盒是可用于執(zhí)行本發(fā)明的方法的各個要素的組合,其中所述要素被優(yōu)化以一起用于所述方法中。所述試劑盒還含有用于執(zhí)行本發(fā)明的方法的手冊。這種試劑盒統(tǒng)一了執(zhí)行本發(fā)明的方法所需的所有必需要素,由此使錯誤的風(fēng)險最小化。因此,這種試劑盒還允許不太熟練的實驗室工作人員執(zhí)行本發(fā)明的方法。[0082]本發(fā)明的方法的特點、特征和優(yōu)點經(jīng)必要修改后適用于本發(fā)明的試劑盒和相應(yīng)的用途。[0083]本發(fā)明的試劑盒可以包含超過一種例如兩種、三種或四種或更多不同的整合酶,以及超過一種DNA接頭分子,例如兩種、三種、四種等的不同DNA接頭分子。所述試劑盒還可以含有一種或多種不同的緩沖組合物,以便為整合酶和整合反應(yīng)產(chǎn)生最佳環(huán)境,還可以含有參比靶DNA等。[0084]本發(fā)明的另一個主題內(nèi)容涉及一種核酸分子,其包含選自SEQIDno.1至15的核苷酸序列。[0085]本發(fā)明的核酸分子特別適合用于本發(fā)明的方法。具體來說,所述核酸分子可以彼此雜交以便形成適合在本發(fā)明的方法中直接使用的DNA接頭分子。所述雜交安排如下:[0086]SEQIDno.l+SEQIDno.2:接頭1[0087]SEQIDno.3+SEQIDno.2:接頭2[0088]SEQIDno.6+SEQIDno.2:接頭3[0089]SEQIDno.7+SEQIDno.2:接頭4[0090]SEQIDno.8+SEQIDno.4:接頭5[0091]SEQIDno.9+SEQIDno.4:接頭6[0092]SEQIDno.8+SEQIDno.5:接頭7[0093]SEQIDno.9+SEQIDno.5:接頭8[0094]SEQIDno·14+SEQIDno·15:接頭9[0095]SEQIDno·10+SEQIDno·ll:接頭10[0096]SEQIDno·12+SEQIDno·13:接頭ll[0097]除非另有定義,否則在本文中使用的所有技術(shù)和科學(xué)術(shù)語一般具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員所通常理解的相同的含義。[0098]不言而喻,上面提到的特點和仍將在下面解釋的特點不僅可以以相應(yīng)指定的組合使用,而且可以以其他組合或獨自使用,而不背離本發(fā)明的范圍。[0099]其他特點、特征和優(yōu)點可以由優(yōu)選實施方式和附圖的描述推斷。[0100]在附圖中:[0101]圖1示出的圖說明了在涉及整合酶的HIV-ι整合(左側(cè))和涉及轉(zhuǎn)座酶的Tn5轉(zhuǎn)座(右側(cè))中事件順序的差異。[0102]圖2示出的圖說明了本發(fā)明方法的實施方式(Α)和關(guān)于通過所述方法產(chǎn)生的帶標(biāo)簽質(zhì)粒DNA片段的詳細(xì)情況(Β)。[0103]圖3示出了瓊脂糖凝膠的照片,證實了通過本發(fā)明的方法成功產(chǎn)生了帶標(biāo)簽的質(zhì)粒DNA片段。[0104]圖4示出了使用兩種不同循環(huán)條件和兩種不同反應(yīng)緩沖液產(chǎn)生的片段化和連接有接頭的基因組DNA的電泳圖。[0105]圖5示出的圖說明了本發(fā)明方法的另一個實施方式。[0106]圖6示出了使用各種不同的片段化接頭和PCR引物混合物產(chǎn)生的片段化和連接有接頭的基因組DNA的電泳圖。[0107]圖7示出了使用不同溫育溫度獲得的片段化和連接有接頭的基因組DNA的電泳圖。實施例[0108]本發(fā)明方法的中心特點是使用整合酶而不是使用例如如W02010/048605中所公開的在現(xiàn)有技術(shù)的片段化和同時的接頭連接中使用的轉(zhuǎn)座酶。[0109]反轉(zhuǎn)錄病毒DNA的整合是反轉(zhuǎn)錄病毒復(fù)制必須履行的步驟,因為原病毒DNA是生產(chǎn)性感染的模板。由整合酶催化的整合過程可以被分成兩個順序反應(yīng)。第一個反應(yīng)被稱為3'加工,對應(yīng)于特異性核酸內(nèi)切反應(yīng),其將病毒DNA末端制備成能夠勝任隨后通過酯交換反應(yīng)共價插入到宿主細(xì)胞基因組中,也被稱為鏈轉(zhuǎn)移。整合酶首先結(jié)合到病毒DNA的每個末端處被稱為整合酶識別序列(IRS)的短序列或相應(yīng)的長末端重復(fù)序列(LTR),并催化被稱為3'加工的內(nèi)切核苷酸切割,其中從病毒DNA的每個末端消除二核苷酸(denucleotide)。然后將得到的切開的DNA用作整合或鏈轉(zhuǎn)移的底物,引起病毒DNA共價插入到被感染細(xì)胞的基因組中。該第二個反應(yīng)在病毒DNA分子的兩個末端同時發(fā)生,其中兩個相反插入點之間的偏距(offset)為正好5個堿基對。[0110]在圖1中,在HIV-1整合(左側(cè))與Τη5轉(zhuǎn)座(右側(cè))的比較中說明了這些事件。HIV-1:I)供體DNA;II)整合酶催化的3'加工;III)整合酶催化的鏈轉(zhuǎn)移;IV)鏈轉(zhuǎn)移的產(chǎn)物;V)DNA修復(fù)的鏈轉(zhuǎn)移產(chǎn)物。Tn5轉(zhuǎn)座子:1)供體DNA;2)3'加工;3-4)5'加工,其由環(huán)形成(3)和平末端DNA的產(chǎn)生(4)構(gòu)成;5)鏈轉(zhuǎn)移;6)修復(fù)的鏈轉(zhuǎn)移產(chǎn)物。[0111]圖2示出了本發(fā)明方法的圖解說明。將各自包含整合酶識別位點(IRS)和引物退火位點(PAS)的兩個DNA接頭分子(接頭1和2)與整合酶(INT)以及待片段化和加標(biāo)簽的靶DNA溫育;參考圖2A上方部分。[0112]整合酶(INT)結(jié)合到接頭分子接頭1和2的IRS和靶DNA,并催化3'加工和鏈轉(zhuǎn)移;參考圖2A中間部分。[0113]在圖2A的下方部分中,示出了整合酶反應(yīng)的結(jié)果,即在其兩個末端處具有連接的接頭的片段化和帶標(biāo)簽的靶DNA,其中所述接頭通過接頭相應(yīng)的IRS區(qū)段連接,從而將PAS暴露在所述片段化和帶標(biāo)簽的靶DNA的末端。[0114]在圖2B中,更詳細(xì)示出了所述片段化和帶標(biāo)簽的靶DNA。所述片段化和帶標(biāo)簽的靶DNA在其末端處包含PAS區(qū)段,允許PCR引物的退火和后者在3'方向上的延伸。[0115]在本發(fā)明的方法中,整合酶反應(yīng)被用于將基因組DNA片段化并將DNA接頭分子連接到兩個末端。然后可以將DNA接頭分子用于例如產(chǎn)生的帶標(biāo)簽和片段化的靶DNA的擴(kuò)增以及隨后的簇產(chǎn)生和測序。[0116]示例性使用了兩種不同的HIV整合酶,即密碼子優(yōu)化、內(nèi)部表達(dá)和純化的HIV-1來源的整合酶,其具有如SEQIDno.16所示序列的171個氨基酸。所述HIV-1來源的整合酶大小為18.97kDa,并包含由50至212號氨基酸表示的HIV整合酶的核心結(jié)構(gòu)域。這種整合酶被稱為"QHINΓ。所述HIV-1來源的整合酶催化去整合反應(yīng)而不是整合(3'加工和轉(zhuǎn)移)。e=27965;?1(理論值):?!17.82;突變小1851((溶解性)。[0117]第二種整合酶是可商購的野生型HIV-1整合酶(BioProductsMD,LLC,Middletown,MD,UnitedStatesofAmerica)。這種整合酶被稱為"BPHIN1"。[0118]設(shè)計了不同的接頭分子,以包含用于HIV-1整合酶的識別位點和可用于文庫擴(kuò)增和隨后在IlluminaNGS平臺上測序的序列。下面的表1包含了本發(fā)明人用于形成DNA接頭分子的序列:[0119][0120]表丨:用于產(chǎn)生DNA接頭分子的序列[0121]接頭分子通過將前面列出的寡核苷酸以不同比率彼此混合來形成。首先在98°C進(jìn)行2分鐘的變性步驟以消除所述寡核苷酸的推測的二級結(jié)構(gòu),然后將探針緩慢冷卻下來以允許互補的寡核苷酸退火。下面的表2示出了不同接頭的制劑。[0122][0123]表2:DNA接頭分子[0124]在第一種可行性測定法中,使用IN接頭1至11與密碼子優(yōu)化的內(nèi)部表達(dá)的HIV-1來源的整合酶(QHIN1)的組合對細(xì)菌質(zhì)粒DNA(pGL2)同時進(jìn)行片段化和接頭連接。[0125]實驗安排如下:[0127]*緩沖液2x:10mMMnCl2,40mMHEPES(pH7.5),2mM二硫蘇糖醇,0.1%NonidetP40,lmMCHAPS,40mMNaCl。[0128]在37°C溫育lOmin以形成整合復(fù)合物。[0129][0130]在37°C溫育1h進(jìn)行質(zhì)粒靶DNA的片段化和同時的接頭連接。[0131]在溫育后,將片段化并連接有接頭的DNA用QIAquick柱和反應(yīng)清理方案進(jìn)行純化。瓊脂糖凝膠分析顯示沒有片段,因為質(zhì)粒和片段的濃度太低而不能在瓊脂糖凝膠上被觀察到。然后使用接頭特異性引物擴(kuò)增片段化并連接有接頭的DNA。對于IN接頭1和2來說,沒有可商購的PCR引物。對于IN接頭3至8來說,使用IlluminaP1和P2引物,對于IN接頭9來說使用RB引物,對于IN接頭10和11來說使用U5LTR和U3LTD引物。[0132]在下表中列出了所使用的PCR引物的序列。[0134]表3:使用的PCR引物[0135]下面列出了PCR設(shè)置方案和循環(huán)條件。[0138]在2%瓊脂糖凝膠中分析擴(kuò)增子,其顯示出質(zhì)粒DNA的片段化,其中尺寸在250至lOOObp之間(圖3A)。[0139]為了觀察所述片段化是否是由PCR中剩余的接頭引起的效應(yīng),使用相同的片段化并連接過的樣品進(jìn)行第二個PCR,并將僅使用接頭的PCR作為"無模板對照"(NTC)。僅使用接頭(NTC)時沒有獲得擴(kuò)增子。圖3B示出了瓊脂糖凝膠,利用所述瓊脂糖凝膠將擴(kuò)增的片段化并連接過的DNA與相應(yīng)的接頭擴(kuò)增(NTC)進(jìn)行并排分析。[0140]在第二個實驗中,使用第二種HIV-1整合酶(野生型HIV整合酶;BioProductsMD,LLC,Middlet〇wn,MD,USA)(BPHIN1),使用性能最好的接頭對質(zhì)粒DNA(pGL2)進(jìn)行片段化和連接。在這個測定法中使用IN接頭7和成對的IN接頭7與8。[0141]測定法[0143]*緩沖液2x:10mMMnCl2,40mMHEPES(pH7.5),2mM二硫蘇糖醇,0.1%NonidetP40,lmMCHAPS,40mMNaCl。[0144]在37Γ溫育lOmin[0146]在37°C溫育lh[0147]使用Illumina引物PI和P2擴(kuò)增所述片段化并連接有接頭的靶DNA,并在瓊脂糖凝膠上進(jìn)行分析。結(jié)果示出在圖3C中。再一次獲得了質(zhì)粒的片段化,其中片段尺寸在150至500bp之間。[0148]為了測試這些結(jié)果是否是來自于非特異性質(zhì)粒擴(kuò)增的假象,與所述片段化并連接有接頭的質(zhì)粒DNA平行地使用P1和P2引物對所述質(zhì)粒進(jìn)行擴(kuò)增,并在瓊脂糖電泳中進(jìn)行分析。結(jié)果示出在圖3D中??梢钥闯觯褂觅|(zhì)粒和接頭時在凝膠圖像中沒有獲得擴(kuò)增。[0149]在通過使用質(zhì)粒作為靶DNA測試本發(fā)明后,下一步是測試通過本發(fā)明的方法是否能夠使用基因組DNA作為靶DNA來產(chǎn)生文庫。在下面的實驗中,使用大腸桿菌(E.coli)DNA作為靶DNA來產(chǎn)生片段化的DNA,在片段的末端上帶有可用于這些片段的擴(kuò)增和隨后在NGS平臺上測序的接頭。[0150]對于下面的設(shè)置來說,使用性能最好的接頭INj妾頭_7和INj妾頭_8。平行地測試儲存在兩種不同緩沖液(D和W)中的QHIN_1。將來自于大腸桿菌的100ng基因組DNA作為靶DNA來進(jìn)行片段化和接頭連接。[0151]實驗設(shè)置:[0152]QHIN_1儲存緩沖液[0153]D:Dar緩沖液[0154]25mMTris-HClpH7,4[0155]1MNaCl[0156]7,5mMCHAPS[0157]ImMDTT[0158]50%甘油[0159]W:Wang50緩沖液[0160]20mMHEPESpH7,35[0161]1MNaCl[0162]ImMDTT[0163]50%甘油[0164]使用0.2μΜ接頭制備兩種主混合物(MMX)。[0166]在溫育后,將樣品用QiaQuick柱純化,并使用兩種不同的循環(huán)條件用引物P1和P2進(jìn)行PCR擴(kuò)增,以便調(diào)查在常規(guī)循環(huán)之前是否需要補全鏈中由整合引起的間隙。[0167]PCR設(shè)置被描述在下面的表中:[0169]循環(huán)條件[0172]在PCR后,使用AgencourtAMPureXP珠子除去剩余的接頭和引物,并通過毛細(xì)管電泳和使用AgilentDNA芯片分析探針。[0173]圖4不出了所有樣品的電泳圖:[0174]1:D100l;Dar緩沖液/100nggDNA/1.循環(huán)[0175]2:W100l;Wang50緩沖液/100nggDNA/1.循環(huán)[0176]3:D1002;Dar緩沖液/100nggDNA/2.循環(huán)[0177]4:W1002;Wang50緩沖液/100nggDNA/2.循環(huán)。[0178]在這里,可以看到擴(kuò)增的DNA的片段,其主要尺寸分布在1000_5000bp之間。這意味著發(fā)生了片段化和接頭連接,并且產(chǎn)生的片段可以使用引物P1和P2來擴(kuò)增。[0179]進(jìn)行了進(jìn)一步的實驗以優(yōu)化片段的尺寸分布,而沒有給出不同的結(jié)果(數(shù)據(jù)未示出)。這是本發(fā)明人試圖使用僅包含整合酶識別位點(IRS)的短接頭進(jìn)行片段化,然后通過添加引物退火位點(PAS)在PCR上完成接頭序列的原因。這個實施方式的原理示出在圖5中。在將靶DNA同時片段化和連接接頭(上方部分)后,然后對連接的片段進(jìn)行PCR(下方部分)。在所述PCR中使用兩對PCR引物。第一對PCR引物由各自包含能夠與連接有接頭的DNA片段的整合酶識別位點(IRS)雜交的IRS并各自包含引物退火位點(PAS1或PAS2)的兩條引物構(gòu)成。第二對PCR引物由各自分別能夠與引物退火位點PAS1或PAS2雜交的兩條引物(P1和P2)構(gòu)成。在隨后的PCR中,將連接有接頭的DNA片段擴(kuò)增,并通過添加引物退火位點PAS1和PAS2來完成所述接頭。[0180]因此,對于進(jìn)一步的片段化實驗來說,使用包含IRS但沒有PAS的片段化接頭(IN_接頭l;INj妾頭_2)、PCR引物混合物-l(21/21plus_IN_4(SEQIDno.6);21/21plus_IN_5(SEQIDno·7);引物Pl(SEQIDno·17);引物P2(SEQIDno·18))或PCR引物混合物-2(6/6plus_IN_6(SEQIDno.8);6/6plus_IN_7(SEQIDηο·9);引物P1(SEQID11〇.17);引物卩2(SEQID11〇.18))。"長的"卩0?引物21/21口1118_預(yù)_4和21/21口1118_115或6/6口1118_預(yù)_6和6/6plus_IN_7分別包含IRS和PAS。"短的"PCR引物PI和P2可以雜交到相應(yīng)的PAS。[0181]將來自于大腸桿菌的100nggDNA用來自于上表的接頭和引物制劑進(jìn)行處理,并在AgilentsBioanalyzer上使用AgilentDNA芯片進(jìn)行分析。圖6示出了使用引物混合物1(A;C)和引物混合物2(B;D)擴(kuò)增后片段的分布。[0182]3:1·INI;IN接頭1/引物混合物1[0183]1:1.N1_0;IN接頭1/引物混合物1_無模板對照[0184]7:2.INI;IN接頭1/引物混合物2[0185]5:2·N1_0;IN接頭1/引物混合物2_無模板對照[0186]4:1.IN2;IN接頭2/引物混合物1[0187]2:1·N2_0;IN接頭2/引物混合物1_無模板對照[0188]8:2·IN2;IN接頭2/引物混合物2[0189]6:2·N2_0;IN接頭2/引物混合物2_無模板對照[0190]可以看出,通過使用INj妾頭2和PCR引物混合物1產(chǎn)生了最佳結(jié)果,這是因為獲得了更好的片段分布。[0191]為了優(yōu)化片段化,計劃使用IN接頭2進(jìn)行進(jìn)一步實驗。[0192]測試了不同濃度和溫育溫度以及純化程序,以獲得文庫的更好的尺寸分布并除去殘留接頭。[0193]圖7示出了在不同溫育溫度下100ng大腸桿菌gDNA的片段化和接頭連接。令人吃驚的是,在這里使用的內(nèi)部HIV-整合酶(QHIN_1)顯示出相當(dāng)高的熱穩(wěn)定性,其允許文庫在更高溫度下溫育并產(chǎn)生文庫的更好的尺寸分布。[0194]A:[0195]1:30;IN接頭_2復(fù)合物與靶DNA在30°C下溫育[0196]3:37;IN接頭2復(fù)合物與靶DNA在37°C下溫育[0197]5:40;IN接頭2復(fù)合物與靶DNA在40°C下溫育[0198]7:45;IN接頭2復(fù)合物與靶DNA在45°C下溫育[0199]B:[0200]1:37;IN接頭2復(fù)合物與靶DNA在37°C下溫育[0201]3:50;IN接頭2復(fù)合物與靶DNA在50°C下溫育[0202]5:55;IN接頭2復(fù)合物與靶DNA在55°C下溫育[0203]7:60;IN/接頭2復(fù)合物與靶DNA在60Γ下溫育[0204]根據(jù)示出的數(shù)據(jù),本發(fā)明人能夠使用HIV-1-整合酶和gDNA重現(xiàn)質(zhì)粒片段化的結(jié)果。所述測定法已被優(yōu)化以產(chǎn)生具有適用于幾種NGS平臺的尺寸分布的文庫。[0205]概述上述結(jié)果,本發(fā)明人已成功測試了不同的整合酶,以開發(fā)本發(fā)明的用于在僅僅一個步驟中產(chǎn)生帶標(biāo)簽靶DNA的片段文庫的方法?!局鳈?quán)項】1.一種用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的方法,所述方法包括:(i)將所述靶DNA與整合酶和包含整合酶識別位點的至少一種DNA接頭分子相接觸,以獲得反應(yīng)混合物,(ii)將所述反應(yīng)混合物在其中所述整合酶催化所述至少一種接頭分子的3'加工和鏈轉(zhuǎn)移反應(yīng)的條件下溫育,其中(a)所述靶DNA被片段化以產(chǎn)生多個靶DNA片段,并且(b)所述至少一種DNA接頭分子被連接到所述多個靶DNA片段中的每個的至少一個末端,以產(chǎn)生所述靶DNA的多個帶標(biāo)簽DNA片段。2.權(quán)利要求1的方法,其特征在于在步驟(ii)(b)中,所述至少一種DNA接頭分子被連接到所述多個靶DNA片段中的每個的兩個末端。3.權(quán)利要求1或2的方法,其特征在于所述至少一種DNA接頭分子還包含用于寡核苷酸退火的位點,優(yōu)選地所述用于寡核苷酸退火的位點被構(gòu)造成用于PCR引物和/或測序引物退火。4.權(quán)利要求1或2的方法,其在步驟(ii)后還包括下述步驟:(iiV對所述靶DNA的所述多個帶標(biāo)簽DNA片段進(jìn)行PCR,以向所述至少一種DNA接頭分子添加用于寡核苷酸退火的位點,優(yōu)選地所述用于寡核苷酸退火的位點被構(gòu)造成用于PCR引物和/或測序引物退火。5.前述權(quán)利要求任一項的方法,其特征在于所述整合酶選自反轉(zhuǎn)錄病毒整合酶,包括HIV整合酶,以及源自于反轉(zhuǎn)錄病毒整合酶的整合酶。6.前述權(quán)利要求任一項的方法,其特征在于所述至少一種DNA接頭分子由包含互補核苷酸序列并彼此特異性雜交的兩個核酸分子構(gòu)成,所述接頭分子選自:接頭1(SEQIDno.l+SEQIDηο·2),接頭2(SEQIDno.3+SEQIDηο·2),接頭3(SEQIDno.6+SEQIDηο·2),接頭4(SEQIDno.7+SEQIDηο·2),接頭5(SEQIDno.8+SEQIDno.4),接頭6(SEQIDno.9+SEQIDno.4),接頭7(SEQIDno.8+SEQIDno.5),接頭8(SEQIDno.9+SEQIDno.5),接頭9(SEQIDno·14+SEQIDno·15),接頭10(SEQIDno·10+SEQIDno·ll),接頭11(SEQIDno.l2+SEQIDηο·13)〇7.前述權(quán)利要求任一項的方法,其在步驟(ii)和/或(iiZ后還包括下述步驟:(iii)純化所述靶DNA的所述多個帶標(biāo)簽DNA片段。8.前述權(quán)利要求任一項的方法,其特征在于它在一個反應(yīng)容器內(nèi)進(jìn)行。9.一種用于產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的試劑盒,所述試劑盒包含:(i)整合酶,以及(ii)包含整合酶識別位點的至少一種DNA接頭分子。10.權(quán)利要求9的試劑盒,其還包含至少一對PCR引物,所述至少一對PCR引物被構(gòu)造成在PCR反應(yīng)中向所述至少一種DNA接頭分子添加用于寡核苷酸退火的位點,優(yōu)選地所述用于寡核苷酸退火的位點被構(gòu)造成用于PCR引物和/或測序引物退火。11.權(quán)利要求9的試劑盒,其特征在于所述至少一種DNA接頭分子還包含用于寡核苷酸退火的位點,優(yōu)選地所述用于寡核苷酸退火的位點被構(gòu)造成用于PCR引物和/或測序引物退火。12.前述權(quán)利要求任一項的試劑盒,其特征在于所述整合酶選自反轉(zhuǎn)錄病毒整合酶,包括HIV整合酶,以及源自于反轉(zhuǎn)錄病毒整合酶的整合酶。13.前述權(quán)利要求任一項的試劑盒,其特征在于所述至少一種DNA接頭分子由包含互補核苷酸序列并彼此特異性雜交的兩個核酸分子構(gòu)成,所述接頭分子選自:接頭1(SEQIDno.l+SEQIDηο·2),接頭2(SEQIDno.3+SEQIDηο·2),接頭3(SEQIDno.6+SEQIDηο·2),接頭4(SEQIDno.7+SEQIDηο·2),接頭5(SEQIDno.8+SEQIDno.4),接頭6(SEQIDno.9+SEQIDno.4),接頭7(SEQIDno.8+SEQIDno.5),接頭8(SEQIDno.9+SEQIDno.5),接頭9(SEQIDno·14+SEQIDno·15),接頭10(SEQIDno·10+SEQIDno·ll),接頭11(SEQIDno.l2+SEQIDηο·13)〇14.整合酶在產(chǎn)生靶DNA的帶標(biāo)簽DNA片段的文庫中的用途,優(yōu)選地所述帶標(biāo)簽DNA片段的文庫是用于DNA測序的文庫,所述DNA測序優(yōu)選地通過下一代測序來進(jìn)行。15.-種核酸分子,其包含選自SEQIDno.1至15的核苷酸序列。【文檔編號】C12Q1/68GK105899683SQ201480072947【公開日】2016年8月24日【申請日】2014年12月11日【發(fā)明人】約安娜·安德里歐,方南,德科·洛斐爾特,安尼卡·彼得羅夫斯基【申請人】凱杰有限公司