欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種構(gòu)建雜交測(cè)序文庫的方法

文檔序號(hào):74624閱讀:2767來源:國(guó)知局
專利名稱:一種構(gòu)建雜交測(cè)序文庫的方法
技術(shù)領(lǐng)域
本發(fā)明涉及核酸測(cè)序技術(shù)領(lǐng)域
,特別是序列捕獲技術(shù)領(lǐng)域
,特別是基于雜交的序列捕獲技術(shù)。另外,本發(fā)明還涉及標(biāo)簽技術(shù),以及實(shí)現(xiàn)多個(gè)樣品在同一反應(yīng)體系中進(jìn)行序列捕獲的方法。本發(fā)明的方法特別適用于第二代測(cè)序技術(shù),尤其是SOlexa測(cè)序技術(shù)。本發(fā)明的方法可用于基因組學(xué)研究。
背景技術(shù)
以Illumina solexa、AB Solid和Roche妨4為代表的第二代測(cè)序技術(shù)使測(cè)序成本大大降低,在近幾年得到快速發(fā)展,并成為基因組學(xué)研究的重要工具。與鏈終止法的 Sanger測(cè)序技術(shù)相比,第二代測(cè)序技術(shù)采用邊合成邊測(cè)序的技術(shù)策略。第二代測(cè)序技術(shù)最大的特點(diǎn)是高通量,其可對(duì)數(shù)以億計(jì)的DNA片段同時(shí)進(jìn)行測(cè)序,目前一臺(tái)高通量測(cè)序儀一次可產(chǎn)生高達(dá)200( 的數(shù)據(jù),相當(dāng)于將一個(gè)人的全基因組測(cè)序65次。然而這種高通量的測(cè)序技術(shù)是通過超聲波或其他方法將基因組打斷成一系列的小片段,并在小片段的兩側(cè)加上接頭,然后通過接頭引物進(jìn)行橋式PCR或emotion PCR擴(kuò)增形成測(cè)序的基本單位,再根據(jù)接頭上的部分序列設(shè)計(jì)公共測(cè)序引物,對(duì)基因組DNA進(jìn)行測(cè)序。
盡管高通量的測(cè)序技術(shù)使測(cè)序成本大大降低,然而測(cè)序一個(gè)人的全基因組序列仍需要數(shù)萬美元,這對(duì)于需要對(duì)大量樣品進(jìn)行測(cè)序的疾病研究等研究項(xiàng)目來說,總測(cè)序成本仍然很昂貴,難以大規(guī)模推廣應(yīng)用。另一方面,對(duì)于研究人類某些疾病的科學(xué)家來說,他們并不需要對(duì)全基因組進(jìn)行測(cè)序,他們感興趣的往往只是很小部分的基因組區(qū)域,例如全外顯子區(qū)(相當(dāng)于的人全基因組大小),如果能選擇性地對(duì)這些區(qū)域進(jìn)行測(cè)序,將使測(cè)序總成本顯著降低同時(shí)也能縮短測(cè)序時(shí)間。序列捕獲技術(shù)是一種對(duì)基因組特定區(qū)域進(jìn)行選擇性富集的技術(shù),其通過合適的方法將感興趣的區(qū)域從基因組中分離出來,然后再對(duì)該目標(biāo)區(qū)域進(jìn)行測(cè)序,這對(duì)于低成本地有針對(duì)性的進(jìn)行基因組學(xué)研究有非常重要的意義。
目前常用的序列捕獲方法主要有三種PCR法、分子倒置探針法(Molecular insersion probes,MIP)和雜交法。PCR法具有高靈敏性、高特異性和重復(fù)性好等優(yōu)點(diǎn)。 PCR富集法在第二代測(cè)序技術(shù)平臺(tái)也有潛在的應(yīng)用前景,其適合用于捕獲一些很小的區(qū)域, 特別是一些連續(xù)的區(qū)域。對(duì)于較大的非連續(xù)的區(qū)域,如全外顯子,該方法需要合成大量的引物、大規(guī)模的PCR反應(yīng)和高強(qiáng)度的勞動(dòng)力等。因此,PCR序列捕獲方法的適用性受到較大的限制。盡管最近報(bào)道的微滴PCR(Rair^torm)等PCR技術(shù)能在一定程度上緩解上述部分問題,然而實(shí)際上這些PCR反應(yīng)由于在同一反應(yīng)中使用多種引物,導(dǎo)致大量非特異擴(kuò)增產(chǎn)物的產(chǎn)生,并且容易出現(xiàn)部分區(qū)域無法擴(kuò)增的情況,此外其擴(kuò)增的區(qū)域大小也有限。
分子倒置探針富集法具有樣品前期處理簡(jiǎn)單、樣品需求量極小等優(yōu)點(diǎn),然而其需要合成價(jià)格較高的分子探針、均一性較差、難以對(duì)一些區(qū)域較大的基因組序列進(jìn)行捕獲等缺點(diǎn),限制了該技術(shù)在第二代測(cè)序平臺(tái)的應(yīng)用前景。
基于雜交的序列捕獲技術(shù)是目前在第二代測(cè)序平臺(tái)中使用較多的序列富集方法, 主要分為芯片雜交和液相雜交兩種。芯片雜交序列捕獲技術(shù)是一種將探針合成在芯片上,并在芯片上進(jìn)行雜交的高通量序列捕獲技術(shù),其可以在一個(gè)芯片內(nèi)捕獲整個(gè)外顯子甚至更大的區(qū)域。液相雜交技術(shù)是通過將芯片上合成的探針剪切回收之后進(jìn)行擴(kuò)增富集而構(gòu)建用于雜交的目的雜交探針庫,液相雜交在動(dòng)力學(xué)上相對(duì)固相雜交更具優(yōu)勢(shì),能降低對(duì)于樣品起始量要求。
芯片雜交技術(shù)與液相雜交技術(shù)屬于高通量的序列捕獲技術(shù),對(duì)于需要對(duì)大量樣品進(jìn)行重測(cè)序的項(xiàng)目來說,逐一對(duì)樣品進(jìn)行雜交與洗脫需要大量的勞動(dòng)力與時(shí)間,同時(shí)也增加了成本和操作錯(cuò)誤的風(fēng)險(xiǎn)。為了與第二代測(cè)序技術(shù)平臺(tái)聯(lián)合使用,我們需要實(shí)現(xiàn)多個(gè)樣品在同一反應(yīng)體系中進(jìn)行雜交洗脫,同時(shí)在測(cè)序后又能分辨來源不同的樣品,這將使工作量與工作時(shí)間大大減少,對(duì)減少操作錯(cuò)誤的風(fēng)險(xiǎn)也有一定的預(yù)防作用。
最近,國(guó)外研究人員報(bào)道了多個(gè)樣品混合雜交的方法(專利號(hào)W02009106308 ;公開號(hào)W02009/106208A2 ;
公開日2009年9月3日),該方法通過連接接頭的方法引入代表特定樣品的標(biāo)簽序列(共133個(gè)標(biāo)簽序列)來區(qū)分不同來源的DNA樣品。所有標(biāo)簽序列均由11個(gè)脫氨核苷酸組成,位于測(cè)序引物和DNA樣品之間。在構(gòu)建測(cè)序文庫時(shí),每個(gè)樣品接上包括不同標(biāo)簽序列的接頭,混合后在MmbleGen芯片雜交系統(tǒng)中進(jìn)行序列捕獲。洗脫后的捕獲序列在Roche 454測(cè)序平臺(tái)進(jìn)行測(cè)序,通過測(cè)序接頭上的標(biāo)簽序列來區(qū)分不同來源的樣品。
然而,該技術(shù)在應(yīng)用范圍和效率等多個(gè)方面還存在缺陷
1、其通過接頭引入標(biāo)簽序列的方法不利于該技術(shù)在Solexa等測(cè)序平臺(tái)的應(yīng)用 一方面,接頭連接后加入的標(biāo)簽序列位于測(cè)序引物與樣品DNA之間,在測(cè)序樣品DNA之前必須先測(cè)序Ilbp的標(biāo)簽序列,這種用同一測(cè)序引物對(duì)標(biāo)簽序列和樣品DNA進(jìn)行連續(xù)測(cè)序的方法在測(cè)序長(zhǎng)度本來就較短的第二代測(cè)序技術(shù)平臺(tái)中使用,無疑會(huì)進(jìn)一步縮短樣品DNA的有效測(cè)序長(zhǎng)度;另一方面,基于接頭連接的方法引入標(biāo)簽序列會(huì)導(dǎo)致樣品DNA的兩個(gè)末端均帶上標(biāo)簽序列,這樣在Solexa等測(cè)序平臺(tái)進(jìn)行雙末端測(cè)序時(shí)會(huì)導(dǎo)致標(biāo)簽序列被測(cè)序兩次, 造成測(cè)序數(shù)據(jù)的浪費(fèi)。
2、該技術(shù)沒有使用接頭的blocks (也稱為封閉序列),這會(huì)導(dǎo)致樣品在雜交時(shí), 由于接頭互補(bǔ)序列之間的退火,使樣品DNA與探針的結(jié)合效率降低,影響序列捕獲效果,同時(shí),沒有任何關(guān)聯(lián)的樣品DNA可能由于接頭之間的退火而相連,并級(jí)聯(lián)放大形成“大分子 DNA",當(dāng)探針與靶DNA退火結(jié)合后,同時(shí)也會(huì)把與靶DNA相連的其他非靶DNA —起捕獲下來,造成捕獲序列中存在大量的非靶序列。
3、由于該技術(shù)主要針對(duì)芯片雜交進(jìn)行優(yōu)化,而在液相系統(tǒng)中使用時(shí),由于樣品DNA 起始量較小,它們通過接頭連接在一起后,可能對(duì)序列捕獲效果產(chǎn)生較大影響,同時(shí)也可能捕獲大量非靶序列。因此,該技術(shù)方案在Agilent液相雜交平臺(tái)的序列捕獲效果可能會(huì)較差。
4、該技術(shù)采用連接帶有標(biāo)簽序列接頭方式進(jìn)行文庫制備,對(duì)于起始量要求較高, 不利于大規(guī)模推廣用于疾病研究領(lǐng)域。

發(fā)明內(nèi)容
本發(fā)明設(shè)計(jì)了長(zhǎng)度為8bp的一段核酸序列,作為標(biāo)簽(也稱為index)序列(如表 1所示),用于對(duì)不同的樣品進(jìn)行標(biāo)記。標(biāo)記后的不同來源樣品可以在同一雜交系統(tǒng)中進(jìn)行序列捕獲,捕獲的序列在洗脫后通過測(cè)序其上的標(biāo)簽序列,即可確定該序列的樣品來源。設(shè)計(jì)的任意兩個(gè)標(biāo)簽序列之間至少有3個(gè)堿基的差異,這種設(shè)計(jì)使我們可以在測(cè)序后對(duì)偶然出現(xiàn)的標(biāo)簽序列測(cè)序錯(cuò)誤有一定的校正功能(能對(duì)標(biāo)簽序列中一個(gè)堿基的測(cè)序錯(cuò)誤進(jìn)行發(fā)現(xiàn)與校正)。設(shè)計(jì)的標(biāo)簽序列不包括與測(cè)序引物3’末端有較高相似性的序列和一些包含3個(gè)以上連續(xù)相同堿基的序列。本發(fā)明通過PCR方法為樣品引入標(biāo)簽序列,該方法簡(jiǎn)單有效,同時(shí)大大減少了對(duì)于樣品起始量要求。
本發(fā)明設(shè)計(jì)并合成了 2條接頭的blocks序列,分別命名為blockl和block2(如表2中所示),用于接頭序列的封閉。這些blocks只封閉DNA單鏈5’端的接頭序列,其中 blockl封閉測(cè)序芯片接頭P5及測(cè)序引物I(SPl)區(qū),block2封閉測(cè)序引物2(SP2)區(qū)、標(biāo)簽區(qū)和測(cè)序芯片接頭P7區(qū)。blockl對(duì)所有樣品都是一樣的,所以叫做公用block ;block2 是針對(duì)不同的標(biāo)簽序列設(shè)計(jì)的,所以在進(jìn)行雜交時(shí)要為含不同標(biāo)簽序列的樣品加入相應(yīng)的 block20
本發(fā)明目的在于實(shí)現(xiàn)多個(gè)樣品在同一反應(yīng)體系中進(jìn)行序列捕獲,該技術(shù)方案包括從樣品基因組DNA起始到測(cè)序結(jié)果輸出全部實(shí)驗(yàn)流程。技術(shù)方案主要由以下三部分組成 文庫構(gòu)建、雜交、測(cè)序與數(shù)據(jù)分析。
文庫構(gòu)建將樣品基因組DNA通過包括但不限于超聲波打斷法打斷成200 250bp大小的片段,通過末端修復(fù)、加“A”堿基、連接等過程為DNA片段加上接頭,然后通過 PCR方法在不同來源的基因組文庫樣品DNA的接頭末端引入8bp的標(biāo)簽序列,使每個(gè)基因組 DNA文庫均帶上含特定序列的標(biāo)簽。其中標(biāo)簽序列可以位于接頭序列末端。PCR產(chǎn)物純化后即完成文庫的構(gòu)建與不同來源樣品DNA的標(biāo)記。
雜交將上一步純化獲得的需要雜交的樣品(是否就是上步純化的PCR產(chǎn)物) 按一定比例(混合比例可根據(jù)預(yù)計(jì)需要數(shù)據(jù)量確定,例如,如需要數(shù)據(jù)量均為20X測(cè)序深度,則取等量樣品進(jìn)行混合)混合,在95°C變性10分鐘后在NimbleGen芯片雜交平臺(tái)或 Agilent液相雜交平臺(tái)進(jìn)行雜交,同時(shí)在雜交體系中加入接頭的blockl和block2以及重復(fù)序列block(Cot-IDNA)。Cot-IDNA是基因組中重復(fù)比例較高的一部分DNA片段,在雜交時(shí)使用能幫助提高雜交效率,Cot-IDNA可得自商品化的產(chǎn)品Human Cot-I DNA (invitrogen),可參考革文新,萬大方,趙新泰,蔣惠秋,顧健人.人cot-lDNA的制備[J], 《腫瘤》1998年5月(第18卷第3期)(127)。待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到來自不同樣品捕獲后的序列混合物。
測(cè)序與數(shù)據(jù)分析將捕獲的序列在Solexa或其他測(cè)序平臺(tái)(需要在構(gòu)建文庫時(shí)加入相應(yīng)的接頭(比如對(duì)于SOLiD測(cè)序平臺(tái),使用該測(cè)序平臺(tái)提供的短片段文庫構(gòu)建接頭) 采用邊合成邊測(cè)序的方法進(jìn)行序列測(cè)定。先用測(cè)序引物I(SPl)對(duì)樣品DNA的一端測(cè)序,再用測(cè)序引物3(SP;3)對(duì)標(biāo)簽序列測(cè)序,最后用測(cè)序引物2 (SP》對(duì)樣品DNA的另一端進(jìn)行測(cè)序(SP1,SP2,SP3均來自IIlumina商業(yè)測(cè)序試劑盒)。對(duì)用SP3測(cè)序引物測(cè)序得到的數(shù)據(jù)進(jìn)行分析可知其上的標(biāo)簽序列,根據(jù)此標(biāo)簽序列確定其對(duì)應(yīng)的樣品DNA的來源。
發(fā)明的有益效果
本發(fā)明的提供的方法中,技術(shù)方案采用PCR方法引入特定的標(biāo)簽序列,標(biāo)簽序列引入效率顯著提高。該方法可保證只在其中一個(gè)接頭末端引入標(biāo)簽序列,避免了兩次對(duì)標(biāo)簽序列進(jìn)行測(cè)序造成的數(shù)據(jù)浪費(fèi),而且能通過PCR方法減少對(duì)于樣品起始量要求.[0022]本發(fā)明的提供的方法中,標(biāo)簽序列與樣品DNA序列的測(cè)序采用不同的測(cè)序引物, 分次進(jìn)行測(cè)序,避免了由于對(duì)標(biāo)簽序列測(cè)序而導(dǎo)致樣品DNA有效測(cè)序長(zhǎng)度的降低。
本發(fā)明所提供的方法采用了 8個(gè)堿基的標(biāo)簽序列,其中任意兩個(gè)標(biāo)簽序列之間至少有3個(gè)堿基的差異,這種設(shè)計(jì)可在一定程度上防止樣品標(biāo)簽序列由于測(cè)序錯(cuò)誤(可對(duì)標(biāo)簽序列中一個(gè)堿基的測(cè)序錯(cuò)誤進(jìn)行發(fā)現(xiàn)與校正)而引起樣品弄混,因此在數(shù)據(jù)分析時(shí)具有一定的校正功能。
本發(fā)明所提供的方法中引入了接頭引物的blocks。這些blocks可封閉接頭序列, 避免樣品DNA由于接頭退火連在一起而影響捕獲效率和導(dǎo)致非特異序列捕獲。
本發(fā)明所提供的方法中,標(biāo)簽序列與樣品DNA序列的測(cè)序采用不同的測(cè)序引物, 分次進(jìn)行測(cè)序,避免了由于對(duì)標(biāo)簽序列測(cè)序而導(dǎo)致樣品DNA有效測(cè)序長(zhǎng)度的降低。
本發(fā)明所提供的blocks只封閉單鏈DNA 5’末端的接頭區(qū)域,而不封閉其3’末端區(qū)域,在保證接頭區(qū)域有效封閉的同時(shí),又避免了捕獲的序列在洗脫后可能殘留的blocks 在PCR反應(yīng)中作為引物擴(kuò)增而導(dǎo)致樣品標(biāo)簽序列弄混和樣品標(biāo)簽序列丟失。
本發(fā)明所提供的方法在NimbleGen芯片雜交系統(tǒng)、Agilent液相雜交系統(tǒng)和 NimbleGen EZ液相雜交系統(tǒng)中均適用,在相同或接近的測(cè)序深度(每個(gè)堿基被測(cè)序次數(shù)) 時(shí)作為衡量序列捕獲效果的目標(biāo)區(qū)域覆蓋度和序列捕獲特異性指標(biāo)在單個(gè)樣品雜交或者多個(gè)樣品雜交時(shí)結(jié)果一致。
本發(fā)明所提供的方法在構(gòu)建雜交測(cè)序文庫時(shí),只需要更換為所使用測(cè)序平臺(tái)提供的對(duì)應(yīng)接頭引物序列,即可適用于Roche 4 和ABSOLiD等其他的第二代測(cè)序平臺(tái),有較廣的應(yīng)用前景。


圖1 實(shí)驗(yàn)流程圖。本發(fā)明的技術(shù)方案包括從DNA起始到數(shù)據(jù)輸出整套實(shí)驗(yàn)流程, 在保證序列捕獲效率的同時(shí),可實(shí)現(xiàn)不同樣品在同一反應(yīng)體系中同時(shí)進(jìn)行序列捕獲。
圖2 構(gòu)建完成的含特定標(biāo)簽序列的樣品DNA文庫示意圖。其中標(biāo)簽序列通過PCR 方法引入。
圖3 接頭Blocks雜交封閉示意圖。Blocks只封閉單鏈DNA 5,末端的接頭。
圖 4 單個(gè)樣品雜交(Pooling-l,Pooling-3,Pooling-4,Pooling-5,Pooling-ll, Pooling-12)和兩個(gè)樣品混合后雜交(Pooling-31,Pooling-32,Pooling-33, Pooling-34, Pooling-35, Pooling-36),在Nimblegen液相雜交系統(tǒng)雜交的捕獲效率。其中,橫坐標(biāo) depth表示測(cè)序深度,縱坐標(biāo)coverage )表示捕獲效率。
圖 5 單個(gè)樣品雜交(Pooling-l,Pooling-3,Pooling-4,Pooling-5,Pooling-ll, Pooling-12)和兩個(gè)樣品混合后雜交(Pooling-31,Pooling-32,Pooling-33, Pooling-34, Pooling-35, Pooling-36),在Nimblegen液相雜交系統(tǒng)雜交后測(cè)序,數(shù)據(jù)比對(duì)至目標(biāo)區(qū)域的比例統(tǒng)計(jì)結(jié)果。其中橫坐標(biāo)pooling表示樣品編號(hào),縱坐標(biāo)Percent(W)表示數(shù)據(jù)比對(duì)至目標(biāo)區(qū)域的比例。
具體實(shí)施方式
下面將結(jié)合實(shí)施例對(duì)本發(fā)明的實(shí)施方案進(jìn)行詳細(xì)描述,但是本領(lǐng)域技術(shù)人員將會(huì)理解,下列實(shí)施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。
本發(fā)明一方面提供了一組標(biāo)簽,所述一組標(biāo)簽包括如下或由如下組成表3所示 159個(gè)標(biāo)簽或與之相差一個(gè)堿基的標(biāo)簽中的至少10個(gè),或至少20個(gè),或至少30個(gè),或至少 40個(gè),至少50個(gè),或至少60個(gè),或至少70個(gè),或至少80個(gè),或90個(gè),或至少100個(gè),或至少 110個(gè),或至少120個(gè),或至少130個(gè),或至少140個(gè),或至少150個(gè),或全部159個(gè),
所述一組標(biāo)簽優(yōu)選地至少包括表3所示的159個(gè)標(biāo)簽中的hdex—Newl-lO, 或 Index_Newll-20, Index_New21-30,或 Index_New31-40, Index_New41-50,或 Index_ New51-60, Index_New61_70,或 Index_New71_80, Index_New81_90,或 Index_New91-100, Index_Newl01-110,或 Index_Newl11-120, Index_Newl21_130,或 Index_Newl31_140, Index_Newl41-150,或hdex_Newl51_159,或者他們?nèi)魏蝺蓚€(gè)或多個(gè)的組合。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,所述“相差一個(gè)堿基的標(biāo)簽”的表述中,相差一個(gè)堿基包括標(biāo)簽序列中1個(gè)堿基的取代、添加或缺失。
本發(fā)明另一方提供了所述標(biāo)簽用于構(gòu)建的基因組文庫,以及進(jìn)行序列捕獲和/或測(cè)序的用途,其中所述標(biāo)簽包含在用于擴(kuò)增目的序列的PCR引物中,從而構(gòu)成各自相對(duì)應(yīng)的PCR標(biāo)簽引物,其中使用所述PCR標(biāo)簽弓I物和如表2所示的引物PE Primer 1. 0通過PCR 方法為基因組文庫引入標(biāo)簽序列。優(yōu)選地,所述PCR標(biāo)簽引物是3’引物,引物PEft~imer 1.0 是5’引物。
本發(fā)明進(jìn)一步提供了使用所述標(biāo)簽構(gòu)建的基因組文庫。
本發(fā)明一方面提供了含有上述標(biāo)簽的一組PCR標(biāo)簽引物,其中所述PCR標(biāo)簽引物包含所述標(biāo)簽,并且優(yōu)選地用作PCR的3’引物,所述一組PCR標(biāo)簽引物包括如下或由如下組成表1所示159個(gè)PCR標(biāo)簽引物或與其中包含的標(biāo)簽相差一個(gè)堿基的PCR標(biāo)簽引物中的至少10個(gè),或至少20個(gè),或至少30個(gè),或至少40個(gè),至少50個(gè),或至少60個(gè),或至少70 個(gè),或至少80個(gè),或90個(gè),或至少100個(gè),或至少110個(gè),或至少120個(gè),或至少130個(gè),或至少140個(gè),或至少150個(gè),或全部159個(gè),
所述一組標(biāo)簽優(yōu)選地至少包括表1所示的159個(gè)PCR標(biāo)簽引物中的 Newl-IOPrimer, 或 Index_Newll_20Primer, Index_New21_30Primer, 或 Index_ New31-40Primer, Index_New41_50Primer, 或 Index_New5l_60Primer, Index_ New61-70Primer, 或 Index_New71_80Primer, Index_New81_90Primer, 或 Index_ New91-1OPrimerOPrimer, Index_NewlOPrimer1-1IOPrimer,或 Index_Newl1l-120Primer, Index_Newl21-130Primer,或 Index_Newl31-140Primer, Index_Newl41-150Primer,或 hdex_Newl51-159Primer,或者他們?nèi)魏蝺蓚€(gè)或多個(gè)的組合。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,“與其中包含的標(biāo)簽相差一個(gè)堿基的PCR標(biāo)簽引物”的表述中,所述相差一個(gè)堿基包括對(duì)表3所示的159個(gè)標(biāo)簽定序列中1個(gè)堿基的取代、 添加或缺失。
本發(fā)明另一方面提供了所述PCR標(biāo)簽引物用于構(gòu)建的基因組文庫,以及進(jìn)行序列捕獲和/或測(cè)序的用途,其中使用所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1.0 通過PCR方法為基因組文庫引入標(biāo)簽序列。優(yōu)選地,所述PCR標(biāo)簽引物是3’引物,引物PE Primer 1. 0 是 5,引物。
本發(fā)明進(jìn)一步提供了使用所述PCR標(biāo)簽引物構(gòu)建的基因組文庫,其中使用所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1. 0通過PCR方法進(jìn)行構(gòu)建。優(yōu)選地,所述 PCR標(biāo)簽引物是3,引物,引物PEI^rimer 1.0是5,引物。
本發(fā)明另一方面提供了接頭封閉序列,其如表2中blockl和block2所示的序列或與其相差一個(gè)堿基的序列,其中block2中的NNNNNNNN如表4中所示的block序列或與其相差一個(gè)堿基。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,“關(guān)于接頭封閉序列的上下文中,所述相差一個(gè)堿基包括序列中1個(gè)堿基的取代、添加或缺失。
本發(fā)明另一方面提供了所述接頭封閉序列用于封閉接頭序列的用途,在進(jìn)行雜交時(shí)要為含不同標(biāo)簽序列的每個(gè)樣品加入相應(yīng)的block。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,所述雜交在包括但不限于如下雜交系統(tǒng)的中進(jìn)行=NimbleGen芯片雜交系統(tǒng)、Agilent液相雜交系統(tǒng)和NimbleGen EZ液相雜交系統(tǒng)。
本發(fā)明進(jìn)一步提供了使用所述接頭封閉序列構(gòu)建的基因組文庫。
本發(fā)明另一方面提供了一種構(gòu)建基因組文庫的方法,所述方法的特征在于使用上文所述PCR標(biāo)簽引物,和/或使用上文所述接頭封閉序列。
本發(fā)明另一方面提供了一種構(gòu)建基因組文庫的方法,其包括
文庫構(gòu)建將樣品基因組DNA通過包括但不限于超聲波打斷法打斷成優(yōu)選為 200 250bp大小的片段,通過末端修復(fù)、加“A”堿基、接頭連接等過程為DNA片段加上特定接頭,然后通過PCR方法使用上文所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1.0 對(duì)不同來源的基因組文庫樣品DNA進(jìn)行擴(kuò)增,優(yōu)選地所述PCR標(biāo)簽引物是3’引物,引物PE Primer 1. 0是5’引物,使每個(gè)基因組DNA文庫均帶上含特定序列的標(biāo)簽,其中所引入的標(biāo)簽序列可以位于接頭序列末端;然后對(duì)PCR產(chǎn)物進(jìn)行純化;其中所述特定接頭包括但不限于以下步驟所使用測(cè)序平臺(tái)所提供的接頭。
雜交經(jīng)純化的PCR產(chǎn)物作為雜交文庫按一定比例(根據(jù)各樣品所需要的數(shù)據(jù)量確定)混合,在95°C變性10分鐘后在NimbleGen芯片雜交平臺(tái)或Agilent液相雜交平臺(tái)進(jìn)行雜交,同時(shí)在雜交體系中加入接頭的blockl和block2以及重復(fù)序列block(Cot-IDNA); 待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到來自不同樣品捕獲后的序列混合物。所述重復(fù)序列block(Cot-IDNA)是基因組上重復(fù)比例較高的一些序列,用于提交雜交效率。
本發(fā)明進(jìn)一步提供了通過上文所述的方法構(gòu)建的文庫或文庫混合物。
本發(fā)明另一方面提供了一種測(cè)序的方法,所述方法的特征在于使用上文所述的 PCR標(biāo)簽引物,和/或使用上文所述的接頭封閉序列。
在本發(fā)明的另一方面中,使用通過上文所述的方法構(gòu)建的文庫或文庫混合物進(jìn)行測(cè)序。文庫測(cè)序可采用任何方法,例如雙脫氧鏈終止法。然而,優(yōu)選高通量測(cè)序方法 如第二代測(cè)序技術(shù)(Metzker ML. Sequencing technologies-the next generation. Nat Rev Genet. 2010Jan ;11(1) :31-46),包括 S0LEXA、SOLID 和 454 (焦磷酸測(cè)序)測(cè)序技術(shù) (平臺(tái))?;蛘呤菃畏肿訙y(cè)序技術(shù)(單分子測(cè)序平臺(tái)),包括Helicos公司的True Single Molecule DNA sequencing 技術(shù),Pacific Biosciences 公司的 the single molecule, real-time (SMRT. TM.)技術(shù),以及 Oxford Nanopore ^Technologies 公司的納米孔測(cè)序技術(shù)等(Rusk,Nicole (2009-04-01) · CheapThird-Generation Sequencing. Nature Methods6(4) :244-245) ο
本發(fā)明另一方面提供了一種測(cè)序的方法,其包括
測(cè)序與數(shù)據(jù)分析將捕獲的序列在Solexa或其他測(cè)序平臺(tái)(需要在構(gòu)建文庫時(shí)加入相應(yīng)的接頭)釆用邊合成邊測(cè)序的方法進(jìn)行序列測(cè)定。具體而言,先用測(cè)序引物I(SPl) 對(duì)樣品DNA的一端測(cè)序,再用測(cè)序引物3 (SP:3)對(duì)標(biāo)簽序列測(cè)序,最后用測(cè)序引物2 (SP2)對(duì)樣品DNA的另一端進(jìn)行測(cè)序(Illmnina測(cè)序試劑盒中商業(yè)測(cè)序引物)。對(duì)用SP3測(cè)序引物測(cè)序得到的數(shù)據(jù)進(jìn)行分析可知其上的標(biāo)簽序列,根據(jù)此標(biāo)簽序列確定其對(duì)應(yīng)的樣品DNA的來源。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,所述的方法中,標(biāo)簽序列與樣品DNA序列的測(cè)序釆用不同的測(cè)序引物,分次完成兩端測(cè)序以及中間標(biāo)簽序列測(cè)序。
在本發(fā)明的一個(gè)具體實(shí)施方式
中,所述的方法適用于Roche 4 和AB Solid等其他的第二代測(cè)序平臺(tái)。
表1,PCR標(biāo)簽引物列表(Index_NewN Primer),其中N為1-159的整數(shù)。[0062]
權(quán)利要求
1.一組標(biāo)簽,所述一組標(biāo)簽包括如下或由如下組成表3所示159個(gè)標(biāo)簽或與之相差一個(gè)堿基的標(biāo)簽中的至少10個(gè),或至少20個(gè),或至少30個(gè),或至少40個(gè),至少50個(gè),或至少60個(gè),或至少70個(gè),或至少80個(gè),或90個(gè),或至少100個(gè),或至少110個(gè),或至少120個(gè), 或至少130個(gè),或至少140個(gè),或至少150個(gè),或全部159個(gè),所述一組標(biāo)簽優(yōu)選地至少包括表3所示的159個(gè)標(biāo)簽中的hdex_Newl-10,或hdex_ Newl1-20, Index_New21-30,或 Index_New31_40, Index_New41_50,或 Index_New51_60, Index_New61-70,或 Index_New71-80, Index_New81-90,或 Index_New91-100, Index_ NewlOl-I10,或 Index_Newl11-120, Index_Newl21_130,或 Index_Newl31_140, Index_ Newl41-150,或hdex_Newl51_159,或者他們?nèi)魏蝺蓚€(gè)或多個(gè)的組合。
2.權(quán)利要求
1所述的標(biāo)簽,其中所述相差一個(gè)堿基包括標(biāo)簽序列中1個(gè)堿基的取代、添加或缺失。
3.權(quán)利要求
1所述的標(biāo)簽用于構(gòu)建基因組文庫的用途,其中所述標(biāo)簽包含在用于擴(kuò)增目的序列的PCR引物中,從而構(gòu)成各自相對(duì)應(yīng)的PCR標(biāo)簽引物,其中使用所述PCR標(biāo)簽引物和如表2所示的引物PEft~imer 1. 0通過PCR方法為基因組文庫引入標(biāo)簽序列,優(yōu)選地所述 PCR標(biāo)簽引物是3’引物,引物PE Primer 1.0是5,引物。
4.使用權(quán)利要求
1或2所述的標(biāo)簽構(gòu)建的基因組文庫。
5.含有權(quán)利要求
1所述的標(biāo)簽的一組PCR標(biāo)簽引物,其中所述PCR標(biāo)簽引物包含權(quán)利要求
1所述的標(biāo)簽,并且優(yōu)選地用作PCR的3’引物,所述一組PCR標(biāo)簽引物包括如下或由如下組成表1所示159個(gè)PCR標(biāo)簽引物或與其中包含的標(biāo)簽相差一個(gè)堿基的PCR標(biāo)簽引物中的至少10個(gè),或至少20個(gè),或至少30個(gè),或至少40個(gè),至少50個(gè),或至少60個(gè),或至少70個(gè),或至少80個(gè),或90個(gè),或至少100個(gè),或至少110個(gè),或至少120個(gè),或至少130 個(gè),或至少140個(gè),或至少150個(gè),或全部172個(gè),所述一組標(biāo)簽優(yōu)選地至少包括表1所示的159個(gè)PCR標(biāo)簽引物中的hdet Newl-IOPrimer, 或 Index_Newll_20Primer, Index_New21_30Primer, 或 Index_ New3l-40Primer, Index_New4l-50Primer, 或 Index_New5l_60Primer, Index_ New61-70Primer, 或 Index_New71_80Primer, Index_New81_90Primer, 或 Index_ New91-1OPrimerOPrimer, Index_NewlOPrimer1-1IOPrimer,或 Index_Newl1l-120Primer, Index_Newl21-130Primer,或 Index_Newl31-140Primer, Index_Newl41-150Primer,或 hdex_Newl51-159Primer,或者他們?nèi)魏蝺蓚€(gè)或多個(gè)的組合。
6.權(quán)利要求
5所述的PCR標(biāo)簽引物,其中所述相差一個(gè)堿基包括對(duì)表3所示的159個(gè)標(biāo)簽定序列中1個(gè)堿基的取代、添加或缺失。
7.權(quán)利要求
4或5所述的PCR標(biāo)簽引物用于進(jìn)行構(gòu)建基因組文庫的用途,其中使用所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1. 0通過PCR方法為基因組文庫引入標(biāo)簽序列,優(yōu)選地所述PCR標(biāo)簽引物是3,引物,引物PE Primer 1. 0是5,引物。
8.使用權(quán)利要求
5或6所述的PCR標(biāo)簽引物構(gòu)建的基因組文庫,其中使用所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1. 0通過PCR方法進(jìn)行構(gòu)建,優(yōu)選地所述PCR標(biāo)簽引物是3,引物,引物PE Primer 1.0是5,引物。
9.接頭封閉序列,其如表2中blockl和block2所示的序列或與其相差一個(gè)堿基的序列,其中block2中的NNNNNNNN如表4中所示的block序列或與其相差一個(gè)堿基。
10.權(quán)利要求
9所述的接頭封閉序列,所述相差一個(gè)堿基包括序列中1個(gè)堿基的取代、 添加或缺失。
11.權(quán)利要求
9或10所述的接頭封閉序列用于封閉接頭序列的用途,在進(jìn)行雜交時(shí)要為含不同標(biāo)簽序列的每個(gè)樣品加入相應(yīng)的block。
12.權(quán)利要求
11所述的用途,其中所述雜交在包括但不限于如下雜交系統(tǒng)的中進(jìn)行 NimbleGen芯片雜交系統(tǒng)、Agilent液相雜交系統(tǒng)和NimbleGen EZ液相雜交系統(tǒng)。
13.使用權(quán)利要求
9或10所述的接頭封閉序列構(gòu)建的基因組文庫。
14.一種構(gòu)建基因組文庫的方法,所述方法的特征在于使用5或6所述的PCR標(biāo)簽引物,和/或使用權(quán)利要求
9或10所述的接頭封閉序列。
15.權(quán)利要求
14所述的方法,其包括文庫構(gòu)建將樣品基因組DNA通過包括但不限于超聲波打斷法打斷成優(yōu)選為200 250bp大小的片段,通過末端修復(fù)、加“A”堿基、接頭連接過程為DNA片段加上接頭,然后通過PCR方法使用權(quán)利要求
5或6所述PCR標(biāo)簽引物和如表2所示的引物PE Primer 1.0 對(duì)不同來源的基因組文庫樣品DNA進(jìn)行擴(kuò)增,優(yōu)選地所述PCR標(biāo)簽引物是3’引物,引物PE Primer 1.0是5’引物,使每個(gè)基因組DNA文庫均帶上含特定序列的標(biāo)簽,其中所引入的標(biāo)簽序列可以位于接頭序列末端;然后對(duì)PCR產(chǎn)物進(jìn)行純化;雜交經(jīng)純化的PCR產(chǎn)物作為雜交文庫按優(yōu)選地根據(jù)各樣品所需要的數(shù)據(jù)量確定的一定比例混合,在95°C變性10分鐘后在NimbleGen芯片雜交平臺(tái)或Agilent液相雜交平臺(tái)進(jìn)行雜交,同時(shí)在雜交體系中加入接頭的blockl和block2以及重復(fù)序列block(Cot-IDNA); 待雜交完畢后,通過變性等方法收集捕獲的序列并純化,得到來自不同樣品捕獲后的序列混合物。
16.通過權(quán)利要求
14或15所述的方法構(gòu)建的文庫或文庫混合物。
專利摘要
本發(fā)明提供了用于核酸測(cè)序,特別是序列捕獲技術(shù)的標(biāo)簽,以及采用PCR方法引入所述標(biāo)簽的方法。本發(fā)明還提供了用于封閉接頭的接頭封閉序列,及其在NimbleGen芯片雜交系統(tǒng)、Agilent液相雜交系統(tǒng)和NimbleGen EZ液相雜交系統(tǒng)中的用途。本發(fā)明進(jìn)一步還提供了使用上述標(biāo)簽和/或接頭封閉序列用于構(gòu)建文庫和/或測(cè)序的方法,以及通過所述方法構(gòu)建的文庫。
文檔編號(hào)C12N15/11GKCN102409047SQ201010299269
公開日2012年4月11日 申請(qǐng)日期2010年9月21日
發(fā)明者劉曉, 吳仁花, 吳明枝, 歐陽偉漢, 武靖華, 蔣慧, 趙美茹 申請(qǐng)人:深圳華大基因研究院, 深圳華大基因科技有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
泰安市| 浏阳市| 桓台县| 拜城县| 洛浦县| 南阳市| 任丘市| 平罗县| 洞口县| 德惠市| 确山县| 开化县| 龙门县| 石阡县| 昌吉市| 图片| 和平区| 白河县| 柳州市| 贵州省| 沙湾县| 五指山市| 东丽区| 板桥市| 龙口市| 甘谷县| 沙雅县| 辽中县| 绵竹市| 肃宁县| 福清市| 河池市| 麻城市| 永新县| 海宁市| 湖南省| 呈贡县| 丹阳市| 平塘县| 武山县| 隆林|