欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

多核苷酸作圖和測(cè)序的制作方法

文檔序號(hào):492208閱讀:198來(lái)源:國(guó)知局
多核苷酸作圖和測(cè)序的制作方法
【專利摘要】本發(fā)明涉及多核苷酸作圖和測(cè)序。本發(fā)明提供了獲得關(guān)于生物聚合物樣本的結(jié)構(gòu)信息的方法。所述方法包括標(biāo)記生物聚合物如DNA或RNA的部分、在一些例子中對(duì)所述生物聚合物進(jìn)行線性化、以及確定標(biāo)記物之間的距離。然后使用者可比較不同樣本的標(biāo)記物間距離以定性地比較不同樣本并分析指定樣本的在兩側(cè)帶有標(biāo)記物的區(qū)域中核苷酸的添加或刪除。所述方法還可對(duì)生物聚合物進(jìn)行測(cè)序。
【專利說(shuō)明】多核苷酸作圖和測(cè)序
[0001]本申請(qǐng)為國(guó)際申請(qǐng)日2009年11月18日、國(guó)際申請(qǐng)?zhí)朠CT/US2009/064996于2011年7月13日進(jìn)入中國(guó)國(guó)家階段、申請(qǐng)?zhí)?00980154567.1、發(fā)明名稱“多核苷酸作圖和測(cè)序”的分案申請(qǐng)。
[0002]相關(guān)申請(qǐng)
[0003]本申請(qǐng)要求2008年11月18日提交的美國(guó)申請(qǐng)N0.61/115,704的優(yōu)先權(quán),通過(guò)參考將其全部?jī)?nèi)容納入本文以用于任何和所有的目的。

【技術(shù)領(lǐng)域】
[0004]本公開(kāi)的發(fā)明涉及核酸測(cè)序領(lǐng)域和分子成像領(lǐng)域。本公開(kāi)的發(fā)明還涉及納米【技術(shù)領(lǐng)域】。

【背景技術(shù)】
[0005]隨著分子生物技術(shù)的進(jìn)展,對(duì)于以不斷增加的分辨率和精確度來(lái)分析越來(lái)越小的樣本有了更多的興趣。這其中的一部分受到種群異質(zhì)性可經(jīng)常掩蓋樣本的重要特征這一認(rèn)識(shí)的驅(qū)動(dòng)。有限的樣本體積也是一些應(yīng)用的考慮因素。
[0006]雖然現(xiàn)有的技術(shù)在理論上能夠從身體小樣本(physically small sample)中提取重要信息,但是這類技術(shù)的有效性受限于它們?cè)谶@樣的小樣本上分辨結(jié)構(gòu)特征的能力。因此,在本【技術(shù)領(lǐng)域】中對(duì)于能夠基于單分子或其它身體小樣本獲得基因組信息的方法和相關(guān)裝置有需求。如果這類方法能夠改進(jìn)到超過(guò)目前技術(shù)所達(dá)到的100bp(Ikb)的精確度的話,那么這類方法的價(jià)值將會(huì)提高。


【發(fā)明內(nèi)容】

[0007]為了應(yīng)對(duì)所述挑戰(zhàn),要求保護(hù)的本發(fā)明首先提供了用于分析一個(gè)或多個(gè)外顯子的存在或相對(duì)位置的方法,所述方法包含分別使用第一和第二標(biāo)記物來(lái)標(biāo)記生物聚合物上的第一和第二位置,使得所述第一和第二標(biāo)記物位于包括至少一個(gè)常外顯子(constant exon)的所述生物聚合物的第一區(qū)域的兩側(cè);以及對(duì)所述生物聚合物進(jìn)行線性化,并將所述第一和第二標(biāo)記物之間的距離與生物聚合物的所述第一區(qū)域中可變外顯子(alternative exon)的存在、不存在、或相對(duì)位置聯(lián)系起來(lái)。
[0008]在第二個(gè)方面,本發(fā)明提供了獲得關(guān)于DNA樣本的結(jié)構(gòu)信息的方法,其包含使用序列特異性切口核酸內(nèi)切酶(nicking endonuclease)使第一個(gè)雙鏈DNA樣本產(chǎn)生切口 ;使一個(gè)或多個(gè)染料標(biāo)記的核苷酸摻入通過(guò)所述切口核酸內(nèi)切酶所產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處;對(duì)包括至少兩個(gè)染料標(biāo)記的核苷酸的所述第一個(gè)雙鏈DNA樣本的一部分進(jìn)行線性化;以及記錄兩個(gè)或更多個(gè)標(biāo)記性染料標(biāo)記的核苷酸的相對(duì)位置。
[0009]還提供了獲得關(guān)于核酸生物聚合物的序列信息的方法,其包含使具有第一結(jié)合序列的第一熒光標(biāo)記序列特異性探針與單鏈核酸生物聚合物結(jié)合;使所述單鏈核酸生物聚合物與攜帶第一突光標(biāo)記物的第一終止核苷酸(terminator nucleotide)、與攜帶第二突光標(biāo)記物的第二終止核苷酸、與攜帶第三熒光標(biāo)記物的第三終止核苷酸、以及與攜帶第四熒光標(biāo)記物的第四終止核苷酸接觸;以及對(duì)所述核酸生物聚合物進(jìn)行線性化和照射以確定與所述第一標(biāo)記序列特異性探針相鄰的所述第一終止核苷酸、第二終止核苷酸、第三終止核苷酸、第四終止核苷酸、或其任何組合的存在或相對(duì)位置。
[0010]本發(fā)明還提供了獲得關(guān)于核酸生物聚合物的結(jié)構(gòu)信息的方法,其包含使雙鏈生物聚合物與切口核酸內(nèi)切酶接觸以產(chǎn)生第一切口位點(diǎn);使所述第一切口位點(diǎn)與攜帶熒光標(biāo)記物A的第一終止核苷酸、與攜帶熒光標(biāo)記物B的第二終止核苷酸、與攜帶熒光標(biāo)記物C的第三終止核苷酸、以及與攜帶熒光標(biāo)記物D的第四終止核苷酸接觸;以及對(duì)所述雙鏈生物聚合物進(jìn)行線性化和照射以確定所述第一終止核苷酸、第二終止核苷酸、第三終止核苷酸、第四終止核苷酸、或其任何組合的相對(duì)位置。
[0011]進(jìn)一步提供了用于進(jìn)行多重雜交(multiplex hybridizat1n)的試劑盒,其包含各具不同顏色的多個(gè)雜交探針;以及將所述多個(gè)雜交探針中的至少兩個(gè)應(yīng)用在核酸樣本上并線性化和成像至少一個(gè)雜交核酸的說(shuō)明書(shū)。

【專利附圖】

【附圖說(shuō)明】
[0012]當(dāng)與附圖結(jié)合起來(lái)閱讀時(shí),可對(duì)發(fā)明概要以及下面的詳細(xì)描述有進(jìn)一步的理解。為了對(duì)本發(fā)明進(jìn)行圖示說(shuō)明,在附圖中顯示了本發(fā)明的示例性實(shí)施方案;然而,本發(fā)明不限于所公開(kāi)的具體方法、組合物、以及裝置。另外,所述附圖不一定要按比例來(lái)繪制。在附圖中:
[0013]圖1A圖示說(shuō)明了對(duì)于Nt.BstNBI切口核酸內(nèi)切酶的作圖統(tǒng)計(jì)數(shù)據(jù)(mappingstatistics),其顯示10bp的光學(xué)分辨率顯著提高了圖譜的精確度和覆蓋度;
[0014]圖1B圖示說(shuō)明了對(duì)于Nt.BspQI切口核酸內(nèi)切酶的獨(dú)特作圖統(tǒng)計(jì)數(shù)據(jù),其顯示10bp的光學(xué)分辨率對(duì)于圖譜的精確度和覆蓋度影響甚微;
[0015]圖1C圖示說(shuō)明了與相對(duì)粗略的圖譜(16kb)相比,相對(duì)精細(xì)的圖譜(1.5kb)對(duì)于結(jié)構(gòu)變異具有更好的檢測(cè)力;
[0016]圖2A描繪了 MAPT的基因結(jié)構(gòu);
[0017]圖2B列出了存在于MAPT基因中的每個(gè)外顯子的每個(gè)外顯子(可變外顯子顯示為陰影)尺寸。
[0018]圖2C圖示說(shuō)明了應(yīng)用于RNA外顯子剪接時(shí)的超分辨率成像的條形碼或作圖方案;
[0019]圖2D圖示說(shuō)明了多重條形碼方案;
[0020]圖3圖示說(shuō)明了用于測(cè)序的起始材料;
[0021]圖4描繪了測(cè)序反應(yīng)的第一個(gè)循環(huán);
[0022]圖5描繪了開(kāi)始于圖4的第二個(gè)測(cè)序循環(huán);
[0023]圖6顯示了多重測(cè)序方案顯著增加了產(chǎn)量;
[0024]圖7A描繪了用于證明SHRMP分辨率的741bp PCR產(chǎn)物模型系統(tǒng);
[0025]圖7B圖示說(shuō)明了標(biāo)記DNA分子在玻璃表面上被線性化后的成像結(jié)果,表明三個(gè)
(3)Cy3染料分子相隔30nm和60nm,這與三個(gè)(3)Cy3探針之間94bp和172bp的距離具有良好的一致性。
[0026]圖8A描繪了用于證明SHRMP和SHREC分辨率的741bp PCR產(chǎn)物模型系統(tǒng);
[0027]圖8B圖示說(shuō)明了標(biāo)記DNA分子在玻璃表面上被線性化后的成像結(jié)果一Cy3_Cy5對(duì)之間的距離為37 土 5nm (預(yù)期為32nm)和91 ± 5nm (預(yù)期為87nm),以及Cy3_Cy3對(duì)之間的距離為56±3nm(預(yù)期為58nm)(圖4),顯示了極好的一致性;
[0028]圖9描繪了要求保護(hù)的本方法查明關(guān)于遺傳物質(zhì)的結(jié)構(gòu)信息的范例性、非限制性實(shí)施方案;
[0029]圖10描繪了要求保護(hù)的本方法查明關(guān)于遺傳物質(zhì)的結(jié)構(gòu)信息的第二個(gè)范例性、非限制性實(shí)施方案;
[0030]圖11描繪了要求保護(hù)的本方法的一個(gè)非限制性實(shí)施方案;和
[0031]圖12描繪了要求保護(hù)的本方法的又一個(gè)非限制性實(shí)施方案。

【具體實(shí)施方式】
[0032]通過(guò)與形成本公開(kāi)的一部分的附圖和實(shí)施例相結(jié)合參考下列詳細(xì)描述,可更容易地理解本發(fā)明。要理解這一發(fā)明不限于在本文中所描述和/或顯示的具體裝置、方法、應(yīng)用、條件、或參數(shù),而且本文中使用的術(shù)語(yǔ)是為了僅通過(guò)實(shí)例來(lái)描述具體實(shí)施方案的目的,且不旨在限制所要求保護(hù)的本發(fā)明。此外,當(dāng)在包括隨附權(quán)利要求書(shū)的本說(shuō)明書(shū)中使用時(shí),除非在上下文中另有明確指示,否則不含具體數(shù)量的名詞包含其復(fù)數(shù)形式,而且對(duì)于特定數(shù)值的引用至少包括該特定值。當(dāng)在本文中使用時(shí),術(shù)語(yǔ)“多個(gè)”是指大于一。當(dāng)表達(dá)了值的范圍時(shí),另一個(gè)實(shí)施方案包括從一個(gè)特定值和/或至另一個(gè)特定值。類似地,當(dāng)通過(guò)使用先行詞“約”來(lái)將值表達(dá)為近似值時(shí),將理解為所述特定值形成了另一個(gè)實(shí)施方案。所有的范圍都是包含其中一切的和可以組合的。
[0033]要理解,為了清晰起見(jiàn)在本文不同實(shí)施方案的內(nèi)容中所描述的本發(fā)明的某些特征,還可以在單個(gè)實(shí)施方案中被組合提供。相反地,為了簡(jiǎn)潔起見(jiàn)在單個(gè)實(shí)施方案的內(nèi)容中所描述的本發(fā)明的各種特征,還可被分別地或在任何子組合中提供。而且,引用陳述范圍的值包括該范圍內(nèi)的每一個(gè)和所有值。
[0034]在第一個(gè)實(shí)施方案中,本發(fā)明提供了分析一個(gè)或多個(gè)外顯子的存在或甚至相對(duì)位置的方法。這些方法適宜包括分別使用第一和第二標(biāo)記物來(lái)標(biāo)記生物聚合物樣本上的第一和第二位置,使得所述第一和第二標(biāo)記物位于包括至少一個(gè)常外顯子的所述生物聚合物樣本第一區(qū)域的兩側(cè)。然后使用者再將所述第一和第二標(biāo)記物之間的距離與生物聚合物的所述第一區(qū)域中可變外顯子(即不出現(xiàn)在每個(gè)mRNA中的外顯子)的存在或不存在(或相對(duì)位置)聯(lián)系起來(lái)。(所述生物聚合物是與mRNA互補(bǔ)的合適的DNA ;這樣的DNA可由本【技術(shù)領(lǐng)域】中的普通專業(yè)人員容易地合成。)
[0035]在一些實(shí)施方案中,所述第一和第二標(biāo)記物是相同的突光團(tuán)。范圍廣泛的突光團(tuán)適用于本發(fā)明,其中包括熒光團(tuán)的Cy-家族。其它熒光團(tuán)對(duì)于本【技術(shù)領(lǐng)域】的專業(yè)人員來(lái)說(shuō)將是已知的:費(fèi)光團(tuán)的歹"表可見(jiàn)于你1女口 http://info, med.yale.edu/genetics/ward/tavi/FISHdyes2.html。所述標(biāo)記物可以具有相同的突光團(tuán),但也可以具有不同的突光團(tuán)。
[0036]使用者將所述第一和第二標(biāo)記物之間的距離與一個(gè)或多個(gè)可變外顯子的存在、不存在、或二者(或甚至所述外顯子的相對(duì)位置)適當(dāng)聯(lián)系起來(lái),這包含將存在于生物聚合物樣本上的第一和第二標(biāo)記物之間的距離與位于已知不含可變外顯子的生物聚合物第一區(qū)域兩側(cè)的標(biāo)記物之間的距離進(jìn)行比較。這適宜通過(guò)對(duì)生物聚合物中包含熒光標(biāo)記物的區(qū)域進(jìn)行線性化來(lái)完成。生物聚合物的線性化在美國(guó)專利申請(qǐng)N0.10/484, 293 (于2009年11月9日授權(quán))中進(jìn)行了詳細(xì)討論,通過(guò)參考將其全部?jī)?nèi)容納入本文以用于所有目的。
[0037]所述建立聯(lián)系適宜包括將第一和第二標(biāo)記物之間的距離與在第一和第二位置之間缺乏可變外顯子的生物聚合物上的第一和第二位置之間的距離進(jìn)行比較。
[0038]通過(guò)例如圖2C來(lái)對(duì)此進(jìn)行說(shuō)明,所述圖在“零”處描繪了不具有可變外顯子的生物聚合物。在該圖中的實(shí)施方案“2”描繪了具有可變外顯子“2”的生物聚合物,所述可變外顯子可通過(guò)觀察到該外顯子導(dǎo)致Cy3和Cy5染料之間的間隔距離增加(342bp)來(lái)檢測(cè),所述Cy3和Cy5染料在所述圖頂端所示的無(wú)可變外顯子生物聚合物中僅分開(kāi)了 255bp。
[0039]圖2B是顯示存在于MAPT基因中的每個(gè)外顯子(可變外顯子通過(guò)陰影塊來(lái)顯示)尺寸的表。圖2A概括地圖示說(shuō)明了在MAPT基因中可能出現(xiàn)的各種剪接排列。如該圖中所示,外顯子2、3、以及10被認(rèn)為是“可變”外顯子,并可以-或可以不-存在于MAPT mRNA中。
[0040]使用者還可以使用另外的標(biāo)記物(使用例如標(biāo)記的核苷酸)來(lái)適當(dāng)?shù)貥?biāo)記生物聚合物上的第三、第四、或甚至更多的位置。這類另外的標(biāo)記物可包括與所述第一和第二標(biāo)記物相同的熒光團(tuán),或可包括與第一和第二標(biāo)記物上的那些不同的熒光團(tuán)。然后使用者可將第三標(biāo)記物和第一標(biāo)記物、第三標(biāo)記物和第二標(biāo)記物之間的距離、或二者與位于第三標(biāo)記物和第一標(biāo)記物之間、第三標(biāo)記物和第二標(biāo)記物之間、或二者的可變外顯子的存在或不存在聯(lián)系起來(lái)。所述關(guān)聯(lián)還可提供一個(gè)或多個(gè)標(biāo)記物的相對(duì)位置。
[0041]圖2也對(duì)此進(jìn)行了顯示。在標(biāo)記了“2+10”的實(shí)施方案中,生物聚合物包括可變外顯子2和10,所述外顯子位于所述生物聚合物上的第一和第二以及第二和第三標(biāo)記物(從左至右讀取)之間。然后使用者可通過(guò)將“2+10”實(shí)施方案上標(biāo)記物之間的距離與在該圖頂端所示的“零”實(shí)施方案上的標(biāo)記物之間距離進(jìn)行比較,來(lái)確定這些外顯子的存在(或相對(duì)位置)。
[0042]除了通過(guò)標(biāo)記物之間的距離來(lái)收集關(guān)于所研究的生物聚合物的結(jié)構(gòu)信息外,使用者還可基于兩個(gè)或更多個(gè)探針的相對(duì)順序來(lái)獲得結(jié)構(gòu)信息,這可通過(guò)攜帶不同顏色熒光團(tuán)的探針而變得更為便利。例如,如果使用了三個(gè)探針(紅、黃、以及綠),那么所述探針以紅-黃-綠的順序來(lái)結(jié)合的序列與所述探針以黃-紅-綠的順序來(lái)結(jié)合的序列在結(jié)構(gòu)上是不同的。因此,使用者可以通過(guò)觀察探針在樣本上結(jié)合/排列的相對(duì)順序以及探針之間的相對(duì)距離這二者來(lái)收集關(guān)于所述樣本的信息。
[0043]回到上述非限制性實(shí)施例,對(duì)兩種樣本進(jìn)行比較的使用者能夠-通過(guò)說(shuō)明探針的相對(duì)順序以及探針之間的距離-來(lái)確定兩種樣本在如下方面的差異:(I)某些核苷酸序列顯現(xiàn)(appeal)的順序(通過(guò)在不同樣本上探針的不同順序來(lái)證實(shí))和(2)在給定樣本中例如拷貝變異(copy variat1n)的數(shù)量(通過(guò)某些探針在一個(gè)樣本上比另一個(gè)上間隔得更遠(yuǎn)來(lái)證實(shí))。
[0044]所述標(biāo)記物適宜彼此隔開(kāi)約30bp至約100bp,但更適當(dāng)約30bp。如在本文的其它地方中所述,許多技術(shù)(例如SHRMP、F1NA、SHREC、或本【技術(shù)領(lǐng)域】的普通專業(yè)人員已知的其它技術(shù))能夠分辨彼此分開(kāi)僅數(shù)百或甚至數(shù)十堿基對(duì)左右的小距離的標(biāo)記物。
[0045]在另一方面,本發(fā)明提供了獲得關(guān)于DNA樣本的結(jié)構(gòu)信息的方法。這些方法適宜包括使用序列特異性切口核酸內(nèi)切酶使第一個(gè)雙鏈DNA樣本產(chǎn)生切口。這樣的“切口酶”是本【技術(shù)領(lǐng)域】中已知的,且可獲自例如New England B1labs (www.neb.com)。
[0046]所述方法適宜包括將一個(gè)或多個(gè)染料標(biāo)記的核苷酸摻入在由所述切口核酸內(nèi)切酶產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處。根據(jù)所述核酸內(nèi)切酶以及所分析的樣本,切口作用(nickage)可沿著所述樣本的長(zhǎng)度產(chǎn)生一個(gè)、兩個(gè)、或多個(gè)切口位點(diǎn)。標(biāo)記的核苷酸可通過(guò)聚合酶被適當(dāng)?shù)負(fù)饺肷锞酆衔镏?。在適當(dāng)?shù)膶?shí)施方案中,標(biāo)記的核苷酸是抵消聚合酶作用且不促進(jìn)鏈進(jìn)一步延長(zhǎng)的終止核苷酸。根據(jù)使用者的需要,所述核苷酸可攜帶相同的熒光團(tuán)標(biāo)記物或不同的標(biāo)記物。
[0047]所述方法還適宜包括對(duì)包含至少兩個(gè)染料標(biāo)記的核苷酸的所述第一個(gè)雙鏈DNA樣本的一部分進(jìn)行線性化。一旦標(biāo)記DNA被線性化,則使用者就可記錄或以其它方式來(lái)說(shuō)明兩個(gè)或更多個(gè)標(biāo)記性染料標(biāo)記的核苷酸的位置,以用于進(jìn)一步的分析。
[0048]一種這樣的分析包括將兩個(gè)或更多個(gè)染料標(biāo)記的核苷酸的相對(duì)位置與所述第一個(gè)雙鏈DNA樣本的一個(gè)或多個(gè)結(jié)構(gòu)特征聯(lián)系起來(lái)。這可能需要-如圖9中所示-確定已知位于目標(biāo)區(qū)域兩側(cè)的兩個(gè)標(biāo)記物之間的距離,所述目標(biāo)區(qū)域例如在一些個(gè)體中已知含有某個(gè)突變或拷貝數(shù)變異的區(qū)域。通過(guò)對(duì)所述樣本上的標(biāo)記物間距離與對(duì)照樣本上的標(biāo)記物間距離(或取自另一個(gè)體或個(gè)體組(individuals)的另一個(gè)樣本上的標(biāo)記物間距離)進(jìn)行比較,使用者可確定是否所分析的受試者可能具有(或不具有)特定的突變。
[0049]在一些實(shí)施方案中,來(lái)源于存在于生物聚合物樣本上標(biāo)記物的相對(duì)位置的“條形碼”提供了關(guān)于主雙鏈DNA樣本內(nèi)的第一個(gè)雙鏈DNA樣本的相對(duì)位置的信息,所述第一個(gè)雙鏈DNA樣本來(lái)源于所述主雙鏈DNA樣本。術(shù)語(yǔ)“條形碼”是指代表樣本結(jié)構(gòu)特征的一組信號(hào)(例如來(lái)自彼此隔開(kāi)的熒光標(biāo)記物的信號(hào))(例如兩個(gè)標(biāo)記物之間的距離可以與標(biāo)記物之間區(qū)域中基因的額外拷貝的存在聯(lián)系起來(lái))。所述“條形碼”還可用于鑒別特定的樣本,在所述特定樣本中來(lái)自位于樣本上的標(biāo)記物的信號(hào)組對(duì)于該樣本來(lái)說(shuō)是特有的或可將該樣本與所研究的其它樣本區(qū)別開(kāi)。
[0050]例如,使用者可確定取自“母本”樣本的第一樣本上的一部分條形碼與取自“母本”樣本的第二樣本上的條形碼重疊,因此表明所述“母本”樣本包含第一和第二樣本所共有的區(qū)域??蓪?duì)這樣的“母本”樣本進(jìn)行消化以產(chǎn)生更小的寡核苷酸,然后所述更小的寡核苷酸自身可通過(guò)本文中所述的各種方法進(jìn)行分析,然后通過(guò)對(duì)所述更小的寡核苷酸“制作條形碼”,使用者可接著確定所述寡核苷酸在“母本”樣本中的相對(duì)位置。
[0051]這顯示于圖13中,其描繪(作圖顯示)了如下步驟:消化DNA的母本樣本,將條形碼放置在由消化所產(chǎn)生的產(chǎn)物上,以及將具有相應(yīng)條形碼的產(chǎn)物適當(dāng)排列-適宜通過(guò)計(jì)算方法進(jìn)行,從而將所述母本以及用于母本的有效條形碼拼在一起。以這種方法,然后使用者可將母本上的條形碼與例如受試者的生理狀況聯(lián)系起來(lái)。這在已知用于消化母本的限制性內(nèi)切酶可分離可能含有拷貝數(shù)變異、外顯子、或其它突變的基因組區(qū)域的情況下可以進(jìn)行;所述復(fù)制數(shù)變異、外顯子、或其它突變可通過(guò)將位于目標(biāo)區(qū)域上的兩個(gè)標(biāo)記物之間的距離與位于已知缺乏(或具有)目標(biāo)突變或外顯子的“對(duì)照”或“標(biāo)準(zhǔn)”上的兩個(gè)標(biāo)記物之間的距離進(jìn)行比較來(lái)檢測(cè)。
[0052]作為非限制性實(shí)施例,使用者可通過(guò)本文中所述的方法將標(biāo)記物的條形碼放置在“母本樣本”的消化產(chǎn)物上,然后使用條形碼通過(guò)計(jì)算機(jī)來(lái)重新裝配那些產(chǎn)物以重新形成“母本”。然后使用者可將“母本”的條形碼與其它已知樣本進(jìn)行比較以確定所述母本的一種或多種特征,例如拷貝數(shù)變異、外顯子的添加或缺失等。以這種方法,使用者可通過(guò)有效地將所有消化產(chǎn)物和它們的條形碼放置在它們?cè)凇澳副尽眱?nèi)的適當(dāng)前后關(guān)系中來(lái)進(jìn)行“母本”樣本的定性評(píng)估。
[0053]所述方法可適宜包括:使用序列特異性切口核酸內(nèi)切酶使第二個(gè)雙鏈DNA樣本產(chǎn)生切口,將一個(gè)或多個(gè)染料標(biāo)記的核苷酸摻入由所述切口核酸內(nèi)切酶所產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處,對(duì)包含至少兩個(gè)染料標(biāo)記的核苷酸的所述第二個(gè)雙鏈DNA樣本的一部分進(jìn)行線性化,并登記(例如記錄或注釋)兩個(gè)或更多個(gè)標(biāo)記性染料標(biāo)記的核苷酸的相對(duì)位置。
[0054]標(biāo)記物的這些相對(duì)位置-即條形碼,可(如前所述)用于確定在主雙鏈DNA樣本中第一和第二雙鏈DNA樣本之間的關(guān)系,所述第一和第二個(gè)雙鏈DNA樣本都來(lái)源于所述主雙鏈DNA樣本。
[0055]在一些實(shí)施方案中,使用者將兩個(gè)或更多個(gè)染料標(biāo)記的核苷酸的相對(duì)位置與接觸過(guò)相同切口核酸內(nèi)切酶的第二個(gè)雙鏈DNA樣本上的相同染料標(biāo)記的核苷酸的位置進(jìn)行比較。以這種方法,使用者可比較取自不同來(lái)源的不同樣本上的“條形碼”。這使得如圖10中所示多個(gè)樣本之間能夠定性比較。在該圖中,樣本來(lái)自受試者A、B、以及C,且根據(jù)要求保護(hù)的本方法進(jìn)行了處理。如所示,受試者C的樣本缺乏與受試者A和B的樣本相結(jié)合的標(biāo)記物,這提示受試者C的DNA缺乏該特定區(qū)域。然后使用者可將這一缺失區(qū)域與受試者C的生理特征聯(lián)系起來(lái),或可將受試者C的結(jié)果與另外的其它受試者的結(jié)果進(jìn)行比較以鑒別遺失了該DNA區(qū)域的個(gè)體所共有的那些特征。
[0056]還提供了獲得關(guān)于核酸生物聚合物的序列信息的方法。這些方法適宜包括將具有第一結(jié)合序列的第一熒光標(biāo)記序列特異性探針與單鏈核酸生物聚合物結(jié)合。這在例如圖11中顯示。然后使用者將所述單鏈核酸生物聚合物與攜帶熒光標(biāo)記物A的第一終止核苷酸(例如攜帶Cy5的腺嘌呤)、與攜帶突光標(biāo)記物B的第二終止核苷酸(例如攜帶Alexa405的胞嘧啶)、與攜帶熒光標(biāo)記物C的第三終止核苷酸、以及與攜帶熒光標(biāo)記物D的第四終止核苷酸接觸。然后使用者對(duì)所述核酸生物聚合物進(jìn)行照射以確定與所述第一標(biāo)記序列特異性探針相鄰的所述第一終止核苷酸、第二終止核苷酸、第三終止核苷酸、第四終止核苷酸、或其任何組合的存在(或相對(duì)位置)。
[0057]所述第一探針的結(jié)合序列適宜在4至6個(gè)核苷酸之間。在一些實(shí)施方案中,核苷酸的熒光標(biāo)記物具有不同的激發(fā)波長(zhǎng)。在其它情況下,兩個(gè)或更多個(gè)標(biāo)記物共享一個(gè)激發(fā)波長(zhǎng)。標(biāo)記的核苷酸的激發(fā)波長(zhǎng)與標(biāo)記的序列特異性探針的激發(fā)波長(zhǎng)可以是相同-或不同的。
[0058]所述方法還適宜包括將分別具有第二、第三、第四、以及第五結(jié)合序列的至少四個(gè)熒光標(biāo)記探針與所述單鏈核酸生物聚合物接觸。所述第二結(jié)合序列是通過(guò)除去位于第一結(jié)合序列5’端的堿基并將第一替代堿基添加至第一結(jié)合序列的3’端來(lái)適當(dāng)?shù)貥?gòu)成的。
[0059]類似地,所述第三結(jié)合序列是通過(guò)除去位于第一結(jié)合序列5’端的堿基并將第二替代堿基添加至第一結(jié)合序列的3’端來(lái)構(gòu)成的。所述第四結(jié)合序列是通過(guò)除去位于第一結(jié)合序列5’端的堿基并將第三替代堿基添加至第一結(jié)合序列的3’端來(lái)適當(dāng)?shù)貥?gòu)成的,且第五結(jié)合序列是通過(guò)除去位于第一結(jié)合序列5’端的堿基并將第四替代堿基添加至第一結(jié)合序列的3’端來(lái)構(gòu)成的。這些探針適宜攜帶彼此不同的熒光團(tuán),且可具有與第一探針不同的熒光團(tuán)。
[0060]作為非限制性實(shí)例,所述第一探針可包含序列5’ -CTAGC-3’。在第二個(gè)探測(cè)循環(huán)中,位于所述探針5’端的C被除去,然后T成為探針的5’端,且探針的3’端如下:5’ -TAGCA-3’ ;5,-TAGC1-3’ ;5,-TAGCQ-3’ ;5,-TAGC£_3’。然后將這些標(biāo)記探針與生物聚合物接觸,且通過(guò)使用適當(dāng)?shù)募ぐl(fā)波長(zhǎng)對(duì)探針進(jìn)行照射,使用者可確定新探針的位置并因此獲得關(guān)于所研究的生物聚合物的序列信息。雖然在這一實(shí)例中所示的結(jié)合序列的長(zhǎng)度為5bp,但是結(jié)合序列適宜I至10bp的長(zhǎng)度,但更適宜4bp至6bp的長(zhǎng)度。
[0061]所述方法還適宜包括對(duì)核酸生物聚合物進(jìn)行照射以確定與第二標(biāo)記序列特異性探針相鄰的第一終止核苷酸、第二終止核苷酸、第三終止核苷酸、第四終止核苷酸、或其任何組合的存在(或相對(duì)位置)。
[0062]圖11是所述方法的一個(gè)非限制性實(shí)施方案。如該圖中所示,使用者可將具有不同結(jié)合序列的第一和第二探針與生物聚合物樣本結(jié)合。然后使用者可在使相鄰所結(jié)合的探針只有單個(gè)核苷酸與單鏈DNA結(jié)合的條件下,使樣本與標(biāo)記的核苷酸接觸。這產(chǎn)生了展示出兩個(gè)標(biāo)記物的給定探針-核苷酸對(duì),所述標(biāo)記物可以-如圖中所示-彼此不同。然后使用者可按需照射樣本以可視化或以其它方式來(lái)定位所述探針-核苷酸對(duì)。探針與核苷酸可以通過(guò)連接酶來(lái)連接。在一些實(shí)施方案中,在探針與核苷酸之間可以有間隙(gap) (1+bps),所述間隙可以通過(guò)聚合酶和提供核苷酸來(lái)填充,所述核苷酸自身可被標(biāo)記。還可使用連接酶來(lái)與探針連接,其中間隙通過(guò)標(biāo)記的核苷酸來(lái)“填入”。可以使用非熒光探針。
[0063]使用者可以在完成探針結(jié)合的第一個(gè)循環(huán)以及隨后的標(biāo)記的核苷酸結(jié)合之后,開(kāi)始使用探針進(jìn)行第二個(gè)循環(huán),第二個(gè)循環(huán)的探針顧及了在第一個(gè)循環(huán)中獲悉的序列信息。例如,第一個(gè)探針可具有AAGG序列,且相鄰該探針結(jié)合的標(biāo)記的核苷酸是T。在下一個(gè)循環(huán)中,使用者可利用這一信息并使用具有序列AGGT的探針,以便獲得如上文中所述的更多的序列信息。
[0064]在另一方面,本發(fā)明提供了獲得關(guān)于核酸生物聚合物的結(jié)構(gòu)信息的方法。這些方法適宜包括(a)將雙鏈生物聚合物與切口核酸內(nèi)切酶接觸以產(chǎn)生至少兩個(gè)切口位點(diǎn);(b)將所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物A(例如Cy3)的第一核苷酸接觸;(c)除去過(guò)量的第一核苷酸;(d)照射所述雙鏈生物聚合物以確定第一核苷酸的存在或相對(duì)位置;(e)將所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物B (例如Cy5)的第二核苷酸接觸和(f)除去過(guò)量的第二核苷酸。使用者適當(dāng)?shù)卣丈潆p鏈生物聚合物以確定第二核苷酸的存在或相對(duì)位置。
[0065]使用者適宜將至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物C(例如Alexa405)的第三核苷酸接觸;除去過(guò)量的第三核苷酸;(j)照射雙鏈生物聚合物以確定第三核苷酸的存在或相對(duì)位置。所述方法還包括(k)將所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物D的第四核苷酸接觸,(I)除去過(guò)量的第四核苷酸;以及(m)照射雙鏈生物聚合物以確定第一核苷酸的存在或相對(duì)位置。
[0066]以這種方法,所述切口酶“打開(kāi)” 了所述雙鏈樣本,使得與切口酶結(jié)合的位置相鄰的核苷酸可用。然后使用者引入所述第一標(biāo)記的核苷酸(例如胞嘧啶),并對(duì)所述生物聚合物進(jìn)行分析以確定是否該核苷酸可能已結(jié)合以及在哪里結(jié)合。然后使用其它核苷酸(鳥(niǎo)嘌呤、酪氨酸、腺嘌呤核苷)來(lái)重復(fù)這一操作,在引入了所述其它核苷酸中的每一個(gè)之后,使用者(通過(guò)照射)來(lái)分析每個(gè)新引入核苷酸的結(jié)合。
[0067]然后可重復(fù)前面的步驟(確定為(b)至(m)),使得使用者能夠通過(guò)添加每個(gè)相繼的標(biāo)記的核苷酸來(lái)獲得更多的序列信息。
[0068]所述照射還適宜確立一個(gè)或多個(gè)標(biāo)記的核苷酸的相對(duì)位置。具有兩個(gè)或更多個(gè)標(biāo)記物的樣本的至少一部分適宜線性化以用于這一分析。然后使用者確定位于雙鏈生物聚合物的線性化部分內(nèi)的兩個(gè)或更多個(gè)標(biāo)記的核苷酸之間的距離。然后可使用這些距離來(lái)獲得用于所分析樣本的條形碼。
[0069]在一些變化形式中,使用者可產(chǎn)生與位于第一個(gè)切口位點(diǎn)處的終止核苷酸相鄰的第二切口位點(diǎn)。使用者適宜將第二切口位點(diǎn)與攜帶熒光標(biāo)記物A的第一核苷酸、與攜帶熒光標(biāo)記物B的第二核苷酸、與攜帶熒光標(biāo)記物C的第三核苷酸、以及與攜帶熒光標(biāo)記物D的第四核苷酸接觸,并照射雙鏈生物聚合物以確定摻入第二切口位點(diǎn)摻入的標(biāo)記的核苷酸。
[0070]這顯示于圖12中。如該圖中所示,兩個(gè)切口酶分子與雙鏈DNA樣本結(jié)合并在它們的末端產(chǎn)生了切口位點(diǎn),通過(guò)該圖中的加框N來(lái)顯示。然后使用者依次引入標(biāo)記的核苷酸。如該圖中所示,腺嘌呤核苷被首先引入并與位于左側(cè)探針對(duì)面的DNA鏈上的T結(jié)合。因?yàn)橛覀?cè)探針的對(duì)面有腺嘌呤核苷,所以標(biāo)記腺嘌呤核苷沒(méi)有結(jié)合在該位點(diǎn),且“X”表示在引入第一個(gè)標(biāo)記堿基后那里沒(méi)有發(fā)生結(jié)合。引入其它的切口酶和標(biāo)記堿基,使用者能夠通過(guò)相繼添加標(biāo)記堿基接著照射所標(biāo)記的樣本,對(duì)生物聚合物靶進(jìn)行測(cè)序。然后從所述方法收集的序列信息可用于設(shè)計(jì)與特定序列結(jié)合的探針,然后可使用所述探針對(duì)指定樣本“制條形碼”,以用于進(jìn)一步表征,例如將第一樣本上兩個(gè)或更多個(gè)標(biāo)記探針之間的相對(duì)距離與不同或?qū)φ諛颖旧舷鄳?yīng)的標(biāo)記探針的距離進(jìn)行比較。
[0071]本發(fā)明還提供了用于進(jìn)行多重雜交的試劑盒。這些試劑盒首先適宜包括多個(gè)雜交探針。每個(gè)探針適宜具有不同顏色或?qū)Σ煌募ぐl(fā)波長(zhǎng)作出反應(yīng)。所述試劑盒還適宜包括對(duì)于將這些雜交探針中的至少兩個(gè)應(yīng)用于核酸樣本上、線性化所標(biāo)記的樣本、以及使至少一個(gè)雜交核酸成像的說(shuō)明書(shū)。在一些實(shí)施方案中,使用者使兩個(gè)或更多個(gè)雜交探針成像以確定兩個(gè)探針之間的距離或兩個(gè)探針之間的相對(duì)位置。
[0072]根據(jù)某些條件,使用者可使用標(biāo)記的核苷酸來(lái)填充(populate)相鄰切口位點(diǎn)之間的整個(gè)生物聚合物區(qū)域。這適宜在所述切口位點(diǎn)彼此比較靠近時(shí)完成。在照射下,具有至少一些標(biāo)記的核苷酸的生物聚合物區(qū)域比較亮;缺乏標(biāo)記的核苷酸的區(qū)域比較暗。然而,使用者仍然可以從亮和暗區(qū)二者中收集信息。
[0073]所謂亮區(qū)提供序列信息,因?yàn)槭褂谜呖梢允褂门c位于所述區(qū)域內(nèi)的各種標(biāo)記的核苷酸相應(yīng)的激發(fā)波長(zhǎng)來(lái)照射該區(qū)域。在其它實(shí)施方案中,使用者可以通過(guò)確定位于暗區(qū)兩側(cè)的亮區(qū)(或甚至核苷酸)之間的距離來(lái)評(píng)估是否所述暗區(qū)-憑借其尺寸-包含拷貝數(shù)變異、外顯子、或其它目標(biāo)結(jié)構(gòu)特征。因此,結(jié)構(gòu)信息可從亮和暗區(qū)二者來(lái)收集。
[0074]在一些實(shí)施方案中,使用者可選擇使用的切口酶具有與生物聚合物樣本上具有特別關(guān)注的區(qū)域互補(bǔ)的結(jié)合序列。以這種方法,使用者可有效地獲得僅針對(duì)被認(rèn)為具有最大興趣或重要性的那個(gè)區(qū)域(或多個(gè)區(qū)域)的序列信息。
[0075]使用者還可通過(guò)將在照射下可見(jiàn)的熒光團(tuán)的順序與一個(gè)或多個(gè)所述熒光團(tuán)與之相對(duì)應(yīng)的核苷酸聯(lián)系起來(lái),以適當(dāng)?shù)卮_定生物聚合物樣本中至少一部分的序列。
[0076]其它的公開(kāi)
[0077]成像技術(shù)
[0078]幾種技術(shù)將熒光成像中的光學(xué)分辨率提高了至少一個(gè)數(shù)量級(jí)。這些成像技術(shù)在單分子DNA和RNA分析上的應(yīng)用大大促進(jìn)了上文中所討論的應(yīng)用。
[0079]一種這樣的技術(shù)被稱為具有單納米精確熒光成像(F1NA),包括通過(guò)將分布函數(shù)與從熒光團(tuán)收集的光相擬合來(lái)對(duì)單個(gè)有機(jī)熒光團(tuán)進(jìn)行定位。這一分布的核心是能夠以1.5nm的精確度來(lái)定位。F1NA已用于研究分子發(fā)動(dòng)機(jī)的移位或測(cè)量小距離。
[0080]這一技術(shù)的擴(kuò)展包括使用光漂白的單分子高分辨率成像(SHRMP),其能夠以約1nm的分辨率來(lái)分辨具有相同顏色的相鄰熒光團(tuán)。F1NA已被擴(kuò)展至兩個(gè)顏色,開(kāi)發(fā)了被稱作單分子高分辨率共定位(SHREC)的方法。使用者可以,例如,對(duì)一起接近到1nm的Cy3和Cy5染料進(jìn)行共定位,所述染料可連接在短DNA的末端。還可使用多色隨機(jī)光學(xué)重建顯微術(shù)(STORM)方法,其允許報(bào)告分子與激活分子的組合配對(duì)。對(duì)這些探針的稀疏子集(sparsesubset)進(jìn)行反復(fù)、顏色特異性的激活可允許具有納米精確度的定位。
[0081]基因組作圖方法
[0082]結(jié)構(gòu)變異在人類健康和常見(jiàn)疾病方面起著非常重要的作用。這些變異被定義為長(zhǎng)于lkb。但是盡管它們很重要,大多數(shù)用于檢測(cè)拷貝數(shù)變異(CNVs)的基因組層面方法(genome-wide approach)是間接的,要根據(jù)樣本和對(duì)照之間信號(hào)強(qiáng)度的差異來(lái)預(yù)測(cè)變異區(qū)域。因此這類方法提供了有限的定量信號(hào)和位置信息,且無(wú)法檢測(cè)平衡事件如倒位和易位。例如,包括SNP陣列、寡核苷酸比較基因組雜交(CGH)陣列、以及BAC CGH陣列在內(nèi)的基于微陣列的平臺(tái)是用于發(fā)現(xiàn)結(jié)構(gòu)變異的主要技術(shù)。這些平臺(tái)靈敏度、特異性、以及探針密度不一致經(jīng)常導(dǎo)致相沖突的結(jié)果,即使對(duì)于完全相同的樣本也是如此。這一定性測(cè)量需要通過(guò)低通量檢測(cè)方法如PCR和FISH來(lái)進(jìn)一步證實(shí)。
[0083]光學(xué)作圖
[0084]上文中所述的單分子技術(shù)非常適合于研究結(jié)構(gòu)變異。然而,由于所述作圖的光學(xué)性質(zhì),它們?cè)诜直姹燃s?Ikbp更靠近的基序的能力上是有限的。明顯更高的作圖效率可通過(guò)分辨相隔小于10bp的特征來(lái)實(shí)現(xiàn)。進(jìn)而,這大大提高了我們鑒別天然的、長(zhǎng)基因組DNA分子中的結(jié)構(gòu)變異的能力。
[0085]合適的作圖方案是基于對(duì)由切口核酸內(nèi)切酶所產(chǎn)生的位點(diǎn)進(jìn)行標(biāo)記。具有五個(gè)堿基識(shí)別序列的切口核酸內(nèi)切酶將平均產(chǎn)生跨越整個(gè)基因組的Ikb物理圖譜。基于計(jì)算機(jī)(in silico)全基因組作圖,這類切口位點(diǎn)的大部分都落在彼此的100bp內(nèi),這一距離無(wú)法使用傳統(tǒng)的光學(xué)裝置來(lái)分辨。這降低了圖譜分辨率并使圖譜的裝配更加困難。
[0086]一個(gè)例子是兩種可商購(gòu)的切口核酸內(nèi)切酶的識(shí)別序列(基序),具有5個(gè)堿基至7個(gè)堿基識(shí)別位點(diǎn)。設(shè)計(jì)出了運(yùn)算法則來(lái)繪制針對(duì)人類參考基因組的所有切口位點(diǎn)的圖譜。
[0087]在酶Nt.BstNBI (5堿基基序GACTC)的例子中,跨越整個(gè)人類基因組有2.1 X 16個(gè)位點(diǎn),這表明在切口之間平均為1.5kb。對(duì)于酶Nt.BspQI (7堿基基序GCTCTTC)來(lái)說(shuō),有平均以15kbp隔開(kāi)的2.2X 15個(gè)切口位點(diǎn)。原則上,使用所述5堿基基序的切口位點(diǎn)可以使用傳統(tǒng)的光學(xué)裝置(?Ikbp)來(lái)分辨,但是計(jì)算機(jī)分析顯示差不多有一半切口位點(diǎn)落在了彼此Ikbp以內(nèi),這使得它們彼此難以區(qū)分。使用所述7堿基基序,人們可以分辨數(shù)量更大的位點(diǎn)。如下面所討論的,這導(dǎo)致了在DNA片段的唯一性作圖中的挑戰(zhàn)。
[0088]提高DNA作圖中的分辨率
[0089]計(jì)算機(jī)作圖用于確定基于目前可獲得的切口酶和我們現(xiàn)有的光學(xué)檢測(cè)系統(tǒng)可唯一作圖的DNA片段的百分比。
[0090]圖1A顯示了切口核酸內(nèi)切酶Nt.BstNBI (5堿基基序)的結(jié)果。對(duì)于100bp的光學(xué)分辨率來(lái)說(shuō),僅有約12%的片段可使用8個(gè)切口位點(diǎn)被唯一鑒別。另一方面,達(dá)到10bp的分辨率后,97%以上的片段是唯一的。緊密聚集的切口位點(diǎn)裝載了更多序列信息,且它們的分布是唯一的。此外,在僅有8個(gè)切口位點(diǎn)的情況下,人們僅需要12kb的片段(平均起來(lái))就能夠?qū)崿F(xiàn)片段針對(duì)參考基因組的唯一性作圖。
[0091]酶Nt.BspQI (7堿基基序)的切口圖譜(圖1B)顯示,將分辨率提高至lOObp,人們獲益極小,因?yàn)槁淙氡舜薎kbp之內(nèi)的Nt.BspQI切口位點(diǎn)較少。使用這種酶,需要平均8個(gè)連續(xù)Nt.BstQI切口位點(diǎn)來(lái)唯一地鑒別DNA片段,但是片段的平均尺寸為約120kb。由于在可使用現(xiàn)有方法合理提取出來(lái)的DNA長(zhǎng)度內(nèi)缺乏連續(xù)的切口位點(diǎn),所以有相當(dāng)多的基因組區(qū)域(?30%)不能作圖。
[0092]在不受任何單個(gè)理論制約的情況下,可鑒別出要求保護(hù)的本發(fā)明的一些優(yōu)勢(shì)。第一,在分辨間隔緊密的切口位點(diǎn)時(shí),可獲得多得多的關(guān)于DNA片段的信息。將片段針對(duì)基因組唯一作圖的能力大大提高了。
[0093]第二,隨著分辨率提高,人們可分辨比目前使用光學(xué)方法可能分辨的小得多的結(jié)構(gòu)變異。最后,提高分辨率還有助于我們鑒別大級(jí)別的結(jié)構(gòu)變異。
[0094]附圖上的其它背景
[0095]圖1C中顯示了具有150kbp插入物的片段的實(shí)例。成功地繪制所述片段的圖譜(并因此對(duì)基因組內(nèi)插入物的位置進(jìn)行鑒別),可使用與插入物相鄰的8個(gè)切口位點(diǎn)的連續(xù)組(contiguous set)。以有限的光學(xué)分辨率,這需要大的(>300kbp)基因組片段。這些難以使用標(biāo)準(zhǔn)的DNA提取規(guī)程來(lái)生成。相反,以10bp的分辨率,人們可以使用僅略大于所述插入物的片段,利用密集切口位點(diǎn)分布來(lái)唯一地繪制所述片段的圖譜。
[0096]對(duì)于可變轉(zhuǎn)錄組(alternative transcriptome)高通量數(shù)字作圖(profiling)的需求
[0097]可極大地受益于作圖能力提高的另一種核酸分析是RNA的可變剪接。在RNA前體的剪接過(guò)程中,內(nèi)含子被除去,且外顯子被連接在一起形成成熟RNA。通過(guò)可變剪接這一過(guò)程,單個(gè)的初級(jí)轉(zhuǎn)錄物產(chǎn)生了不同的成熟RNA。這導(dǎo)致了具有多樣性且甚至拮抗功能的蛋白質(zhì)同工型的產(chǎn)生。最近的研究顯示大蛋白質(zhì)組學(xué)的(proteomic)復(fù)雜性和多樣性是以有限數(shù)量的基因來(lái)實(shí)現(xiàn)的。在人類基因組中,?75%的人類基因顯示了可變剪接。雖然人類基因組含有25,000個(gè)基因,但是它能通過(guò)可變剪接產(chǎn)生幾十萬(wàn)種不同類型的蛋白質(zhì)。
[0098]許多基因的可變剪接變體對(duì)于細(xì)胞生物學(xué)的所有主要方面包括細(xì)胞周期調(diào)控、凋亡等具有決定性影響。已發(fā)現(xiàn)異常的剪接與包括癌癥在內(nèi)的各種疾病相關(guān),且最近的研究顯示mRNA在癌變組織中比在正常組織中更頻繁地被可變剪接。其它例子包括由于包含和包含(inclus1n and inclus1n)異常的外顯子所致的全長(zhǎng)跨膜傳導(dǎo)調(diào)節(jié)(CFTR)基因的顯著降低,這引起非典型形式的囊性纖維化。另一個(gè)例子是微管相關(guān)蛋白τ(ΜΑΡΤ基因)。MAPT對(duì)于微管的聚合和穩(wěn)定性以及神經(jīng)元中的軸突運(yùn)輸來(lái)說(shuō)是必需的。τ外顯子10的異常剪接導(dǎo)致了神經(jīng)退行性疾病一癡呆FTDP-17的發(fā)展。
[0099]已開(kāi)發(fā)了許多技術(shù)來(lái)量化RNA剪接變體。第一,寡核苷酸微陣列和光纖陣列已被用于整體檢測(cè)基因剪接變體。然而,因?yàn)樵陉嚵屑夹g(shù)中每次查詢一個(gè)全RNA轉(zhuǎn)錄物的小片段,所以每次僅可檢測(cè)一個(gè)剪接事件(每次兩個(gè)外顯子)。因此,難以量化在一個(gè)特定剪接變體中包含或排除了多少外顯子。而且,非特異性雜交可產(chǎn)生許多需要進(jìn)一步證實(shí)的假陽(yáng)性。
[0100]第二,實(shí)時(shí)PCR可以通過(guò)每次量化一個(gè)外顯子連接來(lái)獲得剪接信息,但它受到嚴(yán)格的反應(yīng)條件、低通量、以及高成本的限制。第三,所謂的下一代測(cè)序技術(shù)已用于數(shù)字基因表達(dá)圖譜中,且可用于繪制可變剪接變體的圖譜。然而,它們主要基于短序列讀取,且就全長(zhǎng)RNA樣本來(lái)說(shuō)它們具有與微陣列相同的限制。
[0101]現(xiàn)有的聚焦于轉(zhuǎn)錄組的技術(shù)所共有的劣勢(shì)是沒(méi)有一個(gè)能夠監(jiān)測(cè)可變剪接的外顯子的組合,因?yàn)樗鼈儼l(fā)生于個(gè)體轉(zhuǎn)錄物內(nèi)。在現(xiàn)有的方法下,難以對(duì)外顯子的排除進(jìn)行證實(shí),這可導(dǎo)致某些外顯子的假排除。
[0102]盡管可變剪接對(duì)于哺乳動(dòng)物生物學(xué)來(lái)說(shuō)極為重要,但是目前破譯這一問(wèn)題的解決方案面臨著挑戰(zhàn)。的確,由于缺乏強(qiáng)大的方法來(lái)量化RNA剪接變體,所以對(duì)于在整個(gè)發(fā)育階段中如何調(diào)節(jié)和協(xié)調(diào)可變剪接知之甚少。
[0103]提高分辨率以超過(guò)傳統(tǒng)的光學(xué)限制
[0104]作為提高分辨率可獲得的優(yōu)勢(shì)的一個(gè)例子,人們可思考用于微管相關(guān)蛋白τ (MAPT)基因的光學(xué)條形碼方法,所述基因?qū)τ谖⒐艿木酆虾头€(wěn)定性以及神經(jīng)元中的軸突運(yùn)輸來(lái)說(shuō)是必需的。τ外顯子10的異常剪接導(dǎo)致了神經(jīng)退行性疾病如癡呆FTDP-17的發(fā)展。
[0105]一個(gè)示例性RNA條形碼方案顯示于圖2中。MAPT轉(zhuǎn)錄物中的三個(gè)外顯子(2、3、以及10)可經(jīng)歷可變剪接,外顯子2和外顯子3總是剪接在一起。因此,通過(guò)可變剪接可產(chǎn)生六個(gè)不同的MAPT轉(zhuǎn)錄物。所述MAPT基因結(jié)構(gòu)顯示于圖2Α中。
[0106]顯示了所有六種可能的可變剪接同工型(零、2、10、2+10等),且每個(gè)外顯子的長(zhǎng)度顯示于圖2Β中。傳統(tǒng)的光學(xué)分辨率不能辨別與不同外顯子相連的標(biāo)記物。如果外顯子的位置能夠被分辨的話,那么所測(cè)得的標(biāo)記物之間的距離將以與讀取條形碼類似的方法來(lái)鑒別每個(gè)剪接變體。
[0107]為了形成這個(gè)實(shí)施例中的條形碼,可設(shè)計(jì)四個(gè)外顯子特異性寡核苷酸探針以分別與外顯子I (Cy3-綠)、外顯子7 (Cy5-紅)、外顯子11 (Cy5_紅)、外顯子13 (Cy3-綠)進(jìn)行特異性雜交,如圖2C中以綠和紅箭頭所示。標(biāo)記物之間的距離可用于鑒別存在哪個(gè)變體且顏色序列(即綠-紅-紅-綠)顯示全標(biāo)記轉(zhuǎn)錄物的存在。而且,本公開(kāi)的條形碼方案易于多重進(jìn)行。
[0108]例如,如果使用相同的兩個(gè)顏色(例如綠和紅)與四種不同的探針來(lái)標(biāo)記一個(gè)不同的基因,則可設(shè)計(jì)出與MAPT基因不同的用于這一特定基因的顏色序列。因此顏色序列可用于定義特定基因,且該顏色序列的標(biāo)記物之間的距離確定了該特定基因的個(gè)體剪接變體。在這個(gè)二色、四探針?lè)椒ㄖ?,?4= 16個(gè)不同的顏色序列以無(wú)限的能力來(lái)同時(shí)查詢16個(gè)不同基因的剪接變體。如果使用8種不同探針的4種顏色,則可同時(shí)調(diào)查46 = 6 5 5 36個(gè)不同基因,這超過(guò)了整個(gè)人類轉(zhuǎn)錄組(圖2C)。
[0109]這一方法與目前用于查詢RNA剪接的表達(dá)作圖技術(shù)相比有三個(gè)重要優(yōu)勢(shì):(i)通過(guò)同時(shí)繪制單個(gè)轉(zhuǎn)錄物內(nèi)外顯子的分布圖譜,人們可以確定同一個(gè)轉(zhuǎn)錄物內(nèi)多個(gè)可變剪接外顯子之間的關(guān)系。(ii)所述條形碼方案的數(shù)字特性意味著人們不僅可量化個(gè)體剪接變體,人們還可通過(guò)將所有剪接變體加在一起來(lái)量化全部的基因表達(dá)。(iii)所述條形碼方案將提供最大的多重檢測(cè)能力。實(shí)現(xiàn)這些優(yōu)勢(shì)需要所具有的分辨率遠(yuǎn)超過(guò)傳統(tǒng)光學(xué)方法的成像技術(shù)。
[0110]對(duì)于低成本和高通量的全基因組測(cè)序的需求
[0111]人類基因組計(jì)劃(HGP)的成功很大程度上歸功于憑借平行化、自動(dòng)化、微型化、更好的化學(xué)和信息學(xué)的Sanger測(cè)序法的持續(xù)發(fā)展。作為人類基因組計(jì)劃的主力,Sanger測(cè)序法已支配了 DNA測(cè)序領(lǐng)域?qū)⒔?,且它?00Q20堿基讀取長(zhǎng)度具有重要的意義。
[0112]這些新興的測(cè)序技術(shù)可基于檢測(cè)方法被分為兩類:通過(guò)總體檢測(cè)(ensembledetect1n)或通過(guò)單分子檢測(cè)的測(cè)序。因?yàn)樵诳傮w檢測(cè)中需要多個(gè)DNA拷貝,所以在該過(guò)程期間遺傳信息如單倍體型和RNA剪接模式被遺失。雖然通過(guò)單分子檢測(cè)的測(cè)序可能能夠回收單倍體型信息,但是目前的單分子測(cè)序法(例如Helicos tSMS)的讀取長(zhǎng)度是50bp或以下,這遠(yuǎn)遠(yuǎn)短于兩個(gè)SNP之間Ikbp的平均距離。因此,如同使用前輩Sanger測(cè)序法一樣,關(guān)鍵性遺傳信息如單倍體型和RNA剪接模式仍然難以使用這些“下一代”測(cè)序技術(shù)來(lái)獲得。本發(fā)明尤其實(shí)現(xiàn)了超過(guò)1kb的DNA測(cè)序長(zhǎng)度。
[0113]通過(guò)雜交來(lái)進(jìn)行測(cè)序是利用基于微陣列的雜交分析來(lái)確定核酸分子序列的公知方法。通常,使用在微陣列上構(gòu)建的具有已知序列(〈100聚體)的短寡核苷酸來(lái)捕獲(即雜交)并查詢靶分子。所述微陣列分析產(chǎn)生了在靶分子中至少發(fā)現(xiàn)一次的雜交寡核苷酸所有序列的列表。然而,所述列表不顯示雜交寡核苷酸序列的位置,所述列表也不提供寡核苷酸可存在于靶分子上的次數(shù)。然而,本發(fā)明獲得了這類信息。
[0114]圖3顯示了用于測(cè)序的起始材料。一組在5’端以不同顏色熒光團(tuán)標(biāo)記的5聚體(即長(zhǎng)度為5個(gè)核苷酸)寡核苷酸;以不同顏色熒光團(tuán)標(biāo)記的4個(gè)核苷酸終止子;線性化單鏈DNA分子、或具有部分ssDNA間隙的雙鏈DNA分子的陣列。
[0115]圖4描述了示例性測(cè)序反應(yīng)的第一個(gè)循環(huán)。在第一個(gè)循環(huán)后,通過(guò)STORM成像技術(shù)沿著線性化DNA分子記錄并定位每個(gè)雜交和摻入事件。然后洗掉探針。在下一個(gè)循環(huán)中,另有4種5聚體探針AGTCA、AGTCT, AGTCG,以及AGTCT被引入并雜交在與先前探針相同的位置上,因?yàn)樗鼈兿碛信c先前探針相同的序列。然后聚合酶摻入核苷酸終止子(圖5)。
[0116]將這一過(guò)程改變?yōu)槎嘀剡M(jìn)行的(使用不同顏色的標(biāo)記物)并產(chǎn)生在一個(gè)循環(huán)期間讀取的大量序列(圖6)。還開(kāi)發(fā)了運(yùn)算法則來(lái)確定5聚體探針連續(xù)性添加的優(yōu)選次序。本文中使用的超級(jí)成像技術(shù)包括SHRMP、SHREC, STORM。
[0117]實(shí)施例
[0118]已開(kāi)發(fā)了單分子高分辨率共定位(SHREC)和使用光漂白的單分子高分辨率成像(SHRImP)方法來(lái)測(cè)量比瑞利極限(Rayleigh limit)(對(duì)于可見(jiàn)激發(fā)來(lái)說(shuō)^ 250nm)更靠近的兩個(gè)熒光團(tuán)之間的距離。
[0119]對(duì)所述兩個(gè)技術(shù)進(jìn)行組合,在定位方法學(xué)的能力上增加了另一個(gè)方面,且通過(guò)使用各具多個(gè)成員的幾個(gè)不同顏色熒光團(tuán)能夠有潛力分辨幾十個(gè)距離。為了將此應(yīng)用在DNA上,可將雙鏈DNA延展在聚丙烯酸和聚丙烯胺包被的表面上,使得所述DNA相對(duì)變直。為了測(cè)試SHRIMP,使用生物素來(lái)制造DNA構(gòu)建物,然后在與32nm、58nm、以及90nm的Cy3之間距離相對(duì)應(yīng)的位置475bp、172bp、以及94bp處添加三個(gè)Cy_3 (圖7B)。
[0120]更多的細(xì)節(jié)提供在圖7A中。一個(gè)PCR引物使用Cy3在5’端標(biāo)記,且另一個(gè)引物在5’端被磷酸化。在PCR反應(yīng)后,Cy3的5’端保護(hù)該鏈不被λ核酸外切酶消化,這產(chǎn)生了單鏈DNA分子。一旦產(chǎn)生了所述單鏈DNA分子,就可進(jìn)行引物延伸反應(yīng)以在每個(gè)特定序列位置處引入熒光染料。在這一情況下,5’端具有Cy3的兩個(gè)短寡核苷酸分別在距一端94bp和256bp處被雜交。5’端具有生物素的另一個(gè)短寡核苷酸在單鏈模板的3’端被雜交。通過(guò)聚合酶進(jìn)行延伸后,單鏈模板被轉(zhuǎn)化為雙鏈DNA分子,且兩個(gè)Cy3染料分子被引入在特定位點(diǎn)處。
[0121]測(cè)得距離為27nm、61nm、以及95nm,與所預(yù)期的距離有極佳的一致性。為了同時(shí)測(cè)試SHRMP和SHREC,將Cy5置于零位置處,且兩個(gè)Cy3在94bp位置和172bp位置處,其中使用雙視成像系統(tǒng)(dual-view imaging system)來(lái)測(cè)量它們的位置。Cy3_Cy5對(duì)之間的距離為37±5nm(預(yù)期為32nm)和91±5nm(預(yù)期為87nm),且Cy3_Cy3對(duì)之間的距離為56±3nm(預(yù)期為58nm)(圖8)。一致性極佳。
【權(quán)利要求】
1.一種獲得關(guān)于DNA樣本的序列信息的方法,其包含: 使用第一序列特異性切口核酸內(nèi)切酶使第一雙鏈DNA樣本產(chǎn)生切口 ; 將標(biāo)記的核苷酸摻入至所述第一雙鏈DNA樣本中,在由所述切口核酸內(nèi)切酶產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處; 對(duì)包含至少兩個(gè)染料標(biāo)記的核苷酸的所述第一雙鏈DNA樣本的一部分進(jìn)行線性化;和 記錄兩個(gè)或更多個(gè)標(biāo)記的核苷酸的相對(duì)位置,其中所述標(biāo)記的核苷酸中的至少兩個(gè)彼此隔開(kāi)30bp至lOOObp。
2.權(quán)利要求1的方法,其中一個(gè)或多個(gè)標(biāo)記的核苷酸中的至少一個(gè)包含終止核苷酸。
3.權(quán)利要求1的方法,其還包含確定所述第一雙鏈DNA樣本在主雙鏈DNA樣本內(nèi)的相對(duì)位置,所述第一雙鏈DNA樣本來(lái)源于所述主雙鏈DNA樣本。
4.權(quán)利要求3的方法,其中所述第一雙鏈DNA樣本是通過(guò)消化從所述主雙鏈DNA樣本中獲得的。
5.權(quán)利要求1至4任一項(xiàng)的方法,其還包含:使用序列特異性切口核酸內(nèi)切酶使第二雙鏈DNA樣本產(chǎn)生切口 ;將一個(gè)或多個(gè)標(biāo)記的核苷酸摻入至所述第二雙鏈DNA樣本中,在由所述切口核酸內(nèi)切酶產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處;對(duì)包含至少兩個(gè)標(biāo)記的核苷酸的所述第二雙鏈DNA樣本的一部分進(jìn)行線性化;以及記錄兩個(gè)或更多個(gè)標(biāo)記的核苷酸的相對(duì)位置。
6.權(quán)利要求1至4任一項(xiàng)的方法,其還包含將所述兩個(gè)或更多個(gè)標(biāo)記的核苷酸的相對(duì)位置,與在接觸過(guò)相同切口核酸內(nèi)切酶的第二雙鏈DNA樣本上的、相同的標(biāo)記的核苷酸的位置進(jìn)行比較。
7.權(quán)利要求1至4任一項(xiàng)的方法,其中記錄兩個(gè)或更多個(gè)標(biāo)記的核苷酸的相對(duì)位置包括:確定位于第一雙鏈DNA的線性化部分內(nèi)的兩個(gè)或更多個(gè)標(biāo)記的核苷酸之間的距離。
8.權(quán)利要求1至4任一項(xiàng)的方法,其中將標(biāo)記的核苷酸摻入在切口位點(diǎn)處包括:使切口位點(diǎn)與三種或更多種攜帶熒光標(biāo)記物的核苷酸接觸,所述核苷酸選自攜帶熒光標(biāo)記物A的第一核苷酸、攜帶熒光標(biāo)記物B的第二核苷酸、攜帶熒光標(biāo)記物C的第三核苷酸以及攜帶熒光標(biāo)記物D的第四核苷酸。
9.權(quán)利要求8的方法,其還包括對(duì)所述第一雙鏈DNA樣本進(jìn)行照射以確定一個(gè)或多個(gè)攜帶熒光標(biāo)記物的核苷酸的存在或相對(duì)位置。
10.權(quán)利要求9的方法,其還包括通過(guò)將在照射下可見(jiàn)的熒光團(tuán)的順序與一個(gè)或多個(gè)所述突光團(tuán)的對(duì)應(yīng)核苷酸聯(lián)系起來(lái),以確定所述第一雙鏈DNA樣本的至少一部分的序列。
11.權(quán)利要求1至4任一項(xiàng)的方法,其還包括使用第二序列特異性切口核酸內(nèi)切酶使所述第一雙鏈DNA樣本產(chǎn)生切口,從而引入與位于由第一序列特異性切口核酸內(nèi)切酶產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處的核苷酸相鄰的切口位點(diǎn)。
12.權(quán)利要求1至4任一項(xiàng)的方法,其還包括基于所記錄的、標(biāo)記的核苷酸的相對(duì)位置,獲得DNA樣本的序列信息。
13.權(quán)利要求1至4任一項(xiàng)的方法,其中將標(biāo)記的核苷酸摻入包括:使切口位點(diǎn)與兩種或更多種標(biāo)記的核苷酸接觸,所述核苷酸選自攜帶標(biāo)記物A的第一核苷酸、攜帶標(biāo)記物B的第二核苷酸、攜帶標(biāo)記物C的第三核苷酸以及攜帶標(biāo)記物D的第四核苷酸。
14.權(quán)利要求13的方法,其中標(biāo)記物A、標(biāo)記物B、標(biāo)記物C和標(biāo)記物D中的至少兩種、三種或四種是不同的。
15.權(quán)利要求1至4任一項(xiàng)的方法,其中標(biāo)記的核苷酸是染料標(biāo)記的核苷酸。
16.一種獲得關(guān)于DNA樣本的結(jié)構(gòu)信息的方法,其包含: 使用序列特異性切口核酸內(nèi)切酶使第一雙鏈DNA樣本產(chǎn)生切口 ; 將一個(gè)或多個(gè)染料標(biāo)記的核苷酸摻入在由所述切口核酸內(nèi)切酶產(chǎn)生的兩個(gè)或更多個(gè)切口位點(diǎn)處; 對(duì)包含至少兩個(gè)染料標(biāo)記的核苷酸的所述第一雙鏈DNA樣本的一部分進(jìn)行線性化;和 記錄兩個(gè)或更多個(gè)標(biāo)記的染料標(biāo)記的核苷酸的相對(duì)位置。
17.一種獲得關(guān)于核酸生物聚合物的序列信息的方法,其包含: 使具有第一結(jié)合序列的第一熒光標(biāo)記的序列特異性探針與單鏈核酸生物聚合物結(jié)合; 使所述單鏈核酸生物聚合物與攜帶熒光標(biāo)記物A的第一終止核苷酸、與攜帶熒光標(biāo)記物B的第二終止核苷酸、與攜帶熒光標(biāo)記物C的第三終止核苷酸、以及與攜帶熒光標(biāo)記物D的第四終止核苷酸接觸;和 對(duì)所述核酸生物聚合物進(jìn)行照射以確定與第一標(biāo)記的序列特異性探針相鄰的所述第一終止核苷酸、第二終止核苷酸、第三終止核苷酸、第四終止核苷酸、或其任何組合的存在、相對(duì)位置、或二者。
18.一種獲得關(guān)于核酸生物聚合物的結(jié)構(gòu)信息的方法,其包含: (a)使雙鏈生物聚合物與切口核酸內(nèi)切酶接觸以產(chǎn)生至少兩個(gè)切口位點(diǎn); (b)使所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物A的第一核苷酸接觸; (c)除去過(guò)量的第一核苷酸; (d)對(duì)所述雙鏈生物聚合物進(jìn)行照射以確定所述第一核苷酸的存在或相對(duì)位置; (e)使所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物B的第二核苷酸接觸; (f)除去過(guò)量的第二核苷酸; (g)對(duì)所述雙鏈生物聚合物進(jìn)行照射以確定所述第二核苷酸的存在或相對(duì)位置; (h)使所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物C的第三核苷酸接觸; (i)除去過(guò)量的第三核苷酸; (j)對(duì)所述雙鏈生物聚合物進(jìn)行照射以確定所述第三核苷酸的存在或相對(duì)位置; (k)使所述至少兩個(gè)切口位點(diǎn)與攜帶熒光標(biāo)記物D的第四核苷酸接觸; (1)除去過(guò)量的第四核苷酸;和 (m)對(duì)所述雙鏈生物聚合物進(jìn)行照射以確定所述第一核苷酸的存在或相對(duì)位置。
19.用于進(jìn)行多重雜交的試劑盒,其包含: 各具不同顏色的多個(gè)雜交探針;和 將所述多個(gè)雜交探針中的至少兩個(gè)應(yīng)用于核酸樣本上并使至少一個(gè)雜交的核酸線性化和成像的說(shuō)明書(shū)。
【文檔編號(hào)】C12Q1/68GK104372080SQ201410584764
【公開(kāi)日】2015年2月25日 申請(qǐng)日期:2009年11月18日 優(yōu)先權(quán)日:2008年11月18日
【發(fā)明者】肖明, 曹涵, 帕里克史特·A·德施潘德, 邁克爾·博伊斯-加西諾 申請(qǐng)人:博納基因技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
湄潭县| 澄迈县| 衡阳市| 扶绥县| 屯昌县| 桦川县| 义马市| 比如县| 文水县| 开化县| 酒泉市| 苗栗市| 罗城| 徐州市| 镇江市| 台中县| 遂平县| 高平市| 曲水县| 泰州市| 自贡市| 清涧县| 芮城县| 南漳县| 息烽县| 灵台县| 鄂尔多斯市| 奎屯市| 抚顺县| 古交市| 庆安县| 朝阳县| 武强县| 会东县| 乐至县| 金山区| 定远县| 郧西县| 赤水市| 香河县| 邹平县|