示,暈環(huán)探針還包含與第一寡核苷酸的中心序列42互補的一種或多種第二寡核苷酸。在本公開的語境中,這些寡核苷酸可被稱為與核酸序列B雜交的一種或多種第二寡核苷酸。在實施方式32 (顯示于圖A)中,一種或多種第二寡核苷酸可以是單個寡核苷酸44。在實施方式46 (顯示于圖B)中,一種或多種第二寡核苷酸可以是兩種寡核苷酸44a和44b,其中每種各含有與第一寡核苷酸雜交的區(qū)域、和不與第一寡核苷酸雜交的尾。在某些實施方式中,一種或多種第二寡核苷酸可提供擴增和/或測序引物結(jié)合位點和任選的分子條碼序列。如果使用暈環(huán)探針46,則這些序列可存在于寡核苷酸44a和44b的尾中。
[0077]在某些實施方式中,第一寡核苷酸和一種或多種第二寡核苷酸使得它們能夠與基因組的限制片段雜交從而產(chǎn)生這樣的復合體,所述復合體中,一種或多種第二寡核苷酸中至少一種的至少一端與所述片段的一端可連接性鄰近,如US7883849和Dahl等人(Nucl.Acids.Res.200533:e71)所述,其通過引用被并入本文。
[0078]與上述一致,暈環(huán)探針的雙鏈區(qū)域的長度可以為15-100個堿基對(例如,30-60bp),且側(cè)翼區(qū)域38和40 (其與基因組中的靶序列特異性雜交)的序列長度可以為10-100個堿基(例如,12-50個堿基)。應該顯而易見的是,暈環(huán)探針的雙鏈區(qū)域的核苷酸序列應被設(shè)計以使得它不與所研究的基因組雜交。上述方法可用來生產(chǎn)可用于圖5中所示的任一個實施方式中的第一寡核苷酸的群體。
[0079]圖6闡釋了示例性多重暈環(huán)試驗,其中可使用本單鏈產(chǎn)物28的群體(如圖3中所示)。所述方法的某些實施方式可包括:(a)使來自檢測基因組的片段化基因組DNA50與第一寡核苷酸52的群體在一種或多種第二寡核苷酸54存在時雜交以產(chǎn)生雜交產(chǎn)物56。如所示,雜交產(chǎn)物包含一些復合體,例如,58、60和62。如所示,許多第一寡核苷酸(例如,復合體58和60中的那些)與兩種不同的基因組片段雜交,這可預計是因為:在每種第一寡核苷酸分子內(nèi),VjPV2序列可與基因組中相距至少1kb的位點雜交。在某些情況下,相對于參考基因組,檢測基因組可具有如下染色體重排:其將V1-互補序列有效移動至與V2-互補序列相同的鏈上接近V2-互補序列的位點。在這些情況下,如果第一寡核苷酸包含與通過重排移至接近的序列互補的1和V 2序列,那么將產(chǎn)生復合體62,其包含與第一寡核苷酸的兩端雜交的單個基因組片段。如上所述,在某些實施方式中,第一寡核苷酸被設(shè)計以使VJP V2序列鄰近參考基因組中限制酶的切割位點。在這些實施方式中,復合體62中片段的末端可與復合體的第二寡核苷酸的末端可連接性鄰近。在另一些實施方式中,可使用例如核酸外切酶和/或瓣狀核酸內(nèi)切酶來削減(trimmed back)片段的末端以提供這樣的復合體,其中片段的末端與該復合體中第二寡核苷酸的末端可連接性鄰近。
[0080]雜交之后,使雜交產(chǎn)物56與連接酶接觸以使片段化基因組DNA的末端與一種或多種第二寡核苷酸連接從而產(chǎn)生連接產(chǎn)物56。如所示,在含有與第一寡核苷酸的兩端雜交的單個片段的復合體中,片段的兩端與一種或多種第二寡核苷酸連接。在所顯示的實施方式(其應用圖1的圖A中所示暈環(huán)探針)中,連接產(chǎn)生環(huán)狀核酸分子66。在應用圖5的圖B中所示暈環(huán)探針的實施方式中,基因組片段與兩種不同的寡核苷酸(例如,44a和44b,如圖5的圖B中所示)連接,這有效地將銜接子(adaptor)添加到基因組片段的兩端。
[0081]連接之后,使用與一種或多種第二寡核苷酸所提供的位點雜交的擴增引物,使連接產(chǎn)物64經(jīng)受聚合酶鏈式反應條件,其中如上所述,如果寡核苷酸提供引物結(jié)合位點,那么引物可與該寡核苷酸或其互補物雜交。圖6中使用箭頭來指示示例性的擴增引物的位點。等價結(jié)合位點可由圖5的圖B中所示替代性第二寡核苷酸來提供。通過擴增步驟產(chǎn)生產(chǎn)物68指示:相對于參考基因組,檢測基因組包含染色體重排。如果不存在將V1-互補序列移至與V2-互補序列相同的鏈上接近V2-互補序列的位點的重排,則將不會得到擴增產(chǎn)物。
[0082]在某些實施方式中,所述方法還可包括對擴增產(chǎn)物68進行測序。所述測序可使用與一種或多種第二寡核苷酸的互補鏈雜交的引物。可分析該方法以鑒定染色體重排的斷點。
[0083]將顯而易見的是,在某些實施方式中,通過一種或多種第二寡核苷酸所添加的序列可含有適合用于下一代測序平臺的序列,所述測序平臺例如,Illumina的可逆性終止法、Roche的焦磷酸測序法(454)、Life Technologies的連接測序法(SOLiD平臺)或LifeTechnologies的離子激流平臺。下列參考文獻中描述了這種方法的實例:Margulies等A (Nature 2005437:376-80) ;Ronaghi 等人(Analytical B1chemistry 1996242:84-9);Shendure(Science2005309:1728) ;Imelfort 等人(Brief B1inform.200910:609-18);Fox等人(Methods Mol B1l.2009 ;553:79-108) ;Appleby 等人(Methods Mol B1l.2009 ;513:19-39)和Morozova (Genomics.200892:255-64),其中關(guān)于方法和方法的具體步驟(包括每個步驟的起始產(chǎn)物、試劑和終產(chǎn)物全部)的一般描述的通過引用被并入本文。序列可存在于一種或多種第二寡核苷酸中(在它們的尾中或在與第一寡核苷酸雜交的序列中)。在某些情況下,一種或多種第二寡核苷酸可含有兩組引物結(jié)合位點,一組用于通過反向PCR擴增環(huán)狀DNA,另一組用于對所得產(chǎn)物進行測序。一種或多種第二寡核苷酸還可包含位于擴增和測序引物結(jié)合位點下游的分子條碼,其可被用來鑒定序列來自哪個樣品,或計算多少不同的起始分子已被測序。
[0084]在另一些實施方式中,可使用納米孔測序?qū)U增子進行測序(例如,如Soni等人Clin Chem 53:1996-20012007 中所述,或如 Oxford Nanopore Technologies 所述)。納米孔測序是單分子測序技術(shù),其中單個DNA分子在通過納米孔時被直接測序。納米孔是小洞,其直徑Inm左右。將納米孔浸入傳導流體并越過它應用電勢(電壓)導致微量電流,這是因為離子通過納米孔被傳導。流過的電流量對納米孔的尺寸和形狀敏感。當DNA分子穿過納米孔時,DNA分子上的每個核苷酸不同程度阻塞納米孔,從而不同程度改變通過納米孔的電流的量級。因此,這種DNA分子穿過納米孔時的電流改變代表DNA序列的讀取。納米孔測序技術(shù)在美國專利號 5,795,782、6,015,714、6,627,067、7,238,485 和 7,258,838 以及美國專利申請公開2006003171和20090029477中被描述。
[0085]在一些【具體實施方式】中,可通過使用限制酶(例如具有4個、5個或6個堿基對識別位點的一種或多種限制酶)消化基因組DNA來產(chǎn)生片段化基因組DNA?;蛘?,可使用化學、物理或轉(zhuǎn)座酶催化片段化方法從基因組DNA產(chǎn)生基因組DNA,參見,例如,Adey等人(GenomeB1logy2010, 11:R119)。例如,物理片段化方法可以包括超聲、霧化或剪切基因組DNA。在某些實施方式中,在進行所述方法之前,可將基因組DNA片段化至平均尺寸在10bp-1Okb (例如200bp-lkb)范圍內(nèi)。
[0086]上述方法可被用來分析來自任何含核酸實體例如任何生物體、噬菌體或病毒等的基因組。在某些情況下,所述方法可被用來分析來自任何生物體(例如,植物、動物(例如,爬行動物、哺乳動物例如人類和小鼠、昆蟲、蠕蟲、魚類、等)、組織樣品、細菌、真菌(例如,酵母)、噬菌體、病毒、尸體組織、考古學/古代的樣品等等的基因組。在某些實施方式中,所述方法中使用的初始DNA可來源于哺乳動物,其中在某些實施方式中,哺乳動物是人類。在一種實施方式中,檢測基因組疑似含有染色體重排。
[0087]在某些實施方式中,被分析的初始DNA可來源于單一來源(例如,單一生物體、病毒、組織、細胞、對象等),然而在另一些實施方式中,核酸樣品可以是從多個來源提取的核酸的庫(例如來自多種生物體、組織、細胞、對象等的核酸的庫),其中“多種”表示兩種或更多種。因而,在某些實施方式中,核酸樣品可含有來自2種或更多種來源,3種或更多種來源,5種或更多種來源,10種或更多種來源,50種或更多種來源,100種或更多種來源,500種或更多種來源,1000種或更多種來源,5000種或更多種來源,多達并包括約10000種或更多種來源的核酸。分子條碼可允許來自不同來源的序列在分析之后被區(qū)分。此外,反應可以是多重的以在單個反應中靶向多個不同靶位點(例如,10-1000個)。
[0088]組合物
[0089]提供包含雙鏈體的群體的組合物。在某些實施方式中,雙鏈體包含:如上所述,包含具有下式1-B-3’的頂鏈序列的第一寡核苷酸的群體;和包含具有下式V2’ -B’ -3’的底鏈序列的第二寡核苷酸的群體。在一些實施方式中,B和B’的核苷酸序列互補且它們的長度為至少15個核苷酸;第一群體的每種寡核苷酸的B的核苷酸序列相同;第二群體的每種寡核苷酸的B’的核苷酸序列相同A的核苷酸序列在第一群體的寡核苷酸之間是可變的;V2’的核苷酸序列在第二群體的寡核苷酸之間是可變的;且VjP V2’與參考基因組中的不同位點雜交。在一些實施方式中,B的核苷酸序列的長度為至少15個堿基,VjP V 2’的核苷酸序列的長度為至少25個核苷酸且寡核苷酸的第一和第二群體各自可包含至少10種寡核苷酸??纱嬖谟谠摻M合物中的組分的更詳細描述以及可存在于該組合物中的其它組分描述于上文所述的方法部分中。
[0090]試劑盒
[0091]本公開還提供用于實行如上所述本方法的試劑盒(kit)。本試劑盒可至少包含:如上所述,a)包含具有下式1-B-3’的頂鏈序列的第一寡核苷酸的群體;和b)包含具有下式V2’ -B’ -3’的底鏈序列的第二寡核苷酸的群體。在一些實施方式中,B和B’的核苷酸序列互補且它們的長度為至少15個核苷酸;第一群體的每種寡核苷酸的B的核苷酸序列相同;第二群體的每種寡核苷酸的B’的核苷酸序列相同A的核苷酸序列在的第一群體的寡核苷酸之間是可變的;V2’的核苷酸序列在的第二群體的寡核苷酸之間是可變的;且1和V2’與參考基因組中的不同位點雜交。在某些情況下,第一寡核苷酸的群體可包含具有下式F-V1-B-3>的頂鏈序列,第二寡核苷酸的群體包含具有下式R’ _V2’ -B’ -3’的底鏈序列,其中序列R和F’