專利名稱:從生物樣品中選擇性捕獲和擴增外顯子或靶標(biāo)基因組區(qū)域的方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及靶標(biāo)基因組DNA(gDNA)區(qū)域的捕獲和擴增,更特別地,本發(fā)明涉 及使用從模板DNA克隆產(chǎn)生的雜交DNA和/或RNA探針選擇性捕獲并擴增來自任意生物物 種(包括動物、植物、真菌、原生動物、古生菌和真細菌)的基因組、線粒體和其它形式的DNA 的所有外顯子、外顯子的任意子集、或任意其它目標(biāo)區(qū)域的方法。
背景技術(shù):
目前的技術(shù)發(fā)展已經(jīng)能夠?qū)崿F(xiàn)每次實驗進行數(shù)百萬至數(shù)十億堿基對(bps)規(guī)模 的脫氧核糖核酸(DNA)測序(Margulies等人,2005)?,F(xiàn)在至少有三個公司可以提供商業(yè) 化的大規(guī)模并行測序系統(tǒng)(例如,Roche提供的454系統(tǒng);Illumina提供的Illumina系統(tǒng); Applied BioSystems提供的SOLiD系統(tǒng))。目前這些系統(tǒng)的測序能力有的已經(jīng)足以對很多 生物物種(包括人類和小鼠)的基因組進行常規(guī)的從頭測序(de novo sequencing)并對 其重要部分進行再測序(Stephens等人,2006)。但是,在廣泛應(yīng)用的新技術(shù)的成功使用中 存在一個主要瓶頸即如何能以有效的方式在頭尾步驟中從散落于基因組、線粒體和其它 形式的DNA中選擇性捕獲并富集靶標(biāo)外顯子或靶標(biāo)內(nèi)含子區(qū)域。選擇性捕獲并富集來自生 物物種的基因組、線粒體和其它形式的DNA的特定區(qū)域具有廣泛的應(yīng)用。傳統(tǒng)的捕獲并擴增靶標(biāo)基因組DNA片段的方法如下(1)從包含核酸的生物樣品中提取DNA ;(2)通過各種方式(包括通過機械、超聲或酶學(xué)方法)將提取的DNA片段化;(3)通過DNA片段與互補性DNA和/或RNA探針的雜交選擇性捕獲靶標(biāo)DNA片段;(4)首先洗掉未與雜交探針結(jié)合的DNA片段。然后在下一個步驟中在合適的條件 下洗脫與雜交探針結(jié)合的DNA片段;(5)將捕獲的DNA用于下游應(yīng)用。如果需要更大數(shù)量的捕獲的DNA,可以使用通用 引物對通過聚合酶鏈反應(yīng)(PCR)擴增捕獲的DNA片段。具有特異性設(shè)計的序列的通用DNA 引物在步驟(2)或步驟(4)之后連接到所有DNA片段的5’和3’末端。任何旨在成功捕獲DNA片段的有商業(yè)價值的操作來講,整個過程中關(guān)鍵的技術(shù)是 產(chǎn)生雜交DNA和/或RNA探針并將其置于固體支持材料上或混合于液體溶液中的方法(用 于上述方法的步驟3)。捕獲的特異性是由雜交探針的DNA或RNA序列決定的。選擇性捕獲 來自任意生物物種的基因組和線粒體DNA的任何目標(biāo)區(qū)域需要低成本和靈活的方式以可 靠地產(chǎn)生并驗證大量的雜交探針。這些DNA和/或RNA探針的序列必須與目標(biāo)生物物種的 基因組和線粒體DNA中的目標(biāo)區(qū)域精確互補。捕獲能力是由可用于雜交的不同探針的數(shù)目 和長度的組合決定的。捕獲的靈活性是由探針產(chǎn)生的方式以及將其置于固體支持材料上或 混合于液體溶液中的方式?jīng)Q定的。這些雜交DNA和/或RNA探針應(yīng)該具備選擇性捕獲來自 任意生物物種的基因組、線粒體和其它形式的DNA的所有外顯子、外顯子的任意子集、或任 意其它目標(biāo)區(qū)域的總體能力和靈活性。必須以低成本的方式達到特異性、能力和靈活性以便在市場上競爭。因此,如果可以獲得有效解決所有這些問題的方法的話,則可以得到巨大 的技術(shù)和商業(yè)相關(guān)性。因此本領(lǐng)域中存在尚未滿足的需要以解決上述缺陷和不足。
發(fā)明內(nèi)容
在一個方面,本發(fā)明涉及從生物樣品中選擇性捕獲和/或擴增外顯子或靶標(biāo)基因 組區(qū)域的方法。特別地,本發(fā)明要求保護從DNA克隆制備DNA和/或RNA雜交探針的新方 法。在一個具體實施方式
中,該方法包括以下步驟獲得針對靶標(biāo)基因組區(qū)域的DNA模板, 將DNA模板克隆進入克隆載體以形成模板DNA克隆,構(gòu)建至少包括靶標(biāo)基因組區(qū)域的模板 DNA克隆庫,從庫中的DNA模板克隆產(chǎn)生雜交DNA和/或RNA探針,通過靶標(biāo)基因組DNA區(qū) 域與所產(chǎn)生的雜交探針的雜交捕獲靶標(biāo)基因組DNA區(qū)域,以及通過使用將結(jié)合的DNA從雜 交探針上釋放的條件洗脫捕獲的基因組DNA。洗脫條件可以包括溫度的變化,鹽溶液的變化 或溶液PH的變化。在一個具體實施方式
中,從來自生物樣品的總RNA或mRNA通過逆轉(zhuǎn)錄獲得DNA模 板。在另一個具體實施方式
中,通過進行多重聚合酶鏈反應(yīng)(PCR)或通過含有DNA的靶標(biāo) 遺傳區(qū)域的基因合成獲得DNA模板。在另一個具體實施方式
中,DNA模板對應(yīng)于預(yù)先確定 的線粒體DNA片段或全長的線粒體DNA。在一個具體實施方式
中,克隆步驟包括將DNA模板連接進入克隆載體或質(zhì)粒的步 驟??寺NA模板的目的是為了容易地存儲、擴增、復(fù)制和繁殖模板DNA材料以備將來之用。在一個具體實施方式
中,取決于起始RNA材料,庫中的模板DNA克隆包含生物樣品 表達的基因的全長mRNA、mRNA的開放讀碼框或部分長度的cDNA。在另一個具體實施方式
中,當(dāng)通過多重PCR或基因合成擴增內(nèi)含子區(qū)域時,模板DNA克隆庫代表目標(biāo)內(nèi)含子區(qū)域。在一個具體實施方式
中,通過逆轉(zhuǎn)錄或PCR反應(yīng)從cDNA制備的庫中的模板DNA克 隆用于捕獲生物樣品的外顯子。在另一個具體實施方式
中,通過多重PCR擴增內(nèi)含子區(qū)域 制備的庫中的模板DNA克隆用于捕獲生物樣品的內(nèi)含子區(qū)域。在另一個具體實施方式
中, 從線粒體DNA制備的庫中的模板DNA克隆用于捕獲生物樣品的線粒體DNA??寺≈械哪0?DNA可直接用作雜交探針,或者可以通過酶式消化或PCR擴增將模板本身從質(zhì)粒中釋放出 來以用作雜交探針。在一個具體實施方式
中,庫中的模板DNA克隆按照自動化系統(tǒng)可以操作的形式進 行組織。模板DNA克隆的信息儲存在計算機化數(shù)據(jù)庫中,該信息至少包括身份、產(chǎn)生日期、 制備克隆的人員和每個克隆的位置。在一個具體實施方式
中,構(gòu)建步驟包括以下步驟檢驗庫中的模板DNA克隆的質(zhì) 量和完整性,以及監(jiān)視并保持庫中的模板DNA克隆的質(zhì)量以長期使用。檢驗步驟包括以下 步驟確認庫中每個克隆的DNA序列,以及將克隆的DNA序列與生物樣品的靶標(biāo)基因或靶標(biāo) 基因組區(qū)域的參考DNA序列進行比較從而檢測庫中的克隆的完整性和序列準(zhǔn)確性。在一個具體實施方式
中,使用限制性酶將模板DNA片段從克隆載體或質(zhì)粒中消化 出來,從而釋放克隆載體或質(zhì)粒中攜帶的DNA片段,由此產(chǎn)生雜交探針。在另一個具體實施 方式中,使用克隆載體或質(zhì)粒的多個克隆位點上包含的通用引物對序列通過PCR擴增產(chǎn)生 雜交探針。在另一個具體實施方式
中,克隆載體或質(zhì)粒直接用作雜交探針而不將模板探針通過酶式方法切割出來或通過PCR擴增DNA模板。在另一個具體實施方式
中,從庫中的DNA 模板克隆通過體外轉(zhuǎn)錄產(chǎn)生雜交探針。在替代的具體實施方式
中,通過庫中的DNA模板的 體外逆轉(zhuǎn)錄獲得基因的cDNA或cRNA,從而產(chǎn)生雜交探針。在一個具體實施方式
中,捕獲步驟包括將雜交探針固定于固體支持材料的表面或 將雜交探針混合于液體溶液中的步驟。在另一個方面,本發(fā)明涉及從生物樣品中選擇性捕獲和/或擴增靶標(biāo)基因組區(qū)域 的方法。靶標(biāo)基因組區(qū)域包括來自生物樣品(包括動物、植物、真菌、原生動物、古生菌和/ 或真細菌)的基因組、線粒體和其它形式的DNA的外顯子、外顯子的子集、或目標(biāo)區(qū)域。在一個具體實施方式
中,該方法包括以下步驟提供至少包括靶標(biāo)基因組區(qū)域的 模板DNA克隆庫,從庫中的DNA模板克隆產(chǎn)生雜交探針,通過靶標(biāo)基因組DNA區(qū)域與所產(chǎn)生 的雜交探針的雜交捕獲靶標(biāo)基因組DNA區(qū)域。在一個具體實施方式
中,提供步驟包括以下步驟獲得針對靶標(biāo)基因組區(qū)域的 DNA模板,將DNA模板克隆進入克隆載體以形成模板DNA克隆,構(gòu)建至少包括靶標(biāo)基因組區(qū) 域的模板DNA克隆庫,以及檢驗庫中的模板DNA克隆的質(zhì)量和完整性。另外,該方法可以包括以下步驟通過使用將結(jié)合的DNA從雜交探針上釋放的條 件洗脫捕獲的基因組區(qū)域。在另一個方面,本發(fā)明涉及從生物樣品中捕獲和/或擴增靶標(biāo)基因組區(qū)域的試劑 盒。在一個具體實施方式
中,試劑盒具有至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫,其 中模板DNA克隆通過將從靶標(biāo)基因組區(qū)域獲得的DNA模板克隆進入克隆載體而形成;從庫 中的DNA模板克隆產(chǎn)生的雜交探針;以及將靶標(biāo)基因組DNA區(qū)域與所產(chǎn)生的雜交探針雜交 從而捕獲靶標(biāo)基因組DNA區(qū)域的工具。在一個具體實施方式
中,雜交工具包含具有一個或多個表面的固體支持材料,其 中雜交探針置于這些表面上以用于雜交探針與基因組DNA片段的雜交,或者包含溶液,雜 交探針混合于該溶液中以用于雜交探針與基因組DNA片段的雜交。在一個具體實施方式
中,模板DNA克隆庫儲存于計算機化數(shù)據(jù)庫中并由其管理。另外,試劑盒具有用于洗脫捕獲的基因組區(qū)域的工具和/或用于檢測洗脫的基因 組片段/區(qū)域的工具。本發(fā)明的這些方面和其它方面將通過以下優(yōu)選的具體實施方式
的描述以及以下 的附圖變得明顯,雖然可以不脫離本公開的新概念的精神和范圍做出各種變化和修飾。
附圖舉例說明了本發(fā)明的一個或多個具體實施方式
,與說明書一起解釋本發(fā)明的 原理。在所有附圖中盡可能以相同的指代編號指代具體實施方式
的相同或相似元素,其 中圖1顯示了根據(jù)本發(fā)明的一個具體實施方式
從生物樣品中選擇性捕獲和/或擴增 外顯子或靶標(biāo)基因組區(qū)域的方法的流程圖。圖2顯示了根據(jù)本發(fā)明的方法捕獲gDNA片段之后洗脫的gDNA的確認,其中圖板 A)和B)分別是設(shè)計為捕獲GJB2&MY07A的捕獲實驗結(jié)果。每個電泳凝膠泳道中加入的DNA 樣品為泳道1 鮭魚精DNA(作為陰性對照);泳道2 人類gDNA片段,使用檢測Cx26基因的引物通過PCR擴增;泳道3 以第二個人類gDNA樣品重復(fù),與泳道2相似;泳道4 水,作為 Cx26PCR引物的PCR擴增的陰性對照;泳道5 未經(jīng)過片段化處理和DNA捕獲處理的gDNA, 用作實驗中以Cx26PCR引物進行的PCR擴增的陽性對照;泳道6 洗脫的鮭魚精DNA,使用了 針對MY07A的引物(另一個陰性對照);泳道7 洗脫的人類gDNA,使用了針對MY07A的引 物(另一個陰性對照);泳道8 第二個洗脫的人類gDNA樣品,PCR擴增中使用了針對MY07A 的引物(另一個陰性對照);泳道9 直接來自水的PCR擴增的陰性對照;泳道10 使用未經(jīng) 消化的人類gDNA (未經(jīng)過DNA捕獲處理)的陽性對照;泳道A 通過我們的方法捕獲之后洗 脫的人類gDNA,PCR擴增中使用了針對MY07A的引物;泳道B 通過我們的方法捕獲之后洗 脫的鮭魚精DNA,PCR中使用了針對MY07A的引物(用作陰性對照);泳道C 水,陰性對照; 泳道D 未經(jīng)過片段化處理和DNA捕獲處理的gDNA,用作以MY07A引物進行的PCR擴增的陽 性對照。在圖像頂端的圖標(biāo)中顯示了實驗中使用的PCR弓丨物的相對位置。圖3顯示了根據(jù)本發(fā)明的方法捕獲的洗脫的gDNA的另一個確認測試。通過 Southern印跡檢測了捕獲前(總量的大約10% )和洗脫后(90%的DNA樣品經(jīng)我們的方法 處理)的經(jīng)過Bsu36I消化的人類gDNA。結(jié)果顯示出捕獲前和捕獲后的樣品都在預(yù)計的大 約2400bp大小的地方有單一的帶(箭頭指示)。通過比較Southern印跡中帶的深度給出 通過本發(fā)明的方法捕獲gDNA的效率的評估值為大約56%。圖4顯示了根據(jù)本發(fā)明的方法捕獲到的gDNA的另一組確認數(shù)據(jù)。這次我們用的 是Illumina Genome高通量測序儀。在測序中我們測了單邊52個堿基并加上解樣品的分 子編碼的過程。圖4A中顯示的是四個獨立的樣本。捕捉到的DNA小片段和MY015A的基因 序列作了比對。比對的結(jié)果用顏色編碼。我們挑了 MY015A基因的原因是因為這個基因的 結(jié)構(gòu)是所有耳聾基因中最復(fù)雜的。所有樣本的顏色編碼的結(jié)果均顯示捕捉到的DNA小片段 的富集模式完全和MY015A的基因結(jié)構(gòu)重合。因為捕捉探針的目標(biāo)針對的是MY015A的外顯 子區(qū)域,這些結(jié)果說明我們的基因捕捉方法具有很好的特異性。圖4B顯示MY015A外顯子 的目標(biāo)區(qū)域中的每個堿基被覆蓋了 20到1106次。平均的覆蓋次數(shù)是476次。這種覆蓋的 均一性至少可以對同一個突變測20次。這樣對任意一個堿基用下一帶高通量測序儀測錯 的概率就可以下降到每42°中有一個,這是相當(dāng)相當(dāng)?shù)男 ?br>
具體實施例方式以下實施例更詳細地描述了本發(fā)明,這些實施例僅為示例性的,因為其中的多種 修飾和變化對于本領(lǐng)域技術(shù)人員來說是顯而易見的。現(xiàn)在更詳細地描述本發(fā)明的各種具體 實施方式。當(dāng)提及附圖時,同一個數(shù)字通篇代表同一個成分。除非上下文另有特別指明,否 則本說明書和權(quán)利要求書通篇所用的“一個(a)”、“一個(an)”和“the”包括復(fù)數(shù)。同樣, 除非上下文另有特別指明,本說明書和權(quán)利要求書通篇所用的“in”包括“in”和“on”。另 外,下文對本說明書中使用的一些術(shù)語進行了更具體的定義。在本發(fā)明上下文和使用某術(shù)語的特定上下文中,本說明書中使用的術(shù)語一般具有 本領(lǐng)域通用的含義。在下文中或本說明書中其它地方描述了某些術(shù)語以提供實施本發(fā)明的 說明書的額外指導(dǎo)。本說明書其它地方使用的實施例(包括本文討論的任何術(shù)語的例子) 僅為示例性的,不以任何方式限制本發(fā)明或任何例舉的術(shù)語的范圍和涵義。同樣,本發(fā)明不 局限于本說明書提供的各種具體實施方式
。
本文使用的“約”、“大約”或“大概” 一般包括給定數(shù)值或范圍的20%以內(nèi),優(yōu)選 10 %以內(nèi),更優(yōu)選5 %以內(nèi)。本文給出的數(shù)值數(shù)量是大約的,意思是術(shù)語“約”、“大約”或“大 概”如果沒有明文指出也可以推斷出來。本文使用的術(shù)語“包含”、“包括(including)”、“具有”、“含有”、“包括 (involving) ”等等應(yīng)理解為開放式的,即意思是包括但不限于。根據(jù)本發(fā)明的目的,如本文所包括并詳細描述的那樣,本發(fā)明的一個方面涉及選 擇性捕獲和/或擴增來自任意生物物種的基因組、線粒體和其它形式的DNA的所有外顯子、 外顯子的任意子集、或任意其它目標(biāo)區(qū)域的方法。生物物種包括動物、植物、真菌、原生動 物、古生菌、真細菌等。一個具體實施方式
中的方法通過產(chǎn)生并使用雜交DNA和RNA探針實 現(xiàn)。參見圖1,其中顯示了根據(jù)本發(fā)明的一個具體實施方式
從生物樣品中選擇性捕獲 和/或擴增外顯子或靶標(biāo)基因組區(qū)域的方法的流程圖。在步驟110中,獲取了針對靶標(biāo)基因組DNA區(qū)域的DNA模板。在一個具體實施方 式中,從特定的目標(biāo)生物物種的總RNA或mRNA通過逆轉(zhuǎn)錄獲得這些針對外顯子的模板。為 了獲得含有靶標(biāo)外顯子的特定生物物種表達的總RNA或mRNA完整集合,應(yīng)該從該特定生物 物種的不同器官和組織獲取樣品。同樣,為了表達的RNA的集合的完整性,應(yīng)該在不同的發(fā) 育階段收集樣品。作為替代性的產(chǎn)生模板(特別是非編碼內(nèi)含子區(qū)域中的那些)的方法,還可以通 過多重聚合酶鏈反應(yīng)(PCR)選擇性擴增所需的外顯子DNA,或?qū)τ谒x的任何DNA序列可以 使用基因合成的方法。如果內(nèi)含子是需要捕獲的靶標(biāo)基因組DNA區(qū)域,則需要通過多重PCR從基因組DNA 或從含有靶標(biāo)內(nèi)含子區(qū)域的細菌人工染色體(BAC)擴增這些內(nèi)含子區(qū)域。由于線粒體DNA的長度相對較短,所以全長線粒體DNA或其大片段可直接用作通 過多重PCR或通過基因合成方法產(chǎn)生探針的模板。在步驟120中,將用于產(chǎn)生雜交探針的DNA模板克隆進入克隆載體以用于儲存、繁 殖和其它分子操作的目的。將步驟110中獲得的DNA模板連接進入克隆載體或質(zhì)粒??寺?載體或質(zhì)??梢允怯糜诜肿涌寺∧康牡娜我饪寺≥d體或質(zhì)粒,例如構(gòu)建cDNA庫。一旦連接進入特定的克隆載體或質(zhì)粒之后,通過典型的分子克隆技術(shù)處理步驟 110中獲得的DNA模板,這是為了儲存、繁殖和進一步操作(例如亞克隆)和制備數(shù)量更大 的克隆以及其它目的。根據(jù)本發(fā)明,為了產(chǎn)生雜交捕獲探針的目的,不需要獲得可表達的cDNA克隆(可 以轉(zhuǎn)染進入細胞系以產(chǎn)生特定基因的全長蛋白的那些),也不需要100%無誤差的克隆序 列。預(yù)計這種低要求能夠極大地提高捕獲gDNA片段整個過程所需的收集DNA探針模板和 DNA克隆的效率。在步驟130中,組建了包括所有的靶標(biāo)基因和/或基因組區(qū)域的模板DNA克隆庫。 在一個具體實施方式
中,取決于起始RNA材料,獲得了代表目標(biāo)生物物種表達的基因的全 長RNA、開放讀碼框RNA或部分長度的cDNA的cDNA克隆庫。例如,在步驟110中通過多重 PCR擴增內(nèi)含子的例子中,獲得了代表目標(biāo)內(nèi)含子區(qū)域的克隆庫。根據(jù)本發(fā)明的具體實施方式
,通過逆轉(zhuǎn)錄或通過基因合成方法從cDNA制備的庫
8中的克隆用于捕獲外顯子。通過多重PCR擴增內(nèi)含子區(qū)域或通過基因合成方法制備的庫中 的克隆用于捕獲內(nèi)含子區(qū)域。從線粒體DNA制備的庫中的克隆用于捕獲特定生物物種的線 粒體DNA。為了長期和一致性管理的目的,大量的DNA克隆按照自動化系統(tǒng)可以操作的形式 進行組織。例如(但不限于這些形式),克隆可以儲存于多孔板中,例如96孔或384孔板, 或具有更多數(shù)目的孔的其它的板。在一個具體實施方式
中,使用計算機化數(shù)據(jù)庫輔助管理 DNA克隆中的探針集合。在步驟140中,檢驗庫中的模板DNA克隆的質(zhì)量和完整性需要通過測序確認庫中 每個克隆的DNA序列。丟棄那些含有太短、太多錯誤或不是來源于想要的靶標(biāo)的DNA序列 的克隆。在一個具體實施方式
中,經(jīng)確認的DNA克隆被轉(zhuǎn)移至新的板中以備將來之用。儲 存板中的克隆的身份、位置和克隆的其它信息儲存于計算機化數(shù)據(jù)庫中并由其管理。將獲得的克隆的DNA序列與特定生物物種的靶標(biāo)基因或靶標(biāo)基因組區(qū)域的參考 DNA序列進行比較從而檢測庫中的克隆的精確性和完整性。可以從公開渠道或者通過該特 定生物物種的從頭測序(如果它們已經(jīng)不可獲得的話)獲得針對任意生物物種的參考DNA 序列。在一個具體實施方式
中,重復(fù)步驟110至140直至獲得代表所選的所有靶標(biāo)基因 或含有特定生物物種表達的所有基因的cDNA克隆的完整集合,或者獲得目標(biāo)內(nèi)含子區(qū)域。對于重復(fù)步驟110-140多次之后仍然缺失的那些基因,使用替代性的步驟通過 PCR反應(yīng)或通過使用基因合成方法直接擴增目標(biāo)DNA區(qū)域。另外,現(xiàn)在可以在公開市場通過 商業(yè)渠道獲得一些物種的很多基因(全長的或開放讀碼框)的DNA克隆,這也可以用作獲 得DNA克隆的替代性渠道。在步驟150中,監(jiān)視并保持庫中的模板DNA克隆的數(shù)量和質(zhì)量以長期使用。在一 個具體實施方式
中,可以按照需要通過自動方式或人工方式復(fù)制DNA庫。通過正確的維護, 定期質(zhì)量監(jiān)測并解決問題,庫中含有針對任何想要的靶標(biāo)基因和基因組區(qū)域的特定生物物 種的外顯子和/或內(nèi)含子的克隆可用作無限產(chǎn)生雜交探針的穩(wěn)定來源。在步驟160中,從庫中的DNA模板克隆產(chǎn)生雜交探針使DNA庫中的克隆生長至需 要的數(shù)量。從DNA模板產(chǎn)生的、連接進入克隆載體和/或質(zhì)粒中的雜交DNA或RNA探針用 于捕獲基因組和線粒體DNA片段。在一個具體實施方式
中,使用限制性酶將模板DNA片段從克隆載體和/或質(zhì)粒中 消化出來,從而釋放克隆載體和/或質(zhì)粒中攜帶的DNA片段,由此產(chǎn)生雜交探針。在另一個具體實施方式
中,使用克隆載體和/或質(zhì)粒中包含的(通常包含于多克 隆位點中)通用引物對序列通過PCR擴增產(chǎn)生雜交探針。通過人工方式設(shè)置這些反應(yīng),或 者,如果需要產(chǎn)生的雜交探針的數(shù)目太多而不能通過人工操作有效進行的話,則通過自動 化方式設(shè)置這些反應(yīng)。在多孔板的每個孔中設(shè)定并進行PCR反應(yīng)。在一個具體實施方式
中, 對于庫中的很多克隆,在同一個熱循環(huán)儀中同時進行多個板的PCR反應(yīng)。在另一個具體實施方式
中,克隆載體/或質(zhì)粒中攜帶的雜交探針這樣產(chǎn)生直接 使用這些載體或質(zhì)粒而不通過酶式方法將探針切割出來或通過PCR擴增DNA片段。攜帶DNA 探針的載體或質(zhì)??梢陨L至需要的數(shù)量并且被純化。將純化的載體或質(zhì)粒置于使其變成 單鏈的條件中,然后直接固定于固體支持材料上或混合于液體溶液中,從而用作雜交探針。
在替代的實施方式中,通過體外轉(zhuǎn)錄從庫中包含的DNA模板克隆產(chǎn)生RNA雜交探 針。這些可以是常規(guī)RNA探針或增強后續(xù)步驟可操作性的引入了生物素化核苷酸的RNA探 針。在實踐中,在探針用于雜交之前,這些探針(從克隆載體或質(zhì)粒通過酶式方法切 割下來的DNA片段,或每個孔中的PCR擴增子,或載體或質(zhì)粒)需要經(jīng)過純化。對應(yīng)于每個 靶標(biāo)的經(jīng)純化的DNA探針的數(shù)量需要被定量。在一個具體實施方式
中,通過體外逆轉(zhuǎn)錄從以上獲得的包含于庫中的模板DNA獲 得基因的cDNA或cRNA,從而產(chǎn)生雜交探針。cDNA或cRNA (長度為基因的部分長度至全長) 可用于這些目的。如果cDNA或cRNA只含有基因的部分長度(特別是對于那些長基因來 講),需要使用多個cDNA或cRNA以確保這些cDNA探針的組合覆蓋橫越基因的全長。使用 單一全長cDNA或跨越基因的全部外顯子區(qū)域的多個部分長度的cDNA確保捕獲針對該特定 基因的全部外顯子集合。在實踐中,這些cDNA或cRNA可以含有少數(shù)的序列誤差,只要這些誤差的效應(yīng)不累 積至足以嚴重破壞用于捕獲的雜交步驟的結(jié)合特異性和效率的程度。這種低于100%無誤 差的要求將降低產(chǎn)生探針的步驟的成本。在步驟170中,通過雜交捕獲靶標(biāo)基因組DNA區(qū)域并洗脫。根據(jù)本發(fā)明,通過以上任何一種方法獲得的合適數(shù)量的DNA/RNA探針可用作捕獲 靶標(biāo)gDNA區(qū)域的雜交探針。原則是使用飽和濃度的雜交DNA/RNA探針以確保有效捕獲。在 將雙鏈探針置于固體支持材料上或混合于液體溶液中的過程之前和/或之中,將雙鏈探針 置于使其變成單鏈的條件。通過體外轉(zhuǎn)錄產(chǎn)生的單鏈RNA探針直接用于雜交。通常通過以下方法或其組合將DNA雜交探針置于固體支持材料上(a)使用任何 常規(guī)基因芯片陣列點樣機(genechip arrayer)或基因芯片打印機(genechip printer)將 探針點印于玻璃片上;和(b)通過人工方式將探針置于固體支持材料上。固體支持材料包括但不限于,玻璃片,以親和素、鏈霉親和素或其它任何適合于 DNA結(jié)合或排斥的包被物包被的玻璃片,無任何包被物的玻璃珠,以親和素、鏈霉親和素或 其它任何用于DNA結(jié)合或排斥的包被物包被的玻璃珠,Southern或Northern或Western 印跡雜交中通常使用的任何薄膜,以親和素、鏈霉親和素或其它任何包被物包被的在 Southern或Northern或Western印跡雜交中通常使用的任何薄膜,以親和素或鏈霉親和素 包被或不包被的多孔板。另一種使用克隆載體/質(zhì)粒中攜帶的雜交探針的方式是直接使用這些載體/質(zhì)粒 而不將探針通過酶式方法切割出來或通過PCR擴增DNA片段。攜帶DNA探針的載體/質(zhì)粒 可以生長至需要的數(shù)量并且被純化。將含有針對靶標(biāo)基因組區(qū)域的DNA探針的載體/質(zhì)粒 直接固定于固體支持材料上作為單鏈DNA,從而用作雜交探針。在一個具體實施方式
中,為了使DNA探針與固體支持材料結(jié)合得更緊密,可以在 將其放置之后使用烘焙(baking)和/或UV交聯(lián)。在一個具體實施方式
中,可以不先將雜交探針固定于固體材料上,而是混合于雜 交溶液中以用于液相中的捕獲反應(yīng)。雜交之后,在步驟180中,通過使用合適的使結(jié)合的DNA從探針上釋放的條件洗脫 所捕獲的基因組區(qū)域。所述條件包括但不限于,溫度的變化,鹽濃度的變化和/或溶液PH的變化。將釋放的DNA收集起來(如果需要的話進行擴增)以備將來之用。本發(fā)明的一個方面提供了從生物樣品中捕獲和/或擴增靶標(biāo)基因組區(qū)域的試劑 盒。在一個具體實施方式
中,在一個具體實施方式
中,試劑盒具有包括感興趣的靶標(biāo)基因 組區(qū)域的含有模板DNA探針的克隆庫,其中模板DNA克隆通過將從靶標(biāo)基因組區(qū)域獲得的 DNA模板克隆進入克隆載體而形成;從庫中的DNA模板克隆產(chǎn)生的雜交探針;以及將靶標(biāo)基 因組DNA區(qū)域與所產(chǎn)生的雜交探針雜交從而捕獲靶標(biāo)基因組DNA區(qū)域的工具。此外,試劑盒具有洗脫捕獲的基因組片段(將其從雜交探針上釋放并分離)的工 具和用于檢測洗脫的基因組片段的身份的工具。在一個具體實施方式
中,雜交工具包括具有一個或多個表面的固體支持材料,其 中雜交探針置于這些表面上以用于雜交探針與靶標(biāo)基因組DNA區(qū)域的雜交,或者包含溶 液,雜交探針混合于該溶液中以用于雜交探針與基因組和/或線粒體DNA片段的雜交。在一個具體實施方式
中,模板DNA克隆庫儲存于計算機化數(shù)據(jù)庫并由其管理。以下提供了根據(jù)本發(fā)明的具體實施方式
的示例性方法及其相關(guān)結(jié)果,這不是為了 限制本發(fā)明的范圍。注意為了讀者方便,可以在實施例中使用標(biāo)題或小標(biāo)題,這不是為了 以任何方式限制本發(fā)明的范圍。此外,本文提出并公開了一些理論;但是,不論這些理論是 對是錯,均不是以任何方式限制本發(fā)明的范圍。以下示例性實驗數(shù)據(jù)證明本發(fā)明的方法以高效率選擇性捕獲靶標(biāo)基因組 DNA(gDNA)。主要想法是使用基于cDNA探針的方式作為高密度基于寡聚體的基因芯片方法 的低成本替代方式。為了測試根據(jù)本發(fā)明的方法捕獲gDNA片段的特異性,以限制性內(nèi)切酶 (HindIII)消化人類gDNA(50 μ g)。然后通過本發(fā)明的方法捕獲gDNA片段并進行鑒定。在這個示例性的實驗中,測試了兩個cDNA捕獲探針。一個是捕獲GJB2的編碼序 列(其編碼連接蛋白26(Cx26)蛋白)的cDNA探針,其結(jié)果顯示于圖2A。另一個設(shè)計為捕 獲編碼人類肌球蛋白7a蛋白的MY07A的一部分(外顯子5至7),其結(jié)果顯示于圖2B。經(jīng) HindIII消化的gDNA被捕獲并被洗脫。以引物對(其設(shè)計顯示于圖2中的圖的頂端)進 行的第一個特異性PCR擴增用于測試捕獲的特異性。陽性樣品來自經(jīng)本發(fā)明的方法捕獲的 人類gDNA,顯示于圖2A中的泳道2和3,陽性對照顯示于圖2A中的泳道5。泳道5中使用 的人類gDNA未經(jīng)任何處理。所有的樣品均產(chǎn)生預(yù)期大小的清晰的帶。從陰性對照洗脫的 DNA(來自鮭魚精的DNA樣品或直接從水進行PCR,分別顯示于圖2A中的泳道1和4)未產(chǎn) 生任何帶。為了測試gDNA捕獲的特異性,使用針對MY07A的外顯子5至7設(shè)計的引物對通 過PCR擴增捕獲并洗脫的DNA,結(jié)果均為陰性的,如圖2A中泳道6_8所示。泳道9是另一 個直接從水進行PCR的陰性對照。使用未經(jīng)消化的人類gDNA(未經(jīng)過本發(fā)明的方法處理) 的陽性對照產(chǎn)生了清晰的帶,如圖2A中泳道10所示,其具有預(yù)期大小。這些結(jié)果提示通 過本發(fā)明的方法針對GJB2 (編碼Cx26蛋白)捕獲的gDNA富集了 gDNA片段中想要的靶標(biāo) (其特異性包含GJB2),但沒有富集不在靶標(biāo)中的其它區(qū)域(例如MY07A)。為了測試設(shè)計用于從gDNA擴增MY07A的引物對(如圖2A頂端圖所示)是否能夠 產(chǎn)生陽性結(jié)果,通過本發(fā)明的方法從HindIII消化的gDNA片段中捕獲了 MY07A的外顯子5 至外顯子7。捕獲并洗脫的人類gDNA片段(圖2B中的泳道A)和陽性對照(圖2B中的泳 道D,其為通過PCR從未經(jīng)消化的人類gDNA直接擴增)均產(chǎn)生預(yù)期大小的清晰的帶。相反, 捕獲之后來自鮭魚精DNA的PCR擴增物(圖2B中的泳道B)和直接來自水的(圖2B中的泳道C)產(chǎn)生了陰性結(jié)果。為了確定本發(fā)明的方法的捕獲效率,首先以Bsu36I消化gDNA。經(jīng)消化的gDNA的總 量的10%用作捕獲前對照樣品。其余的90%的gDNA樣品經(jīng)過本發(fā)明的方法捕獲GJB2(Cx26 的外顯子2)。通過Southern印跡檢測捕獲前和洗脫后的DNA,捕獲前和捕獲后樣品均在預(yù) 期的 2400bp大小處顯示出單一的帶,如圖3中箭頭所示。比較這兩條帶的相對強度可以 得到本發(fā)明的方法對人類gDNA樣品的捕獲效率為 56%。因此,本文呈現(xiàn)的數(shù)據(jù)證明本發(fā) 明的方法能夠從人類基因組DNA捕獲靶標(biāo)外顯子,其具有高度特異性和有效性。圖4顯示了對根據(jù)本發(fā)明的方法捕獲到的gDNA用另一種方法作的確認。這次我 們用的是Illumina Genome高通量測序儀。在測序中我們測了單邊52個堿基并加上解樣 品的分子編碼的過程。圖4A中顯示的是四個獨立的樣本。捕捉到的DNA小片段和MY015A 的基因序列作了比對。比對的結(jié)果用顏色編碼。我們挑了 MY015A基因的原因是因為這個 基因的結(jié)構(gòu)是所有耳聾基因中最復(fù)雜的。所有樣本的顏色編碼的結(jié)果均顯示捕捉到的DNA 小片段的富集模式完全和MY015A的基因結(jié)構(gòu)重合。因為捕捉探針的目標(biāo)針對的是MY015A 的外顯子區(qū)域,這些結(jié)果說明我們的基因捕捉方法具有很好的特異性。圖4B顯示MY015A 外顯子的目標(biāo)區(qū)域中的每個堿基被覆蓋了 20到1106次。平均的覆蓋次數(shù)是476次。這種 覆蓋的均一性至少可以對同一個突變測20次。這樣對任意一個堿基用下一帶高通量測序 儀測錯的概率就可以下降到每42°中有一個,這是相當(dāng)相當(dāng)?shù)男?。本發(fā)明的優(yōu)點迄今為止,旨在選擇性同時捕獲上千個外顯子或其它數(shù)目的靶標(biāo)外顯子和基因 組區(qū)域的最成功的方法是將基因組DNA(gDNA)片段與高密度寡聚體基因芯片雜交,然后 通過洗脫釋放捕獲的DNA片段(Albert等人,2007 ;Okou等人,2007 ;Porreca等人,2007 ; Gnirke等人,2009)。在現(xiàn)有技術(shù)中,捕獲基因組DNA所需的餌探針是在高密度基因芯片上 原位合成的DNA寡聚體。相反,根據(jù)本發(fā)明,用于捕獲基因組DNA的靶標(biāo)區(qū)域的餌探針是從 cDNA庫或其它類型的DNA模板產(chǎn)生的?,F(xiàn)有技術(shù)中使用的方法與本發(fā)明相比具有以下缺占.(1)生產(chǎn)高密度寡聚體基因芯片需要非常昂貴和專業(yè)的基因芯片生產(chǎn)機器。但是, 本發(fā)明的方法不需要這樣的專業(yè)機器,因此顯著降低了操作成本,這能夠使捕獲的DNA片 段獲得廣泛應(yīng)用,例如下一代的測序系統(tǒng)。目前,只有少數(shù)幾個公司具有生產(chǎn)高密度寡聚體基因芯片的核心技術(shù)。為了在高 密度微陣列基因芯片上原位合成大量的寡聚體探針,需要大量的資金和操作規(guī)模以運行寡 聚體合成機器。但是,根據(jù)本發(fā)明的方法使世界上大量的具有常規(guī)設(shè)備的小規(guī)模實驗室、公 司、醫(yī)院和其它使用者能夠進行大規(guī)模的基因捕獲和/或選擇性靶標(biāo)基因系列(或基因組 區(qū)域)的捕獲以用于遺傳、診斷和其它分析。該方法尤其適合于選擇性捕獲高度選擇性的 靶標(biāo)基因系列,例如與特定疾病相關(guān)的基因,或相關(guān)疾病的特定系列,或可能產(chǎn)生對疾病的 易感性的遺傳標(biāo)記物。在這樣的應(yīng)用中,通常要靶向數(shù)百個基因的系列,這使得使用cDNA 模板庫的方法尤其適合于實際操作。(2)在高密度微陣列中使用短探針限制捕獲DNA片段的有效性和特異性。但是,根 據(jù)本發(fā)明,使用長cDNA模板以產(chǎn)生餌探針的方法增加了捕獲DNA片段的特異性和有效性。通過照相平版印刷法原位合成的寡聚體雜交探針用于產(chǎn)生置于高密度微陣列基因芯片上的雜交餌探針(Albert等人,2007 ;Okou等人,2007 ;Porreca等人,2007 ;Gnirke 等人,2009)。為了捕獲靶標(biāo)基因組DNA片段的目的,故意將寡聚體探針的長度增加至大約 80個堿基對(bp)甚至更長(Gnirke等人,2009),以確保更有效地捕獲(Albert等人,2007 ; Okou等人,2007 ;Porreca等人,2007)。合成更長的探針是技術(shù)上的挑戰(zhàn),并且基因芯片的
生產(chǎn)會更加昂貴。已經(jīng)知道高密度寡聚體微陣列捕獲物含有大約一半的不是來自想要的靶標(biāo)的DNA 片段(Albert等人,2007 ;Okou等人,2007 ;Porreca等人,2007)。短的寡聚體DNA探針的使 用是引起污染問題的部分原因。相反,根據(jù)本發(fā)明,使用了比現(xiàn)有技術(shù)中使用的DNA寡聚體探針(Albert等人, 2007 ;Okou等人,2007 ;Porreca等人,2007)長得多的全長cDNA探針或長的DNA探針緩解 了上述問題。通過使用典型長度為2,OOObp的餌探針,通過使用更嚴謹?shù)碾s交條件,改進了 雜交步驟中捕獲的特異性。本發(fā)明的方法使用的長的DNA探針還確保了可以使用高度嚴謹 雜交條件,在該條件下靶標(biāo)DNA片段仍然能夠與探針結(jié)合。這些高度嚴謹雜交條件應(yīng)該能 夠減少非特異性結(jié)合,從而減少非靶標(biāo)基因組區(qū)域的非特異性捕獲。由于捕獲基因組和線粒體DNA片段時不需要可表達的和100%無誤差的DNA克隆, 所以顯著減少了獲得代表任意特定生物物種所表達的完整基因系列的DNA庫所需的工作 量。另外,現(xiàn)在已經(jīng)可以在公開市場通過商業(yè)渠道獲得一些物種的很多基因的全長cDNA或 開放讀碼框cDNA克隆。通過從商業(yè)渠道直接購買這些克隆,更大的縮短了完成構(gòu)建DNA探 針庫所需的時間。(3)現(xiàn)有技術(shù)中使用的高密度微陣列基因芯片上的小的斑點尺寸顯著限制了捕獲 的能力和完整性。但是,根據(jù)本發(fā)明的方法能夠使尺寸大得多的斑點置于固體表面上,甚至 使用cRNA探針在溶液中進行雜交。對于500k-探針高密度微陣列基因芯片來講,每個部件的典型斑點尺寸是大約 15x18 μ m (或270 μ m2) (Cutler等人,2001)。更高的密度和更大的斑點尺寸是兩個不可兼得 的要求。對于目前市場上最先進的微陣列基因芯片來講,一個基因芯片上組裝了 2,100, 000 個探針,對于每個部件來說斑點更小。這些超高密度基因芯片的價格也更加昂貴。小的斑 點尺寸會降低捕獲能力,特別是需要使用更大量的基因組和線粒體DNA作為下游應(yīng)用的材 料的時候。在本發(fā)明中,DNA探針斑點以低得多的密度被固定于玻璃片上,或者被固定于玻璃 珠的表面上,或者這些探針被固定于多孔板的孔的表面。通過常規(guī)陣列點樣機點印的探針 將具有大得多的表面積(對于玻璃片上的每個探針來講),因為探針斑點的密度低得多。通 過常規(guī)陣列點樣機產(chǎn)生的斑點尺寸是可以調(diào)節(jié)的,通常比500k微陣列基因芯片上產(chǎn)生的 斑點大50倍。通過使用玻璃珠、薄膜和多孔板可以為雜交探針提供更大的表面積。所有這 些因素均有助于獲得更高的DNA捕獲能力。如果RNA雜交探針用于捕獲基因組DNA片段,則可以在液體溶液中直接使用這些 探針而不首先將其固定在固體材料上。在液相中進行的DNA捕獲的能力將會更高。當(dāng)成本是一個重要的考慮因素時(任何成功的商業(yè)操作一向如此),每個基因芯 片能夠捕獲的DNA片段的飽和量成為重要問題。例如,兩個商業(yè)渠道可獲得的大規(guī)模并行 DNA測序系統(tǒng)(SOLiD系統(tǒng)和Illumina系統(tǒng))的最低起始DNA數(shù)量為0. 1 μ g。人類的外顯子大約為總基因組的2%。對于從2毫升人類唾液或血液樣品中通??梢垣@得的40-100 μ g 基因組DNA來講,其中0. 8-2 μ g應(yīng)該是外顯子區(qū)域。這至少比用于下游遺傳分析的基因組 DNA的最低數(shù)量高8倍。因此,如何在盡可能少的機器操作輪次中盡可能完全地捕獲所有的 基因組DNA和線粒體片段對于成功進行所有外顯子系列的分析是至關(guān)重要的。由于每次機 器運行的成本是大約$8,000-10,000,所以更少的機器運行將顯著降低操作成本。由于本發(fā)明的方法可以捕獲更多的靶標(biāo)基因組DNA,所以在很多情況下可能不需 要在將樣品送去進行大規(guī)模并行測序之前進行PCR擴增。避免過多的PCR步驟對于測序應(yīng) 用是至關(guān)重要的,因為PCR擴增之后不同基因之間的相對量的差異通常為至少100倍。這 為基于克隆單一分子測序方法的下一代測序(以覆蓋所有需要的靶標(biāo))提供了取樣偏向。(4)現(xiàn)有技術(shù)使用的高密度微陣列基因芯片的能力不足以在單一基因芯片上捕獲 人類外顯子的完整集合(人類外顯子組)。但是,根據(jù)本發(fā)明的方法提供了捕獲人類外顯子 的完整集合的能力,因為使用了從cDNA模板產(chǎn)生的長的餌探針。這顯著降低了操作成本。在現(xiàn)有技術(shù)中,疊瓦式(tiling)探針或非疊瓦式探針跨越覆蓋整個基因,通常具 有不超過IObp的縫隙間隔。這是因為探針之間的更大的間隔或針對給定區(qū)域的單一探針 將降低捕獲全部基因的機會。假設(shè)寡聚體探針的間隔為10bp,則500k-探針陣列最大可以 捕獲5,000,OOObp的長度。通過相同的分析可以得知,2,000,000-探針高密度微陣列基因 芯片可以捕獲20,000,OOObp0這對于捕獲人類外顯子的全部集合所需的60,000,OOObp仍 然是不足的。所以,要么是降低對間隔的要求,要么通過使用多個寡聚體高密度微陣列完成 全部外顯子組的捕獲。這些方案要么降低有效捕獲的機會,要么顯著增加操作成本。對于 目前市場上最流行的500k微陣列來講,需要10-12個基因芯片以捕獲人類外顯子的全部集
I=I O相反,典型的基因芯片點樣機(例如,Genomics Solutions生產(chǎn)的OmniGrid Arrayer 0GR-03)能夠?qū)⒅辽?0,000個斑點點印在常規(guī)玻璃片上。平均來講,每個人類基 因?qū)⒃诓A暇哂幸粋€以上的斑點,因為估計人類基因的總數(shù)時大約30,000。因此,本發(fā) 明實現(xiàn)了使用點印于單一玻璃片上的單一雜交陣列捕獲所有人類外顯子的能力。這個覆蓋 能力不是通過使用更多的探針實現(xiàn)的,而是通過使用更長的和/或全長的DNA探針實現(xiàn)的。(5)已知點印于高密度微陣列上的寡聚體探針產(chǎn)生不一致的捕獲。但是,根據(jù)本發(fā) 明的方法提供了解決這個問題的靈活性。最近發(fā)表的論文均承認捕獲中的不均一性是有效利用下一代測序平臺的重大阻 礙(Porreca等人,2007)和(Albert等人,2007 ;Porreca等人,2007)。但是,根據(jù)本發(fā)明, 可以調(diào)整相對捕獲效率從而確保在所有基因靶標(biāo)上的一致性捕獲。這是通過調(diào)整放置于陣 列設(shè)計中的基因的相對比例實現(xiàn)的。通過增加那些始終表現(xiàn)出較低捕獲效率的針對外顯子 和基因組區(qū)域的探針的數(shù)目,可以調(diào)節(jié)并改進捕獲的一致性。總之,本發(fā)明提供了使用從模板DNA克隆產(chǎn)生的雜交DNA和RNA探針選擇性捕獲 并擴增來自任意生物物種(包括動物、植物、真菌、原生動物、古生菌和真細菌)的基因組、 線粒體和其它形式的DNA的所有外顯子、外顯子的任意子集、或任意其它目標(biāo)區(qū)域的方法。以上的本發(fā)明的示例性具體實施方式
的描述僅是為了解釋和描述本發(fā)明的目的, 不是為了窮舉或?qū)⒈景l(fā)明限制在所公開的確切形式上。根據(jù)以上教導(dǎo)可進行很多修飾和改 變。
具體實施方式
的選擇和描述是為了解釋本發(fā)明的原理及其實際應(yīng)用,從而使本領(lǐng) 域其它技術(shù)人員應(yīng)用本發(fā)明和各種具體實施方式
并進行適合于所考慮的特定用途的各種 修飾。不脫離本發(fā)明的精神和范圍,替代性的具體實施方式
對于本發(fā)明所屬領(lǐng)域技術(shù)人員 將是顯而易見的。因此,本發(fā)明的范圍由隨附的權(quán)利要求限定,而不是由以上的說明書和其 中描述的示例性具體實施方式
所限定。參考文獻Albert TJ, Molla MN, Muzny DM, Nazareth L, Wheeler D, SongX, Richmond TA, Middle CM,Rodesch MJ,Packard CJ, WeinstockGM, Gibbs RA(2007)Direct selection of human genomic loci bymicroarray hybridization. Nat Methods 4 :903-905.Cutler DJ, Zwick ME, Carrasquillo MM, Yohn CT, Tobin KP, Kashuk C, Mathews DJ, Shah NA, Eichler EE, Warrington JA, Chakravarti A(2001)High-throughput variation detection andgenotyping using microarrays. Genome research 11: 1913-1925.Gnirke A, Melnikov A, Maguire J, Rogov P, LeProust EM, Brockman W,Fennell T, Giannoukos G, Fisher S, Russ C, Gabriel S, Jaffe DB, Lander ES, Nusbaum C(2009) Solution hybrid selection withultra-long oligonucleotides for massively parallel targeted sequencing. Nature biotechnology 27:182—189.Margulies EH,Vinson JP,Miller W,Jaffe DB,Lindblad-Toh K,Chang JL,Green ED, Lander ES, Mullikin JC, Clamp M(2005)Aninitial strategy for the systematic identification of functional elementsin the human genome by low-redundancy comparative sequencing. Proceedings of the National Academy of Sciences of the United Statesot America 102 :4795_4800.Okou DT, Steinberg KM, Middle C, Cutler DJ, Albert TJ, ZwickME(2007) Microarray—based genomic selection for high-throughputresequencing. Nat Methods 4 -.907-909.Porreca GJ,Zhang K,Li JB, Xie B, Austin D, Vassallo SL, Leproust EM,Peck BJ, Emig CJ, Dahl F, Gao Y, Church GM, Shendure J(2007)Multiplex amplification of large sets of human exons. Nat Methods.Stephens M,Sloan JS,Robertson PD,Scheet P,Nickerson DA(2006)Automating sequence-based detection and genotyping of SNPsfrom diploid samples. Nature genetics 38 :375_381.
1權(quán)利要求
一種從生物樣品中選擇性捕獲和/或擴增外顯子或靶標(biāo)基因組區(qū)域的方法,包括以下步驟a)獲得針對靶標(biāo)基因組區(qū)域的DNA模板;b)將DNA模板克隆進入克隆載體以形成模板DNA克??;c)構(gòu)建至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫;d)從庫中的DNA模板克隆產(chǎn)生雜交探針;e)通過靶標(biāo)基因組DNA片段與所產(chǎn)生的雜交探針的雜交捕獲靶標(biāo)基因組DNA區(qū)域;和f)通過使用將結(jié)合的DNA從雜交探針上釋放的條件洗脫捕獲的基因組區(qū)域。
2.根據(jù)權(quán)利要求1所述的方法,其中從來自生物樣品的總RNA或mRNA通過逆轉(zhuǎn)錄獲得 DNA模板。
3.根據(jù)權(quán)利要求1所述的方法,其中通過進行多重聚合酶鏈反應(yīng)(PCR)或通過基因合 成獲得DNA模板。
4.根據(jù)權(quán)利要求1所述的方法,其中針對預(yù)先確定的線粒體DNA片段或全長的線粒體 DNA產(chǎn)生DNA模板。
5.根據(jù)權(quán)利要求1所述的方法,其中克隆步驟包括將DNA模板連接進入克隆載體或質(zhì) 粒的步驟。
6.根據(jù)權(quán)利要求1所述的方法,其中取決于起始RNA材料,模板DNA探針的克隆庫代表 生物樣品表達的基因的全長RNA、開放讀碼框RNA或部分長度的cDNA。
7.根據(jù)權(quán)利要求1所述的方法,其中當(dāng)通過多重PCR或基因合成擴增內(nèi)含子區(qū)域時,模 板DNA克隆庫代表目標(biāo)內(nèi)含子區(qū)域。
8.根據(jù)權(quán)利要求1所述的方法,其中通過cDNA逆轉(zhuǎn)錄或PCR反應(yīng)制備的庫中的模板 DNA克隆用于捕獲生物樣品的外顯子;其中通過多重PCR擴增內(nèi)含子區(qū)域制備的庫中的模 板DNA克隆用于捕獲生物樣品的內(nèi)含子區(qū)域;其中從線粒體DNA制備的庫中的模板DNA克 隆用于捕獲生物樣品的線粒體DNA
9.根據(jù)權(quán)利要求1所述的方法,其中庫中的模板DNA克隆按照自動化系統(tǒng)可以操作的 形式進行組織。
10.根據(jù)權(quán)利要求1所述的方法,其中模板DNA克隆的信息儲存在計算機化數(shù)據(jù)庫中, 該信息至少包括身份、序列構(gòu)象、產(chǎn)生日期和每個克隆的位置。
11.根據(jù)權(quán)利要求1所述的方法,其中構(gòu)建步驟包括以下步驟a)檢驗庫中的模板DNA克隆的質(zhì)量和完整性;和b)監(jiān)視并保持庫中的模板DNA克隆的質(zhì)量以長期使用。
12.根據(jù)權(quán)利要求11所述的方法,其中檢驗步驟包括以下步驟a)確認庫中每個克隆的DNA序列;和b)將克隆的DNA序列與生物樣品的靶標(biāo)基因或靶標(biāo)基因組區(qū)域的參考DNA序列進行比 較從而檢測庫中的克隆的完整性。
13.根據(jù)權(quán)利要求1所述的方法,其中使用限制性酶將模板DNA片段/探針從克隆載體 或質(zhì)粒中消化出來,從而釋放克隆載體或質(zhì)粒中攜帶的DNA片段,由此產(chǎn)生雜交探針。
14.根據(jù)權(quán)利要求1所述的方法,其中使用克隆載體或質(zhì)粒的多個克隆位點上包含的 通用引物對序列通過PCR擴增產(chǎn)生雜交探針。
15.根據(jù)權(quán)利要求1所述的方法,其中通過直接使用克隆載體或質(zhì)粒產(chǎn)生雜交探針而 不將模板探針通過酶式方法切割出來或通過PCR擴增DNA片段。
16.根據(jù)權(quán)利要求1所述的方法,其中從模板DNA克隆通過體外轉(zhuǎn)錄產(chǎn)生探針。
17.根據(jù)權(quán)利要求1所述的方法,其中通過庫中的模板DNA的體外逆轉(zhuǎn)錄獲得基因的 cDNA或cRNA,從而產(chǎn)生雜交探針。
18.根據(jù)權(quán)利要求1所述的方法,其中捕獲步驟包括將雜交探針固定于固體支持材料 的表面或?qū)㈦s交探針混合于溶液中的步驟。
19.根據(jù)權(quán)利要求18所述的方法,其中條件包括溫度的變化,鹽溶液的變化或溶液pH 的變化。
20.一種從生物樣品中選擇性捕獲和/或擴增靶標(biāo)基因組區(qū)域的方法,包括以下步驟a)提供至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫;b)從庫中的DNA模板克隆產(chǎn)生雜交探針;和c)通過靶標(biāo)基因組DNA區(qū)域與所產(chǎn)生的雜交探針的雜交捕獲靶標(biāo)基因組DNA區(qū)域。
21.根據(jù)權(quán)利要求20所述的方法,其中提供步驟包括以下步驟a)獲得針對靶標(biāo)基因組區(qū)域的DNA模板;b)將DNA模板克隆進入克隆載體以形成模板DNA克??;c)構(gòu)建至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫;和d)檢驗庫中的模板DNA克隆的質(zhì)量和完整性。
22.根據(jù)權(quán)利要求20所述的方法,還包括以下步驟a)通過使用將結(jié)合的DNA從雜交探針上釋放的條件洗脫捕獲的基因組區(qū)域。
23.根據(jù)權(quán)利要求20所述的方法,其中靶標(biāo)基因組區(qū)域包括來自生物樣品的基因組、 線粒體和其它形式的DNA的外顯子、外顯子的子集或目標(biāo)區(qū)域,所述生物樣品包括動物、植 物、真菌、原生動物、古生菌和/或真細菌。
24.一種用于從生物樣品中捕獲和/或擴增靶標(biāo)基因組區(qū)域的試劑盒,包括a)至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫,其中模板DNA克隆通過將從靶標(biāo)基因 組區(qū)域獲得的DNA模板克隆進入克隆載體而形成;b)從庫中的DNA模板克隆產(chǎn)生的雜交探針;和c)將靶標(biāo)基因組DNA區(qū)域與所產(chǎn)生的雜交探針雜交從而捕獲靶標(biāo)基因組DNA區(qū)域的工具。
25.根據(jù)權(quán)利要求24所述的試劑盒,其中雜交工具包含a)具有一個或多個表面的固體支持材料,其中雜交探針置于這些表面上以用于雜交探 針與靶標(biāo)基因組DNA區(qū)域的雜交;或b)溶液,雜交探針混合于該溶液中以用于雜交探針與基因組DNA區(qū)域的雜交。
26.根據(jù)權(quán)利要求24所述的試劑盒,其中模板DNA克隆庫通過人工管理,或通過電子數(shù) 據(jù)表程序管理,或儲存于計算機化數(shù)據(jù)庫中。
27.根據(jù)權(quán)利要求24所述的試劑盒,還包含用于洗脫捕獲的基因組區(qū)域的工具。
28.根據(jù)權(quán)利要求27所述的試劑盒,還包含用于檢測洗脫的基因組片段/區(qū)域的工具。
全文摘要
在一個方面,本發(fā)明涉及從生物樣品中選擇性捕獲和擴增外顯子或靶標(biāo)基因組區(qū)域的方法。在一個具體實施方式
中,該方法包括以下步驟獲得針對靶標(biāo)基因組區(qū)域的DNA模板,將DNA模板克隆進入克隆載體以形成模板DNA克隆,構(gòu)建至少包括靶標(biāo)基因組區(qū)域的模板DNA克隆庫,從庫中的DNA模板克隆產(chǎn)生雜交探針,通過靶標(biāo)基因組DNA樣品(通過機械方法或酶學(xué)方法片段化)與所產(chǎn)生的雜交探針的雜交而捕獲靶標(biāo)基因組DNA區(qū)域,以及通過使用將結(jié)合的DNA從雜交探針上釋放并分離的條件洗脫捕獲的基因組片段。
文檔編號C12Q1/68GK101942431SQ20101020557
公開日2011年1月12日 申請日期2010年6月10日 優(yōu)先權(quán)日2009年6月18日
發(fā)明者李玉華, 林曦, 湯文學(xué) 申請人:林曦;湯文學(xué);李玉華