用于多態(tài)性的高通量鑒定和檢測的策略的制作方法
【專利說明】
[0001] 本申請是申請日為2006年6月23日、申請?zhí)枮?00680025630. 8的同名申請的分 案申請。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及分子生物學(xué)和遺傳學(xué)領(lǐng)域。本發(fā)明涉及快速鑒定核酸樣品中的多個多 態(tài)性。經(jīng)鑒定的多態(tài)性可以用于針對測試樣品中的多態(tài)性的高通量篩選系統(tǒng)的開發(fā)。
【背景技術(shù)】
[0003] 長期以來,基因組DNA探查被科學(xué)團(tuán)體特別是醫(yī)學(xué)團(tuán)體所期望?;蚪MDNA是鑒 定、診斷和治療疾病,例如癌癥和阿爾茲氏疾病的關(guān)鍵。除疾病鑒定和治療以外,基因組DNA 的探查可以在植物和動物育種研究中帶來顯著的優(yōu)勢,其可以對全世界的食品及營養(yǎng)問題 提供答案。
[0004] 已知許多疾病與特定的基因兀件有關(guān),特別地,與特定基因中的多態(tài)性有關(guān)。大量 樣品例如基因組的多態(tài)性的鑒定,在目前是一項艱苦而耗時的工作。然而,該鑒定對于下述 領(lǐng)域例如生物醫(yī)學(xué)的研究,開發(fā)藥學(xué)產(chǎn)品、組織分型、基因分型和群體研究具有重大價值。
[0005] 發(fā)明概述
[0006] 本發(fā)明提供了使用高通量方法的組合以快速而經(jīng)濟(jì)的方式在復(fù)雜的例如非常大 量的核酸樣品(例如DNA或RNA)中,有效地鑒定并且可靠地檢測多態(tài)性的方法。
[0007] 這種高通量方法的整合提供了一種平臺,其特別適用于高度復(fù)雜的核酸樣品中的 多態(tài)性的快速且可靠的鑒定和檢測,其中傳統(tǒng)的多態(tài)性的鑒定和繪圖是艱苦且耗時的。
[0008] 本發(fā)明人的發(fā)現(xiàn)之一是用于多態(tài)性,優(yōu)選單核苷酸多態(tài)性的鑒定的解決方案,而 且同樣可用于(微)衛(wèi)星和/或插入/缺失特別是在大基因組中(微)衛(wèi)星和/或插入/ 缺失的鑒定的解決方案。該方法的獨特之處在于它對大的或小的基因組的適用性相同,并 且對大基因組特別是多倍體物種尤其具有優(yōu)勢。
[0009] 為了鑒定SNP(和隨后檢測經(jīng)鑒定的SNP),本領(lǐng)域有幾種可以采用的可能方法。首 選方案中,對完整基因組進(jìn)行測序,并且這可以對幾個個體進(jìn)行。這主要是理論上的實驗, 因為這是麻煩而且昂貴的,并且,盡管技術(shù)快速發(fā)展,這雖然簡單但對用于每一個生物體是 不可行的,尤其是對具有大基因組的生物體是不可行的。次選方案是利用可獲得的(片段 化的)序列信息,例如EST文庫。其允許生成使PCR引物,重新測序和個體間的比較。此 外,其要求初始的序列信息不可得或僅僅是有限量的。進(jìn)一步必須開發(fā)分別針對各個區(qū)域 的PCR-分析,其增加了巨大的成本和開發(fā)時間。
[0010] 第三個選擇是限定自身到各個個體的基因組的部分。困難在于,為了提供用于成 功的SNP鑒定的可比較的結(jié)果,所提供的基因組的部分必須對不同個體是相同的。本發(fā)明 人現(xiàn)在已經(jīng)解決了這一難題,通過整合用于篩選部分的基因組的高度重現(xiàn)性方法集合和用 于多態(tài)性鑒定的高通量測序,其整合于樣品制備和高通量鑒定平臺。本發(fā)明加速了多態(tài)性 發(fā)現(xiàn)的進(jìn)程并且在后續(xù)的用于所發(fā)現(xiàn)的多態(tài)性開發(fā)的過程中,使用相同的要件(element) 可以有效且可靠地進(jìn)行高通量的基因分型。
[0011] 進(jìn)一步設(shè)想的本發(fā)明的方法的應(yīng)用,包括篩選富集的微衛(wèi)星文庫,進(jìn)行轉(zhuǎn)錄作 譜CDNA-AFLP (數(shù)字化Northern)、復(fù)雜基因組的測序,EST文庫測序(對完整CDNA或 cDNA-AFLP)、微小RNA發(fā)現(xiàn)(小的插入文庫的測序)、細(xì)菌人造染色體(BAC)(重疊群)的 測序、批量分離分析法AFLP/cDNA - AFLP、AFLP片段的常規(guī)檢測,例如,標(biāo)記輔助的回交 (MABC)等等。
[0012] 定義
[0013] 在下面的描述和實施例中使用了大量術(shù)語。為了提供對說明書和權(quán)利要求包括 這些術(shù)語給定的范圍的清楚而一致的理解,給出下面的定義。除非在此另有定義,此處所有 使用的技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常所理解的相同的意義。 所有出版物、專利應(yīng)用、專利和其他參考文獻(xiàn)的公開內(nèi)容以其整體作為參與引入此處。
[0014] 多態(tài)性:多態(tài)性指群體中核苷酸序列存在的兩個或多個變體。多態(tài)性可以包含一 個或多個堿基置換、插入、重復(fù)或缺失。多態(tài)性包括,例如,簡單的序列重復(fù)(SSR)和單核苷 酸多態(tài)性(SNP),其是一變異,發(fā)生于當(dāng)單核苷:腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C)或鳥 嘌呤(G) -改變時。變異必需在群體中通常出現(xiàn)至少1 %才被認(rèn)為是SNP。SNP構(gòu)成例如所 有人類遺傳變異的90%,并且在人類基因組中每100至300個堿基就有發(fā)生。每三個SNP 中的兩個是胸腺嘧啶(T)取代胞嘧啶(C)。例如人或植物的DNA序列中的變異可以影響它 們?nèi)绾螒?yīng)對疾病、細(xì)菌、病毒、化學(xué)制品、藥物等。
[0015] 核酸:本發(fā)明的核酸可以包括任何嘧啶和嘌呤堿基,優(yōu)選分別為胞嘧 啶、胸腺嘧啶、和尿嘧啶,及腺嘌呤和鳥嘌呤的多聚物或低聚體,(參見Albert L.Lehninger, Principles of Biochemistry, at793_800 (Worth Pub. 1982)其引入此處作 為參考。本發(fā)明設(shè)想任何脫氧核糖核苷酸、核糖核苷酸或肽核酸組成,及其任何化學(xué)變體, 例如這些堿基的甲基化、羥甲基化或糖基化形式等等。多聚物或低聚體在組合物中可以是 異源的或同源的,也可以分離自天然存在的來源或可以是人工或合成生產(chǎn)的。另外,核酸可 以是DNA或RNA或其混合物,并且可以在單鏈或雙鏈形式包括同源雙鏈、異源雙鏈和雜交形 式中永久地或瞬時性地存在。
[0016] 復(fù)雜度降低(complexity reduction):術(shù)語復(fù)雜度降低用于表示一種方法,其中 核酸樣品例如基因組DNA的復(fù)雜度通過樣品的子集的產(chǎn)生而降低。子集可以是對完整(即 復(fù)雜的)樣品有代表性的,并且優(yōu)選是可重現(xiàn)的子集。可重現(xiàn)的在上下文中的含義為,當(dāng)相 同樣品用相同方法在復(fù)雜度上降低時,即獲得相同的或至少可比的子集。用于復(fù)雜度降低 的方法可以是本領(lǐng)域已知的任何用于復(fù)雜度降低的方法。復(fù)雜度降低的方法的例子包括例 如 AFLP% (Keygene N. V.,the Netherlands ;參見例如 EP 0534858),Dong 所描述的方法 (見于例如 TO 03/012118, TO 00/24939),索引連接(Unrau et al.,vide infra)等。本發(fā) 明中所用的復(fù)雜度降低的方法的相同之處在它們是可重現(xiàn)的??芍噩F(xiàn)的意味著當(dāng)相同樣品 以相同方式在復(fù)雜度上降低時,就獲得了樣品的相同的子集,以避免更多的隨機(jī)的復(fù)雜度 降低,例如顯微解剖或使用代表選擇的組織中轉(zhuǎn)錄的基因組部分的mRNA(cDNA)的使用,因 為其可重現(xiàn)性依賴于組織、分離時間等的選擇。
[0017] 加標(biāo)簽:術(shù)語加標(biāo)簽指將標(biāo)簽添加到核酸樣品,以便能夠區(qū)別它與第二或更多的 核酸樣品。標(biāo)記能夠例如通過在復(fù)雜度降低過程中序列標(biāo)識子的添加或通過任何本領(lǐng)域已 知的方法進(jìn)行。這樣的序列標(biāo)識子可以是例如具有變化組限定了長度的唯一性地用于標(biāo)識 特定核酸樣品的獨特的堿基序列。其典型的例子為例如ZIP序列。用這樣的標(biāo)簽,樣品的 來源可以在進(jìn)一步的加工中被檢測。要是組合來源于不同核酸樣品的加工的產(chǎn)品,不同的 核酸樣品應(yīng)該用不同的標(biāo)簽鑒定。
[0018] 經(jīng)標(biāo)簽的文庫:術(shù)語經(jīng)標(biāo)簽的文庫指加標(biāo)簽的核酸的文庫。
[0019] 測序:術(shù)語測序指核酸樣品,例如DNA或RNA中核苷酸的列(堿基序列)的檢測。
[0020] 比對和對比:術(shù)語"比對"和"對比"含義為基于相同或相似的核苷酸的短的或長 的伸出的存在的兩個或多個核苷酸序列的比較。用于核苷酸序列的對比的幾種方法是本技 術(shù)領(lǐng)域已知的,如將在下面進(jìn)一步說明的一樣。
[0021] 檢測探針:術(shù)語"檢測探針"用于表示為檢測特定的核酸序列而設(shè)計的探針,特別 地,序列包含一個或多個多態(tài)性。
[0022] 高通量篩選:高通量篩選,通常簡稱為HTS,是用于科學(xué)實驗的方法,尤其是與生 物和化學(xué)領(lǐng)域相關(guān)。通過現(xiàn)代機(jī)器人技術(shù)和其他專業(yè)的實驗室硬件的組合,它允許研究人 員可以有效地同時篩選大量樣品。
[0023] 測試樣品核酸:術(shù)語"測試樣品核酸"用來指示用本發(fā)明的方法進(jìn)行多態(tài)性研究的 核酸樣品。
[0024] 限制性核酸內(nèi)切酶:限制性核酸內(nèi)切酶或限制性酶是在雙鏈DNA分子中識別特定 核酸序列(目標(biāo)位點)的酶,并且可以在DNA分子的兩條鏈的每個目標(biāo)位點處修整。
[0025] 限制性片段:用限制性核酸內(nèi)切酶消化產(chǎn)生的DNA分子被稱為限制性片段。任何 給定的基因組(或核酸,無論其來源)將通過特定的限制性核酸內(nèi)切酶消化為限制性片段 的離散集(discrete set)。由限制性核酸內(nèi)切酶消化產(chǎn)生的DNA片段可以進(jìn)一步用于多種 技術(shù)并且例如能夠通過凝膠電泳被檢測。
[0026] 凝膠電泳:為了檢測限制性片段,用于在尺寸基質(zhì)上分級雙鏈DNA分子的方法是 必須的。最常用的用于實現(xiàn)所述分級的方法是(毛細(xì)管)凝膠電泳。DNA片段在這種凝膠 中移動的速率取決于它們的分子量;因此,移動的距離隨片段長度增加而減少。通過凝膠電 泳分級的DNA片段可以通過染色過程,例如銀染色或溴化乙啶染色直接可視,如果包括在 圖譜中的片段的數(shù)量足夠小。備選地,進(jìn)一步的DNA片段的處理可以在片段中的摻入可檢 測的標(biāo)記,例如熒光或放射性標(biāo)記。
[0027] 連接:通過連接酶催化的酶反應(yīng)中,兩個雙鏈的DNA分子被共價連接在一起被稱 為連接。一般地,兩個DNA鏈被共價連接在一起,但是通過鏈的末端之一的化學(xué)或酶修飾, 兩個鏈之一的連接也可以被阻止。如果那樣的話,共價連接將只在兩個DNA鏈的一個中發(fā) 生。
[0028] 合成的寡核苷酸:具有優(yōu)選大約10 -大約50個堿基的單鏈DNA分子,其可以用化 學(xué)方法合成而被稱為合成的寡核苷酸。一般地,這些合成DNA分子被設(shè)計為具有獨特的或 期望的核苷酸序列,盡管合成具有有關(guān)的序列和其在核苷酸序列中的特定位點具有不同核 苷酸組成的分子家族是可能的。術(shù)語合成的寡核苷酸可以用于指具有設(shè)計的或期望的核苷 酸序列的DNA分子。
[0029] 接頭:具有有限量的堿基對的短的雙鏈DNA分子,例如,長度大約10到大約30個 堿基對,其被設(shè)計為它們可以連接到限制性片段的末端。接頭一般由兩個合成的寡核苷酸 組成,其具有部分地相互互補(bǔ)的核苷酸序列。當(dāng)在溶液中在適當(dāng)條件下混合兩種合成的寡 核苷酸時,它們可以相互退火形成雙鏈結(jié)構(gòu)。退火后,接頭分子的一端設(shè)計為與限制性片段 末端相兼容并且能夠被連接其上;接頭的另一端可以被設(shè)計為其不能被連接,但是這不是 必須的(雙連接的接頭)。
[0030] 接頭一連接的限制性片段:已經(jīng)被接頭加帽的限制性片段。
[0031] 引物:一般地,術(shù)語引物指能夠引導(dǎo)DNA的合成的DNA鏈。沒有引物,DNA聚合酶 不能從頭(de novo)合成DNA:其只能在反應(yīng)中延伸現(xiàn)有的DNA鏈,在反應(yīng)中互補(bǔ)鏈用作模 板以指導(dǎo)被組裝的核苷酸的排列。我們可以稱用在聚合酶鏈?zhǔn)椒磻?yīng)(PCR)中的合成的寡核 苷酸分子為引物。
[0032] DNA擴(kuò)增:一般,術(shù)語DNA擴(kuò)增可以被用于表示使用PCR的雙鏈DNA分子的體外合 成。應(yīng)當(dāng)注意,還存在其他擴(kuò)增方法并且它們可以被用于本發(fā)明,而不違反主旨。
[0033] 發(fā)明詳述
[0034] 本發(fā)明提供了用于鑒定一個或多個多態(tài)性的方法,所述的方法包括步驟:
[0035] a)提供第一目的核酸樣品;
[0036] b)對第一目的核酸樣品進(jìn)行復(fù)雜度降低,以提供第一核酸樣品的第一文庫;
[0037]c)連續(xù)地或同時地對第二或更多的目的核酸樣品進(jìn)行步驟a)和b),以獲得第二 或更多目的核酸樣品的第二或更多文庫;
[0038] d)測序第一文庫和第二或更多的文庫的至少部分;
[0039] e)比對在步驟d)中獲得的序列;
[0040] f)確定在步驟e)的比對中第一核酸樣品和第二或更多核酸樣品間的一個或多個 多態(tài)性;
[0041] g)用在步驟f)中確定的一個或多個多態(tài)性設(shè)計一個或多個檢測探針;
[0042] h)提供目的測試樣品核酸;
[0043] i)對目的測試樣品進(jìn)行步驟b)的復(fù)雜度降低以提供測試樣品核酸的測試文庫;
[0044] j)用在步驟g)中設(shè)計的一個或多個檢測探針對測試文庫進(jìn)行高通量篩選以鑒定 在步驟f)中確定的多態(tài)性的存在、缺失或數(shù)量;
[0045] 步驟a)中,提供第一目的核酸樣品。所述的第一目的核酸樣品優(yōu)選為復(fù)雜核酸樣 品例如總基因組DNA或cDNA文庫。優(yōu)選的,復(fù)雜核酸樣品為總基因組DNA。
[0046] 步驟b)中,對第一目的核酸樣品進(jìn)行復(fù)雜度降低以提供第一核酸樣品的第一文 庫。
[0047] 發(fā)明的一個【具體實施方式】,核酸樣品的復(fù)雜度降低的步驟包括催化性切割核酸樣 品為限制性片段,分離限制性片段并選擇特殊的限制性片段庫。任選的,經(jīng)選擇的片段然后 與包含PCR引物模版/結(jié)合序列的接頭序列相連接。
[0048] 復(fù)雜度降低的【具體實施方式】中,IIs型核酸內(nèi)切酶用于消化核酸樣品并且限制性 片段選擇性地連接于接頭序列。接頭序列可以在將被連接的突出端包含不同的核苷酸, 并且只有具有與突出端中核苷酸匹配設(shè)置的接頭連接到該片段并且隨后被擴(kuò)增。這一技 術(shù)在本領(lǐng)域被描述為'索引連接器'。尤其,這一原理的例子可以在Unrau P.and Deugau K.V. (1994) Gene 145:163-169 中看到。
[0049] 在另一【具體實施方式】中,復(fù)雜度降低的方法利用兩個具有不同的目標(biāo)位點和頻率 的限制性核酸內(nèi)切酶和兩個不同的接頭序列。
[0050] 發(fā)明的另一【具體實施方式】中,復(fù)雜度降低的步驟包括對樣品進(jìn)行任意引物PCR。
[0051 ] 在發(fā)明的另一個【具體實施方式】中,復(fù)雜度降低的步驟包括通過變性和重退火DNA 去除重復(fù)序列,然后去除雙鏈的雙鏈(double-stranded duplexes)。
[0052] 在發(fā)明的另一個【具體實施方式】中,復(fù)雜度降低的步驟包括核酸樣品與磁珠雜交, 磁珠連接于包含期望的序列的寡核苷酸探針。這一【具體實施方式】可以進(jìn)一步包括將雜交 的樣品暴露于單鏈DNA核酸酶以除去單鏈DNA,連接包含IIs類限制性酶的接頭序列以釋放 磁珠。這一【具體實施方式】可以包括或可以不包括分離的DNA序列的擴(kuò)增。進(jìn)一步,接頭序 列可以或可以不作為模版用于PCR寡核苷酸引物。在這個【具體實施方式】中,接頭序列可以 含有或可以不含有序列標(biāo)識子(identifier)或標(biāo)記。
[0053] 另一【具體實施方式】中,復(fù)雜度降低的方法包括將DNA樣品暴露于錯配結(jié)合蛋白 (mismatch binding protein)并且用3'-5'核酸外切酶消化樣品,然后用單鏈核酸酶消化 樣品。這一【具體實施方式】中可以包括或可以不包括結(jié)