采用寡核苷酸介導(dǎo)的基因修復(fù)提高靶向基因修飾的效率的方法和組合物的制作方法
【專利說(shuō)明】采用寡核苷酸介導(dǎo)的基因修復(fù)提高靶向基因修飾的效率的 方法和組合物
[0001] 本申請(qǐng)要求2013年3月15日提交的美國(guó)臨時(shí)專利申請(qǐng)?zhí)?1/801,320的優(yōu)先權(quán), 所述專利申請(qǐng)?zhí)卮艘砸玫姆绞讲⑷搿?發(fā)明領(lǐng)域
[0002] 本發(fā)明總體上涉及用于改進(jìn)對(duì)基因組或其他核苷酸序列中的特定位置的修飾的 靶向效率的新穎方法。另外,本發(fā)明涉及已經(jīng)通過(guò)本文所公開(kāi)的方法修飾、突變或標(biāo)記的靶 DNA。本發(fā)明還涉及已經(jīng)通過(guò)本發(fā)明的方法修飾的細(xì)胞、組織和生物體。
[0003] 發(fā)明背景
[0004] DNA雙鏈斷裂(DSB)增強(qiáng)在活細(xì)胞中的同源重組并且已經(jīng)用于通過(guò)使用工程化核 酸內(nèi)切酶靶向基因組編輯。工程化核酸酶的關(guān)鍵組分是DNA識(shí)別結(jié)構(gòu)域,所述結(jié)構(gòu)域能夠 將核酸酶引導(dǎo)至基因組的靶位點(diǎn)以用于基因組DNA雙鏈斷裂。由于非同源末端連接(NHEJ) 所致的細(xì)胞DSB修復(fù)導(dǎo)致靶基因的誘變?nèi)笔?插入?;蛘?,DSB可刺激內(nèi)源性靶基因座與 具有所需遺傳信息的外源引入的同源DNA片段之間的同源重組,這是被稱為基因靶向的一 個(gè)過(guò)程。
[0005] 涉及基因或基因組編輯的最有希望的方法是定制設(shè)計(jì)的鋅指核酸酶(ZFN),其是 由鋅指蛋白的DNA結(jié)合結(jié)構(gòu)域和FokI核酸酶結(jié)構(gòu)域(FN)組成的一種類型的雜交酶。ZFN 技術(shù)主要涉及使用來(lái)源于鋅指(ZF)蛋白的DNA結(jié)合結(jié)構(gòu)域與核酸內(nèi)切酶FokI的非特異性 裂解結(jié)構(gòu)域的雜合蛋白。ZF可被組裝為進(jìn)行定制設(shè)計(jì)以在于預(yù)先選定位點(diǎn)結(jié)合之后識(shí)別選 定DNA序列的模塊,DSB通過(guò)FokI的裂解結(jié)構(gòu)域的作用產(chǎn)生。
[0006] 首先從細(xì)菌海床黃桿菌分離FokI核酸內(nèi)切酶。這種IIS型核酸酶由兩個(gè)獨(dú)立的 結(jié)構(gòu)域組成,N末端DNA結(jié)合結(jié)構(gòu)域和C末端DNA裂解結(jié)構(gòu)域。DNA結(jié)合結(jié)構(gòu)域的功能是用 于識(shí)別非回文序列5' -GGATG-375' -CATCC-3',而催化結(jié)構(gòu)域在所述識(shí)別位點(diǎn)下游9和13個(gè) 核苷酸的固定距離處非特異性地裂解雙鏈DNA。FokI作為無(wú)活性單體存在于溶液中,并且 在結(jié)合其靶DNA且在一些二價(jià)金屬的存在下變成活性二聚體。作為功能性復(fù)合物,F(xiàn)okI的 各自結(jié)合雙鏈DNA分子的兩個(gè)分子通過(guò)DNA催化結(jié)構(gòu)域二聚化以用于有效裂解DNA雙鏈。
[0007] 以類似的方式,還可通過(guò)使用其他蛋白質(zhì)/結(jié)構(gòu)域制備核酸酶,如果所述蛋白質(zhì)/ 結(jié)構(gòu)域能夠特異性DNA識(shí)別。TAL效應(yīng)子屬于細(xì)菌蛋白的一大群體,其存在于黃單胞菌屬的 不同菌株中并且通過(guò)III型分泌系統(tǒng)(所謂的III型效應(yīng)子)易位至宿主細(xì)胞中。一旦在宿 主細(xì)胞中,一些TAL效應(yīng)子已被發(fā)現(xiàn)針對(duì)菌株毒力(引起疾病的能力)或無(wú)毒力(觸發(fā)宿 主抗性反應(yīng)的能力)轉(zhuǎn)錄活化其對(duì)應(yīng)宿主靶基因,這取決于宿主遺傳背景。每個(gè)效應(yīng)子包 含為真核轉(zhuǎn)錄活化因子的特征的功能性核定位基序和有效轉(zhuǎn)錄活化結(jié)構(gòu)域。并且每個(gè)效應(yīng) 子還含有由34個(gè)氨基酸的不同數(shù)目的重復(fù)單位組成的中心重復(fù)區(qū)域,且作為DNA結(jié)合結(jié)構(gòu) 域的重復(fù)區(qū)域決定每個(gè)效應(yīng)子的生物學(xué)特異性。
[0008] Zhang等,Plant Physiol. 161:20-27, 2013(其以引用的方式整體并入本文)公 開(kāi)了使用TALEN(轉(zhuǎn)錄活化因子樣效應(yīng)子核酸酶),其是基于TAL效應(yīng)子樣DNA結(jié)合結(jié)構(gòu)域 與FokI的催化結(jié)構(gòu)域的組合的工程化的核酸內(nèi)切酶。通過(guò)工程化DNA結(jié)合結(jié)構(gòu)域,這些 TALEN據(jù)報(bào)道可容易地設(shè)計(jì)來(lái)識(shí)別特異性DNA結(jié)合結(jié)構(gòu)域。使用煙草原生質(zhì)體作為模型系 統(tǒng),使用包含連接至TALEN識(shí)別位點(diǎn)的黃色熒光蛋白編碼序列的單鏈退火多核苷酸報(bào)道基 因評(píng)定TALEN活性。將此報(bào)道基因系統(tǒng)遞送至原生質(zhì)體,并且可通過(guò)功能性YFP的表達(dá)來(lái) 測(cè)量裂解和修復(fù)事件。
[0009] 發(fā)明概述
[0010] 在第一方面,本發(fā)明涉及用于將基因修復(fù)寡核堿基(GRON)介導(dǎo)的突變引入至植 物細(xì)胞中的靶脫氧核糖核酸(DNA)序列中的方法。所述方法尤其包括在將GRON遞送至植 物細(xì)胞中之前和/或同時(shí)在增加一種或多種細(xì)胞DNA修復(fù)過(guò)程的條件下培養(yǎng)植物細(xì)胞。
[0011] 在某些實(shí)施方案中,增加一種或多種細(xì)胞DNA修復(fù)過(guò)程的條件包括以下中的一種 或多種:將一個(gè)或多個(gè)位點(diǎn)引入至GRON中或至植物細(xì)胞DNA中,所述位點(diǎn)是用于堿基切除 修復(fù)的靶標(biāo);將一個(gè)或多個(gè)位點(diǎn)引入至GRON中或至植物細(xì)胞DNA中,所述位點(diǎn)是用于非同 源末端連接的靶標(biāo);將一個(gè)或多個(gè)位點(diǎn)引入至GRON中或至植物細(xì)胞DNA中,所述位點(diǎn)是用 于微同源介導(dǎo)的末端連接的靶標(biāo);將一個(gè)或多個(gè)位點(diǎn)引入至GRON中或至植物細(xì)胞DNA中, 所述位點(diǎn)是用于同源重組的靶標(biāo);以及將一個(gè)或多個(gè)位點(diǎn)引入至GRON中或至植物細(xì)胞DNA 中,所述位點(diǎn)是用于推動(dòng)修復(fù)的靶標(biāo)。
[0012] 在某些實(shí)施方案中,靶脫氧核糖核酸(DNA)序列是在植物細(xì)胞基因組內(nèi)。植物細(xì) 胞可以是非轉(zhuǎn)基因或轉(zhuǎn)基因的,并且靶DNA序列可以是所述植物細(xì)胞的轉(zhuǎn)基因或內(nèi)源基 因。
[0013] 在某些實(shí)施方案中,增加一種或多種細(xì)胞DNA修復(fù)過(guò)程的條件包括引入一種或多 種化合物,所述化合物在將GRON遞送至植物細(xì)胞中之前或同時(shí)將單或雙DNA鏈斷裂引入至 植物細(xì)胞中。示例性化合物在下文描述。
[0014] 本文所述的方法和組合物適用于一般植物。僅作為舉例,植物物種可選自由以下 組成的組:芥花、向日葵、玉米、煙草、甜菜、棉花、玉米、小麥、大麥、水稻、苜蓿(alfafa)、大 麥、高粱、西紅柿、芒果、桃子、蘋果、梨、草莓、香蕉、甜瓜、土豆、胡蘿卜、萵苣、洋蔥、大豆、 大豆屬、甘蔗、豌豆、鷹嘴豆、紫花豌豆(field bean)、蠶豆、扁豆、蘿卜、蕪菁甘藍(lán)、球芽甘 藍(lán)(brussel sprouts)、羽扇豆、花椰菜、羽衣甘藍(lán)、菜豆、楊樹(shù)、松樹(shù)、桉樹(shù)、葡萄、柑橘、黑 小麥、苜蓿、黑麥、燕麥、草皮和牧草、亞麻、油菜、芥菜、黃瓜、牽?;ā⑾阒?、辣椒、茄子、萬(wàn)壽 菊、蓮花、卷心菜、菊花、康乃馨、郁金香、鳶尾以及百合。這些還可全部或部分地適用于所有 其他生物系統(tǒng),包括但不限于細(xì)菌、真菌和哺乳動(dòng)物細(xì)胞以及甚至其細(xì)胞器(例如,線粒體 和葉綠體)。
[0015] 在某些實(shí)施方案中,所述方法還包括從植物細(xì)胞再生具有通過(guò)GRON引入的突變 的植物,并且可包括從所述植物采集種子。
[0016] 在相關(guān)方面,本發(fā)明涉及包含根據(jù)本文所述的方法通過(guò)GRON引入的基因組修飾 的植物細(xì)胞,包含根據(jù)本文所述的方法通過(guò)GRON引入的基因組修飾的植物,或包含根據(jù)本 文所述的方法通過(guò)GRON引入的基因組修飾的種子。
[0017] 本發(fā)明的其他實(shí)施方案將是從以下詳述、示例性實(shí)施方案和權(quán)利要求書(shū)顯而易見(jiàn) 的。
[0018] 發(fā)明詳述
[0019] 定義
[0020] 根據(jù)以下定義來(lái)理解本發(fā)明。
[0021] 寡核堿基是核堿基的聚合物,所述聚合物可通過(guò)沃森-克里克(Watson-Crick)堿 基配對(duì)與具有互補(bǔ)序列的DNA雜交。
[0022] 核堿基包含堿基,其是嘌呤、嘧啶或其衍生物或類似物。核堿基包括肽核堿基、肽 核酸的亞基和嗎啉核堿基以及核苷和核苷酸。核苷是含有戊呋喃糖基部分的核堿基,例如, 任選取代的核糖核苷或2' -脫氧核糖核苷。核苷可通過(guò)一些鍵聯(lián)部分中的一種連接,所述 連接部分可能含磷或不含磷。通過(guò)未取代的磷酸二酯鍵連接的核苷被稱為核苷酸。
[0023] 寡核堿基鏈具有單個(gè)5'和3'端,其是聚合物的最終核堿基。特殊的寡核堿基鏈 可含有所有類型的核堿基。寡核堿基化合物是含有一個(gè)或多個(gè)為互補(bǔ)的且通過(guò)沃森-克里 克堿基配對(duì)雜交的寡核堿基鏈的化合物。核堿基是脫氧核糖型或核糖型。核糖型核堿基是 含有戊咲喃糖基的核喊基,其中2'碳是被羥基、烷氧基或鹵素取代的亞甲基。脫氧核糖型 核堿基是不同于核糖型核堿基的核堿基且包括所有不含有戊呋喃糖基部分的核堿基。
[0024] 寡核堿基鏈一般包括寡核堿基鏈和寡核堿基鏈的區(qū)段或區(qū)域兩者。寡核堿基鏈具 有3'端和5'端。當(dāng)寡核堿基鏈與一條鏈同延時(shí),所述鏈的3'和5'端也是所述鏈的3'和 5,末端。
[0025] 根據(jù)本發(fā)明,植物器官包括但不限于葉、莖、根、葉芽、花芽、分生組織、胚芽、子葉、 胚乳、萼片、花瓣、雌蕊、心皮、雄蕊、花藥、小孢子、花粉、花粉管、胚珠、子房和果實(shí)或從其取 得的切片、薄片或盤。植物組織包括但不限于愈傷組織、基本組織、維管組織、貯藏組織、分 生組織、葉片組織、莖組織、根組織、冠癭組織、植物腫瘤組織以及再生組織。植物細(xì)胞包括 但不限于具有細(xì)胞壁的分離的細(xì)胞、其各種大小的聚集體以及原生質(zhì)體。
[0026] 當(dāng)如下所述針對(duì)最大對(duì)應(yīng)性進(jìn)行比對(duì)時(shí),如果兩個(gè)多核苷酸或多肽序列中相應(yīng)地 核苷酸或氨基酸殘基的序列相同時(shí),則兩個(gè)多核苷酸或多肽是相同的。在兩個(gè)或更多個(gè)核 酸或多肽序列的背景下,術(shù)語(yǔ)"相同的"或"同一性百分比"是指當(dāng)在比較窗上針對(duì)最大對(duì) 應(yīng)性比較和比對(duì)時(shí),如使用以下序列比較算法中的一種或通過(guò)人工比對(duì)和目視檢查所測(cè) 量,兩個(gè)或更多個(gè)序列或子序列相同或具有指定百分比的相同氨基酸殘基或核苷酸。對(duì)于 序列在保守取代方面不同的多肽來(lái)說(shuō),序列同一性百分比可向上調(diào)整以校正取代的保守性 質(zhì)。用于進(jìn)行這種調(diào)整的手段是本領(lǐng)域的技術(shù)人員熟知的。通常這涉及將保守性取代評(píng)分 為部分而不是完全錯(cuò)配,從而增加序列同一性百分比因此,例如,在相同氨基酸被給予得分 1并且非保守性取代被給予得分零的情況下,保守性取代被給與零與1之間的得分。根據(jù)例 如 Meyers&Miller, Computer Applic. Biol. Sci. 4:11-17 (1988)的算法,例如如在程序 PC/ GENEQntelligenetics, Mountain View, Calif. ,USA)中所實(shí)施來(lái)計(jì)算保守性取代的得分。
[0027] 在兩個(gè)核酸或多肽的背景下,術(shù)語(yǔ)"基本上相同的"和"同一性百分比"是指當(dāng)在 比較窗上針對(duì)最大對(duì)應(yīng)性進(jìn)行比對(duì)時(shí),如使用以下序列比較算法中的一種或通過(guò)人工比對(duì) 和目視檢查所測(cè)量,具有至少50 %、有利地60 %、優(yōu)選地70 %、更優(yōu)選地80 %且最優(yōu)先地 90% -95%核苷酸或氨基酸殘基同一性的序列或子序列。當(dāng)測(cè)試序列與參考序列具有實(shí)質(zhì) 同一性時(shí),此定義還指測(cè)試序列的具有實(shí)質(zhì)序列或子序列互補(bǔ)性的互補(bǔ)序列。
[0028] 本領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到如果兩個(gè)多肽是免疫上類似的,則兩個(gè)多肽也可以是 "基本上相同的"。因此,當(dāng)兩個(gè)多肽的一級(jí)結(jié)構(gòu)展示顯著變異時(shí),總體蛋白質(zhì)結(jié)構(gòu)可以是類 似的。因此,測(cè)量?jī)蓚€(gè)多肽是否是基本上相同的方法涉及測(cè)量單克隆或多克隆抗體與每個(gè) 多肽的結(jié)合。如果對(duì)于第一多肽具有特異性的抗體以針對(duì)第一多肽的親和力的至少三分之 一的親和力結(jié)合第二多肽,則兩個(gè)多肽是基本上相同的。對(duì)于序列比較來(lái)說(shuō),通常一個(gè)序列 充當(dāng)與測(cè)試序列進(jìn)行比較的參考序列。當(dāng)使用序列比較算法時(shí),將測(cè)試序列和參照序列輸 入計(jì)算機(jī)中,指定子序列坐標(biāo)(如果需要),并且指定序列算法程序參數(shù)。然后,序列比較算 法基于指定的程序參數(shù)計(jì)算測(cè)試序列相對(duì)于參考序列的序列同一性百分比。
[0029] 可例如通過(guò)以下方法來(lái)進(jìn)行序列的最佳比對(duì)以供比較,例如Smith和 Waterman, 0.4dv. Appl. Math. 2:482(1 98 I)的局部同源性算法;Needleman 和 Wunsch, J. Mol. Biol. 48:443 (1970)的同