一種轉(zhuǎn)錄激活子樣效應(yīng)因子功能蛋白設(shè)計、合成及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種“轉(zhuǎn)錄激活子樣效應(yīng)因子(Transcript1nActivator LikeEffectors, TALE) ”功能蛋白設(shè)計、合成以及上述功能蛋白的應(yīng)用,特別涉及上述功能蛋白。
【背景技術(shù)】
[0002]在后基因組時代,我們迫切需要高效的基因操縱、合成等新型的生物工程技術(shù)。比如,我們常常需要抑制或沉默一個基因的表達(dá)。傳統(tǒng)的基因敲除(Gene Knockout)技術(shù)依賴于細(xì)胞內(nèi)自然發(fā)生的同源重組,其效率非常低,通常為10_6級;RNAi技術(shù)雖然簡單易行,但是又很難獲得百分之百的抑制效果。除了抑制或沉默特定的基因,我們常常還需要針對特定基因,進(jìn)行某幾個堿基,甚至某一段序列的修改。同樣只依賴于同源重組技術(shù),很難獲得理想的效果。
[0003]TALE (Transcript1n Activator Like Effectors)首先是植物病原菌黃單胞菌(Xanthomonas)上發(fā)現(xiàn)的,特異性地結(jié)合到DNA,在該病原菌感染過程中對植物基因進(jìn)行調(diào)控。TALE蛋白可以穿過核膜進(jìn)入細(xì)胞核內(nèi)與特定的DNA結(jié)合域結(jié)合,調(diào)控植物基因組中與疾病和抵抗力相關(guān)基因的表達(dá)。簡單講,TALE是由4個或以上特異性識別DNA的串聯(lián)“蛋白模塊”和兩側(cè)的N-末端及C-末端序列組成,而每個“蛋白模塊”包含34個氨基酸,其中第12和13位氨基酸是靶向識別的關(guān)鍵位點,被稱作重復(fù)可變的雙氨基酸殘基(repeat variablediresidue,或者RVDs)。TALE識別DNA的機(jī)制在于DNA靶點上的一個核苷酸被一個重復(fù)序列上的RVD識別。
[0004]理論上,針對A、T、G、C任何一個堿基,都能找到與之特定結(jié)合的RVDs。因此,對任何一段DNA序列,我們可以方便的設(shè)計、合成出對應(yīng)蛋白模塊組成的TALE。需要指出的問題是,I)雖然針對A、T、G、C都可以設(shè)計出對應(yīng)的RVD,但是,它們之間的對應(yīng)關(guān)系還有待于進(jìn)一步優(yōu)化;2)設(shè)計合成的TALE能否高效地靶向結(jié)合基因組上的預(yù)期位置,還決定于很多其它因素;3)蛋白模塊的組成也有進(jìn)一步優(yōu)化的空間。
[0005]雖然TALE還有很多問題有待于深入研究加以解決,但是這并不妨礙它的應(yīng)用。一個最大的應(yīng)用前景是TALEN。TALEN是一個融合蛋白,由與某段DNA序列特異性識別TALE與能在DNA序列上產(chǎn)生雙鏈斷裂(double strand break, DSB)的內(nèi)切核酸酶(Nuclease)融合而成。TALEN是異源二聚體分子(即兩單位的TALE-Nuclease共同作用),能夠在兩個相隔較近的特異識別序列間切割DNA。
[0006]TALEN產(chǎn)生的DSB能夠通過以下兩種途徑進(jìn)行修復(fù):1)非同源末端連接(NonHomologous EndJoining7NHEJ):NHEJ是以自然修復(fù)機(jī)制,能被用來引入核苷酸缺失以便失活或敲除一個特異性的祀基因;2)同源重組(Homologous Recombinat1n,HR):DSB促進(jìn)同源重組,在一個DNA模版存在下,能夠產(chǎn)生特異性DNA序列改變,也能夠?qū)⑥D(zhuǎn)基因整合到DNA序列上。NHEJ途徑可以用于基因沉默,而HR可用于修改基因(Gene Editing),或者基因敲入(Gene Knock-1n)。無論是哪種途徑,TALEN產(chǎn)生的修復(fù)與單純依賴于同源重組相比,基因發(fā)生重組的效率大大提高,這為我們從事基因組訂制化(genome customizat1n)提供方便的技術(shù)手段,為開發(fā)出更簡易的新型基因組靶向修飾技術(shù)帶來了新希望。
[0007]TALE 另外一個大的應(yīng)用前景是 TALEA (transcript1n activator-like (TAL)effector activator)。TALEA是一個融合蛋白,將識別特異DNA序列的TALE與轉(zhuǎn)錄因子激活區(qū)域VP64(VP64Activat1n Domain)融合,可構(gòu)建成識別啟動子上特異DNA序列的轉(zhuǎn)錄激活因子TALEA。該融合蛋白將結(jié)合基因啟動子附近的特異DNA序列,并通過VP64激活區(qū)域與Polymerase II結(jié)合,從而激活基因的轉(zhuǎn)錄,提高了內(nèi)源目標(biāo)基因的表達(dá)。在實際操作中,需在目標(biāo)基因的啟動子上游選取靶序列(一般12-18個堿基),構(gòu)建TALE識別模塊。
[0008]TALE技術(shù)已經(jīng)開始在生命科學(xué)領(lǐng)域嶄露頭角。2011年,法國和美國兩個小組合作,利用TALEN技術(shù),在大鼠中敲除失活I(lǐng)gM功能,效率高達(dá)60 %。2011年,包括中國在內(nèi)的幾個小組,利用TALEN技術(shù),在斑馬魚中,敲除失活hey2等基因,效率也達(dá)到了 30 %以上。
[0009]TALE具有特殊的結(jié)構(gòu)特征,包括氮端(N端)分泌信號、中央的DNA結(jié)合域、和核定位序列(Nuclear localizat1n signal,NLS)和碳端(C端)的激活域。DNA結(jié)合域中,幾乎所有已經(jīng)發(fā)現(xiàn)的TALE蛋白都是有數(shù)量不同(12?30)、高度保守的重復(fù)單元組成,這些重復(fù)單元(一般含有33?35個氨基酸)中,除了第12和13位氨基酸不盡相同之外,其他組成部分都十分保守。其中第12和13位可變的氨基酸被稱為重復(fù)序列可變的雙氨基酸殘基RVD (repeat variable d1-residues)。TALE主要是通過重復(fù)單兀中的RVD識別DNA序列。目前已經(jīng)報道的RVD共有14種。NI (天冬酰胺和異亮氨酸)特異性識別A,HD(組氨酸和天冬氨酸)特異性識別C,NN(天冬酰胺和天冬酰胺)可以識別G和A,NK (天冬酰胺和賴氨酸)特異性識別G,NS (天冬酰胺和絲氨酸)可以識別G、A、C和T,NG (天冬酰胺和甘氨酸)特異性識別T,NH(天冬酰胺和組氨酸)特異性識別G,N* (天冬酰胺,第13位空缺)可以識別T、C、G和A,NP (天冬酰胺和脯氨酸)可以識別T、A和C,HN (組氨酸和天冬酰胺)可以識別G和A,NT (天冬酰胺和蘇氨酸)可以識別G和A,SN (絲氨酸和天冬酰胺)特異性識別G,SH (絲氨酸和組氨酸)特異性識別G。
[0010]現(xiàn)有技術(shù)存在的問題:有的TALE特異性不夠強(qiáng),有的TALE識別效率不夠高。因此,開發(fā)新的高效TALE序列(即新的RVD),就成為本領(lǐng)域迫切需要解決的一個技術(shù)問題。
【發(fā)明內(nèi)容】
[0011]本發(fā)明的目的正是為了解決上述技術(shù)問題,希望通過設(shè)計對TALE蛋白進(jìn)行一些改進(jìn),實現(xiàn)TALE蛋白的RVD序列上的優(yōu)化,以達(dá)到針對A、T、G、C任何一個堿基都有與之特定結(jié)合的RVD序列。
[0012]RV特異性識別A堿基;VI特異性識別C堿基;GD特異性識別C堿基;RW特異性識別C堿基;TG識別T堿基,亦可以較弱識別C和G堿基;CG可以識別G堿基,亦可以較弱識別T和C堿基;EC可以較強(qiáng)識別A、G和C堿基,亦可以較弱識別T堿基。
[0013]本發(fā)明采用的技術(shù)方案如下。
[0014]本發(fā)明中設(shè)計針對HHB基因序列設(shè)計合成TALEN,采用的實驗方法是國際上比較常用的突光素酶單鏈重組退火實驗(luciferase single-strand annealing
recombinat1n assay, SSA),和用來檢測內(nèi)源基因非同源重組檢測效率的方法-
SURVEYOR實驗。實驗原理如附圖1、2所示。
[0015]雖然對于識別特異性更好、識別效率更高的新TALE存在普遍的需求,現(xiàn)有技術(shù)中也存在測試TALE識別效率的方法(SSA、SURVEYOR,詳見下文),但是自從TALE被發(fā)現(xiàn)以來,新結(jié)構(gòu)的TALE卻很少見報導(dǎo),在諸多原因中,篩選工作量太大以至于超出忍受范圍,是最主要的原因之一。
[0016]總所周知,由于基本氨基酸即有20種,因此含有兩個氨基酸的RVD存在202即400種排列組合情況,篩選實驗量相當(dāng)大。本發(fā)明中利用質(zhì)粒在大腸桿菌中的質(zhì)粒不相容性這一性質(zhì),在大腸桿菌里大量的排列組合中篩選出有用的RVD。具體步驟如圖1所示。該方法首先建立篩選體系,然后按照20種基本氨基酸兩兩排列組合的400種情況建立TALEN庫,將TALEN庫中的TALEN與報告質(zhì)粒一起共轉(zhuǎn)化進(jìn)大腸桿菌,在其中挑選陽性克隆擴(kuò)增,最后與報告質(zhì)粒再次共轉(zhuǎn)化進(jìn)行驗證。我們設(shè)計的上述新方法使得篩選實驗的實驗量大大減小,從而使得從大量可能的組合中挑選出有效的新型TALE變得可行。
[0017]使用上述方法,我們從幾百種氨基酸組合中挑選出了有效的TALE,分別如下:“轉(zhuǎn)錄激活子樣效應(yīng)因子(TALE) ”功能蛋白中的重復(fù)可變雙氨基酸殘基RVD (repeat variabled1-residues)分別為精氨酸R和纈氨酸V、或者分別為纈氨酸V和異亮氨酸1、或者分別為甘氨酸G和天冬氨酸D、或者分別為精氨酸R和色氨酸W、或者分別為蘇氨酸T和甘氨酸G、或者分別為半胱氨酸C和甘氨酸G、或者分別為谷氨酸E和半胱氨酸C。并且,我們還確認(rèn)了上述新型TALE特異識別的堿基,可以將這些新型的TALE應(yīng)用于這些堿基的特異識別上,分別如下:
[0018]所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD(r印eatvariable d1-residues)分別為精氨酸R和纟顏氨酸V,用于對腺嘌呤(A)的特異性識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD (repeat variabled1-residues)分別為纟顏氨酸V和異亮氨酸I,用于對胞喃唳(C)的特異性識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD(repeat variabled1-residues)分別為甘氨酸G和天冬氨酸D,用于對胞嘧啶(C)的特異性識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD(repeat variabled1-residues)分別為精氨酸R和色氨酸W,用于對胞喃唳(C)的特異性識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD (repeat variable d1-residues)分別為蘇氨酸T和甘氨酸G,用于對胸腺嘧啶(T)的進(jìn)行較強(qiáng)識別,亦可以對胞嘧啶(C)和鳥嘌呤(G)堿基較弱識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD(repeat variable d1-residues)分別為半胱氨酸C和甘氨酸G,用于對鳥嘌呤(G)的進(jìn)行較強(qiáng)識別,亦可以對胸腺嘧啶(T)和胞嘧啶(C)進(jìn)行較弱識別;所述“轉(zhuǎn)錄激活子樣效應(yīng)因子”功能蛋白的重復(fù)可變雙氨基酸殘基RVD(repeat variable d1-residues)分別為谷氨酸E和半胱氨酸C,用于對腺嘌呤(A)、鳥嘌呤(G)和胞嘧啶(C)的進(jìn)行較強(qiáng)識別,亦可以對胸腺嘧啶(T)進(jìn)行較弱識別。
【附圖說明】
[0019]圖1篩選實驗流程示意圖
[0020]圖2 突光素酶單鏈重組退火實驗(luciferase single-strand annealingrecombinat1n assay, SSA)原理圖:首先,把突光素酶基因進(jìn)行改造。在突光素酶基因中間加入終止密碼子和靶基因序列;隨后通過分子生物學(xué)手段再緊接上另外一段熒光素酶基因序列,途中淺灰色區(qū)域的序列(約800bp)相同。當(dāng)TALEN有效果時,TALEN會在靶序列位置把雙鏈DNA剪切形成一個雙鏈的DNA斷裂,由于兩個淺灰色區(qū)域序列(即圖1中“終止密碼子”左側(cè)的一段基因和“靶序列”右側(cè)的一段基因)相同,此時會發(fā)生同源重組,就形成了一個有活性的熒光素酶報告基因,實驗中可以測量熒光素酶的表達(dá)來檢測TALEN的效果的強(qiáng)弱。
[0021]圖3SURVEY0R原理圖:首先用PCR的方法把目的基因片段從基因組上擴(kuò)增出來。其中包括發(fā)生缺失和沒有產(chǎn)生變化的序列。然后把擴(kuò)增出來的片段在體外進(jìn)行重新退火,此時發(fā)生缺失的片段和沒有產(chǎn)生變化的序列會退火形成有部分不配對的雙鏈結(jié)構(gòu)。接下來用SURVEYOR酶進(jìn)行酶切實驗,這種酶可以識別不配對的區(qū)域進(jìn)行酶切。我們可以通過跑膠檢測圖中a、b、c的含量來檢測發(fā)生缺失的效率,從而得出TALEN的作用效果。
[0022]圖4RVD-RV的SSA實驗結(jié)果
[0023]圖5RVD-VI的SSA實驗結(jié)果
[0024]圖6RVD-GD的SSA實驗結(jié)果
[0025]圖7RVD-RW的SSA實驗結(jié)果
[0026]圖8R