本發(fā)明屬于基因工程技術領域,涉及一套基于人工核酸酶介導的快速、高效、可視化細胞修復效率報告系統(tǒng)的構建方法,具體涉及應用基因工程技術在報告載體水平模擬真核細胞內特定基因位點的損傷,對不同修復通路的修復效率進行可視化的粗略定量和流式分析精確定量的方法。
背景技術:
基因組編輯技術是針對基因組進行基因修飾和改造的一種生物工程技術,該技術是人們認識、鑒定基因功能的“金鑰匙”。早期的轉基因技術主要是利用隨機插入的方式將外源基因整合到基因組中,比較常用且高效的手段是轉座子系統(tǒng)介導的轉座效應和逆轉錄病毒介導的整合效應。但是利用以上兩種效應介導的基因敲入一般具有一定的隨機性、多拷貝性和細胞毒性,有著潛在的安全問題,因此在基因治療和轉基因育種等領域的研究應用中受到了很大的限制?;蚪M靶向編輯技術則可以針對基因組某一特定位點進行靶向編輯和修飾操作,避免了隨機性和多拷貝性,降低了細胞毒性。傳統(tǒng)的基因組靶向編輯技術通過打靶載體,利用細胞內自發(fā)的同源重組(Homologous recombination,HR)效應實現(xiàn)目的基因的定點插入。打靶載體需要含有兩段很長的同源臂(基因組中靶基因的序列)、篩選標記基因以及需要引入的外源基因序列。在基因組DNA復制過程中,打靶載體的同源臂在自發(fā)同源重組的機制下能整合至基因組相應位點,同時將外源基因插入靶基因位點。最后通過篩選標記基因篩選獲得目的基因插入的陽性細胞克隆。但是,對于高等動物而言,這種自發(fā)重組的效率非常低(10-6~10-7左右),且單純地延長打靶載體中同源臂序列的長度并不能有效的提高其重組效率。因此,這種依靠自發(fā)重組所介導的基因組靶向編輯技術由于效率低、經費時間投入大和實驗技術要求高等缺點,已經難以滿足應用的需求;特異性和高效性一度成為該技術中的兩個重點和難點。
人工核酸內切酶(Engineered endonuclease,EEN)的出現(xiàn),為基因組靶向編輯技術帶了新的革命。新型的基因組靶向編輯技術主要是通過人工核酸內切酶特異性地在基因組靶序列處引入雙鏈斷裂(Double-stranded breaks,DSBs),利用含有同源臂的供體DNA介導同源重組修復機制,進而實現(xiàn)基因的插入、刪除和點編輯。人工核酸內切酶可以根據(jù)特異性靶序列DNA進行專門的改造和定制,大大提高了基因組靶向編輯的特異性;同時,在基因組DNA中引入雙鏈斷裂后,基因組靶向編輯的效率也得到了飛躍性的提高。目前,應用于基因組靶向編輯技術中的人工核酸內切酶主要包括3種:鋅指核酸酶技術(Zinc finger nucleases,ZFNs)、轉錄激活樣效應因子核酸酶(Transcription activator-like effector nucleases,TALENs)和CRISPR/Cas9核酸酶技術(Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)/CRISPR-associated(Cas))。
自然情況下細胞基因組中發(fā)生DSBs后主要通過以下3種機制進行修復:(1)非同源末端連接(Non-Homologous End Joining,NHEJ)是細胞中DSBs的主要修復方式,斷裂DNA分子兩端可以直接通過非特異性的末端連接實現(xiàn)修復,同時可能會引入少量核苷酸堿基的插入或缺失(Insertions and deletions,Indels),進而可能導致移碼并引起基因破壞甚至是基因敲除;(2)單鏈退火(Single Strand Annealing,SSA),這種機制是同源重組的一種特殊情況,即在DSBs兩邊有一定的正向重復序列(Direct Repeat sequences,DRs)的情況下,斷裂DNA分子直接通過SSA機制修復,在刪除一個DR及中間包含的序列的情況下實現(xiàn)基因修復;(3)同源重組(HR),即斷裂DNA分子在有與之同源的序列存在的情況下,可以通過同源重組機制來修復,所謂的同源的序列可以是姐妹染色單體、同源染色體或者是包含同源臂的外源供體DNA,在哺乳動物細胞中發(fā)生DSBs的同源重組效率要比沒有DSBs時的自發(fā)重組提高1000~50000倍。
綜上所述,利用基因編輯技術可進行動物育種乃至將來應用于人類的基因治療,簡單來說就是在真核生物的基因組中的某位點引入DSB并提供相應的供體模版,讓其按照人們的意愿進行精確編輯,從而實現(xiàn)快速動物育種或者基因治療的目的。
可以看出HR方式的高效修復直接影響目的位點的精確編輯,而NHEJ這種優(yōu)勢修復方式也會伴隨HR修復方式同時存在且與HR互為競爭。提高HR的效率、降低NHEJ的效率是基因編輯研究工作的重中之重;同時,進行基因編輯相關工作的科研人員也迫切的希望知道當人為的針對真核細胞基因組中某一特定的靶位點引入人工核酸酶及相應供體后,該位點發(fā)生NHEJ和HR的效率分別是多少?當斷裂位點的兩段含有合適的重復片段序列時,同時發(fā)生SSA的效率又究竟是多少?為了快速的對真核細胞基因組中斷裂位點處發(fā)生的不同種修復方式的效率進行量化,需要構建報告細胞系或報告載體系統(tǒng)對修復效率進行量化。報告細胞系是將報告基因直接整合到細胞的基因組中,當核酸酶作用于靶序列時,可以通過報告基因的表達來反映修復效率的高低。報告細胞系的優(yōu)點是靶序列整合到基因組中,和靶細胞基因組的情況類似,效率接近且穩(wěn)定。但是由于哺乳動物基因組不易操作,將含靶序列的報告基因整合入基因組難度大,費時費力,并且一種細胞系只能檢測一個或幾個核酸酶的活性,有一定的局限性。而報告載體系統(tǒng)是游離于細胞染色體之外,將核酸酶表達系統(tǒng)、供體模版和報告載體系統(tǒng)共轉染至細胞中,通過載體系統(tǒng)中的報告基因的表達來間接的反映真核細胞中各通路的修復效率。報告載體的靶序列雖然不能完全等同于基因組中靶序列的環(huán)境,但也有其自身明顯的優(yōu)勢,例如構建方便快捷,靶序列易于改變,不需要整合入基因組,并且通過熒光標記或者藥物篩選標記對陽性細胞進行分選實現(xiàn)對目的細胞的收集。因此,報告載體相對于報告細胞系有更為廣泛的應用價值。
現(xiàn)在還沒有發(fā)現(xiàn)將同種報告基因利用其不同修復方式整合到一個載體系統(tǒng)中同時反映真核細胞中特定位點各修復通路效率的工具,已知的報告載體系統(tǒng)大都只能獨立間接反映真核細胞中某一種通路的修復效率。
技術實現(xiàn)要素:
針對上述問題,基于非整合型報告載體系統(tǒng)的優(yōu)勢及科研需求,本發(fā)明提供了一種快速、高效的基于人工核酸酶的可視化細胞修復效率報告系統(tǒng)及其建立方法。
為達到上述目的,本發(fā)明采用了以下技術方案:
基于人工核酸酶的可視化細胞修復效率報告系統(tǒng),包括CRISPR/Cas9表達載體以及雙熒光報告系統(tǒng)表達載體;所述CRISPR/Cas9表達載體包括用于表達對目的基因靶位點具有剪切活性的Cas9核酸酶的序列;雙熒光報告系統(tǒng)表達載體包括順次設置的以下元件:插入有目的基因靶位點的報告基因I表達盒、完整的報告基因II表達盒以及報告基因I的截短序列,其中,報告基因I、II具有不同的檢測信號,目的基因靶位點的插入位置位于報告基因I的閱讀框內并導致該閱讀框打斷,所述報告基因I表達盒與報告基因I的截短序列的轉錄方向相同,所述報告基因I表達盒與報告基因II表達盒的轉錄方向相反,報告基因I的截短序列是僅作為修復模板的自轉錄起始點截短的報告基因I閱讀框片段。
所述CRISPR/Cas9表達載體包括順次設置的抗性篩選基因表達盒、目的基因靶位點sgRNA序列表達盒和hSpCas9基因表達盒。
所述報告基因I選自熒光蛋白報告基因GFP,所述報告基因II選自熒光蛋白報告基因DsRed。
所述報告基因I表達盒包括順次設置的EF1a啟動子、位于目的基因靶位點插入位置之前的熒光蛋白報告基因GFP閱讀框部分GFP-L、目標基因靶位點、位于目的基因靶位點插入位置之后的熒光蛋白報告基因GFP閱讀框部分GFP-R以及polyA;所述報告基因II表達盒包括順次設置的CMV啟動子、熒光蛋白報告基因DsRed閱讀框以及β-globinpolyA。
所述雙熒光報告系統(tǒng)表達載體還包括抗性篩選基因表達盒。
所述報告基因I的截短序列為缺少起始密碼子的熒光蛋白報告基因GFP閱讀框。
所述細胞為真核細胞,例如哺乳動物細胞。
基于人工核酸酶的可視化細胞修復效率報告系統(tǒng)的建立方法,包括以下步驟:
1)確定目的基因靶位點,根據(jù)目的基因靶位點構建CRISPR/Cas9表達載體;
2)將報告基因I的截短序列、報告基因II表達盒以及插入有目的基因靶位點的報告基因I表達盒順次插入同一骨架載體,其中,報告基因I、II具有不同的檢測信號,目的基因靶位點的插入位置位于報告基因I的閱讀框內并導致該閱讀框打斷,所述報告基因I表達盒與報告基因I的截短序列的轉錄方向相同,所述報告基因I表達盒與報告基因II表達盒的轉錄方向相反,報告基因I的截短序列是僅作為修復模板的自轉錄起始點截短的報告基因I閱讀框片段。
所述步驟1)具體包括以下步驟:
1.1)根據(jù)目的基因靶位點通過設計的退火引物擬合得到目的基因靶位點序列片段;
1.2)將所述靶位點序列片段插入pX330-U6-Chimeric_BB-CBh-hSpCas9載體的BbsI多克隆位點,獲得中間載體pX330-U6-VEGFA.sgRNA-CBh-SpCas9;
1.3)從中間載體pX330-U6-VEGFA.sgRNA-CBh-SpCas9中克隆剪切目的基因靶位點所需的sgRNA和Cas9表達盒片段,將該片段插入pLL3.7載體的多克隆位點,得到基于pLL3.7骨架的CRISPR/Cas9表達載體。
所述步驟2)具體包括以下步驟:
2.1)將不含PolyA尾的熒光蛋白報告基因DsRed表達盒插入pXL-BAC II載體的多克隆位點,獲得中間載體pXL-DsRed box without polyA,將β-globin polyA片段插入中間載體pXL-DsRed box without polyA,獲得包含完整表達盒的熒光蛋白報告基因DsRed表達載體pXL-DsRed;
2.2)構建閱讀框中插入有目的基因靶位點的熒光蛋白報告基因GFP表達盒片段,將該片段插入pXL-DsRed中的多克隆位點,獲得中間載體pXL-EF1a.GFP(VEGFA target)-DsRed;
2.3)將熒光蛋白報告基因GFP的截短序列插入到pXL-EF1a.GFP(VEGFA target)-DsRed中的多克隆位點,獲得雙熒光報告系統(tǒng)表達載體。
本發(fā)明的有益效果體現(xiàn)在:
本發(fā)明所述基于人工核酸酶的可視化細胞修復效率報告系統(tǒng)利用并模擬真核細胞內的不同修復機制對報告系統(tǒng)中的相應的熒光報告基因表達盒進行修復,可通過流式細胞儀對雙熒光報告系統(tǒng)表達載體兩種報告基因的表達進行量化(例如GFP熒光蛋白和DsRed熒光蛋白的發(fā)光數(shù)量),在載體水平一次性報告檢測真核細胞中某一確定基因位點HR、SSA和NHEJ的修復效率,該系統(tǒng)還具有應用的延伸性,例如在工作需要的基礎上,可以應用帶有分選功能的流式細胞儀對陽性細胞進行分選從而獲得陽性細胞。
附圖說明
圖1為CRISPR/Cas9表達載體pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9質粒圖譜;
圖2為ScRad52表達載體pLL3.7-ScRad52質粒圖譜;
圖3為雙熒光報告系統(tǒng)表達載體pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP的元件序列結構示意圖;
圖4為雙熒光報告系統(tǒng)表達載體pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP質粒圖譜;
圖5為可視化報告系統(tǒng)在HEK 293T細胞中的修復、工作示意圖;
圖6為VEGFA位點實驗組及對照組可視化報告系統(tǒng)的檢測熒光效果圖;
圖7為可視化報告系統(tǒng)的流式結果圖;
圖8為真核細胞中報告載體水平VEGFA位點修復效率結果圖;
圖9為篩選出的真核細胞基因組中VEGFA位點的測序結果圖。
具體實施方式
為使本發(fā)明的技術方案便于理解,以下結合利用酵母源的Rad52蛋白(簡稱ScRad52)和CRISPR-Cas9編輯人的VEGFA基因,檢測ScRad52提高CRISPR-Cas9打靶后的HR的效率的實施例,對本發(fā)明作進一步的詳細說明。
1.靶位點選擇
基于CRISPR/Cas9系統(tǒng)打靶位點的特點,在基因組中尋找含有PAM(NGG/NGGNG)的靶位點。再經過CRISPR Dsign網站(http://crispr.mit.edu/)的篩選,選擇出以下位點作為VEGFA靶位點(VEGFA target):CTCGGCCACCACAGGGAAGC(參見SEQ.ID.NO.1,左起為5`端)
2.CRISPR/Cas9表達載體(pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9)的構建
CRISPR/Cas9表達載體為本實驗室改造構建,即將可以表達步驟1中選擇的VEGFA靶位點的sgRNA的序列和釀膿鏈球菌Cas9序列(SpCas9)串聯(lián)插入到骨架載體pLL3.7(Addgene,Plasmid#11795)中,如圖1所示。從圖1可以看出,構建的CRISPR/Cas9表達載體包括的元件依次為AmpR啟動子、Ampicillin抗性基因、U6啟動子、VEGFA靶位點序列(靶位點只有20個bp,VEGFA靶位點加后面的gRNA序列表達后才是VEGFA.sgRNA序列)、CBh啟動子、hSpCas9基因序列和BGH polyA。載體的具體構建方法如下:
2.1根據(jù)步驟1確定的VEGFA靶位點設計擬合VEGFA靶位點片段所需引物,分別命名為VEGFA target.F和VEGFA target.R,引物設計如表1:
表1:VEGFA靶位點片段引物設計表
2.2PCR獲得所需的VEGFA靶位點片段
Annealing反應體系如表2所述,反應條件為:95℃5min,之后降到室溫待用。獲得兩端含有BbsI懸臂的VEGFA靶位點片段
表2:VEGFA靶位點片段Annealing體系(北京全式金生物技術,貨號AP111)
2.3中間載體pX330-U6-VEGFA.sgRNA-CBh-SpCas9的構建
用BbsI酶切pX330-U6-Chimeric_BB-CBh-hSpCas9載體(Addgene,Plasmid#42230)作為骨架,酶切體系見表3,膠回收目的片段(8484bp)。將骨架和步驟2.2獲得的VEGFA靶位點片段(Annealing產物)連接(連入骨架的BbsI位點),連接體系見表4。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。獲得中間載體pX330-U6-VEGFA.sgRNA-CBh-SpCas9。
表3:pX330-U6-Chimeric_BB-CBh-hSpCas9酶切體系(New England Biolabs,#R0539S)
表4:pX330-U6-VEGFA.sgRNA-CBh-SpCas9連接體系(New England Biolabs,#R0539S)
2.4 pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9的構建
用NotI和PciI酶切pLL3.7載體(Addgene,Plasmid#11795)作為骨架,同時用NotI和PciI酶切2.3獲得的中間載體pX330-U6-VEGFA.sgRNA-CBh-SpCas9,獲得所需的sgRNA表達盒片段和Cas9表達盒片段,命名U6-VEGFA.sgRNA-CBh-SpCas9,酶切體系見表5、表6,膠回收目的片段(片段大小分別為6230bp和5770bp),將骨架和片段連接(用pLL3.7作為骨架,一是為了和ScRad52表達載體統(tǒng)一,二是pLL3.7骨架應用更廣),連接體系見表7。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。最終獲得pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9。
表5:pLL3.7酶切體系(New England Biolabs,#R3189S和#R0655S)
表6:U6-VEGFA.sgRNA-CBh-SpCas9片段酶切體系(New England Biolabs,#R3189S和#R0655S)
表7:pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9連接體系(New England Biolabs,#M0202S)
3. ScRad52表達載體(pLL3.7-ScRad52)的構建
參考NCBI中公布的ScRad52基因的核苷酸序列(GenBank accession number NC_001145.3),利用Clone ManagerV7軟件進行引物設計,設計可以特異擴增ScRad52基因片段的引物:
AgeI-ScRad52.F:5'-tacACCGGTATGAATGAAATTATGGATATGGATG-3'(SEQ.ID.NO.4)EcoRI-ScRad52.R:5'-ccgGAATTCTCAAGTAGGCTTGCGTGCATGC-3'(SEQ.ID.NO.5)
引物開頭的小寫字母為保護堿基,大寫斜體字母代表酶切位點,下劃線部分代表與酵母基因組匹配的序列,以酵母菌株AH109(BioVector質粒載體菌種細胞基因保藏中心,2011年實驗室提取-80℃保存)的基因組為模版,PCR擴增獲得ScRad52的完整基因序列,插入到骨架載體pLL3.7中,如圖2所示,包括兩個方向相反的表達盒,一個為ScRad52表達盒,另一個為Ampicillin抗性基因表達盒。載體的具體構建方法如下:
3.1 ScRad52基因序列的獲得
以酵母菌株AH109基因組為模版PCR擴增獲得ScRad52基因序列,PCR反應體系如表8所述,反應條件為:95℃預變性5min;95℃變性30s,68℃退火30s,72℃延伸20s,18個循環(huán),每個循環(huán)的退火溫度降1℃;95℃變性30s,50℃退火30s,72℃延伸20s,25個循環(huán);最后72℃延伸10min。
表8:擴增ScRad52基因序列PCR體系(北京全式金生物技術,貨號AP111和AP211)
3.2 pLL3.7-ScRad52的構建
用AgeI和EcoRI酶切pLL3.7載體(Addgene,Plasmid#11795)作為骨架,同時用AgeI和EcoRI酶切步驟3.1中獲得的ScRad52基因序列,酶切體系見表9、表10,膠回收目的片段(片段大小分別為6916bp和1422bp)。將骨架和片段連接,連接體系見表11。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。
表9:pLL3.7酶切體系(New England Biolabs,#R3552S和#R3101S)
表10:ScRad52基因序列酶切體系(New England Biolabs,#R3552S和#R3101S)
表11:pLL3.7-ScRad52連接體系(New England Biolabs,#M0202S)
4.雙熒光報告系統(tǒng)表達載體pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP的構建
該載體由兩個獨立的表達盒片段和一段截短的GFP片段組成,表達盒1設計為啟動子-插入目的基因靶位點的GFP打斷序列(靶位點放入后GFP的閱讀框被打斷,密碼子發(fā)生移碼突變,翻譯的氨基酸錯誤,GFP蛋白不能正確表達,打斷位置在閱讀框的內部)-終止子序列,表達盒2轉錄方向與表達盒1相反,設計為啟動子-完整的DsRed閱讀框序列-終止子序列。通過不同的限制性內切酶的酶切位點將各個片段連在一起(圖3)。
已知的報告載體系統(tǒng)大都只能獨立間接反映真核細胞中某一種通路的修復效率。若要需要得到與本發(fā)明類似的結果,工作量至少需要增加三倍,工作時間也需要相應的延長。本發(fā)明提出的可視化的雙熒光報告系統(tǒng)既可以通過觀察熒光數(shù)量進行粗略、初步定量,又可以通過流式細胞儀進行計數(shù)精確定量,還可以通過流式分選獲得所需的特定修復方式的細胞作為其延伸應用。另外,由于使用了真核細胞中常見的強啟動子,可使其對多種真核模式動物細胞有效,具有應用的廣泛性。
構建該載體需要三步。第一步,擴增獲得完整的DsRed表達盒,并插入含有多克隆位點的pXL-BAC II骨架載體,獲得pXL-DsRed表達載體;第二步,構建含有VEGFA靶位點的被打斷的GFP表達盒片段,再將該片段插入pXL-DsRed中,獲得pXL-EF1a.GFP(VEGFA target)-DsRed;第三步,PCR擴增獲得截短的GPF片段(其設計原則是截短的GFP開放閱讀框片段5`端要與第二步中被VEGFA target打斷的GFP表達盒的打斷位置上游的閱讀框序列GFP-L含有同源部分,同源部分的范圍是150-350bp),并通過引物引入酶切位點,將片段插入到pXL-EF1a.GFP(VEGFA target)-DsRed中,最終獲得pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP雙熒光報告系統(tǒng)的表達載體(圖4)。載體的具體構建和檢測方法如下:
4.1 pXL-DsRed表達載體的構建
4.1.1擴增DsRed box without polyA
以pTCCR克隆載體(GenBank,Accession#:AY569779.1)為模版,利用Clone Manager V7軟件進行引物設計,設計能夠特異擴增CMV啟動子序列和DsRed開放閱讀框序列(即不含polyA尾的DsRed表達盒,DsRed box without polyA)的引物,分別命名為SpeI-BclI-DsRed Box.F和NotI-DsRed Box.R,并分別在相應的位置引入所需的酶切位點。引物設計如表12:
表12:DsRed box without polyA片段引物設計表
其中:引物5’端的下劃線標注的大寫字母為酶切位點,前面的小寫字母為保護堿基。
4.1.2中間載體pXL-DsRed box without polyA
以實驗室保存的pTCCR克隆載體(GenBank,Accession#:AY569779.1)為模版PCR獲得DsRed box without polyA片段(1361bp),PCR反應體系如表13,反應條件為:95℃預變性5min;95℃變性30s,68℃退火30s,72℃延伸20s,18個循環(huán),每個循環(huán)的退火溫度降1℃;95℃變性30s,50℃退火30s,72℃延伸20s,25個循環(huán);最后72℃延伸10min。
表13:DsRed box without polyA片段PCR體系(北京全式金生物技術,貨號AP111和AP211)
用NotI和SpeI酶切pXL-BAC II克隆載體(本實驗室保存,購自Addgene,該克隆載體已下架,具體信息參考Addgene,Plasmid#26852)作為骨架,同時用NotI和SpeI酶切DsRed box without polyA片段,酶切體系見表14、表15,膠回收目的片段(片段大小分別為4087bp和1347bp)。將骨架和酶切回收的DsRed box without polyA片段連接,連接體系見表16。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。
表14:pXL-BAC II酶切體系(New England Biolabs,#R3189S和#R3133S)
表15:DsRed box without polyA片段酶切體系(New England Biolabs,#R3189S和#R3133S)
表16:pXL-DsRed box without polyA連接體系(New England Biolabs,#M0202S)
4.1.3擴增β-globin polyA terminators片段
以質粒pL3-TRE-MCS-polyA-2L(Addgene,Plasmid#11719)為模版,利用Clone ManagerV7軟件進行引物設計,設計可以特異擴增β-globin polyA terminators片段(以下簡稱rb_glob_PA_terminator片段)的引物NotI-rb_glob_PA.F和BglII-rb_glob_PA.R(引物設計如表17),PCR反應體系和條件參考4.1.2,不再贅述。
表17:β-globin polyA terminators片段引物設計表
其中:引物5’端的下劃線大寫字母為酶切位點,前面的小寫字母為保護堿基。
4.1.4 pXL-DsRed表達載體的構建
用NotI和BglII酶切4.1.2構建的中間載體pXL-DsRed box without polyA作為骨架,同時,PCR獲得rb_glob_PA_terminator片段(464bp)后,片段用NotI和BglII酶切;酶切體系見表18、表19,膠回收目的片段(片段大小分別為5380bp和450bp)。將骨架和酶切回收的rb_glob_PA_terminator片段連接,連接體系見表20。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。最終獲得pXL-DsRed表達載體。
表18:pXL-DsRed box without polyA酶切體系(New England Biolabs,#R3189S和#R0144S)
表19:rb_glob_PA_terminator片段酶切體系(New England Biolabs,#R3189S和#R0144S)
表20:pXL-DsRed連接體系(New England Biolabs,#M0202S)
4.2 pXL-EF1a.GFP(VEGFA target)-DsRed表達載體的構建
4.2.1 PCR擴增獲得EF1a.GFP(VEGFA target)-L片段
以質粒pEF-GFP(Addgene,Plasmid#11154)為模版,利用Clone ManagerV7軟件進行引物設計,設計可以特異擴增EF1a.GFP(VEGFA target)-L片段(包括EF1a啟動子、該啟動子后至打斷位置間的1-292bp部分GFP閱讀框GFP-L、靶位點序列以及打斷位置后用于構造重疊區(qū)的部分GFP閱讀框)的引物HindIII-EF1a-GFPL.F和EF1a-GFPL.R(引物設計如表21-1),PCR反應體系和條件參考4.1.2,不再贅述。
表21-1:EF1a.GFP(VEGFA target)-L片段引物設計表
其中:引物5’端的下劃線字體為酶切位點,前面的小寫字母為保護堿基,斜體代表Overlap區(qū)(重疊區(qū))。斜體部分內加框的局部序列即靶位點的反向互補序列。
4.2.2 PCR擴增獲得GFP(VEGFA target)-R-PolyA片段
與4.2.1相似,以質粒pEF-GFP(Addgene,Plasmid#11154)為模版,利用Clone ManagerV7軟件進行引物設計,設計可以特異擴增GFP(VEGFA target)-R-PolyA片段(包括靶位點、GFP閱讀框的其余293-720bp部分GFP-R以及終止子序列)的引物GFPR-polyA.F和ClaI-GFPR-polyA.R(引物設計如表21-2),PCR反應體系和條件參考4.1.2,此處不再贅述。
表21-2:GFP(VEGFA target)-R-PolyA片段引物設計表
其中:引物5’端的下劃線字體為酶切位點,前面的小寫字母為保護堿基,斜體代表Overlap區(qū),斜體部分內加框的局部序列即靶位點。
4.2.3重疊PCR擴增獲得GFP(VEGFA target)片段
以4.2.1和4.2.2獲得的EF1a.GFP(VEGFA target)-L片段和GFP(VEGFA target)-R-PolyA片段為模版,HindIII-EF1a-GFPL.F(表21-1)和ClaI-GFPR-polyA.R(表21-2)為上下游引物,Overlap PCR擴增獲得GFP(VEGFA target)片段(即插入有靶位點的GFP表達盒,片段大小為2528bp),PCR體系見表22。
表22:GFP(VEGFA target)片段Overlap PCR體系(北京全式金生物技術,貨號AP111和AP211)
4.2.4 pXL-EF1a.GFP(VEGFA target)-DsRed表達載體的構建
用HindIII和ClaI酶切4.1中構建的表達載體pXL-DsRed作為骨架,同時,將4.2.3獲得的GFP(VEGFA target)片段用HindIII和ClaI酶切。酶切體系見表23、表24,膠回收骨架及目的片段(片段大小分別為5825bp和2517bp)。將骨架和片段連接,連接體系見表25。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。最終獲得pXL-EF1a.GFP(VEGFA target)-DsRed表達載體。
表23:pXL-DsRed酶切體系(New England Biolabs,#R3104S和#R0197S)
表24:GFP(VEGFA target)片段酶切體系(New England Biolabs,#R3104S和#R0197S)
表25:pXL-EF1a.GFP(VEGFA target)-DsRed連接體系(New England Biolabs,#M0202S)
4.3 pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP表達載體的構建
4.3.1 PCR擴增獲得截短的GFP片段(即Truncated GFP片段,簡稱TrGFP片段)以實驗室保存的pEGFP-C1Vector(GenBank,Accession#:U55763)為模版,利用Clone Manager V7軟件進行引物設計,設計可以特異擴增TrGFP片段的引物BclI-TrGFP.F和SpeI-TrGFP.R(引物設計如表26),PCR反應體系和條件參考4.1.2,在此不再贅述。TrGFP片段在本例中具體是GFP閱讀框的4bp至720bp部分。
表26:TrGFP片段引物設計表
其中:引物5’端的下劃線字體為酶切位點,前面的小寫字母為保護堿基,框內字母代表終止密碼子。
4.3.2 pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP表達載體的構建
用BclI和SpeI酶切4.2中構建的表達載體pXL-EF1a.GFP(VEGFAtarget)-DsRed作為骨架,同時,將4.3.1獲得的TrGFP片段(片段大小為744bp)用BclI和SpeI酶切。酶切體系見表27、表28,膠回收骨架及目的片段(片段大小分別為8334bp和732bp)。將骨架和片段連接,連接體系見表29。經過16℃過夜后轉化大腸桿菌DH5α感受態(tài)細胞,涂LB/Amp平板,挑取單克隆并在LB/Amp液體培養(yǎng)基中37℃培養(yǎng)8h,提質粒。最終獲得pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP表達載體。
表27:pXL-EF1a.GFP(VEGFA target)-DsRed酶切體系(New England Biolabs,#R0160S和#R313 3S)
表28:TrGFP片段酶切體系(New England Biolabs,#R0160S和#R3133S)
表29:pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP連接體系(New England Biolabs,#M0202S)
5 HEK293T細胞中雙熒光報告系統(tǒng)的應用
質粒經酶切鑒定、測序正確后,將報告系統(tǒng)表達質粒pXL-EF1a.GFP(VEGFA)-DsRed-TrGFP、CRISPR/Cas9表達質粒pLL3.7-U6-VEGFA.sgRNA-CBh-SpCas9共轉染HEK293T細胞,檢測該套可視化的雙熒光報告系統(tǒng)是否可以通過模擬真核細胞中的修復機制后正確的表達紅色熒光或者綠色熒光,再通過流式細胞儀讀取GFP熒光蛋白和DsRed熒光蛋白的發(fā)光數(shù)量,一次性檢測真核細胞中確定基因位點HR、SSA和NHEJ的修復效率。
5.1載體系統(tǒng)轉染HEK293T細胞
HEK 293T細胞系置于含10%胎牛血清、100μg/mL青鏈霉素的DMEM培養(yǎng)基中,37℃、5%的CO2培養(yǎng)箱培養(yǎng)。HEK 293T細胞系的轉染:以12孔板為例,接種HEK 293T細胞至12孔板中,待細胞密度接近70%時,更換新鮮的DMEM培養(yǎng)基。吸出12孔板中的培養(yǎng)基,每孔加入37℃預熱的新鮮培養(yǎng)基1mL,2-4小時后開始轉染。取兩個1.5mL滅菌EP管,一個加入共計約4.5μg的質粒,然后加入Opti-MEM至總體積50μL;另一個EP管內加入3μL So-Fast轉染試劑和Opti-MEM至50μL。輕輕混勻兩個EP管內的混合物,然后將含轉染試劑的Opti-MEM緩慢加入含質粒的EP管中,邊加邊輕輕震蕩,使其充分混勻?;靹蚝螅瑢⒒旌衔镏糜谑覝?0min,然后將轉染混合體系滴加至12孔板中,輕輕晃動幾下,將培養(yǎng)板放回培養(yǎng)箱,12小時后換新鮮培養(yǎng)基。轉染所用的體系如表30。
表30:可視化的雙熒光報告系統(tǒng)檢驗工作效率的轉染體系(12孔板)
5.2可視化的雙熒光報告系統(tǒng)的熒光檢測
轉染48h后,利用熒光顯微鏡觀察分別觀察每個孔的紅色熒光和綠色熒光。圖5是報告系統(tǒng)進入真核細胞后的工作原理示意圖,共有3中可能的工作方式:(1)當報告系統(tǒng)通過NHEJ通路發(fā)生修復時,含靶位點的GFP序列被Cas9蛋白切割后直接發(fā)生NHEJ修復,GFP蛋白的閱讀框無法正確修復(在靶位點處發(fā)生了雙鏈斷裂,雙鏈斷裂會造成堿基丟失或者插入,然后會造成密碼子的移碼突變,造成GFP不能正確的表達),GFP蛋白不能正常表達,而DsRed蛋白可以正常表達,即細胞不發(fā)綠光只發(fā)紅光;(2)當報告系統(tǒng)通過SSA通路發(fā)生修復時,前面含靶位點的GFP序列和后面截短的GFP片段含有一段同源臂,通過SSA修復后,中間的DsRed蛋白序列被重組降解掉,因此GFP蛋白可以正常表達而DsRed蛋白不可表達,即細胞只發(fā)綠光;(3)當報告系統(tǒng)通過HR通路發(fā)生修復時,前面含靶位點的GFP序列以后面截短的GFP片段為模版,通過同源重組后前面打斷的GFP序列被修復成完整的GFP表達盒正常表達GFP蛋白,后面的DsRed表達盒也不受影響正常表達,細胞既發(fā)綠光也發(fā)紅光。VEGFA位點實驗組和對照組的熒光照片如圖6所示,圖6中Phase表示的是白光下的細胞狀態(tài)。
5.3可視化報告系統(tǒng)的熒光計數(shù)及細胞修復效率的初步計算
轉染48h后,取各組細胞過流式細胞儀,統(tǒng)計發(fā)紅光和發(fā)綠光的細胞占細胞總數(shù)的百分比,結果如圖7和圖8所示。由于實驗組共轉染ScRad52表達載體,ScRad52具有提高HR修復效率的能力,因此實驗組HR的修復效率更高,導致的雙熒光結果較對照組增多,表明可視化報告系統(tǒng)可以正常工作。
5.4利用可視化報告系統(tǒng)的流式分選及陽性基因組測序
同5.3轉染48h后,通過對轉染后細胞進行流式篩選,提取基因組后測序(圖9,給出了部分測序結果比對圖),發(fā)現(xiàn)實驗組基因組中的NHEJ效率低于對照組效率(與5.3中的結果類似),實驗組基因組HR效率高于對照組效率(約3倍,與5.3結果中的2.34倍類似)。另外因為基因組本位點中不含SSA修復所需的短同源序列,因此基因組該位點SSA的修復效率理論上為零(與5.3結果中的接近于0的較低SSA效率對應),確定了三種修復的發(fā)生頻率與上述5.3的結果具有一致性。
總之,本發(fā)明提出的可視化的雙熒光報告系統(tǒng)可以方便、快速的檢測真核細胞中某個確定VEGFA基因位點HR、SSA和NHEJ的修復效率,同時,如果將本實驗所用的VEGFA基因靶序列更換成其它功能基因靶序列,使用的真核細胞更換成其他的模式真核細胞,同樣可以方便的獲得它類真核細胞中其他確定基因位點發(fā)生的各DNA修復效率,因此本發(fā)明為真核細胞中細胞修復效率方面相關研究的概念驗證提供了一套可靠、高效的工具。
核苷酸序列表
<110> 西北農林科技大學
<120> 基于人工核酸酶的可視化細胞修復效率報告系統(tǒng)及其建立方法
<160> 15
<210> 1
<211> 20
<212> DNA
<213> Homo sapiens (human)
<400> 1
ctcggccacc acagggaagc 20
<210> 2
<211> 25
<212> DNA
<213> 人工合成
<400> 2
caccgctcgg ccaccacagg gaagc 25
<210> 3
<211> 25
<212> DNA
<213> 人工合成
<400> 3
aaacgcttcc ctgtggtggc cgagc 25
<210> 4
<211> 34
<212> DNA
<213> 人工合成
<400> 4
tacaccggta tgaatgaaat tatggatatg gatg 34
<210> 5
<211> 31
<212> DNA
<213> 人工合成
<400> 5
ccggaattct caagtaggct tgcgtgcatg c 31
<210> 6
<211> 44
<212> DNA
<213> 人工合成
<400> 6
cggactagtt gatcaagctt tagttattaa tagtaatcaa ttac 44
<210> 7
<211> 23
<212> DNA
<213> 人工合成
<400> 7
atttgcggcc gctacaggaa cag 23
<210> 8
<211> 34
<212> DNA
<213> 人工合成
<400> 8
atttgcggcc gcgatctttt tccctctgcc aaaa 34
<210> 9
<211> 31
<212> DNA
<213> 人工合成
<400> 9
ggaagatctt tcataagaga agagggacag c 31
<210> 10
<211> 27
<212> DNA
<213> 人工合成
<400> 10
cccaagcttc gtgaggctcc ggtgccc 27
<210> 11
<211> 50
<212> DNA
<213> 人工合成
<400> 11
ttagtcactt agcttccctg tggtggccga gtgcgctcct ggacgtagcc 50
<210> 12
<211> 52
<212> DNA
<213> 人工合成
<400> 12
ctcggccacc acagggaagc taagtgacta accatcttct tcaaggacga cg 52
<210> 13
<211> 30
<212> DNA
<213> 人工合成
<400> 13
cccatcgatg agaagaggga cagctatgac 30
<210> 14
<211> 28
<212> DNA
<213> 人工合成
<400> 14
ctatgatcag tgagcaaggg cgaggagc 28
<210> 15
<211> 31
<212> DNA
<213> 人工合成
<400> 15
cggactagtt tagagtccgg acttgtacag c 31