專利名稱:陸地棉內(nèi)切-1,4-β-葡聚糖酶基因的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及陸地棉內(nèi)切-1,4-β-葡聚糖酶基因的克隆,屬于生物技術(shù)領(lǐng)域。是從陸地棉的纖維中通過基于Microarray技術(shù)得到的。RT-PCR檢測因其僅在纖維各發(fā)育時期特異性表達(dá),且該基因編碼蛋白與細(xì)胞壁的形成及加厚有關(guān),因此以該基因為靶基因?qū)γ藁ㄟM行轉(zhuǎn)化,在一定程度上可有效的提高棉纖維的品質(zhì),因而具有一定的經(jīng)濟及社會效益。
(二)技術(shù)背景棉花作為世界性的重要經(jīng)濟作物,其纖維是一種優(yōu)良的天然纖維,是重要的紡織工業(yè)原料。由于紡織工業(yè)發(fā)展的不斷加快,要求較強、較細(xì)和纖維更整齊的棉纖維,再加上人們保健意識的增強和生活水平的提高,對棉纖維品質(zhì)改良的要求愈加迫切。
近10年來,棉花育種從側(cè)重外在品質(zhì)轉(zhuǎn)變?yōu)閭?cè)重內(nèi)在品質(zhì)。目前,國內(nèi)外除了利用常規(guī)育種手段外,還逐步運用遺傳工程對棉纖維品質(zhì)進行遺傳改良,而此項工作的展開首先依賴于對棉纖維發(fā)育相關(guān)基因及其調(diào)控元件的識別與分離。
棉纖維發(fā)育過程有幾千個基因表達(dá),其相關(guān)基因的分離鑒定以及調(diào)控研究起步較晚,但進展很快。美國和澳大利亞的一些研究小組利用大規(guī)模測序獲得了棉花大量的表達(dá)序列標(biāo)簽(EST)。目前,在GenBank中注冊的EST片段已有221,498條,其中陸地棉共29,344條。這些基因片段為棉花基因表達(dá)譜的建立、基因克隆以及棉纖維發(fā)育生物信息數(shù)據(jù)庫的建立打下了基礎(chǔ)。從目前國內(nèi)外的研究進展來看,已克隆的棉纖維發(fā)育相關(guān)基因僅有20余個,且多數(shù)是在纖維伸長階段的纖維細(xì)胞中特異表達(dá),利用分子生物學(xué)方法改良棉纖維的潛力還遠(yuǎn)沒有發(fā)揮。
本專利所克隆的基因內(nèi)切-1,4-β-葡聚糖酶(EGases,EC 3.2.1.4)作為纖維素酶系中三大纖維酶中的一種,是一類普遍存在于原核生物和真核生物體內(nèi)的水解酶,它可以催化水解具有1,4-β-葡聚糖主鏈的多糖類物質(zhì)。研究表明高等植物中的EGase是由一個多基因家族所編碼的。擬南芥體內(nèi)發(fā)現(xiàn)至少有12個不同的EGase家族蛋白,番茄中也發(fā)現(xiàn)了6個EGase蛋白,并且大多數(shù)是在不同的時間和組織器官中特異表達(dá),這表明EGases對植物體的生長發(fā)育可能具有廣泛的作用,如一些EGases在果實成熟或葉片脫落過程中特異表達(dá),而另外一些EGases在正在伸展的細(xì)胞中高量表達(dá)表明它們可以在初生細(xì)胞壁中的多糖物質(zhì)的聚集或重排等過程中發(fā)揮作用。對于EGases在植物細(xì)胞伸展過程中的作用在過去的20多年中一直受到不少研究者的關(guān)注,雖然有大量相關(guān)的研究報道,但這個問題仍存在爭論。對于其在棉纖維發(fā)育過程中的作用可歸納為以下三個作為植物細(xì)胞結(jié)果材料的纖維素需在纖維素酶系中三大纖維素酶的協(xié)同作用下才能完全降解為葡萄糖,而葡萄糖作為正在伸長的棉纖維中產(chǎn)生滲透壓的主要物質(zhì),與K+、蘋果酸鹽一起,共同產(chǎn)生了80%的纖維滲透壓,從而促進棉纖維細(xì)胞的伸展發(fā)育。
棉纖維細(xì)胞的延伸還需松弛初生壁的纖維素微纖絲網(wǎng)絡(luò)及其與基質(zhì)非纖維素多糖網(wǎng)絡(luò)之間的交聯(lián)。據(jù)研究,1,4-β-內(nèi)葡聚糖酶,膨脹素,內(nèi)木葡聚糖轉(zhuǎn)移酶參與了此過程。1,4-β-內(nèi)葡聚糖酶通過松弛或剪切棉纖維細(xì)胞中的結(jié)合物從而使纖維細(xì)胞得以膨脹(Fry,1995)。此基因的轉(zhuǎn)錄在纖維伸長期保持高水平,其表達(dá)水平隨著纖維伸長速率減慢而降低。
在一定合成途徑,內(nèi)切葡聚糖酶可催化產(chǎn)生木糖寡糖,參與細(xì)胞壁的擴張,促進細(xì)胞伸長。
植物EGases的潛在功能是修飾自身細(xì)胞的細(xì)胞壁成分,因此它們必須被分泌到細(xì)胞表面才能發(fā)揮其功能,事實上迄今已克隆出的植物EGases分子中幾乎都具有典型的真核生物信號肽序列,使它們可以在細(xì)胞的內(nèi)膜系統(tǒng)中加工修飾并最終被分泌到胞外空間。
發(fā)明內(nèi)容技術(shù)問題 本發(fā)明的目的是克隆一個陸地棉纖維素酶基因(Gh EGases)cDNA的全長序列,以此設(shè)計出一對Gh EGases的特異性引物檢測其在陸地棉高品質(zhì)纖維種質(zhì)系7235中的時空表達(dá)情況;以此基因為靶基因,通過基因工程的方法改變目前棉纖維的品質(zhì)特性,獲得一定的經(jīng)濟及社會效益。為棉花的品質(zhì)育種提供基因資源,盡快提高我國棉花品種的纖維品質(zhì),并應(yīng)用于高強纖維棉花品種的生產(chǎn)與品質(zhì)檢測。
技術(shù)方案陸地棉內(nèi)切-1,4-β-葡聚糖酶基因(Gh EGases),長度為2036bp,序列為SEQID NO.1,如下GAAGGCACAGGATTTCTGGGATTTTTCTGCAAATTGGAAGAAAGATAAAG
GCTATGTCATGTTGGGGATCCAAAACTTTTTTTTTTGTTTATAAAAGAATGAAAGAAAGAGATGTGATTGGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA注陰影部分為推測的最大開放讀碼框(ORF);下劃線為潛在加尾信號。
Gh EGases的特異性引物為F5’-TCCATACAACTATTCCT-3’R5’-TTCTCCTCATACACAAC-3’本發(fā)明克隆內(nèi)切-1,4-β-葡聚糖酶基因的技術(shù)路線是1.按照CLONTECH cDNA文庫構(gòu)建方法(CLONTECH CreatorTMSmartTMcDNAlibraies User Manual),構(gòu)建了陸地棉優(yōu)質(zhì)材料7235開花后1,3,5,7,11,14,17,20,23,25等不同纖維發(fā)育時期的混合cDNA文庫。陸地棉優(yōu)質(zhì)材料7235引自江蘇省農(nóng)科院經(jīng)濟作物研究所,該種質(zhì)目前已向相關(guān)研究單位免費發(fā)放。
2.隨機挑取6000余個克隆進行5’端測序分析。進一步將所測序列進行聚類分析,并使用BLASTN非冗余數(shù)據(jù)庫進行數(shù)據(jù)同源性比較,獲1056個非冗余contig和它們的初步功能。
3.按初步分類結(jié)果,從文庫中挑取一類編碼與細(xì)胞壁合成有關(guān)的酶類的克隆,轉(zhuǎn)化,測出全序列。根據(jù)測序結(jié)果,進一步進行BLAST比對,認(rèn)知其可能的功能,并對其最大開放讀碼框進行全長的基因判定。
4.這一類基因中發(fā)現(xiàn)并確認(rèn)一個編碼內(nèi)切-1,4-β-葡聚糖酶的基因為全長序列,根據(jù)該序列設(shè)計一對特異引物,RT-PCR檢測該基因僅在纖維各發(fā)育時期漸增表達(dá)(圖1)。并做了生物信息學(xué)的初步分析。
有益效果本發(fā)明的優(yōu)點表現(xiàn)在(1)目前常見的幾種用于全長cDNA基因克隆技術(shù)有文庫篩選法(LibraryScreening)、cDNA末端快速擴增(RACE)和電子克隆(in silico cloning)等。而本發(fā)明所采用的是基于微陣列分析技術(shù),因其具有高通量,后續(xù)操作方便等優(yōu)點,而非常適合于大規(guī)模獲取相關(guān)基因。
(2)本發(fā)明所克隆的基因編碼內(nèi)切-1,4-β-葡聚糖酶,從現(xiàn)有的資料可知,內(nèi)切-1,4-β-葡聚糖酶類基因是一類基因家族,它們中的大部分與細(xì)胞壁的合成及加厚有關(guān),而細(xì)胞壁的厚度與纖維強度又有著密切的關(guān)系。因此本發(fā)明所克隆的基因與棉纖維的強度有著直接的聯(lián)系。
(3)以此基因作為靶基因,對棉花進行轉(zhuǎn)化理論上可直接有效地提高其強度,打破產(chǎn)量品質(zhì)的負(fù)相關(guān),獲得優(yōu)質(zhì)棉花,帶來可觀的經(jīng)濟社會效益。
(4)目前轉(zhuǎn)基因的外源基因大部分來源于微生物,這類轉(zhuǎn)基因作物對安全性評價要求嚴(yán)格。本專利報道的基因來源于棉花,再導(dǎo)入棉花不存在安全性評價問題。同時,與棉纖維發(fā)育相關(guān)的基因目前國內(nèi)外申請的專利很少,本專利是目前具有中國自主知識產(chǎn)權(quán)的為數(shù)不多的專利之一。該專利的申請可提高中國棉花科研水平在國際同行中的地位。
(5)通過該基因的功能預(yù)測,表明該基因是一個棉纖維發(fā)育過程中特異表達(dá)的基因,通過農(nóng)桿菌介導(dǎo)的方法將該基因?qū)朊藁?,使其過量表達(dá),獲得的轉(zhuǎn)基因植株將在棉纖維伸長或和加厚期大量表達(dá),有望達(dá)到大大提高棉纖維品質(zhì)的目的。
圖1RT-PCR檢測內(nèi)切-1,4-β-葡聚糖酶基因(Gh EGases)在棉花不同組織表達(dá)特點,從左至右依次為根(R)、下胚軸(H)、葉(L)、開花后1、3、5、8、11、14、17、20、23天棉纖維。M示標(biāo)準(zhǔn)分子量。圖1A示棉花的組蛋白Histon3內(nèi)標(biāo),證明RNA模板的一致性。圖1B示內(nèi)切-1,4-β-葡聚糖酶基因在棉花根、下胚軸、葉中不表達(dá),在不同棉纖維發(fā)育期特異表達(dá)。
圖2內(nèi)切-1,4-β-葡聚糖酶基因(Gh EGases)的SignalP信號肽分析。表明N-端有一個長度為23個氨基酸殘基的信號肽。
圖3內(nèi)切-1,4-β-葡聚糖酶基因(Gh EGases)與其它物種來源的多個同源基因的同源關(guān)系樹和種系發(fā)生樹分析。說明Gh EGases與陸地棉β-葡糖苷酶基因(Ghbglx)親緣關(guān)系較遠(yuǎn)。
具體實施方式
1.按照CLONTECH cDNA文庫構(gòu)建方法(CLONTECH公司文庫構(gòu)建試劑盒CreatorTMSmartTMcDNA libraies User Manual),構(gòu)建了陸地棉優(yōu)質(zhì)材料7235開花后1,3,5,7,11,14,17,20,23,25天等不同纖維發(fā)育時期的混合cDNA文庫。陸地棉優(yōu)質(zhì)材料7235引自江蘇省農(nóng)科院經(jīng)濟作物研究所,該種質(zhì)目前已向相關(guān)研究單位免費發(fā)放。
2.隨機挑取6000余個克隆進行5’端測序,進一步將所測序列利用DNASTAR軟件中的ALIGNMENT程序進行聚類分析,并使用BLASTN非冗余數(shù)據(jù)庫(http//www.ncbi.nlm.nih.gov/)進行數(shù)據(jù)同源性比較,獲1056個不重復(fù)的克隆并在NCBI網(wǎng)站進行核酸序列比較獲得它們的初步功能。
3.按照初步功能將上述克隆進行分類,從中挑取功能為與細(xì)胞壁合成有關(guān)的克隆,利用大腸桿菌E.coli為受體,分別進行轉(zhuǎn)化,轉(zhuǎn)化菌株分別進行插入片段的全序列測定。根據(jù)測序結(jié)果,進一步進行BLAST功能比對,明確其可能的功能,并對其最大開放讀碼框(ORF)進行全長的基因判定。在該ORF上游有5‘非翻譯區(qū)的序列,在ORF下游3’非翻譯區(qū)有cDNA的多聚腺嘌呤尾巴。
找到一個全長cDNA序列,BLAST功能比對其功能為編碼內(nèi)切-1,4-β-葡聚糖酶,該全長cDNA序列被定名為Gh EGases。根據(jù)該序列設(shè)計一對特異引物F5’-TCCATACAACTATTCCT-3’R5’-TTCTCCTCATACACAAC-3’進行RT-PCR檢測,結(jié)果表明該基因僅在纖維各發(fā)育時期漸增表達(dá)(圖1、2),由此確定該基因是一個棉纖維發(fā)育特異表達(dá)基因。
4.對該基因Gh EGases的生物信息學(xué)初步分析4.1以此基因的最大ORF推斷的氨基酸序列經(jīng)BLAST(http//www.ncbi.nlm.nih.gov/)功能比較,該基因與已報道陸地棉葡萄糖苷酶(Ghglx)基因具最高的相似性(75%)。
4.2用Expasy pI/Mw程序(http//us.expasy.org/tools/pi_tool.html)對Gh EGases的氨基酸序列進行了一級結(jié)構(gòu)的預(yù)測,該基因Gh EGases理論上的等電點pI=8.17,分子量Mw=68781.01Da。
4.3信號肽SignalP程序(http//genome.cbs.dtu.dk/services/SignalP-2.0/)對由Gh EGases所推導(dǎo)的氨基酸序列進行分析,發(fā)現(xiàn)在該氨基酸序列的N-端有一個長度為23個氨基酸殘基的信號肽,由此確定Gh EGases基因編碼的產(chǎn)物是一個蛋白前體,它在被合成之后將通過分泌途徑運輸?shù)狡渥饔貌课换虮环置诘郊?xì)胞外(圖2)。
4.4蛋白功能區(qū)分析程序(BPROMPT)(http//www.jenner.ac.uk/bprompt/)分析其跨膜區(qū)位于8~17為氨基酸處。
用MotifScan程序(http//myhits.isb-sib.ch/cgi-bin/motif_scan)分析該氨基酸序列位點特征的結(jié)果顯示,Gh EGases氨基酸序列的第102~339位與第411~623位分別為糖基水解家族3的N端與C端功能域。
4.5同源關(guān)系樹分析(DNAMAN軟件),Gh EGases與陸地棉β-葡糖苷酶基因(Ghbglx)親緣關(guān)系較遠(yuǎn)(圖3)。
5.通過該基因的功能預(yù)測,表明該基因是一個棉纖維發(fā)育過程中特異表達(dá)的基因,通過農(nóng)桿菌介導(dǎo)的方法將該基因?qū)朊藁?,使其過量表達(dá),獲得的轉(zhuǎn)基因植株將在棉纖維伸長或和加厚期大量表達(dá),有望達(dá)到大大提高棉纖維品質(zhì)的目的。
SEQUENCE LISTING序列表<110>南京農(nóng)業(yè)大學(xué)<120>陸地棉內(nèi)切-1,4-β-葡聚糖酶基因<130>00<140>00<141>2005-05-26<150>00<151>2005-05-26<160>1<170>PatentIn version 3.1<210>1<211>2036<212>DNA<213>Gossypium hirsutum(陸地棉)<220>
<221>陸地棉內(nèi)切-1,4-β-葡聚糖酶基因(Gh EGases)<222>(51)..(1934)<223>
<400>1gaaggcacag gatttctggg atttttctgc aaattggaag aaagataaag atggcaagaa 60caagaattac catctttttt atggggctcg tgctttggtg ttgcttgaca aaagcggaat 120acatgaaata taaagatccg aaacaggcgg tacatgttcg aacccgggac ctgttggatc 180gaatgacatt ggaggaaaag atcggacaaa tggtccagat cgaacgcagc gttgcttcgg 240ccgacgtgat gaacaagtat ttcattggga gtgtattgag tggaggaggg agtgcccctt 300ctccacaagc ttctccagag gcttggataa acatgatcaa tgactttcag aagggtagtt 360tagcaacccg aatgcagatc cccatgattt acgggattga tgctgttcat ggcaacaaca 420atgtttacaa ggcaacaatt tttcctcaca acattggtct aggtgctacc agggacccta 480aactggttaa gaaaattggg gctgcaacag cacttgaatc tagagcaact ggcattccat 540atgttttcgc accttgtata gcggtttgcc gagatccgag atggggccga tgttacgaaa 600
gttacagcga agatccccat cttgttgacg caatgacaga gattgtacca ggattacaag 660gagacatacc tgctaaatct tctaaaggca ttccatttgt tgctggaaat aaaaatgttg 720cagcttgtgc taagcactac gtaggagatg gtggaacaac caagggcata aatgagaaca 780acacagtgat caactggcat gatttgctta gcattcatat gccaggctac tacacttcga 840ttatcaaagg tgtttcaacg gtcatggttt cgtattctag ttggaacggc gttaaaatgc 900atgctaatcg tgatttagtc actggtttcc tcaagaacaa acttcgattc agaggcttcg 960tcatctcaga ttgggaaggc attgaccgga tcacttatcc acctcatgct aactatacct1020actcgattca agcagcaatc ggatctggca ttgacatggt cgtggttcca tacaactatt1080cctcgttcat ccacgggcta actttccttg tcaaaagcaa tttcatcccc atgagccgca1140ttgatgatgc agtgaagaga attttgagag ttaaatttgc aatgggtcta tttgagaacc1200cattagcaga taacagctta gttgaccaac ttggcagtca ggaacataga gagttggcta1260gagaagcagt gagaaaatca cttgttttgc taaagaatgg gcactctgcc gatcagccat1320tgcttccctt acctaagaag acatcaaaaa tacttgttgc tggtagtcat gcagacaatt1380tgggttatca atgtggtgga tggactattg agtggcaagg gttcagtggc aacgacctta1440caaatggtac aactgtccta aaagccatca aaaacacagt tgattcaagc acgaatgttg1500tgtatgagga gaatccggat cccaaattcg tcaagtccaa caacttctcc tgtgccattg1560tggtagtagg ggagcatcca tatgtcgaaa caaaaggtga cagcatgaat ctaacgattc1620cagaacccgg tccaaccaca atcagaaatg tatgtggagc tttgaaatgt gttgtcatct1680taatgtcggg tcgccccgtt gtgatagaac ctgatattga ctccgtggat gctctggttg1740cggcatggtt gccaggaagc gagggtcatg gtgtggctga tgttctattt ggtgactatg1800gtttttcagg caagcttcct cgtacttggt ttaaaacagt tgatcaactg ccgatgaatg1860ttggggatcc acattatgat ccactcttcc cctttggatt cggcctcact actgaaccaa1920ctaaagctta ctaagctatg tcatgttggg gatccaaaac tttttttttt gtttataaaa1980gaatgaaaga aagagatgtg attggtaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa203權(quán)利要求
1.陸地棉內(nèi)切-1,4-β-葡聚糖酶基因,長度為2036bp,序列為SEQ ID NO.1,如下GAAGGCACAGGATTTCTGGGATTTTTCTGCAAATTGGAAGAAAGATAAAG GCTATGTCATGTTGGGGATCCAAAACTTTTTTTTTTGTTTATAAAAGAATGAAAGAAAGAGATGTGATTGGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA注陰影部分為推測的最大開放讀碼框;下劃線為潛在加尾信號。
2.根據(jù)權(quán)利要求1所述的陸地棉內(nèi)切-1,4-β-葡聚糖酶基因,其特異性引物為F5’-TCCATACAACTATTCCT-3’R5’-TTCTCCTCATACACAAC-3’。
3.權(quán)利要求1或2所述陸地棉內(nèi)切-1,4-β-葡聚糖酶基因為靶基因的應(yīng)用。
全文摘要
本發(fā)明涉及陸地棉內(nèi)切-1,4-β-葡聚糖酶基因的克隆,屬于生物技術(shù)領(lǐng)域??寺∫粋€陸地棉纖維素酶基因(Gh EGases)cDNA的全長序列,以此設(shè)計出一對GhEGases的特異性引物檢測其在陸地棉高品質(zhì)纖維種質(zhì)系7235中的時空表達(dá)情況;以此基因為靶基因,通過基因工程的方法改變目前棉纖維的品質(zhì)特性,RT-PCR檢測因其僅在纖維各發(fā)育時期特異性表達(dá),且該基因編碼蛋白與細(xì)胞壁的形成及加厚有關(guān),為棉花的品質(zhì)育種提供基因資源,盡快提高我國棉花品種的纖維品質(zhì),并應(yīng)用于高強纖維棉花品種的生產(chǎn)與品質(zhì)檢測。
文檔編號C12N15/56GK1699575SQ20051004023
公開日2005年11月23日 申請日期2005年5月26日 優(yōu)先權(quán)日2005年5月26日
發(fā)明者張?zhí)煺? 馬國佳, 郭旺珍 申請人:南京農(nóng)業(yè)大學(xué)