專利名稱:耐高溫組氨酰tRNA合成酶基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫組氨酰tRNA合成酶基因及其編碼的多肽和制備方法。
背景技術(shù):
組氨酰tRNA合成酶作用于組氨醇RNA轉(zhuǎn)運(yùn)合成的過程,這個(gè)過程對(duì)于組氨酸結(jié)合生成蛋白質(zhì)具有至關(guān)重要的作用。這種氨基酸具有獨(dú)特的堿基特性,而且在多數(shù)具有催化功能的蛋白酶群體中是重要的一種?,F(xiàn)在所知道的組氨酰tRNA合成酶的基本結(jié)構(gòu)顯示這種同族二聚體蛋白酶的亞基由420-550個(gè)氨基酸殘基組成。表明組氨酰tRNA合成酶在氨基酸轉(zhuǎn)運(yùn)合成酶中具有一個(gè)相對(duì)較短的鏈長(zhǎng),而氨基酸轉(zhuǎn)運(yùn)合成酶的肽鏈的長(zhǎng)度從300至1100個(gè)氨基酸殘基。來源于組氨酰-信使核糖核苷和結(jié)合了ATP的組氨醇兩個(gè)有機(jī)體,以及他們的組氨酸合成物的組氨酰tRNA合成酶的晶體結(jié)構(gòu)已經(jīng)被發(fā)現(xiàn)。
在2.7的精度條件下,嗜熱菌中組氨酰tRNA合成酶的晶體結(jié)構(gòu)已經(jīng)被測(cè)定。在不對(duì)稱的晶體個(gè)體中,有兩個(gè)同族二聚物,每個(gè)亞基包含421個(gè)氨基酸殘基。每個(gè)蛋白質(zhì)的單體有三個(gè)區(qū)域組成。源于大腸桿菌以及嗜熱菌中的組氨酰tRNA合成酶與有三個(gè)區(qū)域的二聚體蛋白酶十分相似一個(gè)包含了六個(gè)極性反平行的beta-折疊以及三個(gè)II類氨基酸轉(zhuǎn)運(yùn)合成酶圖形特征的N末端觸點(diǎn)區(qū)域;一個(gè)組氨酰tRNA合成酶特性的螺旋區(qū)域,它可以作為聯(lián)系tRNA接收器的途徑;一個(gè)alpha/beta區(qū)域的C末端,它可以作為識(shí)別反密碼子途徑以及組氨酰tRNA合成酶的循環(huán)。
氨?;磻?yīng)遵循標(biāo)準(zhǔn)的兩步機(jī)制。組氨酰tRNA合成酶也屬于這種氨基酸轉(zhuǎn)運(yùn)合成酶。許多組氨酸的類似物已經(jīng)被檢測(cè)出,他們作為酶作用物以及組氨酰tRNA合成酶抑制因子的特性,說明了結(jié)構(gòu)活躍性與相關(guān)結(jié)構(gòu)的關(guān)系,羧基以及氨基集團(tuán)的重要性,以及測(cè)鏈的實(shí)質(zhì)。同時(shí),組氨酰tRNA合成酶已經(jīng)被發(fā)現(xiàn)可以作為,例如風(fēng)濕性關(guān)節(jié)炎或者風(fēng)濕性心肌炎等自身免疫疾病當(dāng)中特別重要的免疫抗原,對(duì)于識(shí)別這些自身免疫抗原結(jié)合的抗原決定部位具有重要意義。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國(guó)云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長(zhǎng)溫度為75攝氏度,厭氧生長(zhǎng),革蘭氏染色反應(yīng)呈陽性。它由中國(guó)科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國(guó)微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2417T=JCM 11007T)。該嗜熱厭氧菌是我國(guó)特有的一個(gè)物種,其體內(nèi)所具有的耐高溫組氨酰tRNA合成酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫組氨酰tRNA合成酶活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫組氨酰tRNA合成酶活性多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的組氨酰tRNA合成酶重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫組氨酰tRNA合成酶活性的多肽的核苷酸序列。所說的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與組氨酰tRNA合成酶相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫組氨酰tRNA合成酶活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
本發(fā)明還提供了生產(chǎn)耐高溫組氨酰tRNA合成酶的方法為1)分離出編碼耐高溫組氨酰tRNA合成酶的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫組氨酰tRNA合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫組氨酰tRNA合成酶。
本發(fā)明涉及嗜熱厭氧菌的耐高溫組氨酰tRNA合成酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫組氨酰tRNA合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫組氨酰tRNA合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫組氨酰tRNA合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫組氨酰tRNA合成酶活性的多肽的方法。
圖1是測(cè)序文庫(kù)構(gòu)建步驟流程圖;圖2是測(cè)序與數(shù)據(jù)分析流程圖。
具體實(shí)施例方式
首先,本發(fā)明提供了分離的,編碼耐高溫組氨酰tRNA合成酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過對(duì)騰沖嗜熱厭氧菌全基因組測(cè)序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有417氨基酸的多肽,該多肽推測(cè)分子量為47365道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫組氨酰tRNA合成酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫組氨酰tRNA合成酶或多肽,其特征在于具有SEQ.ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫組氨酰tRNA合成酶基因”指編碼具有耐高溫組氨酰tRNA合成酶活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡(jiǎn)并序列。該簡(jiǎn)并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡(jiǎn)并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡(jiǎn)并性,所以與SEQ IDNO.1核苷酸序列同源性低至約70%的簡(jiǎn)并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ ID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測(cè)量,如用柱層析,PAGE或HPLC法測(cè)量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫組氨酰tRNA合成酶”指具有耐高溫組氨酰tRNA合成酶活性的SEQ ID NO.2序列的多肽。該術(shù)語還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫組氨酰tRNA合成酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫組氨酰tRNA合成酶的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫組氨酰tRNA合成酶時(shí),可以將耐高溫組氨酰tRNA合成酶基因序列與表達(dá)調(diào)控序列相連,從而形成耐高溫組氨酰tRNA合成酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對(duì)抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營(yíng)養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營(yíng)養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書注明的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。本發(fā)明的耐高溫組氨酰tRNA合成酶基因全長(zhǎng)序列或其片段通??梢杂镁酆厦告?zhǔn)椒磻?yīng)(PCR)擴(kuò)增法,重組法,或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(New YorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測(cè)序文庫(kù)測(cè)序文庫(kù)的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測(cè)序文庫(kù)構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問題,采用多種方法、不同條件的建庫(kù)原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測(cè)序的文庫(kù)。同時(shí),為了便于以后重疊群(contig)的搭接還構(gòu)建了長(zhǎng)插入片段(10kb左右)的測(cè)序文庫(kù)(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫(kù))。該文庫(kù)經(jīng)兩個(gè)末端的測(cè)序在完成圖(finishing)的過程中可以得到contig之間的關(guān)系,并可以解決較大的洞(gap)對(duì)補(bǔ)洞造成的困難。建庫(kù)流程見圖1。
實(shí)施例2基因組測(cè)序在完成騰沖嗜熱厭氧菌基因組的測(cè)序時(shí),主要使用了兩種全自動(dòng)測(cè)序儀ABI377和MegaBACE 1000。這兩種測(cè)序儀都是利用電泳原理進(jìn)行測(cè)序(見圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測(cè)序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測(cè)序儀。
實(shí)施例3Basecalling和測(cè)序質(zhì)量監(jiān)控所謂Basecalling是指從測(cè)序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測(cè)序儀上得到的是A,T,G,C四種堿基對(duì)應(yīng)的不同波長(zhǎng)的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對(duì)應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時(shí)對(duì)這個(gè)堿基給出可信度信息,即堿基的測(cè)序質(zhì)量。在大規(guī)模測(cè)序中,測(cè)序質(zhì)量的監(jiān)控是十分重要的,它直接影響對(duì)測(cè)序的決策,包括文庫(kù)的構(gòu)建,覆蓋率的大小。同時(shí)對(duì)測(cè)序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測(cè)序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考??紤]到測(cè)序中存在載體的影響,需要先對(duì)樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國(guó)Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(WatermanMS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測(cè)序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測(cè)序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對(duì)基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測(cè),基因功能的預(yù)測(cè),以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測(cè)基因編碼序列,然后所有預(yù)測(cè)的開讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無冗余蛋白數(shù)據(jù)庫(kù)(non-redundant protein database)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號(hào)肽序列和啟動(dòng)子序列等。如果在一個(gè)開讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測(cè)不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測(cè)序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫(kù)中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對(duì)應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無活性基因(假基因pseudogenes),因?yàn)檫@說明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長(zhǎng)度小于150堿基對(duì)并且在已有數(shù)據(jù)庫(kù)中沒有同源性和其中沒有明顯的啟動(dòng)子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析,結(jié)果再用InterPro數(shù)據(jù)庫(kù)(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(kù)(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫(kù)的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號(hào)肽區(qū)域。
(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測(cè)序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項(xiàng)十分具體而又繁雜的工作。主要方法包括A.利用測(cè)序中的正反向測(cè)序樣品信息在測(cè)序過程中,我們有意對(duì)某些樣品進(jìn)行了雙向測(cè)序,即同時(shí)測(cè)序某個(gè)插入片段的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對(duì)序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對(duì)序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考。
B.長(zhǎng)插入片段及Cosmid末端測(cè)序基于同樣的原理,我們可以構(gòu)建不同長(zhǎng)度的插入片段文庫(kù),只對(duì)其兩端測(cè)序,然后拼接,分析其具體位置。這些文庫(kù)包括長(zhǎng)度為9-12Kb的長(zhǎng)插入片段庫(kù)和20-40Kb左右的Cosmid文庫(kù)。具體分析方法同上所述。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對(duì)引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補(bǔ)洞等。
實(shí)施例6組氨酰tRNA合成酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的組氨酰tRNA合成酶全長(zhǎng)編碼序列(SEQ IDNO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測(cè)序文庫(kù)的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-HisS。
挑取單菌落的工程菌DH5α-pGEX-2T-HisS于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測(cè)純化效果。在47365道爾頓處的蛋白質(zhì)條帶即為組氨酰tRNA合成酶。
序列表<110>杭州華大基因研發(fā)中心<120>耐高溫組氨酰tRNA合成酶基因及其編碼的多肽和制備方法<140><141><160>2<170>PatentIn Version 3.1<210>1<211>1254<212>DNA<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<220><221>gene<222>(1)...(1254)<223>n=a或g或c或t<400>1atgcttacaa aagctccaag aggtactaag gacgttttgc cctcagaatc ctataaatgg 60cagtatgtgg agaatctgat gagggaaata tgcgaatttt acgggtacaa agaaatacgc 120acccctggat ttgagcatac agaacttttc ttaagagggg ttggggagtc tactgacatt 180gtgagaaaag agatgtacac ttttaatgat aggtctggaa ggagcattac tctaaaagca 240gaaggaactt ctcctgcagt tagagctttt atagagcatg gactttacgc agagacgcag 300cctacaaagc tttactacat aacccctgtg tacaggtatg aaaagcctca agcaggaagg 360ttaagagagc accatcagtt tggggtggag attttcgggg caaaaagcgc ttctgctgat 420gcagaagtca taagcattgc catgactctt ttaaaaaagt taggccttaa taacctggaa 480cttagaataa atagcgtggg gtgtcctgtt tgcaggaaga attacaacaa ggtgttgaag 540gagtttttga aagaacacct ggatgagctc tgtgacgatt gtaaggtgag atacgaagtc 600aatcctttaa gagtgcttga ctgcaaagtg gaaagttgca gaagggttac aggggaggca 660cctcttatta cggattatct ttgtgatgac tgcagaaacc attttgaaga gctaaagaag 720tatctggatg ctatgggata tgattacata gtcgatccca gaatagtgag agggcttgat 780tattacacta aaaccgcttt tgaaataatt tcaaaggaca ttggcgctca gggcactgtc 840tgcggcggtg ggaggtatga tgggctcata gaagagtgcg gcggaccttc aatgcctggg 900gtaggctttg gtatgggaat agaaaggctt cttctgactc tggagcagaa tggcattgaa 960attcctaagc cagaggggcc agaccttttt atagcttaca ttggcgatga agcgaagctt 1020tttactttta cccttgcgaa taaactcagg tttaacggtt taaaggtaga gatagaccat 1080atggaaagaa gtttaaaggc gcaaatgaaa tatgccaata aattaaatgc caaatttgct 1140gtggtgatag gtgaagaaga actcgagagc aaaaaagtga aattgaagaa tatggctaca 1200ggagaagaga cagaaatttt aattgatgaa atagaaaaag cgataaaaaa ttga1254<210>2<211>417<212>PRT<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<400>2Met Leu Thr Lys Ala Pro Arg Gly Thr Lys Asp Val Leu Pro Ser Glu1 5 10 15Ser Tyr Lys Trp Gln Tyr Val Glu Asn Leu Met Arg Glu Ile Cys Glu20 25 30Phe Tyr Gly Tyr Lys Glu Ile Arg Thr Pro Gly Phe Glu His Thr Glu35 40 45Leu Phe Leu Arg Gly Val Gly Glu Ser Thr Asp Ile Val Arg Lys Glu50 55 60Met Tyr Thr Phe Asn Asp Arg Ser Gly Arg Ser Ile Thr Leu Lys Ala65 70 75 80Glu Gly Thr Ser Pro Ala Val Arg Ala Phe Ile Glu His Gly Leu Tyr85 90 95Ala Glu Thr Gln Pro Thr Lys Leu Tyr Tyr Ile Thr Pro Val Tyr Arg100 105 110Tyr Glu Lys Pro Gln Ala Gly Arg Leu Arg Glu His His Gln Phe Gly115 120 125Val Glu Ile Phe Gly Ala Lys Ser Ala Ser Ala Asp Ala Glu Val Ile130 135 140Ser Ile Ala Met Thr Leu Leu Lys Lys Leu Gly Leu Asn Asn Leu Glu145 150 155 160Leu Arg Ile Asn Ser Val Gly Cys Pro Val Cys Arg Lys Asn Tyr Asn165 170 175Lys Val Leu Lys Glu Phe Leu Lys Glu His Leu Asp Glu Leu Cys Asp180 185 190Asp Cys Lys Val Arg Tyr Glu Val Asn Pro Leu Arg Val Leu Asp Cys195 200 205Lys Val Glu Ser Cys Arg Arg Val Thr Gly Glu Ala Pro Leu Ile Thr210 215 220Asp Tyr Leu Cys Asp Asp Cys Arg Asn His Phe Glu Glu Leu Lys Lys225 230 235 240Tyr Leu Asp Ala Met Gly Tyr Asp Tyr Ile Val Asp Pro Arg Ile Val245 250 255Arg Gly Leu Asp Tyr Tyr Thr Lys Thr Ala Phe Glu Ile Ile Ser Lys260 265 270Asp Ile Gly Ala Gln Gly Thr Val Cys Gly Gly Gly Arg Tyr Asp Gly275 280 285Leu Ile Glu Glu Cys Gly Gly Pro Ser Met Pro Gly Val Gly Phe Gly290 295 300Met Gly Ile Glu Arg Leu Leu Leu Thr Leu Glu Gln Asn Gly Ile Glu305 310 315 320Ile Pro Lys Pro Glu Gly Pro Asp Leu Phe Ile Ala Tyr Ile Gly Asp325 330 335Glu Ala Lys Leu Phe Thr Phe Thr Leu Ala Asn Lys Leu Arg Phe Asn340 345 350Gly Leu Lys Val Glu Ile Asp His Met Glu Arg Ser Leu Lys Ala Gln355 360 365Met Lys Tyr Ala Asn Lys Leu Asn Ala Lys Phe Ala Val Val Ile Gly370 375 380Glu Glu Glu Leu Glu Ser Lys Lys Val Lys Leu Lys Asn Met Ala Thr385 390 395 400Gly Glu Glu Thr Glu Ile Leu Ile Asp Glu Ile Glu Lys Ala Ile Lys405 410 415Asn
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫組氨酰tRNA合成酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫組氨酰tRNA合成酶相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫組氨酰tRNA合成酶活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫組氨酰tRNA合成酶的方法,其特征在于該方法包括1)分離出編碼耐高溫組氨酰tRNA合成酶基因的核苷酸序列SEQ IDNO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫組氨酰tRNA合成酶的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫組氨酰tRNA合成酶。
全文摘要
本發(fā)明公開了一種耐高溫組氨酰tRNA合成酶基因及其編碼的多肽和制備方法。它涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫組氨酰tRNA合成酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測(cè)序與分析為基礎(chǔ),克隆分離了耐高溫組氨酰tRNA合成酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫組氨酰tRNA合成酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明提供了具有耐高溫組氨酰tRNA合成酶活性的多肽的氨基酸序列及功能等同體。同時(shí),還提供了制備,分離,純化具有耐高溫組氨酰tRNA合成酶活性的多肽的方法。
文檔編號(hào)C12N15/63GK1379096SQ0211136
公開日2002年11月13日 申請(qǐng)日期2002年4月12日 優(yōu)先權(quán)日2002年4月12日
發(fā)明者汪建, 李蔚, 張麗敏, 田微, 包其郁 申請(qǐng)人:杭州華大基因研發(fā)中心