專利名稱:氨肽酶的制作方法
背景技術(shù):
1.發(fā)明領(lǐng)域本發(fā)明涉及到一種新的細菌性氨肽酶的發(fā)現(xiàn)。更具體而言,本發(fā)明針對的是一種重要的酶活性,細菌中缺失或過表達該酶,將導(dǎo)致細菌中未剪切或已剪切的多肽(如重組多肽)的回收率增加。
2.相關(guān)技術(shù)說明某些蛋白在革蘭氏陰性菌和古細菌如大腸桿菌中產(chǎn)生時,由于這些細胞中氨肽酶的存在,其N端氨基酸殘基會被剪切掉。結(jié)果,與野生型多肽緊密相關(guān)的雜質(zhì)就會同時或是在隨后的細胞裂解(作為產(chǎn)物純化過程的一部分)中,進入細胞培養(yǎng)物。如果制備的是用于治療的蛋白,這種雜質(zhì)必須從野生型多肽中除去。一個實例是人生長激素(hGH),當(dāng)其在大腸桿菌中生產(chǎn)時會將N端的苯丙氨酸殘基切除。這種通過細胞裂解產(chǎn)生的hGH變體(脫苯丙氨酸hGH,des-phe hGH)與未剪切的hGH(天然hGH)形成混合物,難于從混合物中去除。這種去除需要對混合物進行疏水相互作用層析。最好能避免此類額外的純化步驟。
此外,在某些情況下,希望得到切除鏈N端氨基酸殘基的多肽,并且使這種多肽的量相對于其天然序列對應(yīng)物的量大大增加,以獲得更純的剪切物。
數(shù)種已知的大腸桿菌氨肽酶有廣譜特異性并且能夠剪切N端的多種殘基,如pepA、pepB和pepN(大腸桿菌和沙門氏菌,F(xiàn)rederick C.Neidhardt(Ed),ASM Press.Chapter 62 by Charles Miller-Protein Degradation and ProteolyticModification,pp 938-954(1996);Gonzales and Robert-Baudouy,F(xiàn)EMSMicrobiology Reviews.18(4)319-44(1996))。大腸桿菌K12菌株中發(fā)現(xiàn)的yfcK基因編碼的b2324被大腸桿菌基因組測序計劃(Blattner等,Science,2771453-62(1997))在GenBank數(shù)據(jù)庫中列為“假定的肽酶”(登錄號AE000321),但未提供其酶活性的進一步信息。大腸桿菌O157:H7菌株中的同系物與K12菌株中的yfcK基因相同。本領(lǐng)域需要鑒定能通過操作獲得更純的未剪切或已剪切多肽的細菌氨肽酶。
發(fā)明概述yfcK基因編碼的b2324酶現(xiàn)已被鑒定為一種氨肽酶,即,一種負責(zé)從多肽中剪切N端的酶。在此鑒定的基礎(chǔ)上,本發(fā)明提出專利申請。
在實施方案中,通過對染色體的遺傳性破壞,將編碼與該酶同源的氨肽酶的基因,包括編碼氨肽酶b2324的yfcK基因,從革蘭氏陰性菌株中去除,從而不再產(chǎn)生顯著量的經(jīng)剪切的雜質(zhì)。因此排除了將已剪切的雜質(zhì)除去的額外純化步驟。至少已發(fā)現(xiàn)一個這樣獲得的菌株能夠產(chǎn)生與母體菌株相同量的未剪切多肽。
具體地,本發(fā)明提供革蘭氏陰性菌細胞,其染色體基因有缺陷,所述基因與以下分子有至少80%的序列同一性且編碼氨肽酶(a)編碼具有SEQID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體。這些細胞的天然等效細胞包含所述染色體基因,但本發(fā)明的細胞表現(xiàn)了一種對野生型細胞的處理方法,通常是通過遺傳手段,但也可通過任何可行的手段來去除這一基因或使其喪失功能,使得該基因不再編碼氨肽酶。
一方面,本發(fā)明提供了革蘭氏陰性菌細胞,其染色體基因有缺陷,所述基因包括(a)編碼多肽的DNA,所述多肽與SEQ ID NO2中氨基酸殘基1~688所示序列進行比對時陽性得分至少是80%,或(b)DNA分子(a)的互補體,所編碼的多肽是氨肽酶。
又一方面,本發(fā)明提供了在染色體基因中有缺陷的革蘭氏陰性菌細胞,所述基因與具有SEQ ID NO1中核苷酸1~2067所示序列的yfcK基因天然序列有至少80%的序列同一性,而且編碼氨肽酶。
在另一個實施方案中,本發(fā)明提供了一種大腸桿菌細胞,它在染色體天然序列yfcK基因中有缺陷。
優(yōu)選上述細胞在至少一種蛋白酶編碼基因(如degP或fhuA)中有缺陷。此外,這些細胞可包含編碼該細胞異源多肽的核酸,優(yōu)選真核生物的,更優(yōu)選哺乳動物的,而最優(yōu)選人類的多肽,如人生長激素。
在另一實施方案中,本發(fā)明提供了一種產(chǎn)生異源多肽的方法,該方法包括(a)培養(yǎng)上述細胞以及(b)從所述細胞中回收該多肽。優(yōu)選在發(fā)酵罐中進行細胞培養(yǎng)。在另一優(yōu)選的實施方案中,多肽是從細胞周質(zhì)或培養(yǎng)基中回收的。在更優(yōu)選的實施方案中,通過細胞破碎形成裂解物進行回收,并且優(yōu)選從裂解物中純化完整多肽。更優(yōu)選其中的裂解物在純化步驟前經(jīng)過溫育。
在另一方面,本發(fā)明提供了一種防止從多肽N端剪切氨基酸殘基的方法,包括培養(yǎng)上述細胞,其中所說的細胞含有編碼該多肽的核酸,培養(yǎng)要在該核酸能夠表達的條件下進行。優(yōu)選從這些細胞中回收多肽。此外,優(yōu)選對這些細胞而言異源的多肽,更優(yōu)選真核生物的,更優(yōu)選哺乳動物的,而最優(yōu)選人類的多肽。這些細胞優(yōu)選大腸桿菌細胞。
在另一方面,本發(fā)明提供了一種從分離自細胞的多肽中剪切N端氨基酸的方法,該方法包括將多肽與核酸編碼的氨肽酶接觸,所述核酸與以下分子有至少80%的序列同一性(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體。優(yōu)選將多肽與氨肽酶一起溫育。
另一方面,本發(fā)明提供了一種從分離自細胞的多肽中剪切N端氨基酸的方法,該方法包括將多肽與氨肽酶相接觸,該氨肽酶與具有SEQ ID NO2中氨基酸殘基1~688所示序列的天然序列氨肽酶b2324有至少80%的序列同一性。
在一個具體的方面,本發(fā)明提供了一種從多肽N端切去一個氨基酸的方法,該方法包括將多肽與天然序列氨肽酶b2324相接觸。
在另一實施方案中,本發(fā)明涉及產(chǎn)生經(jīng)剪切的多肽的方法,包括,培養(yǎng)含有一種核酸的革蘭氏陰性菌細胞,所述核酸與以下分子有至少80%的序列同一性且編碼氨肽酶(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體;所述細胞包含編碼相應(yīng)未剪切多肽的核酸,該多肽在其N末端有附加的氨基酸,其中所用的培養(yǎng)條件使該基因表達或過表達并使編碼未剪切多肽的核酸表達,如果未剪切多肽和氨肽酶在表達以后不接觸,則使所述未剪切多肽與氨肽酶接觸,以產(chǎn)生經(jīng)剪切的多肽。在優(yōu)選方面,多肽對細胞是異源的,更優(yōu)選真核生物的,甚至更優(yōu)選哺乳動物的,而最優(yōu)選人類的多肽。
在另一方面,本發(fā)明提供了一種產(chǎn)生經(jīng)剪切的多肽的方法,包括培養(yǎng)革蘭氏陰性細菌細胞,該細胞攜有編碼氨肽酶的核酸,該核酸與具有SEQ IDNO1中核苷酸1~2067所示序列的yfcK基因天然序列有至少80%的序列同一性,所述細胞包含編碼相應(yīng)未剪切多肽的核酸,該多肽在其N末端有附加的氨基酸,其中所用的培養(yǎng)條件使該基因表達或過表達并使編碼未剪切多肽的核酸表達,如果未剪切多肽和氨肽酶在表達以后不接觸,可使所述未剪切多肽與氨肽酶接觸,以產(chǎn)生經(jīng)剪切的多肽。
在另一方面,本發(fā)明提供了一種產(chǎn)生經(jīng)剪切的多肽的方法,該方法包括培養(yǎng)含有天然序列yfcK基因的大腸桿菌細胞,所述細胞包含編碼相應(yīng)未剪切多肽的核酸,該多肽在其N末端有附加的氨基酸,其中所用的培養(yǎng)條件使yfcK基因表達或過表達并使編碼未剪切多肽的核酸表達,如果未剪切多肽和yfcK基因編碼的天然序列氨肽酶b2324在表達以后不接觸,可使所述未剪切多肽與天然序列氨肽酶b2324接觸,以產(chǎn)生經(jīng)剪切的多肽。
在產(chǎn)生經(jīng)剪切的多肽的以上方法中,優(yōu)選方面包括,所述細胞在至少一個編碼蛋白酶的基因中有缺陷,和/或培養(yǎng)條件使yfcK基因(天然序列和同系物)過量表達,和/或接觸通過溫育進行。yfcK基因(天然序列和同系物)可以是細菌細胞天然具有的或者可以是被引入細菌細胞的。培養(yǎng)優(yōu)選在發(fā)酵罐中進行。未剪切的多肽優(yōu)選在與氨肽酶接觸之前從細胞中回收,其中可從細胞周質(zhì)或培養(yǎng)基中回收或者通過細胞裂解形成裂解物來回收,優(yōu)選從該裂解物中純化出經(jīng)剪切的多肽。在純化步驟前也可溫育裂解物。裂解物優(yōu)選在約20-40℃,更優(yōu)選約30-40℃,溫育至少約1小時,更優(yōu)選約2-50小時。
圖1描述了大腸桿菌細胞61G3的衍生途徑,該細胞是缺失yfcK基因(編碼b2324)的宿主菌。
圖2展示了室溫下溫育0,15,24和42小時的對照菌株16C9中,rhGH抽提物的面積百分比(液相層析/質(zhì)譜;LC/MS)柱狀圖,天然hGH,脫苯丙氨酸hGH,以及脫苯丙氨酸-脯氨酸hGH的含量以不同的陰影顯示。
圖3展示了含有缺陷基因的于室溫下溫育0,15,24和42小時的菌株61G3中,rhGH的面積百分比(LC/MS)柱狀圖,天然hGH,脫苯丙氨酸hGH,以及脫苯丙氨酸-脯氨酸hGH的含量以不同的陰影顯示。
圖4展示了于37℃下溫育0,15和24小時的對照菌株16C9中,rhGH抽提物的面積百分比(液相層析/質(zhì)譜;LC/MS)柱狀圖,天然hGH,脫苯丙氨酸hGH,以及脫苯丙氨酸-脯氨酸hGH的含量以不同的陰影顯示。
圖5展示了含有缺陷基因的于37℃下溫育0,15和24小時的菌株61G3中,rhGH的面積百分比(LC/MS)柱狀圖,天然hGH,脫苯丙氨酸hGH,以及脫苯丙氨酸-脯氨酸hGH的含量以不同的陰影顯示。
優(yōu)選實施方案詳述定義正如這里使用的,“細胞”、“細胞系”、“菌株”以及“細胞培養(yǎng)物”這些表述可互換使用,而且所有這些名稱都包括后代。因此,單詞“轉(zhuǎn)化體”和“轉(zhuǎn)化細胞”包括原代受試者細胞以及從其得來的培養(yǎng)物,而不考慮轉(zhuǎn)移次數(shù)。還應(yīng)理解,由于有準備的或意外的突變,不一定所有的后代在DNA內(nèi)容上都完全相同。那些篩選出來的與原初轉(zhuǎn)化細胞具有同樣功能或生物活性的突變體后代,也包括在內(nèi)。不同的名稱可以從上下文中清楚其意思。
這里使用的“細菌”是指革蘭氏陰性細菌。一種優(yōu)選的細菌類型是腸桿菌科。屬于腸桿菌科細菌的例子包括埃希氏菌屬、腸桿菌屬、歐文氏菌屬、克雷伯氏菌、變形菌屬、沙門氏菌屬、沙雷氏菌屬以及志賀氏菌屬。其它合適的細菌類型包括,固氮菌屬、假單胞菌屬、根瘤菌屬、透明顫菌屬以及副球菌屬。合適的大腸桿菌宿主包括大腸桿菌W3110(ATCC27,325)、大腸桿菌294(ATCC31,446)、大腸桿菌B以及大腸桿菌X1776(ATCC31,537)。這些例子是用來說明而不是局限于此,而且W3110是優(yōu)選的。上述任一種細菌的突變體細胞也可以使用。當(dāng)然,選擇合適的細菌時必須考慮細菌細胞中復(fù)制子的復(fù)制能力。例如,當(dāng)使用眾所周知的質(zhì)粒如pBR322、pBR325、pACYC177或pKN410提供復(fù)制子時,大腸桿菌、沙雷氏菌或沙門氏菌等種類適于用作宿主。
“染色體yfcK基因”是指編碼蛋白b2324的基因,該蛋白被大腸桿菌基因組測序計劃(Blattner等,上已述及)作為“假定的肽酶”列在GenBank數(shù)據(jù)庫中(登錄號AE000321)。該蛋白有Dayhoff登錄號B65005和SwissProt登錄號P77182,該基因位于大腸桿菌染色體52.59′位置,其堿基對位置=左端2439784bp右端2441790bp。該基因序列是TTGCGCAGCCTTACACACATCGCTAAGATCGAGCCACCGCCTGTAAGACGAGTAACTTACGTGAAACACTACTCCATACAACCTGCCAACCTCGAATTTAATGCTGAGGGTACACCTGTTTCCCGAGATTTTGACGATGTCTATTTTTCCAACGATAACGGGCTGGAAGAGACGCGTTATGTTTTTCTGGGAGGCAACCAATTAGAGGTACGCTTTCCTGAGCATCCACATCCTCTGTTTGTGGTAGCAGAGAGCGGCTTCGGCACCGGATTAAACTTCCTGACGCTATGGCAGGCATTTGATCAGTTTCGCGAAGCGCATCCGCAAGCGCAATTACAACGCTTACATTTCATTAGTTTTGAGAAATTTCCCCTCACCCGTGCGGATTTAGCCTTAGCGCATCAACACTGGCCGGAACTGGCTCCGTGGGCAGAACAACTTCAGGCGCAGTGGCCAATGCCCTTGCCCGGTTGCCATCGTTTATTGCTCGATGAAGGCCGCGTGACGCTGGATTTATGGTTTGGCGATATTAACGAACTGACCAGCCAACTGGACGATTCGCTAAATCAAAAAGTAGATGCCTGGTTTCTGGACGGCTTTGCGCCAGCGAAAAACCCGGATATGTGGACGCAAAATCTGTTTAACGCCATGGCAAGGTTGGCGCGTCCGGGCGGCACGCTGGCGACATTTACGTCTGCCGGTTTTGTCCGCCGCGGTTTGCAGGACGCCGGATTCACGATGCAAAAACGTAAGGGCTTTGGGCGCAAACGGGAAATGCTTTGCGGGGTGATGGAACAGACATTACCGCTCCCCTGCTCCGCGCCGTGGTTTAACCGCACGGGCAGCAGCAAACGGGAAGCGGCGATTATCGGCGGTGGTATTGCCAGCGCGTTGTTGTCGCTGGCGCTATTACGGCGCGGCTGGCAGGTAACGCTTTATTGCGCGGATGAGGCCCCCGCACTGGGTGCTTCCGGCAATCGCCAGGGGGCGCTGTATCCGTTATTAAGCAAACACGATGAGGCGCTAAACCGCTTTTTCTCTAATGCGTTTACTTTTGCTCGTCGGTTTTACGACCAATTACCCGTTAAATTTGATCATGACTGGTGCGGCGTCACGCAGTTAGGCTGGGATGAGAAAAGCCAGCATAAAATCGCACAGATGTTGTCAATGGATTTACCCGCAGAACTGGCTGTAGCCGTTGAGGCAAATGCGGTTGAACAAATTACGGGCGTTGCGACAAATTGCAGCGGCATTACTTATCCGCAAGGTGGTTGGCTGTGCCCAGCAGAACTGACCCGTAATGTGCTGGAACTGGCGCAACAGCAGGGTTTGCAGATTTATTATCAATATCAGTTACAGAATTTATCCCGTAAGGATGACTGTTGGTTGTTGAATTTTGCAGGAGATCAGCAAGCAACACACAGCGTAGTGGTACTGGCGAACGGGCATCAAATCAGCCGATTCAGCCAAACGTCGACTCTCCCGGTGTATTCGGTTGCCGGGCAGGTCAGCCATATTCCGACAACGCCGGAATTGGCAGAGCTGAAGCAGGTGCTGTGCTATGACGGTTATCTCACGCCACAAAATCCGGCGAATCAACATCATTGTATTGGTGCCAGTTATCATCGCGGCAGCGAAGATACGGCGTACAGTGAGGACGATCAGCAGCAGAATCGCCAGCGGTTGATTGATTGTTTCCCGCAGGCACAGTGGGCAAAAGAGGTTGATGTCAGTGATAAAGAGGCGCGCTGCGGTGTGCGTTGTGCCACCCGCGATCATCTGCCAATGGTAGGCAATGTTCCCGATTATGAGGCAACACT
CGTGGAATATGCGTCGTTGGCGGAGCAGAAAGATGAGGCGGTAAGCGCGCCGGTTTTTGACGATCTCTTTATGTTTGCGGCTTTAGGTTCTCGCGGTTTGTGTTCTGCCCCGCTGTGTGCCGAGATTCTGGCGGCGCAGATGAGCGACGAACCGATTCCGATGGATGCCAGTACGCTGGCGGCGTTAAACCCGAATCGGTTATGGGTGCGGAAATTGTTGAAGGGTAAAGCGGTTAAGGCGGGGTAA(SEQ ID NO1)其編碼的蛋白的序列為MRSLTHIAKIEPPPVRRVTYVKHYSIQPANLEFNAEGTPVSRDFDDVYFSNDNGLEETRYVFLGGNQLEVRFPEHPHPLFVVAESGFGTGLNFLTLWQAFDQFREAHPQAQLQRLHFISFEKFPLTRADLALAHQHWPELAPWAEQLQAQWPMPLPGCHRLLLDEGRVTLDLWFGDINELTSQLDDSLNQKVDAWFLDGFAPAKNPDMWTQNLFNAMARLARPGGTLATFTSAGFVRRGLQDAGFTMQKRKGFGRKREMLCGVMEQTLPLPCSAPWFNRTGSSKREAAIIGGGIASALLSLALLRRGWQVTLYCADEAPALGASGNRQGALYPLLSKHDEALNRFFSNAFTFARRFYDQLPVKFDHDWCGVTQLGWDEKSQHKIAQMLSMDLPAELAVAVEANAVEQITGVATNCSGITYPQGGWLCPAELTRNVLELAQQQGLQIYYQYQLQNLSRKDDCWLLNFAGDQQATHSVVVLANGHQISRFSQTSTIPVYSVAGQVSHIPTTPELAELKQVLCYDGYLTPQNPANQHHCIGASYHRGSEDTAYSEDDQQQNRQRLIDCFPQAQWAKEVDVSDKEARCGVRCATRDHLPMVGNVPDYEATLVEYASLAEQKDEAVSAPVFDDLFMFAALGSRGLCSAPLCAEILAAQMSDEPIPMDASTLAALNpNRLWVRKLLKGKAVKAG(SEQ ID NO2).
基因或核酸中的“缺陷”是指細胞中目標(biāo)基因缺失、失活或喪失能力等,導(dǎo)致不能產(chǎn)生其編碼的蛋白。例如,在編碼b2324的染色體基因yfcK中有缺陷的細胞,在培養(yǎng)時不能產(chǎn)生該基因的產(chǎn)物。同樣,在編碼蛋白酶的基因中有缺陷的細胞在培養(yǎng)時不能產(chǎn)生該具體的蛋白酶。
正如這里使用的,“多肽”一般是指來自任何細胞來源的含十個以上氨基酸的肽和蛋白?!爱愒础倍嚯氖悄切λ眉毎麃碚f外來的多肽,如大腸桿菌產(chǎn)生的人類蛋白。盡管異源多肽可以是原核或真核的,優(yōu)選真核的,更優(yōu)選哺乳動物的,最優(yōu)選人類的。
哺乳動物多肽的實例包括以下分子,例如,腎素;生長激素,包括人生長激素和牛生長激素;生長激素釋放因子;甲狀旁腺素;甲狀腺刺激素;脂蛋白;1-抗胰蛋白酶;胰島素A-鏈;胰島素B-鏈;前胰島素;血小板生成素;卵泡刺激素;降鈣素;黃體生成素;胰高血糖素;凝血因子如凝血因子VIIIC,凝血因子IX,組織因子,和von Willebrands因子;抗-凝血因子,如蛋白C;心房利鈉因子(atrial naturietic factor);肺表面活性物質(zhì);纖溶酶原激活劑,例如尿激酶或人尿或組織型纖溶酶原激活劑(t-PA);蛙皮素(bombesin);凝血酶;造血生長因子;腫瘤壞死因子α和β;腦啡肽酶;血清白蛋白,例如人血清白蛋白;Muellerian抑制物質(zhì);松弛素A鏈;松弛素B鏈;前松弛素;小鼠絨毛膜促性腺激素相關(guān)肽;微生物蛋白,例如β內(nèi)酰胺酶;DNase;抑制素;激活素;血管內(nèi)皮生長因子(VEGF);激素或生長因子的受體;整聯(lián)蛋白;蛋白A或D;類風(fēng)濕因子;神經(jīng)營養(yǎng)因子,例如腦衍生的神經(jīng)營養(yǎng)因子(BDNF),神經(jīng)營養(yǎng)蛋白-3、-4、-5或6(NT-3、NT-4、NT-5或NT-6)或神經(jīng)生長因子NGF;心營養(yǎng)蛋白(cardiotrophin)(心肥大因子)如心營養(yǎng)因子-1(CT-1);血小板衍生生長因子(PDGF);成纖維細胞生長因子,例如aFGF和bFGF;表皮生長因子(EGF);轉(zhuǎn)化生長因子(TGF),例如TGF-α和TGF-β,包括TGF-1、TGF-2、TGF-3、TGF-4或TGF-5;胰島素樣生長因子I和II(IGF-I和IGF-II);des(1-3)-IGF-I(腦IGF-I),胰島素樣生長因子結(jié)合蛋白;CD蛋白,例如CD3、CD4、CD8、和CD19;促紅細胞生成素;骨誘導(dǎo)因子;免疫毒素;骨形態(tài)發(fā)生(morphogenetic)蛋白(BMP);干擾素,例如干擾素-α、-β和γ;血清白蛋白,例如人血清白蛋白(HSA)或牛血清白蛋白(BSA);集落刺激因子(CSF),例如M-CSF、GM-CSF和G-CSF;白細胞介素(IL),例如IL-1到IL-10;抗-HER-2抗體;超氧化物歧化酶;T細胞受體;表面膜蛋白;衰變(decay)加速因子;病毒抗原,例如AIDS包膜的一部分;轉(zhuǎn)運蛋白;歸巢受體;粘著素(adderssin);調(diào)節(jié)蛋白;抗體;以及上述任何多肽的片段。一組優(yōu)選的目的多肽是具有N-末端苯丙氨酸的那些,如hGH。另一組優(yōu)選的目的多肽是產(chǎn)生在細菌的周質(zhì)或細胞培養(yǎng)基中的那些,如hGH。
術(shù)語“控制序列”是指在具體宿主生物中表達可操作連接的編碼序列所必需的DNA序列。適宜于細菌的控制序列包括啟動子,任選地操縱子序列,和核糖體結(jié)合位點。
當(dāng)核酸處于與另一個核酸序列有功能關(guān)系的位置上時,該核酸是“可操作相連的”。例如,前序列或分泌前導(dǎo)序列被表達為參與多肽分泌的前蛋白時,編碼前序列或分泌前導(dǎo)序列的DNA與編碼該多肽的DNA是可操作相連的;啟動子影響編碼序列的轉(zhuǎn)錄時,其與該編碼序列是可操作相連的;核糖體結(jié)合位點處在促進翻譯的位置上時,它與編碼序列是可操作相連的。通常,“可操作相連”是指相連的DNA是鄰接的,而且,在分泌前導(dǎo)序列的情況中,是鄰接并處在同一個閱讀框中的。連接可通過,例如,在便利的限制性位點連接來完成的。如果不存在這類位點,可根據(jù)常規(guī)實踐使用合成的寡核苷酸接頭或連接區(qū)。
關(guān)于基因或核酸的術(shù)語“過表達”,是指具體蛋白的合成量超過了該細胞在未經(jīng)人為誘導(dǎo)該合成時通常所產(chǎn)生的量,如利用啟動子的方法。
術(shù)語多肽的“回收”通常是指從產(chǎn)生該多肽的細胞中獲得該多肽的釋放。
術(shù)語“氨肽酶b2324多肽”、“氨肽酶b2324蛋白”以及“氨肽酶b2324”在這里使用時,包含天然氨肽酶b2324和氨肽酶b2324同系物(其在這里有更進一步的說明)。根據(jù)上下文,氨肽酶b2324多肽可以從多種來源分離得到,例如從細菌細胞得到,或通過重組方法和/或合成方法來制備。
“天然序列氨肽酶b2324”包括與天然產(chǎn)生的氨肽酶b2324具有同樣的氨基酸序列的多肽。此類天然序列氨肽酶b2324可以從自然界分離,也可以用重組方法和/或合成方法產(chǎn)生。術(shù)語“天然序列氨肽酶b2324”具體包括,天然產(chǎn)生的截短形式或分泌形式(例如,胞外區(qū)序列)、天然產(chǎn)生的變異體形式(例如,選擇性剪接形式)以及天然產(chǎn)生的氨肽酶b2324等位基因變異體。在本發(fā)明的一個實施方案中,天然序列氨肽酶b2324是包含SEQ IDNO2中氨基酸1~688的成熟或全長天然序列氨肽酶b2324。
“氨肽酶b2324同系物”是指與具有SEQ ID NO2中氨基酸殘基1~688所示序列的氨肽酶b2324有至少80%序列同一性的氨肽酶。此類氨肽酶b2324同系物包括,在SEQ ID NO2序列的N-或C-末端以及在一個或多個內(nèi)部結(jié)構(gòu)域中,添加或刪除了一個或多個氨基酸殘基的氨肽酶b2324多肽。優(yōu)選氨肽酶b2324同系物與SEQ ID NO2的殘基1~688所示氨基酸序列有至少85%的氨基酸序列同一性,更優(yōu)選至少90%,甚至更優(yōu)選至少95%。同系物不包括該天然序列。
yfcK基因是指,與以下分子有至少80%的序列同一性且編碼氨肽酶的基因(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體;還指與具有SEQ ID NO1完整序列的染色體yfcK基因有至少80%的序列同一性并編碼氨肽酶的基因。此類yfcK基因包括,例如染色體yfcK基因,其在SEQ ID NO1序列的5’-或3’-端以及內(nèi)部區(qū)域中,添加或刪除了一個或多個核苷酸殘基。優(yōu)選yfcK基因與SEQ ID NO1的核苷酸1~2067所示序列有至少85%的核酸序列同一性,更優(yōu)選至少90%,甚至更優(yōu)選至少95%。該術(shù)語包括天然序列yfcK基因(即染色體yfcK基因)。
就這里確定的氨肽酶b2324序列而言,“氨基酸序列同一性百分數(shù)(%)”定義為,經(jīng)序列比對以及必要時引入缺口以達到最大序列同一性百分數(shù),而且將任何保守取代都不作為序列同一性來考慮時,候選序列與氨肽酶b2324序列中相同的氨基酸殘基的百分數(shù)。這里用到的%同一性值可通過WU-BLAST-2產(chǎn)生,WU-BLAST-2可從(Altschul等,Methods inEnzymology,266460-480(1996);http//blast.wustl/edu/blast/README.html)獲得。WU-BLAST-2使用數(shù)個搜索參數(shù),其中大多數(shù)設(shè)定為默認值??烧{(diào)整的參數(shù)用下列值來設(shè)定重疊跨度(overlap span)=1,重疊分數(shù)(overlapfraction)=0.125,搜索單詞分數(shù)閾值(word threshold)(T)=11。HSP S和HSP S2參數(shù)是動態(tài)值,是程序本身依據(jù)具體序列組成和用以搜索目標(biāo)序列的具體數(shù)據(jù)庫組成來建立的;不過,可調(diào)整這些值以提高靈敏度。氨基酸序列同一性%值用相同殘基的數(shù)目除以比對區(qū)域中“較長”序列的殘基總數(shù)來確定?!拜^長”序列是比對區(qū)域中具有最真實殘基的序列(忽略WU-Blast-2為使比對分數(shù)最大化而引入的缺口)。
在如上述進行序列比較的上下文中,術(shù)語“陽性”包括經(jīng)比較的序列中那些不相同但有相似性質(zhì)的殘基(例如是保守取代的結(jié)果)。陽性的%值是用在BLOSUM 62矩陣中得正分的殘基部分,除以如上述定義的較長序列的殘基總數(shù)來確定的。
以類似的方式,就這里確定的氨肽酶b2324多肽編碼序列而言,“核苷酸序列同一性百分數(shù)(%)”定義為,在候選序列中與該氨肽酶b2324多肽編碼序列中相同的核苷酸殘基的百分數(shù)。這里用到的同一性值可以通過WU-BLAST-2的BLASTN模塊來產(chǎn)生,使用默認參數(shù),其中重疊跨度和重疊分數(shù)分別設(shè)定為1和0.125。
“分離的”,當(dāng)用于描述本文公開的各種多肽時,是指已從其天然環(huán)境組分中鑒定和分離和/或收獲的多肽。肽的天然環(huán)境中的污染成分,是通常將干擾該多肽的診斷和治療應(yīng)用的物質(zhì),可包括酶、激素和其它蛋白性或非-蛋白性溶質(zhì)。在優(yōu)選的實施方案中,多肽經(jīng)過純化可以達到以下程度(1)經(jīng)轉(zhuǎn)杯式測序儀(spinning cup sequenaor)測出N-末端或內(nèi)部氨基酸序列的至少15個殘基,或者(2)經(jīng)過非-還原或還原條件下的SDS-PAGE和考馬斯藍或優(yōu)選銀染色測出為均相。分離的多肽包括在重組細胞內(nèi)的原位多肽,因為氨肽酶b2324天然環(huán)境的至少一種組分是不存在的。然而,通常用至少一個純化步驟來制備分離的多肽。
編碼氨肽酶b2324多肽的“分離的”核酸分子,是從氨肽酶b2324編碼核酸的天然來源中鑒定出并與該來源中通常與其相關(guān)的至少一種核酸分子污染物分離的核酸分子。分離的氨肽酶b2324編碼核酸分子在形式或框架上與其在天然中發(fā)現(xiàn)的不同。分離的核酸分子由此與氨肽酶b2324編碼核酸分子在天然細胞中的形式區(qū)別開來。但編碼氨肽酶b2324多肽的分離的核酸分子還包括,在通常表達氨肽酶b2324、但該核酸分子的染色體位置不同于天然細胞中位置的那些細胞中所含有的編碼氨肽酶b2324的核酸分子。
具體實施例方式
在一個方面,本發(fā)明涉及細菌性宿主細胞株,該細胞株缺乏氨肽酶(即,剪切多肽N端氨基酸殘基的酶,例如在N末端苯丙氨酸和另一個緊挨著它的氨基酸之間進行剪切的酶),因此允許對多肽進一步純化。
具體地,本發(fā)明這一方面提供了一種革蘭氏陰性菌細胞,該細胞在染色體基因中有缺陷(這一基因在這些細胞的野生型中并無缺陷),所述基因與以下分子有至少80%的序列同一性且編碼氨肽酶(a)編碼具有SEQ IDNO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體。即,所述基因與yfcK基因共享至少80%的序列同一性。優(yōu)選地,該基因與yfcK基因(編碼天然序列氨肽酶b2324)共享至少約85%的序列同一性,更優(yōu)選至少約90%,還更優(yōu)選至少約95%,最優(yōu)選100%的序列同一性。
在另一方面,所述革蘭氏陰性菌細胞在編碼氨肽酶的染色體基因中有缺陷(這一基因在這些細胞的野生型中并無缺陷),該基因與具有SEQ IDNO2中氨基酸1~688的天然序列氨肽酶b2324有至少80%的序列同一性。優(yōu)選地,所述氨肽酶有至少約85%,更優(yōu)選至少約90%,還更優(yōu)選至少約95%的序列同一性。這包括在染色體yfcK基因天然序列中有缺陷的細胞。
在第三個方面,所述革蘭氏陰性菌細胞在染色體基因中有缺陷(這一基因在這些細胞的野生型中并無缺陷),所述基因包括(a)編碼多肽的DNA,所述多肽與跨越SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324進行比對時陽性得分至少是80%,或(b)DNA分子(a)的互補體,所述多肽是氨肽酶。這包括與天然序列氨肽酶b2324的陽性比對得分為100%的細胞。
本發(fā)明這一方面的研究對象是革蘭氏陰性菌細胞,例如基因組已測序的細菌,如沙門氏菌屬、耶爾森氏菌屬、嗜血菌屬、柄桿菌屬、瓊脂桿菌屬(Agrobacterium)、弧菌屬等,其中預(yù)計有yfcK同系物。更優(yōu)選沙門氏菌屬或腸桿菌科的細胞,還更優(yōu)選大腸桿菌,最優(yōu)選W3110。
細胞可在一個或多個其它的染色體基因中有進一步的缺失,所述基因是這些細胞的野生型中存在的基因,例如那些編碼細菌性蛋白酶的基因。蛋白酶基因有缺陷或控制對蛋白酶的調(diào)節(jié)的基因中有缺陷的大腸桿菌菌株是已知的(Beckwith and Strauch,WO 88/05821 published August 11,1988;Chaudhury and Smith,J.Bacteriol.,160788-791(1984);Elish等.,J.Gen.Microbiol.,1341355-1364(1988);Baneyx and Georgiou,“Expression ofproteolytically sensitive polypeptides in Escherichia coli,”InStability of ProteinPharmaceuticals,Vol.3Chemical and Physical Pathways of Protein Degradation,Ahern and Manning,eds.(Plenum Press,New York,1992),p.69-108)。
這些蛋白酶缺陷菌株中的一些已用于嘗試有效產(chǎn)生對蛋白水解作用敏感的多肽,特別是那些有潛在醫(yī)藥或商業(yè)價值的多肽。美國專利5,508,192(Georgiou等)描述了許多蛋白酶缺陷型和/或熱休克蛋白缺陷型細菌宿主的構(gòu)建。這些宿主包括單一、雙重、三重或四重蛋白酶缺陷的細菌和在rpoH基因中也帶有突變的單一蛋白酶細菌。已公開的蛋白酶基因的例子包括degP ompT ptr3,prc(tsp)和degP rpoH株,據(jù)報道,其可在大腸桿菌中產(chǎn)生大量重組蛋白。Park等,Biotechnol.Prog.,15164-167(1999)報道缺失兩種細胞外膜蛋白酶(degP prc)的菌株(HM114)與有更多蛋白酶缺失的其它菌株相比,生長稍快并且產(chǎn)生更多的融合蛋白。本文的細胞可缺失任何一個或多個這樣的蛋白酶,所述蛋白酶優(yōu)選為染色體ptr3編碼的蛋白酶III,染色體ompT編碼的蛋白酶OmpT,和/或染色體degP編碼的蛋白酶DegP。這些菌株也可在tonA(fhuA),phoA,和/或deoC中有缺陷。優(yōu)選在degP和/或fhuA中有缺陷的細胞。最優(yōu)選具有基因型W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096ΔyfcK的細胞。
在另一實施方案中,細胞中包含編碼對細胞而言是異源的多肽的核酸。該核酸可通過任何方式引入細胞,但是優(yōu)選使用轉(zhuǎn)化該核酸的方式,諸如通過使用重組表達載體或通過同源重組方式,最優(yōu)選通過載體引入。
合適的異源多肽例如以上定義的那些,并包括以甲硫氨酸殘基起始而且第二個殘基是苯丙氨酸的蛋白和多肽,以及以苯丙氨酸起始的蛋白(即,那些在成熟形態(tài)中以苯丙氨酸起始或經(jīng)進一步蛋白水解化處理以去除起始甲硫氨酸的蛋白,和那些切除了信號肽、剩下苯丙氨酸作為成熟蛋白N末端殘基的前蛋白,例如人生長激素)。因此,任何對其生產(chǎn)細菌細胞而言是異源的、并且其成熟產(chǎn)物或終產(chǎn)物的氨基端是苯丙氨酸的那些多肽,都將為了這一目的而包括在本文中。
符合苯丙氨酸這一位置要求的人類多肽的例子包括膠原蛋白α2鏈前體、T細胞表面糖蛋白cd3δ鏈前體、胰島素前體、整聯(lián)蛋白α-3前體、整聯(lián)蛋白α-5前體、整聯(lián)蛋白α-6前體、整聯(lián)蛋白α-7前體、整聯(lián)蛋白α-e前體、整聯(lián)蛋白α-m前體、整聯(lián)蛋白α-v前體、整聯(lián)蛋白α-x前體、磷脂酰膽堿-甾醇酰基轉(zhuǎn)移酶前體、淋巴細胞功能相關(guān)抗原3前體、間質(zhì)膠原酶前體、中性膠原酶前體、胃動素前體、neuropilin-1前體、血小板激活因子乙酰水解酶前體、骨唾液蛋白ii前體、生長激素變體前體(Seeburg,DNA 1239-249(1982))、促生長激素前體、小分子誘導(dǎo)型細胞因子a13前體、小分子誘導(dǎo)型細胞因子a27前體、小分子誘導(dǎo)型細胞因子b11前體、腫瘤壞死因子受體超家族成員8前體、促甲狀腺素β鏈前體、血管內(nèi)皮生長因子c前體、前原胰島素(BE885196-A)、人生長激素變體HGH-V(EP89666-A)、人原胰島素(US4431740)、pAP-1(EP177343-A)編碼的AP信號肽以及人生長激素(hGH)、人生長激素(hGF)前體(EP245138-A)、人BMP(EP409472-A)人LFA-3(CD58)蛋白(DE4008354-A)、人II型白細胞介素-1受體(EP460846-A)、腎毒性減弱的抑酶肽類似物#6(WO9206111-A)、腎毒性減弱的抑酶肽類似物#7(WO9206111-A)、腎毒性減弱的抑酶肽類似物#8(WO9206111-A)、腎毒性減弱的抑酶肽類似物#10(WO9206111-A)、腎毒性減弱的抑酶肽類似物#9(WO9206111-A)、腎毒性減弱的抑酶肽類似物#11(WO9206111-A)、腎毒性減弱的抑酶肽類似物#12(WO9206111-A)、腎毒性減弱的抑酶肽類似物#13(WO9206111-A)、腎毒性減弱的抑酶肽類似物#14(WO9206111-A)、α6A整聯(lián)蛋白亞基(WO9219647-A)、α6B整聯(lián)蛋白亞基(WO9219647-A)、人LFA-3蛋白(EP517174-A)、人血漿羧肽酶B(US5206161-A)、類淋巴母細胞源的IL-1R(WO9319777-A)、人LFA-3(JP06157334-A)、由淋巴細胞激活(ILA)誘導(dǎo)的人類受體(CA2108401-A)、內(nèi)皮細胞蛋白受體(WO9605303-A1)、人卵磷脂-膽固醇?;D(zhuǎn)移酶(LCAT)(WO9717434-A2),人的可溶性CD30抗原(DE9219038-U1)、人的小分子CCN樣生長因子(WO9639486-A1)、人血漿羧肽酶B(US5593674-A)、人生長激素(WO9820035-A1)、由質(zhì)粒pKFN-864片段編碼的胰島素類似物(EP861851-A1)、靈長類CXC趨化因子“IBICK”多肽(WO9832858-A2)、人的小分子CCN樣生長因子(US5780263-A)、人血漿透明質(zhì)酸酶(hpHAse)的氨基酸序列(WO9816655-A1)、人II型IL-1R蛋白(US5767064-A)、人(homo sapiens)克隆CC365_40蛋白(WO9807859-A2)、人生長激素(US5955346-A)、人可溶性生長激素受體(US5955346-A)、人CD30抗原蛋白(WO9940187-A1)、人neuropilin-1(WO9929858-A1)、人腦組織來源的多肽(克隆OMB096)(WO9933873-A1)、人Toll蛋白PRO285(WO9920756-A2)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌肽的氨基酸序列(WO9911293-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人分泌蛋白的氨基酸序列(WO9907891-A1)、人血漿羧肽酶B(PCPB)thr147(WO9855645-A1)、人趨化因子MIG-β蛋白(EP887409-A1)、人分泌蛋白的氨基酸序列(WO200052151-A2)、由質(zhì)粒pWRG1630編碼的人hGH/EGF融合蛋白(US6090790-A)、由cDNA克隆3470865編碼的人分泌蛋白(WO200037634-A2)、人單核細胞來源的蛋白FDF03DeltaTM(WO200040721-A1)、人單核細胞來源的蛋白FDF03-S1(WO200040721-A1)、人單核細胞來源的蛋白FDF03-M14(WO200040721-A1)、人單核細胞來源的蛋白FDF03-S2(WO200040721-A1)、人分泌蛋白#2(EP1033401-A2)、人前原-血管內(nèi)皮生長因子C(WO200021560-A1)、人膜轉(zhuǎn)運蛋白MTRP-15(WO200026245-A2)、人血管內(nèi)皮生長因子(VEGF)-C蛋白(WO200024412-A2)、人TANGO191(WO200018800-A1)、干擾素受體-HKAEF92(WO9962934-A1)、人整聯(lián)蛋白亞基α-10(WO9951639-A1)、人整聯(lián)蛋白亞基α-10剪接變體(WO9951639-A1)、人δ1-吡咯啉-5-羧酸酯還原酶同系物(P5CRH)(US6268192-B1)、人生長/分化因子-6-樣蛋白AMF10(WO200174897-A2)、人轉(zhuǎn)運蛋白和離子通道-6(TRICH-6)蛋白(WO200162923-A2)、人轉(zhuǎn)運蛋白和離子通道-7(TRICH-7)蛋白(WO200162923-A2)、人基質(zhì)金屬蛋白酶-1(MMP-1)蛋白(WO200166766-A2)、人基質(zhì)金屬蛋白酶-8(MMP-8)蛋白(WO200166766-A2)、人基質(zhì)金屬蛋白酶-18P(MMP-18P)蛋白(WO200166766-A2)、人G蛋白偶聯(lián)受體6(GPCR6)蛋白(WO200181378-A2)、人Zlec1蛋白(WO200166749-A2)、人基質(zhì)金屬蛋白酶(MMP)-樣蛋白(WO200157255-A1)、人基因15編碼的分泌蛋白HFXDI56(WO200154708-A1)、人基因9編碼的分泌蛋白HTEGF16(WO200154708-A1)、人分泌蛋白(SECP)#4(WO200151636-A2)、人基因20編碼的分泌蛋白HUSIB13(WO200151504-A1)、人基因28編碼的分泌蛋白HISAQ04(WO200151504-A1)、人基因35編碼的分泌蛋白HCNAH57(WO200151504-A1)、人基因17編碼的分泌蛋白HBMCF37(WO200151504-A1)、人腫瘤壞死因子(TNF)刺激d基因-6(TSG-6)蛋白(US6210905-B1)、FCTR10(WO200146231-A2)、人基因18編碼的分泌蛋白HFKHW50(WO200136440-A1)、人基因18編碼的分泌蛋白HFKHW50(WO200136440-A1)、人基因13編碼的分泌蛋白HE8FC45(WO200077022-A1)、人基因32編碼的分泌蛋白HTLIF12(WO200077022-A1)、人基因4編碼的分泌蛋白HCRPV17(WO200134643-A1)、人基因23編碼的分泌蛋白HE8OK73(WO200134643-A1)、人基因4編碼的分泌蛋白HCRPV17(WO200134643-A1)、人基因22編碼的分泌蛋白HMSFK67(WO200132676-A1)、人基因22編碼的分泌蛋白HMSFK67(WO200132676-A1)、人基因22編碼的分泌蛋白HMSFK67(WO200132676-A1)、人基因19編碼的分泌蛋白HCRNF14(WO200134800-A1)、人基因6編碼的分泌蛋白HNEEB45(WO200132687-A1)、人基因6編碼的分泌蛋白HNEEB45(WO200132687-A1)、人基因9編碼的分泌蛋白HHPDV90(WO200132675-A1)、人基因1編碼的分泌蛋白B7-H6(WO200134768-A2)、人基因3編碼的分泌蛋白HDPMS12(WO200134768-A2)、人基因13編碼的分泌蛋白HRABS65(WO200134768-A2)、人基因1編碼的分泌蛋白HDPAP35(WO200134768-A2)、人基因3編碼的分泌蛋白HDPMS12(WO200134768-A2)、人基因17編碼的分泌蛋白HACCL63(WO200134769-A2)、人基因17編碼的分泌蛋白HACCL63(WO200134769-A2)、人基因10編碼的分泌蛋白HHEPJ23(WO200134629-A1)、人基因10編碼的分泌蛋白HHEPJ23(WO200134629-A1)、人基因5編碼的分泌蛋白HE9QN39(WO200134626-A1)、人基因14編碼的分泌蛋白HCRNO87(SEQ 104)(WO200134626-A1)、人基因5編碼的分泌蛋白HE9QN39(WO200134626-A1)、人基因14編碼的分泌蛋白HCRNO87((SEQ 145)(WO200134626-A1)、人基因4編碼的分泌蛋白HSODE04(WO200134623-A1)、人基因6編碼的分泌蛋白HMZMF54(WO200134623-A1)、人基因18編碼的分泌蛋白HPJAP43(WO200134623-A1)、人基因27編碼的分泌蛋白HNTSL47(WO200134623-A1)、人基因4編碼的分泌蛋白HSODE04(WO200134623-A1)、人基因6編碼的分泌蛋白HMZMF54(WO200134623-A1)、人基因18編碼的分泌蛋白HPJAP43(WO200134623-A1)、人基因27編碼的分泌蛋白HNTSL47(WO200134623-A1)、人基因21編碼的分泌蛋白HLJEA01(WO200134767-A2)、人基因25編碼的分泌蛋白HTJNX29(SEQ 115)(WO200134627-A1)、人基因25編碼的分泌蛋白HTJNX29(SEQ 165)(WO200134627-A1)、人TANGO509氨基酸序列(WO200121631-A2)、人TANGO210蛋白(WO200118016-A1)、人癌癥相關(guān)蛋白12(WO200118014-A1)、人癌癥相關(guān)蛋白18(WO200118014-A1)、人B7-4分泌型(B7-4S)蛋白(WO200114557-A1)、人B7-4膜蛋白(B7-4M)(WO200114557-A1)、人B7-4分泌型(B7-4S)蛋白(WO200114556-A1)、人B7-4膜(B7-4M)蛋白(WO200114556-A1)、人白細胞介素DNAX80變體(WO200109176-A2)、人卵磷脂-膽固醇?;D(zhuǎn)移酶(LCAT)(WO200105943-A2)、人多肽PRO1419的氨基酸序列(WO200077037-A2)、人α11整聯(lián)蛋白鏈的氨基酸序列(WO200075187-A1)、人A259(WO200073339-A1)、人骨髓來源的肽(WO200166558-A1)、人腫瘤相關(guān)抗原靶-169(TAT169)蛋白(WO200216602-A2)、人基因3編碼的分泌蛋白HKZAO35ID(WO200218411-A1)、人基因3編碼的分泌蛋白HKZAO35(WO200218411-A1)、人基因11編碼的分泌蛋白HLYCK27(WO200218435-A1)、人INTG-1蛋白(WO200212339-A2)、人基因15編碼的分泌蛋白HFPHA80,SEQ 70(WO200216390-A1)、人基因15編碼的分泌蛋白HFPHA80,SEQ 94(WO200216390-A1)、人基因2編碼的分泌蛋白HDQFU73,SEQ 69(WO200224719-A1)、人基因8編碼的分泌蛋白HDPTC31,SEQ 75(WO200224719-A1)、人基因2編碼的分泌蛋白HDQFU73,SEQ 90(WO200224719-A1)、人基因6編碼的分泌蛋白HDPRJ60,SEQ 95(WO200224719-A1)、人基因8編碼的分泌蛋白HDPTC31,SEQ 99(WO200224719-A1)、人基因8編碼的分泌蛋白HDPTC31,SEQ 100(WO200224719-A1)、人原胰島素類似物(WO200204481-A2)、腫瘤相關(guān)抗原靶蛋白TAT136(WO200216429-A2)、腫瘤相關(guān)抗原靶多肽(TAT)136(WO200216581-A2)、人CD30蛋白序列(WO200211767-A2)、人白細胞介素1R2(IL-1R2)蛋白序列(WO200211767-A2)、人G蛋白偶聯(lián)的受體-7(GPCR-7)蛋白(WO200206342-A2)、人G蛋白偶聯(lián)的受體(GPCR6a)(WO200208289-A2)、人G蛋白偶聯(lián)的受體(GPCR6b)(WO200208289-A2)、人II型白細胞介素-1受體(WO200187328-A2)、人A259多肽(WO200181414-A2)、人血管細胞粘附分子VCAM1(US6307025-B1)、人血管細胞粘附分子VCAM1b(US6307025-B1)、人轉(zhuǎn)運蛋白和離子通道(TRICH)-6(WO200177174-A2)以及人蛋白修飾和維持分子-8(PMMM-8)(WO200202603-A2)。
在另一方面上,本發(fā)明提供了一種產(chǎn)生異源多肽的方法,該方法包括(a)培養(yǎng)攜有編碼異源多肽的核酸的細胞,以及(b)從該細胞中回收此多肽??蓮募毎|(zhì)、細胞周質(zhì)或細胞培養(yǎng)基中進行回收,優(yōu)選從細胞周質(zhì)或細胞培養(yǎng)基中回收多肽。優(yōu)選在發(fā)酵罐中進行培養(yǎng)。按照傳統(tǒng)方式使用培養(yǎng)參數(shù)和獲得多肽產(chǎn)物,例如以下描述的那些方法。
當(dāng)所需多肽在細胞質(zhì)中產(chǎn)生時,不必在細胞裂解之前或之后進行溫育,盡管這樣可以提高剪切物形成的效率。當(dāng)所需多肽分泌到細胞周質(zhì)或細胞培養(yǎng)基中時,則優(yōu)選和推薦一個至少約0.5小時的溫育步驟。為了回收生成在周質(zhì)中的多肽,優(yōu)選方法是裂解或破碎細胞,體積較大時采用,例如,勻漿器、弗氏細胞壓碎器和微流化器(microfluidizer),體積較小時采用超聲破碎儀。從破碎的細胞中得到裂解物,然后從中純化出完整的多肽。優(yōu)選在純化步驟前溫育上述裂解物。溫育可在任何適宜的溫度下操作,但優(yōu)選在室溫或以下溫度溫育至少約1小時,更優(yōu)選約2-50小時。多肽和細胞類型優(yōu)選如上所述。
此外,本發(fā)明提供了一種防止從多肽N端剪切氨基酸殘基的方法,該方法包括培養(yǎng)細胞,所述細胞包含編碼多肽的核酸,所用培養(yǎng)條件使該核酸表達。這些培養(yǎng)條件是常規(guī)的并且是本領(lǐng)域技術(shù)人員已知的。優(yōu)選從所述細胞回收多肽。優(yōu)選的多肽和細胞類型如上所述。
或者相反,從視為雜質(zhì)的未剪切多肽中純化經(jīng)剪切的多肽。在這個方面,本發(fā)明提供了一種從多肽中剪切N端氨基酸的方法,該方法包括將多肽與氨肽酶b2324蛋白按以上所描述進行接觸,其中優(yōu)選通過與氨肽酶b2324蛋白共同溫育進行接觸。產(chǎn)生剪切多肽的更進一步的方法包括培養(yǎng)含有yfcK基因的細菌細胞(無論該基因?qū)毎麃碇v是內(nèi)源的或異源的),所述細胞還包含編碼相應(yīng)未剪切多肽的核酸,該多肽在其N端有附加氨基酸,其中的培養(yǎng)條件使yfcK基因表達或過表達并使編碼未剪切多肽的核酸表達,并且如果未剪切多肽和氨肽酶b2324蛋白在表達后并不接觸,將未剪切多肽與氨肽酶b2324蛋白相接觸以便產(chǎn)生經(jīng)剪切的多肽。
優(yōu)選地,所述多肽對細胞而言是異源的,并且更優(yōu)選是上文列出的一種多肽。優(yōu)選地,細胞的類型選自上文所述,除了未缺失yfcK基因的細胞以外的類型。yfcK基因可由載體導(dǎo)入或?qū)λ拗骷毎允莾?nèi)源的,并且優(yōu)選相對于編碼多肽的核酸的表達而言被過表達,以便有助于酶切反應(yīng)。
在另一優(yōu)選方面,未剪切的多肽在與氨肽酶b2324蛋白接觸前從細胞中回收。在回收中,優(yōu)選破碎(采用上述技術(shù))并且隨后裂解細胞。裂解后,優(yōu)選將未剪切的多肽與氨肽酶b2324蛋白溫育以剪切掉氨基末端,并且從溫育后的裂解物中純化剪切的多肽。裂解物優(yōu)選在約20-40℃溫育至少約1小時,更優(yōu)選在約30-40℃溫育約2-50小時。
I.未剪切的多肽的生產(chǎn)和回收A.將核酸分子插入復(fù)制載體編碼目的多肽的核酸分子可以是任何來源的cDNA或基因組DNA,只要該分子編碼目的多肽。
異源核酸(例如cDNA或基因組DNA)可以插入能在細菌中表達的復(fù)制載體并處于合適的啟動子控制下。很多載體可用于此目的,選擇合適的載體主要根據(jù)將插入該載體的核酸的大小以及將用該載體轉(zhuǎn)化的具體宿主細胞。每一種載體多種與具體宿主細胞相容的組分。根據(jù)具體宿主類型,載體組分通常包括,但不僅限于,下面的一個或更多信號序列、復(fù)制起點、一個或更多的標(biāo)記基因、啟動子以及轉(zhuǎn)錄終止序列。
通常,將含有起源于與宿主細胞相容種類的復(fù)制子和控制序列的質(zhì)粒載體與大腸桿菌宿主聯(lián)合使用。載體通常攜帶復(fù)制位點,以及能夠在轉(zhuǎn)化細胞中提供表型選擇的標(biāo)記序列。例如,大腸桿菌通常用pBR322轉(zhuǎn)化,這是一種來源于大腸桿菌種類的質(zhì)粒(見如Bolivar等,Gene,295(1977))。pBR322包含氨芐青霉素和四環(huán)素抗性基因,提供了用于鑒定轉(zhuǎn)化細胞的便利手段。pBR322質(zhì)?;蚱渌毦|(zhì)粒或噬菌體,一般還包含,或經(jīng)修飾后包含那些可由大腸桿菌宿主用來表達可選擇標(biāo)記基因的啟動子。
(i)信號序列組分編碼本文目的多肽的DNA可以直接表達,也可以與另一多肽一起作為融合蛋白,該另一多肽優(yōu)選信號序列或其它在成熟多肽N末端具有特異性切割位點的多肽。通常,信號序列可以是載體的一種成份,或是插入載體的多肽DNA的一部分。所選的異源信號序列應(yīng)該是可被宿主細胞識別和加工的(即被信號肽酶切割)。
對于不識別和加工天然的或真核多肽的信號序列的細菌宿主細胞,可以將信號序列替換為合適的原核信號序列,后者例如選自堿性磷酸酶、青霉素酶、lpp或熱穩(wěn)定腸毒素II前導(dǎo)序列等。
(ii)復(fù)制起點組分表達載體含有能夠使該載體在一個或更多選定的宿主細胞中復(fù)制的核酸序列。已經(jīng)熟知用于多種細菌的此類序列。質(zhì)粒pBR322的復(fù)制起點適合于大多數(shù)革蘭氏陰性細菌如大腸桿菌。
(iii)選擇基因組分表達載體通常包括一個選擇基因,也稱為選擇標(biāo)記。該基因編碼轉(zhuǎn)化宿主細胞在選擇性培養(yǎng)基中存活或生長所必需的蛋白質(zhì)。沒有用含有該選擇基因的質(zhì)粒轉(zhuǎn)化的宿主細胞將不能在該培養(yǎng)基中存活。此可選擇的標(biāo)記是不同于本發(fā)明使用和定義的遺傳標(biāo)記的。典型的選擇基因編碼具有以下特性的蛋白(a)賦予對抗生素或其它毒素,如氨芐青霉素、新霉素、氨甲蝶呤或四環(huán)素的抗性,或(b)彌補并非由遺傳標(biāo)記的存在而引起的營養(yǎng)缺陷,或(c)補充無法從合成培養(yǎng)基中獲得的關(guān)鍵營養(yǎng),如編碼細菌D-丙氨酸消旋酶的基因。
選擇方案的一個例子是利用藥物使宿主細胞生長停滯。在該例中,那些成功地用目的核酸轉(zhuǎn)化的細胞,產(chǎn)生賦予抗藥性的多肽,從而在選擇中存活下來。這種顯性選擇的例子利用了藥物新霉素(Southern等,J.Molec.Appl.Genet.,1327(1982))、麥考酚酸(Mulligan等,Science,2091422(1980))或潮霉素(Sugden等,Mol.Cell.Biol.,5410-413(1985))。上面給出的三個例子分別利用在真核控制下的細菌基因,來賦予對相應(yīng)藥物G418或新霉素(geneticin)、xgpt(麥考酚酸)、或潮霉素的抗性。
(iv)啟動子組分用于產(chǎn)生目的多肽的表達載體包括合適的啟動子,其可被宿主生物識別而且與編碼目的多肽的核酸可操作相連。適于原核宿主使用的啟動子包括β-內(nèi)酰胺酶和乳糖啟動子系統(tǒng)(Chang等,Nature,275615(1978);Goeddel等,Nature,281544(1979))、阿拉伯糖啟動子系統(tǒng)(Guzman等,J.Bacteriol.,1747716-7728(1992))、堿性磷酸酶、色氨酸(trp)啟動子系統(tǒng)(Goeddel,Nucleic Acids Res.,84057(1980)and EP 36,776)以及雜合啟動子諸如tac啟動子(deBoer等,Proc.Natl.Acad.Sci.USA,8021-25(1983))。不過,其它已知細菌啟動子也是合適的。它們的核苷酸序列已公開,因而本領(lǐng)域技術(shù)人員能利用連接區(qū)或接頭,將它們與編碼目的多肽的DNA連接,以便提供任何所需的限制酶切位點(Siebenlist等,Cell,20269(1980))。
用于細菌系統(tǒng)的啟動子通常還包含Shine-Dalgarno(S.D.)序列,也是與編碼目的多肽的DNA可操作相連。啟動子可以通過限制酶消化從細菌DNA中取出,并插入包含所需DNA的載體。
(v)載體的構(gòu)建和分析構(gòu)建包含一個或更多上述組分的合適載體使用標(biāo)準的連接技術(shù)。將分離的質(zhì)?;駾NA片斷切割、修飾(tailor)并重新連接成所希望的形式,從而產(chǎn)生要求的質(zhì)粒。
為分析確定所構(gòu)建質(zhì)粒中的正確序列,用連接混合物轉(zhuǎn)化大腸桿菌K12菌株294(ATCC31,446)或其它菌株,成功的轉(zhuǎn)化子通過相應(yīng)氨芐青霉素或四環(huán)素抗性來選擇。制備來自轉(zhuǎn)化子的質(zhì)粒,通過限制性內(nèi)切酶消化進行分析和/或用Sanger等,Proc.Natl.Acad.Sci.USA,745463-5467(1977)或Messing等,Nucleic Acids Res.,9309(1981)的方法,或用Maxam等,Methods in Enzymology,65499(1980)的方法測序。
B.宿主細胞的選擇和轉(zhuǎn)化如上所定義的,很多類型的革蘭氏陰性細菌細胞可以用于具有缺陷型yfcK基因的目的,而且上面所提及的那些都是此類例子。大腸桿菌菌株W3110是優(yōu)選的親本菌株,因為它是重組DNA產(chǎn)物發(fā)酵常用的菌株。優(yōu)選宿主細胞分泌最少量的蛋白水解酶。例如,菌株W3110可經(jīng)修飾以便使編碼蛋白的基因內(nèi)產(chǎn)生遺傳突變,這類大腸桿菌宿主的例子并同它們的基因型見下表
同樣適合的是制備菌株36F8的中間體,即27B4(美國專利5,304,472)和35E7(生長好于27B4的自發(fā)性溫度抗性菌落分離物)。另一個合適的菌株是具有突變的細胞周質(zhì)蛋白酶的大腸桿菌菌株,參見1990年8月7日授權(quán)的美國專利4,946,783。
本發(fā)明的突變體細胞可通過將yfcK基因染色體整合到親本細胞中,或通過其它技術(shù),包括下文實施例中所述技術(shù)來產(chǎn)生。
編碼多肽的核酸插入宿主細胞。該核酸用任何適當(dāng)?shù)姆椒?,包括用編碼該多肽的載體轉(zhuǎn)化來導(dǎo)入合適的細菌細胞。轉(zhuǎn)化是指將DNA導(dǎo)入生物體以使該DNA可以作為染色體外元件或通過染色體整合而復(fù)制。根據(jù)所用的宿主細胞,轉(zhuǎn)化用適合于此類細胞的標(biāo)準技術(shù)完成。如Sambrook等,Molecular CloningA Laboratory Manual(New YorkCold Spring HarborLaboratory Press,1989)1.82節(jié)中所述的利用氯化鈣進行鈣處理,一般用于原核細胞或其它包含堅固的細胞壁屏障的細胞。另一種轉(zhuǎn)化的方法使用聚乙二醇/DMSO,如Chung and Miller,Nucleic Acids Res.,163580(1988)描述的。還有另一種方法是利用稱作電穿孔的技術(shù)。
一個通過將編碼多肽的基因插入大腸桿菌宿主基因組來轉(zhuǎn)化的實例,涉及在轉(zhuǎn)化載體中包含與大腸桿菌基因組DNA中發(fā)現(xiàn)的序列互補的DNA序列。用該載體轉(zhuǎn)染大腸桿菌導(dǎo)致與基因組發(fā)生同源重組,以及插入編碼該多肽的基因。優(yōu)選用上述表達載體轉(zhuǎn)化宿主細胞,在經(jīng)改變適于誘導(dǎo)各種啟動子的傳統(tǒng)營養(yǎng)培養(yǎng)基中進行培養(yǎng),從而插入所述核酸。
C.培養(yǎng)宿主細胞用于產(chǎn)生本發(fā)明目的多肽的細菌細胞,在例如Sambrook等出處同上中一般性描述的適宜培養(yǎng)基中培養(yǎng)。
為了分泌表達或過表達的基因產(chǎn)物,宿主細胞培養(yǎng)在足以分泌該基因產(chǎn)物的條件下。這種條件包括,如溫度、養(yǎng)分以及細胞密度等能夠允許細胞分泌的條件。此外,這種條件使細胞可以運行基本的細胞功能如轉(zhuǎn)錄、翻譯以及從一個細胞區(qū)域到另一個區(qū)域的蛋白運輸過程,正如那些對此技術(shù)非常熟練的人已知的。
在使用堿性磷酸酶啟動子的情況中,用于產(chǎn)生本發(fā)明目的多肽的大腸桿菌細胞培養(yǎng)在適宜的培養(yǎng)基中,其中的堿性磷酸酶啟動子可以按照Sambrook等出處同上所一般性描述的方法進行部分或完全誘導(dǎo)。該培養(yǎng)必需不在缺乏無機磷酸鹽或為磷酸鹽饑餓水平時進行。首先,培養(yǎng)基所含無機磷酸鹽的量高于誘導(dǎo)蛋白合成的水平,并且足夠用于細菌生長。隨著細胞生長并利用磷酸鹽,它們降低了培養(yǎng)基中磷酸鹽的水平,因而導(dǎo)致誘導(dǎo)該多肽的合成。
任何除碳、氮和無機磷酸鹽來源以外的其它必需培養(yǎng)基組分,也可以按適當(dāng)濃度包括在內(nèi),可以單獨引入或作為與另一組分或培養(yǎng)基的混合物引入,如復(fù)合氮源。培養(yǎng)基的pH可以是大約5-9的任何pH,主要取決于宿主生物。
如果啟動子是誘導(dǎo)型啟動子,為了進行誘導(dǎo),通常用高細胞密度方法,將細胞培養(yǎng)到一定光學(xué)密度,如A550值約為2.00,在該時刻誘導(dǎo)開始(如通過添加誘導(dǎo)劑、耗盡培養(yǎng)基組分等等),從而誘導(dǎo)編碼目的多肽的核酸表達。
D.檢測表達核酸表達可以在樣品中直接檢測,例如,根據(jù)該多肽的序列選用適當(dāng)標(biāo)記的探針,通過傳統(tǒng)的Southern印跡、定量mRNA轉(zhuǎn)錄的Northern印跡(Thomas,Proc.Natl.Acad.Sci.USA,775201-5205(1980))、dot印跡(DNA分析)或原位雜交來進行檢測??梢允褂酶鞣N標(biāo)記,最常用放射性同位素,特別是32P。然而,也可使用其它技術(shù)如用生物素修飾核苷以引入多核苷酸中。然后將生物素作為抗生物素蛋白或抗體結(jié)合的位點,后者可以用多種標(biāo)記物,如放射性核素、熒光劑、酶等進行標(biāo)記?;蛘呖赏ㄟ^分析或凝膠檢測蛋白。
用于觀測表達或過表達的基因產(chǎn)物是否分泌的方法對于本領(lǐng)域技術(shù)人員來說是很容易獲得的。一旦通過如經(jīng)離心或過濾將培養(yǎng)基與宿主細胞分離,就可利用基因產(chǎn)物的已知特性,從無細胞培養(yǎng)基中檢出該基因產(chǎn)物。所述特性包括該基因產(chǎn)物特有的免疫學(xué)、酶學(xué)或物理學(xué)性質(zhì)。
舉例來說,如果一種過表達的基因產(chǎn)物具有獨特的酶活性,可在宿主細胞使用的培養(yǎng)基中進行針對該活性的檢測。而且,當(dāng)可獲得與給定基因產(chǎn)物產(chǎn)生反應(yīng)的抗體時,此類抗體可用來以任何已知的免疫檢測方法檢測該基因產(chǎn)物(例如,Harlowe等,AntibodiesA Laboratory Manual,ColdSpring Harbor Laboratory Press,New York,1988)。
分泌的基因產(chǎn)物還可以采用根據(jù)特征性物理性質(zhì)如分子量來區(qū)分多肽的實驗來檢測。為檢測該基因產(chǎn)物的物理性質(zhì),所有由宿主細胞新合成的多肽都可以用,例如放射性同位素標(biāo)記物來標(biāo)記。可用于標(biāo)記在宿主細胞內(nèi)合成的多肽的常用放射性同位素包括,氚(3H)、碳-14(14C)、硫-35(35S)諸如此類。舉例來說,宿主細胞可生長于35S-甲硫氨酸或35S-半胱氨酸培養(yǎng)基中,而且大量的35S標(biāo)記將優(yōu)先插入任何新合成的多肽中,包括過表達的異源多肽。繼而除去含35S的培養(yǎng)基,洗滌細胞并將之放入新鮮的無放射性培養(yǎng)基中。細胞在新鮮培養(yǎng)基中維持,所用的時間和條件足以使帶有35S放射性標(biāo)記并已表達的異源多肽分泌,收集培養(yǎng)基并與宿主細胞分離。培養(yǎng)基中已分泌并標(biāo)記的多肽的分子量可以用已知方法如聚丙烯酰胺凝膠電泳來確定。此類方法和/或其它用于檢測分泌基因產(chǎn)物的方法,參見Goeddel,D.V.(ed.)1990,Gene Expression Technology,Methods in Enzymology,Vol.185(Academic Press)以及Sambrook等,出處同上中。
E.回收/純化產(chǎn)生多肽以后,可以通過任何適當(dāng)方式從細胞中回收,所述方式取決于,例如從細胞的哪個部位進行回收。多肽可以從細胞質(zhì)、細胞周質(zhì)或細胞培養(yǎng)基回收。目的多肽優(yōu)選作為分泌多肽從細胞周質(zhì)或培養(yǎng)基中回收。目的多肽從重組細胞蛋白或多肽中純化,以獲得基本均一的目的多肽制品。第一步,將培養(yǎng)基或裂解物離心除去顆粒狀細胞碎片。需要時可進一步分離膜和可溶性蛋白部分。然后根據(jù)所述多肽為膜結(jié)合型、可溶型、還是聚集形式,可以將該多肽從可溶性蛋白部分和從培養(yǎng)裂解物的膜部分中純化出來。然后將所述多肽溶解并重新折疊,必要時,從污染的可溶性蛋白和多肽中純化出來。任何從混合物中除去剪切型多肽雜質(zhì)的典型步驟都可以從純化方案中去掉,因為已不再存在氨肽酶。在一個優(yōu)選實施方案中,將聚集的多肽分離,然后同時進行溶解和再折疊步驟,如美國專利5,288,931中所述。
一個特別優(yōu)選的實施方案中,從細胞周質(zhì)中進行回收,具體是通過細胞破壞(利用如上述方法)以形成裂解物,接著從該裂解物中純化出完整的未剪切多肽。優(yōu)選裂解物在純化前溫育。更優(yōu)選裂解物在大約20~25℃溫育至少約1小時,還更優(yōu)選在室溫左右溫育約2~50小時,還更優(yōu)選在室溫左右溫育約5~45小時,最優(yōu)選在室溫左右溫育約20~30小時。
下面的步驟是合適純化步驟的范例在免疫親和或離子交換柱中分級分離;乙醇沉淀;反相HPLC;在硅或陽離子交換樹脂如DEAE上進行層析分析;層析聚焦;SDS-PAGE;硫酸銨沉淀;以及用如SEPHADEX G-75TM柱進行凝膠過濾。
II.經(jīng)剪切的多肽的生產(chǎn)和回收在此備選方法中,多肽與氨肽酶b2323多肽直接相接觸,使其被剪切。這可以通過幾種手段來完成,包括在大約20~40℃,優(yōu)選30~40℃溫育最多50小時,優(yōu)選至少約1~45小時。在此接觸方法的一個優(yōu)選方面,本發(fā)明提供一種產(chǎn)生剪切多肽的方法,該方法包括培養(yǎng)細菌細胞,該細胞攜有yfcK基因并包含編碼相應(yīng)的未切割多肽的核酸,該多肽在其N末端有附加的氨基酸。所用培養(yǎng)條件使yfcK基因表達或過表達并使編碼未剪切多肽的核酸表達,而且如果未剪切多肽和氨肽酶b2324蛋白在表達以后沒有接觸,還可以將未剪切多肽與氨肽酶b2324蛋白接觸,以產(chǎn)生經(jīng)剪切的多肽。優(yōu)選這種接觸是在前面或下面提出的條件下溫育,而且該培養(yǎng)在發(fā)酵罐中進行。
在一個優(yōu)選的方面中該多肽對細胞是異源多肽,更優(yōu)選真核多肽,還更優(yōu)選哺乳動物尤其是人的多肽。優(yōu)選的細胞是沙門氏菌或腸桿菌科細胞,還更優(yōu)選大腸桿菌細胞,最優(yōu)選W3110。還優(yōu)選至少在一種編碼蛋白酶的基因,如degP或fhuA或兩者中有缺陷的細胞。
在一個優(yōu)選的方面中,該培養(yǎng)條件能使yfcK基因過表達。yfcK基因可以是細菌細胞天然具有的或是通過,例如,用攜有該基因的載體轉(zhuǎn)化而導(dǎo)入該細胞的。
在另一個優(yōu)選的方面中,未剪切的多肽是在與該氨肽酶b2324蛋白接觸前從細胞中回收的,而且未剪切的多肽是從細胞周質(zhì)或培養(yǎng)基中回收的。在一個實施方案中,回收是通過細胞破壞(如上述)以形成裂解物,添加氨肽酶,然后從裂解物中純化經(jīng)剪切的多肽。此例中優(yōu)選裂解物在純化步驟開始前與氨肽酶溫育。更優(yōu)選裂解物在大約20~40℃溫育至少約1小時,還更優(yōu)選在30-40℃左右溫育約2~50小時,還更優(yōu)選在30-40℃左右溫育約5~45小時,最優(yōu)選在純化步驟之前在35-38℃左右溫育約20~30小時。
當(dāng)剪切多肽是通過重組產(chǎn)生的時,親本菌株、培養(yǎng)條件、表達的檢測、回收/純化、以及基本技術(shù)都總體上如上文所述。然而,為了在培養(yǎng)的菌株中過表達,通常使相對于宿主細胞而言內(nèi)源(在染色體上)或外源的yfcK基因與誘導(dǎo)型啟動子可操作相連,從而使該基因在啟動子被誘導(dǎo)時可以過表達。該培養(yǎng)優(yōu)選在誘導(dǎo)yfcK基因表達優(yōu)先于誘導(dǎo)編碼該多肽的核酸表達的條件下進行。用于過表達本文所用基因的適宜技術(shù)包括那些由Joly等,Proc.Natl.Acad.Sci.USA,95,2773-2777(1998);US Pat.Nos.5,789,199和5,639,635;Knappik等,Bio/Technology,11(1)77-83(1993);以及Wulfing和Pluckthun,Journal of Molecular Biology.242(5)655-69(1994)所描述的。
通過參考下面的實施例,可以更全面了解本發(fā)明。但是,它們不應(yīng)被解釋為對本發(fā)明范圍的限定。所有在這里引用的文獻和專利都以參考文獻插入。
實施例1材料和方法經(jīng)PCR擴增獲得編碼b2324的yfcK基因的上游和下游DNA序列,該基因是由基因組測序計劃(來自上述Blattner等的GenBank列表)鑒定的。然后這些融合序列經(jīng)P1轉(zhuǎn)導(dǎo)重組在W3110菌株的染色體上,并用PCR篩選缺失(Metcalf等,Gene,1381-7(1994))以產(chǎn)生菌株61G3,其基因型為W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2 degP∷kanR ilvG2096ΔyfcK。
具體地,本菌株構(gòu)建分幾個步驟來完成,采用的技術(shù)包括用來源于P1(J.Miller,Experiments in Molecular Genetics,Cold Spring Harbor,NY,ColdSpring Harbor Laboratory,1972)的噬菌體P1kc轉(zhuǎn)導(dǎo),以及轉(zhuǎn)座子遺傳(Kleckner等,J.Mol.Biol.,116125-159(1977))。使用的起始宿主是大腸桿菌K-12 W3110,是F-λ-型K-12菌株(Bachmann,Bact.Rev.,36525-557(1972);Bachmann,″Derivations and Genotypes of Some Mutant Derivatives ofEscherichia coli K-12,″p.1190-1219,in F.C.Neidhardt等,ed.,Escherichia coliand Salmonella typhimuriumCellular and Molecular Biology,vol.2,AmericanSociety for Microbiology,Washington,D.C.,1987)。在基因組中導(dǎo)入tonA(fhuA)突變,方法詳見1994年4月19日授權(quán)的美國專利5,304,472。Tn10插入ilv基因是通過P1轉(zhuǎn)導(dǎo)來介導(dǎo)的。利用生長在攜有ilvG2096R突變(Lawther等,Proc.Natl.Acad.Sci.USA,78922-925(1981))的菌株中的P1噬菌體,將異亮氨酸/纈氨酸營養(yǎng)缺陷型轉(zhuǎn)換為原養(yǎng)型,在其中修復(fù)了造成野生型大腸桿菌K-12對纈氨酸敏感的移碼突變。degP41kanr突變描述于美國專利5,304,472。ilvG2096R座位可以通過33B6宿主對40μg/ml纈氨酸(0.3mM)的抗性來確定。兩個缺失突變phoAΔE15和Δ(argF-lac)169描述于美國專利5,304,472。deoC2突變描述于Mark等,Mol.Gen.Genet.155145-152(1977)。61G3菌株的完整來歷示于圖1。
此菌株然后用名為hGH4R的表達質(zhì)粒轉(zhuǎn)化,該質(zhì)粒在搖瓶和10-L發(fā)酵罐中表達并分泌hGH(具有N末端苯丙氨酸)。phGH4R的構(gòu)建詳述于Chang等,Gene,55189-196(1987)中。此轉(zhuǎn)化產(chǎn)生了JJGH1菌株。細胞培養(yǎng)見Andersen等,Biotechnology and Bioengineering,75(2),212-218(2001)。生產(chǎn)hGH之后,用超聲破碎細胞,制備粗制裂解物,然后該裂解物在37℃溫育0~24小時,在室溫下0~40小時。使用較高的溫度是為了提高通過檢驗方法檢測des-phe和des-phe-pro hGH的能力,但不優(yōu)選用于hGH的純化。正常情況下,hGH的純化在冷條件下完成,以降低那些剪切形式的量。
用經(jīng)過phGH4R轉(zhuǎn)化的親本菌株(具有基因型W3110ΔfhuAΔ(arg-F-lac)169phoAΔE15 deoC2的16C9)作為對照來進行同樣的試驗。此菌株適合該用途,因為菌株61G3中的degP和ilvG突變對氨肽酶活性沒有影響。
然后將對照樣品和試驗樣品離心除去顆粒物,可溶相通過LC-MS(液相層析、質(zhì)譜分析)進行分析。檢測到大量完整的、des-phe和des-phe-pro形式的hGH。
結(jié)果圖2和圖4分別顯示用對照菌株(16C9/phGH4R)在室溫和37℃溫育的結(jié)果,而圖3和圖5分別顯示用JJGH1在室溫和37℃溫育的結(jié)果,其中的氨肽酶基因已經(jīng)敲除掉了。這四個圖的實際數(shù)目顯示于下表1中(在Temp=37℃和Temp=RT)??梢钥吹皆?7℃溫育15小時后,基本上沒有切除苯丙氨酸后形成的雜質(zhì),而且即使不經(jīng)溫育,雜質(zhì)的量也減少。還可以看到即使在室溫溫育,與對照相比,在溫育的任何時間,JJGH1細胞系中缺失N末端苯丙氨酸的突變多肽的量都減少了。對該完整多肽的純化可以通過常用或已知的層析方法容易地完成。
表1
此結(jié)果顯示,ΔyfcK菌株可用來防止多肽的N末端剪切。
權(quán)利要求
1.一種革蘭氏陰性細菌細胞,其染色體基因有缺陷,所述基因與以下分子有至少80%的序列同一性且編碼氨肽酶(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體。
2.一種革蘭氏陰性細菌細胞,其染色體基因有缺陷,所述基因包括(a)編碼多肽的DNA,所述多肽與SEQ ID NO2中氨基酸殘基1~688所示序列進行比對時陽性得分至少是80%,或(b)DNA分子(a)的互補體,所述多肽是氨肽酶。
3.一種革蘭氏陰性細菌細胞,其染色體基因有缺陷,所述基因與具有SEQ ID NO1中核苷酸1~2067所示序列的yfcK基因天然序列有至少80%的序列同一性,而且編碼氨肽酶。
4.權(quán)利要求1~3之一的細胞,是沙門氏菌屬或腸桿菌科的細胞。
5.權(quán)利要求4的細胞,是大腸桿菌。
6.權(quán)利要求5的細胞,至少在一個編碼蛋白酶的基因中有缺陷。
7.權(quán)利要求5的細胞,在天然序列yfcK基因中有缺陷。
8.權(quán)利要求1~7之一的細胞,包括編碼該細胞的異源多肽的核酸。
9.權(quán)利要求8的細胞,其中所述多肽是哺乳動物多肽。
10.權(quán)利要求9的細胞,其中所述多肽是人的多肽。
11.權(quán)利要求10的細胞,其中所述多肽是人生長激素。
12.一種用來生產(chǎn)異源多肽的方法,包括(a)培養(yǎng)權(quán)利要求8~11之一的細胞,以及(b)從該細胞中回收該多肽。
13.權(quán)利要求12的方法,其中的培養(yǎng)在發(fā)酵罐中進行,其中所述多肽從該細胞的周質(zhì)或培養(yǎng)基中回收。
14.權(quán)利要求12或13的方法,其中的回收是將細胞破壞以形成裂解物,而其中所述完整多肽是從裂解物中純化的。
15.權(quán)利要求14中的方法,其中的裂解物在純化步驟之前溫育。
16.一種防止從多肽N末端切去氨基酸殘基的方法,包括培養(yǎng)權(quán)利要求1~11之一的細胞,其中所述細胞包含編碼該多肽的核酸,所用的培養(yǎng)條件使該核酸表達。
17.權(quán)利要求16的方法,其中所述多肽是從該細胞中回收的。
18.一種從分離自細胞的多肽的N末端切去氨基酸的方法,包括使該多肽與氨肽酶接觸,編碼該酶的核酸與以下分子有至少80%的序列同一性(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體。
19.一種從分離自細胞的多肽的N末端切去氨基酸的方法,包括使該多肽與氨肽酶接觸,該酶與具有SEQ ID NO2中氨基酸殘基1~688所示序列的天然序列氨肽酶b2324有至少80%的序列同一性。
20.權(quán)利要求18或19的方法,其中使所述多肽與氨肽酶一起溫育。
21.權(quán)利要求18~20之一的方法,其中使所述多肽與天然序列氨肽酶b2324接觸。
22.一種產(chǎn)生經(jīng)剪切的多肽的方法,包括培養(yǎng)革蘭氏陰性細菌細胞,該細胞攜有與以下分子有至少80%的序列同一性且編碼氨肽酶的核酸(a)編碼具有SEQ ID NO2中氨基酸殘基1~688的天然序列氨肽酶b2324的DNA分子;或(b)DNA分子(a)的互補體,所述細胞包含編碼相應(yīng)未剪切多肽的核酸,該未剪切多肽在其N末端有附加的氨基酸,其中所用的培養(yǎng)條件使該基因表達或過表達并使編碼未剪切多肽的核酸表達,在未剪切多肽和氨肽酶于表達以后不接觸的情況下,可使所述未剪切多肽與氨肽酶接觸,以產(chǎn)生經(jīng)剪切的多肽。
23.一種產(chǎn)生經(jīng)剪切的多肽的方法,包括培養(yǎng)革蘭氏陰性細菌細胞,該細胞攜有編碼氨肽酶的核酸,該核酸與具有SEQ ID NO1中核苷酸1~2067所示序列的yfcK基因天然序列有至少80%的序列同一性,所述細胞包含編碼相應(yīng)未剪切多肽的核酸,該未剪切多肽在其N末端有附加的氨基酸,其中所用的培養(yǎng)條件使該基因表達或過表達并使編碼未剪切多肽的核酸表達,在未剪切多肽和氨肽酶于表達以后不接觸的情況下,可使所述未剪切多肽與氨肽酶接觸,以產(chǎn)生經(jīng)剪切的多肽。
24.權(quán)利要求22或23的方法,其中對攜有天然序列yfcK基因的大腸桿菌細胞進行培養(yǎng),并使未剪切的多肽與天然序列氨肽酶b2324相接觸。
25.權(quán)利要求22~24之一的方法,其中所述多肽對所述細胞而言是異源的。
26.權(quán)利要求22~24之一的方法,其中所述多肽是哺乳動物多肽。
27.權(quán)利要求22或23的方法,其中所述細胞至少在一種編碼蛋白酶的基因中有缺陷。
28.權(quán)利要求22或23的方法,其中所述培養(yǎng)條件使編碼該氨肽酶的核酸過表達。
29.權(quán)利要求22或23的方法,其中的接觸通過溫育來進行。
30.權(quán)利要求22或23的方法,其中編碼氨肽酶的核酸是該細菌細胞天然具有的。
31.權(quán)利要求22或23的方法,其中編碼氨肽酶的核酸是導(dǎo)入該細菌細胞的。
32.權(quán)利要求22或23的方法,其中的培養(yǎng)在發(fā)酵罐中進行,而且其中的未剪切多肽是在與氨肽酶接觸前從細胞回收的。
33.權(quán)利要求32的方法,其中所述多肽是從細胞的周質(zhì)或培養(yǎng)基中回收的。
34.權(quán)利要求32或33的方法,其中的回收是將細胞破壞以形成裂解物,而且其中的剪切多肽是從裂解物中純化的。
35.權(quán)利要求34的方法,其中的裂解物在純化步驟之前溫育。
36.權(quán)利要求34或35的方法,其中的裂解物在約20~40℃溫育至少約1小時。
全文摘要
本發(fā)明涉及一種革蘭氏陰性細菌細胞,該細胞在存在于此類細胞野生型的一個染色體基因中有缺陷,該基因與天然序列yfcK基因有至少80%的序列同一性,并且編碼氨肽酶。本發(fā)明還涉及一種革蘭氏陰性細菌細胞,在存在于此類細胞野生型的一個染色體基因中有缺陷,該基因編碼氨肽酶,其與天然序列氨肽酶b2324有至少80%的序列同一性。這些類型中的任一個細胞,當(dāng)其包含編碼異源多肽的核酸時,產(chǎn)生N末端未剪切的多肽,該細胞進行培養(yǎng)并回收多肽后,基本上不產(chǎn)生N末端剪切的多肽這種雜質(zhì)。相反地,本發(fā)明提供一種方法,用于從多肽N末端切去一個氨基酸,包括將此多肽與氨肽酶接觸,該氨肽酶與天然序列氨肽酶b2324有至少80%的序列同一性。
文檔編號C12N9/52GK1555412SQ02817984
公開日2004年12月15日 申請日期2002年9月12日 優(yōu)先權(quán)日2001年9月13日
發(fā)明者約翰·C·喬利, 約翰 C 喬利 申請人:杰南技術(shù)公司