枯草桿菌酶變體和編碼它們的多核苷酸的制作方法
【專利摘要】本發(fā)明涉及多種蛋白酶變體以及用于獲得蛋白酶變體的多種方法。本發(fā)明還涉及編碼這些變體的多核苷酸;包含這些多核苷酸的核酸構(gòu)建體、載體、以及宿主細胞;以及使用這些變體的方法。
【專利說明】枯草桿菌酶變體和編碼它們的多核苷酸[000? ] 序列表的引用
[0002]本申請含有一個計算機可讀形式的序列表,該序列表通過引用結(jié)合在此。
[0003]發(fā)明背景
發(fā)明領(lǐng)域
[0004]本發(fā)明涉及相對于親本枯草桿菌酶在一種或多種特性中展示變化的多種新蛋白酶變體,所述特性包括:洗滌性能、熱穩(wěn)定性、存儲穩(wěn)定性或催化活性。本發(fā)明的這些變體適合用于例如清潔劑或洗滌劑組合物中,如衣物洗滌劑組合物和餐具洗滌劑組合物,包括自動餐具洗滌劑組合物。本發(fā)明還涉及編碼這些變體的分離的DNA序列、表達載體、宿主細胞以及用于產(chǎn)生和使用本發(fā)明變體的方法。此外,本發(fā)明涉及含有本發(fā)明變體的清潔劑和洗滌劑組合物。
[0005]相關(guān)技術(shù)說明
[0006]在洗滌劑工業(yè)中,酶在洗滌配制品中的應用已經(jīng)超過30年。用于此類配制品的酶包括蛋白酶、脂肪酶、淀粉酶、纖維素酶、甘露糖苷酶以及其他酶或其混合物。商業(yè)上最重要的酶是蛋白酶。
[0007]越來越多商業(yè)上使用的蛋白酶是天然存在的野生型蛋白酶的蛋白質(zhì)工程化變體, Everlase?、Relase ?、Coronase?、Liquanase \ Ovozymex、PolarzymeR
和 Kannase?丨(諾維信公司(Novozymes A/s))、Maxacal?,Properase?^Purafect?,
FN2'FN3?以及FN4? (杜邦/杰能科國際公司(DuPont/Genencorinternational, Inc.))。
[0008]此外,本領(lǐng)域描述了多種變體,如在WO 2004/041979(諾維信公司)中描述了相對于親本枯草桿菌酶在例如洗滌性能、熱穩(wěn)定性、存儲穩(wěn)定性或催化活性方面展示變化的多種枯草桿菌酶變體。這些變體適合用于在例如清潔劑或洗滌劑組合物中使用。
[0009]已描述多種有用的枯草桿菌酶變體,其中很多已提供在不同洗滌劑中的改進活性、穩(wěn)定性以及溶解度。US 6,436,690 (布羅德三世(Brode III)等人)描述了在環(huán)59至66(BPN,編號)中的變化,在WO 2009/149200(丹尼斯克公司(Danisco US INC.))中描述了在位置53和55(BPN’編號)處的取代。此外,WO 2002/31133 (諾維信公司)描述了環(huán)51-56 (BPN^編號)中的插入。然而,多種因素造成進一步改進蛋白酶是有利的。洗滌條件例如就溫度和PH而言不斷發(fā)生變化,并且很多污物仍難以在常規(guī)洗滌條件下被完全除去。因此,盡管在蛋白酶開發(fā)方面已有深入研究,但仍然存在對新的改進蛋白酶的需要。
[0010]因此,本發(fā)明的一個目的在于提供一種蛋白酶的與其親本蛋白酶相比具有改進特性的多種變體。
[0011]發(fā)明概述
[0012]本發(fā)明涉及在與具有SEQ ID NO: 2的成熟多肽的位置53、54、55、56、以及57相對應的一個或多個(例如,若干個)位置上包含一個變化的多種蛋白酶變體,其中該變體具有蛋白酶活性并且其中這些變體具有與SEQ ID N0:2至少65%—致的氨基酸序列。
[0013]本發(fā)明還涉及一種用于獲得一種蛋白酶變體的方法,該方法包括在親本枯草桿菌酶的與具有SEQ ID NO: 2的成熟多肽的位置53、54、55、56、以及57相對應的一個或多個位置引入一個缺失,其中該變體具有與SEQ ID NO: 2至少65%—致的氨基酸序列;以及回收該變體。本發(fā)明還涉及編碼這些變體的分離的多核苷酸;包含這些多核苷酸的核酸構(gòu)建體、載體、以及宿主細胞;以及產(chǎn)生這些變體的方法。
[0014]定義
[0015]蛋白酶:術(shù)語“蛋白酶”在此被定義為水解肽鍵的酶。它包括任何屬于EC3.4酶組的酶(包括其13個亞類中的每一種)。EC編號是指來自加利福尼亞州(California),圣地哥(San Diego),學術(shù)出版社(Academic Press)的NC-1UBMB的酶命名法1992,包括分別在歐洲生物化學雜志(Eur.J.Biochem.) 1994,223,1-5 ;歐洲生物化學雜志1995,232,1-6 ;歐洲生物化學雜志1996,237,1-5 ;歐洲生物化學雜志1997,250, 1_6 ;以及歐洲生物化學雜志1999,264,610-650中公開的補充文獻I至5。 [0016]蛋白酶活性:術(shù)語“蛋白酶活性”意指蛋白質(zhì)分解活性(EC3.4)。本發(fā)明的蛋白酶是內(nèi)肽酶(EC3.4.21)。存在若干蛋白酶活性類型:三種主要活性類型是:其中在Pl的Arg或Lys之后存在酰胺底物裂解的胰蛋白酶樣活性、其中在Pl的多個疏水氨基酸中的一個之后發(fā)生裂解的糜蛋白酶樣活性、以及其中在Pl的Ala之后裂解的彈性蛋白酶樣活性。出于本發(fā)明的目的,根據(jù)以下“材料與方法(Materials and Methods) ”所述的程序確定蛋白酶活性。本發(fā)明的這些枯草桿菌酶變體具有SEQ ID NO:2的成熟多肽的至少20%、例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、以及至少100%的蛋白酶活性。
[0017]等位基因變體:術(shù)語“等位基因變體”意指基因的占據(jù)相同染色體基因座的兩種或更多種可替代形式中的任一種。等位基因變異通過突變天然地發(fā)生,并且可以導致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在所編碼的多肽中沒有變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
[0018]cDNA:術(shù)語“cDNA”意指可以通過從得自原核或真核細胞的成熟的、剪接的mRNA分子反轉(zhuǎn)錄來制備的DNA分子。cDNA缺乏可以存在于相應基因組DNA中的內(nèi)含子序列。起始的、初級的RNA轉(zhuǎn)錄物是mRNA的前體,其通過包括剪接的一系列步驟加工,然后作為成熟的已剪接的mRNA出現(xiàn)。
[0019]編碼序列:術(shù)語“編碼序列”意指直接指明其多肽產(chǎn)物的氨基酸序列的多核苷酸。編碼序列的邊界一般由開放閱讀框架決定,該開放閱讀框架通常以ATG起始密碼子或替代性起始密碼子(例如GTG和TTG)開始,并且以終止密碼子(例如TAA、TAG、和TGA)結(jié)束。編碼序列可以是DNA、cDNA、合成或重組的多核苷酸。
[0020]控制序列:術(shù)語“控制序列”意指對于表達編碼本發(fā)明變體的多核苷酸所必需的所有部件。每個控制序列對于編碼變體的多核苷酸可以是天然的或外源的,或者彼此可以是天然的或外源的。此類控制序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列、以及轉(zhuǎn)錄終止子。至少,控制序列包括啟動子,以及轉(zhuǎn)錄和翻譯終止信號。為了引入特異性限制位點以便促進控制序列與編碼變體的多核苷酸的編碼區(qū)的連接,控制序列可以帶有接頭。[0021]表達:術(shù)語“表達”包括涉及變體產(chǎn)生的任何步驟,包括但不限于:轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾、以及分泌。
[0022]表達載體:術(shù)語“表達載體”意指包含編碼一種變體的一種多核苷酸并可操作地連接至提供其表達的額外核苷酸的線性或環(huán)形DNA分子。
[0023]高嚴謹度條件:術(shù)語“高嚴謹度條件”意指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡法(Southernblotting)程序,在42°C下在5X SSPE.0.3% SDS、200 μ g/ml剪切并變性的鮭魚精子DNA和50%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2% SDS在65°C下將載體材料洗滌三次,每次15分鐘。
[0024]宿主細胞:術(shù)語“宿主細胞”意指對于用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達載體進行的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導等是易感的任何細胞類型。術(shù)語“宿主細胞”涵蓋由于復制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。
[0025]改進的特性:術(shù)語“改進的特性”意指與一種變體有關(guān)的特征,該特征相比于親本、或者相比于具有SEQ ID N0:2的蛋白酶、或者相比于具有與所述變體一致的氨基酸序列但是在一個或多個所述指定位置不具有變化的蛋白酶有所改進。此類改進的特性包括但不限于洗滌性能、蛋白酶活性、熱活性曲線、熱穩(wěn)定性、PH活性曲線、pH穩(wěn)定性、底物/輔因子特異性、改善的表面特性、底物特異性、產(chǎn)物特異性、增加的穩(wěn)定性、在存儲條件下的改進的穩(wěn)定性、以及化學穩(wěn)定性。
[0026]改進的洗滌性能:術(shù)語“改進的洗滌性能”在此被定義為一種蛋白酶變體例如通過增強的去污能力(這是特別優(yōu)選的)而相對于親本枯草桿菌酶變體、相對于具有SEQ IDNO:2的蛋白酶、或者相對于具有與所述變體一致的氨基酸序列但是在一個或多個所述指定位置不具有變化的蛋白酶的洗滌性能展示蛋白酶變體的洗滌性能的變化。術(shù)語“洗滌性能”包括在衣物洗滌并且例如在餐具洗滌中的洗滌性能。洗滌性能可以被量化,如在此的“洗滌性能”定義下所描述的。
[0027]改進的蛋白酶活性:術(shù)語“改進的蛋白酶活性”在此被定義為通過增加的蛋白質(zhì)轉(zhuǎn)化而相對于(相比于)親本枯草桿菌酶、或相比于具有SEQ ID NO:2的蛋白酶、或者相對于具有與所述變體一致的氨基酸序列但是在一個或多個所述指定位置不具有變化的蛋白酶的活性展示活性改變的蛋白酶變體的改變的蛋白酶活性(如上文所定義的)。
[0028]改進的熱活性:術(shù)語“改進的熱活性”意指一種變體在特定溫度下相對于親本或相對于具有SEQ ID N0:2的蛋白酶的溫度依賴的活性曲線展示改變的溫度依賴的活性曲線。熱活性值提供了變體在一定溫度范圍內(nèi)增強水解反應的催化的效率的測量。在特定溫度范圍內(nèi)一種變體是穩(wěn)定的并且保留其活性,但是隨著溫度增加而變得不太穩(wěn)定并且因此活性有所降低。此外,由一種變體催化的初始反應速率可以通過增加溫度來加速,這通過確定該變體的熱活性來測量。一種具有較大熱活性的變體將引起一種酶組合物在增強底物水解速率方面的增加,從而減少所需要的時間和/或降低活性所需要的酶濃度。可替代地,具有減小的熱活性的一種變體將 在比由親本的溫度依賴活性曲線定義的親本的最佳溫度更低的溫度下提高酶促反應。
[0029]分離的變體:術(shù)語“分離的變體”意指通過人工修飾的變體。在一個方面,如通過SDS-PAGE確定的,該變體是至少I %純的、例如至少5%純的、至少10%純的、至少20%純的、至少40%純的、至少60%純的、至少80%純的、以及至少90%純的。[0030]分離的多核苷酸:術(shù)語“分離的多核苷酸”意指通過人工修飾的多核苷酸。在一個方面,如通過瓊脂糖電泳法確定的,該分離的多核苷酸是至少1%純的、例如至少5%純的、至少10 %純的、至少20 %純的、至少40 %純的、至少60 %純的、至少80 %純的、至少90 %純的、以及至少95%純的。多核苷酸可以是基因組的、cDNA、RNA、半合成、合成來源或其任何組合。
[0031]低嚴謹度條件:術(shù)語“低嚴謹度條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0.3% SDS,200 μ g/ml剪切并變性的鮭魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2% SDS在50°C下將載體材料洗滌三次,每次15分鐘。
[0032]成熟多肽:術(shù)語“成熟多肽”意指在翻譯和任何翻譯后修飾如N末端加工、C末端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。在一個方面,該成熟多肽與具有SEQ ID NO:2的氨基酸序列對應。
[0033]成熟多肽編碼序列:術(shù)語“成熟多肽編碼序列”意指編碼具有蛋白酶活性的成熟多肽的多核苷酸。在一個方面,成熟多肽編碼序列是基于預測編碼信號肽的SEQ IDNO:1的核苷酸I至90的SignalP(尼爾森(Nielsen)等人,1997,蛋白質(zhì)工程(ProteinEngineering) 10:1-6)的 SEQ ID NO:1 的核苷酸 322 至 1146。
[0034]中嚴謹度條件:術(shù)語“中嚴謹度條件”意指對于至少100個核苷酸長度的探針而言,遵循標準DNA印跡程序,在42°C在5X SSPE、0.3% SDS,200 μ g/ml剪切和變性的鮭魚精子DNA和35%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2% SDS在55°C下將載體材料洗滌三次 ,每次15分鐘。
[0035]中-高嚴謹度條件:術(shù)語“中-高嚴謹度條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并變性的鮭魚精子DNA和35%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2%SDS在60°C下將載體材料洗滌三次,每次15分鐘。
[0036]突變體:術(shù)語“突變體”意指編碼變體的多核苷酸。
[0037]核酸構(gòu)建體:術(shù)語“核酸構(gòu)建體”意指從天然存在的基因中分離的、或以自然界中不會另外存在的方式被修飾成包含核酸片段的、或合成的單鏈或雙鏈的核酸分子。當核酸構(gòu)建體含有表達本發(fā)明編碼序列所需要的控制序列時,術(shù)語核酸構(gòu)建體與術(shù)語“表達盒”含義相同。
[0038]可操作地連接:術(shù)語“可操作地連接”意指如下構(gòu)造,其中控制序列相對于多核苷酸的編碼序列安置在適當位置,這樣使得控制序列指導編碼序列的表達。
[0039]親本:術(shù)語“親本”意指對其做出改變以產(chǎn)生本發(fā)明的酶變體的一種蛋白酶。因此,親本是具有與所述變體一致的氨基酸序列但是在一個或多個所述指定位置不具有變化的一種蛋白酶。應理解,在上下文中,表述“具有一致氨基酸序列”與100%序列一致性有關(guān)。該親本可以是天然存在的(野生型)多肽或其變體。在一個具體實施例中,該親本是與具有SEQ ID NO:2的多肽具有至少60%的一致性、例如至少65%、至少70%、至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的一致性的蛋白質(zhì)。[0040]序列一致性:通過參數(shù)“序列一致性”描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關(guān)性。出于本發(fā)明的目的,使用在EMBOSS包(EMBOSS:歐洲分子生物學開發(fā)軟件套(The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學趨勢(Trends Genet) 16:276-277)(優(yōu)選版本3.0.0或更新版本)的尼德爾(Needle)程序中實施的尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁施,1970,分子生物學雜志(J.Mol.Biol.)48:443-453)確定兩個氨基酸序列之間的序列一致性程度。可任選使用的參數(shù)是空位開放罰分(gap open penalty) 10、空位延伸罰分(gap extension penalty) 0.5、以及EBL0SUM62 (BL0SUM62的EMBOSS版)取代矩陣。使用尼德爾(Needle)標記的“最長一致性(longest identity) ”的輸出(使用-nobrief選項獲得)作為一致性百分比,并且計算如下:
[0041](一致的殘基X100)/(比對長度-比對中的空位總數(shù))。
[0042]出于本發(fā)明的目的,使用在EMBOSS包(EMBOSS:歐洲分子生物學開發(fā)軟件套,賴斯等人,2000,同上)(優(yōu)選版本3.0.0或更新版本)的尼德爾程序中實施的尼德曼-翁施算法(尼德曼和翁施,1970,同上)確定兩個脫氧核糖核苷酸序列之間的序列一致性程度。可任選使用的參數(shù)是空位開放罰分10、空位延伸罰分0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩陣。使用尼德爾標記的“最長一致性”的輸出(使用-nobrief選項獲得)作為一致性百分比,并且計算如下:
[0043](一致的脫氧核糖核苷酸X100)/(比對長度-比對中的空位總數(shù))。 [0044]基本上純的變體:術(shù)語“基本上純的變體”意指包含按重量計至多10%、至多8%、至多6%、至多5%、至多4%、至多3%、至多2%、至多1%、以及至多0.5%的其他多肽材料的制劑,這些其他多肽材料是與其天然或重組地相關(guān)的。優(yōu)選地,該變體按存在于制劑中的總多肽材料的重量計是至少92 %純的,例如至少94%純的、至少95 %純的、至少96 %純的、至少97 %純的、至少98 %純的、至少99 %純的、至少99.5 %純的、以及100 %純的。本發(fā)明的變體優(yōu)選以基本上純的形式存在。例如,這可通過經(jīng)由眾所周知的重組方法或經(jīng)由經(jīng)典的純化方法制備變體來完成。
[0045]變體:術(shù)語“變體”意指具有蛋白酶活性的相比于其親本在一個或多個(或一個或若干個)位置包含一個變化即取代、插入、和/或缺失的多肽,該親本是具有與所述變體一致的氨基酸序列但是在一個或多個所述指定位置不具有所述變化的蛋白酶。取代意指占據(jù)一個位置的氨基酸被一個不同的氨基酸置換;缺失意指除去占據(jù)一個位置的氨基酸;并且插入意指在與占據(jù)一個位置的氨基酸相鄰處添加氨基酸,例如I至10個氨基酸,優(yōu)選I至3個氨基酸。
[0046]非常高嚴謹度條件:術(shù)語“非常高嚴謹度條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并變性的鮭魚精子DNA和50%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2%SDS在70°C下將載體材料洗滌三次,每次15分鐘。
[0047]非常低嚴謹度條件:術(shù)語“非常低嚴謹度條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并變性的鮭魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。最后使用2X SSC、0.2%SDS在45 °C下將載體材料洗滌三次,每次15分鐘。[0048]洗滌性能:術(shù)語“洗滌性能”被用作酶在例如洗滌(如衣物洗滌或硬表面清潔)過程中除去存在于有待清潔的物體上的污物的能力。洗滌性能可以通過計算如在此處的材料與方法所述的AMSA測定中定義的所謂強度值(Int)來定量。也參見在此的實例2中的洗滌性能測試。此外,洗滌性能,特別是根據(jù)本發(fā)明的蛋白酶變體的洗滌性能可以通過以下所述的參考洗滌測試來確定。還參見在此處的實例3。
[0049]野生型蛋白酶:術(shù)語“野生型蛋白酶”意指由天然存在的有機體(例如在自然界中發(fā)現(xiàn)的細菌、古生菌、酵母、真菌、植物或動物)表達的一種蛋白酶。野生型蛋白酶的實例是BPN’,即 SEQ ID NO:2。
[0050]轉(zhuǎn)錄啟動子:術(shù)語“轉(zhuǎn)錄啟動子”用于指為促進特定基因的轉(zhuǎn)錄的一個DNA區(qū)域的啟動子。轉(zhuǎn)錄啟動子典型地位于它們所調(diào)節(jié)的基因附近,在相同鏈上并且在上游(朝向有義鏈的5’區(qū)域)。
[0051]轉(zhuǎn)錄終止子:術(shù)語“轉(zhuǎn)錄終止子”用于指標記基因結(jié)束的基因序列區(qū)段或者供轉(zhuǎn)錄的基因組DNA上的操縱子。
[0052]變體命名慣例
[0053]出于本發(fā)明的目的,在SEQ ID NO: 2中披露的成熟多肽是用于確定在另一個枯草桿菌蛋白酶中的相應氨基酸殘基。將另一種枯草桿菌蛋白酶的氨基酸序列與SEQ ID N0:2中披露的成熟多肽比對,并且基于該比對,使用在EMBOSS包(EMBOSS:歐洲分子生物學開發(fā)軟件套,賴斯等人,2000,遺傳學趨勢16:276-277)(優(yōu)選版本5.0.0或更新版本)的尼德爾程序中實施的尼德曼-翁施算法(尼德曼和翁施,1970,分子生物學雜志48:443-453)確定與SEQ ID NO: 2中所披露的成熟多肽的任何氨基酸殘基相對應的氨基酸位置號。使用的參數(shù)是空位開放罰分10、空位 延伸罰分0.5、以及EBL0SUM62 (BL0SUM62的EMBOSS版)取代矩陣。
[0054]可以通過使用若干計算機程序、使用其對應默認參數(shù)比對多個多肽序列來確定在另一種枯草桿菌蛋白酶中的相應氨基酸殘基的鑒別,所述計算機程序包括但不限于MUSCLE (通過對數(shù)預期的多種序列比較;版本3.5或更新版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research) 32:1792-1797)、MAFFT (版本 6.857 或更新版本;加藤(Katoh)和庫馬(Kuma),2002,核酸研究30:3059-3066 ;加藤等人,2005,核酸研究33:511-518 ;加藤和都(Toh),2007,生物信息學(Bioinformatics) 23:372-374 ;加藤等人,2009,分子生物學方法(Methods in Molecular Biology) 537:39-64 ;加藤和都,2010,生物信息學26:1899-1900)、以及采用Clustalff (1.83或更新版本;湯姆斯(Thompson)等人,1994,核酸研究 22:4673-4680)的 EMBOSS EMMA。
[0055]當從具有SEQ ID NO:2的成熟多肽中分出其他酶從而使得傳統(tǒng)基于序列的比對難以檢測它們的關(guān)系(林達爾(Lindahl)和埃洛弗松(Elofsson),2000,分子生物學雜志295:613-615)時,可以使用其他成對序列比對算法。在基于序列的搜索中的較大靈敏度可以使用搜索程序來獲得,這些搜索程序利用多肽家族的概率表示(特征曲線(profile))來搜索數(shù)據(jù)庫。例如,PS1-BLAST程序通過一個迭代數(shù)據(jù)庫搜索過程來產(chǎn)生多個特征曲線并且能夠檢測關(guān)系疏遠的同源物(阿特休爾等人,1997,核酸研究25:3389-3402)。當多肽的家族或超家族在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中具有一個或多個代表時,甚至可以實現(xiàn)更大的靈敏度。程序如GenTHREADER(瓊斯(Jones),1999,分子生物學雜志287:797-815 ;麥古芬(McGuffin)和瓊斯(Jones),2003,生物信息學19:874-881)利用來自多種來源的信息(PS1-BLAST、二級結(jié)構(gòu)預測、結(jié)構(gòu)比對曲線、以及溶劑化潛能)作為到神經(jīng)網(wǎng)絡的輸入,該神經(jīng)網(wǎng)絡預測查詢序列的結(jié)構(gòu)折疊。類似地,高夫(Gough)等人,2000,分子生物學雜志313:903-919的方法可以用于比對具有未知結(jié)構(gòu)的序列與存在于SCOP數(shù)據(jù)庫中的超家族模型。這些比對進而可以用于生成該多肽的同源性模型,并且可以使用多種出于該目的而開發(fā)的工具來評價這類模型的準確度。
[0056]對于具有已知結(jié)構(gòu)的蛋白質(zhì),若干工具和資源可用于檢索和生成結(jié)構(gòu)比對。例如,已對蛋白質(zhì)的SCOP超家族進行結(jié)構(gòu)比對,并且那些比對是可訪問的并且可下載的。可以使用多種算法如距離比對矩陣(奧爾姆(Holm)和桑德(Sander),1998,蛋白質(zhì)(Proteins) 33:88-96)或者組合延伸(Shindyalov 和伯恩(Bourne), 1998,蛋白質(zhì)工程11:739-747)比對兩種或更多種蛋白質(zhì)結(jié)構(gòu),并且這些算法的實施可以另外用于查詢具有感興趣結(jié)構(gòu)的結(jié)構(gòu)數(shù)據(jù)庫,以便發(fā)現(xiàn)可能的結(jié)構(gòu)同源物(例如,奧爾姆和帕克(Park),2000,生物信息學 16:566-567)。
[0057]在描述本發(fā)明的變體中,采用以下所述的命名法以方便參考。采用已接受的IUPAC
單個字母和三字母的氨基酸縮寫。
[0058]取代。對于一個氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。因此,在位置226處的蘇氨酸被丙氨酸取代表示為“Thr226Ala”或者“T226A”。多個突變通過加號(“ + ”)、逗號或空格分開,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”、“G205R,S411F,,、“G205R S411F”,分別代表位置205和411的甘氨酸(G)取代為精氨酸(R),以及絲氨酸(S)取代為苯丙氨酸(F)。
[0059]缺失。對于一個氨基酸缺失,使用以下命名法:原始氨基酸、位置、*。因此,在位置195上的甘氨酸缺失表示為“Glyl95*”或者“G195*”。多個缺失通過加號(“ + ”)分開,例如,“Glyl95*+Ser411*,,或“G195*+S411*,,。
[0060]插入:額外的氨基酸殘基的插入,例如像在G195后插入賴氨酸可以表示為:Glyl95GlyLys或者G195GK??商娲?,額外的氨基酸殘基的插入,如在G195后插入賴氨酸可以表不為:*195aL。當插入多于一個的氨基酸殘基,例如像在G195后插入Lys和Ala時,這種插入可以表示為:Glyl95GlyLysAla或者G195GKA。在此類情況下,還可以通過將小寫字母添加到在一個或多個插入的氨基酸殘基前的氨基酸殘基位置號處來對一個或多個插入的氨基酸殘基進行編號,在這個實例中:*195aK*195bA。在以上的實例中,序列194至196因此為:
[0061]194195196
[0062]諾維信蛋白酶(Savinase)A-G-L
[0063]194195195a 195b 196
[0064]變體A-G-K-A-L
[0065]在其中取代和插入發(fā)生在相同位置的情況下,這可以表示為S99SD+S99A或者簡單地為S99AD。相同修飾也可以表示為S99A+*99aD。
[0066]在其中插 入與所存在的氨基酸殘基相同的氨基酸殘基的情況下,顯然是在命名中出現(xiàn)了簡并。如果例如在以上實例中,在甘氨酸之后插入甘氨酸,則將它表示為G195GG或者*195aGbG。對于以下變化,相同的實際變化也可以僅表示為A194AG或者*194aG,從
[0067]
【權(quán)利要求】
1.一種用于獲得一種蛋白酶變體的方法,該方法包括在親本枯草桿菌酶的與具有SEQID NO:2的成熟多肽的位置53、54、55、56以及57相對應的一個或多個位置引入一個缺失,其中該變體具有與SEQ ID NO:2至少65%—致的氨基酸序列;并且回收該變體。
2.如權(quán)利要求1所述的方法,其中該變體包含與具有SEQID NO:2的該成熟多肽的位置53、54、55、56或57相對應的兩個、三個、四個或五個缺失。
3.如權(quán)利要求1或2所述的方法,其中通過一種方法獲得該蛋白酶變體,該方法包括在親本枯草桿菌酶的與具有SEQ IDN0:2的該成熟多肽的位置53、54、55、56或57相對應的環(huán)中引入一個或多個選自下組的氨基酸的缺失,該組由Ser、Glu、Thr> Asn或Pro組成,其中該變體與SEQ ID N02具有至少65%的一致性。
4.如權(quán)利要求1所述的方法,其中通過一種方法獲得該蛋白酶變體,該方法包括在親本枯草桿菌酶的與具有SEQ ID NO: 2的該成熟多肽的位置55、56或57相對應的環(huán)中引入一個或多個氨基酸的缺失。
5.如權(quán)利要求1至4中任一項所述的方法,其中該蛋白酶變體與具有SEQID NO:2的該成熟多肽具有至少70%,例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96 %、至少97 %、至少98 %、或者至少99 %、但小于100 %的序列一致性。
6.如權(quán)利要求1至5中任一項所述的方法,其中該親本枯草桿菌酶是選自下組,該組由以下各項組成: (a)與具有SEQID NO:2的該成熟多肽具有至少65%的序列一致性的一種多肽; (b)由在中嚴謹度或高嚴謹度條件下與(i)SEQ ID NO:1的成熟多肽編碼序列、(ii)編碼具有SEQ ID N0:2的該成熟多肽的一種序列、或者(iii)⑴或(ii)的全長互補體雜交的一種多核苷酸編碼的一種多肽; (c)由與SEQID NO:1的成熟多肽編碼序列或者編碼具有SEQ ID NO: 2的該成熟多肽的一種序列具有至少70%—致性的一種多核苷酸編碼的一種多肽;以及 (d)具有SEQID NO:2的該成熟多肽的一個片段,該片段具有蛋白酶活性。
7.如權(quán)利要求1至6中任一項所述的方法,其中該親本枯草桿菌酶與具有SEQID NO: 2的該成熟多肽具有至少65 %,例如至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
8.一種蛋白酶變體,該蛋白酶變體在與具有SEQ 10勵:2的成熟多肽的位置53、54、55、56或57相對應的環(huán)中包含一個或多個氨基酸的缺失并且在與具有SEQ ID NO:2的該成熟多肽的位置53、54、55、56或57相對應的位置進一步包含一個或多個取代,其中 (a)該變體與SEQID NO:2具有至少65%且小于100%的序列一致性,并且 (b)該變體具有蛋白酶活性。
9.如權(quán)利要求8所述的變體,其中該變體在與SEQID NO: 2的位置53相對應的一個位置包含一個缺失并且在與具有SEQ ID NO: 2的該成熟多肽的位置54、55、56或57相對應的一個或多個位置進一步包含一個取代,和/或 其中該變體在與SEQ ID NO: 2的位置54相對應的一個位置包含一個缺失并且在與具有SEQ ID NO:2的該成熟多肽的位置53、55、56或57相對應的一個或多個位置進一步包含一個取代,和/或 其中該變體在與SEQ ID NO: 2的位置55相對應的一個位置包含一個缺失并且在與具有SEQ ID NO:2的該成熟多肽的位置53、54、56或57相對應的一個或多個位置進一步包含一個取代,和/或 其中該變體在與SEQ ID NO: 2的位置56相對應的一個位置包含一個缺失并且在與具有SEQ ID NO:2的該成熟多肽的位置53、54、55或57相對應的一個或多個位置進一步包含一個取代,或者 其中該變體在與SEQ ID NO: 2的位置57相對應的一個位置包含一個缺失并且在與具有SEQ ID NO:2的該成熟多肽的位置53、54、55或56相對應的一個或多個位置進一步包含一個取代。
10.如權(quán)利要求8至9所述的變體,其中在與位置53相對應的該位置上的氨基酸是選自Gly、Ala、Thr、Asn或者是不存在的,和/或 其中在與位置54相對應的該位置上的氨基酸是選自Gly、Ala、Ser、Thr、Asn或者是不存在的,和/或 其中在與位置55相對應的該位置上的氨基酸是選自Gly、Ala、Ser、Asn或者是不存在的,和/或 其中在與位置56相對應的該位置上的氨基酸是選自Gly、Ala、Ser、Thr或者是不存在的,或者 其中在與位置57相對應的該位置上的氨基酸是選自Gly、Ala、Ser、Thr、Asn或者是不存在的。
11.如權(quán)利要求8至10中任一項所述的變體,該變體在與位置53、54、55、56、以及57中任一個相對應的三個位置包含一個變化。
12.如權(quán)利要求8至11中任一項所述的變體,該變體包含一個或多個選自下組的變化,該組由缺失S53*、E54*、T55*、N56*以及P57*和/或取代S53G、T55S以及P57A組成。
13.如權(quán)利要求8至12中任一項所述的變體,其中該變體是選自以下變體:S53G+T55S+N56*+P57A+Y217L、P14T+T55S+N56*+P57A+Y217L、P14T+S53G+N56*+P57A+Y217L、P14T+S53G+T55S+N56*+Y217L、P14T+S53G+T55S+N56*+P57A、P14T+S53G+T55S+N56*+P57A+S101L+Y217L、 V4I+S53G+T55S+N56*+P57A+Y217L、P14T+S53G+T55S+N56*+P57A+Y217L、T55S+N56*+P57A+Y217L、S53G + T55S+N56*+P57A + I79T+Y217L、S53G+T55S+N56*+P57A+P86H+A92S+Y217L、 S53G+T55S+N56*+P57A+A88V+Y217L、 S53G+T55S+N56*+P57A+A98T+Y2I7L、S53G+T55S+N56*+P57A+Y217L、S53G+T55P+N56*+S63G+G146S+Y217L。
14.如權(quán)利要求8至13中任一項所述的變體,該變體相比于該親本或者相比于具有SEQID NO:2的該蛋白酶具有改進的洗滌性能。
15.如權(quán)利要求8至14中任一項所述的變體,其中該變體是選自下組,該組由以下各項組成: a.與SEQID NO:2的該成熟多肽具有至少65%的序列一致性的一種多肽; b.由在中嚴謹度或高嚴謹度條件下與(i)SEQID NO:1的成熟多肽編碼序列、(ii)編碼具有SEQ ID NO:2的該成熟多肽的一種序列、或者(iii)⑴或(ii)的全長互補體雜交的一種多核苷酸編碼的一種多肽; c.由與SEQID NO:1的成熟多肽編碼序列或者編碼具有SEQ ID NO: 2的成熟多肽的一種序列具有至少65%—致性的一種多核苷酸編碼的一種多肽;以及 d.具有SEQ ID NO:2的成熟多肽的一個片段,該片段具有蛋白酶活性。
16.如權(quán)利要求8至15中任一項所述的變體,其中該變體與具有SEQIDN0:2的該成熟多肽具有至少70 %,例如至少75 %、至少80 %、至少85 %、至少90 %、至少95 %、至少96 %、至少97%、至少98%、至少99%、但小于100%的序列一致性。
17.如權(quán)利要求8至16中任一項所述的變體,其中在該變體中的變化總數(shù)是I至20個,例如I至10個和I 至5個,如1、2、3、4、5、6、7、8、9或者10個變化。
【文檔編號】C12N9/54GK104011204SQ201280063467
【公開日】2014年8月27日 申請日期:2012年12月18日 優(yōu)先權(quán)日:2011年12月20日
【發(fā)明者】W.貝森馬特, A.本尼, E.P.弗里斯, P.O.米奇爾森 申請人:諾維信公司