專利名稱:蘇云金芽孢桿菌(bacillus thur_ingiensis)的殺蟲蛋白的制作方法
引言本發(fā)明涉及編碼蘇云金芽孢桿菌產(chǎn)生的殺蟲蛋白的新的DNA序列。具體地說,本發(fā)明提供了編碼被命名為Cry9Fa、Cry1Jd和Cry1Bf的蛋白的新的DNA序列,其有益于保護植物免受昆蟲侵害。此處也包括用至少一種該新分離基因轉(zhuǎn)化的微生物和植物,這樣它們通過表達殺蟲蛋白而賦予昆蟲抗性。
背景技術(shù):
(i)發(fā)明領(lǐng)域Bt或蘇云金芽孢桿菌因其對昆蟲害蟲的特異毒性而廣為所知,并被用于控制植物的昆蟲害蟲幾乎達一個世紀之久。最近幾年,已經(jīng)有了表達Bt蛋白的轉(zhuǎn)基因植物,其已被發(fā)現(xiàn)能成功控制昆蟲對植物的損害(如Vaeck等,1987)。
盡管許多Bt晶體蛋白基因已經(jīng)得到分離,但是對于編碼殺蟲蛋白的新基因的搜索仍在繼續(xù)。實際上,與化學殺蟲劑相比,Bt殺蟲晶體蛋白的靶標昆蟲范圍公知為相對較窄。而且,對相同靶標昆蟲種類具有多重毒性活性使得可使用具有不同作用方式的蛋白成為可能,從而可以防止或延緩昆蟲抗性的發(fā)展。
(ii)相關(guān)技術(shù)描述先前,Cry1B-、Cry1J-和Cry9蛋白的幾種類型已得到鑒定(見Crickmore等,1998,全部詳情并入此文以作參考)。
新的Cry1Bf蛋白與Cry1Be蛋白的序列同源性最為接近(Payne等,1998,美國專利5,723,758),但前者毒性蛋白片斷的氨基酸序列與Cry1Be蛋白毒性片斷的氨基酸序列相比,仍有約14%的差異。
與Cry1Jd的毒性片斷序列同源性最接近的為Cry1Jc1蛋白的毒性片斷(美國專利5,723,758),但這兩個蛋白毒性片斷的氨基酸序列仍有約18%的差異。
如Midoh等人(PCT專利公開WO 98/26073)和Narva等人(PCT專利公開WO 98/00546)所述,與Cry9Fa的毒性片斷序列同源性最接近的為Cry9Ea1蛋白的毒性片斷,但Cry9Fa和Cry9Ea蛋白的毒性片斷仍有約21%的氨基酸序列差異。
本發(fā)明特別優(yōu)選編碼含有下列氨基酸序列的蛋白的DNA序列SEQ IDNo.2蛋白的殺蟲片斷的氨基酸序列、SEQ ID No.4蛋白的殺蟲片斷的氨基酸序列和SEQ ID No.6蛋白的殺蟲片斷的氨基酸序列;或者可選編碼含有下列氨基酸序列的蛋白的DNA序列SEQ ID No.2的氨基酸序列、SEQ IDNo.4的氨基酸序列、SEQ ID No.6的氨基酸序列;或者含有SEQ ID No.1、SEQ ID No.3、或SEQ ID No.5 DNA序列的DNA序列。
此外,本發(fā)明提供了這樣的DNA序列,其至少編碼新分離蛋白的下列部分SEQ ID No.2從第1位氨基酸到第640位氨基酸的氨基酸序列、SEQID No.4從第1位氨基酸到第596位氨基酸的氨基酸序列、SEQ ID No.6從第1位氨基酸到第652位氨基酸的氨基酸序列。
此外,本發(fā)明提供了含有人工DNA序列的上述DNA序列,該人工DNA序列具有不同于天然存在的DNA序列中的密碼子使用,但卻編碼相同的蛋白或其殺蟲片斷。
更進一步地,本發(fā)明提供了包含選自下列氨基酸序列的蛋白a)由保藏在BCCM-LMBP,保藏號為LMBP 3986的cry1Bf基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,b)由保藏在BCCM-LMBP,保藏號為LMBP3983的cry1Jd基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,c)由保藏在BCCM-LMBP,保藏號為LMBP 3984的cry9Fa基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列。
此處尤其優(yōu)選包含選自下列氨基酸序列的蛋白SEQ ID No.2蛋白的殺蟲片斷的氨基酸序列、SEQ ID No.4蛋白的殺蟲片斷的氨基酸序列和SEQID No.6蛋白的殺蟲片斷的氨基酸序列;或者包含選自下列氨基酸序列的蛋白SEQ ID No.2從第1位氨基酸到第640位氨基酸的氨基酸序列、SEQID No.4從第1位氨基酸到第596位氨基酸的氨基酸序列、SEQ ID No.6從第1位氨基酸到第652位氨基酸的氨基酸序列;或者含有SEQ ID No.2、SEQ ID No.4、或SEQ ID No.6氨基酸序列的蛋白。
此處,本發(fā)明也提供了含有在植物表達啟動子控制下的上述DNA的嵌合基因和由轉(zhuǎn)化而含有那些嵌合基因的植物細胞、植株或種子,其中所述植物細胞、植株或種子尤其選自玉米、棉花、水稻、油菜籽、蕓苔、茄子、大豆、土豆、向日葵、西紅柿、甘蔗、茶葉、豌豆、煙草、草莓、苜蓿、黃瓜、西瓜、胡椒、燕麥、大麥、小麥、天竺牡丹、劍蘭、菊花、甜菜、高粱、紫花苜蓿和花生。按本發(fā)明所述,該嵌合基因整合入植物細胞的染色體DNA或葉綠體DNA。
另外,本發(fā)明也提供了由轉(zhuǎn)化而含有任何上述DNA序列的、尤其是選自土壤桿菌屬(Agrobacterium)、埃希氏菌屬(Escherichia)或芽孢桿菌屬(Bacillus)的微生物。
此處也提供了一種控制昆蟲的方法和使植物抗昆蟲的方法,其中所述控制昆蟲的方法包括在宿主細胞、尤其是植物細胞中表達任何上述DNA序列,并使昆蟲和所述宿主細胞相接觸;其中所述使植物抗昆蟲的方法包括用任何上述DNA序列或嵌合基因轉(zhuǎn)化植物細胞,并從此類抗昆蟲細胞再生出轉(zhuǎn)化植株。
按本發(fā)明所述,“Cry1Bf蛋白”指含有SEQ ID No.2氨基酸序列的、保留殺蟲活性的最小蛋白片斷的任何蛋白,尤其是含有SEQ ID No.2中第1位氨基酸到第640位氨基酸的氨基酸序列的任何蛋白,包括但不限于具有SEQ ID No.2氨基酸序列的完整蛋白。這包括含有該最小毒性蛋白片斷的雜合或嵌合蛋白,也包括至少含有SEQ ID No.2毒性片斷三個功能結(jié)構(gòu)域中之一的蛋白。
此處所用術(shù)語“含有序列X的DNA/蛋白”是指至少包括或含有此序列X的DNA或蛋白,從而在5’(或N-末端)和/或3’(或C-末端)末端可包括其它核苷酸或氨基酸序列,如EP 0 193 259公開的可選擇性標記蛋白(的核苷酸序列)。
按本發(fā)明所述,“Cry9Fa蛋白”或“Cry9F蛋白”是指含有SEQ ID No.6氨基酸序列的、保留殺蟲活性的最小蛋白片斷的任何蛋白,尤其是含有SEQ ID No.6中第1位氨基酸到第652位氨基酸的氨基酸序列的任何蛋白,包括但不限于具有SEQ ID No.6氨基酸序列的完整蛋白。這包括含有該最小毒性蛋白片斷的雜合或嵌合蛋白,也包括至少含有SEQ ID No.6毒性片斷三個功能結(jié)構(gòu)域中一個的蛋白。
按本發(fā)明所述,“Cry1Jd蛋白”是指含有SEQ ID No.4氨基酸序列的、保留殺蟲活性的最小蛋白片斷的任何蛋白,尤其是含有SEQ ID No.4中第1位氨基酸到第596位氨基酸的氨基酸序列的任何蛋白,包括但不限于具有SEQ ID No.4氨基酸序列的完整蛋白。這包括含有該最小毒性蛋白片斷的雜合或嵌合蛋白,也包括至少含有SEQ ID No.4毒性片斷三個功能結(jié)構(gòu)域中一個的蛋白。
此處所用術(shù)語“cry1Bf DNA”、“cry9Fa DNA”或“cry1Jd DNA”分別是指編碼如上所述的Cry1Bf、Cry9Fa或Cry1Jd蛋白的任何DNA序列。這包括編碼如上所述的新分離蛋白或其殺蟲片斷的天然存在的、人工的或合成的DNA序列。此處也包括與所保藏的基因組DNA序列或序列列表中所提供序列的編碼區(qū)足夠相似的、編碼殺蟲蛋白的DNA序列,從而使它們可以(即有能力)與這些DNA序列在嚴緊的雜交條件下進行雜交。此處所用的嚴緊的雜交條件具體是指下列條件將相關(guān)基因組DNA序列固定在濾膜上,并將該濾膜在42℃、50%甲酰胺、5%SSPE、2x Denhardt’s試劑和0.1%SDS中預(yù)雜交1到2小時,或在68℃、6x SSC、2x Denhardt’s試劑和0.1%SDS中預(yù)雜交1到2小時。然后直接向預(yù)雜交液中加入變性的標記探針并在上述適當?shù)臏囟认聹赜?6到24小時。溫育之后,于室溫在1x SSC、0.1%SDS中洗滌濾膜20分鐘,然后于68℃在0.2x SSC和0.1%SDS中洗滌三次,每次20分鐘。使用增感屏于-70℃將此濾膜曝光于X-射線膠片(Kodak XAR-2或等同物)24到48小時,以進行放射自顯影。當然,在此步中可以使用等同的條件和參數(shù)而仍保持所需的嚴緊雜交條件。這樣的等同條件之一包括將相關(guān)基因組DNA序列固定在濾膜上,并將該濾膜在42℃、50%甲酰胺、5%SSPE、2x Denhardt’s試劑和0.1%SDS中預(yù)雜交1到2小時,或在68℃、6x SSC、2x Denhardt’s試劑和0.1%SDS中預(yù)雜交1到2小時。然后直接向預(yù)雜交液中加入變性的(地高辛或放射性)標記探針,并在上述適當?shù)臏囟认聹赜?6到24小時。溫育之后,于室溫在2x SSC、0.1%SDS中洗滌濾膜30分鐘,然后于68℃在0.5x SSC和0.1%SDS中洗滌兩次,每次30分鐘。使用增感屏于-70℃將此濾膜曝光于X-射線膠片(Kodak XAR-2或等同物)24到48小時,以進行放射自顯影。
此處所用的蛋白的“殺蟲活性”是指當用蛋白喂飼昆蟲時,該蛋白有殺死昆蟲的能力,其中所述蛋白優(yōu)選通過在重組宿主(如植物)中進行表達。此處所用的蛋白的“昆蟲控制量”是指在植物上喂飼昆蟲時,足以將昆蟲對植物的損害限制在可商業(yè)用水平的蛋白量,其例如通過殺死昆蟲或通過抑制昆蟲的發(fā)育或成長從而使它們對植物有較少的損害且對植物產(chǎn)量不產(chǎn)生明顯的副作用。
按本發(fā)明所述,將昆蟲控制量、優(yōu)選殺蟲量的本發(fā)明的新Cry蛋白與易受該蛋白影響的昆蟲接觸。
此處所用的“Cry蛋白”或“本發(fā)明的Cry蛋白”是指按本發(fā)明所述所分離的并被鑒定為Cry1Bf、Cry9Fa或Cry1Jd蛋白的任何一個新的蛋白。此處所用的Cry蛋白可以是全長蛋白(也叫做原毒素),或是稍微或完全(如N端和C端截短)截短了的形式,只要其保留了殺蟲活性,或者可以是雜合或融合蛋白形式的不同蛋白或蛋白部分的組合物。“Cry原毒素”是指如同由天然存在的Bt DNA序列編碼的全長晶體蛋白,“Cry毒素”是指其殺蟲片斷,尤其指其最小的毒性片斷,用SDS-PAGE電泳測定的一般分子量范圍為約60到約80kD。此處所用的“cry基因”或“cryDNA”是指編碼本發(fā)明所述的Cry蛋白的DNA序列,指上述cry1Bf、cry9Fa和cry1JdDNA序列的任何一個。
此處所用的Cry蛋白的“最小毒性片斷”是指可以通過胰蛋白酶或糜蛋白酶消化溶解了的全長晶體蛋白獲得的保留有毒性的片斷,或由Cry蛋白的DNA片斷編碼的毒性蛋白片斷。與原毒素相比,該蛋白通常有一個短的N末端和長的C末端截短。雖然對于重組表達來說,開始于或大約開始于原始的第1位氨基酸的毒性片斷是本發(fā)明所述的優(yōu)選實施方案,但是我們也應(yīng)該注意到除了C末端截短以外,一些N末端氨基酸也可以缺失而保留該蛋白的殺蟲特點。最小毒性片斷的N末端可以以本領(lǐng)域的常規(guī)技術(shù),通過胰蛋白酶或糜蛋白酶處理的可溶性晶體蛋白的N末端氨基酸序列測定方便地進行測定。
編碼本發(fā)明Cry蛋白的DNA可以以傳統(tǒng)方法從1999年11月25日保藏在BCCM-LMBP,保藏號為LMBP 3983、LMBP 3984、LMBP 3985和LMBP 3986的大腸桿菌(E.coli)菌株中分離得到。所編碼的Cry蛋白可以用來以傳統(tǒng)方法制備特異性單克隆或多克隆抗體(Hfte等,1988)。其毒素形式可以通過Cry原毒素的蛋白酶(如胰蛋白酶)水解獲得。
編碼該Cry蛋白的DNA序列可以以常規(guī)方法從各自菌株中分離得到或者可以基于被編碼的氨基酸序列進行合成。
通過用限制酶消化分離自Bt菌株的總DNA對編碼本發(fā)明Cry蛋白的DNA序列進行了鑒定;使DNA片斷化,從而產(chǎn)生5到10Kb的DNA片斷;將這些片斷連入克隆載體;用克隆載體轉(zhuǎn)化大腸桿菌,再用從已知的Bt晶體蛋白基因構(gòu)建的DNA探針或用基于特異性PCR片斷(使用與已知的Bt晶體蛋白基因相對應(yīng)的引物,由Bt DNA產(chǎn)生)的DNA探針篩選克隆載體轉(zhuǎn)化的大腸桿菌。
而且,在本發(fā)明中使用的DNA序列可以通過合成制得。實際上,由于遺傳密碼的簡并性,一些氨基酸密碼子可以用其它的密碼子進行替換而不改變該蛋白的氨基酸序列。此外,一些氨基酸可以用其它的等同氨基酸代替而對該蛋白的殺蟲活性沒有明顯的改變。而且,與那些負責結(jié)合和毒性的區(qū)域的改變不同,在此分子區(qū)內(nèi)氨基酸序列或組成的改變很少有可能引起該蛋白殺蟲活性的差異。該基因的這些等同物包括在嚴緊條件下與Cry毒素或SEQ ID.No.2、4或6的原毒素的DNA序列雜交并編碼與本發(fā)明(蛋白)毒素具有相同殺蟲特性的蛋白的DNA序列,或者編碼與該蛋白毒素形式(如在Schnepf等人、1998中所述的,從N端到保守序列框5以外2個氨基酸處)或與本發(fā)明Cry1Bf、Cry9FA或Cry1Jd蛋白的原毒素形式具有至少85%、優(yōu)選90%、最優(yōu)選95%氨基酸序列同源性蛋白的DNA序列,序列同源性測定使用威斯康星GCG軟件包的GAP程序(美國威斯康星州麥迪遜,10.0版;在GAP程序中使用GCG的默認值;為進行氨基酸序列比較,使用了blosum62記分模型)。
當然,根據(jù)具體目的的不同,可以構(gòu)建出任何其它的密碼子使用不同而編碼基本上有著相同殺蟲活性的相同蛋白或相似蛋白的DNA序列。這已經(jīng)在原核和真核表達系統(tǒng)中有述,其中將密碼子使用變成在外源宿主中進行基因表達時宿主細胞所偏好的密碼子(Bennetzen & Hall,1982;Itakura,1977)。此外,已知Bt晶體蛋白基因?qū)φ婧嗣艽a子沒有偏好,并非常富含AT(Adang等,1985,Schnepf等,1985)。密碼子使用表可在文獻(Wada等,1990;Murray等,1989)中以及在主要的DNA序列數(shù)據(jù)庫(如德國海德堡的EMBL)中找到。因此,可以構(gòu)建合成的DNA序列從而產(chǎn)生相同的或基本上相同的蛋白。很明顯,一旦知道了本發(fā)明Cry蛋白的氨基酸序列就可以設(shè)計出幾種不同的DNA序列。這些其它的DNA序列包括合成的或半合成的DNA序列,它們?yōu)榱耸够蛑械哪承┪稽c失活已經(jīng)發(fā)生了改變,例如在PCT公開WO 91/16432和WO 93/09218中描述的,選擇性地失活存在于天然序列中的某些隱性調(diào)節(jié)或加工元件,或使總體密碼子使用適合更相關(guān)宿主生物體的密碼子使用,優(yōu)選可在宿主生物體表達的密碼子使用。在構(gòu)建這些基因時,雖然只要該蛋白的毒性不受到負面的影響就可以對氨基酸進行截短或次要的替換或添加,但是還是應(yīng)該最大程度的保持所編碼的氨基酸序列。
通??梢酝ㄟ^PCR介導(dǎo)的突變對DNA序列進行上述的小的修飾(Ho等,1989,White等,1989)。
在提到蛋白時的術(shù)語“基本上相同”是指包括有些氨基酸不同或有一些氨基酸添加(如融合蛋白,參見Vaeck等,1987)或缺失(如N端或C端截短)的蛋白,只要該蛋白在其殺蟲活性上沒有明顯的差異就行。
此處所用的術(shù)語Cry毒素的“功能結(jié)構(gòu)域”是指具有特定結(jié)構(gòu)的、該毒素的任何部分或結(jié)構(gòu)域,其可被轉(zhuǎn)移到另一種(Cry)蛋白上,以產(chǎn)生一種新的、具有本發(fā)明Cry毒素至少一種功能特性(如結(jié)合和/或毒性特性)的雜合蛋白(Ge等,1991)。這些部分以本發(fā)明Cry蛋白的結(jié)合和/或毒性特性構(gòu)成該雜合Bt蛋白的基本特征。這樣的雜合蛋白可以有較大的宿主范圍,改良的毒性和/或可用于防止昆蟲抗性發(fā)展的策略中(歐洲專利公開(“EP”)408 403;Visser等,1993)。
可將由本發(fā)明Bt菌株的總DNA制備的5到10Kb的片斷連入適當?shù)谋磉_載體并轉(zhuǎn)化大腸桿菌,然后可以通過常規(guī)的菌落免疫探測法(French等,1986)用抗Cry蛋白的單克隆或多克隆抗體篩選表達該毒素的克隆,或通過與DNA探針雜交篩選克隆。
而且,可將由本發(fā)明Bt菌株的總DNA制備的5到10Kb的片斷或其被克隆和/或亞克隆到大腸桿菌中的片斷,連入適當?shù)腂t穿梭載體(Lereclus等,1992)并轉(zhuǎn)化進入晶體缺失的Bt突變體。然后篩選產(chǎn)生晶體(鏡檢)或晶體蛋白(SDS-PAGE檢測)的克隆。
編碼本發(fā)明Cry蛋白的基因可以以常規(guī)方法測序(Maxam和Gilbert,1980;Sanger,1977)以得到其DNA序列。序列比較表明這些基因與以前描述的、編碼具有抗鱗翅類活性的原毒素和毒素(Hfte和Whiteley,1989;Crickmore等,1998)不同;而且可在http//epunix.biols.susx.ac.uk/Home/Neil-Crickmore/Bt/index.html上找到1999年11月15日和2000年10月16日Bt命名網(wǎng)站的升級與Crickmore等(1998)的公開相對應(yīng)。
編碼新鑒定的Cry蛋白原毒素形式的有效殺蟲區(qū)段的這些DNA序列的有效殺蟲部分,在對該基因進行序列分析之后,可以按常規(guī)方法制得。在這些片斷中,優(yōu)選保留至少到達Bt蛋白保守序列框5的C端末端(Hofte &Whiteley,1989;Schnepf等1998),優(yōu)選到達保守序列框5C端2個氨基酸的序列。這些Cry蛋白的氨基酸序列可由分離的DNA序列得以確定。編碼該Cry蛋白的DNA序列的“有效殺蟲部分”,在此也指“截短基因”或“截短DNA”,是指編碼一段多肽的DNA序列,該多肽比Cry蛋白原毒素形式的氨基酸要少但可以殺蟲。
為了在大腸桿菌中、在其它Bt菌株中或在植物中表達編碼本發(fā)明Cry蛋白的全長DNA序列或其有效殺蟲部分,在該DNA序列兩側(cè)可以引入適當?shù)南拗泼盖形稽c。這可以使用已知工藝,通過定點突變來進行(Stanssens等,1989;White等,1989)。為在植物中提高表達,可以對本發(fā)明cry基因或cry基因的有效殺蟲部分的密碼子使用進行修飾以形成與PCT公開WO 91/16432和WO 93/09218;EP 0 358 962和EP 0 359 472等同的、修飾的或人工基因或部分基因;或?qū)t基因或部分基因插入葉綠體基因組中并使用葉綠體活性啟動子進行表達(如Mc Bride等,1995)。為在單子葉植物例如玉米中獲得增強表達,也可以將單子葉內(nèi)含子加到嵌合基因中,并且可以以翻譯中性方式,通過內(nèi)含子定點插入和/或通過引入密碼子使用的改變(例如將密碼子使用調(diào)整至特定植物的最優(yōu)密碼子使用(Murray等,1989)而不明顯改變所編碼的氨基酸序列),進一步改變本發(fā)明cry基因或其殺蟲部分的DNA序列,以對可能出現(xiàn)在部分基因中的DNA抑制序列進行修飾。
此外,本發(fā)明Cry蛋白的結(jié)合特性可通過本領(lǐng)域已知方法進行評價(Van Rie等,1990),以確定是否本發(fā)明的Cry蛋白結(jié)合至昆蟲的中腸位點,這與由其它已知的Cry蛋白或Bt蛋白所識別的位點不同。在相關(guān)易感昆蟲中,有著不同結(jié)合位點的Bt毒素對于取代已知的、昆蟲可能已經(jīng)對其產(chǎn)生抗性的Bt毒性是非常有價值的,或者對于與具有不同的、防止或延緩昆蟲對Bt毒素抗性作用模式的Bt毒素的聯(lián)合使用是非常有價值的,尤其是在植物中進行表達的時候。由于此新分離得到的Bt毒素的這些特點,使其在改造植物(例如單子葉植物如玉米或水稻及蔬菜如蕓苔種植物)以保護這些植物免受昆蟲侵害方面十分有用。
編碼Cry原毒素有效殺蟲區(qū)段的cry基因的有效殺蟲部分或其等同物(優(yōu)選cry嵌合基因)可以以常規(guī)方法穩(wěn)定插入單一植物細胞的核基因組,并且這樣轉(zhuǎn)化的植物細胞可以以常規(guī)方法用于生產(chǎn)昆蟲抗性的轉(zhuǎn)化植株。在這點上,可用在根瘤土壤桿菌(Agrobacterium tumefaciens)中的含有cry基因有效殺蟲部分的卸甲Ti質(zhì)粒轉(zhuǎn)化植物細胞,然后使用例如在EP 0116 718、EP 0 270 822、PCT公開WO 84/02913和公開的歐洲專利申請(“EP”)0 242 246和在Gould等(1991)中描述的方法,由該轉(zhuǎn)化的植物細胞再生出轉(zhuǎn)化植株。每種優(yōu)選的Ti質(zhì)粒載體都在Ti質(zhì)粒T-DNA的邊界序列之間含有cry基因有效殺蟲部分,或至少位于其邊界序列的左邊或右邊。當然,也可以用其它類型的載體轉(zhuǎn)化植物細胞,所用轉(zhuǎn)化方法例如使用直接的基因轉(zhuǎn)移(例如在EP 0 233 247中所述)、花粉介導(dǎo)的轉(zhuǎn)化(例如在EP 0 270356、PCT公開WO 85/01856和美國專利4,684,611中所述)、植物RNA病毒介導(dǎo)的轉(zhuǎn)化(例如在EP 0 067 553和美國專利4,407,956中所述)、脂質(zhì)體介導(dǎo)的轉(zhuǎn)化(例如在美國專利4,536,475中所述)和其它方法例如最近所述的轉(zhuǎn)化玉米的某些特定品系(Fromm等,1990;Gordon-Kamm等,1990)和水稻的某些特定品系(Shimamoto等,1989;Datta等,1990)的方法和最近所述的通常轉(zhuǎn)化單子葉植物的方法(PCT公開WO 92/09696)。
所得的轉(zhuǎn)化植株可用于常規(guī)的植物育種方法,用于生產(chǎn)更多的具有同樣特性的植株或用于將該cry基因有效殺蟲部分導(dǎo)入其它相同或相關(guān)植物品種中。從轉(zhuǎn)化植株獲得的種子含有作為穩(wěn)定的基因組插入物的cry基因有效殺蟲部分。轉(zhuǎn)化植株的細胞可以以常規(guī)方法進行培養(yǎng)以生產(chǎn)Cry原毒素(優(yōu)選Cry毒素)的有效殺蟲區(qū)段,可以對其進行回收以用于常規(guī)的抗鱗翅類殺蟲組合物中(美國專利5,254,799)。按本發(fā)明所述,本發(fā)明的植物或種子可通過例如在一塊通常有蟲害的地里播種或種植,以獲得對昆蟲的抗性。因此,按照本發(fā)明,通過在一塊地里,優(yōu)選在通常存在或預(yù)期存在吃該類植物的害蟲(其水平為對植物造成了經(jīng)濟上的損害)出現(xiàn)的地里播種或種植產(chǎn)生本發(fā)明Cry蛋白的本發(fā)明的種子植物,提供了獲得昆蟲抗性的方法和獲得提高的產(chǎn)量或減少蟲害的方法。
將cry基因有效殺蟲部分,優(yōu)選截短cry基因,插入植物細胞基因組,使插入的基因位于可指導(dǎo)該基因部分在此植物細胞中進行表達的啟動子的下游(即3’)及其控制之下。優(yōu)選通過在植物細胞基因組中,具體說來就是在核基因組或葉綠體基因組中,插入cry嵌合基因來完成。優(yōu)選的啟動子包括分離物CM 1841(Gardner等,1981)、CabbB-S(Franck等,1980)和CabbB-JI(Hull和Howell,1987)的花椰菜花葉病毒(CaMV)的35 S組成型強啟動子(即“35 S啟動子”);遍在蛋白家族的啟動子(例如Christensen等,1992的玉米遍在蛋白啟動子,也可參見Cornejo等,1993),gos2啟動子(de Pater等,1992),emu啟動子(Last等,1990),水稻的肌動蛋白啟動子例如Zhang等(1991)描述的啟動子;和分別驅(qū)動1’和2’基因表達的、T-DNA的TR1′啟動子和TR2′啟動子(即分別的“TR1啟動子”和“TR2啟動子”)(Velten等,1984)。另外,啟動子可以為非組成型的、但其對植物的一種或多種組織或器官(如葉和/或根)具特異性,從而使插入的cry基因部分僅在特定組織或器官的細胞中進行表達。例如,通過將有效殺蟲基因部分置于光誘導(dǎo)啟動子(例如在美國專利5,254,799中公開的,植株本身的或另一植株例如豌豆的核酮糖-1,5-二磷酸羧化酶小亞基基因的啟動子)的控制之下,使該cry基因有效殺蟲部分可選擇性地在植物(例如玉米、棉花)的葉子中進行表達。再一種選擇為使用誘導(dǎo)表達啟動子(例如通過溫度、愈傷或化學因子誘導(dǎo))。
將cry基因的有效殺蟲部分插入植物基因組中,使插入的基因部分處于適合的3’末端轉(zhuǎn)錄調(diào)節(jié)信號(即轉(zhuǎn)錄本形成和多聚腺苷酸化信號)的上游。優(yōu)選通過在植物細胞基因組中插入該cry嵌合基因來進行。優(yōu)選的多聚腺苷酸化和轉(zhuǎn)錄本形成信號包括章魚堿合成酶基因的那些信號(Gielen等,1984)和T-DNA基因7(Velten和Schell,1985)的那些信號,它們在被轉(zhuǎn)化的植物細胞中作為3’非翻譯DNA序列存在。
可任選地將cry基因有效殺蟲部分插入到植物基因組中作為與選擇標記基因(例如編碼卡那霉素抗性的neo基因(EP 0 242 236))處于同一啟動子控制之下的雜合基因(美國專利5,254,799;Vaeck等,1987),從而使該植物表達融合蛋白。
編碼抗鱗翅類蛋白的全部cry基因的或部分cry基因也可用來轉(zhuǎn)化其它細菌,例如具有抗鱗翅類或鞘翅類殺蟲活性的蘇云金芽孢桿菌。因此,可以生產(chǎn)轉(zhuǎn)化的Bt菌株,其在同廣譜鱗翅類或鞘翅類昆蟲害蟲斗爭或同其它鱗翅類昆蟲害蟲斗爭方面是十分有用的。用已摻入合適克隆載體的本發(fā)明全部或部分cry基因轉(zhuǎn)化細菌,例如土壤桿菌屬、芽孢桿菌屬或埃希氏菌屬的細菌,可以按常規(guī)方法進行,優(yōu)選使用如Mahillon等(1989)和PCT專利公開WO 90/06999中所述的常規(guī)電穿孔技術(shù)。
含有本發(fā)明cry基因的芽孢桿菌轉(zhuǎn)化菌株可通過常規(guī)方法(Dulmage,1981;Bernhard和Utz,1993)進行發(fā)酵,以提供高產(chǎn)量的細胞。以提供高產(chǎn)量的細胞。在公知的合適條件下(Dulmage,1981),這些菌株的每一種都形成孢子以產(chǎn)生高產(chǎn)量的含有Cry原毒素的晶體蛋白。
殺蟲的,尤其是抗鱗翅類的本發(fā)明組合物可以使用用cry基因轉(zhuǎn)化的微生物,或優(yōu)選其各自的Cry蛋白或Cry原毒素、毒素或有效殺蟲原毒素區(qū)段作為活性成分,與適當?shù)妮d體、稀釋劑、乳化劑和/或分散劑(例如由Bernhard和Utz,1993所描述的)一起以常規(guī)方法進行配制??梢詫⒃摎⑾x組合物制劑為吸濕粉末、丸粒、顆?;驀姺?,或與水性的或非水性的溶劑以泡沫、凝膠、懸液、濃縮物等等制備為液體制劑。
本發(fā)明所述的控制昆蟲,尤其是鱗翅類昆蟲的方法可以包括將本發(fā)明殺蟲量的Cry蛋白或用cry基因轉(zhuǎn)化的宿主細胞應(yīng)用(例如噴灑)到要保護的地點(區(qū)域)。被保護的地點包括,例如昆蟲害蟲的棲息地或種植蔬菜或長有蔬菜的區(qū)域。
為獲得Cry原毒素或毒素,表達Cry蛋白的重組宿主細胞可以以常規(guī)方式在適當?shù)呐囵B(yǎng)基上進行生長,然后使用常規(guī)的方法,例如酶解或去污劑等等裂解之。然后,可以用標準技術(shù)例如色譜、萃取、電泳等等,將該原毒素分離并純化。然后可以通過該原毒素的胰蛋白酶消化獲得毒素。
下列實施例例證了本發(fā)明,而并非是對本發(fā)明或保護的目標進行限制。在實施例、權(quán)利要求和敘述中所涉及的序列表如下序列表SEQ ID No.1-Cry1Bf蛋白和DNA的氨基酸序列和DNA序列。
SEQ ID No.2-Cry1Bf蛋白的氨基酸序列。
SEQ ID No.3-Cry1Jd蛋白和DNA的氨基酸序列和DNA序列。
SEQ ID No.4-Cry1Jd蛋白的氨基酸序列。
SEQ ID No.5-Cry9Fa蛋白和DNA的氨基酸序列和DNA序列。
SEQ ID No.6-Cry9Fa蛋白的氨基酸序列。
SEQ ID No.7-引物Cry1B.fw的DNA序列。
SEQ ID No.8-引物B.R的DNA序列。
SEQ ID No.9-引物B.F的DNA序列。
SEQ ID No.10-引物JFW的DNA序列。
SEQ ID No.11-引物JRV的DNA序列。
SEQ ID No.12-引物9FW的DNA序列。
SEQ ID No.13-引物9RV的DNA序列。
如果在實施例中沒有其它的說明,所有制備和操作重組DNA的方法都按照在Sambrook等,分子克隆-實驗室手冊,第二版(Molecular Cloning-A Laboratory Manual,Second Edition),冷泉港實驗室出版社,紐約(1989)一書和在Ausubel等(1994)現(xiàn)代分子生物學技術(shù),現(xiàn)代技術(shù)(Current Protocols in Molecular Biology,Current Protoools),美國的第一卷和第二卷中所述的標準方法進行。植物分子生物學工作的標準材料和方法在由R.R.D.Croy所著的植物分子生物學Labfax(PlantMolecular Biology Labfax)(1993)(由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK))一書中有述。PCR技術(shù)方法可在M.A.Innis、D.H.Gelfand、J.J.Sninsky和T.J.White編輯的“PCR技術(shù)方法與應(yīng)用指南”(“PCR protocolsa guide to methodsand applications”)(Academic Press,Inc.,1990)一書中找到。
每個菌株均可在常規(guī)標準培養(yǎng)基上進行培養(yǎng),優(yōu)選T3培養(yǎng)基(胰蛋白胨3g/l、胰蛋白 2g/l、酵母抽提物1.5g/l、5mg MnCl2、0.05MNa2HPO4·2H2O、0.05M NaH2PO4·H2O,pH6.8及1.5%瓊脂),優(yōu)選在28℃進行培養(yǎng)。為長期保存,優(yōu)選將等體積的孢晶懸浮物與等體積的50%甘油混合并于-70℃保存或?qū)㈡呔腋∥飪龈伞槭规咦有纬?,?yōu)選在T3培養(yǎng)基上28℃生長72小時,然后于4℃保存。由菌株在成孢期間產(chǎn)生的晶體蛋白被包裹成晶體狀。
實施例2抗所選鱗翅類昆蟲種的BtS02072BG和BtS02739C菌株的殺蟲活性在人工喂養(yǎng)的美洲棉鈴蟲(Helicoverpa zea)、煙芽夜蛾(Heliothisvirescens)、玉米螟(Ostrinia nubilalis)、草地夜蛾(Spodopterafrugiperda)和Sesamia nonagrioides的初生幼蟲上用由BtS02072BG或BtS02739C得到的孢晶混合物(約109孢晶/ml)進行毒性分析。
于Costar 24孔板按孔分發(fā)人工飼料(Vanderzant,1962),以對美洲棉鈴蟲、煙芽夜蛾和玉米螟進行實驗。將50微升孢晶混合物施于飼料表面并在層化氣流中干燥。為對美洲棉鈴蟲、煙芽夜蛾進行實驗,在每個孔里放1條幼蟲,每個樣品用20條幼蟲。為對玉米螟進行實驗,在每個孔里放2條幼蟲,每個樣品用24條幼蟲。于Costar 48孔板按孔分發(fā)人工飼料,以對草地夜蛾進行實驗。將25微升孢晶混合物施于飼料表面并在層化氣流中干燥。在每個孔里放1條幼蟲,每個樣品用18條幼蟲。在第7天計算死亡幼蟲和活幼蟲。死亡幼蟲的百分比如表I所示。表I晶孢混合物施用于昆蟲后死亡幼蟲百分比
實施例3新cry基因的特性使用靶向已知的cry基因中保守區(qū)的簡并引物進行PCR以對BtS02739C基因進行檢測。用Wizard PCR preps(Promega)純化系統(tǒng)對所得的擴增產(chǎn)物進行純化并將其連入pGEM-T載體(Promega)。將連接混合物以電穿孔法轉(zhuǎn)入大腸桿菌JM 101。一次小規(guī)模制備物中至少由40個含有插入片段的轉(zhuǎn)化子組成,并用所選的限制酶進行消化。對所消化的小規(guī)模制備DNA進行電泳,然后可以觀察到不同的DNA片斷類型。對每種類型至少選擇一個菌落。制備適當?shù)腄NA制備物以對每個所選菌落中質(zhì)粒的插入片段序列進行測定。所測定的擴增產(chǎn)物序列與公開的cry序列的排列表明菌株BtS02739C含有一個新的cry1J-型基因和新的cry9-型基因。
BtS02072BG基因的檢測如下。首先,使用菌株BtS02419J的簡并晶體蛋白基因引物進行PCR。使用簡并晶體蛋白引物,以所得的擴增產(chǎn)物為模板進行二次PCR。
用Wizard PCR preps(Promega)純化系統(tǒng)對所得的擴增產(chǎn)物進行純化并將其連入pGEM-T載體(Promega)。將連接產(chǎn)物以電穿孔法轉(zhuǎn)入大腸桿菌XL1 Blue。一次小規(guī)模制備至少由40個含有插入片段的轉(zhuǎn)化子組成,并用所選的限制酶進行消化。對所消化的小規(guī)模制備DNA進行電泳,然后可以觀察到不同的DNA片斷類型。對每種類型至少選擇一個菌落。制備適當?shù)腄NA制備物以對每個所選菌落中質(zhì)粒插入片段的序列進行測定。
由菌株BtS02419J的克隆擴增產(chǎn)物中,我們發(fā)現(xiàn)了一段與cry1Be1相應(yīng)片斷一致的序列,二者只相差一個核苷酸。然后,選擇引物對大量Bt菌株(其中一個是BtS02072BG菌株)中是否存在與已測序的BtS02419J菌株的cry基因片斷相似的cry序列進行評測。這些引物序列如下(5′to3′)正向引物cry1B.fwCAG TCC AAA CGG GTA TAA AC反向引物B.RCTG CTT CGA AGG TTG CAG TA所測定的擴增產(chǎn)物的序列與公開的cry序列的排列表明菌株BtS02072BG含有一個新的cry1B-型基因。
實施例4cry基因的克隆與表達為了從菌株BtS02739C中分離出全長的cry1J-型和cry9-型基因,以及從菌株BtS02072BG中分離出cry1B-型基因,制備了這些菌株的總DNA,并以Sau3A進行部分消化。以蔗糖梯度對所消化的DNA依大小分開,并將5Kb到10Kb片斷連入以BamH1消化并以TsAP(溫敏堿性磷酸酶)處理過的克隆載體pUC19(Yannisch-Perron等,1985)中。將連接混合物以電穿孔法轉(zhuǎn)入大腸桿菌XL1-Blue或大腸桿菌JM109細胞。將轉(zhuǎn)化子鋪于含Xgal和IPTG的LB-triacillin平板上并挑取白色菌落進行濾膜雜交實驗。然后用合適的DIG標記探針篩選含載體的重組大腸桿菌克隆。這些探針按以下方法制得。首先,用來自重組大腸桿菌克隆作為模板細胞(其包含具有特定cry基因片斷的質(zhì)粒)進行PCR,預(yù)先使用表II所示的恰當引物進行擴增。表II用于分離新Bt DNA序列(Y=C或T,S=G或C)的引物
將所得的擴增產(chǎn)物進行凝膠純化,并以它為模板用DIG標記的dNTP進行二次PCR反應(yīng)。將適當量的該擴增產(chǎn)物用于雜交反應(yīng)。
用cry1J-型探針和cry9-型探針的混合物進行菌株BtS02739C的菌落雜交。然后將陽性克隆與每個探針分別雜交。菌株BtS02072BG的菌落雜交用cry1B-型探針進行。在鑒定出一個含全長cry基因質(zhì)粒的陽性克隆后,使用染料終止子標記法及Perkin Elmer ABI Prism-377DNA測序儀對該cry基因兩條鏈的序列進行測定。根據(jù)DNA測序的結(jié)果對這些基因命名如下BtS02739C的cry1J-型和cry9-型基因被分別命名為cry1Jd和cry9Fa,BtS02072BG的cry1B-型基因被命名為cry1Bf。
所分離的cry1Jd、cry9Fa和cry1Bf基因的基因組序列及其編碼的蛋白的序列也在本發(fā)明序列表中列出。這些序列與已知的Cry DNA或蛋白序列的比較表明,這些序列是新的并有相當多的核苷酸和氨基酸與已知的Bt基因及蛋白不同。使用10.0版的Wisconsin GCG軟件包(美國,威斯康星麥迪遜)的GAP程序確定最相似基因和蛋白編碼區(qū)(原毒素和毒素兩種形式)的序列同一性,表III-V為其概述。在GAP程序中使用GCG的默認值。對核苷酸序列比較而言,使用的是nwsgapdna計分模型,對氨基酸序列比較而言,使用blosum62計分模型。在表III-V中使用的毒素形式是指起始于Schnepf等(1998)等所定義的保守序列框5的第一個氨基酸并結(jié)束于最后一個氨基酸(通常為脯氨酸)后兩個氨基酸處的蛋白。原毒素形式是指Bt蛋白/基因的整個蛋白或其編碼區(qū)。表IIIcry1Bf/Cry1Bf的序列同一性
表IVcry9Fa/Cry9Fa的序列同一性
表Vcry1Jd/Cry1Jd的序列同一性
這些新分離基因的基因組克隆已保藏于BCCMTM-LMBP(BelgianCoordinated Collections of Microorganisms-Laboratorium voorMoleculaire Biologie-Plasmidencollectie,University of Gent,K.L.Ledeganckstraat 35,B-9000 Gent,比利時),保藏號為LMBP 3983-含pUC2739C/1Jd1質(zhì)粒(其中含有cry1Jd基因)的大腸桿菌JM109,1999年11月25日保藏(該基因可以通過用XhoI和SmaI消化該質(zhì)粒,分離得到約8.4kb的DNA片斷);LMBP 3984-含pUC2739C/9Fa1質(zhì)粒(其中含有cry9Fa基因)的大腸桿菌JM109,1999年11月25日保藏(該基因可以通過用SacI和PstI消化該質(zhì)粒,分離得到約8kb的DNA片斷);以及LMBP 3986-含pUC2072BG/1Bf1質(zhì)粒(其中含有cry1Bf基因)的大腸桿菌XL1Blue,1999年11月25日保藏(該基因可以通過用SacI和SalI消化該質(zhì)粒,分離得到約7kb的DNA片斷)。
實施例5cry基因的殺蟲活性將含cry9Fa基因的插入片段亞克隆于適當?shù)拇┧筝d體中并通過常規(guī)方法將所得的質(zhì)粒pSL2739C/9Fa1轉(zhuǎn)入晶體缺陷的Bt菌株中。將由該重組Bt菌株結(jié)孢培養(yǎng)物所產(chǎn)生的晶體蛋白在煙芽夜蛾和玉米螟的新生幼蟲上以約109滴度/ml的濃度進行檢測。對玉米螟幼蟲,觀察到100%死亡率,而對煙芽夜蛾幼蟲,死亡率為72%,而用晶體缺陷的對照菌株進行處理以后,幼蟲全都存活。
將含cry1Bf基因的插入片段亞克隆于適當?shù)拇┧筝d體中并通過常規(guī)方法將所得的質(zhì)粒pSL2072BG/1Bf轉(zhuǎn)入晶體缺陷的Bt菌株中。將由該重組Bt菌株結(jié)孢培養(yǎng)物所產(chǎn)生的晶體蛋白在Sesamia nonagrioides、煙芽夜蛾、美洲棉鈴蟲和玉米螟幼蟲上以不同濃度進行檢測。在煙芽夜蛾、玉米螟和Sesamia nonagrioides幼蟲上觀察到了Cry1Bf毒素有相當高的死亡率,而對美洲棉鈴蟲的毒性較低。用晶體缺陷的對照菌株進行處理以后,幼蟲全部存活。
將含cry1Jd基因的插入片段亞克隆于適當?shù)拇┧筝d體中并通過常規(guī)方法將所得的質(zhì)粒pGI2739C/1Jd轉(zhuǎn)入晶體缺陷的Bt菌株中。將由該重組Bt菌株結(jié)孢培養(yǎng)物所產(chǎn)生的晶體蛋白在煙芽夜蛾幼蟲上以不同濃度進行檢測,觀察到了Cry1Bf毒素明顯的致死性。用晶體缺陷的對照菌株進行處理以后,幼蟲全部存活。
實施例6在轉(zhuǎn)化植物中生產(chǎn)新的Cry蛋白。
使用CaMV 35S(Hull和Howell,1987)和遍在蛋白(Christensen等,1992)啟動子,按EP 0 193 259和公開的PCT專利申請WO 94/12264中所描述的方法制得編碼Cry1Bf、Cry1Jd和Cry9Fa蛋白截短形式的嵌合基因。如在公開的PCT專利申請WO 94/12264中所述,開放閱讀框架的密碼子使用與宿主植物的相適應(yīng)為優(yōu)選,以使表達效率最佳。
用所得的嵌合基因轉(zhuǎn)化水稻、棉花和玉米細胞。
如在WO 92/09696或美國專利5,641,664中所述(并入本文以作參考),使用愈傷的和酶降解的胚芽愈傷組織,通過土壤桿菌介導(dǎo)的轉(zhuǎn)化(Ishida等,1996,和美國專利5,591,616)或通過電穿孔法都可以對玉米細胞進行穩(wěn)定轉(zhuǎn)化。
通過土壤桿菌介導(dǎo)的轉(zhuǎn)化(Umbeck等,1987,生物/技術(shù)(Bio/Technology)5,263-266;美國專利;5,004,863,并入本文以作參考)可以對玉米細胞進行穩(wěn)定轉(zhuǎn)化。
用公開的PCT專利申請WO 92/09696中所描述的方法可對水稻細胞進行穩(wěn)定轉(zhuǎn)化。
通過ELISA、Northern和Southern印跡及殺蟲效果選擇再生的轉(zhuǎn)化玉米、棉花和水稻植株。與未轉(zhuǎn)化的對照植株相比,含嵌合基因的后代植株表現(xiàn)出增強的昆蟲抵抗力,其具有適當?shù)睦ハx抵抗力分離和轉(zhuǎn)化表型。蛋白與RNA測定表明增強的昆蟲抵抗力與新Cry蛋白在植株中的較高表達相關(guān)。
參考文獻Adang等(1985),基因(Gene)36,289。
Bennetzen & Hall,(1982),生物化學雜志(J.Biol.Chem.),257,3026-3031。
Berhard,K.和Utz,R.,在蘇云金芽孢桿菌,一種環(huán)境生物殺蟲劑理論與實踐(Bacillus thuringiensis,An Environmental BiopesticideTheory and Practice)一書中的“實驗和商業(yè)用途的蘇云金芽孢桿菌殺蟲劑的生產(chǎn)”(″Production of Bacillus thuringiensis insecticides forexperimental and commercial uses″),255-267頁,Entwistle,P.F.、Cory,J.S.、Bailey,M.J.和Higgs,S.主編,John Wiley和Sons,紐約(1993)。
Christensen等(1992)植物分子生物學(Plant mol.Biol.)18,675-689。
Cornejo等(1993)植物分子生物學23,567-581。
Crickmore等(1998)微生物分子生物學評論(Microbiol.Mol.BiolRev.)62(3),807-13。
Datta S.、Peterhans A.、Datta K.和Potrykus I.,生物/技術(shù)8,736-740(1990)。
Dulmage,H.T.,在作物生產(chǎn)中的生物學控制(Biological Control inCrop Production)一書中的“用于昆蟲的生物學控制的細菌生產(chǎn)”(″Production of Bacteria for Biological Control of Insects″),Paparizas,D.C.主編,Osmun Publishers,Totowa,N.J.,美國,129-141頁(1981)。
Finney,概率分析(Probit Analysis),第三版,劍橋大學出版社(1971)。
Franck,Guilley,Jonard,Richards和Hirth,細胞(Cell)21,285-294(1980)。
French,B.T.、Maul,H.N.和Maul,G.G.,生物化學年鑒紀事(Anal.Biochem.)156,417-423(1986)。
Fromm M.、Morrish F.、Armstrong C.、Williams R.、Thomas J.和Klein T.,生物/技術(shù)8,833-839(1990)。
Gardner、Howarth、Hahn、Brown-Luedi、Shepard和Messing,核酸研究(Nucleic Acids Research)9,2871-2887(1981)。
Ge A.、Rivers D.、Milne R.和Dean D.,生物化學雜志(J.Biol.Chem.)266,17954-17958(1991)。
Gielen,J.、De Beukeleer,M.、Seurinck,J.、Deboeck,F(xiàn).、De Greve,H.、Lemmers,M.、Van Montagu,M.和Schell,歐洲分子生物學雜志(EMBOJ)3,835-845(1984)。
Gordon-Kamm W.、Spencer M.、Mangano M.、Adams T.、Daines R.、Start W.、O′Brien J.、Chambers S.、Adams W.、Willets N.、Rice T.、Mackey C.、Krueger R.、Kausch A.和Lemaux P.,植物細胞(The PlantCell)2,603-618(1990)。
Gould,J.、Devey,M.,Hasegawa,O.、Ulian,E.C.、Peterson,G.和Smith,R.H.,植物生理學(Plant Physiol.)95,426-434(1991)。
Ho等(1989),基因77,51-59。
Hfte H.、Van Rie,J.、Jansens,S.、Van Houtven,A.、Verbruggen,H.和Vaeck,M.,應(yīng)用與環(huán)境微生物學(Applied and EnvironmentalMicrobiology)54,2010-2017 1988)。
Hfte H.和Whiteley H.R.,微生物學評論(Microbiological Review)53,242-255(1989)。
Hull和Howell,病毒學(Virology)86,482-493 1987)。
Ishida等,1996,自然生物技術(shù)(Nature Biotechnology)14,745-750。
Itakura等(1977),科學(Scienc)198,1056-1063。
Jansens等(1997)作物科學(Crop Science)37,1616-1624。
Last等(1990),應(yīng)用遺傳學原理(Theor.Appl.Genet.)81,581-588。
Lereclus,D.、Vallade,M.、Chaufaux,J.、Arantes,O.和Rambaud,S.,生物/技術(shù)10,418(1992)。
Mahillon等,歐洲微生物學會聯(lián)合會微生物學快報(FEMS Microbiol.Letters)60,205-210(1989)。
Maxam,A.M.和Gilbert,W.,酶學方法(Methods in Enzymol.),65,499-560(1980)。
McBride等,1995,生物/技術(shù)13,362。
Murray,E.、Lotzer,J.和Eberle,M.,核酸研究17(2),477-498(1989)。
Sanger等,美國國家科學院院報(Proc.Natl.Acad.Sci.USA.),74(12),5463-5467(1977)。
Schnepf等(1985),生物化學雜志(Journal of Biological Chemistry)260,6264。
Schnepf等(1998),微生物分子生物學評論(Microbiol.Mol.Biol.Rev.)62(3),775-806。
Shimamoto K.、Terada R.、Izawa T.和Fujimoto H.,自然(Nature)338,274-276(1989)。
Stanssens P.、Opsomer C.、McKeown Y.、Kramer W.、Zabeau M.和Fritz H.J.,核酸研究12,4441-4454(1989)。
Vaeck,M.、Reynaerts,A.、Hfte,H.、Jansens,S.、De Beuckeleer,M.、Dean,C.、Zabeau,M.、Vanderzant,經(jīng)濟昆蟲學雜志(J.Econ.Entomol.)55,140頁(1962)。
Van Montagu,M.和Leemans,J.,自然327,33-37(1987)。
Van Rie等,科學247,72(1990)。
Velten,J.、Velten,L.、Hain,R.和Schell,J.,歐洲分子生物學雜志(EMBO J)3,2723-2730(1984)。
Velten,J.和Schell,J.核酸研究13,6981-6998(1985)。
Visser,B.、Bosch,D.和Honée,G.,在蘇云金芽孢桿菌,一種環(huán)境生物殺蟲劑理論與實踐(Bacillus thuringiensis,An EnvironmentalBiopesticideTheory and Practice)一書中的“蘇云金芽孢桿菌晶體蛋白的結(jié)構(gòu)域結(jié)構(gòu)研究遺傳學方法”(″Domain-Structure Studies ofBacillus thuringiensis Crystal ProteinsA Genetic Approach″),,71-88頁,Entwistle,P.F.、Cory,J.S.、Bailey,M.J.和Higgs,S.主編、John Wiley和Sons,紐約(1993)。
Wada等(1990),核酸研究18,2367-1411。
White等(1989),遺傳學趨勢(Trends in Genet.)5,185-189。
Yannisch-Perron,C.、Vierra,J.和Messing,J.,基因33,103-119(1985)。
Zhang等(1991),植物細胞3,1155-1165。
序列表<110>阿溫提斯作物科學公司<120>蘇云金芽孢桿菌(BACILLUS THURINGIENSIS)的殺蟲蛋白。<130>NEWBTSWO<140><141><150>60/173387<151>1999-12-28<160>13<170>PatentIn Ver.2.0<210>1<211>3687<212>DNA<213>蘇云金芽孢桿菌<220><221>CDS<222>(1)..(3687)<400>1ttg act tca aat agg aaa aat gag aat gaa att ata aat gct tta tcg 48Leu Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser1 5 10 15att cca gct gta tcg aat cat tcc aca caa atg gat cta tca cca gat 96Ile Pro Ala Val Ser Asn His Ser Thr Gln Met Asp Leu Ser Pro Asp20 25 30gct cgt att gag gat tct ttg tgt ata gcc gag ggg aat aat atc aat 144Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asn35 40 45cca ctt gtt agc gca tca aca gtc caa acg ggt att aac ata gct ggt 192Pro Leu Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly50 55 60aga ata cta ggt gta tta ggc gta ccg ttt gct gga caa ata gct agt 240Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser65 70 75 80ttt tat agt ttt ctt gtt ggt gaa tta tgg ccc cgc ggc aga gat cag 288Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Gln85 90 95tgg gaa att ttc cta gaa cat gtc gaa caa ctt ata aat caa caa ata 336Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Asn Gln Gln Ile100 105 110aca gaa aat get agg aat acg gca ctt gct cga tta caa ggt tta gga 384Thr Glu Asn Ala Arg Asn Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly115 120 125gat tcc ttt aga gcc tat caa cag tca ctt gaa gat tgg eta gaa aac 432Asp Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn130 135 140cgt gat gat gca aga acg aga agt gtt ctt tat acc caa tat ata gcc 480Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala145 150 155 160tta gaa ctt gat ttt ctt aat gcg atg ccg ctt ttc gca att aga aac 528Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn165 170 175caa gaa gtt cca tta tta atg gta tat gct caa gct gca aat tta cac 576Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His180 185 190cta tta tta ttg aga gat gcc tct ctt ttt ggt agt gaa ttt ggg ctt 624Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu195 200 205aca tcg cag gaa att caa cgt tat tat gag cgc caa gtg gaa caa acg 672Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Gln Thr210 215 220aga gat tat tcc gac tat tgc gta gaa tgg tat aat aca ggt cta aat 720Arg Asp Tyr Ser Asp Tyr Cys Val Glu Trp Tyr Asn Thr Gly Leu Asn225 230 235 240agc ttg aga ggg aca aat gcc gca agt tgg gtg cgt tat aat caa ttc 768Ser Leu Arg Gly Thr Asn Ala Ala Ser Trp Val Arg Tyr Asn Gln Phe245 250 255cgt aga gat cta acg tta ggg gta tta gat cta gtg gca cta ttc cca 816Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro260 265 270agc tat gac act cgc act tat cca ata aat acg agt gct cag tta aca 864Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr275 280 285agg gaa gtt tat aca gac gca att gga gca aca ggg gta aat atg gca 912Arg Glu Val Tyr Thr Asp Ala Ile Gly Ala Thr Gly Val Asn Met Ala290 295 300agt atg aat tgg tat aat aat aat gca cct tcg ttt tcc gct ata gag 960Ser Met Asn Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu305 310 315 320act gcg gtt atc cga agc ccg cat cta ctt gat ttt cta gaa caa ctt 1008Thr Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Leu325 330 335aca att ttt agc act tca tca cga tgg agt gct act agg cat atg act 1056Thr Ile Phe Ser Thr Ser Ser Arg Trp Ser Ala Thr Arg His Met Thr340 345 350tac tgg cgg ggg cac aca att caa tct cgg cca ata gga ggc gga tta 1104Tyr Trp Arg Gly His Thr Ile Gln Ser Arg Pro Ile Gly Gly Gly Leu355 360 365aat acc tca acg cat ggg tct acc aat act tct att aat cct gta aga 1152Asn Thr Ser Thr His Gly Ser Thr Asn Thr Ser Ile Asn Pro Val Arg370 375 380tta tca ttc ttc tct cga gac gta tat tgg act gaa tca tat gca gga 1200Leu Ser Phe Phe Ser Arg Asp Val Tyr Trp Thr Glu Ser Tyr Ala Gly385 390 395 400gtg ctt cta tgg gga att tac ctt gaa cct att cat ggt gtc cct act 1248Val Leu Leu Trp Gly Ile Tyr Leu Glu Pro Ile His Gly Val Pro Thr405 410 415gtt aga ttt aat ttt agg aac cct cag aat act ttt gaa aga ggt act 1296Val Arg Phe Asn Phe Arg Asn Pro Gln Asn Thr Phe Glu Arg Gly Thr420 425 430gct aac tat agt caa ccc tat gag tca cct ggg ctt caa tta aaa gat 1344Ala Asn Tyr Ser Gln Pro Tyr Glu Ser Pro Gly Leu Gln Leu Lys Asp435 440 445tca gaa act gaa tta cca cca gaa aca aca gaa cga cca aat tat gaa 1392Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu450 455 460tca tat agt cat agg tta tct cac ata ggg ctc att tca caa tct agg 1440Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Gln Ser Arg465 470 475 480gtg cat gta cca gta tat tct tgg acg cac cgt agt gca gat cgt aca 1488Val His Val Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr485 490 495aat acc att agt tca gat agc ata aca caa ata cca ttg gta aaa tca 1536Asn Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ser500 505 510ttc aac ctt aat tca ggt acc tct gta gtc agt ggc cca gga ttt aca 1584Phe Asn Leu Asn Ser Gly Thr Ser Val Val Ser Gly Pro Gly Phe Thr515 520 525gga ggg gat ata atc cga act aac gtt aat ggt agt gta cta agt atg 1632Gly Gly Asp Ile Ile Arg Thr Asn Val Asn Gly Ser Val Leu Ser Met530 535 540ggt ctt aat ttt aat aat aca tca tta cag cgg tat cgc gtg aga gtt 1680Gly Leu Asn Phe Asn Asn Thr Ser Leu Gln Arg Tyr Arg Val Arg Val545 550 555 560cgt tat gct gct tct caa aca atg gtc ctg agg gta act gtc gga ggg 1728Arg Tyr Ala Ala Ser Gln Thr Met Val Leu Arg Val Thr Val Gly Gly565 570 575agt act act ttt gat caa gga ttc cct agt act atg agt gca aat gag 1776Ser Thr Thr Phe Asp Gln Gly Phe Pro Ser Thr Met Ser Ala Asn Glu580 585 590tct ttg aca tct caa tca ttt aga ttt gca gaa ttt cct gta ggt att 1824Ser Leu Thr Ser Gln Ser Phe Arg Phe Ala Glu Phe Pro Val Gly Ile595 600 605agt gca tct ggc agt caa act gct gga ata agt ata agt aat aat gca 1872Ser Ala Ser Gly Ser Gln Thr Ala Gly Ile Ser Ile Ser Asn Asn Ala610 615 620ggt aga caa acg ttt cac ttt gat aaa att gaa ttc att cca att act 1920Gly Arg Gln Thr Phe His Phe Asp Lys Ile Glu Phe Ile Pro Ile Thr625 630 635 640gca acc ttc gaa gca gaa tac gat tta gaa agg gcg caa gag gcg gtg 1968Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Glu Ala Val645 650 655aat gct ctg ttt act aat acg aat cca aga aga ttg aaa aca gat gtg 2016Asn Ala Leu Phe Thr Asn Thr Asn Pro Arg Arg Leu Lys Thr Asp Val660 665 670aca gat tat cat att gat caa gta tcc aat tta gtg gcg tgt tta tcg 2064Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser675 680 685gat gaa ttc tgc tta gat gaa aag aga gaa tta ctt gag aaa gtg aaa 2112Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Leu Glu Lys Val Lys690 695 700tat gcg aaa cga ctc agt gat gaa aga aac tta ctc caa gat cca aac 2160Tyr Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn705 710 715 720ttc aca tcc atc aat aag caa cca gac ttc ata tct act aat gag caa 2208Phe Thr Ser Ile Asn Lys Gln Pro Asp Phe Ile Ser Thr Asn Glu Gln725 730 735tcg aat ttc aca tct atc cat gaa caa tct gaa cat gga tgg tgg gga 2256Ser Asn Phe Thr Ser Ile His Glu Gln Ser Glu His Gly Trp Trp Gly740 745 750agt gag aac att aca atc cag gaa gga aat gac gta ttt aaa gag aat 2304Ser Glu Asn Ile Thr Ile Gln Glu Gly Asn Asp Val Phe Lys Glu Asn755 760 765tac gtc aca cta ccg ggg act ttt aat gag tgt tat ccg acg tat tta 2352Tyr Val Thr Leu Pro Gly Thr Phe Asn Glu Cys Tyr Pro Thr Tyr Leu770 775 780tat caa aaa ata gga gag tcg gaa tta aaa gct tat act cgc tac caa 2400Tyr Gln Lys Ile Gly Glu Ser Glu Leu Lys Ala Tyr Thr Arg Tyr Gln785 790 795 800tta aga ggg tat att gaa gat agt caa gat tta gag ata tat ttg att 2448Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile805 810 815cgt tat aat gcg aaa cat gaa aca ttg gat gtt cca ggt acc gag tcc 2496Arg Tyr Asn Ala Lys His Glu Thr Leu Asp Val Pro Gly Thr Glu Ser820 825 830gta tgg ccg ctt tca gtt gaa agc cca atc gga agg tgc gga gaa ccg 2544Val Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu Pro835 840 845aat cga tgc gca cca cat ttt gaa tgg aat cct gat cta gat tgt tcc 2592Asn Arg Cys Ala Pro His Phe Glu Trp Asn Pro Asp Leu Asp Cys Ser850 855 860tgc aga gat gga gaa aaa tgt gcg cat cat tcc cat cat ttc tct ttg 2640Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu865 870 875 880gat att gat att gga tgc aca gac ttg cat gag aat cta ggc gtg tgg 2688Asp Ile Asp Ile Gly Cys Thr Asp Leu His Glu Asn Leu Gly Val Trp885 890 895gtg gta ttc aag att aag acg cag gaa ggt cat gca aga cta ggg aat 2736Val Val Phe Lys Ile Lys Thr Gln Glu Gly His Ala Arg Leu Gly Asn900 905 910ctg gaa ttt att gaa gag aaa cca tta tta gga gaa gca ctg tct cgt 2784Leu Glu Phe Ile Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ser Arg915 920 925gtg aag aga gca gag aaa aaa tgg aga gac aaa cgt gaa aaa cta caa 2832Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln930 935 940ttg gaa aca aaa cga gta tat aca gag gca aaa gaa gct gtg gat gct 2880Leu Glu Thr Lys Arg Val Tyr Thr Glu Ala Lys Glu Ala Val Asp Ala945 950 955 960tta ttt gta gat tct caa tat aat aga tta caa gcg gat aca aac att 2928Leu Phe Val Asp Ser Gln Tyr Asn Arg Leu Gln Ala Asp Thr Asn Ile965 970 975ggc atg att cat gcg gca gat aaa ctt gtt cat cga att cga gag gct 2976Gly Met Ile His Ala Ala Asp Lys Leu Val His Arg Ile Arg Glu Ala980 985 990tat ctg tca gaa tta tct gtt atc ccg ggt gta aat gcg gaa att ttt 3024Tyr Leu Ser Glu Leu Ser Val Ile Pro Gly Val Asn Ala Glu Ile Phe99510001005gaa gaa tta gaa ggt cgc att atc act gca atc tcc cta tac gat gcg 3072Glu Glu Leu Glu Gly Arg Ile Ile Thr Ala Ile Ser Leu Tyr Asp Ala101010151020aga aat gtc gtt aaa aat ggt gat ttt aat aat gga tta gca tgc tgg 3120Arg Asn Val Val Lys Asn Gly Asp Phe Asn Asn Gly Leu Ala Cys Trp1025 103010351040aat gta aaa ggg cat gta gat gta caa cag agc cat cac cgt tct gtc 3168Asn Val Lys Gly His Val Asp Val Gln Gln Ser His His Arg Ser Val104510501055ctt gtt atc cca gaa tgg gaa gca gaa gtg tca caa gca gtt cgc gtc 3216Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser Gln Ala Val Arg Val106010651070tgt ccg ggg cgt ggc tat atc ctc cgt gtc aca gcg tac aaa gag gga 3264Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly107510801085tat gga gag ggt tgt gta acg atc cat gaa atc gag aac aat aca gac 3312Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp109010951100gaa cta aaa ttt aaa aac tgt gaa gaa gag gaa gtg tat cca acg gat 3360Glu Leu Lys Phe Lys Asn Cys Glu Glu Glu Glu Val Tyr Pro Thr Asp1105 111011151120aca gga acg tgt aat gat tat act gca cac caa ggt aca gca gta tgt 3408Thr Gly Thr Cys Asn Asp Tyr Thr Ala His Gln Gly Thr Ala Val Cys112511301135aat tcc cgt aat gct gga tat gag gat gca tat gaa gtt gat act aca 3456Asn Ser Arg Asn Ala Gly Tyr Glu Asp Ala Tyr Glu Val Asp Thr Thr114011451150gca tct gtt aat tac aaa ccg act tat gaa gaa gaa acg tat aca gat 3504Ala Ser Val Asn Tyr Lys Pro Thr Tyr Glu Glu Glu Thr Tyr Thr Asp115511601165gta cga aga gat aat cat tgt gaa tat gac aga ggg tat gtg aat tat 3552Val Arg Arg Asp Asn His Cys Glu Tyr Asp Arg Gly Tyr Val Asn Tyr117011751180cca cca cta cca gct ggt tat atg aca aaa gaa tta gaa tac ttc cca 3600Pro Pro Leu Pro Ala Gly Tyr Met Thr Lys Glu Leu Glu Tyr Phe Pro1185 119011951200gaa acc gat aag gta tgg att gag att gga gaa acg gaa ggg aag ttt 3648Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Lys Phe120512101215att gta gac agc gtg gaa tta ctc ctt atg gag gaa tag 3687Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu12201225<210>2<211>1228<212>PRT<213>蘇云金芽孢桿菌<400>2Leu Thr Ser Asn Arg Lys Asn Glu Asn Glu Ile Ile Asn Ala Leu Ser1 5 10 15Ile Pro Ala Val Ser Asn His Ser Thr Gln Met Asp Leu Ser Pro Asp20 25 30Ala Arg Ile Glu Asp Ser Leu Cys Ile Ala Glu Gly Asn Asn Ile Asn35 40 45Pro Leu Val Ser Ala Ser Thr Val Gln Thr Gly Ile Asn Ile Ala Gly50 55 60Arg Ile Leu Gly Val Leu Gly Val Pro Phe Ala Gly Gln Ile Ala Ser65 70 75 80Phe Tyr Ser Phe Leu Val Gly Glu Leu Trp Pro Arg Gly Arg Asp Gln85 90 95Trp Glu Ile Phe Leu Glu His Val Glu Gln Leu Ile Asn Gln Gln Ile100 105 110Thr Glu Asn Ala Arg Asn Thr Ala Leu Ala Arg Leu Gln Gly Leu Gly115 120 125Asp Ser Phe Arg Ala Tyr Gln Gln Ser Leu Glu Asp Trp Leu Glu Asn130 135 140Arg Asp Asp Ala Arg Thr Arg Ser Val Leu Tyr Thr Gln Tyr Ile Ala145 150 155 160Leu Glu Leu Asp Phe Leu Asn Ala Met Pro Leu Phe Ala Ile Arg Asn165 170 175Gln Glu Val Pro Leu Leu Met Val Tyr Ala Gln Ala Ala Asn Leu His
180 185 190Leu Leu Leu Leu Arg Asp Ala Ser Leu Phe Gly Ser Glu Phe Gly Leu195 200 205Thr Ser Gln Glu Ile Gln Arg Tyr Tyr Glu Arg Gln Val Glu Gln Thr210 215 220Arg Asp Tyr Ser Asp Tyr Cys Val Glu Trp Tyr Asn Thr Gly Leu Asn225 230 235 240Ser Leu Arg Gly Thr Asn Ala Ala Ser Trp Val Arg Tyr Asn Gln Phe245 250 255Arg Arg Asp Leu Thr Leu Gly Val Leu Asp Leu Val Ala Leu Phe Pro260 265 270Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asn Thr Ser Ala Gln Leu Thr275 280 285Arg Glu Val Tyr Thr Asp Ala Ile Gly Ala Thr Gly Val Asn Met Ala290 295 300Ser Met Asn Trp Tyr Asn Asn Asn Ala Pro Ser Phe Ser Ala Ile Glu305 310 315 320Thr Ala Val Ile Arg Ser Pro His Leu Leu Asp Phe Leu Glu Gln Leu325 330 335Thr Ile Phe Ser Thr Ser Ser Arg Trp Ser Ala Thr Arg His Met Thr340 345 350Tyr Trp Arg Gly His Thr Ile Gln Ser Arg Pro Ile Gly Gly Gly Leu355 360 365Asn Thr Ser Thr His Gly Ser Thr Asn Thr Ser Ile Asn Pro Val Arg370 375 380Leu Ser Phe Phe Ser Arg Asp Val Tyr Trp Thr Glu Ser Tyr Ala Gly385 390 395 400Val Leu Leu Trp Gly Ile Tyr Leu Glu Pro Ile His Gly Val Pro Thr405 410 415Val Arg Phe Asn Phe Arg Asn Pro Gln Asn Thr Phe Glu Arg Gly Thr420 425 430Ala Asn Tyr Ser Gln Pro Tyr Glu Ser Pro Gly Leu Gln Leu Lys Asp435 440 445Ser Glu Thr Glu Leu Pro Pro Glu Thr Thr Glu Arg Pro Asn Tyr Glu450 455 460Ser Tyr Ser His Arg Leu Ser His Ile Gly Leu Ile Ser Gln Ser Arg465 470 475 480Val His Val Pro Val Tyr Ser Trp Thr His Arg Ser Ala Asp Arg Thr485 490 495Asn Thr Ile Ser Ser Asp Ser Ile Thr Gln Ile Pro Leu Val Lys Ser500 505 510Phe Asn Leu Asn Ser Gly Thr Ser Val Val Ser Gly Pro Gly Phe Thr515 520 525Gly Gly Asp Ile Ile Arg Thr Asn Val Asn Gly Ser Val Leu Ser Met530 535 540Gly Leu Asn Phe Asn Asn Thr Ser Leu Gln Arg Tyr Arg Val Arg Val545 550 555 560Arg Tyr Ala Ala Ser Gln Thr Met Val Leu Arg Val Thr Val Gly Gly565 570 575Ser Thr Thr Phe Asp Gln Gly Phe Pro Ser Thr Met Ser Ala Asn Glu580 585 590Ser Leu Thr Ser Gln Ser Phe Arg Phe Ala Glu Phe Pro Val Gly Ile595 600 605Ser Ala Ser Gly Ser Gln Thr Ala Gly Ile Ser Ile Ser Asn Asn Ala610 615 620Gly Arg Gln Thr Phe His Phe Asp Lys Ile Glu Phe Ile Pro Ile Thr625 630 635 640Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Glu Ala Val645 650 655Asn Ala Leu Phe Thr Asn Thr Asn Pro Arg Arg Leu Lys Thr Asp Val660 665 670Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser675 680 685Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Leu Glu Lys Val Lys690 695 700Tyr Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn705 710 715 720Phe Thr Ser Ile Asn Lys Gln Pro Asp Phe Ile Ser Thr Asn Glu Gln725 730 735Ser Asn Phe Thr Ser Ile His Glu Gln Ser Glu His Gly Trp Trp Gly740 745 750Ser Glu Asn Ile Thr Ile Gln Glu Gly Asn Asp Val Phe Lys Glu Asn
755 760 765Tyr Val Thr Leu Pro Gly Thr Phe Asn Glu Cys Tyr Pro Thr Tyr Leu770 775 780Tyr Gln Lys Ile Gly Glu Ser Glu Leu Lys Ala Tyr Thr Arg Tyr Gln785 790 795 800Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile805 810 815Arg Tyr Asn Ala Lys His Glu Thr Leu Asp Val Pro Gly Thr Glu Ser820 825 830Val Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Arg Cys Gly Glu Pro835 840 845Asn Arg Cys Ala Pro His Phe Glu Trp Asn Pro Asp Leu Asp Cys Ser850 855 860Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe Ser Leu865 870 875 880Asp Ile Asp Ile Gly Cys Thr Asp Leu His Glu Asn Leu Gly Val Trp885 890 895Val Val Phe Lys Ile Lys Thr Gln Glu Gly His Ala Arg Leu Gly Asn900 905 910Leu Glu Phe Ile Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ser Arg915 920 925Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln930 935 940Leu Glu Thr Lys Arg Val Tyr Thr Glu Ala Lys Glu Ala Val Asp Ala945 950 955 960Leu Phe Val Asp Ser Gln Tyr Asn Arg Leu Gln Ala Asp Thr Asn Ile965 970 975Gly Met Ile His Ala Ala Asp Lys Leu Val His Arg Ile Arg Glu Ala980 985 990Tyr Leu Ser Glu Leu Ser Val Ile Pro Gly Val Asn Ala Glu Ile Phe99510001005Glu Glu Leu Glu Gly Arg Ile Ile Thr Ala Ile Ser Leu Tyr Asp Ala101010151020Arg Asn Val Val Lys Asn Gly Asp Phe Asn Asn Gly Leu Ala Cys Trp1025 103010351040Asn Val Lys Gly His Val Asp Val Gln Gln Ser His His Arg Ser Val
104510501055Leu Val Ile Pro Glu Trp Glu Ala Glu Val Ser Gln Ala Val Arg Val106010651070Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly107510801085Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp109010951100Glu Leu Lys Phe Lys Asn Cys Glu Glu Glu Glu Val Tyr Pro Thr Asp105111011151120Thr Gly Thr Cys Asn Asp Tyr Thr Ala His Gln Gly Thr Ala Val Cys112511301135Asn Ser Arg Asn Ala Gly Tyr Glu Asp Ala Tyr Glu Val Asp Thr Thr114011451150Ala Ser Val Asn Tyr Lys Pro Thr Tyr Glu Glu Glu Thr Tyr Thr Asp115511601165Val Arg Arg Asp Asn His Cys Glu Tyr Asp Arg Gly Tyr Val Asn Tyr117011751180Pro Pro Leu Pro Ala Gly Tyr Met Thr Lys Glu Leu Glu Tyr Phe Pro1185 119011951200Glu Thr Asp Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Lys Phe120512101215Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu12201225<210>3<211>3507<212>DNA<213>蘇云金芽孢桿菌<220><221>CDS<222>(1)..(3507)<400>3atg gag ata aat aat cag aac caa tgc ata cca tat aat tgc tta agt 48Met Glu Ile Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Serl 5 10 15aag cct gag gaa gta ttt ttg gat ggg gag agg ata tta cct gat atc 96Lys Pro Glu Glu Val Phe Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile20 25 30gat cca ctc gaa gtt tct ttg tcg ctt ttg caa ttt ctt ttg aat aac 144Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn35 40 45ttt gtt ccg ggg ggg ggg ttt att tca gga tta att gac aaa ata tgg 192Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Ile Asp Lys Ile Trp50 55 60ggg gct ttg aga cca tct gaa tgg gaa tta ttt ctt gca cag att gaa 240Gly Ala Leu Arg Pro Ser Glu Trp Glu Leu Phe Leu Ala Gln Ile Glu65 70 75 80cag ttg att gat cga aga ata gaa gca aca gta aga gca aaa gca atc 288Gln Leu Ile Asp Arg Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile85 90 95gct gaa tta gaa ggt tta ggg aga agt tat caa cta tat gga gag gca 336Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala100 105 110ttt aaa gag tgg gaa aaa act cca gat aac aca gcg gct cgg tct aga 384Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg115 120 125gta act gag aga ttt cgt ata att gat gct caa att gaa gca aat atc 432Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile130 135 140cct tcg ttt cgg gtt tcc gga ttt gaa gtg cca ctt cta tcg gtt tat 480Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr145 150 155 160acc caa gca gct aat ttg cat ctc gct cta tta aga gat tct gtt att 528Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile165 170 175ttt gga gag aga tgg gga ttg tcg act aca aat gtc aat gat atc tat 576Phe Gly Glu Arg Trp Gly Leu Ser Thr Thr Asn Val Asn Asp Ile Tyr180 185 190aat aga caa gtt aag aga att cat gaa tat agc gat cat tgt gta gat 624Asn Arg Gln Val Lys Arg Ile His Glu Tyr Ser Asp His Cys Val Asp195 200 205acg tat aaa aca gaa tta gaa cgt cta gag ttt aga tct ata gcg caa 672Thr Tyr Lys Thr Glu Leu Glu Arg Leu Glu Phe Arg Ser Ile Ala Gln210 215 220tgg aga ata tat aat cag ttt aga agg gaa ttg aca cta acg gta tta 720Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu225 230 235 240gat att gtc gct ctt ttc ccg aac tat gat ggt aga ctg tat ccg att 768Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Gly Arg Leu Tyr Pro Ile
245 250 255cga aca att tct caa ttg aca aga gaa att tat aca tcc cca gta agc 816Arg Thr Ile Ser Gln Leu Thr Arg Glu Ile Tyr Thr Ser Pro Val Ser260 265 270gaa ttt tat tat ggt ccc att tat aat cat aat atg att ggt acc ttt 864Glu Phe Tyr Tyr Gly Pro Ile Tyr Asn His Asn Met Ile Gly Thr Phe275 280 285att gaa cgg cag cta agg cga cca cat ctt atg gac ttc ttt aac tcc 912Ile Glu Arg Gln Leu Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser290 295 300atg acc atg tat aca tca gat aat aga cgg gaa tat tat tgg tca gga 960Met Thr Met Tyr Thr Ser Asp Asn Arg Arg Glu Tyr Tyr Trp Ser Gly305 310 315 320ctt gaa atg acg gct act ctt act tca gga aat caa gtg tca ttc cct 1008Leu Glu Met Thr Ala Thr Leu Thr Ser Gly Asn Gln Val Ser Phe Pro325 330 335tta gcc ggg act aga ggg aat tca gct cca cca gta tct gtt aga aag 1056Leu Ala Gly Thr Arg Gly Asn Ser Ala Pro Pro Val Ser Val Arg Lys340 345 350act ggt gag gga att tat aga ata tta tcg gaa cca ttt tat tca gca 1104Thr Gly Glu Gly Ile Tyr Arg Ile Leu Ser Glu Pro Phe Tyr Ser Ala355 360 365cct ttt cta ggc acc agt gtg cta gga agt cgc ggg gaa gaa ttt gct 1152Pro Phe Leu Gly Thr Ser Val Leu Gly Ser Arg Gly Glu Glu Phe Ala370 375 380ttt gca tct aat act act aca agt ctg cca tct aca ata tat aga aat 1200Phe Ala Ser Asn Thr Thr Thr Ser Leu Pro Ser Thr Ile Tyr Arg Asn385 390 395 400cgt gga aca gta gat tca tta gtc agc ata ccg cca caa gat tat agc 1248Arg Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp Tyr Ser405 410 415gta cca ccg cac agg ggg tat agt cat tta tta agt cac gtt acg atg 1296Val Pro Pro His Arg Gly Tyr Ser His Leu Leu Ser His Val Thr Met420 425 430cac aat agt tct cct ata ttc cac tgg acg cat cgt agt gcg aca cct 1344His Asn Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala Thr Pro435 440 445aga aat ata att tat cca gat agt atc act caa atc cca gta gtt aag 1392Arg Asn Ile Ile Tyr Pro Asp Ser Ile Thr Gln Ile Pro Val Val Lys450 455 460gct tcg cac ctc tct ggt ggt tca gtt ata aaa gga cct gga cat aca 1440Ala Ser His Leu Ser Gly Gly Ser Val Ile Lys Gly Pro Gly His Thr465 470 475 480ggt gga gat tta ata agc cta cct gta aat aac ttt act cat ttc cga 1488Gly Gly Asp Leu Ile Ser Leu Pro Val Asn Asn Phe Thr His Phe Arg485 490 495atc cca ttt cag gca aac act cca caa agg tat cgt att aga att tgt 1536Ile Pro Phe Gln Ala Asn Thr Pro Gln Arg Tyr Arg Ile Arg Ile Cys500 505 510tat gcg gca gac tca gat ggg act ttg gat agt gga gtt ttc tta agt 1584Tyr Ala Ala Asp Ser Asp Gly Thr Leu Asp Ser Gly Val Phe Leu Ser515 520 525gca gca gca ggg gat ggt ttt aat aca act tct tat agg gcc aca atg 1632Ala Ala Ala Gly Asp Gly Phe Asn Thr Thr Ser Tyr Arg Ala Thr Met530 535 540agc cct gaa ggt tcc tta aca tct cgt gat ttt caa ttt tta gat tta 1680Ser Pro Glu Gly Ser Leu Thr Ser Arg Asp Phe Gln Phe Leu Asp Leu545 550 555 560aac aca tcg ttt acc tcc gat gta gca tct aac tta tgg tta cat ttt 1728Asn Thr Ser Phe Thr Ser Asp Val Ala Ser Asn Leu Trp Leu His Phe565 570 575ata cgt tat ata cga cca ggg aat ttg tat ata gat aga gcg gaa ttt 1776Ile Arg Tyr Ile Arg Pro Gly Asn Leu Tyr Ile Asp Arg Ala Glu Phe580 585 590atc cca gtg gat gca acc ttc gag gca ggt tat aat tta gaa agg gcg 1824Ile Pro Val Asp Ala Thr Phe Glu Ala Gly Tyr Asn Leu Glu Arg Ala595 600 605caa aag gcg gtg aat gcc ctg ttt act tct aca aac caa aaa gga tta 1872Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Lys Gly Leu610 615 620caa aca gat gtg acg gat tat cat att gat caa gta tcc aat cta gtt 1920Gln Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val625 630 635 640gat tgt tta tct gat gag ttt tgc tta gat gaa aag cga aaa ttg tcc 1968Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Lys Leu Ser645 650 655gag aaa gtc aaa cag gcg aag cga ctc agt gat gag cgg aat tta ctt 2016Glu Lys Val Lys Gln Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu660 665 670cag gat tca aat ttc aga ggc atc aat agg gaa caa gac cgt gga tgg 2064Gln Asp Ser Asn Phe Arg Gly Ile Asn Arg Glu Gln Asp Arg Gly Trp
675 680 685aga gga agt acg gat att act atc caa gga gga aac gat gtt ttc aaa 2112Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys690 695 700gag aat tac gtt aca cta cca ggt acc ttt gat gcg tgt tat cca aca 2160Glu Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Ala Cys Tyr Pro Thr705 710 715 720tat ttg tat caa aaa gtc gat gaa tca aaa tta aaa gcc tat acc cgt 2208Tyr Leu Tyr Gln Lys Val Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg725 730 735tat caa tta aga ggc tat atc gaa gat agt caa gat tta gaa gtc tat 2256Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr740 745 750ttg atc cgt tat aat gca aaa tat gaa acg tta aat gtg cca ggt atg 2304Leu Ile Arg Tyr Asn Ala Lys Tyr Glu Thr Leu Asn Val Pro Gly Met755 760 765ggt tct tta tgg cca ctt tca gtc gaa agt cca att gga aag tgt gga 2352Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Lys Cys Gly770 775 780gaa ccg aat cga tgt gtg cca caa ctt gaa tgg aat ccc gat ttc gat 2400Glu Pro Asn Arg Cys Val Pro Gln Leu Glu Trp Asn Pro Asp Phe Asp785 790 795 800tgt tcc tgc aga gac gga gaa aaa tgt gcg cat cat tcg cat cat ttc 2448Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe805 810 815tcc ttg gac att gat gtt gga tgt aca gac ttg aat gag aac cta ggt 2496Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asn Leu Gly820 825 830ata tgg gtg ata ttc aag att aag aca cag gat ggt cat gca aga cta 2544Ile Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu835 840 845gga aat cta gaa ttt ctc gaa gag aaa ccg tta tta gga gaa gcg tta 2592Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu850 855 860gcc cgt gtg aag aga gcg gag aaa aaa tgg aga gac aaa cgt gaa ata 2640Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Ile865 870 875 880ttg caa tca gaa act aat att gtt tat aaa gaa gca aaa gaa gct gta 2688Leu Gln Ser Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ala Val885 890 895gat ggt tta ttc gta gat tcc caa tat gag aga tta caa tct gat acg 2736Asp Gly Leu Phe Val Asp Ser Gln Tyr Glu Arg Leu Gln Ser Asp Thr900 905 910aat atc gcc atg att cat gcg gca gat aaa cgc gtt cac cga atc cga 2784Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg915 920 925gag gct tat ctg cca gag ctc tcc gtg att cca ggt gtc aat gca gcg 2832Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala930 935 940att ttc gaa gaa tta gaa gga cgt att ttc aca gcc tac tct cta tat 2880Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Tyr Ser Leu Tyr945 950 955 960gat gcg aga aat gtc att aaa aac ggt gat ttc aat aat ggc tta tca 2928Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser965 970 975tgc tgg aat gtg aaa ggg cat gta gat ata aaa cag aat ggt cat cgt 2976Cys Trp Asn Val Lys Gly His Val Asp Ile Lys Gln Asn Gly His Arg980 985 990tct gtt ctt gtt atc cca gaa tgg gaa gca caa gtt tca caa gaa gtt 3024Ser Val Leu Val Ile Pro Glu Trp Glu Ala Gln Val Ser Gln Glu Val99510001005cgt gta tgt cca ggt cgt ggc tac atc ctt cgt gtt aca gcg aac aaa 3072Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Asn Lys101010151020gaa gga tat gga gaa ggc tgc gta acg att cat gag att gag aat cat 3120Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn His1025 103010351040act gaa aaa ctg aag ttt aga aac tgc gaa gaa gag gaa gta tat cca 3168Thr Glu Lys Leu Lys Phe Arg Asn Cys Glu Glu Glu Glu Val Tyr Pro104510501055aac aat aca gga acg tgt aat gat tat act gca cac caa caa ggt aca 3216Asn Asn Thr Gly Thr Cys Asn Asp Tyr Thr Ala His Gln Gln Gly Thr106010651070gca gga tgc gca gat gca tgt aat acc cgt aat gtc gga tat gaa gat 3264Ala Gly Cys Ala Asp Ala Cys Asn Thr Arg Asn Val Gly Tyr Glu Asp107510801085gca tat gaa atg aat act aca aca tct gtt aat tac aaa ccg act tac 3312Ala Tyr Glu Met Asn Thr Thr Thr Ser Val Asn Tyr Lys Pro Thr Tyr109010951100gag gaa gaa gta tat aca gat gga cga aga gat aat cct tgt gaa atg 3360Glu Glu Glu Val Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Met1105 111011151120gaa aga ggt tac aca cca tta cca gtt ggt tat gta aca aaa gaa tta 3408Glu Arg Gly Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Glu Leu112511301135gaa tac ttc cct gaa aca aat aca gta tgg att gaa att gga gaa acg 3456Glu Tyr Phe Pro Glu Thr Asn Thr Val Trp Ile Glu Ile Gly Glu Thr114011451150gaa ggg aag ttt att gta gac agt gtc gaa tta ctc ctt atg gaa gaa 3504Glu Gly Lys Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu115511601165tag 3507<210>4<211>1168<212>PRT<213>蘇云金芽孢桿菌<400>4Met Glu Ile Asn Asn Gln Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser1 5 10 15Lys Pro Glu Glu Val Phe Leu Asp Gly Glu Arg Ile Leu Pro Asp Ile20 25 30Asp Pro Leu Glu Val Ser Leu Ser Leu Leu Gln Phe Leu Leu Asn Asn35 40 45Phe Val Pro Gly Gly Gly Phe Ile Ser Gly Leu Ile Asp Lys Ile Trp50 55 60Gly Ala Leu Arg Pro Ser Glu Trp Glu Leu Phe Leu Ala Gln Ile Glu65 70 75 80Gln Leu Ile Asp Arg Arg Ile Glu Ala Thr Val Arg Ala Lys Ala Ile85 90 95Ala Glu Leu Glu Gly Leu Gly Arg Ser Tyr Gln Leu Tyr Gly Glu Ala100 105 110Phe Lys Glu Trp Glu Lys Thr Pro Asp Asn Thr Ala Ala Arg Ser Arg115 120 125Val Thr Glu Arg Phe Arg Ile Ile Asp Ala Gln Ile Glu Ala Asn Ile130 135 140Pro Ser Phe Arg Val Ser Gly Phe Glu Val Pro Leu Leu Ser Val Tyr145 150 155 160Thr Gln Ala Ala Asn Leu His Leu Ala Leu Leu Arg Asp Ser Val Ile165 170 175Phe Gly Glu Arg Trp Gly Leu Ser Thr Thr Asn Val Asn Asp Ile Tyr180 185 190Asn Arg Gln Val Lys Arg Ile His Glu Tyr Ser Asp His Cys Val Asp195 200 205Thr Tyr Lys Thr Glu Leu Glu Arg Leu Glu Phe Arg Ser Ile Ala Gln210 215 220Trp Arg Ile Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val Leu225 230 235 240Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Gly Arg Leu Tyr Pro Ile245 250 255Arg Thr Ile Ser Gln Leu Thr Arg Glu Ile Tyr Thr Ser Pro Val Ser260 265 270Glu Phe Tyr Tyr Gly Pro Ile Tyr Asn His Asn Met Ile Gly Thr Phe275 280 285Ile Glu Arg Gln Leu Arg Arg Pro His Leu Met Asp Phe Phe Asn Ser290 295 300Met Thr Met Tyr Thr Ser Asp Asn Arg Arg Glu Tyr Tyr Trp Ser Gly305 310 315 320Leu Glu Met Thr Ala Thr Leu Thr Ser Gly Asn Gln Val Ser Phe Pro325 330 335Leu Ala Gly Thr Arg Gly Asn Ser Ala Pro Pro Val Ser Val Arg Lys340 345 350Thr Gly Glu Gly Ile Tyr Arg Ile Leu Ser Glu Pro Phe Tyr Ser Ala355 360 365Pro Phe Leu Gly Thr Ser Val Leu Gly Ser Arg Gly Glu Glu Phe Ala370 375 380Phe Ala Ser Asn Thr Thr Thr Ser Leu Pro Ser Thr Ile Tyr Arg Asn385 390 395 400Arg Gly Thr Val Asp Ser Leu Val Ser Ile Pro Pro Gln Asp Tyr Ser405 410 415Val Pro Pro His Arg Gly Tyr Ser His Leu Leu Ser His Val Thr Met420 425 430His Asn Ser Ser Pro Ile Phe His Trp Thr His Arg Ser Ala Thr Pro435 440 445Arg Asn Ile Ile Tyr Pro Asp Ser Ile Thr Gln Ile Pro Val Val Lys450 455 460Ala Ser His Leu Ser Gly Gly Ser Val Ile Lys Gly Pro Gly His Thr465 470 475 480Gly Gly Asp Leu Ile Ser Leu Pro Val Asn Asn Phe Thr His Phe Arg485 490 495Ile Pro Phe Gln Ala Asn Thr Pro Gln Arg Tyr Arg Ile Arg Ile Cys500 505 510Tyr Ala Ala Asp Ser Asp Gly Thr Leu Asp Ser Gly Val Phe Leu Ser515 520 525Ala Ala Ala Gly Asp Gly Phe Asn Thr Thr Ser Tyr Arg Ala Thr Met530 535 540Ser Pro Glu Gly Ser Leu Thr Ser Arg Asp Phe Gln Phe Leu Asp Leu545 550 555 560Asn Thr Ser Phe Thr Ser Asp Val Ala Ser Asn Leu Trp Leu His Phe565 570 575Ile Arg Tyr Ile Arg Pro Gly Asn Leu Tyr Ile Asp Arg Ala Glu Phe580 585 590Ile Pro Val Asp Ala Thr Phe Glu Ala Gly Tyr Asn Leu Glu Arg Ala595 600 605Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Thr Asn Gln Lys Gly Leu610 615 620Gln Thr Asp Val Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val625 630 635 640Asp Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys Arg Lys Leu Ser645 650 655Glu Lys Val Lys Gln Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu660 665 670Gln Asp Ser Asn Phe Arg Gly Ile Asn Arg Glu Gln Asp Arg Gly Trp675 680 685Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asn Asp Val Phe Lys690 695 700Glu Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Ala Cys Tyr Pro Thr705 710 715 720Tyr Leu Tyr Gln Lys Val Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg725 730 735Tyr Gln Leu Arg Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Val Tyr740 745 750Leu Ile Arg Tyr Asn Ala Lys Tyr Glu Thr Leu Asn Val Pro Gly Met755 760 765Gly Ser Leu Trp Pro Leu Ser Val Glu Ser Pro Ile Gly Lys Cys Gly770 775 780Glu Pro Asn Arg Cys Val ProGln Leu Glu Trp Asn Pro Asp Phe Asp785 790795 800Cys Ser Cys Arg Asp Gly Glu Lys Cys Ala His His Ser His His Phe805 810 815Ser Leu Asp Ile Asp Val Gly Cys Thr Asp Leu Asn Glu Asn Leu Gly820 825 830Ile Trp Val Ile Phe Lys Ile Lys Thr Gln Asp Gly His Ala Arg Leu835 840 845Gly Asn Leu Glu Phe Leu Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu850 855 860Ala Arg Val Lys Arg Ala Glu Lys Lys Trp Arg Asp Lys Arg Glu Ile865 870 875 880Leu Gln Ser Glu Thr Asn Ile Val Tyr Lys Glu Ala Lys Glu Ala Val885 890 895Asp Gly Leu Phe Val Asp Ser Gln Tyr Glu Arg Leu Gln Ser Asp Thr900 905 910Asn Ile Ala Met Ile His Ala Ala Asp Lys Arg Val His Arg Ile Arg915 920 925Glu Ala Tyr Leu Pro Glu Leu Ser Val Ile Pro Gly Val Asn Ala Ala930 935 940Ile Phe Glu Glu Leu Glu Gly Arg Ile Phe Thr Ala Tyr Ser Leu Tyr945 950 955 960Asp Ala Arg Asn Val Ile Lys Asn Gly Asp Phe Asn Asn Gly Leu Ser965 970 975Cys Trp Asn Val Lys Gly His Val Asp Ile Lys Gln Asn Gly His Arg980 985 990Ser Val Leu Val Ile Pro Glu Trp Glu Ala Gln Val Ser Gln Glu Val99510001005Arg Val Cys Pro Gly Arg Gly Tyr Ile Leu Arg Val Thr Ala Asn Lys101010151020Glu Gly Tyr Gly Glu Gly Cys Val Thr Ile His Glu Ile Glu Asn His1025 103010351040Thr Glu Lys Leu Lys Phe Arg Asn Cys Glu Glu Glu Glu Val Tyr Pro104510501055Asn Asn Thr Gly Thr Cys Asn Asp Tyr Thr Ala His Gln Gln Gly Thr106010651070Ala Gly Cys Ala Asp Ala Cys Asn Thr Arg Asn Val Gly Tyr Glu Asp107510801085Ala Tyr Glu Met Asn Thr Thr Thr Ser Val Asn Tyr Lys Pro Thr Tyr109010951100Glu Glu Glu Val Tyr Thr Asp Gly Arg Arg Asp Asn Pro Cys Glu Met1105 111011151120Glu Arg Gly Tyr Thr Pro Leu Pro Val Gly Tyr Val Thr Lys Glu Leu112511301135Glu Tyr Phe Pro Glu Thr Asn Thr Val Trp Ile Glu Ile Gly Glu Thr114011451150Glu Gly Lys Phe Ile Val Asp Ser Val Glu Leu Leu Leu Met Glu Glu115511601165<210>5<211>3459<212>DNA<213>蘇云金芽孢桿菌<220><221>CDS<222>(1)..(3459)<400>5atg aac cga aat aat caa aat gat tat gaa gtt att gac gct tcc aat 48Met Asn Arg Asn Asn Gln Asn Asp Tyr Glu Val Ile Asp Ala Ser Asn1 5 10 15tgt ggt tgt gcg tca gat gat gtt gtt caa tac cct ttg gca aga gat 96Cys Gly Cys Ala Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp20 25 30ccg aat gct gta ttc caa aat atg cat tat aaa gat tat ttg caa acg 144Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr35 40 45tat gat gga gac tat aca ggt tct ttt ata aat cct aac tta tct att 192Tyr Asp Gly Asp Tyr Thr Gly Ser Phe Ile Asn Pro Asn Leu Ser Ile50 55 60aat cct aga gat gta ctg caa act gga att aat att gtg gga aga tta 240Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu65 70 75 80cta gga ttt cta ggt gtt cca ttt gct ggt cag tta gtt act ttc tat 288Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr85 90 95act ttt ctt tta aat caa cta tgg cca aca aat gat aat gca gta tgg 336Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp100 105 110gaa gct ttt atg gca caa ata gaa gag ctt att aat caa aga ata tcc 384Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser115 120 125gaa gca gta gta ggg aca gca gcg gat cat tta acg gga tta cac gat 432Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp130 135 140aat tat gag tta tat gta gag gca ttg gaa gaa tgg ctg gaa aga ccg 480Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro145 150 155 160aat gct gct aga act aat cta ctt ttt aat aga ttt acc acc cta gat 528Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp165 170 175agt ctt ttt aca caa ttt atg cca agc ttt ggt act gga cct gga agt 576Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser180 185 190caa aac tac gca gtt cca tta ctt aca gta tac gca caa gca gcg aac 624Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn195 200 205ctt cat ttg tta tta tta aag gat gct gaa ata tat gga gca aga tgg 672Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp210 215 220gga ctg aac caa aat cag att aac tca ttc cat acg cgc caa caa gag 720Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu225 230 235 240cgt act caa tat tat aca aat cat tgc gta acg acg tat aat acc ggt 768Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly245 250 255tta gat aga tta aga ggc aca aat act gaa agt tgg tta aat tat cat 816Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His260 265 270cga ttc cgt aga gag atg aca tta atg gca atg gat tta gtg gcc tta 864Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu
275 280 285ttc cca tac tat aat gtg cga caa tat cca aat ggg gca aat cca cag 912Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln290 295 300ctt aca cgt gaa ata tat acg gat cca atc gta tat aat cca cca gct 960Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala305 310 315 320aat cag gga atc tgc cga cgt tgg ggg aat aat cct tat aat aca ttt 1008Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe325 330 335tct gaa ctt gaa aat gct ttt att cgc ccg cca cat ctt ttt gat agg 1056Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg340 345 350ttg aat aga tta act att tct aga aac cga tat aca gct cca aca act 1104Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr355 360 365aat agc tac cta gac tat tgg tca ggt cat act tta caa agc cag tat 1152Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr370 375 380gca aat aac ccg acg aca tat gaa act agt tac ggt cag att acc tct 1200Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser385 390 395 400aac aca cgt tta ttc aat acg act aat gga gcc aat gca ata gat tca 1248Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser405 410 415agg gca aga aat ttt ggt aac tta tac gct aat ttg tat ggt gtt agc 1296Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser420 425 430tat ttg aat att ttc cca aca ggt gtg atg agt gaa atc acc tca gcc 1344Tyr Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala435 440 445cct aat acg tgt tgg caa gac ctt act aca act gag gaa cta cca cta 1392Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu450 455 460gtg aat aat aat ttt aat ctt tta tct cat gtt act ttc tta cgc ttc 1440Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe465 470 475 480aat act act cag ggt ggc ccc ctt gca act gta ggg ttt gta ccc aca 1488Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr485 490 495tat gtg tgg aca cgt caa gat gta gat ttt aat aat ata att act ccc 1536Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro500 505 510aat aga att act caa ata cca gtg gta aag gca tat gag cta agt agt 1584Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser515 520 525ggt gct act gtc gtg aaa ggt cca gga ttc aca gga gga gat gta atc 1632Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile530 535 540cga aga aca aat act ggt gga ttc gga gca ata agg gtg tcg gtc act 1680Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr545 550 555 560gga ccg cta aca caa cga tat cgc ata agg ttc cgt tat gct tcg aca 1728Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr565 570 575ata gat ttt gat ttc ttt gta aca cgt gga gga act act ata aat aat 1776Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn580 585 590ttt aga ttt aca cgt aca atg aac agg gga cag gaa tca aga tat gaa 1824Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu595 600 605tcc tat cgt act gta gag ttt aca act cct ttt aac ttt aca caa agt 1872Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser610 615 620caa gat ata att cga aca tct atc cag gga ctt agt gga aat ggg gaa 1920Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu625 630 635 640gta tac ctt gat aga att gaa atc atc cct gta aat cca aca cga gaa 1968Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu645 650 655gcg gaa gag gat tta gaa gcg gcg aag aaa gcg gtg gcg agc ttg ttt 2016Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe660 665 670aca cgc aca agg gac gga tta caa gta aat gtg aca gat tat caa gtc 2064Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val675 680 685gat caa gcg gca aat tta gtg tca tgc tta tca gat gaa caa tat gcg 2112Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala690 695 700cat gat aaa aag atg tta ttg gaa gcg gta cgc gcg gca aaa cgc ctc 2160His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu705 710 715 720agc cga gaa cgt aac tta ctt cag gat cca gat ttt aat aca atc aat 2208Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn725 730 735agt aca gaa gaa aat gga tgg aaa gca agt aac ggc gtt act att agt 2256Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser740 745 750gag ggc ggt cca ttc tat aaa ggc cgt gca ctt cag cta gca agt gca 2304Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala755 760 765cga gaa aat tac cca aca tac atc tat caa aaa gta gat gca tcg gag 2352Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu770 775 780tta aaa cct tat aca cga tat aga ctg gat ggg ttc gtg aag agt agt 2400Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser785 790 795 800caa gat tta gaa att gat ctc att cac cat cat aaa gtc cat ctt gtg 2448Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val805 810 815aaa aat gta cta gat aat tta gta tct gat act tac cca gat gat tct 2496Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser820 825 830tgt agt gga atc aat cga tgt gag gaa caa cag atg gta aat gcg caa 2544Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln835 840 845ctg gaa aca gaa cat cat cat ccg atg gat tgc tgt gaa gca gct caa 2592Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln850 855 860aca cat gag ttt tct tcc tat att gat aca ggg gat tta aat tcg act 2640Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr865 870 875 880gta gac cag gga atc tgg gtg atc ttt aaa gtt cga aca aca gat ggt 2688Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly885 890 895tat gcg acg cta gga aat ctt gaa ttg gta gag gtc gga ccg tta ttg 2736Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu900 905 910ggt gaa cct cta gaa cgt gaa caa aga gaa aat gcg aaa tgg aat gca 2784Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala915 920 925gag tta gga aga aaa cgt gca gaa aca gat cgc gtg tat caa gat gcc 2832Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala930 935 940aaa caa tcc atc aat cat tta ttt gtg gat tat caa gat caa caa tta 2880Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu945 950 955 960aat cca caa ata ggg atg gca gat att atg gac gct caa aat ctt gtc 2928Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val965 970 975gca tca att tca gat gta tat agc gat gca gta ctg caa atc cct gga 2976Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly980 985 990att aac tat gag att tac aca gag ctg tcc aat cgc tta caa caa gca 3024Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala99510001005tcg tat ctg tat acg tct cga aat gcg gtg caa aat ggg gac ttt aac 3072Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn101010151020aac ggg cta gat agc tgg aat gca aca gcg ggt gca tcg gta caa cag 3120Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln1025 103010351040gat ggc aat acg cat ttc tta gtt ctt tct cat tgg gat gca caa gtt 3168Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val104510501055tcc caa caa ttt aga gtg cag ccg aat tgt aaa tat gta tta cgt gta 3216Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg Val106010651070aca gca gag aaa gta ggc ggc gga gac gga tac gtg act atc cgg gat 3264Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp107510801085ggt gct cat cat aca gaa acg ctt aca ttt aat gca tgt gat tat gat 3312Gly Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp109010951100ata aat ggc acg tac gtg act gat aat acg tat cta aca aaa gaa gtg 3360Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val1105 111011151120ata ttc tat tca cat aca gaa cac atg tgg gta gag gta aat gaa aca 3408Ile Phe Tyr Ser His Thr Glu His Met Trp Val Glu Val Asn Glu Thr112511301135gaa ggt gca ttt cat ata gat agt att gaa ttc gtt gaa aca gaa aag 3456Glu Gly Ala Phe His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys
114011451150taa 3459<210>6<211>1152<212>PRT<213>蘇云金芽孢桿菌<400>6Met Asn Arg Asn Asn Gln Asn Asp Tyr Glu Val Ile Asp Ala Ser Asn1 5 10 15Cys Gly Cys Ala Ser Asp Asp Val Val Gln Tyr Pro Leu Ala Arg Asp20 25 30Pro Asn Ala Val Phe Gln Asn Met His Tyr Lys Asp Tyr Leu Gln Thr35 40 45Tyr Asp Gly Asp Tyr Thr Gly Ser Phe Ile Asn Pro Asn Leu Ser Ile50 55 60Asn Pro Arg Asp Val Leu Gln Thr Gly Ile Asn Ile Val Gly Arg Leu65 70 75 80Leu Gly Phe Leu Gly Val Pro Phe Ala Gly Gln Leu Val Thr Phe Tyr85 90 95Thr Phe Leu Leu Asn Gln Leu Trp Pro Thr Asn Asp Asn Ala Val Trp100 105 110Glu Ala Phe Met Ala Gln Ile Glu Glu Leu Ile Asn Gln Arg Ile Ser115 120 125Glu Ala Val Val Gly Thr Ala Ala Asp His Leu Thr Gly Leu His Asp130 135 140Asn Tyr Glu Leu Tyr Val Glu Ala Leu Glu Glu Trp Leu Glu Arg Pro145 150 155 160Asn Ala Ala Arg Thr Asn Leu Leu Phe Asn Arg Phe Thr Thr Leu Asp165 170 175Ser Leu Phe Thr Gln Phe Met Pro Ser Phe Gly Thr Gly Pro Gly Ser180 185 190Gln Asn Tyr Ala Val Pro Leu Leu Thr Val Tyr Ala Gln Ala Ala Asn195 200 205Leu His Leu Leu Leu Leu Lys Asp Ala Glu Ile Tyr Gly Ala Arg Trp210 215 220Gly Leu Asn Gln Asn Gln Ile Asn Ser Phe His Thr Arg Gln Gln Glu225 230 235 240Arg Thr Gln Tyr Tyr Thr Asn His Cys Val Thr Thr Tyr Asn Thr Gly245 250 255Leu Asp Arg Leu Arg Gly Thr Asn Thr Glu Ser Trp Leu Asn Tyr His260 265 270Arg Phe Arg Arg Glu Met Thr Leu Met Ala Met Asp Leu Val Ala Leu275 280 285Phe Pro Tyr Tyr Asn Val Arg Gln Tyr Pro Asn Gly Ala Asn Pro Gln290 295 300Leu Thr Arg Glu Ile Tyr Thr Asp Pro Ile Val Tyr Asn Pro Pro Ala305 310 315 320Asn Gln Gly Ile Cys Arg Arg Trp Gly Asn Asn Pro Tyr Asn Thr Phe325 330 335Ser Glu Leu Glu Asn Ala Phe Ile Arg Pro Pro His Leu Phe Asp Arg340 345 350Leu Asn Arg Leu Thr Ile Ser Arg Asn Arg Tyr Thr Ala Pro Thr Thr355 360 365Asn Ser Tyr Leu Asp Tyr Trp Ser Gly His Thr Leu Gln Ser Gln Tyr370 375 380Ala Asn Asn Pro Thr Thr Tyr Glu Thr Ser Tyr Gly Gln Ile Thr Ser385 390 395 400Asn Thr Arg Leu Phe Asn Thr Thr Asn Gly Ala Asn Ala Ile Asp Ser405 410 415Arg Ala Arg Asn Phe Gly Asn Leu Tyr Ala Asn Leu Tyr Gly Val Ser420 425 430Tyr Leu Asn Ile Phe Pro Thr Gly Val Met Ser Glu Ile Thr Ser Ala435 440 445Pro Asn Thr Cys Trp Gln Asp Leu Thr Thr Thr Glu Glu Leu Pro Leu450 455 460Val Asn Asn Asn Phe Asn Leu Leu Ser His Val Thr Phe Leu Arg Phe465 470 475 480Asn Thr Thr Gln Gly Gly Pro Leu Ala Thr Val Gly Phe Val Pro Thr485 490 495Tyr Val Trp Thr Arg Gln Asp Val Asp Phe Asn Asn Ile Ile Thr Pro500 505 510Asn Arg Ile Thr Gln Ile Pro Val Val Lys Ala Tyr Glu Leu Ser Ser515 520 525Gly Ala Thr Val Val Lys Gly Pro Gly Phe Thr Gly Gly Asp Val Ile530 535 540Arg Arg Thr Asn Thr Gly Gly Phe Gly Ala Ile Arg Val Ser Val Thr545 550 555 560Gly Pro Leu Thr Gln Arg Tyr Arg Ile Arg Phe Arg Tyr Ala Ser Thr565 570 575Ile Asp Phe Asp Phe Phe Val Thr Arg Gly Gly Thr Thr Ile Asn Asn580 585 590Phe Arg Phe Thr Arg Thr Met Asn Arg Gly Gln Glu Ser Arg Tyr Glu595 600 605Ser Tyr Arg Thr Val Glu Phe Thr Thr Pro Phe Asn Phe Thr Gln Ser610 615 620Gln Asp Ile Ile Arg Thr Ser Ile Gln Gly Leu Ser Gly Asn Gly Glu625 630 635 640Val Tyr Leu Asp Arg Ile Glu Ile Ile Pro Val Asn Pro Thr Arg Glu645 650 655Ala Glu Glu Asp Leu Glu Ala Ala Lys Lys Ala Val Ala Ser Leu Phe660 665 670Thr Arg Thr Arg Asp Gly Leu Gln Val Asn Val Thr Asp Tyr Gln Val675 680 685Asp Gln Ala Ala Asn Leu Val Ser Cys Leu Ser Asp Glu Gln Tyr Ala690 695 700His Asp Lys Lys Met Leu Leu Glu Ala Val Arg Ala Ala Lys Arg Leu705 710 715 720Ser Arg Glu Arg Asn Leu Leu Gln Asp Pro Asp Phe Asn Thr Ile Asn725 730 735Ser Thr Glu Glu Asn Gly Trp Lys Ala Ser Asn Gly Val Thr Ile Ser740 745 750Glu Gly Gly Pro Phe Tyr Lys Gly Arg Ala Leu Gln Leu Ala Ser Ala755 760 765Arg Glu Asn Tyr Pro Thr Tyr Ile Tyr Gln Lys Val Asp Ala Ser Glu770 775 780Leu Lys Pro Tyr Thr Arg Tyr Arg Leu Asp Gly Phe Val Lys Ser Ser785 790 795 800Gln Asp Leu Glu Ile Asp Leu Ile His His His Lys Val His Leu Val805 810 815Lys Asn Val Leu Asp Asn Leu Val Ser Asp Thr Tyr Pro Asp Asp Ser820 825 830Cys Ser Gly Ile Asn Arg Cys Glu Glu Gln Gln Met Val Asn Ala Gln835 840 845Leu Glu Thr Glu His His His Pro Met Asp Cys Cys Glu Ala Ala Gln850 855 860Thr His Glu Phe Ser Ser Tyr Ile Asp Thr Gly Asp Leu Asn Ser Thr865 870 875 880Val Asp Gln Gly Ile Trp Val Ile Phe Lys Val Arg Thr Thr Asp Gly885 890 895Tyr Ala Thr Leu Gly Asn Leu Glu Leu Val Glu Val Gly Pro Leu Leu900 905 910Gly Glu Pro Leu Glu Arg Glu Gln Arg Glu Asn Ala Lys Trp Asn Ala915 920 925Glu Leu Gly Arg Lys Arg Ala Glu Thr Asp Arg Val Tyr Gln Asp Ala930 935 940Lys Gln Ser Ile Asn His Leu Phe Val Asp Tyr Gln Asp Gln Gln Leu945 950 955 960Asn Pro Gln Ile Gly Met Ala Asp Ile Met Asp Ala Gln Asn Leu Val965 970 975Ala Ser Ile Ser Asp Val Tyr Ser Asp Ala Val Leu Gln Ile Pro Gly980 985 990Ile Asn Tyr Glu Ile Tyr Thr Glu Leu Ser Asn Arg Leu Gln Gln Ala99510001005Ser Tyr Leu Tyr Thr Ser Arg Asn Ala Val Gln Asn Gly Asp Phe Asn101010151020Asn Gly Leu Asp Ser Trp Asn Ala Thr Ala Gly Ala Ser Val Gln Gln1025 103010351040Asp Gly Asn Thr His Phe Leu Val Leu Ser His Trp Asp Ala Gln Val104510501055Ser Gln Gln Phe Arg Val Gln Pro Asn Cys Lys Tyr Val Leu Arg Val106010651070Thr Ala Glu Lys Val Gly Gly Gly Asp Gly Tyr Val Thr Ile Arg Asp107510801085Gly Ala His His Thr Glu Thr Leu Thr Phe Asn Ala Cys Asp Tyr Asp109010951100Ile Asn Gly Thr Tyr Val Thr Asp Asn Thr Tyr Leu Thr Lys Glu Val1105 111011151120Ile Phe Tyr Ser His Thr Glu His Met Trp Val Glu Val Asn Glu Thr112511301135Glu Gly Ala Phe His Ile Asp Ser Ile Glu Phe Val Glu Thr Glu Lys114011451150<210>7<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物cry1B.fw<400>7cagtccaaac gggtataaac 20<210>8<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物B.R<400>8ctgcttcgaa ggttgcagta 20<210>9<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物B.F<400>9cagcgtatta agtcgatgga 20<210>10<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物 JFW<400>10gcagctaatg ctaccacatc20<210>11<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物JRV<400>11gtggcggtat gctgactaat20<210>12<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物 9FW<400>12gyttttattc gcccgccaca20<210>13<211>20<212>DNA<213>人工序列<220><223>人工序列描述引物9RV<400>13cgacagtags acccactact 20
權(quán)利要求
1.編碼蛋白的DNA,其中蛋白含有下列氨基酸序列a)由保藏于BCCM-LMBP,保藏號為LMBP 3986的cry1Bf基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,b)由保藏于BCCM-LMBP,保藏號為LMBP 3983的cry1Jd基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,和c)由保藏于BCCM-LMBP,保藏號為LMBP 3984的cry9Fa基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列。
2.編碼一個蛋白的DNA,該蛋白含有下列氨基酸序列SEQ ID No.2蛋白殺蟲片斷的氨基酸序列,SEQ ID No.4蛋白殺蟲片斷的氨基酸序列,SEQ ID No.6蛋白殺蟲片斷的氨基酸序列。
3.權(quán)利要求2所述的編碼一個蛋白的DNA,該蛋白含有下列氨基酸序列SEQ ID No.2從第1位氨基酸到第640位氨基酸的氨基酸序列,SEQ IDNo.4從第1位氨基酸到第596位氨基酸的氨基酸序列,SEQ ID No.6從第1位氨基酸到第652位氨基酸的氨基酸序列。
4.權(quán)利要求3所述的編碼一個蛋白的DNA,該蛋白含有下列氨基酸序列SEQ ID No.2的氨基酸序列,SEQ ID No.4的氨基酸序列,SEQ ID No.6的氨基酸序列。
5.權(quán)利要求1到4中任何一項所述的DNA,其含有SEQ ID No.1、SEQ ID No.3或SEQ ID No.5的DNA序列。
6.權(quán)利要求5所述的DNA,其含有一段人工DNA序列,該人工DNA序列的密碼子使用與天然存在的DNA序列不同但編碼相同的蛋白或其殺蟲片斷。
7.權(quán)利要求1到4中任何一項所述的DNA,其含有一段人工DNA序列,該人工DNA序列的密碼子使用與天然存在的DNA序列不同但編碼相同的蛋白或其殺蟲片斷。
8.含有下列氨基酸序列的蛋白a)由保藏于BCCM-LMBP,保藏號為LMBP 3986的cry1Bf基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,b)由保藏于BCCM-LMBP,保藏號為LMBP 3983的cry1Jd基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列,和c)由保藏于BCCM-LMBP,保藏號為LMBP 3984的cry9Fa基因所編碼蛋白的殺蟲的胰蛋白酶消化片斷的氨基酸序列。
9.含有下列氨基酸序列的蛋白SEQ ID No.2蛋白殺蟲片斷的氨基酸序列,SEQ ID No.4蛋白殺蟲片斷的氨基酸序列,SEQ ID No.6蛋白殺蟲片斷的氨基酸序列。
10.權(quán)利要求9所述的蛋白,其含有下列氨基酸序列SEQ ID No.2從第1位氨基酸到第640位氨基酸的氨基酸序列,SEQ ID No.4從第1位氨基酸到第596位氨基酸的氨基酸序列,SEQ ID No.6從第1位氨基酸到第652位氨基酸的氨基酸序列。
11.權(quán)利要求8到10中任何一項所述的蛋白,其含SEQ ID No.2、SEQ ID No.4或SEQ ID No.6的氨基酸序列。
12.在植物表達啟動子控制之下的嵌合基因,其含有權(quán)利要求1到7中任何一項所述的DNA。
13.植物細胞,其被轉(zhuǎn)化從而含有權(quán)利要求12所述的嵌合基因。
14.植株或種子,其包含整合在其細胞中的權(quán)利要求12所述的嵌合基因。
15.植株或種子,其包含整合在其細胞的核DNA或葉綠體DNA的權(quán)利要求12所述的嵌合基因。
16.權(quán)利要求14所述的植株或種子,其選自玉米、棉花、水稻、油菜籽、蕓苔、茄子、大豆、土豆、向日葵、西紅柿、甘蔗、茶葉、豌豆、煙草、草莓、苜蓿、黃瓜、西瓜、胡椒、燕麥、大麥、小麥、天竺牡丹、劍蘭、菊花、甜菜、高粱、紫花苜蓿和花生。
17.微生物,其被轉(zhuǎn)化從而含有權(quán)利要求1到7中任何一項所述的DNA。
18.權(quán)利要求17所述的微生物,其選自土壤桿菌屬、埃希氏菌屬或芽孢桿菌屬。
19.控制昆蟲的方法,其包括在宿主細胞中表達權(quán)利要求1到7中任何一項所述的DNA,并將所說的宿主細胞與昆蟲相接觸。
20.獲得抗昆蟲植株的方法,其包括用權(quán)利要求1到7中任何一項所述的DNA或用權(quán)利要求12所述的嵌合基因轉(zhuǎn)化植物細胞,并從這些抗昆蟲的細胞中再生出轉(zhuǎn)化植株。
21.權(quán)利要求20所述的方法,其進一步包括由含所述DNA的所述植株獲得種子。
全文摘要
本發(fā)明涉及來自蘇云金芽孢桿菌菌株的新殺蟲化合物。本發(fā)明提供了被命名為CrylJd、Cry9Fa、和CrylBf的新蛋白及其殺蟲片斷,以及編碼這些蛋白或其殺蟲片斷的DNA序列。本發(fā)明進一步提供了表達這些蛋白的重組宿主,尤其是植物細胞和植株。
文檔編號C12N15/82GK1414973SQ00817997
公開日2003年4月30日 申請日期2000年12月19日 優(yōu)先權(quán)日1999年12月28日
發(fā)明者G·阿爾諾, A·伯特斯, N·達默, E·馬蒂厄, S·萬內(nèi)斯特, J·萬瑞 申請人:拜爾作物科學公司