專利名稱:新穎的脂肪酶及其用途的制作方法
技術領域:
本發(fā)明涉及新鑒定出來的多核苷酸序列,所述序列包含編碼來自Aspergillus niger的新穎的脂肪分解酶(lipolytic enzyme)的基因。本發(fā)明公開了所述新穎基因的全長核苷酸序列,包含所述的新穎的脂肪分解酶的全長編碼序列的cDNA序列以及所述的全長脂肪分解酶及其功能等同物的氨基酸序列。本發(fā)明還涉及在工業(yè)過程中使用上述酶的方法和診斷真菌感染的方法。本發(fā)明中還包括了用本發(fā)明的多核苷酸轉化過的細胞以及這樣的細胞其中,本發(fā)明的脂肪分解酶被遺傳修飾,以增加該酶的活性和/或表達水平。
背景技術:
烘焙產(chǎn)品例如面包是從面團來制備的,面團通常由基本材料制成(小麥)面粉、水以及可選地,鹽。其它添加成分取決于所烘焙的產(chǎn)品,其可以是糖、香料等等。對經(jīng)過發(fā)酵的產(chǎn)品而言,主要使用面包酵母,其次是使用化學發(fā)酵系統(tǒng),例如(產(chǎn))酸(化合物)和碳酸氫鹽的組合。
為改善所述面團的操作屬性和/或所述烘焙產(chǎn)品的最終屬性,人們持續(xù)努力以發(fā)展改善屬性的加工助劑。此處將加工助劑定義為改善所述面團的操作屬性和/或所述烘焙產(chǎn)品的最終屬性的化合物。可能被改善的面團屬性包含可加工性、氣體保持能力、降低的粘性、彈性、延展性、成型性等等??赡鼙桓纳频乃龊姹寒a(chǎn)品的屬性包含產(chǎn)品塊的體積、外殼松脆性、碎屑質地以及柔軟度、有關香味的腐敗和保存期限。改善面團和/或烘焙產(chǎn)品的加工助劑可以分為兩類化學添加劑和酶(也稱為烘焙用酶)。
酵母、酶和化學添加劑通常是分別加入到面團中的。酵母可以作為液體懸浮劑、以壓榨的形式、作為活性干酵母(active dry yeast,ADY)或速發(fā)干酵母(instant dry yeast,IDY)加入。上述酵母制劑的區(qū)別在于水和酵母干物質的含量。液體酵母具有的酵母干物質含量低于25%(w/v)。膏質酵母是液體酵母的特殊形式,其具有的干物質含量在17%和23%之間(w/v)。壓榨酵母具有的酵母干物質含量在25%-35%之間(w/v),干酵母制劑具有的酵母干物質的含量在92%-98%之間(w/v)。
酶可以以干燥的例如顆粒狀的形式或以液體形式被加入。大多數(shù)情況下,化學添加劑以粉末形式被加入。此外,適合于特殊烘焙應用的加工助劑組合物,可以由化學添加劑和酶的專門混合物來構成。
由上述材料和加工助劑來制備面團的方法在本領域是公知的,所述制備方法包括將所述材料和加工助劑混合,并包括一個或多個成型及發(fā)酵步驟。
用此類面團來制備烘焙產(chǎn)品的方法在本領域也是公知的,所述制備方法包括對面團進行成型、造型及進一步的發(fā)酵,以及隨后在需要的溫度和時間下進行烘焙。
改善屬性的化學添加劑包括氧化劑、還原劑、用作面團調整劑的乳化劑或用作碎屑軟化劑的乳化劑、脂肪類物質;所述氧化劑例如是抗壞血酸、溴酸鹽和偶氮碳酸氫鹽,所述還原劑例如是L-半胱氨酸和谷胱甘肽,所述用作面團調整劑的乳化劑例如是二乙酰酒石酸甘油單/二酯(diacetyltartatic esters of mono/diglycerides,DATEM)、硬脂酰乳酸鈉(sodiumstearoyl lactylate,SSL)、硬脂酰乳酸鈣(calcium stearoyl lactylate,CSL),所述用作碎屑軟化劑的乳化劑例如是單硬脂酸甘油酯(glycerolmonostearate,GMS),所述脂肪類物質例如是甘油三酯(脂)或卵磷脂等等。
用更多的天然產(chǎn)品來代替化學添加劑是消費者的需求,為此人們已經(jīng)發(fā)展出了多種能改善面團和/或烘焙產(chǎn)品屬性的烘焙用酶,可以用所有可能的組合形式來使用所述的酶,這取決于特定的烘焙應用的條件。合適的酶包括降解淀粉的酶,降解阿拉伯糖基木聚糖和其它半纖維素的酶,降解纖維素的酶,氧化酶,分解脂肪類物質的酶,降解、修飾或交聯(lián)蛋白質的酶。
降解淀粉的酶例如是內作用酶和外作用酶,所述內作用酶例如是alpha-淀粉酶、麥芽糖淀粉酶、支鏈淀粉酶或其它脫支酶,所述外作用酶用于去除葡萄糖(淀粉葡糖苷酶)、麥芽糖(beta-淀粉酶)、麥芽三糖、麥芽四糖和更高級的寡糖。
降解阿拉伯糖基木聚糖或其它半纖維素的酶例如是木聚糖酶、戊聚糖酶、半纖維素酶、阿拉伯呋喃糖苷酶、葡聚糖酶等等。
降解纖維素的酶例如是纖維素酶、纖維二糖水解酶和beta-葡糖苷酶。
氧化酶例如是葡糖氧化酶、己糖氧化酶、吡喃糖氧化酶、巰基氧化酶、脂肪氧化酶、漆酶、多酚氧化酶等等。
分解脂肪類物質的酶例如是脂肪分解酶,例如三酰甘油脂肪酶、磷脂酶(例如A1、A2、B、C和D)和半乳糖脂酶。
降解、修飾或交聯(lián)蛋白質的酶例如是內作用蛋白酶(絲氨酸蛋白酶、金屬蛋白酶、天冬氨酰蛋白酶、巰基蛋白酶)、從多肽鏈的N-末端(氨肽酶)或C-末端(羧肽酶)切掉一個氨基酸或二肽或三肽等的外作用蛋白酶、對天冬酰胺或谷氨酰胺脫酰胺的酶,例如脫酰胺酶和肽谷氨酰胺酶(peptidoglutaminase),或交聯(lián)酶,例如谷氨酰胺轉移酶。
烘焙用酶可以方便地從微生物中制得。微生物性的烘焙用酶可以從多種來源中獲得;桿菌菌種是細菌性的酶的通常來源,而真菌性的酶則通常產(chǎn)生自曲霉菌種。
烘焙用酶可以被用于多種形式的烘焙制品。術語“烘焙制品”在此被定義為包含面包產(chǎn)品、卷、蛋糕、餡餅、松餅、酵母發(fā)酵的蛋糕及炸圈餅等,所述面包產(chǎn)品例如是烤模面包(tin bread)、面包塊(loaves ofbread)、法式面包。
在上述過程中,使用通過重組DNA技術獲得的烘焙用酶是有好處的。此類重組的酶較之其相應的傳統(tǒng)純化所得到的酶具有很多優(yōu)點。重組酶生產(chǎn)起來成本低,產(chǎn)量高,其不含細菌或病毒等污染物,也不含細菌毒素,還不會對其它的酶活性產(chǎn)生負面影響。
發(fā)明內容
本發(fā)明的一個目的是提供新穎的多核苷酸,所述多核苷酸編碼具有經(jīng)過改善的屬性的新穎的脂肪分解酶。本發(fā)明的進一步的目的是提供天然及重組生產(chǎn)的脂肪分解酶以及制造所述的酶的重組菌株。融合蛋白也是本發(fā)明的一部分,制造和使用本發(fā)明的多核苷酸及多肽的方法也屬于本發(fā)明。
本發(fā)明還有一個目的是提供新穎的脂肪分解酶,所述的酶能解決上述問題中的至少一個,或者所述的酶具有廣泛的底物特異性,或所述的酶在被用于面團和/或烘焙產(chǎn)品時具有一種或多種改善的屬性,所述屬性選自由以下成員構成的組增加的面團強度、增加的面團彈性、增加的面團穩(wěn)定性、降低的面團粘性、經(jīng)過改善的面團延展性、經(jīng)過改善的面團可加工性、增加的烘焙產(chǎn)品體積、經(jīng)過改善的烘焙產(chǎn)品碎屑結構、經(jīng)過改善的烘焙產(chǎn)品柔軟度、經(jīng)過改善的烘焙產(chǎn)品香味、經(jīng)過改善的烘焙產(chǎn)品保鮮性、經(jīng)過改善的烘焙產(chǎn)品顏色、經(jīng)過改善的烘焙產(chǎn)品外殼。
本發(fā)明提供了編碼新穎的脂肪分解酶的新穎的多核苷酸。更具體地,本發(fā)明提供了具有核苷酸序列的多核苷酸,所述核苷酸序列優(yōu)選在高嚴謹條件下,與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的序列雜交。本發(fā)明相應地提供了與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的序列同源性高于40%,例如約60%,優(yōu)選65%,更優(yōu)選為70%,進一步優(yōu)選為75%、80%、85%、90%、95%、96%、97%、98%或99%的核酸。
在一種更優(yōu)選的實施方式中,本發(fā)明提供了可從絲狀真菌中獲得的此種經(jīng)過分離的多核苷酸,具體而言,Aspergillus niger是優(yōu)選的。
在一種實施方式中,本發(fā)明提供了一種經(jīng)過分離的多核苷酸,所述多核苷酸包含編碼一種多肽或其功能等同物的核酸序列,所述多肽的氨基酸序列選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。
在另外一種優(yōu)選的實施方式中,本發(fā)明提供了一種經(jīng)過分離的多核苷酸,所述多核苷酸編碼一種多肽及其功能等同物的至少一個功能結構域,所述多肽選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。
在一種優(yōu)選的實施方式中,本發(fā)明提供了一種脂肪分解酶基因,所述基因選自由SEQ ID NO1、4、7、10、13、16、19、22、25、28、31、34和37所構成的組。在另一個方面,本發(fā)明提供了一種多核苷酸,優(yōu)選是編碼Aspergillus niger的脂肪分解酶或其變異體或片段的cDNA,所述脂肪分解酶的氨基酸序列選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。在一種優(yōu)選的實施方式中,所述cDNA具有選自由SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35和38或其功能等同物所構成的組的序列。
在一種更進一步優(yōu)選的實施方式中,本發(fā)明提供了包含本發(fā)明多肽的編碼序列的多核苷酸,優(yōu)選的多核苷酸是選自SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35和38所構成的組的多核苷酸序列。
本發(fā)明還涉及包含本發(fā)明多核苷酸序列的載體,以及可被用于擴增或探測本發(fā)明的DNA的引物、探針和片段。
在進一步的優(yōu)選實施方式中,提供了一種載體,其中,本發(fā)明的多核苷酸序列與調控序列被功能性地連接起來,所述調控序列適于所述被編碼的氨基酸序列在合適的宿主細胞中表達,例如Aspergillus niger或Aspergillus oryzae。本發(fā)明還提供了用于制備本發(fā)明多核苷酸及載體的方法。
本發(fā)明還涉及重組產(chǎn)生的宿主細胞,所述細胞含有異源的或同源的本發(fā)明的多核苷酸。
在另一個實施方式中,本發(fā)明提供了重組宿主細胞,其中,本發(fā)明脂肪分解酶的表達顯著提高,或其中所述脂肪分解酶的活性增加。
在另一個實施方式中,本發(fā)明提供了重組產(chǎn)生的宿主細胞,所述細胞含有異源的或同源的本發(fā)明的多核苷酸,并且,其中,所述的細胞能產(chǎn)生本發(fā)明的功能性脂肪分解酶;優(yōu)選是能過量表達本發(fā)明的脂肪分解酶的細胞,例如包含拷貝數(shù)增加的本發(fā)明基因或cDNA的Aspergillus菌株。
在本發(fā)明的又一個方面,提供了一種經(jīng)過純化的多肽。本發(fā)明的該種多肽包括由本發(fā)明多核苷酸編碼的多肽。特別優(yōu)選的是選自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的多肽或其功能等同物。
因此,本發(fā)明在一個方面提供了一種脂肪分解酶的組合物,所述組合物含有作為活性成分的選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的酶或其功能等同物。
在另一個方面,本發(fā)明提供了制造烘焙制品的方法,其中,將一種或多種酶或其功能等同物加入到用于制造烘焙制品的面團中,所述的酶選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。
包含本發(fā)明多肽的融合蛋白也在本發(fā)明的范圍內。本發(fā)明還提供了制造本發(fā)明多肽的方法。
本發(fā)明還涉及本發(fā)明的脂肪分解酶在此文描述的任何工業(yè)過程中的應用。
具體實施例方式
脂肪分解酶在此被定義為展示了下述脂肪分解活性中的至少一種優(yōu)選為兩種或三種或四種或更多種活性的酶,所述活性為三酰甘油脂肪酶、磷脂酶A1、磷脂酶A2、磷脂酶B、磷脂酶C、磷脂酶D、溶血磷脂酶和半乳糖脂酶。
多核苷酸本發(fā)明提供了編碼脂肪分解酶的多核苷酸或其功能等同物,所述脂肪分解酶具有選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列。通過對從Aspergillus niger中獲得的基因組克隆進行測序,確定出了分別編碼脂肪分解酶NBE028、NBE029、NBE030、NBE031、NBE032、NBE033、NBE034、NBE036、NBE038、NBE039、NBE043、NBE045和NBE042的七個基因的序列。本發(fā)明提供了多核苷酸序列,所述序列包含編碼脂肪分解酶NBE028、NBE029、NBE030、NBE031、NBE032、NBE033、NBE034、NBE036、NBE038、NBE039、NBE043、NBE045和NBE042的基因,以及其cDNA全序列及編碼序列(表1)。因此,本發(fā)明涉及經(jīng)過分離的多核苷酸,所述多核苷酸包含選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列或其功能等同物。
表1
更具體地,本發(fā)明涉及一種經(jīng)過分離的多核苷酸,所述多核苷酸在嚴謹條件下,優(yōu)選在高度嚴謹條件下,能夠與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的多核苷酸雜交。有利地,此類多核苷酸可以從絲狀真菌中獲得,特別是從Aspergillus niger獲得。更明確地,本發(fā)明涉及一種經(jīng)過分離的多核苷酸,所述多核苷酸具有選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列。
本發(fā)明還涉及一種經(jīng)過分離的多核苷酸或其功能等同物,所述多核苷酸編碼一種多肽的至少一個功能結構域,所述多肽具有選自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列。
在本文中使用的術語“基因”和“重組基因”代指可以從染色體DNA中分離出來的核酸分子,所述核酸分子包括編碼蛋白質的開放閱讀框,所述蛋白質例如是Aspergillus niger的脂肪分解酶?;蚩梢园ň幋a序列、非編碼序列、內含子和調控序列。此外,基因指本文中所定義的經(jīng)過分離的核酸分子。
可以使用標準的分子生物學技術及本文中提供的序列信息,分離出本發(fā)明的核酸分子,例如具有選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列的核酸分子或其功能等同物。例如,用選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸分子的全部或部分作為探針,就可以使用標準的雜交和克隆技術(例如,描述于Sambrook,J.,F(xiàn)ritsh,E.F.,and Maniatis,T.MolecularCloningA Laboratory Manual.2nd,ed.,Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989中的)分離出本發(fā)明的核酸分子來。
此外,使用合成的寡核苷酸引物,通過聚合酶鏈式反應(PCR)可以分離出包含了選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸序列的全部或部分的核酸分子,所述引物是基于選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸序列中含有的序列信息來設計的。
可以用cDNA、mRNA或基因組DNA作為模板,用合適的寡核苷酸引物,根據(jù)標準的PCR擴增技術,來擴增出本發(fā)明的核酸。由此擴增出的核酸可以被克隆進合適的載體,并通過DNA序列分析來確認。
此外,與本發(fā)明的核苷酸序列相應的寡核苷酸或能與本發(fā)明的核苷酸序列雜交的寡核苷酸可以通過標準的合成技術來制備,例如,使用自動DNA合成儀。
在一種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO2中展示的核苷酸序列。SEQ ID NO2的序列相當于SEQ IDNO1中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO3中所示的Aspergillus niger的NBE028多肽的序列。
在第二種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO5中展示的核苷酸序列。SEQ ID NO5的序列相當于SEQ IDNO4中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO6中所示的Aspergillus niger的NBE029多肽的序列。
在第三種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO8中展示的核苷酸序列。SEQ ID NO8的序列相當于SEQ IDNO7中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO9中所示的Aspergillus niger的NBE030多肽的序列。
在第四種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO11中展示的核苷酸序列。SEQ ID NO11的序列相當于SEQ IDNO10中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO12中所示的Aspergillus niger的NBE031多肽的序列。
在第五種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO14中展示的核苷酸序列。SEQ ID NO14的序列相當于SEQ IDNO13中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO15中所示的Aspergillus niger的NBE032多肽的序列。
在第六種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO17中展示的核苷酸序列。SEQ ID NO17的序列相當于SEQ IDNO16中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO18中所示的Aspergillus niger的NBE033多肽的序列。
在第七種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO20中展示的核苷酸序列。SEQ ID NO20的序列相當于SEQ IDNO19中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO21中所示的Aspergillus niger的NBE034多肽的序列。
在第八種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO23中展示的核苷酸序列。SEQ ID NO23的序列相當于SEQ IDNO22中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO24中所示的Aspergillus niger的NBE036多肽的序列。
在第九種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO26中展示的核苷酸序列。SEQ ID NO26的序列相當于SEQ IDNO25中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO27中所示的Aspergillus niger的NBE038多肽的序列。
在第十種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQID NO29中展示的核苷酸序列。SEQ ID NO29的序列相當于SEQ IDNO28中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO30中所示的Aspergillus niger的NBE039多肽的序列。
在第十一種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQ ID NO32中展示的核苷酸序列。SEQ ID NO32的序列相當于SEQID NO31中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO33中所示的Aspergillus niger的NBE043多肽的序列。
在第十二種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQ ID NO35中展示的核苷酸序列。SEQ ID NO35的序列相當于SEQID NO34中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO36中所示的Aspergillus niger的NBE045多肽的序列。
在第十三種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含SEQ ID NO38中展示的核苷酸序列。SEQ ID NO38的序列相當于SEQID NO37中提供的Aspergillus niger的基因的編碼區(qū)域。該cDNA包含了編碼如SEQ ID NO39中所示的Aspergillus niger的NBE042多肽的序列。
在另一種優(yōu)選的實施方式中,經(jīng)過分離的本發(fā)明的核酸分子包含的核酸分子是選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列的互補序列,或上述核苷酸序列的功能等同物。與另一條核苷酸序列互補的核酸分子,與所述的另外的核苷酸序列充分互補,從而能與所述的另外的核苷酸序列雜交,因此形成穩(wěn)定的雙鏈體(duplex)。
本發(fā)明的一個方面涉及編碼本發(fā)明的多肽或其功能等同物的經(jīng)過分離的核酸分子,所述功能等同物例如是具有生物活性的片段或結構域;此方面還涉及足以用作雜交探針去鑒別編碼本發(fā)明多肽的核酸分子的核酸分子;以及適合于用作PCR引物來對核酸分子進行擴增或突變的核酸分子的片段?!敖?jīng)過分離的多核苷酸”或“經(jīng)過分離的核酸”是DNA或RNA,在從中得到所述DNA或RNA的生物體的天然存在的基因組中,所述DNA或RNA與兩條(5’端的一條和3’端的一條)編碼序列直接相鄰,而對“經(jīng)過分離的多核苷酸”或“經(jīng)過分離的核酸”而言,所述DNA或RNA與這兩條編碼序列并不直接相鄰。因此,在一種實施方式中,經(jīng)過分離的核酸包括直接相鄰于所述編碼序列的5’非編碼(例如,啟動子)序列的一部分或全部。因此該術語包括,例如,插入到載體中的重組DNA,插入到自主復制質?;虿《局械闹亟MDNA,或插入到原核生物或真核生物的基因組DNA中的重組DNA,或作為不依賴其它序列的獨立分子(例如,通過PCR或限制性內切酶處理產(chǎn)生的cDNA或基因組DNA片段)而存在的重組DNA。該術語還包括作為雜種基因(hybrid gene)一部分的重組DNA,所述雜種基因編碼另外的多肽,所述的多肽充分去除了細胞物質、病毒物質或培養(yǎng)基(當通過重組DNA技術進行生產(chǎn)時),或化學前體或其它化學制品(當化學合成時)。此外,“經(jīng)過分離的核酸片段”并非是天然就作為片段存在的,而且其也不能在自然狀態(tài)被發(fā)現(xiàn)。
本文中使用的術語“多核苷酸”或“核酸分子”被用來包括DNA分子(例如cDNA和基因組DNA)和RNA分子(例如mRNA)以及用核苷酸類似物生產(chǎn)出的DNA或RNA類似物。所述的核酸分子可以是單鏈的或雙鏈的,但優(yōu)選是雙鏈的DNA??梢允褂霉押塑账犷愃莆锘蜓苌?次黃苷或硫代磷酸核苷酸)來合成所述的核酸。例如,此類寡核苷酸可被用于制備堿基配對能力有所改變或對核酸酶抗性增加的核酸。
本發(fā)明的另一種實施方式提供了經(jīng)過分離的核酸分子,所述核酸分子反義于本發(fā)明的核酸分子。本發(fā)明的范圍內還包括了本文中描述的核酸分子的互補鏈。
測序錯誤本文中提供的序列信息不應被狹義地解釋為需要將非正確鑒別的堿基包括在內??梢院苋菀椎赜帽疚墓_的特定序列從絲狀真菌中分離出完整的基因,特別是從Aspergillus niger中;然后可以很容易地對所述基因進行進一步的序列分析,從而鑒別出測序的錯誤來。
除非另外指明,本文中所有通過對DNA分子進行測序測定出的核苷酸序列都是用自動DNA測序儀來測定的,所有由此處所確定的DNA分子編碼的多肽的氨基酸序列都是通過對按照上文所述測定的DNA序列進行翻譯來預測的。因此,如本領域內所已知的那樣,對任何通過該自動手段來測定的DNA序列而言,本文中測定的任何的核苷酸序列都可能含有一些錯誤。典型地,通過自動操作測定的核苷酸序列與被用來測序的DNA分子的實際核苷酸序列至少約90%相同,更典型地,至少約95%到至少約99.9%相同??赏ㄟ^其它手段更精確地測定所述的實際序列,所述手段包括本領域中公知的手工DNA測序方法。如本領域中還已知的那樣,如果測定出的核苷酸序列較之實際序列有一個插入或缺失,在該核苷酸進行翻譯時就會導致移碼,從而對測定出的核苷酸序列而言,從插入或缺失點開始,預測得到的其所編碼的氨基酸序列就將完全不同于被用于測序的DNA分子實際編碼的氨基酸序列。
本領域內的技術人員能夠鑒別出此類非正確鑒別的堿基,而且知道如何改正此類錯誤。
核酸片段、探針和引物本發(fā)明的核酸分子可以僅僅包含選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸序列的片段或一部分,例如,可以被用作探針或引物的片段,或編碼本發(fā)明蛋白質的一部分的片段。對所述脂肪分解酶基因的克隆測定出的核苷酸序列以及cDNA可用來得到探針和引物,所述探針和引物是為鑒定和/或克隆脂肪分解酶家族的其它成員以及來自其它物種的脂肪分解酶同源體而設計的。典型地,所述探針/引物包含經(jīng)過充分純化的寡核苷酸,典型地,所述寡核苷酸包含核苷酸序列區(qū)域,所述核苷酸序列區(qū)域優(yōu)選在高度嚴謹條件下,與一種核苷酸序列或其功能等同物的至少約12或15個,優(yōu)選約18或20個,優(yōu)選約22或25個,更優(yōu)選約30、35、40、45、50、55、60、65或75或更多的連續(xù)核苷酸雜交,與所述核苷酸序列區(qū)域雜交的核苷酸序列選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組。
基于本文提供的核苷酸序列的探針可被用于探測轉錄物或基因組序列,所述轉錄物或基因組序列例如在其它生物中編碼同樣的蛋白質或同源蛋白質。在優(yōu)選的實施方式中,所述探針進一步地包含連接到其上的標記基團,例如,所述標記基團可以是放射性同位素、熒光化合物、酶或酶的輔助因子。此類探針還可被用作診斷試驗試劑盒的一部分,用于鑒別表達脂肪分解酶蛋白質的細胞。
同一性(identity)和同源性(homology)術語“同源性”或“百分比同一性(percent identity)”在本文中可互換使用。就本發(fā)明的目的而言,在此定義為確定兩條氨基酸序列或兩條核酸序列的百分比同一性,本著最優(yōu)比較的目的(例如,可以在第一條氨基酸序列或核苷酸序列上引入缺口(gap),以與第二條氨基酸序列或核苷酸序列達到最佳的比對),將所述序列進行比對(align)。然后對相應氨基酸位置或核苷酸位置上的氨基酸殘基或核苷酸進行比較。如果第一條序列上某位置的氨基酸殘基或核苷酸與第二條序列上相應位置的相同,那么這些分子在此位置就是相同的。兩條序列間的百分比同一性是所述序列共有的相同位置的數(shù)量的函數(shù)(即,%同一性=相同位置的數(shù)量/位置(即重疊位置)總數(shù)×100)。優(yōu)選地,該兩條序列長度相同。
技術人員會知道有若干計算機程序可被用于確定兩條序列間的同源性。例如,可以使用數(shù)學算法來完成對序列的比對和對兩條序列間百分比同一性的確定。在一個優(yōu)選的實施方式中,使用Needleman and Wunsch(J.Mol.Biol.(48)444-453(1970))算法來確定兩條氨基酸序列間的百分比同一性,所述算法已被合并到GCG軟件包(可從http//www.gcg.com獲得)的GAP程序中,其中使用Blossom 62矩陣或PAM250矩陣,缺口權重為16、14、12、10、8、6或4,長度權重為1、2、3、4、5或6。技術人員會意識到上述的所有不同參數(shù)將導致有細微區(qū)別的結果,但是使用不同算法時兩條序列的總體百分比同一性不會有顯著改變。
在又一個實施方式中,使用GCG軟件包(可從http//www.gcg.com獲得)的GAP程序來確定兩條核苷酸序列間的百分比同一性,其中使用NWSgapdna.CMP矩陣,缺口權重為40、50、60、70或80,長度權重為1、2、3、4、5或6。在另一個實施方式中,使用E.Meyers和W.Miller(CABIOS,411-17(1989))的算法來確定兩條氨基酸序列或核苷酸序列的百分比同一性,所述算法已被合并到ALIGN程序(2.0版)(可從http//vega.igh.cnrs.fr/bin/align-guess.cgi獲得)中,其中使用PAM120加權殘基表,缺口長度懲罰(penalty)為12,缺口懲罰為4。
本發(fā)明的核酸和蛋白質序列可以進一步地被用作“查詢序列”來開展對公眾數(shù)據(jù)庫的搜索,例如,去鑒定相關序列或家族中其它成員。可以使用Altschul,et al.(1990)J.Mol.Biol.215403-10的BLASTN和BLASTX程序(2.0版)來開展此類搜索??梢杂肂LASTN程序,在score=100,字長(word length)=12下來開展BLAST核苷酸搜索,以獲得與本發(fā)明的PLP03核酸分子同源的核苷酸序列??梢杂肂LASTX程序,在score=50,字長=3下來開展BLAST蛋白質搜索,以獲得與本發(fā)明的PLP03蛋白質同源的氨基酸序列。本著比較的目的,為獲得有缺口的比對,可以利用Altschul et al.,(1997)Nucleic Acids Res.25(17)3389-3402中描述的Gapped BLAST。當利用BLAST和Gapped BLAST程序時,可以使用各個程序(例如BLASTX和BLASTN)的缺省參數(shù)。見http//www.ncbi.nlm.nih.gov。
雜交本文中用到的術語“雜交”被用來描述雜交和洗滌的條件,在所述條件下,典型地,互相之間同源性為至少約50%、至少約60%、至少約70%、更優(yōu)選為至少約80%、進一步優(yōu)選為至少約85%到90%、更優(yōu)選為至少95%的核苷酸序列保持相互雜交的狀態(tài)。
對此類雜交條件而言,其中一個優(yōu)選的非限制的例子是在6×氯化鈉/檸檬酸鈉(sodium chloride/sodium citrate,SSC)中,大約45℃下雜交,隨后在1×SSC、0.1%SDS中,50℃下進行一次或多次洗滌,優(yōu)選在55℃下,優(yōu)選在60℃下,進一步優(yōu)選在65℃下。
高度嚴謹條件包括例如,在68℃下于5×SSC/5×Denhardt’s溶液/1.0%SDS中進行雜交,室溫下于0.2×SSC/0.1%SDS中洗滌?;蛘撸礈炜梢栽?2℃展開。
本領域技術人員知道何種條件下適于使用嚴謹雜交條件及高度嚴謹雜交條件。本領域中不難獲得其它關于此類條件的指導,例如,在Sambrooket al.,1989,Molecular Cloning,A Laboratory Manual,Cold Spring HarborPress,N.Y.;和Ausubel et al.(eds.),1995,Current Protocols in MolecularBiology,(John Wiley & Sons,N.Y.)中。
當然,僅與poly A序列(例如mRNA的3’末端poly(A)區(qū))或僅與T(或U)殘基的互補性延伸區(qū)段(stretch)雜交的多核苷酸將不會被包括在用于與本發(fā)明核酸的一部分特異性雜交的本發(fā)明多核苷酸中,因為此類多核苷酸將與任何含有poly(A)延伸區(qū)段的核酸分子或其互補序列(例如,實際上是任何雙鏈的cDNA克隆)雜交。
獲得來自其它生物的全長DNA采用典型手段,可以對從其它生物,例如從絲狀真菌,特別是從Aspergillus的種所構建的cDNA文庫進行篩選。
例如,可以通過Northern印跡分析來對Aspergillus的菌株進行篩選,以獲得同源多核苷酸。在探測到與本發(fā)明多核苷酸同源的轉錄物之后,可以利用本領域技術人員公知的標準技術,由分離自合適菌株的RNA來構建cDNA文庫?;蛘撸梢允褂媚芘c本發(fā)明多核苷酸雜交的探針來對全基因組DNA文庫進行篩選。
例如,可以通過使用兩套簡并的寡核苷酸引物組(primer pool)開展PCR,來分離出同源的基因序列,所述引物組是基于本文所教導的核苷酸而設計的。
用于所述反應的模板可以是通過對mRNA進行反轉錄所獲得的cDNA,所述mRNA是從已知能表達或被懷疑能表達本發(fā)明多核苷酸的菌株中制備得到的。PCR產(chǎn)物可被用于亞克隆或測序,以確保擴增出的序列代表新的PLP03核酸序列或其功能等同物的序列。
然后可以通過一系列已知方法,用所述的PCR片段來分離全長cDNA克隆。例如,可對擴增出的片段進行標記,并將其用于對噬菌體cDNA文庫或粘粒cDNA文庫的篩選。或者,經(jīng)過標記的片段可被用于篩選基因組文庫。
PCR還可被用于從其它生物中分離全長cDNA序列。例如,可以遵循標準工序,從適當?shù)募毎蚪M織來源分離出RNA。用寡核苷酸引物對所述RNA進行反轉錄反應,所述引物與擴增片段的5’末端序列具有特異性,用于引導第一鏈合成。
然后可以用標準的末端轉移酶反應,給得到的RNA/DNA雜交體(hybrid)“加上尾巴”(例如,用鳥嘌呤),所述的雜交體可被RNaseH消化,然后第二鏈合成得以被引導(例如,用poly-C引物)。因此,可以很容易地分離出處于擴增片段上游的cDNA序列。關于有用的克隆策略的綜述,參見例如前述的Sambrook et al.和前述的Ausubel et al.。
載體本發(fā)明的另一個方面是關于載體的,優(yōu)選為表達載體,所述載體含有編碼本發(fā)明蛋白質的核酸或其功能等同物。在本文中用到的術語“載體”指能運送連接到其上的另一個核酸分子的核酸分子。一種載體類型是“質粒”,“質?!敝腑h(huán)狀的雙鏈DNA環(huán),另外的DNA片斷可以連接到所述的環(huán)上。另一種載體的類型是病毒載體,其中,另外的DNA片斷可以連接到病毒基因組中。某些載體能在其被引入的宿主細胞中進行自主復制(例如,具有細菌的復制起點的細菌載體以及游離的哺乳動物載體)。其它載體(例如,非游離的哺乳動物載體)在被引入宿主細胞之后就被整合到了宿主細胞的基因組中,因此它們與宿主基因組一同復制。此外,某些載體能指導可操作地連接到其上的基因的表達。此類載體在本文中被稱為“表達載體”。一般而言,在重組DNA技術中用到的表達載體通常是質粒的形式。在本文中術語“質?!焙汀拜d體”可以互換使用,因為質粒是最常用到的載體形式。然而,本發(fā)明也將包括其它形式的表達載體,例如病毒載體(例如,復制缺陷型逆轉錄病毒、腺病毒和腺伴隨病毒),所述載體能提供等同的功能。
本發(fā)明的重組表達載體包含本發(fā)明的核酸,所述核酸存在的形式適合于該核酸在宿主細胞中的表達,這意味著該重組表達載體包括一段或多段調控序列,所述序列是基于被用于表達的宿主細胞來選擇的,其被可操作地連接到將要表達的核酸序列上。在重組表達載體中,“可操作地連接”被用來表示人們感興趣的核苷酸序列被連接到調控序列上,所述的連接以允許該核苷酸序列表達的方式(例如,在體外轉錄/翻譯系統(tǒng)中或在載體被引入的宿主細胞中)進行。術語“調控序列”將包括啟動子、增強子和其它表達控制元件(例如,多腺苷酸化信號)。例如,在Goeddel;GeneExpression TechnologyMethods in Enzymology 185,Academic Press,SanDiego,CA(1990)中對此類調控序列進行了描述。調控序列包括在很多種宿主細胞中指導核苷酸序列的組成型或誘導型表達的調控序列,也包括僅在某些宿主細胞中指導核苷酸序列表達的調控序列(例如,組織特異性調控序列)。本領域的技術人員將意識到,對表達載體的設計可能依賴于以下因素對將被轉化的宿主細胞的選擇,期望獲得的蛋白質的表達水平等。本發(fā)明的表達載體可以被引入宿主細胞,以生產(chǎn)本文所述的核酸編碼的蛋白質或肽(例如,脂肪分解酶、突變的脂肪分解酶、上述酶的片段、上述酶的變異體或功能等同物、融合蛋白等等)。
可以為了在原核細胞或真核細胞中表達脂肪分解酶而對本發(fā)明的重組表達載體加以設計。例如,本發(fā)明的蛋白質可在細菌細胞、昆蟲細胞(使用桿狀病毒表達載體)、酵母細胞或哺乳動物細胞中表達,所述細菌細胞例如是E.coli和Bacillus的種。在Goeddel;Gene Expression TechnologyMethods in Enzymology 185,Academic Press,San Diego,CA(1990)中對合適的宿主細胞進行了進一步的討論?;蛘?,所述的重組表達載體可在體外進行轉錄及翻譯,例如,使用T7啟動子調控序列和T7聚合酶。
在本發(fā)明中有用的表達載體包括源自染色體、游離體和病毒的載體,例如源自細菌質粒、噬菌體、酵母游離體、酵母染色體元件的載體,源自病毒,例如桿狀病毒、乳頭多瘤空泡病毒(papova virus)、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒和逆轉錄病毒的載體和源自上述物質的組合的載體,例如源自質粒和噬菌體遺傳元件的載體,例如粘粒和噬菌粒(phagemid)。
插入的DNA應當被可操作地連接到合適的啟動子上,例如噬菌體的lambda PL啟動子,E.coli的lac啟動子、trp啟動子和tac啟動子,SV40的早期啟動子和晚期啟動子以及逆轉錄病毒LTR的啟動子。技術人員知道其它合適的啟動子。在一種具體的實施方式中,優(yōu)選的啟動子是能指導脂肪分解酶在絲狀真菌中高水平表達的啟動子。此類啟動子為本領域所已知。所述的表達構建體可以含有用于轉錄起始和終止的位點,還在轉錄區(qū)域含有用于翻譯的核糖體結合位點。由該構建體表達的成熟轉錄物的編碼部分包括處于起點的用于起始翻譯的AUG以及恰當?shù)囟ㄎ挥诖g的多肽末尾的終止密碼。
可通過傳統(tǒng)的轉化或轉染技術將載體DNA引入原核細胞或真核細胞。在此使用的“轉化”和“轉染”指一系列本領域內已知的用于將外源核酸(例如DNA)引入到宿主細胞中的技術,包括磷酸鈣或氯化鈣共沉淀、DEAE-葡聚糖介導的轉染、轉導、感染、脂質轉染、陽離子脂介導的轉染或電穿孔。用于對宿主細胞進行轉化和轉染的合適方法可在Sambrook,et al.(Molecular CloningA Laboratory Manual,2nd,ed.Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989),Davis et al.,Basic Methods in Molecular Biology(1986)及其它實驗手冊中找到。
對哺乳動物細胞的穩(wěn)定轉染而言,人們已知,僅有一小部分的細胞可以將外源DNA整合到其基因組中,這取決于所用的表達載體和轉染技術。為鑒別和選擇出上述整合體,通常將編碼選擇性標志(例如對抗生素的抗性)基因與人們感興趣的基因一起引入到宿主細胞中。優(yōu)選的選擇性標志包括賦予藥物抗性的標志,所述藥物例如是G418、潮霉素和甲氨喋呤。優(yōu)選地,編碼選擇性標志的核酸在與編碼本發(fā)明蛋白質的載體相同的載體上被轉移到宿主細胞中,或者,所述核酸可以在另外的載體上被轉移進去。經(jīng)過被引入的核酸穩(wěn)定轉染的細胞可通過藥物選擇來鑒別(例如,已經(jīng)插入了選擇性標志基因的細胞將存活,而其它細胞則會死亡)。
蛋白質在原核生物中的表達通常是在E.coli中開展的,其中使用了含有組成型或誘導型啟動子的載體,用于指導融合蛋白或非融合蛋白的表達。融合載體將多個氨基酸加入到該載體所編碼的蛋白質上,例如,加入到該重組蛋白的氨基末端。典型地,此類融合載體用作三種目的1)以增強重組蛋白的表達;2)以增加該重組蛋白的溶解度;和3)通過在親和純化中作為配體以協(xié)助該重組蛋白的純化。通常,在融合表達載體中,向融合部分和重組蛋白的連接處引入蛋白酶剪切位點,以便在融合蛋白被純化之后能使重組蛋白與融合部分相分離。此類酶及其同源(cognate)識別序列包括Xa因子、凝血酶和腸激酶。
如本文所指出的,所述表達載體將優(yōu)選含有選擇性標志。此類標志包括用于真核細胞培養(yǎng)的二氫葉酸還原酶或新霉素抗性以及用于培養(yǎng)E.coli和其它細菌的四環(huán)素抗性或氨芐青霉素抗性。合適的宿主的代表性例子包括細菌細胞,例如E.coli、Streptomyces和Salmonella typhimurium;真菌細胞,例如酵母;昆蟲細胞,例如Drosophila S2和Spodoptera Sf9;動物細胞,例如CHO、COS和Bowes黑色素瘤;以及植物細胞。用于上述宿主細胞的合適的培養(yǎng)基和培養(yǎng)條件都是本領域內已知的。
載體中優(yōu)選用于細菌的是可從Qiagen獲得的pQE70、pQE60和pQE-9,可從Stratagene獲得的pBS載體、Phagescript載體、Bluescript載體、pNH8A、pNH16A、pNH18A、pNH46A,可從Pharmacia獲得的ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5。優(yōu)選的真核載體是可從Stratagene獲得的PWLNEO、pSV2CAT、pOG44、pZT1和pSG,以及可從Pharmacia獲得的pSVK3、pBPV、pMSG和pSVL。其它適合的載體對本領域技術人員而言是顯而易見的。
用于本發(fā)明的已知的細菌啟動子包括E.coli的lacI和lacZ啟動子,T3和T7啟動子,gpt啟動子,lambda PR、PL啟動子和trp啟動子,HSV胸苷激酶啟動子,SV40的早期啟動子和晚期啟動子,逆轉錄病毒LTR的啟動子例如勞斯肉瘤病毒(Rous sarcoma virus,RSV)的啟動子以及金屬硫蛋白啟動子,例如小鼠的金屬硫蛋白-I啟動子。
將增強子序列插入到載體中可以增強編碼本發(fā)明多肽的DNA在更高等真核生物中的轉錄。增強子是DNA的順式作用元件,通常從10bp至300bp,其在特定的宿主細胞類型中發(fā)揮作用,以增加啟動子的轉錄活性。增強子的例子包括處于復制起點晚期一側(late side)第100bp至270bp處的SV40增強子、巨細胞病毒早期啟動子的增強子、腺病毒增強子以及處于復制起點晚期一側的多瘤病毒增強子。
為使翻譯的蛋白質能分泌到內質網(wǎng)的腔、胞質間隙或胞外環(huán)境中,可以將適當?shù)姆置谛盘柌迦氲奖磉_的多肽中。所述的信號對該多肽而言可以是內源的,也可以是異源信號。
所述的多肽可以以經(jīng)修飾的形式表達,例如以融合蛋白的形式,并且該多肽不僅可以包括分泌信號,還可以包括其它的異源功能區(qū)域。因此,例如,可以將其它氨基酸,特別是帶電荷的氨基酸,區(qū)域加入到所述多肽的N-末端,以增加其在宿主細胞中、在純化期間或在隨后的操作及貯藏期間的穩(wěn)定性和持久性。此外,還可以將肽的部分加入到所述多肽上,以協(xié)助進行純化。
本發(fā)明的多肽本發(fā)明提供了氨基酸序列和經(jīng)過分離的多肽,所述氨基酸序列可通過在合適的宿主中表達選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的多核苷酸來獲得,所述多肽具有選自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列。此外,包含上述多肽的功能等同物的肽或多肽也被包含于本發(fā)明中。上述多肽被共同包含于術語“本發(fā)明的多肽”中。
(如通常所承認的一樣,)術語“肽”和“寡肽”被認為是同義的,當上下文中需要指出通過肽鍵結合起來的至少兩個氨基酸的鏈時,兩個術語可以互換使用?!岸嚯摹边@個詞在本文中被用于指含有超過七個氨基酸殘基的鏈。本文中所有寡肽和多肽的分子式或序列都是從左至右書寫的,而且是從氨基端到羧基端的方向。本文中使用的單字母氨基酸代碼在本領域中是公知的,其可以在Sambrook,et al.(Molecular CloningA LaboratoryManual,2nd,ed.Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989)中找到。
“經(jīng)過分離的”多肽或蛋白質被用于從其自然環(huán)境中移出來的多肽或蛋白質。例如,出于本發(fā)明的目的,在宿主細胞中表達的經(jīng)重組生產(chǎn)的多肽和蛋白質被認為是經(jīng)過分離的;已用任何合適的技術進行了充分純化的天然或重組多肽也被認為是經(jīng)過分離的,所述技術例如是在Smith andJohnson,Gene 6731-40(1988)中公開的一步純化法。
可通過公知的方法從重組細胞培養(yǎng)物中回收及純化本發(fā)明的脂肪分解酶,所述方法包括硫酸銨或乙醇沉淀、酸提取、陰離子交換層析或陽離子交換層析、磷酸纖維素層析、疏水作用層析、親和層析、羥基磷灰石層析和凝集素層析。最優(yōu)選地,使用高效液相色譜(HPLC)來進行純化。
本發(fā)明的多肽包括天然純化的產(chǎn)物、化學合成工序的產(chǎn)物以及從原核或真核宿主中通過重組技術生產(chǎn)的產(chǎn)物,所述宿主包括例如細菌、酵母、高等植物、昆蟲和哺乳動物。本發(fā)明的多肽可以是經(jīng)過了糖基化的,或者可以是未經(jīng)過糖基化的,這取決于在重組生產(chǎn)工序中所使用的宿主。此外,本發(fā)明的多肽還可以包括初始修飾的甲硫氨酸殘基,在某些情況下作為宿主介導的過程的結果。
本發(fā)明的脂肪分解酶可被有利地用于烘焙過程。加入到面團中的酶的量主要靠經(jīng)驗決定。其可能取決于所用面粉的質量、需要改善的程度、面包或烘焙制品的種類、制備面團的方法、其它成分的百分比等等。
蛋白質片段本發(fā)明還公開了本發(fā)明多肽的具有生物活性的片段。
本發(fā)明多肽的具有生物活性的片段包括包含下述氨基酸序列的多肽,所述氨基酸序列與所述脂肪分解酶的氨基酸序列充分相同或來自所述脂肪分解酶的氨基酸序列(例如所述脂肪分解酶的氨基酸序列選自由SEQ IDNO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組),所述片段包括的氨基酸較之所述的全長蛋白質要少,其顯示了相應全長蛋白質的至少一種生物活性。典型地,具有生物活性的片段包含具有相應全長蛋白質的至少一種生物活性的結構域或基元(motif)。
本發(fā)明蛋白質的具有生物活性的片段可以是多肽,所述多肽的長度例如為10、25、50、100或更多個氨基酸。此外,可以通過重組技術來制備其它具有生物活性的部分,所述部分中被去除了所述蛋白質的其它區(qū)域;對本發(fā)明多肽的天然形式的一種或多種生物活性而言,可以對所述部分進行評估。
本發(fā)明還公開了編碼上述脂肪分解酶蛋白質的具有生物活性的片段的核酸片段。
融合蛋白本發(fā)明的蛋白質或其功能等同物,例如其具有生物活性的部分,可被可操作地連接到非脂肪分解酶多肽(例如,異源氨基酸序列)上,以形成融合蛋白。本文中用到的脂肪分解酶的“嵌合(chimeric)蛋白”和“融合蛋白”包含可操作地連接到非脂肪分解酶多肽上去的脂肪分解酶多肽?!爸痉纸饷付嚯摹敝妇哂羞x自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列的多肽,而“非脂肪分解酶多肽”則指具有與所述脂肪分解酶不充分同源的蛋白質的相應氨基酸序列的多肽,例如不同于所述脂肪分解酶的蛋白質,并且所述蛋白質與所述脂肪分解酶來自相同的或不同的生物。在脂肪分解酶的融合蛋白中,脂肪分解酶多肽可能對應于所述脂肪分解酶蛋白質的全部或部分。在一種優(yōu)選的實施方式中,脂肪分解酶融合蛋白包含脂肪分解酶蛋白質的至少一段具有生物活性的片段。在另一種優(yōu)選的實施方式中,脂肪分解酶融合蛋白包含脂肪分解酶蛋白質的至少兩個具有生物活性的部分。在所述的融合蛋白中,術語“可操作地連接”用來表示所述的脂肪分解酶多肽和所述的非脂肪分解酶多肽以符合讀框的方式(in-frame)相互融合。所述的非脂肪分解酶多肽可以被融合到所述脂肪分解酶多肽的N-末端或C-末端上。
例如,在一種實施方式中,所述的融合蛋白是GST-脂肪分解酶融合蛋白,其中,脂肪分解酶序列被融合到GST序列的C-末端上。此類融合蛋白可以促進對重組的脂肪分解酶的純化。在另一種實施方式中,所述的融合蛋白是在其N-末端含有異源信號序列的脂肪分解酶蛋白質。可以通過使用異源信號序列,來增加所述脂肪分解酶在某些宿主細胞(例如,哺乳動物宿主細胞和酵母宿主細胞)中的表達和/或分泌。
在另一個實施例中,桿狀病毒包膜蛋白的gp67分泌序列可被用作異源信號序列(Current Protocols in Molecular Biology,Ausubel et al.,eds.,John Wiley & Sons,1992)。真核異源信號序列的其它例子包括蜂毒肽的分泌序列和人類胎盤堿性磷酸酶的分泌序列(Stratagene;La Jolla,California)。在又一個實施例中,有用的原核異源信號序列包括phoA分泌信號(前述的Sambrook et al.)和蛋白質A分泌信號(Pharmacia Biotech;Piscataway,New Jersey)。
信號序列可被用于協(xié)助對本發(fā)明蛋白質或多肽的分泌及分離。典型地,信號序列的特征為具有疏水氨基酸核心,分泌期間,在一次或多次切割事件中,通??蓪⑺鲂盘栃蛄袕某墒斓鞍踪|上切割掉。此類信號肽含有加工位點(processing site),所述位點允許信號序列在通過分泌途徑之時被從成熟蛋白質上切割掉。所述信號序列指導了所述蛋白質的分泌,例如從轉化進表達載體的真核宿主中分泌,所述信號序列隨后或同時被切割掉。然后通過本領域公知的方法,可以很容易地從胞外培養(yǎng)基中純化出所述的蛋白質。或者,可以用能協(xié)助純化的序列,例如用GST結構域將所述的信號序列連接到人們感興趣的蛋白質上。因此,例如,編碼所述多肽的序列可與標志序列融合,所述標志序列例如是編碼能促進該融合多肽純化的肽的序列。在本發(fā)明這一方面的某些優(yōu)選的實施方式中,所述的標志序列是六組氨酸的肽,例如pQE載體(Qiagen,Inc.)中提供的標簽;很多標志序列都是可以購買到的。例如,如Gentz et al,Proc.Natl.Acad.Sci.USA86821-824(1989)所述,六組氨酸為所述的融合蛋白提供了方便的純化。所述的HA標簽是另一種有利于純化的肽,其與來自流感血凝素蛋白質的表位相對應,這已被例如Wilson et al.,Cell 37767(1984)進行了描述。
優(yōu)選地,本發(fā)明的嵌合蛋白或融合蛋白是通過標準的重組DNA技術來產(chǎn)生的。例如,遵循傳統(tǒng)技術,將編碼不同多肽序列的DNA片段以符合讀框的方式連接到一起,例如,通過采用平末端或交錯切口末端用于連接;采用限制性酶消化以提供合適的末端,或根據(jù)需要填平粘末端;采用堿性磷酸酶處理,以避免人們不想要的結合或酶連接。在另一種實施方式中,可以通過傳統(tǒng)技術來合成所述的融合基因,所述技術包括自動DNA合成儀?;蛘?,可以使用錨定引物(anchor primer)來開展對基因片段的PCR擴增,所述引物能在兩段連續(xù)的基因片段之間產(chǎn)生互補突出端(overhang),隨后可以進行退火和再次擴增,以產(chǎn)生出嵌合基因序列(例如,見Current Protocols in Molecular Biology,eds.Ausubel et al.JohnWiley & Sons1992)。此外,還可以購買到很多已經(jīng)編碼有融合部分(例如,GST多肽)的表達載體。編碼脂肪分解酶的核酸可被克隆到此類載體中,以使所述融合部分以符合讀框的方式與所述脂肪分解酶蛋白質連接起來。
功能等同物術語“功能等同物”和“功能變異體”在本文中可以互換使用。編碼脂肪分解酶的DNA的功能等同物是經(jīng)過分離的DNA片段,所述片段編碼展示特定功能的多肽,所述功能是本文中定義的Aspergillus niger的脂肪分解酶所具有的。本發(fā)明的脂肪分解酶多肽的功能等同物是展示了本文中定義的Aspergillus niger的脂肪分解酶的至少一種功能的多肽。因此,功能等同物也包括具有生物活性的片段。
蛋白質或多肽功能等同物可以含有僅經(jīng)過對一個或多個氨基酸進行了保守替代的氨基酸序列或僅對非關鍵氨基酸進行了替代、插入或缺失的氨基酸序列,所述氨基酸序列選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。因此,非關鍵氨基酸是氨基酸序列中可被改變的殘基,但所述改變基本不會改變生物功能,所述氨基酸序列選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。例如,對本發(fā)明的脂肪分解酶蛋白質而言是保守的氨基酸殘基,就被預測為是尤其不能進行改變的殘基。此外,對本發(fā)明的脂肪分解酶蛋白質和其它脂肪分解酶而言是保守的氨基酸,也不太可能易于被改變。
術語“保守替代”用來指一種替代,其中,所述的氨基酸殘基被具有相似側鏈的氨基酸殘基所替換。上述族系已為本領域所已知,其包括具有堿性側鏈的氨基酸(例如,賴氨酸、精氨酸和組氨酸),具有酸性側鏈的氨基酸(例如,天冬氨酸、谷氨酸),具有不帶電荷的極性側鏈的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、絲氨酸、蘇氨酸、酪氨酸、半胱氨酸),具有非極性側鏈的氨基酸(例如,丙氨酸、纈氨酸、亮氨酸、異亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),具有beta支鏈形式的側鏈的氨基酸(例如,蘇氨酸、纈氨酸、異亮氨酸)和具有芳香族側鏈的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、組氨酸)。
典型地,核酸功能等同物可以含有沉默突變或不改變所編碼多肽的生物功能的突變。因此,本發(fā)明提供了編碼脂肪分解酶蛋白質的核酸分子,所述蛋白質含有氨基酸殘基的改變,所述氨基酸殘基對特定的生物活性來說是非必要的。此類脂肪分解酶蛋白質與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列不同,但所述的蛋白質仍然保留有至少一種生物活性。在一種實施方式中,所述經(jīng)過分離的核酸分子含有編碼蛋白質的核苷酸分子,其中,所述蛋白質包含與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列具有至少約60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性的基本同源的氨基酸序列。
例如,在Bowie,J.U.et al.,Science 2471306-1310(1990)中提供了關于如何制造表型沉默的氨基酸替代的指導,其中,作者指出,有兩種主要的手段可以用于研究氨基酸序列對改變的容忍度。第一種方法依賴進化過程,其中,突變或者被自然選擇所接受,或者被其拒絕。第二種方法則是利用遺傳工程向克隆基因的特定位點引入氨基酸改變,然后進行選擇或篩選,以鑒別出保留了功能性的序列。如作者所言,上述研究揭示,蛋白質對氨基酸替代有著驚人的容忍度。作者還進一步指出了哪些改變可能被允許進行于蛋白質的特定位置上。例如,大多數(shù)隱蔽的氨基酸殘基需要非極性側鏈,而表面上的側鏈通常很少有保守特征。在前述的Bowie et al和本文引用的參考文獻中,描述了其它的表型沉默替代。
編碼與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的蛋白質同源的蛋白質的經(jīng)過分離的核酸分子,可以通過下述方法來制造向相應的核苷酸編碼序列(表1)中引入一個或多個核苷酸替代、增加或缺失,從而向被編碼的蛋白質中引入一個或多個的氨基酸替代、缺失或插入。可以通過標準技術來引入此類突變,所述技術例如是定點誘變和PCR介導的誘變。
術語“功能等同物”還包括本文提供的Aspergillus niger的脂肪分解酶的直向同源體(orthologue)。Aspergillus niger的脂肪分解酶的直向同源體是可以從其它菌株或物種中分離得到的蛋白質,所述蛋白質具有相似或相同的生物活性。此類直向同源體包含與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列基本同源的氨基酸序列,因此所述同源體不難被鑒別出來。
如本文所定義,術語“基本同源”指第一條氨基酸或核苷酸序列與第二條氨基酸或核苷酸序列含有足夠數(shù)目的或最低要求數(shù)目的相同或等同(例如,具有相似側鏈)的氨基酸或核苷酸,從而,所述的第一條和第二條氨基酸或核苷酸序列具有共同(common)結構域。例如,含有共同結構域,且具有約60%,優(yōu)選為65%,更優(yōu)選為70%,進一步優(yōu)選為75%、80%、85%、90%、95%、96%、97%、98%或99%或更高的同一性的氨基酸序列或核苷酸序列,在本文中就被定義為充分相同。
此外,編碼脂肪分解酶家族其它成員的核酸也在本發(fā)明的范圍內,所述核酸因此具有與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列不同的核苷酸序列。此外,編碼來自其它物種的脂肪分解酶蛋白質的核酸也在本發(fā)明的范圍內,所述核酸具有與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列不同的核苷酸序列。
使用本文中公開的cDNA或其合適的片段作為雜交探針,優(yōu)選在高度嚴謹雜交條件下,可以按照標準的雜交技術,分離出與本發(fā)明多核苷酸的變異體(例如,天然的等位基因變異體)及同源體相應的核酸分子,所述分離基于與所述變異體及同源體相應的核酸分子與本文中公開的核酸分子的同源性。
對本文中提供的Aspergillus niger的序列而言,除其天然存在的等位基因變異體之外,技術人員還知道通過突變向選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核苷酸序列引入改變,由此可以導致所述脂肪分解酶蛋白質的氨基酸序列改變,但所述蛋白質的功能卻沒有實質性變化。
在本發(fā)明的另一個方面,提供了經(jīng)過改善的脂肪分解酶。改善的脂肪分解酶是其中至少一種生物活性經(jīng)過了改善的蛋白質。此類蛋白質可以通過向所述脂肪分解酶編碼序列的全部或一部分上隨機引入突變來獲得,例如通過飽和誘變來獲得,得到的突變體可被重組表達,并被用于進行對生物活性的篩選。例如,本領域提供了用于測量脂肪分解酶酶活的標準檢測方法,因此可以很容易地選出經(jīng)過改善的蛋白質。
在一種優(yōu)選的實施方式中,所述脂肪分解酶具有選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列。另一種實施方式中,所述脂肪分解酶與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列基本同源,并且所述脂肪分解酶保留有選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的多肽的至少一種生物活性,但因為上述的天然變異或誘變,所述的脂肪分解酶與所述多肽的氨基酸序列仍有不同。
在另外一個優(yōu)選實施方式中,所述脂肪分解酶具有由經(jīng)過分離的核酸片段編碼的氨基酸序列,所述核酸片段能與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸雜交,所述雜交優(yōu)選進行于高度嚴謹?shù)碾s交條件下。
因此,所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列具有至少約60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;并且所述蛋白質還保留有選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的多肽的至少一種功能活性。
具體而言,所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO3中所示的氨基酸序列具有至少約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO6中所示的氨基酸序列具有至少約55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO9中所示的氨基酸序列具有至少約75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO12中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO15中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQID NO18中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO21中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO24中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO27中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO30中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO33中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO36中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性;或所述的脂肪分解酶是包含一種氨基酸序列的蛋白質,所述氨基酸序列與SEQ ID NO39中所示的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的同源性。
本發(fā)明的蛋白質的功能等同物還可以通過多種方式被鑒定出來,例如通過對本發(fā)明蛋白質的突變體例如截短突變體的組合(combinatorial)文庫針對脂肪分解酶活性進行篩選。在一種實施方式中,通過核酸水平上的組合誘變產(chǎn)生了變異體的雜色文庫(variegated library)。變異體的雜色文庫可以通過多種方式來產(chǎn)生,例如,通過用酶將合成的寡核苷酸混合物連接到基因序列上,使得一套可能是蛋白質的簡并序列可作為單個的多肽表達,或者,作為一套較大的融合蛋白表達(例如,用于噬菌體展示時)。有很多種方法可用于從簡并的寡核苷酸序列來生產(chǎn)可能是本發(fā)明多肽變異體的文庫。用于合成簡并寡核苷酸的方法在本領域中是已知的(見例如,Narang(1983)Tetrahedron 393;Itakura et al.(1984)Annu.Rev.Biochem.53323;Itakura et al.(1984)Science 1981056;Ike et al.(1983)Nucleic AcidRes.11477)。
另外,本發(fā)明多肽編碼序列的片段的文庫也可用于制造多肽的雜色群(population),以在隨后對變異體的選擇中進行篩選。例如,編碼序列片段的文庫可以通過如下方法來制造用核酸酶處理雙鏈PCR片段,所述片段是人們感興趣的編碼序列的,在所使用的處理條件下,對每個分子而言,切口(nick)僅出現(xiàn)大約一次;對所述雙鏈DNA進行變性;對所述DNA進行復性,以形成雙鏈DNA,所述雙鏈DNA可能包括來自不同切口產(chǎn)物的同義/反義對;通過S1核酸酶處理,從重新形成的雙鏈體中除去單鏈的部分;將得到的片段文庫與表達載體連接起來。通過此種方法,可以得到一種表達文庫,所述文庫編碼多種不同大小的N-末端片段及內部片段,所述片段是人們感興趣的蛋白質的。
本領域中已知的多種技術都可用于篩選組合文庫的基因產(chǎn)物及篩選cDNA文庫以得到具有選定屬性的基因產(chǎn)物,所述組合文庫是通過截短點突變來制造的。典型地,使用最廣泛的用于篩選大基因文庫并適用于高通量分析的技術包括將所述基因文庫克隆到可復制表達載體中;用得到的載體文庫去轉化合適的細胞;在一定條件下表達所述的組合基因,在所述表達條件下,針對人們想要的活性進行的探測,有助于分離出編碼其產(chǎn)物被探測到的基因的載體。遞歸總體誘變(recursive ensemble mutagenesis,REM)技術能增強功能突變體在文庫中出現(xiàn)的頻率,所述技術可與篩選試驗一起使用,以鑒定出本發(fā)明蛋白質的變異體(Arkin and Yourvan(1992)Proc.Natl.Acad.Sci.USA 897811-7815;Delgrave et al.(1993)ProteinEngineering 6(3)327-331)。
在給定的群中可能存在DNA序列多態(tài)性,這可能導致所述脂肪分解酶氨基酸序列的改變,這點對于本領域技術人員來說是顯而易見的。此類遺傳多態(tài)性可能由于天然的等位基因變異而存在于來自不同群的細胞中,或者存在于一個群中。等位基因變異體還可以包括功能等同物。
本發(fā)明多核苷酸的片段還可以包含不編碼功能多肽的多核苷酸。此類多核苷酸可以用作探針或用作PCR反應的引物。
對本發(fā)明的核酸而言,不管其編碼功能多肽或編碼非功能多肽,都可被用作雜交探針或聚合酶鏈式反應(PCR)的引物。不編碼具有脂肪分解酶活性的多肽的本發(fā)明的核酸分子的用途包括(1)從cDNA文庫中分離編碼脂肪分解酶蛋白質的基因,或其等位基因變異體,例如,來自其它生物而不是Aspergillus niger的cDNA文庫;(2)如Verma et al.,HumanChromosomesa Manual of Basic Techniques,Pergamon Press,New York(1988)所述,對中期染色體擴展(spreads)進行的原位雜交(例如FISH),以提供對脂肪分解酶基因的精確染色體定位;(3)Northern印跡分析,用于探測脂肪分解酶mRNA在特定組織和/或細胞中的表達;(4)可作為診斷工具使用的引物和探針,以分析能在給定的生物(例如組織)樣品中與所述脂肪分解酶探針雜交的核酸是否存在。
本發(fā)明中還包括一種方法,所述方法是用于獲得脂肪分解酶編碼基因或cDNA的功能等同物的。該方法需要獲得經(jīng)過標記的探針,所述探針包括經(jīng)過分離的核酸或其變異體,所述核酸編碼選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的序列的全部或一部分;用所述經(jīng)過標記的探針對核酸片段文庫進行篩選,其中,篩選是在允許探針與文庫中核酸片段雜交的條件下進行的,從而形成了核酸雙鏈體,并且由任何經(jīng)過標記的雙鏈體中的核酸片段制備出全長基因序列,以獲得與所述的脂肪分解酶相關的基因。
在一種實施方式中,本發(fā)明的核酸與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的核酸序列或其互補序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同源性。
在另一種優(yōu)選的實施方式中,本發(fā)明的多肽與選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同源性。
宿主細胞在另一種實施方式中,本發(fā)明描述了含有本發(fā)明中包括的核酸的細胞,例如經(jīng)過轉化的宿主細胞或重組的宿主細胞?!敖?jīng)過轉化的細胞”或“重組細胞”是通過重組DNA技術,向其中(或其祖代中)引入了本發(fā)明的核酸的細胞。原核細胞和真核細胞都被包括在內,例如,細菌、真菌、酵母等,特別優(yōu)選的是來自絲狀真菌的細胞,特別是Aspergillusniger。
可以對宿主細胞加以選擇,選出能調節(jié)插入序列表達的宿主細胞或能以特異性的、令人期待的方式對基因產(chǎn)物進行修飾或加工的宿主細胞。此類對蛋白質產(chǎn)物的修飾(例如糖基化)和加工(例如切割)可以促進蛋白質的機能最優(yōu)化。
多種宿主細胞都具有特征性的及特異性的機制,所述機制用于對蛋白質及基因產(chǎn)物的翻譯后加工和修飾。可以選出分子生物學和/或微生物學領域的技術人員熟悉的合適的細胞系或宿主系統(tǒng),以確保對所表達的外源蛋白質的修飾和加工是令人期望的及正確的。為達成此目標,可以使用具有胞內加工系統(tǒng)的真核宿主細胞,所述加工系統(tǒng)用于對初級轉錄物的正確加工、對基因產(chǎn)物的糖基化和磷酸化。此類宿主細胞是本領域中公知的。
宿主細胞還包括但不限于哺乳動物細胞系,例如CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38和脈絡叢細胞系。
如果需要的話,可通過穩(wěn)定轉染的細胞系來生產(chǎn)本發(fā)明的多肽。大量適于對哺乳動物細胞進行穩(wěn)定轉染的載體公眾都可獲得,構建此類細胞系的方法也為公眾所已知,例如在(前述的)Ausubel et al.中。
抗體本發(fā)明進一步地描述了抗體,例如單克隆抗體或多克隆抗體,所述抗體與本發(fā)明的脂肪分解酶蛋白特異性地結合。
在本文中使用的術語“抗體(Ab)”或“單克隆抗體(Mab)”的意義中包括完整的分子及抗體片段(例如,F(xiàn)ab和F(ab’)2片段),所述片段能與脂肪分解酶蛋白質特異性地結合。Fab和F(ab’)2片段缺少完整抗體的Fc片段,較之完整抗體,其能更迅速地從循環(huán)中被清除,并且可能具有更少的非特異性組織結合(Wahl et al.,J.Nucl.Med.24316-325(1983))。因此,上述片段是優(yōu)選的。
可通過若干方法中的任何一種來制備本發(fā)明的抗體。例如,可將表達脂肪分解酶蛋白質或其抗原片段的細胞施用給動物,以誘導含有多克隆抗體的血清的產(chǎn)生。在一種優(yōu)選方法中,制備出脂肪分解酶蛋白質制劑,并對其進行純化,以使其基本沒有天然的污染物。再將該制劑引入到動物中,以產(chǎn)生具有更強的特異活性的多克隆抗血清。
在最優(yōu)選的方法中,本發(fā)明的抗體是單克隆抗體(或其脂肪分解酶蛋白結合片段)??梢杂秒s交瘤技術(Kohler et al.,Nature 256495(1975);Kohler et al.,Eur.J.Immunol.6511(1976);Hammerling et al.,InMonoclonalAntibodies and T-Cell Hybridomas,Elsevier,N.Y.,pp.563-681(1981))來制備此類單克隆抗體。一般而言,此類工序涉及對動物(優(yōu)選為小鼠)進行免疫,其中使用脂肪分解酶蛋白質抗原或使用表達脂肪分解酶蛋白質的細胞。提取出所述小鼠的脾細胞,將其與合適的骨髓瘤細胞系融合。根據(jù)本發(fā)明,可以采用任何合適的骨髓瘤細胞。然而,優(yōu)選采用親本骨髓瘤細胞系(SP2O),所述細胞系可從American Type Culture Collection,Rockville,Maryland獲得。融合之后,將得到的雜交瘤細胞于HAT培養(yǎng)基上進行進行選擇性培養(yǎng),再通過由Wands et al.(Gastro-enterology 80225-232(1981))所述的極限稀釋法(limiting dilution)進行克隆。通過此種選擇方法獲得的雜交瘤細胞再被用于試驗,以鑒定出分泌能與所述脂肪分解酶蛋白質抗原相結合的抗體的克隆。一般而言,如前述的Ausubel et al.所述,所述多肽可被連結到載體蛋白例如KLH上,與佐劑混合,并向宿主哺乳動物中注射。
具體而言,可以通過注射感興趣的多肽來對多種宿主動物進行免疫。合適的宿主動物的例子包括兔子、小鼠、豚鼠和大鼠。根據(jù)宿主動物的不同,多種佐劑可被用于增強免疫反應,其包括但不限于Freund’s(完全及不完全)佐劑,礦物膠例如氫氧化鋁,表面活性物質例如溶血卵磷脂,多聚醇(pluronic polyols),聚陰離子,肽,油乳化劑,匙孔血藍蛋白(keyhole limpet hemocyanin),二硝基苯酚,卡介苗(bacille Calmette-Guerin,BCG)和Corynebacterium parvum。多克隆抗體是從免疫動物血清中獲得的抗體分子的異源群。
此類抗體可以屬于任何的免疫球蛋白類型,所述類型包括lgG、lgM、lgE、lgA、lgD及其亞類。生產(chǎn)本發(fā)明mAb的雜交瘤可在體外或體內培養(yǎng)。
多克隆抗體或單克隆抗體被生產(chǎn)出來之后,就被用來進行免疫測定試驗,所述試驗針對所述抗體對本發(fā)明蛋白質或其功能等同物的特異性識別,所述免疫測定例如是Western印跡分析或使用標準技術進行的免疫沉淀分析,所述技術例如是前述的Ausubel et al.中所述的。與本發(fā)明蛋白質或其功能等同物特異性結合的抗體在本發(fā)明中是有用的。例如,此類抗體可被用于免疫測定,以在Aspergillus的致病株或非致病株中(例如Aspergillus提取物中)探測本發(fā)明的蛋白質。
優(yōu)選地,用本發(fā)明蛋白質的片段來生產(chǎn)本發(fā)明的抗體,所述片段是看上去可能具有抗原性,辨別標準是例如帶電荷殘基出現(xiàn)的高頻率。例如,可以通過標準的PCR技術來產(chǎn)生此類片段,再將此類片段克隆到pGEX表達載體中(前述的Ausubel et al.)。然后可以在E.coli中表達融合蛋白,并用谷胱甘肽瓊脂糖親和矩陣對其進行純化,參見前述的Ausubel et al.所述。如果需要的話,對每種蛋白質可以制造多種(兩種或三種)融合蛋白,每種融合蛋白可以被注射到至少兩只兔子中去。可以通過一系列的注射來提高抗血清,典型地,所述一系列注射中包括至少三次強化注射(booster injection)。典型地,對所述抗血清進行檢查,所述檢查針對所述抗血清對本發(fā)明的蛋白質或其功能等同物的免疫沉淀能力,而無關蛋白質可被用作免疫反應特異性的對照。
或者,為生產(chǎn)單鏈抗體而描述的技術(U.S.Patent 4,946,778及U.S.Patent 4,704,692)可被進行改動以適應于生產(chǎn)針對本發(fā)明蛋白質或其功能等同物的單鏈抗體。用于生產(chǎn)和篩選噬菌體展示文庫的試劑盒可以通過商業(yè)方法獲得,例如從Pharmacia獲得。
另外,例如從U.S.Patent No.5,223,409;PCT Publication No.WO92/18619;PCT Publication No.WO 91/17271;PCT Publication No.WO 20791;PCT Publication No.WO 92/20791;PCT Publication No.WO 92/15679;PCTPublication No.WO 93/01288;PCT Publication No.WO 92/01047;PCTPublication No.WO 92/09690;PCT Publication No.WO 90/02809;Fuchs et al.(1991)Bio/Technology 91370-1372;Hay et al.(1992)Hum.Antibod.Hybridomas 381-85;Huse et al.(1989)Science 246;1275-1281;Griffiths et al.(1993)EMBO J.12725-734中可以找到特別適用于生產(chǎn)及篩選抗體展示文庫的方法及試劑的例子。
可對與本發(fā)明蛋白質或其功能等同物特異性結合的多克隆抗體及單克隆抗體加以使用,例如,用來探測編碼本發(fā)明蛋白質或其功能等同物的基因的表達,例如,在Aspergillus另一種菌株中的表達。例如,對Aspergillus的細胞或提取物進行傳統(tǒng)的免疫測定,可以很容易地對本發(fā)明的蛋白質進行探測。合適的測定的例子包括但不限于Western印跡、ELISA、放射性免疫測定等。
“與……特異性結合”是指抗體能對特定的抗原,例如本發(fā)明的蛋白質,加以識別并與之結合,但所述的抗體卻基本不識別樣品中其它無關分子,也不與所述無關分子結合。
可以對抗體加以純化,例如,通過親和層析的方法,其中,所述多肽抗原被固定到樹脂上。
針對本發(fā)明多肽的抗體(例如,單克隆抗體)可被用于分離所述的多肽,所述分離通過標準技術來進行,例如親和層析或免疫沉淀。此外,此抗體可被用于(例如,在細胞溶菌物或細胞上清液中)探測所述的蛋白質,以對該多肽的表達豐度和表達模式做出評價。所述的抗體還可被用于診斷方面,以作為臨床檢測程序的一部分,監(jiān)測細胞或組織中的蛋白質水平,例如,用于確定特定治療方法的療效或用于對曲霉病(Aspergillosis)的診斷。
通過將所述抗體連結到可被探測的物質上可以有助于探測的進行??杀惶綔y的物質的例子包括若干種酶、輔基、熒光材料、發(fā)光材料、生物發(fā)光材料和放射性材料。合適的酶的例子包括辣根過氧化酶、堿性磷酸酶、β-半乳糖苷酶或乙酰膽堿酯酶;合適的熒光材料的例子包括傘形酮(umbelliferone)、熒光素(fluorescein)、異硫氰酸熒光素、羅丹明(rhodamine)、二氯三嗪基胺(dichlorotriazinylamine)熒光素、丹磺酰氯或藻紅素;發(fā)光材料的例子包括魯米諾(luminol);生物發(fā)光材料的例子包括蟲螢光素酶、蟲螢光素(luciferin)和水母發(fā)光蛋白;合適的放射性材料的例子包括125I、131I、35S或3H。
抗原肽中包括的優(yōu)選的表位是處于該蛋白質表面上的區(qū)域,例如親水區(qū)域。本發(fā)明蛋白質的疏水小區(qū)域(plot)可被用于鑒定親水區(qū)域。
本發(fā)明蛋白質的抗原肽包含至少7個(優(yōu)選為10個、15個、20個或30個)連續(xù)的氨基酸殘基,所述殘基是選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列的;所述抗原肽還包括該蛋白質的表位,從而針對所述肽而產(chǎn)生的抗體能與該蛋白質形成特異性的免疫復合物。
所述的抗原肽所包括的優(yōu)選的表位是處于本發(fā)明蛋白質表面上的區(qū)域,例如,親水區(qū)域、疏水區(qū)域、alpha區(qū)域、beta區(qū)域、卷曲區(qū)域、轉角區(qū)域和柔韌區(qū)域。
免疫檢測可以使用本領域內任何已知的方法來對生物樣品中的本發(fā)明多肽進行定性和定量測定?;诳贵w的技術為檢測生物樣品中特定多肽的水平提供了特別的好處。
其中,所述的初級(單克隆或多克隆)抗體提供了特異性識別,但二級探測系統(tǒng)可以利用熒光、酶或其它經(jīng)過結合的二級抗體。由此獲得了免疫復合物。
因此,本發(fā)明提供了一種診斷方法,用于診斷特定生物是否被Aspergillus感染,所述方法包括如下步驟●從所述疑似被Aspergillus感染的生物中分離出生物樣品;●將所述的生物樣品與本發(fā)明的抗體進行反應;●檢測免疫復合物是否形成。
組織也可以被提取出來,用于釋放蛋白質以進行Western-印跡試驗或斑點印跡(dot/slot)試驗,所述提取例如是使用尿素和中性去垢劑來進行的。上述技術也可用于體液。
其它適用于探測本發(fā)明蛋白質的基于抗體的方法包括免疫測定,例如酶聯(lián)免疫吸附測定(ELISA)和放射性免疫測定(radioimmunoassay,RIA)。例如,針對本發(fā)明蛋白質的單克隆抗體既可被用作免疫吸附劑又可被用作酶標記探針,以對本發(fā)明的蛋白質進行探測及定量。使用線性衰退計算機算法,參照標準制劑中的蛋白質的量,可計算出樣品中存在的蛋白質的量。在另一種ELISA試驗中,可以使用兩種完全不同的特異性單克隆抗體來在生物液中探測本發(fā)明的蛋白質。在該試驗中,一種抗體被用作免疫吸附劑,另一種被用作酶標記探針。
上述技術基本可以“一步”試驗或“兩步”試驗來進行?!耙徊健痹囼炆婕皩⒈景l(fā)明的蛋白質與固定的抗體相接觸,不經(jīng)洗滌,將所述混合物與經(jīng)過標記的抗體相接觸?!皟刹健痹囼炆婕霸趯⑺龌旌衔锱c經(jīng)過標記的抗體接觸前進行洗滌。使用其它傳統(tǒng)方法也可以是合適的。人們通常想要將所述實驗系統(tǒng)中的一種成分固定到支持物上,由此允許該系統(tǒng)中的其它成分與所述成分相接觸,而又不難將其它成分從所述樣品上移除。
合適的酶標記包括例如,來自于氧化酶那一類的,所述的酶可以通過與底物反應來催化過氧化氫的產(chǎn)生??梢酝ㄟ^測量過氧化氫的濃度來測定氧化酶標記的活性,所述過氧化氫是酶標記抗體/底物的反應產(chǎn)生的。
除了酶之外,其它合適的標記包括放射性同位素和熒光標記,所述放射性同位素例如是碘(125I、121I)、碳(14C)、硫(35S)、氚(3H)、銦(112In)和锝(99mTc),熒光標記例如是熒光素和羅丹明,以及生物素。
試驗化合物與本發(fā)明蛋白質的特異性結合可被探測出來,例如,通過將本發(fā)明蛋白質可逆或不可逆地固定到襯底上來進行體外探測,所述襯底例如是96孔聚苯乙烯微量滴定板的孔表面。用于固定多肽和其它小分子的方法是本領域公知的。例如,可以通過將本發(fā)明蛋白質的溶液(典型地,體積為1-100μl,濃度為0.05mg/ml至1mg/ml)加入到每個孔中,來將所述的微量滴定板包被上本發(fā)明的蛋白質,再將所述的板在室溫至37℃間保溫培養(yǎng)0.1至36小時??赏ㄟ^搖晃過量的溶液將未結合到板上的蛋白質從所述的板上除去,再用水或緩沖液對所述的板進行(一次或重復的)洗滌。典型地,所述的蛋白質被包含于水或緩沖液中。然后用緩沖液再對所述的板進行洗滌,所述緩沖液中沒有已結合的蛋白質。為封閉所述板上的游離蛋白質結合位點,用與被結合的蛋白質無關的蛋白質對所述的板進行封閉。例如,在Tris-HCl中濃度為2mg/ml的體積為300μl的牛血清清蛋白(bovine serum albumin,BSA)是合適的。合適的襯底包括含有確定的交聯(lián)化學組成的襯底(例如,塑料襯底,例如聚苯乙烯襯底、苯乙烯襯底或聚丙烯襯底,所述襯底例如是來自Corning Costar Corp.(Cambridge,MA)的)。如果需要的話,珠狀微粒,例如珠狀瓊脂糖或珠狀瓊脂糖凝膠,可被用作襯底。
可通過若干種本領域已知的方法來對試驗化合物與本發(fā)明多肽的結合進行探測。例如,可在免疫測定中使用特異性抗體。如果需要的話,該抗體可被(例如,熒光或用放射性同位素)標記并被直接探測(例如,見West and McMahon,J.Cell Biol.74264,1977)?;蛘?,二級抗體可被用于探測(例如,經(jīng)過標記的抗體,所述經(jīng)過標記的抗體能與抗AN97抗體的Fc部分結合)。在另外一種探測方法中,對本發(fā)明的蛋白質進行標記,并對該標記進行探測(例如,通過用放射性同位素、熒光團、發(fā)色團等來標記本發(fā)明的蛋白質)。在又一種方法中,本發(fā)明的蛋白質被作為融合蛋白來生產(chǎn),其中,本發(fā)明的蛋白質與能通過光學手段檢測到的蛋白質,例如(可在UV光下被探測到的)綠色熒光蛋白,融合。在再一種方法中,本發(fā)明的蛋白質可以與酶融合或共價結合,所述的酶具有可被探測到的酶活,所述的酶例如是辣根過氧化酶、堿性磷酸酶、alpha-半乳糖苷酶或葡糖氧化酶。編碼上述所有酶的基因都已被克隆出來了,對本領域的技術人員而言,所述基因是不難獲得的。如果需要的話,所述的融合蛋白可以包括抗原,采用傳統(tǒng)方法,可使用多克隆抗體或單克隆抗體對此抗原進行探測及測量。合適的抗原包括非酶性多肽(例如,血清蛋白和乳蛋白,所述血清蛋白例如是BSA和球蛋白,所述乳蛋白例如是酪蛋白)和酶(例如,辣根過氧化酶、堿性磷酸酶和alpha-半乳糖苷酶)。
表位、抗原和免疫原在另一個方面,本發(fā)明提供了一種肽或多肽,所述肽或多肽包含本發(fā)明多肽的具有表位的部分。該多肽部分的表位是本發(fā)明多肽的免疫原表位或抗原表位?!懊庖咴砦弧北欢x為蛋白質的一部分,當整個蛋白質是免疫原時,所述的部分會誘發(fā)抗體應答。人們相信,上述免疫原表位僅限于所述分子上的一些位點。另一方面,對蛋白質分子而言,其能與抗體結合的區(qū)域被定義為“抗原表位”。對蛋白質而言,其免疫原表位的數(shù)量通常要少于抗原表位的數(shù)量。例如,見Geysen,H.M.et al.,Proc.Natl.Acad.Sci.USA 813998-4002(1984)。
對具有抗原表位的肽或多肽(也就是說,含有能與抗體結合的蛋白質分子區(qū)域)的選擇而言,本領域中公知對蛋白質序列的一部分進行模擬(mimic)的相對較短的合成肽通常能誘導抗血清的產(chǎn)生,所述抗血清是抗部分被模擬的蛋白質的。例如,見Sutcliffe,J.G.et al.,Science 219660-666(1984)。能誘導抗蛋白質血清產(chǎn)生的肽,往往在蛋白質的一級序列中就有所體現(xiàn),通過一組簡單的化學規(guī)則就可以將其鑒別出來,所述的肽既不限于完整蛋白質的免疫優(yōu)勢(immunodominant)區(qū)域(即免疫原表位),也不限于氨基末端或羧基末端。極度疏水的肽和具有六個或少于六個殘基的肽,通常對誘導與被模擬蛋白質結合的抗體來說是無效的;更長的可溶的肽,尤其是那些含有脯氨酸殘基的,通常是有效的。參見前述的Sutcliffe et al.,在第661頁。例如,根據(jù)上述方針設計了20個肽,所述的肽含有8-39個殘基,覆蓋了流感病毒血凝素HA1多肽鏈序列的75%,這20個肽中,有18個誘導了抗HA1蛋白質或抗完整病毒的抗體;來自MuLV聚合酶的12個肽以及來自狂犬病糖蛋白的18個肽全都誘導了抗體的產(chǎn)生,所述抗體會沉淀相應的蛋白質。
本發(fā)明中,具有抗原表位的肽和多肽因此可用于產(chǎn)生抗體,包括與本發(fā)明多肽特異性結合的單克隆抗體。因此,通過與來自供體的脾細胞相融合并用具有抗原表位的肽進行免疫而獲得的雜交瘤中,有很大一部分通常都會分泌抗原始蛋白的抗體。見前述的Sutcliffe et al.,第663頁。由具有抗原表位的肽或多肽產(chǎn)生的抗體對于探測被模擬的蛋白質是有用的,并且,針對不同肽的抗體可被用于追蹤蛋白質前體上的若干將經(jīng)歷翻譯后加工的區(qū)域的命運。所述的肽和抗肽抗體可被用于一系列針對被模擬蛋白質的定性或定量試驗,例如,可用于競爭性試驗,因為已經(jīng)顯示在免疫沉淀試驗中,更短的肽(例如,大約9個氨基酸)能結合及取代較大的肽。例如,見Wilson I.A.et al.,Cell 37767-778 at 777(1984)。本發(fā)明的抗肽抗體還可用于純化被模擬的蛋白質,例如,用本領域公知的方法通過吸附層析來純化。
根據(jù)上述方針設計出的本發(fā)明的具有抗原表位的肽及多肽優(yōu)選含有本發(fā)明多肽的氨基酸序列中的至少七個氨基酸,更優(yōu)選為至少九個氨基酸,最優(yōu)選為大約15個至大約30個之間的氨基酸。然而,包含本發(fā)明多肽氨基酸序列中更長部分的肽或多肽也被認為是本發(fā)明的具有表位的肽或多肽,并且也可被用于誘導抗被模擬蛋白質的抗體,所述包含更長部分的肽或多肽含有30個至50個氨基酸,或者包含任何長度的氨基酸,所述長度可達本發(fā)明多肽的整個氨基酸序列的長度或包括了本發(fā)明多肽的整個氨基酸序列。優(yōu)選地,對具有表位的肽的氨基酸序列加以選擇,選出在水性溶劑中能充分溶解的那些(即所述的序列包括相對親水的殘基,而優(yōu)選不用高度疏水的序列);含有脯氨酸殘基的序列是特別優(yōu)選的。
可用任何傳統(tǒng)的制造肽或多肽的手段來生產(chǎn)本發(fā)明的具有表位的肽和多肽,所述手段包括用本發(fā)明的核酸分子來進行重組的手段。例如,在重組生產(chǎn)及純化期間,以及在免疫以產(chǎn)生抗肽抗體期間,可以將較短的具有表位的氨基酸序列與作為載體的較大多肽融合。
還可以用已知的化學合成方法來合成具有表位的肽。例如,Houghten描述了一種用于合成較大數(shù)量的肽的簡單方法,例如10-20mg的248個具有13個殘基的不同的肽,其代表了HA1多肽片斷的單氨基酸變異體,它們在少于四周之內被制備和鑒定(通過ELISA類型的結合研究)出來。Houghten,R.A.,Proc.Natl.Acad.Sci.USA 825131-5135(1985)。在Houghten et al.的U.S.Patent No.4,631,211(1986)中,對這種“同時進行的多種肽的合成(Simultaneous Multiple Peptide Synthesis,SMPS)”方法還有進一步的描述。在此工序中,用于對若干種肽進行固相合成的多個單獨的樹脂被分別包含于可透過溶劑的多個小包裝中,從而能夠以最理想的方式使用固相方法中涉及到的很多相同的重復步驟。
完全手工的工序允許500-1000或更多的合成同時開展。見前述的Houghten et al.,第5134頁。
根據(jù)本領域公知的方法,可用本發(fā)明的具有表位的肽和多肽來誘導抗體。例如,見前述的Sutcliffe et al.;前述的Wilson et al.;Chow,M.et al.,Proc.Natl.Acad.Sci.USA 82910-914;和Bittle,F(xiàn).J.et al.,J.Gen.Virol.662347-2354(1985)。
通常,可用游離肽對動物進行免疫;然而,通過將所述的肽與高分子載體連結,可以提高抗肽抗體的效價,所述高分子載體例如是匙孔血藍蛋白(keyhole limpet hemocyanin,KLH)或破傷風類毒素。例如,可用馬來酰亞胺苯酰基-N-羥基琥珀酰亞胺酯(maleimidobenzoyl-N-hydroxysuccinmide ester,MBS)等接頭,將含有半胱氨酸的肽與載體連結,而對其它肽與載體的連結而言,可以使用更一般的連接劑,例如戊二醛。
可用游離肽或與載體連結的肽來對動物進行免疫,例如,通過用乳化劑進行腹膜內注射和/或皮內注射來免疫,所述乳化劑含有約100μg的肽或載體蛋白質以及Freund’s佐劑,所述動物例如是兔子、大鼠和小鼠??赡苄枰啻螐娀⑸?,以提供抗肽抗體的有用效價,所述強化注射例如是時間間隔為大約兩周的,所述抗肽抗體的有用效價可通過例如ELISA試驗來檢測,其中,使用了被吸附到固體表面上的游離肽??赏ㄟ^對抗肽抗體加以選擇來提高被免疫動物血清中的抗肽抗體的效價,例如,通過吸附到固體支持物上的蛋白質上并按照本領域公知的方法對被選出的抗體進行洗脫來進行。
按照本領域中已知的方法,可鑒別出本發(fā)明中的具有免疫原表位的肽,即當整個蛋白質是免疫原時,蛋白質上能誘導抗體應答產(chǎn)生的那些部分。例如,前述的Geysen et al.,1984公開了一種工序,用于在固體支持物上快速地同時合成數(shù)百個肽,所述的肽足夠純凈,能夠在酶聯(lián)免疫吸附測定中進行反應。然后可以很容易地探測到合成肽與抗體之間的相互作用,而不用將其從支持物上移走。用此種途徑,本領域普通技術人員通過常規(guī)手段就可以鑒定出具有目標蛋白質免疫原表位的肽。例如,Geysen etal.對口蹄疫病毒外殼蛋白的免疫重要性表位進行了定位,將其確定為七個氨基酸,所述定位是通過合成包括全部208個可能的六肽在內的重疊系列來進行的,覆蓋了該蛋白質的整個氨基酸序列,所述序列有213個氨基酸。然后,合成出了一套完整的替換多肽,其中,針對所述表位內部的每個位置,進行了全部20個氨基酸的依次替換,賦予與抗體反應特異性的特定氨基酸就被確定出來了。因此,可以用該方法來制造本發(fā)明的具有表位的肽的類似物。Geysen的U.S.Patent No.4,708,781(1987)中還進一步地描述了這種用來鑒定具有目標蛋白質免疫原表位的肽的方法。
更進一步地,Geysen的U.S.Patent No.5,194,392(1990)中,描述了一種用于探測或確定單體(氨基酸或其它化合物)序列的一般方法,所述序列是所述表位的拓撲等同物(即模擬型(mimitope)),所述等同物與感興趣的抗體上的特定的抗體互補位(paratope)(抗原結合部位)互補。更一般地,Geysen的U.S.Patent No.4,433,092(1989)中,描述了一種探測或確定單體序列的方法,所述序列是一種配體的拓撲圖像(topographical)等同物,所述等同物與感興趣的特定受體上的配體結合位點互補。類似地,Houghten,R.A.et al.的關于“過烷基化的寡肽混合物(Peralkylated Oligopeptide Mixtures)”的U.S.Patent No.5,480,971(1996)中,公開了線性的C1-C7-烷基的過烷基化(peralkylated)寡肽以及此類肽的組和文庫,還公開了一種方法,用于使用此類寡肽的組和文庫來確定優(yōu)先與感興趣的接納體(acceptor)分子結合的過烷基化寡肽的序列。因此,也可以通過常規(guī)手段用上述方法來制備本發(fā)明的具有表位的肽的非肽類似物。
脂肪分解酶在工業(yè)過程中的用途本發(fā)明還涉及本發(fā)明的脂肪分解酶在若干經(jīng)過選擇的工業(yè)過程中的用途。盡管人們長期以來從上述過程中獲得了一些經(jīng)驗,但較之目前使用的酶,本發(fā)明的脂肪分解酶則展示了許多顯著的優(yōu)點。取決于特定的應用,上述優(yōu)點可以包括以下方面例如,更低的生產(chǎn)成本、更高的針對底物的特異性、更少的抗原性、更少的不想要的副作用、當用合適的微生物生產(chǎn)時的更高的產(chǎn)量、更合適的pH及溫度范圍、更好的最終產(chǎn)品的口味以及食物級別和潔凈衛(wèi)生的方面。
本發(fā)明還涉及用于制備面團或烘焙產(chǎn)品的方法,所述方法包括將有效數(shù)量的本發(fā)明的脂肪分解酶合并到面團中去,從上述面團獲得的面團或烘焙產(chǎn)品,較之未將所述多肽合并進去的面團或烘焙產(chǎn)品,一種或多種屬性都有了改善。
在本文中把“將……合并到面團中去”這個短語定義為將本發(fā)明的脂肪分解酶加入到面團中,加入到用來制成面團的任何成分中和/或加入到用來制成面團的面團成分的任何混合物中去。換句話說,本發(fā)明的脂肪分解酶可在面團制備過程中的任何一個步驟被加入,本發(fā)明的脂肪分解酶也可以在一個、兩個或多個步驟中被加入??梢詫⒈景l(fā)明的脂肪分解酶加入到面團成分中去,用本領域內公知的方法,對所述面團進行揉捏及烘焙,以制出烘焙產(chǎn)品。例如,見U.S.Patent No.4,567,046,EP-A-426,211,JP-A-60-78529,JP-A-62-111629和JP-A-63-258528。
術語“有效數(shù)量”在本文中被定義為一定量的本發(fā)明的脂肪分解酶,所述數(shù)量足以提供關于人們感興趣的至少一種屬性的可測量出來的效果,所述屬性是所述面團和/或烘焙產(chǎn)品的。
術語“經(jīng)過改善的屬性”在本文中定義為面團和/或從該面團獲得的產(chǎn)品,特別是烘焙產(chǎn)品的任何屬性,較之本發(fā)明的脂肪分解酶未被合并進去的面團或產(chǎn)品而言,所述屬性被本發(fā)明的脂肪分解酶的作用改善了。所述經(jīng)過改善的屬性包括但不限于增加的面團強度、增加的面團彈性、增加的面團穩(wěn)定性、降低的面團粘性、經(jīng)過改善的面團延展性、經(jīng)過改善的烘焙產(chǎn)品的香味、經(jīng)過改善的烘焙產(chǎn)品的保鮮性。
可以通過對制備中加入了本發(fā)明多肽的和制備中未加入本發(fā)明多肽的面團和/或烘焙產(chǎn)品進行比較,來確定出經(jīng)過改善的屬性,可以按照后面的實施例中所描述的本發(fā)明的方法來進行。對與感官相關品質的評估,可以通過使用已在烘焙工業(yè)中完善建立的工序來進行,其中可以包括,例如,利用一組受過專門訓練的品嘗試驗師。
術語“增加的面團強度”在本文中被定義為一種面團的屬性,所述面團通常具有更具彈性的屬性,和/或需要更多關于成型和造型的工作。
術語“增加的面團彈性”在本文中被定義為一種面團的屬性,所述面團在經(jīng)受一定的物理張力之后,更容易恢復其原有的形狀。
術語“增加的面團穩(wěn)定性”在本文中被定義為一種面團的屬性,所述面團更不容易受機械破壞影響,因此能更好地保持其形狀和體積。
術語“降低的面團粘性”在本文中被定義為一種面團的屬性,所述面團更不容易粘附到例如面團生產(chǎn)機器的表面上;可以由熟練的試驗烘焙師對所述屬性進行經(jīng)驗性地評估,或者可以通過使用本領域內已知的品質分析儀(texture analyser,例如TAXT2)來對其進行測量。
術語“經(jīng)過改善的面團延展性”在本文中被定義為一種面團的屬性,所述面團能經(jīng)受更多的張力或拉伸,而不會斷裂開。
術語“經(jīng)過改善的面團可加工性”在本文中被定義為一種面團的屬性,所述面團通常更少粘性和/或更為堅硬和/或更具彈性。
術語“增加的烘焙產(chǎn)品體積”是通過測定給定的面包塊的比體積(體積/質量)來測出的,典型地,通過傳統(tǒng)的油菜籽排水量(rapeseeddisplacement)法來對所述比體積進行測定。
術語“經(jīng)過改善的烘焙產(chǎn)品碎屑結構”在本文中被定義為一種烘焙產(chǎn)品的屬性,所述烘焙產(chǎn)品碎屑中小室的壁更纖小和/或更薄,和/或所述小室在碎屑中的分布更為一致/均勻;通常由熟練的試驗烘焙師來進行經(jīng)驗性的評估。
術語“經(jīng)過改善的烘焙產(chǎn)品柔軟度”是“堅硬度”的反義詞,其在本文中被定義為一種烘焙產(chǎn)品的屬性,所述烘焙產(chǎn)品更容易被壓縮;可以由熟練的試驗烘焙師對所述屬性進行經(jīng)驗性地評估,或者可以通過使用本領域內已知的品質分析儀(例如TAXT2)來對其進行測量。
術語“經(jīng)過改善的烘焙產(chǎn)品香味”由受過專門訓練的試驗小組來評估。
術語“經(jīng)過改善的烘焙產(chǎn)品保鮮性(anti-staling)”在本文中被定義為一種烘焙產(chǎn)品的屬性,所述烘焙產(chǎn)品在貯藏期間的質量參數(shù)劣化速率變慢,所述參數(shù)例如是柔軟度和/或彈性。
術語“面團”在本文中被定義為面粉和其它成分的混合物,所述混合物足夠堅硬,能被揉捏或被卷起來。所述面團可以是新鮮的、冷凍過的、預先暴露的或預先烘焙過的。在Frozen and Refrigerated Doughs and Batters中,Kulp和Lorenz對冷凍過的面團的制備進行了描述。
術語“烘焙產(chǎn)品”在本文中被定義為從面團制得的任何產(chǎn)品,所述產(chǎn)品具有柔軟特征或具有酥脆特征??赏ㄟ^本發(fā)明有好處地生產(chǎn)出的烘焙產(chǎn)品,無論是白色、淺色或深色類型的,其例子是面包(特別是白面包、全麥面包或黑麥面包),典型地,是如下形式的塊或卷、法棍類型的面包、意大利面、皮塔(pita)面包、玉米粉圓餅(tortillas)、墨西哥玉米卷(taco)、蛋糕、班戟(pancake)、餅干、曲奇餅、餡餅皮(piecrust)、饅頭和脆面包等。
本發(fā)明的方法中用到的本發(fā)明的脂肪分解酶和/或另外的酶可以是任何適合于本文中討論的用途的形式,例如干粉、團塊狀粉末、顆粒特別是沒有撒上粉末的(non-dusting)顆粒、液體特別是穩(wěn)定液體、或如WO01/11974及WO02/26044中所述的受到保護的酶。顆粒和成團塊的粉末可以通過傳統(tǒng)方法來制備,例如,通過在流床制粒機(fluid-bedgranulator)中將本發(fā)明的脂肪分解酶噴到載體上來制備。所述的載體可以由微粒狀核心構成,所述核心具有合適的顆粒大小。所述載體可以是可溶的或者是不可溶的,例如,鹽(例如NaCl或硫酸鈉)、糖(例如蔗糖或乳糖)、糖醇(例如山梨糖醇)、淀粉、米、玉米渣或大豆。本發(fā)明的脂肪分解酶和/或另外的酶可以被包含于緩釋制劑中。用于制備緩釋制劑的方法在本領域中是公知的。根據(jù)現(xiàn)有方法添加營養(yǎng)學上可接受的穩(wěn)定劑能對液體酶制劑加以穩(wěn)定,所述穩(wěn)定劑例如是糖、糖醇或其他多羥基化合物和/或乳酸或其它有機酸。
本發(fā)明的脂肪分解酶還可以被合并到含有酵母的組合物中,所述組合物例如是EP-A-0619947、EP-A-0659344和WO02/49441中所公布的。
對于向面粉預混合物中添加而言,本發(fā)明多肽以干燥產(chǎn)品的形式存在是有好處的,所述干燥產(chǎn)品例如是未撒上粉末的顆粒;而對于與液體一起添加而言,本發(fā)明多肽以液體形式存在是有好處的。
面團中可以被合并進一種或多種另外的酶。所述的另外的酶可以是任何來源的,包括哺乳動物和植物,優(yōu)選是微生物(細菌、酵母或真菌)來源的,所述的酶可通過本領域中的常規(guī)技術來獲得。
在一種優(yōu)選的實施方式中,所述另外的酶可以是淀粉酶,例如alpha-淀粉酶(有利于提供可被酵母發(fā)酵的糖以及有利于延緩腐敗)或beta-淀粉酶,環(huán)糊精(cyclodextrin)葡聚糖轉移酶,肽酶,特別是外肽酶(有利于增加香味),谷氨酰胺轉移酶,脂肪酶(有利于對面團或面團成分中的脂肪加以修飾,以軟化所述的面團),磷脂酶,纖維素酶,半纖維素酶,特別是戊聚糖酶例如木聚糖酶(有利于對戊聚糖進行部分水解,以增加所述面團的延展性),蛋白酶(有利于弱化麩質,尤其是使用硬質小麥面粉的時候),蛋白質二硫化物異構酶,例如WO95/00636中公開的蛋白質二硫化物異構酶,糖基轉移酶,過氧化物酶(有利于改善所述面團的稠度(consistency)),漆酶或氧化酶,例如葡糖氧化酶、己糖氧化酶、醛糖氧化酶、吡喃糖氧化酶、脂肪氧化酶或L-氨基酸氧化酶(有利于改善面團稠度)。
當按照本發(fā)明的方法添加一種或多種另外的酶活性時,上述活性可以單獨添加或者與本發(fā)明的多肽一起添加,可選地,作為改善面包屬性的組合物的成分或改善面團屬性的組合物的成分添加。其它的酶活性可以是任何上述的酶,其劑量可以遵循現(xiàn)有的烘焙慣例。
本發(fā)明還涉及用于制備烘焙產(chǎn)品的方法,所述方法包括對通過本發(fā)明的方法獲得的面團進行烘焙,以生產(chǎn)出烘焙產(chǎn)品來??梢杂帽绢I域內公知的方法來進行對所述面團的烘焙,以生產(chǎn)出烘焙產(chǎn)品。
本發(fā)明還涉及分別通過本發(fā)明的方法生產(chǎn)出來的面團和烘焙產(chǎn)品。
本發(fā)明進一步地涉及預混合物,例如,以面粉組合物的形式存在的預混合物,所述預混合物用于面團和/或用面團制成的烘焙產(chǎn)品,其中,所述的預混合物包含本發(fā)明的多肽。術語“預混合物”在本文中被定義為其傳統(tǒng)意義,即作為烘焙試劑的混合物,通常包括面粉,所述預混合物不僅可用于工業(yè)化的面包烘焙機器/設備,其還可用于零售面包店。可以通過將本發(fā)明的多肽或改善面包屬性的組合物和/或改善面團屬性的組合物與合適的載體混合來制備得到所述的預混合物,所述組合物中包含所述的多肽,所述載體例如是面粉、淀粉、糖或鹽。所述預混合物可以包含其它改善面團屬性和/或改善面包屬性的添加劑,例如,任何的上述添加劑,包括酶。
本發(fā)明進一步地涉及以顆?;驁F塊狀粉末的形式存在的烘焙添加劑,所述添加劑中包含本發(fā)明的多肽。優(yōu)選地,所述添加劑顆粒大小分布很狹窄,超過95%的(以重量計)顆粒在25μm至500μm的范圍內。
在面團和面包的制造過程中,本發(fā)明可以和加工助劑聯(lián)合使用,所述加工助劑在前文中有所定義,其例如是化學加工助劑,例如氧化劑(例如抗壞血酸)、還原劑(例如L-半胱氨酸)、氧化還原酶(例如葡糖氧化酶)和/或其它的酶,例如多糖修飾酶(例如,α-淀粉酶、纖維素酶、分支酶等)和/或蛋白質修飾酶(內蛋白酶、外蛋白酶、分支酶等)。
實施例1Aspergillus niger的發(fā)酵通過如下方式獲得由本文中提供的核苷酸序列編碼的脂肪分解酶構建含有所述DNA序列的表達質粒,用該質粒去轉化A.niger菌株,以下述方法培養(yǎng)所述的Aspergillus niger菌株。
將A.niger的新鮮孢子(106-107)接種到20ml的CSL培養(yǎng)基中(帶擋板的100ml瓶中),在34℃和170rpm下培養(yǎng)20-24小時。將5-10ml的CSL預培養(yǎng)物接種到100ml的CSM培養(yǎng)基中(帶擋板的500ml瓶中),之后將所述菌株在34℃和170rpm下發(fā)酵3-5天。
通過在50ml的Greiner管中離心(30分鐘,5000rpm)來獲得不含細胞的上清液。在GF/A Whatman Glass微纖維過濾器(150mm AE)上對所述上清液進行預過濾,以移走較大的顆粒,用4N的KOH將pH調至5(如果必要的話),用0.2μm的(瓶在上)過濾器,在抽氣作用下進行無菌過濾,以去除真菌物質。將所述上清液貯存于4℃(或-20℃)。
所述的CSL培養(yǎng)基由如下物質構成(以每升中的量計)100g的Corn Steep Solids(Roquette)、1g的NaH2PO4·H2O、0.5g的MgSO4·7H2O、10g的葡萄糖·H2O和0.25g的Basildon(防沫劑)。將所述成分溶解于去礦質水中,用NaOH或H2SO4將pH調至5.8;向帶有擋板和泡沫球(foam ball)的100ml瓶中注入20ml發(fā)酵培養(yǎng)液,在120℃下滅菌20分鐘,冷卻至室溫后,向每只瓶中加入200μl含有5000IU/ml青霉素和5mg/ml鏈霉素的溶液。
所述的CSM培養(yǎng)基由如下物質構成(以每升中的量計)150g的麥芽糖·H2O、60g的Soytone(蛋白胨)、1g的NaH2PO4·H2O、15g的MgSO4·7H2O、0.08g的Tween 80、0.02g的Basildon(防沫劑)、20g的MES、1g的L-精氨酸。將所述成分溶解于去礦質水中,用NaOH或H2SO4將pH調至6.2;向帶有擋板和泡沫球的500ml瓶中注入100ml發(fā)酵培養(yǎng)液,在120℃下滅菌20分鐘,冷卻至室溫后,向每只瓶中加入1ml含有5000IU/ml青霉素和5mg/ml鏈霉素的溶液。
實施例2純化本發(fā)明的脂肪分解酶步驟1-制備超濾物對按照實施例1所獲得的培養(yǎng)物上清液進行超濾,以去除小分子的污染物,所述污染物會妨礙酶活測定和烘焙試驗。在Millipore Labscale TFF系統(tǒng)中對30ml上清液進行超濾,所述系統(tǒng)裝備有臨界值(cut-off)為10kDa的過濾器。
用100mM的冷磷酸緩沖液對所述樣品進行3-5次洗滌,這取決于樣品的顏色,所述緩沖液體積為40ml,pH 6.0,其中包括0.5mM的CaCl2。所述酶溶液的最終體積為30ml,在以后的實驗中將其稱為“超濾物”。
步驟2-通過A280和HPSEC來測定所述脂肪分解酶的濃度通過歸因于所述脂肪分解酶的280nm處的消光(A280)以及計算得到的所述脂肪分解酶的分子消光系數(shù),來計算出所述超濾物中脂肪分解酶的濃度。對A280的測量是用Uvikon XL Secomam分光光度計(Beun deRonde,Abcoude,The Netherlands)來進行的。
酶的分子消光系數(shù)可以通過每個酶分子所含的酪氨酸、色氨酸和半胱氨酸殘基的數(shù)目來計算(S.C.Gill and P.H.von Hippel,Anal.Biochem.182,319-326(1989))。所述氨基酸的分子消光系統(tǒng)分別為1280、5690和120M-1·cm-1。從選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的蛋白質序列可以推斷出本發(fā)明脂肪分解酶的酪氨酸、色氨酸和半胱氨酸殘基數(shù)目。表2中總結了計算出的本發(fā)明脂肪分解酶的消光系數(shù)。
表2
可歸于所述脂肪分解酶的所述超濾物在280nm的消光取決于酶樣品的純度。該純度可以用高效尺寸排阻色譜(High Performance SizeExclusion Chromatography,HPSEC)和TSK SW-XL柱(300*7,8mm;MW范圍為10-300kDa)來測定。洗脫緩沖液由25mM的磷酸鈉緩沖液構成,pH為6.0,在1ml/min流速下使用。注射入5-100μl的樣品。測量280nm處的吸收。
可歸于本發(fā)明脂肪分解酶的超濾物A280是從色譜中各個脂肪分解酶在280nm處吸收峰的峰表面(surface)與280nm處吸收峰的總表面之比來獲得的。然后通過將超濾物的A280與上述比率相乘,再除以針對每個脂肪分解酶計算得到的消光系數(shù)(1mg/ml溶液-表2中最右邊一列),來計算出所述脂肪分解酶在超濾物中的濃度。
實施例3活性測量用實施例1中獲得的無細胞上清液進行表3中所總結的脂肪酶檢測、磷脂酶檢測和半乳糖脂酶檢測。
表3按照實施例1制備的無細胞上清液中的脂肪分解酶活性
0=與空白沒有不同;+/++/+++=比空白要高;用2,3-巰基-1-丙醇三丁酸(2,3-mercapto-1-propanol-tributyrate,TBDMP)作為底物,對脂肪酶活性進行分光光度測定。脂肪酶會水解TBDMP的硫鍵從而釋放出硫丁酸,所述硫丁酸隨后再與4,4-二硫雙吡啶(4,4-dithiodipyridine,DTDP)反應形成4-硫吡啶。后者是4-巰基吡啶的互變異構平衡體,其吸收334nm的光。所述反應在0.1M的乙酸緩沖液中于37℃下進行,所述緩沖液pH為5.0,其中含有0.2%的Triton-X100、0.65mM的TBDMP和0.2mM的DTDP。一個脂肪酶單位被定義為在上述反應條件下每分鐘釋放出1微摩爾4-硫丁酸的酶的量。
用1,2-二硫二辛酰磷脂酰膽堿(1,2-dithiodioctanoyl-phosphatidylcholine)作為底物,對磷脂酶A進行分光光度測定。磷脂酶A會水解1號位(PLA1)或2號位(PLA2)的硫鍵,從而釋放出4-硫辛酸,所述4-硫辛酸隨后與4,4’-二硫吡啶反應,形成4-硫吡啶。后者是4-巰基吡啶的互變異構平衡體,其吸收334nm處的光。所述反應在0.1M的乙酸緩沖液中于37℃下進行,所述緩沖液pH為4.0,其中含有0.2%的Triton-X100、0.65mM的底物和0.2mM的DTDP。一個磷脂酶A單位(phospholipase Aunit,PLA)被定義為在上述反應條件下每分鐘釋放出1微摩爾4-硫辛酸的酶的量。
用溶血磷脂酰膽堿作為底物,用31P-NMR分光法來測定溶血磷脂酶活性。溶血磷脂酶會水解酯鍵從而將脂肪酸從甘油部分中釋放。用NMR來定量就此形成的甘油磷酸膽堿。所述反應在50mM的乙酸緩沖液中于55℃下進行30分鐘,所述緩沖液pH為4.5,其中還含有1mg/ml的溶血磷脂酰膽堿和5mM的CaCl2。一個溶血磷脂酶單位(lysophospholipaseunit,LPC)被定義為在上述反應條件下每分鐘形成1微摩爾4-甘油磷酸膽堿的酶的量。
用雙半乳糖甘油二酯作為底物,用H-NMR分光法來測定半乳糖脂酶活性,所述測定按照Hirayama and Matsuda(1972)Agric.Biol.Chem.36,1831中所述的方法來進行。半乳糖脂酶會水解脂肪酸和甘油主鏈之間的酯鍵,因此釋放出一個脂肪酸或全部兩個脂肪酸。所述反應在50mM的乙酸緩沖液中于30℃下進行30分鐘,所述緩沖液pH為4.5,其中還含有4mM的CaCl2、0.2%的Triton X-100和1mg/ml的雙半乳糖甘油二酯(LipidProducts)。一個半乳糖脂酶單位被定義為在上述反應條件下每分鐘形成1微摩爾脂肪酸的酶的量。
實施例2中獲得的超濾物被用來進行FAU酶活測量。用PhadebasAmylase試驗藥片(Pharmacia)來測量真菌的alpha-淀粉酶活性。Phadebas藥片中含有不溶于水的淀粉底物和藍色顏料,所述顏料通過交聯(lián)結合到底物上。所述底物被真菌淀粉酶水解,將被染色的可溶性麥芽糖糊精釋放到溶液中。用含有對照真菌alpha淀粉酶活性的溶液來制備校正曲線。由對照和未知樣品,用pH為5.5的50mM蘋果酸緩沖液制備出適當?shù)南♂屛?。?0℃下將5ml樣品培養(yǎng)5分鐘,加入Phadebas藥片,15分鐘后,加入1.0ml 0.5N的氫氧化鈉使反應終止。使所述混合物自然冷卻至室溫,5分鐘后加入4.0ml的水,用手對其進行搖晃,15分鐘后,所述樣品在4700rpm下離心10分鐘。在620nm處測量上層的消光。所述的OD 620nm是對真菌alpha-淀粉酶活性的測量。一個真菌淀粉酶單位(fungal amylase unit,F(xiàn)AU)在本文中被定義為在上述反應條件下,每小時將1克淀粉(100%干物質)轉化為一種產(chǎn)物的酶的量,所述產(chǎn)物在與已知濃度的碘溶液反應后具有620nm處的透射。
表4按照實施例2制備的超濾物中的蛋白質和FAU
除表4中提到的活性外,還存在較低的葡糖淀粉酶活性,然而其數(shù)量非常之低,因此這些酶不妨礙實施例4中描述的烘焙實驗。
實施例4烘焙實驗1-幼犬面包塊(pup loave)幼面包塊是用150克的面團塊來烘焙的,所述面團塊是通過混合200g面粉(KolibriTM/lbisTM,比例80/20)、1.4g干燥的面包酵母(Fermipan)、4g鹽、3g糖、10mg抗壞血酸、116g水和2g脂肪來獲得的。在搟面混合器中混合6分15秒之后,所述面團被分為若干150克的塊,在30℃下發(fā)酵45分鐘,對其進行沖壓,再發(fā)酵25分鐘,使其成型并在平鍋中烹制(pan)。發(fā)酵進行于90%-100%的相對濕度下。30℃下最后發(fā)酵70分鐘后,在225℃下對所述面團進行20分鐘的烘焙。
將烘焙實驗中不同脂肪分解酶的不同效果(表5和表6)與對照進行比較,所述對照中含有相同數(shù)量的真菌淀粉酶,所述淀粉酶是根據(jù)所述超濾物中的劑量(針對超濾物中的真菌淀粉酶活性,見表4)另行加入的。這是必須的,因為隨脂肪分解酶加入的真菌淀粉酶的量特別影響塊的體積,而非其它參數(shù)。加入了對照數(shù)量的真菌淀粉酶的面包體積被當作100%。
表5
通過面包體積測量儀(Bread Volume Measurer)BVM-3(RI CardsInstruments AB,Viken,Sweden)來測定塊的體積。其測量原理基于傳感器測量的超聲反射,所述傳感器處于旋轉的面包周圍。測量時間需要45秒。
面團粘度和延展性是由合格的烘焙師使用表5中所述的評分標準來評估的。對每個對象而言,測量了兩塊的平均值。
上述測試之后,面團塊被弄成圓形,在30℃下進行45分鐘的第一次發(fā)酵,然后對面團進行沖壓,成型,在平鍋中烹制,再在30℃下發(fā)酵75分鐘。發(fā)酵期間的相對濕度設置在85%。
隨后,通過氣泡的出現(xiàn)、撕裂的側面外皮和不規(guī)則彎曲的外皮表面來判斷經(jīng)過發(fā)酵的面團的穩(wěn)定性。所述面團塊在225℃下烘焙20分鐘。通過BVM-3方法來測定塊的體積表中的平均值來自從同一對象烘焙得到的2個面包。
碎屑結構是由合格的烘焙師用表5中描述的評分標準來判斷的。將所述的面包塊在室溫于聚乙烯袋中貯藏三天,然后用Stevens TextureAnalyser來測量碎屑的牢固性。用所述的品質分析儀來分析來自每個面包塊中央的兩片2cm厚的面包片,使用的探測器直徑為1.5英寸,壓緊深度為5mm(25%),壓緊速度為0.5mm/sec。表中展示的是兩次測量的平均值。
外殼顏色是由合格的烘焙師按照表5中描述的評分標準來判斷的。荷蘭式烤模面包的標準食譜被用作對照。
碎屑顏色是由合格的烘焙師按照表5中描述的評分標準來判斷的。對照面包的碎屑顏色被評定為正常(3)。兩個對象的面包被用作正對照,所述對象是用與對照相同的成分加上0.5%的大豆粉制成的。發(fā)酵和烘焙工序都與沒有大豆粉的對照相同。后者被評判為“非常好”。
所述面包的外伸頂部(overhanging top)是通過所述頂部相對烘焙模具的外伸(hanging)來判斷的,所述頂部的邊緣越低則評價越低。外伸越少,則評價越好。
面包的陳化是通過感受面包片的碎屑堅硬度來判斷的。切片之前,面包在室溫下于塑料袋中貯藏四天。所述面包片的碎屑越軟,則評價越好。
表6本發(fā)明脂肪分解酶的烘焙表現(xiàn)
實施例5烘焙實驗2-batard在被稱為“batard”的法式面包中檢測了本發(fā)明脂肪分解酶的烘焙表現(xiàn)。用標準烘焙方法對batard的制備是通過將大約20℃的3000g小麥粉、70g壓榨酵母、60g鹽、68ppm的抗壞血酸、30ppm的BakezymeHS2000(真菌的半纖維素酶)、7ppm的BakezymeP500(真菌的α-淀粉酶)和1680ml水(8-10℃)在螺旋式混合器(Diosna速度1下2分鐘;速度2下100Wh輸入)中混合來進行的。面團溫度為27℃。所述面團的可加工性由烘焙師進行手工分析。將面團在發(fā)酵箱中進行15分鐘的體積發(fā)酵(bulk proof),32℃,RH為90%。在此階段結束時,對面團塊進行成型和造型,并再在32℃和90%的RH下進行90分鐘的最終發(fā)酵。沿面團塊的長度對經(jīng)過充分發(fā)酵的面團進行切割,并在烤箱中于240℃烘焙30分鐘,并加入初始的蒸汽。冷卻至室溫后,通過BVM-方法(見實施例4)測定所述面包塊的體積。
冷卻至室溫后,直接由合格的烘焙師用表7中的分數(shù)來分析所述面包的斷性(break)、碎性(shred)和形狀。經(jīng)過室溫下于密封箱中的16小時(過夜)貯藏后,由合格的烘焙師來評定碎屑的質量。針對所述面包的值(表8)獲得自一個對象。
表7
表8本發(fā)明脂肪分解酶的烘焙表現(xiàn)
*以ppm表示,基于面粉重量和通過A280方法測定的酶的重量。
序列表<110>帝斯曼知識產(chǎn)權資產(chǎn)管理有限公司<120>新穎的脂肪酶及其用途<130>21078WO<160>39<170>PatentIn version 3.1<210>1<211>3728<212>DNA<213>黑曲霉(Aspergillus niger)<400>1cgggcaatta cgatccgagc gcgctatcta cgtgcaccgg aagcttgctc cttgatttgt60tgtttcataa tacttatttg tgctctttag cccgactgca gtggtggctg catgttgggc120aggtatttaa ctttgggcga taccaactac gcgtgcactt tgaagcatag cacggcgcgc180cggggatgcg tgtcgtctta tgactataat tgatgtggcc gactgactgc ttggtgttag240ggatcttgtg tttatcttgg ttttctgtac ttagaagaga gtgccggtgg catggtggtc300gatataacta gagcaatgcg tgtctccatc ctcatcctca tcggccatcc cttataccct360gatggcgccg aagggtgaga atggcgatgg gcgagaataa tatactgtgt atagtctgtc420ctatcctcct tgtgcactgc aaagtcagtt gatcatcatc cccactcaat cgtccactca480tgctctatat ccgagacaaa ccacaactta ttcaatttaa gcccgagtcc ataatcatcc540acaaccaccc cacagccagg gtacatccag ggtctctttc ccgccggaga aactaagccc600ttagctcctc actaggacct cccgccgcgt cttggctcct catcaccaac tttccaccta660taaactgcat caaacatgct gcaaagccac gactgctgct gcatgcaccc caacatcatc720cccgcataat acatccatcc ctgaagcaat caagcttgac tctgttgttt cttcggagat780gttaaccatt cgtactttcc aaatgacatc aatccaactg atagacatcg ccatcctcct840caataccatg gacgccccac gtccatgtca aaagtaagac tagctcagct cggcgttaat900caattatgat tgcgagtctc aatccctgag tcatgtgttc tctgtgtcgg agaattagac960tgaattcagc tgctcgttgc cactcctagc tccctgataa aggtcctcac ttcgtctcgt1020agctggctgg ctgcatattc tccggtgact aagttaacag aaccagcaac ttagtagcca1080tggcgagcgc actcctctgg ctctccctgc tgggtggcag caccctagcc tcaactctag1140acaccagtaa tacccctacc atcaagagag cagacgcagg aaacaacacc tcctcaatcc1200caacagccac cctcaacaac accgtcttca tcggccgttc cctgcccgag ttcgagcagg1260agttgttcct gggtatcaag tttgctgatg agcccgtgcg attcaccccg tcgacgttga1320aaaccgtcta tcgcgccaat gacagcgaca acggggtgta tcatgcttcc acagcatccg1380gactgcagac ttcctcgggg accgtgctct acaacgccac agagtatggg tatgattgcc1440ccgggtatgg atccgatgag acggagctgg cggaggaagg atatgcgcgg ttcgatgaga1500
actgtatgaa cctgaatata attcggccca agagagagaa agaggatgag ttgttgcctg1560tgatgatttg gatctttggt ggtggttggg tgcagggtgc gactgctgat ccgaggtagg1620atactatagt tttgtgctgt gctgtgtggg gttgatgctg acgatgtgca aggtacaata1680tgagctatat tgttcgccag ggtgcgttga atgataagcc tgtcttgggt gtctcgatca1740attaccgtgt ggctgcgttt ggattccttg actctgtcga ggttatggtg cgtttcttcc1800ttcaccgtca agtatatggg tttcagctga catgacatct gtaggaatcc ggcaacacga1860acctaggact tcgtgatcag cgcgtcgcca tgcattgggt caaacaaaac atcaaggcgt1920ttggtggtga cccggacaag atcaccatct ggggagaatc agcgtgagat tataccctaa1980tagcattcga tatacagcgc ctgacatggc acagtggtgc ctacagcgtc ggagcccacc2040tggtcaccaa cgacggtgac aacgagggtc tattcagagc cggtatgcac accactcccc2100aattctcgtc tcctcatctg ctaaccagca tagccatcat ggaatccggc aacgcagtcg2160gaccccccta caacggcacg gactggtacc agccgatgta cgaccagatc gtgaacgcaa2220ccaagtatgt cctcaccttc cccaaaagac aatactcaaa tgactagtat atatactaac2280tacatgaaag ctgcaccacc tcaagcaaca cccttcaatg cctccgcgaa gtccccttct2340caacgatcta caccgccgca gacatcggcc tggaatggtt cgccaccatc gacggcacct2400tcatcaaaga atatccccaa atcagcatta cggagggccg cttcgccaag gtccccatcc2460tccatggcac caacaccgac gagggcgtga gtttcggtac gacgggcgtg aacactgatg2520ccgaagcgat ccagcagttg atgggtgagc cccccccccc cccccttccc accaatcccc2580aagatatata tatagtacga gatactaagg tgaaatgaaa atgatagcat ccaaacgctg2640ggtcctaaac gaaacccaag ccacgaccct cctatcgcac tatcccaaca tctccgccct2700aggctgtccc tacggatggg gcaacacgac ctggccgaag ctggggtatg aatataagcg2760ctacgagtcg atggcgggcg atctgtgcat ggttgctccg aggaggttgc tcagtcagaa2820gatgaaggag tatgaggagc aagtgtttgc gtatcggtgg gatgtcgctg cgttgaatga2880ttcgagtacg attggggtgg cgcattttgc tgaggtaatg ccatccatcc atcccctatt2940attggttttc cctgcggtat gatatttggt atgctaatga tgtgttactg cgtgcatgca3000tagatcccgt ttgttttcgc caaccctgtg cagaacatca ctccgttggg aagtgatccc3060gcaagactgg agttgggtaa tctggccgcg aggatgtgga cggcttttgt gacggatttg3120gatccgaatg ggcatggtgg tacgttcctc ttctccatct tattagaatt gtgaaatgaa3180gcgtgtggtt ctaatgaggg tgacagtctc tggtatcccc cactggccga aatacaacct3240cactgatccg agggactttg tgttccggct accgagggat ggaagttatg tggagaagga3300tacttttagg acggggggga ttgattatat taatacaatt gtgcggtaag ttgctgctaa3360gtagtactac tatatgtata taggagggtg tgggtgaaaa gtagatagta gtactatatc3420aaggatggtt agatactata tactatttac tactactgta atgttactat aatcaagact3480agaagaaagt ctactgattg attacttcga ctgatcgatt gtattgatct agttagtata3540tcaaatcgac aaagagccgc cgtttttatt cattcatatt tcccgccact aagccagtat3600actataccat agtagtatag ctggtttagt tgatgccgag cagctcaacc tcgctaattg3660atatcagcat tccaatccat tttttcactg gcaaagaata ttagaagagg aaggaggagg3720aggataac 3728<210>2<211>1749<212>DNA<213>黑曲霉(Aspergillus niger)
<220>
<221>CDS<222>(1)..(1749)<400>2atg gcg agc gca ctc ctc tgg ctc tcc ctg ctg ggt ggc agc acc cta48Met Ala Ser Ala Leu Leu Trp Leu Ser Leu Leu Gly Gly Ser Thr Leu1 5 10 15gcc tca act cta gac acc agt aat acc cct acc atc aag aga gca gac96Ala Ser Thr Leu Asp Thr Ser Asn Thr Pro Thr Ile Lys Arg Ala Asp20 25 30gca gga aac aac acc tcc tca atc cca aca gcc acc ctc aac aac acc144Ala Gly Asn Asn Thr Ser Ser Ile Pro Thr Ala Thr Leu Asn Asn Thr35 40 45gtc ttc atc ggc cgt tcc ctg ccc gag ttc gag cag gag ttg ttc ctg192Val Phe Ile Gly Arg Ser Leu Pro Glu Phe Glu Gln Glu Leu Phe Leu50 55 60ggt atc aag ttt gct gat gag ccc gtg cga ttc acc ccg tcg acg ttg240Gly Ile Lys Phe Ala Asp Glu Pro Val Arg Phe Thr Pro Ser Thr Leu65 70 75 80aaa acc gtc tat cgc gcc aat gac agc gac aac ggg gtg tat cat gct288Lys Thr Val Tyr Arg Ala Asn Asp Ser Asp Asn Gly Val Tyr His Ala85 90 95tcc aca gca tcc gga ctg cag act tcc tcg ggg acc gtg ctc tac aac336Ser Thr Ala Ser Gly Leu Gln Thr Ser Ser Gly Thr Val Leu Tyr Asn100 105 110gcc aca gag tat ggg tat gat tgc ccc ggg tat gga tcc gat gag acg384Ala Thr Glu Tyr Gly Tyr Asp Cys Pro Gly Tyr Gly Ser Asp Glu Thr115 120 125gag ctg gcg gag gaa gga tat gcg cgg ttc gat gag aac tgt atg aac432Glu Leu Ala Glu Glu Gly Tyr Ala Arg Phe Asp Glu Asn Cys Met Asn130 135 140ctg aat ata att cgg ccc aag aga gag aaa gag gat gag ttg ttg cct480Leu Asn Ile Ile Arg Pro Lys Arg Glu Lys Glu Asp Glu Leu Leu Pro145 150 155 160gtg atg att tgg atc ttt ggt ggt ggt tgg gtg cag ggt gcg act gct528Val Met Ile Trp Ile Phe Gly Gly Gly Trp Val Gln Gly Ala Thr Ala165 170 175gat ccg agg tac aat atg agc tat att gtt cgc cag ggt gcg ttg aat576Asp Pro Arg Tyr Asn Met Ser Tyr Ile Val Arg Gln Gly Ala Leu Asn180 185 190gat aag cct gtc ttg ggt gtc tcg atc aat tac cgt gtg gct gcg ttt624Asp Lys Pro Val Leu Gly Val Ser Ile Asn Tyr Arg Val Ala Ala Phe
195 200 205gga ttc ctt gac tct gtc gag gtt atg gaa tcc ggc aac acg aac cta672Gly Phe Leu Asp Ser Val Glu Val Met Glu Ser Gly Asn Thr Asn Leu210 215 220gga ctt cgt gat cag cgc gtc gcc atg cat tgg gtc aaa caa aac atc720Gly Leu Arg Asp Gln Arg Val Ala Met His Trp Val Lys Gln Asn Ile225 230 235 240aag gcg ttt ggt ggt gac ccg gac aag atc acc atc tgg gga gaa tca768Lys Ala Phe Gly Gly Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser245 250 255gct ggt gcc tac agc gtc gga gcc cac ctg gtc acc aac gac ggt gac816Ala Gly Ala Tyr Ser Val Gly Ala His Leu Val Thr Asn Asp Gly Asp260 265 270aac gag ggt cta ttc aga gcc gcc atc atg gaa tcc ggc aac gca gtc864Asn Glu Gly Leu Phe Arg Ala Ala Ile Met Glu Ser Gly Asn Ala Val275 280 285gga ccc ccc tac aac ggc acg gac tgg tac cag ccg atg tac gac cag912Gly Pro Pro Tyr Asn Gly Thr Asp Trp Tyr Gln Pro Met Tyr Asp Gln290 295 300atc gtg aac gca acc aac tgc acc acc tca agc aac acc ctt caa tgc960Ile Val Asn Ala Thr Asn Cys Thr Thr Ser Ser Asn Thr Leu Gln Cys305 310 315 320ctc cgc gaa gtc ccc ttc tca acg atc tac acc gcc gca gac atc ggc1008Leu Arg Glu Val Pro Phe Ser Thr Ile Tyr Thr Ala Ala Asp Ile Gly325 330 335ctg gaa tgg ttc gcc acc atc gac ggc acc ttc atc aaa gaa tat ccc1056Leu Glu Trp Phe Ala Thr Ile Asp Gly Thr Phe Ile Lys Glu Tyr Pro340 345 350caa atc agc att acg gag ggc cgc ttc gcc aag gtc ccc atc ctc cat1104Gln Ile Ser Ile Thr Glu Gly Arg Phe Ala Lys Val Pro Ile Leu His355 360 365ggc acc aac acc gac gag ggc gtg agt ttc ggt acg acg ggc gtg aac1152Gly Thr Asn Thr Asp Glu Gly Val Ser Phe Gly Thr Thr Gly Val Asn370 375 380act gat gcc gaa gcg atc cag cag ttg atg gca tcc aaa cgc tgg gtc1200Thr Asp Ala Glu Ala Ile Gln Gln Leu Met Ala Ser Lys Arg Trp Val385 390 395 400cta aac gaa acc caa gcc acg acc ctc cta tcg cac tat ccc aac atc1248Leu Asn Glu Thr Gln Ala Thr Thr Leu Leu Ser His Tyr Pro Asn Ile405 410 415tcc gcc cta ggc tgt ccc tac gga tgg ggc aac acg acc tgg ccg aag1296Ser Ala Leu Gly Cys Pro Tyr Gly Trp Gly Asn Thr Thr Trp Pro Lys420 425 430ctg ggg tat gaa tat aag cgc tac gag tcg atg gcg ggc gat ctg tgc1344
Leu Gly Tyr Glu Tyr Lys Arg Tyr Glu Ser Met Ala Gly Asp Leu Cys435 440 445atg gtt gct ccg agg agg ttg ctc agt cag aag atg aag gag tat gag1392Met Val Ala Pro Arg Arg Leu Leu Ser Gln Lys Met Lys Glu Tyr Glu450 455 460gag caa gtg ttt gcg tat cgg tgg gat gtc gct gcg ttg aat gat tcg1440Glu Gln Val Phe Ala Tyr Arg Trp Asp Val Ala Ala Leu Asn Asp Ser465 470 475 480agt acg att ggg gtg gcg cat ttt gct gag atc ccg ttt gtt ttc gcc1488Ser Thr Ile Gly Val Ala His Phe Ala Glu Ile Pro Phe Val Phe Ala485 490 495aac cct gtg cag aac atc act ccg ttg gga agt gat ccc gca aga ctg1536Asn Pro Val Gln Asn Ile Thr Pro Leu Gly Ser Asp Pro Ala Arg Leu500 505 510gag ttg ggt aat ctg gcc gcg agg atg tgg acg gct ttt gtg acg gat1584Glu Leu Gly Asn Leu Ala Ala Arg Met Trp Thr Ala Phe Val Thr Asp515 520 525ttg gat ccg aat ggg cat ggt gtc tct ggt atc ccc cac tgg ccg aaa1632Leu Asp Pro Asn Gly His Gly Val Ser Gly Ile Pro His Trp Pro Lys530 535 540tac aac ctc act gat ccg agg gac ttt gtg ttc cgg cta ccg agg gat1680Tyr Asn Leu Thr Asp Pro Arg Asp Phe Val Phe Arg Leu Pro Arg Asp545 550 555 560gga agt tat gtg gag aag gat act ttt agg acg ggg ggg att gat tat1728Gly Ser Tyr Val Glu Lys Asp Thr Phe Arg Thr Gly Gly Ile Asp Tyr565 570 575att aat aca att gtg cgg taa1749Ile Asn Thr Ile Val Arg580<210>3<211>582<212>PRT<213>黑曲霉(Aspergillus niger)<400>3Met Ala Ser Ala Leu Leu Trp Leu Ser Leu Leu Gly Gly Ser Thr Leu1 5 10 15Ala Ser Thr Leu Asp Thr Ser Asn Thr Pro Thr Ile Lys Arg Ala Asp20 25 30Ala Gly Asn Asn Thr Ser Ser Ile Pro Thr Ala Thr Leu Asn Asn Thr35 40 45Val Phe Ile Gly Arg Ser Leu Pro Glu Phe Glu Gln Glu Leu Phe Leu
50 55 60Gly Ile Lys Phe Ala Asp Glu Pro Val Arg Phe Thr Pro Ser Thr Leu65 70 75 80Lys Thr Val Tyr Arg Ala Asn Asp Ser Asp Asn Gly Val Tyr His Ala85 90 95Ser Thr Ala Ser Gly Leu Gln Thr Ser Ser Gly Thr Val Leu Tyr Asn100 105 110Ala Thr Glu Tyr Gly Tyr Asp Cys Pro Gly Tyr Gly Ser Asp Glu Thr115 120 125Glu Leu Ala Glu Glu Gly Tyr Ala Arg Phe Asp Glu Asn Cys Met Asn130 135 140Leu Asn Ile Ile Arg Pro Lys Arg Glu Lys Glu Asp Glu Leu Leu Pro145 150 155 160Val Met Ile Trp Ile Phe Gly Gly Gly Trp Val Gln Gly Ala Thr Ala165 170 175Asp Pro Arg Tyr Asn Met Ser Tyr Ile Val Arg Gln Gly Ala Leu Asn180 185 190Asp Lys Pro Val Leu Gly Val Ser Ile Asn Tyr Arg Val Ala Ala Phe195 200 205Gly Phe Leu Asp Ser Val Glu Val Met Glu Ser Gly Asn Th rAsn Leu210 215 220Gly Leu Arg Asp Gln Arg Val Ala Met His Trp Val Lys Gln Asn Ile225 230 235 240Lys Ala Phe Gly Gly Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser245 250 255Ala Gly Ala Tyr Ser Val Gly Ala His Leu Val Thr Asn Asp Gly Asp260 265 270Asn Glu Gly Leu Phe Arg Ala Ala Ile Met Glu Ser Gly Asn Ala Val275 280 285Gly Pro Pro Tyr Asn Gly Thr Asp Trp Tyr Gln Pro Met Tyr Asp Gln290 295 300Ile Val Asn Ala Thr Asn Cys Thr Thr Ser Ser Asn Thr Leu Gln Cys305 310 315 320Leu Arg Glu Val Pro Phe Ser Thr Ile Tyr Thr Ala Ala Asp Ile Gly325 330 335Leu Glu Trp Phe Ala Thr Ile Asp Gly Thr Phe Ile Lys Glu Tyr Pro340 345 350Gln Ile Ser Ile Thr Glu Gly Arg Phe Ala Lys Val Pro Ile Leu His355 360 365Gly Thr Asn Thr Asp Glu Gly Val Ser Phe Gly Thr Thr Gly Val Asn370 375 380Thr Asp Ala Glu Ala Ile Gln Gln Leu Met Ala Ser Lys Arg Trp Val385 390 395 400Leu Asn Glu Thr Gln Ala Thr Thr Leu Leu Ser His Tyr Pro Asn Ile
405 410 415Ser Ala Leu Gly Cys Pro Tyr Gly Trp Gly Asn Thr Thr Trp Pro Lys420 425 430Leu Gly Tyr Glu Tyr Lys Arg Tyr Glu Ser Met Ala Gly Asp Leu Cys435 440 445Met Val Ala Pro Arg Arg Leu Leu Ser Gln Lys Met Lys Glu Tyr Glu450 455 460Glu Gln Val Phe Ala Tyr Arg Trp Asp Val Ala Ala Leu Asn Asp Ser465 470 475 480Ser Thr Ile Gly Val Ala His Phe Ala Glu Ile Pro Phe Val Phe Ala485 490 495Asn Pro Val Gln Asn Ile Thr Pro Leu Gly Ser Asp Pro Ala Arg Leu500 505 510Glu Leu Gly Ash Leu Ala Ala Arg Met Trp Thr Ala Phe Val Thr Asp515 520 525Leu Asp Pro Asn Gly His Gly Val Ser Gly Ile Pro His Trp Pro Lys530 535 540Tyr Asn Leu Thr Asp Pro Arg Asp Phe Val Phe Arg Leu Pro Arg Asp545 550 555 560Gly Ser Tyr Val Glu Lys Asp Thr Phe Arg Thr Gly Gly Ile Asp Tyr565 570 575Ile Asn Thr Ile Val Arg580<210>4<211>3853<212>DNA<213>黑曲霉(Aspergillus niger)<400>4ctttcctgtt gcccggtctt tgttgttgtc ataggataca attacccaga caacgttcgg60tttgtcgatc agttttaagt gtgcgtggac tgacagccaa ggccactggg gcccctgcct120ctatcattta attccacacg ctcgcctctg cagctctggc accagcgttg caaattccag180gggtcagcct acgtggcatt aggctctaag agaatctgag ggaaaggatt tcacttagaa240aaatttatcg gtccggcttg tccgatcggt aggaaggcat tgcttcccct catatgcggc300cccggttccc aagcagctga ttcgggacgt tttccggctt gatcgctata ctctcataat360ctctcctgca agagctggat aaacttggtt tcttatcttc cgtggggatg ccatagtcca420gtagacgctg tctcgaaatt gagtagcacc actatttacg ggcaagttaa tggcacatgt480attagctttg tactgacggt tgaaatgtgg agcaatttcc ggctatgtac cggatctgtt540ccggatatct tcatcgcaat tagttagtac ataaaactcc ctagtcacgc aagaacggtt600cgaacataac gaattaaaaa ttctcattct ctggcaaggc ttcgaaatgt ttgtttcctc660gcttgctcta ttagcactta ttgctccttt gatcgcaatt gcggtaaaaa tagaacagcc720aggaataaat ccaaatccca cagctactgt acgaaatggc acctactatg gtctccataa780
ccagcactat aatcaagacc tctttctcgg tattccatat gcacagcaac ctattggtga840ccttcgcttg cggaccccac gatcaatgaa cacctcctgg ccagtaccaa gaaatgcaac900agaatattca cccgcatgtg ttggatttaa tcagacagag ggtgcttccg aagcctgcct960tactctcaat gtcgtccgcc cggcaagcat cgctctttct gaaagtcttc ccgttgctgg1020tcagtatata ccccaaatct gatcagaagg gccagaactg actttgcgct cggccccagt1080ctggattcat ggcgggggat tcacctccgg ctcttcatca gagaaacaat acaatctgtc1140cttcatcgtt gatcagtcag tccaaatgga aaagcccgtt atcgcagtca gtctaaatta1200tcgtcttcaa tgctggggtt ttatgtggag caaggagatg aaggaagccg gagtagggaa1260cctgggactt agagaccaac gattagctct gcattggata caagaaagta ggtatctcga1320tagtgaagct cttccaagta cggatctgac catgacttag acattgctgc gtttggtgga1380gaccctgctc aggttacaat ttggggtgaa agtgccggcg ctaatagtgt tggcacacat1440ctggttgctt acggagggcg cgatgatggt atattccgtg cagctatcag tgaaagtggt1500gccccaagtg tttaccaacg ttatccaaca cctgctgaat ggcagcccta ttatgatggt1560attgtgaatg catcaggctg cagttcagca acggatactt tggcttgtct ccgaacaatt1620ccaactaaca tattgcatgg catctttgac aacacgtcta ttgtacccat gcacgctatt1680tcaggcctca gcggagcaaa attcattcct gtcatagatg acgacttcat taaagagagt1740gccacggttc agctccagaa gggcaacttc gtcaaagttc cctacttgat tggagctaac1800gccgacgaag ggactgcatt tgctgtggag ggagtcaaca cagatgctga gtttcgcgag1860ctagtcaaag gttggggcct caacaacgct accacggata tcttggaggc cctataccca1920gacattcctc agataggaat ccccgccata atggttggaa ggccaccgtc cggatatgga1980aatcaataca agcgtgtggc cgcatttcag ggtgatgtta acatccatgc cgcacgtagg2040ttgaccagtc agatctggtc atcccgcaat atctcagtat atagctacat gtttgacgtt2100atcagccctg gatatggccc ctctgctggt tcctatgctg gggctactca tggtactgat2160attccgtacg ttttctataa tctggatggc ctggggtatg actcgaacaa caagtccata2220gaaagcatac ctaacagtta ttcccgcatg agcaaaatta tgtcaagaat gtgggtcagt2280tttgtgacaa cattggaccc aaatcattct ggaggtatgg tcccacatcc cattcctatg2340attgcgcaat gtcagacccg agctgaatca actatcttct taggaactaa tgttcagtgg2400ccgccataca atatcgataa tccggagata atctttttcg ataccgatgt cacgaacctc2460acatatgtga gttctgacgt ttaccgtgcg gagggcataa aatacatcag tgatcacctt2520gcaagtgatt tcgggcactg agatcacata tcttctcggt ctaattttag aatgactgtg2580gtctcatcta accagacttg gcccgcaggt ctttacgccc actggtggta attgatgcaa2640cccccaagct atatagtgtc tggggctttg aactactgtc aatgagcgaa aattgactat2700ttccctttat gactcatgta gtagcatttg tgctggcact gtgatcaaga tatgtttttc2760gagattaccg gtagcagagt agtcgatgtc gccaatatta ttcatctata atgaatagta2820ataacttagg agtcattcag tatagtcgat actgacataa gtatcttttc ttgtgatatt2880tataatatgt cccgtttggc cttgtttgta gtaactctca tagcctgctg cttgagaact2940catctgttca atcatagaga taccaattat ggaaggatag gttggcatcg gtgtttgttt3000catcaagact actacctaat aagtcactga agaaggctgt agactgaaag cgcgacattg3060atgattagaa ttccaacttt ggtcaacata tgcattagac tataaaaggg acatgttaga3120agaactaagt acatacgacc atagggtgtg gaaaacaggg cttcccgtcc gctcagccgt3180acttaagcca cacgccggga ggttagtagt tgggtgggtg accaccagcg aatcccttct3240gttgtatgtt tttgtttctc tataaaactt ttggtcgggc atctcgagat gtcttccagg3300atgctaaaac cttcgggttc ctcacagcgg agatggtgtc aactggcttt tttaatgcat3360tcttggctaa agtgctcgtg aacacggcaa tatagtacga tgatatctga agtttgtggt3420
gtcaagacat atgcttattg tgaccaccag accataaatc ggagtattca cagcttatat3480catcctcaaa cattgattgc atagtagagt gtctaactct tgactcaagg gattgaaaat3540gattatttga aaatataggt agttttgaat aacattctgg cacacgagct ttagctggat3600tagtaagatg tgacgccgat tttgggtttg attatgtcat catttggcag ttcccccaga3660ggacagcccg gttaagaacg aaccttttct gagcccgtat acaaatgcgg ggaacagaga3720tgaggagatg ccgaagcatg ctttggcaaa cagaagccac tgtgaaaaac cattcacaga3780tatcttgtga tagttggatt gcactgactg tccgcgaaag cgagcatatc tatcccgtat3840actgagaact agt 3853<210>5<211>1743<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1743)<400>5atg ttt gtt tcc tcg ctt gct cta tta gca ctt att gct cct ttg atc48Met Phe Val Ser Ser Leu Ala Leu Leu Ala Leu Ile Ala Pro Leu Ile1 5 10 15gca att gcg gta aaa ata gaa cag cca gga ata aat cca aat ccc aca96Ala Ile Ala Val Lys Ile Glu Gln Pro Gly Ile Asn Pro Asn Pro Thr20 25 30gct act gta cga aat ggc acc tac tat ggt ctc cat aac cag cac tat144Ala Thr Val Arg Ash Gly Thr Tyr Tyr Gly Leu His Asn Gln His Tyr35 40 45aat caa gac ctc ttt ctc ggt att cca tat gca cag caa cct att ggt192Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Gln Pro Ile Gly50 55 60gac ctt cgc ttg cgg acc cca cga tca atg aac acc tcc tgg cca gta240Asp Leu Arg Leu Arg Thr Pro Arg Ser Met Asn Thr Ser Trp Pro Val65 70 75 80cca aga aat gca aca gaa tat tca ccc gca tgt gtt gga ttt aat cag288Pro Arg Asn Ala Thr Glu Tyr Ser Pro Ala Cys Val Gly Phe Asn Gln85 90 95aca gag ggt gct tcc gaa gcc tgc ctt act ctc aat gtc gtc cgc ccg336Thr Glu Gly Ala Ser Glu Ala Cys Leu Thr Leu Asn Val Val Arg Pro100 105 110gca agc atc gct ctt tct gaa agt ctt ccc gtt gct gtc tgg att cat384Ala Ser Ile Ala Leu Ser Glu Ser Leu Pro Val Ala Val Trp Ile His115 120 125
ggc ggg gga ttc acc tcc ggc tct tca tca gag aaa caa tac aat ctg432Gly Gly Gly Phe Thr Ser Gly Ser Ser Ser Glu Lys Gln Tyr Ash Leu130 135 140tcc ttc atc gtt gat cag tca gtc caa atg gaa aag ccc gtt atc gca480Ser Phe Ile Val Asp Gln Ser Val Gln Met Glu Lys Pro Val Ile Ala145 150 155 160gtc agt cta aat tat cgt ctt caa tgc tgg ggt ttt atg tgg agc aag528Val Ser Leu Asn Tyr Arg Leu Gln Cys Trp Gly Phe Met Trp Ser Lys165 170 175gag atg aag gaa gcc gga gta ggg aac ctg gga ctt aga gac caa cga576Glu Met Lys Glu Ala Gly Val Gly Asn Leu Gly Leu Arg Asp Gln Arg180 185 190tta gct ctg cat tgg ata caa gaa aac att gct gcg ttt ggt gga gac624Leu Ala Leu His Trp Ile Gln Glu Asn Ile Ala Ala Phe Gly Gly Asp195 200 205cct gct cag gtt aca att tgg ggt gaa agt gcc ggc gct aat agt gtt672Pro Ala Gln Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Asn Ser Val210 215 220ggc aca cat ctg gtt gct tac gga ggg cgc gat gat ggt ata ttc cgt720Gly Thr His Leu Val Ala Tyr Gly Gly Arg Asp Asp Gly Ile Phe Arg225 230 235 240gca gct atc agt gaa agt ggt gcc cca agt gtt tac caa cgt tat cca768Ala Ala Ile Ser Glu Ser Gly Ala Pro Ser Val Tyr Gln Arg Tyr Pro245 250 255aca cct gct gaa tgg cag ccc tat tat gat ggt att gtg aat gca tca816Thr Pro Ala Glu Trp Gln Pro Tyr Tyr Asp Gly Ile Val Asn Ala Ser260 265 270ggc tgc agt tca gca acg gat act ttg gct tgt ctc cga aca att cca864Gly Cys Ser Ser Ala Thr Asp Thr Leu Ala Cys Leu Arg Thr Ile Pro275 280 285act aac ata ttg cat ggc atc ttt gac aac acg tct att gta ccc atg912Thr Asn Ile Leu His Gly Ile Phe Asp Asn Thr Ser Ile Val Pro Met290 295 300cac gct att tca ggc ctc agc gga gca aaa ttc att cct gtc ata gat960His Ala Ile Ser Gly Leu Ser Gly Ala Lys Phe Ile Pro Val Ile Asp305 310 315 320gac gac ttc att aaa gag agt gcc acg gtt cag ctc cag aag ggc aac1008Asp Asp Phe Ile Lys Glu Ser Ala Thr Val Gln Leu Gln Lys Gly Asn325 330 335ttc gtc aaa gtt ccc tac ttg att gga gct aac gcc gac gaa ggg act1056Phe Val Lys Val Pro Tyr Leu Ile Gly Ala Asn Ala Asp Glu Gly Thr340 345 350gca ttt gct gtg gag gga gtc aac aca gat gct gag ttt cgc gag cta1104Ala Phe Ala Val Glu Gly Val Asn Thr Asp Ala Glu Phe Arg Glu Leu
355 360 365gtc aaa ggt tgg ggc ctc aac aac gct acc acg gat atc ttg gag gcc1152Val Lys Gly Trp Gly Leu Asn Asn Ala Thr Thr Asp Ile Leu Glu Ala370 375 380cta tac cca gac att cct cag ata gga atc ccc gcc ata atg gtt gga1200Leu Tyr Pro Asp Ile Pro Gln Ile Gly Ile Pro Ala Ile Met Val Gly385 390 395 400agg cca ccg tcc gga tat gga aat caa tac aag cgt gtg gcc gca ttt1248Arg Pro Pro Ser Gly Tyr Gly Asn Gln Tyr Lys Arg Val Ala Ala Phe405 410 415cag ggt gat gtt aac atc cat gcc gca cgt agg ttg acc agt cag atc1296Gln Gly Asp Val Asn Ile His Ala Ala Arg Arg Leu Thr Ser Gln Ile420 425 430tgg tca tcc cgc aat atc tca gta tat age tac atg ttt gac gtt atc1344Trp Ser Ser Arg Asn Ile Ser Val Tyr Ser Tyr Met Phe Asp Val Ile435 440 445agc cct gga tat ggc ccc tct gct ggt tcc tat gct ggg gct act cat1392Ser Pro Gly Tyr Gly Pro Ser Ala Gly Ser Tyr Ala Gly Ala Thr His450 455 460ggt act gat att ccg tac gtt ttc tat aat ctg gat ggc ctg ggg tat1440Gly Thr Asp Ile Pro Tyr Val Phe Tyr Asn Leu Asp Gly Leu Gly Tyr465 470 475 480gac tcg aac aac aag tcc ata gaa agc ata cct aac agt tat tcc cgc1488Asp Ser Asn Asn Lys Ser Ile Glu Ser Ile Pro Asn Ser Tyr Ser Arg485 490 495atg agc aaa att atg tca aga atg tgg gtc agt ttt gtg aca aca ttg1536Met Ser Lys Ile Met Ser Arg Met Trp Val Ser Phe Val Thr Thr Leu500 505 510gac cca aat cat tct gga ggt atg gtc cca cat ccc att cct atg att1584Asp Pro Asn His Ser Gly Gly Met Val Pro His Pro Ile Pro Met Ile515 520 525gcg caa tgt cag acc cga gct gaa tca act atc ttc tta gga act aat1632Ala Gln Cys Gln Thr Arg Ala Glu Ser Thr Ile Phe Leu Gly Thr Asn530 535 540gtt cag tgg ccg cca tac aat atc gat aat ccg gag ata atc ttt ttc1680Val Gln Trp Pro Pro Tyr Asn Ile Asp Asn Pro Glu Ile Ile Phe Phe545 550 555 560gat acc gat gtc acg aac ctc aca tat act tgg ccc gca ggt ctt tac1728Asp Thr Asp Val Thr Asn Leu Thr Tyr Thr Trp Pro Ala Gly Leu Tyr565 570 575gcc cac tgg tgg taa1743Ala His Trp Trp580
<400>23atg ctg aat gca cgc tcc att gct ctg gcc tcg ttg cca gtt ctt ctc48Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15cta cta ttc gcc cag caa ctt gcc tct cac cca acc gag cag att caa96Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30gcc att ctg gct ccg tgg gtc ccg gcc gca cta caa gat gtc gtg ctc144Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45tat aat cga cct cgc gtc ata atc ccc cag ggc act gtc gtc ggc acg192Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60acc ttg aca gac acg ctc aag tcc ccg gta gat gct ttc cga gga att240Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80cca tac gca ttg cct cca att ggg gat aga cgg ttt cgc cgt gcg gag288Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu85 90 95gct gtc cat gcg acg gac gag att atc gat gct agt gaa ttc ggc cca336Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110agg tgc cct gga aag cag ctc ttg aat cca aat gac ata ggt ggt gat384Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125gaa gac tgt ctc aca gtc aat gtc ttc cgg cct cat ggc gct cag gga432Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140aaa ctc cct gtc gct gta tac gtg cac ggc gga gcc tac aat cgc ggc480Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160act gct aaa tat cca gcc tcc gga cac aac acg gcc tcg atg gtc ggc528Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175tgg tcg gac gag ccc ttc gtt gca gtc agc ttc aac tac cgc atc ggc576Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190gcc ctc ggc ttc ctc cca tcc acc cta acc gcc aaa gaa gga atc ctc624Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205aac cta ggc ctc cat gac cag atc ctc ctg ctg caa tgg gtc caa gaa672Ash Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220aac atc gca cat ttc aac ggc gac cca acc caa gtc act cta atc ggc720
290 295 300His Ala Ile Ser Gly Leu Ser Gly Ala Lys Phe Ile Pro Val Ile Asp305 310 315 320Asp Asp Phe Ile Lys Glu Ser Ala Thr Val Gln Leu Gln Lys Gly Asn325 330 335Phe Val Lys Val Pro Tyr Leu Ile Gly Ala Asn Ala Asp Glu Gly Thr340 345 350Ala Phe Ala Val Glu Gly Val Asn Thr Asp Ala Glu Phe Arg Glu Leu355 360 365Val Lys Gly Trp Gly Leu Asn Asn Ala Thr Thr Asp Ile Leu Glu Ala370 375 380Leu Tyr Pro Asp Ile Pro Gln Ile Gly Ile Pro Ala Ile Met Val Gly385 390 395 400Arg Pro Pro Ser Gly Tyr Gly Asn Gln Tyr Lys Arg Val Ala Ala Phe405 410 415Gln Gly Asp Val Asn Ile His Ala Ala Arg Arg Leu Thr Ser Gln Ile420 425 430Trp Ser Ser Arg Asn Ile Ser Val Tyr Ser Tyr Met Phe Asp Val Ile435 440 445Ser Pro Gly Tyr Gly Pro Ser Ala Gly Ser Tyr Ala Gly Ala Thr His450 455 460Gly Thr Asp Ile Pro Tyr Val Phe Tyr Asn Leu Asp Gly Leu Gly Tyr465 470 475 480Asp Ser Asn Asn Lys Ser Ile Glu Ser Ile Pro Asn Ser Tyr Ser Arg485 490 495Met Ser Lys Ile Met Ser Arg Met Trp Val Ser Phe Val Thr Thr Leu500 505 510Asp Pro Asn His Ser Gly Gly Met Val Pro His Pro Ile Pro Met Ile515 520 525Ala Gln Cys Gln Thr Arg Ala Glu Ser Thr Ile Phe Leu Gly Thr Asn530 535 540Val Gln Trp Pro Pro Tyr Asn Ile Asp Asn Pro Glu Ile Ile Phe Phe545 550 555 560Asp Thr Asp Val Thr Asn Leu Thr Tyr Thr Trp Pro Ala Gly Leu Tyr565 570 575Ala His Trp Trp580<210>7<211>2769<212>DNA<213>黑曲霉(Aspergillus niger)
<400>7gtgaacaatg attagacttg gagaacgtgg tctccgattg gaagtggact atctatttaa60tagtattgcc aaggctttct gatcggcaaa catattgtcc tcccgtggtg actggtttct120cgcctgatgt gaatagtgat tatcaattta tacccttcgt cagcactgat tgaataagaa180cttacctcac attgccctca tttctatgct ggaaccatgc acctattttt aagccatccg240gccgatctta ctcacggtat gggctgactt tgtatcacaa cccatacctg tcgaccgtct300aaagtggggt cagtgacaag catgatgccg gtcagcatca tcagctcaac aaattctagc360caacaacgga gatcagtggt ccgacatttg atgtagaatt aaacccgcac acgtcggaat420ggcttcattc tcggtcttag tttcccaatc gaagctggtt cagcgcccag acgcggagcg480tgggggtggg accccggatt ttcccccaca accttggctg tggttggcac tttttcatta540gcctccatcc tgtgcgcaga tactagagaa ctctacatca tgccatcgag gtttgttagt600tagatttgtt aactagctga gcggtgtagg tgcatgccgt acggtgagtt tgtctatctt660ttgtatagcc ggaagccgaa ggtaccccgc gtcatggcta tataaggctt gtatatccca720tgctctggta gatgggacaa caagaacggc gatccgatag aatcatggtg cagggtgtgg780cttttggact gctcgggctg gctgcctctg ctttgggcac ttatgcgccc tactacgcga840atttgacatg ggagcaacca cggactctgt ccaactggtc caaccttacc gtcgagacac900ggacagggac gttcattggt atgctcaatg acacttaccc agacgttcga cagtttctgc960gagttcctta tgccaaggta attctctcgc tgtacacatg tcatactgtg tctgacatga1020ccagcctcct attggggatt taagatggct tcctcctcat cggcttgaca actcaagcag1080aacatatgac tccaccttct atggcccagg taagtagtct tccatacaac tatgagcagt1140tccaattaac ccgagttcag cctgtccgca gtatgttcca gcagagagcg atttttggaa1200tgaatatgaa ccggagaatt tgctgctcaa tgtcggcgaa aggctcaacc agggctctac1260ggcatggtcc tcgtcagagg attgcctgtc cctagcggta tggactccat cgtatgctaa1320tgagacatcc aagctgccag ttgcgctgtt tgtcacggga ggtggtggca tcacaggggg1380tatcaacatt ccgtcccagc tgccctctgc ttgggtatct cgctctcagg agcatatcgt1440tgttaccatc aattaccgcg tcaatatttt tggcagtaag tatttgctct atatttgcaa1500atattagcct gacatgtata gatcccaaat cgcgtgcgtt gaatgatacg tcgcttacgc1560tgatggacgt gcgcgctgct gtggagtggg tatatgagaa cattgaagcg ttcggtggta1620atcccgaaaa tattatggtc agactacaag tttcctctca catgactaga gctaacagta1680agcagctatg gggacagtca caaggtgctt tgctgacgca tctgtacacc ctcgcatggc1740cagaagagcc tcttgccgcc aagttcggcg tcatctccca aggagcatct gccacactca1800acctctctac cacgcccgat gtgtaccaag actttgacat cgtggccaag ggactaggct1860gcaattatgg tgatgatgcc gaggccgagc tggagtgcat gcgtgggatt tcctgggtgc1920agatcgagga gtatatcaac cgctacaata gctctccttc tattgctttc acgaactata1980ttcgtatgta cccatcttgc tcttttaact gcccctacta acaatatcag ccgatgagaa2040atacatcttc tccgacgaaa gacagcgtta ccttgagcgg aaggttgccc gaggcccgtc2100aattcgatct gacacggcgc gagaattccc tagcacaaac acgacctcag taaatattga2160agaaggcgaa tcagactgtc tggcagtgac tgaccttgcg ctacgtgcgt ccattgggct2220cgagacctat cgctactact gggctggtat gtccaatgac tttccatact gaagatagtg2280ctaacataaa caggcaactt ctccaatatc agtcccgtac cgtggctagg agcattccac2340tggaccgacc tgctgatgat cttcggtacg tataatctgg acgtcggcga gatctcgcag2400ttggaagtcg acacctctgc cacgatgcaa gattatctac tcgcctttct gaaggactca2460tcaaccgtca gcgagacggt cggatggccg ttatatctgg gcaacgagac caacggagga2520ctcatcctgg agttcggtaa cggcacagca gtgcggacca tcacaggtga ctggctcgac2580
gcgggatgtt tcaattcatc tatcccattc agaatctggg ggtagcctat acacaccatc2640atcagagtag tatatacatc atatccacaa atccatctcc acctatatac ataaacccca2700actgaatcta caacagcgcc tggtccttct tcccctcccc ctctttaatt tccctcgcct2760tctccccat2769<210>8<211>1623<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1623)<400>8atg gtg cag ggt gtg gct ttt gga ctg ctc ggg ctg gct gcc tct gct48Met Val Gln Gly Val Ala Phe Gly Leu Leu Gly Leu Ala Ala Ser Ala1 5 10 15ttg ggc act tat gcg ccc tac tac gcg aat ttg aca tgg gag caa cca96Leu Gly Thr Tyr Ala Pro Tyr Tyr Ala Asn Leu Thr Trp Glu Gln Pro20 25 30cgg act ctg tcc aac tgg tcc aac ctt acc gtc gag aca cgg aca ggg144Arg Thr Leu Ser Asn Trp Ser Asn Leu Thr Val Glu Thr Arg Thr Gly35 40 45acg ttc att ggt atg ctc aat gac act tac cca gac gtt cga cag ttt192Thr Phe Ile Gly Met Leu Asn Asp Thr Tyr Pro Asp Val Arg Gln Phe50 55 60ctg cga gtt cct tat gcc aag cct cct att ggg gat tta aga tgg ctt240Leu Arg Val Pro Tyr Ala Lys Pro Pro Ile Gly Asp Leu Arg Trp Leu65 70 75 80cct cct cat cgg ctt gac aac tca agc aga aca tat gac tcc acc ttc288Pro Pro His Arg Leu Asp Asn Ser Ser Arg Thr Tyr Asp Ser Thr Phe85 90 95tat ggc cca gcc tgt ccg cag tat gtt cca gca gag agc gat ttt tgg336Tyr Gly Pro Ala Cys Pro Gln Tyr Val Pro Ala Glu Ser Asp Phe Trp100 105 110aat gaa tat gaa ccg gag aat ttg ctg ctc aat gtc ggc gaa agg ctc384Asn Glu Tyr Glu Pro Glu Asn Leu Leu Leu Asn Val Gly Glu Arg Leu115 120 125aac cag ggc tct acg gca tgg tcc tcg tca gag gat tgc ctg tcc cta432Asn Gln Gly Ser Thr Ala Trp Ser Ser Ser Glu Asp Cys Leu Ser Leu130 135 140gcg gta tgg act cca tcg tat gct aat gag aca tcc aag ctg cca gtt480
Ala Val Trp Thr Pro Ser Tyr Ala Asn Glu Thr Ser Lys Leu Pro Val145 150 155 160gcg ctg ttt gtc acg gga ggt ggt ggc atc aca ggg ggt atc aac att528Ala Leu Phe Val Thr Gly Gly Gly Gly Ile Thr Gly Gly Ile Asn Ile165 170 175ccg tcc cag ctg ccc tct gct tgg gta tct cgc tct cag gag cat atc576Pro Ser Gln Leu Pro Ser Ala Trp Val Ser Arg Ser Gln Glu His Ile180 185 190gtt gtt acc atc aat tac cgc gtc aat att ttt ggc aat ccc aaa tcg624Val Val Thr Ile Asn Tyr Arg Val Asn Ile Phe Gly Asn Pro Lys Ser195 200 205cgt gcg ttg aat gat acg tcg ctt acg ctg atg gac gtg cgc gct gct672Arg Ala Leu Asn Asp Thr Ser Leu Thr Leu Met Asp Val Arg Ala Ala210 215 220gtg gag tgg gta tat gag aac att gaa gcg ttc ggt ggt aat ccc gaa720Val Glu Trp Val Tyr Glu Asn Ile Glu Ala Phe Gly Gly Asn Pro Glu225 230 235 240aat att atg gtc aga cta caa gtt tcc tct cac atg act aga gct aac768Asn Ile Met Val Arg Leu Gln Val Ser Ser His Met Thr Arg Ala Asn245 250 255agt aag cag cta tgg gga cag tca caa ggt gct ttg ctg acg cat ctg816Ser Lys Gln Leu Trp Gly Gln Ser Gln Gly Ala Leu Leu Thr His Leu260 265 270tac acc ctc gca tgg cca gaa gag cct ctt gcc gcc aag ttc ggc gtc864Tyr Thr Leu Ala Trp Pro Glu Glu Pro Leu Ala Ala Lys Phe Gly Val275 280 285atc tcc caa gga gca tct gcc aca ctc aac ctc tct acc acg ccc gat912Ile Ser Gln Gly Ala Ser Ala Thr Leu Asn Leu Ser Thr Thr Pro Asp290 295 300gtg tac caa gac ttt gac atc gtg gcc aag gga cta ggc tgc aat tat960Val Tyr Gln Asp Phe Asp Ile Val Ala Lys Gly Leu Gly Cys Asn Tyr305 310 315 320ggt gat gat gcc gag gcc gag ctg gag tgc atg cgt ggg att tcc tgg1008Gly Asp Asp Ala Glu Ala Glu Leu Glu Cys Met Arg Gly Ile Ser Trp325 330 335gtg cag atc gag gag tat atc aac cgc tac aat agc tct cct tct att1056Val Gln Ile Glu Glu Tyr Ile Asn Arg Tyr Asn Ser Ser Pro Ser Ile340 345 350gct ttc acg aac tat att ccc gat gag aaa tac atc ttc tcc gac gaa1104Ala Phe Thr Asn Tyr Ile Pro Asp Glu Lys Tyr Ile Phe Ser Asp Glu355 360 365aga cag cgt tac ctt gag cgg aag gtt gcc cga ggc ccg tca att cga1152Arg Gln Arg Tyr Leu Glu Arg Lys Val Ala Arg Gly Pro Ser Ile Arg370 375 380
tct gac acg gcg cga gaa ttc cct agc aca aac acg acc tca gta aat1200Ser Asp Thr Ala Arg Glu Phe Pro Ser Thr Asn Thr Thr Ser Val Asn385 390 395 400att gaa gaa ggc gaa tca gac tgt ctg gca gtg act gac ctt gcg cta1248Ile Glu Glu Gly Glu Ser Asp Cys Leu Ala Val Thr Asp Leu Ala Leu405 410 415cgt gcg tcc att ggg ctc gag acc tat cgc tac tac tgg gct ggc aac1296Arg Ala Ser Ile Gly Leu Glu Thr Tyr Arg Tyr Tyr Trp Ala Gly Asn420 425 430ttc tcc aat atc agt ccc gta ccg tgg cta gga gca ttc cac tgg acc1344Phe Ser Asn Ile Ser Pro Val Pro Trp Leu Gly Ala Phe His Trp Thr435 440 445gac ctg ctg atg atc ttc ggt acg tat aat ctg gac gtc ggc gag atc1392Asp Leu Leu Met Ile Phe Gly Thr Tyr Asn Leu Asp Val Gly Glu Ile450 455 460tcg cag ttg gaa gtc gac acc tct gcc acg atg caa gat tat cta ctc1440Ser Gln Leu Glu Val Asp Thr Ser Ala Thr Met Gln Asp Tyr Leu Leu465 470 475 480gcc ttt ctg aag gac tca tca acc gtc agc gag acg gtc gga tgg ccg1488Ala Phe Leu Lys Asp Ser Ser Thr Val Ser Glu Thr Val Gly Trp Pro485 490 495tta tat ctg ggc aac gag acc aac gga gga ctc atc ctg gag ttc ggt1536Leu Tyr Leu Gly Asn Glu Thr Asn Gly Gly Leu Ile Leu Glu Phe Gly500 505 510aac ggc aca gca gtg cgg acc atc aca ggt gac tgg ctc gac gcg gga1584Asn Gly Thr Ala Val Arg Thr Ile Thr Gly Asp Trp Leu Asp Ala Gly515 520 525tgt ttc aat tca tct atc cca ttc aga atc tgg ggg tag1623Cys Phe Asn Ser Ser Ile Pro Phe Arg Ile Trp Gly530 535 540<210>9<211>540<212>PRT<213>黑曲霉(Aspergillus niger)<400>9Met Val Gln Gly Val Ala Phe Gly Leu Leu Gly Leu Ala Ala Ser Ala1 5 10 15Leu Gly Thr Tyr Ala Pro Tyr Tyr Ala Asn Leu Thr Trp Glu Gln Pro20 25 30Arg Thr Leu Ser Asn Trp Ser Asn Leu Thr Val Glu Thr Arg Thr Gly35 40 45
Thr Phe Ile Gly Met Leu Asn Asp Thr Tyr Pro Asp Val Arg Gln Phe50 55 60Leu Arg Val Pro Tyr Ala Lys Pro Pro Ile Gly Asp Leu Arg Trp Leu65 70 75 80Pro Pro His Arg Leu Asp Asn Ser Ser Arg Thr Tyr Asp Ser Thr Phe85 90 95Tyr Gly Pro Ala Cys Pro Gln Tyr Val Pro Ala Glu Ser Asp Phe Trp100 105 110Asn Glu Tyr Glu Pro Glu Asn Leu Leu Leu Asn Val Gly Glu Arg Leu115 120 125Asn Gln Gly Ser Thr Ala Trp Ser Ser Ser Glu Asp Cys Leu Ser Leu130 135 140Ala Val Trp Thr Pro Ser Tyr Ala Asn Glu Thr Ser Lys Leu Pro Val145 150 155 160Ala Leu Phe Val Thr Gly Gly Gly Gly Ile Thr Gly Gly Ile Asn Ile165 170 175Pro Ser Gln Leu Pro Ser Ala Trp Val Ser Arg Ser Gln Glu His Ile180 185 190Val Val Thr Ile Asn Tyr Arg Val Asn Ile Phe Gly Asn Pro Lys Ser195 200 205Arg Ala Leu Asn Asp Thr Ser Leu Thr Leu Met Asp Val Arg Ala Ala210 215 220Val Glu Trp Val Tyr Glu Asn Ile Glu Ala Phe Gly Gly Asn Pro Glu225 230 235 240Asn Ile Met Val Arg Leu Gln Val Ser Ser His Met Thr Arg Ala Asn245 250 255Ser Lys Gln Leu Trp Gly Gln Ser Gln Gly Ala Leu Leu Thr His Leu260 265 270Tyr Thr Leu Ala Trp Pro Glu Glu Pro Leu Ala Ala Lys Phe Gly Val275 280 285Ile Ser Gln Gly Ala Ser Ala Thr Leu Asn Leu Ser Thr Thr Pro Asp290 295 300Val Tyr Gln Asp Phe Asp Ile Val Ala Lys Gly Leu Gly Cys Asn Tyr305 310 315 320Gly Asp Asp Ala Glu Ala Glu Leu Glu Cys Met Arg Gly Ile Ser Trp325 330 335Val Gln Ile Glu Glu Tyr Ile Asn Arg Tyr Asn Ser Ser Pro Ser Ile340 345 350Ala Phe Thr Asn Tyr Ile Pro Asp Glu Lys Tyr Ile Phe Ser Asp Glu355 360 365Arg Gln Arg Tyr Leu Glu Arg Lys Val Ala Arg Gly Pro Ser Ile Arg370 375 380Ser Asp Thr Ala Arg Glu Phe Pro Ser Thr Asn Thr Thr Ser Val Asn385 390 395 400
Ile Glu Glu Gly Glu Ser Asp Cys Leu Ala Val Thr Asp Leu Ala Leu405 410 415Arg Ala Ser Ile Gly Leu Glu Thr Tyr Arg Tyr Tyr Trp Ala Gly Asn420 425 430Phe Ser Ash Ile Ser Pro Val Pro Trp Leu Gly Ala Phe His Trp Thr435 440 445Asp Leu Leu Met Ile Phe Gly Thr Tyr Ash Leu Asp Val Gly Glu Ile450 455 460Ser Gln Leu Glu Val Asp Thr Ser Ala Thr Met Gln Asp Tyr Leu Leu465 470 475 480Ala Phe Leu Lys Asp Ser Ser Thr Val Ser Glu Thr Val Gly Trp Pro485 490 495Leu Tyr Leu Gly Asn Glu Thr Asn Gly Gly Leu Ile Leu Glu Phe Gly500 505 510Asn Gly Thr Ala Val Arg Thr Ile Thr Gly Asp Trp Leu Asp Ala Gly515 520 525Cys Phe Asn Ser Ser Ile Pro Phe Arg Ile Trp Gly530 535 540<210>10<211>3235<212>DNA<213>黑曲霉(Aspergillus niger)<400>10gttttcaatt tggactgaat tttggcggca tttcttgtat aaaattaaaa ggggcgttga60ctggattttg gtacttggga tttattctta gctttgactg tacatagttt gggcgtggtt120tgatagccga cgatcggccg acccacgaac cagatttgca tatgattaca ttccttcaat180tttggtccga gtcccaaccc gcctttcaac cccaacaact acaagcacgt tgtgtttgct240acattgactc actcgatatt gctgaaccat gcaggccgcc caactgagtt attacaccaa300gcatgcgaat cggaaagttc gacaaagcgg gtgaaatgtc cgagttggcg aaccaaagcg360caacggtcga ggctcctttc cccgcagagg cagccattct gcagcctttg aactgcgggg420gaaacggcat ttgatcaact cggcactgat gcagtgacca acaggatgtt agcaatgttg480gcctaatata ttcttactga tctgctgata cgtccctccc ttgcatcagc ctcggtttgc540gcatgagaac gggttcgaac gttcctgggc cacccggttg gcgtgatatt ctccgcccac600gctgtctgtc cccctgatgg gaaaccttcg gatcagcgat catcaggcca gttggctatg660agaatagggg ctttgctgtc ttgatgccta aaatgcaggt ctcatagcaa gatccacagc720cgaggaggca catggcgatg tcgaaaccca tgggagctga tttttcggtt ctcggatcgt780gctccaagac atagaaggat attgagcact tgaaacgaag gggtgaaaaa tggaactgta840tatagagtta ctcccagccc gatccgagag cctatgaccc atagcggtac agatcatggc900catcatgaag gccctccttt ggctctccct ttccctcgcc gtctgggcga ctccagttca960acgggatgca gctcctactg tcactattgc gcatccatcg gccaccgtca ttggaaaatc1020tggcaatgtc gagagcttca acaatattcc ctttgcgcag gcccccacag gctcgctgcg1080
tctgaagccc ccacaaccct tggaaactgc cctcggcact gttcaggcca caggagcctc1140gcaatcgtgt ccgcagatgt acttcaccac ggatgagagc gaattcccga catcggtcat1200tggcctcctc gctgatctcc ctttggtaca gtcggctacc aatgctctcg aggattgcct1260gaacattgac attcggcgtc cggccgggac caccgcggac tcgaagctgc ctgtgctggt1320ctggatcttt ggcggaggct ttgaacttgg ttcaaaggcg atgtatgatg gtacaacgat1380ggtatcatcg tcgatagaca agaacatgcc tatcgtgttt gtagcaatga attatcgcgt1440gggaggtttc gggttcttgc ccggaaagga gatcctggag gacgggtccg cgaacctagg1500gctcctggac caacgccttg ccctgcagtg ggttgccgac aacatcgagg cctttggtgg1560agacccggac aaggtgacga tttggggaga atcagcagga gccatttccg tttttgatca1620gatgatcttg tacgacggaa acatcactta caaggataag cccttgttcc ggggggccat1680catggactcc ggtagtgttg ttcccgcaga ccccgtcgat ggggtcaagg gacagcaagt1740atatgatgcg gtagtggaat ctgcaggctg ttcctcttct aacgacaccc tagcttgtct1800gcgtgaacta gactacaccg acttcctcaa tgcggcaaac tccgtgccag gcattttaag1860ctaccattct gtggcgttat catatgtgcc tcgaccggac gggacggcgt tgtcggcatc1920accggacgtt ttgggcaaag cagggaaata tgctcgggtc ccgttcatcg tgggcgacca1980agaggatgag gggaccttat tcgccttgtt tcagtccaac attacgacga tcgacgaggt2040ggtcgactac ctggcctcat acttcttcta tgacgctagc cgagagcagc ttgaagaact2100agtggccctg tacccagaca ccaccacgta cgggtctccg ttcaggacag gcgcggccaa2160caactggtat ccgcaattta agcgattggc cgccattctc ggcgacttgg tcttcaccat2220tacccggcgg gcattcctct cgtatgcaga ggaaatctcc cctgatcttc cgaactggtc2280gtacctggcg acctatgact atggcacccc agttctgggg accttccacg gaagtgacct2340gctgcaggtg ttctatggga tcaagccaaa ctatgcagct agttctagcc acacgtacta2400tctgagcttt gtgtatacgc tggatccgaa ctccaaccgg ggggagtaca ttgagtggcc2460gcagtggaag gaatcgcggc agttgatgaa tttcggagcg aacgacgcca gtctccttac2520ggatgatttc cgcaacggga catatgagtt catcctgcag aataccgcgg cgttccacat2580ctgatgccat tggcggaggg gtccggacgg tcaggaactt agccttatga gatgaatgat2640ggacgtgtct ggcctcggaa aaggatatat ggggatcatg atagtactag ccatattaat2700gaagggcata taccacgcgt tggacctgcg ttatagcttc ccgttagtta tagtaccatc2760gttataccag ccaatcaagt caccacgcac gaccggggac ggcgaatccc cgggaattga2820aagaaattgc atcccaggcc agtgaggcca gcgattggcc acctctccaa ggcacagggc2880cattctgcag cgctggtgga ttcatcgcaa tttcccccgg cccggcccga caccgctata2940ggctggttct cccacaccat cggagattcg tcgcctaatg tctcgtccgt tcacaagctg3000aagagcttga agtggcgaga tgtctctgca ggaattcaag ctagatgcta agcgatattg3060catggcaata tgtgttgatg catgtgcttc ttccttcagc ttcccctcgt gcagatgagg3120tttggctata aattgaagtg gttggtcggg gttccgtgag gggctgaagt gcttcctccc3180ttttagacgc aactgagagc ctgagcttca tccccagcat cattacacct cagca 3235<210>11<211>1689<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1689)<400>11atg gcc atc atg aag gcc ctc ctt tgg ctc tcc ctt tcc ctc gcc gtc48Met Ala Ile Met Lys Ala Leu Leu Trp Leu Ser Leu Ser Leu Ala Val1 5 10 15tgg gcg act cca gtt caa cgg gat gca gct cct act gtc act att gcg96Trp Ala Thr Pro Val Gln Arg Asp Ala Ala Pro Thr Val Thr Ile Ala20 25 30cat cca tcg gcc acc gtc att gga aaa tct ggc aat gtc gag agc ttc144His Pro Ser Ala Thr Val Ile Gly Lys Ser Gly Asn Val Glu Ser Phe35 40 45aac aat att ccc ttt gcg cag gcc ccc aca ggc tcg ctg cgt ctg aag192Asn Asn Ile Pro Phe Ala Gln Ala Pro Thr Gly Ser Leu Arg Leu Lys50 55 60ccc cca caa ccc ttg gaa act gcc ctc ggc act gtt cag gcc aca gga240Pro Pro Gln Pro Leu Glu Thr Ala Leu Gly Thr Val Gln Ala Thr Gly65 70 75 80gcc tcg caa tcg tgt ccg cag atg tac ttc acc acg gat gag agc gaa288Ala Ser Gln Ser Cys Pro Gln Met Tyr Phe Thr Thr Asp Glu Ser Glu85 90 95ttc ccg aca tcg gtc att ggc ctc ctc gct gat ctc cct ttg gta cag336Phe Pro Thr Ser Val Ile Gly Leu Leu Ala Asp Leu Pro Leu Val Gln100 105 110tcg gct acc aat gct ctc gag gat tgc ctg aac att gac att cgg cgt384Ser Ala Thr Asn Ala Leu Glu Asp Cys Leu Asn Ile Asp Ile Arg Arg115 120 125ccg gcc ggg acc acc gcg gac tcg aag ctg cct gtg ctg gtc tgg atc432Pro Ala Gly Thr Thr Ala Asp Ser Lys Leu Pro Val Leu Val Trp Ile130 135 140ttt ggc gga ggc ttt gaa ctt ggt tca aag gcg atg tat gat ggt aca480Phe Gly Gly Gly Phe Glu Leu Gly Ser Lys Ala Met Tyr Asp Gly Thr145 150 155 160acg atg gta tca tcg tcg ata gac aag aac atg cct atc gtg ttt gta528Thr Met Val Ser Ser Ser Ile Asp Lys Asn Met Pro Ile Val Phe Val165 170 175gca atg aat tat cgc gtg gga ggt ttc ggg ttc ttg ccc gga aag gag576Ala Met Asn Tyr Arg Val Gly Gly Phe Gly Phe Leu Pro Gly Lys Glu180 185 190atc ctg gag gac ggg tcc gcg aac cta ggg ctc ctg gac caa cgc ctt624Ile Leu Glu Asp Gly Ser Ala Asn Leu Gly Leu Leu Asp Gln Arg Leu195 200 205gcc ctg cag tgg gtt gcc gac aac atc gag gcc ttt ggt gga gac ccg672
Ala Leu Gln Trp Val Ala Asp Asn Ile Glu Ala Phe Gly Gly Asp Pro210 215 220gac aag gtg acg att tgg gga gaa tca gca gga gcc att tcc gtt ttt720Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Ile Ser Val Phe225 230 235 240gat cag atg atc ttg tac gac gga aac atc act tac aag gat aag ccc768Asp Gln Met Ile Leu Tyr Asp Gly Asn Ile Thr Tyr Lys Asp Lys Pro245 250 255ttg ttc cgg ggg gcc atc atg gac tcc ggt agt gtt gtt ccc gca gac816Leu Phe Arg Gly Ala Ile Met Asp Ser Gly Ser Val Val Pro Ala Asp260 265 270ccc gtc gat ggg gtc aag gga cag caa gta tat gat gcg gta gtg gaa864Pro Val Asp Gly Val Lys Gly Gln Gln Val Tyr Asp Ala Val Val Glu275 280 285tct gca ggc tgt tcc tct tct aac gac acc cta gct tgt ctg cgt gaa912Ser Ala Gly Cys Ser Ser Ser Asn Asp Thr Leu Ala Cys Leu Arg Glu290 295 300cta gac tac acc gac ttc ctc aat gcg gca aac tcc gtg cca ggc att960Leu Asp Tyr Thr Asp Phe Leu Asn Ala Ala Asn Ser Val Pro Gly Ile305 310 315 320tta agc tac cat tct gtg gcg tta tca tat gtg cct cga ccg gac ggg1008Leu Ser Tyr His Ser Val Ala Leu Ser Tyr Val Pro Arg Pro Asp Gly325 330 335acg gcg ttg tcg gca tca ccg gac gtt ttg ggc aaa gca ggg aaa tat1056Thr Ala Leu Ser Ala Ser Pro Asp Val Leu Gly Lys Ala Gly Lys Tyr340 345 350gct cgg gtc ccg ttc atc gtg ggc gac caa gag gat gag ggg acc tta1104Ala Arg Val Pro Phe Ile Val Gly Asp Gln Glu Asp Glu Gly Thr Leu355 360 365ttc gcc ttg ttt cag tcc aac att acg acg atc gac gag gtg gtc gac1152Phe Ala Leu Phe Gln Ser Asn Ile Thr Thr Ile Asp Glu Val Val Asp370 375 380tac ctg gcc tca tac ttc ttc tat gac gct agc cga gag cag ctt gaa1200Tyr Leu Ala Ser Tyr Phe Phe Tyr Asp Ala Ser Arg Glu Gln Leu Glu385 390 395 400gaa cta gtg gcc ctg tac cca gac acc acc acg tac ggg tct ccg ttc1248Glu Leu Val Ala Leu Tyr Pro Asp Thr Thr Thr Tyr Gly Ser Pro Phe405 410 415agg aca ggc gcg gcc aac aac tgg tat ccg caa ttt aag cga ttg gcc1296Arg Thr Gly Ala Ala Asn Asn Trp Tyr Pro Gln Phe Lys Arg Leu Ala420 425 430gcc att ctc ggc gac ttg gtc ttc acc att acc cgg cgg gca ttc ctc1344Ala Ile Leu Gly Asp Leu Val Phe Thr Ile Thr Arg Arg Ala Phe Leu435 440 445
tcg tat gca gag gaa atc tcc cct gat ctt ccg aac tgg tcg tac ctg1392Ser Tyr Ala Glu Glu Ile Ser Pro Asp Leu Pro Asn Trp Ser Tyr Leu450 455 460gcg acc tat gac tat ggc acc cca gtt ctg ggg acc ttc cac gga agt1440Ala Thr Tyr Asp Tyr Gly Thr Pro Val Leu Gly Thr Phe His Gly Ser465 470 475 480gac ctg ctg cag gtg ttc tat ggg atc aag cca aac tat gca gct agt1488Asp Leu Leu Gln Val Phe Tyr Gly Ile Lys Pro Asn Tyr Ala Ala Ser485 490 495tct agc cac acg tac tat ctg agc ttt gtg tat acg ctg gat ccg aac1536Ser Ser His Thr Tyr Tyr Leu Ser Phe Val Tyr Th rLeu Asp Pro Asn500 505 510tcc aac cgg ggg gag tac att gag tgg ccg cag tgg aag gaa tcg cgg1584Ser Asn Arg Gly Glu Tyr Ile Glu Trp Pro Gln Trp Lys Glu Ser Arg515 520 525cag ttg atg aat ttc gga gcg aac gac gcc agt ctc ctt acg gat gat1632Gln Leu Met Asn Phe Gly Ala Asn Asp Ala Ser Leu Leu Thr Asp Asp530 535 540ttc cgc aac ggg aca tat gag ttc atc ctg cag aat acc gcg gcg ttc1680Phe Arg Asn Gly Thr Tyr Glu Phe Ile Leu Gln Asn Thr Ala Ala Phe545 550 555 560cac atc tga1689His Ile<210>12<211>562<212>PRT<213>黑曲霉(Aspergillus niger)<400>12Met Ala Ile Met Lys Ala Leu Leu Trp Leu Ser Leu Ser Leu Ala Val1 5 10 15Trp Ala Thr Pro Val Gln Arg Asp Ala Ala Pro Thr Val Thr Ile Ala20 25 30His Pro Ser Ala Thr Val Ile Gly Lys Ser Gly Asn Val Glu Ser Phe35 40 45Asn Asn Ile Pro Phe Ala Gln Ala Pro Thr Gly Ser Leu Arg Leu Lys50 55 60Pro Pro Gln Pro Leu Glu Thr Ala Leu Gly Thr Val Gln Ala Thr Gly65 70 75 80Ala Ser Gln Ser Cys Pro Gln Met Tyr Phe Thr Thr Asp Glu Ser Glu85 90 95Phe Pro Thr Ser Val Ile Gly Leu Leu Ala Asp Leu Pro Leu Val Gln
100 105 110Ser Ala Thr Asn Ala Leu Glu Asp Cys Leu Asn Ile Asp Ile Arg Arg115 120 125Pro Ala Gly Thr Thr Ala Asp Ser Lys Leu Pro Val Leu Val Trp Ile130 135 140Phe Gly Gly Gly Phe Glu Leu Gly Ser Lys Ala Met Tyr Asp Gly Thr145 150 155 160Thr Met Val Ser Ser Ser Ile Asp Lys Asn Met Pro Ile Val Phe Val165 170 175Ala Met Asn Tyr Arg Val Gly Gly Phe Gly Phe Leu Pro Gly Lys Glu180 185 190Ile Leu Glu Asp Gly Ser Ala Asn Leu Gly Leu Leu Asp Gln Arg Leu195 200 205Ala Leu Gln Trp Val Ala Asp Asn Ile Glu Ala Phe Gly Gly Asp Pro210 215 220Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly Ala Ile Ser Val Phe225 230 235 240Asp Gln Met Ile Leu Tyr Asp Gly Asn Ile Th rTyr Lys Asp Lys Pro245 250 255Leu Phe Arg Gly Ala Ile Met Asp Ser Gly Ser Val Val Pro Ala Asp260 265 270Pro Val Asp Gly Val Lys Gly Gln Gln Val Tyr Asp Ala Val Val Glu275 280 285Ser Ala Gly Cys Ser Ser Ser Asn Asp Thr Leu Ala Cys Leu Arg Glu290 295 300Leu Asp Tyr Thr Asp Phe Leu Asn Ala Ala Asn Ser Val Pro Gly Ile305 310 315 320Leu Ser Tyr His Ser Val Ala Leu Ser Tyr Val Pro Arg Pro Asp Gly325 330 335Thr Ala Leu Ser Ala Ser Pro Asp Val Leu Gly Lys Ala Gly Lys Tyr340 345 350Ala Arg Val Pro Phe Ile Val Gly Asp Gln Glu Asp Glu Gly Thr Leu355 360 365Phe Ala Leu Phe Gln Ser Asn Ile Thr Thr Ile Asp Glu Val Val Asp370 375 380Tyr Leu Ala Ser Tyr Phe Phe Tyr Asp Ala Ser Arg Glu Gln Leu Glu385 390 395 400Glu Leu Val Ala Leu Tyr Pro Asp Thr Thr Thr Tyr Gly Ser Pro Phe405 410 415Arg Thr Gly Ala Ala Asn Asn Trp Tyr Pro Gln Phe Lys Arg Leu Ala420 425 430Ala Ile Leu Gly Asp Leu Val Phe Thr Ile Thr Arg Arg Ala Phe Leu435 440 445Ser Tyr Ala Glu Glu Ile Ser Pro Asp Leu Pro Asn Trp Ser Tyr Leu
450 455 460Ala Thr Tyr Asp Tyr Gly Thr Pro Val Leu Gly Thr Phe His Gly Ser465 470 475 480Asp Leu Leu Gln Val Phe Tyr Gly Ile Lys Pro Asn Tyr Ala Ala Ser485 490 495Ser Ser His Thr Tyr Tyr Leu Ser Phe Val Tyr Thr Leu Asp Pro Asn500 505 510Ser Asn Arg Gly Glu Tyr Ile Glu Trp Pro Gln Trp Lys Glu Ser Arg515 520 525Gln Leu Met Asn Phe Gly Ala Asn Asp Ala Ser Leu Leu Thr Asp Asp530 535 540Phe Arg Asn Gly Thr Tyr Glu Phe Ile Leu Gln Asn Thr Ala Ala Phe545 550 555 560His Ile<210>13<211>2097<212>DNA<213>黑曲霉(Aspergillus niger)<400>13cctggctgac gctataccga agacgatgtc gatgtcgtct ttgctcagag gccccgagtc60gtttggggca cgtcaagaaa gtagtcttcg ctgctgcttg aagacatgat caggacacgc120ggttcgacct tcgagtgtac atgatatccg tagaatttgc ttgtgactac caaggcatat180gttagttcgt gcagtggtaa aagcggcttc tcttcttcaa tctgcgaggt ggagatgcct240actatgatcg tcatccaact tggtgtctac aagacgaaca caagcttagt tccgacgaac300cagtgaaaac tctgtaagat atataagagc atcaagagtc ggacttgctt aggagagtgg360atagttgttg atgctcgcgg aagctctcat atagtataga tatgaagtat cggtgagtcg420tagtagtctt tgtattatat agggagaggc tgaatggtgt gggtcatgat aatttccaca480taatagcgat taaagcccta gatcgagggt atcttgaggc ataaatgata gtatcagtgg540acatatcctg agatgaggat gatatgagat gatagagatg aggaagaaag aggaaagaga600gaggcaagaa cagagatttt tatacctttg cagagcagcc catccgtcac tgaattcagg660catcttcact ccatactatc acgagtcaac gtgaagttgt ataagcgtag tgacaggccg720cagtgacgat gatccgtcac tgcggtggct atccgcgact gatcttgcta tccgtgactg780cgttgactct ggtgaaccaa gtgttcggga aggggtgaaa atgaagctga agcgggtcag840ggaacattcc aagcaacact agacgagtca gcgacgagtc agcgatccac tcggtctcac900acgctcccaa tagtctcaat ttggtgccaa tggcaactaa gtattccatc cacttttaat960taaagtgatc agcggtgcac gaattcacat gctggatctg gtacagatca gattaatatc1020tcctggaata cgatgaaggc ccacctcagg attcacgata aatttctggt gactgccagc1080tcgaatggca ttctccgtca ctctacacct gccgttggtt aattctccga acctctaatt1140gtcaatttct gccaaaatgc gtctatcatc gctggccctg gcatccagcg ccatcctacc1200cgccttaggc tacagcatca acgacttctc ctgcaatagc accgaacacc cgaatccagt1260tgtgctccta catgggctag gcgccaccta ctacgaagac ttgaattacc tgcaaggttg1320
gctacagacc caaggctatt gcacttacgc caaaacctac ggtgcatatg aaggcttccc1380ctttgtcggc ggcctcaagg ccatcgccga atcggccacg gaaatcgccg cgtacatccg1440cgaggtgaaa gaaaagacgg gcgccgacaa gattgacctt gtcggtcact ccgaaggcgc1500cttccagacc ctctacgtcc ctaagttcga ggatggtatc tcggagatgc tggataagct1560ggtggccatt gcacctccca ccagaggcac caacttggcg gggatctatg acatcgcata1620tgttctggga aatctatcgc gcgatctgat aggcgacgtc ctggataccg tgggctgcgc1680cgcctgtgat gatctgggtc cggatggagc agcgattgac cgcttgaacg atggcgagcc1740tatcgtgcag ccgggaaata atctaacggt gattgcatcg cggtccgacg aattggtcac1800cccaaccacc acctccttcg tgcatgaaga tggggtgacc aatgaatggg tgcaagacac1860ttgtcctcta gaccctgtcg gtcatatcgg tgaggcatac gatctgaacg tctggaattt1920ggtcaaaaac gccttggact ctacgccgaa gcgtgagttc gtctgctcgc tgggatctcc1980cggcaggtga gactatcatc ttctgaaaat ttgtatataa gcatttatat ttggataccc2040ggttaccagt cattagtgtc ataatgtata ataatatcac cacaacttcc tccaagc 2097<210>14<211>834<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(834)<400>14atg cgt cta tca tcg ctg gcc ctg gca tcc agc gcc atc cta ccc gcc48Met Arg Leu Ser Ser Leu Ala Leu Ala Ser Ser Ala Ile Leu Pro Ala1 5 10 15tta ggc tac agc atc aac gac ttc tcc tgc aat agc acc gaa cac ccg96Leu Gly Tyr Ser Ile Asn Asp Phe Ser Cys Asn Ser Thr Glu His Pro20 25 30aat cca gtt gtg ctc cta cat ggg cta ggc gcc acc tac tac gaa gac144Asn Pro Val Val Leu Leu His Gly Leu Gly Ala Thr Tyr Tyr Glu Asp35 40 45ttg aat tac ctg caa ggt tgg cta cag acc caa ggc tat tgc act tac192Leu Asn Tyr Leu Gln Gly Trp Leu Gln Thr Gln Gly Tyr Cys Thr Tyr50 55 60gcc aaa acc tac ggt gca tat gaa ggc ttc ccc ttt gtc ggc ggc ctc240Ala Lys Thr Tyr Gly Ala Tyr Glu Gly Phe Pro Phe Val Gly Gly Leu65 70 75 80aag gcc atc gcc gaa tcg gcc acg gaa atc gcc gcg tac atc cgc gag288Lys Ala Ile Ala Glu Ser Ala Thr Glu Ile Ala Ala Tyr Ile Arg Glu85 90 95gtg aaa gaa aag acg ggc gcc gac aag att gac ctt gtc ggt cac tcc336
Val Lys Glu Lys Thr Gly Ala Asp Lys Ile Asp Leu Val Gly His Ser100 105 110gaa ggc gcc ttc cag acc ctc tac gtc cct aag ttc gag gat ggt atc384Glu Gly Ala Phe Gln Thr Leu Tyr Val Pro Lys Phe Glu Asp Gly Ile115 120 125tcg gag atg ctg gat aag ctg gtg gcc att gca cct ccc acc aga ggc432Ser Glu Met Leu Asp Lys Leu Val Ala Ile Ala Pro Pro Thr Arg Gly130 135 140acc aac ttg gcg ggg atc tat gac atc gca tat gtt ctg gga aat cta480Thr Asn Leu Ala Gly Ile Tyr Asp Ile Ala Tyr Val Leu Gly Asn Leu145 150 155 160tcg cgc gat ctg ata ggc gac gtc ctg gat acc gtg ggc tgc gcc gcc528Ser Arg Asp Leu Ile Gly Asp Val Leu Asp Thr Val Gly Cys Ala Ala165 170 175tgt gat gat ctg ggt ccg gat gga gca gcg att gac cgc ttg aac gat576Cys Asp Asp Leu Gly Pro Asp Gly Ala Ala Ile Asp Arg Leu Ash Asp180 185 190ggc gag cct atc gtg cag ccg gga aat aat cta acg gtg att gca tcg624Gly Glu Pro Ile Val Gln Pro Gly Asn Asn Leu Thr Val Ile Ala Ser195 200 205cgg tcc gac gaa ttg gtc acc cca acc acc acc tcc ttc gtg cat gaa672Arg Ser Asp Glu Leu Val Th rPro Thr Thr Thr Ser Phe Val His Glu210 215 220gat ggg gtg acc aat gaa tgg gtg caa gac act tgt cct cta gac cct720Asp Gly Val Thr Asn Glu Trp Val Gln Asp Thr Cys Pro Leu Asp Pro225 230 235 240gtc ggt cat atc ggt gag gca tac gat ctg aac gtc tgg aat ttg gtc768Val Gly His Ile Gly Glu Ala Tyr Asp Leu Asn Val Trp Asn Leu Val245 250 255aaa aac gcc ttg gac tct acg ccg aag cgt gag ttc gtc tgc tcg ctg816Lys Asn Ala Leu Asp Ser Thr Pro Lys Arg Glu Phe Val Cys Ser Leu260 265 270gga tct ccc ggc agg tga834Gly Ser Pro Gly Arg275<210>15<211>277<212>PRT<213>黑曲霉(Aspergillus niger)<400>15Met Arg Leu Ser Ser Leu Ala Leu Ala Ser Ser Ala Ile Leu Pro Ala
1 5 10 l5Leu Gly Tyr Ser Ile Asn Asp Phe Ser Cys Asn Ser Thr Glu His Pro20 25 30Asn Pro Val Val Leu Leu His Gly Leu Gly Ala Thr Tyr Tyr Glu Asp35 40 45Leu Asn Tyr Leu Gln Gly Trp Leu Gln Thr Gln Gly Tyr Cys Thr Tyr50 55 60Ala Lys Thr Tyr Gly Ala Tyr Glu Gly Phe Pro Phe Val Gly Gly Leu65 70 75 80Lys Ala Ile Ala Glu Ser Ala Thr Glu Ile Ala Ala Tyr Ile Arg Glu85 90 95Val Lys Glu Lys Thr Gly Ala Asp Lys Ile Asp Leu Val Gly His Ser100 105 110Glu Gly Ala Phe Gln Thr Leu Tyr Val Pro Lys Phe Glu Asp Gly Ile115 120 125Ser Glu Met Leu Asp Lys Leu Val Ala Ile Ala Pro Pro Thr Arg Gly130 135 140Thr Asn Leu Ala Gly Ile Tyr Asp Ile Ala Tyr Val Leu Gly Asn Leu145 150 155 160Ser Arg Asp Leu Ile Gly Asp Val Leu Asp Thr Val Gly Cys Ala Ala165 170 175Cys Asp Asp Leu Gly Pro Asp Gly Ala Ala Ile Asp Arg Leu Asn Asp180 185 190Gly Glu Pro Ile Val Gln Pro Gly Asn Asn Leu Thr Val Ile Ala Ser195 200 205Arg Ser Asp Glu Leu Val Thr Pro Thr Thr Thr Ser Phe Val His Glu210 215 220Asp Gly Val Thr Asn Glu Trp Val Gln Asp Thr Cys Pro Leu Asp Pro225 230 235 240Val Gly His Ile Gly Glu Ala Tyr Asp Leu Asn Val Trp Asn Leu Val245 250 255Lys Asn Ala Leu Asp Ser Thr Pro Lys Arg Glu Phe Val Cys Ser Leu260 265 270Gly Ser Pro Gly Arg275<210>16<211>1881<212>DNA<213>黑曲霉(Aspergillus niger)<400>16ccgagtgatc cgcgacttct gggtcagctt tgttctgcgg gctccaccag tgccgtcatc60
gcacgcgaga cccgccccgg atgcttagct gaagccggca tagtccatcc ccgctcgggc120gtgatgccca acggtcactg gaggagaggt gcagggagga tgccgttgca tgaatcaagc180ccggggtttg actttcatcc gctcgtttcc tactggcggg ttcgccctct ccatcgaagc240cacggatcct tccatccgga tcctggcaga acagtgagga agcagagctt ggttatagta300gaaattatta ataccgagct ggtctgccca tttttcccaa accttccctc tttccatccc360tctcgcctcg cacccccttt atcctccctc ccgccatgta tatcccctcg gtgctgcttc420tggccgcgag cctgttccat ggcgcaacgg cgctgcccac gcccggctcc acgcccatcc480cgcccagcca ggatccctgg tacagtgcgc ccgagggctt cgaggaggct gatcccggtg540ccatcctgcg cgtgcggccc gcgcccggca acttgaccgt ggtagtgggc aatgcgtcgg600cggcctacaa catcctctac cgcactacag acagtcagta caagccctcc tgggctgtga660ccaccctgct ggtgcccccc gtggccgcct ccgccgccgt caaccagagt gtcctgctct720cccaccagat cgcctacgat tcgttcgacg tcaatgccag tcccagctac gccatgtaca780ccagcccgcc ctccgatatt atcctcgccc tgcagcgcgg ctggttcgtt aacgtccccg840attacgaggg ccccaatgcc tctttcaccg ccggtgtgca gtccggccat gccaccctcg900actcggtccg cagcgtgctc gcctccggat tcggcctgaa cgaggacgcc cagtacgctc960tgtggggtta ctctggcggt gccttggcca gcgaatgggc tgctgaactg cagatgcaat1020acgctcccga gttgaacatt gccggtctgg ccgtgggtgg tctcactccc aatgttacca1080gcgtcatgga cacggtgacc tcgaccatca gtgcgggact catccccgcc gccgccctgg1140gtctgtcgag ccagcacccc gagacctacg agttcatcct cagccagctc aagacgacgg1200gaccctacaa ccgcacagga ttcctagccg ccaaggacct gaccctgtcc gaggcggagg1260tcttctacgc cttccagaac atcttcgatt actttgtcaa cggatcggcc acgttccagg1320cggaggtggt gcagaaggcg ctgaaccagg acggatacat gggctaccat gggttcccgc1380agatgccggt gctcgcgtac aaggctattc acgatgagat cagtcccatc caggatacgg1440atcgcgtgat caagcgctac tgtggtctgg gattgaacat cttgtatgag cggaacacca1500tcggtggcca ctcggcagag caggtgaatg gcaacgccag ggcgtggaac tggttgacga1560gcattttcga cggaacgtat gcgcagcagt acaagaccga ggggtgcacg atccgcaatg1620tcactctgaa cacgacttcc tccgtttatt agagaggggg ctgttgttat gtgaataatg1680ctgaagatgg ctgtgtatgg acggtccgct ctcctgtata gtaatgggct aatgcatgcg1740gcttcatgaa catggtacga aagattagat tatgtatata gtgtggaagt ggtaatgatg1800atataatatc tgtctatgat ctatgttcct gctattctat acaaacgcga ccattcacag1860aatgactact ggcacatctg c 1881<210>17<211>1257<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1257)<400>17atg tat atc ccc tcg gtg ctg ctt ctg gcc gcg agc ctg ttc cat ggc 48
Met Tyr Ile Pro Ser Val Leu Leu Leu Ala Ala Ser Leu Phe His Gly1 5 10 15gca acg gcg ctg ccc acg ccc ggc tcc acg ccc atc ccg ccc agc cag96Ala Thr Ala Leu Pro Thr Pro Gly Ser Thr Pro Ile Pro Pro Ser Gln20 25 30gat ccc tgg tac agt gcg ccc gag ggc ttc gag gag gct gat ccc ggt144Asp Pro Trp Tyr Ser Ala Pro Glu Gly Phe Glu Glu Ala Asp Pro Gly35 40 45gcc atc ctg cgc gtg cgg ccc gcg ccc ggc aac ttg acc gtg gta gtg192Ala Ile Leu Arg Val Arg Pro Ala Pro Gly Asn Leu Thr Val Val Val50 55 60ggc aat gcg tcg gcg gcc tac aac atc ctc tac cgc act aca gac agt240Gly Asn Ala Ser Ala Ala Tyr Asn Ile Leu Tyr Arg Thr Thr Asp Ser65 70 75 80cag tac aag ccc tcc tgg gct gtg acc acc ctg ctg gtg ccc ccc gtg288Gln Tyr Lys Pro Ser Trp Ala Val Thr Thr Leu Leu Val Pro Pro Val85 90 95gcc gcc tcc gcc gcc gtc aac cag agt gtc ctg ctc tcc cac cag atc336Ala Ala Ser Ala Ala Val Asn Gln Ser Val Leu Leu Ser His Gln Ile100 105 110gcc tac gat tcg ttc gac gtc aat gcc agt ccc agc tac gcc atg tac384Ala Tyr Asp Ser Phe Asp Val Asn Ala Ser Pro Ser Tyr Ala Met Tyr115 120 125acc agc ccg ccc tcc gat att atc ctc gcc ctg cag cgc ggc tgg ttc432Thr Ser Pro Pro Ser Asp Ile Ile Leu Ala Leu Gln Arg Gly Trp Phe130 135 140gtt aac gtc ccc gat tac gag ggc ccc aat gcc tct ttc acc gcc ggt480Val Asn Val Pro Asp Tyr Glu Gly Pro Asn Ala Ser Phe Thr Ala Gly145 150 155 160gtg cag tcc ggc cat gcc acc ctc gac tcg gtc cgc agc gtg ctc gcc528Val Gln Ser Gly His Ala Thr Leu Asp Ser Val Arg Ser Val Leu Ala165 170 175tcc gga ttc ggc ctg aac gag gac gcc cag tac gct ctg tgg ggt tac576Ser Gly Phe Gly Leu Asn Glu Asp Ala Gln Tyr Ala Leu Trp Gly Tyr180 185 190tct ggc ggt gcc ttg gcc agc gaa tgg gct gct gaa ctg cag atg caa624Ser Gly Gly Ala Leu Ala Ser Glu Trp Ala Ala Glu Leu Gln Met Gln195 200 205tac gct ccc gag ttg aac att gcc ggt ctg gcc gtg ggt ggt ctc act672Tyr Ala Pro Glu Leu Asn Ile Ala Gly Leu Ala Val Gly Gly Leu Thr210 215 220ccc aat gtt acc agc gtc atg gac acg gtg acc tcg acc atc agt gcg720Pro Asn Val Thr Ser Val Met Asp Thr Val Thr Ser Thr Ile Ser Ala225 230 235 240
gga ctc atc ccc gcc gcc gcc ctg ggt ctg tcg agc cag cac ccc gag768Gly Leu Ile Pro Ala Ala Ala Leu Gly Leu Ser Ser Gln His Pro Glu245 250 255acc tac gag ttc atc ctc agc cag ctc aag acg acg gga ccc tac aac816Thr Tyr Glu Phe Ile Leu Ser Gln Leu Lys Thr Thr Gly Pro Tyr Asn260 265 270cgc aca gga ttc cta gcc gcc aag gac ctg acc ctg tcc gag gcg gag864Arg Thr Gly Phe Leu Ala Ala Lys Asp Leu Thr Leu Ser Glu Ala Glu275 280 285gtc ttc tac gcc ttc cag aac atc ttc gat tac ttt gtc aac gga tcg912Val Phe Tyr Ala Phe Gln Asn Ile Phe Asp Tyr Phe Val Asn Gly Ser290 295 300gcc acg ttc cag gcg gag gtg gtg cag aag gcg ctg aac cag gac gga960Ala Thr Phe Gln Ala Glu Val Val Gln Lys Ala Leu Asn Gln Asp Gly305 310 315 320tac atg ggc tac cat ggg ttc ccg cag atg ccg gtg ctc gcg tac aag1008Tyr Met Gly Tyr His Gly Phe Pro Gln Met Pro Val Leu Ala Tyr Lys325 330 335gct att cac gat gag atc agt ccc atc cag gat acg gat cgc gtg atc1056Ala Ile His Asp Glu Ile Ser Pro Ile Gln Asp Thr Asp Arg Val Ile340 345 350aag cgc tac tgt ggt ctg gga ttg aac atc ttg tat gag cgg aac acc1104Lys Arg Tyr Cys Gly Leu Gly Leu Asn Ile Leu Tyr Glu Arg Asn Thr355 360 365atc ggt ggc cac tcg gca gag cag gtg aat ggc aac gcc agg gcg tgg1152Ile Gly Gly His Ser Ala Glu Gln Val Asn Gly Asn Ala Arg Ala Trp370 375 380aac tgg ttg acg agc att ttc gac gga acg tat gcg cag cag tac aag1200Asn Trp Leu Thr Ser Ile Phe Asp Gly Thr Tyr Ala Gln Gln Tyr Lys385 390 395 400acc gag ggg tgc acg atc cgc aat gtc act ctg aac acg act tcc tcc1248Thr Glu Gly Cys Thr Ile Arg Asn Val Thr Leu Asn Thr Thr Ser Ser405 410 415gtt tat tag1257Val Tyr<210>18<211>418<212>PRT<213>黑曲霉(Aspergillus niger)<400>18Met Tyr Ile Pro Ser Val Leu Leu Leu Ala Ala Ser Leu Phe His Gly
1 5 10 15Ala Thr Ala Leu Pro Thr Pro Gly Ser Thr Pro Ile Pro Pro Ser Gln20 25 30Asp Pro Trp Tyr Ser Ala Pro Glu Gly Phe Glu Glu Ala Asp Pro Gly35 40 45Ala Ile Leu Arg Val Arg Pro Ala Pro Gly Asn Leu Thr Val Val Val50 55 60Gly Asn Ala Ser Ala Ala Tyr Asn Ile Leu Tyr Arg Thr Thr Asp Ser65 70 75 80Gln Tyr Lys Pro Ser Trp Ala Val Thr Thr Leu Leu Val Pro Pro Val85 90 95Ala Ala Ser Ala Ala Val Asn Gln Ser Val Leu Leu Ser His Gln Ile100 105 110Ala Tyr Asp Ser Phe Asp Val Asn Ala Ser Pro Ser Tyr Ala Met Tyr115 120 125Thr Ser Pro Pro Ser Asp Ile Ile Leu Ala Leu Gln Arg Gly Trp Phe130 135 140Val Asn Val Pro Asp Tyr Glu Gly Pro Asn Ala Ser Phe Thr Ala Gly145 150 155 160Val Gln Ser Gly His Ala Thr Leu Asp Ser Val Arg Ser Val Leu Ala165 170 175Ser Gly Phe Gly Leu Asn Glu Asp Ala Gln Tyr Ala Leu Trp Gly Tyr180 185 190Ser Gly Gly Ala Leu Ala Ser Glu Trp Ala Ala Glu Leu Gln Met Gln195 200 205Tyr Ala Pro Glu Leu Asn Ile Ala Gly Leu Ala Val Gly Gly Leu Thr210 215 220Pro Asn Val Thr Ser Val Met Asp Thr Val Thr Ser Thr Ile Ser Ala225 230 235 240Gly Leu Ile Pro Ala Ala Ala Leu Gly Leu Ser Ser Gln His Pro Glu245 250 255Thr Tyr Glu Phe Ile Leu Ser Gln Leu Lys Thr Thr Gly Pro Tyr Asn260 265 270Arg Thr Gly Phe Leu Ala Ala Lys Asp Leu Thr Leu Ser Glu Ala Glu275 280 285Val Phe Tyr Ala Phe Gln Asn Ile Phe Asp Tyr Phe Val Asn Gly Ser290 295 300Ala Thr Phe Gln Ala Glu Val Val Gln Lys Ala Leu Asn Gln Asp Gly305 310 315 320Tyr Met Gly Tyr His Gly Phe Pro Gln Met Pro Val Leu Ala Tyr Lys325 330 335Ala Ile His Asp Glu Ile Ser Pro Ile Gln Asp Thr Asp Arg Val Ile340 345 350Lys Arg Tyr Cys Gly Leu Gly Leu Asn Ile Leu Tyr Glu Arg Asn Thr
355 360 365Ile Gly Gly His Ser Ala Glu Gln Val Asn Gly Asn Ala Arg Ala Trp370 375 380Asn Trp Leu Thr Ser Ile Phe Asp Gly Thr Tyr Ala Gln Gln Tyr Lys385 390 395 400Thr Glu Gly Cys Thr Ile Arg Asn Val Thr Leu Asn Thr Thr Ser Ser405 410 415Val Tyr<210>19<211>2809<212>DNA<213>黑曲霉(Aspergillus niger)<400>19agtaatgtat catttgaaag atcagtaaat gaaatctgct gcacaatgca cgctttgaga60acgacgatgc gaatcgtaga atgcccaagt cagtctgcgt ggtcagacga gacccataca120ttgcatatgt acaatctagt agtataatat ggtgtaaatc cccataacct gatactcata180cacactatca gggcttgggt acatgagcga agtagtccca acaatcaaac aatcatccaa240actccaagcc aaatgccagc gaaaacaaca aaagcacaac atgatgttac agtgcactag300ggaaaccaat ctgtgtcacc atcactcagg acaccagata taacgaaccc ccctcacaga360ccacgagtct tctccggatc catctgcacc tcatcaccgc taatttcctt gaccgtctca420aacgccggct tgcccgcata tagctgctgg gacgagctgg agccgccgcc ttccgtcgtc480gataccgaga tgggctggtt tccgcggaac cgcttgcgca tatcgatcag gccgcgtcta540tagaaggaca aacagttagt aaccctgatg acttggcggt gattgcgttt tacaagaagg600tagcggctct ttactcactt gcactcgctg aatcccttcc gcaattgctg gcatcgcatg660ggaagctcgt cgacgtacgg ctcactcaga cattcgcggg gcgagcgccg ttgcaccatg720atgcagtctg attcttggag acattgggcc agagcatttc ctgttcatcc aggtgagatt780gattagagag tgtggagctg aagctgaagt tggggacaat gaggtggtga tctccgttcg840gggatacgtc gagtatccaa gccgcaattt aagagtatgg taaaggatat aagggtcaaa900cgtactgatc tcttggcagg aactcggcat tttggcgaac aacaatggcc gaattgctca960gccaactgac aagcaggaac aataccggtc tgcggcggcg gacatctgga gataatttgt1020ctgatcggaa aacaaactca accaacgggc cttgccccgg attaggtaag ccatcacatg1080aagaaggccc ccatgacgtc tggggggaat cctgacttgc tgcttgttcc gcttgattta1140tcctcttccc ctagtcatgc ggtcttgggt ctttgaagca ttgcttcggc gcattatggt1200tcactactac tactgcaggt gataagtatt ttagttggtt gatttgcaaa ttgtccatcc1260cttttcgata ataggaggtt tggtcttaat cgtcatggcg cgcgttccgg tcattggacg1320gctgttttgg ttcgagtatt tggccctttt tgggtcgctg attttggtat tgctggaatg1380ggttatacat attatcacat tctgtctgcg taagtagtgt gttcattctc tggaattgtg1440gtctatgtcg aggggcaaga gctaactgac gcagctgaac ctgttattaa gttctgttac1500gatcgatcca agactatctt caacgccttc attcctcccg atgacccggc taagcgcggt1560aaagaagaga aaattgctgc gtcggttgct ctggcgtcgg acttcacgga tatatgcgcg1620ctgttcggat atgaggcgga ggaacatatc gtccagacag gggatggcta tctgcttggt1680
ctgcaccgac tgccctatcg gaaaggagag gaggggagga agatcaacca gggcgaaggg1740agcatcaaga agaaggtcgt ctatctccac catggtctca tgatgtgcag tgaagtctgg1800atctgtctgt cagaggagca gcgatgcctt ccgtttcaat tagtcgaaag gggctatgac1860gtgtggttgg ggaacaatag aggaaacaag tactcgaaga agtccgtcaa gcattcgccc1920ctgtcgaacg agttctggga cttttcgatc gatcagttct cgttccatga tatcccagac1980agcatcaagt atatcctgga agtgacaggg cagccctccc tgtcatacgt ggggttctcg2040cagggaacag cgcaggcatt tgcgacgctg tccattcatc ctttgttgaa tcagaagatc2100gatgtctttg tggctctcgc gccggcaatg gctccgacag gtcttccaaa tcatctcgtg2160gactcgctca tgaaggcttc gccgaacttc ctgtttctgc tgtttggcag acgcagcatc2220cttagctcaa cgacgatgtg gcagacaatt ctctacccgc ctatctttgt ttggatcatc2280gacacgtcac ttcgcggcct gttcaattgg aggtgcaaga acatcagccg ctggcagaag2340ctggcagggt acctgcatct gttttccttc actagcacca agtcggtcgt ccattggttc2400cagattattc ggcaccggaa tttccagttc tacgatgacg aaatccatgc cccgctcagt2460attgtggcca gtgagcgatt ttacaagccg gtcaagtacc cgactaagaa cattaagacg2520cccattgtcc tgttgtatgg cggtagcgat agtctcgttg atatcaacgt gatgttgtcc2580gagctccctc gcgggaccgt ggcgaaggaa atcccgcagt atgagcattt agatttcttg2640tgggcgcgtg atgtggacca attggtattc aaccatgtct tcgaagcgct ggagcggtac2700agctcggaga atcagaaagg gacattgatg gagaaggtta atggtgccgc gggcacatat2760gtaccgacat aaagtacgag gtcctgcacc aatgaagaca cgcataatc2809<210>20<211>1413<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1413)<400>20atg gcg cgc gtt ccg gtc att gga cgg ctg ttt tgg ttc gag tat ttg48Met Ala Arg Val Pro Val Ile Gly Arg Leu Phe Trp Phe Glu Tyr Leu1 5 10 15gcc ctt ttt ggg tcg ctg att ttg gta ttg ctg gaa tgg gtt ata cat96Ala Leu Phe Gly Ser Leu Ile Leu Val Leu Leu Glu Trp Val Ile His20 25 30att atc aca ttc tgt ctg cct gaa cct gtt att aag ttc tgt tac gat144Ile Ile Thr Phe Cys Leu Pro Glu Pro Val Ile Lys Phe Cys Tyr Asp35 40 45cga tcc aag act atc ttc aac gcc ttc att cct ccc gat gac ccg gct192Arg Ser Lys Thr Ile Phe Asn Ala Phe Ile Pro Pro Asp Asp Pro Ala50 55 60aag cgc ggt aaa gaa gag aaa att gct gcg tcg gtt gct ctg gcg tcg240
Lys Arg Gly Lys Glu Glu Lys Ile Ala Ala Ser Val Ala Leu Ala Ser65 70 75 80gac ttc acg gat ata tgc gcg ctg ttc gga tat gag gcg gag gaa cat288Asp Phe Thr Asp Ile Cys Ala Leu Phe Gly Tyr Glu Ala Glu Glu His85 90 95atc gtc cag aca ggg gat ggc tat ctg ctt ggt ctg cac cga ctg ccc336Ile Val Gln Thr Gly Asp Gly Tyr Leu Leu Gly Leu His Arg Leu Pro100 105 110tat cgg aaa gga gag gag ggg agg aag atc aac cag ggc gaa ggg agc384Tyr Arg Lys Gly Glu Glu Gly Arg Lys Ile Asn Gln Gly Glu Gly Ser115 120 125atc aag aag aag gtc gtc tat ctc cac cat ggt ctc atg atg tgc agt432Ile Lys Lys Lys Val Val Tyr Leu His His Gly Leu Met Met Cys Ser130 135 140gaa gtc tgg atc tgt ctg tca gag gag cag cga tgc ctt ccg ttt caa480Glu Val Trp Ile Cys Leu Ser Glu Glu Gln Arg Cys Leu Pro Phe Gln145 150 155 160tta gtc gaa agg ggc tat gac gtg tgg ttg ggg aac aat aga gga aac528Leu Val Glu Arg Gly Tyr Asp Val Trp Leu Gly Asn Asn Arg Gly Asn165 170 175aag tac tcg aag aag tcc gtc aag cat tcg ccc ctg tcg aac gag ttc576Lys Tyr Ser Lys Lys Ser Val Lys His Ser Pro Leu Ser Asn Glu Phe180 185 190tgg gac ttt tcg atc gat cag ttc tcg ttc cat gat atc cca gac agc624Trp Asp Phe Ser Ile Asp Gln Phe Ser Phe His Asp Ile Pro Asp Ser195 200 205atc aag tat atc ctg gaa gtg aca ggg cag ccc tcc ctg tca tac gtg672Ile Lys Tyr Ile Leu Glu Val Thr Gly Gln Pro Ser Leu Ser Tyr Val210 215 220ggg ttc tcg cag gga aca gcg cag gca ttt gcg acg ctg tcc att cat720Gly Phe Ser Gln Gly Thr Ala Gln Ala Phe Ala Thr Leu Ser Ile His225 230 235 240cct ttg ttg aat cag aag atc gat gtc ttt gtg gct ctc gcg ccg gca768Pro Leu Leu Asn Gln Lys Ile Asp Val Phe Val Ala Leu Ala Pro Ala245 250 255atg gct ccg aca ggt ctt cca aat cat ctc gtg gac tcg ctc atg aag816Met Ala Pro Thr Gly Leu Pro Asn His Leu Val Asp Ser Leu Met Lys260 265 270gct tcg ccg aac ttc ctg ttt ctg ctg ttt ggc aga cgc agc atc ctt864Ala Ser Pro Asn Phe Leu Phe Leu Leu Phe Gly Arg Arg Ser Ile Leu275 280 285agc tca acg acg atg tgg cag aca att ctc tac ccg cct atc ttt gtt912Ser Ser Thr Thr Met Trp Gln Thr Ile Leu Tyr Pro Pro Ile Phe Val290 295 300
tgg atc atc gac acg tca ctt cgc ggc ctg ttc aat tgg agg tgc aag960Trp Ile Ile Asp Thr Ser Leu Arg Gly Leu Phe Asn Trp Arg Cys Lys305 310 315 320aac atc agc cgc tgg cag aag ctg gca ggg tac ctg cat ctg ttt tcc1008Asn Ile Ser Arg Trp Gln Lys Leu Ala Gly Tyr Leu His Leu Phe Ser325 330 335ttc act agc acc aag tcg gtc gtc cat tgg ttc cag att att cgg cac1056Phe Thr Ser Thr Lys Ser Val Val His Trp Phe Gln Ile Ile Arg His340 345 350cgg aat ttc cag ttc tac gat gac gaa ate cat gcc ccg ctc agt att1104Arg Asn Phe Gln Phe Tyr Asp Asp Glu Ile His Ala Pro Leu Ser Ile355 360 365gtg gcc agt gag cga ttt tac aag ccg gtc aag tac ccg act aag aac1152Val Ala Ser Glu Arg Phe Tyr Lys Pro Val Lys Tyr Pro Thr Lys Asn370 375 380att aag acg ccc att gtc ctg ttg tat ggc ggt agc gat agt ctc gtt1200Ile Lys Thr Pro Ile Val Leu Leu Tyr Gly Gly Ser Asp Ser Leu Val385 390 395 400gat atc aac gtg atg ttg tcc gag ctc cct cgc ggg acc gtg gcg aag1248Asp Ile Asn Val Met Leu Ser Glu Leu Pro Arg Gly Thr Val Ala Lys405 410 415gaa atc ccg cag tat gag cat tta gat ttc ttg tgg gcg cgt gat gtg1296Glu Ile Pro Gln Tyr Glu His Leu Asp Phe Leu Trp Ala Arg Asp Val420 425 430gac caa ttg gta ttc aac cat gtc ttc gaa gcg ctg gag cgg tac agc1344Asp Gln Leu Val Phe Asn His Val Phe Glu Ala Leu Glu Arg Tyr Ser435 440 445tcg gag aat cag aaa ggg aca ttg atg gag aag gtt aat ggt gcc gcg1392Ser Glu Asn Gln Lys Gly Thr Leu Met Glu Lys Val Asn Gly Ala Ala450 455 460ggc aca tat gta ccg aca taa1413Gly Thr Tyr Val Pro Thr465 470<210>21<211>470<212>PRT<213>黑曲霉(Aspergillus niger)<400>21Met Ala Arg Val Pro Val Ile Gly Arg Leu Phe Trp Phe Glu Tyr Leu1 5 10 15Ala Leu Phe Gly Ser Leu Ile Leu Val Leu Leu Glu Trp Val Ile His
20 25 30Ile Ile Thr Phe Cys Leu Pro Glu Pro Val Ile Lys Phe Cys Tyr Asp35 40 45Arg Ser Lys Thr Ile Phe Asn Ala Phe Ile Pro Pro Asp Asp Pro Ala50 55 60Lys Arg Gly Lys Glu Glu Lys Ile Ala Ala Ser Val Ala Leu Ala Ser65 70 75 80Asp Phe Thr Asp Ile Cys Ala Leu Phe Gly Tyr Glu Ala Glu Glu His85 90 95Ile Val Gln Thr Gly Asp Gly Tyr Leu Leu Gly Leu His Arg Leu Pro100 105 110Tyr Arg Lys Gly Glu Glu Gly Arg Lys Ile Asn Gln Gly Glu Gly Ser115 120 125Ile Lys Lys Lys Val Val Tyr Leu His His Gly Leu Met Met Cys Ser130 135 140Glu Val Trp Ile Cys Leu Ser Glu Glu Gln Arg Cys Leu Pro Phe Gln145 150 155 160Leu Val Glu Arg Gly Tyr Asp Val Trp Leu Gly Asn Asn Arg Gly Asn165 170 175Lys Tyr Ser Lys Lys Ser Val Lys His Ser Pro Leu Ser Asn Glu Phe180 185 190Trp Asp Phe Ser Ile Asp Gln Phe Ser Phe His Asp Ile Pro Asp Ser195 200 205Ile Lys Tyr Ile Leu Glu Val Thr Gly Gln Pro Ser Leu Ser Tyr Val210 215 220Gly Phe Ser Gln Gly Thr Ala Gln Ala Phe Ala Thr Leu Ser Ile His225 230 235 240Pro Leu Leu Asn Gln Lys Ile Asp Val Phe Val Ala Leu Ala Pro Ala245 250 255Met Ala Pro Thr Gly Leu Pro Asn His Leu Val Asp Ser Leu Met Lys260 265 270Ala Ser Pro Asn Phe Leu Phe Leu Leu Phe Gly Arg Arg Ser Ile Leu275 280 285Ser Ser Thr Thr Met Trp Gln Thr Ile Leu Tyr Pro Pro Ile Phe Val290 295 300Trp Ile Ile Asp Thr Ser Leu Arg Gly Leu Phe Asn Trp Arg Cys Lys305 310 315 320Asn Ile Ser Arg Trp Gln Lys Leu Ala Gly Tyr Leu His Leu Phe Ser325 330 335Phe Thr Ser Thr Lys Ser Val Val His Trp Phe Gln Ile Ile Arg His340 345 350Arg Asn Phe Gln Phe Tyr Asp Asp Glu Ile His Ala Pro Leu Ser Ile355 360 365Val Ala Ser Glu Arg Phe Tyr Lys Pro Val Lys Tyr Pro Thr Lys Asn
370 375 380Ile Lys Thr Pro Ile Val Leu Leu Tyr Gly Gly Ser Asp Ser Leu Val385 390 395 400Asp Ile Asn Val Met Leu Ser Glu Leu Pro Arg Gly Thr Val Ala Lys405 410 415Glu Ile Pro Gln Tyr Glu His Leu Asp Phe Leu Trp Ala Arg Asp Val420 425 430Asp Gln Leu Val Phe Asn His Val Phe Glu Ala Leu Glu Arg Tyr Ser435 440 445Ser Glu Asn Gln Lys Gly Thr Leu Met Glu Lys Val Asn Gly Ala Ala450 455 460Gly Thr Tyr Val Pro Thr465 470<210>22<211>3328<212>DNA<213>黑曲霉(Aspergillus niger)<400>22gatttatgaa gacaggggag ctctcagtag atgatcttcg cacaattgca cttcctgggg60agcctgttta gtctctagtg aattattgat agacaggtca tctgcctcga gggggttcta120ctaacaacgt gatatctatg ttgctccttt actttagaag aaaggttctg cttggtagct180ggaacccagt atatagttga tgtgagtata tgaagattcc aatgctttgg aatattccgc240cgtggctgaa tgatgggact ctcactgcca agccaaggga ttcctcccga aatttttgca300catatgttgt tgatgcctta tccctctggc attcactcgt tgctgcctcg ggtgggaccc360gacagtcctc aaacgatgaa atcttattgg ctctgctagt tgagctcggt ttcaccattt420ctattggcgc tttctcactc tactccatat tacagcttcc gctttgcaat gcggggctgt480gctgcgactt tgaattgctc gcatagcaag agacactgac cagcaatcca gctcttctgc540ccacatatgt tgcctttgcc ttagtatctc ataatttatg tgtccagtga gacagtttgt600ttgtactgta gcttgagttg ggaatcgtgt cctgtgacca tggaaatata tattctggat660ctcagaacat ctctaccgtt tgtaattttt gatatacttc ccaggatggg acaatgggga720cgatgagtat tgggatgcca tatcacttga aagcctctta gacagactgc acctattttt780attatgctaa attctttacg agacactttc ttcaagtttc tggccctttg tgaggcagag840tgaaacacga gcgttcaaac ttgtgttgta gatgtttatg atatttatct cagacagtct900ttccacatcc tgtaatcccc aacagaaaaa gatacacagt atatcactag aagctcctaa960tagttatcat gctgcaccct aacagcaatg cagtcaccct gctgcgtcag cgaccccgat1020tccggagaag tatccgagat agcgataagg atgcggagat aagattggca agtggagatg1080agaaagatat cctcggcctc agaagtaggc ccgatgataa ataactagtg aacaagtccc1140ccgcccttct ccgagcaaac tacacttcaa catgctgaat gcacgctcca ttgctctggc1200ctcgttgcca gttcttctcc tactattcgc ccagcaactt gcctctcacc caaccgagca1260gattcaagcc attctggctc cgtgggtccc ggccgcacta caagatgtcg tgctctataa1320tcgacctcgc gtcataatcc cccagggcac tgtcgtcggc acgaccttga cagacacgct1380
caagtccccg gtagatgctt tccgaggaat tccatacgca ttgcctccaa ttggggatag1440acggtttcgc cgtgcggagg ctgtccatgc gacggacgag attatcgatg ctagtgaatt1500cggcccaagg tatgcttctt atacgacatt cagatcatat ctgacctttc aggtgccctg1560gaaagcagct cttgaatcca aatgacatag gtggtgatga agactgtctc acagtcaatg1620tcttccggcc tcatggcgct cagggaaaac tccctgtcgc tgtatacgtg cacggcggag1680cctacaatcg cggcactggt aggtgtatca ccctcagtcc tctatatacc cacagctaaa1740tatccagcct ccggacacaa cacggcctcg atggtcggct ggtcggacga gcccttcgtt1800gcagtcagct tcaactaccg gtacgtcctc aaacctgtcc tccgaatcaa ctcaactaac1860aacccatcag catcggcgcc ctcggcttcc tcccatccac cctaaccgcc aaagaaggaa1920tcctcaacct aggcctccat gaccagatcc tcctgctgca atgggtccaa gaaaacatcg1980cacatttcaa cggcgaccca acccaagtca ctctaatcgg cctctccgcc ggcgcgcact2040ccgtatgccc ccttctaaga tacaaataga actcagtccc ctacccccaa actaacgcca2100cacagatagc ccaccacatc atgaactaca acccaccaaa cacccccctc tttcaccgcg2160ccatcatcga atccggcgcc gccacctccc gcgccgtcca cccctacaac gcctccctcc2220acgaatccca attcacagac ttcctcactg aaacgggctg cactaacctc cccgacactg2280ccattttgcc ctgtctccgc gccctcccat cctcagccat taccaccgcc tccatctccg2340tcttcgacaa atacaacccc tccatccgct gggccttcca acccgtcatc gaccacgaga2400tcatccaccg ccggcccatc gacgcctggc gctcaggaaa gtggaatagg atgcccatcc2460taacgggctt caactcgaac gaggggacat actacgtccc tcgcaacctc tctctctccg2520aggatttcac ttcgttcttc cgaaccctcc tccccgcgta ccccgagagc gacatccaga2580ccatcgatga gatctacccc gatccgaatg tatatgctac ggcgtcgcca tacctcgaga2640caaggccgat cccgagtcta ggaaggcagt ttaagcggct ggaggcggcg tatgggcatt2700atgcgtatgc gtgtccagta cggcagacgg cggggtttgt tgctaatgat gatggttgtg2760gtgagccggt gtttttgtat cgctgggcgt tgaataagac tgttattgga ggcgcgaacc2820atggtgatca gatggagtat gagacgttta atcctgcggt tagggatatt tcggaggctc2880agagggaggt tgcggggttg tttcatgcgt atgtgacttc gtttgtggtg catggggatc2940cgaatgttct ggggggtagg tatgagggga gggaggtttg ggagaggtat agtggggagg3000gaggggaggt gatggtgttt ggggagggga atgatgaacg tgctgggggg gatggagttg3060gggttgcggc gaggttgaag agggatgagt ggggggtgaa ggagtgtgga ttttggtctg3120ggaggagtgg gatttccgag tgatggtttg tttatatata gtctagtgga aggggatgta3180tatactgtag tcactatctg tagaacttta cttggtgtgt agatagtaaa tactacaact3240gctgaagacc ttgggataga acgacatgct gtttaatcct caaccctgac tagatatatt3300gtgcattact tgcatccacg cctaacat 3328<210>23<211>1779<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1779)
<400>23atg ctg aat gca cgc tcc att gct ctg gcc tcg ttg cca gtt ctt ctc48Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15cta cta ttc gcc cag caa ctt gcc tct cac cca acc gag cag att caa96Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30gcc att ctg gct ccg tgg gtc ccg gcc gca cta caa gat gtc gtg ctc144Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45tat aat cga cct cgc gtc ata atc ccc cag ggc act gtc gtc ggc acg192Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60acc ttg aca gac acg ctc aag tcc ccg gta gat gct ttc cga gga att240Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80cca tac gca ttg cct cca att ggg gat aga cgg ttt cgc cgt gcg gag288Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu85 90 95gct gtc cat gcg acg gac gag att atc gat gct agt gaa ttc ggc cca336Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110agg tgc cct gga aag cag ctc ttg aat cea aat gac ata ggt ggt gat384Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125gaa gac tgt ctc aca gtc aat gtc ttc cgg cct cat ggc gct cag gga432Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140aaa ctc cct gtc gct gta tac gtg cac ggc gga gcc tac aat cgc ggc480Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160act gct aaa tat cca gcc tcc gga cac aac acg gcc tcg atg gtc ggc528Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175tgg tcg gac gag ccc ttc gtt gca gtc agc ttc aac tac cgc atc ggc576Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190gcc ctc ggc ttc ctc cca tcc acc cta acc gcc aaa gaa gga atc ctc624Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205aac cta ggc ctc cat gac cag atc ctc ctg ctg caa tgg gtc caa gaa672Asn Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220aac atc gca cat ttc aac ggc gac cca acc caa gtc act cta atc ggc720
Asn Ile Ala His Phe Asn Gly Asp Pro Thr Gln Val Thr Leu Ile Gly225 230 235 240ctc tcc gcc ggc gcg cac tcc ata gcc cac cac atc atg aac tac aac768Leu Ser Ala Gly Ala His Ser Ile Ala His His Ile Met Asn Tyr Asn245 250 255cca cca aac acc ccc ctc ttt cac cgc gcc atc atc gaa tcc ggc gcc816Pro Pro Asn Thr Pro Leu Phe His Arg Ala Ile Ile Glu Ser Gly Ala260 265 270gcc acc tcc cgc gcc gtc cac ccc tac aac gcc tcc ctc cac gaa tcc864Ala Thr Ser Arg Ala Val His Pro Tyr Asn Ala Ser Leu His Glu Ser275 280 285caa ttc aca gac ttc ctc act gaa acg ggc tgc act aac ctc ccc gac912Gln Phe Thr Asp Phe Leu Thr Glu Thr Gly Cys Thr Asn Leu Pro Asp290 295 300act gcc att ttg ccc tgt ctc cgc gcc ctc cca tcc tca gcc att acc960Thr Ala Ile Leu Pro Cys Leu Arg Ala Leu Pro Ser Ser Ala Ile Thr305 310 315 320acc gcc tcc atc tcc gtc ttc gac aaa tac aac ccc tcc atc cgc tgg1008Thr Ala Ser Ile Ser Val Phe Asp Lys Tyr Asn Pro Ser Ile Arg Trp325 330 335gcc ttc caa ccc gtc atc gac cac gag atc atc cac cgc cgg ccc atc1056Ala Phe Gln Pro Val Ile Asp His Glu Ile Ile His Arg Arg Pro Ile340 345 350gac gcc tgg cgc tca gga aag tgg aat agg atg ccc atc cta acg ggc1104Asp Ala Trp Arg Ser Gly Lys Trp Asn Arg Met Pro Ile Leu Thr Gly355 360 365ttc aac tcg aac gag ggg aca tac tac gtc cct cgc aac ctc tct ctc1152Phe Asn Ser Asn Glu Gly Thr Tyr Tyr Val Pro Arg Asn Leu Ser Leu370 375 380tcc gag gat ttc act tcg ttc ttc cga acc ctc ctc ccc gcg tac ccc1200Ser Glu Asp Phe Thr Ser Phe Phe Arg Thr Leu Leu Pro Ala Tyr Pro385 390 395 400gag agc gac atc cag acc atc gat gag atc tac ccc gat ccg aat gta1248Glu Ser Asp Ile Gln Thr Ile Asp Glu Ile Tyr Pro Asp Pro Asn Val405 410 415tat gct acg gcg tcg cca tac ctc gag aca agg ccg atc ccg agt cta1296Tyr Ala Thr Ala Ser Pro Tyr Leu Glu Thr Arg Pro Ile Pro Ser Leu420 425 430gga agg cag ttt aag cgg ctg gag gcg gcg tat ggg cat tat gcg tat1344Gly Arg Gln Phe Lys Arg Leu Glu Ala Ala Tyr Gly His Tyr Ala Tyr435 440 445gcg tgt cca gta cgg cag acg gcg ggg ttt gtt gct aat gat gat ggt1392Ala Cys Pro Val Arg Gln Thr Ala Gly Phe Val Ala Asn Asp Asp Gly450 455 460
tgt ggt gag ccg gtg ttt ttg tat cgc tgg gcg ttg aat aag act gtt1440Cys Gly Glu Pro Val Phe Leu Tyr Arg Trp Ala Leu Asn Lys Thr Val465 470 475 480att gga ggc gcg aac cat ggt gat cag atg gag tat gag acg ttt aat1488Ile Gly Gly Ala Asn His Gly Asp Gln Met Glu Tyr Glu Thr Phe Asn485 490 495cct gcg gtt agg gat att tcg gag gct cag agg gag gtt gcg ggg ttg1536Pro Ala Val Arg Asp Ile Ser Glu Ala Gln Arg Glu Val Ala Gly Leu500 505 510ttt cat gcg tat gtg act tcg ttt gtg gtg cat ggg gat ccg aat gtt1584Phe His Ala Tyr Val Thr Ser Phe Val Val His Gly Asp Pro Asn Val515 520 525ctg ggg ggt agg tat gag ggg agg gag gtt tgg gag agg tat agt ggg1632Leu Gly Gly Arg Tyr Glu Gly Arg Glu Val Trp Glu Arg Tyr Ser Gly530 535 540gag gga ggg gag gtg atg gtg ttt ggg gag ggg aat gat gaa cgt gct1680Glu Gly Gly Glu Val Met Val Phe Gly Glu Gly Asn Asp Glu Arg Ala545 550 555 560ggg ggg gat gga gtt ggg gtt gcg gcg agg ttg aag agg gat gag tgg1728Gly Gly Asp Gly Val Gly Val Ala Ala Arg Leu Lys Arg Asp Glu Trp565 570 575ggg gtg aag gag tgt gga ttt tgg tct ggg agg agt ggg att tcc gag1776Gly Val Lys Glu Cys Gly Phe Trp Ser Gly Arg Ser Gly Ile Ser Glu580 585 590tga1779<210>24<211>592<212>PRT<213>黑曲霉(Aspergillus niger)<400>24Met Leu Asn Ala Arg Ser Ile Ala Leu Ala Ser Leu Pro Val Leu Leu1 5 10 15Leu Leu Phe Ala Gln Gln Leu Ala Ser His Pro Thr Glu Gln Ile Gln20 25 30Ala Ile Leu Ala Pro Trp Val Pro Ala Ala Leu Gln Asp Val Val Leu35 40 45Tyr Asn Arg Pro Arg Val Ile Ile Pro Gln Gly Thr Val Val Gly Thr50 55 60Thr Leu Thr Asp Thr Leu Lys Ser Pro Val Asp Ala Phe Arg Gly Ile65 70 75 80Pro Tyr Ala Leu Pro Pro Ile Gly Asp Arg Arg Phe Arg Arg Ala Glu
85 90 95Ala Val His Ala Thr Asp Glu Ile Ile Asp Ala Ser Glu Phe Gly Pro100 105 110Arg Cys Pro Gly Lys Gln Leu Leu Asn Pro Asn Asp Ile Gly Gly Asp115 120 125Glu Asp Cys Leu Thr Val Asn Val Phe Arg Pro His Gly Ala Gln Gly130 135 140Lys Leu Pro Val Ala Val Tyr Val His Gly Gly Ala Tyr Asn Arg Gly145 150 155 160Thr Ala Lys Tyr Pro Ala Ser Gly His Asn Thr Ala Ser Met Val Gly165 170 175Trp Ser Asp Glu Pro Phe Val Ala Val Ser Phe Asn Tyr Arg Ile Gly180 185 190Ala Leu Gly Phe Leu Pro Ser Thr Leu Thr Ala Lys Glu Gly Ile Leu195 200 205Asn Leu Gly Leu His Asp Gln Ile Leu Leu Leu Gln Trp Val Gln Glu210 215 220Asn Ile Ala His Phe Asn Gly Asp Pro Thr Gln Val Thr Leu Ile Gly225 230 235 240Leu Ser Ala Gly Ala His Ser Ile Ala His His Ile Met Asn Tyr Asn245 250 255Pro Pro Asn Thr Pro Leu Phe His Arg Ala Ile Ile Glu Ser Gly Ala260 265 270Ala Thr Ser Arg Ala Val His Pro Tyr Asn Ala Ser Leu His Glu Ser275 280 285Gln Phe Thr Asp Phe Leu Thr Glu Thr Gly Cys Thr Asn Leu Pro Asp290 295 300Thr Ala Ile Leu Pro Cys Leu Arg Ala Leu Pro Ser Ser Ala Ile Thr305 310 315 320Thr Ala Ser Ile Ser Val Phe Asp Lys Tyr Asn Pro Ser Ile Arg Trp325 330 335Ala Phe Gln Pro Val Ile Asp His Glu Ile Ile His Arg Arg Pro Ile340 345 350Asp Ala Trp Arg Ser Gly Lys Trp Asn Arg Met Pro Ile Leu Thr Gly355 360 365Phe Asn Ser Asn Glu Gly Thr Tyr Tyr Val Pro Arg Asn Leu Ser Leu370 375 380Ser Glu Asp Phe Thr Ser Phe Phe Arg Thr Leu Leu Pro Ala Tyr Pro385 390 395 400Glu Ser Asp Ile Gln Thr Ile Asp Glu Ile Tyr Pro Asp Pro Asn Val405 410 415Tyr Ala Thr Ala Ser Pro Tyr Leu Glu Thr Arg Pro Ile Pro Ser Leu420 425 430Gly Arg Gln Phe Lys Arg Leu Glu Ala Ala Tyr Gly His Tyr Ala Tyr
435 440 445Ala Cys Pro Val Arg Gln Thr Ala Gly Phe Val Ala Asn Asp Asp Gly450 455 460Cys Gly Glu Pro Val Phe Leu Tyr Arg Trp Ala Leu Asn Lys Thr Val465 470 475 480Ile Gly Gly Ala Asn His Gly Asp Gln Met Glu Tyr Glu Thr Phe Asn485 490 495Pro Ala Val Arg Asp Ile Ser Glu Ala Gln Arg Glu Val Ala Gly Leu500 505 510Phe His Ala Tyr Val Thr Ser Phe Val Val His Gly Asp Pro Asn Val515 520 525Leu Gly Gly Arg Tyr Glu Gly Arg Glu Val Trp Glu Arg Tyr Ser Gly530 535 540Glu Gly Gly Glu Val Met Val Phe Gly Glu Gly Asn Asp Glu Arg Ala545 550 555 560Gly Gly Asp Gly Val Gly Val Ala Ala Arg Leu Lys Arg Asp Glu Trp565 570 575Gly Val Lys Glu Cys Gly Phe Trp Ser Gly Arg Ser Gly Ile Ser Glu580 585 590<210>25<211>3932<212>DNA<213>黑曲霉(Aspergillus niger)<400>25cagataacgt tttgagtttg gggatcttga ttatctcggc tccaaacaga ctcgcctatc60cgagagatca agtacataat gcaactagct attagtcaaa tataacgccg gcagaagtct120attttgtcct tttctctttc tttcctcgaa gaaaacccgt ggattaactt gagccggtcg180gcctcaaagt cggctcaacc ggcgcgttgc caactttaaa tgcagacaac catcgtttcc240ggccgttgtg ggggcgatgt agatcagatc caaattccca aaacatccat ggggtaaatc300aagaattgag gttacatcga ccgatagggc tcttaatcca accctcttca cggggaaaac360cttctatatg atacatggtt tactcctctg tttctcttcc tccccggagg tgccaaatcc420gggcgcatcg tgtctattct tagcaaccag cgaatttgac aaattgatcc aatcccatag480aatcagagta actctacaac ccaatcagtc gcctaatacg cacagcaaaa gaagatgcat540tcggacagcc aacgcaagaa aagagattaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa600aaaaggcctc ccctcatcac ctcaccaaag tcgcaatcaa tcagcgacca ctagctacat660cgcgactgaa cgatagcatt ccgcatggtg ttaaagttca agacagttgc tatgcttgcc720cgaaccttta cacattcttg ccctttccgt agaattccaa gctcatcgga cagagagtag780tgtttctgtg aatgtggtgg tttaccaccg ttacctctgc tgtctatcac ttgctcctac840ccctgagcac aggcaccata gttacaacac ccccacgggg ccattgtctg ttttcagctt900cagcttcgtc gacaatggac tgtcatatcc cctcatctca aaagaatgtc ggaaacactg960tatggcatgg cgtgtgggaa ccgatcaatt tgtataatat cttaggccca cctcttcccc1020tccgagaggt ttgacatcag ggggtttcag agatagtccg tcgatattta tggcttcctc1080
tgtcttcttg ccgctacttg cggcctcatt actgcccaca ctcgcttcta cacagaatgc1140cgatacaccg acatccgctc ctactgtgca agtccgcaat ggcacatacg agggtctcta1200taatcccacg tacaatcagg acttgttcct cggcataccg tatgcgcagc ctccggttgg1260tgagctacga ttccgtccac cacaaccgct caacacgacg tggactggca ctcgaaatgc1320aacagcctat tacaatgaat gtatcggtta tggtagcgac gactggtatt ggaccgacgt1380agtctccgaa gattgtctcg ctctcagtgt gattcgacct cacggcatcg actcaagcgc1440gaagctgccc gtcgtcttct ggatgcatgg tggagaattc gcagaaggag gcactcgcga1500ctcccgttac aacctctcct acatcgtcca acaatcccag gagatgcaat ctcccatcat1560tggcgtgact gtcaactacc gcctttcggg atggggattc ctctatagcc aggaagtcgc1620cgacgaaggc tccgccaact taggactccg cgaccaacgg cacgctctgt actggctcca1680agagaatatc gcttccttcg gcggcgaccc gtcgcggctc accatctggg gccaaagtgc1740cggtgccaac agcgtcggtc tccatttagt ggcatacgac ggccagaatg atggcatctt1800ccgtgccggg atcgccgaga gcggctccgt accctccctc gcagcataca tgagcgccga1860agatgcacaa ccatactatg atgccgtcgt caacgcaacc aactgcaccg gctcttccaa1920cacccttact tgtctccgtg aagttcccac cgacgtcctc agctccatct tcaacagctc1980cctcgtcgct ggggcaggat atcatcccgt cattgacggc gatttcctca gagcctcggg2040gatagttaat ctccagactg gccaattcgc caaaaccccg cttcttatcg gcaccaactt2100cgacgaaggg accaagtatg cccctcatgg ctataatacc accgaccaat ttgtctccct2160cgtccaagcc aacggaacca attataccag cgctctcacc attgcatccc tgtacccaga2220tgacccagcc gttggtattc cgggaaccct tcaaggtcgt cccccaccgt catacggtta2280ccagtggaag cgcgtggctg ccttcctcgg cgatctgctc atgcacgcgc ctcgccgcgt2340gacaacccag tggctggcac actggaatgt acctgcctac gtgtatcact ggaacgtgat2400gacactaggg ccattagatg gagccgcgca tggctatgaa gtccccttca gtttccataa2460ttatgatggt ttgggcgatg aacggggaaa cgacagcgtg acctggccac aactatcgac2520tatgatgtca cggatgtggg tgagctttat taatcatttg gatccgaatt atagtaatag2580tgagtgattt gccccaccta cctctggaca ctgctttagg agcttgaggg taaggaagga2640tgctgacacg ctgctctgct agtgacggat atccactggc ctgtctacac aacagaaacc2700ccgcaaaata tggtctttga tgtcaatgtg actggactgg cttatgttga accagatacc2760tatagagcgg agggaattgc gtatatcact agcattctgc agagtgcctt taatcggtag2820ggtagactag aggcttcaat atcaatagat atcacacata caggagagca gcccatgttt2880ccctccagat caagagctat tccgttaaaa ggtagtgcat ccccgcaccg gggggaaggc2940cggggagtgc ttacctctgt gtgaaactag aattccagca acgatggttt tagaaaggcc3000agatctgttg actcattgtt tgatcctccg atgttgcatc cgagaaagct tctgcttggt3060cgtgccaagg atgttaacag ctgctgttga ggcaactcta gaaaccccat agacctttac3120tatctcgctg actagagggt acagtaggtc ctactttgaa ttccttggcg gttgggattt3180cgcggaaggt tgtctcaacc ctcaatgctt gtcacgacag acggcttggc aatgagacga3240gaccacgggc gattgacatg tgtcaagcag tagctatcgg gaatctgaaa aagcatggct3300gtcatggact ttgcaggcaa aggctgtctg ttctagacca tcggctagag cgcggtgagc3360atactaggcg agctgaaaag cctagaagcg gttgccggtt atccgctttg tttgtgccct3420ttccgtttcc gggcgtaggc aatcacattt aggcaatgcc gtgtgggcct tggagatctc3480acctaacctt attgcatttt acctcacggt gatacaacct gagtgactat cagggaaact3540gagcctattg atcatcacat attagcacca cacaaagctg ccaaggaaca atagtaatgt3600gagcgccaag gagatatctt tgaactttgt ctccagatct tgtactacat acccagccag3660acaggggttc gtatcgatgg ctccacagcg ggatatcatg aatcttcatg tcgtcacgac3720
tcatacctcg agcgataggg ccgggtatta ctccatctgg aaattgtcat gactgtagag3780ctcagctgtc cgggatacga gcattatccg tcagtttata aattccaggg ccatcctgct3840caatctcaac atgtgggctc ttacgctgtc atcatattag ttagggtcca agagaatcac3900agaatcattg gcattgttct tcatcgttcc aa 3932<210>26<211>1518<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1518)<400>26atg gct tcc tct gtc ttc ttg ccg cta ctt gcg gcc tca tta ctg ccc48Met Ala Ser Ser Val Phe Leu Pro Leu Leu Ala Ala Ser Leu Leu Pro1 5 10 15aca ctc gct tct aca cag aat gcc gat aca ccg aca tcc gct cct act96Thr Leu Ala Ser Thr Gln Asn Ala Asp Thr Pro Thr Ser Ala Pro Thr20 25 30gtg caa gtc cgc aat ggc aca tac gag ggt ctc tat aat ccc acg tac144Val Gln Val Arg Asn Gly Thr Tyr Glu Gly Leu Tyr Asn Pro Thr Tyr35 40 45aat cag gac ttg ttc ctc ggc ata ccg tat gcg cag cct ccg gtt ggt192Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Pro Pro Val Gly50 55 60gag cta cga ttc cgt cca cca caa ccg ctc aac acg acg tgg act ggc240Glu Leu Arg Phe Arg Pro Pro Gln Pro Leu Asn Thr Thr Trp Thr Gly65 70 75 80act cga aat gca aca gcc tat tac aat gaa tgt atc ggt tat ggt agc288Thr Arg Asn Ala Thr Ala Tyr Tyr Asn Glu Cys Ile Gly Tyr Gly Ser85 90 95gac gac tgg tat tgg acc gac gta gtc tcc gaa gat tgt ctc gct ctc336Asp Asp Trp Tyr Trp Thr Asp Val Val Ser Glu Asp Cys Leu Ala Leu100 105 110agt gtg att cga cct cac ggc atc gac tca agc gcg aag ctg ccc gtc384Ser Val Ile Arg Pro His Gly Ile Asp Ser Ser Ala Lys Leu Pro Val115 120 125gtc ttc tgg atg cat ggt gga gaa ttc gca gaa gga ggc act cgc gac432Val Phe Trp Met His Gly Gly Glu Phe Ala Glu Gly Gly Thr Arg Asp130 135 140tcc cgt tac aac ctc tcc tac atc gtc caa caa tcc cag gag atg caa480
Ser Arg Tyr Asn Leu Ser Tyr Ile Val Gln Gln Ser Gln Glu Met Gln145 150 155 160tct ccc atc att ggc gtg act gtc aac tac cgc ctt tcg gga tgg gga528Ser Pro Ile Ile Gly Val Thr Val Asn Tyr Arg Leu Ser Gly Trp Gly165 170 175ttc ctc tat agc cag gaa gtc gcc gac gaa ggc tcc gcc aac tta gga576Phe Leu Tyr Ser Gln Glu Val Ala Asp Glu Gly Ser Ala Asn Leu Gly180 185 190ctc cgc gac caa cgg cac gct ctg tac tgg ctc caa gag aat atc gct624Leu Arg Asp Gln Arg His Ala Leu Tyr Trp Leu Gln Glu Asn Ile Ala195 200 205tcc ttc ggc ggc gac ccg tcg cgg ctc acc atc tgg ggc caa agt gcc672Ser Phe Gly Gly Asp Pro Ser Arg Leu Thr Ile Trp Gly Gln Ser Ala210 215 220ggt gcc aac agc gtc ggt ctc cat tta gtg gca tac gac ggc cag aat720Gly Ala Asn Ser Val Gly Leu His Leu Val Ala Tyr Asp Gly Gln Asn225 230 235 240gat ggc atc ttc cgt gcc ggg atc gcc gag agc ggc tcc gta ccc tcc768Asp Gly Ile Phe Arg Ala Gly Ile Ala Glu Ser Gly Ser Val Pro Ser245 250 255ctc gca gca tac atg agc gcc gaa gat gca caa cca tac tat gat gcc816Leu Ala Ala Tyr Met Ser Ala Glu Asp Ala Gln Pro Tyr Tyr Asp Ala260 265 270gtc gtc aac gca acc aac tgc acc ggc tct tcc aac acc ctt act tgt864Val Val Asn Ala Thr Asn Cys Thr Gly Ser Ser Asn Thr Leu Thr Cys275 280 285ctc cgt gaa gtt ccc acc gac gtc ctc agc tcc atc ttc aac agc tcc912Leu Arg Glu Val Pro Thr Asp Val Leu Ser Ser Ile Phe Asn Ser Ser290 295 300ctc gtc gct ggg gca gga tat cat ccc gtc att gac ggc gat ttc ctc960Leu Val Ala Gly Ala Gly Tyr His Pro Val Ile Asp Gly Asp Phe Leu305 310 315 320aga gcc tcg ggg ata gtt aat ctc cag act ggc caa ttc gcc aaa acc1008Arg Ala Ser Gly Ile Val Asn Leu Gln Thr Gly Gln Phe Ala Lys Thr325 330 335ccg ctt ctt atc ggc acc aac ttc gac gaa ggg acc aag tat gcc cct1056Pro Leu Leu Ile Gly Thr Asn Phe Asp Glu Gly Thr Lys Tyr Ala Pro340 345 350cat ggc tat aat acc acc gac caa ttt gtc tcc ctc gtc caa gcc aac1104His Gly Tyr Asn Thr Thr Asp Gln Phe Val Ser Leu Val Gln Ala Asn355 360 365gga acc aat tat acc agc gct ctc acc att gca tcc ctg tac cea gat1152Gly Thr Asn Tyr Thr Ser Ala Leu Thr Ile Ala Ser Leu Tyr Pro Asp370 375 380
gac cca gcc gtt ggt att ccg gga acc ctt caa ggt cgt ccc cca ccg1200Asp Pro Ala Val Gly Ile Pro Gly Thr Leu Gln Gly Arg Pro Pro Pro385 390 395 400tca tac ggt tac cag tgg aag cgc gtg gct gcc ttc ctc ggc gat ctg1248Ser Tyr Gly Tyr Gln Trp Lys Arg Val Ala Ala Phe Leu Gly Asp Leu405 410 415ctc atg cac gcg cct cgc cgc gtg aca acc cag tgg ctg gca cac tgg1296Leu Met His Ala Pro Arg Arg Val Thr Thr Gln Trp Leu Ala His Trp420 425 430aat gta cct gcc tac gtg tat cac tgg aac gtg atg aca cta ggg cca1344Asn Val Pro Ala Tyr Val Tyr His Trp Asn Val Met Thr Leu Gly Pro435 440 445tta gat gga gcc gcg cat ggc tat gaa gtc ccc ttc agt ttc cat aat1392Leu Asp Gly Ala Ala His Gly Tyr Glu Val Pro Phe Ser Phe His Asn450 455 460tat gat ggt ttg ggc gat gaa cgg gga aac gac agc gtg acc tgg cca1440Tyr Asp Gly Leu Gly Asp Glu Arg Gly Asn Asp Ser Val Thr Trp Pro465 470 475 480caa cta tcg act atg atg tca cgg atg tgg gtg agc ttt att aat cat1488Gln Leu Ser Thr Met Met Ser Arg Met Trp Val Ser Phe Ile Asn His485 490 495ttg gat ccg aat tat agt aat agt gag tga15Leu Asp Pro Asn Tyr Ser Asn Ser Glu500 505<210>27<211>505<212>PRT<213>黑曲霉(Aspergillus niger)<400>27Met Ala Ser Ser Val Phe Leu Pro Leu Leu Ala Ala Ser Leu Leu Pro1 5 10 15Thr Leu Ala Ser Thr Gln Asn Ala Asp Thr Pro Thr Ser Ala Pro Thr20 25 30Val Gln Val Arg Asn Gly Thr Tyr Glu Gly Leu Tyr Asn Pro Thr Tyr35 40 45Asn Gln Asp Leu Phe Leu Gly Ile Pro Tyr Ala Gln Pro Pro Val Gly50 55 60Glu Leu Arg Phe Arg Pro Pro Gln Pro Leu Asn Thr Thr Trp Thr Gly65 70 75 80Thr Arg Asn Ala Thr Ala Tyr Tyr Asn Glu Cys Ile Gly Tyr Gly Ser85 90 95
Asp Asp Trp Tyr Trp Thr Asp Val Val Ser Glu Asp Cys Leu Ala Leu100 105 110Ser Val Ile Arg Pro His Gly Ile Asp Ser Ser Ala Lys Leu Pro Val115 120 125Val Phe Trp Met His Gly Gly Glu Phe Ala Glu Gly Gly Thr Arg Asp130 135 140Ser Arg Tyr Asn Leu Ser Tyr Ile Val Gln Gln Ser Gln Glu Met Gln145 150 155 160Ser Pro Ile Ile Gly Val Thr Val Asn Tyr Arg Leu Ser Gly Trp Gly165 170 175Phe Leu Tyr Ser Gln Glu Val Ala Asp Glu Gly Ser Ala Asn Leu Gly180 185 190Leu Arg Asp Gln Arg His Ala Leu Tyr Trp Leu Gln Glu Asn Ile Ala195 200 205Ser Phe Gly Gly Asp Pro Ser Arg Leu Thr Ile Trp Gly Gln Ser Ala210 215 220Gly Ala Asn Ser Val Gly Leu His Leu Val Ala Tyr Asp Gly Gln Asn225 230 235 240Asp Gly Ile Phe Arg Ala Gly Ile Ala Glu Ser Gly Ser Val Pro Ser245 250 255Leu Ala Ala Tyr Met Ser Ala Glu Asp Ala Gln Pro Tyr Tyr Asp Ala260 265 270Val Val Asn Ala Thr Asn Cys Thr Gly Ser Ser Asn Thr Leu Thr Cys275 280 285Leu Arg Glu Val Pro Thr Asp Val Leu Ser Ser Ile Phe Asn Ser Ser290 295 300Leu Val Ala Gly Ala Gly Tyr His Pro Val Ile Asp Gly Asp Phe Leu305 310 315 320Arg Ala Ser Gly Ile Val Asn Leu Gln Thr Gly Gln Phe Ala Lys Thr325 330 335Pro Leu Leu Ile Gly Thr Asn Phe Asp Glu Gly Thr Lys Tyr Ala Pro340 345 350His Gly Tyr Asn Thr Thr Asp Gln Phe Val Ser Leu Val Gln Ala Asn355 360 365Gly Thr Asn Tyr Thr Ser Ala Leu Thr Ile Ala Ser Leu Tyr Pro Asp370 375 380Asp Pro Ala Val Gly Ile Pro Gly Thr Leu Gln Gly Arg Pro Pro Pro385 390 395 400Ser Tyr Gly Tyr Gln Trp Lys Arg Val Ala Ala Phe Leu Gly Asp Leu405 410 415Leu Met His Ala Pro Arg Arg Val Thr Thr Gln Trp Leu Ala His Trp420 425 430Asn Val Pro Ala Tyr Val Tyr His Trp Asn Val Met Thr Leu Gly Pro435 440 445
Leu Asp Gly Ala Ala His Gly Tyr Glu Val Pro Phe Ser Phe His Asn450 455 460Tyr Asp Gly Leu Gly Asp Glu Arg Gly Asn Asp Ser Val Thr Trp Pro465 470 475 480Gln Leu Ser Thr Met Met Ser Arg Met Trp Val Ser Phe Ile Asn His485 490 495Leu Asp Pro Asn Tyr Ser Asn Ser Glu500 505<210>28<211>3091<212>DNA<213>黑曲霉(Aspergillus niger)<400>28ggcgaacggg cctgagcgtg cgtcggaggc agaagtagag ccgggactat ggatattggc60gaggaatata ttatagtaga ttatagggag tcgaatgcag ctcggattgg gttgttactt120tgagtcagat ggacattgtt ggaaaagatg aacgcgacgg gaaaaaaaca tgaggatttg180cggggatttc gtcacatgcg gaggcgcgga ttttcccctc cggatttact tcctcaactc240tcctttctct ttcatttcca tccgatttga gtccaactca tctcactcga agaatctcat300taatttcagg gtcctgctca gcccagtcaa ggttccttag tttcgatcct tcagttggcc360cgtcatgtcc attgaccagg aatggagcaa gccccgatga ggatcggcca gcggagacaa420ctgccaatcc ttggtatcca tacccttaac agcgcaatgg caccagctct ctgccgattc480acgtcatctg cacagcctag ctgccgatta ggcttgaccc cttctcactt gcggcatcag540tgccgctgat actagccccc acagagtgtt tctcccttcg actgtggctc ggaacgtggg600ggcgggttcc aagttcttat gcccagagtt ggttggctag ccttgctcat ctgggtggcc660agcacacctc ccatacaata ggatccgtgg tgttggcagg attcttgtca tttcgccatg720tcgaatcacc gcatgcggaa ggaggacgcc ttgccttgca atgttttctc cacatctgcg780accctattgt tcagaccctg gagccgattc cgcgagatgt attcctgccg ggccactgaa840agtgctttat aacgtctggg gtgtcctttt attgatgaga gcatgatctt tcgcgttaca900gttctcacaa tcggttaaag cattcgtggc cccgaggctc gttgcacaac acaatatgat960tttctttcat ctggcaccgt tcttctttct ctttggtcta gtagtatctt ctcagaaccc1020tacggtggac cttggctaca caagatataa aggcaaatct ctgcccaatg gtatcagtca1080gtggctgggg atacgctacg cggctgcacc taccgggtct ctgcggttct ctgcgccaca1140ggatcctgac acggtagatg gcgttcaaga agcattcaag gtatggtttt ttctacaata1200aataaaaaga tatattgcga gtctgtgctt tgctaatacc cagggcacag catggtcccc1260ggtgtgttcc caccagccaa tatcccactc ccgcaggcac gtccgaggat tgtctcttcc1320tcgatgtata cgctcccagc tcggtggaag ctactacgag gctgcccgtt ttcgtttgga1380ttcaaggagg cggcttcaat gccaactcca gccccaacta caatggaaca ggattgatcg1440aagcggccaa tatgtccatg gtggtggtca ccttcaacta cagggtcggt ccgtacgggt1500tcctctctgg atccgaggtg ctggagggag gaagcgtgaa caatggcctg aaggaccaaa1560tcaaggtcct gaagtgggtg caagagcata tcagcaaggt atgcggacac tcaccaaccc1620acagcaaatc accgctaatt gcagccgcag tttggaggcg atcccagtca cgttgttatc1680
ggcggcgaca gcgcaggcgc agcgtctatc actctccatc tttcagccca cggtggcaga1740gacgacgaac tattccacgc tgccgccgca gagtcccaaa gctttgctcc tatgttgacc1800gtcaatcaaa gccaattcgc ctataacaac ctggtcatcc gcgccggctg cgcaagcgat1860tcagacaccc tcgcctgctt acgccgacta aacaccacag aactgcagcg catcaacatc1920aacacaccct tacccaccgc ccaacaagca cctctctacc tgtacggtcc cgtcgtcgac1980ggctccctca tcccagacta cacataccgg cttttccagc aaggcaaatt catcaaagtc2040cccgtaatct tcggcgacga caccaacgaa ggaacaatct tcgtccccaa aacgacctcc2100accgtcggcg aagccgacac cttcatccaa gaccaattcc ccaacatcaa cttcacccac2160ctaaccaagc tgaacgactg gtatctcaaa gaaaaccaaa ctcgcgagtt ccccaattcc2220tccccctact ggcgtcccgc tagcaccgcg tacggtgaaa tcagatatat ctgtccgggg2280atctacatgt cctctgtgtt tgctagtgcc ggtgtcaaca gctggaacta tcattatgct2340gtgcaggacc ccgccgcgga agcctcaggc agaggtgtca gtcatactgt ggaagaaaat2400gccatttggg gcccgcagta tgtgagtggc acaccgccgg cgtcgtatct cactgagaat2460gcgccaattg tgccggtgat gcagggctac tggacgagtt tcattagagt gtttgatccg2520aatccgctga ggtatccggg gagtccggag tggaagacgt ggagtgatgg acatggggag2580gattatcggc ggatatttgt ccgcacgaat gagacgagga tggagacggt gtcggaggcg2640cagagggaaa ggtgcgaata ttggagtagt gttgggccgg acttgtcgca gtgattgcac2700ttattatctt tgttcggtgg taaggtatat atatagatag tataatattg taagctatag2760agtgatggta cgtgaattga atatatggag aaagatggtc ttgtataaat caaaacattc2820ttttttggct gccattccac gatcatcatt cccaatgatc aaaccaagta actataaccg2880aatatataca tctatatcaa cctgcttctc atcagaatta ccaaaagacg ggtccggcac2940acacagctag accgagcaga tacgtcgaca tgaacccagg tgatgaaaca taatgcaaca3000aaagaaagag aaaagaaggc aaaacaagtg agaagcacta ctgctccaca tagagcagta3060aacgaacgat gaatgaggga tatcatcatc a 3091<210>29<211>1617<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1617)<400>29atg att ttc ttt cat ctg gca ccg ttc ttc ttt ctc ttt ggt cta gta48Met Ile Phe Phe His Leu Ala Pro Phe Phe Phe Leu Phe Gly Leu Val1 5 10 15gta tct tct cag aac cct acg gtg gac ctt ggc tac aca aga tat aaa96Val Ser Ser Gln Asn Pro Thr Val Asp Leu Gly Tyr Thr Arg Tyr Lys20 25 30ggc aaa tct ctg ccc aat ggt atc agt cag tgg ctg ggg ata cgc tac144Gly Lys Ser Leu Pro Asn Gly Ile Ser Gln Trp Leu Gly Ile Arg Tyr
35 40 45gcg gct gca cct acc ggg tct ctg cgg ttc tct gcg cca cag gat cct192Ala Ala Ala Pro Thr Gly Ser Leu Arg Phe Ser Ala Pro Gln Asp Pro50 55 60gac acg gta gat ggc gtt caa gaa gca ttc aag cat ggt ccc cgg tgt240Asp Thr Val Asp Gly Val Gln Glu Ala Phe Lys His Gly Pro Arg Cys65 70 75 80gtt ccc acc agc caa tat ccc act ccc gca ggc acg tcc gag gat tgt288Val Pro Thr Ser Gln Tyr Pro Thr Pro Ala Gly Thr Ser Glu Asp Cys85 90 95ctc ttc ctc gat gta tac gct ccc agc tcg gtg gaa gct act acg agg336Leu Phe Leu Asp Val Tyr Ala Pro Ser Ser Val Glu Ala Thr Thr Arg100 105 110ctg ccc gtt ttc gtt tgg att caa gga ggc ggc ttc aat gcc aac tcc384Leu Pro Val Phe Val Trp Ile Gln Gly Gly Gly Phe Asn Ala Asn Ser115 120 125agc ccc aac tac aat gga aca gga ttg atc gaa gcg gcc aat atg tcc432Ser Pro Asn Tyr Asn Gly Thr Gly Leu Ile Glu Ala Ala Asn Met Ser130 135 140atg gtg gtg gtc acc ttc aac tac agg gtc ggt ccg tac ggg ttc ctc480Met Val Val Val Thr Phe Asn Tyr Arg Val Gly Pro Tyr Gly Phe Leu145 150 155 160tct gga tcc gag gtg ctg gag gga gga agc gtg aac aat ggc ctg aag528Ser Gly Ser Glu Val Leu Glu Gly Gly Ser Val Asn Asn Gly Leu Lys165 170 175gac caa atc aag gtc ctg aag tgg gtg caa gag cat atc agc aag ttt576Asp Gln Ile Lys Val Leu Lys Trp Val Gln Glu His Ile Ser Lys Phe180 185 190gga ggc gat ccc agt cac gtt gtt atc ggc ggc gac agc gca ggc gca624Gly Gly Asp Pro Ser His Val Val Ile Gly Gly Asp Ser Ala Gly Ala195 200 205gcg tct atc act ctc cat ctt tca gcc cac ggt ggc aga gac gac gaa672Ala Ser Ile Thr Leu His Leu Ser Ala His Gly Gly Arg Asp Asp Glu210 215 220cta ttc cac gct gcc gcc gca gag tcc caa agc ttt gct cct atg ttg720Leu Phe His Ala Ala Ala Ala Glu Ser Gln Ser Phe Ala Pro Met Leu225 230 235 240acc gtc aat caa agc caa ttc gcc tat aac aac ctg gtc atc cgc gcc768Thr Val Asn Gln Ser Gln Phe Ala Tyr Asn Asn Leu Val Ile Arg Ala245 250 255ggc tgc gca agc gat tca gac acc ctc gcc tgc tta cgc cga cta aac816Gly Cys Ala Ser Asp Ser Asp Thr Leu Ala Cys Leu Arg Arg Leu Asn260 265 270acc aca gaa ctg cag cgc atc aac atc aac aca ccc tta ccc acc gcc864
Thr Thr Glu Leu Gln Arg Ile Asn Ile Asn Thr Pro Leu Pro Thr Ala275 280 285caa caa gca cct ctc tac ctg tac ggt ccc gtc gtc gac ggc tcc ctc912Gln Gln Ala Pro Leu Tyr Leu Tyr Gly Pro Val Val Asp Gly Ser Leu290 295 300atc cca gac tac aca tac cgg ctt ttc cag caa ggc aaa ttc atc aaa960Ile Pro Asp Tyr Thr Tyr Arg Leu Phe Gln Gln Gly Lys Phe Ile Lys305 310 315 320gtc ccc gta atc ttc ggc gac gac acc aac gaa gga aca atc ttc gtc1008Val Pro Val Ile Phe Gly Asp Asp Thr Asn Glu Gly Thr Ile Phe Val325 330 335ccc aaa acg acc tcc acc gtc ggc gaa gcc gac acc ttc atc caa gac1056Pro Lys Thr Thr Ser Thr Val Gly Glu Ala Asp Thr Phe Ile Gln Asp340 345 350caa ttc ccc aac atc aac ttc acc cac cta acc aag ctg aac gac tgg1104Gln Phe Pro Asn Ile Asn Phe Thr His Leu Thr Lys Leu Asn Asp Trp355 360 365tat ctc aaa gaa aac caa act cgc gag ttc ccc aat tcc tcc ccc tac1152Tyr Leu Lys Glu Asn Gln Thr Arg Glu Phe Pro Asn Ser Ser Pro Tyr370 375 380tgg cgt ccc gct agc acc gcg tac ggt gaa atc aga tat atc tgt ccg1200Trp Arg Pro Ala Ser Thr Ala Tyr Gly Glu Ile Arg Tyr Ile Cys Pro385 390 395 400ggg atc tac atg tcc tct gtg ttt gct agt gcc ggt gtc aac agc tgg1248Gly Ile Tyr Met Ser Ser Val Phe Ala Ser Ala Gly Val Asn Ser Trp405 410 415aac tat cat tat gct gtg cag gac ccc gcc gcg gaa gcc tca ggc aga1296Asn Tyr His Tyr Ala Val Gln Asp Pro Ala Ala Glu Ala Ser Gly Arg420 425 430ggt gtc agt cat act gtg gaa gaa aat gcc att tgg ggc ccg cag tat1344Gly Val Ser His Thr Val Glu Glu Asn Ala Ile Trp Gly Pro Gln Tyr435 440 445gtg agt ggc aca ccg ccg gcg tcg tat ctc act gag aat gcg cca att1392Val Ser Gly Thr Pro Pro Ala Ser Tyr Leu Thr Glu Asn Ala Pro Ile450 455 460gtg ccg gtg atg cag ggc tac tgg acg agt ttc att aga gtg ttt gat1440Val Pro Val Met Gln Gly Tyr Trp Thr Ser Phe Ile Arg Val Phe Asp465 470 475 480ccg aat ccg ctg agg tat ccg ggg agt ccg gag tgg aag acg tgg agt1488Pro Asn Pro Leu Arg Tyr Pro Gly Ser Pro Glu Trp Lys Thr Trp Ser485 490 495gat gga cat ggg gag gat tat cgg cgg ata ttt gtc cgc acg aat gag1536Asp Gly His Gly Glu Asp Tyr Arg Arg Ile Phe Val Arg Thr Asn Glu500 505 510
acg agg atg gag acg gtg tcg gag gcg cag agg gaa agg tgc gaa tat1584Thr Arg Met Glu Thr Val Ser Glu Ala Gln Arg Glu Arg Cys Glu Tyr515 520 525tgg agt agt gtt ggg ccg gac ttg tcg cag tga1617Trp Ser Ser Val Gly Pro Asp Leu Ser Gln530 535<210>30<211>538<212>PRT<213>黑曲霉(Aspergillus niger)<400>30Met Ile Phe Phe His Leu Ala Pro Phe Phe Phe Leu Phe Gly Leu Val1 5 10 15Val Ser Ser Gln Asn Pro Thr Val Asp Leu Gly Tyr Thr Arg Tyr Lys20 25 30Gly Lys Ser Leu Pro Asn Gly Ile Ser Gln Trp Leu Gly Ile Arg Tyr35 40 45Ala Ala Ala Pro Thr Gly Ser Leu Arg Phe Ser Ala Pro Gln Asp Pro50 55 60Asp Thr Val Asp Gly Val Gln Glu Ala Phe Lys His Gly Pro Arg Cys65 70 75 80Val Pro Thr Ser Gln Tyr Pro Thr Pro Ala Gly Thr Ser Glu Asp Cys85 90 95Leu Phe Leu Asp Val Tyr Ala Pro Ser Ser Val Glu Ala Thr Thr Arg100 105 110Leu Pro Val Phe Val Trp Ile Gln Gly Gly Gly Phe Asn Ala Asn Ser115 120 125Ser Pro Asn Tyr Asn Gly Thr Gly Leu Ile Glu Ala Ala Asn Met Ser130 135 140Met Val Val Val Thr Phe Asn Tyr Arg Val Gly Pro Tyr Gly Phe Leu145 150 155 160Ser Gly Ser Glu Val Leu Glu Gly Gly Ser Val Asn Asn Gly Leu Lys165 170 175Asp Gln Ile Lys Val Leu Lys Trp Val Gln Glu His Ile Ser Lys Phe180 185 190Gly Gly Asp Pro Ser His Val Val Ile Gly Gly Asp Ser Ala Gly Ala195 200 205Ala Ser Ile Thr Leu His Leu Ser Ala His Gly Gly Arg Asp Asp Glu210 215 220Leu Phe His Ala Ala Ala Ala Glu Ser Gln Ser Phe Ala Pro Met Leu225 230 235 240
Thr Val Asn Gln Ser Gln Phe Ala Tyr Asn Asn Leu Val Ile Arg Ala245 250 255Gly Cys Ala Ser Asp Ser Asp Thr Leu Ala Cys Leu Arg Arg Leu Asn260 265 270Thr Thr Glu Leu Gln Arg Ile Asn Ile Asn Thr Pro Leu Pro Thr Ala275 280 285Gln Gln Ala Pro Leu Tyr Leu Tyr Gly Pro Val Val Asp Gly Ser Leu290 295 300Ile Pro Asp Tyr Thr Tyr Arg Leu Phe Gln Gln Gly Lys Phe Ile Lys305 310 315 320Val Pro Val Ile Phe Gly Asp Asp Thr Asn Glu Gly Thr Ile Phe Val325 330 335Pro Lys Thr Thr Ser Thr Val Gly Glu Ala Asp Thr Phe Ile Gln Asp340 345 350Gln Phe Pro Asn Ile Asn Phe Thr His Leu Thr Lys Leu Asn Asp Trp355 360 365Tyr Leu Lys Glu Asn Gln Thr Arg Glu Phe Pro Asn Ser Ser Pro Tyr370 375 380Trp Arg Pro Ala Ser Thr Ala Tyr Gly Glu Ile Arg Tyr Ile Cys Pro385 390 395 400Gly Ile Tyr Met Ser Ser Val Phe Ala Ser Ala Gly Val Asn Ser Trp405 410 415Asn Tyr His Tyr Ala Val Gln Asp Pro Ala Ala Glu Ala Ser Gly Arg420 425 430Gly Val Ser His Thr Val Glu Glu Asn Ala Ile Trp Gly Pro Gln Tyr435 440 445Val Ser Gly Thr Pro Pro Ala Ser Tyr Leu Thr Glu Asn Ala Pro Ile450 455 460Val Pro Val Met Gln Gly Tyr Trp Thr Ser Phe Ile Arg Val Phe Asp465 470 475 480Pro Asn Pro Leu Arg Tyr Pro Gly Ser Pro Glu Trp Lys Thr Trp Ser485 490 495Asp Gly His Gly Glu Asp Tyr Arg Arg Ile Phe Val Arg Thr Asn Glu500 505 510Thr Arg Met Glu Thr Val Ser Glu Ala Gln Arg Glu Arg Cys Glu Tyr515 520 525Trp Ser Ser Val Gly Pro Asp Leu Ser Gln530 535<210>31<211>4575<212>DNA<213>黑曲霉(Aspergillus niger)
<400>31gatgcaactt cagtgaaatt gagacgattg taactcatca tcgcatctca catggaaagg60ttgtacaccc aacaattaga cctcaacata tttcacggat attcctgcaa gatatataat120aaagccatca ctccactttg gtagatatgt tagccaaccg ggtttgagcg agtttcttga180atggactcat taagggtagg atcaattctg atgtccacaa ttggtcccta tttgccagat240gtaggcccag agaattcggt atcttgcaga tttgcgatgc tatcccggtt tccagtaaac300tattaggttc ggctcggtca caccagacag acacgactga cccatgcgct gccaggaatc360ctgataggcc tagcagtccc gcgtgcacat atcggcttgg tagaaaagga tagccgtgaa420tgtataatct ttcagatgac ggttaaatgc gtttctgtat ggtgagaagc tgtgtagatg480ggagatgagc tgtaaatggc ttcgcagtgg caacctctag gctgctgcag gccggaatac540tgcatggcgt gattttcgtc gtgaatcttg ttcatataca ggtgtaaaac acacgtaagg600aaaatcttgt tatagcaggg ttgaaaacag ttgctagaat tggcagtgac tgttgcggtt660gcaagggttt attttgcacc cttgaagtac actgcgcttg gtcaaaggca aatcacccca720tcaagtaata aatatatatc tctgttatca agtcggctcc tctagtagtg cagcctcagt780acagacaaca gggactaaca gcactcttgc tgttgagctt gagcgcacct cacctttctc840tccggcctct ttcgtatttg gcatttcaat ggcctgttat gggacttctg agcctgcttg900attgagtgat atggtagtgc gagcgcaaaa aaggtgattt tcaaacacca tgatgcaaag960tcagaggtaa gtgcgagagg gagatcagga ggaggagagc tttatataag gccgcgtagg1020cggcagagac ggcaagacat ctggtgaagt accagcattc agtgaatttt ataacagtat1080tatttgtcat cacgactctg cattgccttt aataagctcg gcgtaatttg gtagggaccc1140taggtttgga tagccccagg ggggcttggt gtcggttgtg gagcttgctg cccgagattc1200attttacacc tagtcaggga tccgggcggg ttttatacct ccctggaggc ggaatgtacc1260tttgttatca ctgaaaattc cggccatttt gttctatttt actggctatg gggtttgcca1320ctatcgctca catcctcgca aggcacctcc cgatactgca gtcaaacgtg ggagttgccg1380atagaaacta caagatcaaa tctcgttccc tgggttggac ggtcacattc ggtgaaagag1440gtttatcttc gctccaacca gcctttcatg tcgggcgctc agtgcataag atccaagcaa1500ttttaagcac tgtactccac tagtcacact gttttagcag tgcatgcttc tgaatcagga1560ctaaactccg atttttctca gtgaatactg ctaaagacaa ttatgatcct acagactatc1620tctgtgaaaa agcgcagtta acttctcgtc aatcatgaag ccattttgag cctttctccg1680tcaatcattc acccctactg ttgactatat cagccctaag ggaataaaac atttgccgta1740gaggtgaact ataactcaat caatgactga aagcttaacg tatctcacaa ttcatctcac1800cgtgaagagt catttacatt tacgatccag ccaggccgcg ctgacatcag caggcgtgag1860agcgcatcca tgcttgctcg gacataagcc gaatccattg catgatgcga ccttcccgaa1920agagtatggg tgtccgaact gaccatgtca gtggccccat atggctctca actacacgaa1980cacagacctt tatcagtccc ggtccccaca acttaaatcc ggagatgcgg gggtgcagga2040atggaacacg gatacatgtg tggaatgtag gaccaaacaa attggctgtc gtggacattc2100gactcgactt gacccctcaa tgcgctggcc ggaggactga gccatagggt ataagaacac2160cgtgatcact catgcctcgt tatcgctttt ctatcattat gtctcgatat caggaagaca2220tagcatgacc gtgaacacga tgaagggaat gctcccgacg cttagttggt tggcactggg2280catggccagc ctggcaacct gcaccaaccc agtagcccag acaaagaacg gaagttatta2340tggtgtctac atgcctcagt ataatgagga ttattttctt ggaattccat ttgctaagcc2400cccgttggca cacttgcgtt gggccaaccc cgagagtctt aatgagtctt ggtcgggatt2460gcgccctgct accggctatg cgatggtaag tagcctgaac agactgctaa acgaccatgt2520
acttactaac agcgcgtgtg ataggaatgt ataggttacg gcagtgatca aaaaggttat2580ctgcaggtga ggatttgacg ccactttctt tacgctgttc tctactaacc agcaaaatag2640agcgaggact gtctctacct aaacgtggtc cgtcccgctg aatacgacaa tgccagtctt2700ccagtccttg tatggattca tggtatgtag tgaaatctac ctcaacgaca agttactccc2760gacgctgaat gaacaaaaca ggcggtggct tcgcacaagg cggcactccc gaccttcgat2820acaatcttac atttattgtt gaacactcgg tcaatatcgg ccagccaatt atcgcagtga2880gcgttgccta tcgtctcggt ccttggggtt tcttcaatgg ggtcgagctc gccaatgagg2940gatcgttaaa tctcgggctg aaggaccagc gcttggccct gcattgggtg aaagagaaca3000ttgcaggttt cggtggtggg tttccataaa gctattaaac gtacacagtc caaaattact3060aatgacagtc actcctatac aggcgaccct agtaaagtcg tgatttacgg acaaagtgcc3120ggctccgaaa gcgtgggata ccaaatccgc gcgtacaacg gccgagatga cgggctcttc3180cgcggaggca tgatggagtc cggcgcggtg ttacctggca gtgccttgaa cctcacctgg3240acatatgagc cttggttcca gcaaatagca gacgaggcag gatgttccca gaccacccgc3300aaactggact gtctacgccg cacgcccttc acagtcctaa acaacattct gaacaccacc3360gccaacgaca cgacgcctta caactggagg cccacagtgg acggtgactt cgtagcgcga3420tatcccagcg agcaactcga cacaggagac ttcgtcaaag taccaatcat aatcggctac3480accacggacg aaggaacaac agagtgccca gaaccagtga acaccaccgc cgaattaaaa3540gaatacctca gctgtacgta cctccttccc ttcctccctt atccccccat ccccatccca3600ataacaccaa cccagcaaca acaacctacg gctgggccct cgactcacag gtagtatcct3660cgctcctgga cctctacccc aacaccacct ccttcggcat cccatcatcc gaagaactcg3720gcggcaacgt caccttccca cagccctacg gcgccgcatt ccgccagacg gcagcatact3780acggcgacgc ccagttcata gccgcgacgc gctacacctg tgagctatgg gcggcacata3840acctgacagc atattgctac cgattcaaca ccaagacaga cgattacaac agggaagaag3900gcgtggcgca tttctcggac gtgatcttca tcttcaacaa ccttaatggt tatgggttca3960gtccgaaccc gttcaccaat gctccagaga gctatactga gcttagctac ctcatgtccg4020gctcgtggat cagcttcact aatagtctgg atcctaataa gtggactggt cgcggaagga4080acgctacgaa gacggagaat tggcccgtgt atgatctgga gaatcccttg agtatgatct4140gggatgcgaa tgtcacttcg tatgcggcgc cggatacttg gcgtaaggag ggtattgcgt4200tgattaatgc taatcggagg gcgtatcaga ggtgaatgtg gtgtagcttg cagccgttgc4260ctacttgttc gactttcaaa ctcaaaactt tctattgaga gagaaaattg tgcgaggaaa4320gtactaccgc gggcagaaca ctctgcgcac aggtccatat ctacaaactc actgaacaga4380gtctatagca gattaggtag attgtcaagc ttacatacag acataacccc accacaatat4440cgtggtaaga tagcacattt ctttaaagaa gaaaaaaaaa gatgaataca tataatcggc4500tacgtcaata attcaaaaca gaatatgtca gctgtgcaca catccgacca ttacactagt4560aaagtgagcg gcggc 4575<210>32<211>1695<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS
<222>(1)..(1695)<400>32atg aag gga atg ctc ccg acg ctt agt tgg ttg gca ctg ggc atg gcc48Met Lys Gly Met Leu Pro Thr Leu Ser Trp Leu Ala Leu Gly Met Ala1 5 10 15agc ctg gca acc tgc acc aac cca gta gcc cag aca aag aac gga agt96Ser Leu Ala Thr Cys Thr Asn Pro Val Ala Gln Thr Lys Asn Gly Ser20 25 30tat tat ggt gtc tac atg cct cag tat aat gag gat tat ttt ctt gga144Tyr Tyr Gly Val Tyr Met Pro Gln Tyr Asn Glu Asp Tyr Phe Leu Gly35 40 45att cca ttt gct aag ccc ccg ttg gca cac ttg cgt tgg gcc aac ccc192Ile Pro Phe Ala Lys Pro Pro Leu Ala His Leu Arg Trp Ala Asn Pro50 55 60gag agt ctt aat gag tct tgg tcg gga ttg cgc cct gct acc ggc tat240Glu Ser Leu Asn Glu Ser Trp Ser Gly Leu Arg Pro Ala Thr Gly Tyr65 70 75 80gcg atg gaa tgt ata ggt tac ggc agt gat caa aaa ggt tat ctg cag288Ala Met Glu Cys Ile Gly Tyr Gly Ser Asp Gln Lys Gly Tyr Leu Gln85 90 95agc gag gac tgt ctc tac cta aac gtg gtc cgt ccc gct gaa tac gac336Ser Glu Asp Cys Leu Tyr Leu Asn Val Val Arg Pro Ala Glu Tyr Asp100 105 110aat gcc agt ctt cca gtc ctt gta tgg att cat ggc ggt ggc ttc gca384Asn Ala Ser Leu Pro Val Leu Val Trp Ile His Gly Gly Gly Phe Ala115 120 125caa ggc ggc act ccc gac ctt cga tac aat ctt aca ttt att gtt gaa432Gln Gly Gly Thr Pro Asp Leu Arg Tyr Asn Leu Thr Phe Ile Val Glu130 135 140cac tcg gtc aat atc ggc cag cca att atc gca gtg agc gtt gcc tat480His Ser Val Asn Ile Gly Gln Pro Ile Ile Ala Val Ser Val Ala Tyr145 150 155 160cgt ctc ggt cct tgg ggt ttc ttc aat ggg gtc gag ctc gcc aat gag528Arg Leu Gly Pro Trp Gly Phe Phe Asn Gly Val Glu Leu Ala Asn Glu165 170 175gga tcg tta aat ctc ggg ctg aag gac cag cgc ttg gcc ctg cat tgg576Gly Ser Leu Asn Leu Gly Leu Lys Asp Gln Arg Leu Ala Leu His Trp180 185 190gtg aaa gag aac att gca ggt ttc ggt ggc gac cct agt aaa gtc gtg624Val Lys Glu Asn Ile Ala Gly Phe Gly Gly Asp Pro Ser Lys Val Val195 200 205att tac gga caa agt gcc ggc tcc gaa agc gtg gga tac caa atc cgc672Ile Tyr Gly Gln Ser Ala Gly Ser Glu Ser Val Gly Tyr Gln Ile Arg
210 215 220gcg tac aac ggc cga gat gac ggg ctc ttc cgc gga ggc atg atg gag720Ala Tyr Asn Gly Arg Asp Asp Gly Leu Phe Arg Gly Gly Met Met Glu225 230 235 240tcc ggc gcg gtg tta cct ggc agt gcc ttg aac ctc acc tgg aca tat768Ser Gly Ala Val Leu Pro Gly Ser Ala Leu Asn Leu Thr Trp Thr Tyr245 250 255gag cct tgg ttc cag caa ata gca gac gag gca gga tgt tcc cag acc816Glu Pro Trp Phe Gln Gln Ile Ala Asp Glu Ala Gly Cys Ser Gln Thr260 265 270acc cgc aaa ctg gac tgt cta cgc cgc acg ccc ttc aca gtc cta aac864Thr Arg Lys Leu Asp Cys Leu Arg Arg Thr Pro Phe Thr Val Leu Asn275 280 285aac att ctg aac acc acc gcc aac gac acg acg cct tac aac tgg agg912Asn Ile Leu Asn Thr Thr Ala Asn Asp Thr Thr Pro Tyr Asn Trp Arg290 295 300ccc aca gtg gac ggt gac ttc gta gcg cga tat ccc agc gag caa ctc960Pro Thr Val Asp Gly Asp Phe Val Ala Arg Tyr Pro Ser Glu Gln Leu305 310 315 320gac aca gga gac ttc gtc aaa gta cca atc ata atc ggc tac acc acg1008Asp Thr Gly Asp Phe Val Lys Val Pro Ile Ile Ile Gly Tyr Thr Thr325 330 335gac gaa gga aca aca gag tgc cca gaa cca gtg aac acc acc gcc gaa1056Asp Glu Gly Thr Thr Glu Cys Pro Glu Pro Val Asn Thr Thr Ala Glu340 345 350tta aaa gaa tac ctc agc tca aca aca acc tac ggc tgg gcc ctc gac1104Leu Lys Glu Tyr Leu Ser Ser Thr Thr Thr Tyr Gly Trp Ala Leu Asp355 360 365tca cag gta gta tcc tcg ctc ctg gac ctc tac ccc aac acc acc tcc1152Ser Gln Val Val Ser Ser Leu Leu Asp Leu Tyr Pro Asn Thr Thr Ser370 375 380ttc ggc atc cca tca tcc gaa gaa ctc ggc ggc aac gtc acc ttc cca1200Phe Gly Ile Pro Ser Ser Glu Glu Leu Gly Gly Asn Val Thr Phe Pro385 390 395 400cag ccc tac ggc gcc gca ttc cgc cag acg gca gca tac tac ggc gac1248Gln Pro Tyr Gly Ala Ala Phe Arg Gln Thr Ala Ala Tyr Tyr Gly Asp405 410 415gcc cag ttc ata gcc gcg acg cgc tac acc tgt gag cta tgg gcg gca1296Ala Gln Phe Ile Ala Ala Thr Arg Tyr Thr Cys Glu Leu Trp Ala Ala420 425 430cat aac ctg aca gca tat tgc tac cga ttc aac acc aag aca gac gat1344His Asn Leu Thr Ala Tyr Cys Tyr Arg Phe Asn Thr Lys Thr Asp Asp435 440 445tac aac agg gaa gaa ggc gtg gcg cat ttc tcg gac gtg atc ttc atc1392
Tyr Asn Arg Glu Glu Gly Val Ala His Phe Ser Asp Val Ile Phe Ile450 455 460ttc aac aac ctt aat ggt tat ggg ttc agt ccg aac ccg ttc acc aat1440Phe Asn Asn Leu Asn Gly Tyr Gly Phe Ser Pro Asn Pro Phe Thr Asn465 470 475 480gct cca gag agc tat act gag ctt agc tac ctc atg tcc ggc tcg tgg1488Ala Pro Glu Ser Tyr Thr Glu Leu Ser Tyr Leu Met Ser Gly Ser Trp485 490 495atc agc ttc act aat agt ctg gat cct aat aag tgg act ggt cgc gga1536Ile Ser Phe Thr Asn Ser Leu Asp Pro Asn Lys Trp Thr Gly Arg Gly500 505 510agg aac gct acg aag acg gag aat tgg ccc gtg tat gat ctg gag aat1584Arg Asn Ala Thr Lys Thr Glu Asn Trp Pro Val Tyr Asp Leu Glu Asn515 520 525ccc ttg agt atg atc tgg gat gcg aat gtc act tcg tat gcg gcg ccg1632Pro Leu Ser Met Ile Trp Asp Ala Asn Val Thr Ser Tyr Ala Ala Pro530 535 540gat act tgg cgt aag gag ggt att gcg ttg att aat gct aat cgg agg1680Asp Thr Trp Arg Lys Glu Gly Ile Ala Leu Ile Asn Ala Asn Arg Arg545 550 555 560gcg tat cag agg tga1695Ala Tyr Gln Arg<210>33<211>564<212>PRT<213>黑曲霉(Aspergillus niger)<400>33Met Lys Gly Met Leu Pro Thr Leu Ser Trp Leu Ala Leu Gly Met Ala1 5 10 15Ser Leu Ala Thr Cys Thr Asn Pro Val Ala Gln Thr Lys Asn Gly Ser20 25 30Tyr Tyr Gly Val Tyr Met Pro Gln Tyr Asn Glu Asp Tyr Phe Leu Gly35 40 45Ile Pro Phe Ala Lys Pro Pro Leu Ala His Leu Arg Trp Ala Asn Pro50 55 60Glu Ser Leu Asn Glu Ser Trp Ser Gly Leu Arg Pro Ala Thr Gly Tyr65 70 75 80Ala Met Glu Cys Ile Gly Tyr Gly Ser Asp Gln Lys Gly Tyr Leu Gln85 90 95Ser Glu Asp Cys Leu Tyr Leu Asn Val Val Arg Pro Ala Glu Tyr Asp100 105 110
Asn Ala Ser Leu Pro Val Leu Val Trp Ile His Gly Gly Gly Phe Ala115 120 125Gln Gly Gly Thr Pro Asp Leu Arg Tyr Asn Leu Thr Phe Ile Val Glu130 135 140His Ser Val Asn Ile Gly Gln Pro Ile Ile Ala Val Ser Val Ala Tyr145 150 155 160Arg Leu Gly Pro Trp Gly Phe Phe Asn Gly Val Glu Leu Ala Asn Glu165 170 175Gly Ser Leu Asn Leu Gly Leu Lys Asp Gln Arg Leu Ala Leu His Trp180 185 190Val Lys Glu Asn Ile Ala Gly Phe Gly Gly Asp Pro Ser Lys Val Val195 200 205Ile Tyr Gly Gln Ser Ala Gly Ser Glu Ser Val Gly Tyr Gln Ile Arg210 215 220Ala Tyr Asn Gly Arg Asp Asp Gly Leu Phe Arg Gly Gly Met Met Glu225 230 235 240Ser Gly Ala Val Leu Pro Gly Ser Ala Leu Asn Leu Thr Trp Thr Tyr245 250 255Glu Pro Trp Phe Gln Gln Ile Ala Asp Glu Ala Gly Cys Ser Gln Thr260 265 270Thr Arg Lys Leu Asp Cys Leu Arg Arg Thr Pro Phe Thr Val Leu Asn275 280 285Asn Ile Leu Asn Thr Thr Ala Asn Asp Thr Thr Pro Tyr Asn Trp Arg290 295 300Pro Thr Val Asp Gly Asp Phe Val Ala Arg Tyr Pro Ser Glu Gln Leu305 310 315 320Asp Thr Gly Asp Phe Val Lys Val Pro Ile Ile Ile Gly Tyr Thr Thr325 330 335Asp Glu Gly Thr Thr Glu Cys Pro Glu Pro Val Asn Thr Thr Ala Glu340 345 350Leu Lys Glu Tyr Leu Ser Ser Thr Thr Thr Tyr Gly Trp Ala Leu Asp355 360 365Ser Gln Val Val Ser Ser Leu Leu Asp Leu Tyr Pro Asn Thr Thr Ser370 375 380Phe Gly Ile Pro Ser Ser Glu Glu Leu Gly Gly Asn Val Thr Phe Pro385 390 395 400Gln Pro Tyr Gly Ala Ala Phe Arg Gln Thr Ala Ala Tyr Tyr Gly Asp405 410 415Ala Gln Phe Ile Ala Ala Thr Arg Tyr Thr Cys Glu Leu Trp Ala Ala420 425 430His Asn Leu Thr Ala Tyr Cys Tyr Arg Phe Asn Thr Lys Thr Asp Asp435 440 445Tyr Asn Arg Glu Glu Gly Val Ala His Phe Ser Asp Val Ile Phe Ile450 455 460
Phe Asn Asn Leu Asn Gly Tyr Gly Phe Ser Pro Asn Pro Phe Thr Asn465 470 475 480Ala Pro Glu Ser Tyr Thr Glu Leu Ser Tyr Leu Met Ser Gly Ser Trp485 490 495Ile Ser Phe Thr Asn Ser Leu Asp Pro Asn Lys Trp Thr Gly Arg Gly500 505 510Arg Asn Ala Thr Lys Thr Glu Asn Trp Pro Val Tyr Asp Leu Glu Asn515 520 525Pro Leu Ser Met Ile Trp Asp Ala Asn Val Thr Ser Tyr Ala Ala Pro530 535 540Asp Thr Trp Arg Lys Glu Gly Ile Ala Leu Ile Asn Ala Asn Arg Arg545 550 555 560Ala Tyr Gln Arg<210>34<211>2371<212>DNA<213>黑曲霉(Aspergillus niger)<400>34gccctgacat ggacggtgtc agatagagac cgttggaagg ctgaaccaca gggcacacgg60cacgttgagg accctgcatg ccggtgtatc cggataatgg cagataatcc cggctaattg120ggggcgacgg cagctacggc tcacaaattg tgatggaata gacacggcat gatgtttcaa180tgaagctcca aactttacag tgctaggctg taaacgtgat tataatcacg atgtaattga240ttatcatcta caactcaacc cccgcaccaa gaaatgaatc ctctcgtcgg aagaaaaaga300cggcattcca gaagaacttt ttcctagata acaaacagta atcagtccat ccgtccctga360cgatcccccc atcgaacctc ggtaagacgc tcgacccaaa aaccagaccg acaagctttt420caacctccct aaacgaaaca acggctgtgt tgatcgtgaa cgtggttgcc tataccaata480cgagaaccat ataggataga aattgagttt accgtggaaa agccacccgc tacagtttaa540ttaaccaacc cacccacatg cccaaggcac ctgtaacagg gactactgtc cagagagtgg600atagtggcta gtgggcagac gtcggatgaa ctccggaaga ccctaactga tacgtagaac660catcgtgaac cctggtttgt ccctagttcg gggcgctatt cccagcgtag aaaagcggcc720gatcctctga aacagttttc ccccggggta tacttgctag ttagtcacta tcatacaaaa780gtagtgtagt ggacaagacc agggtctact actattagtt agttctgttt catcccgact840caattttgcg tcccaagacc ctgggttgtc cgggcctgtc ttgcccaaca cgagatgtat900ggagtaagta tggagggaga ctaacctcgg aatattcttg tctcttttta gtactatcta960gcccttagtg agactatagc agtagtgaac cagagagaga gagagatgtc tatataagta1020cagtcgtaga tccctaaaca tgaccagctt cagactcaga ctcgagcagc cagtgcagtc1080cagtccactc tttcattctc accccttctt tactatctta caataatttc tattcaataa1140gtctgcagtg cagcacccac acacattcat tctctgagag ataaaaaata acaaaatggc1200ccccctcaaa tccctcctcc tcggcgcctc cctggccacc ctcgcccttt ccaccccact1260ggcaaccgac gccgaaaacc tctacgcacg tcaattcggc acgggctcta cagccaacga1320actcgagcag ggaagctgca aggatgtgac tctcatcttt gcgagggggt caactgagct1380
tgggaatatg gtatgcttgt tgcctgcctt tacccgtact atactatccc agaacatacc1440aagcacaaca tcacaaaaca tgtggagcca ggagctaatc agtggtggtg atgatatgat1500gtagggcacc gtaatcggcc cccctctctg cgacaacctg aaatccaaac tcggatccga1560caaagtcgcc tgccagggtg tcggcggcca atacagcgcc ggactcgtgc agaatgccct1620gccccagaac accgatccgg ggagtatctc cgccgcgaag cagatgttcg aggaggcgaa1680ttcgaagtgt cccaatacta agattgttgc gggtggttat aggtatatat ccctttcccc1740tttaccttcc cccatatcaa tgctagaggc aaaggaatat catgctaatg tagatgttgg1800ggaaacagtc aaggaagcgc tgtgattgac aacgccgtgc aagaactcag caccaccgtg1860aaagaccaag tgaagggtgt cgtgctcttc gggttcacga gaaacgtgca ggatcacggg1920cagatcccta attaccctaa ggatgacgtg aaggtttatt gtgccgtggg cgatctggtc1980tgtgatgata cgttggttgt tacggcgatg catctgacgt atggcatgga tgcgggtgat2040gcggcgagct ttttggccga gaaggtgcag tcttccagta gttcgactac tagctccagc2100tcggatgccg cgagtagttc atctgctgcg gggacgtcgt cgtcggggtt gtcgggactg2160tcttcttttt ttggaggtct ctaaatagaa ttagatgaga tgagtggtcc gggtgggggt2220ttaggggatt gttgttcgtt tctcttggat gatttagttt ccgttattta cttagctggg2280ataagatata tggtacatag tatagatgtg ttgtgatgtt attctggcta ttttgtacac2340tttgacatga tctgcgatat gggagcgtct a 2371<210>35<211>789<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(789)<400>35atg gcc ccc ctc aaa tcc ctc ctc ctc ggc gcc tcc ctg gcc acc ctc48Met Ala Pro Leu Lys Ser Leu Leu Leu Gly Ala Ser Leu Ala Thr Leu1 5 10 15gcc ctt tcc acc cca ctg gca acc gac gcc gaa aac ctc tac gca cgt96Ala Leu Ser Thr Pro Leu Ala Thr Asp Ala Glu Asn Leu Tyr Ala Arg20 25 30caa ttc ggc acg ggc tct aca gcc aac gaa ctc gag cag gga agc tgc144Gln Phe Gly Thr Gly Ser Thr Ala Asn Glu Leu Glu Gln Gly Ser Cys35 40 45aag gat gtg act ctc atc ttt gcg agg ggg tca act gag ctt ggg aat192Lys Asp Val Thr Leu Ile Phe Ala Arg Gly Ser Thr Glu Leu Gly Asn50 55 60atg ggc acc gta atc ggc ccc cct ctc tgc gac aac ctg aaa tcc aaa240Met Gly Thr Val Ile Gly Pro Pro Leu Cys Asp Asn Leu Lys Ser Lys65 70 75 80
ctc gga tcc gac aaa gtc gcc tgc cag ggt gtc ggc ggc caa tac agc288Leu Gly Ser Asp Lys Val Ala Cys Gln Gly Val Gly Gly Gln Tyr Ser85 90 95gcc gga ctc gtg cag aat gcc ctg ccc cag aac acc gat ccg ggg agt336Ala Gly Leu Val Gln Asn Ala Leu Pro Gln Asn Thr Asp Pro Gly Ser100 105 110atc tcc gcc gcg aag cag atg ttc gag gag gcg aat tcg aag tgt ccc384Ile Ser Ala Ala Lys Gln Met Phe Glu Glu Ala Asn Ser Lys Cys Pro115 120 125aat act aag att gtt gcg ggt ggt tat agt caa gga agc gct gtg att432Asn Thr Lys Ile Val Ala Gly Gly Tyr Ser Gln Gly Ser Ala Val Ile130 135 140gac aac gcc gtg caa gaa ctc agc acc acc gtg aaa gac caa gtg aag480Asp Asn Ala Val Gln Glu Leu Ser Thr Thr Val Lys Asp Gln Val Lys145 150 155 160ggt gtc gtg ctc ttc ggg ttc acg aga aac gtg cag gat cac ggg cag528Gly Val Val Leu Phe Gly Phe Thr Arg Asn Val Gln Asp His Gly Gln165 170 175atc cct aat tac cct aag gat gac gtg aag gtt tat tgt gcc gtg ggc576Ile Pro Asn Tyr Pro Lys Asp Asp Val Lys Val Tyr Cys Ala Val Gly180 185 190gat ctg gtc tgt gat gat acg ttg gtt gtt acg gcg atg cat ctg acg624Asp Leu Val Cys Asp Asp Thr Leu Val Val Thr Ala Met His Leu Thr195 200 205tat ggc atg gat gcg ggt gat gcg gcg agc ttt ttg gcc gag aag gtg672Tyr Gly Met Asp Ala Gly Asp Ala Ala Ser Phe Leu Ala Glu Lys Val210 215 220cag tct tcc agt agt tcg act act agc tcc agc tcg gat gcc gcg agt720Gln Ser Ser Ser Ser Ser Thr Thr Ser Ser Ser Ser Asp Ala Ala Ser225 230 235 240agt tca tct gct gcg ggg acg tcg tcg tcg ggg ttg tcg gga ctg tct768Ser Ser Ser Ala Ala Gly Thr Ser Ser Ser Gly Leu Ser Gly Leu Ser245 250 255tct ttt ttt gga ggt ctc taa789Ser Phe Phe Gly Gly Leu260<210>36<211>262<212>PRT<213>黑曲霉(Aspergillus niger)<400>36
Met Ala Pro Leu Lys Ser Leu Leu Leu Gly Ala Ser Leu Ala Thr Leu1 5 10 15Ala Leu Ser Thr Pro Leu Ala Thr Asp Ala Glu Asn Leu Tyr Ala Arg20 25 30Gln Phe Gly Thr Gly Ser Thr Ala Asn Glu Leu Glu Gln Gly Ser cys35 40 45Lys Asp Val Thr Leu Ile Phe Ala Arg Gly Ser Thr Glu Leu Gly Asn50 55 60Met Gly Thr Val Ile Gly Pro Pro Leu Cys Asp Asn Leu Lys Ser Lys65 70 75 80Leu Gly Ser Asp Lys Val Ala Cys Gln Gly Val Gly Gly Gln Tyr Ser85 90 95Ala Gly Leu Val Gln Asn Ala Leu Pro Gln Asn Thr Asp Pro Gly Ser100 105 110Ile Ser Ala Ala Lys Gln Met Phe Glu Glu Ala Asn Ser Lys Cys Pro115 120 125Asn Thr Lys Ile Val Ala Gly Gly Tyr Ser Gln Gly Ser Ala Val Ile130 135 140Asp Asn Ala Val Gln Glu Leu Ser Thr Thr Val Lys Asp Gln Val Lys145 150 155 160Gly Val Val Leu Phe Gly Phe Thr Arg Asn Val Gln Asp His Gly Gln165 170 175Ile Pro Asn Tyr Pro Lys Asp Asp Val Lys Val Tyr Cys Ala Val Gly180 185 190Asp Leu Val Cys Asp Asp Thr Leu Val Val Thr Ala Met His Leu Thr195 200 205Tyr Gly Met Asp Ala Gly Asp Ala Ala Ser Phe Leu Ala Glu Lys Val210 215 220Gln Ser Ser Ser Ser Ser Thr Thr Ser Ser Ser Ser Asp Ala Ala Ser225 230 235 240Ser Ser Ser Ala Ala Gly Thr Ser Ser Ser Gly Leu Ser Gly Leu Ser245 250 255Ser Phe Phe Gly Gly Leu260<210>37<211>2981<212>DNA<213>黑曲霉(Aspergillus niger)<400>37tcctcatccc atgctctccc ggcagaaccc cggagacaac ccacactaat gcacccaaag60caaaatgaca tggattgaat tatccggggt gcatccatct tgttccccca cacattggac120
cctttcctta taatggctgc cccggcaaac ccccaattgc tgtttaggcc agcgcagata180gcaaatctct cgtctgatta acgatgctaa agctcgctgt tgctcttttt tcgttacttg240ccgtgggcaa tgcagcgcca accaaagtgg cccgttccac ggccagtcct acggccaagg300ttcgcaacgg tacatatgtc ggagtgacaa atgcgcatta ccagcaagat ttctttttgg360gaatgccgta tgcccagcag cctttaggtg acttgcgctt cacggtgcct cagtccctga420acgaaagctg gagtggcgag cgcgacgcga aggaatattc caatatctgt gtaggatacg480gtgtgagtgc gcaaatcttc ttcgagagcc aggccctact agctgcatcc tggcactatg540aatataatct aatgggtaga tctgttagac cgactcgatt tggtacccac agtccgaagc600ttgtctaacc ttgaatgtca tccgcgattc ttctgcaaat gagaactcga agctccccgt660gggcgtctgg atacatggag gtggcttctt tgagggatct agtgctgacc agcgctacaa720catgtccgcg attgttgcca actcctataa gatcggtatg tcgacgtatg cggttgtaga780attagactga ctcggcttgc tcgcattgta ggaaagccgt tcattgctgt cagcttaaac840tatcgccttt cggcatgggg cttcttgagt tccagtcaag tctggggcac tggcaatacc900aatctaggta tcagggatca aaggttagca ctccattgga tcaaggagaa tatcgcggca960ttcggaggag acccagataa gatcactatc tggggcgaat ctgccggagc gatgtccgtg1020ggttatcacc ttgcagcata cggcggtagg gacgatggac tcttccgtgg aggaattatg1080gagtcaggag ggactattgc agctagtcca gccaactata ccgggtacca agcgcactat1140gatgagctcg cgggtcaagt cggttgctcc gacgtagtag attcgttgca gtgcctgcgc1200gaagttccgt tcgagaaatt gaacgctgct ctcaacacca ccagtggtaa ctcggatttc1260aatttcgggc ccgtcattga tggagatata atcagggact ggggcagcct ccagctagac1320aagcatgaat tcgtcaaagt ccctattctt gcaggtacca ataccgacga agggacagcc1380tttgggccca caggtatcaa cacgacagag gagttctatg catatctcac aggtatgtgt1440gataatgagt taacatcctg aaagaacccc agagcagcaa aacgggctaa tctcactggc1500agatggcgaa tctggattcc agctaccccc cacgatcgcc caggaaatcc tgcagctcta1560ccctgatgat ccagcactgg gcatccccga atttctcggt gacactagag tcccgtccaa1620aggctaccaa tggcggcgca cctgtgcata cgcaggggac tatgtaatgc atgccaaccg1680tcgccgacaa tgtgaggcgt ggacagagac ctcgacgacg gcgtactgtt atcgattcaa1740tatgcgtgcg gccgatgtcc ccatcctgtc tggcgccacc cattttgaag aagttgcttt1800tgtattcaac aacattgcag gactcgggta ccattacgga aagccgttcg cagggatgcc1860cgagtcctac gtacagctaa gcaacttgat gaccagcatg tgggcatcct tcatccacga1920tttagaccct aattcgggca tcaaggactc agctgtacag tggcaaccgt acgggaagga1980tcagccggtt gatctagtgt ttgatgcgaa tgtcacgagc tacagctaca tggagccaga2040cacgtggcgg aaggagggga tcgactatat caattccgtg gccaacgcgt actggcgata2100agcttcatgc tatcgaaaac acatgtgatg agcgtgagag tttttgcctt ccgcttgatg2160ttgcctgcga gaggaaaagg ttaaggcaaa caaggatggt agggggtgcg agcgcatcta2220agtcggccac ggtagttgat tgatggttcc ctcgttagaa gcaaatacag atgccatact2280tcctgcaaca aacccagaac ttgttgtaat caagtttttt caaacggatg gtagatcggt2340tccgatttgt aaaaagcaag atcctagcgt tacgagggaa ccaagacacc cacacagagg2400agcattacga attccaaatt accaaagcct gtataacaaa aaccagcaga gaccgcctaa2460ttagtcaact acagcattgg ttcaatgtac ctgcaaggac ctttacacgc gtggtcaccc2520atgtaccaag ccaagccaac ggccaagaca cggaaataac caagaggaaa ccactccctc2580caagaatcaa gaacccaggg ggtcaagaga atctggaagc gataaagggg tcttcttttt2640tttctttgct tacctagaga gggaggagtc ggcgttcatc gtcaatcagt agagtgttct2700ccgccctgag tggtgtagtc tatatccgga ccatcgggga catgattatc atacgatcca2760
taaccaagtc cccgattgta ctacggctac caaaactaga atgatgaaaa tattggagta2820cgaaaggaac taaaccaata ctaagaaaaa aaaaaaagag taaagaaaaa agagtaaaaa2880accaagctcg gaaagtaaaa atttcccctg gtcttgttgt cattccccta cctattgaga2940accgggttca ccaatgacag cggatccccg atttgacatc g2981<210>38<211>1686<212>DNA<213>黑曲霉(Aspergillus niger)<220>
<221>CDS<222>(1)..(1686)<400>38atg cta aag ctc gct gtt gct ctt ttt tcg tta ctt gcc gtg ggc aat48Met Leu Lys Leu Ala Val Ala Leu Phe Ser Leu Leu Ala Val Gly Asn1 5 10 15gca gcg cca acc aaa gtg gcc cgt tcc acg gcc agt cct acg gcc aag96Ala Ala Pro Thr Lys Val Ala Arg Ser Thr Ala Ser Pro Thr Ala Lys20 25 30gtt cgc aac ggt aca tat gtc gga gtg aca aat gcg cat tac cag caa144Val Arg Asn Gly Thr Tyr Val Gly Val Thr Asn Ala His Tyr Gln Gln35 40 45gat ttc ttt ttg gga atg ccg tat gcc cag cag cct tta ggt gac ttg192Asp Phe Phe Leu Gly Met Pro Tyr Ala Gln Gln Pro Leu Gly Asp Leu50 55 60cgc ttc acg gtg cct cag tcc ctg aac gaa agc tgg agt ggc gag cgc240Arg Phe Thr Val Pro Gln Ser Leu Asn Glu Ser Trp Ser Gly Glu Arg65 70 75 80gac gcg aag gaa tat tcc aat atc tgt gta gga tac ggt acc gac tcg288Asp Ala Lys Glu Tyr Ser Asn Ile Cys Val Gly Tyr Gly Thr Asp Ser85 90 95att tgg tac cca cag tcc gaa gct tgt cta acc ttg aat gtc atc cgc336Ile Trp Tyr Pro Gln Ser Glu Ala Cys Leu Thr Leu Asn Val Ile Arg100 105 110gat tct tct gca aat gag aac tcg aag ctc ccc gtg ggc gtc tgg ata384Asp Ser Ser Ala Asn Glu Asn Ser Lys Leu Pro Val Gly Val Trp Ile115 120 125cat gga ggt ggc ttc ttt gag gga tct agt gct gac cag cgc tac aac432His Gly Gly Gly Phe Phe Glu Gly Ser Ser Ala Asp Gln Arg Tyr Asn130 135 140atg tcc gcg att gtt gcc aac tcc tat aag atc gga aag ccg ttc att480
Met Ser Ala Ile Val Ala Asn Ser Tyr Lys Ile Gly Lys Pro Phe Ile145 150 155 160gct gtc agc tta aac tat cgc ctt tcg gca tgg ggc ttc ttg agt tcc528Ala Val Ser Leu Asn Tyr Arg Leu Ser Ala Trp Gly Phe Leu Ser Ser165 170 175agt caa gtc tgg ggc act ggc aat acc aat cta ggt atc agg gat caa576Ser Gln Val Trp Gly Thr Gly Asn Thr Asn Leu Gly Ile Arg Asp Gln180 185 190agg tta gca ctc cat tgg atc aag gag aat atc gcg gca ttc gga gga624Arg Leu Ala Leu His Trp Ile Lys Glu Asn Ile Ala Ala Phe Gly Gly195 200 205gac cca gat aag atc act atc tgg ggc gaa tct gcc gga gcg atg tcc672Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser Ala Gly Ala Met Ser210 215 220gtg ggt tat cac ctt gca gca tac ggc ggt agg gac gat gga ctc ttc720Val Gly Tyr His Leu Ala Ala Tyr Gly Gly Arg Asp Asp Gly Leu Phe225 230 235 240cgt gga gga att atg gag tca gga ggg act att gca gct agt cca gcc768Arg Gly Gly Ile Met Glu Ser Gly Gly Thr Ile Ala Ala Ser Pro Ala245 250 255aac tat acc ggg tac caa gcg cac tat gat gag ctc gcg ggt caa gtc816Asn Tyr Thr Gly Tyr Gln Ala His Tyr Asp Glu Leu Ala Gly Gln Val260 265 270ggt tgc tcc gac gta gta gat tcg ttg cag tgc ctg cgc gaa gtt ccg864Gly Cys Ser Asp Val Val Asp Ser Leu Gln Cys Leu Arg Glu Val Pro275 280 285ttc gag aaa ttg aac gct gct ctc aac acc acc agt ggt aac tcg gat912Phe Glu Lys Leu Asn Ala Ala Leu Asn Thr Thr Ser Gly Asn Ser Asp290 295 300ttc aat ttc ggg ccc gtc att gat gga gat ata atc agg gac tgg ggc960Phe Asn Phe Gly Pro Val Ile Asp Gly Asp Ile Ile Arg Asp Trp Gly305 310 315 320agc ctc cag cta gac aag cat gaa ttc gtc aaa gtc cct att ctt gca1008Ser Leu Gln Leu Asp Lys His Glu Phe Val Lys Val Pro Ile Leu Ala325 330 335ggt acc aat acc gac gaa ggg aca gcc ttt ggg ccc aca ggt atc aac1056Gly Thr Asn Thr Asp Glu Gly Thr Ala Phe Gly Pro Thr Gly Ile Asn340 345 350acg aca gag gag ttc tat gca tat ctc aca gat ggc gaa tct gga ttc1104Thr Thr Glu Glu Phe Tyr Ala Tyr Leu Thr Asp Gly Glu Ser Gly Phe355 360 365cag cta ccc ccc acg atc gcc cag gaa atc ctg cag ctc tac cct gat1152Gln Leu Pro Pro Thr Ile Ala Gln Glu Ile Leu Gln Leu Tyr Pro Asp370 375 380
gat cca gca ctg ggc atc ccc gaa ttt ctc ggt gac act aga gtc ccg1200Asp Pro Ala Leu Gly lle Pro Glu Phe Leu Gly Asp Thr Arg Val Pro385 390 395 400tcc aaa ggc tac caa tgg cgg cgc acc tgt gca tac gca ggg gac tat1248Ser Lys Gly Tyr Gln Trp Arg Arg Thr Cys Ala Tyr Ala Gly Asp Tyr405 410 415gta atg cat gcc aac cgt cgc cga caa tgt gag gcg tgg aca gag acc1296Val Met His Ala Asn Arg Arg Arg Gln Cys Glu Ala Trp Thr Glu Thr420 425 430tcg acg acg gcg tac tgt tat cga ttc aat atg cgt gcg gcc gat gtc1344Ser Thr Thr Ala Tyr Cys Tyr Arg Phe Asn Met Arg Ala Ala Asp Val435 440 445ccc atc ctg tct ggc gcc acc cat ttt gaa gaa gtt gct ttt gta ttc1392Pro Ile Leu Ser Gly Ala Thr His Phe Glu Glu Val Ala Phe Val Phe450 455 460aac aac att gca gga ctc ggg tac cat tac gga aag ccg ttc gca ggg1440Asn Asn Ile Ala Gly Leu Gly Tyr His Tyr Gly Lys Pro Phe Ala Gly465 470 475 480atg ccc gag tcc tac gta cag cta agc aac ttg atg acc agc atg tgg1488Met Pro Glu Ser Tyr Val Gln Leu Ser Asn Leu Met Thr Ser Met Trp485 490 495gca tcc ttc atc cac gat tta gac cct aat tcg ggc atc aag gac tca1536Ala Ser Phe Ile His Asp Leu Asp Pro Asn Ser Gly Ile Lys Asp Ser500 505 510gct gta cag tgg caa ccg tac ggg aag gat cag ccg gtt gat cta gtg1584Ala Val Gln Trp Gln Pro Tyr Gly Lys Asp Gln Pro Val Asp Leu Val515 520 525ttt gat gcg aat gtc acg agc tac agc tac atg gag cca gac acg tgg1632Phe Asp Ala Asn Val Thr Ser Tyr Ser Tyr Met Glu Pro Asp Thr Trp530 535 540cgg aag gag ggg atc gac tat atc aat tcc gtg gcc aac gcg tac tgg1680Arg Lys Glu Gly Ile Asp Tyr Ile Asn Ser Val Ala Asn Ala Tyr Trp545 550 555 560cga taa1686Arg<210>39<211>561<212>PRT<213>黑曲霉(Aspergillus niger)<400>39Met Leu Lys Leu Ala Val Ala Leu Phe Ser Leu Leu Ala Val Gly Asn
1 5 10 15Ala Ala Pro Thr Lys Val Ala Arg Ser Thr Ala Ser Pro Thr Ala Lys20 25 30Val Arg Asn Gly Thr Tyr Val Gly Val Thr Asn Ala His Tyr Gln Gln35 40 45Asp Phe Phe Leu Gly Met Pro Tyr Ala Gln Gln Pro Leu Gly Asp Leu50 55 60Arg Phe Thr Val Pro Gln Ser Leu Asn Glu Ser Trp Ser Gly Glu Arg65 70 75 80Asp Ala Lys Glu Tyr Ser Asn Ile Cys Val Gly Tyr Gly Thr Asp Ser85 90 95Ile Trp Tyr Pro Gln Ser Glu Ala Cys Leu Thr Leu Asn Val Ile Arg100 105 110Asp Ser Ser Ala Asn Glu Asn Ser Lys Leu Pro Val Gly Val Trp Ile115 120 125His Gly Gly Gly Phe Phe Glu Gly Ser Ser Ala Asp Gln Arg Tyr Asn130 135 140Met Ser Ala Ile Val Ala Asn Ser Tyr Lys Ile Gly Lys Pro Phe Ile145 150 155 160Ala Val Ser Leu Asn Tyr Arg Leu Ser Ala Trp Gly Phe Leu Ser Ser165 170 175Ser Gln Val Trp Gly Thr Gly Asn Thr Asn Leu Gly Ile Arg Asp Gln180 185 190Arg Leu Ala Leu His Trp Ile Lys Glu Asn Ile Ala Ala Phe Gly Gly195 200 205Asp Pro Asp Lys Ile Thr Ile Trp Gly Glu Ser Ala Gly Ala Met Ser210 215 220Val Gly Tyr His Leu Ala Ala Tyr Gly Gly Arg Asp Asp Gly Leu Phe225 230 235 240Arg Gly Gly Ile Met Glu Ser Gly Gly Thr Ile Ala Ala Ser Pro Ala245 250 255Asn Tyr Thr Gly Tyr Gln Ala His Tyr Asp Glu Leu Ala Gly Gln Val260 265 270Gly Cys Ser Asp Val Val Asp Ser Leu Gln Cys Leu Arg Glu Val Pro275 280 285Phe Glu Lys Leu Asn Ala Ala Leu Asn Thr Thr Ser Gly Asn Ser Asp290 295 300Phe Asn Phe Gly Pro Val Ile Asp Gly Asp Ile Ile Arg Asp Trp Gly305 310 315 320Ser Leu Gln Leu Asp Lys His Glu Phe Val Lys Val Pro Ile Leu Ala325 330 335Gly Thr Asn Thr Asp Glu Gly Thr Ala Phe Gly Pro Thr Gly Ile Asn340 345 350Thr Thr Glu Glu Phe Tyr Ala Tyr Leu Thr Asp Gly Glu Ser Gly Phe
355 360 365Gln Leu Pro Pro Thr Ile Ala Gln Glu Ile Leu Gln Leu Tyr Pro Asp370 375 380Asp Pro Ala Leu Gly Ile Pro Glu Phe Leu Gly Asp Thr Arg Val Pro385 390 395 400Ser Lys Gly Tyr Gln Trp Arg Arg Thr Cys Ala Tyr Ala Gly Asp Tyr405 410 415Val Met His Ala Asn Arg Arg Arg Gln Cys Glu Ala Trp Thr Glu Thr420 425 430Ser Thr Thr Ala Tyr Cys Tyr Arg Phe Asn Met Arg Ala Ala Asp Val435 440 445Pro Ile Leu Ser Gly Ala Thr His Phe Glu Glu Val Ala Phe Val Phe450 455 460Asn Asn Ile Ala Gly Leu Gly Tyr His Tyr Gly Lys Pro Phe Ala Gly465 470 475 480Met Pro Glu Ser Tyr Val Gln Leu Ser Asn Leu Met Thr Ser Met Trp485 490 495Ala Ser Phe Ile His Asp Leu Asp Pro Asn Ser Gly Ile Lys Asp Ser500 505 510Ala Val Gln Trp Gln Pro Tyr Gly Lys Asp Gln Pro Val Asp Leu Val515 520 525Phe Asp Ala Asn Val Thr Ser Tyr Ser Tyr Met Glu Pro Asp Thr Trp530 535 540Arg Lys Glu Gly Ile Asp Tyr Ile Asn Ser Val Ala Asn Ala Tyr Trp545 550 555 560Arg
權利要求
1.一種經(jīng)過分離的多核苷酸,所述多核苷酸能與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的多核苷酸雜交。
2.如權利要求1所述的經(jīng)過分離的多核苷酸,所述多核苷酸能在高度嚴謹條件下與選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組的多核苷酸雜交。
3.如權利要求1或2所述的經(jīng)過分離的多核苷酸,所述多核苷酸可以從絲狀真菌中獲得。
4.如權利要求3所述的經(jīng)過分離的多核苷酸,所述多核苷酸可以從Aspergillus niger中獲得。
5.一種經(jīng)過分離的多核苷酸,所述多核苷酸編碼多肽或其功能等同物,所述多肽包含選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組的氨基酸序列。
6.一種經(jīng)過分離的多核苷酸,編碼多肽或其功能等同物的至少一個功能結構域,所述多肽選自由SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。
7.一種經(jīng)過分離的多核苷酸,所述多核苷酸包含一種核苷酸序列或其功能等同物,所述核苷酸序列選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組。
8.一種經(jīng)過分離的多核苷酸,選自由SEQ ID NO1、2、4、5、7、8、10、11、13、14、16、17、19、20、22、23、25、26、28、29、31、32、34、35、37和38所構成的組。
9.一種載體,所述載體包含如權利要求1至8所述的多核苷酸序列。
10.如權利要求9所述的載體,其中所述的如權利要求1至8所述的多核苷酸與調控序列可操作地連接,所述調控序列適于所述多核苷酸序列在合適的宿主細胞中的表達。
11.如權利要求10所述的載體,其中所述的合適的宿主細胞是絲狀真菌。
12.一種用于生產(chǎn)如權利要求1-8所述的多核苷酸或如權利要求9至11所述的載體的方法,所述方法包括如下步驟培養(yǎng)經(jīng)過所述多核苷酸或所述的載體轉化的宿主細胞,從所述的宿主細胞中分離出所述的多核苷酸或所述的載體。
13.一種經(jīng)過分離的脂肪分解酶或其功能等同物,所述酶選自由SEQID NO3、6、9、12、15、18、21、24、27、30、33、36和39所構成的組。
14.如權利要求13所述的酶,可從Aspergillus niger中獲得。
15.一種經(jīng)過分離的脂肪分解酶,所述的酶可通過在合適的宿主細胞例如Aspergillus niger中表達如權利要求1至8所述的多核苷酸或如權利要求9至11所述的載體來獲得。
16.重組的脂肪分解酶,所述的酶包含如權利要求13-15中所述的任何脂肪分解酶的功能結構域。
17.一種用于生產(chǎn)如權利要求13至16所述的脂肪分解酶的方法,所述方法包括如下步驟用如權利要求1至8所述的經(jīng)過分離的多核苷酸或如權利要求9至11所述的載體對合適的宿主細胞進行轉化,在允許所述的多核苷酸表達的條件下培養(yǎng)所述的細胞,以及可選地,從所述細胞或培養(yǎng)基中純化被編碼的多肽。
18.一種重組宿主細胞,所述細胞包含如權利要求1至8所述的多核苷酸或如權利要求9至11所述的載體。
19.一種重組宿主細胞,所述細胞表達如權利要求13至16所述的脂肪分解酶。
20.經(jīng)過純化的抗體,所述抗體能與如權利要求13至16所述的脂肪分解酶發(fā)生反應。
21.融合蛋白,所述蛋白包含如權利要求13至16所述的脂肪分解酶序列。
22.一種用于生產(chǎn)面團的方法,所述方法包括添加如權利要求13-16中任意一項所述的脂肪分解酶。
23.一種用于從面團生產(chǎn)烘焙產(chǎn)品的方法,所述面團是通過如權利要求22所述的方法來制備的。
24.如權利要求13-16中任意一項所述的脂肪分解酶在制備面團和/或其烘焙產(chǎn)品中的用途。
全文摘要
本發(fā)明涉及新鑒定出來的多核苷酸序列,所述序列包含編碼來自Aspergillus niger的新穎的脂肪分解酶的基因。本發(fā)明公開了所述新穎基因的全長核苷酸序列,包含所述的新穎的脂肪分解酶的全長編碼序列的cDNA序列以及所述的全長功能蛋白質及其功能等同物的氨基酸序列。本發(fā)明還涉及在工業(yè)過程中使用上述酶的方法和診斷真菌感染的方法。本發(fā)明中還包括了用本發(fā)明的多核苷酸轉化過的細胞以及這樣的細胞其中,本發(fā)明的脂肪分解酶被遺傳修飾,以增加該酶的活性和/或表達水平。
文檔編號C12N9/20GK1675355SQ03819742
公開日2005年9月28日 申請日期2003年8月15日 優(yōu)先權日2002年8月19日
發(fā)明者理查德·奧爾本, 烏爾里克·福克斯, 安德烈亞斯·弗里茨, 貝婭特麗克絲·格哈德, 奧利弗·海因里希, 希爾馬·伊爾根弗里茨, 迪特爾·梅爾, 法維奧·斯普雷亞菲科, 克里斯琴·瓦格納, 德·萊克斯·博爾, 羅埃爾弗·伯恩哈德·梅瑪 申請人:帝斯曼知識產(chǎn)權資產(chǎn)管理有限公司