欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

來自菌株產(chǎn)加爾巴丁游動(dòng)放線菌和利古里亞游動(dòng)放線菌中的羊毛硫細(xì)菌素的生物合成成...的制作方法

文檔序號:3560659閱讀:1408來源:國知局
專利名稱:來自菌株產(chǎn)加爾巴丁游動(dòng)放線菌和利古里亞游動(dòng)放線菌中的羊毛硫細(xì)菌素的生物合成成 ...的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及羊毛硫細(xì)菌素類抗菌肽阿肽加定(actagardine)的生物合成成簇基因的表征,一種新型阿肽加定變異體與它的基因合成簇的鑒定。本發(fā)明還涉及生產(chǎn)與使用如下多肽的方法,其包括阿肽加定,菌株利古里亞游動(dòng)放線菌中的一種新的阿肽加定變體形式,以及根據(jù)本發(fā)明應(yīng)用已表征的生物合成成簇基因中的基因所生產(chǎn)出的這兩種多肽的變體形式。

背景技術(shù)
羊毛硫細(xì)菌素類抗菌肽是一類革蘭氏陽性細(xì)菌合成的具有包括抗菌能力在內(nèi)的多種活性的多肽。除了其他類型的殘基修飾以外,它們通過硫醚氨基酸羊毛硫氨酸和甲基羊毛硫氨酸將肽鏈相互交聯(lián),形成一種多環(huán)的結(jié)構(gòu)。根據(jù)一種并不絕對的分類標(biāo)準(zhǔn),這類抗菌肽可以分為2種類型,A型和B型。A型羊毛硫細(xì)菌素類抗菌肽是一類較為延伸的親水脂類肽,它們具有在細(xì)菌膜以及其他原生質(zhì)膜上形成孔洞的能力。如乳鏈菌肽(Nisin)和枯草菌素(subtilin)。相反的,B型羊毛硫細(xì)菌素類抗菌肽是一類球形的,有確定構(gòu)象的多肽,它們能夠抑制特異的酶的活性。如肉桂霉素(cinnamycin)和耐久霉素(duramycin)。
B型羊毛硫細(xì)菌素類抗菌肽例如肉桂霉素(cinnamycin)的活性包括抑制細(xì)菌活性(提供潛在的抗生素應(yīng)用前景),抑制血管緊張素轉(zhuǎn)換酶活性(提供潛在的血壓調(diào)節(jié)應(yīng)用前景),通過抑制磷脂酶A2活性實(shí)現(xiàn)的免疫調(diào)節(jié)(提供潛在的抗炎藥物應(yīng)用前景),以及對前列腺素和白三烯的生物合成的干擾。
B型羊毛硫細(xì)菌素類抗菌肽看來能通過封阻酶的底物從而干擾酶的活性。例如,研究發(fā)現(xiàn)mersacidin和阿肽加定這樣的B型羊毛硫細(xì)菌素類抗菌肽可以抑制肽聚糖的生物合成;轉(zhuǎn)糖基反應(yīng)被確認(rèn)為靶反應(yīng)。這個(gè)反應(yīng)的反應(yīng)底物是lipid II,它是形成脂結(jié)合細(xì)胞壁的前體。盡管它同時(shí)也是羊毛硫細(xì)菌素類抗菌肽萬古霉素的作用靶點(diǎn),但這個(gè)反應(yīng)的反應(yīng)位點(diǎn)是與之不同的一個(gè)新的作用位點(diǎn),還沒有運(yùn)用于任何現(xiàn)有的抗菌類藥物中。
研究表明B型羊毛硫細(xì)菌素抗菌肽的麻西那霉素(cinnamycin)類具有抗菌活性,尤其是針對芽孢桿菌,并且描述了麻西那霉素對細(xì)菌膜功能的影響,對三磷酸腺苷依賴的質(zhì)子轉(zhuǎn)運(yùn),鈣離子的攝取以及三磷酸腺苷酶活性的影響。此外,也有報(bào)道說明麻西那霉素能導(dǎo)致含有磷脂酰乙醇胺的細(xì)菌扁平膜產(chǎn)生邊界分明的孔洞。這些效應(yīng)都可以歸因與上述這些B型羊毛硫細(xì)菌素抗菌肽與磷脂酰乙醇胺的特異性結(jié)合。
羊毛硫細(xì)菌素類抗菌肽已應(yīng)用于作為食品添加劑以及對抗痤瘡丙酸桿菌(Propionibacterium acnes)和一些難對付的病原菌如對常用的抗生素產(chǎn)生抗藥性的耐甲氧西林金黃色葡萄球菌(MRSA)以及肺炎鏈球菌(Streptococcus pneumoniae),并表現(xiàn)出了其有效性和實(shí)用性。更詳盡的綜述,可以參閱如下文獻(xiàn)SahI和Bierbaum(1998)Annual Rev.Microbiol.5241-79;Jack和SahI(1995)TIBTECH 13269-278;Gasson(1995)羊毛硫細(xì)菌素s,第十章,在Vining和Stuttard(eds)Biotechnology SeriesGenetics and Biochemistry of Antibiotic Production,Biotechnological I 30Series 28,283-306頁。
在抗生素領(lǐng)域,對新型抗菌化合物總是有著持續(xù)性的需求,以此克服抗藥性,生物兼容性以及毒性等各種問題。同樣,對生產(chǎn)羊毛硫細(xì)菌素類抗菌肽及其變體形式(具有與其天然形式不同的活性特征)也有著相應(yīng)的需求。
阿肽加定是一種已知的B型四環(huán)的羊毛硫細(xì)菌素類抗菌肽,其肽段包含19個(gè)氨基酸(1890Da)。它在體外實(shí)驗(yàn)和體內(nèi)的模式動(dòng)物實(shí)驗(yàn)中,均表現(xiàn)出強(qiáng)大的抑制重要的革蘭氏陽性病原菌如金黃色葡萄球菌(Staphylococcus aureus)和化膿性鏈球菌(Streptococcus pyogenes)活力的能力。阿肽加定的結(jié)構(gòu)如圖4所示。該化合物由一個(gè)前原肽(pre-pro-peptide)生成,此前原肽的C末端部分的多肽序列為SSGWVCTL TIECGTVICAC(序列編號為SEQ ID NO4)。這段多肽(SEQID NO4)通過以下步驟的交聯(lián)反應(yīng)修飾,形成其二級結(jié)構(gòu)和三級結(jié)構(gòu)1-6交聯(lián),形成羊毛硫氨酸(Ser-Cys);7-12交聯(lián),形成β甲基羊毛硫氨酸(Thr-Cys);9-17交聯(lián),形成β甲基羊毛硫氨酸(Thr-Cys);14-19交聯(lián),形成形成β甲基羊毛硫氨酸亞砜(Thr-Cys)。
有報(bào)道表明,阿肽加定可以由游動(dòng)放線菌屬(Actinoplanes)中的兩個(gè)菌種產(chǎn)加爾巴丁游動(dòng)放線菌(A.garbadinensis))和利古里亞游動(dòng)放線菌(A.liguriae)產(chǎn)生。同時(shí)產(chǎn)生的還有一種阿肽加定的類似物,其14-19交聯(lián)沒有被氧化,也就是指它是一個(gè)β甲基羊毛硫氨酸而不是β甲基羊毛硫氨酸亞砜。本文中稱為脫氧阿肽加定(deoxy-actagardine)。
專利US6,022,851中描述了從產(chǎn)加爾巴丁游動(dòng)放線菌和A.liguriae的分離株中提取阿肽加定的方法。


發(fā)明內(nèi)容
本發(fā)明涉及與源于產(chǎn)加爾巴丁游動(dòng)放線菌(Actinoplanes garbadinensis)和利古里亞游動(dòng)放線菌(Actinoplanes liguriae)中的B型羊毛硫細(xì)菌素類抗菌肽阿肽加定相關(guān)的生物合成成簇基因的信息,包括克隆的,測序的,已闡明的結(jié)構(gòu)信息和調(diào)控信息。
本發(fā)明還在利古里亞游動(dòng)放線菌的分離株中驚奇地發(fā)現(xiàn),所述分離株在這里命名為利古里亞游動(dòng)放線菌NCIMB 41362,其產(chǎn)生一種新的形式的阿肽加定,這里命名為阿肽加定B(actagardine B),其非氧化形式命名為脫氧阿肽加定B(deoxy-actagardine B)。這些形式都具有同阿肽加定相似的抗微生物活性,并且都是由序列編號為SEQ ID NO1的起始多肽通過與生成阿肽加定相似的交聯(lián)反應(yīng)步驟生成。這些變體形式可以作為阿肽加定新的有用的替代物。并且,在鑒定阿肽加定B與阿肽加定之間所擁有的不同氨基酸殘基信息之后,可以基于這些不同研發(fā)出更多的羊毛硫細(xì)菌素類抗菌肽。
本發(fā)明也提供了從產(chǎn)生阿肽加定的菌株產(chǎn)加爾巴丁游動(dòng)放線菌和利古里亞游動(dòng)放線菌NCIMB 41362中分別分離出的包含產(chǎn)生阿肽加定和阿肽加定B相關(guān)的基因的成簇基因的信息。
一方面,本發(fā)明提供了一種新的阿肽加定B及其變體形式,包括基于初級多肽序列SEQ ID NO2和SEQ ID NO3的變體形式以及這些變體形式的變體形式。
另一方面,本發(fā)明提供了編碼阿肽加定B及其變體形式的核酸,提供了源于上文中所提到的成簇基因的一系列核酸以及它們的變體形式,提供了生成阿肽加定B及其變體形式的方法,還提供了生成新的阿肽加定B變體形式的方法。



圖1提供了從產(chǎn)加爾巴丁游動(dòng)放線菌中分離出的阿肽加定編碼和調(diào)控成簇基因的圖譜。
圖2提供了從利古里亞游動(dòng)放線菌中分離出的編碼阿肽加定(actagardine)的新變體形式的編碼和調(diào)控成簇基因的圖譜,所述阿肽加定的新變體形式在這里被稱為actagardine B。
圖3提供了利用從產(chǎn)加爾巴丁游動(dòng)放線菌或者利古里亞游動(dòng)放線菌中分離得到的核酸序列產(chǎn)生新的阿肽加定變體形式的方法的示意圖。
圖4是一個(gè)成熟的阿肽加定的一級結(jié)構(gòu)示意圖。其中,X1-X2代表Val-Ile,Y代表-S(O)-,Z表示NH2?!懊撗醢㈦募佣˙(deoxy-actagardineB)”是第15位的Val突變?yōu)長eu,第16位的Ile突變?yōu)閂al,該變體形式的AbuS14和AlaS19之間存在一個(gè)非氧化形式的甲基羊毛硫氨酸橋。
序列說明 為了方便閱讀,本申請中提到的序列用數(shù)字非連續(xù)地編號如下(SEQ ID NO1是阿肽加定B(Actagardine B)多肽的一級結(jié)構(gòu)序列SSGWVCTLTIECGTLVCAC. SEQ ID NO2是阿肽加定B(Actagardine B)變體VV多肽的一級結(jié)構(gòu)序列 SSGWVCTLTIECGTVVCAC. SEQ ID NO3是阿肽加定B(Actagardine B)變體LI多肽的一級結(jié)構(gòu)序列 SSGWVCTLTIECGTLICAC. SEQ ID NO4是阿肽加定多肽(Actagardine)的一級結(jié)構(gòu)序列 SSGWVCTLTIECGTVICAC; SEQ ID NO11是丙氨酰阿肽加定多肽B(Ala-Actagardine B)的一級結(jié)構(gòu)序列 ASSGWVCTLTIECGTLVCAC. SEQ ID NO12是丙氨酰阿肽加定多肽B(Ala-Actagardine B)變體VV的一級結(jié)構(gòu)序列 ASSGWVCTLTIECGTVVCAC. SEQ ID NO13是丙氨酰阿肽加定多肽B(Ala-Actagardine B)變體LI的一級結(jié)構(gòu)序列 ASSGWVCTLTIECGTLICAC. SEQ ID NO14是丙氨酰阿肽加定多肽(Ala-Actagardine)的一級結(jié)構(gòu)序列 ASSGWVCTLTIECGTVICAC. SEQ ID NO212是阿肽加定B的前原肽(pre-pro-Actagardine B)的一級結(jié)構(gòu)序列 MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC. SEQ ID NO22是阿肽加定B的前原肽(pre-pro-Actagardine B)變體VV的一級結(jié)構(gòu)序列 MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC. SEQ ID NO23是阿肽加定B的前原肽(pre-pro-Actagardine B)變體LI的一級結(jié)構(gòu)序列 MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC. SEQ ID NO119是阿肽加定的前原肽(pre-pro-Actagardine)的一級結(jié)構(gòu)序列 MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC. SEQ ID NO100是粘粒CosAG14中源于產(chǎn)加爾巴丁游動(dòng)放線菌且不含載體序列的核酸序列。
SEQ ID NOs101-132分別是SEQ ID NO100中的開放閱讀框orf1-orf32對應(yīng)的多肽序列。
SEQ ID NO200是粘粒CosAL02中源于利古里亞游動(dòng)放線菌且不含載體序列的核酸序列。
SEQ ID NOs201-231分別是SEQ ID NO200中的開放閱讀框orf1-orf31對應(yīng)的多肽序列。
SEQ ID NOs300-312是下文記載的引物序列。
發(fā)明詳述 本發(fā)明涉及SEQ ID NO100和SEQ ID NO200所列成簇基因以及這些成簇基因所編碼的多肽及其變體形式。SEQ ID NO119所列多肽是阿肽加定的前原肽(pre-pro-actagardine),SEQ ID NO212所列多肽是阿肽加定B的前原肽(pre-pro-actagardine B)。其余本發(fā)明涉及的多肽以及它們的變體形式(本文中定義了的)在本文中統(tǒng)稱為“成簇多肽”(clusterpolypeptides)。源于序列SEQ ID NO100的成簇多肽稱為“1XX多肽系列”,相應(yīng)的,源于序列SEQ ID NO200的成簇多肽稱為“2XX多肽系列”。與一個(gè)成簇多肽在序列和長度上都是100%一致的多肽稱為野生型多肽。源于序列SEQ ID NO100和SEQ ID NO200的成簇多肽可以是野生型,也可以是變體形式。
多肽可以是基本分離的形式,本發(fā)明中分離出的多肽就是指那些上文中定義的序列的分離形式,它不含有,或者基本不含有別的天然條件下與之結(jié)合的物質(zhì),如細(xì)菌中的其它多肽。例如,這些多肽天然可以與稀釋劑或者佐劑一起配制,為了實(shí)用的目的又將其分離出來。
同樣本發(fā)明中的多肽可能是一種基本純化的形式,這種情況下,在制備物中有不少于90%,例如95%,98%,甚至99%的多肽是本發(fā)明的多肽。
羊毛硫細(xì)菌素多肽以及Lantibiotic A基因 本發(fā)明中,提及羊毛硫細(xì)菌素A或者LanA多肽時(shí),羊毛硫細(xì)菌素A或者LanA基因,一般是指一種B型的羊毛硫細(xì)菌素類抗菌肽的多肽,以及編碼該多肽的基因。因此,當(dāng)提及上述表述形式時(shí),即指包括如下在內(nèi)的多肽或者基因肉桂霉素(cinnamycin),mersacidin,阿肽加定和阿肽加定B(actagardine B)以及編碼這些多肽的基因。當(dāng)提及一種能產(chǎn)生羊毛硫細(xì)菌素類抗菌肽的宿主細(xì)胞,即是指能夠在天然形式下產(chǎn)生LanA多肽的任意一種宿主細(xì)胞,下文將會(huì)有更加詳細(xì)的定義。
LanA多肽是指一種具有抗菌活性的多肽。抗菌活性可通過測定該多肽抗某種參照微生物如藤黃微球菌(Micrococcus luteus)的MIC值來確定。一種LanA多肽展現(xiàn)出抗菌活性是指其MIC值小于或等于阿肽加定抗同種參照微生物菌株的MIC值的16倍。在本發(fā)明中,菌株產(chǎn)加爾巴丁游動(dòng)放線菌中的LanA基因記為actA,同時(shí)利古里亞游動(dòng)放線菌中的LanA基因記為LigA。
其他類型的Lan多肽 本文中如提及“LanM”多肽,是指源于羊毛硫細(xì)菌素類抗菌肽成簇基因的一種多肽,其是一種在前體多肽轉(zhuǎn)換為具有羊毛硫細(xì)菌素類抗菌肽性質(zhì)化合物的過程中所必需的修飾因子。LanM多肽包括SEQ IDNO120(ActM)及其變體形式,SEQ ID NO213(LigM)及其變體形式。專利WO02/088367中定義的多肽cinM,Altena等人2000年報(bào)道的多肽mrsM,以及與能夠產(chǎn)生B型羊毛硫細(xì)菌素類抗菌肽的細(xì)菌成簇基因同源的多肽。
本文中如提及“LanR”多肽,是指源于Lantibiotic類抗菌肽成簇基因的一種多肽,其是一種在前體多肽的合成調(diào)控過程中必需的調(diào)控因子。LanR多肽包括SEQ ID NO122(ActR)及其變體形式,SEQ ID NO216(LigR)及其變體形式,專利WO02/088367中定義的多肽cinR1,Altena等人2000年報(bào)道的多肽mrsR1,以及與能夠產(chǎn)生B型羊毛硫細(xì)菌素類抗菌肽的細(xì)菌成簇基因同源的多肽。
本文中如提及“LanT”多肽,是指源于羊毛硫細(xì)菌素類抗菌肽成簇基因的一種多肽,其是一種在生成羊毛硫細(xì)菌素類化合物的前體多肽的過程中必需的轉(zhuǎn)運(yùn)因子。LanT多肽包括SEQ ID NO123(ActT)及其變體形式,SEQ ID NO214(LigT)及其變體形式,專利WO02/088367中定義的多肽cinT,Altena等人2000年報(bào)道的多肽mrsT,以及與能夠產(chǎn)生B型羊毛硫細(xì)菌素類抗菌肽的細(xì)菌成簇基因同源的多肽。
本文中如提及“LanO”多肽,是指源于羊毛硫細(xì)菌素類抗菌肽成簇基因的一種多肽,它被認(rèn)為參與了一個(gè)氧化反應(yīng)使脫氧形式的阿肽加定被氧化成為阿肽加定或者使本發(fā)明的化合物中的Y被氧化成-S(O)-。
LanO多肽包括SEQ ID NO122(ActO)及其變體形式,SEQ IDNO215(LigO)及其變體形式,以及與能夠產(chǎn)生B型羊毛硫細(xì)菌素類抗菌肽的細(xì)菌成簇基因同源的多肽。
成簇多肽 一方面,本發(fā)明提供了下述成簇多肽的分離形式,他們的序列編號如下SEQ ID NO101,102,103,104,105,106,107,108,109,110,111,112,113,114,115,116,117,118,120,121,122,123,124,125,126,127,128,129,130,131,132,201,202,203,204,205,206,207,208,209,210,211,213,214,215,216,217,218,219,220,221,222,223,224,225,226,227,228,229,230和231。另一方面,本發(fā)明還提供了一種成簇多肽,它是上述任一序列的變體形式。
成簇多肽中值得特別關(guān)注的多肽包括屬于1XX多肽系列和2XX多肽系列的LanM,LanR,LanT或者LanO類型的多肽。
與一個(gè)成簇多肽相關(guān)的變體是指其多肽的氨基酸序列與參照多肽的氨基酸序列(這里指所有野生型的成簇多肽)相比,表現(xiàn)出顯著的氨基酸序列同一性,但又不完全相同的多肽及其片段。
除非特別指出,優(yōu)選的顯著的氨基酸序列同一性是指至少80%同一性,更優(yōu)選的為85%,90%或者95%,更加優(yōu)選的為98%或者99%。變體的長度最好與野生型成簇多肽相同,至少具有其70%的長度,優(yōu)選地為至少80%,更優(yōu)選的為至少90%,更優(yōu)選的為至少具有其95%的長度。
“氨基酸序列同一性百分?jǐn)?shù)(%)”是指在如有必要的情況下,在對準(zhǔn)序列和引入空位后,且不考慮保守替換作為序列同一性的一部分情況下,一個(gè)候選序列與其所比較的序列在達(dá)到了最大的序列同一性時(shí),它們在序列上一致的氨基酸所占的百分?jǐn)?shù)。本文中所用到的氨基酸序列同一性百分?jǐn)?shù)的值是由軟件BLAST-2生成,該軟件由Altschul等人與1996年發(fā)布,可以在網(wǎng)址http://blast.wustl/edu/blast/README.html獲得其信息。WU-BLAST-2軟件在使用時(shí)所用到的參數(shù)大部分被設(shè)為默認(rèn)值,可調(diào)整的參數(shù)使用了如下的設(shè)置overlap span=1,overlap fraction=0.125,wordthreshold(T)=11。參數(shù)HSPS和HSPS2是由程序自身根據(jù)特定序列的組成和針對被搜索的目標(biāo)序列的特定數(shù)據(jù)庫的組成所生成的一個(gè)動(dòng)態(tài)參數(shù),但其可以被調(diào)整用于增加程序的敏感度。氨基酸序列同一性百分比的數(shù)值A(chǔ)%是用比對后一致的殘基數(shù)目除以比對區(qū)域中“較長”序列的總氨基酸殘基數(shù)乘以100后得到的數(shù)值。“較長”序列是指在對準(zhǔn)區(qū)域中含有實(shí)際殘基數(shù)最多的序列(WU BLAST-2程序?yàn)榱耸箤?zhǔn)分?jǐn)?shù)最大化而引入的空缺在這里忽略不計(jì))。
一般來說可取的,變體形式將保留其對應(yīng)多肽的生物學(xué)功能。在本發(fā)明中,變體形式具有生物學(xué)功能是指該變體同其成簇基因的其他成員共同存在于宿主細(xì)胞中的時(shí)候,宿主細(xì)胞具有產(chǎn)生羊毛硫細(xì)菌素類抗菌肽的能力。這個(gè)可以通過如下方式驗(yàn)證,例如,如果要驗(yàn)證是1XX多肽系列的成簇多肽的一個(gè)變體形式,則使用含有SEQ ID NO100序列的宿主細(xì)胞,或者對于2XX多肽系列的成簇多肽的一個(gè)變體形式則使用含有SEQ IDNO200序列的宿主細(xì)胞,將核苷酸序列修飾為編碼其對應(yīng)變體形式多肽的核苷酸序列,此時(shí)如果宿主細(xì)胞仍然能夠產(chǎn)生相應(yīng)檢測的羊毛硫細(xì)菌素類抗菌肽多肽是否依然產(chǎn)生。
前體多肽 另一方面,本發(fā)明提供了一種多肽,優(yōu)選分離形式的多肽,所述多肽是生成本發(fā)明化合物或者阿肽加定的前體。前體多肽包括下述多肽SEQID NOs1-4,SEQ ID NOs11-14,SEQ ID NOs212,22,23和119,同時(shí)還包括這些序列的能轉(zhuǎn)化成為羊毛硫細(xì)菌素類抗菌肽多肽的變體形式和衍生物形式。
序列編號為SEQ ID NOs1-4中的任意一個(gè)前體多肽的變體形式是指其序列中的一個(gè)或多個(gè),例如1-5個(gè),比如1,2,3或4個(gè),氨基酸殘基被其他氨基酸殘基所替換的多肽。優(yōu)選SEQ ID NOs1-4中任意一個(gè)序列的前體多肽如下位置的氨基酸殘基被替換掉2,3,4,5,8,10,11,13或18。
序列編號為SEQ ID NOs11-14中的任意一個(gè)前體多肽的變體形式是指其序列中的一個(gè)或多個(gè),例如1-5個(gè),比如1,2,3或4個(gè),氨基酸殘基被其他氨基酸殘基所替換的多肽。優(yōu)選SEQ ID NOs11-14中任意一個(gè)序列的前體多肽如下位置的氨基酸殘基被替換掉3,4,5,6,9,11,12,14或19。
序列編號為SEQ ID NOs212,22,23和119中的任意一個(gè)前體多肽的變體形式是指其與序列SEQ ID NOs1-4分別對應(yīng)的C末端區(qū)域(46-64位氨基酸殘基)序列中的一個(gè)或多個(gè),例如1-5個(gè),比如1,2,3或4個(gè),氨基酸殘基被其他的氨基酸殘基所替換掉的多肽。優(yōu)選該前體多肽的變體形式中對應(yīng)于SEQ ID NOs1-4中的任意一個(gè)序列的如下位置的氨基酸殘基被替換掉2,3,4,5,8,10,11,13,18。這種變體也許還會(huì)進(jìn)一步包括N末端的變化,這種變化至少要保留70%,例如至少80%,優(yōu)選的為至少90%,例如至少95%的N末端區(qū)域(1-45位殘基)。例如,SEQ IDNO212或者SEQ ID NO119N末端的變體形式可能包含了一個(gè)或者多個(gè)替換(例如,1-12個(gè),比如1-5個(gè),又如1,2或3個(gè)替換發(fā)生于如下位置4,5,6,8,9,12,13,17,18,19,21和32,我們所示的數(shù)據(jù)是在SEQ ID NO212和SEQ ID NO119之間變化)。
替換可以是一種氨基酸被另一種天然存在的氨基酸所替代,它可以是保守替換也可以是非保守替換。保守替換包含下表所列的情況,表中氨基酸位于第二列的同一個(gè)區(qū)間,,且優(yōu)選它們在第三列的同一行中可以被彼此取代
對SEQ ID NO212而言,替換的氨基酸可以是與SEQ ID NO119相對應(yīng)位置的氨基酸殘基不相同的,反之亦然。無論出現(xiàn)哪種情況,SEQ IDNO119中的氨基酸發(fā)生替換后,都將使其轉(zhuǎn)變成了SEQ ID NO212的氨基酸序列,反之亦然。(例如,SEQ ID NO212的第4位Ile被Leu取代,等等)。
前體多肽也可以在一個(gè)不表達(dá)羊毛硫細(xì)菌素類抗菌肽的細(xì)菌中通過表達(dá)編碼其多肽的核酸來獲得。
化合物 一方面,本發(fā)明提供了一種如下通式的化合物
其中 -X1-X2-代表-Leu-Val-,-Val-Val-或者-Leu-Ile-; Y代表-S-或者-S(O)-;和 Z代表H2N-或者Ala-, 或其藥學(xué)上可接受的鹽。另一方面,本發(fā)明提供了一些來源于這些化合物的變體形式以及具有生物學(xué)活性的衍生物。
如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S(O)-并且Z是NH2,本發(fā)明的該化合物也稱為阿肽加定B(actagardine B)。
如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S(O)-并且Z是Ala-,本發(fā)明的該化合物也稱為丙氨酰阿肽加定B(ala-actagardine B)。
如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S-并且Z是NH2,本發(fā)明的該化合物也稱為脫氧阿肽加定B(deoxy-actagardine B)。
如果-X1-X2-表示的是-Leu-Val-,Y表示的是-S-并且Z是Ala-,本發(fā)明的該化合物也稱為丙氨酰脫氧阿肽加定B(ala-deoxy-actagardine B)。
當(dāng)Z表示H2N-基團(tuán)的時(shí)候,是指上述化合物1位丙氨酸殘基的N末端的NH2基團(tuán)。相應(yīng)的,當(dāng)Z所表示的基團(tuán)是Ala-的時(shí)候,是指一個(gè)丙氨酸殘基,按照本領(lǐng)域慣例應(yīng)該表示成Ala(0),它通過酰胺鍵與1位的丙氨酸相連。
變體形式 上述通式(I)所示的化合物的變體形式是指化合物中的1個(gè)或者多個(gè)如1-5個(gè),比如1,2,3或者4個(gè),氨基酸殘基被替換成了其他的氨基酸殘基。優(yōu)選替換如下位置的氨基酸殘基通式(I)中的2,3,4,5,8,10,11,13或18位。
變體形式也可以包括15位或者16位的替換,如果15位和16位都發(fā)生了替換,并且其他位置的氨基酸并沒有發(fā)生替換,則15位和16位分別不是Val和Ile。
當(dāng)Z基團(tuán)代表的是Ala-的時(shí)候,本發(fā)明化合物的變體包括該Ala-被其他氨基酸(特別是由遺傳密碼編碼的天然氨基酸,或者其D型異構(gòu)體)替換了的形式,更特別指被如下氨基酸基團(tuán)所替換Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu,Arg-,Ser-以及Trp-。一方面,如果變體形式發(fā)生替換的氨基酸是從Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu,Arg-,Ser-這些基團(tuán)中選出的話,這樣的變體形式可以用專利US 6,022,815中所提到的向Z=H2N的化合物中添加化學(xué)加成上述氨基酸殘基的化學(xué)方法合成。要注意的是,采用化學(xué)加入加成的方法可以使允許氨基酸處于L構(gòu)型或D構(gòu)型。其包含了D-Ala,以及上述提到的各種氨基酸的D型異構(gòu)體。
衍生物 本發(fā)明提供的化合物(包括其變體)的衍生物是指它的一個(gè)或者多個(gè)氨基酸側(cè)鏈被修飾過了的產(chǎn)物,例如被酯化,酰胺化或者氧化的產(chǎn)物。
本發(fā)明提供的化合物的衍生物可以是阿肽加定中一個(gè)羧基官能團(tuán)的單酰胺衍生物,特別是在C末端。更確切的說,這種衍生物可以是本發(fā)明化合物的C末端為-COR的形式,其中R表示基團(tuán)-NR1R2,而R1和R2獨(dú)立地代表 (i)氫原子; (ii)通式為-(CH2)n-NR3R4的基團(tuán),其中n代表從2到8的整數(shù),并且R3和R4獨(dú)立地代表氫原子或(C1-C4)烷基,或者R3和R4合起來代表-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或-(CH2)5-基團(tuán);或者R1和R2與鄰近的氮原子合起來代表一個(gè)4位被如下取代物所取代的哌嗪 (a)(C1-C4)烷基; (b)(C5-C7)-環(huán)烷基, (c)吡啶基, (d)-(CH2)p-NR5R6,其中p代表一個(gè)從1到8的整數(shù),并且R5和R6獨(dú)立地代表氫原子或(C1-C4)烷基; (e)哌啶基; (f)被取代的哌啶基,所述被取代的哌啶基有一個(gè)(C1-C4)烷基的N-取代基。
(g)芐基;和 (h)被取代的芐基,其苯環(huán)部分帶有1個(gè)或者2個(gè)取代基,所述取代基選自氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。
在一個(gè)實(shí)施例中,通式-COR中的R代表基團(tuán)-NR1R2,其中R1和R2獨(dú)立地代表氫原子和一個(gè)通式為-(CH2)n-NR3R4的基團(tuán),其中n表示2到8的整數(shù),R3和R4獨(dú)立地代表氫原子或(C1-C4)烷基或者R3和R4合起來代表基團(tuán)-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或者-(CH2)5-,或者R1和R2和鄰近的氮原子合起來代表了一個(gè)4位被如下取代基所取代的哌嗪(C1-C4)烷基,(C5-C7)-環(huán)烷基,吡啶基,芐基,以及被取代的芐基,所述被取代的芐基的苯環(huán)部分帶有1個(gè)或者2個(gè)取代基,取代基可以是氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。
另外,衍生物可以包括內(nèi)部殘基的側(cè)鏈羧基官能團(tuán)-COOH被修飾為-COOR5的化合物,所述內(nèi)部殘基例如是Glu,其中R5代表氫原子,(C1-C4)烷基或者(C1-C4)烷氧基以及(C2-C4)烷基。
本發(fā)明化合物的N末端衍生物是N末端的氨基-NH2被取代為-NHR6基團(tuán),其中R6代表(C1-C4)烷基。
“(C1-C4)烷基”是指含有1到4個(gè)碳原子的直鏈或者支鏈烷基鏈,例如甲基,乙基,丙基,1-甲基乙基,丁基,1-甲基丙基或1,1-二甲基乙基?!?C2-C4)烷基”是指含有2-4個(gè)碳原子的直鏈或者支鏈烷基鏈,例如乙基,丙基,1-甲基乙基,丁基,1-甲基丙基,1,1-二甲基乙基?!?C5-C7)環(huán)烷基”是指選自環(huán)戊烷基,環(huán)己基或環(huán)庚烷基中的一個(gè)環(huán)烷基基團(tuán)。
“(C1-C4)烷氧基”所表示的意思是指含有1-4個(gè)碳原子的直鏈或者支鏈烷氧基鏈,例如甲氧基,乙氧基,丙氧基,1-甲基乙氧基,丁氧基,1-甲基丙氧基和1,1-二甲基乙氧基。
本發(fā)明中的衍生物可以參照專利EP-0195359中所描述的生產(chǎn)阿肽加定衍生物的方法得到,其內(nèi)容作為參考文件列入此處。
進(jìn)一步的實(shí)施方案 衍生物的C末端通式是-COR,其中R代表基團(tuán)-NR1R2,一些實(shí)施例中,R1代表氫原子,R2代表了一個(gè)通式為-(CH2)n-NR3R4的基團(tuán),其中n表示2到8之間的整數(shù),R3和R4獨(dú)立地代表了氫原子或者(C1-C4)烷基或者R3與R4合起來代表了如下基團(tuán)-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或者-(CH2)5-。在這些實(shí)施例中,R3和R4優(yōu)選地代表氫原子或者(C1-C4)烷基。更優(yōu)選地代表(C1-C2)烷基,如甲基。整數(shù)n優(yōu)選地在2-5之間,更優(yōu)選地在2-4之間,例如3。
在另一個(gè)實(shí)施方案中,R1和R2和鄰近的氮原子一起代表了一個(gè)哌嗪。,優(yōu)選地4位N-取代基選自如下基團(tuán) (a)(C1-C4)烷基; (b)(C5-C7)-環(huán)烷基, (d)-(CH2)p-NR5R6,其中p代表一個(gè)從1到8的整數(shù),R5和R6獨(dú)立地代表氫原子或者(C1-C4)烷基; (e)哌啶基;和 (f)被取代的哌啶基,所述被取代的哌啶基有一個(gè)(C1-C4)烷基的N-取代基。
其中氮原子優(yōu)選地位于哌啶基和被取代的哌啶基的4位上。
該N-取代基更優(yōu)選地選自如下基團(tuán) (d)-(CH2)p-NR5R6,其中p代表一個(gè)從1到8的整數(shù),并且R5和R6獨(dú)立地代表氫原子或(C1-C4)烷基;和 (f)被取代的哌啶基,所述被取代的哌啶基有一個(gè)(C1-C4)烷基的N-取代基。
如果N-取代基是-(CH2)p-NR5R6,那么R5和R6優(yōu)選地為(C1-C4)烷基,更優(yōu)選地為(C1-C2)烷基,例如甲基。p優(yōu)選地為1到4之間的整數(shù),例如3。
如果N取代基是被取代的哌啶基,那么N-取代優(yōu)選地為(C1-C2)烷基,如甲基。如上所述,氮原子優(yōu)選地位于4位。
核酸 本發(fā)明中的核酸,可以是指DNA,也可以是指RNA,一般是指DNA。本發(fā)明中的核酸序列可以是單鏈的,也可以是雙鏈的。一方面,本發(fā)明提供了一種分離形式的編碼了成簇多肽的核酸。另一方面,本發(fā)明也提供了一種分離形式的編碼前體多肽或其變體形式或其部份片段的核酸。
另一方面,本發(fā)明提供了一種分離形式的核酸,所述核酸可以包括序列SEQ ID NO100或者SEQ ID NO200的完整序列或其一部分片段,也包括本發(fā)明中公開的含有基因間隔區(qū)的片段。這樣的基因間隔區(qū)可以包含有調(diào)控本發(fā)明中的成簇多肽或者多肽前體表達(dá)的啟動(dòng)子元件和其他類型的調(diào)控元件。
對于本領(lǐng)域技術(shù)人員來說,25個(gè)堿基的核苷酸是其數(shù)量足以確定其是否特異于本文中所公開的某個(gè)特定的基因或成簇基因或其亞序列。因此,包括序列SEQ ID NO100或SEQ ID NO200,以及與其序列具有顯著同一性的變體形式在內(nèi)的這些片段,在長度上至少要大于25個(gè)堿基,例如,其核苷酸長度至少大于30,或者至少大于50,或者至少大于100,或者至少大于250。
本發(fā)明同時(shí)也包括基因間序列的變體形式的啟動(dòng)子元件,優(yōu)選地實(shí)施例中,啟動(dòng)子元件是基因間序列(或其一部分)的某特定序列。在所有的情況下,優(yōu)選地實(shí)施例中提到的開放閱讀框,基因,核酸,多肽或者啟動(dòng)子都是指某一特定序列,從廣義上來講,本發(fā)明還提供了含有特定序列的變體形式的實(shí)施例。
這里所用到的有關(guān)特定核酸的“變體形式”是指與參照核苷酸序列有所不同的并滿足如下條件的任一核酸序列與參照序列相比,或者與參照序列的互補(bǔ)序列相比,或者與參照序列的一個(gè)片段相比,或者與該片段的互補(bǔ)序列相比,可以與之互補(bǔ)的序列,或者在序列上表現(xiàn)出高度的同一性的序列,或者在嚴(yán)格的反應(yīng)條件下可以與之互補(bǔ)的序列。也可以指編碼與參照核酸序列表達(dá)的氨基酸序列高度一致的氨基酸序列的核酸序列,或者該核苷序列的一個(gè)片段?!白凅w形式”還可以指那些僅僅是彼此的遺傳密碼簡并性不同,而編碼出相同的氨基酸序列的不相同的核酸。本發(fā)明中所提到的核酸的變體形式更進(jìn)一步具有如下特性將本發(fā)明中的核酸變體形式導(dǎo)入到本發(fā)明鑒定的成簇基因中,使相應(yīng)的部分序列發(fā)生了改變,再將這個(gè)重組的片段轉(zhuǎn)入到一個(gè)合適的宿主細(xì)胞中在適合生產(chǎn)羊毛硫細(xì)菌素類抗菌肽的條件下培養(yǎng)(例如本文的實(shí)施例中的情況),最后生產(chǎn)出的分子能夠具有一種或者多種羊毛硫細(xì)菌素類抗菌肽的活性(特別是抗菌的活性)。優(yōu)選將生產(chǎn)調(diào)整到高細(xì)胞密度下進(jìn)行。
顯著的核酸序列同一性優(yōu)選地為至少50%一致,更優(yōu)選地為60%,70%,80%,90%,,更優(yōu)選地為95%,98%或者99%。在核苷酸變體形式(或其一部分)與比較片段比對核酸序列是否具有顯著同一性的時(shí)候,該比較片段優(yōu)選地為至少具有參照片段中的30個(gè)堿基序列,更優(yōu)選地是該片段具有參照片段中的60個(gè)堿基,90個(gè)堿基或者120個(gè)堿基,更優(yōu)選地為具有參照片段中的180個(gè)堿基,240個(gè)堿基或者300個(gè)堿基序列。最優(yōu)選地情況是使用整個(gè)參照片段與其比對。
“核酸序列同一性百分?jǐn)?shù)”定義為候選序列與比對序列一致的堿基數(shù)目所占的百分比。本文中用到的這個(gè)值是由軟件WU BLAST-2中的BLASTN模塊計(jì)算得到,除了overlap span和overlap fraction這兩個(gè)參數(shù)的值分別設(shè)為1和0.125以外,其他的參數(shù)均采用默認(rèn)值。
本發(fā)明中所涉及的啟動(dòng)子變體形式的核酸序列的同一性的評估優(yōu)選地需要超過30個(gè)殘基的序列,更優(yōu)選地需要40個(gè)堿基或者50個(gè)堿基,更優(yōu)選地需要60個(gè)堿基。
“嚴(yán)格條件”或者“高嚴(yán)格條件”根據(jù)如下條件定義(1)使用低離子強(qiáng)度和高溫洗脫,例如0.015M的氯化鈉/0.0015M的檸檬酸鈉/0.1%的十二烷基硫酸鈉(SDS),50℃;(2)在雜交的過程中使用變性劑,例如使用甲酰胺,如50%(v/v)甲酰胺和0.1%的牛血清白蛋白/0.1%的Ficoll/0.1%的聚乙烯吡咯烷酮/pH6.5的50mM磷酸鈉緩沖液和750mM的氯化鈉,75mM的42℃的檸檬酸鈉;或者(3)使用50%甲酰胺,5×SSC(0.75M的氯化鈉,0.075M的檸檬酸鈉),50mM的磷酸鈉(pH6.8),0.1%的焦磷酸鈉,5×Denhardt溶液,超聲處理的鮭魚精DNA(50g/ml),0.1%的SDS,以及42℃的10%的硫酸葡聚糖于,并于42℃的0.2×SSC(氯化鈉/檸檬酸鈉)洗脫,再在55℃的50%甲酰胺中洗脫,最后使用含有EDTA的0.1×SSC組成的洗液在55℃下進(jìn)行高嚴(yán)謹(jǐn)度洗脫。
當(dāng)一個(gè)目的核酸序列被稱作與啟動(dòng)子或者調(diào)控序列“調(diào)控相聯(lián)”的時(shí)候,是指這個(gè)啟動(dòng)子或者調(diào)控序列在一個(gè)適宜的表達(dá)系統(tǒng)中可以指導(dǎo)這個(gè)核酸序列的轉(zhuǎn)錄,并且使該核酸序列可以在正確的閱讀框中進(jìn)行翻譯。優(yōu)選地是指當(dāng)一個(gè)核酸與啟動(dòng)子或者調(diào)控序列調(diào)控相聯(lián)的時(shí)候,該核酸的轉(zhuǎn)錄本還包含了一個(gè)適合核糖體結(jié)合的位點(diǎn),這樣可以在一個(gè)適宜的表達(dá)系統(tǒng)中表達(dá)出該核酸序列所編碼的多肽。其實(shí)例可查閱Sambrook等人1989年的工作以及Ausubel等人1995年的工作。
當(dāng)一個(gè)核酸被稱為分離的核酸的時(shí)候,是指該序列已經(jīng)從正常存在于菌株產(chǎn)加爾巴丁游動(dòng)放線菌和/或者利古里亞游動(dòng)放線菌的一些或者所有其他的核酸序列中完全的或者基本地分離出來。這里特別是指核酸序列從那些不屬于本發(fā)明的成簇基因片段的序列混合物中分離出來。
根據(jù)上文所提到的內(nèi)容,本發(fā)明提供了編碼阿肽加定或者阿肽加定B(actagardine B)的生物合成成簇基因的核酸序列或者一組核酸序列。相應(yīng)的,整個(gè)成簇基因或其具有至少25個(gè)連續(xù)核苷酸的一部分的用途十分廣泛,其包括但不限于表達(dá)阿肽加定或者阿肽加定B(actagardine B);將其作為探針在其他的物種中篩選相關(guān)的分子;用其誘導(dǎo)基因沉默等類似用途。
表達(dá)構(gòu)件 本發(fā)明的另一方面是提供了一個(gè)表達(dá)構(gòu)件,它包含一個(gè)可以編碼本發(fā)明中的成簇多肽或者羊毛硫細(xì)菌素類抗菌肽的核酸,并且可操作的連接在一個(gè)啟動(dòng)子后。
另一方面,本發(fā)明提供了一組表達(dá)構(gòu)件。一組表達(dá)構(gòu)件包括本發(fā)明中提到的兩個(gè)或者更多的多肽編碼序列,以及至少一個(gè)適合上述序列表達(dá)的啟動(dòng)子。所述啟動(dòng)子(多個(gè)啟動(dòng)子)可以是這些多肽基因天然連接的啟動(dòng)子(或者就一個(gè)變體來說,該基因的啟動(dòng)子就是該變體的來源的啟動(dòng)子),或者可以是一個(gè)構(gòu)成性的或者可誘導(dǎo)的并且在宿主細(xì)胞中正常行使功能的啟動(dòng)子。這樣的啟動(dòng)子包括那些位于表1和表2中所列開放讀碼框上游的序列SEQ ID NO100或序列SEQ ID NO200的基因間隔區(qū)。啟動(dòng)子可操作的連接在表達(dá)構(gòu)件的核酸上。這里所提到的通過“可操作的連接”是指該啟動(dòng)子在一個(gè)適宜的表達(dá)系統(tǒng)中可以指導(dǎo)目的核酸序列的轉(zhuǎn)錄,并且使該核酸序列可以在正確的閱讀框中進(jìn)行翻譯。優(yōu)選地情況是,當(dāng)一個(gè)目的核酸與啟動(dòng)子或者調(diào)控序列調(diào)控相聯(lián)的時(shí)候該核酸序列的轉(zhuǎn)錄本還包含了一個(gè)適合核糖體結(jié)合的位點(diǎn),這樣可以在一個(gè)適宜的表達(dá)系統(tǒng)中表達(dá)出該核酸序列所編碼的多肽。其實(shí)例可查閱Sambrook等人1989年的工作,Ausubel等人2002年的工作以及Kieser 2000年的工作。
本發(fā)明中所提及的以組為單位的表達(dá)構(gòu)件包含了編碼上文中定義的前體多肽和成簇多肽的基因的多種排列。在本發(fā)明的許多方面,一組表達(dá)構(gòu)件中至少包含一個(gè)LanA基因。這樣的組的例子可參照下文中的“Set 1”至“Set 7”,其作為說明,組構(gòu)件的形式并不局限于此。
Set 1一個(gè)編碼前體多肽的LanA基因,優(yōu)選地為編碼可以轉(zhuǎn)化成為本發(fā)明的化合物的前體多肽基因,加上一個(gè)編碼LanM多肽的LanM基因。該LanM多肽優(yōu)選地為序列SEQ ID NO120或其變體,或者SEQ ID NO213或其變體。
Set2一個(gè)編碼前體多肽的LanA基因,優(yōu)選地為編碼可以轉(zhuǎn)化成為本發(fā)明的化合物的前體多肽的基因,加上一個(gè)編碼LanR多肽的LanR基因,該LanR多肽優(yōu)選地為序列SEQ ID NO122或其變體,或者SEQ ID NO216或其變體。
Set3一個(gè)編碼前體多肽的LanA基因,優(yōu)選地為編碼可以轉(zhuǎn)化成為本發(fā)明的化合物的前體多肽的基因,加上一個(gè)編碼LanM多肽的LanM基因,加上一個(gè)編碼LanR多肽的LanR基因。該LanM多肽優(yōu)選地為序列SEQ ID NO120或其變體,或者SEQ ID NO213或其變體。該LanR多肽優(yōu)選為序列SEQ ID NO122或其變體,或者SEQ ID NO216或其變體。
Set4第三組的所有基因再加上一個(gè)編碼LanO多肽的LanO基因。該LanO多肽優(yōu)選為序列SEQ ID NO122或其變體,或者SEQ ID NO215或其變體。
Set5第三組或者第四組的所有基因再加上一個(gè)編碼LanT多肽的LanT基因。該LanT多肽優(yōu)選為序列SEQ ID NO123或其變體,或者SEQID NO214或其變體。
Set6序列SEQ ID NOs116至127或它們變體的基因。
Set7序列SEQ ID NOs206至220或它們變體的基因。
一方面來說,一組表達(dá)構(gòu)件包含的序列都是編碼1XX多肽系列的多肽的序列或者都是編碼2XX多肽系列的多肽的序列。但是本發(fā)明并不排除那些同時(shí)包含了2種系列多肽的表達(dá)構(gòu)件。
重組表達(dá)載體 一方面,本發(fā)明提供了一種重組載體其包含了本發(fā)明中的一個(gè)或者多個(gè)表達(dá)構(gòu)件。另一方面,本發(fā)明提供了一組重組載體,其包含了本發(fā)明中的一組表達(dá)構(gòu)件。選取和構(gòu)建適宜的導(dǎo)入核酸序列至細(xì)菌中的載體的條件包含如下方面如有需要,可以有附加的合適的調(diào)控元件,包括附加的啟動(dòng)子,終止子片段,增強(qiáng)子元件,標(biāo)記基因以及其他合適的元件。載體可以視情況選擇質(zhì)粒,病毒,如噬菌體,或者噬菌粒。更詳細(xì)的實(shí)例信息,可以查閱Sambrook等人編寫的分子克隆,實(shí)驗(yàn)室操作手冊第二版1989年出版,冷泉港的冷泉港實(shí)驗(yàn)室出版社出版。該書介紹了很多現(xiàn)有的技術(shù)和核酸操作方法如核酸構(gòu)件的準(zhǔn)備,突變,測序。而將DNA導(dǎo)入細(xì)菌種,以及基因表達(dá),和蛋白質(zhì)的分析方法,這些實(shí)驗(yàn)方法可以查閱1995年Ausubel等人的Current Protocols in Molecular Biology一書,由WileyInterscience Publishers出版社出版。在鏈霉菌(Streptomyces spp)中使用這些技術(shù)的很多內(nèi)容都在1985年Hopwood等人的Genetic manipulation ofStreptomyces a aboratory manual(NorwichJohn Innes)一書中有詳細(xì)記載,以及Kieser T.等人所著Practical Streptomyces Genetics(2000),(The johninnes foundation)第386頁。還有Sambrook等人,Ausubel等人,Hopwood等人以及Kieser等人的工作成果均作為參考文獻(xiàn)列入此處,以作為參考。
表達(dá)盒 另一方面,發(fā)明人開發(fā)出了一種有效的生產(chǎn)和篩選阿肽加定B(actagardine B)的抗菌肽類衍生物的載體系統(tǒng)。這是通過導(dǎo)入一個(gè)或者多個(gè)限制性內(nèi)切酶識別位點(diǎn)至編碼SEQ ID NO1,11或者212多肽的LanA基因序列中從而構(gòu)建出一個(gè)表達(dá)盒系統(tǒng)來實(shí)現(xiàn)的。因此,從另一方面來講,本發(fā)明提供了一個(gè)重組DNA表達(dá)盒,它包含了編碼阿肽加定B(actagardineB)前體多肽的核酸序列,其中所述序列包含 位于或者鄰近編碼序列N末端的第一限制性內(nèi)切酶位點(diǎn); 位于第一限制性內(nèi)切酶位點(diǎn)下游且位于編碼序列之中的任意的第二限制性內(nèi)切酶位點(diǎn); 位于或者鄰近鄰近編碼序列C末端編碼區(qū)的第三限制性酶切位點(diǎn)。
其中至少有一個(gè)所述的限制性酶切位點(diǎn)沒有出現(xiàn)在編碼序列為SEQID NO200的LanA編碼序列中。
另一方面,本發(fā)明還提供了一個(gè)重組DNA盒,它包含了編碼阿肽加定前體多肽的核苷酸序列,所述核苷酸序列包含 位于或者鄰近編碼序列N末端的第一限制性內(nèi)切酶位點(diǎn); 位于第一限制性內(nèi)切酶位點(diǎn)的下游且位于編碼序列之中的任意的第二限制性內(nèi)切酶位點(diǎn); 位于或者鄰近鄰近編碼序列C末端編碼區(qū)的第三限制性酶切位點(diǎn)。
其中至少一個(gè)所述的限制性酶切位點(diǎn)沒有出現(xiàn)在編碼序列為SEQ IDNO100的LanA編碼序列中。
一般來說,所有這2個(gè)或者3個(gè)酶切位點(diǎn)都各不相同,最好是當(dāng)這個(gè)表達(dá)盒被整合進(jìn)入一個(gè)載體后,這些酶切位點(diǎn)在該載體中也應(yīng)當(dāng)是唯一的。
在一個(gè)優(yōu)選的方面中,非天然存在的限制性內(nèi)切酶位點(diǎn)是第二酶切位點(diǎn),其位于編碼多肽SEQ ID NO1或SEQ ID NO4的序列的第5個(gè)和第16個(gè)密碼子之間,例如在第6個(gè)密碼子至第15個(gè)密碼子之間。
所述表達(dá)盒最好能包括一個(gè)LanA基因的引導(dǎo)序列和LanA基因的啟動(dòng)子,并包括一個(gè)或者多個(gè)成簇基因,特別是當(dāng)所述成簇基因?yàn)樗拗骷?xì)胞互補(bǔ)其缺失的基因所必需的時(shí)候。
本發(fā)明所描述的表達(dá)盒可以用多種方法改造。例如,通過切割位于第一和第二,第一和第三,或者第二和第三限制酶切位點(diǎn)之間的表達(dá)盒而獲得的片段,該片段可以使用編碼某個(gè)羊毛硫細(xì)菌素類抗菌肽或其變體的變體編碼序列替換。因此本發(fā)明也提供了這種表達(dá)盒的變體形式,其中所述變體形式在編碼序列的編碼區(qū)中有1-15個(gè)核苷酸發(fā)生替換。
作為生成這種變體的中間產(chǎn)物,其第一和第二限制酶切位點(diǎn)之間,第一和第三限制酶切位點(diǎn)之間,第二和第三限制酶切位點(diǎn)之間,可以被大填充片段所替換。
另一方面,編碼羊毛硫細(xì)菌素類抗菌肽衍生物的表達(dá)盒可以轉(zhuǎn)化宿主細(xì)胞去表達(dá)出這些衍生物,例如可以用這種方法評估該衍生物抗菌的特性。
一方面,可以構(gòu)建多個(gè)表達(dá)盒從而提供一個(gè)含有不同衍生物的庫,所述庫可以用于篩選其中有活性的衍生物。
本發(fā)明的表達(dá)盒可以來源于本領(lǐng)域中用于在宿主細(xì)胞中表達(dá)基因的任何克隆和表達(dá)載體。這樣的載體包含一個(gè)或多個(gè)復(fù)制起點(diǎn),其可以是對溫度敏感的。這樣的載體可以含有選擇標(biāo)記基因,例如氯霉素乙?;D(zhuǎn)移酶基因,紅霉素抗性基因,安普霉素抗性基因或者四環(huán)素抗性基因。該載體也可以含有靶區(qū)域,該區(qū)域是宿主細(xì)胞中LanA成簇基因以外的基因組序列的同源序列。這種載體可以用于整合表達(dá)盒到與靶區(qū)域同源的基因組序列中。
該表達(dá)盒可以包含一個(gè)或者多個(gè)除LanA基因及其衍生物以外的成簇基因。當(dāng)宿主細(xì)胞是一種ΔLanA型菌株,其中LanA基因沒有活性,從某種意義上講,其中的成簇基因也被失活的時(shí)候(例如Altena等人2000年文章中提到的菌株),就需要表達(dá)盒提供這樣的基因或者其等效基因。
這里所提到的“位于或鄰近編碼區(qū)的N末端”是指限制性酶切位點(diǎn)的第一個(gè)堿基位于LanA引導(dǎo)序列的密碼子ATG上游6個(gè)堿基處到前導(dǎo)肽(propeptide)的第一個(gè)密碼子的下游6個(gè)密碼子距離的區(qū)間內(nèi)。優(yōu)選的情況是限制性酶切位點(diǎn)的第一個(gè)堿基位于前導(dǎo)肽編碼序列的第一個(gè)密碼子上游12個(gè)殘基處,更優(yōu)選的情況是上游6個(gè)殘基處,至第一個(gè)密碼子下游6個(gè)殘基處的區(qū)間內(nèi)。
一方面,第一限制酶切位點(diǎn)是BglII酶切位點(diǎn)。
類似的,這里提到的“位于或鄰近C末端編碼區(qū)”是指限制性酶切位點(diǎn)的第一個(gè)堿基至少包含了前導(dǎo)肽的終止密碼子中的一個(gè)核苷酸,或者限制酶切位點(diǎn)的5’端或者3’端分別不超出終止密碼子下游或者上游12個(gè)殘基,優(yōu)選的情況是6個(gè)殘基。
一方面,第三限制酶切位點(diǎn)是AvrII。
如果第二限制酶切位點(diǎn)存在,那么它將位于第一和第三限制酶切位點(diǎn)之間。優(yōu)選的情況是該限制酶切位點(diǎn)包含位于前導(dǎo)肽編碼序列的第5-16密碼子中的至少一個(gè)核苷酸,優(yōu)選情況是第8-16密碼子中的至少一個(gè)核苷酸。相應(yīng)的實(shí)施例中,通過改變ActA的編碼序列中第6和第7位的密碼子,引入一個(gè)BsrG1酶切位點(diǎn)。當(dāng)然,其他的修改方式本發(fā)明同樣也考慮在內(nèi)。
對表達(dá)盒還可以做更多的改變,例如可以在表達(dá)盒的第一個(gè)限制酶切位點(diǎn)和第三個(gè)限制酶切位點(diǎn)中引入2個(gè)或者更多的位點(diǎn)。
表達(dá)盒可以包括2個(gè)或者3個(gè)非天然存在的限制性酶切位點(diǎn)。相應(yīng)的實(shí)施例中,編碼ActA的序列SEQ ID NO100中的三個(gè)酶切位點(diǎn)并不是天然存在的。
表達(dá)盒的構(gòu)建簡化了快速產(chǎn)生羊毛硫細(xì)菌素類抗菌肽衍生物的過程,下文中將會(huì)有更詳細(xì)的討論。
一方面,第一和第二,第一和第三,或者第二和第三酶切位點(diǎn)之間的區(qū)域可以被其他填充片段所替代。如果第一和第三酶切位點(diǎn)之間如果還有2個(gè)或2個(gè)以上的酶切位點(diǎn)存在的話,任何一對這些酶切位之間的區(qū)域都可以被填充片段所替換。填充片段比其替換的片段要大的DNA序列。其大小可以是從50到5000的核苷酸,例如可以是大小從500到2000之間的核苷酸。引入這些填充片段的價(jià)值在于當(dāng)這個(gè)區(qū)域被一個(gè)編碼羊毛硫細(xì)菌素類抗菌肽的寡聚核苷酸所取代之后,質(zhì)粒的大小將會(huì)有一個(gè)顯著性的下降。這樣得到的質(zhì)??梢员缓苋菀椎膹哪切┥倭课幢幻盖械馁|(zhì)粒中純化出來,從而消除所有的背景污染。
本發(fā)明中的表達(dá)盒可以用于介導(dǎo)載體中的ActA序列的改變,然后再將其導(dǎo)入宿主細(xì)胞中表達(dá)羊毛硫細(xì)菌素類抗菌肽。為了完成這個(gè)過程,這個(gè)序列需要可操作的連接于LanA(如ActA或者LigA)的引導(dǎo)序列,該引導(dǎo)序列再可操作的連接于LanA啟動(dòng)子序列(如ActA或者LigA)。
另外,作為一種替代的方法,包含表達(dá)盒的載體也可以包括一個(gè)LanR基因。LanR基因與Latibiotic A編碼序列串聯(lián),并位于其下游。
表達(dá)文庫 本發(fā)明中的表達(dá)盒可以用于提供編碼羊毛硫細(xì)菌素類抗菌肽的文庫。這種文庫可以通過導(dǎo)入多個(gè)序列到表達(dá)盒的第一和第二限制酶切位點(diǎn)之間,或者第一和第三限制酶切位點(diǎn)之間,或者第二和第三限制酶切位點(diǎn)之間的方式構(gòu)建,其中所述的多個(gè)序列中的每一個(gè)都與相應(yīng)的ActA或者LigA序列相對應(yīng),其可以是SEQ ID Nos100或者200的前導(dǎo)肽部分有1-15個(gè)核苷酸變化,如1-10個(gè)核苷酸變化,如1到6個(gè)核苷酸變化,如1到3個(gè)核苷酸變化后得到的序列。優(yōu)選的情況是這些改變的結(jié)果導(dǎo)致了其編碼的蛋白序列的改變。當(dāng)然并沒有排除沒有編碼改變的情況。
關(guān)于本發(fā)明構(gòu)建的文庫的另一方面。這樣的文庫可以包含10到100,000,10到10,000,10到1,000不同的編碼序列,它們都是表達(dá)盒中羊毛硫細(xì)菌素A類抗菌肽編碼序列的變體。
編碼羊毛硫細(xì)菌素A類抗菌肽衍生物的表達(dá)盒可以被導(dǎo)入到宿主細(xì)胞中去表達(dá)羊毛硫細(xì)菌素類抗菌肽。
在一個(gè)實(shí)施例中,所述表達(dá)文庫被轉(zhuǎn)化到宿主細(xì)胞中,然后篩選和分離出其中具有抗菌活性的菌落。如果一個(gè)含有羊毛硫細(xì)菌素類抗菌肽表達(dá)序列的單個(gè)菌落表現(xiàn)出抗菌活性,它就可以被檢測到。本發(fā)明進(jìn)一步提供了分離獲得這個(gè)篩選到的有活性的抗菌肽的方法。
宿主細(xì)胞 本發(fā)明將宿主細(xì)胞分為2種主要的類型。一種是生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞。另一種是非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞,即是指該宿主細(xì)胞不含LanA基因,或者不含有產(chǎn)生一個(gè)LanA多肽所必須的成簇基因。
在一個(gè)實(shí)施例中,本發(fā)明提供了一種轉(zhuǎn)入了本發(fā)明中的一組表達(dá)構(gòu)件的宿主細(xì)胞。這組表達(dá)構(gòu)件可以是上文中定義的Set1-7中的任意一組,也可以是其它前體和編碼核酸的成簇多肽的任意組合。在另一個(gè)實(shí)施例中,可以用本發(fā)明的表達(dá)盒去轉(zhuǎn)化所述的宿主細(xì)胞。
在又一個(gè)實(shí)施例中,本發(fā)明提供了一個(gè)宿主細(xì)胞文庫,其中的每一個(gè)文庫都含有本發(fā)明中的不同的表達(dá)盒。
生產(chǎn)羊毛硫細(xì)菌素類抗菌肽的宿主細(xì)胞 在一個(gè)實(shí)施例中,宿主細(xì)胞是一種生產(chǎn)羊毛硫細(xì)菌素類抗菌肽的宿主細(xì)胞。生產(chǎn)羊毛硫細(xì)菌素類抗菌肽的宿主細(xì)胞是指具有如下特點(diǎn)的一類細(xì)胞其表達(dá)構(gòu)件包含了LanA基因,當(dāng)將該宿主細(xì)胞轉(zhuǎn)入到不含有其它任何成簇基因的細(xì)胞后,它能夠被表達(dá)并產(chǎn)生LanA多肽。這樣的細(xì)胞包括所有能生產(chǎn)B型羊毛硫細(xì)菌素類抗菌肽的細(xì)胞,例如任意一株能產(chǎn)生羊毛硫細(xì)菌素類抗菌肽的芽孢桿菌或者放線菌或者鏈霉菌(例如,S.lividans或者S.coelicolor)。這樣的細(xì)胞范例包括生產(chǎn)肉桂霉素的宿主細(xì)胞(例如Streoptomyces cinnamoneus cinnamoneus DSM 40005),或者生產(chǎn)阿肽加定的宿主細(xì)胞產(chǎn)加爾巴丁游動(dòng)放線菌或者利古里亞游動(dòng)放線菌NCIMB41362。
當(dāng)涉及本發(fā)明中具有通式(I)化合物,其中-X1-X2-代表-Leu-Val-時(shí),其宿主細(xì)胞可為沒有任何其他修飾的A.liguriae NCIMB 41362。
一方面,這種類型的宿主細(xì)胞內(nèi)源的羊毛硫細(xì)菌素A基因可能發(fā)生了突變,導(dǎo)致該基因不表達(dá)或者基因表達(dá)產(chǎn)物是一個(gè)失活形式。這樣的宿主細(xì)胞可通過靶向的同源重組去刪除或者突變其內(nèi)源的LanA基因而獲得。在本領(lǐng)域中已知的可實(shí)現(xiàn)這個(gè)技術(shù)的方法可以查閱Altena等人2000年的報(bào)道,以及專利WO2005/093069,其內(nèi)容列入此處以作參考。這種方法處理后得到的宿主細(xì)胞被稱為ΔLanA宿主細(xì)胞。在一個(gè)特定的實(shí)施例中,宿主細(xì)胞是ΔLigA利古里亞游動(dòng)放線菌NCIMB 41362宿主細(xì)胞其LigA基因已經(jīng)失活,例如被突變或者刪除,例如是通過同源重組的方法刪除了LigA基因。在另一個(gè)實(shí)施例中,宿主細(xì)胞是一個(gè)ΔActA產(chǎn)加爾巴丁游動(dòng)放線菌宿主細(xì)胞,其ActA基因已經(jīng)失活,例如被突變或者刪除,例如是通過同源重組的方法刪除了ActA基因。
本專利還構(gòu)想了用其他成簇基因轉(zhuǎn)化這種類型的宿主細(xì)胞的情形,盡管這種類型的宿主細(xì)胞已經(jīng)提供了生產(chǎn)表達(dá)LanA所必需的成簇基因,但是該成簇基因的提供不是必需的。
非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞 在非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞中表達(dá)編碼前體多肽的LanA基因后,其產(chǎn)物可以轉(zhuǎn)化為阿肽加定或者其變體形式或者轉(zhuǎn)化為本發(fā)明中的化合物;在表了含有LanA基因的一組表達(dá)構(gòu)件以后,其產(chǎn)物可以轉(zhuǎn)化為阿肽加定或者其變體形式或者轉(zhuǎn)化為本發(fā)明中的化合物。能夠提供上述表達(dá)和轉(zhuǎn)化環(huán)境的任意一種宿主細(xì)胞都是非產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞。
非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞可以是一種細(xì)菌宿主細(xì)胞。細(xì)菌宿主細(xì)胞包括放線菌,或者鏈霉菌,例如S.lividans,S.coelicolor或者S.cinnamoneus。
宿主細(xì)胞可以是那些LanO基因可能因突變或者刪除導(dǎo)致失活(或者在非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞的情況下,則LanO基因不存在)的類型,或者是宿主細(xì)胞中的LanO基因表達(dá)量增加的類型,例如,通過提供2個(gè)或者更多的拷貝數(shù)的LanO基因,或者將基因連結(jié)到一個(gè)在宿主細(xì)胞中可以增強(qiáng)基因表達(dá)量的啟動(dòng)子。用這種方式調(diào)控lanO基因,可以改變宿主細(xì)胞中本發(fā)明的化合物的氧化形式(Y=-S(O))和還原(Y=-S-)形式產(chǎn)量的相對比例。
生產(chǎn)本發(fā)明中的化合物 本發(fā)明的中的化合物可以通過表達(dá)相應(yīng)核酸得到,例如,如果一個(gè)重組表達(dá)載體中其表達(dá)構(gòu)件含有編碼前體多肽的序列,在一個(gè)含有LanA基因的宿主細(xì)胞中,如有必要,加上那些能夠轉(zhuǎn)化前體多肽生成目的產(chǎn)物的成簇基因,則在該菌中就可以表達(dá)出本發(fā)明中的化合物。如上文所述,當(dāng)涉及本發(fā)明通式(I)化合物,其中-X1-X2-代表-Leu-Val-的時(shí)候,其宿主細(xì)胞可為沒有任何其他修飾的A.liguriae NCIMB 41362。
將表達(dá)盒,或者表達(dá)載體導(dǎo)入宿主細(xì)胞中的方法(特別是體外導(dǎo)入)一般是指轉(zhuǎn)化,但并不局限與此方法。可以使用任何有效的技術(shù)。對于細(xì)菌細(xì)胞來說,合適的技術(shù)包括氯化鈣轉(zhuǎn)化作用,聚乙二醇輔助轉(zhuǎn)染,電穿孔,接合和轉(zhuǎn)染,或者使用噬菌體進(jìn)行轉(zhuǎn)導(dǎo)。
一方面,本發(fā)明提供了一種表達(dá)本發(fā)明中的核酸的方法,該方法包括宿主細(xì)胞(或者其他的表達(dá)系統(tǒng))的選取和宿主細(xì)胞的培養(yǎng),以表達(dá)目標(biāo)核酸。目標(biāo)核酸構(gòu)建于一個(gè)表達(dá)盒中,這樣只要培養(yǎng)宿主細(xì)胞就可以生產(chǎn)出本發(fā)明的產(chǎn)物。
優(yōu)選的目標(biāo)核酸開始表達(dá)的條件是當(dāng)宿主細(xì)胞的培養(yǎng)基本上達(dá)到高細(xì)胞密度的時(shí)候,更優(yōu)選的表達(dá)條件是當(dāng)宿主細(xì)胞的生長達(dá)到或接近穩(wěn)定期的時(shí)候。細(xì)胞培養(yǎng)達(dá)到或者接近穩(wěn)定期的時(shí)候,其OD650的值在1-20之間。本領(lǐng)域中常見的細(xì)胞培養(yǎng)方法可以參閱例如,Sambrook等人1989年的報(bào)道,Ausubel等人2002年的報(bào)道,以及Kieser等人2000年的報(bào)道(特別針對鏈霉菌的培養(yǎng))。表達(dá)系統(tǒng)的表達(dá)產(chǎn)物需要被收集和純化。分離方法包括,使用溶劑萃取的技術(shù)從發(fā)酵培養(yǎng)基中獲取產(chǎn)物,吸附樹脂例如疏水性樹脂,或者沉淀的方法,例如硫酸銨沉淀法。純化方法包括色譜技術(shù),例如離子交換,疏水作用,反相色譜,正相色譜,固相色譜提取,以及HPLC,例如,可參見專利US5112806中所描述的分離mersacidin的方法。
細(xì)胞培養(yǎng)完成之后,本發(fā)明的化合物可以從宿主細(xì)胞培養(yǎng)基中回收,回收的化合物可以配制成藥物組合物,或者任意的藥學(xué)上可接受的鹽形式。
宿主細(xì)胞如果生產(chǎn)出的是本發(fā)明化合物的一個(gè)混合物形式,例如,化合物中的Y是-S-或者-S(O)-的混合物,或者其中Z是NH2或者Ala-的混合物,或者所有4種形態(tài)的混合物,該產(chǎn)物可以用如HPLC這樣的標(biāo)準(zhǔn)分離技術(shù)分離,例如,專利US 6,022,851中生產(chǎn)阿肽加定和丙氨酰阿肽加定(Ala-Actagardine)所描述的分離方法。
其回收的化合物可以配制成藥物組合物的形式,或者任意藥學(xué)上可接受的鹽形式。
藥學(xué)上可接受的鹽的形式 “藥學(xué)上可接受的鹽的形式”,是指所述堿基保持生物學(xué)功效和化合物特征并且為生理所接受的酸加鹽。這種鹽包括那些由無機(jī)酸如鹽酸、氫溴酸、硫酸、硝酸、磷酸以及類似酸,形成的鹽,以及有機(jī)酸如乙酸、丙酸、乙醇酸、丙酮酸、草酸、蘋果酸、丙二酸、琥珀酸、馬來酸、反丁烯二酸、酒石酸、檸檬酸、安息香酸、肉桂酸、苦杏仁酸、甲基黃酰氟酸、乙基黃酰氟酸、p-甲苯黃酰氟酸、水楊酸及類似的。
鹽還包括堿式鹽,像堿或堿土金屬鹽,如鈉、鉀、鈣或鎂鹽。
藥物組合物 本發(fā)明的羊毛硫細(xì)菌素可以同一或多個(gè)本領(lǐng)域技術(shù)人員熟知的藥學(xué)上可接受的成分一起配制,這些成分包括但不限于,藥學(xué)上可接受的載體、佐劑、賦形劑、稀釋液、填充劑、緩沖液、防腐劑、抗氧化劑、潤滑劑、穩(wěn)定劑、助溶劑、表面活性劑(如潤濕劑)、掩蔽劑、著色劑、調(diào)味劑以及甜味劑。所述配方還可以進(jìn)一步包括其他活性成分,例如,其他治療或預(yù)防成分。因此本發(fā)明進(jìn)一步提供了如上文所定義的藥物組合物,以及制備包含將至少一種上文所定義的活性化合物與一種或多種其他本領(lǐng)域技術(shù)人員熟知的藥學(xué)上可接受的成分,如載體、佐劑、賦形劑等混合的方法。如果配制成離散的單元(例如,片劑等),那么每個(gè)單元將含有預(yù)訂量(劑量)的活性化合物。
此處所用的術(shù)語“藥學(xué)上可接受的”就是化合物、成分、材料、組合物、劑量形式等在健康醫(yī)學(xué)判斷的范圍內(nèi)適合用于同所述主題(如人)的組織接觸而沒有過度的毒性、刺激、過敏反應(yīng),或其他問題或并發(fā)癥,并與合理的獲益/風(fēng)險(xiǎn)對比值相稱。每一種載體、佐劑、賦形劑等在與配方的其它成分相配伍的意思上也必須是“可接受的”的。
組合物可以被配成使用于任何合適的給藥途徑和方式的形式。藥學(xué)上可接受的載體或稀釋液包括那些用于配方中并適用于口服的、直腸給藥的、經(jīng)鼻的、局部的(包括含服和舌下的)、陰道的或非腸道的(包括皮下、肌肉、靜脈、皮層內(nèi)、腸內(nèi)和腦膜)的給藥的載體或稀釋劑。所述配方可以便利的以單位劑量形式提供并可以通過任何本領(lǐng)域技術(shù)人員熟知的已有技術(shù)來制備。這樣的方法包括把活性成分和由一或多種附屬成分組成的載體結(jié)合到一起的步驟。一般來說所述制劑通過其活性成分被均一且密切地帶入液體載體或完好分隔的固體載體或兩者都有來制備,然后,如果需要的話,再加工產(chǎn)品。
對于固體組合物,常規(guī)的無毒性固體載體包括,例如藥用級的甘露醇、乳糖、纖維素、纖維素衍生物、淀粉、硬脂酸鎂、糖精鈉、滑石粉、葡萄糖、蔗糖、碳酸鎂以及可能用到的類似物。上文所定義的活性化合物可以使用例如,聚(亞烷基)二醇、乙?;视鸵约邦愃频奈镔|(zhì)配成栓劑,。藥學(xué)上液體給藥的組合物可以,例如通過溶解、分散等制備,由上文所定義的活性化合物和任意在載體中的藥學(xué)上的佐劑,例如,像,水、鹽水葡萄糖、甘油、乙醇以及類似物質(zhì)混合,從而形成溶液或懸浮液。如果想得到,被注射的藥物組合物也可以含有少量的無毒性輔料像細(xì)潤或乳化劑、pH緩沖試劑和類似的,例如,醋酸鈉、單十二酸酯山梨聚糖、三乙醇胺醋酸鈉、單十二酸酯山梨聚糖、三乙醇胺油酸鹽等。制備這些劑型的方法是對本領(lǐng)域技術(shù)人員來說是熟知的或是現(xiàn)而易見的;例如,參見“RemingtonThe Science and Practice of Pharmacy”,20th Edition,2000,pub.Lippincott,Williams & Wilkins。所述組合物或配方,無論如何,必須含有一些所述的活性化合物,其含量應(yīng)達(dá)到足以減輕被治療患者癥狀的有效量。
含有在0.25到95%范圍內(nèi)的活性成分余量是由無毒性載體組成的藥物劑型和組合物將被制備。
對于口服給藥,藥學(xué)上可接受的無毒組合物是是通過結(jié)合任意常用的賦形劑加工而成,所述賦形劑例如,像,藥用級的甘露醇、乳糖、纖維素、纖維素衍生物、sodium crosscarmellose、淀粉、硬脂酸鎂、糖精鈉、滑石粉、葡萄糖、蔗糖、鎂、碳酸鹽及類似物。這些組合物表現(xiàn)為溶液、懸浮液、片劑、丸劑、膠囊、粉劑以及緩釋制劑的形式存在。這些組合物可以含有1%-95%的活性成分,優(yōu)選2-50%,最優(yōu)選5-8%。
腸胃外給藥通常表現(xiàn)為注射,皮下、肌肉或者靜脈注射。注射劑可以通過常規(guī)方式制備,可以是液體溶液或懸浮液,注射前可以做成液體溶液或懸浮液的固體形式,或乳狀液。適用的賦形劑包括,例如,水、鹽、葡萄糖、甘油、乙醇或類似的物質(zhì)。此外,如果想得到,可使用的藥物組合物也可以含有少量的無毒性輔料像細(xì)潤或乳化劑、pH緩沖試劑和類似的,例如,醋酸鈉、失水山梨醇單月桂酸酯、油酸三乙醇胺、三乙醇胺醋酸鈉等。
對于局部使用,藥學(xué)上可接受的組合物可以配成合適的軟膏或活性化合物懸浮或溶解在一種或多種載體中的凝膠的形式。適用于本發(fā)明中化合物局部給藥的載體包括,但不限于,礦物油、液體蠟膏、白凡士林、丙二醇、聚乙二醇、聚氧化丙稀化合物、酯類乳化劑和水。供選擇的,藥學(xué)上可接受的組合物可以被配成合適的洗劑或霜?jiǎng)浠钚猿煞謶腋』蛘呷芙庥谝环N或多種藥學(xué)上可接受的載體。合適的載體包括,但不限于,礦物油、山梨醇酐單硬脂酸酯、聚山梨醇酯60、十六烷基酯蠟、cetearyl alcohol、2—辛基十二烷醇(2-octyldodecanol)、苯甲醇和水。
活性化合物在該親本組合物或局部組合物種的百分比很大程度上依賴于其特異的本性,還有化合物的活力和客體的需求。然而,活性成分的百分比在0.1%到10%w/w之間是合格的,如果該組合物是固體則活性成分的含量要高一些,隨后可以稀釋到上述百分比。優(yōu)選,所述組合物在溶液中含有0.2-2%w/w的活性物質(zhì)。
關(guān)于合適的載體、佐劑、賦形劑的進(jìn)一步啟示可以從制藥標(biāo)準(zhǔn)參考書中找到,例如,RemingtonThe Science and Practice of Pharmacy”,20thEdition,2000,pub.Lippincott,Williams & Wilkins;and Handbook ofPharmaceutical Excipients,2nd edition,1994. 化合物的應(yīng)用 本發(fā)明中的羊毛硫細(xì)菌素化合物和組合物可以以醫(yī)學(xué)治療或預(yù)防的方法使用于客體??腕w可以是人或動(dòng)物客體。動(dòng)物客體可以是哺乳動(dòng)物或其他脊椎動(dòng)物。
因此本發(fā)明提供一個(gè)可用于客體治療或預(yù)防的化合物。本發(fā)明還提供了利用本發(fā)明化合物來生產(chǎn)可用于客體治療或預(yù)防的藥物。
治療方法可以是細(xì)菌感染,包括皮膚、黏膜、腸或全身性感染。
變體及其組合物可以用于菌血癥(bacteraemia)(包括導(dǎo)尿管相關(guān)的菌血癥)、肺炎、皮膚和皮膚結(jié)構(gòu)感染(包括手術(shù)部位感染)、心內(nèi)膜炎和骨髓炎的系統(tǒng)性治療。這些或其他這樣的治療可以直接抗擊致病物質(zhì)如葡萄球菌、鏈球菌、腸道球菌。本發(fā)明的化合物及其組合物還可以用于皮膚感染的局部治療,包括痤瘡也就是痤瘡丙酸桿菌(Propionibacteriumacnes)。所述變體及其組合物也可以用于眼部感染像結(jié)膜炎的治療,且可用于腸的二重感染的口服治療,如由艱難梭菌(Clostridium difficile)包括多重抵抗的C.difficile引起(假膜性結(jié)腸炎),或用于口服治療與幽門螺桿菌(Helicobacter pylori)關(guān)聯(lián)的腸感染的口服治療。
所述變體還可以用于創(chuàng)傷或燒傷皮膚的治療或感染預(yù)防。此外,變體及其組合物還可以用于預(yù)防疾病,如,清除鼻孔來預(yù)防MRSA的傳播。這可以用于有感染危險(xiǎn)的客體(如進(jìn)入醫(yī)院的病人)或用于健康的職業(yè)工作者或其它存在成為該感染攜帶者危險(xiǎn)的看護(hù)人員。腹部手術(shù)前預(yù)防性的清除腸道菌群也是預(yù)期的。
根據(jù)本發(fā)明的化合物可以以經(jīng)腸的(口服),腸胃外的(肌肉或靜脈注射),直腸的或在本地(局部)的方式使用。它們可以以溶液、粉末(片劑、膠囊包括微膠囊)、軟膏(霜?jiǎng)┗蚰z)或栓劑形式使用。這種配方可能的輔料是制藥上慣用的液體或固體填充劑和添加劑、溶劑、乳化劑、潤滑劑、調(diào)味劑、著色劑和/或緩沖液。一般以有利的劑量,給藥劑量與身體體重的比為0.1-1000mg/kg,優(yōu)選0.2-100mg/kg來使用??梢员憷陌凑瞻辽俑鶕?jù)本發(fā)明的每日有效量的化合物的劑量單位來使用,如30-3000,優(yōu)選50-1000,mg。
本發(fā)明的實(shí)驗(yàn)原理,包括其最佳方式,現(xiàn)在將通過例子進(jìn)一步具體討論,附圖作為參考。
實(shí)施例1-成簇基因的克隆 從產(chǎn)加爾巴丁游動(dòng)放線菌和利古里亞游動(dòng)放線菌中鑒定和克隆阿肽加定生物合成成簇基因。
O/SBDIG-1是一種地高辛(DIG)標(biāo)記的由48個(gè)堿基組成的簡并寡聚核苷酸。它是根據(jù)阿肽加定多肽中已知的氨基酸序列以及考慮到游動(dòng)放線菌屬的密碼子偏好性設(shè)計(jì)出的。對從產(chǎn)加爾巴丁游動(dòng)放線菌中提取的基因組DNA并使用限制性內(nèi)切酶NcoI消化后的酶切片段做Southern雜交分析,鑒定出一個(gè)大約3kb的DNA片段可以與探針OSBDIG-1雜交。在富集NcoI消化的基因組DNA以后,分離出其中3kb左右的DNA片段,并克隆到載體pLITMUS28(NEB)的NcoI位點(diǎn)上??寺〉玫降馁|(zhì)粒轉(zhuǎn)入大腸桿菌菌株E.coli DH10B中并使用探針O/SBDIG-1做Southern雜交分析。選取其中的一個(gè)雜交結(jié)果為陽性的質(zhì)粒送交序列分析。測序結(jié)果表明這個(gè)命名為pLITAG01的質(zhì)粒由編碼負(fù)責(zé)阿肽加定生物合成的lanA結(jié)構(gòu)基因的DNA(actA),以及一段上游區(qū)域,該序列被認(rèn)為編碼一部分的ABC糖轉(zhuǎn)運(yùn)體,以及一段下游區(qū)域,編碼了部分的LanM(actM)。
引物O/ACT08F和O/ACT09R根據(jù)質(zhì)粒pLITAG01的序列而設(shè)計(jì)。使用地高辛標(biāo)記的dNTPs(Roche)以及pLITAG01為模板,使用這些引物進(jìn)行PCR反應(yīng),得到了一個(gè)2296bp的地高辛標(biāo)記的DNA片段,命名為SBDIG-2。
通過克隆Sau3AI酶切的產(chǎn)加爾巴丁游動(dòng)放線菌ATCC 31049以及利古里亞游動(dòng)放線菌NCIMB 41362基因組DNA片段至預(yù)先用BamHI酶切的粘粒SuperCosl(Stratagene)中,構(gòu)建了2個(gè)粘粒文庫。對每個(gè)粘粒文庫都使用SBDIG-1為探針做Southern雜交分析。從中各選取25個(gè)和SBDIG-1雜交呈陽性的粘??寺。偈褂肙/SBDIG-1和SBDIG-2作為探針重新做Southern雜交分析。來源于A.garbadinensis基因組DNA中的9個(gè)粘粒以及來源于利古里亞游動(dòng)放線菌基因組中的11個(gè)粘粒的插入片段與2個(gè)探針雜交呈陽性。使用T3和T7引物分離并測序這些質(zhì)粒中的插入片段DNA。粘粒CosAL02和CosAG14隨后被完整測序(劍橋大學(xué)生物化學(xué)系測序部門)。
材料與方法 菌株 本發(fā)明中用到的細(xì)菌菌株歸結(jié)于表5 載體 粘粒SuperCosl從stratagene公司獲得。
質(zhì)粒pLITMUS從New England Biolabs公司獲得。
引物 引物名稱SEQ.IDSequence 5’-3’ O/SBDIG-1 300 TGGGTSTGCACSCTSACSATCGARTGCGGNACSGT SATCTGCGCSTGC O/ACT08F301 TCCAGCACGCGCGGGG O/ACT09R302 GTTCGACCAGCCGCCC Souther雜交 DNA探針的標(biāo)記 DNA雜交探針的制備是使用Roche公司的地高辛(DIG)PCR DNA標(biāo)記和檢測試劑盒,并根據(jù)他們的說明書所制備。
轉(zhuǎn)移DNA至尼龍膜。
目標(biāo)DNA首先通過瓊脂糖凝膠電泳分離,然后通過一個(gè)真空泵印跡裝置(Q BIO gene)轉(zhuǎn)移到尼龍膜上(Hybond-N,Amersham Int.,UK)。
使用0.5M HCl脫嘌呤DNA的處理時(shí)間根據(jù)溴酚藍(lán)染料條帶完全變黃的時(shí)間來決定(對于濃度為0.7%的瓊脂糖凝膠來說一般是15-20分鐘)。然后使用1.5M NaCl,1.5M NaOH進(jìn)行系統(tǒng)性的變性,再使用0.5M Tris,1.5MNaCl,pH8.0的條件下進(jìn)行中和,每一步大約15-20分鐘。于20×SSC中浸潤至少60分鐘來完成完全的DNA印跡。將印跡膜從真空泵印跡裝置中取出后,置于室溫下風(fēng)干。通過UV透照器(UVP)在波長365nm的紫外照射下照射5分鐘實(shí)現(xiàn)DNA的交聯(lián)(DNA面朝下)。
菌落轉(zhuǎn)移和雜交 將要使用雜交方法篩選的菌落轉(zhuǎn)移到一個(gè)尼龍膜上(Rochediagnostics)。通過放置帶正電荷的尼龍膜于菌落上,然后緊壓1分鐘完成有效的轉(zhuǎn)移。于膜上標(biāo)記參照點(diǎn),以標(biāo)記出對應(yīng)的菌落的位置。緊接著,移開尼龍膜,并參照Roche的用戶手冊(過濾雜交DIG應(yīng)用手冊)準(zhǔn)備雜交。
雜交和膜的顯影 預(yù)制好的探針和DNA在68℃的HB-1000型雜交爐(UVP)中雜交過夜(大約16個(gè)小時(shí))。雜交之后的膜在室溫下用含有0.1%十二烷基硫酸鈉(SDS)和2×檸檬酸鈉鹽的溶液(SSC)洗兩遍,每次5分鐘。之后再在68℃下在SBDIG-1存在的條件下使用含有0.1% SDS和1×SSC的溶液洗雜交膜兩遍,每次15分鐘。再于68℃在SBDIG-2存在的條件下使用含有0.1% SDS和0.1×SSC的溶液洗篩選膜兩遍,每次15分鐘。然后膜使用Roche用戶手冊上推薦的方法顯影(過濾雜交DIG應(yīng)用手冊)。
軟件 共有序列使用如下軟件分析FramePlot版本號2.3.2,BioEdit sequencealignment editor,Clustal W(EMBL-EBI)以及Basic Local Alignment SearchTool(BLAST,NCBI) 結(jié)果與討論 CosAG14 粘粒CosAG14,含有從產(chǎn)加爾巴丁游動(dòng)放線菌中分離出的38168bp基因組DNA片段。通過序列分析,該DNA編碼了阿肽加定前肽以及其前導(dǎo)序列,這個(gè)基因記為actA。分析表明,2個(gè)丙氨酸殘基直緊接位于阿肽加定前肽的上游。這兩個(gè)殘基應(yīng)該是蛋白酶切割阿肽加定前導(dǎo)肽的識別位點(diǎn)。該位點(diǎn)的不完全酶切會(huì)導(dǎo)致一個(gè)丙氨殘基殘留,最后生成丙氨酰阿肽加定(ala-actagardine),該化合物經(jīng)常在產(chǎn)加爾巴丁游動(dòng)放線菌的發(fā)酵液中檢測到。actA基因下游的一個(gè)3162bp的DNA區(qū)域同一些lanM類蛋白相比,例如,mersacidin成簇基因中的mrsM(30%同一性)具有很強(qiáng)的序列相似性。這個(gè)推測的基因記為actM,它可能參與了阿肽加定前體多肽的修飾,催化了脫氫反應(yīng)和硫醚鍵的生成。actM下游11bp處的一個(gè)編碼了341個(gè)氨基酸殘基的開放閱讀框同一些熒光素酶類型的單加氧酶具有序列相似性(大約39%同一性),被記為actO。單加氧酶actO的功能可能是催化脫氧阿肽加定(deoxy-actagardine)結(jié)合氧原子,生成阿肽加定。與actO取向相反,位于下游62bp處的開放閱讀框,記為actR。該開放閱讀框的蛋白產(chǎn)物與一些二元響應(yīng)調(diào)節(jié)因子表現(xiàn)出序列相似性(~37%同一性)。位于actR下游789bp并與其基因序列方向相同的是一個(gè)推測為編碼了812個(gè)氨基酸的蛋白的基因,它與ABC轉(zhuǎn)運(yùn)系統(tǒng)的通透酶具有序列相似性(大約25%序列同一性)。這個(gè)推測的蛋白記為actT,可能負(fù)責(zé)修飾后的羊毛硫細(xì)菌素類抗菌肽的外運(yùn)。actT下游的第二和第四個(gè)開放閱讀框編碼的氨基酸序列表現(xiàn)出分別與反應(yīng)調(diào)節(jié)因子激酶(reponse regulator kinase)以及青霉素結(jié)合蛋白序列相似性(大約30%序列同一性)。對產(chǎn)單胞李斯特菌(Listeria monocytogenes)中的乳酸鏈球菌肽的生物合成成簇基因的研究工作(Gravesen等人2004年的工作)表明組氨酸激酶和一種青霉素結(jié)合蛋白,以及一個(gè)未知功能的蛋白參與了賦予乳酸鏈球菌肽抗菌性的反應(yīng)過程。這些基因的相似序列位于actA基因的附近表明這些序列參與了賦予阿肽加定抗菌性的反應(yīng)過程。
CosAL02 粘粒CosAL02,含有從Actinoplanes liguriae中分離出的40402bp基因組DNA片段。序列分析表明其中含有一個(gè)編碼了64個(gè)氨基酸蛋白的lanA基因,它與粘粒CosAG14中的actA基因具有高度的序列同源性(50個(gè)一致的氨基酸殘基)。這里把該種lanA基因記為ligA。該lanA基因前肽的氨基酸序列與阿肽加定的前體多肽的氨基酸有2個(gè)殘基的差異,在如下的序列比對中指出(SEQ.ID 119和SEQ.ID 212) AG actA MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTVICAC 64 AL lanA MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTLVCAC 64 ****.**.***.***************************************** 其中的第15位的V突變成了L和16位的I突變成了V,突變后產(chǎn)生的蛋白和阿肽加定具有相同的的分子量,所以在質(zhì)譜分析(lc-ms)中沒有區(qū)分出來。CosAL02中鑒定出的lanA基因的潛在產(chǎn)物表明它是一種新的羊毛硫細(xì)菌素類抗菌肽。在ligA上游321bp處的開放閱讀框編碼了一個(gè)含有286個(gè)氨基酸的推定蛋白,,它與菌株Streptomyces glaucescens中的StrR蛋白有序列相似性(46%的序列同一性)。StrR蛋白是一個(gè)通路特異的DNA結(jié)合激活因子,它參與了鏈霉素基因的表達(dá)調(diào)控。LigA基因下游的開放閱讀框的序列相似度(31%同一性)表明它編碼了一個(gè)1046個(gè)氨基酸的lanM多肽(以下記為ligM),所述lanM多肽可能參與了ligA前肽的修飾。開放閱讀框下游緊接著lanT(ligT)的起始密碼子,它與ligM的終止密碼子重疊。LigT是一個(gè)含有575氨基酸的蛋白,表現(xiàn)出與一些ABC轉(zhuǎn)運(yùn)體具有序列相似性。LanT蛋白的功能是負(fù)責(zé)分泌成熟的終產(chǎn)物以及仍含有前導(dǎo)序列的翻譯后修飾產(chǎn)物。與粘粒CosAG14中觀察到的一樣,ligT下游緊接著的開放閱讀框編碼的347個(gè)氨基酸的蛋白,與熒光素酶類型的單加氧酶具有序列相似性(約38%序列同一性)。這個(gè)推測的單加氧酶(ligO)被認(rèn)為參與了氧原子的結(jié)合和亞砜鍵的形成。LigO的下游與其基因序列反向的位置有一個(gè)推測為217個(gè)氨基酸的蛋白,表現(xiàn)出與一些二元反應(yīng)調(diào)節(jié)因子具有序列相似性(約37%序列同一性)。這個(gè)推測的調(diào)節(jié)因子記為ligR。
表1 -CosAG14注解(從產(chǎn)加爾巴丁游動(dòng)放線菌分離出的38168bp片段,SuperCosl載體的骨架序列被忽略) 基因名 描述 位置(DNA)開放閱 氨基酸大 起始 - 終 稱 讀框位 小 (堿基 止 (3 個(gè)氨 置 長度) 基酸) orf1推定蛋白 482-42 -1 146(441) MPR-RCG orf2推定蛋白 2824-2375-2 149(450) VSV-ERA orf3參與細(xì)胞分裂的ATP 4432-2876-2 518(1557) VER-TNR 酶AAA orf4糖水解酶 6002-5391-1 203(612) VGE-NYS orf5內(nèi)切葡聚糖酶 6484-5825-2 219(660) MRR-TVR 基因名 描述 位置(DNA)開放閱 氨基酸大 起始 - 終 稱讀框位 小 (堿基 止(3 個(gè)氨 置 長度) 基酸) orf6胞嘧啶/腺嘌呤脫氨酶 6627-7112+3 161(486) MTI-PAQ orf7未知 7756-8997+1 413(1242) VTT-YDK orf8未知 9586-8933-2 217(654) VGK-FRG orf9丙酮酸氧化酶 11886-10108 -3 592(1779) VSD-DPS orf10 水解酶或酰基轉(zhuǎn)移酶 12066-12866 +3 266(801) VSR-SGT orf11 醛糖差向異構(gòu)酶 13116-14306 +3 396(1191) MTE-TAD orf12 ABC糖轉(zhuǎn)運(yùn)周質(zhì)成分14385-15521 +3 378(1137) MPR-AHG orf13 ABC糖轉(zhuǎn)運(yùn)通透酶 15514-16572 +1 352(1059) MDD-GRS orf14 ATP結(jié)合相關(guān)的ABC 16569-17330 +3 253(762) MTA-RGR 轉(zhuǎn)運(yùn)蛋白 orf15 推定蛋白,甲基轉(zhuǎn)移酶 18102-17335 -3 255(768) MES-RKR orf16 ABC轉(zhuǎn)運(yùn)通透酶18962-18120 -1 280(843) MPP-RKG orf17 ABC轉(zhuǎn)運(yùn)通透酶19896-18991 -3 301(906) MSA-ESE orf18 底物結(jié)合相關(guān)的ABC21236-19899 -1 445(1338) MFI-SGR 轉(zhuǎn)運(yùn)蛋白 orf19 actA,結(jié)構(gòu)基因 21572-21766 +2 64(195)MSA-CAC orf20 actM,修飾基因 21837-24998 +3 1053 MSP-PLT (3162) orf21 actO,單加氧酶 25009-26034 +1 341(1026) MPE-PAA orf22 actR,反應(yīng)調(diào)節(jié)因子 26791-26096 -2 231(696) MRS-CLS orf23 actT,結(jié)合的通透酶的 29323-26885 -2 812MLA-LTR ABC轉(zhuǎn)運(yùn)因子 (2439bp) orf24 推定蛋白 29462-30196 +2 244(735) MIV-RNR orf25 反應(yīng)調(diào)節(jié)因子激酶 30235-31338 +1 367(1104) VLR-ARA orf26 反應(yīng)調(diào)節(jié)因子感受器 31335-31997 +3 220(663) MTR-AVG orf27 青霉素結(jié)合蛋白 32138-34486 +2 782(2349) MLI-PPR orf28 甲基轉(zhuǎn)移酶 35209-34448 -2 253(762) MAP-DRR 基因名 描述 位置(DNA) 開放閱 氨基酸大 起始 - 終 稱讀框位 小 (堿基 止(3 個(gè)氨 置 長度) 基酸) orf29水解酶 36030-35245 -3 261(786) VPR-PPP orf30反應(yīng)調(diào)節(jié)因子 36086-36820 +2 244(735) VSP-TGS orf31果糖二磷酸醛縮酶 36844-37689 +1 281(846) MKD-RAW orf32水解酶 37590-38168 +3 192(579) MGS-DPA 表2-CosAL02注解(從利古里亞游動(dòng)放線菌分離出的40402bp片段,SuperCosl載體的骨架序列被忽略) 基因名 描述 位置(DNA) 開放閱讀 氨基酸 起始 - 終止 稱 框位置 大 小 (3 個(gè)氨基酸) (堿基長 度) orf1 分泌系統(tǒng)蛋白 1008-1 -2 335 VRL-VDI (1008) orf2 反應(yīng)調(diào)節(jié)因子 2198-1122 -3 358 MSE-LFP (1077) orf3 推定蛋白 3088-2288 -1 266 MRR-VVR (801) orf4 推定蛋白 4410-3112 -2 432 MRR-RTG (1299) orf5 與ATP結(jié)合相關(guān)的反應(yīng) 5205-4795 -2 136 MWK-SAR調(diào)節(jié)因子 (411) orf6 ABC糖轉(zhuǎn)運(yùn)因子 5516-6607 +2 363 MFN-SAY (1092) orf7 ATP結(jié)合相關(guān)的ABC糖6673-8178 +1 501 MLL-DEH轉(zhuǎn)運(yùn)因子 (1506) 基 因 名 描述 位置(DNA) 開放閱讀 氨 基 酸 起始 - 終止 稱 框位置大小 (3 個(gè)氨基酸) (堿基長 度) orf8 ABC轉(zhuǎn)運(yùn)通透酶 8168-9127 +2319MST-RTR (960) orf9 ABC轉(zhuǎn)運(yùn)因子通透酶蛋9130-10092 +1320MSI-RRS 白 (963) orf10 金屬肽酶 12046- -1486MRT-PGS (Metallopeptidase) 10586(1461) orf11 推測的StrR類似調(diào)節(jié)因 12460- +1286MDS-DAA 子 13320(861) orf12 ligA 13641- +364(195)MSA-CAC 13835 orf13 ligM 13907- +21046 MSS-THV 17047 (3141) orf14 ligT,ABC轉(zhuǎn)運(yùn)因子 17040- +3575MSE-LLT 18767 (1728) orf15 ligO,熒光素酶類型的單 18785- +2347MLS-RRW 加氧酶 19828 (1044) orf16 ligR,反應(yīng)調(diào)節(jié)因子 20459- -3217MAD-ELA 19806 (654) orf17 結(jié)合通透酶的ABC轉(zhuǎn)運(yùn)23069- -3814MIF-LVR 因子 20625 (2445) orf18 ABC轉(zhuǎn)運(yùn)因子,ATP結(jié) 23788- -1240MVS-VTS 合蛋白 23066 (723) orf19 組氨酸激酶 23980- +1362VIA-AVP 25068 (1089) orf20 反應(yīng)調(diào)節(jié)因子 25065- +3218MTE-GPS 25721 (657) 基 因 名描述 位置(DNA) 開放閱讀 氨 基 酸 起始 - 終止 稱 框位置大小 (3 個(gè)氨基酸) (堿基長 度) orf21 推測的膜蛋白 26673- -2 301MPI-RFP25768 (906) orf22 α-β水解酶26697- +3 290MRN-ASR27569 (873) orf23 轉(zhuǎn)錄調(diào)控因子 27574- +1 145VRL-RLG28011 (438) orf24 丙酮酰依賴的精氨酸脫 28102- +1 175MAD-GMN 羧酶 28629 (528) orf25 推測的二氨基庚二酸鹽 30946- -2 406MTL-LYA 脫羧酶 29626 (1221) orf26 激酶 31860- -2 309VRS-PDL30931 (930) orf27 轉(zhuǎn) 錄調(diào)控因子33248- -3 367VVF-ANS32145 (1104) orf28 糖基轉(zhuǎn)移酶 33600- +3 317MPS-NAG34553 (954) orf29 糖基轉(zhuǎn)移酶 34543- +1 369MPA-ARV35652 (1110) orf30 二氫硫辛酰胺脫氫酶 36432- +3 459MGE-INF37811 (1380) orf31 推測的膜蛋白 37973- +2 348MTT-TPG39019 (1047) 實(shí)施例2-表達(dá)盒 表達(dá)盒的構(gòu)建 本實(shí)施例闡明了構(gòu)建本發(fā)明中的表達(dá)盒的方法。該表達(dá)盒中的質(zhì)粒pAGvarX可以高效構(gòu)建本發(fā)明中的LanA基因的變體形式,隨后轉(zhuǎn)入一個(gè)宿主細(xì)胞中,例如一株不含野生型actA的產(chǎn)加爾巴丁游動(dòng)放線菌中(A.garbadinenis Δ actA)。該質(zhì)粒源于載體pSET152(Bierman等人1992年的工作),它可以通過attP附著位點(diǎn)整合到宿主細(xì)胞的染色體上。通過寄助物和其自有的阿肽加定生物合成成簇基因的野生型基因一起去表達(dá)actA基因突變型,從而產(chǎn)生阿肽加定的變體形式。
質(zhì)粒pAGvarX的構(gòu)建 除非另有說明,這里所有的引用的位置都是指序列SEQ ID NO100上的位置。圖3中展示了載體pAGvarX的構(gòu)建圖譜。以O(shè)/Agvar01bF和O/Agvar02bR(見引物表)為引物,以pLITAG01為模板PCR擴(kuò)增從ActA基因上游讀碼框區(qū)域21237位堿基開始至actA編碼區(qū)的21672位編碼亮氨酸殘基的堿基之間的一段序列。這對引物在5’末端通過設(shè)計(jì)引入一個(gè)端側(cè)XbaI酶切位點(diǎn),通過同義突變在亮氨酸編碼actA的3’端引入一個(gè)BglII的酶切位點(diǎn)。該擴(kuò)增片段與Smal酶切并脫磷后的pUC19連接,構(gòu)建成的載體記為pAGvar1。
以O(shè)/Agvar05F和O/Agvar06R為引物,以pLITAG01為模板PCR擴(kuò)增actA基因C末端與其下游緊接的開放閱讀框(包括21758-21836)之間的DNA序列。引物設(shè)計(jì)時(shí)在5’端引入一個(gè)端側(cè)AvrII酶切位點(diǎn),3’末端引入一個(gè)EcoRI酶切位點(diǎn)。該P(yáng)CR產(chǎn)物與SmalI酶切并脫磷后的pUC19連接,構(gòu)建成的載體記為pAGvar2。質(zhì)粒pAGvar1和pAGvar2均使用XbaI酶切,然后回收pAGvar1中的PCR產(chǎn)物片段,將其克隆到脫磷后的pAGvar2的XbaI位點(diǎn),再通過酶切分析的方式鑒定連接片段方向的正確性。構(gòu)建成的質(zhì)粒記為pAGvar3,其隨后使用BglII和AvrII雙酶切,再與退火后的寡聚核苷酸O/AGvar03F和O/AGvar04R連接,構(gòu)建成的質(zhì)粒記為pAGvar4。質(zhì)粒pAGvar4隨后使用EcoRI和XbaI雙酶切,得到一個(gè)包括退火寡聚核苷酸序列在內(nèi)大約620bp的片段,隨后與EcoRI和XbaI雙酶切的質(zhì)粒pSET152連接,構(gòu)建成的載體記為pAGvarX。
這段通過退火相應(yīng)的寡聚核苷酸序列構(gòu)建的pAGvarX的區(qū)域,已通過同義突變的方式引入了一個(gè)BsrGI酶切位點(diǎn),它位于阿肽加定多肽序列的6位和7位上(相應(yīng)的氨基酸是C和T)。該位點(diǎn)可以用于與其上游的BglII或者下游的AvrII酶切位點(diǎn)聯(lián)合使用導(dǎo)入任意一段含有氨基酸定點(diǎn)突變的actA多肽的DNA序列。
實(shí)施例3-宿主細(xì)胞 這個(gè)實(shí)施例公開了一個(gè)構(gòu)建其LanA基因失活的生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞的方法。本實(shí)施例中,構(gòu)建出的是一株刪除了actA基因的產(chǎn)加爾巴丁游動(dòng)放線菌。
菌株產(chǎn)加爾巴丁游動(dòng)放線菌ΔactA的構(gòu)建 菌株產(chǎn)加爾巴丁游動(dòng)放線菌ΔactA可以用作表達(dá)阿肽加定結(jié)構(gòu)基因actA的變體形式的宿主。該菌株是使用Gust等人2002年開發(fā)的Redirect技術(shù)從野生型產(chǎn)加爾巴丁游動(dòng)放線菌改造而來。首先,使用表達(dá)盒SBdel-1替換粘粒CosAG14中編碼actA的DNA區(qū)域。表達(dá)盒SBdel-1是由側(cè)端連有FLP識別位點(diǎn)(FRT)的oriT,和安普霉素抗性基因(aac(3)IV)組成,且該表達(dá)盒可以用質(zhì)粒pIJ773為模板,O/SB50F和O/SB51R為引物,PCR擴(kuò)增得到,所述兩個(gè)引物結(jié)合的位點(diǎn)分別位于序列SEQ ID NO100的21536位和21802位。根據(jù)Redirect的步驟(見Gust等人2004年的報(bào)道),使用Sbdel-1替換掉CosAG14中的actA后生成粘粒記為CosAG14 Δ A。然后根據(jù)Redirect技術(shù)的第七步,使用FLP介導(dǎo)的刪除方法刪除了CosAG14Δ A中原Sbdel-1的中心序列,其產(chǎn)物粘粒記為CosAG14 Δ B。該區(qū)域刪除后使用這個(gè)載體介導(dǎo)的刪除可以實(shí)現(xiàn)無極性,無標(biāo)記的框內(nèi)刪除,而且可以重復(fù)使用同樣的抗性篩選標(biāo)記(Gust等人2003年的報(bào)道)。
菌株構(gòu)建的第二階段是改造這個(gè)粘粒使其可以通過接合的方式導(dǎo)入產(chǎn)加爾巴丁游動(dòng)放線菌中。其步驟首先是用轉(zhuǎn)化的方法將CosAG14 Δ B導(dǎo)入大腸桿菌E.coli BW25113/pIJ790中。再根據(jù)Redirect的步驟將CosAG14Δ B中的氨芐青霉素基因使用SBdel-2替代掉,構(gòu)建成的粘粒記為CosAG14 Δ C。該SBdel-2表達(dá)盒同SBdel-1一樣,含有安普霉素抗性基因(aac(3)IV)和側(cè)端連有FRT位點(diǎn)的oriT。該表達(dá)盒以O(shè)/SB52F和O/SB53R為引物,以pIJ773為模板通過PCR擴(kuò)增得到。
在CosAG14ΔC被用于轉(zhuǎn)化電轉(zhuǎn)感受態(tài)細(xì)胞E.coli ET12567/pUZ8002后,再根據(jù)Redirect的步驟將其與產(chǎn)加爾巴丁游動(dòng)放線菌接合轉(zhuǎn)移,。(參見Gust等人2004年的報(bào)道以及下文)。如此構(gòu)建之后的菌株中的actA基因已經(jīng)從其基因組中刪除,即為產(chǎn)加爾巴丁游動(dòng)放線菌ΔactA菌株。
關(guān)于獲得上述產(chǎn)加爾巴丁游動(dòng)放線菌ΔactA菌株的進(jìn)一步描述如下,在CosAG14 Δ C載體被用于轉(zhuǎn)化電轉(zhuǎn)感受態(tài)細(xì)胞E.coliET12567/pUZ8002之后,使用接合的方式轉(zhuǎn)入到菌株產(chǎn)加爾巴丁游動(dòng)放線菌中。將得到的具有安普霉素抗性的接合后體置于不含安普霉素培養(yǎng)基TSB中進(jìn)行六輪連續(xù)的繼代培養(yǎng)。第六輪培養(yǎng)后得到的克隆使用65號培養(yǎng)基于30℃。培養(yǎng)5天后,將菌落轉(zhuǎn)移到一個(gè)大約1em2的65號培養(yǎng)基上并作菌種保存。于30℃培養(yǎng)3天后挑選的菌被轉(zhuǎn)移到含有終濃度為50ug/ml的安普霉素的65號培養(yǎng)基上培養(yǎng)。于30℃培養(yǎng)72小時(shí)后,挑選出對安普霉素敏感的菌落,相應(yīng)的菌種被接種到含有10ml TSB培養(yǎng)基的50ml的燒瓶中,于30℃,250rpm條件下培養(yǎng)4天。從每個(gè)培養(yǎng)物中提取相應(yīng)的菌株的基因組DNA,并使用寡核苷酸O/Agvar01bF和O/Agvar06r做PCR分析。制備得到一種大小跟刪除了的actA基因一樣的PCR產(chǎn)物。于此同時(shí),對發(fā)酵液做HPLC分析,證明前述樣品確實(shí)不能產(chǎn)生阿肽加定多肽。
實(shí)施例4-異源表達(dá) 本實(shí)施例公開了在一個(gè)非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞S.lividans中表達(dá)SEQ ID NO100成簇基因中的阿肽加定的方法。這種類型的宿主細(xì)胞提供了另一種表達(dá)這兩個(gè)多肽有活性的變體的方法。
粘粒CosAG14和CosAL02包含了生產(chǎn)阿肽加定和脫氧阿肽加定B(deoxy-actaggardine B)相關(guān)的生物合成成簇基因,但不含有一個(gè)用于異源宿主結(jié)合轉(zhuǎn)染的起始位點(diǎn)(oriT)。使用Redirect技術(shù)(見Gust等人2002年的報(bào)道),可以將oriT和噬菌體附著位點(diǎn)attP和整合酶(int)導(dǎo)入到CosAG14和CosAL02中的SuperCos1骨架序列中,替換其新霉素抗性基因neo。
構(gòu)建用于異源表達(dá)的載體 粘粒pMJCOS1(由JIC,Norwich提供)是SuperCos1(Stratagene)的一個(gè)衍生物,其中SuperCos1原有的編碼新霉素抗性基因被一個(gè)包含了編碼oriT,attP,整合酶(int)和安普霉素抗性基因(aac(3)IV)的表達(dá)盒(Heapra)所替換。Heapra表達(dá)盒可使用SspI酶切pMJCOS1并使用瓊脂糖凝膠回收DNA分離得到。根據(jù)Gust et al 2004年描述的Redirect的步驟,利用這個(gè)表達(dá)盒與CosAG14和CosAL02分別構(gòu)建出粘粒CosAG14Heapra和CosAL02Heapra。
粘粒CosAG14Heapra隨后通過接合的方式導(dǎo)入到菌株S.lividans。并分離出菌株S.lividans/CosAG14Heapra的安普霉素抗性接合后體。從中挑取了3個(gè)接合后體接種到TSB種子培養(yǎng)基上培養(yǎng)。同時(shí)培養(yǎng)S.lividans,A.garbadinenis,利古里亞游動(dòng)放線菌以作為平行組對照。經(jīng)48小時(shí)培養(yǎng)后,將種子培養(yǎng)基培養(yǎng)物接種到4種不同的生產(chǎn)培養(yǎng)基中,分別是AAS1,GM1,GM3和TSB。將這些培養(yǎng)物于30℃培養(yǎng)9天,并從燒瓶中分裝出其中第5,7和9天的培養(yǎng)物各1.5ml用于后續(xù)實(shí)驗(yàn)。分裝的樣品于14000rpm離心(IEC micromax benchtop離心機(jī))10分鐘,隨后將上清轉(zhuǎn)入新管,將未稀釋的原液用于生物鑒定和HPLC-MS分析。
抑菌圈(暈圈)實(shí)驗(yàn)可以指示出生物活性的化合物存在,抑菌圈可以在所有用含有粘粒CosAG14Heapra的S.lividans(S.lividans/CosAG14HEapra)上清液上樣的孔中觀察到,但是沒有在使用TSB培養(yǎng)基培養(yǎng)的發(fā)酵液上清的上樣的孔中觀察到。S.lividans生長的所有4種培養(yǎng)基的發(fā)酵液上清加入上樣孔后,也沒有觀察到孔周圍有顯示生物活性的暈圈出現(xiàn)。同時(shí)A.liguriae和A.garbadinensis生長的所有培養(yǎng)基的發(fā)酵液上清加入上樣孔后可觀察到暈圈的出現(xiàn)。所有從5天到9天的取樣點(diǎn)都產(chǎn)生了暈圈,同時(shí)也觀察到相應(yīng)暈圈直徑上有明顯縮小的現(xiàn)象。
使用HPLC-MS對S.lividans/CosAG14Heapra的發(fā)酵液上清進(jìn)行分析,證實(shí)了其峰值的保留時(shí)間和分子量與0位丙氨酰阿肽加定(ala(0)actagardine)一致。僅在S.lividans的發(fā)酵上清液中沒有檢測到這些峰。表3總結(jié)了對S.lividans,S.lividans/CosAG14Heapra,產(chǎn)加爾巴丁游動(dòng)放線菌和A.liguriae培養(yǎng)了五天后的發(fā)酵液上清的HPLC-MS分析。
表3 樣品 發(fā) 酵 產(chǎn)物濃 保 留 分 子 檢測到的多肽化合物培 養(yǎng) 度 時(shí)間離子基 (μg/ml) (min) (m/z) S.lividans/ GM1 83 6.75981 0 位 丙 氨 酰 阿 肽 加 定 CosAG14HEapra (Ala(0)Actagardine)(M+2H)+2 991 0 位 丙 氨 酰 阿 肽 加 定 ( Ala(0)Actagardine ) (M+H+Na)+2 S.lividans/ GM3 33 6.75981 0 位 丙 氨 酰 阿 肽 加 定 CosAG14HEapra (Ala(0)Actagardine)(M+2H)+2 991 0 位 丙 氨 酰 阿 肽 加 定 ( Ala(0)Actagardine ) (M+H+Na)+2 S.lividans GM1 未檢測 未 檢 未 檢 未檢測到到 測到測到 S.lividans GM3 未檢測 未 檢 未 檢 未檢測到到 測到測到 產(chǎn)加爾巴丁游動(dòng) GM1 58 6.9 945 阿肽加定(M+2H)+2 放線菌 產(chǎn)加爾巴丁游動(dòng) GM3 24 6.8 981 0 位 丙 氨 酰 阿 肽 加 定 放線菌(Ala(0)Actagardine)(M+2H)+2 991 0 位 丙 氨 酰 阿 肽 加 定 ( Ala(0)Actagardine ) (M+H+Na)+2 利古里亞游動(dòng)放 GM1 未檢測 7.06937 脫 氧 阿 肽 加 定 B 線菌 到 ( Deoxy-actagardine B ) (M+2H)+2 利古里亞游動(dòng)放 GM3 未檢測 7.06937 脫 氧 阿 肽 加 定 B 線菌 到 ( Deoxy-actagardineB ) (M+2H)+2 實(shí)施例5-抗菌活性 MIC值的測定 進(jìn)一步檢測了入選的上文公開的已生成的一些變體形式的一系列菌種的抗菌能力。這里使用Mueller-Hinton肉湯(MHB)的抗生素兩倍系列稀釋法檢測了針對除肺炎鏈球菌(Streptococcus pneumoniae)以外的所有菌種的最低抑菌濃度(MIC),該肉湯補(bǔ)充無水氯化鈣,其鈣的終濃度為400μg/ml。針對S.pneumoniae的最低抑菌濃度的MIC值使用腦心浸液(BHI)肉湯的抗生素兩倍系列稀釋法檢測得到,該肉湯補(bǔ)充無水氯化鈣,其鈣的終濃度為400μg/ml??股卦噭﹥?chǔ)液的制備和儲(chǔ)存均參照NCCLS標(biāo)準(zhǔn)M7-A6。
通過控制600nm的吸光率在0.2至0.3之間的標(biāo)準(zhǔn)來把活躍生長狀態(tài)的發(fā)酵液培養(yǎng)物密度稀釋到105至106CFU/ml之間,相當(dāng)于0.5麥?zhǔn)媳葷針?biāo)準(zhǔn)。然后將它們進(jìn)一步稀釋到與發(fā)酵液的濃度為1100,用于后續(xù)實(shí)驗(yàn)。在96孔微量滴定板(96-well microtitre plates)上進(jìn)行2次重復(fù)的測定,,總反應(yīng)體系為200μl(160μl肉湯,20μl抗生素,20μl接種菌液),其抗生素抗生素濃度范圍從64μg/ml至0.06μg/ml。96孔微量滴定板的第12個(gè)孔不含抗生素試劑。使用萬古霉素(Vancomycin)作為對照抗生素作質(zhì)量監(jiān)控。平板于37℃有氧搖動(dòng)培養(yǎng)18到20個(gè)小時(shí),以細(xì)菌無可見生長的最小藥物濃度作為MIC值。

實(shí)施例6-核磁共振分析 對阿肽加定和脫氧阿肽加定(Deoxy-actagardine)的核磁共振進(jìn)行分析 核磁共振光譜分析(COSY,TOCSY,HSQC和NOESY)從多肽產(chǎn)物角度證實(shí)了阿肽加定(產(chǎn)加爾巴丁游動(dòng)放線菌)和脫氧阿肽加定(deoxy-actagardine B)(利古里亞游動(dòng)放線菌)的測序結(jié)果。同時(shí),獲得了一個(gè)并不完全明確的所有氨基酸殘基配置的信息,它與圖4中所示結(jié)構(gòu)一致,并足以證明利古里亞游動(dòng)放線菌產(chǎn)生的脫氧脫氧阿肽加定B(deoxy-actagardine B)的15位和16位的氨基酸殘基分別為Leu和Val。
實(shí)施例7-衍生物的合成 本例合成了下列脫氧阿肽加定B(deoxy-actagardine B)的衍生物,其基團(tuán)Z和C末端的氨基化合物列表如下 化合物結(jié)構(gòu) 化合物 Z位C末端氨基化合物 I H
II H
IIIH
IV D-Ala H V L-Ile H VI L-Val H VIIL-Phe H VIII L-Lys H IX L-Tryp H 化合物I至XI的合成均按以下步驟進(jìn)行 通用步驟1制備化合物1至3 在脫氧阿肽加定B(deoxy-actagardine B)(20mg,1 1nmol)的溶液中,加入對應(yīng)的氨基化合物(11nmol)和溶解于干燥的二甲基甲酰胺(0.8ml)的二異丙基乙胺(7.2μl,70nmol)以及200μl溶解于干燥的二甲基甲酰胺(1.0ml)的六氟磷酸苯并三唑-1-基-氧-三-吡咯烷基-磷鹽(benzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate)(PyBop)(70mg,134nmol)。在反應(yīng)的過程中使用HPLC來監(jiān)測混合物成分,并逐步加入Pybop溶液直到所有的起始反應(yīng)物被消耗完全。在這個(gè)階段,HPLC分析顯示其中的二酰氨的量是變化的(5-20%)。反應(yīng)結(jié)束以后,使用pH為7含有30%乙腈的20mM Kpi磷酸緩沖液(10ml)來稀釋混合物。按照表4所描述的條件使用制備HPLC來純化單酰胺類物質(zhì)。適宜的收集管中的洗脫液并將其濃縮至其原體積的25%后使用一個(gè)預(yù)處理的C18 Bond Elut色譜柱(500mg)脫鹽處理。上樣后依次使用兩個(gè)柱體積的30%,40%,70%和90%的甲醇水溶液洗脫C18 Bond Elut色譜柱(500mg),蒸發(fā)其中合適的收集管的洗脫液以獲得白色固體形態(tài)的期望產(chǎn)物 化合物IDeoxy-Actagardine B N-[3-dimethylaminopropyl]monocarboxamide 根據(jù)通用步驟1通過3-(dimethylamino)propylamine與脫氧阿肽加定B(deoxy-actagardine B)偶合可獲得化合物I。其產(chǎn)量為18mg,產(chǎn)率為85%。[M+2H 2+]預(yù)計(jì)為979.0,實(shí)測為980.2。
化合物IIDeoxy-Actagardine B N-[1-(1-methyl-4-piperidinyl)piperazine]monocarboxamide 根據(jù)通用步驟1通過4-(piperidino)piperazine與脫氧阿肽加定B(deoxy-actagardine B)偶合可獲得化合物II。其產(chǎn)量為8mg,產(chǎn)率為37%。[M+2H 2+]預(yù)計(jì)為1019.5,實(shí)測為1020.0;[M+3H 3+]預(yù)計(jì)為680.0,實(shí)測為680.0。
化合物IIIDeoxy-Actagardine B[1-(3-dimethylaminopropyl)piperazine]monocarboxamide 根據(jù)通用步驟1通過1-(3-dimethylaminopropyl)piperazine與脫氧阿肽加定 B(deoxy-actagardine B)偶合可獲得化合物III。其產(chǎn)量為10mg,產(chǎn)率為46%。[M+2H 2+]預(yù)計(jì)為1013.5,實(shí)測為1014.0。
通用步驟2制備化合物4至9 Fmoc保護(hù)的氨基酸(34nmol)溶于干燥的二甲基甲酰胺溶液得到的溶液使用含有六氟磷酸苯并三唑-1-基-氧三-吡咯烷基-磷鹽(benzotriazole-1-yl-oxy-tris-pyrrolidino-phosphoniumhexafluorophosphate)(PyBop)(11.4mg,22nmol)和含有二異丙基乙胺(11μl,68nmol)的干燥二甲基甲酰胺(0.4ml)溶液處理。該混合物然后加入到含有脫氧阿肽加定 B(deoxy-Actagardine B)(2mg,11nmol)的干燥的二甲基甲酰胺溶液中(0.5ml)。在室溫下反應(yīng)1個(gè)小時(shí)后,使用HPLC(30-65%乙腈溶于20mM Kpi磷酸緩沖水溶液中,pH7)分析表明起始物質(zhì)均完全轉(zhuǎn)化。上述反應(yīng)混合物用40%甲醇水溶液(20ml)稀釋后,上樣至已經(jīng)依次使用兩個(gè)柱體積的100%的甲醇和水預(yù)處理過的C18 Bond Elut色譜柱中(500mg)。隨后依次用兩個(gè)柱體積的40%,50%,60%,70%,80%,90%和100%的甲醇水溶液進(jìn)行洗脫。收集管中的洗脫液使用HPLC分析后,將其中含有Fmoc保護(hù)的偶合產(chǎn)物蒸發(fā)干燥。殘余物溶解于二甲基甲酰胺(1ml)中,然后加入哌啶(50μl)以反應(yīng)去除Fmoc保護(hù)基團(tuán)。使用HPLC監(jiān)控反應(yīng)的進(jìn)程,當(dāng)起始物被完全消耗后,用30%甲醇水溶液(20ml)稀釋反應(yīng)后的溶液。按照上文中描述的方法將混合物使用C18 Bond Elutcartridge(500mg)洗脫,合適的收集管中的洗脫物在揮發(fā)干燥獲得產(chǎn)物后進(jìn)一步地按照表4中所述條件使用制備型HPLC純化。其中合適的收集管中的洗脫液濃縮至原體積的25%,然后上樣至C18 Bond Elut色譜柱(500mg)脫鹽,所述柱已經(jīng)依次使用兩個(gè)柱體積的30%,40%,70%和90%甲醇水溶液沖洗。最后蒸發(fā)其中合適的收集管的洗脫液以獲得白色固體形態(tài)的期望產(chǎn)物。
化合物IVD-0位丙氨酰脫氧阿肽加定 B(D-Ala(0)deoxy-actagardineB) 根據(jù)通用步驟2通過脫氧阿肽加定 B(deoxy-actagardine B)與Fmoc-D-alanine偶合可獲得化合物IV,其產(chǎn)率為74%。[M+2H 2+]預(yù)計(jì)為972.5,實(shí)測為973.0。
化合物VL-lle(0)deoxy-actagardine B 根據(jù)通用步驟2,通過脫氧阿肽加定 B(deoxy-actagardine B)與Fmoc-L-isoleucine偶合可獲得化合物V,產(chǎn)率為27%。[M+2H 2+]預(yù)計(jì)為993.5,實(shí)測為993.8。
化合物VIL-Val(0)deoxyactagardine B 根據(jù)通用步驟2,通過脫氧阿肽加定 B(deoxy-actagardine B)與Fmoc-L-valine偶合,可獲得化合物VI,其產(chǎn)率為55%。[M+2H 2+]預(yù)計(jì)為986.5,實(shí)測985.9。
化合物VIIL-Phe(0)deoxyactagardine B 根據(jù)通用步驟2,通過脫氧阿肽加定 B(deoxy-actagardine B)與Fmoc-L-phenylalanine偶合,可獲得化合物VII,其產(chǎn)率為22%。[M+2H 2+]預(yù)計(jì)為1010.5,實(shí)測為1010.9。
化合物VIIIL-Lys(0)deoxyactagardine B 根據(jù)通用步驟2,通過脫氧阿肽加定 B(deoxy-actagardine B)與Bis(Fmoc)-L-lysine偶合,可獲得化合物VIII,其產(chǎn)率為45%。[M+2H 2+]預(yù)計(jì)為1001.0,實(shí)測為1001.6。
化合物IXL-Tryp(0)deoxyactagardine B 根據(jù)通用步驟2,通過脫氧阿肽加定 B(deoxy-actagardine B)與Fmoc-L-tryptophan偶合,可獲得化合物IX,其產(chǎn)率為55%。[M+2H 2+]預(yù)計(jì)為1030.0,實(shí)測為1029.9。
實(shí)施例8—進(jìn)一步的抗菌數(shù)據(jù) MIC測定 葡萄球菌(Staphylococcus),鏈球菌(Streptococcus),腸球菌(Enterococcus spp) 最低抑菌濃度(MICs)的檢定和抗菌試劑原液的配制和儲(chǔ)存均是按照NCCLS參考所描述的需氧菌微量肉湯稀釋法進(jìn)行的(M7-A6,2003)。MIC是在Mueller-Hinton發(fā)酵液(MHB)或腦心浸液(BHI)肉湯(S.pneumoniae)中對抗生素使用兩倍系列稀釋法測出的。處于活躍生長狀態(tài)的肉湯培養(yǎng)物使用無菌肉湯或者直接菌落懸浮(S.pneumoniae)將其濁度調(diào)節(jié)至0.5麥?zhǔn)媳葷針?biāo)準(zhǔn)(McFarland 0.5 standard 1×108CFU/ml),然后在無菌肉湯中進(jìn)一步稀釋,至最終得到的接種物在無菌96孔微量滴定板中的濁度約5×105CFU/ml為止。用于接種。用Enterococcus faecalis ATCC29212作為對照菌并使用萬古霉素(Vancomycin)作為對照抗生素作質(zhì)量控制進(jìn)行2次重復(fù)的分析測定。平板于37℃有氧搖動(dòng)培養(yǎng)18到20個(gè)小時(shí),以細(xì)菌無可見生長的最小藥物濃度作為MIC值。
艱難梭菌(Clostridium difficile) 對C.difficile最低抑菌濃度(MICs)的檢定和抗菌試劑原液的配制和儲(chǔ)存均是參考NCCL所描述的厭氧菌瓊脂稀釋法進(jìn)行的(M11-A5,2001)??股氐膬杀断盗邢♂尫ㄖ兴孟♂屌囵B(yǎng)基為Wilkens-Chalgren瓊脂(WCA)。將測試菌從培養(yǎng)了48小時(shí)的Braziers(C.C.E.Y.)瓊脂上挑出,在Schaedler發(fā)酵液中進(jìn)行繼代培養(yǎng)至密度等于0.5麥?zhǔn)媳葷針?biāo)準(zhǔn)(McFarland0.5 standard)(1×108CFU/ml),然后將其接種于WCA瓊脂平板上培養(yǎng)至其密度為約105CFU/spot。使用Bacteroides fragilis ATCC 25285作為對照菌株并使用甲硝唑(Metronidazole)作為對照抗生素作質(zhì)量控制。所有的操作均以2次重復(fù)進(jìn)行,所有接觸空氣的操作于可短暫接觸氧氣的還原培養(yǎng)基中進(jìn)行。平板于37℃無氧培養(yǎng)48個(gè)小時(shí),以測試菌相對于無氧培養(yǎng)對照盤中細(xì)菌表現(xiàn)出顯著的生長停滯時(shí)的最小藥物濃度作為MIC值。
痤瘡丙酸桿菌(Propionibacterium acnes) 生長了3到7天的測試菌從含有呋喃唑酮(1-2g/ml)的Wilkens-Chalgren瓊脂(WCA)上挑出。P.aches的單克隆用直接菌落懸浮的方法接種至新鮮的Wilkens-Chalgren肉湯(WCB)培養(yǎng)基中,并調(diào)節(jié)密度到0.5麥?zhǔn)媳葷針?biāo)準(zhǔn)(McFarland 0.5 standard 1×108CFU/ml),然后在無菌WCB肉湯中進(jìn)一步稀釋,至無菌96孔微量滴定板中的最終接種物的密度為約5×105CFU/ml為止??股氐膬杀断盗邢♂尫ㄖ兴孟♂屢簽闊o菌水,并根據(jù)NCCLS(M11-A5,2001)標(biāo)準(zhǔn)制備和儲(chǔ)存原液。
分析均以2次重復(fù)進(jìn)行并使用萬古霉素(Vancomycin)和克林霉素(Clindamycin)作為對照抗生素作質(zhì)量控制。平板于37℃無氧培養(yǎng)48—72個(gè)小時(shí),以測試菌相對于無氧培養(yǎng)對照盤中細(xì)菌表現(xiàn)出顯著的生長停滯時(shí)的最小藥物濃度作為MIC值。所有的操作均以2次重復(fù)進(jìn)行,所有接觸空氣的操作于可短暫接觸氧氣的還原培養(yǎng)基中進(jìn)行。
這里所用培養(yǎng)基所含鈣離子濃度(以氯化鈣的形式)均為50ug/ml,如使用了更高濃度的鈣離子將會(huì)特別指出。各物種中MIC值在下列的表格中列出,單位為μg/ml 表6針對Enterococci,Streptococci和Staphylococci的MIC值 0位丙氨酰脫氧阿肽加定B 脫氧阿肽加定B 菌株(Ala(O)-deoxyactagardine-B) (Deoxyactagardine-B) M.luteus 4698+200μg/ml Ca2+ 4 8 E.faecalis 29212 16 16 E.faecalis 29212+200μg/ml Ca2+4 8 E.faecalis 29212+400μg/ml Ca2+ 4 E.faecium 7131121(VRE) >64>64 E.faecium 7131121(VRE)+200μg/ml Ca2+ >64>64 E.faecium 7131121(VRE)+400μg/ml Ca2+ 32 E.faecium 19579 >64>64 E.faecium 19579+200μg/ml Ca2+>64 >64 E.faecium 19579+400μg/ml Ca2+16 S.aureus R33(MRSA) 32 320位丙氨酰脫氧阿肽加定B脫氧阿肽加定B 菌株 (Ala(O)-deoxyactagardine-B) (Deoxyactagardine-B) S.aureus R33(MRSA)+200μg/ml Ca2+16 8 S.aureus R33(MRSA)+400μg/ml Ca2+ 16 S.aureus SH100016 16 S.aureus SH1000+200μg/ml Ca2+ 8 8 S.aureus SH1000+400μg/ml Ca2+ 16 S.epidermidis 1104716 32 S.epidermidis 11047+200μg/ml Ca2+ 8 16 S.epidermidis 11047+400μg/ml Ca2+ 16 S.pnuemoniae R616 16 S.pnuemoniae R6+200μg/ml Ca2+ 32 6 S.pnuemoniae R6+400μg/ml Ca2+ 4 S.aureus 12232 MRSA16 S.aureus R36(MRSA) 16 S.aureus R34(MRSA) 16 S.aureus R39(MRSA) >32 S.aureus R40(MRSA) >32 S.aureus W71(MRSA) >32 S.aureus W74(MRSA) >32 S.aureus W96(MRSA) >32 S.aureus W97(MRSA) >32 S.aureus W98(MRSA) >32 S.aureus W99(MRSA) >32 S.epidermidis 7755298(MRSE)>32 S.epidermidis 7865688(MRSE)>32 S.epidermidis 7753921(MRSE)>32 S.epidermidis GRL05011(MRSE) >32 表7針對梭鏈孢酸(fusidic acid)耐受型金黃色葡萄球菌(Staphylococcus aureus)的MIC值 脫氧阿肽加定B 菌株 (Deoxy-Actagardine B) Fusidic acid-res S.aureus 8325-4 8,8 Fusidic acid-res S.aureus CS1116 32,32 Fusidic acid-res S.aureus CS957 32,32 Fusidic acid-res S.aureus CS767 32,32 Fusidic acid-res S.aureus CS858 32,32 Fusidic acid-res S.aureus CS741 32,32 Fusidic acid-res S.aureus CS1145 16,16 Fusidic acid-res S.aureus CS872 16,16 Fusidic acid-res S.aureus CS866 32,32 Fusidic acid-res S.aureus CS607 64,64 Fusidic acid-res S.aureus CS22 16,16 Fusidic acid-res S.aureus 8325-4+200μg/ml Ca2+ 4,4 Fusidic acid-res S.aureus CS1116+200μg/ml Ca2+ 16,16 Fusidic acid-res S.aureus CS957+200μg/ml Ca2+16,16 Fusidic acid-res S.aureus CS767+200μg/ml Ca2+16,16 Fusidic acid-res S.aureus CS858+200μg/ml Ca2+16,16 Fusidic acid-res S.aureus CS741+200μg/ml Ca2+16,16 Fusidic acid-res S.aureus CS1145+200μg/ml Ca2+ 8,8 Fusidic acid-res S.aureus CS872+200μg/ml Ca2+8,8 Fusidic acid-res S.aureus CS866200μg/ml Ca2+ 8,8 Fusidic acid-res S.aureus CS607+200μg/ml Ca2+32,32 Fusidic acid-res S.aureus CS22+200μg/ml Ca2+ 4,4 表8針對莫匹羅星耐受型金黃色葡萄球菌(Staphylococcus.Aureus)的MIC值脫氧阿肽加定B 菌株 (Deoxy-actagardine B) 8325-4 8,8 GISA-2 8,8 LZ616,16 LZ816,16 LZ916,16 LZ10 8,8 4204,4 1205 16,16 1120 16,16 1454 16,16 10868,8 表9針對痤瘡丙酸桿菌(Propionibacterium acnes)的MIC值脫氧阿肽加定B 菌株(Deoxy-Actagardine B) Propionibacterium acnes P37(lab strain) 4,4 P.acnes AT1 4,4 P.acnes AT262,2 P.acnes 101897d 2,2 P.acnes PF284(tet res) 2,2 P.acnes PF286(erythro & clin res)2,2 P.acnes PF289(clin和co-trimazole res)4,8 表10針對C.difficile的MIC值 0位丙氨酰脫氧阿肽加定B 脫氧阿肽加定B 菌株 (Ala(O)-deoxyactagardine-B)(Deoxyactagardine-B) C.difficile 377794 4 C.difficile 191262 4 MIC5010 C.difficile strains 2 MIC9010 C.difficilestrains 4 表11抗C.difficile的MIC值 菌株 IIIIIIIVVVIVIIVIIIIX C.difficile 37779>8 4 48 1 4 1 C.difficile 19126>8 4 48 2 4 2 MIC50 C.difficle 2 2 2 MIC90 C.difficile 4 4 2 材料與方法 在實(shí)施例2到7中所使用的材料與方法如下 培養(yǎng)基 所有的緩沖液,溶液和培養(yǎng)基均使用反滲透(RO)水配制,并且每升溶液含有如下組分 AAS1 ABB13 可溶性淀粉10g Soytone peptone 5g 葡萄糖10g 可溶性淀粉 5g 蛋白胨5g CaCO33g 玉米漿干粉1g MOPS 2.1g 酵母抽提物2g 瓊脂 20g 調(diào)節(jié)pH至6.0 調(diào)節(jié)pH至7.0 GM1 BHI Lablemco meat 4g 腦心浸液 37gextract 蛋白胨4g NaCl 2.5gGM3 酵母抽提物1g Arkasoy soyflour 20g 大豆粉10g 甘露醇 20g 葡萄糖25g 調(diào)節(jié)pH至7.0 CaCO3 5g 調(diào)節(jié)pH至7.6 LA luria瓊脂40g Mueller Hinton Mueller Hinton 21g LB發(fā)酵液 如為瓊脂板使用Luria發(fā)酵液 25g 瓊脂 10g SFM SV2 大豆粉20g 葡萄糖 15g D-甘露醇 20g 甘油 15g 瓊脂 16g 蛋白胨 15g NaCl 3g CaCO31g 調(diào)節(jié)pH至7.0 TAE bufferTSB Tris 48.44 胰蛋白酶大豆發(fā)酵 30g g 液 EDTA 3.72g 調(diào)節(jié)pH至7.0 調(diào)節(jié)pH至8.3 2TY ‘65’ 胰蛋白胨 16g 葡萄糖 4g 酵母抽提物 10g 酵母抽提物 4g NaCl 5g麥芽抽提物 10g 調(diào)節(jié)pH至 CaCO3 2g6.5-7.0瓊脂 12g調(diào)節(jié)pH至7.2 生物測定 將藤黃微球菌(Micrococcus luteus)從冷凍原液中接種到10ml的Mueller-Hinton發(fā)酵液中于30℃,200rpm搖動(dòng)的條件下培養(yǎng)過夜。再將1ml該培養(yǎng)物接種到300ml的Mueller-Hinton瓊脂中,隨后將瓊脂鋪于培養(yǎng)皿中。使用打孔器在上面等距離的鉆出直徑6mm的上樣孔,并在其中加入50μl相應(yīng)樣品。將生物測定板置于空氣層流室中直到加入的樣品擴(kuò)散,隨后將這些檢測板轉(zhuǎn)移到30℃的培養(yǎng)箱中培養(yǎng)過夜。
限制性內(nèi)切酶消化 用限制性內(nèi)切酶消化DNA的反應(yīng)是在生產(chǎn)商提供的緩沖液中并按照 使用手冊來進(jìn)行的。一個(gè)典型的反應(yīng)中,為了制備DNA所進(jìn)行的消化反應(yīng),5μg DNA需要使用12單位的酶在推薦溫度下消化3小時(shí)。為了分析DNA所進(jìn)行的消化反應(yīng),再使用2單位的酶在推薦溫度下消化0.5μg DNA2到3個(gè)小時(shí)。然后進(jìn)行瓊脂糖凝膠電泳分析消化后的DNA。
接合后體的繼代培養(yǎng) 將含有接合后體的瓊脂栓塞接種到裝有8ml TSB培養(yǎng)基和兩個(gè)玻璃珠的50ml燒瓶中。在30℃,250rpm搖動(dòng)的條件下培養(yǎng)10天后將100μl菌液接種到裝有10ml TSB培養(yǎng)基和兩個(gè)玻璃珠的50ml燒瓶中。在燒瓶中培養(yǎng)兩天后將1ml菌液接種到一個(gè)裝有10ml TSB培養(yǎng)基的50ml燒瓶中。在30℃,250rpm搖動(dòng)下,每輪2天的條件下連續(xù)進(jìn)行6輪連續(xù)的培養(yǎng)。將第六輪繼代培養(yǎng)后的細(xì)胞于4000rpm離心(Heraeus Sepatech Megafuge)20分鐘得到細(xì)胞沉淀。隨后在TSB培養(yǎng)基中對這些細(xì)胞進(jìn)行超聲(MSE SanyoSoniprep 150,amplitude 10-15 microns)來破壞菌絲體。將這些超聲處理過的細(xì)胞進(jìn)行一系列稀釋(用TSB進(jìn)行10-1至10-5的稀釋)后涂布于65號培養(yǎng)基并于30℃培養(yǎng)。
異源表達(dá)發(fā)酵 將瓊脂栓塞或者250μl-80℃甘油原液接種到裝有2個(gè)玻璃珠,以及含有萘啶酸和合適的選擇性抗生素的8ml TSB或AAS1培養(yǎng)基的50ml錐形瓶中。在30℃,200rpm搖動(dòng)的條件下培養(yǎng)2到4天后,將1.2ml(3%)的種子培養(yǎng)物接種到裝有40ml相應(yīng)產(chǎn)物培養(yǎng)基和2個(gè)玻璃珠的250ml錐形瓶中。在30℃,200rpm搖動(dòng)的條件下培養(yǎng)9天,在培養(yǎng)的過程中,每隔一段時(shí)間從每個(gè)發(fā)酵液中取出1.5ml的完整發(fā)酵液用于生物測定和/或HPLC-MS分析。
用于分離脫氧阿肽加定B(deoxy-actagardine B)的利古里亞游動(dòng)放線菌的發(fā)酵 將500ul(1%)取自甘油原液的利古里亞游動(dòng)放線菌細(xì)腦接種到裝有2個(gè)玻璃珠和50ml SV2培養(yǎng)基的250ml錐形瓶中。經(jīng)過在30℃,250rpm搖動(dòng)的條件下4天的培養(yǎng)后,將12ml(3%)種子培養(yǎng)物接種到裝有400ml GM3培養(yǎng)基的2L錐形瓶中。將這些菌液在30℃,225rpm搖動(dòng)的條件下培養(yǎng)9天。以4000rpm(Heraeus Sepatech Megafuge)離心30分鐘收集發(fā)酵液中的細(xì)胞,并棄掉上清液。
用于分離阿肽加定和0位丙氨酰阿肽加定(Ala(0)-actagardine)的產(chǎn)加爾巴丁游動(dòng)放線菌的發(fā)酵 將500μl(1%)取自甘油原液的A.garbadinensis細(xì)胞接種到裝有2個(gè)玻璃珠和50ml AAS培養(yǎng)基的250ml錐形瓶中。經(jīng)過在30℃,250rpm的條件下培養(yǎng)9天后,將12ml(3%)種子培養(yǎng)物接種到裝有400ml AAS培養(yǎng)基的2L錐形瓶中。將這些菌液在30℃,200rpm的條件下培養(yǎng)8天。以4000rpm(Heraeus Sepatech Megafuge)離心30分鐘收集發(fā)酵液中的細(xì)胞,并棄掉上清液。
為MIC分析分離脫氧阿肽加定B(deoxy-actagardine B) 將Diaion HP-20樹脂(50g/L)加入到從A.liguriae發(fā)酵產(chǎn)物中分離出的上清液中,并混合,于4℃過夜放置。將懸液等分分裝到Bond Elut色譜柱(60ml),然后依次使用4倍柱床體積的水和3倍柱床體積的25%,50%,75%和100%甲醇清洗樹脂。HPLC分析確定脫氧阿肽加定(Deoxy-actagardine)存在于50%,75%和100%甲醇的洗脫組分中。合并這些組分并將其體積濃縮至起始體積的四分之一左右。將這些來自于1L發(fā)酵產(chǎn)物的濃縮液上樣至兩個(gè)預(yù)先已經(jīng)用2個(gè)柱體積100%甲醇和2個(gè)柱體積的水依次清洗處理過的C18 Bond Elut色譜柱(5g)上。依次用2個(gè)柱體積的50%,60%,70%,80%,90%和100%的甲醇洗脫的色譜柱。HPLC分析確認(rèn)在80%,90%和100%甲醇的洗脫液中存在脫氧阿肽加定(deoxy-actagardine),將這些組分合并并將體積濃縮至起始體積的三分之一左右。將相同體積pH值為2.5的含有40mM磷酸鉀的50%甲醇溶液加入到濃縮液中,然后將得到的濃縮液平均上樣至三個(gè)經(jīng)過預(yù)平衡的SCXBond Elut色譜柱(1g)中。該柱先用pH值為2.5的含有40mM磷酸鉀的50%甲醇溶液清洗,然后用1.5個(gè)柱體積的pH值為7的含有250mM磷酸鉀的50%甲醇溶液進(jìn)行洗脫。再將洗脫液上樣至一個(gè)預(yù)先依次使用2個(gè)柱體積的甲醇和水處理過的C18 Bond Elut色譜柱(5g)中進(jìn)行脫鹽,該柱依次用2個(gè)柱體積的50%和60%甲醇清洗。然后通過依次加入2個(gè)柱體積的50%,60%,70%,80%,90%和100%的甲醇洗脫脫氧阿肽加定B(deoxy-actagardine B)。使用HPLC分析和LC-MS來確定含有純化后的脫氧阿肽加定B(deoxy-actagardine B)的收集管。將這些收集管中洗脫液合并并蒸發(fā)干燥。
從A.liguriae發(fā)酵液中分離0位丙氨酰阿肽加定B(Ala(0)-Deoxyactagardine B) 將Diaion HP-20樹脂(50g/L)與從4升A.liguriae發(fā)酵產(chǎn)物中分離出來的上清液混合,于4℃過夜放置。將懸液收集到一個(gè)燒結(jié)玻璃漏斗中,依次用4個(gè)柱床體積的水和4個(gè)柱床體積的50%甲醇清洗樹脂。使用5個(gè)柱床體積的100%甲醇將脫氧阿肽加定B(Deoxy-actagardine B)和0位丙氨酰脫氧阿肽加定B(Ala(0)-deoxyactagardine B)洗脫下來。將100%甲醇的洗脫組分濃縮到起始體積的三分之一,然后加入水將甲醇濃度稀釋至60%。首先用兩個(gè)柱體積的50%甲醇清洗4個(gè)10g C18 Bond Elut色譜柱,將上步獲得的溶液上樣到這4個(gè)色譜柱中。使用2個(gè)柱體積的甲醇/0.5%甲酸溶液將脫氧阿肽加定B(deoxy-actagardine B)相關(guān)組分洗脫。所獲得的洗脫液通過蒸發(fā)濃縮至40ml,隨后按照下表所述條件使用制備HPLC分離其中的0位丙氨酰脫氧阿肽加定B(Ala(0)-deoxy-actagardine B)與脫氧阿肽加定B(Deoxy-actagardine B)。
按照上文中描述的方法將相應(yīng)含有阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine)(通過使用HPLC和LC-MS分析來確定)的收集管中的洗脫組分使用C18 Bond Elut色譜柱進(jìn)行脫鹽,然后離心干燥。
0位丙氨酰脫氧阿肽加定B(Ala(0)-deoxy-actagardine B)從色譜柱洗脫的保留時(shí)間為5.04分鐘,利用MS分析確認(rèn)的特征為972.2 m/z (M+2H)+2。
為MIC分析分離阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine) 按照上述從利古里亞游動(dòng)放線菌中純化脫氧阿肽加定B(deoxy-actagardine B)的方法來純化阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine),其區(qū)別在于純化Actagardine和Ala(O)-actagardine的時(shí)候,在使用SCX Bond Elut色譜柱后,使用制備HPLC來洗脫分離。將從SCX Bond Elut色譜柱上洗脫下的洗脫液通過旋轉(zhuǎn)蒸發(fā)從70ml濃縮至18ml,隨后按照表4中所描述的條件采用制備HPLC純化該濃縮物。按照上文中描述的方法將相應(yīng)含有阿肽加定和0位丙氨酰阿肽加定(Ala(O)-actagardine)(通過使用HPLC和LC-MS分析來確定)的收集管中的洗脫組分使用C18 Bond Elut色譜柱進(jìn)行脫鹽,然后離心干燥。
表4分離阿肽加定和0位丙氨酰阿肽加定(Ala(0)actagardine)所用制備型HPLC的操作條件 瓊脂糖凝膠電泳 DNA電泳是根據(jù)Sambrook等人1989年發(fā)表的工作中描述的方法進(jìn)行的。使用TAE緩沖液配制瓊脂糖凝膠(濃度為0.7—1%),為了可以使用紫外光照射來檢測DNA的存在,在配制凝膠的過程中加入終濃度為0.1μg/ml的溴乙啶。樣品與0.1體積的10倍工作濃度的瓊脂糖凝膠上樣溶液混合,然后加樣至凝膠中并且在旁邊的的加樣孔中加入100bp,1kb或者是lambda DNA-HindIII的分子量標(biāo)記,在1—5V/cm的電場中進(jìn)行電泳。在波長為300nm的紫外光下檢測凝膠并采用UVP成像系統(tǒng)紀(jì)錄結(jié)果。
從瓊脂糖凝膠中回收DNA 將含有DNA的小塊凝膠從整塊瓊脂糖凝膠中切下,然后使用Qiaquick凝膠回收試劑盒(Qiagen)進(jìn)行回收,最后將DNA洗脫到滅菌的反滲透純水或Tris-HCl(10mM,pH8.5)或TE緩沖液中。
末端補(bǔ)平 使用大腸桿菌E.coli DNA聚合酶的Klenow片斷將限制性內(nèi)切酶消化DNA生成的3’粘性末端補(bǔ)平。在一個(gè)典型的反應(yīng)中,每μg DNA需加入1個(gè)單位的酶和250μM的各種dNTP。反應(yīng)在25℃下進(jìn)行15到30分鐘,隨后加入終濃度為10mM的EDTA終止反應(yīng)。
DNA磷酸化 根據(jù)Sambrook等人1989年發(fā)表的工作中描述的方法,用T4多核酸激酶在37℃處理PCR產(chǎn)物30分鐘。隨后用65℃處理20分鐘使酶失活。
線性化載體的脫磷酸反應(yīng) 為了避免線性化載體的自連,根據(jù)操作手冊使用蝦類的堿性磷酸酶(SAP)來除去5’的磷酸鹽基團(tuán)。在一個(gè)典型的反應(yīng)中,在DNA限制性內(nèi)切反應(yīng)的最后一個(gè)小時(shí)將1個(gè)單位的SAP加入反應(yīng)混合物中。反應(yīng)結(jié)束后將反應(yīng)混合物在65℃處理20分鐘使酶失活。
DNA連接反應(yīng) 根據(jù)Sambrook等人1989年發(fā)表的工作中描述的方法進(jìn)行DNA連接反應(yīng),在總體積為15ul的體系中加入1個(gè)單位的T4 DNA連接酶,在16℃反應(yīng)12—16小時(shí)。
細(xì)菌培養(yǎng)物的保存 取0.5ml相應(yīng)的培養(yǎng)基在—80℃下冷凍,得到含有10%終濃度甘油的活細(xì)胞甘油懸液。產(chǎn)加爾巴丁游動(dòng)放線菌和利古里亞游動(dòng)放線菌的單菌落,可通過將50ul發(fā)酵液或者甘油菌涂布于65號培養(yǎng)基或ABB13培養(yǎng)基上生長培養(yǎng)獲得。
聚合酶鏈?zhǔn)椒磻?yīng) 聚合酶鏈?zhǔn)椒磻?yīng)(PCR)是在Stratagene Robocycler Gradient 96上進(jìn)行的。在一個(gè)典型的反應(yīng)中,將100—200ng模版DNA與20pmol各種寡聚核苷酸引物和濃度均為250mM的各種dNTP混合。在終體積為50ul或100ul的反應(yīng)體系中含有生產(chǎn)商提供的嗜熱DNA聚合酶緩沖液和10%(v/v)總體積的DMSO。在一個(gè)典型的反應(yīng)中,加入5個(gè)單位的嗜熱DNA聚合酶然后進(jìn)行變性1分鐘(94℃),Y℃(退火溫度)下進(jìn)行30秒—3分鐘延伸(72℃)的初始循環(huán)。接下來按照94℃ 1分鐘,Y℃(退火溫度)1分鐘,72℃延伸X分鐘的程序進(jìn)行30個(gè)循環(huán),最后進(jìn)行一個(gè)72℃延伸2X分鐘的終末循環(huán)。關(guān)于延伸時(shí)間X的選取,是按照使用Taq多聚酶每分鐘產(chǎn)生1kb產(chǎn)物和使用Pfu多聚酶每2分鐘產(chǎn)生1kb產(chǎn)物計(jì)算的。關(guān)于退火溫度Y的選取,在擴(kuò)增pAGvar1時(shí)是55℃而擴(kuò)增pAGvar2時(shí)是49℃。Redirect技術(shù)的實(shí)驗(yàn)步驟(Gust et al.,2004)中描述了擴(kuò)增SBdel-1和SBdel-2的條件。
引物 質(zhì)粒DNA的制備 小規(guī)模的制備質(zhì)粒(每次制備少于20ug)時(shí),從2YT(或LA)平板培養(yǎng)基上挑出單菌落接種于已滅菌并加入了合適抗生素的3ml 2YT或LB培養(yǎng)基中。將接種好的培養(yǎng)基于37℃,250rpm搖動(dòng)的條件下培養(yǎng)過夜(12到16小時(shí))。于12000xg離心1分鐘以收集細(xì)胞,隨后按照說明書,使用Wizard(Promega)Miniprep試劑盒制備質(zhì)粒DNA。在大規(guī)模,目的為100ug質(zhì)粒DNA進(jìn)行質(zhì)粒制備時(shí),則培養(yǎng)30ml 2YT培養(yǎng)基然后根據(jù)操作說明書使用Qiagen Midi-prep試劑盒制備質(zhì)粒。所有質(zhì)粒制備均以限制性內(nèi)切酶反應(yīng)分析和/或DNA測序來進(jìn)行確認(rèn)。
制備粘粒DNA 為了制備粘粒DNA,先從2YT(或LA)平板培養(yǎng)基上挑出單菌落接種于已滅菌并加入了合適抗生素的50ml 2YT或LB培養(yǎng)基中。將接種好的培養(yǎng)基于37℃,250rpm搖動(dòng)的條件下培養(yǎng)過夜(12到16小時(shí))。于4000rpm(Heraeus sepatech Megafuge 2.0R)離心分離20分鐘以收集細(xì)胞,隨后按照說明書,使用Qiagen Midi-prep試劑盒制備粘粒DNA。
電轉(zhuǎn)感受態(tài)大腸桿菌細(xì)胞(electrocompetent E.coli cells)的制備和轉(zhuǎn)化 根據(jù)Dower等人1998年發(fā)表的工作中描述的方法制備電轉(zhuǎn)感受態(tài)大腸桿菌細(xì)胞。將60μl分裝的感受態(tài)細(xì)胞于冰上解凍然后與1.8μl連接反應(yīng)混合物或質(zhì)粒DNA混合。將混合物注入電轉(zhuǎn)化杯(Sigma 0.1cm)然后將電轉(zhuǎn)杯放入電轉(zhuǎn)化儀(Stratagene electroporator-1000)中。按照電位差1.8kV/mm(25μF,200Ω)的條件進(jìn)行轉(zhuǎn)化并隨后加入0.5ml的2YT或LB培養(yǎng)基。與37℃培養(yǎng)45到60分鐘使抗生素抗性基因得以表達(dá)再將轉(zhuǎn)化后的細(xì)胞涂布于合適的選擇性培養(yǎng)基上。
制備基因組DNA 根據(jù)Kieser等人2000年發(fā)表的工作中描述的方法制備基因組DNA模版。
游動(dòng)放線菌(Actinoplanes sp.)的接合步驟 除了菌株E.coli ET12567/pUB307(Flett etal.,1997)被替換成菌株ET12567/pUB8002(Kieser et al.,2000)之外,大腸桿菌(E.coli)與游動(dòng)放線菌(Actinoplanes sp.)之間的屬間接合操作均是按照Heinzelmann等人2003年發(fā)表的工作中的描述進(jìn)行的。接合后體被轉(zhuǎn)移并涂布在含有相關(guān)的選擇性抗生素和50ug/ml萘啶酸的65號培養(yǎng)基或ABB13培養(yǎng)基上,面積為一塊大約1平方厘米的區(qū)域。這些平板于30℃培養(yǎng)4到7天,然后接種于肉湯培養(yǎng)基培養(yǎng) 鏈霉菌(Streptomyces sp.)的接合步驟 大腸桿菌(E.coli)與鏈霉菌(Streptomyces sp.)之間的屬間接合操作是按照Kieser等人2000年發(fā)表的工作中的描述進(jìn)行的。結(jié)合后體被轉(zhuǎn)移并涂布在含有50ug/ml萘啶酸和相關(guān)的選擇性抗生素的SFM培養(yǎng)基上,面積為一塊大約1平方厘米的區(qū)域。這些平板于30℃培養(yǎng)4到7天,然后接種于肉湯培養(yǎng)基培養(yǎng)。
表5菌株列表 抗生素 如果無特別說明,抗生素原液在水中配制,并將配制后的溶液通過0.22um微孔濾器(Millipore filter)進(jìn)行滅菌處理。用乙醇配制的溶液沒有經(jīng)過滅菌處理(Sambrook et al.,1989)。所有的抗生素儲(chǔ)存于—20℃。在使用安普霉素的培養(yǎng)基中,加入終濃度為10mM的MgCl2(原液濃度為2.5M)。
原液工作濃度 氨芐青霉素(amp) 100mg/ml 100μg/ml 安普霉素(apra) 100mg/ml 50μg/ml 羧芐青霉素(car) 100mg/ml 100μg/ml 氯霉素(cm) 25mg/ml溶于乙醇 25μg/ml 卡那霉素(kan) 50mg/ml 50μg/ml 萘啶酸(na) 25mg/ml 25μg/ml 表達(dá)盒

載體
高效液相色譜 HPLC分析使用的是Hewlett Packard 1050 series HPLC系統(tǒng),并且按照下列參數(shù)運(yùn)行 色譜柱 Zorbax SB-C18,4.6 x 150mm,5μ 流動(dòng)相A 30%乙腈溶解于20mM磷酸鉀緩沖液中pH7.0 流動(dòng)相B 65%乙腈溶解于20mM磷酸鉀緩沖液中pH7.0 流速 1ml/min 梯度時(shí)間0分鐘 100% A0% B 時(shí)間10分鐘0% A100% B 時(shí)間11分鐘0% A100% B 時(shí)間11.2分鐘 100% A0% B 循環(huán)時(shí)間15分鐘 注射體積10μl 檢測210nm 高效液相色譜—質(zhì)譜(HPLC-MS) HPLC-MC分析使用的是一臺Hewlett Packard 1050 series HPLC系統(tǒng)連接到一臺Micromass Platform LC(使用MassLynx version 3.5軟件)上,按照下列參數(shù)運(yùn)行 色譜柱Agilent Zorbax SB-C18 150×4.6mm 5μ 流速1ml/min 流動(dòng)相A 10%乙腈,0.1%甲酸,90%水。
B 90%乙腈,0.1%甲酸,90%水。
A到B的線性梯度時(shí)間大于10分鐘,保持1分鐘,B-A 波長200-400nm 注射體積10μl 柱后分流110 質(zhì)譜檢測儀Micromass Platform LC 模式正離子電噴霧(Electrospray positive) 氮?dú)饬魉?80l/hr 毛細(xì)管電壓40V 分離透鏡偏移5V
菌種保藏
按照布達(dá)佩斯條約,菌種NCIMB 41362于2005年12月7日存于NCIMB公司,地址是Aberdeen,AB21 9YA,Scotland,UK由NovacataBiosystems公司代理。
參考資料
Altena,K.,Guder,A.,Cramer,C.and Bierbaum,G.(2000).Biosynthesis of thelantibiotic mersacidinorganization of a type B lantibiotic gene cluster.AppliedEnvironmental Microbiology 66(6)2565-71.’
Ausubel,F(xiàn).M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.and Struhl,K.(2002).Current Protocols in Molecular Biology(5th edition).WileyInterscience Publishers.
Bierman,M.,Logan,R.,O′Brien,K.,Seno,E.T.,Nagaraja Rao,R.and Schoner,B.E.(1992).Plasmid cloning vectors for the conjugal transfer of DNA from Escherichia coli toStreptomyces spp.Gene 116(1)43-49.
Chatterjee,S.,Chatterjee,S.,Ganguli,B.N.,Chatterjee,D.K.,Jani,R.K.H.,Rupp,R.H.,F(xiàn)ehlhaber,H-W.,Kogler,H.,Siebert,G.and Teetz,V.(1992)Antibiotic,mersacidin,a process for the preparation thereof and the use thereof as a pharmaceutical.US Patent 5,112,806.
Dower,W.J.,Miller,J.F.and Ragsdale,C.W.(1988).High effiiciencytransformation of E.coliby high voltage electroporation.Nucleic Acids Research 16(13)6127-6145.
Flett,F(xiàn).,Mersinias,V.and Smith,C.P.(1997).High effiiciency intergeneric conjugaltransfer of plasmid DNA from Escherichia coli to methyl DNA-restricting Streptomycetes.FEMS Microbiology Letters 155(2)223-229.
Gravesen,A.,Kallipolitis,B.,
,K.,
,P.E.,Ramnath,M.and
,S.(2004)pbp2229-Mediated nisin resistance mechanism in Listeriamonocytogenes confers cross-protection to class IIa bacteriocins and affects virulence geneexpression.Applied and Environmental Microbiology 70(3)1669-1679.
Gust,B.,Challis,G.L.,F(xiàn)oWler,K.,Kieser,T.and Chater,K.F.(2003).PCR-targetedStreptomyces gene replacement identifies a protein domain needed for biosynthesis of thesesquiterpene soil odor geosmin.PNAS 100(4)1541-1546.
Gust,B.,Chandra,G.,Jakimowicz,D.,Yuqing,T.,Bruton,C.J.and Chater,K.F.(2004).λ Red-mediated genetic manipulation of antibiotic-producing Streptomyces.Advances in applied microbiology 54107-128.
Gust,B.,Chater,K.F.and Kieser,T.E.(2002).Methods and materials for targetedgene disruption in actinomycete bacteria.Patent Application WO 02/103010A1.
Heinzelmann,E.,Berger,S.,Puk,O.,Reichenstein,B.,Wohlleben,W.and Schwartz,D.(2002).A glutamate mutase is involved in the biosynthesis of the lipopeptide antibioticfriulimicin in Actinoplanes friuliensis.Antimicrobial Agents and Chemotherapy 47(2)447-457.
Kieser,T.,Bibb,M.J.,Buttner,M.J.,Chater,K.F.and HopWood,D.A.(2000).
Practical Streptomyces Genetics.Norwich,John Innes Foundation.
Sambrook,J.,F(xiàn)ritsch,E.F.and Maniatis,T.(1989).Molecular CloningA laboratory
manual.New York,Cold Spring Harbor Laboratory Press.
Vertesy,L.,Herbert,K.,Schiell,M.and Wink,J.(2000).lantibiotic related toactagardine,and processes for the preparation and use thereof.US Patent 6,022,851.
序列列表
SEQ ID NO1阿肽加定BSSGWVCTLTIECGTLVCAC
SEQ ID NO2阿肽加定B變體VVSSGWVCTLTIECGTVVCAC
SEQ ID NO3阿肽加定B變體LISSGWVCTLTIECGTLICAC
SEQ ID NO4阿肽加定SSGWVCTLTIECGTVICAC
SEQ ID NO5-SEQ ID NO10(Null)
SEQ ID NO11 Ala-阿肽加定BASSGWVCTLTIECGTLVCAC
SEQ ID NO12 Ala-阿肽加定B變體VVASSGWVCTLTIECGTVVCAC
SEQ ID NO13 Ala-阿肽加定B變體LIASSGWVCTLTIECGTLICAC
SEQ ID NO14 Ala-阿肽加定ASSGWVCTLTIECGTVICAC
SEQ ID NO15-SEQ ID NO21(Null)
SEQ ID NO22 pre-pro-阿肽加定B變體VVMSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWVCTLTIECGTVVCAC
SEQ ID NO23 pre-pro-阿肽加定B變體LIMSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWVCTLTIECGTLICAC
SEQ ID NO24-SEQ ID NO99(Null)
SEQ ID NO100 CosAG14(38168bp)
GATCGGCCGCCGTCAGCTGGAGAAGCGCTGGCTGGCGCGGCTCACCCGCAACGGCCACCCGCATCCGACCCGGGCGCT
GGCGCTGCGGATGGGCGCGGTGGAGTTCGCGGGGCAGCTGGCGCTGCAGCTCGCCGACATGCGCAAGCCCGGCACGCC
GTCAGCGACCTGACCCGCTGCTCGACGCAGCTCGCTCGCCGGTCCCGCGCCGCGCCGATCAACTCCGGCAGCACGGCG
CGAGCTTCAATCAGCCGGCCCGGCGCACCCCCTACGCCGGTGCGACGAGGCATGCCCGAGACCAGCGCGGCCGCAGAG
GGCCGGTCGGCGCCGGACCGGTCAGCGCGCCCGCAATCAGGCCGGCAGGCCCGCCCGGAGCCGGACCGGTCGGCGCGC
CCGCAATCAGGCCGACAGGCCCGCCCGGGGTCAGGCTGGTCGGCTGCGCCGGGCCGGCAGGCCGGCGAGCAGCGCGTC
GAGCGTCTCGGCATCCGCCCAGCCGTTGACTGACACTGCGCCTGCCGCCGTGACCGTGACCTCAAGGCGGTCCGGTGT
CACCGCCACGTCGATCGGCGCGTCCTCGATGCGGTCGCTCAAGCGGATGAACTGCTGGTTCGTCGAGCCGACCCAGGG
CCGCTCGTGGTCCAGCAGGTCCTGCCGGAAGGGGCCGGCCACCAGCAGGTCCGTGGCGTCGAGCAGTGCGGCGACGTC
GGCCCGGCCGTCCGCGGCGAGAGCGCGCAGACGGGCGTACTCGTAGCCGGTGAACGTCATGACCGAGCGACCCGCCTG
CCGCACCCCGGCGGCCACCGCGGCGAGACCGGCCGCCTGCTCGAACGGCTCGCCGCCGAGCAGGGTGACACCCGTGGT
GCCCGTGGCGAGCACTCGGTCCACCAACTCGGCGGGTGCGGCCGGCACCCCACCGCGTACGCCGAACAAATGCGGATT
GAAGCATCCGGCGCACCGGATGGTGCAACCCTGCACCCAGATCGCGGTCCGCTCGCCCGGTCCTTCGGCGGTGGTCCG
GTCGAGGAACCGGGCCACCCGCACGAGCGGCGGCTCAGACATCGACTATCCGACCGAAAGGCGTCTGGTTCGCTTGCG
GCGGCGGCTCGCACGACAGCCGGTCCCGGACCGCGACGAACTCGTGTGGTGCGAGCCCGGCCACGGCCGCGAACTCGC
CGAGACTGGCGAATCCGCCCCGCGCCTGCCGCGCCGCCACGACGTCCGCCACCCGCTGCGGGGTGAGACCGGGCACGG
CGGCCAACTGTTGCGCGTCCGCGGTGTTGACATCGAGCCGCTCGGGCGCCGGCTCCAGCAGCGAGCCCGGCACACCCC
CAGCCGGCGAGCCCAGCGCGGGCTCCAGCGGGCCGGGCGCGGGCCCAGCGGGCCAGGCCGCTGTGGGCTCAGCCTGCC
GGCCGGCTGCGGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCGCTGCCGGCTCAGCCTGCCAGCCCG
CTGCCGGCTCAGCGGGCCGGCCCGCCGCCGGCTCAGCCAGCGGGCCCCTCGCGGGCTCAGGCCCGGGAGTCCCTCCGT
AGAACTCTTGCGGCGAAGGAACGACACCCTGTAGTTGCGGCGGCAGCGGAGTCGCCACGGGAGCGGGCGCGTTCGCCC
ACGGCGCCTGCTGGGGCTGCGCATACCACGGCACGTGAGCGGCACGCCAGCGCAGCCAGGAGGCGTTGATGACGAACG
CGTGCGCGACGCTGATCGGCCACACCATGAACATGATCGAGAACGCGAGGTTCTGCTGGAGCGAGTCCTCGGCGCCCT
CACTGCCGAGAAAGAAGCAGAAGTTGGCCACGACGGTGTAGAGGATCCCGGCGATCCACCACACCGGCCGCCGGGCGC
GGATGCCGACGTAGAGGAACCCGACCGCGGAGAAACAGCTGAAGGGCACCATCGGCGCGATCACCCAGGCGCTGTGCG
CGAGGCGCCACGACAGCCGCGCCGGCCCGGTCCGCTTGCCCGGCTCGTGACCTGGATGCGGCGGATAGGACGGATACG
GCTGCTGGTGAGCAGGCGGGAACGGCGGCAGCGGCTGCTGACCGGAAGCAGGCGGGAACGGCGGCAGCGGCTGCTTGC
CGAACGACGGCGGGTACGCCGGCTGCGAGGCGGGATACGGGTCCTGGCCCGGGTTAGGCGGTGTCCACGTCACGGTTC
ACGATCCGTTCCCGCGCGGTGTGCGCCTGACGCGTGTAATCCGCGGTGTACGCACTGTGCCGCACCTGCCCGCCGACG
AGATCCTCCAGAACGGCCACGTAGTCCAGGCAGCGCTCGCCGAGAATGTCCACGGTCTCGGCACTGACCTGGCCGTCG
GGACCGACCGTGACGACGATCCGAGGATTCTCCGTCATGCCCGCTCCCTCTCCACCTCGAAGACCAGGCGCACACTGG
CGTCCTGGCCGACCGACTCCGACTCCAGCCGCAGCCCGGCCTCGGGCGCCTGCGCGCGCAGCCGCTCCAGGACGGCCT
GCTGGACCCGCCGCCCGTACGCGGTGTCGACGGTCGTCATCAACTCGACAGCCCCTGGCTGATCGACGCCGGTGACGT
GCGCGGCCCAGATGCCGTCCGCGCCGCGGGTGAACGTCGCGGCGCTCTGCGTCCAGGTCGCCGAGATCGTGTCGCCGG
CGGCCGTCACGGTGGCTCCGGTGTCGCGCAGCGCCGCATCGAGCAGGGTGACATCGCGCATGCGGGTCTGCACCTGGC
AGATCAGCCGGCCGTCGTCCATCCGGCCCGCGGCGGCCTGAACCGCGGCCGCGCCGGCCATCGCCAACGGCACCAGCA
GCAGTGAAACGCTCACCATGCCCCCCGTTCTCGCTGTGGCCACACCCTATCGGCAGGGTGCGACAAATCATCGGTTGG
TGAGGTCCCAGTCGTCGGTGCCGGTGGCCGACACGGCGCGATTGCGGGCCCAGCCGCGCAGGGCGTCGACCCGCTCGG
CCTGCGTCACGCTGAGCGGCACGATGCTCATCACCGCGCGTACGAGATCGTCGCGCCGCAGTGGGCGGCGTTCGGAGA
ACGCGTCGAACAGTCCCGCAATGACCGCCTGCTCTATCTCCGCGCCGGAGTAGCCCTCGGTCAGCCCGGCCAGCTCGG
TGAGCAGCTCGGCATCGACCCGCAGCTCGCCGGCGGCACGCCGGTGCCGCAGCGCCCGCCCGAGGTGCACCCGCCACA
CCGCGACCCGCTCGGACCGGCTCGGCAGATCCACGAAGAACGTCTCGTCGAAGCGTCCCTTGCGCAACAGCTCCGGCG
GCAGCCCGTCGAAGTCGTTGGCCGTCGCGATCACGAAGACCGGAGTCCGCTTCTCCTGCATCCAGGTGAGGAAGGTGC
CGAAGACCCGGGCACCGGTGCCGGAATCACCCCCGGTGCCGCCGGCGAAGCCCTTCTCGATCTCGTCGACCCACAGGA
CGCACGGGGCGACCGCCTCCGCCGTACGCAATGCGGTGCGCATGTTGTGCTCGCTGGAACCGACCAGGCCGGAGAAGA
CACGGCCGATGTCGAAGCGCAGCAGAGGCAGGTTCCAGGCGGTCGCGACCGCCTTGGCGGTCAGCGACTTGCCGCAGC
CCGGCACGCCGGTGATCAGTACGCCGCGCGGCGCGGGCAGGCCGTACCCGGCCGCCTCGTCCAGCCAGGATCCGTTGC
GTTTGACCAGCCAGGCCTTGAGGTTCTCCAGGCCGCCGACGTCGTCGAGCACGGTTCCGGCGGCCATGAACTCCAGCA
CGCCCGATTTGCGTACGGTCTGGCGCTTCTCCTCGTGCACGATCTCCAGGTCGGCCAGATCGAGCACGGCGTCGTTCA
CCATGGCCCGGGCGTACGCGTTCTCCGCCTCCTGCATGGTCAGGCCGGCCGCGGCCGTGACGAACCGCTCCCGGCTCT
GCTCGTCGAGCTCCACCCGCAGCCGCCCGGACGCGGTGTTCCCGCGCACCATGGCGTCGAGCAGAGCGCGCAACTCCA
GCTGGCCGGGCAGCGGGAAGTCGACGATCGTGACGTCCTTGCTCAGCTCGACCGGCAGGTCCAGTACCGGCGAGAGCA
GCACGAGTGTCCGCGGGCTGCGGCCGGCCCGGAACGCCTGGGCGATGTCGCGCACCAGCCGGACGACCTCCGGGCTCT
GCGCGAACAGCGGGTGCAGGTCGCGGAAGACGAAGACAGCCGGTTCGTCGATGCGCTGCACCGCCCTGAGCGCGTCGG
TGGCCCGCTGCGCGCCCGAGCGGGCCTCGCCGTTCGGCTGGACCAGACCGGCGGTCAGCGACCAGGTCCAGACGGCAC
GTGGCACGCGGACGAGGTCGGCGTCGCCGGCGATGCCGGCGAGGTGGTGCAGCGCCCGCTGCTCCTCGTACGTCTCGA
GGTGGAGCACCGGGAACCGGGCCTTCAACAGCTGCGCGAACGTCTCCGCGAACGACCTCTCCACCGGCGCATCCTACG
GCCGCGCCGGCCGGCGTGTCAGAGCCCGGACGGGGTGCCGGTGGCGTCGCGTGCCGTCCGGTCCTTCCCGCGCTCGAC
GGGTTCGTTGGGTTGATCGGTCATGGCATCCTCCTGCTCAGTCCGGGCGGTAGACGGCGGTGTCCCCGGACACGGCGC
CGGGGTCGTACCCCGAGCGGCCGGTTTCCTCCGTGGTGTCCTGCTCGTCAGCGCCGGCGCCTGTCGACTCGCCGGGTT
TGCGCAGTGACGCCGCGTATGCCGGGGTTCCGTCCGGCTCGTCCGTGGGATGCCGCTGGAGTTGTTCTCGGTCATCGG
TCATGAACGGCGGACTTCCCTGCAAGAGCGCGGACAAACGTGGTCGTTTATCCCGCAGCCGGGCGGGCAGTCGTCCAC
CATGGAACCCATCGGTGACCCTGACGAGCAGACCGGCGACTTCGCCGAAGAGCACGAACTGACCGAGGTGACAGCCGA
GGAGGACGACGACGGCGAGCCGGAGAGCCCGGATCGCTGGACCGGCGGCATGGACTCCGACGGTCCCCCGTGACCTGC
GGCTACGATCCCTCACAGGTGCCCGCCCCGCCGACGACCCGAGGTTCGTAGCCGTTGTCCTCCATCACCGAGCTGACC
GAGTCCGTGCGTGCCTTCGCGCGCGAGCGCAACTGGGAGCAGTTCCACACGCCGAAGAACCTCGCGATGGCCCTGGCC
GGCGAGGTCGGTGAGCTTCTGGCCGAGTTCCAGTGGCTGACGCCGGAACAATCAGCCGCGGTCATGCGCGATCCCGAT
CTCGGCCCGCGGGTCCGGGCCGAGATCGGAGACGTCACGATCTATCTCGTACGCCTGGCGGACGTGCTCGGCATCGAC
CTGGTCGAGGCGGCCACCGACAAGTTGGCGGAAGCCGGCCGCCGCTACACCGTCGAAGCCGCCCGCGACTCGGCCGCC
AAGATCGATCAGCTGTAGTTCAGCGAGAAGTTGTTGACCGTGAAGTTGGACTGACCGGCGGTGCCGCTGATCTCGAAG
CCGAACTGCGCCTCGCCGACCGTCACGTCACCCCACCAGCCGTTGGTGCGCAGCCAGTTCAGGATCGCCAGGATGTCG
ACGGTGCCGGAGTTCGTGTTGGTACGGATGAACGAGAAGACCGCGTTGGCGCCGTTCGACCCGCGGTAGACGTTCCAG
GTGTGCCCGCCGACGGACAGGTTGCGGACGTTCGGCACCGCGCCGTTGGCGTCGTACTGTTCGGCGATCGGCCCGACC
GCGCCCTGCTGGTTGGTCCAGATCATGACCTCGTAGGCGTGGTTGTTCGCCCAGATGTCGTAGGTCGTCGAGTAGTCG
CCGCTGGACGGCACCGACACGTTGAAGGAGCTCGTCAGAGAATTGAGCGAGCTCAGCGTACGGTTGAGGGTCTTTCCG
GTGTTGGGGTAGGACTTGACCCCGCTGGTGCGCGGGTGATTCGCGACGACGCCCCAGTTGGTGCCGCTGCGCGCCCAG
ATGGTCTGGGTGCCGGCGCCCGAGCCCCAGATGTTGTTGTGAGGATGTATCCGTTGTTGGTCCAGTTCGCCCACTGTC
CCGAGTCGACCCAGACGGCGTCGCTCGGTACGCCGTTGGTGGGCGGCTGCGAGCTCGGGCTGGTGGGGCCAGCCGATC
CGGTGCAGGCGGTCCCGTTGAGCGTGAACGTGCCCGGTGCCGGGGTGGCGGCGCCGGAGCCGTTGAATCCGAACGACA
CGGTCGCGTTGGTGCCGACGGATCCGTTGTAGCCGGCGTTGCGGGCGGTGACCTGCGATCCGCTCTGGGTCAGGCTGG
TGTTCCAGGCCTGGGTGACGGTCTGCCCGCCGGAGTAGGACCAGACCAACGTCCAGTTCGTGAGCGGATCACCCAGGT
TGGTGATGGTGACGTTGGCGCCGAAGCCGCCGGGCCACTGGCTGCTCACGGTGTAGGCGACGCGGCAGCCGGCCGCGG
CGGACGCCGGGAGCGCGGTGACGACGCCGGCACCGGCGATGAGGGCCGCCGAGGCGGCCAGGGAGAGCGCGAGAGTAC
GTCTGCGCATGCCGTTCCAATCTCGGAGGGGGAACACACGACGCTCGTCGAAGCGCTTCGATAATGAAGGCTGGGGAT
CTACGAGTGTCGATGCGGGATGAGGCCGATGTTACGACCCGCCGCCGCGGCGAGGCAACCGCTACCTTGGGCGCATGA
CGATCACCGAGACCGATCTCGCCCACCTGCGCCGATGCGTCGACCTGGCCCGCGAGGCCCTCGACGACGGCGACGAGC
CGTTCGGTTCCGTCCTGGTCTCCGCCGACGGCAAGGTGCTGTTCGAGGACCGCAACCGGGTGAGGCACGGCGACGCCA
CCCAGCACCCGGAGTTCGCGATCTCCCGCTGGGCGGCCGAGCACCTGACCCCGCGGGAGCGCGCCAGCGCGACGGTCT
ACACCTCGGGCGAGCACTGCCCGATGTGCTCAGCGAGCCACGGCTGGGTCCGCCTGGGCCGCATCGTGTACGCGGCGT
CGAGCGCCCAGCTGACCGCCTGGTACAAGGAGTGGGGAATCCCGGCGGGCCCGGTCGCCCCGCTACCGATCACCACAG
TGGTCCCCGGCGCCGTCGTGGAGGGCCCGGTCCCAGCCTTCGAGGCCGAGCTGCGGGAGCTACATCGCGCCCGCTTCA
CCCCAGCGCAGTAGCCGCCGGACGAAACCCGACCCTTCTCGCCAATGAACCGGACCTGCGAGCGTGTCTGGATTGACC
GCGGAGGCCCGCAACGCCACAGGCTCGATCTCCGTCACCGTCGGACCTCAGGGGCAGGTCGAGGATCTGCGCCTTGAC
GACCGAGTGCATGACCTCCCATCCCAGGAACTGAGCCAGCAGATCCTGACAGTGATGCGAAAGGCTCAGTACCAGCTC
ACCGAGTACGTCTCGGCGCACATCCGTGACACCGTGGGCATGGATTCGGAGACCGGTCGCAATGTGCTCGACGCGTTC
GCACAGCGCTTCCCGCTGCCGGAGATGACCGATGAGCGTTGAGCAGGTACAGCTGCCGATCGACGTAATCAACCGGCA
CACCACTACCATCGCCGCAACCGCCGATGCCGTACGGCAGGCCCGCGCCGCGGCAGGTCAGGCAGCCATGGACTCGCA
AGCGTACGGCCAGTTGTGTCAGTTCCTGCCGACCGCGTTCAGCGTCGTGTTCGAGAGTGCGATCGTCGCCATGACCGG
CAGCGCCGAAGCGTTGCAGGAAACCACCTTCAACCTGCAGGATGCCGTCACGACGTTCAGATACACCGACGAGTCGGC
CGCTCGCACCATCGCCTCCGCAGGTTCGCCGCCGTGACCACACCACTTGTCGCCCAAGCCGGGGACTCCACCACGGGA
TTGACCGGTCTGGGGCTCGTGGAGGACGCCCACCAGATCGCAGAAGCCATCCGCGGGAACAGTTGGGTCGACGGCGTC
CTCGGCGGAGTCGGGGCCAGCCTCGACGGTCTGGCGCTGGCGATCGACCCGCTCGGCACCCTTGCCGCCTGGGGCGTC
GCCTGGCTCATCGAGCACGTCCAACCGCTACAAGACGCCCTGGACTGGCTGGCCGGCGACGTCGACGAGATAGCCGCC
CAAGCCGCCACCTGGCGCAACGTCGCCGCCTTCACCGACAGCGCCCAGCAGGATTACGCCGATCGGCTCCGCACCGAG
GTCGCCGGCTGGTTCGGCGCCTCCGGCGACGCATACCGGGCCCATGCCAGCGAACACTTGGCCGCACTGAAAGGCATC
AGCACCGCAGCCGGCGGCATTTCGTCCGCCGTCGAAGGCGCCGGCCTGCTCGTCAGCCTGGTGCGCGGAATTGTCCGC
GACCTGATCGCCCAGTTCGTCGCCACTCTGGCCGTTCGGCTGCCACAATGGCTCGCCGCCGAAGGACTCACTCTGGGC
CTCGCCACCCCCGTTGTCGCGAGCCAAGTTGCCGCCCTCGTCGCCCGCGGGGTCAACAAGATCCAGCACTTCATACGG
GCGCTGCTCAACAGCCTTCGACGGCTGATGCCCATGATCGACCGGCTGGGTGAAGTCCTGGAGCGGCTCCGCATGCTC
ACCGACCGGCTCGCAAGGTCCAGCCCCTCCACCCGCCCGGAGCCGACACCCGGCCCCGCTACTCACGCCGGAACCGAG
AACGCATCGGGAAACAAGCCCGAGGGCGACCTCGAACCGAACGAACCGCGCCCGGCCGAGGCTGACGCCAGAGACAGT
ACGCCTCAGGCGTTCGTGGACGAGGTCGTCAGCAACCCCCGGTCAGTCGCGGGACACTCCGCGCAGTCCATCGCGGAC
CAGTTCAACGCCGCCGGATACTCTGCGGTCGTCGAGCAGAGCACCAGGAGCGGCACCTCGGGGAACGCCATCCAGGTA
CGCATTCACGGCCACCCGGATATCACCAACATCCAGGTGCATCCGGGAGGAGGACGGCACACGCCGGAGGGGTCCCCG
TATTGGAAAATTTCGACGAATACGGTCGGGAAGATCTGGATCATCCCCGAAAATTTCCGGGGCGCCGATGAACTGCGT
GGGAATGTGGTGCGCTATGACAAATAAGATCATCAAAGTGGATCGGGTGGGATCCGCGGGGGAAGCTGCCACGCTCGT
CGCCCTGGGCGTCGACATCGTCGGGGTCGATCTTCGTCCTGATCCGCGATTCGTTGATGATCGCACGCTGGACGCCGA
ACAGGTTCGCCACATCCGCGAAGCGCTGCCGCACACGACGCTGGCCGTCACCATGGACACCGGCACCGAGCCGGACCA
TGTCGTCGAACTCGCAAGGCGAATCGGCGCGGATCTGGTCCAGTCGATCAACGGTGTCATCCCGCCGCTCCCAGTACG
CGTCGCCCTGCGCAAGGCCGACATCGCGATTGTCTATGCGGGCACAGAGATCTCCCACGACGACGATCCCGGCTGGGT
CTTCAGCGCGTACGACGACACTCCGGACCTGAACGCCGCCCTGTTTCAAGTGGAGGTGCTTCCGGAGTACCTCGATTC
CTGGGAGTTTCTGCGTGACCGCTCCCCGGAATATGCCGACGAGTTCCAGATCGAAGATCTCGACGACCTCGGACGCGC
TCGCCCCTTGGTTGCCGGCCTGAATCTCACGGCTCAGAACCTCGACGAGATCAGGGCACGGCTTCCCCACGTCCGCGG
TCTGGCGCTCACCCTCGCGCACGAGGCCGCGAGGAGCGACGCGCGGTTCTTCATGTTTCCCCACGTAGTGGACATCCT
TTCGGGAGACTCGTCCGGGTGACCGGCATCGCGCGGGAGGGGGCTGGTGTCGCAGAGTCAGGCTGACGGCATTCCGGC
GGGCCTGACGGGAGGAACCTCATGACCGGGCTGTTCACCATGCGCAAGCACGAGGAGGGCGCCGGGGAGGTTCGGATC
GTCGTGAGCGGCGAGATCGACGGCGATGTCAGCGCGGCGCTCACCCTGTTCATCGCCAACGCCGCCGAGCAGGACGGT
GTCCGATCGGTGCTGGTGGATCTGGAGCCGGTGCTGCTGCTGGCCGCAGCCGGGATCCGGTGCCTGCTGAGCGGCCGT
GAGGCGGCTCTGCTGCAGGGCTGCTCCTACGAGCTGGTCAACGTCCGGCACGAGGTCGCGGATTCACTGCACGCCGCC
GGCGTGGCAGATCTGCTGCTCACCCTGCCGGTCCGCTGAGCCGGCTCAGCTCGGGTCGTCGAAGCCCTCGTCGGCGCG
TTCGCGGCGCAGGTGTGCCTCGGCCCGGCGCGCCTGGTCACCCTTCTCCGCTGCCAGCCCGGCGTACATGGCCTGCAC
CTTCTCGTACGGCTGGCCGGGCGGCAGCAGCGGGATCGCCGGATCGACCACGGCCTCGATCAGCGTCGGGCGGTCCGC
GGACAGCGCCGCCTCCCACGCGCCGGTCAGGTCGGACGGGTCGGTGATCCGCACTCCGCGCAGGCCGAGCAGCTCGGC
GTAGCGCGCGTACGGGACGTCGGGCAGTTCCTGCGACGTGACGAAGCGCGGCTCGCCCTCGGTCTCGCGCTGCTCCCA
GCTGACCTCGGCCAGGTCCCGGTTGTTCAGCACGCACACCACGAAGCGCGGGTCCGCCCAGTCGCGCCAGCGGGCGGC
CACCGTGATCAGTTCCGCCATGCCCGCCATCTGCATCGCGCCGTCGCCGGCCAGCACCACGACCGGGCGTTGCGGCGC
CGCCAGCTTGGCGGCGAGACCGTACGGCAACCCGCACCCCATCGACGCCAGCGTGCTGGACAGATGCGCCGGGACACC
GCGGGGCAGCCGCAGGTGCCGGGCGTACCAGTAGACGACCGAGCCGACGTCGACCGCGACCTGCGCGTCCGCGGGCAG
GTGGTCGGAGAGGGAGCGAATCACGTGCTGCGGGTTGACCGGTTCGGCGGGCGCCGCGGCCCGGGCCGCGCTGATCAG
GCGCCAGCGCTGCACCCATTCCTCCACGCGGGCGCCCCAGGCGCCGCTTGCCCGGCTGGGCAGCAGTCCGAGCAGCTC
ACGCAAGGTTTCCACGGCGTCGCCCAGGAGCGGGACCTCAACCGGATACCGTACGCCCAGACGGCGCCCGTCCACGTC
GATCTGTACGGCCCGCGCCTGCCCCGGCCGGGGATAGAACTCGGTCCACGGGTCGTTCGTGCCGATCAGCAGCAGCGT
GTCGCAGTGCCGCATCAGCTCGGCGCTGGCCGTGGTGCCCAGGTGCCCCATGACGCCGGTGTGGAACGGCAGGTTCTC
GTCGAGGACCGGCTTGCCGAGCAGCGAGGTGGTCACGCCGGCACCGAGCCGCTGCGCCAGCTCGACGATCTCGCGCTC
CGCGCCGTACGCTCCCTGCCCCACCATGATCGCCACCCGCTCGCCGGAGCGGAGCACCTCGGCCGCCTCGCGCAGGTC
TTCCGGGCGGGGCACCACCCGGGCGGGGCGCAGCCCCGCGCTCGTCGCCAGCACACCGTGCTCATGCGCCTGCGGGTC
GGGCGCCGGGGCCGTCTGTACGTCGTGCGGCAGGACCACGCAGGTCGGGCTGCGGGTCGCGAGCGCGGTGCGGAACGC
GCGGTCGAGGAGCATCGGCACCTGCTCGCTCGTGTGCGCGGCCTGCACGAACTGGGCGCACACGTCGCCGAAGAGCCG
CACCAGGTCGATCTCCTGCTGGTACGCGCTGCCGAGCACCGTCGAGACCTGCTGGCCGACGATCGCGACGACCGGTTT
GGAGTCGAGTTTCGCGTCGTAGAGGCCGTTGAGCAGGTGCACCGCGCCGGGACCCTGGGTGGCGAGGCAGACTCCGGC
ACCACCGGTGTACTTGGCGTGGCCGACGGCCATGAACGCCGCGCCCTCCTCGTGCCGGGCCTGCACGAAGGTGGGCCG
GCCGGCCCGGCGCAGCGCTCCGATCACGCCGTCGATGCCGTCCCCGGAGTACCCGAAGACCCGTTCCACGTCCCACGC
GGTCAGACGCTCCACGACCACGTCCGACACGGTCCGCTCCGTCACCGCTGCCTCCTCACGTCACACCGGGGGCTACCC
GCTCAGCCGCGCGGTACTCGCCTTGCGCGAAATGCGACTCGCGTGCACCTCACGGGCCGGGCGGACGCGGCACGGATC
TGAGCTGGTTCCCGCCCGGTTCTGATCCCCTGTGATCGGGGTACACACGTGCGGTGAGCAGGGACAAGACGTACCGGC
CGGTCCGTCCCGACGGGATCCGGACCACCTTCCACGACGGTGTACTCGGGCGCATGCGGATCCGGTGCCTGGGCGAGC
CGCGTCCGGGCGTACCGGAGATCGTGATGATCCAGGGTATGACCGTGAGTGACTATCTGCTGCCGGGTCTGGGCGCGC
TCAGCGCCTGGACCCGGGTGCACCTGGTGGAGCTGCCGGGAGGCAGCGGCAGCGGCCGGCCGCCGCACGATCTCACGG
TCGAGGAGTACGCGCGGGCCGCGGCCGACTGGCTGTGCGCCCAGCGCCTGGGCCGGATCGTGCTGGCCGGCCATTCGA
GCGGCACGCAGGTGGCGGCGGAGACCGCGCTGTTGTGCCCGGACGAGGTGGCCGGAGTGGTGCTGGCCGGCCCGGCGA
TCGACCCGGTGGCCCGCGGCGGCCTGCGGGTCTTCGCGCGCTGGTGGATCGACCGGCGCGGCGACCCGAAGAGCCTGG
ACGAGGTGCACAAACCCGAACGCGAGCAGGTCGGGTTCCGGCGGCTGTTCCAGGTGCTGCGCGCCCACCTGCGTCACG
ACCTGGAGAAGCCGGTGGTCGGGCTCTGCGTGCCGGTGCTGGTCATCCGCGGCAGCGAGGACCGGCTCGGCACCGCGC
GGTGGGCCCGGCGGCTCGCCGATCTGGCTGCCGTGGGCGGCCGGTACGTCGAGGTGCCGGGCACCCACTCGTTCTGCT
GGCGTTACCCGCAGGCCTGGTCCGCGCCGATCCGTGAATTCGCCGGATGGTCGGTATCGGTCTCCGGCACCTGAACGG
ACGTTTCGGTGGCATCGCCGCCACCGCGGGCCGGCGCATCCGCATCCACAGTCCGGGGTGAGGGTCAGCGCCGTTCGG
AGGCGGAGTGTCGATGATCGGTCAATTGACGTGCTTCCATGAGCCGCCCTACGGTCCGACAGAGAAATCGTTATCCGG
ACCACCATCGACATCCGAATCGGTGGCCCCGGAGCCGATCATCGACCGACCCCGGGCCACCCCCGCTCTTGCCAGAGG
GGGCGAGGCACATGACGGAAGCTGATCATCGTCCGACCGTTCTCAGGAGAATCCTACGGCTGTGCGCCGTGCTTCTCA
TGGTGCTCGGAGTGGGCCTGGTCGGCGCCCCGACGTCGCACGCCGGCGGCAAGCCGACCATCTCCAAGGAGGCGTTCG
GCAGCGTCGGCGGCAAGGCCGTCGACCGGTACACCCTCACCAACGGGCGCCTGCAGGTGCGGATCCTCACCTACGGAG
GCATCCTGCAGACCATCACGTTCCCCGACCACCGCGGCCGCAGGGCCAACGTGACGCTCGGATTCAGGACCCTCGACG
AGTACGTGACGACGAAGAACCCGGCGTACTTCGGCGCCATCATCGGCCGCTACGGCAACCGGATTGCCGACGGCCGGT
TCACCCTGGACGGCACGACCTACCAGCTGGCGACCAACAACGACCCGAACCACCTGCACGGCGGGGTCGTCGGCTTCG
ACAAGCGGGTGTGGGACGCCACGCCGATCCGCGACGGCGACAGCGTCGGGCTGCGCCTGACCTACACCAGCCCGCACG
GCGAGGAGAACTACCCCGGAACCCTGCGCGTGACGATGACCTACACCGTCACCCGGCAGATGGGTATCCGGATGGACT
ACCGGGCGACGACCGACAGACCGACGATCGTCAACCTGACCAACCACGCGTACTGGAACCTCGGCGGCGAGGGCACCG
GGACCATCGACGACCACCTGCTGAAGCTCAACGCCAACCGCTACACGCCGGTCGACGCCACGCTGATCCCGACGGGGG
CGATCGACGCGGTCGCCGGCACACCGATGGACTTCCGCCGGCCCACGCCGATCGGCGCGCGCAACCGCGACCCGTTCC
AGCAACTGGTGTACGGGCGCGGCTACGACCACAACTGGGTGCTGAACCGCGAGGACGGCCAGTTCCGGCGTCTCGAGT
TCGCGGCCCGGGCGGTCGACCCGGACAGCGGGCGGCAGCTCACCATCTACACCACCGAGCCGGGCATCCAGTTCTACG
GCGGCAACTTCCTCGACGGCACCCTGTACGGCACCAGCGGCCGGGCCTACCGTCAGGGAGACGGTTTCGCCCTGGAGA
CACAGCACTTCCCGGATTCTCCGAACCACGCGAACTTCCCGTCGACCGTCCTTCGACCGGGACAGACCTACAACTCGA
CGACCATCTACCAGTTCGGTACCGCCGACTGATCGCCTCAGGCCGGCCGCCGCGGGACGGCGCGCCGCGGCCGGCCGC
ACGGCAGTCAGCGGCGGCGACTGGAGGCACACATGCCACGCATCCATCCGAAAGTCGAGGAGGCCGTCTCTACGCTCG
ACCTGAACCGGACGACACGACGCCGGCTGTTGTCCGGAACCGGGTTGTTCAGCGCCTCGCTCGCCGCGGGCGCGCTGC
TGAGCGCATGCAGCGACCAGAACGACGGCCAGAACCAGACCGAGGGCGCCGGTAACTTCCCGGACACCCCCGAGTGGC
GGTTCACATTCGTCAACCACGTGACCACCAACCCGTTCTTCACCCCGACGCAGTACGGGATGGAGGACGCCGCGACGC
TGCTCGGCATCGCCAAGCCGCAGTGGACCGGCTCGCAGAACTCGATCGTGGCCGAAATGGTGAACGCGACGAACACCG
CGGTCAGCGCAAAGGTGGACGGAATCGCCATCGCCGTGGTCGACAAGGACGCGTTCCGGGGGCCGGTCGACCAGGCTC
TCAACGCGGGGATACCGGTGGTGTCGTACAACGCCGACGGAGCCCGGGGCGCGCCGGGCACGAACCGGCTGGCCTATA
TCGGACAGGGCCTGTACGAGTCCGGGTACGCGCTGGGCCAGCGGGCGTTGCAGGTGCTGGACTCCGGCGAGGTGGCCG
CCTTCATCGCCACCCCGGGCGCGCTGAACATCCAGCCGCGCATCGACGGCGCGCAACAGGCGTTCAAGGACTCCGGCA
AGCCGATCACGTTCACCGCGGTCGCCACGAACGCCGACGTGACACGCGGTCTGTCCATCATCGACGCGTACGCCCAGG
GGCACGCCAACCTGGCCGGCATGCTGGCGGTGGACGCCGGATCGACGTCGTCGGTGGGTCAGACCGTCAAGAAGTACA
ACATGCGCGGCAAGGGGCTCAAGGTGGCCGGCGGGTTCGACCTGATCCCGGAGACGCTGACCGGGATCCAGGAGGGCA
GCCTCGACTACACCATCGACCAGCAGCCTTATCTGCAGGGATTCCTGCCCGTGCTGGCGCTGTACTTCTACAAGGTGT
CCGGCGGGCTGATCGCGCCGAGTGAGACGAACACCGGGCTGTTGTTCGTCACCAAGGACAACGTCGCCCCGTACCAGA
GCACGAAGAGCCGGTACGAGGGCTCCACGACCGACAAGGTTCTCGTACCTCGCAGCGGGCCGATCGCCCATGGATGAC
CGGATCTCGCCTGCGCCCGCGCAGGCGCCTTCCCTCGAGGTCGAGCAACGCCGTGGCCGGTGGCAGCCGGTCACGGCG
GCCGGCCGGAAGGTCCTCGACGCCTTCCTGCGGCGGCGTGAGGCCAGCGTGCTGCTCGTCGCGATCGGCCTGATGATC
TACTTTCGGGCGTCCAGCCCGGTCTTCCTGAGCCGCGACAACCTGGTCAACATCGCCCAGGCGACCGCGCCCGTCGCG
ATCATCGCGGTCGGCATCGTGCTGCTGCTGGTCAGCGGCGAGATCGACCTGTCCGTCGGTATCGTGGCCGCGCTGGCG
CCGTTCCTGTTCCACTTCGGGATCAACTTCTACTCGCTGCCGGTGGTGCCCGCCTTCGTGGTGGCGCTGGCGATCGCG
GCCGGAATCGGCCTGGTGAACGGGCTGATCGTCACGCAGCTGCACGTGCCCTCGTTCGTGACGACGCTGGGCACGTTC
TTCGCCGTGCAGGGCATCCTGCTGATCACGTCGCACGCCTATCCGGTGCCGATCCCCGACGCGGCCAAGGGCACGTTC
CAAACCTGGCTCGGCGCCGGGCCGTGGGCCAGCATCACCTGGGCGCTGATCATCGTCGCGATCTTCCACACGGTGCTG
ACCCTGACCCGGTGGGGCCTGCACACCATCTCGGTCGGCGGCAACCCGGTCGGCGCCACCGAGGCCGGCATCCGCGCC
TCCCGCATCAAGATCGGCAACTTCGTGATCACCAGCACGCTGGGTGGGCTGGTCGGCATCATGGAGGCGTTCCGGATC
AACACCATCGACCCGAACATCGGCGGCGGCACGACGCTGACCTTCTACGCCATCTCGGCGGCGGTCATCGGCGGCACC
GCGCTCGCCGGCGGCTCCGGCACCATCGTCGGCGCCTTCCTGGGCGCCCTCGTGCTGGCCGAGCTGCAGAACGGGTTC
AACCTCATCGGCTACAGCGCCAACACCATCTTCCTCATCCTGGGCCTGGCCATCCTCGTCTCGATGATCGCCAACCAG
TACCTCTCCCGACTGCGCCGGGCAGGCCGATCATGACCGCGGAAACCGTGTCCGACGCGCTGCGCGTACAGAACATCG
CCAAGAGATTCGGCGCTCTCACCGCGCTGCAGGACGTGACCCTGCGCGTCGCCGAAGGCGAGGTGCTGGGCCTGATCG
GCGACAACGGCGCCGGCAAGTCGACCCTCATCAAAATCATCTGCGGGTACCACCGGCCGGACGCCGGGCGCATCTTCG
TCGGCGGCGAGGAGGTCACGCTGCGCAGCGTCGACCACGCCCGCTCGGTCGGCATCGACGCCGTCTATCAGGACCTGG
CCCTGGTCAACGAGCTGTCCGTCTACCACAACATGTTCCTCAACCGGGAGCTCGTACGGTGGCCGCTGCTGAACAACC
GGGCGATGCGCCGCCGTGCCGAGGAGCACCTGCGCGACATGGGAGTGAACCTGCCGGACGTCGGCGTCGAGGTGGCCA
AGCTCTCCGGCGGCCAGCGCCAGGCGATCGCGGTGGCCCGCTGCGTCTACTCCGACGCCCGCATCCTGCTGCTGGACG
AGCCGCTAGCCGCGATGGGCGCGAAGGAGGGCACGATGATCCTCGACCTGATCCGCGACCTGAAGGCGCGCGGCAACG
TGTCGATCATCATCATCGCGCACAACTACGCGCAGGTGCTCGACGTGTGCGACCGGGTGAACCTGCTGCAGCACGGCC
GGATCACCTTCGACAAGAGGTCGGCGGACACGTCGCTGGCCGAACTGACCGAGCTGGTGGTCGCCGAGTACCGCACCG
GCCGCGGGCGGTGACGCCTCAGCGCTTGCGGCCGACTCCGCTGTACTGGCTCGCGCCGGTCGTCTCGTCGCCGGGGTC
GGGATGCCACTGCGGGCTCGGCACGACGCCCGGCGGGACCAGGTCCAGTCCCTCGAAGAAGCCGGCGATCTCGTCGGG
CGTATGCATCAGGTAGGGCACCGCACCGGAGGAGTTGTAGGCGTCCTGGGCCTGGTTGAGCGCCTCCTCCCCGGCGAC
GCGCACACCGTCGTTGATCGACAGGTAGCTGCCGGGCGGCAGCCCGGCCATCAGCTGCCGGACGATGTCGCGGACCTC
CGCGGTGCTGGGGATGTGGCCGAGCACGCCGTTGAGGATCAGCGCCACCGGCCGGCCCATGTCGAGCTCGCGGGCGGC
GACCGCCAGGATGTCCGCCGGTTTCTGCAGGTCACCCTCGAGGTAGACGTCGGACGACCCGGCCAGCAGCTCACGGCC
GTGCTCCACCGCGTACGGGTCCTTGTCGACGTAGAGGACCCGGGCGTCAGGGGCGACCCGCTGCGCGATCTGGTGGGT
GTTGTCGACGGTGGGCAGGCCCGCGCCGACGTCGAGGAACTGGCGCACGCCGGCCTCGCCGGCGAGGTAGCGCACGGC
ACGCGACAGGTACCGCCGGGACTCGCGGGCGATCTCGTCGATGCCGGGGAACACGGCACGGTACTCGTCGCCGGCAGC
GCGGTCGACCGGGAGGTTGTCGGTGCCGCCGAGCCAGTAGTTCCAGATGCGGGCCGACTGGGGCACCGAGGCGCCGGA
CTCCATAGTCACGGATCGATAGCCTAGCCCTTGCGCGCCTGGGTGGCGACGCCCTCGACGAAGTAGCGCTGGCACAGG
AAGAACGCGATGATCATCGGCACCGTGGTGATCACCGCGCCGGCCAGGACGATCTCCCAGCGGGCCTCGCCCGCCTGG
CCGAACTGGTCGAGGATCGCCTTCATGCCGCGCGGCATGGTGAACAGCGCCGGATCCCGCAGATAGATCAGCGGCTTG
AGCAGGTCGGACCAGCTGGCCCGCAGCTCGAACACGAACGCCACGATCAGCGCCGGCCGGCACAGCGGCACCGCGATG
CGCCAGAACAGCCGCCAGTACCCGGCGCCGTCGACGCGGGCCGCCTCGAACAGCTCACGGGGCACGCCGAGGAAGAAC
TGCCGGATCAGGAAGATGTAGAAGGCGCTGCCGAACAGGTTGCCGGCCCAGAGCGGCACCTGCGTGGCGGCCAGGCCG
AGCTCGTTCCAGATCAGGTACGTGGGGATCATGGTGACCGCGCCGGGCAGCATCATCGTGCCGACGACCAGGGCGAAC
AACACGTTGCGCCCGGGGAAGCGGAAGTAGGCGAAGCCGAACGCCACGACCGCGCTGGAGATCGTGACCGCGGCCGCG
GCGGCGAGTGCCACCACGACGCTGTTGAACATCCAGGTCAGCACGGGCGCGGCGTCCCAGATGGCGGTGTAGTTCCCC
GGCGCCCACTCGGCGGGGAGCAGCCGGTTGTCGAAGACGTCGGGGCGGGGCTTGAGGGAGGCGCTGACCAGCCAGACG
AACGGGTACACGAAGATCACCGCGGCGGCGGCCAGGGCGGTCCAGAGCACCCAGGGATGCGGGCCGCGCGAGGTGCGC
GGTGGCATGGTCCTGTCCTCAGCCACAGCCACGGCCTCACTCGCTCTCGTAGTAGACGAATCGCCGGCTGAGCCGGAC
CTGCACGACCGTGATGATCACGATGATCAGGAACAGCAGCCAGGCCAGCGCCGAGGCGTACCCCATGTGCAGGAACTG
GAAGGCCTGCTGGAACAGGTAGACCACATAGAACAGGGCGGCGTCGTTGCCGTACGTCTGCTGGTTGGCACTGCCGTA
GAAGGCGGTGTAGACCTCGTCGAAGGTCTGCAGCGAGGCGATCGTGTTGATGATCAGCGTGAAGAAGAGCGCGCCGCT
GATCATCGGCACGGTGACCGCGCGGAACCGCGCCCACGCCGACGCGCCGTCCATCTCGGCGGCCTCGTAGAGGTCGCG
GGGCACGTTCTGCAGCGCCGCCAGGTAGATGATGACCGTGCTGCCGAGGCTCCAGGCGCCGATCAGCACCAGGCCGGG
CTTGATCCACGGGCCGTCGACGGTCCAGTTCGGCCCGTCGATGCCGACCGTGCCCAGCGCCTCGTTCACGATGCCGAC
CTGGCCGTTGAACAGCAGCAGGAACAGCACGCCCACGGCCACCTTGGGGGTGATCGTCGGCAGGTAGAAGATCGTGCG
GAAGAACCCGGCGGAGCGGCGCCCGACCCGGGCCAGCAGCATCGCCAGGGCCAGGGACACGATCATGGTGACCGGCAC
GTGCAGCGCCGTGTAGATCAGCGTGTTGGCGATGCTCGTACGCACCCGCGGGTCGGCGAGCATCTGCCGGTAGTTCTC
GCCGCCGACGAAGTCGGTGCTGGTGAGCACGTCGTAGTCGGTGAACGACAGGACGAGGCTGGCCACCATCGGCCCCGC
CATGAAGACCGTGAAGCCGATGAGCCACGGCGACAGGAAACCGAAGGCGGCCAGGGTCTCCCGCCGCCGCACGGCGGC
ACTCATCGTCAGCGTCCGCTGTTGGCCTTGTCCAGCGCGGCCTGAGCCTGCTGCTGGGCCTCGGCCATGGCCTGGGCG
GGTTTCTGCTTGCCTTCCAGGACCCGGTTGACCGCGTTCTGCCAGGCGGCCTTGAATTCCTCACCGGCGGCGAGCGCC
GGCTCCGAGAAGCCGGACTCCTGGGTCTGCAGGACGATCTGCACGTTGGCGTCGGGTTTCACGACGTCTCTGAAGATC
ACTTCGTCGGCCTTCTTGTTGCCGGTGTAGACGCCGGCGAAGGGTTTGTTCTCCTTCTTGCGCAGCTCGGCACGGGCC
CTCGCGGCGGCGATCCAGGTCTCGCTCGCGGTCATCGTCTTGATCCACTTACAGGCCTGCCCAGGGTGCGCGCTGTTC
GCCGGGATGGCCCAGGCGTTGCCCGTGATCCAGTCGATCGGCTGCCCGTCGACGCCGCGGAACGGCGCCACGGTCACC
TTGACCTTCGGCGAGTTGTCGGCGAGCACGTTGAGGTAGAAGTCCTCCATCGGGAAGGCGCCGAGCTGGTTGCTGGCG
AACTGGTTCTTGGCGCCGAAGAAGTCCCACGAGTCGCGGAACGACTTGAAGTTCGACCAGCCGCCCTGCGCGTTGATC
AGGCCGACGGCGTATTCGAGGGCCTCGACCACCTTCGGGTTGTTCAGCTGGGCGGTGCGACCGTCGTCGCTGACCAGG
GCGGCGCCGTTCGCGCGCGCCCAGACGGGCAGGAACTCGGGCAGCTTCGGGTCGAACCCGATCCGCTGGAGCTTGCCG
CCGCTCATCCTGGTGAGCCGGGCCGTGGCCGTCGACAGCGCCTGCCAGTCCCCCGTGTCGAACCCGGCGGGATCCAAG
TTGACCTCGGCGAACGCGGCGTCGTTGAGCATCAGGACGCGGTTGTTGTAGAAGTCCGGCAGGCCGTACAGCTGCCCG
TTCAGGGTCGCCTCGGTGACCGCGGCCTCGCGGAACTGGCTCATGTCGATCTTCTCCCGTTCGACGCAGTCGCCGAGC
GGAGTGAGCGCCTTCTTGGCCGCGTAGGTGCCGAGCAGCCGCCGTTCCATGTACACCAGGTCCGGCGGGGTCCTGGAG
GCCACCGCGGACAGGAACGCCTGGGCGTCGAAGCTGCCCTCGGACGCCTTCGCCAGGCTGGGCGCGATCACGGCGTTG
GCCGCGTCGAAGCGGGTCTTGGCGATCTCGTCGCCGGTGCCGAAACCCATCATGGTCAGCGTCACCGCGGCGTTGCTG
TCGGAGTCCGAATCGGATCCGCCCACGCCACCGCAGCCCGCCGCCAATGTCAGAACCAGGGCACCACCCACCACAAAC
CGGATCGATCGGATGAACATCGTTGTTCTCCCATTTTCACTTGTTCCCGTGGGCGAAGCATAAGTTCACTTCGATGCC
CGCGCACTCGGAGCGGCTGCTGTCAACCGCCGACCGGTTGGCGGATCACCACGATCGGGTGGTGCGGCCGCTGCCGGG
CCGCGCTCCTGCTCCCGCCGCCACGCGGGTGGGCAGATACCGATCGGCGTCGCTCTAATCGATGGCAGGGATACCGAC
GGTGACACCGTTTCCTCCCGCCGCTTCATCCCGACGTAATCGCGGGCATGGCGCCGTGGCCGCGTTTCGTCGAAATCG
CCGGGCTATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGTCTGCTCTCGCCATCGAGAAGTCCTGGAAGGA
CGTCGACCTCCGTGACGGGGCGACCAGCCACCCGGCCGGCCTCGGCTTCGGCGAGCTCACCTTCGAGGACCTTCGCGA
GGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGCACCCTGACGATCGAGTGCGGCACCGTGATCTGCGCCTG
CTGATCGACGATCGTTTCCGGCCCGGGGCGGGCATCGCCCGCCCCGGGCCATCCATTTCGCGCGGGGAGCAGCCATGT
CACCGGTTCCTTCACTCAATTCCACCTCGGTACGCGACAGCGCGTATCTGCACGAACGAACGGTGACCGGAGAAGACC
AGCCGGCACCGGCCGCGCAGGCGCGGATAGCGTCCTGGCGCGATTCGGCGTTCCTCGACGACCGGGTTCTCGACATCC
GGCTACGTCAATGGGGAATCGACCGTGCCACCTTCGGCCGGCTGCTCACCGACGACGACTTCACCGTTCCCGGCCGGC
TGCTCGCCTGGGCGGACGAGCTGGCCACGGTGCTGGCCACCGACACGACACCGGTCACCGGACTCGAGTTGTCCACCA
AACTGTGGTCACAGGGATTCGACCGGCTGCTCTTCGCCGGCCTGCTTCACCCGTTCCTCGCCCACTACGAACAGCGGC
TGCACGAGCGCGTGCCCCGGCCGATCGCCGGCAGCCTGCGCCGGCCGCTGCTGGAGTCGCTGGCCAACCGGCTGCTCG
CCGTCGCGGCACGCACCCTGCTGCTGGAGCTCAACGTGGCCCGTGTGCACGGGCGGCTGACCGGCGACACCCCGCAGC
AGCGCTACGACGACTACGACCGGCGGCTGCTCACCGACCCCGCCTACCTGGCCGCCCTCTTCGAGGAATACCCGGTGC
TCGGCCGTTGCCTGGTCGAATGCGGCCGGCGTTGGGTGGACCACGCCGCCGAGCTGTTCAACCGGCTCCACGACGACG
AGCCCGAACTGCGCGCGGCCGGTCTGCTGCCGCCGTCGGCGGAAGCGCTGCGCAGCGTACGGCTGGACCTCGGGGACC
CGCACAACGGCGGCCGGTCGGTGGTGCAGCTGACCTTCGACGACGGCACCGACCTGGTCTACAAGCCGCGGCCGGTCG
GATCCGAACGCGCCTACGCCGAGACGATGGCCGCGCTGGCCCGCCACGGGCTGCCGGTGCCGGTGACCGCCCCGCGCG
TGCTGGACCGTGGCGGGCACGGCTGGTGCGAGTTCGTCCGGCCCGCGCCCTGCGCCGACGCCGCCGAGCTGTCCCGCT
TCTACCGGCGCGCCGGATCGGTGCTGGCGGCCATGCTGCTGCTCGGTGGCGTCGACATGCACATGGAGAACGTCATCG
CCGCGGGGTCGTCGTTCACCCCGATCGACCTGGAGACCGTGCTGCAGTCCGGAGAGCTCGGCGACGGCGCCACCGACG
CGTACGGGCGGGCCCTCGACCTGCTCAACCGCAGCGTGCTGGCGATCGGCATCCTGCCCGCCCGCGCGTTCGGTGGCC
GGCAGCGAAAGAGTGTCGACGTCAGCGCCCTCGGCGGCGGCGAACCGCAGACCGCGCCCCGGCCGGTGCCACGCATCG
TCGACGCGTACACCGACACGGCACGGCTGGAAGCGGTCGAGGCCACCATGGCCGGCGCCCAGAACCGGCCGAGCCTGC
CCGGCGCCGAGGTCCGCCCGTGGGAGCACACCGCTGACGTGGTCGCCGGGTTCACCGACGCCTACGACATCATGCTGG
CCCACCGCGCCGACTTCGACCGGCTGCTGCGCGGCTTCCACGACGTGGAGGTGCGCTACCTGCCCCGGCCCACCCGTC
GTTACAGCATCTTCCTGACCGAGAGCTACCACCCCGACTACCTGCGCGACGCCAGCGACCGGGACCGGCTGCTCGACA
AGCTGTGGACCGCCGCGGACGCCCGCCCCGAGCTGATTCCGATCATCGAGTCGGAGAAGCGACAACTGCTCGCCGGTG
ACATCCCGTGCTTCCGCAGCGTCGCGGGAAGCCGGCAGATCCGCACCGCCTCCGGCCCGCTGCACCCGGAGTTCTTCA
CCGCGCCGGCCGTCACCGTACTGACCCGCCGGCTCGGCGAGTTCGGACCGGTGCACCGCGCCGCCCAGGTACGCATCA
TCCGCGACTCGATGGCCACGATGCCCGGCCCCCGGCCCGCCGCCCAGCCGTCCCCCGACCGGGCGGCGGGCCCCCGGC
CCCGCGTCACCGGCGCCGACCCGGCCACGCTCGCCGACCGCATCGCCCGCAGGCTCGCCGACGAGGCGATCCTCGGCG
ACCGCGACGTGTCCTGGATCGGCGTCAGCATCGAAGGCGTCGCCCAGGAGACCTACAGCTACAAGCCGATGGCGACCG
GCCTGTACGACGGCGTGGCCGGCCTGGCGCTCACCTTCGCGTACGCGGCCCGCACCCTCGGCGACGACCGCTACCTGG
ACCTGGCACACCGAGCGGCCCGCCCCGTCGCCGGCTACCTGCGCTACCTCGCCGAGCACCGCATCGTCGAGACCGTCG
GCGCCTACAGCGGCACCGCCGGGCTGCTCTACGCCCTGGACCACGTGGCCCACGCCACCGGCGACGACTCCTACCTCG
ACGCGGTCTCGGAGGCGGTGCCGTGGCTGCGCGAATGCGCCACCCGCGAGGAGTGCCCCGACCTGATCGCCGGGCTGG
CCGGCTGCGCCCTGATCAGCCTGGACCTGCACGGGCGCCACCGGATCGACGGGCTGCGCGAGGTGGCGGCCATCTGCG
CCGAACGGCTCGCCGCCCTCGCCGTCGACGTCGACGGCGCCGCCGGATGGCCGGCCACTCCGGACGGACCGCTGCTCG
GCGGGTTCTCCCACGGCGCGGCCGGCATCGCCTGGCCGCTGCACCGGCTCGCCACCGAACTCGGCGACCCCTCGCTGC
GCGAGCTCGCCCGCCGCGCGGTCCAGTTCGACCGCGACCTGTACGTGCCCGCCGCGGGCGCCTGGCGTGACCTGCGCC
CGGAGATGGCCGGCACCGACTCCTACCCCGCGCTGTGGTGCCACGGGGCCGCCGGCATCGGCCTGTCCCGGCTGCTCA
TCGCGCAGCACGACCAGGACACGCGACTGGCCGCGGAGGCCACCGCCGCCCTCGACCTGGTCGGCGCGCACGGCTTCG
GCCACAACCACAGCATCTGCCACGGCGACTTCGGCGCCCTCGCCCTGTTCGACCTGGCGGCACGAACCGGCTTCGACC
CCGGGCGCCACGACGCGGCCGCCGCGGCCGTGACCGCCGACATCGCCGCCAACGGAGCCCGTTGTGGCCTGGTCGGCG
ACATCCACATGCCGGGACTCATGCTCGGCGCCGCCGGCATCTGCCTGAGCCTGCTGCGCATCGCCCACCCCGCGCAGG
TGCCCGCGGTGGCCTGGCTGCAGCCGCCGCTGACCTGAGGAGGAGCCCATGCCGGAAGAGATCGTGCTCAGCGTGCTG
GACCAGGTGCCGGTGTTCCGTGACGGCAGCCCGGCGGAGGCGGTGCGCGACGCGGTCGCGCTGGCCCGCAGCGCCGAA
CAGTACGGCTACCACCGCTTCTGGATCGCCGAGCACCACGGCAGCGCGGCCAACGCGTGCGCCGCCCCCGAGGTGGTG
ACGGCCGCGGTGGCCGCCGCCACGAGCCGGATCCGGGTGGGCAGCGGCGGCGTGCTGCTGCCGCACTACAGCCCGCTG
AAGGTGGCCGAGACGTTCCGGGTGCTGGCGGCGCTGTATCCGGGCCGCATCGACCTCGGTTTCGGCCGGGCTCCTGGT
GGGCCGCCGGCGATGGCCGAGCTGCTCAACCCGTACGCGGTCCGCACCGACGAGGCGTTCCTGGAGCAGATCGGCCGG
CTGCTGGGGTTCCTCGGCGACACCCGTACGGTCAGCCGCGTGTCGGTGACGCCGCAGGTGGAAGAGCCCCCGGTGCCG
TGGATGCTCGGCGCCGGGACCGGCAGCGCCCGGATGGCCGGCATGCTGGGGTTGCCGTTCTGTTTCGCCCAGTTCATC
GCGACCGAGGAGTGCCCGGAGGCGATCGAGGCGTACCGGGATGCGTTCCGGCCGTCGCCCTGGCTGGAGCGACCCCAG
CCGATGCTCGCCTTGCGGGTGCTGTGCGCCGACTCGGACGCGGAGGCCGAGGAACTGGCCACGTGTTTCTGGATGTCG
TGCACGACCGGCTGGCGTGCGCAGGTGCAGCTCACCGACGACTACCGTGGGGGCGCGCCCAATCTCGACGACGCACGC
CGGTACCGGCTGACCGCGGAGGACCTCGCGCTGCGGGAGAGCCGGCCGTTCCTGCAGATCTCCGGGACGCCGGCCGCG
GTGGGCAAGGAGATCCGCAGGTTGCAGGCGGTGTACGGGGTATCCGAGGTGGTGCTCACCACGAACTGCCCCGGCCTG
CCGGCGCGGCGCCGCTCCTACGAACTGCTCGCCGGCGAGTTCGCATCCCCGGCGGCCTGACGGCCTCAGGTCCGCGGT
AGCTCCGCGTAGGTCCCGCGCAATGCCGCGGACCTGACGGCCGTCAGGACAGGCAGACGTCGTCGCTGGACAGACCCG
ACGCATACGCCAGGACGGCGGCCTGCACGCGGTTGGCCACGCCGAGCTTGCTCAGGATCACGCTGACGTGCTCCTTCA
CCGTGGCGGCGCTGAGGAACAGCTGCCGGCTGATCTCCGCGTTCGTGAGGCCGGCGCCGAGCAGGCGCAGAATGCTCT
GCTCCCGGTCGGACAGCTGTTTGACCCGCTCGCAGGCCGGTGACCCGGCCCCCGCGGCAGATCCCCGTGAGCCCGCAC
GCACGACCACCGACGACGCCTCGGGCGCCAGCACGATGCTGCCCTCGGCCAGCGCCCGCACGGCGGCGACCAGCTGTT
CGGGCTGGCTGTCGCGCAACAGGAAGCCGCAGGCCCCACCCCGCAGCGAGTCGAGCACCAGCTCGGGTGGGGCGAGAG
TGGTCAGCATCGCGATCGCCGGCGGGCTGCTCAGAGCCCGCAGCTGATCGAGCACCTCCAGCCCGTCGCTCTGGGCAC
TGTGGCCGTCGAGCAGCACCACGGCAGGCCGGTGCTGCTCGACGGCCGATCTCAGGTTCTCCCGGTCCGTCGTGGCGA
CCGCGAAGCCGCCGGTGCTCTCCAGGATCATCTTGATGCCGATGCTGACCAGTGCTTCGCCGTCCACGACCAGTACGT
CCGTCACGATCGGTCCCCCGCGAGCCGCCGAACGCATGCAACTTGCATCCGCATTCGTGACATTACTTCACTTATATG
GTCGAATCAATCGATTTTTCGCGTATAGTCATTAACAACACACAGCGCGTCGTCAGCGGGTCAGACCCTCGGCCGGGG
CGACCCGCGCCGCCCGCCGCGCCGGCGCCAGACTGGCCACCACCCCGGTCAGCACCGCCACCACCAGCACGGCGGCCA
GCTGGCCCCACGGCAGGCGGATCACCGGATCGGCGGTACGCCCCACGGCCGCCGCCACCGCGGCCAGCCCCACCGGGA
CACCGACCACGAGGCCGGCCACCGTGCCGAGCAGCGTGATCACGACCGCCTCGACCGCGAGCATCGCCCGCAGCCGCG
CCCGGCGTGTGCCCAGCGCCCGCAACAGCGCCATCTCGCGTACCCGCTCGACGACCGACAGGCCCAGCAGATTCGCGA
TGCCGAGCAGTGCGATCACCACCGTGACCGCCAGCATCGCCAGCGACAGTCCCAACAGGATCGACAGCACGTTCGCGA
TGTCACCGCCCTCGGTGACCCCGCCACCGACCTGCACCAGCGCGTCGCGGGCGGCCACCGCGCCGACGGCGGCCGACA
GCGCCTCCCGGTCGAAGCCGGGGTCAGCGACGCCCCACACCGTTGTCGGCACCGCCTCGATCCGGTTCGCCGCCAGGG
TCCGCGCGCTCACCACGCCCAGCAGCTGCCCGGTGGTGTCCGCCAGCCGCGACGCCCGGGCGATCAGGTTCACCCGGC
GCTCGCCGACCTCGACGACGATCGGGGCGCTGTCCGGCAGGCCCAGCTCGGCCAGATAGGTCGCCGGCACCAGCACCA
CCGGCTCCCCGGCGAGCTCCGGTGCCACCCGGGCCGCCAGTTCGTCGCCGGGCGCGGCCAGCAGCCGCGGCGTCGCCT
TGCCGCCGTCCGGGAAACGGGCCGCGACCGTGCCGACCGTGCCACTGGCCGACAGCTGTGGCACCGCGGCGAAGGCCC
CGGCGGTGGCACCGCTGATCGGCTCGCCGTCGGTGCGCAGGCCCGCCGCCACCGGGTAGCGCGCCTCCAGGTCGGCGT
TCACCGTGGCCCGCCCGCTGGTCGCCGCCACCGCCAGGCAGGTGATCAGCGCCGCGCCGACCACCACCGCCATCGCCG
CCGAAGCCGTCCGGCGCGCGTTCTGGCTCAGGCTGGTCCCGGCCAGGCCGGCGGCCACGCCGAAACGCTCCAGCAGCC
GCGCCGCCGGCGCCAGGGACAACGCGATCAGCCGCGGCAACGCCGCCAGCAACCCCGCCGCCAGCAGAAGCCCGCCCA
GCAGCGCCAGGGGCAGCGACGCGCCGATCGCCGCCACCGCGAGCGCGGCGGCGCCCACCACGGTCACCACGGTGCCCA
CGACGAGCCGGCGACCGCCGCGGACCGTGCCGGCCGGCGGCTCGTCGGCCGCCTGCAACGCCCGCACCGGGGCGATCC
TGGTGGCACGCCGGGCCGGCGCCCAGGCGGCCACCAGCGTGGCCAGCACCCCGGCCAGCACACAGCCGGCCAGGGCGA
ACGGATTGACCCGCAGCCCGCCGCCGCTGATGTCGAGCAGGTCGGCGCCGAGATAACCCAGCCCCACACCCGCCGCCG
CGCCGACCAGGCCGCCGGCTGTTCCGGCGATCGCCGCCTCGGCCAGCACGACCCGGCTCACCTGGGCACGATGACCGC
CGACCAGCCGCAGCAGGGCGATCTGCCGGATCCGCTGGACGATCACCACGTGGAAGGTGTTCGCGATGACCAGCACCG
CCGCGAGCAGGGCGACAGCCGCGAACGCCAGCATGATCACGACCAGCTGGCCGTTGCCGCCGGCGAACCTCGCGGCGG
CCTGATCCGCAGCCGCCGAGGCGTCGGTCGCCGAGATGCCGGGGCCCATGCTGCGCCGCAACGCGTCAACGGTGCCGG
TCAGCGAGGCGTCGTCGGCGACAGTCAGCAGCGCGGCCGGCGGCACGTCACCGGCGAAGAACGACGCGTCGGCGTAGA
ACCGGAAGTCCGAGCCGGTCAGCGGCCGGAAACCCAGGTCGGCGGCACCGGTCACGGTGACCGGCTGCGGCGCCGCCT
CACCGTGGCGTACCGTCAGCGTGGCCCCGACGTCGATGCCGAGGTCGTCGAGGGTGCGCTGGTCGGCGACGAGCTGTC
CGGGCCCGGTGGGCCACGCGCCCCGGTCCAAGGTGAACCAGCGGACCTGCGGGGTGGCCGCGATGCTCTGCACGTTGG
CCGAGCCGCGCCGCGATCCGCCGAACACGCTGACCGTGCGCGCGTACTGCGCGTCCACCGAGCGCACCCCCGGCACCG
CGGCCGCGGCCTCGTACCAGGCCGGGTCGCGGACCGTGTCGTCGGCGTCGAGCACGATGTCGGCGGTGGTCAACGGCG
CGGCGGCGGTACGCCGCAGGCCCTCACCCGAGGTGGCCGCGAAGGTCGCGGTCGCGGCCAGGAAACCGGTCGCCAGCA
TCACCGCCGCGACGATCGCGAACAGCCGGGCCGGGTAGGCGCGCAGCTGGGACCAGGCAAGCGCGAAGATCATCGTCA
CACCGCCACCGACGCCATCGCCGCGAGGATCTGATCGCGGCCGGGACTGCGCAGTTCCTCACGGATCCGGCCGTCGGC
CATCACCAGGACCCGGTCGGCGTACGTCGCGGCGCCCGGATCGTGGGTGACCATGATGATCGTCTGGCCGGAGCGGCG
TGCCGCGTCGCGCAGCCCGCCCAGCAGCGCGCGGCCGGTGGCGATGTCCAGCGCGCCGGTCGGCTCGTCGGCGAAGAC
CACCGACGGCTTGGCCAGCAGCGCCCGCGCCACCGCCACCCGCTGCTGCTGGCCGCCGGACAGCTCGGACGGACGATG
CCCCAGCCGGTCGGTGATCTGCAGTGAATCGGTGATCTTCCGCAGCTCGCCCGGATCCACCCGGCGGCCGGCGAGCCG
TAGCGGCAGCACGATGTTCTGCTCCGCCGTCAGCGTCGGCAGCAGGTTGAACGCCTGGAAGACGAAGCCGATCCGGTC
GCGGCGCAGGTCGGTCAGGGCCCGGTCGTCCAGACCGGCCAATGACCGCCCGGCCAGGCTGACCGTGCCCGCCGTCGG
TGTGTCCAATCCGGCCAGCAGGTGCATCAGCGTCGTCTTCCCGGAACCGGACGGGCCCATGATCGCGGTGAACTGGCC
CGCGGAGAAGCCCGCGGACACCCCGTCGACGGCTGTCACGGCAGCCGGCCCTGTTCCGTACGTCTTGCTGACGTCCCG
GCAACTGACCATCTCGGCGTGTGTCGTCTGCGTTGTCACCGCACCCACGCTAGAAATCCGCGCGGACCGGCACATCCC
ACCACGGGATCCCGGTCGGGCGGTGGACCGATACCTTCGTATGACCCGCCGGTATCGACCTCGGGCGCCGTGTTCCCG
CAATCGATGATGTCTGCTTAGGCTGGGACCGTGGTGCGAGGGAACCGGGTGCTCAGGATCGACGCCCTCGTCGCCGCC
GCGGTGGTCATCGGCTGTCTGCTCCTCGGGCTCGCCGGGCTGTCCGAGTGGTACTGGTCGGCCGCGGTGGCCGTACCG
TTGCTTCTCCGGCGCAGCGCTCCGCGCTGCTTCCTGGCGCTGGTCGCCGGCGTCTCCGGCCTGCACCTGCTGGCCTCG
CACAGCTTCATGTTCCCCGGCGATCTGGTCGCTCTGGTCGCGGTGCACGCCGCCGCGGCGCACGCGCCGGGCCGTGCC
CGCCACGCCGGACTGCTGCTCGGCGCCGCCGGAGCTCTCGTGGTGGCCGCCCAGGCCCTGCAGGACCAGCGCCTCGGC
TCGGCGCTGCCCGCGGTGCTGATCGTCGCGAGCACGATGGCCGCCTGGTCGATCGGGCTGATGCAGCGCCAGCAGCGC
AGCGCCGTGCTCGACGCCGAGCACCGCCGCCGGCTGGCCGAACAGGACAGCGCCATGCGCGCGCAGCTGGCCGTGCAC
GAGGAGCGCACCCGGATCAGCCAGGAGATGCACGACATCATCGCCCACTCGCTGGCCTCGATCATCGCCCAGGCCGAA
GGCGGCCGGGTCGCCGCCCGCGCCGACGCGCGGATCGCCGGGCCGGTGTTCGACCGGATCGCGGGCCTCGGCCGTCAA
GCCCTCACCGACGTGAAACGGCTGCTCACCGTCGTGGACCACGACGACGAATGGCACGACGACGGACTGGAGCGGCTG
CCGGTGCTGCTCGCCGGAGTCACCGAGGCCGGGCTGGACGTGACCGTGGACAGCAGCGGGGCGCCGCAGCCGCTCGCC
GCCGGGATGGACCTCGCCGTGTACCGGGTGATCCAGGAGTCGCTGACCAACGTGCTCAAGCACGCGCCGGCGCGCCGG
GCCTGCCTGCGGATGCGGTGGACGCCCGCGCTGCTCACGGTCACGGTGAGCAGCCCGCTTCCCGGTGGCCGCGGCGCC
GGCCTGGTCGAGGGGCGCGGCCTGTCCGGGATCCGGCAGCGCTGCTCACTGTTCAACGGCGACTGCACCGTCACCGCG
ACCACGGAACTCACCGTCACCACCACCTGGCCCCTCACCCCGGAAGGAGCGCGCGCATGACGCGGCCACCGATCGCCG
TGCTGATCGCCGACGATCAGGAGCTGGTACGCACCGGTTTCGCGATGGTCGTCGACGCGGCGCCGGACATGCGGGTCG
TGGCCATCGCCGCGAGCGGCGCGGAGGCGATCGAGCTGGCCGCCGAACACCGGCCGGACGTCATCCTGATGGACATCC
GCATGCCGGGCACCGACGGGATCACCGCGACCAGCGCGATCCTGGCCGCCGGCGGCGAGCGGCCACCGAAGATCATCG
CGCTGACGACGTACGACAGCAGCGACTACGCGACGCGGATCCTCACCGCCGGGGCCAGCGGCTATCTGCTGAAGGACG
CGACCGCCGAGGGCCTGACGGCGGCGATCCGCAGCGCGTACCACGGCGGGTCGGTGATCGCCCCGACGACGACCCGGA
ACCTGGTCGCGGCCCGCGCCGAGCCACCGCCGCCGGCTCGCGACCCGGCGCCGCTGGACACGTTCACCGCCCGGGAAC
GCGACGTGTTCGACCTGATCGTGGCGGGCGCCAACAACGCGGAGATCGCGGCCCGGCTGCACCTGGCCGAGGTGACGG
TGAAGACGCACGTCGGCCGGGTGCTGGCCAAGCTCGGGGTACGCGACCGGCTCAACGTAGTCGTCTGGGCGTACCGCA
ACGGCGCTGTCGGCTGATCCGCACCCTCAGGCCCTTGACACGGTGCCACGGTGGCACGGTGTGATAGACCCGGGTCGT
TTCGCCTCACACTGGTGGTGGTGCGGTGAGTTCCTGGGTACGCCGGCGCGATCACAACGTCTTCGTCAACGCGTTCAA
CATGCTCATATGCGGCCTCATCGCCGGCGTCGTCGTGGCCGCTGCCGCGTTCCCGTTCGCCGCGATGTCCGGCCTGGC
CGCCAAGGCCGGCCAGCAGACGTTCGCGAGCCTGCCCAGCGAGCTGAAGGCGTTCCGGTCACCGCAGATCAGCCGGAT
CTACGCCGCCGACAACAGGACCCAGGTCGCCCAGTTCTACGACGAGTTCCGCAGTGACGTCCCGCTCAAGGAGATGTC
GCCGTTCATGCGCGACGCCATGGTCGCGGCCGAGGACCGGCAGTTCTACCAGCACCACGGCGTGGACCTGAAAGGCGC
GGCGCGTGCGCTGGTCAACAACCGCAACGGCGGGCAGAAACAGGGCGCGTCGACGATCACCATGCAGTGGGTACGGAT
CTCGCTGGCCTACTCGGCGACCAAGCCGCAGGACGTCATCGACGCCACCGAGGACGCCCCGAAGCGCAAGGTCGCCGA
GATGAAGTACGCGCTCGAGGTGGAGAAGCAGCTCAGCAAGGACCAGATCCTGGAGCGGTACCTGAACATCGTGCCGTT
CGGCAAGCAGACGTACGGCATCTACGCGGCCAGCCGGGTCTACTTCAACAAGAAGCCCAAGGACCTCACGATCGGCGA
GGCCGCGCTGCTGGCCGCCATCGTGAAGGCGCCGTCCGCGTACGACCCCACCGACCCGGACGGTTACGAGCTCATCCG
GCAGCGGCGCAACGCCTATGTCATCCCGGGCATGGTGGAGATGGGCGCCATCACCCGGGCGCAGGCCGACGCGGCGCT
CAAGGAGGCCATCCCGCGCAAGGTACGCCCGATGAGCAACGGCTGCGTGTCGGTGGCCAAGAACAACTGGGGCTTCTT
CTGCGACTACTTCTACCGCTGGTGGATGGAGCGCAAGGAGTTCGGGCCCACGCCGTACGACCGGGAGCGCCGGCTGAA
GAGCGGCGGCTACCGGATCACCACGACACTCGACGTCAAGGCGCAGAAGCAGGCCCGGGATCGGATCGGCGACCTGAT
CTCCGAGAAGAACAAGAACGCGCTGCTGCTGGCAGCCGTCGAGCCCGGCACCGGCAAGGTACGCATGCTCGCCGCCAA
CCGCCGGTACAAGCTGGACGATCCGGATGATCCGCAGAACGCGATCTCCTCCGACCCGAGAAAGGCGCGCAAGGGCAT
CCGTGGCTCGTACCCGAACACGACGAATCCCCTGCTGACCGGCGGCGGCGACATCACCGGCTACCAGGCCGGCTCGGT
GATGAAGATGTTCACCATCGTCGCCGCGCTGGAGCAGGGCTACCCGCTCGCCTACACGATCAGGACGCAGAGCCGGTA
CCGCTCCCGCTACATCATCGAGAGCAGCAACGACGCGGCCTGCCCCGGAACGCACTTCTGGTGTCCCAGCAACGCCGG
TGGCGGCGGCGAGGGTGTCTTCAACATGTGGACCGGCCTGGGCAGGTCGATCAACACGTACTTCGTGCCGCTGGAGGA
ACGCGTCGGCGCGGAGAAGGTGGTCAGCGCCGCGAAACGCTTCGGCATCCAGTTCCGGGAGCCGGACGACGCACTGCT
GGCCGAACCGGGCAACGCACACCAGTGGGGCGCCTTCACCCTGGGCGTCTCGGCCACCACCCCGCTGGACATGGCCAA
CGCCTACGCCACCCTGGCCGCCGACGGGATGTACTGCCCGCCGACCCCGATCGAGCGGATCGCCACCCGTGACGGCGA
CCAGCTGGACGTCGGCCGGTCCCCGTGCGTACGGGCGACCGCCAAGGACGTCGCCCGCGCCGCCCTCGACGCGGCCCG
CTGCCCGGTGGGCGACTCCGCGCAGCTCGGCCGGTGCGGGGGAAGCACCGCCGGCATCACCCGGTCGGTGGTCGGGCA
TCCGGTGTTCGGCAAGACCGGCACCACCGACCGCGACCGGACCGCCTCGCTGATCGCCGGCACCACCGCGCTGGTGGT
CGCCGGTTACCTGGTCAACCCCGACTACCAGAACCACCGCGACCGGCTCGACCACGACCAGGTCAACCCGGCCGTCTA
CCGCACGCTCGCCGACTACATGGAGGGCAGGCCACGGGAGTCGTTCAAGCGGCCGTCGAGCGGGCGGATCGCGTTCGG
TGACCAGCGCTCGATCCCGGACGTCGAGTGCGACCCGATGCCCCGCGCCCGCGACCGTCTGGAGGATGCCGGCTTCGA
CGTCTGGCGAGGCCAGGAAGTGGAGTCGGACTGTCCCGCGGGCACCGCGGCCGGCACCGAGCCGAGCGGCCGGACCGT
CAAGAACGGCGTGGTGGTGATCCAGGTGAGCAAGGGCCGCCGGGGCGCGTCACCGCCGATCTTCCCGCCGATCGGGCC
ACCCCGCTGACCGGCTGACGGCGTAGACGTCGCCGGCGTTCGCCTCGTGCGGCAGCCCGGCCAGGTGCGCGAGCATCT
CGTCGCGGGCGGCCCACCGGCCGAAGGTGCGGGCCATGGTCTCGCCCAGGGAGACGTCGAAGCCGTCGAAGCCCAGCT
CGCCGGCACGGTCGAGGCAGCGCCGGGCCACGTCCCGGGCGATCGTCGTGAACTCGAACGACAACGCCCGGACACCGC
GGCTCAGACCGGCGAGCACCGCGTCCTCGTACCCTTCGACGTCGATCTTGATGAAGGCCGGCAGGCCGAATCGCTGGA
CGAGCGTGTCCAGGGTGACCGCAGGGACGGTGATCTGCTGGTCCCAGACCTCGTTCTCCCAGCCGCGCGAGCCGGTCG
CCGCGGTCAGGAAGCGCACCGAGTTCGTGGAGACCGTCGGGTTCGCCGAGTTGATGTAGAGCGGCACGCTCCCGCCGG
CGGGCCCGCACGCGGCCTCGACGAGCGCCACCCGGTCGTCGTGGGCGTAGAGCGCGCGCAGCGCCCGCATGCACAGCG
GCTGCGGTTCGACGGCGACCACGCGGGCGCCGAGCCGCCGGAAGCAGGCGACCCGGTCACCGACGTGCGCGCCGATGT
CGAAGACGACGTCACCCGGCCGGACGAAACGCCGGTACATCGCGTCCATCGCGGCCTCCCGGCCGGCGTCACCGTAGT
AGTAACGCAGCGACCGGGTCAGCGGCGCCATGGCCGGGTCGACTCTCAGTTTGCGCAGGTCATCGGTCACGGCGGGGG
CATTCCCCCGATCAGGCGATCCATGCATCGCCGGCGCGTGCGCAGGTAGGCGGCGATCGCCCGGGCGGAACGCACGCC
CGAGGTGGTCATGACGTTGTGCGCGGCGGCCGGGACGGTCACCGACACGCCGCCGGTCATCGCCGCCACCTCGGCACG
CCAGCGCAGCGGCGCCACCGGATCAAGCGACCCGCCGAGCACCAGCGGGGGTACGGGCAACCGGCGCAGATCCTCCTC
GATCGCGTTGCGTACCGAGTGGCCGACCGTGGCCAGAACCCGCCACGGCTTGGCGTCGGCGATGTCGCGGACCAGCAC
CGGCGCCTGCCACGGCGCCTCGATCCACAGGTCCACCGCCCACCGGCCGATCAGCGCCCGCCGGGACCGGGCCGCCGG
GTCGGTGGTCGGGCTGGCCAGCACGACGGCGGCGACCAGGTCCGGCCGCAGCACCGCGAGACGGGCCGCCACCTCGGC
GCCGAACGAGTGCCCGGCGATGCAGGCCCGGGGCACGCCGAGCACGTCCAGCCAGGCCGCGAGGTGTTCGGCGTGCCG
GCCCACGTCGTACGCGCGGCGCGGCTTGTCGCTGAACCCGAACCCGGGAAGGTCCGGAACGAGGACCGGATGGCGGCC
CGCCAGCGCGTGGGCGGTGGGCATCAGGTAGCGGTGCGAGACGGCGAGCCCGTGTACCAGCACCACCGGAAGGCCGCC
GGCGTGGCACGCGTGCCGGTCGTGCGTACGCACTCCACCGACCGTCACCAGGCGGCTGTCGAATCGGGGCACCGCGGA
GATGTACCCCGTCCTTCCGCAATCTTTCCCGCGCGGTTAGTTTCGAGTTGTGTCGCCGCCCTTCCGGCTCGACGAGGC
GGTCGCCGACGTCTACGGCGACCTGCGCCTGGCGCCCGTGCTGCGGCGGCTGCTGCGGCACAGCGGCCGCCTGACCGG
CTCGGTGGCCGGCAGCGTGTCGCTGATCGACGCGGACCGCGGCTGCTACGTCAAGGCCGCCGAGTACGGCGCGAACTG
CCAGCTCGGACGCTCTTTCCCGCTCGACGAGGGCGCCACCGGCCGCGCCTTCGGCAGCCGCCGGCCCGTGGTGATCCC
GGACTACGGTCAGCTGCGGGCCGGTCATCTCGCGGCGGCGCATCCGGCACGGAAGGGCCCGGCCGTCGCTGTGCCGAT
CTGGTGGCGCGGCGACGTGATCGCGGTGAACGTCGCCTTCGCGCCGGCCTTCTCCCTGGGTGGTGTCGACGAACTGGA
GGCGCTGACCCAGTCCGCGGCCGCCGCGATCGTCCGCAGCCGGGGTGTGCGGGTCCGCGCCGACCCGCCGTACGCGGC
TCCGGCCGCACCGTTCACCCCGCGCGAGGCCGAGGTCCTCGATCTGCTCCGGCAGGGTCTGACCGACCGCGAGATGGC
CCGCCGGCTCGGCCTGTCCGCGAAGACCGTGGAGAAGCACGTCGGCGCGATCAGGCGCAAGACCGGGACCTCCAACCG
TACGGCGGCGGTCGTCACGGCCCTGGACAACGACTGGGTGGGGAATCTTCCCCATACCGCGGAGCACACCACCGGGTC
TTGACTGGCGGCATGCCCGTCGTCTCCATGAAGGACATCCTCGACCGTGCGCTGGCCGAGCGGTACGGTGTGGCCGCC
TTCAACATCGTCAACGACCTGACCGTCGAGGCCGTGCTCGCCGCCGCGGCGGAGGAACGCGCCCCGGTCATCCTGCAG
ACCTCGGTCAAGACGGTCCGGATGTACGGCCGCCCCCGGCTGTACGAGATCGTCCACGCCTTCGCCCACGACGCGCCC
GTCCCGGTGACCCTGCACCTGGACCACTGCCCCGAGCGGTCGGTCATCTCCGACTGCCTCGCCGGCGGCTGGAACTCC
GTGCTCTTCGACGCGCACGAGCTCGACGTGGCCGACAACCTGCGCCAGACCACCGAGGTGGTGGCCGAGGCCCGTCGC
GCCGGCGCCCACGTCGAGGGCGAGATCGAGGGCATCCAGGGTGTCGAGGACGACGTCGGCAACGACTACGCCCCGATG
GTGCAGAGCCTGGAGGTGGCGGTCGACTTCATCAAACGCACCGGCGTCGACTGTTTCGCGCCGGCCATCGGCAACGCG
CACGGCCAGTACAAGCAGGCGCCCGTGCTCAACACCCGCCGGGTCAGCGACCTCGTTGCGGCCACCGGCATCCCGATG
GCCCTGCACGGCGGCACCGGCCTCTCCGACGAGCAGTTCACCGACCTCATCGCCCGTGGCTGCGCGAAGGTCAACATC
TCCACGGCGCTCAAGGAGTCGTTCATGAAATCCGGCCTGGAGTTCCTGCGCGAGGCCGATGAGCGCGGCAAATGGGAT
CCGCCGTCGCTGTTCCGGCATCAGCGGGCGGCGGTCGTAGAGATGGCCCGGCAGCACATCCGGCTCTTCGGCGGATCG
GGGCGCGCGTGGTGAACGCCCTGGTCTTCGACTGCGACGGCGTGCTGGCCGACACCGAACGGCACGGCCACCTGCCCG
CGTTCAACGCCACGTTCGAGCAGTTCGGGCTGCCCGTGCGGTGGAGCGAGGAGGAATACGGCGAGAAGCTGCGCATCG
GCGGCGGCAAGGAGCGGATGGCGTCGCTGTTCGCCGATCCCGCCTTCGCCGCGGCGGCCGGCGACACCGACCGTACGG
AACTGCTGCGAACCTGGCACCGCGCCAAGACCGCGGCTTTCACGAAGCTGGTCGCCGAGGGCCGGATTCCGGCCCGTC
CGGGCACAGCCCGGATCATCAGCGAGGCACTCCGGGCAGGATGGACGGTCGCGGTCGCTTCCACGTCGGCCGAGGATT
CGGTACGCGCAGTGCTCGTCAACGCCGTGGGAGCGACGACTGCCGAGCGGATCCCGGTGTTCGCCGGAGACGTCGTGC
CCGCGAAGAAACCCGACCCGGCGATC
SEQ ID NO101 orf1 推定蛋白 146aa
MPRRSTRCSPACRPGAADQPDPGRACRPDCGRADRSGSGRACRPDCGRAD
RSGADRPSAAALVSGMPRRTGVGGAPGRLIEARAVLPELIGAARDRRASC
VEQRVRSLTACRACACRRAAAPAAPRTPPRPSAAPAPGSDAGGRCG
SEQ ID NO102 orf2 推定蛋白 149aa
VSVSLLLVPLAMAGAAAVQAAAGRMDDGRLICQVQTRMRDVTLLDAALRD
TGATVTAAGDTISATWTQSAATFTRGADGIWAAHVTGVDQPGAVELMTTV
DTAYGRRVQQAVLERLRAQAPEAGLRLESESVGQDASVRLVFEVERERA
SEQ ID NO103 orf3 ATPase AAA 參與細(xì)胞分裂 518aa
VERSFAETFAQLLKARFPVLHLETYEEQRALHHLAGIAGDADLVRVPRAV
WTWSLTAGLVQPNGEARSGAQRATDALRAVQRIDEPAVFVFRDLHPLFAQ
SPEVVRLVRDIAQAFRAGRSPRTLVLLSPVLDLPVELSKDVTIVDFPLPG
QLELRALLDAMVRGNTASGRLRVELDEQSRERFVTAAAGLTMQEAENAYA
RAMVNDAVLDLADLEIVHEEKRQTVRKSGVLEFMAAGTVLDDVGGLENLK
AWLVKRNGSWLDEAAGYGLPAPRGVLITGVPGCGKSLTAKAVATAWNLPL
LRFDIGRVFSGLVGSSEHNMRTALRTAEAVAPCVLWVDEIEKGFAGGTGG
DSGTGARVFGTFLTWMQEKRTPVFVIATANDFDGLPPELLRKGRFDETFF
VDLPSRSERVAVWRVHLGRALRHRRAAGELRVDAELLTELAGLTEGYSGA
EIEQAVIAGLFDAFSERRPLRRDDLVRAVMSIVPLSVTQAERVDALRGWA
RNRAVSATGTDDWDLTNR
SEQ ID NO104 orf4 糖水解酶 203aa
VGELDQQRIHPHNNIWGSGAGTQTIWARSGTNWGVVANHPRTSGVKSYPN
TGKTLNRTLSSLNSLTSSFNVSVPSSGDYSTTYDIWANNHAYEVMIWTNQ
QGAVGPIAEQYDANGAVPNVRNLSVGGHTWNVYRGSNGANAVFSFIRTNT
NSGTVDILAILNWLRTNGWWGDVTVGEAQFGFEISGTAGQSNFTVNNFSL
NYS
SEQ ID NO105 orf5 內(nèi)切葡聚糖酶 219aa
MRRRTLALSLAASAALIAGAGVVTALPASAAAGCRVAYTVSSQWPGGFGA
NVTITNLGDPLTNWTLVWSYSGGQTVTQAWNTSLTQSGSQVTARNAGYNG
SVGTNATVSFGFNGSGAATPAPGTFTLNGTACTGSAGPTSPSSQPPTNGV
PSDAVWVDSGQWANWTNNGYILTTTSGARAPAPRPSGRAAAPTGASSRIT
RAPAGSSPTPTPERPSTVR
SEQ ID NO106 orf6 胞嘧啶/腺嘌啉 脫氨酶 161aa
MTITETDLAHLRRCVDLAREALDDGDEPFGSVLVSADGKVLFEDRNRVRH
GDATQHPEFAISRWAAEHLTPRERASATVYTSGEHCPMCSASHGWVRLGR
IVYAASSAQLTAWYKEWGIPAGPVAPLPITTVVPGAVVEGPVPAFEAELR
ELHRARFTPAQ
SEQ ID NO107 orf7 未知 413aa
VTTPLVAQAGDSTTGLTGLGLVEDAHQIAEAIRGNSWVDGVLGGVGASLD
GLALAIDPLGTLAAWGVAWLIEHVQPLQDALDWLAGDVDEIAAQAATWRN
VAAFTDSAQQDYADRLRTEVAGWFGASGDAYRAHASEHLAALKGISTAAG
GISSAVEGAGLLVSLVRGIVRDLIAQFVATLAVRLPQWLAAEGLTLGLAT
PVVASQVAALVARGVNKIQHFIRALLNSLRRLMPMIDRLGEVLERLRMLT
DRLARSSPSTRPEPTPGPATHAGTENASGNKPEGDLEPNEPRPAEADARD
STPQAFVDEVVSNPRSVAGHSAQSIADQFNAAGYSAVVEQSTRSGTSGNA
IQVRIHGHPDITNIQVHPGGGRHTPEGSPYWKISTNTVGKIWIIPENFRG
ADELRGNVVRYDK
SEQ ID NO108 orf8 未知 217aa
VGKPCPDLVEVLSREIQAGNQGASASEVVEIFDLELVGIFRGAVTQKLPG
IEVLRKHLHLKQGGVQVRSVVVRAEDPAGIVVVGDLCARIDNRDVGLAQG
DAYWERRDDTVDRLDQIRADSPCEFDDMVRLGAGVHGDGQRRVRQRFADV
ANLFGVQRAIINESRIRTKIDPDDVDAQGDERGSFPRGSHPIHFDDLICH
SAPHSHAVHRRPGNFRG
SEQ ID NO109 orf9 丙酮酸氧化酶 592aa
VSDVVVERLTAWDVERVFGYSGDGIDGVIGALRRAGRPTFVQARHEEGAA
FMAVGHAKYTGGAGVCLATQGPGAVHLLNGLYDAKLDSKPVVAIVGQQVS
TVLGSAYQQEIDLVRLFGDVCAQFVQAAHTSEQVPMLLDRAFRTALATRS
PTCVVLPHDVQTAPAPDPQAHEHGVLATSAGLRPARVVPRPEDLREAAEV
LRSGERVAIMVGQGAYGAEREIVELAQRLGAGVTTSLLGKPVLDENLPFH
TGVMGHLGTTASAELMRHCDTLLLIGTNDPWTEFYPRPGQARAVQIDVDG
RRLGVRYPVEVPLLGDAVETLRELLGLLPSRASGAWGARVEEWVQRWRLI
SAARAAAPAEPVNPQHVIRSLSDHLPADAQVAVDVGSVVYWYARHLRLPR
GVPAHLSSTLASMGCGLPYGLAAKLAAPQRPVVVLAGDGAMQMAGMAELI
TVAARWRDWADPRFVVCVLNNRDLAEVSWEQRETEGEPRFVTSQELPDVP
YARYAELLGLRGVRITDPSDLTGAWEAALSADRPTLIEAVVDPAIPLLPP
GQPYEKVQAMYAGLAAEKGDQARRAEAHLRRERADEGFDDPS
SEQ ID NO110 orf10 水解酶 或 ?;D(zhuǎn)移酶 266aa
VSRDKTYRPVRPDGIRTTFHDGVLGRMRIRCLGEPRPGVPEIVMIQGMTV
SDYLLPGLGALSAWTRVHLVELPGGSGSGRPPHDLTVEEYARAAADWLCA
QRLGRIVLAGHSSGTQVAAETALLCPDEVAGVVLAGPAIDPVARGGLRVF
ARWWIDRRGDPKSLDEVHKPEREQVGFRRLFQVLRAHLRHDLEKPVVGLC
VPVLVIRGSEDRLGTARWARRLADLAAVGGRYVEVPGTHSFCWRYPQAWS
APIREFAGWSVSVSGT
SEQ ID NO111 orf11 醛糖差向異構(gòu)酶 396aa
MTEADHRPTVLRRILRLCAVLLMVLGVGLVGAPTSHAGGKPTISKEAFGS
VGGKAVDRYTLTNGRLQVRILTYGGILQTITFPDHRGRRANVTLGFRTLD
EYVTTKNPAYFGAIIGRYGNRIADGRFTLDGTTYQLATNNDPNHLHGGVV
GFDKRVWDATPIRDGDSVGLRLTYTS PHGEENYPGTLRVTMTYTVTRQMG
IRMDYRATTDRPTIVNLTNHAYWNLGGEGTGTIDDHLLKLNANRYTPVDA
TLIPTGAIDAVAGTPMDFRRPTPIGARNRDPFQQLVYGRGYDHNWVLNRE
DGQFRRLEFAARAVDPDSGRQLTIYTTEPGIQFYGGNFLDGTLYGTSGRA
YRQGDGFALETQHFPDSPNHANFPSTVLRPGQTYNSTTIYQFGTAD
SEQ ID NO112 orf12 ABC 糖轉(zhuǎn)運(yùn)周質(zhì)成分(sugar transport periplasmiccomponent)378aa
MPRIHPKVEEAVSTLDLNRTTRRRLLSGTGLFSASLAAGALLSACSDQND
GQNQTEGAGNFPDTPEWRFTFVNHVTTNPFFTPTQYGMEDAATLLGIAKP
QWTGSQNSIVAEMVNATNTAVSAKVDGIAIAVVDKDAFRGPVDQALNAGI
PVVSYNADGARGAPGTNRLAYIGQGLYESGYALGQRALQVLDSGEVAAFI
ATPGALNIQPRIDGAQQAFKDSGKPITFTAVATNADVTRGLSIIDAYAQG
HANLAGMLAVDAGSTSSVGQTVKKYNMRGKGLKVAGGFDLIPETLTGIQE
GSLDYTIDQQPYLQGFLPVLALYFYKVSGGLIAPSETNTGLLFVTKDNVA
PYQSTKSRYEGSTTDKVLVPRSGPIAHG
SEQ ID NO113 orf13 ABC 糖轉(zhuǎn)運(yùn)通透酶 352aa
MDDRISPAPAQAPSLEVEQRRGRWQPVTAAGRKVLDAFLRRREASVLLVA
IGLMIYFRASSPVFLSRDNLVNIAQATAPVAIIAVGIVLLLVSGEIDLSV
GIVAALAPFLFHFGINFYSLPVVPAFVVALAIAAGIGLVNGLIVTQLHVP
SFVTTLGTFFAVQGILLITSHAYPVPIPDAAKGTFQTWLGAGPWASITWA
LIIVAIFHTVLTLTRWGLHTISVGGNPVGATEAGIRASRIKIGNFVITST
LGGLVGIMEAFRINTIDPNIGGGTTLTFYAISAAVIGGTALAGGSGTIVG
AFLGALVLAELQNGFNLIGYSANTIFLILGLAILVSMIANQYLSRLRRAG
RS
SEQ ID NO114 orf14 具有ATP結(jié)合功能,還有253個(gè)氨基酸的ABC轉(zhuǎn)運(yùn)蛋白
MTAETVSDALRVQNIAKRFGALTALQDVTLRVAEGEVLGLIGDNGAGKST
LIKIICGYHRPDAGRIFVGGEEVTLRSVDHARSVGIDAVYQDLALVNELS
VYHNMFLNRELVRWPLLNNRAMRRRAEEHLRDMGVNLPDVGVEVAKLSGG
QRQAIAVARCVYSDARILLLDEPLAAMGAKEGTMILDLIRDLKARGNVSI
IIIAHNYAQVLDVCDRVNLLQHGRITFDKRSADTSLAELTELVVAEYRTG
RGR
SEQ ID NO115 orf15 推定蛋白.轉(zhuǎn)甲基酶 255aa
MESGASVPQSARIWNYWLGGTDNLPVDRAAGDEYRAVFPGIDEIARESRR
YLSRAVRYLAGEAGVRQFLDVGAGLPTVDNTHQIAQRVAPDARVLYVDKD
PYAVEHGRELLAGSSDVYLEGDLQKPADILAVAARELDMGRPVALILNGV
LGHIPSTAEVRDIVRQLMAGLPPGSYLSINDGVRVAGEEALNQAQDAYNS
SGAVPYLMHTPDEIAGFFEGLDLVPPGVVPSPQWHPDPGDETTGASQYSG
VGRKR
SEQ ID NO116 orf16 ABC 轉(zhuǎn)運(yùn)通透酶 280aa
MPPRTSRGPHPWVLWTALAAAAVIFVYPFVWLVSASLKPRPDVFDNRLLP
AEWAPGNYTAIWDAAPVLTWMFNSVVVALAAAAAVTISSAVVAFGFAYFR
FPGRNVLFALVVGTMMLPGAVTMIPTYLIWNELGLAATQVPLWAGNLFGS
AFYIFLIRQFFLGVPRELFEAARVDGAGYWRLFWRIAVPLCRPALIVAFV
FELRASWSDLLKPLIYLRDPALFTMPRGMKAILDQFGQAGEARWEIVLAG
AVITTVPMIIAFFLCQRYFVEGVATQARKG
SEQ ID NO117 orf17 ABC 轉(zhuǎn)運(yùn)通透酶 301aa
MSAAVRRRETLAAFGFLSPWLIGFTVFMAGPMVASLVLSFTDYDVLTSTD
FVGGENYRQMLADPRVRTSIANTLIYTALHVPVTMIVSLALAMLLARVGR
RSAGFFRTIFYLPTITPKVAVGVLFLLLFNGQVGIVNEALGTVGIDGPNW
TVDGPWIKPGLVLIGAWSLGSTVIIYLAALQNVPRDLYEAAEMDGASAWA
RFRAVTVPMISGALFFTLIINTIASLQTFDEVYTAFYGSANQQTYGNDAA
LFYVVYLFQQAFQFLHMGYASALAWLLFLIIVIITVVQVRLSRRFVYYES
E
SEQ ID NO118 orf18 ABC transport substrate binding 445aa
MFIRSIRFVVGGALVLTLAAGCGGVGGSDSDSDSNAAVTLTMMGFGTGDE
IAKTRFDAANAVIAPSLAKASEGSFDAQAFLSAVASRTPPDLVYMERRLL
GTYAAKKALTPLGDCVEREKIDMSQFREAAVTEATLNGQLYGLPDFYNNR
VLMLNDAAFAEVNLDPAGFDTGDWQALSTATARLTRMSGGKLQRIGFDPK
LPEFLPVWARANGAALVSDDGRTAQLNNPKVVEALEYAVGLINAQGGWSN
FKSFRDSWDFFGAKNQFASNQLGAFPMEDFYLNVLADNSPKVKVTVAPFR
GVDGQPIDWITGNAWAIPANSAHPGQACKWIKTMTASETWIAAARARAEL
RKKENKPFAGVYTGNKKADEVIFRDVVKPDANVQIVLQTQESGFSEPALA
AGEEFKAAWQNAVNRVLEGKQKPAQAMAEAQQQAQAALDKANSGR
SEQ ID NO119 orf19 actA 1anA結(jié)構(gòu)基因 64aa
MSALAIEKSWKDVDLRDGATSHPAGLGFGELTFEDLREDRTIYAASSGWV
CTLTIECGTVICAC
SEQ ID NO120 orf20 actM 1anM 修飾基因 1053aa
MSPVPSLNSTSVRDSAYLHERTVTGEDQPAPAAQARIASWRDSAFLDDRV
LDIRLRQWGIDRATFGRLLTDDDFTVPGRLLAWADELATVLATDTTPVTG
LELSTKLWSQGFDRLLFAGLLHPFLAHYEQRLHERVPRPIAGSLRRPLLE
SLANRLLAVAARTLLLELNVARVHGRLTGDTPQQRYDDYDRRLLTDPAYL
AALFEEYPVLGRCLVECGRRWVDHAAELFNRLHDDEPELRAAGLLPPSAE
ALRSVRLDLGDPHNGGRSVVQLTFDDGTDLVYKPRPVGSERAYAETMAAL
ARHGLPVPVTAPRVLDRGGHGWCEFVRPAPCADAAELSRFYRRAGSVLAA
MLLLGGVDMHMENVIAAGSSFTPIDLETVLQSGELGDGATDAYGRALDLL
NRSVLAIGILPARAFGGRQRKSVDVSALGGGEPQTAPRPVPRIVDAYTDT
ARLEAVEATMAGAQNRPSLPGAEVRPWEHTADVVAGFTDAYDIMLAHRAD
FDRLLRGFHDVEVRYLPRPTRRYSIFLTESYHPDYLRDASDRDRLLDKLW
TAADARPELIPIIESEKRQLLAGDIPCFRSVAGSRQIRTASGPLHPEFFT
APAVTVLTRRLGEFGPVHRAAQVRIIRDSMATMPGPRPAAQPSPDRAAGP
RPRVTGADPATLADRIARRLADEAILGDRDVSWIGVSIEGVAQETYSYKP
MATGLYDGVAGLALTFAYAARTLGDDRYLDLAHRAARPVAGYLRYLAEHR
IVETVGAYSGTAGLLYALDHVAHATGDDSYLDAVSEAVPWLRECATREEC
PDLIAGLAGCALISLDLHGRHRIDGLREVAAICAERLAALAVDVDGAAGW
PATPDGPLLGGFSHGAAGIAWPLHRLATELGDPSLRELARRAVQFDRDLY
VPAAGAWRDLRPEMAGTDSYPALWCHGAAGIGLSRLLIAQHDQDTRLAAE
ATAALDLVGAHGFGHNHSICHGDFGALALFDLAARTGFDPGRHDAAAAAV
TADIAANGARCGLVGDIHMPGLMLGAAGICLSLLRIAHPAQVPAVAWLQP
PLT
SEQ ID NO121 orf21 acto 單加氧酶 341aa
MPEEIVLSVLDQVPVFRDGSPAEAVRDAVALARSAEQYGYHRFWIAEHHG
SAANACAAPEVVTAAVAAATSRIRVGSGGVLLPHYSPLKVAETFRVLAAL
YPGRIDLGFGRAPGGPPAMAELLNPYAVRTDEAFLEQIGRLLGFLGDTRT
VSRVSVTPQVEEPPVPWMLGAGTGSARMAGMLGLPFCFAQFIATEECPEA
IEAYRDAFRPSPWLERPQPMLALRVLCADSDAEAEELATCFWMSCTTGWR
AQVQLTDDYRGGAPNLDDARRYRLTAEDLALRESRPFLQISGTPAAVGKE
IRRLQAVYGVSEVVLTTNCPGLPARRRSYELLAGEFASPAA
SEQ ID NO122 orf22 actR 反應(yīng)調(diào)節(jié)子 231aa
MRSAARGGPIVTDVLVVDGEALVSIGIKMILESTGGFAVATTDRENLRSA
VEQHRPAVVLLDGHSAQSDGLEVLDQLRALSSPPAIAMLTTLAPPELVLD
SLRGGACGFLLRDSQPEQLVAAVRALAEGSIVLAPEASSVVVRAGSRGSA
AGAGSPACERVKQLSDREQSILRLLGAGLTNAEISRQLFLSAATVKEHVS
VILSKLGVANRVQAAVLAYASGLSSDDVCLS
SEQ ID NO123 orf23 actT ABC transporter associated permease812aa
MIFALAWSQLRAYPARLFAIVAAVMLATGFLAATATFAATSGEGLRRTAA
APLTTADIVLDADDTVRDPAWYEAAAAVPGVRSVDAQYARTVSVFGGSRR
GSANVQSIAATPQVRWFTLDRGAWPTGPGQLVADQRTLDDLGIDVGATLT
VRHGEAAPQPVTVTGAADLGFRPLTGSDFRFYADASFFAGDVPPAALLTV
ADDASLTGTVDALRRSMGPGISATDASAAADQAAARFAGGNGQLVVIMLA
FAAVALLAAVLVIANTFHVVIVQRIRQIALLRLVGGHRAQVSRVVLAEAA
IAGTAGGLVGAAAGVGLGYLGADLLDISGGGLRVNPFALAGCVLAGVLAT
LVAAWAPARRATRIAPVRALQAADEPPAGTVRGGRRLVVGTVVTVVGAAA
LAVAAIGASLPLALLGGLLLAAGLLAALPRLIALSLAPAARLLERFGVAA
GLAGTSLSQNARRTASAAMAVVVGAALITCLAVAATSGRATVNADLEARY
PVAAGLRTDGEPISGATAGAFAAVPQLSASGTVGTVAARFPDGGKATPRL
LAAPGDELAARVAPELAGEPVVLVPATYLAELGLPDSAPIVVEVGERRVN
LIARASRLADTTGQLLGVVSARTLAANRIEAVPTTVWGVADPGFDREALS
AAVGAVAARDALVQVGGGVTEGGDIANVLSILLGLSLAMLAVTVVIALLG
IANLLGLSVVERVREMALLRALGTRRARLRAMLAVEAVVITLLGTVAGLV
VGVPVGLAAVAAAVGRTADPVIRLPWGQLAAVLVVAVLTGVVASLAPARR
AARVAPAEGLTR
SEQ ID NO124 orf24 推定蛋白 244aa
MIVWPERRAASRSPPSSARPVAMSSAPVGSSAKTTDGLASSARATATRCC
WPPDSSDGRCPSRSVICSESVIFRSSPGSTRRPASRSGSTMFCSAVSVGS
RLNAWKTKPIRSRRRSVRARSSRPANDRPARLTVPAVGVSNPASRCISVV
FPEPDGPMIAVNWPAEKPADTPSTAVTAAGPVPYVLLTSRQLTISACVVC
VVTAPTLEIRADRHIPPRDPGRAVDRYLRMTRRYRPRAPCSRNR
SEQ ID NO125 orf25 反應(yīng)調(diào)節(jié)子激酶 367aa
VLRIDALVAAAVVIGCLLLGLAGLSEWYWSAAVAVPLLLRRSAPRCFLAL
VAGVSGLHLLASHSFMFPGDLVALVAVHAAAAHAPGRARHAGLLLGAAGA
LVVAAQALQDQRLGSALPAVLIVASTMAAWSIGLMQRQQRSAVLDAEHRR
RLAEQDSAMRAQLAVHEERTRISQEMHDIIAHSLASIIAQAEGGRVAARA
DARIAGPVFDRIAGLGRQALTDVKRLLTVVDHDDEWHDDGLERLPVLLAG
VTEAGLDVTVDSSGAPQPLAAGMDLAVYRVIQESLTNVLKHAPARRACLR
MRWTPALLTVTVSSPLPGGRGAGLVEGRGLSGIRQRCSLFNGDCTVTATT
ELTVTTTWPLTPEGARA
SEQ ID NO126 orf26 反應(yīng)調(diào)節(jié)子傳感器 220aa
MTRPPIAVLIADDQELVRTGFAMVVDAAPDMRVVAIAASGAEAIELAAEH
RPDVILMDIRMPGTDGITATSAILAAGGERPPKIIALTTYDSSDYATRIL
TAGASGYLLKDATAEGLTAAIRSAYHGGSVIAPTTTRNLVAARAEPPPPA
RDPAPLDTFTARERDVFDLIVAGANNAEIAARLHLAEVTVKTHVGRVLAK
LGVRDRLNVVVWAYRNGAVG
SEQ ID NO127 orf27 青霉素結(jié)合蛋白 782aa
MLICGLIAGVVVAAAAFPFAAMSGLAAKAGQQTFASLPSELKAFRSPQIS
RIYAADNRTQVAQFYDEFRSDVPLKEMSPFMRDAMVAAEDRQFYQHHGVD
LKGAARALVNNRNGGQKQGASTITMQWVRISLAYSATKPQDVIDATEDAP
KRKVAEMKYALEVEKQLSKDQILERYLNIVPFGKQTYGIYAASRVYFNKK
PKDLTIGEAALLAAIVKAPSAYDPTDPDGYELIRQRRNAYVIPGMVEMGA
ITRAQADAALKEAIPRKVRPMSNGCVSVAKNNWGFFCDYFYRWWMERKEF
GPTPYDRERRLKSGGYRITTTLDVKAQKQARDRIGDLISEKNKNALLLAA
VEPGTGKVRMLAANRRYKLDDPDDPQNAISSDPRKARKGIRGSYPNTTNP
LLTGGGDITGYQAGSVMKMFTIVAALEQGYPLAYTIRTQSRYRSRYIIES
SNDAACPGTHFWCPSNAGGGGEGVFNMWTGLGRSINTYFVPLEERVGAEK
VVSAAKRFGIQFREPDDALLAEPGNAHQWGAFTLGVSATTPLDMANAYAT
LAADGMYCPPTPIERIATRDGDQLDVGRSPCVRATAKDVARAALDAARCP
VGDSAQLGRCGGSTAGITRSVVGHPVFGKTGTTDRDRTASLIAGTTALVV
AGYLVNPDYQNHRDRLDHDQVNPAVYRTLADYMEGRPRESFKRPSSGRIA
FGDQRSIPDVECDPMPRARDRLEDAGFDVWRGQEVESDCPAGTAAGTEPS
GRTVKNGVVVIQVSKGRRGASPPIFPPIGPPR
SEQ ID NO128 orf28 甲基轉(zhuǎn)移酶 253aa
MAPLTRSLRYYYGDAGREAAMDAMYRRFVRPGDVVFDIGAHVGDRVACFR
RLGARVVAVEPQPLCMRALRALYAHDDRVALVEAACGPAGGSVPLYINSA
NPTVSTNSVRFLTAATGSRGWENEVWDQQITVPAVTLDTLVQRFGLPAFI
KIDVEGYEDAVLAGLSRGVRALSFEFTTIARDVARRCLDRAGELGFDGFD
VSLGETMARTFGRWAARDEMLAHLAGLPHEANAGDVYAVSRSAGWPDRRE
DRR
SEQ ID NO129 orf29 水解酶 261aa
VPRFDSRLVTVGGVRTHDRHACHAGGLPVVLVHGLAVSHRYLMPTAHALA
GRHPVLVPDLPGFGFSDKPRRAYDVGRHAEHLAAWLDVLGVPRACIAGHS
FGAEVAARLAVLRPDLVAAVVLASPTTDPAARSRRALIGRWAVDLWIEAP
WQAPVLVRDIADAKPWRVLATVGHSVRNAIEEDLRRLPVPPLVLGGSLDP
VAPLRWRAEVAAMTGGVSVTVPAAAHNVMTTSGVRSARAIAAYLRTRRRC
MDRLIGGMPPP
SEQ ID NO130 orf30 反應(yīng)調(diào)節(jié)子 244aa
VSPPFRLDEAVADVYGDLRLAPVLRRLLRHSGRLTGSVAGSVSLIDADRG
CYVKAAEYGANCQLGRSFPLDEGATGRAFGSRRPVVIPDYGQLRAGHLAA
AHPARKGPAVAVPIWWRGDVIAVNVAFAPAFSLGGVDELEALTQSAAAAI
VRSRGVRVRADPPYAAPAAPFTPREAEVLDLLRQGLTDREMARRLGLSAK
TVEKHVGAIRRKTGTSNRTAAVVTALDNDWVGNLPHTAEHTTGS
SEQ ID NO131 orf31 果糖二磷酸醛縮酶 281aa
MKDILDRALAERYGVAAFNIVNDLTVEAVLAAAAEERAPVILQTSVKTVR
MYGRPRLYEIVHAFAHDAPVPVTLHLDHCPERSVISDCLAGGWNSVLFDA
HELDVADNLRQTTEVVAEARRAGAHVEGEIEGIQGVEDDVGNDYAPMVQS
LEVAVDFIKRTGVDCFAPAIGNAHGQYKQAPVLNTRRVSDLVAATGIPMA
LHGGTGLSDEQFTDLIARGCAKVNISTALKESFMKSGLEFLREADERGKW
DPPSLFRHQRAAVVEMARQHIRLFGGSGRAW
SEQ ID NO132 orf32 水解酶 192aa
MGSAVAVPASAGGGRRDGPAAHPALRRIGARVVNALVFDCDGVLADTERH
GHLPAFNATFEQFGLPVRWSEEEYGEKLRIGGGKERMASLFADPAFAAAA
GDTDRTELLRTWHRAKTAAFTKLVAEGRIPARPGTARIISEALRAGWTVA
VASTSAEDSVRAVLVNAVGATTAERIPVFAGDVVPAKKPDPA
SEQ ID NO133-SEQ ID NO199
(Null)
SEQ ID NO200 CosAL02(40402bp)
GATCAGGTCGACCGCGGAGCTGATCTGGTCACGGATCGCGCGGATCGGCAGGTCCATGCCGGCCATCAGCA
CCATCGTCTCCAGCCGGGACAGCGCGTCCCGCGGCGTGTTCGCGTGCAGGGTGGTCAGCGAGCCGTCGTGG
CCGGTGTTCATCGCCTGCAGCATGTCGAGCGCGGCGGCGTCACGGACCTCGCCGACGACGATCCGGTCCGG
GCGCATCCGCAGCGCGTTGCGGACCAGGTCGCGGGTGGTGATCGTGCCCCGGCCCTCGGAGTTCGGCGGCC
GGGACTCCAGGCGCACCACGTGGTCCTGGACCAGTTGCAGCTCGGCGGCGTCCTCGATGGTCACGATGCGC
TCGTCGGCCGGGACGAAGCTGGAGAGGACGTTCAGGATCGTGGTCTTGCCGGAGCCGGTGCCGCCGCTGAC
CAGGATGGTGCGCCGGCCGCGCACGCACGCGTCCAGGAACTCGGCGGCCTGCCGGGTGAGCGTGCCGTACT
GCAGCAGGTCACCGACGGTGAGCGGGACCGCGGCGAACTTGCGGATGGTCAGCGTCGAGCCGTCCAGCGCG
ATCGGCGGGACCACGGCGTTGACCCGGCTCCCGTCCGGCAGCCGGGCGTCGACGGTCGGGCTGGCCTCGTC
CACGCGGCGGCCGACCCGCGAGCAGATCCGGTCGATGATCCGGCGCAGGTGCTGCTCGTCGTCGAACTCGG
CGGCGACCTTCTCGAGGCGGCCGAACCGCTCGACGTAGACCGAGTACGGCCCGTTCACCATCACCTCGGTC
ACCGACGGGTCGCGCAGCAGCGACTCGATCGGTCCGTGGCCGAGCACCTCGTCGGTCACCTCGCGGGTGAT
CCGGGCCCGGTCCGCGCCGGAGAGCGGGGTCTCCTCCCGGGCGAGCAGGTCGTGGAGCGCGTCCCGGACCC
GGGCGTCCAGGTCCTCGCTCTGGCCGGTGGTGTAGAGCGTCGGCCCGAGCTCGTCGGCGAGCCGCCGCTGG
ATCCGCAGCCGCACCTCGCCGACCTGGTCCTGCGGCGGGCGGCCGGCGGCCCGGTAGCGGTCGCCGCCGCG
TGGCTCGGTGGGCGGTGGTGGGGGCGTGCCGGCGCCGCTCAGGCGGCTGGAGAGGCTCACGGGAACAACCT
CCCGAGGAACCCGCGGCGCCGCTGGGGTGTGGTGCCGACGCCGGCGATCCGGTCACCGAGCTCCCGGATCG
CCCGGCTGACCGGGTGCAGCGGGTCGGTGACGGCGATCGGCTCGCCGTGGTTGACCGAGACCGTCACGTCC
CGGCTGGCCGGCACCTGCACCGCGAACGGCATGCCGGCCGCGACCTCCACCTCGGACGGGCTCAGGCCGAC
CTGGGCGCCGGCCCGGTTGAAGACCAGCAGCCGCTTGTCCTTGGGGTAGTCGAGCAGGTCGAACATCTCCG
CGGTGAGCCGGACCGACTTGAGCGCCGGAAGATCCGGGGTGACGATCGGGATGAACCAGTCGGACATGTCC
AGCGCGGCCAGCACCTGGTCGGTGACCACGGACGGGGTGTCCACCACGATGAAGTCGTAGAGCGGGCGGGC
CACGTCCAGCAGCTCGACGACGAACTCCCGGCGGACCTGCTCGCCCTCGGCCGGGCTGGCCGGCGCCAGGA
GGGCGTCGAGACTTTGCCGGTACGTCGTGACGATCGACCGCAGCCCGGGCTCGTCCAGCCGACCGGCCATC
TGCAGGCCCCCGGCGATGTTGCGTTCCGGGGACAGCTTCATCATGATCGCCACGTCGCCGAACTGCAGGTC
CAGGTCCATCAGCAGCACCCGGCGTCCGGCACCGGCCAGCGCGACGGCCAGGTTCACCGCCACCACGCTGC
GCCCGCAGCCGCCCTTGCCGGCGAAGACCGTGACCACACTGGCGTACGGGGCGTTGTCGCCGGTCCCGCGC
ATGGTGGTGCTCAGCGCCTTGGACAGGTCGACCGACCGGACCGTCGCGCTGCGGATGCCCTCCTCGTCCTC
CTCGGCGACCAGGTCCCGGATGCCGGACTGCAGGCAGCGCAGCACCACGCCGGCCTCGATCGCGTGGCGGA
TCAGCACCACCCCGATCACCGGGCGCTGCAACCGCTGGTACGCCGTGAACATCAGCGCCTCGTCCAGGTCC
ACGACCGCGCCGATCACCACGAGCAGCGTCTCCGGGTAGCGGGGGAGATACGACTCCAGCTCGCTCATGCT
CTTGAGCATCGTGCCGCCGATCGCCCGGAAGTCGTTGCCCCAGTGCGTGCGGCGCTCGTCGTCGGGCTCGA
CGTACACATAGAGGCTCATCGCACGACCCAGCTCGTGTCGATCGCCGGGCCGGTGCTCGCGGTGGCGTTCG
GGCCGAGCAGCGCCAGGTAGAGCGATCCGCTCTGGGCGGCGTGCACGAGTCGCAGGGCGTCGGTGTCGCCG
ACGGCCAGGGTCACGACGTACCGCTGGATCTCCTTGACCGCGGCGGTGCTGTCGCCGGCCGAGGCGGACGG
ACCGGGGGTGGGCGAGGGCGACGGCGTCACGGGGGCCTGACCCGGTTCCGCCTCCCCGATGGTGATCACCC
GTGCCTTCGGCAGCAGGAGCTCGGTCATCGGGATGGTCTCGTGGTCCTCCGCCATCAGGACCTTCGCCTGG
TACGTGTAATAGACCGCGACCTGGTCGCCGGGCGTGATGTTGCCGGCTACCTGCGGGGCGACGTTGAGCGC
CACCGAGACCGCGAGCGACCTACGGGGCACCGGGATCCGCCCGGTGTGCGACGGCGCCGGTGACGCCGGGA
CGAACAGCGTCCGCATGAGGAGCTGCCGGGGCTGCAGGTCCCCGCCGAGCCGGAGCGGGTCGAGCGCGCTG
TCCCAGGTGGTCAGCGCCCCGGCGGGCACGGTGACGGTGGGGACCAGGAGCCGCTCGGTCAGGCCCCGGGC
GCGGATCTCGGCGCCGCTGGTCCCGGACGGGATGTGCTGCCCGGCGACCAGGATCCAGGTGCCCTCCCGGC
CGCTGAGCGCGCGCCGGTCGGCCGACCGGGCGTAGGACAGGACGGCCGCCCCGCTGATCCCGGCCAGCACC
AGCGCGGCCAGCAGGATCAGGATGCGGCGGCGCATGACTTCACCTTCTCAGGCACCGGTCATCCCGTACGG
CCGATCACCATCGCGCCGTAATACCGCGAGGTGGCGAACCGCGTCGGTACGTGGTCCGTGACCAGCGCTCT
GGTGAAGTAGCCGTAGAGGCAGGACTGCGCCGCGCACAGCGCTCTCTGCGCCCCCGGCACGAGCGAGGGGA
CCGCGGATCCGGGTGACACCGGGCCGCTGACCGGGCTCTCGTAGCCGGTGAGGACGAGCGGCGCGAAGCCG
GCGATCCGGTAGTACGACGGCAGCGTGCCGATCACCGCCACCTGCCTGTCGAAGATCGGCACCAGCACCGG
CTGCCCCGAGGTGATCAGGACGTTCAGCCGGTCGAGGCAGGCCGTGGCGGCGGAGGCGTTGCCGGGGCCGA
TGGTGAATCCGCCGACCCAGCTGTCCGCCGGCCCGTCGGTCGCCGGGATGCCGGTCAGCTCGCAGGAGGCG
TCCGGTGCGCTGACCGGCAGCAGGCCCGGCAGCGCCGGCGGGCCGTCCGGCTGCCCGAGCCACGTGTAACC
GGCGACGGTCTCGCCGGCGTCGGCCGGGCAGGACGTGGCGAGGATGCCGTCGCTGATCGGGATGTAGCCGG
CCGTCGGGTCGGAGAGGCCGAGCAGCGGGTGGACGCCGGTCTGCGGGTTCGGGCCGGTGGGCGGCGGCGGG
GCGAAGAACCTCGTGTAGTCGCCGGTCAGCCGCAGGAAGTCGCACCGGGAGACGCCGAGCGCGAGGACGTC
GGTGACCGCCGGAGCTCCCCAGGCGACCCGGCCGCAGGCGCCCATCTTCGCCCCGTGGTACGCCGACCCGG
CCAGACCGCGCCCGAACAGCGGCGGCACCACCGAGGTGTTGTCGCTGTTGCGGGTGGACGTCCGGACCTCG
ACGTACCGGTACGGCCCGGAGGCGCTCGGCGGCGCGGGGCACGTGACCGGGGTGTTCCAGGAGCTCGGGCA
GCCGGCGTCGGCGGTGGTGACGCCGGCGGCGGAGACGGTGGTGATGCAGAACTGGACGTCCGAGACGAGGT
CCTTGGCGTTCCGGTCGGCGTACCGCTGCGCGTTGTCCCGCTGCGCGGCGACGGTGCAGGTGGCGGACGTC
AGGTCCCGGCCGGCCGTGCCGGCGCAGGCCTGCGCGACCTTCCACGACGCCGCGTCGGCCCCGCTCTGCAA
CTGCTCCCGCTCGGCGTAGAGCGCGCCGATGTCGATCACCAGCGCCGCCATCCCGAGCAGGACGCCGGCGC
CGGCCAGGACGGCGACCAGCGCGGTGATCACGCCGTGCTCGCCGCGGGGCGGGAACAGGGCGTGGATCAGC
CGACGCATGACATCACGCCGGTCGCGCTCATCGTGATCGTGCCCATGGTCTGCCCGCCGACCAGCCTGACC
AGCGCCACCATCGGCGTGATCGGCTGGTACCGGCGGGTCAGCACGACCTCGGCGTCGGCGCCGGCGAGCGA
GGTGGCCGAACAGGTCGTGACGGTCTGGGTCACCGACGGCGCCCCGGTGGCGCCGACGATGCCGTTGACCT
TGGCGTGCACCGCCGCGGCCGTGCCGTTCAGGGCGCCGAGCCGGGCGCCCTCCCGGGCCGCCTCGGTGAGC
TGGATGTACTGCTGGAGCAGCCGGCCCATGTCGATGATCCCGAACAGGATCAGCAGCAGCACCGGCATCAC
GATGGCGGTCTCCAGCGCCGCGGCGCCCCGGTCCCGGTTATCGTGCGGAGCTCTCCGCTCCCTGGGCGAGA
ACCGTACGCAACATCCCGGCCAGCCGGTCCGCCGTATACGGCTTCGCCACGAATGGCGACCCGGCACGGAT
CAGCCCTTTCTTGATGGCGATCTCCTCCGGGACCCCGGAGACGTAGACGATCTTCATGCCCGGCCGGACCT
CGGAGGCCGAGCGGGCCAGCTCCCCGCCGGAGACTCCCGGCAGGCCCAGGTCGGTGAGCAGCACGTCGATC
GCTCCGCTGTGCACCCGGCACGTCATGATGGCGCTGACCGGGTCTTTCGCCACGAGGACGACGAACCCGCG
CATCTCCAGCATCTGTGCGGCGAGCTCACGCAGGTCCTCGTCGTCCTCCACCAGGAGAACGACCGGCCCCT
GCCGCTCGGTTGCTTTCCACATCATTCCTCTCCCGGTGCACGAGGAATCCGGCGACGACTCTTCCCGTCGC
TGCCTCTGCTCACGCTATCCACCGGCCTGCCTGGCCCGGTGGCATTCGCGGAAATGTCGATGCCCTCAAAT
CAGCATTTGTCCGGCGGCACTGTCCGTGTTAACGCTCACTACGTTGCGCTGACGTCACGTTTCGTCCCGGT
AACAGTTCGGGGTCTTGACAGATCACGAGCGTCGATGGGTGAATGTGTTCAATCCTGATCGGACGAGTGCA
GGATAAACAACGTTTGCGTGTGAAGCCGTTTGGCTTTGAGGGGGCTCCATGTTCAATTACGTCAGTTTCGT
GCGCCCTAAAACCTTTGCCGCCACCTTCGCGGCAGCCGCCCTGCTGCTCGGCTCGGGCGCCTGCGCGAAGA
GCGAGGACTCCGGGGACACCGTGGCGGCGGGTCCCGCCCCGTCGGCGGCGCAGGTGGTCCAGTCCGCCTCG
GCCGGCTCCGCGACCTGTGCCTTGGATCAGTACGGCGCGTCCAAGCTCGACCTGAAGACCGCCTCCGTCGG
CTTCTCCCAGTCGGAGAAGGAGGCGAACCCGTTCCGGATCGCCGAGACGAAGTCCATCAAGGACGAGGCCG
CGAAGCTGGGCATCACCAACCTCAAGACCTCGAACGCGAACTCACAATTCAACAAGCAGATCGCCGACGTC
GAGCAGATGATCGATGCGGGCGTGCAGCTGCTGGTGATCGCGCCGCTCAACTCGGACGGCTGGGACTCGGT
GTTCGCCAAGGCGACGGCGAAGCACATCCCGATCATCACGATCGACCGGAAGATCAACGCGACCGCCTGCA
AGGACTACCTGACCTTCATCGGCTCCGACTTCGCCGAGCAGGGCAAGCGGGCCGCCGACGCGCTGGCCAAG
TCGCTGGGCAACAAGGGCGAGGTGGCGATCCTGCTGGGCGCTCCCGGCAACAACGTCACCACGCTGCGGAC
CAGCGGCTTCAAGGACGAGATCGCCAAGGTCGCGCCGGACATCAAGATCACGTTCGAGCAGACCGGCAACT
TCTCCCGGGAGGACGGGCAGAAGGTCGCCGAGCAGCTGCTGCAGTCCAAGCCGAACATCAACGGCATCTAC
GGCGAGAACGACGAGATGGCGCTCGGCGCGATCACCGCGCTCAAGGGCGCCGGCAAGAAGGCCGGCGACGT
CAAGATCGTCTCGATCGACGGCACCAAGGGCGCGGTGCAGGGCATCGTGGACGGCTGGGTCTCCGCGGTGA
TCGAGTCCAACCCGCGCTTCGGGCCGCTGGCCTTCGACACCGCGACGAAGTTCTTCGGCGGCGAGCCGGTC
GGCCAGGACATCGTCATCCAGGACCGTGCCTACGACGAGTCGAACGCCAAGACCGACATCGGCAGCGCGTA
CTAGAGAGCGCTCCCAATCGGGTGTCCGGGGATGAACCGGGCACCCGCCGGCACGGAGGAGGGCGGCTCAT
GCTGCTGGAAGTCTCCGGCGTCTCCAAGACCTTCCCCGGCGTACGCGCCCTGGACGGGGTGTCCTTCACCC
TGAACCCGGGCGAGGTGCACGCGCTGGTGGGGGAGAACGGCGCCGGCAAGTCGACGTTGATCAAAGTGCTC
ACCGGGGTCTACCAGCCGGACAGTGGCGAGCTGCGCTACCGCGGCGAGCCGGCCCGGTTCGCCACCCCGCT
GGACGCCCAGCGGGCCGGTATCTCGACCATCTATCAGGAGGTCAACCTCGTCCCGCTGATGAGCGTGGCGC
ACAACCTGTTCCTCGGCCGGGAGCCGCGCAACCGGTTCGGGCTGCTGGACGAGGCCCGGATGGTCGCCGAG
GCCACCGAGATCCTGGCCGGTTACGGCGTACGCACCGATGTCCGCCGCCGCCTCGGCACCCTGGCCCTGGG
CGCGCAGCAGATGGTCGCGCTCGCCCGGGCCGTCATGGTCGACGCCCGGGTCGTGGTGATGGACGAGCCCA
CCTCGTCGCTGGAGCCGCGCGAGGTGGAGACCCTGTTCGGGGTGATCCGCGAGCTGCACACCGCGGGCATC
GGCATCGTCTACGTCTCGCACCGGCTGGACGAGCTCTACCGGGTGTGCGACGCGGTCACGATCCTGCGCGA
CGGCAAGCTCGTGCACACCGGCCGGATGGCCGATCTCGACCGGCGCACGCTGGTCTCGCTGATGCTCGGCC
GCGAGTTCGGGGCGGACTTCACCAGCTTCTCCGAGTCACCGCAGAGCACCCCGGAGGGCGAGCCGGTCCTG
CGGGTGTCCGGCCTGACCAGCCGCCCCCGGCTCGACGACATCAGCTTCGACGTGCGCCCCGGCGAGGTGGT
CGGCCTGGGCGGCCTGCTCGGCGCCGGCCGCAGCGAGACGATCAAGGCGATCGGCGGGGCGTACCCGATCG
ACTCCGGCGTGATCGAGGTCGGCGGCGTCCGGCTCGGCAGGCCCAGCACGGTACGGGCGGTCCGCGCGGGC
GTGGCCACCCAGCCGGAGGACCGCAAGGCCGAGGGGATCGTCCCCGGCCTGTCGATCCGGGACAACATCGC
GCTCGCGATCCTGCCGCGGATGGCCCGTTTCGGACTGGTCAGCGACAAGCGGATCGACAGCATCGTCGCCA
CGTACATGAGCCGGCTGCGGATCAAGGCGTCCGGTCCGGACCAGGCGGTCGGCGATCTCTCCGGTGGCAAC
CAGCAGAAGGTGCTGCTCGCGCGGCTGCTCGCCACCGGCCCGAAGGTGCTGCTGCTCGACGAGCCGACCCG
GGGCATCGATGTCGGCGCCAAGGCCGAGGTGCAGGCGCTGATCGACGAGCTGGCGAAGGAGGGGCTCGGTG
TCGTGCTGGTCTCCTCGGACGCCGAGGAACTGGTCGAGGGCGCGGACCGGGTGGTGGTGCTGCGCGACGGC
GCGGTCGTCGGCACCCTCACCGGCGACCGGGTGACCACCGAGGCCCTGATGGCCACGATCGCGGAGGCCGC
GGATGAGCACTGAGACCCTGACCCGCCCGCGGATGACGTTCAACCCGGCGTGGGCGGCACGCTACGGCGTC
TACGCGGCGATCGTTCTGCTGATCGTCGTCAACATCGCCTTCACGCCGTACTTCCTGACCCTGAGCAATCT
GCGGATCCAGCTGATCCAGGCGGCGCCGGTGGTGATCGTCGCGCTCGGCATGGCCCTGGTCATCGGCACCG
AGGGGATCGACCTCTCGGTGGGTTCGGTCATGGCGCTCGCCGCGGCCTTCATACCCCTCTATCTGGGGTAC
GGCGTGACAGCCGCGATCCTCGTCTCGCTCCTCGCGGGTGTGGCGGTCGGGCTGATCAACGGTGTCCTGGT
CGCGAAGGCCGGCCTGCAGCCGATCGTGGCGACGCTGGCCCTGTTCGTCGGCGGTCGCGGGCTGGCCGTGG
TGATCTCCGGTGGACAGCTCAAGGACGTGCGCAACGCCGACCTGCTCTACCTGGGCTCCGGTGACCTGCTC
GGCGTGCCGGTCCTGGTCTGGATCGCGGCGCTGCTGGTGCTCGTGGTGGCGTTCGTGGTCCGGCGTACCGT
CTTCGGCCGGCGCCTGCTGGCCGTCGGCGGCAACCGGCCCGCCGCCGAGCTCGCCGGCCTCCCGGTCAAGC
GGGTGCTGATCGGCGTCTACGTCTTCTGCGCGGTGCTCGCCTCGATCGCCGGCCTGCTCTCGGTCGCGCGC
ATCCAGTCCAGCGACGCGTCCGCGGTCGGCCTGCTGATCGAGCTCTCCGCGATCACCGCGGTGGTCGTCGG
CGGCACCCCGCTCACCGGCGGCCGGGTCCGGGTGCTCGGCACCGTGGCCGGGGCCCTGCTCATGCAACTGG
TGGTCGCCACCATGATCAAACACGATCTCCCGCCGTCCACCACCGAGATGGTGCAGGCCGTGATCATCCTG
GTCGCGGTCTACGTGGCCCGGGAGAGGAGGACCCGGTGACCATGTCGATCCCCGTGCCCGCTTTCCGGAAC
CCCCGGCTTCCGCAGCGCGGACAACGCCGGCACGATCCTGGTCGCCGCGGCGCCACCGATGCTGATCGCGC
TCGGCATGACCTTCGTGATCATCACGGGCGGGATCGACCTCTCGGTCGGCTCGCTCTACGTGCTCGGCGGG
GTGGTCGCCGCCTGGGCGTCGCAGTGGGGAGTCGTCGCGGCGCTGGCCGCGCCGTTGCTCCTGTGCGGGGC
CATCGGCGTACTGAACGGGATCCTGATCTCGAGAACCGGGATGGCGCCCTTCATCGTCACCCTCGCCGCGC
TGCTCGGCGCCCGTGGCCTCATGCGCAGCATCAGCGATGAGGGCTCGACGACGTACCTGGTCAGGAGCGAC
GTCTTCCACGAGCTGGGCACGGGATCCCTGCTCGGCGTCGGTCTGCCGGTCTGGCTGGCCGCGGTTCTGGT
CGGCGCCGGGATCCTGGTGCTGAACCGGACCCGGTTCGGGCACGCCGTGCACGCCATCGGCGGGAGCGAGG
ACGCCGCCGCGCTGATGGGGCTGCCCGTACGGCGAATAAAGGTCTGGGTCTATCTCCTCTCCGGGCTGCTC
GCGGGACTCGCCGGTGCGATCAACGCGGCCAAGCTCGGCTCCGGGGTCACCGTGCTCGGCAGTGGCATGGA
GCTCGACGCCATCGCCGCCGTCGTGATCGGTGGCACGCTGCTCACCGGCGGCTCCGGGTCGATCGCCGGCA
CGGTCGCGGGGGTGCTGCTGCTCGGCGTGATCCAGAACCTGATCAACCAGGTCGGCAACGTCAACAGCAAC
TGGCAGCAGGTGATCAGCGGTGGGTTCCTCGCCGCTGTGGTCGTGGCGCAGACAACTCTCGTACGCGCAAG
AAGATCTTGACGTGGAGGCCCGCCCGGGGACCCTGCCGCGGGCGGGCAGGCGTAGGTTGCCCGCATGACGG
AGCATCGGGTCTCCCCGGCCGGGCGGGCGCTCGCGTGGCTGATGCTGGTCTCCGGGTTCGCCGCGGTCGTC
GGGTCGTTCCTGCCGTGGGCCTGGGTCGACTTCCCGGAGCAGGGCAGCAGCCAGGTGTCCGGGAGCCTCGT
GTCCGACCTGTTCACCGCGTTCTTCGGGGTCGTGCTCGCCGGGTACGCGGTGCCCGCCGTGCGCGGCGAGC
GCCTGCCCGGCCTCGAGACGTTCTTCTCGGTCGGCGCCGGGCTGGTGCTGTTCACGCTCGGGGCCTGGGAC
AGCCGGCACCTGACCTCGATGACCGCCGCCCTGGTCGCGGCCGACACCGGCACGACCATCGGGCCCGGTCT
CTGGCTGTGCATGATCGGCGGCCTGCTGGGCGCGCTCGCGGCGGCGGCCCTCGCCGTCCGGGGACGCCGGC
CGGTCGTCAGCTCCCGGGTGTGACCACCCAGTCCGGGTGGTTCGGCATCGGAGGGGTCGTGACGCCGAGGA
GCCAGGAGGTCAGGAACGGCCGCAGATCCTGGCGGGCGACCCGCGAGGCGAGCGTGATGAAGTCACCGGTC
GAGGCGGAGCGGCCGCGGTACGTCGTCAGCCAGGCGCGTTCGACCCGCTGGAACGTCGCCGCGCCGATCTT
CTGCCGGAGCGCGTAGAGGACCAGCGCGCCGCCGGCGTAGACGTTCGGGTTGAAGACGTCCCACGTGGTCG
CCGCGTCGAGCGGGGCGGCGACCGGACCGTACCTGGCGCGGAAGATGTCGCCGGCGGCGTAGACGGCCTTG
AAGAACGCCTCGCGGTCGGCCAGGCCGGTGTACTGCGGGAACCCGCCGGTCTCCTCCGACCAGAGCATCTC
GTACCAGGTGGCGTGGCCCTCGTTGAGCCAGACGTCGCTCCACGAGAACGGCGAGACGCTGTCGCCGAACC
ACTGGTGGGCCAGCTCGTGGGTCATCGACGGGCCGCGGGTGGTCTCGGGGCCGGTGAACAGGGCGGCGCCG
TACAGCGAAAGGGTCTGGGTCTCCAGGGCGTAGCCCAGGTCGTCGTCGATCACCAGGGAGCCGTAGTCCTC
GAACGGATAGGGCCCGGCCTGCTTCTCCATCCAGGCGAGCTGCTCGCGTTCCCCGGCGATCGCGGGCAGCA
GCGTGCCGGCGAGGCGTCGCGGCACCACGTCGCGGATCGGGGTGCCGCCGGCCGCCGGGCGGCGCTCGACC
ACGAAGTCGCCGACGGCCGTCTGCACCAGCTCGGTGGCCATCGGGGCGGACTCGCGGTAGACCGAGCTGAC
GTGGCCGTCGTGCTCGGTCGTGCTCACCAGCGTGCCGTTGGCCGTCCCGGTCCAGCCGGCCGGCACGGTGA
GCGTGATCGTGAAGGTCGCCTTGTCCCGTGGATGGTCGTTGCCGGGGAACAGCAGGTGCGCCGAGCCGGGC
TGGGCAGCGAGCACCGTCCCGTCCGGCGTCGCCACGAGAGCGGCCGGGGCGGCGGTGAAGTTCGCGACCGT
GACCCGGAACAGCCGCCCCCGGGGAAGGGGGCGCCGCGGGATGACGGTCAGCTCGTCGCCGTCCCGGGCGG
CCCGCGCGGGCTGCCCGTCGACCGAGACGCGCCCGATCGAGGCGCCGCCGAAGTCGAGGTCGAAGCGGGAC
AGGCTCTGCCCGGCGACGGCGGTGATCGTCACATCGCCGGATACGACCTGCTTCGGGTCCTTCTCCGGGTA
GCGCAGGCGGAGGTCGTAGTCGAGCACGTCGTAGCCGCCGTTGCCGAGCAGCGGGTAGAGGCGGTCGCCGA
GGCCGGCGGACCCGGGTGACGGCGAGGGCCCGGCCTGCGCCGGTGCGGCGGCTGCGGCCAGGGCGAGGACG
ACGGTGGCGCCGACGGTGAGGACGCGGGTGCCCGCGGACGTTCGCATGGCTTCCGACGCTAGGCGACACCA
CCGGAAGCCATCGACCCATGGGCATGTATGAAATCCCACAATCTCCGATGTGGACGGACGGATGGTGCGCA
GTATGCAACTTGCAGATTTCGGGACATTCCCTAGCCCGGCGGTTGCCGTGTGCACCCGTTCGACCACTGTC
CGGAACCGCGTGGTGAGCAGGGTGAACGTTCATGCGGCCCGGGCCGCCGGAGGTCCCGTGACCGTTCGCAT
TGCCGTGCGCCGGTGAATCACTCCGCTTTACGACTTCGCGACAAGTGGTTAATGTCGGCGAAGCGATATAT
CGTCCAGTTATTCGGGGGACTGCGGTGCATGAGCAAAAAATCACTCCGGCGATTGCCAGCGGATCACCGCA
AATTGAATTGCTGCCCGTCAATTCCCTGCGAGTGATGGATTCGCCGCGACTGAACGGTGAGGACCCGCGGC
ACACCGAGGTGCTCGCCGGCTTCGGGGCGGAGCTCCCGCCGATCGTCGTGCACCGGGCGACCATGCGGGTC
ATCGACGGCGCGCACCGGCTGAGCGCGGCCCGGCTGCGCGGCGACGACCGGATCAGGGCGGTGCTGTTCGA
CGGCACCGAGCAGGAGGCCTACGTGCTGAGCGTCAAGGCCAACGTGACGCACGGGCTGCCGCTGTCCGCCG
CCGAGCGCACCCGTGCGGCGGAGCGCATCATCACGATGCATCCTGACTGGTCGGACCGGATGATCGCGGCG
TCCAGCGGGCTGGGCGCGCGGACCGTCGGCGGCCTCCGCCGGCGGCGCGCGGCCTCCGGCGAGAGCCCGGC
GGGCCTCCGCTCGCGCGCCGGCCGGGACAGCCGCGTCCGGCCGGCCGGCAGCACCGCGGGCCGGCTGAAAG
CGGTCGACTACCTCCAGGACCGGCCGGACGCCTCACTGCGGGAGATCGCCCGGCACGCCGGCGTCTCTCCG
TCGACCGCCCGTGACGTCCGGGACCGGCTGCACCGCGGCGAGGACCCGATCCCCGCCACGCAACGCGCGGC
GGCACGCCCCGGAAACGATTCCCCGCCGCTGCGGTCGCTGGTCCAGGGCTTGGCGAGCGACCCGTCGTTGC
GATTCAGCGAGTCCGGGCGCGATCTGCTGCGCTGGTTGATTGCCCACGCCGTTCAGGACGGCGAATGGAAA
GGGCTGGTCGACACTATTCCGGCGCATTCCGCGCAGGCGCTGGCGAAAATCGCGCGCCATTGTTCGCGGGA
ATGGCGTGAGTTCGCGGACATCCTGGAGAAGGACGCCGCGTAGGCCACCGGCATTTCTTCCGGCACCCGGT
CCGCCCTCCGTCACGCACAGGTCAGAGTACTGATGGCGGCTGTCAACCCGCCGATCTGCGGGTAGGTGCCG
ACGTCCTTCCGCCGACCGTCTGCCGAACGCATCCGGTCGGTGCCCGATGTGCGGGTAGGCATTCACCGATC
AGGGTTGCTCCAATGTCTCTCGTCGATACCGCGGCTGATACCTCCGCGGTACTCGGCAGAACACTCCGTGG
CTATGGCGCCGTGGTCCCGGAGCCTTTCCTGAAGTACTTCGGACGTACCTGTCCGGAGTCCCCCACAGAAG
GAGACATCATGTCGGCCATCACCGTGGAAACCACCTGGAAGAACACCGACCTCCGGGAGGACCTCACCGCT
CACCCGGCCGGCCTCGGCTTCGGCGAGCTGAGCTTCGAGGACCTGCGTGAGGACCGCACCATCTACGCGGC
CAGCAGCGGCTGGGTCTGCACCCTGACCATCGAGTGCGGCACGCTCGTCTGCGCCTGCTGACCAACGGTCA
TCGCACTGCCGGGACCGGGGCTGACCCCGGTCCCGGCACCCTCTCCCCGGCAGGAGCCTGCATGTCATCCT
TTGCGATCGCCGCTTCGCCGGCCAGCGCGTACCTGCACGAGCGCTCCGCCGGCCCCGGCGGCGACCCCGTG
GCGGAGCACGAGCGGGTCGAGTCGTGGCGCGAGTCCGCGTTCCTGGACGACCCGGTCCTGGACATCCGCCT
GCGCGAGCTCGGACTCAGCCGGGCCGAGTTCGGCCGGCTGCTGACCGACGGCGCGTACGACGCCGGGAGCA
CGGCCCTCGACTGGGCCGGCGAGCTGGCCGCCGTGCTGGCGACCGGGACCGGCGCGGTCACCGGACTCGCC
CGGTCGACCAAGCTGTGGGCGCAGGGCTTCGACCGGCTGCCGTTCGCCGGGCTGATCGAGAGGTTCCTCGC
GTACTACGAGCCGCGGGTGCCGCGCACCGCCGGGACCGTCCGGGTGTCCCTGCTGGAGAGCCTCGCGAACC
GCCTGCTCACGGTCGCGACCCGGACCCTGCTGCTGGAACTGAACGTGGCCCGGGTGCACGGCCGCCTGACC
GGCGCCACCCCCGGGGAACGCTACGACCACTACGACCGGGTCCTGCTGACCGACCCGGACTACCTGCGCTC
GCTCTTCGGCGAGTACCCGGTGCTCGGCCGGGCCATGGTCGAGTGCGGCCGCCGCTGGGCGTCGGCGATGG
CCGAGCTGTTCCAGCGCCTGGACGCCGACCGTCCCGCCCTGCACGCCGCCGGGCTGCTGCCGGCCGGCGCG
GGCGAGGTCACCGCGCTCCGGCCCGACCTCGGAGACCCGCACAACAGCGGCCGCGCGGTCGCGATCCTGAC
CTTCCGGTCCGGTGCCCAGCTGGTGTACAAGCCCCGGCCGGTCGGGCCGGAGCGCGCGTACGCCGAGACCG
CCGCGGCCCTGAACCGGCACGGCCTGAGCCTGCCGCTGACCGCCGTGGACGTGCTCGACCGCGGCGCCTAC
GGCTGGTGCGAGCTGGTCCGGCACGAGCCGTGCGCCGACCGCGCCGACCTGGACCGCTTCTACCGGCGTAC
CGGCGCGGTCCTGGCCACCACTCTGCTGCTCGGCGCCGTCGACGTGCACATGGAGAACGTCATCGCGGCCG
GCTCGTCCTGCATGCCCATCGACCTGGAGACGCTGCTGCAGCCCGGGGTCCCGTCCGGTGACGCGACGGAC
GCCTACACCCGGGCGCTCGACCTGCTCAACCAGAGCGTGCTGGCGATCGGGATCCTGCCCGCCCGGGCGTT
CGGCGGCCGGGAGCGCAAGAGCGTCGACGTCAGCGCGATCGGCGGCGGCGAGGCACAGACCGCGCCCCGGC
CGGTGCCGATGGTCGTGGAGCCGTTCACCGACGTGGCCCGGATCGAGGCGGTGGAAGCGACCATGCTGGGC
GCGCAGAACCGGCCGGTGCTGGTCGGCGCCGAGGTGCGGCCCGAGGAGCACACCGAGGCGGTGGTGGCCGG
CTTCACCGAGGCGTACGACCTGATCGTCCGGCACCGCGAGGACTTCGCCGACCTGCTGGCCGGCTTCGGTG
ACGTCGAGGTGCGCTACCTGCCCCGCCCGACCCGCCGGTACAGCATGTTCCTGACCGAGAGCTACCACCCG
GACTACCTGCGCGACGCGCGTGACCGCGACCGGCTGCTCGACAAGCTGTGGACCGCCGCGGGCGCCCGTCC
CGACCTGATCCCCATCATCGAGTCGGAGAAGCGCCAGCTGCTGGCCGGCGACATCCCGTGCTTCCGCGCGC
TGGCCGGCGACCGGGCGATCCGCACCGCGTCCGCCCCGGTGGCGCCGGACTTCTTCGACGCCCCCGGCATC
GAGGTGCTGGCCGGCCGCCTGCGGCAGTTCGGGCCGGTGCACCGGGCTGCCCAGCTGCGGATCATCCGCGA
GTCGATGGGAACCATGCCCGCGCCCGGCCCGATCGCCGGGACACCCGCGCCATCCTCCGAGCGGCGTGGCG
GCCTCGACCCCCGTGAGGCCGCCACGCTCGGGGACCGGCTCGTGCGGGAGCTCGCGGACGAGGCGATCCTC
GGGGCCGACGACGCCGGCTGGATCGGAGTCAGCATCGAGGGCCTCGACCAGGAGACGTTCAGCTACAAGCC
GATGGCGACCGGGCTGTACGACGGCATCGCGGGAATGGCGCTGACGTACGCGTACGCCGCCCGCACGCTCG
GCGACGAGCGCTACCTCGACCTGACCCGCCGTACCGTCAAGCTGGTCTCCGGCTATCTGCGGTACCTCGCC
GAGCACCGGATCGTGGAGACGGTCGGGGCGTACAGCGGGATGGCCGGCCTGCTCTACACGCTGGATCACGT
CGCCCATGCCACCGGCGACGCGTCGCTGCTGGGCGAGATCGAGGCCGCGCTGCCCTGGCTGCGGGAGTGCG
CTACCCGCGAGGAGTGCCCGGACCTGATCGCCGGCCTGGCCGGTTGCGCCGTCGTCGCGCTGTCGCTGTAC
CGGCGGCACGGCATCGCCGGTTACCGCGAGGTCGCGGAGATCTGCGGCCGGCGACTGGCCGGCACCGCGGT
CGACGTCGAGGGCGCCGCGGGCTGGGCCGCGACCCGGACCGGCGTGATCCTCGGCGGTTTCTCGCACGGCT
CGGCCGGGATCGCCTGGGCCCTGCACGAGCTCGCCGCCGAGTTCGGTGACCGGGACCTGCGCGAGCTGGCC
GACCGGGCGGTCGAGTTCGACCGGCGGCTGTACGTTCCGGCCGCCGGCGCCTGGCGCGACCTGCGGCCCGA
GATGGCCGGCACCGACGGTTACCCGGCGCTCTGGTGTCACGGCGCCGCCGGCATCGGCCTGTCCCGGCTGC
TGATCCACCGGATCCGGCCGGACGAGCGGCTCGCCGAGGAGGCCCGCGCCGCGGTGGCGCTGGTCCGGCGG
CACGGCTTCGGCCACAATCACAGCCTCTGCCACGGCGACTTCGGCGCGCTGGCCCTGCTCGGCCTGGCCGA
CCGCGCGTGGCCCGGGTCGGGCGGCCACGACGAGCGTGCCGGCGCGGTCGTGCGGGACATCGGCGAGACCG
GTCTGCGCTGCGGGCTGGGCAACGGCATCCGGATGCCGGGTCTGATGCTCGGCGCCGCGGGCGCCGGACTG
AGCCTGCTCCGGCTGGCCGCGCCCGCCGACGTGCCCGCGGTCACCTGGCTGGAACCGCCGCGGGGCACGCA
TGTCTGAGACGGCCGGGCTGCTGCGGCGGAGCCTGCTCGATCACCGGGGCAAGCTCGCCGCCGTGGCCGGT
CTCGCCGTCGCCGGGGTCGGCTGCCAGCTGGGCCAGCCGTTCCTCATCCGGCGCGTGCTCACGGCGGTGCA
GTCCGCACAGCCGTACCGCCAATTGGCTCTCGCCGTTCTGGCGGTCATGGTCGTCGGCGCGGCGCTGGGCG
CCGTCCAGCAGTTCCTGCTGCAGCGCACCGGGGAGGCGATGGTCTTCACGGTGCGCCGCACGCTCGTCGCG
CACCTGCTGCGGCTGCCGGTCGCGGCCTACGACGAGCGGCAGTCCGGCGATCTGGTGTCCCGGGTCGGCGC
CGACACCGCCCAGGTGCGCTCGGTGATCACGTCCGGGGTGGTCGACCTGGCCGGGGGCGTCCTGCTCGTCG
GCGGCTCGATCGCCGGCATGATCATCATTGATCCGGTCCTGCTCGGCGTCAGCCTGGCGCCGGTGCTGTGC
GGCGCCGCCGGGGTCCGGCTGGTCGGCCGTCGGCTGCGCCCGCTCAGCTCGGCGGTCCAGGAGTCGATCGG
CGCGCTCACCGCCTCGACCACCCGGGCCCTCGGCGCGATCCGCACGATCCGGGTCGCCGGCGCCACCGAGC
GCGAGACCGCCCTGATCGTCGCCGAGGCCGACCGCGCCCGGGCGGCGGGCGTCCGGCTCGCCCTGGTCGCG
GCCCAGGCCGGCCCGATCGTCCGGCTCGCCCTGCAGGGCGCGTTCGTCGCGGTGATCGGCTTCGGCGGCTA
CCGGGTCGCGAACGGCGCGGTGTCGGTCGGCGACCTGGTCGCGTTCACGCTGCTGCTGTTCACGCTGGCGC
TGCCCCTGGCCCAGCTCGCCGAGGCGGCCACCCGGATCCAGACCGGGCTGGGCGCGCTGACCCGGATCGAG
GAGATCCTGGCCCTGCCGGACGAGGACAGCGCGCTCGGCGTCCGTGCGAGGACGCCCGCCACGGTCCGGCA
CGATCCGGTGCTGCTGGAGTTCGATCACGTGTCGTTCCGCTATCCCACCGGCGGGGAGATCCTGCGCGACG
TCAGCTTCCGGGTGCCGGCCGGCAGCACCACCGCGCTCGTCGGGCCGTCCGGGGCCGGCAAGTCGACGATC
CTGGCACTGATCGCCCGGCTCTACGAGGTCCACGGTGGCCGGATCCTGCTGCACGGCCGCGACATCCGCGA
CTACCCGCTCGCCGAGCTGCGGGCCGCCCTCGGCTACGTCGAGCAGGAGGCCCCGGTGCTGGCCGGCACCG
TCCGGGACAACCTGACACTGGCCGCGCCGGACGTCGCGGAACACGCGATCCGCCACGTCACCGCATCGGTC
AACCTCGACGACCTGCTCGCCCGTGACCCGGCCGGCCTGGACGCGCCGGTCGGGGACGGCGGCGTGCTGTT
CTCCGGCGGTGAACGGCAACGGCTCGCCGTCGCCCGGACCCTGCTCGCCCCGGGCGAACTGCTGCTCTTCG
ACGAGCCGACCGCCCACCTGGACGCCCGCAACGAGCAGGCGCTGCAGCACGGCCTGACCGCGCACGCCGCC
GGCCGGACGCTGGTGGTGGTCGCGCACCGCCTGGCGACCGTCGCGCACGCCGACCAGATCCTGGTGATCGA
CGACGGTCGTTCGGTCGCCGCCGGGCGGCACGAGGAGCTGCTCGTCCGCGACCCGACCTACCGCGAGTTCG
CCACCCGTCAACTGCTGACCTGAATCCCGAGGTGTACGCCATGCTCAGTGTCCTGGACCAGGTGCCCGTGT
TCCGTGGCGACGACCCCGCCGAGGCGGTCCGCGAGGCCGTCGGGCTCGCCCGGGCCGCCGAGTCGCTCGGC
TATCACCGGTTCTGGATCGCCGAGCATCACGGCAGCGCCGCCAACGCGTGCGCGGCGCCGGAGATCGTGGC
GGCGGCCGTCGCCGGAGCCACCGAACGGATCCGGGTGGGCACCGGGGGAGTGCTGCTGCCGTACTACAGCC
CGCTCAAGGTGGCGGAGGCCTTCCGGGTGCTGGCGGCGCTGTATCCGGGGCGGATCGACCTCGGGTTCGGG
CGGGGCAGGGGCGGGCCGGCGGTGATGGCCGAGCTGCTCAACCCGTACGCGATCGCGACCGAGGAGGCGTA
CGCCGAGCAGGTCGGCCGGCTTCTCGCGTTCCTGGGCGACGCGCGGACCGTCAGCCGGGTGTCGGTCACGC
CGGCGGTGCAGGACCCGCCGTTGCCGTGGCTGCTCGGCTCCGGCGTCGGCAGCGCCCGCCTCGCCGGGATG
CTCGGCGTGCCGTTCTGCTTCGCGCAGTTCATCGCGACCGAGGAGTGCCCGGAGGCGATCGCGGCGTACCA
GGAGTCGTTCCGGAGCTCGCCGTGGCTGGACGAGCCGCAGGCGATGCTGGCGTTGCGGGTGCTCGCGGCCG
GCACCGCCGAGGACGCCGAGGAGCTGGCCACCGGCTTCTGGATGTCGTGCACCACCGGATGGCGGGCCCAG
GTCCGGCCGGACGACGACTACCGGGGTGGCGTGCCGAACCTGGCGGACGCCCAGCGGTACACGCTGACCGA
GGAGGACCTGGCGATGCGCGCGAGCCGGCCGTACCTGCAGATCTCCGGCACGGCGGAGACGGTCGGCGAGG
AGATCCGGCGACTGCGCAAGGTGTACGACGTGGCCGAGGTCATGCTCACCACGAACTGTCCCGGGGCGGCC
GCCCCGGCGCCGGTCCTACGAGCTGCTGGCCGCCGAGCTCGGGCTGACCGCGCCGGCGTGACCCGGGTCAG
GCCAGCTCGTCGGTGGTGAGGCCGGCGGCGTACGCCAGCACGGCGGCCTGCACCCGGTTGGCCACACCGAG
CTTGCGCAGGATGACGCTGACGTACTCCTTGACCGTGGAGTCGCTGATGAACAGGCGCCCGGCGATCTCCG
CGTTGGTCAGCCCCTGCCCGATCAACCCCAGAACGGCCTGTTCCCGGTCGGAGAGCTGTTTGACCTCGTCG
ACCGCGTTCTCGGCGGCCGGAGTGCCCCGGCAGGCCGCGCCCAGCATGATCGACGAGGCCTCCGGCGCCAG
CACGGTCACCCCGGACGCCAGCGCGCGGACCGCCGCGACCAGTTGCTCCGGCTGACTGTCCTTGAGCAGGA
AGCCGCAGGCGCCACCGCGCAGCGACTCCAGCACGGTGCTGGACGCCGCCAGCGTGGCCAGCACCGCCAGC
GCCGGCCCGGACTCCAGGTCGCGCAGCCGGGTCAGCAGCGGCACGCTCTCCGGCAGGGTCGCGTGCGCGTC
CAGCAGGACGACCGCGGGCCGGTGCTCGCTGACCGCGGCGAGCGCGCTGTCGCGGTCAGCGGCGACGACGG
AGAAGCCACCCATCGTCTCCAGGATCATCTTGATGCCGATCGAGACCAGGGCCTCCTCGGCCACCACCAGT
ACGTCCGCCATGCCTCCCCCGGGCAATGTAGCCGTACGAGATTTGATAGTGCACAAAAACCATCGAATTAC
TGCTCTTTCGAATCATACATGTATTTATGCAAATTTCTGGTCAGGAAACGGGGACGATCCGAGACGCCCGG
GCCGGCGTCTCGGATCGTCCTTCACCGCGCACGGCTATCGCACGAGCCCTTCCGCGGGGGCGATCCGCGTG
GCTCGCCGAGCCGGCGCCAGGCTGGCCAGCACACCGGTGACCGCGGCGGCCACCAGCACGAGACCCAGCTG
CGGCCACGCCAGCATGATCACCGGTTCGGCCTGCCGGCCCACGGCCGCGATCACGCCGACCAGCCCGACCG
GCACCCCGATGACGATGCCGGCCACCGTGCCGACCAGCGTGATCGTGACCGCCTCGACGGCGACCATCGCG
CGCAGCCGGCTCCGGCGGGTGCCGAGCGCCCGCAGCAGGGCCATCTCCCGGGTTCGTTCGATCACCGAGAG
GCCGAGCAGGTTGGCGATGCCGAGCAGCGCGATCACCACGGTGACCGCCAGCATGCCCAGCGACAGTCCGA
GCAGGATGGACAGGACGTTCATGATGTCGCCGCCCTCGGTGACACCGCCGCCGACCTCCACACCGGCGTCG
CGTGCCGCCACCGCGTTGACGTCGGCGGCCAGCGTCTCCCGGTCGAAGCCGCCCGGCGCGGTGCCCCAGAC
CGTGGTCGGCACGGTCCGGACCCCGGCGGCGGTCAGGACGTCACCGGTGGTGACGCCGAGCAGCTGCCCGG
TCGTGTCGGCCAGCCGCGAGCCCCGGGCGGTGAACCGCAGGTCCCGCCCGCCGGCCGTGACCGTGAGCGGA
GCACCGTCCGTCAGCCCGCGCGCCGTCAGGTAGGAGGCCGGCACCAGCAGCACCGGGTCCCCGGTGGACGC
GCTCAGCTCCGGCGCGAGGCGCCCGGCCACGTCGGTGGGGAGCGCCGCGATCCGGGCCGGCGTGGGTTTGC
CCGCGGCCGGGAACGTCGCCGCGCTCGTCGCCACGGTGGCCGTGGTCAGCCCGGTGATCCCGGACAGCGCC
CGGACCGTGCGGTCGTCGATCGCCGCGCCGTCGGTGTGCACGCTGACCGCCACCGGATAGCGCGCCTCCAG
GTCGGCCTCCACCGTGGCCCGCCCGCTCGCCGAGGCCACGGCCAGGCCGGTGATCAGCGCGGCCCCGACGA
CCACGGCCATCGTCGCCGACGCCGTCCGGCGCGCGTTCTGCCGGAGGTTGCTGCCGGCCAGGCTCGCCGCC
ACCCCGAACCGTTCCAGGCCGCGCGCCGCCGGCGGCAACAGCAGGGCGATGCCCAGCGGCAGCGCGGTCAG
CAGCCCGGCGGCGAGCAGCACCCCGCCGACCAGCGCGAGCGGCAGGGAGGTGCCGATCGCGGCGAGACCCA
GCACGCCCACGGCCAGGCCGATCAGGATCAGCCCGGCGACCAGGCGGCGCCCGCCGCGGACCTGTGCGGGA
AGAGCGTCCGGCACCTCCTGCAGCGCGCGCACCGGGGGAACCCGGGTCGCACGGCGGGCCGGCGCCCAGGC
CGCGACGACCGTGGCGCCCACCCCGGTGAGCACACACAGCGCCAGCACGATCGGGTTGACCGCCAGGCCGC
CGCCGTTGATGTCGAGCAGGCCGGCCCCGAGATAGCCGAGCCCGACACCGGCGACCGCGCCGATCACCGCG
CCGATGCTCCCGGCGATCGCCGCCTCCGCCAGCACCACCCGGCTCACCTGGCGGCGGTGCCCGCCGACCAG
CCGCAGCAACGCGACCTGGCGGACCCGCTGGGAGACGATCACCTGGAAGGTGTTCGCGATGACCAGGATCG
ACGCGAGCAGCGCCACCGCGGCGAACGCCAGCATCAGCACGACCAGCTGGGTGTTGCCACCGGCGAACCGG
CCGGCGGCCGCGTCGGCGGCCGCCGACGCGTCGGTCGCGGTCGCCCCCGGCGGCAGGGCCCGGCCGACCGC
GTCGACGGTCTCGGCCAGCCGGTCCCGGTCCGTGACGGTGAGCAGCGCGGCCGGCGGCGTGTCCCCGGCGA
AGAACGACGCGGCGGCGTAGAACCGGTAGTCCGAGCCGGTCAGCGGGCGGAAGCCGAGATCGGCCGAGCCG
ACCACGGTCACCGGCACCGGGGCGGCCGTGCCCTGCCGGAAGTCGAGGTGGGCGCCGACCCCGACGCCGAG
GTCGGTGAGGGTCCGCCGGTCGGCGACGACCTGCCCGGCCGCGCTCGGCCAGGTGCCCTCGTCGACGGTGA
ACCAGCGCACCGACGCGGTCGCCGGGATGCTCTGCACGTTGGCCGAGCCGCGCCGGTCGCCGCCGAAGACG
CTGACCGTCCGTGCGTACTGCGGGTCGACGCTCCGCACGCCCCGCACCCCGGCGGCCGCCTGGTACCACTG
CGGGTCGTGCACCGTGTCGTCGGCGTCGAGCACGATGTCCGCCGTGGTCAACGGGGCCGCGGCGGTGAGCC
GCAGACCCTCGTCCGAGGTGCTCGCGAACGTGGCCGTGGCGGCCAGGAAGCCGGTGGCCAGCACGACCGCG
GCGACGATCGCGAGCAGCCGGCCGGGGTGCGACCGGACCTGCGACCAGGCCAGCGTGAAGATCATGACGTC
ACCGTCACCGACGCCATGACCGACATGATCGACTCCAGTGTGGGCGCTCGGAGCTCGTCCCAGAGCCGCCC
GTCGGCCATGATCAAGACCCGATCGGCGTACGTCGCGGCGGCAGCGTCATGCGTCACCATGATGATCGTCT
GGCTGGCCTGCCGGGCGGCGTTCTGCAGCCCGGCGAGCAGCGCCCGGCCGGTGGCGATGTCCAGCGCGCCG
GTCGGCTCGTCGGCGAACACCACCGACGGCTCGGTGAGCAGCGCGCGTGCCACCGCGACCCGCTGCTGCTG
GCCACCGGACAGCTCGGCGGGCCGATGGCCGAGCCGGTCGCCGATCTGCAGCGACGCGGCGATGCGCTGCA
GCCGGTCGCGGTCCACCGGACGGCCGGCCAGCCGCAGCGGCAGCACGATGTTCTGCTCGGCGGTCAGCGTG
GGCAGCAGGTTGAACGCCTGGAAGATGAAGCCGACCCGGTCCCGGCGCAGGTCGGTGAGCGCGCGGTCGTC
CAGCCCGGCGAGCGCGGTGCCGGCCAGGCTGACCTCGCCCTCGGTCGGTGTGTCCAGCCCGGCGAGCAGGT
GCATCAGCGTGGTCTTGCCGGAGCCGGAGGGGCCCATGATCGCGGTGAACTCGCCGGCCGCGAAGGAGGTC
GACACCCCGTCGACGGCGACCACCGCGGCGTCCCCGGTTCCGTACCGTTTACGCAGGTTGCGGCAACTGAC
CATGGAGCTGCTCTTCGTCTGCATCATCACGGTTGCGACGTTAGGGAAGTGGCGGGCCGCCCACATCCGTC
CGGGGCATCGCCGCGACCGATACCAAGGTATCGACCTGGCGTGCGGATGGTGCCGCGAGCGCTCGCGGTCC
CTACTCTGAGAGCGTGGGAAGCTGGGACAGGAGAACGCTGACGGTCGATACGGTGATCGCCGGCGCCGCGG
TCATGGTGTGCCTGCTGCTCGGGTTGGCCGGTCTGGACGAGTGGTACTGGTCGGCCGCGCTCTGCGTCCCC
CTGGTGATCCGGCGCTCGGCTCCGGTGGTCTTCCTCGCGCTGGTCGCGGTGCTCTCCGGCATCCACATGAT
CTACTCCGGCAGCTTCGCGTTCCCCGGTGACCTGGTCGATCTGGTCGCCGTGCACGCCGTCGCCGGTTACG
GCCCGGCCCGGGTCCGGCACCTGGGCCTGCTGCTCGGCGTGGCCGGCAGCCTGGTGGTGACCGCCCGGGCG
CTGCACGACGGGCTGCCGTCGTCCGCGACGCTGCCCGCCGCGCTGATCGTCGCCGCGACCCTGGCCGCCTG
GTCGACCGGCCTGATGCAACGCCGGCAGCGGGCCGACGTGATCGAGGCCGATCACCGCCGCCGGCTCGCCG
AGCAGGACAGCGCGATGCGTGCCCGGCTCGCGGCGATCGAGGAGCGCACCCGGATCAGTCAGGAGATGCAC
GACATCATCGCCCACTCGCTGGCCTCGGTGATCGCCCAGGCCGAGGGCGGCCGGGTCGCCGCGCGCGCCGA
CGCGGTCGTCGCCGGCCCGCTGTTCGACCGCATCGCGCAGATCGGCCGGGAGGCCCTCAACGACGTGAAGC
GGCTGCTGAACTCGATCGACGGCGACACGCCGGACGACTTCGCGCAGGGCCTGCCCGACCTGCCGGGCCTG
CTGGCCGGGGTCTCCGCCGCCGGCCTCGACGTGACGTTCGAGGTGGCCGGCCCGGAGCAGCCGCTCGCGTC
CGGCATGGACCTGGCGGTGTACCGGGTGATCCAGGAGTCACTGACCAACGTGCTCAAACACGCCACGCAGC
GGCAGGCCCGGCTCAGCCTGGTGTGGACGCCGGCGTGGCTCGAGGTCAGCGTGACCAGCCCGCTGACCTTC
GCCGGCGCGCTCCGCGAGGGTCGCGGGCTGTCCGGCATCCGGCAGCGGTGCTCGTTGTTCAACGGCGACTG
CGAGATCGTGGCCGGGCAGACCTTCAGCGTGATCACCCGCTGGCCGCTCGCCCGTCCGGAGGTTGCCGTCC
CATGACCGAGCCGCAGATCGACGTGGTGATCGCCGACGATCAGGACCTCGTCCGGACGGGCTTCGCCCTGG
TCGTCGACTCGGCCCCGGACATGCGGGTGGTCGCGACCGCGGCGGACGGCGCCGAGGTGGTGCGGCTGGCC
GCGGAGTTCCGCCCCGACGTGGTGCTGATGGACATCCGGATGCCCCGGGTCGACGGCATCACCGCGGCCCG
GGCGATCCTGGAGGGCAACGCTCAGCCGCCGAAGATCGTCGCGCTGACCACCTACGACAACGATGAGTACG
CCAGCCGGATCCTGGCCGCCGGCGCCAGTGGGTACCTGTTGAAGGACACCACCGCCGAGGGCCTGACCGCG
GCGATCCGGACGGTGCACCGCGGCGGCTCGGTGCTGGCCCCGTCCACCACCCACCGCCTGGTGACCGCGCA
CCGTCAGCATCCGGCACGCCCGTCCGCGCTGCTGGATTCCTTCACCACCCGGGAGCGCGAGGTCTTCGACC
TGATCGTGGCCGGCGCCAGCAACGCGGAGATCGCCGACCGCCTGAACCTGGCGGAGGTCACGATCAAGACC
CACGTCGGCCGGGTGCTGGCCAAGATCGGCGTCCGCGACCGGGTGAACGTCGTGATCTGGGCCTACCGGAA
CGGCGCCGGGCCGAGCTGAGCAGGGGCCAGGCCGCGCTCGCACTCGGCCGAATCCCGAAAAGCGGCTAGGG
GAAGCGGATCTCGGCGGCCAGCGGCAGGTGGTCACTGCCGGTCCGGGGGAGGGCCGTCAGCCGCGTGACCG
TCATCGATCGCGCCAGCACCTGGTCGATCCGGGCGACCGGCGTCCGCGCCGGCCAGGTGAACGCGAAGTCC
GCGGGCGAATCGATCATCACTTGCCGGATCGGCCGCAGCCCGCGGTCGTCCACCGACGTGTTCAGGTCCCC
GATCACGACCAGCCGCGGAACCGGGTCGGCGGCGAGCAGCGCGCCGAGCTTCCGGGCGCTCTCGTCCCGCC
GTGCCGAGGTGAGTCCCGCCGCGGTGACCCGCACCGACGGCAGATGCGCGACGTACACCGCGGTGTCCCCG
CCCGGCGTCCGGGCCACCGCCCGCAGCCCCCGGTTCCAGTCCTCGCCCAGGTCATGCGGCCGGATGTCGAT
CGCCTCCGCGCCGGTCAGCGGATAGCGCGACCACAGCGCCACGGTCCCCTGCACGGTGTGGAACGGAAGCT
CCGCGTCGAGCACACCCCGGTAGGCGGCCACCGCCTCCGGCAGCACCTCCTCCAGCCCGACCAGGTCCGGA
TGTGCCGCGAGCAGCGCCCGGGCGGTCCCCGCCGGGTCCGGGTTCTCGTCGCTCACGTTGTGCTGCACGAC
GATCAGATCCGGCGTGCCGGTGTCCCGGTCGACCACGTAGCCGCCGAAATGGATCAGCCACGCGCCCAGCG
GCAGCAGCACCGCGGCGAGGCCGGTCAGCGATCGCCGCATCAGCGCCAGCAGGAGCAGGACCGGCACGGCC
AGCCCGAACCACGGCAAAAACGCCTCGATCAGGCTGCCCGCGTTGCCGACCGCGTTGGGGACCAGACGGTG
ACCGAGAATGACCGCCCCGGCCAGAACAGCGGTCCACAAGATCGGCATCGGGAGATGTTATCTTATTTCGC
ATGCGAAATAATGAGACGGTACGGATCCCGGTAGCGACCGGCGGCGCCGTCACGGCCACGCTGTTCGCGCC
CGAGTCCGCGCGTGCCGTGCTGGTCGTGCACCCGGCGACCGCGACTCCGCAGGGCTTCTACGCGTCGTTCG
CCACCTACCTGGCGGAGAACGGGATCGCCACGGTCACCTACGACTACCGTGGCACCGGCCGTTCCGGCTCC
CCGCGCGACCACCGTGACCTGGGCATGCGCGACTGGATCGGCGCCGACGCCCCGGCCGTCGCGGCGTGGGC
CGCCGACCGCTTCCCGGGCCTGCCCCGGCTCGCCGCCGGTCACAGCCTCGGCGGGCACGTGATCGCGCTCG
GCGCGGCCGGCCCGGATCTGGCCGCCTCGGTGATCGTCGCCTCGCACATCGCCGCGCTGCGCACCATCCCG
AGCCGGCTGGAGCGGTTCCGCGTGCGAATCATGCTTCACATCCTGGGTCCGGCCCTCGGGCGGCTGCTGGG
CTACGTGCCGGCCAGAAGTCTGGGCCTCGGCGAGGACCTGCCGGCCGCCGCGATGTTGGAGTGGGGCGGCT
GGGCGCGCAGGGACAACTACTTCTTCGACGACCCGTCGATGCGCGCCGCCGAGCGCGCCGCCACCCTGACC
GGCCCGGTCCTGGCCGTCGGCACCACGGACGACCCGTGGTCCACGCCGCGCCAGATGGACGCCCTCACCGT
GCACCTGACCAGCGCATCCGTGGAGCGGCGAACCTACTCACCGGCCGCCGCCGGGGTCCCGGTGATCGGGC
ACCACGGCCTGTTCCGGCGCGCCGTGCGCGACACCGTCTGGCCGGAACTGCTGGCCTGGTTGCACGCCCAC
TCGGAGAAGGCGTCAAGATGACCGCGTGCGCCTGCCTCGCCTGATCTTCCTGCTCTTCAACGCCGACCGCG
CGGTCCGGCGCTGGATCGACGCCCGTTCCGGTGACACCGGGATCGGCGCGTCCGGCGCCGGCGTGCTGTTC
TACCTCGCCGGTCACGAGAACGCCCTCATCGGCGACGTGACCGCGGCCCTGGGTGCGTCACCATCCGGCAT
GAGCGGCCTGGTGAACCGCCTGGAGCGTGGCGGTTGCCTGACCCGCTCGCAGGACCCGGCCGACGCCCGCG
CGGTGCGGCTCGCCCTGACCCCGCGCGGACACCAGGTGGTGATCCACGCCCGCGGGCTGGTCGACGACCTG
AACGAGCAGCTCACGGCCGGTTTCGACGACGCCGAGATAGCGGTCGTCCAACGCTGGCTGGAGCACGTGAC
CCGGGTGTCCGTGCAACGTGAGGAGCGACTCGGTTAGCGTCCGGTGATCAGCTAAACCTCCGGGACGGGCC
GCCGAAGTGAGGTGTCGCAAGGCACCACCGCTTCCGATCCGCCCTTGAGGAGACCCATGGCTGACTCCGTC
GTCTTCGACCAGATCCCCGTCGTCCGCGCCATCGGCCGAGGCACCACCTCGCTGAGCGCCTTCCACGACGC
GCTGGTGACCATGGAGTGCGGTTTCTACAACCTTGTCCGGCTCTCCAGCGTCATCCCGCCGGGCACCGCCG
TCGACCCCAGCGGCAAGGCTCCGGTCCCGGTCGGGGCGTGGGGCGACAAGCTGTACTGCGTCTACGCCGAG
CAGCACGCCAGCCAGCCGGGCGAGGAGGCGTGGGCCGGCATCGGCTGGGTGCAGCGCCGCGACGGCCAGGG
CGGCCTGTTCGTCGAGCACGAGGGCACCAGCGAGTCGTTCGTCCGCGAGGCGATCAAGGCCAGCCTCCGCG
ACCTGGTCAAGGGCCACGAGGACGACTTCGACGGCCCGGACTTCGTCGTCCACGGCGTGGTCTCCGACGGC
GAGCCGGTCTGCGCGATGGTGCTCGCCCCCTACGAGACCGCCCCGTGGCGCGGCGTCCGTGCCACCGACCC
GCCCGGCATGAACTGACCTGTCACCACGAGAGCCTCGCCTCGCACGTCGGGGCGAGGCTTTCGGCATTCGC
TTTTCACTTCGACAACCCCCTCCGTACCGAAGAAATCGAAGATCAAATTCTTCATTGCCTATCTCCGCTGT
GGTCCAGATCGTCGCTCCCGCGGGGACCCTTCCGGTCTGAGCAGGGCCGTAACCGGCCCAGAACGCTCAGC
CCGAAAGGGCGACCTCCGTGGCGGGGCACGGTCAGGGCAAAATTCCGTCGCCGGTCGCCAGGGATTCGCCG
CCGGTTGCTGCGGGTGGGGTGCGGCGGTCCGCCGGAGGTATGGGTTGCCGCTACGCTCGGCTAGCTTTCGA
CCACCGGTAACGTGTAATTCCCCTTCGGTCCACCTACGCCCGTTGTGATCTCCTTATGGTGGGCTCGCTTA
TCCTCGTCCTGTGCATCTGGGCCGCATCGGCCGCGATGTTCTTCCGGCTGTCCTCTCCGGCCCGGACGCCG
GGCACCCGTGCCTGGCGTTTCGCCCCGATCCTGACCGCCGGTTTCGCGATTCCGCTCGCCGCCGCCTACGG
TCGGCAGGACTGGTCCACCTTCGGGTCGCTGCTGGTCGCCGGCCTGGCCGCCTTCGCGGTCCTGCTCTACC
TGCTCCGTCCCGTCCGCCTCTGATCCATACTCGGTCGTTGTGACGACCCGGATGCCCCGCCTCGAGATCGA
ATACTGCACACAGTGCCGCTGGCTGCTCCGCGCCGCGTGGCTGGCGCAGGAGCTGCTCACCACATTCCCCC
GCGATCTCGGCGAGGTTGCCCTGGTCCCCGGGATCGGCGGCGTCTTCGAGGTCCGCCTCGACGGCGAGATC
CTCTGGAACCGCAAGCCGGACGGCTTCCCCGACCTCGCCCAGCTCAAGCGCCTGGTCCGCGACCGGGTCGC
CCCGGGCCGCGACCTCGGCCACTCCGACCGCGCCGCCACCGACTCCTAGCCCACACGTCCTCCTCCACCGC
TCCGGCCGCGGGACGCGTCTACGCGTACAGGATCCGGTCGATCGTCTCGCGGGGGAGCAGCGTGCGGGCCC
GCCCACCGCAGACGGCGACCACCGCCGGCCGCCCGACATAGACATCGCGCCGCTGGTGGTACGCCCCGGTA
CCGGACAGCGCCACCAGATCACCGGCCGCCATGTCACCCGGCAGCTCCGCCACCGCCACCGTCGCGTCCCC
GCAGCGAACCGTGATCGACCGGCCCGGCGCCGGCGACGCCCGGCCGATCAGCGCTGCCGTGTGCAGGCCGG
CGCAGTCCGCCCCGGGCAGGCAGTCCGGGACGTCCCCGTCCAGCTCGATCACGCCGTCCCCGGCGGCCACC
ACTCGGTGCACCGTGATCCCGGCACGACCCAGCAGCGCACGCCCGGGCGACACGTGCACCTCGGGCGGCTC
AATGCCGTACCCCTCGGAAGTGACCTGCGCGACCGCCCGCAACCTGGCAGCGAAAATGCCCACCGGGAGAT
CGGCGGCATGGCCGCCGCCGAGGTTGAGCACGGGCACCGTCGTCCGCAGTCGCGCGACGAACCCGATCGCC
TCACGCAGGCAACTCTCGTAGGTGCCGAAGCGGTTCAGCCGGTGCCCGAGCGAGCAGTCCAGCCCGGCCAG
CACCAGCCTCCGCGACCGGGTCACCGTGGCGACGGCGGCGAGCGCGGCCGAGCTGTTCAGCCGCACCCCGT
AGCCGCGCTGTGCGCTGCCCGGCCGGACCCTCAGCAGGACGCGCTGCCCCGGCCGGGACCGCGCCGCGACC
ACTTCCGCCTCGGAGGCCGAGCCGATCACGACGGCGGCGCCGCAGGACAGTGCCGCCTCCAGATCCGCCAC
GGACTTCCCGCTCCCGAACAGCGCCAGCGACTCCGGGCGGATCCCCGCGTCGAGCGCCGTCCGCAGTTCGG
CGGCCGAGCGGCAGTAGCAGCCCAGCCCGTCCCGCGCGATCCACCGCGCGGCACCCCTGAGCAGGCCGCCC
TTGGCGCTGCAGCACACCGCGCCCGGCCCGAACGCCGCGACGTACTCCGCGCAGCGACTGTGCACATCGGT
CTCGTCGATCACGTGCACCGGAGTGCCGTGGGCCGCGGCGATCCGGGTCACCGGCACCCCGCCGACGGTGA
GGTCACCGGGCTCGGTCCAGCGTGCGGTGAGCGGCCAGTTCGCGGGGTCGAGGCGCGGGCGGAGCGACGCG
CCCAGTGAGGGCAGAATCTCGGACAACGTCATACCGCGAGCCTGCTCGCCGGCCCGTGCCCGAGAAGATCC
GGATACGCCACGTTGACGATCGACGTGCCGTTGTTGACGTGTCGCCTACAGGTCGGGGCTGTCGGCGGGAG
CCATGATCCGCAGCGCGTTCGGGTCGATCGCGATCCGCATCGGCGTCGTGCCCCGAGGCTCGCCGTCGACC
TCGACGGCCACCGGCCGATCCGTCTCCAGCCAGAGTTCCCGGACCGCGATGAAAGGGCGTTCATGCAGGGT
ACGGCGATGCCCGGTGGCCGCGTTCCGGGCCGTCTCGCGCAGCAGCTCCCGCCGGCTCGCCCCGCCCACCG
GATAGGCGACCAGCAGCCGGTCGTCGGCGTGCGCGTCCGCGGTGATCGGCCGGCCGGCGTGGAAACCGCCG
TTCGCGACGTACACCTGATGGGTGTGGAACCGCAGCTCCCGCCCCTCGGCCCGGATCACCGCGCGGACCGG
CCGGTGCCGGGCGAGCAGCCCGAGCGCGGTCATCGGATACGCCAGCCGCCCCACGGCCCGTTTCAACCGCG
GCGGCGCGCTGATCATCACCTCGCCGGAGAGCCCGATCCCGACGTGGTTGGTGAACGGCACGTCCCCGGCG
ACGCCCAGGTCCACGTCGATGACTTTGCCGTCCACCAGGGTCGCGATGGCGGCTTCGAGGTCCGGCTCGAT
CCGCACGGTCCGGGCGAAGTTGTTGGTGGTGCCGAGCGGCAGCACCCCGAGCGCCACGTCCCGGTGTGCCA
GCATCCGCCCCGCGGTGCTGATCGTCCCGTCCCCGCCCCCGGCGATCAGCAGGTCGGGCTCTTTCCTGAGC
GCTTCGGAGATCAGCCCGTCCAGCCCGCCGGACTGCTCCAGCGCATACGTCCCGAGCAGCTCGAACCCGGC
CTCGACAAGCCGCCGCCGCGCCTCTTCGTAGAGGAGCCGCCCCCGCCGGGACCGCGTGTTGACAACAAGAA
CCGCCCGCCGCCCTCGCCGGATGTCAGCACTGTGCTCCCGCTTACTACGCACCCGCCGACCCTATCCGCCC
CAACCCACCCAACGCCCACGCCTCGTTCCCGCCCGCCCGGTCCCGAGCCGTGATCACCAGCCGCAAGGCCT
CAGCTGGCGTTGACGGCTGATTTCGGCCCGGTTTTGCGCCGTAGGCGCCAGCCGCGAGGTGTCGGCTGGCG
TTCAGGGCTGGATTCGGCTCGGTTTTGAGCCGTGGGTGCCAGCTGGGGGCTGCGGCCGGAAGGGGGTGGAT
GTGGGGATGCCCCGGGGCCGTAGGCCTCGGGGCACCGAAAAAGCGAACCAGCTCAGCTGTTGGCGATGAAC
GCCGGATGCGACAGCAGGAACGTGTCGATCTGGTCCTTCTTGATCGACTTCAGCAGGTCCATGCTGTCGTC
GCTCAGGAGCTCGACGCTGCCGGAGCCCGGCACGTTCTCCGAGTTCAGCTTGCCGGCGTTGGTCTTGATGG
TGAGGAGCTTGTCCGGCTTGAGGCTGCGCATCGCGAGCGCCCAGTCGGCCAGGTCGATGCCACCGTCGTCG
ACCGTCATCGCCTTGCCGAACGCGCTGAGCAGCTTCGGCAGCTTGGTCGGCGAGTCGAGGCCGTCCTTCAG
CGCCTGGTTGATGATCGCCTTGAAGAACTGCTGCTGGTGCCGCTGGCGACCGTAGTCGAGCGAGTTGTCGG
CGAGCAGGTCACGCTGGCGGACGAAGTCGAGCGCCTGGCCGGGGGTGAAGCAGTGGTCGCCCTTGGTGTAC
GTGTTCGGCGTCACGCCCGAGATCTTGCTCTTCAGCGTGCCGTCCGGGTTGATCACGAACGGCTTGGCGGT
CTTGCCGTTCTGGTCCTTGCCCAGGTGGATCGACTTGGTCGTGGTGTCCACGTACATGCAGACCTTGCCGA
GCACGTTCACCACGTCGCGGAAGCCCTGGAAGTCGATGATCGCCCCGGCGTCCGGCGTGATGCCGGTCAGT
TCCTTGACGGTCATGGTGAGCAACTCGAAGCCGTGCTGCAGCGCCTCGTTGCCCTTGAGCCCGCGGGTGCC
GAACGCGAACGCGGCGTTGATCTTCGTCTTGCCGCCGGCCCACTTCTGCTTCCCGTTGTCGTACGCCGGGA
TGTAGACGTAGCTGTCCCGGGGGAGCGAGATCATGTAACCGCTGCTGTGGTCCTTGTTGATGTGCAGCAGG
ATGATCGAGTCCGACCGGAGGGGCTCGCCGTTGGTCTGCGTGGGCCGCTGGTCGATGCCGACGAGCAGGAG
ATTCTTCGCCCCGTCGAGGTTCGCGTTCTTCTTCTCCTCGGCGGGTTTCGCCGAGCCGAGCAGCGACTCCT
GCCCGACCGAGGAGGTGGCCGCGGCCACCGTCGCGTTCAGCCCGATCGCGCCACCGCCACCGCCGACCAGC
AGCAGTGAGCCGAAGACCACGGTCCAGAAAGCCCAGCGGGGTGTGCGGCGTCGGCGCTTGCTGGTCCTACG
CAAGGGGTCTCCTCTAATCGGGGCGGTCGTTCCGCCCCAGGACAATCTAGGACGGTCGTTCCACCCATGAA
GACGGGCGCCGCGAGCGAAAAGATTGCCTGCGGAACATTGAATTTTCCTGAGCGTCAGGTAGCTACAAGCT
GTTAACCATCGCACCACCAAGGCGACCTAGGTTCTGCACGGCCCCGGGCCCCCGAGGTTCCGACAAAGTTG
CCCAAAGCGAGTCGCCATGCCCTCAGAGCCGGATGTCAGTGTCGTCATTCCGACGTGTAACCGGCCGGAGT
TGGCCGTCCGCGCGGTGCGCAGCGCCCTCGGGCAGACGCACCGGAACCTCGAGGTGATCGTCGTCGTCGAC
GGTCCCGACGAGGCGACCGTGACGGCGCTGGGCGAGGTCGGTGACCCGCGACTCAGCGTGATCGTGCTGCC
GGAGCGTGGCAAGGCCCCGAACGCGCGGAACACTGGCGCCCGGGCCGCCCGCGGCCGCTGGACGGCGATGC
TCGACGACGACGACGAGTGGCTGCCCACCAAGATCGAACGGCAGCTGGAGACGGCCGCGGCGGCGACCGTG
GAGCGCCCGGTGGTGGCCTGCCGGATGATCAGCCGGACGCCGCGGGCCGACACGATCATGCCGCGCCGGCT
GCCCGAGCCGGGTGAGCCGATCAGTGAATACCTGCTGGTCCGCCGCGGTCTGTTCTACGGCGACGGCTTCG
TGCAGACGTCCTGCATCATGGCGCCGACCGAGCTGTGGCGGAAGGTGCCGTTCACCGTCGGCCTGCGCCGC
GCGCAGGAGCTGGACTGGACGCTGCGGGCGATGCGCGAGCCGGGCACCGCGCTGATCTACGCCGAGGAGCC
GCTGGTCCTCTGGCACCAGGACGAGAACCGTGACCGGATCAGCCTGCAGAACCCGTGGCGCGAGCAACTGG
AGTGGCTGCGCGGCAACCGGGAGCTGTTCACGCCGCGTGCCTACGCCGCGTTCACGCTGAGTGTGCTGAGC
TCGATGGCCGCGCCGACCCGGGACACCGGGCTCTTCCGTGAGCTGCTCGCCGAGGCCCGCACGCACGGCGA
CCCGGGCACCGTCGACTACCTTACGCACATGCAGATCTGGGCCCTCCCGCCGAGCGTCCGGCACCGCCTGC
GTGACGTCGTGGTGGGCCGCGGCAAGACGAGCAGCAATGCCGGCTGAGCGCCGGGTCGCGATCTGGCGCAG
TTCGATGCTGCCCGGCTCCGAGACGTTCGTCCGCAATCAGGCCGACGCGCTGACCCGCTGGACCCCGGCCT
ATGTCGGCGCGGTCCGGCACGAGTCGGTGCTGTCCCGCCCCGACGACGTGATCGCCTTCCCGGGCGGCAAG
GGGTTCCTGCGACTGCGGCTGACCGGGGCGTCTCCCCAGCTGCAGAAGACGATTTCCGCCGTACGGCCGAA
TCTGGTTCATGCCCATTTCGGTGGTGACGGATGGCTGGTGAGCCACTCCGCCCAGCAGCTGGGGGTGCCGC
TGGCCGTCACCGTGCACGGGCACGACGTGACCCGTCAGCCGTCCAGCCCGGGCGCGAAGGGCGTGCGCTAC
CGCCGCAACCTGCAGACCGTTTTCACGCGGGCGTCGCTGGTCATCGCGGTCTCGGAGGTGATCCGCGGCCA
GGCGATCAGGTGGGGCGCCGACCCGGCGAAGGTGAAGGTGCACTACACCGGCATCGCGGTTCCCCCGGAGC
AGCCGGAGGAGGTGCCGAAGCGGTGGGACGTGGTGTTCATCGGCCGTTTCGTCGCCAAGAAGGGCGTCGAC
GACCTGCTCACCGCGCTCGCCGCGGTCGAGTCGCGCCCGCGCGCGCTGCTCATCGGCGACGGCGAGCTGAT
GACGGCGATGCGTGCCCGTGCCGAGCAGCTGGGCGTGGACGTCACGTTCGCCGGCAGCCGGACCCCCGAGC
AGGTGCGGCGCCACCTGCTGGAGTCGCGGCTGCTGGCCTGCCCGTCGAAGACCGCGCCGGACGGGGACACC
GAGGGCCTGCCGACCACGATCCTGGAGGCGGCCGCGCTCGGCCTGCCGGTGGTCGCAACCCGGCACAGCGG
CATCCCGGAGGCCGTGATCGACGGTGAGACCGGCCTGCTCAGCCCGGAGGCGGACCCGGCGGCGCTGGCGG
TGTCGCTGACCCGGCTGCTCGGTGACGAGGATCTCCAGCGCCGGCTCGGTGCGCGGGCGCGGCGGCACGTC
ACGGCACACTTCGATCTCGTGGAGCAGACCAGGCGGCTGGAGGACCTGTATGACGAGGTCGTGGCGGGCGC
TAGGGTCTAGGCCTGCCTGTCCGGCTTCCTGGGGGAAATCATGATCTGCACGCACTGCGGCTCACCGGCGG
CGCCGACCGTCGGCCCGTGCCCGGGCTGCGGCCGTCCGGTCTCCGCCCCGGCCGGGGTGTTCCCGGACCCG
CTGGCCGCGCCGGCCGAGCGGTCGCTCCCCACGTCGGCGTACAGCGTGCCGGTCGATCCGTACACCGGCCC
GACCACCGGTGACCCGTTCGCCGGCGACTCGTTCCACACCCCGCCGCCGGCGTCCCCGATGCCGCCGCCGG
TGACCGAGCCGATCACGCCGACGCCGCCCCCGCCGGCCTACGCCCCGCCCCCGCAGTACAGCCCGCCGCCG
TATGCGGGGGCGCCCGGTCAGCCCTATCCGGGTCAGCCTTACCCAGGTCAGCCCTACCCGGGACAGCCCTA
CCCCGGGCAGCAGCCGTATCCCGGCCAGCAGCCCTACCCCGGATACGGCCAGTCGAACAGCCAGGCCCTGA
CCATCGTCGCCTACGTCCTCGGCGGCTTCGGTCTCCTGACCATGACCCCGCTCATCGGCGTCGTCGGCCTG
GTCCTGGCGAACTTCGCGAAGCGCCGTCACGAGCGCAATGCCTCGATCGCGGTCAAGATCGTCGCCGGCCT
GGTGATCGCCGCTTTGGTGCTGAGCATCGTGGACCGCATCGTTTAAGGCCTGCCCTGCCGATCACTCAGGG
CGGCGACTTCTGGGCGGCGGGGGTGCTCCCCTCGCCGGAAAGGATGTCCGGTTCCCGGGATGGTCAGTACT
GTCGGCTCATGGGCGAACATTTCGATCTTGTCGTGCTGGGCGCCGGTCCGGGTGGATATGTCGCGGCGATC
CGCGGCGCTCAACTGGGCCTGACCACCGCGATCGTCGAGGACAAGTACTGGGGCGGCGTCTGCCTCAACGT
CGGCTGCATCCCGTCGAAAGCGCTGCTGCGCAACGCGGAGCTGGCGCACATCTTCCACCACCAGGCGCAGA
CCTTCGGCATCGAGGGGAAGGTCACCTTCGACTTCGCCGTCGCCCACCAGCGCAGCCGCAGCGTCGCCGAC
GGCCGCGTCAAGGGCGTGCACTTCCTGATGAAGAAGAACGGGATCACCGAGATCCAGGGGCGTGGCGAGTT
CACCGACGCGCACACGCTGCGGGTCGGCGACCGGACGGTCACGTTCGACAACTGCATCCTGGCGACCGGCG
CGAGCACCCGGATGATTCCCGGCACGAGCGTCTCGAAGCGGGTCGTGACGTACGAGGAGCAGATCCTCGAC
CCCGACCTGCCGGACAGCATCGTGATCGTCGGCGCCGGCGCGATCGGCGTCGAGTTCGCGTATGTGCTGCG
CAACTACGGCGTCGACGTGACCATCGTGGAGTTCCTCGACCGGATGCTGCCGCTGGAGGACGAGGAGGTCT
CCAAGGAGCTGCTCCGGCAGTACCGCAAGCTCGGCGTCGACGTGCGGGTCGGCACCCGGGTGGAGGGCATC
GAGGAGGGCGCCGACTCGGTCCGCGTCACCGTCTCCAAGAACGGGAAGACCGAGGTCCTCGAGGCCGACAA
GGTGATGCAGGCGATCGGCTTCAAGCCCAACGTGGAGGGCTACGGGCTGGAGACCACCGGCGTCACGGTGT
CCGACCGCGGCGCGGTCGAGATCGACGACTTCTGCCGTACGAACGTGCCCGGCATCTACGCCATCGGCGAC
GTCACCGCGAAGCTGATGCTGGCGCACGCCGCCGAGGCGATGGGCATCGTGGCGGCCGAGACGATCGCCGG
CGCCGAGACGATGGCCCTCGACTACCGGATGATCCCGCGCGCGACTTTCTGCCAGCCGCAGGTCGCCAGCT
TCGGGTGGACCGAGGCGCAGGCCCGCGAGCAGGGCTTCGACGTCAAGGTGGCCAAGTTCCCGTTCACCGCG
AACGGCAAGGCGCACGGCCTCGGCGACGCGACCGGGTTCGTGAAGATCCTCAGTGACGCGAAGTACGGGGA
GCTGCTCGGCGCGCACCTGATCGGGCCGGACGTGACCGAGCTGCTACCCGAGCTGACCCTGGCCCAGCAGT
GGGACCTGACCGTCCACGAGGTCGGGCGCAACGTGCACGCGCATCCGACGCTCGCCGAGGCGGTCAAGGAG
GCGATCCACGGCCTGGCCGGCCACATGATCAACTTCTGAGTCCGCCGCTCGGCCGACGGGTCCGCCGCTCG
GCCGACGGGTCCGCCGCTCGGCCGACGGGTCCGCTGTCCGGCCGACGAGTCCGCCGCCCGGCTGACGCCCG
GGGGAGTAGCCGGAGCCGCCCGTACCGCGCCTGCGGTAGCCCGAATACCTACGCGGGGATGACGACTCCGC
CCCGCCGGTCGGGAACGCTGAGCCTTGTGACCCTGACCGTCGAGCCTCCGATCGCCCCGGCGCCGCCCGCC
GCCCCGGGGCGATCCCGGCGGCGCAGGCTGGGCTATCTGGCGTTCGTGCTGGTCGCGGTGGTGGCGGTGGT
GACGCTGCGCGACCGGCTGCCGGATCCGGGGGAGTTCCTCGACGCGCTGCGAGCGGCCGACTGGCGGTGGG
CGGCGCTCGCGGTGGGGGCCGGGGTGCTGTCCCAGATCGCGTACGCCGAGCAGCAGCGCCGGCTTCTCGCC
GCGTTCGGAGTGCGCGTGCCGGCCCGGCGGGCGATCGCGATGACGTACGTCCGGTCGGCGCTGAGCATGGC
GCTGCCGGCCGGGTCGGCGGCCTCCGCGGCGTACGCCTTCCAGGTCTATCGTCGCCACGGCGCCACCGCGG
CGATCTCCGCGACGGCGACCCTGATCTCGACGGTCGTGACCGTGATGTCGCTGGGCCTGCTCTACGCCGCG
ACCTGGTCGCTGACCGCCACCGTCGTGGCCGGCCTGGCCGTTCTCCTGCTGTGGATCTACCGGACCGTGCG
GGGCCCGGTCCCCGCGCGTGCCGGCGTGCCGCGCCGTCTGAGGGTCGCCCCGATCGCCCGCCTGCTCCAGC
GGCCCGCCGTGGCCCAGGCGCTCCGGGGTGCACGGTCCGTCCCGGCCCGGACGTGGCTCACGGTGACCCTG
GCCGGCGTGATCAACTGGCTGCTGGACATGGCCTGCCTGCTCCTCGCGGCCGACGCGCTGCACGCCGGGCT
CGGCTGGAGCCGGCTCGCGCTGATCTACCTGGCCGTCCAGGTGGTCCGGCAGATCCCGCTCACCCCCGGCG
GCATCGGCCTGATCGAGACCAGCATGCTCGCCGGCCTGATCGCCGCGGGCGCCCCGCAGGTCACCGCCGCC
GGGATCGTCCTGATCTACCGGCTGATCTCGTTCTGGCTGATCCTGCCCAGCGGGCTGGCCGCCCACCTGAC
CCTGCGCCGGGGGACCGTGCCGCCGGTGACTCCGGGCTGACCGCCGGGGCTCAGGCGCGGTCGAACTGCTG
GAGGACGGCGCCGAGGCCGAGCGTCAGGGCCGGGCCGGGCAGTCGTGAGTCCAGCCCGTACCGCCGGCCGG
GGTTCTCCCGATCGACCAGGTCCTGCCAGAGCCCGGTCACCGGATCGCCCAGCCCCGGCAGGTCGTGCCCG
GCCGCCCGGAGCAGCTCGGCCAGGTCGTTCTGCTGGCGCAGCCGCTGCTCCTCGAAGATCTGGCTCCACTG
CATCAGCGAGATCGACGCCTCCAGTGTGTCCGGCACCGTCTCGTCCAGCATCGGCAGCGGTCGCGCCGCGG
CCCACGCCGCGAGCTGCGCCCCGGTCACCGTGCCGGGATCGTCGTCGCGGCTGCGCGCCAGCGCGTACGAC
AGCAGCGCCGTGGTCTCCACCAGCAGGTGCTGCACCGGGACGCGCGCCGGCGGGTCCAGCCACCAGTGGTC
CGCCTCGAGCAGGGCCGCGGCGTGCCGGGTCGCCGCCCGCCACCAGCCGTCGTCGCCGCCGGCCAGGGCGT
CGGTGTAGGACCACAGGAAGGTCACCCTTCCGTGCCTACCAGCGGCACTTGACACGAGTCAATCACGCGAA
CGCGTGGCGACGACCGCGATCGCTTCGACGGAGATCAGCAGCCCGTGCGGGAGAACCACGCCGGCGGGCGC
GGACCGGGCCGGCGGCGGGTCGGGCATGTGCCGCGCCAGCACCTGGTTGATCACCGGGAAGTCCTCGACGT
GCGTGTAGAAGACGGTCAGCTTCACCAGCCCGTCCAGCCCGTCCAGCCCGGAGCCGGCCGCCGCCAGCACC
GCCCCGAGGTTGCACAGCGCCTGCTCGGTCTGCGCCTCGATGCCGTCCACCGGCTTCCCGGTCGCGGGGTC
GATCCCGGGCATCCCGGAGCAGAACACGAACCCGCCGGCGACGATCGCCTGGCTGTAGGGCCCCAGCGCCG
TGGGGGCCCGCTCACTCGTCACCGCGATGCGATCCATCGGGCGAGTCTCCCGCACCGGGCATCGATGGTCT
TTCGGCTTTATGACACGGGTGGGAGCTTGACAGCCGTACATCGTTTATCGATTATCAATATATCGAAAAAC
GATAAGGGGGTACGTCGTGAAGACCGACTGGTTGACGGAGTTCCACCAGGTGCTGCTGGTCGCCGCGCTGG
GCGCCGGGGCCGCCGCCGTCCTCGGGACCGTCGGGCTCGTGGTGCAGGACGAGGTCGTCGTCCCGGGCGGC
ACGTCGGCTCCGGCGAGCGTGGTCAGCGACCCGAGCGTCACCCAGCTCCTGCTCGCCGTGGCGGCCGCCGT
GCCGACGTACCTGCTGGCGACCGCCATGCTGGTGCTGCTGTACCGGTTGGTCGGCGCCGCGCGTCGCGGGG
ATC
SEQ ID NO201 orf1 分泌系統(tǒng)蛋白 334aa
VRLRIQRRLADELGPTLYTTGQSEDLDARVRDALHDLLAREETPLSGADR
ARITREVTDEVLGHGPIESLLRDPSVTEVMVNGPYSVYVERFGRLEKVAA
EFDDEQHLRRIIDRICSRVGRRVDEASPTVDARLPDGSRVNAVVPPIALD
GSTLTIRKFAAVPLTVGDLLQYGTLTRQAAEFLDACVRGRRTILVSGGTG
SGKTTILNVLSSFVPADERIVTIEDAAELQLVQDHVVRLESRPPNSEGRG
TITTRDLVRNALRMRPDRIVVGEVRDAAALDMLQAMNTGHDGSLTTLHAN
SEQ ID NO202 orf2 反應(yīng)調(diào)節(jié)子 358aa
MSELESYLPRYPETLLVVIGAVVDLDEALMFTAYQRLQRPVIGVVLIRHA
IEAGVVLRCLQSGIRDLVAEEDEEGIRSATVRSVDLSKALSTTMRGTGDN
APYASVVTVFAGKGGCGRSVVAVNLAVALAGAGRRVLLMDLDLQFGDVAI
MMKLSPERNIAGGLQMAGRLDEPGLRSIVTTYRQSLDALLAPASPAEGEQ
VRREFVVELLDVARPLYDFIVVDTPSVVTDQVLAALDMSDWFIPIVTPDL
PALKSVRLTAEMFDLLDYPKDKRLLVFNRAGAQVGLSPSEVEVAAGMPFA
VQVPASRDVTVSVNHGEPIAVTDPLHPVSRAIRELGDRIAGVGTTPQRRR
GFLGRLFP
SEQ ID NO203 orf3 推定蛋白 266aa
MRRRILILLAALVLAGISGAAVLSYARSADRRALSGREGTWILVAGQHIP
SGTSGAEIRARGLTERLLVPTVTVPAGALTTWDSALDPLRLGGDLQPRQL
LMRTLFVPASPAPSHTGRIPVPRRSLAVSVALNVAPQVAGNITPGDQVAV
YYTYQAKVLMAEDHETIPMTELLLPKARVITIGEAEPGQAPVTPSPSPTP
GPSASAGDSTAAVKEIQRYVVTLAVGDTDALRLVHAAQSGSLYLALLGPN
ATASTGPAIDTSWVVR
SEQ ID NO204 orf4 推定蛋白 432aa
MRRLIHALFPPRGEHGVITALVAVLAGAGVLLGMAALVIDIGALYAEREQ
LQSGADAASWKVAQACAGTAGRDLTSATCTVAAQRDNAQRYADRNAKDLV
SDVQFCITTVSAAGVTTADAGCPSSWNTPVTCPAPPSASGPYRYVEVRTS
TRNSDNTSVVPPLFGRGLAGSAYHGAKMGACGRVAWGAPAVTDVLALGVS
RCDFLRLTGDYTRFFAPPPPTGPNPQTGVHPLLGLSDPTAGYIPISDGIL
ATSCPADAGETVAGYTWLGQPDGPPALPGLLPVSAPDASCELTGIPATDG
PADSWVGGFTIGPGNASAATACLDRLNVLITSGQPVLVPIFDRQVAVIGT
LPSYYRIAGFAPLVLTGYESPVSGPVSPGSAVPSLVPGAQRALCAAQSCL
YGYFTRALVTDHVPTRFATSRYYGAMVIGRTG
SEQ ID NO205 orf5 Response regulator ATP-binding 136aa
MWKATERQGPVVLLVEDDEDLRELAAQMLEMRGFVVLVAKDPVSAIMTCR
VHSGAIDVLLTDLGLPGVSGGELARSASEVRPGMKIVYVSGVPEEIAIKK
GLIRAGSPFVAKPYTADRLAGMLRTVLAQGAESSAR
SEQ ID NO206 orf6 ABC 糖轉(zhuǎn)運(yùn)子 363aa
MFNYVSFVRPKTFAATFAAAALLLGSGACAKSEDSGDTVAAGPAPSAAQV
VQSASAGSATCALDQYGASKLDLKTASVGFSQSEKEANPFRIAETKSIKD
EAAKLGITNLKTSNANSQFNKQIADVEQMIDAGVQLLVIAPLNSDGWDSV
FAKATAKHIPIITIDRKINATACKDYLTFIGSDFAEQGKRAADALAKSLG
NKGEVAILLGAPGNNVTTLRTSGFKDEIAKVAPDIKITFEQTGNFSREDG
QKVAEQLLQSKPNINGIYGENDEMALGAITALKGAGKKAGDVKIVSIDGT
KGAVQGIVDGWVSAVIESNPRFGPLAFDTATKFFGGEPVGQDIVIQDRAY
DESNAKTDIGSAY
SEQ ID NO207 orf7 ABC sugar transporter ATP-binding
501aa
MLLEVSGVSKTFPGVRALDGVSFTLNPGEVHALVGENGAGKSTLIKVLTG
VYQPDSGELRYRGEPARFATPLDAQRAGISTIYQEVNLVPLMSVAHNLFL
GREPRNRFGLLDEARMVAEATEILAGYGVRTDVRRRLGTLALGAQQMVAL
ARAVMVDARVVVMDEPTSSLEPREVETLFGVIRELHTAGIGIVYVSHRLD
ELYRVCDAVTILRDGKLVHTGRMADLDRRTLVSLMLGREFGADFTSFSES
PQSTPEGEPVLRVSGLTSRPRLDDISFDVRPGEVVGLGGLLGAGRSETIK
AIGGAYPIDSGVIEVGGVRLGRPSTVRAVRAGVATQPEDRKAEGIVPGLS
IRDNIALAILPRMARFGLVSDKRIDSIVATYMSRLRIKASGPDQAVGDLS
GGNQQKVLLARLLATGPKVLLLDEPTRGIDVGAKAEVQALIDELAKEGLG
VVLVSSDAEELVEGADRVVVLRDGAVVGTLTGDRVTTEALMATIAEAADE
H
SEQ ID NO208 orf8 ABC 轉(zhuǎn)運(yùn)通透酶 319aa
MSTETLTRPRMTFNPAWAARYGVYAAIVLLIVVNIAFTPYFLTLSNLRIQ
LIQAAPVVIVALGMALVIGTEGIDLSVGSVMALAAAFIPLYLGYGVTAAI
LVSLLAGVAVGLINGVLVAKAGLQPIVATLALFVGGRGLAVVISGGQLKD
VRNADLLYLGSGDLLGVPVLVWIAALLVLVVAFVVRRTVFGRRLLAVGGN
RPAAELAGLPVKRVLIGVYVFCAVLASIAGLLSVARIQSSDASAVGLLIE
LSAITAVVVGGTPLTGGRVRVLGTVAGALLMQLVVATMIKHDLPPSTTEM
VQAVIILVAVYVARERRTR
SEQ ID NO209 orf9 ABC 轉(zhuǎn)運(yùn)通透酶蛋白 320aa
MSIPVPAFRNGGFVQRQGALAVLVTVVAISLAAFPGFRSADNAGTILVAA
APPMLIALGMTFVIITGGIDLSVGSLYVLGGVVAAWASQWGVVAALAAPL
LLCGAIGVLNGILISRTGMAPFIVTLAALLGARGLMRSISDEGSTTYLVR
SDVFHELGTGSLLGVGLPVWLAAVLVGAGILVLNRTRFGHAVHAIGGSED
AAALMGLPVRRIKVWVYLLSGLLAGLAGAINAAKLGSGVTVLGSGMELDA
IAAVVIGGTLLTGGSGSIAGTVAGVLLLGVIQNLINQVGNVNSNWQQVIS
GGFLAAVVVAQTTLVRARRS
SEQ ID NO210 orf10 metallopeptidase 486aa
MRTSAGTRVLTVGATVVLALAAAAAPAQAGPSPSPGSAGLGDRLYPLLGN
GGYDVLDYDLRLRYPEKDPKQVVSGDVTITAVAGQSLSRFDLDFGGASIG
RVSVDGQPARAARDGDELTVIPRRPLPRGRLFRVTVANFTAAPAALVATP
DGTVLAAQPGSAHLLFPGNDHPRDKATFTITLTVPAGWTGTANGTLVSTT
EHDGHVSSVYRESAPMATELVQTAVGDFVVERRPAAGGTPIRDVVPRRLA
GTLLPAIAGEREQLAWMEKQAGPYPFEDYGSLVIDDDLGYALETQTLSLY
GAALFTGPETTRGPSMTHELAHQWFGDSVSPFSWSDVWLNEGHATWYEML
WSEETGGFPQYTGLADREAFFKAVYAAGDIFRARYGPVAAPLDAATTWDV
FNPNVYAGGALVLYALRQKIGAATFQRVERAWLTTYRGRSASTGDFITLA
SRVARQDLRPFLTSWLLGVTTPPMPNHPDWVVTPGS
SEQ ID NO211 orf11 putative StrR-like regulator 286aa
MDSPRLNGEDPRHTEVLAGFGAELPPIVVHRATMRVIDGAHRLSAARLRG
DDRIRAVLFDGTEQEAYVLSVKANVTHGLPLSAAERTRAAERIITMHPDW
SDRMIAASSGLGARTVGGLRRRRAASGESPAGLRSRAGRDSRVRPAGSTA
GRLKAVDYLQDRPDASLREIARHAGVSPSTARDVRDRLHRGEDPIPATQR
AAARPGNDSPPLRSLVQGLASDPSLRFSESGRDLLRWLIAHAVQDGEWKG
LVDTIPAHSAQALAKIARHCSREWREFADILEKDAA
SEQ ID NO212 orf12 1anA 64aa
MSAITVETTWKNTDLREDLTAHPAGLGFGELSFEDLREDRTIYAASSGWV
CTLTIECGTLVCAC
SEQ ID NO213 orf13 1anM 1046aa
MSSFAIAASPASAYLHERSAGPGGDPVAEHERVESWRESAFLDDPVLDIR
LRELGLSRAEFGRLLTDGAYDAGSTALDWAGELAAVLATGTGAVTGLARS
TKLWAQGFDRLPFAGLIERFLAYYEPRVPRTAGTVRVSLLESLANRLLTV
ATRTLLLELNVARVHGRLTGATPGERYDHYDRVLLTDPDYLRSLFGEYPV
LGRAMVECGRRWASAMAELFQRLDADRPALHAAGLLPAGAGEVTALRPDL
GDPHNSGRAVAILTFRSGAQLVYKPRPVGPERAYAETAAALNRHGLSLPL
TAVDVLDRGAYGWCELVRHEPCADRADLDRFYRRTGAVLATTLLLGAVDV
HMENVIAAGSSCMPIDLETLLQPGVPSGDATDAYTRALDLLNQSVLAIGI
LPARAFGGRERKSVDVSAIGGGEAQTAPRPVPMVVEPFTDVARIEAVEAT
MLGAQNRPVLVGAEVRPEEHTEAVVAGFTEAYDLIVRHREDFADLLAGFG
DVEVRYLPRPTRRYSMFLTESYHPDYLRDARDRDRLLDKLWTAAGARPDL
IPIIESEKRQLLAGDIPCFRALAGDRAIRTASAPVAPDFFDAPGIEVLAG
RLRQFGPVHRAAQLRIIRESMGTMPAPGPIAGTPAPSSERRGGLDPREAA
TLGDRLVRELADEAILGADDAGWIGVSIEGLDQETFSYKPMATGLYDGIA
GMALTYAYAARTLGDERYLDLTRRTVKLVSGYLRYLAEHRIVETVGAYSG
MAGLLYTLDHVAHATGDASLLGEIEAALPWLRECATREECPDLIAGLAGC
AVVALSLYRRHGIAGYREVAEICGRRLAGTAVDVEGAAGWAATRTGVILG
GFSHGSAGIAWALHELAAEFGDRDLRELADRAVEFDRRLYVPAAGAWRDL
RPEMAGTDGYPALWCHGAAGIGLSRLLIHRIRPDERLAEEARAAVALVRR
HGFGHNHSLCHGDFGALALLGLADRAWPGSGGHDERAGAVVRDIGETGLR
CGLGNGIRMPGLMLGAAGAGLSLLRLAAPADVPAVTWLEPPRGTHV
SEQ ID NO214 orf14 1anT 575aa
MSETAGLLRRSLLDHRGKLAAVAGLAVAGVGCQLGQPFLIRRVLTAVQSA
QPYRQLALAVLAVMVVGAALGAVQQFLLQRTGEAMVFTVRRTLVAHLLRL
PVAAYDERQSGDLVSRVGADTAQVRSVITSGVVDLAGGVLLVGGSIAGMI
IIDPVLLGVSLAPVLCGAAGVRLVGRRLRPLSSAVQESIGALTASTTRAL
GAIRTIRVAGATERETALIVAEADRARAAGVRLALVAAQAGPIVRLALQG
AFVAVIGFGGYRVANGAVSVGDLVAFTLLLFTLALPLAQLAEAATRIQTG
LGALTRIEEILALPDEDSALGVRARTPATVRHDPVLLEFDHVSFRYPTGG
EILRDVSFRVPAGSTTALVGPSGAGKSTILALIARLYEVHGGRILLHGRD
IRDYPLAELRAALGYVEQEAPVLAGTVRDNLTLAAPDVAEHAIRHVTASV
NLDDLLARDPAGLDAPVGDGGVLFSGGERQRLAVARTLLAPGELLLFDEP
TAHLDARNEQALQHGLTAHAAGRTLVVVAHRLATVAHADQILVIDDGRSV
AAGRHEELLVRDPTYREFATRQLLT
SEQ ID NO215 orf15 1ano(Lucifrase 型單氧酶)347aa
MLSVLDQVPVFRGDDPAEAVREAVGLARAAESLGYHRFWIAEHHGSAANA
CAAPEIVAAAVAGATERIRVGTGGVLLPYYSPLKVAEAFRVLAALYPGRI
DLGFGRGRGGPAVMAELLNPYAIATEEAYAEQVGRLLAFLGDARTVSRVS
VTPAVQDPPLPWLLGSGVGSARLAGMLGVPFCFAQFIATEECPEAIAAYQ
ESFRSSPWLDEPQAMLALRVLAAGTAEDAEELATGFWMSCTTGWRAQVRP
DDDYRGGVPNLADAQRYTLTEEDLAMRASRPYLQISGTAETVGEEIRRLR
KVYDVAEVMLTTNCPGAAAPAPVLRAAGRRARADRAGVTRVRPARRW
SEQ ID NO216 orf16 1anR(反應(yīng)調(diào)節(jié)子)217aa
MADVLVVAEEALVSIGIKMILETMGGFSVVAADRDSALAAVSEHRPAVVL
LDAHATLPESVPLLTRLRDLESGPALAVLATLAASSTVLESLRGGACGFL
LKDSQPEQLVAAVRALASGVTVLAPEASSIMLGAACRGTPAAENAVDEVK
QLSDREQAVLGLIGQGLTNAEIAGRLFISDSTVKEYVSVILRKLGVANRV
QAAVLAYAAGLTTDELA
SEQ ID NO217 orf17 ABC-transporter associated permease 814aa
MIFTLAWSQVRSHPGRLLAIVAAVVLATGFLAATATFASTSDEGLRLTAA
APLTTADIVLDADDTVHDPQWYQAAAGVRGVRSVDPQYARTVSVFGGDRR
GSANVQSIPATASVRWFTVDEGTWPSAAGQVVADRRTLTDLGVGVGAHLD
FRQGTAAPVPVTVVGSADLGFRPLTGSDYRFYAAASFFAGDTPPAALLTV
TDRDRLAETVDAVGRALPPGATATDASAAADAAAGRFAGGNTQLVVLMLA
FAAVALLASILVIANTFQVIVSQRVRQVALLRLVGGHRRQVSRVVLAEAA
IAGSIGAVIGAVAGVGLGYLGAGLLDINGGGLAVNPIVLALCVLTGVGAT
VVAAWAPARRATRVPPVRALQEVPDALPAQVRGGRRLVAGLILIGLAVGV
LGLAAIGTSLPLALVGGVLLAAGLLTALPLGIALLLPPAARGLERFGVAA
SLAGSNLRQNARRTASATMAVVVGAALITGLAVASASGRATVEADLEARY
PVAVSVHTDGAAIDDRTVRALSGITGLTTATVATSAATFPAAGKPTPARI
AALPTDVAGRLAPELSASTGDPVLLVPASYLTARGLTDGAPLTVTAGGRD
LRFTARGSRLADTTGQLLGVTTGDVLTAAGVRTVPTTVWGTAPGGFDRET
LAADVNAVAARDAGVEVGGGVTEGGDIMNVLSILLGLSLGMLAVTVVIAL
LGIANLLGLSVIERTREMALLRALGTRRSRLRAMVAVEAVTITLVGTVAG
IVIGVPVGLVGVIAAVGRQAEPVIMLAWPQLGLVLVAAAVTGVLASLAPA
RRATRIAPAEGLVR
SEQ ID NO218 orf18 ABC-transporter ATP-binding protein 240aa
MVSCRNLRKRYGTGDAAVVAVDGVSTSFAAGEFTAIMGPSGSGKTTLMHL
LAGLDTPTEGEVSLAGTALAGLDDRALTDLRRDRVGFIFQAFNLLPTLTA
EQNIVLPLRLAGRPVDRDRLQRIAASLQIGDRLGHRPAELSGGQQQRVAV
ARALLTEPSVVFADEPTGALDIATGRALLAGLQNAARQASQTIIMVTHDA
AAATYADRVLIMADGRLWDELRAPTLESIMSVMASVTVTS
SEQ ID NO219 orf19 組氨酸激酶 362aa
VIAGAAVMVCLLLGLAGLDEWYWSAALCVPLVIRRSAPVVFLALVAVLSG
IHMIYSGSFAFPGDLVDLVAVHAVAGYGPARVRHLGLLLGVAGSLVVTAR
ALHDGLPSSATLPAALIVAATLAAWSTGLMQRRQRADVIEADHRRRLAEQ
DSAMRARLAAIEERTRISQEMHDIIAHSLASVIAQAEGGRVAARADAVVA
GPLFDRIAQIGREALNDVKRLLNSIDGDTPDDFAQGLPDLPGLLAGVSAA
GLDVTFEVAGPEQPLASGMDLAVYRVIQESLTNVLKHATQRQARLSLVWT
PAWLEVSVTSPLTFAGALREGRGLSGIRQRCSLFNGDCEIVAGQTFSVIT
RWPLARPEVAVP
SEQ ID NO220 orf20 反應(yīng)調(diào)節(jié)子 218aa
MTEPQIDVVIADDQDLVRTGFALVVDSAPDMRVVATAADGAEVVRLAAEF
RPDVVLMDIRMPRVDGITAARAILEGNAQPPKIVALTTYDNDEYASRILA
AGASGYLLKDTTAEGLTAAIRTVHRGGSVLAPSTTHRLVTAHRQHPARPS
ALLDSFTTREREVFDLIVAGASNAEIADRLNLAEVTIKTHVGRVLAKIGV
RDRVNVVIWAYRNGAGPS
SEQ ID NO221 orf21 假定膜蛋白301aa
MPILWTAVLAGAVILGHRLVPNAVGNAGSLIEAFLPWFGLAVPVLLLLAL
MRRSLTGLAAVLLPLGAWLIHFGGYVVDRDTGTPDLIVVQHNVSDENPDP
AGTARALLAAHPDLVGLEEVLPEAVAAYRGVLDAELPFHTVQGTVALWSR
YPLTGAEAIDIRPHDLGEDWNRGLRAVARTPGGDTAVYVAHLPSVRVTAA
GLTSARRDESARKLGALLAADPVPRLVVIGDLNTSVDDRGLRPIRQVMID
SPADFAFTWPARTPVARIDQVLARSMTVTRLTALPRTGSDHLPLAAEIRF
P
SEQ ID NO222 orf22 alpha-beta 水解酶 290aa
MRNNETVRIPVATGGAVTATLFAPESARAVLVVHPATATPQGFYASFATY
LAENGIATVTYDYRGTGRSGSPRDHRDLGMRDWIGADAPAVAAWAADRFP
GLPRLAAGHSLGGHVIALGAAGPDLAASVIVASHIAALRTI PSRLERFRV
RIMLHILGPALGRLLGYVPARSLGLGEDLPAAAMLEWGGWARRDNYFFDD
PSMRAAERAATLTGPVLAVGTTDDPWSTPRQMDALTVHLTSASVERRTYS
PAAAGVPVIGHHGLFRRAVRDTVWPELLAWLHAHSEKASR
SEQ ID NO223 orf23 轉(zhuǎn)錄調(diào)控因子 145aa
VRLPRLIFLLFNADRAVRRWIDARSGDTGIGASGAGVLFYLAGHENALIG
DVTAALGASPSGMSGLVNRLERGGCLTRSQDPADARAVRLALTPRGHQVV
IHARGLVDDLNEQLTAGFDDAEIAVVQRWLEHVTRVSVQREERLG
SEQ ID NO224 orf24 丙酮酰依賴的精氨酸脫羧酶 175aa
MADSVVFDQIPVVRAIGRGTTSLSAFHDALVTMECGFYNLVRLSSVIPPG
TAVDPSGKAPVPVGAWGDKLYCVYAEQHASQPGEEAWAGIGWVQRRDGQG
GLFVEHEGTSESFVREAIKASLRDLVKGHEDDFDGPDFVVHGVVSDGEPV
CAMVLAPYETAPWRGVRATDPPGMN
SEQ ID NO225 orf25 假定的二氨基庚二酸脫羧酶 406aa
MTLSEILPSLGASLRPRLDPANWPLTARWTEPGDLTVGGVPVTRIAAAHG
TPVHVIDETDVHSRCAEYVAAFGPGAVCCSAKGGLLRGAARWIARDGLGC
YCRSAAELRTALDAGIRPESLALFGSGKSVADLEAALSCGAAVVIGSASE
AEVVAARSRPGQRVLLRVRPGSAQRGYGVRLNSSAALAAVATVTRSRRLV
LAGLDCSLGHRLNRFGTYESCLREAIGFVARLRTTVPVLNLGGGHAADLP
VGIFAARLRAVAQVTSEGYGIEPPEVHVSPGRALLGRAGITVHRVVAAGD
GVIELDGDVPDCLPGADCAGLHTAALIGRASPAPGRSITVRCGDATVAVA
ELPGDMAAGDLVALSGTGAYHQRRDVYVGRPAVVAVCGGRARTLLPRETI
DRILYA
SEQ ID NO226 orf26 激酶 309aa
VRSKREHSADIRRGRRAVLVVNTRSRRGRLLYEEARRRLVEAGFELLGTY
ALEQSGGLDGLISEALRKEPDLLIAGGGDGTISTAGRMLAHRDVALGVLP
LGTTNNFARTVRIEPDLEAAIATLVDGKVIDVDLGVAGDVPFTNHVGIGL
SGEVMISAPPRLKRAVGRLAYPMTALGLLARHRPVRAVIRAEGRELRFHT
HQVYVANGGFHAGRPITADAHADDRLLVAYPVGGASRRELLRETARNAAT
GHRRTLHERPFIAVRELWLETDRPVAVEVDGEPRGTTPMRIAIDPNALRI
MAPADSPDL
SEQ ID NO227 orf27 轉(zhuǎn)錄調(diào)控因子 367aa
VVFGSLLLVGGGGGAIGLNATVAAATSSVGQESLLGSAKPAEEKKNANLD
GAKNLLLVGIDQRPTQTNGEPLRSDSIILLHINKDHSSGYMISLPRDSYV
YIPAYDNGKQKWAGGKTKINAAFAFGTRGLKGNEALQHGFELLTMTVKEL
TGITPDAGAIIDFQGFRDVVNVLGKVCMYVDTTTKSIHLGKDQNGKTAKP
FVINPDGTLKSKISGVTPNTYTKGDHCFTPGQALDFVRQRDLLADNSLDY
GRQRHQQQFFKAIINQALKDGLDSPTKLPKLLSAFGKAMTVDDGGIDLAD
WALAMRSLKPDKLLTIKTNAGKLNSENVPGSGSVELLSDDSMDLLKSIKK
DQIDTFLLSHPAFIANS
SEQ ID NO228 orf28 糖基轉(zhuǎn)移酶 317aa
MPSEPDVSVVIPTCNRPELAVRAVRSALGQTHRNLEVIVVVDGPDEATVT
ALGEVGDPRLSVIVLPERGKAPNARNTGARAARGRWTAMLDDDDEWLPTK
IERQLETAAATVERPVVACRMISRTPRADTIMPRRLPEPGEPISEYLLV
RRGLFYGDGFVQTSCIMAPTELWRKVPFTVGLRRAQELDWTLRAMREPGT
ALIYAEEPLVLWHQDENRDRISLQNPWREQLEWLRGNRELFTPRAYAAFT
LSVLSSMAAPTRDTGLFRELLAEARTHGDPGTVDYLTHMQIWALPPSVRH
RLRDVVVGRGKTSSNAG
SEQ ID NO229 orf29 糖基轉(zhuǎn)移酶 369aa
MPAERRVAIWRSSMLPGSETFVRNQADALTRWTPAYVGAVRHESVLSRPD
DVIAFPGGKGFLRLRLTGASPQLQKTISAVRPNLVHAHFGGDGWLVSHSA
QQLGVPLAVTVHGHDVTRQPSSPGAKGVRYRRNLQTVFTRASLVIAVSEV
IRGQAIRWGADPAKVKVHYTGIAVPPEQPEEVPKRWDVVFIGRFVAKKGV
DDLLTALAAVESRPRALLIGDGELMTAMRARAEQLGVDVTFAGSRTPEQV
RRHLLESRLLACPSKTAPDGDTEGLPTTILEAAALGLPVVATRHSGIPEA
VIDGETGLLSPEADPAALAVSLTRLLGDEDLQRRLGARARRHVTAHFDLV
EQTRRLEDLYDEVVAGARV
SEQ ID NO230 orf30 二氫硫辛酰胺脫氫酶 459aa
MGEHFDLVVLGAGPGGYVAAIRGAQLGLTTAIVEDKYWGGVCLNVGCIPS
KALLRNAELAHIFHHQAQTFGIEGKVTFDFAVAHQRSRSVADGRVKGVHF
LMKKNGITEIQGRGEFTDAHTLRVGDRTVTFDNCILATGASTRMIPGTSV
SKRVVTYEEQILDPDLPDSIVIVGAGAIGVEFAYVLRNYGVDVTIVEFLD
RMLPLEDEEVSKELLRQYRKLGVDVRVGTRVEGIEEGADSVRVTVSKNGK
TEVLEADKVMQAIGFKPNVEGYGLETTGVTVSDRGAVEIDDFCRTNVPGI
YAIGDVTAKLMLAHAAEAMGIVAAETIAGAETMALDYRMIPRATFCQPQV
ASFGWTEAQAREQGFDVKVAKFPFTANGKAHGLGDATGFVKILSDAKYGE
LLGAHLIGPDVTELLPELTLAQQWDLTVHEVGRNVHAHPTLAEAVKEAIH
GLAGHMINF
SEQ ID NO231 orf31 假定膜蛋白 348aa
MTTPPRRSGTLSLVTLTVEPPIAPAPPAAPGRSRRRRLGYLAFVLVAVVA
VVTLRDRLPDPGEFLDALRAADWRWAALAVGAGVLSQIAYAEQQRRLLAA
FGVRVPARRAIAMTYVRSALSMALPAGSAASAAYAFQVYRRHGATAAISA
TATLISTVVTVMSLGLLYAATWSLTATVVAGLAVLLLWIYRTVRGPVPAR
AGVPRRLRVAPIARLLQRPAVAQALRGARSVPARTWLTVTLAGVINWLLD
MACLLLAADALHAGLGWSRLALIYLAVQVVRQIPLTPGGIGLIETSMLAG
LIAAGAPQVTAAGIVLIYRLISFWLILPSGLAAHLTLRRGTVPPVTPG
SEQ ID NO232-SEQ ID NO299
(Null)
SEQ ID NO300 O/SBDIG-1
TGGGTSTGCACSCTSACSATCGARTGCGGNACSGTSATCTGCGCSTGC
SEQ ID NO301 O/ACT08F
TCCAGCACGCGCGGGG
SEQ ID NO302 O/ACT09R
GTTCGACCAGCCGCCC
SEQ ID NO303 O/AGvar01bF
TTCTAGACGTTGTTCTCCCATTTTCAC
SEQ ID NO304 O/AGvar02bR
AAGATCTTCGAAGGTGAGCTCGCCGAA
SEQ ID NO305 O/AGvar03F
GATCTTCGCGAGGACCGCACCATCTACGCCGCCAGCAGCGGCTGGGTGTGTACACTGACGATCGAGTGCGG
CACCGTGATCTGCGCCTGCTGAC
SEQ ID NO306 O/AGvar04R
CTAGGTCAGCAGGCGCAGATCACGGTGCCGCACTCGATCGTCAGTGTACACACCCAGCCGCTGCTGGCGGC
GTAGATGGTGCGGTCCTCGCGAA
SEQ ID NO307 O/AGvar05F
GCCTGCTGACCTAGGTCGACGATCGT
SEQ ID NO308 O/AGvar06r
TGAATTCGGCTGCTCCCCGCGCGAAAT
SEQ ID NO309 O/SB50F
ATTCGCCCGGGAAGTCCACCGAAAGGAAGACACACCATGATTCCGGGGATCCGTCGACC
SEQ ID NO310 O/SB51R
GGGCGATGCCCGCCCCGGGCCGGAAACGATCGTCGATCATGTAGGCTGGAGCTGCTTC
SEQ ID NO311 O/SB52F
AAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGATTCCGGGGATCCGTCGACC
SEQ ID NO312 O/SB53R
GCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCATGTAGGCTGGAGCTGCTTC
權(quán)利要求
1.一種化合物,其通式如下
其中
-X1-X2-代表-Leu-Val-;-Val-Val-或者-Leu-Ile-;
Y代表-S-或-S(O)-;和
Z代表NH2或Ala-,
或其藥學(xué)上可接受的鹽。
2.一種化合物,其通式如下
其中
-X1-X2-代表-Leu-Val-;-Val-Val-或者-Leu-Ile-;
Y代表-S-或-S(O)-;和
Z代表NH2或Ala-,
或者所述化合物的具有生物學(xué)活性的變體形式,或者該化合物或其變體形式的衍生物,或者該化合物,或其變體或它們的衍生物的藥學(xué)上可接受的鹽。
3.根據(jù)權(quán)利要求2所述的化合物,其中所述變體是指通式中Z位代表一個(gè)氨基酸。
4.根據(jù)權(quán)利要求3所述的化合物,其中所述氨基酸選自如下基團(tuán)Ala,Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu-,Arg-,Ser-和Trp,且所述氨基酸為D-或者L-構(gòu)型。
5.根據(jù)權(quán)利要求3所述的化合物,其中Z位代表的氨基酸選自如下基團(tuán)Ile-,Lys-,Phe-,Val-,Glu-,Asp-,His-,Leu-,Arg-和Ser-。
6.根據(jù)權(quán)利要求2至5中任一項(xiàng)所述的化合物,其中所述衍生物的C末端分子式為-COR,其中R代表基團(tuán)-NR1R2,這里R1和R2獨(dú)立地代表
(i)氫原子;
(ii)一個(gè)通式為-(CH2)n-NR3R4的基團(tuán),其中n代表從2到8的整數(shù),并且R3和R4獨(dú)立地代表氫原子或(C1-C4)烷基或者R3和R4合起來代表基團(tuán)-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或-(CH2)5-;或者R1和R2與相鄰的氮原子合起來代表一個(gè)4位被如下取代基所取代的哌嗪
(a)(C1-C4)烷基;
(b)(C5-C7)-環(huán)烷基,
(c)吡啶基,
(d)-(CH2)p-NR5R6,其中p代表一個(gè)從1到8的整數(shù),并且R5和R6獨(dú)立地代表氫原子或(C1-C4)烷基;
(e)哌啶基;
(f)被取代的哌啶基,其中所述被取代的哌啶基含有一個(gè)(C1-C4)烷基的N-取代基。
(g)芐基;和
(h)被取代的芐基,其苯環(huán)部分含有1個(gè)或者2個(gè)取代基,所述取代基可以是氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。
7.根據(jù)權(quán)利要求2至6中任一項(xiàng)所述的化合物,其中所述衍生物的C末端通式為-COR,其中R代表基團(tuán)-NR1R2,這里R1和R2獨(dú)立地代表氫原子,通式為-(CH2)n-NR3R4的基團(tuán),其中n代表從2到8的整數(shù),并且R3和R4獨(dú)立地代表氫原子或(C1-C4)烷基或者R3和R4合起來代表基團(tuán)-(CH2)3-,-(CH2)4-,(CH2)2-O-(CH2)2-,-(CH2)2-S-(CH2)2-或-(CH2)5-,或者R1和R2與相鄰的氮原子合起來代表一個(gè)4位被如下取代基所取代的哌嗪(C1-C4)烷基;(C5-C7)-環(huán)烷基,吡啶基,芐基,以及被取代的芐基,其苯環(huán)部分含有1個(gè)或者2個(gè)取代基,所述取代基可以是氯原子,溴原子,硝基,(C1-C4)烷基以及(C1-C4)烷氧基。
8.根據(jù)權(quán)利要求2至7中任一項(xiàng)所述的化合物,其中內(nèi)部殘基的側(cè)鏈羧基官能團(tuán)被修飾,所述官能團(tuán)從-COOH被修飾成基團(tuán)-COOR5,其中R5代表氫原子,(C1-C4)烷基或者(C1-C4)烷氧基(C2-C4)烷基。
9.根據(jù)權(quán)利要求2至8中任一項(xiàng)所述的化合物,其中所述化合物的N末端氨基基團(tuán)-NH2被基團(tuán)-NHR6替代,其中R6代表(C1-C4)烷基。
10.分離得到的核酸,其編碼選自下列序列中的任意一種的多肽SEQID NOs:1-4,SEQ ID NOs:11-14,SEQ ID NOs:212,22,23和119。
11.分離得到的核酸,其編碼選自下列序列中的任意一種的多肽SEQID NOs:1-4,SEQ ID NOs:11-14,SEQ ID NOs:212,22,23和119,或編碼上述序列的有生物學(xué)活性的變體形式。
12.分離得到的多肽,包含SEQ ID NOs:101-132中的任一序列,或一種與上述序列中的任一條具有至少90%的序列同一性的變體形式。
13.分離得到的多肽,包含SEQ ID NOs:201-231中的任一序列,或一種與上述序列中的任一條具有至少90%的序列同一性的變體形式。
14.表達(dá)構(gòu)件,其包含權(quán)利要求10或權(quán)利要求11所述的核酸序列。
15.一組表達(dá)構(gòu)件,其包含權(quán)利要求10或權(quán)利要求11所述的第一核酸,和編碼LanM多肽的第二核酸,所述多肽包含SEQ ID NO:120或SEQID NO:213序列,或者是與SEQ ID NO:120或SEQ ID NO:213具有至少90%以上序列同一性的變體形式。
16.一組表達(dá)構(gòu)件,其包含權(quán)利要求10或權(quán)利要求11所述的第一核酸,或包含權(quán)利要求7所述的第一和第二核酸,和編碼LanR多肽的第三核酸,該多肽包含序列SEQ ID NO:122或SEQ ID NO:216,或者是與SEQID NO:122或SEQ ID NO:216具有至少90%以上序列同一性的變體形式。
17.根據(jù)權(quán)利要求15或權(quán)利要求16所述的一組表達(dá)構(gòu)件,其進(jìn)一步編碼SEQ ID NO:123或其變體,或編碼SEQ ID NO:214或其變體的LanT多肽的核酸。
18.根據(jù)權(quán)利要求15、16或17所述的表達(dá)構(gòu)件,其進(jìn)一步包含編碼SEQ ID NO:122或其變體,或編碼SEQ ID NO:215或其變體的LanO多肽的核酸。
19.重組載體,其包含權(quán)利要求14至17中任意一項(xiàng)所述的表達(dá)構(gòu)件中的任意一種。
20.用權(quán)利要求19所述的載體轉(zhuǎn)化的宿主細(xì)胞。
21.根據(jù)權(quán)利要求20所述的宿主細(xì)胞,該細(xì)胞為一種放線菌。
22.根據(jù)權(quán)利要求21所述的放線菌,所述放線菌為非生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞。
23.根據(jù)權(quán)利要21或22所述的放線菌,其選自Streptomyces lividans,S.coelicolor和S.cinnamoneus所組成的組。
24.一種生產(chǎn)權(quán)利要求1至9中任一項(xiàng)所述的化合物的方法,其包含在一種生產(chǎn)羊毛硫細(xì)菌素類抗菌肽宿主細(xì)胞中表達(dá)一段編碼多肽的序列,該序列選自SEQ ID NOs:1,2,3,11,12,13,212,22和23中的一種,或者上述序列的變體形式。
25.根據(jù)權(quán)利要求24所述的方法,其中所述的宿主細(xì)胞中內(nèi)源的LanA基因存在突變致使該基因不能表達(dá)或者基因產(chǎn)物沒有活性。
26.根據(jù)權(quán)利要求24或25所述的方法,其中宿主細(xì)胞是產(chǎn)加爾巴丁游動(dòng)放線菌或利古里亞游動(dòng)放線菌。
27.根據(jù)權(quán)利要求24至26中任一項(xiàng)所述的方法,其中宿主細(xì)胞是利古里亞游動(dòng)放線菌NCIMB 41362。
28.根據(jù)權(quán)利要求24所述的方法,其中宿主細(xì)胞是一種不生產(chǎn)羊毛硫細(xì)菌素類抗菌肽的放線菌,且所述放線菌使用序列SEQ ID NO:100或SEQID NO:200,或者上述序列的片斷或變體形式去轉(zhuǎn)化,其中所述的片段或變體賦予了該宿主細(xì)胞生產(chǎn)羊毛硫細(xì)菌素的能力。
29.根據(jù)權(quán)利要求28所述的方法,其宿主細(xì)胞被編碼SEQ IDNOs:116-127的核酸轉(zhuǎn)化,或者被其編碼與SEQ ID NOs:116-127的多肽具有至少90%序列同一性的多肽的核酸變體轉(zhuǎn)化。
30.根據(jù)權(quán)利要求28所述的方法,其宿主細(xì)胞被編碼SEQ IDNOs:206-220的核酸轉(zhuǎn)化,或者被其編碼與SEQ ID NOs:206-220的多肽具有至少90%序列同一性的多肽的核酸變體轉(zhuǎn)化。
31.菌株利古里亞游動(dòng)放線菌NCIMB 41362。
32.在其內(nèi)源性的LanA基因有突變致使該基因不表達(dá)或基因產(chǎn)物無活性的利古里亞游動(dòng)放線菌NCIMB 41362的衍生物
33.重組DNA盒,其包含一段編碼SEQ ID NO:212的羊毛硫細(xì)菌素LigA的前原肽的核苷酸序列,所述序列包含
位于或者鄰近編碼序列N末端編碼區(qū)的第一限制性內(nèi)切酶位點(diǎn);
位于第一限制酶切位點(diǎn)的下游且位于編碼序列之中的第二限制性內(nèi)切酶位點(diǎn),該位點(diǎn)為可選酶切位點(diǎn);
位于或者鄰近編碼序列C末端編碼區(qū)的第三限制性酶切位點(diǎn)。
其中至少有一個(gè)所述的限制性酶切位點(diǎn)沒有出現(xiàn)在SEQ ID NO:200的ligA編碼序列中。
34.重組DNA盒,其包含編碼SEQ ID NO:119的羊毛硫細(xì)菌素Lan A的前原肽的核苷酸序列,所述序列包含
位于或者鄰近編碼序列N末端編碼區(qū)域的第一限制性內(nèi)切酶位點(diǎn);
位于第一限制性內(nèi)切酶位點(diǎn)的下游且位于編碼序列之中的第二限制性內(nèi)切酶位點(diǎn),該位點(diǎn)為可選酶切位點(diǎn);
位于或者鄰近編碼序列C末端編碼區(qū)的的第三限制性酶切位點(diǎn)。
其中至少有一個(gè)所述的限制性酶切位點(diǎn)沒有出現(xiàn)在SEQ ID NO:100的lanA編碼序列中。
35.制備羊毛硫細(xì)菌素類抗菌肽編碼基因序列文庫的方法,其包括
提供權(quán)利要求33或34所述的表達(dá)盒,
在表達(dá)盒的第一個(gè)與第二個(gè)限制性內(nèi)切酶位點(diǎn)之間,第一個(gè)與第三個(gè)限制性內(nèi)切酶位點(diǎn)之間,或者第二個(gè)與第三個(gè)限制性內(nèi)切酶位點(diǎn)之間導(dǎo)入多個(gè)序列,其中每個(gè)所述序列除了有1到15個(gè)核苷酸的改變外均與羊毛硫細(xì)菌素編碼序列相對應(yīng);和
回收編碼多個(gè)lantibitotic類抗菌肽變體的序列的表達(dá)文庫。
36.一種方法,其包含
提供根據(jù)權(quán)利要求35的方法制備的表達(dá)文庫;
將所述文庫中一個(gè)或多個(gè)表達(dá)盒導(dǎo)入到能夠表達(dá)羊毛硫細(xì)菌素抗菌肽的宿主細(xì)胞中;和
篩選具有l(wèi)aintibiotic抗菌肽活性的宿主細(xì)胞。
37.根據(jù)權(quán)利要求36所述的方法,其進(jìn)一步包含回收羊毛硫細(xì)菌素。
38.權(quán)利要求36或37之方法,其進(jìn)一步包含分離一種含有文庫中某個(gè)成員的宿主細(xì)胞。
39.一種分離的核酸,其包含SEQ ID NO:100或SEQ ID NO:200,或者包含上述序列的片斷或變體,其中所述的片斷和變體可以為作為宿主細(xì)胞的放線菌提供生產(chǎn)羊毛硫細(xì)菌素的能力。
40.根據(jù)權(quán)利要求39所述的分離的核酸,其中所述核酸編碼SEQ IDNOs:116-127序列或者變體形式,其中核酸編碼的多肽至少與SEQ IDNOs:116-127存在90%以上的序列同一性。
41.根據(jù)權(quán)利要求39所述的分離的核酸,其中所述的宿主細(xì)胞使用編碼SEQ ID NOs:206-220或其變體的核酸轉(zhuǎn)化,其中所述核酸編碼的多肽至少與SEQ ID NOs:206-220存在90%以上的序列同一性。
42.藥物組合物,其包括任意一種權(quán)利要求1至9中所述的化合物,以及一種藥學(xué)上可接受的載體或稀釋劑。
43.治療或預(yù)防受治療者細(xì)菌感染的方法,其包含對所述受治療者使用權(quán)利要求1-9中任一項(xiàng)所述的化合物或使用權(quán)利要求42所述的藥物組合物。
全文摘要
本發(fā)明涉及羊毛硫細(xì)菌素類抗菌肽阿肽加定的生物合成成簇基因的表征,一種新型變種阿肽加定與其基因合成簇的鑒定。本發(fā)明還涉及生產(chǎn)與使用如下多肽的方法,其包括阿肽加定,一種新的阿肽加定變體即本文中的阿肽加定B,以及根據(jù)本發(fā)明應(yīng)用已表征的生物合成成簇基因中的基因所生產(chǎn)出的這兩種多肽的變體形式。
文檔編號C07K7/08GK101389641SQ200780006748
公開日2009年3月18日 申請日期2007年1月17日 優(yōu)先權(quán)日2006年1月17日
發(fā)明者史蒂文·博克斯, 赫蘇斯·科爾特斯巴爾加略, 邁克爾·約翰·道森 申請人:諾瓦克塔生物系統(tǒng)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
靖远县| 仙游县| 吉林省| 海口市| 新化县| 长岛县| 乡城县| 塔河县| 山阳县| 浑源县| 延边| 宾阳县| 阿坝| 靖边县| 灌阳县| 阿瓦提县| 达州市| 化州市| 南涧| 德州市| 丽江市| 太和县| 亚东县| 博乐市| 阜康市| 桐梓县| 平凉市| 临潭县| 萨嘎县| 渝北区| 陆河县| 长兴县| 友谊县| 夏河县| 钟祥市| 都兰县| 板桥市| 西宁市| 渝中区| 那曲县| 五寨县|