在轉(zhuǎn)基因哺乳動(dòng)物奶中生產(chǎn)融合蛋白的方法

文檔序號：3556009閱讀：379來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>有機(jī)化學(xué)裝置的制造及其處理,應(yīng)用技術(shù)

專利名稱：在轉(zhuǎn)基因哺乳動(dòng)物奶中生產(chǎn)融合蛋白的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及具有生物活性并可以用于藥物學(xué)的雙功能融合蛋白的生產(chǎn)。特別地，本發(fā)明提供在轉(zhuǎn)基因哺乳動(dòng)物奶中尤其是非人胎盤哺乳動(dòng)物奶中生產(chǎn)與重組人α-甲胎蛋白序列相連的β-干擾素和α-甲胎蛋白融合蛋白序列，并提供了該融合蛋白在治療應(yīng)用或病癥中的用途。
背景技術(shù)：
如上所述，本發(fā)明總地涉及在轉(zhuǎn)基因動(dòng)物奶中轉(zhuǎn)基因生產(chǎn)融合蛋白的領(lǐng)域。具體地，涉及產(chǎn)生能夠生產(chǎn)各種目標(biāo)融合蛋白的各種物種的轉(zhuǎn)基因非人哺乳動(dòng)物的改良方法。
目前，存在許多藥物學(xué)上未能開發(fā)的具有一個(gè)或多個(gè)潛在治療活性的多肽、大分子和/或蛋白質(zhì)(“感興趣的蛋白質(zhì)”)。對于該無能存在各種原因，如體內(nèi)的低穩(wěn)定性、非-真核細(xì)胞蛋白質(zhì)中發(fā)現(xiàn)的改變的糖基化模式、不適當(dāng)?shù)姆g加工、三級結(jié)構(gòu)、脆性結(jié)構(gòu)、免疫原性、工業(yè)可接受規(guī)模生產(chǎn)的困難性等等。此外，由于與其純化方法、給藥或藥物動(dòng)力學(xué)相關(guān)的問題，一些治療上感興趣的蛋白質(zhì)在體內(nèi)沒有給出所期望的結(jié)果。
本發(fā)明使得克服這些缺陷成為可能。本發(fā)明提供了新的融合分子，其可以開發(fā)感興趣蛋白質(zhì)的生理特性或效應(yīng)。特別地本發(fā)明起因于以下的證明可以將源自生物活性蛋白質(zhì)的生理活性序列與由保留人α-甲胎蛋白生理活性的蛋白質(zhì)序列組成的另一重組蛋白質(zhì)結(jié)構(gòu)融合來獲得雙功能融合蛋白，而沒有削弱α-甲胎蛋白或其第二個(gè)蛋白部分的生物特性。還起因于發(fā)明者的證明本發(fā)明的重組人α-甲胎蛋白蛋白序列(“AFP”)可以提高本發(fā)明融合蛋白的半衰期，以及還增加了協(xié)同的治療效能。
現(xiàn)有技術(shù)中已經(jīng)顯示了AFP的生理效應(yīng)包括對各種細(xì)胞類型的刺激和抑制效果。這些效果大部分由靶細(xì)胞類型、AFP的相對濃度以及其它細(xì)胞因子和生長因子的存在來決定。例如，AFP可以抑制多種腫瘤細(xì)胞的生長，尤其是，抑制雌激素刺激的或雌激素敏感的細(xì)胞的生長。相反地，AFP刺激正常胚胎成纖維細(xì)胞的生長。AFP還已經(jīng)顯示了具有免疫抑制和免疫增生效果。因此可以這樣利用AFP融合蛋白的治療效用來最大化各種病況的治療藥理有效性，尤其是使用雙功能分子。
根據(jù)本發(fā)明的融合蛋白可以在動(dòng)物體內(nèi)維持所需的生物活性延長的時(shí)間段。還可以通過重組生物體在允許商業(yè)開發(fā)的水平上分泌表達(dá)根據(jù)本發(fā)明的目標(biāo)蛋白質(zhì)，如在細(xì)胞培養(yǎng)生產(chǎn)設(shè)備或轉(zhuǎn)基因哺乳動(dòng)物中。沿著這條線，轉(zhuǎn)基因哺乳動(dòng)物對于本發(fā)明的融合蛋白是優(yōu)選的生產(chǎn)和表達(dá)載體。
長期需要具有特定所需特性或特征的哺乳動(dòng)物，如提高的體重、奶含量、奶生產(chǎn)體積、哺乳間隔的長度和疾病抗性。傳統(tǒng)育種方法能夠產(chǎn)生具有一些特定所需特性的動(dòng)物，但是這些特性通常伴隨多種非所需的特征，且通常太費(fèi)時(shí)、成本高和發(fā)展不可靠。此外，這些方法完全不能夠使特定動(dòng)物系產(chǎn)生基因產(chǎn)物，如所述物種的遺傳互補(bǔ)另外完全缺失的所需蛋白治療劑(即，人或人源化血漿蛋白或有蹄類奶中的其它分子)。能夠產(chǎn)生轉(zhuǎn)基因動(dòng)物的技術(shù)發(fā)展在生產(chǎn)工程化攜帶特定特性或設(shè)計(jì)成表達(dá)特定蛋白或其它新的治療、科學(xué)或商業(yè)價(jià)值的分子化合物的動(dòng)物中提供了特別精確的方法。即，轉(zhuǎn)基因動(dòng)物是攜帶已經(jīng)在發(fā)育早期有意引入現(xiàn)有體細(xì)胞和/或種系細(xì)胞的目標(biāo)基因的動(dòng)物。隨著動(dòng)物的發(fā)育和生長，工程化進(jìn)入動(dòng)物中的蛋白產(chǎn)物或特定的發(fā)育改變得到表達(dá)，而且在這一點(diǎn)上存在于該動(dòng)物及其后代的遺傳互補(bǔ)中。
本發(fā)明的優(yōu)選實(shí)施方案中提供了在轉(zhuǎn)基因哺乳動(dòng)物奶中批量生產(chǎn)目標(biāo)雙功能融合蛋白。在奶中生產(chǎn)目標(biāo)融合蛋白作為批量生產(chǎn)方法是理想的，因?yàn)槭褂靡阎哪虉黾夹g(shù)可以生產(chǎn)、收集和純化非常大體積的奶。使用轉(zhuǎn)基因哺乳動(dòng)物生產(chǎn)方法的第二個(gè)優(yōu)勢在于對于人體內(nèi)生物活性必需的一些反應(yīng)，例如羧基端酰胺化，通過現(xiàn)有化學(xué)方法或在細(xì)菌中或其它體外情況中是難以以良好產(chǎn)量來進(jìn)行的。例如，通過識別并修飾目標(biāo)融合蛋白或羧基端具有甘氨酸殘基的蛋白的特定酶來催化羧基端酰胺化。因此，本發(fā)明合適設(shè)計(jì)的融合蛋白可以在分泌進(jìn)入轉(zhuǎn)基因動(dòng)物的奶之前得到特異性的酰胺化。這只是可以通過乳腺中的生物合成途徑進(jìn)行并可能用于特定融合蛋白合成的一系列翻譯后修飾的一個(gè)實(shí)例。所需翻譯后修飾的其它實(shí)例包括二硫橋形成、谷氨酸殘基的γ-羧化作用以及O-和N-連接糖基化的加入。
關(guān)于AFP的生理活性片段，還必須注意重組AFP的非糖基化形式呈現(xiàn)與正常糖基化形式相似的生物特性并由于缺少糖基化的可變性提供了標(biāo)準(zhǔn)化的均一產(chǎn)品。還可以更容易地在體外或轉(zhuǎn)基因系統(tǒng)中生產(chǎn)。因此，非糖基化AFP對于商業(yè)生產(chǎn)是優(yōu)選的形式。
根據(jù)現(xiàn)有技術(shù)，能夠生產(chǎn)目標(biāo)重組蛋白的動(dòng)物的產(chǎn)生是已知的。然而，在本發(fā)明之前仍然未知的是本發(fā)明所需的遺傳操縱水平、各種可獲得融合蛋白成分的修飾序列、本發(fā)明雙功能分子的協(xié)同作用及其在病狀或病理學(xué)中的用途。
因此，存在對治療組合物改良生產(chǎn)方法的需要。在核移植范圍內(nèi)，本發(fā)明的方法通常應(yīng)用于初級體細(xì)胞，來產(chǎn)生可用于在它們的奶中生產(chǎn)目標(biāo)重組融合雙功能蛋白的轉(zhuǎn)基因動(dòng)物。

發(fā)明內(nèi)容
簡要地說，本發(fā)明提供了生產(chǎn)所關(guān)心的雙功能融合蛋白的方法，優(yōu)選通過使用轉(zhuǎn)基因動(dòng)物。該方法包括用給定的轉(zhuǎn)基因構(gòu)建體轉(zhuǎn)染非人哺乳動(dòng)物細(xì)胞系，該構(gòu)建體含有至少一個(gè)編碼所需的第一個(gè)所需肽片段和第二個(gè)所需肽片段的重組DNA編碼序列，其中每個(gè)片段保留目標(biāo)單個(gè)蛋白的生物活性。該方法包括產(chǎn)生DNA構(gòu)建體；選擇其中所需重組序列已經(jīng)插入細(xì)胞或細(xì)胞系基因組中的細(xì)胞系；進(jìn)行核移植程序來產(chǎn)生與所需融合蛋白雜合的轉(zhuǎn)基因動(dòng)物。此后，可以從轉(zhuǎn)基因動(dòng)物的奶或其它體液中收集表達(dá)雙功能融合蛋白的融合蛋白并純化用作治療劑。
根據(jù)本發(fā)明可以進(jìn)行的另一步驟是將雜合轉(zhuǎn)基因動(dòng)物活體切片檢查。此后，根據(jù)本發(fā)明，用從雜合動(dòng)物獲得的活體切片檢查過的細(xì)胞系來體外擴(kuò)大細(xì)胞系，在較短的時(shí)間段內(nèi)產(chǎn)生多個(gè)轉(zhuǎn)基因動(dòng)物。
可替換地或另外地，可以進(jìn)行核移植程序來產(chǎn)生轉(zhuǎn)基因細(xì)胞團(tuán)，用于研究、連續(xù)克隆或其它的體外用途。本發(fā)明的優(yōu)選實(shí)施方案中，通過幾種已知的分子生物學(xué)方法中的一種來表征存活細(xì)胞，這些方法包括但不限于FISH、DNA印跡法或PCR。以上提供的方法可以加速生產(chǎn)與所需轉(zhuǎn)基因純合的轉(zhuǎn)基因動(dòng)物畜群并因此更有效地生產(chǎn)所需的生物藥物。這樣，本發(fā)明可以生產(chǎn)遺傳上所需的自身表達(dá)目標(biāo)雙功能融合蛋白的牲畜或非人哺乳動(dòng)物。
此外，本發(fā)明的方法還可以產(chǎn)生一個(gè)或多個(gè)攜帶特別有益或有價(jià)值融合蛋白的純合動(dòng)物，潛在地提高所需蛋白質(zhì)的畜群產(chǎn)量，比現(xiàn)有方法更快。同樣，本發(fā)明的方法還提供了替代由于疾病或其自身死亡失去的特定轉(zhuǎn)基因動(dòng)物。它們還將有助于和促進(jìn)用各種DNA構(gòu)建體構(gòu)建的轉(zhuǎn)基因動(dòng)物的生產(chǎn)以致最佳化所需生物藥物組合物的生產(chǎn)并降低生產(chǎn)成本。
因此，根據(jù)本發(fā)明的實(shí)施方案，可以用于制造與目標(biāo)融合蛋白純合的轉(zhuǎn)基因動(dòng)物。該實(shí)施方案中，優(yōu)選表征目標(biāo)轉(zhuǎn)基因和雜合轉(zhuǎn)基因動(dòng)物的遺傳組成。此后，通過使用標(biāo)記物質(zhì)來選擇與所需轉(zhuǎn)基因純合的細(xì)胞；使用已知的分子生物學(xué)方法來表征存活細(xì)胞；挑選存活細(xì)胞或細(xì)胞集落細(xì)胞用于第二輪核移植或胚胎移植；和生產(chǎn)與所需融合蛋白純合的動(dòng)物。
因此本發(fā)明的一個(gè)主題涉及雙功能融合蛋白，該融合蛋白含有源自具有治療活性肽片段的活性部分，該活性部分與人α-甲胎蛋白或人α-甲胎蛋白變體偶聯(lián)，這兩部分具有分開的效果，且在一些情況中具有協(xié)同效果。
本發(fā)明的另一主題涉及上述嵌合分子的制備方法。更具體地，該方法包括促使真核或原核細(xì)胞宿主表達(dá)編碼所需融合蛋白的核苷酸序列，且然后收集融合蛋白產(chǎn)物。
因此，本發(fā)明的目的是提供能夠治療重癥肌無力的藥物。
本發(fā)明的另一目的是提供抑制癌細(xì)胞增生的藥物和/或?qū)梢园l(fā)展成能夠供養(yǎng)腫瘤的血管的內(nèi)皮細(xì)胞是抗血管生成的藥物。
本發(fā)明的再一目的是提供治療類風(fēng)濕性關(guān)節(jié)炎患者的方法。
本發(fā)明的另一目的是提供使用在此所述的藥物來治療癌癥的方法。
本發(fā)明的另一目的是提供使用根據(jù)本發(fā)明的雙功能蛋白質(zhì)來治療皮膚病或受損皮膚的方法。
通過本發(fā)明可以達(dá)到閱讀以下公開內(nèi)容時(shí)更顯而易見的這些和其它目的。

圖1顯示了實(shí)施本發(fā)明所涉及方法的流程圖。
圖2顯示了通過核移植形成克隆動(dòng)物方法的概圖。
圖3顯示了β-干擾素氨基酸序列的圖。
圖4顯示了所關(guān)心的融合蛋白。
詳述以下的縮寫在說明書中具有指定的含意縮寫的解釋體細(xì)胞核移植(SCNT)囊性纖維化跨膜傳導(dǎo)調(diào)節(jié)蛋白 (CFTR)核移植 (NT)合成輸卵管流體 (SOF)胎牛血清(FBS)聚合酶鏈?zhǔn)椒磻?yīng) (PCR)牛血清白蛋白(BSA)術(shù)語解釋
AFP分泌信號或“AFP信號肽”或“AFP前導(dǎo)序列”或“AFP信號序列”——具有與基因庫登記號No.V01514所列氨基酸1-18基本上相同氨基酸序列的肽(通過核苷酸45-98編碼)。蛋白質(zhì)分泌信號是在加工或成熟處理過程中從AFP切割得到的。
?！獙儆诟鞣N物種的奶牛或與各種物種的奶牛相關(guān)。
生物活性/生理活性——指的是廣義地解釋。在干擾素樣蛋白質(zhì)的情況中，包括所有已知(或待發(fā)現(xiàn)的)特性，包括對人IFN-α或?qū)θ薎FN-β具有特異性的或兩者所共有的特性，如它們的抗病毒活性及其調(diào)節(jié)主要組織相容性復(fù)合體(MHC)的抗原的能力。
生物流體——生物體如哺乳動(dòng)物、鳥、兩棲動(dòng)物或爬行動(dòng)物產(chǎn)生的水溶液，其含有浸于水溶液中的細(xì)胞分泌的蛋白質(zhì)。實(shí)例包括奶、尿液、唾液、精液、陰道流體、滑液、淋巴液、羊水、血液、汗水和眼淚；以及植物產(chǎn)生的水溶液，例如，包括滲出液、葉尖吐水、木質(zhì)部、韌皮部、樹脂和花蜜。
生物流體產(chǎn)生細(xì)胞——生物流體浸泡的并將蛋白質(zhì)分泌至生物流體的細(xì)胞。
生物藥物——意思是其來源、合成或制造涉及使用微生物、重組動(dòng)物(包括，無限制，嵌合或轉(zhuǎn)基因動(dòng)物)、核轉(zhuǎn)移、微量注射或細(xì)胞培養(yǎng)技術(shù)的任何藥物、治療劑、疫苗或任何藥物上有用的組合物。
公山羊——屬于各種物種的山羊或與各種物種的山羊相關(guān)。
編碼——通常指的是以可翻譯形式存在的序列信息，通常可操作地連接于啟動(dòng)子(例如，β-酪蛋白或β-乳球蛋白啟動(dòng)子)。當(dāng)功能啟動(dòng)子提高該序列的轉(zhuǎn)錄或表達(dá)時(shí)，將序列可操作地連接于啟動(dòng)子。認(rèn)為反義鏈也編碼序列，因?yàn)橄嗤畔?nèi)容以容易獲得的形式存在，尤其是當(dāng)連接于促進(jìn)有義鏈表達(dá)的序列時(shí)。使用標(biāo)準(zhǔn)的或修飾的遺傳密碼，信息是可轉(zhuǎn)變的。
表達(dá)載體——遺傳上工程化的質(zhì)?；虿《?，源自例如噬菌體、腺病毒、逆轉(zhuǎn)錄病毒、痘病毒、皰疹病毒或人工染色體，用于將可操作地連接于啟動(dòng)子的AFP融合蛋白編碼序列轉(zhuǎn)移至宿主細(xì)胞中，使得編碼的重組AFP融合蛋白在宿主細(xì)胞中得到表達(dá)。
功能蛋白——具有生物活性或其它活性或用途的蛋白質(zhì)，與內(nèi)源產(chǎn)生時(shí)看到的相似。
融合載玻片——以固定距離分開放置的平行電極的載玻片。將細(xì)胞偶聯(lián)體放置于電極之間來接受用于融合和激活的電流。
同源序列——指的是當(dāng)比較時(shí)呈現(xiàn)相似性的遺傳序列。核酸同源性的標(biāo)準(zhǔn)是通常本領(lǐng)域所用的同源性量度或雜交條件。核酸的基本上同源性意思是區(qū)段或其互補(bǔ)鏈當(dāng)比較時(shí)，當(dāng)最佳序列比對時(shí)，至少約60％的殘基，通常至少約70％，更通常至少約80％，優(yōu)選至少約90％，且更優(yōu)選至少約95％至98％的核苷酸是相同的，具有適當(dāng)?shù)暮塑账岵迦牖蛉笔??；蛘撸谶x擇性雜交條件下，當(dāng)區(qū)段與一條鏈或其互補(bǔ)鏈雜交時(shí)呈現(xiàn)基本上同源性。當(dāng)比特異性全部缺失更有選擇性發(fā)生雜交時(shí)呈現(xiàn)雜交的選擇性。通常，當(dāng)在至少約14個(gè)核苷酸的一段序列上存在至少約55％同源性，優(yōu)選至少約65％，更優(yōu)選至少約75％，且最優(yōu)選至少約90％時(shí)，將發(fā)生選擇性雜交。
人α-甲胎蛋白或“AFP”或“rAFP”——具有與基因庫登記號No.V01514(SEQ ID NO4)所列的成熟α-甲胎蛋白(氨基酸19-609)基本上相同的氨基酸序列并通過基因庫登記號No.V01514(SEQ IDNO3)所列cDNA序列的核苷酸99-1874編碼的并報(bào)道于Morinaga等(PROC.NATL.ACAD.SCI.USA 804604-4608，(1983))中的肽。
人α-甲胎蛋白前體——具有與基因庫登記號No.V01514(SEQ IDNO2)所列的氨基酸1-609基本上相同的氨基酸序列并通過基因庫登記號No.V01514(SEQ ID NO1)所列的cDNA序列的核苷酸45-1874編碼的肽。
前導(dǎo)序列或“信號序列”——編碼蛋白質(zhì)的分泌信號且當(dāng)可操作連接于編碼AFP融合蛋白的下游核酸分子時(shí)指導(dǎo)AFP分泌的核酸序列。前導(dǎo)序列可以是天然的人AFP前導(dǎo)序列、人工衍生的前導(dǎo)序列，或可以從與用于指導(dǎo)AFP編碼序列轉(zhuǎn)錄的啟動(dòng)子相同的基因獲得，或來自細(xì)胞正常分泌的另一種蛋白質(zhì)。
產(chǎn)奶細(xì)胞——將蛋白質(zhì)分泌至奶中的細(xì)胞(例如，乳房上皮細(xì)胞)。
奶特異性啟動(dòng)子——天然指導(dǎo)將蛋白質(zhì)分泌至奶中的細(xì)胞(例如，乳房上皮細(xì)胞)中基因表達(dá)的啟動(dòng)子，并包括，例如，酪蛋白啟動(dòng)子，例如，α酪蛋白啟動(dòng)子(例如，αS-1酪蛋白啟動(dòng)子和αS2酪蛋白啟動(dòng)子)、β酪蛋白啟動(dòng)子(例如，山羊β酪蛋白基因啟動(dòng)子)(DiTullio，BIOTECHNOLOGY 1074-77，1992)、γ酪蛋白啟動(dòng)子和κ酪蛋白啟動(dòng)子；乳清酸性蛋白(WAP)啟動(dòng)子(Gorton等，BIOTECHNOLOGY51183-1187，1987)；β乳球蛋白啟動(dòng)子(Clark等，BIOTECHNOLOGY7487-492，1989)；和α-乳清蛋白啟動(dòng)子(Soulier等，F(xiàn)EBS LETTS.29713，1992)。還包括在乳房組織中特異性激活的啟動(dòng)子并因此根據(jù)本發(fā)明是有用的，例如，鼠乳房腫瘤病毒(MMTV)的長末端重復(fù)(LTR)啟動(dòng)子。
非糖基化人AFP——具有與上述成熟人α-甲胎蛋白基本上相同的氨基酸序列的肽，除了包括SEQ ID NO4的氨基酸位置233的天冬酰胺殘基至谷氨酰胺殘基的突變(如列于SEQ ID NO6)，因此消除單個(gè)糖基化位點(diǎn)。前體非糖基化人α-甲胎蛋白的核酸序列包括SEQ IDNO5所列序列的核苷酸45至1874。
核移植——指的是克隆方法，其中將核從供體細(xì)胞移植入去核的卵母細(xì)胞中。
可操作地連接——當(dāng)合適的分子(例如，轉(zhuǎn)錄激活蛋白)結(jié)合調(diào)控序列時(shí)，以允許基因表達(dá)的方式將基因與一個(gè)或多個(gè)調(diào)控序列連接。
綿羊——屬于綿羊、與綿羊相關(guān)或類似綿羊。
單性生殖——胚胎從卵母細(xì)胞發(fā)育而沒有精子的穿透。
藥物學(xué)純度——指的是適于明確的生物測試以及用于合適給藥來實(shí)現(xiàn)人患者治療的融合蛋白?；旧系乃幬飳W(xué)純度意思是至少約90％純。
豬——屬于或類似豬。
啟動(dòng)子——足以指導(dǎo)轉(zhuǎn)錄的最小序列。本發(fā)明中還包括那些足以使啟動(dòng)子依賴性基因表達(dá)變得對于細(xì)胞類型特異性、組織特異性、暫時(shí)特異性可控制的或通過外部信號或試劑可誘導(dǎo)的啟動(dòng)子元件；這樣的元件可以位于天然基因的5’或3’或內(nèi)含子序列區(qū)域中。
蛋白質(zhì)——如在此所用的包括糖蛋白，以及具有其它附加物的蛋白質(zhì)。這還包括保留生理功能的斷裂的或截短的多肽。
重組——指的是不是天然產(chǎn)生的或是通過人工組合兩個(gè)另外分開的序列區(qū)段制得的核酸序列。通常通過化學(xué)合成方法或通過人工操縱核酸的分離區(qū)段，例如，通過基因工程技術(shù)來實(shí)現(xiàn)該人工組合。通常用編碼相同或保守氨基酸的多余密碼子替代密碼子來進(jìn)行，同時(shí)通常引入或除去序列識別位點(diǎn)。或者，將所需功能多肽序列的核酸區(qū)段連接在一起來產(chǎn)生包括通常天然形式中沒有發(fā)現(xiàn)的所需結(jié)合功能的單個(gè)基因?qū)嶓w。限制酶識別位點(diǎn)通常是這樣人工操縱的目標(biāo)，但是可以通過設(shè)計(jì)摻入其它位點(diǎn)特異性目標(biāo)，例如，啟動(dòng)子、DNA復(fù)制位點(diǎn)、調(diào)節(jié)序列、控制序列或其它有用特征。相似的概念用于重組，例如，根據(jù)本發(fā)明的雙功能融合蛋白。
治療有效量——當(dāng)給藥于患者時(shí)，治療分子或其片段抑制或刺激該分子調(diào)節(jié)的生物活性的量。
轉(zhuǎn)化、“轉(zhuǎn)染”或“轉(zhuǎn)導(dǎo)”——用于將外源分子引入細(xì)胞中的任何方法。脂質(zhì)轉(zhuǎn)染、DEAE-葡聚糖-介導(dǎo)的轉(zhuǎn)染、微量注射、核移植(參見，例如，Campbell等，BIOL.REPROD.49933-942，1993；Campbell等，NATURE 385810-813，1996)、原生質(zhì)體融合、磷酸鈣沉淀、轉(zhuǎn)導(dǎo)(例如，噬菌體、腺病毒、逆轉(zhuǎn)錄病毒或其它病毒傳送)、電穿孔和生物彈道轉(zhuǎn)化只是本領(lǐng)域技術(shù)人員已知的可以使用的幾種方法。
轉(zhuǎn)化細(xì)胞或轉(zhuǎn)染細(xì)胞——通過重組DNA技術(shù)已經(jīng)引入編碼AFP的核酸分子的細(xì)胞(或細(xì)胞的后代)。核酸分子可以穩(wěn)定地?fù)饺胨拗魅旧w中，或可以游離基因地維持。
轉(zhuǎn)基因——通過方法插入細(xì)胞或其祖先的任何片段的核酸分子，且該核酸分子變成從該細(xì)胞發(fā)育而來的動(dòng)物的基因組的一部分。這樣的轉(zhuǎn)基因可以包括對轉(zhuǎn)基因動(dòng)物部分或全部外源(即，外來的)的基因，或可以表示具有與動(dòng)物的內(nèi)源基因相同性的基因。
轉(zhuǎn)基因的——包括已經(jīng)通過方法插入細(xì)胞或其祖先的核酸分子的任何細(xì)胞，且該核酸分子變成從該細(xì)胞發(fā)育而來的動(dòng)物的基因組的一部分。
轉(zhuǎn)基因生物——已經(jīng)實(shí)驗(yàn)上轉(zhuǎn)移進(jìn)另一生物體的遺傳材料的生物，使得該宿主除了其遺傳互補(bǔ)中已經(jīng)具有的，在其染色體中還獲得了轉(zhuǎn)移基因的遺傳信息。
有蹄類——屬于或涉及有蹄的通常食草的四腳哺乳動(dòng)物，包括，無限制，綿羊、豬、山羊、牛和馬。
載體——如在此所用的意思是質(zhì)粒、噬菌體DNA或其它DNA序列，這些序列(1)能夠在宿主細(xì)胞中復(fù)制，(2)能夠轉(zhuǎn)化宿主細(xì)胞和(3)含有適于鑒定轉(zhuǎn)化細(xì)胞的標(biāo)記。
根據(jù)本發(fā)明，提供了生產(chǎn)所關(guān)心融合蛋白的方法，該方法包括在轉(zhuǎn)基因非人胎盤哺乳動(dòng)物的奶中表達(dá)融合蛋白，該融合蛋白包括連接于第二個(gè)目標(biāo)多肽的第一個(gè)目標(biāo)多肽，兩個(gè)多肽具有獨(dú)立的生理效應(yīng)。
用于本發(fā)明的雙功能分子中的一個(gè)目標(biāo)蛋白質(zhì)家族是蛋白質(zhì)的干擾素家族。干擾素(“IFN”)構(gòu)成一組天然生成的蛋白質(zhì)，已知其呈現(xiàn)抗病毒、抗腫瘤和免疫調(diào)節(jié)性能。這類細(xì)胞因子具有免疫刺激/調(diào)節(jié)活性。干擾素是一族小蛋白和糖蛋白，具有約15,000至28,000道爾頓(15-28kDa)分子量，主要通過細(xì)胞響應(yīng)病毒感染以及響應(yīng)合成或生物誘導(dǎo)劑在體內(nèi)產(chǎn)生和分泌。用于描述和命名干擾素的命名法約定是復(fù)雜的。這大部分是由于發(fā)展中的知識和技術(shù)，其已經(jīng)顯示通過相同類型細(xì)胞產(chǎn)生的多種干擾素，干擾素不同種類和形式的發(fā)現(xiàn)，以及與之前報(bào)道的其它相同的相同形式的發(fā)現(xiàn)。因?yàn)槿颂烊桓蓴_素長期以來提取是昂貴的，因此已經(jīng)發(fā)展技術(shù)來制備重組形式的人干擾素。
干擾素通過結(jié)合細(xì)胞表面的特定膜受體來發(fā)揮它們的細(xì)胞活性。一旦結(jié)合細(xì)胞膜，干擾素啟動(dòng)一連串復(fù)雜的胞內(nèi)事件，包括某些其它細(xì)胞因子的上調(diào)、某些酶的誘導(dǎo)、細(xì)胞增殖的抑制、免疫調(diào)節(jié)活性如巨噬細(xì)胞吞噬細(xì)胞活性的提高和淋巴細(xì)胞對靶細(xì)胞特定細(xì)胞毒性的增大(例如，細(xì)胞免疫性)，和病毒感染細(xì)胞中病毒復(fù)制的抑制。
多種生物活性與IFN相關(guān)，包括抗病毒、抗增生和免疫調(diào)節(jié)活性。治療用途包括治療多毛細(xì)胞白血病、慢性骨髓性白血病、低級非霍奇金淋巴瘤、皮膚T細(xì)胞淋巴瘤類癌瘤、腎細(xì)胞癌、頭和頸的鱗狀上皮腫瘤、多發(fā)性骨髓瘤和惡性黑素瘤。對于病毒疾病，已經(jīng)發(fā)現(xiàn)IFN-α有助于治療由乙型肝炎或丙型肝炎病毒引起的慢性活動(dòng)性肝炎。
1993年，美國食品和藥品管理局(FDA)批準(zhǔn)β干擾素(IFN-β)作為多發(fā)性硬化(MS)的治療劑。β干擾素的給藥減慢了這種慢性的且通常損壞神經(jīng)的在美國影響了約350,000人群的疾病的進(jìn)展。藥物的可獲得性對于MS患者是里程碑，這些患者通常從皮質(zhì)類固醇和其它治療劑獲得不足的益處。
MS是自體免疫疾病，其中身體防御系統(tǒng)攻擊髓鞘，髓鞘是保護(hù)腦和脊髓神經(jīng)纖維的脂肪物質(zhì)，和覆蓋電線的絕緣體非常象。因?yàn)镸S損傷在髓鞘中形成了破損，傳導(dǎo)至腦或從腦傳導(dǎo)出來的電脈沖受到了破壞。結(jié)果，患有MS的患者經(jīng)歷包括虛弱、疲勞、失禁、視覺缺陷、語言不清或有時(shí)候癱瘓的癥狀?，F(xiàn)有技術(shù)中已經(jīng)顯示β干擾素正面影響了多發(fā)性硬化的治療。服用高劑量β干擾素的復(fù)發(fā)-減輕MS的不臥床患者具有約低30％的發(fā)作，且嚴(yán)重程度是服用安慰劑患者的一半。因此，通過本發(fā)明方法制得的所關(guān)心分子是AFP-IFN-β雙功能融合蛋白，當(dāng)治療上用于對抗MS時(shí)，具有有益的協(xié)同效果。即，通過功能α-甲胎蛋白部分的存在來協(xié)同性提高β-IFN的治療效果，功能α-甲胎蛋白部分自身具有對抗MS的有益效果。
用于可能的體外生產(chǎn)的原核或真核的合適宿主生物體包括大腸桿菌(E.coli)、假單胞菌(Pseudomonas)、枯草芽孢桿菌(Bacillussubtilis)、蘇云金芽孢桿菌(Bacillus thringiensis)、各種酵母菌株、嗜熱芽孢桿菌(Bacillus thermophilus)，動(dòng)物細(xì)胞如小鼠、大鼠或中國倉鼠卵巢(CHO)細(xì)胞，植物細(xì)胞，動(dòng)物和植物宿主等等。必須認(rèn)識到當(dāng)用載體轉(zhuǎn)化選擇的宿主時(shí)，為了使蛋白質(zhì)序列得到表達(dá)，還將合適的啟動(dòng)子-操縱基因序列引入。宿主可以是原核的或真核的，對于體外系統(tǒng)，大腸桿菌和CHO細(xì)胞是優(yōu)選的宿主。依據(jù)用于生產(chǎn)本發(fā)明的蛋白質(zhì)和遺傳工程化序列的DNA序列的宿主生物體中發(fā)生的糖基化作用，根據(jù)本發(fā)明表達(dá)的融合蛋白可以是糖基化的或非糖基化的。如果需要，當(dāng)大腸桿菌或芽孢桿菌是宿主生物體時(shí)，獲得的所表達(dá)的非糖基化蛋白質(zhì)可以在體外任選地糖基化，通過化學(xué)、酶或本領(lǐng)域已知的其它類型修飾。
根據(jù)本發(fā)明用于轉(zhuǎn)基因動(dòng)物的方法，適于體細(xì)胞核移植的轉(zhuǎn)基因初級細(xì)胞系(來自公山羊、牛、綿羊、豬或任何其它非人脊椎動(dòng)物)是通過所關(guān)心的融合蛋白核酸構(gòu)建體(例如，靶向人α甲胎蛋白-β干擾素融合蛋白乳腺表達(dá)的乳腺特異性轉(zhuǎn)基因)轉(zhuǎn)染形成的。轉(zhuǎn)基因構(gòu)建體可以含有選擇標(biāo)記(如新霉素、卡那霉素、四環(huán)素、嘌呤霉素、zeocin、潮霉素或任何其它選擇標(biāo)記)或用能夠在細(xì)胞培養(yǎng)物中表達(dá)選擇標(biāo)記的盒共轉(zhuǎn)染。
本發(fā)明提供了含有在此所述核酸序列的表達(dá)載體，該核酸序列可操作地連接于至少一個(gè)調(diào)節(jié)序列。許多這樣的載體是可購得的，且通過本領(lǐng)域技術(shù)人員可以容易地制得其它合適的載體。“可操作地連接”或“操作地連接”指的是以允許通過宿主生物體表達(dá)核酸序列的方式將核酸分子與調(diào)節(jié)序列連接。調(diào)節(jié)序列是本領(lǐng)域已知的并可以選擇來生產(chǎn)編碼的多肽或蛋白質(zhì)。因此，術(shù)語“調(diào)節(jié)序列”包括啟動(dòng)子、增強(qiáng)子和其它表達(dá)控制元件，其描述于Goeddel，GENE EXPRESSIONTECHNOLOGYMETHODS IN ENZYMOLOGY 185，(Academic Press，SanDiego，Calif.(1990))。例如，可以使用天然調(diào)節(jié)序列或?qū)D(zhuǎn)化的宿主細(xì)胞天然的調(diào)節(jié)序列。
應(yīng)當(dāng)理解可以根據(jù)這些因素來設(shè)計(jì)表達(dá)載體，如待轉(zhuǎn)化宿主細(xì)胞的選擇和/或期望得到表達(dá)的蛋白類型。例如，可以通過將克隆的基因或其部分連接到適于在原核細(xì)胞、真核細(xì)胞或兩者中表達(dá)的載體中來生產(chǎn)本發(fā)明的多肽。(A LABORATORY MANUAL，第2版，Sambrook等編輯(Cold Spring Harbor Laboratory Press，1989)第16和17章)。
選擇用于所需核酸構(gòu)建體而重組的集落后，分離并擴(kuò)大細(xì)胞，并根據(jù)本領(lǐng)域已知的方法等份冰凍用于長期保存?？梢允褂脴?biāo)準(zhǔn)的生物分子學(xué)方法(PCR、DNA印跡法、FISH)來表征所選擇的轉(zhuǎn)基因細(xì)胞系。攜帶所關(guān)心的雙功能融合蛋白的合適拷貝數(shù)量的核酸構(gòu)建體且通常具有單個(gè)整合位點(diǎn)(盡管相同技術(shù)可以用于多個(gè)整合位點(diǎn))的細(xì)胞系，然后可以用作本領(lǐng)域已知的體細(xì)胞核移植實(shí)驗(yàn)方案中的細(xì)胞核供體。核移植和胚胎移植至受體動(dòng)物并懷孕后，獲得活的轉(zhuǎn)基因后代。通常該轉(zhuǎn)基因后代在特定染色體上只攜帶一個(gè)轉(zhuǎn)基因整合，另一條同源染色體在相同的位點(diǎn)不攜帶整合。因此轉(zhuǎn)基因后代對于轉(zhuǎn)基因是雜合體，維持了目前至少兩個(gè)連續(xù)繁殖周期來產(chǎn)生純合的轉(zhuǎn)基因動(dòng)物的需要。
具體實(shí)施例方式
實(shí)施例1AFP-β干擾素本發(fā)明的另一方面是需要本發(fā)明雙功能融合蛋白患者的治療方法，通過將治療有效量的生物流體(例如，奶，尿液，唾液，精液或陰道流體，滑液，淋巴液，羊水，蛋卵黃囊、卵殼或尿囊中的流體，血液，汗水和眼淚；或植物產(chǎn)生的水溶液，包括，例如，滲出液或葉尖吐水，木質(zhì)部，韌皮部，樹脂和花蜜)，或其提取物，給藥于患者，該生物流體或其提取物包括從轉(zhuǎn)基因非人生物體(例如，哺乳動(dòng)物(例如，小鼠、山羊、綿羊、駱駝、奶牛、豬、兔子、馬、?；蛎乐揆?、鳥、爬行動(dòng)物、兩棲動(dòng)物或植物)獲得的本發(fā)明的雙功能融合蛋白。理想的實(shí)施方案中，本發(fā)明的雙功能融合蛋白具有SEQ ID NO4、10和24組合所列的序列。另一實(shí)施方案中，生物流體是奶。仍然另一實(shí)施方案中，從轉(zhuǎn)基因非人生物體的生物流體來純化本發(fā)明的雙功能融合蛋白(例如，從哺乳動(dòng)物的奶、尿液、血液或淋巴液純化本發(fā)明的雙功能融合蛋白)。各種理想的實(shí)施方案中，本發(fā)明的方法可以用于抑制或治療免疫性疾病，例如，人免疫缺陷病毒(HIV)的感染、癌細(xì)胞生長，用于誘導(dǎo)骨髓細(xì)胞增殖(例如，骨髓移植后或骨髓毒性治療如化療或放療后)，或用作免疫抑制劑(例如，抑制自體反應(yīng)性免疫細(xì)胞增殖、抑制移植器官的排異(例如，移植物抗宿主疾病)，或抑制或治療自體免疫疾病，例如類風(fēng)濕性關(guān)節(jié)炎、肌肉萎縮、系統(tǒng)性紅斑狼瘡、重癥肌無力、多發(fā)性硬化、胰島素依賴性糖尿病或牛皮癬)。人AFP基因(基因庫登記號#M16110)。
實(shí)施例2所關(guān)心的融合蛋白的序列A.α甲胎蛋白Seq.Id.1列于基因庫登記號No.V01514的完整cDNA序列。
Seq.Id.2基因庫登記號No.V01514(氨基酸1-609)。
Seq.Id.3基因庫登記號No.V01514(核酸99-1874)來自Seq.Id.1的cDNA。
Seq.Id.4基因庫登記號No.V01514(氨基酸19-609)。
Seq.Id.5基因庫登記號No.V01514(前體非糖基化人α甲胎蛋白的核酸序列，核酸45-1874)。
Seq.Id.6基因庫登記號No.V01514(氨基酸19-609)除了包括SEQ ID NO4在氨基酸位置233的突變，從天冬酰胺殘基突變成谷氨酰胺殘基來除去AFP中的單個(gè)糖基化位點(diǎn)。
Seq.Id.7基因庫登記號No.V01514(氨基酸1-18)AFP分泌信號。
Seq.Id.8基因庫登記號No.V01514(AFP分泌信號的核苷酸45-98，DNA序列)。
Seq.Id.9人AFP基因(基因庫登記號#M16110)。
B.所關(guān)心的配偶體蛋白的序列Seq.Id.10基因厙/EMBL/DDBJ登記號No.AAC41702，來自國家生物技術(shù)信息中心(National Center for BiotechnologyInformation)——人β干擾素變體1(1-187氨基酸殘基)。
Seq.Id.11基因庫/EMBL/DDBJ登記號No.CAA00839，來自國家生物技術(shù)信息中心——人α干擾素變體2A(1-212氨基酸殘基)。
Seq.Id.12基因庫/EMBL/DDBJ登記號No.AAP20099，來自國家生物技術(shù)信息中心——人α干擾素變體2B(1-166氨基酸殘基)。
Seq.Id.13蛋白質(zhì)序列記錄基因庫登記號No.NP_795372，來自國家生物技術(shù)信息中心——人τ干擾素(1-189氨基酸殘基)。
Seq.Id.14蛋白質(zhì)序列記錄基因庫登記號No.NP_76918，來自國家生物技術(shù)信息中心——人α干擾素變體1(1-189氨基酸殘基)。
Seq.Id.15蛋白質(zhì)序列記錄基因庫登記號No.NP_000610，來自國家生物技術(shù)信息中心——人γ干擾素(1-166氨基酸殘基)。
Seq.Id.16基因庫/EMBL/DDBJ登記號No.AAH18990，來自國家生物技術(shù)信息中心——輕鏈人鐵蛋白(1-175氨基酸殘基)。
Seq.Id.17基因庫/EMBL/DDBJ登記號No.AAH16857，來自國家生物技術(shù)信息中心——重鏈人鐵蛋白(1-183氨基酸殘基)。
Seq.Id.18基因庫/EMBL/DDBJ登記號No.AAH05322，來自國家生物技術(shù)信息中心——人核心蛋白聚糖(1-359氨基酸殘基)。
Seq.Id.19基因庫登記號No.113936——人抗凝血酶(1-464氨基酸殘基)。
Seq.Id.20基因庫登記號No.113936——通過在精氨酸殘基393和絲氨酸殘基394之間抗凝血酶的酶切割產(chǎn)生的“切割的”人抗凝血酶(1-464氨基酸殘基)。
Seq.Id.21蛋白質(zhì)序列記錄基因庫登記號No.NP_002611，來自國家生物技術(shù)信息中心——人血小板因子4(1-104氨基酸殘基)。
Seq.Id.22蛋白質(zhì)序列記錄基因庫登記號No.NP_000939，來自國家生物技術(shù)信息中心——人促乳素(1-227氨基酸殘基)。
Seq.Id.23基因庫/EMBL DDBJ登記號No.CAA26189，來自國家生物技術(shù)信息中心——人降鈣素(1-93氨基酸殘基)。
Seq.Id.24基因庫/EMBL DDBJ登記號No.AAE57231，來自國家生物技術(shù)信息中心——IRES銜接物序列變體1(1-236氨基酸殘基)。
Seq.Id.25基因庫/EMBL DDBJ登記號No.AAH08915，來自國家生物技術(shù)信息中心——α-1抗胰蛋白酶(1-406氨基酸殘基)。
C.最佳化密碼子蛋白質(zhì)在宿主生物體中的表達(dá)，最特別地在轉(zhuǎn)基因生物體中的表達(dá)，部分取決于DNA構(gòu)建體的起始密碼子與宿主生物體的最適(或共有)起始位點(diǎn)相配的程度、mRNA密碼子使用與宿主生物體的“密碼子偏倚性”相配的程度、隱含的內(nèi)含子剪接位點(diǎn)的存在(可能形成截短的或無義蛋白質(zhì))，以及所關(guān)心的蛋白質(zhì)中穩(wěn)定或去穩(wěn)定信號(即，PEST降解信號)的存在。
源自具有與宿主生物體高度分歧核酸特征的生物體的所關(guān)心蛋白質(zhì)可以從cDNA序列的再次工程化獲益，以致最佳化關(guān)鍵氨基酸的密碼子，使得它們與給定氨基酸的“優(yōu)選”或普通核酸密碼子更精密地相配對。例如，來自高A-T含量生物體(例如盤基網(wǎng)柄菌(Dictyosteliumdiscoideum)或惡性瘧原蟲(Plasmodium falciparum))的所關(guān)心蛋白質(zhì)可以更容易地表達(dá)，通過將密碼子最佳化朝向G-C重密碼子，而使氨基酸序列未改變。
在轉(zhuǎn)基因動(dòng)物生產(chǎn)系統(tǒng)中，使用最佳化的表達(dá)系統(tǒng)用于生產(chǎn)大量所關(guān)心的蛋白質(zhì)可能必需制備足夠可獲得的化合物來使其在治療上是可行的。為此，對于根據(jù)本發(fā)明提供的所有雙功能融合蛋白，可以使用最佳化密碼子再次工程化合成基因。
材料和方法轉(zhuǎn)基因山羊&牛將用作該研究的細(xì)胞和細(xì)胞系供體的無瘙癢病的純種和混雜種的阿爾卑斯(Alpine)、薩嫩(Sassen)和吐根堡(Toggenburg)奶場的山羊畜群根據(jù)良好農(nóng)業(yè)實(shí)踐(Good Agricultural Practice，GAP)指導(dǎo)來飼養(yǎng)。相似地，根據(jù)GAP指導(dǎo)來飼養(yǎng)所用的牛并保證來源于無瘙癢病和牛腦炎的畜群。
公山羊胎體細(xì)胞系的分離用作細(xì)胞核供體的初級公山羊胎成纖維細(xì)胞系源自35-和40-天的胎。外科手術(shù)取出胎并放入平衡的磷酸鹽緩沖鹽水(PBS，無Ca++/Mg++)中。通過將胎組織切碎暴露于0.025％的胰蛋白酶、0.5mM的EDTA 38℃10分鐘來制得單個(gè)細(xì)胞懸浮液。用胎細(xì)胞培養(yǎng)基[平衡的培養(yǎng)基-199(M199，Gibco)含有10％胎牛血清(FBS)，補(bǔ)充核苷，0.1mM 2-巰基乙醇，2mM的L-谷氨酰胺和1％的青霉素/鏈霉素(10,000I.U.每種/ml)]洗滌細(xì)胞，并在25cm2的燒瓶中培養(yǎng)。孵育4天后通過胰蛋白酶消化收集初級胎細(xì)胞的連生單層，然后維持于培養(yǎng)物中或冷藏。
同質(zhì)融合蛋白如在此所用的，術(shù)語基本上純的和同質(zhì)的用來描述已經(jīng)從天然伴隨其的成分中分離出來的蛋白質(zhì)或多肽。通常，當(dāng)至少約60至75％的樣品呈現(xiàn)單一的多肽主鏈時(shí)，單體蛋白質(zhì)是基本上純的。少量變體或化學(xué)修飾通常具有相同的多肽序列?；旧霞兊牡鞍踪|(zhì)通常包括超過約85至90％的蛋白質(zhì)樣品，更通常包括至少約95％，優(yōu)選將超過約99％純。通常，在聚丙烯酰胺凝膠上測量純度，使用通過染色測定的同質(zhì)性。對于某些目的，使用高的分辨率并且利用HPLC或相似的方法來進(jìn)行純化。對于大多數(shù)目的，將使用簡單的色譜柱或聚丙烯酰胺凝膠來測定純度。
當(dāng)使蛋白質(zhì)與其天然狀態(tài)下伴隨其的天然污染物分離時(shí)，蛋白質(zhì)是基本上無天然伴隨成分的。因此，化學(xué)合成的或在與其天然來源的細(xì)胞不同的細(xì)胞系統(tǒng)中合成的蛋白質(zhì)基本上無天然伴隨成分。該術(shù)語用于描述在異種哺乳動(dòng)物細(xì)胞或植物細(xì)胞、大腸桿菌和其它原核生物中合成的多肽和核酸。本發(fā)明提供了用于治療用途的基本上純的制劑?？梢栽O(shè)計(jì)各種從生物材料中分離它們的方法，部分基于在此包含的結(jié)構(gòu)和功能描述。
“AFP-配偶體多肽”融合蛋白的構(gòu)建根據(jù)本發(fā)明，術(shù)語“融合蛋白”用來描述包括兩種所關(guān)心多肽的融合蛋白，通過銜接物序列氨基酸序列來融合。根據(jù)本發(fā)明，雙功能融合蛋白的產(chǎn)生在提供特定病癥改進(jìn)的治療選項(xiàng)中是有用的工具。因此，所需融合技術(shù)的發(fā)展已經(jīng)變得日益重要。結(jié)構(gòu)生物學(xué)中，重組融合蛋白的構(gòu)建通常用作提高可溶性蛋白的表達(dá)和幫助蛋白質(zhì)純化的方法。已經(jīng)將該技術(shù)用于研究體外測定中的蛋白質(zhì)功能活性和用于體內(nèi)生產(chǎn)。近些年來，在生物技術(shù)領(lǐng)域中報(bào)道了基因融合技術(shù)的廣泛應(yīng)用。這些應(yīng)用包括抗體的選擇和生產(chǎn)以及雙功能酶的工程化。
融合蛋白的構(gòu)建包括通過銜接物序列連接兩個(gè)大分子。根據(jù)本發(fā)明，所關(guān)心的大分子包括蛋白質(zhì)或蛋白質(zhì)的球狀結(jié)構(gòu)域。在功能融合蛋白的構(gòu)建中，銜接物序列的選擇特別重要。除了合適氨基酸組成的必要性，必需考慮銜接物序列的總體折疊。實(shí)際上，通常不利的是含有具有形成螺旋或鏈結(jié)構(gòu)高傾向的銜接物序列，因?yàn)檫@些將限制融合蛋白的柔性并因而影響其功能活性。因此，為了避免這樣的二級結(jié)構(gòu)元件，通常需要仔細(xì)考慮銜接物序列的設(shè)計(jì)。以下提供了一套已知采用了通過X-射線結(jié)晶學(xué)和NMR測定的延伸構(gòu)象的樣品銜接物序列樣本銜接物序列SEQ.NO. 殘基1 ALAGLUASPGLYGLUARGVALLEUPROGLYSERGLY0.25 -0.62 -0.72 -0.18 -0.62 -1.80 0.54 0.53 -0.07 -0.18 -0.26 -0.182 ALAPROGLULYSGLYLYSASNTHRLEUGLYSERGLY0.25 -0.07 -0.62 -1.10 -0.18 -1.10 -0.64 0.16 0.53 -0.18 -0.26 -0.183 ALAPROSERSERLYSSERTHRSERGLYGLYSERGLY0.25 -0.07 -0.26 -0.26 -1.10 -0.26 0.16 -0.26 -0.18 -0.18 -0.26 -0.184 ALALYSPROGLYLEUVALASPASNGLNGLYSERGLY0.25 -1.10 -0.07 -0.18 0.53 0.54 -0.72 -0.64 -0.69 -0.18 -0.26 -0.185 ALAPHEGLYASNALAASNSERALAARGGLYSERGLY0.25 0.61 -0.18 -0.64 0.25 -0.64 -0.26 0.25 -1.80 -0.18 -0.26 -0.186 ALAPR0SERASPLYSGLUGLYTYRSERGLYSERGLY0.25 -0.07 -0.26 -0.72 -1.10 -0.62 -0.18 0.02 -0.26 -0.18 -0.26 -0.187 ALALYSPR0ASNPR0THRGLYTHRVALGLYSERGLY0.25 -1.10 -0.07 -0.64 -0.07 0.16 -0.18 0.16 0.54 -0.18 -0.26 -0.188 ALAILEHISGLUTYRPHEARGGLYGLYGLYSERGLY0.25 0.73 -0.46 -0.62 0.02 0.61 -1.80 -0.18 -0.18 -0.18 -0.26 -0.189 ALALEUHISGLYARGGLYGLYGLUASPGLYSERGLY0.25 0.53 -0.46 -0.18 -1.80 -0.18 -0.18 -0.62 -0.72 -0.18 -0.26 -0.1810 ALASERSERPROASPVALALALYSGLYGLYSERGLY0.25 -0.26 -0.26 -0.07 -0.72 0.54 0.25 -1.10 -0.18 -0.18 -0.26 -0.18
這些是氨基酸序列和殘基的疏水性。
用于本發(fā)明的銜接物序列包括至少一個(gè)氨基酸殘基或多個(gè)，上述提供的那些是12個(gè)氨基酸殘基長。所關(guān)心的第一個(gè)和第二個(gè)多肽(例如，各自為AFP和β干擾素片段)的取向，可以根據(jù)待融合至銜接物的AFP的N端序列和第二個(gè)所關(guān)心多肽的C端的方便性來改變，反之亦然。融合兩個(gè)生物活性分子來提供提高的治療功能以及來提高分子的半衰期。載體蛋白質(zhì)的選擇通常通過所構(gòu)建融合蛋白的應(yīng)用來控制。本發(fā)明中，AFP作為載體蛋白多肽，同時(shí)保留其自身的治療效用并呈現(xiàn)出活性的協(xié)同提高。
根據(jù)常規(guī)技術(shù)進(jìn)行編碼轉(zhuǎn)基因的各種基因組或cDNA片段的連接，使用平端或交錯(cuò)端用于連接、限制酶消化來提供合適的末端、適當(dāng)填充粘性末端、堿和磷酸酶處理來避免不理想的連接，以及使用合適的連接酶來連接?；驑?gòu)建體可以任選地編碼前導(dǎo)序列來使得融合蛋白有效表達(dá)。
將人AFP的DNA構(gòu)建體與銜接物序列和第二個(gè)所關(guān)心的多核苷酸序列融合?？偟暮塑账嵝蛄锌梢跃哂衅渥罴衙艽a子來提高表達(dá)和/或與所選的表達(dá)平臺(例如轉(zhuǎn)基因哺乳動(dòng)物、原核細(xì)胞培養(yǎng)物、哺乳動(dòng)物細(xì)胞培養(yǎng)物等)更相容。由于所關(guān)心融合蛋白的糖基化作用是真核系統(tǒng)的特征，因此優(yōu)選在真核細(xì)胞或轉(zhuǎn)基因哺乳動(dòng)物中生產(chǎn)用于治療應(yīng)用的雙功能重組蛋白序列。這些生產(chǎn)平臺中，可以將所選的用于所關(guān)心融合蛋白擴(kuò)增并為了所關(guān)心雙功能蛋白的cDNA構(gòu)建體形成轉(zhuǎn)基因的質(zhì)粒亞克隆進(jìn)所選擇的基因擴(kuò)增系統(tǒng)中。此后，將DNA構(gòu)建體切除并轉(zhuǎn)染進(jìn)靶核的基因組中。
為了確保生物功能蛋白的生產(chǎn)，因?yàn)檫@些因素如確保成功分泌蛋白的天然前導(dǎo)序列的存在，合適折疊因子的存在和翻譯后修飾的能力，根據(jù)本發(fā)明優(yōu)選在哺乳動(dòng)物細(xì)胞中表達(dá)所需的融合蛋白。此外，雙功能融合蛋白在哺乳動(dòng)物細(xì)胞中的表達(dá)對用于生物藥物的生產(chǎn)中是必要的。
本發(fā)明涉及具有特定所需序列多肽的生產(chǎn)方法，和涉及實(shí)施該方法必需的蛋白質(zhì)和核酸中間產(chǎn)物。待生產(chǎn)的雙功能融合蛋白序列可以與所需的最終產(chǎn)物(所關(guān)心的肽)相同或可以含有所關(guān)心肽的一個(gè)或多個(gè)串連的拷貝和/或可以含有與選擇性可斷裂鍵相關(guān)的序列。更優(yōu)選，本發(fā)明的方法包括步驟a)提供cDNA或基因組DNA構(gòu)建體，其編碼含有第一個(gè)所關(guān)心多肽、肽銜接物序列和第二個(gè)所關(guān)心多肽的融合蛋白，該基因可操作地連接于第一個(gè)基因座控制區(qū)和第一個(gè)啟動(dòng)子。
b)制得具有整合至其染色體中的可操作連接的融合基因的轉(zhuǎn)基因動(dòng)物，借此融合蛋白得到表達(dá)并在哺乳期或激素誘導(dǎo)的哺乳中摻入轉(zhuǎn)基因動(dòng)物的奶中；和c)從轉(zhuǎn)基因動(dòng)物的奶中分離融合蛋白。
轉(zhuǎn)基因的細(xì)胞培養(yǎng)物生產(chǎn)中，連同宿主使用合有源自與宿主細(xì)胞相容物種的復(fù)制子和控制序列的載體。載體通常攜帶復(fù)制子位點(diǎn)，以及能夠提供轉(zhuǎn)化細(xì)胞中表型選擇的特定基因。融合蛋白的表達(dá)還可以放置于可能與未轉(zhuǎn)化狀態(tài)生物體同源的其它調(diào)節(jié)序列的控制下。例如，轉(zhuǎn)基因山羊中，可以使用山羊β酪蛋白啟動(dòng)子，其在哺乳期開始時(shí)將激活所關(guān)心轉(zhuǎn)基因的表達(dá)。還可以使用其它啟動(dòng)子/操縱基因系統(tǒng)或其部分。例如，可以使用乳清酸性啟動(dòng)子、β-乳球蛋白、堿性磷酸酶等等。
對于哺乳動(dòng)物宿主，幾個(gè)可能的載體系統(tǒng)可用于初始表達(dá)。一類載體利用源自動(dòng)物病毒的DNA元件，如牛乳頭狀瘤病毒、多形瘤病毒、腺病毒、牛痘病毒、桿狀病毒、逆轉(zhuǎn)錄病毒(RSV、MMTV或MOMLV)，或SV40病毒?？梢酝ㄟ^引入一個(gè)或多個(gè)可以選擇轉(zhuǎn)染宿主細(xì)胞的標(biāo)記來選擇已將DNA穩(wěn)定整合到其染色體中的細(xì)胞。標(biāo)記可以給營養(yǎng)缺陷的宿主提供質(zhì)子轉(zhuǎn)移、抗生素抗性或?qū)χ亟饘偃玢~的抗性等等?？梢詫⑦x擇標(biāo)記基因直接連接于待表達(dá)的DNA序列，或通過共轉(zhuǎn)化引入相同的細(xì)胞中。對于mRNA的最佳合成，還可能需要另外的元件。這些元件可以包括剪接信號以及轉(zhuǎn)錄啟動(dòng)子、增強(qiáng)子和終止信號。
用于胚胎重建的供體細(xì)胞的制備將轉(zhuǎn)染的胎體細(xì)胞接種于含有胎細(xì)胞培養(yǎng)基的4-孔平板中并維持培養(yǎng)(5％CO2，39℃)。48小時(shí)后，用新鮮的低血清(0.5％FBS)胎細(xì)胞培養(yǎng)基替換培養(yǎng)基。在接下來的2-7天中每48至72小時(shí)用低血清胎細(xì)胞培養(yǎng)基替換培養(yǎng)基，低血清培養(yǎng)基后，通過胰蛋白酶消化收集體細(xì)胞(用作細(xì)胞核供體)。在與去核的卵母細(xì)胞融合之前，將細(xì)胞重懸浮于平衡的M199中至少6小時(shí)，M199含有10％FBS，補(bǔ)充2mM L-谷氨酰胺，1％青霉素/鏈霉素(10,000I.U.每種/ml)。用于產(chǎn)生所需轉(zhuǎn)基因動(dòng)物的本實(shí)驗(yàn)優(yōu)選用山羊細(xì)胞或小鼠細(xì)胞進(jìn)行來傳代或各自用山羊或小鼠來進(jìn)行，但是根據(jù)本發(fā)明，可以使用任何所需的哺乳動(dòng)物細(xì)胞系來進(jìn)行。
卵母細(xì)胞收集使卵母細(xì)胞供體同步和超數(shù)排卵，如之前所述(Ongeri等，2001)，并以48小時(shí)的間隔與切除輸精管的雄性交配。收集后，將卵母細(xì)胞在含有10％FBS，補(bǔ)充2mM L-谷氨酰胺和1％青霉素/鏈霉素(10,000I.U.每種/ml)的M199中培養(yǎng)。
胞質(zhì)體制備和去核在去核之前，用細(xì)胞松弛素-B(Sigma，SOF中5μg/ml，含有10％FBS)處理所有的卵母細(xì)胞15至30分鐘。用25至30μm的玻璃移液管將中期-II階段的卵母細(xì)胞去核，通過吸出第一個(gè)極體和圍繞極體附近的細(xì)胞質(zhì)(～30％細(xì)胞質(zhì))來除去中期板。去核后，將所有卵母細(xì)胞立即重建。
核移植和重建在用于卵母細(xì)胞去核的相同培養(yǎng)基中進(jìn)行供體細(xì)胞注射。使用玻璃吸管將一個(gè)供體細(xì)胞放置于透明帶和卵質(zhì)體膜之間。在電融合和激活程序之前，將細(xì)胞-卵母細(xì)胞偶聯(lián)體在SOF中孵育30至60分鐘。將重建的卵母細(xì)胞在融合緩沖液(300mM甘露醇，0.05mM CaCl2，0.1mMMgSO4，1mM K2HPO4，0.1mM谷胱甘肽，0.1mg/ml BSA)中平衡2分鐘。在室溫下，在具有2個(gè)形成“融合載玻片”的不銹鋼電極(500μm間隙；BTX-Genetronics，San Diego，CA)并充滿融合培養(yǎng)基的融合室中進(jìn)行電融合和激活。
使用融合載玻片進(jìn)行融合。將融合載玻片放入融合盤中，然后用足夠量的融合緩沖液將盤淹沒來覆蓋融合載玻片的電極。從培養(yǎng)箱中取出偶聯(lián)體并用融合緩沖液洗滌。使用立體顯微鏡，將偶聯(lián)體等距放置于電極間，使細(xì)胞核/胞質(zhì)體連接與電極平行。應(yīng)該注意用于偶聯(lián)體來促進(jìn)激活和融合的電壓范圍為1.0kV/cm至10.0kV/cm。然而優(yōu)選，最初的單個(gè)同時(shí)融合和激活電脈沖具有2.0至3.0kV/cm的電壓，最優(yōu)選2.5kV/cm，優(yōu)選至少20μsec的持續(xù)時(shí)間。使用BTX ECM 2001Electrocell Manipulator將這種電脈沖應(yīng)用于細(xì)胞偶聯(lián)體。微脈沖的持續(xù)時(shí)間為10至80μsec。處理后，通常將處理過的偶聯(lián)體轉(zhuǎn)移至新鮮融合緩沖液的液滴中。用平衡的SOF/FBS洗滌融合處理過的偶聯(lián)體，然后轉(zhuǎn)移至含有或不含細(xì)胞松弛素-B的平衡SOF/FBS中。如果使用細(xì)胞松弛素-B，其濃度為1至15μg/ml，最優(yōu)選為5μg/ml。將偶聯(lián)體在潮濕氣體室中37-39℃孵育，空氣中含有約5％CO2。應(yīng)該注意本公開中所提供的任一實(shí)驗(yàn)方案的整個(gè)過程中可以使用甘露醇替代細(xì)胞松弛素-B(基于HEPES-緩沖的甘露醇(0.3mm)的培養(yǎng)基，含有Ca+2和BSA)。
核移植胚胎培養(yǎng)并移植至受體自從在綿羊中利用體細(xì)胞的成功報(bào)道開始(Wilmut等，1997)，核移植已經(jīng)發(fā)生了重要的進(jìn)展。許多其它物種也已經(jīng)從體細(xì)胞得到克隆(Baguisi等，1999和Cibelli等，1998)，取得不同程度的成功。還報(bào)道了多種其它胎和成熟體細(xì)胞組織類型(Zou等，2001和Wells等，1999)，以及胚胎(Meng等，1997)。還已經(jīng)在不同的實(shí)驗(yàn)室方法中證明了細(xì)胞核處于重建時(shí)的細(xì)胞周期的階段是關(guān)鍵的(Kasinathan等，BIOL.REPROD.2001；Yong等，1998；和Kasinathan等，NATURE BIOTECH.2001)。
本發(fā)明的所有核移植胚胎在50μl含有10％FBS的SOF的液滴中培養(yǎng)，其上覆蓋著礦物油。在將胚胎移植給受體之前，將胚胎培養(yǎng)物在濕潤的含有5％CO2的39℃培養(yǎng)箱中保持48小時(shí)。如之前所述(Baguisi等，1999)，進(jìn)行受體胚胎移植。
對任何核移植程序成功首要的是細(xì)胞核與去核的胞質(zhì)體具有合適的融合。然而，同等重要的是重建的胚胎(細(xì)胞核和胞質(zhì)體)起正常胚胎的作用并分裂和發(fā)育成活胎且最終成為活的后代。以上詳述的該實(shí)驗(yàn)室的結(jié)果表明分開的或結(jié)合的融合和分裂兩者都具有以統(tǒng)計(jì)學(xué)上顯著性的方式預(yù)測哪些細(xì)胞系適于核移植程序的能力。盡管每個(gè)單獨(dú)的參數(shù)可以幫助預(yù)先選擇所利用的細(xì)胞系，但是參數(shù)的結(jié)合鞏固了細(xì)胞系選擇的結(jié)果。
懷孕和產(chǎn)期護(hù)理對于山羊，處于動(dòng)情期頭天后第25天開始通過超聲波掃描確定懷孕。每周進(jìn)行評價(jià)直至懷孕第75天，此后每月一次來評價(jià)胎兒的生存力。對于懷孕持續(xù)超過152天的，用5mg的PGF2μ(Lutalyse，Upjohn)誘導(dǎo)分娩。在處理后24小時(shí)內(nèi)分娩。出生后立即從母畜中取出小山羊，并在分娩后1小時(shí)內(nèi)接受熱處理的初乳。對于懷孕和產(chǎn)期護(hù)理，適于其它有蹄類(例如，牛)的時(shí)間范圍是本領(lǐng)域已知的。
克隆動(dòng)物的基因分型出生后不久，從克隆的動(dòng)物(例如，山羊或牛)和代孕母畜獲得血樣和耳朵皮膚活體切片用于基因組DNA分離。根據(jù)本發(fā)明，首先通過PCR分析每個(gè)樣品，使用用于特定轉(zhuǎn)基因靶蛋白的引物，然后接受DNA印跡分析，使用用于特定靶蛋白的cDNA。對于每個(gè)樣品，按照本領(lǐng)域已知的標(biāo)準(zhǔn)程序，用EcoRI(New England Biolabs，Beverly，MA)消化5μg的基因組DNA，在0.7％的瓊脂糖凝膠(SeaKem，ME)上電泳并通過毛細(xì)管轉(zhuǎn)移固定于尼龍膜(MagnaGraph，MSI，Westboro，MA)上。使用Prime-It試劑盒(Stratagene，La Jolla，CA)，用被32PudCTP標(biāo)記的1.5kb Xho I-Sal I hAT cDNA片段探查膜。在65℃進(jìn)行雜交過夜。用0.2XSSC，0.1％SDS洗滌印跡并曝光于X-OMATTMAR膠片48小時(shí)。
本發(fā)明還包括克隆遺傳上工程化或轉(zhuǎn)基因哺乳動(dòng)物的方法，通過該方法在分化的哺乳動(dòng)物細(xì)胞或細(xì)胞核中將所需的基因插入、除去或修飾，然后將分化的哺乳動(dòng)物細(xì)胞或細(xì)胞核插入去核的卵母細(xì)胞。
本發(fā)明還提供了根據(jù)上述方法獲得的哺乳動(dòng)物，以及那些哺乳動(dòng)物的后代。本發(fā)明優(yōu)選用于克隆公山羊或牛，但可以用于任何哺乳動(dòng)物物種。本發(fā)明進(jìn)一步提供了核移植胎兒以及核移植和嵌合后代在細(xì)胞、組織和器官移植領(lǐng)域中的用途。
卵母細(xì)胞的合適哺乳動(dòng)物來源包括山羊、綿羊、牛、豬、兔子、豚鼠、小鼠、倉鼠、大鼠、靈長類等。優(yōu)選，從有蹄類獲得卵母細(xì)胞，最優(yōu)選是山羊或牛。分離卵母細(xì)胞的方法是本領(lǐng)域公知的。實(shí)質(zhì)上，這包括從哺乳動(dòng)物例如山羊的卵巢或生殖道分離卵母細(xì)胞。有蹄類卵母細(xì)胞容易獲得的來源是來自激素誘導(dǎo)的雌性動(dòng)物。
為了成功使用技術(shù)如遺傳工程、核移植和克隆，在這些細(xì)胞用作核移植受體細(xì)胞之前，以及它們通過精細(xì)胞受精發(fā)育成胚胎之前，可以優(yōu)選使卵母細(xì)胞在體內(nèi)成熟。中期II階段的卵母細(xì)胞，其已經(jīng)在體內(nèi)成熟，已經(jīng)成功用于核移植技術(shù)中。實(shí)質(zhì)上，在動(dòng)情期發(fā)作后或注射人絨膜促性腺激素(hCG)或類似激素后幾小時(shí)，外科手術(shù)從非超排卵或超排卵動(dòng)物收集成熟的中期II卵母細(xì)胞。
此外，應(yīng)該注意通過轉(zhuǎn)基因技術(shù)來修飾動(dòng)物基因組的能力提供了生產(chǎn)重組蛋白的新的可替換方案。轉(zhuǎn)基因農(nóng)場動(dòng)物奶中生產(chǎn)人重組藥物解決了許多與微生物的生物反應(yīng)器相關(guān)的問題(例如，翻譯后修飾的缺乏、不合適的蛋白折疊、高純化成本)或與動(dòng)物細(xì)胞生物反應(yīng)器相關(guān)的問題(例如，高成本、昂貴的培養(yǎng)基、低產(chǎn)量)。本發(fā)明能夠在與所需基因純合的轉(zhuǎn)基因動(dòng)物奶中或其它體液(即，尿液或血液)中使用轉(zhuǎn)基因生產(chǎn)生物藥物、融合蛋白、血漿蛋白和其它所關(guān)心的分子。通過本發(fā)明的方法能夠生產(chǎn)的融合蛋白包括含有α-甲胎蛋白多肽和融合蛋白配偶體的那些，融合蛋白配偶體包括抗凝血酶III、截短的ATIII、乳鐵蛋白、尿激酶、血小板因子4(“PF4”)、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制劑、核心蛋白聚糖、α干擾素、β干擾素、鐵蛋白、促乳素、CFTR、血液因子X、血液因子VIII以及促紅細(xì)胞生成素。
根據(jù)本發(fā)明的實(shí)施方案，當(dāng)使用多輪或連續(xù)輪的轉(zhuǎn)基因選擇來產(chǎn)生多于一個(gè)特征純合的細(xì)胞或細(xì)胞系時(shí)，可以用組合物處理這樣的細(xì)胞或細(xì)胞系來延長給定細(xì)胞系在體外培養(yǎng)物中可以經(jīng)受的傳代數(shù)。端粒酶就屬于可以如此利用的這樣的化合物。
使用活的生物體用作生產(chǎn)方法意味著所有產(chǎn)生的材料在化學(xué)上與天然產(chǎn)物相同。就基本的氨基酸結(jié)構(gòu)而言，這意味著只有L-光學(xué)異構(gòu)體，具有天然構(gòu)型，將存在于產(chǎn)物中。由于與化學(xué)合成途徑相比較，生物合成的高保真度，還將忽略錯(cuò)誤序列的數(shù)量，化學(xué)途徑中偶聯(lián)反應(yīng)的相對無效總是產(chǎn)生失敗的序列。對于進(jìn)一步的修飾反應(yīng)如羧基端酰胺化，副反應(yīng)的不存在也是重要考慮因素。此外，體內(nèi)起作用的酶給予了高程度的保真度和立體特異性，其通過化學(xué)方法不能配對。最后在生物流體中生產(chǎn)所關(guān)心的融合蛋白意味著殘留在終產(chǎn)物中的低水平污染物可能比來源于化學(xué)反應(yīng)器的那些毒性更低。
本發(fā)明實(shí)施中最重要的考慮因素之一是選擇形成融合蛋白的融合配偶體。該融合配偶體，可以是且優(yōu)選通常是，天然蛋白或其生理活性片段，但是不必須是。其自身可在奶中高產(chǎn)量產(chǎn)生的蛋白質(zhì)，如α-1-抗胰蛋白酶，可能是本發(fā)明中有用的融合配偶體。理想蛋白的名單包括抗凝血酶III、截短的ATIII、乳鐵蛋白、尿激酶、血小板因子4(“PF4”)、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制劑、核心蛋白聚糖、α干擾素、β干擾素、鐵蛋白、促乳素、CFTR、血液因子X、血液因子VIII以及促紅細(xì)胞生成素。盡管，為了優(yōu)選，融合配偶體可以另外是奶中天然產(chǎn)生的蛋白質(zhì)，因?yàn)檫@對于以下的設(shè)想是合理的正常分泌至奶中且可以高水平產(chǎn)生的蛋白質(zhì)，在另一功能多肽與其羧基端融合后，將持續(xù)這樣的分泌和產(chǎn)生。用于在奶中生產(chǎn)所關(guān)心的融合蛋白的特別優(yōu)選的融合配偶體是人α-甲胎蛋白。
根據(jù)本發(fā)明可能存在融合配偶體蛋白的序列從天然序列的一些變異。盡管人α-甲胎蛋白或其它融合配偶體的天然、野生型序列(和在等位基因變體的情況下共有序列)通常是優(yōu)選的，但是可以接納或者，至少在某些情況下期望從天然序列的一些變異，條件是融合配偶體的特性不被損害到不可接受的程度。至少90或95％的氨基酸同源性通常是適當(dāng)?shù)?，并且一般不多于一個(gè)或兩個(gè)氨基酸改變將是優(yōu)選的。
如之前所述的，每升牛奶三克的表達(dá)水平在現(xiàn)有轉(zhuǎn)基因動(dòng)物技術(shù)范圍內(nèi)是令人滿意的。這樣的水平對于人α-甲胎蛋白融合蛋白也應(yīng)該是可以達(dá)到的，人α-甲胎蛋白融合蛋白是非毒性的內(nèi)源蛋白質(zhì)。此外，沒有理由認(rèn)為這樣的水平在其它物種奶中不應(yīng)該是可行的。所需的銜接物序列可以含有多于使兩個(gè)功能部分分離所需要的絕對最小序列1)例如，IRES銜接物序列變體1，SEQ ID 24。
2)至第一個(gè)融合配偶體的任何C-末端延伸，如上述的人α-甲胎蛋白延伸，也可以認(rèn)為是銜接物的一部分。
本發(fā)明的實(shí)施中，在轉(zhuǎn)基因動(dòng)物的奶中生產(chǎn)雙功能融合蛋白?？梢酝ㄟ^源自所選動(dòng)物(如?；蛐∈?的基因組材料或反向翻譯的信使RNA的篩選文庫來獲得編碼人α-甲胎蛋白的序列。然后將這些序列與所需的融合偶聯(lián)體蛋白多肽序列一起克隆進(jìn)合適的質(zhì)粒載體中并在合適的宿主生物體，通常是大腸桿菌中擴(kuò)增。然后可以構(gòu)建編碼所選肽的DNA序列，例如，通過聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增重疊退火的寡核苷酸混合物。
載體擴(kuò)增后，切除帶有合適5’和3’控制序列的DNA構(gòu)建體，從載體的剩余物中純化出來并用于生產(chǎn)已將所需雙功能融合蛋白整合到其基因組中的轉(zhuǎn)基因動(dòng)物。相反，對于一些載體，如酵母人造染色體(YAC)，不需要從載體除去裝配的構(gòu)建體；在這種情況中，擴(kuò)增的載體可以直接用于制造轉(zhuǎn)基因動(dòng)物。這種情況中，雙功能涉及通過足夠保留其生物活性的蛋白序列核酸序列編碼的第一個(gè)多肽的存在，然后將這第一個(gè)多肽連接于也含有足夠保留其生理活性的蛋白質(zhì)多肽序列的第二個(gè)多肽的編碼序列。將編碼序列可操作地連接于控制序列，該控制序列能夠使編碼序列在轉(zhuǎn)基因非人胎盤哺乳動(dòng)物的奶中得到表達(dá)。
適于指導(dǎo)轉(zhuǎn)基因動(dòng)物奶中產(chǎn)生的DNA序列攜帶源自天然衍生奶蛋白的5’啟動(dòng)子區(qū)并因而在激素和組織特異性因子的控制下。因此，這樣的啟動(dòng)子在哺乳期的哺乳動(dòng)物組織中應(yīng)該是最活躍的。根據(jù)本發(fā)明，這樣所用的啟動(dòng)子后面可以接著指導(dǎo)蛋白前導(dǎo)序列產(chǎn)生的DNA序列，該蛋白前導(dǎo)序列指導(dǎo)融合蛋白穿過哺乳動(dòng)物上皮進(jìn)入奶中的分泌。在融合蛋白構(gòu)建體另一端，合適3’-序列，優(yōu)選也源自天然分泌的奶蛋白，并可以加入來提高mRNA的穩(wěn)定性。用于在轉(zhuǎn)基因動(dòng)物奶中生產(chǎn)蛋白質(zhì)的合適控制序列的實(shí)例是來自公山羊β酪蛋白啟動(dòng)子的那些。
現(xiàn)在可以使用各種方法來進(jìn)行轉(zhuǎn)基因動(dòng)物的生產(chǎn)。本發(fā)明優(yōu)選的方法是核移植。
融合蛋白序列將通過以下的實(shí)施例來說明本發(fā)明優(yōu)選的融合蛋白。本發(fā)明優(yōu)選的實(shí)施方案是由人α-甲胎蛋白多肽在其羧基端通過單個(gè)蛋氨酸殘基連接于β干擾素多肽(IFN-β)制得的融合蛋白。本發(fā)明該融合蛋白的可替換實(shí)施方案中，IFN-β多肽在其羧基端將攜帶額外的甘氨酸來作為α-酰胺化酶的底物。以下提供本發(fā)明該優(yōu)選實(shí)施方案的序列本發(fā)明優(yōu)選的實(shí)施方案中，編碼該構(gòu)建體的DNA序列將攜帶5’-β-酪蛋白啟動(dòng)子區(qū)、帶有全部編碼外顯子的完整人α-甲胎蛋白編碼序列、銜接物和然后人IFN-β編碼序列。融合蛋白具有與上述提供的相同的融合配偶體，但是使用不同的銜接物序列。這需要融合蛋白在人α-甲胎蛋白的羧基端和IFN-β之間攜帶氨基酸銜接物序列。
這必須通過在DNA編碼區(qū)域進(jìn)行合適的改變來產(chǎn)生。如上所述可以制得融合蛋白，但是在來自β-乳球蛋白或來自參與控制奶蛋白表達(dá)的任何其它合適的啟動(dòng)子的人或牛5’-和3’-控制序列的控制下。
呈現(xiàn)并鑒定了大量對應(yīng)于各種所關(guān)心的各種融合蛋白的DNA序列。本發(fā)明的融合蛋白提供了生理活性α-甲胎蛋白多肽作為連接于各種第二個(gè)多肽融合配偶體的第一個(gè)結(jié)構(gòu)域的用途。本發(fā)明考慮并包括所有干擾素的天然、自然、修飾和重組DNA干擾素樣蛋白質(zhì)，作為α-甲胎蛋白結(jié)構(gòu)域的潛在融合配偶體。所有這些干擾素和其它已知的蛋白質(zhì)在本領(lǐng)域中是已知的或在本發(fā)明的考慮范圍內(nèi)。本發(fā)明主要涉及與α-甲胎蛋白結(jié)構(gòu)域融合的α和β干擾素的各種修飾的融合蛋白或多肽。已經(jīng)報(bào)道通過在動(dòng)物細(xì)胞或酵母中表達(dá)蛋白質(zhì)來獲得糖基化的干擾素。
最適于修飾的分子位置的選擇取決于特定的蛋白質(zhì)。因此，根據(jù)本發(fā)明，保留其天然生理活性的理想序列的識別可以在任何位點(diǎn)引入天然生成的蛋白序列中，條件是這樣引入的序列對生物活性沒有不利影響，其中這樣的活性是所需的。根據(jù)本發(fā)明只需要引入含有或是所需生物活性位點(diǎn)的大量氨基酸共有序列。
以下描述了說明性的而非限制性的特定實(shí)施方案。
優(yōu)選的人雙功能AFP融合蛋白AFP-β干擾素AFP-α干擾素AFP-τ干擾素AFP-抗凝血酶IIIAFP-核心蛋白聚糖AFP-促乳素AFP-γ干擾素AFP-PF4AFP-降鈣素AFP-α-1-抗胰蛋白酶抗凝血酶III-α-甲胎蛋白融合蛋白的構(gòu)建抗凝血酶或抗凝血酶III(ATIII)是凝血過程中涉及的單鏈糖蛋白。主要在肝臟合成，具有其通過內(nèi)質(zhì)網(wǎng)的胞內(nèi)運(yùn)輸所需要的32個(gè)氨基酸的信號肽；然后在分泌之前將肽裂解。Mourey等，BIOCHIMIE72599-608(1990)。
ATIII是蛋白質(zhì)的絲氨酸蛋白酶抑制劑家族的成員并作為凝固級聯(lián)中涉及的凝血酶和其它酶的抑制劑。如在此所用的，將活性天然完整形式的ATIII命名為S(受應(yīng)力的)形式(S-ATIII)。S-ATIII與凝血酶(通過肝素的存在顯著提高)和其它酶(不是所有的絲氨酸蛋白酶抑制劑都具有肝素親和性)形成緊密結(jié)合復(fù)合物。
通過各種酶，包括凝血酶，可以將S-ATIII裂解成松弛的(R)-構(gòu)象(R-ATIII)。ATIII可以源自其本質(zhì)上產(chǎn)生蛋白質(zhì)的任何生物體。特定實(shí)施方案中，生物體是牛或人。在基因庫登記號No.1168462下可獲得牛ATIII的氨基酸序列，在基因庫登記號No.113936下可獲得人ATIII的氨基酸序列。
ATIII或其生物等價(jià)物的特定部分和構(gòu)象，其是本發(fā)明的主題，還可以通過體內(nèi)使用酶(例如彈性蛋白酶)來生產(chǎn)。例如，可以體內(nèi)使用酶來產(chǎn)生抑制內(nèi)皮細(xì)胞增生、血管生成和/或腫瘤生長的ATIII片段、構(gòu)象、生物等價(jià)物或衍生物，用或不用血漿或天然ATIII來作為另外的底物。已經(jīng)測定ATIII的特定構(gòu)象降低血管生成、內(nèi)皮細(xì)胞增生和腫瘤生長。(如在此所用的，內(nèi)皮細(xì)胞增生還包括內(nèi)皮細(xì)胞遷移和管形成)。如在此所述的，可以通過本領(lǐng)域已知的各種方法來制得或分離ATIII和/或片段、構(gòu)象、生物等價(jià)物或衍生物，包括但不限于，純化、轉(zhuǎn)基因和重組方法。
然而，優(yōu)選在編碼IFN-β的核苷酸序列中的位點(diǎn)進(jìn)行核苷酸序列的插入，使得最小化對所得到重組蛋白生物活性的不利影響，當(dāng)這樣的生物活性是關(guān)鍵的時(shí)候。
奶特異性啟動(dòng)子本發(fā)明實(shí)施中有用的轉(zhuǎn)錄啟動(dòng)子是優(yōu)選在哺乳動(dòng)物上皮細(xì)胞中激活的那些啟動(dòng)子，包括控制編碼奶蛋白基因的啟動(dòng)子，這些奶蛋白如酪蛋白、β-乳球蛋白(Clark等，(1989)BIO/TECHNOLOGY 7487-492)、乳清酸性蛋白(Gorton等(1987)BIO/TECHNOLOGY 51183-1187)和乳清蛋白(Soulier等，(1992)，F(xiàn)EBS LETTS.29713)。酪蛋白啟動(dòng)子可以源自任何哺乳動(dòng)物物種的α、β、γ或κ酪蛋白基因；優(yōu)選的啟動(dòng)子是源自山羊β酪蛋白基因(DiTullio，(1992)BIO/TECHNOLOGY 1074-77)。奶特異性蛋白啟動(dòng)子或在乳房組織中特異性激活的啟動(dòng)子可以源自cDNA或基因組序列。優(yōu)選，它們是基因組來源的。
對于至少一種且通常是幾種生物體中的所有上述的乳腺特異性基因，DNA序列信息是可獲得的。參見，例如，Richards等，J.BIOL.CHEM.256，526-532(1981)(α-乳清蛋白大鼠)；Campbell等，NUCLEIC ACIDS RES.12，8685-8697(1984)(大鼠WAP)；Jones等，J.BIOL.CHEM.260，7042-7050(1985)(大鼠β-酪蛋白)；Yu-Lee&Rosen，J.BIOL.CHEM.258，10794-10804(1983)(大鼠γ-酪蛋白)；Hall，BIOCHEM.J.242，735-742(1987)(人α-乳清蛋白)；Stewart，NUCLEIC ACIDS RES.12，389(1984)(牛αs1和κ酪蛋白cDNA)；Gorodetsky等，GENE 66，87-96(1988)(牛β酪蛋白)；Alexander等，EUR.J.BIOCHEM.178，395-401(1988)(牛κ酪蛋白)；Brignon等，F(xiàn)EBS LETT.188，48-55(1977)(牛αs2酪蛋白)；Jamieson等，GENE 61，85-90(1987)，Ivanov等，Biol.Chem.Hoppe-Seyler369，425-429(1988)，Alexander等，NUCLEIC ACIDS RES.17，6739(1989)(牛β乳球蛋白)；Vilotte等，BIOCHIMIE 69，609-620(1987)(牛α-乳清蛋白)。各種奶蛋白基因的結(jié)構(gòu)和功能綜述于Mercier & Vilotte，J.DAIRY SCI.76，3079-3098(1993)(在此以其整體引入作為參考用于所有目的)。一定程度上可能需要另外的序列數(shù)據(jù)，使用現(xiàn)有序列作為探針可以容易地克隆已經(jīng)獲得的區(qū)域側(cè)翼的序列。通過來自這樣生物體的篩選文庫使用已知的同源核苷酸序列或同源蛋白的抗體作為探針同樣獲得來自不同生物體的乳腺特異性調(diào)節(jié)序列。
信號序列根據(jù)本發(fā)明有用的信號序列是奶特異性信號序列或其它的信號序列，其導(dǎo)致真核或原核蛋白的分泌。優(yōu)選，信號序列選自奶特異性信號序列，即，來自編碼分泌至奶中的產(chǎn)物的基因。最優(yōu)選，奶特異性信號序列與本發(fā)明表達(dá)系統(tǒng)中所用的奶特異性啟動(dòng)子相關(guān)。對于本發(fā)明，信號序列的大小不是關(guān)鍵。需要的只是序列具有足夠大小來實(shí)現(xiàn)所需重組蛋白例如在乳房組織中的分泌。例如，來自編碼酪蛋白，例如，α、β、γ或κ酪蛋白，β乳球蛋白，乳清酸性蛋白和乳清蛋白基因的信號序列在本發(fā)明中是有用的。優(yōu)選的信號序列是山羊β-酪蛋白信號序列。
也可以使用來自其它分泌蛋白質(zhì)的信號序列，例如通過肝細(xì)胞、腎臟細(xì)胞和胰腺細(xì)胞分泌的蛋白質(zhì)。
所分泌蛋白質(zhì)的氨基端區(qū)域可以通過在待分泌的蛋白質(zhì)中包含正常分泌的蛋白質(zhì)的全部或部分編碼序列來提高分泌非分泌蛋白的功效。優(yōu)選在蛋白質(zhì)序列中不包括正常分泌的蛋白質(zhì)的全部序列，而是只有正常分泌蛋白質(zhì)氨基端的一部分。例如，將不是正常分泌的蛋白質(zhì)(通常在其氨基端)與正常分泌蛋白質(zhì)的氨基端部分融合。
優(yōu)選，正常分泌的蛋白質(zhì)是通常在奶中分泌的蛋白質(zhì)。這樣的蛋白質(zhì)包括乳房上皮細(xì)胞分泌的蛋白質(zhì)，奶蛋白如酪蛋白，β乳球蛋白，乳清酸性蛋白和乳清蛋白。酪蛋白包括任何哺乳動(dòng)物物種的α、β、γ或κ酪蛋白基因。優(yōu)選的蛋白質(zhì)是β酪蛋白，例如，山羊β酪蛋白。編碼所分泌蛋白質(zhì)的序列可以源自cDNA或基因組序列。優(yōu)選，它們是基因組來源的，并包括一個(gè)或多個(gè)內(nèi)含子。
DNA構(gòu)建體在此所述的表達(dá)系統(tǒng)或構(gòu)建體，還可以包括編碼非分泌蛋白質(zhì)的DNA序列的3’未翻譯區(qū)下游。該區(qū)域顯然穩(wěn)定了表達(dá)系統(tǒng)的RNA轉(zhuǎn)錄物并因此提高來自表達(dá)系統(tǒng)的所需蛋白質(zhì)的產(chǎn)量。在3’未翻譯區(qū)中提供poly A信號的序列在本發(fā)明構(gòu)建體中是有用的。這樣的序列可以源自例如SV40小t抗原，酪蛋白3’未翻譯區(qū)或本領(lǐng)域公知的其它3’未翻譯序列。優(yōu)選，3’未翻譯區(qū)源自奶特異性蛋白。3’未翻譯區(qū)的長度不是關(guān)鍵，但是poly A轉(zhuǎn)錄物的穩(wěn)定效果似乎在穩(wěn)定表達(dá)序列的RNA中是重要的。
任選地，表達(dá)系統(tǒng)或構(gòu)建體在啟動(dòng)子和編碼信號序列的DNA序列之間包括5’未翻譯區(qū)。這樣的未翻譯區(qū)可以來自獲得啟動(dòng)子的相同控制區(qū)或可以來自不同的基因，例如，它們可以源自其它合成的、半合成的或天然來源。同樣，它們的具體長度不是關(guān)鍵，然而，它們似乎在提高表達(dá)水平中是有用的。
構(gòu)建體還可以包括優(yōu)先在乳房上皮細(xì)胞中表達(dá)的基因N-端編碼區(qū)的約10％、20％、30％或更多。例如，N-端編碼區(qū)還可以對應(yīng)于所用的啟動(dòng)子，例如，山羊β-酪蛋白N-端編碼區(qū)。
可以使用本領(lǐng)域公知的方法制得上述的表達(dá)系統(tǒng)。例如，可以使用運(yùn)用常規(guī)銜接物、限制位點(diǎn)等的各種連接技術(shù)來取得良好的效果。優(yōu)選，作為較大質(zhì)粒的一部分制得本發(fā)明的表達(dá)系統(tǒng)。這樣的制備使得以本領(lǐng)域公知的有效方式來克隆和選擇正確的構(gòu)建。更優(yōu)選，本發(fā)明的表達(dá)系統(tǒng)位于質(zhì)粒上的合適限制位點(diǎn)之間，使得它們可以容易地從剩余的質(zhì)粒序列分離用于摻入所需的哺乳動(dòng)物。
現(xiàn)有技術(shù)方法通常包括制造構(gòu)建體并在將構(gòu)建體放入轉(zhuǎn)基因動(dòng)物中之前測試其在培養(yǎng)細(xì)胞中產(chǎn)生產(chǎn)物的能力。令人驚訝地，本發(fā)明者發(fā)現(xiàn)在測定例如在轉(zhuǎn)基因動(dòng)物奶中正常非分泌蛋白是否可以分泌中，這樣的實(shí)驗(yàn)方案不可能有預(yù)測價(jià)值。因此，理想的是在轉(zhuǎn)基因動(dòng)物例如轉(zhuǎn)基因小鼠中直接測試構(gòu)建體，因?yàn)橐恍┰贑HO細(xì)胞中不能分泌的構(gòu)建體分泌至轉(zhuǎn)基因動(dòng)物的奶中。
轉(zhuǎn)基因哺乳動(dòng)物優(yōu)選，將本發(fā)明的DNA構(gòu)建體引入哺乳動(dòng)物的種系中。例如，通過本領(lǐng)域已知的標(biāo)準(zhǔn)轉(zhuǎn)基因技術(shù)，可以將構(gòu)建體的一個(gè)或幾個(gè)拷貝引入哺乳動(dòng)物胚胎的基因組中。
任何非人哺乳動(dòng)物可以有益地用于本發(fā)明中。在此以具有乳腺并產(chǎn)奶的所有動(dòng)物來限定哺乳動(dòng)物，人除外。優(yōu)選產(chǎn)生大體積的奶并具有長哺乳期的哺乳動(dòng)物。優(yōu)選的哺乳動(dòng)物是奶牛、綿羊、山羊、小鼠、牛、駱駝和豬。當(dāng)然，對于本發(fā)明任何給定的表達(dá)序列，這些哺乳動(dòng)物中的每種相互之間可能不是同樣有效的。例如，特定的奶特異性啟動(dòng)子或信號序列在一種哺乳動(dòng)物中比在其它的哺乳動(dòng)物中更有效。然而，本領(lǐng)域技術(shù)人員按照本發(fā)明的教導(dǎo)可以容易地進(jìn)行這樣的選擇。
在出生后可以測定轉(zhuǎn)基因哺乳動(dòng)物幼仔的構(gòu)建體進(jìn)入后代基因組的引入。優(yōu)選，通過與對應(yīng)于后代染色體材料上編碼所需重組蛋白產(chǎn)物或其區(qū)段的DNA序列的探針雜交來實(shí)現(xiàn)該測定。發(fā)現(xiàn)在其基因組中含有至少一個(gè)構(gòu)建體拷貝的那些哺乳動(dòng)物后代生長至成熟。這些后代的雌性物種在它們的奶中或隨著它們的奶一起將產(chǎn)生所需的蛋白?；蛘?，可以繁殖轉(zhuǎn)基因哺乳動(dòng)物來產(chǎn)生在它們的奶中產(chǎn)生所需蛋白的其它轉(zhuǎn)基因后代。
對于蛋白質(zhì)分泌至奶中，可以使用本領(lǐng)域中標(biāo)準(zhǔn)的任何測定技術(shù)(例如，蛋白質(zhì)印跡或酶測定)來測試轉(zhuǎn)基因雌性。
其它表達(dá)系統(tǒng)雖然已經(jīng)說明了本發(fā)明優(yōu)選的方法來表達(dá)修飾的干擾素-α-甲胎蛋白組合，形成各種核苷酸序列，并轉(zhuǎn)化特定的宿主，清楚的是本發(fā)明不以任何方式受這些說明的限制。真核和原核宿主細(xì)胞兩者都可以使用。用于分離基因以及在細(xì)菌細(xì)胞和異種細(xì)胞中表達(dá)干擾素的幾種方法非常適于生產(chǎn)本發(fā)明的修飾干擾素。
同樣，可以從脊椎動(dòng)物細(xì)胞培養(yǎng)物生產(chǎn)修飾的干擾素，例如，猴子腎成纖維細(xì)胞的COS-7系可以用作宿主使用合適的表達(dá)載體來生產(chǎn)修飾的干擾素。已經(jīng)描述了真核表達(dá)載體的許多其它實(shí)例且是本領(lǐng)域已知的。
用于本發(fā)明在轉(zhuǎn)化宿主細(xì)胞中復(fù)制的載體具有含有功能性復(fù)制起點(diǎn)的DNA區(qū)段(復(fù)制子)。質(zhì)粒和噬菌體DNA根據(jù)其本性含有有助于在宿主細(xì)胞中復(fù)制的復(fù)制子。載體含有DNA區(qū)段，其將用于從非轉(zhuǎn)化細(xì)胞中選擇轉(zhuǎn)化細(xì)胞的特性傳送至可轉(zhuǎn)化的宿主細(xì)胞。為了選擇目的，可以使用多種特性中的任一種。最常用的特性之一是抗生素抗性，例如，新霉素抗性和四環(huán)素抗性。
從生物流體中純化AFP-融合蛋白使用標(biāo)準(zhǔn)蛋白純化技術(shù)從轉(zhuǎn)基因生物體的生物流體中純化本發(fā)明的AFP融合蛋白，如親和色譜(參見，例如，Ausubel等，CURRENTPROTOCOLS IN MOLECULAR BIOLOGY，John Wiley&Sons，New York，NY，1988；還參見Lubon等，美國專利5,831,141)或其它的本領(lǐng)域技術(shù)人員已知的蛋白純化方法。一旦得到分離，如果需要，可以將AFP-融合蛋白進(jìn)一步純化，例如通過高效液相色譜(HPLC；例如，參見，F(xiàn)isher，LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY，編輯，Work和Burdon，Elsevier，1980)，和/或切向流過濾。純化后，AFP融合蛋白至少為80％純，優(yōu)選90％純，更優(yōu)選95％純，和最優(yōu)選99％純。
動(dòng)物啟動(dòng)子在乳房組織中表達(dá)AFP有用的啟動(dòng)子包括天然驅(qū)動(dòng)乳房特異性多肽如奶蛋白表達(dá)的啟動(dòng)子，盡管可以使用允許AFP分泌至奶中的任何啟動(dòng)子。這些包括，例如，天然指導(dǎo)乳清酸性蛋白(WAP)，αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、κ-酪蛋白、β-乳球蛋白、α-乳清蛋白的表達(dá)的啟動(dòng)子(參見，例如Drohan等，U.S.專利No.5,589,604；Meade等，U.S.專利No.4,873,316；和Karatzas等，U.S.專利No.5,780,009)，以及描述于U.S.專利No.5,750,172中的其它啟動(dòng)子。乳清酸性蛋白(WAP；基因庫登記號No.X01153)，嚙齒動(dòng)物中的主要的乳清蛋白，在懷孕后期和哺乳期專門在乳腺中高水平表達(dá)(Hobbs等，J.BIOL.CHEM.2573598-3605，1982)。對于所需乳腺特異性啟動(dòng)子的其它信息，參見，例如，Richards等，J.BIOL.CHEM.256526-532，1981(α-乳清蛋白大鼠)；Campbell等，NUCLEIC ACIDSRES.128685-8697，1984(大鼠WAP)；Jones等，J.BIOL.CHEM.2607042-7050，1985(大鼠β-酪蛋白)；Yu-Lee & Rosen，J.BIOL.CHEM.25810794-10804，1983(大鼠γ-酪蛋白)；Hall，BIOCHEM.J.242735-742，1987(人α-乳清蛋白)；Stewart，NUCLEICACIDS RES.123895-3907，1984(牛α-s1和κ-酪蛋白cDNA)；Gorodetsky等，GENE 6687-96，1988(牛β-酪蛋白)；Alexander等，EUR.J.BIOCHEM.178395-401，1988(牛κ-酪蛋白)；Brignon等，F(xiàn)EBS LETT.18848-55，1977(牛α-s2酪蛋白)；Jamieson等，GENE 6185-90，1987，Ivanov等，BIOL.CHEM.Hoppe-Seyler369425-429，1988，和Alexander等，NUCLEIC ACIDS RES.176739，1989(牛β-乳球蛋白)；和Vilotte等，BIOCHIMIE 69609-620，1987(牛α-乳清蛋白)。各種奶蛋白基因的結(jié)構(gòu)和功能綜述于Mercier &Vilotte，J.DAIRY SCI.763079-3098，1993。如果另外的側(cè)翼序列可用于最佳化表達(dá)，可以使用現(xiàn)有的序列作為探針來克隆這樣的序列。通過這樣生物體的篩選文庫使用已知的同源核苷酸序列或同源蛋白的抗體作為探針來獲得不同生物體的乳腺特異性調(diào)節(jié)序列。
用于表達(dá)并將AFP分泌至奶中的有用的信號序列是奶特異性信號序列。理想地，信號序列選自奶特異性信號序列，即，來自編碼分泌至奶中的產(chǎn)物的基因。最理想地，奶特異性信號序列與上述的奶特異性啟動(dòng)子相關(guān)。信號序列的大小對于本發(fā)明不是關(guān)鍵。只需要序列具有足夠大小來實(shí)現(xiàn)例如在乳房組織中AFP的分泌。例如，來自編碼酪蛋白，例如，中α、β、γ或κ酪蛋白，β乳球蛋白，乳清酸性蛋白和乳清蛋白的基因的信號序列在本發(fā)明中是有用的。也可以使用來自其它分泌蛋白的信號序列，例如，由肝細(xì)胞、腎臟細(xì)胞或胰細(xì)胞分泌的蛋白質(zhì)。
用于在泌尿組織中表達(dá)重組多肽轉(zhuǎn)基因的有用啟動(dòng)子是尿血小板溶素(uroplakin)和尿調(diào)節(jié)素啟動(dòng)子(Kerr等，NAT.BIOTECHNOL.1675-79，1998；Zbikowska等，BIOCHEM.J.3657-11，2002)，盡管可以使用允許轉(zhuǎn)基因產(chǎn)物分泌至尿中的任何啟動(dòng)子。
通過產(chǎn)血和產(chǎn)血清細(xì)胞(例如，肝上皮細(xì)胞)表達(dá)并將AFP分泌至血液中的有用啟動(dòng)子是清蛋白啟動(dòng)子(參見，例如，Shen等，DNA8101-108，1989；Tan等，DEV.BIOL.14624-37，1991；McGrane等，TIBS 1740-44，1992；Jones等，J.BIOL.CHEM.26514684-14690，1990；和Shimada等，F(xiàn)EBS LETTERS 279198-200，1991)，盡管可以使用允許轉(zhuǎn)基因產(chǎn)物分泌至血液中的任何啟動(dòng)子。還可以使用天然α-甲胎蛋白啟動(dòng)子(參見，例如基因庫登記號No.AB053574；AB053573；AB053572；AB053571；AB053570；和AB053569)。用于在精液中表達(dá)AFP的有用啟動(dòng)子描述于U.S.專利No.6,201,167中。有用的鳥-特異性啟動(dòng)子是卵清蛋白啟動(dòng)子和apo-B啟動(dòng)子。其它鳥特異性啟動(dòng)子是本領(lǐng)域已知的。卵清蛋白啟動(dòng)子可以用于指導(dǎo)隨后在蛋的蛋白中沉積的AFP的表達(dá)。apo-B啟動(dòng)子還可以用于指導(dǎo)重組多肽在肝中的表達(dá)，最終它將沉積至蛋黃中。鳥卵是用于表達(dá)大量重組多肽的最佳載體，由于以下原因(1)每個(gè)卵中包裹大量的蛋白質(zhì)，(2)容易非入侵地收集蛋并可以保存延長的時(shí)間段，和(3)卵是無菌的，且與奶不一樣，不含有細(xì)菌污染物。具體地，對于每個(gè)卵，鳥在輸卵管中可以產(chǎn)生三克清蛋白，其中超過50％是卵清蛋白。另外三克在肝臟中產(chǎn)生(血清脂蛋白)并沉積在卵黃中。此外，由于它們與哺乳動(dòng)物的進(jìn)化距離，鳥通常在免疫上不能識別哺乳動(dòng)物蛋白，因此在鳥中表達(dá)AFP對鳥的存活力和健康不太可能具有任何的有害影響。
本發(fā)明方法中有用的其它啟動(dòng)子包括可誘導(dǎo)的啟動(dòng)子。一般而言，重組蛋白在大多數(shù)真核表達(dá)系統(tǒng)中以組成型方式表達(dá)?？烧T導(dǎo)的啟動(dòng)子或增強(qiáng)子元件的增加提供對AFP表達(dá)的時(shí)間控制或空間控制，且提供表達(dá)的可替換機(jī)理?？烧T導(dǎo)的啟動(dòng)子包括熱激蛋白、金屬硫蛋白和MMTV-LTR，而可誘導(dǎo)的增強(qiáng)子元件包括用于蛻皮激素、muristerone A和四環(huán)素/強(qiáng)力霉素的那些。
Tet-On和Tet-Off基因表達(dá)系統(tǒng)(Clontech)是用于本發(fā)明方法中的可誘導(dǎo)系統(tǒng)的一個(gè)實(shí)例。該系統(tǒng)使用四環(huán)素(Tc)效應(yīng)元件來維持AFP在開(組成型關(guān)，用Tc誘導(dǎo))或關(guān)(組成型開，用Tc或強(qiáng)力霉素阻抑)模式下的表達(dá)。還可以將選擇標(biāo)記摻入AFP轉(zhuǎn)基因中用于已經(jīng)轉(zhuǎn)化細(xì)胞的容易鑒別。選擇標(biāo)記通常分成兩個(gè)功能種類隱性或顯性。隱性標(biāo)記通常是編碼在宿主細(xì)胞(缺乏“標(biāo)記”產(chǎn)物或功能的細(xì)胞)中不產(chǎn)生的產(chǎn)物的基因。用于胸苷激酶(TK)、二氫葉酸還原酶(DHFR)、腺嘌呤轉(zhuǎn)磷酸核糖基酶(APRT)和次黃嘌呤-鳥嘌呤轉(zhuǎn)磷酸核糖基酶(HGPRT)的標(biāo)記基因?qū)儆谶@類。顯性標(biāo)記包括編碼賦予生長抑制化合物(抗生素、藥物)抗性和/或允許宿主細(xì)胞在代謝限制環(huán)境中生長的產(chǎn)物的基因。這類中通常使用的標(biāo)記包括賦予氨甲蝶呤抗性的突變DHFR基因；用于黃嘌呤-鳥嘌呤轉(zhuǎn)磷酸核糖基酶的gpt基因，其允許宿主細(xì)胞在含有霉酚酸/黃嘌呤的培養(yǎng)基中生長；和用于氨基糖苷3’-磷酸轉(zhuǎn)移酶的neo基因，其可以賦予對G418、慶大霉素、卡那霉素和新霉素的抗性。
核酸載體本發(fā)明的某些實(shí)施方案中，涉及載體，或重組表達(dá)載體，這些載體包括在此所述的任一核酸分子。使用在此的載體來擴(kuò)增編碼融合蛋白的DNA或RNA和/或表達(dá)編碼SSTR-融合蛋白的DNA。載體包括但不限于質(zhì)粒、噬菌體、粘粒、游離基因、病毒顆?；虿《?，以及可整合的DNA片段(即，通過同源重組可整合至宿主基因組的片段)。病毒顆粒包括但不限于腺病毒、桿狀病毒、細(xì)小病毒、皰疹病毒、痘病毒、腺伴隨病毒、Semliki Forest病毒、牛痘病毒、逆轉(zhuǎn)錄病毒、微粒和裸DNA。不同的實(shí)施方案中，表達(dá)可以通過靶向配體瞄準(zhǔn)特定細(xì)胞類型或細(xì)胞群。表達(dá)載體包括，但不限于，pcDNA3(Invitrogen)和pSVL(Pharmacia Biotech)。其它表達(dá)載體包括但不限于，pSPORTTM載體，pGEMTM載體(Promega)，pPROEX載體TM(LTI，Bethesda，Md.)，BluescriptTM載體(Stratagene)，pQE.TM載體(Qiagen)，pSE420TM(Invitrogen)和pYES2TM(Invitrogen)。表達(dá)構(gòu)建體可以包括融合蛋白編碼多核苷酸，該多核苷酸可操作地連接于內(nèi)源或外源表達(dá)控制DNA序列和轉(zhuǎn)錄終止子。由于許多載體中核酸插入的有限間隔，理想的是插入較小的報(bào)道基因或報(bào)道融合構(gòu)建體。例如，可以使用全部或部分促生長素抑制素報(bào)道羧基端的缺失。表達(dá)控制DNA序列通常包括啟動(dòng)子、增強(qiáng)子、操縱基因和調(diào)節(jié)元件結(jié)合位點(diǎn)，并通?；谄渲袑⒁褂帽磉_(dá)構(gòu)建體的表達(dá)系統(tǒng)來選擇。
通常出于提高基因表達(dá)的能力來選擇啟動(dòng)子和增強(qiáng)子序列，而通常出于調(diào)節(jié)基因表達(dá)的能力來選擇操縱序列。本發(fā)明的表達(dá)構(gòu)建體還可以包括編碼一個(gè)或多個(gè)可以鑒定帶有構(gòu)建體的宿主細(xì)胞的選擇標(biāo)記的序列。表達(dá)構(gòu)建體還可以包括有助于宿主細(xì)胞中同源重組的序列。不同的實(shí)施方案中，構(gòu)建體還可以包括在宿主細(xì)胞中復(fù)制所需要的序列。
在此列出了各種實(shí)例性的組織特異性啟動(dòng)子(Pearse和Takor，1979；Nylen和Becker，1995)。盡管不是完全的列舉，這些啟動(dòng)子是可以用于本發(fā)明某些實(shí)施方案中的啟動(dòng)子和增強(qiáng)子類型的實(shí)例。可用于本發(fā)明中的其它啟動(dòng)子是本領(lǐng)域技術(shù)人員容易獲知的。
可誘導(dǎo)的啟動(dòng)子包括但不限于MT II，MMTV(小鼠乳房腫瘤病毒)、c-jun、膠原酶、溶基質(zhì)素、鼠MX基因、GRP78基因、α-2-巨球蛋白、波形蛋白、MHC I型基因H-2kB、HSP70、增殖蛋白、腫瘤壞死因子和甲狀腺刺激激素-α?？梢允褂眉?xì)胞特異性增強(qiáng)子和/或啟動(dòng)子來獲得細(xì)胞或組織特異性表達(dá)(總地參見，Huber等，ADV.DRUG.DELIVERYREVIEWS 17279-292，1995)。
表達(dá)載體可以用于生產(chǎn)編碼蛋白，還可以簡單用于擴(kuò)增SSTR-融合蛋白編碼多核苷酸序列。一些實(shí)施方案中，載體是其中多核苷酸可操作地連接于包括表達(dá)控制序列的多核苷酸的表達(dá)載體。某些實(shí)施方案中，自主復(fù)制重組表達(dá)構(gòu)建體如質(zhì)粒和病毒DNA載體摻入多核苷酸。表達(dá)載體還可以是可復(fù)制的DNA構(gòu)建體，其中編碼SSTR-融合蛋白的DNA序列可操作地連結(jié)或連接于能夠?qū)崿F(xiàn)SSTR-融合蛋白在合適宿主中表達(dá)的合適控制序列。當(dāng)它們功能上彼此相關(guān)時(shí)，將DNA區(qū)可操作地連結(jié)或連接。例如，將啟動(dòng)子可操作地連結(jié)或連接于編碼序列，如果它控制序列的轉(zhuǎn)錄。擴(kuò)增載體不需要表達(dá)控制結(jié)構(gòu)域，而只需要在宿主中復(fù)制的能力，通常通過復(fù)制起點(diǎn)來給予，和幫助轉(zhuǎn)化體的識別的選擇基因。表達(dá)載體中對控制序列的需要將根據(jù)所選的宿主和所選的轉(zhuǎn)化方法而改變。通常，控制序列包括轉(zhuǎn)錄啟動(dòng)子、控制轉(zhuǎn)錄的任選的操縱基因序列、編碼合適mRNA核糖體結(jié)合的序列以及控制轉(zhuǎn)錄和翻譯終止的序列。
不同的實(shí)施方案中，載體可以含有宿主生物體所識別的啟動(dòng)子。啟動(dòng)子序列可以是原核的、真核的、合成的或病毒的。合適原核序列的實(shí)例包括噬菌體λ啟動(dòng)子(THE BACTERIOPHAGE LAMBDA，Hershey，A.D.，編輯，Cold Spring Harbor Press，Cold Spring Harbor，N.Y.(1973)；LAMBDA II，Hendrix，R.W.編輯，Cold Spring Harbor Press，Cold Spring Harbor，N.Y.(1980)；以及Benoist等，The trp，recA，heat shock，and lacZpromoters of E.coli and SV40 early promote，NATURE，290304-310，(1981))。另外的啟動(dòng)子包括但不限于鼠乳房腫瘤病毒、人免疫缺陷病毒的長末端重復(fù)、maloney病毒、細(xì)胞肥大病毒立即早期啟動(dòng)子、EB病毒、勞斯肉瘤病毒、人肌動(dòng)蛋白、人肌球蛋白、人血紅蛋白、人肌肉肌酸和人金屬硫蛋白。
載體中還可以包括另外的調(diào)節(jié)序列。通過噬菌體MS-2的復(fù)制酶基因和噬菌體λ的基因cII的SD序列來表示合適調(diào)節(jié)序列的實(shí)例。SD序列可以直接后面接著編碼SSTR-融合蛋白的DNA并導(dǎo)致成熟SSTR-融合蛋白的表達(dá)。
此外，合適的表達(dá)載體可以包括合適的可以篩選轉(zhuǎn)化宿主細(xì)胞的標(biāo)記。使用本領(lǐng)域技術(shù)人員公知的和描述于Sambrook等(上文)中的各種技術(shù)中的任一種技術(shù)來進(jìn)行所選宿主的轉(zhuǎn)化。
還可以通過構(gòu)建載體包括外部源起點(diǎn)或通過宿主細(xì)胞染色體復(fù)制機(jī)理來提供復(fù)制起點(diǎn)。如果將載體整合至宿主細(xì)胞染色體，后者就足夠了?；蛘撸耸褂煤胁《緩?fù)制起點(diǎn)的載體外，本領(lǐng)域技術(shù)人員可以通過使用選擇標(biāo)記和SSTR-融合蛋白編碼DNA共轉(zhuǎn)化的方法來轉(zhuǎn)化哺乳動(dòng)物細(xì)胞。合適標(biāo)記的實(shí)例是二氫葉酸還原酶或胸苷激酶(參見，US專利No.4,399,216)。
編碼報(bào)道蛋白質(zhì)融合如SSTR2-融合蛋白的核苷酸序列，可以根據(jù)常規(guī)技術(shù)與載體DNA重組，包括用于連接的平端或交叉端，限制酶消化來提供合適的末端，如果需要填補(bǔ)粘性末端，堿性磷酸酶處理來避免不良的連接并用合適的連接酶來連接。Sambrook等的上文公開了這樣的操作技術(shù)，且是本領(lǐng)域公知的。構(gòu)建哺乳動(dòng)物表達(dá)載體的方法公開于，例如，Okayama等，MOL.CELL.BIOL.3280，(1983)；Cosman等，MOL.IMMUNOL，23935(1986)；和Cosman等，NATURE，312768，(1984)。
轉(zhuǎn)基因構(gòu)建體優(yōu)選包括啟動(dòng)子下游的前導(dǎo)序列。前導(dǎo)序列是編碼蛋白質(zhì)分泌信號的核酸序列，且當(dāng)可操作地連接于編碼本發(fā)明AFP-融合蛋白的下游核酸分子時(shí)，指導(dǎo)AFP-融合蛋白分泌?？梢詮挠糜谥笇?dǎo)編碼AFP的核酸分子轉(zhuǎn)錄的啟動(dòng)子相同的基因獲得前導(dǎo)序列(例如，編碼奶特異性蛋白的基因)?；蛘?，可以使用編碼天然人AFP蛋白分泌信號的前導(dǎo)序列(基因庫登記號No.V01514的氨基酸1-19)。
治療用途在處理這些組織培養(yǎng)物中，優(yōu)選將在此的組合在體外使用。然而，該組合對于體內(nèi)應(yīng)用也是有效的。根據(jù)預(yù)期的體內(nèi)給藥模式，可以以固體、半固體或液體的劑型來使用組合物，如，片劑、丸劑、粉劑、膠囊、凝膠、膏劑、液體、懸浮液等等。優(yōu)選以適于確定劑量單次給藥的單位劑型來施用組合物。根據(jù)所需的制劑，組合物還可以包括藥物學(xué)上可接受的載體或稀釋劑，將其限定為通常用于配制動(dòng)物或人給藥的藥物組合物的基于水溶液的賦形劑。選擇稀釋劑以致不會影響人α-甲胎蛋白的生物活性。這樣稀釋劑的實(shí)例是蒸餾水、生理鹽水、林格溶液、葡萄糖溶液和Hank’s溶液。相同的稀釋劑可以用于重建凍干的人α-甲胎蛋白。此外，藥物組合物還可以包括其它的醫(yī)學(xué)試劑，藥劑，載體，助劑，非毒性、非治療性、非免疫性的穩(wěn)定劑等。就成分的溶解性、生物活性等而言，這樣的稀釋劑或載體的有效量是有效獲得藥物學(xué)上可接受制劑的量。
在此的組合物可以通過口服、非腸道或局部給藥以及全身形式給藥于人患者來用于抗黑素瘤和抗乳癌治療。
融合蛋白多功能結(jié)構(gòu)域根據(jù)本發(fā)明，涉及的雙功能融合蛋白對重癥肌無力、類風(fēng)濕性關(guān)節(jié)炎、骨質(zhì)疏松、癌癥、局部施用和多發(fā)性硬化具有獨(dú)特的雙重治療效果。其它方面的有效性包括抗病毒活性、免疫調(diào)節(jié)活性和抗血管生成活性(斷裂的ATIII融合-AFP蛋白)。
根據(jù)本發(fā)明的保守變體通常保留蛋白質(zhì)結(jié)構(gòu)域的整個(gè)分子結(jié)構(gòu)。根據(jù)構(gòu)成公開蛋白產(chǎn)物的各個(gè)氨基酸的特性，一些合理的置換是顯而易見的。可以進(jìn)行氨基酸置換，即，“保守置換”，例如，以所涉及殘基的極性、電荷、溶解度、疏水性、親水性和/或兩性性質(zhì)為基礎(chǔ)。
例如，(a)非極性(疏水性)氨基酸包括丙氨酸、亮氨酸、異亮氨酸、纈氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸；(b)極性中性氨基酸包括甘氨酸、絲氨酸、蘇氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺；(c)正電荷(堿性)氨基酸包括精氨酸、賴氨酸和組氨酸；和(d)負(fù)電荷(酸性)氨基酸包括天冬氨酸和谷氨酸。置換通常在基團(tuán)(a)-(d)中進(jìn)行。此外，甘氨酸和脯氨酸基于它們破壞α螺旋的能力可以相互置換。同樣地，某些氨基酸，如，丙氨酸、半胱氨酸、亮氨酸、蛋氨酸、甘氨酸、谷氨酰胺、組氨酸和賴氨酸多在α螺旋中發(fā)現(xiàn)，而纈氨酸、異亮氨酸、苯丙氨酸、酪氨酸、色氨酸和蘇氨酸多在β-折疊中發(fā)現(xiàn)。甘氨酸、絲氨酸、天冬氨酸、天冬酰胺和脯氨酸多在轉(zhuǎn)角中發(fā)現(xiàn)?？梢栽谝韵碌幕鶊F(tuán)中進(jìn)行一些優(yōu)選的置換(i)S和T；(ii)P和G；和(iii)A、V、L和I。根據(jù)已知的遺傳密碼，以及重組和合成DNA技術(shù)，本領(lǐng)域技術(shù)人員可以容易地構(gòu)建編碼保守氨基酸變體的DNA。
制備雙功能分子本發(fā)明考慮的雙功能蛋白是含有每種之前所述結(jié)構(gòu)域的蛋白，其中在這樣融合時(shí)，兩個(gè)結(jié)構(gòu)域基本上保留其相關(guān)的特征并在某些治療應(yīng)用如重癥肌無力或類風(fēng)濕性關(guān)節(jié)炎中具有協(xié)同效果。盡管通常產(chǎn)生融合蛋白，也可以通過常規(guī)化學(xué)方法來融合結(jié)構(gòu)域，例如使用多功能交聯(lián)銜接物。當(dāng)形成融合蛋白時(shí)，可以將任一個(gè)結(jié)構(gòu)域放置于另一個(gè)結(jié)構(gòu)域的C-端或N-端。用于形成融合蛋白的合適方法應(yīng)當(dāng)是基本上不改變所需融合蛋白兩個(gè)多肽中任一個(gè)的生物活性的方法。
本發(fā)明不受限于生產(chǎn)在此考慮的所需融合蛋白的任何特定方法。然而，根據(jù)所考慮的重組生產(chǎn)方法，本發(fā)明提供了包含一個(gè)或多個(gè)本發(fā)明所述結(jié)構(gòu)域的核苷酸序列的重組DNA構(gòu)建體。本發(fā)明的重組構(gòu)建體包括載體，如質(zhì)粒或病毒載體，其中以任何方向插入DNA或DNA片段，通常帶有可讀框。本發(fā)明進(jìn)一步涉及含有這些載體的細(xì)胞。
細(xì)菌表達(dá)通過將編碼所需蛋白的結(jié)構(gòu)DNA序列以及合適的翻譯起始和終止信號插入具有功能啟動(dòng)子的可操作閱讀相中來構(gòu)建用于細(xì)菌使用的有用表達(dá)載體。載體將包含一個(gè)或多個(gè)表型選擇標(biāo)記和復(fù)制起點(diǎn)來確保載體的維持，如果理想的，來提供在宿主中的擴(kuò)增。合適的用于轉(zhuǎn)化的原核宿主包括大腸桿菌、枯草芽孢桿菌、鼠傷寒沙門氏菌以及假單胞菌、鏈霉菌和葡萄球菌屬中的各種物種，盡管其它的也可以使用作為選擇的物質(zhì)。優(yōu)選實(shí)施方案中，原核宿主是大腸桿菌。
細(xì)菌載體可以是例如基于噬菌體、質(zhì)粒、或粘粒的。這些載體可以包括選擇標(biāo)記和源自可購得的通常含有公知克隆載體pBR322(ATCC37017)元件的質(zhì)粒的細(xì)菌復(fù)制起點(diǎn)。這些可購得的載體包括，例如，GEM1(Promega Biotec，Madison，Wis.，USA)，pBs、phagescript、PsiX174、pBluescript SK、pBs KS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene)；pTrc99A、pKK223-3、pKK233-3、pKK232-8、pDR540和pRIT5(Pharmacia)。根據(jù)本發(fā)明，優(yōu)選的載體是THE Pt7I表達(dá)載體。
這些“主鏈”部分與合適的啟動(dòng)子和待表達(dá)的結(jié)構(gòu)序列結(jié)合。細(xì)菌啟動(dòng)子包括lac、T3、T7、λPR或PL、trp和ara。T7是優(yōu)選的細(xì)菌啟動(dòng)子。
合適宿主菌株的轉(zhuǎn)化和宿主菌株生長至合適的細(xì)胞密度后，通過合適的方式(例如，溫度變動(dòng)或化學(xué)誘導(dǎo))將所選的啟動(dòng)子去阻抑/誘導(dǎo)并將細(xì)胞培養(yǎng)另外的時(shí)間段。通常通過離心收集細(xì)胞，通過物理或化學(xué)方法來破碎細(xì)胞，并將所得到的粗制提取物保留用于進(jìn)一步的純化。
真核表達(dá)還可以使用各種哺乳動(dòng)物細(xì)胞培養(yǎng)系統(tǒng)來表達(dá)重組蛋白。哺乳動(dòng)物表達(dá)系統(tǒng)的實(shí)例包括所選的鼠L細(xì)胞，如胸苷激酶-陰性(TK)和腺嘌呤轉(zhuǎn)磷酸核糖基酶(APRT)細(xì)胞。其它實(shí)例包括猴子腎成纖維細(xì)胞的COS-7系，由Gluzman描述，Cell 23175(1981)，和其它能夠表達(dá)相容載體的細(xì)胞系，例如，C127、3T3、CHO、HeLa和BHK細(xì)胞系。特別地，關(guān)于酵母，可以提及的有酵母屬(Saccharomyces)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、許旺氏酵母屬(Schwanniomyces)或漢遜酵母屬(Hansenula)中所述的酵母。能夠用于本發(fā)明中的真菌中，更特別地可以提及的有曲霉屬(Aspergillus)或木霉屬(Trichoderma)。
哺乳動(dòng)物表達(dá)載體將包括復(fù)制起點(diǎn)、合適的啟動(dòng)子和增強(qiáng)子、以及任何必要的核糖體結(jié)合位點(diǎn)、多腺苷酸化位點(diǎn)、剪接供體和受體位點(diǎn)、轉(zhuǎn)錄終止序列和5’側(cè)翼非轉(zhuǎn)錄序列?？梢允褂迷醋許V40病毒基因組，例如，SV40起點(diǎn)、早期啟動(dòng)子、增強(qiáng)子、剪接和多腺苷酸化位點(diǎn)的DNA序列來提供所需的非轉(zhuǎn)錄遺傳因子。
哺乳動(dòng)物啟動(dòng)子包括β酪蛋白、β乳球蛋白、乳清酸性蛋白啟動(dòng)子，其它包括HSV胸苷激酶，早期和晚期SV40，來自逆轉(zhuǎn)錄病毒的LTRs以及鼠金屬硫蛋白-1。實(shí)例哺乳動(dòng)物載體包括pWLneo、pSV2cat、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG和pSVL(Pharmacia)。優(yōu)選實(shí)施方案中，哺乳動(dòng)物表達(dá)載體是pUCIG-MET。選擇標(biāo)記包括CAT(氯霉素轉(zhuǎn)移酶)。
可以以各種方式制得可用于本發(fā)明構(gòu)架中的核苷酸序列。通常，通過在閱讀相，裝配編碼多肽每個(gè)功能部分的序列來獲得它們。后者可以通過本領(lǐng)域技術(shù)人員的技術(shù)來分離，例如直接從細(xì)胞信使RNA(mRNA)中分離，或通過從互補(bǔ)DNA(cDNA)文庫再克隆，或者它們可以是完全合成的核苷酸序列。此外，可以理解，為了獲得所述序列的衍生物或變體，隨后還可以將核苷酸序列修飾，例如，通過遺傳工程技術(shù)。
原位雜交熒光(FISH)分析使用標(biāo)準(zhǔn)培養(yǎng)和制備方法從培養(yǎng)的源自攜帶所需轉(zhuǎn)基因動(dòng)物的細(xì)胞中獲得中期和間期的核。將核沉積在載玻片上并與洋地黃毒苷標(biāo)記的探針雜交，該探針源自含有8kb用于所關(guān)心雙功能蛋白的基因組序列的構(gòu)建體。使用辣根過氧化物酶綴合的抗體擴(kuò)增結(jié)合的探針并用酪胺綴合的異硫氰酸熒光素(FITC，綠色熒光染料)檢測。用4’，6-二脒基-2-苯基吲哚(DAPI，藍(lán)色染料)將核復(fù)染色。使用MetaMorph軟件獲得FISH圖象。
治療組合物根據(jù)制備藥物上有用組合物的已知方法來配制本發(fā)明的蛋白質(zhì)，借此將本發(fā)明的分子或其功能衍生物與藥物學(xué)上可接受的載體或賦形劑混合而組合。例如，為了形成適于有效給藥的藥物學(xué)上可接受的組合物，描述了合適的賦形劑及其劑型，包括其它的人蛋白，例如，人血清清蛋白，這樣的組合物將含有有效量的一種或多種本發(fā)明的蛋白質(zhì)，和合適量的載體或賦形劑。
可以使用一種或多種生理學(xué)上可接受的載體或賦形劑以常規(guī)方式來配制根據(jù)本發(fā)明使用的藥物組合物。因此，可以將雙功能分子及其生理學(xué)上可接受的鹽和溶劑化物配制成用于吸入或吹入(通過嘴或鼻子)給藥或口服、口腔合化、非腸道或直腸給藥。
對于口服，藥物組合物可以采用例如片劑或膠囊的形式，通過常規(guī)方式制得，使用藥物學(xué)上可接受的賦形劑如粘合劑(例如，預(yù)糊化的玉米淀粉，聚丙烯吡咯烷酮或羥丙基甲基纖維素)；填料(例如，乳糖、微晶纖維素或磷酸氫鈣)；潤滑劑(例如，硬脂酸鎂、滑石或硅石)；崩解劑(例如，土豆淀粉或淀粉羥乙酸鈉)；或濕潤劑(例如，十二磺基硫酸鈉)?？梢酝ㄟ^本領(lǐng)域公知的方法將片劑包衣。用于口服的液體制劑可以采用例如溶液、糖漿或懸浮液的形式，或可以將它們制成在使用前用水或其它合適賦形劑構(gòu)建的干產(chǎn)品。可以通過常規(guī)方式制得這樣的液體制劑，使用藥物學(xué)上可接受的添加劑，如懸浮劑(例如，山梨醇糖漿，纖維素衍生物或氫化食用脂肪)；乳化劑(例如，卵磷脂或阿拉伯膠)；非水性賦形劑(例如，杏仁油、油酯、乙醇或分餾的植物油)；和防腐劑(例如，甲基或丙基對羥基苯甲酸酯或山梨酸)。如果需要，制劑還可以含有緩沖鹽、調(diào)味劑、著色劑和甜味劑。
可以適當(dāng)配制用于口服的制劑來給予活性化合物的受控釋放。對于口腔含化給藥，組合物可以采用以常規(guī)方式配制的片劑或錠劑形式。
對于通過吸入的給藥，以加壓包裝或噴霧器中呈現(xiàn)的氣溶膠噴霧形式來方便地遞送根據(jù)本發(fā)明使用的雙功能分子，使用合適的推進(jìn)劑，例如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合適的氣體。在加壓氣溶膠的情況中，可以通過提供遞送計(jì)量用量的閥來決定劑量單位。可以配制用于吸入器或吹入器中的例如明膠的膠囊和藥筒來含有化合物和合適粉末基料如乳糖或淀粉的粉末混合物。
可以配制本發(fā)明的雙功能融合蛋白用于通過注射的非腸道給藥，例如，通過快速濃注或連續(xù)灌輸。用于注射的制劑可以以單位劑型呈現(xiàn)，例如，在安瓿中或在多劑量容器中，含有加入的防腐劑。組合物可以采用這樣的形式如油或水性賦形劑中的懸浮液、溶液或乳液，并可以含有配制劑如懸浮劑、穩(wěn)定劑和/或分解劑?；蛘?，活性成分可以是在使用前用合適賦形劑例如無菌無熱原水構(gòu)建的粉末形式。
還可以將化合物配制于直腸組合物中如栓劑或滯留灌腸劑，例如，含有常規(guī)栓劑基料如可可脂或其它甘油酯。
除了之前所述的制劑，雙功能分子還可以配制成長效制劑。這樣的長效制劑可以通過植入(例如，皮下或肌內(nèi))或通過肌內(nèi)注射來給藥。因此，例如，化合物可以與合適的聚合或疏水材料(例如，作為可接受油中的乳液)或離子交換樹脂一起配制，或配制成微溶衍生物，例如，作為微溶鹽。
如果需要，組合物可以存在于包裝或分配裝置中，其可以含有一個(gè)或多個(gè)含有活性成分的單位劑量形式。例如包裝可以包括金屬或塑料薄片，如泡罩包裝。包裝或分配裝置可以附隨給藥的說明。
本發(fā)明的一些融合蛋白組合物可以治療上用于癌癥治療中。因此，可以將它們與常規(guī)化療劑結(jié)合配制。常規(guī)化療劑包括烷基化劑、抗代謝物、各種天然產(chǎn)物(例如，長春花屬生物堿、表鬼臼毒素、抗生素和消耗氨基酸的酶)、激素和激素拮抗劑。特定種類的藥劑包括氮芥、烷基磺酸鹽、亞硝基脲、三氮烯、葉酸類似物、嘧啶類似物、嘌呤類似物、鉑復(fù)合物、腎上腺皮質(zhì)抑制劑、腎上腺類固醇、孕酮、雌激素、抗雌激素和雄激素。一些實(shí)例化合物包括環(huán)磷酰胺、苯丁酸氮芥、氨甲蝶呤、氟尿嘧啶、阿糖胞苷、硫鳥嘌呤、長春堿、長春新堿、阿霉素、柔紅霉素、絲裂霉素、順鉑、羥基脲、強(qiáng)的松、羥孕酮己酸鹽、甲羥孕酮、醋酸甲地孕酮、己烯雌酚、炔雌醇、他莫西芬、丙酸睪酮和氟甲睪酮。例如，治療乳癌中，優(yōu)選他莫西芬。
治療方法根據(jù)本發(fā)明的創(chuàng)造性治療方法通常使用上述鑒定的雙功能蛋白。融合蛋白的結(jié)構(gòu)域具有特異性靶向特定組織和/或增加對靶組織免疫應(yīng)答的能力。因此，典型的方法包括將靶細(xì)胞的受體與融合蛋白的受體-拮抗結(jié)構(gòu)域結(jié)合和/或刺激T-細(xì)胞依賴性免疫應(yīng)答。
治療方法包括將治療有效量的融合蛋白給予需要治療的患者。在此使用的“治療上有效的”指的是融合蛋白的量是足以抑制或逆轉(zhuǎn)病況(例如，降低或抑制癌生長)的量。一些方法考慮了與已知癌癥藥物或治療例如化療(優(yōu)選使用上述種類的化合物)或放療的聯(lián)合治療。患者可以是人或非人動(dòng)物。當(dāng)患有以促進(jìn)癌癥維持或增生的受體的提高水平為特征的癌癥時(shí)，患者通常需要治療。
在體內(nèi)治療過程中的給藥可以通過任何途徑，包括非腸道和口服，但優(yōu)選非腸道?？梢允褂媚覂?nèi)、靜脈內(nèi)、鞘內(nèi)和腹膜內(nèi)給藥途徑，通常優(yōu)選靜脈內(nèi)。本領(lǐng)域技術(shù)人員將認(rèn)識到根據(jù)待治療的病癥來改變給藥的途徑。
確定治療有效量具體地取決于這些因素，如藥物的毒性和功效。可以使用本領(lǐng)域公知的和前述參考文獻(xiàn)中可找到的方法來測定毒性?？梢岳孟嗤闹笇?dǎo)結(jié)合以下實(shí)施例中所述的方法來測定功效。因此，藥物學(xué)上的有效量，是臨床醫(yī)師認(rèn)為毒理學(xué)上可耐受的而仍然有效驗(yàn)的量。例如，可以通過靶組織T淋巴細(xì)胞細(xì)胞毒性的誘導(dǎo)或基本上的誘導(dǎo)或靶組織塊的減小來測量功效。合適的劑量約為1mg/kg至10mg/kg。
測定融合蛋白生物活性的篩選測定本發(fā)明還提供了基于細(xì)胞的測定系統(tǒng)，可以用于比較本發(fā)明給定融合蛋白的每個(gè)多肽結(jié)構(gòu)域的生物活性。為此，使用細(xì)胞增殖測定法來確保融合蛋白的融合結(jié)構(gòu)域各自保留了與未融合時(shí)的天然蛋白(即，不是融合蛋白的一部分)相似的生物學(xué)功能。
一實(shí)施方案中，通過在體外將蛋白引入兩種分開類型的細(xì)胞系來測定融合蛋白的生物活性每個(gè)細(xì)胞系測定特定結(jié)構(gòu)域的生物活性。例如，為第一個(gè)多肽結(jié)構(gòu)域生物活性的可靠指示物的細(xì)胞系應(yīng)該用于測試該結(jié)構(gòu)域的效應(yīng)，而能夠表明第二個(gè)多肽結(jié)構(gòu)域生物效應(yīng)的細(xì)胞系應(yīng)該用于監(jiān)控另一結(jié)構(gòu)域的活性。這還將幫助測定兩個(gè)功能融合蛋白結(jié)構(gòu)域的協(xié)同效應(yīng)和附加效應(yīng)。以下實(shí)施例是說明性的并不應(yīng)該認(rèn)為是限制性的?？梢栽诃h(huán)狀質(zhì)粒、粘粒載體或其它載體如源自病毒的載體中攜帶AFP-融合轉(zhuǎn)基因構(gòu)建體。載體可以含有另外的有助于它在原核和真核細(xì)胞中增殖的序列，例如，藥物選擇標(biāo)記(例如，大腸桿菌中的氨芐青霉素抗性，或哺乳動(dòng)物細(xì)胞細(xì)胞中的的G-418抗性)和復(fù)制起點(diǎn)(例如，用于在原核細(xì)胞中復(fù)制的colE1，和用于在哺乳動(dòng)物細(xì)胞中復(fù)制的oriP)。
實(shí)施例3純化融合蛋白為了獲得融合蛋白提高的產(chǎn)量，需要根據(jù)本領(lǐng)域公知的方法首先純化它們。這些步驟包括從轉(zhuǎn)基因動(dòng)物收集奶或通過離心從培養(yǎng)物除去細(xì)胞，接著沉淀、切向流過濾，和色譜方法，如低壓SEC和制備性RP-HPLC色譜。接著這些步驟的是緩沖液交換、去除熱原和凍干。
之前所述的不是用來確定本發(fā)明已經(jīng)鑒定的所有方面或?qū)嵤┓桨?，也不是以任何方式來限制本發(fā)明。附圖，將其引入并構(gòu)成說明書的一部分，說明了本發(fā)明的實(shí)施方案，并與說明一起，用來解釋本發(fā)明的原理。
該說明書中提及的所有出版物和專利申請?jiān)诖艘胱鳛閰⒖迹c具體表明每個(gè)單獨(dú)的出版物或?qū)＠暾堃胱鳛閰⒖嫉某潭认嗤?br> 盡管已經(jīng)結(jié)合具體實(shí)施方案描述了本發(fā)明，可以理解能夠進(jìn)一步改變且該申請涵蓋大體上按照本發(fā)明原理的對本發(fā)明的任何改變、使用或調(diào)整并包括在本發(fā)明所屬領(lǐng)域中已知或慣例范圍內(nèi)的與本公開的偏離，并可以應(yīng)用于上文所列的基本特征中。
所引用的文獻(xiàn)并引入作為參考1.Baguisi A，(1999)等，Production of Goats by Somatic CellNuclear Transfer(通過體細(xì)胞核移植來生產(chǎn)山羊)NATURE BIOTECH；17456-461。
2.Cibelli JB，(1998)等，Cloned Transgenic Calves ProducedFrom Nonquiescent Fetal Fibroblasts(從非靜止的胎成纖維細(xì)胞產(chǎn)生的克隆轉(zhuǎn)基因小牛)SCIENCE；2801256-1258。
3.Eipper BA等，Peptidylglycine alpha-Amidating MonooxygenaseA Multifunctional Protein with Catalytic，Processing andRouting Domains(1993)(肽甘氨酸α-酰胺化單加氧酶具有催化、加工和傳遞結(jié)構(gòu)域的多功能蛋白)PROTEIN SCIENCE 2，489-497。
4.Eppstein等，BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS，12066-73(1984)。
5.Hwang，H.-Y等(1996)Creation of Homozygous Mutants ofLeishmania Donovani With Single Targeting Constructs(具有單個(gè)靶向構(gòu)建體的Leishmania Donovani純合突變體的形成)J.BIOL.CHEM.27130840-30846。
6.Jain，M等(2001)Targeted Inactivation of GaI Does Not AlterCardiac Function or β-Adrenergic Sensitivity(GaI的靶向滅活沒有改變心臟功能或β-腎上腺素敏感性)AM.J.PHYSIOL.280569H-575。
7.Kanehisa(1984)NUC.ACIDS RES.12203-213。
8.Kasinathan P，(2001)等，Effect of Fibroblast Donor CellAge and Cell Cycle on Development of Bovine Nuclear TransferEmbryos In Vitro(成纖維細(xì)胞供體細(xì)胞年齡和細(xì)胞周期對體外牛核移植胚胎發(fā)育的影響)BIOL REPROD.；64(5)1487-1493。
9.Kasinathan P，(2001)等，Production of Calves from G1Fibroblasts(從G1成纖維細(xì)胞生產(chǎn)小牛)NATURE BIOTECH；191176-1178。
10.Kerr等，NAT.BIOTECHNOL.1675-79，1998。
11.Lim，S等(1997)A Shortened Life Span of EKLF-/-AdultErythrocytes，Due to a Deficiency of Beta-Globin Chains，isAmeliorated by Human Gamma-Globin Chains(由于β-球蛋白鏈的缺陷，通過人γ-球蛋白鏈來改善EKLF-/-成熟紅細(xì)胞縮短的生命期限)BLOOD 90291-1299。
12.Meng L等(1997)Rhesus Monkeys Produced by Nuclear Transfer(通過核移植產(chǎn)生的恒河猴)BIOL REPROD.Aug；57(2)454-9。
13.Mortensen，R等(1992)Production of Homozygous Mutant ESCells with a Single Targeting Construct(用單個(gè)靶向構(gòu)建體生產(chǎn)純合突變體ES細(xì)胞)MOL.CELL.BIOL.12，2391-2395。
14.Nagy，A等(1996)Targeted MutagenesisAnalysis of PhenotypeWithout Germ-Line Transmission(靶向突變無種系傳送的表型分析)J.CLIN.INVEST.971360-1365。
15.Ongeri EM等(2001)Development of Goat Embryos After In vitroFertilization and Parthenogenetic Activation by DifferentMethods(通過不同方法體外受精和單性生殖激活后山羊胚胎的發(fā)育)THERIOGENOLOGY Jun 1；55(9)1933-45。
16.Paris等，BIOTECHNOL.APPL.BIOCHEM.12436-449(1990)。
17.REMINGTON′S PHARMACEUTICAL SCIENCES(第16版，Osol，A編輯，Mack，Easton Press.(1980))。
18.Sakai，E等(1999)Recombination And Transcription of TheEndogenous Ig Heavy Chain Locus Is Effected by the Ig Heavy ChainIntronic Enhancer Core Region In the Absence of the MatrixAttachment Regions(內(nèi)源Ig重鏈基因座的重組和轉(zhuǎn)錄在基質(zhì)附著區(qū)不存在下受到Ig重鏈內(nèi)含子增強(qiáng)子核心區(qū)的影響)PROC.NATL.ACAD.SCI.U.S.A.961526-1531。
19.Sambrook等，MOLECULAR CLONING--A LABORATORY MANUAL，ColdSpring Harbor Laboratory Press，(第2版)1989。
20.Watson等，(1987)THE MOLECULAR BIOLOGY OF THE GENE(第4版)，第1&2卷，Benjamin，Menlo Park，Calif。
21.Wilmut I等，(2002)Somatic Cell Nuclear Transfer(體細(xì)胞核移植)NATURE Oct 10；419(6907)583-6。
22.Wilmut I等，(1997)Viable Offspring Derived From Fetal andAdult Mammalian Cells(源自胎和成熟哺乳動(dòng)物細(xì)胞的有生活力的后代)NATURE Feb 27；385(6619)10-3。
23.Wold F等，In vivo Chemical Modification of Proteins(蛋白質(zhì)的體內(nèi)化學(xué)修飾)ANN.REV.BIOCHEM.50 783-814(1981)。
24.Wright等，High Level Expression of Active Humanalpha-l-Antitrypsin in the Milk of Transgenic Sheep(活性的人α-1-抗胰蛋白酶在轉(zhuǎn)基因綿羊奶中的高水平表達(dá))(1991)BIO/TECHNOLOGY，977-84。
25.Yong Z和L Yuqiang，(1998)Nuclear-Cytoplasmic In teractionand Development of Goat Embryos Reconstructed by NuclearTransplantationProduction of Goats by Serially CloningEmbryos(核-細(xì)胞質(zhì)的相互作用和通過核移植重建的山羊胚胎的發(fā)育通過連續(xù)克隆胚胎生產(chǎn)山羊)BIOL REPROD.；58266-269。
26.Zou X等，(2002)Generation of Cloned Goats(Capra Hircus)From Transfected Foetal Fibroblast Cells，The Effect of DonorCell Cycle(從轉(zhuǎn)染的胎成纖維細(xì)胞產(chǎn)生克隆的山羊(Capra Hircus)，供體細(xì)胞周期的影響)MOL REPROD DEV.；61164-172。
所引用的專利并引入作為參考1.Meade等，TRANSGENIC NON HUMAN MAMMAL MILK(轉(zhuǎn)基因非人哺乳動(dòng)物奶)美國專利5,750,172；授權(quán)公告日1998年5月12日。
2，Meade等，ISOLATION OF EXOGENOUS RECOMBINANT PROTEINSFROM THE MILK OF TRANSGENIC MAMMALS(從轉(zhuǎn)基因哺乳動(dòng)物奶中分離外源重組蛋白)美國專利4,873,316；授權(quán)公告日1989年10月10日。
3.Stice等，CLONING USING DONOR NUCLEI FROM PROLIFERATINGSOMATIC CELLS(使用增殖體細(xì)胞的供體核來克隆)美國專利5,945,577；授權(quán)公告日1999年8月31日。
4.Hurwitz等，美國專利5,648,2435.Meade等，美國專利5,827,6906.DiTullio等，美國專利5,843,7057.Clark等，美國專利5,322,7758.Garner等，美國專利5,639,9409.Deboer等，美國專利5,633,07610.Drohan等，美國專利5,589,604
序列表<110>GTC Biotherapeutics，Inc.
Meade，HarryCox，Geoffrey F.
<120>在轉(zhuǎn)基因哺乳動(dòng)物奶中生產(chǎn)融合蛋白的方法<130>GTC-220 PCT<150>60/500,910<151>2003-09-05<160>35<170>PatentIn version 3.2<210>1<211>2029<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白CDNA<300>
<308>基因庫登記號No.V01514<309>2002-01-11<313>(1)..(2029)<400>1atattgtgct tccaccactg ccaataacaa aataactagc aaccatgaag tgggtggaat 60caattttttt aattttccta ctaaatttta ctgaatccag aacactgcat agaaatgaat120atggaatagc ttccatattg gattcttacc aatgtactgc agagataagt ttagctgacc180tggctaccat attttttgcc cagtttgttc aagaagccac ttacaaggaa gtaagcaaaa240tggtgaaaga tgcattgact gcaattgaga aacccactgg agatgaacag tcttcagggt300gtttagaaaa ccagctacct gcctttctgg aagaactttg ccatgagaaa gaaattttgg360
agaagtacgg acattcagac tgctgcagcc aaagtgaaga gggaagacat aactgttttc 420ttgcacacaa aaagcccact ccagcatcga tcccactttt ccaagttcca gaacctgtca 480caagctgtga agcatatgaa gaagacaggg agacattcat gaacaaattc atttatgaga 540tagcaagaag gcatcccttc ctgtatgcac ctacaattct tctttgggct gctcgctatg 600acaaaataat tccatcttgc tgcaaagctg aaaatgcagt tgaatgcttc caaacaaagg 660cagcaacagt tacaaaagaa ttaagagaaa gcagcttgtt aaatcaacat gcatgtgcag 720taatgaaaaa ttttgggacc cgaactttcc aagccataac tgttactaaa ctgagtcaga 780agtttaccaa agttaatttt actgaaatcc agaaactagt cctggatgtg gcccatgtac 840atgagcactg ttgcagagga gatgtgctgg attgtctgca ggatggggaa aaaatcatgt 900cctacatatg ttctcaacaa gacactetgt caaacaaaat aacagaatgc tgcaaactga 960ccacgctgga acgtggtcaa tgtataattc atgcagaaaa tgatgaaaaa cctgaaggtc1020tatctccaaa tctaaacagg tttttaggag atagagattt taaccaattt tcttcagggg1080aaaaaaatat cttcttggca agttttgttc atgaatattc aagaagacat cctcagcttg1140ctgtctcagt aattctaaga gttgctaaag gataccagga gttattggag aagtgtttcc1200agactgaaaa ccctcttgaa tgccaagata aaggagaaga agaattacag aaatacatcc1260aggagagcca agcattggca aagcgaagct gcggcctctt ccagaaacta ggagaatatt1320acttacaaaa tgcgtttctc gttgcttaca caaagaaagc cccccagctg acctcgtcgg1380agctgatggc catcaccaga aaaatggcag ccacagcagc cacttgttgc caactcagtg1440aggacaaact attggcctgt ggcgagggag cggctgacat tattatcgga cacttatgta1500tcagacatga aatgactcca gtaaaccctg gtgttggcca gtgctgcact tcttcatatg1560ccaacaggag gccatgcttc agcagcttgg tggtggatga aacatatgtc cctcctgcat1620tctctgatga caagttcatt ttccataagg atctgtgcca agctcagggt gtagcgctgc1680
aaacgatgaa gcaagagttt ctcattaacc ttgtgaagca aaagccacaa ataacagagg 1740aacaacttga ggctgtcatt gcagatttct caggcctgtt ggagaaatgc tgccaaggcc 1800aggaacagga agtctgcttt gctgaagagg gacaaaaact gatttcaaaa actcgtgctg 1860ctttgggagt ttaaattact tcaggggaag agaagacaaa acgagtcttt cattcggtgt 1920gaacttttct ctttaatttt aactgattta acactttttg tgaattaatg aaatgataaa 1980gacttttatg tgagatttcc ttatcacaga aataaaatat ctccaaatg 2029<210>2<211>609<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因庫登記號No.V01514<309>1995-03-30<313>(1)..(609)<400>2Met Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr1 5 10 15Glu Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu20 25 30Asp Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr35 40 45Ile Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser
50 55 60Lys Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp65 70 75 80Glu Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu85 90 95Glu Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp100 105 110Cys Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His115 120 125Lys Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro130 135 140Val Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn145 150 155 160Lys Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro165 170 175Thr Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys180 185 190Cys Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr195 200 205Val Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys210 215 220Ala Val Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val
225 230 235 240Thr Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln245 250 255Lys Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly260 265 270Asp Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile275 280 285Cys Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys290 295 300Leu Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp305 310 315 320Glu Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp325 330 335Arg Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala340 345 350Ser Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser355 360 365Val Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys370 375 380Phe Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu385 390 395 400Leu Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys
405 410 415Gly Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu420 425 430Val Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met435 440 445Ala Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu450 455 460Ser Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile465 470 475 480Ile Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly485 490 495Val Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe500 505 510Ser Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp515 520 525Asp Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala530 535 540Leu Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys545 550 555 560Pro Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser565 570 575Gly Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe
580 585 590Ala Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly595 600 605Val<210>3<211>1776<212>PRT<213>智人<300>
<308>基因庫登記號No.V01514<309>2002-01-11<313>(99)..(1874)<400>3Ala Gly Ala Ala Cys Ala Cys Thr Gly Cys Ala Thr Ala Gly Ala Ala1 5 10 15Ala Thr Gly Ala Ala Thr Ala Thr Gly Gly Ala Ala Thr Ala Gly Cys20 25 30Thr Thr Cys Cys Ala Thr Ala Thr Thr Gly Gly Ala Thr Thr Cys Thr35 40 45Thr Ala Cys Cys Ala Ala Thr Gly Thr Ala Cys Thr Gly Cys Ala Gly50 55 60Ala Gly Ala Thr Ala Ala Gly Thr Thr Thr Ala Gly Cys Thr Gly Ala65 70 75 80Cys Cys Thr Gly Gly Cys Thr Ala Cys Cys Ala Thr Ala Thr Thr Thr
85 90 95Thr Thr Thr Gly Cys Cys Cys Ala Gly Thr Thr Thr Gly Thr Thr Cys100 105 110Ala Ala Gly Ala Ala Gly Cys Cys Ala Cys Thr Thr Ala Cys Ala Ala115 120 125Gly Gly Ala Ala Gly Thr Ala Ala Gly Cys Ala Ala Ala Ala Thr Gly130 135 140Gly Thr Gly Ala Ala Ala Gly Ala Thr Gly Cys Ala Thr Thr Gly Ala145 150 155 160Cys Thr Gly Cys Ala Ala Thr Thr Gly Ala Gly Ala Ala Ala Cys Cys165 170 175Cys Ala Cys Thr Gly Gly Ala Gly Ala Thr Gly Ala Ala Cys Ala Gly180 185 190Thr Cys Thr Thr Cys Ala Gly Gly Gly Thr Gly Thr Thr Thr Ala Gly195 200 205Ala Ala Ala Ala Cys Cys Ala Gly Cys Thr Ala Cys Cys Thr Gly Cys210 215 220Cys Thr Thr Thr Cys Thr Gly Gly Ala Ala Gly Ala Ala Cys Thr Thr225 230 235 240Thr Gly Cys Cys Ala Thr Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala245 250 255Thr Thr Thr Thr Gly Gly Ala Gly Ala Ala Gly Thr Ala Cys Gly Gly
260 265 270Ala Cys Ala Thr Thr Cys Ala Gly Ala Cys Thr Gly Cys Thr Gly Cys275 280 285Ala Gly Cys Cys Ala Ala Ala Gly Thr Gly Ala Ala Gly Ala Gly Gly290 295 300Gly Ala Ala Gly Ala Cys Ala Thr Ala Ala Cys Thr Gly Thr Thr Thr305 310 315 320Thr Cys Thr Thr Gly Cys Ala Cys Ala Cys Ala Ala Ala Ala Ala Gly325 330 335Cys Cys Cys Ala Cys Thr Cys Cys Ala Gly Cys Ala Thr Cys Gly Ala340 345 350Thr Cys Cys Cys Ala Cys Thr Thr Thr Thr Cys Cys Ala Ala Gly Thr355 360 365Thr Cys Cys Ala Gly Ala Ala Cys Cys Thr Gly Thr Cys Ala Cys Ala370 375 380Ala Gly Cys Thr Gly Thr Gly Ala Ala Gly Cys Ala Thr Ala Thr Gly385 390 395 400Ala Ala Gly Ala Ala Gly Ala Cys Ala Gly Gly Gly Ala Gly Ala Cys405 410 415Ala Thr Thr Cys Ala Thr Gly Ala Ala Cys Ala Ala Ala Thr Thr Cys420 425 430Ala Thr Thr Thr Ala Thr Gly Ala Gly Ala Thr Ala Gly Cys Ala Ala
435 440 445Gly Ala Ala Gly Gly Cys Ala Thr Cys Cys Cys Thr Thr Cys Cys Thr450 455 460Gly Thr Ala Thr Gly Cys Ala Cys Cys Thr Ala Cys Ala Ala Thr Thr465 470 475 480Cys Thr Thr Cys Thr Thr Thr Gly Gly Gly Cys Thr Gly Cys Thr Cys485 490 495Gly Cys Thr Ala Thr Gly Ala Cys Ala Ala Ala Ala Thr Ala Ala Thr500 505 5l0Thr Cys Cys Ala Thr Cys Thr Thr Gly Cys Thr Gly Cys Ala Ala Ala515 520 525Gly Cys Thr Gly Ala Ala Ala Ala Thr Gly Cys Ala Gly Thr Thr Gly530 535 540Ala Ala Thr Gly Cys Thr Thr Cys Cys Ala Ala Ala Cys Ala Ala Ala545 550 555 560Gly Gly Cys Ala Gly Cys Ala Ala Cys Ala Gly Thr Thr Ala Cys Ala565 570 575Ala Ala Ala Gly Ala Ala Thr Thr Ala Ala Gly Ala Gly Ala Ala Ala580 585 590Gly Cys Ala Gly Cys Thr Thr Gly Thr Thr Ala Ala Ala Thr Cys Ala595 600 605Ala Cys Ala Thr Gly Cys Ala Thr Gly Thr Gly Cys Ala Gly Thr Ala
610 615 620Ala Thr Gly Ala Ala Ala Ala Ala Thr Thr Thr Thr Gly Gly Gly Ala625 630 635 640Cys Cys Cys Gly Ala Ala Cys Thr Thr Thr Cys Cys Ala Ala Gly Cys645 650 655Cys Ala Thr Ala Ala Cys Thr Gly Thr Thr Ala Cys Thr Ala Ala Ala660 665 670Cys Thr Gly Ala Gly Thr Cys Ala Gly Ala Ala Gly Thr Thr Thr Ala675 680 685Cys Cys Ala Ala Ala Gly Thr Thr Ala Ala Thr Thr Thr Thr Ala Cys690 695 700Thr Gly Ala Ala Ala Thr Cys Cys Ala Gly Ala Ala Ala Cys Thr Ala705 710 715 720Gly Thr Cys Cys Thr Gly Gly Ala Thr Gly Thr Gly Gly Cys Cys Cys725 730 735Ala Thr Gly Thr Ala Cys Ala Thr Gly Ala Gly Cys Ala Cys Thr Gly740 745 750Thr Thr Gly Cys Ala Gly Ala Gly Gly Ala Gly Ala Thr Gly Thr Gly755 760 765Cys Thr Gly Gly Ala Thr Thr Gly Thr Cys Thr Gly Cys Ala Gly Gly770 775 780Ala Thr Gly Gly Gly Gly Ala Ala Ala Ala Ala Ala Thr Cys Ala Thr
785 790 795 800Gly Thr Cys Cys Thr Ala Cys Ala Thr Ala Thr Gly Thr Thr Cys Thr805 810 815Cys Ala Ala Cys Ala Ala Gly Ala Cys Ala Cys Thr Cys Thr Gly Thr820 825 830Cys Ala Ala Ala Cys Ala Ala Ala Ala Thr Ala Ala Cys Ala Gly Ala835 840 845Ala Thr Gly Cys Thr Gly Cys Ala Ala Ala Cys Thr Gly Ala Cys Cys850 855 860Ala Cys Gly Cys Thr Gly Gly Ala Ala Cys Gly Thr Gly Gly Thr Cys865 870 875 880Ala Ala Thr Gly Thr Ala Thr Ala Ala Thr Thr Cys Ala Thr Gly Cys885 890 895Ala Gly Ala Ala Ala Ala Thr Gly Ala Thr Gly Ala Ala Ala Ala Ala900 905 9l0Cys Cys Thr Gly Ala Ala Gly Gly Thr Cys Thr Ala Thr Cys Thr Cys915 920 925Cys Ala Ala Ala Thr Cys Thr Ala Ala Ala Cys Ala Gly Gly Thr Thr930 935 940Thr Thr Thr Ala Gly Gly Ala Gly Ala Thr Ala Gly Ala Gly Ala Thr945 950 955 960Thr Thr Thr Ala Ala Cys Cys Ala Ala Thr Thr Thr Thr Cys Thr Thr
965 970 975Cys Ala Gly Gly Gly Gly Ala Ala Ala Ala Ala Ala Ala Thr Ala Thr980 985 990Cys Thr Thr Cys Thr Thr Gly Gly Cys Ala Ala Gly Thr Thr Thr Thr995 10001005Gly Thr Thr Cys Ala Thr Gly Ala Ala Thr Ala Thr Thr Cys Ala101010151020Ala Gly Ala Ala Gly Ala Cys Ala Thr Cys Cys Thr Cys Ala Gly102510301035Cys Thr Thr Gly Cys Thr Gly Thr Cys Thr Cys Ala Gly Thr Ala104010451050Ala Thr Thr Cys Thr Ala Ala Gly Ala Gly Thr Thr Gly Cys Thrl05510601065Ala Ala Ala Gly Gly Ala Thr Ala Cys Cys Ala Gly Gly Ala Gly107010751080Thr Thr Ala Thr Thr Gly Gly Ala Gly Ala Ala Gly Thr Gly Thr108510901095Thr Thr Cys Cys Ala Gly Ala Cys Thr Gly Ala Ala Ala Ala Cys110011051110Cys Cys Thr Cys Thr Thr Gly Ala Ala Thr Gly Cys Cys Ala Ala111511201125Gly Ala Thr Ala Ala Ala Gly Gly Ala Gly Ala Ala Gly Ala Ala
113011351140Gly Ala Ala Thr Thr Ala Cys Ala Gly Ala Ala Ala Thr Ala Cys114511501155Ala Thr Cys Cys Ala Gly Gly Ala Gly Ala Gly Cys Cys Ala Ala116011651170Gly Cys Ala Thr Thr Gly Gly Cys Ala Ala Ala Gly Cys Gly Ala117511801185Ala Gly Cys Thr Gly Cys Gly Gly Cys Cys Thr Cys Thr Thr Cys119011951200Cys Ala Gly Ala Ala Ala Cys Thr Ala Gly Gly Ala Gly Ala Ala120512101215Thr Ala Thr Thr Ala Cys Thr Thr Ala Cys Ala Ala Ala Ala Thr122012251230Gly Cys Gly Thr Thr Thr Cys Thr Cys Gly Thr Thr Gly Cys Thr123512401245Thr Ala Cys Ala Cys Ala Ala Ala Gly Ala Ala Ala Gly Cys Cys125012551260Cys Cys Cys Cys Ala Gly Cys Thr Gly Ala Cys Cys Thr Cys Gly126512701275Thr Cys Gly Gly Ala Gly Cys Thr Gly Ala Thr Gly Gly Cys Cys128012851290Ala Thr Cys Ala Cys Cys Ala Gly Ala Ala Ala Ala Ala Thr Gly
129513001305Gly Cys Ala Gly Cys Cys Ala Cys Ala Gly Cys Ala Gly Cys Cys131013151320Ala Cys Thr Thr Gly Thr Thr Gly Cys Cys Ala Ala Cys Thr Cys132513301335Ala Gly Thr Gly Ala Gly Gly Ala Cys Ala Ala Ala Cys Thr Ala134013451350Thr Thr Gly Gly Cys Cys Thr Gly Thr Gly Gly Cys Gly Ala Gly135513601365Gly Gly Ala Gly Cys Gly Gly Cys Thr Gly Ala Cys Ala Thr Thr137013751380Ala Thr Thr Ala Thr Cys Gly Gly Ala Cys Ala Cys Thr Thr Ala138513901395Thr Gly Thr Ala Thr Cys Ala Gly Ala Cys Ala Thr Gly Ala Ala140014051410Ala Thr Gly Ala Cys Thr Cys Cys Ala Gly Thr Ala Ala Ala Cys141514201425Cys Cys Thr Gly Gly Thr Gly Thr Thr Gly Gly Cys Cys Ala Gly143014351440Thr Gly Cys Thr Gly Cys Ala Cys Thr Thr Cys Thr Thr Cys Ala144514501455Thr Ala Thr Gly Cys Cys Ala Ala Cys Ala Gly Gly Ala Gly Gly
146014651470Cys Cys Ala Thr Gly Cys Thr Thr Cys Ala Gly Cys Ala Gly Cys147514801485Thr Thr Gly Gly Thr Gly Gly Thr Gly Gly Ala Thr Gly Ala Ala149014951500Ala Cys Ala Thr Ala Thr Gly Thr Cys Cys Cys Thr Cys Cys Thr150515101515Gly Cys Ala Thr Thr Cys Thr Cys Thr Gly Ala Thr Gly Ala Cys152015251530Ala Ala Gly Thr Thr Cys Ala Thr Thr Thr Thr Cys Cys Ala Thr153515401545Ala Ala Gly Gly Ala Thr Cys Thr Gly Thr Gly Cys Cys Ala Ala155015551560Gly Cys Thr Cys Ala Gly Gly Gly Thr Gly Thr Ala Gly Cys Gly156515701575Cys Thr Gly Cys Ala Ala Ala Cys Gly Ala Thr Gly Ala Ala Gly158015851590Cys Ala Ala Gly Ala Gly Thr Thr Thr Cys Thr Cys Ala Thr Thr159516001605Ala Ala Cys Cys Thr Thr Gly Thr Gly Ala Ala Gly Cys Ala Ala161016151620Ala Ala Gly Cys Cys Ala Cys Ala Ala Ala Thr Ala Ala Cys Ala
162516301635Gly Ala Gly Gly Ala Ala Cys Ala Ala Cys Thr Thr Gly Ala Gly164016451650Gly Cys Thr Gly Thr Cys Ala Thr Thr Gly Cys Ala Gly Ala Thr165516601665Thr Thr Cys Thr Cys Ala Gly Gly Cys Cys Thr Gly Thr Thr Gly167016751680Gly Ala Gly Ala Ala Ala Thr Gly Cys Thr Gly Cys Cys Ala Ala168516901695Gly Gly Cys Cys Ala Gly Gly Ala Ala Cys Ala Gly Gly Ala Ala170017051710Gly Thr Cys Thr Gly Cys Thr Thr Thr Gly Cys Thr Gly Ala Ala171517201725Gly Ala Gly Gly Gly Ala Cys Ala Ala Ala Ala Ala Cys Thr Gly173017351740Ala Thr Thr Thr Cys Ala Ala Ala Ala Ala Cys Thr Cys Gly Thr174517501755Gly Cys Thr Gly Cys Thr Thr Thr Gly Gly Gly Ala Gly Thr Thr176017651770Thr Ala Ala1775<210>4
<211>591<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因庫登記號No.V01514<309>1995-03-30<313>(19)..(609)<400>4Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp Ser1 5 10 15Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile Phe20 25 30Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys Met35 40 45Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu Gln50 55 60Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu Leu65 70 75 80Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys Cys85 90 95Ser Gln Ser Glu Glu Gly Arg His Ash Cys Phe Leu Ala His Lys Lys100 105 110
Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro Val Thr115 120 125Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys Phe130 135 140Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr Ile145 150 155 160Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys Lys165 170 175Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val Thr180 185 190Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys Ala Val195 200 205Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val Thr Lys210 215 220Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys Leu225 230 235 240Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp Val245 250 255Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys Ser260 265 270Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu Thr275 280 285
Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu Lys290 295 300Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg Asp305 310 315 320Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser Phe325 330 335Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val Ile340 345 350Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe Gln355 360 365Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu Gln370 375 380Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly Leu385 390 395 400Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val Ala405 410 415Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala Ile420 425 430Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser Glu435 440 445Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile Gly450 455 460
His Leu Cys Ile Arg His Glu Met Thr Pro Val Ash Pro Gly Val Gly465 470 475 480Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser Ser485 490 495Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp Lys500 505 510Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu Gln515 520 525Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro Gln530 535 540Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly Leu545 550 555 560Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala Glu565 570 575Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val580 585 590<210>5<211>1830<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白片段<300>
<308>基因庫登記號No.V01514
<309>2002-01-11<313>(45)..(1874)<400>5atgaagtggg tggaatcaat ttttttaatt ttcctactaa attttactga atccagaaca 60ctgcatagaa atgaatatgg aatagcttcc atattggatt cttaccaatg tactgcagag120ataagtttag ctgacctggc taccatattt tttgcccagt ttgttcaaga agccacttac180aaggaagtaa gcaaaatggt gaaagatgca ttgactgcaa ttgagaaacc cactggagat240gaacagtctt cagggtgttt agaaaaccag ctacctgcct ttctggaaga actttgccat300gagaaagaaa ttttggagaa gtacggacat tcagactgct gcagccaaag tgaagaggga360agacataact gttttcttgc acacaaaaag cccactccag catcgatccc acttttccaa420gttccagaac ctgtcacaag ctgtgaagca tatgaagaag acagggagac attcatgaac480aaattcattt atgagatagc aagaaggcat cccttcctgt atgcacctac aattcttctt540tgggctgctc gctatgacaa aataattcca tcttgctgca aagctgaaaa tgcagttgaa600tgcttccaaa caaaggcagc aacagttaca aaagaattaa gagaaagcag cttgttaaat660caacatgcat gtgcagtaat gaaaaatttt gggacccgaa ctttccaagc cataactgtt720actaaactga gtcagaagtt taccaaagtt aattttactg aaatccagaa actagtcctg780gatgtggccc atgtacatga gcaetgttgc agaggagatg tgctggattg tctgcaggat840ggggaaaaaa tcatgtccta catatgttct caacaagaca ctctgtcaaa caaaataaca900gaatgctgca aactgaccac gctggaacgt ggtcaatgta taattcatgc agaaaatgat960gaaaaacctg aaggtctatc tccaaatcta aacaggtttt taggagatag agattttaac 1020caattttctt caggggaaaa aaatatcttc ttggcaagtt ttgttcatga atattcaaga 1080agacatcctc agcttgctgt ctcagtaatt ctaagagttg ctaaaggata ccaggagtta 1140ttggagaagt gtttccagac tgaaaaccct cttgaatgcc aagataaagg agaagaagaa 1200
ttacagaaat acatccagga gagccaagca ttggcaaagc gaagctgcgg cctcttccag 1260aaactaggag aatattactt acaaaatgcg tttctcgttg cttacacaaa gaaagccccc 1320cagctgacct cgtcggagct gatggccatc accagaaaaa tggcagccac agcagccact 1380tgttgccaac tcagtgagga caaactattg gcctgtggcg agggagcggc tgacattatt 1440atcggacact tatgtatcag acatgaaatg actccagtaa accctggtgt tggccagtgc 1500tgcacttctt catatgccaa caggaggcca tgcttcagca gcttggtggt ggatgaaaca 1560tatgtccctc ctgcattctc tgatgacaag ttcattttcc ataaggatct gtgccaagct 1620cagggtgtag cgctgcaaac gatgaagcaa gagtttctca ttaaccttgt gaagcaaaag 1680ccacaaataa cagaggaaca acttgaggct gtcattgcag atttctcagg cctgttggag 1740aaatgctgcc aaggccagga acaggaagtc tgctttgctg aagagggaca aaaactgatt 1800tcaaaaactc gtgctgcttt gggagtttaa 1830<210>6<211>591<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因庫登記號No.V01514<309>1995-03-30<313>(19)..(609)<400>6Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp Ser15 10 15
Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile Phe20 25 30Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys Met35 40 45Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu Gln50 55 60Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu Leu65 70 75 80Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys Cys85 90 95Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys Lys100 105 110Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro Val Thr115 120 125Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys Phe130 135 140Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr Ile145 150 155 160Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys Lys165 170 175Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val Thr180 185 190
Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys Ala Val195 200 205Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val Thr Lys210 215 220Leu Ser Gln Lys Phe Thr Lys Val Gln Phe Thr Glu Ile Gln Lys Leu225 230 235 240Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp Val245 250 255Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys Ser260 265 270Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu Thr275 280 285Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu Lys290 295 300Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg Asp305 310 315 320Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser Phe325 330 335Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val Ile340 345 350Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe Gln355 360 365
Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu Gln370 375 380Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly Leu385 390 395 400Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val Ala405 410 415Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala Ile420 425 430Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser Glu435 440 445Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile Gly450 455 460His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val Gly465 470 475 480Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser Ser485 490 495Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp Lys500 505 510Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu Gln515 520 525Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro Gln530 535 540
Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly Leu545 550 555 560Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala Glu565 570 575Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val580 585 590<210>7<211>18<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因庫登記號No.V01514<309>1995-03-30<313>(1)..(18)<400>7Met Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr1 5 10 15Glu Ser<210>8<211>54<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白片段<300>
<308>基因庫登記號No.V01514<309>2002-01-11<313>(45)..(98)<400>8atgaagtggg tggaatcaat ttttttaatt ttcctactaa attttactga atcc 54<210>9<211>27553<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白基因組DNA序列<300>
<308>基因庫登錄號No.M16110<309>1997-06-03<313>(1)..(27553)<400>9gaattcccaa tatctagtat tttctactat taaactttgt gcctcttcaa aactgcattt 60tctctcattc cctaagtgtg cattgttttc ccttaccggt tggtttttcc accacctttt120acattttcct ggaacactat accctccctc ttcatttggc ccacctctaa ttttctttca180gatctccatg aagatgttac ttcctccagg aagccttatc tgacccctcc aaagatgtca240tgagttcctc ttttcattct actaatcaca gcatccatca caccatgttg tgattactga300tactattgtc tgtttctctg attaggcagt aagctcaaca agagctacat ggtgcctgtc360tcttgttgct gattattccc atccaaaaac agtgcctgga atgcagactt aacattttat420tgaatgaata aataaaaccc catctatcga gtgctacttt gtgcaagacc cggttctgag480
gcatttatat ttattgattt atttaattct catttaacca tgaaggaggt actatcacta540tccttatttt atagttgata aagataaagc ccagagaaat gaattaactc acccaaagtc600atgtagctaa gtgacagggc aaaaattcaa accagttccc caactttacg tgattaatac660tgtgctatac tgcctctctg atcatatggc atggaatgca gacatctgct ccgtaaggca720gaatatggaa ggagattgga ggatgacaca aaaccagcat aatatcagag gaaaagtcca780aacaggacct gaactgatag aaaagttgtt actcctggtg tagtcgcatc gacatcttga840tgaactggtg gctgacacaa catacattgg cttgatgtgt acatattatt tgtagttgtg900tgtgtatttt tatatatata tttgtaatat tgaaatagtc ataatttact aaaggcctac960catttgccag gcatttttac atttgtcccc tctaatcttt tgatgagatg atcagattgg 1020attacttggc cttgaagatg atatatctac atctatatct atatctatat ctatatctat 1080atctatatct atatctatat ctatatatgt atatcagaaa agctgaaata tgttttgtaa 1140agttataaag atttcagact ttatagaatc tgggatttgc caaatgtaac ccctttctct 1200acattaaacc catgttggaa caaatacatt tattattcat tcatcaaatg ttgctgagtc 1260ctggctatga accagacact gtgaaagcct ttgggatatt ttgcccatgc ttgggcaagc 1320ttatatagtt tgcttcataa aactctattt cagttcttca taactaatac ttcatgacta 1380ttgcttttca ggtattcctt cataacaaat actttggctt tcatatattt gagtaaagtc 1440ccccttgagg aagagtagaa gaactgcact ttgtaaatac tatcctggaa tccaaacgga 1500tagacaagga tggtgctacc tctttctgga gagtacgtga gcaaggcctg ttttgttaac 1560atgttcctta ggagacaaaa cttaggagag acacgcatag cagaaaatgg acaaaaacta 1620acaaatgaat gggaattgta cttgattagc attgaagacc ttgtttatac tatgataaat 1680gtttgtattt gctggaagtg ctactgacgg taaacccttt ttgtttaaat gtgtgcccta 1740gtagcttgca gtatgatcta ttttttaagt actgtactta gcttatttaa aaattttatg 1800
tttaaaattg catagtgctc tttcattgaa gaagttttga gagagagata gaattaaatt1860cacttatctt accatctaga gaaacccaat gttaaaactt tgttgtccat tatttctgtc1920ttttattcaa catttttttt agagggtggg aggaatacag aggaggtaca atgatacaca1980aatgagagca ctctccatgt attgttttgt cctgtttttc agttaacaat atattatgag2040catatttcca tttcattaaa tattcttcca caaagttatt ttgatggctg tatatcaccc2100tactttatga atgtaccata ttaatttatt tcctggtgtg ggttatttga ttttataatc2160ttacctttag aataatgaaa cacctgtgaa gctttagaaa atactggtgc ctgggtctca2220actccacaga ttctgattta actggtctgg gttacagact aggcattggg aattcaaaaa2280gttcccccag tgattctaat gtgtagccaa gatcgggaac ccttgtagac agggatgata2340ggaggtgagc cactcttagc atccatcatt tagtattaac atcatcatct tgagttgcta2400agtgaatgat gcacctgacc cactttataa agacacatgt gcaaataaaa ttattatagg2460acttggttta ttagggcttg tgctctaagt tttctatgtt aagccataca tcgcatacta2520aatactttaa aatgtacctt attgacatac atattaagtg aaaagtgttt ctgagctaaa2580caatgacagc ataattatca agcaatgata atttgaaatg aatttattat tctgcaactt2640agggacaagt catctctctg aattttttgt actttgagag tatttgttat atttgcaaga2700tgaagagtct gaattggtca gacaatgtct tgtgtgcctg gcatatgata ggcatttaat2760agttttaaag aattaatgta tttagatgaa ttgcatacca aatctgctgt cttttcttta2820tggcttcatt aacttaattt gagagaaatt aattattctg caacttaggg acaagtcatg2880tctttgaata ttctgtagtt tgaggagaat atttgttata tttgcaaaat aaaataagtt2940tgcaagtttt ttttttctgc cccaaagagc tctgtgtcct tgaacataaa atacaaataa3000ccgctatgct gttaattatt ggcaaatgtc ccattttcaa cctaaggaaa taccataaag3060taacagatat accaacaaaa ggttactagt taacaggcat tgcctgaaaa gagtataaaa3120
gaatttcagc atgattttcc atattgtgct tccaccactg ccaataacaa aataactagc3180aaccatgaag tgggtggaat caattttttt aattttccta ctaaatttta ctgaatccag3240aacactgcat agaaatgaat atggaatagg tgagatattt tgtgtttttc ttgtcttttc3300tctatatcaa aattttttaa attataaaat ttgcattaat ttgtcttgat ttattattca3360tatttattat tccacatgga gaaaaaatat ttaactgatg gatatattta aatgaaagaa3420aaacttgtaa ctttacaaga ggtttacaaa gttatagcag tgtttaatgg atgaatggtt3480tgtatgtttc atgttgaatt aatttttaca cttcaatggt atgcatatta actttgaaaa3540attatatata tacacatata tgtacatata tatgaatata aataaaattt tatatgtgaa3600gaagccagaa ttatgctcct tcacataact ccctcagact agtaaaatag ataaaatctt3660tgtttttaat acagaaaaat gggtcattat ttgatggtct gaagaagaaa tattgtgact3720gggatatgaa tggcaaaccg tagtacaact atgttcaaaa gaatgcctga aatatatttt3780taaccatttg actttcagga cagttacagc actacagtac agggaaaaac caaacaactg3840gaagacaaaa tctggatttt agtgataggt ctactataaa ttatgcttgt taacttcatt3900ccttagtttc ctagttttct tttcctcaag tataaaatta agatgcttag gttatcccta3960atgttctttt aattctgaaa ctgtacagtt ctaactgaaa cacaaacatt catatgtaac4020aatgattact ttcttggttg cagttgaaaa cacgtttcat gaagtttatt ttgccttcca4080gcttccatat tggattctta ccaatgtact gcagagataa gtttagctga cctgtaagtt4140ttgcttatat aaatgtactt taaatgtgta aagcaaggat aagtaaatac ttaaataaaa4200ttgggtaccc ctgtgagctc ttaaaagcac aaaagcaatt tggacaattt caagaaaagt4260tactcatact gaatatcaac ttgatgttga agaggttaaa ctgttgacta atgtcttcga4320cattgacctt ttgattcctt gaaatctcat gagtcaaacc aaatcagatt ttagaaactg4380aagattagtg tctgatcagt gacaaccata tactaattca ggaatttttc tcatcagtac4440
caacagggtg atattataat gttttctttt ctgtatacta tttaaatctt agcagcaaac4500cataggtgat aaaatattct atttgctgtt atttgtggag agtatgttag tctcttggat4560gtctttccat tccacatttt aaaaatttct aacaaagaat ttaaagtagt gtgttgctgt4620tactccttgc acatccaaac ctgcataagg attgctttga gtcaatccat gagcactgta4680gtcttgggtt ttagaccttg atcatactgg gaatagacac tgttagaggt ctgtctaatt4740accaattttt ttttgcttaa atttaaaagt aaccataaag aatatagata ccctcaatta4800tgggtacatt acagtagatg gatggtcaca gaaggagaaa ccactcttat gggaaatcca4860cttattttag cctttaacat ctatatgtat atttatggca aaagaaaaca agaaaaagac4920taaagtttct tctcagatga cctggaagct aattttacat aattttacaa atcaaatgtc4980taaacagatt acaacataaa tagaaaacaa aacaaacaaa tgaaaaacta tacttgagaa5040aaataagctt gctgcaggtc tgttccttaa ggattcacac gtatttttgt ttcagggcta5100ccatattttt tgcccagttt gttcaagaag ccacttacaa ggaagtaagc aaaatggtga5160aagatgcatt gactgcaatt gagaaaccca ctggagatga acagtcttca gggtgtttag5220aaaaccaggt gagtgaataa ttttaaaaaa gcattgtgat atttgacaaa aatttagcat5280gctgaagaga agatacaaaa atagcagtga aaaatgcatt taaatatttg aagagctatt5340gtatgaaaga gggattagat tcattctgaa ttgctaaaga gggcagaaga gaacaatagg5400tagttattat aaagagacca tataaatatg atgaactaag gttctgaaat aagattatct5460tgatgactat gggcatatta acttttttga gcttcagttt tcttatctgt aaaataaggg5520atgataatag ctcccatttc atagttagca tggaaattga tataacagca atagtagcta5580acttttatta tacacacaat gtgactggca ttattctagg gagcataatg tgtatattga5640taataaaaat attttatgac ataggggata gatagcactg atgaatcaga atggttgtcc5700agtgagtcaa gagatgctgg ctcgggcttc tgggcaggat atcagctttg cttacctata5760
tttatttatt aaacatttaa aataatcctt gaagatagat gctaatcttc caactgagga5820agctgaggct cagagaattt aagtaacttt cttatgggaa ccaccaaatg gcagagccag5880gatttgaact agaccatctg gcttaaaatt gacagtctta gtagcttcat tacactataa5940ctatagtgaa tgtaagatgc atagcacatc gttagggttg ccaggtttag caaacaacaa6000caaaacataa tacccagttc aatctgaatt ttagataaac actaaatact tttcttagta6060taaggatatt tcattgtaga agctcaacaa ataatattta ttatttattt tatctcaaca6120tagaaacaaa cttgataatg attagaactc tccaattata aaacaacatg cccagagaat6180actctgttat ggtggggtta attaggtggc tgaaagacaa tgtacctgga atatcataga6240agagatgctc ctttaaggat atagtttaag ttctttccaa ctttgaaatt tatgaattga6300caaaaatttc tgttttgcat ctctattttt gtcttgttct gataatcttt tcaaaatgtg6360tataaaaaaa caagaataca ttatctattg caactttaca accaattaga ggttcaaggt6420aatgttacag atcgctgatt tattcttgta aattcaaagg tatgtctttt aaatgaggat6480tgggaattag aaatcttacg taagccttcc aggattctct aaatattact gtagcagcta6540taaaagctac ataaaagttc cctcagatac atgaaacaca tgtattcctc agatgctttc6600tgtggaatat tgatgctgtc atctgagttt ggtaagggta agtcacagag gaggaaacac6660atacatttta aaacatttta gctaaatatg taattgtggc caagaaaagt gtttttttaa6720aaaataatta tttcatttca aaatcatttt tatttataat tgaaaataat atgcagtttt6780ttattgtctt gtaaggatgg catgtaaaat gagcatttat gtctgaaatg tggtatgtct6840gtgtgtgtgt gtgtatatgt atatatgtat gtatatacca taatatatac atatgtattt6900gcaattccaa aagttacatc tttaatgaga atcatgaaaa tattattttg ctcagtttct6960ttttttattt aaatttaaat ttaaagttct ggtgtacacg ggcaggatga gcaggtctgt7020tacataggta aacacgtggc atggtggttt gctgcaccta ccaacctgtt gcctgggtat7080
taagcccagc gtgcattacc tatttttcct aatgctctcc ctccctgcac tccactccct7140gacaggcccc agtgtgtgct gtttccctcc ctgtgtccat gaaacatggt ttatatattt7200ataaaagttt atatatccta gtccaaattt ttgataacac aaaaaggaaa aataaaataa7260ttcaaaattg ggaaagagaa acaaaagatt gcatggcttt tttcctttta ttgtttggac7320attaaagtct cattttccat aaggcagcaa agaaatctat ttcatcaggc tgaaacaaaa7380tacattagaa tttgtatgga aaatttttca gaatctatag ttctgatttt agacattaga7440aaatgtttca tgtgtcttat agatttttaa agcaaagtta gttgtctttc tccaaacata7500aaatatttct tatagctacc tgcctttctg gaagaacttt gccatgagaa agaaattttg7560gagaagtacg gacattcaga ctgctgcagc caaagtgaag agggaagaca taactgtttt7620cttgcacaca aaaagcccac tccagcatcg atcccacttt tccaagttcc agaacctgtc7680acaagctgtg aagcatatga agaagacagg gagacattca tgaacaagta aggatccagt7740ttaaaggtag atgcaaacct cagaaacaca gcaatggcaa gcctaattta gtatttttgc7800aatgtactca tgtactccca gtaagaggta taatgtttct ttggtgttgt gtctgctgag7860gtcccaggca aggtaattag gagagcaaca ttcaatgtaa cttggtttcc atagcacgct7920agatgtagta caaaccacag gacaaaccta ccagaggttc cattagtccc ttgagagata7980tacacctttt ttttttcttt ttacccattc tactctcaat tttaccttgt tcaagaatat8040attagtattg caccaaattg atgctttcca gagccatata ttggtgtttt gtgttcacct8100aattgcctag aaataaaagt tagagatcca agcatggtca agcatggtca agatacacag8160acatggcaaa ggtttactga acacttagga tgttgtgggg ccgggcgcgg tggctcacgc8220ttgtaatccc agcactttgg gaggccgagg cgggcggatc acgaggtcag gagatcgaga8280ccatcctggc taacatggtg aaaccccgtc tctactaaaa atacaaaaaa aattagccgg8340gcgtgatggt gggcgcctgt agtcccagct actcgggagg ctgaggcagg agaatggcgt8400
gaaccctgga ggcggagctt gcagtgagcc gagattgcgc cactgcactc ccgcctgggc8460cacagagcga gactccgtct caaaaaaaaa aaaaaaaaaa aaggatgttg tggaaacatg8520tctgcttgca cagaggatca gattaacact cacaaacaaa ctttgaagcc tccttctcct8580cttcctcttc attcttcttc tttcccccat tttgttgata ggaaattgaa ggttggaagg8640ctaaaacaac tggctaaggg cacacagcta gtacatttga ccccaggttc ttctgttgga8700gaagcctgta cgtaactctt caatcacttc tgccttccat gttacttcct aaaccagata8760aatagagaga ttgcccttag aacatctctg ctatggcgac tatccaggtg cataacccca8820ttctgcactg acaagggata aaatgtccat ctttctgttg cacttagcag aagtctggct8880ttgctgatcc ctgaaacata tctgagtagg cttattgaaa aagacctttt aataagaatc8940atggttagca tgtctgccta ttttcttctc ataatagaat ctggtaccat ctgtcagata9000tttttccccc caggatcttt agtgaggaaa attttgacaa catgtggaaa aaatatgatg9060attttcccct taggaacaca gtaaagacaa agtcaaatgc attttgttgt tgttgttttt9120gaatctttaa ataaatccca gtgtccagtt ccaagcagta gtagtcctat ttttaggtgt9180ttataaatct tctagctcta ttttatttca cagattcatt tatgagatag caagaaggca9240tcccttcctg tatgcaccta caattcttct ttgggctgct cgctatgaca aaataattcc9300atcttgctgc aaagctgaaa atgcagttga atgcttccaa acaaaggtat catatttgcg9360tggatatctg aaccagtact gtagtctatg actcattaaa acaaaacaaa gttaaaaatg9420aaaacgtgct taattgtgga gagtatcgtt tttggaatag agaaatagtt cagcagtctg9480atattcttcg agtgaacaaa actggatttg ctggttttta ttatctattc attaagtcaa9540caataatttt attattaagg aagtgagttt gatgggataa agaaggaaag acagacagac9600agaaagagag aaagagaggg tgctataaat gggaaggagt aagtgaaaga aaacggagaa9660aaggaggagc agaggagaga gaaaaaatga agaactatga taaatgcttt atacttactg9720
tttttttaaa ccttagaaca aatttgaggt gtaagtattt ttgtccttta acaaactagg9780aaagaggttt agagaagaaa atttttttta ggtttagaga ggtagaataa tatccaccat9840taactacttg ctaccagcag tcctataaca aaaatttcct gagaactgac tactctcagt9900gtcaagccgt gatacaatcg tattttttgt aactgagaag acacttaaga aattagcagg9960cttcaatttg tctttaagct gtttaaaggt acagttgttc atttatgatc cccagtataa 10020aagttatgtt tttgtttcaa ggtactttga gtaaatttgt ctggcacaga tgcatataaa 10080ctaacccaaa agaataaatg agtcaataat attctgcgat aatgtatgac atttataatt 10140tttagtaaaa aacatatttt atggaatttc attttaccta tacttgttgt ttttctaaat 10200attagagctt gtaaagaaaa tgttagtata tgctttcatg acattttgtt tcctctacat 10260ctaggcagca acagttacaa aagaattaag agaaagcagc ttgttaaatc aacatgcatg 10320tgcagtaatg aaaaattttg ggacccgaac tttccaagcc atgtaagttc aagttctatc 10380tagggaagag ggtgagagct acagaactac cattttgcaa tttgggttcg tttttttaat 10440tgttgctgtt ttagagaatg aagacccctt tgtgacctct ttgatgaggg ctaatgggat 10500tagaaccatg aactcttagg atcagaagga agctaacgga taagtcagtt taacacttac 10560taaagcctag ctgagataat acatagaaaa gacttttaaa gtttatgtta tttacctgtt 10620ctttaagaca cttaagttct ggcctgccat caaattatac ctcatcacta gaccatattt 10680ttctagctct tctacaaaat aagtcagcct tcactgagtg tcatttaaaa cttttgcctt 10740aacaagaaat tctttatatt aattgtgttt cttaatcttc tataaggctc tttatagcat 10800ttattgcttc ccataaaaat attcctttga ggcaataata ttagaatcta gtgtcaggag 10860aaaagaacat tttaaattat ataacttctt taaagtactc atcaactctt ttatgataaa 10920acatttctag tatatgaaaa tatctgagct gctaatcgaa tagtagtaag tatatatatt 10980cagagtttat ttgattgctg tttggttaaa taacacgtta aagcatattg tagacaatgg 11040
aaatctagaa tgaagttttt agtaatagaa ttagttctaa agactgaaat ttcttcttgt11100aagaagtcag atttatgcct taactaccct ccaactcaat tagaaattga aagattaatt11160tatgacctac tttaaaaaaa tttatcttag taataaaata gaaattgaga tagtattata11220atacccttat catttgctat ccataagtga aagctaagtg gtctaaattt atagagaaga11280tccatcttta tcagaagcag gagtaacact attttctcta ggagcaatgg ttttacaaag11340acaactctta aaatttaatg aaatatgcag aggaaaccag aatttttatt tcttacttct11400tttttggcca cattactctc ttggcacact ggtatgcctg aaatgtttaa tctgctccac11460tttcttgtcc catttcattg atttgcacat acgcctcctt tcctggattc tcagaagtat11520tttttacccc agtaaaaaat ggttctcatt ttcatggaat tttccatttc ttaattgttt11580atccttttaa agttttatgt ccactcaata caaatgctca gcataagggt tgaatggcaa11640aaataattta ccttaattct taagacatgt tttaggaaaa gataaattat ttctaaacca11700tttgtggggc cagctcacag tttacagagt taccaccttg aaagatatgg ctggaatcaa11760gccttaaaac atgtttcctt ttctttttaa acaacaaggg aatttcagtc atttctcttt11820gaaacttcta ctgtagtaat actctataaa ttctatttta ttttgacaga taaccaagaa11880attaatttct aatttctttt ttttccctag aactgttact aaactgagtc agaagtttac11940caaagttaat tttactgaaa tccagaaact agtcctggat gtggcccatg tacatgagca12000ctgttgcaga ggagatgtgc tggattgtct gcaggatggg gtgaggagtc ttgcttctta12060aaatagaaga ttttcactcc cttttctttc tttttgtctc attctaaaag ggagaaggtt12120gtttgacttg aattggttac agagtatgta aactaggtga ctccttaaat ttgcagaatt12180ctcggtagta aaacttaaac catcttttgt tgatcctggc tttcacttta gctatacccc12240tttttgtgaa accaaggctc atctatttct tacttctaaa aaaaccgtgg gaacttctca12300gaaggcttct ccatagttac ttggaggacg ggaggaaact aaggtttaat gtatttattt12360
tttcattcat ttattctttc atttgacaaa taaatatata ttaaatactt tctatctgct12420agccactatg acagacactt gttttaaaag cacaggctga cctcaaggaa ttcacagtct12480gataggagag ataagacagt gacctccttg gagttaggga ctgccttggt ttactgttat12540ctccatagca caatgcctgg cacatggaag gcattctata atagtttgtt aaatgaacga12600atgcaataaa aattgcacaa gtaactgtcc taccaggtaa aaagctagcc ttgccaaaga12660caagtgtgaa taaagtggtc tcggagaatt agaaaacaaa atttaaaaaa cccagcaaca12720gtttcttgag tgtgctctag tcagtggtgg tttaagcagt gtggcattgg cttattttgg12780ctaaccctag acttcctaga ttttacaaga gaggactgtt gaccctcaga ttactctgtc12840tctgtgggct ccatgacaca ccaaagagat taaaatccaa ggagcttaaa aattactgct12900cttaggtact caaatggctt gataaccagc actggactat ggtttccaga aggctgaaag12960tgaagataaa atgctcattt cagcccatcc gatggcaatt cagtgagatg cttgaagtaa13020gcaagaagcc gaggctgcag aggaggcctg agagtgacag tccctgagga gctggggaag13080aagtgggagg aggcagcctg gcaggcgact gtactacttt acttgttttt cttctagaaa13140tatggcatac taggaaaacc aacaagaagt attttgtttt tctttgagct cagttttccc13200attttgaacg gacaatttta ctgtttctcg ttgtcatttt taaaaagtta attttttcaa13260tttttggagc tcataaccac ccttttcctt taaagtggaa acattaattt cagcatgata13320tgtaagttgg attttgatag ctgaataatg ggttctaatt atctttgctg agaatgtaca13380gaattttcag tcccatgaca ggtatatatg taagctctgc ctctctctgg ccacttaggt13440gcattgccat tttattatct atagactgcc ctctgaaggt catagtcagt cactgcagta13500tgttctgata aagatgatta tcattcttac ggaatttctc gtggagcaga aagtttgctc13560tccatgttat gataccagtt gcaagtgttg tttaggggca aatttgaatg ctaatagaaa13620tacatatagc aacatgcatc ctattttatt tgagcacatt tccctcttat ttgtaaaggt13680
tttcaattga aataacatag gatttagctt acaactatgg aaagaagaat tgaacaaaca13740ggtaagtgga aaggaatgag aaaaggcaaa agtggggaga aagcactaaa acgggagaca13800agttaaaatt tctttttaat tgataggtca cgttctcact ctatttgcct ttaagggaag13860aaagcaatca agttaatatg ttttccttca ttgtatagta tgtaactacg gacactatta13920gaggagggat ttgtgtagca cttaggacat tatacttgat aatttccaag ggtctttcta13980gatttaaaag tctgattcta acgtagtaat aaaaataaag gcccaatttt ctctttaata14040ttgcctgaag atattactct attattgcat taaaattaaa cattcacaca ttgtttgcac14100tgctaaataa aattatgtaa tttcttcttc tttccttcct ccttccccca tccctctcta14160tttccctttc cccttccttc tttcctggcc ttttttcctt ctttctttgt tcccttctcc14220ctccctcccc tttcttcctt tttctaaagc tggctttgag atcctttatt aaagaataaa14280tctttaaaac ttatacttta ttttccctgt tgcaggaaaa aatcatgtcc tacatatgtt14340ctcaacaaga cactctgtca aacaaaataa cagaatgctg caaactgacc acgctggaac14400gtggtcaatg tataattcat gcagaaaatg atgaaaaacc tgaaggtcta tctccaaatc14460taaacaggtt tttaggagat agagatttta accaattttc ttcaggggaa aaaaatatct14520tcttggcaag gtaacacact ctgtaaatgc atgttcatgc aagtaaaaat gattatgtgg14580ctgacagatt tgcgttgttg aaatggagag tgatgattat ggtttttgag ttcaatatgt14640gaggatattt ggctagaatg ttctgagcca aaatagattt cagtagataa ccagggaata14700agtaatggga tttggtgttt aacggtgaag cgttcaccac tgtgactcat taactgcttt14760gctatgaagc tgaattttat ttcacatcaa tttctctgga atcagaagca ttgtcatcct14820gtaaagatta ctcatatcaa ggccaccatt gaactctcaa ataggatatg gatatttttg14880taataagaag agttcatgat taagaatgaa ctcttgctac gcatgttaaa aaaaaaactt14940ttctccaaaa gataacacaa gagataatgc taggtagaag aacttttata ggaacagctt15000
attggctatg tattaaatac atgttttgta ttttttaaga aaatcaaaac atgtttagag15060acatttgcag tacagtagtt tgttttaata caactgatag gtcacgttct cactctattt15120gcctttaagg gaagaaagca atcaagttaa tacgttttcc ttcattgtat agtatgtaac15180tatggacact attagaggag ggatttgtgt agcacttagg acattatact tgataatttc15240caagggtctt tctagattta aaagtctgat tctaacgtag taataaaaat aaaggcccaa15300ttttctcttt aatattgcct gaagatatta ctctattatt gcattaaaat taaacattca15360cacattgttt gcactgctaa ataaaattat gtaagctaga ataaagttca gatttaggag15420acacatagtg acaactgatt ggtgacagaa ctaatcctat aatctgggaa tacggttagt15480aaagtcaaga attaccttta agtttacaca tccatgcaca tctaaatcta attgtttaat15540agaagcagtt cttcagttgc aaaggttctt tgcagtagaa ttttctcagc caggaatgat15600tttcccccag atatttgcat ggcttctttc acttagctga tctctgttct gatatcagct15660gcctagagag aattttcttg accacattca aagttagtgg cctctccacc ttgggtatca15720tccttttttc tctttttcat ctttatttat tttcattgat ttatcgctaa ctgaaatgag15780atggcctatt tcttgtttat ttgttctgcc tccctataat gtgtgctttt cagagggcag15840gtatttatct tagacatcat tgagtccgtt ctgcttaaag caatgctagc aaagagtgga15900cactggaaaa atatttgttg aataaatgaa tataaagtcc gtaattgaaa agtcaaattg15960agagatgcag gagaaaacaa aaagccattt tacaggacaa tttgaaggat cacagtctgt16020attaacagtt ttgccattca tataattcaa atcatatttg attttcaggt ttatttattt16080gaatttaact tccacatgcc atattatata ggaataactg gagaagtgat ggctcctttt16140gtctcttagt tccaataact tgaaatattt ttctccacat atttcagttt tgttcatgaa16200tattcaagaa gacatcctca gcttgctgtc tcagtaattc taagagttgc taaaggatac16260caggagttat tggagaagtg tttccagact gaaaaccctc ttgaatgcca agataaagga16320
gtaagttgct ctagaatttt aggggagtat gaaaaactgg attgatatca tctgttaaaa16380atgctgtttg tttgaaagcc tctagttttc aactagttgt tagccagtta tatctatttg16440tctagatatt aagctgttat taactagcag tcagcagcta gtggcttgct ttagaaacaa16500aaatgttaat tgcttctcag ccttttggct aagatcaagt gtagaaataa aaatgttaac16560caaaagtcct ttgatccaca aataaaggta gtattcatta ttcatttttg gataacttca16620gaaaggcaag aatttggtac agaaagaact gtaaccattt atccaaagat tgagttttgc16680cattaaatga ttttgtgatt tataaaatgt taaacttaat ctccccaaaa tccattttct16740gtaattatca aaatttacac tttaccatat ttaatattta aacatctctg attggtttta16800taatagtata taatattgat caattttata tacaaagtta tgcatccaag aaaagaaaaa16860tgtatatgta ataattcttc attttcagga agaagaatta cagaaataca tccaggagag16920ccaagcattg gcaaagcgaa gctgcggcct cttccagaaa ctaggagaat attacttaca16980aaatgcgtat gtttttgtaa acagtatttt tagtgaatta aaattattaa agagaatgta17040gccttcccca attctcctcc tttggaagca acaagaatga cctgtgaggt ctgatctgtg17100gtattgactt taagttcccc atactgtgca aatttttgca gtaaagatat ccattctgtc17160atagtctgtc cgagttaaag caccaaaaga tcacagttaa aatcaatgaa gctccgaggt17220tgagaataca agtcaggctt cctcctggag tttgcttttt cattgtgata tgcttctata17280ataggagtac agggagtggt tgttagagta aatgcatctc aaaagttggt tcaaatacca17340tgtagatgaa acaaacgagc tgacctcatg tcttctggca tgagagtaga gagtctgtga17400gaagaagcaa ggcggctaaa aactcatgaa tgactcagca ggacttagtt aaaaaatgct17460tctttcaggt ttctcgttgc ttacacaaag aaagcccccc agctgacctc gtcggagctg17520atggccatca ccagaaaaat ggcagccaca gcagccactt gttgccaact cagtgaggac17580aaactattgg cctgtggcga gggagcggtg agtgtctgct tggtttggtc ccatctcatt17640
tctgccctgt ttgacttgaa atagcctcat aattcccctc tagggaagac ggtaaaaaccl7700aatgtagaga tggccttagg aggcttgttt gattagtcac ggttggaggg gtgtgagaac17760ccagctctgg atggctggca tgtggccatg cttcctattc ctccagggtg gctggtggaa17820gttcagccag tttagtcaac aatatctgag ccaactttat atatcagaaa gacagaacga17880ccaacatgta actcataatt cataacaatt cataattcat aacttcaaat cataatttct17940gctttttgtt catatactta ctttgatgtt ttaaaaaagc tttatctttg attgattaaa18000attagtcatg ctattttagc catatttata ttttcacctt ttgtaacatg atattattat18O60tatgacatca ggaataattg gttccctttc gcagggtata gggtacagca caggataagt18120attatgttct gaatagtaaa atgactttcg agtcagtaat gccaatattc tttacttcct18180aatgtcacta gtatcataca taagattaca ggatgaatta aaaatatttt tcctataaag18240tcataattgc aaacaaaatt gtctatttta tcctttttcc tctttttcat aatggggagt18300tatttgctgt tagtcttcat gtcatacatt ttttccccaa aggttaagag taaaaggaga18360gttcttgtga ttaaatgtca cctcaattgt ttgttgaatt tcccatgctg ggaggctgca18420gggatgcagg atggtgtaat ggttcaggag tgtatgttcc ggaggccacc agccaacaac18480cgcattctac tttcactatt ctttagttgt atcacagtgg gaaagcaact tatgtcatta18540agcttgagtt ttttcatctg acatttgaga atacaaatta taccaccctc atacgacagc18600tgttttaaac aagataatct gcataactca cacagcacta gtctgacaga taaagtgcac18660acaaaacata ttatttctta ttacaagtta ttactaggtg attaagaaat atctcctaag18720taggcaaggt agcaagattc tacattagga aagtcttaaa aacccacaaa attgctctta18780cttcttttca attaggatga tatattagct gcaagtgtat acatgtgtat atgtatgtga18840ataaaagggg taagtttgtg ctattcttac cttcagatag tgattatcaa aagaaaaatg18900gaaagttcaa ctaaatacac atgggaaaca taaaggcaga gacatttttg tcctttagaa18960
gtgtgtatgt aactggaagc atgtttcaaa tagctgacac aaatagctaa atgactatcc19020tcaacatcac atatggacca tctgctacta cttgctaagg cttagcccaa acaaatgggt19080aaatcctgga atttacaata taatgtcaca tgatcctaca tagcaaattt tcctgtaata19140ttaattataa attgctgggc attagaaatt attgcagcag ttttctgaaa aactgaacca19200actttgtgac taatgcccaa tctccttact tttttttctc attctcctaa ccaggctgac19260attattatcg gacacttatg tatcagacat gaaatgactc cagtaaaccc tggtgttggc19320cagtgctgca cttcttcata tgccaacagg aggccatgct tcagcagctt ggtggtggat19380gaaacatatg tccctcctgc attctctgat gacaagttca ttttccataa ggatctgtgc19440caagctcagg gtgtagcgct gcaaacgatg aagcaagagt aagaaactgt tacttgctag19500catggaaaag aatgacaacc ccaaagagta actgagactt ctacctcgct cacctaacac19560tattgggctc actaacagag cgttactccc aaaacactta aaatgccttt gaaaatagtt19620ttgtctcagt gtcttcacag tctcattggg gaagcaggtc tagaaaaatc gacgagggtg19680gacaatttcc tgtttgtaaa aataatctct gttgtaactg ttattgtgat atgtatttgg19740gggttgagga aaagtgggca atctattctg aggaattaga gtgtatcttt gcagcaaattL9800tgggtacttc cattccaagc acaggaaaca catcattgaa tcttttttta cactatttac19860actttgaaga gaataaccat cttatttaat tcaaccatgc agtttgggtg ttaagaaatg19920acatgtacat ttcagttcat tgtgggagct cttttgtaat ggtgatggtc atgcaagtca19980atggagctta tgttcttcaa actcccatgc attttaatcc tcacttgttt tgtaaatagt20040cttccttcat tggaaaaccc attcttctct tttttcctct atcacagtct gaggtatgtt20100tcacagtatg ataagaatgt tgcctgttct ggcaagcttt ttctattgct ctggtctact20160ttctattgct ctggtctaag tccaacatga aaggcttgct aagtgagcag tgcaggcaat20220tagtgctgcc agtgcccaga taaggggtgt gataactgga tgggcaggat tcggagatct20280
gggtctttga gtgtagataa gacacagtta agaagagcgg acaggaaagg atattcctgg20340gggatgaggg gagattgcct tccactacac ataagtatgg tcaagtatga aatagtgttt20400tatccacaac ctgcacaact ccaggctggt ggaacacttg gcatgttttc agcctcaatc20460tttctactga aagtactaga caaggtgtgt gtggtcagtc tggtgatagg ttgatggagt20520aagggtttag gctctgaaaa ttctctacta ggaaggctgt agaaaaatag cattgcataa20580cagacttctc ttgtattttg ttttgtttta aatcacaggt ttctcattaa ccttgtgaag20640caaaagccac aaataacaga ggaacaactt gaggctgtca ttgcagattt ctcaggcctg20700ttggagaaat gctgccaagg ccaggaacag gaagtctgct ttgctgaaga ggtacatgca20760gctcatttca tactcaaaat acttgctatg gaattttctg tagtggataa tgaaaggaag20820accctacaaa tttataactt taaaatattt tcagagagat ttaaatttca ttgagaagca20880gattgaggga ttctataaga tttaaaaaat aatcacattt tcttgcttaa tattaggaaa20940atttataata ttaaaatata ttaatagaat tagtaatttt aatttatttc ctagtagaga21000aacccataaa gtgaatgtgt aaataattga tggtaattta gatagtttct ggcctaaaat21060tgatcaattc agctaaatgg attaaaggat ttaatagcaa attaattgtg caaacagagt21120attaggagtc tatttgtaga aaatgttttt gaactcattt agaagcttgc ttttgtacat21180caacagagta gtatttagga gttattttaa ttacatagta attttagctg gataattagc21240cagattttct ttaaccaggg gattctacct aacatttaaa aaaattacct tttttcagct21300ttattgaggc atgattgaca aatacaaatt atatatgttt agggtgaaca tgtgatgttt21360caatatattt atacattgtg aaatgattat cacaatcaag ataattggct aaattttaca21420aatctttagt ttgtattgct acatatattt gaatatagca acactatact ttaaaaagat21480attctataac ttagcgtttt tgtcaatttt acctttctca ccatgtaaaa tccaaagaca21540gatatattta gaaatgtaga gtttttctat aaataatata attagatgca tttgagtgtg21600
tgcacttacc agtatatgtg tgtgtttttg gtgggatcag gtagggtggg acatagataa21660ccaaattaga taaaactggt gaaacagatt tgatgtgaag catttctgaa aaacatgaca21720caagaagatt aatgttctct aatctgagaa gacatttatt tagatataga gaacatgaac21780aaatagtagc agtgctttat ctgcaaacct tttaatttct aataacttgt aatttgtaga21840ggaaggggaa agattgagaa tacgcattga tttggagatt gttatagaag aaaactgttg21900atgtgaaaga atattgtttt ctccctggct tttactatcc caggttgttg gcatcagaga21960tgtgtttctt catttttaac ttagttaatc tacaaaccta tgaattcacc ccggattgta22020gagtgttaac tgtatgattg gtataataat ccatttcttt atctgattat gtttattctt22080aattttcagg gacaaaaact gatttcaaaa actcgtgctg ctttgggagt ttaaattact22140tcaggtaaca aaacattcag acaagcctga atacaatgtt gtttctccag aaatatcaat22200ccataatgag atagatcatg aggagtgcca ttaattctct taaaaataca tggaattcaa22260aaaaaagttt attttaaaaa cacttgaaca aaattacgca cacaatgtta aattagtggc22320tcaactatgc aaaatccttt ttggttattt aaaagacttc aacaaatgct atcagaagac22380tttcctacgt atccaatatt tctctgatat aaaataatag aaccagttac ttactgcacc22440tattagttta attagtattt aatatatttt tgctcatatt gcaggggaag agaagacaaa22500acgagtcttt cattcggtgt gaacttttct ctttaatttt aactgattta acactttttg22560tgaattaatg aaatgataaa gacttttatg tgagatttcc ttatcacaga aataaaatat22620ctccaaatgt ttccttttcc aagtttgctt atttatgaaa agttatcgat aatttcttta22680gttttgtata ccattgtctg aagcagattc tgttaaaata gcattaagtg ttggttgtta22740taggagatta aagctatcca aggatggatt tacagcacta gatcacttgg tgaactgaaa22800aatgttccca agttaaacac tatttgatgc taccagggca ttttgtttat taaatgacca22860tcactgaagt attctaacag ataatctgga gatgagaaaa gaaattatta ttcttctatg22920
ggatctaaga aaatttaaca tctacttttt ttctcaatct tgttcagttc tctattcaca22980gacattttaa aacataagaa tattacagtt ttgattgaat ataattaatg ttttcatcaa23040ttaaattttt attccacaaa tgtttattaa gccttcactg agttccaggc cttgggctgg23100gtacagtcac tgttctccag tcgcttcagt agagaaggaa gcaacacaat aatgatgcct23160cagattatga ccacaaggag ttgacaacaa attgttgagg gaacgaaagg gtgggtgaca23220tcagttctga ctggaaaagg tgccataaat gtttaagaag agtcttagaa aatgaatgag23280cattcatcag ttcaagtaaa agagaaggcc attttatgaa agaggaaaca tggtcagagg23340tactgggtat gacaaagtat gatgaatagt tttagaggag tacagggtag gtaggaaggg23400tagagatgta gaatgttagg caggatgtgg aagctatgaa gggctaatcc agactctcag23460ggctctattc taaagaggtt ggacaatatc ttatgagtaa cagaggacca cagtgatagc23520taagcagagg tgtgctatta ataattagct ttgaggaaga taatctatga gatacggagc23580atgggcaatg gggcagggaa aagggtagag ggggcaaagt cagcaagagg tgacaaaaag23640accattcccc cagtagggaa gctgtttatc ttattagctt tgaatagaaa tctgaaaatt23700acatgcatac tttggcctgg gctctgggag aagacaatgg ctttagagca ataaaatgtg23760ctttcggttc ttcttctctt tttttttgaa ttggaatctg ctatgttgcc cagctggtct23820caaaatcctg ggctcaaaag atcctcctac cttggcctcc tgagtagctg ggactagagc23880catgaaccac tacacctagc ccttttagtt ctaactagat tgctttctac ttgacatttt23940tctttccatt gtactgcaac atctatgaac tttgtctgat tttggtgtaa ttctaaaagg24000tattaattta aagatcacaa taaaataaaa tcacgttcaa tataaaagca ttaagctgga24060aaatgcttta tttttttaag ggaaaagcac aatgaaggta aaactgttag ggaaatttgt24120gagtcaaata atattttgtt gaaatatata aagaaaaaat gattggaggc agaaggataa24180attgacgtaa gtacaattgt aaattgggga tttttaaaaa tttattttat ttatttattt24240
atttttttga gacagagtct cgctgtgtcg tcaggctgga gtgcagtggt acaatctcgg24300ctcactgcaa gctctgactc cctggttcaa gcgattctcc tacctcagcc tcctgagtag24360ctgggattac aggcacgcgc catgacaccc agctaatttt tgtattttta gtagagacgg24420ggtttcacca tgttggccag gctgacctcg aactcctggc ctcatgatct gcctgtctcg24480gcctcccaaa gtgttgggat tataggcatg agccactgca cccagccaaa ttggagattt24540taaaacatct ctacctcatt aacagaacaa gttaggcaaa taacaaataa agactcaggg24600tattaaactg ctgtagtcag gattaccaac aactttcaca ctgcaaaatc caatagtgga24660ttcttagtct ttagcttatc tgagttctct cagcagcatt tgacacaatt gatcactctc24720ttttccttga aacgttttcc tcacttggtg ttcggacttt cttccaacct cattggctgt24780ttcacctcaa tcttctttgc tgtgtcctcc taactctttg acctctaaat gttggagtgt24840cccagaacag ttcttccttg accgaaattc actcatccag actcagtgca ttaaatgcca24900tctagatgtt gacaacacat gtttatagct ccagcctgga tttcttcctt gacttacagg24960ctcttacgtc agcttcctcc ttaacatctc catgctgata atgtatagac aacacaaact25020tagcacatta caaattgaat gtgaatctac tccttgtccc aaatttgtac ctccatcttg25080tctatctgtc tgtttttatg agtcagacat tttggattta ttgatgaccc ctctcttgca25140tatcacccac acattcaatc tatgagcaaa gcttgtcggc tctaccttta aaaagtatcc25200agaatttgac tatttctcaa tactttggta ccagtcacaa tcatatgcct cactggggtt25260attgcaatag attcctaatt ggtcttttta caagtgacct tgctccaccc tcaaccctat25320tctcaaaagt gaacattatg tcacttttcc actcagaatc ctctagtggc ttcccacttc25380tctcagagta aaatgcaaag tctgtccaat gaccctacat gataatatct ttctgacctt25440ttttgttact cctctgatca ggtacagagg tctccctgct gctcttcaag ttaccaatca25500atgtcctgct cagggttttg ccctcatgac ccttctggct tagaagaccc tcagctatgt 25560
gtgaggctca cttcatcacc aacttcaagc ttctactcgt agttatctgc taaatgatga25620tgttttcctc aactacctta ttttaattca gaaatgccat tcccagtccc cacaacactt25680atcaccatct gacaaacact agattttact tgtttatttt ctgtctacct cactagagtg25740taagctccat gagaacagta acttttgtct cctttgttta cttcggctat cttcagcata25800tagaacagtg cctgaaacat aataggcatt ctagaaatat ttatttgagt atgtggagga25860atactacacg ccatgggcta tatatatttt cttataaggt ggtgaaacta gaggggttgt25920tagcttcctc taataaaatt tttttctaga gaaaaaaaaa aagcacaggc ctaagaaatt25980aacataaaaa ccataagata ccactgagga tgttaaagac gtgtgtgtgt gtgtgtgtgt26040gtgtgtgtgt atgcatgtgt gtgtgtgtgt gtatgcatgt gtatgtgtgt gtaggcatgt26100gtgtgtgtgt atcgtgtaga atgagaatta ggaagtggtg gcattctaga atagctggct26160tgaaagaggg tgggtaggtt tgggggatag atttttaact tgtgcttttg tctatacact26220aaattacaac gaagtctgcc acttgcttca ctgccactgt gaagcataaa tcagaaggag26280tagctcaaat tgcttggtga ccacaggata atattgggat aaggctaaac tccagctggg26340gcaaaagact ggtgaaaaca gctgggtgca gaacagctac tgttaaaaat taagtcttcc26400aatctcttta ttttatttta ttttatttat ttatttattt atttatttat ttttttgtat26460tatactttaa gttttagggt acctgtgccc agcaatccca ttactgggta tatacccaaa26520ggattataaa tcatgctgct ataaagacac atgcacatgt atgtttattg cggcactatt26580cacaatagca aagacttgga accaacccaa atgtccaaca atgatagact ggattaagaa26640aatgtggcac atatacacca tggaatacta ggcagccata aaaaaggatg agttcatgtc26700ctttgtaggt acatggatga agttggaaac catcattgca atctctttca tgcctacttt26760cccaggactt gtggattacc gtataaggaa tttgtctcct ccaatgatgc tgctttcaaa26820gagttaagga agggtccaga gaattgctcc atagcatgga attaaattaa taatcaataa26880
cagtaagatc tctagaaagt ccccaaacat ccattaacta agtaacatgc ttgtaaacat26940tcatgaatca aaaaagaaat cagaagcata tttaaaaaat atttttgcct gaatgaaaat27000gaaaaatgtg tcagaattta tagaatgtca ctaaaacagt gacatttaaa ttaaaggaaa27060tttataacgc taaaggccta tgtgttatag aaaagaagga agatctcaaa tcaatgacat27120cagcttcttc cttaataatc tagagatgaa agagcaaatt aaaaaactag tcatgagaaa27180gaagataata aagatcaaag gagaatcaat aaaatagaaa acagaagaaa tcaatagata27240taatcactgc aaccaaatgc ggttctttaa gatcaatact attaataaac ctctaaccag27300atttctcact accaatgttt ggaatgagag aggtgatagt attacaagta ttaaaataat27360gagaagaaaa tgttgtgaaa aaaatatgtc agtaaattca atgacatatg aaaaggacag27420attccttgaa agacacactt acaaaagctc atgcaagaac aagtagttaa cgtggttatt27480tatgtattaa ggaaattgaa gttgtaatta agatcattcc cacaaagaaa actccaggct27540tcacgatgaa ttc 27553<210>10<211>187<212>PRT<213>智人<220>
<221>misc_特征<223>人β-干擾素<300>
<308>基因庫/EMBL/DDBJ登記號No.AAC41702<309>1995-01-01<313>(1)..(187)<400>10Met Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser1 5 10 15
Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg20 25 30Ser Ser Asn Cys Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg35 40 45Leu Glu Tyr Cys Leu Lys Asp Arg Arg Asn Phe Asp Ile Pro Glu Glu50 55 60Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Val Thr Ile65 70 75 80Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser85 90 95Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val100 105 110Tyr His Gln Arg Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu115 120 125Lys Glu Asp Phe Thr Arg Gly Lys Arg Met Ser Ser Leu His Leu Lys130 135 140Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Asp Ser145 150 155 160His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr165 170 175Val Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn180 185
<210>11<211>212<212>PRT<213>智人<220>
<221>misc_特征<223>人干擾素變體2A<300>
<308>基因庫/EMBL/DDBJ登錄號No.CAA00839<309>1993-12-03<313>(1)..(212)<400>11Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu1 5 10 15Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro20 25 30Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr35 40 45Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile50 55 60Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser65 70 75 80Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala85 90 95Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu
100 105 110Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr115 120 125Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln130 135 140Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn145 150 155 160Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu165 170 175Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His180 185 190Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala195 200 205Leu Arg Gln Met210<210>12<211>166<212>PRT<213>智人<220>
<221>misc_特征<223>人干擾素變體2b<300>
<308>基因庫/EMBL/DDBJ登記號No.AAP20099<309>2003-04-30
<313>(1)..(166)<400>12Met Cys Asp Leu Pro Gln Thr His Ser Leu Gly Ser Arg Arg Thr Leu1 5 10 15Met Leu Leu Ala Gln Met Arg Arg Ile Ser Leu Phe Ser Cys Leu Lys20 25 30Asp Arg His Asp Phe Gly Phe Pro Gln Glu Glu Phe Gly Asn Gln Phe35 40 45Gln Lys Ala Glu Thr Ile Pro Val Leu His Glu Met Ile Gln Gln Ile50 55 60Phe Asn Leu Phe Ser Thr Lys Asp Ser Ser Ala Ala Trp Asp Glu Thr65 70 75 80Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr Gln Gln Leu Asn Asp Leu85 90 95Glu Ala Cys Val Ile Gln Gly Val Gly Val Thr Glu Thr Pro Leu Met100 105 110Lys Glu Asp Ser Ile Leu Ala Val Arg Lys Tyr Phe Gln Arg Ile Thr115 120 125Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro Cys Ala Trp Glu Val Val130 135 140Arg Ala Glu Ile Met Arg Ser Phe Ser Leu Ser Thr Asn Leu Gln Glu145 150 155 160
Ser Leu Arg Ser Lys Glu165<210>13<211>208<212>PRT<213>智人<220>
<221>misc_特征<223>人τ干擾素<300>
<308>蛋白質(zhì)序列記錄基因庫登記號No.NP-795372<309>2004-07-02<313>(1)..(208)<400>13Met Ile Ile Lys His Phe Phe Gly Thr Val Leu Val Leu Leu Ala Ser1 5 10 15Thr Thr Ile Phe Ser Leu Asp Leu Lys Leu Ile Ile Phe Gln Gln Arg20 25 30Gln Val Asn Gln Glu Ser Leu Lys Leu Leu Asn Lys Leu Gln Thr Leu35 40 45Ser Ile Gln Gln Cys Leu Pro His Arg Lys Asn Phe Leu Leu Pro Gln50 55 60Lys Ser Leu Ser Pro Gln Gln Tyr Gln Lys Gly His Thr Leu Ala Ile65 70 75 80Leu His Glu Met Leu Gln Gln Ile Phe Ser Leu Phe Arg Ala Asn Ile85 90 95
Ser Leu Asp Gly Trp Glu Glu Asn His Thr Glu Lys Phe Leu Ile Gln100 105 110Leu His Gln Gln Leu Glu Tyr Leu Glu Ala Leu Met Gly Leu Glu Ala115 120 125Glu Lys Leu Ser Gly Thr Leu Gly Ser Asp Asn Leu Arg Leu Gln Val130 135 140Lys Met Tyr Phe Arg Arg Ile His Asp Tyr Leu Glu Asn Gln Asp Tyr145 150 155 160Ser Thr Cys Ala Trp Ala Ile Val Gln Val Glu Ile Ser Arg Cys Leu165 170 175Phe Phe Val Phe Ser Leu Thr Glu Lys Leu Ser Lys Gln Gly Arg Pro180 185 190Leu Asn Asp Met Lys Gln Glu Leu Thr Thr Glu Phe Arg Ser Pro Arg195 200 205<210>14<211>189<212>PRT<213>智人<220>
<221>misc_特征<223>人α-干擾素變體16<300>
<308>蛋白質(zhì)序列記錄基因庫登記號No.NP_002164<309>1993-06-11<313>(1)..(189)
<400>14Met Ala Leu Ser Phe Ser Leu Leu Met Ala Val Leu Val Leu Ser Tyr1 5 10 15Lys Ser Ile Cys Ser Leu Gly Cys Asp Leu Pro Gln Thr His Ser Leu20 25 30Gly Asn Arg Arg Ala Leu Ile Leu Leu Ala Gln Met Gly Arg Ile Ser35 40 45His Phe Ser Cys Leu Lys Asp Arg Tyr Asp Phe Gly Phe Pro Gln Glu50 55 60Val Phe Asp Gly Asn Gln Phe Gln Lys Ala Gln Ala Ile Ser Ala Phe65 70 75 80His Glu Met Ile Gln Gln Thr Phe Asn Leu Phe Ser Thr Lys Asp Ser85 90 95Ser Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Ile Glu Leu100 105 110Phe Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Thr Gln Glu Val Gly115 l20 125Val G1u Glu Ile Ala Leu Met Asn Glu Asp Ser Ile Leu Ala Val Arg130 135 140Lys Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Met Gly Lys Lys Tyr Ser145 150 155 160Pro Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser165 170 175
Phe Ser Thr Asn Leu Gln Lys Gly Leu Arg Arg Lys Asp180 185<210>15<211>166<212>PRT<213>智人<220>
<221>misc_特征<223>人y-干擾素<300>
<308>蛋白質(zhì)序列記錄基因庫登記號No.NP_000610<309>1994-11-15<313>(1)..(166)<400>15Met Lys Tyr Thr Ser Tyr Ile Leu Ala Phe Gln Leu Cys Ile Val Leu1 5 10 15Gly Ser Leu Gly Cys Tyr Cys Gln Asp Pro Tyr Val Lys Glu Ala Glu20 25 30Asn Leu Lys Lys Tyr Phe Asn Ala Gly His Ser Asp Val Ala Asp Asn35 40 45Gly Thr Leu Phe Leu Gly Ile Leu Lys Asn Trp Lys Glu Glu Ser Asp50 55 60Arg Lys Ile Met Gln Ser Gln Ile Val Ser Phe Tyr Phe Lys Leu Phe65 70 75 80Lys Asn Phe Lys Asp Asp Gln Ser Ile Gln Lys Ser Val Glu Thr Ile
85 90 95Lys Glu Asp Met Asn Val Lys Phe Phe Asn Ser Asn Lys Lys Lys Arg100 105 110Asp Asp Phe Glu Lys Leu Thr Asn Tyr Ser Val Thr Asp LeuAsn Val115 120 125Gln Arg Lys Ala Ile His Glu Leu Ile Gln Val Met Ala Glu Leu Ser130 135 140Pro Ala Ala Lys Thr Gly Lys Arg Lys Arg Ser Gln Met Leu Phe Gln145 150 155 160Gly Arg Arg Ala Ser Gln165<210>16<211>175<212>PRT<213>智人<220>
<221>misc_特征<223>輕鏈人鐵蛋白<300>
<308>基因庫/EMBL/DDBJ登記號No.AAH18990<309>2001-12-07<313>(1)..(175)<400>16Met Ser Ser Gln Ile Arg Gln Asn Tyr Ser Thr Asp Val Glu Ala Ala1 5 10 15
Val Asn Ser Leu Val Asn Leu Tyr Leu Gln Ala Ser Tyr Thr Tyr Leu20 25 30Ser Leu Gly Phe Tyr Phe Asp Arg Asp Asp Val Ala Leu Glu Gly Val35 40 45Ser His Phe Phe Arg Glu Leu Ala Glu Glu Lys Arg Glu Gly Tyr Glu50 55 60Arg Leu Leu Lys Met Gln Asn Gln Arg Gly Gly Arg Ala Leu Phe Gln65 70 75 80Asp Ile Lys Lys Pro Ala Glu Asp Glu Trp Gly Lys Thr Pro Asp Ala85 90 95Met Lys Ala Ala Met Ala Leu Glu Lys Lys Leu Asn Gln Ala Leu Leu100 105 110Asp Leu His Ala Leu Gly Ser Ala Arg Thr Asp Pro His Leu Cys Asp115 120 125Phe Leu Glu Thr His Phe Leu Asp Glu Glu Val Lys Leu Ile Lys Lys130 135 140Met Gly Asp His Leu Thr Asn Leu His Arg Leu Gly Gly Pro Glu Ala145 150 155 160Gly Leu Gly Glu Tyr Leu Phe Glu Arg Leu Thr Leu Lys His Asp165 170 175<210>17<211>183<212>PRT<213>智人
<220>
<221>misc_特征<223>重鏈人鐵蛋白<300>
<308>基因庫/EMBL/DDBJ登記號No.AAH16857<309>2001-11-05<313>(1)..(183)<400>17Met Thr Thr Ala Ser Thr Ser Gln Val Arg Gln Asn Tyr His Gln Asp1 5 10 15Ser Glu Ala Ala Ile Asn Arg Gln Ile Asn Leu Glu Leu Tyr Ala Ser20 25 30Tyr Val Tyr Leu Ser Met Ser Tyr Tyr Phe Asp Arg Asp Asp Val Ala35 40 45Leu Lys Asn Phe Ala Lys Tyr Phe Leu His Gln Ser His Glu Glu Arg50 55 60Glu His Ala Glu Lys Leu Met Lys Leu Gln Asn Gln Arg Gly Gly Arg65 70 75 80Ile Phe Leu Gln Asp Ile Lys Lys Pro Asp Cys Asp Asp Trp Glu Ser85 90 95Gly Leu Asn Ala Met Glu Cys Ala Leu His Leu Glu Lys Asn Val Asn100 105 110Gln Ser Leu Leu Glu Leu His Lys Leu Ala Thr Asp Lys Asn Asp Pro115 120 125
His Leu Cys Asp Phe Ile Glu Thr His Tyr Leu Asn Glu Gln Val Lys130 135 140Ala Ile Lys Glu Leu Gly Asp His Val Thr Asn Leu Arg Lys Met Gly145 150 155 160Ala Pro Glu Ser Gly Leu Ala Glu Tyr Leu Phe Asp Lys His Thr Leu165 170 175Gly Asp Ser Asp Asn Glu Ser180<210>18<211>359<212>PRT<213>智人<220>
<221>misc_特征<223>人核心蛋白聚糖<300>
<308>基因庫/EMBL DDBJ登記號No.AAH05322<309>2001-03-27<313>(1)..(359)<400>18Met Lys Ala Thr Ile Ile Leu Leu Leu Leu Ala Gln Val Ser Trp Ala1 5 10 15Gly Pro Phe Gln Gln Arg Gly Leu Phe Asp Phe Met Leu Glu Asp Glu20 25 30Ala Ser Gly Ile Gly Pro Glu Val Pro Asp Asp Arg Asp Phe Glu Pro35 40 45
Ser Leu Gly Pro Val Cys Pro Phe Arg Cys Gln Cys His Leu Arg Val50 55 60Val Gln Cys Ser Asp Leu Gly Leu Asp Lys Val Pro Lys Asp Leu Pro65 70 75 80Pro Asp Thr Thr Leu Leu Asp Leu Gln Asn Asn Lys Ile Thr Glu Ile85 90 95Lys Asp Gly Asp Phe Lys Asn Leu Lys Asn Leu His Ala Leu Ile Leu100 105 110Val Asn Asn Lys Ile Ser Lys Val Ser Pro Gly Ala Phe Thr Pro Leu115 120 125Val Lys Leu Glu Arg Leu Tyr Leu Ser Lys Asn Gln Leu Lys Glu Leu130 135 140Pro Glu Lys Met Pro Lys Thr Leu Gln Glu Leu Arg Ala His Glu Asn145 150 155 160Glu Ile Thr Lys Val Arg Lys Val Thr Phe Asn Gly Leu Asn Gln Met165 170 175Ile Val Ile Glu Leu Gly Thr Asn Pro Leu Lys Ser Ser Gly Ile Glu180 185 190Asn Gly Ala Phe Gln Gly Met Lys Lys Leu Ser Tyr Ile Arg Ile Ala195 200 205Asp Thr Asn Ile Thr Ser Ile Pro Gln Gly Leu Pro Pro Ser Leu Thr210 215 220
Glu Leu His Leu Asp Gly Asn Lys Ile Ser Arg Val Asp Ala Ala Ser225 230 235 240Leu Lys Gly Leu Asn Asn Leu Ala Lys Leu Gly Leu Ser Phe Asn Ser245 250 255Ile Ser Ala Val Asp Asn Gly Ser Leu Ala Asn Thr Pro His Leu Arg260 265 270Glu Leu His Leu Asp Asn Asn Lys Leu Thr Arg Val Pro Gly Gly Leu275 280 285Ala Glu His Lys Tyr Ile Gln Val Val Tyr Leu His Asn Asn Asn Ile290 295 300Ser Val Val Gly Ser Ser Asp Phe Cys Pro Pro Gly His Asn Thr Lys305 310 315 320Lys Ala Ser Tyr Ser Gly Val Ser Leu Phe Ser Asn Pro Val Gln Tyr325 330 335Trp Glu Ile Gln Pro Ser Thr Phe Arg Cys Val Tyr Val Arg Ser Ala340 345 350Ile Gln Leu Gly Asn Tyr Lys355<210>19<211>464<212>PRT<213>智人
<220>
<221>misc_特征<223>人抗凝血酶<300>
<308>基因庫登錄號No.113936<309>1986-07-21<313>(1)..(464)<400>19Met Tyr Ser Asn Val Ile Gly Thr Val Thr Ser Gly Lys Arg Lys Val1 5 10 15Tyr Leu Leu Ser Leu Leu Leu Ile Gly Phe Trp Asp Cys Val Thr Cys20 25 30His Gly Ser Pro Val Asp Ile Cys Thr Ala Lys Pro Arg Asp Ile Pro35 40 45Met Asn Pro Met Cys Ile Tyr Arg Ser Pro Glu Lys Lys Ala Thr Glu50 55 60Asp Glu Gly Ser Glu Gln Lys Ile Pro Glu Ala Thr Asn Arg Arg Val65 70 75 80Trp Glu Leu Ser Lys Ala Asn Ser Arg Phe Ala Thr Thr Phe Tyr Gln85 90 95His Leu Ala Asp Ser Lys Asn Asp Asn Asp Asn Ile Phe Leu Ser Pro100 105 110Leu Ser Ile Ser Thr Ala Phe Ala Met Thr Lys Leu Gly Ala Cys Asn115 120 125Asp Thr Leu Gln Gln Leu Met Glu Val Phe Lys Phe Asp Thr Ile Ser
130 135 140Glu Lys Thr Ser Asp Gln Ile His Phe Phe Phe Ala Lys Leu Asn Cys145 150 155 160Arg Leu Tyr Arg Lys Ala Asn Lys Ser Ser Lys Leu Val Ser Ala Asn165 170 175Arg Leu Phe Gly Asp Lys Ser Leu Thr Phe Asn Glu Thr Tyr Gln Asp180 185 190Ile Ser Glu Leu Val Tyr Gly Ala Lys Leu Gln Pro Leu Asp Phe Lys195 200 205Glu Asn Ala Glu Gln Ser Arg Ala Ala Ile Asn Lys Trp Val Ser Asn210 215 220Lys Thr Glu Gly Arg Ile Thr Asp Val Ile Pro Ser Glu Ala Ile Asn225 230 235 240Glu Leu Thr Val Leu Val Leu Val Asn Thr Ile Tyr Phe Lys Gly Leu245 250 255Trp Lys Ser Lys Phe Ser Pro Glu Asn Thr Arg Lys Glu Leu Phe Tyr260 265 270Lys Ala Asp Gly Glu Ser Cys Ser Ala Ser Met Met Tyr Gln Glu Gly275 280 285Lys Phe Arg Tyr Arg Arg Val Ala Glu Gly Thr Gln Val Leu Glu Leu290 295 300Pro Phe Lys Gly Asp Asp Ile Thr Met Val Leu Ile Leu Pro Lys Pro
305 310 315 320Glu Lys Ser Leu Ala Lys Val Glu Lys Glu Leu Thr Pro Glu Val Leu325 330 335Gln Glu Trp Leu Asp Glu Leu Glu Glu Met Met Leu Val Val His Met340 345 350Pro Arg Phe Arg Ile Glu Asp Gly Phe Ser Leu Lys Glu Gln Leu Gln355 360 365Asp Met Gly Leu Val Asp Leu Phe Ser Pro Glu Lys Ser Lys Leu Pro370 375 380Gly Ile Val Ala Glu Gly Arg Asp Asp Leu Tyr Val Ser Asp Ala Phe385 390 395 400His Lys Ala Phe Leu Glu Val Asn Glu Glu Gly Ser Glu Ala Ala Ala405 410 415Ser Thr Ala Val Val Ile Ala Gly Arg Ser Leu Asn Pro Asn Arg Val420 425 430Thr Phe Lys Ala Asn Arg Pro Phe Leu Val Phe Ile Arg Glu Val Pro435 440 445Leu Asn Thr Ile Ile Phe Met Gly Arg Val Ala Asn Pro Cys Val Lys450 455 460<210>20<211>393<212>PRT<213>智人
<220>
<221>misc_特征<223>人抗凝血酶片段<300>
<308>基因庫登錄號No.113935<309>1986-07-21<313>(1)..(393)<400>20Met Tyr Ser Asn Val Ile Gly Thr Val Thr Ser Gly Lys Arg Lys Val1 5 10 15Tyr Leu Leu Ser Leu Leu Leu Ile Gly Phe Trp Asp Cys Val Thr Cys20 25 30His Gly Ser Pro Val Asp Ile Cys Thr Ala Lys Pro Arg Asp Ile Pro35 40 45Met Asn Pro Met Cys Ile Tyr Arg Ser Pro Glu Lys Lys Ala Thr Glu50 55 60Asp Glu Gly Ser Glu Gln Lys Ile Pro Glu Ala Thr Asn Arg Arg Val65 70 75 80Trp Glu Leu Ser Lys Ala Asn Ser Arg Phe Ala Thr Thr Phe Tyr Gln85 90 95His Leu Ala Asp Ser Lys Asn Asp Asn Asp Asn Ile Phe Leu Ser Pro100 105 110Leu Ser Ile Ser Thr Ala Phe Ala Met Thr Lys Leu Gly Ala Cys Asn115 120 125
Asp Thr Leu Gln Gln Leu Met Glu Val Phe Lys Phe Asp Thr Ile Ser130 135 140Glu Lys Thr Ser Asp Gln Ile His Phe Phe Phe Ala Lys Leu Asn Cys145 150 155 160Arg Leu Tyr Arg Lys Ala Asn Lys Ser Ser Lys Leu Val Ser Ala Asn165 170 175Arg Leu Phe Gly Asp Lys Ser Leu Thr Phe Asn Glu Thr Tyr Gln Asp180 185 190Ile Ser Glu Leu Val Tyr Gly Ala Lys Leu Gln Pro Leu Asp Phe Lys195 200 205Glu Asn Ala Glu Gln Ser Arg Ala Ala Ile Asn Lys Trp Val Ser Asn210 215 220Lys Thr Glu Gly Arg Ile Thr Asp Val Ile Pro Ser Glu Ala Ile Asn225 230 235 240Glu Leu Thr Val Leu Val Leu Val Asn Thr Ile Tyr Phe Lys Gly Leu245 250 255Trp Lys Ser Lys Phe Ser Pro Glu Asn Thr Arg Lys Glu Leu Phe Tyr260 265 270Lys Ala Asp Gly Glu Ser Cys Ser Ala Ser Met Met Tyr Gln Glu Gly275 280 285Lys Phe Arg Tyr Arg Arg Val Ala Glu Gly Thr Gln Val Leu Glu Leu290 295 300
Pro Phe Lys Gly Asp Asp Ile Thr Met Val Leu Ile Leu Pro Lys Pro305 310 315 320Glu Lys Ser Leu Ala Lys Val Glu Lys Glu Leu Thr Pro Glu Val Leu325 330 335Gln Glu Trp Leu Asp Glu Leu Glu Glu Met Met Leu Val Val His Met340 345 350Pro Arg Phe Arg Ile Glu Asp Gly Phe Ser Leu Lys Glu Gln Leu Gln355 360 365Asp Met Gly Leu Val Asp Leu Phe Ser Pro Glu Lys Ser Lys Leu Pro370 375 380Gly Ile Val Ala Glu Gly Arg Asp Asp385 390<210>21<211>104<212>PRT<213>智人<220>
<221>misc_特征<223>人血小板因子<300>
<308>蛋白質(zhì)序列記錄基因庫登記號No.NP_002611<309>1995-01-07<313>(1)..(104)<400>21Met Ser Ser Ala Ala Arg Ser Arg Leu Thr Arg Ala Thr Arg Gln Glu1 5 10 15
Met Leu Phe Leu Ala Leu Leu Leu Leu Pro Val Val Val Ala Phe Ala20 25 30Arg Ala Glu Ala Glu Glu Asp Gly Asp Leu Gln Cys Leu Cys Val Lys35 40 45Thr Thr Ser Gln Val Arg Pro Arg His Ile Thr Ser Leu Glu Val Ile50 55 60Lys Ala Gly Pro His Cys Pro Thr Ala Gln Leu Ile Ala Thr Leu Lys65 70 75 80Asn Gly Arg Lys Ile Cys Leu Asp Leu Gln Ala Leu Leu Tyr Lys Lys85 90 95Ile Ile Lys Glu His Leu Glu Ser100<210>22<211>227<212>PRT<213>智人<220>
<221>misc_特征<223>人促乳素<300>
<308>蛋白質(zhì)序列記錄基因庫登記號No.NP_000939<309>2001-10-15<313>(1)..(227)<400>22Met Asn Ile Lys Gly Ser Pro Trp Lys Gly Ser Leu Leu Leu Leu Leu1 5 l0 15
Val Ser Asn Leu Leu Leu Cys Gln Ser Val Ala Pro Leu Pro Ile Cys20 25 30Pro Gly Gly Ala Ala Arg Cys Gln Val Thr Leu Arg Asp Leu Phe Asp35 40 45Arg Ala Val Val Leu Ser His Tyr Ile His Asn Leu Ser Ser Glu Met50 55 60Phe Ser Glu Phe Asp Lys Arg Tyr Thr His Gly Arg Gly Phe Ile Thr65 70 75 80Lys Ala Ile Asn Ser Cys His Thr Ser Ser Leu Ala Thr Pro Glu Asp85 90 95Lys Glu Gln Ala Gln Gln Met Asn Gln Lys Asp Phe Leu Ser Leu Ile100 105 110Val Ser Ile Leu Arg Ser Trp Asn Glu Pro Leu Tyr His Leu Val Thr115 120 125Glu Val Arg Gly Met Gln Glu Ala Pro Glu Ala Ile Leu Ser Lys Ala130 135 140Val Glu Ile Glu Glu Gln Thr Lys Arg Leu Leu Glu Gly Met Glu Leu145 150 155 160Ile Val Ser Gln Val His Pro Glu Thr Lys Glu Asn Glu Ile Tyr Pro165 170 175Val Trp Ser Gly Leu Pro Ser Leu Gln Met Ala Asp Glu Glu Ser Arg180 185 190
Leu Ser Ala Tyr Tyr Asn Leu Leu His Cys Leu Arg Arg Asp Ser His195 200 205Lys Ile Asp Asn Tyr Leu Lys Leu Leu Lys Cys Arg Ile Ile His Asn210 215 220Asn Asn Cys225<210>23<211>93<212>PRT<213>智人<220>
<221>misc_特征<223>人降鈣素<300>
<308>基因庫/EMBL DDBJ登記號No.CAA26189<309>1989-03-15<313>(1)..(93)<400>23Val Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser1 5 10 15Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro20 25 30Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr35 40 45Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
50 55 60Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg65 70 75 80Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala Asn85 90<210>24<211>236<212>PRT<213>智人<300>
<308>基因庫/EMBL DDBJ登記號No.AAE57231<309>2001-05-16<313>(1)..(236)<400>24Met Thr Gly Tyr Glu Ala Arg Leu Ile Thr Phe Gly Thr Trp Met Tyr1 5 10 15Ser Val Asn Lys Glu Gln Leu Ala Arg Ala Gly Phe Tyr Ala Ile Gly20 25 30Gln Glu Asp Lys Val Gln Cys Phe His Cys Gly Gly Gly Leu Ala Asn35 40 45Trp Lys Pro Lys Glu Asp Pro Trp Glu Gln His Ala Lys Trp Tyr Pro50 55 60Gly Cys Lys Tyr Leu Leu Glu Glu Lys Gly His Glu Tyr Ile Asn Asn65 70 75 80Ile His Leu Thr Arg Ser Leu Glu Gly Ala Leu Val Gln Thr Thr Lys
85 90 95Lys Thr Pro Ser Leu Thr Lys Arg Ile Ser Asp Thr Ile Phe Pro Asn100 105 110Pro Met Leu Gln Glu Ala IIe Arg Met Gly Phe Asp Phe Lys Asp Val115 120 125Lys Lys Ile Met Glu Glu Arg Ile Gln Thr Ser Gly Ser Asn Tyr Lys130 135 140Thr Leu Glu Val Leu Val Ala Asp Leu Val Ser Ala Gln Lys Asp Thr145 150 155 160Thr Glu Asn Glu Leu Asn Gln Thr Ser Leu Gln Arg Glu Ile Ser Pro165 170 175Glu Glu Pro Leu Arg Arg Leu Gln Glu Glu Lys Leu Cys Lys Ile Cys180 185 190Met Asp Arg Tyr Ile Ala Val Val Phe Ile Pro Cys Gly His Leu Val195 200 205Thr Cys Lys Gln Cys Ala Glu Ala Val Asp Arg Cys Pro Met Cys Ser210 215 220Ala Val Ile Asp Phe Lys Gln Arg Val Phe Met Ser225 230 235<210>25<211>406<212>PRT<213>智人
<220>
<221>misc_特征<223>人α-1-抗胰蛋白酶<300>
<308>基因庫/EMBL DDBJ登記號No.AAH08915<309>2001-05-29<313>(1)..(406)<400>25Met Gln Leu Phe Leu Leu Leu Cys Leu Val Leu Leu Ser Pro Gln Gly1 5 10 15Ala Ser Leu His Arg His His Pro Arg Glu Met Lys Lys Arg Val Glu20 25 30Asp Leu His Val Gly Ala Thr Val Ala Pro Ser Ser Arg Arg Asp Phe35 40 45Thr Phe Asp Leu Tyr Arg Ala Leu Ala Ser Ala Ala Pro Ser Gln Asn50 55 60Ile Phe Phe Ser Pro Val Ser Ile Ser Met Ser Leu Ala Met Leu Ser65 70 75 80Leu Gly Ala Gly Ser Ser Thr Lys Met Gln Ile Leu Glu Gly Leu Gly85 90 95Leu Asn Leu Gln Lys Ser Ser Glu Lys Glu Leu His Arg Gly Phe Gln100 105 110Gln Leu Leu Gln Glu Leu Asn Gln Pro Arg Asp Gly Phe Gln Leu Ser115 120 125
Leu Gly Asn Ala Leu Phe Thr Asp Leu Val Val Asp Leu Gln Asp Thr130 l35 140Phe Val Ser Ala Met Lys Thr Leu Tyr Leu Ala Asp Thr Phe Pro Thr145 150 155 160Asn Phe Arg Asp Ser Ala Gly Ala Met Lys Gln Ile Asn Asp Tyr Val165 170 175Ala Lys Gln Thr Lys Gly Lys Ile Val Asp Leu Leu Lys Asn Leu Asp180 185 190Ser Asn Ala Val Val Ile Met Val Asn Tyr Ile Phe Phe Lys Ala Lys195 200 205Trp Glu Thr Ser Phe Asn His Lys Gly Thr Gln Glu Gln Asp Phe Tyr210 215 220Val Thr Ser Glu Thr Val Val Arg Val Pro Met Met Ser Arg Glu Asp225 230 235 240Gln Tyr His Tyr Leu Leu Asp Arg Asn Leu Ser Cys Arg Val Val Gly245 250 255Val Pro Tyr Gln Gly Asn Ala Thr Ala Leu Phe Ile Leu Pro Ser Glu260 265 270Gly Lys Met Gln Gln Val Glu Asn Gly Leu Ser Glu Lys Thr Leu Arg275 280 285Lys Trp Leu Lys Met Phe Lys Lys Arg Gln Leu Glu Leu Tyr Leu Pro290 295 300
Lys Phe Ser Ile Glu Gly Ser Tyr Gln Leu Glu Lys Val Leu Pro Ser305 310 315 320Leu Gly Ile Ser Asn Val Phe Thr Ser His Ala Asp Leu Ser Gly Ile325 330 335Ser Asn His Ser Asn Ile Gln Val Ser Glu Met Val His Lys Ala Val340 345 350Val Glu Val Asp Glu Ser Gly Thr Arg Ala Ala Ala Ala Thr Gly Thr355 360 365Ile Phe Thr Phe Arg Ser Ala Arg Leu Asn Ser Gln Arg Leu Val Phe370 375 380Asn Arg Pro Phe Leu Met Phe Ile Val Asp Asn Asn Ile Leu Phe Leu385 390 395 400Gly Lys Val Asn Arg Pro405<210>26<211>32<212>PRT<213>合成<400>26Ala Leu Ala Gly Leu Ala Ser Pro Gly Leu Tyr Gly Leu Ala Arg Gly1 5 10 15Val Ala Leu Leu Glu Pro Arg Gly Leu Tyr Ser Glu Arg Gly Leu Tyr20 25 30<210>27
<211>33<212>PRT<213>合成<400>27Ala Leu Ala Pro Arg Gly Leu Leu Tyr Ser Gly Leu Tyr Leu Tyr Ser1 5 10 15Ala Ser Asn Thr His Arg Leu Glu Gly Leu Tyr Ser Glu Arg Gly Leu20 25 30Tyr<210>28<211>35<212>PRT<213>合成<400>28Ala Leu Ala Pro Arg Ser Glu Arg Ser Glu Arg Leu Tyr Ser Ser Glu1 5 10 15Arg Thr His Arg Ser Glu Arg Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr35<210>29<211>34<212>PRT<213>合成<400>29
Ala Leu Ala Leu Tyr Ser Pro Arg Gly Leu Tyr Leu Glu Val Ala Leu1 5 10 15Ala Ser Pro Ala Ser Asn Gly Leu Asn Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>30<211>36<212>PRT<213>合成<400>30Ala Leu Ala Pro His Glu Gly Leu Tyr Ala Ser Asn Ala Leu Ala Ala1 5 10 15Ser Asn Ser Glu Arg Ala Leu Ala Ala Arg Gly Gly Leu Tyr Ser Glu20 25 30Arg Gly Leu Tyr35<210>31<211>34<212>PRT<213>合成<400>31Ala Leu Ala Pro Arg Ser Glu Arg Ala Ser Pro Leu Tyr Ser Gly Leu1 5 10 15Gly Leu Tyr Thr Tyr Arg Ser Glu Arg Gly Leu Tyr Ser Glu Arg Gly20 25 30
Leu Tyr<210>32<211>34<212>PRT<213>合成<400>32Ala Leu Ala Leu Tyr Ser Pro Arg Ala Ser Asn Pro Arg Thr His Arg1 5 10 15Gly Leu Tyr Thr His Arg Val Ala Leu Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>33<211>35<212>PRT<213>合成<400>33Ala Leu Ala Ile Leu Glu Hi s Ile Ser Gly Leu Thr Tyr Arg Pro His1 510 15Glu Ala Arg Gly Gly Leu Tyr Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr35
<210>34<211>34<212>PRT<213>合成<400>34Ala Leu Ala Leu Glu His Ile Ser Gly Leu Tyr Ala Arg Gly Gly Leu1 5 10 15Tyr Gly Leu Tyr Gly Leu Ala Ser Pro Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>35<211>35<212>PRT<213>合成<400>35Ala Leu Ala Ser Glu Arg Ser Glu Arg Pro Arg Ala Ser Pro Val Ala1 5 10 15Leu Ala Leu Ala Leu Tyr Ser Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr3權(quán)利要求
1.通過轉(zhuǎn)基因DNA構(gòu)建體編碼的雙功能融合蛋白，該構(gòu)建體包括第一個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，和第二個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，共同組成所述的融合蛋白，其中所述的第一個(gè)和所述的第二個(gè)多肽結(jié)構(gòu)域各自保留其所需的生物活性，其中所述第一個(gè)多肽結(jié)構(gòu)域編碼的多肽是人α-甲胎蛋白或其具有人α-甲胎蛋白生物活性的片段。
2.權(quán)利要求1的融合蛋白，其中所述的融合蛋白是DNA連續(xù)編碼序列的產(chǎn)物。
3.權(quán)利要求1的融合蛋白，其中所述第二個(gè)多肽結(jié)構(gòu)域編碼的哺乳動(dòng)物多肽是人IFN-β或其具有IFN-β生物活性的片段。
4.權(quán)利要求2的融合蛋白，其中所述的第二個(gè)多肽結(jié)構(gòu)域選自抗凝血酶III、乳鐵蛋白、鐵蛋白、降鈣素、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制劑、核心蛋白聚糖、催乳素、τ干擾素、α干擾素、鐵蛋白、促乳素、CFTR、Muellerian抑制物質(zhì)、血液因子X、血液因子VIII、截短的ATIII和促紅細(xì)胞生成素。
5.權(quán)利要求1的融合蛋白，進(jìn)一步包括谷胱甘肽S-轉(zhuǎn)移酶多肽序列。
6.編碼連接于SEQ.ID NO10的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
7.編碼連接于SEQ.ID NO11的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
8.編碼連接于SEQ.ID NO12的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
9.編碼連接于SEQ.ID NO13的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
10.編碼連接于SEQ.ID NO14的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
11.編碼連接于SEQ.ID NO15的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
12.編碼連接于SEQ.ID NO16的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
13.編碼連接于SEQ.ID NO17的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
14.編碼連接于SEQ.ID NO18的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
15.編碼連接于SEQ.ID NO19的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
16.編碼連接于SEQ.ID NO20的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
17.編碼連接于SEQ.ID NO21的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
18.編碼連接于SEQ.ID NO22的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
19.編碼連接于SEQ.ID NO23的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
20.編碼連接于SEQ.ID NO24的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
21.編碼連接于SEQ.ID NO25的SEQ.ID NO4所示氨基酸序列的分離多核苷酸。
22.重組DNA載體，包括權(quán)利要求1的融合蛋白的核酸序列。
23.用權(quán)利要求22所述的重組DNA載體轉(zhuǎn)化的宿主細(xì)胞。
24.重組DNA載體，包括權(quán)利要求1的融合蛋白的核酸序列，其中所述的載體是表達(dá)載體，該載體包括可操作連接于權(quán)利要求1融合蛋白的啟動(dòng)子。
25.權(quán)利要求1的方法，其中通過至少一種β酪蛋白啟動(dòng)子來啟動(dòng)所述的編碼所需融合蛋白的DNA構(gòu)建體。
26.融合蛋白，通過以下方法制得，該方法包括(a)通過細(xì)胞表達(dá)權(quán)利要求1的融合蛋白；和(b)收集蛋白。
27.權(quán)利要求26的融合蛋白，其中所述的融合蛋白進(jìn)一步包括N-端蛋氨酸。
28.治療病癥的方法，包括施用有效量的融合蛋白，通過轉(zhuǎn)基因DNA構(gòu)建體編碼所述的融合蛋白，該構(gòu)建體包括第一個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，和第二個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，一起構(gòu)成所述的融合蛋白，其中所述的第一個(gè)和所述的第二個(gè)多肽結(jié)構(gòu)域各自保留其所需的生物活性，其中所述第一個(gè)多肽結(jié)構(gòu)域編碼的多肽是人α-甲胎蛋白或其具有人α-甲胎蛋白生物活性的片段。
29.權(quán)利要求28的方法，其中所述的病癥是病毒感染。
30.權(quán)利要求29的方法，其中所述的病毒感染是由人免疫缺陷病毒引起的。
31.權(quán)利要求28的方法，其中所述第二個(gè)多肽結(jié)構(gòu)域編碼的多肽是人IFN-β或其具有人IFN-β生物活性的片段。
32.權(quán)利要求28的方法，其中所述的病癥是癌癥。
33.權(quán)利要求28的方法，其中所述的病癥是類風(fēng)濕性關(guān)節(jié)炎。
34.權(quán)利要求28的方法，其中所述的病癥是多發(fā)性硬化。
35.權(quán)利要求28的方法，其中所述的病癥是骨質(zhì)疏松。
36.權(quán)利要求28的方法，其中所述的病癥是牛皮癬。
37.權(quán)利要求28的方法，其中所述的病癥是重癥肌無力。
38.權(quán)利要求32的方法，其中所述的病癥是癌癥，且所述病癥的治療進(jìn)一步包括用有效量的第二種組合物來治療，所述的第二種組合物選自阿霉素；氨甲蝶呤；他莫西芬；順鉑；長春堿；或長春新堿。
39.權(quán)利要求26的融合蛋白，其中通過原核細(xì)胞來表達(dá)所述融合蛋白。
40.權(quán)利要求26的融合蛋白，其中通過細(xì)菌來表達(dá)所述融合蛋白。
41.權(quán)利要求26的融合蛋白，其中通過真核細(xì)胞來表達(dá)所述融合蛋白。
42.權(quán)利要求26的融合蛋白，其中通過動(dòng)物細(xì)胞來表達(dá)所述融合蛋白。
43.權(quán)利要求26的融合蛋白，其中所述動(dòng)物細(xì)胞是CHO細(xì)胞。
44.權(quán)利要求26的融合蛋白，其中所述動(dòng)物細(xì)胞是COS細(xì)胞。
45.權(quán)利要求26的融合蛋白，其中通過酵母來表達(dá)所述融合蛋白。
46.權(quán)利要求26的融合蛋白，其中所述酵母是酵母屬(Saccharomyces)。
47.通過以下方法制得的融合蛋白，該方法包括(a)通過轉(zhuǎn)基因動(dòng)物表達(dá)權(quán)利要求1的融合蛋白；和(b)收集蛋白。
48.生產(chǎn)能夠產(chǎn)生所關(guān)心融合蛋白的轉(zhuǎn)基因動(dòng)物的方法，包括用編碼第一個(gè)蛋白多肽結(jié)構(gòu)域和第二個(gè)蛋白多肽結(jié)構(gòu)域的轉(zhuǎn)基因DNA構(gòu)建體轉(zhuǎn)染非人哺乳動(dòng)物細(xì)胞系；選擇其中所述轉(zhuǎn)基因DNA構(gòu)建體已經(jīng)插入該細(xì)胞或細(xì)胞系基因組中的細(xì)胞系；和進(jìn)行第一個(gè)核移植程序來產(chǎn)生與所需基因雜合的第一個(gè)轉(zhuǎn)基因動(dòng)物。
49.權(quán)利要求48的方法，進(jìn)一步包括表征所述的第一個(gè)雜合轉(zhuǎn)基因動(dòng)物的遺傳組成，通過使用選擇劑來選擇與所述的所需轉(zhuǎn)基因DNA構(gòu)建體純合的細(xì)胞；使用已知的分子生物學(xué)方法來表征存活的細(xì)胞；并挑選存活的細(xì)胞或細(xì)胞集落細(xì)胞用于第二輪的核移植或胚胎移植；并產(chǎn)生與所述的所需轉(zhuǎn)基因DNA構(gòu)建體純合的第二個(gè)轉(zhuǎn)基因動(dòng)物。
50.權(quán)利要求49的方法，其中通過幾種已知的分子生物學(xué)方法之一來表征所述的存活細(xì)胞，這些方法包括但不限于FISH、DNA印跡、PCR。
51.權(quán)利要求48的方法，其中所述的用作供體核或供體細(xì)胞核來源的非人哺乳動(dòng)物細(xì)胞系來自有蹄類。
52.權(quán)利要求48或51的方法，其中所述的用作供體細(xì)胞或供體細(xì)胞核的非人哺乳動(dòng)物細(xì)胞系來自選自牛、羊、豬、馬、公山羊和水牛的有蹄類。
53.權(quán)利要求48的方法，其中所述的用作供體核或供體細(xì)胞核來源的非人哺乳動(dòng)物細(xì)胞素是來自成體非人哺乳動(dòng)物體細(xì)胞的分化的哺乳動(dòng)物細(xì)胞。
54.權(quán)利要求48的方法，其中所述的第一個(gè)轉(zhuǎn)基因動(dòng)物是嚙齒動(dòng)物。
55.權(quán)利要求48的方法，其中所述的第一個(gè)轉(zhuǎn)基因動(dòng)物是有蹄類。
56.權(quán)利要求48的方法，其中所述的第一個(gè)轉(zhuǎn)基因動(dòng)物來自選自牛、羊、豬、馬、公山羊和水牛的有蹄類。
57.權(quán)利要求48或49的方法所得到的后代。
58.權(quán)利要求48的方法，其中在所述的核移植方案中使用了細(xì)胞松弛素-B。
59.權(quán)利要求48的方法，其中在所述的核移植方案中未使用細(xì)胞松弛素-B。
60.權(quán)利要求48或49的方法，其中使用的技術(shù)產(chǎn)生了純合細(xì)胞系。
61.權(quán)利要求48或49的方法，其中所述的第一個(gè)和第二個(gè)蛋白多肽結(jié)構(gòu)域核酸序列是連接的并作為單個(gè)氨基酸序列來翻譯。
62.權(quán)利要求48的方法，其中將所述的轉(zhuǎn)基因DNA構(gòu)建體可操作地連接于乳房組織特異性啟動(dòng)子，該啟動(dòng)子使在轉(zhuǎn)基因非人胎盤哺乳動(dòng)物的奶中產(chǎn)生所述轉(zhuǎn)基因DNA構(gòu)建體的雙功能融合蛋白產(chǎn)物成為可能。
63.權(quán)利要求49的方法，其中將所述的轉(zhuǎn)基因DNA構(gòu)建體可操作地連接于乳房組織特異性啟動(dòng)子，該啟動(dòng)子使在轉(zhuǎn)基因非人胎盤哺乳動(dòng)物的奶中產(chǎn)生所述轉(zhuǎn)基因DNA構(gòu)建體的雙功能融合蛋白產(chǎn)物成為可能。
64.權(quán)利要求62或63的轉(zhuǎn)基因哺乳動(dòng)物，其中所述啟動(dòng)子是β-乳球蛋白啟動(dòng)子。
65.權(quán)利要求62或63的轉(zhuǎn)基因哺乳動(dòng)物，其中所述啟動(dòng)子是β-酪蛋白啟動(dòng)子。
66.權(quán)利要求48的方法，其中所述的第一個(gè)蛋白多肽結(jié)構(gòu)域編碼人α-甲胎蛋白而其中所述的第二個(gè)蛋白多肽結(jié)構(gòu)域編碼用于生物藥物蛋白產(chǎn)物的所需基因密碼，這些生物藥物蛋白產(chǎn)物選自抗凝血酶III、乳鐵蛋白、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制劑、核心蛋白聚糖、β干擾素、α干擾素、鐵蛋白、促乳素、CFTR、Muellerian抑制物質(zhì)、催乳素、血液因子X、血液因子VIII、截短的ATIII和促紅細(xì)胞生成素。
67.權(quán)利要求48和49方法的后代所產(chǎn)生的奶。
68.使用含有融合蛋白物質(zhì)的組合物治療人癌癥或腫瘤細(xì)胞的方法，通過轉(zhuǎn)基因DNA構(gòu)建體來編碼所述融合蛋白，該構(gòu)建體包括第一個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，和第二個(gè)具有所需生物活性的多肽結(jié)構(gòu)域，一起構(gòu)成所述的融合蛋白，其中所述的第一個(gè)和所述的第二個(gè)多肽結(jié)構(gòu)域各自保留其所需的生物活性，且其中所述的第一個(gè)多肽結(jié)構(gòu)域具有人α-甲胎蛋白的活性，改進(jìn)包括用基本上藥物學(xué)純的所述融合蛋白和有效量5-氟尿嘧啶的組合物來治療患者。
69.權(quán)利要求3的融合蛋白，其中所述的人α-甲胎蛋白或人α-甲胎蛋白變體具有高的血漿半衰期。
70.權(quán)利要求69的融合蛋白，其中所述的人α-甲胎蛋白變體具有一個(gè)或多個(gè)殘基的突變。
71.權(quán)利要求69的融合蛋白，其中所述的人α-甲胎蛋白變體具有一個(gè)或多個(gè)殘基的缺失。
72.權(quán)利要求69的融合蛋白，其中所述的人α-甲胎蛋白變體具有一個(gè)或多個(gè)殘基的突變和缺失。
73.權(quán)利要求69的融合蛋白，其中所述人α-甲胎蛋白變體具有一個(gè)或多個(gè)殘基的添加。
74.權(quán)利要求69的融合蛋白，其中所述融合蛋白進(jìn)一步包括肽銜接物。
75.權(quán)利要求69的融合蛋白，其中所述融合蛋白包括分泌信號序列。
76.權(quán)利要求69的融合蛋白，其中所述的人IFN-β與所述的人α-甲胎蛋白或人α-甲胎蛋白變體的N-端融合。
77.權(quán)利要求69的融合蛋白，其中所述的人IFN-β與所述的人α-甲胎蛋白或人α-甲胎蛋白變體的C-端融合。
78.如SEQ.ID NO1所示的分離的核酸序列。
79.如權(quán)利要求6-21所示的分離的核酸序列，進(jìn)一步包括氨基酸連接序列。
80.治療人癌癥或腫瘤細(xì)胞的方法，使用含有融合蛋白物質(zhì)的組合物，所述融合蛋白包括第一個(gè)蛋白多肽結(jié)構(gòu)域和共價(jià)連接的第二個(gè)蛋白多肽結(jié)構(gòu)域，所述的第一個(gè)蛋白多肽結(jié)構(gòu)域編碼人α-甲胎蛋白氨基酸序列，且其中所述的第二個(gè)蛋白多肽結(jié)構(gòu)域編碼具有所需蛋白生理活性的生物藥物蛋白產(chǎn)物，所需蛋白選自抗凝血酶III、乳鐵蛋白、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制劑、核心蛋白聚糖、β干擾素、α干擾素、鐵蛋白、促乳素、CFTR、Muellerian抑制物質(zhì)、促乳素、血液因子X、血液因子VIII、截短的ATIII和促紅細(xì)胞生成素，且其中所述的第二個(gè)蛋白多肽與所述的所需蛋白的天然序列超過85％同源。
81.治療人皮膚病或損傷的方法，使用含有融合蛋白物質(zhì)的組合物，所述融合蛋白包括第一個(gè)蛋白多肽結(jié)構(gòu)域和共價(jià)連接的第二個(gè)蛋白多肽結(jié)構(gòu)域，所述的第一個(gè)蛋白多肽結(jié)構(gòu)域編碼人α-甲胎蛋白氨基酸序列，且其中所述第二個(gè)蛋白多肽結(jié)構(gòu)域編碼具有所需蛋白生理活性的生物藥物蛋白產(chǎn)物，所需蛋白選自抗凝血酶III、α-1-抗胰蛋白酶和核心蛋白聚糖，且其中所述第二個(gè)蛋白多肽與所述的所需蛋白的天然序列超過85％同源。
82.權(quán)利要求81的方法，其中所述的人皮膚病或損傷選自光老化損傷、鼻炎、曬斑、皮炎和燒傷。
83.權(quán)利要求28的方法，其中所述的病癥是肌肉萎縮。
84.權(quán)利要求28的方法，其中所述的病癥是胰島素依賴性糖尿病。
85.權(quán)利要求28的方法，其中所述的病癥是牛皮癬。
86.權(quán)利要求28的方法，其中所述的病癥是系統(tǒng)性紅斑狼瘡。
87.權(quán)利要求28的方法，其中所述的病癥是多毛細(xì)胞白血病。
88.權(quán)利要求28的方法，其中所述的病癥是慢性骨髓性自血病。
89.權(quán)利要求28的方法，其中所述的病癥是皮膚T細(xì)胞淋巴瘤類癌瘤。
90.權(quán)利要求28的方法，其中所述的病癥是腎細(xì)胞癌。
91.權(quán)利要求28的方法，其中所述的病癥是頭和頸的鱗狀上皮腫瘤。
92.權(quán)利要求28的方法，其中所述的病癥是多發(fā)性骨髓瘤。
93.權(quán)利要求28的方法，其中所述的病癥是惡性黑素瘤。
94.權(quán)利要求28的方法，其中所述的病癥是乙型肝炎。
95.權(quán)利要求28的方法，其中所述的病癥是丙型肝炎。
96.權(quán)利要求28的方法，其中所述的病癥是低級非霍奇金淋巴瘤。
全文摘要
從轉(zhuǎn)基因動(dòng)物的奶中生產(chǎn)和純化所需的融合蛋白。作為融合蛋白制得肽具有合適的融合配偶體如人α－甲胎蛋白。融合配偶體蛋白促進(jìn)和提高了整個(gè)分子的半衰期以及其自身具有治療效用。通常通過使用轉(zhuǎn)基因動(dòng)物來產(chǎn)生融合蛋白且目前可以通過親和純化方法從這樣動(dòng)物的奶中或其它體液中純化出來。通過該途徑生產(chǎn)肽的特定優(yōu)勢，除了高產(chǎn)量和生物相容性的明顯優(yōu)勢外，是特定的翻譯后修飾，如羧基端酰胺化，可以在乳腺中進(jìn)行。包括與人α－甲胎蛋白片段或其變體融合的治療活性多肽的生物活性多肽，及其制備方法，編碼這樣融合多肽的核苷酸序列，包括這樣核苷酸序列的表達(dá)盒，含有這樣表達(dá)盒的自我復(fù)制的質(zhì)粒，以及含有所述融合多肽的藥物組合物。
文檔編號C07H21/04GK1871252SQ200480030708
公開日2006年11月29日申請日期2004年9月3日優(yōu)先權(quán)日2003年9月5日
發(fā)明者H·米德, G·F·考克斯申請人:Gtc生物治療學(xué)公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：H.米德;G.F.考克斯
技術(shù)所有人：GTC生物治療學(xué)公司
我是此專利的發(fā)明人

上一篇：新三萜衍生物、其制備方法及其應(yīng)用的制作方法
上一篇：烯烴的制備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、張老師：1.探索新型氧化還原酶結(jié)構(gòu)-功能關(guān)系，電催化反應(yīng)機(jī)制 2.酶電催化導(dǎo)向的酶分子改造 3.納米材料、生物功能多肽對酶-電極體系的影響4. 生物電化學(xué)傳感和生物電合成體系的設(shè)計(jì)與應(yīng)用。
2、鄔老師：1.高分子材料的共混與復(fù)合 2.涉及材料功能化及結(jié)構(gòu)與性能的研究；高分子熱穩(wěn)定劑的研發(fā)
3、趙老師：1.電化學(xué)離子儲存和分離技術(shù) 2.工業(yè)結(jié)晶
4、廖老師：1. 晶面可控氧化鋁、碳基載體及催化劑等高性能、新結(jié)構(gòu)催化材料研究 2. 乙烯環(huán)氧化催化劑的研究與開發(fā) 3. 低碳不飽和烯烴的選擇性氧化催化劑及工業(yè)技術(shù)開發(fā)
5、李老師：1. 加氫精制 2. 選擇加氫 3. 加氫脫氧 4. 介孔及介微孔分子篩合成及催化應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

安利蛋白粉轉(zhuǎn)基因相關(guān)技術(shù)

轉(zhuǎn)基因bt毒蛋白相關(guān)技術(shù)

bt蛋白與轉(zhuǎn)基因相關(guān)技術(shù)

低蛋白米是轉(zhuǎn)基因大米相關(guān)技術(shù)

非轉(zhuǎn)基因蛋白酶相關(guān)技術(shù)

轉(zhuǎn)基因大豆蛋白含量相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在轉(zhuǎn)基因哺乳動(dòng)物奶中生產(chǎn)融合蛋白的方法