在轉(zhuǎn)基因動(dòng)物中生產(chǎn)纖維蛋白原的制作方法

文檔序號(hào)：448930閱讀：928來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>食品,飲料機(jī)械,設(shè)備的制造及其制品加工制作,儲(chǔ)藏技術(shù)

專利名稱：在轉(zhuǎn)基因動(dòng)物中生產(chǎn)纖維蛋白原的制作方法
背景技術(shù)：
血液凝集系列反應(yīng)的最后一步是由凝血酶催化將可溶性的血漿蛋白纖維蛋白原轉(zhuǎn)化為不溶性的纖維蛋白。凝血酶從纖維蛋白原的三條組成鏈之一(Aα)上切下一條小肽(纖維蛋白肽A)。隨后纖維蛋白發(fā)生聚合，并在凝血因子X(jué)III的激活下交聯(lián)形成穩(wěn)定的血栓。
纖維蛋白原是生物組織膠的一個(gè)關(guān)鍵成分(見U.S.Patent Nos.4,377,572和4,442,655)，生物組織膠能模擬自然血栓的形成，啟動(dòng)止血過(guò)程及修復(fù)受損組織。組織膠提供縫合線，卡釘以及其它縫合傷口的機(jī)械方法的附件或替代品。然而，這些產(chǎn)品的基本組分(纖維蛋白原，因子X(jué)III和凝血酶)是從人的血漿庫(kù)中通過(guò)低溫沉淀(例如U.S.Patent Nos.4,377,572；4,362,567；4,909,251)或乙醇沉淀(例如U.S.PatentNos.4,442,655)或者是從單一提供者血漿中(如U.S.Patent No.4,627,879，Spotnitzet al.，Am.Surg.55166-168，1989)制備的。得到的纖維蛋白原/因子X(jué)III制劑在使用前迅速與牛凝血酶混合，將纖維蛋白原轉(zhuǎn)變成纖維蛋白，并激活因子X(jué)III，由此開始粘合劑的凝聚過(guò)程。
市場(chǎng)上可得到的粘合劑來(lái)源于血庫(kù)中的血漿，由于血源產(chǎn)品已伴隨有人免疫缺陷病毒(HIV)，肝炎病毒和其它致病原的傳播，因此限制了這類粘合劑的可接受性和可得性，現(xiàn)在它們?cè)诿绹?guó)已禁止使用。
使用自體血漿可降低疾病傳播的危險(xiǎn)，但自體粘合劑僅能使用于有選擇的外科手術(shù)中，而且患者要預(yù)先提供所需的血液。
如上所述，纖維蛋白原由三種多肽鏈組成，每一種在裝配好的分子中以雙體存在。這些被命名為Aα，Bβ和γ鏈的多肽鏈，在肝臟中協(xié)調(diào)表達(dá)，裝配和分泌。盡管可預(yù)期重組DNA技術(shù)已能提供一種替代方法來(lái)代替從血漿中分離纖維蛋白原，這一點(diǎn)已證明是有困難的。三種纖維蛋白原多肽鏈已分別單獨(dú)在E.coli中表達(dá)(Lord，DNA433-38，1985；Bolyard and Lord，Gene66183-192，1988；Bolyard and Lord，Blood731202-1206)，但有功能的纖維蛋白原還沒(méi)能在真核系統(tǒng)中生產(chǎn)出來(lái)。生物感受態(tài)纖維蛋白原在酵母中的表達(dá)還未見報(bào)道。培養(yǎng)的轉(zhuǎn)染的哺乳動(dòng)物細(xì)胞已被用來(lái)表達(dá)生物感受態(tài)纖維蛋白原(Farrell et al.，Blood7455a，1989；Hartwig and Danishefsky，J.Biol.Chem.2666578-6585，1991；Farrell et al.，Biochemistry309414-9420，1991)，但表達(dá)水平之低使得生產(chǎn)商業(yè)數(shù)量的重組纖維蛋白原不具可行性。實(shí)驗(yàn)證據(jù)說(shuō)明，與肝臟相比，培養(yǎng)細(xì)胞中的較低的轉(zhuǎn)錄效率可能是表達(dá)水平低的一個(gè)原因，但在轉(zhuǎn)染的BHK細(xì)胞中增加纖維蛋白原鏈的mRNA的總量并沒(méi)有引起纖維蛋白原蛋白分泌的相應(yīng)增加(Prunkard and Forster，XIV Congress of the International Society on Thrombosisand Haemostasis，1993)。后面的這些結(jié)果暗示，纖維蛋白原的正確裝配與加工有一些組織特異性的機(jī)制，而這些機(jī)制在普通的實(shí)驗(yàn)條件下的細(xì)胞株中并不存在。
現(xiàn)有技術(shù)中還需要生產(chǎn)大量的高質(zhì)量的用于組織粘合劑和其它用途的纖維蛋白原的方法，更需要的是不含血液病原體的纖維蛋白原。本發(fā)明滿足了這些需要并提供了其它有關(guān)的優(yōu)勢(shì)。發(fā)明概述本發(fā)明的一個(gè)目的是提供商用數(shù)量的重組纖維蛋白原，尤其是重組人纖維蛋白原。本發(fā)明的另一個(gè)目的是提供在轉(zhuǎn)基因動(dòng)物，特別是家畜，如牛，綿羊，豬和山羊的乳腺組織中表達(dá)纖維蛋白原的材料和方法。
一方面，本發(fā)明提供了一種生產(chǎn)纖維蛋白原的方法，包括(a)提供編碼與纖維蛋白原Aα鏈相連接的分泌信號(hào)的第一條DNA片段，編碼與纖維蛋白原Bβ鏈相連接的分泌信號(hào)的第二條DNA片段，和編碼與纖維蛋白原γ鏈相連接的分泌信號(hào)的第三條DNA片段，其中第一、第二、第三條片段中的每一條都與在雌性哺乳動(dòng)物宿主的乳腺中表達(dá)其所需要的附加的DNA片段相連接；(b)將DNA片段導(dǎo)入一個(gè)非人類哺乳動(dòng)物物種的受精卵；(c)將該受精卵植入該物種的雌性動(dòng)物的輸卵管或子宮內(nèi)，以獲得帶有該DNA結(jié)構(gòu)的后代；(d)繁殖該后代以產(chǎn)生雌性后裔，來(lái)表達(dá)第一、第二、第三條DNA片段并生產(chǎn)出含有由這些片段編碼的生物感受態(tài)纖維蛋白原的乳汁；(e)從這些雌性后裔中收集乳汁；以及(f)從這些乳汁中回收纖維蛋白原。在一個(gè)實(shí)施方案中，帶有導(dǎo)入片段的受精卵在植入之前要培養(yǎng)一段時(shí)間。
另一方面，本發(fā)明提供了一種生產(chǎn)纖維蛋白原的方法，包括以下步驟(a)將編碼與纖維蛋白原Aα鏈相連的分泌信號(hào)的第一條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第一個(gè)融合基因；(b)將編碼與纖維蛋白原Bβ鏈相連的分泌信號(hào)的第二條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第二個(gè)融合基因；(c)將編碼與纖維蛋白原γ鏈相連的分泌信號(hào)的第三條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第三個(gè)融合基因；(d)將第一、第二、第三個(gè)融合基因?qū)胍环侨祟惒溉閯?dòng)物的種系，使得該DNA片段在該動(dòng)物或其雌性后裔的乳腺中表達(dá)，并且生物感受態(tài)纖維蛋白原分泌到該哺乳動(dòng)物或其雌性后裔的乳汁中；(e)從該哺乳動(dòng)物或其雌性后裔中獲取乳汁；以及(f)從乳汁中回收纖維蛋白原。在優(yōu)選的實(shí)施方案中，哺乳動(dòng)物是綿羊、豬、山羊或牛。
另一方面，本發(fā)明提供了一種生產(chǎn)纖維蛋白原的方法包括以下步驟(a)提供一種非人類的轉(zhuǎn)基因雌性哺乳動(dòng)物，在其種系中帶有編碼纖維蛋白原Aα，Bβ及γ鏈的異源DNA片段，其中的DNA片段在該哺乳動(dòng)物的乳腺中表達(dá)而該DNA片段所編碼的纖維蛋白原被分泌到該哺乳動(dòng)物的乳汁中；(b)從該哺乳動(dòng)物中收集乳汁；(c)從乳汁中回收纖維蛋白原。
另一方面，本發(fā)明提供了一種非人類的哺乳動(dòng)物的胚胎，在其細(xì)胞核中含有編碼纖維蛋白原Aα，Bβ及γ鏈的外源DNA片段。在一個(gè)相關(guān)的方面，本發(fā)明提供了一種轉(zhuǎn)基因的非人類雌性哺乳動(dòng)物，它在乳汁中生產(chǎn)可回收量的人纖維蛋白原。
另一方面，本發(fā)明提供了一種生產(chǎn)哺乳動(dòng)物的轉(zhuǎn)基因后代的方法，它包括以下步驟(a)提供編碼纖維蛋白原Aα鏈的第一條DNA片段，編碼纖維蛋白原Bβ鏈的第二條DNA片段，以及編碼纖維蛋白原γ鏈的第三條DNA片段，其中所說(shuō)的第一，第二和第三條DNA片段中的每一條都連接有附加的DNA片段，以滿足使其在宿主雌性哺乳動(dòng)物的乳腺中表達(dá)及分泌到宿主雌性哺乳動(dòng)物乳汁中的要求；(b)將該DNA片段導(dǎo)入非人類哺乳動(dòng)物的一個(gè)受精卵中；(c)將受精卵植入雌性非人類種屬動(dòng)物的輸卵管或子宮內(nèi)，以獲得帶有第一、第二和第三個(gè)DNA片段的后代。在一個(gè)相關(guān)的方面，本發(fā)明提供根據(jù)該程序生產(chǎn)的非人類哺乳動(dòng)物。
另一方面，本發(fā)明提供了帶有編碼異源纖維蛋白原Aα，Bβ及γ鏈的種系DNA片段的非人類哺乳動(dòng)物，其中該哺乳動(dòng)物的雌性后裔在其乳腺中表達(dá)這些DNA片段來(lái)生產(chǎn)生物感受態(tài)纖維蛋白原。
參考以下的詳細(xì)說(shuō)明及附圖后，本領(lǐng)域熟練技術(shù)人員將會(huì)明白本發(fā)明的這些方面及其它方面。附圖簡(jiǎn)述

圖1闡述人纖維蛋白原Aα鏈DNA序列的亞克隆。
圖2是載體Zem228的部分限制性圖譜。所用的符號(hào)MT-1p代表鼠金屬硫蛋白啟動(dòng)子；SV40t代表SV40終止子；以及SV40p代表SV40啟動(dòng)子。
圖3闡述人纖維蛋白原Bβ鏈DNA序列的亞克隆。
圖4闡述人纖維蛋白原γ鏈DNA序列的亞克隆。
圖5是載體Zem219b的部分限制性圖譜。使用的符號(hào)MT-1P代表鼠金屬硫蛋白啟動(dòng)子；hGHt代表人生長(zhǎng)激素終止子；SV40p代表SV40啟動(dòng)子；DHFR代表二氫葉酸還原酶基因；以及SV40t代表SV40終止子。本發(fā)明的詳細(xì)描述在開始本發(fā)明的詳述之前，定義一些用于本文的術(shù)語(yǔ)將會(huì)有所幫助用于本文時(shí)，術(shù)語(yǔ)“生物感受態(tài)纖維蛋白原”用來(lái)指當(dāng)用凝血酶處理時(shí)能發(fā)生聚合形成不溶性纖維蛋白的纖維蛋白原。
術(shù)語(yǔ)“卵”用來(lái)指未受精的卵細(xì)胞、在原核融合以前已受精的卵細(xì)胞或早期胚胎(具有融合原核的受精卵細(xì)胞)。
“生產(chǎn)含有生物感受態(tài)纖維蛋白原的乳汁的雌性哺乳動(dòng)物”是一個(gè)在懷孕與分娩后，在哺乳期間，生產(chǎn)含有可回收量的生物感受態(tài)纖維蛋白原的乳汁的動(dòng)物。本領(lǐng)域熟練技術(shù)人員能認(rèn)識(shí)到這些動(dòng)物斷斷續(xù)續(xù)地產(chǎn)奶，因而斷斷續(xù)續(xù)地生產(chǎn)纖維蛋白原。
術(shù)語(yǔ)“后裔”用的即是其一般含義，包括子女及后代。
術(shù)語(yǔ)“異源的”用來(lái)指其來(lái)源與其所導(dǎo)入的動(dòng)物物種不同的遺傳物質(zhì)，或者是從這些遺傳物質(zhì)中生產(chǎn)出來(lái)的蛋白質(zhì)。
在本發(fā)明中，轉(zhuǎn)基因動(dòng)物技術(shù)被運(yùn)用來(lái)在宿主雌性哺乳動(dòng)物的乳腺中生產(chǎn)纖維蛋白原。所感興趣的蛋白在乳腺中的表達(dá)及隨后向乳汁中的分泌克服了在用其它途徑分離蛋白質(zhì)時(shí)所遇到的許多困難。乳汁很容易被收集，并可大量得到，而且能很好地進(jìn)行生物化學(xué)鑒定，另外，存在于乳汁中的主要蛋白質(zhì)的濃度很高(從約1g/L到15g/L)。
從商業(yè)觀點(diǎn)來(lái)看，很清楚優(yōu)選的是使用那些產(chǎn)奶量大的物種作為宿主。雖然較小的動(dòng)物如小鼠和大鼠也可以使用(而且優(yōu)選的是使用于驗(yàn)證概念階段)，在本發(fā)明中優(yōu)選的是使用家畜，包括但并非限于使用豬、山羊、綿羊和牛。綿羊是特別優(yōu)選的，這是基于如下因素如在該物種中有轉(zhuǎn)基因的歷史，產(chǎn)乳量，費(fèi)用及收集綿羊奶的設(shè)備的易得性。影響宿主物種的選擇的因素的比較見WO88/00239。通常的愿望是選擇已作為日常用途喂養(yǎng)的動(dòng)物來(lái)繁殖，例如East，F(xiàn)riesland綿羊，或者是通過(guò)將轉(zhuǎn)基因系喂養(yǎng)一段時(shí)間導(dǎo)入日常的家系。無(wú)論怎樣，應(yīng)該使用熟悉的，具有良好健康狀況的動(dòng)物。
根據(jù)本發(fā)明生產(chǎn)的纖維蛋白原可以是人纖維蛋白原或非人類動(dòng)物的纖維蛋白原。作為藥用的話，優(yōu)選的是應(yīng)用對(duì)患者來(lái)說(shuō)是天然的蛋白質(zhì)，因此本發(fā)明提供了在人類和畜類藥物中都可使用的纖維蛋白原。編碼人纖維蛋白原的成分鏈的克隆的DNA分子是由這些人描述的Rixon et al.(Biochem.223237，1983)，Chung et al.(Biochem.223244，1983)，Chung et al.(Biochem.223250，1983)，Chung et al.(Adv.Exp.Med.Biol.28139-48，1990)以及Chung et al.(Ann.NY Acad.Sci.408449-456，1983)。牛纖維蛋白原的克隆由Brown et al.(Nuc.Acad.Res.176397，1989)和Chung etal.(Proc.Natl.Acad.Sci.USA 781466-1470，1981)描述，其它的哺乳動(dòng)物纖維蛋白原由Murakawa et al.(Thromb.Haemost.69351-360，1993)描述。人類Aα，Bβ和γ鏈基因的代表性序列分別顯示于SEQ ID NOS1，3和5。那些熟練技術(shù)人員將明白這些序列的等位變異體將是存在的；另外的突變體可以通過(guò)氨基酸的置換、缺失或插入產(chǎn)生；而且這樣的變異體在本發(fā)明中是有用的。一般地，優(yōu)選的是那些包括僅僅有限數(shù)目的氨基酸置換、缺失或插入的工程變異體，并且任何置換都是保守性的，因此優(yōu)選的方案是生產(chǎn)在序列上與相應(yīng)的天然鏈至少有90％，較好的是至少95％，更好的是有至少99％或更多同一性的纖維蛋白原鏈多肽。術(shù)語(yǔ)“γ鏈”指的是包括纖維蛋白原的替代性拼接的γ’鏈(Chung et al.，Biochem.234232-4236，1984)。人類γ’鏈的氨基酸序列顯示于SEQ ID NO6。較短的γ鏈?zhǔn)怯蒘EQ ID NO5的9511位和10054位核苷酸之間的替代性拼接而產(chǎn)生的，因而翻譯終止于SEQ ID NO5中的10065位核苷酸之后。
為獲得在乳腺中的表達(dá)，使用了一種來(lái)源于乳蛋白基因的轉(zhuǎn)錄啟動(dòng)子。乳蛋白基因包括那些編碼酪蛋白，β-乳球蛋白(BLG)，乳清蛋白，以及乳清酸性蛋白的基因。β-乳球蛋白啟動(dòng)子是優(yōu)選的。若是羊β-乳球蛋白基因，羊BLG基因5’側(cè)序列的至少約406bp(包括在SEQ ID NO7的核苷酸3844-4257中)的區(qū)域?qū)⑼ǔ１挥玫?。?yōu)選的是更大部分的5’側(cè)序列，直到大約5Kbp。一條更大的DNA片段，包括5’側(cè)啟動(dòng)子區(qū)域及β-乳球蛋白基因的5’非編碼區(qū)域(包括在SEQ ID NO7的核苷酸1-4257)是特別優(yōu)選的。見Whitelaw et al.，Biochem.J.28631-39，1992。來(lái)自于其它種屬的類似的啟動(dòng)子DNA片段也是適用的。
β-乳球蛋白基因的其它區(qū)域也能摻入到結(jié)構(gòu)中，正如待表達(dá)的基因的基因組區(qū)域?，F(xiàn)有技術(shù)中通常接受的是失去了內(nèi)含子的結(jié)構(gòu)，例如，與那些含有這樣的DNA序列的相比，其表達(dá)性很差(見Brinster et al.，Proc.Natl.Acad.Sci.USA.85836-840，1988；Palmiter et al.，Proc.Natl.Acad.Sci.USA.88478-482，1991；Whitelawet al.，Transgenic Res.13-13，1991；WO 89/01343；WO 91/02318)。在這一點(diǎn)上，通常優(yōu)選的方案是，在可能時(shí)，使用含有所有或一些編碼所感興趣的蛋白質(zhì)或多肽的基因中的天然內(nèi)含子的基因組序列。在本發(fā)明的某些實(shí)施例中，優(yōu)選方案是還包括至少一些來(lái)自于β-乳球蛋白基因的內(nèi)含子。一個(gè)這樣的區(qū)域是一條提供內(nèi)含子拼接及RNA多腺苷酸化的、來(lái)自于羊β-乳球蛋白基因的3’非編碼區(qū)的DNA片段。當(dāng)用一個(gè)基因的天然3’非編碼區(qū)取代時(shí)，這一羊β-乳球蛋白片段同時(shí)能增強(qiáng)與穩(wěn)定感興趣的蛋白質(zhì)或多肽的表達(dá)水平。在其它的實(shí)施方案中，一個(gè)或多個(gè)纖維蛋白原序列的起始ATG附近的區(qū)域被替換成來(lái)自于乳汁特異性蛋白基因的相應(yīng)的序列。這樣的替換提供了所推想的組織特異性起始環(huán)境以增強(qiáng)表達(dá)。很容易將全部的纖維蛋白原鏈的前原和5’非編碼區(qū)序列置換為那些例如BLG基因的相應(yīng)序列，盡管較小的區(qū)域也能被置換。
為了表達(dá)纖維蛋白原，編碼纖維蛋白原的三種組分多肽鏈的每個(gè)DNA片段都連接有其表達(dá)所需的附加的DNA片段。這些附加的片段包括以上所提到過(guò)的乳類蛋白基因啟動(dòng)子，還有提供轉(zhuǎn)錄終止和mRNA多腺苷酸化的序列。表達(dá)單位還包括與編碼纖維蛋白原多肽鏈的片段相連接的編碼分泌信號(hào)的DNA片段。分泌信號(hào)可能是天然的纖維蛋白原分泌信號(hào)也可能是另一種蛋白，例如一種乳蛋白的信號(hào)肽。術(shù)語(yǔ)“分泌信號(hào)”用于此處指的是一個(gè)蛋白質(zhì)中指導(dǎo)其穿過(guò)細(xì)胞的分泌途徑到外面的部分。分泌信號(hào)最常見的是在蛋白質(zhì)的N-端。例如，可見von Heinje.Nuc.Acids Res.144683-4690，1986；和meadeet al.，U.S.Patent No.4,873,316中所述。
表達(dá)單位的構(gòu)建很容易通過(guò)將纖維蛋白原鏈序列插入到一個(gè)質(zhì)粒或噬菌體載體中來(lái)實(shí)現(xiàn)，這些載體中含有附加的DNA片段；當(dāng)然表達(dá)單位也能通過(guò)基本的任一序列的連接反應(yīng)來(lái)構(gòu)建。尤其便利的是提供一個(gè)含有編碼乳蛋白的DNA片段的載體，并將編碼乳蛋白的序列置換成編碼一條纖維蛋白原鏈(包括分泌信號(hào))的序列，因此產(chǎn)生一個(gè)包括有乳蛋白基因的表達(dá)調(diào)控序列的基因融合體。無(wú)論如何，表達(dá)單位在質(zhì)粒或其它載體中的克隆方便了纖維蛋白原序列的擴(kuò)增。擴(kuò)增很容易在細(xì)菌(如E.coli)宿主細(xì)胞中進(jìn)行，這樣典型的載體將包括一個(gè)在細(xì)菌宿主細(xì)胞中的復(fù)制原點(diǎn)和一個(gè)選擇性標(biāo)記。
考慮到纖維蛋白原鏈基因的大小最為實(shí)際的是制備三種分離的表達(dá)單位，將其混合，并將混合物導(dǎo)入宿主中。然而，本領(lǐng)域熟練技術(shù)人員會(huì)明白其它的程序也是可行的。例如，三條鏈的表達(dá)單位可以單個(gè)分別導(dǎo)入不同的胚胎，隨后通過(guò)繁殖使之結(jié)合。在第三種方法中，三個(gè)表達(dá)單位可以連接在一個(gè)合適的載體中，如酵母人工染色體或噬菌體P1克隆。兩條或三條鏈的編碼序列可以結(jié)合在多順?lè)醋颖磉_(dá)單位中(見Levinson etal.，U.S.Patent No.4,713,339)。
然后，表達(dá)單位被導(dǎo)入所選擇的宿主的受精卵(包括早期胚胎)中。異源基因的導(dǎo)入可以通過(guò)幾條途徑之一而完成，包括顯微注射(如U.S.Patent No.4,873,191)，反轉(zhuǎn)錄病毒感染(Jaenisch，Science 2401468-1474，1988)或使用胚胎干細(xì)胞(ES)的定點(diǎn)整合(Bradly et al.，Bio/Technology 10534-539，1992)。該受精卵然后被植入假孕雌性動(dòng)物的輸卵管或子宮內(nèi)并讓其繼續(xù)發(fā)育。在其種系中帶有導(dǎo)入的DNA的后代可以通過(guò)正常的孟德爾遺傳方式將該DNA傳給其后裔，并發(fā)展成轉(zhuǎn)基因種群。制造轉(zhuǎn)基因動(dòng)物的一般方法是現(xiàn)有技術(shù)中已知的。如可見以下所引的參考文獻(xiàn)Hogan et al.，Manipulating the Mouse EmbryoA Laboratory Manual，Cold Spring Harbor Laboratory，1986；Simons et al.，Bio/Technology 6179-183，1988；Wall et al.，Biol.Repord.32645-651，1985；Buhler et al.，Bio/Technology 8140-143，1990；Ebert et al.，Bio/Technology 9835-838，1991；Krimpenfort et al.，Bio/Technology 9844-847，1991；Wall et al.，J.Cell.Biochem.49113-120，1992；以及WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及GB 87/00458。將外源DNA導(dǎo)入哺乳動(dòng)物及其生殖細(xì)胞的技術(shù)最初是在小鼠中發(fā)展起來(lái)的。見Gordon et al.，Proc.Natl.Acad.Sci.USA777380-7384，1980；Gordon and Ruddle，Science 2141244-1246，1981；Palmiter andBrinster，Cell 41343-345，1985；Brinster et al.，Proc.Natl.Acad.Sci.USA824438-4442，1985；and Hogan et al.，(ibid.)。這些技術(shù)后來(lái)也適用于較大的動(dòng)物，包括家畜(見WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及Simons et al.，Bio/Technology 6179-183，1988)。概括地說(shuō)，到目前為止，已在轉(zhuǎn)基因小鼠和家畜的生產(chǎn)中，用最有效的方法，將數(shù)以百計(jì)的感興趣的線性DNA分子注射進(jìn)受精卵的原核中。將該DNA注入受精卵的細(xì)胞質(zhì)中也是可行的。
優(yōu)選方案是獲得每條纖維蛋白原鏈的平衡表達(dá)，使得成熟蛋白質(zhì)的形成較有效。理想的是，三個(gè)表達(dá)單位應(yīng)該在導(dǎo)入受精卵的同一個(gè)DNA分子中。然而，這種方法會(huì)產(chǎn)生一些技術(shù)上的難題，例如在注射和操作階段。比如，纖維蛋白原表達(dá)單位的大小使得必須在注射前使用酵母人工染色體(YACs)或噬菌體P1來(lái)擴(kuò)增和操作DNA。若按此方法進(jìn)行，待注射的含有所有三個(gè)表達(dá)單位的DNA片段將會(huì)非常巨大，因此要求將注射方法作一些修改，如使用更大號(hào)的針頭。在一個(gè)較為簡(jiǎn)單的方法中，使用的是各種單個(gè)表達(dá)單位的混合物。優(yōu)選方案是結(jié)合等摩爾量的三種表達(dá)單位，雖然本領(lǐng)域熟練技術(shù)人員會(huì)明白這種比例可以根據(jù)所給的表達(dá)單位的性質(zhì)而作一些改變。當(dāng)使用較少摩爾數(shù)的一種或兩種鏈時(shí)，也能得到某種程度的表達(dá)，但一般說(shuō)來(lái)其水平會(huì)降低。通?？梢灶A(yù)期的是若以偏離優(yōu)選的等摩爾比例的比例進(jìn)行，其表達(dá)效率將會(huì)下降。不管怎樣，優(yōu)選的方案是使用一種混合物，其中Aα∶Bβ∶γ表達(dá)單位的比例在0.5-1∶0.5-1∶0.5-1范圍之內(nèi)。若將其比例從等摩爾狀態(tài)改變，優(yōu)選的是使用相對(duì)多一些的Bβ表達(dá)單位。另外，一個(gè)表達(dá)單位或是兩種表達(dá)單位的混合物也可導(dǎo)入單獨(dú)的卵中，當(dāng)然，由此而來(lái)的動(dòng)物將只表達(dá)一條或兩條纖維蛋白原鏈。要用這種方法產(chǎn)生完整的纖維蛋白原分子就要求隨后進(jìn)行一個(gè)繁殖過(guò)程，以結(jié)合存在于一群動(dòng)物的個(gè)體中的所有三種表達(dá)單位。
一般地，雌性動(dòng)物要用促濾泡激素處理使之超數(shù)排卵，然后交配。收集受精卵，然后用已知方法將異源DNA注射進(jìn)入卵中?？梢娨韵滤玫奈墨I(xiàn)U.S.Patent No.4,873,191；Gordon et al.，Proc.Natl.Acad.Sci.USA 777380-7384，1980；Gordonand Ruddle，Science 2141244-1246，1981；Palmiter and Brinster，Cell 41343-345，1985；Brinster et al.，Proc.Natl.Acad.Sci.USA 824438-4442，1985；Hogan etal.，Manipulating the Mouse EmbryoA Laboratory Manual，Cold Spring HarborLaboratory，1986；Simons et al.，Bio/Technology 6179-183，1988；Wall et al.，Biol.Repord.32645-651，1985；Buhler et al.，Bio/Technology 8140-143，1990；Ebert et al.，Bio/Technology 9835-838，1991；Krimpenfort et al.，Bio/Technology9844-847，1991；Wall et al.，J.Cell.Biochem.49113-120，1992；以及WIPO出版物WO 88/00239，WO 90/05188，WO 92/11757；以及GB 87/00458。
為了注射進(jìn)入受精卵中，要用合適的限制性酶消化將表達(dá)單位從其各自的載體中切下。為了方便起見，優(yōu)選的方案是設(shè)計(jì)的載體使得切下表達(dá)單位的酶不會(huì)在表達(dá)單位內(nèi)部或載體上別的地方有切割位點(diǎn)。表達(dá)單位通過(guò)傳統(tǒng)方法回收，例如電泳洗脫，隨后用酚抽提，用乙醇沉淀，以及蔗糖密度梯度離心，或結(jié)合使用這些方法。
DNA注射到卵中，基本上是按照上述Hogan et al.的方法。在一次典型的注射中，使用體視可調(diào)焦顯微鏡(優(yōu)選×50或×63)，將在一個(gè)裝有胚胎培養(yǎng)基的盤子中的卵子固定。合適的培養(yǎng)基包括Hepes(N-2-羥乙基哌嗪-N’-2-乙磺酸)或碳酸氫鹽緩沖培養(yǎng)基如M2或M16(可購(gòu)自Sigma Chemical Co.，St.Louis，USA)或合成的輸卵管培養(yǎng)基(見下述)。使用一個(gè)用毛細(xì)管做的drummond吸管將卵固定并轉(zhuǎn)移到注射裝置上的玻璃載片的中央。在此步驟時(shí)，使用低倍鏡(×4)觀察。使用注射裝置上的吸管將卵子定位于載玻片的中心。單個(gè)的卵隨后被固定到吸管上以備注射。每一次注射，吸管/卵都要定位于視野的中心。然后將注射針頭定位于卵的正下方。最好使用×40倍的Nomarski目鏡，兩個(gè)操作臺(tái)的高度調(diào)節(jié)到使卵和針頭同時(shí)聚焦。通過(guò)旋轉(zhuǎn)卵和調(diào)節(jié)吸管，將原核定位。一旦原核被定位后，調(diào)節(jié)操作臺(tái)的高度使其聚焦于原核膜。注射器針頭位于卵的下方并使針尖正好處于原核中心下面的位置。然后使用注射操作裝置調(diào)整針頭的位置，使針頭和原核進(jìn)入同一個(gè)聚焦平面。通過(guò)注射操作裝置上的操縱桿(joy stick)移動(dòng)針頭到卵的右方。用一個(gè)短的連續(xù)穿刺動(dòng)作，將原核膜刺穿并使針尖留在原核內(nèi)。通過(guò)玻璃針筒給注射針頭加壓，直到原核膨脹到接近原來(lái)體積的兩倍。此時(shí)，緩慢地移走針頭，轉(zhuǎn)回到低倍鏡(如×4)，將注射過(guò)的卵移到玻璃片上的不同的區(qū)域，并對(duì)另一只卵重復(fù)該程序。
DNA注射完畢之后，培養(yǎng)該卵細(xì)胞使原核融合，生產(chǎn)一單細(xì)胞胚胎或較晚期胚胎。一般地，卵的培養(yǎng)在該種的體溫下并在含有平衡的鹽和血清的緩沖培養(yǎng)基中進(jìn)行。然后將活的胚胎轉(zhuǎn)移進(jìn)假孕的受體雌性動(dòng)物中，典型的做法是將其植入輸卵管或子宮，使之發(fā)育。在胚胎發(fā)生過(guò)程中，注射的DNA將以隨機(jī)方式整合到少數(shù)發(fā)育胚胎的染色體中。
潛在的轉(zhuǎn)基因后代通過(guò)血樣和/或組織活體解剖進(jìn)行篩選。從這些樣品中制備出DNA并檢查注入的結(jié)構(gòu)的存在，可利用諸如聚合酶鏈?zhǔn)椒磻?yīng)(PCR，見Mullis，U.S.Patent No.4,683,202)和Southern印跡(Southern，J.Mol.Biol.98503，1975；Maniatis etal.，Molecular CloningA Laboratory Manual，Cold Spring Harbor Laboratory，1982)等技術(shù)?！敖⒄?founder)”轉(zhuǎn)基因動(dòng)物，或稱G0s，可以是完全轉(zhuǎn)基因的，即在其所有細(xì)胞中都有轉(zhuǎn)基因；也可以是部分的，只在某一類細(xì)胞中有轉(zhuǎn)入的基因(見Wilkieet al.，Develop.Biol.1189-18，1986)。在后一種情況下，生殖細(xì)胞集團(tuán)中可能是全部的或部分的轉(zhuǎn)基因的。而且，在后一種情況下，實(shí)際所得到的“建立者”的后代中的轉(zhuǎn)基因后代的比例還不足根據(jù)孟德爾定律預(yù)測(cè)值的50％。“建立者”G0動(dòng)物生長(zhǎng)到性成熟期后，進(jìn)行交配，得到后代，或稱G1s。G1s同樣檢查轉(zhuǎn)基因的存在，確定其是否從“建立者”G0動(dòng)物中傳了下來(lái)。若是雄性G0s，可使其與數(shù)個(gè)未轉(zhuǎn)基因的雌性交配，以產(chǎn)生大量后代，此舉增加了發(fā)現(xiàn)轉(zhuǎn)基因傳遞的機(jī)會(huì)。雌性“建立者”G0可以通過(guò)自然交配、人工授精或超數(shù)排卵得到許多卵子并轉(zhuǎn)移給代理母親。后一種方法給出了在那些產(chǎn)仔量少的動(dòng)物中觀察到轉(zhuǎn)基因傳遞的最好的機(jī)會(huì)。上述的繁殖程序被用來(lái)獲得能將DNA以正常的孟德爾方式遺傳給后代的動(dòng)物，并使其發(fā)展成轉(zhuǎn)基因動(dòng)物的種群(小鼠、綿羊、豬、山羊、牛)。
從哺乳期的G0和G1雌性動(dòng)物中得到的乳汁要進(jìn)行異源蛋白的檢查，依靠使用免疫技術(shù)如ECLISA(見Harlow and Lane，A Laboratory Manual，Cold Spring HarborLaboratory，1988)以及Western印跡(見Towbin et al.，Procc.Natl.Acad.Sci.USA 764354，1979)。由于在現(xiàn)有技術(shù)中公知的各種原因，異源蛋白的表達(dá)水平在不同的個(gè)體之間將是不同的。
一個(gè)令人滿意的動(dòng)物家族應(yīng)該滿足三個(gè)標(biāo)準(zhǔn)它們應(yīng)來(lái)源于同一個(gè)建立者G0動(dòng)物；它們應(yīng)該表現(xiàn)出穩(wěn)定的轉(zhuǎn)基因的傳遞；而且它們?cè)诖c代之間及個(gè)體動(dòng)物的每次產(chǎn)乳期之間應(yīng)該表現(xiàn)出穩(wěn)定的表達(dá)水平。這些原則已經(jīng)確定并討論過(guò)(Carver et al.，Bio/Technology 111263-1270，1993)。來(lái)自于這樣的一個(gè)合適的家族的動(dòng)物可被稱之為一個(gè)“系”。最初，雄性動(dòng)物G0或G1，被用來(lái)通過(guò)自然地或人工受精繁殖出一群生產(chǎn)者動(dòng)物。以這種方式，可以迅速產(chǎn)生許多帶有相同的整合的轉(zhuǎn)基因的雌性動(dòng)物，從中可以得到乳汁供應(yīng)。
纖維蛋白原從乳汁中的回收使用標(biāo)準(zhǔn)的做法，諸如脫脂、沉淀、過(guò)濾以及蛋白質(zhì)層析技術(shù)。
根據(jù)本發(fā)明生產(chǎn)的纖維蛋白原適用于人類及畜類醫(yī)藥，例如用于配制外科中的粘合劑。這種粘合劑是現(xiàn)有技術(shù)中公知的。如可見引用的文獻(xiàn)U.S.Patent No.4,377,572；4,442,655；4,462,567；以及4,627,879。一般地，將纖維蛋白原與因子X(jué)III結(jié)合形成第一種成分，在使用之前與含有凝血酶的第二種成分混合。凝血酶使纖維蛋白原轉(zhuǎn)變成纖維蛋白，使混合物成為膠狀，并激活因子X(jué)III。激活的因子X(jué)III使纖維蛋白交聯(lián)，強(qiáng)化并穩(wěn)定粘合劑基質(zhì)。這樣的典型的粘合劑中，含有大約30mg/ml-100mg/ml的纖維蛋白原與大約50μg/ml-500μg/ml的因子X(jué)III。它們還可能含有其它成分，例如aprotinin，乳清蛋白，纖聯(lián)蛋白，膨化劑以及溶劑。生產(chǎn)因子X(jué)III的方法是現(xiàn)有技術(shù)中公知的。如可見U.S.Patent No.5,204,447。纖維蛋白原還可以用來(lái)包被聚合物如合成血管移植物的表面，如U.S.Patent No.5,272,074.(列于此處參考)所述。
通過(guò)下列的非限制性實(shí)施例對(duì)本發(fā)明做進(jìn)一步的闡述。實(shí)施例1去掉載體pUC18(Yanisch-Perron et al.，Gene 33103-119，1985)上的多克隆位點(diǎn)，置換成一條合成的雙鏈寡核苷酸(鏈顯示于SEQ ID NO8和SEQ ID NO27中)，該鏈含有限制性切點(diǎn)Pvu I/Mlu I/Eco RV/Xba I/Pvu I/Mlu I，并在5’端加有與Eco RI和Hind III配對(duì)的接頭。pUC18用EcoRI和HindIII雙酶切，其5’磷酸基團(tuán)用牛胰磷酸酶除去，將寡核苷酸鏈連接到載體骨架中。做序列測(cè)定確定跨過(guò)連接區(qū)域的序列正確無(wú)誤，新的質(zhì)粒叫做pUCPM。
從pSS1tgXS(WIPO出版物WO 88/00239中公開)上切下β-乳球蛋白(BLG)基因Sal I-Xba I片段，克隆到用Sal I和Xba I酶切過(guò)的載體pUCPM中構(gòu)建載體pUCXS。因此pUCXS是pUC18的一個(gè)衍生質(zhì)粒，含有完整的BLG基因，該基因來(lái)自于噬菌體SS1(Ali and Clark，J.Mol.Biol.199415-426，1988)上的從Sal I位點(diǎn)到Xba I位點(diǎn)的片段。
質(zhì)粒pSStgSE(WIPO出版物WO 88/00239中公開)含有一個(gè)1290bp的BLG片段，其兩側(cè)有Sph I和Eco RI限制位點(diǎn)、一段跨過(guò)單一位點(diǎn)Not I的區(qū)域及一個(gè)位于BLG mRNA的5’非翻譯引導(dǎo)區(qū)的Pvu II位點(diǎn)。在此Pvu II位點(diǎn)上連接有一個(gè)雙鏈的8bp的DNA連接序列(5’-GGATATCC-3’)，構(gòu)成Eco RV的識(shí)別位點(diǎn)。這個(gè)質(zhì)粒稱做pSS1SE/RV。pSS1SE/RV中Sph I和Eco RV間的DNA序列被酶切下來(lái)，并被用來(lái)置換pUCXS中的等價(jià)片段。得到的質(zhì)粒稱做pUCXSRV。插入到pUCXSRV中的BLG的序列顯示于SEQ ID NO7，在BLG基因的5’非翻譯引導(dǎo)區(qū)的4245位核苷酸上有一個(gè)EcoRV的單一酶切位點(diǎn)。該位點(diǎn)允許插入一些在BLG啟動(dòng)子控制下的轉(zhuǎn)錄起始位點(diǎn)3’端的任何附加的DNA序列。
使用引物BLGAMP3(5’-TGG ATC CCC TGC CGG TGC CTC TGG-3’；SEQ ID NO9)和BLGAMP4(5’-AAC GCG TCA TCC TCT GTG AGC CAG-3’；SEQ ID NO10)，從pUCXSRV中的BLG基因的終止密碼子的3’端的序列中生產(chǎn)出接近650bp的一個(gè)PCR片段。該P(yáng)CR片段利用工程技術(shù)在5’端加有一個(gè)Bam HI位點(diǎn)，在3’端加有一個(gè)Mlu I位點(diǎn)，并被克隆進(jìn)Bam HI和Mlu I切過(guò)的pGEM7zf(+)(Promega)構(gòu)成pDAM 200(+)。
pUCXSRV用Kpn I消化，最大的含有載體的條帶用凝膠純化。該條帶含有全部的pUC質(zhì)粒序列以及一些BLG基因上的3’非編碼區(qū)序列。在此骨架中連接上一個(gè)來(lái)自pDAM200(+)的小的Kpn I片段；后者在2.6Kbp的BLG3’側(cè)區(qū)域的5’末端利用工程技術(shù)以正確的方向產(chǎn)生了一個(gè)Bam HI位點(diǎn)。該質(zhì)粒稱做pBLAC200。從pBLAC200得到的2.6Kbp的ClaI-XbaI片段連接到ClaI-XbaI酶切的pSP72載體(Promega)中，由此在BLG序列的上游置入一EcoRV位點(diǎn)，此質(zhì)粒稱為pBLAC210。
從pBLAC210上得到的2.6Kbp的Eco RV-Xba I片段連接到Eco RV-Xba I酶切的pUCXSRV上，形成pMAD6。此時(shí)，從pUCXSRV上切下了所有編碼序列和內(nèi)含子序列，形成了由4.3Kbp的5’啟動(dòng)子和側(cè)翼有單一Eco RV位點(diǎn)的2.6Kbp的3’下游序列組成的一條BLG的“迷你”基因。在pMAD6的Eco RV位點(diǎn)插入一個(gè)寡核苷酸接頭(ZC6839ACT ACG TAGT；SEQ ID NO11)。這一修改破壞了Eco RV位點(diǎn)，但產(chǎn)生了一個(gè)用于克隆目的的Sna BI位點(diǎn)。該載體命名為pMAD6-Sna。信使mRNA起始于Sna BI位點(diǎn)的上游并終止于Sna BI位點(diǎn)的下游。前體轉(zhuǎn)錄將編碼一個(gè)單個(gè)BLG來(lái)源的內(nèi)含子，即內(nèi)含子6，它完整地位于基因的3’非翻譯區(qū)內(nèi)。實(shí)施例2編碼單個(gè)纖維蛋白原鏈的克隆得自于University of Washington，Seattle的Dr.Earl W.Davie實(shí)驗(yàn)室。一個(gè)基因組纖維蛋白原Aα鏈克隆(Chung et al.，1990，ibid.)得自于質(zhì)粒BS4。該質(zhì)粒含有插入載體pUC18的Sal I和Bam HI位點(diǎn)的Aα鏈克隆，但缺失了Aα鏈頭四個(gè)氨基酸的編碼序列?；蚪MBβ鏈DNA(Chung et al.，ibid.)分離自λCharon 4A噬菌體克隆(命名為βλ4)的兩個(gè)Eco RI片段，每條片段長(zhǎng)5.6Kbp。兩個(gè)片段分別克隆到已用Eco RI消化并經(jīng)牛胰磷酸酶處理過(guò)的pUC19中。得到的克隆用限制性酶Pvu II消化篩選，鑒定出有5’和3’Bβ插入的質(zhì)粒(分別命名為β5’RI/puc和β3’RI/puc)?；蚪Mγ鏈克隆按Rixon et al.(Biochemistry 242077-2086，1985)所述分離?？寺γ12A9包括5’非編碼序列及約4535bp的γ鏈編碼序列。克隆pγ12F3包括其余的編碼序列和3’非編碼核苷酸。這兩個(gè)質(zhì)粒都是基于pBR322的在Eco RI位點(diǎn)插入纖維蛋白原序列的質(zhì)粒。這些質(zhì)粒被用來(lái)作為個(gè)自PCR反應(yīng)的模板。
為了將纖維蛋白原鏈編碼序列插進(jìn)表達(dá)載體中，使用Mullis(U.S.Patent No.4,683,202)所述的PCR技術(shù)給其加尾。該步驟是移去天然的5’和3’非翻譯序列，在其每條編碼序列的第一個(gè)ATG的上游加上一條9個(gè)堿基的序列(CCT GCA GCC)，提供Aα鏈的頭四個(gè)密碼子，除去了Aα鏈序列中的一個(gè)內(nèi)部的Mlu I位點(diǎn)，并增加了限制性位點(diǎn)以方便隨后的克隆操作。
參看圖1，Aα鏈編碼序列的5’末端通過(guò)PCR反應(yīng)加尾。PCR反應(yīng)體系中，含有分別為20pmol的引物ZC6632(SEQ ID NO12)和ZC6627(SEQ ID NO13)，約10ng的質(zhì)粒BS4模板DNA，10μl的含有分別為2.5mM的各種dNTP的混合液，7.5μl的10×Pyrococcus furiosus(Pfu)DNA聚合酶緩沖液#1(200mM Tris-HCl，pH8.2，100mM KCl，60mM(NH4)2SO4，20mMMgCl2，1％Triton X-100，100μg/ml的去核酸酶牛血清白蛋白)(Stratagene，La Jolla，CA)，加水至75μl?；旌衔镌谝粋€(gè)DNA熱循環(huán)儀(Perkin-Elmer)上以如下方式進(jìn)行5個(gè)循環(huán)94℃45秒，40℃90秒，72℃120秒；再進(jìn)行20個(gè)循環(huán)94℃45秒，45℃90秒，72℃120秒；然后在72℃保溫7分鐘。5’PCR片段用Bam HI和Hind III消化，然后將該Bam HI-Hind III片段與一個(gè)內(nèi)部的2.91Kbp的Hind III-Xba I片段及經(jīng)Bam HI，Xba I消化的pUC18一起連接。對(duì)PCR產(chǎn)生的外顯子序列進(jìn)行序列測(cè)定。
再參看圖1，通過(guò)一系列步驟給Aα編碼序列的3’末端加尾。其中使用重疊延伸PCR反應(yīng)(Ho et al.，Gene 7751-59，1989)使Aα序列的終止密碼子上游563位堿基上的Mlu I位點(diǎn)發(fā)生了突變。在第一個(gè)反應(yīng)中，在如上所述的反應(yīng)體系中加有分別為40pmol的引物ZC6521(SEQ ID NO14)和ZC6520(SEQ ID NO15)，約10ng的質(zhì)粒BS4模板DNA。反應(yīng)進(jìn)行5個(gè)循環(huán)94℃45秒，40℃90秒，72℃120秒；再進(jìn)行15個(gè)循環(huán)94℃45秒，45℃90秒，72℃120秒；然后在72℃保溫7分鐘。第二個(gè)反應(yīng)以同樣的方式進(jìn)行，但使用每種分別為40pmol的引物ZC6519(SEQ ID NO16)和ZC6518(SEQ ID NO17)并以BS4為模板。從第一個(gè)和第二個(gè)反應(yīng)中得到的PCR片段通過(guò)凝膠電泳分離并從凝膠上洗脫下來(lái)。每種回收的反應(yīng)產(chǎn)物的約1/10與每種分別為40pmol的引物ZC6521(SEQ IDNO14)和ZC6518(SEQ ID NO17)在一個(gè)PCR反應(yīng)中結(jié)合，在此反應(yīng)中，每個(gè)片段(含有個(gè)別的堿基變化)的互補(bǔ)的3’末端作為其互補(bǔ)鏈3’延伸反應(yīng)的引物與其退火。使用與第一個(gè)和第二個(gè)3’PCR反應(yīng)中相同的反應(yīng)條件進(jìn)行PCR反應(yīng)。然后將反應(yīng)產(chǎn)物用Xba I和Bam HI消化，并將Xba I-Bam HI片段克隆到Xba I和Bam HI消化的pUC18中。對(duì)PCR產(chǎn)生的外顯子序列進(jìn)行序列測(cè)定。
如圖1中所示，5’Bam HI-Xba I片段(3.9Kbp)和3’Xba I-Bam HI片段(1.3Kbp)插入到載體Zem228的Bam HI位點(diǎn)，Zem228是一個(gè)pUC18的衍生質(zhì)粒，在小鼠MT-1啟動(dòng)子和SV40終止子之間有一個(gè)Bam HI克隆位點(diǎn)，并在SV40啟動(dòng)子和終止子旁側(cè)有一個(gè)新霉素抗性標(biāo)記。見歐洲專利局出版物EP 319，944和圖2。從載體Zem228上分離出完整的Aα編碼序列Sna BI片段，插入到質(zhì)粒pMAD6-Sna的Sna BI位點(diǎn)。
參看圖3，使用寡核苷酸ZC6629(SBQ ID NO18)，ZC6630(SEQ ID NO19)和ZC6625(SEQ ID NO20)通過(guò)PCR給Bβ鏈的5’末端加尾。這些引物以成對(duì)結(jié)合的方式(ZC6629+ZC6625或ZC6630+ZC6625)使用，產(chǎn)生起始于第一個(gè)ATG密碼子(SEQ IDNO3中的470位)的Bβ編碼序列(命名為N1-β)或起始于第三個(gè)ATG密碼子(SEQ IDNO3中的512位)的Bβ編碼序列(命名為N3-β)。在如上所述的反應(yīng)混合物中加入5ng的β5’RI/puc模板DNA，并結(jié)合每種分別為20pmol的引物(N1-βZC6629，SEQID NO18+ZC6625，SEQ ID NO20或N3-βZC6630，SEQ ID NO19+ZC6625，SEQ ID NO20)?；旌象w系進(jìn)行如下的5個(gè)循環(huán)94℃45秒，40℃120秒(N1-β)或90秒(N3-β)，72℃120秒；再進(jìn)行20個(gè)循環(huán)94℃45秒，45℃120秒(N1-β)或90秒(N3-β)，72℃120秒；然后在72℃保溫7分鐘。兩種反應(yīng)產(chǎn)物都用EcoRI和Bgl II消化，并將酶切的片段與內(nèi)部的Bgl II-Xba I片段和Eco RI+Xba I消化的pUC19一起連接。使用寡核苷酸引物ZC6626(SEQ ID NO21)和ZC6624(SEQ ID NO22)以及約5ng的β3’RI/puc模板在一個(gè)如上所述的反應(yīng)混合物中給Bβ鏈序列的3’末端加尾?；旌衔餃赜?個(gè)循環(huán)94℃45秒，40℃90秒，72℃120秒；再進(jìn)行15個(gè)循環(huán)94℃45秒，45℃90秒，72℃120秒；然后在72℃保溫7分鐘。分離出一個(gè)990bp的Bgl II-EcoRI片段。該3’片段與鄰近的編碼片段(340bp，Sph I-Bgl II)和Sph I+Eco RI消化的pUC19連接。對(duì)PCR產(chǎn)生的3’和5’外顯子進(jìn)行序列測(cè)定。在Xba I+Sph I消化的pUC19中連接兩個(gè)內(nèi)部片段(4285bp Xba I-Eco RI和383bp Eco RI-Sph I)構(gòu)建第三個(gè)中間載體。然后裝配完整的Bβ編碼序列(兩種形式)，連接5’Eco RI-Xba I片段中的一個(gè)，內(nèi)部Xba I-Sph I片段，3’Sph I-Eco RI片段和Eco RI消化的載體pUC19。然后Bβ序列以7.6Kbp的Sna BI片段的形式分離出來(lái)，插入到pMAD6-Sna的Sna BI位點(diǎn)中。
參看圖4，使用寡核苷酸引物ZC6514(SEQ ID NO23)和ZC6517(SEQ ID NO24)以及約5ng的pγ12A9為模板通過(guò)PCR給γ鏈序列的5’末端加尾。使用40pmol的每種引物按如上所述進(jìn)行PCR反應(yīng)。反應(yīng)進(jìn)行5個(gè)循環(huán)94℃45秒，40℃60秒，72℃120秒；接著進(jìn)行15個(gè)循環(huán)94℃45秒，45℃60秒，72℃120秒。得到的213bp的片段用Bam HI和Spe I消化，將得到的酶切片段與鄰近的下游4.4Kbp的Spe I-Eco RI片段和BamHI+Eco RI消化的pUC19連接。使用每種40pmol的寡核苷酸引物ZC6516(SEQ ID NO25)和ZC6515(SEQ ID NO26)，約50ng的pγ12F3模板以及與用于5’片段的相同的熱循環(huán)程序給γ鏈序列的3’末端加尾。得到的500bp的片段用Bam HI和Spe I消化，將得到的酶切片段與上游2.77Kbp的Eco RI片段和Eco RI+Bam HI消化的pUC19連接。所有PCR產(chǎn)生的外顯子都進(jìn)行序列測(cè)定。然后裝配完整的γ’鏈編碼序列，在Bam HI+Xba I消化的Zem219b中，連接一個(gè)4.5Kbp的Bam HI-Eco RI5’片段，一個(gè)1.1Kbp的Eco RI-PstI內(nèi)部片段和一個(gè)2.14Kbp的Pst I-Xba I3’片段。Zem219b是一個(gè)pUC18衍生載體，含有一個(gè)小鼠金屬硫蛋白啟動(dòng)子和一個(gè)與SV40啟動(dòng)子連接的DHFR選擇標(biāo)記(圖5)。質(zhì)粒Zem219b已以E.coli XL1-blue轉(zhuǎn)化子的形式保藏于American Type CultureCollection，編號(hào)為68979。完整的γ’鏈編碼序列以一個(gè)7.8Kbp的Sna BI片段的形式分離出來(lái)并插入到pMAD6-Sna的Sna BI位點(diǎn)。實(shí)施例3用于初始繁殖系(C57BL6J，CBACA)的小鼠得自于Harlan Olac Ltd.(Bicester，UK)。讓其成對(duì)交配產(chǎn)生F1雜交系(B6CBAF1)，以得到受體雌性，超數(shù)排卵的雌性，用于繁殖的雄性，以及被結(jié)扎的雄性。所有的動(dòng)物都保持在一種14小時(shí)光亮/10小時(shí)黑暗的循環(huán)中，并喂以任意量的水和食物(Special Diet Services RM3，Edinburgh，Scotland)。
轉(zhuǎn)基因小鼠的產(chǎn)生基本上如Hogan et al.，在Manipulating the Mouse EmbryoALaboratory Manual，Cold Spring Harbor Laboratory，1986中所述。雌性B6CBAF1動(dòng)物在4-5周齡時(shí)通過(guò)注射懷孕雌鼠的血清促性腺激素(FOLLIGON，Vet-Drug，F(xiàn)alkirk，Scotland)(5iu)，隨后在45小時(shí)后注射人絨毛膜促性腺激素(CHORULON，Vet-Drug，F(xiàn)alkirk，Scotland)(5iu)，使之超數(shù)排卵。然后讓其與一只種鼠交配過(guò)夜。隨后檢查這些雌性動(dòng)物交配是否陽(yáng)性。那些已經(jīng)交配的雌性動(dòng)物被選出，收集它們的卵子以備用于顯微注射。
如Hogan et al.(ibid.)所述將DNA注射到受精卵中。簡(jiǎn)而言之，每種含有Aα，Bβ和γ表達(dá)單位的載體用Mlu I消化，各表達(dá)單位用蔗糖密度梯度離心分離出來(lái)。所有使用的化學(xué)藥品均為試劑級(jí)(Sigma Chemical Co.，St.Louis，MO，USA)，所有的溶液均為無(wú)菌及無(wú)核酸酶的。溶于1M NaCl，20mM Tris pH8.0，5mMEDTA的20％及40％的蔗糖溶液使用UHP水制備并經(jīng)過(guò)濾除菌?；旌系润w積的20％和40％的蔗糖溶液，制備30％的蔗糖溶液。分步將0.5ml的40％、30％和20％的蔗糖溶液鋪設(shè)到2ml的晶形塑料管中，并靜置1小時(shí)，做成一種梯度。100μl的DNA溶液(接近8μgDNA)加到梯度液的頂部，然后于Beckman TL100超速離心機(jī)中使用TLS-55轉(zhuǎn)頭(BeckmanInstruments，F(xiàn)ullerton，CA，USA)在15℃下以26,000rpm轉(zhuǎn)速離心17-20小時(shí)。使用一只20號(hào)的針頭穿刺離心管的底部，分部收集各梯度的液滴于96孔板中。取出3μl的液體在1％的瓊脂糖小膠上分析。將含有所需要的DNA片段的部分匯集起來(lái)，然后在0.3MNaAc中于-20℃用乙醇沉淀過(guò)夜。DNA沉淀物重溶于50-100μl UHP水中并用熒光計(jì)測(cè)量定量。表達(dá)單位稀釋于Dulbecco’s磷酸緩沖鹽(無(wú)鈣和鎂)(每升中含0.2gKCL，0.2gKH2PO4，8.0gNaCl，1.15gNa2HPO4)，以1∶1∶1的摩爾比混合(使用N1-β或是N3-β表達(dá)單位)，其濃度調(diào)節(jié)到大約6μg/ml，并注射到卵子中(每只卵大約總共2pl的DNA溶液)。
通過(guò)處于自然發(fā)情期的B6CBAF1雌鼠與結(jié)扎過(guò)的雄鼠交配，制備6-8周齡的受體雌鼠。那些交配檢測(cè)為陽(yáng)性的雌鼠保留下來(lái)準(zhǔn)備轉(zhuǎn)移顯微注射后的卵。
潛在的轉(zhuǎn)基因動(dòng)物出生之后，于4周齡時(shí)在無(wú)菌條件下對(duì)尾部進(jìn)行活體解剖。組織樣品放入2ml含有200μg/ml蛋白酶K(Boehringer Mannheim，Germany)的，尾緩沖液(0.3MNaAc，50mMHCl，1.5mMMgCl2，10mM Tris-HCl，PH8.5，0.5％NP40，0.5％Tween20)中，顛倒數(shù)次混勻。樣品于55℃-60℃振蕩(250rpm)3小時(shí)至過(guò)夜。通過(guò)PCR和Southern印跡檢查制備于活體解剖樣品的DNA中注射的結(jié)構(gòu)的存在。劇烈振蕩消化后的組織，取5μl液體放入0.5ml的微量離心管中。對(duì)照包括陽(yáng)性和陰性尾部樣品。每管中加入40μl的硅酮油(BDH，Poole，UK)并短暫地離心。管在一個(gè)熱循環(huán)儀(如Omni-gene，Hybaid，Teddington，UK)的加熱塊上保溫到95℃，10分鐘。此后，每管中加入45μl的PCR混合液，這樣，每個(gè)反應(yīng)混合液的最終組成為50mM KCl；2mMMgCl2；10mM Tris-HCl(pH8.3)；0.01％的明膠；0.1％NP40；10％的DMSO；500nM的各種引物；200μM的dNTPs；0.02U/μl的Taq聚合酶(Boehinger Mannheim，Mannheim，Germany)。按照所用的特定引物所要求的溫度變化，每管重復(fù)進(jìn)行30個(gè)循環(huán)。引物可能會(huì)有不同，但所有的引物都必須以BLG啟動(dòng)子區(qū)為目標(biāo)。這對(duì)于注射的DNA片段是特異性的，因?yàn)樾∈笾袥](méi)有BLG基因。然后在每管中加入12μl的5X上樣緩沖液，其中含有Orange G標(biāo)記染料(0.25％Orange G(Sigma)15％Ficoll-400[PharmaciaBiosystems Ltd.，Milton Keynes，UK])，反應(yīng)混合物在含有EB(Sigma)的1.6％瓊脂糖凝膠中電泳，直到標(biāo)記染料遷移到膠的2/3長(zhǎng)度處。在254nm波長(zhǎng)的紫外燈下觀察凝膠。用這種方法可以鑒定出具有一個(gè)或多個(gè)注射的DNA片段的轉(zhuǎn)基因小鼠。
挑選陽(yáng)性的尾部樣品以獲得純的DNA。DNA樣品通過(guò)使用一個(gè)BLG啟動(dòng)子探針(SEQID NO7中的2523-4253位核苷酸)做Southern印跡進(jìn)行篩選。使用合適的限制性酶(例如EcoRI)進(jìn)行特異性裂解可以分辨出含有Aα，Bβ和γ序列的三種結(jié)構(gòu)。
基本上按如上所述的方法制備的轉(zhuǎn)基因小鼠的Southern印跡的分析結(jié)果表明。有多于50％的后代含有所有三種纖維蛋白原序列。陽(yáng)性動(dòng)物的乳汁的還原性SDS聚丙烯酰胺凝膠電泳檢查表明，所有三種蛋白鏈都存在且其濃度接近1mg/ml。完全裝配好的纖維蛋白原的量則與乳汁存在的各亞單位之間的比例有關(guān)。在小鼠乳汁中沒(méi)有明顯的與高濃度的人類纖維蛋白原相關(guān)的表型。實(shí)施例4供體母羊在0日用陰道內(nèi)的含孕酮的棉球(CHRONOGEST Goat Sponge，Intervet，Cambridfe，UK)處理。棉球留在原處保持10或12天。
超數(shù)排卵的誘導(dǎo)是通過(guò)用總共1單位的羊促卵泡激素(OFSH)(OVAGEN，HorizonAnimal Reproduction Technology Pty.Ltd.，New Zealand)處理，分8次肌肉注射給藥，每次注射0.125單位，注射開始于-4日的500pm結(jié)束于0日的800am。在-4日給供者母羊肌肉注射0.5ml的黃體裂解試劑(ESTRUMATE，Vet-Drug)引起黃體退化，使之回復(fù)到發(fā)情和排卵期。為了使排卵同步，供體動(dòng)物在0日500pm肌肉注射2ml合成的釋放激素類似物(RECEPTAL，Vet-Drug)。
在人工授精(A.I.)之前，供體動(dòng)物要斷絕食物和水至少12小時(shí)。動(dòng)物在+1日在鎮(zhèn)靜和局部麻醉狀態(tài)下通過(guò)子宮內(nèi)窺人工授精。在人工授精前大約15分鐘通過(guò)肌肉注射0.05-0.1ml/10kg體重的甲苯噻嗪(ROMPUN，Vet-Drug)或0.1ml/10kg體重劑量的ACP注射液(10mg/ml)(Vet-Drug)使其鎮(zhèn)靜。人工授精使用從Poll Dorset公羊中剛收集的精液進(jìn)行。精液用等量的過(guò)濾后的磷酸緩沖液稀釋，每個(gè)子宮喇叭口里注射0.2ml的稀釋精液。在人工授精前后，馬上給供體動(dòng)物肌肉注射AMOXYPEN(Vet-Drug)。
從1日500pm起給供體動(dòng)物斷絕食物和水，于2日回收受精卵?；厥赵谌闋顟B(tài)下進(jìn)行，麻醉是通過(guò)靜脈注射5％的硫噴妥鈉(INTRAVAL SODIUM，Vet-Drug)，劑量為每10kg體重3ml。插管后通過(guò)吸入1-2％Halthane/O2/N2保持麻醉狀態(tài)。為了回收受精卵，要進(jìn)行一次腹腔切開手術(shù)，并從腹腔中取出子宮。卵子的回收是通過(guò)給輸卵管倒灌注加有New Zealand來(lái)源的牛血清白蛋白的Ovum Culture Medium(AdvancedProtein Products，Brierly Hill，West Midlands，UK)。灌注之后，將子宮放回腹腔，縫合傷口。供體動(dòng)物允許在操作后恢復(fù)或是讓其“安樂(lè)死”。允許恢復(fù)的供體動(dòng)物在操作之前或之后立即肌肉注射操作者推薦劑量的Amoxypen L.A.。
含有三種纖維蛋白原鏈表達(dá)單位的質(zhì)粒用MluI消化，表達(dá)單位片段通過(guò)蔗糖密度梯度離心回收與純化。用熒光計(jì)測(cè)定片段的濃度，并用上述的不含鈣和鎂的Dulbecco’s磷酸緩沖液稀釋。濃度調(diào)節(jié)到6μg/ml，約2pl的混合液顯微注射進(jìn)入每個(gè)具有可見原核的受精卵的一個(gè)原核中。
所有經(jīng)過(guò)原核顯微注射的受精卵在體外培養(yǎng)于38.5℃，5％CO25％O290％N2氣氛以及大約100％的濕度，培養(yǎng)基為加有20％v/v的結(jié)扎公羊血清的二氧化碳緩沖的合成輸卵管培養(yǎng)基(見表)。血清可在56℃加熱滅活30分鐘，使用前冷凍儲(chǔ)存于-20℃。受精卵培養(yǎng)一段合適的時(shí)間，使早期胚胎死亡(由操作技術(shù)引起的)發(fā)生。棄掉那些已死的或停止發(fā)育的胚胎。已經(jīng)發(fā)育到5或6次細(xì)胞分裂的胚胎轉(zhuǎn)移到同步化的受體母羊中。
表合成輸卵管培養(yǎng)基儲(chǔ)液A(可保存使用3個(gè)月)NaCl 6.29gKCl 0.534gKH2PO40.162gMgSO4.7H2O0.182g青霉素 0.06g60％乳酸鈉糖漿 0.6mlSuper H2O 99.4ml儲(chǔ)液B(可保存使用2周)NaHCO30.21g酚紅 0.001gSuper H2O 10ml儲(chǔ)液C(可保存使用2周)丙酮酸鈉 0.051gSuper H2O 10ml儲(chǔ)液D(可保存使用3個(gè)月)CaCl2·2H2O 0.262gSuper H2O 10ml儲(chǔ)液E(可保存使用3個(gè)月)Hepes0.651g酚紅 0.001g
Super H2O10ml配制10ml碳酸氫鹽緩沖培養(yǎng)基儲(chǔ)液A 1ml儲(chǔ)液B 1ml儲(chǔ)液C 0.07ml儲(chǔ)液D 0.1mlSuper H2O7.83mlOsmolarity應(yīng)該是265-285 mOsm。加入2.5ml熱滅活的綿羊血過(guò)濾除菌。
配制10mls Hepes緩沖培養(yǎng)基儲(chǔ)液A 1ml儲(chǔ)液B 0.2ml儲(chǔ)液C 0.07ml儲(chǔ)液D 0.1ml儲(chǔ)液E 0.8mlSuper H2O7.83mlOsmolarity應(yīng)該是265-285 mOsm。加入2.5ml熱滅活的綿羊血過(guò)濾除菌。
受體母羊用陰道內(nèi)的含孕酮的棉球(CHRONOGEST Ewe Sponge or CHRONOGEST Ewe-Lamb Sponge，Intervet)處理，棉球留在原處保持10或12天。在-1日取走棉球，給母羊肌肉注射1.5ml(300iu)的促卵泡激素替代物(P.M.S.G.，Intervet)以及0.5ml的黃體裂解試劑(Estrumate，Coopers Pitman-Moore)。在0日和1日800am-500pm之間用結(jié)扎的公羊試驗(yàn)?zāi)秆虻陌l(fā)情期。
在6日或7日將體外培養(yǎng)存活下來(lái)的胚胎放回受體母羊(從5日或6日500pm開始禁食)中。胚胎轉(zhuǎn)移在如上所述的全麻狀態(tài)下進(jìn)行。子宮通過(guò)剖腹取出，可使用腹窺鏡，也可不用。胚胎返回到那些至少具有一個(gè)合適的黃體的母羊的子宮的一個(gè)或兩個(gè)喇叭口內(nèi)。放回子宮之后，縫合腹部傷口。給動(dòng)物在操作之前或之后立即肌肉注射操作者所推薦劑量的Amoxypen L.A.，讓受體動(dòng)物恢復(fù)。
羊羔在耳部掛上標(biāo)簽，放回飼養(yǎng)棚中。母羊和羊羔可以圈養(yǎng)喂以完全飼料和其它輔助飼料，或者隨意喂以干草，也可到草地上放養(yǎng)。
在其第一周齡內(nèi)(或在不損害健康的前提下盡可能早地)，使用兩種取樣方式試驗(yàn)羊羔中異源DNA的存在。從頸靜脈中抽取10ml血樣到一個(gè)EDTA針管中，如果合適，在頭一周內(nèi)還可以從羊羔中第二次取出血樣。組織樣品的獲取是通過(guò)尾部活體解剖，使用一個(gè)橡皮筋纏上三圈使尾部失去反應(yīng)，然后盡可能快地取樣(通常在其長(zhǎng)出尾巴后200min之內(nèi))。組織立刻放入尾部緩沖液中。尾部樣品保存于室溫并于收集當(dāng)日分析。所有的羊羔在解剖之后立即肌肉注射操作者所推薦劑量的Amoxypen L.A.，被切過(guò)的尾部末端噴以抗生素噴霧劑。
首先分離白細(xì)胞從綿羊血液中提取DNA。10ml的血樣稀釋于20ml的Hank’s緩沖鹽(HBS；Sigma Chemical Co.)中。在兩個(gè)15ml的螺口管中每個(gè)內(nèi)的5ml Histopaque(Sigma)上覆蓋10ml的稀釋血液。這些管于3,000rpm(最大2,000xg)離心，于室溫下緩慢降速15分鐘。將白血細(xì)胞分界面移到一個(gè)干凈的15ml管中，用HBS稀釋到15ml。稀釋的細(xì)胞液于室溫3,000rpm離心10分鐘，回收細(xì)胞沉淀，溶于2-5ml尾部緩沖液中。
為了從白細(xì)胞中提取DNA，在細(xì)胞中加入10％的SDS使其終濃度達(dá)到1％，并顛倒管使之混勻。加入1mg新配的蛋白酶K溶液，混合液于45℃保溫過(guò)夜，DNA用等體積的酚/氯仿抽提3次，并用氯仿/異戊醇抽提一次。加入0.1體積的3M NaAc和2倍體積的乙醇，顛倒混勻。沉淀的DNA用一只干凈的末端有標(biāo)記的玻璃棒纏繞成團(tuán)。用70％乙醇洗滌后，使DNA涼至半干，然后重新溶解于TE(10mM Tris-HCl，1mM EDTA，PH7.4)中。
來(lái)自于血液和尾部的DNA樣品使用對(duì)BLG啟動(dòng)子區(qū)及纖維蛋白原鏈編碼區(qū)特異的探針進(jìn)行Southern印跡分析。
雖然出于闡述本發(fā)明的目的，在此做了一些特殊實(shí)施方案的描述，但應(yīng)理解的是，在不背離本發(fā)明的精神實(shí)質(zhì)和范圍的情況下，除了前面所述的，尚可對(duì)其進(jìn)行各種修改。相應(yīng)地，本發(fā)明將僅受后面所附的權(quán)利要求書的限制。
序列表(1)一般信息(i)申請(qǐng)人ZymoGenetics，Inc.
1201 Eastlake Avenue EastSeattle，Washington 98102United States of AmericaPharmaceutical Proteins Ltd.
RoslinEdinburghMidlothian，Scotland EH25 9PP(ii)發(fā)明名稱在轉(zhuǎn)基因動(dòng)物中生產(chǎn)纖維蛋白原(iii)序列數(shù)27(iv)聯(lián)系地址(A)聯(lián)系人ZymoGenetics，Inc.
(B)街道1201 Eastlake Avenue East(C)城市Seattle(D)州華盛頓州(E)國(guó)家美國(guó)(F)郵編98102(v)計(jì)算機(jī)可讀形式(A)媒介類型軟盤(B)計(jì)算機(jī)IBM PC兼容機(jī)(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release #1.0，Version#1.25(vi)本申請(qǐng)資料(A)申請(qǐng)?zhí)?B)申請(qǐng)日(C)分類(vi)律師/代理人信息(A)姓名Parker，Gary E(B)注冊(cè)號(hào)31-648(C)案號(hào)/文檔號(hào)93-15PC(viii)通訊信息(A)電話206-442-6673(B)傳真206-442-6678(2)SEQ ID NO1的信息(i)序列特征(A)長(zhǎng)度5943bp(B)類型核酸(C)鏈性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(vii)來(lái)源(B)克隆人纖維蛋白原A-α鏈(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置連接(31..84，1154..1279，1739..1922，3055..3200，3786..5210)(xi)序列描述SEQ ID NO1GTCTAGGAGC CAGCCCCACC CTTAGAAAAG ATG TTT TCC ATG AGG ATC GTC TGC54Met Phe Ser Met Arg Ile Val Cys1 5CTA GTT CTA AGT GTG GTG GGC ACA GCA TGG GTATGGCCCT TTTCATTTTT 104Leu Val Leu Ser Val Val Gly Thr Ala Trp10 15TCTTCTTGCT TTCTCTCTGG TGTTTATTCC ACAAAGAGCC TGGAGGTCAG AGTCTACCTG 164CTCTATGTCC TGACACACTC TTAGCTTTAT GACCCCAGGC CTGGGAGGAA ATTTCCTGGG 224TGGGCTTGAC ACCTCAAGAA TACAGGGTAA TATGACACCA AGAGGAAGAT CTTAGATGGA 284TGAGAGTGTA CAACTACAAG GGAAACTTTA GCATCTGTCA TTCAGTCTTA CCACATTTTG 344TTTTGTTTTG TTTTAAAAAG GGCAAGAATT ATTTGCCATC CTTGTACCTA TAAAGCCTTG 404GTGCATTATA ATGCTAGTTA ATGGAATAAA ACATTTTATG GTAAGATTTG TTTTCTTTAG 464TTATTAATTT CTTGCTACTT GTCCATAATA AGCAGAACTT TTAGTGTTAG TACAGTTTTG 524CTGAAAGGTT ATTGTTGTGT TTGTCAAGAC AGAAGAAAAA GCAAACGAAT TATCTTTGGA 584AATATCTTTG CAGTATCAGA AGAGATTAGT TAGTAAGGCA ATACGCTTTT CCGCAGTAAT 644GGTATTCTTT TAAATTATGA ATCCATCTCT AAAGGTTACA TAGAAACTTG AAGGAGAGAG 704GAACATTCAG TTAAGATAGT CTAGGTTTTT CTACTGAAGC AGCAATTACA GGAGAAAGAG 764CTCTACAGTA GTTTTCAACT TTCTGTCTGC AGTCATTAGT AAAAATGAAA AGGTAAAATT 824TAACTGATTT TATAGATTCA AATAATTTTC CTTTTAGGAT GGATTCTTTA AAACTCCTAA 884TATTTATCAA ATGCTTATTT AAGTGTCACA CACAGTTAAG AAATTTGTAC ACCTTGTCTC 944CTTTAATTCT CATAACAACT CCATAAAATG GGTCCTAGGA TTTCCATTTG AAGATAAGAA1004ACCTGAAGCT TGCCGAAGCC CTGTGTCTGC TCTCCTTAAT CTCTGTGAGA GTGCCATCTC1064TTCCTGGGGA CTTGTAGGCA TGCCACTGTC TCCTCTTCTG GCTAACATTG CTGTTGCTCT1124CTTTTGTGTA TGTGAATGAA TCTTTAAAG ACT GCA GAT AGT GGT GAA GGT GAC 1177Thr Ala Asp Ser Gly Glu Gly Asp20 25TTT CTA GCT GAA GGA GGA GGC GTG CGT GGC CCA AGG GTT GTG GAA AGA 1225Phe Leu Ala Glu Gly Gly Gly Val Arg Gly Pro Arg Val Val Glu Arg30 35 40CAT CAA TCT GCC TGC AAA GAT TCA GAC TGG CCC TTC TGC TCT GAT GAA 1273His Gln Ser Ala Cys Lys Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu45 50 55GAC TGG GTAAGCAGTC AGCGGGGGAA GCAGGAGATT CCTTCCCTCT GATGCTAGAG 1329Asp Trp60GGGCTCACAG GCTGACCTGA TTGGTCCCAG AAACTTTTTT AAATAGAAAA TAATTGAATA1389GTTACCTACA TAGCAAATAA AGAAAAGGAA CCTACTCCCA AGAGCACTGT TTATTTACCT1449CCCCAACTCT GGATCATTAG TGGGTGAACA GACAGGATTT CAGTTGCATG CTCAGGCAAA1509ACCAGGCTCC TGAGTATTGT GGCCTCAATT TCCTGGCACC TATTTATGGC TAAGTGGACC1569CTCATTCCAG AGTTTCTCTG CGACCTCTAA CTAGTCCTCT TACCTACTTT TAAGCCAACT1629TATCTGGAAG AGAAAGGGTA GGAAGAAATG GGGGCTGCAT GGAAACATGC AAAATTATTC1689TGAATCTGAG AGATAGATCC TTACTGTAAT TTTCTCCCTT CACTTTCAG AAC TAC 1744Asn TyrAAA TGC CCT TCT GGC TGC AGG ATG AAA GGG TTG ATT GAT GAA GTC AAT 1792Lys Cys Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn65 70 75CAA GAT TTT ACA AAC AGA ATA AAT AAG CTC AAA AAT TCA CTA TTT GAA 1840Gln Asp Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu80 85 90TAT CAG AAG AAC AAT AAG GAT TCT CAT TCG TTG ACC ACT AAT ATA ATG 1888Tyr Gln Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met95 100 105 110GAA ATT TTG AGA GGC GAT TTT TCC TCA GCC AAT AGTAAGTATTA 1932Glu Ile Leu Arg Gly Asp Phe Ser Ser Ala Asn115 120CATATTTACT TCTTTGACTT TATAACAGAA ACAACAAAAA TCCTAAATAA ATATGATATC1992CGCTTATATC TATGACAATT TCATCCCAAA GTACTTAGTG TAGAAACACA TACCTTCATA2052ATATCCCTGA AAATTTTAAG AGGGAGCTTT TGTTTTCGTT ATTTTTTCAA AGTAAAAGAT2112GTTAACTGAG ATTGTTTAAG GTCACAAAAT AAGTCAGAAT TTTGGATTAA AACAAGAATT2172TAAATGTGTT CTTTTCAACA GTATATACTG AAAGTAGGAT GGGTCAGACT CTTTGAGTTG2232ATATTTTTGT TTCTGCTTTG TAAAGGTGAA AACTGAGAGG TCAAGGAACT TGTTCAAAGA2292CACAGAGCTG GGAATTCAAC TCCCAGACTC CACTGAGCTG ATTAGGTAGA TTTTTAAATT2352TAAAATATAG GGTCAAGCTA CGTCATTCTC ACAGTCTACT CATTAGGGTT AGGAAACATT2412GCATTCACTC TGGGCATGGA CAGCGAGTCT AGGGAGTCCT CAGTTTCTCA AGTTTTGCTT2472TGCCTTTTTA CACCTTCACA AACACTTGAC ATTTAAAATC AGTGATGCCA ACACTAGCTG2532GCAAGTGAGT GATCCTGTTG ACCCAAAACA GCTTAGGAAC CATTTCAAAT CTATAGAGTT2592AAAAAGAAAA GCTCATCAGT AAGAAAATCC AATATGTTCA AGTCCCTTGA TTAAGGATGT2652TATAAAATAA TTGAAATGCA ATCAAACCAA CTATTTTAAC TCCAAATTAC ACCTTTAAAA2712TTCCAAAGAA AGTTCTTCTT CTATATTTCT TTGGGATTAC TAATTGCTAT TAGGACATCT2772TAACTGGCAT TCATGGAAGG CTGCAGGGCA TAACATTATC CAAAAGTCAA ATGCCCCATA2832GGTTTTGAAC TCACAGATTA AACTGTAACC AAAATAAAAT TAGGCATATT TACAAGCTAG2892TTTCTTTCTT TCTTTTTTCT CTTTCTTTCT TTCTTTCTTT CTTTCTTTCT TTCTTTCTTT2952CTTTCTTTCT TTCTCCTTCC TTCCTTTCTT CCTTTCTTTT TTGCTGGCAA TTACAGACAA3012ATCACTCAGC AGCTACTTCA ATAACCATAT TTTCGATTTC AG AC CGT GAT AAT 3065Asn Arg Asp Asn125ACC TAC AAC CGA GTG TCA GAG GAT CTG AGA AGC AGA ATT GAA GTC CTG 3113Thr Tyr Asn Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu130 135 140AAG CGC AAA GTC ATA GAA AAA GTA CAG CAT ATC CAG CTT CTG CAG AAA 3161Lys Arg Lys Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys145 150 155AAT GTT AGA GCT CAG TTG GTT GAT ATG AAA CGA CTG GAG GTAAGTATGT 3210Asn Val Arg Ala Gln Leu Val Asp Met Lys Arg Leu Glu160 165 170GGCTGTGGTC CCGAGTGTCC TTGTTTTTGA GTAGAGGGAA AAGGAAGGCG ATAGTTATGC3270ACTGAGTGTC TACTATATGC AGAGAAAAGT GTTATATCCA TCATCTACCT AAAAGTAGGT3330ATTATTTTCC TCACTCCACA GTTGAAGAAA AAAAAATTCA GAGATATTAA GTAAATTTTC3390CAACGTACAT AGATAGTAAT TCAAAGCAAT GTTCAGTCCC TGTCTATTCC AAGCCATTAC3450ATCACCACAC CTCTGAGCCC TCAGCCTGAG TTCACCAAGG ATCATTTAAT TAGCGTTTCC3510TTTGAGAGGG AATAGCACCT TACTCTTGAT CCATTCTGAG GCTAAGATGA ATTAAACAGC3570ATCCATTGCT TATCCTGGCT AGCCCTGCAA TACCCAACAT CTCTTCCACT GAGGGTGCTC3630GATAGGCAGA AAACAGAGAA TATTAAGTGG TAGGTCTCCG AGTCAAAAAA AATGAAACCA3690GTTTCCAGAA GGAAAATTAA CTACCAGGAA CTCAATAGAC GTAGTTTATG TATTTGTATC3750TACATTTTCT CTTTATTTTT CTCCCCTCTC TCTAG GTG GAC ATT GAT ATT AAG 3803Val Asp Ile Asp Ile Lys175ATC CGA TCT TGT CGA GGG TCA TGC AGT AGG GCT TTA GCT CGT GAA GTA 3851Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val180 185 190GAT CTG AAG GAC TAT GAA GAT CAG CAG AAG CAA CTT GAA CAG GTC ATT 3899Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile195 200 205GCC AAA GAC TTA CTT CCC TCT AGA GAT AGG CAA CAC TTA CCA CTG ATA 3947Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile210 215 220AAA ATG AAA CCA GTT CCA GAC TTG GTT CCC GGA AAT TTT AAG AGC CAG 3995Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225230 235 240CTT CAG AAG GTA CCC CCA GAG TGG AAG GCA TTA ACA GAC ATG CCG CAG 4043Leu Gln Lys Val Pro Pro Glu Trp Lys Ala Leu Thr Asp Met Pro Gln245 250 255ATG AGA ATG GAG TTA GAG AGA CCT GGT GGA AAT GAG ATT ACT CGA GGA 4091Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly260 265 270GGC TCC ACC TCT TAT GGA ACC GGA TCA GAG ACG GAA AGC CCC AGG AAC 4139Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn275 280 285CCT AGC AGT GCT GGA AGC TGG AAC TCT GGG AGC TCT GGA CCT GGA AGT 4187Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser290 295 300ACT GGA AAC CGA AAC CCT GGG AGC TCT GGG ACT GGA GGG ACT GCA ACC 4235Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305 310 315 320TGG AAA CCT GGG AGC TCT GGA CCT GGA AGT GCT GGA AGC TGG AAC TCT 4283Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser325 330 335GGG AGC TCT GGA ACT GGA AGT ACT GGA AAC CAA AAC CCT GGG AGC CCT 4331Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Asn Pro Gly Ser Pro340 345 350AGA CCT GGT AGT ACC GGA ACC TGG AAT CCT GGC AGC TCT GAA CGC GGA 4379Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly355 360 365AGT GCT GGG CAC TGG ACC TCT GAG AGC TCT GTA TCT GGT AGT ACT GGA 4427Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly370 375 380CAA TGG CAC TCT GAA TCT GGA AGT TTT AGG CCA GAT AGC CCA GGC TCT 4475Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385 390 395 400GGG AAC GCG AGG CCT AAC AAC CCA GAC TGG GGC ACA TTT GAA GAG GTG 4523Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val405 410 415TCA GGA AAT GTA AGT CCA GGG ACA AGG AGA GAG TAC CAC ACA GAA AAA 4571Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys420 425 430CTG GTC ACT TCT AAA GGA GAT AAA GAG CTC AGG ACT GGT AAA GAG AAG 4619Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys435 440 445GTC ACC TCT GGT AGC ACA ACC ACC ACG CGT CGT TCA TGC TCT AAA ACC 4667Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr450 455 460GTT ACT AAG ACT GTT ATT GGT CCT GAT GGT CAC AAA GAA GTT ACC AAA 4715Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465 470 475 480GAA GTG GTG ACC TCC GAA GAT GGT TCT GAC TGT CCC GAG GCA ATG GAT 4763Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp485 490 495TTA GGC ACA TTG TCT GGC ATA GGT ACT CTG GAT GGG TTC CGC CAT AGG 4811Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg500 505 510CAC CCT GAT GAA GCT GCC TTC TTC GAC ACT GCC TCA ACT GGA AAA ACA 4859His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr515 520 525TTC CCA GGT TTC TTC TCA CCT ATG TTA GGA GAG TTT GTC AGT GAG ACT 4907Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr530 535 540GAG TCT AGG GGC TCA GAA TCT GGC ATC TTC ACA AAT ACA AAG GAA TCC4955Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545 550 555 560AGT TCT CAT CAC CCT GGG ATA GCT GAA TTC CCT TCC CGT GGT AAA TCT5003Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser565 570 575TCA AGT TAC AGC AAA CAA TTT ACT AGT AGC ACG AGT TAC AAC AGA GGA5051Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly580 585 590GAC TCC ACA TTT GAA AGC AAG AGC TAT AAA ATG GCA GAT GAG GCC GGA5099Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly595 600 605AGT GAA GCC GAT CAT GAA GGA ACA CAT AGC ACC AAG AGA GGC CAT GCT5147Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala610 615 620AAA TCT CGC CCT GTC AGA GGT ATC CAC ACT TCT CCT TTG GGG AAG CCT 5195Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625 630 635 640TCC CTG TCC CCC TAGACTAAGT TAAATATTTC TGCACAGTGT TCCCATGGCC 5247Ser Leu Ser Pro645CCTTGCATTT CCTTCTTAAC TCTCTGTTAC ACGTCATTGA AACTACACTT TTTTGGTCTG5307TTTTTGTGCT AGACTGTAAG TTCCTTGGGG GCAGGGCCTT TGTCTGTCTC ATCTCTGTAT5367TCCCAAATGC CTAACAGTAC AGAGCCATGA CTCAATAAAT ACATGTTAAA TGGATGAATG5427AATTCCTCTG AAACTCTATT TGAGCTTATT TAGTCAAATT CTTTCACTAT TCAAAGTGTG5487TGCTATTAGA ATTGTCACCC AACTGATTAA TCACATTTTT AGTATGTGTC TCAGTTGACA5547TTTAGGTCAG GCTAAATACA AGTTGTGTTA GTATTAAGTG AGCTTAGCTA CCTGTACTGG5607TTACTTGCTA TTAGTTTGTG CAAGTAAAAT TCCAAATACA TTTGAGGAAA ATCCCCTTTG5667CAATTTGTAG GTATAAATAA CCGCTTATTT GCATAAGTTC TATCCCACTG TAAGTGCATC5727CTTTCCCTAT GGAGGGAAGG AAAGGAGGAA GAAAGAAAGG AAGGGAAAGA AACAGTATTT5787GCCTTATTTA ATCTGAGCCG TGCCTATCTT TGTAAAGTTA AATGAGAATA ACTTCTTCCA5847ACCAGCTTAA TTTTTTTTTT AGACTGTGAT GATGTCCTCC AAACACATCC TTCAGGTACC 5907CAAAGTGGCA TTTTCAATAT CAAGCTATCC GGATCC 5943(2)SEQ ID NO2的信息(i)序列特征(A)長(zhǎng)度644個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Phe Ser Met Arg Ile Val Cys Leu Val Leu Ser Val Val Gly Thr1 5 10 15Ala Trp Thr Ala Asp Ser Gly Glu Gly Asp Phe Leu Ala Glu Gly Gly20 25 30Gly Val Arg Gly Pro Arg Val Val Glu Arg His Gln Ser Ala Cys Lys35 40 45Asp Ser Asp Trp Pro Phe Cys Ser Asp Glu Asp Trp Asn Tyr Lys Cys50 55 60Pro Ser Gly Cys Arg Met Lys Gly Leu Ile Asp Glu Val Asn Gln Asp65 70 75 80Phe Thr Asn Arg Ile Asn Lys Leu Lys Asn Ser Leu Phe Glu Tyr Gln85 90 95Lys Asn Asn Lys Asp Ser His Ser Leu Thr Thr Asn Ile Met Glu Ile100 105 110Leu Arg Gly Asp Phe Ser Ser Ala Asn Asn Arg Asp Asn Thr Tyr Asn115 120 125Arg Val Ser Glu Asp Leu Arg Ser Arg Ile Glu Val Leu Lys Arg Lys130 135 140Val Ile Glu Lys Val Gln His Ile Gln Leu Leu Gln Lys Asn Val Arg145 150 155 160Ala Gln Leu Val Asp Met Lys Arg Leu Glu Val Asp Ile Asp Ile Lys165 170 175Ile Arg Ser Cys Arg Gly Ser Cys Ser Arg Ala Leu Ala Arg Glu Val180 185 190Asp Leu Lys Asp Tyr Glu Asp Gln Gln Lys Gln Leu Glu Gln Val Ile195 200 205Ala Lys Asp Leu Leu Pro Ser Arg Asp Arg Gln His Leu Pro Leu Ile210 215 220Lys Met Lys Pro Val Pro Asp Leu Val Pro Gly Asn Phe Lys Ser Gln225 230 235 240Leu Gl n Lys Val Pro Pro Glu Trp Lys Ala Leu ThrAsp Met Pro Gln245 250255Met Arg Met Glu Leu Glu Arg Pro Gly Gly Asn Glu Ile Thr Arg Gly260 265 270Gly Ser Thr Ser Tyr Gly Thr Gly Ser Glu Thr Glu Ser Pro Arg Asn275 280 285Pro Ser Ser Ala Gly Ser Trp Asn Ser Gly Ser Ser Gly Pro Gly Ser290 295 300Thr Gly Asn Arg Asn Pro Gly Ser Ser Gly Thr Gly Gly Thr Ala Thr305 310 315 320Trp Lys Pro Gly Ser Ser Gly Pro Gly Ser Ala Gly Ser Trp Asn Ser325 330 335Gly Ser Ser Gly Thr Gly Ser Thr Gly Asn Gln Asn Pro Gly Ser Pro340 345 350Arg Pro Gly Ser Thr Gly Thr Trp Asn Pro Gly Ser Ser Glu Arg Gly355 360 365Ser Ala Gly His Trp Thr Ser Glu Ser Ser Val Ser Gly Ser Thr Gly370 375 380Gln Trp His Ser Glu Ser Gly Ser Phe Arg Pro Asp Ser Pro Gly Ser385 390 395 400Gly Asn Ala Arg Pro Asn Asn Pro Asp Trp Gly Thr Phe Glu Glu Val405 410 415Ser Gly Asn Val Ser Pro Gly Thr Arg Arg Glu Tyr His Thr Glu Lys420 425 430Leu Val Thr Ser Lys Gly Asp Lys Glu Leu Arg Thr Gly Lys Glu Lys435 440 445Val Thr Ser Gly Ser Thr Thr Thr Thr Arg Arg Ser Cys Ser Lys Thr450 455 460Val Thr Lys Thr Val Ile Gly Pro Asp Gly His Lys Glu Val Thr Lys465 470 475 480Glu Val Val Thr Ser Glu Asp Gly Ser Asp Cys Pro Glu Ala Met Asp485 490 495Leu Gly Thr Leu Ser Gly Ile Gly Thr Leu Asp Gly Phe Arg His Arg500 505 510His Pro Asp Glu Ala Ala Phe Phe Asp Thr Ala Ser Thr Gly Lys Thr515 520 525Phe Pro Gly Phe Phe Ser Pro Met Leu Gly Glu Phe Val Ser Glu Thr530 535 540Glu Ser Arg Gly Ser Glu Ser Gly Ile Phe Thr Asn Thr Lys Glu Ser545 550 555 560Ser Ser His His Pro Gly Ile Ala Glu Phe Pro Ser Arg Gly Lys Ser565 570 575Ser Ser Tyr Ser Lys Gln Phe Thr Ser Ser Thr Ser Tyr Asn Arg Gly580 585 590Asp Ser Thr Phe Glu Ser Lys Ser Tyr Lys Met Ala Asp Glu Ala Gly595 600 605Ser Glu Ala Asp His Glu Gly Thr His Ser Thr Lys Arg Gly His Ala610 615 620Lys Ser Arg Pro Val Arg Gly Ile His Thr Ser Pro Leu Gly Lys Pro625 630 635 640Ser Leu Ser Pro(2)SEQ ID NO3的信息(i)序列特征(A)長(zhǎng)度8878bp(B)類型核酸(C)鏈性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(vii)來(lái)源(B)克隆人纖維蛋白原B-β鏈(ix)特征(A)名稱/關(guān)鍵詞misc-RNA(B)位置1..469(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置470..583(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置584..3257(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置3258..3449(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置3450..3938(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置3939..4122(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置4123..5042(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置5043..5270(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置5271..5830(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置5831..5944(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置5945..6632(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置6633..6758(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置6759..6966(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置6967..7252(ix)特征(A)名稱/關(guān)鍵詞內(nèi)含子(B)位置7253..7870(ix)特征(A)名稱/關(guān)鍵詞外顯子(B)位置7871..8102(ix)特征(A)名稱/關(guān)鍵詞3’UTR(B)位置8103..8537(ix)特征(A)名稱/關(guān)鍵詞misc-RNA(B)位置8538..8878(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置連接(470..583，3258..3449，3939..4122，5043..5270，5831..5944，6633..6758，6967..7252，7871..8102)(xi)序列描述SEQ ID NO3GAATTCATGC CCCTTTTGAA ATAGACTTAT GTCATTGTCA GAAAACATAA GCATTTATGG 60TATATCATTA ATGAGTCACG ATTTTAGTGG TTGCCTTGTG AGTAGGTCAA ATTTACTAAG 120CTTAGATTTG TTTTCTCACA TATTCTTTCG GAGCTTGTGT AGTTTCCACA TTAATTTACC 180AGAAACAAGA TACACACTCT CTTTGAGGAG TGCCCTAACT TCCCATCATT TTGTCCAATT 240AAATGAATTG AAGAAATTTA ATGTTTCTAA ACTAGACCAA CAAAGAATAA TAGTTGTATG 300ACAAGTAAAT AAGCTTTGCT GGGAAGATGT TGCTTAAATG ATAAAATGGT TCAGCCAACA 360AGTGAACCAA AAATTAAATA TTAACTAAGG AAAGGTAACC ATTTCTGAAG TCATTCCTAG 420CAGAGGACTC AGATATATAT AGGATTGAAG ATCTCTCAGT TAAGTCTAC ATG AAA 475Met Lys1AGG ATG GTT TCT TGG AGC TTC CAC AAA CTT AAA ACC ATG AAA CAT CTA 523Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys His Leu5 10 15TTA TTG CTA CTA TTG TGT GTT TTT CTA GTT AAG TCC CAA GGT GTC AAC 571Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly Val Asn20 25 30GAC AAT GAG GAG GTGAATTTTT TAAAGCATTA TTATATTATT AGTAGTATTA 623Asp Asn Glu Glu35TTAATATAAG ATGTAACATA ATCATATTAT GTGCTTATTT TAATGAAATT AGCATTGCTT 683ATAGTTATGA AATGGAATTG TTAACCTCTG ACTTATTGTA TTTAAAGAAT GTTTCATAGT 743ATTTCTTATA TAAAAACAAA GTAATTTCTT GTTTTCTAGT TTATCACCTT TGTTTTCTTA 803AGATGAGGAT GGCTTAGCTA ATGTAAGATG TGTTTTTCTC ACTTGCTATT CTGAGTACTG 863TGATTTTCAT TTACTTCTAG CAATACAGGA TTACAATTAA GAGGACAAGA TCTGAAAATC 923TCACAAACTA TAAAATAATA AAAGAGCAGA ATTTTAAGAT AAAAGAAACT GGTGGTAGGT 983AGATTGTTCT TTGGTGAAGG AAGGTAATAT ATATTGTTAC TGAGATTACT ATTTATAAAA1043ATTATAACTA AGCCTAAAAG CAAAATACAT CAAGTGTAAT GATAGAAAAT GAAATATTGC1103TTTTTTCAGA TGAAAAGTTC AAATTAGAGT TAGTGTGTAT TGTTATTATT AATAGTTATG1163AAACACGGTT CAGTCTAATT TATTTATTTG TAGAACAGTT TGTCCTCAAC TATTATTTTT1223GCTGACTTAT TGCTGTTAAT TTGCAGTTAC TAAAAATACA GAAATGCATT TAGGACAATG1283GATATTTAAG AAATTTAAAT TTTATCATCA AACGTATCAT GGCCAAATTT CTTACATATA1343GCATAGTATC ATTAAACTAG AAATAAGAAT ACACAATAAT ATTTAAATGA AGTGATTCAT1403TTCGGATCAT TATTGAGTTT CAAGGGAACT TGAGTGTTGT ACTTATCAGA CTCTACATGT1463AAGAACATAT AGTTAATCTG GTTGTGTGTG TAAAAACATA TGGTTAATCT GGTTAAGTCT1523GGTTAATCAT ATTAGGTAAG AAAAATGTAA AGAATGTGTA AGACGAAATT TTTGTAAAGT1583ACTCTGCAAA GCACTTTCAC ATTTCTGCTT ATCAACTAAA CCTCACAGAG ATAGTTTAAT1643AGTTTAGGCT TTAAAATGGA TTTTGATTAT TCAACAAGTG GCCTTCATAA TTTCTTTAAG1703TGTTTTTCTT TAAGTATATA CTTTCTTTAA ATATTTTTTA AAATTTCCTT TTCTCTAGTA1763AAGCCAGACC ATCCATGCTA CCTCTCTAGT GGCACTCTGA AATAAAAAGA AAATAGTTTT1823CTCTGTTATA ATTGTATTTG TAATAAGCAG ATGAATCACA TTTCTTAAAA TTTGTTTTAG1883AGAGGGTAAG CTCTGACTAG GACCATGACT TCAATGTGAA ATATGTATAT ATCCTCCGAA1943TCITTACATA TTAAGAATGT ATATAGTCAA CTGGTTAAAC AGGAAAATCT GGAACAGCCT2003GGCTGGGTTT TAATCTTAGC ACCATCCTAC TAAATGTTAA ATAATATTAT AATCTAATGA2063ATAAATGACA ATGCAATTCC AAATAGAGTT CATCTGATGA CTTCTAGACT CACAAAATTG2123CAAGAGAGCT CAGTTGTTGC TCAGTTGTTC CAAATCATGT CGTTTGTTAA TTTGTAATTA2183AGCTCCAAAG GATGTATAGC TACTGACAAA AAAAAAAATG AGAATGTAGT TAATCCAAAT2243CAAAACTTTC CTATTGCAAT GCGTATTTTC TGCTTCATTA TCCTTTAATA TAATATTTTA2303AGTTAGCAAG TAATTTTAAT TACAATGCAC AAGCCTTGAG AATTATTTTA AATATAAGAA2363AATCATAATG TTTGATAAAG AAATCATGTA AGAAATTTCA AGATAATGGT TTAACAAATA2423ATTTTGTTGA TAGAAGATAA GACTAAAAGT GAAATTCGAA GTGGAGAGGA CACTTAAACT2483GTAGTACTTG TTATGTGTGA TTCCAGTAAA AATAGTAATG AGCACTTATT ATTGCCAAGT2543ACTGTTCTGA GGGTACCATA TGCAATAAGT TATTTAATCC TTACAATAAT CTTGTAAGGC 2603AGATTCAAAC TATCATTACA CTTATTTTAC AGATGAGAAA ACTGGGGCAC AGATAAAGCA 2663ACTTGCCCAA GGTCTCATAG CTGTAAGTCA ACCCTACGGT CAAGACCTAC AAGTAGCCGA 2723GCTCCAGAGT ACATTATGAG GGTCAAAGAT TGTCTTATTA CAAATAAATT CCAAGTAGAA 2783TCAACCTTTA ATAAGTCTTT AATGTCTCTT AAATATGTTT ATATAGGAGT CTAATCACCA 2843ATTCACAAAA ATGAAAGTAG GGAAATGATT AACAATAATC ATAGGAATCT AACAATCCAA 2903GTGGCTTGAG AATATTCATT CTTCTTGACA GTATAGATTC TTTACAATTT CGTAAGTTCC 2963AATGTATGTT TTAGGAATAT GAGGTCATTA CTATTCATAA TCTGATACAG CTTTATCCTA 3023AGGCCTCTCT TTAAAAACTA CACTGCATCA TAGCTTTTTT GTGCAGTTGG TCTTTCTACT 3083GTTACTGAAC AGTAAGCAAC CTACAGATTC ACTATCACCA ACCAGCCAGT TGATGGATCT 3143TAAGCAAATT ATCAAGCTTG TGATAACCTA AATTATAAAA TGAGGGTGTT GGAATAGTTA 3203CATTCCAAAT CTTCTATAAC ACTCTGTATT ATATTTCTGC CTCATTCCTT GTAG GGT 3260GlyTTC TTC AGT GCC CGT GGT CAT CGA CCC CTT GAC AAG AAG AGA GAA GAG 3308Phe Phe Ser Ala Arg Gly His Arg Pro Leu Asp Lys Lys Arg Glu Glu40 45 50 55GCT CCC AGC CTG AGG CCT GCC CCA CCG CCC ATC AGT GGA GGT GGC TAT 3356Ala Pro Ser Leu Arg Pro Ala Pro Pro Pro Ile Ser Gly Gly Gly Tyr60 65 70CGG GCT CGT CCA GCC AAA GCA GCT GCC ACT CAA AAG AAA GTA GAA AGA 3404Arg Ala Arg Pro Ala Lys Ala Ala Ala Thr Gln Lys Lys Val Glu Arg75 80 85AAA GCC CCT GAT GCT GGA GGC TGT CTT CAC GCT GAC CCA GAC CTG 3449Lys Ala Pro Asp Ala Gly Gly Cys Leu His Ala Asp Pro Asp Leu90 95 100GTGGGTGCAC TGATGTTTCT TGCAGTGGTG GCTCTCTCAT GCAGAGAAAG CCTGTAGTCA 3509TGGCAGTCTG CTAATGTTTC ACTGACCCAC ATTACCATCA CTGTTATTTT GTTTGTTTAT 3569TTTGGAAATA AAATTCAAAA CATAAACATA TTGGGCCTTT GGTTTAGGCT TTCTTTCTTG3629TTTTCTTTGG TCTGGGCCCA AAATTTCAAA TTAGGATATG TGGGTGCCAC CTTTCCATTT3689GTATTTTGCC ACTGCCTTTG TTTAGTTGGT AAAATTTTCA TAGCCCAATT ATATTTTTTC3749TGGGGTAAGT AATATTTTAA ATCTCTATGA GAGTATGATG ATGACTTTCG AATTTCTGGT3809CTTACAGAAA ACCAAATAAT AAATTTTTAT GTTGGCTAAT CGTATCGCTG AATTTTCCTA3869TGTGCTATTT TAACAAATGT CCATGACCCA AATCCTTCAT CTAATGCCTG CTATTTTCTT3929TGTTTTTAG GGG GTG TTG TGT CCT ACA GGA TGT CAG TTG CAA GAG GCT3977Gly Val Leu Cys Pro Thr Gly Cys Gln Leu Gln Glu Ala105 110 115TTG CTA CAA CAG GAA AGG CCA ATC AGA AAT AGT GTT GAT GAG TTA AAT 4025Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp Glu Leu Asn120 125 130AAC AAT GTG GAA GCT GTT TCC CAG ACC TCC TCT TCT TCC TTT CAG TAC 4073Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser Phe Gln Tyr135 140 145ATG TAT TTG CTG AAA GAC CTG TGG CAA AAG AGG CAG AAG CAA GTA AAA G 4122Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys Gln Val Lys150 155 160GTAGATATCC TTGTGCTTTC CATTCGATTT TCAGCTATAA AATTGGAACC GTTAGACTGC4182CACGAGAATG CATGGTTGTG AGAAGATTAA CATTTCTGGG TTAGTGAATA GCATTCATAC4242GCTTTTGGGC ACCTTCCCCT GCAACTTGCC AGATAAGCAC TATTCAGCTC TTATTCCCAG4302TCTGACATCA GCAAGTGTGA TTTTCTATGA AAAATTCTAC TATGACTCCT TATTTTAAGT4362ATACAAGAAA CTTGTGACTC AGAAGATAAT ATTTACAGAG TGGAAAAAAA CCCCTAGCAT4422TTATAGTTTT AACATTTGAG GTTTTGAATG AGAGAGTTAT CCATAATATA TTCAATTGTG4482TTGTGGATAA TGACACCTAA CCTGTGAATC TTGAGGTCAG AATGTTGAGT GCTGTTGACT4542TGGTGGTCAG GAAACAGCTA GTGCGTGAGC CTGGCACAGG CATCTCAGTG AGTAGCATAC4602CCACAGTTGG AAATTTTTCA AAGAAATCAA AGGAATCATG ACATCTTATA AATTTCAAGG4662TTCTGCTATA CTTATGTGAA ATGGATAAAT AAATCAAGCA TATCCACTCT GTAAGATTGA4722ACTTCTCAGA TGGAAGACCC CAATACTGCT TTCTCCTCTT TTCCCTCACC AAAGAAATAA4782ACAACCTATT TCATTTATTA CTGGACACAA TCTTTAGCGT ATACCTATGG TAAATTACTA4842GTATGGTGGT TAGGATT T GTTAATTTGT ATATGTCATG CGCCAAATCA TTTCCACTAA4902ATATGACTAT ATATCATAAC TGCTTGGTGA TAGCTCAGTG TTTAATAGTT TATTCTCAGA4962AAATCAAAAT TGTATAGTTA AATACATTAG TTTTATGAGG CAAAAATGCT AACTATTTCT5022ACATAATTTC ATTTTTCCAG AT AAT GAA AAT GTA GTC AAT GAG TAC TCC5071Asp Asn Glu Asn Val Val Asn Glu Tyr Ser165 170TCA GAA CTG GAA AAG CAC CAA TTA TAT ATA GAT GAG ACT GTG AAT AGC 5119Ser Glu Leu Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser175 180 185AAT ATC CCA ACT AAC CTT CGT GTG CTT CGT TCA ATC CTG GAA AAC CTG 5167Asn Ile Pro Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu190 195 200 205AGA AGC AAA ATA CAA AAG TTA GAA TCT GAT GTC TCA GCT CAA ATG GAA 5215Arg Ser Lys Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu210 215 220TAT TGT CGC ACC CCA TGC ACT GTC AGT TGC AAT ATT CCT GTG GTG TCT 5263Tyr Cys Arg Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser225 230 235GGC AAA G GTAACTGATT CATAAACATA TTTTTAGAGA GTTCCAGAAG AACTCACACA5320Gly LysCCAAAAATAA GAGAACAACA ACAACAACAA AAATGCTAAG TGGATTTTCC CAACAGATCA5380TAATGACATT ACAGTACATC ATAAAAATAT CCTTAGCCAG TTGTGTTTTG GACTGGCCTG5440GTGCATTTGC TGGTTTTGAT GAGCAGGATG GGGCACAGGT AGTCCCAGGG GTGGCTGATG5500TGTGCATCTG CGTACTGGCT TGAACAGATG GCAGAACCAC AGATAGATGT AGAAGTTTCT5560CCATTTTGTG TGTTCTGGGA GCTCATGGAT ATTCCAGGAC ACAAAAGGTG GAGAAGAGCT5620TTGTTCATCC TCTTAGCAGA TAAACGTCCT CAAAACTGGG TTGGACTTAC TAAAGTAAAA5680TGAAAATCTA ATATTTGTTA TATTATTTTC AAAGGTCTAT AATAACACAC TCCTTAGTAA5740CTTATGTAAT GTTATTTTAA AGAATTGGTG ACTAAATACA AAGTAATTAT GTCATAAACC5800CCTGAACATA ATGTTGTCTT ACATTTGCAG AA TGT GAG GAA ATT ATC AGG AAA 5853Glu Cys Glu Glu Ile Ile Arg Lys240 245GGA GGT GAA ACA TCT GAA ATG TAT CTC ATT CAA CCT GAC AGT TCT GTC 5901Gly Gly Glu Thr Ser Glu Met Tyr Leu Ile Gln Pro Asp Ser Ser Val250 255 260AAA CCG TAT AGA GTA TAC TGT GAC ATG AAT ACA GAA AAT GGA G 5944Lys Pro Tyr Arg Val Tyr Cys Asp Met Asn Thr Glu Asn Gly265 270 275GTAAGCTTTC GACAGTTGTT GACCTGTTGA TCTGTAATTA TTTGGATACC GTAAAATGCC6004AGGAAACAAG GCCAGGTGTG GTGGCTCATA CCTGTAATTC CAGCACCTTG GGAGGCCAAA6064GTGGGCTGAT AGCTTGAGCC TAGGAGTTTG AAACTAGCCT GGGCAACATA ATGAGACCCT6124AACTCTACAA AAAAAAAAAA AATACCAAAA AAAAAAAAAA AATCAGCTGT GTTGGTAGTA6184TGTGCCTGTA GTCCCAGCTA TCCAGGAGGC TGAGATGGGA GATCACCTGA GCCCACAACC6244TGGAGTCTTG ATCATGCTAC TGAACTGTAG CCTGGGCAAC AGAGGATAGT GAGATCCTGT6304CTCAAAAAAA AAAATTAATT AAAAAGCCAG GAAACAAGAC TTAGCTCTAA CATCTAACAT6364AGCTGACAAA GGAGTAATTT GATGTGGAAT TCAACCTGAT ATTTAAAAGT TATAAAATAT6424CTATAATTCA CAATTTGGGG TAAGATAAAG CACTTGCAGT TTCCAAAGAT TTTACAAGTT6484TACCTCTCAT ATTTATTTCC TTATTGTGTC TATTTTAGAG CACCAAATAT ATACTAAATG6544GAATGGACAG GGGATTCAGA TATTATTTTC AAAGTGACAT TATTTGCTGT TGGTTAATAT6604ATGCTCTTTT TGTTTCTGTC AACCAAAG GA TGG ACA GTG ATT CAG AAC CGT 6655Gly Trp Thr Val Ile Gln Asn Arg280 285CAA GAC GGT AGT GTT GAC TTT GGC AGG AAA TGG GAT CCA TAT AAA CAG 6703Gln Asp Gly Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln290 295 300GGA TTT GGA AAT GTT GCA ACC AAC ACA GAT GGG AAG AAT TAC TGT GGC 6751Gly Phe Gly Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly305 310 315CTA CCA G GTAACGAACA GGCATGCAAA ATAAAATCAT TCTATTTGAA ATGGGATTTT6808Leu ProTTTTAATTAA AAAACATTCA TTGTTGGAAG CCTGTTTTAG GCAGTTAAGA GGAGTTTCCT6868GACAAAAATG TGGAAGCTAA AGATAAGGGA AGAAAGGCAG TTTTTAGTTT CCCAAAATTT6928TATTTTTGGT GAGAGATTTT ATTTTGTTTT TCTTTTAG GT GAA TAT TGG CTT6980Gly Glu Tyr Trp Leu320GGA AAT GAT AAA ATT AGC CAG CTT ACC AGG ATG GGA CCC ACA GAA CTT 7028Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly Pro Thr Glu Leu325 330 335 340TTG ATA GAA ATG GAG GAC TGG AAA GGA GAC AAA GTA AAG GCT CAC TAT 7076Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val Lys Ala His Tyr345 350 355GGA GGA TTC ACT GTA CAG AAT GAA GCC AAC AAA TAC CAG ATC TCA GTG 7124Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr Gln Ile Ser Val360 365 370AAC AAA TAC AGA GGA ACA GCC GGT AAT GCC CTC ATG GAT GGA GCA TCT 7172Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met Asp Gly Ala Ser375 380 385CAG CTG ATG GGA GAA AAC AGG ACC ATG ACC ATT CAC AAC GGC ATG TTC 7220Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His Asn Gly Met Phe390 395 400TTC AGC ACG TAT GAC AGA GAC AAT GAC GGC TG GTATGTGTGG 7262Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp405 410 415CACTCTTTGC TCCTGCTTTA AAAATCACAC TAATATCATT ACTCAGAATC ATTAACAATA7322TTTTTAATAG CTACCACTTC CTGGGCACTT ACTGTCAGCC ACTGTCCTAA GCTCTTTATG7382CATCACTCGA AAGCATTTCA ACTATAAGGT AGACATTCTT ATTCTCATTT TACAGATGAG7442ATTTAGAGAG ATTACGTGAT TTGTCCAATG TCACACAACT ACCCAGAGAT AAAACTAGAA7502TTTGAGCACA GTTACTTTCT GAATAATGAG CATTTAGATA AATACCTATA TCTCTATATT7562CTAAAGTGTG TGTGAAAACT TTCATTTTCA TTTCCAGGGT TCTCTGATAC TAAGGGTTGT7622AAAAGCTATT ATTCCAGTAT AAAGTAACAA ACACAGTCCC TAGATGGATT GCCACAAAGG7682CCCAGTTATC TCTCTTTCTT GCTATAGGGC ACAGGAGGTC TTTGGTGTAT TAGTGTGACT7742CTATGTATAG CACCCAAAGG AAAGACTACT GTGCACACGA GTGTAGCAGT CTTTTATGGG7802TAATCTGCAA AACGTAACTT GACCACCGTA GTTCTGTTTC TAATAACGCC AAACACATTT7862TCTTTCAG G TTA ACA TCA GAT CCC AGA AAA CAG TGT TCT AAA GAA GAC 7910Leu Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp420 425GGT GGT GGA TGG TGG TAT AAT AGA TGT CAT GCA GCC AAT CCA AAC GGC 7958Gly Gly Gly Trp Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly430 435 440AGA TAC TAC TGG GGT GGA CAG TAC ACC TGG GAC ATG GCA AAG CAT GGC 8006Arg Tyr Tyr Trp Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly445 450 455 460ACA GAT GAT GGT GTA GTA TGG ATG AAT TGG AAG GGG TCA TGG TAC TCA 8054Thr Asp Asp Gly Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser465 470 475ATG AGG AAG ATG AGT ATG AAG ATC AGG CCC TTC TTC CCA CAG CAA TAGTCCCCAA8109Met Arg Lys Met Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln480 485 490TACGTAGATT TTTGCTCTTC TGTATGTGAC AACATTTTTG TACATTATGT TATTGGAATT8169TTCTTTCATA CATTATATTC CTCTAAAACT CTCAAGCAGA CGTGAGTGTG ACTTTTTGAA8229AAAAGTATAG GATAAATTAC ATTAAAATAG CACATGATTT TCTTTTGTTT TCTTCATTTC8289TCTTGCTCAC CCAAGAAGTA ACAAAAGTAT AGTTTTGACA GAGTTGGTGT TCATAATTTC8349AGTTCTAGTT GATTGCGAGA ATTTTCAAAT AAGGAAGAGG GGTCTTTTAT CCTTGTCGTA8409GGAAAACCAT GACGGAAAGG AAAAACTGAT GTTTAAAAGT CCACTTTTAA AACTATATTT8469ATTTATGTAG GATCTGTCAA AGAAAACTTC CAAAAAGATT TATTAATTAA ACCAGACTCT8529GTTGCAATAA GTTAATGTTT TCTTGTTTTG TAATCCACAC ATTCAATGAG TTAGGCTTTG 8589CACTTGTAAG GAAGGAGAAG CGTTCACAAC CTCAAATAGC TAATAAACCG GTCTTGAATA 8649TTTGAAGATT TAAAATCTGA CTCTAGGACG GGCACGGTGG CTCACGACTA TAATCCCAAC 8709ACTTTGGGAG GCTGAGGCGG GCGGTCACAA GGTCAGGAGT TCAAGACCAG CCTGACCAAT 8769ATGGTGAAAC CCCATCTCTA CTAAAAATAC AAAAATTAGC CAGGCGTGGT GGCAGGTGCC 8829TGTAGGTCCC AGCTAGCCTG TGAGGTGGAG ATTGCATTGA GCCAAGATC 8878(2)SEQ ID NO4的信息(i)序列特征(A)長(zhǎng)度491個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO4Met Lys Arg Met Val Ser Trp Ser Phe His Lys Leu Lys Thr Met Lys1 5 10 15His Leu Leu Leu Leu Leu Leu Cys Val Phe Leu Val Lys Ser Gln Gly20 25 30Val Asn Asp Asn Glu Glu Gly Phe Phe Ser Ala Arg Gly His Arg Pro35 40 45Leu Asp Lys Lys Arg Glu Glu Ala Pro Ser Leu Arg Pro Ala Pro Pro50 55 60Pro Ile Ser Gly Gly Gly Tyr Arg Ala Arg Pro Ala Lys Ala Ala Ala65 70 75 80Thr Gln Lys Lys Val Glu Arg Lys Ala Pro Asp Ala Gly Gly Cys Leu85 90 95His Ala Asp Pro Asp Leu Gly Val Leu Cys Pro Thr Gly Cys Gln Leu100 105 110Gln Glu Ala Leu Leu Gln Gln Glu Arg Pro Ile Arg Asn Ser Val Asp115 120 125Glu Leu Asn Asn Asn Val Glu Ala Val Ser Gln Thr Ser Ser Ser Ser130 135 140Phe Gln Tyr Met Tyr Leu Leu Lys Asp Leu Trp Gln Lys Arg Gln Lys145 150 155 160Gln Val Lys Asp Asn Glu Asn Val Val Asn Glu Tyr Ser Ser Glu Leu165 170 175Glu Lys His Gln Leu Tyr Ile Asp Glu Thr Val Asn Ser Asn Ile Pro180 185 190Thr Asn Leu Arg Val Leu Arg Ser Ile Leu Glu Asn Leu Arg Ser Lys195 200 205Ile Gln Lys Leu Glu Ser Asp Val Ser Ala Gln Met Glu Tyr Cys Arg210 215 220Thr Pro Cys Thr Val Ser Cys Asn Ile Pro Val Val Ser Gly Lys Glu225 230 235 240Cys Glu Glu Ile Ile Arg Lys Gly Gly Glu Thr Ser Glu Met Tyr Leu245 250 255Ile Gln Pro Asp Ser Ser Val Lys Pro Tyr Arg Val Tyr Cys Asp Met260 265 270Asn Thr Glu Asn Gly Gly Trp Thr Val Ile Gln Asn Arg Gln Asp Gly275 280 285Ser Val Asp Phe Gly Arg Lys Trp Asp Pro Tyr Lys Gln Gly Phe Gly290 295 300Asn Val Ala Thr Asn Thr Asp Gly Lys Asn Tyr Cys Gly Leu Pro Gly305 310 315 320Glu Tyr Trp Leu Gly Asn Asp Lys Ile Ser Gln Leu Thr Arg Met Gly325 330 335Pro Thr Glu Leu Leu Ile Glu Met Glu Asp Trp Lys Gly Asp Lys Val340 345 350Lys Ala His Tyr Gly Gly Phe Thr Val Gln Asn Glu Ala Asn Lys Tyr355 360 365Gln Ile Ser Val Asn Lys Tyr Arg Gly Thr Ala Gly Asn Ala Leu Met370 375 380Asp Gly Ala Ser Gln Leu Met Gly Glu Asn Arg Thr Met Thr Ile His385 390 395 400Asn Gly Met Phe Phe Ser Thr Tyr Asp Arg Asp Asn Asp Gly Trp Leu405 410 415Thr Ser Asp Pro Arg Lys Gln Cys Ser Lys Glu Asp Gly Gly Gly Trp420 425 430Trp Tyr Asn Arg Cys His Ala Ala Asn Pro Asn Gly Arg Tyr Tyr Trp435 440 445Gly Gly Gln Tyr Thr Trp Asp Met Ala Lys His Gly Thr Asp Asp Gly450 455 460Val Val Trp Met Asn Trp Lys Gly Ser Trp Tyr Ser Met Arg Lys Met465 470 475 480Ser Met Lys Ile Arg Pro Phe Phe Pro Gln Gln485 490(2)SEQ ID NO5的信息(i)序列特征(A)長(zhǎng)度10564bp(B)類型核酸(C)鏈性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型DNA(基因組)(vii)來(lái)源(B)克隆人纖維蛋白原γ鏈(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置連接(1799..1876，1973..2017，2207..2390，2510..2603，4211..4341，4645..4778，5758..5942，7426..77039342..9571)(xi)序列描述SEQ ID NO5CTACACACTT CTTGAAGGCA AAGGCAATGC TGAAGTCACC TTTCATGTTC AAATCATATT 60AAAAAGTTAG CAAGATGTAA TTATCAGTGT ACTATGTAAA TCTTTGTGAA TGATCAATAA 120TTACATATTT TCATTATATA TATTTTAGTA GATAATATTT ATATACATTC AACATTCTAA 180ATATAGAAAG TTTACAGAGA AAAATAAAGC CTTTTTTTCC AATCCTGTCC TCCACCTCTG 240CATCCCATTC TTCTTCACAG AGGCAACTGA TTCAAGTCAT TACATAGTTA TTGAGTGTTA 300ACTACAACTA TGTTAAGTAC AGCTATATAT GTTAGATGCC GTAGCCACAG AAATCAGTTT 360ACAATCTAAT GCAGTGGATA CAGCATGTAT ACATATAATA TAAGGTTGCT ACAAATGCTA 420TCTGAGGTAG AGCTGTTTGA AAGAATACTA ATACTTAAAT GTTTAATTCA ACTGACTTGA 480TTGACAACTG ATTAGCTGAG TGGAAAAGAT GGATGAGAAA GATTGTGAGA CTTAATTGGC 540TGGTGGTATG GTGATATGAT TGACAATAAC TGCTAAGTCA GAGAGGGATA TATTAAGGAG 600GAGAAGAAAA GCAACAAATC TGGTTTTGAT GTGTTCACTT TGTTATAATT ATTGATTATT 660TACTGAATAT GAATATTTAT CTTTGTTTTT GAGTCAATAA ATATACCTTT GTAAAGACAG 720AATTAAAGTA TTAGTATTTC TTTCAAACTG GAGGCATTTC TCCCACTAAC ATATTTCATC 780AAAACTTATA ATAAGCTTGG TTCCAGAGGA AGAAATGAGG GATAACCAAA AATAGAGACA 840TTAATAATAG TGTAACGCCC AGTGATAAAT CTCAATAGGC AGTGATGACA GACATGTTTT 900CCCAAACACA AGGATGCTGT AAGGGCCAAA CAGAAATGAT GGCCCCTCCC CAGCACCTCA 960TTTTGCCCCT TCCTTCAGCT ATGCCTCTAC TCTCCTTTAG ATACAAGGGA GGTGGATTTT1020TCTCTTCTCT GAGATAGCTT GATGGAACCA CAGGAACAAT GAAGTGGGCT CCTGGCTCTT1080TTCTCTGTGG CAGATGGGGT GCCATGCCCA CCTTCAGACA AAGGGAAGAT TGAGCTCAAA1140AGCTCCCTGA GAAGTGAGAG CCTATGAACA TGGTTGACAC AGAGGGACAG GAATGTATTT1200CCAGGGTCAT TCATTCCTGG GAATAGTGAA CTGGGACATG GGGGAAGTCA GTCTCCTCCT1260GCCACAGCCA CAGATTAAAA ATAATAATGT TAACTGATCC CTAGGCTAAA ATAATAGTGT1320TAACTGATCC CTAAGCTAAG AAAGTTCTTT TGGTAATTCA GGTGATGGCA GCAGGACCCA1380TCTTAAGGAT AGACTAGGTT TGCTTAGTTC GAGGTCATAT CTGTTTGCTC TCAGCCATGT1440ACTGGAAGAA GTTGCATCAC ACAGCCTCCA GGACTGCCCT CCTCCTCACA GCAATGGATA1500ATGCTTCACT AGCCTTTGCA GATAATTTTG GATCAGAGAA AAAACCTTGA GCTGGGCCAA1560AAAGGAGGAG CTTCAACCTG TGTGCAAAAT CTGGGAACCT GACAGTATAG GTTGGGGGCC1620AGGATGAGGA AAAAGGAACG GGAAAGACCT GCCCACCCTT CTGGTAAGGA GGCCCCGTGA1680TCAGCTCCAG CCATTTGCAG TCCTGGCTAT CCCAGGAGCT TACATAAAGG GACAATTGGA1740GCCTGAGAGG TGACAGTGCT GACACTACAA GGCTCGGAGC TCCGGGCACT CAGACATC 1798ATG AGT TGG TCC TTG CAC CCC CGG AAT TTA ATT CTC TAC TTC TAT GCT 1846Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1 5 10 15CTT TTA TTT CTC TCT TCA ACA TGT GTA GCA GTAAGTGTGC TCTTCACAAA1896Leu Leu Phe Leu Ser Ser Thr Cys Val Ala20 25ACGTTGTTTA AAATGGAAAG CTGGAAAATA AAACAGATAA TAAACTAGTG AAATTTTCGT1956ATTTTTTCTC TTTTAG TAT GTT GCT ACC AGA GAC AAC TGC TGC ATC TTA2005Tyr Val Ala Thr Arg Asp Asn Cys Cys Ile Leu30 35GAT GAA AGA TTC GTAAGTAGTT TTTATGTTTC TCCCTTTGTG TGTGAACTGG 2057Asp Glu Arg Phe40AGAGGGGCAG AGGAATAGAA ATAATTCCCT CATAAATATC ATCTGGCACT TGTAACTTTT2117TAAAAACATA GTCTAGGTTT TACCTATTTT TCTTAATAGA TTTTAAGAGT AGCATCTGTC2177TACATTTTTA ATCACTGTTA TATTTTCAG GGT AGT TAT TGT CCA ACT ACC TGT 2230Gly Ser Tyr Cys Pro Thr Thr Cys45GGC ATT GCA GAT TTC CTG TCT ACT TAT CAA ACC AAA GTA GAC AAG GAT 2278Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys Asp50 55 60 65CTA CAG TCT TTG GAA GAC ATC TTA CAT CAA GTT GAA AAC AAA ACA TCA 2326Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr Ser70 75 80GAA GTC AAA CAG CTG ATA AAA GCA ATC CAA CTC ACT TAT AAT CCT GAT 2374Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro Asp85 90 95GAA TCA TCA AAA CCA A GTGAGAAAAT AAAGACTACT GACCAAAAAA 2420Glu Ser Ser Lys Pro100TAATAATAAT AATCTGTGAA GTTCTTTTGC TGTTGTTTTA GTTGTTCTAT TTGCTTAAGG2480ATTTTTATGT CTCTGATCCT ATATTACAG AT ATG ATA GAC GCT GCT ACT TTG 2532Asn Met Ile Asp Ala Ala Thr Leu105 110AAG TCC AGG ATA ATG TTA GAA GAA ATT ATG AAA TAT GAA GCA TCG ATT 2580Lys Ser Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile115 120 125TTA ACA CAT GAC TCA AGT ATT CG GTAAGGATTT TTGTTTTAAT TTGCTCTGCA2633Leu Thr His Asp Ser Ser Ile Arg130AGACTGATTT AGTTTTTATT TAATATTCTA TACTTGAGTG AAAGTAATTT TTAATGTGTT2693TTCCCCATTT ATAATATCCC AGTGACATTA TGCCTGATTA TGTTGAGCAT AGTAGAGATA2753GAAGTTTTTA GTGCAATATA AATTATACTG GGTTATAATT GCTTATTAAT AATCACATTG2813AAGAAAGATG TTCTAGATGT CTTCAAATGC TAGTTTGACC ATATTTATCA AAAATTTTTT2873CCCCATCCCC CATTTATCTT ACAACATAAA ATCAATCTCA TAGGAATTTG GGTGTTGAAA2933ATAAAATCCT CTTTATAAAA ATGCTGACAA ATTGGTGGTT AAAAAAATTA GCAAGCAGAG2993GCATAGTAAG GATTTTGGCT CCTAAAGTAA ATTATATTGA ATGTGGAGCA GGAAGAAACA3053TGTCTTGAGA GACTAAGTGT GGCAAATATT GCAAAGCTCA TATTGATCAT TGCAGAATGA3113ACCTGCATAG TCTCTTCCCT TCATTTGGAA GTGAATGTCT CTGTTAAAGC TTCTCAGGGA3173CTCATAAACT TTCTGAACAT AAGGTCTCAG ATACAGTTTT AATATTTTTC CCCAATTTTT3233TTTTCTGAAT TTTTCTCAAA GCAGCTTGAG AAATTGAGAT AAATAGTAGC TAGGGAGAAG3293TGGCCCAGGA AAGATTTCTC CTCTTTTTGC TATCAGAGGG CCCTTGTTAT TATTGTTATT3353ATTATTACTT GCATTATTAT TGTCCATCAT TGAAGTTGAA GGAGGTTATT GTACAGAAAT3413TGCCTAAGAC AAGGTAGAGG GAAAACGTGG ACAAATAGTT TGTCTACCCT TTTTTACTTC3473AAAGAAAGAA CGGTTTATGC ATTGTAGACA GTTTTCTATC ATTTTTGGAT ATTTGCAAGC3533CACCCTGTAA GTAACTACAA AAGGAGGGTT TTTACTTCCC CCAGTCCATT CCCAAAGCTA3593TGTAACCAGA AGCATTAAAG AAGAAAGGGG AAGTATCTGT TGTTTTATTT TACATACAAT3653AACGTTCCAG ATCATGTCCC TGTGTAAGTT ATATTTTAGA TTGAAGCTTA TATGTATAGC3713CTCAGTAGAT CCACAAGTGA AAGGTATACT CCTTCAGCAC ATGTGAATTA CTGAACTGAG3773CTTTTCCTGC TTCTAAAGCA TCAGGGGGTG TTCCTATTAA CCAGTCTCGC CACTCTTGCA3833GGTTGCTATC TGCTGTCCCT TATGCATAAA GTAAAAAGCA AAATGTCAAT GACATTTGCT3893TATTGACAAG GACTTTGTTA TTTGTGTTGG GAGTTGAGAC AATATGCCCC ATTCTAAGTA3953AAAAGATTCA GGTCCACATT GTATTCCTGT TTTAATTGAT TTTTTGATTT GTTTTTCTTT4013TTCAAAAAGT TTATAATTTT AATTCATGTT AATTTAGTAA TATAATTTTA CATTTTCCTC4073AAGAATGGAA TAATTTATCA GAAAGCACTT CTTAAGAAAA TACTTAGCAG TTTCCAAAGA4133AAATATAAAA TTACTCTTCT GAAAGGAATA CTTATTTTTG TCTTCTTATT TTTGTTATCT4193TATGTTTCTG TTTGTAG A TAT TTG CAG GAA ATA TAT AAT TCA AAT AAT CAA 4244Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn Gln135 140 145AAG ATT GTT AAC CTG AAA GAG AAG GTA GCC CAG CTT GAA GCA CAG TGC 4292Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln Cys150 155 160CAG GAA CCT TGC AAA GAC ACG GTG CAA ATC CAT GAT ATC ACT GGG AAA G 4341Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly Lys165 170 175GTAACTGATG AAGGTTATAT TGGGATTAGG TTCATCAAAG TAAGTAATGT AAAGGAGAAA4401GTATGTACTG GAAAGTATAG GAATAGTTTA GAAAGTGGCT ACCCATTAAG TCTAAGAATT4461TCAGTTGTCT AGACCTTTCT TGAATAGCTA AAAAAAACAG TTTAAAAGGA ATGCTGATGT4521GAAAAGTAAG AAAATTATTC TTGGAAAATG AATAGTTTAC TACATGTTAA AAGCTATTTT4581TCAAGGCTGG CACAGTCTTA CCTGCATTTC AAACCACAGT AAAAGTCGAT TCTCCTTCTC4641TAG AT TGT CAA GAC ATT GCC AAT AAG GGA GCT AAA CAG AGC GGG CTT 4688Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu180 185 190TAC TTT ATT AAA CCT CTG AAA GCT AAC CAG CAA TTC TTA GTC TAC TGT 4736Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys195 200 205GAA ATC GAT GGG TCT GGA AAT GGA TGG ACT GTG TTT CAG AAG 4778Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys210 215 220GTAATTTTTT CCCCACCATG TGTATTTAAT AAATTCCTAC ATTGTTTCTG CCATATGGCA4838GATACTTTTC TAAGCACCTT GTGAACCGTA GCTCATTTAA TCCTTGCAAT AGCCCTAAGA4898GGAAGGTACT TCTGTTACTC CTATTTACAG AAAAGGAAAC TGAGGCACAC AAGGTTAAAT4958AACTTGCCCA AGACCACATA ACTAATAAGC AACAGAGTCA GCATTTGAAC CTAGGCAGTA5018TAGTTTCAGA GTTTGTGACT TGACTCTATA TTGTACTGGC ACTGACTTTG TAGATTCATG5078GTGGCACATA ATCATAGTAC CACAGTGACA AATAAAAAGA AGGAAACTCT TTTGTCAGGT5138AGGTCAAGAC CTGAGGTTTC CCATCACAAG ATGAGGAAGC CCAACACCAC CCCCCACCAC5198CCCACCACCA TCACCACCCT TTCACACACC AGAGGATACA CTTGGGCTGC TCCAAGACAA5258GGAACCTGTG TTGCATCTGC CACTTGCTGA TACCCACTAG GAATCTTGGC TCCTTTACTT5318TCTGTTTACC TCCCACCACT GTTATAACTG TTTCTACAGG GGGCGCTCAG AGGGAATGAA5378TGGTGGAAGC ATTAGTTGCC AGACACCGAT TGAGCAATGG GTTCCATCAT AAGTGTAAGA5438ATCAGTAATA TCCAGCTAGA GTTCTGAAGT CGTCTAGGTG TCTTTTTAAT ATTACCACTC5498ATTTAGAATT TATGATGTGC CAGAAACCCT CTTAAGTATT TCTCTTATAT TCTCTCTCAT5558GATCCTTGCA GCAACCCTAA GAAGTAACCA TCATTTTTCC TATTTGATAC ATGAGGAAAC5618TGAGGTAGCT TGGCCAAGAT CACTTAGTTG GGAGTTGATA GAACCAGTGC TCTGTATTTT5678TGACAAAATG TTGACAGCAT TCTCTTTACA TGCATTGATA GTCTATTTTC TCCTTTTGCT5738CTTGCAAATG TGTAATTAG AGA CTT GAT GGC AGT GTA GAT TTC AAG AAA AAC 5790Arg Leu Asp Gly Ser Val Asp Phe Lys Lys Asn225 230TGG ATT CAA TAT AAA GAA GGA TTT GGA CAT CTG TCT CCT ACT GGC ACA 5838Trp Ile Gln Tyr Lys Glu Gly Phe Gly His Leu Ser Pro Thr Gly Thr235 240 245ACA GAA TTT TGG CTG GGA AAT GAG AAG ATT CAT TTG ATA AGC ACA CAG 5886Thr Glu Phe Trp Leu Gly Asn Glu Lys Ile His Leu Ile Ser Thr Gln250 255 260 265TCT GCC ATC CCA TAT GCA TTA AGA GTG GAA CTG GAA GAC TGG AAT GGC 5934Ser Ala Ile Pro Tyr Ala Leu Arg Val Glu Leu Glu Asp Trp Asn Gly270 275 280AGA ACC AG GTACTGTTTT GAAATGACTT CCAACTTTTT ATTGTAAAGA 5982Arg Thr SerTTGCCTGGAA TGTGCACTTT CCAACTATCA ATAGACAATG GCAAATGCAG CCTGACAAAT6042GCAAACAGCA CATCCAGCCA CCATTTTCTC CAGGAGTCTG TTTGGTTCTT GGGCAATCCA6102AAAAGGTAAA TTCTATTCAG GATGAATCTA AGTGTATTGG TACAATCTAA TTACCCTGGA6162ACCATTCAGA GTAATAGCTA ATTACTGAAC TTTTAATCAG TCCCAGGAAT TGAGCATAAA6222ATTATAATTT TATCTAGTCT AAATTACTAT TTCATGAAGC AGGTATTATT ATTAATCCCA6282TTTTATAGAT TAACTTGCTC AAAGTCACAT TGCTGATAAG TGGTAGAGGT AGAATTCAGA6342CTCAAGTAGT TTAACTTTAG AGCCTGTCCT CTTAACAACT ATCCTGGTTG AAAAGCAAAT6402ACAGCCTCTT CAGACTTCTC AGTGCCTTGA TGGCCATTTA TTCTGTCAAA TCATGAGCTA6462CCCTAAAAGT AAACCAGCTA GCTCTTTTGA TGATCTAGAG GCTTCTTTTT GCTTGAGATA6522TTTGAAGGTT TTAAGCATTG TTACCTAATT AAAATGCAGA AAAATATCCA ACCCTCTTGT6582TATGTTTAAG GAATAGTGAA ATATATTGTC TTCAAACACA TGGACTTTTT TTTATTGCTT6642GGTTGGTTTT TAATCCAGAA AGTGCTATAG TCAGTAGACC TTCTTCTAGG AAAGGACCTT6702CCATTTCCCA GCCACTGGAG ATTAGAAAAT AAGCTAAATA TTTTCTGGAA ATTTCTGTTC 6762ATTCATTAAG GCCCATCCTT TCCCCCACTC TATAGAAGTG TTGTCCACTT GCACAATTTT 6822TTCCAGGAAA GAATCTCTCT AACTCCTTCA GCTCACATGC TTTGGACCAC ACAGGGAAGA 6882CTTTGATTGT GTAATGCCCT CAGAAGCTCT CCTTCTTGCC ACTACCACAC TGATTTGAGG 6942AAGAAAATCC CTTTAGCACC TAACCCTTCA GGTGCTATGA GTGGCTAATG GAACTGTACC 7002TCCTTCAAGT TTTGTGCAAT AATTAAGGGT CACTCACTGT CAGATACTTT CTGTGATCTA 7062TGATAATGTG TGTGCAACAC ATAACATTTC AATAAAAGTA GAAAATATGA AATTAGAGTC 7122ATCTACACAT CTGGATTTGA TCTTAGAATG AAACAAGCAA AAAAGCATCC AAGTGAGTGC 7182AATTATTAGT TTTCAGAGAT GCTTCAAAGG CTTCTAGGCC CATCCCGGGA AGTGTTAATG 7242AGCTGTGGAC TGGTTCACAT ATCTATTGCC TCTTGCCAGA TTTGCAAAAA ACTTCACTCA 7302ATGAGCAAAT TTCAGCCTTA AGAAACAAAG TCAAAAATTC CAAGGAAGCA TCCTACGAAA 7362GAGGGAACTT CTGAGATCCC TGAGGAGGGT CAGCATGTGA TGGTTGTATT TCCTTCTTCT 7422CAG T ACT GCA GAC TAT GCC ATG TTC AAG GTG GGA CCT GAA GCT GAC 7468Thr Ala Asp Tyr Ala Met Phe Lys Val Gly Pro Glu Ala Asp285 290 295AAG TAC CGC CTA ACA TAT GCC TAC TTC GCT GGT GGG GAT GCT GGA GAT 7516Lys Tyr Arg Leu Thr Tyr Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp300 305 310GCC TTT GAT GGC TTT GAT TTT GGC GAT GAT CCT AGT GAC AAG TTT TTC 7564Ala Phe Asp Gly Phe Asp Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe315 320 325 330ACA TCC CAT AAT GGC ATG CAG TTC AGT ACC TGG GAC AAT GAC AAT GAT 7612Thr Ser His Asn Gly Met Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp335 340 345AAG TTT GAA GGC AAC TGT GCT GAA CAG GAT GGA TCT GGT TGG TGG ATG 7660Lys Phe Glu Gly Asn Cys Ala Glu Gln Asp Gly Ser Gly Trp Trp Met350 355 360AAC AAG TGT CAC GCT GGC CAT CTC AAT GGA GTT TAT TAC CAA G 7703Asn Lys Cys His Ala Gly His Leu Asn Gly Val Tyr Tyr Gln365 370 375GTATGTTTTC CTTTCTTAGA TTCCAAGTTA ATGTATAGTG TATACTATTT TCATAAAAAA7763TAATAAATAG ATATGAAGAA ATGAAGAATA ATTTATAAAG ATAGTAGGGA TTTTATCATG7823TTCTTTATTT CAACTAAGTT CTTTGAAACT GGAAGTGGAT AATACCAAGT TCATGCCTAA7883AATTAGCCCT TCTAAAGAAA TCCACCTGCT GCAAAATATC CAGTAGTTTG GCATTATATG7943TGAAACTATC ACCATCATAG CTGGCACTGT GGGTTGTGGG ATCTCCTTTA GACATACAAC8003ATAAATGATC TGGATGGATT AACATTACTA CATGGATGCT TGTTGACACA TTAACCTGGC8063TTCCCATGAG CTTTGTGTCA GATACACGCA GTGAACAGGT GTTTGGAGGA ACAGAATAAA8123GAGAAGGCAA GCACTGGTAA GGGCAGGGGT TTGTGAAAGC TTGAGAGAAG AGACCAGTCT8183GAGGACAGTA GACACTTATT TTAGGATGGG GGTTGGATGA GGAGGCTATA GTTTGCTATA8243AGCTTGGAAT GGTTTGGAAC ACTGGTTTCA CTCACCTACC CAGCAGTTAT GTGTGGGGAA8303GCCTTACCGA TGCTAAAGGA TCCATGTTAC AATAATGGCA TTATTTGGAA ATCCCAGTGG8363TATTCCATGA ATAAAACCAC TATGAAGATA ATCCCACTCA ACAGACTCTC CGTTGGAGAA8423GGACAGCAAC ACCACCCTGG GAAAGCCAAA CAGTCAGACC AGACCTGTTT AGCATCAGTA8483GGACTTCCCT ACCATATCTG CTGGGTAGAT GAGTGAAACC AGTGTTCCAA ACCACTCCGG8543GCTTGTAGCA AACCATAGTC TCCTCATCTA CCAAGATGAG CAACCTTACC TCCTGATGTC8603CTAGCCAATC ACCAACTAGG AAACTTTGCA CAGTTTATTT AAAGTAACAG TTTGATTTTC8663ACAATATTTT TAAATTGGAG AAACATAACT TATCTTTGCA CTCACAAACC ACATAATGAG8723AAGAAACTCT AAGGGAAAAT GCTTGATCTG TGTGACCCGG GGCGCCATGC CAGAGCTGTA8783GTTCATGCCA GTGTTGTGCT CTGACAAGCC TTTTACAGAA TTACATGAGA TCTGCTTCCC8843TAGGACAAGG AGAAGGCAAA TCAACAGAGG CTGCACTTTA AAATGGAGAC ATAAAATAAC8903ATGCCAGAAC CATTTCCTAA AGCTCCTCAA TCAACCAACA AAATTGTGCT TTCAAATAAC8963CTGAGTTGAC CTCATCAGGA ATTTTGTGGC TCCTTCTCTT CTAACCTGCC TGAAGAAAGA9023TGGTCCACAG CAGCTGAGTC CGGGATGGAT AAGCTTAGGG ACAGAGGCCA ATTAGGGAAC9083TTTGGGTTTC TAGCCCTACT AGTAGTGAAT AAATTTAAAG TGTGGATGTG ACTATGAGTC9143ACAGCACAGA TGTTGTTTAA TAATATGTTT ATTTTATAAA TTGATATTTT AGGAATCTTT9203GGAGATATTT TCAGTTAGCA GATAATACTA TAAATTTTAT GTAACTGGCA ATGCACTTCG9263TAATAGACAG CTCTTCATAG ACTTGCAGAG GTAAAAAGAT TCCAGAATAA TGATATGTAC9323ATCTACGACT TGTTTTAG GT GGC ACT TAC TCA AAA GCA TCT ACT CCT AAT 9373Gly Gly Thr Tyr Ser Lys Ala Ser Thr Pro Asn380 385GGT TAT GAT AAT GGC ATT ATT TGG GCC ACT TGG AAA ACC CGG TGG TAT 9421Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr Arg Trp Tyr390 395 400TCC ATG AAG AAA ACC ACT ATG AAG ATA ATC CCA TTC AAC AGA CTC ACA 9469Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn Arg Leu Thr405 410 415ATT GGA GAA GGA CAG CAA CAC CAC CTG GGG GGA GCC AAA CAG GTC AGA 9517Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys Gln Val Arg420 425 430 435CCA GAG CAC CCT GCG GAA ACA GAA TAT GAC TCA CTT TAC CCT GAG GAT 9565Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr Pro Glu Asp440 445 450GAT TTG TAGAAAATTA ACTGCTAACT TCTATTGACC CACAAAGTTT CAGAAATTCT 9621Asp LeuCTGAAAGTTT CTTCCTTTTT TCTCTTACTA TATTTATTGA TTTCAAGTCT TCTATTAAGG9681ACATTTAGCC TTCAATGGAA ATTAAAACTC ATTTAGGACT GTATTTCCAA ATTACTGATA9741TCAGAGTTAT TTAAAAATTG TTTATTTGAG GAGATAACAT TTCAACTTTG TTCCTAAATA9801TATAATAATA AAATGATTGA CTTTATTTGC ATTTTTATGA CCACTTGTCA TTTATTTTGT9861CTTCGTAAAT TATTTTCATT ATATCAAATA TTTTAGTATG TACTTAATAA AATAGGAGAA9921CATTTTAGAG TTTCAAATTC CCAGGTATTT TCCTTGTTTA TTACCCCTAA ATCATTCCTA9981TTTAATTCTT CTTTTTAAAT GGAGAAAATT ATGTCTTTTT AATATGGTTT TTGTTTTGTT 10041ATATATTCAC AGGCTGGAGA CGTTTAAAAG ACCGTTTCAA AAGAGATTTA CTTTTTTAAA 10101GGACTTTATC TGAACAGAGA GATATAATAT TTTTCCTATT GGACAATGGA CTTGCAAAGC 10161TTCACTTCAT TTTAAGAGCA AAAGACCCCA TGTTGAAAAC TCCATAACAG TTTTATGCTG 10221ATGATAATTT ATCTACATGC ATTTCAATAA ACCTTTTGTT TCCTAAGACT AGATACATGG 10281TACCTTTATT GACCATTAAA AAACCACCAC TTTTTGCCAA TTTACCAATT ACAATTGGGC 10341AACCATCAGT AGTAATTGAG TCCTCATTTT ATGCTAAATG TTATGCCTAA CTCTTTGGGA 10401GTTACAAAGG AAATAGCAAT TATGGCTTTT GCCCTCTAGG AGATACAGGA CAAATACAGG 10461AAAATACAGC AACCCAAACT GACAATACTC TATACAAGAA CATAATCACT AAGCAGGAGT 10521CACAGCCACA CAACCAAGAT GCATAGTATC CAAAGTGCAG CTG 10564(2)SEQ ID NO6的信息(i)序列特征(A)長(zhǎng)度453個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO6Met Ser Trp Ser Leu His Pro Arg Asn Leu Ile Leu Tyr Phe Tyr Ala1 5 10 15Leu Leu Phe Leu Ser Ser Thr Cys Val Ala Tyr Val Ala Thr Arg Asp20 25 30Asn Cys Cys Ile Leu Asp Glu Arg Phe Gly Ser Tyr Cys Pro Thr Thr35 40 45Cys Gly Ile Ala Asp Phe Leu Ser Thr Tyr Gln Thr Lys Val Asp Lys50 55 60Asp Leu Gln Ser Leu Glu Asp Ile Leu His Gln Val Glu Asn Lys Thr65 70 75 80Ser Glu Val Lys Gln Leu Ile Lys Ala Ile Gln Leu Thr Tyr Asn Pro85 90 95Asp Glu Ser Ser Lys Pro Asn Met Ile Asp Ala Ala Thr Leu Lys Ser100 105 110Arg Ile Met Leu Glu Glu Ile Met Lys Tyr Glu Ala Ser Ile Leu Thr115 120 125His Asp Ser Ser Ile Arg Tyr Leu Gln Glu Ile Tyr Asn Ser Asn Asn130 135 140Gln Lys Ile Val Asn Leu Lys Glu Lys Val Ala Gln Leu Glu Ala Gln145 150 155 160Cys Gln Glu Pro Cys Lys Asp Thr Val Gln Ile His Asp Ile Thr Gly165 170 175Lys Asp Cys Gln Asp Ile Ala Asn Lys Gly Ala Lys Gln Ser Gly Leu180 185 190Tyr Phe Ile Lys Pro Leu Lys Ala Asn Gln Gln Phe Leu Val Tyr Cys195 200 205Glu Ile Asp Gly Ser Gly Asn Gly Trp Thr Val Phe Gln Lys Arg Leu210 215 220Asp Gly Ser Val Asp Phe Lys Lys Asn Trp Ile Gln Tyr Lys Glu Gly225 230 235 240Phe Gly His Leu Ser Pro Thr Gly Thr Thr Glu Phe Trp Leu Gly Asn245 250 255Glu Lys Ile His Leu Ile Ser Thr Gln Ser Ala Ile Pro Tyr Ala Leu260 265 270Arg Val Glu Leu Glu Asp Trp Asn Gly Arg Thr Ser Thr Ala Asp Tyr275 280 285Ala Met Phe Lys Val Gly Pro Glu Ala Asp Lys Tyr Arg Leu Thr Tyr290 295 300Ala Tyr Phe Ala Gly Gly Asp Ala Gly Asp Ala Phe Asp Gly Phe Asp305 310 315 320Phe Gly Asp Asp Pro Ser Asp Lys Phe Phe Thr Ser His Asn Gly Met325 330 335Gln Phe Ser Thr Trp Asp Asn Asp Asn Asp Lys Phe Glu Gly Asn Cys340 345 350Ala Glu Gln Asp Gly Ser Gly Trp Trp Met Asn Lys Cys His Ala Gly355 360 365His Leu Asn Gly Val Tyr Tyr Gln Gly Gly Thr Tyr Ser Lys Ala Ser370 375 380Thr Pro Asn Gly Tyr Asp Asn Gly Ile Ile Trp Ala Thr Trp Lys Thr385 390 395 400Arg Trp Tyr Ser Met Lys Lys Thr Thr Met Lys Ile Ile Pro Phe Asn405 410 415Arg Leu Thr Ile Gly Glu Gly Gln Gln His His Leu Gly Gly Ala Lys420 425 430Gln Val Arg Pro Glu His Pro Ala Glu Thr Glu Tyr Asp Ser Leu Tyr435 440 445Pro Glu Asp Asp Leu450(2)SEQ ID NO7的信息(i)序列特征(A)長(zhǎng)度10807bp(B)類型核酸(C)鏈性雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆卵β-乳球蛋白(xi)序列描述SEQ ID NO7ACGCGTGTCG ACCTGCAGGT CAACGGATCT CTGTGTCTGT TTTCATGTTA GTACCACACT 60GTTTTGGTGG CTGTAGCTTT CAGCTACAGT CTGAAGTCAT AAAGCCTGGT ACCTCCAGCT 120CTGTTCTCTC TCAAGATTGT GTTCTGCTGT TTGGGTCTTT AGTGTCTCCA CACAATTTTT 180AGAATTGTTT GTTCTAGTTC TGTGAAAAAT GATGCTGGTA TTTTGATAAG GATTGCATTG 240AATCTGTAAA GCTACAGATA TAGTCATTGG GTAGTACAGT CACTTTAACA ATATTAACTC 300TTCACATCTG TGAGCATGAT ATATTTTCCC CCTCTATATC ATCTTCAATT CCTCCTATCA 360GTTTCTTTCA TTGCAGTTTT CTGAGTACAG GTCTTACACC TCCTTGGTTA GAGTCATTCC 420TCAGTATTTT ATTCCTTTGA TACAATTGTG AATGAGGTAA TTTTCTTAGT TTCTCTTTCT 480GATAGCTCAT TGTTAGTGTA TATATAGAAA AGCAACAGAT TTCTATGTAT TAATTTTGTA 540TCCTGCAACA GATTTCTATG TATTAATTTT GTATCCTGCT ACTTTACGGA ATTCACTTAT 600TAGCTTTTTG GTGACATCTT GAGGATTTTC TGAAGAAAAT GGCATGGTAT GGTAGGACAA 660GGTGTCATGT CATCTGCAAA CAGTGGCAGT TTTCCTTCTT CCCTTCCAAC CTGGATTTCT 720TTGATTTCTT TCTGTCTGAG TACGACTAGG ATTCCCAATA CTATACCGAA TAAAAGTGGC 780AAGAGTGGAC ATCCTTGTCT TATTTTTCTG ACCTTAGAGG AAATGCTTTC AGTTTTTCAC 840CATTAATTAT AATGTTTACT GTGGGCTTGT CATATGTGGC CTTCATTATA TGGAGGTCTA 900TTCCCTCTAT ACCCACCTTG TTGAGAGTTT TTATCATAAA AGTATGTTGA ATTTTGTCAA 960AAGTTTTTCC TGCATCTATT GAGATGATTT TTACTCTTCA ATTCATTAAT GATTTTTATT 1020CTTCATTTTG TTAATGATTT CCATTCTTCA ATTTGTTAAC GTGGTATATC ACATTGATTG 1080ATTTGTGGAT ACCTTTGTAT CCCTGGGATA AACCTCACTT GATCATGAGC TTTCAATGTA 1140TTTTTGAATT CACTTTGCTA ATATTCTGTT GGGTATTTTT GCATCTCTAT TCATCAATGA 1200TATTGGCCTA AGAAAGGTTT TGTCTGGTTT TAGTATCAGG GTGATGCTGG CCTCATAGAG 1260AGAGTTTAGA AGCATTTCCT CCTCTTTGAT TTTTCGGAAT AGTTTGAGTA GGATAGGTAT 1320TAACTCTTCT TTAAATGTTT GGGGACTTCC CTGGTGAGCC GGTGGTTGAG AATCCGCCTC 1380AGGGATGTGG GTTTGATCCC TGGTCAGGGA ACCATTAATA AGATCCCACA TGCTGCAGGC 1440AACAAGCCCC CAAGCTGCAA CCACTGAGCT GCAACCGCTG CAGTGCCCAC AGGCCACGAC 1500CAGAGAAAGC CCACATACAG CAGGGAAGAC CCAGCACAAC CGGAAAAAGG AGTTTGGTGG 1560AATACAGCTG TGAAGCCGTC TGGTCCTGGA CTCCTGCTTG AGGGAATTTT TTAAAAATTA 1620TTGATTCAAT TTCATTACTG GTAACTGGTC TGTTCATATT TTCTATTTCT TCCGGGTTCA 1680GTCTTGGGAG ATTGTACATG CCTAGGAATG TGTCCGTTTC TTCTAGGTTG TCCATTTTAT 1740TGGACATGCA TGGGAGCACA CAGCACCGAC CAGCGAGACT CATGCTGGCT TCCTGGGGCC1800AGGCTGGGGC CCCAAGCAGC ATGGCATCCT AGAGTGTGTG AAAGCCCACT GACCCTGCCC1860AGCCCCACAA TTTCATTCTG AGAAGTGATT CCTTGCTTCT GCACTTACAG GCCCAGGATC1920TGACCTGCTT CTGAGGAGCA GGGGTTTTGG CAGGACGGGG AGATGCTGAG AGCCGACGGG1980GGTCCAGGTC CCCTCCCAGG CCCCCCTGTC TGGGGCAGCC CTTGGGAAAG ATTGCCCCAG2040TCTCCCTCCT ACAGTGGTCA GTCCCAGCTG CCCCAGGCCA GAGCTGCTTT ATTTCCGTCT2100CTCTCTCTGG ATGGTATTCT CTGGAAGCTG AAGGTTCCTG AAGTTATGAA TAGCTTTGCC2160CTGAAGGGCA TGGTTTGTGG TCACGGTTCA CAGGAACTTG GGAGACCCTG CAGCTCAGAC2220GTCCCGAGAT TGGTGGCACC CAGATTTCCT AAGCTCGCTG GGGAACAGGG CGCTTGTTTC2280TCCCTGGCTG ACCTCCCTCC TCCCTGCATC ACCCAGTTCT GAAAGCAGAG CGGTGCTGGG2340GTCACAGCCT CTCGCATCTA ACGCCGGTGT CCAAACCACC CGTGCTGGTG TTCGGGGGGC2400TACCTATGGG GAAGGGCTTC TCACTGCAGT GGTGCCCCCC GTCCCCTCTG AGATCAGAAG2460TCCCAGTCCG GACGTCAAAC AGGCCGAGCT CCCTCCAGAG GCTCCAGGGA GGGATCCTTG2520CCCCCCCGCT GCTGCCTCCA GCTCCTGGTG CCGCACCCTT GAGCCTGATC TTGTAGACGC2580CTCAGTCTAG TCTCTGCCTC CGTGTTCACA CGCCTTCTCC CCATGTCCCC TCCGTGTCCC2640CGTTTTCTCT CACAAGGACA CCGGACATTA GATTAGCCCC TGTTCCAGCC TCACCTGAAC2700AGCTCACATC TGTAAAGACC TAGATTCCAA ACAAGATTCC AACCTGAAGT TCCCGGTGGA2760TGTGAGTTCT GGGGCGACAT CCTTCAACCC CATCACAGCT TGCAGTTCAT CGCAAAACAT2820GGAACCTGGG GTTTATCGTA AAACCCAGGT TCTTCATGAA ACACTGAGCT TCGAGGCTTG2880TTGCAAGAAT TAAAGGTGCT AATACAGATC AGGGCAAGGA CTGAAGCTGG CTAAGCCTCC2940TCTTTCCATC ACAGGAAAGG GGGGCCTGGG GGCGGCTGGA GGTCTGCTCC CGTGAGTGAG3000CTCTTTCCTG CTACAGTCAC CAACAGTCTC TCTGGGAAGG AAACCAGAGG CCAGAGAGCA3060AGCCGGAGCT AGTTTAGGAG ACCCCTGAAC CTCCACCCAA GATGCTGACC AGCCAGCGGG3120CCCCCTGGAA AGACCCTACA GTTCAGGGGG GAAGAGGGGC TGACCCGCCA GGTCCCTGCT3180ATCAGGAGAC ATCCCCGCTA TCAGGAGATT CCCCCACCTT GCTCCCGTTC CCCTATCCCA3240ATACGCCCAC CCCACCCCTG TGATGAGCAG TTTAGTCACT TAGAATGTCA ACTGAAGGCT3300TTTGCATCCC CTTTGCCAGA GGCACAAGGC ACCCACAGCC TGCTGGGTAC CGACGCCCAT3360GTGGATTCAG CCAGGAGGCC TGTCCTGCAC CCTCCCTGCT CGGGCCCCCT CTGTGCTCAG3420CAACACACCC AGCACCAGCA TTCCCGCTGC TCCTGAGGTC TGCAGGCAGC TCGCTGTAGC3480CTGAGCGGTG TGGAGGGAAG TGTCCTGGGA GATTTAAAAT GTGAGAGGCG GGAGGTGGGA3540GGTTGGGCCC TGTGGGCCTG CCCATCCCAC GTGCCTGCAT TAGCCCCAGT GCTGCTCAGC3600CGTGCCCCCG CCGCAGGGGT CAGGTCACTT TCCCGTCCTG GGGTTATTAT GACTCTTGTC3660ATTGCCATTG CCATTTTTGC TACCCTAACT GGGCAGCAGG TGCTTGCAGA GCCCTCGATA3720CCGACCAGGT CCTCCCTCGG AGCTCGACCT GAACCCCATG TCACCCTTGC CCCAGCCTGC3780AGAGGGTGGG TGACTGCAGA GATCCCTTCA CCCAAGGCCA CGGTCACATG GTTTGGAGGA3840GCTGGTGCCC AAGGCAGAGG CCACCCTCCA GGACACACCT GTCCCCAGTG CTGGCTCTGA3900CCTGTCCTTG TCTAAGAGGC TGACCCCGGA AGTGTTCCTG GCACTGGCAG CCAGCCTGGA3960CCCAGAGTCC AGACACCCAC CTGTGCCCCC GCTTCTGGGG TCTACCAGGA ACCGTCTAGG4020CCCAGAGGGG ACTTCCTGCT TGGCCTTGGA TGGAAGAAGG CCTCCTATTG TCCTCGTAGA4080GGAAGCCACC CCGGGGCCTG AGGATGAGCC AAGTGGGATT CCGGGAACCG CGTGGCTGGG4140GGCCCAGCCC GGGCTGGCTG GCCTGCATGC CTCCTGTATA AGGCCCCAAG CCTGCTGTCT4200CAGCCCTCCA CTCCCTGCAG AGCTCAGAAG CACGACCCCA GGGATATCCC TGCAGCCATG4260AAGTGCCTCC TGCTTGCCCT GGGCCTGGCC CTCGCCTGTG GCGTCCAGGC CATCATCGTC4320ACCCAGACCA TGAAAGGCCT GGACATCCAG AAGGTTCGAG GGTTGGCCGG GTGGGTGAGT4380TGCAGGGCGG GCAGGGGAGC TGGGCCTCAG AGAGCCAAGA GAGGCTGTGA CGTTGGGTTC4440CCATCAGTCA GCTAGGGCCA CCTGACAAAT CCCCGCTGGG GCAGCTTCAA CCAGGCGTTC4500ACTGTCTTGC ATTCTGGAGG CTGGAAGCCC AAGATCCAGG TGTTGGCAGG GCTGGCTTCT4560CCTGCGGCCG CTCTCTGGGG AGCAGACGGC CGTCTTCTCC AGTCCTCTGC GCGCCCTGAT4620TTCCTCTTCC TGTGAGGCCA CCAGGCCTGC TGGAAACACG CCTGCCTGCG CAGCTTCACA4680CGACCTTTGT CATCTCTTTA AAGGCCATGT CTCCAGAGTC ATGTGTTGAA GTTCTGGGGG4740TTAGTGGGAC ACAGTTCAGC CCCTAAAAGA GTCTCTCTGC CCCTCAAATT TTCCCCACCT4800CCAGCCATGT CTCCCCAAGA TCCAAATGTT GCTACATGTG GGGGGGCTCA TCTGGGTCCC4860TCTTTGGGTT CAGTGTGAGT CTGGGGAGAG CATTCCCCAG GGTGCAGAGT TGGGGGGAGT4920ATCTCAGGGC TGCCCAGGCC GGGGTGGGAC AGAGAGCCCA CTGTGGGGCT GGGGGCCCCT4980TCCCACCCCC AGAGTGCAAC TCAAGGTCCC TCTCCAGGTG GCGGGGACTT GGCACTCCTT5040GGCTATGGCG GCCAGCGACA TCTCCCTGCT GGATGCCCAG AGTGCCCCCC TGAGAGTGTA5100CGTGGAGGAG CTGAAGCCCA CCCCCGAGGG CAACCTGGAG ATCCTGCTGC AGAAATGGTG5160GGCGTCTCTC CCCAACATGG AACCCCCACT CCCCAGGGCT GTGGACCCCC CGGGGGGTGG5220GGTGCAGGAG GGACCAGGGC CCCAGGGCTG GGGAAGAGGG CTCAGAGTTT ACTGGTACCC5280GGCGCTCCAC CCAAGGCTGC CCACCCAGGG CTTTTTTTTT TTTTAAACTT TTATTAATTT5340GATGCTTCAG AACATCATCA AACAAATGAA CATAAAACAT TCATTTTTGT TTACTTGGAA5400GGGGAGATAA AATCCTCTGA AGTGGAAATG CATAGCAAAG ATACATACAA TGAGGCAGGT5460ATTCTGAATT CCCTGTTAGT CTGAGGATTA CAAGTGTATT TGAGCAACAG AGAGACATTT5520TCATCATTTC TAGTCTGAAC ACCTCAGTAT CTAAAATGAA CAAGAAGTCC TGGAAACGAA5580GCAGTGTGGG GATAGGCCCG TGTGAAGGCT GCTGGGAGGC AGCAGACCTG GGTCTTCGGG5640CTCAAGCAGT TCCCGCTACC AGCCCTGTCC ACCTCAGACG GGGGTCAGGG TGCAGGAGAG5700AGCTGGATGG GTGTGGGGGC AGAGATGGGG ACCTGAACCC CAGGGCTGCC TTTTGGGGGT5760GCCTGTGGTC AAGGCTCTCC CTGACCTTTT CTCTCTGGCT TCATCTGACT TCTCCTGGCC5820CATCCACCCG GTCCCCTGTG GCCTGAGGTG ACAGTGAGTG CGCCGAGGCT AGTTGGCCAG5880CTGGCTCCTA TGCCCATGCC ACCCCCCTCC AGCCCTCCTG GGCCAGCTTC TGCCCCTGGC5940CCTCAGTTCA TCCTGATGAA AATGGTCCAT GCCAATGGCT CAGAAAGCAG CTGTCTTTCA6000GGGAGAACGG CGAGTGTGCT CAGAAGAAGA TTATTGCAGA AAAAACCAAG ATCCCTGCGG6060TGTTCAAGAT CGATGGTGAG TCCGGGTCCC TGGGGGACAC CCACCACCCC CGCCCCCGGG6120GACTGTGGAC AGGTTCAGGG GGCTGGCGTC GGGCCCTGGG ATGCTAAGGG ACTGGTGGTG6180ATGAAGACAC TGCCTTGACA CCTGCTTCAC TTGCCTCCCC TGCCACCTGC CCGGGGCCTT6240GGGGCGGTGG CCATGGGCAG GTCCCGGCTG GCGGGCTAAC CCACCAGGGT GACACCCGAG6300CTCTCTTTGC TGGGGGGCGG GCGGTGCTCT GGGCCCTCAG GCTGAGCTCA GGAGGTACCT6360GTGCCCTCCC AGGGGTAACC GAGAGCCGTT GCCCACTCCA GGGGCCCAGG TGCCCCACGA6420CCCCAGCCCG CTCCACAGCT CCTTCATCTC CTGGAGACAA ACTCTGTCCG CCCTCGCTCA6480TTCACTTGTT CGTCCTAAAT CCGAGATGAT AAAGCTTCGA GGGGGGGTTG GGGTTCCATC6540AGGGCTGCCC TTCCGCCGGG CAGCCTGGGC CACATCTGCC CTTGGCCCCC TCAGGACTCA6600CTCTGACTGG AGGCCCTGCA CTGACTGACG CCAGGGTGCC CAGCCCAGGG TCTCTGGCGC6660CATCCAGCTG CACTGGGTTT GGGTGCTGGT CCTGCCCCCA AGCTGCCCGG ACACCACAGG6720CAGCCGGGGC TGCCCACTGG CCTCGGTCAG GGTGAGCCCC AGCTGCCCCC GCTCAGGGCT6780TGCCCCGACA ATGACCCCAT CCTCAGGACG CACCCCCCTT CCCTTGCTGG GCAGTGTCCA6840GCCCCACCCG AGATCGGGGG AAGCCCTATT TCTTGACAAC TCCAGTCCCT GGGGGAGGGG6900GCCTCAGACT GAGTGGTGAG TGTTCCCAAG TCCAGGAGGT GGTGGAGGGT CCTGGCGGAT6960CCAGAGTTGA CAGTGAGGGC TTCCTGGGCC CCATGCGCCT GGCAGTGGCA GCAGGGAAGA7020GGAAGCACCA TTTCAGGGGT GGGGGATGCC AGAGGCGCTC CCCACCCCGT CTTCGCCGGG7080TGGTGACCCC GGGGGAGCCC CGCTGGTCGT GGAGGGTGCT GGGGGCTGAC TAGCAACCCC7140TCCCCCCCCG TTGGAACTCA CTTTTCTCCC GTCTTGACCG CGTCCAGCCT TGAATGAGAA7200CAAAGTCCTT GTGCTGGACA CCGACTACAA AAAGTACCTG CTCTTCTGCA TGGAAAACAG7260TGCTGAGCCC GAGCAAAGCC TGGCCTGCCA GTGCCTGGGT GGGTGCCAAC CCTGGCTGCC7320CAGGGAGACC AGCTGCGTGG TCCTTGCTGC AACAGGGGGT GGGGGGTGGG AGCTTGATCC7380CCAGGAGGAG GAGGGGTGGG GGGTCCCTGA GTCCCGCCAG GAGAGAGTGG TCGCATACCG7440GGAGCCAGTC TGCTGTGGGC CTGTGGGTGG CTGGGGACGG GGGCCAGACA CACAGGCCGG7500GAGACGGGTG GGCTGCAGAA CTGTGACTGG TGTGACCGTC GCGATGGGGC CGGTGGTCAC7560TGAATCTAAC AGCCTTTGTT ACCGGGGAGT TTCAATTATT TCCCAAAATA AGAACTCAGG7620TACAAAGCCA TCTTTCAACT ATCACATCCT GAAAACAAAT GGCAGGTGAC ATTTTCTGTG7680CCGTAGCAGT CCCACTGGGC ATTTTCAGGG CCCCTGTGCC AGGGGGGCGC GGGCATCGGC7740GAGTGGAGGC TCCTGGCTGT GTCAGCCGGC CCAGGGGGAG GAAGGGACCC GGACAGCCAG7800AGGTGGGGGG CAGGCTTTCC CCCTGTGACC TGCAGACCCA CTGCACTGCC CTGGGAGGAA7860GGGAGGGGAA CTAGGCCAAG GGGGAAGGGC AGGTGCTCTG GAGGGCAAGG GCAGACCTGC7920AGACCACCCT GGGGAGCAGG GACTGACCCC CGTCCCTGCC CCATAGTCAG GACCCCGGAG7980GTGGACAACG AGGCCCTGGA GAAATTCGAC AAAGCCCTCA AGGCCCTGCC CATGCACATC8040CGGCTTGCCT TCAACCCGAC CCAGCTGGAG GGTGAGCACC CAGGCCCCGC CCTTCCCCAG8100GGCAGGAGCC ACCCGGCCCC GGGACGACCT CCTCCCATGG TGACCCCCAG CTCCCCAGGC8160CTCCCAGGAG GAAGGGGTGG GGTGCAGCAC CCCGTGGGGG CCCCCTCCCC ACCCCCTGCC8220AGGCCTCTCT TCCCGAGGTG TCCAGTCCCA TCCTGACCCC CCCATGACTC TCCCTCCCCC8280ACAGGGCAGT GCCACGTCTA GGTGAGCCCC TGCCGGTGCC TCTGGGGTAA GCTGCCTGCC8340CTGCCCCACG TCCTGGGCAC ACACATGGGG TAGGGGGTCT TGGTGGGGCC TGGGACCCCA8400CATCAGGCCC TGGGGTCCCC CCTGTGAGAA TGGCTGGAAG CTGGGGTCCC TCCTGGCGAC8460TGCAGAGCTG GCTGGCCGCG TGCCACTCTT GTGGGTGACC TGTGTCCTGG CCTCACACAC8520TGACCTCCTC CAGCTCCTTC CAGCAGAGCT AAGGCTAAGT GAGCCAGAAT GGTACCTAAG8580GGGAGGCTAG CGGTCCTTCT CCCGAGGAGG GGCTGTCCTG GAACCACCAG CCATGGAGAG8640GCTGGCAAGG GTCTGGCAGG TGCCCCAGGA ATCACAGGGG GGCCCCATGT CCATTTCAGG8700GCCCGGGAGC CTTGGACTCC TCTGGGGACA GACGACGTCA CCACCGCCCC CCCCCCATCA8760GGGGGACTAG AAGGGACCAG GACTGCAGTC ACCCTTCCTG GGACCCAGGC CCCTCCAGGC8820CCCTCCTGGG GCTCCTGCTC TGGGCAGCTT CTCCTTCACC AATAAAGGCA TAAACCTGTG8880CTCTCCCTTC TGAGTCTTTG CTGGACGACG GGCAGGGGGT GGAGAAGTGG TGGGGAGGGA8940GTCTGGCTCA GAGGATGACA GCGGGGCTGG GATCCAGGGC GTCTGCATCA CAGTCTTGTG9000ACAACTGGGG GCCCACACAC ATCACTGCGG CTCTTTGAAA CTTTCAGGAA CCAGGGAGGG9060ACTCGGCAGA GACATCTGCC AGTTCACTTG GAGTGTTCAG TCAACACCCA AACTCGACAA9120AGGACAGAAA GTGGAAAATG GCTGTCTCTT AGTCTAATAA ATATTGATAT GAAACTCAAG9180TTGCTCATGG ATCAATATGC CTTTATGATC CAGCCAGCCA CTACTGTCGT ATCAACTCAT9240GTACCCAAAC GCACTGATCT GTCTGGCTAA TGATGAGAGA TTCCCAGTAG AGAGCTGGCA9300AGAGGTCACA GTGAGAACTG TCTGCACACA CAGCAGAGTC CACCAGTCAT CCTAAGGAGA9360TCAGTCCTGG TGTTCATTGG AGGACTGATG TTGAAGCTGA AACTCCAATG CTTTGGCCAC9420CTGATGTGAA GAGCTGACTC ATTTGAAAAG ACCCTGATGC TGGGAAAGAT TGAGGGCAGG9480AGGAGAAGGG GACGACAGAG GATGAGATGG TTGGATGGCA TCACCAACAC AATGGACATG9540GGTTTGGGTG GACTCCAGGA GTTGGTGATG GACAGGGAGG CCTGGCGTGC TACGGAAGCG9600GTTTATGGGG TCACAAAGAC TGAGTGACTG AACTGAGCTG AACTGAATGG AAATGAGGTA9660TACAGCAAAG TGGGGATTTT TTAGATAATA AGAATATACA CATAACATAG TGTATACTCA9720TATTTTTATG CATACCTGAA TGCTCAGTCA CTCAGTCGTA TCTGACTCTG TGACCTATGG9780ACCGTAGCCT TCCAGGTTTC TTCTGTCCAC AGAATTCTCC AAGGCAAGAA TACTGGAGTG9840GGTAGCCATT TCCTCCTCCA GGGGATCCTC CCGACCCAGG GATTGAACCG GCATCTCCTG9900TATTGGCAGG TGGATTCTTT ACCACTGTGC CACCAGGGAA GCCCGTGTTA CTCTCTATGT9960CCCACTTAAT TACCAAAGCT GCTCCAAGAA AAAGCCCCTG TGCCCTCTGA GCTTCCCGGC 10020CTGCAGAGGG TGGTGGGGGT AGACTGTGAC CTCGGAACAC CCTCCCGCTT CAGGACTCCC 10080GGGCCACGTG ACCCACAGTC CTGCAGACAG CCGGGTAGCT CTGCTCTTCA AGGCTCATTA 10140TCTTTAAAAA AAACTGAGGT CTATTTTGTG ACTTCGCTGC CGTAACTTCT GAACATCCAG 10200TGCGATGGAC AGGACCTCCT CCCCAGGCCT CAGGGGCTTC AGGGAGCCAG CCTTCACCTA 10260TGAGTCACCA GACACTCGGG GGTGGCCCCG CCTTCAGGGT GCTCACAGTC TTCCCATCGT 10320CCTGATCAAA GAGCAAGACC AATGACTTCT TAGGAGCAAG CAGACACCCA CAGGACACTG 10380AGGTTCACCA GAGCTGAGCT GTCCTTTTGA ACCTAAAGAC ACACAGCTCT CGAAGGTTTT 10440CTCTTTAATC TGGATTTAAG GCCTACTTGC CCCTCAAGAG GGAAGACAGT CCTGCATGTC 10500CCCAGGACAG CCACTCGGTG GCATCCGAGG CCACTTAGTA TTATCTGACC GCACCCTGGA 10560ATTAATCGGT CCAAACTGGA CAAAAACCTT GGTGGGAAGT TTCATCCCAG AGGCCTCAAC 10620CATCCTGCTT TGACCACCCT GCATCTTTTT TTCTTTTATG TGTATGCATG TATATATATA 10680TATATATTTT TTTTTTTTTC ATTTTTTGGC TGTGCTGGCT GTTCGTTGCA GTTCGGTGCG 10740CAGGCTTCTC TCTAGTTTCT CTCTAGTCTT CTCTTATCAC AGAGCAGTCT CTAGACGATC 10800GACGCGT10807(2)SEQ ID NO8的信息(i)序列特征(A)長(zhǎng)度47bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(xi)序列描述SEQ ID NO8AATTCCGATC GACGCGTCGA CGATATACTC TAGACGATCG ACGCGTA 47(2)SEQ ID NO9的信息(i)序列特征(A)長(zhǎng)度24bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆BLGAMP3(xi)序列描述SEQ ID NO9TGGATCCCCT GCCGGTGCCT CTGG24(2)SEQ ID NO10的信息(i)序列特征(A)長(zhǎng)度24bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆BLGAMP4(xi)序列描述SEQ ID NO10AACGCGTCAT CCTCTGTGAG CCAG24(2)SEQ ID NO11的信息(i)序列特征(A)長(zhǎng)度10bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6839(xi)序列描述SEQ ID NO11ACTACGTAGT10(2)SEQ ID NO12的信息(i)序列特征(A)長(zhǎng)度42bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6632(xi)序列描述SEQ ID NO12CGACGCGGATCCTACGTACCTGCAGCCATGTTTTCCATGA GG 42(2)SEQ ID NO13的信息(i)序列特征(A)長(zhǎng)度21bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6627(xi)序列描述SEQ ID NO13AGGGCTTCGG CAAGCTTCAG G21(2)SEQ ID NO14的信息(i)序列特征(A)長(zhǎng)度24bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6521(xi)序列描述SEQ ID NO14GCCAAAGACT TACTTCCCTC TAGA24(2)SEQ ID NO15的信息(i)序列特征(A)長(zhǎng)度30bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6520(xi)序列描述SEQ ID NO15GCATGAACGT CGCGTGGTGG TTGTGCTACC 30(2)SEQ ID NO16的信息(i)序列特征(A)長(zhǎng)度30bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6519(xi)序列描述SEQ ID NO16ACCACGCGAC GTTCATGCTC TAAAACCGTT 30(2)SEQ ID NO17的信息(i)序列特征(A)長(zhǎng)度36bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6518(xi)序列描述SEQ ID NO17GCTGCGGGAT CCTACGTACT AGGGGGACAG GGAAGG 36(2)SEQ ID NO18的信息(i)序列特征(A)長(zhǎng)度45bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6629(xi)序列描述SEQ ID NO18CGACGCGAAT TCTACGTACC TGCAGCCATG AAAAGGATGG TTTCT 45(2)SEQ ID NO19的信息(i)序列特征(A)長(zhǎng)度45bp
(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6630(xi)序列描述SEQ ID NO19CGACGCGAAT TCTACGTACC TGCAGCCATG AAACATCTAT TATTG 45(2)SEQ ID NO20的信息(i)序列特征(A)長(zhǎng)度21bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6625(xi)序列描述SEQ ID NO20GTGAGATTTT CAGATCTTGT C 21(2)SEQ ID NO21的信息(i)序列特征(A)長(zhǎng)度21bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6626(xi)序列描述SEQ ID NO21AAGAATTACT GTGGCCTACC A21(2)SEQ ID NO22的信息(i)序列特征(A)長(zhǎng)度33bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6624(xi)序列描述SEQ ID NO22GCTGCGGAAT TCTACGTACT ATTGCTGTGG GAA 33(2)SEQ ID NO23的信息(i)序列特征(A)長(zhǎng)度45bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6514(xi)序列描述SEQ ID NO23CGACGCGGAT CCTACGTACC TGCAGCCATG AGTTGGTCCT TGCAC 45(2)SEQ ID NO24的信息(i)序列特征(A)長(zhǎng)度21bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6517(xi)序列描述SEQ ID NO24GTCTCTGGTA GCAACATACT A 21(2)SEQ ID NO25的信息(i)序列特征(A)長(zhǎng)度22bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6516(xi)序列描述SEQ ID NO25GGGTTTCTAG CCCTACTAGT AG 22(2)SEQ ID NO26的信息(i)序列特征(A)長(zhǎng)度22bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(vii)來(lái)源(B)克隆ZC6515(xi)序列描述SEQ ID NO26GGGTTTCTAG CCCTACTAGT AG 22(2)SEQ ID NO27的信息(i)序列特征(A)長(zhǎng)度47bp(B)類型核酸(C)鏈性單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(xi)序列描述SEQ ID NO27AAGCTACGCG TCGATCGTCT AGAGTATATC GTCGACGCGT CGATCGG4權(quán)利要求
1.一種生產(chǎn)纖維蛋白原的方法，包括提供編碼與纖維蛋白原Aα鏈相連接的分泌信號(hào)的第一條DNA片段，編碼與纖維蛋白原Bβ鏈相連接的分泌信號(hào)的第二條DNA片段，和編碼與纖維蛋白原γ鏈相連接的分泌信號(hào)的第三條DNA片段，其中第一、第二、第三條片段中的每一條都與在雌性哺乳動(dòng)物宿主的乳腺中表達(dá)其所需要的附加的DNA片段相連接；將所說(shuō)的DNA片段導(dǎo)入一個(gè)非人類哺乳動(dòng)物物種的受精卵；將所說(shuō)的受精卵植入所說(shuō)的物種的雌性動(dòng)物的輸卵管或子宮內(nèi)，以獲得帶有所說(shuō)的DNA結(jié)構(gòu)的后代；繁殖所說(shuō)的后代以產(chǎn)生雌性后裔，來(lái)表達(dá)所說(shuō)的第一、第二、第三條DNA片段并生產(chǎn)出含有由這些片段編碼的生物感受態(tài)纖維蛋白原的乳汁；從所說(shuō)的雌性后裔中收集乳汁；從這些乳汁中回收纖維蛋白原。
2.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的物種選自由綿羊，豬，山羊和牛組成的一組。
3.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第一，第二和第三條DNA片段中的每一條包括一個(gè)內(nèi)含子。
4.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第一，第二和第三條DNA片段的摩爾比在0.5-1∶0.5-1∶0.5-1范圍之內(nèi)。
5.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第一，第二和第三條DNA片段中的每一條都連接有選自由酪蛋白，β-乳球蛋白，α-乳清蛋白以及乳清酸性蛋白基因啟動(dòng)子組成的一組中的一個(gè)轉(zhuǎn)錄啟動(dòng)子。
6.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第一，第二和第三條DNA片段在β-乳球蛋白啟動(dòng)子的控制之下表達(dá)。
7.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的導(dǎo)入步驟包括向所說(shuō)的受精卵的一個(gè)原核中注射所說(shuō)的第一，第二和第三條DNA片段。
8.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的纖維蛋白原是人類纖維蛋白原。
9.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第二條DNA片段包括如SEQ ID NO3所示的從470位-8100位核苷酸的核苷酸序列。
10.根據(jù)權(quán)利要求1的方法，其中所說(shuō)的第二條DNA片段包括如SEQ ID NO3的從512位-8100位核苷酸的核苷酸序列。
11.一種生產(chǎn)纖維蛋白原的方法，包括將編碼與纖維蛋白原Aα鏈相連的分泌信號(hào)的第一條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第一個(gè)融合基因；將編碼與纖維蛋白原Bβ鏈相連的分泌信號(hào)的第二條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第二個(gè)融合基因；將編碼與纖維蛋白原γ鏈相連的分泌信號(hào)的第三條DNA片段摻入β-乳球蛋白基因，生產(chǎn)出第三個(gè)融合基因；將所說(shuō)的第一、第二、第三個(gè)融合基因?qū)胍环侨祟惒溉閯?dòng)物的種系，使得所說(shuō)的DNA片段在該哺乳動(dòng)物或其雌性后裔的乳腺中表達(dá)，并且生物感受態(tài)纖維蛋白原分泌到該哺乳動(dòng)物或其雌性后裔的乳汁中；從所說(shuō)的哺乳動(dòng)物或其雌性后裔中獲得乳汁；從所說(shuō)的乳汁中回收所說(shuō)的纖維蛋白原。
12.根據(jù)權(quán)利要求11的方法，其中所說(shuō)的哺乳動(dòng)物是綿羊，豬，山羊或牛。
13.根據(jù)權(quán)利要求11的方法，其中所說(shuō)的第一，第二和第三個(gè)融合基因中的每一個(gè)包括一個(gè)內(nèi)含子。
14.根據(jù)權(quán)利要求11的方法，其中所說(shuō)的第一，第二和第三個(gè)融合基因的摩爾比在0.5-1∶0.5-1∶0.5-1范圍之內(nèi)。
15.根據(jù)權(quán)利要求11的方法，其中所說(shuō)的導(dǎo)入步驟包括向所說(shuō)的受精卵的一個(gè)原核中注射所說(shuō)的第一，第二和第三個(gè)融合基因，并將所說(shuō)的卵植入假孕的雌性動(dòng)物的輸卵管，以產(chǎn)生在其種系中帶有所說(shuō)的融合基因的雌性后代。
16.一種生產(chǎn)纖維蛋白原的方法，包括提供一種非人類的轉(zhuǎn)基因雌性哺乳動(dòng)物，在其種系中帶有編碼纖維蛋白原Aα，Bβ及γ鏈的異源DNA片段，其中所說(shuō)的DNA片段在所說(shuō)的哺乳動(dòng)物的乳腺中表達(dá)而所說(shuō)的DNA片段所編碼的纖維蛋白原分泌到所說(shuō)的哺乳動(dòng)物的乳汁中；從所說(shuō)的哺乳動(dòng)物中收集乳汁；從所說(shuō)的乳汁中回收所說(shuō)的纖維蛋白原。
17.根據(jù)權(quán)利要求16的方法，其中所說(shuō)的哺乳動(dòng)物是綿羊，豬，山羊或牛。
18.一種非人類哺乳動(dòng)物的胚胎，在其細(xì)胞核中含有編碼纖維蛋白原Aα，Bβ及γ鏈的異源DNA片段。
19.一種在其乳汁中生產(chǎn)可回收量的人類纖維蛋白原的轉(zhuǎn)基因非人類哺乳動(dòng)物。
20.一種生產(chǎn)哺乳動(dòng)物的轉(zhuǎn)基因后代的方法，包括提供編碼纖維蛋白原Aα鏈的第一條DNA片段，編碼纖維蛋白原Bβ鏈的第二條DNA片段，和編碼纖維蛋白原γ鏈的第三條DNA片段，其中第一、第二、第三條片段中的每一條都與在雌性哺乳動(dòng)物宿主的乳腺中表達(dá)其并分泌到所說(shuō)的宿主雌性哺乳動(dòng)物的乳汁中所需要的附加的DNA片段相連接；將所說(shuō)的DNA片段導(dǎo)入一個(gè)非人類哺乳動(dòng)物的受精卵；將所說(shuō)的受精卵植入所說(shuō)的非人類物種的雌性動(dòng)物的輸卵管或子宮內(nèi)，以獲得帶有所說(shuō)的第一、第二和第三條DNA片段的后代。
21.根據(jù)權(quán)利要求20的方法，其中所說(shuō)的后代是雌性的。
22.根據(jù)權(quán)利要求20的方法，其中所說(shuō)的后代是雄性的。
23.一種根據(jù)權(quán)利要求20的方法生產(chǎn)的非人類哺乳動(dòng)物。
24.根據(jù)權(quán)利要求23的非人類哺乳動(dòng)物，其中所說(shuō)的哺乳動(dòng)物是雌性的。
25.根據(jù)權(quán)利要求24的雌性哺乳動(dòng)物，其生產(chǎn)含有所說(shuō)的DNA片段所編碼的生物感受態(tài)纖維蛋白原的乳汁。
26.根據(jù)權(quán)利要求23的非人類哺乳動(dòng)物，其中所說(shuō)的哺乳動(dòng)物是雄性的。
27.一種在其種系中帶有編碼異源纖維蛋白原的Aα，Bβ及γ鏈的DNA片段的非人類哺乳動(dòng)物，其中所說(shuō)的哺乳動(dòng)物的雌性后裔在其乳腺中表達(dá)所說(shuō)的DNA片段并生產(chǎn)生物感受態(tài)纖維蛋白原。
28.根據(jù)權(quán)利要求27的哺乳動(dòng)物，其中所說(shuō)的哺乳動(dòng)物是雌性的。
29.根據(jù)權(quán)利要求27的哺乳動(dòng)物，其中所說(shuō)的哺乳動(dòng)物是雄性的。
全文摘要
本發(fā)明公開了在轉(zhuǎn)基因非人類哺乳動(dòng)物中生產(chǎn)纖維蛋白原的材料與方法。編碼纖維蛋白原Aα，Bβ和γ鏈的DNA片段導(dǎo)入非人類哺乳動(dòng)物的種系，該哺乳動(dòng)物及其雌性后裔生產(chǎn)含有導(dǎo)入的DNA所表達(dá)的纖維蛋白原的乳汁。還公開了帶有編碼異源纖維蛋白原多肽鏈的DNA片段的非人類哺乳動(dòng)物胚胎和轉(zhuǎn)基因非人類哺乳動(dòng)物。
文檔編號(hào)C12N15/09GK1144539SQ95191945
公開日1997年3月5日申請(qǐng)日期1995年3月1日優(yōu)先權(quán)日1994年3月3日
發(fā)明者伊恩·加納, 邁克爾·A·達(dá)爾林普爾, 唐娜·E·普倫克德, 唐納德·C·福斯特申請(qǐng)人:酶遺傳學(xué)公司, 藥物蛋白質(zhì)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：伊恩.加納;邁克爾.A.達(dá)爾林普爾;唐娜.E.普倫克德;唐納德.C.福斯特
技術(shù)所有人：酶遺傳學(xué)公司;藥物蛋白質(zhì)有限公司
我是此專利的發(fā)明人

上一篇：一種蛋白膠的制造方法
上一篇：用htra啟動(dòng)子在減毒細(xì)菌中表達(dá)異源蛋白的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.食品功能因子基因工程菌種的構(gòu)建、智能高通量進(jìn)化篩選 2.發(fā)酵工藝優(yōu)化
2、馬老師：1.酶工程與生物催化 2.釀造技術(shù)與風(fēng)味分析 3.生物質(zhì)資源綜合利用
3、林老師：1.釀造微生物育種及關(guān)鍵釀造工藝開發(fā) 2. 真菌基因功能及調(diào)控網(wǎng)絡(luò)解析 3.精細(xì)化學(xué)品、蛋白真菌細(xì)胞底盤開發(fā)
4、張老師：1.發(fā)酵食品安全：危害物相關(guān)基因的篩選，危害物產(chǎn)生菌的快速檢測(cè)，危害物的預(yù)警和發(fā)酵過(guò)程控制 2.真菌次級(jí)代謝與調(diào)控 3.釀造酒相關(guān)研究
5、郭老師：1.現(xiàn)代釀造技術(shù)與食品安全 2. 酵母生物學(xué) 3.生物基化學(xué)品與合成生物學(xué)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

纖維蛋白原相關(guān)技術(shù)

纖維蛋白原偏高相關(guān)技術(shù)

纖維蛋白原偏低相關(guān)技術(shù)

人纖維蛋白原相關(guān)技術(shù)

纖維蛋白原正常值相關(guān)技術(shù)

纖維蛋白原降解產(chǎn)物相關(guān)技術(shù)

血漿纖維蛋白原偏高相關(guān)技術(shù)

fib纖維蛋白原相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在轉(zhuǎn)基因動(dòng)物中生產(chǎn)纖維蛋白原的制作方法