專利名稱:Icam-4的材料和方法
技術(shù)領(lǐng)域:
概括地說,本發(fā)明涉及細胞粘附分子,更具體地說,涉及一種DNA的克隆和表達,該DNA編碼一個迄今未知的多肽,此多肽與細胞粘附分子ICAM-1、ICAM-2和ICAM-R具有結(jié)構(gòu)相關(guān)性,被定名為ICAM-4。
背景技術(shù):
最近十多年的研究已深刻地闡明了參與體內(nèi)細胞-細胞相互作用的一些分子過程,特別是與免疫系統(tǒng)中細胞的運動和激活有關(guān)的過程,近來,又闡明了與神經(jīng)系統(tǒng)中細胞的發(fā)育和正常生理功能有關(guān)的過程。一般地,可參閱Springer,自然,346425-434(1990),關(guān)于免疫系統(tǒng)的細胞,以及Yoshihara等,神經(jīng)科學(xué)研究,1083-105(1991)和Sonderegger和Rathjen,細胞生物學(xué)雜志,1191387-1394(1992),關(guān)于神經(jīng)系統(tǒng)的細胞。細胞表面蛋白質(zhì),以及特別是所謂的細胞粘附分子(“CAM”)都已經(jīng)是藥物學(xué)研究和開發(fā)的對象,作為其目標,它們參與白細胞外滲到炎癥部位和運動到遠隔的靶組織的過程,以及神經(jīng)細胞分化和復(fù)雜的神經(jīng)網(wǎng)絡(luò)的形成過程。對細胞粘附分子的分離和表征,編碼這種分子的DNA序列的克隆和表達,以及適合于炎癥過程及神經(jīng)系統(tǒng)發(fā)育和發(fā)揮功能的治療藥物和診斷試劑,這些也已經(jīng)是許多美國和國外申請的專利證書的主題。參閱Edwards,當(dāng)前治療學(xué)專利評論,(Current Opinion in Therapeutic Patents),1(11)1617-1630(1991),特別是其中引用的已發(fā)表的“專利文獻參考”。
對于本發(fā)明背景的主要興趣在于以前確定和表征的細胞粘附過程中的某些介質(zhì),‘白細胞整合蛋白’,LFA-1,MAC-1和gp150.95(據(jù)WHO的命名法原來被分別稱為CD18/CD11a,CD18/CD11b和CD18/CD11c)它們構(gòu)成存在B淋巴細胞,T淋巴細胞,單核細胞和粒細胞上的細胞表面蛋白雜二聚體“整合蛋白”的一個亞科。參閱例如Springer,同上p429的表1。其它一些涉及白細胞激活,粘附,活動性等等伴隨炎癥過程發(fā)生的事件的單鍵粘附分子(CAM)也是我們的興趣所在。例如,目前認為,在作為炎癥特征的白細胞外滲之前,在白細胞上組成性表達的聚合蛋白的激活過程就已經(jīng)發(fā)生了,并接著發(fā)生整合蛋白(例如LFA-1)與一個或兩個不同的細胞間粘附分子(ICAM)之間的緊密配體/受體相互作用,這兩個粘附分子是表達在血管內(nèi)皮細胞表面和其它白細胞上的,被稱為ICAM-1和ICAM-2。
象迄今已表征的其它CAM一樣[例如在1990年11月15日公開的PCT WO 90/13300中所述的血管粘附分子(VCAM-1),以及在Newman等,科學(xué),2471219-1222(1990)和1991年7月25日公開的PCT WO 91/10683中所述的血小板內(nèi)皮細胞粘附分子(PECAM-1)],ICAM-1和ICAM-2在結(jié)構(gòu)上與免疫球蛋白基因總科(Superfamily)的其它成員同源,其中每種分子的細胞外部分是由具有類似羧基末端基元的許多結(jié)構(gòu)域組成。“典型”的類免疫球蛋白結(jié)構(gòu)域含有一個環(huán)形結(jié)構(gòu),通常是由二個半胱氨酸之間的二硫鍵在每個環(huán)的末端錨定而成。ICAM-1包含5個類免疫球蛋白結(jié)構(gòu)域;ICAM-2由于細胞的分布狀態(tài)而不同于ICAM-1,包含有2個這樣的結(jié)構(gòu)域;PECAM-1包含6個;VCAM包含6個或7個,取決于拼接的變異,等等。此外,CAM典型地包含一個據(jù)信是參與分子在細胞表面定向的疏水“跨膜”區(qū),以及一個羧基末端“細胞質(zhì)”區(qū)。CAM動態(tài)分布的模型圖通常顯示,這種分子在跨膜區(qū)錨定在細胞膜中,其細胞質(zhì)“尾巴”伸入到細胞質(zhì)中,而一個或多個類免疫球蛋白環(huán)從細胞表面向外伸出。
許多神經(jīng)細胞表達帶有細胞外類免疫球蛋白結(jié)構(gòu)域的表面受體,該結(jié)構(gòu)域與ICAMs在結(jié)構(gòu)上有相似性。參閱例如,Yoshihara等,同上。除了類Ig結(jié)構(gòu)域之外,神經(jīng)系統(tǒng)的許多粘附分子在其細胞外結(jié)構(gòu)域還含有銜接重復(fù)的類纖維粘附蛋白序列。
已提出細胞間粘連分子的多種治療應(yīng)用,包括以ICAM-1結(jié)合人鼻病毒的能力為前提的用途。例如,1992年1月29日公開的歐洲專利申請486 257 A,涉及開發(fā)ICAM-1的多聚體(multimeric)構(gòu)型和形式(包括全長度分子形式的被截短的分子形式),它們被認為具有更高的配體/受體結(jié)合能力,特別是對病毒,對結(jié)合了抗原和病原如惡性瘧原蟲(plasmodium falciparum)的淋巴細胞的結(jié)合。
以類似的方式,已提出了與細胞間粘附分子免疫學(xué)相關(guān)的蛋白質(zhì)的多種應(yīng)用。例如,1991年11月14日公開的WO 91/16928,涉及人化嵌合體抗-ICAM-1抗體以及它們在治療特異性和非特異性炎癥,病毒感染和氣喘中的應(yīng)用。1992年3月19日公開的WO 92/04034中描述了抗ICAM-1抗體及其片段,在治療內(nèi)毒素休克中是有用的。1992年4月16日公開的WO 92/06119涉及用抗-ICAM-1抗個體型抗體和抗體片段抑制ICAM-1依賴性炎癥應(yīng)答。
盡管通過對細胞間粘附蛋白如ICAM-1和淋巴細胞相互作用整合蛋白如LFA-1的鑒別和表征,對細胞粘附現(xiàn)象的本質(zhì)已有所認識,但是對它的描述還遠未完成。一般認為,在炎癥過程和目標淋巴細胞在體內(nèi)運行的過程中,還涉及有多種其它的蛋白質(zhì)。例如,在以下專利中公開了對ICAM-相關(guān)蛋白質(zhì)ICAM-R的克隆和表達美國專利申請序列號07/827,689,07/889,724,07/894,061和08/009,266,以及相應(yīng)公開的PCT申請WO 93/14776(1993年8月5日公開)。這些專利申請的公開內(nèi)容在此特別引入作為參考,ICAM-R的DNA的氨基酸序列已在SEQ ID NO.4中列出。已發(fā)現(xiàn)這種新的配體可以在人淋巴細胞、單核細胞和粒細胞上表達。
本專利申請?zhí)貏e感興趣的還在于另一個類ICAM表面分子,它被確定為具有不同于任何已知ICAM分子的組織特異性表達。Mori等,[美國國家科學(xué)院院刊(USA)843921-3925(1987)]報導(dǎo)過對家兔腦中的一個端腦特異性抗原的確定,發(fā)現(xiàn)它特別與單克隆抗體271A6有免疫反應(yīng)活性。這個表面抗原被命名為端腦素(telencephalin)。Imamura等[神經(jīng)科學(xué)通訊,119118-121(1990)],同一個多克隆抗體測定其定位表達,證實端腦素在貓視覺皮層的表達表現(xiàn)出組織上的差異,還報導(dǎo)說,端腦素的表達是隨發(fā)育進程而可變的。Oka等,[神經(jīng)科學(xué)3593-103(1990)]隨后報導(dǎo),用單克隆抗體271A6分離出了端腦素。在出版物中報導(dǎo)了該表面分子的分子量大約是500kD,并且該分子是由4個亞單位組成,每個亞單位的天然分子量是130kD,經(jīng)N-聚糖酶處理后變成大約100kD。Yoshihiro等[神經(jīng)科學(xué),研究增刊,18,p.S83(1994)]在日本神經(jīng)科學(xué)協(xié)會的第十七屆年會上(1993,12月7-9日在日本Nagoya召開),以及1993年11月9日在華盛頓特區(qū)召開的神經(jīng)科學(xué)協(xié)會第二十三屆年會上[神經(jīng)科學(xué)協(xié)會摘要19(1-3)p.646(1993)],報導(dǎo)了家兔端腦素的cDNA和氨基酸序列。由報告中推導(dǎo)出的氨基酸序列表明,具有9個細胞外類免疫球蛋白(Ig)結(jié)構(gòu)域的130kD端腦素是一個完整的膜蛋白。其遠端的八個結(jié)構(gòu)域顯示出與其它ICAM的類Ig結(jié)構(gòu)域有同源性。Yoshihare等,在神經(jīng)元(neuron)12543-553(1994)中也報導(dǎo)了與此相同的結(jié)果。
因此,本領(lǐng)域需要繼續(xù)發(fā)現(xiàn)參與人細胞-細胞相互作用的另外一些蛋白質(zhì),并且特別需要提供用于根據(jù)其氨基酸序列對這些蛋白質(zhì)進行特異性確定和表征的信息。但是,為了使這些分子達到可以構(gòu)成開發(fā)治療和診斷藥劑基礎(chǔ)的程度,有必要對編碼它們的DNA進行闡明。尤其需要這樣一些基本的信息,它們能用于大批量生產(chǎn)蛋白質(zhì),用于對天然產(chǎn)生它們的細胞進行鑒別,以及用于制備抗體物質(zhì)或其它對其參與的配體/受體結(jié)合反應(yīng)具有特異性激活和/或抑制作用的新穎結(jié)合蛋白質(zhì)的信息。
發(fā)明簡述本發(fā)明一方面提供純化并分離的多聚核苷酸(例如DNA序列、RNA轉(zhuǎn)錄本及其反義寡聚核苷酸),它編碼新的多肽“ICAM-4”及其多肽變異體(包括片段缺失、替代和添加的類似物),該多肽及其變異體顯示一種或多種對ICAM-4有特異性的配體/受體結(jié)合生物學(xué)活性和/或免疫學(xué)特性。ICAM-4特異性配體/受體結(jié)合生物學(xué)活性包括ICAM-4的細胞外結(jié)構(gòu)域的細胞質(zhì)結(jié)構(gòu)域(例如在細胞-細胞的粘附和/或信號的轉(zhuǎn)遞過程中)與其它分子的相互作用。本發(fā)明的優(yōu)選DNA序列包括基因組序列和cDNA序列,以及完全或部分化學(xué)合成的DNA序列。目前優(yōu)選的多聚核苷酸如SEQ ID NO1所示,它編碼了大鼠ICAM-4。發(fā)明人試圖獲得本發(fā)明DNA序列的生物學(xué)復(fù)制物(即體內(nèi)或體外制得的分離的DNA序列的拷貝)。本發(fā)明還提供自主復(fù)制的重組構(gòu)建體,例如摻入了ICAM-4序列的質(zhì)粒載體和病毒DNA載體,特別是這樣一種載體,其中編碼ICAM-4或ICAM-4變異體的DNA是經(jīng)操作與內(nèi)源性或外源性表達控制DNA序列連接的。
根據(jù)本發(fā)明的另一方面,以能使目的多肽在其內(nèi)表達的方式,用本發(fā)明的DNA序列穩(wěn)定地轉(zhuǎn)化宿主細胞,特別是單細胞宿主細胞如原核細胞和真核細胞。表達這種ICAM-4和ICAM-4變異體產(chǎn)物的宿主細胞可用于各種有用的目的。就此表達的產(chǎn)物而言,它們是“展示”在宿主細胞的表面,所以這種細胞可能構(gòu)成有價值的免疫原,用于開發(fā)與ICAM-4和ICAM-4變異體進行特異性免疫反應(yīng)的抗體物質(zhì)。本發(fā)明的宿主細胞在用于大批量生產(chǎn)ICAM-4和ICAM-4變異體的方法中特別有用,其中所述細胞生長在適合的培養(yǎng)基中,目的多肽產(chǎn)物可從細胞中或者從細胞生長于其中的培養(yǎng)基中分離出來。
本發(fā)明的新的ICAM-4雖然可以作為分離物從天然細胞得到,但是,同ICAM-4變異體產(chǎn)物一道,優(yōu)選地是通過包括本發(fā)明宿主細胞的重組體技術(shù)制備。在SEQ ID NO2中列出了ICAM-4多肽的目前優(yōu)選的氨基酸序列。取決于被選擇作為生產(chǎn)重組體的宿主細胞和/或分離后加工過程不同,產(chǎn)物可能以完全或部分地糖基化形式,部分或完全的去糖基化形式或者非糖基化的形式得到。本發(fā)明的ICAM-4變異體可能包括水溶性或水不溶性單體、多聚體或環(huán)狀I(lǐng)CAM-4片段,它們包含有上述列舉的一個或多個結(jié)構(gòu)域的全部或一部分,并具有ICAM-4的生物學(xué)或免疫學(xué)特性,包括例如,對ICAM-4的結(jié)合配偶體結(jié)合的能力如/或抑制ICAM-4與天然結(jié)合配偶體結(jié)合的能力。本發(fā)明的ICAM-4變異體還可以包括多肽類似物,其中的一個或多個特定的氨基酸被刪去或被替代了(1)對特異于ICAM-4的一種或多種生物學(xué)活性或免疫學(xué)特性沒有損失,并優(yōu)選地增強,(2)特異性地喪失了特殊的配體/受體結(jié)合功能。發(fā)明人試圖構(gòu)建包含有能促進多聚體形成的其他氨基酸(如賴氨酸或半胱氨酸)殘基的多肽類似物。
被本發(fā)明包含的還有對ICAM-4或ICAM-4變異體具有特異性(即對于與ICAM-4結(jié)構(gòu)相關(guān)的ICAM-1,ICAM-2和ICAM-R細胞間粘附分子無活性)的抗體物質(zhì)(例如單克隆抗體,多克隆抗體,抗體片段,單鏈抗體,嵌合抗體,CDR-嫁接抗體等等)和其它結(jié)合蛋白質(zhì)(如多肽和肽)。本發(fā)明還包括特異性分泌本發(fā)明單克隆抗體的雜交瘤細胞系。本發(fā)明優(yōu)選的雜交瘤細胞包括如下的幾種127A、127H、173E、179I和179H。用分離的天然或重組體ICAM-4或ICAM-4變異體,或者用在其表面表達這種產(chǎn)物的細胞,都可形成抗體物質(zhì)。另外,本發(fā)明的結(jié)合蛋白質(zhì)對確定結(jié)合位點結(jié)構(gòu)的特征(例如,表位和/或?qū)CAM-4氨基酸序列中修飾部分的結(jié)合特性的敏感度)也是有用的。
組合物形式的結(jié)合蛋白質(zhì)對免疫以及純化本發(fā)明多肽和確定在其表面呈現(xiàn)此多肽的細胞都是有用的。顯然,它們對調(diào)節(jié)(即阻斷,抑制或刺激)涉及ICAM-4的配體/受體結(jié)合生物學(xué)活性也是有用的,特別是對調(diào)節(jié)那些與特異性和非特異性免疫系統(tǒng)應(yīng)答有關(guān)的ICAM-4效應(yīng)器功能是有用的。本發(fā)明還試圖構(gòu)建對抗ICAM-4抗體物質(zhì)有特異性的抗個體型抗體,并應(yīng)用這種抗個體型抗體物質(zhì)調(diào)節(jié)免疫反應(yīng)。用于對細胞表面和體液如血清或腦脊液內(nèi)的ICAM-4進行檢測和定量測定的方法,可能包括例如用單個抗體底物的方法或用多個抗體底物的“夾心”測定方式。在檢測體液內(nèi)的ICAM-4時,本發(fā)明的抗體對判斷神經(jīng)病理學(xué)疾病的發(fā)生也是有用的,因為它可能與循環(huán)的ICAM-4的濃度增加相關(guān)聯(lián)。這種神經(jīng)病理學(xué)疾病包括,但不局限于,由各種疾病例如血栓形成,栓塞等等引起的大腦局部缺血(即麻痹)。
本發(fā)明的DNA和氨基酸序列的公開所提供的信息的科學(xué)價值是顯而易見的。作為一組實施例,對ICAM-4的cDNA序列的知識,可用于通過DNA/DNA雜交來分離編碼ICAM-4的基因組DNA序列和確定ICAM-4表達控制調(diào)節(jié)序列如啟動子、操縱子等。以本發(fā)明的DNA序列和在嚴格的條件下實施的DNA/DNA雜交方法,預(yù)計同樣能夠分離編碼ICAM-4等位變異體的DNA,還能分離編碼共同具有一個或多個對ICAM-4特異性的生物學(xué)和/或免疫學(xué)特性的其他結(jié)構(gòu)相關(guān)蛋白質(zhì)的DNA,以及分離編碼與來自其它種類的ICAM-4同源的蛋白質(zhì)的DNA。本發(fā)明的DNAs在DNA/RNA雜交測定中,對測定細胞合成ICAM-4的能力是有用的。通過本發(fā)明還能得到與調(diào)節(jié)通常表達ICAM-4的那些細胞表達ICAM-4相關(guān)的反義多聚核苷酸。作為另一組實施例,對ICAM-4的DNA和氨基酸序列的認識,使有可能通過重組方式來產(chǎn)生ICAM-4變異體,例如以ICAM-4蛋白質(zhì)序列和免疫球蛋白重鏈恒定區(qū)和/或鉸鏈區(qū)的存在為特征的雜交融合蛋白(有時被稱為“免疫粘附的”)。參閱Capon等,自然,337525-531(1989),Ashkenasi等,P.N.A.S.(USA),8810535-10539(1991),以及1989年4月6日公開的PCT WO 89/02922。ICAM-4變異體融合蛋白還可以包括例如,ICAM-4的特定的細胞外結(jié)構(gòu)域和其它的細胞粘附分子的某些部分。
本發(fā)明的DNA還可以用于確定未被翻譯的DNA序列,該序列特異性地啟動經(jīng)操作連接于啟動子結(jié)構(gòu)域的多聚核苷酸的表達。在例如基因移植的情況下,確定和運用這種啟動子序列是特別需要的,在某一限定的神經(jīng)環(huán)境中,基因轉(zhuǎn)移可能特別需要異源性基因表達。本發(fā)明還包括含有本發(fā)明啟動子的載體,以及嵌合基因構(gòu)建體,其中本發(fā)明的啟動子經(jīng)操作連接于一個異源多聚核苷酸序列和一個轉(zhuǎn)錄終止信號。
本發(fā)明提供的DNA和氨基酸序列信息,還可用于對ICAM-4的結(jié)構(gòu)和功能進行系統(tǒng)的分析,并可對那些在細胞外和細胞內(nèi)與之相互作用的分子進行確認。本發(fā)明的抗ICAM-4單克隆抗體的個體型可代表這種分子的特征,并可以模仿天然結(jié)合蛋白(肽和多肽),通過這些天然結(jié)合蛋白型,可調(diào)節(jié)ICAM-4在細胞間和細胞內(nèi)的活性,或者通過它使ICAM-4可調(diào)節(jié)細胞間和細胞內(nèi)的一些過程。另外,它們還可以代表ICAM-4活性的新類型的調(diào)節(jié)劑??箓€體型抗體本身又可以代表具有生物學(xué)活性的一類新型ICAM-4等效物。用于確定調(diào)節(jié)ICAM-4活性的抗體或其它化合物的體外測定方法可以包括例如,固定化ICAM-4或與ICAM-4結(jié)合的天然配體,可測定地標記非固定化的結(jié)合配偶體,將這種結(jié)合配偶體共同溫育,然后測定待測化合物對標記結(jié)合量的影響,其中與不存在待測化合物的標記結(jié)合量相比較,存在待測化合物的標記結(jié)合量減少,表明該待測物是ICAM-4結(jié)合抑制劑。
本發(fā)明提供的DNA序列信息還可用于通過同源重組或“敲出”(knockout)方案[參閱例如Kapecchi,科學(xué),2441288-1292(1989)],培育不能表達功能性ICAM-4蛋白的嚙齒類動物,或表達變異體ICAM-4蛋白的嚙齒類動物。這樣的嚙齒類動物可用作研究ICAM-4和ICAM-4調(diào)節(jié)劑體內(nèi)活性的實驗?zāi)P汀?br>
發(fā)明詳述1993年8月5日提交的母美國專利申請系列號08/102,852公開的內(nèi)容,被特別引入作為參考。該專利申請的實施例特別涉及如下方面設(shè)計和構(gòu)建用于PCR擴增ICAM相關(guān)DNA的寡核苷酸探針;用該探針與編碼ICAM-1和ICAM-2的DNA同源,但與之不同的人基因組片段;以該基因組片段篩選cDNA文庫,從而分離另外的ICAM-R編碼序列;篩選cDNA文庫,從而分離出編碼ICAM-R的全長度的人cDNA序列;對ICAM-R的DNA和氨基酸序列信息進行表征,特別是與ICAM-1和ICAM-2相關(guān)的序列信息;培育表達ICAM-R的哺乳動物宿主細胞;評定ICAM-R參與涉及CD18依賴性途徑和CD18非依賴性途徑的粘附過程的指標;用ICAM-R誘導(dǎo)的肽抑制細胞對ICAM-R的粘附;表達ICAM-R的變異體;制備和鑒定抗ICAM-R抗體及其片段;繪制被抗ICAM-R單克隆抗體識別的ICAM-R抗原決定部位圖譜;確定ICAM-R和編碼其RNA的分布狀態(tài)和生物化學(xué)特征;確定在同型細胞-細胞粘附中和在免疫細胞激活/再生過程中的ICAM-R;以及確定ICAM-R的細胞質(zhì)結(jié)構(gòu)域的不同的磷酸化和細胞骨架聯(lián)系。還公開了對編碼嚙齒類ICAM的DNA的鑒定結(jié)果,當(dāng)時看來是人ICAM-R的大鼠同源物,并且用這種DNA構(gòu)建和表達了編碼谷胱甘肽-S-轉(zhuǎn)移酶融合蛋白的DNA。在母專利申請(U.S.S.N.08/102,852)實施例6中,可以找到如何確定這種嚙齒類動物DNA的詳細描述,并且在此作為實施例1被重新提出。因為多數(shù)編碼嚙齒類動物ICAM的序列已被確定了,顯然嚙齒類動物ICAM DNA不能編碼人ICAM-R的大鼠同源物,但是事實上編碼了一種新的多肽,在此被定名為ICAM-4。為了理解確定ICAM-4的經(jīng)過,提供了時間表,隨后是本發(fā)明的詳細描述。
第一個嚙齒類動物基因組ICAM-4序列被確定為編碼與人ICAM-R(在此是SEQ ID NO4)的結(jié)構(gòu)域2(在此的SEQ ID NO3和U.S.S.N.08/102,852的SEQ ID NO23)同源的一個區(qū)。第二個是重疊的基因組DNA(在此的SEQ ID NO5和U.S.S.N.08/102,852的SEQ ID NO26),也被確定為編碼SEQ ID NO3的結(jié)構(gòu)域2和ICAM-1的序列。用SEQ ID NO3作探針,一個嚙齒類動物脾cDNA(在此的SEQ ID NO6和U.S.S.N.08/102,852中的SEQ ID NO25)被確定為編碼從2到5的結(jié)構(gòu)域以及以前沒有被看作是ICAM結(jié)構(gòu)域的第五結(jié)構(gòu)域。此時,這些被新確定的嚙齒類動物DNA看來編碼一個人類ICAM-R的嚙齒類動物同源物,但是要使這些DNA的3’區(qū)與其它ICAM匹配被證明是困難的。
隨后從大鼠脾細胞文庫中分離出的一個1kb cDNA克隆,以及RT-PCR片段的擴增表明,cDNA和基因組克隆的一部分還沒有被確定序列。另一個RT-PCR擴增產(chǎn)物(SEQ ID NO7)證實了這個遺漏。已決定從基因組和cDNA克隆中,通過用EcoRI對克隆進行消化,切出177bp的一個片段,以便從λ噬菌體中分離出這些序列,用于DNA測序研究。通過借助這些其它的序列對SEQ ID NOs5和6進行再分析,使有可能對最初分離的基因組和cDNA克隆測定出更精確,更完整的序列,該序列在此如SEQ ID NOs8和9所示以修正的形式給出。
為了確定完整的ICAM-4編碼序列,分離出了大鼠腦cDNA(SEQID NO10),并通過cDNA末端(5’RACE)的5’快速擴增來測定5’末端序列,此擴增產(chǎn)物在SEQ ID NO11中列出。綜合來自RT-PCR克隆(SEQ ID NO7),腦cDNA(SEQ ID NO10)和RACE擴增產(chǎn)物(SEQ ID NO11)的資料,可以對ICAM-4(SEQ ID NO1)的完整編碼序列進行確定。
本發(fā)明將通過下列實施例進行說明。更具體地說,實施例1涉及克隆嚙齒類動物部分ICAM-4 DNA。實施例2描述對嚙齒類動物ICAM-4轉(zhuǎn)錄過程的核酸印跡(Northern blot)分析。實施例3描述對全長嚙齒類動物ICAM-4 cDNA的分離過程。實施例4涉及在腦組織中嚙齒類動物ICAM-4的原位雜交。實施例5涉及在原核生物中產(chǎn)生ICAM-4融合蛋白。實施例6描述對大鼠ICAM-4/GSE融合蛋白有特異性的單克隆抗體的制備。實施例7描述在桿狀病毒表達系統(tǒng)中對可溶性大鼠ICAM-4蛋白質(zhì)的表達。實施例8涉及制備對在桿狀病毒系統(tǒng)中表達的大鼠ICAM-4具有特異性的單克隆抗體。實施例9描述對大鼠ICAM-4的表達的免疫細胞化學(xué)分析。實施例10涉及對編碼人基因組ICAM-4的DNA的克隆。實施例11涉及編碼人ICAM-4的cDNA的克隆。實施例12描述對人ICAM-4的表達的核酸印跡分析。實施例13涉及人ICAM-4/GST融合蛋白質(zhì)的產(chǎn)生。實施例14涉及對人ICAM-4具有免疫特異性的單克隆抗體的制備。實施例15描述建立一種俘獲測定法用于測定特定流體中可溶性ICAM-4的濃度。實施例16將這種俘獲測定法用于對中風(fēng)病人血清中的ICAM-4濃度進行測定。實施例17涉及對大鼠癲癇模型中ICAM-4轉(zhuǎn)錄的測定。實施例18涉及人ICAM-4的啟動子區(qū)的克隆。
實施例1大鼠ICAM相關(guān)DNA的克隆A.大鼠基因組ICAM相關(guān)的結(jié)構(gòu)域2 DNA的分離以一個通過PCR從編碼人ICAM-3結(jié)構(gòu)域2的DNA產(chǎn)生的[32P]-標記探針,對在λEMBL 3中構(gòu)建的大鼠基因組文庫進行篩選。該探針的序列被列舉在SEQ ID NO12中。將序列文庫的噬菌斑轉(zhuǎn)移到Hybond N+尼龍膜上(Amersham,Arlington Heights,IL)。按標準的方法對全部cDNA和基因組序列庫進行篩選。在含有40-50%甲酰胺5倍稀釋的Denhardt’s位,5倍稀釋的SSPE液和1.0%SDS的溶液中,在42℃進行預(yù)雜交和雜交過程。加入探針([32P]標記的),使其濃度為每毫升雜交液含105-106cpm。雜交16-18小時之后,將尼龍膜在室溫下,在含有0.1%SDS的2X SSPE中徹底清洗,隨后在-80℃暴露于X-射線膠片過夜。對陽性噬菌斑作一輪或多輪雜交處理,而得到克隆的噬菌體。將從陽性克隆裂解液制備的DNA亞克隆進入pBS+并進行測序。
對第一個編碼大鼠ICAM相關(guān)的結(jié)構(gòu)域2的基因組克隆的鑒定結(jié)果是,它是與其它ICAM家族成員中的結(jié)構(gòu)域2同源的(參閱例如,美國專利申請系列號08/102,852的表1),但是不同于以前報導(dǎo)的大鼠ICAM-1的核苷酸序列[Kita,等,生物化學(xué)生物物理學(xué)報,1131108-110(1992)]或小鼠ICAM-2的核苷酸序列[Xu,等,免疫學(xué)雜志,1492560-2565(1992)]。在本申請的共未決母申請中,作為表明是大鼠ICAM-R變異體的形式,公開了這個克隆的核酸序列和推導(dǎo)出的氨基酸序列,并分別作為SEQ ID NOs23和24列舉在專利U.S.S.N.08/102,852中。在此,同樣的這些序列分別列舉在SEQ ID NO3和13中。
第二個基因組克隆,是重疊的克隆,也用相同的探針進行了鑒定,測定表明含有SEQ ID NO3的ICAM結(jié)構(gòu)域2序列和編碼至少部分大鼠ICAM-1的5’DNA。在本申請的共未決母申請中,作為SEQ IDNO26列舉了這個克隆的核酸序列,并在此,作為SEQ ID NO5被列舉。此第二個克隆顯示,第一個克隆的ICAM-相關(guān)的基因片段和編碼大鼠ICAM-1的基因,是位于大鼠同一染色體上,彼此不超過5kb。B.分離大鼠ICAM相關(guān)的cDNA為了確定對ICAM-相關(guān)多肽的一個較完整的蛋白質(zhì)編碼序列,用編碼結(jié)構(gòu)域2序列的,來自在上述A部分(SEQ ID NO3)確定的大鼠基因組克隆的[32P]標記DNA,對大量來自大鼠和小鼠各種細胞類型的cDNA序列文庫進行了篩選,細胞類型包括大鼠的巨噬細胞(Clontech,Palo Alto,CA),外周血淋巴細胞(PBL)(Clontech),T細胞(自用構(gòu)建的)和脾細胞(Clontech),小鼠的PBL(Clontech),T細胞(自用構(gòu)建的)和B細胞(自用構(gòu)建的)。
在大鼠脾細胞cDNA序列文庫中(Clontech)鑒定出一株克隆,它包含5個類Ig結(jié)構(gòu)域,其中4個是與ICAM-1和ICAM-R中的結(jié)構(gòu)域2到結(jié)構(gòu)域5同源的。但是,這株克隆包含編碼近似第5類Ig結(jié)構(gòu)域的3’DNA,這是在任何其它ICAM多肽中,以前尚未被鑒定過的。此外,這個含有特殊3’序列的克隆,隨后被測定是位于結(jié)構(gòu)域4和5之間的部分基因內(nèi)區(qū)(以下將論述),這暗示此克隆是一個未成熟的或異常拼接的轉(zhuǎn)錄產(chǎn)物。該獨特結(jié)構(gòu)域的存在以及測定表明3’區(qū)不能適當(dāng)?shù)嘏c其它已知的ICAM匹配,都暗示ICAM相關(guān)的DNA可能編碼一個新的大鼠ICAM多肽。此克隆的核酸序列,在本申請的母申請中以SEQ ID NO25被列舉出,在此,這個脾細胞cDNA克隆的核酸序列被列舉在SEQ IDNO6中。C.對大鼠cDNA和基因組DNA的再分析在1993年8月5日申請了美國專利申請序列號08/102,852之后,測定表明,在部分的大鼠脾細胞cDNA克隆(母申請中的SEQ ID NO25和在此的SEQ ID NO6)和大鼠肝細胞基因組克隆(母申請的SEQ ID NO26和在此的SEQ ID NO5)中遺漏了一個內(nèi)部177bp EcoRI片段,它是每個克隆的一部分,但是在亞克隆步驟中丟失了,是在將序列文庫插入物借助EcoRI的消化作用從λ載體移出,并連接到一個測序載體上的時候丟失的。觀察表明,cDNA和基因組克隆可能遺漏了一個編碼片段,顯然是由于大鼠基因組序列和cDNA序列能與各種RT-PCR擴增產(chǎn)物相匹配,包括SEQ ID NO7,它在大鼠序列中顯示有一個缺漏處。
用脾細胞cDNA克隆(SEQ ID NO6)作為探針,對來源于脾細胞序列文庫的cDNA進行后續(xù)的分離和序列匹配,提供的第一個指標是,在脾細胞cDNA和基因組克隆的一個區(qū)段沒有被確定序列。這種想法顯然得到了進一步證實根據(jù)用5’引物(RRD35’Xho,含有5’XhoI限制性位點以促進克隆過程,列舉在SEQ ID NO14中),和3’引物(RRD5 3’Hind,含有HindIII位點以促進克隆過程,列舉在SEQ IDNO15中),對跨越結(jié)構(gòu)域3到結(jié)構(gòu)域5的RT-PCR片段進行擴增。
GAACTCGAGGCCATGCCTCCACTTTCC (SEQ ID NO14)CCATAAGCTTTATTCCACCGTGACAGCCAC(SEQ ID NO15)這二個DANs序列顯然表明,在測序之前cDNA和基因組克隆就已經(jīng)丟失了一個片段,對RT-PCR DNA測序(下面將要論述)之后,這種想法得到進一步支持。可以得出結(jié)論,在測序之前用EcoRI限制性消化除去cDNA和基因組片段,將導(dǎo)致177bp片段的缺失,在用瓊脂糖凝膠對來自λ噬菌體序列的克隆進行分離時,不能觀察測定出這個片段。隨后的序列分析確定了二個EcoRI位點的位置,在二個最初的克隆中,它們位于177bp片段的兩側(cè)。
177bp EcoRI片段,在如SEQ ID NO9列舉的大鼠部分cDNA克隆中,是位于核苷酸719和896之間,而在如SEQ ID NO8列舉的部分基因組克隆中,是位于核苷酸2812和2989之間。D.通過RT-PCR克隆分離的DNART-PCR被用于對大鼠ICAM相關(guān)的基因產(chǎn)生更完整的序列信息。來自基因組克隆(SEQ ID NO3)的序列信息,可用于設(shè)計與蛋白編碼區(qū)的5’區(qū)互補的有義引物,如對cDNA克隆的測定所示,并且可用于設(shè)計反義引物,它可以被設(shè)計成與cDNA克隆(SEQ IDNO6)中的編碼序列的3’區(qū)到該編碼序列互補。
用于PCR反應(yīng)的模板cDNA按如下方法制備,將從大鼠脾細胞分離的poly A+RNA大約2μg,在10μl體積中,以65℃加熱變性。變性處理之后,加入0.1μl RNasin(Invitrogen,San Diego,CA),5μl 5XRTase緩沖液(BRL,Bethesda,MD),2μl隨機六聚體(pd(N)6,100μl/ml)(Pharmacia,Piscataway,NJ),6μl dNTPs(各2mM)和2μl AMV RTase(BRL),此反應(yīng)物在42℃溫育60-90分鐘。將反應(yīng)物貯存于-20℃?zhèn)溆谩?br>
最初的一系列實驗是用于鑒定在用大鼠脾細胞cDNA作模板的PCR反應(yīng)中,產(chǎn)生擴增產(chǎn)物的寡聚核苷酸引物對。在PCR中,不同的5’有義引物與一個3’引物配對,此引物是被設(shè)計成與一個內(nèi)部的編碼序列互補,該3’引物被定名為RRD2 3-1,如SEQ ID NO16所示。
AACGTGCGGAGCTGTCTG(SEQ ID NO16)(在下述最終分離的RT-PCR產(chǎn)物,SEQ ID NO7中,引物RRD23-1對應(yīng)于核苷酸719到736)。類似的情況是,不同的3’反義引物與一個5’引物配對,此引物是被設(shè)計成與另一個內(nèi)部的編碼序列互補,在這些反應(yīng)中的5’引物被定名為RGen 3900S,并被列舉在SEQ IDNO17中。
ACGGAATTCGAAGCCATCAACGCCAGG(SEQ ID NO17)(在下述SEQ ID NO7中,引物RGen 3900S對應(yīng)于核苷酸1719到1736)。根據(jù)擴增產(chǎn)物的分子大小和這些產(chǎn)物與部分cDNA克隆雜交的能力,確定了一對引物是最有效的,并被用于隨后的PCR擴增。此5’引物被定名為RGen 780S(SEQ ID NO18),此3’引物被定名為RGen 4550AS(SEQ ID NO19)。
CATGAATTCCGAATCTTGAGTGGGATG(SEQ ID NO18)ATAGAATTCCTCGGGACACCTGTAGCC(SEQ ID NO19)(在下述SEQ ID NO7中,引物RGen 780S對應(yīng)于核苷酸1到18,引物RGen4550AS相應(yīng)于核苷酸2197到2214)。
在各種條件下將此引物對用于PCR,以便得到最佳的擴增。在二個不同的退火溫度,運用了總共15個改變pH和Mg++濃度的不同的PCR緩沖液,來自每個反應(yīng)的產(chǎn)物樣品,在1%瓊脂糖凝膠上進行分離。因為通過對來自任何反應(yīng)條件的溴化乙錠染色凝膠的可視性檢驗,都不能檢測出任何擴增產(chǎn)物,所以運用了更靈敏的Southern(DNA)雜交技術(shù)來檢測PCR產(chǎn)物。
通過電泳將等分量擴增的DNA分離,再用常規(guī)的Southern印跡吸附技術(shù)將它轉(zhuǎn)移到Hybond N+尼龍膜上,然后與用[32P]標記的完整大鼠cDNA雜交。雜交的條件基本上同上述A部分中用于序列文庫篩選的條件。放射自顯影顯示,在二個反應(yīng)中,已經(jīng)產(chǎn)生了少量大約2.2kb的DNA,并且,二個反應(yīng)的擴增產(chǎn)物的剩余部分可在瓊脂糖凝膠上分離開。盡管據(jù)可視性檢驗沒有顯示任何區(qū)帶,但從凝膠上還是洗脫出了2.2kb區(qū)帶,并且在另一個PCR反應(yīng)中被用作模板,此PCR反應(yīng)的條件是,用同樣的引物(SEQ ID NO18和19),含有1mM Mg++的Tris-HCl緩沖液,pH 8.0,以及55℃退火溫度。來自次級PCR的擴增產(chǎn)物在凝膠中是可見的,可被洗脫出,并克隆進入質(zhì)粒pBS+(Stratagene,LaJolla,CA)用于序列分析。
生成的RT-PCR克隆被測定含有2214bp,列示在SEQ ID NO7中。該克隆能編碼在大鼠脾細胞cDNA克隆中發(fā)現(xiàn)的結(jié)構(gòu)域2到結(jié)構(gòu)域6,還能編碼一個附加的氨基末端結(jié)構(gòu)域1,一個附加的羧基末端結(jié)構(gòu)域7,以及似乎是另一個羧基末端結(jié)構(gòu)域8的164bp。與結(jié)構(gòu)域1緊鄰的5’區(qū)是一個附加的144bp序列,推測是來自引導(dǎo)區(qū)和第一區(qū)之間的基因內(nèi)區(qū)。這個克隆不含有5’引導(dǎo)序列或3’跨膜的和細胞質(zhì)內(nèi)區(qū)。除了以前在脾cDNA克隆中確定的結(jié)構(gòu)域6之外,RT-PCR克隆中的第7和第8結(jié)構(gòu)域也支持如下假設(shè)此克隆是新的嚙齒類動物ICAM。
實施例2Northern(RNA)印跡分析法為了進一步研究這種可能性,即在實施例1中鑒定的ICAM-相關(guān)的克隆編碼了一種如獨特的類Ig結(jié)構(gòu)域所示的新的ICAM多肽,用Northern印跡分析法對組織特殊性表達進行了檢測,以使能夠與以前報導(dǎo)的人ICAM表達模式相比較[ICAM-1,Dustin等,免疫學(xué)雜志,137245-254(1986),ICAM-2,Staunton等,自然,33961-64(1989),ICAM-R,de Fourgerolles和Springer,實驗醫(yī)學(xué)雜志,175185-190(1992)]。
用STAT 60 RNA分離試劑(Tel-test“B”,Inc,F(xiàn)riendswood,Texas),按照廠商提供的方案,分別從大鼠的肺,腦,脊髓,肝,消化道,胸腺,淋巴結(jié)和脾制備細胞總RNA。用低聚dT纖維素柱,從總RNA中分離純化出Poly A+RNA。在1%甲醛瓊脂糖凝膠上,將從每種組織得到的RNA大約5μg進行分離,然后轉(zhuǎn)移至hybond-C硝酸纖維素膜上(Amersham)。
將來自實施例1的,相應(yīng)于結(jié)構(gòu)域2到4(在SEQ ID NO6中的核苷酸1到724)的大鼠脾cDNA片段,亞克隆進入pBluescript SK+(Stratagene),并按照廠商(Boehringer Mannheim,Indianapolis,IN)提供的方案,用32P-標記的UTP和大約500ng線性化的模板,通過體外轉(zhuǎn)錄產(chǎn)生一個反義RNA探針。將膜結(jié)合RNA在含有下列成分的溶液中進行預(yù)雜交50%甲酰胺,5×SSC,1×PE(50mMTris-HCl,pH7.5,0.1%焦磷酸鈉,0.2%聚乙烯吡咯烷酮,0.2%ficoll,5mM EDTA,1%SDS)和150μg/ml的變性處理過的鮭魚精DNA。放射標記的探針通過煮沸變性處理后,加入到該預(yù)雜交液中,使其最后濃度為1×106cpm/ml。在65℃雜交處理16-18小時。然后在65℃,在含有0.1%SDS的2×SSC中對膜進行洗滌,隨后對X-射線膠片曝光3-16小時。
RNA印跡分析表明,實施例1中確定的ICAM-相關(guān)的cDNA只在大鼠腦中被表達,這是一種對任何其它ICAM多肽以前尚未報導(dǎo)過的組織特異性。這種表達模式,加上尚不知存在于其它ICAM多肽中的獨特的類Ig結(jié)構(gòu)域,都表明該ICAM相關(guān)的克隆是ICAM蛋白質(zhì)家族的一個新成員,被命名為ICAM-4。
最初鑒定的cDNA克隆在大鼠脾細胞序列文庫中被檢測出的事實暗示,脾細胞中的一個子系統(tǒng)可能以低水平表達ICAM-4。但是,在許多血細胞生成cDNA序列文庫中未能檢測出適當(dāng)拼接的克隆,這使人懷疑是否ICAM-4蛋白真的能在除腦以外的組織中被表達。對ICAM-4cDNA在脾細胞中被檢測出的一種解釋是,PCR的靈敏度可能擴增了痕跡量的轉(zhuǎn)錄本,即使這些組織并不能表達所編碼的蛋白質(zhì)。
實施例3全長大鼠ICAM-4cDNA的分離A.對大鼠腦cDNA克隆的確定鑒于ICAM-4的組織特異性表達,腦組織mRNA被用于分離編碼ICAM-4的全長cDNA的目的。對二個探針作放射性標記,第一個是與實施例1中鑒定的脾細胞cDNA克隆(SEQ ID NO7)的結(jié)構(gòu)域1到結(jié)構(gòu)域2互補,第二個是與其結(jié)構(gòu)域3到結(jié)構(gòu)域5互補,并用這二個探針在以前自用構(gòu)建的λgt10中篩選大鼠腦cDNA序列文庫。雜交條件如實施例1中所述,對陽性噬菌斑作一輪或多輪篩選處理,得到克隆的噬菌體。
鑒別出9個陽性克隆,以其中兩個與兩個探針雜交。最長的兩個克隆,稱作克隆7,含有2550bp,它們編碼在cDNA探針中發(fā)現(xiàn)的5個類Ig結(jié)構(gòu)域的4個結(jié)構(gòu)域。此外,克隆7還編碼在探針中沒有發(fā)現(xiàn)的其它4個類Ig結(jié)構(gòu)域。對假定的跨膜結(jié)構(gòu)域和細胞質(zhì)結(jié)構(gòu)域鑒定表明,其后面連有一個終止密碼子,一個聚腺苷酸化信號,和一個聚A尾部。測定表明,通過與RT-PCR克隆(SEQ ID NO7)相比較,克隆7缺少至少一個5’類Ig結(jié)構(gòu)域,并缺少一個引導(dǎo)序列;對此序列文庫再次篩選沒有得到任何含有這些序列的更長的克隆??寺?的核酸序列被列舉在SEQ ID NO10中。B. 5’末端的測定為了分離結(jié)構(gòu)域1和其它5’序列,運用了被稱為cDNA末端5’快速擴增(RACE)的PCR技術(shù)[PCR方案方法和應(yīng)用指南,Innis等(eds)學(xué)術(shù)出版社紐約(1990)pp28-38]可通過使用5’RACE試劑盒(Clontech)進行。該技術(shù)使用了一個與第二引物配對的內(nèi)部引物,此第二引物是與一個接合于cDNA序列文庫分子5’末端的連接子序列互補的。因此,運用這種引物對的PCR可擴增并促進對此插入序列的鑒定。然后重疊的序列信息可以用于產(chǎn)生完整的基因序列。
在一個以該試劑盒的寡聚核苷酸和一個基于內(nèi)部ICAM-4序列的反義引物進行的PCR試驗中,使用了來自大鼠腦的準備用于RACE的cDNA(由試劑盒提供)。3’反義引物,被稱為Spot 714AS,是根據(jù)ICAM-4結(jié)構(gòu)域4序列設(shè)計的,被列舉在SEQ ID NO20中。
CARGGTGACAAGGGCTCG(SEQ ID NO20)隨后對由這個引物對得到的擴增產(chǎn)物,用試劑盒提供的相同5’引物進行次極PCR試驗,此5’引物是同一個與ICAM-4結(jié)構(gòu)域1中的一部分互補的3’引物配對的引物。第2個3’引物被定名為RRACE2,并列舉在SEQID NO21中。
TATGAATTCAGTTGAGCCACAGCGAGC(SEQ ID NO21)每個用于次極PCR的引物都含有一個EcoRI位點,以便使產(chǎn)生的擴增產(chǎn)物容易克隆進pBS+(Stratagene)。生成的含有基因5’末端的質(zhì)粒DNA,可通過對大鼠ICAM-4結(jié)構(gòu)域1和2探針的雜交來鑒別,相應(yīng)于SEQID NO7中的核苷酸1到736。從生成的擴增產(chǎn)物還可確定結(jié)構(gòu)域1和疏水引導(dǎo)區(qū)的部分序列信息。
來自5’RACE法的產(chǎn)物是一個長度為222bp的DNA片段,含有以甲硫氨酸為起始的60bp上游區(qū),82bp的引導(dǎo)序列,和80bp來自結(jié)構(gòu)域1的序列。此擴增產(chǎn)物被列舉在SEQ ID NO11中。C.大鼠ICAM-4的全長序列根據(jù)由5’RACE法得到的序列信息(SEQ ID NO11),構(gòu)建了一個全長ICAM-4的復(fù)合克隆,RT-PCR克隆(SEQ ID NO7)和腦cDNA克隆7(SEQ ID NO10)。對大鼠ICAM-4的全長基因測定表明,它含有2985bp(堿基對),帶有一個單開口的解讀結(jié)構(gòu),它是編碼一個推測的含917個氨基酸的蛋白質(zhì)的結(jié)構(gòu)。假定的Kozak序列位于引導(dǎo)序列中的甲硫氨酸殘基的上游。在27個氨基酸的疏水引導(dǎo)序列的后面是9個類Ig結(jié)構(gòu)域,一個跨膜區(qū)和含有58個氨基酸的細胞質(zhì)尾部。該復(fù)合ICAM-4 cDNA被列舉在SEQ ID NO1中,該推測的氨基酸序列數(shù)列舉在SEQ ID NO2中。
象其它ICAM多肽一樣,ICAM-4也包含細胞外結(jié)構(gòu)域,跨膜結(jié)構(gòu)域和細胞質(zhì)結(jié)構(gòu)域。在細胞外結(jié)構(gòu)域,ICAM-4的氨基末端是包括氨基酸1到氨基酸27的一個引導(dǎo)序列,隨后是9個類免疫球蛋白Ig結(jié)構(gòu)域,這是ICAM-4獨有的特征,對于ICAM-1,ICAM-2和ICAM-R,是分別包含5個,2個和5個細胞外類Ig結(jié)構(gòu)域。在ICAM-4,結(jié)構(gòu)域1包含氨基酸28到118,結(jié)構(gòu)域2包含氨基酸119到224,結(jié)構(gòu)域3包含氨基酸225到321,結(jié)構(gòu)域4包含氨基酸322到405,結(jié)構(gòu)域5包含氨基酸406到488,結(jié)構(gòu)域6包含氨基酸489到569,結(jié)構(gòu)域7包含氨基酸570到662,結(jié)構(gòu)域8包含氨基酸663到742,和結(jié)構(gòu)域9包含氨基酸743到830。在每個結(jié)構(gòu)域內(nèi),都有一種由半胱氨酸殘基之間的二硫鍵形成特征性“環(huán)形”結(jié)構(gòu),通常位于該結(jié)構(gòu)域氨基酸序列相對的兩端。ICAM-4的其他結(jié)構(gòu)特征包括含有氨基酸831到859的跨膜區(qū)和含有氨基酸860到917的細胞質(zhì)區(qū)。
對于大鼠ICAM-4內(nèi)每個結(jié)構(gòu)域的氨基酸序列與ICAM家族其它成員對應(yīng)性的比較,僅限于同人的ICAM-1,ICAM-2和ICAM-R相應(yīng)的序列,因為對于嚙齒類動物所有三個同源物的序列資料以前都未見報導(dǎo)。在第一結(jié)構(gòu)域,嚙齒類動物ICAM-4顯示有21%,30%和28%分別與人ICAM-1,ICAM-2和ICAM-R相同。第二結(jié)構(gòu)域保存更多,氨基酸與ICAM-1,-2,和-3相同的百分數(shù)分別是60,42,和62。結(jié)構(gòu)域3-5顯示與ICAM-1相同的百分數(shù)是48,49,和40,而對于ICAM-R分別是60,59,和29。有趣的是,大鼠ICAM-4結(jié)構(gòu)域6到8與結(jié)構(gòu)域5最相似(有29%-42%完全相同),可能是由于基因片段的復(fù)制造成。第9和最后一個細胞外結(jié)構(gòu)域與其它ICAM結(jié)構(gòu)域匹配很差,但人VCAM-1的第3和第6結(jié)構(gòu)域有22%相同,VCAM-1是參與細胞粘附的蛋白質(zhì)Ig家族的另一個成員。細胞質(zhì)結(jié)構(gòu)域的尾部由58個氨基酸組成。這比ICAM家族其它成員的都長,在人ICAM-1,-2,和3中,分別包含28,26,和37個氨基酸。正如第9結(jié)構(gòu)域一樣,大鼠ICAM-4細胞質(zhì)結(jié)構(gòu)域的尾部與人VCAM-1細胞質(zhì)結(jié)構(gòu)域的尾部最相似,只包含19個氨基酸。大鼠ICAM-4的大約19個膜氨基酸,與VCAM-1共用7個相同的氨基酸殘基(37%)。
最后,將與LFA-1(CD11a/CD18)的結(jié)合功能繪制成ICAM中第一結(jié)構(gòu)域的基因排列圖。Vonderheide等,[細胞生物學(xué)雜志,125215-222(1994)]鑒定了一個認為是與整合蛋白結(jié)合有關(guān)的序列基元。盡管在結(jié)構(gòu)域1中大鼠ICAM-4的其它ICAM之間僅有相當(dāng)?shù)偷南嗨疲沁@個結(jié)合序列基元被保留了,表明大鼠ICAM-4可能是LFA-1或者其它整合蛋白的一個配體。
實施例4在腦組織中的原位雜交為了將表達ICAM-4的特異性腦組織定位,采用了以ICAM-4結(jié)構(gòu)域1和ICAM-4結(jié)構(gòu)域3到4作反義RNA探針的原位雜交技術(shù)。對這些探針通過體外轉(zhuǎn)錄用35S-標記的UTP作了標記。
雜交之前,將正常大鼠腦的冰凍組織切片在4%多聚甲醛中固定20分鐘,然后作漂洗和脫水處理,再使被固定的RNA在70℃,在2×SSC,70%甲酰胺中變性處理2分鐘。在50℃,將組織切片在含有下列成分的溶液中雜交過夜50%甲酰胺,0-3M NaCl,20mM Tris-HCl,pH7.4,5mM EDTA,10%硫酸葡聚糖,1×Denhardt,0.5mg/ml的酵母RNA,10mM DTT和濃度為50000cpm/μl的探針。組織玻片在室溫下,在4×SSC,10mM DTT中洗一次,60分鐘,60℃下在50%甲酰胺,2×SSC,10mM DTT中洗一次,40分鐘,再在室溫下,分別在2×SSC和1×SSC中洗一次,各30分鐘。用平行的實驗確定雜交的特異性,按相同的方案進行,但是還包括在60℃,在50%甲酰胺,1×SSC,10mM DTT中,更嚴格地洗40分鐘。洗片之后,將組織玻片在NTB2乳膠(Kodak,Rochester,NY)中浸一下,再曝光2至21天,然后顯影和作計數(shù)染色。陰性對照包括從ICAM-4結(jié)構(gòu)域1產(chǎn)生的有義探針和ICAM-4結(jié)構(gòu)域3到4的有義RNA探針,此外還包括一個人免疫缺損病毒(HIV-1)RNA探針。
腦組織中的檢測信號主要位于灰質(zhì),最強的信號在大腦皮層和海馬的灰質(zhì)中。此雜交分布圖與ICAM-4主要在大腦神經(jīng)細胞中表達相符合。
實施例5ICAM-4融合蛋白的產(chǎn)生為了產(chǎn)生針對ICAM-4多肽片段特異性的單克隆抗體,先用原核生物表達載體pGEX(Pharmacia,Alameda,CA)產(chǎn)生大鼠ICAM-4/谷胱甘肽S-轉(zhuǎn)移酶(GST)融合蛋白。
將相應(yīng)于結(jié)構(gòu)域1 5’和3’末端的和結(jié)構(gòu)域2 5’和3’末端的PCR引物,用于擴增編碼各個結(jié)構(gòu)域的DNA片段。產(chǎn)生的片段再被分別克隆進入pGEX-2T的EcoRI位點,DNA序列分析證實了其正確的取向和讀出結(jié)構(gòu)。隨后根據(jù)它們產(chǎn)生適當(dāng)分子量融合蛋白的能力,篩選轉(zhuǎn)化體。
細菌在含有1%SDS的PBS中經(jīng)超聲波處理溶菌之后,ICAM-4結(jié)構(gòu)域1/GST和ICAM-4結(jié)構(gòu)域2/GST融合蛋白都存留在可溶性組分之中。將來自100ml培養(yǎng)物的可溶性組分在帶有SDS的染料中煮沸,并在10%預(yù)制的聚丙烯酰胺-SDS凝膠上進行分離。然后將凝膠在冰冷卻的0.4M KCl中染色,并切下融合蛋白帶。在透析管內(nèi)的含有25mMTris-HCl和192mM甘氨酸的緩沖液中,通過電洗脫法將融合蛋白從凝膠切片中洗脫出。用OD280測定大致的蛋白質(zhì)濃度,制劑的純度可在用考馬斯藍染色的SDS-PAGE上測定。
實施例6針對大鼠ICAM-4/GST融合蛋白的單克隆抗體的制備用在福氏完全佐劑(FCA)中乳化的40-50μg ICAM-4結(jié)構(gòu)域2/GST融合蛋白(實施例5中所述的),通過皮下注射免疫Balb/c小鼠。二周后,用相同的蛋白質(zhì),但是在福氏不完全佐劑中乳化的蛋白質(zhì),再次通過皮下注射免疫小鼠。在第二次免疫的二周之后,再給予最后二次腹膜內(nèi)注射免疫,用的是無佐劑的可溶性抗原,中間相隔二周。通過ELISA法測定每只免疫小鼠血清與大鼠ICAM-4特異性反應(yīng)的能力。此ICAM-4是如下所述用桿狀病毒表達系統(tǒng)產(chǎn)生的。
從#1654小鼠無菌取出脾臟,置于10ml無血清的RPMI 1640液中。向此RPMI(Gibco,Burlington,Ottawa,Canada)液中補加2mM L-谷酰胺,1mM丙酮酸鈉,100單位/ml青霉素,和100μg/ml鏈霉素,然后在此溶液中,通過用二塊顯微鏡玻片的粗糙末端研磨脾組織,而形成單細胞懸液。細胞懸液用無菌的70目Nitek細胞濾器(BectonDickinson,Parsippany,NJ)過濾,用RPMI液洗二次,每次以200×g離心5分鐘。將從第二次洗液得到的沉淀再懸浮在20ml無血清的RPMI液中。用同樣的方法制備取自三只正常Balb/c小鼠的胸腺細胞。
在融合之前,使NS-1骨髓瘤細胞在加有11%Fetalclone血清(FBS)(Hyclone Laboratories,Logan,Utah)的RPMI中,維持在對數(shù)生長時相3天。收獲時,在200×g離心細胞5分鐘,沉淀如上面所述洗滌二次。洗過之后,在無血清的RPMI中,將細胞懸液配成10ml的最后體積。取20μl等分量,用無血清RPMI作1∶50稀釋,再取20μl等分量稀釋液與用0.85%鹽水(Gibco)配制的0.4%錐蟲蘭染色劑20μl混合,轉(zhuǎn)入血細胞計數(shù)器(Baxter Healthcare,Deerfield,IL),作細胞計數(shù)。用大約2.425×108個脾細胞與4.85×107個NS-1細胞結(jié)合,離心此混合物,棄去上清液。輕輕彈擊離心管,使離心沉淀松動,混勻,然后加入用75mM Hepes,pH8.0(Boehringer Mannheim,Indianapolis,IN)配制的50%PEG 1500 2ml,加注時同時攪拌,1分鐘以上加完。隨后,在超過7分鐘的時間內(nèi)加入另外14ml無血清RPMI。細胞懸液在200×g離心10分鐘,棄去上清液。將沉淀再次懸浮在含有下列成分的200ml RPMI中15%FBS,100μM次黃嘌呤鈉,0.4μM氨基喋呤,16μM胸腺嘧啶脫氧核苷(HAT)(Gibco),25單位/ml IL-6(Bochringer Mannheim)和1.5×106個胸腺細胞/ml。先將此懸液置于225cm2的培養(yǎng)瓶內(nèi)(Corning,Essex,UnitedKingdom)37℃培養(yǎng)4小時,然后以200μl/孔分配到10×96平底孔組織培養(yǎng)板(Corning)中。對培養(yǎng)板中的細胞在融合后的第3,4,5,和6天作換液飼養(yǎng),方法是用20G注射針(Becton Dickinson)從每孔吸出大約100μl培養(yǎng)液,每孔再加入上述培養(yǎng)液,但其中僅含10單位/mlIL-6,不含胸腺細胞。
最后通過抗原固定化ELISA法對融合培養(yǎng)板進行篩選,方法如下。用Immulon 4酶聯(lián)板(Dynatech,Cambridge,MA),以100ng/孔結(jié)構(gòu)域1-GST或結(jié)構(gòu)域2-GST融合蛋白(以50mM碳酸鹽緩沖液配制),在4℃包被過夜。對此酶聯(lián)板以100μl/孔PBS新鮮配制的0.5%皮膚膠原蛋白(Sigma,St.Louis,MO),在37℃封閉30分鐘。封閉完成之后,將此酶聯(lián)板用含有0.05%吐溫20的PBS(PBST)洗3次,然后分別加入取自每個融合細胞孔的雜交瘤細胞懸液,50μl/孔。39℃培育30分鐘后,如上所述洗滌酶聯(lián)板之后,加入1∶3500稀釋的辣根過氧化物酶標記羊抗小鼠IgG(Fc)(Jackson ImmunoResearch,WestGrove,Pennsylvania)50μl/孔。將此酶聯(lián)板再次培育30分鐘,再用PBST洗4次。加入由1mg/ml鄰苯二胺(Sigma)和0.1μl/ml 30%H2O2組成的,在100mM檸檬酸,pH4.5中配制的底物液,100μl/孔。允許生色反應(yīng)進行10分鐘,然后加入50μl/孔15%H2SO4,使反應(yīng)停止。然后在自動酶聯(lián)板測定儀(Dynetech)上,在490nm測定光吸水度。
然后,將對結(jié)構(gòu)域2-GST蛋白,而不是結(jié)構(gòu)域1-GST蛋白的陽性反應(yīng)孔,通過針對桿狀病毒上清液(在下面描述的ELISA測定進行篩選。ELISA試驗步驟同上所敘,不同的是Immulon 4酶聯(lián)板最初是用在50mM碳酸鹽緩沖液中1∶4稀釋的桿狀病毒上清液包被過夜。通過在RPMI,15%FBS,100μM次黃嘌呤鈉,16μM胸腺嘧啶脫氧核苷和10單位/ml IL-6中作連續(xù)雙倍稀釋,對其中三個孔(103A,103B和103F)克隆2到3次。4天后肉眼觀測各克隆板孔,記錄最低密度孔的克隆數(shù)量。7至10天后,對每次克隆選出的孔再用ELISA法針對結(jié)構(gòu)域1-GST蛋白和結(jié)構(gòu)域2-GST蛋白,或者桿狀病毒上清液進行測定。
對雜交瘤細胞產(chǎn)生的單克隆抗體用ELISA法作同型性測定。對Immulon 4酶聯(lián)板(Dynatech)用在50mM碳酸鹽緩沖液,pH9.6中1∶5000稀釋的羊抗-小鼠IgA,IgG,或IgM(Organon Teknika,Durham,NC),50μl/孔,在4℃包被。然后用PBS配制的1%BSA,在37℃對各孔封閉30分鐘,用PBST洗3次。對每個孔加入1∶10稀釋的雜交瘤細胞培養(yǎng)上清液50μl,培育,并如上洗滌。最后一次洗滌之后,加入50μl/孔辣根過氧化物酶標記的兔抗小鼠IgG1,G2a,G2b,或G3(Zymed,San Francisco,CA) (在加有1%正常羊血清的PBST中作1∶1000稀釋)。同上培育,用PBST洗4次,然后加入100μl底物液,5分之后加入50μl 15%H2SO4停止生色反應(yīng),在酶聯(lián)板測定儀(Dynatech)上,在490nm測定光吸收度。
結(jié)果表明,抗體103A,103B,和103F都是IgG1同型物。這些抗體隨后將用于免疫細胞化學(xué)分析,免疫印跡測定和用于桿狀病毒表達蛋白質(zhì)的純化。
實施例7用桿狀病毒表達大鼠ICAM-4桿狀病毒表達系統(tǒng)(Invitrogen)被用于產(chǎn)生相應(yīng)于ICAM-4結(jié)構(gòu)域1至6的可溶性蛋白質(zhì)。因為當(dāng)時對ICAM-4的引導(dǎo)序列尚不知道,所以構(gòu)建了含有在適當(dāng)?shù)慕庾x結(jié)構(gòu)中,把3’融合到ICAM-1引導(dǎo)序列的ICAM-4編碼序列的表達結(jié)構(gòu)。關(guān)于構(gòu)建ICAM-1/ICAM-4表達質(zhì)粒的具體詳情如下所述。
用引入了幾個特征以便促進融合質(zhì)粒構(gòu)建的引物,通過PCR擴增了編碼5個類Ig結(jié)構(gòu)域的大鼠ICAM-1 DNA。5’寡核苷酸引物除了在引導(dǎo)序列中第一個甲硫氨酸的上游有一個一致的Kozak序列外,還含有HindIII和BglII位點。3’寡聚核苷酸引物包含有一個6個組氨酸后緊連有一個終止密碼子的一個HindIII克隆位點的編碼序列。將PCR擴增產(chǎn)物克隆進入HindIII-消化的pBS+載體,序列分析證實了這種適當(dāng)?shù)慕Y(jié)構(gòu)。對ICAM-1引導(dǎo)序列中的內(nèi)部SmaI位點和載體的多克隆區(qū)(3’到ICAM-1類Ig結(jié)構(gòu)域5)中的另一個SmaI位點進行消化切割,將除去絕大多數(shù)ICAM-1編碼序列。在做完這些操作之后,這種線性化的,具有平末端的載體內(nèi)包含有一部分上游多克隆區(qū)(在多克隆區(qū)中原始HindIII位點的那些限制性5’位點),Kozak序列和絕大多數(shù)ICAM-1引導(dǎo)序列。
用經(jīng)過消化處理,使之能夠?qū)⑦@些序列克隆進入上述線性化載體的引物,通過PCR將大鼠ICAM-4結(jié)構(gòu)域1到結(jié)構(gòu)域6的編碼序列進行擴增。5’寡核苷酸引物包含有一個EcoRV位點和為完成ICAM-1引導(dǎo)序列需要的密碼子。3’寡核苷酸引物包含有對6個組氨酸殘基的密碼子,一個終止密碼子和HingIII和EcoRV限制性位點。用EcoRV消化由此PCR的擴增產(chǎn)物,產(chǎn)生一個具平末端的序列,然后將它整合進入具平末端的,SmaI消化的pBS+線性化載體內(nèi)。將含有ICAM-1引導(dǎo)序列5’到ICAM-4結(jié)構(gòu)域1至6的完整序列,從具有BglII/HindIII消化位點的結(jié)構(gòu)中除去,并且將純化的ICAM-1/ICAM-4融合序列直接克隆進入BglII/HindIII消化的pBluesac III載體(Invitrogen)。
通過ELISA試驗對該重組病毒產(chǎn)生的蛋白質(zhì)進行鑒定,開始是用,以實施例5中所述的大鼠ICAM-4結(jié)構(gòu)域2/GST融合蛋白免疫小鼠的免疫血清。在下面的工作中,從那些小鼠產(chǎn)生的單克隆抗體,將被用于純化由重組桿狀病毒在SF9細胞中產(chǎn)生的ICAM-4蛋白。
實施例8針對桿狀病毒表達的大鼠ICAM-4的單克隆抗體的制備如實施例7中所述,使大鼠ICAM-4結(jié)構(gòu)域1-6在桿狀病毒表達系統(tǒng)中表達。該重組蛋白用單克隆抗體103A(如實施例6中所述)純化。
簡言之,將30mg純化的單克隆抗體103A(溶于100mM硼酸鈉,500mM氯化鈉溶液內(nèi))偶聯(lián)于3g溴化氰活化Sepharose 4B上(Pharmacia,Piscataway,NJ)。在此Sepharose柱上,將含有重組大鼠ICAM-4(結(jié)構(gòu)域1-6)的桿狀病毒上清液加樣上柱,在4℃過夜。先用無鈣、鎂的磷酸鹽緩沖鹽水(CMF-PBS)洗柱,然后用50mM檸檬酸,500mM NaCl,pH4.0的溶液洗脫結(jié)合物。樣品用1/10體積的pH10Tris液中和,貯存于-20℃。在SDS-PAGE上分離的純化蛋白質(zhì),顯示高于90%的純度,遷移在大約80kD的分子量位置。
用純化的重組大鼠ICAM-4結(jié)構(gòu)域1-6蛋白質(zhì),按在實施例6中所述的類似方法免疫小鼠。來自1945號小鼠的脾用于127號融合。融合方案同實施例6中所述。通過ELISA法對重組ICAM-4蛋白篩選融合細胞孔。第二次篩選使用了對大鼠腦組織切片的免疫細胞化學(xué)法(如下面實施例9中所述)。從這株融合細胞中還克隆出了另外四個對大鼠ICAM-4特異性的抗體127A,127E,127F,和127H。大鼠腦組織切片上每種抗體的免疫細胞化學(xué)染色結(jié)果與用單克隆抗體103A(見實施例9)觀察到的結(jié)果相同。測定了這些單克隆抗體結(jié)合D1/GST和D2/GST融合蛋白的能力(在實施例5中所述)。單克隆抗體127A識別D1/GST融合蛋白,單克隆抗體127H識別D2/GST融合蛋白。這二個不同的結(jié)合特異性,以及其它的特點如不與二個GST蛋白質(zhì),暗示至少有3個不同的抗原決定部位可被這批抗體識別。雜交瘤細胞127A和127H,分別于1995年5月31和1995年6月1日存于美國典型培養(yǎng)物保藏中心,12301 Parklawn Drive,Rockville,Maryland 20852,保藏號分別為HB11905和HB11911。
實施例9大鼠ICAM-4表達的免疫細胞化學(xué)以單克隆抗體103A作免疫細胞化學(xué)實驗,用于定位大鼠腦內(nèi)的蛋白質(zhì)產(chǎn)物。
將取自正常成年雌性Lewis大鼠的腦作矢向切開,在無RNase的1XPBS中,在冰浴上洗30分鐘。在TekII組織坩鍋(cryomolds)(MilesLaboratories,Inc.Naperville,IL)內(nèi)加入少量O.C.T.化合物(Miles,Inc,Elkhart,IN),然后將腦組織塊放入其中。腦組織塊放在坩鍋中心部位,再加滿OCT化合物,然后將坩鍋放入裝有2-甲基丁烷(AldrichChemical Company,Inc,Milwaukee,WI)的容器內(nèi),再把此容器放入液氮中。在坩鍋內(nèi)的組織塊和OCT被冷凍后,將組織塊存于-80℃?zhèn)溆糜谇衅?br>
作6μm厚度的組織切片,切片貼于涂有Vectabond(VectorLaboratories,Inc.Burlingame,CA)的載玻片上,在室溫下于空氣中干燥過夜待用。切片在室溫下,在乙醚(Malinckrodt,Paris,KY)中固定5分鐘。當(dāng)載玻片從乙醚中取出之后,讓試劑蒸發(fā)掉。在室溫下,用在1×PBS(僅用磷酸鈉鹽配制)中配制的50%正常大鼠血清(Sigma)和2%牛血清白蛋白(BSA)(Sigma)150μl封閉每塊切片30分鐘。封閉完成后,小心地從切片上吸去封閉液,將純化的抗體103A上清液在封閉液中作1∶10稀釋,對每塊組織切片加150μl。將組織載玻片置于溫盒內(nèi),在4℃培育過夜。
第二天從切片上輕輕吸去抗體溶液,組織載玻片在1×PBS中洗3次,每次4分鐘。從組織載玻片上吸去殘留的PBS,用含有10%正常大鼠血清和2%BSA的1×PBS,將第2抗體,大鼠抗小鼠-生物素標記抗體(Jackson Immuno-Research Laboratories)作1∶100稀釋,對組織切片各加100μl。在室溫下溫育反應(yīng)1小時。切片在1×PBS中洗2次,每次4分鐘,然后用Elite大鼠IgG Vectastain ABC試劑盒(VectorLaboratories,Inc. Burlingame,CA),將按照其產(chǎn)品說明書配制的ABC試劑100μl加到每個切片上。在室溫下溫育30分鐘。溫育反應(yīng)之后,組織玻片在1×PBS中洗2次(每次4分鐘),然后對每個組織切片加Vector VIP過氧化物酶底物液(Vector Laboratories,Inc.Burlingame,CA)150μl,作用大約10分鐘。顯色之后,組織切片在流水下漂洗5分鐘,用Meyer’s蘇木精(Sigma)作計數(shù)染色20秒,再在緩慢的流水中漂洗5分鐘。作組織載玻片通過梯度乙醇作系列脫水,最后通過二甲苯,并用Accumount 60(Stephens Scientific,Riverdale,NJ)封片。
用單克隆抗體(mAb)103A作用過的大鼠腦組織切片的免疫細胞化學(xué)顯示,大鼠ICAM-4是被表達在海馬的神經(jīng)細胞內(nèi)。染色式樣暗示,這種蛋白質(zhì)可能被限制在神經(jīng)的突起(樹突)中。腦組織切片按同樣的方式,以無關(guān)抗體或僅用第二步試劑染色時,不顯示出以MAb 103染色所見到的明顯的表達式樣。
實施例10人ICAM-4基因組DNA的克隆在從基因組DNA克隆大鼠ICAM-4的過程中,發(fā)現(xiàn)ICAM-1和ICAM-4定位在彼此相距5kD的位置,這個資料被用于克隆人同源ICAM-4的目的。
基因組系統(tǒng)公司(Genome Systems Inc)用人ICAM-1結(jié)構(gòu)域3引物,即一個設(shè)計與人ICAM-1結(jié)構(gòu)域3互補的正常義引物(H-1/D3 S)和一個設(shè)計與人ICAM-3互補的反義引物(H-1/D3 AS),通過PCR擴增了人P1序列文庫中的片段。這些引物被分別列舉在SEQID NOs22和23。
CCGGGTCCTAGAGGTGGACACGCA(SEQ ID NO22)TGCAGTGTCTCCTGGCTCTGGTTC(SEQ ID NO23)對被稱為1566和1567的兩個克隆進行了鑒定和進一步分析。兩個P1克隆都含有大約75-95kb的基因組DNA插入片段。將克隆用BamHI消化后,用瓊脂糖凝膠電泳分離,再轉(zhuǎn)移印跡到尼龍膜上。在42℃,在低強度(30%甲酰胺)或高強度(60%甲酰胺)下,以放射標記的人ICAM-1,ICAM-3或大鼠ICAM-4探針,進行DNA印跡雜交試驗,雜交液的其它成分如實施例1中所述。低強度雜交組在室溫下用含有0.1%SDS的2×SSPE洗。高強度雜交組在65℃用含有0.1%SDS的0.2×SSPE洗。膜被洗過后,對X-射線膠片曝光3.5小時。
不同的雜交結(jié)果表明,人ICAM-1包含在5.5kb BamHI片段上,而人ICAM-3定位于4.0kb和1.5kb BamHI片段。人ICAM-1和ICAM-R片段被亞克隆進入pBS+,用局部序列分析法證實了它們的相同性。
將在高強度條件下與大鼠ICAM-4雜交的7.0kb BamHI片段進行亞克隆,并通過RsaI限制性消化作進一步切割。鑒定了三個與大鼠ICAM-4雜交的RsaI片段,并測定了它們的序列。根據(jù)它們與大鼠ICAM-4的同源性,顯示這些片段包含有結(jié)構(gòu)域2,3,4,5,以及部分結(jié)構(gòu)域6。
實施例11人ICAM-4cDNA的克隆以對應(yīng)于人ICAM-4結(jié)構(gòu)域2-5(實施例10中所述)的基因組DNA片段用作探針,篩選λgt10人海馬cDNA序列庫(Clontech,PaloAlto,CA)。序列文庫的篩選方案基本上同實施例1所述。
在此序列文庫中發(fā)現(xiàn)的最長的人ICAM-4克隆(18號)僅有992bp(SEQ ID24),大致對應(yīng)于預(yù)測的3kb基因的中間部分。將此來自克隆18(SEQ ID24)的992bp DNA插入片段,用作篩選λZAPII人海馬cDNA序列文庫(Stratagent,La Jolla,CA)的探針。這個序列文庫產(chǎn)生了許多陽性克隆。最長的克隆,34號有2775bp(SEQ ID25)。根據(jù)與全長大鼠ICAM-4的匹配情況,預(yù)測這個克隆在結(jié)構(gòu)域1的5’末端漏失了引導(dǎo)序列和大約30bp。在3’末端漏失了poly A+,但翻譯終止密碼子仍存在。
以對應(yīng)于開始的3個結(jié)構(gòu)域的DNA片段(克隆34號中的核苷酸1到840)作探針,篩選來自人大腦皮層的λgt10 cDNA序列文庫(Clontech,Palo Alto,CA)。鑒定出一個克隆,16-1(SEQ ID26),具有1557bp,并且包含39bp的5’未轉(zhuǎn)錄DNA,一個引導(dǎo)序列和全部5個結(jié)構(gòu)域的序列信息。重疊克隆34號(SEQ ID25)和16-1(SEQ ID26),被用于產(chǎn)生全長人ICAM-4序列(SEQ ID27)的復(fù)合體。
全長的基因長度為2927bp,編碼一個924個氨基酸的蛋白質(zhì)。ICAM-4核苷酸序列被列舉在SEQ ID NO27,其氨基酸序列被列舉在SEQ ID NO28。序列與全長大鼠ICAM-4基因(SEQID11)的匹配性表明,總的DNA序列一致性為82%,在氨基酸水平的一致性為85%。在大鼠和人之間,保存了九個類Ig蛋白質(zhì)細胞外結(jié)構(gòu)域結(jié)構(gòu)。引導(dǎo)序列從氨基酸1延伸到28,結(jié)構(gòu)域1從氨基酸29到117,結(jié)構(gòu)域2從氨基酸118到224,結(jié)構(gòu)域3從氨基酸225到320,結(jié)構(gòu)域4從氨基酸321到405,結(jié)構(gòu)域5從氨基酸406到488,結(jié)構(gòu)域6從氨基酸489到570,結(jié)構(gòu)域7從氨基酸571到663,結(jié)構(gòu)域8從氨基酸664到743,結(jié)構(gòu)域9從氨基酸744到837,跨膜區(qū)從氨基酸838到857,以及細胞質(zhì)尾部從氨基酸858到924。
人ICAM-4(HuICAM-4),除了在遺傳上與ICAM-1和ICAM-R相關(guān)聯(lián)外,還顯示出某些共同的結(jié)構(gòu)特征,可將它們共同分類為一類分子。一個結(jié)構(gòu)域通過HuICAM-4與其它ICAM家族成員的結(jié)構(gòu)域匹配性,可顯示其同源性變異程度。HuICAM-4的結(jié)構(gòu)域1氨基酸序列,與ICAM1,2和3相比,一致性分別為21%,30%和26%。HuICAM-4的結(jié)構(gòu)域3,與ICAMs1和3的相同分別為50%和65%。HuICAM-4的結(jié)構(gòu)域4與ICAM-1和3的一致性分別為54%和64%。HuICAM-4的結(jié)構(gòu)域5-8與ICAM-1和3的5個結(jié)構(gòu)域最為相似,對ICAM-1結(jié)構(gòu)域5其一致性范圍為33-47%,對于ICAM-R結(jié)構(gòu)域5,其一致性范圍為21-31%。HuICAM-4的9個結(jié)構(gòu)域與ICAM家族的其它成員匹配不佳,但與HuICAM-1的結(jié)構(gòu)域3的結(jié)構(gòu)域6相類似(分別有24%和23%相同)。
實施例12人ICAM-4表達的Northern分析從Clontech(Palo Alto,CA)購買了兩種人多組織Northern(MTN)印跡物。將這些含有來自人不同的16種組織的poly A+RNA至少2μg的印跡物在變性甲醛1.2%瓊脂糖凝膠上展開,并轉(zhuǎn)移到尼龍膜上。印跡斑點在42℃,在10ml含有下列成分的溶液中預(yù)雜交3小時5×SSPE,10×Denhardts溶液,50%甲酰胺,2%SDS和100μg/ml變性的鮭魚精DNA。然后再在上述溶液中,在42℃與放射性標記的人ICAM-4探針(18號克隆,SEQ ID24)雜交16小時。第二天,印跡斑點先在室溫下以0.1×SSC/0.1%SDS溶液洗,然后在50℃下洗。在-80℃將印跡斑點對X-射線膠片曝光24小時。分析結(jié)果顯示在如下表1中。
只有包含腦RNA的印跡泳道與ICAM-4探針雜交了,在大約3kb位置顯示出一條單獨的帶。較長時間的曝光(5天)證實,只有腦顯示出可檢出水平的信息。為了確定是否所有的印跡泳道都含有可比較量的類似性質(zhì)的RNA,用相同的印跡斑點與對照β-肌動蛋白探針雜交。從印跡斑點上通過用煮沸的0.1%SDS溶液處理15分鐘,脫去ICAM-4探針,隨后用廠商提供的β-肌動蛋白探針,按同樣的方法進行檢測。除了含量稍有不同,所有印跡泳道都顯示含有高品質(zhì)的RNA。
表1人ICAM-4表達的組織RNA印跡分析探針組織 ICAM-4β-肌動蛋白心臟- +++腦 + ++胎盤- +++肺 - +++肝 - +++骨骼肌 - ++++腎 - +++胰腺- ++脾 - +++胸腺- +++前列腺 - +++睪丸- +++卵巢- +++小腸- +++結(jié)腸- +++外周血白細胞- +++從Clontech購買了另外兩個RNA印跡物,它們含有來自人腦16個不同亞區(qū)的poly A+RNA(如表2所示)。以用于組織分析的類似的方法對印跡物進行探測,結(jié)果顯示在表2。含有RNA的質(zhì)和量,可通過用β肌動蛋白探針對印跡斑點探測來驗證。
所有顯示ICAM-4表達的結(jié)構(gòu)域,都是端腦的一部分,僅丘腦是例外,它被認為是間腦的一部分。海馬和大腦皮層顯示具有最高水平的表達。所有情況下其轉(zhuǎn)錄本大小都相同,為3kb。ICAM-4表達的精細組織分布暗示,啟動子區(qū)可能含有使其范圍產(chǎn)物具有觀測到的進化性立體表達的成分。利用這些資料,總的來說,可以對神經(jīng)基因表達的控制有更深入的了解。
表2人ICAM-4表達的腦細胞類型RNA印跡分析探針腦區(qū)ICAM-4 β-肌動蛋白杏仁核++ +++尾狀核++ +++胼胝體+ +++海馬 ++ +++下丘腦- +++黑質(zhì) - +++丘腦下核 + +++丘腦 + +++小腦 - +++大腦皮質(zhì) +++ +++髓質(zhì) - +++脊髓 - +++枕極 ++ +++額葉 ++ +++顳葉 ++ +++豆狀核++ +++實施例13人ICAM-4/IgG融合蛋白的產(chǎn)生為了生產(chǎn)蛋白質(zhì)用于產(chǎn)生單克隆抗體和用于在粘附測定中鑒定潛在的ICAM-4配體,構(gòu)建了人ICAM-4/IgG1融合蛋白表達質(zhì)粒。制備了二個構(gòu)建體,第一個包含表達HuICAM-4結(jié)構(gòu)域1-3的DNA,第二個包含表達HuICAM-4結(jié)構(gòu)域4-8的DNA。二者都連接于在載體pDCS1中的人IgG1 Fc區(qū),此載體用巨細胞病毒(CMV)的啟動子啟動表達過程,并用來自IgG4的信號序列促進分子分泌。
設(shè)計了用于產(chǎn)生亞克隆必需的DNA片段的PCR引物(如以下SEQID NOs29-32所示)。對于結(jié)構(gòu)域15’末端“正常義”引物(HI4-D1(S)SEQ ID NO29)被設(shè)計成補足了在克隆34號中漏失的結(jié)構(gòu)域1 30個堿基對。引物HI4-D1(S)(SEQ ID NO29)和HI4-D3(AS)(SEQ ID NO30)被用于產(chǎn)生編碼人ICAM-4的結(jié)構(gòu)域1-3的DNA片段,這個片段相應(yīng)于SEQ ID NO1中從核苷酸130到核苷酸996的一個區(qū)。引物HI4-D3(S)(SEQ ID NO31)和HI4-D8(AS)(SEQ ID NO32)被用于產(chǎn)生編碼人ICAM-4的結(jié)構(gòu)域4-8的DNA片段,此片段相應(yīng)于SEQ ID NO30中從核苷酸997到核苷酸2268的一個區(qū)。每個5’引物編碼一個BamHI限制性位點(GGATCC,下面用黑體字所示),每個3’(反義)引物含有一個XhoI位點(CTCGAG,下面用黑體字所示),以便促進對IgG1基因亞克隆5’。所有的寡核苷酸在5’末端都含有隔離物核苷酸(下面加線的)使之能夠進行限制性消化。
HI4-DI(S) (SEQ ID NO29)GTACTTACAGGATCCGCGGTCTCGCAG-GAGCCCTTCTGGGCGGACCTACAGCCTGCGTGGCGTTCHI4-D3(AS) (SEQ ID NO30)ATTTCTCTCGAGGATGGTCACGTTCTCCCGGHI4-D4(S) (SEQ ID NO31)ATTTCTGGATCCTACAGCTTCCCGGCACCACTCHI4-D8(AS) (SEQ ID NO32)ATTTCTCTCGAGTTCCACGCCCACAGTGACGGPCR反應(yīng)在50μl體積內(nèi)進行,用Perkin Elmer提供的含有AmpliTaq酶的緩沖液。加入的引物最后濃度為10μg/ml,含有的4種dNTP濃度為2mM。反應(yīng)連續(xù)進行30個循環(huán)變性(94℃,4分鐘),退火(50℃,2分鐘),及延伸(72℃,1分鐘)。在瓊脂糖凝膠上觀測PCR產(chǎn)物,以每個反應(yīng)的一個等分量產(chǎn)物用于亞克隆進入載體pCRII(Invitrogen,SanDiego,CA)。通過序列分析以便發(fā)現(xiàn)擴增過程中產(chǎn)生的可能錯誤,并確定正確的取向。用BamHI和XhoI對適當(dāng)克隆進行消化,產(chǎn)生的片段用瓊脂糖凝膠電泳分離。將純化的片段連接到被事先用BamHI和XhaI消化處理過的pDCS1載體中,對形成的質(zhì)粒測定序列,以確定正確的取向和讀出結(jié)構(gòu)。
在將表達質(zhì)粒暫時轉(zhuǎn)染進入COS7細胞,并從培養(yǎng)基中分離出分泌的蛋白質(zhì)之后,得到了人ICAM-4結(jié)構(gòu)域1-3和4-8/IgG1融合蛋白。轉(zhuǎn)染操作方法如下將有大約50-60%連生的粘連COS7細胞用CMF-PBS洗,接著,在含有6μl 0.25M氯奎(Sigma,St.Louis,MO)的7.5ml無血清DMEM培養(yǎng)基(Gibco,Gaithersburg,MD)中,使細胞與10-15μg質(zhì)粒DNA相接觸。再加入另外7.5ml含有150μl DEAE右旋糖酐(50mg/ml)(Sigma,St.Louis,MO)的無血清培養(yǎng)基,平皿先培養(yǎng)2-3小時,然后移去培養(yǎng)基,以PBS配制的10%DMSO(Mallinckrodt,McGaw Park,Illinois)代替。培育1分鐘后,移去DMSO溶液,以含有5%FBS的新鮮培養(yǎng)基代替。每個轉(zhuǎn)錄都包括多個培養(yǎng)皿,將表達相同蛋白質(zhì)的細胞培養(yǎng)基合并,用于蛋白質(zhì)分離。
每三天收集培養(yǎng)基一次,共收集3-4次。用0.4-0.8ml Procep A柱(Bioprocessing Ltd,England)純化蛋白質(zhì),柱子先用35mM Tris,150mM NaCl,PH7.5液進行了預(yù)平衡。培養(yǎng)基分二次加樣上柱,流速為每小時小于60個柱體積的容量。用20倍柱體積的Tris/NaCl緩沖液,20倍體積的0.55M二乙醇胺pH8.5液,以及20倍體積的50mM檸檬酸,pH5.0液,各洗柱一次。然后用50mM檸檬酸,pH3.0液洗脫融合蛋白被收集在1ml的洗脫組分中,并將每個組分用1/10體積的1M Tris,pH9.5液中和。以O(shè)D280測定蛋白質(zhì)的濃度,用SDS-PAGE測定蛋白質(zhì)的純度。
發(fā)現(xiàn)來自牛IgG(存在于FBS中)的顯著污染。盡管預(yù)測結(jié)構(gòu)域1-3融合蛋白比結(jié)構(gòu)域4-8融合蛋白小,但二種蛋白都遷移到大約90kD。對此觀測結(jié)果的一種可能的解釋是,較小的結(jié)構(gòu)域1-3融合蛋白與較大的結(jié)構(gòu)域4-8融合蛋白相比,可能被更多地糖基化了。
這種純化的蛋白質(zhì)除了用于產(chǎn)生單克隆抗體外(如下所述),還將在粘附測定法中用于鑒定ICAM-4配體。
實施例14單克隆抗體的制備將在實施例13中所述的純化蛋白質(zhì),用實施例6中所述的免疫方案,用于產(chǎn)生單克隆抗體。
來自2250號小鼠(用HuICAM-4 D1-3/IgG1免疫的)的脾用于172號融合,來自2272號小鼠(用HuICAM-4 D4-8/IgG1免疫的)的脾用于173號融合。融合方案同實施例6所述。用每種HuICAM-4/IgG1融合蛋白,通過ELISA法(基本同實施例6所述)對融合板進行篩選。對僅識別免疫原蛋白的融合孔中的上清液考慮進行克隆。對人海馬切片的免疫細胞化學(xué)實驗被用作第二級篩選法。
每個融合孔中免疫細胞化學(xué)試驗陽性的一個初始克隆,將被進一步克隆。二個克隆的一個在克隆中不能生長,僅保留了一個候選克隆繼續(xù)進行,即克隆173E,它是來自HuICAM-4 D4-8/IgG免疫的小鼠。雜交瘤細胞173E已于1995年6月1日保藏于美國典型培養(yǎng)物保藏中心,12301 Parklawn Drive,Rockville,Maryland 20852,保藏號HB11912。
從用相應(yīng)于結(jié)構(gòu)域1-3的可溶性ICAM-4片段免疫的小鼠得到的另一個融合體,發(fā)現(xiàn)有6個克隆(179A,179B,179D,179H,179I和179K)對HuICAM-4結(jié)構(gòu)域1到3(D1-3)是特異性的。179系列中的所有6個抗體都結(jié)合于齒狀回中的樹突,以及多形細胞層和錐體細胞層的樹突。除了樹突之外,單克隆抗體179A還能使這些結(jié)構(gòu)域的神經(jīng)細胞體結(jié)合染色。
另一些融合體也同樣產(chǎn)生與特殊的ECAM-4區(qū)具有特異性免疫活性的另一些抗體。
實施例15俘獲測定法的建立對來自融合體179的6個單克隆抗體,以各種組合形式測定它們在溶液中俘獲和識別可溶性ICAM-4的能力。為了檢測正常和疾病狀態(tài)下人體液中可溶性ICAM-4的水平,建立了如下所述的測定法。
用抗體179I,以3μg/ml的濃度,在37℃,每孔125μl,包被Immulon4(Dynatech)96孔酶聯(lián)板2小時。吸去抗體溶液,用含有在無鈣,無鎂PBS(CFF-PBS)中配制的5%Teleostean膠原蛋白的封閉液300μl,在室溫下封閉每個孔30分鐘。吸去封閉液,每孔加入在Ommi稀釋劑(CMF-PBS,含1%膠原蛋白和0.05%吐溫20)中稀釋的樣品液100μl,此混合物在35℃溫育30分鐘。用PBST(CMF-PBS,含0.05%吐溫20)洗酶聯(lián)板3次。用NHS-LC-生物素(Pierce),按照廠商提供的方案,將抗體179H在1.5mg/ml下生物素化,作1∶2000稀釋后加入各孔(100μl/孔)。得到的混合液在37℃溫育30分鐘,用PBST洗板3次。對每個孔加入鏈親合素-HRP(Pierce)(100μl,0.25μg/ml),此混合物在37℃溫育30分鐘。用PBST洗板4次,然后加入在緩沖基質(zhì)(含有1M檸檬酸的13.6g/L三水合醋酸鈉,pH調(diào)至5.5,臨用前加入150μl/L 30%H2O2)中1∶100稀釋的四甲基聯(lián)苯胺(Sigma)(以DMSO配制的10mg/ml貯備液)100μl。反應(yīng)在室溫下,在黑暗中進行30分鐘,然后加入50μl/孔15%H2SO4,終止反應(yīng)。在450nm測定光吸收度。
結(jié)果表明,本測定法能夠在低至5-10ng/ml的濃度下檢測可溶性HuICAM-4 D1-3重組蛋白,曲線的線性范圍在10-100ng/ml。未觀察到對HuICAM-4 D4-8的交叉反應(yīng)性,當(dāng)這個蛋白區(qū)以1μg/ml和10μg/ml用此法檢測時未見交叉反應(yīng)。
實施例16對中風(fēng)病人血清中可溶性ICAM-4的測定為了評價在神經(jīng)性疾病和狀態(tài)下ICAM-4的作用,對來自28名患急性中風(fēng)病人的血清和20名年青健康志愿者(未作年齡匹配)的血清,用上述的檢測法進行了測定,以比較可溶性ICAM-4血清濃度的差別。
結(jié)果表明,在健康志愿者的血清中沒有可測定濃度的ICAM-4。但是,28名急性中風(fēng)病人中的20名,血清中含有可測定濃度的ICAM-4。來自陽性中風(fēng)病人的檢測信號表明血清中的濃度相當(dāng)于5-38ng/ml標準品(可溶性ICAM-4 D1-3重組體蛋白)。
實施例17癲癇模型大鼠海馬中的ICAM-4 mRNA含量對大鼠用一種產(chǎn)生激發(fā)性致癲癇動物模型中方法處理[Lothman,et al.Brain Res.36083-91(1985)],然后測定其海馬中表達的大鼠ICAM-4 mRNA含量。在此模型中,對大鼠的海巴通過在腦中該結(jié)構(gòu)域的埋藏電極,給予持續(xù)的驚厥下電刺激,逐漸引起嚴重的行為發(fā)作。激發(fā)過程包括每天給予12次刺激,每隔1天刺激一次,連續(xù)8天。一旦完全被激發(fā)后,一次刺激就能引起與人癲癇類似的行為發(fā)作和組織學(xué)改變。對完全被激發(fā)的大鼠每天給予2次刺激,持續(xù)二周以上,在最后一次刺激的24小時后將動物活殺。取出海馬,切開用于RNA制備。
用鈲鹽/苯酚/氯仿抽取方法[Chomezynski和Sacchi,Anal.Biochem 162156-159(1987)],從每個樣本中制備總RNA。先在變性甲醛瓊脂糖凝膠上分離RNA,然后轉(zhuǎn)移到尼龍膜上,并與放射標記的大鼠ICAM-4和甘油醛-3-磷酸脫氫酶(GAPDH)特異性DNA探針雜交。GAPDH是一個基礎(chǔ)表達基因,通常被用作對照,來確定凝膠泳道間RNA加入量的差異。ICMA-4/GAPDH比率的波動被解釋為ICAM-4表達水平的改變。用磷酸瓊脂對ICAM-4和GAPDH雜交帶進行定量,并測定ICAM-4/GAPDH的比率。
與被激發(fā)的待測組動物(n=5)相比較,未被激發(fā)的對照動物(n=5)中,ICAM-4/GAPDH比率顯著升高,表明由于激發(fā)過程,使ICAM-4被調(diào)低了。但是,應(yīng)該注意到,由于對照組動物沒有受到任何假激發(fā)處理,因此存在這樣一種可能性,即ICAM-4 mRNA含量的調(diào)整是對與激發(fā)有關(guān)的外科處理的反應(yīng)。
實施例18對人ICAM-4上游調(diào)節(jié)DNA的克隆和分析ICAM-4基因的表達在空間和時間上都受到調(diào)控,表達僅局限于腦的最前部或最下面的結(jié)構(gòu)域,即端腦部分。為了試圖鑒定負責(zé)ICMA-4局限性轉(zhuǎn)錄調(diào)控的基因序列,對核苷酸5’區(qū)到人ICAM-4編碼序列進行了檢測。
對一個來自7.0kb基因組BamHI片段(實施例10中所述)的2607個堿基對的BamHI/PstI片段進行了序列測定,發(fā)現(xiàn)在ATG起始密碼子的上游含有1684個核苷酸。此上游區(qū)完整的序列列舉在SEQ IDNO33中。關(guān)于ICAM-4編碼區(qū)的位置,在ATG起始密碼子(在SEQ ID NO33中編號為核苷酸1685-1687的)中的“A”被稱為+1核苷酸,與A+1核苷酸緊鄰的核苷酸5’被稱為-1。這樣,完整的序列被顯示為從核苷酸-1684延伸到核苷酸+3,相應(yīng)于序列表中核苷酸1到核苷酸1687的編號。
根據(jù)此基因組HuICAM-4序列,合成了寡聚核苷酸,用于通過PCR產(chǎn)生上游調(diào)控區(qū)內(nèi)各種長度的DNA分子。列舉在表3中的每個寡聚核苷酸都包含一個隔離區(qū)(以斜體字顯示),約6-10bp,以便能對PCR產(chǎn)物進行酶促消化,每個寡聚核苷酸還包含一個NheI或HindIII,限制性位點(黑體字所示),以及一個特異性雜交引物序列(下面加線的)。寡核苷酸的名字含有指明它在上游調(diào)控區(qū)內(nèi)位置的數(shù)字。在PCR擴增過程中,如表4所示,寡核苷酸被配對,產(chǎn)生含有特異性上游調(diào)控區(qū)的DNA片段。
表3用于擴增HuICAM-4上游區(qū)的PCR引物HI4-19(AS)CAGAACTAAGCTTACAGGAGGCGAGGAGAGCGCGAG(SEQ ID NO34)HI4-114CAACAATGCTAGCCAAGCGCAACTCTGTCTC(SEQ ID NO35)HI4-149CAACAATGCTAGCCTTGGAAACCAAGTTACC(SEQ ID NO36)HI4-206 CAACAATGCTAGCAGGAGCTTAGCGCACGCTCG(SEQ ID NO37)HI4-270 CAACAATGCTAGCCATGCCGGCCTCCACGTAG(SEQ ID NO38)HI4-408CAACAATGCTAGCGTCCAGCTTATTATCATG(SEQ ID NO39)HI4-480 CAACAATGCTAGCCTTAGTCCCCAAATGTATC(SEQ ID NO40)HI4-560 CAACAATGCTAGCGGAGAAGGATCAGTGAG(SEQ ID NO41)HI4-817 CAACAATGCTAGCCTCCACCCACCGAGCAGAAG(SEQ ID NO42)
在每個寡核苷酸內(nèi)產(chǎn)生的限制性位點和隔離,為酶促消化和后續(xù)的將各個PCR產(chǎn)物克隆進入pGL3基本載體(Promega,Madison,WI)的步驟作好了準備,這種載體在緊靠多克隆位點(MCS)的下游含有一個熒光素酶受體基因。被克隆進入此載體MCS區(qū)的啟動子活性,在被轉(zhuǎn)染的細胞系內(nèi),驅(qū)動熒光素酶受體基因的表達,來自被表達的熒光素酶的發(fā)光,可以被測定作為啟動子活性的指標。pGL3基本載體沒有啟動子,因此可用作陰性對照,而含有一個SV 40啟動子的pGL3載體可作為陽性對照。每個表達結(jié)構(gòu)的序列可通過限制性分析的DNA測序來驗證。
用Transfection MBS哺乳動物轉(zhuǎn)染試劑盒(Stratagene,La Jolla,CA),按照廠商提供的方案,將含有表4中所述各種擴增序列的質(zhì)粒轉(zhuǎn)染進入哺乳動物細胞。將每種質(zhì)粒引入二種不同的細胞系,COS 7細胞和NT 2前體細胞(Ntera 2/D1,來自Stratagene)。COS 7細胞是通常使用的,以SV 40轉(zhuǎn)化過的猴類成纖維細胞系,這樣使它們更適合于在以陽性對照pGL3啟動子載體轉(zhuǎn)染的細胞中,驅(qū)動在SV 40啟動子控制下的基因表達。NT 2前體細胞是一個指定的神經(jīng)前體細胞系,雖然它們不表達ICAM-4,但它們可能比表達ICAM-4的細胞類型更具有代表性特征。
表4配對的引物和被擴增的結(jié)構(gòu)域寡聚核苷酸對相應(yīng)的上游調(diào)控區(qū)HI4-19(AS)和HI4-114-19→-114HI4-19(AS)和HI4-149-19→-149HI4-19(AS)和HI4-206-19→-206HI4-19(AS)和HI4-270-19→-270HI4-19(AS)和HI4-408-19→-408HI4-19(AS)和HI4-480-19→-480HI4-19(AS)和HI4-560-19→-560HI4-19(AS)和HI4-817-19→-817
用6孔平底組織培養(yǎng)板(Falcon),每孔接種2.5×105個細胞。每孔用5μg質(zhì)粒DNA轉(zhuǎn)染COS 7細胞和NT 2細胞,每個作平行的雙份。將此細胞在37℃培養(yǎng)48小時,使細胞裂解后,用熒光素酶測定系統(tǒng)(Promega)測定熒光素酶的活性。
綜合在表5中的實驗結(jié)果顯示,在NT 2細胞中,ICAM-4上游調(diào)控區(qū)的-408到-19和-480到-19區(qū),具有高水平的啟動子活性。因為NT 2細胞來自于神經(jīng)元,所以它們可能表達識別ICAM-4啟動子的某些轉(zhuǎn)錄因子,在其它類型的細胞未見這種情況。用含有核苷酸-560到-19的質(zhì)粒轉(zhuǎn)染,在COS細胞轉(zhuǎn)染子中得到了最高水平的啟動子活性。雖然陽性對照pGL3啟動子載體很適合轉(zhuǎn)染COS細胞,但在NT2細胞中都顯示非常低的啟動子活性,這說明有一類細胞特別偏愛某些啟動子序列。
表55’ICAM-4區(qū)啟動子活性上游區(qū) 發(fā)光COS NT2-114至-19 0.003 0.376-149至-19 0.008 0.628-206至-19 0.443 0.622-270至-19 0.056 1.140-408至-19 0.401 7.970-480至-19 0.274 4.630-560至-19 3.227 1.232-817至-19 0.035 4.453pGL3 Promoter Vector29.0700.063pGL3 Basic Vector 0.008 0.014因為正常情況下COS 7或NT2都不表達ICAM-4,所以將用初始培養(yǎng)的海馬神經(jīng)細胞重復(fù)些相同的實驗,這種神經(jīng)細胞確能表達ICAM-4,也必然表達對ICAM-4啟動子活性所需要的轉(zhuǎn)錄機制。通過將在此所述的各個啟動子構(gòu)建體及其它構(gòu)建體,轉(zhuǎn)染到更自然的細胞環(huán)境中,有可能更精確地確定在上游調(diào)控區(qū)是什么分子負責(zé)密切地調(diào)控腦中的ICAM-4基因。
以上闡述的實施例都與本發(fā)明目前優(yōu)選的實施方案有關(guān),對于本領(lǐng)域的技術(shù)人員,預(yù)期將會有許多與之有關(guān)的改進和改變方案。因此,僅在所附的權(quán)利要求中出現(xiàn)的限定,才應(yīng)該屬于本發(fā)明的范圍。
序列表(1)一般資料(i)申請人Gallatin,W.MichaelKilgannon,Patrick D.
(ii)發(fā)明名稱ICAM-4材料和方法(iii)序列數(shù)42(iv)相關(guān)地址(A)收信人Marshall,O’Toole,Gerstein,Murray & Borun(B)街道233 South Wacker Drive,6300 Sears Tower(C)城市Chicago(D)州Illinois(E)國家United States of America(F)郵編60606-6402(v)計算機可讀形式(A)介質(zhì)類型軟盤(B)計算機IBM PC兼容(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件PatentIn Release#1.0,Version#1.25(vi)當(dāng)前申請數(shù)據(jù)(A)申請?zhí)?B)提交日期∶(C)分類(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 07/827,689(B)提交日期27-JAN-1992(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 07/889,724(B)提交日期26-MAY-1992(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 07/894,061(B)提交日期05-JUN-1992(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 08/009,266(B)提交日期22-JAN-1993(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 08/102,852(B)提交日期05-AUG-1993(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 08/245,295(B)提交日期18-MAY-1994(vii)在先申請數(shù)據(jù)(A)申請?zhí)朥S 08/485,604(B)提交日期07-JUN-1995(viii)律師/代理人資料(A)姓名WILLIAMS,JR.JOSEPH A.
(B)注冊號38,659(C)參考/登記號27866/33321(ix)通訊資料(A)電話312-474-6300(B)電傳312-474-0448(C)電報25-3856(2)SEQ ID NO1的資料(i)序列特征(A)長度2988個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置61..2814(xi)序列描述SEQ ID NO1AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA 60ATG CCG GGG CCT TCA CCA GGG CTG CGC CGA ACG CTC CTC GGC CTC TGG 108Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15GCT GCC CTG GGC CTG GGG ATC CTA GGC ATC TCA GCG GTC GCG CTA GAA 156Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30CCT TTC TGG GCG GAC CTT CAG CCC CGC GTG GCG CTC GTG GAG CGC GGG 204Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45GGC TCG CTG TGG CTC AAC TGC AGC ACT AAC TGT CCG AGG CCG GAG CGC 252Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60GGT GGC CTG GAG ACC TCG CTA CGC CGA AAC GGG ACC CAG AGG GGT CTG 300Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80CGC TGG CTG GCT CGA CAG CTG GTG GAC ATC CGA GAG CCT GAA ACC CAG 348Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95CCG GTC TGC TTC TTC CGC TGC GCG CGC CGC ACA CTC CAA GCG CGT GGG 396Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110CTC ATC CGA ACT TTC CAG CGA CCG GAT CGG GTA GAG CTA GTG CCT CTG 444Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125CCT CCT TGG CAG CCT GTA GGT GAG AAC TTC ACC TTG AGC TGC AGG GTC 492Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140CCG GGG GCA GGA CCC CGA GCG AGC CTC ACA TTG ACC TTG CTG CGA GGC 540Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160GGC CAG GAG CTG ATT CGC CGA AGT TTC GTA GGC GAG CCA CCC CGA GCT 588Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175CGG GGT GCG ATG CTC ACC GCC ACG GTC CTG GCG CGC AGA GAG GAT CAC 636Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190AGG GCC AAT TTC TCA TGC CTC GCG GAG CTT GAC CTG CGG CCA CAC GGC 684Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205TTG GGA CTG TTT GCA AAC AGC TCA GCC CCC AGA CAG CTC CGC ACG TTT 732Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220GCC ATG CCT CCA CTT TCC CCG AGC CTT ATT GCC CCA CGA TTC TTA GAA 780Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240GTG GGC TCA GAA AGG CCG GTG ACT TGC ACT TTG GAT GGA CTG TTT CCT 828Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255GCC CCA GAA GCC GGG GTT TAC CTC TCT CTG GGA GAT CAG AGG CTT CAT 876Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270CCT AAT GTG ACC CTC GAC GGG GAG AGC CTT GTG GCC ACT GCC ACA GCT 924Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285ACA GCA AGT GAA GAA CAG GAA GGC ACC AAA CAG CTG ATG TGC ATC GTG 972Thr Ala Ser Glu Glu Gln Glu Gly Thr Lys Gln Leu Met Cys Ile Val290 295 300ACC CTC GGG GGC GAA AGC AGG GAG ACC CAG GAA AAC CTG ACT GTC TAC 1020Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320AGC TTC CCG GCT CCT CTT CTG ACT TTA AGT GAG CCA GAA GCC CCC GAG 1068Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335GGA AAG ATG GTG ACC GTA AGC TGC TGG GCA GGG GCC CGA GCC CTT GTC 1116Gly Lys Met Val Thr Val Ser Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350ACC TTG GAG GGA ATT CCA GCT GCG GTC CTT GGG CAG CCC GCT GAG CTC 1164Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365CAG TTA AAT GTC ACA AAG AAT GAC GAC AAG CGG GGC TTC TTC TGC GAC 1212Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Phe Phe Cys Asp370 375 380GCT GCC CTC GAT GTG GAC GGG GAA ACT CTG AGA AAG AAC CAG AGC TCT 1260Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400GAG CTT CGT GTT CTG TAC GCA CCT CGG CTG GAT GAC TTG GAC TGT CCC 1308Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415AGG AGC TGG ACG TGG CCA GAG GGT CCA GAG CAG ACC CTC CAC TGC GAG 1356Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430GCC CGT GGA AAC CCT GAG CCC TCC GTG CAC TGT GCA AGG CCT GAC GGT 1404Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445GGG GCG GTG CTA GCG CTG GGC CTG TTG GGT CCA GTG ACC CGT GCC CTC 1452Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460GCG GGC ACT TAC CGA TGT ACA GCA ATC AAT GGG CAA GGC CAG GCG GTC 100Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480AAG GAT GTG ACC CTG ACT GTG GAA TAT GCC CCA GCG CTG GAC AGT GTA 1548Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495GGC TGC CCA GAA CGT ATT ACT TGG CTG GAG GGG ACA GAG GCA TCG CTT 1596Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510AGC TGT GTG GCA CAC GGG GTC CCA CCA CCT AGC GTG AGC TGT GTG CGC 1644Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525TCT GGA AAG GAG GAA GTC ATG GAA GGG CCC CTG CGT GTG GCC CGG GAG 1692Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540CAC GCT GGC ACT TAC CGA TGC GAA GCC ATC AAC GCC AGG GGA TCA GCG 1740His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560GCC AAA AAT GTG GCT GTC ACG GTG GAA TAT GGT CCC AGT TTT GAG GAG 1788Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575TTG GGC TGC CCC AGC AAC TGG ACT TGG GTA GAA GGA TCT GGA AAA CTG 1836Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590TTT TCC TGT GAA GTT GAT GGG AAG CCG GAA CCA CGC GTG GAG TGC GTG 1884Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605GGC TCG GAG GGT GCA AGC GAA GGG GTA GTG TTG CCC CTG GTG TCC TCG 1932Gly Ser Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620AAC TCT GGT TCC AGA AAC TCT ATG ACT CCT GGT AAC CTG TCA CCG GGT 1980Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640ATT TAC CTC TGC AAC GCC ACC AAC CGG CAT GGC TCC ACA GTC AAA ACA 2028Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655GTC GTC GTG AGC GCG GAA TCA CCG CCA CAG ATG GAT GAA TCC AGT TGC 2076Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Ser Cys660 665 670CCG AGT CAC CAG ACA TGG CTG GAA GGA GCC GAG GCT ACT GCG CTG GCC 2124Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685TGC AGT GCC AGA GGC CGC CCC TCT CCA CGC GTG CGC TGT TCC AGG GAA 2172Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Ser Arg Glu690 695 700GGT GCA GCC AGG CTG GAG AGG CTA CAG GTG TCC CGA GAG GAT GCG GGG 2220Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710 715 720ACC TAC CTG TGT GTG GCT ACT AAC GCG CAT GGC ACG GAT TCA CGG ACC 2268Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735GTC ACT GTG GGT GTG GAA TAC CGG CCT GTG GTG GCT GAG CTG GCA GCC 2316Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750TCG CCC CCA AGC GTG CGG CCT GGC GGA AAC TTC ACT CTG ACC TGC CGT 2364Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765GCA GAG GCC TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG GGA 2412Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780GCT CTC AAC CTC GGT CTC TCC AGC AAC AAC AGC ACG CTG AGC GTG GCG 2460Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800GGT GCC ATG GGC AGC CAT GGT GGC GAG TAT GAG TGC GCA GCC ACC AAT 2508Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815GCG CAT GGG CGC CAC GCA CGG CGC ATC ACG GTG CGC GTG GCC GGT CCA 2556Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830TGG CTG TGG GTC GCT GTG GGC GGT GCG GCA GGG GGC GCG GCG CTG CTG 2604Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu835 840 845GCC GCA GGG GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCT TGC AAG 2652Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860AAG GGA GAG TAC AAC GTC CAG GAG GCT GAG AGC TCA GGC GAG GCG GTG 2700Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val865 870 875 880TGT CTC AAT GGC GCG GGC GGG ACA CCG GGT GCA GAA GGC GGA GCA GAG 2748Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895ACC CCC GGC ACT GCC GAG TCA CCT GCA GAT GGC GAG GTT TTC GCC ATC 2796Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910CAG CTG ACA TCT TCC TGAGCCTGTA TCCAGCTCCC CCAGGGGCCT CGAAAGCACA 2851Gln Leu Thr Ser Ser915GGGGTGGACG TATGTATTGT TCACTCTCTA TTTATTCAAC TCCAGGGGCG TCGTCCCCGT 2911TTTCTACCCA TTCCCTTAAT AAAGTTTTTA TAGGAGAAAA AAAAAAAAAA AAAAAAAAAA 2971AAAAAAAAAA AAAAAAA2988(2)SEQ ID NO2的資料(i)序列特征(A)長度917個氨基酸(B)類型氨基酸(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO2Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285Thr Ala Ser Glu Glu Gln Glu Gly Thr Lys Gln Leu Met Cys Ile Val290 295 300Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335Gly Lys Met Val Thr Val Ser Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Phe Phe Cys Asp370 375 380Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605Gly Ser Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Ser Cys660 665 670Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Ser Arg Glu690 695 700Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710 715 720Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu835 840 845Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val865 870 875 880Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910Gln Leu Thr Ser Ser915(2)SEQ ID NO3的資料(i)序列特征(A)長度315個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(基因組)(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置1..315(xi)序列描述SEQ ID NO3CCG GAT CGG GTA GAG CTA GTG CCT CTG CCT CCT TGG CAG CCT GTA GGT48Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly1 5 10 15GAG AAC TTC ACC TTG AGC TGC AGG GTC CCG GGG GCA GGA CCC CGA GCG96Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30AGC CTC ACA TTG ACC TTG CTG CGA GGC GGA CAG GAG CTG ATT CGC CGA 144Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45AGT TTC GTA GGC GAG CCA CCC CGA GCT CGG TGT GCG ATG CTC ACC GCC 192Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60ACG GTC CTG GCG CGC AGA GAG GAT CAC AGG GAC AAT TTC TCA TGC CTC 240Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80GCG GAG CTT GAC CTG CGG ACA CAC GGC TTG GGA CTG TTT GCA AAC AGC 288Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser85 90 95TCA GCC CCC AGA CAG CTC CGC ACG TTT 315Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105(2)SEQ ID NO4的資料(i)序列特征(A)長度1781個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置16..1659(xi)序列描述SEQ ID NO4CAGCTCTCTG TCAGA ATG GCC ACC ATG GTA CCA TCC GTG TTG TGG CCC AGG 51Met Ala Thr Met Val Pro Ser Val Leu Trp Pro Arg1 5 10GCC TGC TGG ACT CTG CTG GTC TGC TGT CTG CTG ACC CCA GGT GTC CAG99Ala Cys Trp Thr Leu Leu Val Cys Cys Leu Leu Thr Pro Gly Val Gln15 20 25GGG CAG GAG TTC CTT TTG CGG GTG GAG CCC CAG AAC CCT GTG CTC TCT 147Gly Gln Glu Phe Leu Leu Arg Val Glu Pro Gln Asn Pro Val Leu Ser30 35 40GCT GGA GGG TCC CTG TTT GTG AAC TGC AGT ACT GAT TGT CCC AGC TCT 195Ala Gly Gly Ser Leu Phe Val Asn Cys Ser Thr Asp Cys Pro Ser Ser45 50 55 60GAG AAA ATC GCC TTG GAG ACG TCC CTA TCA AAG GAG CTG GTG GCC AGT 243Glu Lys Ile Ala Leu Glu Thr Ser Leu Ser Lys Glu Leu Val Ala Ser65 70 75GGC ATG GGC TGG GCA GCC TTC AAT CTC AGC AAC GTG ACT GGC AAC AGT 291Gly Met Gly Trp Ala Ala Phe Asn Leu Ser Asn Val Thr Gly Asn Ser80 85 90CGG ATC CTC TGC TCA GTG TAC TGC AAT GGC TCC CAG ATA ACA GGC TCC 339Arg Ile Leu Cys Ser Val Tyr Cys Asn Gly Ser Gln Ile Thr Gly Ser95 100 105TCT AAC ATC ACC GTG TAC GGG CTC CCG GAG CGT GTG GAG CTG GCA CCC 387Ser Asn Ile Thr Val Tyr Gly Leu Pro Glu Arg Val Glu Leu Ala Pro110 115 120CTG CCT CCT TGG CAG CCG GTG GGC CAG AAC TTC ACC CTG CGC TGC CAA 435Leu Pro Pro Trp Gln Pro Val Gly Gln Asn Phe Thr Leu Arg Cys Gln125 130 135 140GTG GAG GGT GGG TCG CCC CGG ACC AGC CTC ACG GTG GTG CTG CTT CGC 483Val Glu Gly Gly Ser Pro Arg Thr Ser Leu Thr Val Val Leu Leu Arg145 150 155TGG GAG GAG GAG CTG AGC CGG CAG CCC GCA GTG GAG GAG CCA GCG GAG 531Trp Glu Glu Glu Leu Ser Arg Gln Pro Ala Val Glu Glu Pro Ala Glu160 165 170GTC ACT GCC ACT GTG CTG GCC AGC AGA GAC GAC CAC GGA GCC CCT TTC 579Val Thr Ala Thr Val Leu Ala Ser Arg Asp Asp His Gly Ala Pro Phe175 180 185TCA TGC CGC ACA GAA CTG GAC ATG CAG CCC CAG GGG CTG GGA CTG TTC 627Ser Cys Arg Thr Glu Leu Asp Met Gln Pro Gln Gly Leu Gly Leu Phe190 195 200GTG AAC ACC TCA GCC CCC CGC CAG CTC CGA ACC TTT GTC CTG CCC GTG 675Val Asn Thr Ser Ala Pro Arg Gln Leu Arg Thr Phe Val Leu Pro Val205 210 215 220ACC CCC CCG CGC CTC GTG GCC CCC CGG TTC TTG GAG GTG GAA ACG TCG 723Thr Pro Pro Arg Leu Val Ala Pro Arg Phe Leu Glu Val Glu Thr Ser225 230 235TGG CCG GTG GAC TGC ACC CTA GAC GGG CTT TTT CCA GCC TCA GAG GCC 771Trp Pro Val Asp Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala240 245 250CAG GTC TAC CTG GCG CTG GGG GAC CAG ATG CTG AAT GCG ACA GTC ATG 819Gln Val Tyr Leu Ala Leu Gly Asp Gln Met Leu Asn Ala Thr Val Met255 260 265AAC CAC GGG GAC ACG CTA ACG GCC ACA GCC ACA GCC ACG GCG CGC GCG 867Asn His Gly Asp Thr Leu Thr Ala Thr Ala Thr Ala Thr Ala Arg Ala270 275 280GAT CAG GAG GGT GCC CGG GAG ATC GTC TGC AAC GTG ACC CTA GGG GGC 915Asp Gln Glu Gly Ala Arg Glu Ile Val Cys Asn Val Thr Leu Gly Gly285 290 295 300GAG AGA CGG GAG GCC CGG GAG AAC TTG ACG GTC TTT AGC TTC CTA GGA 963Glu Arg Arg Glu Ala Arg Glu Asn Leu Thr Val Phe Ser Phe Leu Gly305 310 315CCC ATT GTG AAC CTC AGC GAG CCC ACC GCC CAT GAG GGG TCC ACA GTG 1011Pro Ile Val Asn Leu Ser Glu Pro Thr Ala His Glu Gly Ser Thr Val320 325 330ACC GTG AGT TGC ATG GCT GGG GCT CGA GTC CAG GTC ACG CTG GAC GGA 1059Thr Val Ser Cys Met Ala Gly Ala Arg Val Gln Val Thr Leu Asp Gly335 340 345GTT CCG GCC GCG GCC CCG GGG CAG ACA GCT CAA CTT CAG CTA AAT GCT 1107Val Pro Ala Ala Ala Pro Gly Gln Thr Ala Gln Leu Gln Leu Asn Ala350 355 360ACC GAG AGT GAC GAC GGA CGC AGC TTC TTC TGC AGT GCC ACT CTC GAG 1155Thr Glu Ser Asp Asp Gly Arg Ser Phe Phe Cys Ser Ala Thr Leu Glu365 370 375 380GTG GAC GGC GAG TTC TTG CAC AGG AAC AGT AGC GTC CAG CTG CGA GTC 1203Val Asp Gly Glu Phe Leu His Arg Asn Ser Ser Val Gln Leu Arg Val385 390 395CTG TAT GGT CCC AAA ATT GAC CGA GCC ACA TGC CCC CAG CAC TTG AAA 1251Leu Tyr Gly Pro Lys Ile Asp Arg Ala Thr Cys Pro Gln His Leu Lys400 405 410TGG AAA GAT AAA ACG AGA CAC GTC CTG CAG TGC CAA GCC AGG GGC AAC 1299Trp Lys Asp Lys Thr Arg His Val Leu Gln Cys Gln Ala Arg Gly Asn415 420 425CCG TAC CCC GAG CTG CGG TGT TTG AAG GAA GGC TCC AGC CGG GAG GTG 1347Pro Tyr Pro Glu Leu Arg Cys Leu Lys Glu Gly Ser Ser Arg Glu Val430 435 440CCG GTG GGG ATC CCG TTC TTC GTC AAC GTA ACA CAT AAT GGT ACT TAT 1395Pro Val Gly Ile Pro Phe Phe Val Asn Val Thr His Asn Gly Thr Tyr445 450 455 460CAG TGC CAA GCG TCC AGC TCA CGA GGC AAA TAC ACC CTG GTC GTG GTG 1443Gln Cys Gln Ala Ser Ser Ser Arg Gly Lys Tyr Thr Leu Val Val Val465 470 475ATG GAC ATT GAG GCT GGG AGC TCC CAC TTT GTC CCC GTC TTC GTG GCG 1491Met Asp Ile Glu Ala Gly Ser Ser His Phe Val Pro Val Phe Val Ala480 485 490GTG TTA CTG ACC CTG GGC GTG GTG ACT ATC GTA CTG GCC TTA ATG TAC 1539Val Leu Leu Thr Leu Gly Val Val Thr Ile Val Leu Ala Leu Met Tyr495 500 505GTC TTC AGG GAG CAC CAA CGG AGC GGC AGT TAC CAT GTT AGG GAG GAG 1587Val Phe Arg Glu His Gln Arg Ser Gly Ser Tyr His Val Arg Glu Glu510 515 520AGC ACC TAT CTG CCC CTC ACG TCT ATG CAG CCG ACA GAA GCA ATG GGG 1635Ser Thr Tyr Leu Pro Leu Thr Ser Met Gln Pro Thr Glu Ala Met Gly525 530 535 540GAA GAA CCG TCC AGA GCT GAG TGACGCTGGG ATCCGGGATC AAAGTTGGCG 1686Glu Glu Pro Ser Arg Ala Glu545GGGGCTTGGC TGTGCCCTCA GATTCCGCAC CAATAAAGCC TTCAAACTCC CAAAAAAAAA1746AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 1781(2)SEQ ID NO5的資料(i)序列特征(A)長度4900個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO5CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA 60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG 120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC 180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA 240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN 300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA 360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT 420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC 480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA 540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTTGCCCC AAGCCTCTGT GTCTCTCCCC 600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC 660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT 720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCCTCTAATA GCGCGTCAGT 780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG 840TCCTTATGGA CACCCCTGGT TGGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC 900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT 960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG1080GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG1200TGAGTTCAGG GTGGGCACNC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC1260CGCCCTCTGA TCCTCCTGCT TGTTCTGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC1440ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC 1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC 1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA 1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT 1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC 1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN 1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT 1860AGCTTAAGTA CTTTCTCCTG TGAGCTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA 1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT 1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT 2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG 2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT 2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC 2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT 2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG 2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA 2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA 2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT 2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG 2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG 2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT 2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA 2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAA 2820GGACCCTCTT ACCGGCCCCA TCTTTAACCT TATCGTATCC CCTCTGCCTC ATGCCCGCAG 2880ACGCACCTCG GCTGGATGAC TGGGACTGTC CCAGGAGCTG GACGTGGCCA GAGGGTCCAG 2940AGCAGACCCT CCACTGCGAG GCCCGTGGAA ACCCTGAGCC CTCCGTGCAC TGTGCAAGGC 3000CTGACGGTGG GGCGGTGCTA GCGCTGGGCC TGTTGGGTCC AGTGACCCGT GCCCTCGCGG 3060GCACTTACCG ATGTACAGCA ATCAATGGGC AAGGCCAGGC GGTCAAGGAT GTGACCCTGA 3120CTGTGGAATG TGAGTAGGGG GAGGTGGGCA TGCTTATCCC TTTAAGGTCA CGGAGTGTAC 3180TGGGAGACTG GCTATACGGA AAGGAAAGAA GCCTAGGTTC AGCAGGGATT GGGAAAACAC 3240TGAAGGAAAG TGGTGTGGTG TTTACAAACT TAACGGTGGT AACTGGGCAC GGTCTGGCAA 3300AAACAGACAG CCAAGAGAGT GTGCCTGGGA AGCTGCAATG GGGGCTTTGT GGGAATTGGT 3360CAACAGCACC CTGAGATCTC AGGAAAGGGG CCTGAAGTTA TCTCCAGAAC CCATGTGAAG 3420GCAGGAAGAG AGAACGCCCA CCTTTTCCTG CTCCCCCCAA CCCCCCCCCA CATATCACAC3480GGAGTATATA AATAAATAAA ATGGCTCCTG CCGGAGGGAG TGAGAAGCTG TCTCCTGCAG3540GCTCAGAGCA GTGGTAGTGC ATGCCTTTAA TCCCAGCACT CGGTAGGCAA AGGCAGGCAG3600ATCTCTGTGA ATGTGGGGCC AGCCTGGTCT GTACAGAGAA ATCCTGTCTC AAAACAAACC3660AGCAAAGAAA CAAAACCAAA ATCAATTCCA GATGCCCCAG CGCTGGACAG TGTAGGCTGC3720CCANGACGTA TTACTTGNCT GGAGGGGACA GAGGCATCGC TTAGCTGTGT GGCACACGGG3780GTCCCACCAC CTAGCGTGAG CTGTGTGCGC TCTGGAAAGG AGGAAGTCAT GGAAGGGCCC3840CTGCGTGTGG CCCGGGAGCA CGCTGGCACT TACCGATGCG AAGCCATCAA CGCCAGGGGA3900TCAGCGGNCA AAAATGTGGC TGTCACGGTG GAATGTGAGT AGGGGTGGCT ACGGAAATGT3960CCACACCTGC GTCCTCTGTC CTCAGTGTGA ACTCCTATTT CCCTGCTTCC TAGATGGTCC4020CAGTTNTGAG GAGTTGGGCT GCCCCAGCAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT4080GTTTTCCTGT GAAGTTGATG GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG4140TGCAAGCGAA GGGGTAGTGT TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT4200GACTCCTGGT AACCTGTCAC CGGGTATTTA CCTCTGCAAC GCCACCAACC GGCATGGCTC4260CACAGTCAAA ACAGTCGTCG TGAGCGCGGA ATGTGAGCAG GGGCCCAGGT GGGCGGAGAG4320TACCGGGTGT CCCAGGATCT TTTCTTTCCC TGATGCCCCT CCTTATGGTG GCTGATCTGC4380AGCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGC TGGAAGGAGC4440CGAGGCTACT GCGCTGGCCT GCAGTGACAG GGGNCGCCCC TCTCCACGCG TGCGCTGTTC4500CAGGGAAGGT GCAGCCAGGC TGGAGAGGCT ACAGGTGTCC CGAGAGGATG CGGGGACCTA4560CCTGTGTGTG GCTACCAACG CGCATGGCAC GGATTCACGG ACCGTCACTG TGGGTGTGGA4620ATGTGAGTGA GGACAGCGCT GAATGAAGAC GACTCAGACC GCCAGAAAAG TGCCTTGAGG4680CCTGGGATGT ATGATCCAGT GGGTAGAGTG CTCAATTAGC ACTCACTAAA ATGTATATTC4740TATTCCTAAT ACTCTTTAAT TTTANCCTTT GGGAGGCAGA GACAGGCAGA TCTCTGTTCC4800GGGATAACCT GCTCTCTGTC TAGGACAGCT TGGTCTACAG AGGGGNTACA GGCCCCCCCT4860CCCAAGATTG NATAGCAACC CTCTGGCTCC CTGTCTCTCT 4900(2)SEQ ID NO6的資料(i)序列特征(A)長度1295個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO6NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG 60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC 120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT 180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC 240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GATTGTTTGC AAACAGCTCA 300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCATTTT CCCCGAGCCT TATTGCCCCA 360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT 420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC 480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC 540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC 600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG 660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA 720ATTCCAAGGA CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG 780CCCGCAGACG CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG 840GGTCCAGAGC AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT 900GCAAGGCCTG ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC 960CTCGCGGGCA CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG1020ACCCTGACTG TGGAATATGC CCCAGCGCTG GACAGTGTAG GCTGCCCAGA ACGTATTACT1080TGGCTGGAGG GGACAGAGGC ATCGCTTAGC TGTGTGGCAC ACGGGGTCCC ACCACCTAGC1140GTGAGCTGTG TGCGCTCTGG AAAGGAGGAA GTCATGGAAG GGCCCCTGCG TTTTGGCCGG1200GAGCACGCTG GCACTTACCG ATGCGAAGCC ATCAACGCCA GGGGATCAGC GGCCAAAAAT1260GTGGCTGTCA CGGTGGAATA TGGTCCCCGG AATTC 1295(2)SEQ ID NO7的資料(i)序列特征(A)長度2214個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO7CGAATCTTGA GTGGGATGCG GGACTCCCGT GCTATTTCTT GGCGGAGGTC TTTCCTGGTC 60CTTATGGACA CCCCTGGTTT GGGATATGGG GGCCGCTAAG ATTTCAGAGA TGGGGTCCCT 120AGGCTGAGCC CGCGTTTTCC CGGGCAGCGG TCGCGCTAGA ACCTTTCTGG GCGGACCTTC 180AGCCCCGCGT GGCGCTCGTG GAGCGCGGGG GCTCGCTGTG GCTCAACTGC AGCACTAACT 240GTCCGAGGCC GGAGCGCGGT GGYCTGGAGA CCTCGCTACG CCGAAACGGG ACCCAGAGGG 300GTCTGCGCTG GCTGGCTCGA CAGMTGGTGG ACATCCGAGA GCCTGAAACC CAGTCGGTCT 360GCTTCTTCCG CTGGGCGCGC CGCACACTCC AAGNGAGTGG GCTCATCCGA ACTTTCCAGC 420GACCGGATCG GGTAGAGCTA GTGCCTCTGN CTCCTTGGCA GCCTGTAGGT GAGAACTTCA 480CCTTGAGCTG CAGGGTCCCG GGGGCAGGAC CCCGAGCGAG CCTCACATTG ACCTTGCTGC 540GAGGCGGCCA GGAGCTGATT CGCCGAAGTT TCGTAGGCGA GCCACCCCGA GCTCGGGGTG 600CGATGCTCAC CGCCACGGTC CTGGCGCGCA GAGAGGATCA CAGGGCCAAT TTCTCATGCC 660TCGCGGAGCT TGACCTGCGG ACACACGGCT TGGGACTGTT TGCAAACAGC TCAGCCCCCA 720GACAGCTCCG CACGTTTGGC ATGCCTCCAC TTTCCCCGAG CCTTATTGNC CCACGATTCT 780TAGAAGTGGG CTCAGAAAGG CCGGTGACTT GCACTTTGGA TGGACTGTTT CCTGCCCCAG 840AAGCCGGGGT TTACCTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG ACCCTCGACG 900GGGAGAGCCT TGTGGCCACT GNCACAGMTA CAGCAAGTGA AGAACAGGAA GGCACCAAAC 960AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA AACCTGACTG 1020TCTACAGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA 1080TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG 1140CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC 1200GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA 1260GCTCTGAGCT TCGTGTTCTG TACGCACCTC GGCTGGATGA CTTGGACTGT CCCAGGAGCT 1320GGACGTGGCC AGAGGGTCCA GAGCAGACCC TCCACTGCGA GGCCCGTGGA AACCCTGAGC 1380CCTCCGTGCA CTGTGCAAGG CCTGACGGTG GGGCGGTGCT AGCGCTGGGC CTGTTGGGTC 1440CAGTAGCCCG TGCCCTCGCG GGAACTTACC GATGTACAGC AATCAATGGG CAAGGCCAGG 1500CGGTCAAGGA TGTGACCCTG ACTGTGGAAT ATGCCCCAGC GCTGGACAGT GTAGGCTGCC 1560CAGAACGTAT TACTTGGCTG GAGGGGACAG AGGCATCGCT TAGCTGTGTG GCACACGGGG 1620TCCCACCACC TAGCGTGAGC TGTGTGCGCT CTGGAAAGGA GGAAGTCATG GAAGGGCCCC 1680TGCGTGTGGC CCGGGAGCAC GCTGGCACTT ACCGATGCGA AGCCATCAAC GNCAGGGGAT 1740CAGCGGWCAA AAATGTGGCT GTCACGGTGG AATATGGTCC CAGTTTGGAG GAGTTGGGCT 1800GCCCCAGYAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT GTTTTCCTGT GAAGTTGATG 1860GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG TGCAAGCGAA GGGGTAGTGT 1920TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT GACTCCTGGT AACCTGTCAC1980CGGGTATTTA CCTCTGCAAC GCCACCAACC GGMATGGNTC CACAGTCAAA ACAGTCGTCG2040TGAGCGCGGA ATCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGN2100TGGAAGGAGC CGAGGNTACT GCGCTGGCCT GCAGTGCCAG AGGNCGCCCC TCTCCACGCG2160TGCGCTGTTC CAGGGAAGGT GCAGMCAGGC TGGAGAGGNT ACAGGTGTCC CGAG 2214(2)SEQ ID NO8的資料(i)序列特征(A)長度5077個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO8CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG 120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC 180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA 240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN 300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA 360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT 420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC 480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA 540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTGCCCCC AAGCCTCTGT GTCTCTCCCC 600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC 660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT 720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCCTCTAATA GCGCGTCAGT 780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG 840TCCTTATGGA CACCCCTGGT TTGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC 900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT 960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA 1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG 1080GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT 1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG 1200TGAGTTCAGG GTGGGCACNC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC 1260CGCCCTCTGA TCCTCCTGCT TGTTCTGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG 1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT 1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC 1440ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC 1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC 1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA 1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT 1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC 1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN 1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT 1860AGCTTAAGTA CTTTCTCCTG TGAGTTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA 1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT 1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT 2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG 2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT 2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC 2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT 2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG 2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA 2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA 2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT 2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG 2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG 2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT 2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA 2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG 2820CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC 2880GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA 2940GCTCTGAGCT TCGTGTTCTG TGTGAGTGGA TGTTCACTTT ATCTCTGTGA ATTCCAAGGA 3000CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG CCCGCAGACG 3060CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG GGTCCAGAGC 3120AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT GCAAGGCCTG 3180ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC CTCGCGGGCA 3240CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG ACCCTGACTG 3300TGGAATGTGA GTAGGGGGAG GTGGGCATGC TTATCCCTTT AAGGTCACGG AGTGTACTGG 3360GAGACTGGCT ATACGGAAAG GAAAGAAGCC TAGGTTCAGC AGGGATTGGG AAAACACTGA 3420AGGAAAGTGG TGTGGTGTTT ACAAACTTAA CGGTGGTAAC TGGGCACGGT CTGGCAAAAA 3480CAGACAGCCA AGAGAGTGTG CCTGGGAAGC TGCAATGGGG GCTTTGTGGG AATTGGTCAA 3540CAGCACCCTG AGATCTCAGG AAAGGGGCCT GAAGTTATCT CCAGAACCCA TGTGAAGGCA 3600GGAAGAGAGA ACGCCCACCT TTTCCTGCTC CCCCCAACCC CCCCCCACAT ATCACACGGA 3660GTATATAAAT AAATAAAATG GCTCCTGCCG GAGGGAGTGA GAAGCTGTCT CCTGCAGGCT 3720CAGAGCAGTG GTAGTGCATG CCTTTAATCC CAGCACTCGG TAGGCAAAGG CAGGCAGATC 3780TCTGTGAATG TGGGGCCAGC CTGGTCTGTA CAGAGAAATC CTGTCTCAAA ACAAACCAGC 3840AAAGAAACAA AACCAAAATC AATTCCAGAT GCCCCAGCGC TGGACAGTGT AGGCTGCCCA 3900NGACGTATTA CTTGNCTGGA GGGGACAGAG GCATCGCTTA GCTGTGTGGC ACACGGGGTC 3960CCACCACCTA GCGTGAGCTG TGTGCGCTCT GGAAAGGAGG AAGTCATGGA AGGGCCCCTG 4020CGTGTGGCCC GGGAGCACGC TGGCACTTAC CGATGCGAAG CCATCAACGC CAGGGGATCA 4080GCGGNCAAAA ATGTGGCTGT CACGGTGGAA TGTGAGTAGG GGTGGCTACG GAAATGTCCA 4140CACCTGCGTC CTCTGTCCTC AGTGTGAACT CCTATTTCCC TGCTTCCTAG ATGGTCCCAG 4200TTNTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA GAAGGATCTG GAAAACTGTT 4260TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG TGCGTGGGCT CGGAGGGTGC 4320AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT GGTTCCAGAA ACTCTATGAC 4380TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC ACCAACCGGC ATGGCTCCAC 4440AGTCAAAACA GTCGTCGTGA GCGCGGAATG TGAGCAGGGG CCCAGGTGGG CGGAGAGTAC 4500CGGGTGTCCC AGGATCTTTT CTTTCCCTGA TGCCCCTCCT TATGGTGGCT GATCTGCAGC 4560ACCGCCACAG ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA 4620GGCTACTGCG CTGGCCTGCA GTGACAGGGG NCGCCCCTCT CCACGCGTGC GCTGTTCCAG 4680GGAAGGTGCA GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT 4740GTGTGTGGCT ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATG 4800TGAGTGAGGA CAGCGCTGAA TGAAGACGAC TCAGACCGCC AGAAAAGTGC CTTGAGGCCT 4860GGGATGTATG ATCCAGTGGG TAGAGTGCTC AATTAGCACT CACTAAAATG TATATTCTAT 4920TCCTAATACT CTTTAATTTT ANCCTTTGGG AGGCAGAGAC AGGCAGATCT CTGTTCCGGG 4980ATAACCTGCT CTCTGTCTAG GACAGCTTGG TCTACAGAGG GGNTACAGGC CCCCCCTCCC 5040AAGATTGNAT AGCAACCCTC TGGCTCCCTG TCTCTCT 5077(2)SEQ ID NO9的資料(i)序列特征(A)長度1472個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO9NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG 60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC 120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT 180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC 240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GACTGTTTGC AAACAGCTCA 300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCACTTT CCCCGAGCCT TATTGCCCCA 360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT 420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC 480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC 540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC 600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG 660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA 720ATTCCAGCTG CGGTCCCTGG GCAGCCCGCT GAGCTCCAGT TAAATGTCAC AAAGAATGAC 780GACAAGCGGG GCTTCTTCTG CGACGCTGCC CTCGATGTGG ACGGGGAAAC TCTGAGAAAG 840AACCAGAGCT CTGAGCTTCG TGTTCTGTGT GAGTGGATGT TCACTTTATC TCTGTGAATT 900CCAAGGACCC TCTTACCGGC CCCATCTTTA ACCTTATCGT ATCCCCTCTG CCTCATGCCC 960GCAGACGCAC CTCGGCTGGA TGACTTGGAC TGTCCCAGGA GCTGGACGTG GCCAGAGGGT 1020CCAGAGCAGA CCCTCCACTG CGAGGCCCGT GGAAACCCTG AGCCCTCCGT GCACTGTGCA 1080AGGCCTGACG GTGGGGCGGT GCTAGCGCTG GGCCTGTTGG GTCCAGTGAC CCGTGCCCTC 1140GCGGGCACTT ACCGATGTAC AGCAATCAAT GGGCAAGGCC AGGCGGTCAA GGATGTGACC 1200CTGACTGTGG AATATGCCCC AGCGCTGGAC AGTGTAGGCT GCCCAGAACG TATTACTTGG 1260CTGGAGGGGA CAGAGGCATC GCTTAGCTGT GTGGCACACG GGGTCCCACC ACCTAGCGTG 1320AGCTGTGTGC GCTCTGGAAA GGAGGAAGTC ATGGAAGGGC CCCTGCGTTT TGGCCGGGAG 1380CACGCTGGCA CTTACCGATG CGAAGCCATC AACGCCAGGG GATCAGCGGC CAAAAATGTG 1440GCTGTCACGG TGGAATATGG TCCCCGGAAT TC 1472(2)SEQ ID NO10的資料(i)序列特征(A)長度2550個堿基對(B)類型∶核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO10CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG AACTTCACCT TGAGCTGCAG GGTCCCGGGG 60GCAGGACCCC GAGCGAGCCT CACATTGACC TTGCTGCGAG GCGGCCAGGA GCTGATTCGC120CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT CGGGGTGCGA TGCTCACCGC CACGGTCCTG180GCGCGCAGAG AGGATCACAG GGCCAATTTC TCATGCCTCG CGGAGCTTGA CCTGCGGCCA240CACGGCTTGG GACTGTTTGC AAACAGCTCA GCCCCCAGAC AGCTCCGCAC GTTTGCCATG300CCTCCACTTT CCCCGAGCCT TATTGCCCCA CGATTCTTAG AAGTGGGCTC AGAAAGGCCG360GTGACTTGCA CTTTGGATGG ACTGTTTCCT GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG420GGAGATCAGA GGCTTCATCC TAATGTGACC CTCGACGGGG AGAGCCTTGT GGCCACTGCC480ACAGCTACAG CAAGTGAAGA ACAGGAAGGC ACCAAACAGC TGATGTGCAT CGTGACCCTC540GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC CTGACTGTCT ACAGCTTCCC GGCTCCTCTT600CTGACTTTAA GTGAGCCAGA AGCCCCCGAG GGAAAGATGG TGACCGTAAG CTGCTGGGCA660GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA ATTCCAGCTG CGGTCCCTGG GCAGCCCGCT720GAGCTCCAGT TAAATGTCAC AAAGAATGAC GACAAGCGGG GCTTCTTCTG CGACGCTGCC780CTCGATGTGG ACGGGGAAAC TCTGAGAAAG AACCAGAGCT CTGAGCTTCG TGTTCTGTAC840GCACCTCGGC TGGATGACTT GGACTGTCCC AGGAGCTGGA CGTGGCCAGA GGGTCCAGAG900CAGACCCTCC ACTGCGAGGC CCGTGGAAAC CCTGAGCCCT CCGTGCACTG TGCAAGGCCT960GACGGTGGGG CGGTGCTAGC GCTGGGCCTG TTGGGTCCAG TGACCCGTGC CCTCGCGGGC 1020ACTTACCGAT GTACAGCAAT CAATGGGCAA GGCCAGGCGG TCAAGGATGT GACCCTGACT 1080GTGGAATATG CCCCAGCGCT GGACAGTGTA GGCTGCCCAG AACGTATTAC TTGGCTGGAG 1140GGGACAGAGG CATCGCTTAG CTGTGTGGCA CACGGGGTCC CACCACCTAG CGTGAGCTGT 1200GTGCGCTCTG GAAAGGAGGA AGTCATGGAA GGGCCCCTGC GTGTGGCCCG GGAGCACGCT 1260GGCACTTACC GATGCGAAGC CATCAACGCC AGGGGATCAG CGGCCAAAAA TGTGGCTGTC 1320ACGGTGGAAT ATGGTCCCAG TTTTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA 1380GAAGGATCTG GAAAACTGTT TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG 1440TGCGTGGGCT CGGAGGGTGC AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT 1500GGTTCCAGAA ACTCTATGAC TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC 1560ACCAACCGGC ATGGCTCCAC AGTCAAAACA GTCGTCGTGA GCGCGGAATC ACCGCCACAG 1620ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA GGCTACTGCG 1680CTGGCCTGCA GTGCCAGAGG CCGCCCCTCT CCACGCGTGC GCTGTTCCAG GGAAGGTGCA 1740GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT GTGTGTGGCT 1800ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATA CCGGCCTGTG 1860GTGGCTGAGC TGGCAGCCTC GCCCCCAAGC GTGCGGCCTG GCGGAAACTT CACTCTGACC 1920TGCCGTGCAG AGGCCTGGCC TCCAGCCCAG ATCAGCTGGC GCGCGCCCCC GGGAGCTCTC 1980AACCTCGGTC TCTCCAGCAA CAACAGCACG CTGAGCGTGG CGGGTGCCAT GGGCAGCCAT 2040GGTGGCGAGT ATGAGTGCGC AGCCACCAAT GCGCATGGGC GCCACGCACG GCGCATCACG 2100GTGCGCGTGG CCGGTCCATG GCTGTGGGTC GCTGTGGGCG GTGCGGCAGG GGGCGCGGCG 2160CTGCTGGCCG CAGGGGCCGG CCTGGCCTTC TACGTGCAGT CCACCGCTTG CAAGAAGGGA 2220GAGTACAACG TCCAGGAGGC TGAGAGCTCA GGCGAGGCGG TGTGTCTCAA TGGCGCGGGC 2280GGGACACCGG GTGCAGAAGG CGGAGCAGAG ACCCCCGGCA CTGCCGAGTC ACCTGCAGAT 2340GGCGAGGTTT TCGCCATCCA GCTGACATCT TCCTGAGCCT GTATCCAGCT CCCCCAGGGG 2400CCTCGAAAGC ACAGGGGTGG ACGTATGTAT TGTTCACTCT CTATTTATTC AACTCCAGGG 2460GCGTCGTCCC CGTTTTCTAC CCATTCCCTT AATAAAGTTT TTATAGGAGA AAAAAAAAAA 2520AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2550(2)SEQ ID NO11的資料(i)序列特征(A)長度222個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述 SEQ ID NO11AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA60ATGCCGGGGC CTTCACCAGG GCTGCGCCGA ACGCTCCTCG GCCTCTGGGC TGCCCTGGGC 120CTGGGGATCC TAGGCATCTC AGCGGTCGCG CTAGAACCTT TCTGGGCGGA CCTTCAGCCC 180CGCGTGGCGC TCGTGGAGCG CGGGGGCTCG CTGTGGCTCA AC 222(2)SEQ ID NO12的資料(i)序列特征(A)長度292個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO12TGTGGAGCTG GCACCCCTGC CTCCTTGGCA GCCGGTGGGC CAGAACTTCA CCCTGCGCTG 60CCAAGTGGAG GGTGGGTCGC CCCGGACCAG CCTCACGGTG GTGCTGCTTC GCTGGGAGGA 120GGAGCTGAGC CGGCAGCCCG CAGTGGAGGA GCCAGCGGAG GTCACTGCCA CTGTGCTGGC 180CAGCAGAGAC GACCACGGAG CCCCTTTCTC ATGCCGCACA GAACTGGACA TGCAGCCCCA 240GGGGCTGGGA CTGTTCGTGA ACACCTCAGC CCCCCGCCAG CTCCGAACCT TT 292(2)SEQ ID NO13的資料(i)序列特征(A)長度105個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO13Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly15 10 15Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser85 90 95Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105(2)SEQ ID NO14的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型 cDNA(xi)序列描述SEQ ID NO14GAACTCGAGG CCATGCCTCC ACTTTCC 27(2)SEQ ID NO15的資料(i)序列特征(A)長度30個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO15CCATAAGCTT TATTCCACCG TGACAGCCAC30(2)SEQ ID NO16的資料(i)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO16AACGTGCGGA GCTGTCTG 18(2)SEQ ID NO17的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO17ACGGAATTCG AAGCCATCAA CGCCAGG 27(2)SEQ ID NO18的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO18CATGAATTCC GAATCTTGAG TGGGATG27(2)SEQ ID NO19的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO19ATAGAATTCC TCGGGACACC TGTAGCC 27(2)SEQ ID NO20的資料(i)序列特征(A)長度18個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO20CARGGTGACA AGGGCTCG 18(2)SEQ ID NO21的資料(i)序列特征(A)長度27個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO21TATGAATTCA GTTGAGCCAC AGCGAGC 27(2)SEQ ID NO22的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO22CCGGGTCCTA GAGGTGGACA CGCA 24(2)SEQ ID NO23的資料(i)序列特征(A)長度24個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO23TGCAGTGTCT CCTGGCTCTG GTTC 24(2)SEQ ID NO24的資料(i)序列特征(A)長度992個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO24GCGAAAACCG GGAGACCCGG GAGAACGTGA CCATCTACAG CTTCCCGGCA CCACTCCTGA 60CCCTGAGCGA ACCCAGCGTC TCCGAGGGGC AGATGGTGAC AGTAACCTGC GCAGCTGGGG 120CCCAAGCTCT GGTCACACTG GAGGGAGTTC CAGCCGCGGT CCCGGGGCAG CCCGCCCAGC 180TTCAGCTAAA TGCCACCGAG AACGACGACA GACGCAGCTT CTTCTGCGAC GCCACCCTCG 240ATGTGGACGG GGAGACCCTG ATCAAGAACA GGAGCGCAGA GCTTCGTGTC CTATACGCTC 300CCCGGCTAGA CGATTCGGAC TGCCCCAGGA GTTGGACGTG GCCCGAGGGC CCAGAGCAGA 360CGCTGCGCTG CGAGGCCCGC GGGAACCCAG AACCCTCAGT GCACTGTGCG CGCTCCGACG 420GCGGGGCCGT GCTGGCTCTG GGCCTGCTGG GTCCAGTCAC TCGGGCGCTC TCAGGCACTT 480ACCGCTGCAA GGCGGCCAAT GATCAAGGCG AGGCGGTCAA GGACGTAACG CTAACGGTGG 540AGTACGCACC AGCGCTGGAC AGCGTGGGCT GCCCAGAACG CATTACTTGG CTGGAGGGAA 600CAGAAGCCTC GCTGAGCTGT GTGGCGCACG GGGTACCGCC GCCTGATGTG ATCTGCGTGC 660GCTCTGGAGA ACTCGGGGCC GTCATCGAGG GGCTGTTGCG TGTGGCCCGG GAGCATGCGG 720GCACTTACCG CTGCGAAGCC ACCAACCCTC GGGGCTCTGC GGCCAAAAAT GTGGCCGTCA 780CGGTGGAATA TGGCCCCAGG TTTGAGGAGC CGAGCTGCCC CAGCAATTGG ACATGGGTGG 840AAGGATCTGG GCGCCTGTTT TCCTGTGAGG TCGATGGGAA GCCACAGCCA AGCGTGAAGT 900GCGTGGGCTC CGGGGGCACC ACTGAGGGGG TGCTGCTGCC GCTGGCACCC CCAGACCCTA 960GTCCCAGAGC TCCCAGAATC CCTAGAGTCC TG992(2)SEQ ID NO25的資料(i)序列特征(A)長度2775個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO25GCAGCCTCGC GTGGCGTTCG TGGAGCGCGG GGGCTCGCTG TGGCTGAATT GCAGCACCAA60CTGCCCTCGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTG CGCCGAAACG GGACCCAGAG 120GGGTTTGCGT TGGTTGGCGC GGCAGCTGGT GGACATTCGC GAGCCGGAGA CTCAGCCCGT 180CTGCTTCTTC CGCTGCGCGC GGCGCACACT ACAGGCGCGT GGGCTCATTC GCACTTTCCA 240GCGACCAGAT CGCGTAGAGC TGATGCCGCT GCCTCCCTGG CAGCCGGTGG GCGAGAACTT 300CACCCTGAGC TGTAGGGTCC CCGGCGCCGG GCCCCGTGCG AGCCTCACGC TGACCCTGCT 360GCGGGGCGCC CAGGAGCTGA TCCGCCGCAG CTTCGCCGGT GAACCACCCC GAGCGCGGGG 420CGCGGTGCTC ACAGCCACGG TACTGGCTCG GAGGGAGGAC CATGGAGCCA ATTTCTCGTG 480TCGCGCCGAG CTGGACCTGC GGCCGCACGG ACTGGGACTG TTTGAAAACA GCTCGGCCCC 540CAGAGAGCTC CGAACCTTCT CCCTGTCTCC GGATGCCCCG CGCCTCGCTG CTCCCCGGCT 600CTTGGAAGTT GGCTCGGAAA GGCCCGTGAG CTGCACTCTG GACGGACTGT TTCCAGCCTC 660AGAGGCCAGG GTCTACCTCG CACTGGGGGA CCAGAATCTG AGTCCTGATG TCACCCTCGA 720AGGGGACGCA TTCGTGGCCA CTGCCACAGC CACAGCTAGC GCAGAGCAGG AGGGTGCCAG 780GCAGCTGGTC TGCAACGTCA CCCTGGGGGG CGAAAACCGG GAGACCCGGG AGAACGTGAC 840CATCTACAGC TTCCCGGCAC CACTCCTGAC CCTGAGCGAA CCCAGCGTCT CCGAGGGGCA 900GATGGTGACA GTAACCTGCG CAGCTGGGGC CCAAGCTCTG GTCACACTGG AGGGAGTTCC 960AGCCGCGGTC CCGGGGCAGC CCGCCCAGCT TCAGCTAAAT GCCACCGAGA ACGACGACAG 1020ACGCAGCTTC TTCTGCGACG CCACCCTCGA TGTGGACGGG GAGACCCTGA TCAAGAACAG 1080GAGCGCAGAG CTTCGTGTCC TATACGCTCC CCGGCTAGAC GATTCGGACT GCCCCAGGAG 1140TTGGACGTGG CCCGAGGGCC CAGAGCAGAC GCTGCGCTGC GAGGCCCGCG GGAACCCAGA 1200ACCCTCAGTG CACTGTGCGC GCTCCGACGG CGGGGCCGTG CTGGCTCTGG GCCTGCTGGG 1260TCCAGTCACT CGGGCGCTCT CAGGCACTTA CCGCTGCAAG GCGGCCAATG ATCAAGGCGA 1320GGCGGTCAAG GACGTAACGC TAACGGTGGA GTACGCACCA GCGCTGGACA GCGTGGGCTG 1380CCCAGAACGC ATTACTTGGC TGGAGGGAAC AGAAGCCTCG CTGAGCTGTG TGGCGCACGG 1440GGTACCGCCG CCTGATGTGA TCTGCGTGCG CTCTGGAGAA CTCGGGGCCG TCATCGAGGG 1500GCTGTTGCGT GTGGCCCGGG AGCATGCGGG CACTTACCGC TGCGAAGCCA CCAACCCTCG 1560GGGCTCTGCG GCCAAAAATG TGGCCGTCAC GGTGGAATAT GGCCCCAGGT TTGAGGAGCC 1620GAGCTGCCCC AGCAATTGGA CATGGGTGGA AGGATCTGGG CGCCTGTTTT CCTGTGAGGT 1680CGATGGGAAG CCACAGCCAA GCGTGAAGTG CGTGGGCTCC GGGGGCACCA CTGAGGGGGT 1740GCTGCTGCCG CTGGCACCCC CAGACCCTAG TCCCAGAGCT CCCAGAATCC CTAGAGTCCT 1800GGCACCCGGT ATCTACGTCT GCAACGCCAC CAACCGCCAC GGCTCCGTGG CCAAAACAGT 1860CGTCGTGAGC GCGGAGTCGC CACCGGAGAT GGATGAATCT ACCTGCCCAA GTCACCAGAC 1920GTGGCTGGAA GGGGCTGAGG CTTCCGCGCT GGCCTGCGCC GCCCGGGGTC GCCCTTCCCC 1980AGGAGTGCGC TGCTCTCGGG AAGGCATCCC ATGGCCTGAG CAGCAGCGCG TGTCCCGAGA 2040GGACGCGGGC ACTTACCACT GTGTGGCCAC CAATGCGCAT GGCACGGACT CCCGGACCGT 2100CACTGTGGGC GTGGAATACC GGCCAGTGGT GGCCGAACTT GCTGCCTCGC CCCCTGGAGG 2160CGTGCGCCCA GGAGGAAACT TCACGTTGAC CTGCCGCGCG GAGGCCTGGC CTCCAGCCCA 2220GATCAGCTGG CGCGCGCCCC CGAGGGCCCT CAACATCGGC CTGTCGAGCA ACAACAGCAC 2280ACTGAGCGTG GCAGGCGCCA TGGGAAGCCA CGGCGGCGAG TACGAGTGCG CACGCACCAA 2340CGCGCACGGG CGCCACGCGC GGCGCATCAC GGTGCGCGTG GCCGGTCCGT GGCTATGGGT 2400CGCCGTGGGC GGCGCGGCGG GGGGCGCGGC GCTGCTGGCC GCGGGGGCCG GCCTGGCCTT 2460CTACGTGCAG TCCACCGCCT GCAAGAAGGG CGAGTACAAC GTGCAGGAGG CCGAGAGCTC 2520AGGCGAGGCC GTGTGTCTGA ACGGAGCGGG CGGCGGCGCT GGCGGGGCGG CAGGCGCGGA 2580GGGCGGACCC GAGGCGGCGG GGGGCGCGGC CGAGTCGCCG GCGGAGGGCG AGGTCTTCGC 2640CATACAGCTG ACATCGGCGT GAGCCCGCTC CCCTCTCCGC GGGCCGGGAC GCCCCCCAGA 2700CTCACACGGG GGCTTATTTA TTGCTTTATT TATTTACTTA TTCATTTATT TATGTATTCA 2760ACTCCAAGGG AATTC 2775(2)SEQ ID NO26的資料(i)序列特征(A)長度1557個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO26CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCGA TGCCAGGGCC TTCGCCAGGG 60CTGCGCCGGG CGCTACTCGG CCTCTGGGCT GCTCTGGGCC TGGGGCTCTT CGGCCTCTCA 120GCGGTCTCGC AGGAGCCCTT CTGGGCGGAC CTGCAGCCTC GCGTGGCGTT CGTGGAGCGC 180GGGGGCTCGC TGTGGCTGAA TTGCAGCACC AACTGCCCTC GGCCGGAGCG CGGTGGCCTG 240GAGACCTCGC TGCGCCGAAA CGGGACCCAG AGGGGTTTGC GTTGGTTGGC GCGGCAGCTG 300GTGGACATTC GCGAGCCGGA GACTCAGCCC GTCTGCTTCT TCCGCTGCGC GCGGCGCACA 360CTACAGGCGC GTGGGCTCAT TCGCACTTTC CAGCGACCAG ATCGCGTAGA GCTGATGCCG 420CTGCCTCCCT GGCAGCCGGT GGGCGAGAAC TTCACCCTGA GCTGTAGGGT CCCCGGCGCC 480GGGCCCCGTG CGAGCCTCAC GCTGACCCTG CTGCGGGGCG CCCAGGAGCT GATCCGCCGC 540AGCTTCGCCG GTGAACCACC CCGAGCGCGG GGCGCGGTGC TCACAGCCAC GGTACTGGCT 600CGGAGGGAGG ACCATGGAGC CAATTTCTCG TGTCGCGCCG AGCTGGACCT GCGGCCGCAC 660GGACTGGGAC TGTTTGAAAA CAGCTCGGCC CCCAGAGAGC TCCGAACCTT CTCCCTGTCT 720CCGGATGCCC CGCGCCTCGC TGCTCCCCGG CTCTTGGAAG TTGGCTCGGA AAGGCCCGTG 780AGCTGCACTC TGGACGGACT GTTTCCAGCC TCAGAGGCCA GGGTCTACCT CGCACTGGGG 840GACCAGAATC TGAGTCCTGA TGTCACCCTC GAAGGGGACG CATTCGTGGC CACTGCCACA 900GCCACAGCTA GCGCAGAGCA GGAGGGTGCC AGGCAGCTGG TCTGCAACGT CACCCTGGGG 960GGCGAAAACC GGGAGACCCG GGAGAACGTG ACCATCTACA GCTTCCCGGC ACCACTCCTG 1020ACCCTGAGCG AACCCAGCGT CTCCGAGGGG CAGATGGTGA CAGTAACCTG CGCAGCTGGG 1080GCCCAAGCTC TGGTCACACT GGAGGGAGTT CCAGCCGCGG TCCCGGGGCA GCCCGCCCAG 1140CTTCAGCTAA ATGCCACCGA GAACGACGAC AGACGCAGCT TCTTCTGCGA CGCCACCCTC 1200GATGTGGACG GGGAGACCCT GATCAAGAAC AGGAGCGCAG AGCTTCGTGT CCTATACGCT 1260CCCCGGCTAG ACGATTCGGA CTGCCCCAGG AGTTGGACGT GGCCCGAGGG CCCAGAGCAG 1320ACGCTGCGCT GCGAGGCCCG CGGGAACCCA GAACCCTCAG TGCACTGTGC GCGCTCCGAC 1380GGCGGGGCCG TGCTGGCTCT GGGCCTGCTG GGTCCAGTCA CTCGGGCGCT CTCAGGCACT 1440TACCGCTGCA AGGCGGCCAA TGATCAAGGC GAGGCGGTCA AGGACGTAAC GCTAACGGTG 1500GAGTACGCAC CAGCGCTGGA CAGCGTGGGC TGCCCAGAAC GCATTACTTG GCTGGAG1557(2)SEQ ID NO27的資料(i)序列特征(A)長度2927個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置40..2814(xi)序列描述SEQ ID NO27CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCG ATG CCA GGG CCT TCG 54Met Pro Gly Pro Ser1 5CCA GGG CTG CGC CGG GCG CTA CTC GGC CTC TGG GCT GCT CTG GGC CTG 102Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp Ala Ala Leu Gly Leu10 15 20GGG CTC TTC GGC CTC TCA GCG GTC TCG CAG GAG CCC TTC TGG GCG GAC 150Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu Pro Phe Trp Ala Asp25 30 35CTG CAG CCT CGC GTG GCG TTC GTG GAG CGC GGG GGC TCG CTG TGG CTG 198Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly Gly Ser Leu Trp Leu40 45 50AAT TGC AGC ACC AAC TGC CCT CGG CCG GAG CGC GGT GGC CTG GAG ACC 246Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg Gly Gly Leu Glu Thr55 60 65TCG CTG CGC CGA AAC GGG ACC CAG AGG GGT TTG CGT TGG TTG GCG CGG 294Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu Arg Trp Leu Ala Arg70 75 80 85CAG CTG GTG GAC ATT CGC GAG CCG GAG ACT CAG CCC GTC TGC TTC TTC 342Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln Pro Val Cys Phe Phe90 95 100CGC TGC GCG CGG CGC ACA CTA CAG GCG CGT GGG CTC ATT CGC ACT TTC 390Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly Leu Ile Arg Thr Phe105 110 115CAG CGA CCA GAT CGC GTA GAG CTG ATG CCG CTG CCT CCC TGG CAG CCG 438Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu Pro Pro Trp Gln Pro120 125 130GTG GGC GAG AAC TTC ACC CTG AGC TGT AGG GTC CCC GGC GCC GGG CCC 486Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro135 140 145CGT GCG AGC CTC ACG CTG ACC CTG CTG CGG GGC GCC CAG GAG CTG ATC 534Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly Ala Gln Glu Leu Ile150 155 160 165CGC CGC AGC TTC GCC GGT GAA CCA CCC CGA GCG CGG GGC GCG GTG CTC 582Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala Arg Gly Ala Val Leu170 175 180ACA GCC ACG GTA CTG GCT CGG AGG GAG GAC CAT GGA GCC AAT TTC TCG 630Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His Gly Ala Asn Phe Ser185 190 195TGT CGC GCC GAG CTG GAC CTG CGG CCG CAC GGA CTG GGA CTG TTT GAA 678Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly Leu Gly Leu Phe Glu200 205 210AAC AGC TCG GCC CCC AGA GAG CTC CGA ACC TTC TCC CTG TCT CCG GAT 726Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe Ser Leu Ser Pro Asp215 220 225GCC CCG CGC CTC GCT GCT CCC CGG CTC TTG GAA GTT GGC TCG GAA AGG 774Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu Val Gly Ser Glu Arg230 235 240 245CCC GTG AGC TGC ACT CTG GAC GGA CTG TTT CCA GCC TCA GAG GCC AGG 822Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala Arg250 255 260GTC TAC CTC GCA CTG GGG GAC CAG AAT CTG AGT CCT GAT GTC ACC CTC 870Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Ser Pro Asp Val Thr Leu265 270 275GAA GGG GAC GCA TTC GTG GCC ACT GCC ACA GCC ACA GCT AGC GCA GAG 918Glu Gly Asp Ala Phe Val Ala Thr Ala Thr Ala Thr Ala Ser Ala Glu280 285 290CAG GAG GGT GCC AGG CAG CTG GTC TGC AAC GTC ACC CTG GGG GGC GAA 966Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val Thr Leu Gly Gly Glu295 300 305AAC CGG GAG ACC CGG GAG AAC GTG ACC ATC TAC AGC TTC CCG GCA CCA1014Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr Ser Phe Pro Ala Pro310 315 320 325CTC CTG ACC CTG AGC GAA CCC AGC GTC TCC GAG GGG CAG ATG GTG ACA1062Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu Gly Gln Met Val Thr330 335 340GTA ACC TGC GCA GCT GGG GCC CAA GCT CTG GTC ACA CTG GAG GGA GTT1110Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Val Thr Leu Glu Gly Val345 350 355CCA GCC GCG GTC CCG GGG CAG CCC GCC CAG CTT CAG CTA AAT GCC ACC1158Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu Gln Leu Asn Ala Thr360 365 370GAG AAC GAC GAC AGA CGC AGC TTC TTC TGC GAC GCC ACC CTC GAT GTG1206Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp Ala Thr Leu Asp Val375 380 385GAC GGG GAG ACC CTG ATC AAG AAC AGG AGC GCA GAG CTT CGT GTC CTA1254Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala Glu Leu Arg Val Leu390 395 400 405TAC GCT CCC CGG CTA GAC GAT TCG GAC TGC CCC AGG AGT TGG ACG TGG 1302Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro Arg Ser Trp Thr Trp410 415 420CCC GAG GGC CCA GAG CAG ACG CTG CGC TGC GAG GCC CGC GGG AAC CCA 1350Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu Ala Arg Gly Asn Pro425 430 435GAA CCC TCA GTG CAC TGT GCG CGC TCC GAC GGC GGG GCC GTG CTG GCT 1398Glu Pro Ser Val His Cys Ala Arg Ser Asp Gly Gly Ala Val Leu Ala440 445 450CTG GGC CTG CTG GGT CCA GTC ACT CGG GCG CTC TCA GGC ACT TAC CGC 1446Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu Ser Gly Thr Tyr Arg455 460 465TGC AAG GCG GCC AAT GAT CAA GGC GAG GCG GTC AAG GAC GTA ACG CTA 1494Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val Lys Asp Val Thr Leu470 475 480 485ACG GTG GAG TAC GCA CCA GCG CTG GAC AGC GTG GGC TGC CCA GAA CGC 1542Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val Gly Cys Pro Glu Arg490 495 500ATT ACT TGG CTG GAG GGA ACA GAA GCC TCG CTG AGC TGT GTG GCG CAC 1590Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu Ser Cys Val Ala His505 510 515GGG GTA CCG CCG CCT GAT GTG ATC TGC GTG CGC TCT GGA GAA CTC GGG 1638Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg Ser Gly Glu Leu Gly520 525 530GCC GTC ATC GAG GGG CTG TTG CGT GTG GCC CGG GAG CAT GCG GGC ACT 1686Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg Glu His Ala Gly Thr535 540 545TAC CGC TGC GAA GCC ACC AAC CCT CGG GGC TCT GCG GCC AAA AAT GTG 1734Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser Ala Ala Lys Asn Val550 555 560 565GCC GTC ACG GTG GAA TAT GGC CCC AGG TTT GAG GAG CCG AGC TGC CCC 1782Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu Glu Pro Ser Cys Pro570 575 580AGC AAT TGG ACA TGG GTG GAA GGA TCT GGG CGC CTG TTT TCC TGT GAG 1830Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg Leu Phe Ser Cys Glu585 590 595GTC GAT GGG AAG CCA CAG CCA AGC GTG AAG TGC GTG GGC TCC GGG GGC 1878Val Asp Gly Lys Pro Gln Pro Ser Val Lys Cys Val Gly Ser Gly Gly600 605 610ACC ACT GAG GGG GTG CTG CTG CCG CTG GCA CCC CCA GAC CCT AGT CCC 1926Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro Pro Asp Pro Ser Pro615 620 625AGA GCT CCC AGA ATC CCT AGA GTC CTG GCA CCC GGT ATC TAC GTC TGC 1974Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro Gly Ile Tyr Val Cys630 635 640 645AAC GCC ACC AAC CGC CAC GGC TCC GTG GCC AAA ACA GTC GTC GTG AGC 2022Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys Thr Val Val Val Ser650 655 660GCG GAG TCG CCA CCG GAG ATG GAT GAA TCT ACC TGC CCA AGT CAC CAG 2070Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr Cys Pro Ser His Gln665 670 675ACG TGG CTG GAA GGG GCT GAG GCT TCC GCG CTG GCC TGC GCC GCC CGG 2118Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu Ala Cys Ala Ala Arg680 685 690GGT CGC CCT TCC CCA GGA GTG CGC TGC TCT CGG GAA GGC ATC CCA TGG 2166Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg Glu Gly Ile Pro Trp695 700 705CCT GAG CAG CAG CGC GTG TCC CGA GAG GAC GCG GGC ACT TAC CAC TGT 2214Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala Gly Thr Tyr His Cys710 715 720 725GTG GCC ACC AAT GCG CAT GGC ACG GAC TCC CGG ACC GTC ACT GTG GGC 2262Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr Val Thr Val Gly730 735 740GTG GAA TAC CGG CCA GTG GTG GCC GAA CTT GCT GCC TCG CCC CCT GGA 2310Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala Ser Pro Pro Gly745 750 755GGC GTG CGC CCA GGA GGA AAC TTC ACG TTG ACC TGC CGC GCG GAG GCC 2358Gly Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg Ala Glu Ala760 765 770TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG AGG GCC CTC AAC 2406Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Arg Ala Leu Asn775 780 785ATC GGC CTG TCG AGC AAC AAC AGC ACA CTG AGC GTG GCA GGC GCC ATG 2454Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala Gly Ala Met790 795 800 805GGA AGC CAC GGC GGC GAG TAC GAG TGC GCA CGC ACC AAC GCG CAC GGG 2502Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg Thr Asn Ala His Gly810 815 820CGC CAC GCG CGG CGC ATC ACG GTG CGC GTG GCC GGT CCG TGG CTA TGG 2550Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro Trp Leu Trp825 830 835GTC GCC GTG GGC GGC GCG GCG GGG GGC GCG GCG CTG CTG GCC GCG GGG 2598Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu Ala Ala Gly840 845 850GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCC TGC AAG AAG GGC GAG 2646Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys Lys Gly Glu855 860 865TAC AAC GTG CAG GAG GCC GAG AGC TCA GGC GAG GCC GTG TGT CTG AAC 2694Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val Cys Leu Asn870 875 880885GGA GCG GGC GGC GGC GCT GGC GGG GCG GCA GGC GCG GAG GGC GGA CCC 2742Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly Ala Glu Gly Gly Pro890 895 900GAG GCG GCG GGG GGC GCG GCC GAG TCG CCG GCG GAG GGC GAG GTC TTC 2790Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala Glu Gly Glu Val Phe905 910 915GCC ATA CAG CTG ACA TCG GCG TGAGCCCGCT CCCCTCTCCG CGGGCCGGGA 2841Ala Ile Gln Leu Thr Ser Ala920 925CGCCCCCCAG ACTCACACGG GGGCTTATTT ATTGCTTTAT TTATTTACTT ATTCATTTAT 2901TTATGTATTC AACTCCAAGG GAATTC 2927(2)SEQ ID NO28的資料(i)序列特征(A)長度924個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO28Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160Ala Gln Glu Leu Ile Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala165 170 175Arg Gly Ala Val Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Gly Ala Asn Phe Ser Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205Leu Gly Leu Phe Glu Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe210 215 220Ser Leu Ser Pro Asp Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro245 250 255Ala Ser Glu Ala Arg Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Ser260 265 270Pro Asp Val Thr Leu Glu Gly Asp Ala Phe Val Ala Thr Ala Thr Ala275 280 285Thr Ala Ser Ala Glu Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val290 295 300Thr Leu Gly Gly Glu Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu325 330 335Gly Gln Met Val Thr Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Val340 345 350Thr Leu Glu Gly Val Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu355 360 365Gln Leu Asn Ala Thr Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp370 375 380Ala Thr Leu Asp Val Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Ser Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ser Gly Thr Tyr Arg Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg5l5 520 525Ser Gly Glu Leu Gly Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg530 535 540Glu His Ala Gly Thr Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser545 550 555 560Ala Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu565 570 575Glu Pro Ser Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg580 585 590Leu Phe Ser Cys Glu Val Asp Gly Lys Pro Gln Pro Ser Val Lys Cys595 600 605Val Gly Ser Gly Gly Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro610 615 620Pro Asp Pro Ser Pro Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro625 630 635 640Gly Ile Tyr Val Cys Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys645 650 655Thr Val Val Val Ser Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr660 665 670Cys Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu675 680 685Ala Cys Ala Ala Arg Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg690 695 700Glu Gly Ile Pro Trp Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala705 710 715 720Gly Thr Tyr His Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg725 730 735Thr Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala740 745 750Ala Ser Pro Pro Gly Gly Val Arg Pro Gly Gly Asn Phe Thr Leu Thr755 760 765Cys Arg Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro770 775 780Pro Arg Ala Leu Asn Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser785 790 795 800Val Ala Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg805 810 815Thr Asn Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala820 825 830Gly Pro Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala835 840 845Leu Leu Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala850 855 860Cys Lys Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu865 870 875 880Ala Val Cys Leu Asn Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly885 890 895Ala Glu Gly Gly Pro Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala900 905 910Glu Gly Glu Val Phe Ala Ile Gln Leu Thr Ser Ala915 920(2)SEQ ID NO29的資料(i)序列特征(A)長度65個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO29GTACTTACAG GATCCGCGGT CTCGCAGGAG CCCTTCTGGG CGGACCTACA GCCTGCGTGG60CGTTC65(2)SEQ ID NO30的資料(i)序列特征(A)長度31個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO30ATTTCTCTCG AGGATGGTCA CGTTCTCCCG G 31(2)SEQ ID NO31的資料(i)序列特征(A)長度33個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型cDNA(xi)序列描述SEQ ID NO31ATTTCTGGAT CCTACAGCTT CCCGGCACCA CTC33(2)SEQ ID NO32的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO32ATTTCTCTCG AGTTCCACGC CCACAGTGAC GG 32(2)SEQ ID NO33的資料(i)序列特征(A)長度1687個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO33GGATCCTTTG AGCCCTGAAA GTCGAGGTTG CAGTGAGCCT TGATCGTGCC ACTGCACTCC60AGCCTGGGGG ACAGAGCACG ACCCTGTCTC CAAAAATAAA ATAAAAATAA AAATAAATAT 120TGGCGGGGGA ACCCTCTGGA ATCAATAAAG GCTTCCTTAA CCAGCCTCTG TCCTGTGACC 180TAAGGGTCCG CATTACTGCC CTTCTTCGGA GGAACTGGTT TGTTTTTGTT GTTGTTGTTG 240TTTTTGCGAT CACTTTCTCC AAGTTCCTTG TCTCCCTGAG GGCACCTGAG GTTTCCTCAC 300TCAGGGCCCA CCTGGGGTCC CGAAGCCCCA GACTCTGTGT ATCCCCAGCG GGTGTCACAG 360AAACCTCTCC TTCTGCTGGC CTTATCGAGT GGGATCAGCG CGGCCGGGGA GAGCCACGGG 420CAGGGGCGGG GTGGGGTTCA TGGTATGGCT TTCCTGATTG GCGCCGCCGC CACCACGCGG 480CAGCTCTGAT TGGATGTTAA GTTTCCTATC CCAGCCCCAC CTTCAGACCC TGTGCTTTCC 540TGGAGGCCAA ACAACTGTGG AGCGAGAACT CATCTCCAAA ATAACTTACC ACGCTGGAGT 600GAGACCACGA ATGGTGGGGA GGGGAGGGTC CCACGGACAT ATTGAGGGAC GTGGATACGC 660AGAAGAGGTA TCCATGTGGT GGCAGCCGGG AAGGGGTGAT CAGATGGTCC ACAGGGAATA 720TCACAAACTC GAATTCTGAC GATGTTCTGG TAGTCACCCA GCCAGATGAG CGCATGGAGT 780TGGCGGTGGG GGGTGTCAAA GCTTGGGGCC CGGAAGCGGA GTCAAAAGCA TCACCCTCGG 840TCCCTTGTTC TCGCGTGGAT GTCAGGGCCT CCACCCACCG AGCAGAAGGC GGACTCAGGG 900GCGCTCCAGG GTGGCTCGAG CTCACACACG CTGAGTAGAC ACGTGCCCGC TGCACCCTGG 960GTAAATACAG ACCCGGAGCC GAGCGGATTC TAATTTAGAC GCCCGCGAAC GCTGCGCGCA 1020CGCACACGTG TCCTCGGCTC GCTGGCACTT TCGTCCCGCC CCCTCCGTCG CGTGCCGGAG 1080CTGACCCGGA GGGGTGCTTA GAGGTATGGC TCCGCGGGGT CAAAAGGAGA AGGATCAGTG 1140AGAGAGGATC CCCACACCCT CCCCTAGAAC TGTCCTTTCC CCATCCAGTG CCTCCCAAAT 1200CTCTCTTAGT CCCCAAATGT ATCCCCGCCC TAAGGGGCGC TGGTGGGAGG AGCTAAATGT 1260GGGGGCGGAG CTCGGAGTCC AGCTTATTAT CATGGCATCT CAGCCAGGGC TGGGGTAGGG 1320GTTTGGGAAG GGCAACCCAG CATCCCCCGA TCCCAGAGTC GCGGCCGGGG ATGACGCGAG 1380AGAGCGTGGT CGCCCCCAGA AGGCCCTGGG CCATCATGCC GGCCTCCACG TAGACCCCAG 1440GGGTCGCTCA CTCCTGCCAG CTCGCCTTCA CCAAGGCCAG GAGCTTAGCG CACGCTCGCC 1500TCCCGCCCCC CCGCCGCCTC TGCCGCCGCC CCCTCCTTGG AAACCAAGTT ACCAACGTTA 1560AACCAATCCC CAAGCGCAAC TCTGTCTCCC CCACACCCCA CCCGCCGCGC CGCGCGGAGC 1620CGTCCTCTAG CCCAGCTCCT CGGCTCGCGC TCTCCTCGCC TCCTGTGCTT TCCCCGCCGC 1680GGCGATG 1687(2)SEQ ID NO34的資料(i)序列特征(A)長度36個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO34CAGAACTAAG CTTACAGGAG GCGAGGAGAG CGCGAG 36(2)SEQ ID NO35的資料(i)序列特征(A)長度31個堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(基因組)(xi)序列描述SEQ ID NO5CAACAATGCT AGCCAAGCGC AACTCTGTCT C 31(2)SEQ ID NO36的資料(i)序列特征(A)長度31個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO36CAACAATGCT AGCCTTGGAA ACCAAGTTAC C 31(2)SEQ ID NO37的資料(i)序列特征(A)長度33個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO37CAACAATGCT AGCAGGAGCT TAGCGCACGC TCG 33(2)SEQ ID NO38的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO38CAACAATGCT AGCCATGCCG GCCTCCACGT AG 32(2)SEQ ID NO39的資料(i)序列特征(A)長度31個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO39CAACAATGCT AGCGTCCAGC TTATTATCAT G31(2)SEQ ID NO40的資料(i)序列特征(A)長度32個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO40CAACAATGCT AGCCTTAGTC CCCAAATGTA TC32(2)SEQ ID NO41的資料(i)序列特征(A)長度30個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO41CAACAATGCT AGCGGAGAAG GATCAGTGAG30(2)SEQ ID NO42的資料(i)序列特征(A)長度33個堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結(jié)構(gòu)線性(ii)分子類型DNA(xi)序列描述SEQ ID NO42CAACAATGCT AGCCTCCACC CACCGAGCAG AAG 3權(quán)利要求
1.一種神經(jīng)病理學(xué)篩選方法,其包括如下步驟a)從第一個個體得到一液體樣品;b)將此樣品與對ICAM-4具有特異性免疫反應(yīng)的抗體相接觸;c)對樣品中的ICAM-4/抗體結(jié)合作定量測定;d)將此個體中的ICAM-4/抗體結(jié)合同已知神經(jīng)病理正常的第二個個體的結(jié)果相比較。
2.權(quán)利要求1的方法,其中的液體樣品是血清。
3.權(quán)利要求1的方法,其中的液體樣品是腦脊液。
4.權(quán)利要求1的方法,其中ICAM-4/抗體結(jié)合是通過放射免疫測定法(RIA)進行定量測定的。
5.權(quán)利要求1的方法,其中ICAM-4/抗體結(jié)合是通過酶聯(lián)免疫吸附測定法(ELISA)進行定量測定的。
6.一個被純化和分離的DNA,其含有哺乳動物ICAM-4的啟動子。
7.權(quán)利要求6的DNA,其中所說的啟動子是人ICAM-4的啟動子。
8.權(quán)利要求7的DNA,其中的啟動子包含在SEQ ID NO33中。
9.權(quán)利要求8的DNA,其中所說的啟動子包含在SEQ ID NO33中從大約核苷酸1204到大約核苷酸1666的序列之中。
10.權(quán)利要求6到9中任一權(quán)項的DNA,其中所說的啟動子在神經(jīng)細胞中,能夠特異性地啟動對經(jīng)操作與該啟動子連接的多聚核苷酸的轉(zhuǎn)錄過程。
11.權(quán)利要求10的DNA,其中所說的神經(jīng)細胞是海馬細胞。
12.一種包含有人ICAM-4基因啟動子的嵌合體多聚核苷酸。
13.權(quán)利要求12的嵌合體多聚核苷酸,其中所說的啟動子包含在SEQ ID NO33的從大約核苷酸1204到大約核苷酸1666的序列之中。
14.一種含有權(quán)利要求6或12的DNA的表達載體。
15.一種用權(quán)利要求14的載體轉(zhuǎn)化的宿主細胞。
全文摘要
本發(fā)明公開了編碼一種新型的細胞間粘附分子多肽(被稱為“ICAM-4”)及其變異體的DNA序列,以及通過重組技術(shù)生產(chǎn)這種多肽的方法和材料。本發(fā)明還公開了一些與ICAM-4結(jié)合的分子及其用途。
文檔編號G01N33/68GK1164870SQ96190874
公開日1997年11月12日 申請日期1996年6月6日 優(yōu)先權(quán)日1995年6月7日
發(fā)明者P·D·基爾加農(nóng), W·M·加勒廷 申請人:艾科斯有限公司