專利名稱:具有抑制癌細胞生長功能的新的人蛋白及其編碼序列的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于生物技術(shù)領(lǐng)域,具體地說,本發(fā)明涉及新的編碼具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸編碼的多肽。本發(fā)明還涉及此多核苷酸和多肽的用途和制備。
人基因組學研究目前是國際上的熱點,除人染色體DNA大規(guī)模測序,表達序列測序(EST)的方法外,還缺少從功能開始的篩選具有功能基因的高通量的方法。
癌癥是危害人類健康的主要疾病之一。為了有效地治療和預防腫瘤,目前人們已越來越關(guān)注腫瘤的基因治療。因此,本領(lǐng)域迫切需要開發(fā)研究具有抑癌功能的人蛋白及其激動劑/抑制劑。
本發(fā)明的目的是提供一類新的具有抑癌功能的人蛋白多肽以及其片段、類似物和衍生物。
本發(fā)明的另一目的是提供編碼這些多肽的多核苷酸。
本發(fā)明的另一目的是提供生產(chǎn)這些多肽的方法以及該多肽和編碼序列的用途。
在本發(fā)明的第一方面,提供新穎的分離出的具有抑癌功能的蛋白多肽,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17;或其保守性變異多肽、或其活性片段、或其活性衍生物。
較佳地,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17。
在本發(fā)明的第二方面,提供了一種分離的多核苷酸,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。較佳地,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17。更佳地,該多核苷酸的序列選自下組SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18的編碼區(qū)序列或全長序列。
在本發(fā)明的第三方面,提供了含有上述多核苷酸的載體,以及被該載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞或者被上述多核苷酸直接轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
在本發(fā)明的第四方面,提供了制備具有抑癌功能的蛋白活性的多肽的制備方法,該方法包含(a)在適合表達具有抑癌功能的蛋白的條件下,培養(yǎng)上述被轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的蛋白活性的多肽。
在本發(fā)明的第五方面,提供了與上述的具有抑癌功能的蛋白多肽特異性結(jié)合的抗體。還提供了可用于檢測的核酸分子,它含有上述的多核苷酸中連續(xù)的10-800個核苷酸。
在本發(fā)明的第六方面,提供了一種藥物組合物,它含有安全有效量的本發(fā)明的具有抑癌功能的蛋白多肽以及藥學上可接受的載體。這些藥物組合物可治療癌癥以及細胞異常增殖等病癥。
本發(fā)明的其它方面由于本文的技術(shù)的公開,對本領(lǐng)域的技術(shù)人員而言是顯而易見的。
本發(fā)明采用大規(guī)模cDNA克隆轉(zhuǎn)染癌細胞,在獲得具有抑癌作用的基礎(chǔ)上,經(jīng)測序證明為新的基因,進一步得到全長cDNA克隆。DNA轉(zhuǎn)染試驗證明,本發(fā)明的具有抑癌功能的蛋白對癌細胞(肝癌細胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分離的”是指物質(zhì)從其原始環(huán)境中分離出來(如果是天然的物質(zhì),原始環(huán)境即是天然環(huán)境)。如活體細胞內(nèi)的天然狀態(tài)下的多聚核苷酸和多肽是沒有分離純化的,但同樣的多聚核苷酸或多肽如從天然狀態(tài)中同存在的其他物質(zhì)中分開,則為分離純化的。
如本文所用,“分離的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然與其相關(guān)的其它蛋白、脂類、糖類或其它物質(zhì)。本領(lǐng)域的技術(shù)人員能用標準的蛋白質(zhì)純化技術(shù)純化具有抑癌功能的蛋白?;旧霞兊亩嚯脑诜沁€原聚丙烯酰胺凝膠上能產(chǎn)生單一的主帶。具有抑癌功能的蛋白多肽的純度能用氨基酸序列分析。
本發(fā)明的多肽可以是重組多肽、天然多肽、合成多肽,優(yōu)選重組多肽。本發(fā)明的多肽可以是天然純化的產(chǎn)物,或是化學合成的產(chǎn)物,或使用重組技術(shù)從原核或真核宿主(例如,細菌、酵母、高等植物、昆蟲和哺乳動物細胞)中產(chǎn)生。根據(jù)重組生產(chǎn)方案所用的宿主,本發(fā)明的多肽可以是糖基化的,或可以是非糖基化的。本發(fā)明的多肽還可包括或不包括起始的甲硫氨酸殘基。
本發(fā)明還包括具有抑癌功能的人蛋白的片段、衍生物和類似物。如本文所用,術(shù)語“片段”、“衍生物”和“類似物”是指基本上保持本發(fā)明的天然具有抑癌功能的人蛋白相同的生物學功能或活性的多肽。本發(fā)明的多肽片段、衍生物或類似物可以是(ⅰ)有一個或多個保守或非保守性氨基酸殘基(優(yōu)選保守性氨基酸殘基)被取代的多肽,而這樣的取代的氨基酸殘基可以是也可以不是由遺傳密碼編碼的,或(ⅱ)在一個或多個氨基酸殘基中具有取代基團的多肽,或(ⅲ)成熟多肽與另一個化合物(比如延長多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(ⅳ)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前導序列或分泌序列或用來純化此多肽的序列或蛋白原序列)。根據(jù)本文的教導,這些片段、衍生物和類似物屬于本領(lǐng)域熟練技術(shù)人員公知的范圍。
本發(fā)明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因組DNA或人工合成的DNA。DNA可以是單鏈的或是雙鏈的。DNA可以是編碼鏈或非編碼鏈。以PP2703蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO:3所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO:2的蛋白質(zhì),但與SEQ IDNO:3所示的編碼區(qū)序列有差別的核酸序列。以PP3227蛋白(在本申請中,蛋白質(zhì)的命名采用其克隆編號)為例,編碼成熟多肽的編碼區(qū)序列可以與SEQ ID NO:6所示的編碼區(qū)序列相同或者是簡并的變異體。如本文所用,“簡并的變異體”在本發(fā)明中是指編碼具有SEQ ID NO:5的蛋白質(zhì),但與SEQ ID NO:6所示的編碼區(qū)序列有差別的核酸序列。對于其他具有抑癌功能的蛋白,可依此類推。對于其他具有抑癌功能的蛋白,可依此類推。
編碼成熟多肽的多核苷酸包括只編碼成熟多肽的編碼序列;成熟多肽的編碼序列和各種附加編碼序列;成熟多肽的編碼序列(和任選的附加編碼序列)以及非編碼序列。
術(shù)語“編碼多肽的多核苷酸”可以是包括編碼此多肽的多核苷酸,也可以是還包括附加編碼和/或非編碼序列的多核苷酸。
本發(fā)明還涉及上述多核苷酸的變異體,其編碼與本發(fā)明有相同的氨基酸序列的多肽或多肽的片段、類似物和衍生物。此多核苷酸的變異體可以是天然發(fā)生的等位變異體或非天然發(fā)生的變異體。這些核苷酸變異體包括取代變異體、缺失變異體和插入變異體。如本領(lǐng)域所知的,等位變異體是一個多核苷酸的替換形式,它可能是一個或多個核苷酸的取代、缺失或插入,但不會從實質(zhì)上改變其編碼的多肽的功能。
本發(fā)明還涉及與上述的序列雜交且兩個序列之間具有至少50%,較佳地至少70%,更佳地至少80%相同性的多核苷酸。本發(fā)明特別涉及在嚴格條件下與本發(fā)明所述多核苷酸可雜交的多核苷酸。在本發(fā)明中,“嚴格條件”是指(1)在較低離子強度和較高溫度下的雜交和洗脫,如0.2×SSC,0.1%SDS,60℃;或(2)雜交時加有變性劑,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)僅在兩條序列之間的相同性至少在95%以上,更好是97%以上時才發(fā)生雜交。并且,可雜交的多核苷酸編碼的多肽與SEQ IDNO:2所示的成熟多肽有相同的生物學功能和活性。
本發(fā)明還涉及與上述的序列雜交的核酸片段。如本文所用,“核酸片段”的長度至少含15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸以上。核酸片段可用于核酸的擴增技術(shù)(如PCR)以確定和/或分離編碼具有抑癌功能的蛋白的多聚核苷酸。
本發(fā)明中的多肽和多核苷酸優(yōu)選以分離的形式提供,更佳地被純化至均質(zhì)。
本發(fā)明的DNA序列能用幾種方法獲得。例如,用本領(lǐng)域熟知的雜交技術(shù)分離DNA。這些技術(shù)包括但不局限于1)用探針與基因組或cDNA文庫雜交以檢出同源性核苷酸序列,和2)表達文庫的抗體篩選以檢出具有共同結(jié)構(gòu)特征的克隆的DNA片段。
編碼具有抑癌功能的蛋白的特異DNA片段序列產(chǎn)生也能用下列方法獲得1)從基因組DNA分離雙鏈DNA序列;2)化學合成DNA序列以獲得所需多肽的雙鏈DNA。
上述提到的方法中,分離基因組DNA最不常用。當需要的多肽產(chǎn)物的整個氨基酸序列已知時,DNA序列的直接化學合成是經(jīng)常選用的方法。如果所需的氨基酸的整個序列不清楚時,DNA序列的直接化學合成是不可能的,選用的方法是cDNA序列的分離。分離感興趣的cDNA的標準方法是從高表達該基因的供體細胞分離mRNA并進行逆轉(zhuǎn)錄,形成質(zhì)?;蚴删wcDNA文庫。提取mRNA的方法已有多種成熟的技術(shù),試劑盒也可從商業(yè)途徑獲得(Qiagene)。而構(gòu)建cDNA文庫也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。還可得到商業(yè)供應(yīng)的cDNA文庫,如Clontech公司的不同cDNA文庫。當結(jié)合使用聚合酶反應(yīng)技術(shù)時,即使極少的表達產(chǎn)物也能克隆。
可用常規(guī)方法從這些cDNA文庫中篩選本發(fā)明的基因。這些方法包括(但不限于)(1)DNA-DNA或DNA-RNA雜交;(2)標志基因的功能出現(xiàn)或喪失;(3)測定具有抑癌功能的蛋白的轉(zhuǎn)錄本的水平;(4)通過免疫學技術(shù)或測定生物學活性,來檢測基因表達的蛋白產(chǎn)物。上述方法可單用,也可多種方法聯(lián)合應(yīng)用。
在第(1)種方法中,雜交所用的探針是與本發(fā)明的多核苷酸的任何一部分同源,其長度至少15個核苷酸,較好是至少30個核苷酸,更好是至少50個核苷酸,最好是至少100個核苷酸。此外,探針的長度通常在2kb之內(nèi),較佳地為1kb之內(nèi)。此處所用的探針通常是在本發(fā)明的基因DNA序列信息的基礎(chǔ)上化學合成的DNA序列。本發(fā)明的基因本身或者片段當然可以用作探針。DNA探針的標記可用放射性同位素,熒光素或酶(如堿性磷酸酶)等。
在第(4)種方法中,檢測具有抑癌功能的蛋白基因表達的蛋白產(chǎn)物可用免疫學技術(shù)如Western印跡法,放射免疫沉淀法,酶聯(lián)免疫吸附法(ELISA)等。
應(yīng)用PCR技術(shù)擴增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被優(yōu)選用于獲得本發(fā)明的基因。特別是很難從文庫中得到全長的cDNA時,可優(yōu)選使用RACE法(RACE-cDNA末端快速擴增法),用于PCR的引物可根據(jù)本文所公開的本發(fā)明的序列信息適當?shù)剡x擇,并可用常規(guī)方法合成??捎贸R?guī)方法如通過凝膠電泳分離和純化擴增的DNA/RNA片段。
如上所述得到的本發(fā)明的基因,或者各種DNA片段等的核苷酸序列的測定可用常規(guī)方法如雙脫氧鏈終止法(Sanger et al.PNAS,1977,74:5463-5467)。這類核苷酸序列測定也可用商業(yè)測序試劑盒等。為了獲得全長的cDNA序列,測序需反復進行。有時需要測定多個克隆的cDNA序列,才能拼接成全長的cDNA序列。
本發(fā)明也涉及包含本發(fā)明的多核苷酸的載體,以及用本發(fā)明的載體或具有抑癌功能的蛋白編碼序列經(jīng)基因工程產(chǎn)生的宿主細胞,以及經(jīng)重組技術(shù)產(chǎn)生本發(fā)明所述多肽的方法。
通過常規(guī)的重組DNA技術(shù),可利用本發(fā)明的多聚核苷酸序列可用來表達或生產(chǎn)重組的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般來說有以下步驟(1).用本發(fā)明的編碼具有抑癌功能的人蛋白的多核苷酸(或變異體),或用含有該多核苷酸的重組表達載體轉(zhuǎn)化或轉(zhuǎn)導合適的宿主細胞;(2).在合適的培養(yǎng)基中培養(yǎng)的宿主細胞;(3).從培養(yǎng)基或細胞中分離、純化蛋白質(zhì)。
本發(fā)明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重組表達載體中。術(shù)語“重組表達載體”指本領(lǐng)域熟知的細菌質(zhì)粒、噬菌體、酵母質(zhì)粒、植物細胞病毒、哺乳動物細胞病毒如腺病毒、逆轉(zhuǎn)錄病毒或其他載體。在本發(fā)明中適用的載體包括但不限于在細菌中表達的基于T7的表達載體(Rosenberg,et a1.Gene,1987,56:125);在哺乳動物細胞中表達的pMSXND表達載體(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆蟲細胞中表達的來源于桿狀病毒的載體??傊?,只要能在宿主體內(nèi)復制和穩(wěn)定,任何質(zhì)粒和載體都可以用。表達載體的一個重要特征是通常含有復制起點、啟動子、標記基因和翻譯控制元件。
本領(lǐng)域的技術(shù)人員熟知的方法能用于構(gòu)建含具有抑癌功能的人蛋白編碼DNA序列和合適的轉(zhuǎn)錄/翻譯控制信號的表達載體。這些方法包括體外重組DNA技術(shù)、DNA合成技術(shù)、體內(nèi)重組技術(shù)等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,coldSpring Harbor Laboratory.New York,1989)。所述的DNA序列可有效連接到表達載體中的適當啟動子上,以指導mRNA合成。這些啟動子的代表性例子有大腸桿菌的lac或trp啟動子;λ噬菌體PL啟動子;真核啟動子包括CMV立即早期啟動子、HSV胸苷激酶啟動子、早期和晚期SV40啟動子、反轉(zhuǎn)錄病毒的LTRs和其他一些已知的可控制基因在原核或真核細胞或其病毒中表達的啟動子。表達載體還包括翻譯起始用的核糖體結(jié)合位點和轉(zhuǎn)錄終止子。
此外,表達載體優(yōu)選地包含一個或多個選擇性標記基因,以提供用于選擇轉(zhuǎn)化的宿主細胞的表型性狀,如真核細胞培養(yǎng)用的二氫葉酸還原酶、新霉素抗性以及綠色熒光蛋白(GFP),或用于大腸桿菌的四環(huán)素或氨芐青霉素抗性。
包含上述的適當DNA序列以及適當啟動子或者控制序列的載體,可以用于轉(zhuǎn)化適當?shù)乃拗骷毎允蛊淠軌虮磉_蛋白質(zhì)。
宿主細胞可以是原核細胞,如細菌細胞;或是低等真核細胞,如酵母細胞;或是高等真核細胞,如哺乳動物細胞。代表性例子有大腸桿菌,鏈霉菌屬;鼠傷寒沙門氏菌的細菌細胞;真菌細胞如酵母;植物細胞;果蠅S2或Sf9的昆蟲細胞;CHO、COS或Bowes黑素瘤細胞的動物細胞等。
本發(fā)明的多核苷酸在高等真核細胞中表達時,如果在載體中插入增強子序列時將會使轉(zhuǎn)錄得到增強。增強子是DNA的順式作用因子,通常大約有10到300個堿基對,作用于啟動子以增強基因的轉(zhuǎn)錄。可舉的例子包括在復制起始點晚期一側(cè)的100到270個堿基對的SV40增強子、在復制起始點晚期一側(cè)的多瘤增強子以及腺病毒增強子等。
本領(lǐng)域一般技術(shù)人員都清楚如何選擇適當?shù)妮d體、啟動子、增強子和宿主細胞。
用重組DNA轉(zhuǎn)化宿主細胞可用本領(lǐng)域技術(shù)人員熟知的常規(guī)技術(shù)進行。當宿主為原核生物如大腸桿菌時,能吸收DNA的感受態(tài)細胞可在指數(shù)生長期后收獲,用CaCl2法處理,所用的步驟在本領(lǐng)域眾所周知??晒┻x擇的是用MgCl2。如果需要,轉(zhuǎn)化也可用電穿孔的方法進行。當宿主是真核生物,可選用如下的DNA轉(zhuǎn)染方法磷酸鈣共沉淀法,常規(guī)機械方法如顯微注射、電穿孔、脂質(zhì)體包裝等。
獲得的轉(zhuǎn)化子可以用常規(guī)方法培養(yǎng),表達本發(fā)明的基因所編碼的多肽。根據(jù)所用的宿主細胞,培養(yǎng)中所用的培養(yǎng)基可選自各種常規(guī)培養(yǎng)基。在適于宿主細胞生長的條件下進行培養(yǎng)。當宿主細胞生長到適當?shù)募毎芏群?,用合適的方法(如溫度轉(zhuǎn)換或化學誘導)誘導選擇的啟動子,將細胞再培養(yǎng)一段時間。
在上面的方法中的重組多肽可包被于細胞內(nèi)、細胞外或在細胞膜上表達或分泌到細胞外。如果需要,可利用其物理的、化學的和其它特性通過各種分離方法分離和純化重組的蛋白。這些方法是本領(lǐng)域技術(shù)人員所熟知的。這些方法的例子包括但并不限于常規(guī)的復性處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透破菌、超處理、超離心、分子篩層析(凝膠過濾)、吸附層析、離子交換層析、高效液相層析(HPLC)和其它各種液相層析技術(shù)及這些方法的結(jié)合。
重組的具有抑癌功能的人蛋白或多肽有多方面的用途。這些用途包括(但不限于)直接做為藥物治療具有抑癌功能的蛋白功能低下或喪失所致的疾病,和用于篩選促進或?qū)咕哂幸职┕δ艿牡鞍坠δ艿目贵w、多肽或其它配體。例如,抗體可用于激活或抑制具有抑癌功能的人蛋白的功能。用表達的重組具有抑癌功能的人蛋白篩選多肽庫可用于尋找有治療價值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本發(fā)明也提供了篩選藥物以鑒定提高(激動劑)或阻遏(拮抗劑)具有抑癌功能的人蛋白的藥劑的方法。激動劑提高具有抑癌功能的人蛋白刺激細胞增殖等生物功能,而拮抗劑阻止和治療與細胞過度增殖有關(guān)的紊亂如各種癌癥。例如,能在藥物的存在下,將哺乳動物細胞或表達具有抑癌功能的人蛋白的膜制劑與標記的具有抑癌功能的人蛋白一起培養(yǎng)。然后測定藥物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗劑包括篩選出的抗體、化合物、受體缺失物和類似物等。具有抑癌功能的人蛋白的拮抗劑可以與具有抑癌功能的人蛋白結(jié)合并消除其功能,或是抑制具有抑癌功能的人蛋白的產(chǎn)生,或是與多肽的活性位點結(jié)合使多肽不能發(fā)揮生物學功能。具有抑癌功能的人蛋白的拮抗劑可用于治療用途。
在篩選作為拮抗劑的化合物時,可以將具有抑癌功能的蛋白加入生物分析測定中,通過測定化合物影響具有抑癌功能的蛋白和其受體之間的相互作用來確定化合物是否是拮抗劑。用上述篩選化合物的同樣方法,可以篩選出起拮抗劑作用的受體缺失物和類似物。
本發(fā)明的多肽可直接用于疾病治療,例如,各種惡性腫瘤、和細胞異常增殖等。
本發(fā)明的多肽,及其片段、衍生物、類似物或它們的細胞可以用來作為抗原以生產(chǎn)抗體。這些抗體可以是多克隆或單克隆抗體。多克隆抗體可以通過將此多肽直接注射動物的方法得到。制備單克隆抗體的技術(shù)包括雜交瘤技術(shù),三瘤技術(shù),人B-細胞雜交瘤技術(shù),EBV-雜交瘤技術(shù)等。
可以將本發(fā)明的多肽和拮抗劑與合適的藥物載體組合后使用。這些載體可以是水、葡萄糖、乙醇、鹽類、緩沖液、甘油以及它們的組合。組合物包含安全有效量的多肽或拮抗劑以及不影響藥物效果的載體和賦形劑。這些組合物可以作為藥物用于疾病治療。
本發(fā)明還提供含有一種或多種容器的藥盒或試劑盒,容器中裝有一種或多種本發(fā)明的藥用組合物成分。與這些容器一起,可以有由制造、使用或銷售藥品或生物制品的政府管理機構(gòu)所給出的指示性提示,該提示反映出生產(chǎn)、使用或銷售的政府管理機構(gòu)許可其在人體上施用。此外,本發(fā)明的多肽可以與其它的治療化合物結(jié)合使用。
藥物組合物可以以方便的方式給藥,如通過局部、靜脈內(nèi)、腹膜內(nèi)、肌內(nèi)、皮下、鼻內(nèi)或皮內(nèi)的給藥途徑。具有抑癌功能的蛋白以有效地治療和/或預防具體的適應(yīng)癥的量來給藥。施用于患者的具有抑癌功能的蛋白的量和劑量范圍將取決于許多因素,如給藥方式、待治療者的健康條件和診斷醫(yī)生的判斷。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多種治療目的?;蛑委熂夹g(shù)可用于治療由于具有抑癌功能的蛋白的無表達或異常/無活性的具有抑癌功能的蛋白的表達所致的細胞增殖、發(fā)育或代謝異常。重組的基因治療載體(如病毒載體)可設(shè)計成表達變異的具有抑癌功能的蛋白,以抑制內(nèi)源性的具有抑癌功能的蛋白活性。例如,一種變異的具有抑癌功能的蛋白可以是縮短的、缺失了信號傳導功能域的具有抑癌功能的蛋白,雖可與下游的底物結(jié)合,但缺乏信號傳導活性。因此重組的基因治療載體可用于治療具有抑癌功能的蛋白表達或活性異常所致的疾病。來源于病毒的表達載體如逆轉(zhuǎn)錄病毒、腺病毒、腺病毒相關(guān)病毒、單純皰疹病毒、細小病毒等可用于將具有抑癌功能的蛋白基因轉(zhuǎn)移至細胞內(nèi)。構(gòu)建攜帶具有抑癌功能的蛋白基因的重組病毒載體的方法可見于已有文獻(Sambrook,et al.)。另外重組具有抑癌功能的人蛋白基因可包裝到脂質(zhì)體中轉(zhuǎn)移至細胞內(nèi)。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反義RNA和DNA)以及核酶也在本發(fā)明的范圍之內(nèi)。核酶是一種能特異性分解特定RNA的酶樣RNA分子,其作用機制是核酶分子與互補的靶RNA特異性雜交后進行核酸內(nèi)切作用。反義的RNA和DNA及核酶可用已有的任何RNA或DNA合成技術(shù)獲得,如固相磷酸酰胺化學合成法合成寡核苷酸的技術(shù)已廣泛應(yīng)用。反義RNA分子可通過編碼該RNA的DNA序列在體外或體內(nèi)轉(zhuǎn)錄獲得。這種DNA序列已整合到載體的RNA聚合酶啟動子的下游。為了增加核酸分子的穩(wěn)定性,可用多種方法對其進行修飾,如增加兩側(cè)的序列長度,核糖核苷之間的連接應(yīng)用磷酸硫酯鍵或肽鍵而非磷酸二酯鍵。
多聚核苷酸導入組織或細胞內(nèi)的方法包括將多聚核苷酸直接注入到體內(nèi)組織中;或在體外通過載體(如病毒、噬菌體或質(zhì)粒等)先將多聚核苷酸導入細胞中,再將細胞移植到體內(nèi)等。
本發(fā)明的多肽還可用作肽譜分析,例如,多肽可用物理的、化學或酶進行特異性切割,并進行一維或二維或三維的凝膠電泳分析。
本發(fā)明還提供了針對具有抑癌功能的人蛋白抗原決定簇的抗體。這些抗體包括(但不限于)多克隆抗體、單克隆抗體、嵌合抗體、單鏈抗體、Fab片段和Fab表達文庫產(chǎn)生的片段。
抗具有抑癌功能的人蛋白的抗體可用于免疫組織化學技術(shù)中,檢測活檢標本中的具有抑癌功能的人蛋白。
與具有抑癌功能的人蛋白結(jié)合的單克隆抗體也可用放射性同位素標記,注入體內(nèi)可跟蹤其位置和分布。這種放射性標記的抗體可作為一種非創(chuàng)傷性診斷方法用于腫瘤細胞的定位和判斷是否有轉(zhuǎn)移。
本發(fā)明中的抗體可用于治療或預防與具有抑癌功能的人蛋白相關(guān)的疾病。給予適當劑量的抗體可以刺激或阻斷具有抑癌功能的人蛋白的產(chǎn)生或活性。
抗體也可用于設(shè)計針對體內(nèi)某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高親和性的單克隆抗體可與細菌或植物毒素(如白喉毒素,蓖麻蛋白,紅豆堿等)共價結(jié)合。一種通常的方法是用巰基交聯(lián)劑如SPDP,攻擊抗體的氨基,通過二硫鍵的交換,將毒素結(jié)合于抗體上,這種雜交抗體可用于殺滅具有抑癌功能的人蛋白陽性的細胞。
多克隆抗體的生產(chǎn)可用具有抑癌功能的人蛋白或多肽免疫動物,如家兔,小鼠,大鼠等。多種佐劑可用于增強免疫反應(yīng),包括但不限于弗氏佐劑等。
具有抑癌功能的人蛋白單克隆抗體可用雜交瘤技術(shù)生產(chǎn)(Kohler and Milstein.Nature,1975,256:495-497)。將人恒定區(qū)和非人源的可變區(qū)結(jié)合的嵌合抗體可用已有的技術(shù)生產(chǎn)(Morrison et al,PNAS,1985,81:6851)。而已有的生產(chǎn)單鏈抗體的技術(shù)(U.S.PatNo.4946778)也可用于生產(chǎn)抗具有抑癌功能的人蛋白的單鏈抗體。
能與具有抑癌功能的人蛋白結(jié)合的多肽分子可通過篩選由各種可能組合的氨基酸結(jié)合于固相物組成的隨機多肽庫而獲得。篩選時,必須對具有抑癌功能的人蛋白分子進行標記。
本發(fā)明還涉及定量和定位檢測具有抑癌功能的人蛋白水平的診斷試驗方法。這些試驗是本領(lǐng)域所熟知的,且包括FISH測定和放射免疫測定。試驗中所檢測的具有抑癌功能的人蛋白水平,可以用作解釋具有抑癌功能的人蛋白在各種疾病中的重要性和用于診斷具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相關(guān)疾病的診斷和治療。在診斷方面,具有抑癌功能的蛋白的多聚核苷酸可用于檢測具有抑癌功能的蛋白的表達與否或在疾病狀態(tài)下具有抑癌功能的蛋白的異常表達。如具有抑癌功能的蛋白DNA序列可用于對活檢標本的雜交以判斷具有抑癌功能的蛋白的表達異常。雜交技術(shù)包括Southern印跡法,Northern印跡法、原位雜交等。這些技術(shù)方法都是公開的成熟技術(shù),相關(guān)的試劑盒都可從商業(yè)途徑得到。本發(fā)明的多核苷酸的一部分或全部可作為探針固定在微陣列(Microarray)或DNA芯片(又稱為“基因芯片”)上,用于分析組織中基因的差異表達分析和基因診斷。用具有抑癌功能的蛋白特異的引物進行RNA-聚合酶鏈反應(yīng)(RT-PCR)體外擴增也可檢測具有抑癌功能的蛋白的轉(zhuǎn)錄產(chǎn)物。
檢測具有抑癌功能的蛋白基因的突變也可用于診斷具有抑癌功能的蛋白相關(guān)的疾病。具有抑癌功能的蛋白突變的形式包括與正常野生型具有抑癌功能的蛋白DNA序列相比的點突變、易位、缺失、重組和其它任何異常等??捎靡延械募夹g(shù)如Southern印跡法、DNA序列分析、PCR和原位雜交檢測突變。另外,突變有可能影響蛋白的表達,因此用Northern印跡法、Western印跡法可間接判斷基因有無突變。
本發(fā)明的序列對染色體鑒定也是有價值的。該序列會特異性地針對某條人染色體具體位置且并可以與其雜交。目前,需要鑒定染色體上的各基因的具體位點?,F(xiàn)在,只有很少的基于實際序列數(shù)據(jù)(重復多態(tài)性)的染色體標記物可用于標記染色體位置。根據(jù)本發(fā)明,為了將這些序列與疾病相關(guān)基因相關(guān)聯(lián),其重要的第一步就是將這些DNA序列定位于染色體上。
簡而言之,根據(jù)cDNA制備PCR引物(優(yōu)選15-35bp),可以將序列定位于染色體上。然后,將這些引物用于PCR篩選含各條人染色體的體細胞雜合細胞。只有那些含有相應(yīng)于引物的人基因的雜合細胞會產(chǎn)生擴增的片段。
體細胞雜合細胞的PCR定位法,是將DNA定位到具體染色體的快捷方法。使用本發(fā)明的的寡核苷酸引物,通過類似方法,可利用一組來自特定染色體的片段或大量基因組克隆而實現(xiàn)亞定位??捎糜谌旧w定位的其它類似策略包括原位雜交、用標記的流式分選的染色體預篩選和雜交預選,從而構(gòu)建染色體特異的cDNA庫。
將cDNA克隆與中期染色體進行熒光原位雜交(FISH),可以在一個步驟中精確地進行染色體定位。此技術(shù)的綜述,參見Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到準確的染色體位置,此序列在染色體上的物理位置就可以與基因圖數(shù)據(jù)相關(guān)聯(lián)。這些數(shù)據(jù)可見于例如,V.Mckusick,Mendelian Inheritance in Man(可通過與Johns Hopkins University Welch Medical Library聯(lián)機獲得)。然后可通過連鎖分析,確定基因與業(yè)已定位到染色體區(qū)域上的疾病之間的關(guān)系。
接著,需要測定患病和未患病個體間的cDNA或基因組序列差異。如果在一些或所有的患病個體中觀察到某突變,而該突變在任何正常個體中未觀察到,則該突變可能是疾病的病因。比較患病和未患病個體,通常涉及首先尋找染色體中結(jié)構(gòu)的變化,如從染色體水平可見的或用基于cDNA序列的PCR可檢測的缺失或易位。根據(jù)目前的物理作圖和基因定位技術(shù)的分辨能力,被精確定位至與疾病有關(guān)的染色體區(qū)域的cDNA,可以是50至500個潛在致病基因間之一種(假定1兆堿基作圖分辨能力和每20kb對應(yīng)于一個基因)。
本發(fā)明的具有抑癌功能的蛋白核苷酸全長序列或其片段通??梢杂肞CR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列,尤其是開放閱讀框序列來設(shè)計引物,并用市售的cDNA庫或按本領(lǐng)域技術(shù)人員已知的常規(guī)方法所制備的cDNA庫作為模板,擴增而得有關(guān)序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關(guān)的序列,就可以用重組法來大批量地獲得有關(guān)序列。這通常是將其克隆入載體,再轉(zhuǎn)入細胞,然后通過常規(guī)方法從增殖后的宿主細胞中分離得到有關(guān)序列。
此外,還可用人工合成的方法來合成有關(guān)序列,尤其是片段長度較短時。通常,通過先合成多個小片段,然后再進行連接可獲得序列很長的片段。
目前,已經(jīng)可以完全通過化學合成來編碼本發(fā)明蛋白(或其片段,或其衍生物)的DNA序列。然后可將該DNA序列引入本領(lǐng)域中的各種DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發(fā)明蛋白序列中。
此外,由于本發(fā)明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,與來源于其他物種的同族蛋白相比,預計在施用于人時將具有更高的活性和/或更低的副作用(例如在人體內(nèi)的免疫原性更低或沒有)。
下面結(jié)合具體實施例,進一步闡述本發(fā)明。應(yīng)理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規(guī)條件如Sambrook等人,分子克隆實驗室手冊(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例1:cDNA基因的獲得及對癌細胞克隆形成的抑制作用PP2703,PP3227,PP3564,PP3686,PP3774,PP3781是通過用常規(guī)方法構(gòu)建人胎盤cDNA文庫而獲得的。取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純kit(pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文庫構(gòu)建kit(Seratagene公司)構(gòu)建上述mRNA的cDNA文庫。其中反轉(zhuǎn)錄酶改用MMLV-RT-SuperscriptⅡ(GIBCO BRL),反轉(zhuǎn)錄反應(yīng)在42℃進行。轉(zhuǎn)化XL 10-Gold感受細胞,獲得了1×106cfu/μg cDNA滴度的cDNA文庫。第一輪隨機挑取cDNA克隆,其后以高豐度cDNA克隆和已證明有抑癌細胞生長功能的cDNA克隆為探針,雜交篩選cDNA文庫,挑取弱陽性及陰性克隆。用Qiagen 96孔板質(zhì)粒抽提kit,按廠家說明書進行質(zhì)粒DNA的提取。質(zhì)粒DNA和空載體同時轉(zhuǎn)染肝癌細胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待轉(zhuǎn)染。每份DNA樣品中加0.74μl脂質(zhì)體及9.3μl無血清培液,混勻后,室溫放置10分鐘。每管中加150μl無血清培液,均分加入3孔生長于96孔板的7721細胞中,37℃放置2小時,每孔再加50μl無血清培液,37℃24小時。每孔換100μl全培液,37℃24小時,換含G418的全培液100μl,37℃ 24~48小時,邊觀察,邊換G418濃度不等的培液。約2~3次后,直到鏡檢細胞有克隆形成,計數(shù)。發(fā)現(xiàn)以上克隆有抑制細胞克隆形成作用,結(jié)果如下表所示。
cDNA克隆轉(zhuǎn)染細胞(7721)克隆形成情況
對cDNA克隆采用雙脫氧終止法,在ABI377 DNA自動測序儀上測定其一端近500bp的核苷酸序列。分析后,確定為新基因克隆,進行另一端測序,仍未獲得全長cDNA序列,設(shè)計引物,再次進行測序,直到獲得全長序列(SEQ ID NO:1、4、7、10、13、16)。
實施例2從胎盤cDNA中PCR獲得全長基因取3、6、10月齡的胎盤組織,用Trizol試劑(GIBCO BRL公司)按廠方說明書提取總RNA,用mRNA提純試劑盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptⅡ(GIBCO BRL)反轉(zhuǎn)錄酶在42℃進行反轉(zhuǎn)錄反應(yīng),獲得胎盤cDNA。利用各個基因的轉(zhuǎn)異引物(如下表所示),按90℃ 3分鐘1個循環(huán);94℃ 30秒,60℃30秒,72℃ 1分鐘,共35個循環(huán);72℃ 10分鐘,1個循環(huán)進行PCR擴增,獲得含有完整開放閱讀框序列的各蛋白基因的擴增產(chǎn)物。擴增產(chǎn)物經(jīng)測序驗證,與實施例1測得的序列相符,隨后用常規(guī)技術(shù)將擴增產(chǎn)物轉(zhuǎn)入宿主細胞,獲得重組蛋白。
基因特異引物
實施例3:cDNA克隆序列分析1.PP2703A核苷酸序列PP2703(SEQ ID NO:1)長度2518bp1 GGGATTTTCT GCTCCGGTTG GTGAGCGCGC CTGCGCGTTG ACGGCGATTT51 TGCGTTCTGA GGCTGCAGCG TCGGCATCTT GAGCTGCCGG TTCGCGAGTT101 CGAGGCCAGG TTCCGCCTGT CGTGGGTTCG CACCCCGGAC GCGATGCTAT151 TCGACAAGGT GAAAGCGTTC TCGGTGCAGT TGGACGGCGC GACCGCGGGC201 GTCGAGCCCG TGTTTAGCGG CGGCCAGGCC GTGGCGGGCC GGGTGCTGCT251 GGAGCTGTCA AGCGCCGCGC GTGTGGGTGC CCTGAGGCTG CGCGCGCGGG301 GCCGCGCCCA CGTGCACTGG ACCGAGTCGC GCAGCGCGGG CTCGAGCACG351 GCTTACACGC AGAGCTACAG TGAACGCGTG GAGGTCGTGA GCCACCGCGC401 CACGCTCCTG GCGCCAGATA CCGGGGAGAC CACGACGCTG CCTCCTGGGC451 GCCATGAGTT CCTGTTCAGC TTCCAGCTGC CCCCGACCCT GGTGACATCC501 TTCGAGGGCA AACACGGTAG TGTCCGCTAC TGTATCAAGG CCACCCTGCA551 CCGGCCCTGG GTCCCAGCAC GCCGGGCAAG GAAGGTGTTC ACTGTCATCG601 AGCCTGTGGA CATCAACACG CCAGCCCTGC TGGCACCTCA AGCGGGGGCT651 CGGGAAAAGG TTGCCCGATC CTGGTACTGT AACCGTGGCC TAGTCTCCCT701 TTCGGCCAAG ATCGACCGCA AGGGCTACAC CCCAGGAGAG GTCATCCCTG751 TCTTTGCCGA GATCGACAAC GGCTCCACAC GTCCTGTGCT GCCTCGGGCA801 GCCGTGGTGC AGACACAGAC GTTCATGGCC CGAGGCGCCC GAAAGCAGAA851 ACGGGCAGTG GTGGCCAGCC TCGCGGGCGA GCCGGTGGGC CCCGGGCAGC901 GGGCGCTGTG GCAGGGCCGG GCACTGCGGA TCCCCCCAGT GGGTCCTTCC951 ATCCTGCACT GCCGCGTTCT ACACGTGGAC TACGCACTCA AGGTCTGTGT1001 GGATATCCCA GGAACGTCCA AGCTGCTGCT GGAGCTGCCA CTGGTGATCG1051 GCACCATTCC CTTGCACCCT TTTGGCAGCC GTTCCTCCAG CGTGGGCAGC1101 CACGCCAGCT TCCTGCTGGA CTGGAGGCTG GGGGCCTTGC CGGAGCGGCC1151 TGAGGCTCCT CCTGAGTACT CGGAGGTGGT AGCCGACACT GAGGAGGCAG1201 CCTTGGGGCA GAGCCCCTTC CCGCTTCCGC AGGACCCCGA CATGAGCCTT1251 GAAGGCCCGT TCTTCGCCTA CATCCAAGAG TTCCGCTACC GCCCGCCACC1301 CCTGTACTCT GAGGAGGATC CAAACCCACT CTTGGGGGAC ATGAGGCCGC1351 GCTGCATGAC TTGCTGAACG GCACAGGGAC CCCTCGAGGA ACAAGGTTGC1401 ACACCAGCTT TCAGCCACCA TGACTGTGGG GAGTGGCTGG ACCAAGGGCT1451 GACCTCCCCG ACTGCATCAA AGTTGGGGAA CCAAGTCTCA GAGTGAGGCG1501 GGGGCCTTTC GGATATCACA TGGGACAGAG GAAGAGCCCG GCTGGAATCT1551 GACTTACCTG GACCGCTGTC CTTGTGAGGC ATTGAATGCC CAGTGCAGTA1601 TCCGAGAGAC TGTTTAATAA CCTGTCTTCC CAGCCAATTG GTGGTGCTGG1651 AATCCCCTAG GAGCCTTCAG TCTGGGAGAA ACAGAGCCAG ACATAGACAG1701 TTCCAGCATC ACAGAACCAG AAGAAGAGAC CTGCAACTGT GAGAGTCCAG1751 ACAGGAAGCA GAGAAGGCGT CCTTGCGGAA AGGGCATTTT AGCTGAGGCT1801 TTGGAGTACG AATAGGAGCT CAGCAGGCAG ACGAATGAGG AATAAAGGTC1851 AGAGAAGGTC AGAGCTGAGT GACGTTTGGA ATCCACCCCG TTTATTGTAG1901 AACTGGGGGT TCAGAGGGCA GGTGCCTCAG AGTTGAGGCC ACACAGTGAG1951 GTCTGGTGGG TGAAAGGACC CAGGAACGAG GCGTTCAGGA AAGCAGGTTG2001 TCAGAGCTAT GTGGAGTCTG TGGGTGGCAG GGGCAGCCGC TCCAGCCTTT2051 GAAGACTTTG AAAGCCAGAG ATTCCTGGCG CAGGCTTGGA CTTCCTGGGA2101 GCTCCTCCAA GTACCCAGGG GCATCAGAGC TGCCTGGGTG TTACATGGCC2151 CAGGGAACCC AGGTTCAGGG TAGGACAGGC AAGACCAGAT ACCCAATGTG2201 CAAAGTGAAA ACACTGGGCT CCCTGTTAAA CGATGAAGAA TTCAAGACAG2251 TGACAGCATT ACGTCACCCC TGGGGACAGA GGTCAGCCTA AGGTGACACA2301 CGGGGACTAC TGTGCTTCCG GAGGCTCCCT GTGTCCTGGA GGAGAAAAGC2351 ATTAGAGGGG GCAGCTGGAC AAGCTCCCAA CTGCAGAGTC CCAGCCCTGG2401 CTGGGGCAGG GCCCCGGCCT GGGACTCAGC ATTTCTGATA TGCCTTAAGA2451 ATTCATTCTG TTTTGTACAA TTATTTTTTA AAAGTAAACG TGTGGAGAAA2501 GAAAAAAAAA AAAAAAAAB.氨基酸序列PP2703(SEQ ID NO:2)長度407個氨基酸1 MLFDKVKAFS VQLDGATAGV EPVFSGGQAV AGRVLLELSS AARVGALRLR51 ARGRAHVHWT ESRSAGSSTA YTQSYSERVE VVSHRATLLA PDTGETTTLP101 PGRHEFLFSF QLPPTLVTSF EGKHGSVRYC IKATLHRPWV PARRARKVFT151 VIEPVDINTP ALLAPQAGAR EKVARSWYCN RGLVSLSAKI DRKGYTPGEV201 IPVFAEIDNG STRPVLPRAA VVQTQTFMAR GARKQKRAVV ASLAGEPVGP251 GQRALWQGRA LRIPPVGPSI LHCRVLHVDY ALKVCVDIPG TSKLLLELPL301 VIGTIPLHPF GSRSSSVGSH ASFLLDWRLG ALPERPEAPP EYSEVVADTE351 EAALGQSPFP LPQDPDMSLE GPFFAYIQEF RYRPPPLYSE EDPNPLLGDM401 RPRCMTCC.核苷酸及氨基酸組合序列克 隆 號PP2703(SEQ ID NO:3)起始編碼子144 ATG終止編碼子1367 TGA蛋白質(zhì)分子量 44376.531 GG GAT TTT CTG CTC CGG TTG GTG AGC GCG CCT GCG CGT TGA CGG CGA 4748 TTT TGC GTT CTG AGG CTG CAG CGT CGG CAT CTT GAG CTG CCG GTT CGC 9596 GAG TTC GAG GCC AGG TTC CGC CTG TCG TGG GTT CGC ACC CCG GAC GCG 143144 ATG CTA TTC GAC AAG GTG AAA GCG TTC TCG GTG CAG TTG GAC GGC GCG 1911 Met Leu Phe Asp Lys Val Lys Ala Phe Ser Val Gln Leu Asp Gly Ala 16192 ACC GCG GGC GTC GAG CCC GTG TTT AGC GGC GGC CAG GCC GTG GCG GGC 23917 Thr Ala Gly Val Glu Pro Val Phe Ser Gly Gly Gln Ala Val Ala Gly 32240 CGG GTG CTG CTG GAG CTG TCA AGC GCC GCG CGT GTG GGT GCC CTG AGG 28733 Arg Val Leu Leu Glu Leu Ser Ser Ala Ala Arg Val Gly Ala Leu Arg 48288 CTG CGC GCG CGG GGC CGC GCC CAC GTG CAC TGG ACC GAG TCG CGC AGC 33549 Leu Arg Ala Arg Gly Arg Ala His Val His Trp Thr Glu Ser Arg Ser 64336 GCG GGC TCG AGC ACG GCT TAC ACG CAG AGC TAC AGT GAA CGC GTG GAG 38365 Ala Gly Ser Ser Thr Ala Tyr Thr Gln Ser Tyr Ser Glu Arg Val Glu 80384 GTC GTG AGC CAC CGC GCC ACG CTC CTG GCG CCA GAT ACC GGG GAG ACC 43181 Val Val Ser His Arg Ala Thr Leu Leu Ala Pro Asp Thr Gly Glu Thr 96432 ACG ACG CTG CCT CCT GGG CGC CAT GAG TTC CTG TTC AGC TTC CAG CTG 47997 Thr Thr Leu Pro Pro Gly Arg His Glu Phe Leu Phe Ser Phe Gln Leu 112480 CCC CCG ACC CTG GTG ACA TCC TTC GAG GGC AAA CAC GGT AGT GTC CGC 527113 Pro Pro Thr Leu Val Thr Ser Phe Glu Gly Lys His Gly Ser Val Arg 128528 TAC TGT ATC AAG GCC ACC CTG CAC CGG CCC TGG GTC CCA GCA CGC CGG 575129 Tyr Cys Ile Lys Ala Thr Leu His Arg Pro Trp Val Pro Ala Arg Arg 144576 GCA AGG AAG GTG TTC ACT GTC ATC GAG CCT GTG GAC ATC AAC ACG CCA 623145 Ala Arg Lys Val Phe Thr Val Ile Glu Pro Val Asp Ile Asn Thr Pro 160624 GCC CTG CTG GCA CCT CAA GCG GGG GCT CGG GAA AAG GTT GCC CGA TCC 671161 Ala Leu Leu Ala Pro Gln Ala Gly Ala Arg Glu Lys Val Ala Arg Ser 176672 TGG TAC TGT AAC CGT GGC CTA GTC TCC CTT TCG GCC AAG ATC GAC CGC 719177 Trp Tyr Cys Asn Arg Gly Leu Val Ser Leu Ser Ala Lys Ile Asp Arg 192720 AAG GGC TAC ACC CCA GGA GAG GTC ATC CCT GTC TTT GCC GAG ATC GAC 767193 Lys Gly Tyr Thr Pro Gly Glu Val Ile Pro Val Phe Ala Glu Ile Asp 208768 AAC GGC TCC ACA CGT CCT GTG CTG CCT CGG GCA GCC GTG GTG CAG ACA 815209 Asn Gly Ser Thr Arg Pro Val Leu Pro Arg Ala Ala Val Val Gln Thr 224816 CAG ACG TTC ATG GCC CGA GGC GCC CGA AAG CAG AAA CGG GCA GTG GTG 863225 Gln Thr Phe Met Ala Arg Gly Ala Arg Lys Gln Lys Arg Ala Val Val 240864 GCC AGC CTC GCG GGC GAG CCG GTG GGC CCC GGG CAG CGG GCG CTG TGG 911241 Ala Ser Leu Ala Gly Glu Pro Val Gly Pro Gly Gln Arg Ala Leu Trp 256912 CAG GGC CGG GCA CTG CGG ATC CCC CCA GTG GGT CCT TCC ATC CTG CAC 959257 Gln Gly Arg Ala Leu Arg Ile Pro Pro Val Gly Pro Ser Ile Leu His 272960 TGC CGC GTT CTA CAC GTG GAC TAC GCA CTC AAG GTC TGT GTG GAT ATC1007273 Cys Arg Val Leu His Val Asp Tyr Ala Leu Lys Val Cys Val Asp Ile 2881008 CCA GGA ACG TCC AAG CTG CTG CTG GAG CTG CCA CTG GTG ATC GGC ACC1055289 Pro Gly Thr Ser Lys Leu Leu Leu Glu Leu Pro Leu Val Ile Gly Thr 3041056 ATT CCC TTG CAC CCT TTT GGC AGC CGT TCC TCC AGC GTG GGC AGC CAC1103305 Ile Pro Leu His Pro Phe Gly Ser Arg Ser Ser Ser Val Gly Ser His 3201104 GCC AGC TTC CTG CTG GAC TGG AGG CTG GGG GCC TTG CCG GAG CGG CCT1151321 Ala Ser Phe Leu Leu Asp Trp Arg Leu Gly Ala Leu Pro Glu Arg Pro 3361152 GAG GCT CCT CCT GAG TAC TCG GAG GTG GTA GCC GAC ACT GAG GAG GCA1199337 Glu Ala Pro Pro Glu Tyr Ser Glu Val Val Ala Asp Thr Glu Glu Ala 3521200 GCC TTG GGG CAG AGC CCC TTC CCG CTT CCG CAG GAC CCC GAC ATG AGC1247353 Ala Leu Gly Gln Ser Pro Phe Pro Leu Pro Gln Asp Pro Asp Met Ser 3681248 CTT GAA GGC CCG TTC TTC GCC TAC ATC CAA GAG TTC CGC TAC CGC CCG1295369 Leu Glu Gly Pro Phe Phe Ala Tyr Ile Gln Glu Phe Arg Tyr Arg Pro 3841296 CCA CCC CTG TAC TCT GAG GAG GAT CCA AAC CCA CTC TTG GGG GAC ATG1343385 Pro Pro Leu Tyr Ser Glu Glu Asp Pro Asn Pro Leu Leu Gly Asp Met 4001344 AGG CCG CGC TGC ATG ACT TGC TGA ACG GCA CAG GGA CCC CTC GAG GAA1391401 Arg Pro Arg Cys Met Thr Cys *** 4081392 CAA GGT TGC ACA CCA GCT TTC AGC CAC CAT GAC TGT GGG GAG TGG CTG14391440 GAC CAA GGG CTG ACC TCC CCG ACT GCA TCA AAG TTG GGG AAC CAA GTC14871488 TCA GAG TGA GGC GGG GGC CTT TCG GAT ATC ACA TGG GAC AGA GGA AGA15351536 GCC CGG CTG GAA TCT GAC TTA CCT GGA CCG CTG TCC TTG TGA GGC ATT15831584 GAA TGC CCA GTG CAG TAT CCG AGA GAC TGT TTA ATA ACC TGT CTT CCC16311632 AGC CAA TTG GTG GTG CTG GAA TCC CCT AGG AGC CTT CAG TCT GGG AGA16791680 AAC AGA GCC AGA CAT AGA CAG TTC CAG CAT CAC AGA ACC AGA AGA AGA17271728 GAC CTG CAA CTG TGA GAG TCC AGA CAG GAA GCA GAG AAG GCG TCC TTG17751776 CGG AAA GGG CAT TTT AGC TGA GGC TTT GGA GTA CGA ATA GGA GCT CAG18231824 CAG GCA GAC GAA TGA GGA ATA AAG GTC AGA GAA GGT CAG AGC TGA GTG18711872 ACG TTT GGA ATC CAC CCC GTT TAT TGT AGA ACT GGG GGT TCA GAG GGC19191920 AGG TGC CTC AGA GTT GAG GCC ACA CAG TGA GGT CTG GTG GGT GAA AGG19671968 ACC CAG GAA CGA GGC GTT CAG GAA AGC AGG TTG TCA GAG CTA TGT GGA20152016 GTC TGT GGG TGG CAG GGG CAG CCG CTC CAG CCT TTG AAG ACT TTG AAA20632064 GCC AGA GAT TCC TGG CGC AGG CTT GGA CTT CCT GGG AGC TCC TCC AAG21112112 TAC CCA GGG GCA TCA GAG CTG CCT GGG TGT TAC ATG GCC CAG GGA ACC21592160 CAG GTT CAG GGT AGG ACA GGC AAG ACC AGA TAC CCA ATG TGC AAA GTG22072208 AAA ACA CTG GGC TCC CTG TTA AAC GAT GAA GAA TTC AAG ACA GTG ACA22552256 GCA TTA CGT CAC CCC TGG GGA CAG AGG TCA GCC TAA GGT GAC ACA CGG23032304 GGA CTA CTG TGC TTC CGG AGG CTC CCT GTG TCC TGG AGG AGA AAA GCA23512352 TTA GAG GGG GCA GCT GGA CAA GCT CCC AAC TGC AGA GTC CCA GCC CTG23992400 GCT GGG GCA GGG CCC CGG CCT GGG ACT CAG CAT TTC TGA TAT GCC TTA24472448 AGA ATT CAT TCT GTT TTG TAC AAT TAT TTT TTA AAA GTA AAC GTG TGG24952496 AGA AAG AAA AAA AAA AAA AAA AA 25182.PP3227A核苷酸序列PP3227(SEQ ID NO:4)長度1384bp1 ATCAACATTG TCTGTAATTC AGCTTATGTT GTAAACGTAG CCAGTCACAT51 TCACATGGAA ACTGCTACAG TTAAAAGTAC ACTAGACCCA GAACTGCTTA101 ATTTGTTTCA CTTATTCTCA AATGCTGCAT GCTACATGCC AAACAGGTGA151 GACAGCTGGT CATGTACAGT GACATTGTCT GTCATCATTT GCTCATATGG201 GGATACTTAA ACAATTAAAA ACTGACAATG GACTCGCTTA TACTAGTCAT251 GCTTTTCAAA ATTTCTTATA GCTTTGGGCT ATAACCCATA AAATTGGAAT301 TCCTTATAAT CCTAAAGGAC AAGGCATTGT AGAGCAGGCA CATTGAACAT351 TACAACACAT GTTGAAAAGA CGAAAGGGGT ATAGGAGGCC AACTACCACC401 TCAATCAAAA CTACATTTAG CCTTATTTAC TTCACATTTT TGGACTCCTG451 GTACAGATGG TAAGACTCCA GCAGAAAGAC ATTGGCAAGT GTTAGAGGAA501 AAGAGGAAAG TTTATCTGAA AGCATTATGG AAATCCCTGG AAGGACAATG551 GAAAGGTTGG GTGGATTTAC TGACGTGGAG AAGAGGGTAT GCTTGTGTTT601 TCACAGGAGA TGGACAAGCC GTGTGGGTGC CCTCAAGGTG TGTGCAACCA651 TGGAATGGGA GACTGGAGGA ACCCAGGGTG GCCAACCATG GGTCCGGTCC701 CTCTGGTGTG AGCCATGAGC CAGCTGAGCC TGAGTGCGAA GACGGAGAGA751 AGGCCGACCA CAGTCATGAC ATCAACCCCC ATAACCTGGG GACAACTCAA801 GAAAACCACA CAGGAGGCTG AGAAACTACT GGAGCACCAG GGACAGTCTG851 TAAAGTTGGA TGGACCACCA ATGGGAAAAT GAGAGCTGCC CACCCTGGCC901 TTACACTCCT TCAATTAATA CATAAACAGA AAGGAGGATA TACAGAGAGC951 CAAAGGCCCA TGGGACGTGA CCAACATTCC ACTGAGTCTA TACGATCAAA1001 CAGCAAACTG TTTATCATGA ATACAGAATG TGGGCAAACT CATGACTGTG1051 CCTGCCCCAG AAGGTTTGCT GAGGGCAATT GCTTCCTGAC GCCAAGCTCC1101 TTGAGGTTAT CTATTGGGAC ATCCAGAGAA TGCAGTCTTG CAAGCCTACT1151 CTGGACCGAG CAGCTGACCC CCTCTTCCAC TTCCCTTCAC ACTATCTCTT1201 TTGCCTAATA AATACGGAAG GCTGTGTACA AGGTCAGGTC CCTTGTCCAC1251 TAGAGGCAAG GTGCTTCCTG ACCCTTCTTC CAAATATAAA AAAAAAAAAA1301 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1351 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAB.氨基酸序列PP3227(SEQ ID NO:5)長度109個氨基酸1 MRAAHPGLTL LQLIHKQKGG YTESQRPMGR DQHSTESIRS NSKLFIMNTE51 CGQTHDCACP RRFAEGNCFL TPSSLRLSIG TSRECSLASL LWTEQLTPSS101 TSLHTISFAC.核苷酸及氨基酸組合序列克 隆 號 PP3227(SEQ ID NO:6)起始編碼子 879 ATG終止編碼子1208 TAA蛋白質(zhì)分子量12067.061 AT CAA CAT TGT CTG TAA TTC AGC TTA TGT TGT AAA CGT AGC CAG TCA 4748 CAT TCA CAT GGA AAC TGC TAC AGT TAA AAG TAC ACT AGA CCC AGA ACT 9596 GCT TAA TTT GTT TCA CTT ATT CTC AAA TGC TGC ATG CTA CAT GCC AAA143144 CAG GTG AGA CAG CTG GTC ATG TAC AGT GAC ATT GTC TGT CAT CAT TTG191192 CTC ATA TGG GGA TAC TTA AAC AAT TAA AAA CTG ACA ATG GAC TCG CTT239240 ATA CTA GTC ATG CTT TTC AAA ATT TCT TAT AGC TTT GGG CTA TAA CCC287288 ATA AAA TTG GAA TTC CTT ATA ATC CTA AAG GAC AAG GCA TTG TAG AGC335336 AGG CAC ATT GAA CAT TAC AAC ACA TGT TGA AAA GAC GAA AGG GGT ATA383384 GGA GGC CAA CTA CCA CCT CAA TCA AAA CTA CAT TTA GCC TTA TTT ACT431432 TCA CAT TTT TGG ACT CCT GGT ACA GAT GGT AAG ACT CCA GCA GAA AGA479480 CAT TGG CAA GTG TTA GAG GAA AAG AGG AAA GTT TAT CTG AAA GCA TTA527528 TGG AAA TCC CTG GAA GGA CAA TGG AAA GGT TGG GTG GAT TTA CTG ACG 575576 TGG AGA AGA GGG TAT GCT TGT GTT TTC ACA GGA GAT GGA CAA GCC GTG 623624 TGG GTG CCC TCA AGG TGT GTG CAA CCA TGG AAT GGG AGA CTG GAG GAA 671672 CCC AGG GTG GCC AAC CAT GGG TCC GGT CCC TCT GGT GTG AGC CAT GAG 719720 CCA GCT GAG CCT GAG TGC GAA GAC GGA GAG AAG GCC GAC CAC AGT CAT 767768 GAC ATC AAC CCC CAT AAC CTG GGG ACA ACT CAA GAA AAC CAC ACA GGA 815816 GGC TGA GAA ACT ACT GGA GCA CCA GGG ACA GTC TGT AAA GTT GGA TGG 863864 ACC ACC AAT GGG AAA ATG AGA GCT GCC CAC CCT GGC CTT ACA CTC CTT 9111 Met Arg Ala Ala His Pro Gly Leu Thr Leu Leu 11912 CAA TTA ATA CAT AAA CAG AAA GGA GGA TAT ACA GAG AGC CAA AGG CCC 95912 Gln Leu Ile His Lys Gln Lys Gly Gly Tyr Thr Glu Ser Gln Arg Pro 27960 ATG GGA CGT GAC CAA CAT TCC ACT GAG TCT ATA CGA TCA AAC AGC AAA100728 Met Gly Arg Asp Gln His Ser Thr Glu Ser Ile Arg Ser Ash Ser Lys 431008 CTG TTT ATC ATG AAT ACA GAA TGT GGG CAA ACT CAT GAC TGT GCC TGC105544 Leu Phe Ile Met Asn Thr Glu Cys Gly Gln Thr His Asp Cys Ala Cys 591056 CCC AGA AGG TTT GCT GAG GGC AAT TGC TTC CTG ACG CCA AGC TCC TTG110360 Pro Arg Arg Phe Ala Glu Gly Asn Cys Phe Leu Thr Pro Ser Ser Leu 751104 AGG TTA TCT ATT GGG ACA TCC AGA GAA TGC AGT CTT GCA AGC CTA CTC115176 Arg Leu Ser Ile Gly Thr Ser Arg Glu Cys Ser Leu Ala Ser Leu Leu 911152 TGG ACC GAG CAG CTG ACC CCC TCT TCC ACT TCC CTT CAC ACT ATC TCT119992 Trp Thr Glu Gln Leu Thr Pro Ser Ser Thr Ser Leu His Thr Ile Ser 1071200 TTT GCC TAA TAA ATA CGG AAG GCT GTG TAC AAG GTC AGG TCC CTT GTC1247108 Phe Ala *** 1101248 CAC TAG AGG CAA GGT GCT TCC TGA CCC TTC TTC CAA ATA TAA AAA AAA12951296 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA13431344 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 13843.PP3564A核苷酸序列(SEQ ID NO:7)長度1009bp1 GTTCAAGTGT TAGAATGGAG AGCTGGAGTT CGTTCAGAAT AGTGCTGTGT51 GTTACCACGT CTCCCCTGCA CCCCATTCCT ACCTTGTAGC TCATGACCAT101 TGTGTATAGC ATTTCTACAC TTTGTTTCTT GGTCCTTGGC AATAAAAAGA151 ATGATCTCCC TGAGCCTTTG ACCCCAGATA AACCCCTCCC AATTAATGCA201 TTTTCATTTC CTACTGATAC AAGGCCTGGA GAGGGCTGTT GGGGGCCCTC251 AGGGAGGGTT CAACTCTGAG ACGAGAACTG CCTTGGTGAA GGCAAGTTCA301 AGCACCACTT GAGACTGGGG GCAGCATGGA GTAGGGCAGG GCTACGGGGA351 TACACGGTGC ACCCTGCAAC TTATACCTGA GCCCAGTACA ACAAAGGTGA401 CGGGTGGTGT AGGTACACAC CCAGAGATGG AGCACTGCAG ATCAGCAACC451 TCAGCCCCAC CTGGGAATTC GCTGGAAATG CAGGCTCAAG CCCCTCCCCA501 CACCTGGTGA ATGAGAGAGC CCCAGCCTGA CCCAAGCCCA GGGCGACTCC551 CATACCCTGA AGCCTGGGGC ATGCTGGGCA GCACCGGTGC CCAAATCTGG601 CTGGTGGACA GAAGCACCTG GAGAGTTGGA GAGCTTTTTA AAAAGACATC651 TCTCAGCACT TCCCTCTCTG CAGATTCTGA CTCAATTAAA GAATATCTCC701 TCCAGGTGTG GTGGCTCACA CCTGTAATCC CAGCACTTTG GGAAGCCGAG751 GTGGATGGAC CACGATGTCA GGAGTTCAAG ACCAGCCTGG CCAACATGGT801 GAAACCCCAT CTCTCCTAAA GATACAAAAA AAATTAGCCA GGCGTGGCAG851 TGGGCGCCTG TAATCCCAGC TACTCAGGAG ACTGAGGCAG AGAATTGCTT901 GAAGCCAGAG GCAGAGGTTG CAATGAGCCG GGATCACGCC ACTGAACTCC951 AGCCTGGGTG ACAGAGTGAG ACTCTTGTCT CCAAAAAAAA AAAAAAAAAA1001 AAAAAAAAAB氨基酸序列(SEQ ID NO:8)長度102個氨基酸1 MREPQPDPSP GRLPYPEAWG MLGSTGAQIW LVDRSTWRVG ELFKKTSLST SLSADSDSIK61 EYLLQVWWLT PVIPALWEAE VDGPRCQEFK TSLANMVKPH LSC.核苷酸及氨基酸組合序列克 隆 號PP3564(SEQ ID NO:9)起始編碼子511 ATG終止編碼子819 TAA蛋白質(zhì)分子量 115141 GTT CAA GTG TTA GAA TGG AGA GCT GGA GTT CGT TCA GAA TAG TGC TGT 4849 GTG TTA CCA CGT CTC CCC TGC ACC CCA TTC CTA CCT TGT AGC TCA TGA 9697 CCA TTG TGT ATA GCA TTT CTA CAC TTT GTT TCT TGG TCC TTG GCA ATA 144145 AAA AGA ATG ATC TCC CTG AGC CTT TGA CCC CAG ATA AAC CCC TCC CAA 192193 TTA ATG CAT TTT CAT TTC CTA CTG ATA CAA GGC CTG GAG AGG GCT GTT 240241 GGG GGC CCT CAG GGA GGG TTC AAC TCT GAG ACG AGA ACT GCC TTG GTG 288289 AAG GCA AGT TCA AGC ACC ACT TGA GAC TGG GGG CAG CAT GGA GTA GGG 336337 CAG GGC TAC GGG GAT ACA CGG TGC ACC CTG CAA CTT ATA CCT GAG CCC 384385 AGT ACA ACA AAG GTG ACG GGT GGT GTA GGT ACA CAC CCA GAG ATG GAG 432433 CAC TGC AGA TCA GCA ACC TCA GCC CCA CCT GGG AAT TCG CTG GAA ATG 480481 CAG GCT CAA GCC CCT CCC CAC ACC TGG TGA ATG AGA GAG CCC CAG CCT 5281 Met Arg Glu Pro Gln Pro 6529 GAC CCA AGC CCA GGG CGA CTC CCA TAC CCT GAA GCC TGG GGC ATG CTG 5767 Asp Pro Ser Pro Gly Arg Leu Pro Tyr Pro Glu Ala Trp Gly Met Leu 22577 GGC AGC ACC GGT GCC CAA ATC TGG CTG GTG GAC AGA AGC ACC TGG AGA 62423 Gly Ser Thr Gly Ala Gln Ile Trp Leu Val Asp Arg Ser Thr Trp Arg 38625 GTT GGA GAG CTT TTT AAA AAG ACA TCT CTC AGC ACT TCC CTC TCT GCA 67239 Val Gly Glu Leu Phe Lys Lys Thr Ser Leu Ser Thr Ser Leu Ser Ala 54673 GAT TCT GAC TCA ATT AAA GAA TAT CTC CTC CAG GTG TGG TGG CTC ACA 72055 Asp Ser Asp Ser Ile Lys Glu Tyr Leu Leu Gln Val Trp Trp Leu Thr 70721 CCT GTA ATC CCA GCA CTT TGG GAA GCC GAG GTG GAT GGA CCA CGA TGT 76871 Pro Val Ile Pro Ala Leu Trp Glu Ala Glu Val Asp Gly Pro Arg Cys 86769 CAG GAG TTC AAG ACC AGC CTG GCC AAC ATG GTG AAA CCC CAT CTC TCC 81687 Gln Glu Phe Lys Thr Ser Leu Ala Asn Met Val Lys Pro His Leu Ser 102817 TAA AGA TAC AAA AAA AAT TAG CCA GGC GTG GCA GTG GGC GCC TGT AAT 864103 *** 103865 CCC AGC TAC TCA GGA GAC TGA GGC AGA GAA TTG CTT GAA GCC AGA GGC 912913 AGA GGT TGC AAT GAG CCG GGA TCA CGC CAC TGA ACT CCA GCC TGG GTG 960961 ACA GAG TGA GAC TCT TGT CTC CAA AAA AAA AAA AAA AAA AAA AAA AAA10081009 A 10094.PP3686A核苷酸序列(SEQ ID NO:10)長度1880bp1 CCAGCCTCAG CTGGCCACCA GGCCGTGGAT CCAGGACATC GAGGGAGCCA51 GCGCCAAGGA CCTTTGCAGC GCGTCTTCGG TTGTGTCCCC GTCTTTTGTA101 CCAACAGGGG AGAAGCCATG TGAGCAAGTC CAGTTCCAGC CCAACACAGT151 GAACACTTTG GCCTGCCCGC TCCTCTCCAA CCTGGCGACC CGACTCTGGC201 TACGCAACGG GGCCCCCGTC AATGCCTCGG CCTCCTGCCA CGTGCTACCC251 ACTGGGGACC TGCTGCTGGT GGGCACCCAA CAGCTGGGGG AGTTCCAGTG301 CTGGTCACTA GAGGAGGGCT TCCAGCAGCT GGTAGCCAGC TACTGCCCAG351 AGGTGGTGGA GGACGGGGTG GCAGACCAAA CAGATGAGGG TGGCAGTGTA401 CCCGTCATTA TCAGCACATC GCGTGTGAGT GCACCAGCTG GTGGCAAGGC451 CAGCTGGGGT GCAGACAGGT CCTACTGGAA GGAGTTCCTG GTGATGTGCA501 CGCTCTTTGT GCTGGCCGTG CTGCTCCCAG TTTTATTCTT GCTCTACCGG551 CACCGGAACA GCATGAAAGT CTTCCTGAAG CAGGGGGAAT GTGCCAGCGT601 GCACCCCAAG ACCTGCCCTG TGGTGCTGCC CCCTGAGACC CGCCCACTCA651 ACGGCCTAGG GCCCCCTAGC ACCCCGCTCG ATCACCGAGG GTACCAGTCC701 CTGTCAGACA GCCCCCCGGG GGCCCGAGTC TTCACTGAGT CAGAGAAGAG751 GCCACTCAGC ATCCAAGACA GCTTCGTGGA GGTATCCCCA GTGTGCCCCC801 GGCCCCGGGT CCGCCTTGGC TCGGAGATCC GTGACTCTGT GGTGTGAGAG851 CTGACTTCCA GAGGACGCTG CCCTGGCTTC AGGGGCTGTG AATGCTCGGA901 GAGGGTCAAC TGGACCTCCC CTCCGCTCTG CTCTTCGTGG AACACGACCG951 TGGTGCCCGG CCCTTGGGAG CCTTGGGGCC AGCTGGCCTG CTGCTCTCCA1001 GTCAAGTAGC GAAGCTCCTA CCACCCAGAC ACCCAAACAG CCGTGGCCCC1051 AGAGGTCCTG GCCAAATATG GGGGCCTGCC TAGGTTGGTG GAACAGTGCT1101 CCTTATGTAA ACTGAGCCCT TTGTTTAAAA AACAATTCCA AATGTGAAAC1151 TAGAATGAGA GGGAAGAGAT AACATGGCAT GCAGCACACA CGGCTGCTCC1201 AGTTCATGGC CTCCCAGGGG TGCTGGGGAT GCATCCAAAG TGGTTGTCTG1251 AGACAGAGTT GGAAACCCTC ACCAACTGGC CTCTTCACCT TCCACATTAT1301 CCCGCTGCCA CCGGCTGCCC TGTCTCACTG CAGATTCAGG ACCAGCTTGG1351 GCTCCGTGCG TTCTGCCTTG CCAGTCAGCC GAGGATGTAG TTGTTGCTGC1401 CGTCGTCCCA CCACCTCAGG GACCAGAGGG CTAGGTTGGC ACTGCGGCCC1451 TCACCAGGTC CTGGGCTCGG ACCCAACTCC TGGACCTTTC CAGCCTGTAT1501 CAGGCTGTGG CCACACGAGA GGACAGCGCG AGCTCAGGAG AGATTTCGTG1551 ACAATGTACG CCTTTCCCTC AGAATTCAGT GAAGAGACTG TCGCCTGCCT1601 TCCTCCGTTG TTGCGTGAGA ACCCGTGTGC CCCTTCCCAC CATATCCACC1651 CTCGCTCCAT CTTTGAACTC AAACACGAGG AACTAACTGC ACCCTGGTCC1701 TCTCCCCAGT CCCCAGTTCA CCCTCCATCC CTCACCTTCC TCCACTCTAA1751 GGGATATCAA CACTGCCCAG CACAGGGGCC CTGAATTTAT GTGGTTTTTA1801 TATATTTTTT AATAAGATGC ACTTTATGTC ATTTTTTAAT AAAGTCTGAA1851 GAATTACTGT TTAAAAAAAA AAAAAAAAAAB氨基酸序列(SEQ ID NO:11)長度201個氨基酸1 MQHTRLLQFM ASQGCWGCIQ SGCLRQSWKP SPTGLFTFHI IPLPPAALSH CRFRTSLGSV61 RSALPVSRGC SCCCRRPTTS GTRGLGWHCG PHQVLGSDPT PGPFQPVSGC GHTRGQRELR121 RDFVTMYAFP SEFSEETVAC LPPLLRENPC APSHHIHPRS IFELKHEELT APWSSPQSPV181 HPPSLTFLHS KGYQHCPAQG PC.核苷酸及氨基酸組合序列克 隆 號 PP3686(SEQ ID NO:12)起始編碼子 1179 ATG終止編碼子1784 TGA蛋白質(zhì)分子量 221551 CC AGC CTC AGC TGG CCA CCA GGC CGT GGA TCC AGG ACA TCG AGG GAG 4748 CCA GCG CCA AGG ACC TTT GCA GCG CGT CTT CGG TTG TGT CCC CGT CTT 9596 TTG TAC CAA CAG GGG AGA AGC CAT GTG AGC AAG TCC AGT TCC AGC CCA 143144 ACA CAG TGA ACA CTT TGG CCT GCC CGC TCC TCT CCA ACC TGG CGA CCC 191192 GAC TCT GGC TAC GCA ACG GGG CCC CCG TCA ATG CCT CGG CCT CCT GCC 239240 ACG TGC TAC CCA CTG GGG ACC TGC TGC TGG TGG GCA CCC AAC AGC TGG 287288 GGG AGT TCC AGT GCT GGT CAC TAG AGG AGG GCT TCC AGC AGC TGG TAG 335336 CCA GCT ACT GCC CAG AGG TGG TGG AGG ACG GGG TGG CAG ACC AAA CAG 383384 ATG AGG GTG GCA GTG TAC CCG TCA TTA TCA GCA CAT CGC GTG TGA GTG 431432 CAC CAG CTG GTG GCA AGG CCA GCT GGG GTG CAG ACA GGT CCT ACT GGA 479480 AGG AGT TCC TGG TGA TGT GCA CGC TCT TTG TGC TGG CCG TGC TGC TCC 527528 CAG TTT TAT TCT TGC TCT ACC GGC ACC GGA ACA GCA TGA AAG TCT TCC 575576 TGA AGC AGG GGG AAT GTG CCA GCG TGC ACC CCA AGA CCT GCC CTG TGG 623624 TGC TGC CCC CTG AGA CCC GCC CAC TCA ACG GCC TAG GGC CCC CTA GCA 671672 CCC CGC TCG ATC ACC GAG GGT ACC AGT CCC TGT CAG ACA GCC CCC CGG 719720 GGG CCC GAG TCT TCA CTG AGT CAG AGA AGA GGC CAC TCA GCA TCC AAG 767768 ACA GCT TCG TGG AGG TAT CCC CAG TGT GCC CCC GGC CCC GGG TCC GCC 815816 TTG GCT CGG AGA TCC GTG ACT CTG TGG TGT GAG AGC TGA CTT CCA GAG 863864 GAC GCT GCC CTG GCT TCA GGG GCT GTG AAT GCT CGG AGA GGG TCA ACT 911912 GGA CCT CCC CTC CGC TCT GCT CTT CGT GGA ACA CGA CCG TGG TGC CCG 959960 GCC CTT GGG AGC CTT GGG GCC AGC TGG CCT GCT GCT CTC CAG TCA AGT10071008 AGC GAA GCT CCT ACC ACC CAG ACA CCC AAA CAG CCG TGG CCC CAG AGG10551056 TCC TGG CCA AAT ATG GGG GCC TGC CTA GGT TGG TGG AAC AGT GCT CCT11031104 TAT GTA AAC TGA GCC CTT TGT TTA AAA AAC AAT TCC AAA TGT GAA ACT11511152 AGA ATG AGA GGG AAG AGA TAA CAT GGC ATG CAG CAC ACA CGG CTG CTC11991 Met Gln His Thr Arg Leu Leu 71200 CAG TTC ATG GCC TCC CAG GGG TGC TGG GGA TGC ATC CAA AGT GGT TGT12478 Gln Phe Met Ala Ser Gln Gly Cys Trp Gly Cys Ile Gln Ser Gly Cys 231248 CTG AGA CAG AGT TGG AAA CCC TCA CCA ACT GGC CTC TTC ACC TTC CAC129524 Leu Arg Gln Ser Trp Lys Pro Ser Pro Thr Gly Leu Phe Thr Phe His 391296 ATT ATC CCG CTG CCA CCG GCT GCC CTG TCT CAC TGC AGA TTC AGG ACC134340 Ile Ile Pro Leu Pro Pro Ala Ala Leu Ser His Cys Arg Phe Arg Thr 551344 AGC TTG GGC TCC GTG CGT TCT GCC TTG CCA GTC AGC CGA GGA TGT AGT139156 Ser Leu Gly Ser Val Arg Ser Ala Leu Pro Val Ser Arg Gly Cys Ser 711392 TGT TGC TGC CGT CGT CCC ACC ACC TCA GGG ACC AGA GGG CTA GGT TGG143972 Cys Cys Cys Arg Arg Pro Thr Thr Ser Gly Thr Arg Gly Leu Gly Trp 871440 CAC TGC GGC CCT CAC CAG GTC CTG GGC TCG GAC CCA ACT CCT GGA CCT148788 His Cys Gly Pro His Gln Val Leu Gly Ser Asp Pro Thr Pro Gly Pro 1031488 TTC CAG CCT GTA TCA GGC TGT GGC CAC ACG AGA GGA CAG CGC GAG CTC1535104 Phe Gln Pro Val Ser Gly Cys Gly His Thr Arg Gly Gln Arg Glu Leu 1191536 AGG AGA GAT TTC GTG ACA ATG TAC GCC TTT CCC TCA GAA TTC AGT GAA1583120 Arg Arg Asp Phe Val Thr Met Tyr Ala Phe Pro Ser Glu Phe Ser Glu 1351584 GAG ACT GTC GCC TGC CTT CCT CCG TTG TTG CGT GAG AAC CCG TGT GCC1631136 Glu Thr Val Ala Cys Leu Pro Pro Leu Leu Arg Glu Asn Pro Cys Ala 1511632 CCT TCC CAC CAT ATC CAC CCT CGC TCC ATC TTT GAA CTC AAA CAC GAG1679152 Pro Ser His His Ile His Pro Arg Ser Ile Phe Glu Leu Lys His Glu 1671680 GAA CTA ACT GCA CCC TGG TCC TCT CCC CAG TCC CCA GTT CAC CCT CCA1727168 Glu Leu Thr Ala Pro Trp Ser Ser Pro Gln Ser Pro Val His Pro Pro 1831728 TCC CTC ACC TTC CTC CAC TCT AAG GGA TAT CAA CAC TGC CCA GCA CAG1775184 Ser Leu Thr Phe Leu His Ser Lys Gly Tyr Gln His Cys Pro Ala Gln 1991776 GGG CCC TGA ATT TAT GTG GTT TTT ATA TAT TTT TTA ATA AGA TGC ACT1823200 Gly Pro *** 2021824 TTA TGT CAT TTT TTA ATA AAG TCT GAA GAA TTA CTG TTT AAA AAA AAA18711872 AAA AAA AAA18805.PP3774A核苷酸序列(SEQ ID NO:13)長度1747bp1 CCGGGTCCGC TGCCTGGCGC TGCGGGCGGC GGGCCATGGT GGTTTGGATT51 GAGCCGGGCC CGGCCGGGGC GCCGAGTCGG AGGGGGTGGC AGTGAGCGGC101 GGCAGAGGCT ACGGGGCTCG GTTTGGCTGA CTGGGGAGTC GGCAGGCGGC151 AGGAACCATG CGAGGCCAGC GGAGCCTGCT GCTGGGCCCG GCCCGCCTCT201 GCCTCCGCCT CCTTCTGCTG CTGGGTTACA GGCGCCGCTG TCCACCTCTA251 CTCCGGGGTC TAGTACAGCG CTGGCGCTAC GGCAAGGTCT GCCTGCGCTC301 CCTGCTCTAC AACTCCTTTG GGGGCAGTGA CACCGCTGTT GATGCTGCCT351 TTGAGCCTGT CTACTGGCTG GTAGACAACG TGATCCGCTG GTTTGGAGTG401 GTGTTCGTGG TCCTGGTGAT CGTGCTGACA GGCTCCATTG TAGCTATCGC451 CTACCTGTGT GTCCTGCCTC TCATCCTCCG AACCTACTCA GTGCCACGAC501 TCTGCTGGCA TTTCTTCTAT AGCCACTGGA ATCTGATCCT GATTGTCTTC551 CACTACTACC AGGCCATCAC CACTCCGCCT GGGTACCCAC CCCAGGGCAG601 GAATGATATC GCCACCGTCT CCATCTGTAA GAAGTGCATT TACCCCAAGC651 CAGCCCGAAC ACACCACTGC AGCATCTGCA ACAGGTGTGT GCTGAAGATG701 GATCACCACT GCCCCTGGCT AAACAATTGT GTGGGCCACT ATAACCATCG751 GTACTTCTTC TCTTTCTGCT TTTTCATGAC TCTGGGCTGT GTCTACTGCA801 GCTATGGAAG TTGGGACCTT TTCCGGGAGG CTTATGCTGC CATTGAGACT851 TATCACCAGA CCCCACCACC CACCTTCTCC TTTCGAGAAA GGATGACTCA901 CAAGAGTCTT GTCTACCTCT GGTTCCTGTG CAGTTCTGTG GCACTTGCCC951 TGGGTGCCCT AACTGTATGG CATGCTGTTC TCATCAGTCG AGGTGAGACT1001 AGCATCGAAA GGCACATCAA CAAGAAGGAG AGACGTCGGC TACAGGCCAA1051 GGGCAGAGTA TTTAGGAATC CTTACAACTA CGGCTGCTTG GACAACTGGA1101 AGGTATTCCT GGGTGTGGAT ACAGGAAGGC ACTGGCTTAC TCGGGTGCTC1151 TTACCTTCTA GTCACTTGCC CCATGGGAAT GGAATGAGCT GGGAGCCCCC1201 TCCCTGGGTG ACTGCTCACT CAGCCTCTGT GATGGCAGTG TGAGCTGGAC1251 TGTGTCAGCC ACGACTCGAG CACTCATTCT GCTCCCTATG TTATTTCAAG1301 GGCCTCCAAG GGCAGCTTTT CTCAGAATCC TTGATCAAAA AGAGCCAGTG1351 GGCCTGCCTT AGGGTACCAT GCAGGACAAT TCAAGGACCA GCCTTTTTAC1401 CACTGCAGAA GAAAGACACA ATGTGGAGAA ATCTTAGGAC TGACATCCCT1451 TTACTCAGGC AAACAGAAGT TCCAACCCCA GACTAGGGGT CAGGCAGCTA1501 GCTACCTACC TTGCCCAGTG CTGACCCGGA CCTCCTCCAG GATACAGCAC1551 TGGAGTTGGC CACCACCTCT TCTACTTGCT GTCTGAAAAA ACACCTGACT1601 AGTACAGCTG AGATCTTGGC TTCTCAACAG GGCAAAGATA CCAGGCCTGC1651 TGCTGAGGTC ACTGCCACTT CTCACATGCT GCTTAAGGGA GCACAAATAA1701 AGGTATTCGA TTTTTAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAB氨基酸序列(SEQ ID NO:14)長度361個氨基酸1 MRGQRSLLLG PARLCLRLLL LLGYRRRCPP LLRGLVQRWR YGKVCLRSLL YNSFGGSDTA61 VDAAFEPVYW LVDNVIRWFG VVFVVLVIVL TGSIVAIAYL CVLPLILRTY SVPRLCWHFF121 YSHWNLILIV FHYYQAITTP PGYPPQGRND IATVSICKKC IYPKPARTHH CSICNRCVLK181 MDHHCPWLNN CVGHYNHRYF FSFCFFMTLG CVYCSYGSWD LFREAYAAIE TYHQTPPPTF241 SFRERMTHKS LVYLWFLCSS VALALGALTV WHAVLISRGE TSIERHINKK ERRRLQAKGR301 VFRNPYNYGC LDNWKVFLGV DTGRHWLTRV LLPSSHLPHG NGMSWEPPPW VTAHSASVMA361 VC.核苷酸及氨基酸組合序列克 隆 號 PP3774(SEQ ID NO:15)起始編碼子 158 ATG終止編碼子1243 TGA蛋白質(zhì)分子量417921C CGG GTC CGC TGC CTG GCG CTG CGG GCG GCG GGC CAT GGT GGT TTG 4647 GAT TGA GCC GGG CCC GGC CGG GGC GCC GAG TCG GAG GGG GTG GCA GTG 9495 AGC GGC GGC AGA GGC TAC GGG GCT CGG TTT GGC TGA CTG GGG AGT CGG 142143 CAG GCG GCA GGA ACC ATG CGA GGC CAG CGG AGC CTG CTG CTG GGC CCG 1901 Met Arg Gly Gln Arg Ser Leu Leu Leu Gly Pro 11191 GCC CGC CTC TGC CTC CGC CTC CTT CTG CTG CTG GGT TAC AGG CGC CGC 23812 Ala Arg Leu Cys Leu Arg Leu Leu Leu Leu Leu Gly Tyr Arg Arg Arg 27239 TGT CCA CCT CTA CTC CGG GGT CTA GTA CAG CGC TGG CGC TAC GGC AAG 28628 Cys Pro Pro Leu Leu Arg Gly Leu Val Gln Arg Trp Arg Tyr Gly Lys 43287 GTC TGC CTG CGC TCC CTG CTC TAC AAC TCC TTT GGG GGC AGT GAC ACC 33444 Val Cys Leu Arg Ser Leu Leu Tyr Asn Ser Phe Gly Gly Ser Asp Thr 59335 GCT GTT GAT GCT GCC TTT GAG CCT GTC TAC TGG CTG GTA GAC AAC GTG 38260 Ala Val Asp Ala Ala Phe Glu Pro Val Tyr Trp Leu Val Asp Asn Val 75383 ATC CGC TGG TTT GGA GTG GTG TTC GTG GTC CTG GTG ATC GTG CTG ACA 43076 Ile Arg Trp Phe Gly Val Val Phe Val Val Leu Val IIe Val Leu Thr 91431 GGC TCC ATT GTA GCT ATC GCC TAC CTG TGT GTC CTG CCT CTC ATC CTC 47892 Gly Ser Ile Val Ala Ile Ala Tyr Leu Cys Val Leu Pro Leu Ile Leu 107479 CGA ACC TAC TCA GTG CCA CGA CTC TGC TGG CAT TTC TTC TAT AGC CAC 526108 Arg Thr Tyr Ser Val Pro Arg Leu Cys Trp His Phe Phe Tyr Ser His 123527 TGG AAT CTG ATC CTG ATT GTC TTC CAC TAC TAC CAG GCC ATC ACC ACT 574124 Trp Asn Leu Ile Leu Ile Val Phe His Tyr Tyr Gln Ala Ile Thr Thr 139575 CCG CCT GGG TAC CCA CCC CAG GGC AGG AAT GAT ATC GCC ACC GTC TCC 622140 Pro Pro Gly Tyr Pro Pro Gln Gly Arg Asn Asp Ile Ala Thr Val Ser 155623 ATC TGT AAG AAG TGC ATT TAC CCC AAG CCA GCC CGA ACA CAC CAC TGC 670156 Ile Cys Lys Lys Cys Ile Tyr Pro Lys Pro Ala Arg Thr His His Cys 171671 AGC ATC TGC AAC AGG TGT GTG CTG AAG ATG GAT CAC CAC TGC CCC TGG 718172 Ser Ile Cys Asn Arg Cys Val Leu Lys Met Asp His His Cys Pro Trp 187719 CTA AAC AAT TGT GTG GGC CAC TAT AAC CAT CGG TAC TTC TTC TCT TTC 766188 Leu Asn Asn Cys Val Gly His Tyr Asn His Arg Tyr Phe Phe Ser Phe 203767 TGC TTT TTC ATG ACT CTG GGC TGT GTC TAC TGC AGC TAT GGA AGT TGG 814204 Cys Phe Phe Met Thr Leu Gly Cys Val Tyr Cys Ser Tyr Gly Ser Trp 219815 GAC CTT TTC CGG GAG GCT TAT GCT GCC ATT GAG ACT TAT CAC CAG ACC 862220 Asp Leu Phe Arg Glu Ala Tyr Ala Ala Ile Glu Thr Tyr His Gln Thr 235863 CCA CCA CCC ACC TTC TCC TTT CGA GAA AGG ATG ACT CAC AAG AGT CTT 910236 Pro Pro Pro Thr Phe Ser Phe Arg Glu Arg Met Thr His Lys Ser Leu 251911 GTC TAC CTC TGG TTC CTG TGC AGT TCT GTG GCA CTT GCC CTG GGT GCC 958252 Val Tyr Leu Trp Phe Leu Cys Ser Ser Val Ala Leu Ala Leu Gly Ala 267959 CTA ACT GTA TGG CAT GCT GTT CTC ATC AGT CGA GGT GAG ACT AGC ATC1006268 Leu Thr Val Trp His Ala Val Leu Ile Ser Arg Gly Glu Thr Ser Ile 2831007 GAA AGG CAC ATC AAC AAG AAG GAG AGA CGT CGG CTA CAG GCC AAG GGC1054284 Glu Arg His Ile Asn Lys Lys Glu Arg Arg Arg Leu Gln Ala Lys Gly 2991055 AGA GTA TTT AGG AAT CCT TAC AAC TAC GGC TGC TTG GAC AAC TGG AAG1102300 Arg Val Phe Arg Asn Pro Tyr Asn Tyr Gly Cys Leu Asp Asn Trp Lys 3151103 GTA TTC CTG GGT GTG GAT ACA GGA AGG CAC TGG CTT ACT CGG GTG CTC1150316 Val Phe Leu Gly Val Asp Thr Gly Arg His Trp Leu Thr Arg Val Leu 3311151 TTA CCT TCT AGT CAC TTG CCC CAT GGG AAT GGA ATG AGC TGG GAG CCC1198332 Leu Pro Ser Ser His Leu Pro His Gly Asn Gly Met Ser Trp Glu Pro 3471199 CCT CCC TGG GTG ACT GCT CAC TCA GCC TCT GTG ATG GCA GTG TGA GCT1246348 Pro Pro Trp Val Thr Ala His Ser Ala Ser Val Met Ala Val *** 3621247 GGA CTG TGT CAG CCA CGA CTC GAG CAC TCA TTC TGC TCC CTA TGT TAT12941295 TTC AAG GGC CTC CAA GGG CAG CTT TTC TCA GAA TCC TTG ATC AAA AAG13421343 AGC CAG TGG GCC TGC CTT AGG GTA CCA TGC AGG ACA ATT CAA GGA CCA13901391 GCC TTT TTA CCA CTG CAG AAG AAA GAC ACA ATG TGG AGA AAT CTT AGG14381439 ACT GAC ATC CCT TTA CTC AGG CAA ACA GAA GTT CCA ACC CCA GAC TAG14861487 GGG TCA GGC AGC TAG CTA CCT ACC TTG CCC AGT GCT GAC CCG GAC CTC15341535 CTC CAG GAT ACA GCA CTG GAG TTG GCC ACC ACC TCT TCT ACT TGC TGT15821583 CTG AAA AAA CAC CTG ACT AGT ACA GCT GAG ATC TTG GCT TCT CAA CAG16301631 GGC AAA GAT ACC AGG CCT GCT GCT GAG GTC ACT GCC ACT TCT CAC ATG16781679 CTG CTT AAG GGA GCA CAA ATA AAG GTA TTC GAT TTT TAA AAA AAA AAA17261727 AAA AAA AAA AAA AAA AAA AAA 1747D.Blastp結(jié)果Query=PP3774(361個氨基酸)>SP_IN:Q18585 Q18585 caenorhabditis elegans.cosmid c43h6.11/1999長度=306分值=122 bits(304),預計值=3e-27相同性=76/222(34%),相似性=107/222(47%),缺口=18/222(8%)Query:126 LILIVFHYYQAITTPPGYPPQGRNDIATVSICKKCIYPKPARTHHCSICNRCVLKMDHHC 185L I +HYY+A T PP PDS C KC Y KHHCS+C +CVL MDHHCSbjct:78 LFNIQYHYYKARTIPPVANPGEEGD----SFCSKCNYWKSDNAHHCSVCEKCVLGMDHHC 133Query:186 PWLNNCVGHYNHRYFFSFCFFMTLGC---VYCSYGSWD--LFREA----YAAIETYHQTP 236W+N CVG +NHR+FF F +TL + Y S+ LF E+Y HSbjct:134 IWINQCVGLHNHRHFFLFIANLTLAAATIIIAGYQSFSDHLFLESSQTTYCTTILEHAPL 193Query:237 PPTFSFRERMTHKSLVYLWFLCSSVALALGALTVWHAVLISRGETSIERHINKKERRRLQ 296+ S+V+ + L + + +G LT W+ LIS G T I+ ++Sbjct:194 QDIICDYDGFARTSVVFCYLLSGILLVMVGGLTSWNIYLISIGCTYIDYLKLTGSKKNTS 253Query:297 AKGRVFRNPYNYGCLDNWKVFLGVDTGRHWLTRVLLPSSHLP 338A+ R+ N G NW+ FLG+ R + V++P++ PSbjct:254 ARKRL-----NKGFKANWRNFLGLRRNRTFFKCVIMPTALPP 290>SP_IN:017549 017549 caenorhabditis elegans.m18.8 protein.11/1999長度=447分值=105 bits(259),預計值=5e-22相同性=60/173(34%),相似性=87/173(49%),缺口=9/173(5%)Query:124 WNLILIVFHYYQAITTPPGYPPQGRN-----DIATVSICKKCIYPKPARTHHCSICNRCV 178WN L + + + APGY P+G D + C C K R+HHCS C+RCSbjct:71 WNY-LTIGNLFNASFFGPGYVPRGWRPENAADEKKLQFCVPCNGFKVPRSHHCSKCDRCC 129Query:179 LKMDHHCPWLNNCVGHYNHRYFFSFCFFMTLGCVYCSY--GSWDLFREAYAAIETYHQTP 236+KMDHHCPW+NNCVGH NH+YF F FF +GC++ + GS L+ +A +Sbjct:130 MKMDHHCPWINNCVGHRNHQYFLRFLFFSVVGCIHSTIIDGS-ALYHAIFAGWYQKYGDG 188Query:237 PPTFSFRERMTHKSLVYLWFLCSSVALALGALTVWHAVLISRGETSIERHINK 289
++ +LV+ + +VALAL L + +RIE +I +Sbjct:189 TEPIILLTPISFIALVFAIAMAIAVALALTFLFITQLRYVIRNRNGIEDYIRE 2416.PP3781A核苷酸序列(SEQ ID NO:16)長度1431bp1 GTTTCTGGAG TCCTGGGAAG GTGTCTGCCT GGCCGCGCTG CCAGATCAGT51 ACATCTTTTG TAAAAACCCT GAAATGGGCA GGGAAGAAAA CAGGGATTTC101 CCCTCTCTAG ATCCCTGCCA GGTCCCTCTC CAGGAGGCCC CTCTGCTCTC151 CTGAAGGGTG GTCCCTGAGG GTCTGCCCAG CCTTGGCACG AGAGGTTGGT201 TCCAGCCCCT GGCAGGGCTT CCTTCCAAGG GCCCCTGCAG CCTACAAACT251 GGGCCTCGGG CGACTCAAAA TAAGTGCTCT TGGGGGTGGC TCTACCCCAT301 TACCTCCCCG AGCCACAACT CCTGGCCTTC GACTTCTGGC TGGGTTAGCC351 AGACCCTGGT TTCTCTACCC TGATGTTGCA TGAGACCTGG TAACAGTGTC401 TCCCTCCCAG CTCCTTGCCA AAGCCTCTGT TGAGACCTGG GCTTCTTGTA451 GCCCCTTCTC CCTCTGGCCA GCTGCACAGC CTGTGGGAGG TGCCCGGCCC501 AGGCTGGGTG TGGGGGAAGC TGGTCCCTGC TGTGGGTGGC GCTGGGGACC551 TAGGGGCTCC TTCTGAGGTT GGCCTTGTGG CTCTGGGCTG TATGCCTCTG601 GGGTGTAGGG AAGAGGCGGG AGGAGTCATG GGGATGGGGA GCGGCAAGGG651 GGAGAGAGGG GCCCTCGACA AAGGCTTGGG AAATGAGGGG AGGTGGAGGC701 AGGGCAGGGG AAGCGAAGAG TCAGCCTTGG AGAGAGCACC CTGGGGCCTC751 CGTGTCGGGG TACACCCAGC ACTTTGCGAC CTGCGGCCCA GCAGGCGCGG801 AGGATGGCGG GGAGGAAGCC AGCAGCCCCT GTGTTTACTG TCGTCAGAAA851 GGTCTTGTGT TTTGGTTTTG GGGTTTTTGT TTTGTTTGTG TTTTGTTTGG901 CTTGTTTGTT TTTTAAGGGG AAAAAAGTTT GTAATTATTT CATCCAAATC951 TCCCGTTATA TATCTGTGAA TAATAAGAGA TTTTATAATA GCAAGAAAAT1001 GATGTATATT TTAGTTTGTT GACAAATAAG TCATCATGAT CACGAAGGAC1051 ACTGAGAAAA AAATAATTTA GAACCCTGGT TTTTGTGAAT TTTTTTGTTT1101 TGTGTTTCTT TGTTTTGAGA TTTGTGTTTG GTTTGGTTTT TGCACTGCAC1151 TAAGGCAGGA GGGTTGGAGG GCTGGGTGCA GCCTGGGAGT CCGATGGTTT1201 TCAGCAGGAG ACGGGGTGTC CCCTGCAGGG GGCTAAACTG CAGGGGCCTG1251 AGATTAGCTG TGAACATGTG GGAGCCCGAT GCATGTGGGT CAGGGATCTG1301 GGGGCCCCCC CAGCTGGCGG GAACCCCAAA TGGACACAAA CTGTACATTT1351 GCCAATGGGT TTTTTTTCAG ACCATGGTTT TTACTTGCAA ATAAACCTGA1401 GTTTCTTTTC TGCAAAAAAA AAAAAAAAAA AB氨基酸序列(SEQ ID NO:17)長度125個氨基酸1 MPLGCREEAG GVMGMGSGKG ERGALDKGLG NEGRWRQGRG SEESALERAP WGLRVGVHPA61 LCDLRPSRRG GWRGGSQQPL CLLSSERSCV LVLGFLFCLC FVWLVCFLRG KKFVIISSKS121 PVIYLC.核苷酸及氨基酸組合序列克 隆 號 PP3781(SEQ ID NO:18)起始編碼子 592 ATG終止編碼子969 TGA蛋白質(zhì)分子量135961 GTT TCT GGA GTC CTG GGA AGG TGT CTG CCT GGC CGC GCT GCC AGA TCA 4849 GTA CAT CTT TTG TAA AAA CCC TGA AAT GGG CAG GGA AGA AAA CAG GGA 9697 TTT CCC CTC TCT AGA TCC CTG CCA GGT CCC TCT CCA GGA GGC CCC TCT 144145 GCT CTC CTG AAG GGT GGT CCC TGA GGG TCT GCC CAG CCT TGG CAC GAG 192193 AGG TTG GTT CCA GCC CCT GGC AGG GCT TCC TTC CAA GGG CCC CTG CAG 240241 CCT ACA AAC TGG GCC TCG GGC GAC TCA AAA TAA GTG CTC TTG GGG GTG 288289 GCT CrA CCC CAT TAC CTC CCC CAG CCA CAA CTC CTG GCC TTC GAC TTC 336337 TGG CTG GGT TAG CCA GAC CCT GGT TTC TCT ACC CTG ATG TTG CAT GAG 384385 ACC TGG TAA CAG TGT CTC CCT CCC ACC TCC TTG CCA AAG CCT CTG TTG 432433 AGA CCT GGG CTT CTT GTA GCC CCT TCT CCC TCT GGC CAG CTG CAC ACC 480481 CTG TGG GAG GTG CCC GGC CCA GGC TGG GTG TGG GGG AAG CTG GTC CCT 528529 GCT GTG GGT GGC GCT GGG GAC CTA GGG GCT CCT TCT GAG GTT GGC CTT 576577 GTG GCT CTG GGC TGT ATG CCT CTG GGG TGT AGG GAA GAG GCG GGA GGA 6241 Met Pro Leu Gly Cys Arg Glu Glu Ala Gly Gly 11625 GTC ATG GGG ATG GGG AGC GGC AAG GGG GAG AGA GGG GCC CTC GAC AAA 67212 Val Met Gly Met Gly Ser Gly Lys Gly Glu Arg Gly Ala Leu Asp Lys 27573 GGC TTG GGA AAT GAG GGG AGG TGG AGG CAG GGC AGG GGA AGC GAA GAG 72028 Gly Leu Gly Asn Glu Gly Arg Trp Arg Gln Gly Arg Gly Ser Glu Glu 43721 TCA GCC TTG GAG AGA GCA CCC TGG GGC CTC CGT GTC GGG GTA CAC CCA 76844 Ser Ala Leu Glu Arg Ala Pro Trp Gly Leu Arg Val Gly Val His Pro 59769 GCA CTT TGC GAC CTG CGG CCC AGC AGG CGC GGA GGA TGG CGG GGA GGA 81660 Ala Leu Cys Asp Leu Arg Pro Ser Arg Arg Gly Gly Trp Arg Gly Gly 75817 AGC CAG CAG CCC CTG TGT TTA CTG TCG TCA GAA AGG TCT TGT GTT TTG 86476 Ser Gln Gln Pro Leu Cys Leu Leu Ser Ser Glu Arg Ser Cys Val Leu 91865 GTT TTG GGG TTT TTG TTT TGT TTG TGT TTT GTT TGG CTT GTT TGT TTT 91292 Val Leu Gly Phe Leu Phe Cys Leu Cys Phe Val Trp Leu Val Cys Phe 107913 TTA AGG GGA AAA AAG TTT GTA ATT ATT TCA TCC AAA TCT CCC GTT ATA 960108 Leu Arg Gly Lys Lys Phe Val Ile Ile Ser Ser Lys Ser Pro Val Ile 123961 TAT CTG TGA ATA ATA AGA GAT TTT ATA ATA GCA AGA AAA TGA TGT ATA1008124 Tyr Leu *** 1261009 TTT TAG TTT GTT GAC AAA TAA GTC ATC ATG ATC ACG AAG GAC ACT GAG10561057 AAA AAA ATA ATT TAG AAC CCT GGT TTT TGT GAA TTT TTT TGT TTT GTG11041105 TTT CTT TGT TTT GAG ATT TGT GTT TGG TTT GGT TTT TCC ACT CCA CTA11521153 AGG CAG GAG GGT TGG AGG GCT GGG TGC ACC CTG GGA GTC CGA TGG TTT12001201 TCA GCA GGA GAC GGG GTG TCC CCT GCA GGG GGC TAA ACT GCA GGG GCC12481249 TGA GAT TAG CTG TGA ACA TGT GGG AGC CCG ATG CAT GTG GGT CAG GGA12961297 TCT GGG GGC CCC CCC ACC TGG CGG GAA CCC CAA ATG GAC ACA AAC TGT13441345 ACA TTT GCC AAT GGG TTT TTT TTC AGA CCA TGG TTT TTA CTT GCA AAT13921393 AAA CCT GAG TTT CTT TTC TGC AAA AAA AAA AAA AAA AAA1431在本發(fā)明提及的所有文獻都在本申請中引用作為參考,就如同每一篇文獻被單獨引用作為參考那樣。此外應(yīng)理解,在閱讀了本發(fā)明的上述講授內(nèi)容之后,本領(lǐng)域技術(shù)人員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本申請所附權(quán)利要求書所限定的范圍。
權(quán)利要求
1.一種分離的具有抑癌功能的人蛋白,其特征在于,它包含具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQID NO:17;或其保守性變異多肽、或其活性片段、或其活性衍生物。
2.如權(quán)利要求1所述的多肽,其特征在于,該多肽是具有選自下組的氨基酸序列的多肽SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17。
3.一種分離的多核苷酸,其特征在于,它包含一核苷酸序列,該核苷酸序列與選自下組的一種核苷酸序列有至少85%相同性(a)編碼如權(quán)利要求1和2所述多肽的多核苷酸;(b)與多核苷酸(a)互補的多核苷酸。
4.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸編碼的多肽具有選自下組的氨基酸序列SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17。
5.如權(quán)利要求3所述的多核苷酸,其特征在于,該多核苷酸的序列選自下組SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18的編碼區(qū)序列或全長序列。
6.一種載體,其特征在于,它含有權(quán)利要求3所述的多核苷酸。
7.一種遺傳工程化的宿主細胞,其特征在于,它是選自下組的一種宿主細胞(a)用權(quán)利要求6所述的載體轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞;(b)用權(quán)利要求3所述的多核苷酸轉(zhuǎn)化或轉(zhuǎn)導的宿主細胞。
8.一種具有抑癌功能的人蛋白活性的多肽的制備方法,其特征在于,該方法包含(a)在適合表達具有抑癌功能的人蛋白的條件下,培養(yǎng)權(quán)利要求7所述的宿主細胞;(b)從培養(yǎng)物中分離出具有抑癌功能的人蛋白活性的多肽。
9.一種能與權(quán)利要求1所述的具有抑癌功能的人蛋白特異性結(jié)合的抗體。
10.一種核酸分子,它含有權(quán)利要求3所述的多核苷酸中連續(xù)的10-800個核苷酸。
11.一種藥物組合物,其特征在于,它含有安全有效量的權(quán)利要求1所述的多肽以及藥學上可接受的載體。
全文摘要
本發(fā)明公開了一類新的具有抑癌功能的人蛋白,編碼此多肽的多核苷酸和經(jīng)重組技術(shù)產(chǎn)生該多肽的方法。本發(fā)明還公開了此多肽用于治療多種疾病如癌癥等的方法。本發(fā)明還公開了抗此多肽的拮抗劑及其治療作用。本發(fā)明還公開了編碼這類新的具有抑癌功能的人蛋白的多核苷酸的用途。
文檔編號C12N15/13GK1323802SQ00115680
公開日2001年11月28日 申請日期2000年5月15日 優(yōu)先權(quán)日2000年5月15日
發(fā)明者顧健人, 楊勝利 申請人:上海市腫瘤研究所