專利名稱:肝細胞癌-相關(guān)基因和多肽,以及檢測肝細胞癌的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在肝細胞癌中上調(diào)的基因,由該基因編碼的多肽以及檢測肝細胞癌的方法。
背景技術(shù):
利用cDNA微陣列技術(shù)可以獲得正常細胞與惡性細胞內(nèi)基因表達的詳盡分布圖(Perou,C.M.等,Nature.406747-752,2000;Clark,E.A.等,Nature.406532-535,2000;Okabe,H.等,Cancer Res.612129-2137,2001)。該方法揭示出癌細胞的復雜的性質(zhì),有助于增進對致癌作用的了解。對在腫瘤中下調(diào)的基因的鑒定可對具體癌癥進行更加準確無誤的診斷,并開發(fā)出新的治療靶子(Golub,T.R.等,Science 286531-537,1999)。
肝細胞癌(HCC)是世界范圍內(nèi)癌癥死亡的主要原因。盡管近來治療策略有所改進,但晚期HCC患者的預后仍然很差。盡管分子水平的研究揭示出肝癌的成因與TP53,CTNNB1和/或AXIN1基因的改變相關(guān)(Perou,C.M.等,Nature.406747-752,2000;Satoh,S.等,Nat Genet.24245-250,2000),但這些改變似乎只涉及部分HCC。因此,仍然需要可以作為診斷標記和/或治療癌癥的藥物靶子的主要基因。
本發(fā)明人早先通過在HCC基因組范圍內(nèi)進行的分析,鑒定并報道了新基因VANGL1(Yagyu,R.等,國際腫瘤學雜志(International Journal ofOncology)201173-1178,2002)。
發(fā)明內(nèi)容
本發(fā)明的一個目的在于提供在肝細胞癌中上調(diào)的基因,由該基因編碼的多肽以及檢測肝細胞癌的方法。
本發(fā)明人利用能顯示23,040個基因的cDNA微陣列,研究了HCC的表達分布圖。通過這些努力精確定位了165個基因,包括69個EST,與相應的非癌肝細胞相比它們在癌癥組織中似乎高頻上調(diào)。本發(fā)明人從在HCC中的表達經(jīng)常提高的轉(zhuǎn)錄本中分離了三個基因。這些基因編碼與矢車菊根皮素(centaurin)-家族蛋白質(zhì)具有共同結(jié)構(gòu)特征的產(chǎn)物。
三個基因中的一個相應于單基因簇(UniGene cluster)EST Hs.44579,該基因是在染色體帶1p36.13上過表達的新基因。由于該基因的開放閱讀框編碼的蛋白與發(fā)育分化增強因子2(DDEF2)具有約60%同一性,本發(fā)明人將該基因稱作發(fā)育分化增強因子樣1(DDEFL1)。
另一個在HCC中上調(diào)的基因相應于單基因簇EST(hs.122730)。其推定的氨基酸序列分別與在果蠅中涉及細胞極性和決定細胞命運的斜視(Strabismus)(Van Gogh)和Van Gogh樣2(VANGL2)具有40%和63%的同一性。因此,將該基因稱作Van Gogh樣1(VANGL1)。
所發(fā)現(xiàn)的另一個在HCC中上調(diào)的基因是LGN(Genbank登錄號U54999)。LGN蛋白與抑制性異源三聚體G蛋白的α亞基(Gαi2)相互作用。
DDEFL1或LGN的基因轉(zhuǎn)移促進缺乏任何一個上述基因內(nèi)源表達的細胞的增殖。此外,DDEFL1,VANGL1或LGN的表達通過轉(zhuǎn)染它們的特定反義S-寡核苷酸而降低后,可抑制肝細胞癌細胞的生長。
上述發(fā)現(xiàn)有助于闡明HCC的機制,并研究出新的策略對HCC進行診斷和治療。
本發(fā)明具體地提供(1)選自下述的經(jīng)分離的核酸(a)包含SEQ ID NO1或NO3所示核苷酸序列的核酸;(b)編碼包含SEQ ID NO2或NO4所示氨基酸序列的多肽的核酸;(c)包含在嚴緊條件下可與由SEQ ID NO1或NO3或其互補鏈組成的核苷酸序列雜交的鏈的核酸,(2)選自下述的經(jīng)分離的多肽(a)由SEQ ID NO1或NO3所示核苷酸序列編碼的多肽;(b)包含SEQ ID NO2或NO4所示氨基酸序列的多肽;(c)與SEQ ID NO2或NO4具有至少65%同一性的多肽,(3)帶有(1)中的核酸的載體,(4)帶有(1)中的核酸或(3)中的載體的轉(zhuǎn)化子,(5)生產(chǎn)多肽的方法,該方法包括在培養(yǎng)基中培養(yǎng)(4)中的轉(zhuǎn)化子,在所述轉(zhuǎn)化子中表達所述多肽,和從培養(yǎng)基中回收所述多肽,(6)可與(2)中的多肽特異結(jié)合的抗體,(7)檢測肝細胞癌的方法,該方法包括下述步驟
(a)制備受試者的生物樣品;(b)測定至少一種選自如SEQ ID NO1,SEQ ID NO3,和SEQ ID NO5所示的多肽的表達水平;(c)將上述表達水平與在非癌癥樣品中的測定值相比較;和(d)確定受試者是否患癌癥,(8)檢測肝細胞癌的試劑,其包含在嚴緊條件下可與選自SEQ ID NO1,NO3或NO5的核苷酸序列或其互補序列雜交的鏈的核酸,(9)檢測肝細胞癌的試劑,其包含(6)中的抗體,和(10)抑制肝細胞癌生長的方法,該方法包括向肝細胞癌中引入至少一種可與SEQ ID NO1,NO3或NO5的核苷酸序列雜交的反義寡核苷酸。
下面對本發(fā)明進行詳細描述。
核酸本發(fā)明提供在肝細胞癌中上調(diào)的基因。
DDEFL1的核苷酸序列和氨基酸序列分別如SEQ ID NO1和NO2所示。完整的DDEFL1 cDNA由4050個核苷酸組成,具有由2712個核苷酸組成、并編碼903個氨基酸的蛋白(Genbank登錄號AB051853)的開放閱讀框。DDFEL1的氨基酸序列與DDEFL2具有60%的同一性,與DDEF/ASAP1具有46%的同一性,其包含一個ArfGTP酶-激活蛋白(ArfGAP)結(jié)構(gòu)域和兩個錨蛋白(ankyrin)重復。
DDEFL1與調(diào)節(jié)肌動蛋白細胞骨架重新組織相關(guān)的矢車菊根皮素家族成員DDEF2具有60%的同一性。這表明DDEFL1可能也在細胞結(jié)構(gòu)的組建中起作用(Randazzo,P.A.等,Arf GTP激活蛋白ASAP1調(diào)節(jié)肌動蛋白細胞骨架(The Arf GTPase-activating protein ASAP1 regulates the actincytoskeleton,)Proc.Natl.Acad.Sci.USA 974011-4016,2000)。由于DDEFL1也保持PH結(jié)構(gòu)域和ArfGAP基元,所以它似乎是通過GAP激活的方式調(diào)節(jié)Arf小GTP酶的矢車菊根皮素家族新成員。據(jù)認為可在GEFs的Db1家族中的大多數(shù)分子中觀察到的PH結(jié)構(gòu)域是通過與特定的靶分子相互作用,和/或通過直接調(diào)節(jié)催化結(jié)構(gòu)域在蛋白的重新定位中起關(guān)鍵作用(Jackson,T.R.等,Trends Biochem Sci.25489-495,2000;Cerione,R.A.和Zheng,Y.,Curr.Opin.Cell.Biol.8216-222,1996;Chardin,P.等,Nature 384481-484,1996)。雖然DDEF2定位于外周的粘著斑(focal adhesion),本發(fā)明人發(fā)現(xiàn)myc-標記的DDEFL1蛋白質(zhì)在細胞質(zhì)中擴散。
Arf蛋白質(zhì)涉及重要的細胞過程,如液泡膜運輸,內(nèi)質(zhì)網(wǎng)(ER)和高爾基體內(nèi)部空間(comparetment)完整性的維持,以及外周細胞骨架的調(diào)整(Cukierman,E.等,Science 2701999-2002,1995)。迄今為止,已鑒定出六個Arf家族成員(Arf1-Arf6)及其功能(Moss,J.and Vaughan,M.,J.Biol.Chem.27012327-12330,1995)。例如研究表明,Arf6蛋白可以作為細胞骨架的調(diào)節(jié)劑來改變粘著斑的形態(tài)并阻止細胞的擴散,且DDEF2表現(xiàn)出對Arf1的GAP活性。
DDEFL1的過表達增進促生長作用和細胞在低血清條件下的存活。這表明DDEFL1有助于癌細胞在貧營養(yǎng)和含氧量低的條件下生長。DDEFL1在HCC中頻繁的上調(diào)強調(diào)了該基因在肝癌發(fā)生中的重要性。
VANGL1的核苷酸序列和氨基酸序列分別如SEQ ID NO3和NO4所示。確定的cDNA序列由1879個核苷酸組成,包含一個編碼524個氨基酸的蛋白質(zhì)(Genbank登錄號AB057596)的由1572個核苷酸組成的開放閱讀框。
經(jīng)鑒定斜視(stbm)是決定果蠅突變體具有毛糙眼表型的基因(Wolff T.和Rubin G.M.,Development 1251149-1159,1998)。該基因是維持眼,腿和剛毛的極性所需的,并在果蠅中決定R3和R4光感受器的細胞命運。與stbm同源的小鼠基因Ltap在神經(jīng)管突變體小鼠Loop-尾中改變,所述小鼠是神經(jīng)管缺陷(NTD)的動物模型(Kibar Z等,Nat Genet.28251-255,2001)。因此,VANGL1可能還在細胞極性,細胞命運決定和/或組織結(jié)構(gòu)中起重要作用。由于VANGL1在HCC中頻繁地上調(diào),并且抑制其表達將顯著地減少癌細胞的生長或殘留,所以VANGL1可以使癌細胞延長存活時間和/或進行去極化生長。
LGN的核苷酸序列和氨基酸序列分別如SEQ ID NO5和NO6所示。LGN的cDNA由2336個核苷酸組成,編碼677個氨基酸的肽。
從前報道LGN蛋白是與抑制性的異源三聚體G蛋白α亞基(Gαi2)相互作用的蛋白)(Mochizuki,N.等,Gene 18139-43,1996)。Gαi2的激活突變曾經(jīng)在垂體瘤等內(nèi)分泌腫瘤中有過報道(Hermouet,S.等,Proc.Natl. Acad.Sci.USA 8810455-10459,1991;Pace,A.M.等,Proc.Natl.Acad.Sci.USA.887031-7035,1991;Lyons,J.et al,Science 249655-659,1990)。然而,未見到LGN涉及腫瘤發(fā)生或致癌作用的報告。集落形成試驗表明LGN可能具有致癌的活性。LGN增強表達可以活化Gαi2并且介導肝癌發(fā)生中的致癌信號。
本發(fā)明的核酸包括cDNA,基因組DNA,化學合成的DNA和RNA。可以是單鏈或雙鏈。
此處所用“經(jīng)分離的核酸”是指一種核酸,其結(jié)構(gòu)不等同于任何天然存在的核酸,或跨越三個以上獨立基因的天然基因組核酸的任何片段。因此該術(shù)語包括,例如(a)一種DNA,其具有該DNA分子天然狀態(tài)下所在生物體的基因組中天然基因組DNA分子的一部分序列;(b)一種核酸,其整合到載體或原核或真核生物基因組DNA中,使所得的分子不同于任何天然載體或基因組DNA;(c)單獨的分子例如cDNA,基因組片段,由聚合酶鏈式反應(PCR)產(chǎn)生的片段,或限制性片段;和(d)重組核苷酸序列,作為雜合基因(即編碼融合蛋白的基因)的一部分。具體地說,從這一定義中排除的是下述的核酸,即存在于由不同的(i)DNA分子,(ii)轉(zhuǎn)染細胞,或(iii)細胞克隆形成的混合物中的DNA分子,例如當它們出現(xiàn)在DNA文庫,如cDNA或基因組DNA文庫中。
在一個實施方案中,本發(fā)明的核酸包括,包含DDEFL1或VANGL1的核苷酸序列(具體說來是SEQ ID NO1或NO3)的核酸。
在另一個實施方案中,本發(fā)明的核酸包括編碼包含DDEFL1或VANGL1的氨基酸序列的多肽(具體說來是SEQ ID NO2或NO4)的核酸。因而,包含基于遺傳密碼簡并性的任意序列的核酸均包括在內(nèi)。
在又一個實施方案中本發(fā)明的核酸包含SEQ ID NO1或NO3的變體核酸序列。所述變體包括含有在嚴緊條件下可與由SEQ ID NO1或NO3組成的核苷酸序列或其互補鏈雜交的鏈的核酸。
此處所用的術(shù)語“互補”是指雙鏈核酸的其中一條鏈的全部堿基均能與另一條鏈的堿基形成堿基對。另外,“互補”不僅指在至少15個毗連核苷酸形成的連續(xù)區(qū)域內(nèi)完全匹配的那些,還包括在該區(qū)域內(nèi)具有至少65%,優(yōu)選70%,更優(yōu)選80%,更優(yōu)選90%,最優(yōu)選95%或更高同一性的那些。
此處所述兩核酸的“百分比同一性”是利用Karlin和Altschul的算法(Proe.Natl.Acad.Sci.USA 872264-2268,1990)經(jīng)Karlin和Altschul修改(Proc.Natl.Acad.Sci.USA 905873-5877,1993)后的算法確定的。該算法已并入Altschul等的NBLAST和XBLAST程序(J.Mol.Biol.215403-410,1990)。BLAST核苷酸檢索是利用NBLAST程序進行的,得分(score)=100,字長(wordlength)=12。蛋白質(zhì)的同源檢索可在,例如在日本DNA數(shù)據(jù)庫(DDBJ)中通過FASTA程序,BLAST程序等進行。BLAST蛋白質(zhì)檢索是利用XBLAST程序進行的,得分(score)=50,字長(wordlength)=3。當兩序列間存在缺口(gap)時,利用Gapped BLAST進行,參見Altsuchl等(Nucleic AcidsRes.253389-3402,1997)。運用BLAST和Gapped BLAST程序時,應用各程序(例如XBLAST和NBLAST)的缺省參數(shù)。
優(yōu)選地,該變體包括與SEQ ID NO1或NO3所示的核苷酸序列具有至少65%同一性的核苷酸序列。更優(yōu)選,該變體與SEQ ID NO1或NO3所示的核苷酸序列具有至少65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%或更高的同一性。當所述變體在長度上等同于或長于參照序列,如SEQ ID NO1或NO3時,所述比較是基于全長的參照序列作出的。當所述變體比參照序列,例如SEQ ID NO或NO3短時,所述比較是基于參照序列中與變體序列相同長度的節(jié)段進行的(排除同源性計算時所需的任何環(huán))。
所述嚴緊條件雜交定義為在下述條件下進行的平衡雜交42℃,2xSSC,0.1%SDS(低嚴緊);50℃,2x SSC,0.1%SDS(中度嚴緊);65℃,2x SSC,0,1%SDS(高度嚴緊)。如果需要通過洗滌達到平衡,所述洗滌利用適合于具體嚴緊性要求的雜交溶液進行。通常,溫度越高在平衡狀態(tài)下雜交的兩條鏈間的同源性越高。
對本發(fā)明的核酸的長度沒有限制,但其優(yōu)選包含至少15,20,30,40 50,100,150,200,300,400,500 1000,1500,2000,2500,或3000個核苷酸。
本發(fā)明的核酸包括用作探針或引物的多核苷酸,所述探針或引物可與SEQ ID NO1或NO3或其互補鏈特異雜交。術(shù)語“特異雜交”是指在通常的雜交條件下,優(yōu)選在嚴緊條件下與SEQ ID NO1或NO3所示的核苷酸序列雜交,但不與編碼其它多肽的DNA交叉雜交。
所述引物和探針包含SEQ ID NO1或3所示核苷酸序列或其互補序列中的至少15個連續(xù)的核苷酸。通常,所述引物包含15到100個核苷酸,優(yōu)選包含15到35個核苷酸,所述探針包含至少15個核苷酸,優(yōu)選包含至少30個核苷酸,包含SEQ ID NO1或NO3所示序列的部分或全部。所述引物可用于擴增編碼本發(fā)明多肽的核酸,所述探針可用于分離或檢測編碼本發(fā)明的多肽的核酸。本發(fā)明的引物和探針可利用,例如可商購的寡核苷酸合成儀制備。所述探針也可以通過限制酶處理等方式制備成雙鏈DNA片段。
本發(fā)明的核酸包括可與SEQ ID NO1或3的核苷酸序列中任意位點雜交的反義寡核苷酸。本文術(shù)語“反義寡核苷酸”不僅指其全部核苷酸均與相應的DNA或mRNA特異區(qū)域互補的那些寡核苷酸,還包括具有一個或多個錯配的核苷酸的寡核苷酸,只要DNA或mRNA和寡核苷酸能與SEQ IDNO1或NO3的核苷酸序列雜交即可。
優(yōu)選所述反義寡核苷酸針對SEQ ID NO1或NO3中的至少15個連續(xù)的核苷酸。更優(yōu)選上述的反義寡核苷酸包含上述至少15連續(xù)的核苷酸中的起始密碼子。
本發(fā)明的反義寡核苷酸包括含低級烷基磷酸酯(例如,甲基磷酸酯或乙基磷酸酯),硫代磷酸酯(phosphothioate)和磷酰胺酸酯(phosphoramidate)的類似物。
本發(fā)明的反義寡核苷酸,通過與編碼本發(fā)明多肽的DNA或mRNA相結(jié)合并抑制其轉(zhuǎn)錄或翻譯,從而作用于產(chǎn)生本發(fā)明的多肽的細胞,促進所述mRNA的降解從而抑制本發(fā)明多肽的表達。
本發(fā)明核酸的制備如下??衫绺鶕?jù)編碼本發(fā)明多肽的DNA的核苷酸信息(例如SEQ ID NO1或NO3)制備引物,通過噬斑PCR(Affara NA等(1994)Genomics 22,205-210)制備編碼本發(fā)明多肽的cDNA。利用可商購的“Qiagen基因組DNA試劑盒(Qiagen,Hilden,Germany)的方法制備基因組DNA。所得DNA的核苷酸序列可以利用本領(lǐng)域已知的方法,例如可商購的″染料終止子測序試劑盒″(Applied Biosystems)確定。本發(fā)明的核酸,如下文所述可用于生產(chǎn)重組蛋白并檢測肝細胞癌。
載體,轉(zhuǎn)化子和重組多肽的生產(chǎn)本發(fā)明還涉及插入了本發(fā)明核酸的載體。
本發(fā)明的載體包括制備本發(fā)明重組多肽的載體。任何能夠表達本發(fā)明多肽的載體均可使用。
表達載體的實例包括細菌(例如大腸桿菌)表達載體,酵母表達載體,昆蟲表達載體,和哺乳動物表達載體。在本發(fā)明中,哺乳動物表達載體如,pcDNA3.1-myc/His或pcDNA 3.1載體(Invitrogen)均可使用。可利用本領(lǐng)域公知的方法將本發(fā)明的核酸插入到載體中。
本發(fā)明的載體還包括在體內(nèi)表達本發(fā)明多肽的載體(尤其用于基因治療)。各種病毒載體和非病毒載體只要其能在體內(nèi)表達本發(fā)明的多肽均可使用。病毒載體的實例包括腺病毒載體,反轉(zhuǎn)錄病毒載體等等。陽離子脂質(zhì)體可作為非病毒的載體的例子。
本發(fā)明還提供以可表達的方式帶有本發(fā)明核酸的轉(zhuǎn)化子。本發(fā)明的轉(zhuǎn)化子包括帶有插入了本發(fā)明核酸的上述表達載體的轉(zhuǎn)化子,以及帶有整合了本發(fā)明核酸的基因組的轉(zhuǎn)化子。本發(fā)明的核酸可以任何形式保留在所述轉(zhuǎn)化子中,只要所述轉(zhuǎn)化子可以表達所述核酸即可。
本發(fā)明對插入了所述載體的細胞沒有特殊的限制,只要所述載體能在所述細胞中表達本發(fā)明的核酸即可。例如大腸桿菌,酵母,哺乳動物細胞和昆蟲細胞均能用作宿主細胞。優(yōu)選的哺乳動物細胞如COS7細胞和NIH3T3細胞??捎帽绢I(lǐng)域已知的方法,如電穿孔法和磷酸鈣法將載體引入細胞。
可用本領(lǐng)域的常規(guī)方法從轉(zhuǎn)化子中分離純化所述重組多肽。例如,在收集了轉(zhuǎn)化子并獲得了提取物之后可通過離子交換層析,反向?qū)臃治龇?,凝膠過濾,或在柱子中固定了針對本發(fā)明多肽的抗體的親和層析法,或通過這幾種柱子的組合,來純化并制備目的多肽。
當本發(fā)明的多肽在宿主細胞(例如動物細胞,大腸桿菌)中作為與谷胱甘肽-S-轉(zhuǎn)移酶蛋白的融合蛋白表達,或作為添加了多個組氨酸的重組多肽表達時,可利用谷胱甘肽柱或鎳柱純化所表達的重組多肽。融合蛋白純化后還可以根據(jù)需要用凝血酶或Xa-因子切除非目的多肽區(qū)域。
多肽本發(fā)明提供由DDEFL1或VANGL1(例如SEQ ID NO1或NO3)編碼的經(jīng)分離的多肽。在具體實施方案中,本發(fā)明的多肽包括由SEQ ID NO1或NO3的核苷酸序列編碼的多肽,和包含SEQ ID NO2或NO4所示氨基酸序列的多肽。
所述“經(jīng)分離的多肽”指基本純且不含其它生物大分子的多肽?;炯兊亩嚯氖歉芍刂辽?5%(例如,至少80,85,95,或99%)純的。純度可通過任何適宜的標準方法測定,例如通過柱層析法,聚丙烯酰胺凝膠電泳,或高效液相色譜分析。
本發(fā)明的多肽包括SEQ ID NO2或NO4的變體,只要所述變體與SEQID NO2或NO4具有至少65%的同一性即可。所述變體可以是,包含SEQID NO2或NO4所示氨基酸序列、且其中有一個或多個氨基酸被取代,缺失,添加和/或插入的多肽。所述變體也可以是由包含在嚴緊條件下可與由SEQ ID NO1或NO3所示核苷酸序列雜交的鏈的核酸所編碼的多肽。
已知具有在具體氨基酸序列中缺失,添加和/或替代一個或多個氨基酸殘基所得的氨基酸序列的多肽可保持原始的生物活性(Mark,D.F.等,Proc.Natl.Acad.Sci.USA(1984)81,5662-5666,Zoller,M.J. & Smith,M.,NucleicAcids Research(1982)10,6487-6500,Wang,A.等,Science 224,1431-1433,Dalbadie-McFarland,G.等,Proc.Natl.Acad.Sci.USA(1982)79,6409-6413)。
通過取代,缺失,添加,和/或插入而突變的氨基酸的數(shù)目沒有特別的限定。通常,該數(shù)目是氨基酸殘基總數(shù)的10%或更少,優(yōu)選5%或更少,更優(yōu)選1%或更少。
將要突變的氨基酸殘基優(yōu)選經(jīng)過突變成為側(cè)鏈性質(zhì)保守的不同氨基酸。氨基酸側(cè)鏈性質(zhì)的實例是疏水的氨基酸(A,I,L,M,F(xiàn),P,W,Y,V),親水氨基酸(R,D,N,C,E,Q,G,H,K,S,T),以及含有下列側(cè)鏈的氨基酸脂肪族側(cè)鏈(G,A,V,L,I,P);包含羥基的側(cè)鏈(S,T,Y);含硫原子的側(cè)鏈(C,M);含羧酸和酰胺的側(cè)鏈(D,N,E,Q);包含堿基的側(cè)鏈(R,K,H);和包含芳族的側(cè)鏈(H,F(xiàn),Y,W)(括號中的字母是氨基酸的單字母密碼)。“保守氨基酸取代”是用上述一組中氨基酸取代同組中的另一氨基酸。
缺失變體包括SEQ ID NO1或NO3所示氨基酸序列的片段。該片段是具有與本發(fā)明的上述多肽部分相同但非全部相同的氨基酸序列的多肽。本發(fā)明的多肽片段通常由8個或更多氨基酸殘基組成,優(yōu)選由12個或更多氨基酸殘基組成(例如,15個或更多氨基酸殘基)。優(yōu)選片段的實例包括下述的截短多肽具有缺失了一組或兩組氨基酸殘基的氨基酸序列的多肽,其中所述一組缺失包括氨基末端或羧基末端的缺失,所述兩組缺失分別包括氨基末端和羧基末端的缺失。此外,還優(yōu)選具有結(jié)構(gòu)或功能特點的片段,其包括那些具有α-螺旋和α-螺旋形成區(qū),β-折疊和β-折疊形成區(qū),轉(zhuǎn)角和轉(zhuǎn)角形成區(qū),卷曲和卷曲形成區(qū),親水區(qū)域,疏水區(qū)域,α-兩親性區(qū)域,β-兩親性區(qū)域,可變區(qū),表面成形區(qū)域,底物結(jié)合區(qū)域,和高抗原性指數(shù)區(qū)域。也優(yōu)選生物學活性片段。生物學活性片段可以介導本發(fā)明多肽的活性,所述片段包括那些具有類似的或改進的活性的片段和減少了不良活性的片段。例如具有通過結(jié)合配體將信號轉(zhuǎn)導到細胞內(nèi)的活性的片段,以及在動物(包括人)中具有抗原性或免疫原性的片段。這些多肽片段優(yōu)選保持本發(fā)明多肽的抗原性。
所述添加變體包括本發(fā)明多肽與另一肽或多肽的融合蛋白。融合蛋白可利用本領(lǐng)域技術(shù)人員已知的方法制備,例如將編碼本發(fā)明多肽的DNA與編碼其它肽或多肽的DNA相連接,使框架匹配,再將其插入表達載體并在宿主中表達。對與本發(fā)明的多肽相融合的肽或多肽沒有限制。
已知的肽,例如FLAG(Hopp,T.P.等,Biotechnology(1988)6,1204 1210),6xHis(包含六個His(組氨酸)殘基),10xHis,流感病毒凝集素(HA),人C-myc片段,VSP-GP片段,p18HIV片段,T7標記,HSV-標記,E-標記,SV40 T抗原片段,lck標記,α-微管蛋白片段,B-標記,蛋白C片段,等等均可用作與本發(fā)明的多肽相融合的肽。與本發(fā)明的多肽相融合的多肽的例子,如GST(谷胱甘肽-S-轉(zhuǎn)移酶),流感病毒凝集素(HA),免疫球蛋白恒定區(qū),β-半乳糖苷酶,MBP(麥芽糖-結(jié)合蛋白)等等。
通過將可商購的編碼這些肽或多肽的DNA與編碼本發(fā)明的多肽的DNA相融合,并表達所述融合DNA,可以制備融合蛋白。
變體多肽優(yōu)選與SEQ ID NO2或NO4所示氨基酸序列具有至少65%的同一性。更具體地說,所述修飾多肽與SEQ ID NO2或NO4所示氨基酸序列具有至少65%,70%,75%,80%,85%,90%,95%,96%,97%,98%,99%,或以上的同一性。當經(jīng)修飾的多肽長于或等同于參考序列,例如SEQ ID NO2或NO4時,所述比較是基于全長的參考序列進行的。當經(jīng)修飾的多肽比參照序列,例如SEQ ID NO2或NO4短時,所述比較是基于參照序列中和變體序列相同長度的節(jié)段進行的。
此處所用兩個氨基酸序列間的“百分同一性”是應用與上述核酸的描述中同樣的方法確定的。
本發(fā)明的多肽可應用本領(lǐng)域技術(shù)人員已知的方法,通過上述的遺傳工程技術(shù)制備成天然的多肽或重組多肽。天然的多肽可通過下述方式獲得,即用重組多肽免疫小動物獲得抗體,將該抗體與柱子偶聯(lián),利用這種柱子通過親和層析提取高水平表達本發(fā)明多肽的肝組織或細胞。制備重組多肽可以是,將編碼本發(fā)明多肽的DNA(例如包含SEQ ID NO或3所示核苷酸序列的DNA)插入到合適的表達載體中,將所述表達載體引入宿主細胞,使所得的轉(zhuǎn)化子表達所述多肽,再回收所表達的多肽。
可以通過已知的方法,例如PCR-介導的定點誘變誘導系統(tǒng)(GIBCO-BRL,Gaithersburg,Maryland),寡核苷酸-介導的特定區(qū)域(sight-directed)-誘變(Kramer,W.and Fritz,HJ(1987)酶學方法(Methods inEnzymol)154350-367)將突變插入到SEQ ID NO1或NO3的氨基酸序列中,來制備變體多肽。
抗體本發(fā)明還涉及可與本發(fā)明的多肽特異結(jié)合的抗體。對本發(fā)明的抗體的形式?jīng)]有特別地限制,其包括多克隆抗體和單克隆抗體。還包括用本發(fā)明的多肽免疫動物(如,兔)制備的抗血清,各類多克隆和單克隆抗體,由遺傳工程制備的人源化抗體,以及人抗體。
多克隆抗體可通過下述方式制備,即收獲用本發(fā)明的多肽免疫小動物(如兔)所獲得的血清,通過偶聯(lián)了本發(fā)明多肽的親和層析柱取得僅僅識別本發(fā)明多肽的組分,再利用蛋白G或蛋白A柱從上述組分中純化免疫球蛋白G或M。
制備單克隆抗體是通過下述方式進行的,即用本發(fā)明的多肽免疫小動物(如小鼠),取出所述動物的脾臟,將所述器官勻漿成細胞,再利用試劑,如聚乙二醇將所述細胞與小鼠骨髓瘤細胞融合,從融合細胞(雜交瘤)中選擇能產(chǎn)生針對本發(fā)明多肽的抗體的克隆,將所得的雜交瘤移植到小鼠的腹腔中,提取腹水。所得的單克隆抗體可通過,例如硫酸銨沉淀,蛋白A或蛋白G柱,DEAE離子交換層析,或偶聯(lián)了本發(fā)明多肽的親和層析柱進行純化。本發(fā)明的抗體可用于純化和檢測本發(fā)明的多肽。特別是可用于檢測肝細胞癌。
人抗體或人源化抗體可通過本領(lǐng)域技術(shù)人員已知的方法制備。例如可用本發(fā)明的多肽免疫已將其免疫系統(tǒng)轉(zhuǎn)變?yōu)槿嗣庖呦到y(tǒng)的小鼠來制備人抗體。人源化的抗體可通過下述方法制備,例如從單克隆抗體產(chǎn)生細胞克隆出所述抗體的基因,利用CDR移植方法將所述基因中的抗原識別部位移植到已知的人抗體中。
檢測方法本發(fā)明還提供利用DDEFL1 VANGL1或LGN多肽作為標記檢測肝細胞癌的方法。
所述檢測是通過下述方法進行的,測定來自受試者的生物樣品中DDEFL1 VANGL1,和LGN多肽至少其中之一的表達水平,將其與非癌樣品中的表達水平相比較,確定受試者是否患癌癥。
此處所用的生物樣品包括來自需要進行肝細胞癌檢測的受試者的任何肝組織或細胞。特別是可以使用肝活組織檢查樣品。所述生物樣品還包括由肝組織或細胞制備的mRNA,cRNA或cDNA樣品。mRNA和cDNA樣品可由常規(guī)方法制備。cRNA是指用RNA聚合酶從模板cDNA轉(zhuǎn)錄所得的RNA。cRNA可以以連接有T7啟動子的cDNA為模板,利用T7 RNA聚合酶來合成。可以利用為獲得基于DNA芯片的表達分布圖的可商購cRNA轉(zhuǎn)錄試劑盒。
在具體實施方案中,可以通過RNA,cDNA或多肽的水平測定DDEFL1,VANGL1或LGN多肽的表達水平。
mRNA的表達水平可以通過例如,利用可與DDEFL1,VANGL1,或LGN的核苷酸序列雜交的探針進行Northern印跡,或利用可與DDEFL1,VANGL1,或LGN的核苷酸序列雜交的引物進行RT-PCR來測定。
用于本發(fā)明的檢測方法的探針和引物包括可與SEQ ID NO1,NO3或NO5的核苷酸序列或其互補序列特異雜交的核酸。術(shù)語“特異雜交”是指在正常雜交條件下,優(yōu)選在嚴緊條件下,可與SEQ ID NO1,NO3或NO5的核苷酸序列雜交,而不與編碼其它多肽的DNA交叉雜交。
所述引物和探針包含SEQ ID NO1,NO3或NO5的核苷酸序列或它們的互補序列中至少15個連續(xù)的核苷酸。通常,所述引物包含15到100個核苷酸,優(yōu)選15到35個核苷酸,所述探針包含至少15個核苷酸,優(yōu)選至少30個核苷酸,其包含SEQ ID NO1,NO3或NO5的至少一部分或全部序列。所述引物和探針可通過例如可商購的寡核苷酸合成儀制備。所述探針還可以制備成由限制酶處理所得的雙鏈DNA片段。
cDNA表達水平可通過,例如應用DNA陣列的方法測定(MasamiMuramatsu和Masashi Yamamoto,新遺傳工程手冊(New Genetic EngineeringHandbook)280-284頁,YODOSHA Co.,LTD.)。具體地說,首先提供來自受試者的cDNA樣品和固體支持物,其上固定有與DDEFL1,VANGL1或LGN的核苷酸序列雜交的多核苷酸探針??梢岳萌缟纤鎏结槨?梢栽谒龉腆w支持物上固定兩種以上的探針以檢測兩種以上的靶多核苷酸。根據(jù)需要可對cDNA樣品進行標記以用于檢測。對于所用的標記并沒有特殊地限定,只要其能被檢測即可,例如熒光標記,放射性標記等。可通過常規(guī)的方法進行標記(L.Luo等,“激光捕獲的鄰近神經(jīng)原亞型基因表達分布圖(Geneexpression profiles of laser-captured adjacent neuronal subtypes)”,Nat.Med.(1999)117-122頁)。
使cDNA樣品與固定于固體支持物上的探針相接觸,以便使cDNA樣品與所述探針雜交。盡管雜交反應溶液和反應條件根據(jù)不同的因素,如探針的長度而有所不同,但本領(lǐng)域的技術(shù)人員可以通過常規(guī)的方法來確定。
cDNA樣品和固體支持物上的探針之間的雜交強度,可根據(jù)cDNA樣品的標記物種類進行確定。例如可通過探測器讀出熒光信號來檢測熒光標記物。
用不同的熒光標記對實驗cDNA樣品和對照cDNA樣品(例如來自非癌組織或細胞的cDNA)進行標記即可同時測定它們的雜交強度。例如上述的一個cDNA樣品用Cy5標記,另一個用Cy3標記。Cy5和Cy3的熒光信號強度說明各cDNA樣品的表達水平(Duggan等,Nat.Genet.2110-14,1999)。
在該方法中也可以用cRNA而不是cDNA進行測定。
此外,可利用針對DDEFL1,VANGL1,或LGN多肽的抗體,通過下述方法測定多肽的表達水平,所述方法例如SDS聚丙烯酰胺電泳法,Western印跡,點印跡,免疫分析,例如免疫沉淀,熒光免疫分析,放射免疫分析,酶免疫分析(例如酶聯(lián)免疫吸附試驗(ELISA)),和免疫組化染色等等。
在具體實施方案中,將生物樣品與固定于固體支持物上的針對DDEFL1,VANGL1或LGN多肽的抗體相接觸,再將所述固體支持物上的抗原-抗體復合物與帶有可檢測的標記的第二抗體相接觸,用適當?shù)姆椒z測所述標記物。
用于本發(fā)明的檢測方法的抗體包括任何可與DDEFL1,VANGL1,或LGN多肽,特別是與具有SEQ ID NO2,NO4或NO6的氨基酸序列的多肽結(jié)合的抗體,包括用DDEFL1,VANGL1,或LGN多肽免疫動物(如兔)所得的抗血清,各種類別的多克隆和單克隆抗體,由遺傳工程制備的人源化抗體,和人抗體。這些抗體的制備如上所述。
將如上述測定的表達水平與在非癌樣品中測定的表達水平相比較,確定受試者是否存在肝細胞癌。當在受試者樣品中測得的表達水平高于非癌樣品中的表達水平時,則可判斷受試者患有癌癥或具有患所述癌癥的危險性。另一方面,當在受試者樣品中測得的表達水平不高于非癌樣品中的表達水平時,則可判斷受試者未患有癌癥。具體地說,受試樣品是否比非癌樣品的表達水平高可根據(jù)相對表達比率(受試樣品/非癌樣品)確定;當所述相對表達比率高于2.0,可以斷定其表達水平較高。
檢測試劑本發(fā)明提供針對肝細胞癌的檢測試劑。
在一個實施方案中,本發(fā)明的檢測試劑包括具有可與DDEFL1,VANGL1或LGN,特別是SEQ ID NO1,NO3,或NO5雜交的至少15個核苷酸的多核苷酸。多核苷酸可作為探針或引物用于上述本發(fā)明的檢測方法。用作探針時,包含于本發(fā)明的檢測試劑中的多核苷酸可以是經(jīng)過標記的。標記的方法包括,例如通過T4多核苷酸激酶用32P使所述多核苷酸的5’-末端磷酸化的標記方法;以隨機的六聚物寡核苷酸等作為引物,通過DNA聚合酶例如Klenow酶引入帶有同位素(例如32P),熒光染料,生物素等標記的底物堿基的方法(隨機引導法等等)。
在另一個實施方案中,本發(fā)明的檢測試劑包含可與DDEFL1,VANGL1或LGN多肽特別是具有SEQ ID NO2,NO4,或NO6的氨基酸序列的多肽相結(jié)合的抗體。本發(fā)明的抗體用于在上述本發(fā)明的檢測方法中檢測本發(fā)明的多肽。所述抗體可用公知的方法進行標記。此外,所述抗體可被固定到固體支持物上。
本發(fā)明的檢測試劑還可以包含介質(zhì)或添加劑,包括無菌水,生理鹽水,植物油,表面活性劑,脂類,增溶劑,緩沖液,蛋白穩(wěn)定劑(如牛血清白蛋白和明膠),保存劑等等,只要其不影響本發(fā)明檢測方法中的反應即可。
抑制肝細胞癌生長的方法本發(fā)明還提供抑制肝細胞癌生長的方法。在一個具體實施方案中,該方法可通過將DDEFL1,VANGL1,或LGN的反義寡核苷酸引入靶細胞來進行。
用于該方法的反義寡核苷酸可與SEQ ID NO1,NO3,或NO5的核苷酸序列內(nèi)的任意位點雜交。所述反義寡核苷酸不僅包括那些全部的核苷酸均與相應的DNA或mRNA特異區(qū)域的核苷酸互補的寡核苷酸,還包括具有一個或多個錯配的核苷酸的寡核苷酸,只要DNA或mRNA和寡核苷酸能與SEQ ID NO1或NO3或NO5的核苷酸序列雜交即可。
所述反義寡核苷酸優(yōu)選針對SEQ ID NO1,NO3,或NO5中至少15個連續(xù)的核苷酸。更優(yōu)選上述的反義寡核苷酸包含上述至少15連續(xù)的核苷酸中的起始密碼子。
所述反義寡核苷酸包括含低級烷基磷酸酯(例如,甲基磷酸酯或乙基磷酸酯),硫代磷酸酯和磷酰胺酸酯的類似物。
此處,所述靶細胞可以是哺乳動物細胞,優(yōu)選人細胞。
所述引入方法可以是體外,體內(nèi),或回體(ex vivo)的轉(zhuǎn)移方法。在一個實施方案中,所述反義寡核苷酸可以通過常規(guī)的轉(zhuǎn)染方法引入靶細胞。或者,所述引入可通過常規(guī)的基因轉(zhuǎn)移技術(shù),利用帶有反義寡核苷酸的載體,如腺病毒載體,反轉(zhuǎn)錄病毒載體,或陽離子的脂質(zhì)體進行。
在此引用的任何專利,專利申請,和出版物均并入本申請作為參考。
圖1a-1b說明HCC中稱作B9362的基因的表達。圖1a說明由cDNA微陣列檢測的B9362在原始的20個HCC中的相對表達比率(癌/非-癌)。圖1b顯示對附加的11個HCC病例通過半定量RT-PCR分析的B9362表達情況的照片。GAPDH的表達作為內(nèi)部對照。
圖2a-2d說明DDEFL1的鑒定結(jié)果。圖2a是DDEFL1在各種人組織中的Northern印跡分析結(jié)果。圖2b顯示DDEFL1的結(jié)構(gòu)。圖2c顯示預期的DDEFL1蛋白和ArfGAP家族成員之間的相似性。圖2d顯示DDEFL1和DDEF2中ArfGAP基元氨基酸序列之間的同一性。箭頭指示CXXCX16CXXC基元,表示對GAP活性而言必不可少的鋅指結(jié)構(gòu)。
圖3a-3b顯示DDEFL1的亞細胞定位。圖3a是Western印跡分析結(jié)果的照片,表明cMyc-標記的DDEFL1蛋白在經(jīng)pcDNA-DDEFL1-myc質(zhì)粒轉(zhuǎn)染的COS7細胞中表達。圖3b是顯示所述細胞的免疫細胞化學的照片,表明cMyc-標記的DDEFL1蛋白定位于細胞質(zhì)。
圖4a-4d顯示DDEFL1的生長-促進效果。圖4a是顯示集落形成試驗結(jié)果的照片,表明DDEFL1促進NIH3T3,SNU423,和Alexander細胞生長。圖4b是表明NIH3T3-DDEFL1細胞穩(wěn)定表達外源DDEFL1的照片。圖4c是顯示穩(wěn)定表達外源DDEFL1的NIH3T3-DDEFL1細胞在含10%FBS的培養(yǎng)基中的生長。圖4d是顯示NIH3T3-DDEFL1細胞在含0.1%FBS的培養(yǎng)基生長的圖表(p<0.01)。
圖5a-5b顯示經(jīng)設計能在SNU475細胞中抑制DDEFL1的反義S-寡核苷酸的生長抑制作用。圖5a顯示反義S-寡核苷酸的設計和顯示通過轉(zhuǎn)染AS1或AS5反義S-寡核苷酸使DDEFL1表達降低的照片。圖5b是顯示AS1和AS5抑制SNU475細胞生長的照片。
圖6a-6b顯示VANGL1在HCC中的表達。圖6a顯示由cDNA微陣列檢測的VANGL1在原始的20個HCC中的相對表達比率(癌/非-癌)。圖6b是顯示用附加的10個HCC病例由半定量RT-PCR分析的D3244表達情況的照片。T,腫瘤組織;N,正常組織。GAPDH的表達作為內(nèi)部對照。
圖7a和7b說明VANGL1的鑒定結(jié)果。圖7a是顯示VANGL1在各種人組織中多-組織Northern印跡分析結(jié)果的照片。圖7b顯示預期的VANGL1蛋白質(zhì)結(jié)構(gòu)。
圖8a和8b顯示VANGL1的亞細胞定位。圖8a是用pcDNA3.1-myc/His-VANGL1轉(zhuǎn)染,用小鼠抗-myc單克隆抗體染色,用偶聯(lián)了若丹明的抗小鼠IgG第二抗體顯現(xiàn)的SNU475細胞的照片。核是DAPI復染的。圖8b是經(jīng)類似染色并觀察的模擬細胞的照片。
圖9a-9d顯示經(jīng)設計能抑制VANGL1的反義S-寡核苷酸的生長抑制效果。圖9a是顯示VANGL1在用對照或反義寡核苷酸處理12小時的SNU475細胞中表達的照片。圖9b是顯示S寡核苷酸抑制SNU423細胞生長的照片。圖9c是由MTT試驗分析細胞活力的結(jié)果圖。圖9d是顯示經(jīng)正義或反義寡核苷酸處理的細胞的熒光活化細胞分揀(FACS)結(jié)果。
圖10a和10b顯示與相應的非癌活組織相比HCC的LGN基因表達。圖10a顯示由cDNA微陣列檢測的LGN在原始的20個HCC中的相對表達比率(癌/非-癌)。圖10b顯示用附加的10個HCC病例由半定量RT-PCR分析的LGN表達情況的照片。GAPDH的表達作為內(nèi)部對照。T,腫瘤組織;N,正常組織。
圖11顯示LGN的基因組結(jié)構(gòu)。
圖12a-12c顯示LGN的亞細胞定位。圖12a是用pcDNA3.1-myc/His-LGN轉(zhuǎn)染的COS7細胞的照片,其中核是DAPI復染的。圖12b是用pcDNA3.1myc/His-LGN轉(zhuǎn)染,用小鼠抗c-myc抗體染色,用偶聯(lián)了若丹明的抗小鼠IgG第二抗體顯示的COS7細胞。圖12c是a和b的合并。
圖13a和13b顯示LGN的生長-促進效果。圖13a是顯示集落形成試驗結(jié)果的照片,表明LGN促進NIH3T3,SNU423,Alexander和SNU475細胞的生長。圖13b是顯示在含10%FBS的培養(yǎng)基中穩(wěn)定表達外源LGN的NIH3T3-LGN細胞的生長優(yōu)于模擬(NIH3T3-LacZ)細胞。
圖14a和14b顯示經(jīng)設計能抑制LGN表達的反義S-寡核苷酸在人肝細胞癌SNU423細胞中的生長抑制。圖14a的照片顯示,反義S-寡核苷酸反義3的轉(zhuǎn)染降低了LGN的表達。圖4b的照片顯示,反義3抑制了SNU423細胞生長。
本發(fā)明的最佳實施方式參照下述實施例對本發(fā)明進行闡述,但這些實施例不視為對本發(fā)明的限制。
實施例11-1.鑒定通常在人肝細胞癌中上調(diào)的DDEFL1通過包含23040個基因的基因組范圍的cDNA微陣列方法,將20例肝細胞癌(HCC)的表達分布圖分別與其相應的非癌肝組織進行了比較。所有的HCC組織和相應的非癌組織都是經(jīng)肝切除術(shù)病人同意由其外科手術(shù)樣品中獲得的。發(fā)現(xiàn)具有本國(in-house)登錄號B9362的基因(相應于EST,UniGene簇的Hs.44579)在1.57到5.83的范圍內(nèi)過表達(圖1a)。在12例HCC中的11例中均觀察到其上調(diào)的表達(Cy3Cy5強度比>2.0),所述12例是可以穿過截留濾光片的病例(cy3和Cy5信號都大于25,000)。由于該基因的開放閱讀框編碼的蛋白與發(fā)育分化增強因子2(DDEF2)具有約60%同一性,本發(fā)明人將該基因稱作發(fā)育分化增強因子樣1(DDEFL1)。為了闡明cDNA的微陣列結(jié)果,通過半定量RT-PCR檢測了另外11例HCC中該轉(zhuǎn)錄本的表達。GAPDH的表達作為內(nèi)部對照。RT-PCR是如下進行的。用Qiagen RNeasy試劑盒(Qiagen)或Trizol試劑(Life Technologies,Inc.)根據(jù)產(chǎn)品說明抽提總RNA。用聚dT12-18引物(Amersham Pharmacia Biotech)和Superscript II反轉(zhuǎn)錄酶(Life Technologies)將10微克小份的總RNA反轉(zhuǎn)錄成單鏈cDNA。稀釋單鏈cDNA制劑,以備隨后在20μl PCR緩沖液(TAKARA)中,通過標準RT-PCR實驗進行PCR擴增。擴增反應是在GeneAmp PCR system 9700(Perkin-Elmer,F(xiàn)oster City,CA)中如下進行的94℃變性4min,然后以94℃30s,56℃30s,72℃45s進行20(對于GAPDH)或33(對于DDEFL1)個循環(huán)。GAPDH引物序列為正向5’-ACAACAGCCTCAAGATCATCAG(SEQ ID NO7),反向,5’-GGTCCACCACTGACACGTTG(SEQ ID NO8);DDEFL1引物序列為正向5’-AGCTGAGACATTTGTTCTCTTG(SEQ ID NO9),反向5’-TATAAACCAGCTGAGTCCAGAG(SEQ ID NO10)。結(jié)果證實DDEFL1的表達在九例腫瘤增加(圖1b)。
1-2.新基因DDEFL1的分離和結(jié)構(gòu)DDEFL1的表達是利用DDEFL1的PCR產(chǎn)物為探針,通過多-組織northern-印跡分析檢測的。人多-組織印跡(Clontech,Palo Alto)與32P標記的DDEFL1 cDNA雜交。依照供應商的說明進行預雜交,雜交和洗滌。所述印跡用增感屏在-80℃下放射自顯影72h。結(jié)果表明4-kb的轉(zhuǎn)錄本在肺,肝,小腸胎盤和外周血白細胞中表達(圖2a)。
由于B9362比在Northern印跡中檢測出的小,通過5’RACE實驗確定該基因的全部編碼序列。5’RACE實驗是利用Marathon cDNA擴增試劑盒(Clontech,Palo Alto,CA)依照制造商的說明進行的。利用試劑盒中提供的基因-特異的反向引物(5’-CTCACTTGGCACGTCAGCAGGG(SEQ ID NO11))和AP-1引物擴增DDEFL1 cDNA的5′部分。cDNA模板是由人肝mRNA合成的。用TA克隆試劑盒(Invitrogen)克隆PCR產(chǎn)物,用ABI PRISM 3700 DNA測序儀(Applied Biosystems)確定其序列。
完整的cDNA由4050個核苷酸組成,具有一個2712個核苷酸的開放閱讀框,它編碼具有903個氨基酸的蛋白(Genbank登錄號AB051853)。第一個ATG的側(cè)翼序列(CCCGCCATGC(SEQ ID NO12))與在真核生物中起始翻譯的共有序列相吻合,并在上游帶有一個框內(nèi)終止密碼子。在NCBI(國家生物信息中心)數(shù)據(jù)庫中用BLAST程序檢索,鑒定出一個已分配到染色體帶1p36.12上的基因組序列(Genbank登錄號AL357134)。該cDNA與基因組序列的比較顯示DDEFL1由25個外顯子組成(圖2b)。
用簡單模塊結(jié)構(gòu)檢索工具(Simple Modular Architecture Research Tool,SMART)檢索蛋白基元,結(jié)果顯示預期的蛋白包含兩個卷曲螺旋區(qū)(密碼子141-172和241-278),一個PH(Pleckstrin homology)基元(密碼子303-396),一個ArfGAP基元(Arf的GTP酶激活蛋白)(密碼子426-551),和兩個錨蛋白重復(密碼子585-617和621-653)。這一結(jié)構(gòu)與矢車菊根皮素β1和矢車菊根皮素β2(圖2c)類似。特別是DDEFL1具有矢車菊根皮素-家族蛋白的特征,如PH結(jié)構(gòu)域,磷脂酰肌醇3,4,5-三磷酸的靶子,和ArfGAP基元。DDEFL1的ArfGAP基元的氨基酸序列與DDEF2中相應部分具有67.8%的同一性。顯然,代表對GAP活性必不可少的鋅指結(jié)構(gòu)的CXXCX16CXXC基元是完全保守的。
1-3.DDEFL1的亞細胞定位將DDEFL1的編碼序列克隆到pcDNA3.1-myc/His載體(invitrogen)中。將所得的表達myc-標記型DDEFL1蛋白的質(zhì)粒(pDNA-myc/His-DDEFL1)瞬時轉(zhuǎn)染COS7細胞(美國典型培養(yǎng)物保藏中心(ATCC))。通過免疫印跡(Western印跡)檢測預期的myc-標記蛋白如下。將用pcDNA3.1-myc/His-DDEFL1轉(zhuǎn)染的細胞用PBS洗兩次,再用裂解緩沖液(150mM NaCl,1%Triton X-100,50mM Tris-HCl pH7.4,1mM DTT和1X完全蛋白酶抑制劑混合物(Boehringer))收集。在細胞勻漿后,10,000xg離心30min,使上清液標準化以利用Bradford試驗(Bio-Rad)測定蛋白濃度。用10%SDS-PAGE分離蛋白,用小鼠抗myc抗體進行免疫印跡。HRP-偶聯(lián)的山羊抗小鼠IgG(Amersham)作為第二抗體用于ECL檢測系統(tǒng)(Amersham)。結(jié)果,用抗myc抗體在western印跡中檢測到了DDEFL1蛋白(圖3a)。
此外,免疫細胞化學染色是如下進行的。首先,將所述細胞用含4%多聚甲醛的PBS固定15min,然后在RT中,用含0.1%Triton X-100的PBS透析2.5min。然后在4℃將所述細胞用含2%BSA的PBS覆蓋24h以封閉非特異性雜交。將小鼠抗myc單克隆抗體(Sigma)以1∶1000稀釋,或?qū)⑿∈罂笷LAG抗體(Sigma)以1∶2000稀釋用作第一抗體,與若丹明偶聯(lián)型抗-小鼠第二抗體(Leinco和ICN)一起孵化,觀察所述反應。核用4′,6′-聯(lián)脒-2′-苯基吲哚二氫氯化物(DAPI)復染。在ECLIPSE E800顯微鏡下獲得熒光圖像。顯微分析表明該蛋白主要存在于細胞質(zhì)中(圖3b)。DDEFL1也定位在人胚腎(HEK293)細胞(ATCC)的細胞質(zhì)中。
1-4.DDEFL1對細胞生長的影響將DDEFL1的編碼序列克隆到pcDNA 3.1載體(invitrogen)中。將涂布于10-cm平皿(2×105細胞/皿)的NIH3T3細胞(ATCC),用表達DDEFL1的質(zhì)粒(pcDNA DDEFL1)和對照質(zhì)粒(pcDNA-LacZ)轉(zhuǎn)染,在添加了10%胎牛血清和1%抗生素/抗霉菌溶液(Sigma)的Dulbecco改良Eagle’s培養(yǎng)基中培養(yǎng),并進一步用適當濃度的遺傳霉素培養(yǎng)兩周。細胞用100%甲醇固定,再用Giemsa溶液染色。用pcDNA-DDEFL1轉(zhuǎn)染的細胞比對照細胞明顯產(chǎn)生了更多克隆。用人肝細胞癌SNU423(韓國細胞系庫)和Alexander(ATCC)細胞轉(zhuǎn)染也出現(xiàn)類似的集落形成增多現(xiàn)象,其中DDEFL1內(nèi)源表達極低(圖4a)。
為了進一步研究這一生長-促進效應,建立了穩(wěn)定表達外源DDEFL1的NIH3T3細胞。利用FuGENE6試劑(Boehringer)按照供應商的說明將pDNA-myc/His-DDEFL1轉(zhuǎn)染到NIH3T3細胞中。轉(zhuǎn)染24小時后,向培養(yǎng)基中添加遺傳霉素,轉(zhuǎn)染兩周后選出單個集落。用半定量RT-PCR確定DDEFL1的表達(圖4b)。在含10%FBS的培養(yǎng)基中,NIH3T3-DDEFL1細胞的生長速率在統(tǒng)計學意義上高于模擬細胞(NIH3T3-LacZ)(p<0.05)(圖4c)。在僅含0.1%FBS的培養(yǎng)基中,NIH3T3-DDEFL1細胞存活6天,而在相同條件下,對照NIH3T3細胞在6天內(nèi)死亡。在該情況下,NIH3T3-DDEFL1細胞在含0.1%FBS的培養(yǎng)基中的生長速率在統(tǒng)計學意義上高于模擬細胞(圖4d)(P<0.01)。
1-5.在人細胞肝癌SNU475細胞中反義S-寡核苷酸對DDEFL1表達的抑制合成下列六對相應于DDEFL1基因的對照(正義)和反義S-寡核苷酸。反義DDEFL1-AS15’-TGCTCCGGCATGGCGG-3’(SEQ ID NO13);DDEFL1-AS25’-GCTGAACTGCTCCGGC-3’(SEQ ID NO14);DDEFL1-AS35’-TCCAAGATCTCCTCCC-3’(SEQ ID NO15);DDEFL1-AS45’-TCTCCTTCCAAGATCT-3’(SEQ ID NO16);DDEFL1-AS55’-GCGCTGAGCCGGCCTC-3’(SEQ ID NO17);和DDEFL1-AS65’-CCTCACCTCCTCCCGC-3’(SEQ ID NO18).
對照
DDEFL1-S1 5’-CCGCCATGCCGGAGCA-3’(SEQ ID NO19);DDEFL1-S2 5’-GCCGGAGCAGTTCAGC-3’(SEQ ID NO20);DDEFL1-S3 5’-GGGAGGAGATCTTGGA-3’(SEQ ID NO21);DDEFL1-S4 5’-AGATCTTGGAAGGAGA-3’(SEQ ID NO22);DDEFL1-S5 5’-GAGGCCGGCTCAGCGC-3’(SEQ ID NO23);和DDEFL1-S6 5’-GCGGGAGGAGGTGAGG-3’(SEQ ID NO24)。
利用LIPOFECTIN試劑(GIBCO BRL)將合成的S-寡核苷酸轉(zhuǎn)染到SNU475細胞(韓國細胞系庫),在我們檢測的六例肝細胞癌細胞系中,上述細胞具有最高的DDEFL1表達水平(未給出數(shù)據(jù))。轉(zhuǎn)染12和24小時后,與相應的對照S-寡核苷酸S1和S5相比,反義S-寡核苷酸AS1和AS5顯著地抑制DDEFL1的表達(圖5a)。轉(zhuǎn)染6天后,用反義S-寡核苷酸AS1或AS5轉(zhuǎn)染的存活細胞明顯少于用各自的對照S-寡核苷酸S1或S5轉(zhuǎn)染的細胞(圖5b)。在三次獨立實驗均得到一致的結(jié)果。
實施例22-1.鑒定通常在人肝細胞癌中上調(diào)的VANGL1實施例1的基因組范圍內(nèi)cDNA微陣列分析還揭示出另一基因,它相應于UniGene簇EST(Hs.122730)的本國登錄號D3244。該基因在12例臨床HCC的10例中與相應的非癌肝組織對照相比明顯上調(diào)。這12例腫瘤與相應非癌組織相比的相對表達率在1.5到16.0的范圍(圖6a)。在12例HCC的10例中均觀察到上調(diào)的表達(Cy3∶Cy5強度比>2.0),這12例病例是可以穿過截留濾光片的病例(cy3和Cy5信號都大于25,000)。在另外10例HCC中,通過用類似于實施例1-1的半定量RT-PCR證實D3244表達的提高,所用引物對為,正向5’-GAGTTGTATTATGAAGAGGCCGA(SEQ ID NO25);反向5’-ATGTCTCAGACTGTAAGCGAAGG(SEQ ID NO26)(圖6b)。
2-2.VANGL1在成人組織中的表達按照實施例1-2的方式,以D3244 cDNA為探針進行多組織northern印跡分析,結(jié)果表明1.9-kb的轉(zhuǎn)化子以組織-特異性方式在睪丸和卵巢中大量表達(圖7a)。在NCBI數(shù)據(jù)庫檢索相應于D3244的基因組序列,發(fā)現(xiàn)了被分配到染色體帶1p22的兩個序列(Genbank登錄號AL450389和AL592436)。利用GENSCAN和Gene Recognition以及Assembly Internet Link程序,預測出侯選-外顯子序列并進行外顯子連接。此外,按照實施例1-2的方式,用反向引物((5’-TGTCAGCTCTCCGCTTGCGGAAAAAAAG(SEQ ID NO27))進行5’RACE,以便確定轉(zhuǎn)錄本5’區(qū)域的序列。結(jié)果獲得了1879個核苷酸的組裝人cDNA序列,其包含一個1572個核苷酸的開放閱讀框(Genbank登錄號AB057596)。預期的氨基酸序列與斜視(Van Gogh)和VANGL2分別具有40%和63%的同一性。因此,將相應于D3244的基因稱作Van Gogh樣1(VANGL1)。簡單模塊結(jié)構(gòu)研究工具提示,預期的蛋白包含公認的四個跨膜結(jié)構(gòu)域(密碼子111-133,148-170,182-204,219-241)(圖7b)。
2-3.VANGL1的亞細胞定位將表達c-myc-標記型VANGL1蛋白的pcDNA3.1-myc/His-VANGL1質(zhì)粒瞬間轉(zhuǎn)染到SNU475細胞(韓國細胞系庫)中。按照實施例1-3的方式進行免疫細胞化學染色。結(jié)果表明所述經(jīng)標記的VANGL1蛋白存在于細胞質(zhì)中(圖8a和8b)。
2-4.用經(jīng)設計能降低VANGL1表達的反義S-寡核苷酸抑制肝細胞癌細胞的生長為測試VANGL1的抑制是否可以導致HCC細胞的細胞周期阻滯和/或死亡,合成了下述四對反義和對照(正義)S-寡核苷酸,并將其轉(zhuǎn)染到SNU475細胞中。
反義反義1 5’-GTATCCATAGCAATGG-3’(SEQ ID NO28);反義2 5’-TGGArTGGGTATCCAT-3’(SEQ ID NO29);反義3 5’-TAAGTGGATTGGGTAT-3’(SEQ ID NO30);和反義4 5’-ACTCCTACCTGCCTGT-3’(SEQ ID NO31).
對照正義1 5’-CCATTGCTATGGATAC-3’(SEQ ID NO32);正義2 5’-ATGGATACCCAATCCA-3’(SEQ ID NO33);正義3 5’-ATACCCAATCCACTTA-3’(SEQ ID NO34);和正義4 5’-ACAGGCAGGTAGGAGT-3’(SEQ ID NO35).
含起始密碼子的反義S-寡核苷酸(反義3)在SNU475細胞中顯著地降低VANGL1內(nèi)源表達(圖9a)。
用3-(4,5-二甲基-噻唑-2-基)-2,5-二苯基四唑溴化物(MTT)試驗評價細胞活力如下。將細胞以5×105細胞/100mm皿的濃度涂平皿。接種24小時后將細胞用經(jīng)設計能抑制VANGL1的正義或反義S寡核苷酸進行一式三份地轉(zhuǎn)染。轉(zhuǎn)染72小時后,將所用培養(yǎng)基替換為含500μg/ml 3-(4,5-二甲基-噻唑-2-基)-2,5-二苯基四唑溴化物(MTT)(Sigma)的新鮮培養(yǎng)基,在37℃繼續(xù)培養(yǎng)4小時。然后加入1ml 0.01N HCl/10%SDS以便裂解細胞,并用ELISA讀板儀在570nm測試波長(參考波長,630nm)測定裂解物的吸光度。用與對照細胞相比所得的相對吸光度表示所述細胞的活力。
與對照的正義S寡核苷酸正義3相比,反義S-寡核苷酸反義3的轉(zhuǎn)染顯著地減少存活細胞的數(shù)量(圖9b和9c)。這一結(jié)果在三次獨立實驗中得到確認。
此外進行了如下的流式細胞術(shù)分析。將細胞以1×105細胞/100mm平皿的濃度涂皿,在給定的時間內(nèi)用胰蛋白酶處理,然后用70%冷乙醇固定。經(jīng)RNase處理后,將細胞用碘化丙啶(propidium iodide)(50μg/ml)的PBS溶液染色。在Becton Dickinson FACScan上進行流式細胞術(shù)分析,然后用CellQuest和ModFit軟件(Verity Software House)進行分析。在至少20,000個未經(jīng)選通(ungated)的細胞中,確定了核在細胞周期的G0/G1,S和G2/M期和任意的亞G1群中的百分比。
FACS分析表明,VANGL1抑制顯著增加了亞G1期細胞的數(shù)目(圖9d)。這些結(jié)果提示,VANGL1可以對肝細胞癌的細胞生長和/或存活起重要作用。
實施例33-1.人肝細胞癌中LGN通常增加通過實施例1-1的微陣列分析還選出另一個通常上調(diào)的基因D3636,它相應于LGN(Genbank登錄號U54999),且與相應的非癌活組織相比在12例臨床HCC的10例中顯著上調(diào)。這12例腫瘤相對于非癌組織的相對表達式比率在0.7到16.0的范圍。在12例HCC的10例中均觀察到LGN的已上調(diào)的表達(Cy3∶Cy5強度比>2.0),這些病例是可以穿過截留濾光片的病例(cy3和Cy5信號都大于25,000)(圖10a)。在另外10例HCC中,通過用類似于實施例1-1的半定量RT-PCR證實LGN表達也存在上調(diào),所用引物對為,正向5’-ATCTGAAGCACTTAGCAATTGC(SEQ ID NO36),反向5’-CTGTAGCTCAGACCAAGAACC(SEQ ID NO37)(圖10b)。
3-2.LGN的基因組結(jié)構(gòu)
LGN的cDNA由2,336個核苷酸組成,編碼677個氨基酸的肽。將該cDNA序列與基因組cDNA序列比較,表明LGN基因由14個外顯子組成(圖11)。
3-3.LGN的亞細胞定位用表達c-myc-標記型LGN蛋白的pcDNA3.1-myc/His-LGN質(zhì)粒瞬間轉(zhuǎn)染COS7細胞。按照實施例1-3的方式進行免疫印跡分析,檢測到相應于myc-標記型LGN蛋白的72kDa帶(圖12)。類似地,按照實施例1-3進行免疫細胞化學染色,結(jié)果顯示標記的LGN蛋白存在于細胞質(zhì)和細胞核中。
3-4.LGN基因轉(zhuǎn)移可以促進細胞生長為分析LGN對細胞生長的作用,如實施例1-4一樣用表達LGN的質(zhì)粒(pcDNA3.1-myc/His-LGN)轉(zhuǎn)染NIH3T3,SNU423,Alexander和SNU475細胞進行集落形成試驗。與對照質(zhì)粒(pcDNA3.1-myc/His-LacZ)相比,pcDNA3.1-myc/His-LGN在這些細胞中產(chǎn)生明顯更多的集落(圖13a)。這一結(jié)果在三次獨立實驗中得到確認。
為進一步研究LGN對細胞生長的作用,建立了穩(wěn)定表達外源LGN的NIH3T3細胞(NIH3T3-LGN細胞)。與對照NIH3T3 LacZ細胞相比,NIH3T3-LGN細胞顯示較高的生長速率(圖13b)。
3-5.LGN的反義S-寡核苷酸抑制人肝細胞癌SNU475細胞的生長合成下述五對相應于LGN的對照(正義)和反義S-寡核苷酸,然后轉(zhuǎn)染到SNU423細胞中。
反義反義1 5’-CCATCGAGTCATATTA-3’(SEQ ID NO38);反義2 5’-TTCCTCCATCGAGTCA-3’(SEQ ID NO39);反義3 5’-AAATTTTCCTCCATCG-3’(SEQ ID NO40);反義4 5’-AGTCTTACCTGTAACG-3’(SEQ ID NO41);和反義5 5’-GCTTCCATTCTACAAA-3’(SEQ ID NO42).
正義正義1 5’-TAATATGACTCGATGG-3’(SEQ ID NO43);正義2 5’-TGACTCGATGGAGGAA-3’(SEQ ID NO44);正義3 5’-CGATGGAGGAAAATTT-3’(SEQ ID NO45);正義4 5’-CGTTACAGGTAAGACT-3’(SEQ ID NO46);和正義5 5’-TTTGTAGAATGGAAGC-3’(SEQ ID NO47).
轉(zhuǎn)染12小時后,與對照S寡核苷酸(正義3)相比,跨起始密碼子的反義S-寡核苷酸(反義3)顯著地抑制LGN的表達(圖14a)。轉(zhuǎn)染6天后,經(jīng)反義3轉(zhuǎn)染的存活細胞的數(shù)目顯著地少于經(jīng)對照正義3轉(zhuǎn)染的存活細胞的數(shù)目(圖14b)。在三次獨立實驗中均得到一致的結(jié)果。
工業(yè)實用性本發(fā)明提供DDEFL1,VANGL1或LGN的cDNA核苷酸序列和多肽氨基酸序列,已發(fā)現(xiàn)這些基因在肝細胞癌中通常上調(diào)。因此這些多肽可以作為標記用于確定是否存在肝癌。這些核苷酸序列信息使得能設計探針和引物來檢測或擴增DDEFL1,VANGL1或LGN基因。還使得能合成抑制DDEFL1,VANGL1或LGN多肽表達的反義核苷酸序列。氨基酸序列信息使得能制備與DDEFL1,VANGL1或LGN多肽結(jié)合的抗體。所述探針引物以及抗體可用作檢測肝細胞癌的試劑。此外,本發(fā)明人證實,用反義寡核苷酸抑制DDEFL1,VANGL1或LGN的表達,能顯著地降低HCC細胞的生長。由此,所述反義寡核苷酸可用于抑制HCC細胞的生長。本發(fā)明還有助于進一步闡明肝細胞的致癌作用機制,并發(fā)現(xiàn)可用于開發(fā)肝癌治療的有效藥物的分子靶。
序列表<110>東京大學總長代表日本國(JAPAN AS REPRESENTED BY THE PRESIDENT OF THEUNIVERSITY OF TOKYO ONCOTHERAPY SCIENCE,INC.)<120>肝細胞癌-相關(guān)基因和多肽,以及檢測肝細胞癌的方法<130>SEN-A0121P<140>
<141>
<150>US 60/324,261<151>2001-09-25<150>CA<151>2002-08-23<160>47<170>PatentIn version 3.1<210>1<211>4050<212>DNA<213>人(Homo sapiens)<400>1gtgccccccg cgctccgctc cggcagctcc acgctcgcgc ccgccatgcc ggagcagttc60agcgtcgccg agttcctggc cgtcaccgcg gaggacctca gctccccggc tggggccgcc120gccttcgccg ccaagatgcc ccggtaccga ggggcggcgc tggcgcggga ggagatcttg180gaaggagacc aagccatcct gcagagaata aagaaggctg tgcgggcaat ccatagctcc240ggccttggcc atgtggagaa tgaagagcag taccgagagg ccgtggaatc cttaggcaac300agccacctgt cccagaacag ccatgagctg tccacaggct tcctaaactt ggccgtgttc360acccgcgagg ttgctgcgct cttcaagaac ctgattcaga acttgaacaa cattgtctct420ttccccctgg acagtctgat gaaggggcag ctgagggacg gtcgacagga ttccaaaaaa480cagctggaga aggcatggaa ggactatgaa gccaaaatgg ccaagctgga gaaggagcgc540
gatcgggcca gggtgacagg agggatccct ggggaggtgg cccaggacat gcagagagag600cggcgcatct tccagctgca catgtgtgag tatctgctca aagccgggga gagccagatg660aagcaaggtc ctgacttcct tcagagcctc atcaagttct tccacgccca gcacaacttt720ttccaagatg gctggaaggc tgcccagagc ctgttcccct tcatcgagaa gctggcggcc780tcagtacatg cactccatca ggcccaggag gacgagctac agaagctgac ccagctccgg840gactccctcc gagggacact gcagcttgag agcagagagg aacacctgag ccggaagaac900tcaggatgtg gctatagcat ccaccagcac caaggcaaca agcagtttgg gacggagaaa960gtgggctttc tatacaagaa aagtgacgga attcgaagag tctggcagaa aaggaagtgt1020ggagtcaagt atggctgcct gaccatctca cacagcacga taaaccggcc cccggtgaag1080ctgaccctgc tgacgtgcca agtgaggcca aaccctgagg agaaaaagtg cttcgacctg1140gtgacccaca accggacgta ccactttcag gcagaggacg agcacgagtg tgaggcgtgg1200gtgtcagtgt tgcagaacag caaggacgaa gccctgagca gcgccttcct cggggagccc1260agcgctggcc cggggtcctg ggggtccgcc ggccatgatg gggagccgca cgacctcaca1320aagctgctca tcgcggaggt gaagagcagg cctgggaata gccagtgctg cgactgcggg1380gctgcagacc ccacgtggct cagcaccaac ctgggcgtgc tcacctgcat ccagtgctcg1440ggcgtccacc gcgaactggg cgtgcgcttt tcgcgcatgc agtcactcac cttggacctg1500ctgggcccct ccgagttgtt gctggccttg aacatgggaa acacgagctt caatgaggtc1560atggaggccc agctaccctc acacggcggc cctaaaccct cagctgagag tgacatgggc1620acccgcaggg actacattat ggccaagtat gtggagcata ggtttgcacg ccggtgcaca1680cctgagcctc agcgactctg gacagccatt tgcaacaggg acctcctgtc ggtactggag1740gcctttgcca atgggcagga ctttggacag ccgctgccag ggcctgatgc acaggcacct1800gaagaactcg tcttgcattt ggctgtcaaa gtcgccaacc aggcttccct gcctctggtg1860gatttcatca tccagaacgg tggtcacctg gatgccaagg ctgctgacgg gaacacggct1920
ctgcactacg cagcactcta caaccagccc gactgcctca agctgctgct gaaggggaga1980gctttggttg gcacagtaaa tgaagcaggc gagacagctc tggacatagc caggaagaag2040caccacaagg agtgtgagga gctgctggag caggcccagg cggggacctt tgccttccct2100ctacatgtgg actactcctg ggtaatttcc acagagcctg gctctgacag tgaggaggat2160gaggaagaga agcgctgctt gctgaagctc ccggcccagg ctcactgggc cagtgggagg2220ctggacatca gcaacaagac ctatgagact gtcgccagcc tgggagcagc cacccctcag2280ggcgagagtg aggactgtcc cccgcccttg ccagtcaaaa actcttctcg gactttggtc2340caagggtgtg caagacatgc cagtggagat cgttctgaag tctccagcct gagttcagag2400gcccctgaga cccctgagag cctgggcagt ccagcctcct cctccagtct gatgagcccc2460ttggaacctg gggatcccag ccaagcccca cccaactctg aagagggcct ccgagagccc2520ccaggcacct ccagacccag cctgacatcc gggaccaccc cttcggagat gtacctcccc2580gtcagattca gctccgagag cactcgctcc tatcggcggg gggcgcggag ccctgaagat2640ggtccctcag ccaggcagcc tctgcccaga aggaacgtgc cggttggcat cactgaagga2700gatggctcaa ggactgggag tctcccagca agttctgtgc aacttttgca agactagctc2760cttgctggcc cccacatgcc ccatgctagg ccccaatgtt cagagctggg acttgagctc2820acaaaactgg ggagctgaga catttgttct cttggatctc actctctctg tcccttgtgc2880ctctgtagct ggccttcttc ctgccacagg ccatgcctct accaaggaca catggccttt2940ccctgttagg gctgatggcg gttctttcct atctcattac ccgctagggg cctgggagcc3000ctgtggctgg atctgagtgc tcctgagctg gcttcagctg cagaactctc agtccctcat3060cagatcgaga ctctatttcc cccgtcagtc tgggggcttc acaagggcag gagagccctc3120catcactgac ttccagatca gggaccctgc caagtaggga ctgtcttctc agccagccat3180ttattagtct aatattcctt cactaaattc caactctatg tctggacctg tgttaggcac3240ttcagatacc acacgagtaa gacaagggcc ctgcaggggt ggtcctttgg tggaaagctg3300
gtcttaaggg ttgggcttgg gaataggcag ggtcagattc cagggcatgg ctctggactc3360agctggttta tacctatatg accattacag ttgtctacag atcacatcca ttctggctgg3420tcaacatgca tgctgtactg gctgttaaat aaaaatattc tgaatgtcac tccttttgag3480ggacagcaca gccttcccta ggcattctcc tatattcccc agccaaattg tagagtcaga3540tgcacccaca tttgcctgtg tccttgattt agcaggaagg aaaggaatag tcggggttga3600tggatgccca cttctcttct ctttctcttg gtcaactcag gagcctttta gtctgaggga3660atggagaggc aaagaaagaa gggagagtaa tagaattggg agggcagaga cttaagggtt3720ctgcttccca gccctagaaa ttctatcatt gctcagcccc aatgagaaag cagatacacc3780taagccatca tcaaccacta acatctcaac ttgccagttg ctgggtgctg ggccctggca3840ggaatgggcc aagccaagca ggggagacta gagagcacca atggccaaca cagctgcctg3900gctggggagg ctgtgctgtt tcccctggag acctgactgg tctgtggttc ccacaggaac3960agggttgtct tttgagcccc cagtgtctgg tttcattcat ctcagacttg ttatttcact4020catctctaat aaaggattgg ggggtcagtt 4050<210>2<211>903<212>PRT<213>人(Homo sapiens)<400>2Met Pro Glu Gln Phe Ser Val Ala Glu Phe Leu Ala Val Thr Ala Glu1 5 10 15Asp Leu Ser Ser Pro Ala Gly Ala Ala Ala Phe Ala Ala Lys Met Pro20 25 30Arg Tyr Arg Gly Ala Ala Leu Ala Arg Glu Glu Ile Leu Glu Gly Asp35 40 45Gln Ala Ile Leu Gln Arg Ile Lys Lys Ala Val Arg Ala Ile His Ser50 55 60
Ser Gly Leu Gly His Val Glu Asn Glu Glu Gln Tyr Arg Glu Ala Val65 70 75 80Glu Ser Leu Gly Asn Ser His Leu Ser Gln Asn Ser His Glu Leu Ser85 90 95Thr Gly Phe Leu Asn Leu Ala Val Phe Thr Arg Glu Val Ala Ala Leu100 105 110Phe Lys Asn Leu Ile Gln Asn Leu Asn Asn Ile Val Ser Phe Pro Leu115 120 125Asp Ser Leu Met Lys Gly Gln Leu Arg Asp Gly Arg Gln Asp Ser Lys130 135140Lys Gln Leu Glu Lys Ala Trp Lys Asp Tyr Glu Ala Lys Met Ala Lys145 150 155 160Leu Glu Lys Glu Arg Asp Arg Ala Arg Val Thr Gly Gly Ile Pro Gly165 170175Glu Val Ala Gln Asp Met Gln Arg Glu Arg Arg Ile Phe Gln Leu His180 185 190Met Cys Glu Tyr Leu Leu Lys Ala Gly Glu Ser Gln Met Lys Gln Gly195 200 205Pro Asp Phe Leu Gln Ser Leu Ile Lys Phe Phe His Ala Gln His Asn210 215 220Phe Phe Gln Asp Gly Trp Lys Ala Ala Gln Ser Leu Phe Pro Phe Ile225 230 235 240Glu Lys Leu Ala Ala Ser Val His Ala Leu His Gln Ala Gln Glu Asp245 250 255Glu Leu Gln Lys Leu Thr Gln Leu Arg Asp Ser Leu Arg Gly Thr Leu260 265 270Gln Leu Glu Ser Arg Glu Glu His Leu Ser Arg Lys Asn Ser Gly Cys275 280 285Gly Tyr Ser Ile His Gln His Gln Gly Asn Lys Gln Phe Gly Thr Glu290 295 300Lys Val Gly Phe Leu Tyr Lys Lys Ser Asp Gly Ile Arg Arg Val Trp
305 310 315 320Gln Lys Arg Lys Cys Gly Val Lys Tyr Gly Cys Leu Thr Ile Ser His325 330 335Ser Thr Ile Asn Arg Pro Pro Val Lys Leu Thr Leu Leu Thr Cys Gln340 345 350Val Arg Pro Asn Pro Glu Glu Lys Lys Cys Phe Asp Leu Val Thr His355 360 365Asn Arg Thr Tyr His Phe Gln Ala Glu Asp Glu His Glu Cys Glu Ala370 375 380Trp Val Ser Val Leu Gln Asn Ser Lys Asp Glu Ala Leu Ser Ser Ala385 390 395 400Phe Leu Gly Glu Pro Ser Ala Gly Pro Gly Ser Trp Gly Ser Ala Gly405 410 415His Asp Gly Glu Pro His Asp Leu Thr Lys Leu Leu Ile Ala Glu Val420 425 430Lys Ser Arg Pro Gly Asn Ser Gln Cys Cys Asp Cys Gly Ala Ala Asp435 440 445Pro Thr Trp Leu Ser Thr Asn Leu Gly Val Leu Thr Cys Ile Gln Cys450 455 460Ser Gly Val His Arg Glu Leu Gly Val Arg Phe Ser Arg Met Gln Ser465 470 475 480Leu Thr Leu Asp Leu Leu Gly Pro Ser Glu Leu Leu Leu Ala Leu Asn485 490 495Met Gly Asn Thr Ser Phe Asn Glu Val Met Glu Ala Gln Leu Pro Ser500 505 510His Gly Gly Pro Lys Pro Ser Ala Glu Ser Asp Met Gly Thr Arg Arg515 520 525Asp Tyr Ile Met Ala Lys Tyr Val Glu His Arg Phe Ala Arg Arg Cys530 535 540Thr Pro Glu Pro Gln Arg Leu Trp Thr Ala Ile Cys Asn Arg Asp Leu545 550 555 560
Leu Ser Val Leu Glu Ala Phe Ala Asn Gly Gln Asp Phe Gly Gln Pro565 570 575Leu Pro Gly Pro Asp Ala Gln Ala Pro Glu Glu Leu Val Leu His Leu580 585 590Ala Val Lys Val Ala Asn Gln Ala Ser Leu Pro Leu Val Asp Phe Ile595 600 605Ile Gln Asn Gly Gly His Leu Asp Ala Lys Ala Ala Asp Gly Asn Thr610 615 620Ala Leu His Tyr Ala Ala Leu Tyr Asn Gln Pro Asp Cys Leu Lys Leu625 630 635 640Leu Leu Lys Gly Arg Ala Leu Val Gly Thr Val Asn Glu Ala Gly Glu645 650 655Thr Ala Leu Asp Ile Ala Arg Lys Lys His His Lys Glu Cys Glu Glu660 665 670Leu Leu Glu Gln Ala Gln Ala Gly Thr Phe Ala Phe Pro Leu His Val675 680 685Asp Tyr Ser Trp Val Ile Ser Thr Glu Pro Gly Ser Asp Ser Glu Glu690 695 700Asp Glu Glu Glu Lys Arg Cys Leu Leu Lys Leu Pro Ala Gln Ala His705 710 715 720Trp Ala Ser Gly Arg Leu Asp Ile Ser Asn Lys Thr Tyr Glu Thr Val725 730 735Ala Ser Leu Gly Ala Ala Thr Pro Gln Gly Glu Ser Glu Asp Cys Pro740 745 750Pro Pro Leu Pro Val Lys Asn Ser Ser Arg Thr Leu Val Gln Gly Cys755 760 765Ala Arg His Ala Ser Gly Asp Arg Ser Glu Val Ser Ser Leu Ser Ser770 775 780Glu Ala Pro Glu Thr Pro Glu Ser Leu Gly Ser Pro Ala Ser Ser Ser785 790 795 800
Ser Leu Met Ser Pro Leu Glu Pro Gly Asp Pro Ser Gln Ala Pro Pro805 810 815Asn Ser Glu Glu Gly Leu Arg Glu Pro Pro Gly Thr Ser Arg Pro Ser820 825 830Leu Thr Ser Gly Thr Thr Pro Ser Glu Met Tyr Leu Pro Val Arg Phe835 840 845Ser Ser Glu Ser Thr Arg Ser Tyr Arg Arg Gly Ala Arg Ser Pro Glu850 855 860Asp Gly Pro Ser Ala Arg Gln Pro Leu Pro Arg Arg Asn Val Pro Val865 870 875 880Gly Ile Thr Glu Gly Asp Gly Ser Arg Thr Gly Ser Leu Pro Ala Ser885 890895Ser Val Gln Leu Leu Gln Asp900<210>3<211>1879<212>DNA<213>人(Homo sapiens)<400>3ctcgctcaca aaaaattgag ccggccctgg aggcctgggg ggcgagtccg gttgcgcctc60ggagagcgca acaggcagaa tttgttcctg ttgaagagtg gctcctcttc taatttccag120actccttgag gttttaggag tctggtaggt gaaattttct acctctaagg agaaacagta180cctgctcctt cctcaagcgc aagccctcca ttgctatgga taccgaatcc acttattctg240gatattctta ctattcaagt cattcgaaaa aatctcacag acaaggggaa agaactagag300agagacacaa gtcaccccgg aataaagacg gcagagggtc agaaaagtct gtcaccattc360aacctcccac tggagagccc ctgttgggaa atgattctac tcggacagag gaagttcagg420atgacaactg gggagagacc accacggcca tcacaggcac ctcggagcac agcatatccc480aagaggacat tgccaggatc agcaaggaca tggaggacag cgtggggctg gattgcaaac540
gctacctggg cctcaccgtc gcctcttttc ttggacttct agttttcctc acccctattg600ccttcatcct tttacctccg atcctgtgga gggatgagct ggagccttgt ggcacaattt660gtgaggggct ctttatctcc atggcattca aactcctcat tctgctcata gggacctggg720cacttttttt ccgcaagcgg agagctgaca tgccacgggt gtttgtgttt cgtgcccttt780tgttggtcct catctttctc tttgtggttt cctattggct tttttacggg gtccgcattt840tggactctcg ggaccggaat taccagggca ttgtgcaata tgcagtctcc cttgtggatg900ccctcctctt catccattac ctggccatcg tcctgctgga gctcaggcag ctgcagccca960tgttcacgct gcaggtggtc cgctccaccg atggcgagtc ccgcttctac agcctgggac1020acctgagtat ccagcgagca gcattggtgg tcctagaaaa ttactacaaa gatttcacca1080tctataaccc aaacctccta acagcctcca aattccgagc agccaagcat atggccgggc1140tgaaagtcta caatgtagat ggccccagta acaatgccac tggccagtcc cgggccatga1200ttgctgcagc tgctcggcgc agggactcaa gccacaacga gttgtattat gaagaggccg1260aacatgaacg gcgagtaaag aagcggaaag caaggctggt ggttgcagtg gaagaggcct1320tcatccacat tcagcgtctc caggctgagg agcagcagaa agccccaggg gaggtgatgg1380accctaggga ggccgcccag gccattttcc cctccatggc cagggctctc cagaagtacc1440tgcgcatcac ccggcagcag aactaccaca gcatggagag catcctgcag cacctggcct1500tctgcatcac caacggcatg acccccaagg ccttcctaga acggtacctc agtgcgggcc1560ccaccctgca atatgacaag gaccgctggc tctctacaca gtggaggctt gtcagtgatg1620aggctgtgac taatggatta cgggatggaa ttgtgttcgt ccttaagtgc ttggacttca1680gcctcgtagt caatgtgaag aaaattccat tcatcatact ctctgaagag ttcatagacc1740ccaaatctca caaatttgtc cttcgcttac agtctgagac atccgtttaa aagttctata1800tttgtggctt tattaaaaaa aaaagaaaaa tatatagaga gatatgcaaa aaaaataaaa1860gacaaaaaca aaaaaaaaa 1879
<210>4<211>524<212>PRT<213>人(Homo sapiens)<400>4Met Asp Thr Glu Ser Thr Tyr Ser Gly Tyr Ser Tyr Tyr Ser Ser His1 5 10 15Ser Lys Lys Ser His Arg Gln Gly Glu Arg Thr Arg Glu Arg His Lys20 25 30Ser Pro Arg Asn Lys Asp Gly Arg Gly Ser Glu Lys Ser Val Thr Ile35 40 45Gln Pro Pro Thr Gly Glu Pro Leu Leu Gly Asn Asp Ser Thr Arg Thr50 55 60Glu Glu Val Gln Asp Asp Asn Trp Gly Glu Thr Thr Thr Ala Ile Thr65 70 75 80GLy Thr Ser Glu His Ser Ile Ser Gln Glu Asp Ile Ala Arg Ile Ser85 90 95Lys Asp Met Glu Asp Ser Val Gly Leu Asp Cys Lys Arg Tyr Leu Gly100 105 110Leu Thr Val Ala Ser Phe Leu Gly Leu Leu Val Phe Leu Thr Pro Ile115 120 125Ala Phe Ile Leu Leu Pro Pro Ile Leu Trp Arg Asp Glu Leu Glu Pro130 135 140Cys Gly Thr Ile Cys Glu Gly Leu Phe Ile Ser Met Ala Phe Lys Leu145 150 155 160Leu Ile Leu Leu Ile Gly Thr Trp Ala Leu Phe Phe Arg Lys Arg Arg165 170 175Ala Asp Met Pro Arg Val Phe Val Phe Arg Ala Leu Leu Leu Val Leu180 185 190Ile Phe Leu Phe Val Val Ser Tyr Trp Leu Phe Tyr Gly Val Arg Ile195 200 205
Leu Asp Ser Arg Asp Arg Asn Tyr Gln Gly Ile Val Gln Tyr Ala Val210 215 220Ser Leu Val Asp Ala Leu Leu Phe Ile His Tyr Leu Ala Ile Val Leu225 230 235 240Leu Glu Leu Arg Gln Leu Gln Pro Met Phe Thr Leu Gln Val Val Arg245 250 255Ser Thr Asp Gly Glu Ser Arg Phe Tyr Ser Leu Gly His Leu Ser Ile260 265 270Gln Arg Ala Ala Leu Val Val Leu Glu Asn Tyr Tyr Lys Asp Phe Thr275 280 285Ile Tyr Asn Pro Asn Leu Leu Thr Ala Ser Lys Phe Arg Ala Ala Lys290 295300His Met Ala Gly Leu Lys Val Tyr Asn Val Asp Gly Pro Ser Asn Asn305 310 315 320Ala Thr Gly Gln Ser Arg Ala Met Ile Ala Ala Ala Ala Arg Arg Arg325 330 335Asp Ser Ser His Asn Glu Leu Tyr Tyr Glu Glu Ala Glu His Glu Arg340 345 350Arg Val Lys Lys Arg Lys Ala Arg Leu Val Val Ala Val Glu Glu Ala355 360 365Phe Ile His Ile Gln Arg Leu Gln Ala Glu Glu Gln Gln Lys Ala Pro370 375 380Gly Glu Val Met Asp Pro Arg Glu Ala Ala Gln Ala Ile Phe Pro Ser385 390 395 400Met Ala Arg Ala Leu Gln Lys Tyr Leu Arg Ile Thr Arg Gln Gln Asn405 410 415Tyr His Ser Met Glu Ser Ile Leu Gln His Leu Ala Phe Cys Ile Thr420 425 430Asn Gly Met Thr Pro Lys Ala Phe Leu Glu Arg Tyr Leu Ser Ala Gly435 440 445
Pro Thr Leu Gln Tyr Asp Lys Asp Arg Trp Leu Ser Thr Gln Trp Arg450 455 460Leu Val Ser Asp Glu Ala Val Thr Asn Gly Leu Arg Asp Gly Ile Val465 470 475 480Phe Val Leu Lys Cys Leu Asp Phe Ser Leu Val Val Asn Val Lys Lys485 490 495Ile Pro Phe Ile Ile Leu Ser Glu Glu Phe Ile Asp Pro Lys Ser His500 505 510Lys Phe Val Leu Arg Leu Gln Ser Glu Thr Ser Val515 520<210>5<211>2336<212>DNA<213>人(Homo sapiens)<400>5ggcacgagga agaatcagga gcttaggatg tattaacacc aactcattaa tatactaacc60ggacaatgtt ctacaaacaa ttctacattg taaaggactg gattggcaca aaataaaata120attttatttt attcagctta taatatgact cgatggagga aaatttgata agcatgagag180aagaccattc ttttcatgtt cgttacagaa tggaagcttc ttgcctagag ctggccttgg240aaggggaacg tctatgtaaa tcaggagact gccgcgctgg cgtgtcattc tttgaagctg300cagttcaagt tggaactgaa gacctaaaaa cacttagcgc tatttacagc cagttgggca360atgcttattt ctatttgcat gattatgcca aagcattaga atatcaccat catgatttaa420cccttgcaag gactattgga gaccagctgg gggaagcgaa agctagtggt aatctgggaa480acaccttaaa agttcttggg aattttgacg aagccatagt ttgttgtcag cgacacctag540atatttccag agagcttaat gacaaggtgg gagaagcaag agcactttac aatcttggga600atgtgtatca tgccaaaggg aaaagttttg gttgccctgg tccccaggat gtaggagaat660
ttccagaaga agtgagagat gctctgcagg cagccgtgga tttttatgag gaaaacctat720cattagtgac tgctttgggt gaccgagcgg cacaaggacg tgcctttgga aatcttggaa780acacacatta cctccttggc aacttcaggg atgcagttat agctcatgag cagcgtctcc840ttattgcaaa agaatttgga gataaagcag ctgaaagaag agcatatagc aaccttggaa900atgcatatat atttcttggt gaatttgaaa ctgcctcgga atactacaag aagacactac960tgttggcccg acagcttaaa gaccgagctg tagaagcaca gtcttgttac agtcttggaa1020atacatatac tttacttcaa gactatgaaa aggccattga ttatcatctg aagcacttag1080caattgctca agagctgaat gatagaattg gtgaaggaag agcatgttgg agcttaggaa1140atgcatacac agcactagga aatcatgatc aagcaatgca ttttgctgaa aagcacttgg1200aaatttcaag agaggttggg gataaaagtg gtgaactaac agcacgactt aatctctcag1260accttcaaat ggttcttggt ctgagctaca gcacaaataa ctccataatg tctgaaaata1320ctgaaattga tagcagtttg aatggtgtac tccccaagtt gggacgccgg catagtatgg1380aaaatatgga acttatgaag ttaacaccag aaaaggtaca gaactggaac agtgaaattc1440ttgctaagca aaaacctctt attgccaaac cttctgcaaa gctactcttt gtcaacagac1500tgaaggggaa aaaatacaaa acgaattcct ccactaaagt tctccaagat gccagtaatt1560ctattgacca ccgaattcca aattctcaga ggaaaatcag tgcagatact attggagatg1620aagggttctt tgacttatta agccgatttc aaagcaatag gatggatgat cagagatgtt1680gcttacaaga aaagaactgc catacagctt caacaacaac ttcttccact ccccctaaaa1740tgatgctaaa aacatcatct gttcctgtgg tatcccccaa cacggatgag tttttagatc1800ttcttgccag ctcacagagt cgccgtctgg atgaccagag ggctagtttc agtaatttgc1860cagggcttcg tctaacacaa aacagccagt cggtacttag ccacctgatg actaatgaca1920acaaagaggc tgatgaagat ttctttgaca tccttgtaaa atgtcaagga tccagattag1980atgatcaaag atgtgctcca ccacctgcta ccacaaaggg tccgacagta ccagatgaag2040
actttttcag ccttatttta cggtcccagg gaaagagaat ggatgaacag agagttcttt2100tacaaagaga tcaaaacaga gacactgact ttgggctaaa ggactttttg caaaataatg2160ctttgttgga gtttaaaaat tcagggaaaa aatcggcaga ccattagtta ctatggattt2220attttttttc ctttcaaaca cggtaaggaa acaatctatt acttttttcc ttaaaaggag2280aatttatagc actgtaatac agcttaaaat atttttagaa tgatgtaaat agttaa2336<210>6<211>677<212>PRT<213>人(Homo sapiens)<400>6Met Arg Glu Asp His Ser Phe His Val Arg Tyr Arg Met Glu Ala Ser1 5 10 15Cys Leu Glu Leu Ala Leu Glu Gly Glu Arg Leu Cys Lys Ser Gly Asp20 25 30Cys Arg Ala Gly Val Ser Phe Phe Glu Ala Ala Val Gln Val Gly Thr35 40 45Glu Asp Leu Lys Thr Leu Ser Ala Ile Tyr Ser Gln Leu Gly Asn Ala50 55 60Tyr Phe Tyr Leu His Asp Tyr Ala Lys Ala Leu Glu Tyr His His His65 70 75 80Asp Leu Thr Leu Ala Arg Thr Ile Gly Asp Gln Leu Gly Glu Ala Lys85 90 95Ala Ser Gly Asn Leu Gly Asn Thr Leu Lys Val Leu Gly Asn Phe Asp100 105 110Glu Ala Ile Val Cys Cys Gln Arg His Leu Asp Ile Ser Arg Glu Leu115 120 125Asn Asp Lys Val Gly Glu Ala Arg Ala Leu Tyr Asn Leu Gly Asn Val130 135 140Tyr His Ala Lys Gly Lys Ser Phe Gly Cys Pro Gly Pro Gln Asp Val
145 150 155 l60Gly Glu Phe Pro Glu Glu Val Arg Asp Ala Leu Gln Ala Ala Val Asp165 170 175Phe Tyr Glu Glu Asn Leu Ser Leu Val Thr Ala Leu Gly Asp Arg Ala180 185 190Ala Gln Gly Arg Ala Phe Gly Asn Leu Gly Asn Thr His Tyr Leu Leu195 200 205Gly Asn Phe Arg Asp Ala Val Ile Ala His Glu Gln Arg Leu Leu Ile210 215 220Ala Lys Glu Phe Gly Asp Lys Ala Ala Glu Arg Arg Ala Tyr Ser Asn225 230 235 240Leu Gly Asn Ala Tyr Ile Phe Leu Gly Glu Phe Glu Thr Ala Ser Glu245250 255Tyr Tyr Lys Lys Thr Leu Leu Leu Ala Arg Gln Leu Lys Asp Arg Ala260 265 270Val Glu Ala Gln Ser Cys Tyr Ser Leu Gly Asn Thr Tyr Thr Leu Leu275 280 285Gln Asp Tyr Glu Lys Ala Ile Asp Tyr His Leu Lys His Leu Ala Ile290 295 300Ala Gln Glu Leu Asn Asp Arg Ile Gly Glu Gly Arg Ala Cys Trp Ser305 310 315 320Leu Gly Asn Ala Tyr Thr Ala Leu Gly Asn His Asp Gln Ala Met His325 330 335Phe Ala Glu Lys His Leu Glu Ile Ser Arg Glu Val Gly Asp Lys Ser340 345 350Gly Glu Leu Thr Ala Arg Leu Asn Leu Ser Asp Leu Gln Met Val Leu355 360 365Gly Leu Ser Tyr Ser Thr Asn Asn Ser Ile Met Ser Glu Asn Thr Glu370 375 380Ile Asp Ser Ser Leu Asn Gly Val Leu Pro Lys Leu Gly Arg Arg His385 390 395400
Ser Met Glu Asn Met Glu Leu Met Lys Leu Thr Pro Glu Lys Val Gln405 410 415Asn Trp Asn Ser Glu Ile Leu Ala Lys Gln Lys Pro Leu Ile Ala Lys420 425 430Pro Ser Ala Lys Leu Leu Phe Val Asn Arg Leu Lys Gly Lys Lys Tyr435 440 445Lys Thr Asn Ser Ser Thr Lys Val Leu Gln Asp Ala Ser Asn Ser Ile450 455 460Asp His Arg Ile Pro Asn Ser Gln Arg Lys Ile Ser Ala Asp Thr Ile465 470 475 480Gly Asp Glu Gly Phe Phe Asp Leu Leu Ser Arg Phe Gln Ser Asn Arg485 490 495Met Asp Asp Gln Arg Cys Cys Leu Gln Glu Lys Asn Cys His Thr Ala500 505 510Ser Thr Thr Thr Ser Ser Thr Pro Pro Lys Met Met Leu Lys Thr Ser515 520 525Ser Val Pro Val Val Ser Pro Asn Thr Asp Glu Phe Leu Asp Leu Leu530 535 540Ala Ser Ser Gln Ser Arg Arg Leu Asp Asp Gln Arg Ala Ser Phe Ser545 550 555 560Asn Leu Pro Gly Leu Arg Leu Thr Gln Asn Ser Gln Ser Val Leu Ser565 570 575His Leu Met Thr Asn Asp Asn Lys Glu Ala Asp Glu Asp Phe Phe Asp580 585 590Ile Leu Val Lys Cys Gln Gly Ser Arg Leu Asp Asp Gln Arg Cys Ala595 600 605Pro Pro Pro Ala Thr Thr Lys Gly Pro Thr Val Pro Asp Glu Asp Phe610 615 620Phe Ser Leu Ile Leu Arg Ser Gln Gly Lys Arg Met Asp Glu Gln Arg625 630 635 640
Val Leu Leu Gln Arg Asp Gln Asn Arg Asp Thr Asp Phe Gly Leu Lys645 650 655Asp Phe Leu Gln Asn Asn Ala Leu Leu Glu Phe Lys Asn Ser Gly Lys660 665 670Lys Ser Ala Asp His675<210>7<211>22<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>7acaacagcct caagatcatc ag 22<210>8<211>20<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>8ggtccaccac tgacacgttg 20<210>9<211>22<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>9agctgagaca tttgttctct tg 22
<210>10<211>22<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>10tataaaccag ctgagtccag ag 22<210>11<211>22<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>11ctcacttggc acgtcagcag gg 22<210>12<211>10<212>DNA<213>人(Homo sapiens)<400>12cccgccatgc10<210>13<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>13tgctccggca tggcgg 16<210>14
<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>14gctgaactgc tccggc 16<210>15<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>15tccaagatct cctccc 16<210>16<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>16tctccttcca agatct 16<210>17<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>17gcgctgagcc ggcctc 16
<210>18<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>18cctcacctcc tcccgc 16<210>19<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>19ccgccatgcc ggagca 16<210>20<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>20gccggagcag ttcagc 16<210>21<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>21
gggaggagat cttgga 16<210>22<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>22agatcttgga aggaga 16<210>23<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>23gaggccggct cagcgc 16<210>24<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>24gcgggaggag gtgagg 16<210>25<211>23<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列
<400>25gagttgtatt atgaagaggc cga 23<210>26<211>23<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>26atgtctcaga ctgtaagcga agg 23<210>27<211>28<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>27tgtcagctct ccgcttgcgg aaaaaaag28<210>28<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>28gtatccatag caatgg 16<210>29<211>16<212>DNA<213>人工的
<220>
<223>一個人工合成的寡核苷酸序列<400>29tggattgggt atccat 16<210>30<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>30taagtggatt gggtat 16<210>31<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>31actcctacct gcctgt 16<210>32<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>32ceattgctat ggatac 16<210>33<211>16
<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>33atggataccc aatcca 16<210>34<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>34atacccaatc cactta 16<210>35<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>35acaggcaggt aggagt 16<210>36<211>22<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>36atctgaagca cttagcaatt gc 22
<210>37<211>21<212>DNA<213>人工的<220>
<223>一個人工合成的引物序列<400>37ctgtagctca gaccaagaac c 21<210>38<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>38ccatcgagtc atatta 16<210>39<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>39ttcctccatc gagtca 16<210>40<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>40aaattttcct ccatcg 16
<210>41<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>41agtcttacct gtaacg 16<210>42<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>42gcttceattc tacaaa 16<210>43<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>43taatatgact cgatgg 16<210>44<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列
<400>44tgactcgatg gaggaa 16<210>45<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>45cgatggagga aaattt 16<210>46<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>46cgttacaggt aagact 16<210>47<211>16<212>DNA<213>人工的<220>
<223>一個人工合成的寡核苷酸序列<400>47tttgtagaat ggaagc 1權(quán)利要求
1.選自下述的經(jīng)分離的核酸(a)包含SEQ ID NO1或NO3所示核苷酸序列的核酸;(b)編碼包含SEQ ID NO2或NO4所示氨基酸序列的多肽的核酸;(c)包含在嚴緊條件下可與由SEQ ID NO1或NO3組成的核苷酸序列或其互補鏈雜交的鏈的核酸。
2.選自下述的經(jīng)分離的多肽(a)由SEQ ID NO1或NO3所示核苷酸序列編碼的多肽(b)包含SEQ ID NO2或NO4所示氨基酸序列的多肽;(c)與SEQ ID NO2或NO4具有至少65%同一性的多肽。
3.帶有權(quán)利要求1所述核酸的載體。
4.帶有權(quán)利要求1所述核酸或權(quán)利要求3所述載體的轉(zhuǎn)化子。
5.生產(chǎn)多肽的方法,該方法包括在培養(yǎng)物中培養(yǎng)權(quán)利要求4的轉(zhuǎn)化子,在所述轉(zhuǎn)化子中表達所述多肽,和從培養(yǎng)物中回收所述多肽。
6.可與權(quán)利要求2所述多肽特異結(jié)合的抗體。
7.檢測肝細胞癌的方法,該方法包括下述步驟(a)制備來自受試者的生物樣品;(b)測定至少一種選自下組的多肽的表達水平,所述多肽是SEQ IDNO1,SEQ ID NO3,和SEQ ID NO5所示的多肽;(c)將上述表達水平與在非癌癥樣品中的測定值相比較;和(d)確定受試者是否患癌癥。
8.一種檢測肝細胞癌的試劑,其包含一種核酸,該核酸含有在嚴緊條件下可與由SEQ ID NO1,NO3或NO5組成的核苷酸序列或其互補鏈雜交的鏈。
9.檢測肝細胞癌的試劑,其包含權(quán)利要求6所述抗體。
10.抑制肝細胞癌生長的方法,該方法包括向肝細胞癌中引入至少一種可與SEQ ID NO1,NO3或NO5雜交的反義寡核苷酸。
全文摘要
本發(fā)明提供在肝細胞癌中上調(diào)的基因,和由這些基因所編碼的多肽。還提供載體,轉(zhuǎn)化子和生產(chǎn)所述重組多肽的方法。還提供這些基因的探針和引物以及針對所述多肽的抗體。所述探針,引物和抗體可用作檢測肝細胞癌的試劑。還提供利用所述試劑檢測肝細胞癌的方法。還提供這些基因的反義核苷酸序列,其可用于抑制肝細胞癌的生長。
文檔編號A61K31/7088GK1592793SQ0282331
公開日2005年3月9日 申請日期2002年9月25日 優(yōu)先權(quán)日2001年9月25日
發(fā)明者中村佑輔, 古川洋一 申請人:東京大學總長代表日本國, 腫瘤療法科學股份有限公司