本發(fā)明涉及分子生物學(xué)技術(shù)領(lǐng)域,具體地說,是一種與惡性膠質(zhì)瘤診斷相關(guān)的標(biāo)志物及其應(yīng)用。
背景技術(shù):
gbm最初命名為多形性膠質(zhì)母細(xì)胞瘤,就是在試圖描述腫瘤內(nèi)不同細(xì)胞的顯著差異,這也反映了分子的異質(zhì)性。早在基因組技術(shù)能夠明確gbm分子特征的情況下,一個(gè)簡(jiǎn)單的臨床現(xiàn)象就重塑了gbm作為一種單一的疾病這種概念。臨床上,大多數(shù)膠質(zhì)母細(xì)胞瘤(約90%)為原發(fā)性,僅少數(shù)是從低級(jí)別膠質(zhì)瘤進(jìn)展而來(繼發(fā)性gbm)。原發(fā)性和繼發(fā)性gbms表現(xiàn)出完全不同的分子特征,例如,表皮生長(zhǎng)因子受體(egfr)和磷酸酶張力蛋白同源物(pten)常在原發(fā)性gbms中異常,而tp53在繼發(fā)性gbms中異常。雖然繼發(fā)性gbms很罕見的,僅占gbms的5%到10%,但其獨(dú)特的分子特征和臨床過程讓我們認(rèn)識(shí)到gbm是一種異質(zhì)性的疾病。
gbm是癌癥基因組圖譜(tcga)項(xiàng)目首選研究的癌癥,2008年nature雜志發(fā)表了tcga發(fā)出的第一篇研究結(jié)果,其從拷貝數(shù)變異,基因表達(dá),dna甲基化等方面對(duì)gbm分子特征進(jìn)行了多角度大規(guī)模的分析。除了常見的體細(xì)胞突變,包括tp53,pten,nf1,egfr,erbb2,rb1,pik3r1,pik3ca等,tcga還發(fā)現(xiàn)了一些新的顯著性變異,如nf1、park2的純合子缺失,以及akt3的擴(kuò)增等,并且發(fā)現(xiàn)這些遺傳變異主要富集在三條信號(hào)通路:(a)受體酪氨酸激酶/ras/磷脂酰肌醇3激酶(rtk/ras/pi3k)信號(hào)通路(在88%的gbm病人中異常);(b)p53信號(hào)通路(在87%的gbm病人中異常);and(c)rb信號(hào)通路(在78%的gbm病人中異常)。
tcga及其他研究小組的研究成果描繪了一幅gbm的分子景觀圖:egfr,met,pdgfra,mdm4,mdm2,ccnd2,pik3cad等基因的擴(kuò)增及cdkn2a/b,cdkn2c,pten,rb1,nfkb1a等基因的缺失;及p53、pten、nf1、rb1、idh1和idh2在體細(xì)胞中有不同頻率的突變,如egfr胞外域的突變,包括egfr變異iii(egfrviii)。隨著基因組技術(shù)的進(jìn)步,一些新的遺傳改變被發(fā)現(xiàn),包括wnt信號(hào)調(diào)節(jié)器fat1在20%膠質(zhì)母細(xì)胞瘤中出現(xiàn)體細(xì)胞突變,和fgfr3/tacc融合基因的發(fā)現(xiàn)。盡管這些新的遺傳改變可能并不常見,但是他們可以擴(kuò)展我們的生物信息認(rèn)知并且可能具有很大臨床應(yīng)用價(jià)值。
通過對(duì)tcga基因表達(dá)數(shù)據(jù)的分析,verhaak等人將gbm分為四個(gè)亞型,即neural,proneural,mesenchymal,classical亞型,每個(gè)亞型均有完全不同的分子改變。proneural亞型特點(diǎn)是有豐富的pdgfra,cdk6,cdk4和met改變,并且伴有頻繁的idh1突變;classical亞型特點(diǎn)是具有egfr擴(kuò)增,及pten和cdkn2a缺失;mesenchymal亞型特點(diǎn)是nf1、tp53和cdkn2a的突變和/或缺失。最后是neural亞型,其遺傳特征尚不明確。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)中的不足,提供tnc基因的一種新用途。
為實(shí)現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案是:tnc基因作為診斷標(biāo)志物在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
tnc基因的表達(dá)產(chǎn)物作為診斷標(biāo)志物在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
進(jìn)一步地,tnc基因的表達(dá)產(chǎn)物為tenascinc蛋白。
檢測(cè)tnc基因或其表達(dá)產(chǎn)物的試劑在制備惡性膠質(zhì)瘤診斷產(chǎn)品中的應(yīng)用。
進(jìn)一步地,所述的惡性膠質(zhì)瘤為多形性膠質(zhì)母細(xì)胞瘤。
進(jìn)一步地,所述的惡性膠質(zhì)瘤診斷產(chǎn)品用于惡性膠質(zhì)瘤的診斷或預(yù)后判斷。
進(jìn)一步地,所述的診斷產(chǎn)品為試劑盒、芯片或試紙。
本發(fā)明優(yōu)點(diǎn)在于:
本發(fā)明對(duì)gbm進(jìn)行了綜合的基因組學(xué)及蛋白組學(xué)分析,通過基于基因芯片及rna測(cè)序的基因表達(dá)分析及l(fā)c-ms/ms的蛋白質(zhì)譜分析,發(fā)現(xiàn)tnc基因在mrna水平及蛋白水平上調(diào)。對(duì)tnc做了生存分析,發(fā)現(xiàn)它的過表達(dá)與gbm病人預(yù)后不良有關(guān),說明tnc可作為gbm生物標(biāo)志物及潛在的治療靶點(diǎn)。
附圖說明
附圖1:15個(gè)lggs中45個(gè)5倍差異改變的mrna的聚類分析(p<0.01)。
附圖2:7個(gè)gbm中20個(gè)5倍差異改變的基因的聚類分析(p<0.01)。
附圖3:22個(gè)lggs中21個(gè)5倍差異改變基因(p<0.01)的聚類分析。
附圖4:27個(gè)gbm中25個(gè)5倍差異改變基因(p<0.01)。
附圖5:148個(gè)基因的go分析。主要的生物過程是:生物過程正向調(diào)控,代謝過程正向調(diào)控,細(xì)胞過程正向調(diào)控,生物過程負(fù)向調(diào)控,單一生物體定位;主要的分子功能是:核定位,受體結(jié)合,蛋白質(zhì)轉(zhuǎn)運(yùn)活性,mrna3’-非翻譯區(qū)au-富集區(qū)結(jié)合,細(xì)胞周期過程;主要的細(xì)胞組件是:胞漿部分,細(xì)胞漿,胞內(nèi)細(xì)胞器,高分子復(fù)合物,細(xì)胞器。
附圖6:keggpathway分析。五條主要信號(hào)通路為:催產(chǎn)素信號(hào)轉(zhuǎn)導(dǎo)通路,逆行大麻信號(hào)通路,晝夜夾帶,血管平滑肌收縮,谷氨酸神經(jīng)突觸。
附圖7:sring在線分析。重要的蛋白包括plk4,cdk6,prdm10和mef2c。
附圖8:15個(gè)顯著失調(diào)的蛋白。上調(diào)的包括hexb,nes;下調(diào)的包括mbp,hspa12a。
附圖9:16個(gè)在基因和蛋白層面上下調(diào)趨勢(shì)一致的分子。
附圖10:gbm中nes、hexb和hspa12a、mbp的相對(duì)表達(dá)量。qrt-pcr結(jié)果顯示nes、hexb表達(dá)顯著上調(diào);hspa12a、mbp表達(dá)顯著下調(diào)。
附圖11:nes的ihc染色結(jié)果示意圖。
附圖12:693個(gè)蛋白的go分析。主要生物過程是:能量和代謝前提的產(chǎn)生,通過氧化作用派生能量,細(xì)胞呼吸,嘌呤核苷酸的代謝,atp的代謝過程;主要分子功能是:nadh氧化還原酶活性,nadh脫氫酶活性,氧化還原活性,催化活性,陽離子運(yùn)輸atp酶活性;主要細(xì)胞組分是:髓鞘,細(xì)胞外囊,外泌體,有界膜囊,線粒體。
附圖13:kegg分析。主要通路是:氧化磷酸化,亨丁頓舞蹈癥,帕金森病,阿爾茨海默病,代謝通路。
附圖14:string蛋白質(zhì)相互作用分析。重要的蛋白包括ndufv2,eno2andatp2a1。
附圖15:10個(gè)與693個(gè)差異蛋白為共同差異基因/蛋白的分子。
附圖16:14個(gè)共同分子。包括hspa12a,snca,gnao1,serpina3,capg,anxa1,sod2,tnc,pygl,cd44,tgfbi,gbp1,serpinh1,nes。其中上調(diào)的nes,tgfbi及下調(diào)的hspa12a,snca也同時(shí)出現(xiàn)在圖15及圖9中。
附圖17:基因表達(dá)聯(lián)合質(zhì)譜分析。總共得到36個(gè)差異分子,其中25個(gè)上調(diào),11個(gè)下調(diào)。
附圖18:go分析。主要生物過程包括:電子傳遞鏈,化學(xué)平衡,創(chuàng)傷反應(yīng),細(xì)胞呼吸,藥物反應(yīng);主要分子功能包括:蛋白結(jié)合,蛋白復(fù)合物結(jié)合,結(jié)合,結(jié)構(gòu)分子活性,膠原蛋白結(jié)合;主要細(xì)胞組成包括:外泌體,部分胞外區(qū),有界膜囊,胞外區(qū),肌動(dòng)蛋白細(xì)胞骨架。
附圖19:keegpathway分析。主要通路:帕金森病,代謝通路,逆行大麻信號(hào)通路,氧化磷酸化,神經(jīng)信號(hào)傳遞通路。
附圖20:蛋白質(zhì)相互作用分析。重要的分子包括stat3,cd44。
附圖21:14個(gè)蛋白質(zhì)的14條肽段在正常腦組織和gbm中出現(xiàn)突變的情況。
附圖22:不同突變數(shù)的蛋白質(zhì)的比例。myh11,fn1,synm出現(xiàn)10個(gè)以上突變數(shù)。
附圖23:3個(gè)蛋白(myh11,fn1,synm)出現(xiàn)saavs的氨基酸位點(diǎn)的示意圖。
附圖24:19個(gè)突變蛋白(9.5%)富集在focaladhesion通路上,突變的蛋白質(zhì)用紅框標(biāo)出。
附圖25:soat1和nes為我們geo基因表達(dá)芯片、tcag基因表達(dá)芯片和質(zhì)譜突變鑒定共同的分子;apob為tcag測(cè)序、tcga基因表達(dá)芯片和質(zhì)譜突變鑒定共同的分子。
附圖26:生存曲線表明nes的上調(diào)與較短的os有關(guān),預(yù)示著較差的預(yù)后。
附圖27:生存曲線表明tnc的上調(diào)與較短的os有關(guān),預(yù)示著較差的預(yù)后。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明提供的具體實(shí)施方式作詳細(xì)說明。
實(shí)施例1
本領(lǐng)域已知的各種技術(shù)檢測(cè)tnc基因的表達(dá)情況。
實(shí)施例2
本領(lǐng)域已知的各種技術(shù)檢測(cè)tnc基因的表達(dá)產(chǎn)物(例如tenascinc蛋白)。
實(shí)施例3
1.材料與方法
1.1病人組織樣本
我們收集了8對(duì)經(jīng)外科切除并根據(jù)最新的who分類的膠質(zhì)母細(xì)胞瘤(gbm)及配對(duì)的正常腦組織的新鮮組織樣本;樣本均來自贛州市人民醫(yī)院。所有患者均簽署知情同意書,該項(xiàng)操作受贛州市人民醫(yī)院倫理委員會(huì)許可。
1.2試劑配制
uabuffer配方:urea48.048g,tris1.2114g,加入100ml水,調(diào)節(jié)ph=8.5
iaa:0.005miaa溶解于ua中(13.875mgiaa溶解于1.5mlua中)
200mmdtt:30.86mgdtt溶解于1ml100mmnh4hco3中
abc/碳酸氫銨:0.05mabc溶解于h2o中(395.3mg溶于100mlddh2o)
50mmnh4hco3:50ul1mnh4hco3(79.06mg溶于1mlddh2o)加入950ulddh2o
sdt裂解液配方:sds4g,dtt1.54g,tris1.21g,hcl調(diào)ph=7.6
2.1lc-ms/ms蛋白質(zhì)譜分析
2.1.1樣品準(zhǔn)備(以下操作均在冰上進(jìn)行)
1.8對(duì)gbm及正常腦組織樣本被切成小碎塊(約1mm3),并用pbs清洗;
2.20-50mg組織(約含2-5mg蛋白),加入sdt裂解液(4%sds,0.1mdtt,0.1mtris-hcl,ph7.6)400ul,4℃低溫均漿90s;
3.100℃水浴煮3min;
4.超聲10次,條件:80w,每次超聲10s,間隔15s;
5.16,000g離心10min,取上清(不要吸到沉淀,寧少勿多);
6.熒光分光光度法測(cè)定蛋白質(zhì)濃度;
2.1.2質(zhì)譜樣品前處理(faspmethod,在10k超濾管中進(jìn)行)
1.20-200ug蛋白加30ulsdt裂解液(不要加大于30ulsdt,有可能堵塞濾芯,如濃度低,可分次加入sdt裂解液和ua,不可一次加入超過30ul);加入100ulua,600rpm,混勻儀混勻1min,14,000g離心15min,具體離心時(shí)間視情況而定,離干,注意離心管中液體不可過多;
2.再加入200ulua,14,000g離心15min,去除離心管中液體;
3.加入100uliaa,600rpm混勻儀混勻1min,暗處孵育20min;
4.14,000g離心10min;
5.加入100ulureabuffer,14000g離心10min,重復(fù)兩次;
6.加入100ul50mm的abc到超濾管中,14000g離心10min,重復(fù)兩次;
7.加入40ul50mm含1-4μg胰酶的abc(胰酶:蛋白為1:50-1:100),振蕩1min;
8.超濾管放入37℃的水浴鍋中酶解16-18h;
9.將超濾管轉(zhuǎn)移到新的收集管中,14,000g離心10min收集超濾下來的肽段;
10.往超濾管中再加入50ulabc,14,000g離心10min收集超濾下來的肽段;
11.多肽混合物-80℃冷凍后凍干;
12.多肽混合物經(jīng)固相萃取柱脫鹽處理;
2.1.3nano-lc-ms/ms分析
凍干的多肽混合物重溶于0.1%甲酸溶液中,使用ltqorbitrapvelos專業(yè)質(zhì)譜儀鑒定多肽混合物。easynanolcsystem儀器參數(shù)設(shè)置為:全掃描范圍為300-2000amu(1個(gè)微掃描),之后為20個(gè)信號(hào)依賴二級(jí)掃描(掃描寬度為3amu,35%標(biāo)準(zhǔn)化能量碰撞,動(dòng)態(tài)排除1min)。
2.1.4數(shù)據(jù)分析
原始數(shù)據(jù)使用maxquant軟件(version1.3.0.5)分析,檢索數(shù)據(jù)庫為swissprot人蛋白質(zhì)數(shù)據(jù)庫(www.uniprot.org)。檢索參數(shù)為:胰蛋白酶,1%誤切率,誤切位點(diǎn)為2,母離子質(zhì)量誤差為0.05da,固定修飾為脲甲基化修飾carbamidomethy(c),無可變修飾。
搜索條件:胰酶消化,最大遺漏酶切位點(diǎn)1個(gè),肽段質(zhì)量精確度±0.1,ms/ms質(zhì)量精確度±0.1,固定修飾carbamidomethyl(c)。人工測(cè)序獲得的肽序列通過embl(http://dove.embl-heidelber.de/blast2/)搜索非冗余蛋白質(zhì)序列數(shù)據(jù)庫nrdb95,參數(shù)設(shè)置為默認(rèn)值。
2.2quantitativereal-timepcr
2.2.1總rna抽提
1.每50mg-100mg組織加1mltrizol裂解,組織的體積不應(yīng)超過加入trizol體積的10%,使用勻漿器充分勻漿;勻漿液在室溫(15℃~30℃)放置5min;
2.rna分離:按1:0.2(trizol:氯仿)的體積比加入氯仿,蓋嚴(yán),用力劇烈震蕩15秒,在室溫放置3-5min,12000rpm、4℃條件下離心15分鐘;離心后上述混合液可以分為三相,下層的為苯酚-氯仿相,中間層及上層無色的水相層。小心取出ep管,將上層含rna的透明水相轉(zhuǎn)移至新的ep管中;
3)rna沉淀:按照每1mltrizol加0.5ml異丙醇的比例,加入異丙醇,混勻,室溫放置10min。12,000rpm、4℃條件下離心10min,rna沉淀形成膠狀物沉在管底。
4.rna洗滌:棄上清,按照trizol與乙醇比例為1:1加入75%乙醇,進(jìn)行洗滌,渦旋混合;4℃、7500rpm條件下離心5min,棄上清;置于室溫干燥沉淀。注意不要讓rna完全干燥,因rna完全干燥后很難溶解。
5.rna再溶解:用depc處理過的水重新溶解rna。
注意:提取rna時(shí)需戴上口罩、手套,使用專用的rnasefree的槍頭和離心管,離心機(jī)需要提前預(yù)冷。
2.2.2rna定量及純度檢測(cè)
使用微量分光光度計(jì)對(duì)上述rna進(jìn)行定量分析,檢測(cè)其濃度及純度。a260/a280比值是純度檢測(cè)的重要指標(biāo),一般在1.8-2.0,低于此值表示有rna或其他雜質(zhì)的污染,定量后的rna樣本可以進(jìn)行rt-pcr或保存在-80℃冰箱備用。
2.2.3cdna的合成
按takara公司primescripttmrt-pcr試劑盒說明書進(jìn)行逆轉(zhuǎn)錄合成cdna,下列組分配制rt反應(yīng)體系(冰上操作):
反轉(zhuǎn)錄反應(yīng)條件:42℃10min;95℃2min;16℃forever
反應(yīng)結(jié)束后即得到的cdna溶液加80μlh2o(20μl→100μl),使終濃度為10ng/μl,繼續(xù)進(jìn)行qrt-pcr反應(yīng)或-20℃凍存?zhèn)溆谩?/p>
2.2.4qrt-pcr
本實(shí)驗(yàn)所有mrna引物及內(nèi)參均由上海生工生物公司設(shè)計(jì)合成。
實(shí)時(shí)熒光定量pcr引物序列
按takara公司sybrpremixextaqkit說明書上的操作步驟,進(jìn)行實(shí)時(shí)熒光定量pcr檢測(cè)。冰上加樣,反應(yīng)體系如下:
反應(yīng)條件如下:
熔解曲線分析,判斷產(chǎn)物純度:反應(yīng)結(jié)束后,rqmanager分析軟件統(tǒng)計(jì)處理,獲取ct值,并根據(jù)熔解曲線判斷產(chǎn)物的純度。
2.2.5數(shù)據(jù)分析及處理
獲取每次試驗(yàn)?zāi)康幕蚣皟?nèi)參的ct值(c代表cycle,t代表threshold),ct值代表每個(gè)反應(yīng)孔內(nèi)的熒光強(qiáng)度達(dá)到設(shè)定的閾值時(shí)所經(jīng)歷的循環(huán)數(shù)。具體計(jì)算方法如下:
△ct=目的基因ct值-管家基因gapdhct值
△△ct=目的基因△ct-參照樣本(即對(duì)照組)目的基因△ct
相對(duì)表達(dá)量=2-△△ct
2.3免疫組化染色
1.脫蠟和水化:常規(guī)二甲苯脫蠟,梯度酒精水化;
2.pbs沖洗3次,每次5min;
3.抗原修復(fù):以0.01m檸檬酸緩沖液(ph6.0)高壓2min修復(fù)抗原,冷卻至室溫;
4.pbs洗3次,每次5min;
5.在3%h202-甲醇溶液中孵育10min,以滅活內(nèi)源性過氧化物酶活性;
6.pbs洗3次,每次5min;
7.封閉:滴加正常5%山羊血清,室溫孵育30min,甩去多余液體;
8.pbs沖洗3遍除去血清,滴加一抗(pbs代替一抗作為陰性對(duì)照),4℃冰箱過夜;
9.次日pbs洗3次,每次5min;
10.滴加辣根過氧化物酶(hrp)標(biāo)記的二抗,室溫孵育30min;
11.pbs洗3次,每次5min;
12.滴加sp(鏈霉親和素-過氧化酶),室溫孵育10min;
13.pbs洗3次,每次5min;
14.顯色:dab顯色5-10min,顯微鏡下判斷染色程度,蒸餾水洗終止顯色;
15.復(fù)染:蘇木精復(fù)染,1%鹽酸酒精分化幾秒;
16.自來水沖洗5min;
17.常規(guī)脫水透明、中性樹膠封片、鏡檢。
2.4生物信息學(xué)分析
我們從geo數(shù)據(jù)庫下載了兩組膠質(zhì)瘤的全基因組表達(dá)譜數(shù)據(jù)(gse45921和gse51146),并用mev4.7.1軟件對(duì)差異基因做了分層聚類分析?;虮倔w(geneontology,go)((http://www.geneontology.org/)按照生物途徑(biologyprocess),分子功能(molecularfunction)和細(xì)胞定位(cellularlocation)對(duì)基因進(jìn)行注釋和分類,被用來評(píng)價(jià)差異基因富集在gbm中哪些功能類群。keegpathway記錄了細(xì)胞之中的分子相互作用網(wǎng)絡(luò)以及具體生物所特有的變化形式,被用來評(píng)價(jià)差異基因富集在哪些信號(hào)通路。蛋白質(zhì)相互作用通過string進(jìn)行在線分析(http://string-db.org/)。
2.5統(tǒng)計(jì)學(xué)分析
所有的統(tǒng)計(jì)分析采用ibmspssstatistics20(ibmcorp.;armonk,ny,usa)統(tǒng)計(jì)軟件包進(jìn)行數(shù)據(jù)處理。表達(dá)量用均數(shù)±標(biāo)準(zhǔn)偏差呈現(xiàn)。獨(dú)立樣本t檢驗(yàn)進(jìn)行組間差異比較,卡方檢驗(yàn)進(jìn)行組間率的差異比較。kaplan-meier曲線來確定各組的總生存率,結(jié)果與對(duì)數(shù)秩檢驗(yàn)比較。p<0.05被認(rèn)為有統(tǒng)計(jì)學(xué)意義。
3.結(jié)果
3.1geo數(shù)據(jù)庫基因芯片的分析
我們分析了利用affymetrixu133plus2.0芯片對(duì)22個(gè)膠質(zhì)瘤及配對(duì)正常腦組織進(jìn)行的全基因組表達(dá)譜分析的數(shù)據(jù)(geodataset:gse45921),其中包括15個(gè)低級(jí)別的膠質(zhì)瘤(lggs)和7個(gè)膠質(zhì)母細(xì)胞瘤(gbm)。
結(jié)果發(fā)現(xiàn):相對(duì)于配對(duì)的正常腦組織,15個(gè)lggs中有492個(gè)2倍以上差異改變(foldchange≥2;p<0.05)的mrna,其中367個(gè)上調(diào),125個(gè)下調(diào);相對(duì)于配對(duì)的正常腦組織,15個(gè)lggs中有45個(gè)5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中35個(gè)上調(diào),包括sfrp2,rpe65,cd44,myc等;10個(gè)下調(diào),包括arg1,enc1,psg5等。用mev4.7.1軟件做聚類分析(圖1)。
相對(duì)于配對(duì)的正常腦組織,7個(gè)gbm中有657個(gè)1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異基因,其中133個(gè)上調(diào),524個(gè)下調(diào);相對(duì)于配對(duì)的正常腦組織,7個(gè)gbm中有20個(gè)5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中8個(gè)上調(diào),12個(gè)為下調(diào)。上調(diào)的包括top2a,gfap,sod2,cdca7l,gdf8,id3,xist,cdc2;下調(diào)的包括vipr1,camk2a,gjb6,ryr2,cntnap2,scel,slc8a2,creg2,mfsd4,cacng3,neurod6,cabp1。用mev4.7.1軟件做聚類分析(圖2)。
此外,我們還分析了另外一組利用上海博星公司biostarh-140s×32芯片進(jìn)行的全基因組表達(dá)譜芯片數(shù)據(jù)(geodataset:gse51146),包括49個(gè)膠質(zhì)瘤及配對(duì)的正常腦組織,其中22個(gè)低級(jí)別膠質(zhì)瘤(lggs),27個(gè)膠質(zhì)母細(xì)胞瘤(gbm)。
結(jié)果發(fā)現(xiàn):相對(duì)于配對(duì)的正常腦組織,22個(gè)lggs中有399個(gè)2倍以上差異改變(foldchange≥2;p<0.05)的mrna,其中332個(gè)上調(diào),67個(gè)為下調(diào);相對(duì)于配對(duì)的正常腦組織,22個(gè)lggs中有21個(gè)5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中17個(gè)上調(diào),包括itsn2,rps6kc1,sb92,kcmf1,thap3,wipi49,snd1,itga5,yes1,bhmt2,pp1553,lrrtm2,col1a2,snx16,slco1b1,paf400,uvrag;4個(gè)為下調(diào),包括rtn1,atxn10,nap1l3,dmbt1。用mev4.7.1軟件做聚類分析(圖3)。
相對(duì)于配對(duì)的正常腦組織,27個(gè)gbm中有609個(gè)1.5倍以上差異改變(foldchange≥1.5;p<0.05)的mrna,其中481個(gè)上調(diào),128個(gè)為下調(diào);相對(duì)于配對(duì)的正常腦組織,27個(gè)gbm中有25個(gè)5倍以上差異改變(foldchange≥5;p<0.01)的mrna,其中23個(gè)上調(diào),包括rps6kc1,ywhag,rxrb,trrap,tomm22,htt,smarcal1,utp15,col3a1,itga5,timp1,ccl2,trp2,ehd3,ranbp2,sr140,b3galnt1,phf10,umps,dhcr7,mettl5,zdhhc2,tppp2;2個(gè)下調(diào),包括taf10,plp1。用mev4.7.1軟件做聚類分析(圖4)。
通過對(duì)比兩組基因芯片中g(shù)bm與正常腦組織的1.5倍差異改變的mrna(affymetrix芯片中657個(gè)與biostarh芯片中609個(gè)),我們發(fā)現(xiàn)了148個(gè)共同表達(dá)改變的基因。
3.2go,keggpathway及蛋白質(zhì)相互作用分析
為了判斷差異基因主要富集在哪些功能類群和代謝通路,我們對(duì)148個(gè)基因進(jìn)行了go(圖5)和keggpathway(圖6)分析及蛋白質(zhì)相互作用分析(圖7)。
3.3蛋白質(zhì)譜分析
我們利用nano-lc-ms/ms對(duì)8個(gè)gbm及其配對(duì)的正常腦組織進(jìn)行了全蛋白組測(cè)序。每個(gè)樣品做了3次重復(fù)。
結(jié)果發(fā)現(xiàn):相對(duì)于配對(duì)的正常腦組織,8個(gè)gbm中有693個(gè)1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異蛋白,其中500個(gè)上調(diào),193個(gè)為下調(diào);其中有15個(gè)改變最顯著的差異蛋白(foldchange≥10;p<0.01),6個(gè)上調(diào),包括tmx1,acox1,hexb,gorasp2,synm,nes;9個(gè)下調(diào),包括mbp,cnp,plp1,mylpf,tuba4a,sncg,hspa12a,gpd1,dmtn。用mev4.7.1軟件做聚類分析(圖8)。
在693個(gè)差異蛋白中,與148個(gè)差異基因相比有16個(gè)共同的分子,并且上下調(diào)趨勢(shì)一致(圖9),包括nes,hexb,cnn3,h2afz,stat3,rps28,elavl1,ilf3,arpc5,eif2s2,mcts1,ndufs2,ndufa10,calm1,hspa12a,mbp,說明這些蛋白水平的改變可能是由于基因改變引起的。
在16個(gè)共同差異基因/蛋白中,我們選取了最顯著上調(diào)的nes、hexb和最顯著下調(diào)的hspa12a、mbp進(jìn)行了qrt-pcr(圖10)和ihc(圖11,nes的ihc結(jié)果)驗(yàn)證,結(jié)果證實(shí)了這些差異基因/蛋白的上調(diào)和下調(diào)表達(dá)趨勢(shì)和芯片/質(zhì)譜結(jié)果是一致的。
3.4go,keggpathway及蛋白質(zhì)相互作用分析
接著,我們對(duì)上述gbm與正常腦組織的693個(gè)1.5倍差異改變的蛋白,進(jìn)行了go(圖12),keggpathway(圖13)和蛋白質(zhì)相互作用分析(圖14)。
3.5tcga數(shù)據(jù)庫基因表達(dá)分析
我們下載了tcga數(shù)據(jù)庫的gbmgeneexpression(illuminahiseq)測(cè)序結(jié)果,包含了172例樣本,其中5例正常腦組織,167例gbm組織。相對(duì)于正常腦組織,167個(gè)gbm中有2881個(gè)1.5倍以上差異改變(foldchange≥1.5;p<0.05)的差異基因。2881個(gè)1.5倍差異改變的基因中,有10個(gè)與693個(gè)1.5倍差異改變蛋白為共同的差異基因/蛋白,包括sncg,snca,sptb,ckmt1a,myh1,myh4,f2,hist1h1b,tgfbi,lmnb1(圖15)。
我們還下載了tcga數(shù)據(jù)庫中另外一組基因芯片數(shù)據(jù)gbmgeneexpression(tcga_gbm_exp_u133a),包含了539例樣本,其中10例正常腦組織,529例gbm組織。相對(duì)于正常腦組織,529個(gè)gbm中有298個(gè)1.5倍差異改變(foldchange≥1.5;p<0.05)的基因。298個(gè)1.5倍差異改變的基因中,有14個(gè)與693個(gè)1.5倍差異改變蛋白為共同的差異基因/蛋白(圖16)。
總之,我們利用基因表達(dá)和蛋白質(zhì)譜聯(lián)合分析,總共得到了36個(gè)共同的差異分子(foldchange≥1.5;p<0.05)包括gnao1,sncg,snca,sptb,ckmt1a,myh1,myh4,ndufa10,calm1,hspa12a,mbp,serpina3,capg,anxa1,sod2,tnc,pygl,cd44,tgfbi,gbp1,serpinh1,nes,f2,hist1h1b,lmnb1,hexb,cnn3,h2afz,stat3,rps28,elavl1,ilf3,arpc5,eif2s2,mcts1,ndufs2,其中25個(gè)上調(diào),11個(gè)下調(diào)。geo-基因芯片/蛋白質(zhì)譜16個(gè)共同分子,tcga-基因芯片/蛋白質(zhì)譜14個(gè),tcga-測(cè)序/蛋白質(zhì)譜10個(gè)。其中兩兩共同的分子有4個(gè)(上調(diào)的tgfbi,nes和下調(diào)的snca,hspa12a),沒有三種共同的分子(圖17)。
3.6go,keggpathway及蛋白質(zhì)相互作用分析
我們對(duì)這36個(gè)在mrna水平及蛋白水平均失調(diào)的分子做了go(圖18),keggpathway(圖19)及蛋白質(zhì)相互作用分析(圖20)。
3.7單氨基酸變異(saavs)的鑒定
為了從質(zhì)譜結(jié)果中分析單氨基酸突變,我們利用tcga_gbm外顯子測(cè)序的突變結(jié)果(http://cbio.mskcc.org/cancergenomics/pancan_tcga/)構(gòu)建了gbm的單氨基酸變異(saavs)數(shù)據(jù)庫。
我們?cè)趕wissprot人標(biāo)準(zhǔn)蛋白質(zhì)數(shù)據(jù)庫中搜索得到的質(zhì)譜結(jié)果,包括4834個(gè)蛋白的36858條肽段信息;平均7.6條肽段/每個(gè)蛋白。而我們將質(zhì)譜結(jié)果在新構(gòu)建的saavs數(shù)據(jù)庫中進(jìn)行重新搜索,得到了8對(duì)gbm樣本的突變肽段數(shù)據(jù),其中包括2515個(gè)蛋白的23405條肽段信息;平均9.3條突變肽段/每個(gè)蛋白。與正常人數(shù)據(jù)庫相比,我們構(gòu)建的saavs數(shù)據(jù)庫搜索得到新的897個(gè)蛋白質(zhì)的3884條突變肽段,平均4.3條突變肽段/每個(gè)蛋白。
其中有14個(gè)蛋白質(zhì)的14條肽段在8個(gè)正常腦組織中只有一個(gè)樣本中出現(xiàn)(正常組織中突變概率12.5%),而在8個(gè)gbm中的至少6個(gè)gbm中出現(xiàn)了一次突變(gbm中突變概率≥75%)(圖21)。
186個(gè)蛋白質(zhì)的335條肽段只在gbm中出現(xiàn)了突變,平均1.8條突變肽段/每個(gè)蛋白(從1-48條肽段);150個(gè)蛋白質(zhì)(80.6%)只有一個(gè)gbm樣本的一條肽段出現(xiàn)saavs,突變數(shù)(numbersofmutation,nm)等于1(突變數(shù)等于出現(xiàn)突變的gbm樣本×突變位點(diǎn));20個(gè)蛋白(10.8%)突變數(shù)等于2;18個(gè)蛋白(7.0%)突變數(shù)為2-10個(gè);3個(gè)蛋白(1.6%)(myh11,fn1,synm)出現(xiàn)10個(gè)以上突變數(shù),nms>10(圖22),分別有48,16和14個(gè)nms;3個(gè)蛋白(myh11,fn1,synm)出現(xiàn)saavs的氨基酸位點(diǎn)如圖所示(圖23)。
與正常腦組織相比,上述gbm中總共有200個(gè)蛋白質(zhì)出現(xiàn)了概率≥75%的突變。對(duì)這些突變做keggpathway分析,發(fā)現(xiàn)有19個(gè)蛋白質(zhì)(9.5%)在focaladhesion的pathway上(圖24)。
這200個(gè)突變的蛋白質(zhì)與我們37個(gè)geo數(shù)據(jù)庫中g(shù)bm芯片結(jié)果(7+27)1.5倍差異基因相比,有6個(gè)共同的分子;與tcga-gbm-u133a的529例gbm表達(dá)芯片1.5倍差異基因相比,有3個(gè)共同的分子;與tcga-gbm-u133a的167例gbm組織illuminahiseq測(cè)序結(jié)果的1.5倍差異基因相比,有8個(gè)共同的分子。
質(zhì)譜突變分析與基因表達(dá)差異基因篩選得到的共同分子總共有14個(gè),8個(gè)上調(diào),6個(gè)下調(diào),包括apob,rufy1,ceacam5,ldb3,krt82,c1ql3,soat1,col6a3,acin1,nes,tnc,cilp,ikbip,hk3(圖25)。
3.8生存分析
我們利用基因表達(dá)和蛋白質(zhì)譜定量聯(lián)合分析,總共得到了36個(gè)差異分子,利用基因表達(dá)與氨基酸突變聯(lián)合分析,得到14個(gè)共同分子,其中nes和tnc在兩組聯(lián)合分析中均出現(xiàn)。我們進(jìn)一步對(duì)這兩個(gè)分子在我們的27個(gè)gbm表達(dá)譜芯片數(shù)據(jù)和529個(gè)gbm表達(dá)譜芯片數(shù)據(jù)(15個(gè)病人失訪,只分析了514個(gè)gbm)中做了生存分析。
結(jié)果表明:nes在我們的27個(gè)gbm表達(dá)譜芯片數(shù)據(jù)和514個(gè)gbm表達(dá)譜芯片數(shù)據(jù)中,表達(dá)越高,gbm病人生存時(shí)間越短(p=0.012和0.018)(圖26);tnc在我們的27個(gè)gbm表達(dá)譜芯片數(shù)據(jù)和514個(gè)gbm表達(dá)譜芯片數(shù)據(jù)中,表達(dá)越高gbm病人生存時(shí)間越短(p=0.036)(圖27)。
4.討論
膠質(zhì)母細(xì)胞瘤(gbm)是成人最常見原發(fā)性惡性腦瘤,也是最致命的人類癌癥之一。本文對(duì)gbm進(jìn)行了綜合的基因組學(xué)及蛋白組學(xué)分析,為理解gbm的發(fā)病機(jī)制提供了一點(diǎn)新見解,并且鑒定出了一些潛在的治療靶點(diǎn),為開發(fā)新的更有效的治療方法提供了分子基礎(chǔ)。
通過基于基因芯片及rna測(cè)序的基因表達(dá)分析及基于液相色譜-串聯(lián)質(zhì)譜聯(lián)用技術(shù)(lc-ms/ms)的蛋白質(zhì)譜分析,我們鑒定出了36個(gè)在mrna水平及蛋白水平均出現(xiàn)失調(diào)的分子,包括上調(diào)的tgfbi,nes,及下調(diào)的snca,hspa12a。并且我們?cè)诜治鰞山Mgeo基因芯片數(shù)據(jù)中發(fā)現(xiàn),gbm與正常腦組織的差異基因,和lggs與正常腦組織的差異基因重復(fù)不多,這說明從正常腦膠質(zhì)細(xì)胞發(fā)展為低級(jí)別膠質(zhì)瘤(lggs)或膠質(zhì)母細(xì)胞瘤(gbm)是兩種完全不同的生物學(xué)過程,這也符合我們的臨床觀察,即大部分(約90%)的gbm是原發(fā)性的,僅有不到10%是由低級(jí)別膠質(zhì)瘤進(jìn)展而來。
同時(shí),我們發(fā)現(xiàn)的失調(diào)的基因,包括tgfbi,nes,snca,hspa12a等已經(jīng)被發(fā)現(xiàn)在gbm及其它腫瘤中起重要作用。轉(zhuǎn)錄生長(zhǎng)因子誘導(dǎo)基因(tgfbi,transforminggrowthfactor,beta-induced),編碼一種能夠結(jié)合i,ii和iv型膠原蛋白的含有精氨酸、甘氨酸和天冬氨酸(rgd,l-arginine,glycine,andl-asparticacid)序列的蛋白,其在gbm通過tgf-β信號(hào)通路表達(dá)上調(diào);nestin(nes)基因,編碼中間絲蛋白家族的一個(gè)成員,神經(jīng)巢蛋白,主要在神經(jīng)細(xì)胞表達(dá),被證明是gbm的一個(gè)預(yù)后標(biāo)志物;突觸核蛋白α(snca,synucleinalpha)是突觸核蛋白家族的一員,在大腦表達(dá)豐富,其過表達(dá)能通過腫瘤壞死因子α(tnf-alpha)介導(dǎo)的信號(hào)通路來促進(jìn)人腦膠質(zhì)瘤細(xì)胞系u373細(xì)胞的凋亡;hspa12a(heatshockproteinfamilya(hsp70)member12a),是熱休克蛋白家族的一員,被報(bào)道稱與漢族人群中胃癌的發(fā)病風(fēng)險(xiǎn)有關(guān),并且其過表達(dá)與早期hbv相關(guān)的肝細(xì)胞癌的預(yù)后不良相關(guān)。
其它一些通過生物信息學(xué)分析預(yù)測(cè)的重要分子,包括cd6,cd44和stat3等,也有相關(guān)研究表明其在gbm及其它腫瘤的發(fā)病中起重要作用。信號(hào)傳導(dǎo)及轉(zhuǎn)錄活化因子3(stat3,signaltransducerandactivatoroftranscription-3),是stat蛋白家族的一員,已被報(bào)道在gbm發(fā)生,發(fā)展及侵襲中起重要作用。cd44基因編碼一種有多種異構(gòu)體的細(xì)胞表面糖蛋白,參與細(xì)胞間相互作用、細(xì)胞黏附與遷移,被證明在包括gbm的多種癌癥中過表達(dá),在腫瘤細(xì)胞惡性進(jìn)展中起重要作用,如細(xì)胞遷移,腫瘤生長(zhǎng)及血管形成。cdk6在gbm中通過小泛素化修飾劑1(sumo1)的作用驅(qū)動(dòng)腫瘤細(xì)胞周期改變,促進(jìn)腫瘤進(jìn)展。cdk4和cdk6的選擇性靶向抑制劑,如abemaciclib已被報(bào)道在實(shí)體性腫瘤,包括乳腺癌,非小細(xì)胞肺癌,神經(jīng)膠質(zhì)母細(xì)胞瘤及其它實(shí)體性腫瘤中是安全有效的。
蛋白組學(xué)的一個(gè)根本問題就是鑒定哪些蛋白編碼序列的改變能夠引起蛋白表達(dá)水平的改變。因?yàn)闃?biāo)準(zhǔn)數(shù)據(jù)庫不能從質(zhì)譜結(jié)果中鑒定出突變的肽段,我們利用cosmic數(shù)據(jù)庫中g(shù)bm外顯子測(cè)序結(jié)果構(gòu)建了單氨基酸變異數(shù)據(jù)庫(saavs)。通過分析質(zhì)譜數(shù)據(jù),我們鑒定出了200個(gè)高突變率的蛋白,結(jié)合基因表達(dá)分析,我們發(fā)現(xiàn)14個(gè)分子同時(shí)有mrna水平的改變,其中nes及tnc又同時(shí)有蛋白水平的改變。我們進(jìn)一步對(duì)nes及tnc做了生存分析,發(fā)現(xiàn)它們的過表達(dá)與gbm病人預(yù)后不良有關(guān),說明nes及tnc有可能成為gbm生物標(biāo)志物及潛在的治療靶點(diǎn)。
毫無疑問,更深入的基因組分析會(huì)產(chǎn)生更豐富和更深層次的分子亞型,但是如何從中找到藥物靶點(diǎn)是我們要解決的關(guān)鍵問題。一種方法是應(yīng)用生物信息學(xué)工具來預(yù)測(cè)分子功能。carro等人應(yīng)用生物信息學(xué)的逆向工程算法從tcgagbm數(shù)據(jù)庫中發(fā)現(xiàn)了兩個(gè)轉(zhuǎn)錄因子c/ebpβ和stat3,它們能調(diào)節(jié)間充質(zhì)表達(dá)樣式,并有明顯的抗腫瘤作用。sumazin等人用另一種生物信息驅(qū)動(dòng)的方法開發(fā)了一種多變量分析工具(hermes),能從全基因組轉(zhuǎn)錄和mirna譜的綜合分析中系統(tǒng)地推斷出microrna作用的候選靶點(diǎn)。用這種方法,他們揭示了一個(gè)豐富的轉(zhuǎn)錄后microrna調(diào)控網(wǎng)絡(luò),鑒定出了pten缺失在促進(jìn)腫瘤生長(zhǎng)中的核心作用,即通過microrna依賴性的調(diào)節(jié)網(wǎng)絡(luò)。genovese等人應(yīng)用另外一種算法揭示了一條新的,受mir-34a調(diào)節(jié)的,轉(zhuǎn)化生長(zhǎng)因子(tgf)-β依賴的信號(hào)通路。因此,應(yīng)用生物信息學(xué)工具來預(yù)測(cè)疾病發(fā)生中的關(guān)鍵分子,結(jié)合實(shí)驗(yàn)?zāi)P偷墓δ茯?yàn)證,已經(jīng)開始產(chǎn)生一系列具有臨床價(jià)值的理論。
另一種方法,集中在評(píng)估異常分子所匯聚的核心信號(hào)通路及它們對(duì)下游效應(yīng)器的影響。brennan等人對(duì)20個(gè)gbm組織樣本中57個(gè)信號(hào)蛋白分子(包括已知信號(hào)通路中的翻譯后修飾蛋白)進(jìn)行分析,結(jié)果揭示了三條信號(hào)通路:egfr亞組,以egfr激活及pi3k信號(hào)增強(qiáng)為特點(diǎn);(b)pdgf亞組,特點(diǎn)是pdgfr信號(hào)通路;(c)nf1亞組,其下游信號(hào)效應(yīng)器不明確。對(duì)tcga基因表達(dá)亞型的分析表明egfr、pdgfra、nf1的改變彼此之間是不交叉的,這些發(fā)現(xiàn)都是基于tcga定義的三條核心信號(hào)通路(rtk/ras/pi3k、p53及rb1通路)。
總之,綜合的基因組學(xué)及蛋白組學(xué)分析為理解gbm的發(fā)病機(jī)制及開發(fā)新的治療方法提供了新的分子基礎(chǔ)。并且氨基酸突變分析有可能拓展我們對(duì)蛋白質(zhì)突變?cè)谄渌┌Y中的理解。
以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明方法的前提下,還可以做出若干改進(jìn)和補(bǔ)充,這些改進(jìn)和補(bǔ)充也應(yīng)視為本發(fā)明的保護(hù)范圍。
sequencelisting
<110>上海市第十人民醫(yī)院
<120>一種與惡性膠質(zhì)瘤診斷相關(guān)的標(biāo)志物及其應(yīng)用
<130>/
<160>4
<170>patentinversion3.3
<210>1
<211>22
<212>dna
<213>人工序列
<400>1
gaactggactgtggcattgaga22
<210>2
<211>21
<212>dna
<213>人工序列
<400>2
cacaaagcgactggatgaacc21
<210>3
<211>21
<212>dna
<213>人工序列
<400>3
tgggtgtgaaccatgagaagt21
<210>4
<211>21
<212>dna
<213>人工序列
<400>4
tgagtccttccacgataccaa21