專利名稱:來自ffpe樣品的基因表達(dá)分布圖的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及擴(kuò)增用福爾馬林、甲醛或多聚甲醛固定的樣品中表達(dá)的核酸分子。這種樣品可以包埋在石蠟中和/或長(zhǎng)時(shí)間保存。
本發(fā)明也涉及利用擴(kuò)增的核酸分子來測(cè)定所述樣品中基因表達(dá)的水平及其與不同疾病和病況的相關(guān)性?;虮磉_(dá)水平的信息可電子保存并用于協(xié)助疾病的診斷和治療。
背景技術(shù):
不同類型腫瘤(乳房、肺、前列腺和結(jié)腸)的基因表達(dá)分析揭示各種解剖學(xué)定義的癌內(nèi)存在著許多腫瘤亞類。此外,在一些這種研究中,不同亞類與具體預(yù)后相關(guān)連。例如,Wigle等(1)和Beer等(2)證明在非小細(xì)胞肺癌中存在的一些特定基因簇與不同的無疾病存活相關(guān)聯(lián)。這些報(bào)導(dǎo)確定了腫瘤的分子“構(gòu)成”,如基因表達(dá)分布圖所定義,這種構(gòu)成與臨床結(jié)局直接相關(guān),例如無疾病存活。這些回顧性研究強(qiáng)烈提醒隨著前瞻性試驗(yàn)的發(fā)展,有很大應(yīng)用前景的是某給定腫瘤的分子構(gòu)成與病人是否對(duì)某給定治療有反應(yīng)或無反應(yīng)直接相關(guān)聯(lián)。
一種進(jìn)行回顧性研究的方法是利用兩種主要類型的臨床樣品,冷凍樣品和福爾馬林固定及石蠟包埋的樣品。然而,當(dāng)完成臨床樣品的基因表達(dá)分析時(shí),要考慮至少3個(gè)主要因素。首先,利用冷凍樣品作微陣列實(shí)驗(yàn)需要大量組織且大多數(shù)研究者目前使用的實(shí)驗(yàn)設(shè)計(jì)和方法中,一次微陣列實(shí)驗(yàn)將“耗盡”全部活檢組織材料,因此顯著地限制了該材料用于微陣列后的驗(yàn)證實(shí)驗(yàn)、其它不同內(nèi)容的微陣列或其它類型的研究(如蛋白質(zhì)組分析)。
第二,迄今為止的微陣列研究一般開始于勻漿化的活檢組織,因此必須僅用高度富集腫瘤的樣品以最大程度減少樣品異質(zhì)性細(xì)胞的數(shù)量。不幸的是,這不是臨床試驗(yàn)中的“真實(shí)”情況,臨床試驗(yàn)中不能選擇隨后將檢測(cè)哪些亞組的活檢組織。使用激光捕獲顯微解剖(Emmert-Buck等,3)可避免這個(gè)問題,因其能選擇和捕獲所需類型的細(xì)胞而不論腫瘤量?!罢鎸?shí)”樣品包括腫瘤量可能極少(即10%)的樣品,因該樣品就活檢組織中存在的不同類型細(xì)胞總數(shù)而言,可能是異質(zhì)性的,或樣品中可含有大量浸潤(rùn)性炎癥細(xì)胞。
最后,臨床檢驗(yàn)中的常規(guī)樣品加工方法與研究實(shí)驗(yàn)室中進(jìn)行的顯著不同。具體說,對(duì)于常規(guī)分析臨床送鹼的活檢組織,是通過福爾馬林固定隨后石蠟包埋來加工組織。此方法高效,是目前是病理學(xué)研究的標(biāo)準(zhǔn)方法。不幸的是,目前只有冷凍樣品可用于微陣列分析,因?yàn)橐话慵夹g(shù)不能從福爾馬林固定樣品中獲得mRNA用于總mRNA表達(dá)分析(即用于雜交cDNA或寡核苷酸微陣列)。例如,Lewis等(5)清楚地說明mRNA失去聚腺苷酸尾是“逆轉(zhuǎn)錄步驟失敗的主要原因”。
其它使用福爾馬林固定組織來產(chǎn)生cDNA用于隨后實(shí)驗(yàn)的嘗試產(chǎn)生了混亂的結(jié)果。例如,Karsten等(4)用酪胺信號(hào)擴(kuò)增(TSA)系統(tǒng)比較了冷凍與福爾馬林固定組織在cDNA微陣列中的應(yīng)用,結(jié)論是“福爾馬林產(chǎn)生的RNA不是cDNA合成的良好底物在我們的微陣列實(shí)驗(yàn)中明顯不能產(chǎn)生可靠的雜交”。另一方面,Cohen等(9)描述了逆轉(zhuǎn)錄的使用,用隨機(jī)六聚體和實(shí)時(shí)定量RT-PCR擴(kuò)增來檢測(cè)2種趨化因子的表達(dá)。類似使用逆轉(zhuǎn)錄PCR以擴(kuò)增和檢測(cè)各個(gè)基因序列的表達(dá)見Lewis等(5)、Lehmann等(6)、Specht等(8)、Masuda等(10)和Danenberg等(11)的描述。尚沒有報(bào)導(dǎo)通過整體擴(kuò)增提取的核酸隨后通過多重分析如用微陣列來分析細(xì)胞水平基因表達(dá)的方法。
本文引用的文獻(xiàn)并非承認(rèn)任何文獻(xiàn)都是相關(guān)的現(xiàn)有技術(shù)。迄今的所有說明或提供的文獻(xiàn)內(nèi)容是以可獲得的專利申請(qǐng)信息為基礎(chǔ),不意味承認(rèn)文獻(xiàn)的日期或內(nèi)容是正確的。
發(fā)明的說明本發(fā)明提供分析被固定和任選被包埋的細(xì)胞中不同核酸序列表達(dá)的方法,。固定作用可視作將表達(dá)水平“凍結(jié)”于固定時(shí)細(xì)胞中存在的水平。可將細(xì)胞中不同序列具體如mRNA的表達(dá)水平認(rèn)為是其凍結(jié)時(shí)的水平。因而,可捕捉細(xì)胞基因表達(dá)的動(dòng)態(tài)情況作為代表不同基因序列那時(shí)表達(dá)水平的靜態(tài)分子。本發(fā)明提供定量檢測(cè)這些表達(dá)水平的方法,或通過從細(xì)胞mRNA群中同時(shí)產(chǎn)生多個(gè)cDNA分子來觀察此種情況的方法。mRNA表達(dá)的這種“整體”分析之后可進(jìn)行所述cDNA的轉(zhuǎn)錄以產(chǎn)生RNA分子用于試驗(yàn)。
通過大致類似于傳統(tǒng)的照相方法,固定法捕捉的表達(dá)水平“情況”可用于產(chǎn)生“負(fù)”鏈cDNA,從其可產(chǎn)生擴(kuò)增的RNA分子用于檢驗(yàn),例如以陣列(或能用陣列)模式為基礎(chǔ)例如微陣列的試驗(yàn)。含有能與擴(kuò)增RNA分子雜交的多個(gè)序列的此陣列是“照相”描述細(xì)胞中基因表達(dá)的陣列。
因而,本發(fā)明提供了“解開”固定和包埋組織樣品中的基因表達(dá)數(shù)據(jù)(或觀察這種樣品的細(xì)胞表達(dá)水平)的方法,所用的技術(shù)可制備和分析所述細(xì)胞中信使RNA分子的水平。在較佳實(shí)施方案中,可利用本發(fā)明定量測(cè)定以確定1種或多種核酸序列的表達(dá)水平?;蛘呖衫帽景l(fā)明作定性測(cè)定。
一般,含組織樣品的固定細(xì)胞可用作含實(shí)施本發(fā)明物質(zhì)的細(xì)胞來源。優(yōu)選切樣品用于提取和制備RNA,任選先進(jìn)行顯微解剖和/或去除包埋物質(zhì)。提取的RNA任選的加熱至理論上能去除修飾并使RNA恢復(fù)到更天然、預(yù)固定狀態(tài)。然后擴(kuò)增聚腺苷酸化的RNA,先用寡dT引物非選擇性地將它們轉(zhuǎn)變成cDNA,引物宜可操作性連接于能指導(dǎo)cDNA轉(zhuǎn)錄的啟動(dòng)子序列。該啟動(dòng)子可以是單鏈序列(在合成第二條cDNA鏈時(shí)轉(zhuǎn)變成雙鏈序列)或雙鏈。然后轉(zhuǎn)錄該cDNA,產(chǎn)生擴(kuò)增RNA與提取的RNA物質(zhì)序列相同或互補(bǔ)。該擴(kuò)增的RNA是“整體”的,因?yàn)樗跃巯佘账峄癁榛A(chǔ)而不是選擇任何特定基因序列。然而,擴(kuò)增的RNA可用于測(cè)定或分析對(duì)應(yīng)于細(xì)胞中核酸表達(dá)的序列,如通過與某陣列(或可分棟陣列)模式例如微陣列上的序列雜交。另外,可用其它方法分析此cDNA,包括直接擴(kuò)增(例如但不限于下面進(jìn)一步討論的PCR)。
第一方面,本發(fā)明提供初提和制備固定細(xì)胞中RNA的方法,采用蛋白酶處理聯(lián)合隨后的RNA提取并使其接觸硅膠基質(zhì)。提取優(yōu)選采用含胍鹽的化合物進(jìn)行,或采用其它能產(chǎn)生這種化合物的離液效果使蛋白變性的方法。這改進(jìn)了隨后分析RNA的條件。
第二方面,本發(fā)明提供通過加熱制備用于逆轉(zhuǎn)錄的RNA的改進(jìn)方法。不受理論約束,認(rèn)為此法可導(dǎo)致脫去RNA堿基在細(xì)胞固定期間所經(jīng)歷的修飾。這改進(jìn)了隨后使用的RNA的條件。
第三方面,本發(fā)明提供一種擴(kuò)增含3’末端聚腺苷酸序列的RNA分子為基礎(chǔ)的擴(kuò)增方法。以前認(rèn)為這種分子已降解而不能用作逆轉(zhuǎn)錄的模板(5)。進(jìn)行此種擴(kuò)增可能開始要用一種寡dT引物來逆轉(zhuǎn)錄模板聚腺苷酸化的RNA,此種引物任選地含有操作性連接有啟動(dòng)子序列的單鏈或雙鏈序列。通常逆轉(zhuǎn)錄聚腺苷酸化的RNA使得能同時(shí)產(chǎn)生多個(gè)cDNA分子,這些分子反映了細(xì)胞的模板聚腺苷酸化RNA分子的水平。本發(fā)明也可用于擴(kuò)增固定組織樣品中存在的病使體表達(dá)的聚腺苷酸化RNA分子。
在本發(fā)明的具體較佳實(shí)施方案中,本發(fā)明的所有這三個(gè)方面一起聯(lián)合使用來產(chǎn)生固定組織樣品中基因表達(dá)的信息。
可用cDNA分子來轉(zhuǎn)錄含模板聚腺苷酸化RNA的序列的RNA分子或轉(zhuǎn)錄與這些序列互補(bǔ)的RNA分子。這些轉(zhuǎn)錄的分子可任選地作標(biāo)記并用來與互補(bǔ)序列雜交如微陣列中的序列雜交,以檢測(cè)和任選地定量分離得到該,模板聚腺苷酸化RNA的細(xì)胞中不同序列的表達(dá)。或者,該轉(zhuǎn)錄的分子可用于產(chǎn)生標(biāo)記的cDNA分子以與陣列雜交。所任選在微陣上雜交的從模板聚腺苷酸化RNA擴(kuò)增的mRNA制備的cDNA和任選隨后的cDNA都是本發(fā)明的產(chǎn)品。
從模板聚腺苷酸化RNA制備的cDNA分子也可用于其它核酸分析方法中。非限制性例子包括通過使用特異性引物的PCR和定量或?qū)崟r(shí)PCR擴(kuò)增以測(cè)定或分析特定序列的表達(dá)水平。盡管擴(kuò)增可結(jié)合微陣列雜交一起進(jìn)行,但此方法不是“整體”的,因?yàn)镻CR方法需要利用1種或多種引物中的特定序列,選擇性擴(kuò)增一些序列用于分析。這些方法可用于測(cè)定鑒定為與下述結(jié)果相關(guān)的特定基因序列的表達(dá)水平。
另一方面,本發(fā)明結(jié)合使用了患有或懷疑患有關(guān)疾病或其它有害病況的受試者優(yōu)選人的固定組織樣品。優(yōu)選聯(lián)合采用患相同疾病或有害病況的受試者的樣品以鑒定基因序列的表達(dá)水平,與該疾病或其治療或其結(jié)果的一個(gè)或多個(gè)方面的相關(guān)性。隨時(shí)收集這種樣品且經(jīng)常與取樣后受試者的疾病、病況、治療和/或結(jié)果的詳細(xì)信息相關(guān)聯(lián)。這類信息的非限制性例子包括涉及收集樣品固定后受試者隨著時(shí)間推移所經(jīng)歷的診斷、預(yù)后、治療、對(duì)治療的反應(yīng)和/或?qū)嶋H結(jié)局。另外一方面,基因序列的表達(dá)水平可能與組織取樣前的受試者病況相關(guān)。非限制性例子包括預(yù)先存在的疾病或有害病況、疾病發(fā)作年齡、感染因子的感染、接觸突變?cè)椿蚨拘詣⒒蜻z傳障礙。這種相關(guān)性性質(zhì)上是回顧性的,與要發(fā)生的結(jié)局相關(guān)性相反,后者性質(zhì)是前瞻性的。此外,基因序列的表達(dá)水平可能與獲得樣品(用于測(cè)定基因表達(dá)水平)后受試者的疾病、病況、治療和/或結(jié)局的信息相關(guān)。因此,本發(fā)明可用于將基因表達(dá)與獲取樣品的受試者的回顧性以及前瞻性信息相關(guān)連??赏ㄟ^應(yīng)用基因表達(dá)水平與結(jié)局之間的相關(guān)性,利用這種相關(guān)性來產(chǎn)生一種模式以協(xié)助臨床診斷。
再一方面,本發(fā)明提供了將關(guān)于固定樣品的細(xì)胞中多個(gè)核酸序列的表達(dá)水平的信息編成數(shù)據(jù)結(jié)構(gòu)的方法。該數(shù)據(jù)結(jié)構(gòu)的任選地包埋在固體介質(zhì)或其它制備物中,例如但不限于計(jì)算機(jī)介質(zhì)或其它電子可讀介質(zhì)中可讀介質(zhì)中。該數(shù)據(jù)結(jié)構(gòu)的排列優(yōu)選能方便地使用表達(dá)水平的信息,用于解釋和利用表達(dá)水平信息的方法中和某疾病或其治療或結(jié)局的各方面中。可將基因表達(dá)水平與某疾病或其治療或結(jié)局各方面的相關(guān)性,作為相同數(shù)據(jù)結(jié)構(gòu)部分或作為不同的數(shù)據(jù)結(jié)構(gòu)保存。
本發(fā)明也提供了將這些相關(guān)性應(yīng)用于另一受試者樣品的基因表達(dá)信息,以鑒定所述樣品是否有相同表達(dá)水平和所述受試者是否可能患有相同疾病或易經(jīng)受相同治療或有其結(jié)局。另外受試者的這種樣品包括不固定的樣品,例如但不限于新鮮或冷凍樣品。這些其它樣品的表達(dá)水平信息不需通過實(shí)施本發(fā)明來獲得,而可使用其它方法,包括但不限于RT-PCR擴(kuò)增各基因序列和檢測(cè)表達(dá)序列所編碼蛋白質(zhì)的表達(dá)。這種解釋和應(yīng)用的方法任選采用計(jì)算機(jī)執(zhí)行。
這種數(shù)據(jù)結(jié)構(gòu)中的核酸表達(dá)信息優(yōu)選包括6個(gè)月到超過100年的1種或多種固定組織樣品的信息,優(yōu)選包括取樣受試者的固定后治療和/或結(jié)果的信息??蓪⒍嗝茉囌叩亩鄠€(gè)樣品的信息相關(guān)聯(lián),以鑒定與受試者的疾病或固定后治療和/或結(jié)避各方面相關(guān)的1種或多種基因序列的特異性表達(dá)水平。可全部或部分應(yīng)用此信息以構(gòu)成受試者的疾病或有害病況的所有或部分臨床含義或鑒定。也可用于預(yù)后估計(jì),如組織樣品中具有相同表達(dá)分布圖的其他受試者可能經(jīng)歷的結(jié)局。也可應(yīng)用此信息以利用1種或多種序列的表達(dá)水平,根據(jù)與該表達(dá)水平相關(guān)的診斷、預(yù)后、治療、對(duì)治療的反應(yīng)和/或?qū)嶋H結(jié)局來確定更大組的人群或亞群。也可根據(jù)與1種或多種序列的關(guān)聯(lián)用于鑒定某疾病或其治療的新方面,。
在本發(fā)明的另外一方面中,提供應(yīng)用或查詢此信息的方法,來鑒定含有另一受試者細(xì)胞的樣品,該受試者的表達(dá)水平相同,因而屬于一個(gè)人群或亞群。另一受試者的樣品不需固定,但可以是新鮮或冷凍樣品,作為非限制性例子。這些方法可任選地用計(jì)算機(jī)執(zhí)行以最大程度提高該信息的應(yīng)用效益,使表達(dá)水平與診斷、預(yù)后、治療、對(duì)治療的反應(yīng)和/或?qū)嶋H結(jié)局相關(guān)聯(lián)。這些方法在本發(fā)的臨床應(yīng)用中的優(yōu)點(diǎn)是能幫助醫(yī)生和其他治療和/或輔導(dǎo)病人的醫(yī)學(xué)人士。
附圖的簡(jiǎn)要說明
圖1顯示從福爾馬林固定1到8天的組織中提取的RNA,。
圖2A顯示從福爾馬林固定1、4或8天的組織樣品以及新鮮冷凍組織中擴(kuò)增的RNA,。圖2B顯示固定4天的組織樣品的另外結(jié)果。
圖3A顯示有約1-2年歷史的檔案FFPE樣品的RNA擴(kuò)增。圖3B顯示4個(gè)有6年歷史的檔案FFPE乳房核心活檢組織的RNA擴(kuò)增結(jié)果,。
圖4顯示有約1到4年歷史的膀胱癌FFPE樣品的RNA擴(kuò)增。
圖5顯示擴(kuò)增自FFPE樣品的2個(gè)獨(dú)立的RNA雜交信號(hào)強(qiáng)度散布圖。
圖6顯示FFPE和冷凍樣品的信號(hào)強(qiáng)度散布圖。
圖7顯示福爾馬林固定不同時(shí)間加熱去修飾后FFPE樣品的3’序列RNA擴(kuò)增的相對(duì)產(chǎn)量。
圖8顯示福爾馬林固定不同時(shí)間加熱去修飾后FFPE樣品的更長(zhǎng)3’序列RNA擴(kuò)增的相對(duì)產(chǎn)量,樣品在加熱去。
圖9顯示微陣列數(shù)據(jù)的比較,該陣列采用隨機(jī)引物或在缺乏隨機(jī)引物時(shí)制備cDNA制備的擴(kuò)增RNA,所產(chǎn)生。
完成本發(fā)明的模式本發(fā)明提供用福爾馬林固定(FF)和任選石蠟包埋(FFPE)的(常規(guī))臨床活檢組織的細(xì)胞的整體mRNA分布圖。換句話說,本發(fā)明提供對(duì)FF樣品細(xì)胞中整體mRNA表達(dá)的分析。本發(fā)明可用于測(cè)定活檢組織的細(xì)胞內(nèi)不同基因的表達(dá)以及用作細(xì)胞內(nèi)蛋白表達(dá)的指示物。
在一個(gè)實(shí)施方案中,本發(fā)明任選使用顯微解剖技術(shù)從福爾馬林固定組織樣品中分離細(xì)胞,接著采用RNA提取操作隨后擴(kuò)增mRNA以得到整體mRNA的表達(dá)分布圖。分離的細(xì)胞優(yōu)選是外觀不正常的細(xì)胞。也可分離正常細(xì)胞用作對(duì)照細(xì)胞。鑒定到的表達(dá)分布圖隨后可任選地用于鑒定基因序列,其表達(dá)可確定這些細(xì)胞的分子表達(dá)特征和它們所處的狀態(tài)。這種狀態(tài)包括但不限于疾病狀況、類型、狀態(tài)、階段和/或亞階段或亞類。在較佳實(shí)施方案中,可利用該特征(或表達(dá)水平)與取得該組織樣品受試者的病史漿料來鑒定細(xì)胞和含這種細(xì)胞的受試者對(duì)不同治療方案是敏感或者耐受。此信息可隨后用于指導(dǎo)(或使用更有效的治療方法)對(duì)另一受試者或病人(鑒定為具有相同特征的細(xì)胞)的治療。在其它實(shí)施方案中,此表達(dá)水平可與取得樣品的受試者的前瞻性漿料一起使用。
在本發(fā)明的一個(gè)具體示范例中,提供了獲得FFPE樣品的基因表達(dá)數(shù)據(jù)的方法,該方法包括(1)分離FFPE樣品中含細(xì)胞的部分,例如通過顯微解剖(例如但不限于激光顯微解剖)分離,(2)提提該樣品以收集含mRNA的組分,(3)任選地純化該mRNA,(4)擴(kuò)增該mRNA,任選采用以下方法,包括a.通過逆轉(zhuǎn)錄合成第一條DNA鏈,所用引物含聚(或寡)dT區(qū)和啟動(dòng)子部分,b.采用外源提供的隨機(jī)引物合成第二條鏈,c.從所述引物中存在的啟動(dòng)子(任選地通過所述第二條鏈的合成變成雙鏈)開始到產(chǎn)生所含序列與FFPE樣品的mRNA相互補(bǔ)的多拷貝RNA分子進(jìn)行體外轉(zhuǎn)錄,(5)通過IVT轉(zhuǎn)錄的RNA與含不同基因序列的微陣列雜交,分析樣品中的基因表達(dá)(用mRNA水平表示)。
實(shí)施本發(fā)明可采用各種本領(lǐng)域已知的方法固定和包埋的樣品。簡(jiǎn)言之,這些方法通常開始于獲自患有或懷疑患有疾病或其它有害病況病人的含細(xì)胞組織。組織樣品的非限制性例子包括核心活檢組織、取出的腫瘤組織和細(xì)胞學(xué)樣品。其它非限制性例子包括細(xì)針抽吸物(FNA)、針穿刺活檢組織和導(dǎo)管灌洗樣品。組織類型的非限制性例子包括胰腺、大腸、大腸癌、肌肉、膀胱、腎、肺、腦、淋巴瘤和多細(xì)胞生物體的任何其它組織。
將樣品迅速浸沒,在固定液,如具有蛋白交聯(lián)活性的溶液中,例如但不限于甲醛溶液、戊二醛溶液、甲醛-醇混合溶液、醇溶液、布安氏液、岑克爾氏液、Hely溶液、鋨酸溶液、卡諾氏液和其相等液。固定醇的非限制性例子包括乙醇和異丙醇。這優(yōu)選盡可能迅速地進(jìn)行以最大程度減少收集后和固定前可能發(fā)生的細(xì)胞變化。也應(yīng)保持組織和其中細(xì)胞的精細(xì)結(jié)構(gòu)。
固定劑優(yōu)選包含甲醛或多聚甲醛或固定組織樣品的其它制劑。優(yōu)選的固定劑包括緩沖甲醛液,如磷酸緩沖甲醛溶液,或其它的緩沖甲醛或多聚甲醛液??蓪⒐潭ǖ臉悠肪S持為“濕樣品”,認(rèn)為“濕樣品”是“濕檔案”的一部分,或任選地用包埋方法處理如石蠟或其它蠟像碳?xì)浠衔锇瘛km然可使用其它固定劑如丙酮、克拉克氏液、卡諾氏、戊二醛、含氯化汞的甲醛制劑、布安氏固定劑,但實(shí)施本發(fā)明優(yōu)選采用大量的檔案組織樣品,這些樣品用福爾馬林固定和石蠟包埋(FFPE)。固定劑可任選地含有鎂陽離子。
固定時(shí)間優(yōu)選16到48或72小時(shí),溫度約4℃到室溫??刹捎眉s16、約20、約24、約28、約32、約36、約40、約44、約48、約52、約56、約60、約64、約68和約72小時(shí)的時(shí)間來實(shí)施本發(fā)明?;蛘撸部刹捎眉s3、約4、約5、約7、約8、約9、約10、約12、約14和約15小時(shí)的更短時(shí)間。這種更短時(shí)間段可能對(duì)較小樣品更適合,如在FNA或針穿刺活檢組織樣品時(shí)??刹捎眉s4、約8、約12、約16、約20、約24和約26℃的溫度。本發(fā)明也可采用上述之外的其它樣品固定時(shí)間和溫度進(jìn)行,如4、5、6、7或8天。固定后用標(biāo)準(zhǔn)技術(shù)和包埋方法將樣品可包埋于石蠟中,然后貯存在本領(lǐng)域所用的條件下,如約4℃到室溫。
為實(shí)施本發(fā)明,固定和包埋樣品的時(shí)間優(yōu)選6個(gè)月到約100年,以使表達(dá)水平與取得樣品病人實(shí)際結(jié)局相關(guān)聯(lián)。顯然,時(shí)間少于6個(gè)月的樣品也可用于本發(fā)明的實(shí)施,但這種樣品中的表達(dá)水平也許不能與取得樣品的病人實(shí)際結(jié)局相關(guān)聯(lián),因?yàn)闀r(shí)間間隔短。然而,沒有相關(guān)結(jié)局信息的樣品的表達(dá)水平可用來與用本發(fā)明更老樣品產(chǎn)生的表達(dá)水平和相關(guān)結(jié)局作比較。
用于表達(dá)水平與實(shí)際結(jié)局相關(guān)連的優(yōu)選較老樣品是約6個(gè)月、約1年、約2年、約3年、約4年、約5年、約6年、約7年、約8年、約9年、約10年、約11年、約12年、約13年、約14年、約15年、約16年、約17年、約18年、約19年、約20年、約25年、約30年、約40年、約50年、約60年、約70年、約75年、約80年、約90年或約100年的樣品。
優(yōu)選在本發(fā)明中采用固定樣品的切片以保存固定樣品中的物質(zhì)作后續(xù)使用。切片也可如下所述與任選的顯微解剖聯(lián)合應(yīng)用。制備切片可采用任何切片技術(shù)和方法。在一個(gè)實(shí)施方案中,石蠟塊用切片機(jī)切成切片。優(yōu)選仔細(xì)清潔切片機(jī)以去除或減少外來核酸分子或核酸降解物質(zhì)污染的可能性。一個(gè)非限制性例子包括采用無危險(xiǎn)的賽璐璐(zylol)替代物與3%次氯酸鹽溶液來處理切片過程中聯(lián)用的塑料器皿。
任選但優(yōu)選用本領(lǐng)域已知方法使切片脫蠟,去除樣品中的石蠟塊。已知有各種脫蠟技術(shù)可采用任何適當(dāng)技術(shù)來實(shí)施本發(fā)明。這種方法包括但不限于用有機(jī)溶劑或試劑洗滌以溶解石蠟。合適溶劑的非限制性例子包括苯、甲苯、乙苯、二甲苯、D-檸檬油精、辛烷和它們的混合物。這些溶劑油優(yōu)選高純度,通常99%以上的純度。
用有機(jī)溶劑或試劑洗滌去除石蠟,接著去除溶劑或試劑。所用有機(jī)溶劑體積和必須的洗滌次數(shù)取決于樣品大小和待去除的石蠟量??上礈鞓悠?次到大約10次,或約2-4次。對(duì)于10μm組織樣品,有機(jī)溶劑典型體積是約500μL。也可采用其它脫蠟方法。
脫蠟后,樣品優(yōu)選再水合,如用遞減濃度的低級(jí)醇水溶液逐步洗滌。乙醇是再水合的優(yōu)選低級(jí)醇,雖然也可使用其它醇。非限制性例子包括甲醇、異丙醇和其它C1-C5醇。或者使樣品與醇溶液劇烈混合,再去除醇溶液。在一個(gè)實(shí)施方案中,醇濃度逐步降低,在約3-5步驟中從約100%降到約70%,每步減少約10%或更少,如經(jīng)過100%、95%、90%、80%、70%步驟。脫蠟和再水合也可用本領(lǐng)域已知的其它試劑進(jìn)行。
經(jīng)過或不經(jīng)過脫蠟,任選染色切片以顯現(xiàn)切片中的細(xì)胞,優(yōu)選采用不引起RNA損失的方法。蘇木精和曙紅(H&E)染色可用于本發(fā)明的一些實(shí)施方案中,特別是隨后采用任選的顯微解剖步驟來分離1種或多種單一細(xì)胞時(shí)。染色也能用于評(píng)價(jià)切片以確定是否需要根據(jù)污染細(xì)胞的存在與否進(jìn)行隨后的顯微解剖,優(yōu)選不用污染細(xì)胞來提取RNA。當(dāng)癌細(xì)胞中的基因表達(dá)時(shí)癌細(xì)胞樣品中存在的過量浸潤(rùn)性免疫細(xì)胞是最感興趣的需要使用顯微解剖分離癌細(xì)胞情況的一個(gè)非限制性例子。。
組織切片的顯微解剖可用任何適當(dāng)方法進(jìn)行。非限制性例子包括激光捕獲顯微解剖(LCM)或激光顯微解剖(LMD)。分離細(xì)胞的好處是能夠排除不相關(guān)的細(xì)胞類型,例如但不限于浸潤(rùn)性免疫細(xì)胞,以及排除其它來源和/或表型的細(xì)胞。顯微解剖可有利地用于實(shí)施本發(fā)明實(shí)踐,因?yàn)榭蓮墓潭ê桶窠M織樣品或切片中去污染的非疾病相關(guān)細(xì)胞(如浸潤(rùn)性淋巴細(xì)胞或其它免疫系統(tǒng)細(xì)胞)除以避免影響感興趣細(xì)胞中基因表達(dá)的測(cè)定。這種污染的非限制性例子存在于活檢組織被固定和隨后用于制備切片時(shí)。實(shí)施本發(fā)明優(yōu)選捕獲約100-1000個(gè)或更多細(xì)胞,然而也可用較少的細(xì)胞。
未脫蠟的顯微解剖樣品可任選用上述方法去除石蠟。
如本文所示,切片和顯微解剖都是抽提本發(fā)明所用細(xì)胞的RNA之前的任選步驟。本發(fā)明可采用各多種提取方法來實(shí)施,包括酸性硫氰酸胍/酚-氯仿抽提、蛋白酶K在不同溫度下消化不同時(shí)間、基于寡dT的層析、硫氰酸胍裂解然后結(jié)合于玻璃珠或其它硅膠基質(zhì)進(jìn)行抽提(參見參考文獻(xiàn)13-15)。然而,本發(fā)明也提供新的下述RNA提取方法。意外地發(fā)現(xiàn)此方法可提高從固定樣品中提取RNA的量和數(shù)量。
本發(fā)明還提供任選的加熱步驟,據(jù)信此步驟可去除核酸堿基通常由于甲醛固定而產(chǎn)生的修飾。然而,本發(fā)明不受此理論約束,提供的理論有助于理解本發(fā)明而不是限制本發(fā)明。理論上的修飾是以不同速度加入一個(gè)羥甲基(-CH2OH)基團(tuán)。此修飾的堿基改變了堿基配對(duì)能力,因此可能對(duì)本發(fā)明的任何一方面產(chǎn)生有害作用,例如在引發(fā)和核酸聚合反應(yīng),例如逆轉(zhuǎn)錄中,樣品中的RNA分子可能與其它核酸發(fā)生雜交。
具體說本發(fā)明采用了較長(zhǎng)的加熱時(shí)間,但不會(huì)使RNA分子有害降解。加熱優(yōu)選在70或約70℃進(jìn)行至少1小時(shí),優(yōu)選60分鐘以上,例如120或180分鐘,雖然也可采用多至8小時(shí)的時(shí)間。因此,加熱時(shí)間可從60分鐘以上到約75分鐘、約90分鐘、約105分鐘、約120分鐘、約135分鐘、約150分鐘、約165分鐘、約180分鐘、約4小時(shí)、約5小時(shí)、約6小時(shí)、約7小時(shí)或約8小時(shí)。最優(yōu)選采用加熱約3小時(shí),例如150-210或165-195分鐘??稍诟鞣N緩沖溶液中進(jìn)行,例如但不限于10mM Tris-HCl,pH8.0或左右。也可采用相當(dāng)?shù)囊宜峋彌_液。鑒于70℃加熱60分鐘時(shí)RNA發(fā)生降解和產(chǎn)量減少這種情況,意外地發(fā)現(xiàn)了可利用這種條件(參見Masuda等(6))。
本發(fā)明提供用聚或寡dT引物整體擴(kuò)增固定樣品中的細(xì)胞聚腺苷酸化RNA的方法。所用引物與mRNA分子的聚腺苷酸尾雜交而合成第一條cDNA鏈。這些鏈可較短約100-400個(gè)堿基,或可以較長(zhǎng),例如多至1-6千堿基。這反映了基于本領(lǐng)域所了解的令人驚訝的結(jié)果,即從固定樣品提了的mRNA的聚腺苷酸尾大都降解而不能通過聚或寡dT引物逆轉(zhuǎn)錄(參見Lewis等(5))。各種以dT為基礎(chǔ)的引發(fā)方法可用于本發(fā)明,其非限制性例子包括美國(guó)專利5,545,522、5,716,785和5,891,636所述的,其中進(jìn)行第二條cDNA鏈合成不用外源性引物。優(yōu)選的方法描述見出版的國(guó)際專利申請(qǐng)WO 02/052031(對(duì)應(yīng)于2001年12月21日提交的PCT/US01/50340)采用隨機(jī)引物來合成第二條cDNA鏈。
可利用cDNA直接分析基因表達(dá),例如但不限于與標(biāo)記的多核苷酸探針雜交或?yàn)榱藱z測(cè)進(jìn)行標(biāo)記然后與與探針雜交?;蛴肞CR技術(shù)擴(kuò)增后,然后檢測(cè)間接分析該cDNA?;蛘遚DNA可用于體外轉(zhuǎn)錄,所用方式的描述見國(guó)際專利申請(qǐng)WO02/052031。簡(jiǎn)言之,第一條cDNA鏈包含啟動(dòng)子序列的單鏈或雙鏈形式,通過與用于合成第一條cDNA鏈的聚dT或寡dT引物操作連接而引入??捎盟鰡?dòng)子起動(dòng)轉(zhuǎn)錄所得的雙鏈cDNA來產(chǎn)生mRNA轉(zhuǎn)錄物。這些轉(zhuǎn)錄物包含與聚腺苷酸化RNA互補(bǔ)的序列,用于產(chǎn)生cDNA。本發(fā)明的引物連接的啟動(dòng)子優(yōu)選T7啟動(dòng)子,但其它非限制性例子包括T3和SP6啟動(dòng)子。
在另一個(gè)IVT實(shí)施方案中,啟動(dòng)子序列可通過操作連接于隨機(jī)引物而引入,用于合成第二條cDNA鏈。可用所述啟動(dòng)子起動(dòng)轉(zhuǎn)錄所得的雙鏈cDNA來產(chǎn)生含聚腺苷酸化RNA序列的mRNA轉(zhuǎn)錄,用于產(chǎn)生cDNA。在上述二IVT實(shí)施方案之一中,通過與標(biāo)記的多核苷酸探針雜交或?yàn)榱藱z測(cè)進(jìn)行標(biāo)記,然后與探針雜交可直接分析轉(zhuǎn)錄(或擴(kuò)增)的RNA。也可通過PCR技術(shù)擴(kuò)增后間接分析轉(zhuǎn)錄的RNA,或轉(zhuǎn)變成cDNA進(jìn)行上述分析。后面的二種技術(shù)當(dāng)然有賴于采用與cDNA末端序列互補(bǔ)的引物。
在一個(gè)具體的較佳實(shí)施方案中,采用一部分?jǐn)U增的RNA來產(chǎn)生成偶聯(lián)有熒光染料的標(biāo)記cDNA,例如使用標(biāo)記的核苷酸。用第二種相容的熒光染料標(biāo)記參考品擴(kuò)增的RNA。使等量的2種標(biāo)記cDNA與一微陣列雜交,不同的核酸序列分別位于該微陣列的不同位置。雜交和洗滌后,掃描該微陣列并定量測(cè)定微陣列上各序列的雜交信號(hào)強(qiáng)度。標(biāo)準(zhǔn)化熒光強(qiáng)度后,表示為各擴(kuò)增的RNA與參考品擴(kuò)增的RNA的比值,代表各擴(kuò)增的RNA序列的基因表達(dá)水平。或者,擴(kuò)增的RNA在其產(chǎn)生時(shí)標(biāo)記它們。任選將標(biāo)記的擴(kuò)增RNA片段化與探針雜交,例如但不限于與微陣列上固定的探針雜交。可直接標(biāo)記RNA用于檢測(cè),如用熒光或放射性標(biāo)記的核苷酸標(biāo)記,或者間接標(biāo)記,如用生物素?;暮塑账針?biāo)記,它可通過熒光或放射性標(biāo)記的鏈霉親和物素檢測(cè)。因此,對(duì)應(yīng)于本發(fā)明擴(kuò)增的RNA的DNA和RNA分子可用作探針。間接標(biāo)記的另一種形式是使用丙烯胺使標(biāo)記物如熒光染料偶聯(lián)于核酸分子(示范例參見下面的實(shí)施例1)。
微陣列上的序列優(yōu)選FFPE樣品細(xì)胞中表達(dá)的不同基因序列的3’部分序列,用本發(fā)明方法分析。如技術(shù)人員所知,該3’部分最靠近聚腺苷酸化位點(diǎn),因而最可能被逆轉(zhuǎn)錄,從而可在實(shí)施本發(fā)明所得了cDNA中找到。
有關(guān)不同序列表達(dá)水平的信息,例如但不限于上述熒光強(qiáng)度的比值,可通過技術(shù)人員偏愛的合適介質(zhì)保存。在本發(fā)明的較佳實(shí)施方案中,可用磁或電子保存該信息,更優(yōu)選以計(jì)算機(jī)可讀形式保存。表達(dá)水平數(shù)據(jù)可作為原始數(shù)據(jù)或加工數(shù)據(jù)(例如但不限于標(biāo)準(zhǔn)化、修正,或以比值形式)或其組合保存。加工數(shù)據(jù)優(yōu)選用原始表達(dá)水平形式,將其轉(zhuǎn)變?yōu)闃悠犯骰蛐蛄械谋磉_(dá)值或表達(dá)指數(shù)。在較佳實(shí)施方案中,將該信息作為數(shù)據(jù)組和/或數(shù)據(jù)結(jié)構(gòu)保存。一個(gè)非限制性例子是保存為含存儲(chǔ)記錄的表格。表格式保存方法可視作數(shù)據(jù)域,其保存的信息如受試者標(biāo)識(shí)符(含有或沒有受試者的FF或FFPE樣品的不同序列表達(dá)水平的信息)和/或基因序列標(biāo)識(shí)符。這些標(biāo)識(shí)符也可用作各自領(lǐng)域的描述性名字。受試者標(biāo)識(shí)符和基因序列標(biāo)識(shí)符域都優(yōu)選命名為主要“鍵”,用于專一性地鑒別一記錄。本發(fā)明的表格式信息保存方法優(yōu)選對(duì)某疾病或有害病況具有特異性可保存在計(jì)算機(jī)可讀介質(zhì)中。它們也可以是一種數(shù)據(jù)結(jié)構(gòu)以支持本發(fā)明提供的專一性操作、“查尋”或應(yīng)用功能。
在本發(fā)明的一具體較佳實(shí)施方案中,將基因表達(dá)水平信息與獲得FF或FFPE樣品的供體的其它信息組合。受試者優(yōu)選病人,因而其它信息包括但不限于通常獲得的與醫(yī)學(xué)或臨床治療相關(guān)的信息。非限制性例子包括年齡、體重、身高、病史以及健康狀況和/或癥狀或疾病種類或獲得樣品時(shí)的狀態(tài)。又一個(gè)例子是獲自病理學(xué)家對(duì)樣品回顧的信息。后面的測(cè)試項(xiàng)目是與患有或懷疑患有疾病或其它有害病況的病人的相關(guān)性。此種額外的信息也可用上述表格式保存方法或用分開的保存方法保存。
當(dāng)可得到時(shí),其它信息也包括樣品分離后病人診斷和護(hù)理的信息。一般,這種信息通常保持在患者的時(shí)間病史中記錄了治療和結(jié)果(包括疾病進(jìn)一步發(fā)展、根除或減輕)以及醫(yī)生的注釋和/或觀察。后者的非限制性例子包括病人的異常遺傳組成病例、確定明確診斷或治療進(jìn)程的難處和/或異常疾病進(jìn)展,盡管進(jìn)行了治療。這種額外信息的其它非限制性例子包括病人的診斷和/或預(yù)后、所用的治療方法、病人和疾病對(duì)所述治療的反應(yīng)、所述治療是否有副作用、受試者死亡的原因和年齡、所述病人和疾病的其它結(jié)局。在本發(fā)明的具體較佳實(shí)施方案中,將所用治療方法和結(jié)果的信息與基因表達(dá)水平的信息相組合。
涉及結(jié)果的優(yōu)選信息是隨著時(shí)間推移收集的信息,包括但不限于關(guān)于疾病進(jìn)一步發(fā)展、根除或減輕、治療的成功或失敗、患者治療后的壽命的信息。此種額外信息也可用上述表格式保存方法或用分開的保存方法保存。或者,可與上述表格式保存方法相結(jié)合,通過引入接受對(duì)象(receiver object)中,接受對(duì)象與表格式保存方法組合使用。此種組合優(yōu)選保存在同一介質(zhì)中。
其它可能與基因表達(dá)水平相關(guān)的信息包括組織取樣時(shí)受試者的信息。非限制性例子包括先前存在的疾病如自身免疫疾病、有害的病況如過度炎癥和細(xì)菌、病毒或真菌感染。另外,可將收集樣品分離后受試者的相同類型信息相關(guān)連。這種數(shù)據(jù)性質(zhì)是前瞻性的,包括臨床試驗(yàn)的信息作為非限制性例子。因此,實(shí)施本發(fā)明可采用與FF或FFPE樣品分離時(shí)間相關(guān)的回顧性和前瞻性數(shù)據(jù)。或者,實(shí)施本發(fā)明可采用與RNA提取和cDNA制備時(shí)間相關(guān)的回顧性和前瞻性數(shù)據(jù)。
測(cè)定FF或FFPE樣品中不同基因序列表達(dá)水平的這種能力,提供了使表達(dá)水平與疾病或病人結(jié)果的時(shí)間信息相關(guān)聯(lián)的方法,因?yàn)镕F或FFPE樣品可用作與結(jié)局相關(guān)聯(lián)的時(shí)間參考點(diǎn)。FF或FFPE樣品保存時(shí)間長(zhǎng)到足以與疾病或病人結(jié)間的時(shí)間信息相組合,因此可打入檔案中,將基因表達(dá)與疾病進(jìn)展和結(jié)局相關(guān)聯(lián)。
本發(fā)明通過提供進(jìn)入所保存的整體基因表達(dá)數(shù)據(jù)的通道“解開了”該擋案,這與以各基因序列分析為基礎(chǔ)的其它各表達(dá)數(shù)據(jù)位(bits)相反。同時(shí)評(píng)估一個(gè)樣品中多種基因序列表達(dá)水平的這種能力使得可將這些水平的數(shù)據(jù)匯編成數(shù)據(jù)結(jié)構(gòu)用于隨后的應(yīng)用、分析和操作。
通常,匯編數(shù)據(jù)的方法是本領(lǐng)域已知的,但本發(fā)明提供了解FF或FFPE樣品的基因表達(dá)數(shù)據(jù)與本文所述受試者或病人的其它信息相組合的方法。本發(fā)明提供的方法和所得組合部分提供了產(chǎn)生疾病的分子模型以及預(yù)測(cè)模型的能力,有助于診斷和治療疾病。此種組合數(shù)據(jù)的產(chǎn)生和用途在下面作進(jìn)一步描述。
應(yīng)用或查詢與結(jié)局相關(guān)的基因表達(dá)水平的“分布圖”方法,包括對(duì)懷疑患有疾病受試者的診斷,全部或部分將獲自受試者的樣品的基因表達(dá)與本發(fā)明產(chǎn)生的1種或多種分布作比較。相同或類似的基因表達(dá)分布表明存在相同疾病。因此,該分布圖可視作確診疾病的一部分或作為區(qū)別性診斷排除其它疾病或有害病況的一種工具。該分布圖也可用作確定具有相同或類似細(xì)胞基因表達(dá)分布圖受試者1種或多種特征。這些特征包括本文所述不同結(jié)局以及尚待認(rèn)識(shí)的特征。
該分布圖也可用于確定受試者的治療方法,利用上述所得診斷來確定治療方法。另外,該分布圖可包括有效治療的指征,此指征以其樣品用于產(chǎn)生該分布圖的患者的治療結(jié)果為基礎(chǔ)。尋求或需要治療的患者樣品的相同或類似的基因表達(dá)分布表明,所用的治療方法將對(duì)其樣品用于產(chǎn)生該分布圖的患者有效。
本發(fā)明的分布圖也用于提供患病者的預(yù)后或咨詢信息。疾病結(jié)局的信息與本發(fā)明的基因表達(dá)水平相關(guān)聯(lián)后,可提供給組織樣品具有相同或類似基因表達(dá)水平的患者。
RNA提取可提取FFPE樣品的細(xì)胞RNA,方法采用酸性硫氰酸胍/酚-氯仿、蛋白酶K消化、基于寡dT的層析、硫氰酸胍裂解硅膠為基礎(chǔ)的介質(zhì)結(jié)合來提取(參見參考文獻(xiàn)13-15)。用蛋白酶K消化一般要有EDTA存在,常接著采用酚-氯仿提取步驟去除降解的蛋白質(zhì)類物質(zhì)和蛋白酶K,以分離RNA。本領(lǐng)域技術(shù)人員懂得,蛋白質(zhì)類物質(zhì)可通過無水酚相的存在與核酸,包括RNA分開,RNA則留在水相中。
本發(fā)明提供改進(jìn)的RNA提取方法,包括使用蛋白酶K,接著的變性采用含胍鹽的化合物,作為離液劑使污染的蛋白質(zhì)類物質(zhì)變性。然后與硅膠為基礎(chǔ)的不結(jié)合污染蛋白質(zhì)類物質(zhì)的基質(zhì)結(jié)合來分離RNA。這部分基于一個(gè)意外的發(fā)現(xiàn),即含胍鹽的使蛋的化合物白酶K變性從而將其去除來純化RNA。然后,可用常規(guī)方法從硅膠基質(zhì)中洗脫結(jié)合的RNA,用于后續(xù)操作。
含胍鹽的化合物非限制性例子包括異硫氰酸胍(GITC或硫氰酸胍,GSCN)和鹽酸胍。它們可與多種陰離子抗衡離子一起使用,合適的抗衡離子由技術(shù)人員選擇。本發(fā)明所用胍鹽溶液通常的濃度在約1-5M的范圍內(nèi),優(yōu)選約為4M;優(yōu)選緩沖液的pH值為3-6,更優(yōu)選pH4;合適的生化緩沖液如Tris-HCl。含胍鹽的溶液可任選含有1種或多種RNA酶抑制劑。
也可采用其它具有含胍鹽的化合物活性的離液劑,只要能從FFPE樣品中純化得到有效濃度的RNA,其量與用含胍鹽的化合物相同。這種試劑的非限制性例子包括尿素、甲酰胺、碘化鉀、硫氰酸鉀和其等價(jià)物。
蛋白酶K處理優(yōu)選在EDTA存在時(shí)進(jìn)行,優(yōu)選在約42℃或到60℃的溫度進(jìn)行至少8小時(shí),優(yōu)選至少16小時(shí),更優(yōu)選至少24小時(shí)。其它條件可以是適合RNA提取的任何條件。一個(gè)非限制性例子是10mM Tris-HCl,pH8.0或左右、2%SDS和100-500μg/ml蛋白酶K。
上述本發(fā)明的實(shí)施方案,其中用蛋白酶K處理樣品的固定細(xì)胞以制備細(xì)胞裂解液,在對(duì)核酸物質(zhì)進(jìn)行進(jìn)一步制備之前去除裂解物中的蛋白質(zhì)類物質(zhì)。除了使用上述酚或GITC去除蛋白質(zhì)來物質(zhì)的步驟外一個(gè)非限制性例子是使用能結(jié)合蛋白質(zhì)類物質(zhì)的陰離子、聚電解質(zhì)物質(zhì)和/或二價(jià)陽離子的水溶液。這種物質(zhì)可以是顆粒性質(zhì)和/或作為漿液應(yīng)用,如購自Ambion的漿液。去除蛋白質(zhì)類物質(zhì)后,樣品任選用DNA酶處理隨后用于RNA擴(kuò)增。如果采用任選的DNA酶,可在RNA擴(kuò)增步驟前使用蛋白質(zhì)類物質(zhì)的去除和/或變性步驟。
基因表達(dá)水平數(shù)據(jù)的產(chǎn)生和用途本發(fā)明方法獲得約FF或FFPE樣品的基因表達(dá)水平數(shù)據(jù),優(yōu)選將其組織在含有多個(gè)數(shù)據(jù)域的計(jì)算機(jī)可讀介質(zhì)的一個(gè)或多個(gè)數(shù)據(jù)域中。該數(shù)據(jù)優(yōu)選以表達(dá)值或指數(shù)的形式與樣品供者的其它數(shù)據(jù)相關(guān)聯(lián)??扇芜x的數(shù)據(jù)域地將組織成一個(gè)或多個(gè)數(shù)據(jù)組和/或一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu)。將數(shù)據(jù)域保存在所述計(jì)算機(jī)可讀介質(zhì)的可尋地址范圍中,可處理成為代表FFPE樣品的基因表達(dá)水平數(shù)據(jù)。
產(chǎn)生基因表達(dá)的數(shù)據(jù)優(yōu)選利用與其陣列,如本文所述微陣列的雜交。含核酸探針的不同基因序列各自位于微陣列的明確位置上。優(yōu)選將探針固定在微陣列上,代表不同基因或基因片段任選具有共同性。共同性的非限制性例子包括預(yù)期它們可在某給定細(xì)胞類型、組織或器官中表達(dá);在某種疾病狀態(tài)或有害病況中表達(dá);具有類似的生物功能;或都是其特定生物體的表達(dá)基因?;蛘撸瑢?shí)施本發(fā)明可采用能被某陣列,如獲自Illumina的陣列分類棟選的物質(zhì)。
已知有各種技術(shù)可用于制作微陣列,微陣列由各種密度安置的探針組成。非限制性例子包括每平方厘米中約10-500,000個(gè)探針(和基因序列)。這種微陣列的探針能與本文所述FF或FFPE樣品產(chǎn)生的標(biāo)記核酸分子雜交,。觀察到的與各探針雜交的強(qiáng)度,反映了FF或FFPE樣品中各序列的表達(dá)水平或數(shù)據(jù)。
通常對(duì)照樣品獲自已知來源和/或已知量的mRNA,測(cè)試樣品獲自本文所述FF或FFPE樣品的mRNA。對(duì)照樣品的一個(gè)非限制性例子是正常細(xì)胞,優(yōu)選獲自與測(cè)試樣品所用的同一FF或FFPE樣品,其含有非正常細(xì)胞??捎帽疚乃龊捅绢I(lǐng)域一般所用的顯微解剖方法能分離正常和非正常細(xì)胞。
對(duì)照和/或測(cè)試樣品與參比mRNA結(jié)合使用,例如用作微陣列實(shí)驗(yàn)之間對(duì)照的參比mRNA具有各種序列表達(dá)的1種或多種非零信號(hào)。非限制性例子包括購自Stratagene的人、大鼠和小鼠通用參比RNA。測(cè)試樣品可獲自患病病人或者曾用藥物或其它制劑治療者的FF或FFPE樣品。樣品也可以是對(duì)其特定治療或給藥方案有反應(yīng)和無反應(yīng)的腫瘤樣品。這種差異樣品中的基因表達(dá)水平也可彼此比較和與對(duì)照比較來評(píng)估,以鑒定與一個(gè)樣品相關(guān)的而與其它樣品不相關(guān)的基因表達(dá)水平。
優(yōu)選在相同條件下進(jìn)行各種樣品的雜交,在具體的較佳實(shí)施方案中將對(duì)照和測(cè)試樣品作不同標(biāo)記與同一微陣列雜交。優(yōu)選的標(biāo)記是熒光,例如但不限于購自Amersham的紅和綠(如Cy5和Cy3)單反應(yīng)染料,用于直接或間接標(biāo)記核酸分子。各雜交產(chǎn)生的數(shù)據(jù),無論作為原始雜交信號(hào)強(qiáng)度或是操作后的數(shù)據(jù),例如但不限于斑點(diǎn)滲濾、背景修正和/或標(biāo)準(zhǔn)化,可如上所述保存在計(jì)算機(jī)可讀介質(zhì)中。數(shù)據(jù)優(yōu)選保存為測(cè)試樣品強(qiáng)度與對(duì)照樣品(參比RNA)強(qiáng)度的標(biāo)準(zhǔn)化比值,雖然其它形式的加工數(shù)據(jù)也可使用,包括調(diào)整樣品中統(tǒng)計(jì)學(xué)變量的數(shù)據(jù)和原始表達(dá)水平數(shù)據(jù),以產(chǎn)生表達(dá)值或指數(shù)。優(yōu)選將數(shù)據(jù)載入數(shù)據(jù)域以促進(jìn)結(jié)果分析,與獲得FFPE樣品的與其它受試者的信息相比較。其它數(shù)據(jù)如各樣品上的數(shù)據(jù)、雜交條件和微陣列信息任選與上述數(shù)據(jù)一起保存。
雜交信號(hào)的強(qiáng)度優(yōu)選通過微陣列讀數(shù)器/分析儀測(cè)量。這通常用各種已知的硬件和軟件組分進(jìn)行,與雜交實(shí)驗(yàn)一起使用,微陣列讀數(shù)器/分析儀可輸出微陣列各位點(diǎn)或元件的原始或加工表達(dá)數(shù)據(jù)。數(shù)據(jù)可包括微陣列上各元件的熒光強(qiáng)度值。經(jīng)加工的數(shù)據(jù)能確定各基因序列的表達(dá)或不表達(dá),任選作為與對(duì)照相比的比值。任選地,任何表達(dá)水平可以多個(gè)位點(diǎn)的雜交數(shù)據(jù)為基礎(chǔ),這些位點(diǎn)具有對(duì)給定基因序列的相同或不同探針,如對(duì)某給定基因序列的多個(gè)探針。加工水平可在使用前取平均值。
可將基因表達(dá)數(shù)據(jù)與其它數(shù)據(jù)保存在相同或不同的文件中,其它數(shù)據(jù)例如但不限于微陣列上提供的基因序列的位置和身份、FF或FFPE供者信息、微陣列設(shè)計(jì)信息、生物信息、數(shù)據(jù)來源、FF或FFPE樣品信息、實(shí)驗(yàn)樣品的說明和其它實(shí)驗(yàn)數(shù)據(jù)及雜交信息。
表示為雜交信號(hào)強(qiáng)度(原始數(shù)據(jù))或表達(dá)指數(shù)(如原始強(qiáng)度的比值),的基因表達(dá)信息是“表達(dá)數(shù)據(jù)”,反映了FF或FFPE樣品內(nèi)各種基因序列的表達(dá)。表達(dá)數(shù)據(jù)可任選包括信息和一系列提醒以促進(jìn)其它信息的進(jìn)入,其它信息涉及實(shí)驗(yàn)數(shù)據(jù)、獲得該數(shù)據(jù)的FF或FFPE樣品、或獲得該樣品的受試者的信息。非限制性例子包括獲得樣品的受試者的結(jié)局?jǐn)?shù)據(jù),如受試者隨著時(shí)間推移所經(jīng)歷的診斷、預(yù)后、治療、對(duì)治療的反應(yīng)和/或?qū)嶋H結(jié)局。表達(dá)數(shù)據(jù)和提醒可以中貯存在計(jì)算機(jī)可讀介質(zhì)可尋址范圍內(nèi)的數(shù)據(jù)域形式。
含有表達(dá)數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)可任選進(jìn)一步包括“結(jié)果數(shù)據(jù)”對(duì)象(objet),它起著信息中心單元的作用,不僅包含表達(dá)數(shù)據(jù),也接受獲得FF或FFPE樣品因而獲得表達(dá)數(shù)據(jù)的自受試者的結(jié)果數(shù)據(jù)。此結(jié)果數(shù)據(jù)也可認(rèn)為是樣品供者的表型數(shù)據(jù),包括供者的年齡、人口統(tǒng)計(jì)和歷史;病史;診斷史;所用的治療和對(duì)治療的反應(yīng);死亡率;疾病復(fù)發(fā),包括復(fù)發(fā)時(shí)疾病形式的變化;及上述其它信息??蓪⒃摻Y(jié)果數(shù)據(jù)對(duì)象保存在可尋址范圍內(nèi),與表達(dá)數(shù)據(jù)分開,或保存在也保存了提供表達(dá)數(shù)據(jù)的數(shù)據(jù)域的可尋地址范圍內(nèi)。當(dāng)產(chǎn)生了結(jié)果數(shù)據(jù)對(duì)象時(shí),留出位置保存受試者所經(jīng)歷結(jié)果的表型信息。這是一種不同于僅保存結(jié)果信息的數(shù)據(jù)庫的方法,,因?yàn)樵摻Y(jié)果對(duì)象也包含了表達(dá)數(shù)據(jù)。它提供了以前沒有的優(yōu)點(diǎn),因?yàn)樵摻Y(jié)果對(duì)象可用于使表達(dá)數(shù)據(jù)與表型數(shù)據(jù)/結(jié)果相關(guān)聯(lián),以鑒定與1種或多種表型結(jié)果相關(guān)的特定基因序列的表達(dá)。它也允許該對(duì)象從一個(gè)位置或來源送到另一個(gè)位置或來源同時(shí)含有相關(guān)的1種或多種結(jié)果的所有信息。這些優(yōu)點(diǎn)使其應(yīng)用更容易、速度更快而同時(shí)最大程度減少了失信息的可能性。
產(chǎn)生該結(jié)果數(shù)據(jù)對(duì)象后,不難接受用戶或其它來源的各種表型和結(jié)果信息或數(shù)據(jù)。在一個(gè)較佳實(shí)施方案中,結(jié)果數(shù)據(jù)可經(jīng)電子引入??稍谌魏螘r(shí)候更新一個(gè)結(jié)果數(shù)據(jù)對(duì)象的表達(dá)數(shù)據(jù)。這種更新必然產(chǎn)生更新的結(jié)果數(shù)據(jù),任選能接受與該更新表達(dá)數(shù)據(jù)的來源相對(duì)應(yīng)來源的結(jié)果數(shù)據(jù)。這種更新的表達(dá)數(shù)據(jù)可接替和取代先前的表達(dá)數(shù)據(jù)。
用戶可將結(jié)果數(shù)據(jù)輸入到結(jié)果數(shù)據(jù)對(duì)象中,以響應(yīng)表達(dá)數(shù)據(jù)所顯示的結(jié)果信息的提醒??蓪⒔Y(jié)果信息以文本或數(shù)字形式保存在結(jié)果數(shù)據(jù)對(duì)象的適合接受和保存結(jié)果數(shù)據(jù)的數(shù)據(jù)域中。該結(jié)果數(shù)據(jù)對(duì)象也任選地允許用戶輸入另外信息,不限于結(jié)果信息。
收到結(jié)果數(shù)據(jù)后,可利用表達(dá)數(shù)據(jù)和結(jié)果數(shù)據(jù)使1種或多種基因序列與1種或多種結(jié)果相關(guān)聯(lián)。換句話說,使表達(dá)數(shù)據(jù)(如各種基因序列的表達(dá)指數(shù))與表型數(shù)據(jù)相關(guān)聯(lián),鑒定各個(gè)指數(shù)和基因序列與結(jié)果的相關(guān)性??蓪⒈磉_(dá)指數(shù)排列在數(shù)據(jù)矩陣中,如顯示各FF或FFPE樣品的各基因序列的各個(gè)指數(shù)的表格中。然后用各樣品的標(biāo)識(shí)符使樣品供者的表型數(shù)據(jù)與表達(dá)指數(shù)相關(guān)聯(lián)。此關(guān)聯(lián)方法也可描述為構(gòu)建模型或表達(dá)分布圖來解釋各樣品的表達(dá)指數(shù)與表型數(shù)據(jù)之間的相關(guān)性。本發(fā)明此方面可使用的兩種綜合模式方法是統(tǒng)計(jì)學(xué)模式和人工智能為基礎(chǔ)的模式。前者的非限制性例子包括邏輯回歸和分類樹??衫眠@些預(yù)測(cè)其特定表達(dá)指數(shù)是否能預(yù)示表型結(jié)局。后者的一個(gè)非限制性例子是神經(jīng)網(wǎng)絡(luò)。
模式的型建立可視作以表達(dá)指數(shù)和表型數(shù)據(jù)為基礎(chǔ)的有監(jiān)督的學(xué)習(xí),,它們可用作構(gòu)建模式或分布圖的一種培訓(xùn)組。優(yōu)選建立所得模式或分布圖用于最大程度減少誤差率,如通過增加置信/概率/可能性水平,在這些水平上的表達(dá)指數(shù)可定為預(yù)測(cè)性。這也可稱為模式或分布圖的最優(yōu)化,它也能導(dǎo)致表達(dá)指數(shù)包括結(jié)果預(yù)測(cè)指數(shù)的實(shí)際數(shù)字減少。本發(fā)明提供從相同的表達(dá)數(shù)據(jù)和表型數(shù)據(jù)構(gòu)建多種模式或分布圖的能力,所有的數(shù)據(jù)可最優(yōu)化,然后比較和進(jìn)行選擇用于可能的用途。
進(jìn)行模式的構(gòu)建和選擇優(yōu)選根據(jù)數(shù)據(jù)與待尋找的模式或分布圖的相關(guān)性或重要性的認(rèn)識(shí)通過應(yīng)用域知識(shí)來包括或排除數(shù)據(jù)。作為一個(gè)非限制性例子,認(rèn)識(shí)到基因序列“A”表達(dá)蛋白產(chǎn)物“a引物”,進(jìn)而控制基因序列“B”的表達(dá),將此認(rèn)識(shí)與模式構(gòu)建相關(guān)聯(lián)以便有可能調(diào)整該模型,用于說明“B”表達(dá)的增加或減少對(duì)應(yīng)于“A”表達(dá)相類似的增加或減少,而不是作為能與表達(dá)數(shù)據(jù)相關(guān)聯(lián)的獨(dú)立指數(shù)。域知識(shí)也稱為對(duì)數(shù)據(jù)分析技術(shù)優(yōu)選用于模式構(gòu)建重要性的認(rèn)識(shí)。作為一個(gè)非限制性例子,采用Person相關(guān)性(Person Product Moment Correlation)使基因表達(dá)指數(shù)與表型數(shù)據(jù)相關(guān)聯(lián),在許多情況中為線性關(guān)系。
可利用FF或FFPE樣品的其它表達(dá)數(shù)據(jù)和表型數(shù)據(jù)驗(yàn)證選擇后的模式或分布圖。作為一個(gè)非限制性例子,如果在模式構(gòu)建和選擇中,基因序列“X”的表達(dá)減少與24個(gè)月內(nèi)病人死亡相關(guān),可根據(jù)其預(yù)測(cè)樣品供者在24個(gè)月內(nèi)死亡表型結(jié)局的能力,如果樣品的基因序列“X”表達(dá)有相同減少而證實(shí)此模式。一旦得到證實(shí),可認(rèn)為與模式或分布圖依據(jù)特定基因表達(dá)指數(shù)可預(yù)測(cè)不同的表型結(jié)局。當(dāng)然,可利用引入現(xiàn)有培訓(xùn)組中的不同培訓(xùn)組或其它數(shù)據(jù)或者不同的選擇標(biāo)準(zhǔn)或應(yīng)用不同的域知識(shí)更新或改變?cè)撃J饺缓笤儆枰则?yàn)證。本發(fā)明產(chǎn)生的模式優(yōu)選是單基因序列或2-5或5-10個(gè)基因序列的表達(dá)水平能預(yù)測(cè)表型結(jié)局的模式,雖然一個(gè)模式中也可采用10-20、20-30、30-40、40-50或大于50個(gè)基因序列。
在本發(fā)明的較佳實(shí)施方案中,表達(dá)數(shù)據(jù)包括患有相同疾病、有害病況或生物狀態(tài)的。受試者的多個(gè)FF或FFPE樣品的基因表達(dá)信息。表型或結(jié)局?jǐn)?shù)據(jù)優(yōu)選用于產(chǎn)生該表達(dá)數(shù)據(jù)的FF或FFPE樣品的供者的1種或多種結(jié)局。
通過提供能促進(jìn)對(duì)本發(fā)明理解而不是限制本發(fā)明范圍的例子,待與表達(dá)數(shù)據(jù)相關(guān)聯(lián)的結(jié)局可以是癌癥對(duì)特定治療方案的反應(yīng)性,如乳癌對(duì)三苯氧胺的反應(yīng)。該結(jié)局可以是三苯氧胺治療開始后不同時(shí)間的疾病狀態(tài)(患病或無病)。此結(jié)乙數(shù)據(jù)可用于使1種或多種基因序列的表達(dá)水平(增加或減少)與治療開始后不同時(shí)間的三苯氧胺治療成功或失敗相關(guān)聯(lián)??衫么朔N相關(guān)性來鑒定1種或多種基因序列的表達(dá)水平(增加或減少),確定具有這種表達(dá)水平的和受益或不受益于三苯氧胺治療的患者人群。該人群也可視作患有對(duì)三苯氧胺敏感或耐藥性的乳癌人群。
可利用這種相關(guān)性來鑒定亞群,如其基因序列表達(dá)水平與三苯氧胺長(zhǎng)期或短期治療成功相關(guān)的患者。這些亞群也可視作有不同預(yù)期(或計(jì)劃)存活時(shí)間的患者人群。
另一個(gè)非限制性例子是使用50歲以上婦女的FFPE樣品(切除的活檢組織)的訓(xùn)練數(shù)據(jù),這些婦女是ER(+)、淋巴節(jié)(-)、腫瘤小于2cm(最大尺寸處)。優(yōu)選采用各組婦女的至少10個(gè)樣品;更優(yōu)選采用各組的至少15、至少20、至少25或至少50個(gè)樣品。這些婦將經(jīng)歷手術(shù)并給予三苯氧胺5年。這些婦女的一個(gè)亞群將會(huì)疾病復(fù)發(fā),另一個(gè)亞群不會(huì)。對(duì)疾病復(fù)發(fā)掃女性亞群構(gòu)建模式(基因表達(dá)分布圖)與不復(fù)發(fā)的婦女作比較,能夠鑒定到其表達(dá)能預(yù)示這群病人中乳癌復(fù)發(fā)或不復(fù)發(fā)的基因序列。本發(fā)明可提供發(fā)生或不發(fā)生復(fù)發(fā)的病人亞群。
如有經(jīng)驗(yàn)的醫(yī)師所知,上面的例子性質(zhì)上是示范性的,對(duì)其它藥物或治療方案的反應(yīng)可能是本發(fā)明應(yīng)用所關(guān)注的,治療方案包括但不限于放射治療或放射和化療的組合。另外,本發(fā)明此方面不限于分析治療結(jié)果。例如,與生存期望或轉(zhuǎn)移發(fā)生的相關(guān)性也可通過應(yīng)用本發(fā)明方法來實(shí)施。
因此,結(jié)果數(shù)據(jù)對(duì)象提供了一個(gè)包含的信息單元,用于分析和比較表達(dá)數(shù)據(jù)與結(jié)果數(shù)據(jù)。與該對(duì)象相類似的是其中可放置所有結(jié)果與表達(dá)相關(guān)性信息的文件夾或文件。該文件隨后可從一處或位置運(yùn)送到另一處,以分析其中的數(shù)據(jù)或引入另外的表達(dá)和/或結(jié)果數(shù)據(jù)。由于表達(dá)水平數(shù)據(jù)產(chǎn)生自本發(fā)明提供的FF或FFPE樣品中非選擇性聚腺苷酸化mRNA水平,該表達(dá)數(shù)據(jù)更完整并因此能更全面鑒定與結(jié)果相關(guān)聯(lián)的基因序列的表達(dá)水平。
采用結(jié)果數(shù)據(jù)對(duì)象也打開了多種選擇。如上所示,可利用該對(duì)象使基因表達(dá)水平與1種或多種結(jié)果相關(guān)聯(lián)以確定某基因的“表達(dá)分布圖”,包括與所述結(jié)果相關(guān)聯(lián)的基因表達(dá)水平。該“表達(dá)分布圖數(shù)據(jù)”代表了表達(dá)水平的范圍,任選以雜交信號(hào)強(qiáng)度形式或其比值形式或其它與結(jié)果相關(guān)的表達(dá)指數(shù)形式。。表達(dá)分布圖數(shù)據(jù)可任選包括信息和一系列的提醒以促進(jìn)其它信息的進(jìn)入,例如用于與表達(dá)分布圖作比較的樣品的表達(dá)水平,表達(dá)分布圖可用作預(yù)測(cè)模式。表達(dá)分布圖數(shù)據(jù)和提醒可以數(shù)據(jù)域形式保存于計(jì)算機(jī)可讀介質(zhì)的可尋址范圍中。此種介質(zhì)可與包含表達(dá)數(shù)據(jù)和結(jié)果數(shù)據(jù)對(duì)象的介質(zhì)相同或不同。
本發(fā)明也提供含有表達(dá)分布圖數(shù)據(jù)的計(jì)算機(jī)可讀介質(zhì)。它任選進(jìn)一步包括“分布圖數(shù)據(jù)”對(duì)象。該分布圖數(shù)據(jù)對(duì)象作用是信息的中心單元,不僅含有表達(dá)分布圖數(shù)據(jù),也接受測(cè)試樣品的表達(dá)數(shù)據(jù)。測(cè)試樣品可以是結(jié)果已知的FFPE樣品,用于測(cè)試驗(yàn)證該表達(dá)分布圖數(shù)據(jù)鑒定結(jié)果的能力。另外,測(cè)試樣品可以是患者或?qū)で笾委熣叩男迈r、冷凍、或最近的FF或FFPE組織樣品,來預(yù)測(cè)受試者的結(jié)果,或通過與該表達(dá)分布圖數(shù)據(jù)的比較提供不同治療方法效果的信息。
作為一個(gè)非限制性例子,本發(fā)明提供鑒定圖與乳癌不同階段,如非典型導(dǎo)管增生(ADH)、原位導(dǎo)管癌(DCIS)和浸潤(rùn)性導(dǎo)管癌(IDC)相關(guān)聯(lián)的基因表達(dá)分布圖的方法。與腫瘤各階段相關(guān)的表達(dá)分布圖數(shù)據(jù)可以是乳癌分布圖數(shù)據(jù)對(duì)象的一部分,該數(shù)據(jù)對(duì)象能接受患有或懷疑患有乳癌的病人測(cè)試樣品的表達(dá)數(shù)據(jù)。比較測(cè)試樣品的基因表達(dá)水平和該分布圖能確定病人有沒有上述乳癌階段之一或其組合??捎帽疚乃龅?整體)聚腺苷酸化mRNA擴(kuò)增或用PCR基因序列擴(kuò)增其表達(dá)與乳癌表達(dá)分布圖相關(guān)的基因序列產(chǎn)生測(cè)試樣品的表達(dá)數(shù)據(jù)。采用整體mRNA擴(kuò)增能使所得測(cè)試樣品的表達(dá)數(shù)據(jù)與其它表達(dá)分布圖作比較和分析。
分布圖數(shù)據(jù)對(duì)象可保存在可尋址范圍內(nèi),與表達(dá)分布圖數(shù)據(jù)分開,或保存在也保存了代表表達(dá)分布圖數(shù)據(jù)的數(shù)據(jù)域中的可尋址范圍內(nèi)。。當(dāng)產(chǎn)生了該分布圖數(shù)據(jù)對(duì)象時(shí),留出位置保存一個(gè)或多個(gè)測(cè)試樣品的表達(dá)水平數(shù)據(jù)。表達(dá)水平數(shù)據(jù)優(yōu)選接受到對(duì)象的適合這種接收并易與該表達(dá)分布圖數(shù)據(jù)作比較的一個(gè)或多個(gè)數(shù)據(jù)域中。這提供了根據(jù)基因表達(dá)水平和與FF和/或FFPE樣品擋案的相關(guān)性及與其相關(guān)的病史結(jié)局預(yù)測(cè)結(jié)局的能力。
產(chǎn)生分布圖數(shù)據(jù)對(duì)象后,不難接受用戶或其它來源的不同表達(dá)水平的信息或數(shù)據(jù)。在一個(gè)較佳實(shí)施方案中,測(cè)試樣品的表達(dá)水平數(shù)據(jù)用電子引入直接來自微陣列讀數(shù)器。分布圖數(shù)據(jù)對(duì)象的表達(dá)分布圖數(shù)據(jù)可在任何時(shí)候更新。這種更新必然產(chǎn)生更新的分布圖數(shù)據(jù)對(duì)象,它可接替和取代先前的對(duì)象。由于表達(dá)分布圖數(shù)據(jù)產(chǎn)生自反映本發(fā)明提供的非選擇性聚腺苷酸化mRNA水平的表達(dá)水平數(shù)據(jù),故該表達(dá)分布圖數(shù)據(jù)是更完整更全面的。因此,發(fā)明能提供其表達(dá)水平與其結(jié)果相關(guān)的多種基因序列。本發(fā)明也使得一些亞組的表達(dá)分布圖得到鑒定并與其它的結(jié)果相關(guān)聯(lián)。
在本發(fā)明的另一個(gè)實(shí)施方案中,該表達(dá)分布圖數(shù)據(jù)可采納到空白表格軟件程序中以回顧該分布圖數(shù)據(jù)并任選地與測(cè)試樣品的表達(dá)數(shù)據(jù)作比較和分析。優(yōu)選采納能分析表達(dá)數(shù)據(jù),與分布圖數(shù)據(jù)作比較的程序來確定與該表達(dá)數(shù)據(jù)相關(guān)的結(jié)果??衫没蜷_發(fā)其它分析模塊(軟件)來利用所采納的分布圖數(shù)據(jù),使結(jié)果與測(cè)試樣品相關(guān)聯(lián)。
因此,本發(fā)明提供了一種在介質(zhì)中,貯存了多個(gè)數(shù)據(jù)域、代表一種數(shù)據(jù)結(jié)構(gòu),如表達(dá)數(shù)據(jù)或表達(dá)分布圖數(shù)據(jù)計(jì)算機(jī)可讀介質(zhì),該介質(zhì)含有提供(表達(dá)或表達(dá)分布圖)數(shù)據(jù)的第一數(shù)據(jù)域,可將這些數(shù)據(jù)與輸入(結(jié)果數(shù)據(jù)或測(cè)試樣品表達(dá)數(shù)據(jù))信息相關(guān)聯(lián)或進(jìn)行分析,所述第一數(shù)據(jù)域貯存在所述計(jì)算機(jī)可讀介質(zhì)的可尋址范圍中;一個(gè)或多個(gè)接受項(xiàng)將接收所述輸入信息,各接受項(xiàng)保存在所述計(jì)算機(jī)可讀介質(zhì)的不同尋址范圍中,其中各接受項(xiàng)包含適合保存輸入與所述第一數(shù)據(jù)域相關(guān)的或用于分析的信息的數(shù)據(jù)域。
在另一實(shí)施方案中,第一數(shù)據(jù)域保存在接受對(duì)象之一所用的可尋址范圍中。此外,計(jì)算機(jī)可讀介質(zhì)可任選包括適于保存一個(gè)或多個(gè)提醒的提醒域,以引起輸入信息進(jìn)入,輸入信息可以是獲得FFPE樣品用于產(chǎn)生所述表達(dá)數(shù)據(jù)的患者的結(jié)局信息。
本發(fā)明的一個(gè)較佳實(shí)施方案是含基因表達(dá)分布圖的計(jì)算機(jī)可讀介質(zhì),包括保存在該介質(zhì)上的提供數(shù)據(jù)結(jié)構(gòu)多個(gè)數(shù)據(jù)域,包括至少一個(gè)提供保存在可尋址范圍中的表達(dá)分布圖數(shù)據(jù)的數(shù)據(jù)域,和分布圖數(shù)據(jù)接受對(duì)象,該接受對(duì)象可接收基因表達(dá)數(shù)據(jù)以與所述表達(dá)分布圖數(shù)據(jù)相關(guān)聯(lián)。該接受對(duì)象保存在不同的尋址范圍中或保存在也保存了所述至少一個(gè)數(shù)據(jù)域的地址中。該介質(zhì)可任選地包括適于保存一個(gè)或多個(gè)提醒提醒域中引起輸入信息進(jìn)入,輸入信息可以是病人組織樣品細(xì)胞的表達(dá)數(shù)據(jù)。
本發(fā)明還提供產(chǎn)生表達(dá)數(shù)據(jù)的系統(tǒng)和方法,用于包含在計(jì)算機(jī)可讀介質(zhì)中,該介質(zhì)任選地包含接受對(duì)象,該接受對(duì)象接收與所述數(shù)據(jù)相關(guān)聯(lián)的結(jié)果信息。本發(fā)明還提供使所述表達(dá)數(shù)據(jù)與所述結(jié)果信息相關(guān)聯(lián)的系統(tǒng)和方法,從而1種或多種基因序列的表達(dá)水平可與所述結(jié)果相關(guān)聯(lián)或相連系。此外,本發(fā)明提供產(chǎn)生與結(jié)果相關(guān)的基因表達(dá)分布圖的系統(tǒng)和方法,包含在計(jì)算機(jī)可讀介質(zhì)中。介質(zhì)任選地包含接受對(duì)象,以接收測(cè)試樣品的表達(dá)數(shù)據(jù),與所述基因表達(dá)分布圖作比較和分析。也提供用于所述比較和分析的系統(tǒng)和方法。本發(fā)明的系統(tǒng)和方法優(yōu)選用計(jì)算機(jī)執(zhí)行、任選地保存為計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可執(zhí)行指令。
如以下進(jìn)一步所解釋,本發(fā)明提供的數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組,包括與接受對(duì)象所接收信息一起使用的數(shù)據(jù)。本發(fā)明的實(shí)施方案包括產(chǎn)生所述數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組以及所述對(duì)象的方法。該數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組優(yōu)選直接或間接通過分析FF和/或FFPE樣品的聚腺苷酸化mRNA中反映的基因表達(dá)而產(chǎn)生。產(chǎn)生基因表達(dá)數(shù)據(jù)是發(fā)明的初始作用段。該作用可包括產(chǎn)生輸入信息的提醒以及產(chǎn)生接受對(duì)象來接收這種信息。本發(fā)明的一個(gè)關(guān)鍵特征是采用代表聚腺苷酸化mRNA水平的表達(dá)數(shù)據(jù),結(jié)合接受對(duì)象作為中央貯藏室。
收到輸入信息后,下一個(gè)作用段是使所述信息與表達(dá)數(shù)據(jù)中發(fā)現(xiàn)的1種或多種基因序列的表達(dá)水平相關(guān)聯(lián)。關(guān)聯(lián)結(jié)果可用作下一個(gè)作用段中其它數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組的數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組包括基因表達(dá)分布圖數(shù)據(jù),與一個(gè)或多個(gè)其它接受對(duì)象所接收的信息一起使用。產(chǎn)生所述數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)組的方法也包括在本發(fā)明的實(shí)施方案中作為本發(fā)明另一作用來實(shí)施。該作用可包括產(chǎn)生輸入信息的提醒以及產(chǎn)生接受對(duì)象來接收這種信息。本發(fā)明的一個(gè)關(guān)鍵特征是能夠利用該表達(dá)分布圖數(shù)據(jù)和測(cè)試樣品的輸入表達(dá)數(shù)據(jù)來預(yù)測(cè)獲得樣品受試者的結(jié)局。這種預(yù)測(cè)是根據(jù)FF和/或FFPE樣品與取樣后受試者的結(jié)局相關(guān)的表達(dá)數(shù)據(jù)(聚腺苷酸化mRNA水平)為基礎(chǔ)。
向用戶顯示的提醒或提醒序列可以是適合指導(dǎo)所請(qǐng)求信息進(jìn)入的任何提醒。涉及結(jié)果信息的非限制性例子所包括疾病或病況以及狀況的提醒,狀況可以是其亞類或階段;所用的治療方法;治療結(jié)果;隨著時(shí)間的疾病進(jìn)程;取樣后的存活時(shí)間(根據(jù)相關(guān)的死亡原因);后發(fā)疾病(例如原發(fā)性癌之后的轉(zhuǎn)移性癌)。涉及測(cè)試樣品表達(dá)數(shù)據(jù)信息的非限制性例子所包括表達(dá)數(shù)據(jù)(原始、加工或標(biāo)準(zhǔn)化);的提醒所用的微陣列和探針序列;懷疑的疾病或狀況;樣品類型和/或年齡。在一個(gè)實(shí)施方案中,這種提醒是向用戶顯示的文本域。一般,該提醒所請(qǐng)求的信息實(shí)際上僅受到與本文所述表達(dá)分布圖任務(wù)的相關(guān)性限制。因此,這種提醒可能請(qǐng)求多種信息。
如本文所述,接受對(duì)象允許接受的信息作相對(duì)于保存為該對(duì)象一部分的表達(dá)數(shù)據(jù)或表達(dá)分布圖數(shù)據(jù)的相關(guān)性分析。因此,接受對(duì)象包含了保存接受任何適當(dāng)信息所需的數(shù)據(jù)域。該接受對(duì)象或者可以是適于進(jìn)行本文所述相關(guān)性分析和/或其它比較功能的分析對(duì)象的一部分。另外,如果要使用分析模塊,該接受對(duì)象可包含允許這種分析模塊提取相關(guān)信息和分析或展示這種信息供用戶分析的信息。進(jìn)行分析優(yōu)選采用適于分析所接受信息或者與表達(dá)數(shù)據(jù)或表達(dá)分析數(shù)據(jù)作比較的任何類型的分析模塊。
在一個(gè)實(shí)施方案中,分析模塊是一種適合的空白表格軟件程序,它允許將所接受信息與所述數(shù)據(jù)相關(guān)聯(lián)、分析和/或作其它比較。作為一個(gè)非限制性例子,所述數(shù)據(jù)可包括多個(gè)能鑒定請(qǐng)求用于該數(shù)據(jù)的特異性信息項(xiàng)目的提醒。各提醒可代表空白表格軟件程序中的一行,可將接受自用戶的各條信息項(xiàng)目置于該空白表格軟件程序的一列中。一行可代表一特定結(jié)果,如疾病對(duì)其特定藥物治療的敏感性,而列代表用于產(chǎn)生待使用表達(dá)數(shù)據(jù)的各FFPE樣品的結(jié)果信息,。此時(shí)的分析模塊適合使結(jié)果信息與1種或多種基因序列表達(dá)水平相關(guān)聯(lián)以構(gòu)建本文所述的模式。
由于接受對(duì)象所接收的信息必須與該對(duì)象溝通,本發(fā)明的一些實(shí)施方案包括通過電子方式溝通信息的方法。這可通過任選地直接連接了電子裝置(例如但不限于含結(jié)果信息的數(shù)據(jù)庫或微陣列讀數(shù)器/分析儀/圖象處理器)的通信處理器進(jìn)行,,電子裝置包含待溝通的信息。
在本發(fā)明的另一個(gè)實(shí)施方案中,提供FF或FFPE表達(dá)信息處理系統(tǒng)。該系統(tǒng)優(yōu)選用計(jì)算機(jī)執(zhí)行包含數(shù)據(jù)域和數(shù)據(jù)結(jié)構(gòu)及任選的本文所述對(duì)象。該系統(tǒng)也優(yōu)選包含用于方法或過程的指令,加工獲自微陣列雜交的表達(dá)數(shù)據(jù)并將它保存在本文所述計(jì)算機(jī)可讀介質(zhì)中。
本發(fā)明的又一個(gè)實(shí)施方案是一種計(jì)算機(jī)可讀介質(zhì),它包含計(jì)算機(jī)保存表達(dá)數(shù)據(jù),如微陣列雜交表達(dá)數(shù)據(jù)的指令。這些指令優(yōu)選包括至少一個(gè)微陣列的表達(dá)信號(hào)強(qiáng)度所產(chǎn)生的表達(dá)數(shù)據(jù),和保存至少一個(gè)含該數(shù)據(jù)的數(shù)據(jù)組或結(jié)構(gòu)的指令。這些指令還任選地包括保存指令;保存原始或加工或標(biāo)準(zhǔn)化數(shù)據(jù)的指令;或用概括方法總結(jié)表達(dá)數(shù)據(jù)的指令。
本發(fā)明也提供一種系統(tǒng)來保存表達(dá)數(shù)據(jù)或表達(dá)分布圖數(shù)據(jù),包括一個(gè)或多個(gè)微陣列的雜交信號(hào)強(qiáng)度所產(chǎn)生的上述數(shù)據(jù)和/或保存所述產(chǎn)生的數(shù)據(jù)的方法。
用于實(shí)施本發(fā)明的優(yōu)選表達(dá)數(shù)據(jù)獲自患病或有害病況的受試者的FFPE樣品,,這些受試者的細(xì)胞有異常或改變的基因表達(dá)(包括對(duì)感染的反應(yīng),如細(xì)菌、分枝桿菌和真菌的反應(yīng))。非限制性例子包括癌癥、病毒感染、自身免疫疾病、關(guān)節(jié)炎、糖尿病和其它代謝疾病。
本文所用術(shù)語的定義如本文所用,“序列”或“基因序列”是由各別序號(hào)的核苷酸堿基組成的核酸分子或多核苷酸,該術(shù)語包括編碼分離產(chǎn)物的有序堿基(即“編碼區(qū)”),無論性質(zhì)是RNA或是蛋白質(zhì),以及包括“編碼區(qū)”之前或之后的有序堿基。后者的非限制性例子包括基因的5’和3’非翻譯區(qū)。認(rèn)為1種以上的多核苷酸能可編碼一種分離的產(chǎn)物。也認(rèn)為所示序列可能存在等位基因和多態(tài)性,可用于實(shí)施本發(fā)明來鑒定所示序列的表達(dá)水平或其等位基因或多態(tài)性。等位基因或多態(tài)性的鑒定部分取決于染色體位置和在有絲分裂期間重組的能力。
術(shù)語“使……相關(guān)”或“相關(guān)性”或其等價(jià)物指1種或多種序列的表達(dá)與細(xì)胞生理狀態(tài)間的關(guān)聯(lián)性,可用本文所述方法排除1種或多種其它狀態(tài)。本發(fā)明提供基因序列表達(dá)水平變化和結(jié)果與獲得FFPE樣品的受試者所經(jīng)歷治療之間的相關(guān)性。增加和減少易用非正常細(xì)胞與正常細(xì)胞中表達(dá)的比值形式表示,比值1(1)表明非正常細(xì)胞中的表達(dá)與正常細(xì)胞沒有差異,而比值2(2)和二分之一分別表明多兩倍和一半。正常和非正常細(xì)胞優(yōu)選來自同一FFPE樣品。表達(dá)水平不難通過下述定量方法測(cè)定。
“多核苷酸”是任何長(zhǎng)度核苷酸的聚合形式,是通過磷酸二酯鍵相連的核糖核苷酸或脫氧核糖核苷酸,包括本文所述給定序列的正鏈和該給定序列的互補(bǔ)鏈。此術(shù)語僅指分子的一級(jí)結(jié)構(gòu)。因此,此術(shù)語包括雙和單鏈DNA和RNA以及其含非磷酸二酯主鏈的類似物。它也包括已知類型的修飾,包含本領(lǐng)域已知的標(biāo)記、甲基化、“加帽”、用類似物取代一個(gè)或多個(gè)天然產(chǎn)生的核苷酸、核苷酸間修飾如不帶電的連接鍵(例如硫代磷酸酯、二硫代磷酸酯等)以及該多核苷酸的非修飾形式。
術(shù)語“擴(kuò)增”廣義用于指用DNA或RNA聚合酶酶產(chǎn)生一擴(kuò)增產(chǎn)物。如本文所用,“擴(kuò)增”一般指產(chǎn)生多個(gè)拷貝的所需序列特別是樣品的序列的過程?!皵U(kuò)增”也可用于DNA擴(kuò)增,其中細(xì)胞基因組內(nèi)的編碼序列拷貝增加?!岸嗫截悺敝钢辽?個(gè)拷貝。“拷貝”不一定指與模板序列互補(bǔ)或相同的完全序列。擴(kuò)增mRNA的方法通常是本領(lǐng)域已知的,包括逆轉(zhuǎn)錄PCR(RT-PCR)和本文所述的那些方法。
對(duì)應(yīng)的指一個(gè)核酸分子與另一個(gè)核酸分子共享有數(shù)量顯著的序列相同性。數(shù)量顯著指至少95%,通常至少98%更常至少99%相同,序列相同性可用BLAST算法測(cè)定,如Altschul等(1990),J.Mol.Biol.215403-410所述(用發(fā)表的默認(rèn)設(shè)置,即參數(shù)w=4,t=17)。另外,RNA可通過本領(lǐng)域已知方法直接標(biāo)記為對(duì)應(yīng)的cDNA,。
“微陣列”是優(yōu)選不連續(xù)區(qū)域的線性或二維陣列,各自具有在固相支持物表面形成的明確的區(qū)域,固相支持物例如但不限于玻璃、塑料或合成膜。一固相支持物表面待檢測(cè)的固定多核苷酸的總數(shù),確定了微陣列上不連續(xù)區(qū)域的密度,優(yōu)選至少約50/cm2,更優(yōu)選至少約100/cm2,甚至更加優(yōu)選至少約500/cm2或至少約1,000/cm2。在一些實(shí)施方案中,這種陣列至少含有總共不到500個(gè)、約1000個(gè)、約1500個(gè)、約2000個(gè)、約2500上或約3000個(gè)固定的多核苷酸。如本文所用,DNA微陣列是安置在芯片或其它表面上的寡核苷酸或多核苷酸的陣列,用于雜交樣品中擴(kuò)增的或克隆的多核苷酸。由于各特定探針組在陣列中的位置是已知的,故樣品多核苷酸的身份可根據(jù)它們與微陣列中特定位置的結(jié)合而確定。
由于本發(fā)明依賴序列的表達(dá)過量或不足的鑒定,本發(fā)明的一個(gè)實(shí)施方案包括通過樣品中的mRNA或其擴(kuò)增或克隆形式與已知序列的多核苷酸的雜交來測(cè)定表達(dá)。此類型的優(yōu)選多核苷酸包含其它人類序列中沒發(fā)現(xiàn)的某序列的至少約20個(gè)、至少約22、至少約24、至少約26、至少約28、至少約30、至少約32、至少約34、至少約36、至少約38、至少約40、至少約42、至少約44或至少約46個(gè)連續(xù)堿基。如前面句子子所用的術(shù)語“約”指比所述數(shù)值多一個(gè)或少一個(gè)。更長(zhǎng)的多核苷酸當(dāng)然可包含不影響與樣品中核酸雜交的小量錯(cuò)配(例如通過存在的突變)??蓸?biāo)記這種多核苷酸以協(xié)助其檢測(cè);或者,可標(biāo)記能與這種多核苷酸雜交的核酸。這種多核苷酸也可固定,如通過附著于固相支持物。
甚至更加優(yōu)選的多核苷酸含有人類基因組其它序列中沒有發(fā)現(xiàn)的某序列的。至少約50、至少約100、至少約150、至少約200、至少約250、至少約300、至少約350、至少約400、至少約450或至少約500個(gè)序列連續(xù)堿基。如前面句子中所用,術(shù)語“約”指比所述數(shù)值多或少10%。優(yōu)選的這種序列見于所表達(dá)mRNA的聚腺苷酸尾上游緊靠3’端的部分。這種多核苷酸當(dāng)然可包含不影響與樣品中核酸雜交的小量錯(cuò)配。
在本發(fā)明的另一個(gè)實(shí)施方案中,可擴(kuò)增和檢測(cè)所有或部分的所示序列,方法如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和其變體,例如但不限于定量PCR(QPCR)、逆轉(zhuǎn)錄PCR(RT-PCR)、實(shí)時(shí)PCR、任選的實(shí)時(shí)RT-PCR。這些方法采用與所示序列一些部分互補(bǔ)的1種或2種引物,其中引物用于引發(fā)核酸合成。任選地標(biāo)記新合成的核酸,可直接檢測(cè)或通過與本發(fā)明的多核苷酸雜交來檢測(cè)??墒剐潞铣傻暮怂嵩谠试S它們雜交的條件下接觸本發(fā)明的多核苷酸。
術(shù)語“標(biāo)記物”指能產(chǎn)生可檢測(cè)信號(hào)表明標(biāo)記分子存在的一種成分。適當(dāng)?shù)臉?biāo)記物包括放射性同位素、核苷酸生色團(tuán)、酶、底物、熒光分子、化學(xué)發(fā)光分子、磁性粒子、生物發(fā)光分子等。因此,標(biāo)記物是可通過光譜、光化學(xué)、生化、免疫化學(xué)、電學(xué)、光學(xué)或化學(xué)方法檢測(cè)的可檢測(cè)成分,。
“表達(dá)”和“基因表達(dá)”指核酸物質(zhì)如本發(fā)明序列的轉(zhuǎn)錄,以及轉(zhuǎn)錄序列被翻譯的可能性?;虮磉_(dá)的“水平”指表達(dá)量,表達(dá)量與對(duì)照或正常表達(dá)水平相比可增加或減少。雖然這種增加或減少不難通過mRNA產(chǎn)生的相對(duì)水平來測(cè)定,但減少也可通過顯示表達(dá)降低的序列的啟動(dòng)子狀態(tài)測(cè)定(如甲基化或其它失活類型)。
如本文所用,術(shù)語“包括”和其同源詞以它們所含意義使用,即等同于術(shù)語“包含”和其對(duì)應(yīng)的同源詞。
“允許”某事件發(fā)生的條件,或“適合”某事件如雜交、鏈延伸等發(fā)生的條件,或“適當(dāng)”的條件是不阻止這類事件發(fā)生的條件。因此,這些條件可允許、提高、促進(jìn)和/或有助于該事件的發(fā)生。本領(lǐng)域已知的和本文所述的這種條件取決于,例如核苷酸序列的性質(zhì)、溫度和緩沖液條件。這些條件也取決于需要何種事件,如雜交、切割、鏈延伸或轉(zhuǎn)錄。
如本文所用,序列“突變”指本文所述感興趣基因的序列與參比序列相比較的任何序列變化。序列突變包括由于例如取代、缺失或插入等機(jī)。所致的單個(gè)核苷酸的變化或序列中一個(gè)以上核苷酸的改變。單個(gè)核苷酸多態(tài)性(SNP)也是本文所用的一種序列突變。由于本發(fā)明根據(jù)的是序列表達(dá)的增加和減少,因此也可在實(shí)施本發(fā)明中測(cè)定基因編碼和非編碼區(qū)的突變。
“檢測(cè)”或“探測(cè)”包括任何檢測(cè)方法,直接和間接檢測(cè)基因表達(dá)和其變化。例如,可以直接或間接觀察到“可檢測(cè)到較少”的表達(dá)。該術(shù)語表示任何減少(包括缺乏可檢測(cè)信號(hào))。類似的,“可檢測(cè)到更多”產(chǎn)物指任何增加,無論是直接或是間接觀察到的。
寡dT和聚dT序列或引物指存在于多核苷酸中的至少約8個(gè)連續(xù)dT堿基。優(yōu)選約8-20、約21或約30個(gè)連續(xù)dT堿基。也可采用約30個(gè)以上的連續(xù)dT堿基。
隨機(jī)引物指采用隨機(jī)序列的至少約6個(gè)連續(xù)堿基作為合成核酸鏈的引物。引物優(yōu)選具有6、7、8、9或10個(gè)連續(xù)堿基。技術(shù)人員知道太短的引物不能與模板鏈穩(wěn)定雜交而引發(fā)多核苷酸聚合。太長(zhǎng)的引物可能不能充分迅速擴(kuò)散以引發(fā)足夠數(shù)量的互補(bǔ)序列合成。
“疾病”指活生物體或其組織或器官正常狀態(tài)發(fā)生的損害該生物體生理功能行為的變化。疾病可能因接觸環(huán)境因素(例如但不限于化學(xué)制劑或放射線)和感染因子(例如但不限于細(xì)菌、病毒或寄生蟲),生物體先天性缺陷(例如但不限于遺傳突變,可與環(huán)境因素聯(lián)合或在生物體生命的不同時(shí)間出現(xiàn))所致。疾病也可能是由于上述因素的聯(lián)合作用以及描述為一組相關(guān)疾病。后者的一個(gè)非限制性例子是所用的術(shù)語“乳癌”,指乳房組織中的一組癌癥疾病以及一組乳癌亞類疫病。
除非另有定義,本文所用全部技術(shù)和科學(xué)術(shù)語與本發(fā)明所屬領(lǐng)域普通技術(shù)人員通常理解的意義相同。除非另有說明,實(shí)施本發(fā)明將采用本領(lǐng)域技術(shù)范圍內(nèi)的分子生物學(xué)(包括重組技術(shù))、微生物學(xué)、細(xì)胞生物學(xué)、生化和免疫學(xué)的常規(guī)技術(shù)。這類技術(shù)在文獻(xiàn)中有充分說明,如《分子克隆實(shí)驗(yàn)室手冊(cè)》(Molecular CloningA Laboratory Manual),第2版(Sambrook等,1989);《寡核苷酸合成》(Oligonucleotide Synthesisi)(M.J.Gait編,1984);《動(dòng)物細(xì)胞培養(yǎng)》(AnimalCell Culture)(R.I.Freshney編,1987);《酶學(xué)方法》(Methods in Enzymology)(Academic Press,Inc.);《分子生物學(xué)當(dāng)前操作》(Current Protocols inMolecular Biology)(F.M.Ausubel等編,1987,定期更新);《PCR聚合酶鏈?zhǔn)椒磻?yīng)》(PCRThe Polymerase Chain Reaction)(Mullis等編,1994)。本發(fā)明所用的引物、寡核苷酸合和多核苷酸可用本領(lǐng)域已知的標(biāo)準(zhǔn)技術(shù)產(chǎn)生。
現(xiàn)已總體上描述了本發(fā)明,通過參考以下實(shí)施例不難理解本發(fā)明的內(nèi)容,闡述這些實(shí)施例不意味著限制本發(fā)明,除非有說明。
實(shí)施例1所選的材料和方法提取RNA前的蛋白酶K消化將5-10μm厚的福爾馬林固定石蠟包埋(FFPE)的組織切片置于磨砂載玻片上,經(jīng)歷脫蠟、H&E染色和脫水。制備完整切片的或用PixCell II系統(tǒng)(Arcturus,Mountain View,CA)獲得的約3000到5000個(gè)激光捕獲細(xì)胞的,組織裂解,用含有10mM Tris-HCl,pH8.0、RNA-級(jí)的蛋白酶K(100或500μg/ml,Invitrogen,Carlsbad,CA)、2%SDS(Invitrogen,Carlsbad,CA)的溶液42℃處理至少16小時(shí)。
逆轉(zhuǎn)錄為產(chǎn)生用于單獨(dú)定量RT-PCR分析或RNA擴(kuò)增的cDNA,將獲自樣品的去修飾RNA用寡dT或隨機(jī)引物逆轉(zhuǎn)錄,反應(yīng)液含50mM Tris-HCl、37.5mM KCl、1.5mM MgCl2、10mM DTT、0.5mM dNTP(Pharmacia,Piscataway,NJ)、40單位的RNA酶抑制劑(Promega,Madison,WI)、200單位的Superscript RT II(Invitrogen,Carlsbad,CA)。
RNA擴(kuò)增的簡(jiǎn)要示范例線性擴(kuò)增各RNA制品的mRNA組分,采用改良版本的RiboAmpTMRNA擴(kuò)增試劑盒(Arcturus,Mountain View,CA)。簡(jiǎn)言,各樣品的RNA用20納克含T7啟動(dòng)子序列的寡dT引物引發(fā),逆轉(zhuǎn)錄,然后用隨機(jī)引物轉(zhuǎn)變成雙鏈cDNA。然后該cDNA用途模板在體外轉(zhuǎn)錄反應(yīng),中用T7RNA聚合酶產(chǎn)生反義方向的擴(kuò)增RNA(aRNA)(其序列與用作cDNA合成模板的mRNA序列互補(bǔ))。進(jìn)行第二輪擴(kuò)增產(chǎn)生更多的aRNA,隨后用此aRNA作為模板制備熒光標(biāo)記的cDNA探針用于雜交。
探針標(biāo)記和微陣列雜交各樣品的一部分?jǐn)U增RNA用于cDNA標(biāo)記反應(yīng),采用5-(3-氨基烯丙基)-2’-脫氧尿苷-5’-三磷酸(氨基烯丙基-dUTP),和Fair Play試劑盒(Stratagene,LaJolla,CA)。將Cy3或Cy5單反應(yīng)染料(Amersham,Piscataway,NJ)偶聯(lián)于純化的cDNA上,用QiaQuick PCR純化柱(Qiagen,Valencia,CA)進(jìn)一步純化。為制備熒光標(biāo)記的cDNA,Cy5染料用于標(biāo)記各測(cè)試樣品的aRNA,Cy3染料用于標(biāo)記參比aRNA(通用的人參比RNA,Stratagene,La Jolla,CA)。將等量的純化Cy5-標(biāo)記的測(cè)試樣品cDNA與Cy3-標(biāo)記的參比cDNA與微陣列共雜交,40μl雜交溶液(5XSSC、0.1μg/μl COT-1DNA、0.2%SDS、50%甲酰胺)中包含多至22,000個(gè)特征,以25ng/μl的探針濃度在42℃進(jìn)行17小時(shí),濕度大于60%。
獲得表達(dá)數(shù)據(jù)雜交后,洗滌微陣列載玻片,掃描并定量測(cè)定雜交信號(hào)強(qiáng)度。斑點(diǎn)過濾/背景修正和標(biāo)準(zhǔn)化后,將Cy5和Cy3熒光強(qiáng)度表示為Cy5/Cy3的標(biāo)準(zhǔn)化比值,代表測(cè)試樣品相對(duì)于通用參比RNA的基因表達(dá)水平。
實(shí)施例2FFPE樣品中的RNA穩(wěn)定性和其擴(kuò)增5μm組織切片用福爾馬林固定1、4或8天,隨后石蠟包埋。給切片脫蠟,用分級(jí)乙醇再水合,然后用500μg/ml蛋白酶K在10mM Tris-HCl pH8.0;2%SDS中42℃處理4小時(shí)。
冷凍組織樣品用蛋白酶K類似消化作比較。
圖1顯示RNA凝膠電泳的結(jié)果,表明福爾馬林固定組織的RNA在福爾馬林固定1到8天的組織中保持完整。樣品一式二份跑電泳?!癕”表示RNA標(biāo)記物泳道。
圖2A顯示固定1、4或8天的組織樣品以及新鮮冷凍組織樣品的RNA擴(kuò)增結(jié)果。樣品用蛋白酶K消化,接著用含GITC的溶液提取并在硅膠柱上純化。如上所述擴(kuò)增RNA。泳道1-7分別含有RNA標(biāo)記物、第一天的FFPE、第一天的FFPE、第4天的FFPE、第8天的FFPE、第8天的FFPE和0小時(shí)/新鮮冷凍樣品。
圖2B顯示固定4天的組織樣品的RNA擴(kuò)增結(jié)果在6個(gè)泳道中的分析。第一泳道含RNA標(biāo)記物。
實(shí)施例3檔案乳腺癌FFPE樣品的RNA擴(kuò)增保存約1到2年的檔案FFPE乳腺核心活檢組織如上面實(shí)施例2所述進(jìn)行處理。下表1小結(jié)了樣品和其擴(kuò)增的RNA產(chǎn)量。結(jié)果示于圖3A,其中M表示RNA標(biāo)記物。
表1
圖3B顯示保存6年的4個(gè)檔案FFPE乳腺核心活檢組織的RNA擴(kuò)增結(jié)果。樣品作一式二份分析。下表2小結(jié)了樣品和其擴(kuò)增的RNA產(chǎn)量。“DCIS”指原位導(dǎo)管癌;“IDC”指浸潤(rùn)性導(dǎo)管癌。
表2
實(shí)施例4檔案膀胱癌FFPE樣品的RNA擴(kuò)增保存約1到4年的檔案FFPE人膀胱樣品如上面實(shí)施例2所述進(jìn)行處理。下表3小結(jié)了樣品和其擴(kuò)增的RNA產(chǎn)量。T1、Ta、HG、LG和CIS分別指表面浸潤(rùn)、原位乳突、高等級(jí)、低等級(jí)和原位平癌瘤(flat carcinoma in situ)。
結(jié)果示于圖4,其中M表示RNA標(biāo)記物。泳道1、4和15顯示亞適條件擴(kuò)增的結(jié)果。
表3
實(shí)施例5FFPE樣品中基因表達(dá)的一致性將病人的FFPE樣品用于2次獨(dú)立的激光捕獲顯微解剖(LCM),然后如實(shí)施例2所述分別進(jìn)行mRNA擴(kuò)增。用擴(kuò)增的RNA產(chǎn)生用于微陣列雜交的標(biāo)記cDNA,該微陣列含17296個(gè)寡核苷酸基因序列探針.2次獨(dú)立實(shí)驗(yàn)的各探針雜交信號(hào)強(qiáng)度(log)散點(diǎn)圖(scatter-plot)見圖5。僅148個(gè)基因(總數(shù)的0.8%)顯示在一式二份雜之交間的變化超過2倍變差??傁嚓P(guān)系數(shù)是0.96。
實(shí)施例6比較FFPE和冷凍樣品中的基因表達(dá)將同一病人活檢組織的FFPE和冷凍樣品切片,用于實(shí)施例2所述的mRNA擴(kuò)增,不用激光捕獲顯微解剖。用擴(kuò)增的RNA產(chǎn)生用于微陣列雜交的標(biāo)記cDNA。FFPE和冷凍樣品的微陣列各探針序列的雜交信號(hào)強(qiáng)度(log)散點(diǎn)圖見圖6。總相關(guān)系數(shù)是0.912。
用擴(kuò)增自福爾馬林中固定1、4或8天石蠟包埋切片的RNA進(jìn)行類似實(shí)驗(yàn),顯示了基因表達(dá)模式相似的重復(fù)性。這種樣品之間強(qiáng)度的相關(guān)性見表4。
表4
實(shí)施例7FFPE樣品中的RNA去修飾采用福爾馬林固定4或8天,然后石蠟包埋的FFPE樣品,作RNA提取,接著70℃去修飾不同時(shí)間。然后用RT-PCR擴(kuò)增這些樣品,所用引物可擴(kuò)增β肌動(dòng)蛋白mRNA聚腺苷酸位點(diǎn)上游的約110個(gè)堿基。擴(kuò)增的相對(duì)產(chǎn)量見圖7,其中3-8小時(shí)的去修飾時(shí)間得到良好產(chǎn)量。
這些樣品也通過RT-PCR擴(kuò)增,所用引物可擴(kuò)增β肌動(dòng)蛋白mRNA聚腺苷酸位點(diǎn)上游的約1000個(gè)堿基。擴(kuò)增的相對(duì)產(chǎn)量見圖8,其中3-8小時(shí)的去修飾時(shí)間得到良好產(chǎn)量。
采用包埋前福爾馬林固定1天的FFPE樣品觀察到類似結(jié)果。
實(shí)施例8RNA擴(kuò)增技術(shù)的比較采用福爾馬林固定24小時(shí)然后石蠟包埋組織的RNA制備總RNA用于實(shí)施例2所述擴(kuò)增。將總RNA轉(zhuǎn)變成雙鏈cDNA(在第一輪中),使用寡dT-T7引物,通過外源提供的隨機(jī)引物產(chǎn)生第二條cDNA鏈,或用“內(nèi)源性引發(fā)”產(chǎn)生第二條cDNA鏈,不用隨機(jī)引物。產(chǎn)物cDNA用于(“第一輪”)體外轉(zhuǎn)錄(IVT)以產(chǎn)生擴(kuò)增的RNA,用于在第二輪中產(chǎn)生cDNA,所用方法與第一輪相同。所得cDNA用于第二輪IVT,其中將生物素?fù)饺氲綌U(kuò)增的RNA產(chǎn)物中以產(chǎn)生aRNA探針,用作微陣列上的探針靶。
雜交前,使10-20生物素?;腶RNA片段化片段化,所用緩沖液含20mM Tris-乙酸,pH8.1、50mM KOAc、15mM MgOAc,將緩沖液加熱至95℃30分鐘,然后冷卻。隨后純化片段化的aRNA并以0.05μg/μl的濃度與微陣列45℃雜交16小時(shí),所用緩沖液含100mM MES、1M[Na+]、20mM EDTA、0.01%土溫-20、0.1mg/ml鯡精DNA、0.5mg/ml乙?;疊SA。所得散點(diǎn)圖見圖9,顯示了微陣列探針位置上的信號(hào)強(qiáng)度。X軸沒用隨機(jī)引物,Y軸用了隨機(jī)引物。相關(guān)系數(shù)r是0.9173787,表明2種方法都能擴(kuò)增FFPE樣品的RNA用于本發(fā)明。
參考文獻(xiàn)1.Beer等,Gene Expression profiles predict survival of patients with lungadenocarcinoma.,Nat.Med.,8,816-824,2002.
2.Wigle等,Molecular Profiling of Non-Small Lung Cancer and Correlation withDisease-free Survival.Cancer Res.,62,3005-3008,2002.
3.Emmert-Buck等,Laser Capture Microdissection.Science,274,998-1001,1996.
4.Karsten等,An evaluation of tyramide signal amplification and archived fixed andfrozen tissue in microarray gene expression analysis.Nucleic Acid Research,30,E4,20025.Lewis等,Unlocking the archive-gene expression in paraffin-embedded tissue.J.Pathology,195,66-71,20016.Lehmann等,Real-time PCR analysis of DNA and RNA extracted from formalin-fixed and paraffin-embedded biopsies.Methods,25,409-418,2001
7.Feldman,Reaction of formaldehyde with nucleotides and ribonucleic acid,Biochimica Et Biophysica Acta,149,20-34,19678.Specht等,Quantitative gene expression analysis in microdissected archivalformalin-fixed and paraffin-embedded tumor tissue.American J.Pathology,158,419-429,20019.Cohen等,Laser microdissection and gene expression analysis on formaldehyde-fixed archival tissue.Kidney International,61,125-132,2002.
10.Masuda等,Analysis of chemical modification of RNA from formalin-fixedsamples and optimization of molecular biology applications for such samples.NucleicAcid Research,27,4436-4443,1999.
11.Danenverg等,USP 6,428,963.
12.Wang等,USP 5,672,696.
13.Chomczynshi等,Single-step method of RNA isolatin by acid guanidiniumthiocyanate-phenol-chloroform extraction.Anal.biochem.162,156-159,1987.
14.Houze等,Sonification as a means of enhancing the detection of gene expressionlevels from formalin-fixed,paraffin-embedded biopsies.Biotechniques 21,1074-1082,1996.
15.Su等,High-throughput RT-PCR analysis of multiple transcripts using amicroplate RNA isolation procedure.Biotechniques 6,1107-1113,1997.
16.Crino等,Embryonic neuronal markers in tuberous sclerosissingle-cellmolecular pathology.Proc.Natl.Acad.Sci.,USA 93,14152-14157,1996.
本文引用的所有文獻(xiàn)的內(nèi)容納入本文供參考,無論以前是否已特定納入過。如本文所用,術(shù)語“一個(gè)”、“一種”和“任何”各自都包括單數(shù)和復(fù)數(shù)形式。
現(xiàn)已充分描述了本發(fā)明,本領(lǐng)域技術(shù)人員懂得可在廣泛范圍的同等參數(shù)、濃度和條件內(nèi)進(jìn)行本發(fā)明,而不背離本發(fā)明的精神和范圍無需過多實(shí)驗(yàn)。雖然已結(jié)合具體實(shí)施方案描述了本發(fā)明,將會(huì)理解可對(duì)本發(fā)明進(jìn)一步修改。此專利申請(qǐng)涵蓋遵循于發(fā)明原理,包括那些脫離本說明書的對(duì)本發(fā)明作的任何變化、應(yīng)用或改編,如在本發(fā)明所屬領(lǐng)域內(nèi)已知的或常規(guī)實(shí)踐的范圍中和可應(yīng)用于上文所列的基本特征。
權(quán)利要求
1.一種合成FFPE樣品細(xì)胞的聚腺苷酸化RNA的cDNA的方法,其特征在于,該方法包括a)提取所述細(xì)胞中的所述RNA;b)在能導(dǎo)致合成與所述提取的RNA互補(bǔ)的第一條cDNA鏈的條件下使所述提取的RNA接觸含寡dT序列的引物。
2.如權(quán)利要求1所述的方法,其特征在于,該方法還包括約70℃加熱提取自所述細(xì)胞的所述RNA,然后使所述RNA接觸所述引物。
3.如權(quán)利要求1所述的方法,其特征在于,從所述細(xì)胞提取RNA包括從所述樣品獲得所述細(xì)胞;用蛋白酶K消化所述細(xì)胞產(chǎn)生成消化物質(zhì);使該消化物質(zhì)接觸含胍鹽的化合物產(chǎn)生混合物;使該混合物接觸硅膠基質(zhì)使RNA結(jié)合該基質(zhì);去除未結(jié)合物質(zhì)后洗脫得到結(jié)合的RNA。
4.如權(quán)利要求2或3所述的方法,其特征在于,所述加熱約3-8小時(shí)。
5.如權(quán)利要求4所述的方法,其特征在于,所述加熱約3小時(shí)。
6.如權(quán)利要求1所述的方法,其特征在于,該方法還包括用隨機(jī)引物合成第二條cDNA鏈。
7.如權(quán)利要求1所述的方法,其特征在于,該方法還包括不用隨機(jī)引物合成第二條cDNA鏈。
8.如上述任一項(xiàng)權(quán)利要求所述的方法,其特征在于,所述引物可操作性連接于啟動(dòng)子序列。
9.如權(quán)利要求6所述的方法,其特征在于,所述隨機(jī)引物是六聚體、七聚體、八聚體或九聚體。
10.如權(quán)利要求2所述的方法,其特征在于,提取所述細(xì)胞的RNA包括從所述樣品獲得所述細(xì)胞;用蛋白酶K消化所述細(xì)胞主生消化物質(zhì);使該消化物質(zhì)接觸含胍鹽的化合物產(chǎn)生混合物;使該混合物接觸硅膠基質(zhì)使RNA結(jié)合該基質(zhì);去除未結(jié)合物質(zhì)后洗脫得到結(jié)合的RNA。
11.如權(quán)利要求10所述的方法,其特征在于,所述加熱約3到約-8小時(shí)。
12.如權(quán)利要求11所述的方法,其特征在于,所述加熱約3小時(shí)。
13.一種診斷病人的方法,其特征在于,該方法包括獲得所述病人的一個(gè)或多個(gè)細(xì)胞的基因表達(dá)數(shù)據(jù),將所述數(shù)據(jù)與一個(gè)或多個(gè)FFPE樣品的基因表達(dá)數(shù)據(jù)所產(chǎn)生的基因表達(dá)分布圖作比較,診斷所述病人患有所述基因表達(dá)分布所確定的疾病。
14.如權(quán)利要求13所述的方法,其特征在于,所述基因表達(dá)分布圖通過擴(kuò)增所述FFPE樣品的聚腺苷酸化mRNA而產(chǎn)生。
15.一種含有表現(xiàn)為數(shù)據(jù)結(jié)構(gòu)的基因表達(dá)分布圖的計(jì)算機(jī)可讀介質(zhì),其特征在于,所述介質(zhì)具有貯存在該介質(zhì)中的多數(shù)數(shù)據(jù)域,并包括表現(xiàn)為待分析基因表達(dá)分布圖數(shù)據(jù)的第一數(shù)據(jù)域,所述第一數(shù)據(jù)域貯存在所述計(jì)算機(jī)可讀介質(zhì)的可尋址范圍中;一個(gè)或多個(gè)接受對(duì)象,這種接受對(duì)象會(huì)接收測(cè)試樣品的表達(dá)數(shù)據(jù)以用所述基因表達(dá)分布圖數(shù)據(jù)分析,各接受對(duì)象保存在所述計(jì)算機(jī)可讀介質(zhì)的不同可尋址范圍中,其中各接受對(duì)象包含適合于保存輸入信息的數(shù)據(jù)域,用于與所述第一數(shù)據(jù)域相關(guān)聯(lián)或分析。
16.如權(quán)利要求15所述的介質(zhì),其中所述第一數(shù)據(jù)域保存在所述一個(gè)或多個(gè)接受對(duì)象之一所使用的可尋址范圍中。
17.如權(quán)利要求15所述的介質(zhì),其中所述介質(zhì)還包括提醒域,該提醒域適合于保存一個(gè)或多個(gè)數(shù)據(jù)提醒以引起測(cè)試樣品表達(dá)數(shù)據(jù)進(jìn)入。
18.如權(quán)利要求15所述的介質(zhì),其中所述測(cè)試樣品的表達(dá)數(shù)據(jù)獲自病人樣品所含的組織細(xì)胞。
19.如權(quán)利要求15所述的介質(zhì),其中所述基因表達(dá)分布圖數(shù)據(jù)得自擴(kuò)增,一個(gè)或多個(gè)FFPE樣品中的聚腺苷酸化mRNA。
20.一種使FFPE樣品的基因表達(dá)數(shù)據(jù)與獲得所述樣品的受試者所經(jīng)歷疾病或治療結(jié)局相關(guān)聯(lián)的系統(tǒng),其特征在于,該系統(tǒng)包括通過擴(kuò)增所述FFPE樣品的聚腺苷酸化mRNA產(chǎn)生所述基因表達(dá)數(shù)據(jù)的方法,;鑒定與所述受試者所經(jīng)歷的至少1種疾病或治療結(jié)局相關(guān)聯(lián)的1種或多種基因表達(dá)水平的方法。
全文摘要
本發(fā)明提供涉及從固定和包埋的組織樣品產(chǎn)生基因表達(dá)數(shù)據(jù)及其用途的方法和組合物。此種數(shù)據(jù)可用電子方法保存和執(zhí)行以及用于促進(jìn)疾病的診斷和治療。
文檔編號(hào)C12Q1/68GK1714157SQ200380103222
公開日2005年12月28日 申請(qǐng)日期2003年10月10日 優(yōu)先權(quán)日2002年10月11日
發(fā)明者M·G·厄蘭德, R·薩倫卡 申請(qǐng)人:阿克丘勒斯生物科學(xué)股份有限公司