用于內(nèi)分泌治療下的乳腺癌復(fù)發(fā)預(yù)測(cè)的方法
【專利摘要】本發(fā)明涉及用于乳腺癌疾病結(jié)果的預(yù)后的方法、試劑盒和系統(tǒng),所述方法包括:(a)確定來自所述患者的腫瘤樣品中以下9個(gè)基因中的至少2個(gè)的RNA表達(dá)水平:UBE2C、BIRC5、RACGAP1、DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP;(b)數(shù)學(xué)地組合在該腫瘤樣品中確定的所述組基因的表達(dá)水平值,從而得出組合得分,其中所述組合得分指示所述患者的預(yù)后;以及實(shí)施所述方法的試劑盒和系統(tǒng)。
【專利說明】
用于內(nèi)分泌治療下的乳腺癌復(fù)發(fā)預(yù)測(cè)的方法
[0001] 本申請(qǐng)為2012年09月28日提交的名稱為"用于內(nèi)分泌治療下的乳腺癌復(fù)發(fā)預(yù)測(cè)的 方法"的中國(guó)專利申請(qǐng)No. 201180016811.5的分案申請(qǐng)。本申請(qǐng)要求2010年03月31日提交的 歐洲專利申請(qǐng)No. 10158561.0的優(yōu)先權(quán)。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及用于乳腺癌疾病結(jié)果的預(yù)后的方法、試劑盒和系統(tǒng)。更具體而言,本發(fā) 明涉及基于乳腺癌患者的腫瘤樣品中標(biāo)記基因表達(dá)水平的測(cè)定對(duì)乳腺癌的預(yù)后。
【背景技術(shù)】
[0003] 在西方國(guó)家,乳腺癌是婦女癌癥死亡的主要原因之一。更具體來說,僅在美國(guó),乳 腺癌每年奪走約40000名婦女的生命,并且每年約有200,000名婦女被診斷出患有乳腺癌。 在過去幾十年中,輔助性全身療法已經(jīng)大幅提升了早期乳腺癌的存活率。這種臨床經(jīng)驗(yàn)使 得大家一致推薦給絕大多數(shù)的乳腺癌患者(EBCAG)提供輔助性全身治療。在乳腺癌的治療 中,除了常規(guī)進(jìn)行腫瘤的手術(shù)切除和隨后的腫瘤床放療外,還有多種治療選擇可以應(yīng)用。三 種主要的、概念上不同的策略是內(nèi)分泌治療、化學(xué)治療和使用靶向治療劑的治療。采用內(nèi)分 泌藥物的治療的先決條件是腫瘤組織中激素受體的表達(dá),即雌激素受體、孕激素受體或者 兩者的表達(dá)。當(dāng)在大量患者群組(cohort)中測(cè)試時(shí)具有不同的作用模式和疾病結(jié)果差異的 幾種內(nèi)分泌藥物是可用的。他莫昔芬是過去三十年中內(nèi)分泌治療的主要藥物。大量的臨床 試驗(yàn)表明,他莫昔芬顯著地降低了腫瘤復(fù)發(fā)的風(fēng)險(xiǎn)。另一種治療選擇基于屬于新的一類內(nèi) 分泌藥物的芳香酶抑制劑。不同于作為雌激素結(jié)合的競(jìng)爭(zhēng)性抑制劑的他莫昔芬,芳香酶抑 制劑阻斷了雌激素本身的產(chǎn)生,從而降低了對(duì)雌激素受體陽性腫瘤細(xì)胞的生長(zhǎng)刺激。然而, 有些患者盡管接受了內(nèi)分泌治療但會(huì)經(jīng)歷復(fù)發(fā),尤其是這些患者可能受益于其他治療藥 物。在雌激素受體陽性以及雌激素受體陰性的患者中,已經(jīng)證明使用蒽環(huán)類抗生素、紫杉烷 類和其他藥物的化學(xué)治療可以有效減少疾病的復(fù)發(fā)。NSABP-20研究在淋巴結(jié)陰性雌激素受 體陽性患者中比較了單獨(dú)的他莫昔芬和他莫昔芬加上化學(xué)治療,表明聯(lián)合治療要比單獨(dú)的 他莫昔芬更有效。然而,比較了單獨(dú)的他莫昔芬和他莫昔芬加上化學(xué)治療的IBCSG IX研究 卻未能表明添加細(xì)胞毒性藥物有任何顯著的益處。最近,已經(jīng)表明全身施用的抗腫瘤細(xì)胞 表面上HER2/neu抗原的抗體可以使過表達(dá)Her2neu的腫瘤患者的復(fù)發(fā)風(fēng)險(xiǎn)降低數(shù)倍。然而, 大部分(即使不是所有的)不同藥物治療都有許多潛在的副作用,可能會(huì)嚴(yán)重影響患者的生 活質(zhì)量(Shapiro和Recht,2001 ;Ganz等人,2002)。這使得必須在對(duì)個(gè)體患者進(jìn)行認(rèn)真的風(fēng) 險(xiǎn)評(píng)估的基礎(chǔ)上選擇治療策略以避免過度治療以及不足的治療。由于化學(xué)治療的益處在以 缺乏HER2/neu和雌激素受體表達(dá)為特征的HER2/neu陽性腫瘤(基底型)中比在HER2/neu陰 性和雌激素受體陽性腫瘤(管腔型)中相對(duì)較大,最具有挑戰(zhàn)性的治療決定涉及管腔型腫 瘤,針對(duì)管腔型腫瘤的典型臨床因素,比如分級(jí)、腫瘤大小或淋巴結(jié)累及,不能對(duì)是否采用 化學(xué)治療這一問題給出明確的答案。已經(jīng)開發(fā)了較新的分子工具,如21基因分析、基因組等 級(jí)指數(shù)分析和其他工具,來解決這個(gè)醫(yī)療需求。
[0004] 治療指南通常由本領(lǐng)域知名的專家開發(fā)。在歐洲,圣加侖指南(St Gallen gui de 1 ine s)從2009年開始向HER2陽性乳腺癌患者以及HER2陰性和ER陰性疾病患者推薦化 學(xué)治療。在HER2陰性和ER陽性疾病患者中存在關(guān)于化學(xué)治療有效性的不確定性。為了對(duì)個(gè) 體做出平衡的治療決定,用癌癥復(fù)發(fā)的可能性作為最有用的標(biāo)準(zhǔn)。諸如淋巴結(jié)狀態(tài)、腫瘤分 級(jí)、腫瘤大小等臨床標(biāo)準(zhǔn)是有幫助的,因?yàn)樗鼈兲峁╆P(guān)于復(fù)發(fā)風(fēng)險(xiǎn)的信息。最近,已經(jīng)表明 多基因分析比標(biāo)準(zhǔn)臨床風(fēng)險(xiǎn)因素提供更好的或額外的信息。普遍認(rèn)為,增殖標(biāo)記似乎提供 主要的預(yù)后信息。這些預(yù)測(cè)器化1'6(1;[01:01')的突出的例子是來自48611(113的1^11]111^口1';[111:檢 測(cè)、來自Veridex的復(fù)發(fā)評(píng)分和Jules Bordet研究所開發(fā)并授權(quán)給Ipsogen的基因組等級(jí)指 數(shù)。所有這些分析都是基于對(duì)至少70個(gè)基因的表達(dá)水平的測(cè)定,并且所有這些都已經(jīng)針對(duì) 未被福爾馬林固定和石蠟包埋嚴(yán)重降解、但從新鮮組織中分離的RNA(在RNALaterTM中運(yùn) 輸)進(jìn)行了開發(fā)。另一種突出的多基因分析是Genomic Health Inc的復(fù)發(fā)評(píng)分檢測(cè)。該檢測(cè) 在從福爾馬林固定的、石蠟包埋的組織樣品中提取RNA后測(cè)定16個(gè)癌癥相關(guān)基因和5個(gè)參考 基因的表達(dá)水平。
[0005] 然而,在最重要的臨床風(fēng)險(xiǎn)組中,即那些基于標(biāo)準(zhǔn)臨床參數(shù)具有中等復(fù)發(fā)風(fēng)險(xiǎn)的 乳腺癌患者中,現(xiàn)有的工具苦于缺乏臨床有效性和實(shí)用性。因此,需要更好的工具來根據(jù)患 者的預(yù)后優(yōu)化治療決定。針對(duì)避免化學(xué)治療的臨床應(yīng)用,需要具有高靈敏度和高陰性預(yù)測(cè) 值的檢測(cè),以便不會(huì)發(fā)生對(duì)患者的治療不足從而導(dǎo)致最終發(fā)生術(shù)后遠(yuǎn)端轉(zhuǎn)移。關(guān)于在對(duì)輔 助性治療作出臨床決定中有用的材料和方法的持續(xù)需求,本發(fā)明滿足了對(duì)基于容易獲得的 臨床和實(shí)驗(yàn)數(shù)據(jù)進(jìn)行乳腺癌預(yù)后的先進(jìn)方法的需求。
【發(fā)明內(nèi)容】
[0006] 總體而言,本發(fā)明提供了評(píng)估淋巴結(jié)陰性或陽性、雌激素受體陽性和HER2/NEU陰 性乳腺癌患者,特別是接受內(nèi)分泌治療的患者(例如用他莫昔芬治療時(shí))的復(fù)發(fā)風(fēng)險(xiǎn)的方 法。雌激素受體狀態(tài)一般用免疫組織化學(xué)來確定,HER2/NEU(ERBB2)狀態(tài)一般用免疫組織化 學(xué)和熒光原位雜交來確定。然而,為了本發(fā)明的目的,雌激素受體狀態(tài)和ffiR2/NEU(ERBB2) 狀態(tài)可用諸如免疫組織化學(xué)、熒光原位雜交(FISH)或RNA表達(dá)分析等任何合適的方法來確 定。
[0007] 本發(fā)明涉及用于預(yù)測(cè)乳腺癌患者的雌激素受體陽性和HER2陰性腫瘤的乳腺癌結(jié) 果的方法,所述方法包括:
[0008] (a)確定來自所述患者的腫瘤樣品中以下9個(gè)基因中至少2個(gè)的RNA表達(dá)水平: UBE2C、BIRC5、RACGAP1、DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP;
[0009] (b)數(shù)學(xué)地組合在所述腫瘤樣品中確定的所述組基因的表達(dá)水平值,從而得出組 合得分,其中所述組合得分指示所述患者的預(yù)后。在一個(gè)實(shí)施方案中,至少選擇3、4、5或6個(gè) 基因。
[0010] 在本發(fā)明的進(jìn)一步的實(shí)施方案中,該方法包括:
[0011] (a)確定來自所述患者的腫瘤樣品中以下8個(gè)基因的RNA表達(dá)水平:UBE2C、 RACGAP1、DHCR7、STC2、AZGP1、RBBP8、IL6 ST和MGP;
[0012] (b)數(shù)學(xué)地組合在所述腫瘤樣品中確定的所述組基因的表達(dá)水平值,從而得出組 合得分,其中所述組合得分指示所述患者的預(yù)后。
[0013] 在進(jìn)一步的實(shí)施方案中,本發(fā)明的方法包括:
[0014] (a)確定來自所述患者的腫瘤樣品中以下8個(gè)基因的RNA表達(dá)水平:UBE 2C、BIRC5、 DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP;
[0015] (b)數(shù)學(xué)地組合在所述腫瘤樣品中確定的所述組基因的表達(dá)水平值,從而得出組 合得分,其中所述組合得分指示所述患者的預(yù)后。
[0016] 在本發(fā)明的又一實(shí)施方案中,
[0017] BIRC5 可以替換為 UBE2C 或 T0P2A 或 RACGAP1 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRD1 或DCN或ADRA2A或SQLE或CXCL12或EPHX2或ASPH或PRSS16或EGFR或CCND1或TRIM29或DHCR7 或PIP或TFAP2B或WNT5A或AP0D或PTPRT,條件是替換后選擇8個(gè)不同的基因;且
[0018] UBE2C 可以替換為 BIRC5 或 RACGAP1 或 T0P2A 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRD1 或ADRA2A或DCN或SQLE或CCND1或ASPH或CXCL12或PIP或PRSS16或EGFR或DHCR7或EPHX2或 TR頂29,條件是替換后選擇8個(gè)不同的基因;且
[0019] DHCR7可以替換為AURKA、BIRC5、UBE2C或任何其他可以代替BIRC5或UBE2C的基因, 條件是替換后選擇8個(gè)不同的基因;且
[0020] STC2 可以替換為 INPP4B 或 IL6ST 或 SEC14L2 或 MAPT 或 CHPT1 或 ABAT 或 SCUBE2 或 ESR1 或RBBP8或PGR或PTPRT或HSPA2或PTGER3,條件是替換后選擇8個(gè)不同的基因;且
[0021] AZGP1可以替換為PIP或EPHX2或PLAT或SEC14L2或SCUBE2或PGR,條件是替換后選 擇8個(gè)不同的基因;且
[0022] RBBP8可以替換為CELSR2或PGR或STC2或ABAT或IL6ST,條件是替換后選擇8個(gè)不同 的基因;且
[0023] IL6ST 可以替換為 INPP4B 或 STC2 或 MAPT 或 SCUBE2 或 ABAT 或 PGR 或 SEC14L2 或 ESR1 或 GJA1或MGP或EPHX2或RBBP8或PTPRT或PLAT,條件是替換后選擇8個(gè)不同的基因;且 [0024] MGP可以替換為AP0D或IL6ST或EGFR,條件是替換后選擇8個(gè)不同的基因。
[0025] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述組合得分表明從細(xì)胞 毒性化學(xué)治療中受益。
[0026] 在患者接受內(nèi)分泌治療之前使用本發(fā)明的方法允許預(yù)測(cè)內(nèi)分泌治療的療效。
[0027] 下面的表2中示出了在接受內(nèi)分泌治療的患者中,每個(gè)上述標(biāo)記基因的過表達(dá)是 指示好結(jié)果還是指示壞結(jié)果。因此,技術(shù)人員可以考慮給定基因的效果來構(gòu)建數(shù)學(xué)組合,即 算法。例如,其過表達(dá)指示好結(jié)果的基因的求和或加權(quán)求和導(dǎo)致一種其中高風(fēng)險(xiǎn)得分指示 好結(jié)果的算法。通過用臨床記錄分析患者的腫瘤樣品,可以檢查該算法的有效性,其中,例 如,可以分別確定和比較好結(jié)果患者和壞結(jié)果患者的得分。技術(shù)人員、生物統(tǒng)計(jì)學(xué)家將知道 運(yùn)用進(jìn)一步的數(shù)學(xué)方法如判別函數(shù)來得到優(yōu)化的算法。例如可以針對(duì)靈敏度或特異性對(duì)算 法進(jìn)行優(yōu)化。算法可通過調(diào)整而適應(yīng)于用來測(cè)量標(biāo)記基因的基因表達(dá)的特定分析平臺(tái),如 定量PCR。
[0028] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述內(nèi)分泌治療包括他莫 昔芬或芳香酶抑制劑。
[0029] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中預(yù)測(cè)發(fā)生復(fù)發(fā)的風(fēng)險(xiǎn)。
[0030] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述表達(dá)水平作為非蛋白 質(zhì)表達(dá)水平進(jìn)行確定。
[0031] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述表達(dá)水平作為RNA表達(dá) 水平進(jìn)行確定。
[0032] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述表達(dá)水平通過以下方 法中的至少一種來確定
[0033] 基于PCR的方法,
[0034]基于微陣列方法,和 [0035]基于雜交的方法。
[0036] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述表達(dá)水平的測(cè)定是在 福爾馬林固定的、石蠟包埋的腫瘤樣品中或在新鮮冷凍的腫瘤樣品中進(jìn)行的。
[0037] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中,所述至少一個(gè)標(biāo)記基因的 表達(dá)水平作為相對(duì)于至少一個(gè)參考基因或相對(duì)于計(jì)算的平均表達(dá)值的表達(dá)模式進(jìn)行確定。
[0038] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中,所述數(shù)學(xué)組合步驟包括對(duì) 代表給定基因的表達(dá)水平的值應(yīng)用算法的步驟。
[0039] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中所述算法是所述代表給定 基因表達(dá)水平的值的線性組合。
[0040] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中代表給定基因的表達(dá)水平 的值乘以一個(gè)系數(shù)。
[0041 ]根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中,為所述組合得分確定一 個(gè)、兩個(gè)或兩個(gè)以上的閾值,并且通過對(duì)所述組合得分應(yīng)用該閾值,該閾值判別為高和低風(fēng) 險(xiǎn),高、中和低風(fēng)險(xiǎn),或更多的風(fēng)險(xiǎn)組。
[0042]根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中高組合得分表明從更具侵 略性的治療如細(xì)胞毒性化學(xué)治療中受益。本領(lǐng)域技術(shù)人員理解,在這一點(diǎn)上,"高得分"涉及 參考值或截止值。本領(lǐng)域技術(shù)人員進(jìn)一步理解,取決于所用來得到組合得分的特定算法,低 于截止值或參考值的"低"得分也可以表明受益于更具侵略性的治療,如細(xì)胞毒性化學(xué)治 療。當(dāng)與高轉(zhuǎn)移風(fēng)險(xiǎn)具有正相關(guān)的基因代入具有正系數(shù)的算法,使得高總得分指示與高風(fēng) 險(xiǎn)具有正相關(guān)的基因的高表達(dá)時(shí),情況就是這樣。
[0043] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中,在數(shù)學(xué)地組合基因表達(dá)水 平值以得出組合得分的步驟中處理關(guān)于患者的淋巴結(jié)狀態(tài)的信息。
[0044] 根據(jù)本發(fā)明的一個(gè)方面,提供了如上所述的方法,其中,如果所述淋巴結(jié)狀態(tài)為陰 性,則所述關(guān)于淋巴結(jié)狀態(tài)的信息為<〇的數(shù)值,而如果所述淋巴結(jié)狀態(tài)為陽性或未知,則 所述信息為>〇的數(shù)值。在本發(fā)明的示例性實(shí)施方案中,陰性淋巴結(jié)狀態(tài)被賦予數(shù)值〇,未知 淋巴結(jié)狀態(tài)被賦予數(shù)值0.5,而陽性淋巴結(jié)狀態(tài)被賦予數(shù)值1。也可選擇其他值,以反映淋巴 結(jié)狀態(tài)在算法中的不同的權(quán)重。
[0045] 本發(fā)明還涉及用于執(zhí)行如上所述的方法的試劑盒,所述試劑盒包含一組能夠特異 性結(jié)合基因組合中基因的序列或基因片段的序列的寡核苷酸,其中
[0046] (i)所述組合包括至少以下8個(gè)基因:UBE2C、BIRC5、DHCR7、STC2、AZGP1、RBBP8、 IL6ST和MGP;或
[0047] (ii)所述組合包括至少以下 10個(gè)基因:BIRC5、AURKA、PVALB、匪U、STC2、RBBP8、 PTGER3、CXCL12、CDH1和PIP;或
[0048] ( i i i )所述組合包括至少以下9個(gè)基因 :BIRC5、DHCR7、RACGAP1、PVALB、STC2、 IL6ST、PTGER3、CXCL12和ABAT;或
[0049] (i v)所述組合包括至少以下9個(gè)基因:DHCR7、RACGAP 1、NMU、AZGP1、RBBP8、IL6ST和 MGP〇
[0050] 本發(fā)明還涉及用于執(zhí)行權(quán)利要求1至17中任一項(xiàng)的方法的試劑盒的應(yīng)用,所述試 劑盒包含一組能夠特異性結(jié)合基因組合中基因的序列或基因片段的序列的寡核苷酸,其中 [0051 ] (i)所述組合包括至少以下8個(gè)基因:UBE2C、BIRC5、DHCR7、STC2、AZGP1、RBBP8、 IL6ST和MGP;或
[0052] (i i)所述組合包括至少以下 10個(gè)基因:BIRC5、AURKA、PVALB、匪U、STC2、RBBP8、 PTGER3、CXCL12、CDH1和PIP;或
[0053] ( i i i )所述組合包括至少以下9個(gè)基因 :BIRC5、DHCR7、RACGAP 1、PVALB、STC2、 IL6ST、PTGER3、CXCL12和ABAT;或
[0054] (iv)所述組合包括至少以下9個(gè)基因:DHCR7、RACGAP 1、NMU、AZGP 1、RBBP8、IL6ST和 MGP; 19.-種計(jì)算機(jī)程序產(chǎn)品,該產(chǎn)品通過數(shù)學(xué)地組合代表基因AKR1C3、MAP4和SPP1的表達(dá) 水平的值以得出組合得分,能夠處理所述值,其中,所述組合得分表明所述患者從細(xì)胞毒性 化學(xué)治療中受益。
[0055] 本發(fā)明還涉及一種計(jì)算機(jī)程序產(chǎn)品,該產(chǎn)品根據(jù)上述方法通過數(shù)學(xué)地組合代表基 因組合的表達(dá)水平的值以得出組合得分,能夠處理所述值,其中,所述組合得分指示所述患 者從內(nèi)分泌治療獲得的療效或益處。
[0056] 所述計(jì)算機(jī)程序產(chǎn)品可存儲(chǔ)在數(shù)據(jù)載體上,或在能夠輸出代表給定基因的表達(dá)水 平的值的診斷系統(tǒng)如實(shí)時(shí)P CR系統(tǒng)上執(zhí)行。
[0057] 如果計(jì)算機(jī)程序產(chǎn)品存儲(chǔ)在數(shù)據(jù)載體上,或在計(jì)算機(jī)上運(yùn)行,操作個(gè)人可以輸入 對(duì)于各自基因的表達(dá)水平獲得的表達(dá)值。該計(jì)算機(jī)程序產(chǎn)品然后可以應(yīng)用算法,以產(chǎn)生表 明給定患者從細(xì)胞毒性化學(xué)治療中受益的組合得分。
[0058] 本發(fā)明的方法具有以下優(yōu)點(diǎn):在僅僅使用少數(shù)基因的基礎(chǔ)上,提供了對(duì)疾病結(jié)果 的可靠的預(yù)測(cè)?,F(xiàn)已發(fā)現(xiàn),本發(fā)明的方法特別適合于分析攜帶被分類為ESR1陽性和ERBB2陰 性的腫瘤的患者對(duì)內(nèi)分泌治療例如他莫昔芬治療的響應(yīng)。
【附圖說明】
[0059]圖1顯示在ABCSG06和08研究的組合群以及個(gè)體治療組中,使用遠(yuǎn)端轉(zhuǎn)移作為終 點(diǎn),T5得分的具有95%置信區(qū)間的校正危險(xiǎn)單位比的Forrest圖。
[0060]圖2顯示根據(jù)T5得分值分成高或低風(fēng)險(xiǎn)的、來自ABCSG06和08組合群的ER+、HER-、 N0-3患者的Kaplan Meier分析。
[0061 ] 圖3顯示了在用RACGAP1取代BIRC5的實(shí)施例中,RACGAP1與BIRC5之間的表達(dá)值之 間的聯(lián)合分布。
【具體實(shí)施方式】
[0062] 定義
[0063] 除非另有定義,本文所用的技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬領(lǐng)域中的普通技術(shù) 人員所通常理解的相同的含義。
[0064] 術(shù)語"癌癥"不限于任何階段、等級(jí)、組織形態(tài)學(xué)特征、攻擊性或累及組織的惡性腫 瘤或細(xì)胞聚集。
[0065] 本文中所用的術(shù)語疾病的"預(yù)測(cè)結(jié)果"意在包括對(duì)經(jīng)歷了給定治療的患者的結(jié)果 的預(yù)測(cè)和未經(jīng)治療的患者的預(yù)后。術(shù)語"預(yù)測(cè)結(jié)果"尤其可涉及患者發(fā)生轉(zhuǎn)移、局部復(fù)發(fā)或 者死亡的風(fēng)險(xiǎn)。
[0066] 本文所用的術(shù)語"預(yù)測(cè)"涉及在用給定療法對(duì)腫瘤進(jìn)行治療的情況下,對(duì)腫瘤惡性 程度的個(gè)別評(píng)估,或者患者的預(yù)期生存率(0AS,總生存率,或DFS,無病生存率)。與之相反, 術(shù)語"預(yù)后"涉及在未對(duì)腫瘤進(jìn)行治療的情況下,對(duì)腫瘤惡性程度的個(gè)別評(píng)估,或者患者的 預(yù)期生存率(0AS,總生存率,或DFS,無病生存率)。
[0067] 在本發(fā)明的含義中,"結(jié)果"是在疾病過程中所達(dá)到的定義的狀況。這種疾病結(jié)果 可以是,例如臨床狀況,如"疾病復(fù)發(fā)"、"轉(zhuǎn)移發(fā)展"、"淋巴結(jié)轉(zhuǎn)移發(fā)展"、"遠(yuǎn)端轉(zhuǎn)移發(fā)展"、 "存活"、"死亡"、"腫瘤緩解率"、疾病分期或等級(jí)等。
[0068] "風(fēng)險(xiǎn)"可以理解為與受試者或患者發(fā)展或達(dá)到某一疾病結(jié)果的概率有關(guān)的數(shù)值。 在本發(fā)明的上下文中,術(shù)語"風(fēng)險(xiǎn)"并不帶有任何關(guān)于患者健康的積極或消極的暗示,而僅 指給定狀況的發(fā)生或發(fā)展的概率或可能性。
[0069] 術(shù)語"臨床數(shù)據(jù)"涉及關(guān)于患者的健康狀態(tài)的全部可得到的數(shù)據(jù)和信息,包括但不 限于年齡、性別、體重、絕經(jīng)/激素狀態(tài)、疾病發(fā)生學(xué)數(shù)據(jù)、既往病史數(shù)據(jù)、通過體外診斷方法 如組織病理學(xué)、血液或尿液檢驗(yàn)獲得的數(shù)據(jù)、通過成像方法如X-射線、計(jì)算機(jī)斷層掃描、 1?1、?£1\叩6(^、超聲波獲得的數(shù)據(jù)、電生理學(xué)數(shù)據(jù)、遺傳分析、基因表達(dá)分析、活組織檢查 評(píng)估、術(shù)中發(fā)現(xiàn)。
[0070] 術(shù)語"淋巴結(jié)陽性"、"診斷為淋巴結(jié)陽性"、"結(jié)累及"或"淋巴結(jié)累及"是指患者以 前被診斷為淋巴結(jié)轉(zhuǎn)移。它應(yīng)包括兩種引流淋巴結(jié):近淋巴結(jié)和遠(yuǎn)端淋巴結(jié)轉(zhuǎn)移。這種以前 的診斷本身并不構(gòu)成本發(fā)明方法的一部分。相反,它是選擇其樣品可以用于本發(fā)明的一個(gè) 實(shí)施方案的患者的先決條件。這種以前的診斷可能已經(jīng)通過本領(lǐng)域中已知的任何合適的方 法實(shí)現(xiàn),所述方法包括但不限于淋巴結(jié)切除和病理學(xué)分析、活檢分析、指示轉(zhuǎn)移的生物標(biāo)記 的體外分析、成像方法(例如,計(jì)算機(jī)斷層掃描、X-射線、磁共振成像、超聲波)和術(shù)中發(fā)現(xiàn)。 [0071 ]在本發(fā)明的上下文中,"生物樣品"是來自于生物有機(jī)體或與之有過接觸的樣品。 生物樣品的例子有:細(xì)胞、組織、體液、洗出液、涂片樣品、活檢標(biāo)本、血液、尿液、唾液、痰、血 漿、血清、細(xì)胞培養(yǎng)上清液等等。
[0072] "腫瘤樣品"是含有腫瘤細(xì)胞的生物樣品,不論是完整的還是降解的。樣品可以是 任何生物組織或流體的樣品。這樣的樣品包括但不限于,痰、血液、血清、血漿、血細(xì)胞(如白 細(xì)胞)、組織、中心或細(xì)針活檢樣品、含細(xì)胞的體液、尿液、腹膜液和胸膜液、腦脊液、淚液,或 從它們中分離的細(xì)胞。這也可包括組織切片,例如為了組織學(xué)目的而制作的冷凍或固定切 片,或顯微切割的細(xì)胞或其細(xì)胞外部分。待分析的腫瘤樣品可以是通過抽吸或穿刺、切除或 通過任何其他獲得活檢或切除的細(xì)胞物質(zhì)的手術(shù)方法從腫瘤病變處采集的組織材料。這些 包括從患者獲得的腫瘤細(xì)胞或腫瘤細(xì)胞片段。可在例如通過乳頭抽吸、導(dǎo)管灌洗、細(xì)針活檢 或從刺激的或自發(fā)的乳頭溢液中收集的細(xì)胞"涂片"中發(fā)現(xiàn)細(xì)胞。在另一實(shí)施方案中,樣品 是體液。這樣的體液包括,例如,血液、血清、血漿、淋巴液、腹水液、婦科流體或尿液,但不限 于這些體液。
[0073] "基因"是含有產(chǎn)生功能性RNA產(chǎn)物所必需的信息的一組核酸區(qū)段。"基因產(chǎn)物"是 通過基因的轉(zhuǎn)錄或表達(dá)產(chǎn)生的生物分子,例如,mRNA、cDNA或翻譯的蛋白質(zhì)。
[0074] "mRNA"是基因的轉(zhuǎn)錄產(chǎn)物,且具有本領(lǐng)域技術(shù)人員所理解的通常含義。"由mRNA衍 生的分子"是通過化學(xué)或酶方法從mRNA模板得到的分子,如cDNA。
[0075]術(shù)語"表達(dá)水平"是指確定的基因表達(dá)的水平。這可以是作為絕對(duì)值,或與參考基 因(例如持家基因)相比,與兩個(gè)或更多的參考基因的平均值相比,或與計(jì)算的平均表達(dá)值 相比(例如,在DNA芯片分析中),或在不使用參考樣品的情況下與另一個(gè)信息基因相比而確 定的基因表達(dá)水平?;虻谋磉_(dá)水平可以直接測(cè)量,例如通過獲得信號(hào),其中該信號(hào)強(qiáng)度與 該基因的mRNA轉(zhuǎn)錄物的量相關(guān),或者它可以在蛋白質(zhì)水平上間接獲得,例如通過免疫組織 化學(xué)、CISH、ELISA或RIA方法。也可以通過與參考樣品的競(jìng)爭(zhēng)性反應(yīng)獲得表達(dá)水平。通過在 分析中測(cè)量一些物理參數(shù)例如熒光發(fā)射而確定的表達(dá)值可以被賦予一個(gè)數(shù)值,該數(shù)值可用 于進(jìn)一步的信息處理。
[0076]在本發(fā)明的含義中,"表達(dá)水平的參考模式"應(yīng)該被理解為可以用于同另一個(gè)表達(dá) 水平模式進(jìn)行比較的任何表達(dá)水平模式。在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,表達(dá)水平的參 考模式是,例如,在健康個(gè)體組、患病個(gè)體組或已經(jīng)接受特定類型治療的患病個(gè)體組(作為 參考組)或具有好或壞的結(jié)果的個(gè)體組中觀察到的表達(dá)水平的平均模式。
[0077] 在本發(fā)明的含義內(nèi),術(shù)語"數(shù)學(xué)地組合表達(dá)水平"應(yīng)被理解為從確定的基因表達(dá)水 平推導(dǎo)出數(shù)值,以及對(duì)一個(gè)或多個(gè)這樣的數(shù)值應(yīng)用算法,以獲得組合數(shù)值或組合得分。
[0078] "算法"是進(jìn)行某些操作順序以產(chǎn)生信息的過程。
[0079] "得分"是通過應(yīng)用算法來數(shù)學(xué)地組合表達(dá)水平而推導(dǎo)出的數(shù)值。它也可以從表達(dá) 水平和其他信息例如臨床數(shù)據(jù)推導(dǎo)。得分可與患者的疾病結(jié)果相關(guān)。
[0080] "判別函數(shù)"是用于將對(duì)象或事件進(jìn)行分類的一組變量的函數(shù)。因此,判別函數(shù)允 許根據(jù)可從患者、樣品或事件獲得的數(shù)據(jù)或參數(shù)將所述患者、樣品或事件分類到一個(gè)類別 或多個(gè)類別中。這種分類是本領(lǐng)域技術(shù)人員所公知的標(biāo)準(zhǔn)統(tǒng)計(jì)分析工具。例如,根據(jù)從患 者、樣品或事件所獲得的數(shù)據(jù),可將所述患者分類為"高風(fēng)險(xiǎn)"或"低風(fēng)險(xiǎn)"、"高轉(zhuǎn)移概率"或 "低轉(zhuǎn)移概率"、"需要治療"或"不需要治療"。分類不限于"高與低",而是可以分類到多種類 另IJ、等級(jí)等。在更廣泛的意義上,分類也應(yīng)被理解為判別得分,其中,例如較高的得分代表了 較高的遠(yuǎn)端轉(zhuǎn)移可能性,例如,遠(yuǎn)端轉(zhuǎn)移的(總)風(fēng)險(xiǎn)。允許分類的判別函數(shù)的例子包括但不 限于,由支持向量機(jī)(SVM)、K_最近鄰法(kNN)、(樸素)貝葉斯模型、線性回歸模型定義的函 數(shù),或分段定義函數(shù),例如,在亞組發(fā)現(xiàn)中,在決策樹中,在數(shù)據(jù)的邏輯分析(LAD)中,等等。 在更廣泛的意義上,諸如相關(guān)系數(shù)、投影、支持向量機(jī)得分、其他基于相似性的方法、它們的 組合等數(shù)學(xué)方法或算法的連續(xù)得分值是用于說明目的的例子。
[0081] 術(shù)語"治療方式"、"治療模式"、"方案"以及"治療方案"是指用于癌癥治療的抗腫 瘤、和/或抗血管、和/或免疫刺激、和/或血細(xì)胞增殖劑、和/或放射療法、和/或高溫療法、 和/或低溫療法的及時(shí)序貫或同時(shí)施用。這些的施用可以通過輔助和/或新輔助模式進(jìn)行。 這樣的"方案"的組合在定義的治療窗口內(nèi)在單個(gè)治療劑的劑量、應(yīng)用的時(shí)限和施用頻率方 面可能會(huì)有所不同。目前,各種藥物和/或物理方法的各種組合以及各種計(jì)劃表正在研究 中。
[0082] 術(shù)語"細(xì)胞毒性化學(xué)治療"是指影響細(xì)胞的增殖和/或存活的各種治療方式。治療 可包括烷化劑、抗代謝物、蒽環(huán)類、植物生物堿類、拓?fù)洚悩?gòu)酶抑制劑和包括單克隆抗體和 激酶抑制劑在內(nèi)的其他抗腫瘤劑的給藥。特別地,細(xì)胞毒性治療可涉及紫杉烷治療。紫杉烷 類是植物生物堿類,它們通過防止微管功能來阻止細(xì)胞分裂。紫杉烷的原型是天然產(chǎn)物紫 杉醇,最初被稱為紫杉酚(Taxol),最初來源于太平洋紫杉樹的樹皮。多西紫杉醇是紫杉醇 的一種半合成類似物。紫杉烷類增強(qiáng)微管的穩(wěn)定性,防止在細(xì)胞分裂后期染色體的分離。
[0083] 術(shù)語"內(nèi)分泌治療"或"激素治療"(有時(shí)也被稱為"抗激素治療")表示以激素信號(hào) 傳導(dǎo)為靶標(biāo)的治療,例如激素抑制、激素受體抑制、激素受體激動(dòng)劑或拮抗劑的使用、清除 劑或孤兒受體的使用、激素衍生物的使用和干擾激素產(chǎn)生。具體的例子是調(diào)節(jié)雌激素受體 信號(hào)傳導(dǎo)的他莫昔芬治療或干擾類固醇激素產(chǎn)生的芳香酶治療。
[0084] 他莫昔芬是口服活性的選擇性雌激素受體調(diào)節(jié)劑(SERM),用于治療乳腺癌,是目 前世界上用于這一目的的銷量最大的藥物。他莫昔芬以Nolvadex、Istubal和Valodex的商 品名銷售。然而,甚至在其專利到期之前,該藥物仍然廣泛地用它的通用名"他莫昔芬"來提 及。他莫昔芬和他莫昔芬衍生物競(jìng)爭(zhēng)性地結(jié)合腫瘤和其他組織靶標(biāo)上的雌激素受體,產(chǎn)生 減少RNA合成和抑制雌激素效應(yīng)的核復(fù)合物。
[0085] 類固醇受體是執(zhí)行類固醇激素的信號(hào)轉(zhuǎn)導(dǎo)的細(xì)胞內(nèi)受體(通常是細(xì)胞質(zhì)的)。例子 包括:1型受體,尤其是性激素受體,例如,雄激素受體、雌激素受體、孕激素受體;糖皮質(zhì)激 素受體、鹽皮質(zhì)激素受體;和II型受體,例如,維生素A受體、維生素D受體、類視黃醇受體、甲 狀腺激素受體。
[0086] 本文所用的術(shù)語"基于雜交的方法"是指提供將互補(bǔ)的單鏈核酸或核苷酸類似物 組合成一個(gè)雙鏈分子的過程的方法。核苷酸或核苷酸類似物在正常條件下將與它們的互補(bǔ) 物結(jié)合,所以兩個(gè)完全互補(bǔ)的鏈很容易相互結(jié)合。在生物分析中,經(jīng)常使用標(biāo)記的單鏈探針 以便找到互補(bǔ)的靶序列。如果這樣的序列存在于樣品中,探針將與所述序列雜交,然后由于 標(biāo)記而能夠被檢測(cè)到。其他的基于雜交的方法包括微陣列和/或生物芯片方法。其中,探針 被固定在固相上,然后將其暴露于樣品。如果互補(bǔ)的核酸存在于樣品中,它們將與探針雜 交,并因此能夠被檢測(cè)到。這些方法也被稱為"基于陣列的方法"。另一基于雜交的方法是 PCR,將在下文中描述。當(dāng)涉及到表達(dá)水平的測(cè)定時(shí),例如,基于雜交的方法可以用來確定給 定基因的mRNA的量。
[0087] 能夠特異性結(jié)合基因或其片段的序列的寡核苷酸涉及與基因或基因產(chǎn)物如基因 的mRNA或cDNA或其片段特異性雜交的寡核苷酸。為了特異性檢測(cè)基因或基因產(chǎn)物,不一定 要檢測(cè)整個(gè)基因序列。約20-150個(gè)堿基的片段將含有足夠的序列特異性信息,以允許特異 性雜交。
[0088] 本文所用的術(shù)語"基于PCR的方法"是指包括聚合酶鏈反應(yīng)(PCR)的方法。這是一種 通過體外的酶復(fù)制來指數(shù)擴(kuò)增核酸例如DNA的方法。由于PCR是一種體外技術(shù),它可以在不 限制DNA的形式的情況下進(jìn)行,并且可以被廣泛地修改以執(zhí)行多種遺傳操作。當(dāng)涉及到表達(dá) 水平的測(cè)定時(shí),基于PCR的方法例如可以用來通過以下步驟檢測(cè)給定mRNA的存在:(1)在逆 轉(zhuǎn)錄酶的幫助下將完整的mRNA池(即所謂的轉(zhuǎn)錄組)逆轉(zhuǎn)錄成cDNA,和(2)在各自的引物的 幫助下檢測(cè)給定cDNA的存在。這種方法通常被稱為逆轉(zhuǎn)錄PCR(rtPCR)。
[0089] 此外,基于PCR的方法包括,例如,實(shí)時(shí)PCR,以及尤其適合表達(dá)水平分析的動(dòng)力學(xué) 或定量 PCR(qPCR)。
[0090]術(shù)語"定量PCR(qPCR)"是指允許對(duì)樣品中的模板進(jìn)行量化的任何類型的PCR方法。 定量實(shí)時(shí)PCR包括不同的表現(xiàn)和產(chǎn)物檢測(cè)技術(shù),例如TaqMan技術(shù)或LightCycler技術(shù)。例如, TaqMan技術(shù)使用雙標(biāo)記的熒光探針。TaqMan實(shí)時(shí)PCR在PCR指數(shù)階段經(jīng)由熒光團(tuán)檢測(cè)產(chǎn)物的 積累,而不是像在常規(guī)PCR中那樣在終點(diǎn)檢測(cè)。產(chǎn)物的指數(shù)性增加用于確定循環(huán)閾值,CT,即 檢測(cè)到熒光的顯著指數(shù)性增加時(shí)的PCR循環(huán)數(shù),并且與存在于反應(yīng)中的DNA模板的拷貝數(shù)直 接相關(guān)。該反應(yīng)的設(shè)置與常規(guī)PCR非常相似,只是在允許測(cè)量PCR管中的熒光分子的實(shí)時(shí)熱 循環(huán)儀中進(jìn)行。不同于常規(guī)PCR,在TaqMan實(shí)時(shí)PCR中向反應(yīng)中添加探針,即與DNA模板內(nèi)20-60個(gè)核苷酸的區(qū)段互補(bǔ)且位于兩個(gè)引物之間的單鏈寡核苷酸。熒光報(bào)告分子或熒光團(tuán)(例 如,6-羧基熒光素,縮寫:FAM,或四氯熒光素,縮寫:TET)和猝滅劑(例如,四甲基羅丹明,縮 寫:TAMRA,或二氫環(huán)吡咯并吲哚三肽"黑洞猝滅劑",縮寫:BHQ)分別共價(jià)連接到探針的5 '和 3'末端[2]。熒光團(tuán)與連接到探針上的猝滅劑之間的緊密接近抑制了熒光團(tuán)發(fā)出的熒光。在 PCR過程中,當(dāng)DNA合成開始時(shí),Taq聚合酶的5 '到3 '外切核酸酶活性降低了已經(jīng)與模板退火 的探針的比例。探針的降解從中釋放出熒光團(tuán),并且打破了與猝滅劑的緊密接近,從而減輕 了猝滅效果,并允許熒光團(tuán)發(fā)熒光。因此,在實(shí)時(shí)PCR熱循環(huán)儀中檢測(cè)到的熒光與釋放的熒 光團(tuán)和PCR中存在的DNA模板的量成正比。
[0091 ] "陣列"或"矩陣"是指裝置上可尋址的位置或"地址"的布置。位置可以以二維陣 列、三維陣列或其他矩陣格式排布。位置的數(shù)目可以從幾個(gè)到至少幾十萬個(gè)。最重要的是, 每個(gè)位置代表一個(gè)完全獨(dú)立的反應(yīng)位點(diǎn)。陣列包括但不限于核酸陣列、蛋白質(zhì)陣列和抗體 陣列。"核酸陣列"是指含有核酸探針如寡核苷酸、核苷酸類似物、多核苷酸、核苷酸類似物 的聚合物、嗎啉代或基因的更大部分的陣列。陣列上的核酸和/或類似物優(yōu)選為單鏈的。其 中探針是寡核苷酸的陣列被稱為"寡核苷酸陣列"或"寡核苷酸芯片"。"微陣列"在本文中也 指"生物芯片"或"生物學(xué)芯片",是具有至少約100/cm 2、優(yōu)選至少約1000/cm2的離散區(qū)域密 度的區(qū)域陣列。
[0092] 在本發(fā)明的含義內(nèi),"引物對(duì)"和"探針"具有分子生物學(xué)領(lǐng)域技術(shù)人員所公知的該 術(shù)語的普通含義。在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,"引物對(duì)"和"探針"應(yīng)被理解為具有與 待檢測(cè)或定量的靶多核苷酸區(qū)域相同、互補(bǔ)、同源的或與該區(qū)域的互補(bǔ)物同源的序列的多 核苷酸分子。在另一實(shí)施方案中,也包含核苷酸類似物以用作引物和/或探針。用于動(dòng)力學(xué) 或?qū)崟r(shí)PCR應(yīng)用的探針技術(shù)可以是,例如,可從Applied Biosystems獲得的TaqMan?系統(tǒng), 延伸探針如Sc_〇rpi〇n?Primers,雙雜交探針(Dual Hybridisation Probes ),可從 Chemicon Internationa 1 Inc獲得的AmpMUior1!).,或小溝結(jié)合劑(Minor Groove Binders)〇
[0093] 在本發(fā)明的含義內(nèi),"個(gè)別標(biāo)記的探針"應(yīng)理解為有助于探針的檢測(cè)或定量的、含 有多核苷酸、寡核苷酸或核苷酸類似物和標(biāo)記物的分子探針。優(yōu)選的標(biāo)記物是熒光分子、發(fā) 光分子、放射性分子、酶分子和/或猝滅分子。
[0094] 在本發(fā)明的含義內(nèi),"陣列化探針"應(yīng)理解為固定的探針的集合,優(yōu)選為有序排列。 在本發(fā)明的優(yōu)選實(shí)施方案中,個(gè)別的"陣列化探針"可根據(jù)它們各自在固體載體例如"芯片" 上的位置來鑒別。
[0095] 當(dāng)用于單鏈核酸序列時(shí),術(shù)語"基本上同源的"是指在如上所述的低嚴(yán)格性條件下 能夠與該單鏈核酸序列雜交(即,與之互補(bǔ))的任何探針。
[0096]結(jié)合示例性實(shí)施方案和附圖對(duì)本發(fā)明進(jìn)行了說明:
[0097]圖1顯示在ABCSG06和08研究的組合群以及個(gè)體治療組中,使用遠(yuǎn)端轉(zhuǎn)移作為終 點(diǎn),T5得分的具有95%置信區(qū)間的校正危險(xiǎn)單位比的Forrest圖。
[0098]圖2顯示根據(jù)T5得分值分成高或低風(fēng)險(xiǎn)的、來自ABCSG06和08組合群的ER+、HER-、 N0-3患者的Kaplan Meier分析。
[0099] 本文公開了獨(dú)特的標(biāo)記基因組合,它們可以組合為用于本文提出的新預(yù)測(cè)檢驗(yàn)的 算法。從技術(shù)上講,可以使用兩種技術(shù)來實(shí)施本發(fā)明的方法:1)從新鮮或固定的腫瘤組織中 分離總RNA,和2)分離的核酸的動(dòng)力學(xué)RT-PCR。備選地,也考慮使用替代技術(shù),例如通過微陣 列或通過在蛋白質(zhì)水平上測(cè)量,來測(cè)量表達(dá)水平。
[0100] 本發(fā)明的方法基于從腫瘤中分離的RNA種類的定量測(cè)定以得到表達(dá)值,和隨后對(duì) 所述確定的表達(dá)值的生物信息學(xué)分析。RNA種類可分離自任何類型的腫瘤樣品,例如活檢樣 品、涂片樣品、切除的腫瘤物質(zhì)、新鮮冷凍的腫瘤組織或石蠟包埋的、福爾馬林固定的腫瘤 組織。首先,如上所述確定編碼基因 UBE2C、BIRC5、DHCR7、RACGAP1、AURKA、PVALB、NMU、STC2、 AZGP1、RBBP8、IL6ST、MGP、PTGER3、CXCL12、ABAT、CDH1 和 PIP 的特定組合的基因或其特定組 合的RNA水平?;谶@些表達(dá)值,通過數(shù)學(xué)組合,例如根據(jù)公式T5、T1、T4或T5b(見下文),計(jì) 算出預(yù)后得分。高得分值表示發(fā)展遠(yuǎn)端轉(zhuǎn)移的高風(fēng)險(xiǎn),低得分值表示遠(yuǎn)端轉(zhuǎn)移的低風(fēng)險(xiǎn)。因 此,高得分也表明患者是高風(fēng)險(xiǎn)患者,將受益于更具侵略性的治療,如細(xì)胞毒性化學(xué)治療。
[0101] 本文的實(shí)例基于使用同樣地在輔助設(shè)置下用他莫昔芬進(jìn)行治療的患者的腫瘤對(duì) 預(yù)后基因的鑒定。此外,相關(guān)基因的鑒定也已限制在根據(jù)RNA表達(dá)水平被分類為ESR1陽性和 ERBB2陰性的腫瘤。另外,算法的開發(fā)也考慮允許分離中等風(fēng)險(xiǎn)例如2級(jí)腫瘤的基因。最后, 進(jìn)行從Affymetrix HG_U133a陣列到定量實(shí)時(shí)PCR的平臺(tái)轉(zhuǎn)移,以及從新鮮冷凍組織到FFPE 組織的樣品類型轉(zhuǎn)移,以確保獨(dú)立于平臺(tái)和組織類型的、穩(wěn)定的算法表現(xiàn)。其結(jié)果是,如上 所述對(duì)來自原發(fā)腫瘤的RNA種類的表達(dá)水平的確定和隨后的復(fù)變和多變量分析提供了一種 出色的方法,該方法用于預(yù)測(cè)被診斷為淋巴結(jié)陰性或陽性的早期乳腺癌患者在輔助設(shè)置下 僅用他莫昔芬治療時(shí)疾病復(fù)發(fā)的可能性。因此,該檢驗(yàn)依賴于比競(jìng)爭(zhēng)劑檢驗(yàn)更少的基因,但 可以提供出色的關(guān)于高靈敏度和陰性預(yù)測(cè)值的信息,尤其是用于基于標(biāo)準(zhǔn)臨床因素被認(rèn)為 表現(xiàn)出中等復(fù)發(fā)風(fēng)險(xiǎn)的腫瘤。
[0102] 使用西門子的基于二氧化硅珠子的全自動(dòng)化RNA分離方法,在Hamilton MICR0LAB STARLET液體處理自動(dòng)裝置(17)上,從一個(gè)IOmi的全FFPE組織切片中提取總RNA。自動(dòng)裝置、 緩沖液和化學(xué)品是西門子VERS ANT? kPCR分子系統(tǒng)(Siemens Healthcare Diagno st i cs,Tarry town,NY;在美國(guó)無法商購(gòu))的部分。簡(jiǎn)言之,將150微升FFPE緩沖液(緩 沖液FFPE,研究用試劑,Siemens Healthcare Diagnostics)加至每個(gè)切片,并在振搖下80 °C孵育30分鐘,以熔化石蠟。冷卻下來后,加入蛋白酶K,在65°C孵育30分鐘。裂解后,通過在 65°C與40yl二氧化硅包被的氧化鐵珠子孵育15分鐘的步驟,從裂解液中移除剩余的組織碎 片。用磁體分離具有表面結(jié)合的組織碎片的珠子,將裂解物轉(zhuǎn)移到一個(gè)標(biāo)準(zhǔn)的2ml深孔板 (96孔)中。在孔中,總RNA和DNA結(jié)合到40yl未使用的珠子上,并在室溫孵育。通過加入600yl 裂解緩沖液產(chǎn)生離液序列高的條件。然后,對(duì)珠子進(jìn)行磁分離,并棄去上清液。之后,洗滌表 面結(jié)合的核酸三次,然后磁化、抽吸并棄去上清液。之后,通過將珠子與l〇〇yl洗脫緩沖液在 70°C、振搖下孵育10分鐘來洗脫核酸。最后,分離珠子,上清液與12yl DNase I混合物(2此 DNase I(不含RNase);10lil 10x DNase I緩沖液;Ambion/Applied Biosystems, Darmstadt,德國(guó))孵育,以除去污染的DNA。在37°C孵育30分鐘后,將不含DNA的總RNA溶液分 為小份并儲(chǔ)存在_80°C下或直接通過逆轉(zhuǎn)錄動(dòng)力學(xué)PCR(RTkPCR)用于mRNA表達(dá)分析。所有樣 品都在ABiPRI:SM.?7900HT(Applied Biosystems,Darmstadt,德國(guó))中通過一步RT-kPCR分 析了多達(dá)3個(gè)參考基因(RPL37A、CALM2、0AZ1)和多達(dá)16個(gè)靶基因的基因表達(dá)。使用R0X(6-羧 基 _X -羅丹明)的 SuperScript? 111 P丨atinurn? - 步定量 RT -P CR 系統(tǒng)(I n v i t r 〇 g e n, Karl sruhe,德國(guó))根據(jù)制造商的說明使用。相應(yīng)的探針和引物在表1中示出。PCR條件如下: 在50 °C下30分鐘,在95 °C下2分鐘,隨后在95 °C下15秒和在60 °C下30秒40個(gè)循環(huán)。所有PCR試 驗(yàn)都平行進(jìn)行三次。作為RNA收率的替代標(biāo)記,如其他地方所述(17),使用持家基因RPL37A 的循環(huán)閾值(Ct)。通過delta-Ct法使用下面的公式計(jì)算靶基因的相對(duì)基因表達(dá)水平:
[0103] 20-(Ct(靶標(biāo))-平均值(Ct(參考基因)))。
[0104] 從Affymetrix HG_U133a陣列(新鮮冷凍組織)到定量實(shí)時(shí)PCR(FFPE組織)的平臺(tái) 轉(zhuǎn)移如下計(jì)算。用這兩個(gè)平臺(tái)測(cè)定來自于158名患者的材料以產(chǎn)生配對(duì)樣品。從PCR數(shù)據(jù)計(jì) 算Delta-Ct值。通過應(yīng)用下界(將所有低于下界的值都設(shè)置為下界),然后計(jì)算以2為底的對(duì) 數(shù),從Affymetrix數(shù)據(jù)計(jì)算log2-表達(dá)。下界的應(yīng)用降低了增大的相對(duì)測(cè)量噪音對(duì)低表達(dá)的 基因/樣品的影響;使用下界20,在0.1和200之間的下界也表現(xiàn)很好。通過最大化delta-Ct 值(來自PCR)與log2-表達(dá)(來自Affymetrix)之間的Pearson相關(guān)系數(shù),為每個(gè)PCR測(cè)定的基 因選擇HG_U133a探針組。其他相關(guān)性量度也有很好的表現(xiàn),例如Spearman相關(guān)系數(shù)。在大多 數(shù)情況下,最相關(guān)的探針組屬于預(yù)期的基因,對(duì)于其余的情況,移除PCR基因以便進(jìn)一步處 理。也移除在平臺(tái)間表現(xiàn)出不佳相關(guān)性的那些基因,其中對(duì)Pearson相關(guān)系數(shù)使用閾值0.7 (在0.5和0.8之間的值),也表現(xiàn)很好。通過以下步驟完成平臺(tái)變換:計(jì)算兩個(gè)平臺(tái)的無監(jiān)督 z-變換并組合它們;然后通過以下步驟將單PCR-delta-Ct值轉(zhuǎn)化為Affymetrix等級(jí):(i)應(yīng) 用仿射線性變換,其中通過PCR數(shù)據(jù)的z-變換確定系數(shù),(ii)應(yīng)用逆仿射線性變換,其中通 過Affymetrix數(shù)據(jù)的z-變換確定系數(shù),(iii )對(duì)log2進(jìn)行逆運(yùn)算,即計(jì)算關(guān)于底數(shù)2的指數(shù)。 兩倍z-變換的替代方案為線性或更高階的回歸、穩(wěn)健回歸或基于主成分的方法,它們也表 現(xiàn)很好。
[0107]下面的表2列出了在本發(fā)明方法中和在特定實(shí)施方案T5、T1、T4和T5b中所用的基 因。表2也顯示了給定基因的過表達(dá)在他莫昔芬治療下是指示好結(jié)果還是壞結(jié)果。表2列出 了基因的功能、細(xì)胞內(nèi)的區(qū)室定位和它參與的細(xì)胞過程。 [0108] 表2:算法T5、T1、T4和T5b的基因列表
[0111] 下面的表3顯示了用于每個(gè)算法的基因組合。
[0112] 表3:用于各個(gè)算法的基因組合:
[0114] 下面的表4顯示了本發(fā)明標(biāo)記基因的Af f y探針組標(biāo)識(shí)號(hào)和TaqMan設(shè)計(jì)標(biāo)識(shí)號(hào)映 射。
[0115] 表4:基因符號(hào)、Affy探針組標(biāo)識(shí)號(hào)和TaqMan設(shè)計(jì)標(biāo)識(shí)號(hào)映射:
[0117] 下面的表5顯示了本發(fā)明標(biāo)記基因的全名、Entrez基因號(hào)、基因庫(kù)收錄號(hào)和染色體 定位。
[0118] 正式符號(hào) 正式全名 Entrez基收錄號(hào) 定位 因號(hào) IIBE2C 遍在蛋白綴合酶 11065 U73379 2:(k(13.12: E2C B1RC5 含桿狀病毒 IAP 重 332 U75285 復(fù)區(qū)5 DHCR7 7-脫氫膽固醇還原酶丨7丨7 AF034544 ilq!3.4 STC2 司腺鈣蛋白 2 8614 AB012664 5q35.2 RBBP8 視網(wǎng)膜母細(xì)胞瘤結(jié)5932 AF043431 18qll.2 合蛋白8_ IL6ST 白介素6信號(hào)轉(zhuǎn)導(dǎo)物3572 M57230 5qll MGP 基質(zhì) Gla 蛋白 4256 M58549 12pl2.3 AZGP1 ?-2-糖蛋白 1,鋅結(jié) 563 BC005306 llq22.1 口 RACGAP1 Rac C3TP:姆e :_化蛋魏 12:7 12ql3 白1 AURKA 極光激酶 4 6790 BC001280 20tjl3 PVALB 小清蛋白 5816 MV1 002854 22ql3.1
[0119] NMU 神經(jīng)調(diào)節(jié)肽 U 10874 X76029 4ql2 PTGER3 前列腺素 E 受體 5733 X83863 lp31.2 3(EP3亞型) CXCL12 趨化因子(C-X-C 基 6387 L36033 lOqll 1 序)配體12(基質(zhì)細(xì)胞 衍生因子1) A BAT 4-氨基丁酸轉(zhuǎn)氨酶 18 L32961 16pl3.2 CDH1 鈣粘著蛋白 1,1 型,999 L08599 I6q22.1 E-鈣粘著蛋白(上皮> PIP 催乳素誘導(dǎo)的蛋白 5304 NMM_002652 7q32-qter 質(zhì)
[0120] 示例算法T5:
[0121] 算法T5是包括四個(gè)成員的委員會(huì)(committee),其中每個(gè)成員是兩個(gè)基因的線性 組合。T5的數(shù)學(xué)公式如下所示;其符號(hào)與T1相同。T5可以僅由基因表達(dá)數(shù)據(jù)計(jì)算。
[0122] 風(fēng)險(xiǎn)成員 1 =0 ? 434039[0 ? 301 ? ? 0 ? 567]*(0 ? 939*BIRC5-3 ? 831)
[0123] -0.491845[-0.714..-0.270]*(0.707*RBBP8-0.934)
[0124] 風(fēng)險(xiǎn)成員2 = 0.488785[0.302. .0.675]*(0.794*UBE2C-1.416)
[0125] -0.374702[-0.570..-0.179]*(0.814*IL6ST-5.034)
[0126] 風(fēng)險(xiǎn)成員 3 = -0 ? 39169 [ -0 ? 541 ? ? -0 ? 242 ] * (0 ? 674*AZGP1 -0 ? 777)
[0127] +0.44229[0.256..0.628]*(0.891*DHCR7-4.378)
[0128] 風(fēng)險(xiǎn)成員4 = -0.377752[-0.543. .-0.212]*(0.485*MGP+4.330)
[0129] -0?177669[-0?267??-0?088]*(0?826*STC2-3?630)
[0130] 風(fēng)險(xiǎn)=風(fēng)險(xiǎn)成員1+風(fēng)險(xiǎn)成員2+風(fēng)險(xiǎn)成員3+風(fēng)險(xiǎn)成員4
[0131] 每行左邊的系數(shù)作為C0X比例風(fēng)險(xiǎn)回歸系數(shù)來計(jì)算,方括號(hào)中的數(shù)字表示這些系 數(shù)的95 %置信區(qū)間。換句話說,可以不將項(xiàng)(0.939*BIRC5-3.831)乘以0.434039,而是將其 乘以在0.301和0.567之間的任何系數(shù),而仍然得到在95%置信區(qū)間內(nèi)的預(yù)測(cè)結(jié)果。每行的 右邊在圓括號(hào)中的項(xiàng)表示從PCR到Affymetrix的平臺(tái)轉(zhuǎn)移:變量PVALB、CDH1、...表示用參 考基因標(biāo)準(zhǔn)化的基于PCR的表達(dá)(delta-Ct值),圓括號(hào)內(nèi)的整個(gè)項(xiàng)對(duì)應(yīng)于相應(yīng)探針組的 Affymetrix微陣列表達(dá)值的對(duì)數(shù)(底數(shù)2)。
[0132] 在他莫昔芬或阿那曲唑治療的患者中測(cè)試了算法T5的表現(xiàn),所述患者帶有不超過 3個(gè)陽性淋巴結(jié)和ER+,HER2-腫瘤,參與隨機(jī)化臨床試驗(yàn)ABCSG06(n = 332)或ABCSG08(n = 1244)。如圖1所示,Cox回歸分析揭示,在所有測(cè)試群組中,T5得分與遠(yuǎn)端轉(zhuǎn)移的發(fā)展有顯著 的相關(guān)性。
[0133] 在用預(yù)定的T5得分截止值對(duì)合并的ABCSG組的患者進(jìn)行分類后,進(jìn)行了Kaplan Meier分析。具有發(fā)展遠(yuǎn)端轉(zhuǎn)移的低風(fēng)險(xiǎn)的患者具有2-9.3的T5得分,而具有發(fā)展遠(yuǎn)端轉(zhuǎn)移 的高風(fēng)險(xiǎn)的患者具有大于-9.3的T5得分。如圖2所示,觀察到兩個(gè)風(fēng)險(xiǎn)組的高度顯著的分 離。
[0134] 重要的是,對(duì)照"在線輔助(Adjuvantlonline)"對(duì)T5得分進(jìn)行了評(píng)估和比較,"在 線輔助"是一個(gè)基于諸如腫瘤大小、腫瘤分級(jí)和淋巴結(jié)狀態(tài)等臨床參數(shù)的輸入來幫助治療 選擇的在線工具。當(dāng)對(duì)照在線輔助復(fù)發(fā)風(fēng)險(xiǎn)得分通過雙變量Cox回歸檢驗(yàn)T5得分時(shí),兩個(gè)得 分同遠(yuǎn)端轉(zhuǎn)移的發(fā)展保持顯著的相關(guān)性。使用分別根據(jù)T5(截止值為-9.3)和在線輔助(截 止值為8)分開的二分?jǐn)?shù)據(jù)進(jìn)行的雙變量Cox回歸,再次取得了非常顯著和獨(dú)立的與到轉(zhuǎn)移 (作為臨床終點(diǎn))的時(shí)間的相關(guān)性。
[0135] 表6: T5和在線輔助的雙變量Cox回歸
[0137] 其中HR =危險(xiǎn)比,95%CI = 95%置信區(qū)間,p = P值。
[0138] 示例性Kaplan Meyer曲線顯示于圖1中,其中根據(jù)預(yù)定的截止值,高=高風(fēng)險(xiǎn)組, 低=低風(fēng)險(xiǎn)組。
[0139]高T5得分值表示在給定的期限內(nèi)發(fā)生遠(yuǎn)端轉(zhuǎn)移的風(fēng)險(xiǎn)增加。
[0140]已經(jīng)證明對(duì)于已用他莫昔芬治療的患者,以及已用芳香酶抑制劑治療的患者,情 況也是這樣。
[0141] 示例算法T1:
[0142] 算法T1是包括三個(gè)成員的委員會(huì),其中每個(gè)成員是多達(dá)四個(gè)變量的線性組合。通 常,變量可以是基因表達(dá)或臨床變量。在T1中,唯一的非基因變量為淋巴結(jié)狀態(tài),如果患者 為淋巴結(jié)陰性,則編碼為0,如果患者為淋巴結(jié)陽性,則編碼為1。11的數(shù)學(xué)公式如下所示。
[0143] 風(fēng)險(xiǎn)成員1=+0.193935[0.108..0.280]*(0.792*卩7厶1^-2.189)
[0144] -0.240252[-0.400..-0.080]*(0.859*CDHl-2.900)
[0145] -0.270069[-0.385..-0.155]*(0.821*STC2-3.529)
[0146] +1.2053[0.534. .1.877]*淋巴結(jié)狀態(tài)
[0147] 風(fēng)險(xiǎn)成員 2 = -0.25051 [-0.437 ? .-0.064]*(0.558*CXCL12+0.324)
[0148] -0.421992[-0.687..-0.157]*(0.715*RBBP8-1.063)
[0149] +0.148497[0.029..0.268]*(1.823*NMU-12.563)
[0150] +0?293563[0?108??0?479]*(0?989*BIRC5-4?536)
[0151] 風(fēng)險(xiǎn)成員3 = +0.308391[0.074. .0.543]*(0.812*AURKA-2.656)
[0152] -0.225358[-0.395..-0.055]*(0.637*PTGER3+0.492)
[0153] -0.116312[-0.202..-0.031]*(0.724*PIP+0.985)
[0154] 風(fēng)險(xiǎn)=+風(fēng)險(xiǎn)成員1+風(fēng)險(xiǎn)成員2+風(fēng)險(xiǎn)成員3
[0155] 每行左邊的系數(shù)作為C0X比例風(fēng)險(xiǎn)回歸系數(shù)來計(jì)算,方括號(hào)中的數(shù)字表示這些系 數(shù)的9 5 %置信區(qū)間。每行的右邊在圓括號(hào)中的項(xiàng)表示從PCR到Af f yme tr i x的平臺(tái)轉(zhuǎn)移:變量 PVALB、CDH1、...表示用參考基因標(biāo)準(zhǔn)化的基于PCR的表達(dá),圓括號(hào)內(nèi)的整個(gè)項(xiàng)對(duì)應(yīng)于相應(yīng) 探針組的Af f ymetr ix微陣列表達(dá)值的對(duì)數(shù)(底數(shù)2)。
[0156] 示例算法T4:
[0157]算法T4是基序(motif)的線性組合。將Af fymetrix數(shù)據(jù)集和PCR數(shù)據(jù)的幾項(xiàng)分析的 前10個(gè)基因群聚成基序。不屬于集群的基因用作單基因基序。在多變量分析中發(fā)現(xiàn)C0X比例 風(fēng)險(xiǎn)回歸系數(shù)。
[0158] 通常,基序可以是單基因表達(dá)或相關(guān)基因的平均基因表達(dá)。T4的數(shù)學(xué)公式如下所 不。
[0159] prolif=((0.84[0.697.,0.977]*RACGAP1-2.174)+(0.85[0.713..0.988]
[0160] *DHCR7-3?808) + (0?94[0?786??1?089]*BIRC5-3?734))/3
[0161] m〇tiv2 = ((0.83[0.693. .0.96]*IL6ST-5.295) + (l.ll[0.930. .1.288]*
[0162] ABAT-7.019)+(0.84[0.701..0.972]*STC2-3.857))/3
[0163] ptger3 = (PTGER3*0.57[0.475. . 0.659]+l. 436)
[0164] cxcll2 = (CXCL12*0.53[0.446. .0.618]+0.847)
[0165] pvalb = (PVALB*0.67[0.558..0.774]-〇.466)
[0166] 每個(gè)基因的因子和偏移表示從PCR到Affymetrix的平臺(tái)轉(zhuǎn)移:變量RACGAP1、 DHCR7、...表示用CALM2和PPIA標(biāo)準(zhǔn)化的基于PCR的表達(dá),圓括號(hào)內(nèi)的整個(gè)項(xiàng)對(duì)應(yīng)于相應(yīng)探 針組的Affymetrix微陣列表達(dá)值的對(duì)數(shù)(底數(shù)2)。方括號(hào)中的數(shù)字表示這些因子的95%置 信區(qū)間。
[0167] 由于該算法在與臨床變量結(jié)合時(shí)表現(xiàn)甚至更好,因此加入淋巴結(jié)狀態(tài)。在T4中,如 果患者為淋巴結(jié)陰性,則淋巴結(jié)狀態(tài)編碼為〇,如果患者為淋巴結(jié)陽性,則編碼為1。于是,算 法T4為:
[0168] M& = -0.32[-0.510..-0.137]*motiv2
[0169] +0.65[0.411.,0.886]*prolif
[0170] -0.24[-0.398..-0.08]*ptger3
[0171] -0.05[_0.225..0.131]*cxcll2
[0172] +0.09[0.019.,0.154]*pvalb
[0173] +淋巴結(jié)狀態(tài)
[0174] 風(fēng)險(xiǎn)系數(shù)作為COX比例風(fēng)險(xiǎn)回歸系數(shù)來計(jì)算,方括號(hào)中的數(shù)字表示這些系數(shù)的 95 %置信區(qū)間。
[0175] 算法T5b是包括兩個(gè)成員的委員會(huì),其中每個(gè)成員是四個(gè)基因的線性組合。T5b的 數(shù)學(xué)公式如下所示,其符號(hào)與T1和T5相同。在T5b中,非基因變量為淋巴結(jié)狀態(tài),如果患者為 淋巴結(jié)陰性,則編碼為0,如果患者為淋巴結(jié)陽性,則編碼為1,而如果淋巴結(jié)狀態(tài)未知,則編 碼為0.5。了513定義為:
[0176] 風(fēng)險(xiǎn)成員 1=0.359536[0.153. .0.566]*(0.891*DHCR7-4.378)
[0177] -0.288119[-0.463..-0.113]*(0.485*MGP+4.330)
[0178] +0.257341[0.112.,0.403]*(1.118*NMU-5.128)
[0179] -0?337663[-0?499??-0?176]*(0?674*AZG卟0?777)
[0180] 風(fēng)險(xiǎn)成員2 = -0.374940[-0.611..-0.139]*(0.707*1^8?8-0.934)
[0181] -0?387371[-0?597??-0?178]*(0?814*IL6ST-5?034)
[0182] +0.800745[0.551..1.051]*(0.860*RACGAPl-2.518)
[0183] +0.770650[0.323. .1.219]*淋巴結(jié)狀態(tài)
[0184] 風(fēng)險(xiǎn)=風(fēng)險(xiǎn)成員1+風(fēng)險(xiǎn)成員2
[0185] 本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,這些算法代表特定的例子,并且基于表2中給出的關(guān)于 基因表達(dá)與結(jié)果的相關(guān)性的信息,可以用常規(guī)技術(shù)建立替代算法。
[0186] 采用基因子集的算法簡(jiǎn)化
[0187] "示例算法T5"是一個(gè)由四個(gè)成員組成的委員會(huì)預(yù)測(cè)器,每個(gè)成員具有2個(gè)目標(biāo)基 因。每個(gè)成員都是獨(dú)立的且自包含的遠(yuǎn)端復(fù)發(fā)預(yù)測(cè)器,每個(gè)附加的成員均有助于算法的穩(wěn) 健性和預(yù)測(cè)能力,以預(yù)測(cè)乳腺癌患者的到轉(zhuǎn)移的時(shí)間、到死亡的時(shí)間或存活的可能性。下面 的等式示出了"示例算法T5";為便于讀取,小數(shù)點(diǎn)后的位數(shù)已截短為2位;在方括號(hào)中的范 圍列出了系數(shù)的估計(jì)范圍(平均值+/_3個(gè)標(biāo)準(zhǔn)差)。
[0188] T5 算法:
[0189] +0.41[0.21..0.61]*BIRC5-0.33[-0.57...09]*RBBP8
[0190] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0191] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7
[0192] -0.18[-0.31..-0.06]*MGP-0.13[-0.25..-0.02]*STC2
[0193] c-指數(shù):訓(xùn)練集= 0.724
[0194] 該算法中的基因名稱表示該基因的mRNA表達(dá)與一個(gè)或多個(gè)如上所述的持家基因 相比的差異。
[0195] 分析不同于發(fā)現(xiàn)群組(234個(gè)腫瘤樣品)的群組,令人驚訝地發(fā)現(xiàn),"原始T5算法"的 一些簡(jiǎn)化仍然取得了沒有明顯差于原始T5算法的診斷表現(xiàn)。最直接的簡(jiǎn)化是將委員會(huì)預(yù)測(cè) 器減少至僅有一個(gè)成員。"單成員委員會(huì)"的表現(xiàn)示例如下所示:
[0196] 僅成員1:
[0197] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0198] c-指數(shù):訓(xùn)練集=0 ? 653,獨(dú)立群組=0 ? 681
[0199] 僅成員2:
[0200] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0201] c-指數(shù):訓(xùn)練集=0 ? 664,獨(dú)立群組=0 ? 696
[0202]僅成員3:
[0203] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7
[0204] c-指數(shù):訓(xùn)練集=〇 ? 666,獨(dú)立群組=0 ? 601
[0205] 僅成員4:
[0206] -0.18[-0.31..-0.06]*MGP-0.13[-0.25..-0.02]*STC2
[0207] c-指數(shù):訓(xùn)練集=0 ? 668,獨(dú)立群組=0 ? 593
[0208] 與完整算法的表現(xiàn)相比,如在234個(gè)樣品的獨(dú)立群組中所示的單成員委員會(huì)的表 現(xiàn)顯著下降。不過,使用由較少的成員組成的委員會(huì)允許更簡(jiǎn)單、更低成本地估計(jì)乳腺癌復(fù) 發(fā)或乳腺癌死亡的風(fēng)險(xiǎn),這對(duì)于某些診斷目的來說可能是可以接受的。
[0209] 逐漸組合多于一個(gè)但少于四個(gè)的成員形成一個(gè)新的預(yù)后委員會(huì)預(yù)測(cè)器算法,往往 會(huì)導(dǎo)致診斷表現(xiàn)與單成員委員會(huì)相比有小但顯著的提升。令人驚訝地發(fā)現(xiàn),一些委員會(huì)成 員的組合會(huì)產(chǎn)生顯著的改善而其他組合幾乎沒有改善。最初,假設(shè)如采用的基因所反映的、 代表相似生物學(xué)基序的成員組合,與反映顯著不同的生物學(xué)基序的組合成員相比,會(huì)產(chǎn)生 較小的改善。然而,情況并不是這樣。沒有規(guī)則被確認(rèn)可以預(yù)言一些基因的組合比另一基因 組合產(chǎn)生表現(xiàn)出更強(qiáng)預(yù)測(cè)能力的算法。只能基于實(shí)驗(yàn)數(shù)據(jù)選擇有希望的組合。
[0210] 經(jīng)確認(rèn)可以產(chǎn)生簡(jiǎn)化但強(qiáng)大的算法的組合委員會(huì)成員的組合如下所示。
[0211] 僅成員1和2:
[0212] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0213] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0214] c-指數(shù):訓(xùn)練集= 0.675,獨(dú)立群組= 0.712 [0215] 僅成員1和3:
[0216] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0217] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7
[0218] c-指數(shù):訓(xùn)練集=0 ? 697,獨(dú)立群組=0 ? 688 [0219] 僅成員1和4:
[0220] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0221] -0.18[-0.31..-0.06]*MGP-0.13[-0.25..-0.02]*STC2
[0222] c-指數(shù):訓(xùn)練集=0.705,獨(dú)立群組=0.679
[0223] 僅成員2和3:
[0224] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0225] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7
[0226] c-指數(shù):訓(xùn)練集=0 ? 698,獨(dú)立群組=0 ? 670
[0227] 僅成員1、2和3:
[0228] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0229] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0230] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7 [0231 ] c-指數(shù):訓(xùn)練集=0 ? 701,獨(dú)立群組=0 ? 715
[0232] 不省略整個(gè)委員會(huì)成員而只省略不同委員會(huì)成員中的單個(gè)基因或多個(gè)基因也是 可能的,但是需要對(duì)整個(gè)算法進(jìn)行再訓(xùn)練。不過,它也有利于執(zhí)行。通過省略整個(gè)成員或個(gè) 別基因所產(chǎn)生的簡(jiǎn)化算法的表現(xiàn)在很大程度上是相同的。
[0233] 通過基因替換產(chǎn)生的算法變型
[0234] 上面描述的算法,如"示例算法T5",也可以通過將一個(gè)或多個(gè)基因替換為一個(gè)或 多個(gè)其他的基因來進(jìn)行修改。這樣修改的目的是將在特定平臺(tái)上難以測(cè)定的基因替換為更 易于在這個(gè)平臺(tái)上分析的基因。雖然與起始算法相比,這種轉(zhuǎn)移可能并不一定會(huì)產(chǎn)生改善 的表現(xiàn),但它可以產(chǎn)生將這種預(yù)后算法植入到特定診斷平臺(tái)的線索。通常,通過將一個(gè)基因 替換為具有高相關(guān)性的(例如,由Pearson相關(guān)系數(shù)所顯示的)共表達(dá)基因,能夠最佳地實(shí)現(xiàn) 用另一個(gè)基因取代一個(gè)基因,同時(shí)保留預(yù)測(cè)算法的診斷力。不過,需要記住,在一個(gè)平臺(tái)上 高度相關(guān)的兩個(gè)基因的mRNA表達(dá)當(dāng)在另一個(gè)平臺(tái)上評(píng)估時(shí),可能會(huì)表現(xiàn)為完全相互獨(dú)立。 因此,當(dāng)為了便于在實(shí)驗(yàn)上實(shí)踐而減少時(shí),這種表面上簡(jiǎn)單的替換可能會(huì)產(chǎn)生令人失望的 糟糕結(jié)果,以及令人驚訝的好結(jié)果,這總是取決于所用平臺(tái)的無法估量的因素。通過重復(fù)該 過程,可以替換幾個(gè)基因。
[0235] 通過在驗(yàn)證群組上評(píng)估T5算法得分及其變型的預(yù)測(cè)表現(xiàn),可以證明這種方法的有 效性。下表顯示了在兩個(gè)驗(yàn)證群組中關(guān)于終點(diǎn)遠(yuǎn)端復(fù)發(fā)的c-指數(shù)。
[0236] 表 7
[0239] 可以看到一個(gè)T5基因(此處以BIRC5為例示出)的省略顯著降低了預(yù)測(cè)表現(xiàn)。將其 替換為另一基因產(chǎn)生幾乎相同的表現(xiàn)。
[0240] 替換一個(gè)基因的較好的方法是重新訓(xùn)練該算法。由于T5由四個(gè)獨(dú)立的委員會(huì)成員 組成,只需要重新訓(xùn)練含有替換的基因的成員。下面的公式顯示了在234名乳腺癌患者的群 組中訓(xùn)練的上述T5算法的基因替換。下面只示出了一個(gè)成員,對(duì)于c-指數(shù)計(jì)算,使用的其余 成員與原始T5算法相比沒有改變。在方括號(hào)中的范圍列出了估計(jì)的系數(shù)范圍:平均值+/-3 個(gè)標(biāo)準(zhǔn)差。
[0241] T5 的成員 1:
[0242] 原始成員1:
[0243] +0.41[0.21..0.61]*BIRC5-0.33[-0.57..-0.09]*RBBP8
[0244] c-指數(shù):訓(xùn)練集=〇 ? 724,獨(dú)立群組=0 ? 705
[0245] 將成員1中的BIRC5替換為T0P2A:
[0246] +0.47[0.24..0.69]*TOP2A-〇.34[-0.58...10]*RBBP8
[0247] c-指數(shù):訓(xùn)練集=0 ? 734,獨(dú)立群組=0 ? 694
[0248] 將成員1中的BIRC5替換為RACGAP1:
[0249] +0.69[0.37.,1.00]*RACGAPl-0.33[-0.57.,-0.09]*RBBP8
[0250] c-指數(shù):訓(xùn)練集=0 ? 736,獨(dú)立群組=0 ? 743
[0251] 將成員1中的RBBP8替換為CELSR2:
[0252] +0.38[0.19..0.57]*BIRC5-0.18[-0.41..0.05]*CELSR2
[0253] c-指數(shù):訓(xùn)練集=0 ? 726,獨(dú)立群組=0 ? 680 [0254] 將成員1中的RBBP8替換為PGR:
[0255] +0.35[0.15..0.54]*BIRC5-0.09[-0.23..0.05]*PGR
[0256] c-指數(shù):訓(xùn)練集=0 ? 727,獨(dú)立群組=0 ? 731
[0257] T5 的成員 2:
[0258]原始成員2:
[0259] +0.38[0.15..0.61]*UBE2C-0.30[-0.55..-0.06]*IL6ST
[0260] c-指數(shù):訓(xùn)練集=0.724,獨(dú)立群組=0.725
[0261] 將成員2中的UBE2C替換為RACGAP1:
[0262] +0.65[0.33..0.96]*RACGAPl-0.38[-0.62..-0.13]*IL6ST
[0263 ] c-指數(shù):訓(xùn)練集=0 ? 735,獨(dú)立群組=0 ? 718
[0264] 將成員2中的UBE2C替換為T0P2A:
[0265] +0.42[0.20..0.65]*T0P2A-0.38[-0.62..-0.13]*IL6ST
[0266] c-指數(shù):訓(xùn)練集=0 ? 734,獨(dú)立群組=0 ? 700
[0267] 將成員2中的IL6ST替換為INPP4B:
[0268] +0.40[0.17..0.62]*UBE2C-0.25[-0.55..0.05]*INPP4B
[0269] c-指數(shù):訓(xùn)練集=0 ? 725,獨(dú)立群組=0 ? 686
[0270] 將成員2中的IL6ST替換為MAPT:
[0271] +0.45[0.22..0.69]*UBE2C-0.14[-0.28..0.01]*MAPT
[0272 ] c-指數(shù):訓(xùn)練集=0.727,獨(dú)立群組=0.711
[0273] T5 的成員 3:
[0274] 原始成員3:
[0275] -0.28[-0.43..-0.12]*AZGP1+0.42[0.16..0.68]*DHCR7
[0276] c-指數(shù):訓(xùn)練集=0 ? 724,獨(dú)立群組=0 ? 705
[0277] 將成員3中的AZGP1替換為PIP:
[0278] -0.10[-0.18..-0.02]*PIP+0.43[0.16..0.70]*DHCR7
[0279] c-指數(shù):訓(xùn)練集=0 ? 725,獨(dú)立群組=0 ? 692
[0280] 將成員3中的AZGP1替換為EPHX2:
[0281] -0.23[-0.43..-0.02]*EPHX2+0.37[0.10..0.64]*DHCR7
[0282] c-指數(shù):訓(xùn)練集=0 ? 719,獨(dú)立群組=0 ? 698
[0283] 將成員3中的AZGP1替換為PLAT:
[0284] -0.23[-0.40..-0.06]*PLAT+0.43[0.18..0.68]*DHCR7
[0285] c-指數(shù):訓(xùn)練集= 0.712,獨(dú)立群組= 0.715
[0286] 將成員3中的DHCR7替換為AURKA:
[0287] -0.23[-0.39..-0.06]*AZGP1+0.34[0.10..0.58]*AURKA
[0288] c-指數(shù):訓(xùn)練集=0 ? 716,獨(dú)立群組=0 ? 733
[0289] T5 的成員 4:
[0290]原始成員4:
[0291] -0.18[-0.31..-0.06]*MGP-0.13[-0.25..-0.02]*STC2
[0292] c-指數(shù):訓(xùn)練集=0 ? 724,獨(dú)立群組=0 ? 705
[0293] 將成員4中的MGP替換為AP0D:
[0294] -0.16[-0.30..-0.03]*AP0D-0.14[-0.26..-0.03]*STC2
[0295] c-指數(shù):訓(xùn)練集=0 ? 717,獨(dú)立群組=0 ? 679
[0296] 將成員4中的MGP替換為EGFR:
[0297] -0.21[-0.37..-0.05]*EGFR-〇.14[-0.26...03]*STC2
[0298] c-指數(shù):訓(xùn)練集= 0.715,獨(dú)立群組= 0.708
[0299] 將成員4中的STC2替換為INPP4B:
[0300] -0.18[-0.30.,-0.05]*MGP-0.22[-0.53..0.08]*INPP4B
[0301] c-指數(shù):訓(xùn)練集= 0.719,獨(dú)立群組= 0.693
[0302] 將成員4中的STC2替換為SEC14L2:
[0303] -0.18[-0.31..-0.06]*MGP-0.27[-0.49..-0.06]*SEC14L2
[0304] c-指數(shù):訓(xùn)練集=〇 ? 718,獨(dú)立群組=0 ? 681
[0305] 可以看到,為了用動(dòng)力學(xué)PCR進(jìn)行定量而在實(shí)驗(yàn)上鑒定的單基因的替換通常影響 T5算法的預(yù)測(cè)表現(xiàn),根據(jù)c-指數(shù)評(píng)估,其影響不顯著。
[0306]下表(表8)顯示了針對(duì)T5算法的基因的潛在替換候選基因。每個(gè)候選基因顯示在 一個(gè)單元格中:基因名稱后接著是括號(hào)內(nèi)的T5算法中原始基因和替換候選基因的表達(dá)的絕 對(duì)Pearson相關(guān)系數(shù),和HG-U133A探針組標(biāo)識(shí)號(hào)。
[0307]表 8
[0309] 下表(表9)列出了用于上表的qRT-PCR引物和探針序列。
[0310] 表9
[0312]用于無監(jiān)督選擇可能的基因替換候選物的第二種替代方法僅基于Affymetrix數(shù) 據(jù)。這具有僅基于已經(jīng)公開的數(shù)據(jù)(例如來自www.ncbi .nlm.nih.gov/geo/)就能夠完成的 優(yōu)點(diǎn)。下表(表10)列出了針對(duì)在算法T1-T5中使用的探針組的HG-U133a探針組替換候選基 因。這基于這些算法的訓(xùn)練數(shù)據(jù)。列的標(biāo)題中包含以粗體顯示的基因名稱和探針組標(biāo)識(shí)號(hào)。 然后,列出了 10個(gè)最相關(guān)的探針組,其中每個(gè)單元格包含探針組標(biāo)識(shí)號(hào)、在括號(hào)內(nèi)的相關(guān)系 數(shù)和基因名稱。
[0313]表 1〇
[0316]在選擇基因或探針組后,必須定義在待取代的基因的表達(dá)值與新基因的表達(dá)值之 間的數(shù)學(xué)映射。有幾種替代方法在這里基于實(shí)施例"用RACGAP1取代BIRC5的delta-Ct值"進(jìn) 行了討論。在訓(xùn)練數(shù)據(jù)中,表達(dá)的聯(lián)合分布看起來類似于圖3中的分布。
[0317] Pearson 相關(guān)系數(shù)為 0.73。
[0318] -種方法是通過回歸創(chuàng)建從RACGAP1到BIRC5的映射函數(shù)。線性回歸是第一選擇, 并且在該實(shí)例中得出
[0319] BIRC5 = 1.22*RACGAPl-2.85。
[0320] 使用該公式,可以很容易地用右手側(cè)取代例如算法T5中的BIRC5變量。在穩(wěn)健回歸 的其他例子中,多項(xiàng)式回歸或單變量非線性預(yù)變換可能就足夠了。
[0321 ]回歸方法假定在BIRC5上有測(cè)量噪音,但在RACGAP1上無噪音。因此,在這兩個(gè)變量 的可交換性上映射不是對(duì)稱的。對(duì)稱映射方法將基于兩個(gè)單變量z-變換。
[0322] z = (BIRC5-平均值(BIRC5))/標(biāo)準(zhǔn)差(BIRC5)和
[0323] z = (RACGAP1-平均值(RACGAP1))/標(biāo)準(zhǔn)差(RACGAP1)
[0324] z = (BIRC5-8 ? 09)/l ? 29 = (RACGAP1-8 ? 95)/0 ? 77
[0325] BIRC5 = 1.67*RACGAPl+-6.89
[0326] 另外,在其他實(shí)例中,其他變換可能是足夠的:
[0327] 根據(jù)中間值和/或平均絕對(duì)差(mad)標(biāo)準(zhǔn)化,非線性映射,等等。
【主權(quán)項(xiàng)】
1. 用于預(yù)測(cè)乳腺癌患者的雌激素受體陽性和HER2陰性腫瘤的乳腺癌結(jié)果的方法,所述 方法包括: (a) 確定來自所述患者的腫瘤樣品中以下8個(gè)基因的RNA表達(dá)水平:UBE2C、RACGAP1、 DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP; (b) 數(shù)學(xué)地組合在所述腫瘤樣品中值為確定的所述組的基因的表達(dá)水平值,從而得出 組合得分,其中所述組合得分指示所述患者的預(yù)后。2. 根據(jù)權(quán)利要求1所述的方法,其中 UBE2C 可以替換為 BIRC5 或 T0P2A 或 AURKA 或 NEK2 或 E2F8 或 PCNA 或 CYBRD1 或 ADRA2A 或 DCN 或SQLE或CCND1或ASPH或CXCL12或PIP或PRSS16或EGFR或DHCR7或EPHX2或TRIM29;且 DHCR7可以替換為AURKA、BIRC5、UBE2C或任何其他可以代替BIRC5或UBE2C的基因;且 而 STC2 可以替換為 INPP4B 或 IL6ST 或 SEC14L2 或 MAPT 或 CHPT1 或 ABAT 或 SCUBE2 或 ESR1 或 RBBP8或PGR或PTPRT或HSPA2或PTGER3;且 AZGP1 可以替換為 PIP 或 EPHX2 或 PLAT 或 SEC14L2 或 SCUBE2 或 PGR;且 RBBP8可以替換為CELSR2或PGR或STC2或ABAT或IL6 ST;且 IL6ST 可以替換為 INPP4B 或 STC2 或 MAPT 或 SCUBE2 或 ABAT 或 PGR 或 SEC14L2 或 ESR1 或 GJA1 或MGP或EPHX2或RBBP8或PTPRT或PLAT;且 MGP可以替換為APOD或IL6 ST或EGFR。3. 根據(jù)權(quán)利要求1或2所述的方法,其中,所述患者已經(jīng)接受內(nèi)分泌治療或計(jì)劃接受內(nèi) 分泌治療。4. 如權(quán)利要求3所述的方法,其中所述內(nèi)分泌治療包含他莫昔芬或芳香酶抑制劑。5. 根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其中,預(yù)測(cè)發(fā)生乳腺癌復(fù)發(fā)或癌癥相關(guān)死 亡的風(fēng)險(xiǎn)。6. 根據(jù)權(quán)利要求1所述的方法,其中,所述表達(dá)水平通過以下方法中的至少一種來確 定: 基于PCR的方法, 基于微陣列的方法,和 基于雜交的方法。7. 如前述權(quán)利要求中任一項(xiàng)所述的方法,其中,所述表達(dá)水平的確定是在福爾馬林固 定的、石蠟包埋的腫瘤樣品中,或在新鮮冷凍的腫瘤樣品中進(jìn)行的。8. 如前述權(quán)利要求中任一項(xiàng)所述的方法,其中,至少一個(gè)標(biāo)記基因的表達(dá)水平作為相 對(duì)于至少一個(gè)參考基因或相對(duì)于計(jì)算的平均表達(dá)值的表達(dá)模式進(jìn)行確定。9. 如前述權(quán)利要求中任一項(xiàng)所述的方法,其中,所述數(shù)學(xué)組合步驟包括對(duì)代表給定基 因表達(dá)水平的值應(yīng)用算法的步驟。10. 如權(quán)利要求9所述的方法,其中所述算法是所述代表給定基因表達(dá)水平的值的線性 組合。11. 如權(quán)利要求10所述的方法,其中代表給定基因表達(dá)水平的值乘以一個(gè)系數(shù)。12. 如前述權(quán)利要求中任一項(xiàng)所述的方法,其中,為所述組合得分確定一個(gè)、兩個(gè)或兩 個(gè)以上的閾值,通過對(duì)所述組合得分應(yīng)用該閾值,其判別為高和低風(fēng)險(xiǎn),高、中和低風(fēng)險(xiǎn),或 更多個(gè)風(fēng)險(xiǎn)組,高組合得分表明從細(xì)胞毒性化學(xué)治療中受益。13. 如前述權(quán)利要求中任一項(xiàng)所述的方法,其中,在所述數(shù)學(xué)地組合基因表達(dá)水平值以 得出組合得分的步驟中處理關(guān)于所述患者的淋巴結(jié)狀態(tài)的信息。14. 如權(quán)利要求12或13所述的方法,其中,如果所述淋巴結(jié)狀態(tài)是陰性的,則所述關(guān)于 淋巴結(jié)狀態(tài)的信息是一個(gè)數(shù)值;如果所述淋巴結(jié)狀態(tài)是陽性的,則所述信息是一個(gè)不同的 數(shù)值;如果所述淋巴結(jié)狀態(tài)未知,則所述信息是一個(gè)不同或相同的數(shù)值。15. -種用于執(zhí)行權(quán)利要求1至14中任一項(xiàng)所述的方法的試劑盒的用途,所述試劑盒包 括一組能夠特異性結(jié)合基因組合中基因的序列或基因片段的序列的寡核苷酸,其中,所述 組合包括以下8個(gè)基因:UBE2C、RACGAP1、DHCR7、STC2、AZGP1、RBBP8、IL6ST和MGP。
【文檔編號(hào)】C12Q1/68GK105821125SQ201610238134
【公開日】2016年8月3日
【申請(qǐng)日】2011年3月29日
【發(fā)明人】馬瑞克·達(dá)特曼, 因克·賽賓·費(fèi)德, 馬蒂亞斯·格爾曼, 圭多·亨尼希, 卡斯滕·韋伯, 克里斯蒂安·馮托爾訥, 拉爾夫·克羅嫩維特, 克里斯托夫·佩特里
【申請(qǐng)人】斯維丹診斷有限責(zé)任公司