專利名稱:能預(yù)測人類乳腺癌轉(zhuǎn)移能力的拷貝數(shù)變化的制作方法
技術(shù)領(lǐng)域:
本發(fā)明在一個實施例中涉及通過確定指定基因中的單核苷酸多態(tài)性(SNP)數(shù)目 來提供乳腺癌的預(yù)后的方法。
背景技術(shù):
乳腺癌是一種異質(zhì)性疾病,呈現(xiàn)出多種臨床表現(xiàn)、組織學(xué)類型和生長速率。在沒有 可檢測的淋巴結(jié)轉(zhuǎn)移的患者(據(jù)認(rèn)為低風(fēng)險的群體)中,20-30%的患者在五到十年的隨訪 后發(fā)展復(fù)發(fā)性疾病。目前不能可靠地進(jìn)行這組中有復(fù)發(fā)風(fēng)險的個體的鑒定。DNA拷貝數(shù)變化(CNA)或者拷貝數(shù)多態(tài)性(CNP),如缺失、插入和擴(kuò)增,據(jù)認(rèn)為是促 成癌發(fā)生的主要基因組變化之一。常規(guī)的和基于陣列的比較基因組雜交均已揭示了乳腺腫 瘤中發(fā)生了變化的染色體區(qū)域。但是,沒有使用高通量、高分辨率平臺來研究DNA拷貝數(shù)變 化與乳腺癌預(yù)后的關(guān)系的研究。
發(fā)明內(nèi)容
本文公開的方法使得使用拷貝數(shù)變化(CNA)來預(yù)測患者預(yù)后結(jié)果成為可行。當(dāng)與 基于基因表達(dá)的特征集合(signature)結(jié)合在一起來進(jìn)行預(yù)后時,拷貝數(shù)特征集合(CNS) 能精修風(fēng)險分類,并且能鑒定具有明顯更差的預(yù)后前景和對化療藥物的潛在差異響應(yīng)的那 些乳腺癌患者。在本文討論的實例中,使用了高通量和高分辨率的基于寡核苷酸的單核苷酸多態(tài) 性(SNP)陣列技術(shù)來分析乳腺癌基因組中超過100,000個SNP基因座的CNA。在一大群的 313名LNN(淋巴結(jié)陰性)乳腺癌患者中,鑒定了與一亞群具有非常高的發(fā)展遠(yuǎn)程轉(zhuǎn)移的可 能性的患者相關(guān)的CNA。在兩個獨立的患者群體中驗證了 CNA的預(yù)后能力。另外,使用公布 的預(yù)測性基因特征集合,對所鑒定的具有不同預(yù)后的患者亞群測試了推定性藥物功效。結(jié) 果表明,將DNA拷貝數(shù)分析和基因表達(dá)分析相組合,能提供另外的和更好的乳腺癌患者風(fēng) 險評估方法。
本發(fā)明參照附圖進(jìn)行公開,其中圖1是鑒定具有預(yù)后性拷貝數(shù)變化(CNA)的基因(SNP)的分析工作流程;圖2A和2B示出了具有預(yù)后性CNA的染色體區(qū)域;圖3顯示無遠(yuǎn)程轉(zhuǎn)移的存活與CNS的關(guān)系;圖4說明對化療化合物的敏感性;
圖5圖示ER陽性腫瘤和ER陰性腫瘤的分化;和圖6顯示ER陰性腫瘤的某些數(shù)據(jù)。本文給出的實例舉例說明了本發(fā)明的幾個實施例,但是不應(yīng)該理解為以任何方式 限制本發(fā)明的范圍。
具體實施例方式特定的DNA拷貝數(shù)變化(CNA),如缺失和擴(kuò)增,是通過減低的凋亡、未受約束的增 殖和增加的運(yùn)動性和血管發(fā)生促成癌發(fā)生和腫瘤進(jìn)展的主要基因組變化。由于很大部分的 基因組畸變與癌癥生物學(xué)無關(guān),而是僅僅由隨機(jī)的中性事件所致,因此要鑒定負(fù)責(zé)最終導(dǎo) 致惡性轉(zhuǎn)化和進(jìn)展的基因表達(dá)調(diào)節(jié)的那些致病基因CNA,這是一個挑戰(zhàn)。熒光原位雜交和比 較基因組雜交(CGH)均已揭示了乳腺腫瘤中顯示CNA的染色體區(qū)域。在最近的包括51個 乳腺腫瘤的研究中,將高分辨率SNP與基因表達(dá)概況分析相結(jié)合使用來精修乳腺癌擴(kuò)增子 邊界和縮小潛在驅(qū)動基因名單。但是,僅有少數(shù)的研究考察了 CNA的預(yù)后意義,而這些研究 的樣品數(shù)量過小,因此不能得出確切的結(jié)論。另外,以足夠的樣品數(shù)量和具有對人基因組的 適當(dāng)覆蓋率和定位(mapping)分辨率的技術(shù),采用CNA和基因表達(dá)概況分析的組合分析來 考察乳腺癌預(yù)后的研究就更少。本說明書描述了 313個淋巴結(jié)陰性(LNN)原發(fā)性乳腺腫瘤的基因組DNA中,人基 因組的100,000多個SNP基因座的DNA拷貝數(shù)的分析,所述腫瘤同時還有全基因組基因表 達(dá)數(shù)據(jù)可供利用。將這兩個數(shù)據(jù)集相結(jié)合可以鑒定與遠(yuǎn)程轉(zhuǎn)移有高度相關(guān)性的基因組基因 座和它們的定位基因?;诠嫉念A(yù)測性特征集合,對經(jīng)鑒定的患者亞群進(jìn)一步測試推定 性藥物功效。對沒有接受輔助性系統(tǒng)治療的一大群313名LNN乳腺癌患者進(jìn)行了 DNA拷貝數(shù)和 基因表達(dá)的組合分析。就我們所知,在使用分辨率比aCGH高得多的的高密度SNP陣列技術(shù) 分析CNA以進(jìn)行乳腺癌預(yù)后的研究中,這是最大型的一個。從200名LNN患者的訓(xùn)練集鑒 定了顯示CNA和一致的基因表達(dá)調(diào)節(jié)的81個基因的特征集合。將這個CNS在獨立的113 名LNN患者中以及在116名LNN患者的外部aCGH數(shù)據(jù)集中進(jìn)行了驗證。初步的臨床效用 已得到證明,因為由81基因CNS鑒定具有特別快速的復(fù)發(fā)的極差預(yù)后組實際上構(gòu)成了由單 獨的76基因GES預(yù)測的差預(yù)后患者亞群。因此通過在應(yīng)用GES之外還應(yīng)用CNS,乳腺癌患 者的預(yù)后的風(fēng)險分類得到明顯改進(jìn)。此外,通過使用之前報道的有關(guān)對化療化合物的敏感 性的基因特征集合譜(gene signature prof ile),證實這個極差預(yù)后組對手術(shù)前T/FAC組 合化療特別是對環(huán)磷酰胺和多柔比星化合物的抗性可能要高得多,而卻受益于依托泊苷和 托泊替康。這可提示,與其他患者組相比,屬于這個類別的患者應(yīng)加以緊密監(jiān)測,并用不同 的化療方案進(jìn)行管理,而且CNS的81個基因在化療敏感性方面也起到重要作用。之前的考察基因擴(kuò)增和乳腺癌預(yù)后之間的關(guān)系的研究,將不同的乳腺癌亞型如ER 陽性和ER陰性認(rèn)為是單一同類群體。但是,眾所周知,這些腫瘤在病理學(xué)上和生物學(xué)上差 異極大,這由大為不同的全局基因表達(dá)譜得到證明。這一二分情形(dichotomy)還延伸到 DNA拷貝數(shù)的全局模式。因此,所述分析需要分別對ER陽性和ER陰性(雌激素受體陽性 和陰性)腫瘤來進(jìn)行。的確,從ER陽性腫瘤鑒定的預(yù)后性染色體區(qū)域與ER陰性腫瘤享有 的共同之處極少。例如,染色體區(qū)域8q是公知的與乳腺癌預(yù)后差有關(guān)的DNA擴(kuò)增位點。區(qū)域8q在ER陽性腫瘤中的確是擴(kuò)增熱點,但對于ER陰性腫瘤卻不含明顯的擴(kuò)增區(qū)域。由 于ER陰性腫瘤僅占LNN乳腺癌的一小部分( 25% ),有理由推測,那些在其分析中沒有 將兩種類型的乳腺腫瘤區(qū)分開來的研究可能會讓其結(jié)論受控于來自占大部分的ER陽性腫 瘤樣品的結(jié)果。從我們的分析觀察到的這兩類腫瘤之間的另一明顯差異在于染色體區(qū)域 20ql3. 2-13. 3。ER陽性腫瘤中這個區(qū)域的拷貝數(shù)的增加,但相反ER陰性腫瘤中這個區(qū)域的 拷貝數(shù)的損失,與早期復(fù)發(fā)相關(guān)。這些結(jié)果合在一起再度強(qiáng)調(diào),ER陽性腫瘤和ER陰性腫瘤 遵循不同的生物途徑來進(jìn)行癌發(fā)育和發(fā)展。預(yù)后件染餼體區(qū)域的鑒定從每個SNP的四分位拷貝數(shù)估計數(shù)(interquartile copy numberestimate)計算 得到的平均拷貝數(shù)的中值為2. 1,這與基因組的大部分是二倍體的一般假定相一致。用PCA 對所有313個腫瘤進(jìn)行的無監(jiān)督分析表明,染色體拷貝數(shù)變化在ER陽性腫瘤和ER陰性腫 瘤之間顯示明顯的分離傾向(圖5)。因此,這兩類乳腺腫瘤不僅在如之前許多研究所示的 全局基因表達(dá)方面有差異,而且在DNA水平上也有不同的染色體變化。因此,有必要分別對 ER陽性腫瘤和ER陰性腫瘤進(jìn)行隨后的分析。將患者以大約2 1的比例隨機(jī)分成200名 患者(ER陽性腫瘤133名,ER陰性腫瘤67名)的訓(xùn)練集和113名患者(ER陽性腫瘤66名, ER陰性腫瘤47名)的測試集(表1和圖1)。訓(xùn)練集用來鑒定預(yù)后性染色體區(qū)域和被定位 基因,并用來構(gòu)建CNS以預(yù)測遠(yuǎn)程轉(zhuǎn)移;測試集是為了驗證目的單獨留出。首先,鑒定出其CNA與患者的DMFS相關(guān)的染色體區(qū)域。對于ER陽性腫瘤,分布在 17條染色體上的45個染色體區(qū)域被鑒定為具有與DMFS相關(guān)的CNA (圖2A和表7),對于ER 陰性腫瘤,有56個區(qū)域分布在19條染色體上(表8)。ER陽性腫瘤和ER陰性腫瘤的這些 區(qū)域大小的總數(shù)分別為521Mb (表4)和496Mb (表5)。從ER陽性腫瘤鑒定的預(yù)后性染色體 區(qū)域與ER陰性腫瘤享有的共同之處極少(圖2A和2B)。在200名患者的訓(xùn)練集當(dāng)中,構(gòu)建了 81基因預(yù)后性拷貝數(shù)特征集合(copy number signature, CNS),該特征集合在113名患者的獨立測試集當(dāng)中(風(fēng)險比[HR] :2.8,95%置 信區(qū)間[Cl] :1.4-5.6,ρ = 0.0036)和在116名患者的外部數(shù)據(jù)集當(dāng)中(HR:3. 7,95CI 1.3-10.6,ρ = 0.0102)鑒定到遠(yuǎn)程轉(zhuǎn)移概高率的患者亞群。這些高風(fēng)險患者構(gòu)成了由我 們之前確立的76基因表達(dá)特征集合(gene expression signature, GES)預(yù)測到的高風(fēng)險 患者亞群。由CNS和GES鑒定出的這個極差預(yù)后組對手術(shù)前紫杉醇和5-FU-多柔比星-環(huán) 磷酰胺(T/FAC)組合化療(ρ = 0. 0003)特別是對多柔比星和環(huán)磷酰胺化合物的抗性據(jù)推 定更高,而卻潛在受益于依托泊苷和托泊替康?;颊邩悠繁狙芯恐惺褂昧藦腅rasmus醫(yī)學(xué)中心(荷蘭鹿特丹)腫瘤庫選擇的313名LNN 乳腺癌患者的冷凍腫瘤樣本。這些患者都沒有接受過任何系統(tǒng)(新)輔助療法。局部原 發(fā)治療的指導(dǎo)方針是一樣的。在這些樣本當(dāng)中,273個用來產(chǎn)生76基因特征集合,以供用 Affymetrix U133A芯片預(yù)測遠(yuǎn)程轉(zhuǎn)移。其余40名患者用來研究預(yù)后性生物途徑。本研 究得到荷蘭鹿特丹Erasmus醫(yī)學(xué)中心的醫(yī)學(xué)倫理委員會的批準(zhǔn)(MEC 02. 953),并按照荷 蘭醫(yī)學(xué)科學(xué)學(xué)會聯(lián)盟(the Federation of Medical Scientific Societies)的行為準(zhǔn) 則(http://www.fmwv.nl/)進(jìn)行,并且在可能的情況下遵循腫瘤標(biāo)志預(yù)后研究的報道建議 REMARK(Reporting Recommendations forTumor Marker Prognostic Studies REMARK)。
用之前描述的ER(和PgR)截止值,有199個腫瘤樣本被歸類為ER陽性,114個為 ER陰性?;颊咴谑中g(shù)(保乳手術(shù)230名患者;改良式的乳房根除術(shù)83名患者)時的年 齡中值為54歲(范圍26-83歲)。存活患者(η = 220)的隨訪時間中值為99個月(范 圍20-169個月)。總共有114名患者(36% )發(fā)展了遠(yuǎn)程轉(zhuǎn)移,在DMFS的分析中算作失 敗。在去世的93名患者中,7名死亡時沒有疾病跡象,在DMFS的分析中在最終隨訪時進(jìn)行 審查;86名患者在早先的復(fù)發(fā)后死亡。患者的臨床病理學(xué)特征在表1中給出。含有臨床 和SNP數(shù)據(jù)的數(shù)據(jù)集已提交到Gene ExpressionOmnibus數(shù)據(jù)庫,登錄號為10099 (http // www. ncbi. nlm. nih. gov/geo,用戶名jyu8 ;密石馬jackxyu)。在本研究中用作獨立驗證的116名LNN患者的外部陣列CGH(aCGH)數(shù)據(jù)集下載自 http://www. ncbi. nlm. nih. gov/geo/query/acc. cgi ? acc = GSE8757。與這個數(shù)據(jù)集相 關(guān)的臨床數(shù)據(jù)(表1)由英國劍橋大學(xué)的Teschendorff博士惠贈。DNA分離、雜交和DNA拷貝數(shù)分析用QIAamp DNA小型試劑盒(Qiagen,荷蘭Venlo市)按照廠商提供的方案從 5-10 個 30 μ m 腫瘤冰凍切片(10-25mg)分離基因組 DNA。用 Affymetrix GeneChiρ Mapping 100K陣列組(Affymetrix,Santa Clara, CA)按照標(biāo)準(zhǔn)的方案對得自每個患者樣 品的基因組DNA進(jìn)行等位基因型分析(allelo-typed)。簡言之,將250ng的基因組DNA 用Hind III或Xba I消化,然后連接到能識別黏性四堿基對(bp)突出端的銜接頭。使用 DNAEngine (MJ Research, Watertown, ΜΑ),用能識別該銜接頭序列的通用引物,以經(jīng)優(yōu)化 能優(yōu)先擴(kuò)增250-2000bp大小范圍的片斷的PCR條件,擴(kuò)增銜接頭所連接的DNA片斷。用 Qiagen MinElute 96UF PCR純化系統(tǒng)純化后,使總共40 μ g的PCR產(chǎn)物片斷化,約2. 9 μ g 在4% TBE瓊脂糖凝膠上進(jìn)行顯影,以確認(rèn)DNA片斷的平均尺寸小于180bp。然后將片斷 化的DNA用生物素進(jìn)行標(biāo)記,在雜交爐中與Affymetrix GeneChi ρ HumanMapping 100Κ 陣列組在480C下雜交17小時。用Affymetrix FluidicsStation將陣列洗滌和染色,用 GeneChip 掃描儀 3000 G7 和GeneChip 操作軟件(GCOS) (Affymetrix)進(jìn)行掃描。用 GTYPE (Affymetrix)軟件產(chǎn)生陣列上每個探針組的SNP信號(SNP call)。本研究中96. 6% 的探針組測定到SNP信號,標(biāo)準(zhǔn)偏差為2.6%。然后用CCNT 3. 0軟件產(chǎn)生代表每個探針組 的拷貝數(shù)的數(shù) 。這是通過將每個芯片的雜交強(qiáng)度與廠商提供的100多名各種族正常個 體的強(qiáng)度測量值參考組相比較來進(jìn)行。然后用CCNT的基因組平滑函數(shù),以0. 5Mb的窗口 大小,對拷貝數(shù)測量值進(jìn)行平滑處理。Affymetrix GeneChipiHuman Mapping 100K陣列組 含有115,353個探針組,其精確定位位置得到了界定。各探針組之間的間距的長度中值為 8. 6kb,75%的間距小于28kb,95%的間距小于94. 5kb。n 有予頁 J^ 丨???uim^m^Mmmmm^通過利用可獲得的關(guān)于RNA基因表達(dá)和DNA拷貝數(shù)的基因組數(shù)據(jù)-RNA基因表達(dá) 數(shù)據(jù)是從我們之前的研究產(chǎn)生,而DNA拷貝數(shù)數(shù)據(jù)是在本研究中從同一患者群體獲得_設(shè) 計了綜合性分析方法來鑒定其CNA與遠(yuǎn)程轉(zhuǎn)移相關(guān)的染色體區(qū)域和經(jīng)定位候選基因(圖 1)。我們的方法在原理上與Adler等人采取并描述為微陣列特征集合的逐步連鎖分析 (SLAMS)的方法非常相似,SLAMS是通過使全基因組DNA拷貝數(shù)和基因表達(dá)數(shù)據(jù)交叉來鑒定 表達(dá)特征集合(expression signature)的遺傳調(diào)節(jié)物。對ER陽性患者和ER陰性患者分別進(jìn)行分析,并在平衡臨床和病理參數(shù)(包括T階段、等級、絕經(jīng)狀態(tài)和復(fù)發(fā))的情況下以 大約2 1的比例將患者隨機(jī)分成200名患者的訓(xùn)練集和113名患者的測試集(圖1)。訓(xùn) 練集用來鑒定預(yù)后性染色體區(qū)域和被定位基因,并用來構(gòu)建CNS以預(yù)測遠(yuǎn)程轉(zhuǎn)移;測試集 是為了驗證目的單獨留出。我們的分析中的第一個步驟是鑒定其拷貝數(shù)變化與遠(yuǎn)程轉(zhuǎn)移相關(guān)的染色體區(qū)域。 簡言之,在訓(xùn)練集當(dāng)中,用單變量Cox比例風(fēng)險回歸評估每個單獨SNP的拷貝數(shù)和FMFS的 時間之間的相關(guān)性的統(tǒng)計學(xué)顯著性。然后,為對預(yù)后性染色體區(qū)域進(jìn)行精修,用平均含有 250個SNP的5Mb滑動窗口,以1Mb的階梯對染色體進(jìn)行掃描,以編集該窗口當(dāng)中所有SNP 的Cox回歸ρ值,和確定所有這些SNP作為一個整體相對于被重排列的數(shù)據(jù)集的平滑ρ值。 簡言之,對于含有η個SNP的5Mb大小的給定窗口,讓β i和Pi分別表示第i個SNP的Cox 回歸的Cox回歸系數(shù)和P值。通過如下將這個窗口當(dāng)中的所有SNP的統(tǒng)計學(xué)顯著性作為一 個整體進(jìn)行加和,確定這個窗口的對數(shù)分?jǐn)?shù)S
其中 指示變量Ii用來說明和區(qū)分陽性相關(guān)拷貝數(shù)變化與陰性相關(guān)拷貝數(shù)變化,這由 Cox回歸系數(shù)Pi的符號表示。正系數(shù)反映出復(fù)發(fā)患者具有比無疾病患者更高的拷貝數(shù),而 負(fù)系數(shù)則相反。為從對數(shù)分?jǐn)?shù)計算平滑P值,運(yùn)用重排列(permutation)得出對數(shù)分?jǐn)?shù)的 空分布。通過將臨床信息對患者編號進(jìn)行“洗牌”,進(jìn)行了四百個重排列。從平滑P值,預(yù)后 性染色體區(qū)域定義為其中平滑P值均小于0. 05的染色體區(qū)段。CNS和預(yù)測樽型的構(gòu)津一旦鑒定出預(yù)后性染色體區(qū)域,用UCSC基因組瀏覽器(http://genome.ucsc. edu)人2006年3月(hgl8)匯編,以那些區(qū)域當(dāng)中的Entrez Gene ID對明確界定的基因 進(jìn)行定位。接著,用兩個過濾步驟選擇那些具有預(yù)后價值的置信度較高的基因以建立CNS。 首先,過濾掉那些具有至少一個相應(yīng)的AfTymetrix U133A探針組ID的基因。只有那些從 基因表達(dá)數(shù)據(jù)具有統(tǒng)計學(xué)上顯著的Cox回歸ρ值(ρ <0.05)的基因得以通過。其次,基因 表達(dá)水平和拷貝數(shù)之間的相關(guān)性必須大于0. 5。如果該基因當(dāng)中含有多個SNP,則選擇具有 最佳Cox回歸ρ值的SNP ;如果不含有SNP,則選擇最接近的SNP。對于U133A探針組,使用 具有最佳Cox ρ值的那一個。為使用CNS中的基因建立模型以預(yù)測遠(yuǎn)程轉(zhuǎn)移,將基因數(shù)字拷貝數(shù)估計數(shù)轉(zhuǎn)換成 離散數(shù)值,即擴(kuò)增、無變化或者缺失。為進(jìn)行轉(zhuǎn)換,通過對代表性SNP的拷貝數(shù)數(shù)據(jù)進(jìn)行正 態(tài)混合建模和使用建模得到的分布的主峰作為二倍拷貝數(shù)的估計數(shù)來估計每個基因的二 倍拷貝數(shù)。于是,對于擴(kuò)增,將它定義為比二倍拷貝數(shù)估計數(shù)高1.5個單位以確保因內(nèi)在數(shù) 據(jù)變異性所致的假陽性低;而由于該拷貝數(shù)變化的性質(zhì)和針對拷貝數(shù)損失的拷貝數(shù)數(shù)據(jù)的 窄分布,將缺失定義為比二倍拷貝數(shù)估計數(shù)低0.5個單位。一旦轉(zhuǎn)換了拷貝數(shù)數(shù)據(jù),用以下 的簡單和直觀算法建立預(yù)測模型。如果某患者中至少η個基因的拷貝數(shù)發(fā)生變化,則該算
7法將該患者歸類為復(fù)發(fā)者,否則歸類為非復(fù)發(fā)者。對CNS中從1到所有基因的η檢查所有 可能的情形,并通過檢查訓(xùn)練集當(dāng)中所述特征集合的性能(由顯著的log-rank試驗ρ值來 測量)和為陽性(預(yù)測的復(fù)發(fā)者)百分?jǐn)?shù)設(shè)定下限以避免出現(xiàn)隨著η的增加陽性數(shù)變得非 常少的情況,來確定η的值。CNS的驗證用與上文所述相同的算法,在剩余的測試患者的拷貝數(shù)數(shù)據(jù)集當(dāng)中和在外部aCGH 數(shù)據(jù)集當(dāng)中,評估CNS的性能。對于外部數(shù)據(jù)集,由于它是從完全不同的aCGH技術(shù)得出,并 且數(shù)據(jù)格式為log2比例,擴(kuò)增的截止值設(shè)定為0. 45,而缺失的截止值設(shè)定為-0. 35,以確保 所產(chǎn)生的陽性百分?jǐn)?shù)與SNP陣列技術(shù)相當(dāng)。和CNS的構(gòu)建一樣,驗證是用CNS中相應(yīng)的基 因子集分別在ER陽性和陰性腫瘤中進(jìn)行的。但是,所顯示的最終性能代表測試集當(dāng)中ER 陽性和陰性患者兩者的組合性能。對化療的推定件響應(yīng)為檢驗測試集患者對化療化合物的推定性響應(yīng),使用了兩個公布的研究中的基因 表達(dá)特征集合。30基因手術(shù)前紫杉醇、氟尿嘧啶、多柔比星和環(huán)磷酰胺(T/FAC)響應(yīng)特征集 合的原始基因表達(dá)數(shù)據(jù)集和對角線性鑒別分析(DLDA)的預(yù)測算法的R函數(shù)下載自http:// bioinformatics. mdanderson. org/pubdata. html。模型是用所提供的R函數(shù)從原始數(shù)據(jù) 集訓(xùn)練,然后在我們的基因表達(dá)數(shù)據(jù)集當(dāng)中測試。對于七個預(yù)測對各個化療藥物的敏感性 的基因表達(dá)特征集合的每一個,在Anil Potti和Jowph Nevins博士的幫助下,采用二值 probit回歸模型的Bayesian擬合計算對每個化合物的敏感性的預(yù)測概率(有關(guān)細(xì)節(jié)參見 Potti A, Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomic signatures to guide the use of chemotherapeutics (指導(dǎo)化療藥物的使用的基因組特征集合)。Nat Med. 2006 年 11 月;12(11) 1294-300))。統(tǒng)計分析以所有SNP對拷貝數(shù)數(shù)據(jù)集進(jìn)行使用主成分分析(PCA)的無監(jiān)督分析以檢查潛在 的腫瘤亞類。用Kaplan-Meier存活曲線和log-rank試驗評估預(yù)測的高風(fēng)險組和低風(fēng)險組 的DMFS的差異。進(jìn)行Cox比例風(fēng)險回歸以計算HR及其95% Cl。由于缺少等級方面的數(shù) 據(jù),多變量Cox回歸分析是通過在一般位置模型下用Markov Chain Monte Carlo方法進(jìn)行 多重填補(bǔ)來進(jìn)行(Schafer JL. Analysis of incomplete multivariate data(不完全多變 量數(shù)據(jù)的分析)。London :Chapman&Hall/CRC Press ;1997)。進(jìn)行T檢驗以評估各預(yù)后組 之間差異治療響應(yīng)的顯著性。所有統(tǒng)計分析都是用R版本2. 6. 2進(jìn)行。搜索預(yù)后性候選基因以構(gòu)建CNS采用得自我們之前對相同腫瘤的研究的基因表達(dá)概況分析數(shù)據(jù)(WangY,Klijn JG, Zhang Y,Sieuwerts AM,Look MP,Yang F等人。Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer(予頁測淋巴結(jié)陰性 原發(fā)性乳腺癌的遠(yuǎn)程轉(zhuǎn)移的基因表達(dá)譜)。Lmcet. 2005年2月19日;365 (9460) :671_9,和 Yu JX, Sieuwerts AM,Zhang YiMartens JW, Smid MiKlijn JG等人。Pathway analysis of gene signatures predicting metastasis ofnode-negative primary breast cancer(予頁 測淋巴結(jié)陰性原發(fā)性乳腺癌的轉(zhuǎn)移的基因特征集合的途徑分析)。BMC Cancer. 2007年9 月25日;7(1) 182)來篩選在基因表達(dá)譜和拷貝數(shù)變化之間具有一致變化模式的基因。拷貝數(shù)的變化必須反映在基因表達(dá)水平的相應(yīng)變化才能具有表型效應(yīng),這一點被認(rèn)為是合理 的。在這些預(yù)后區(qū)域當(dāng)中,分別對ER陽性腫瘤(表4)和ER陰性腫瘤(表5)定位了總共 2,833個和3,656個基因。對于ER陽性腫瘤,有122個基因在基因表達(dá)數(shù)據(jù)和拷貝數(shù)數(shù)據(jù) 具有顯著的Cox回歸ρ < 0. 05,并顯示出DNA拷貝數(shù)和基因表達(dá)的變化方向相同。對于ER 陰性腫瘤,有78個基因在該兩個數(shù)據(jù)集具有顯著ρ值,并顯示出相同的變化方向(圖6)。 其中,ER陽性腫瘤的53(43% )個基因和ER陰性腫瘤的28(36% )個基因分別有大于0. 5 的基因表達(dá)與拷貝數(shù)間相關(guān)系數(shù)。因此總共鑒定出81個預(yù)后性候選基因,于是將它們用作 預(yù)后用CNS (表2及表6A和6B)。CNS的驗證驗證是分別在ER陽性和陰性腫瘤中,分別用來自CNS的53個和28個基因?qū)y 試集進(jìn)行。所顯示的最終性能代表這2個亞群的組合結(jié)果。在113名獨立患者的測試集 當(dāng)中,對由81基因CNS分級的兩個患者群體進(jìn)行的Kaplan-Meier分析顯示出在遠(yuǎn)程轉(zhuǎn)移 時間方面有統(tǒng)計學(xué)上顯著差異(圖3,A),風(fēng)險比(HR)為2. 8 (ρ = 0.0036)。兩個群體的 估計的5年遠(yuǎn)程轉(zhuǎn)移率分別為27% [95%置信區(qū)間(Cl),17%-35% ]和67% (95% Cl, 32% -84% ) ο 當(dāng)與我們之前鑒定的 76 基因 GES (Wang Y,Klijn JG, ZhangY, Sieuwerts AM, Look MP, Yang F 等人。Gene-expression profilesto predict distant metastasis of lymph-node-negative primarybreast cancer (預(yù)測淋巴結(jié)陰性原發(fā)性乳腺癌的遠(yuǎn)程轉(zhuǎn)移 的基因表達(dá)譜)。Lancet. 2005 Feb 19 ;365 (9460) :671_9)結(jié)合使用時,由81基因CNS確 定為具有較差預(yù)后結(jié)果的患者群體保持一樣,估計的5年遠(yuǎn)程轉(zhuǎn)移率為67%。76基因GES 將另一個具有較好預(yù)后的患者群體進(jìn)一步分級成良好預(yù)后組和差預(yù)后組,5年估計復(fù)發(fā)率 分別為11%和37% (圖3,B)。這個結(jié)果導(dǎo)致得出三個預(yù)后組,對于GES良好/CNS良好組、 GES差/CNS良好組、GES差/CNS差組分別定義為良好組、差組和極差組。對兩種特征集合 連同傳統(tǒng)的臨床和病理學(xué)因素進(jìn)行的多變量Cox回歸分析表明,這兩種特征集合的組合是 DMFS的唯一顯著(似然比檢驗ρ = 0. 0003)預(yù)后因子,極差預(yù)后組與良好預(yù)后組相比HR為 8. 86,差預(yù)后組與良好預(yù)后組相比HR為3. 59 (表3)。接著,在得自較低分辨率aCGH技術(shù)(ChinSF, Teschendorff AE, Marioni JC, Wang Y, Barbosa-Morais NL, Thorne NP 等人。High-resolution array-CGH and expression profiling identifies a novelgenomic subtype of ER negative breast cancer(高分辨 率陣列CGH和表達(dá)概況分析鑒定出ER陰性乳腺癌的新型基因組亞型)。Genome Biol. 2007 年10月9日;8 (10) :R215)的116名LNN患者(79個ER陽性腫瘤和37個ER陰性腫瘤)的 完全獨立外部數(shù)據(jù)集當(dāng)中,對CNS進(jìn)行測試。81基因CNS明顯地將這個患者群體(圖3,C) 分級成兩個HR為3. 7 (ρ = 0. 0102)的預(yù)后組,并在包括年齡、腫瘤大小、等級、ER狀態(tài)的的 多變量Cox回歸分析中仍是唯一顯著的預(yù)后因子(ρ = 0.015)。與我們自己的數(shù)據(jù)集相比, 差預(yù)后組的5年遠(yuǎn)程轉(zhuǎn)移率較低(19%),這很可能是由于腫瘤尺寸較小(78%小于2cm)和 由于這個群體中三分之一以上的患者已接受過輔助激素和/或化療的事實(表1)。對化療的響應(yīng)隨后,用得自兩個研究的得到很好驗證的基因特征集合(Potti A,Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomicsignatures to guide the use of chemotherapeutics (指導(dǎo)化療藥物的使用的基因組特征集合)。Nat Med. 2006年11月;12(11) 1294-300,和 Hess KR, Anderson K, Symmans WF, Valero V, Ibrahim N, Mejia JA 等 人。Pharmacogenomic predictor of sensitivity to preoperativechemotherapy with paclitaxel and fluorouracil, doxorubicin, andcyclophosphamide in breast cancer (乳腺癌中手術(shù)前紫杉醇和氟尿嘧啶、多柔比星和環(huán)磷酰胺化療敏感性的藥物基因 組學(xué)預(yù)測物)。J ClinOncol. 2006 年 9 月 10 日;24 (26) :4236_44),對由 GES 和 CNS 預(yù)后 測定所確定的三個預(yù)后組進(jìn)行化療響應(yīng)譜考察。對于所述兩個研究,還有隨訪驗證研究 可供利用(Bonnefoi H,Potti A,Delorenzi M,Mauriac L,Campone M,Tubiana-Hulin M 等 人。Validation of gene signaturesthat predict the response of breast cancer to neoadjuvantchemotherapy :a substudy of the EORTC 10994/BIG 00-01 clinicaltrial (預(yù)測乳腺癌對新輔助化療的響應(yīng)的基因特征集合的驗證E0RTC10994/ BIG 00-01 臨床試驗的子研究)。Lancet Oncol. 2007 年 12 月;8 (12) 1071-8,和 Peintinger F,Anderson K,Mazouni C,Kuerer HM, Hatzis C,Lin F 等人。Thirty-gene pharmacogenomic test correlateswith residual cancer burden after preoperative chemotherapy forbreast cancer (30基因藥物基因組學(xué)試驗與乳腺癌手術(shù)前化療后的殘 余癌負(fù)荷相關(guān)聯(lián))。Clin Cancer Res. 2007年7月15日;13(14) :4078_82)。首先,使用之 前發(fā)表的預(yù)測對手術(shù)前T/FAC化療的病理完全響應(yīng)(pCR)的30基因特征結(jié)合(Hess KR, Anderson K, Symmans WF,ValeroV, Ibrahim N, Mejia JA等人。Pharmacogenomic predictor ofsensitivity to preoperative chemotherapy with paclitaxel andfluorouraci1, doxorubicin, and cyclophosphamide in breast cancer (季L腺癌中手術(shù)Ilf紫杉酉享禾口氣尿 嘧啶、多柔比星和環(huán)磷酰胺化療敏感性的藥物基因組學(xué)預(yù)測物)。J Clin Oncol. 2006年9 月10日;24 (26) :4236-44),將不同預(yù)后亞組中的每個患者分配到2個響應(yīng)組中具有pCR 或者仍具有殘余疾病。極差預(yù)后組中的15名患者只有2名(13%)被預(yù)測為具有pCR,而 差預(yù)后組中的60名患者有34名(57%)和良好預(yù)后組中38名患者中有14名(37% )分 別被預(yù)測為具有pCR。極差預(yù)后組的化療響應(yīng)分?jǐn)?shù)顯著低于差預(yù)后組(P = 0.0003),這表 明在要是這些患者接受了手術(shù)前T/FAC化療的情況中,這些患者對手術(shù)前T/FAC化療的抗 性會大得多(圖4,A)。其次,使用在細(xì)胞系上建立的表達(dá)特征集合(Potti A,Dressman HK, Bild A, Riedel RF, Chan G, Sayer R 等人。Genomicsignatures to guide the use of chemotherapeutics (指導(dǎo)化療藥物的使用的基因組特征集合)。Nat Med. 2006年11月; 12(11) :1294-300),將這三個預(yù)后組針對七種分別的化療化合物進(jìn)行響應(yīng)譜測定。對于每 種化合物,采用二值probit回歸模型的Bayesian擬合計算對該化合物的敏感性的預(yù)測概 率。與差預(yù)后組相比,極差預(yù)后組中的患者對多柔比星(圖4,D)和環(huán)磷酰胺(圖4,E)的 抗性似乎更大,這與30基因特征集合作出的T/FAC響應(yīng)預(yù)測(圖4,A)相一致。另一方面, 極差預(yù)后組對依托泊苷(圖4,G)和托泊替康(圖4,H)更敏感。因此,當(dāng)與基于基因表達(dá) 的特征集合相結(jié)合進(jìn)行預(yù)后和療法預(yù)測時,由SNP陣列測量的CNA能改進(jìn)風(fēng)險分類,并且能 鑒定具有明顯更差的預(yù)后前景和對化療藥物的潛在差異響應(yīng)的那些乳腺癌患者。^ 1 患、者及jq中瘤的臨床禾Π病理學(xué)Φ寺征年齡,歲
平均值(標(biāo)準(zhǔn)偏差) <=40 41-55 56-70 >70 絕經(jīng)狀態(tài) 絕經(jīng)前 絕經(jīng)后 T階段 Tl T2
T3/4 未知 等級 差
中等 良好 未知 ER狀態(tài) 陽性 陰性 PR狀態(tài)
陽性
等級是由地區(qū)病理學(xué)家評估,反映腫瘤收集年間的現(xiàn)行規(guī)范;ER陽性和PgR陽性 > lOfmol/mg蛋白質(zhì)或者> 10%陽性腫瘤細(xì)胞。NA,無。m 2-Mimuimmm^ (cns)的 8i 個某因的說明
全部患者 訓(xùn)練集 驗證集 特征(n=313) (n=200) (n=113) 外部驗證集(n=116)
(12)
5
2%)
(31%)
2%)
(48%)
2%)
10
\ly /—S % % ) 9 7 %
3 3(4o 7 5 8
/O Λι/ 6
14
111
%)
8 CJ
3 7 5
\7 (6
3 3 1
3) 3
/Iv
(50%)
100
^^ \l/ 6 % 4 4
/V /Iv
52°/64%) 3 4
/IN /fv
7 2 1
(43%)
_ \l/ /O \)/ \l/
\I/ ft/ /O /mv
2l°/3 2β/
(31
3 1
%) %)
(4
(51
2 5 1
\1/ \ly % % ) 9 7 % A^ (4(4(4:0·/
3 5 1
8
11
/O Ni/ /O /O / ft/ /O
3 ^ O W/ 4 6 O
(2%)
1-3 yc
(6
(3
19 11
(50
5 1
148 (47%)
%) 3
/Iv
/O ft/ \—/
巧5 %
(32
6 3
/ι /Iv
4 O O 1 2
法
移 療
性知明 查衫 知 陰未54是否審_是否未
U \ / V/ \|/ H % 5 9 % 3 O 5 3 5 1 3
7 5
5 3
/ V /Iv /Iv 18 1
(3
8 3
78 (67%)
(78%) (22%) O O
(42%) (29%) (29%) O
(68%) (32%)
7 3
na
na na7%)
(90%)3%)
10
X)/
^^ ^^ X)/
7 1%
1 2 7
11 表3 :GES和CNS組合的多變量Cox回歸分析 年齡(每10歲遞增) 絕經(jīng)后相比絕經(jīng)前 HR =風(fēng)險比;95% CI = 95%置信區(qū)間。表4 :ER陽件腫瘤具有預(yù)后件拷貝數(shù)奪化(CNA)的染色體區(qū)域 表5 :ER陰t牛腫瘤H有預(yù)后t??截悾奪化(CNA)的染fM本區(qū)域 表6A 用作CNS的81個基因的說明
ql2. 1
表 6B用作CNS的81個某因的說明(續(xù))
前53個基因來自ER陽性腫瘤,后28個基因來自ER陰性腫瘤。表7 =ER陽件腫瘤中的預(yù)后件染餼體區(qū)域 表8 :ER陰件腫瘤中的預(yù)后件染餼體區(qū)域
權(quán)利要求
一種界定具有預(yù)后價值的染色體區(qū)域的方法,所述方法包括將染色體的預(yù)定區(qū)段中的所有SNP的顯著性加和以界定具有預(yù)后價值的染色體區(qū)域的步驟。
2.根據(jù)權(quán)利要求1所述的方法,其中所述加和步驟是通過測定所述區(qū)域中每個SNP的 Cox比例風(fēng)險回歸的P值并將組合的P值加和來進(jìn)行。
3.根據(jù)權(quán)利要求1所述的方法,所述方法還包括將SNP拷貝數(shù)與位于所述預(yù)定染色體 區(qū)段當(dāng)中的基因的表達(dá)水平相關(guān)聯(lián)的步驟。
4.根據(jù)權(quán)利要求1所述的方法,所述方法還包括基于組合的P值開發(fā)治療方案的步驟。
5.一種提供人乳腺癌的預(yù)后的方法,所述方法包括以下步驟 獲得人的DNA樣品;在至少選自以下的基因中對所述DNA樣品檢查單核苷酸多態(tài)性SMC4、PD⑶10、PREP、 CBX3、NUP205、TCEBl、TERFl、TPD52、GGH、TRAMl、ZBTB10, YTHDF3、EIF3E、P0LR2K、RPL30、 CCNE2、RAD54B、MTERFD1、ENY2、DPYl9L4、ZNF623、SCRIB、SLC39A4、ATP6V1G1、TCTN3、PSMA6、 STRN3、CLTC、TRIM37、NME1、NME2、RPS6KB1、PPMlD、MED13、SLC35B1、APPBP2、MKS1、C17orf71、 HEATR6、TMEM49、USP32、ANKRD40、NME1-NME2、ZNF264、ZNF304、ATP5E、CSTFU PPP1R3D、 AURKA、RAEl、STX16、C20orf43、RAB22A、HDACl、BSDCl、Clorf9、C0X5B、EIF5B、DDX18、TSN、 p20、METTL5、MGATl、TUBB2A、RWDDl、PGM3、F0X03、CDC40、REV3L、HDAC2、TSPYL4、C6orf60、 ASF1A、MED23、TSPYLl、ACTRlO、KIAA0247、RARA, KRT10、RI0K3、IMPACT、以及它們的組合; 基于所述檢查DNA樣品的步驟的結(jié)果,提供人乳腺癌的預(yù)后。
6.根據(jù)權(quán)利要求5所述的方法,所述方法還包括獲得人的乳腺腫瘤樣品的步驟。
7.根據(jù)權(quán)利要求6所述的方法,所述方法還包括確定所述腫瘤樣品是雌激素受體陽性 還是雌激素受體陰性的步驟。
8.根據(jù)權(quán)利要求7所述的方法,其中所述腫瘤樣品被確定為雌激素受體陽性,并且所 述單核苷酸多態(tài)性被確定為在TCTN3方面的損失。
9.根據(jù)權(quán)利要求7所述的方法,其中所述腫瘤樣品被確定為雌激素受體陰性,并且所 述單核苷酸多態(tài)性被確定為在HDAC1、BSDCl或它們的組合方面的損失。
10.一種提供人乳腺癌的預(yù)后的方法,所述方法包括以下步驟獲得人的DNA樣品; 在選自染色體號 1、2、3、4、5、6、7、9、10、11、12、14、16、17、18、19、20、21、23 以及它們的組合的至少一個染色體上對該DNA樣品檢查單核苷酸多態(tài)性,其中所述單核苷酸多態(tài)性出 現(xiàn)在表7和8所示的相應(yīng)起始堿基和終止堿基之間;基于所述檢查DNA樣品的步驟的結(jié)果,提供人乳腺癌的預(yù)后。
11.根據(jù)權(quán)利要求10所述的方法,所述方法還包括從所述人獲得乳腺腫瘤樣品的步馬聚ο
12.根據(jù)權(quán)利要求11所述的方法,所述方法還包括確定所述腫瘤樣品是雌激素受體陽 性還是雌激素受體陰性的步驟。
13.根據(jù)權(quán)利要求12所述的方法,其中所述腫瘤樣品被確定為雌激素受體陽性,并且 所述單核苷酸多態(tài)性出現(xiàn)在表7所示的相應(yīng)起始堿基和終止堿基之間。
14.根據(jù)權(quán)利要求12所述的方法,其中所述腫瘤樣品被確定為雌激素受體陰性,并且 所述單核苷酸多態(tài)性出現(xiàn)在表8所示的相應(yīng)起始堿基和終止堿基之間。全文摘要
本發(fā)明書公開了一種界定具有預(yù)后價值的染色體區(qū)域的方法,所述方法是通過將染色體的預(yù)定區(qū)段中的所有SNP(單核苷酸多態(tài)性)的顯著性進(jìn)行加和來界定具有預(yù)后價值的染色體區(qū)域?;谥付ɑ蛑械腟NP,可提供更加準(zhǔn)確的乳腺癌預(yù)后。
文檔編號C12Q1/68GK101918591SQ200880120887
公開日2010年12月15日 申請日期2008年12月15日 優(yōu)先權(quán)日2007年12月14日
發(fā)明者J·X·于, Y·張, Y·王, Y·蔣 申請人:維里德克斯有限責(zé)任公司