欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

包含mdm2的雙微染色體及其方法

文檔序號:6167513閱讀:379來源:國知局
包含mdm2的雙微染色體及其方法
【專利摘要】構(gòu)思的系統(tǒng)和方法允許利用利用配對末端序列分析和拆分讀數(shù)細(xì)化來進(jìn)行計算基因組分許,從而標(biāo)識與重排的高拷貝數(shù)和取向相關(guān)聯(lián)的高置信度斷裂點(diǎn),然后將這些高置信度斷裂點(diǎn)作為雙微體(DM)全重構(gòu)的基礎(chǔ)。在特別優(yōu)選的方案中,DM還包括致癌基因或腫瘤抑制基因,和/或可見于血液或從血液中獲得的流體中。
【專利說明】包含MDM2的雙微染色體及其方法
[0001] 本申請要求遞交于2011年12月8日的序號為61/568, 513以及遞交于2012年3 月28日的序號為61/616, 535的美國臨時專利申請的優(yōu)先權(quán)。該文獻(xiàn)以及本文中所論述的 所有其他外來材料的全部內(nèi)容通過引用合并于此。在并入的參考文獻(xiàn)中的術(shù)語的定義或使 用與本文所提供的該術(shù)語的定義不一致或相悖的情況下,在本文中提供的該術(shù)語的定義適 用,而參考文獻(xiàn)中該術(shù)語的定義不適用。

【技術(shù)領(lǐng)域】
[0002] 本發(fā)明的領(lǐng)域是分子診斷,特別涉及基因組重排的分析和標(biāo)識。

【背景技術(shù)】
[0003] 全基因組測序的引入已經(jīng)為研究者提供了前所未有的測量大多數(shù)癌癥的基因組 重排特性的復(fù)雜狀態(tài)的能力。已經(jīng)開發(fā)出多種從配對末端測序數(shù)據(jù)推斷結(jié)構(gòu)變化的方 法(Bioinformatics(2009) ;25:i222_i230;Nature Methods 2009 August ;6:677-681 ; Nature Genetics 2011 March ;43:964 - 968),但是這種方法所謂的結(jié)構(gòu)變化通常僅隔離 地考慮,主要用來標(biāo)識潛在的融合基因。發(fā)現(xiàn)所有真正的結(jié)構(gòu)變化以及濾除虛假肯定的難 度使得難以利用當(dāng)前已知方法的輸出來重裝腫瘤基因組的大部分區(qū)域。這種難度特別不 幸,因為正確的腫瘤基因組裝配有助于展現(xiàn)出腫瘤基因組的復(fù)雜結(jié)構(gòu)并且可用于推斷諸如 致癌基因的放大和腫瘤抑制因子的刪除的體細(xì)胞變更出現(xiàn)的機(jī)制。
[0004] 快速地降低成本以及全基因組測序的增加的數(shù)據(jù)分辨率也指望涌現(xiàn)出從血液進(jìn) 行癌癥診斷的新種類。例如,Leary等人(SciTransl Med 2010Feb. ;2(20):20ral4)開發(fā) 了重排末尾(PARE)的個性化分析,其利用了體細(xì)胞重排來構(gòu)建對于復(fù)發(fā)的基于血液的診 斷化驗。雖然該新穎的方法提供了用于監(jiān)控的有力骨架,但是通常需要活體檢視的腫瘤組 織的分析來發(fā)現(xiàn)待在血液中測量的特定標(biāo)記物。其他監(jiān)控技術(shù),諸如測量循環(huán)腫瘤細(xì)胞, 需要僅當(dāng)具有轉(zhuǎn)移性潛能的腫瘤存在時才可能的大的富集努力(Cancer Lett. 2007 Aug.; 253(2) : 180 - 204)。這兩種技術(shù)提出了技術(shù)挑戰(zhàn),這使得它們不適合初期腫瘤診斷。
[0005] 公知的是,雙鏈DNA在細(xì)胞的細(xì)胞質(zhì)中會變得極度放大且成環(huán)狀,形成了所謂的 雙微體(Cancer Genet. Cytogenet. 1982 Feb. ;5(1) :81_94)。已表明,雙微體(DM)對于 一些藥物給予阻力,而且沿著該阻力非均勻地傳遞給子細(xì)胞。經(jīng)觀察,它們的尺寸已高達(dá) 幾兆堿基,并且包含類似于實際染色體的染色質(zhì),但是缺少在正常染色體中可見的著絲粒 或端粒。因為DM缺少著絲粒,它們在細(xì)胞分裂過程中隨機(jī)分布到子細(xì)胞,并且它們在未來 的代中會丟失,除非存在某種選擇性壓力來保持它們。然而,DM的隨機(jī)分布還提供了簡單 的快速放大繼代中的致癌基因 DM的機(jī)制,其中細(xì)胞可累積雙微體的數(shù)百拷貝。雖然多形 性成膠質(zhì)細(xì)胞瘤(GBM)中的雙微體的頻率大部分未知,但是Fan等人的近期研究(J.Appl. Genet. 201 IFeb. ;52(1) :53 - 59)已經(jīng)將成神經(jīng)細(xì)胞瘤標(biāo)識為具有次高的DM量,提供了如 下可能性:在GBM腫瘤中的頻率放大的致癌基因中的一些可能通過致癌基因雙微體的形成 和累積來解釋。
[0006] 盡管存在三十年前最初標(biāo)識了 DM的事實,但是在文獻(xiàn)中沒有證據(jù)表明,已經(jīng)進(jìn)行 過DM的全面序列分析。因此,對于改進(jìn)的診斷方法,尤其是對于改進(jìn)的可能與DM的存在相 關(guān)聯(lián)的腫瘤組織的基因分析的方法,仍存在需求。
[0007] 發(fā)明概述
[0008] 發(fā)明主題涉及到方法和計算系統(tǒng),其中全基因組配對末端序列分析使得能夠經(jīng)由 高置信度的斷裂點(diǎn)和關(guān)聯(lián)的高拷貝數(shù)的標(biāo)識來進(jìn)行基因重排的快速且全面的標(biāo)識,從而完 全重構(gòu)通常包含與贅生物相關(guān)聯(lián)的極度放大的致癌基因的完整DM。
[0009] 在本發(fā)明主題的一個特別優(yōu)選的方案中,分析基因組數(shù)據(jù)的方法,包括:確定腫瘤 基因組序列與匹配的正?;蚪M序列之間的相對拷貝數(shù)的步驟;以及標(biāo)識腫瘤基因組序列 和匹配的正?;蚪M序列中的推定斷裂點(diǎn)的另一步驟。在另一步驟中,細(xì)化推定斷裂點(diǎn),優(yōu) 選地利用將腫瘤基因組序列分段并且將片段與基準(zhǔn)數(shù)據(jù)庫進(jìn)行比較,從而腫瘤基因組序列 的斷裂點(diǎn)位置和取向,而且在另一步驟中,使用讀數(shù)支持閾值(例如,用戶確定的)來將斷 裂點(diǎn)確認(rèn)為顯著斷裂點(diǎn)。在又一步驟中,利用相對拷貝數(shù)、所述顯著斷裂點(diǎn)和所述取向來確 定具有環(huán)形解的基因組排列(其可指示雙微染色體)。
[0010] 在特別優(yōu)選的方案中,確定相對拷貝數(shù)的步驟是利用動態(tài)加窗來執(zhí)行的,和/或 其中利用不一致配對讀數(shù)來執(zhí)行標(biāo)識推定斷裂點(diǎn)的步驟。雖然不限于該發(fā)明主題,通常優(yōu) 選的是,通過生成斷裂點(diǎn)圖并且求解斷裂點(diǎn)圖而達(dá)到環(huán)形解來確定基因組排列。
[0011] 在另一構(gòu)思的方案中,腫瘤基因組序列來自實體瘤,而腫瘤基因組序列與存在于 生物流體(例如,血液、血清、血漿、抽出物等)中的遺傳物質(zhì)隔離。例如,實體瘤可以是多 形性成膠質(zhì)細(xì)胞瘤或非小細(xì)胞肺癌。
[0012] 從不同的視角看,構(gòu)思的分析基因組數(shù)據(jù)的方法可以包括:在達(dá)到斷裂點(diǎn)的讀數(shù) 支持閾值(優(yōu)選地為用戶定義的)時,將腫瘤基因組序列的拷貝數(shù)與腫瘤基因組序列中的 斷裂點(diǎn)相關(guān)聯(lián)的步驟;以及確定腫瘤基因組序列的取向的步驟。這些方法還包括:利用拷 貝數(shù)、斷裂點(diǎn)的位置和腫瘤基因組序列的取向來確定基因組排列的步驟。典型地,但不是必 要的,通過利用腫瘤基因組序列的拷貝數(shù)、斷裂點(diǎn)在基因組內(nèi)的位置以及腫瘤基因組序列 的取向生成斷裂點(diǎn)圖來執(zhí)行確定基因組排列的步驟,其中在斷裂點(diǎn)圖中,拷貝數(shù)表達(dá)為邊 緣,并且其中斷裂點(diǎn)位置表達(dá)為頂點(diǎn)。
[0013] 在發(fā)明主題的另一方案中,分析實體瘤的基因組數(shù)據(jù)的方法包括:將實體瘤標(biāo)識 為其中腫瘤基因組的至少部分存在于生物流體中的步驟;以及從患者體中獲得生物流體并 且隔離腫瘤基因組的至少部分的另一步驟,然后使用其來分析基因組數(shù)據(jù),如上文和在發(fā) 明詳述中所描述的。最常見的是,腫瘤基因組的部分作為可能包括致癌基因或腫瘤抑制基 因的雙微染色體而存在。因此,構(gòu)思的方法還可以包括:標(biāo)識腫瘤基因組的隔離的至少部分 內(nèi)的致癌基因或腫瘤抑制基因的步驟。在該情形下,該方法還包括:利用以致癌基因或腫瘤 抑制基因為目標(biāo)的藥用方案來治療或建議治療患者的步驟。
[0014] 在發(fā)明主題的又一方案中,分析實體瘤(例如,多形性成膠質(zhì)細(xì)胞瘤或非小細(xì)胞 肺癌)的基因組數(shù)據(jù)的方法將包括:從患者體中獲得生物流體(例如,血液、血清、血漿等) 并且將腫瘤基因組的至少部分與生物流體隔離的步驟;以及判定致癌基因(例如,野生型 或EGFR、c-Myc或MDM2的突變體形式)周圍的區(qū)域是否展現(xiàn)出指示放大的雙微體的成簇斷 裂點(diǎn)圖案的另一步驟。優(yōu)選地,如上文所描述的且如發(fā)明詳述中所描述的,執(zhí)行判定。
[0015] 因此,發(fā)明人還構(gòu)思了從頭診斷腫瘤病(例如,胃癌、結(jié)腸癌、前列腺癌、肺癌、白 血病或乳腺癌)的方法,其包括:從患者體中獲得生物樣本以及將核酸與樣本隔離的步驟, 以及對于基因組樣本的拷貝數(shù)以及基因組樣本中的斷裂點(diǎn)來分析核酸的另一步驟。在又一 步驟中,在達(dá)到斷裂點(diǎn)的讀數(shù)支持閾值時,基因組序列的拷貝數(shù)與基因組序列中的斷裂點(diǎn) 相關(guān)聯(lián),并且確定基因組序列的取向。在又一步驟中,利用拷貝數(shù)、斷裂點(diǎn)的位置和基因組 序列的取向來確定基因組排列,并且如此標(biāo)識出的基因組排列用來確定腫瘤病的可能性。 在發(fā)明主題的至少一些方案中,基因組排列被標(biāo)識為雙微體,和/或包含致癌基因或腫瘤 抑制基因。
[0016] 本發(fā)明主題的各個目的、特征、方案和優(yōu)點(diǎn)將從下面連同其中相似標(biāo)記表示相似 部件的附圖的圖一起對優(yōu)選實施方案的詳細(xì)描述中變得更加清晰。

【專利附圖】

【附圖說明】
[0017] 圖1是描繪根據(jù)本發(fā)明主題的推定結(jié)構(gòu)變型例的初始標(biāo)識的示例圖。
[0018] 圖2是描繪圖1的推定結(jié)構(gòu)變型例中斷裂點(diǎn)的細(xì)化分析的示例圖。
[0019] 圖3是根據(jù)本發(fā)明主題的示例性的斷裂點(diǎn)圖。
[0020] 圖4是用于體細(xì)胞斷裂點(diǎn)的讀數(shù)支持的示例性的直方圖。
[0021] 圖5是描繪高拷貝數(shù)和高度支持的斷裂點(diǎn)的示例性的基因組瀏覽器顯示。
[0022] 圖6是圖5所示的數(shù)據(jù)和用于斷裂點(diǎn)圖的環(huán)形解的詳細(xì)試圖。
[0023] 圖7描繪了描繪出染色體7和12上的高的拷貝數(shù)以及高度支持的斷裂點(diǎn)的示例 性的基因組瀏覽器顯示。
[0024] 圖8是圖7所示的所選數(shù)據(jù)和斷裂點(diǎn)圖的環(huán)形解的詳細(xì)試圖。
[0025] 圖9是示例性地描繪根據(jù)本發(fā)明主題的用于基因組分析的構(gòu)造和系統(tǒng)的示意圖。
[0026] 圖10A和10B是用于第一腫瘤樣本中的重排模式和對應(yīng)的環(huán)形解的示例性圖示。
[0027] 圖11A和11B是用于第二腫瘤樣本中的重排模式和對應(yīng)的環(huán)形解的示例性圖示。
[0028] 圖12A和12B是用于另一腫瘤樣本中的重排模式和對應(yīng)的環(huán)形解的示例性圖示。
[0029] 發(fā)明詳述
[0030] 發(fā)明人已經(jīng)發(fā)現(xiàn),通過標(biāo)識高置信度的斷裂點(diǎn)和關(guān)聯(lián)的高拷貝數(shù),以及通過分析 數(shù)據(jù)以達(dá)到重排繪圖中的環(huán)形解,能夠進(jìn)行基因組分析以標(biāo)識出全基因組序列數(shù)據(jù)中的一 個或多個DM。
[0031] 為此目的,發(fā)明人開發(fā)并使用能夠標(biāo)識出高置信度斷裂迪娜、片段取向以及全基 因組測序數(shù)據(jù)的分析的算法,這最終使得對在多種情況下包含極度放大的致癌基因的完 整DM進(jìn)行完全重構(gòu)。例如,發(fā)明人使用了從Cancer Genome Atlas (Nature 2008 Oct.; 455(7216) :1061 - 1068)獲得的兩個多形性成膠質(zhì)細(xì)胞瘤(GBM)樣本序列來用于完整DM的 完全重構(gòu)。另外,發(fā)明人還發(fā)現(xiàn)了同一患者的血液樣本中的DM的證據(jù),表明GBM腫瘤細(xì)胞 正將致癌DM脫落于血流中。特別優(yōu)選的算法包括BAMBAM,其描述域通過引用合并于此的 US 2012/0066001和US 2012/0059670中。本文所提出的方法和計算系統(tǒng)使得能夠經(jīng)由全 基因組配對末尾測序來進(jìn)行基因重排的快速且全面的標(biāo)識。更特別地,發(fā)明人采用了下面 描述的系統(tǒng)和方法來分析全基因組測序數(shù)據(jù),從而達(dá)到表示描述完全重構(gòu)的DM的結(jié)果。
[0032] 在下面的論述中,多次提到由計算設(shè)備形成的服務(wù)器、服務(wù)、接口、入口、平臺或其 他系統(tǒng)。應(yīng)當(dāng)理解,這些術(shù)語的使用視為代表具有配置為執(zhí)行存儲在計算機(jī)可讀有形、非暫 態(tài)介質(zhì)上的軟件指令的至少一個處理器的一個或多個計算設(shè)備。例如,服務(wù)器能夠包括以 實現(xiàn)所描述的作用、職責(zé)或功能的方式作為網(wǎng)頁服務(wù)器、數(shù)據(jù)庫服務(wù)器或其他類型的計算 機(jī)服務(wù)器而運(yùn)行的一個或多個計算機(jī)。
[0033] 在發(fā)明主題的一個示例性方案中,確定拷貝數(shù)和推斷結(jié)構(gòu)變化如下。
[0034] 計算腫瘤與匹配的正常之間的相對拷貝數(shù):利用動態(tài)加窗方法來計算腫瘤對正常 相對拷貝數(shù),動態(tài)加窗方法根據(jù)腫瘤或正常測序數(shù)據(jù)集中的讀數(shù)覆蓋率來擴(kuò)大和縮小窗的 基因組寬度。用零寬度的窗來初始化該過程。來自腫瘤和匹配的正常序列數(shù)據(jù)兩者的每 個超過某些品質(zhì)閾值(例如,讀數(shù)映射品質(zhì))的讀數(shù)將被分別計數(shù)為腫瘤計數(shù)N tUfflOT和正常 計數(shù)NnOTmal。第一讀數(shù)的起始位置和停止位置限定了初始的窗寬,并且隨著更多的讀數(shù)被采 集,窗寬擴(kuò)大以包含所處理的所有讀數(shù)的最小起始位置和最大停止位置。
[0035] 當(dāng)滿足下面的條件時進(jìn)行相對拷貝數(shù)計算:來自腫瘤或匹配正常數(shù)據(jù)集的讀數(shù)計 數(shù)超過了固定為1〇〇個讀數(shù)的用戶定義的上下閾值。當(dāng)這種情況發(fā)生時,記錄窗的尺寸和 位置、原始讀數(shù)計數(shù)N tumOT,Nnmial以及相對拷貝數(shù)計算NtumOT/Nnmial。然后,對于下一次采集和 計算,將所有的值復(fù)位。通過根據(jù)局部讀數(shù)覆蓋率來修整N nOTmal的尺寸,該方法在低覆蓋率 區(qū)域中產(chǎn)生了大的窗以提高信噪比,而極度放大的區(qū)域?qū)a(chǎn)生較小的窗,提高擴(kuò)增子邊界 的分辨率。
[0036] 利用配對末端成簇來推斷結(jié)構(gòu)變化的區(qū)域:為了標(biāo)識推定染色體內(nèi)和染色體間重 排,bambam搜索存儲在一對按坐標(biāo)分類的BAM文件中的不一致配對讀數(shù),一個來自腫瘤樣 本,另一個來自匹配的正常樣本,其中不一致配對中的每個讀數(shù)映射到基準(zhǔn)序列的不同區(qū) 域。染色體內(nèi)一致配對是那些具有異常大的插入尺寸(即,基準(zhǔn)上將配對讀數(shù)分開的基因 組距離超過了用戶定義的閾值)的配對或者那些在不正確取向上映射(即,倒位)的配對。 通過映射到不同染色體的配對讀數(shù)來定義染色體間不一致配對。在圖1中示出了該過程的 概覽,該圖示意性地描繪了結(jié)構(gòu)變化調(diào)用的概覽。bambam利用不一致映射的讀數(shù)配對來識 別推定結(jié)構(gòu)變化的初始標(biāo)識,其中兩個讀數(shù)完全映射到基準(zhǔn)基因組,但是以異常的、非基準(zhǔn) 的方式來這樣做。隨后通過稱為bridget的程序利用在斷裂點(diǎn)鄰近處的任何可用拆分讀數(shù) 來細(xì)化bambam所發(fā)現(xiàn)的推定斷裂點(diǎn)。
[0037] 來自腫瘤和正常數(shù)據(jù)集的所有不一致的配對末尾讀數(shù)根據(jù)其基因組位置而成簇 以定義斷裂點(diǎn)所被視為的適當(dāng)?shù)幕蚪M區(qū)域。聚集過程包括將在推定斷裂點(diǎn)的兩側(cè)上與其 他讀數(shù)重疊且具有相同取向的讀數(shù)群集在一起,同時對來自于腫瘤和正常數(shù)據(jù)集的讀數(shù)的 數(shù)量進(jìn)行跟蹤。當(dāng)簇中重疊的不一致配對的數(shù)量超過了用戶定義的閾值時,在輸出中定義 和記錄了描述重排的斷裂點(diǎn)。
[0038] 如果斷裂點(diǎn)被來自腫瘤數(shù)據(jù)集的讀數(shù)顯著地支持,則斷裂點(diǎn)被分類為"體細(xì)胞"。 允許來自匹配的正常數(shù)據(jù)集的"體細(xì)胞"斷裂點(diǎn)的最小量的讀數(shù)支持適應(yīng)一定水平的腫瘤 DNA存在于匹配的正常樣本的情況。當(dāng)存在于實體瘤的DNA中的極度放大的區(qū)域以低的而 可檢測的水平脫落到血流中時,這種情況會發(fā)生??商娲兀跒檠盒园┌Y的情況下,期 望在匹配的正常樣本(通常是表皮)中存在高水平的腫瘤漸滲現(xiàn)象。能夠根據(jù)在匹配的正 常樣本中期望的腫瘤"污染"量來調(diào)節(jié)匹配的正常數(shù)據(jù)集中所允許的體細(xì)胞斷裂點(diǎn)的支持 量。"自然突變"斷裂點(diǎn)是那些在腫瘤和匹配的正常數(shù)據(jù)集中都具有顯著支持或者僅在匹配 的正常數(shù)據(jù)集中具有支持的斷裂點(diǎn)。在該分析中不考慮這些斷裂點(diǎn),因為這些重排與所著 手的問題無關(guān)。而且,由于測序儀器所引發(fā)的偽跡、樣本制備(諸如全基因組放大)或所采 用的短讀數(shù)映射算法中的系統(tǒng)偏差,這些斷裂中的許多斷裂點(diǎn)被視為假性的。
[0039] 利用拆分讀數(shù)進(jìn)行結(jié)構(gòu)變化的細(xì)化:bambam最初發(fā)現(xiàn)的斷裂點(diǎn)是恰當(dāng)?shù)?,因為?們使用了全映射讀數(shù),全映射讀數(shù)本質(zhì)上基本不覆蓋斷裂點(diǎn)的實際接合處,因為這代表了 不存在于基準(zhǔn)(或者在體細(xì)胞重排的情況下為匹配的正常數(shù)據(jù)集)中的序列。為了細(xì)化斷 裂點(diǎn)的位置,開發(fā)了稱為Bridget的程序。
[0040] Bridget被給予bambam所發(fā)現(xiàn)的適當(dāng)?shù)臄嗔腰c(diǎn)并且搜索通過完全映射配對錨定 在推定斷裂點(diǎn)附近的所有未對齊讀數(shù)。這些未映射讀數(shù)中的每一個都具有成為與重排的斷 裂點(diǎn)接合處重疊的"拆分讀數(shù)"的可能。圍繞斷裂點(diǎn)兩側(cè)的局部的基因組序列被分裂成一 組獨(dú)特小區(qū)(當(dāng)前小區(qū)尺寸=16bp),并且構(gòu)建小區(qū)序列及其在基準(zhǔn)基因組中的位置的小 區(qū)數(shù)據(jù)庫。通過將讀數(shù)分裂成相同尺寸的小區(qū)并且標(biāo)記它們在讀數(shù)內(nèi)的位置,對于每個未 對齊的讀數(shù)來構(gòu)造類似的小區(qū)數(shù)據(jù)庫。將基準(zhǔn)小區(qū)數(shù)據(jù)庫和未對齊小區(qū)數(shù)據(jù)庫相比較,確 定基準(zhǔn)中的每個未對準(zhǔn)小區(qū)的基因組位置。通過確定在基準(zhǔn)讀數(shù)和未對齊讀數(shù)中毗連的最 大的一組小區(qū),斷裂點(diǎn)的每側(cè)各一個,來計算這些位置的"雙跨越集合"。
[0041] 基準(zhǔn)坐標(biāo)中的雙跨越集合的最小和最大基因組位置精確地確定了斷裂點(diǎn)位置,以 及接合處兩側(cè)的取向(或鏈向)。通過描述斷裂點(diǎn)的左右邊界的信息,完全地定義重排的序 列,即,左側(cè)由(例如,染色體=chrl,位置=lOOObp,鏈=正向)定義,右側(cè)由(例如,染 色體=chr5,位置=500,000bp, strand =反向)定義。還通過這些雙跨越集合來確定斷 裂點(diǎn)的序列同源性(即,短序列,諸如"CA",在斷裂點(diǎn)的兩個邊界上觀察到為相同,但是在 兩個序列的接合處的對齊讀數(shù)上僅觀察到一次)。
[0042] 對于每個未對齊的讀數(shù),雙跨越集合確定了斷裂點(diǎn)的潛在位置。因為每個未對齊 讀數(shù)可以確定斷裂點(diǎn)的略微不同的位置(由于靠近斷裂點(diǎn)的序列誤差、重復(fù)參照等),根據(jù) 雙跨越集合確定的所有斷裂點(diǎn)位置用來生成可能的接合序列。所有的未映射讀數(shù)與這些可 能的接合序列中的每一個重新對齊,并且針對讀數(shù)與原始序列對齊的良好程度來測量其對 齊度的整體改進(jìn)。產(chǎn)生了對齊得分的最大改進(jìn)的接合序列被判斷為真實重排的最佳候選。 如果該最佳接合序列產(chǎn)生了對齊得分的可忽略的改進(jìn),則該接合序列被拋棄,因為其不大 可能代表真實重排。在該情況下,還可以確定,拆分讀數(shù)確認(rèn)的缺乏是bambam所發(fā)現(xiàn)的原 始結(jié)構(gòu)重排可能為假性的證據(jù)。圖2示意性地描繪了精確地標(biāo)識發(fā)生了結(jié)構(gòu)重排的基因組 中的位置的示例性方法。對于潛在拆分讀數(shù)和基準(zhǔn)基因組兩者都確定小區(qū)(或kmer)。確 定雙跨越集合(在該圖的底部表示為深紅色和紫色框),其完全地定義了如何構(gòu)造重排序 列。雙跨越集合對于拆分讀數(shù)中的序列誤差或SNP是穩(wěn)健的。
[0043] 一旦已經(jīng)如上文所述利用拆分讀數(shù)細(xì)化了結(jié)構(gòu)變化,驅(qū)動實際上與極度放大的區(qū) 域有關(guān)的一個或多個斷裂點(diǎn)。更具體地,既定斷裂點(diǎn)的支持與其連接的區(qū)域的拷貝數(shù)成正 t匕。因此,通過需要斷裂點(diǎn)具有高水平的讀數(shù)支持,能夠濾除作為拷貝中立重排的部分或?qū)?致低拷貝放大和刪除而相反集中于腫瘤中作為極度放大區(qū)域的部分的斷裂點(diǎn)上的斷裂點(diǎn)。 選擇特定的讀數(shù)支持閾值,使得去除具有腫瘤基因組的拷貝中立區(qū)域所期望的讀數(shù)支持的 斷裂點(diǎn)。
[0044] 然后,通過遍行斷裂點(diǎn)圖來重構(gòu)擴(kuò)增子。例如,類似于近期公開的方法(Genome Res.,2011年10月12日),發(fā)明人通過描述代表腫瘤基因組的放大片段的一組邊緣和將邊 緣彼此連接的一組有向頂點(diǎn)來構(gòu)造斷裂點(diǎn)圖。此處,邊緣被定義為在相對拷貝數(shù)中觀察到 的腫瘤基因組的放大片段,而頂點(diǎn)是以上述方式發(fā)現(xiàn)的極度被支持的斷裂點(diǎn)。如果放大片 段被斷裂點(diǎn)中斷,則該片段將在中斷斷裂點(diǎn)的位置處拆分成兩個邊緣。
[0045] 通過根據(jù)基因位置來布置片段,發(fā)明人通過從第一放大片段的最左側(cè)位置開始且 朝向右側(cè)前進(jìn)直到遇到向右取向的頂點(diǎn)來確定代表重排的腫瘤序列的邊緣排列。通過跟隨 頂點(diǎn)到達(dá)其所連接的片段且沿出射頂點(diǎn)所規(guī)定的方向(左或右)移動,路徑繼續(xù)。當(dāng)已經(jīng) 遍歷通過所有邊緣和頂點(diǎn)的路徑至少一次時,得到了斷裂點(diǎn)圖的解。在圖3中示出了玩具 實施例的斷裂點(diǎn)圖及其解,證實了遍行斷裂點(diǎn)圖來重構(gòu)重排序列。以片段"a"起始,將跟隨 離開的斷裂點(diǎn)1到達(dá)右側(cè),進(jìn)入片段"b"的左手側(cè)。繼續(xù)向右,將跟隨離開的斷裂點(diǎn)2,進(jìn)入 片段"c"的右手側(cè)。該斷裂點(diǎn)指向左,指示在重排序列的倒置取向中發(fā)現(xiàn)片段"c"。跟隨最 后的斷裂點(diǎn)3回到片段"a"的左手側(cè),解釋了拷貝數(shù)中的所有額外拷貝。因此,所發(fā)現(xiàn)的最 后的解是"ab_c"。
[0046] 給定這樣松弛的約束,顯然可以得到斷裂點(diǎn)圖的許多令人滿意的解。然而,通過圖 的最優(yōu)路徑是那些與所觀測到的相對拷貝數(shù)最密切一致的路徑。解遍歷既定片段的次數(shù)產(chǎn) 生了該片段的拷貝數(shù)的估計。計算對于每個解所觀測到的相對拷貝數(shù)的片段遍歷計數(shù)的均 方根偏差(RMSD),然后,將具有最小RMSD值的解被標(biāo)記為最優(yōu)。 實施例
[0047] 發(fā)明人將上述方法應(yīng)用于兩個多形性成膠質(zhì)細(xì)胞瘤(GBM)樣本,標(biāo)示為 TCGA-06-0648 和 TCGA-06-0152,兩者均通過 Cancer Genome Atlas(TCGA)項目測序。來自 這些樣本的腫瘤和匹配的正常(血液)測序數(shù)據(jù)集按如方法中所描述地進(jìn)行處理,產(chǎn)生腫 瘤對正常相對拷貝數(shù)估計,標(biāo)識斷裂點(diǎn),并且執(zhí)行拆分讀數(shù)分析。兩個樣本的腫瘤基因組和 正常基因組被測序成近似30x的平均覆蓋率。
[0048] bambam標(biāo)識出總共3, 696個斷裂點(diǎn),其中bridget發(fā)現(xiàn)132個斷裂點(diǎn)具有直接跨 越推定斷裂點(diǎn)的拆分讀數(shù)。圖4示出了在樣本TCGA-06-0648中發(fā)現(xiàn)的所有體細(xì)胞斷裂點(diǎn) 的讀數(shù)支持的直方圖。通過將最小讀數(shù)支持閾值設(shè)定成100,去除了 bridget所支持的除 了 16個體細(xì)胞斷裂點(diǎn)之外的全部體細(xì)胞斷裂點(diǎn)。有益的是,這些高度支持的全部16個斷 裂點(diǎn)靠近染色體12的成簇區(qū)域中的極度放大的片段的邊界,如圖5所示,其中基因組瀏覽 器顯示樣本TCGA-06-0648的相對拷貝數(shù)("Overall Copy Number",以灰度表示)以及高 度支持的斷裂點(diǎn)("染色體間重排"和"染色體內(nèi)重排",斷裂點(diǎn)支持>100個讀數(shù))。發(fā)現(xiàn) 總共16個放大的片段,一個片段包含GBM腫瘤發(fā)生所涉及到的已知致癌基因 MDM2。實際 上,每一個放大的片段的邊界能夠與正確取向而使得其進(jìn)入放大部或從放大部離開的單個 斷裂點(diǎn)相關(guān)聯(lián)。這表明了,高度支持的斷裂點(diǎn)和放大部相關(guān)并且實際上可代表腫瘤基因組 中的放大片段的重排構(gòu)造。
[0049] 圖6是因為它們靠的太近而不能在圖5的瀏覽器繪圖中可見而夸大了一些片段的 尺寸和位置的這些相同數(shù)據(jù)的圖。圖6描繪了 TCGA-06-0648斷裂點(diǎn)圖的環(huán)形解,表明了包 含MDM2的放大后的雙微染色體的存在。斷裂點(diǎn)讀數(shù)支持列為腫瘤讀數(shù)計數(shù)/布爾讀數(shù)計 數(shù),例如,1365/9意味著1,365個讀數(shù)支持腫瘤中的斷裂點(diǎn),在血液中發(fā)現(xiàn)了 9個支持讀數(shù)。 解列出了其新構(gòu)造中片段的次序和取向,負(fù)號用于指示倒置取向上的片段。放大片段的拷 貝數(shù)表示,在平均腫瘤細(xì)胞中存在的每個片段至少有40個拷貝。該圖是斷裂點(diǎn)圖的直觀表 示,并且通過遍行斷裂點(diǎn)圖,找到了單個最優(yōu)解。該解的令人關(guān)注的方面是,其是環(huán)形的,因 為最后一個片段的最后遍歷返回到起始位置,即,第一個頂點(diǎn)也是最后一個頂點(diǎn)。環(huán)形解確 切通過每個片段一次,然而拷貝數(shù)表明存在腫瘤基因組中的每個片段的近似40個拷貝。為 了解釋那些額外拷貝,必須循環(huán)通過片段另外39遍。這些額外的拷貝可存在于多種不同的 構(gòu)造中,通過兩個極端例證:(1)復(fù)制40個拷貝以按該精確的次序和取向來形成這些片段 的未斷裂的串聯(lián)陣列,或者(2)形成單個自復(fù)制雙微染色體,其中平均腫瘤細(xì)胞具有累積 的40個拷貝。顯然,后一選擇更加節(jié)儉,因為其不需要在重排序列的近似同一位置(S卩,初 始擴(kuò)增子的邊界頂點(diǎn))發(fā)生40次接連的串聯(lián)復(fù)制,而使得不丟失放大片段或者不以不同的 濃度存在放大片段。因此,數(shù)據(jù)表明,包含MDM2的致癌基因 DM存在于該GBM腫瘤樣本中。
[0050] 還顯示在圖6中的是用于腫瘤和血液測序數(shù)據(jù)集中的全部高度支持的斷裂點(diǎn)的 讀數(shù)支持。首先要注意的是,斷裂點(diǎn)在腫瘤中具有極高的支持度,一些斷裂點(diǎn)由多于2, 000 個拆分讀數(shù)支持。這是所期望的,因為重排限定了擴(kuò)增子,并且擴(kuò)增子以極高的拷貝數(shù)存 在。更關(guān)注的是,每個斷裂點(diǎn)還在患者血液中顯示出驚人的高支持量。假設(shè)DM在一連串有 絲分裂階段之后丟失的傾向,DM起初存在于突變體中且保持?jǐn)?shù)十年是不大可能的,僅僅在 腫瘤生成過程中經(jīng)過了放大??紤]到致癌基因 DM不大可能為非癌癥細(xì)胞提供選擇性優(yōu)勢, 這點(diǎn)尤其為真。更節(jié)儉的解決方案是,該致癌基因 DM起初不是體細(xì)胞,在腫瘤生成之前或 腫瘤生成過程中的某點(diǎn)被構(gòu)造和放大。該DM為出現(xiàn)的腫瘤細(xì)胞提供的選擇性優(yōu)勢導(dǎo)致累 積更多DM拷貝的細(xì)胞相對于那些具有較少拷貝的細(xì)胞具有不同的生長優(yōu)勢,使得在假設(shè) 為該DM的部分的區(qū)域中觀察到具有均勻的高的拷貝數(shù)的腫瘤細(xì)胞群體。MDM2常見于致癌 基因 DM中的事實使得更加支持該假設(shè)(Genomics. 1993Feb ; 15 (2) :283-90)。
[0051] 通過在此處描述的方法處理另一 GBM腫瘤樣本TCGA-06-0152中的類似結(jié)果。圖7 顯示的是染色體12的包括致癌基因 CDK4和MDM2的極度放大區(qū)域以及染色體7的包括EGFR 致癌基因的區(qū)域的瀏覽器截圖。此處,顯示了染色體(a) 12和(b)7上的樣本TCGA-06-0152 的放大的片段和高度支持的結(jié)構(gòu)變體(讀數(shù)支持>100)的基因組瀏覽器繪圖。注意,在圖8 中給出了將染色體12上的小的放大區(qū)域與染色體7上的放大區(qū)域連接的紫色的染色體間 斷裂點(diǎn),這些斷裂點(diǎn)包含了這些區(qū)域的EGFRA圖。此處,顯示出用于GBM樣本TCGA-06-0152 的斷裂點(diǎn)圖的環(huán)形解,其表明存在在腫瘤中放大的兩個單獨(dú)的致癌基因 DM。MDM2+CDK4雙 微體的解遍歷了一些片段多次,但是在觀測到的相對拷貝數(shù)中解釋了所有額外的遍歷。20 個斷裂點(diǎn)中的11個斷裂點(diǎn)表明了患者血液樣本中的不一致讀數(shù)證據(jù)。放大了兩個染色體 上總共29個片段,一些片段比其他片段顯示出更高的相對拷貝數(shù)。發(fā)現(xiàn)了 20個高度支持 的斷裂,如之前樣本TCGA-06-0648那樣,所有斷裂能夠唯一地與相對拷貝數(shù)中的不連續(xù)相 關(guān)聯(lián)。通過求解斷裂點(diǎn)圖,發(fā)現(xiàn)了兩個獨(dú)立的環(huán)形解。解(1)使用染色體12上除了兩個染 色體內(nèi)斷裂點(diǎn)之外的所有斷裂點(diǎn)并且包含了致癌基因 CDK4的一個拷貝以及致癌基因 MDM2 的兩個拷貝。解(2)合并了跨越染色體7和12上的放大區(qū)域的兩個染色體間斷裂點(diǎn)以及 染色體12上的兩個染色體內(nèi)斷裂點(diǎn),并且包含了致癌基因 EGFR。這兩個解表明,在該樣本 中形成并放大了兩個DM,兩個DM都包含了不同的致癌基因并且可能對于生長的腫瘤細(xì)胞 提供顯著的選擇性優(yōu)勢。
[0052] 解(1)還描述了通過放大片段的比在樣本TCGA-06-0648中觀測到的更復(fù)雜的路 徑。為了在解中合并所有高度支持的斷裂點(diǎn),一些片段必須被遍歷多次。29個片段中的11 個片段被遍歷兩次,一個小的片段被遍歷三次。在相對拷貝數(shù)中觀測到了由于這些遍歷預(yù) 期到的增加的拷貝數(shù),其中平均腫瘤細(xì)胞包含該DM的近似35個拷貝。被遍歷兩次的片段 具有大概70個拷貝數(shù)。被遍歷三次的片段表現(xiàn)為與被遍歷兩次的片段相比具有增加的拷 貝數(shù)(?85對?75),但是該片段的小尺寸使其難以精確地計算出相對拷貝數(shù)。
[0053] 如之前所述,在患者血液樣本TCGA-06-0152中存在腫瘤斷裂點(diǎn)的證據(jù),但是比 在血液樣本TCGA-06-0648中觀測到的程度更輕。20個斷裂點(diǎn)中的11個斷裂點(diǎn)具有較 低水平的讀數(shù)支持,而9個斷裂點(diǎn)在血液中無讀數(shù)支持。出現(xiàn)這種情況可能有多種原因。 例如,血液數(shù)據(jù)可能在較低覆蓋率下進(jìn)行測序,使得經(jīng)過任意既定體細(xì)胞斷裂點(diǎn)的測序機(jī) 率更低??商娲?,原因可能是生物固有的,由此一些機(jī)制誘發(fā)TCGA-06-0152腫瘤以比 TCGA-06-0648低的速率將DM脫落到血流中,降低了血液中DM的觀測濃度。
[0054] 在DM特定斷裂點(diǎn)的血液中存在腫瘤不一致讀數(shù)則表明,這些GBM帶來的DM經(jīng)過 血腦屏障且進(jìn)入患者的血流中。最令人著急的是,血液中GBM帶來的DM的數(shù)量使得利用僅 從患者血液得到的平均覆蓋率的測序數(shù)據(jù)就能夠檢測到DM特定的斷裂點(diǎn)。雖然測序證據(jù) 強(qiáng)有力地表明了致癌基因 DM的存在,但是不得不對腫瘤和匹配的正常樣本執(zhí)行放大的致 癌基因的FISH(熒光原位雜交)分析來確認(rèn)該假設(shè)。
[0055] 從另一視角看,應(yīng)當(dāng)理解的是,基因組不穩(wěn)定性和結(jié)構(gòu)重排是癌癥集中于的區(qū)別 性印記。通過下一代測序技術(shù),發(fā)明人的測量由于腫瘤生成和發(fā)展而出現(xiàn)的結(jié)構(gòu)重排的能 力已顯著提高,然而,對于輔助這些事件的更好理解的重排發(fā)現(xiàn)、分析和可視化方法產(chǎn)生了 迫切的需求。
[0056] 為解決這些難題,發(fā)明人的測序分析流水線使得各個腫瘤突變的發(fā)現(xiàn)、小的插入 缺失、拷貝數(shù)改變、等位基因特定的放大和刪除以及基因組重排合理化。例如,在一個代表 性分析中,利用在可用的斷裂點(diǎn)附近發(fā)現(xiàn)的未映射的】推定的拆分讀數(shù)來將重排細(xì)化成斷 裂點(diǎn)精度。然后,呈現(xiàn)結(jié)果,優(yōu)選地以交互式的、基于網(wǎng)絡(luò)的基因組瀏覽器來呈現(xiàn),提供高水 平的、經(jīng)處理的結(jié)果以及由其獲得這些的原始數(shù)據(jù)的分析和可視化,這示意性地圖示在圖9 中。
[0057] 利用其匹配的正常序列來標(biāo)識體細(xì)胞重排,測序分析流水線用來發(fā)現(xiàn)來自The Cancer Genome Atlas (TCGA)項目的17個全基因組多形性成膠質(zhì)細(xì)胞瘤(GBM)腫瘤樣本中 的高置信度的、小規(guī)模和大規(guī)模的體細(xì)胞事件。在這些樣本中標(biāo)識出的=的眾多受關(guān)注的 結(jié)構(gòu)變型中,發(fā)明人發(fā)現(xiàn)了在可裝配以便以堿基級別的精度構(gòu)造環(huán)形雙微染色體的極度放 大區(qū)域中的具有復(fù)雜重排模式的兩個腫瘤,如圖10A/B和11A/B中所看到的。在血液測序 數(shù)據(jù)中發(fā)現(xiàn)了雙微體所特有的斷裂點(diǎn)的證據(jù),提高了可開發(fā)針對具體患者的基于PCR的化 驗以量化體細(xì)胞重排的存在從而用作監(jiān)控腦腫瘤的進(jìn)展的代理的可能性。
[0058] 而且,發(fā)現(xiàn)了四個GBM腫瘤,它們展現(xiàn)出EGFR放大和重排,表明EGFRvIII突變基 因的存在,由此刪除了 EGFR的外顯子2-6。將EGFRvIII關(guān)聯(lián)的斷裂點(diǎn)的讀數(shù)支持與鄰近處 正常映射的讀數(shù)的量相比較,表明EGFRvIII突變出現(xiàn)在野生型EGFR的放大之后,作為腫瘤 中EGFR拷貝的總數(shù)的小部分而存在。示例性的結(jié)果提供在圖12A/B中。
[0059] 因此,應(yīng)當(dāng)理解的是,將相對拷貝數(shù)與斷裂點(diǎn)整合的能力提供了一種理解癌癥細(xì) 胞的基因組拓?fù)浣Y(jié)構(gòu)的新方式。更具體地,發(fā)明人證實,在腫瘤的極度放大的區(qū)域的情況 下,觀測到的拷貝數(shù)和高度支持的斷裂點(diǎn)兩者都能夠通過求解簡單的斷裂點(diǎn)圖來解釋,斷 裂點(diǎn)圖描述了腫瘤基因組中的極度放大的片段的次序和取向。
[0060] 在此處論述的GBM樣本中,放大的片段的斷裂點(diǎn)圖的最優(yōu)解是環(huán)形的。這些環(huán)形 解表明了,觀測到的放大區(qū)域可能已經(jīng)形成了稱為雙微體的環(huán)形染色體。在每個雙微體上 致癌基因的存在及其極度放大的狀態(tài)表明了,雙微體具有強(qiáng)的致癌基因潛能,將選擇性優(yōu) 勢賦予腫瘤細(xì)胞,并且它們的形成很可能是兩個GBM腫瘤的腫瘤生成中的關(guān)鍵事件。
[0061] 對于這些在兩個腫瘤的發(fā)展中可能具有巨大影響的這些腫瘤基因組的部分的重 構(gòu)同等重要的是,專用于DM的幾乎每個斷裂點(diǎn)同樣在該患者血液中具有可檢測的讀數(shù)支 持。該發(fā)現(xiàn)表明,GBM帶來的DM正通過某種機(jī)制進(jìn)入血流,這特別重要,因為這表明了以致 癌基因 DM為特征的GBM腫瘤可利用血液樣本來檢測和監(jiān)控,而無序在先的腫瘤測序。
[0062] 這些致癌基因 DM的一種可能的傳輸機(jī)制是經(jīng)由微泡,微泡是從可包含各種細(xì)胞 成分的大多數(shù)細(xì)胞了類型脫落的血漿膜的細(xì)胞外片段。研究表明,腫瘤細(xì)胞釋放大量的 包含多個子細(xì)胞微粒的微泡,包括核酸和蛋白質(zhì),其具有用于診斷和監(jiān)控的潛能。起初,在 從患有GBM腫瘤的患者體中提取的血清中標(biāo)識出mRNA、miRNA和生血管蛋白質(zhì)(Nat. Cell Biol. 2008Dec. ; 10 (12) :1470 - 1476)。近期,Balaj 等人(Nat Commun 2011 ;2:180)已經(jīng) 隔離出包含具有放大的致癌基因序列的單鏈DNA(ssDNA)的微泡,特別是c-Myc。
[0063] 檢測血流中的DM的能力應(yīng)當(dāng)擴(kuò)展至通常以包含已知致癌基因的極度放大DM為特 征的其他癌癥,諸如非小細(xì)胞肺癌中的EGFR和急性粒細(xì)胞性白血病中的EGFR。實際上,對 于血流更可接近的腫瘤類型,通過這種方法檢測DM的能力可以提高。此外,可以基于僅從 血流中采集的的證據(jù)來規(guī)定特別地以通常經(jīng)由基于DM的機(jī)制放大的基因為目標(biāo)的藥物, 避免疼痛,并且在為GBM腫瘤的情況下,避免危險的腫瘤活體檢視。
[0064] 可以設(shè)想基于測序的化驗,其并入了血液樣本的全基因組測序數(shù)據(jù)以可靠地判定 諸如EGFR、c-Myc、MDM2等已知的致癌基因周圍的區(qū)域是否呈現(xiàn)出指示放大雙微體的成簇 的斷裂點(diǎn)圖案。將經(jīng)過這些區(qū)域的不一致讀數(shù)組合應(yīng)當(dāng)提高標(biāo)識這些區(qū)域的能力,即使當(dāng) 血流中DM的濃度低時。如果微泡實際上傳輸DM,則富集微泡的技術(shù)將進(jìn)一步提高從血液樣 本中檢測低水平致癌基因 DM的能力。
[0065] 因此,基于上述,應(yīng)當(dāng)理解本文所提供的分子診斷工具能夠用于無需疾病先驗知 識的腫瘤病的診斷和/或確認(rèn)。最優(yōu)選的是,生物樣本是血液或血液的血清/血漿微量,但 是還可以包括活體檢視材料或抽出物。此外,可構(gòu)思的是,這種診斷工具可適用于所有類型 腫瘤病,特別是癌癥(例如,各種癌、淋巴瘤和肉瘤)。
[0066] 因此,發(fā)明人特別地構(gòu)思了基因信息的一種或多種重排模式的用途和/或標(biāo)識, 最優(yōu)選地,基因信息直接從全血(或經(jīng)處理的其中的小部分)獲得。最典型地,重排模式 包括基因組重排,特別是環(huán)形分子由基因組物質(zhì)形成(通常具有等于或小于3Mb的尺寸)。 在特別構(gòu)思的用途和方法中,環(huán)形重排的遺傳物質(zhì)包括致癌基因和/或腫瘤抑制基因的至 少部分。然而,最典型地,環(huán)形重排的遺傳物質(zhì)將包括全功能或至少可全表達(dá)形式的致癌基 因和/或腫瘤抑制基因。因此,能夠通過各種治療、診斷或預(yù)后方法哺乳動物的樣本進(jìn)行分 析,優(yōu)選地利用檢測雙微體的、特別是包括致癌基因和/或腫瘤抑制基因的雙微體的簡單 血液測試。相反,以患腫瘤個體的血流中具有雙微體(特別是包括致癌基因和/或腫瘤抑 制基因的雙微體)的觀察為前提,應(yīng)當(dāng)認(rèn)識到,通過對從患腫瘤個體(或者甚至是細(xì)胞培養(yǎng) 或動物模型)隔離出的雙微體進(jìn)行分析,可以發(fā)現(xiàn)新的或至今未識別的致癌基因和/或腫 瘤抑制基因。
[0067] 基于進(jìn)一步的觀察,發(fā)明人還構(gòu)思了,雙微體相對于基因組信息的數(shù)值比例可用 作疾病、特別是腫瘤病的指示的閾值。因此,雙微體的分析可用作預(yù)測癌癥危險或擴(kuò)散的指 導(dǎo)性指示符。當(dāng)然,值得注意的是,雙微體不一定需要包括用于這種分析的致癌基因和/或 腫瘤抑制基因。
[0068] 而且,可構(gòu)思的是雙微體中的致癌基因的類型還可能與特定類型的疾病相關(guān)聯(lián), 特別是與腫瘤病相關(guān)聯(lián)。因此,從全血進(jìn)行基因重排的分析以及雙微體中致癌基因和/或 腫瘤抑制基因的標(biāo)識/量化可以提供關(guān)于特定贅生物的類型、進(jìn)展和/或危險。因此,多種 基于全血的測試(例如,無分離、過濾等)被認(rèn)為在疾病的診斷或預(yù)測中對于致癌基因的檢 測特別有利。例如,在確立具體斷裂迪娜和以特定腫瘤類型為特征的重排時,可設(shè)計專門幫 助標(biāo)識這種重排(和DM)的存在和/或量的引子。類似地,可以在利用雙微體的分析的方法 中確定治療效率或藥物效果,特別是那些包括致癌基因和/或腫瘤抑制基因的雙微體。這 種測試方法在基于雙鏈斷裂(或其修復(fù)抑制)的一定的化學(xué)治療劑和/或放射治療的背景 下特別有用。
[0069] 基于能夠從全血中大量地分離雙微體的觀察,發(fā)明人還構(gòu)思了,雙微體可與蛋白 質(zhì)、脂蛋白、脂類和/或囊泡結(jié)構(gòu)以及特別是微泡相關(guān)聯(lián)。因此,在雙微體被包封在微泡中 的情況下,應(yīng)當(dāng)理解的是,來自微泡的表面表位代表了微泡所源起的細(xì)胞。因此,能夠基于 微泡薄膜成分的分析來標(biāo)識腫瘤起源(例如,組織類型)。
[0070] 本領(lǐng)域技術(shù)人員顯而易見的是,除了已經(jīng)描述的之外,可以有更多的變型例,而不 偏離本文中的發(fā)明構(gòu)思。因此,除了在隨附權(quán)利要求書的精神下之外,發(fā)明主題不受限制。 而且,在解釋說明書和權(quán)利要求書時,所有的術(shù)語應(yīng)當(dāng)以與上下文一致的盡可能寬泛的方 式來解釋。特別地,術(shù)語"包括"和"包含"應(yīng)當(dāng)解釋為以非窮盡方式指代要素、部件或步驟, 表明了所指代的要素、部件或步驟可以存在或利用或與未明確指代的其他要素、部件或步 驟相結(jié)合。在說明書的權(quán)利要求書提到從由A,B,C...和N構(gòu)成的組中選出的至少一個某 物的情況下,該文本應(yīng)當(dāng)解釋為僅需要來自該組的一個要素,而不是A加N、或B加N,等等。
【權(quán)利要求】
1. 分析基因組數(shù)據(jù)的方法,包括: 確定腫瘤基因組序列與匹配的正?;蚪M序列之間的相對拷貝數(shù); 標(biāo)識所述腫瘤基因組序列與所述匹配的正?;蚪M序列中的推定斷裂點(diǎn); 細(xì)化所述推定斷裂點(diǎn)以標(biāo)識斷裂點(diǎn)位置和所述腫瘤基因組序列的取向; 利用讀數(shù)支持閾值將所述斷裂點(diǎn)確認(rèn)為顯著斷裂點(diǎn); 利用所述相對拷貝數(shù)、所述顯著斷裂點(diǎn)和所述取向來確定具有環(huán)形解的基因組排列。
2. 如權(quán)利要求1所述的方法,其中利用動態(tài)加窗來執(zhí)行確定所述相對拷貝數(shù)的步驟, 和/或其中利用不一致配對讀數(shù)來執(zhí)行標(biāo)識推定斷裂點(diǎn)的步驟。
3. 如權(quán)利要求1所述的方法,其中通過生成斷裂點(diǎn)圖且求解所述斷裂點(diǎn)圖而達(dá)到所述 環(huán)形解來確定所述基因組排列。
4. 如權(quán)利要求1所述的方法,其中利用將所述腫瘤基因組序列分段且將片段與基準(zhǔn)數(shù) 據(jù)庫進(jìn)行比較來執(zhí)行細(xì)化所述推定斷裂點(diǎn)的步驟。
5. 如權(quán)利要求1所述的方法,其中所述讀數(shù)支持閾值是用戶確定的。
6. 如權(quán)利要求1所述的方法,其中所述環(huán)形解指示雙微染色體作為所述基因組排列。
7. 如權(quán)利要求1所述的方法,其中所述腫瘤基因組序列來自作為實體瘤的腫瘤,并且 其中所述腫瘤基因組序列與存在于生物流體中的遺傳物質(zhì)隔離。
8. 如權(quán)利要求7所述的方法,其中所述生物流體是血液。
9. 如權(quán)利要求8所述的方法,其中所述實體瘤是多形性成膠質(zhì)細(xì)胞瘤或非小細(xì)胞肺 癌。
10. 分析基因組數(shù)據(jù)的方法,包括: 在達(dá)到所述斷裂點(diǎn)的讀數(shù)支持閾值時,將腫瘤基因組序列的拷貝數(shù)與所述腫瘤基因組 序列中的斷裂點(diǎn)相關(guān)聯(lián); 確定所述腫瘤基因組序列的取向;以及 利用所述拷貝數(shù)、所述斷裂點(diǎn)的位置和所述腫瘤基因組序列的取向來確定基因組排 列。
11. 如權(quán)利要求10所述的方法,其中所述讀數(shù)支持閾值是用戶定義的讀數(shù)支持閾值。
12. 如權(quán)利要求10所述的方法,其中通過利用所述腫瘤基因組序列的所述拷貝數(shù)、所 述斷裂點(diǎn)在基因組內(nèi)的位置以及所述腫瘤基因組序列的所述取向生成斷裂點(diǎn)圖來執(zhí)行確 定基因組排列的步驟,其中在所述斷裂點(diǎn)圖中所述拷貝數(shù)表達(dá)為邊緣,并且其中所述斷裂 點(diǎn)位置表達(dá)為頂點(diǎn)。
13. 分析實體瘤的基因組數(shù)據(jù)的方法,包括: 將所述實體瘤標(biāo)識為其中腫瘤基因組的至少部分存在于生物流體中的腫瘤; 從患者體中獲得所述生物流體并且將所述腫瘤基因組的所述至少部分隔離;以及 根據(jù)權(quán)利要求1或權(quán)利要求10的方法,利用所述腫瘤基因組的隔離的至少部分來分析 所述基因組數(shù)據(jù)。
14. 如權(quán)利要求13所述的方法,其中所述腫瘤基因組的所述至少部分作為雙微染色體 而存在。
15. 如權(quán)利要求13所述的方法,還包括:標(biāo)識所述腫瘤基因組的隔離的至少部分內(nèi)的 致癌基因或腫瘤抑制基因的步驟。
16. 如權(quán)利要求15所述的方法,還包括:利用以致癌基因或腫瘤抑制基因為目標(biāo)的藥 用方案來治療患者的步驟。
17. 分析實體瘤的基因組數(shù)據(jù)的方法,包括: 從患者體中獲得生物流體并且將腫瘤基因組的至少部分與所述生物流體隔離;以及 判定致癌基因周圍的區(qū)域是否展示出指示放大雙微體的成簇斷裂點(diǎn)圖案。
18. 如權(quán)利要求17所述的方法,其中致癌基因是野生型或EGFR、c-Myc或MDM2的突變 體形式。
19. 如權(quán)利要求17所述的方法,其中確定步驟包括使用根據(jù)權(quán)利要求1或權(quán)利要求10 的方法。
20. 如權(quán)利要求17所述的方法,其中所述實體瘤是多形性成膠質(zhì)細(xì)胞瘤或非小細(xì)胞肺 癌,并且其中所述生物流體是血液。
21. 從頭診斷腫瘤病的方法,包括: 從患者體中獲得生物樣本并且將核酸與所述樣本隔離; 對于基因組樣本的拷貝數(shù)和所述基因組樣本中的斷裂點(diǎn)來分析所述核酸; 在達(dá)到所述斷裂點(diǎn)的讀數(shù)支持閾值時,將所述基因組序列的所述拷貝數(shù)與所述基因組 序列中的所述斷裂點(diǎn)相關(guān)聯(lián); 確定所述基因組序列的取向;以及 利用所述拷貝數(shù)、所述斷裂點(diǎn)的位置和所述基因組序列的所述取向來確定基因組排 列;以及 利用所述基因組排列來確定所述腫瘤病的可能性。
22. 如權(quán)利要求21所述的方法,還包括將所述基因組排列標(biāo)識為雙微體的步驟。
23. 如權(quán)利要求22所述的方法,還包括標(biāo)識所述基因組排列中的致癌基因或腫瘤抑制 基因的步驟。
24. 如權(quán)利要求21所述的方法,其中所述腫瘤病是胃癌、結(jié)腸癌、前列腺癌、肺癌、白血 病或乳腺癌。
【文檔編號】G01N33/574GK104094120SQ201280068336
【公開日】2014年10月8日 申請日期:2012年12月7日 優(yōu)先權(quán)日:2011年12月8日
【發(fā)明者】J·Z·桑伯恩, C·J·瓦斯克, S·C·本茨 申請人:凡弗3基因組有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
南雄市| 通辽市| 独山县| 鄂州市| 大新县| 东城区| 普兰县| 平顶山市| 长顺县| 文成县| 贵港市| 洛阳市| 奉化市| 江源县| 清水河县| 神池县| 宁津县| 尤溪县| 文山县| 东宁县| 合川市| 巫溪县| 金塔县| 凤庆县| 仪陇县| 中牟县| 炎陵县| 新郑市| 洛南县| 乌什县| 安康市| 农安县| 比如县| 连城县| 时尚| 治县。| 盖州市| 大城县| 安吉县| 江华| 临沂市|