本申請要求于2014年2月27日提交的美國臨時申請序列號61/945,791的權(quán)益,該申請通過引用全文并入本文。
援引并入
本說明書中提到的所有出版物、專利和專利申請均通過引用而并入本文,其程度猶如特別地且單獨地指出每個單獨的出版物、專利或?qū)@暾埻ㄟ^引用而全文并入。
技術(shù)實現(xiàn)要素:
一些實施方案涉及鑒定可動因子插入(MEI)標(biāo)記的細(xì)胞增殖的方法,該方法包括以下步驟:定量測量第一核酸樣品中第一MEI插入位點處的MEI水平,定量測量第二核酸樣品中第一MEI插入位點處的MEI水平,以及如果第一核酸樣品中第一MEI插入位點處的MEI水平與第二核酸樣品中第一MEI插入位點處的MEI水平顯著(substantially)不同,則將所述第一MEI插入位點鑒定為標(biāo)記MEI標(biāo)記的細(xì)胞增殖。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品包含基本相似量的核酸。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品中存在基本相似量的對照核酸。所述方法的一些方面包括鑒定與所述第一MEI插入位點相鄰的序列。所述方法的一些方面包括選擇與應(yīng)對與所述第一MEI插入位點相鄰的序列中的缺陷的功效相關(guān)的治療。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品在第一時間點和第二時間點從相同(common)個體獲得。在所述方法的一些方面,所述第一時間點和第二時間點被施用于所述個體的治療隔開。在所述方法的一些方面,所述治療包括癌癥療法。在所述方法的一些方面,所述第一時間點和第二時間點相隔至少6個月。在所述方法的一些方面,所述第一時間點和第二時間點相隔至少1年。在所述方法的一些方面,所述第一時間點和第二時間點相隔至少2年。在所述方法的一些方面,所述第一時間點和第二時間點相隔至少5年。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品從血液中提取。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品包含循環(huán)游離核酸。在所述方法的一些方面,所述第一核酸樣品和所述第二核酸樣品包含循環(huán)游離基因組DNA。在所述方法的一些方面,所述第一核酸樣品從個體的第一位置獲得,而所述第二核酸樣品從該個體的第二位置獲得。在所述方法的一些方面,所述第一位置包含第一癌性組織。在所述方法的一些方面,所述第二位置包含健康組織。在所述方法的一些方面,所述第二位置包含第二癌性組織。在所述方法的一些方面,所述第二癌性組織和所述第一癌性組織來源于相同的癌。所述方法的一些方面包括生成報告,該報告披露第一核酸樣品中第一MEI插入位點處的MEI水平和第二核酸樣品中第一MEI插入位點處的MEI水平。在所述方法的一些方面,所述報告提供給所述個體。在所述方法的一些方面,所述報告提供給醫(yī)療保健專業(yè)人員。在所述方法的一些方面,所述報告是保密的。
一些實施方案涉及可動因子插入(MEI)監(jiān)測方案,其包括以下步驟:從個體獲得包含多個MEI插入邊界的基因組序列信息,考察所述多個MEI插入邊界以鑒定與癌基因相鄰的邊界,以及隨時間監(jiān)測與所述癌基因相鄰的MEI邊界的定量豐度。在所述方法的一些方面,所述隨時間監(jiān)測與所述癌基因相鄰的MEI邊界的定量豐度包括在第一時間點獲得第一血液樣品,確定在所述第一時間點所述第一血液樣品中所述MEI邊界的定量豐度,在第二時間點獲得第二血液樣品,以及確定所述在第二時間點所述第二血液樣品中所述MEI邊界的定量豐度。在所述方法的一些方面,所述隨時間監(jiān)測與所述癌基因相鄰的MEI邊界的定量豐度包括在第一時間點獲得第一組織樣品,確定在所述第一時間點所述第一組織樣品中所述MEI邊界的定量豐度,在第二時間點獲得第二組織樣品,以及確定在所述第二時間點所述第二組織樣品中所述MEI邊界的定量豐度。在所述方法的一些方面,所述第一組織樣品和所述第二組織樣品包含腫瘤組織。所述方法的一些方面包括選擇應(yīng)對與所述癌基因中的缺陷有關(guān)的癌癥的治療。所述方法的一些方面包括如果從所述第一時間點到所述第二時間點,樣品中MEI插入位點的定量豐度增加高于閾值,則施用所述應(yīng)對與所述癌基因中的缺陷有關(guān)的癌癥的治療。在所述方法的一些方面,所述閾值為10%的增加。在所述方法的一些方面,所述閾值為20%的增加。在所述方法的一些方面,所述閾值為30%的增加。在所述方法的一些方面,所述閾值為50%的增加。所述方法的一些方面包括在第一時間點前施用第一劑量的所述應(yīng)對與所述癌基因中的缺陷有關(guān)的癌癥的治療,并且如果從所述第一時間點到所述第二時間點,樣品中MEI插入位點的定量豐度未能降低至閾值以下,則增加劑量。在所述方法的一些方面,所述閾值為所述第一時間點的量的90%。在所述方法的一些方面,所述閾值為所述第一時間點的量的80%。在所述方法的一些方面,所述閾值為所述第一時間點的量的70%。在所述方法的一些方面,所述閾值為所述第一時間點的量的60%。在所述方法的一些方面,所述閾值為所述第一時間點的量的50%。在所述方法的一些方面,所述閾值為所述第一時間點的量的10%。在所述方法的一些方面,所述治療包括化療。在所述方法的一些方面,所述治療包括放療。在所述方法的一些方面,所述治療包括針對與MEI插入相鄰的序列中的缺陷的藥物。在所述方法的一些方面,所述治療包括針對由與MEI插入位點相鄰的序列編碼的蛋白質(zhì)參與的途徑的誤調(diào)節(jié)的藥物。在所述方法的一些方面,所述治療包括特異性結(jié)合MEI插入接合點(junction)的核酸。在所述方法的一些方面,所述核酸包括piRNA。在所述方法的一些方面,所述核酸包括siRNA。在所述方法的一些方面,所述核酸包括CRISPR核酸。在所述方法的一些方面,所述核酸引導(dǎo)MEI插入邊界的甲基化。
一些實施方案涉及用于癌組織的體內(nèi)可視化的組合物,該組合物包含與檢測元件偶聯(lián)的、跨越與癌基因相鄰的MEI邊界的核酸探針。在所述組合物的一些方面,所述檢測元件包含熒光團(tuán)。在所述組合物的一些方面,所述檢測元件包含光可激發(fā)的部分。在所述組合物的一些方面,所述探針穿過細(xì)胞膜。在所述組合物的一些方面,所述探針穿過細(xì)胞核膜。在所述組合物的一些方面,探針熒光依賴于探針與包含與癌基因相鄰的MEI邊界的靶核酸序列的結(jié)合。在所述組合物的一些方面,所述探針通過手持熒光團(tuán)激發(fā)裝置可視化。
一些實施方案涉及用于監(jiān)測基因組老化的方法,該方法包括以下步驟:在第一時間段定量測量第一核酸樣品中MEI插入位點的數(shù)目,在第一時間段定量測量第一核酸樣品中MEI插入位點的數(shù)目,以及將MEI插入邊界的增加與基因組老化的增加相關(guān)聯(lián)。在所述方法的一些方面,MEI插入位點數(shù)目的10%的增加表明基因組老化。在所述方法的一些方面,MEI插入位點數(shù)目的20%的增加表明基因組老化。在所述方法的一些方面,MEI插入位點數(shù)目的30%的增加表明基因組老化。在所述方法的一些方面,MEI插入位點數(shù)目的50%的增加表明基因組老化。所述方法的一些方面包括如果表明基因組老化,則推薦抗老化方案。在所述方法的一些方面,該抗老化方案包括卡路里限制。在所述方法的一些方面,該抗老化方案包括NTHE的施用。在所述方法的一些方面,該抗老化方案包括DNA甲基化酶的施用。在所述方法的一些方面,該抗老化方案包括小調(diào)節(jié)eRNA的施用。在所述方法的一些方面,該抗老化方案包括逆轉(zhuǎn)錄酶抑制劑的施用。在所述方法的一些方面,該抗老化方案包括逆轉(zhuǎn)錄病毒抑制劑的施用。在所述方法的一些方面,該抗老化方案包括HIV抑制劑的施用。在所述方法的一些方面,該抗老化方案包括AZT的施用。在所述方法的一些方面,該抗老化方案包括HBV抑制劑的施用。在所述方法的一些方面,該抗老化方案包括三氮唑核苷(ribavirin)的施用。在所述方法的一些方面,該抗老化方案包括轉(zhuǎn)座酶抑制劑的施用。
一些實施方案涉及比較第一核酸樣品與第二核酸樣品的方法,該方法包括以下步驟:獲得所述第一核酸樣品的多個MEI邊界的可動因子插入(MEI)邊界序列,分析所述第二核酸樣品中是否存在所述多個MEI邊界,以及如果所述第二核酸樣品缺少在所述第一核酸樣品中存在的MEI邊界序列,則將所述第二核酸樣品鑒定為與所述第一核酸樣品不同。所述方法的一些方面包括如果所述第二核酸樣品包含在所述第一核酸樣品中不存在的MEI邊界序列,則將所述第二核酸樣品鑒定為與所述第一核酸樣品不同。在所述方法的一些方面,獲得所述第一核酸樣品的多個MEI邊界的可動因子插入(MEI)邊界序列包括進(jìn)行所述第一核酸樣品的全基因組測序。在所述方法的一些方面,獲得所述第一核酸樣品的多個MEI邊界的可動因子插入(MEI)邊界序列包括對所述第一核酸樣品的多個MEI邊界進(jìn)行靶向測序。在所述方法的一些方面,分析所述第二核酸樣品中是否存在所述多個MEI邊界包括進(jìn)行所述第二核酸樣品的全基因組測序。在所述方法的一些方面,分析所述第二核酸樣品中是否存在所述多個MEI邊界包括進(jìn)行對所述第二核酸樣品的多個MEI邊界進(jìn)行靶向測序。在所述方法的一些方面,對所述第二核酸樣品的多個MEI邊界進(jìn)行靶向測序包括使所述第二核酸樣品與引物組接觸,該引物組包含特異性擴(kuò)增所述第一核酸樣品的每個MEI插入位點的引物。在所述方法的一些方面,對所述第二核酸樣品的多個MEI邊界進(jìn)行靶向測序包括使所述第二核酸樣品與探針組接觸,該探針組包含與所述第一核酸樣品的每個MEI插入位點特異性退火的探針。在所述方法的一些方面,所述探針組包含至少一種與熒光團(tuán)結(jié)合的探針,使得與底物結(jié)合的探針相對于未與底物結(jié)合的探針可被差異性地可視化。在所述方法的一些方面,所述第二樣品包括法醫(yī)樣品。在所述方法的一些方面,所述第二樣品包括植物樣品。在所述方法的一些方面,所述植物樣品是植物作物樣品。在所述方法的一些方面,所述第二樣品包含生物危害性物質(zhì)。
一些實施方案涉及用于在延緩年齡相關(guān)的基因組退化中使用的組合物,該組合物包含可動因子插入抑制藥物。在所述組合物的一些方面,所述組合物包含逆轉(zhuǎn)錄酶抑制劑。在所述組合物的一些方面,所述組合物包含逆轉(zhuǎn)錄病毒抑制劑。
附圖說明
本發(fā)明的新穎特征在所附的權(quán)利要求書中具體闡述。通過參考以下對利用本發(fā)明原理的說明性實施方案加以闡述的詳細(xì)描述以及附圖,將會獲得對本發(fā)明的特征和優(yōu)點的更好的理解,在這些附圖中:
圖1示出了使用靶向測序來探測和/或檢測復(fù)雜變體。
圖2顯示了使用冗余度和標(biāo)簽來確認(rèn)和/或定量插入事件。
具體實施方式
可動因子插入(MEI)也被稱為轉(zhuǎn)座因子,其占人類基因組的三分之二。存在數(shù)百種由于古老MEI活性而進(jìn)化的人類基因。一些MEI在人類基因組中仍具有活性,包括現(xiàn)代Alu序列。神經(jīng)元細(xì)胞具有高M(jìn)EI活性,并且病毒MEI的效應(yīng)在全基因組范圍內(nèi)在癌癥中發(fā)揮作用。MEI隨機(jī)無偏倚地出現(xiàn)在基因組的蛋白質(zhì)編碼區(qū)和非編碼區(qū)二者中。MEI影響人類宿主轉(zhuǎn)錄和細(xì)胞活性,因此在破壞宿主基因的功能時是非常有害的。針對這些有害事件的種系傳遞會發(fā)生強陰性選擇。MEI與癌癥及其他遺傳病癥有關(guān),但體細(xì)胞MEI的規(guī)模和范圍尚未得到很好的研究或證明。新的DNA測序技術(shù)正在難以解釋該作用,因為,例如,樣品制備和分析方法缺乏對活性MEI在疾病中的作用進(jìn)行定量的必要靈敏度。由于有偏倚的擴(kuò)增,許多這樣的方法錯報了MEI的活性。用于準(zhǔn)確檢測MEI的方法需要能夠確定被體細(xì)胞MEI影響的關(guān)鍵基因并定量其隨疾病進(jìn)展的活性。用于檢測和定量關(guān)鍵基因功能破壞的一種非侵入性試驗是細(xì)胞健康的通用試驗,并且已經(jīng)涉及成年發(fā)作疾病的幾乎所有領(lǐng)域。
可動DNA因子是進(jìn)化和遺傳病的主要驅(qū)動力??蓜右蜃诱既祟惢蚪M的近三分之二。MEI的主要類型包括但不限于Alu、LINE、SVA、I型逆轉(zhuǎn)錄轉(zhuǎn)座子、ERV(內(nèi)源性逆轉(zhuǎn)錄病毒),并且它們被統(tǒng)稱為Mobilome。
下一代測序技術(shù)增加了我們對MEI在人類基因組中的普遍性的了解。Alu、SINE和SVA因子現(xiàn)今在人類基因組中具有活性。MEI的特定家族在其插入位點處具有共同的序列特征,由此允許產(chǎn)生合成寡核苷酸來探詢這些插入事件的診斷性序列。對遺傳的MEI的分析及其在1000個基因組計劃的可公開獲得的數(shù)據(jù)內(nèi)的群體頻率表明,在研究群體中發(fā)現(xiàn)的幾乎所有MEI都被認(rèn)為是罕見的并且以小于10%的頻率出現(xiàn)。大多數(shù)遺傳的MEI都不編碼蛋白質(zhì)編碼,表明MEI對基因功能具有高度破壞性,因此通過自然選擇而被去除。特別地,體細(xì)胞MEI是組織特異性的。例如,Alu和SVA MEI是常見的腫瘤特異性事件,特別是在上皮癌中,但不太可能在血液或腦癌中發(fā)現(xiàn)。這表明對MEI活性的環(huán)境效應(yīng)。應(yīng)激誘導(dǎo)的MEI活性的進(jìn)一步證據(jù)來自于許多轉(zhuǎn)座因子具有與熱休克TF結(jié)合位點相似的啟動子序列這一事實。ME的激活與甲基化的減少之間存在相關(guān)性,已經(jīng)提出這是MEI活性的控制機(jī)理。體細(xì)胞MEI活性在胚胎發(fā)生、腫瘤細(xì)胞系和神經(jīng)元祖細(xì)胞中是豐富的,但關(guān)于MEI在正常體細(xì)胞組織中的活性是鮮為人知的。
數(shù)十年來癌癥研究的一種主要材料(staple)——HeLa細(xì)胞系,具有在c-Myc基因上游的HPV插入位點,這可能是無限細(xì)胞分裂的原因。
MEI可以通過破壞開放閱讀框或通過在人類基因中提供選擇性剪接位點、備選的啟動子位點或備選的polyA信號來改變?nèi)说霓D(zhuǎn)錄。根據(jù)2001年的人類基因組草圖,許多人驚訝于人類基因組僅編碼約20,000個基因,特別是相比于>100,000種翻譯的蛋白質(zhì)?,F(xiàn)在認(rèn)為MEI通過引入新的剪接位點(例如,L1、Alu)而與此現(xiàn)象關(guān)聯(lián)。大多數(shù)Alu衍生的基因被選擇性地剪接,并且許多選擇性剪接是組織特異性的。大多數(shù)人類基因利用選擇性剪接位點,受到基因的備選末端的MEI加工的影響。例如,ATRN基因在內(nèi)含子中具有L1因子。選擇性剪接的基因編碼可溶形式的引蛋白(Attractin),這是炎癥應(yīng)答的一部分。該備選形式充當(dāng)色素沉著和能量代謝的受體。超過120種逆轉(zhuǎn)錄轉(zhuǎn)座子序列已進(jìn)化成功能性的人類基因。對于Alu、L1和SVA因子,估計的從頭種系MEI突變的比例分別為20個初生兒中1例到100個中1例到1000個中1例。DNA甲基化被證明是宿主防御機(jī)制,缺少甲基轉(zhuǎn)移酶的小鼠表現(xiàn)出高的染色體不穩(wěn)定性,最終變?yōu)闉?zāi)難性的。小RNA也是MEI活性和作用的調(diào)節(jié)機(jī)制。這些小RNA(包括piRNA和siRNA的類別)也是MEI衍生的。MEI對轉(zhuǎn)錄的影響可以通過選擇性剪接、備選的啟動子或備選的polyA位點而在單個基因座處。在整體水平上,轉(zhuǎn)錄網(wǎng)絡(luò)由MEI啟動子活性控制。胚胎干細(xì)胞顯示出基因網(wǎng)絡(luò)的連接。ES細(xì)胞顯示出內(nèi)源性逆轉(zhuǎn)錄病毒長串聯(lián)重復(fù)序列的網(wǎng)絡(luò),該內(nèi)源性逆轉(zhuǎn)錄病毒長串聯(lián)重復(fù)序列引發(fā)通過甲基化控制的基因表達(dá)的網(wǎng)絡(luò)。在多能性狀態(tài)下,ERV被甲基化阻抑。哺乳動物妊娠途徑通過MEI活性進(jìn)化。該基因網(wǎng)絡(luò)在孕酮應(yīng)答中被MER20因子激活。例如,催乳素啟動子來源于MER39可動因子。用于胎兒-母體交換的合胞素(Synctin)基因也來源于ERV基因。ERV的側(cè)翼為約300至約1200個核苷酸的LTR。對于更常見的因子,許多MEI的大小可以在例如約200bp至約10kb的范圍內(nèi)。
ME掃描可從人類基因組中最具活性的常見MEI——AluYb8/9因子中鑒定遺傳的MEI。然而該方法在本質(zhì)上不是定量的。當(dāng)研究比較非洲與歐洲人群時,這些Alu因子模擬SNP的多樣性特征。Alu拷貝在數(shù)量上遠(yuǎn)超過人類基因組中的編碼基因,并且據(jù)估計,由于在腫瘤和衰老細(xì)胞中發(fā)生MEI活性的脫阻抑,體細(xì)胞MEI事件在數(shù)量上遠(yuǎn)超過種系事件。這些因子的豐度和重復(fù)性質(zhì)對此時的全基因組研究造成了問題。測序深度越大,檢測MEI的靈敏度越高,但在文庫制備步驟期間,可能由于嵌合分子的產(chǎn)生而引起假陽性,并且由于在諸如PCR等過程中的偏倚,某些因子可能被過度表示。
盡管上述實例示出了遺傳的MEI的作用、其破壞性作用和陰性選擇,但對體細(xì)胞MEI的普遍性也有了更多的了解。MEI的鑲嵌性在神經(jīng)元細(xì)胞中是豐富的。神經(jīng)元具有水平升高的非整倍性和逆轉(zhuǎn)錄轉(zhuǎn)座,這可能有助于人腦中的功能多樣性。
有證據(jù)暗示,體細(xì)胞組織中MEI的活化對老化有影響。在正常老化過程中,體細(xì)胞MEI轉(zhuǎn)錄開始變得活化。這些因子的活化逆轉(zhuǎn)錄轉(zhuǎn)座在小鼠的晚期衰老中發(fā)生,這對應(yīng)于隨細(xì)胞年齡升高的基因組不穩(wěn)定性。MEI位置和豐度調(diào)節(jié)衰老的速率,并且缺乏維持復(fù)雜DNA結(jié)構(gòu)的能力導(dǎo)致組織的功能紊亂以及生物體的最終死亡。這些轉(zhuǎn)座事件可以被多種應(yīng)激相關(guān)因素如炎癥加速。在一些情況下,逆轉(zhuǎn)錄轉(zhuǎn)座通過逆轉(zhuǎn)錄酶的抑制如用于乙肝病毒(HBV)和人類免疫缺陷病毒(HIV)感染的藥物來介導(dǎo)。小鼠中自然發(fā)生的癌癥具有增加的MEI活性。
由于癌癥被認(rèn)為是基因組的疾病,因此癌癥是并且將很可能繼續(xù)是最流行的體細(xì)胞MEI研究領(lǐng)域??刹捎酶吒采w度全基因組測序(WGS)分析HBV整合事件的影響及其在肝細(xì)胞癌(HCC)中的作用。從技術(shù)角度來看,由于插入事件的數(shù)目與測序的深度成正比,因此測序深度增加會導(dǎo)致許多更加確定的體細(xì)胞插入事件。與來自相同個體的正常樣品相比,肝細(xì)胞癌(HCC)腫瘤中的克隆擴(kuò)充導(dǎo)致更高頻率的相同事件。平均來說,在腫瘤來源的DNA中,對于宿主人類基因組的每個拷貝均可發(fā)現(xiàn)病毒基因組的兩個拷貝。在插入位點附近發(fā)現(xiàn)了破壞性事件,包括直接的基因破壞、病毒啟動子驅(qū)動的人類基因轉(zhuǎn)錄、病毒-人類轉(zhuǎn)錄物融合以及DNA拷貝數(shù)變化。有證據(jù)支持插入事件的隨機(jī)模型,提示插入大多數(shù)是隨機(jī)的,其中可能僅有的影響是未束縛在染色質(zhì)中的DNA的可接近性。由于擴(kuò)增的偏倚,先前基于PCR的方法通常過高地估計了某些插入事件的普遍性。整合廣泛存在于整個腫瘤和正常肝組織中,但由于功能性影響限于腫瘤細(xì)胞的腫瘤抑制基因和癌基因在腫瘤中的插入事件存在不同模式,并且豐度是這些細(xì)胞的克隆擴(kuò)充的結(jié)果。插入“端”映射(map)至HBV基因組的不同區(qū)域,這可用于插入位點的檢測目的。例如,DR1和DR2位點是在HBV線性病毒的HBx基因的末端處發(fā)現(xiàn)的直接重復(fù)元件。隨機(jī)模型顯示,來自轉(zhuǎn)錄物的融合產(chǎn)物可映射至基因組中的任何位置,因此在插入點存在來自病毒的共同位點和來自人類基因組的無偏倚位點。
大多數(shù)HBV插入位點不是頻繁發(fā)生的,但經(jīng)歷克隆擴(kuò)充的腫瘤中的主要插入位點的豐度顯著升高。腫瘤中的大多數(shù)事件出現(xiàn)在蛋白質(zhì)編碼基因附近,提示未在染色質(zhì)中的暴露的DNA使其易于插入。腫瘤中的插入事件存在對于啟動子和外顯子的陽性選擇。在癌基因普查數(shù)據(jù)庫中,大多數(shù)插入可能似乎是中性的,不插入基因中。腫瘤中整合位點的數(shù)目可能與結(jié)果或其他醫(yī)療指標(biāo)如存活率對應(yīng)。例如,具有>3個插入事件的腫瘤可能對存活具有更大的負(fù)面影響。
可以使用來自各種癌癥類型的腫瘤的RNA-Seq數(shù)據(jù)來研究宿主/病毒融合,特別是已知的致癌病毒。例如,可將NGS RNA-Seq讀序映射至HPV、HBV、HCV、EBV和HHV的常見病毒株以觀察其對宮頸癌、肝癌和伯基特淋巴瘤的影響。使用從頭組裝,可以重新診斷具有新型HPV株的陰性宮頸癌腫瘤。PCR測定可能錯報HPV整合的豐度。不論涉及的腫瘤類型或組織如何,HPV陽性整合均可顯示出腫瘤聚類(clustering)。病毒MEI可通過病毒癌基因的表達(dá)或通過整合從而改變癌基因或腫瘤抑制基因的活性來引起細(xì)胞轉(zhuǎn)化。
為了MEI檢測的臨床應(yīng)用及其診斷意義,必須采用靶向策略。MEI是鑲嵌性的,由某種形式的環(huán)境因素如應(yīng)激誘導(dǎo)的MEI活性或病毒誘導(dǎo)的MEI活性引起。已證明,MEI對進(jìn)化有顯著的影響,并且當(dāng)其在基因組的功能區(qū)中被發(fā)現(xiàn)時具有非常有害的影響。SNP的遺傳模式模型以及對體細(xì)胞MEI的影響是一個剛剛開始被解開的謎。觀察插入位點以及定量其在所有組織類型(可能使用血液或血液中的無細(xì)胞DNA作為替代品)中的豐度的能力是用于確定細(xì)胞健康的有用工具。這些活躍可動的或侵入性的基因組因子的靶標(biāo)可用于診斷目的,以及通過小RNA、甲基化或甚至對逆轉(zhuǎn)錄酶抑制對特定個體的合理治療干預(yù)。了解這些因子對個體以及特別是個體疾病的影響將能夠提供新的治療和診斷選擇。例如,引起癌癥的MEI事件擾亂癌基因或腫瘤抑制基因。使用在活組織內(nèi)通過各種手段激活的熒光探針來靶向用于在手術(shù)中提取的那些細(xì)胞??缭娇蓜右蜃优c其擾亂的人類宿主基因序列的接合點、僅對特定接合事件具有結(jié)合效率的探針將為手術(shù)中的提取提供標(biāo)志物或信標(biāo)。
MEI的起源可能是非人類的,其隨時間進(jìn)化或通過病毒感染而引入。從病毒的角度來看,其主要目的是存活。由感染、炎癥、毒素如酒精、物理壓力、潰瘍等誘導(dǎo)的細(xì)胞應(yīng)激全都影響細(xì)胞的存活,因此使MEI活性增加。活性MEI的失調(diào)(Deregulation)可能只是偶然地發(fā)生。然后活性MEI使染色體重排或改變細(xì)胞轉(zhuǎn)錄。這些影響可能是溫和的或災(zāi)難性的。一個細(xì)胞變得脫阻抑,并最終克隆擴(kuò)充。被活性MEI破壞的基因決定擴(kuò)充的速率。如果細(xì)胞生長基因或調(diào)節(jié)基因被破壞,則其分裂速率上升,導(dǎo)致腫瘤生長。相反,非癌癥相關(guān)基因也可被擾亂,并且激活/滅活關(guān)鍵的細(xì)胞機(jī)制(例如,凋亡、壞死、增殖、細(xì)胞分裂)。例如,如果凋亡途徑被滅活,則細(xì)胞可能繼續(xù)分裂,增加在器官中的普遍性,并開始負(fù)面地影響器官功能。最終,這可導(dǎo)致功能喪失。被擾亂的基因以及插入事件的數(shù)目均可充當(dāng)細(xì)胞健康或疾病進(jìn)展的診斷性指標(biāo)。在一些情況下,這些細(xì)胞中的一些可能死亡,并且來自這些細(xì)胞的DNA將會以無細(xì)胞DNA的形式在血液中被發(fā)現(xiàn)。采用具有足以檢測這些罕見事件的靈敏度以及足以定量這些罕見事件的精確度的技術(shù)監(jiān)測這些無細(xì)胞分子的增加將是分子醫(yī)學(xué)的主要研究內(nèi)容。從早期基線開始的事件的數(shù)目以及其擾亂的基因都可以將全部人類器官的細(xì)胞功能分類并監(jiān)測個體在其一生中的細(xì)胞健康。這些診斷試驗可能導(dǎo)致受MEI擾亂影響的幾乎所有成人發(fā)作疾病和病癥的早期檢測和預(yù)防。大腦中體細(xì)胞活性的增加可導(dǎo)致癌癥、神經(jīng)變性病癥如阿爾茨海默病或帕金森病,或其他病癥如孤獨癥。MEI既含有遺傳的組分也含有體細(xì)胞活性。它們之間的關(guān)系可以解釋這些病癥中的許多病癥的遺傳力缺失以及應(yīng)激或環(huán)境誘導(dǎo)的這些因子的激活。這可能是這些復(fù)雜病癥的合理解釋。
MEI代表了我們DNA中僅有的真正個體基因組標(biāo)志物。對于攜帶幾乎相同DNA的雙胞胎,由于錯誤率,使用目前的測序儀無法檢測出絕對差異。相反,尋找MEI譜可以確定在兩個幾乎相同的基因組(例如,雙胞胎)之間的致病的基因組差異。此外,MEI的真正獨特的遺傳組成構(gòu)成僅有的真正獨特的法醫(yī)鑒定標(biāo)志物。最簡單的實例是密切相關(guān)的個體或雙胞胎的MEI。MEI與傳統(tǒng)SNP檢測或微衛(wèi)星標(biāo)志物相結(jié)合能夠確定地排除甚至最接近的基因組序列。
隨著產(chǎn)生的關(guān)于個人基因組的序列信息的量增加以及公開共享該信息的意愿增加,偽造基因組身份的能力必定成為現(xiàn)實。在一些情況下,對用于PCR分析的引物具有更好結(jié)合親和力的合成DNA序列從通過公共領(lǐng)域、研究領(lǐng)域或者甚至通過基因檢測公司的網(wǎng)絡(luò)安全性缺乏而獲得的個體序列數(shù)據(jù)生成。個體的血液中摻有這些高度有效的DNA序列不大可能對個體的健康造成影響,或者如果造成了影響,那些個體也可能愿意接受這種風(fēng)險。當(dāng)抽取血液用于DNA檢測時,這些更加有效的分子可能混淆或徹底掩蓋個體的身份或甚至將該樣品表示為另一個個體。MEI,特別是最近作為體細(xì)胞MEI有活性的那些MEI,將呈現(xiàn)一種完全獨特的鑒定策略,由于這些體細(xì)胞事件在基因組中的位置以及這樣的事件在復(fù)雜背景中的量,在一些情況下使用該策略作為基因組鑒定。
這些法醫(yī)目的還可在農(nóng)業(yè)中用于檢測GMO作物。來自GMO農(nóng)場的種子可輕易地傳播至相鄰的農(nóng)場。許多農(nóng)業(yè)公司檢測在相鄰農(nóng)場中的這些轉(zhuǎn)座的因子,以確定其不希望的知識產(chǎn)權(quán)轉(zhuǎn)移的程度。以極高靈敏度定量這些診斷標(biāo)志物的方法將允許檢測和定量已被其產(chǎn)物污染的生物體的百分比的能力。PCR方法以及其他偏倚策略不提供這一水平的靈敏度。
MEI也可對化妝品工業(yè)具有重大的影響。由于MEI激活與細(xì)胞老化有關(guān),因此其代表了一種用于研究和確定皺紋或脫發(fā)的原因的獨特方法。MEI可以是遺傳的、體細(xì)胞激活的或病毒誘導(dǎo)的。全都導(dǎo)致基因組及其功能的破壞。確定被擾亂的基因代表了用于降低或消除其活性的治療和美容干預(yù)的新目標(biāo)。監(jiān)測MEI活性的速率和水平可以是通過自然手段如卡路里限制或通過增加藥理干預(yù)劑量進(jìn)行干預(yù)的信號。
如本文公開的,從早期MEI活性基線開始的監(jiān)測細(xì)胞健康的試驗是針對所有個體的常見檢測選擇。
在本文的整個說明書中,為了便于理解,本公開內(nèi)容被分成多個部分。應(yīng)理解,這些劃分是為了方便理解,而并不一定限制說明書的一些部分相對于彼此的適用性。因此,說明書的任何一個部分中的公開內(nèi)容在一些情況下不僅與該部分有關(guān),而且與其他部分有關(guān),并且在一些情況下與作為整體的公開內(nèi)容有關(guān)。
用于體細(xì)胞MEI檢測和定量的方法
當(dāng)前用于MEI檢測的全基因組方法包括全基因組測序和生物信息學(xué)分析。MEI事件導(dǎo)致“分離讀序(split-reads)”,其中序列的一部分映射至人類參考基因組而另一部分未恰當(dāng)?shù)赜成?。配雙或配對端讀序提供了使用一個讀序的全部或一部分來錨定DNA分子的未映射或連接部分的位置的能力。大規(guī)模平行測序通過更多的采樣允許冗余的探詢和置信水平增加。然而,該增加的采樣導(dǎo)致成本急劇增加。更深的測序深度與MEI檢測的靈敏度成比例。全基因組測序(WGS)方法造成了成本增加以及不想要的數(shù)據(jù)和倫理考慮方面的問題,但在一些情況下具有無偏倚檢測整個樣品中的MEI插入位點的優(yōu)勢。在一些情況下,這些方法引入序列特異性擴(kuò)增偏倚,這將抑制定量一些MEI事件的能力,該能力對確定中性MEI與致病MEI之間的差異是關(guān)鍵的。
針對MEI的一些先前的靶向方法通常涉及半特異性PCR的變化形式。如先前討論的,由于序列特異性偏倚,這些方法在一些情況下不是定量的,由于序列擴(kuò)增效率而極大地過度呈現(xiàn)一些MEI位置相對于其他位置的量。無法確定體細(xì)胞MEI事件是否為中性的,因此無法確定該事件是否是隨機(jī)呈現(xiàn)的,或者無法確定其是否已在諸如癌癥中克隆擴(kuò)充。此外,對于MEI的插入端,基因座特異性引物的設(shè)計的靈活性有限。如果序列發(fā)生突變或差異足以導(dǎo)致不發(fā)生擴(kuò)增或?qū)е虏荒敲从行У臄U(kuò)增,則對該特異性事件的量進(jìn)行定量是不可能的。因此在使用這些方法時必須小心,以確保序列結(jié)果定量地反映原始核酸樣品中的模板量。
由于MEI的插入端通常是重復(fù)或改變的,因此一些適當(dāng)?shù)陌邢蝮w細(xì)胞MEI檢測方法能夠提供冗余度?;钚泽w細(xì)胞MEI是現(xiàn)代的,與古老的無活性MEI相比不大可能被截短,但就診斷性序列而言,活性體細(xì)胞MEI可以是突變或最小化的。因此,針對MEI的插入端,如TSR或在HBV的情況下在Hbx基因附近的DR 1/2診斷區(qū)域,設(shè)計了多個冗余的基因座特異性引物。這些多個不同的起始點還允許MEI的確認(rèn),因為MEI事件的多次獨立采樣允許事件的內(nèi)部確認(rèn)以及更高的靈敏度和特異性。此外,應(yīng)該對NGS文庫分子產(chǎn)生天然標(biāo)簽或替代的3'端。由于NGS文庫分子的替代3'端引起的冗余引物位點與天然標(biāo)簽的組合顯示了DNA模板的獨立采樣,從而保證了任何局部性的插入事件均可通過在擴(kuò)增步驟期間去除克隆矯作物(artifact)而得到確認(rèn)和定量。此外,這樣的方法需要在制備過程中避免片段化和連接,因為嵌合分子可在這些制備步驟中產(chǎn)生并導(dǎo)致假陽性。
本文設(shè)想了其他定量方法,并且本文公開的與MEI位點有關(guān)的方法不受任一種定量方法的限制。各種方法在本文中均作為替代方案呈現(xiàn),突出了其各自呈現(xiàn)的挑戰(zhàn)和優(yōu)勢,以及為了使每種方法均適用于本文公開的方法而將要采取的防范措施。
本文公開內(nèi)容的各個實施方案包括一個或多個MEI事件相對于其插入相鄰的基因組序列的定量。定量通過多種方法實現(xiàn)。MEI,有時被稱為MEI及其插入相鄰的基因組序列,最初通過非靶向方法中的全基因組測序,或通過特異性或半特異性PCR或本領(lǐng)域已知的其他方法來鑒定。在一些實施方案中,使用了TAIL-PCR或本領(lǐng)域中已知用于確定插入相鄰序列的其他方法。在許多實施方案中,對于映射至插入相鄰邊界的初始MEI,全基因組測序或其他非靶向方法是優(yōu)選的。在后續(xù)測定中,在一些實施方案中使用了全基因組方法,而針對特異性MEI和插入相鄰序列的靶向測定在備選的后續(xù)測定中使用或與全基因組測定組合使用。
核酸樣品中MEI插入相鄰序列接合點的豐度的定量通過多種備選或協(xié)調(diào)的方法實現(xiàn)。通過將跨越給定MEI及其插入相鄰序列的讀序的數(shù)目或獨特讀序的數(shù)目或獨立衍生的讀序的數(shù)目與以下任一項或多項進(jìn)行比較來定量特異性MEI插入邊界:樣品中核酸的量;映射至核酸樣品中的已知單拷貝序列的讀序的數(shù)目或獨特讀序的數(shù)目或獨立衍生的讀序的數(shù)目,映射至單獨MEI及其插入相鄰序列的讀序的數(shù)目或獨特讀序的數(shù)目或獨立衍生的讀序的數(shù)目;或在不同時間點映射至相同MEI及其插入相鄰序列的讀序的數(shù)目或獨特讀序的數(shù)目或獨立衍生的讀序的數(shù)目。在一些情況下,通過相對于輸入核酸的總量測量跨越其插入位點的獨立讀序的數(shù)目來定量特異性MEI插入位點。在一些情況下,通過相對于映射至核酸樣品的已知獨特基因座的獨立讀序的數(shù)目測量跨越其插入位點的獨立讀序的數(shù)目來定量特異性MEI插入位點。在一些情況下,通過相對于映射至已知拷貝數(shù)的多拷貝基因座的獨立讀序的數(shù)目測量跨越其插入位點的獨立讀序的數(shù)目來定量特異性MEI插入位點。在一些情況下,通過相對于來自第二時間點的樣品的跨越其插入位點的獨立讀序的數(shù)目測量來自第一時間點的樣品的跨越其插入位點的獨立讀序的數(shù)目來定量特異性MEI插入位點。組合地或作為替代方案考慮備選的定量方法,如通過與具有可定量的熒光水平的熒光探針雜交而定量。
圖2呈現(xiàn)了用于MEI插入位點定量的多個獨立讀序的實例。每個讀序均包含MEI和插入相鄰序列,并且每個讀序均具有5’端、3’端和插入長度的獨特組合。因此,每個讀序均可被鑒定,并且是MEI和插入相鄰序列而不是克隆擴(kuò)增的PCR產(chǎn)物的獨立表示。
設(shè)計
每個MEI家族均在MEI的插入端具有相似的序列。例如,在Alus中,重復(fù)序列的側(cè)翼可以有7bp診斷性序列。末端的長度可以變化,并且/或者可具有一些重復(fù)序列。在Alu序列中,還可以有polyA序列的延伸??梢圆糠值匕邢騪olyA序列。還可以靶向具有序列同源性的直接重復(fù)區(qū),如DR1和DR2。使用更長的讀取長度(例如,MiSeq 2x350讀序)、用于配對末端測序的更長插入片段(例如,500bp插入片段)以及由于ddNTP摻入引起的可控的片段長度,可為可動因子的DR1和DR2區(qū)的每條鏈設(shè)計多種引物。例如,為了靶向可動因子(例如,Alus、LINE、SVA、病毒MEI等)的每個末端處的1kb區(qū)域,可設(shè)計多個非重疊引物,以從最末端(接近末端重復(fù)序列)跨越通過更加復(fù)雜的序列,從而提供更高的特異性。在一些情況下,對于MEI的每個側(cè)翼元件,可以使用至少約三種引物。與PCR不同,由于使用鏈置換聚合酶的線性引物延伸,多個引發(fā)位點將不會互相干擾。因子的每個家族均可具有足夠的序列差異,以通過生成的合成序列經(jīng)由測序立即鑒定因子類型??设b定每個因子家族內(nèi)的多種引物,并將其分箱(bin)在一起以供自組裝。在一些情況下,讀序可以以足夠的確定性進(jìn)行映射,以確定是否存在關(guān)鍵基因的中斷。然后可通過簡單地比較從嵌合分子產(chǎn)生的非MEI序列,使用相同MEI的多種引物作為相同MEI破壞事件的獨立確認(rèn)。隨著多個引發(fā)事件(例如,每個MEI約3個至約10個),每一種引物將從基因組的多個拷貝產(chǎn)生相同事件的多個拷貝。天然標(biāo)簽和3'合成標(biāo)簽可用來確定模板的獨立采樣,并進(jìn)一步確認(rèn)該事件。有趣的是,相同的方法可用來確定事件的相對年齡。更加古老的MEI事件傾向于在MEI序列自身內(nèi)具有截短的末端或突變,并且這些事件因為缺乏剪切和粘貼或拷貝和粘貼活性所需的插入序列而通常被顯示為無活性的。
本公開內(nèi)容還提供了用于檢測遺傳疾病中的MEI的方法。在全長MEI的存在下,可使用其他的數(shù)據(jù)來源進(jìn)一步確定MEI是否是體細(xì)胞的或是否仍然具有活性。通常,截短事件可以表明無活性的MEI,該MEI可能是遺傳的并且可能在大部分分子中找到。另一方面,在較小百分比的分子中發(fā)現(xiàn)新的體細(xì)胞MEI活性(可以是細(xì)胞老化的指示),這是需要極深的序列深度的原因。通過反算,體細(xì)胞活性的比率為25次細(xì)胞分裂中接近約一次。在雜合的群體中,這相當(dāng)于來自給定組織或活檢物的50個DNA分子中約一個。對于50分之一的事件,在每個個體事件三個讀序的情況下,需要150x的測序深度。鑒于潛在的高異質(zhì)性和其中許多是單例(singleton)事件的事實,可能需要提供平均至少1000倍的覆蓋來分析腫瘤,并且相比于分析古老MEI如Alus的內(nèi)源活性的覆蓋或許甚至更高(例如,約1百萬倍的覆蓋)。
其他的數(shù)據(jù)來源來自其擾亂的一個或多個基因,并且如果事件是克隆擴(kuò)增的,其還來自事件的數(shù)目。例如,病毒如HPV或HBV將會自身隨機(jī)地插入到基因組的許多區(qū)域。這是導(dǎo)致每個個體事件中同等水平的標(biāo)準(zhǔn)化覆蓋的隨機(jī)事件。如果該事件命中細(xì)胞生長基因(例如,癌基因或腫瘤抑制基因),則可以觀察到那些細(xì)胞類型的克隆擴(kuò)充。因此與背景單例(singleton)或雙例(doubleton)體細(xì)胞事件的數(shù)目相比,特定MEI事件的數(shù)目充當(dāng)疾病診斷的指示。對于單細(xì)胞工作,如已經(jīng)在腫瘤中顯示的,相同細(xì)胞中的多個事件可以是結(jié)果的指示。由于每個腫瘤可具有受感染的但非腫瘤的細(xì)胞的集合,因此甚至觀察異質(zhì)腫瘤也可以提供另一水平的數(shù)據(jù)。背景事件與引起腫瘤的事件的比例可通過對每個事件中的測序深度覆蓋取平均值來計算。例如,3倍或更大的增加將是引起腫瘤的事件相對于良性事件的截止值。這可用作治療期間血液中特定腫瘤的監(jiān)測目標(biāo),或用于確定疾病進(jìn)展,或作為探針(跨越該事件)用于在手術(shù)期間提取以保證腫瘤的去除是完全的。例如,在肝細(xì)胞中HBV感染的情況下,可利用針對HBV序列的特異性引物,使用靶向接近線性病毒中Hbx基因的DR1或DR2區(qū)的插入末端的3種不同引物來鑒定所有讀序。通過計算來自三種引物(其從基因組中的給定位置產(chǎn)生數(shù)據(jù))中的每一種的平均覆蓋深度,并將給定事件的平均深度與其他隨機(jī)插入事件的平均深度進(jìn)行比較,可將更高平均覆蓋的事件突出顯示為可導(dǎo)致克隆擴(kuò)充的主要插入位點。在一些實例中,給定事件的平均深度可以是其他隨機(jī)插入事件的平均深度的超過約1.2倍、約1.4倍、約1.6倍、約1.8倍、約2倍、約3倍、約4倍、約5倍、約10倍、約20倍、約50倍或約100倍??墒褂萌N不同引物從更加有效的序列(例如,較低GC含量的區(qū)域)中去除擴(kuò)增矯作物??墒褂锰烊缓碗S機(jī)合成的標(biāo)簽去除任一事件的克隆擴(kuò)增。總的來說,可以存在多種用于確認(rèn)和定量每個事件的信息來源。
本公開內(nèi)容可提供一種包含分子文庫的組合物,其中每個分子均代表MEI事件。該文庫可以為多重(multiplex)的形式。
本公開內(nèi)容可進(jìn)一步提供一種用于測試所有已知致癌病毒和/或在種系中傳代的所有已知活性ALU及MEI的方法。該方法可用于諸如癌基因破壞、細(xì)胞老化、每個組織特異性MEI事件中關(guān)鍵基因的破壞(例如,老化大腦中的阿爾茨海默癥)和/或針對細(xì)胞健康和老化的測試等應(yīng)用。
本公開內(nèi)容提供了一種從已知插入位點序列生成基因組中的未知序列的方法。可使用該未知序列確定基因的破壞??墒褂脕碜宰x序的合成引物序列確定經(jīng)測序的MEI類型,可使用基因組序列鑒定被破壞的基因,并且可使用天然和合成的標(biāo)簽確定每個事件的定量數(shù)量。因此,事件的位置和豐度以及總活性(事件的總數(shù))均可在成年發(fā)作的疾病和細(xì)胞健康中具有診斷或預(yù)后意義。
針對插入?yún)^(qū)域的引物設(shè)計出現(xiàn)在MEI的5'或3'插入位點處的已知診斷性序列中。通過分解成20、50、100個堿基對的窗口,考慮TM、簡并位置和重復(fù)位置,設(shè)計了獨特或有些獨特的引物序列。由于設(shè)計了從插入端開始的多種引物,因此引物設(shè)計是冗余的。開發(fā)、合成并以等摩爾比合并了針對所有已知MEI病毒性和內(nèi)源性MEI序列設(shè)計的單引物文庫。
引物在與所使用的測序平臺的銜接子互補物(compliment)對應(yīng)的5'端包含分子“尾”。在一些情況下,為了樣品多重化在合成步驟中包含任選的分子條形碼。
引物延伸通過在均勻溫度下使用鏈置換聚合酶或通過使用熱穩(wěn)定聚合酶以及使引物延伸反應(yīng)循環(huán)而發(fā)生。該聚合酶必須具有在摻入修飾的堿基或具有缺少羥基的末端3'端的堿基的同時進(jìn)行延伸的能力。
在反應(yīng)混合物中使用天然dNTP和生物素化的ddNTP的組合。ddNTP與天然dNTP之比決定了延伸分子的片段長度。例如,使用1%比例的ddNTP將產(chǎn)生1/100的在任何給定堿基處摻入終止分子的幾率。通常的結(jié)果顯示,1%的ddNTP比例產(chǎn)生約500bp的片段峰。這可能是因為天然NTP相對于改變的NTP的摻入效率差異。
所得到的分子是嵌合體,其由在5'端的合成序列和在3'端的來源于患者的序列組成。該分子以終止的、生物素化的核苷酸結(jié)束。
通過使用親和反應(yīng),從基因組背景中純化所述分子。該步驟使用鏈霉親和素涂覆的磁珠。珠子上的每個鏈霉親和素分子結(jié)合四個生物素化的分子,而剩余的ddNTP、dNTP和未使用的引物被去除。
使用隨機(jī)引物進(jìn)行第二引物延伸反應(yīng),該隨機(jī)引物由在3'端的8個核苷酸和與測序儀平臺對應(yīng)的B-銜接子互補物組成。隨機(jī)引發(fā)在整個分子上發(fā)生,但通過使用鏈置換聚合酶,只有最遠(yuǎn)端的隨機(jī)引物及其延伸產(chǎn)物將保持與鏈霉親和素珠子氫鍵結(jié)合。來自B反應(yīng)的拷貝分子將一直運行通過前一條鏈上的A引物,并產(chǎn)生具有5'B銜接子、8bp合成隨機(jī)序列、MEI插入的人類宿主基因組序列位點、MEI基因座特異性引物的合成序列以及在3端的A銜接子互補物的單鏈分子。如果需要樣品多重化,則使這些分子從鏈霉親和素結(jié)合的分子上變性并PCR擴(kuò)增以摻入全長測序儀銜接子和任選的外部條形碼。
這種嵌合讀序結(jié)構(gòu)及其特征在數(shù)據(jù)分析中具有許多優(yōu)勢。使用引物的合成基因座特異性序列來確定在讀序中靶向哪個MEI。對于相同MEI種類導(dǎo)致不同延伸起始點的冗余引物位點可用作插入事件的內(nèi)部確認(rèn)。這也避免了因基因座特異性引物不太有效或設(shè)計不當(dāng)而退出(drop out)。該基因座特異性引物可用于所有已知的MEI,包括Alus、LINE以及病毒MEI。將在單個文庫中設(shè)計已知病毒的全譜,多種病毒在相同樣品中的可能性較低。有可能許多病毒引物在任何給定的樣品中將不產(chǎn)生數(shù)據(jù)。
3'片段化和改變的3'序列充當(dāng)內(nèi)部分子標(biāo)簽或天然條形碼。如果兩個讀序具有不同的天然標(biāo)簽(3'序列),則它們肯定是模板DNA的獨立讀出,而非克隆錯誤。
來自B銜接子反應(yīng)的合成序列的隨機(jī)8bp也可充當(dāng)隨機(jī)標(biāo)簽??梢越M合使用隨機(jī)3'序列與來自隨機(jī)8-mer的隨機(jī)標(biāo)簽的組合,以進(jìn)一步保證讀序是獨立的而非克隆擴(kuò)增的。
在數(shù)據(jù)分析過程中,首先對來自給定MEI的讀序修剪去(trim of)銜接子序列。如果測序儀運行含有多重化的條形碼化樣品,則鑒定分子條形碼。鑒定與合成基因座特異性引物對應(yīng)的前5-25個堿基以確定被靶向的MEI事件。然后從讀序中修剪這些堿基以供映射和組裝。將剩余的序列相對于人類參考基因組映射并跨越重疊讀序進(jìn)行組裝,以提供人類基因組中的插入位置的證據(jù)。重復(fù)讀序基于其3'端和隨機(jī)標(biāo)簽而被去除。對于配對端讀序,如果未單獨地映射,則使用減小的插入大小募集第二個讀序,以針對插入位點提供重疊讀序。通過使用MiSeq系統(tǒng),采用300bp的插入大小(優(yōu)先于ILMN聚類產(chǎn)生),生成了約400-500bp的累積序列以供位置映射。在去除全部克隆讀序后,對每個位置定量事件的位置和數(shù)目。
因此,本文公開了與可動因子插入(MEI)插入位點序列和可動因子活性有關(guān)的方法、組合物及使用方法,例如其涉及人類健康??蓪⑷祟惪蓜右蜃臃诸悶镈NA轉(zhuǎn)座子或逆轉(zhuǎn)錄轉(zhuǎn)座子。DNA轉(zhuǎn)座子通過剪切-粘貼機(jī)制移動。逆轉(zhuǎn)錄轉(zhuǎn)座子通過經(jīng)由RNA中間體的拷貝-粘貼機(jī)制(被稱為逆轉(zhuǎn)錄轉(zhuǎn)座的過程)調(diào)動。
與人類疾病有關(guān)的可動因子是本領(lǐng)域已知的。示例性的可動因子包括但不限于L1、Alu、SINE-R/VNTR/Alu(SVA)、經(jīng)加工的假基因和人類內(nèi)源性逆轉(zhuǎn)錄病毒(HERV)。位于蛋白質(zhì)編碼基因座的5’側(cè)的逆轉(zhuǎn)錄轉(zhuǎn)座子常常充當(dāng)備選啟動子。例如,如通過帽分析基因表達(dá)和焦磷酸測序所評價的,位于基因的3’UTR(非翻譯區(qū))中的逆轉(zhuǎn)錄轉(zhuǎn)座子顯示出降低相應(yīng)基因表達(dá)的有力證據(jù)。已知逆轉(zhuǎn)錄轉(zhuǎn)座子的低甲基化影響該逆轉(zhuǎn)錄轉(zhuǎn)座子自身或附近基因的轉(zhuǎn)錄。例如,已知與MET(肝細(xì)胞生長因子受體)癌基因相關(guān)的L1中啟動子的增加的甲基化誘導(dǎo)攜帶腫瘤的膀胱的尿路上皮內(nèi)的備選MEI轉(zhuǎn)錄物。
類似地,由于其對人類基因組序列的影響,本文設(shè)想多種構(gòu)成‘可動因子’的人類逆轉(zhuǎn)錄病毒。多種人類逆轉(zhuǎn)錄病毒是本領(lǐng)域已知的。已知逆轉(zhuǎn)錄病毒以兩種形式存在:作為其染色體DNA中的正常遺傳元件(內(nèi)源性逆轉(zhuǎn)錄病毒)和作為從人到人傳播的水平傳播傳染性含RNA病毒(外源性逆轉(zhuǎn)錄病毒,例如HIV和人T細(xì)胞白血病病毒HTLV)。已知由于人類逆轉(zhuǎn)錄病毒插入導(dǎo)致的DNA異常變化與疾病的發(fā)作有關(guān)。插入到人DNA中的示例性人類逆轉(zhuǎn)錄病毒包括但不限于HIV1、HIV2、HTLV1、HTLV2和HSRV。
本文公開了鑒定可動因子插入(MEI)標(biāo)記的細(xì)胞增殖的方法。在一些情況下,這些方法包括以下步驟:定量測量第一核酸樣品中第一MEI插入位點處的MEI水平;定量測量第二核酸樣品中第一MEI插入位點處的MEI水平;以及如果第一核酸樣品中第一MEI插入位點處的MEI水平與第二核酸樣品中第一MEI插入位點處的MEI水平顯著不同,則將所述第一MEI插入位點鑒定為標(biāo)記MEI標(biāo)記的細(xì)胞增殖。
在一些情況下對樣品的核酸量進(jìn)行歸一化,而在備選的情況下,通過例如測量已知在健康個體中將在每個單倍體基因組以單拷貝存在的一種或多種核酸的水平來對核酸量進(jìn)行歸一化。在一些情況下,當(dāng)樣品的核酸豐度或核酸相對豐度或歸一化的核酸豐度相差5%、10%、15%、20%、25%、30%、35%、40%、45%、50%或大于50%時發(fā)生‘顯著不同’。在一些情況下,‘顯著不同’是指相差5%。在一些情況下,‘顯著不同’是指相差10%。在一些情況下,‘顯著不同’是指相差15%。在一些情況下,‘顯著不同’是指相差20%。在一些情況下,‘顯著不同’是指相差25%。在一些情況下,‘顯著不同’是指相差30%。在一些情況下,‘顯著不同’是指相差35%。在一些情況下,‘顯著不同’是指相差40%。在一些情況下,‘顯著不同’是指相差45%。在一些情況下,‘顯著不同’是指相差50%。在一些情況下,‘顯著不同’是指相差大于50%。
在一些情況下確定了與MEI插入位點相鄰的序列。在一些情況下使用與MEI插入位點相鄰的序列來選擇治療,例如,如果相對于其他MEI或在一個時間點相對于之前的時間點,該MEI插入與過度增殖有關(guān)。
例如,如果MEI相鄰序列與已知癌基因?qū)?yīng),則選擇與應(yīng)對與該癌基因相關(guān)的癌癥相關(guān)的治療,施用于在時間上或空間上表現(xiàn)出該MEI的過度增殖的個體。
多種與癌癥發(fā)作有關(guān)的基因是本領(lǐng)域已知的。這些基因有不同名稱,包括但不限于,癌癥驅(qū)動基因(driver)、癌基因、腫瘤抑制基因和腫瘤易感基因。已知這些基因的異常DNA變化有助于癌癥進(jìn)展。變化時與驅(qū)動癌癥有關(guān)的示例性基因包括但不限于abl1、acvr1b、af4/hrx、akt1、akt-2、alk、alk/npm、aml1、aml1/mtg8、apc、ar、arid1a、arid1b、arid2、asxl1、atm、atrx、axin1、axl、b2m、bap1、bcl2、blc-3、bcl-6、bcor、bcr/abl、braf、brca1、brca2、card11、casp8、c-myc、cbl、cdc73、cdh1、cdkn2a、cebpa、cic、crebbp、crlf2、csf1r、ctnnb1、cyld、daxx、dbl、del/can、dnmt1、dnmt3a、e2a/pbx1、egfr、enl/hrx、ep300、erbB、erbB-2、erg/TLS、ets-1、ews/fli-、ezh2、fam123b、fbxw7、fgfr2、fgfr3、flt3、fms、fos、foxl2、fps、fubp1、gata1、gata2、gata3、gli、gna11、gnaq、gnas、gsp、her2/neu、h3f3a、hist1h3b、hnf1a、hras、hox11、hst、idh1、idh2、il-2、int-2、jak1、jak2、jak3、jun、kit、ks3、K-sam、kdm5c、kdm6a、kit、klf4、kras、lbc、lck、lmo1、lmo2、l-myc、lyl-1、lyt-10C alpha-1、mas、mdm-2、mos、map2k1、map3k1、med12、men1、met、mlh1、mll2、mll3、mpl、msh2、msh6、myd88、myb、myh11/cbfb、ncor1、neu、n-myc、nf1、nf2、nfe2l2、notch1、notch2、npm1、nras、ost、pax5、pbx1/e2a、pbrm1、pdgfra、phf6、pik3ca、pik3r1、pim-1、prad-1、ppp2r1a、prdm1、ptch1、pten、ptpn11、raf、rar/pml、rasH、rasN、rb1、rel/nrg、ret、rhom1、rehom2、ros、rnf43、runx1、ski、sis、set/can、srcret、setd2、setbp1、sf3b1、smad2、smad4、smarca4、smarcb1、smo、socs1、sox9、spop、srsf2、stag2、stk11、tal1、tal2、tan-1、tiam1、tsc2、trk、tet2、tnfaip3、traf7、tp53、tsc1、tshr、u2af1、vhl和wt1。例如,映射至該列表中的基因的MEI插入相鄰序列在一些情況下提示,將選擇與所述基因或與所述基因的基因產(chǎn)物參與的信號途徑有關(guān)的治療以并入治療方案中。
類似地,多種基因組重排被鑒定為與癌癥有關(guān)。本領(lǐng)域已知,癌癥中的基因重排主要由DNA雙鏈斷裂(DSB)引起。導(dǎo)致基因重排的示例性機(jī)制包括但不限于合成依賴性末端連接(SDEJ)、通過斷裂-融合-橋循環(huán)的姐妹染色單體融合導(dǎo)致的基因擴(kuò)增、V(D)J重組活化(RAG)蛋白介導(dǎo)的易位以及活化誘導(dǎo)的胞苷脫氨酶(AID)類別轉(zhuǎn)換重組。
示例性的基因重排包括但不限于ACSL3/ETV1、ACTB/GLI1、AFF3/BCL2、AGTRAP/BRAF、AHRR/NCOA2、AKAP9/BRAF、ALK/PTPN3、ANKRD28/NUP98、ARHGAP6/PRCC、ASPSCR1/TFE3、ATIC/ALK、BACH2/BCL2L1、BCL11B/TCR、BCL2/Ig、BCOR/RARA、BCR/ABL1、BCR/FGFR1、BCR/JAK2、BCR/PDGFRA、BIRC3/MALT1、BRD3/C15orf55、BRWD3/ARHGAP2、BRWD3/ARHGAP20、C11orf95/MKL2、C15orf21/ETV1、C15orf55/BRD4、C6orf204/PDGFRB、CACNA2D4/WDR43、CANT1/ETV4、CAPRIN1/PDGFRB、CARS/ALK、CBFB/MYH11、CCDC6/PDGFRB、CCDC6/RET、CCDC88C/PDGFRB、CCND1/FSTL3、CD44/SLC1A2、CD74/ROS1、CDH11/USP6、CDK5RAP2/PDGFRA、CDK6/MLL、CEP110/FGFR1、CHCHD7/PLAG1、CHIC2/ETV6、CIC/DUX4、CLTC/ALK、CLTC/TFE3、CNBP/USP6、CNTRL/KIT、COL1A1/PDGFB、COL1A1/USP6、COL1A2/PLAG1、COL6A3/CSF1、CREB3L2/PPARG、CRTC1/MAML2、DGKB/MIPOL1、EML1/ABL1、EML4/ALK、EPC1/PHF1、ERC1/PDGFRB、ESRP1/RAF1、ETV6/ABL1、ETV6/ABL2、ETV6/ACSL6、ETV6/ARNT、ETV6/BAZ2A、ETV6/CDX2、ETV6/FGFR3、ETV6/FLT3、ETV6/GOT1、ETV6/ITPR2、ETV6/JAK2、ETV6/LYN、ETV6/MDS2、ETV6/MECOM、ETV6/NKAIN2、ETV6/NTRK3、ETV6/PDGFRA、ETV6/PDGFRB、ETV6/PER1、ETV6/PRDM16、ETV6/RUNX1、ETV6/SYK,EWSR1/ATF1、EWSR1/CREB1、EWSR1/DDIT3、EWSR1/ERG、EWSR1/ETV1、EWSR1/ETV4、EWSR1/FEV、EWSR1/FLI1、EWSR1/NFATC2、EWSR1/NR4A3、EWSR1/PATZ1、EWSR1/PBX1、EWSR1/POU5F1、EWSR1/SMARCA5、EWSR1/SP3、EWSR1/WT1、EWSR1/ZNF444、EXOC2/IGH、FCHSD1/BRAF、FGFR1OP/FGFR1、FGFR1OP/FGFR1、FGFR1OP2/FGFR1、FIP1L1/PDGFRA、FIP1L1/RARA、FOXO1/PAX3、FOXP1/ABL1、FUS/ATF1、FUS/CREB3L1、FUS/CREB3L2、FUS/DDIT3、FUS/ERG、FUS/FEV、FZD6/SDC2、GAPDH/BCL6、GIT2/PDGFRB、GOLGA4/PDGFRB、GOLGA5/RET、GOPC/ROS1、HAS2/PLAG1、HELIOS/BCL11B、ERVK-17/ETV1、HIP1/PDGFRB、HIST1H4I/BCL6、HMGA1/LAMA4、HMGA2/CCNB1IP1、HMGA2/COG5、HMGA2/COX6C、HMGA2/FHIT、HMGA2/LPP、HMGA2/NFIB、HMGA2/RAD51L1、HMGA2/WIF1、HMGN2P46/ETV1、HNRNPA2B1/ETV1、HOOK3/RET、HPR/MRPS10、HSP90AA1/BCL6、HSP90AB1/BCL6、IKZF1/BCL6、IL2/DEXI、IL2/TNFRSF17、IL21R/BCL6、INPP5D/ABL1、ITK/SYK、Ig/BCL11B、Ig/BCL3、Ig/BCL6、Ig/BCL7A、Ig/CCND1、Ig/CCND3、Ig/CDKN2A、Ig/FCGR2B、Ig/FCRL4、Ig/FOXP1、Ig/IL3、Ig/KDSR、Ig/LHX4、Ig/LHX4、Ig/MUC1、Ig/MYC、Ig/PAFAH1B2、Ig/WHSC1、Ig/WWOX、JAZF1/PHF1、JAZF1/SUZ12、KIAA1549/BRAF、KIF5B/ALK、KIF5B/PDGFRA、KIF5B/RET、KLK2/ETV4、KTN1/RET、LCK/TCR、LCP1/BCL6、LEO1/SLC12A1、LIFR/PLAG1、LRRFIP1/FGFR1、LYL1/TCR、MALAT1/ACAT2、MALAT1/TFEB、MALT1/MAP4、MEF2D/DAZAP1、MIR142/MYC、MLL/ABI1、MLL/ABI2、MLL/ACACA、MLL/AFF1、MLL/AFF3、MLL/AFF4、MLL/ARHGAP26、MLL/ARHGEF12、MLL/CASC5、MLL/CASP8AP2、MLL/CBL、MLL/CREBBP、MLL/DAB2IP、MLL/EEFSEC、MLL/ELL、MLL/EP300、MLL/EPS15、MLL/FLNA、MLL/FOXO3、MLL/GAS7、MLL/GMPS、MLL/GPHN、MLL/KIAA0284、MLL/KIAA1524、MLL/LASP1、MLL/LPP、MLL/MAML2、MLL/MAPRE1、MLL/MLLT1、MLL/MLLT10、MLL/MLLT11、MLL/MLLT3、MLL/MLLT4、MLL/MLLT6、MLL/MYO1F、MLL/NCKIPSD、MLL/NEBL、MLL/PICALM、MLL/PDS5A、MLL/SACM1L、MLL/SEPT11、MLL/SEPT2、MLL/SEPT5、MLL/SEPT6、MLL/SEPT9、MLL/SH3GL1、MLL/SORBS2、MLL/TET1、MLL/ZFYVE19、MN1/ETV6、MSI2/HOXA9、MSN/ALK、MYB/GATA1、MYB/NFIB、MYC/Ig、MYC/ZBTB5、MYH9/ALK、MYO18A/FGFR1、MYST3/ASXL2、MYST3/CREBBP、MYST3/NCOA2、MYST3/NCOA3、MYST4/CREBBP、NAV2/TCF7L1、NCOA4/RET、NDE1/PDGFRB、NDRG1/ERG、NDRG1/ERG、NFKB2/INA、NFKB2/TBXAS1、NIN/PDGFRB、NONO/TFE3、NOTCH1/TCR、NPM1/ALK、NPM1/MLF1、NPM1/RARA、NSD1/ANKRD28、NUMA1/RARA、NUP214/ABL1、NUP214/DEK、NUP98/ADD3、NUP98/CCDC28A、NUP98/DDX10、NUP98/HHEX、NUP98/HMGB3、NUP98/HOXA11、NUP98/HOXA13、NUP98/HOXA9、NUP98/HOXC11、NUP98/HOXC13、NUP98/HOXD11、NUP98/HOXD13、NUP98/IQCG、NUP98/KDM5A、NUP98/LNP1、NUP98/MLL、NUP98/NSD1、NUP98/PRRX1、NUP98/PRRX2、NUP98/PSIP1、NUP98/RAP1GDS1、NUP98/SETBP1、NUP98/TOP1、NUP98/WHSC1L1、OMD/USP6、P2RY8/CRLF2、PAX3/NCOA1、PAX3/NCOA2、PAX5/AUTS2、PAX5/BRD1、PAX5/C20orf112、PAX5/DACH1、PAX5/ELN、PAX5/ETV6、PAX5/FOXP1、PAX5/HIPK1、PAX5/JAK2、PAX5/PML、PAX5/POM121、PAX5/SLCO1B3、PAX5/ZNF521、PAX8/PPARG、PCM1/JAK2、PCM1/RET、PDE4DIP/PDGFRB、PEX5/LPL、PICALM/MLLT10、PIM1/BCL6、PML/RARA、POU2AF1/BCL6、PPP2R2A/CHEK2、PRKAR1A/RARA、PRKAR1A/RET、PRKG2/PDGFRB、PVRL2/TCR、RABEP1/PDGFRB、RANBP17/TCR、RANBP2/ALK、RBM15/MKL1、RBM6/CSF1R、RCSD1/ABL1、RNF213/ALK、RPN1/MECOM、RUNX1/AFF3、RUNX1/CBFA2T3、RUNX1/CLCA2、RUNX1/LPXN、RUNX1/MACROD1、RUNX1/RUNX1T1、RUNX1/SH3D19、RUNX1/TRPS1、RUNX1/USP42、RUNX1/YTHDF2、RUNX1/ZNF687、RYK/ATP5O、SEC31A/ALK、SEC31A/JAK2、SENP6/NKAIN2、SET/NUP214、SFPQ/ABL1、SFPQ/TFE3、SFRS3/BCL6、SLC34A2/ROS1、SLC45A3/BRAF、SLC45A3/ELK4、SLC45A3/ERG、SLC45A3/ETV1、SLC45A3/FLI1、SNX2/ABL1、SPECC1/PDGFRB、SPTBN1/FLT3、SQSTM1/ALK、SRGAP3/RAF1、SS18/SSX1、SS18/SSX2、SS18/SSX4、SS18L1/SSX1、SSBP2/JAK2、STAT5B/RARA、STRN/PDGFRA、TAF15/NR4A3、TAF15/ZNF384、TAL1/RHOA、TAL1/TCR、TCEA1/PLAG1、TCF12/NR4A3、TCF3/HLF、TCF3/NOP2、TCF3/PBX1、TCF3/TFPT、TCF3/ZNF384、TCR/LMO1、TCR/LMO2、TCR/MTCP1NB、TFG/ALK、TFG/NR4A3、TFG/NTRK1、TFRC/BCL6、THRAP3/USP6、TLX1/TCR、TMPRSS2/ERG、TMPRSS2/ERG、TMPRSS2/ETV1、TMPRSS2/ETV4、TMPRSS2/ETV5、TP53BP1/PDGFRB、TPM3/PDGFRB、TPM4/ALK、TPR/NTRK1、TRIM24/FGFR1、TRIM27/RET、TRIM33/RET、TRIP11/PDGFRB、VTI1A/TCF7L2、WDR48/PDGFRB、WWTR1/CAMTA1、ZBTB16/RARA、ZMIZ1/ABL1、ZMYM2/FGFR1、RUNX1/KIAA1549L、YAP1/TFE3、GTF2I/NCOA2、EWS/FLI1、SLC44A1/PRKCA、NAB2/STAT6、CUX1/AGR3、FGFR3/BAIAP2L1、FGFR3/TACC3、FGFR3/TACC3和NABP1/RARA。因此,對應(yīng)于與癌基因重排有關(guān)的基因的MEI插入相鄰序列提示,與該重排相關(guān)的治療在針對該個體的治療方案中將是有效的。
在一些情況下,根據(jù)從基因組分析獲得的信息施用抗癌劑?;熆拱﹦┑膶嵗ǎ旱骖?Nitrogen Mustards),如苯達(dá)莫司汀、苯丁酸氮芥、氮芥(chlormethine)、環(huán)磷酰胺、異環(huán)磷酰胺、美法侖、潑尼氮芥、氯乙環(huán)磷酰胺;烷基磺酸鹽,如白消安、甘露舒凡、蘇消安;乙烯亞胺,如卡波醌、塞替派、三亞胺醌;亞硝基脲,如卡莫司汀、福莫司汀、洛莫司汀、尼莫司汀、雷莫司汀、司莫司汀、鏈脲菌素;環(huán)氧化物,如依托格魯;其他烷化劑,如達(dá)卡巴嗪、二溴甘露醇、哌泊溴烷、替莫唑胺;葉酸類似物,如甲氨蝶呤、培美曲塞、普拉曲沙、雷替曲塞;嘌呤類似物,如克拉屈濱、氯法拉濱、氟達(dá)拉濱、巰嘌呤、奈拉濱、硫鳥嘌呤;嘧啶類似物,如阿扎胞苷、卡培他濱、卡莫氟、阿糖胞苷、地西他濱、氟尿嘧啶、吉西他濱、替加氟;長春花生物堿,如長春堿、長春新堿、長春地辛、長春氟寧、長春瑞濱;鬼臼毒素衍生物,如依托泊苷、替尼泊苷;秋水仙素衍生物,如脫羰秋水仙堿;紫杉烷,如多西他賽、紫杉醇、聚谷氨酸紫杉醇;其他植物生物堿和天然產(chǎn)物,如曲貝替定;放線菌素,如更生霉素;蒽環(huán)霉素,如阿柔比星、柔紅霉素、阿霉素、表阿霉素、伊達(dá)比星、米托蒽醌、吡柔比星、戊柔比星、佐柔比星;其他細(xì)胞毒性抗生素,如博來霉素、伊沙匹隆、絲裂霉素、普卡霉素;鉑化合物,如卡鉑、順鉑、奧沙利鉑、賽特鉑;甲基肼,如甲基芐肼;致敏劑,如氨基酮戊酸、乙丙昔羅、氨基酮戊酸甲酯、卟吩姆鈉、替莫卟吩;蛋白激酶抑制劑,如達(dá)沙替尼、厄洛替尼、依維莫司、吉非替尼、伊馬替尼、拉帕替尼、尼洛替尼、pazonanib、索拉非尼、舒尼替尼、西羅莫司;其他抗腫瘤劑,如阿利維甲酸、六甲蜜胺、安吖啶、阿那格雷、三氧化二砷、天冬酰胺酶、貝沙羅汀、硼替佐米、塞來考昔、地尼白介素(denileukin diftitox)、雌氮芥、羥基脲、伊立替康、氯尼達(dá)明、馬索羅酚、米替福新、米托胍腙、米托坦、奧利默森(oblimersen)、培門冬酶、噴司他丁、羅米地辛、塞西馬集(sitimagene ceradenovec)、噻唑呋林、拓?fù)涮婵?、維甲酸、伏立諾他;雌激素,如二乙基二苯乙烯醇、炔雌醇、磷雌酚、磷酸聚雌醇;孕激素,如孕諾酮、甲羥孕酮、甲地孕酮;促性腺激素釋放激素類似物,如布舍瑞林、戈舍瑞林、亮丙瑞林、曲普瑞林;抗雌激素,如氟維司群、他莫昔芬、托瑞米芬;抗雄激素,如比卡魯胺、氟他胺、尼魯米特;酶抑制劑,如氨魯米特、阿那曲唑、依西美坦、福美坦、來曲唑、伏氯唑;其他激素拮抗劑,如阿巴瑞克、地加瑞克;免疫刺激劑,如組胺二鹽酸鹽、米伐木肽、匹多莫德、普樂沙福、羅喹美克、胸腺五肽;免疫抑制劑,如依維莫司、胍立莫司、來氟米特、霉酚酸、西羅莫司;鈣調(diào)磷酸酶抑制劑,如環(huán)孢素、他克莫司;其他免疫抑制劑,如硫唑嘌呤、來那度胺、甲氨蝶呤、沙利度胺;以及放射性藥物,如碘芐胍。
在一些實施方案中,抗癌劑是毒素,例如白喉毒素。在某些實施方案中,使生物相容性水凝膠聚合物負(fù)載有治療有效量的一種或多種毒素以形成生物相容性水凝膠聚合物。毒素的實例包括外毒素,如白喉毒素、肉毒桿菌毒素、溶細(xì)胞素、溶血素(例如,金黃色葡萄球菌(Staphyllococcus aureus)的α毒素或α溶血素)、霍亂毒素、百日咳毒素、志賀毒素;來自大腸桿菌(E.coli)的熱穩(wěn)定腸毒素;箭毒;α-眼鏡蛇毒素;維羅毒素-1(Verotoxin-1);以及來自百日咳博德特氏菌(Bordetella pertussis)的腺苷酸環(huán)化酶(AC)毒素。
在一些情況下,治療包括施用特異性地以包含MEI插入相鄰連續(xù)序列的核酸序列的降解為目標(biāo)的組合物。
除了使用MEI邊界來選擇與與被上述MEI插入相鄰序列標(biāo)記的基因產(chǎn)物相關(guān)的途徑或基因產(chǎn)物或基因有關(guān)的治療之外,在一些情況下還使用MEI插入邊界序列來開發(fā)直接靶向跨越MEI和插入相鄰序列的序列的核酸靶向藥物。本文設(shè)想包含跨越MEI和插入相鄰邊界序列的核酸序列的多種組合物。在一些情況下,這樣的組合物的一個共同方面是,它們包含對跨越MEI邊緣序列和插入相鄰基因組序列二者的序列具有特異性并且長度不足以靶向單獨的MEI序列或插入相鄰序列的核酸組分。
也就是說,本文在許多情況下設(shè)想和公開的組合物在不存在插入相鄰序列的情況下不與MEI結(jié)合,并且在不存在相鄰MEI的情況下不與插入相鄰序列結(jié)合;確切地說,本文公開的組合物包含與含有MEI和相鄰基因組序列兩者的序列進(jìn)行特異性結(jié)合的核酸組分。因此,在用這樣的組合物治療后,只有與MEI插入相鄰序列對應(yīng)的核酸,例如本文公開的已經(jīng)在時間或空間測定(例如,如上文公開的)中被鑒定為明顯過度表示的核酸,才會被該組合物所靶向,而其他MEI和包含插入相鄰序列但不含MEI序列的未插入的等位基因不被該組合物結(jié)合。在一些情況下,該組合物的核酸組分包含MEI序列的3、4、5、6、7、8、9、10個或超過10個堿基,以及插入相鄰序列的3、4、5、6、7、8、9、10個或超過10個堿基,使得該組合物與單獨的MEI之間或者該組合物與單獨的插入相鄰序列之間的結(jié)合能不足以保證結(jié)合。
例如,如本文公開的組合物包含與指導(dǎo)包含MEI和插入相鄰序列的靶序列的內(nèi)切核苷酸切割的部分組合的、具有如上所述的特征的引導(dǎo)核酸。
在一些實施方案中,所述引導(dǎo)核酸分子為引導(dǎo)RNA分子。在一些情況下,例如通過募集具有內(nèi)切核酸酶活性的蛋白質(zhì)如Cas9蛋白,該引導(dǎo)RNA分子或其他引導(dǎo)核酸分子指導(dǎo)與其結(jié)合的DNA分子的內(nèi)切核苷酸切割。鋅指核酸酶(ZFN)、轉(zhuǎn)錄激活物樣效應(yīng)物核酸酶和基于成簇規(guī)律間隔短回文重復(fù)序列/Cas的RNA指導(dǎo)的DNA核酸酶(CRISPR/Cas9)等與本公開內(nèi)容的一些實施方案相匹配。
引導(dǎo)RNA分子或其他引導(dǎo)核酸分子包含與將從測序中去除的靶序列發(fā)生堿基配對的序列(靶序列區(qū)內(nèi)的非靶序列)。在一些實施方案中,該堿基配對是完全的,而在一些實施方案中,該堿基配對是部分的,或包含未配對的堿基以及與非靶序列配對的堿基。
引導(dǎo)RNA分子或其他引導(dǎo)核酸分子可包含一個或多個形成‘發(fā)夾’結(jié)構(gòu)的區(qū)域。這樣的一個或多個區(qū)域包含部分或完全回文的序列,使得該區(qū)域的5’和3’端可彼此雜交形成雙鏈‘莖'結(jié)構(gòu),在一些實施方案中該結(jié)構(gòu)被非回文環(huán)加帽,從而將雙鏈環(huán)中的每條單鏈彼此拴住。
在一些實施方案中,引導(dǎo)RNA分子或其他引導(dǎo)核酸分子包含莖環(huán),如tracrRNA莖環(huán)。莖環(huán)如tracrRNA莖環(huán)可與核酸內(nèi)切核酸酶如Cas9DNA內(nèi)切核酸酶復(fù)合或結(jié)合。或者,莖環(huán)可與除Cas9之外的內(nèi)切核酸酶復(fù)合,或與除內(nèi)切核酸酶之外的核酸修飾酶如堿基切除酶、甲基轉(zhuǎn)移酶或具有干擾一種或多種DNA聚合酶的其他核酸修飾活性的酶復(fù)合。
tracrRNA/CRISPR/內(nèi)切核酸酶系統(tǒng)被鑒定為真細(xì)菌和古細(xì)菌原核生物中的適應(yīng)性免疫系統(tǒng),細(xì)胞借由該系統(tǒng)獲得對具有已知序列的病毒的反復(fù)感染的抗性。參見,例如,Deltcheva E,Chylinski K,Sharma CM,Gonzales K,Chao Y,Pirzada ZA等人(2011)"CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III"Nature 471(7340):602–7.doi:10.1038/nature09886.PMC 3070239.PMID 21455174;Terns MP,Terns RM(2011)"CRISPR-based adaptive immune systems"Curr Opin Microbiol 14(3):321–7.doi:10.1016/j.mib.2011.03.005.PMC 3119747.PMID 21531607;Jinek M,Chylinski K,Fonfara I,Hauer M,Doudna JA,Charpentier E(2012)"A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity"Science 337(6096):816–21.doi:10.1126/science.1225829.PMID 22745249;以及Brouns SJ(2012)"A Swiss army knife of immunity"Science 337(6096):808–9.doi:10.1126/science.1227253.PMID 22904002。該系統(tǒng)已被調(diào)適用于在真核細(xì)胞中引導(dǎo)靶向誘變。參見,例如,Wenzhi Jiang,Huanbin Zhou,Honghao Bi,Michael Fromm,Bing Yang和Donald P.Weeks(2013)"Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis,tobacco,sorghum and rice"Nucleic Acids Res.Nov 2013;41(20):e188,2013年8月31日在線發(fā)表.doi:10.1093/nar/gkt780,以及其中的參考文獻(xiàn)。
如本文所設(shè)想的,在一些實施方案中使用引導(dǎo)RNA分子或其他引導(dǎo)核酸分子來提供對DNA內(nèi)切核酸酶如Cas9內(nèi)切核酸酶的序列特異性。在這些實施方案中,引導(dǎo)RNA分子或其他引導(dǎo)核酸分子包含與內(nèi)切核酸酶如Cas9結(jié)合或被內(nèi)切核酸酶如Cas9結(jié)合的發(fā)夾結(jié)構(gòu)(在一些實施方案中設(shè)想其他內(nèi)切核酸酶作為替代物或添加物),并且引導(dǎo)RNA分子或其他引導(dǎo)核酸分子進(jìn)一步包含與將從測序文庫或測序反應(yīng)中去除的序列結(jié)合或特異性結(jié)合或排他性地結(jié)合的識別序列。引導(dǎo)RNA分子或其他引導(dǎo)核酸分子中的識別序列的長度可根據(jù)序列消除過程中期望的特異性程度而變化。如上文所討論的,核酸特異性在許多情況下被解釋為以下情況:RNA分子或其他引導(dǎo)核酸分子與MEI-插入相鄰序列接合點特異性結(jié)合,但不與單獨的MEI也不與單獨的插入相鄰序列結(jié)合。包含在樣品中頻繁出現(xiàn)的序列或包含差異豐富序列(富含AT的基因組樣品中的AT豐度或富含GC的基因組樣品中的GC豐度)的短識別序列有可能鑒定相對大量的位點,并因此引導(dǎo)頻繁的核酸修飾,如內(nèi)切核酸酶活性、堿基切除、甲基化或干擾至少一種DNA聚合酶活性的其他活性。包含在樣品中不頻繁出現(xiàn)的序列或包含表示不足的堿基組合(富含AT的基因組樣品中的GC豐度或富含GC的基因組樣品中的AT豐度)的長識別序列有可能鑒定相對少量的位點,并因此引導(dǎo)不頻繁的核酸修飾,如內(nèi)切核酸酶活性、堿基切除、甲基化或干擾至少一種DNA聚合酶活性的其他活性。因此,如本文公開的,在一些實施方案中,通過對識別序列長度的修飾,可以調(diào)節(jié)從測序反應(yīng)中去除序列的頻率,以便特異性地靶向單個MEI-插入相鄰序列。
引導(dǎo)RNA分子或其他引導(dǎo)核酸分子可通過多種符合本公開內(nèi)容的方法合成??墒褂脴?biāo)準(zhǔn)合成技術(shù)來產(chǎn)生大量的引導(dǎo)RNA分子或其他引導(dǎo)核酸分子。雙鏈DNA分子可包含RNA分子或其他引導(dǎo)核酸分子位點特異性結(jié)合序列、引導(dǎo)RNA分子或針對Cas9蛋白和T7啟動子位點的其他引導(dǎo)核酸分子序列。在一些情況下,該雙鏈DNA分子的長度可小于約100bp??墒褂肨7聚合酶來創(chuàng)建單鏈RNA分子,該單鏈RNA分子可包含靶RNA序列和針對Cas9蛋白的引導(dǎo)RNA序列。
例如,本文公開的組合物包含具有如上所述的MEI插入相鄰序列結(jié)合特征的引導(dǎo)核酸,該引導(dǎo)核酸引導(dǎo)插入相鄰序列中的基因的沉默,使得基因產(chǎn)物如癌基因產(chǎn)物、導(dǎo)致例如細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷的基因產(chǎn)物的截短或以其他方式突變的等位基因在插入相鄰序列處在被引導(dǎo)核酸結(jié)合時得以沉默。在一些情況下,引導(dǎo)核酸包含siRNA部分、piRNA部分或參與基因沉默、基因產(chǎn)物的轉(zhuǎn)錄調(diào)節(jié)或轉(zhuǎn)錄后調(diào)節(jié)的其他核酸部分。
siRNA和piRNA是與基因沉默有關(guān)的小RNA分子。向生物體中引入dsRNA可導(dǎo)致基因表達(dá)的特異性干擾。該現(xiàn)象被稱為RNA干擾(RNAi),由特異性靶向mRNA以便被植物、無脊椎動物和哺乳動物細(xì)胞中的細(xì)胞機(jī)制降解而導(dǎo)致。本領(lǐng)域已知的示例性RNAi技術(shù)包括但不限于siRNA、shRNA和piRNA。RNAi機(jī)制的組分包括靶向靶基因的dsRNA(siRNA或shRNA)、Dicer、Argonaute蛋白家族(特別是Ago-2)、Drosha、RISC、TRBP和PACT。小干擾RNA(siRNA)通常被認(rèn)為是具有2nt 3’端突出端的dsRNA,其激活RNAi,導(dǎo)致mRNA以依賴于靶mRNA的互補結(jié)合的序列特異性方式降解。shRNA通常被認(rèn)為是含有環(huán)結(jié)構(gòu)的短發(fā)夾RNA(shRNA),其被加工成siRNA并且也導(dǎo)致mRNA以依賴于靶mRNA的互補結(jié)合的序列特異性方式降解。Drosha通常被認(rèn)為是在細(xì)胞核中加工pri-miRNA和shRNA的RNA酶III酶。Dicer通常被認(rèn)為是將dsRNA加工成20-25bp的siRNA,而在3'端留下2nt突出端的核糖核酸酶(RNA酶)III酶。果蠅(Drosophila)Dicer-2切割長dsRNA,而Dicer-1對miRNA加工是重要的。RISC通常被認(rèn)為是由Argonaute蛋白質(zhì)和締合的siRNA組成的最小RNA誘導(dǎo)的沉默復(fù)合物(RISC)。其還可含有PACT、TRBP和Dicer。應(yīng)注意,RISC的確切組成尚未得到描述。TRBP通常被認(rèn)為是Dicer對dsRNA的切割以及隨后向RISC的傳遞所需的。蛋白R(PKR)活化蛋白(PACT)通常被認(rèn)為與用于dsRNA切割的Dicer和TRBP相關(guān)。與單鏈siRNA一起,argonaute蛋白家族組裝形成RISC,結(jié)合21–35nt RNA(包括miRNA和siRNA)以及其關(guān)聯(lián)的靶mRNA,隨后通過其核酸內(nèi)切功能將它們切割。
小干擾RNA(siRNA)——有時被稱為短干擾RNA或沉默RNA,是一類雙鏈RNA分子,通常為20-25個堿基對的長度。siRNA是RNA干擾(RNAi)途徑中最值得注意的,其中其干擾具有互補核苷酸序列的特定基因的表達(dá)。siRNA通過使mRNA在轉(zhuǎn)錄后分解來起作用,導(dǎo)致不發(fā)生翻譯。siRNA還在RNAi相關(guān)途徑中起作用,例如,充當(dāng)抗病毒機(jī)制,或在塑造基因組的染色質(zhì)結(jié)構(gòu)中起作用。
當(dāng)在siRNA或shRNA之間進(jìn)行選擇時,要考慮的重要因素是治療的長度。siRNA在細(xì)胞中瞬時表達(dá),而shRNA可通過病毒介導(dǎo)的轉(zhuǎn)導(dǎo)而被穩(wěn)定地整合。siRNA設(shè)計的指導(dǎo)方針包括:(1)通常推薦19–29nt的siRNA序列以避免非特異性沉默,(2)包含AA二核苷酸的靶向位點,和(3)具有3’dUdU或dTdT二核苷酸突出端的siRNA使有效性增強。通常,siRNA序列應(yīng)該具有35–55%的G/C含量。
由于不同的細(xì)胞類型對核酸的引入具有不同的敏感性,因此用于遞送RNAi的方案將取決于細(xì)胞類型。轉(zhuǎn)染、電穿孔和某些病毒遞送方法是瞬時的。
最常見的核酸遞送方法包括轉(zhuǎn)染和電穿孔。轉(zhuǎn)染包括核酸與載體分子的復(fù)合物的形成,這允許它們穿過細(xì)胞膜。轉(zhuǎn)染方法包括脂質(zhì)轉(zhuǎn)染,在脂質(zhì)轉(zhuǎn)染中,具有帶有帶正電荷的頭部基團(tuán)的長疏水鏈的陽離子脂質(zhì)與帶負(fù)電荷的siRNA相互作用,從而將其包圍在脂雙層中,該脂雙層隨后被細(xì)胞內(nèi)吞;基于陽離子聚合物的納米顆粒,其允許降低的毒性和增加的效率,并且允許遞送修飾的siRNA;以及脂質(zhì)或細(xì)胞穿透肽(CPP)綴合,其包括siRNA與疏水部分(例如,膽固醇)或陽離子CCP(例如,轉(zhuǎn)運蛋白或pentatratin)的綴合,這促進(jìn)了向靶細(xì)胞內(nèi)的遞送。
在電穿孔方法中,向由具有帶負(fù)電荷的頭部基團(tuán)的磷脂分子組成的細(xì)胞膜施加電場。電脈沖導(dǎo)致磷脂重新定向,在膜中產(chǎn)生孔,從而允許siRNA進(jìn)入。電穿孔常用于難以轉(zhuǎn)染的細(xì)胞。然而,必須針對每種細(xì)胞或組織類型來優(yōu)化具體的設(shè)置(電壓、脈沖數(shù)和脈沖的長度)。
已知RNAi干預(yù)對癌癥、神經(jīng)疾病、病毒感染、黃斑變性、糖尿病性視網(wǎng)膜病和丙型肝炎以及其他病癥具有治療價值。
轉(zhuǎn)座子沉默是以轉(zhuǎn)座子為目標(biāo)的轉(zhuǎn)錄基因沉默的一種形式。轉(zhuǎn)錄基因沉默是防止DNA的該區(qū)域轉(zhuǎn)錄的組蛋白修飾的結(jié)果。轉(zhuǎn)座子的轉(zhuǎn)錄沉默對基因組的維持至關(guān)重要。轉(zhuǎn)座子的“跳躍(jumping)”產(chǎn)生基因組不穩(wěn)定性并且可以導(dǎo)致非常有害的突變。轉(zhuǎn)座因子插入與包括血友病、重癥聯(lián)合免疫缺陷和癌癥傾向在內(nèi)的多種疾病有關(guān)。因此,為阻止轉(zhuǎn)座子突變發(fā)展并傳遞到下一代,轉(zhuǎn)座子的沉默在種系中是非常重要的。
最大的一類小RNA——Piwi相互作用RNA(piRNA)的長度在26到31個核苷酸之間,并且其通過與來自Argonaute蛋白家族的piwi蛋白(基因沉默蛋白質(zhì))相互作用而起作用。本領(lǐng)域已知與PIWI蛋白結(jié)合的piRNA采用轉(zhuǎn)錄后轉(zhuǎn)錄物破壞來使轉(zhuǎn)座子沉默。大多數(shù)piRNA相對于從沉默的轉(zhuǎn)座子轉(zhuǎn)錄的mRNA是反義的,其通常與Piwi和Aubergine(Aub)蛋白相締合,而相反,有義鏈piRNA傾向于與Argonaute 3(Ago3)締合。被稱為“乒乓”擴(kuò)增的循環(huán)在有義和反義piRNA之間進(jìn)行,其包括大量的修剪和加工以產(chǎn)生成熟的piRNA。該過程導(dǎo)致種系中大多數(shù)piRNA的產(chǎn)生,并且還可以解釋piRNA在種系發(fā)育中的起源。Piwi-piRNA復(fù)合物通過增加轉(zhuǎn)座子區(qū)之內(nèi)或上游的CpG甲基化,和/或轉(zhuǎn)座子區(qū)周圍的染色質(zhì)修飾,或通過直接降解轉(zhuǎn)座子的轉(zhuǎn)錄物來抑制轉(zhuǎn)座子表達(dá)。
可替代地或組合地,在一些情況下,選擇與應(yīng)對癌癥有關(guān)的治療,該癌癥與細(xì)胞生長、細(xì)胞周期或細(xì)胞增殖途徑(與MEI有關(guān)的基因為其編碼參與成員)的誤調(diào)節(jié)有關(guān)。例如,TOR(雷帕霉素信號傳導(dǎo)的靶標(biāo))的負(fù)調(diào)節(jié)物如TSC2基因座中的MEI提示采用生長調(diào)節(jié)抑制劑的治療,而編碼視網(wǎng)膜母細(xì)胞瘤抑制基因Rb的基因座中的MEI提示與細(xì)胞周期進(jìn)展有關(guān)的治療。
在一些情況下,在個體中的位置之間或在來自個體的相同樣品來源的時間之間比較MEI水平。
在一些情況下,使用血液作為待測定核酸如游離循環(huán)核酸的來源,以單獨地或與替代監(jiān)測方法組合地用于MEI水平的持續(xù)時間監(jiān)測。可替代地或組合地,在一些實施方案中使用來自其他來源的循環(huán)游離DNA或其他DNA。
提取循環(huán)游離核酸的方法是本領(lǐng)域已知的。當(dāng)核酸在細(xì)胞內(nèi)時,提取程序通常包括細(xì)胞裂解(通常通過對樣品進(jìn)行化學(xué)和物理法混合、研磨或超聲處理而實現(xiàn)),通過添加去污劑或表面活性劑(也用于細(xì)胞裂解)去除膜脂質(zhì),任選地通過添加蛋白酶去除蛋白質(zhì),任選地通過添加RNA酶去除RNA(當(dāng)DNA為所需靶標(biāo)時進(jìn)行)。DNA純化方法是本領(lǐng)域已知的。示例性的DNA純化方法包括但不限于乙醇沉淀、酚-氯仿提取和微型柱純化??墒褂帽涞囊掖蓟虍惐纪瓿梢掖汲恋?。由于DNA在這些醇中是不可溶的,因此其將聚集在一起,在離心后得到沉淀物。通過增加離子強度(通常通過添加乙酸鈉)來改善DNA的沉淀。酚-氯仿提取使樣品中的蛋白質(zhì)變性。在樣品離心后,變性的蛋白質(zhì)留在有機(jī)相中,而含有核酸的水相與氯仿混合,從而將酚殘留物從溶液中去除。對于微型柱純化,根據(jù)緩沖液的pH和鹽含量,核酸與固相(二氧化硅或其他)結(jié)合,隨后洗脫。
供提取的循環(huán)核酸的示例性形式包括但不限于DNA、RNA、mRNA寡聚核小體的、線粒體的、表觀遺傳學(xué)修飾的、單鏈的、雙鏈的、環(huán)狀的,質(zhì)粒、粘粒、酵母人工染色體人工或人造DNA(如包括獨特DNA序列)、以及從RNA樣品逆轉(zhuǎn)錄的DNA如cDNA,及其組合。用于核酸提取的示例性生物來源包括但不限于全血、血清、血漿、臍帶血、絨膜絨毛、羊水、腦脊液、脊髓液、灌洗液(例如,支氣管肺泡的、胃的、腹膜的、導(dǎo)管的、耳的、關(guān)節(jié)鏡的(athroscopic))活檢樣品、尿液、糞便、痰液、唾液、鼻粘膜、前列腺液、精液、淋巴液、膽汁、淚液、汗液、乳汁、乳房流體、胚胎細(xì)胞和胎兒細(xì)胞。該生物樣品可以是含有核酸的任何組織或流體。示例性的生物樣品包括但不限于石蠟包埋的組織、冷凍的組織、手術(shù)細(xì)針抽吸物,以下的細(xì)胞:皮膚、肌肉、肺、頭和頸、食管、腎、胰腺、口、咽喉、咽、喉、食道、筋膜(facia)、腦、前列腺、乳腺、子宮內(nèi)膜、小腸、血細(xì)胞、肝、睪丸、卵巢、子宮、子宮頸、結(jié)腸、胃、脾、淋巴結(jié)、骨髓或腎。流體樣品可包括支氣管刷出物、支氣管洗液、支氣管破壞物、外周血淋巴細(xì)胞、淋巴液、腹水、漿液、胸腔積液、痰液、腦脊液、淚液、食道洗液以及糞便或尿液標(biāo)本如膀胱洗液和尿。
如上文討論或本領(lǐng)域已知的核酸樣品來源以一個或多個時間間隔獲得,并且獲得核酸以用于MEI插入邊界豐度的定量評價。時間點可相隔數(shù)日、數(shù)周、數(shù)月或數(shù)年,如1個月、2個月、3個月、4個月、5個月、6個月、1年、2年、3年、4年、5年、10年或超過10年。
在一些情況下,時間點被部分或完全執(zhí)行治療方案如腫瘤或其他癌性組織切除而隔開,或被施用以消除腫瘤或癌性組織為目標(biāo)的治療如化療或放療而隔開。在一些情況下,如上文公開的治療方案和組合物預(yù)期用于治療方案的時間分析。
因此,使用針對與過度增殖細(xì)胞有關(guān)的MEI的MEI水平定量,例如,以便監(jiān)測干預(yù)的效力,其中MEI水平的降低表明有效力,或者M(jìn)EI相對水平的升高速率的降低表明有效力,或者M(jìn)EI插入邊界的相對量穩(wěn)定在穩(wěn)定水平表明有效力。
除樣品的時間分隔之外,本文還涉及樣品的空間分隔。因此,在一些情況下,從第一區(qū)域或組織取得與腫瘤或癌活性在表型上不相關(guān)的樣品,并從疑似具有癌活性或癌前活性或者觀察為腫瘤或癌的第二區(qū)域或組織取得第二樣品。
在一些情況下,從癌或腫瘤內(nèi)的多個區(qū)域如靜止區(qū)域和有絲分裂活躍或增殖活躍區(qū)域取得樣品,使得與腫瘤增生、生長、細(xì)胞分裂或轉(zhuǎn)移有關(guān)的細(xì)胞與良性、靜止或衰老腫瘤組織相關(guān)細(xì)胞分開。
在一些情況下,將腫瘤組織在空間上區(qū)分,使得例如內(nèi)部和邊緣的細(xì)胞群體分開提取??商娲鼗蚪M合地,通過表面特征或生物標(biāo)志物對腫瘤細(xì)胞進(jìn)行分選。
若干細(xì)胞分選方法是本領(lǐng)域已知的。示例性的細(xì)胞分選的類型包括但不限于熒光激活細(xì)胞分選(FACS)、磁性細(xì)胞選擇和單細(xì)胞分選。單細(xì)胞分選提供了根據(jù)細(xì)胞內(nèi)和細(xì)胞外性質(zhì)分選細(xì)胞的不均勻混合物的方法。FACS利用流式細(xì)胞術(shù)提供細(xì)胞內(nèi)和細(xì)胞外性質(zhì)(不包括形態(tài)學(xué))的定量測量,以供分選細(xì)胞的不均勻混合物。磁性細(xì)胞分選提供了根據(jù)細(xì)胞外性質(zhì)(通常是細(xì)胞表面蛋白質(zhì)(即,抗原))富集細(xì)胞的不均勻混合物的方法。磁性激活細(xì)胞分選(MACS)是基于柱子的分離技術(shù),其中使標(biāo)記的細(xì)胞通過磁柱。SEP系統(tǒng)提供了不使用柱子的細(xì)胞分離技術(shù),其中將含有標(biāo)記的細(xì)胞的管放置在磁場內(nèi)。陽性選擇的細(xì)胞保留在管中,而陰性選擇的細(xì)胞存在于液體懸浮液中。細(xì)胞分選方法包括特異性結(jié)合癌癥生物標(biāo)志物以分選細(xì)胞的分選劑(例如,抗體)。
示例性的癌癥生物標(biāo)志物包括但不限于CCR10、CD9、CD13、CD15、CD24、CD26、CD29、CD32、CD46、CD49a、CD49b、CD49c、CD49f、CD51、CD54、CD55、CD56、CD58、CD63、CD66a、CD66c、CD66e、CD71、CD73、CD81、CD82、CD91、CD98、CD99、CD102、CD104、CD105、CD108、CD111、CD117、CD118、CD130、CD131、CD133、CD136、CD141、CD146、CD147、CD148、CD151、CD155、CD157、CD164、CD166、CD167a、CD172a、CD177、CD186、CD196、CD221、CD230、CD234、CD244、CD245、CD262、CD265、CD273、CD275、CD295、CD298、CD299、CD317、CD318、CD324、CD340、BMPR-1B、鈣粘蛋白-11、c-Met、密蛋白-3(Claudin-3)、DLL-1、DLL-3、Eph-B2、Eph-B4、FOLR1、Frizzled-3、Glut-1、Glut-2、磷脂酰肌醇聚糖5、HLA-A/B/C、HLA-A2、HER3、IL-15R、IL-20Ra、jagged-2、整聯(lián)蛋白-a8、整聯(lián)蛋白a9b1、整聯(lián)蛋白b5、LAG-3、白三烯-B4R、Lox-1、LDL-R、MCSP、mer、柄蛋白-4(nectin-4)、notch2、NPC、PD-L2、叢蛋白-B1、腦信號蛋白4B、促生長素抑制素-R2(somatostatin-R2)、TROP-2、ULBP2、整聯(lián)蛋白aVb9和VEGFR2。在單細(xì)胞分選和FACS的情況下,生物標(biāo)志物可以是細(xì)胞內(nèi)或細(xì)胞外的。
比較樣品之間的MEI水平,以鑒定在第二樣品中差異性過度豐富的MEI插入接合點。如本文所述,在一些情況下,一個樣品中差異豐富的MEI插入接合點比另一樣品豐富10%、20%、30%、40%、50%、70%、100%、2倍、2.5倍、3倍、3.5倍、4倍、5倍或超過5倍。
使用被鑒定為在假定不健康的組織中差異性存在的MEI插入邊界來指導(dǎo)如上所述的治療選擇。使用被鑒定為在假定不健康的組織中差異性存在的MEI插入邊界來監(jiān)測疾病進(jìn)展或治療效力,使得相對水平的降低,或相對水平的穩(wěn)定化,或相對水平增加速率的降低表明有治療效力。
在一些情況下,使用與過度增殖細(xì)胞活性有關(guān)的MEI-插入相鄰序列來監(jiān)測在鑒定的腫瘤或癌癥部位之外的腫瘤或癌癥或癌前細(xì)胞擴(kuò)充,使得來源于假定健康組織的樣品中MEI插入位點的相對豐度的增加指示該樣品所源自的組織為潛在癌前或癌性的風(fēng)險。
在一些實施方案中,提供詳述MEI定量測序分析的結(jié)果的報告。例如,該報告包含關(guān)于經(jīng)時程相對于治療方案的或在一個組織或區(qū)域中相對于另一個的MEI相對豐度水平的信息。在一些情況下,該報告隨附有治療推薦,該治療推薦關(guān)聯(lián)于與MEI插入位點或與過度增殖細(xì)胞有關(guān)的位點相鄰的序列的身份或由該身份獲知。在各個實施方案中,這樣的治療推薦包括化療、放療、組織切除或其組合。在一些情況下,該治療針對與MEI插入位點有關(guān)的破壞基因的產(chǎn)物,而在一些實施方案中,該治療針對破壞基因的產(chǎn)物所參與的途徑的成員的誤調(diào)節(jié)。例如,如果負(fù)調(diào)節(jié)物被破壞(如通過MEI插入表明的),則治療可針對由于MEI插入破壞而預(yù)期將會上調(diào)的下游信號組分。
在一些情況下,將報告提供給個體,而在一些情況下,將報告提供給醫(yī)療保健專業(yè)人員。在一些情況下,報告以保密形式提供,使得其不被提供給公眾,而是僅直接提供給提供樣品的個體或該個體及相關(guān)的醫(yī)療保健專業(yè)人員,或保密地提供給醫(yī)療保健專業(yè)人員。
多種方法可用于MEI-插入相鄰序列定量。重復(fù)元件如MEI序列如何通過全基因組測序進(jìn)行定量分析的概念性實例如下。
在一些情況下,此處獲得的序列信息用于樣品中的核酸序列豐度。如本文公開或如本領(lǐng)域已知的那樣生成文庫并對文庫進(jìn)行測序。排除重復(fù)讀序,使得僅包括獨特標(biāo)記的讀序。將獨特讀序映射至基因組序列。對映射至靶區(qū)域的獨特文庫序列讀序的數(shù)目進(jìn)行計數(shù)并用于表示該序列在樣品中的豐度。在一些實施方案中,獨特標(biāo)記的序列讀序均映射至樣品序列中的單個位點。在一些情況下,獨特標(biāo)記的序列讀序映射至整個基因組中的多個位點,如轉(zhuǎn)座子插入位點或重復(fù)元件位點。因此,在一些情況下,映射至轉(zhuǎn)錄物組‘基因座’或轉(zhuǎn)錄物的文庫分子的數(shù)目與該轉(zhuǎn)錄物在產(chǎn)生文庫的樣品中的累積水平相對應(yīng)。相對于映射至基因組的給定獨特區(qū)域的文庫分子的數(shù)目,映射至重復(fù)元件的文庫分子的數(shù)目指示該重復(fù)元件在樣品中的相對豐度。映射至給定MEI插入接合點的序列讀序用來定量給定樣品中的該插入接合點。因此,通過比較跨越MEI插入邊界的讀序的數(shù)目,相對于例如樣品中的其他序列,如已知在樣品的健康單倍體基因組中為單拷貝的序列,定量了該插入邊界。
因此,定量樣品中核酸分子序列的相對豐度通過生成包含獨特標(biāo)記的文庫片段的序列文庫并將該核酸分子序列映射至該文庫上而實現(xiàn),例如該核酸分子序列在該文庫中的出現(xiàn)頻率與該核酸分子序列在產(chǎn)生該文庫的樣品中的豐度相對應(yīng)。在一些情況下,相對于第二核酸分子序列在該文庫中的出現(xiàn)頻率評價核酸分子序列在該文庫中的出現(xiàn)頻率,所述第二核酸序列與在轉(zhuǎn)錄物組中具有已知豐度或?qū)τ诨蚪M樣品的每個基因組具有已知拷貝數(shù)的基因座或轉(zhuǎn)錄物相對應(yīng)。
下文提供了用于核酸樣品中核酸序列定量的更加詳細(xì)的方案。然而,需要強調(diào)的是,本文公開的方法不限于任何一種在核酸樣品中的核酸序列定量方法。
從基因組中每個可能的位置生成下一代測序(NGS)文庫需要無偏倚的方法,以將基因組DNA(gDNA)模板轉(zhuǎn)化成適當(dāng)大小的、平臺特異性測序銜接子在gDNA側(cè)翼的文庫分子。這可以采用如下式所示的具有測序銜接子尾部的隨機(jī)引物來進(jìn)行:5’-銜接子序列-NNNNNNNN-3’。
為了使給定基因組的偏倚最小化,可以以半隨機(jī)方式合成引物的“隨機(jī)”部分,以應(yīng)對感興趣的基因組中的可變內(nèi)含物??蓪⒔o定基因組(例如,人類基因組)分解成具有不同GC含量的100bp窗口。理想地,合成包含代表性“隨機(jī)性”的引物,該“隨機(jī)性”針對基因組中1%至100%GC的GC含量的窗口而排列,并且以相對于每個GC%下的基因組含量的比例合成并合并這些引物。
隨機(jī)引發(fā)可允許基因組的每個堿基被表示為測序儀讀序的起始位置。為了在基因組中每個可能的堿基處結(jié)束每個文庫分子,需要用來終止從隨機(jī)引物開始的聚合的隨機(jī)/無偏倚方法。要做到這一點,可以使用含有固定比例的四種天然核苷酸中的每一種的ddNTP與固定比例的缺少3’-OH基團(tuán)的雙脫氧核苷酸的混合物。ddNTP與dNTP的比例可以決定在任意給定堿基位置終止的可能性。例如,1%ddNTP混合物(99%dNTP)將給出這樣的可能性,即99%的從隨機(jī)引物延伸的分子將越過第一堿基聚合。該相同的實例將給出50bp的N50(50%的分子將長于N個堿基)。隨著相對ddNTP比例降低,N50插入大小增加。因此,在某些條件下,0.8的ddNTP%導(dǎo)致中值插入大小(N50)為62.5,并且包含銜接子和隨機(jī)引物的全長文庫分子的相應(yīng)N50為198.5,0.4的ddNTP%導(dǎo)致中值插入大小(N50)為125,并且包含銜接子和隨機(jī)引物的全長文庫分子的相應(yīng)N50為261,0.2的ddNTP%導(dǎo)致中值插入大小(N50)為250,并且包含銜接子和隨機(jī)引物的全長文庫分子的相應(yīng)N50為386,0.1的ddNTP%導(dǎo)致中值插入大小為500,并且包含銜接子和隨機(jī)引物的全長文庫分子的相應(yīng)N50為636,而0.05的ddNTP%導(dǎo)致中值插入大小為1000,并且包含銜接子和隨機(jī)引物的全長文庫分子的相應(yīng)N50為1136。對于低復(fù)雜度的區(qū)域,如一段AT或GC,該基因組位置中ddNTP的有效濃度將減半,導(dǎo)致在1%ddNTP混合物下,對于在這樣的低復(fù)雜度基因組基因座中發(fā)生的引物延伸反應(yīng),N50為100個核苷酸。(未考慮全部8種核苷酸之間的聚合酶摻入效率差異)。
調(diào)節(jié)反應(yīng)中的ddNTP%可調(diào)節(jié)聚合的分子的范圍和多樣性。ddNTP濃度對片段長度和腺嘌呤-酪氨酸偏倚的影響在圖11中示出。ddNTP濃度對產(chǎn)率的影響在圖12中示出。在0.4%ddNTP下,300-1000bp(摩爾)的摩爾濃度為27.5;在0.2%ddNTP下,300-1000bp(摩爾)的摩爾濃度為16.1;在0.1%ddNTP下,300-1000bp(摩爾)的摩爾濃度為5.8;而在0.05%ddNTP下,300-1000bp(摩爾)的摩爾濃度為4.9。圖13示出了按照大小選擇的分子的讀取位置。
另一個步驟可以是將銜接子標(biāo)記的分子與gDNA模板以及任何過量的反應(yīng)物如引物和過量的NTP分離。這可以通過使用生物素化的ddNTP完成??墒褂面溍褂H和素涂覆的磁珠來實現(xiàn)該分離。
聚合酶的選擇可限于具有鏈置換以及ddNTP/生物素?fù)饺肽芰Φ拿?。SEQUENASE和THERMOSEQUENASE(Affymetrix,Santa Clara,CA)是兩種這樣的酶。如果由于缺少樣品資源或強制稀釋而需要低輸入量,則可通過使用酶混合物如SEQUENASE和Phi29(一種缺乏摻入ddNTP能力的高度持續(xù)性聚合酶)優(yōu)化反應(yīng)以改善產(chǎn)率。phi 29酶將增加用于在反應(yīng)中被SEQUENASE加工的模板量。還可以通過優(yōu)化反應(yīng)持續(xù)時間來提高模板的產(chǎn)率和多樣性。
這樣的測序反應(yīng)的產(chǎn)物由下式表示:5’-銜接子-NNNNNNNN-基因組插入片段-ddNTP/生物素。
目前的商用測序儀需要gDNA插入片段的側(cè)翼為2個銜接子序列??赏ㄟ^第二隨機(jī)引發(fā)反應(yīng)添加第二銜接子。從磁珠上分離的產(chǎn)物可用作使用隨機(jī)引物與第二銜接子的第二隨機(jī)引發(fā)反應(yīng)的模板,如下式所示:5’-銜接子2-NNNNNNNN-3’。置換的產(chǎn)物也可用作使用隨機(jī)引物與第二銜接子的第二隨機(jī)引發(fā)反應(yīng)的模板。
用于第二銜接子添加的酶可以不需要摻入ddNTP的能力。鏈置換可能是必需的??山邮艿拿赴⊿EQUENASE、THERMOSEQUENASE、Phi29、Bst DNA聚合酶和Taq DNA聚合酶。引物的隨機(jī)部分可以與珠子結(jié)合的模板結(jié)合并通過該模板分子的末端延伸。在最靠近模板的3'端處結(jié)合的引物可以置換在下游結(jié)合的引物,使得將產(chǎn)生單拷貝的具有第一和第二銜接子兩者的與珠子結(jié)合的模板。該拷貝可與磁珠保持氫鍵鍵合。可通過珠子洗滌去除過量的引物、NTP、酶和置換產(chǎn)物。可對所得的產(chǎn)物進(jìn)行熱變性(將其從珠子上釋放),并測序或通過采用與銜接子互補的引物的PCR進(jìn)行擴(kuò)增。由此產(chǎn)生的產(chǎn)物由下式表示(以3’至5’方向示出):3’-銜接子1-NNNNNNNN-gDNA插入片段-NNNNNNNN-銜接子2-5’。
NGS測序中的關(guān)鍵錯誤模式是文庫制備中的錯誤的克隆擴(kuò)增。對于無PCR方案,這可能很少受到關(guān)注,但任何低輸入方案都需要擴(kuò)增來獲得足夠的文庫以加載到測序儀上。擴(kuò)增過程中引入的錯誤可在測序儀中顯露出來。這些錯誤的標(biāo)準(zhǔn)減少是從分析中去除重復(fù)。然而,如果給予樣品足夠的測序能力,則重復(fù)讀序(具有相同起始和終止位置的讀序)可自然發(fā)生。因此,去除這些讀序?qū)⒔档驮撛囼灥母采w度和準(zhǔn)確性。在分析中使用合成隨機(jī)引物可允許相對于低頻突變準(zhǔn)確確定克隆矯作物。PCR重復(fù)可在兩端上具有相同的隨機(jī)引物序列,而由于深度測序覆蓋導(dǎo)致的重復(fù)可具有不同的隨機(jī)引物序列。由于合成序列總是在每個讀序的相同位置處,因此該信息可以很容易地在分析中獲得。
非終止性合成測序化學(xué)法(如Qiagen和ION Torrent)在對均聚物的長段進(jìn)行測序時遇到困難。這可以通過復(fù)雜文庫生成來減輕,這種復(fù)雜文庫生成通過在本文所述的均聚物的每個堿基處的終止來實現(xiàn)。
因此,與以上公開內(nèi)容一致,生成了第一鏈寡核苷酸文庫。為了生成隨機(jī)文庫,合成了第一輪合成寡核苷酸的群體。第一鏈寡核苷酸均包含位于隨機(jī)寡聚物序列(如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30聚物或更大的寡聚物)的5’側(cè)的序列銜接子,該序列銜接子之后為發(fā)生模板引導(dǎo)的延伸的3’OH。在一些情況下,該序列銜接子被配置為包含可變標(biāo)識符序列。在替代情況下,該序列銜接子是不變的。在一些情況下,使用序列銜接子作為引物結(jié)合位點進(jìn)行測序銜接子如A銜接子的后續(xù)添加,例如通過經(jīng)由擴(kuò)增的標(biāo)準(zhǔn)引物引導(dǎo)的序列添加。
在一些情況下,合成了寡核苷酸群體,使得給定隨機(jī)寡聚物堿基序列(如隨機(jī)5、6、7、8、9或10聚物)的所有可能的組合都在第一鏈寡核苷酸群體中呈現(xiàn)。在其他情況下,特別是當(dāng)選擇長隨機(jī)寡聚物時,但偶爾也在較小寡聚物的情況下,存在給定隨機(jī)寡聚物堿基序列的部分可能的組合。
在一些情況下,隨機(jī)寡聚物的堿基以相等的比例呈現(xiàn)核酸堿基的無偏倚的隨機(jī)分布。在一些情況下,每個堿基在給定位置出現(xiàn)或在隨機(jī)寡聚物群體中總計出現(xiàn)的可能性相同。然而,在其他情況下,為了增加退火和隨后第一鏈合成的效率,合成了群體,使其包含具有某些堿基或堿基對的偏倚呈現(xiàn)的隨機(jī)寡聚物(如隨機(jī)8聚物)的偏倚。例如,據(jù)觀察,人類基因組具有約40%的GC百分比,而不是從真正隨機(jī)堿基豐度預(yù)期的50%GC組成。參見例如圖10。在一些情況下,隨機(jī)寡聚物分布是偏倚的,使得第一鏈合成文庫中隨機(jī)寡聚物序列(如8聚物序列)的總體分布反映出偏斜的靶標(biāo)平均值如靶基因組、靶基因座、靶基因家族、靶基因組元件(例如外顯子、內(nèi)含子或啟動子序列)的平均值的總體分布,或在一些實施方案中,匹配作為整體的人類基因組。
使第一鏈寡核苷酸文庫或代表第一鏈寡核苷酸文庫的90%、80%、70%、60%、50%、40%、30%、20%、10%或少于10%的寡核苷酸文庫子集與包含核酸如脫氧核糖核酸或核糖核酸的樣品接觸。核酸如DNA或RNA可以以寬范圍的量提供。在一些情況下,基因組DNA樣品以等于或約為諸如1ng、2ng、3ng、4ng、5ng、6ng、7ng、8ng、9ng、10ng、11ng、12ng、13ng、14ng、15ng、16ng、17ng、18ng、19ng、20ng、21ng、22ng、23ng、24ng、25ng、26ng、27ng、28ng、29ng、30ng、31ng、32ng、33ng、34ng、35ng、36ng、37ng、38ng、39ng、40ng、41ng、42ng、43ng、44ng、45ng、46ng、47ng、48ng、49ng、50ng、51ng、52ng、53ng、54ng、55ng、56ng、57ng、58ng、59ng、60ng、61ng、62ng、63ng、64ng、65ng、66ng、67ng、68ng、69ng、70ng、71ng、72ng、73ng、74ng、75ng、76ng、77ng、78ng、79ng、80ng、81ng、82ng、83ng、84ng、85ng、86ng、87ng、88ng、89ng、90ng、91ng、92ng、93ng、94ng、95ng、96ng、97ng、98ng、99ng或100ng的量,或在由上述列表限定的范圍之外的數(shù)值的量提供。從下文可以看出,下游熱循環(huán)的數(shù)目將隨著起始模板量的增加而減少。在一些情況下,RNA樣品由從少至1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100個細(xì)胞或多于100個細(xì)胞的細(xì)胞群體提取的RNA提供。
還向混合物中添加包含與DNA聚合酶活性一致的試劑的聚合酶緩沖液。多種聚合酶符合本公開內(nèi)容。在一些情況下,示例性的聚合酶具有鏈置換活性、ddNTP摻入活性,并且能夠摻入生物素標(biāo)記的核苷酸如生物素標(biāo)記的ddNTP。示例性的聚合酶是測序酶(Sequenase),而示例性的逆轉(zhuǎn)錄酶是HIV逆轉(zhuǎn)錄酶。
還向混合物中添加核苷酸群體,如包含dATP、dTTP、dCTP和dGTP的群體,以及在一些情況下還包含ddNTP如ddATP、ddTTP、ddCTP和ddGTP的群體。在一些情況下,僅向dNTP群體中添加單種ddNTP,如單獨的ddATP、單獨的ddTTP、單獨的ddCTP和單獨的ddGTP。在一些情況下,添加了ddNTP對,如ddATP和ddTTP,或ddCTP和ddGTP。
在一些情況下,添加至組合物的ddNTP群體如ddATP、ddTTP、ddCTP和ddGTP包含至少一種生物素標(biāo)記的ddNTP,如生物素標(biāo)記的ddATP、生物素標(biāo)記的ddTTP、生物素標(biāo)記的ddCTP和生物素標(biāo)記的ddGTP。
dNTP/ddNTP比例的范圍符合本公開內(nèi)容。99.9%/0.1%、99.5%/0.5%、99%/1%、98%/2%的比例和替代的比例符合本公開內(nèi)容。在一些情況下,選擇了99%脫氧NTP與1%雙脫氧NTP的相對比例。
在一些情況下通過加熱至解鏈溫度以上,如95℃、96℃、97℃、98℃或99℃或更高的溫度,使混合物變性。在許多情況下,低于100℃的變性溫度是示例性的。
然后將混合物例如在冰上冷卻30秒、1分鐘、2分鐘或多于2分鐘,或在4℃下冷卻30秒、1分鐘、2分鐘或多于2分鐘,或在足以允許第一鏈合成寡核苷酸與核酸樣品如基因組DNA樣品或RNA樣品之間反向互補堿基配對的備選冷卻溫度下冷卻。在一些情況下,第一鏈合成寡核苷酸中的一些或全部在其隨機(jī)寡核苷酸(如隨機(jī)8聚物)與其各自結(jié)合的核酸樣品序列如基因組DNA序列、cDNA序列或RNA序列之間顯示出完全的反向互補性。在一些情況下,一些寡核苷酸結(jié)合與寡核苷酸的隨機(jī)寡聚物(如隨機(jī)8聚物)不完全反向互補的基因組區(qū)。在一些情況下,不具有完全反向互補性的堿基配對對隨機(jī)文庫制備過程中的后續(xù)步驟無害。
在備選的實施方案中,在任選的變性步驟之前或之后添加聚合酶。將混合物加熱至與聚合酶活性如最佳聚合酶活性一致的溫度(例如,20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃,或在一些情況下,比該范圍中的數(shù)值更高或更低的數(shù)值),并溫育足以合成第一鏈文庫的一段時間,如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45分鐘或超過45分鐘。在一些情況下,在該溫育期間的時間點如每10分鐘對反應(yīng)進(jìn)行攪拌。
延伸從第一鏈合成寡核苷酸的3’OH進(jìn)行,導(dǎo)致在每個退火寡核苷酸的退火位點處與模板反向互補的序列被摻入每個退火寡核苷酸的3’端。延伸持續(xù)直到摻入生物素標(biāo)記的ddNTP分子,在該時間點延伸終止。如果dNTP和生物素-ddNTP以99%/1%的比例提供,則發(fā)生延伸的第一鏈寡核苷酸的50%在摻入生物素-ddNTP分子之前顯示出超過50個堿基的延伸。在其他參數(shù)未同時改變的一些情況下,ddNTP比例降低,代表至少50%延伸產(chǎn)物的長度的N50增加。
在溫育期完成時,例如通過在98℃下熱滅活五分鐘來終止反應(yīng)?;蛘?,可在另一個溫度下,或通過添加螯合劑或dNTP酶來實現(xiàn)滅活。
如上文提到的,在一些情況下,摻入的ddNTP例如被生物素標(biāo)簽標(biāo)記。在一些情況下,考慮了生物素的替代物,如二硝基苯基??膳cddNTP結(jié)合并通過至少一種核酸聚合酶摻入至新生核酸分子中的任何親和標(biāo)簽都符合本公開內(nèi)容。類似地,可經(jīng)由例如ddNTP結(jié)合部分遞送至核酸分子的ddNTP端的任何親和標(biāo)簽也都符合本公開內(nèi)容。在一些情況下,該親和標(biāo)簽是生物素-ddNTP。
在一些情況下,提供了與本文提供的標(biāo)記的第一鏈核酸分子結(jié)合的標(biāo)簽結(jié)合劑,如在標(biāo)簽生物素的情況下的親和素或鏈霉親和素。在特定情況下,將鏈霉親和素與磁珠結(jié)合,使得可通過放置在磁場中(如在磁性支架(stand)上)來分離鏈霉親和素和任何結(jié)合配偶體。
使用標(biāo)簽結(jié)合劑例如針對生物素標(biāo)記的ddNTP核酸末端的鏈霉親和素來分離標(biāo)記的第一鏈文庫。在一些情況下,將珠子/樣品混合物在22C下溫育并以10分鐘的間隔攪拌30分鐘。然后將混合物放置在磁性支架上,在珠子沉降后去除上清液。對該管進(jìn)行攪拌并使其在磁性支架上靜置。用200uL TE緩沖液洗滌珠子三次。替代的標(biāo)簽結(jié)合劑組合和替代的方案符合本文公開內(nèi)容。
在一些情況下,在不依賴于標(biāo)記的情況下,例如通過大小選擇如凝膠電泳以及隨后對所需大小的核酸的純化來純化第一鏈分子。在一些情況下,分離了大小范圍為10-100、10-150、10-200、1-300、10-350、10-400、10-500、10-600、10-700、10-800、10-900或10-1000個堿基的片段。
將如上純化的第一鏈文庫模板重新引入至反應(yīng)緩沖液中。例如,在一些情況下,將模板與其純化標(biāo)簽分離,從鏈霉親和素標(biāo)簽上洗脫,并重懸于包含dNTP的核酸合成緩沖液中。在一些情況下,模板保持與其純化標(biāo)簽附接,洗滌所述模板,并將其重懸于反應(yīng)緩沖液中。在一些情況下,包括在第一鏈文庫生成后的NaOH洗滌,以去除遺留序列并減少第一鏈文庫產(chǎn)物的自折疊。
如下合成文庫第二鏈分子。添加包含第二鏈引物群體的第二探針文庫。在一些情況下,每個第二鏈引物包含在隨機(jī)寡聚物序列如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30聚物或更大寡聚物(例如8聚物)的5’側(cè)的B-銜接子序列,該B-銜接子序列之后為發(fā)生模板引導(dǎo)的延伸的3’OH。在一些情況下,該序列銜接子被配置為包含可變標(biāo)識符序列。在替代情況下,該序列銜接子是不變的。在一些情況下,使用序列銜接子作為引物結(jié)合位點進(jìn)行測序銜接子如B銜接子的后續(xù)添加,例如通過經(jīng)由擴(kuò)增的標(biāo)準(zhǔn)引物引導(dǎo)的序列添加。
在一些情況下,隨后合成了寡核苷酸群體,使得給定隨機(jī)寡聚物堿基序列(如隨機(jī)8聚物)的所有可能的組合都在第二鏈寡核苷酸群體中呈現(xiàn)。在其他情況下,特別是當(dāng)選擇長隨機(jī)寡聚物時,但偶爾也在較小寡聚物的情況下,存在給定隨機(jī)寡聚物堿基序列的部分可能的組合。
在一些情況下,隨機(jī)寡聚物的堿基以相等的比例呈現(xiàn)核酸堿基的無偏倚的隨機(jī)分布。在一些情況下,每個堿基在給定位置出現(xiàn)或在隨機(jī)寡聚物群體中總計出現(xiàn)的可能性相同。然而,在其他情況下,為了增加退火和隨后第二鏈合成的效率,合成了群體,使其包含具有某些堿基或堿基對的偏倚呈現(xiàn)的隨機(jī)寡聚物(如隨機(jī)8聚物)的偏倚。例如,據(jù)觀察,人類基因組具有約40%的GC百分比,而不是從真正隨機(jī)堿基豐度預(yù)期的50%GC組成。參見例如圖10。在一些情況下,隨機(jī)寡聚物分布是偏倚的,使得第二鏈合成文庫中隨機(jī)寡聚物序列(如8聚物序列)的總體分布反映出偏斜的靶標(biāo)平均如靶基因組、靶基因座、靶基因家族、靶基因組元件(例如外顯子、內(nèi)含子或啟動子序列)的平均的總體分布,或在一些實施方案中,匹配作為整體的人類基因組。
將混合物加熱至98℃持續(xù)3分鐘。該混合物在冰上冷卻2分鐘,以允許第二鏈合成寡核苷酸與第一鏈文庫之間的反向互補堿基配對。觀察到一些寡核苷酸在其隨機(jī)8聚物與各自結(jié)合的第一鏈序列之間顯示出完全的反向互補性。還觀察到一些寡核苷酸結(jié)合與寡核苷酸的隨機(jī)8聚物不完全反向互補的基因組區(qū)。不具有完全反向互補性的堿基配對對隨機(jī)文庫制備過程中的后續(xù)步驟無害。
將組合物加熱至室溫并使之持續(xù)30分鐘。對于輸入DNA量更低的樣品,可以延長該時間段。
觀察到從第一鏈合成寡核苷酸的3’OH的延伸,導(dǎo)致在每個退火寡核苷酸的退火位點處與模板反向互補的序列被摻入每個退火寡核苷酸的3’端。延伸持續(xù)直到到達(dá)第一鏈模板的5’端。觀察到遠(yuǎn)離第一鏈模板的3’端退火的第二鏈寡核苷酸經(jīng)歷從其3’端的延伸,但通過由進(jìn)一步向第一鏈模板的3’端退火的寡核苷酸引發(fā)的延伸反應(yīng)從第一鏈被置換。
因此,合成了雙鏈文庫分子,其包含兩條不同的鏈:1)第一鏈,其從5’端開始,具有A銜接子、隨機(jī)8聚物序列和1-100個核苷酸數(shù)量級的靶序列,在生物素標(biāo)記的ddNTP處終止;和2)第二鏈,其從5’端開始,具有B銜接子、第二隨機(jī)8聚物序列、來源于樣品的靶序列、與第一鏈的隨機(jī)8聚物反向互補的第一隨機(jī)8聚物序列以及與第一A銜接子反向互補的序列。
在一些情況下,使用磁性鏈霉親和素珠子分離生物素標(biāo)記的雙鏈文庫分子。例如,在結(jié)合緩沖液中提供磁性鏈霉親和素珠子,混合,并使其在磁性支架上靜置。然后可將結(jié)合緩沖液替換成25uL、50uL、75uL、100uL、125uL、150uL、175uL、200uL、225uL、250uL、275uL、300uL、350uL、400uL、450uL或500uL體積并重復(fù)該過程。然后吸出上清液,并可將珠子重懸在5uL、10uL、12uL、14uL、16uL、18uL、20uL、22uL、24uL、26uL、28uL、30uL、31uL、32uL、33uL、34uL、35uL、36uL、37uL、38uL、39uL、40uL、41uL、42uL、43uL、44uL、45uL、46uL、47uL、48uL、49uL 50uL、52uL、54uL、56uL、58uL或60uL的結(jié)合緩沖液中。
在一些情況下,然后將生物素標(biāo)記的雙鏈文庫分子添加至重懸的珠子。在一些情況下,將珠子/樣品混合物在22℃下溫育并以10分鐘的間隔攪拌30分鐘。然后將混合物放置在磁性支架上,并在珠子沉降后去除上清液。對該管進(jìn)行攪拌并使其在磁性支架上靜置。用200uL TE緩沖液洗滌珠子三次。在一些情況下,這產(chǎn)生鏈霉親和素純化的雙鏈文庫分子的群體,該雙鏈文庫分子包含兩條不同的鏈:1)第一鏈,其從5’端開始,具有A銜接子、隨機(jī)寡聚物(如8聚物)序列和1-100個核苷酸數(shù)量級的靶序列、在生物素標(biāo)記的ddNTP處終止;和2)第二鏈,其從5’端開始,具有B銜接子、第二隨機(jī)寡聚物(如8聚物)序列、來源于樣品的靶序列、與第一鏈的隨機(jī)寡聚物(如8聚物)反向互補的第一隨機(jī)寡聚物(如8聚物)序列以及與第一A銜接子反向互補的序列。替代的標(biāo)簽結(jié)合劑組合和替代的方案符合本文公開內(nèi)容。
然后,例如,將與雙鏈文庫分子群體結(jié)合的磁性鏈霉親和素珠子重懸在一定量的無核酸酶的水中。該量可以是10uL、12uL、14uL、16uL、18uL、20uL、22uL、24uL、26uL、28uL、30uL、32uL、34uL、36uL、37uL、38uL、39uL、40uL、41uL、42uL、43uL、44uL、45uL、46uL、47uL、48uL、50uL、52uL、54uL、56uL、58uL或60uL無核酸酶的水。向重懸的珠子中添加一定量的銜接子A引物和一定量的銜接子B引物。銜接子A引物的量與銜接子B引物的量可以是相同或不同的。銜接子A引物的量和銜接子B引物的量可獨立地為1uL、2uL、3uL、4uL、5uL、6uL、7uL、8uL、9uL或10uL。在一些情況下,銜接子A引物在引物的3’端包含與雙鏈模板的第一銜接子相同的序列,并進(jìn)一步包含如本文所述的合成測序反應(yīng)所必需的序列。在其他情況下,銜接子A引物在引物的3’端具有與雙鏈模板的第一銜接子的序列的一個堿基對錯配、兩個堿基對錯配、三個堿基對錯配、四個堿基對錯配、五個堿基對錯配、六個堿基對錯配、七個堿基對錯配、八個堿基對錯配、九個堿基對錯配或十個堿基對錯配。在一些情況下,銜接子B引物在引物的3’端包含與雙鏈模板的第二鏈的第二銜接子相同的序列,并進(jìn)一步包含如本文所述的合成測序反應(yīng)所必需的序列。在其他情況下,銜接子B引物在引物的3’端具有與雙鏈模板的第二鏈的第二銜接子的序列的一個堿基對錯配、兩個堿基對錯配、三個堿基對錯配、四個堿基對錯配、五個堿基對錯配、六個堿基對錯配、七個堿基對錯配、八個堿基對錯配、九個堿基對錯配或十個堿基對錯配。
將2x PCR主混合物以10uL、15uL、20uL、25uL、30uL、35uL、40uL、45uL、50uL、55uL、60uL、65uL、70uL、75uL、80uL、85uL、90uL、95uL或100uL的量添加至珠子和引物的混合物中。在一些情況下,然后使該混合物經(jīng)歷如下的熱循環(huán):約98℃持續(xù)約2分鐘;接著為約98℃持續(xù)約20秒、約60℃持續(xù)約30秒以及約72℃持續(xù)約30秒的約6個循環(huán);在所述約6個循環(huán)后,將反應(yīng)保持在約72℃持續(xù)約5分鐘,隨后在約4℃下儲存。本公開內(nèi)容設(shè)想熱循環(huán)條件的優(yōu)化,如對于具有較低模板輸入的樣品增加PCR循環(huán)的次數(shù)。在一些情況下,在沒有PCR的情況下進(jìn)行擴(kuò)增。在一個實例中,模板核酸與含有全長測序銜接子的引物一起使用,并且采用隨后的大小選擇進(jìn)行第一鏈合成和第二鏈合成。這可能需要或不需要使用發(fā)夾來避免二聚化。
在一些情況下,觀察到由此生成的測序文庫具有以下特征。每個雙鏈分子按順序包含足以進(jìn)行合成測序的銜接子A序列、第一隨機(jī)寡聚物序列(如8聚物)、未知長度但可能在1-100個堿基內(nèi)的靶區(qū)域、第二隨機(jī)寡聚物(如8聚物)序列以及足以進(jìn)行如本文公開的合成測序的B銜接子序列。
在一些情況下,觀察到文庫成分具有以下特征。每個分子均包含與文庫中其他分子的第一分子標(biāo)簽(如8聚物)相獨立的第一分子標(biāo)簽(如8聚物)。每個分子均包含與原始樣品的序列對應(yīng)的靶序列。每個給定分子的靶序列的起點、靶序列的長度和靶序列的終點均與文庫中每個其他分子的起點、長度和終點相獨立。每個分子均包含與文庫中其他分子的第二分子標(biāo)簽(如8聚物)相獨立的第二分子標(biāo)簽(如8聚物)。
在一些情況下,觀察到文庫總體上具有以下特征?;旧纤械臉悠沸蛄性谖膸熘杏啥鄠€重疊分子表示?;旧纤械奈膸旆肿?罕見事件除外)在通過熱循環(huán)最終添加A和B銜接子之前都是獨特的,就其第一分子標(biāo)簽(如8聚物)序列、靶序列起點、靶序列、靶序列長度、靶序列終點和第二分子標(biāo)簽(如8聚物)序列而言彼此不同。
使此處生成的序列文庫經(jīng)歷與其A銜接和B銜接子相容的合成測序,并評價測序結(jié)果。獨立地,準(zhǔn)備第二份原始樣品,以便采用標(biāo)準(zhǔn)的基于PCR的文庫標(biāo)記進(jìn)行測序,其包括對未標(biāo)記的模板的基于PCR的大量擴(kuò)增。對文庫進(jìn)行測序并將結(jié)果進(jìn)行比較。
觀察到,在傳統(tǒng)序列文庫測序結(jié)果中鑒定了與MEI對應(yīng)的序列。觀察發(fā)現(xiàn)MEI單體單元與多個插入相鄰邊界序列相鄰,提示其以多個拷貝存在于樣品中。
由于序列讀序在每個文庫成員中被5’標(biāo)簽、3’標(biāo)簽以及樣品序列的獨特起點、終點和長度獨特地標(biāo)記,因此序列讀序可容易地被分成與獨特文庫分子對應(yīng)的組。通過對序列讀序群體中呈現(xiàn)的獨特文庫分子的數(shù)目(而不是序列讀序的數(shù)目)進(jìn)行計數(shù),可以獲得具有經(jīng)歷測序的核酸樣品中的給定MEI插入相鄰序列的分子的絕對或相對數(shù)目的定量量度。
可使用備選的定量方法,并且本文公開的方法不限于單一的定量方法。例如,在一些情況下使用定量PCR來確定一個或多個樣品中的MEI插入相鄰序列的水平。
通常,在具有用指定波長的光束照射每個樣品并檢測由激發(fā)的熒光團(tuán)發(fā)射的熒光的能力的熱循環(huán)儀中進(jìn)行定量PCR。該熱循環(huán)儀還能夠快速加熱和冷卻樣品,由此利用核酸和DNA聚合酶的物理化學(xué)性質(zhì)。PCR過程通常由重復(fù)25-40次的一系列溫度變化組成。這些循環(huán)通常由三個階段組成:第一階段,在約95℃下,使雙鏈核酸解鏈;第二階段,在約50-60℃的溫度下,使引物與DNA模板結(jié)合;第三階段,在68-72℃之間,促進(jìn)由DNA聚合酶進(jìn)行的聚合。由于片段大小較小,在這一類型的PCR中通常省略最后一步,這是因為該酶能夠在對齊(alignment)階段與變性階段之間的變化期間增加其數(shù)目。此外,一些熱循環(huán)儀向每個循環(huán)增加僅持續(xù)數(shù)秒、溫度為例如80℃的另一個短的溫度階段,以便降低在使用非特異性染料時由引物二聚體的存在而導(dǎo)致的噪聲。每個循環(huán)所采用的溫度和時間安排依賴于很多參數(shù),如:用于合成DNA的酶、反應(yīng)中二價離子和dNTP的濃度以及引物的鍵合溫度。
在定量PCR(qPCR)的情況下,DNA結(jié)合染料與雙鏈(ds)DNA在PCR中結(jié)合,導(dǎo)致該染料的熒光。PCR期間DNA產(chǎn)物的增加導(dǎo)致熒光強度的增加,并在每個循環(huán)進(jìn)行測量,從而允許DNA濃度被定量。定量PCR還可包含熒光報告探針,以僅檢測含有該探針序列的DNA,這增加了特異性并使得能夠甚至在非特異性DNA擴(kuò)增的存在下進(jìn)行定量。
使用qPCR的定量方法包括相對定量和絕對定量。絕對定量通過使用校準(zhǔn)曲線與DNA標(biāo)準(zhǔn)比較而給出靶DNA分子的確切數(shù)目。相對定量基于內(nèi)部參考基因來確定靶基因表達(dá)的倍數(shù)差異。將定量表示為被解釋為互補DNA(cDNA,由mRNA的逆轉(zhuǎn)錄生成)的mRNA的表達(dá)水平變化。
與終點PCR(常規(guī)PCR)不同,實時PCR允許通過測量熒光在擴(kuò)增過程中的任何時間點定量所需產(chǎn)物。常采用的通過定量PCR的DNA定量方法依賴于在對數(shù)尺度上將熒光對循環(huán)數(shù)作圖。將基于DNA的熒光的檢測閾值設(shè)置為稍高于背景。熒光超過該閾值的循環(huán)數(shù)被稱為閾值循環(huán)(Ct)或定量循環(huán)(Cq)。
商業(yè)定量PCR組合物、試劑盒和方法是可獲得的,并且其使用符合本文公開的、涉及MEI插入相鄰序列定量的一些方法。
本文公開的一些實施方案涉及隨時間監(jiān)測總體體細(xì)胞基因組健康。如本文公開的,總體基因組健康涉及由獨立MEI事件的豐度反映的體細(xì)胞基因組‘健康’狀態(tài),在一些情況下與插入位點無關(guān)。因此,在一些情況下,方法涉及MEI事件的總數(shù)的時間或空間測定。在一些情況下,由于每個插入事件傳達(dá)了對相關(guān)插入位點基因有害的風(fēng)險,因此MEI事件數(shù)目的增加表明‘總基因組健康’的降低。在一些情況下,MEI事件的總數(shù)與癌癥、衰老、細(xì)胞活性喪失或細(xì)胞活性降低的風(fēng)險相關(guān)。
例如使用如本文或其他地方公開的定量全基因組測序確定總MEI事件??商娲鼗蚪M合地,使用例如本領(lǐng)域已知的Q-PCR或熒光原位雜交法,使用對單個可動因子具有特異性的引物、探針或引物和探針,或使用引物組、探針組或引物組和探針組來測定單獨的可動因子,使得多個可動因子(至多且包括已知可動因子的10%、20%、30%、40%、50%、60%、70%、80%、90%、95%,或約100%,或100%)就其在第一時間點或第一組織中的豐度得到定量。
在一些情況下,使用該定量作為基因組健康的基線,尤其當(dāng)樣品取自基因組健康預(yù)期較高(如在青年或成年早期)時的組織或第一時間段時。
第二樣品在第二時間點,如在第一時間點后不到1年、1年、2年、3年、4年、5年、10年或超過10年的時間點取得。測量總MEI水平,并將其與初始時間點的水平或客觀上與患者的基因組健康總體相關(guān)的水平進(jìn)行比較。
如果相比于第一樣品或之前的樣品,第二樣品中的MEI事件總數(shù)在豐度上升高10%、20%、30%、40%、50%、70%、100%、2倍、2.5倍、3倍、3.5倍、4倍、5倍或大于5倍,則將該樣品中的核酸確定為‘衰老的’或基因組健康不佳。多個治療選擇可用于被確定為體細(xì)胞核酸樣品的基因組健康不佳的個體。在一些情況下,選擇卡路里限制。在一些情況下,推薦NSAID作為治療方案的一部分。NSAID的部分列表包括以下藥物:阿司匹林、塞來昔布(Celebrex)、雙氯芬酸(Cambia、Cataflam、Voltaren-XR、Zipsor、Zorvolex)、二氟尼柳、依托度酸、布洛芬(Motrin,Advil)、吲哚美辛(Indocin)、酮洛芬、酮咯酸、萘丁美酮、萘普生(Aleve、Anaprox、Naprelan、Naprosyn)、奧沙普秦(Daypro)、吡羅昔康(Feldene)、雙水楊酸酯、舒林酸和妥美汀。其他NSAID也予以考慮并且符合本文公開內(nèi)容。
可動因子活性與逆轉(zhuǎn)錄轉(zhuǎn)座酶(retrotransposase)活性有關(guān),并且在一些情況下與抑制性基因組甲基化的缺陷有關(guān)。因此,在一些情況下,治療方案包括施用逆轉(zhuǎn)錄酶抑制劑。在一些情況下,治療包括施用逆轉(zhuǎn)錄轉(zhuǎn)座酶抑制劑。在一些情況下,治療包括施用逆轉(zhuǎn)錄病毒抑制劑。可基于從基因組分析獲得的信息施用治療方法。針對遺傳異常的治療方案是本領(lǐng)域已知的。為了治療逆轉(zhuǎn)錄病毒病癥而施用的示例性抑制劑包括但不限于核苷類似物、蛋白酶抑制劑、非核苷反轉(zhuǎn)錄酶抑制劑(NNRTI)、核苷酸慢轉(zhuǎn)錄酶抑制劑(NtRTI)、混合抑制劑或進(jìn)入抑制劑以及整合酶抑制劑。示例性的NRTI包括齊多夫定(Retrovir)、拉米夫定(Epivir)、地達(dá)諾新(Videx)、扎西他濱(Hivid)、司他夫定(Zerit)和阿巴卡韋(Ziagen)。示例性的蛋白酶抑制劑包括沙奎那韋(Invirase)、利托那韋(Norvir)、茚地那韋(Crixivan)、奈非那韋(Viracept)、安普那韋(Agenerase)、洛匹那韋、阿扎那韋(Reyataz)和替拉那韋(Aptivus)。示例性的非核苷反轉(zhuǎn)錄酶抑制劑(NNRTI)包括奈韋拉平(Viramune)、地拉韋啶(Rescriptor)、依非韋倫(Sustiva)和依曲韋林(Intelence)。示例性的NtRTI包括替諾福韋(Viread)。示例性的混合抑制劑或進(jìn)入抑制劑包括馬拉維若(Maraviroc)和恩夫韋地。示例性的整合酶抑制劑包括雷特格韋(Isentress)。可替代地或與以上列出的治療的任意組合聯(lián)合地,向個體施用甲基轉(zhuǎn)移酶或促進(jìn)DNA甲基化的組合物。用于治療HBV的示例性抑制劑包括但不限于干擾素α(IFN-α)、PEG-IFN-α、恩替卡韋和替諾福韋。
在一些情況下,隨時間監(jiān)測治療對MEI豐度增加的影響。例如,在治療方案如本文公開的治療方案開始后的時間點(如第一時間點后的1個月、2個月、3個月、4個月、5個月、6個月、7個月、8個月、9個月、10個月、11個月、不到1年、1年、2年、3年、4年、5年、10年或超過10年的時間點)取得第三樣品。測量總MEI水平,并將其與初始時間點的水平、或客觀上與患者基因組健康總體相關(guān)的水平、或在治療方案開始前確定的水平進(jìn)行比較,或者與之前的MEI豐度測量值進(jìn)行比較。繼續(xù)進(jìn)行導(dǎo)致MEI豐度增加的速率降低(直到并且包括使MEI總量穩(wěn)定在插入前水平)的治療方案,在一些情況下伴隨著對總MEI水平的持續(xù)監(jiān)測。替換、補充不影響總MEI水平增加的治療方案,或修改或增加劑量方案,使得MEI水平增加可能受到積極影響。
在一些情況下,該測定與顯示出隨時間特定增加的特定MEI插入相鄰位點的監(jiān)測,或與MEI相鄰邊界的監(jiān)測組合進(jìn)行,以鑒定涉及已知或疑似癌基因(如本文列出的癌基因)或與癌基因活性有關(guān)的基因組重排(如本文列出的基因組重排)或這二者的事件,使得特別被懷疑與目前或未來癌癥或腫瘤活性有關(guān)的MEI插入事件得到早期鑒定,并且例如使用本文公開的組合物和方法來應(yīng)對。
為了細(xì)胞健康,一個或多個試驗在早期進(jìn)行并監(jiān)測血液中無細(xì)胞DNA的插入事件。相同插入事件的增加代表該事件的克隆擴(kuò)充,并且可將其定量并與疾病進(jìn)展相關(guān)聯(lián)。該試驗可與針對MEI插入的組織特異性試驗、種系變體分析(包括外顯子組或全基因組測序)或甲基化或定量RNA分析組合使用,以確定細(xì)胞健康或疾病進(jìn)展。
此外,本公開內(nèi)容的一些實施方案涉及具有MEI插入邊界的組織的可視化,該MEI插入邊界例如是與過度增殖(如癌癥或腫瘤細(xì)胞群體中的過度增殖)有關(guān)的MEI插入相關(guān)邊界。在一些情況下,使用具有與包含MEI插入相鄰連續(xù)序列的核酸序列特異性退火的核苷酸序列的寡核苷酸探針,使得在退火后,該探針對于例如分析癌性或腫瘤組織的成功切除的醫(yī)師而言是可檢測的。
在一些情況下,使用MEI插入邊界序列來開發(fā)直接將跨越MEI和插入相鄰序列的序列可視化的核酸靶向探針。本文設(shè)想了包含跨越MEI和插入相鄰邊界序列的核酸序列的多種組合物。在一些情況下,這樣的組合物的一個共同方面是,它們包含對跨越MEI邊緣序列和插入相鄰基因組序列二者的序列具有特異性并且長度不足以單獨靶向MEI序列或插入相鄰序列的核酸組分。
也就是說,本文在許多情況下設(shè)想和公開的組合物在不存在插入相鄰序列的情況下不與MEI結(jié)合,并且在不存在相鄰MEI的情況下不與插入相鄰序列結(jié)合;確切地說,本文公開的組合物包含與包含MEI和相鄰基因組序列兩者的序列進(jìn)行特異性結(jié)合的核酸組分。因此,在用這樣的組合物治療后,只有與MEI插入相鄰序列對應(yīng)的核酸,例如本文公開的已經(jīng)在時間或空間測定(例如,如上文公開的)中被鑒定為明顯過度表示的核酸,才會被該組合物所可視化,而其他MEI和包含插入相鄰序列但不含MEI序列的未插入的等位基因不被該組合物結(jié)合。在一些情況下,該組合物的核酸組分包含MEI序列的3、4、5、6、7、8、9、10個或超過10個堿基,和插入相鄰序列的3、4、5、6、7、8、9、10個或超過10個堿基,使得該組合物與單獨的MEI之間或者該組合物與單獨的插入相鄰序列之間的結(jié)合能不足以保證結(jié)合。
在一些實施方案中,與核酸結(jié)合的還有熒光團(tuán)或其他可視化部分。在一些情況下,只有在核酸與底物結(jié)合時該部分才被可視化。例如,在一些情況下,探針包含熒光團(tuán)和猝滅劑,使得在不存在與靶MEI插入相鄰位點的結(jié)合時,該猝滅部分阻止熒光,而在存在與靶MEI插入相鄰位點的結(jié)合時,該猝滅劑在空間上從熒光團(tuán)上去除,使得該熒光團(tuán)能夠在被激發(fā)劑激發(fā)時發(fā)射。
在一些情況下,使用探針來分析癌性組織的完全切除。將組織切除并與探針接觸。通過例如在經(jīng)受具有與熒光團(tuán)的激發(fā)譜匹配的電磁能的波長時在切除的組織中存在熒光來確認(rèn)癌性組織。通過在經(jīng)受具有與熒光團(tuán)的激發(fā)譜匹配的電磁能的波長時不存在熒光來鑒定非癌性組織。多種激發(fā)裝置是本領(lǐng)域已知的,如在手術(shù)室環(huán)境中容易實用的手持激發(fā)裝置。
本領(lǐng)域已知,熒光團(tuán)和其他染料的化學(xué)反應(yīng)性衍生物可用作標(biāo)記分子的報告分子。示例性的DNA結(jié)合報告分子包括但不限于:SeTau-380-NHS、羥基香豆素、氨基香豆素、甲氧基香豆素、瀑布藍(lán)(Cascade Blue)、太平洋藍(lán)(Pacific Blue)、太平洋橙(Pacific Orange)、SeTau-405-NHS、SeTau-405-馬來酰亞胺、螢光黃、SeTau-425-NHS、NBD、R-藻紅蛋白(PE)、Seta-PerCP-680、PE-Cy5綴合物、PE-Cy7綴合物、Red 613、PerCP、TruRed、FluorX、熒光素、BODIPY-FL、Cy2、Cy3、Seta-555-NHS、Seta-555-疊氮化物、Seta-555-DBCO、Seta-R-PE-670、Cy3B、Seta-580-NHS、Cy3.5、SeTau-647-NHS、Cy5、Seta-APC-780、Cy5.5、Seta-680-NHS、Cy7、TRITC、X-羅丹明、麗絲胺羅丹明B、德克薩斯紅(Texas Red)、別藻藍(lán)蛋白(APC)、APC-Cy7綴合物、Seta-780-NHS。
熒光團(tuán)和其他報告分子可用來與結(jié)合DNA的探針結(jié)合。本領(lǐng)域已知,這樣的探針被設(shè)計用于增加定量PCR的特異性。例如,TaqMan探針原理依賴于Taq聚合酶的5′至3′核酸外切酶活性,以在與互補靶序列雜交和基于熒光團(tuán)的檢測過程中切割雙標(biāo)記的探針。所得到的熒光信號允許在PCR的指數(shù)階段定量測量產(chǎn)物的積累。
TaqMan探針由與寡核苷酸探針的5’-端共價附接的熒光團(tuán)和在3’-端的猝滅劑組成。具有不同化學(xué)性質(zhì)的其他探針是本領(lǐng)域已知的,并且包括但不限于6-羧基熒光素或四氯熒光素,和猝滅劑(例如,四甲基羅丹明)。經(jīng)由FRET(熒光共振能量轉(zhuǎn)移),猝滅劑分子猝滅熒光團(tuán)在被熱循環(huán)儀的光源激發(fā)時發(fā)射的熒光。只要熒光團(tuán)和猝滅劑是接近的,猝滅就會抑制熒光信號。
在一些情況下,所述探針包含引導(dǎo)探針跨細(xì)胞膜、跨核膜或跨細(xì)胞膜和核膜二者易位的部分,使得便于接近組織核DNA。
此外,本文公開的一些實施方案涉及通過將樣品的MEI插入相鄰序列的譜與第二樣品的譜或已知參考譜進(jìn)行比較來鑒定生物樣品如人類樣品、其他動物樣品、植物樣品或生物危害性樣品。使待確定其譜的樣品經(jīng)歷例如通過全基因組測序或其他合適方法的MEI插入相鄰序列確定過程,并確定其單個MEI插入相鄰譜。在一些情況下,開發(fā)了引物組、探針組或引物組及探針組,使得在其他樣品中檢測樣品的MEI插入相鄰序列譜而無需依賴于全基因組測序。
獲得了與已開發(fā)出MEI插入相鄰譜的樣品具有相同物種和表型的未知來源的樣品。在一些情況下,該樣品是作物植物如轉(zhuǎn)基因作物植物的樣品,并且存在關(guān)于該作物植物種系的來源的某一問題。獲得了相同物種并且具有相同轉(zhuǎn)基因抗性的市售轉(zhuǎn)基因植物的譜,并將該譜與未知來源的樣品的MEI插入相鄰譜進(jìn)行比較。通過將樣品的MEI插入相鄰序列與參考進(jìn)行比較,確定樣品和參考是否來自最近共同的原種(stock)。
在備選的實施方案中,使用MEI插入相鄰譜來確定例如法醫(yī)樣品或者生物危害性材料如炭疽、鼠疫耶爾森氏菌(Yersinia pestris)、耐甲氧西林金黃色葡萄球菌(MRSA)或其他可武器化的生物材料的來源。
在一些實施方案中,將第二核酸樣品鑒定為不同于第一或參考核酸樣品包括確定所述第二核酸樣品是否缺少該第一核酸樣品中存在的MEI邊界序列。
在一些實施方案中,將所述第二核酸樣品鑒定為不同于所述第一核酸樣品包括確定所述第二核酸樣品是否包含在所述第一核酸樣品中不存在的MEI邊界序列。
在備選的實施方案中,通過靶向測序或通過全基因組測序或二者確定邊界序列。在一些情況下,使樣品接觸探針如上文討論的探針,或探針組,并且在一些情況下通過在與探針分子接觸后,單獨地、連續(xù)地或組合地評價探針激發(fā)時樣品的熒光來實現(xiàn)樣品鑒定。
盡管本文中已經(jīng)示出并描述了本發(fā)明的優(yōu)選實施方案,但對于本領(lǐng)域技術(shù)人員顯而易見的是,這些實施方案僅以示例的方式提供。本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的情況下現(xiàn)將想到多種變化、改變和替代。應(yīng)當(dāng)理解,本文中所述的本發(fā)明實施方案的各種替代方案可用于實施本發(fā)明。目的在于以下述權(quán)利要求限定本發(fā)明的范圍,并由此涵蓋這些權(quán)利要求范圍內(nèi)的方法和結(jié)構(gòu)及其等同項。
實施例
實施例1.時間MEI監(jiān)測。對來自個體的核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)一次的頻率出現(xiàn)的MEI插入位點,表明產(chǎn)生MEI插入的事件很可能發(fā)生在個體的先祖種系中而不是個體的體細(xì)胞中。
鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的體細(xì)胞中發(fā)生。檢查MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
隨時間監(jiān)測MEI插入位點豐度。兩年后,來自實施例1的個體的核酸樣品從該個體的血液中取出。分析來自該個體的血液的核酸。
鑒定了MEI插入位點。觀察到第一MEI插入位點以與先前全基因組測序工作中觀察到的頻率相當(dāng)?shù)念l率出現(xiàn)。得出以下結(jié)論:MEI插入邊界本身與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷不相關(guān)。
觀察到第二MEI插入位點出現(xiàn)的頻率是先前全基因組測序工作中觀察到的頻率的10倍。得出以下結(jié)論:MEI插入邊界與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷相關(guān)。對該個體進(jìn)行進(jìn)一步的觀察,以尋找癌癥或其他欠調(diào)節(jié)的細(xì)胞增殖缺陷,從中可以獲得DNA以確定腫瘤或其他細(xì)胞缺陷是否與MEI插入邊界對應(yīng)。
鑒定了假定癌性組織。對來自假定癌性組織的核酸樣品進(jìn)行全基因組定量測序。發(fā)現(xiàn)第二MEI插入位點出現(xiàn)的頻率是原始全基因組MEI調(diào)查中的頻率的100倍。
實施例2.時間MEI監(jiān)測。來自實施例1的個體的核酸樣品從該個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。
將假定癌性腫瘤組織從該個體切除。按照該程序,來自實施例1的個體的第二核酸樣品從該個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率已回到原始全基因組MEI調(diào)查中的頻率。
實施例3.時間MEI監(jiān)測。在切除假定癌性腫瘤組織后兩年,從個體的血液中取出來自實施例1和2的個體的核酸樣品。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率保持在原始全基因組MEI調(diào)查中的頻率。
在切除假定癌性腫瘤組織后四年,來自實施例1和2的個體的核酸樣品從個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率是原始全基因組MEI調(diào)查中的頻率的5倍。
對該個體進(jìn)行進(jìn)一步的觀察,以尋找癌癥或其他欠調(diào)節(jié)的細(xì)胞增殖缺陷,從中可以獲得DNA以確定腫瘤或其他細(xì)胞缺陷是否與MEI插入邊界對應(yīng)。
鑒定了假定癌性組織。對來自假定癌性組織的核酸樣品進(jìn)行全基因組定量測序。發(fā)現(xiàn)第二MEI插入位點出現(xiàn)的頻率是原始全基因組MEI調(diào)查中的頻率的100倍。
將假定癌性腫瘤組織從該個體切除。按照該程序,從該個體的血液中取出核酸樣品。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率已回到原始全基因組MEI調(diào)查中的頻率。
實施例4.空間MEI監(jiān)測。對來自患有腫瘤的個體的表型健康組織的第一核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的體細(xì)胞中發(fā)生。檢查了MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
對來自患有腫瘤的個體的腫瘤組織的第二核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的腫瘤細(xì)胞中發(fā)生。檢查了MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
檢查了插入位點的相對和絕對豐度。觀察到一些MEI插入位點以與在來源于個體的表型健康組織的核酸樣品中發(fā)現(xiàn)的頻率相當(dāng)?shù)南鄬徒^對頻率出現(xiàn)。得出以下結(jié)論:這些位點與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷不相關(guān)。
鑒定了對腫瘤組織核酸樣品獨特的MEI位點。一些腫瘤特異性MEI插入位點以低豐度出現(xiàn)在腫瘤組織核酸樣品中。得出以下結(jié)論:這些MEI插入與腫瘤活性不相關(guān)。
在整個腫瘤組織核酸樣品中發(fā)現(xiàn)一些MEI插入位點。得出以下結(jié)論:這些MEI插入位點對于細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷的顯現(xiàn)是必需的。然而,它們在非腫瘤核酸樣品中的相對豐富的存在表明,其本身不表明與腫瘤活性相關(guān)的細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷的存在。
一些MEI插入位點在整個腫瘤組織核酸樣品中以非常高的頻率被發(fā)現(xiàn),而在非腫瘤核酸樣品中以非常低的頻率被發(fā)現(xiàn)。得出以下結(jié)論:這些MEI插入位點指示與腫瘤活性相關(guān)的細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷的顯現(xiàn)。
實施例5.特異性MEI插入邊界靶向。將來自實施例2-3的MEI插入邊界用作藥物干預(yù)的源頭。開發(fā)了包含MEI插入序列和插入相鄰基因組序列的核酸分子。將該分子封裝到CRISPR核酸靶向復(fù)合物中,該復(fù)合物特異性地引導(dǎo)內(nèi)切核酸酶切割與MEI插入序列和插入相鄰基因組序列相鄰的核酸,而不切割其他MEI插入位點。
實施例6.排除具有與假定癌性組織相關(guān)的MEI插入邊界的細(xì)胞的治療干預(yù)。在切除假定癌性腫瘤組織后兩年,來自實施例1和2的個體的核酸樣品從個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率保持在原始全基因組MEI調(diào)查中的頻率。
在切除假定癌性腫瘤組織后四年,來自實施例1和2的個體的核酸樣品從個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率是原始全基因組MEI調(diào)查中的頻率的5倍。
對該個體進(jìn)行進(jìn)一步的觀察,以尋找癌癥或其他欠調(diào)節(jié)的細(xì)胞增殖缺陷,從中可以獲得DNA以確定腫瘤或其他細(xì)胞缺陷是否與MEI插入邊界對應(yīng)。
鑒定了假定癌性組織。對來自假定癌性組織的核酸樣品進(jìn)行全基因組定量測序。發(fā)現(xiàn)第二MEI插入位點出現(xiàn)的頻率是原始全基因組MEI調(diào)查中的頻率的100倍。
用包含實施例5的靶向MEI插入邊界的藥物的治療方案治療該個體。觀察到假定癌性組織經(jīng)歷特異性細(xì)胞死亡。
按照該程序,從該個體的血液中取出核酸樣品。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率已回到原始全基因組MEI調(diào)查中的頻率。
實施例7.排除具有與假定癌性組織相關(guān)的MEI插入邊界的細(xì)胞的治療干預(yù)。在切除假定癌性腫瘤組織后兩年,來自實施例1和2的個體的核酸樣品從個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率保持在原始全基因組MEI調(diào)查中的頻率。
在切除假定癌性腫瘤組織后四年,來自實施例1和2的個體的核酸樣品從個體的血液中取出。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率是原始全基因組MEI調(diào)查中的頻率的5倍。
對該個體進(jìn)行進(jìn)一步的觀察,以尋找癌癥或其他欠調(diào)節(jié)的細(xì)胞增殖缺陷,從中可以獲得DNA以確定腫瘤或其他細(xì)胞缺陷是否與MEI插入邊界對應(yīng)。
沒有鑒定出假定癌性組織。
用包含實施例5的靶向MEI插入邊界的藥物的治療方案治療該個體。
按照該程序,從該個體的血液中取出核酸樣品。分析了來自該個體的血液的核酸,并確定了相對和絕對的MEI插入位點頻率。觀察到第二MEI插入位點的頻率已回到原始全基因組MEI調(diào)查中的頻率。
實施例8.年齡特異性基因組衰老的監(jiān)測。對來自個體的核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)一次的頻率出現(xiàn)的MEI插入位點,表明產(chǎn)生MEI插入的事件很可能發(fā)生在個體的先祖種系中而不是個體的體細(xì)胞中。
鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的體細(xì)胞中發(fā)生。檢查了MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
隨時間監(jiān)測MEI插入位點豐度。五年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的相當(dāng)?shù)南鄬︻l率和相對豐度出現(xiàn)。
十年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn)。然而,觀察到已發(fā)生新的MEI插入事件,使插入位點的總數(shù)上升至2倍。
推薦包含卡路里限制的抗老化方案。
15年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與十年時觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn),表明MEI插入位點頻率的增加沒有持續(xù)。
實施例9.年齡特異性基因組衰老的監(jiān)測。對來自個體的核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)一次的頻率出現(xiàn)的MEI插入位點,表明產(chǎn)生MEI插入的事件很可能發(fā)生在個體的先祖種系中而不是個體的體細(xì)胞中。
鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的體細(xì)胞中發(fā)生。檢查了MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
隨時間監(jiān)測MEI插入位點豐度。五年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的相當(dāng)?shù)南鄬︻l率和相對豐度出現(xiàn)。
十年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn)。然而,觀察到已發(fā)生新的MEI插入事件,使插入位點的總數(shù)上升至2倍。
隨后是包含逆轉(zhuǎn)錄酶抑制劑治療的抗老化方案。
15年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與十年時觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn),表明MEI插入位點頻率的增加沒有持續(xù)。
實施例10.年齡特異性基因組衰老的監(jiān)測。對來自個體的核酸樣品進(jìn)行全基因組定量測序。鑒定到以每兩個單倍體基因組拷貝出現(xiàn)一次的頻率出現(xiàn)的MEI插入位點,表明產(chǎn)生MEI插入的事件很可能發(fā)生在個體的先祖種系中而不是個體的體細(xì)胞中。
鑒定到以每兩個單倍體基因組拷貝出現(xiàn)少于一次的頻率出現(xiàn)的MEI插入位點,表明該事件已在個體的一些但并非全部的體細(xì)胞中發(fā)生。檢查了MEI插入位點,并確定一些MEI插入位點很可能已經(jīng)破壞了其功能喪失與細(xì)胞周期調(diào)節(jié)、細(xì)胞生長調(diào)節(jié)或細(xì)胞分裂調(diào)節(jié)缺陷有關(guān)的基因。
隨時間監(jiān)測MEI插入位點豐度。五年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的相當(dāng)?shù)南鄬︻l率和相對豐度出現(xiàn)。
十年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與在初始全基因組定量測序后觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn)。然而,觀察到已發(fā)生新的MEI插入事件,使插入位點的總數(shù)上升至2倍。
隨后是包含逆轉(zhuǎn)錄病毒抑制劑治療的抗老化方案。
15年后,從個體的血液中取出該個體的核酸樣品。分析來自該個體的血液的核酸。
觀察到MEI插入位點以與十年時觀察到的豐度相當(dāng)?shù)南鄬ωS度出現(xiàn),表明MEI插入位點頻率的增加沒有持續(xù)。