基本無偏差的基因組擴(kuò)增的制作方法
【專利說明】基本無偏差的基因組擴(kuò)増
[0001] 相關(guān)申請的交叉引用
[0002] 本申請要求2013年5月30日提交的美國臨時(shí)申請No.61/829193的權(quán)益,在此將其 以引用的方式整體并入。
[0003] 關(guān)于聯(lián)邦贊助R&D的聲明
[0004] 本研究由美國國立衛(wèi)生研究院R01HG004876資助支持。政府對本發(fā)明擁有一定的 權(quán)利。
[0005] 背景
[0006] 通過全基因組擴(kuò)增,單細(xì)胞中的遺傳物質(zhì)可通過DNA聚合酶擴(kuò)增為許多克隆拷貝, 并且可通過鳥槍法測序描述其特征。已經(jīng)在微生物和哺乳動物細(xì)胞中成功示范了單細(xì)胞的 基因組測序M,并應(yīng)用于描繪海洋微生物基因組的多樣性 7、癌癥中的體細(xì)胞突變8,9以及精 子中的減數(shù)分裂重組和突變 3,1()。
[0007] 領(lǐng)域
[0008] 本文的實(shí)施方案通常涉及全基因組擴(kuò)增。本文的一些實(shí)施方案通常涉及無偏差的 基因組擴(kuò)增。
[0009] 概述
[0010] 根據(jù)一些方面,提供產(chǎn)生基本無偏差的單細(xì)胞的基因組擴(kuò)增文庫的方法。該方法 可包括在配置以用于基本無偏差的基因組擴(kuò)增的納升級反應(yīng)環(huán)境中擴(kuò)增單細(xì)胞的基因組, 以及構(gòu)建包含基本無偏差的基因組擴(kuò)增的多個擴(kuò)增子的文庫。在一些實(shí)施方案中,擴(kuò)增單 細(xì)胞的基因組包括多鏈置換擴(kuò)增(MDA),所述多鏈置換擴(kuò)增包含使反應(yīng)環(huán)境與(a)鏈置換聚 合酶和(b)多個隨機(jī)的DNA多聚物相接觸,并因此產(chǎn)生基本無偏差的單細(xì)胞的基因組擴(kuò)增。 在一些實(shí)施方案中,基因組核酸的量與納升級反應(yīng)環(huán)境的體積的比率為至少約0.03百萬個 堿基對/納升。在一些實(shí)施方案中,基因組核酸的量與納升級反應(yīng)環(huán)境的體積的比率為至少 約200百萬個堿基對/納升。在一些實(shí)施方案中,配置納升級反應(yīng)環(huán)境以用于以大于1 X的覆 蓋度擴(kuò)增至少約90%的基因組。在一些實(shí)施方案中,納升級反應(yīng)環(huán)境包括不大于約20nL的 體積。在一些實(shí)施方案中,納升級反應(yīng)環(huán)境包括不大于約12nL的體積。在一些實(shí)施方案中, 該方法還包括在單基板上的多個納升級反應(yīng)環(huán)境中擴(kuò)增多個單細(xì)胞的基因組,其中至少 95%的反應(yīng)環(huán)境不包含除單細(xì)胞的基因組外的任何基因組。在一些實(shí)施方案中,至少99% 的反應(yīng)環(huán)境不包含除單細(xì)胞的基因組外的任何基因組。在一些實(shí)施方案中,配置基板以用 于單移液操作,從而將單細(xì)胞的基因組分配于反應(yīng)環(huán)境中。在一些實(shí)施方案中,該方法還包 括選擇期望數(shù)量的反應(yīng)環(huán)境;以及僅在期望數(shù)量的反應(yīng)環(huán)境中擴(kuò)增多個單細(xì)胞的基因組。 在一些實(shí)施方案中,該方法還包括鑒定實(shí)現(xiàn)期望水平的擴(kuò)增的反應(yīng)環(huán)境,其中從實(shí)現(xiàn)期望 水平的擴(kuò)增的反應(yīng)環(huán)境中構(gòu)建文庫。在一些實(shí)施方案中,該方法還包括從多個反應(yīng)環(huán)境中 構(gòu)建多個文庫,其中多個文庫的數(shù)量與多個反應(yīng)環(huán)境的數(shù)量相同或不同。在一些實(shí)施方案 中,在納升級反應(yīng)環(huán)境中擴(kuò)增單細(xì)胞的基因組包括在擴(kuò)增-檢測部分存在的情況下擴(kuò)增。在 一些實(shí)施方案中,所述擴(kuò)增-檢測部分包含花青染料。在一些實(shí)施方案中,所述擴(kuò)增-檢測部 分包含SYBR?綠染料。在一些實(shí)施方案中,來自擴(kuò)增-檢測部分的信號鑒定了已經(jīng)實(shí)現(xiàn)期望 水平的擴(kuò)增的反應(yīng)環(huán)境。在一些實(shí)施方案中,反應(yīng)環(huán)境不包含除單細(xì)胞之外的任何細(xì)胞。在 一些實(shí)施方案中,所述反應(yīng)環(huán)境不包含除單細(xì)胞的基因組之外的任何基因組。在一些實(shí)施 方案中,所述隨機(jī)多聚物選自:五聚物、六聚物、七聚物、八聚物、九聚物以及十聚物。在一些 實(shí)施方案中,所述隨機(jī)多聚物為六聚物。在一些實(shí)施方案中,基本上所有的多個擴(kuò)增子是無 支鏈的。在一些實(shí)施方案中,該方法還包括在構(gòu)建文庫之前,從反應(yīng)環(huán)境中移出多個擴(kuò)增子 中的至少一些。在一些實(shí)施方案中,移出多個擴(kuò)增子中的至少一些包括顯微操作。在一些實(shí) 施方案中,所述多個擴(kuò)增子包含不多于約100皮克-約10納克的DNA。在一些實(shí)施方案中,所 述文庫包括基于轉(zhuǎn)座酶的文庫。在一些實(shí)施方案中,所述文庫包括基于Tn5轉(zhuǎn)座酶的文庫。 在一些實(shí)施方案中,所述文庫包括隨機(jī)斷裂和連接文庫。在一些實(shí)施方案中,所述單細(xì)胞為 一個人細(xì)胞或微生物細(xì)胞。在一些實(shí)施方案中,所述單細(xì)胞包括不可培養(yǎng)或基本不可培養(yǎng) 的細(xì)菌細(xì)胞。在一些實(shí)施方案中,MDA包括實(shí)時(shí)MDA。在一些實(shí)施方案中,對兩個或更多個單 細(xì)胞的兩個或更多個基因組并行實(shí)施該方法,并因此并行產(chǎn)生兩個或更多個無偏差的擴(kuò)增 文庫。在一些實(shí)施方案中,該方法還包括下述中的至少一項(xiàng):人腸道內(nèi)不可培養(yǎng)的細(xì)菌的從 頭組裝,異質(zhì)環(huán)境(如海水)中不可培養(yǎng)的細(xì)菌的從頭組裝、單神經(jīng)元的拷貝數(shù)變異檢出、單 癌細(xì)胞或循環(huán)腫瘤細(xì)胞的拷貝數(shù)變異檢出、或者人類單體型分析。在一些實(shí)施方案中,鏈置 換聚合酶包括高保真聚合酶。在一些實(shí)施方案中,所述鏈置換聚合酶包括phi29聚合酶。 [0011]根據(jù)一些方面,提供通過多鏈置換擴(kuò)增(MDA)產(chǎn)生基本無偏差的基因組擴(kuò)增的方 法。該方法可包括提供納升級反應(yīng)環(huán)境中的基因組,以及使所述納升級反應(yīng)環(huán)境與(a)鏈置 換聚合酶以及(b)多個隨機(jī)DNA多聚物相接觸,并因此產(chǎn)生基本無偏差的基因組擴(kuò)增。在一 些實(shí)施方案中,該方法還包括構(gòu)建包含基本無偏差的基因組擴(kuò)增的多個擴(kuò)增子的文庫。在 一些實(shí)施方案中,配置納升級反應(yīng)環(huán)境以用于以大于1 X的覆蓋度擴(kuò)增至少90%的基因組。 在一些實(shí)施方案中,基因組核酸的量與納升級反應(yīng)環(huán)境的體積的比率為至少約0.3百萬個 堿基對/納升。在一些實(shí)施方案中,基因組核酸的量與反應(yīng)環(huán)境的體積的比率為至少約200 百萬個堿基對/納升。在一些實(shí)施方案中,隨機(jī)多聚物選自:五聚物、六聚物、七聚物、八聚 物、九聚物以及十聚物。在一些實(shí)施方案中,所述隨機(jī)多聚物包括六聚物。在一些實(shí)施方案 中,基本上所有的多個擴(kuò)增子都是無支鏈的。在一些實(shí)施方案中,納升級反應(yīng)環(huán)境包括促進(jìn) 基本無偏差的單細(xì)胞擴(kuò)增的納升級反應(yīng)環(huán)境。在一些實(shí)施方案中,所述納升級反應(yīng)環(huán)境包 括不大于約20nL的體積。在一些實(shí)施方案中,所述納升級反應(yīng)環(huán)境包括不大于約12nL的體 積。在一些實(shí)施方案中,所述反應(yīng)環(huán)境包含不多于一種基因組的可能性為至少99%。在一些 實(shí)施方案中,該方法還包括下述中的至少一項(xiàng):人腸道中不可培養(yǎng)的細(xì)菌的基因組的從頭 組裝、異質(zhì)環(huán)境中不可培養(yǎng)的細(xì)菌的從頭組裝、單神經(jīng)元的拷貝數(shù)變異檢出、單癌細(xì)胞或循 環(huán)腫瘤細(xì)胞的拷貝數(shù)變異檢出、或者人類單體型分析。在一些實(shí)施方案中,鏈置換聚合酶包 括高保真聚合酶。在一些實(shí)施方案中,所述鏈置換聚合酶包括phi29聚合酶。
[0012]根據(jù)一些方面,提供用于基本無偏差的至少一種單細(xì)胞的基因組擴(kuò)增的基板。所 述基板可包括多個上樣區(qū),其中配置每個上樣區(qū)以接收液體樣品。每個上樣區(qū)可包含促進(jìn) 基本無偏差的單細(xì)胞擴(kuò)增的多個納升級反應(yīng)環(huán)境。在一些實(shí)施方案中,配置多個納升級反 應(yīng)環(huán)境以并行實(shí)施期望數(shù)量的擴(kuò)增反應(yīng),其中在不同的納升級反應(yīng)環(huán)境中進(jìn)行每個擴(kuò)增反 應(yīng)。在一些實(shí)施方案中,配置多個納升級反應(yīng)環(huán)境,以在不對所述基板進(jìn)行進(jìn)一步修飾的情 況下并行實(shí)施期望數(shù)量的擴(kuò)增反應(yīng)。在一些實(shí)施方案中,所述多個納升級反應(yīng)環(huán)境不與任 何微流體通道或納流體通道流體連通。在一些實(shí)施方案中,每個納升級反應(yīng)環(huán)境的體積不 大于約12nL。在一些實(shí)施方案中,每個納升級反應(yīng)環(huán)境的體積不大于20nL。在一些實(shí)施方案 中,配置每個上樣區(qū),以將包含稀釋的細(xì)胞的溶液經(jīng)由單移液操作上樣進(jìn)多個納升級反應(yīng) 環(huán)境。在一些實(shí)施方案中,每個反應(yīng)環(huán)境包含多種隨機(jī)多聚物和鏈置換聚合酶。在一些實(shí)施 方案中,所述多個多聚物包括六聚物。在一些實(shí)施方案中,基板包含至少三個上樣區(qū)。在一 些實(shí)施方案中,每個上樣區(qū)包含至少十個納升級反應(yīng)環(huán)境。在一些實(shí)施方案中,每個上樣區(qū) 包含至少一百個納升級反應(yīng)環(huán)境。在一些實(shí)施方案中,基板還包含檢測器,配置檢測器以檢 測每個反應(yīng)環(huán)境中的擴(kuò)增-檢測部分。在一些實(shí)施方案中,基板還包括配置以從單一反應(yīng)環(huán) 境中回收擴(kuò)增的核酸的納升級移液器。在一些實(shí)施方案中,配置納升級反應(yīng)環(huán)境以使在將 包含單細(xì)胞或其部分的溶液上樣至上樣區(qū)之后,至少99%的反應(yīng)環(huán)境包含不多于一種細(xì)胞 的基因組。在一些實(shí)施方案中,基本上每個反應(yīng)環(huán)境都包含不多于一種細(xì)胞的基因組,并且 其中基本上包含基因組的每個反應(yīng)環(huán)境還包含基因組的多個擴(kuò)增子。在一些實(shí)施方案中, 所述多個擴(kuò)增子包含基本無偏差的基因組覆蓋度。在一些實(shí)施方案中,所述多個擴(kuò)增子包 含不多于約100皮克-約10納克的DNA。在一些實(shí)施方案中,鏈置換聚合酶包括高保真聚合 酶。在一些實(shí)施方案中,所述鏈置換聚合酶包括phi29聚合酶。
[0013] 附圖簡要說明
[0014] 圖1為一系列顯示根據(jù)本文的一些實(shí)施方案的基本無偏差的基因組擴(kuò)增的原理 圖。圖1A為在根據(jù)本文的一些實(shí)施方案的基本無偏差的基因組擴(kuò)增方法的背景下,顯示根 據(jù)本文的一些實(shí)施方案的基板100的原理圖。每個基板100可包含16個單獨(dú)的上樣區(qū)12,每 個上樣區(qū)14包含255個納升級反應(yīng)環(huán)境,例如12nl微孔??衫脝我埔豪鯇⒓?xì)胞、裂解液、變 性緩沖液、中和緩沖液以及包含擴(kuò)增-檢測部分的MDA預(yù)混液中的每一種添加至微孔中。然 后可以使用熒光顯微鏡,利用實(shí)時(shí)MDA系統(tǒng)來使擴(kuò)增子生長可視化。隨時(shí)間顯示熒光漸增的 微孔為陽性擴(kuò)增子。利用與顯微操作系統(tǒng)相連的精細(xì)玻璃移液器提取擴(kuò)增子。圖1B為不同 放大率的單大腸桿菌(E.coli)細(xì)胞的一系列掃描電子顯微鏡(SEM)圖像。該特定孔僅包含 一個細(xì)胞,并且觀察到的大多數(shù)孔也包含不多于1個細(xì)胞。圖1C為顯示可用于根據(jù)本文的一 些實(shí)施方案的實(shí)時(shí)MDA的定制顯微鏡培養(yǎng)室的照片。該培養(yǎng)室是溫度和濕度受控的,以減緩 試劑的蒸發(fā)。此外,它通過自身包含的顯微操作系統(tǒng)而防止擴(kuò)增子提取過程中的污染。還顯 示了整個微孔陣列的圖像,以及探入孔中的微量移液管。圖1D為顯示根據(jù)本文的一些實(shí)施 方案,利用DNA聚合酶I以及Ampligase將復(fù)雜的3維MDA擴(kuò)增子簡化為線性DNA的原理圖。該 過程可顯著改善標(biāo)簽化后的文庫復(fù)雜性。
[0015] 圖2為根據(jù)本文的一些實(shí)施方案,通過MIDAS產(chǎn)生的組裝的大腸桿菌基因組圖。利 用MIDAS分析三個單大腸桿菌細(xì)胞。用極少的測序投入(2-8M PElOObp讀?。┙M裝了88%-94%之間的基因組。該直方圖顯示該三個細(xì)胞中每一個的每個組裝區(qū)域覆蓋的平均深度的 l〇g2。缺口用有顏色的重疊群之間的空白表示。覆蓋的深度在整個基因組中十分一致,并且 存在很少的缺口。
[0016] 圖3為一系列顯示根據(jù)本文的一些實(shí)施方案進(jìn)行MDA和MIDAS之后,單細(xì)菌細(xì)胞以 及哺乳動物細(xì)胞基因組覆蓋度的圖。圖3A為顯示根據(jù)本文的一些實(shí)施方案,在PCT管中擴(kuò)增 10小時(shí)(上部)、2小時(shí)(中部)以及在微孔中(MIDAS)擴(kuò)增10小時(shí)(底部)的單大腸桿菌細(xì)胞之 間的比較的圖。Log 1Q比率(y軸)代表標(biāo)準(zhǔn)化的覆蓋度。隨著MDA受限,偏差得到改善,其中 MIDAS方法顯示出最高的統(tǒng)一性。圖3B為顯示根據(jù)本文的一些實(shí)施方案,利用傳統(tǒng)的MDA與 MIDAS擴(kuò)增的單一人細(xì)胞之間的比較的圖。與通過MIDAS擴(kuò)增的單神經(jīng)元核(底部)相比,單 淋巴細(xì)胞的10小時(shí)MDA(上部)顯示出更大的覆蓋度偏差。圖3C為顯示根據(jù)本文的一些實(shí)施 方案擴(kuò)增的單細(xì)菌細(xì)胞的覆蓋度分布的圖。X軸代表分成100個總的庫的基因組覆蓋度的 l〇g1Q<3MIDAS(30)顯示緊密的覆蓋度,表示該文庫中有限的偏差。正常的(32)以及受限的 (34)管內(nèi)MDA文庫顯示出大范圍的覆蓋度。圖3D為顯示根據(jù)本文的一些實(shí)施方案擴(kuò)增的單 哺乳動物細(xì)胞的覆蓋度分布的圖。MIDAS(36)比管內(nèi)MDA文庫(38)顯示出更緊密的覆蓋度分 布。
[0017]圖4為一系列顯示根據(jù)本文的一些實(shí)施方案,利用MIDAS檢測拷貝數(shù)變異的圖。圖 4A為顯示根據(jù)本文的一些實(shí)施方案,用MIDAS分析的唐氏綜合征單細(xì)胞的拷貝數(shù)變異的散 點(diǎn)圖的圖。X軸顯示基因組位點(diǎn),y軸顯示(以log 2水平)估計(jì)的拷貝數(shù)。在該單細(xì)胞中可清楚 地觀察到三體性21,以及一些其它更小的CNV檢出。圖4B為根據(jù)本文的一些實(shí)施方案,具有 三體性21"加標(biāo)"的唐氏綜合征單細(xì)胞中拷貝數(shù)變異的散點(diǎn)圖。X軸顯示基因組位點(diǎn),y軸顯 示(以l〇g 2水平)估計(jì)的拷貝數(shù)。在每個箭頭處,將染色體21的2Mb的部分通過計(jì)算插入基因 組。在每個位點(diǎn),檢出了拷貝數(shù)變異,顯示MIDAS可以準(zhǔn)確地檢測2Mb的拷貝數(shù)變異。
[0018]圖5為一系列描述根據(jù)本文的一些實(shí)施方案的實(shí)時(shí)MDA的顯微鏡圖片。利用488nm 的濾光片每小時(shí)拍攝圖片。顯示的是1小時(shí)(圖5A)、2小時(shí)(圖5B)、3小時(shí)(圖5C)、4小時(shí)(圖 5D)、5小時(shí)(圖5E)、6小時(shí)(圖5F)、7小時(shí)(圖5G)以及8小時(shí)(圖5H)。觀察到擴(kuò)增子在1小時(shí)開 始生長,并繼續(xù)生長直至它們由于微孔內(nèi)有限的空間而不能擴(kuò)增。該飽和通常發(fā)生在5-6小 時(shí)之內(nèi)。擴(kuò)增子的隨機(jī)分布顯示細(xì)胞接種是隨機(jī)的,并且相鄰的孔中不存在擴(kuò)增子。
[0019] 圖6為一系列描述根據(jù)本文的一些實(shí)施方案的擴(kuò)增子提取的顯微鏡圖片?;蚪M DNA充滿微孔,并且實(shí)施MDA以使每個孔都包含MDA擴(kuò)增子。圖6A中的熒光顯示擴(kuò)增成功。擴(kuò) 增之后,微量移液管降低至單孔,由箭頭指出,并提取擴(kuò)增子。圖6B顯示在不干擾鄰近微孔 的內(nèi)容物的情況下,成功移出擴(kuò)增子,因?yàn)闊晒鈫适А?br>[0020] 圖7為描述根據(jù)本文的一些實(shí)施方案,組裝的基因組與定位于整個基因組的讀取 之間的比較的原理圖。外側(cè)的圈顯示定位于大腸桿菌的組裝的重疊群。中間的圈顯示定位 于大腸桿菌的未經(jīng)處理的讀取。內(nèi)側(cè)的圈代表讀取的覆蓋度。在重疊群未被組裝的定位區(qū) 域中,覆蓋度較低。
[0021] 圖8為一系列描述根據(jù)本文的一些實(shí)施方案,利用基于傳統(tǒng)MDA的單細(xì)胞測序檢測 拷貝數(shù)變異的圖。圖8A為描述用傳統(tǒng)的MDA分析的唐氏綜合征單細(xì)胞中拷貝數(shù)變異的散點(diǎn) 圖的圖。X軸顯示基因組位點(diǎn),y軸顯示(以log2水平)估計(jì)的拷貝數(shù)。在該單細(xì)胞中觀察不到 三體性21,并檢出了遍布整個基因組的一些其它的大的CNV。圖8B為描述具有三體性21"加 標(biāo)"的唐氏綜合征單細(xì)胞中拷貝數(shù)變異的散點(diǎn)圖的圖。X軸顯示基因組位點(diǎn),y軸顯示(以 log2水平)估計(jì)的拷貝數(shù)。在每個箭頭處,將染色體21的2Mb部分通過計(jì)算插入基因組。在任 何位點(diǎn)都未檢出拷貝數(shù)變異,顯示基于傳統(tǒng)的MDA的方法不能準(zhǔn)確地檢測CNV。
[0022]圖9A-9B為一系列描述根據(jù)本文的一些實(shí)施方案的MIDAS擴(kuò)增與MALBAC(不同的擴(kuò) 增核酸的方法)的比較的圖。圖9A為描述MALBAC(上部)與MIDAS(底部)的一對圖,其中MIDAS 與MALBAC顯示出貫穿基因組的類似的無偏差覆蓋度。圖9B為描述,與MALBAC 92相比,MIDAS 90顯示出稍好的覆蓋度分布的一對圖。
[0023] 圖10A-10C為一系列描述根據(jù)本文的一些實(shí)施方案的MIDAS擴(kuò)增與下述數(shù)據(jù)的比 較的圖:之前公開的兩種精細(xì)胞池的二倍體區(qū)域的管內(nèi)MDA數(shù)據(jù) 43、微流體MDA1()數(shù)據(jù)和 MALBAC44數(shù)據(jù)以及用MALBAC32處理的單SW480癌細(xì)胞的二倍體區(qū)域的數(shù)據(jù)?;蚪M位點(diǎn)被合 并至預(yù)先確定的大小為~60kb的可變庫,以包含類似的讀取數(shù) 3(),并且繪制為針對基因組覆 蓋度(用平均數(shù)進(jìn)行標(biāo)準(zhǔn)化)的loglO比率(y軸)的圖。對于癌細(xì)胞數(shù)據(jù),非二倍體區(qū)域已經(jīng) 被掩蓋(粉色之間的白色空白),以移除通過將高度非整倍性細(xì)胞與原代二倍體細(xì)胞進(jìn)行比 較而產(chǎn)生的偏差。圖10A描述了精子池1的管內(nèi)MDA結(jié)果;精子池2的管內(nèi)MDA結(jié)果;以及精子 池1的微流體MDA結(jié)果。圖10B描述了精子池2的微流體MDA結(jié)果;精子池1的mALBAC結(jié)果;以及 精子池2的mALBAC結(jié)果。圖10C描述了 SW480癌細(xì)胞的結(jié)果(二倍體區(qū)域,MALBAC)、神經(jīng)元核1 的MIDAS結(jié)果;以及神經(jīng)元核2的MIDAS結(jié)果。
[0024] 詳細(xì)描述
[0025]亞納克量的核酸(例如單細(xì)胞的基因組)的擴(kuò)增可用于多種應(yīng)用。根據(jù)本文的一些 實(shí)施方案,提供用于基本無偏差的核酸擴(kuò)增的方法和制成品。在一些實(shí)施方案中,以納升級 的體積擴(kuò)增少量的核酸,例如單細(xì)胞的基因組材料。納升級的體積可提供高濃度反應(yīng)物用 于擴(kuò)增。所述擴(kuò)增可包括多鏈置換擴(kuò)增(MDA)。在一些實(shí)施方案中,在單一反應(yīng)空間(如孔) 實(shí)施所述擴(kuò)增,因此將移動部分最小化。在一些實(shí)施