使用多態(tài)性變體等位基因頻率進行單體型分型和拷貝數(shù)分型的制作方法

文檔序號：9769200閱讀：796來源：國知局

使用多態(tài)性變體等位基因頻率進行單體型分型和拷貝數(shù)分型的制作方法
【技術領域】
[0001]本發(fā)明設及用于遺傳物質(zhì)的單體型分型和/或拷貝數(shù)分型的方法。更具體地，本發(fā) 明設及用于通過對單細胞、少量細胞的庫、多細胞DNA制劑或甚至來自例如血流中的無細胞 DNA的DNA制劑中的多態(tài)性變體(PV)等位基因分數(shù)(PVAF)進行測定、定相和分段從而進行全基因組單體型分型、單體型特異性DNA拷貝數(shù)分析和測定DNA異常的減數(shù)分裂/有絲分裂起源的方法。
[醒]發(fā)明背景
[0003] 特異性祀向每個家族的特定突變的（單細胞)診斷測試的開發(fā)費時、勞動強度大且昂貴，此外還導致待經(jīng)歷該操作的夫婦的長長的等待列表。因此，新的用于遺傳診斷的遺傳方法勢在必行。
[0004] 染色體非整倍性是妊娠失敗和胎兒或個體的異常發(fā)育的主要原因。運樣的非整倍性可W來自減數(shù)分裂錯誤，運在絕經(jīng)期前的十年中卵子發(fā)生中更為普遍。植入前遺傳學篩查(PGS)已經(jīng)被概念化為提高每個移植胚胎的妊娠率并防止IVF后的異常妊娠與患病的活產(chǎn)兒。然而，基于FISH和基于aCGH的PGS方法不能鑒別減數(shù)分裂錯誤和有絲分裂錯誤。特別地，卵裂期細胞分裂很容易發(fā)生有絲分裂染色體分離錯誤，運并不必然損害正常的胚胎發(fā) 育。
[0005] 基于微陣列或下一代測序W及隨后的全基因組單體型分型，全基因組SNP分析最近已經(jīng)變?yōu)榭尚小Ｈ欢?，非分裂中期的二倍體單細胞的整個基因組的精確單體型分型已被大大地排除，主要是由于由單細胞DNA擴增假象(如隨機ADO)和一個等位基因相對于另一個等位基因的優(yōu)先擴增(PA) W及SNP探針強度的錯誤算法解釋所引入的基因型錯誤。
[0006] Wang等人在"PennCNV: an integrated hidden Markov model designed for high-resolution copy number variation detection in whole-genome SNP genotyping data."Genome research 17,1665(2007)中開發(fā)了一種用于測定拷貝數(shù)崎變的整合的隱藏MarkoV模型（被稱為PennCNV)。PennCNV使用SNP B等位基因頻率(BAF)值和 Io曲值來測定拷貝數(shù)崎變。運適用于還未經(jīng)歷全基因組擴增(WGA)的多細胞樣品，因為不同的拷貝數(shù)崎變具有特定的BAF值模式。然而，由于等位基因擴增偏差，由單細胞的全基因組擴增(WGA)所獲得的PVAF值可能顯著失真，并因此不如來源于未進行WGA的DNA樣品的PVAF 值那樣可W區(qū)分不同的拷貝數(shù)狀態(tài)。特別是重復和=體性極其難W在單細胞中確認普通的 PVAF值和Io排值；當被應用于臨床設置時，運可能會導致單細胞拷貝數(shù)分析的錯誤解釋并因此甚至導致誤診。PennCNV和本領域已知的其它類似方法也可W采用S重基因型來測定來源于大量細胞的DNA樣品中崎變的起源。盡管運些方法適用于使用多細胞DNA樣品的離散雙等位基因基因型檢測和確認缺失，然而均不能精確地確認崎變(特別是重復)的親本起源的干擾和機理起源的干擾。然而，在本發(fā)明的實施方案中，提供信息的PVAF值被有利地單體型分型/定相并用于測定單體型特異性拷貝數(shù)狀態(tài)W及它們的親本起源和機理起源，低至單細胞水平。
[0007] 除了本領域已知的運些方法之外，本領域已知的還有基于群體用于測定未經(jīng)歷 WGA的多細胞DNA樣品中的等位基因不平衡和鑲嵌性。￥曰1:1曰111；[1等人在"化口1017口6-6曰36(1 profiling of subtle allelic imbalance with SNP arrays''，Genome research 23, 152，（2013)中使用雜合SNP檢出（SNP-calI)的B等位基因頻率(BAF)值來檢測正常I: I等位基因的改變。在使用如Scheet等人在"A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and h曰plotypic ph3se.''inAmeric3n journal of human genetics 78,629 (2006)中所述的fastPHASE進行種系單體型的基于群體的統(tǒng)計學估計后，他們將運些估計的種系單體型和從相同的雜合SNP的BAF值所推導的超過闊值(即在所有的雜合基因座上所觀察的BAF的中位值)的"過量"單體型進行比較W測定種系單體型和BAF推導的"過量"單體型之間的相一致性(phase concordance)，和從而單體型特異性等位基因不平衡。然而，他們沒有考慮BAF本身的幅度并忽略了總強度。相反，Nik-Zainal等人在叮he life Msto巧 of 2化reast cancers."Cell,149,5,2012中很好地應用了來自千人基因組計劃（"A map of human genome variation from population-scale sequencing.''Nature 467,1061, 2010)的數(shù)據(jù)并使用IMPUTE(Howie等人在"Fast and accurate genotype imputation in genome-wide association studies through pre-phasing.''Nature Genetics 44,8, 2012中）來將由下一代測序數(shù)據(jù)所測定的種系SNP定相至片段化和從而短的親本特異性單體型域化aplotype block)。通過單體型對等位基因比率的隨后分析證實了比當對個體SNP BAF進行全基因組評分時更高的對檢測等位基因不平衡和異常的靈敏度。通過將該原理(被命名為Battenberg算法)應用于雜合SNP檢出的BAF值，他們能夠從所預期的0.5的值評估雜合SNP檢出的BAF值的失真W測定短單體型延伸中的等位基因不平衡，并因此研究DNA樣品中的鑲嵌DNA拷貝數(shù)崎變。然而重要的是，已經(jīng)顯示本領域已知的上述兩種方法適用于從大量細胞提取的標準DNA樣品，但會對來源于單細胞數(shù)據(jù)的BAF值是低效率的，因為群體測定的種系單體型代表短的延伸，并且單細胞分析所需的全基因組擴增方法向SNP的BAF引入了噪聲。此外，在單細胞樣品中不能顯示親本同源重組位點。相反，本發(fā)明的實施方案有利地應用基于家族或親屬的定相原理并且特別地不需要測定在研究本身下的DNA樣品的SNP檢出。因此，根據(jù)本發(fā)明的實施方案的方法有利地能夠在廣泛的種系單體型上解釋PVAF值，并且能夠用于解釋除標準DNA樣品W外需要全基因組擴增的DNA樣品、單細胞或少量細胞的 PVAF值。根據(jù)本發(fā)明的實施方案的方法有利地應用親本的和在特定實施方案中另外的近親的強有力的離散PV基因型W對親本基因型進行定相，其隨后被應用于W單體型特異性的方式來分別地從父本和母本的提供信息的SNP研究DNA樣品的PVAF值。根據(jù)本發(fā)明的實施方案的方法使用長的親本單體型域，其中可考慮到隨機WGA假象的影響。此外，運些基于群體的方法不能有效追蹤基因組異常的機理起源。然而，本發(fā)明有利地能夠追蹤基因組異常至減數(shù)分裂或有絲分裂錯誤。運在植入前遺傳學診斷(PGD)中具有重要意義，特別是當在早期發(fā) 育的卵裂期完成該診斷時。如果植入前胚胎的單細胞具有減數(shù)分裂機理起源的崎變，則該胚胎不應當被植入，因為崎變最可能在胚胎的所有單個卵裂球中永存。然而，如果卵裂期胚胎具有有絲分裂機理起源的崎變，運并不必然意味著崎變存在于該胚胎的所有單個卵裂球中，因為染色體不穩(wěn)定性在卵裂期胚胎發(fā)生中是常見的。因此，通過本發(fā)明測定染色體異常的減數(shù)分裂或有絲分裂機理起源使得針對卵裂期胚胎的用于非整倍性篩查的植入前遺傳學診斷(PGS)成為可能。因此，本發(fā)明使得在一次測定中同時進行PGD和PGS變得可行。
[0008] Navin等人在('Tumor evolution inferred by single-cell sequencing"Nature 472,90(2011)中開發(fā)了聚焦序列讀數(shù)深度分析方法來在單細胞WGA產(chǎn)物的測序后計算單細胞DNA拷貝數(shù)景觀。計算了對應于特定區(qū)間(bin)的單端序列讀數(shù)的量W測定經(jīng)歷WGA的單細胞基因組的IogR值及后續(xù)拷貝數(shù)狀態(tài)。有利地，本發(fā)明的實施方案使用來源于高通量基因分型技術(包括SNP陣列和下一代測序設備）的PV基因型、Io排值和PVAF值，W及整合的 Io曲值和PVAF值來顯示基因組崎變。后一種實施方案良好適用于測定缺失，然而，普通單細胞PVAF值對于重復的確認不是強有力的。與后一種實施方案相比，本發(fā)明的其它實施方案將PVAF值分類和亞分類，隨后對運些值進行分段。因此，本發(fā)明的方法的實施方案有利地能夠重建親本單體型并測定崎變的減數(shù)分裂或有絲分裂機理起源。
[0009] 對于WGA之后的單細胞或低細胞量的單體型分型，現(xiàn)有技術方法能夠利用細胞的離散雙等位基因基因型。在運些方法中，測定精確的等位基因和單體型的量W及它們的起源是不可能的。例如，本領域已知的運些方法不能精確地區(qū)分二體染色體與具有有絲分裂起源的S體性。此外，當在少量細胞或多細胞DNA樣品中存在細胞的混合物時，不能分析DNA 樣品的鑲嵌性質(zhì)。此外，因為運些方法采用雙等位基因基因型，它們可嚴重遭受樣品中的 WGA假象W及真正的DNA拷貝數(shù)變異。為了將WGA等位基因脫扣假象減輕至一定程度， Handyside等人在"Karyomapping:a universal method for genome wide analysis of genetic disease based on mapping crossovers between parental haplotypesJ Med Genet,47,10,（2010)中建議只使用雜合基因型。盡管該方法可消除ADO假象的影響;但它沒有減輕由等位基因插入(allele drop inKADI)假象產(chǎn)生的假雜合基因型。因為，WGA 產(chǎn)物中的雜合SNP只占（單細胞)基因型的小部分，較小的ADI假象可能有很大的影響從而導致假單體型。根據(jù)本發(fā)明的實施方案的方法相對于運些現(xiàn)有技術方法是有利的，因為使用了連續(xù)的提供信息的PVAF值。運具有若干優(yōu)點，包括因為PVAF值和后續(xù)分段化的應用減輕隨機WGA假象(包括不完全的AD0、ADI、優(yōu)先擴增(PA))的作用W及考慮了樣品中真正的拷貝數(shù)變異而對于重建的單體型具有更高的靈敏度;可W檢測和分析少量細胞或多細胞DNA樣品的鑲嵌性質(zhì);不僅可W識別有絲分裂=體性和二體性而且可W測定崎變的減數(shù)分裂和有絲分裂性質(zhì)，此外，可W檢測拷貝中性事件(諸如UPhD和UPiD);另外，可W檢測研究中的每個親本中或個體的DNA中LOH(運可能是血緣的結(jié)果）的修補(patch)。
[0010] 特別地，現(xiàn)有技術方法不允許使用連續(xù)多態(tài)性變體等位基因頻率（同時)測定拷貝數(shù)和單體型。當使用來源于包含少量遺傳物質(zhì)的樣品(諸如單細胞樣品）的含噪聲基因分型數(shù)據(jù)時，運尤其復雜。
[0011] 仍然存在對用于單體型分型和/或拷貝數(shù)分型的改善的方法的需要。
[001。發(fā)明概述
[0013] 本發(fā)明的一個目的是提供用于單體型分型和/或拷貝數(shù)分型的設備和方法。特別地，本發(fā)明提供一種方法，其允許同時全基因組檢測遺傳異常(包括拷貝數(shù)變異、鑲嵌性W 及區(qū)分單體性和單親二體性）、遺傳物質(zhì)的遺傳(包括單體型)和遺傳異常的機理起源(例如減數(shù)分裂或有絲分裂起源）。此外，本發(fā)明的方法甚至允許分析包含極少量的DNA的樣品(諸如單細胞樣品）中的遺傳物質(zhì)。與現(xiàn)有技術相比，本發(fā)明提供在所獲得的信息的細節(jié)和類型 W及精確度上得到改善的方法。
[0014] 本發(fā)明的一個優(yōu)點是不使用DNA樣品本身的離散PV檢出。運對于單細胞或少量細胞DNA樣品是重要的，因為本發(fā)明的方法減少了由WGA假象和/或用WGA物質(zhì)測定的信號的算法解釋所引起的錯誤離散PV檢出。
[0015] 本發(fā)明的一個優(yōu)點是具有兩個固有特征：（1)每個親本圖譜內(nèi)的一致性特征 (parity feature)和(2)親本圖譜之間的互補性特征。
[0016] 本發(fā)明的實施方案的一個優(yōu)點是基于多態(tài)性變體等位基因分數(shù)提供一種改善的方法，W進行全基因組單體型分型、拷貝數(shù)分析和測定單細胞或多細胞來源的DNA樣品中 DNA異常的機理起源。
[0017] 該目的通過根據(jù)本發(fā)明的獨立權利要求的方法實現(xiàn)。從屬權利要求設及優(yōu)選的實施方案。
[0018] 在第一方面，本發(fā)明提供用于分析受試者的遺傳物質(zhì)的方法，所述方法包括：
[0019]-獲得受試者的遺傳物質(zhì)的連續(xù)多態(tài)性變體等位基因頻率(PVAF)值；
[0020]-獲得第一親本的基因型信息；
[0021 ]-基于第一親本的基因型信息將連續(xù)PVAF值分類在對應于第一親本的類別中；
[0022] -對所述分類的PVAF值進行分段；W及
[0023] -提供分段的PVAF值W指示受試者的遺傳物質(zhì)中的遺傳異常和/或受試者的遺傳物質(zhì)的遺傳。
[0024] 在一個相關的方面，本發(fā)明提供用于分析受試者的遺傳物質(zhì)的方法，所述方法包括：
[0025] -獲得受試者的遺傳物質(zhì)的連續(xù)多態(tài)性變體等位基因頻率(PVAF)值；
[00%]-獲得第一親本和第二親本的基因型信息；
[0027]-基于第一親本和第二親本的基因型信息將連續(xù)PVAF值分類在對應于第一親本的類別中；
[00%]-對所述分類的PVAF值進行分段；W及
[0029] -提供分段的PVAF值W指示受試者的遺傳物質(zhì)中的遺傳異常和/或受試者的遺傳物質(zhì)的遺傳。
[0030] 在第二方面，本發(fā)明提供一種方法，其包括：
[0031] -獲得受試者的遺傳物質(zhì)的連續(xù)多態(tài)性變體等位基因頻率(PVAF)值；
[0032] -獲得第一親本的定相的基因型信息和第二親本的定相的或未定相的基因型信息；
[0033] -基于第一親本和第二親本的基因型信息將連續(xù)PVAF值分類在對應于第一親本的類別中；
[0034] -將來自對應于第一親本的類別的連續(xù)PVAF值亞分類成子類別；
[0035] -將所述亞分類的PVAF值進行分段；W及
[0036] -提供分段的PVAF值W指示受試者的遺傳物質(zhì)中的遺傳異常和/或受試者的遺傳物質(zhì)的遺傳。
[0037] 在第=方面，本發(fā)明提供一種方法，其包括：
[0038] -獲得受試者的遺傳物質(zhì)的連續(xù)多態(tài)性變體等位基因頻率(PVAF)值；
[0039] -獲得第一親本的定相的基因型信息和第二親本的定相的基因型信息；
[0040] -基于第一親本和第二親本的基因型信息將連續(xù)PVAF值分類成對應于第一親本的第一類別和對應于第二親本的第二類別；
[0041 ]-將第一類別和第二類別中的連續(xù)PVAF值亞分類成子類別；
[0042] -將所述亞分類的PVAF值進行分段；W及
[0043] -提供分段的PVAF值W指示受試者的遺傳物質(zhì)中的遺傳異常和/或受試者的遺傳物質(zhì)的遺傳。
[0044] 在其它方面，本發(fā)明提供用于對樣品的遺傳物質(zhì)進行單體型分型和/或拷貝數(shù)分型的方法，所述方法包括：
[0045] -測定樣品的遺傳物質(zhì)的連續(xù)多態(tài)性變體等位基因頻率(PVAF)值；
[0046] -使用近親的基因型或樣品本身的基因型提供定相的親本多態(tài)性變體(PV)基因型；
[0047] -使用所提供的（定相的或未定相的）親本PV基因型將所測定的樣品的遺傳物質(zhì) 的連續(xù)PVAF值進行分類，得到分類的PVAF值；
[0048] -使用所提供的親本的定相的PV基因型將樣品的所述分類的PVAF值亞分類成子類別；
[0049] -將所述亞分類的PVAF值進行分段，得到單體型分型的/定相的和分段的PVAF模式。
[0050] 在本發(fā)明的優(yōu)選實施方案中，樣品的遺傳物質(zhì)可W來源于單細胞、少量細胞、大量細胞或無細胞DNA。已使用包含受試者的遺傳物質(zhì)的樣品測定了連續(xù)PVAF值。在特定實施方案中，所述樣品包含所述受試者的少量遺傳物質(zhì)，諸如包含所述受試者的僅一個或少量細胞的樣品，或獲自孕育著所述受試者的母親的血漿樣品。在另一個特定實施方案中，已使用 (特別是全基因組)陣列或測序技術(尤其是如本文所述的陣列和測序技術)測定連續(xù)PVAF 值。在又一個特定實施方案中，已使用全基因組擴增的(經(jīng)歷WGA的)樣品測定連續(xù)PVAF值。
[0051] 在本發(fā)明的優(yōu)選實施方案中，多態(tài)性變體可W是任何遺傳變體，其在與參考序列相比較時具有至少一種替代形式。在特定實施方案中，所述多態(tài)性變體是多核巧酸多態(tài)性 (SNP)。在其它實施方案中，所述PVAF值是B等位基因頻率(BAF)。
[0052] 在本發(fā)明的優(yōu)選實施方案中，方法可W進一步包括根據(jù)單體型分型的/定相的和分段的PVAF值(在本文中也被稱為(分段的)PVAF模式)標準化遺傳物質(zhì)的DNA量值(諸如讀出計數(shù)或Io曲值）。特別地，方法包括獲得DNA量值并基于所述分段的PVAF值標準化所述DNA 量值。優(yōu)選地，DNA量值為10曲值或讀出計數(shù)值。
[0053] 在本發(fā)明的優(yōu)選實施方案中，提供所述定相的親本PV基因型包括：
[0054] (a)基于(近)親屬（即在兩個同線基因座上雜合的親本中，其中第一基因座上的等位基因的指定處于與第二基因座上的等位基因相同的染色體上）的基因型對親本PV基因型進行定相。
[0055] 在特定實施方案中，本發(fā)明的方法進一步包括在分段之前針對中軸線反射獲得的 PVAF值。在進一步的優(yōu)選實施方案中，本發(fā)明的方法包括在分段之前在對應于特定的定相親本基因型的位置上針對中軸線反射獲得的PVAF值。反射PVAF值提供的益處為它改善分段 (更多的PVAF值存在于用于分段的特定PVAF值的周圍）。此外，反射PVAF值幫助從連續(xù)PVAF 圖提取單體型信息。
[0056] 優(yōu)選地，在對應于第一親本的類別中反射PVAF值包括：
[0057]-測定其中所述第一親本具有特定的定相基因型(例如，AB或BA)的基因座；W及 [0化引一將所測定的基因座上的PVAF值圍繞中軸線反射。
[0059] 特別地，反射PVAF值在兩個子類別中均進行。在另一個優(yōu)選實施方案中，方法還包括在對應于第二親本的類別中反射PVAF值。應當注意的是，測定其中應當在第一親本和第二親本類別中反射PVAF值的基因座不必需地針對同樣的特定的定相基因型進行。例如，在父本類別中，可W針對其中父本單體型是AB的那些基因座反射PVAF值;而在母本類別中，可 W針對其中母本單體型是BA的那些基因座反射PVAF值。然而，在特定的親本類別中，優(yōu)選在其中所述親本具有特定的定相基因型(例如，針對雙等位基因標記物的任一 AB)的基因座上進行PVAF值的反射。
[0060] 在本發(fā)明的優(yōu)選實施方案中，方法包括：
[0061 ] (a)將樣品的遺傳物質(zhì)的所測定的連續(xù)PVAF值分類在親本PVAF類別中
[0062] (b)將(a)的所述親本PVAF類別進行亞分類并根據(jù)親本定相的PV基因型的特定組合反射所測定的PVAF值。
[0063] 在本發(fā)明的優(yōu)選實施方案中，單體型分型的/定相的和分段的PVAF模式提供獨立的單體型域檢出。
[0064] 在本發(fā)明的優(yōu)選實施方案中，將親本得分和所述單體型分型的/定相的和分段的 PVAF模式用于標準化DNA量值(在本文中也被稱為(相對)拷貝數(shù)值）（例如10排)和測定樣品的遺傳物質(zhì)的二體染色體。
[0065] 在本發(fā)明的優(yōu)選實施方案中，方法還可包括將所述標準化的（相對)拷貝數(shù)值(例如Io曲)或具有單體型分型的/定相的和分段的PVAF模式的拷貝數(shù)圖譜進行整合，W掲示樣品的遺傳物質(zhì)中不同異常的不同標志（S ignature)。
[0066] 在特定實施方案中，將連續(xù)PVAF值分類在對應于第一親本的類別中包括：
[0067] -使用第一親本和任選第二親本的基因型信息測定針對第一親本提供信息的基因座；W及
[0068] -將針對第一親本提供信息的所述基因座上的受試者的遺傳物質(zhì)的連續(xù)PVAF值分類在對應于第一親本的類別中。
[0069] 在另一個特定實施方案中，將來自對應于第一親本的類別的連續(xù)PVAF值進行亞分類包括：
[0070] -測定具有第一親本和第二親本的特定基因型組合的基因座；
[0071] -將具有第一親本和第二親本的特定基因型組合的所述基因座上的受試者的遺傳物質(zhì)的連續(xù)PVAF值進行亞分類。
[0072] 在本發(fā)明的優(yōu)選實施方案中，使用分段法進行分段。本領域技術人員知曉適用于將分類(亞分類)的PVAF值進行分段的分段法，諸如包括K均值算法的聚類分段法。在

完整全部詳細技術資料下載

當前第1頁1 2 3 4 5 6

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：M·扎馬尼埃斯特基;J·韋爾米徐;T·富特;
技術所有人：勒芬天主教大學;
我是此專利的發(fā)明人

上一篇：用于媒體的發(fā)現(xiàn)時機貨幣化的系統(tǒng)和方法
上一篇：用于信息檢索系統(tǒng)的搜索引擎的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用多態(tài)性變體等位基因頻率進行單體型分型和拷貝數(shù)分型的制作方法