一種遺傳代謝病的篩查方法和試劑盒的制作方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明屬于遺傳檢測,特別涉及基因突變的檢測。
【背景技術(shù)】
[0002] 遺傳代謝病是因維持機(jī)體正常代謝所必需的某些由多肽和(或)蛋白組成的酶、 受體、載體及膜栗生物合成發(fā)生遺傳缺陷,即編碼這類多肽(蛋白)的基因發(fā)生突變而導(dǎo)致 的疾病。多為單基因遺傳病,遺傳代謝病一部分病因由基因遺傳導(dǎo)致,還有一部分是后天基 因突變造成,發(fā)病期不僅僅是新生兒,覆蓋全年齡階段。
[0003] 遺傳代謝病對(duì)人體損傷極大,常見有神經(jīng)系統(tǒng)異常、代謝性酸中毒和酮癥、嚴(yán)重嘔 吐、肝臟腫大或肝功能不全、特殊氣味、容貌怪異、皮膚和毛發(fā)異常、眼部異常、耳聾等,多數(shù) 遺傳代謝病伴有神經(jīng)系統(tǒng)異常,在新生兒期發(fā)病者可表現(xiàn)為急性腦病,造成癡呆、腦癱、甚 至昏迷、死亡等嚴(yán)重并發(fā)癥。
[0004] 隨著高通量測序技術(shù)的發(fā)展與成熟,人全基因組測序已經(jīng)成為遺傳代謝病相關(guān)致 病基因突變研究和診斷的重要工具。通過全基因組測序?qū)Ρ粶y樣本進(jìn)行全基因組掃描,可 實(shí)現(xiàn)對(duì)基因突變零遺漏,從而成為遺傳代謝病相關(guān)致病基因突變研究和診斷的有效工具。
[0005] 由于人類基因組的大小約為3Gb,對(duì)其進(jìn)行全基因組測序總計(jì)約需90Gb測序數(shù) 據(jù)。巨大的數(shù)據(jù)量要求所致高昂的測序成本,導(dǎo)致全基因組測序應(yīng)用于遺傳代謝病的基因 診斷受到限制。
[0006] 全基因組測序需要產(chǎn)生大量的測序數(shù)據(jù)量,測序成本高,因此測序深度不可能太 深。對(duì)于檢查基因突變而言,想要實(shí)現(xiàn)突變檢查的零遺漏,全基因組測序確實(shí)難以擔(dān)當(dāng)此 任。特別是對(duì)于,一次檢測數(shù)百個(gè)基因上發(fā)生的所有突變,高深度測序才能實(shí)現(xiàn)對(duì)突變檢測 的準(zhǔn)確性。
[0007] 因此,開發(fā)一款價(jià)格低廉的,準(zhǔn)確性高的基因突變檢查產(chǎn)品,特別是對(duì)于遺傳代謝 病基因突變的診斷產(chǎn)品,具有重要的作用。
【發(fā)明內(nèi)容】
[0008] 在第一方面,本發(fā)明涉及一種制備基因DNA探針文庫的方法:
[0009] 1)針對(duì)所述基因的編碼序列,由5'往3'方向,按照序列反向互補(bǔ)的原則,從第 一個(gè)堿基開始設(shè)計(jì)長度為110_130bp的探針序列,并且每兩個(gè)相鄰的探針序列之間存在重 疊,所述每兩個(gè)相鄰的探針序列之間重疊是所述探針長度的1/2或2/3 ;
[0010] 2)在每個(gè)探針序列的5'端和3'端,分別添加TAGGTGTGTAGGCGC(SEQIDNO. 1)和 GTCAGCTAGTACGCA(SEQIDNO. 2)序列,形成兩端帶有同樣序列的探針序列;
[0011] 3)合成上述探針序列,形成寡核苷酸混合物;
[0012] 4)通過PCR的方法,采用5'端均帶有標(biāo)記(例如生物素標(biāo)記)的正向引物(SEQ IDNO. 3 :TTAGATAGGTGTGTAGGCGC)和反向引物(SEQIDNO. 4 :TAAGGTGCGTACTAGCTGAC),對(duì) 寡核苷酸混合物進(jìn)行擴(kuò)增,形成帶標(biāo)記(例如生物素標(biāo)記)的基因DNA探針文庫。
[0013] 在一個(gè)實(shí)施方案中,步驟3)中的采用寡核苷酸原位合成技術(shù),在芯片上進(jìn)行寡核 苷酸的大規(guī)模合成上述探針序列,將芯片上的寡核苷酸洗脫下列,形成寡核苷酸混合物。
[0014] 在一個(gè)實(shí)施方案中,所述基因選自表1中示出的遺傳代謝病相關(guān)致病基因,例如 表1中的所有基因。
[0015] 在一個(gè)實(shí)施方案中,所述探針序列的長度為120bp,所述探針在每兩個(gè)相鄰的探針 序列之間存在60bp或80bp的重疊。
[0016] 在一個(gè)實(shí)施方案中,所述探針序列的長度為114bp,所述探針在每兩個(gè)相鄰的探針 序列之間存在76bp的重疊。該優(yōu)選實(shí)施方案中的所述方法,特別適合于檢測選自表2 (優(yōu) 選表3)中示出的遺傳代謝病相關(guān)致病基因,例如表3中的所有基因。
[0017] 在一個(gè)實(shí)施方案中,所述基因選自表3中示出的遺傳代謝病相關(guān)致病基因,例如 表3中的所有基因。
[0018] 在第二方面,本發(fā)明涉及本發(fā)明第一方面的方法制備的基因DNA探針文庫和包括 所述基因DNA探針文庫的試劑盒。
[0019] 在第三方面,本發(fā)明涉及一種利用試劑盒篩查受試者基因突變的方法,所述方法 包括:
[0020] 1)提取所述受試者的基因組DNA,打斷至200-300bp的范圍;
[0021] 2)對(duì)上述打碎的基因組DNA進(jìn)行DNA小片段文庫的制備;
[0022] 3)將DNA小片段文庫和本發(fā)明第二方面的基因DNA探針文庫進(jìn)行雜交,進(jìn)行基因 的捕獲;
[0023] 4)采用PCR,以SEQIDN0. 5 :
[0024] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT和SEQID NO. 6 :
[0025] CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT為引物, 對(duì)上述捕獲后的產(chǎn)物進(jìn)行擴(kuò)增,得到擴(kuò)增產(chǎn)物;
[0026] 5)對(duì)步驟4)中獲得的擴(kuò)增產(chǎn)物進(jìn)行上機(jī)測序,得到所述基因的測序數(shù)據(jù);
[0027] 6)將測序數(shù)據(jù)與到人類參考基因組進(jìn)行比對(duì),從而得到與參考基因組不同的單核 苷酸多態(tài)性、插入或缺失,即所檢測到的基因突變。
[0028] 在一個(gè)實(shí)施方案中,所述人類參考基因組是HG19。
[0029] 在一個(gè)實(shí)施方案中,在步驟2)中采用IlluminaTruSeqDNAlibrary preparation試劑盒,進(jìn)行DNA小片段文庫的制備。
[0030] 本發(fā)明的方法和試劑盒至少有如下優(yōu)點(diǎn):
[0031] 相對(duì)于全基因組測序,大大節(jié)約了所需要的測序數(shù)據(jù)量;
[0032] -次性檢測疾病相關(guān)致病基因的所有突變,實(shí)現(xiàn)對(duì)疾病基因診斷的零遺漏,為疾 病的治療和干預(yù)提供保障;
[0033] 高深度的測序,實(shí)現(xiàn)對(duì)基因突變的高準(zhǔn)確性檢測;
[0034] 成本低,一次檢測數(shù)百個(gè)基因上發(fā)生的所有突變;
[0035] 高深度測序?qū)崿F(xiàn)對(duì)突變檢測的準(zhǔn)確性。
【具體實(shí)施方式】
[0036] 通過參考示范性實(shí)施例,本發(fā)明的目的和功能以及用于實(shí)現(xiàn)這些目的和功能的方 法將得以闡明。然而,本發(fā)明并不受限于以下所公開的示范性實(shí)施例;可以通過不同形式來 對(duì)其加以實(shí)現(xiàn)。說明書的實(shí)質(zhì)僅僅是幫助相關(guān)領(lǐng)域技術(shù)人員綜合理解本發(fā)明的具體細(xì)節(jié)。
[0037] 在本發(fā)明中,針對(duì)基因的編碼序列,由5'往3'方向,按照序列反向互補(bǔ)的原則,從 第一個(gè)堿基開始設(shè)計(jì)長度為110_130bp的探針序列,優(yōu)選120bp,并且每兩個(gè)相鄰的探針序 列之間存在重疊,所述每兩個(gè)相鄰的探針序列之間重疊是所述探針長度的1/2或2/3。對(duì) 于所述探針序列的長度,大于130bp會(huì)帶來合成上的困難,小于llObp-是其捕獲能力降 低,二是會(huì)增加探針數(shù)量,從而增加成本,二者平衡非常重要,發(fā)明人經(jīng)過不斷試驗(yàn),得到了 110-130bp的較優(yōu)值。對(duì)于所述探針在每兩個(gè)相鄰的探針序列之間的重疊,所述每兩個(gè)相鄰 的探針序列之間重疊是所述探針長度的1/2或2/3,這是因?yàn)闀?huì)對(duì)每一個(gè)區(qū)域都形成2層或 者3層的探針覆蓋,因此探針覆蓋均勻,進(jìn)而不影響捕獲的均一性,而探針覆蓋不均勻會(huì)影 響到捕獲的均一性。因此,所述每兩個(gè)相鄰的探針序列之間重疊是所述探針長度的1/2或 2/3。在所述每兩個(gè)相鄰的探針序列之間重疊是所述探針長度的1/2的情況下,優(yōu)選探針長 度是偶數(shù);在所述每兩個(gè)相鄰的探針序列之間重疊是所述探針長度的2/3的情況下,優(yōu)選 探針長度是3的整倍數(shù)。但是,在探針長度不是偶數(shù)或3的整倍數(shù)的情況下,所述重疊取所 述探針長度1/2或2/3的近似整數(shù)也是可以的,雖然其效果不如探針長度是偶數(shù)或3的整 倍數(shù)的情況。
[0038] -般而言,所述探針長度較短時(shí),比如110_120bp之間,優(yōu)選所述每兩個(gè)相鄰的探 針序列之間重疊是所述探針長度的2/3。這樣雖然探針的捕獲能力較低,但探針的覆蓋增 加50%,效果反而更好。從性價(jià)比的角度看,優(yōu)選所述探針長度為111或114、所述每兩個(gè) 相鄰的探針序列之間重疊是所述探針長度的2/3的情況。
[0039] 在本發(fā)明中,在每個(gè)探針序列的5 '端和3 '端,分別添加TAGGTGTGTAGGCGC(SEQID NO. 1)和GTCAGCTAGTACGCA(SEQIDNO. 2)序列,這是為了PCR擴(kuò)增富集探針而加入的引物 結(jié)合序列,這樣使用一對(duì)引物即可實(shí)現(xiàn)對(duì)所有探針的擴(kuò)增。
[0040] 在本發(fā)明中,對(duì)于正向引物(SEQIDNO. 3 :TTAGATAGGTGTGTAGGCGC)和反向引物 (SEQIDNO. 4 :TAAGGTGCGTACTAGCTGAC),選擇這對(duì)引物是因?yàn)樗鼈冊谌嘶蚪M上沒有同源 序列,對(duì)PCR擴(kuò)增不會(huì)產(chǎn)生干擾,它們自身之間也沒有重疊和干擾。
[0041] 實(shí)施例
[0042] 1.遺傳代謝病相關(guān)致病基因的試劑盒制備
[0043] 所述試劑盒包括如下方法制備的遺傳代謝病相關(guān)致病基因DNA探針文庫:
[0044] 1)根據(jù)人類參考基因組HG19,結(jié)合Ensembl、CCDS、Gencode、VEGA、SNP以及 CytoBand數(shù)據(jù)庫,獲取以下表1中遺傳代謝病相關(guān)致病基因的所有編碼序列;
[0045] 表1遺傳代謝病相關(guān)致病基因列表
[0046] (基因名稱來自http://www.genenames.org/):
[0047]
[0048] 2)針對(duì)每個(gè)編碼序列,由5'往3'方向,按照序列反向互補(bǔ)的原則,從第一個(gè)堿基 開始設(shè)計(jì)長度為120bp的探針序列,并且每兩個(gè)相鄰的探針序列之間存在60bp的重疊;
[0049] 3)在每個(gè)探針序列的5'端和3'端,分別添加TAGGTGTGTAGGCGC(SEQIDNO. 1)和 GTCAGCTAGTACGCA(SEQIDNO. 2)序列,形成兩端帶有同樣序列的探針序列列表;
[0050] 4)采用寡核苷酸原位合成技術(shù),在芯片上進(jìn)行寡核苷酸的大規(guī)模合成上述探針序 列列表中的序列;
[0051] 5)用氨水將芯片上的寡核苷酸洗脫下列,溶于100微升的超純水中,形成寡核苷 酸混合物;
[0052] 6)通過PCR的方法,采用5'端帶有生物素標(biāo)記的正向引物(SEQID NO. 3 :TTAGATAGGTGTGTAGGCGC)和5'端帶有同樣標(biāo)記的反向引物(SEQIDNO. 4 : TAAGGTGCGTACTAGCTGAC),對(duì)寡核苷酸混合物進(jìn)行擴(kuò)增,形成帶生物素標(biāo)記的遺傳代謝病相 關(guān)致病基