欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

利用高通量測序同時測定基因表達量和多聚腺苷酸加尾的方法

文檔序號:411628閱讀:931來源:國知局
專利名稱:利用高通量測序同時測定基因表達量和多聚腺苷酸加尾的方法
技術(shù)領(lǐng)域
本發(fā)明屬于基因組學(xué)技術(shù)領(lǐng)域,具體涉及一種利用高通量測序(或下一代測序)技術(shù)同時測定真核生物基因組中基因的表達量和多聚腺苷酸加尾的方法。
背景技術(shù)
中心法則是現(xiàn)代分子生物學(xué)最重要也是最基本的規(guī)律。遺傳信息通過轉(zhuǎn)錄從DNA到RNA,再通過翻譯從RNA到蛋白質(zhì)。而轉(zhuǎn)錄是遺傳信息流的第一步,對于轉(zhuǎn)錄的調(diào)控也是基因表達最重要的調(diào)控手段之一。近年來高通量測序技術(shù)(或下一代測序),特別是RNA測序(RNA-seq)技術(shù)的飛速發(fā)展,給真核生物轉(zhuǎn)錄組的研究帶來了的革命性的影響。由于RNA測序技術(shù)通量更高、更準(zhǔn)確、更靈敏,同時價格還在不斷下降,因此已經(jīng)日漸成為基礎(chǔ)生物 學(xué)研究和生物醫(yī)學(xué)研究的常規(guī)技術(shù)。與微陣列(Microarray)技術(shù)不同,RNA測序不依賴于已有的基因注釋,因此除了檢測已知基因,還能夠發(fā)現(xiàn)許多新的轉(zhuǎn)錄體。近些年,許多研究已經(jīng)利用RNA-seq發(fā)現(xiàn)了新的選擇性剪接異構(gòu)體(Alternative splicing isoform)、基因間的長鏈非編碼RNA (longintergenic non-coding RNA, IincRNA)以及短鏈非編碼RNA。為了進一步驗證天然反義轉(zhuǎn)錄體(Natural Antisense Transcripts)在許多物種中的廣泛性,研究人員進一步開發(fā)了鏈特異性的RNA測序技術(shù)(Strand-specific RNA-seq)。由于在測序文庫的構(gòu)建過程中保留了 RNA的鏈信息,因此這種改進的RNA測序技術(shù)不僅能夠發(fā)現(xiàn)新的反義轉(zhuǎn)錄體,同時也能夠區(qū)分內(nèi)含子中的信號是來源于內(nèi)含子保留還是反義轉(zhuǎn)錄體??梢哉f,目前對于轉(zhuǎn)錄組的研究正經(jīng)歷著一場革命,許多以前所沒有發(fā)現(xiàn)的轉(zhuǎn)錄體由于下一代測序技術(shù)愈來愈高的通量而被不斷發(fā)現(xiàn)。這些新轉(zhuǎn)錄體的生物學(xué)功能也被越來越多的研究證實。由于選擇性啟動子、選擇性剪接和選擇性PolyA加尾是引起眾多轉(zhuǎn)錄異構(gòu)體的原因,因此研究者們開發(fā)了許多RNA測序的變種用于專門研究轉(zhuǎn)錄的起始位點(從而確定選擇性啟動子)、3’末端形成(從而確定選擇性PolyA加尾)。眾所周知,不同的PolyA加尾位點可以導(dǎo)致同一轉(zhuǎn)錄體不同的3’UTR (3,Untranslated Region, 3端非翻譯區(qū))長度。由于3’ UTR含有眾多的RNA順式調(diào)控元件,比如亞細胞定位元件、RNA穩(wěn)定性元件、微RNA(microRNA, miRNA)結(jié)合元件及PolyA加尾信號等,因此3’ UTR的長度對于基因的轉(zhuǎn)錄后調(diào)控具有重要的作用。研究發(fā)現(xiàn),3’UTR的某些點突變可導(dǎo)致嚴(yán)重的疾病。不少基因中3’UTR上的DNA刪除與癌癥的產(chǎn)生密切相關(guān)。Adrian Wiestner等人發(fā)現(xiàn)在細胞周期蛋白Dl (CCNDl)上的點突變和DNA刪除可以導(dǎo)致具有較短3’ UTR的信使RNA的表達,并與套細胞淋巴瘤的高增殖性和低存活率密切相關(guān)。因此,全基因組PolyA位點的精確定位對于深入理解疾病產(chǎn)生的機制具有重要意義。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠簡單、精確、經(jīng)濟的同時檢測基因表達量和多聚腺苷酸加尾位點的方法。本發(fā)明提供的同時檢測基因表達量和多聚腺苷酸加尾位點的方法,采用高通量測序技術(shù)。本方法的關(guān)鍵之處是在逆轉(zhuǎn)錄時引入可被切除的特殊堿基,從而去除多余的腺苷酸,達到直接測定PoIyA (PA)位點的目的。同已有方法相比,本方法更為簡單、精確和省錢。由于本方法無需polyA+ RNA的純化,直接進行逆轉(zhuǎn)錄,因此更簡單;由于采用雙端測序策略從而能進一步增加可用的序列,因此更精確;由于這一方法既能精確測定PA位點,又能可靠確定基因表達量,因此更省錢。同時本方法具有的鏈特異性巧妙設(shè)計還有一個額外好處,就是能夠測定反義轉(zhuǎn)錄體的PA位點。本發(fā)明方法主要為一種高通量測序文庫的構(gòu)建新方法(簡稱PA_seq)。起始材料為總RNA,終產(chǎn)物為擴增后的雙鏈DNA測序文庫。該文庫經(jīng)高通量測序(比如Illumina的GAIIx測序平臺或HiSeq2000/HiSeq2500測序平臺)后獲得基因表達及多聚腺苷酸(PolyA)加尾的基礎(chǔ)數(shù)據(jù),再經(jīng)過生物信息學(xué)分析獲得真核生物基因組中基因的表達量和多聚腺苷酸加尾的詳細信息,從而可用于人類重要疾病(如癌癥、心血管相關(guān)疾病、糖尿病、神經(jīng)退行 性疾病、出生缺陷疾病等)的早期診斷、治療中對藥物的反應(yīng)和預(yù)后預(yù)測。利用高通量測序同時測定真核生物基因組中基因的表達量和多聚腺苷酸加尾的方法,具體步驟如下直接片段化總RNA,在逆轉(zhuǎn)錄時引入可被切除的特殊堿基dUTP,用磁珠純化雙鏈DNA,用USER酶識別dUTP并釋放磁珠上的雙鏈DN ;該雙鏈DNA經(jīng)末端補平后加上一個3端腺苷酸突出;連接反應(yīng)經(jīng)純化和片段大小選擇后用相應(yīng)的PCR引物擴增,獲得可用于高通量測序的文庫;構(gòu)建的文庫可以單端測序,也可以雙端測序;該文庫經(jīng)高通量測序(比如Illumina的GAIIx測序平臺或HiSeq2000/HiSeq2500測序平臺)后獲得基因表達及多聚腺苷酸(PolyA)加尾的基礎(chǔ)數(shù)據(jù),再經(jīng)過生物信息學(xué)分析獲得真核生物基因組中基因的表達量和多聚腺苷酸加尾的詳細信息。高通量測序文庫構(gòu)建的具體操作過程如下總RNA經(jīng)TRIzoI試劑或其它常規(guī)方法提取后,用DNaseI酶處理以便除去混有的基因組DNA污染。純化后的總RNA在鎂離子作用下高溫片段化,之后用于逆轉(zhuǎn)錄。逆轉(zhuǎn)錄采用經(jīng)過生物素和脫氧尿嘧啶(dUTP)修飾的寡聚胸腺嘧啶(oligo(dT)),并用DNA polymerase I和RNase H進行雙鏈DNA的合成。產(chǎn)生的雙鏈DNA在磁珠(Streptavidin MyOne magnetic beads)的結(jié)合純化后用一種特殊的酶(USER,尿苷酸特異的糖苷酶和內(nèi)切酶)消化,從而釋放出切除后的雙鏈DNA。該雙鏈DNA經(jīng)末端補平后加上一個3端腺苷酸突出,用于連接Illumina接頭或SOLiD接頭或454接頭。連接反應(yīng)經(jīng)純化和片段大小選擇后用相應(yīng)的PCR引物擴增,從而獲得可用于高通量測序的特殊文庫。該文庫可以單端測序,也可以雙端測序。文庫構(gòu)建的細節(jié)見具體實施方式
部分。所述總RNA來源所涉及的物種包括人、猩猩、獼猴、大鼠、小鼠、果蠅、斑馬魚、線蟲、擬南芥、水稻、棉花、油菜、酵母及瘧原蟲。文庫適用的平臺包括Illumina GAIIx 平臺、Illumina HiSeq2000、IlluminaHiSeq2500、Illumina MySeq 平臺、454 測序平臺、ABI S0LiD4、ABI 5500 系列測序平臺及ABI Ion Torrent的高通量測序。


圖I是PA-seq方法不意圖。其中磁珠為Invitrogen公司的Dynabeads MyOne Cl。
圖2是利用PA-seq方法測定人胰腺中的基因多聚腺苷酸位點在基因組瀏覽器上的信號。圖中舉例列出了 2號染色體上約20kb的一段區(qū)域,由4個基因組成。左側(cè)的數(shù)字表示短序列數(shù),可以反應(yīng)表達量?;蜃⑨尣捎肦efSeq系統(tǒng),最粗的實線表示基因的外顯子,基因兩側(cè)的較粗實線表示5端和3端的非翻譯區(qū)。最細的實線表示內(nèi)含子,上面的箭頭表不基因轉(zhuǎn)錄的方向。每個基因的名字在左側(cè)顯不。圖3 是 PA-seq 方法和微陣列(Affymatrix Microarry, Affy array)方法對同一樣品的基因表達相關(guān)性圖。兩個方法的相關(guān)系數(shù)(R)為0.64,與目前公認(rèn)的高通量測序和微陣列兩個方法之間的相關(guān)性(0. 6^0. 7) 一致 ,表明本專利的PA-seq方法可以用來反映基因的表達量。圖4是不同人組織中基因的選擇性PolyA加尾情況。左側(cè)的超氧化物岐化酶基因有兩個選擇性PolyA加尾位點,從胰腺到睪丸到心臟,平均的3端非翻譯區(qū)(3’UTR)長度不斷縮短。右側(cè)的羥酰輔酶A脫氫酶基因選擇性PolyA加尾模式?jīng)]有變化。圖5是人細胞周期素Dl (CCNDl)基因在正常免疫T細胞和人B淋巴瘤細胞系中的PolyA加尾情況。人細胞周期素Dl基因的突變導(dǎo)致的新增PolyA位點被認(rèn)為是引起B(yǎng)淋巴瘤(一種白細胞癌癥,又稱白血病)的一個重要原因。PA-seq技術(shù)能很可靠地檢測出B細胞中的新增PolyA位點。圖6是利用PA-seq方法測定小鼠中全基因組水平PolyA加尾的有關(guān)Sodl基因的結(jié)果。由圖可知本方法能可靠檢測出已知的PolyA加尾位點和基因表達量。同時一個新的PoIyA加尾位點也被檢測出,并且在不同條件下使用比例不同。
具體實施例方式所有實施例中的有關(guān)DNA和RNA基本操作均參考《分子克隆實驗室操作指南》(金冬雁等譯,科學(xué)出版社,北京(1993))和《精編分子生物學(xué)指南》(顏子穎等譯,科學(xué)出版社,北京(1998))。分子操作中所用的酶和特殊試劑在之后括號中均注明了相應(yīng)的公司。實施例I 總RNA的片段化和逆轉(zhuǎn)錄
總RNA(包括人、猩猩、獼猴、大鼠、小鼠、果蠅、斑馬魚、線蟲、擬南芥、水稻、棉花、油菜、酵母及痕原蟲)經(jīng)TRIzol試劑(Invitrogen)或其它常規(guī)方法提取后,用RNeasy Mini試劑盒(Qiagen)及DNaseI酶(Qiagen)處理以便除去混有的基因組DNA污染。純化后的總RNA用Nanodrop (Thermol)測定濃度后取出IOug (微克)用于文庫構(gòu)建。RNA溶于30ul (微升)片段化緩沖液中(40 mM Tris-HAc (pH 8.2),100 mM KAc and 30 mM MgAc2)并于 94°C加熱3min (分鐘)達到片段化目的。RNA片段可用Ambion公司的GlycoBlue幫助乙醇沉淀純化。純化后的RNA在50ul體系中進行逆轉(zhuǎn)錄,包括10 pmol oligo(dT)引物(序列如下5’-bio-TTTTTTTTTTTTTTTTdUTTTVN-3’ (SEQ ID NO. I ),其中 bio 為雙生物素修飾,dU為脫氧尿嘧啶,V為除T外的任何核苷酸,N為任何核苷酸),2ul superscript II逆轉(zhuǎn)錄酶(Invitrogen), 100 單位的 RNA 酶抑制劑 RNasin (Promega)以及新配制的 actinomycinD (來自USB公司,用于抑制逆轉(zhuǎn)錄酶所具有的依賴DNA的DNA聚合酶活性)。逆轉(zhuǎn)錄體系在42°C孵育2分鐘后再加逆轉(zhuǎn)錄酶并混勻。之后保持在42°C共I小時,隨后加熱到75°C共15分鐘使逆轉(zhuǎn)錄酶失活。反應(yīng)可在4°C長期保存。我們采用ZYMO Research公司的ZYMOclean & concentrator-5試劑盒進行純化并洗脫于20ul無核酸酶的純水中。
實施例2 :雙鏈DNA的合成
20ul逆轉(zhuǎn)錄純化產(chǎn)物于50ul反應(yīng)體系中進行雙鏈DNA的合成。緩沖液體系為500 mMTris-HCl, pH7. 8,50 mM MgC12, 10 mM DTT0在冰上放置5分鐘后加入25單位的DNApolymerase I (NEB), I 個單位的 RNase H (NEB)和 15pmol 的 dNTP (Bioline)。混勻后于15°C保持2. 5小時。 實施例3 磁珠純化雙鏈DNA
每個起始樣品需要50ul的Dynabeads MyOne Cl (Invitrogen)磁珠來純化。磁珠的純化按照Invitrogen公司提供的標(biāo)準(zhǔn)流程。兩輪洗脫后將磁珠懸浮于44 ul 10 mM Tris-HCl(pH7. 4)溶液中,加入Iul APex熱不穩(wěn)定性堿性磷酸酶(Epicentre)和5ul IOx Apex緩沖液(Epicentre)?;靹蚝笤?7°C孵育10分鐘,然后移至70°C加熱滅活5分鐘。磁珠接著 用300ul Ix結(jié)合與洗脫緩沖液洗兩次,300ul 10 mM Tris-HCl (pH 7. 4)洗一次,最后混勻于 48 ii I TEl 緩沖液中(IOmM Tris-HCl, 0. ImM EDTA, pH8. 0)。實施例4 =USER酶消化
在48ul含有磁珠的TEl緩沖液中加入2ul USER酶(NEB)并在600轉(zhuǎn)/分鐘的37°C混勻儀中保持I小時,雙鏈DNA將中磁珠上釋放出來。離心管在磁架上放置2分鐘分離上清和磁珠。取出上清并用ZYMO Research公司的clean & concentrator-5試劑盒純化雙鏈DNA。DNA洗脫于20ul純水中。實施例5 :雙鏈DNA的補平和3端加腺苷酸
我們用3個單位的T4 DNA聚合酶(NEB)和300uM的dNTP (Bioline)在I倍的NEB常規(guī)緩沖液2中反應(yīng)。該反應(yīng)體系在15°C保持15分鐘,然后用ZYMO Research公司的clean
&concentrator-5試劑盒純化并洗脫至20ul純水中。純化并補平的DNA用Klenow (exo_)DNA聚合酶(Epicentre)和200 u M dATP加上3端腺苷酸突出。該反應(yīng)體系在37°C保持30分鐘,然后用ZYMO Research公司的clean & concentrator-5試劑盒純化并洗脫至7ul純水中。實施例6 :接頭的連接反應(yīng)
在實施例5中得到的7ul DNA中加入Iul 10倍T4 DNA連接酶緩沖液、3pmol的Illumina公司接頭(或者SOLiD平臺接頭)和Iul高濃度T4 DNA連接酶(NEB; 2000 units/U I)?;靹蚝笤谑覝胤胖?0分鐘,隨后用ZYMO Research公司的clean & concentrator-5試劑盒純化并洗脫至20ul純水中。將20ul連接并純化后的產(chǎn)物跑2%的瓊脂糖凝膠電泳,切出250_450bp片段并用ZYMO Research公司的DNA Recovery試劑盒純化并洗脫至20ul純水中。實施例7 :低循環(huán)PCR擴增
用于我們用堿性磷酸酶去除了信使RNA相同的鏈上的磷酸基團,因此只有另一條鏈能夠被連接。在50ul的PCR體系中含有以下成分20ul的沖實施例6中獲得的DNA模版、I倍濃度的Finnnzymes公司的HF緩沖液、I nmol dNTP>25 pmol的正向引物(5,- AAT GATACG GCG ACC ACC GAG ATC TAC ACT CTT TCC CTA CAC GAC GCT CTT CCG ATC T_3’ (SEQID NO. 2 和 25 pmol 的反向引物(5,- CAA GCA GAA GAC GGC ATA CGA GAT CGG TCT CGGCAT TCC TGC TGA ACC GCT CTT CCG ATC T_3’ (SEQ ID NO. 3))以及 0. 5 y I 的 Phusion高忠誠度DNA聚合酶(Finnzymes)。熱循環(huán)的參數(shù)如下98 ° C for 30s; 16 cycles of98 ° C for 10s, 67 ° C for 30s and 72 ° C for 30s; 72 ° C for 10 min; hold at10° C0取出20ulPCR產(chǎn)物跑2%瓊脂糖凝膠電泳,切出300-500bp產(chǎn)物并用ZYMO Research公司的DNA Recovery試劑盒純化并洗脫至20ul純水中。用Qubit突光儀(Invitrogen)測定文庫的濃度。加入終濃度為0. 1%的Tween-20用于測序前的樣品保存。用Illumina公司的GAIIx或HiSeq2000/2500或MySeq進行雙端的測序,每端測定50個堿基。454測序文庫、ABI SOLiD 4文庫、ABI 5500文庫及ABI Ion Torrent文庫采用對應(yīng)的測序儀測序。文庫的構(gòu)建除接頭不同需用對應(yīng)的PCR引物外,其余均完全一樣。實施例8 :生物信息學(xué)分析
混合樣品的原始數(shù)據(jù)通過構(gòu)建文庫時所用的條形碼進行分開。由于左側(cè)短序列(readI)的前三個堿基在設(shè)計時為“TTT”,因此在比對之前需要去除。對于人的樣品,我們用序列比對軟件bwa(采用默認(rèn)參數(shù))將其映射到人的最新基因組hgl9版本上。大鼠、小鼠以及其它樣品分別用對應(yīng)的最新基因組進行映射。分析所用到的工具包括samtools,bamtools以及bedtools,均為開放源軟件。我們將所有具有唯一映射位置的短序列用于下游的多聚 腺苷酸加尾位點的分析。由于多聚腺苷酸位點(polyadenylation site, PA位點)成簇,因此我們采用了 F-seq這一算法對鑒定出的原始PA位點進行成簇化。我們采用RefSeq作為基因注釋系統(tǒng)。
權(quán)利要求
1.ー種利用高通量測序同時測定真核生物基因組中基因的表達量和多聚腺苷酸加尾的方法,其特征在于具體步驟為直接片段化總RNA ;在逆轉(zhuǎn)錄時引入可被切除的特殊堿基dUTP ;用磁珠純化雙鏈DNA,用USER酶識別dUTP并釋放磁珠上的雙鏈DNA ;該雙鏈DNA經(jīng)末端補平后加上ー個3端腺苷酸突出;連接反應(yīng)經(jīng)純化和片段大小選擇后用相應(yīng)的PCR引物擴增,獲得可用于高通量測序的文庫;構(gòu)建的文庫可以單端測序,也可以雙端測序;該文庫經(jīng)高通量測序,獲得基因表達及多聚腺苷酸加尾的基礎(chǔ)數(shù)據(jù),再經(jīng)過生物信息學(xué)分析獲得真核生物基因組中基因的表達量和多聚腺苷酸加尾的詳細信息。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于高通量測序文庫構(gòu)建的具體過程如下總RNA經(jīng)TRIzol試劑或其它常規(guī)方法提取后,用DNaseI酶處理以便除去混有的基因組DNA污染;純化后的總RNA在鎂離子作用下高溫片段化,之后用于逆轉(zhuǎn)錄;逆轉(zhuǎn)錄采用經(jīng)過生物素和脫氧尿嘧啶修飾的寡聚胸腺嘧啶,并用DNA polymerase I和RNase H進行雙鏈DNA的合成;產(chǎn)生的雙鏈DNA在磁珠的結(jié)合純化后用尿苷酸特異的糖苷酶和內(nèi)切酶消化,從而釋放出切除后的雙鏈DNA ;該雙鏈DNA經(jīng)末端補平后加上ー個3端腺苷酸突出,用于連接Illumina接頭或SOLiD接頭或454接頭;連接反應(yīng)經(jīng)純化和片段大小選擇后用相應(yīng)的PCR 弓I物擴增,獲得可用于高通量測序的文庫。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于總RNA來源于人、猩猩、獼猴、大鼠、小鼠、果蠅、斑馬魚、線蟲、擬南芥、水稻、棉花、油菜、酵母或瘧原蟲。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于構(gòu)建的文庫可用于IlluminaGAIIx平臺、Illumina HiSeq2000、Illumina HiSeq2500、Illumina MySeq 平臺、454 測序平臺、ABIS0LiD4、ABI 5500系列測序平臺及ABI Ion Torrent的高通量測序。
全文摘要
本發(fā)明屬于基因組學(xué)技術(shù)領(lǐng)域,具體涉及一種利用高通量測序同時測定真核生物基因組中基因的表達量和多聚腺苷酸加尾的方法。本方法在逆轉(zhuǎn)錄時引入可被切除的特殊堿基,從而去除多余的腺苷酸,達到直接測定PolyA位點的目的。本方法無需信使RNA的純化,直接進行逆轉(zhuǎn)錄,因此更簡單;由于采用雙端測序,因此更精確;本方法既能精確測定PolyA位點,又能可靠確定基因表達量,因此更省錢。該文庫經(jīng)高通量測序后獲得基因表達及PolyA加尾的基礎(chǔ)數(shù)據(jù),再經(jīng)過生物信息學(xué)分析獲得基因的表達量和PolyA加尾的詳細信息,為人類重要疾病的早期診斷和預(yù)后預(yù)測提供分析依據(jù)。
文檔編號C12Q1/68GK102732629SQ20121021399
公開日2012年10月17日 申請日期2012年8月1日 優(yōu)先權(quán)日2012年8月1日
發(fā)明者倪挺, 魏剛 申請人:復(fù)旦大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
浙江省| 临汾市| 贵溪市| 临武县| 广安市| 清镇市| 新巴尔虎右旗| 合阳县| 繁昌县| 陕西省| 黔江区| 曲阳县| 广东省| 微博| 平谷区| 团风县| 铜山县| 遵化市| 赞皇县| 黔东| 凉城县| 光山县| 宁强县| 封丘县| 武乡县| 株洲市| 华池县| 焦作市| 凌海市| 句容市| 阿拉善左旗| 泸水县| 隆子县| 英德市| 吐鲁番市| 河南省| 遵义县| 灵璧县| 榆林市| 镇赉县| 沧源|