欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種影響rna剪接的snv檢測(cè)方法

文檔序號(hào):10613128閱讀:2561來(lái)源:國(guó)知局
一種影響rna剪接的snv檢測(cè)方法
【專利摘要】本發(fā)明提供了一種影響RNA剪接的SNV檢測(cè)方法,包括以下步驟:1)根據(jù)SNP文件的位點(diǎn)信息和基因組序列信息,提取突變前后該位點(diǎn)上下游100bp的序列和反向互補(bǔ)序列;2)用步驟1)提取的序列,基于最大熵原理、馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)三種不同的方法分別預(yù)測(cè)剪接位點(diǎn);3)根據(jù)三種方法的預(yù)測(cè)評(píng)分結(jié)果進(jìn)行整合,篩選對(duì)RNA剪接產(chǎn)生影響的SNV。本發(fā)明通過(guò)整合這三種方法,以SNV數(shù)據(jù)作為輸入,來(lái)預(yù)測(cè)突變前后RNA剪接的變化,獲得影響RNA剪接的SNV,有效的提高預(yù)測(cè)的準(zhǔn)確性,為生物實(shí)驗(yàn)和臨床研究提供參考。
【專利說(shuō)明】
一種影響RNA剪接的SNV檢測(cè)方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于基因信息數(shù)據(jù)處理領(lǐng)域,特別是涉及到一種影響RNA剪接的SNV檢測(cè)方法。
【背景技術(shù)】
[0002]RNA剪接是在前體mRNA中,刪除內(nèi)含子連接外顯子,生成成熟mRNA的過(guò)程。RNA剪接是基因調(diào)控中的一個(gè)重要部分。調(diào)控RNA剪接的機(jī)制很復(fù)雜,涉及許多RNA結(jié)合蛋白。剪接過(guò)程需要識(shí)別外顯子內(nèi)含子的邊界。發(fā)生在外顯子內(nèi)含子邊界的SNV,可導(dǎo)致RNA剪接發(fā)生改變,影響mRNA的有效翻譯,導(dǎo)致人類疾病的發(fā)生。因此,研究SNV對(duì)RNA剪接的影響至關(guān)重要。
[0003]大多數(shù)真核生物中,內(nèi)含子的5’端邊界或donor剪接位點(diǎn)通常包含二核苷酸GT,而內(nèi)含子的3’端邊界或acceptor剪接位點(diǎn)通常包含二核苷酸AG。除了這些二聚體,一個(gè)富含啼啶的區(qū)域通常出現(xiàn)在acceptor剪接位點(diǎn)AG之前,剪接分支點(diǎn)在acceptor上游?30nt的區(qū)域。
[0004]目前,有許多用于識(shí)別剪接位點(diǎn)的軟件,例如,genefinders,HumanSpl icingFinder。這要求我們提高剪接位點(diǎn)預(yù)測(cè)準(zhǔn)確性,同時(shí)也給我們提供了一個(gè)整合不同算法的軟件來(lái)預(yù)測(cè)剪接位點(diǎn)的機(jī)會(huì),使得我們能夠準(zhǔn)確的預(yù)測(cè)SNV對(duì)RNA剪接的影響。

【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明提出一種影響RNA剪接的SNV檢測(cè)方法,預(yù)測(cè)突變前后RNA剪接的變化,獲得影響RNA剪接的SNV,有效的提高預(yù)測(cè)的準(zhǔn)確性,為生物實(shí)驗(yàn)和臨床研究提供參考。
[0006]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:一種影響RNA剪接的SNV檢測(cè)方法,包括以下步驟:
[0007]I)根據(jù)SNP文件的位點(diǎn)信息和基因組序列信息,提取突變前后該位點(diǎn)上下游10bp的序列和反向互補(bǔ)序列;
[0008]2)用步驟I)提取的序列,基于最大熵原理、馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)三種不同的方法分別預(yù)測(cè)剪接位點(diǎn);
[0009]3)根據(jù)三種方法的預(yù)測(cè)評(píng)分結(jié)果進(jìn)行整合,篩選對(duì)RNA剪接產(chǎn)生影響的SNV。
[0010]進(jìn)一步的,步驟2)所述的基于最大熵原理預(yù)測(cè)剪接位點(diǎn)的方法是使用Maxentscan軟件進(jìn)行計(jì)算。
[0011]進(jìn)一步的,步驟2)所述的基于馬爾科夫模型預(yù)測(cè)剪接位點(diǎn)的方法是使用GeneSplicer軟件進(jìn)行計(jì)算。
[0012]進(jìn)一步的,步驟2)所述的基于人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)剪接位點(diǎn)的方法是使用NetGene2軟件進(jìn)行計(jì)算。
[0013]進(jìn)一步的,步驟3)對(duì)三種方法的得分情況整合生成剪接位點(diǎn)評(píng)估表,然后進(jìn)行篩選。
[0014]相對(duì)于現(xiàn)有技術(shù),本發(fā)明所述的一種影響RNA剪接的SNV檢測(cè)方法具有以下優(yōu)勢(shì):
[0015]本發(fā)明整合不同算法的軟件來(lái)預(yù)測(cè)剪接位點(diǎn)的機(jī)會(huì),MaxEntScan、GeneSplicer、NetGene2分別是基因最大信息熵、馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)三個(gè)不同的方法預(yù)測(cè)剪接位點(diǎn)的軟件,本發(fā)明通過(guò)整合這三個(gè)軟件以SNV數(shù)據(jù)作為輸入,來(lái)預(yù)測(cè)突變前后RNA剪接的變化,獲得影響RNA剪接的SNV,有效的提高預(yù)測(cè)的準(zhǔn)確性,為生物實(shí)驗(yàn)和臨床研究提供參考。
【附圖說(shuō)明】
[0016]構(gòu)成本發(fā)明的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0017]圖1為本發(fā)明的流程示意圖。
[0018]圖2為本發(fā)明的輸入文件實(shí)例。
[0019]圖3為本發(fā)明的MaxEntScan預(yù)測(cè)donor site實(shí)例。
[0020]圖4為本發(fā)明的GeneSplicer預(yù)測(cè)實(shí)例。
[0021]圖5為本發(fā)明的NetGene2預(yù)測(cè)結(jié)果實(shí)例。
[0022]圖6為本發(fā)明的結(jié)果文件格式。
【具體實(shí)施方式】
[0023]需要說(shuō)明的是,在不沖突的情況下,本發(fā)明的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0024]下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0025]本發(fā)明的方法原理:
[0026]本發(fā)明預(yù)測(cè)SNV對(duì)RNA剪接的影響,整合了三個(gè)基于不同算法預(yù)測(cè)RNA剪接位點(diǎn)的軟件,以SNV信息的文件作為輸入,提取突變前后發(fā)生SNV的位點(diǎn)上下游10bp的序列和它們的方向互補(bǔ)序列預(yù)測(cè)剪接位點(diǎn),從而,得到突變前后DNA正鏈和負(fù)鏈RNA剪接位點(diǎn)的變化信息。
[0027]首先,提取序列,本發(fā)明不僅提取了基因組中無(wú)突變發(fā)生時(shí)正常的序列片段作為對(duì)照,還提取了這些序列的反向互補(bǔ)序列,本發(fā)明可以預(yù)測(cè)出突變位點(diǎn)的相反鏈的RNA剪接現(xiàn)象是否收到影響。
[0028]然后,預(yù)測(cè)剪接位點(diǎn),用上面描述的方法提取的序列,作為三個(gè)軟件的輸入(其中Maxentscan需要做滑窗處理)。需要強(qiáng)調(diào)的是,Maxentscan,Genesplicer,NetGene2這三個(gè)軟件分別是基于最大熵原理、馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)三個(gè)不同的方法來(lái)預(yù)測(cè)剪接位點(diǎn)的。本發(fā)明整合了這三個(gè)軟件可以提高預(yù)測(cè)的準(zhǔn)確性,降低假陽(yáng)性率。
[0029]最后,根據(jù)三個(gè)軟件的評(píng)分結(jié)果,篩選對(duì)RNA剪接產(chǎn)生影響的SNV。
[0030]下面結(jié)合附圖作詳細(xì)說(shuō)明:
[0031](I)提取序列
[0032]本發(fā)明的輸入文件為常見(jiàn)的SNP文件,如圖2所示。根據(jù)SNP的位點(diǎn)信息和基因組序列信息,提取突變前后該位點(diǎn)上下游10bp的序列和反向互補(bǔ)序列。
[0033](2)計(jì)算剪接位點(diǎn)得分
[0034]MaxEntScan軟件,預(yù)測(cè)donor site要求輸入9bp的序列(3個(gè)核苷酸位于外顯子中,6個(gè)核苷酸位于內(nèi)含子中),預(yù)測(cè)acceptor site需要輸入23bp的序列(20個(gè)核苷酸位于內(nèi)含子中,3個(gè)核苷酸位于外顯子中)。本軟件采用滑窗處理201bp長(zhǎng)度的序列,作為輸入計(jì)算MaxEntScan得分,結(jié)果如圖3所示。結(jié)果文件是兩列的txt文件,第一列為序列,第二列為得分,得分越高的位點(diǎn)是真實(shí)的剪接位點(diǎn)的可能性越高。
[0035]GeneSplicer軟件是基于馬爾科夫模型預(yù)測(cè)剪接位點(diǎn)的軟件,它的輸出結(jié)果如圖4所示。結(jié)果為4列的文件,前兩列分別為剪接位點(diǎn)的在序列5’和3’的位置,第三列為剪接位點(diǎn)的預(yù)測(cè)得分,第四列,為預(yù)測(cè)的置信度,第五列為剪接位點(diǎn)的類型(donor或acceptor)。
[0036]NetGene2是基于人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)剪接位點(diǎn)得分的軟件。結(jié)果文件如圖5所示。第一條序列沒(méi)有預(yù)測(cè)出剪接位點(diǎn),而第二條序列的5’端開(kāi)始的第102個(gè)核苷酸位置為donor位點(diǎn),并且置信度為0.34。
[0037](3)整合結(jié)果
[0038]對(duì)三個(gè)軟件的得分情況整合生成剪接位點(diǎn)評(píng)估表,如圖6所示。前四列分別為SNP的信息(染色體號(hào)、位置、突變前堿基、突變后堿基),中間幾列MaxEnt Scan,GeneSplicer,Ne tGene2三個(gè)軟件就突變前后RNA剪接位點(diǎn)的預(yù)測(cè)得分,最后一列是整合三個(gè)軟件分析后的結(jié)果。
[0039]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種影響RNA剪接的SNV檢測(cè)方法,其特征在于,包括以下步驟: 1)根據(jù)SNP文件的位點(diǎn)信息和基因組序列信息,提取突變前后該位點(diǎn)上下游10bp的序列和反向互補(bǔ)序列; 2)用步驟I)提取的序列,基于最大熵原理、馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)三種不同的方法分別預(yù)測(cè)剪接位點(diǎn); 3)根據(jù)三種方法的預(yù)測(cè)評(píng)分結(jié)果進(jìn)行整合,篩選對(duì)RNA剪接產(chǎn)生影響的SNV。2.根據(jù)權(quán)利要求1所述的一種影響RNA剪接的SNV檢測(cè)方法,其特征在于,步驟2)所述的基于最大熵原理預(yù)測(cè)剪接位點(diǎn)的方法是使用Maxentscan軟件進(jìn)行計(jì)算。3.根據(jù)權(quán)利要求1所述的一種影響RNA剪接的SNV檢測(cè)方法,其特征在于,步驟2)所述的基于馬爾科夫模型預(yù)測(cè)剪接位點(diǎn)的方法是使用GeneSplicer軟件進(jìn)行計(jì)算。4.根據(jù)權(quán)利要求1所述的一種影響RNA剪接的SNV檢測(cè)方法,其特征在于,步驟2)所述的基于人工神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)剪接位點(diǎn)的方法是使用NetGene2軟件進(jìn)行計(jì)算。5.根據(jù)權(quán)利要求1所述的一種影響RNA剪接的SNV檢測(cè)方法,其特征在于,步驟3)對(duì)三種方法的得分情況整合生成剪接位點(diǎn)評(píng)估表,然后進(jìn)行篩選。
【文檔編號(hào)】G06F19/22GK105975809SQ201610318326
【公開(kāi)日】2016年9月28日
【申請(qǐng)日】2016年5月13日
【發(fā)明人】薛成海, 馬熹, 李連碩
【申請(qǐng)人】萬(wàn)康源(天津)基因科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乡宁县| 虎林市| 兰考县| 海安县| 油尖旺区| 鲁山县| 鄢陵县| 通榆县| 扬中市| 时尚| 沂南县| 五家渠市| 青浦区| 樟树市| 密山市| 图们市| 富锦市| 年辖:市辖区| 汉阴县| 苗栗市| 曲周县| 蓬安县| 武穴市| 睢宁县| 迭部县| 云阳县| 信阳市| 尼勒克县| 阳东县| 迁安市| 额尔古纳市| 突泉县| 永顺县| 阿拉尔市| 锡林浩特市| 株洲县| 安国市| 绵竹市| 阿尔山市| 都兰县| 尤溪县|