欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

包含假結(jié)的rna結(jié)構(gòu)預(yù)測(cè)方法

文檔序號(hào):6402192閱讀:777來(lái)源:國(guó)知局
專利名稱:包含假結(jié)的rna結(jié)構(gòu)預(yù)測(cè)方法
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息工程領(lǐng)域,涉及一種對(duì)核糖核酸(在下文中,簡(jiǎn)稱為RNA)的進(jìn)行預(yù)測(cè)的方法,尤其涉及包含假結(jié)的RNA結(jié)構(gòu)預(yù)測(cè)方法。
背景技術(shù)
假結(jié)(pseudoknot,亦稱偽結(jié))是包含至少兩個(gè)莖環(huán)結(jié)構(gòu)的核酸三級(jí)結(jié)構(gòu),其中,兩個(gè)莖環(huán)之一的一半插在另一莖環(huán)的兩半之間。1982年首次在蕪菁花葉病毒(turnip yellowmosaic virus)中發(fā)現(xiàn)了假結(jié)。假結(jié)折疊成結(jié)形的三維立體構(gòu)象,但不是真正的拓?fù)浣Y(jié)。實(shí)際上,預(yù)測(cè)帶假結(jié)的最小自由能RNA結(jié)構(gòu)的一般問(wèn)題已被證明是NP完全問(wèn)題。然而,許多重要的生物方法依賴于對(duì)帶假結(jié)的RNA結(jié)構(gòu)的預(yù)測(cè)。例如,端粒酶RNA組分(Telomerase RNA component,參考

圖1)包含對(duì)其活性至關(guān)重要的假結(jié)。許多病毒使用假結(jié)結(jié)構(gòu)形成類似tRNA基序(tRNA-like motif )滲透到宿主細(xì)胞。具有廣泛的三級(jí)結(jié)構(gòu)的RNA分子往往有大量的假結(jié)。然而,由于假結(jié)結(jié)構(gòu)的上下文敏感性(context-sensitivity)或“重疊”的特性,難于對(duì)它進(jìn)行生物計(jì)算檢測(cè)。假結(jié)的堿基配對(duì)沒(méi)有很好的嵌套,換而言之,堿基對(duì)在序列中彼此重疊出現(xiàn)。這使得現(xiàn)有的動(dòng)態(tài)規(guī)劃的標(biāo)準(zhǔn)方法(standard method of dynamicprogramming)難于預(yù)設(shè)核糖核酸(在下文中,簡(jiǎn)稱為RNA)中的假結(jié)序列。較新的隨機(jī)上下文無(wú)關(guān)方法(method of stochastic context-free grammars)也遇到了同樣的問(wèn)題。在較流行的Mfold和Pfold等二級(jí)結(jié)構(gòu)預(yù)測(cè)方法中,甚至不會(huì)去預(yù)測(cè)的RNA序列中存在的假結(jié)結(jié)構(gòu)。因此,如何盡量提高對(duì)帶假結(jié)的RNA結(jié)構(gòu)系列的預(yù)測(cè)的敏感性和特異性,是一個(gè)亟待解決的科學(xué)難題。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題之一是需要提供一種能夠降低時(shí)間和空間復(fù)雜度的對(duì)包含假結(jié)的RNA結(jié)構(gòu)進(jìn)行預(yù)測(cè)的方法。為了解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種包含假結(jié)的RNA結(jié)構(gòu)預(yù)測(cè)方法。該方法包括:步驟S10,確定待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,包括假結(jié),把所有已知存在的結(jié)構(gòu)單元放入結(jié)構(gòu)單元池Stl=Is1, S2, S3,…sn}, η為結(jié)構(gòu)單元總數(shù),Sn表示第η個(gè)結(jié)構(gòu)單元;步驟S20,基于待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,通過(guò)迭代確定U= (U1, U2,..., Ur,…,UE}, Ur表示第r次迭代得到的RNA結(jié)構(gòu)能量較小的RNA結(jié)構(gòu),R為總迭代次數(shù);步驟S30,根據(jù)Ur中各元素的自由能及其在RNA結(jié)構(gòu)中結(jié)構(gòu)單元出現(xiàn)頻率的總和,分別確定Ur中各元素與實(shí)際RNA結(jié)構(gòu)的相似值;步驟S40,將U中相似值高的元素預(yù)測(cè)為該待預(yù)測(cè)RNA序列的RNA結(jié)構(gòu)。其中,所述基于待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,通過(guò)迭代確定U= (U17U2,…,Ur, -,Ue)的步驟,進(jìn)一步包括 :子步驟S201,對(duì)結(jié)構(gòu)單元Ur賦空值,Ur表示第r次折疊得到的RNA結(jié)構(gòu);將迭代次數(shù)K初始化為I ;子步驟S202,通過(guò)子步驟S203至子步驟S204執(zhí)行K次折疊處理;子步驟S203,逐個(gè)判斷S中的結(jié)構(gòu)單元Si是否能夠使得當(dāng)前的RNA結(jié)構(gòu)Ur的自由能減少且Si與Ur中的結(jié)構(gòu)單元不重疊,若判斷為是,則K=K+1,將Si并入^,然后返回子步驟S202以進(jìn)行下一次折疊,反之,若判斷為否,則繼續(xù)判斷S中的si+1是否能夠使得當(dāng)前的RNA結(jié)構(gòu)Ur的自由能減少且Si與Ur中的結(jié)構(gòu)單元不重疊,直到對(duì)S中的所有元素進(jìn)行了判斷;子步驟S204,若對(duì)S中的所有元素進(jìn)行了判斷,表示S中已經(jīng)不存在能夠減少RNA結(jié)構(gòu)Ur的自由能量的結(jié)構(gòu)單元,則本次迭代結(jié)束。進(jìn)一步,所述子步驟S203利用下述表達(dá)式來(lái)計(jì)算當(dāng)前的RNA結(jié)構(gòu)Ur的自由能:
權(quán)利要求
1.一種包含假結(jié)的RNA結(jié)構(gòu)預(yù)測(cè)方法,其特征在于,包括: 步驟S10,確定待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,包括假結(jié),把所有已知存在的結(jié)構(gòu)單元放入結(jié)構(gòu)單元池Stl=Is1, S2, S3,…sn}, η為結(jié)構(gòu)單元總數(shù),Sn表示第η個(gè)結(jié)構(gòu)單元;步驟S20,基于待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,通過(guò)迭代確定U= {U1;U2,-,Ur,…,UE}, Ur表示第r次迭代得到的RNA結(jié)構(gòu)能量較小的RNA結(jié)構(gòu),R為總迭代次數(shù); 步驟S30,根據(jù)Ur中各元素的自由能及其在RNA結(jié)構(gòu)中結(jié)構(gòu)單元出現(xiàn)頻率的總和,分別確定Ur中各元素與實(shí)際RNA結(jié)構(gòu)的相似值; 步驟S40,將U中相似值高的元素預(yù)測(cè)為該待預(yù)測(cè)RNA序列的RNA結(jié)構(gòu)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,通過(guò)迭代確定U= (U1, U2,..., Ur,..., υκ}的步驟,進(jìn)一步包括: 子步驟S201,對(duì)結(jié)構(gòu)單元Ur賦空值,Ur表示第r次折疊得到的RNA結(jié)構(gòu);將迭代次數(shù)K初始化為I ; 子步驟S202,通過(guò)子步驟S203至子步驟S204執(zhí)行K次折疊處理; 子步驟S203,逐個(gè)判斷S中的結(jié)構(gòu)單元Si是否能夠使得當(dāng)前的RNA結(jié)構(gòu)Ur的自由能減少且Si與I中的結(jié)構(gòu)單元不重疊,若判斷為是,則K=K+1,將Si并入I,然后返回子步驟S202以進(jìn)行下一次折疊,反之,若判斷為否,則繼續(xù)判斷S中的si+1是否能夠使得當(dāng)前的RNA結(jié)構(gòu)Ur的自由能減少且Si與Ur中的結(jié)構(gòu)單元不重疊,直到對(duì)S中的所有元素進(jìn)行了判斷;子步驟S204,若對(duì)S中的所有元素進(jìn)行了判斷,表示S中已經(jīng)不存在能夠減少RNA結(jié)構(gòu)Ur的自由能量的結(jié)構(gòu)單元,則本次迭代結(jié)束。
3.根據(jù)權(quán)利要 求2所述的方法,其特征在于,所述子步驟S203利用下述表達(dá)式來(lái)計(jì)算當(dāng)前的RNA結(jié)構(gòu)I的自由能: Enest Emuitii00p+Estem+Ebuige+Einteri00p +Ehai_+EA,其中, E表示RNA結(jié)構(gòu)的自由能; Enest表示RNA結(jié)構(gòu)中嵌套結(jié)構(gòu)的能量,Emultiloop是RNA結(jié)構(gòu)中多分枝環(huán)的能量,Estem是RNA結(jié)構(gòu)中莖區(qū)的能量,Ebulge是RNA結(jié)構(gòu)中凸起的能量,Einteltrap是RNA結(jié)構(gòu)中內(nèi)環(huán)的能量,Ehairpin是RNA結(jié)構(gòu)中發(fā)卡環(huán)的能量,Ea是各結(jié)構(gòu)單元的補(bǔ)償連接參數(shù); Epseudo表示RNA結(jié)構(gòu)中假結(jié)的能量。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過(guò)如下表達(dá)式來(lái)計(jì)算RNA結(jié)構(gòu)Ur中假結(jié)的能量: Epseudo =A1Sb+A2Pb+A3Nb+A4+A5 A1是產(chǎn)生一個(gè)假結(jié)結(jié)構(gòu)中子假結(jié)的能量值,Sb是假結(jié)結(jié)構(gòu)中子假結(jié)的個(gè)數(shù),Pb是假結(jié)內(nèi)部邊界上的配對(duì)堿基對(duì)個(gè)數(shù),Nb是假結(jié)內(nèi)部未配對(duì)的堿基個(gè)數(shù),A2、A3分別是Pb和Nb的能量值,可由實(shí)驗(yàn)測(cè)出,A4是假結(jié)中的同軸堆積能權(quán)值,A5是RNA結(jié)構(gòu)單元之間的連接參數(shù),連接參數(shù)表示RNA假結(jié)與RNA結(jié)構(gòu)單元之間的連接修正值。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的方法,其特征在于,步驟S30中,依據(jù)以下表達(dá)式來(lái)計(jì)算U中各元素與實(shí)際RNA結(jié)構(gòu)的相似值:Function (Ur) =E (Ur) X a/n+P (Ur) Xb+c, r e [1,k] 其中,F(xiàn)unction(Ur)表示U1^與實(shí)際RNA結(jié)構(gòu)的相似值; E(Ur)表示結(jié)構(gòu)單元14的自由能; a,b、C、k是常數(shù); η表示RNA堿基序列長(zhǎng)度; P(Ur)表示Ur中的結(jié)構(gòu)單元在RNA結(jié)構(gòu)中出現(xiàn)頻率的總和。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,a∈[5,15],b∈[l,8],c∈[l,10],k∈ [90,110]。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,a=10,b=3, c=5, k=100。
全文摘要
本發(fā)明公開(kāi)了一種包含假結(jié)的RNA結(jié)構(gòu)預(yù)測(cè)方法。該方法包括確定待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,包括假結(jié),把所有已知存在的結(jié)構(gòu)單元放入結(jié)構(gòu)單元池S0={s1,s2,s3,…sn},n為結(jié)構(gòu)單元總數(shù),sn表示第n個(gè)結(jié)構(gòu)單元;基于待預(yù)測(cè)RNA序列中的所有結(jié)構(gòu)單元,通過(guò)迭代確定U={U1,U2,…,Ur,…,UR},Ur表示第r次迭代得到的RNA結(jié)構(gòu)能量較小的RNA結(jié)構(gòu),R為總迭代次數(shù);根據(jù)Ur中各元素的自由能及其在所有的RNA結(jié)構(gòu)中出現(xiàn)頻率的總和,分別確定Ur中各元素與實(shí)際RNA結(jié)構(gòu)的相似值;將U中相似值高的元素預(yù)測(cè)為該待預(yù)測(cè)RNA序列的RNA結(jié)構(gòu)。本發(fā)明能夠降低RNA結(jié)構(gòu)的預(yù)測(cè)的時(shí)間、空間復(fù)雜度,提高預(yù)測(cè)敏感性和特異性。
文檔編號(hào)G06F19/18GK103235902SQ20131013638
公開(kāi)日2013年8月7日 申請(qǐng)日期2013年4月18日 優(yōu)先權(quán)日2013年4月18日
發(fā)明者劉振棟, 張鵬, 崔巍, 張志軍, 李躍軍, 柳楠, 徐功文 申請(qǐng)人:山東建筑大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
关岭| 宁夏| 荃湾区| 邹平县| 甘肃省| 长治县| 株洲市| 金寨县| 大安市| 永靖县| 临邑县| 正阳县| 屏南县| 鄱阳县| 许昌县| 镇赉县| 峡江县| 夏邑县| 中牟县| 镇康县| 福泉市| 乌兰察布市| 尤溪县| 宣化县| 梓潼县| 中山市| 资阳市| 晋宁县| 广河县| 射阳县| 浦县| 鄯善县| 綦江县| 马关县| 富源县| 安塞县| 兴海县| 资溪县| 宁海县| 封开县| 阿合奇县|