專利名稱:基于fpga的rna二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置、系統(tǒng)及其實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置、系統(tǒng)及其實(shí)現(xiàn)方法,特別是涉及一種基于FPGA的RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置、系統(tǒng)及其實(shí)現(xiàn)方法。
背景技術(shù):
從20世紀(jì)80年代開始,隨著基因組測(cè)序數(shù)據(jù)的迅速增加,生物信息學(xué)開始逐漸興起。生物信息學(xué)是通過計(jì)算機(jī)手段和統(tǒng)計(jì)學(xué)方法存儲(chǔ),傳遞,分析和解讀蛋白質(zhì)和核算序列的各種生物信息,以幫助了解生物進(jìn)化和遺傳過程的科學(xué)。與傳統(tǒng)生物學(xué)不同的是,生物信息學(xué)的研究方式不是完全靠實(shí)驗(yàn)手段,而是由數(shù)據(jù)出發(fā),根據(jù)理論推測(cè)出某些結(jié)果,再用實(shí)驗(yàn)的方式來驗(yàn)證該結(jié)果是否正確。由于人類基因組計(jì)劃的實(shí)施,人們獲得了海量的數(shù)據(jù)。如
何從這些海量數(shù)據(jù)中獲取有用的信息是生物信息學(xué)亟需解決的問題。RNA(Ribonucleic Acid,核糖核酸)是生物體中的一種重要的大分子,其既可以攜帶遺傳信息,又可以作為功能分子。目前,人類已經(jīng)獲得大量的RNA —級(jí)結(jié)構(gòu)(PrimaryStructure)的信息。由于在有機(jī)大分子中,功能和結(jié)構(gòu)通常有著密切的聯(lián)系,因此越來越多的研究人員開始關(guān)注RNA的二級(jí)結(jié)構(gòu)(Secondary Structure)以及三級(jí)結(jié)構(gòu)。但利用實(shí)驗(yàn)的方法(主要是X射線晶體衍射和核磁共振)來確定其三級(jí)結(jié)構(gòu)的花費(fèi)高,難度極大,并且不是對(duì)所有的分子都有效。同時(shí)研究人員普遍認(rèn)為,RNA的三級(jí)結(jié)構(gòu)很難通過一級(jí)序列直接得到。直接針對(duì)其三級(jí)結(jié)構(gòu)的理論預(yù)測(cè),目前進(jìn)展都不是很順利,因此預(yù)測(cè)二級(jí)結(jié)構(gòu)是獲取三級(jí)結(jié)構(gòu)的必經(jīng)之路。在這樣的需求背景下,通過計(jì)算機(jī)模擬和預(yù)測(cè)RNA的二級(jí)結(jié)構(gòu),用較低的成本和較快的時(shí)間獲得具有一定可信度的結(jié)果的方式,成為生物信息學(xué)的重要任務(wù)。RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)的本質(zhì)其實(shí)就是找出一級(jí)序列的各個(gè)堿基之間形成的配對(duì)關(guān)系。Nussinov算法是使用動(dòng)態(tài)規(guī)劃實(shí)現(xiàn)RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)的一種經(jīng)典算法。其核心思想是求出堿基序列折疊之后的堿基之間最大的配對(duì)數(shù)。Nussinov算法是一個(gè)標(biāo)準(zhǔn)的動(dòng)態(tài)規(guī)劃過程。假設(shè)序列的長(zhǎng)度為n,最終要計(jì)算序列(1,η)的堿基對(duì)的最大數(shù)目。這個(gè)數(shù)目可以通過求解2個(gè)子問題來解決。如下公式是Nussinov算法的計(jì)算公式。
權(quán)利要求
1.一種基于FPGA的RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,包括 基于向量處理的處理單元,根據(jù)設(shè)定的并行寬度n,在每個(gè)時(shí)鐘周期執(zhí)η次加法操作與η次比較操作,并生成一中間結(jié)果,存儲(chǔ)于存儲(chǔ)器模塊,每次操作的一操作數(shù)由該存儲(chǔ)器模塊提供,另一操作數(shù)由臨時(shí)的操作數(shù)寄存器提供;以及 存儲(chǔ)器模塊,包括存儲(chǔ)單元及臨時(shí)存儲(chǔ)單元,該存儲(chǔ)單元為該基于向量處理的處理單元提供數(shù)據(jù),該臨時(shí)存儲(chǔ)單元為每次運(yùn)算時(shí)該基于向量處理的處理單元運(yùn)算結(jié)果的臨時(shí)存儲(chǔ)。
2.如權(quán)利要求I所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,其特征在于計(jì)算完矩陣每一行的結(jié)果都存在該臨時(shí)存儲(chǔ)單元中,在算下一行的結(jié)果時(shí),會(huì)從該臨時(shí)存儲(chǔ)單元寫回到該存儲(chǔ)單元中,同時(shí)它作為一部分操作數(shù)送入該基于向量處理的處理單元做加法運(yùn)算。
3.如權(quán)利要求2所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,其特征在于RNA序列信息存儲(chǔ)于該存儲(chǔ)單元。
4.一種基于FPGA的RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng),包括 上位機(jī),將RNA序列信息通過網(wǎng)絡(luò)傳給RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,并將其存儲(chǔ)于該預(yù)測(cè)裝置的存儲(chǔ)單元;以及 RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,對(duì)該RNA序列信息形成向量操作數(shù),根據(jù)設(shè)定的并行寬度執(zhí)行Nussinov計(jì)算公式,將結(jié)果寫回存儲(chǔ)單元,并于所有計(jì)算完成后,再將結(jié)果通過網(wǎng)絡(luò)傳回該上位機(jī)。
5.如權(quán)利要求4所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng),其特征在于,該Nussinov計(jì)算公式為
6.如權(quán)利要求4所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng),其特征在于該上位機(jī)為通用計(jì)算機(jī)。
7.—種基于FPGA的RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)之實(shí)現(xiàn)方法,包括如下步驟 步驟一,上位機(jī)將RNA序列的信息傳送至RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置并存儲(chǔ); 步驟二,基于向量處理的處理單元根據(jù)設(shè)定的并行寬度,將RNA序列信息形成向量操作數(shù)后并行執(zhí)行Nussinov算法,并將結(jié)果寫回到存儲(chǔ)單元;以及 步驟三,當(dāng)所有的計(jì)算完成后,將該存儲(chǔ)單元中的數(shù)據(jù)讀出并傳回該上位機(jī)。
8.如權(quán)利要求7所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)之實(shí)現(xiàn)方法,其特征在于于步驟二中,該基于向量處理的處理單元根據(jù)設(shè)定的并行寬度n,在每個(gè)時(shí)鐘周期執(zhí)η次加法操作與η次比較操作,并生成一中間結(jié)果,存儲(chǔ)于該存儲(chǔ)單元。
9.如權(quán)利要求8所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)之實(shí)現(xiàn)方法,其特征在于每次操作的一操作數(shù)由該存儲(chǔ)器模塊提供,另一操作數(shù)由臨時(shí)的操作數(shù)寄存器提供。
10.如權(quán)利要求9所述的基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)系統(tǒng)之實(shí)現(xiàn)方法,其特征在于該上位機(jī)與該RNA 二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置通過高速以太網(wǎng)通信。
全文摘要
本發(fā)明公開一種基于FPGA的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置、系統(tǒng)及其實(shí)現(xiàn)方法,該系統(tǒng)包括上位機(jī),將RNA序列信息通過網(wǎng)絡(luò)傳給RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,并將其存儲(chǔ)于該預(yù)測(cè)裝置的存儲(chǔ)單元;以及RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)裝置,對(duì)該RNA序列信息形成向量操作數(shù),根據(jù)設(shè)定的并行寬度執(zhí)行Nussinov計(jì)算公式,將結(jié)果寫回存儲(chǔ)單元,并于所有計(jì)算完成后,再將結(jié)果通過網(wǎng)絡(luò)傳回該上位機(jī),本發(fā)明通過向量化運(yùn)算的方式,將傳統(tǒng)的每周期進(jìn)行一個(gè)單個(gè)操作數(shù)的運(yùn)算,變成每周期同時(shí)進(jìn)行一次向量操作,每個(gè)向量操作數(shù)由許多個(gè)普通操作數(shù)組成,極大提高了算法的計(jì)算效率。
文檔編號(hào)G06F19/16GK102819692SQ20121028537
公開日2012年12月12日 申請(qǐng)日期2012年8月10日 優(yōu)先權(quán)日2012年8月10日
發(fā)明者付宇卓, 蘇啟龍, 蔣江, 劉婷 申請(qǐng)人:上海交通大學(xué)