基于生物云平臺的文章分析系統(tǒng)和方法
【專利摘要】本發(fā)明公開了基于生物云平臺的文章分析系統(tǒng)和方法,其中系統(tǒng)包括:用戶界面模塊、請求分析模塊、圖表呈現(xiàn)模塊、綜合分析模塊;用戶界面模塊用于獲取并發(fā)送用戶請求;請求分析模塊用于接收用戶請求并對用戶請求進行分析,指示將指定的文章內容發(fā)送給圖表呈現(xiàn)模塊;圖表呈現(xiàn)模塊接收并將指定的文章以圖表的形式進行展示;綜合分析模塊根據(jù)圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在圖表呈現(xiàn)模塊進行展示。用戶可以根據(jù)指定的文章內容中所采用的邏輯分析方法對測序數(shù)據(jù)進行分析,最終以圖表呈現(xiàn),圖表與文章中圖表呈現(xiàn)形式高度相似,使得數(shù)據(jù)分析方式不再局限于傳統(tǒng)業(yè)務線流程的單一性,提高對測序數(shù)據(jù)的處理效率。
【專利說明】基于生物云平臺的文章分析系統(tǒng)和方法
【技術領域】
[0001]本發(fā)明涉及生物信息分析【技術領域】,特別涉及一種基于生物云平臺的文章分析系統(tǒng)和方法。
【背景技術】
[0002]隨著高通量測序技術在醫(yī)療、健康、醫(yī)藥、環(huán)境、能源等相關領域的廣泛應用,生物大數(shù)據(jù)時代已經到來。由于采用不同代進行測序,測序得到的高通量原始數(shù)據(jù)是長度不等的序列,要通過生物信息學工具將這些序列組裝成長的鄰接片段甚至是整個基因組的框架,或者把這些序列比對到已有的基因組或者相近物種基因組序列上,并進一步分析得到有生物學意義的結果。
[0003]文章分析模式由于文章間分析思路是不同的,因而分析方式多元化,由于對測序數(shù)據(jù)進行分析所參照的文章在選擇時需要依賴于某個公司業(yè)務線涵蓋的領域技術的支持,因此選定的文章在涵蓋領域上會有一定的偏向性。發(fā)表文章對圖表的格式質量要求較高,有些學者做出的圖表內容極具啟發(fā)性,卻由于格式不符合期刊的指定要求而得不到及時發(fā)表。
[0004]因此利用現(xiàn)有技術的方法,對同一業(yè)務線流程結果具有較強的單一性,如果用戶有新的需求,則需要采用一套全新的系統(tǒng)性的分析方法來進行數(shù)據(jù)分析,這樣就會增加測序成本,而且即便相同的原始數(shù)據(jù)由不同的測序公司進行測序所得到的測序結果也會有所差別,導致測序結果精確度很差。
【發(fā)明內容】
[0005]為了解決現(xiàn)有技術對測序數(shù)據(jù)處理過程中分析方法單一性,處理效率低的技術問題,一方面,
[0006]基于生物云平臺的文章分析系統(tǒng),包括:用戶界面模塊、請求分析模塊、圖表呈現(xiàn)模塊、綜合分析模塊;
[0007]所述用戶界面模塊用于獲取并發(fā)送用戶請求;
[0008]所述請求分析模塊用于接收所述用戶請求并對所述用戶請求進行分析,指示將指定的文章內容發(fā)送給所述圖表呈現(xiàn)模塊;
[0009]所述圖表呈現(xiàn)模塊用于接收所述指定的文章內容并將所述指定的文章以圖表的形式進行展示;
[0010]所述綜合分析模塊根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在所述圖表呈現(xiàn)模塊進行展示。
[0011]可選的,還包括:
[0012]云端數(shù)據(jù)庫,用于存儲測序數(shù)據(jù)和文章,所述用戶請求用于指示從所述云端數(shù)據(jù)庫中選擇符合要求的文章作為指定的文章內容。
[0013]可選的,所述綜合分析模塊包括分析軟件模塊和任務調度模塊;
[0014]所述分析軟件模塊用于以所述圖表呈現(xiàn)模塊中展示的圖表作為模板,根據(jù)所述模板生成對所述測序數(shù)據(jù)進行分析的操作任務;
[0015]所述任務調度模塊用于接收并執(zhí)行所述操作任務,所述操作任務為分析軟件模塊對測序數(shù)據(jù)進行分析后生成的任務。
[0016]可選的,所述綜合分析軟件還包括分析軟件庫,用于存儲各種分析軟件,所述任務調度模塊在執(zhí)行所述操作任務過程中從所述分析軟件庫中選擇相應的分析軟件。
[0017]可選的,所述用戶界面模塊還用于獲取并發(fā)送處理請求,所述處理請求用于指示從所述云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
[0018]可選的,所述用戶界面模塊為網頁WEB圖形化用戶界面模塊。
[0019]可選的,所述指定的文章為整篇文章、整篇文章中的部分圖表或整篇文章中的某一個圖表中的一種。
[0020]另一方面,
[0021]本發(fā)明還提供了基于生物云平臺的文章分析方法,包括:
[0022]接收用戶請求并進行分析,所述用戶請求用于指示從云端數(shù)據(jù)庫中選擇符合要求的文章作為指定的文章內容;
[0023]按照所述用戶請求的指示將指定的文章內容以圖表的形式進行展示;
[0024]根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在所述圖表呈現(xiàn)模塊進行展示。
[0025]可選的,根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析之前還包括:
[0026]獲取并發(fā)送處理請求,其中所述處理請求用于指示從所述云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
[0027]可選的,根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析包括:
[0028]以所述圖表呈現(xiàn)模塊中展示的圖表作為模板,根據(jù)所述模板生成對所述測序數(shù)據(jù)進行分析的操作任務;
[0029]接收并執(zhí)行所述操作任務,所述操作任務為分析軟件模塊對測序數(shù)據(jù)進行分析后生成的任務。
[0030]利用本發(fā)明提供的基于生物云平臺的文章分析系統(tǒng),用戶可以根據(jù)指定的文章內容中所采用的邏輯分析方法對測序數(shù)據(jù)進行分析,最終以圖表呈現(xiàn)。文章分析模式收錄的文章分析方法極具代表性和可重復性并且與傳統(tǒng)測序公司提供的服務有區(qū)別,其分析思路是基于成功發(fā)表的文章中的圖表進行提煉,并且將測序數(shù)據(jù)處理成與指定的文章內容高度相似,可以直接發(fā)表的高質量圖表形式,而且圖表與文章中圖表呈現(xiàn)形式高度相似,使得數(shù)據(jù)分析方式不再局限于傳統(tǒng)業(yè)務線流程的單一性,極大地豐富了對數(shù)據(jù)的實用性,提高對測序數(shù)據(jù)的處理效率。
【專利附圖】
【附圖說明】
[0031]圖1為實施例一提供的基于生物云平臺的文章分析系統(tǒng)的組成結構示意圖;
[0032]圖2為實施例一中文章選擇界面的示意圖;
[0033]圖3為實施例一中對指定的文章內容中摘要以及圖表進行展示的示意圖;
[0034]圖4為實施例一中對測序數(shù)據(jù)按照指定的文章內容的分析思路進行分析得到的圖表不意圖;
[0035]圖5為實施例一中用戶請求以及處理請求參數(shù)輸入的界面示意圖;
[0036]圖6為實施例一中圖表呈現(xiàn)模塊同時呈現(xiàn)指定的文章內容中的圖表與測序數(shù)據(jù)采用同樣的思路進行分析得到的圖表對比圖;
[0037]圖7為實例二提供的基于生物云平臺的文章分析方法的步驟流程圖;
[0038]圖8為實施例二中步驟S3的步驟流程圖。
【具體實施方式】
[0039]下面結合附圖和實施例,對本發(fā)明的【具體實施方式】作進一步詳細描述。以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0040]實施例一
[0041]本實施例提供了基于生物云平臺的文章分析系統(tǒng),組成示意圖如圖1所示,包括:用戶界面模塊10、請求分析模塊20、圖表呈現(xiàn)模塊30、綜合分析模塊40 ;
[0042]用戶界面模塊10用于獲取并發(fā)送用戶請求;
[0043]請求分析模塊20用于接收用戶請求并對用戶請求進行分析,指示將指定的文章內容發(fā)送給圖表呈現(xiàn)模塊30;
[0044]圖表呈現(xiàn)模塊30用于接收指定的文章內容并將指定的文章以圖表的形式進行展示;
[0045]綜合分析模塊40根據(jù)圖表呈現(xiàn)模塊30中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在圖表呈現(xiàn)模塊30進行展示。
[0046]本實施例提供的文章分析系統(tǒng)屬于云平臺文章分析模式,是基于生物云平臺的一種分析模塊,旨在提供一種新的思路,利用已有的優(yōu)秀的文章分析方法對測序數(shù)據(jù)進行分析,并且用高質量可直接發(fā)表的圖表來進行展示,利用這種思路可以打破傳統(tǒng)業(yè)務線流程的單一性,可以節(jié)省對測序數(shù)據(jù)的處理時間,從而提高處理效率。
[0047]可選的,本實施例的系統(tǒng)中還包括:
[0048]云端數(shù)據(jù)庫50,用于存儲測序數(shù)據(jù)和文章,用戶請求用于指示從云端數(shù)據(jù)庫50中選擇符合要求的文章作為指定的文章內容。
[0049]可選的,綜合分析模塊40包括分析軟件模塊41和任務調度模塊42,其中分析軟件模塊41用于以圖表呈現(xiàn)模塊30中展示的圖表作為模板,根據(jù)模板生成對測序數(shù)據(jù)進行分析的操作任務;任務調度模塊42,用于接收并執(zhí)行操作任務,操作任務為分析軟件模塊41對測序數(shù)據(jù)進行分析后生成的任務。
[0050]可選的,綜合分析軟件40還包括分析軟件庫43,用于存儲各種分析軟件,任務調度模塊42在執(zhí)行操作任務過程中從分析軟件庫43選擇相應的分析軟件。
[0051]可選的,用戶界面模塊10還用于獲取并發(fā)送處理請求,處理請求用于指示從云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
[0052]可選的,用戶界面模塊10為網頁WEB圖形化用戶界面模塊,利用圖形化的用戶界面可以方便用戶操作。
[0053]可選的,云端數(shù)據(jù)庫50中的文章來自于nature,nature b1technology,naturegenetics, Cell, PLOS ONE,PNAS,Nucleic Acids Research 中任意一種期刊。云端數(shù)據(jù)庫50中的文章還可以是除上述期刊以外其他生物醫(yī)學期刊,已有的有關生物測序技術的文章,即對文章所在的平臺不做具體限定。
[0054]WEB圖形化用戶界面模塊、請求分析模式模塊、圖表呈現(xiàn)模塊、分析軟件模塊這些模塊操作均基于html5+CSS3+jS的前端頁面和java服務器后臺,任務調度模塊接受到調度命令后,調動Perl、C、Python、R等計算機語言的服務器端腳本。用戶可以根據(jù)所需選擇按照整篇文章呈現(xiàn)或者只選擇其中一部分,最終呈現(xiàn)與文章數(shù)量一致或相差無幾,并且呈現(xiàn)高度相似的高質量圖表。
[0055]按照云端數(shù)據(jù)庫中的測序數(shù)據(jù),根據(jù)指定的文章內容的思路來分析,并且結果圖表在數(shù)量上與文章分析結果一致或相差無幾;在呈現(xiàn)形式方面,表格的表頭與文章中表格一致,圖在圖形上與文章保持一致。系統(tǒng)包括WEB圖形化用戶界面模塊、請求分析模塊、圖表呈現(xiàn)模塊、分析軟件模塊、任務調度模塊,云端數(shù)據(jù)庫,以及包含多種用于生物測序數(shù)據(jù)的分析軟件庫。用戶將生物測序數(shù)據(jù)導入云端數(shù)據(jù)庫,在請求分析模塊中選擇指定文章,WEB圖形化用戶界面模塊接收用戶請求后將指定的文章內容發(fā)送到圖表呈現(xiàn)模塊,圖表呈現(xiàn)模塊將其以圖表形式進行展示,用戶通過圖表呈現(xiàn)模塊瀏覽圖表后,后根據(jù)需求選擇分析軟件,WEB圖形化用戶界面模塊將請求傳至分析軟件模塊,分析軟件模塊接收用戶請求后,在分析軟件庫中選擇相應軟件,將其封裝為操作任務并傳遞給任務調度模塊,任務調度模塊接收操作任務后,根據(jù)調度計劃執(zhí)行任務,并將運行結果返回給圖表呈現(xiàn)模塊,最終將展示的圖表存儲于云端數(shù)據(jù)庫中。
[0056]以下以具體方案為例進行說明:
[0057]用戶利用云平臺文章分析模式平臺對已有生物測序數(shù)據(jù)進行分析,需先進入如圖2所示的文章選擇界面,界面包括文章名稱、作者以及對應的期刊,用戶可以根據(jù)自己需求,選擇所需的文章。進入所選的文章后,其呈現(xiàn)方式如圖3,包括文章名稱、作者、摘要以及文章中的所有圖表,其圖表被劃分為不同模塊,用戶可以點擊“Click to run the mainpipeline of the paper”運行出文章內容所有的圖表,也可以切換模塊對感興趣的模塊點擊“Software for the step”進行模塊分析,還可以點擊感興趣的圖表,對單獨的圖表用自己所選的測序數(shù)據(jù)進行分析。圖4呈現(xiàn)的是用戶點擊單一圖片后出現(xiàn)的頁面,點擊左下角的“software for the graph”將跳轉到圖5中所示的程序參數(shù)填寫頁面。按照說明與案例,用戶將測序數(shù)據(jù)與參數(shù)填寫后,點擊運行,運行成功后將得到如圖6所示的分析結果,圖6中左邊為指定的文章內容已有的圖表,右邊為按照左邊圖表對用戶所選的測序數(shù)據(jù)進行分析得到的圖表。
[0058]利用本發(fā)明提供的基于生物云平臺的文章分析系統(tǒng),用戶可以根據(jù)指定的文章內容中所采用的邏輯分析方法對測序數(shù)據(jù)進行分析,最終以圖表呈現(xiàn)。文章分析模式收錄的文章分析方法極具代表性和可重復性并且與傳統(tǒng)測序公司提供的服務有區(qū)別,其分析思路是基于成功發(fā)表的文章中的圖表進行提煉,并且將測序數(shù)據(jù)處理成與指定的文章內容高度相似,可以直接發(fā)表的高質量圖表形式,而且圖表與文章中圖表呈現(xiàn)形式高度相似,使得數(shù)據(jù)分析方式不再局限于傳統(tǒng)業(yè)務線流程的單一性,極大地豐富了對數(shù)據(jù)的實用性,提高對測序數(shù)據(jù)的處理效率。
[0059]實施例二
[0060]本實施例提供了基于生物云平臺的文章分析方法,步驟流程如圖7所示,包括以下步驟:
[0061]步驟S1、接收用戶請求并進行分析,用戶請求用于指示從云端數(shù)據(jù)庫中選擇符合要求的文章作為指定的文章內容。
[0062]步驟S2、按照用戶請求的指示將指定的文章內容以圖表的形式進行展示。
[0063]步驟S3、根據(jù)圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在圖表呈現(xiàn)模塊進行展示。
[0064]可選的,步驟S3根據(jù)圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析之前還包括:
[0065]步驟S0、獲取并發(fā)送處理請求,其中處理請求用于指示從云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
[0066]可選的,步驟S3根據(jù)圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析的步驟流程如圖8所示,具體包括以下步驟:
[0067]步驟S31、以圖表呈現(xiàn)模塊中展示的圖表作為模板,根據(jù)模板生成對測序數(shù)據(jù)進行分析的操作任務。
[0068]步驟S32、接收并執(zhí)行操作任務,操作任務為分析軟件模塊41對測序數(shù)據(jù)進行分析后生成的任務。
[0069]利用本實施例提供的方法能夠實現(xiàn)與實施例一相同的技術效果,此處不再贅述。
[0070]以上實施方式僅用于說明本發(fā)明,而并非對本發(fā)明的限制,有關【技術領域】的普通技術人員,在不脫離本發(fā)明的精神和范圍的情況下,還可以做出各種變化和變型,因此所有等同的技術方案也屬于本發(fā)明的范疇,本發(fā)明的專利保護范圍應由權利要求限定。
【權利要求】
1.基于生物云平臺的文章分析系統(tǒng),其特征在于,包括:用戶界面模塊、請求分析模塊、圖表呈現(xiàn)模塊、綜合分析模塊; 所述用戶界面模塊用于獲取并發(fā)送用戶請求; 所述請求分析模塊用于接收所述用戶請求并對所述用戶請求進行分析,指示將指定的文章內容發(fā)送給所述圖表呈現(xiàn)模塊; 所述圖表呈現(xiàn)模塊用于接收所述指定的文章內容并將所述指定的文章以圖表的形式進行展示; 所述綜合分析模塊根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在所述圖表呈現(xiàn)模塊進行展示。
2.根據(jù)權利要求1所述的系統(tǒng),其特征在于,還包括: 云端數(shù)據(jù)庫,用于存儲測序數(shù)據(jù)和文章,所述用戶請求用于指示從所述云端數(shù)據(jù)庫中選擇符合要求的文章作為指定的文章內容。
3.根據(jù)權利要求1所述的系統(tǒng),其特征在于,所述綜合分析模塊包括分析軟件模塊和任務調度模塊; 所述分析軟件模塊用于以所述圖表呈現(xiàn)模塊中展示的圖表作為模板,根據(jù)所述模板生成對所述測序數(shù)據(jù)進行分析的操作任務; 所述任務調度模塊用于接收并執(zhí)行所述操作任務,所述操作任務為分析軟件模塊對測序數(shù)據(jù)進行分析后生成的任務。
4.根據(jù)權利要求3所述的系統(tǒng),其特征在于,所述綜合分析軟件還包括分析軟件庫,用于存儲各種分析軟件,所述任務調度模塊在執(zhí)行所述操作任務過程中從所述分析軟件庫中選擇相應的分析軟件。
5.根據(jù)權利要求2所述的系統(tǒng),其特征在于,所述用戶界面模塊還用于獲取并發(fā)送處理請求,所述處理請求用于指示從所述云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
6.根據(jù)權利要求1或5所述的系統(tǒng),其特征在于,所述用戶界面模塊為網頁WEB圖形化用戶界面模塊。
7.根據(jù)權利要求1所述的系統(tǒng),其特征在于,所述指定的文章為整篇文章、整篇文章中的部分圖表或整篇文章中的某一個圖表中的一種。
8.基于生物云平臺的文章分析方法,其特征在于,包括: 接收用戶請求并進行分析,所述用戶請求用于指示從云端數(shù)據(jù)庫中選擇符合要求的文章作為指定的文章內容; 按照所述用戶請求的指示將指定的文章內容以圖表的形式進行展示; 根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析,并將分析結果以圖表形式在所述圖表呈現(xiàn)模塊進行展示。
9.根據(jù)權利要求8所述的方法,其特征在于,根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析之前還包括: 獲取并發(fā)送處理請求,其中所述處理請求用于指示從所述云端數(shù)據(jù)里中選擇測序數(shù)據(jù)。
10.根據(jù)權利要求8所述的方法,其特征在于,根據(jù)所述圖表呈現(xiàn)模塊中展示的圖表對測序數(shù)據(jù)進行分析包括: 以所述圖表呈現(xiàn)模塊中展示的圖表作為模板,根據(jù)所述模板生成對所述測序數(shù)據(jù)進行分析的操作任務; 接收并執(zhí)行所述操作任務,所述操作任務為分析軟件模塊對測序數(shù)據(jù)進行分析后生成的任務。
【文檔編號】G06F19/28GK104462865SQ201410555021
【公開日】2015年3月25日 申請日期:2014年10月17日 優(yōu)先權日:2014年10月17日
【發(fā)明者】鄭洪坤, 劉戈, 劉東源 申請人:北京百邁客生物科技有限公司