本發(fā)明涉及生信分析,更具體地說,涉及一種基因融合檢測panel性能評價方法及裝置。
背景技術(shù):
1、基因融合(gene?fusion)是指在基因組中發(fā)生某種形式的基因拼接,導致兩個或多個基因序列合并成為一個新的融合基因。這種融合可能是由于基因突變、基因重排等遺傳事件引起的。融合基因檢測在醫(yī)學領(lǐng)域具有重要的地位和作用。它不僅可以輔助診斷、病因探尋、預后評估、用藥指導和監(jiān)測微小殘留病等方面發(fā)揮重要作用,還可以為科學研究提供寶貴的資源和數(shù)據(jù)支持。
2、dna水平和rna水平的靶向高通量測序均可檢測基因中融合的存在。在dna水平上,融合斷點位置通常位于較長的內(nèi)含子區(qū)域,且融合的斷裂點變化很大。因此,融合基因檢測要覆蓋非常冗長且含有大量重復序列的內(nèi)含子區(qū)域,而且,不同基因的內(nèi)含子含有非常相似的重復序列,不利于準確報出融合。rna靶向測序檢測融合基因具有高度敏感性和特異性,可以檢測到低表達水平的融合基因,從而提高檢測的敏感性。此外,靶向特定的rna序列可以減少假陽性結(jié)果,增強檢測的特異性。還可以提供基因融合的定量信息,這對于了解基因融合在疾病發(fā)展和治療反應中的作用非常重要。rna靶向測序檢測可以實現(xiàn)高通量檢測,不需要事先了解融合伴侶基因的信息,即可發(fā)現(xiàn)以前未知的基因融合事件。
3、近年來已有多種rna融合檢測panel,覆蓋融合基因組合范圍從小于100個到近千個。融合檢測panel檢出性能的評價對于臨床決策的準確性、個性化治療方案的制定、新藥研發(fā)與臨床試驗的推進、疾病預后的評估以及提升檢測技術(shù)的可信度等方面都具有極其重要的意義。目前主要是通過商業(yè)化標準品對融合檢測panel的檢出性能進行評價。但是,商業(yè)化標準品僅包含幾十個融合基因,并不能全面、客觀地對融合檢測panel對全部融合基因檢出性能進行評價。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種基因融合檢測panel性能評價方法及裝置,用于解決無法對基因融合檢測panel性能全面、客觀評價的問題。
2、為實現(xiàn)上述目的,現(xiàn)提出的方案如下:
3、一種基因融合檢測panel性能評價方法,包括:
4、基于預先構(gòu)建的融合基因轉(zhuǎn)錄本數(shù)據(jù)庫,合成不同類型的已知融合基因單鏈dna,用于模擬未知融合基因組合,其中,融合基因單鏈dna包括位于5’端的t7啟動子、融合基因序列以及位于3’端的反向擴增引物;
5、對融合基因單鏈dna進行擴增,構(gòu)建測序文庫;
6、對融合基因單鏈dna擴增產(chǎn)物進行轉(zhuǎn)錄,構(gòu)建轉(zhuǎn)錄組文庫;
7、使用待評價檢測panel對轉(zhuǎn)錄組文庫進行捕獲;
8、對捕獲的轉(zhuǎn)錄本進行測序,得到測序數(shù)據(jù);
9、對測序數(shù)據(jù)進行數(shù)據(jù)處理;
10、判斷處理后的測序數(shù)據(jù)是否通過質(zhì)控;
11、若通過,則基于處理后的測序數(shù)據(jù)分析目標融合檢出情況,得到待評價檢測panel對融合基因的檢出性能。
12、優(yōu)選地,合成不同類型的已知融合基因單鏈dna的過程,包括:
13、將每個已知融合基因的融合斷點定位在3’及5’端,用于模擬融合基因轉(zhuǎn)錄本的狀態(tài);
14、將融合核心基因與伴侶基因分別與固定序列組合,模擬第一類未知融合基因;
15、將核心基因非熱點外顯子與隨機選擇的基因外顯子組合,模擬第二類未知融合基因;
16、設(shè)計內(nèi)參與性別基因轉(zhuǎn)錄本。
17、優(yōu)選地,在對融合基因單鏈dna進行擴增之后,還包括:
18、基于標準生物信息學分析方法對測序文庫中的融合基因單鏈dna進行分析,統(tǒng)計每個融合基因的支持reads數(shù)。
19、優(yōu)選地,統(tǒng)計每個融合基因的支持reads數(shù),包括:
20、若融合基因與目標融合基因序列完全一致判定為支持reads,其中,目標融合基因序列是預設(shè)序列。
21、優(yōu)選地,還包括:
22、對核心基因與伴侶基因熱點區(qū)域外顯子區(qū)域增加標簽,作為檢測對照。
23、優(yōu)選地,還包括:
24、通過高通量測序檢測轉(zhuǎn)錄組文庫的融合基因轉(zhuǎn)錄本的豐度;
25、采用ddpcr對轉(zhuǎn)錄組文庫中目標基因拷貝數(shù)進行絕對定量,得到每個融合基因轉(zhuǎn)錄本的拷貝數(shù)。
26、優(yōu)選地,對測序數(shù)據(jù)進行數(shù)據(jù)處理的過程,包括:
27、將測序數(shù)據(jù)中的接頭序列、低質(zhì)量的堿基片段以及核糖體rna進行去除;
28、對測序數(shù)據(jù)中重復reads進行標記。
29、優(yōu)選地,判斷處理后的測序數(shù)據(jù)是否通過質(zhì)控的過程,包括:
30、根據(jù)測序數(shù)據(jù)的堿基質(zhì)量值、持家基因表達量和質(zhì)控基因表達量判斷測序數(shù)據(jù)是否通過質(zhì)控。
31、一種基因融合檢測panel性能評價裝置,包括:
32、基因序列存儲單元,用于存儲融合基因轉(zhuǎn)錄本數(shù)據(jù),以供基于預先構(gòu)建的融合基因轉(zhuǎn)錄本數(shù)據(jù)庫,合成不同類型的已知融合基因單鏈dna,用于模擬未知融合基因組合,其中,融合基因單鏈dna包括位于5’端的t7啟動子、融合基因序列以及位于3’端的反向擴增引物;對融合基因單鏈dna進行擴增,構(gòu)建測序文庫;對融合基因單鏈dna擴增產(chǎn)物進行轉(zhuǎn)錄,構(gòu)建轉(zhuǎn)錄組文庫;使用待評價檢測panel對轉(zhuǎn)錄組文庫進行捕獲;
33、測序單元,用于對捕獲的轉(zhuǎn)錄本進行測序,得到測序數(shù)據(jù);
34、數(shù)據(jù)處理單元,用于對測序數(shù)據(jù)進行數(shù)據(jù)處理;
35、質(zhì)控單元,用于判斷處理后的測序數(shù)據(jù)是否通過質(zhì)控;
36、融合檢測單元,用于在測序數(shù)據(jù)通過質(zhì)控之后,基于處理后的測序數(shù)據(jù)分析目標融合檢出情況,得到待評價檢測panel對融合基因的檢出性能。
37、從上述的技術(shù)方案可以看出。本發(fā)明通過基于預先構(gòu)建的融合基因轉(zhuǎn)錄本數(shù)據(jù)庫,合成不同類型的已知融合基因單鏈dna,用于模擬未知融合基因組合,使本發(fā)明的評價方法不僅可以評價檢測panel對已知的融合基因的檢出性能,還可以評價檢測panel對未知的融合基因的檢出性能。
38、本發(fā)明構(gòu)建了一個覆蓋全面的融合基因庫,通過生物信息學分析方法可以準確評價檢測panel對每一個融合基因的檢測性能。
1.一種基因融合檢測panel性能評價方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基因融合檢測panel性能評價方法,其特征在于,合成不同類型的已知融合基因單鏈dna的過程,包括:
3.根據(jù)權(quán)利要求1所述的基因融合檢測panel性能評價方法,其特征在于,在對融合基因單鏈dna進行擴增之后,還包括:
4.根據(jù)權(quán)利要求3所述的基因融合檢測panel性能評價方法,其特征在于,統(tǒng)計每個融合基因的支持reads數(shù),包括:
5.根據(jù)權(quán)利要求1所述的基因融合檢測panel性能評價方法,其特征在于,還包括:
6.根據(jù)權(quán)利要求1所述的基因融合檢測panel性能評價方法,其特征在于,還包括:
7.根據(jù)權(quán)利要求1-6中任一項所述的基因融合檢測panel性能評價方法,其特征在于,對測序數(shù)據(jù)進行數(shù)據(jù)處理的過程,包括:
8.根據(jù)權(quán)利要求7所述的基因融合檢測panel性能評價方法,其特征在于,判斷處理后的測序數(shù)據(jù)是否通過質(zhì)控的過程,包括:
9.一種基因融合檢測panel性能評價裝置,其特征在于,包括: