為選擇治療方案而分析基因信息的方法和儀器的制造方法
【專利摘要】本發(fā)明涉及為了選擇治療方案進(jìn)行基因信息分析的方法和儀器。獲取關(guān)于基因網(wǎng)絡(luò)的信息,其中基因網(wǎng)絡(luò)中個(gè)體基因組所含基因根據(jù)基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群;并將對(duì)至少一種所用藥物有反應(yīng)的子群可視化。
【專利說明】為選擇治療方案而分析基因信息的方法和儀器
[0001]相關(guān)申請(qǐng)的交叉引用
[0002]本申請(qǐng)要求2012年7月13日提交至韓國(guó)知識(shí)產(chǎn)權(quán)局的韓國(guó)專利申請(qǐng)10-2012-076803的權(quán)益,該申請(qǐng)的公開內(nèi)容通過引用全部并入本文。
發(fā)明領(lǐng)域
[0003]本文涉及為了選擇治療方案進(jìn)行基因信息(比如個(gè)體的基因組)分析的方法和儀器。
【背景技術(shù)】
[0004]基因組代表生物體的全部遺傳信息。已經(jīng)開發(fā)了給特定個(gè)體的基因組測(cè)序的多種技術(shù),比如脫氧核糖核酸(DNA)芯片和第二代測(cè)序(Next Generation Sequencing, NGS)技術(shù)、第三代測(cè)序(NNGS)技術(shù)等等?;蛐畔?比如核酸序列和蛋白質(zhì))的分析被廣泛用于發(fā)現(xiàn)指示疾病(比如糖尿病或癌癥)的基因,或者理解基因多樣性和個(gè)體表達(dá)特點(diǎn)之間的相關(guān)性。具體來說,從個(gè)體采集的基因信息對(duì)于找出個(gè)體中與不同癥狀或疾病進(jìn)展相關(guān)的遺傳特性非常重要。因此,諸如核酸序列和蛋白的個(gè)體基因信息是獲知當(dāng)前和將來的疾病相關(guān)信息,以便預(yù)防疾病或者在疾病初始階段選擇最佳療法的核心數(shù)據(jù)。利用基因組檢測(cè)儀器,比如用于檢測(cè)單核苷酸多態(tài)性(SNP)、拷貝數(shù)變化(CNV)等的DNA芯片和微陣列,正確分析個(gè)體基因信息的技術(shù)已有研究。
[0005]發(fā)明概述
[0006]本發(fā)明提供了為了選擇治療方案進(jìn)行基因信息(比如個(gè)體的基因組)分析的方法和儀器。
[0007]本發(fā)明提供了計(jì)算機(jī)可讀的記錄介質(zhì),用于保存執(zhí)行所述方法的計(jì)算機(jī)可讀程序。
[0008]本發(fā)明其他方面將在后文中描述一部分,其它部分則是根據(jù)描述顯而易見的,或者通過實(shí)施本文的實(shí)施方案可以了解。
[0009]根據(jù)本發(fā)明的一個(gè)方面,為了選擇治療方案進(jìn)行基因信息分析的方法包括:獲取關(guān)于基因網(wǎng)絡(luò)的信息,其中個(gè)體基因組所含基因根據(jù)基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群;從基因網(wǎng)絡(luò)所含復(fù)數(shù)個(gè)子群中提取含有對(duì)至少一種所用藥物有反應(yīng)的基因的子群;和根據(jù)提取子群所含基因信息生成至少一個(gè)索引以便顯現(xiàn)被提取的子群。
[0010]根據(jù)本發(fā)明的另一方面,提供了計(jì)算機(jī)可讀的記錄介質(zhì),用于保存計(jì)算機(jī)可讀的執(zhí)行所述基因信息分析方法的程序。
[0011]根據(jù)本發(fā)明的另一方面,為了選擇治療方案對(duì)基因信息進(jìn)行分析的儀器包括:數(shù)據(jù)獲取單元,用于獲取關(guān)于基因網(wǎng)絡(luò)的信息,其中個(gè)體基因組所含基因根據(jù)基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群;子群提取器,用于從基因網(wǎng)絡(luò)所含復(fù)數(shù)個(gè)子群中提取子群,所述子群含有對(duì)至少一種所用藥物有反應(yīng)的基因;和索引生成器,用于根據(jù)提取子群所含基因信息生成至少一個(gè)索引以便將提取子群可視化。[0012]附圖簡(jiǎn)述
[0013]由以下對(duì)實(shí)施方案的描述,結(jié)合附圖可以清楚看到并且更容易理解這些和/或其他方面,附圖中:
[0014]圖1是根據(jù)本發(fā)明的實(shí)施方案,為了選擇治療方案對(duì)基因信息進(jìn)行分析的儀器的方塊圖;
[0015]圖2是通常已知的基因網(wǎng)絡(luò);
[0016]圖3A顯示了根據(jù)本發(fā)明的實(shí)施方案,由使用人員輸入圖1的儀器中的藥物列表;
[0017]圖3B顯示了根據(jù)本發(fā)明的實(shí)施方案,子群提取器所提取的子群表;
[0018]圖4顯示了根據(jù)本發(fā)明的實(shí)施方案,由索引生成器生成的提取子群的遺傳變異索引;
[0019]圖5A描述了根據(jù)本發(fā)明的實(shí)施方案,在索引生成器中計(jì)算距離的過程;
[0020]圖5B描述了根據(jù)本發(fā)明的另一個(gè)實(shí)施方案,在索引生成器中計(jì)算距離的過程;
[0021]圖6顯示了根據(jù)本發(fā)明的實(shí)施方案,由可視化處理器處理過的結(jié)果;
[0022]圖7顯示了根據(jù)本發(fā)明的實(shí)施方案,對(duì)西妥昔單抗(Cetuximab)有反應(yīng)者的結(jié)腸癌樣品和無反應(yīng)者結(jié)腸癌樣品的可視化結(jié)果;以及
[0023]圖8的流程圖舉例說明了根據(jù)本發(fā)明的實(shí)施方案,為了決定治療方案對(duì)基因信息進(jìn)行分析的方法。
[0024]發(fā)明詳述
[0025]以下詳述實(shí)施方案以供參考,其實(shí)例如附圖所示。
[0026]圖1是根據(jù)本發(fā)明的實(shí)施方案,為了選擇治療方案對(duì)基因信息進(jìn)行分析的儀器10的方塊圖。參考圖1,儀器10包含數(shù)據(jù)獲取單元110、子群提取器120、索引生成器130和可視化處理器140。為了清楚,圖1中僅描述了與本實(shí)施方案有關(guān)的硬件成分。但是本領(lǐng)域普通技術(shù)人員理解儀器10中還可以包含其他普遍使用的硬件成分。
[0027]具體來說,儀器10可以是處理器。該處理器可以通過含有復(fù)數(shù)個(gè)邏輯門的陣列,或者微處理器和可以在微處理器中執(zhí)行的記憶存儲(chǔ)程序的組合來實(shí)施。此外,本領(lǐng)域技術(shù)人員理解儀器10也可以由另一種類型的硬件實(shí)施。
[0028]儀器10通過從與藥物(比如抗癌藥物)使用有關(guān)的個(gè)體基因組數(shù)據(jù)中,將與導(dǎo)致疾病(比如癌癥或腫瘤)的基因相關(guān)的基因信息可視化,可以作為幫助醫(yī)務(wù)人員進(jìn)行患者診斷和選擇治療方案的裝置。此外,儀器10提供的信息可以用于研究,比如新藥和診斷標(biāo)記物等的開發(fā)。
[0029]通常,個(gè)體的基因組表示個(gè)體含有的所有基因信息,近年,隨著測(cè)序技術(shù)的發(fā)展,人類和其他生物體的完整基因組已被表達(dá)?;蚪M所含基因信息對(duì)于找出生物作用機(jī)制,比如核酸序列、蛋白解析等是必需的。基因組分析被廣泛用于理解各種生物現(xiàn)象,比如找出特定疾病(糖尿病或癌癥)的成因、遺傳多樣性、個(gè)體表達(dá)特性等。
[0030]近年,基因組研究中逐漸發(fā)現(xiàn)了基因組所含基因之間的功能相關(guān)性,從而有可能分析眾多基因之間的基因網(wǎng)絡(luò),因?yàn)榫唧w生物體中幾乎所有生理癥狀都?xì)w因于多個(gè)基因的相互作用,而不是單一基因產(chǎn)生的。
[0031]圖2是通常已知的基因網(wǎng)絡(luò)。圖2只顯示了整個(gè)基因網(wǎng)絡(luò)的一部分以助于對(duì)本實(shí)施方案的理解。但本領(lǐng)域技術(shù)人員也可以容易地獲得關(guān)于整個(gè)基因網(wǎng)絡(luò)其他部分的信息。[0032]參見圖2,基因網(wǎng)絡(luò)表現(xiàn)為其中的基因以復(fù)雜的方式相互關(guān)聯(lián)的網(wǎng)絡(luò)。具體來說,基因網(wǎng)絡(luò)包含根據(jù)基因間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群或子網(wǎng)的基因。如圖2所示,這些子群或子網(wǎng)用基因網(wǎng)絡(luò)中的結(jié)點(diǎn)表示。例如,雖然圖2的基因網(wǎng)絡(luò)中沒有顯示,當(dāng)用符號(hào)ALK、EPHA1和JAK3標(biāo)記對(duì)應(yīng)子群或子網(wǎng)的結(jié)點(diǎn)時(shí),這些結(jié)點(diǎn)可以分別表示惡性淋巴瘤受體酪氨酸激酶、EPH受體Al和Janus激酶3。以上描述的基因網(wǎng)絡(luò)對(duì)本領(lǐng)域技術(shù)人員是顯而易見的,因此這里省略了對(duì)它的詳細(xì)描述。
[0033]雖然關(guān)于基因網(wǎng)絡(luò)的信息是已知的,對(duì)與治療(比如藥物)相關(guān)的基因網(wǎng)絡(luò)進(jìn)行分析的方法還鮮有研究。具體來說,只考慮過測(cè)量個(gè)體癌癥患者的單個(gè)基因或一組基因中的改變(對(duì)于被給予某些類型的抗癌藥物處方的情況,癌癥患者的細(xì)胞相對(duì)正常細(xì)胞的改變)的技術(shù)。
[0034]但是,通過考慮這些抗癌藥物之間的相關(guān)性而測(cè)量個(gè)體癌癥患者的單個(gè)基因或一組基因的改變的技術(shù)還沒有引申到被給予兩類或更多類抗癌藥物的情況。
[0035]當(dāng)考慮給予兩類或更多類抗癌藥物時(shí),通過給每類抗癌藥物單獨(dú)測(cè)量一組基因的改變來確定抗癌藥物可能是沒有意義的,因?yàn)楫?dāng)兩類抗癌藥物具有相同或類似的機(jī)制時(shí),很難預(yù)測(cè)兩類抗癌藥物的全部效能。因此,當(dāng)考慮用兩類或更多類抗癌藥物進(jìn)行個(gè)性化療法時(shí),可以首先測(cè)量患者的遺傳改變是否與每種抗癌藥物的效能有關(guān),同時(shí)可以測(cè)量?jī)深惢蚋囝惪拱┧幬锏臋C(jī)制是否相似。換句話說,當(dāng)使用多種抗癌藥物時(shí),可以測(cè)量數(shù)種癌基因是否與多種抗癌藥物的途徑相關(guān),如果測(cè)量到數(shù)種癌基因與多種抗癌藥物的途徑相關(guān),所述多種抗癌藥物之間的相關(guān)性可以首先用于找出抗癌藥物的最佳聯(lián)用。
[0036]與現(xiàn)有的分析基因信息的儀器不同,儀器10可以索引基因網(wǎng)絡(luò)中與多種抗癌藥物相關(guān)的數(shù)個(gè)癌基因之間的相關(guān)性、對(duì)索引進(jìn)行數(shù)值分析、并提供數(shù)值結(jié)果。這就是說,儀器10可以數(shù)值化分析并提供多組基因(子群或子網(wǎng))之間的關(guān)聯(lián)性,而不是象現(xiàn)有儀器那樣數(shù)值化分析單個(gè)基因或單組基因中的改變。
[0037]現(xiàn)更詳細(xì)地描述儀器10的操作和功能。
[0038]參見圖1,數(shù)據(jù)獲取單元110獲取關(guān)于基因網(wǎng)絡(luò)的信息,其中基因網(wǎng)絡(luò)中個(gè)體基因組所含基因根據(jù)基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群(或子網(wǎng))。獲取的關(guān)于基因網(wǎng)絡(luò)的信息可以包括,個(gè)體基因組所含多個(gè)基因之間的相互關(guān)聯(lián)的信息;關(guān)于根據(jù)功能相關(guān)性劃分的復(fù)數(shù)個(gè)子群(或子網(wǎng))的信息等等。獲取的基因網(wǎng)絡(luò)可以是從現(xiàn)有技術(shù)已知的數(shù)據(jù)庫(DB)中獲取的。
[0039]子群提取器120從數(shù)據(jù)獲取單元110獲取的基因網(wǎng)絡(luò)所含復(fù)數(shù)個(gè)子群中提取含有對(duì)至少一種所用藥物有反應(yīng)的基因的子群。
[0040]儀器10的使用者,例如醫(yī)務(wù)人員,可以通過使用儀器10輸入給予某個(gè)癌癥患者的抗癌藥物列表。替代地,儀器10的使用者可以輸入藥物列表以便研究對(duì)某些藥物有反應(yīng)的子群之間的相關(guān)性。雖然圖1中沒有顯示,可以利用與儀器10連接的一般使用者界面裝置來輸入列表。
[0041]圖3A顯示了根據(jù)本發(fā)明的實(shí)施方案,由使用者輸入圖1的儀器10中的藥物列表20。參見圖3A,藥物列表20中給出了 18種不同抗癌藥物的名稱,比如克唑替尼(crizotinib)、舒尼替尼(sunitinib)、帕唑帕尼(pazopanib)、西妥昔單抗(cetuximab)、帕尼單抗(panitumumab)、吉非替尼(gefitinib)、埃羅替尼(erlotinib)、達(dá)沙替尼(dasatinib)、曲妥單抗(trastuzumab)、拉帕替尼(Iapatinib)、帕利夫明(palifermin)、坦度替尼(tandutinib)、索拉非尼(sorafenib)、舒尼替尼(sunitinib)、凡德他尼(vandetanib)、西妥木單抗(cixutumumab)、蓋尼塔單抗(ganitumab)和地特胰島素(insulin detemir)。
[0042]圖3B顯示了根據(jù)本發(fā)明的實(shí)施方案,子群提取器120所提取的子群的列表。參見圖3B,顯示了圖3A中描述的藥物被作圖到基因網(wǎng)絡(luò)的某些子群中的結(jié)果。例如,給克唑替尼作圖到ALK子網(wǎng),因?yàn)榭诉蛱婺岬淖饔脵C(jī)制對(duì)應(yīng)的基因包含在ALK子網(wǎng)中。此外,給舒尼替尼和帕唑帕尼作圖到CSFIR子網(wǎng),因?yàn)槭婺崽婺岷团吝蚺聊岬淖饔脵C(jī)制對(duì)應(yīng)的基因包含在CSFIR子網(wǎng)中。這樣,關(guān)于含有與藥物作用對(duì)應(yīng)的基因的子群的信息可以基于現(xiàn)有技術(shù)中已知的內(nèi)容。因此,根據(jù)本領(lǐng)域已知的信息,子群提取器120通過給含有與至少一種所用藥物的作用對(duì)應(yīng)的基因的子群作圖來提取子群。
[0043]回到圖1,索引生成器130根據(jù)子群提取器120提取的子群所含基因信息生成至少一個(gè)索引,以便使提取的子群可視化。
[0044]索引生成器130所 生成的至少一個(gè)索引包括用于判斷選自下述的至少一項(xiàng)的索引:每個(gè)提取子群的遺傳改變水平、提取子群之間的相關(guān)性,和提取子群所含基因數(shù)量。
[0045]用于判斷每個(gè)提取子群的遺傳改變水平的索引,由索引生成器130在提取子群所含基因的遺傳改變水平的基礎(chǔ)上進(jìn)行計(jì)算。
[0046]用于判斷每個(gè)提取子群的遺傳改變水平的索引,可以與根據(jù)每個(gè)提取子群的遺傳改變水平用不同顏色表示提取子群的索引對(duì)應(yīng)。
[0047]每個(gè)提取子群的遺傳改變水平可以根據(jù)以下統(tǒng)計(jì)概率來計(jì)算,所述統(tǒng)計(jì)概率是在個(gè)體基因組所含眾多基因中有遺傳改變的那些基因被包括在每個(gè)提取子群中的統(tǒng)計(jì)概率。這可以通過使用公知的方法,比如Geneset Analysis、Geneset Enrichment Analysis和Fisher Exact Test 來計(jì)算。
[0048]例如,索引生成器130可以用公式I生成每個(gè)提取子群遺傳改變水平的索引。
YiV-M"
,v"i j
[0049]P = 1^ -TlA-
U J(I)
[0050]在公式I中,P表示提取子群的遺傳改變水平的概率,N表示基因總數(shù),k表示在癌癥中發(fā)生改變的基因的數(shù)量,M表示提取子群所含基因的數(shù)量,X表示從癌癥中發(fā)生改變的基因中得到的提取子集所包含的基因的數(shù)量。
[0051]公式I表示,當(dāng)從N個(gè)基因中選擇了 k個(gè)發(fā)生遺傳改變的基因時(shí),提取子群中包含X個(gè)或更多個(gè)發(fā)生遺傳改變的基因的概率值P。公式I被稱為Fisher Exact Test。
[0052]但是,本領(lǐng)域技術(shù)人員可以理解,索引生成器130可以用與上述類似的其他算法,比如Geneset Analysis和Geneset Enrichment Analysis,而不是公式I,來計(jì)算用于判斷每個(gè)提取子群的遺傳改變水平的索引。
[0053]圖4的示意圖顯示了根據(jù)本發(fā)明的實(shí)施方案,由索引生成器130生成的提取子群的遺傳改變水平的索引。參見圖4,提取子群的遺傳改變水平可以用表示顏色水平的索引來代表。
[0054]回到圖1,索引生成器130基于距離(該距離表示提取子群所含基因之間的功能緊密程度)計(jì)算了用于判斷提取子群之間相關(guān)性的索引。在本實(shí)施方案中,術(shù)語“距離”不代表子群之間的實(shí)際距離,而是作為一個(gè)抽象概念表示提取子群所含基因之間的功能緊密程度。因此,術(shù)語“距離”可以用另外的術(shù)語,比如“厚度”代替。但在本實(shí)施方案中,使用了術(shù)語“距離”來描述。
[0055]可以利用提取子群之間功能上相互關(guān)聯(lián)的基因的數(shù)量來計(jì)算所述距離。更具體地說,可以通過對(duì)提取子群之間功能相互聯(lián)系的基因的數(shù)量和從基因網(wǎng)絡(luò)中隨機(jī)取樣的子群之間功能相互聯(lián)系的基因的數(shù)量進(jìn)行比較,在所得結(jié)果的基礎(chǔ)上計(jì)算所述距離。
[0056]圖5A的示意圖描述了根據(jù)本發(fā)明的實(shí)施方案,在索引生成器130中計(jì)算所述距離的過程。當(dāng)提取了兩個(gè)子群時(shí),可以計(jì)算這兩個(gè)子群之間的相關(guān)性。
[0057]參見圖5A,當(dāng)存在兩個(gè)提取子群時(shí),兩個(gè)子群間的距離的倒數(shù)與直接關(guān)聯(lián)的基因的數(shù)量和通過共有兩個(gè)子群所含基因中的單個(gè)基因而相互關(guān)聯(lián)的基因的數(shù)量成比例,并且與兩個(gè)子群所含基因的總數(shù)成反比。這里可以采用權(quán)重來區(qū)分直接關(guān)聯(lián)的基因的數(shù)量的重要性和通過共享單個(gè)基因而相互關(guān)聯(lián)的基因的數(shù)量的重要性。
[0058]最后,可以利用公式2計(jì)算兩個(gè)子群之間的距離。
[0059]
【權(quán)利要求】
1.為了選擇治療方案進(jìn)行基因信息分析的方法,所述方法包括: 獲取關(guān)于基因網(wǎng)絡(luò)的信息,所述基因網(wǎng)絡(luò)中,個(gè)體的基因組所含基因根據(jù)這些基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群; 從基因網(wǎng)絡(luò)所含復(fù)數(shù)個(gè)子群中提取具有對(duì)至少一種所用藥物有反應(yīng)的基因的子群;和 根據(jù)提取子群所含基因信息生成至少一個(gè)索引,以便將提取子群可視化。
2.權(quán)利要求1所述的方法,其中所述至少一個(gè)生成的索引包括用于判斷選自下述的至少一項(xiàng)的索引:每個(gè)提取子群的遺傳改變水平、提取子群之間的相關(guān)性,和提取子群所含基因數(shù)量。
3.權(quán)利要求1所述的方法,其中所述的生成包括,根據(jù)提取子群所含基因的改變水平,計(jì)算每個(gè)提取子群的遺傳改變水平。
4.權(quán)利要求3所述的方法,其中每個(gè)提取子群的遺傳改變水平是根據(jù)以下統(tǒng)計(jì)概率來計(jì)算,所述統(tǒng)計(jì)概率是在個(gè)體基因組所含眾多基因中有遺傳改變的那些基因被包括在每個(gè)提取子群中的統(tǒng)計(jì)概率。
5.權(quán)利要求3所述的方法,其中每個(gè)提取子群的遺傳改變水平是利用選自GenesetAnalysis、Geneset Enrichment Analysis 和 Fisher Exact Test 中的至少一種計(jì)算的。
6.權(quán)利要求3所述的方法,其中至少一個(gè)生成的索引是根據(jù)每個(gè)提取子群的遺傳改變水平,用不同顏色表示每個(gè)提取子群的索引。
7.權(quán)利要求1所述的方 法,其中的生成包括,根據(jù)距離計(jì)算用于判斷提取子群之間的相關(guān)性的索引,其中所述距離表示提取子群中所含基因之間的功能關(guān)聯(lián)緊密程度。
8.權(quán)利要求7所述的方法,其中所述距離是利用提取子群之間功能上相互關(guān)聯(lián)的基因的數(shù)量計(jì)算的。
9.權(quán)利要求7所述的方法,其中所述距離是基于這樣的結(jié)果計(jì)算的,所述結(jié)果是通過對(duì)提取子群之間功能相互關(guān)聯(lián)的基因的數(shù)量和從所述基因網(wǎng)絡(luò)中隨機(jī)取樣的子群之間功能相互關(guān)聯(lián)的基因的數(shù)量進(jìn)行比較得到的。
10.權(quán)利要求1所述的方法,其中的生成包括,計(jì)算用于判斷提取子群所含基因的數(shù)量的索引。
11.權(quán)利要求10所述的方法,其中所述至少一個(gè)生成的索引是根據(jù)提取子群所含基因數(shù)量用不同大小表示每個(gè)提取子群的索引。
12.權(quán)利要求1所述的方法,還包含通過給提取子群視覺上應(yīng)用至少一個(gè)生成的索引使提取子群可視化。
13.權(quán)利要求12所述的方法,其中的可視化包括以相互連接的結(jié)點(diǎn)代表提取子群而使提取子群可視化。
14.權(quán)利要求12所述的方法,其中的可視化包括,通過只激活屏幕上顯示的基因網(wǎng)絡(luò)中呈現(xiàn)至少一個(gè)生成的索引的提取子群而使提取子群可視化。
15.計(jì)算機(jī)可讀記錄介質(zhì),用于存儲(chǔ)執(zhí)行權(quán)利要求1-14中任一項(xiàng)所述方法的計(jì)算機(jī)可讀程序。
16.為了選擇治療方案進(jìn)行基因信息分析的儀器,所述儀器包括: 數(shù)據(jù)獲取單元,用于獲取關(guān)于基因網(wǎng)絡(luò)的信息,所述基因網(wǎng)絡(luò)中個(gè)體基因組所含基因根據(jù)基因之間的功能相關(guān)性被劃分為復(fù)數(shù)個(gè)子群;子群提取器,用于從基因網(wǎng)絡(luò)所含復(fù)數(shù)個(gè)子群中提取具有對(duì)至少一種所用藥物有反應(yīng)的基因的子群;和 索引生成器,用于根據(jù)提取子群所含基因信息生成至少一個(gè)索引以便將提取子群可視化。
17.權(quán)利要求16所述的儀器,其中所述至少一個(gè)生成的索引包括用于判斷選自下述的至少一項(xiàng)的索引:每個(gè)提取子群的遺傳改變水平、提取子群之間的相關(guān)性,和提取子群所含基因數(shù)量。
18.權(quán)利要求16所述的儀器,其中索引生成器根據(jù)提取子群所含基因的改變水平,計(jì)算每個(gè)提取子群的遺傳改變水平。
19.權(quán)利要求18所述的儀器,其中每個(gè)提取子群的遺傳改變水平是根據(jù)以下統(tǒng)計(jì)概率來計(jì)算,所述統(tǒng)計(jì)概率是在個(gè)體基因組所含眾多基因中有遺傳改變的那些基因被包括在每個(gè)提取子群中的統(tǒng)計(jì)概率。
20.權(quán)利要求18所述的儀器,其中至少一個(gè)生成的索引是根據(jù)每個(gè)提取子群的遺傳改變水平而用不同顏色表示每個(gè)提取子群的索引。
21.權(quán)利要求16所述的儀器,其中索引生成器根據(jù)距離計(jì)算用于判斷提取子群之間的相關(guān)性的索引,其中所述距離表示提取子群中所含基因之間的功能關(guān)聯(lián)緊密程度。
22.權(quán)利要求21所述的儀器,其中所述距離是利用提取子群之間功能上相互關(guān)聯(lián)的基因的數(shù)量計(jì)算的。
23.權(quán)利要求16所述的儀器,其中索引生成器計(jì)算用于判斷提取子群所含基因的數(shù)量的索引。
24.權(quán)利要求23所述的儀器,其中所述至少一個(gè)生成的索引是根據(jù)提取子群所含基因數(shù)量用不同大小表示每個(gè)提取子群的索引。
25.權(quán)利要求16所述的儀器,還包含通過給提取子群視覺上應(yīng)用至少一個(gè)生成的索引使提取子群可視化的可視化過程 。
【文檔編號(hào)】G06F19/18GK103544405SQ201310071524
【公開日】2014年1月29日 申請(qǐng)日期:2013年3月6日 優(yōu)先權(quán)日:2012年7月13日
【發(fā)明者】安兌臻, S.穆科爾杰, 洪錫瑱, R.S.馬拉瓦瑞普, 孫大淳, 李天熙, S.A.博帕蒂卡爾 申請(qǐng)人:三星電子株式會(huì)社