專利名稱:構(gòu)建基因表達(dá)、蛋白質(zhì)或代謝物水平圖譜的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分析基因表達(dá)、代謝物或蛋白質(zhì)水平的方法,這種方法產(chǎn)生細(xì)胞的特征性圖譜(profiles)的應(yīng)用,以及此圖譜在疾病診斷及分析用于處理細(xì)胞的新型化合物的作用方式中的應(yīng)用。
背景技術(shù):
近年來的技術(shù)進(jìn)步使同時(shí)測定細(xì)胞中大量分子變得容易進(jìn)行。由此導(dǎo)致了細(xì)胞中諸如蛋白質(zhì)、代謝物和mRNA等特定類型分子復(fù)雜圖譜的產(chǎn)生。典型地,對(duì)于存在于細(xì)胞中的所選定的某類分子中的每一個(gè)分子,都會(huì)產(chǎn)生一個(gè)信號(hào),此信號(hào)和這個(gè)分子在細(xì)胞中存在的數(shù)量相關(guān)。因此,細(xì)胞中基因表達(dá)的圖譜通常是通過對(duì)單個(gè)基因的mRNA水平的大量的獨(dú)立測定來構(gòu)建的。也就是說,表達(dá)圖譜通過許多信號(hào)構(gòu)建,其中每一個(gè)信號(hào)代表一個(gè)基因的表達(dá)水平。同樣,代謝物圖譜是由每一個(gè)代表細(xì)胞內(nèi)單個(gè)代謝物水平的信號(hào)來構(gòu)建的,而蛋白質(zhì)圖譜是由每一個(gè)代表細(xì)胞內(nèi)單個(gè)蛋白質(zhì)水平的信號(hào)來構(gòu)建的。
這類圖譜的構(gòu)建是非常有價(jià)值的,因?yàn)樗试S在例如不同的細(xì)胞狀態(tài)間(例如健康狀態(tài)和疾病狀態(tài)間)或在不同處理對(duì)細(xì)胞的效果間檢測差異。然而,這種作圖實(shí)驗(yàn)會(huì)產(chǎn)生大量數(shù)據(jù),大量的數(shù)據(jù)使數(shù)據(jù)存貯、操作和解釋很困難。通常,然后對(duì)這些單個(gè)數(shù)據(jù)點(diǎn)進(jìn)行分析,并將數(shù)據(jù)聚類為表現(xiàn)出例如相似表達(dá)水平或相似功能或結(jié)構(gòu)特征的分子群體,以便于解釋圖譜。然而,這個(gè)分析階段意味著在構(gòu)建一個(gè)用戶友好并易于解釋的圖譜前需要一定程度的知識(shí)(例如關(guān)于與其它單個(gè)分子相比較的某一單個(gè)分子的水平,或關(guān)于單個(gè)分子本身的結(jié)構(gòu)和/或功能的知識(shí))。
發(fā)明內(nèi)容
本發(fā)明致力于解決這些難題并提供了一種獲取細(xì)胞分子圖譜的極其簡化的方法,這種方法具有的優(yōu)點(diǎn)是它使技術(shù)人員可以構(gòu)建細(xì)胞中所選類型分子的水平的圖譜,此圖譜可被用于區(qū)分不同的處理或不同的細(xì)胞狀態(tài),而構(gòu)建此圖譜時(shí)所使用的數(shù)據(jù)比通常用于構(gòu)建現(xiàn)有圖譜時(shí)使用的數(shù)據(jù)少。此外,本發(fā)明提供了一種獲取細(xì)胞有用分子圖譜的方法而不需要任何關(guān)于對(duì)圖譜有貢獻(xiàn)的單個(gè)分子的知識(shí)。
本發(fā)明的方法應(yīng)用廣泛,因?yàn)樗鼈兛杀粦?yīng)用于細(xì)胞內(nèi)不同類別的分子,例如,它們可被用于獲取細(xì)胞內(nèi)代謝物或蛋白質(zhì)或表達(dá)基因之水平的圖譜,并且它們可被應(yīng)用于來自任何來源生物體的細(xì)胞。
本發(fā)明提供了一種表征細(xì)胞或表征對(duì)細(xì)胞處理的效果的方法,它包括以下步驟a)獲取多個(gè)聚集信號(hào)(aggregate signals),其中每一個(gè)聚集信號(hào)代表至少兩個(gè)指示信號(hào)的組合,而且每個(gè)指示信號(hào)指示細(xì)胞中某分子的水平;b)從該多個(gè)聚集信號(hào)產(chǎn)生細(xì)胞或?qū)?xì)胞之處理特征性的圖譜,其特征在于獲取每一個(gè)聚集信號(hào)時(shí)沒有分析任何一個(gè)指示信號(hào)對(duì)該聚集信號(hào)的貢獻(xiàn)。
本發(fā)明的方法特別具有優(yōu)勢,因?yàn)樵谌魏螖?shù)據(jù)分析階段之前產(chǎn)生聚集信號(hào)減少了用于構(gòu)建圖譜的數(shù)據(jù)點(diǎn)的數(shù)量,并簡化了任何后續(xù)的數(shù)據(jù)處理和分析。根據(jù)本發(fā)明方法構(gòu)建的圖譜可以來源于單個(gè)細(xì)胞、細(xì)胞群、組織或完整的生物體,并是它們特征性的。本發(fā)明的圖譜也可以涉及特定的亞細(xì)胞組分內(nèi)所選定的某類分子的水平,并是其特征性的。
本發(fā)明的方法可被用于產(chǎn)生存在于細(xì)胞中的任何適合類別分子的特征性圖譜。例如,此方法可被用于根據(jù)基因表達(dá)水平、代謝物水平或蛋白質(zhì)水平表征細(xì)胞。
從中獲取圖譜的聚集信號(hào)代表至少兩個(gè)指示信號(hào),每一個(gè)指示信號(hào)指示細(xì)胞中單個(gè)分子的水平。聚集信號(hào)由此而代表了細(xì)胞內(nèi)一組分子的水平。這組分子的組成優(yōu)選在關(guān)于單個(gè)分子的結(jié)構(gòu)或功能上是的隨機(jī)選取的代謝物、蛋白質(zhì)或基因的指示信號(hào)不按其相關(guān)的生物學(xué)或生理學(xué)途徑分組雖然不是必須的,但的確是優(yōu)選的。同樣,這種指示信號(hào)不必按由結(jié)構(gòu)類別或基于完整基因或蛋白質(zhì)的同源性而劃分的家族成員關(guān)系分組,由此,進(jìn)一步優(yōu)選指示信號(hào)不進(jìn)行這樣的分組。
在本發(fā)明的另一方面,這組分子的組成在關(guān)于從中構(gòu)建圖譜的細(xì)胞、細(xì)胞群、組織或生物體中單個(gè)分子的水平上是隨機(jī)選取的,即組成該組的單一個(gè)子不必具有相同或相近的表達(dá)水平或以相同或相近的量存在。因此,在一個(gè)優(yōu)選的實(shí)施方案中,聚集信號(hào)代表至少兩個(gè)指示信號(hào)的組合,其中,第一指示信號(hào)指示第一分子的水平或量,第二指示信號(hào)指示第二分子的水平或量,并且第一分子的水平或量與第二分子的水平或量相當(dāng)不同。“相當(dāng)不同”,意思是如果在聚集信號(hào)產(chǎn)生之前要使用任何適合的統(tǒng)計(jì)或聚類分析程序分析第一或第二分子的水平,則這兩個(gè)水平被認(rèn)為是不同的。如上所述,每個(gè)指示信號(hào)指示細(xì)胞中單個(gè)分子的水平。本領(lǐng)域技術(shù)人員可以理解,單個(gè)分子的水平可以為零或大于零。
通過任何適當(dāng)?shù)姆椒óa(chǎn)生并檢測指示信號(hào);放射性配體檢測(radio-ligand detection)、熒光檢測、免疫分析及基于酶的分析都構(gòu)成可被用于本發(fā)明方法信號(hào)檢測體系的例子。指示信號(hào)可被轉(zhuǎn)換為電子信號(hào)以便于產(chǎn)生聚集信號(hào)以及其后的圖譜,然而,本領(lǐng)域技術(shù)人員將理解這種轉(zhuǎn)換不需要任何單個(gè)分子對(duì)任何聚集信號(hào)的相對(duì)貢獻(xiàn)的知識(shí)。
構(gòu)成聚集信號(hào)的指示信號(hào)可以通過在物理上相互非??拷姆绞疆a(chǎn)生,由此使聚集信號(hào)的產(chǎn)生變得容易。作為另一種選擇,聚集信號(hào)可由隨機(jī)聚類指示信號(hào)而獲得。
在以本發(fā)明方法產(chǎn)生基因表達(dá)圖譜中,從中產(chǎn)生聚集信號(hào)的指示信號(hào)指示著細(xì)胞中表達(dá)的基因的mRNA水平。mRNA的水平可通過任何合適的方法測定,包括例如核酸雜交、定量PCR及技術(shù)人員所熟悉的任何其它方法。
在一個(gè)實(shí)施方案中,來源于細(xì)胞的mRNA(或來源于細(xì)胞mRNA的cDNA)與一個(gè)多核苷酸群體雜交。每一個(gè)多核苷酸對(duì)應(yīng)于至少一種能在細(xì)胞中表達(dá)的基因,每一個(gè)雜交事件產(chǎn)生一個(gè)指示對(duì)應(yīng)于被雜交多核苷酸的一個(gè)或多個(gè)基因的表達(dá)水平的雜交信號(hào)(即指示信號(hào))。然后,不分析任何一個(gè)雜交信號(hào)對(duì)此聚集表達(dá)信號(hào)的貢獻(xiàn),而獲得代表從多核苷酸群體亞群產(chǎn)生的雜交信號(hào)的組合的聚集表達(dá)信號(hào),并用于構(gòu)建表達(dá)圖譜。
任何本領(lǐng)域所熟知的常規(guī)方法都可用于制備本發(fā)明所用的mRNA和/或cDNA。普通技術(shù)人員也同樣理解,本發(fā)明中所用的細(xì)胞mRNA可以是總細(xì)胞RNA混合物的形式,或它可以以純化的形式應(yīng)用,例如,它可以經(jīng)過polyA純化。
與mRNA或cDNA雜交的多核苷酸群體,對(duì)應(yīng)于能在細(xì)胞中表達(dá)的基因,因?yàn)檫€不可能預(yù)知在一個(gè)特定時(shí)間或在一組特定條件下細(xì)胞中有多少或有那些基因?qū)?huì)表達(dá)。整個(gè)多核苷酸群體可對(duì)應(yīng)于所有在細(xì)胞中能表達(dá)的基因,包括預(yù)測的基因序列、未知功能的基因及功能已經(jīng)被指明的基因。作為另一種選擇,多核苷酸群體可對(duì)應(yīng)于在細(xì)胞中能表達(dá)的基因的一個(gè)亞群(例如,僅僅是功能已經(jīng)被描述的和/或已知能夠在一組特定條件下表達(dá)的那些基因或其一部分)。
可和mRNA或cDNA雜交的多核苷酸群體的每一單個(gè)成員,對(duì)應(yīng)于至少一個(gè)在細(xì)胞中能表達(dá)的基因?!皩?duì)應(yīng)于”的意思是多核苷酸可特異地與在細(xì)胞中能表達(dá)的基因的mRNA轉(zhuǎn)錄本(或來源于它的cDNA)雜交,如果那個(gè)基因在細(xì)胞內(nèi)表達(dá)的話。因此,用于本發(fā)明的多核苷酸群體可能包含全長或部分長度的基因組或cDNA克隆,或由它們而來的多核苷酸,包括合成的核酸序列。
多核苷酸群體的成員可以對(duì)應(yīng)于單個(gè)基因或可對(duì)應(yīng)于一個(gè)以上的基因。在多核苷酸對(duì)應(yīng)于單個(gè)基因時(shí),此多核苷酸的序列通常將會(huì)與單個(gè)基因的核酸(mRNA或cDNA)互補(bǔ)。在多核苷酸對(duì)應(yīng)于一個(gè)以上的基因時(shí),此多核苷酸的序列可能與幾個(gè)(即2個(gè)或更多個(gè))基因的核酸互補(bǔ)。
從中獲取聚集表達(dá)信號(hào)的每一個(gè)多核苷酸亞群對(duì)應(yīng)于至少2個(gè)在細(xì)胞中能表達(dá)的基因。優(yōu)選的是,一個(gè)亞群將對(duì)應(yīng)2到500(包括2和500)之間任意數(shù)量的基因。在特定的實(shí)施方案中,一個(gè)亞群對(duì)應(yīng)于41、166、664、或2656個(gè)基因。
對(duì)于普通技術(shù)人員來說,很明顯,一個(gè)亞群可以包含多核苷酸群體的單個(gè)成員,如果此單個(gè)成員對(duì)應(yīng)于一個(gè)以上的基因。作為另一種選擇,一個(gè)亞群可以包含一個(gè)以上的多核苷酸,并且在那個(gè)亞群中的每一個(gè)多核苷酸可以對(duì)應(yīng)于一個(gè)或多個(gè)在細(xì)胞中能表達(dá)的基因。因此可能存在這樣的亞群,在該亞群中的多核苷酸的數(shù)量與該亞群對(duì)應(yīng)的基因的數(shù)量或者相同或者不同。
用于本發(fā)明的多核苷酸群體可以存在于溶液中,或者作為另一種選擇,它們可以結(jié)合于固體支持物上。合適的固體支持物可以是平面表面形式,例如膜,包括尼龍膜和PVDF膜,或者是載玻片。在平面表面被用作固體支持物時(shí),多核苷酸群體可在平表面上形成離散點(diǎn)的陣列。每個(gè)離散點(diǎn)將包含多核苷酸群體的至少一個(gè)成員,并將由此對(duì)應(yīng)于至少一個(gè)能在細(xì)胞中表達(dá)的基因。在優(yōu)選方面,每個(gè)離散點(diǎn)將包含從中獲取聚集表達(dá)信號(hào)的多核苷酸群體的一個(gè)亞群。
作為另一種選擇,多核苷酸群體可被直接或間接結(jié)合在多個(gè)小珠上。當(dāng)珠子被用作固體支持物時(shí),優(yōu)選的是每一粒珠子結(jié)合從中獲取聚集表達(dá)信號(hào)的多核苷酸群體的一個(gè)亞群。同樣優(yōu)選的是每一粒珠子都是可唯一鑒別的,例如,通過每一粒珠子與一種熒光標(biāo)記相結(jié)合。
在一個(gè)特別優(yōu)選的實(shí)施方案中,多核苷酸群體的所有多核苷酸成員將包含polyT區(qū)域和隨機(jī)的核苷酸序列。mRNA與這樣的多核苷酸群體雜交導(dǎo)致不同數(shù)量的mRNA分子與多核苷酸群體的不同成員結(jié)合。這個(gè)特定的實(shí)施方案提供了指示信號(hào)可以如何被隨機(jī)組合在一起的例子在這個(gè)例子中,組合是基于基因的5′末端序列而不是基于基因的功能或基因整個(gè)長度的同源性之上的。這個(gè)實(shí)施方案的另一個(gè)重要的特征是聚集表達(dá)信號(hào)能夠從多核苷酸群體中的單個(gè)成員獲得,即,單個(gè)多核苷酸充當(dāng)從中獲得聚集表達(dá)信號(hào)的多核苷酸群體的亞群。
進(jìn)一步優(yōu)選的是,這樣的單個(gè)多核苷酸成員能夠很容易被相互區(qū)分開。這是可以做到的,例如通過將單個(gè)多核苷酸成員與不同的珠子相結(jié)合,或?qū)⑺鼈冊谄矫婺ど吓帕谐牲c(diǎn)陣以使每一個(gè)離散點(diǎn)包含單個(gè)多核苷酸成員。
通過改變隨機(jī)核苷酸序列的長度,與單個(gè)多核苷酸成員相結(jié)合的mRNA分子的數(shù)量可以被改變,因?yàn)殡S著多核苷酸中隨機(jī)序列的長度減少,更多數(shù)量與單個(gè)多核苷酸雜交的mRNA分子的幾率將會(huì)增加。
在另一個(gè)實(shí)施方案中,本發(fā)明方法可被用于產(chǎn)生細(xì)胞的代謝物圖譜,或細(xì)胞的蛋白質(zhì)圖譜。
在此所描述的聚集信號(hào)構(gòu)成本發(fā)明的另一個(gè)方面,例如,在一個(gè)實(shí)施方案中,提供了用于細(xì)胞或細(xì)胞處理之效果的特征性圖譜的聚集信號(hào),其中聚集信號(hào)代表至少兩個(gè)指示信號(hào)的組合,每個(gè)指示信號(hào)指示著細(xì)胞中分子的水平,并且,在獲取聚集信號(hào)時(shí)沒有分析任何一個(gè)指示信號(hào)對(duì)此聚集信號(hào)的貢獻(xiàn)。在第二個(gè)實(shí)施方案中,提供了代表至少兩個(gè)指示信號(hào)的隨機(jī)組合的聚集信號(hào)。在第三個(gè)實(shí)施方案中,提供了代表至少兩個(gè)指示信號(hào)的隨機(jī)組合的聚集信號(hào),并且獲取聚集信號(hào)時(shí)沒有分析任何一個(gè)指示信號(hào)對(duì)此聚集信號(hào)的貢獻(xiàn)。
本發(fā)明也涉及細(xì)胞中所選類別分子之水平的圖譜,此圖譜包含多個(gè)本發(fā)明的聚集信號(hào)。
當(dāng)圖譜為基因表達(dá)圖譜時(shí),每個(gè)聚集信號(hào)指示基因亞群的聚集表達(dá)水平,而且每個(gè)亞群包含至少兩個(gè)基因。同樣,蛋白質(zhì)圖譜將包含多個(gè)聚集信號(hào),其中每個(gè)聚集信號(hào)指示存在于細(xì)胞中的至少兩個(gè)蛋白質(zhì)的聚集水平;代謝物圖譜將包含多個(gè)聚集信號(hào),其中每個(gè)聚集信號(hào)指示存在于細(xì)胞中的至少兩個(gè)代謝物的聚集水平。
按照本發(fā)明的圖譜可被用于將所選類別的分子(mRNA、蛋白質(zhì)或代謝物)的水平與特定的細(xì)胞狀態(tài)關(guān)聯(lián)起來。在此對(duì)細(xì)胞所用的術(shù)語“狀態(tài)”可以指細(xì)胞的生理狀態(tài),它可由環(huán)境脅迫、疾病或外源試劑的處理引起,或者它可以指細(xì)胞的發(fā)育階段。通過比較從兩種不同狀態(tài)細(xì)胞中獲得的圖譜,可以構(gòu)建用于表征兩種狀態(tài)的圖譜,并是這兩種狀態(tài)特征性的。為了直接比較這種圖譜,可以理解,在每個(gè)所比較的圖譜中,在從中產(chǎn)生聚集信號(hào)的亞群中分子的組成將相同。通常,比較是在來源于測試狀態(tài)細(xì)胞(例如,來源于疾病狀態(tài)的或以外源試劑處理的細(xì)胞)的圖譜和來源于對(duì)照狀態(tài)細(xì)胞(例如,來源于健康狀態(tài)的細(xì)胞或沒經(jīng)外源試劑處理的細(xì)胞)的圖譜之間進(jìn)行的。
基因表達(dá)圖譜在特定細(xì)胞狀態(tài)的診斷中特別有用,例如在診斷疾病中,在此,該疾病導(dǎo)致了表達(dá)基因的數(shù)目和/或水平發(fā)生了改變。比較病變細(xì)胞和健康或?qū)φ占?xì)胞的基因表達(dá)圖譜,將可以構(gòu)建這種疾病特征性的圖譜。由此可以構(gòu)建一組圖譜,其每個(gè)圖譜是一個(gè)特定疾病狀態(tài)所特征性的。在懷疑細(xì)胞可能病變時(shí),可以獲得它們的圖譜,與健康細(xì)胞的圖譜相比較,并與某一特定疾病特征性的已知圖譜一起評(píng)比。通過這種方法,就可以診斷疾病。
用類似的方法,基因表達(dá)圖譜可被用于驗(yàn)證或鑒別一種特定處理(例如,以化合物處理)影響細(xì)胞的方式?;衔锏淖饔梅绞娇赏ㄟ^比較來源于經(jīng)這種化合物處理的細(xì)胞的圖譜與來源于未經(jīng)處理的細(xì)胞或合適的對(duì)照細(xì)胞的圖譜而得到檢驗(yàn)或鑒別。然后將這種圖譜與已獲得的作用方式已知的化學(xué)物質(zhì)的圖譜一起評(píng)比,并從而使測試化合物的作用方式得到驗(yàn)證或鑒別。
本發(fā)明也涉及新型化學(xué)物質(zhì),其作用方式已經(jīng)通過在此所描述的任何圖譜進(jìn)行了檢驗(yàn)或鑒別。
現(xiàn)通過舉例的方法詳細(xì)闡述本發(fā)明的各個(gè)方面及實(shí)施方案。應(yīng)當(dāng)理解的是,在不偏離本發(fā)明范圍的情況下可以對(duì)細(xì)節(jié)進(jìn)行修改。
附圖簡述
圖1 分析單個(gè)基因表達(dá)時(shí)顯示處理間相關(guān)性的樹形2 分析2個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)性的樹形3 分析10個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)性的樹形4 分析41個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)性的樹形5 分析166個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)性的樹形6 分析664個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)的樹形7 分析2656個(gè)基因的群體表達(dá)時(shí)顯示處理間相關(guān)性的樹形圖實(shí)施例利用聚集表達(dá)信號(hào)產(chǎn)生植物細(xì)胞基因表達(dá)圖譜以ALS(0.5ppm)、PDS(50ppm)、固醇(Sterol)(150ppm)及AOZ(0.5ppm)處理植物,處理后3天收獲。采用標(biāo)準(zhǔn)程序從處理后植物及沒經(jīng)處理的對(duì)照植物中分離RNA。
采用擬南芥(Arabidopsis)基因表達(dá)微陣列或GEMs(Incyte)進(jìn)行總計(jì)18項(xiàng)雜交實(shí)驗(yàn),每個(gè)微陣列包含對(duì)應(yīng)于7968個(gè)不同基因(即擬南芥基因總數(shù)的一個(gè)亞群)的多核苷酸。每個(gè)GEM與兩個(gè)RNA樣品雜交或者是一個(gè)“處理”樣品和一個(gè)“對(duì)照”樣品,或者是兩個(gè)不同的對(duì)照RNA樣品。表1給出了所進(jìn)行的雜交實(shí)驗(yàn)的概述。
表1 GEM雜交概述。對(duì)照或者與處理同時(shí)進(jìn)行(Cb對(duì)照)或者與處理分別進(jìn)行(Ca對(duì)照)。
從單個(gè)雜交信號(hào)獲取表達(dá)圖譜根據(jù)總體信號(hào)對(duì)來自每個(gè)GEM的信號(hào)進(jìn)行標(biāo)準(zhǔn)化。對(duì)每個(gè)基因計(jì)算處理與對(duì)照間比率的對(duì)數(shù)。然后采用距離算法根據(jù)基因表達(dá)比率的相似性對(duì)實(shí)驗(yàn)進(jìn)行聚類。所獲得的樹形圖(圖1)基于7968個(gè)基因并代表從單個(gè)基因產(chǎn)生的基因表達(dá)圖譜(即7968個(gè)群體,每個(gè)群體包含一個(gè)基因)。
這種分析清楚地分離開了所有處理和所有對(duì)照。然而,觀察到了一定程度的對(duì)照偏差,實(shí)驗(yàn)似乎按照對(duì)照而不是按照處理聚類。
從聚集表達(dá)信號(hào)獲取表達(dá)圖譜然后檢測考慮不同大小基因群體的聚集表達(dá)水平對(duì)處理間聚類的影響。群體大小基于這樣的假設(shè)進(jìn)行選擇實(shí)際上,將以oligo-dTN(n)引物對(duì)聚集表達(dá)水平進(jìn)行評(píng)價(jià)。如果n=1,存在3種不同的可能引物(oligo dT(G/A/C)),如果n=2,則存在12種不同引物(oligo dT(G/A/C)(G/A/T/C))等等?;虮浑S機(jī)分組如下每個(gè)基因被隨機(jī)分配一個(gè)數(shù)字,然后按這個(gè)數(shù)字將基因排列成表,并根據(jù)它們在列表中的位置分配到群體中。為了這種in silico分析的目的,群體大小保持穩(wěn)定,然而,實(shí)際上,群體大小可能因不同引物而變化。結(jié)果,某些基因(那些排在列表末端的)被排除在分析之外。表2顯示了所分析的不同群體大小及在每種情況下被遺漏的基因數(shù)量。
表2 由代表不同數(shù)量基因的聚集表達(dá)信號(hào)產(chǎn)生圖譜。進(jìn)行in silico分析的基礎(chǔ)是,實(shí)際上,聚集表達(dá)信號(hào)將從oligo-dTN(n)引物產(chǎn)生。
對(duì)于每個(gè)基因群體,對(duì)其組成基因的信號(hào)進(jìn)行歸總。然后如上所述對(duì)信號(hào)實(shí)行標(biāo)準(zhǔn)化,計(jì)算比率的對(duì)數(shù)值,并對(duì)處理進(jìn)行聚類。所得到的樹形圖見圖2至圖7。
結(jié)果在單個(gè)基因的分析中(圖1),以ALS處理的樣品聚類很好,與其它處理相分離。PDS及固醇處理分辨得不很清楚,對(duì)照表現(xiàn)出對(duì)聚類型式產(chǎn)生的影響比處理產(chǎn)生的影響更大。然而,可以預(yù)料,PDS及固醇處理會(huì)給出相似的表達(dá)圖譜。
在本質(zhì)上,當(dāng)按每兩個(gè)基因一組共3072組(圖2)或每10個(gè)基因一組共768組(圖3)來分析樣品時(shí),產(chǎn)生了相同的聚類型式。當(dāng)按每42個(gè)基因一組共192組(圖4)分析數(shù)據(jù)時(shí),ALS處理仍然明顯與固醇和PDS處理分離開。然而,在PDS和固醇處理中,分辨率稍有降低。當(dāng)數(shù)據(jù)聚集成每166個(gè)基因一組共48組(圖5)時(shí),來源于不同對(duì)照的信號(hào)強(qiáng)于來源于單個(gè)處理的信號(hào)。然而,如果僅僅考慮對(duì)Cb1對(duì)照(即與處理同時(shí)進(jìn)行的對(duì)照)構(gòu)建圖譜的樣品,ALS抑制劑仍然聚類在一起,與其它處理相分離,并且所有的處理都明顯與所有的對(duì)照分離開。只有當(dāng)按每664個(gè)基因一組共12組(圖6)分析數(shù)據(jù)時(shí),某些對(duì)照才開始與處理同組。當(dāng)按每2565個(gè)基因一組共3組(圖7)分析數(shù)據(jù)時(shí),得到的分辨率很低。
結(jié)論對(duì)基因群聚集表達(dá)的分析允許根據(jù)處理的作用方式對(duì)處理聚類。不需要單個(gè)基因身份的知識(shí)。
在每10個(gè)基因一組共分768組的聚類型式中基本上沒有觀察到變化。因此,有可能將需要分析的數(shù)據(jù)點(diǎn)的數(shù)量減少10倍而不影響聚類。按每166個(gè)基因一組共分48組時(shí),通常聚類很好的處理仍然可以被分辨。
權(quán)利要求
1.表征細(xì)胞或?qū)?xì)胞處理之效果的方法,包括以下步驟a)獲取多個(gè)聚集信號(hào),其中每一個(gè)聚集信號(hào)代表至少兩個(gè)指示信號(hào)的組合,而且每個(gè)指示信號(hào)指示細(xì)胞中分子的水平;b)從多個(gè)聚集信號(hào)產(chǎn)生細(xì)胞或?qū)?xì)胞之處理的特征性圖譜;其特征在于獲取每一個(gè)聚集信號(hào)時(shí)不分析任何一個(gè)指示信號(hào)對(duì)該聚集信號(hào)的貢獻(xiàn)。
2.根據(jù)權(quán)利要求1的方法,其中每個(gè)指示信號(hào)指示細(xì)胞中mRNA分子的水平。
3.根據(jù)權(quán)利要求1的方法,其中每個(gè)指示信號(hào)指示細(xì)胞中代謝物的水平。
4.根據(jù)權(quán)利要求1的方法,其中每個(gè)指示信號(hào)指示細(xì)胞中蛋白質(zhì)的水平。
5.表征細(xì)胞或?qū)?xì)胞處理之效果的方法,包括以下步驟a)將來源于細(xì)胞的mRNA或來源于細(xì)胞mRNA的cDNA與多核苷酸群體雜交,其中每一個(gè)多核苷酸對(duì)應(yīng)于至少一個(gè)能在細(xì)胞中表達(dá)的基因,并且每一個(gè)雜交事件產(chǎn)生一個(gè)指示對(duì)應(yīng)于被雜交多核苷酸的基因的表達(dá)水平的雜交信號(hào);b)獲取多個(gè)聚集表達(dá)信號(hào),其中每一個(gè)聚集表達(dá)信號(hào)代表從該多核苷酸群體的亞群產(chǎn)生的雜交信號(hào)的組合,且每個(gè)亞群對(duì)應(yīng)于至少2個(gè)能在細(xì)胞中表達(dá)的基因;而且,獲取每一個(gè)聚集表達(dá)信號(hào)時(shí)不分析任何一個(gè)雜交信號(hào)對(duì)該聚集表達(dá)信號(hào)的貢獻(xiàn);c)從多個(gè)聚集表達(dá)信號(hào)產(chǎn)生細(xì)胞或?qū)?xì)胞之處理的特征性表達(dá)圖譜。
6.根據(jù)權(quán)利要求5的方法,其中亞群對(duì)應(yīng)于2至500(包括2和500)個(gè)隨機(jī)選擇的、能在細(xì)胞中表達(dá)的基因。
7.根據(jù)權(quán)利要求5或權(quán)利要求6的方法,其中亞群對(duì)應(yīng)于41、166、664或2656個(gè)隨機(jī)選擇的、能在細(xì)胞中表達(dá)的基因。
8.根據(jù)上述權(quán)利要求任一項(xiàng)的方法,其中第一亞群所對(duì)應(yīng)的基因的數(shù)量不同于第二亞群所對(duì)應(yīng)的基因的數(shù)量。
9.根據(jù)上述權(quán)利要求任一項(xiàng)的方法,其中組成亞群的多核苷酸的數(shù)量與此亞群所對(duì)應(yīng)的基因的數(shù)量相同。
10.根據(jù)權(quán)利要求5至8中任何一項(xiàng)的方法,其中組成亞群的多核苷酸的數(shù)量比此亞群所對(duì)應(yīng)的基因的數(shù)量少。
11.根據(jù)權(quán)利要求5至10中任何一項(xiàng)的方法,其中多核苷酸群體結(jié)合在固體支持物上。
12.根據(jù)權(quán)利要求11的方法,其中固體支持物是平面表面形式,并且多核苷酸群體在平面表面上形成離散點(diǎn)的陣列。
13.根據(jù)權(quán)利要求12的方法,其中每個(gè)離散點(diǎn)包含一個(gè)從中獲取聚集表達(dá)信號(hào)的亞群。
14.根據(jù)權(quán)利要求11的方法,其中固體支持物是多個(gè)珠子的形式,并且每粒珠子是可唯一鑒別的。
15.根據(jù)權(quán)利要求14的方法,其中每粒珠子結(jié)合從中獲取聚集表達(dá)信號(hào)的多核苷酸群體的一個(gè)亞群。
16.細(xì)胞中基因表達(dá)水平的圖譜,此圖譜包含多個(gè)聚集信號(hào),其中每一個(gè)聚集信號(hào)代表至少2個(gè)指示信號(hào)的組合,每個(gè)指示信號(hào)指示細(xì)胞中基因的表達(dá)水平;而且,獲取聚集信號(hào)時(shí)不分析任何一個(gè)指示信號(hào)對(duì)此聚集信號(hào)的貢獻(xiàn)。
17.通過比較第一和第二根據(jù)權(quán)利要求16的圖譜而獲得的基因表達(dá)圖譜,其中第一圖譜從第一狀態(tài)的細(xì)胞中獲取,第二圖譜從第二狀態(tài)的細(xì)胞中獲取,并且在每個(gè)圖譜中所采用的亞群內(nèi)的基因組成是相同的。
18.根據(jù)權(quán)利要求17的基因表達(dá)圖譜,其中第一狀態(tài)由第一處理產(chǎn)生,第二狀態(tài)由第二處理產(chǎn)生。
19.根據(jù)權(quán)利要求17或18的基因表達(dá)圖譜,其中第一狀態(tài)為測試狀態(tài),第二狀態(tài)為對(duì)照狀態(tài)。
20.根據(jù)權(quán)利要求19的基因表達(dá)圖譜,其中測試狀態(tài)為可能患病的狀態(tài)。
21.根據(jù)權(quán)利要求20的基因表達(dá)圖譜診斷患病狀態(tài)的用途。
22.根據(jù)權(quán)利要求19的基因表達(dá)圖譜,其中第一狀態(tài)的細(xì)胞已經(jīng)以作用方式已知的化合物處理過。
23.根據(jù)權(quán)利要求19的基因表達(dá)圖譜,其中第一狀態(tài)的細(xì)胞已經(jīng)以作用方式未知的化合物處理過。
24.根據(jù)權(quán)利要求22或權(quán)利要求23的基因表達(dá)圖譜在鑒定或檢驗(yàn)測試化合物作用方式中的用途。
25.新型化合物,其作用方式已經(jīng)通過采用根據(jù)權(quán)利要求22或權(quán)利要求23的基因表達(dá)圖譜得到鑒定或檢驗(yàn)。
全文摘要
本發(fā)明涉及分析基因表達(dá)、代謝物或蛋白質(zhì)水平的方法,這種方法構(gòu)建細(xì)胞的特征性圖譜的用途,以及此圖譜在疾病診斷及分析用于處理細(xì)胞的新型化合物的作用方式中的應(yīng)用。這些獲取細(xì)胞分子圖譜的簡化方法具有的優(yōu)點(diǎn)是它使普通技術(shù)人員可以構(gòu)建細(xì)胞中所選類別分子水平的圖譜,此圖譜可被用于區(qū)分不同的處理或不同的細(xì)胞狀態(tài),而構(gòu)建此圖譜時(shí)所使用的數(shù)據(jù)比通常用于構(gòu)建現(xiàn)有圖譜的數(shù)據(jù)少。
文檔編號(hào)G06F19/20GK1610755SQ02809485
公開日2005年4月27日 申請(qǐng)日期2002年7月17日 優(yōu)先權(quán)日2001年7月19日
發(fā)明者S·J·W·霍爾, D·R·奧賴?yán)?申請(qǐng)人:辛根塔有限公司