欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

通過載體構(gòu)建體與細(xì)胞dna的非同源重組來表達(dá)內(nèi)源基因的制作方法

文檔序號(hào):452965閱讀:529來源:國知局

專利名稱::通過載體構(gòu)建體與細(xì)胞dna的非同源重組來表達(dá)內(nèi)源基因的制作方法
背景技術(shù)
:發(fā)明領(lǐng)域本發(fā)明的領(lǐng)域是通過原位重組法來活化基因表達(dá)或?qū)е禄蜻^表達(dá)。本發(fā)明涉及使內(nèi)源基因在細(xì)胞中以高于通??梢娪诩?xì)胞中的水平進(jìn)行表達(dá)。在一個(gè)活化基因表達(dá)的調(diào)控序列通過非同源或非法重組整合到細(xì)胞后該基因的表達(dá)被活化或提高。由于整合不需要導(dǎo)向序列,該方法能夠鑒定和表達(dá)用目前方法無法發(fā)現(xiàn)的基因。因此,可以由那種未被測序和實(shí)際上不知道其存在的以及已非常明確的基因獲得與人類疾病和發(fā)育相關(guān)的基因產(chǎn)物。所述方法提供了用于治療和診斷目的的這些基因的基因產(chǎn)物。相關(guān)現(xiàn)有技術(shù)鑒定和過表達(dá)與人類疾病相關(guān)的新基因是開發(fā)新的治療藥物的一個(gè)重要步驟。目前建立用于過表達(dá)蛋白質(zhì)的細(xì)胞文庫的方法是建立在制備和克隆cDNA的基礎(chǔ)上。因此,為了用這種方法鑒定新基因,必須在用于構(gòu)建文庫的細(xì)胞中表達(dá)該基因。該基因還必須以足以在文庫中以足夠量出現(xiàn)的水平表達(dá)。這其中是有疑問的,因?yàn)樵S多基因僅在少數(shù)細(xì)胞群中、或者在短暫的發(fā)育期間以極低的量表達(dá)。另外,由于某些mRNA的體積太大,很難或不可能制備能表達(dá)生物活性蛋白質(zhì)的全長cDNA分子。對(duì)于小mRNA也發(fā)現(xiàn)有缺少全長cDNA分子的情況,這被認(rèn)為是與遺傳信息中那些難于通過反轉(zhuǎn)錄來制備的序列或者在細(xì)菌中的增殖期間不穩(wěn)定的序列有關(guān)。因此,即使最完整的cDNA文庫也只能表達(dá)全部可能基因組中的一部分。最后,許多cDNA文庫是在細(xì)菌載體中制備的,用這些載體來表達(dá)生物活性哺乳動(dòng)物蛋白質(zhì)有很大的局限性,因?yàn)槎鄶?shù)哺乳動(dòng)物蛋白質(zhì)在細(xì)菌中不能正確地折疊和/或不恰當(dāng)?shù)靥腔R虼?,建立一個(gè)更有代表性的表達(dá)蛋白質(zhì)的文庫的方法將非常有價(jià)值,該文庫能便于真實(shí)地表達(dá)生物活性蛋白質(zhì)。目前用于過表達(dá)蛋白質(zhì)的方法包括克隆目的基因,將其轉(zhuǎn)入一個(gè)構(gòu)建體,鄰接合適的啟動(dòng)子/增強(qiáng)子、多腺苷酸化信號(hào)以及剪接位點(diǎn),并將該構(gòu)建體導(dǎo)入適當(dāng)?shù)乃拗骷?xì)胞。一種替代方法包括利用同源重組通過將一個(gè)強(qiáng)啟動(dòng)子或其他調(diào)控序列靶定到預(yù)先確定的基因上來活化該基因的表達(dá)。WO90/14092描述了在哺乳動(dòng)物細(xì)胞中,原位修復(fù)編碼目的蛋白質(zhì)的基因。該申請(qǐng)描述了用來對(duì)編碼目的蛋白質(zhì)的基因進(jìn)行定點(diǎn)修飾的單鏈寡核苷酸。也可包括一個(gè)標(biāo)記物。但是,這些方法局限于提供與靶位點(diǎn)有相當(dāng)同源性的寡核苷酸序列。因此,所述方法需要已知通過定點(diǎn)修飾和同源重組進(jìn)行活化所需要的位點(diǎn)。用這類方法不能發(fā)現(xiàn)新基因。WO91/06667描述了原位表達(dá)哺乳動(dòng)物基因的方法。利用所述方法,通過同源重組將擴(kuò)增基因?qū)肽康幕蜞徫弧H缓笤诤线m的培養(yǎng)基中培養(yǎng)細(xì)胞,擴(kuò)增基因和目的基因均被擴(kuò)增,目的基因表達(dá)增強(qiáng)。如上,導(dǎo)入擴(kuò)增基因的方法限于同源重組,不能用來活化未知其序列或(存在)的新基因。WO91/01140描述了通過同源重組修飾細(xì)胞,從而使內(nèi)源基因失活。通過這些方法,同源重組被用來修飾和失活基因,并能制備可作為基因療法中的供體的細(xì)胞。WO92/20808描述了原位修飾基因組靶位點(diǎn)的方法。文中描述的是一些小修飾,例如在DNA中改變單個(gè)堿基。該方法依賴于利用用于導(dǎo)向的同源DNA進(jìn)行基因組修飾。WO92/19255描述了一種通過同源重組來增強(qiáng)目的基因表達(dá)的方法,其中將一個(gè)DNA序列整合到基因組或大的基因組片段中。然后可以將被修飾的序列轉(zhuǎn)入次級(jí)宿主中進(jìn)行表達(dá)。可以在目標(biāo)基因旁邊整合一個(gè)擴(kuò)增基因從而使目標(biāo)區(qū)域可被擴(kuò)增用于增強(qiáng)表達(dá)。同源重組是該定向方法所必須的。WO93/09222描述了通過活化編碼所需產(chǎn)物的內(nèi)源基因來制備蛋白質(zhì)的方法。通過同源重組并將通常與希望其表達(dá)的基因相聯(lián)的區(qū)域替換或失活來靶定調(diào)控區(qū)域。這一失活或替換導(dǎo)致基因以高于正常的水平表達(dá)。WO94/12650描述了一種活化內(nèi)源基因在細(xì)胞中原位表達(dá)和擴(kuò)增的方法,其中所述基因在細(xì)胞中不表達(dá)或不以所需水平表達(dá)。用這樣的一個(gè)外源DNA序列轉(zhuǎn)染細(xì)胞,該序列修復(fù)、改變、缺失或替換細(xì)胞中存在的一段序列或者它是通常不與細(xì)胞中的內(nèi)源基因功能性地連接的調(diào)控序列。為了達(dá)到這一目的,用與基因組DNA序列在預(yù)選位點(diǎn)上同源的DNA序列來靶定內(nèi)源基因。另外,可以包括編碼選擇標(biāo)記的擴(kuò)增DNA。通過在選擇用于擴(kuò)增的條件下培養(yǎng)同源重組細(xì)胞,內(nèi)源基因和擴(kuò)增標(biāo)記共擴(kuò)增,并使基因表達(dá)提高。WO95/31560描述了用于同源重組的DNA構(gòu)建體。該構(gòu)建體包括一個(gè)靶定序列,一個(gè)調(diào)控序列、一個(gè)外顯子和一個(gè)未配對(duì)的剪接供體位點(diǎn)。通過構(gòu)建體與細(xì)胞內(nèi)的基因組序列之間的同源重組實(shí)現(xiàn)靶定,使得能在體外或體內(nèi)制備蛋白質(zhì)。WO96/29411描述了利用外源調(diào)控序列,通過同源重組將外源外顯子(編碼或非編碼)及剪接供體位點(diǎn)導(dǎo)入基因組中一個(gè)預(yù)先選定的位點(diǎn)。在此申請(qǐng)中,定位了所導(dǎo)入的DNA,從而使外源調(diào)控區(qū)域控制下的轉(zhuǎn)錄子包括存在于血小板生成素、DnaseⅠ或β-干擾素基因中的外源外顯子和內(nèi)源外顯子,從而得到其中外源和外源外顯子可操縱地連接在一起的轉(zhuǎn)錄子。這些新的轉(zhuǎn)錄單位是通過同源重組得到的。美國專利5272071描述了通過插入一個(gè)能增強(qiáng)細(xì)胞內(nèi)常規(guī)表達(dá)基因的表達(dá)水平的DNA調(diào)控元件使得該細(xì)胞內(nèi)的轉(zhuǎn)錄沉默基因發(fā)生轉(zhuǎn)錄活化。插入調(diào)控元件使得它與正常情況下沉默的基因可操縱地連接在一起。借助同源重組以下述方式來實(shí)現(xiàn)插入用通常情況下沉默的基因的一個(gè)片段(靶向DNA)和用來誘導(dǎo)所需轉(zhuǎn)錄的DNA調(diào)控元件來建立DNA構(gòu)建體。美國專利5578461討論了通過同源重組活化哺乳動(dòng)物目的基因表達(dá)。將一個(gè)DNA序列整合到基因組或一個(gè)大基因組片段中來增強(qiáng)目的基因的表達(dá)。然后可以將該修飾過的構(gòu)建體轉(zhuǎn)入次級(jí)宿主中??梢栽谀康幕蜞徑幷弦粋€(gè)擴(kuò)增基因從而使目的區(qū)域發(fā)生擴(kuò)增以實(shí)現(xiàn)增強(qiáng)表達(dá)。上述兩種方法(通過克隆或通過體內(nèi)同源重組構(gòu)建過表達(dá)構(gòu)建體)均要求在其可被過表達(dá)之前將基因克隆并測序。另外,利用同源重組,還必須要知道基因組序列和結(jié)構(gòu)。不幸的是,許多基因還未被鑒定和/或測序。因此,無論目的基因是否以前已被克隆、其序列和結(jié)構(gòu)是否已知,用于過表達(dá)該基因的方法將十分有用。發(fā)明簡述因此,本發(fā)明一般性地涉及在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,所述方法包括將含有轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞,使載體通過非同源重組整合到該細(xì)胞的基因組中,使內(nèi)源基因在細(xì)胞內(nèi)過表達(dá)。該方法不需要預(yù)先已知內(nèi)源基因的序列,甚至不需要知道它的其存在。本發(fā)明還包括用于經(jīng)非同源重組來活化基因的表達(dá)或過表達(dá)基因的新載體構(gòu)建體。該新構(gòu)建體不含同源導(dǎo)向序列。這就是說,它不含有這樣一些核苷酸序列,該序列靶定宿主細(xì)胞DNA并促進(jìn)在靶位點(diǎn)進(jìn)行內(nèi)源重組,從而導(dǎo)致細(xì)胞基因借助所導(dǎo)入的轉(zhuǎn)錄調(diào)控序列而過表達(dá)。新載體構(gòu)建體包括這樣的載體,它含有與一個(gè)未配對(duì)的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,并還含有1或多個(gè)擴(kuò)增標(biāo)記。新載體構(gòu)建體包括下列構(gòu)建體具有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、分泌信號(hào)序列以及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起;具有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、表位標(biāo)記以及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起;含有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、信號(hào)序列和表位標(biāo)記以及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起;含有轉(zhuǎn)錄調(diào)控序列的構(gòu)建體,該序列與翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記以及序列特異的蛋白酶位點(diǎn)和未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起。載體構(gòu)建體可以含有1或多個(gè)用于挑選重組宿主細(xì)胞的選擇標(biāo)記??蛇x擇地,可通過由活化內(nèi)源基因產(chǎn)物提供的性狀的表型選擇來實(shí)現(xiàn)挑選。這些載體,和實(shí)際上本文公開的任何載體,以及本領(lǐng)域技術(shù)人員很容易想到這些載體的變異體可被用于在本文公開的任何方法中配制可由這些方法制備的任何組合物。用于本發(fā)明載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列包括,但不限于啟動(dòng)子。在優(yōu)選實(shí)施方案中,所述啟動(dòng)子是一個(gè)病毒啟動(dòng)子。在更優(yōu)選的實(shí)施方案中,病毒啟動(dòng)子是巨細(xì)胞病毒立即早期啟動(dòng)子。在另一個(gè)具體實(shí)施方案中,啟動(dòng)子是細(xì)胞非病毒啟動(dòng)子或誘導(dǎo)型啟動(dòng)子。用于本發(fā)明載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列也可以包括,但不限于增強(qiáng)子。在優(yōu)選實(shí)施方案中,所述增強(qiáng)子是病毒增強(qiáng)子。在更優(yōu)選的實(shí)施方案中,該病毒增強(qiáng)子是巨細(xì)胞病毒立即早期增強(qiáng)子。在另一個(gè)具體實(shí)施方案中,增強(qiáng)子是細(xì)胞非病毒增強(qiáng)子。在文中公開的方法的優(yōu)選實(shí)施方案中,載體構(gòu)建體是,或者可以含有線性RNA或DNA。可以篩選基因表達(dá)的含有載體的細(xì)胞。可以于體外在利于由細(xì)胞產(chǎn)生預(yù)期量內(nèi)源基因的基因產(chǎn)物(文中又可互換地稱為“表達(dá)產(chǎn)物”)的條件下,培養(yǎng)過表達(dá)所述基因的細(xì)胞,其中該內(nèi)源基因已被活化或其表達(dá)已提高。然后可分離并純化表達(dá)產(chǎn)物,用來進(jìn)行如蛋白質(zhì)治療或發(fā)現(xiàn)藥物。另一方面,使表達(dá)所需基因產(chǎn)物的細(xì)胞在體內(nèi)表達(dá)基因產(chǎn)物。在本發(fā)明這些具體方面,在利于基因被真核生物體內(nèi)細(xì)胞進(jìn)行過表達(dá)或活化的條件下,可以將含有本發(fā)明所述載體構(gòu)建體(已整合到其基因組中)的細(xì)胞導(dǎo)入真核生物(比如脊椎動(dòng)物,尤其是哺乳動(dòng)物,更特別是人)。在本發(fā)明這些相關(guān)方面,可以在將細(xì)胞導(dǎo)入真核生物之前將其分離和克隆。本發(fā)明還涉及在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和1或多個(gè)擴(kuò)增標(biāo)記的載體導(dǎo)入細(xì)胞,使載體通過非同源重組整合到細(xì)胞基因組中,使內(nèi)源基因在細(xì)胞內(nèi)過表達(dá)??梢院Y選過表達(dá)所述基因的含有載體的細(xì)胞。培養(yǎng)過表達(dá)基因的細(xì)胞,從而獲得內(nèi)源基因的擴(kuò)增。然后可以體外培養(yǎng)細(xì)胞來制備已發(fā)生擴(kuò)增的內(nèi)源基因的預(yù)期量基因產(chǎn)物,其中所述內(nèi)源基因已被活化或者其表達(dá)已提高。然后可以分離并純化基因產(chǎn)物。可選擇地,擴(kuò)增之后,可令細(xì)胞在體內(nèi)表達(dá)內(nèi)源基因并產(chǎn)生預(yù)期量基因產(chǎn)物。但是應(yīng)當(dāng)明白,任何用于文中所述方法的載體可以包括1或多個(gè)擴(kuò)增標(biāo)記。因此,在細(xì)胞內(nèi),載體和目的DNA(即含有被過表達(dá)的基因的DNA)都被擴(kuò)增,并獲得內(nèi)源基因進(jìn)一步增強(qiáng)的表達(dá)。與此相應(yīng),所述方法可以包括一個(gè)擴(kuò)增內(nèi)源基因的步驟。本發(fā)明還涉及在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和未配對(duì)剪接供體序列的載體導(dǎo)入細(xì)胞,使載體經(jīng)非同源重組整合到細(xì)胞基因組中,在細(xì)胞中過表達(dá)所述內(nèi)源基因??梢院Y選基因表達(dá)的含有載體的細(xì)胞??梢栽隗w外培養(yǎng)過表達(dá)基因的細(xì)胞以便制備預(yù)期量的其表達(dá)已被活化或提高的基因的基因產(chǎn)物。然后可以分離并純化所述基因產(chǎn)物??蛇x擇地,可令細(xì)胞在體內(nèi)表達(dá)所需基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和1或多個(gè)擴(kuò)增標(biāo)記。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和剪接供體序列。本發(fā)明的任何載體構(gòu)建體還可以包含分泌信號(hào)序列。分泌信號(hào)序列被安排在構(gòu)建體中,這樣它將與被活化的內(nèi)源蛋白可操縱地連接在一起。因此,目的蛋白質(zhì)會(huì)在細(xì)胞內(nèi)發(fā)生分泌,方便了該蛋白質(zhì)的純化。與此相應(yīng),所述方法可以包括一個(gè)使蛋白質(zhì)表達(dá)產(chǎn)物從細(xì)胞中分泌出來的步驟。本發(fā)明還包括通過任何上述方法制得的細(xì)胞。本發(fā)明包括含有所述載體構(gòu)建體的細(xì)胞、其中的載體構(gòu)建體已整合到細(xì)胞基因組中的細(xì)胞、以及由內(nèi)源基因在所導(dǎo)入的轉(zhuǎn)錄調(diào)控序列的引導(dǎo)下過表達(dá)所需基因產(chǎn)物的細(xì)胞??蓪⒓?xì)胞分離并克隆??梢栽谌魏握婧松飦碓?比如真菌、植物或動(dòng)物)的細(xì)胞內(nèi)實(shí)施所述方法。在優(yōu)選實(shí)施方案中,可以在脊椎動(dòng)物細(xì)胞內(nèi)尤其是哺乳動(dòng)物細(xì)胞(包括但不限于大鼠、小鼠、牛、豬、綿羊、山羊和人細(xì)胞,更特別是在人細(xì)胞中)中實(shí)施本發(fā)明的方法。通過上述方法制得的單個(gè)細(xì)胞可以過表達(dá)單個(gè)基因或多個(gè)基因??梢酝ㄟ^將單一類型的構(gòu)建體整合到基因組中的多個(gè)位置來活化細(xì)胞內(nèi)的多個(gè)基因。類似地,可以通過將多重構(gòu)建體(即多個(gè)類型的構(gòu)建體)整合到基因組中的多個(gè)位置來活化細(xì)胞內(nèi)的多個(gè)基因。因此,一個(gè)細(xì)胞可以只含一類載體構(gòu)建體或不同類型的載體構(gòu)建體,每個(gè)均能活化一個(gè)內(nèi)源基因。本發(fā)明還涉及通過下列一或多項(xiàng),制備上述細(xì)胞的方法將本發(fā)明的一或多個(gè)載體構(gòu)建體導(dǎo)入細(xì)胞;使導(dǎo)入的構(gòu)建體通過非同源重組整合到細(xì)胞基因組中;在細(xì)胞內(nèi)過表達(dá)一或多個(gè)內(nèi)源基因;分離和克隆細(xì)胞。本發(fā)明還涉及由這些方法制得的細(xì)胞,其中該細(xì)胞可能是分離的細(xì)胞。本發(fā)明還包括利用上述細(xì)胞來過表達(dá)基因(比如內(nèi)源的細(xì)胞基因)的方法,所述基因已被鑒定(例如,已測序)、未鑒定(例如,一個(gè)功能已知但未被克隆或測序的基因),或是在過表達(dá)之前,不知道其存在的基因??梢杂眉?xì)胞來在體外或體內(nèi)制備預(yù)期量的表達(dá)產(chǎn)物。如果必要,可以隨后通過例如裂解細(xì)胞或從生長培養(yǎng)基中分離(當(dāng)載體含有分泌信號(hào)序列時(shí))來分離并純化該表達(dá)產(chǎn)物。本發(fā)明還包括由上述方法制得的細(xì)胞文庫。每個(gè)文庫可以包括得自一次轉(zhuǎn)染實(shí)驗(yàn)的所有克隆或得自一次轉(zhuǎn)染實(shí)驗(yàn)的一個(gè)亞組的克隆。所述亞組可以過表達(dá)相同的基因或多個(gè)基因,例如,一類基因。轉(zhuǎn)染可以用單個(gè)構(gòu)建體或多個(gè)構(gòu)建體進(jìn)行??梢酝ㄟ^將得自兩次或多次轉(zhuǎn)染實(shí)驗(yàn)的所有重組細(xì)胞合并、將得自一次轉(zhuǎn)染實(shí)驗(yàn)的1或多個(gè)細(xì)胞亞組合并、或者將得自不同轉(zhuǎn)染實(shí)驗(yàn)的細(xì)胞亞組合并從而形成所述文庫。所得文庫可以表達(dá)相同的基因或多個(gè)基因,例如一類基因。同樣,在每次轉(zhuǎn)染中,可以使用單個(gè)構(gòu)建體或多個(gè)構(gòu)建體。文庫可由相同或不同的細(xì)胞類型構(gòu)成。本發(fā)明還涉及通過從相同或不同轉(zhuǎn)染實(shí)驗(yàn)中挑選各種細(xì)胞亞組來制備文庫的方法。本發(fā)明還涉及利用上述細(xì)胞或細(xì)胞文庫來過表達(dá)或活化內(nèi)源基因的方法,或者獲得這些過表達(dá)或活化基因的基因表達(dá)產(chǎn)物的方法。根據(jù)本發(fā)明的這一方面,可以篩選細(xì)胞或細(xì)胞文庫來表達(dá)某因,并可挑選出能表達(dá)所需基因產(chǎn)物的細(xì)胞。然后用這些細(xì)胞來分離或純化用于后續(xù)用途的基因產(chǎn)物??梢酝ㄟ^下述方式在細(xì)胞內(nèi)進(jìn)行表達(dá)在有利于由細(xì)胞產(chǎn)生內(nèi)源基因的表達(dá)產(chǎn)物的條件下體外培養(yǎng)所述細(xì)胞,或者使細(xì)胞在體內(nèi)表達(dá)基因。在本發(fā)明的優(yōu)選實(shí)施方案中,所述方法包括一個(gè)分離或純化表達(dá)產(chǎn)物的過程。在非常優(yōu)選的實(shí)施方案中,培養(yǎng)能表達(dá)內(nèi)源基因產(chǎn)物的細(xì)胞,培養(yǎng)條件為有利于產(chǎn)生足夠量的基因產(chǎn)物以便用于商業(yè)應(yīng)用,尤其是診斷、治療和藥物開發(fā)等用途。任何上述方法都可進(jìn)一步包括在載體整合之前或同時(shí),向細(xì)胞的基因組DNA導(dǎo)入雙鏈斷裂片段。根據(jù)以下附圖和說明書及權(quán)利要求,本發(fā)明的其它優(yōu)選實(shí)施方案對(duì)本領(lǐng)域普通技術(shù)人員是顯而易見的。附圖簡述圖1.本文所述基因活化過程的示意圖。將活化構(gòu)建體轉(zhuǎn)染到細(xì)胞內(nèi),并使其在DNA斷裂處整合到宿主細(xì)胞染色體中。如果斷裂發(fā)生在目的基因的上游(例如Epo),并且合適的活化構(gòu)建體在斷裂處整合,這樣調(diào)控序列與目的基因可操縱地連接在一起,基因就被活化。轉(zhuǎn)錄和剪接產(chǎn)生嵌合RNA分子,該分子含有來自活化構(gòu)建體和內(nèi)源基因的外顯子序列。隨后的翻譯將產(chǎn)生目的蛋白質(zhì)。將重組細(xì)胞分離后,可以進(jìn)一步借助基因擴(kuò)增來增強(qiáng)基因表達(dá)。圖2.非翻譯活化構(gòu)建體的示意圖。箭頭代表啟動(dòng)子序列。外顯子序列表示為開放盒,S/D表示剪接供體序列。與下面說明對(duì)應(yīng)的構(gòu)建體編號(hào)示于左邊。選擇和擴(kuò)增標(biāo)記未示出。圖3.翻譯活化構(gòu)建體的示意圖,箭頭代表啟動(dòng)子序列。外顯子序列表示為開放盒,S/D表示剪接供體序列。翻譯的信號(hào)肽、表位標(biāo)記以及蛋白酶切割序列示于構(gòu)建體下的圖標(biāo)中。與下面說明對(duì)應(yīng)的構(gòu)建體編號(hào)示于左邊。選擇和擴(kuò)增標(biāo)記未示出。圖4.能活化內(nèi)源基因的活化構(gòu)建體的示意圖。圖5A-5D.pRIG8R1-CD2的核苷酸序列(SEQIDNO7)。圖6A-6C.pRIG8R2-CD2的核苷酸序列(SEQIDNO8)。圖7A-7C.pRIG8R3-CD2的核苷酸序列(SEQIDNO9)。發(fā)明詳述通過非同源重組活化基因大大優(yōu)于其它基因活化方法。與以前蛋白質(zhì)過表達(dá)不同,本文描述的方法不需克隆(從細(xì)胞中分離出來)目的基因。它們也不需了解將要過表達(dá)的基因的DNA序列或結(jié)構(gòu)(即ORF、內(nèi)含子、外顯子或上游和下游調(diào)控元件的序列)或該基因的表達(dá)方式(即組織特異性、發(fā)育調(diào)控等)。另外,這些方法不需要有關(guān)目的基因的基因結(jié)構(gòu)(即內(nèi)含子和外顯子結(jié)構(gòu))的知識(shí)。因此,本發(fā)明的方法涉及載體構(gòu)建體,其中該載體構(gòu)建體不含有用于同源重組的靶核苷酸序列。靶序列能使載體DNA與細(xì)胞DNA在細(xì)胞DNA上的預(yù)定位點(diǎn)進(jìn)行同源重組,所述位點(diǎn)與載體中的序列具有同源性,在預(yù)定位點(diǎn)發(fā)生的同源重組導(dǎo)致轉(zhuǎn)錄調(diào)控序列被導(dǎo)入基因組,內(nèi)源基因隨即被活化。本發(fā)明的方法不包括載體在預(yù)定位點(diǎn)處整合。相反,本方法涉及本發(fā)明的載體構(gòu)建體通過非同源或“非法重組”整合到細(xì)胞DNA(例如,細(xì)胞基因組)中。本文中描述的載體不含靶序列。靶序列是載體上的這樣一個(gè)序列,它與待活化的基因內(nèi)部的或者其上游的一或多個(gè)序列同源,其中上游區(qū)域到達(dá)并且包括目的基因相同的編碼鏈上第一個(gè)功能剪接受體位點(diǎn),借助該同源性,將能活化目的基因的轉(zhuǎn)錄調(diào)控序列整合到含有待活化基因的細(xì)胞的基因組中。在用增強(qiáng)子整合載體來活化內(nèi)源基因的情況中,在增強(qiáng)子能起到作用的距離內(nèi),所述載體不與目的基因的基因組的上游或下游(或在目的基因內(nèi)部)的任何序列有同源性。因此這些方法能夠鑒定到那些已被或可能被常規(guī)和現(xiàn)有克隆技術(shù)丟失的新基因。利用本文描述的構(gòu)建體和方法,可以快速鑒定未知和/或未鑒定的基因,并使其過表達(dá)以產(chǎn)生蛋白質(zhì)。這些蛋白質(zhì)的用途包括人類治療和診斷,及作為藥物開發(fā)的靶。所述方法還能用于已知和/或已鑒定基因的過表達(dá),以便體外或體內(nèi)制備蛋白質(zhì)。“已知基因”涉及基因的鑒定水平。本發(fā)明能表達(dá)已被鑒定和未被鑒定的基因。不同程度的鑒定都是可能的。這些包括詳細(xì)的鑒定,比如克隆、DNA、RNA和/或蛋白質(zhì)測序,以及確定基因的調(diào)控和功能與克隆序列的關(guān)系(例如,識(shí)別啟動(dòng)子和增強(qiáng)子序列、開放讀碼框的功能,內(nèi)含子等)。鑒定可以較粗略,比如將基因和相關(guān)功能作圖,或得到部分氨基酸序列或核苷酸序列,或已將蛋白質(zhì)純化并確定了功能。鑒定可能是極基本的,如已知核苷酸或氨基酸序列或者已將蛋白質(zhì)分離,但功能未知??蛇x擇地,功能可能是已知的,但相關(guān)的蛋白質(zhì)或核苷酸序列未知,或者雖然知道序列但沒有與功能建立聯(lián)系。最后,也可能沒有做任何鑒定,因?yàn)榛虻拇嬖诩捌涔δ芫俏粗?。本發(fā)明可以在任何上述或其它具體的鑒定程度的水平上表達(dá)任何基因。利用一個(gè)活化構(gòu)建體并在一組轉(zhuǎn)染中可以活化或過表達(dá)許多不同蛋白質(zhì)(在本文中還可互換地稱為“基因產(chǎn)物”或“表達(dá)產(chǎn)物”)。因此,在用相同或不同構(gòu)建體轉(zhuǎn)染之后,一組轉(zhuǎn)染子(文庫)中的一個(gè)細(xì)胞或不同細(xì)胞可以過表達(dá)多個(gè)蛋白質(zhì)。而以前的活化方法要求給每個(gè)待活化基因建立一個(gè)獨(dú)特的構(gòu)建體。此外,利用一個(gè)構(gòu)建體可以同時(shí)形成和檢測一個(gè)基因附近的許多不同整合位點(diǎn)。這就使得能快速確定用于蛋白質(zhì)表達(dá)的活化構(gòu)建體的最佳基因組位置。利用以前的方法,對(duì)于目的基因5’端的序列和結(jié)構(gòu)必須做廣泛的鑒定。必須給每個(gè)要制備的活化構(gòu)建體分離一個(gè)合適的靶序列。通常,靶序列必須是分離自與待活化細(xì)胞相同的人或動(dòng)物實(shí)驗(yàn)株的純合序列。在某些情下,該DNA可能是來自目的基因的50kb或更長片段。因此,制備每個(gè)導(dǎo)向構(gòu)建體要對(duì)內(nèi)源基因進(jìn)行大量克隆和測序工作。而因?yàn)楸景l(fā)明的方法不需要序列和結(jié)構(gòu)信息,可以活化未知基因和帶有未做鑒定的上游區(qū)域的基因。這就有可能利用內(nèi)源DNA序列與胞內(nèi)DNA進(jìn)行的非同源重組做原位基因活化。本發(fā)明即提供了利用非同源重組實(shí)現(xiàn)的這種原位基因活化所需的方法和組分(例如,載體構(gòu)建體)。DNA分子可以通過幾種不同的獨(dú)立機(jī)制發(fā)生重組從而重新分配其遺傳內(nèi)容,所述機(jī)制包括同源重組、位點(diǎn)特異性重組、以及非同源/非法重組。同源重組涉及那些序列極其類似的DNA片段之間的重組、已經(jīng)證實(shí),同源重組涉及在遺傳物重新分配之前,同源序列沿其鏈形成配對(duì)。交叉的確切位點(diǎn)可以是同源片段中的任何位點(diǎn)。重組效率與同源導(dǎo)向序列的長度(Hope,發(fā)育113399(1991);Reddy等,病毒學(xué)雜志651507(1991))、兩個(gè)發(fā)生重組的序列之間的序列相同程度(VonMelchner等,基因進(jìn)展6919(1992))、以及構(gòu)建體中同源與非同源DNA的比率(Letson,遺傳學(xué)117759(1987))成比例。另一方面,位點(diǎn)特異性重組涉及遺傳物質(zhì)在預(yù)定位點(diǎn)(由特異DNA序列決定)的交換。在該反應(yīng)中,蛋白質(zhì)重組酶結(jié)合到重組信號(hào)序列上,形成一個(gè)鏈斷裂,并促進(jìn)DNA鏈交換。Cre/Lox重組就是位點(diǎn)特異性重組的實(shí)例。非同源/非法重組,比如本發(fā)明的方法有利地所采用的,包括沒有顯著序列同源性的遺傳物質(zhì)的連接(交換或重新分配)并且不是發(fā)生在位點(diǎn)特異性重組序列處。非同源重組的例子包括外源DNA在非同源位點(diǎn)整合到染色體中、染色體易位和缺失,DNA末端連接,染色體末端的雙鏈斷裂修復(fù),橋裂合以及轉(zhuǎn)染序列的連環(huán)化。在多數(shù)情況中,認(rèn)為非同源重組是通過“游離DNA未端”的連接發(fā)生的。游離末端是這樣的DNA分子,它含有一個(gè)能夠與第二個(gè)DNA末端直接連接、或者在修復(fù)或加工后與第二個(gè)DNA末端連接的末端。該DNA末端可能含有5′突出端,3′突出端,或者平末端。在本文中,可以廣泛地將逆轉(zhuǎn)錄病毒插入和其它轉(zhuǎn)座反應(yīng)看作是非同源重組。這些反應(yīng)不涉及利用發(fā)生重組的分子間的同源性。而且,與位點(diǎn)特異性重組不同,這些類型的重組反應(yīng)不是在離散位點(diǎn)之間進(jìn)行的。相反,僅在重組配偶體(即,逆轉(zhuǎn)錄病毒或轉(zhuǎn)座子)之一上需要有特異蛋白質(zhì)/DNA復(fù)合體,而第二個(gè)DNA配偶體(即,細(xì)胞基因組)通常是相當(dāng)非特異性的。結(jié)果,這些“載體”不是以定向方式整合到細(xì)胞基因組,因此可以根據(jù)本發(fā)明用它們來遞送活化構(gòu)建體??捎糜诒疚乃龇椒ǖ妮d體構(gòu)建體理想情況下可以含有一個(gè)轉(zhuǎn)錄調(diào)控序列,它與細(xì)胞內(nèi)的基因組序列發(fā)生非同源重組從而在該細(xì)胞內(nèi)過表達(dá)內(nèi)源基因。本發(fā)明的載體構(gòu)建體還缺少同源靶序列。即,它們不含有靶定宿主細(xì)胞DNA并促進(jìn)在靶位點(diǎn)處發(fā)生同源重組的DNA序列。因此,本發(fā)明的載體構(gòu)建體通過非同源重組整合到細(xì)胞基因組中,并借助所導(dǎo)入的包含在整合進(jìn)來的載體構(gòu)建體中的轉(zhuǎn)錄調(diào)控序列來過表達(dá)細(xì)胞基因。本發(fā)明一般性地涉及用于在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中,使載體通過非同源重組整合到細(xì)胞基因組中,使內(nèi)源基因在細(xì)胞內(nèi)過表達(dá)。該方法不需要預(yù)先了解內(nèi)源基因的序列甚至其存在。而在待活化基因序列已知的情況下,可以將構(gòu)建體改造為含有合適的載體元件構(gòu)型(例如,起始密碼子的位置,內(nèi)源基因的第一個(gè)外顯子中存在的附加密碼子、以及合適的讀框)從而獲得最大程度的過表達(dá)和/或適當(dāng)?shù)牡鞍踪|(zhì)序列。在本發(fā)明的某些實(shí)施方案中,可以篩選基因表達(dá)的含有載體的細(xì)胞??梢泽w外培養(yǎng)過表達(dá)所述基因的細(xì)胞,培養(yǎng)條件為有利于該細(xì)胞產(chǎn)生那些已被活化或其表達(dá)已提高的內(nèi)源基因的預(yù)期量的基因產(chǎn)物。如果需要,可以隨后將基因產(chǎn)物分離或純化以便用于,例如,蛋白質(zhì)療法或藥物開發(fā)??蛇x擇地,可以將表達(dá)所需基因產(chǎn)物的細(xì)胞在體內(nèi)表達(dá)所述基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列??蛇x擇地,所述載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和1或多個(gè)擴(kuò)增標(biāo)記。因此,本發(fā)明還涉及在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和擴(kuò)增標(biāo)記的載體導(dǎo)入細(xì)胞中,使載體通過非同源重組整合到細(xì)胞基因組中,使內(nèi)源基因在細(xì)胞內(nèi)過表達(dá)。篩選過表達(dá)所述基因的含有載體的細(xì)胞。培養(yǎng)過表達(dá)所述基因的細(xì)胞從而使內(nèi)源基因的擴(kuò)增。然后將細(xì)胞體外培養(yǎng)從而得到擴(kuò)增后的內(nèi)源基因的預(yù)期量基因產(chǎn)物,該內(nèi)源基因已被活化,或者其表達(dá)已提高,然后可以對(duì)基因產(chǎn)物進(jìn)行分離和純化。可選擇地,擴(kuò)增后,使細(xì)胞在體內(nèi)表達(dá)內(nèi)源基因并產(chǎn)生預(yù)期量基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有轉(zhuǎn)錄調(diào)控序列和剪接供體序列。因此,本發(fā)明還涉及在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括將含有轉(zhuǎn)錄調(diào)控序列和未配對(duì)的剪接供體序列的載體導(dǎo)入細(xì)胞中,使載體通過非同源重組整合到細(xì)胞基因組中,使內(nèi)源基因在細(xì)胞內(nèi)過表達(dá)。篩選表達(dá)所述基因的含有載體的細(xì)胞。體外培養(yǎng)過表達(dá)基因的細(xì)胞從而得到預(yù)期量的內(nèi)源基因的基因產(chǎn)物,該內(nèi)源基因的表達(dá)已被活化,或者其表達(dá)已提高,然后可以對(duì)基因產(chǎn)物進(jìn)行分離和純化??蛇x擇地,可以使細(xì)胞在體內(nèi)表達(dá)所需基因產(chǎn)物。載體構(gòu)建體可本質(zhì)上含有可操縱地連接到未配對(duì)剪接供體序列的轉(zhuǎn)錄調(diào)控序列,并且還含有擴(kuò)增標(biāo)記。其它活化載體包括下列一些構(gòu)建體具有轉(zhuǎn)錄調(diào)控序列和含有起始密碼子的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子及分泌信號(hào)序列的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子及表位標(biāo)記的外顯子序列的構(gòu)建體;具有轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子、信號(hào)序列及表位標(biāo)記的外顯子序列的構(gòu)建體;包含轉(zhuǎn)錄調(diào)控序列和含有翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記及序列特異性蛋白酶位點(diǎn)的外顯子序列的構(gòu)建體。在上述每個(gè)構(gòu)建體中,構(gòu)建體上的外顯子緊鄰未配對(duì)的剪接供體位點(diǎn)的上游。構(gòu)建體還可以含有調(diào)控序列、缺少polyA信號(hào)的選擇標(biāo)記、內(nèi)部核糖體進(jìn)入位點(diǎn)(ires)以及未配對(duì)的剪接供體位點(diǎn)(圖4)。任選在ires和未配對(duì)的剪接供體位點(diǎn)之間包括起始密碼子、分泌信號(hào)序列、表位標(biāo)記、和/或蛋白酶切割位點(diǎn)。當(dāng)該構(gòu)建體整合到基因上游時(shí),由于內(nèi)源基因可以提供一個(gè)polyA位點(diǎn),選擇標(biāo)記可以被有效地表達(dá)。此外,下游基因也被表達(dá),因?yàn)閕res使得在下游開放讀框(即內(nèi)源基因)處開始進(jìn)行蛋白質(zhì)翻譯。因此,由該活化構(gòu)建體產(chǎn)生的信息是多順反子的。該構(gòu)建體的優(yōu)點(diǎn)在于整合事件不在基因附近進(jìn)行,并且適當(dāng)取向,不會(huì)產(chǎn)生抗藥性集落。其原因是沒有polyA尾部(內(nèi)源基因所提供的),新霉素抗性基因不能有效地表達(dá)。通過減少無效整合的次數(shù),可以在不影響其覆蓋面(被活化的基因的數(shù)量)的情況下,降低文庫的復(fù)雜程度,這能便利篩選過程。在所述構(gòu)建體的另一個(gè)實(shí)施方案中,可以在調(diào)控序列和neo起始密碼子之間以及ires和未配對(duì)的剪接供體位點(diǎn)之間(在ires和起始密碼子(如果有)之間)包括上crx-lox重組序列。分離出其目的基因已被活化的細(xì)胞后,可以用編碼cre重組酶的質(zhì)粒轉(zhuǎn)染該細(xì)胞,從而除去neo基因和ires。這能消除多順反子信息,使得內(nèi)源基因直接從被整合上來的活化構(gòu)建體上的調(diào)控序列進(jìn)行表達(dá)。利用Cre重組來協(xié)助從哺乳動(dòng)物染色體上缺失遺傳元件已有描述(Gu等,科學(xué)265103(1994);Sauer,酶學(xué)方法225890-900(1993))。因此,可用于本文描述的方法的構(gòu)建體包括,但不限于,下列構(gòu)建體(見圖1-4)1)具有調(diào)控序列和缺少翻譯起始密碼子的外顯子的構(gòu)建體。2)具有調(diào)控序列和缺少翻譯起始密碼子的外顯子,其后是剪接供體位點(diǎn)的構(gòu)建體。3)具有調(diào)控序列和讀碼框1(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。4)具有調(diào)控序列和讀碼框2(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。5)具有調(diào)控序列和讀碼框3(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。6)具有調(diào)控序列以及讀碼框1(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子和分泌信號(hào)序列的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。7)具有調(diào)控序列以及讀碼框2(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子和分泌信號(hào)序列的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。8)具有調(diào)控序列以及讀碼框3(相對(duì)剪接供體位點(diǎn)而言)中含有翻譯起始密碼子和分泌信號(hào)序列的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。9)具有調(diào)控序列以及讀碼框1(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。10)具有調(diào)控序列以及讀碼框2(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。11)具有調(diào)控序列以及讀碼框3(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。12)具有調(diào)控序列以及讀碼框1(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。13)具有調(diào)控序列以及讀碼框2(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。14)具有調(diào)控序列以及讀碼框3(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列和表位標(biāo)記的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。15)具有調(diào)控序列以及讀碼框1(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記和序列特異的蛋白酶位點(diǎn)的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。16)具有調(diào)控序列以及讀碼框2(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記和序列特異的蛋白酶位點(diǎn)的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。17)具有調(diào)控序列以及讀碼框3(相對(duì)剪接供體位點(diǎn)而言)中含有(從5’到3’)翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記和序列特異的蛋白酶位點(diǎn)的外顯子,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。18)具有與選擇標(biāo)記連接在一起的調(diào)控序列,其后是內(nèi)部核糖體進(jìn)入位點(diǎn)和未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。19)構(gòu)建體18,其中cre/lox重組信號(hào)位于a)調(diào)控序列和選擇標(biāo)記的開放讀碼框之間以及b)ires和未配對(duì)剪接供體位點(diǎn)之間。20)具有調(diào)控序列,該序列與含有缺少終止密碼子的綠色熒光蛋白的外顯子可操縱地連接在一起,其后是未配對(duì)剪接供體位點(diǎn)的構(gòu)建體。但是應(yīng)當(dāng)明白,任何用于文中所述方法的載體可以包括一或多個(gè)(即,1、2、3、4、5或更多,最優(yōu)選1或2個(gè))擴(kuò)增標(biāo)記。與此相應(yīng),所述方法可以包括一個(gè)擴(kuò)增內(nèi)源基因的步驟。在活化構(gòu)建體上插入一或多個(gè)擴(kuò)增標(biāo)記使得在被活化細(xì)胞中,目的基因與一或多個(gè)擴(kuò)增標(biāo)記并列。一旦分離出被活化細(xì)胞,可以通過挑選這樣一些細(xì)胞進(jìn)一步提供表達(dá),所述細(xì)胞包含帶有目的基因和活化構(gòu)建體的基因座拷貝數(shù)增加。可以通過本領(lǐng)域已知的挑選方染來實(shí)現(xiàn)這一目的,例如在含有1或多種選擇試劑的選擇培養(yǎng)基上培養(yǎng)細(xì)胞,其中所述選擇試劑對(duì)基因構(gòu)建體或載體上含有的1或多個(gè)擴(kuò)增標(biāo)記有特異性。經(jīng)上述任何載體的非同源整合使內(nèi)源基因活化后,可以通過挑選位于整合載體中的拷貝數(shù)增加的擴(kuò)增標(biāo)記來進(jìn)一步提高內(nèi)源基因的表達(dá)。雖然可以用整合載體上的一個(gè)擴(kuò)增標(biāo)記來實(shí)施該方法,但在本發(fā)明的替代實(shí)施方案中,提供了這樣的方法,其中載體可包含2或多個(gè)(即2、3、4、5或更多,最優(yōu)選2個(gè))擴(kuò)增標(biāo)記來協(xié)助更有效地挑選出那些載體和旁側(cè)目的基因均被擴(kuò)增的細(xì)胞。這種方案對(duì)于某些細(xì)胞尤其有用,所述細(xì)胞有載體上所含的一或多個(gè)擴(kuò)增標(biāo)記的一個(gè)功能性內(nèi)源拷貝,因?yàn)檫x擇步驟可以分離出那些不正確地?cái)U(kuò)增了內(nèi)源擴(kuò)增標(biāo)記,而不是載體編碼的擴(kuò)增標(biāo)記的細(xì)胞。該方法也可用于淘汰那些通過不涉及基因擴(kuò)增的機(jī)制對(duì)選擇試劑產(chǎn)生抗性的細(xì)胞。在這些情況下,使用兩或多種擴(kuò)增標(biāo)記的方法是有益的,因?yàn)橐粋€(gè)細(xì)胞在沒有擴(kuò)增整合載體和旁側(cè)目的基因的情況下,對(duì)兩或多種選擇試劑產(chǎn)生抗性的可能性顯著低于細(xì)胞對(duì)任何一種選擇試劑產(chǎn)生抗性的可能性。因此,通過同時(shí)或連續(xù)選擇兩或多個(gè)載體編碼的擴(kuò)增標(biāo)記,將有更大百分比的最后分離到的細(xì)胞含有被擴(kuò)增的載體和目的基因。因此,在另一個(gè)實(shí)施方案中,本發(fā)明的載體可以含有兩或多種(即2,3,4,5,或更多,最優(yōu)選2種)擴(kuò)增標(biāo)記,該方法能夠在活化表達(dá)后更有效地?cái)U(kuò)增載體序列和鄰近的目的基因。可以用于構(gòu)建所述載體的擴(kuò)增標(biāo)記的例子包括,但不限于二氫葉酸還原酶、腺苷脫氨酶、天冬氨酸轉(zhuǎn)氨甲酰酶、二氫乳清酸酶以及氨甲酰磷酸合成酶。還應(yīng)當(dāng)明白,本文所述的任何構(gòu)建體可以含有真核生物病毒的復(fù)制起點(diǎn)替代擴(kuò)增標(biāo)記或與其相連。病毒復(fù)制起點(diǎn)的存在使得整合載體和相鄰的內(nèi)源基因作為游離體分離和/或在導(dǎo)入適當(dāng)?shù)牟《緩?fù)制蛋白質(zhì)的情況下,擴(kuò)增到高拷貝數(shù)。有用的病毒起點(diǎn)的例子包括,但不限于SV40ori和EBVoriP。本發(fā)明還包括一些實(shí)施方案,其中本文公開的構(gòu)建體本質(zhì)上含有以上具體描述的用于這些構(gòu)建體的成分。還應(yīng)當(dāng)明白,上述構(gòu)建體是可以用于本文所述方法的構(gòu)建體的例子,而本發(fā)明包括這些構(gòu)建體的功能等同物。術(shù)語“載體”應(yīng)理解為一般性地指將核苷酸序列導(dǎo)入細(xì)胞中的運(yùn)載物。它并不試圖限定到任何具體序列。載體本身可以是活化內(nèi)源基因的核苷酸序列或者可以含有活化內(nèi)源基因的序列。因此,載體可以僅是一個(gè)本質(zhì)上只含有活化所需的序列的線形成環(huán)形多核苷酸,或者可以是存在于較大多核苷酸中的這些序列或者其它構(gòu)建體,比如一個(gè)DNA或RNA病毒基因組、完整的毒粒或其它用來將關(guān)鍵核苷酸或其它序列導(dǎo)入細(xì)胞中的生物構(gòu)建體。載體可以含有天然存在的或者是通過基因工程或合成法制得的DNA序列。當(dāng)構(gòu)建體非同源整合到細(xì)胞基因組中時(shí),其能夠活化內(nèi)源基因的表達(dá)。內(nèi)源基因的表達(dá)可能產(chǎn)生全長蛋白質(zhì),或產(chǎn)生內(nèi)源蛋白質(zhì)的截短的生物活性形態(tài),這取決于整合位點(diǎn)(如在上游區(qū)域還是內(nèi)含子2)。被活化的基因可以是已知基因(例如,已被克隆或鑒定的)或未知基因(未被克隆或鑒定的),基因的功能可以是已知或未知的?;钚砸阎牡鞍踪|(zhì)的例子包括,但不限于,細(xì)胞因子、生長因子、神經(jīng)遞質(zhì)、酶、結(jié)構(gòu)蛋白質(zhì)、細(xì)胞表面受體,胞內(nèi)受體、激素、抗體以及轉(zhuǎn)錄因子??梢杂帽痉椒ㄖ苽涞囊阎鞍踪|(zhì)的具體例子包括,但不限于,紅細(xì)胞生成素、胰島素、生長激素、葡糖腦苷脂酶,組織纖溶酶原活化物、粒細(xì)胞集落刺激因子(G-CSF)、粒細(xì)胞/巨噬細(xì)胞集落刺激因子(GM-CSF)、干擾素α、干擾素β、干擾素δ,白介素-2、白介素-3、白介素-4、白介素-6、白介素-8、白介素-10、白介素-11、白介素-12、白介素-13、白介素-14、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生長因子-2、骨骼生長因子-7,腫瘤壞死因子、α-Ⅰ抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬細(xì)胞集落刺激因子(M-CSF)、干細(xì)胞因子、促卵泡激素β、尿激酶、神經(jīng)生長因子、類胰島素生長因子、促胰島素、甲狀旁腺激素、乳鐵蛋白、補(bǔ)體抑制因子、血小板衍生生長因子,角質(zhì)細(xì)胞生長因子、肝細(xì)胞生長因子、內(nèi)皮細(xì)胞生長因子、神經(jīng)營養(yǎng)蛋白-3、血小板生成素、絨膜促性腺激素、凝血調(diào)節(jié)蛋白、α糖苷、表皮生長因子以及成纖維細(xì)胞生長因子。本發(fā)明還能活化許多表達(dá)跨膜蛋白質(zhì)的基因,并制備和分離這些蛋白質(zhì),它們包括但不限于生長因子的細(xì)胞表面受體、激素、神經(jīng)遞質(zhì)和細(xì)胞因子如上面描述的那些、跨膜離子通道、膽固醇受體、脂蛋白(包括LDL和HDL)和其它類脂部分的受體、整合蛋白和其它胞外基質(zhì)受體、細(xì)胞骨架錨蛋白、免疫球蛋白受體、CD抗原(包括CD2、CD3、CD4、CD8和CD34抗原),以及其它本領(lǐng)域已知的細(xì)胞表面跨膜的結(jié)構(gòu)和功能蛋白質(zhì)。正如本領(lǐng)域普遍技術(shù)人員能想到的,通過本發(fā)明的方法還可以制備其它本領(lǐng)域已知的其它細(xì)胞蛋白質(zhì)和受體。本文所述方法的一個(gè)優(yōu)點(diǎn)是它實(shí)際上能活化任何基因。但是,由于基因有不同的基因組結(jié)構(gòu),包括不同的內(nèi)含子/外顯子界線和起始密碼的位置,為了在一群細(xì)胞中活化最大數(shù)量的不同基因,要提供許多活化構(gòu)建體??梢詫⑦@些構(gòu)建體分別轉(zhuǎn)染到細(xì)胞中制備文庫,每個(gè)文庫含有的細(xì)胞帶有獨(dú)特的一組活化基因。某些基因被幾種不同的活化構(gòu)建體活化。另外,可以活化基因的某些部分來產(chǎn)生截短的、生物活性蛋白質(zhì)。截短的蛋白質(zhì)可以這樣制備,例如將活化構(gòu)建體整合到內(nèi)源基因中部的內(nèi)含子或外顯子中,而不是整合到第二個(gè)外顯子的上游。使用不同構(gòu)建體還可以使活化了的基因被修飾從而使其含有新的序列。例如,可以在活化構(gòu)建體上包含分泌信號(hào)序列來促進(jìn)活化基因的分泌。在某些情況中,根據(jù)內(nèi)含子/外顯子結(jié)構(gòu)和目的基因的情況,分泌信號(hào)序列可以取代內(nèi)源基因的全部或部分信號(hào)序列,在另外一些情況中,信號(hào)序列能使通常位于胞內(nèi)的蛋白質(zhì)分泌出去。載體上的調(diào)控序列可以是組成型啟動(dòng)子??蛇x擇地,啟動(dòng)子可以是誘導(dǎo)型的,使用誘導(dǎo)型啟動(dòng)子能使細(xì)胞在常規(guī)培養(yǎng)和擴(kuò)展過程中只產(chǎn)生低基底水平的活化蛋白質(zhì)。然后例如在制備或篩選過程中,細(xì)胞可以被誘導(dǎo)以產(chǎn)生大量所需蛋白質(zhì)。誘導(dǎo)型啟動(dòng)子的例子包括,但不限于,四環(huán)素誘導(dǎo)型啟動(dòng)子和金屬硫蛋白啟動(dòng)子。在本發(fā)明的優(yōu)選實(shí)施方案中,載體上的調(diào)控序列可以是組織特異性啟動(dòng)子或增強(qiáng)子。載體上的調(diào)控序列可以分離自細(xì)胞或病毒基因組。細(xì)胞調(diào)控序列的例子包括,但不限于,來自肌動(dòng)蛋白基因、金屬硫蛋白Ⅰ基因、免疫球蛋白基因、酪蛋白Ⅰ基因、血清白蛋白基因、膠原蛋白基因、球蛋白基因、層粘連蛋白基因、血影蛋白基因、錨蛋白基因、Na/KATP酶基因和微管蛋白基因的調(diào)控元件。病毒調(diào)控序列的例子包括,但不限于,來自巨細(xì)胞病毒(CMV)立即早期基因、腺病毒晚期基因、SV40基因、逆轉(zhuǎn)錄病毒LTRs和皰疹病毒基因的調(diào)控元件。通常,調(diào)控序列含有轉(zhuǎn)錄因子(比如NF-kB、SP-1、TATA結(jié)合蛋白、AP-1、和CAAT結(jié)合蛋白)的結(jié)合位點(diǎn)。從功能上說,調(diào)控序列是由其啟動(dòng)、增強(qiáng)或者改變內(nèi)源基因轉(zhuǎn)錄的能力所定義的。在優(yōu)選實(shí)施方案中,調(diào)控序列是病毒啟動(dòng)子。在極優(yōu)選的實(shí)施方案中,啟動(dòng)子是CMV立即早期基因啟動(dòng)子。在替代實(shí)施方案中,增強(qiáng)子是細(xì)胞非病毒啟動(dòng)子。在優(yōu)選實(shí)施方案中,調(diào)控元件含有一個(gè)增強(qiáng)子。在極優(yōu)選的實(shí)施方案中,增強(qiáng)子是CMV立即早期基因增強(qiáng)子。在替代實(shí)施方案中,調(diào)控元件是細(xì)胞、非病毒增強(qiáng)子。轉(zhuǎn)錄調(diào)控序列可以由支架結(jié)構(gòu)結(jié)合區(qū)或基質(zhì)結(jié)合位點(diǎn)、負(fù)調(diào)控元件以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)組成。調(diào)控序列還可以包括基因座控制區(qū)。本發(fā)明包括逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列,例如長末端重復(fù)的使用。但是當(dāng)用這些序列時(shí),它們不必與任何逆轉(zhuǎn)錄病毒序列相連,后者能極大地影響轉(zhuǎn)錄調(diào)控序列作為待活化的內(nèi)源基因(即轉(zhuǎn)錄調(diào)控序列將要與之重組以便活化的細(xì)胞基因)的轉(zhuǎn)錄啟動(dòng)子或增強(qiáng)子的功能。構(gòu)建體可以含有一個(gè)不與載體上的外顯子序列可操縱地連接在一起的調(diào)控序列。例如,當(dāng)調(diào)控元件是一個(gè)增強(qiáng)子,它可以在內(nèi)源基因附近(例如,上游、下游、或在內(nèi)含子內(nèi)部)進(jìn)行整合并刺激該基因從其內(nèi)源啟動(dòng)子處開始表達(dá)。通過這個(gè)活化機(jī)制,在被活化基因的轉(zhuǎn)錄產(chǎn)物中不存在來自載體的外顯子序列??蛇x擇地,調(diào)控元件可以與外顯子可操縱地連接在一起,該外顯子可以是天然產(chǎn)生的序列或者可以是非天然產(chǎn)生的(例如合成制備的)序列。為了活化在其第一個(gè)外顯子中缺少起始密碼子的內(nèi)源基因(例如,促卵泡激素β),優(yōu)選將載體上的外顯子的起始密碼子缺失。為了活化其第一個(gè)外顯子中含有起始密碼子的內(nèi)源基因(例如,紅細(xì)胞生成素和生長激素),優(yōu)選載體上的外顯子含有起始密碼子,通常是ATG,優(yōu)選是一個(gè)高效翻譯起始位點(diǎn)(kozak,分子生物學(xué)雜志196947(1987))。外顯子可以含有跟在起始密碼子后面的附加密碼子。這些密碼子可以來源于天然產(chǎn)生的基因或者是非天然產(chǎn)生的(例如,合成的)。密碼子可以與待活化內(nèi)源基因的第一個(gè)外顯子中的密碼子相同??蛇x擇地,密碼子可與內(nèi)源基因的第一個(gè)外顯子中的密碼子不同。例如,所述密碼子可以編碼一個(gè)表位標(biāo)記、分泌信號(hào)序列、跨膜結(jié)構(gòu)域、選擇標(biāo)記或篩選標(biāo)記。任選,緊鄰?fù)怙@子序列3’端有一個(gè)未配對(duì)的剪接供體位點(diǎn)。當(dāng)待活化的基因的結(jié)構(gòu)已知時(shí),應(yīng)將剪接供體位點(diǎn)放在緊鄰載體外顯子的位置,這樣在剪接之后,載體中的密碼子將與內(nèi)源基因的第二個(gè)外顯子的密碼子讀框一致。當(dāng)待活化的內(nèi)源基因的結(jié)構(gòu)未知時(shí),使用分別含有不同讀碼框的構(gòu)建體??刹倏v地連接被定義為一個(gè)允許通過指定序列進(jìn)行轉(zhuǎn)錄的構(gòu)型。例如,與外顯子序列可操縱地連接的調(diào)控序列表明該外顯子序列被轉(zhuǎn)錄。載體上存在起始密碼子時(shí),可操縱地連接還表明載體外顯子的開放讀碼框與內(nèi)源基因的開放讀碼框是讀框一致的。在非同源整合之后,載體上的調(diào)控序列(例如,啟動(dòng)子)變成與內(nèi)源基因可操縱地連接在一起,并在一個(gè)通常稱為CAP位點(diǎn)的位點(diǎn)上協(xié)助轉(zhuǎn)錄起始。轉(zhuǎn)錄連續(xù)通過載體上的外顯子元件(以及如果有的話,通過起始密碼子、開放讀碼框,和/或未配對(duì)的剪接供體位點(diǎn))和通過內(nèi)源基因。由這個(gè)可操縱連接產(chǎn)生的初級(jí)轉(zhuǎn)錄產(chǎn)物被剪接以產(chǎn)生一個(gè)含有來自載體和內(nèi)源基因兩者的外顯子序列的嵌合轉(zhuǎn)錄產(chǎn)物。翻譯后,該轉(zhuǎn)錄產(chǎn)物能產(chǎn)生一個(gè)內(nèi)源蛋白質(zhì)。外顯子或“外顯子序列”定義為存在于成熟RNA分子中的任何被轉(zhuǎn)錄的序列。載體上的外顯子可以含有非翻譯序列,例如,5’非翻譯區(qū)。可選擇地,或者與非翻譯序列連接在一起,外顯子可以含有編碼序列,比如起始密碼子和開放讀碼框。開放讀碼框可以編碼天然產(chǎn)生的氨基酸序列或非天然產(chǎn)生的氨基酸序列(例如,合成密碼子)。開放讀碼框還可以編碼分泌信號(hào)序列、表位標(biāo)記、外顯子、選擇標(biāo)記、篩選標(biāo)記或者核苷酸,當(dāng)與內(nèi)源基因進(jìn)行剪接時(shí),該核苷酸用于保護(hù)該開放讀碼框。初級(jí)轉(zhuǎn)錄產(chǎn)物的剪接(通過該過程去除內(nèi)含子)由分別位于內(nèi)含子5’和3’端的剪接供體位點(diǎn)和剪接受體位點(diǎn)引導(dǎo)進(jìn)行。剪接供體位點(diǎn)的共有序列是(A/C)AGGURAGU(其中R代表嘌呤核苷酸),1-3位的核苷酸位于外顯子中,核苷酸GURAGU位于內(nèi)含子中。未配對(duì)的剪接供體位點(diǎn)在本文中定義為位于活化構(gòu)建體上的沒有下游剪接受體位點(diǎn)的剪接供體位點(diǎn)。當(dāng)載體通過非同源重組整合到宿主細(xì)胞的基因組中時(shí),未配對(duì)的剪接供體位點(diǎn)與來自內(nèi)源基因的剪接受體位點(diǎn)形成配對(duì)。來自載體的剪接供體位點(diǎn),與來自內(nèi)源基因的剪接受體位點(diǎn)一起,將引導(dǎo)載體剪接受體位點(diǎn)和內(nèi)源剪接受體位點(diǎn)之間的所有序列的切除。這些間插序列的切除去掉了干擾內(nèi)源蛋白質(zhì)翻譯的序列。本文中所用的術(shù)語“上游”和“下游”,意指相對(duì)編碼鏈,分別是5’或3’方向。術(shù)語基因的“上游區(qū)域”定義為基因的第二個(gè)外顯子到達(dá)并包括具有相同編碼鏈的第一個(gè)相鄰基因的最后一個(gè)外顯子的核苷酸序列5’(相對(duì)于編碼鏈)。從功能上來說,上游區(qū)域是內(nèi)源基因第二個(gè)外顯子5’方向的任何位點(diǎn),它能使非同源整合的載體與內(nèi)源基因可操縱地連接在一起。載體構(gòu)建體可以含有選擇標(biāo)記以便協(xié)助鑒定和分離含有進(jìn)行了非同源整合的活化構(gòu)建體的細(xì)胞。選擇標(biāo)記的例子包括編碼下列物質(zhì)的基因新霉素抗性(neo)、次黃嘌呤磷酸核糖轉(zhuǎn)移酶(HPRT)、嘌呤霉素(pac)、二氫乳清酸酶谷氨酰胺合成酶(GS)、組氨酸D(hisD)、氨甲酰磷酸合成酶(CAD)、二氫葉酸還原酶(DHFR)、多抗藥性1(mdr1)、天冬氨酸轉(zhuǎn)氨甲酰酶、黃嘌呤-鳥嘌呤磷酸核糖轉(zhuǎn)移酶(gpt)和腺苷脫氨酶(ada)??蛇x擇地,載體可以含有一個(gè)篩選標(biāo)記,代替選擇標(biāo)記或除選擇標(biāo)記以外。篩選標(biāo)記能使含有載體的細(xì)胞分離出來,而不需給它們施加藥物或其它選擇壓力。篩選標(biāo)記的例子包括編碼細(xì)胞表面蛋白質(zhì)、熒光蛋白和酶的基因。包含載體的細(xì)胞可以通過FACS(熒光激活細(xì)胞分選儀)利用細(xì)胞表面蛋白的熒光標(biāo)記的抗體或者用能被載體編碼的酶轉(zhuǎn)化為熒光產(chǎn)物的底物來分離??蛇x擇地,可以通過由內(nèi)源基因產(chǎn)物提供的性狀進(jìn)行表型選擇來挑選。因此,活化構(gòu)建體可以不含選擇標(biāo)記,而不是由內(nèi)源基因自身提供的“標(biāo)記”。在該實(shí)施方案中,可以基于活化基因賦予的表型來挑選活化細(xì)胞。選擇表型的例子包括細(xì)胞增殖、生長因子獨(dú)立型生長、集落形成、細(xì)胞分化(例如,分化成神經(jīng)細(xì)胞,肌細(xì)胞、上皮細(xì)胞等)、不依賴于貼壁的生長、對(duì)細(xì)胞因子的活化作用(例如,激酶,轉(zhuǎn)錄因子,核酸酶等)、細(xì)胞表面受體/蛋白的表達(dá)、獲得或喪失細(xì)胞-細(xì)胞粘著性、遷移和細(xì)胞活化(例如,休眠或活化的T細(xì)胞)。當(dāng)篩選轉(zhuǎn)染細(xì)胞以得到基因活化產(chǎn)物而不是篩選穩(wěn)定的整合子,可以刪除構(gòu)建體上的選擇標(biāo)記。當(dāng)穩(wěn)定整合效率高時(shí),這一點(diǎn)尤其有用。載體可以含有一或多個(gè)(即1、2、3、4、5或更多,最優(yōu)選1或2個(gè))擴(kuò)增標(biāo)記以便挑選出包含拷貝數(shù)增加的整合載體和相鄰活化內(nèi)源基因的細(xì)胞。擴(kuò)增標(biāo)記的例子包括,但不限于二氫葉酸還原酶(DHFR)、腺苷脫氨酶(ada)、二氫乳清酸酶谷氨酰胺合成酶(GS)和氨甲酰磷酸合成酶(CAD)。載體可以含有用于基因擴(kuò)增的真核生物病毒復(fù)制起點(diǎn)。這些起點(diǎn)可以取代擴(kuò)增標(biāo)記或者與擴(kuò)增標(biāo)記共存。載體還可以含有用于構(gòu)建體在微生物中增殖的遺傳元件。有用的遺傳元件的例子包括微生物的復(fù)制起點(diǎn)和抗生素抗性標(biāo)記。這些載體和文中公開的任何載體,以及本領(lǐng)域普通技術(shù)人員容易想到的變體可以用于上文描述的任何方法從而形成可由這些方法制得的任何組合物。構(gòu)建體非同源整合到細(xì)胞基因組中使來自載體的調(diào)控元件和來自內(nèi)源基因的外顯子之間形成可操縱的連接。在優(yōu)選實(shí)施方案中,利用載體調(diào)控序列的插入來上調(diào)內(nèi)源基因的表達(dá)。上調(diào)基因表達(dá)包括將一個(gè)轉(zhuǎn)錄上的沉默基因轉(zhuǎn)化為轉(zhuǎn)錄上的活化基因。它還包括使那些已具轉(zhuǎn)錄活性的基因,但蛋白質(zhì)產(chǎn)生量低于所需量的基因的基因表達(dá)增強(qiáng)。在其它實(shí)施方案中,可以用其它方法來影響內(nèi)源基因的表達(dá),比如下調(diào)表達(dá)、建立誘導(dǎo)型表型或改變表達(dá)的組織特異性。根據(jù)本發(fā)明,制備基因表達(dá)產(chǎn)物的體外方法可能包括,例如,(a)將本發(fā)明的載體導(dǎo)入細(xì)胞;(b)使載體通過非同源重組整合到細(xì)胞基因組中;(c)由載體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細(xì)胞中的內(nèi)源基因,從而使其過表達(dá);(d)篩選過表達(dá)內(nèi)源基因的細(xì)胞;以及(e)在有利于細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下培養(yǎng)細(xì)胞。本發(fā)明的這種體外方法可能還包含分離表達(dá)產(chǎn)物來制備分離的基因表達(dá)產(chǎn)物。在這種方法中,可以有利地使用任何本領(lǐng)域已知的分離蛋白質(zhì)的方法,包括但不限于層析(例如,HPLC、FPLC、LC、離子交換、親合、體積排阻等)、沉淀(例如,硫酸銨沉淀、免疫沉淀等)、電泳及其它為本領(lǐng)域普通技術(shù)人員所熟知的蛋白質(zhì)分離和純化方法。類似地,體內(nèi)制備基因表達(dá)產(chǎn)物的方法可能包括,例如(a)將本發(fā)明的載體導(dǎo)入細(xì)胞;(b)使載體通過非同源重組整合到細(xì)胞基因組中;(c)由載體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細(xì)胞中的內(nèi)源基因,從而使其過表達(dá);(d)篩選過表達(dá)內(nèi)源基因的細(xì)胞;以及(e)在有利于所述細(xì)胞在真核生物體內(nèi)過表達(dá)內(nèi)源基因的條件下,將分離且克隆的細(xì)胞導(dǎo)入真核生物中。根據(jù)發(fā)明的這個(gè)方面,可以有利地使用任何真核生物,包括真菌(尤其是酵母),植物和動(dòng)物,更優(yōu)選動(dòng)物,還優(yōu)選的是脊椎動(dòng)物,最優(yōu)選哺乳動(dòng)物,尤其是人。在某些相關(guān)實(shí)施方案中,本發(fā)明提供了這樣的方法,它還進(jìn)一步包括在將細(xì)胞導(dǎo)入真核生物之前對(duì)它進(jìn)行分離和克隆。本文中所用的短語在細(xì)胞中或由細(xì)胞在體外“有利于制備表達(dá)產(chǎn)物的條件”,“有利于基因過表達(dá)的條件”以及“有利于基因活化的條件”是指任何和所有適宜的環(huán)境、物理、營養(yǎng)或生化參數(shù),這些參數(shù)能夠允許、協(xié)助或促進(jìn)細(xì)胞在體外產(chǎn)生表達(dá)產(chǎn)物、或者過表達(dá)或活化基因。這類條件當(dāng)然包括使用培養(yǎng)基、保溫、光照、濕度等,其可能是最佳或能夠允許、協(xié)助或促進(jìn)細(xì)胞在體外產(chǎn)生表達(dá)產(chǎn)物、或者使基因過表達(dá)或活化的條件。類似地,本文中所用的的短語在細(xì)胞中或由細(xì)胞在體內(nèi)“有利于制備表達(dá)產(chǎn)物的條件”,“有利于基因過表達(dá)的條件”以及“有利于基因活化的條件”是指是指任何和所有適宜的環(huán)境、物理、營養(yǎng)或生化、行為、遺傳和情感參數(shù),在這些條件下維持含有所述細(xì)胞的動(dòng)物,這些條件能夠允許、協(xié)助或促進(jìn)由真核生物的細(xì)胞體內(nèi)產(chǎn)生表達(dá)產(chǎn)物或者使基因過表達(dá)或活化。利用已描述過的篩選方法和下面例舉的方法,或者其它本領(lǐng)域常規(guī)的測量基因表達(dá)、活化或過表達(dá)的方法,本領(lǐng)域普通技術(shù)人員可以確定給定的一組條件是否有利于體外或體外進(jìn)行基因表達(dá)、活化或過表達(dá)。本發(fā)明還包括由上述任何方法制得的細(xì)胞。本發(fā)明包括含有所述載體構(gòu)建體的細(xì)胞,已整合了載體構(gòu)建體的細(xì)胞以及那些在所導(dǎo)入的轉(zhuǎn)錄調(diào)控序列的驅(qū)動(dòng)下,由內(nèi)源基因過表達(dá)所需基因產(chǎn)物的細(xì)胞。用于本發(fā)明的細(xì)胞可以來源于任何真核物種,可以是初級(jí)、次級(jí)或無限增殖化的細(xì)胞。此外,細(xì)胞可以來源于生物體內(nèi)的任何組織。可用來從中分離和活化細(xì)胞的組織的例子包括,但不限于,肝、腎、脾、骨髓、胸腺、心臟、肌肉、肺、腦、睪丸、卵巢、胰島、腸、骨髓、皮膚、骨、膽囊、前列腺、膀胱、胚胎以及免疫和造血系統(tǒng)。細(xì)胞類型包括成纖維細(xì)胞、上皮細(xì)胞、神經(jīng)細(xì)胞、干細(xì)胞和濾泡細(xì)胞。但是,利用本發(fā)明,可以用任何細(xì)胞或細(xì)胞類型來活化基因表達(dá)??梢栽趤碓从谡婧松锉热缯婢?、植物或動(dòng)物的任何細(xì)胞中實(shí)施所述方法。優(yōu)選實(shí)施方案包括脊椎動(dòng)物,尤其是哺乳動(dòng)物,更特別是人??梢詫?gòu)建體整合到初級(jí)、次級(jí)或無限增殖化的細(xì)胞中。初級(jí)細(xì)胞是分離自脊椎動(dòng)物,并且未被傳代的細(xì)胞。次級(jí)細(xì)胞是已被傳代的初級(jí)細(xì)胞,但未被無限增殖化。無限增殖化的細(xì)胞是可以無限傳代的細(xì)胞系。在優(yōu)選實(shí)施方案中,細(xì)胞是無限增殖化的細(xì)胞系。無限增殖化的細(xì)胞系的例子包括,但不限于,HT1080、HeLa、Jurkat、293細(xì)胞、KB癌、T84結(jié)腸上皮細(xì)胞系、Raji、HepG2或Hep3B肝癌細(xì)胞系、A2058黑素瘤、U937淋巴瘤和WI38成纖維細(xì)胞系、體細(xì)胞雜種及雜交瘤。用于本發(fā)明的細(xì)胞可以來源于任何真核生物物種,包括但不限于哺乳動(dòng)物細(xì)胞(比如大鼠、小鼠、牛、豬、綿羊、山羊和人)、鳥類細(xì)胞、魚類細(xì)胞、兩棲動(dòng)物細(xì)胞、爬行動(dòng)物細(xì)胞、植物細(xì)胞和酵母細(xì)胞。優(yōu)選地,通過活化來自某物種的細(xì)胞中的基因表達(dá)來過表達(dá)特定物種的內(nèi)源基因或基因產(chǎn)物。例如,使用人類細(xì)胞來過表達(dá)內(nèi)源人類蛋白質(zhì)。類似地,要過表達(dá)內(nèi)源牛蛋白質(zhì)(例如牛生長激素),使用牛細(xì)胞。所述細(xì)胞可以來源于真核生物中的任何組織??捎脕韽闹蟹蛛x和活化細(xì)胞的脊椎動(dòng)物組織的例子包括,但不限于,肝、腎、脾、骨髓、胸腺、心臟、肌肉、肺、腦、免疫系統(tǒng)(包括淋巴系統(tǒng))、睪丸、卵巢、胰島、腸、胃、骨髓、皮膚、骨、膽囊、前列腺、膀胱、受精卵、胚胎和造血組織。有用的脊椎動(dòng)物細(xì)胞類型包括,但不限于,成纖維細(xì)胞、上皮細(xì)胞、神經(jīng)細(xì)胞、種系細(xì)胞(即精母細(xì)胞/精子以及卵母細(xì)胞)、干細(xì)胞和濾泡細(xì)胞??捎脕韽闹蟹蛛x和活化細(xì)胞的植物組織包括,但不限于葉組織、子房組織、雄蕊組織、雌蕊組織、根組織、塊莖、配子、種子、胚芽等。但本領(lǐng)域普通技術(shù)人員會(huì)想到,利用本發(fā)明可以用任何真核的細(xì)胞或細(xì)胞類型來活化基因表達(dá)。上述任何方法制備的任何細(xì)胞都可用來篩選所需基因產(chǎn)物的表達(dá),并提供所需量的細(xì)胞內(nèi)過表達(dá)的基因產(chǎn)物??梢詫⒃摷?xì)胞分離和克隆??捎靡栽摲椒ㄖ频玫募?xì)胞來在體外(例如用于蛋白質(zhì)治療)或體內(nèi)(用于細(xì)胞療法)制備蛋白質(zhì)。工業(yè)上的生長和制備條件經(jīng)常與用于分析用途(例如克隆、蛋白質(zhì)或核酸測序、制備抗體、X-射線晶體學(xué)分析、酶學(xué)分析等)的細(xì)胞生長和制備條件不同。用于搖瓶中生長的細(xì)胞放大試驗(yàn)包括提高細(xì)胞可以附著的表面積。因此經(jīng)常加入微載體珠來提高工業(yè)生長用的表面積。旋轉(zhuǎn)器培養(yǎng)中的細(xì)胞放大試驗(yàn)可能涉及體積的較大提高。微載體和旋轉(zhuǎn)器培養(yǎng)可能需要5升或更大體積。根據(jù)目的蛋白質(zhì)的固有效價(jià)(比活),體積低至1-10升。常見的是10-15升。但是,可能會(huì)需要達(dá)到50-100升,體積可能會(huì)高至10,000-15,000升。在某些情況中,可能需要更高體積。還可以在大量T型燒瓶(例如50-100個(gè))中培養(yǎng)細(xì)胞。除了生長條件,工業(yè)規(guī)模上的蛋白質(zhì)純化也與分析用純化相當(dāng)不同。在工業(yè)實(shí)踐中,可以由相當(dāng)于10升(大約104細(xì)胞/ml)細(xì)胞量等同物開始純化蛋白質(zhì)。開始蛋白質(zhì)純化的細(xì)胞量等同物可以達(dá)到10升(高達(dá)106或107細(xì)胞/ml)的細(xì)胞。但本領(lǐng)域普通技術(shù)人員會(huì)想到,更高或更低一些的起始細(xì)胞量等同物也可用于本方法。另一種工業(yè)培養(yǎng)條件,特別在當(dāng)終產(chǎn)物要臨床使用時(shí),是在無血清培養(yǎng)基中培養(yǎng)細(xì)胞,無血清培養(yǎng)基是指不含血清或所含血清沒有達(dá)到細(xì)胞生長所需量的培養(yǎng)基。很顯然,這避免了對(duì)有毒污染物(例如病毒)或其它類型污染物(例如會(huì)使純化過程復(fù)雜的蛋白質(zhì))的不希望的共純化。用于細(xì)胞生長的無血清培養(yǎng)基、這種培養(yǎng)基的工業(yè)來源及在無血清培養(yǎng)基中培養(yǎng)細(xì)胞的方法是本領(lǐng)域普通技術(shù)人員熟知的。由上面描述的方面獲得的單個(gè)細(xì)胞能夠過表達(dá)一個(gè)基因或多個(gè)基因。通過整合一個(gè)構(gòu)建體或在同一細(xì)胞中整合多重構(gòu)建體(即多種類型的構(gòu)建體)可以活化多個(gè)基因。因此,一個(gè)細(xì)胞可以只含一類載體構(gòu)建體或不同類型的構(gòu)建體,每種構(gòu)建體能活化一個(gè)內(nèi)源基因。本發(fā)明還涉及通過下列一或多項(xiàng)步驟來制備上述細(xì)胞的方法導(dǎo)入一或多個(gè)載體構(gòu)建體;使導(dǎo)入的構(gòu)建體通過非同源重組整合到細(xì)胞基因組中;在細(xì)胞內(nèi)過表達(dá)1或多個(gè)內(nèi)源基因;以及分離和克隆所述細(xì)胞。方便起見,當(dāng)討論將多核苷酸導(dǎo)入細(xì)胞中時(shí),本文采用術(shù)語“轉(zhuǎn)染”。但是,應(yīng)當(dāng)明白該術(shù)語的特定用途已被用來泛指將多核苷酸導(dǎo)入細(xì)胞的方法,也用來指用其它本文描述的方法實(shí)現(xiàn)的導(dǎo)入,比如電穿孔,脂質(zhì)體介導(dǎo)的導(dǎo)入,逆轉(zhuǎn)錄病毒介導(dǎo)的導(dǎo)入等(以及依照其自身特定含義的導(dǎo)入方法)可以通過許多本領(lǐng)域已知方法將載體導(dǎo)入細(xì)胞。這些方法包括,但不限于,電穿孔、磷酸鈣沉淀、DEAE右旋糖苷、脂質(zhì)體轉(zhuǎn)染和受體介導(dǎo)的胞吞、1,5-二甲基-1,5-二氮十一亞基聚甲溴化物(polybrene)、粒子轟擊和顯微注射??蛇x擇地,可臺(tái)將載體以病毒顆粒(可復(fù)制感受態(tài)病毒或復(fù)制缺陷型病毒)的形式遞送到細(xì)胞中??捎糜谶f送核苷酸的病毒的例子包括,但不限于,腺病毒、腺病毒相關(guān)病毒、逆轉(zhuǎn)錄病毒、皰疹病毒和痘苗病毒。本領(lǐng)域技術(shù)人員知道的其它適用于將核苷酸分子遞送到細(xì)胞中的病毒可以被等效地用于該方法。轉(zhuǎn)染之后,在一定條件下培養(yǎng)細(xì)胞,該條件是本領(lǐng)域已知的適合載體和宿主細(xì)胞基因組之間進(jìn)行非同源整合的條件??梢赃M(jìn)一步在本領(lǐng)域已知的使被活化內(nèi)源基因進(jìn)行表達(dá)的條件下,培養(yǎng)含有非同源整合的載體的細(xì)胞。可以在一個(gè)DNA構(gòu)建體或各自獨(dú)立的構(gòu)建體上將載體構(gòu)建體導(dǎo)入細(xì)胞,并發(fā)生連環(huán)化。盡管在優(yōu)選實(shí)施方案中,載體構(gòu)建體是雙鏈DNA載體構(gòu)建體,載體構(gòu)建體也包括單鏈DNA、單鏈和雙鏈DNA的結(jié)合形式、單鏈RNA、雙鏈RNA、以及單鏈和雙鏈RNA的結(jié)合形式。因此,例如,載體構(gòu)建體可以是單鏈RNA,其由逆轉(zhuǎn)錄酶將其轉(zhuǎn)化為cDNA,cDNA再被轉(zhuǎn)化為雙鏈DNA,而雙鏈DNA最終與宿主細(xì)胞基因組發(fā)生重組。在優(yōu)選實(shí)施方案中,導(dǎo)入細(xì)胞之前將構(gòu)建體線性化?;罨瘶?gòu)建體的線性化產(chǎn)生游離DNA末端,它能在整合過程中與染色體末端反應(yīng)。一般來說,構(gòu)建體在調(diào)控元件(以及外顯子和剪接供體序列,如果有這些序列)下游被線性化??梢酝ㄟ^,例如在調(diào)控序列下游加入一個(gè)獨(dú)特的限制位點(diǎn)并在轉(zhuǎn)染前用相應(yīng)的限制酶處理構(gòu)建體來促進(jìn)線性化。在構(gòu)建體上的線性化位點(diǎn)和近端最具功能的元件(例如未配對(duì)的剪接供體位點(diǎn))之間插入一個(gè)“間隔區(qū)”序列是有利的,但這一作法不是必須的。有間隔區(qū)序列存在能夠保護(hù)載體上的重要功能元件在轉(zhuǎn)染過程中免受外切核苷酶的降解。所述間隔區(qū)可以由任何不會(huì)改變文中所述載體的基本功能的核苷酸序列構(gòu)成。也可以用環(huán)形構(gòu)建體來活化內(nèi)源基因表達(dá)。本領(lǐng)域已知,環(huán)形質(zhì)粒在轉(zhuǎn)染到細(xì)胞中時(shí)能夠整合到宿主細(xì)胞基因組中。據(jù)推測,轉(zhuǎn)染過程中在環(huán)形質(zhì)粒中發(fā)生DNA斷裂,從而產(chǎn)生能連接到染色體末端的游離DNA末端。構(gòu)建體中的某些斷裂將發(fā)生在不破壞載體的關(guān)鍵功能的位置(例如,斷裂發(fā)生在調(diào)控序列下游),因此可以使構(gòu)建體以能活化內(nèi)源基因的構(gòu)型整合到染色體中。如上所述,可以在構(gòu)建體上插入間隔區(qū)序列(例如,調(diào)控序列下游)。轉(zhuǎn)染過程中,發(fā)生在間隔區(qū)的斷裂將在構(gòu)建體上的某個(gè)位點(diǎn)形成游離末端,該游離末端適合構(gòu)建體整合到宿主細(xì)胞基因組中后活化內(nèi)源基因。本發(fā)明還包括由上述方法制得的細(xì)胞文庫。一個(gè)文庫可以包括得自一次轉(zhuǎn)染實(shí)驗(yàn)的所有克隆或者得自一次轉(zhuǎn)染實(shí)驗(yàn)的一個(gè)亞組的克隆,所述亞組可以過表達(dá)相同的基因或多個(gè)基因,例如,一類基因。轉(zhuǎn)染可以用單個(gè)類型的構(gòu)建體或多個(gè)類型的構(gòu)建體進(jìn)行。可以將得自兩次或多次轉(zhuǎn)染實(shí)驗(yàn)的所有重組細(xì)胞合并,將得自一次轉(zhuǎn)染實(shí)驗(yàn)的1或多個(gè)亞組的細(xì)胞合并或者將得自多次轉(zhuǎn)染實(shí)驗(yàn)的亞組的細(xì)胞合并來構(gòu)成文庫。所得文庫可以表達(dá)相同基因,或多個(gè)基因,例如,一類基因。同樣,在每次轉(zhuǎn)染過程中,可以使用一個(gè)構(gòu)建體或多個(gè)構(gòu)建體。所述文庫可以由相同細(xì)胞類型或不同細(xì)胞類型構(gòu)成。所述文庫可以由一類細(xì)胞組成,該細(xì)胞含有一種類型活化構(gòu)建體,所述構(gòu)建體在自發(fā)DNA斷裂形成的斷裂處或由同時(shí)施加(給相同細(xì)胞)或者分別施加(給各個(gè)細(xì)胞群,然后將細(xì)胞合并在一起構(gòu)成文庫)的輻射、限制酶、和/或DNA斷裂劑導(dǎo)致的斷裂處整合到染色體中。文庫可以由多類細(xì)胞組成,這些細(xì)胞含有一個(gè)或多個(gè)構(gòu)建體,所述構(gòu)建體整合到用輻射、限制酶,和/或DNA斷裂劑一起施加給相同細(xì)胞或者分別(施加給各個(gè)細(xì)胞群,然后將細(xì)胞合并在一起構(gòu)成文庫)處理過的細(xì)胞的基因組中。本發(fā)明還涉及從相同或不同轉(zhuǎn)染實(shí)驗(yàn)中挑選各種細(xì)胞亞組來制備文庫的方法。例如,可以將所有表達(dá)核因子的細(xì)胞(由轉(zhuǎn)染構(gòu)建體20的細(xì)胞中核綠色熒光蛋白的存在來確定)合并以形成含有活化核因子的細(xì)胞文庫。類似地,可以合并表達(dá)膜蛋白或分泌蛋白的細(xì)胞。也可以將細(xì)胞根據(jù)表型分組,例如,生長因子獨(dú)立型生長、生長因子獨(dú)立型增殖、集落形成、細(xì)胞分化(例如分化為神經(jīng)細(xì)胞、肌細(xì)胞、上皮細(xì)胞等)、不依賴于貼壁的生長、活化細(xì)胞因子(例如,激酶、轉(zhuǎn)錄因子、核酸酶等),細(xì)胞-細(xì)胞粘附的獲得或喪失、遷移或細(xì)胞活化(例如休眠或活化T細(xì)胞)。本發(fā)明還涉及利用細(xì)胞文庫來過表達(dá)內(nèi)源基因的方法。篩選文庫用于基因的表達(dá),并挑選出能表達(dá)所需基因產(chǎn)物的細(xì)胞。然后,可以用細(xì)胞來純化基因產(chǎn)物,用作隨后使用??梢泽w外培養(yǎng)細(xì)胞或者使細(xì)胞體內(nèi)表達(dá)基因來使細(xì)胞進(jìn)行表達(dá)。本發(fā)明還涉及利用文庫來鑒定新基因和基因產(chǎn)物的方法。本發(fā)明還涉及通過用能刺激或影響非同源整合方式的試劑處理細(xì)胞來提高基因活化效率的方法。已經(jīng)證實(shí),不同細(xì)胞類型的基因表達(dá)方式、染色質(zhì)結(jié)構(gòu)以及甲基化方式顯著不同。即使來自相同細(xì)胞類型的不同細(xì)胞系也可能有明顯差異。這些差異能夠通過影響DNA斷裂方式和修復(fù)過程而影響非同源整合的方式。例如,染色質(zhì)化的DNA片段(可能與失活基因有關(guān)的性狀)可能對(duì)限制酶和化學(xué)試劑引起的斷裂作用的抗性更高,而對(duì)輻射引起的斷裂作用敏感。此外,可將失活基因甲基化,在這種情況中,被CpG甲基化阻斷的限制酶不能在失活基因附近切割甲基化位點(diǎn),從而更難用甲基化敏感酶來活化該基因。通過用各種DNA斷裂劑在多個(gè)細(xì)胞系中建立活化文庫可以避開這些問題。這樣做,可以產(chǎn)生更完全的整合方式,并能最大可能地活化給定基因。本發(fā)明的方法可包括給含有將要過表達(dá)的內(nèi)源基因的細(xì)胞的DNA中導(dǎo)入雙鏈斷裂。這些方法在載體整合之前或同時(shí)給細(xì)胞內(nèi)的基因組DNA中導(dǎo)入雙鏈斷裂。DNA斷裂的機(jī)制對(duì)基因組中DNA的斷裂方式會(huì)有顯著影響。這樣,用輻射、限制酶、博來霉素或其它斷裂劑可以在不同位置自發(fā)或人為地產(chǎn)生DNA斷裂。為了提高整合效率以及整合位點(diǎn)分布的隨機(jī)性,可以在轉(zhuǎn)染之前或之后用低、中或高劑量輻射處理細(xì)胞。借助人工誘導(dǎo)的雙鏈斷裂,這時(shí)作為DNA修復(fù)過程的一部分,轉(zhuǎn)染DNA可以整合到宿主細(xì)胞染色體中。通常,形成用作整合位點(diǎn)的雙鏈斷裂是限速步驟。因此,通過用輻射(或其它DNA破壞劑)來增加染色體斷裂,在給定轉(zhuǎn)染中能得到更多整合子。此外,由輻射引起的DNA斷裂的機(jī)制與自發(fā)斷裂的機(jī)制不同。當(dāng)高能光子擊中DNA分子時(shí),輻射能直接誘導(dǎo)DNA斷裂??蛇x擇地,輻射可以活化細(xì)胞中的某些化合物,后者接著與DNA鏈反應(yīng)并使其斷裂。而另一方面,自發(fā)斷裂被認(rèn)為是由細(xì)胞內(nèi)產(chǎn)生的反應(yīng)性化合物(比如超氧化物和過氧化物)和DNA分子之間的相互作用導(dǎo)致的。但是細(xì)胞內(nèi)的DNA不是以裸露、去蛋白化的聚合物的形式存在,而是與染色質(zhì)結(jié)合,并以凝聚狀態(tài)存在。因此在細(xì)胞內(nèi)導(dǎo)致雙鏈斷裂的試劑無法接近某些區(qū)域。輻射產(chǎn)生的光子波長具有擊中DNA的高度凝聚區(qū)的足夠短的波長,從而誘發(fā)那些不能發(fā)生自發(fā)斷裂的DNA區(qū)域的斷裂。因此,輻射能產(chǎn)生不同的DNA斷裂方式,后者接下去導(dǎo)致不同的整合方式。這樣,利用經(jīng)過/未經(jīng)過輻射處理的細(xì)胞中的相同活化構(gòu)建體制得的文庫可能含有不同活化基因組。最后,輻射處理能將非同源整合效率提高5-10倍,這使得能用較少細(xì)胞產(chǎn)生完整的文庫。因此,輻射處理能提高基因活化效率并在轉(zhuǎn)染細(xì)胞中形成新的整合和活化方式。有用的輻射類型包括α、β、γ、x-射線,以及紫外照射。適用的輻射劑量隨細(xì)胞類型而不同,但通常來說,導(dǎo)致0.1%到99%細(xì)胞存活的劑量范圍是有用的。對(duì)于HT1080細(xì)胞,這相當(dāng)于大約0.1rads到1000rads的137Cs源的輻射劑量。也可以使用其它劑量,只要該劑量能夠提高整合頻率或者改變整合位點(diǎn)的形式。除了輻射,也可以用限制酶來人工誘導(dǎo)轉(zhuǎn)染細(xì)胞內(nèi)的染色體斷裂。與輻射一樣,DNA限制酶能夠形成染色體斷裂,后者隨之作為轉(zhuǎn)染DNA的整合位點(diǎn)。該大量的DNA斷裂使得活化構(gòu)建體的整體整合效率提高。另外,由限制酶導(dǎo)致的斷裂機(jī)制與輻射斷裂不同,染色體斷裂的方式也很可能不同。較之光子和能破壞DNA的小代謝物,限制酶是相對(duì)大的分子。因此,限制酶傾向于將比整個(gè)基因組的緊密程度小的區(qū)域斷裂。如果目的基因存在于基因組的可接近區(qū)域內(nèi),則用限制酶處理細(xì)胞能提高活化構(gòu)建體整合到目的基因上游的可能性。由于限制酶識(shí)別特異序列,并且由于給定的限制位點(diǎn)不存在于目的基因的上游,可以使用多種限制酶。由于每種酶有不同的特性(例如大小、穩(wěn)定性、切割甲基化位點(diǎn)的能力以及最適反應(yīng)條件),這些特性會(huì)影響到宿主染色體中哪個(gè)位點(diǎn)被切割,因此使用多種限制酶是重要的。每種酶,由于其可切割的限制位點(diǎn)的不同分布,將產(chǎn)生不同的整合方式。因此,在導(dǎo)入活化構(gòu)建體之前、期間或之后,導(dǎo)入限制酶(或能夠表達(dá)限制酶的質(zhì)粒)將導(dǎo)致不同基因組的活化。最后,限制酶誘導(dǎo)的斷裂使整合效率提高5-10倍(Yorifuji等,突變研究243121(1990)),這就使得可以轉(zhuǎn)染較少的細(xì)胞而制備到完整的文庫。這樣,可以用限制酶形成新的整合方式,以便使那些在自發(fā)斷裂或其他人工誘導(dǎo)的斷裂處通過非同源重組產(chǎn)生的文庫中不能被活化的基因活化。還可以用限制酶使活化構(gòu)建體偏性整合到基因組中的預(yù)期位點(diǎn)。例如,已描述過幾種罕見的限制酶,它們能平均每50-1000kb切割真核DNA。如果一個(gè)罕見的限制酶識(shí)別序列恰巧位于目的基因的上游,通過在活化構(gòu)建體進(jìn)行轉(zhuǎn)染的同時(shí)導(dǎo)入該限制酶,可以擇優(yōu)地在目的基因上游形成DNA斷裂。然后,這些斷裂可以作為活化構(gòu)建體的整合位點(diǎn)。能在目的基因內(nèi)部或附近的合適位置進(jìn)行切割并且其識(shí)別位點(diǎn)在基因組的其他位置不多出現(xiàn),或者在所述基因附近過多出現(xiàn)(例如,含有CpG的限制位點(diǎn)),任何這樣的酶都可以。對(duì)于以前未被鑒定的基因,可以使用具有8bp識(shí)別位點(diǎn)的限制酶(例如,NotⅠ、SfiⅠ、PmeⅠ、SwaⅠ、SseⅠ、SfrⅠ、SgrAl、PacⅠ、AscⅠ、SgfⅠ和Sse8387Ⅰ)、識(shí)別含有CpG的位點(diǎn)的酶(例如WagⅠ、Bsi-WⅠ、MluⅠ和BssHⅡ)以及其他罕見的切割酶。以這種方法,可以形成富含特定類型活化基因的“偏性”文庫。就這方面來說,含有CpG二核苷酸的限制酶位點(diǎn)尤其有用,因?yàn)檫@些位點(diǎn)在整個(gè)基因組中含量少,而在許多基因5’端的CpG島(正是用于基因活化的位置)中含量豐富。因此,識(shí)別這些位點(diǎn)的酶能優(yōu)先在基因序列5’端切割??梢酝ㄟ^幾種方法將限制酶導(dǎo)入宿主細(xì)胞。首先,可以通過電穿孔將限制酶導(dǎo)入細(xì)胞(Yorifuji等,突變研究243121(1990);Winegar等,突變研究22549(1989))。通常,導(dǎo)入細(xì)胞的限制酶的量與它在電穿孔介質(zhì)中的濃度成比例。必須通過調(diào)節(jié)電壓、電容和電阻來優(yōu)化每個(gè)細(xì)胞系的脈沖條件。其次,可以由編碼該酶的質(zhì)粒在真核生物調(diào)控元件的控制下瞬時(shí)表達(dá)限制酶??梢酝ㄟ^使用誘導(dǎo)型啟動(dòng)子以及改變誘導(dǎo)的強(qiáng)度來控制所產(chǎn)生的酶的含量。在某些情況中,可能希望限制所產(chǎn)生的限制酶的量(由于其毒性)。在這些情況中,可以利用弱的或突變的啟動(dòng)子、剪接位點(diǎn)、翻譯起始密碼子和polyA尾部來降低所產(chǎn)生的酶量。再次,可以通過能與細(xì)胞膜融合或通透的試劑來導(dǎo)入限制酶。脂質(zhì)體和鏈球菌溶血素O(Pimplikar等,細(xì)胞生物學(xué)雜志1251025(1994))是這類試劑的例子。最后,可以利用機(jī)械穿孔和顯微注射來將核酸酶和其他蛋白質(zhì)導(dǎo)入細(xì)胞。但是,任何能將活性酶遞送到活細(xì)胞中的方法都是適用的。由博萊霉素和其他DNA損傷劑誘導(dǎo)的DNA斷裂也可以產(chǎn)生不同的DNA斷裂方式。因此,任何能在細(xì)胞中產(chǎn)生雙鏈斷裂的試劑或培養(yǎng)條件都可以用來提高非同源重組的效率和/或改變其位點(diǎn)。各類化學(xué)DNA損傷劑的例子包括,但不限于,過氧化物和其他能產(chǎn)生自由基的化合物、烷基化試劑、拓?fù)洚悩?gòu)酶抑制劑、抗腫瘤藥物、酸、取代核苷酸和烯二炔(enediyne)抗生素。特異性化學(xué)DNA損傷劑包括,但不限于,博萊霉素、過氧化氫、氫過氧化枯烯、氫過氧化叔丁基、次氯酸(與苯胺、1-萘胺或1-萘酚反應(yīng))、硝酸、磷酸、阿霉素、9-脫氧阿霉素、去甲基-6-阿霉素、5-亞氨基柔紅霉素、亞德里亞霉素(adriamycin)、4-(9-丫啶氨基)甲磺間茴香胺、新制癌菌素、8-甲氧咖啡因、依托泊甙、橢圓玫瑰樹堿、碘代脫氧尿嘧啶核苷和溴脫氧尿苷。已經(jīng)證明可以通過將細(xì)胞預(yù)先暴露于低劑量DNA斷裂劑,比如輻射或博萊霉素中,來誘導(dǎo)細(xì)胞內(nèi)的DNA修復(fù)機(jī)制。在轉(zhuǎn)染前用這些試劑將細(xì)胞預(yù)處理大約24小時(shí),細(xì)胞在轉(zhuǎn)染后能更有效地修復(fù)DNA斷裂和整合DNA。另外,可以使用較高劑量的輻射或其他DNA斷裂劑,因?yàn)轭A(yù)處理后的LD50(導(dǎo)致50%處理細(xì)胞死亡的劑量)更高。這就使得能以多種劑量產(chǎn)生隨機(jī)活化文庫并在宿主細(xì)胞的染色體中形成分布不同的整合位點(diǎn)。篩選一旦制備了一個(gè)活化文庫(或多個(gè)文庫),就可以用許多檢測方法來篩選。根據(jù)目的蛋白質(zhì)的特性(例如分泌的與胞內(nèi)蛋白)和用于形成文庫的活化構(gòu)建體的性質(zhì),可以使用以下描述的任何或所有檢測方法。也可以使用其他檢測形式。ELISA.可以利用酶聯(lián)免疫吸附檢測法(ELISA)來檢測已活化的蛋白質(zhì)。如果活化的基因產(chǎn)物被分泌出來,在含有結(jié)合的目的蛋白質(zhì)的特異抗體的孔中溫育活化文庫細(xì)胞集的培養(yǎng)物上清液。如果一個(gè)或一群細(xì)胞已經(jīng)活化了目的基因,蛋白質(zhì)將分泌到培養(yǎng)基中。通過篩選文庫克隆集(所述集合可以是1到100,000個(gè)以上文庫成員),可以鑒定到含有目的基因已被活化的細(xì)胞的集合。然后可以通過同胞選擇、有限稀釋或其他本領(lǐng)域已知技術(shù)將目的細(xì)胞從其他文庫成員中純化出來。除了分泌蛋白,還可以使用ELISA來篩選表達(dá)胞內(nèi)或膜結(jié)合蛋白質(zhì)的細(xì)胞。在這些情況下,不是篩選培養(yǎng)物上清液,而是從文庫集合(每個(gè)細(xì)胞在每個(gè)集合中至少出現(xiàn)100-1000次)中取出少量細(xì)胞、裂解、澄清并加入包被抗體的小孔。ELISA斑點(diǎn)檢測將ELISA斑點(diǎn)包被目的蛋白質(zhì)的特異抗體。包被后,用1%BSA/PBS將小孔于37℃封閉1小時(shí)。隨后,將隨機(jī)活化文庫中的100,000到500,000個(gè)細(xì)胞加入每個(gè)孔中(代表全部集合的約10%)。通常,每個(gè)孔加入一個(gè)集合。如果細(xì)胞表達(dá)目的蛋白質(zhì)的頻率是1/10000(即集合包含10000個(gè)單克隆,其中之一表達(dá)目的蛋白質(zhì)),則每孔鋪500000個(gè)細(xì)胞將產(chǎn)生50個(gè)特異細(xì)胞。將細(xì)胞在孔中于37℃無移動(dòng)或無干擾地溫育24到48小時(shí)。溫育結(jié)束時(shí),吸出細(xì)胞并將培養(yǎng)板用PBS/0.05%Tween20洗3次,用PBS/1%BSA洗3次。以適當(dāng)?shù)臐舛葘⒍辜尤肟字校谑覝販赜?小時(shí)或者4℃溫育16小時(shí)??梢詫⑦@些抗體生物素化或者直接用辣根過氧化酶(HRP)標(biāo)記。吸出二抗,用PBS/1%BSA將培養(yǎng)板洗3次。加入標(biāo)記了HRP的三抗或鏈霉抗生物素蛋白,并于室溫溫育1小時(shí)。FACS檢測可以利用熒光激活細(xì)胞分選儀(FACS)以多種方法來篩選隨機(jī)活化文庫。如果目的基因編碼細(xì)胞表面蛋白質(zhì),則可以將熒光標(biāo)記的抗體與來自活化文庫的細(xì)胞一起溫育。如果目的基因編碼分泌蛋白質(zhì),則可以將細(xì)胞生物素化,并與偶聯(lián)到目的蛋白質(zhì)的特異抗體的鏈霉抗生物素蛋白一起溫育(Manz等,美國科學(xué)院學(xué)報(bào)921921(1995))。溫育后,將細(xì)胞放入高濃度明膠中(或其他聚合物,比如瓊脂糖或甲基纖維素)以便限制分泌蛋白質(zhì)的擴(kuò)散。當(dāng)細(xì)胞分泌出蛋白質(zhì)時(shí),它被結(jié)合到細(xì)胞表面上的抗體捕獲。就可以通過熒光標(biāo)記的二抗來檢測是否存在目的蛋白質(zhì)。對(duì)于分泌和膜結(jié)合蛋白質(zhì),都可以隨后根據(jù)其熒光信號(hào)分選細(xì)胞。然后可以分離出熒光細(xì)胞,擴(kuò)增并進(jìn)一步經(jīng)FACS、有限稀釋或其他本領(lǐng)域已知的細(xì)胞純化技術(shù)將其富集。磁珠分離這項(xiàng)技術(shù)的原理與FACS類似。通過將活化文庫與偶聯(lián)抗體的、目的蛋白質(zhì)特異的磁珠一起溫育來檢測膜結(jié)合蛋白質(zhì)和捕獲的分泌蛋白質(zhì)。如果蛋白質(zhì)存在于細(xì)胞表面,磁珠會(huì)與該細(xì)胞結(jié)合。利用一個(gè)磁體,可以將表達(dá)目的蛋白質(zhì)的細(xì)胞從文庫中的其他細(xì)胞中純化出來。然后將細(xì)胞從小珠上釋放、擴(kuò)增、分析并在需要時(shí)進(jìn)一步純化。RT-PCR收集少量細(xì)胞(至少等于集合中各克隆的數(shù)目)并裂解以便純化RNA。分離后,用逆轉(zhuǎn)錄酶將RNA進(jìn)行逆轉(zhuǎn)錄。然后用目的基因的cDNA的特異性引物進(jìn)行PCR??晒┻x擇的是,可以使用跨越活化構(gòu)建體中的合成外顯子和內(nèi)源基因的外顯子的引物。該引物不會(huì)與內(nèi)源表達(dá)的目的基因雜交,也不使其擴(kuò)增。反之,如果活化構(gòu)建體整合到目的基因的上游,并活化了基因表達(dá),則該引物與所述基因的第二個(gè)特異引物一起,依靠剪接到內(nèi)源基因的外顯子上的合成外顯子的存在而使被活化基因發(fā)生擴(kuò)增。因此,可以用這個(gè)方法來檢測那些通常情況下目的基因的表達(dá)低于預(yù)期水平的細(xì)胞內(nèi)的活化基因。表型分組在這個(gè)實(shí)施方案中,可以根據(jù)活化基因賦予的表型來挑選細(xì)胞。可以選擇的表型的例子包括增殖、生長因子獨(dú)立型生長、集落形成、細(xì)胞分化(例如分化成神經(jīng)細(xì)胞、肌細(xì)胞、上皮細(xì)胞等)、不依賴于貼壁的生長、對(duì)細(xì)胞因子的活化作用(例如,激酶,轉(zhuǎn)錄因子,核酸酶等)、獲得或喪失細(xì)胞-細(xì)胞粘著性、遷移和細(xì)胞活化(例如,休眠或活化的T細(xì)胞)。分離顯示一種表型(比如上面描述的)的活化細(xì)胞非常重要,因?yàn)轭A(yù)計(jì)是由整合構(gòu)建體使內(nèi)源基因活化導(dǎo)致了所觀察到的細(xì)胞表型。因此,活化基因可能是重要的治療藥物或者是治療或誘導(dǎo)所觀察到的表型的藥物靶??梢酝ㄟ^瞬時(shí)上調(diào)文庫細(xì)胞中的基因表達(dá)來有效地提高上述每一檢測方法的靈敏度。對(duì)于含有NF-kB位點(diǎn)的啟動(dòng)子(在活化構(gòu)建體上),通過向文庫中加入PMA和腫瘤壞死因子-α可以做到這一點(diǎn)。單獨(dú)加入丁酸鈉或者它與PMA和腫瘤壞死因子-α一起可以進(jìn)一步增強(qiáng)基因表達(dá)。加入這些試劑可以提高目的基因的表達(dá),從而可以利用較低靈敏度的檢測方法來鑒定目的基因已活化的細(xì)胞。由于建立了巨大的活化文庫以便盡可能多地活化許多基因,將文庫克隆組織為集合是有益的。每個(gè)集合可以含有1到100000個(gè)以上單個(gè)克隆。因此,在給定集合中,通常產(chǎn)生稀釋濃度的許多活化蛋白質(zhì)(原因在于集合的整個(gè)尺寸和該集合內(nèi)產(chǎn)生給定活化蛋白質(zhì)的有限數(shù)目的細(xì)胞)。因此,篩選前將蛋白質(zhì)濃縮能有效地提高在篩選方法中檢測活化蛋白質(zhì)的能力。一個(gè)特別有用的濃縮方法是超濾;但是,也可以用其他方法。例如,在結(jié)合所存在的多數(shù)或全部蛋白質(zhì)的條件下,通過吸附到離子交換、疏水、染料、羥基磷灰石、凝集素以及其他合適的樹脂上來非特異或半特異地濃縮蛋白質(zhì)。這樣在篩選前可以將結(jié)合蛋白質(zhì)以小體積移走。有益的做法是使細(xì)胞在無血清培養(yǎng)基中生長以便協(xié)助蛋白質(zhì)的濃縮。在另一個(gè)實(shí)施方案中,活化構(gòu)建體上可以包括的有用序列是表位標(biāo)記。所述表位標(biāo)記可以包含一個(gè)能夠親合純化(例如在免疫親合或螯合基質(zhì)上)活化蛋白質(zhì)的氨基酸序列。因此,通過在活化構(gòu)建體上包括表位標(biāo)記可以純化活化文庫中所有的活化蛋白質(zhì)。通過將活化蛋白質(zhì)從其他細(xì)胞和培養(yǎng)基蛋白質(zhì)中純化出來,可以協(xié)助篩選新的蛋白質(zhì)和酶活性。在某些情況中,可能會(huì)希望在將活化蛋白質(zhì)提純后除去表位標(biāo)記。通過在活化構(gòu)建體上的表位標(biāo)記下游包括一個(gè)蛋白酶識(shí)別序列(例如,因子Ⅱa或腸激酶切割位點(diǎn))可以達(dá)到該目的。將純化的活化蛋白與合適的蛋白酶一起溫育可以從蛋白質(zhì)上釋放出表位標(biāo)記。在那些表位標(biāo)記位于活化構(gòu)建體上的文庫中,可以利用親合純化將所有活化蛋白質(zhì)從所有其他細(xì)胞和培養(yǎng)基蛋白質(zhì)中純化出來。這不僅使活化蛋白質(zhì)得到濃縮,還使其從可能干擾用于篩選文庫的檢測方法的其它活性中純化出來。一旦鑒定到含有過表達(dá)目的基因的細(xì)胞的克隆集合,可以采取措施來分離活化細(xì)胞。利用許多本領(lǐng)域已知的方法可以實(shí)現(xiàn)活化細(xì)胞的分離。細(xì)胞純化方法的例子包括有限稀釋、熒光活化細(xì)胞分選、磁珠分離、同胞選擇和利用克隆環(huán)進(jìn)行的單克隆純化。在本發(fā)明的優(yōu)選實(shí)施方案中,所述方法包括一個(gè)純化表達(dá)產(chǎn)物的步驟。在極其優(yōu)選的實(shí)施方案中,培養(yǎng)表達(dá)內(nèi)源基因產(chǎn)物的細(xì)胞以便產(chǎn)生工業(yè)應(yīng)用上,特別是在診斷和治療以及藥物開發(fā)用途上可行用量的基因產(chǎn)物。任何用于本文所述方法中的載體可以包括一個(gè)擴(kuò)增標(biāo)記。這樣,可以在細(xì)胞內(nèi)使載體和目的DNA(即含有過表達(dá)的基因)得到擴(kuò)增,并進(jìn)一步增強(qiáng)內(nèi)源基因的表達(dá)。與此相應(yīng),所述方法可以包括一個(gè)擴(kuò)增內(nèi)源基因的步驟。一旦已經(jīng)分離了活化細(xì)胞,可以通過使含有目的基因和活化構(gòu)建體的基因座擴(kuò)增來進(jìn)一步提高表達(dá)。通過以下描述的各種方法,單獨(dú)或組合使用可以做到這一點(diǎn)。擴(kuò)增標(biāo)記是能夠挑選到更高拷貝數(shù)的基因。擴(kuò)增標(biāo)記的例子包括二氫葉酸還原酶、腺苷脫氨酶、天冬氨酸轉(zhuǎn)氨甲酰酶、二氫乳清酸酶以及氨甲酰磷酸合成酶。對(duì)于這些例子,可以選擇拷貝數(shù)增加的擴(kuò)增標(biāo)記和旁側(cè)序列(包括目的基因)用作由擴(kuò)增標(biāo)記起作用的藥物或毒性代謝物??傊S著藥物或毒性代謝物濃度升高,含有較少拷貝擴(kuò)增標(biāo)記的細(xì)胞死亡,而含有拷貝增加的標(biāo)記的細(xì)胞存活并形成集落??梢詫⑦@些集落分離、擴(kuò)增并分析目的基因產(chǎn)物的增加水平。在活化構(gòu)建體上插入一個(gè)擴(kuò)增標(biāo)記將導(dǎo)致活化細(xì)胞中的目的基因與擴(kuò)增標(biāo)記并列。在存在增加量選擇劑(通常是藥物或代謝物)的情況下培養(yǎng)細(xì)胞,就可以挑選出含有拷貝數(shù)增加的擴(kuò)增標(biāo)記和目的基因的活化細(xì)胞。例如,可以用氨甲喋呤來選擇二氫葉酸還原酶(DHFR)的擴(kuò)增。當(dāng)在每個(gè)升高藥物濃度下得到抗藥集落時(shí),可以挑選出單個(gè)集落并鑒定擴(kuò)增標(biāo)記和目的基因的拷貝數(shù),并分析目的基因的表達(dá)??梢蕴暨x出活化基因表達(dá)水平最高的單個(gè)克隆用于在更高藥物濃度下的進(jìn)一步擴(kuò)增。在最高藥物濃度下,克隆會(huì)表達(dá)量已經(jīng)大大增加的目的蛋白質(zhì)。擴(kuò)增DHFR時(shí),可以方便地在幾個(gè)不同濃度的氨甲喋呤處鋪上大約1×107細(xì)胞。有用的氨甲喋呤的起始濃度在大約5到100nM之間。但是必須針對(duì)每個(gè)細(xì)胞系和整合位點(diǎn)根據(jù)經(jīng)驗(yàn)確定氨甲喋呤的最佳濃度。在含有氨甲喋呤的培養(yǎng)基中生長之后,從最高濃度氨甲喋呤中挑出集落并分析目的基因表達(dá)的提高。然后將具有最高濃度氨甲喋呤的克隆生長在更高濃度的氨甲喋呤中以便挑選出進(jìn)一步擴(kuò)增的DHFR和目的基因。對(duì)于含有最高程度基因擴(kuò)增的克隆可以使用微摩和毫摩范圍的氨甲喋呤濃度。在活化構(gòu)建體上插入一個(gè)病毒復(fù)制起點(diǎn)(例如,人細(xì)胞中的oriP或SV40以及小鼠細(xì)胞中的多瘤ori)將導(dǎo)致在活化細(xì)胞中目的基因與病毒復(fù)制起點(diǎn)并列。通過以反式導(dǎo)入病毒復(fù)制蛋白可以使起點(diǎn)和旁側(cè)序列擴(kuò)增。例如,使用oriP(Epstein-Barr病毒的復(fù)制起點(diǎn))時(shí),可以瞬時(shí)或穩(wěn)定表達(dá)EBNA-Ⅰ。EBNA-Ⅰ能夠起始從整合的oriP基因座開始復(fù)制。所述復(fù)制可以從起點(diǎn)雙向延伸。當(dāng)產(chǎn)生各個(gè)復(fù)制產(chǎn)物時(shí),它又能起始復(fù)制。結(jié)果,可以得到許多拷貝病毒起點(diǎn)和包括目的基因的旁側(cè)基因組序列。該更高的拷貝數(shù)使細(xì)胞能產(chǎn)生更大量的目的基因。在某個(gè)頻率處,復(fù)制產(chǎn)物會(huì)重新結(jié)合形成含有旁側(cè)基因組序列(包括目的基因)的環(huán)形分子。通過單細(xì)胞克隆以及Hirt提取和Southern印跡分析可以分離出含有攜帶目的基因的環(huán)形分子的細(xì)胞。一旦得到純化,可以將含有拷貝數(shù)增加(通常10-50拷貝)的附加體基因組座位的細(xì)胞在培養(yǎng)基中增殖。為了獲得更高的擴(kuò)增,可以通過在原始構(gòu)建體中的第一個(gè)起點(diǎn)鄰近出包括一個(gè)第二起點(diǎn)來進(jìn)一步增加附加體。例如,可以用T抗原來使oriP/SV40附加體拷貝數(shù)增加到約1000(Heinzel等,病毒雜志623738(1988))。這種拷貝數(shù)的顯著增加能夠明顯地提高蛋白質(zhì)的表達(dá)。本發(fā)明包括體外和體內(nèi)過表達(dá)內(nèi)源基因。因此,可以在體外用細(xì)胞以產(chǎn)生預(yù)期量的基因產(chǎn)物或者可以在體內(nèi)用細(xì)胞以在完整動(dòng)物提供基因產(chǎn)物。本發(fā)明還包括由本文所述方法產(chǎn)生的蛋白質(zhì)。這些蛋白質(zhì)得自已知或未知基因??梢杂盟龇椒ㄖ苽涞囊阎鞍踪|(zhì)的例子包括,但不限于,紅細(xì)胞生成素、胰島素、生長激素、葡糖腦苷脂酶,組織纖溶酶原活化物、粒細(xì)胞集落刺激因子(G-CSF)、粒細(xì)胞/巨噬細(xì)胞集落刺激因子(GM-CSF)、干擾素α、干擾素β、干擾素γ,白介素-2、白介素-6、白介素-11、白介素-12、TGF-β,凝血因子Ⅴ,凝血因子-Ⅶ、凝血因子-Ⅷ、凝血因子-Ⅸ、凝血因子-Ⅹ、TSH-β、骨骼生長因子-2、骨骼生長因子-7,腫瘤壞死因子、α-1抗胰蛋白酶、抗凝血酶Ⅲ,白血病抑制因子、胰高血糖素、蛋白C、蛋白激酶C、巨噬細(xì)胞集落刺激因子(M-CSF)、干細(xì)胞因子、促卵泡激素β、尿激酶、神經(jīng)生長因子、類胰島素生長因子、促胰島素、甲狀旁腺激素、乳鐵蛋白、補(bǔ)體抑制因子、血小板衍生生長因子,角質(zhì)細(xì)胞生長因子、神經(jīng)營養(yǎng)蛋白-3、血小板生成素、絨膜促性腺激素、凝血調(diào)節(jié)蛋白、α糖苷、表皮生長因子、FGF、巨噬細(xì)胞集落刺激因子以及上述每個(gè)蛋白質(zhì)的細(xì)胞表面受體。從活化細(xì)胞中純化蛋白質(zhì)產(chǎn)物時(shí),可以采用任何本領(lǐng)域已知的蛋白質(zhì)純化方法。分離含有活化膜蛋白編碼基因的細(xì)胞從藥物開發(fā)的觀點(diǎn)來看,那些編碼膜相關(guān)蛋白質(zhì)的基因特別令人感興趣??梢杂眠@些基因和它們編碼的蛋白質(zhì)利用組合化學(xué)庫和高產(chǎn)量篩選方法來,例如,開發(fā)小分子藥物。另一方面,可以用這些蛋白質(zhì)或蛋白質(zhì)的可溶形式(例如缺少跨膜區(qū)的截短的蛋白質(zhì))作為人或動(dòng)物的治療活性劑。還可以使用膜蛋白的鑒定利用雙元雜交法或親合捕集技術(shù)來鑒定新配體(例如,細(xì)胞因子、生長因子以及其他效應(yīng)分子)。膜蛋白還可能有許多其他應(yīng)用。目前鑒定編碼完整膜蛋白的基因的手段包括從cDNA文庫中分離所述基因并將其測序。然后利用能鑒定蛋白質(zhì)的跨膜區(qū)的疏水性曲線通過ORF分析來鑒定完整膜蛋白質(zhì)。不幸的是,用這個(gè)方法不能鑒定編碼完整膜蛋白的基因,除非該基因能在用于制備cDNA文庫的細(xì)胞中表達(dá)。另外,許多基因只在很少的細(xì)胞中,在很短的發(fā)育時(shí)期內(nèi),和/或以極低水平表達(dá)。因此,不能用現(xiàn)有的方法來有效地鑒定這些基因。利用本發(fā)明能在不知道基因的序列、結(jié)構(gòu)、功能或表達(dá)方式的情況下活化內(nèi)源基因。利用本發(fā)明公開的方法,可以只在轉(zhuǎn)錄水平下活化基因,或者在轉(zhuǎn)錄和翻譯水平下活化基因。因此,可以在含有已整合載體的細(xì)胞中制備由活化內(nèi)源基因編碼的蛋白質(zhì)。此外,利用本文公開的特異載體,可以將由活化內(nèi)源基因產(chǎn)生的蛋白質(zhì)進(jìn)行修飾以便如包括一個(gè)表位標(biāo)記。其他載體(例如,上面描述的載體12-17)可以編碼一個(gè)跟有表位標(biāo)記的信號(hào)肽。可以用該載體來分離那些已經(jīng)活化完整膜蛋白質(zhì)表達(dá)的細(xì)胞(見以下實(shí)施例5)。還可以用該載體引導(dǎo)通常不分泌的蛋白質(zhì)的分泌。因此,本發(fā)明還涉及鑒定編碼細(xì)胞完整膜蛋白質(zhì)或跨膜蛋白質(zhì)的內(nèi)源基因的方法。本發(fā)明的這些方法可以包括一或多個(gè)步驟。例如,本發(fā)明的一個(gè)這種方法可包括(a)將本發(fā)明的一個(gè)或多個(gè)載體導(dǎo)入細(xì)胞中;(b)使載體通過非同源重組整合到細(xì)胞基因組中;(c)由整合載體構(gòu)建體上所含的轉(zhuǎn)錄調(diào)控序列上調(diào)細(xì)胞中的內(nèi)源基因,使其過表達(dá);(d)篩選過表達(dá)內(nèi)源基因的細(xì)胞;以及(e)鑒定活化基因以便確定它作為編碼細(xì)胞完整膜蛋白質(zhì)的基因的同一性。在相關(guān)實(shí)施方案中,本發(fā)明提供的這類方法還包括在鑒定活化基因之前從細(xì)胞中分離活化基因。為了鑒定編碼完整膜蛋白質(zhì)的基因,整合到細(xì)胞基因組的載體應(yīng)包含一個(gè)與外顯子序列連接在一起的調(diào)控序列,所述外顯子序列含有起始密碼子、信號(hào)序列和表位標(biāo)記,隨后是未配對(duì)的剪接供體位點(diǎn)。當(dāng)內(nèi)源基因發(fā)生整合和活化時(shí),產(chǎn)生含有來自載體的信號(hào)肽和表位標(biāo)記的嵌合蛋白質(zhì),所述載體與由內(nèi)源基因的下游外顯子編碼的蛋白質(zhì)融合在一起。該嵌合蛋白質(zhì),通過載體編碼的信號(hào)肽的存在,被引導(dǎo)到分泌途徑,在此完成蛋白質(zhì)的翻譯并分泌蛋白。但是,如果活化內(nèi)源基因編碼完整膜蛋白質(zhì),并且該基因的跨膜區(qū)由位于載體整合位點(diǎn)3’處的外顯子編碼,則該嵌合蛋白質(zhì)會(huì)到達(dá)細(xì)胞表面,表位標(biāo)記將會(huì)在細(xì)胞表面顯示出來。利用已知的細(xì)胞分離方法(例如流式細(xì)胞計(jì)分選、磁珠細(xì)胞分選、免疫吸附或其他本領(lǐng)域技術(shù)人員熟悉的方法),可用該表位標(biāo)記的抗體從細(xì)胞群中分離出顯示表位標(biāo)記且已活化完整膜蛋白質(zhì)編碼的基因的細(xì)胞。然后用這些細(xì)胞來研究膜蛋白質(zhì)的功能。另一方面,用本領(lǐng)域已知的任何方法來從這些細(xì)胞中分離出活化基因,例如通過與載體編碼的外顯子具有特異性的DNA探針進(jìn)行雜交來對(duì)篩選由這些細(xì)胞制備到的cDNA文庫,或者利用本文描述的遺傳構(gòu)建體。由載體外顯子編碼的表位標(biāo)記可以是一個(gè)能結(jié)合到抗體上的短肽、一個(gè)能結(jié)合到底物(例如多組氨酸/二價(jià)金屬離子載體、麥芽糖結(jié)合蛋白/麥芽糖載體、谷胱苷肽S-轉(zhuǎn)移酶/谷胱苷肽載體)上的短肽或者一個(gè)來自其上存在抗體或配體的完整膜蛋白質(zhì)的胞外區(qū)(缺少跨膜區(qū))。但是,應(yīng)當(dāng)理解,可以根據(jù)本發(fā)明等效地使用本領(lǐng)域技術(shù)人員熟悉的其他類型的表位標(biāo)記。對(duì)本文描述的方法和應(yīng)用的其他合適的改進(jìn)和變化對(duì)本領(lǐng)域技術(shù)人員是顯而易見的,并且可以在不脫離本發(fā)明的范圍或其實(shí)施方案下而進(jìn)行。上面已詳細(xì)描述了本發(fā)明,參照以下實(shí)施例可以更清楚地理解本發(fā)明,這些實(shí)施例在此僅做例證,而非意在限制本發(fā)明。實(shí)施例實(shí)施例1轉(zhuǎn)染細(xì)胞以活化內(nèi)源基因表達(dá)方法構(gòu)建pRIG-1人DHFR由cDNA通過PCR進(jìn)行擴(kuò)增,所述cDNA是由HT1080細(xì)胞使用引物DHFR-F1(5’TCCTTCGAAGCTTGTCATGGTTGGTTCGCTAAACTGCAT3’)(SEQIDNO1)和DHFR-R1(5’AAACTTAAGATCGATTAATCATTCTTCTCATATACTTCAA3’)(SEQIDNO2)通過PCR制備的,并將人DHFR克隆至pTARGETTM(Promega)中的T位點(diǎn)產(chǎn)生pTARGETDHFR。用NheⅠ和XbaⅠ消化PREP9分離RSV啟動(dòng)子,并將其插入pTARGETDHFR的NheⅠ位點(diǎn)產(chǎn)生pTgTRSV+DHFR。將寡核苷酸JH169(5’ATCCACCATGGCTACAGGTGAGTACTCG3’)(SEQIDNO3)和JH170(5’GATCCGAGTACTCACCTGTAGCCATGGTGGATTTAA3’)(SEQIDNO4)退火,并將其插入pTgTRSV+DHFR的Ⅰ-Ppo-Ⅰ和NheⅠ位點(diǎn)以產(chǎn)生pTgTRSV+DHFR+Exl。用引物TetF1(5’GGCGAGATCTAGCGCTATATGCGTTGATGCAAT3’)(SEQIDNO5)和TetF2(5’GGCCAGATCTGCTACCTTAAGAGAGCCGAAACAAGCGCTCATGAGCCCGAA3’)(SEQIDNO6)將相應(yīng)于pBR322的230-508位核苷酸的279bp區(qū)進(jìn)行PCR擴(kuò)增。用BglⅡ消化擴(kuò)增產(chǎn)物,并將其克隆至pTgTRSV+RSV+DHFR+Exl的BamHⅠ位點(diǎn)產(chǎn)生pRIG-1。轉(zhuǎn)染-在HT1080細(xì)胞中形成pRIG-1基因活化文庫為了活化基因表達(dá),從上述構(gòu)建體組中選擇合適的活化構(gòu)建體。然后將所選的活化構(gòu)建體通過本領(lǐng)域任何已知轉(zhuǎn)染方法導(dǎo)入細(xì)胞。轉(zhuǎn)染方法的例子包括電穿孔、脂質(zhì)體轉(zhuǎn)染、磷酸鈣沉淀、DEAE右旋糖和受體介導(dǎo)的胞吞。導(dǎo)入細(xì)胞中之后,使DNA經(jīng)非同源重組整合到宿主細(xì)胞的基因組中。整合可以在自發(fā)染色體斷裂處或人工誘導(dǎo)的染色體斷裂處進(jìn)行。方法用pRIG-1轉(zhuǎn)染人細(xì)胞。使2×109HH1細(xì)胞(HT1080細(xì)胞的HPRT亞克隆)在150mm組織培養(yǎng)板中生長至90%鋪滿。將培養(yǎng)液從細(xì)胞中吸出,作為條件培養(yǎng)液保存(參見下文)。通過將細(xì)胞與胰蛋白酶短暫溫育而使其從培養(yǎng)板上脫落,將其加入培養(yǎng)液/10%胎牛血清中以便中和胰蛋白酶,并在Jouan離心機(jī)中于1000rpm沉淀5分鐘。將細(xì)胞在1XPBS中洗滌、計(jì)數(shù)并如上述重新沉淀。將細(xì)胞沉淀以終濃度2.5×107細(xì)胞/ml重新懸浮在1XPBS(GibcoBRLCat#14200-075)中。然后將細(xì)胞暴露于50rads來自137Cs源的γ照射中。用BamHⅠ將pRIG-1線性化,用酚/氯仿提純,用乙醇沉淀并重懸于PBS中。將純化和線性化的活化構(gòu)建體加入細(xì)胞懸浮液中至終濃度為40μg/ml。然后將DNA/照射過的細(xì)胞混合物混勻,向每個(gè)0.4cm的電穿孔管(Biorad)中移入400μl該混合物。用電穿孔裝置(Biorad)給小管以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細(xì)胞于室溫培養(yǎng)10分鐘,然后移入含有青霉素/鏈霉素(Gibco/BRL)的αMEM/10%FBS中。將細(xì)胞鋪在含有35mlαMEM/10%FBS/penstrep(33%條件培養(yǎng)液/67%新鮮培養(yǎng)液)的培養(yǎng)板上,濃度為大約7×106細(xì)胞/150mm板。于37℃培養(yǎng)24小時(shí)后,將取自60mg/ml儲(chǔ)液的G418(Gibco/BRL)加入到每個(gè)培養(yǎng)板中至終濃度為500μg/ml。經(jīng)4天選擇后,用新鮮的αMEM/10%FBS/penstrep/500μg/mlG418替換培養(yǎng)液。然后再將細(xì)胞保溫7-10天,培養(yǎng)物上清液用于檢測新的蛋白因子的存在或者儲(chǔ)存在-80℃用于后面的分析。藥物抗性克隆可以保存在液氮中用于后面的分析。實(shí)施例2利用電離輻射來提高DNA整合的頻率和隨機(jī)性方法HH1細(xì)胞90%鋪滿時(shí)收集,在1XPBS中洗滌,以7.5×106細(xì)胞/ml的細(xì)胞濃度重懸于1XPBS中。向細(xì)胞中加入15μg線性化的DNA(pRIG-1),并混勻。將400μl加入各電穿孔管(Biorad)中,用電穿孔儀(Biorad)以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細(xì)胞于室溫培養(yǎng)10分鐘,然后移入2.5mlαMEM/10%FBS/1Xpenstrep中。從每次脈沖照射中取300μl細(xì)胞在轉(zhuǎn)染前或者轉(zhuǎn)染后1或4小時(shí)以0、50、500和5000rads照射。照射后,立即將細(xì)胞鋪在含完全培養(yǎng)基的組織培養(yǎng)板上。鋪板24小時(shí)后,向培養(yǎng)物中加入G418至終濃度為500μg/ml。選擇后7天時(shí),將培養(yǎng)基換成含有500μg/mlG418的新鮮完全培養(yǎng)基。選擇后10天時(shí),從培養(yǎng)板中吸出培養(yǎng)基,用考馬斯藍(lán)/90%甲醇/10%乙酸將細(xì)胞集落染色,并計(jì)數(shù)多于50個(gè)細(xì)胞的集落。實(shí)施例3用限制酶在基因組中產(chǎn)生隨機(jī)、半隨機(jī)或?qū)虻臄嗔逊椒℉HI細(xì)胞90%鋪滿時(shí)收集,在1XPBS中洗滌,以7.5×106細(xì)胞/ml的細(xì)胞濃度重懸于1XPBS中。為了檢測整合效率,向每份400μl等分的細(xì)胞中加入15μg線性化的DNA(PGK-βgeo)并混勻。然后向幾份細(xì)胞中加入限制酶XbaⅠ、NotⅠ、HindⅢ、IppoⅠ(10-500單位)以便分離細(xì)胞/DNA混合物。取400μl加入每個(gè)電穿孔管中,用電穿孔儀(Biorad)以250伏、600微法拉、50歐姆輸送脈沖。電脈沖后,將細(xì)胞于室溫培養(yǎng)10分鐘,然后移入2.5mlαMEM/10%FBS/1Xpenstrep中。從每次脈沖照射的2.5ml總細(xì)胞中取300μl細(xì)胞鋪在含完全培養(yǎng)基的組織培養(yǎng)板上。鋪板24小時(shí)后,向培養(yǎng)物中加入G418至終濃度為600μg/ml。選擇后7天時(shí),將培養(yǎng)基換成含有600μg/mlG418的新鮮完全培養(yǎng)基。選擇后10天時(shí),從培養(yǎng)板中吸出培養(yǎng)基,用考馬斯藍(lán)/90%甲醇/10%乙酸將細(xì)胞集落染色,并計(jì)數(shù)多于50個(gè)細(xì)胞的集落。實(shí)施例4通過對(duì)位于整合載體上的兩個(gè)擴(kuò)增標(biāo)記進(jìn)行選擇來進(jìn)行擴(kuò)增載體整合到宿主細(xì)胞基因組后,可以通過同時(shí)或連續(xù)選擇位于整合載體上的1或多個(gè)擴(kuò)增標(biāo)記使遺傳基因座的拷貝數(shù)擴(kuò)增。例如,可以使包含兩個(gè)擴(kuò)增標(biāo)記的載體整合到基因組中,并通過對(duì)位于載體上的這兩個(gè)擴(kuò)增標(biāo)記進(jìn)行選擇來提高給定基因(即位于載體整合位點(diǎn)處的基因)的表達(dá)。這種方法大大方便了分離已經(jīng)擴(kuò)增了正確基因座(即含有整合載體的基因座)的細(xì)胞克隆。一旦載體通過非同源重組整合到基因組中,則可將含有在獨(dú)特位置處整合的載體的細(xì)胞的單個(gè)克隆與其他含有在基因組中其它位置處整合的載體的細(xì)胞分離開。另一種方法是可選擇混合的細(xì)胞群體用于擴(kuò)增。然后在對(duì)第一擴(kuò)增標(biāo)記具有特異性的第一種選擇試劑的存在下培養(yǎng)含有整合載體的細(xì)胞。該試劑挑選出已經(jīng)擴(kuò)增載體和內(nèi)源染色體上的擴(kuò)增標(biāo)記的細(xì)胞。然后,通過在對(duì)第二擴(kuò)增標(biāo)記具有特異性的第二種選擇試劑的存在下培養(yǎng)細(xì)胞選擇這些細(xì)胞用于第二個(gè)選擇標(biāo)記的擴(kuò)增。經(jīng)過該第二個(gè)選擇步驟,載體和旁側(cè)基因組DNA均已擴(kuò)增的細(xì)胞能夠存活,而只擴(kuò)增了內(nèi)源的第一擴(kuò)增標(biāo)記的細(xì)胞或者是具備了非特異性抗性的細(xì)胞不能存活。當(dāng)含有兩個(gè)以上(如3,4,5或更多)的擴(kuò)增標(biāo)記的載體整合到細(xì)胞基因組中時(shí),可以以類似的方式,通過在對(duì)整合載體上所含的其他擴(kuò)增標(biāo)記具有特異性的選擇試劑的存在下對(duì)細(xì)胞進(jìn)行連續(xù)培養(yǎng)來做附加選擇。挑選后,檢測存活細(xì)胞的所需基因的表達(dá)水平,并選出表達(dá)水平最高的細(xì)胞做進(jìn)一步擴(kuò)增。替代的做法是,可以進(jìn)一步培養(yǎng)對(duì)兩種(如果使用了兩個(gè)擴(kuò)增標(biāo)記)或全部(如果使用了兩個(gè)以上擴(kuò)增標(biāo)記)選擇試劑具有抗性的細(xì)胞的集合,而不分離出單個(gè)克隆。然后將這些細(xì)胞擴(kuò)展,并在更高濃度的第一種選擇試劑(通常是高兩倍)的存在下進(jìn)行培養(yǎng)。重復(fù)該過程直至達(dá)到預(yù)期的表達(dá)水平??蛇x擇地,可以同時(shí)針對(duì)兩種(如果使用了兩個(gè)擴(kuò)增標(biāo)記)或全部(如果使用了兩個(gè)以上擴(kuò)增標(biāo)記)擴(kuò)增標(biāo)記來挑選含有整合載體的細(xì)胞。通過將兩種(如果使用了兩個(gè)標(biāo)記)或全部(如果使用了兩個(gè)以上標(biāo)記)選擇試劑加入其中培養(yǎng)了轉(zhuǎn)染細(xì)胞的選擇培養(yǎng)基中來實(shí)現(xiàn)同時(shí)挑選。大多數(shù)存活細(xì)胞已擴(kuò)增了整合載體。然后可以將這些克隆分別篩選來鑒定表達(dá)水平最高的細(xì)胞,或者把它們作為一個(gè)集合來進(jìn)行。給這些細(xì)胞施加更高濃度的各選擇試劑(通常是高兩倍)。然后再檢測存活細(xì)胞的表達(dá)水平。重復(fù)該過程直至達(dá)到預(yù)期表達(dá)水平。利用任何一種選擇策略(即同時(shí)或連續(xù)選擇),通過從沒有細(xì)胞毒性的低濃度到導(dǎo)致多數(shù)細(xì)胞死亡的高濃度滴定選擇試劑來獨(dú)立地確定所述選擇試劑的起始濃度。通常,選擇能形成離散集落(例如,所鋪的每100000個(gè)細(xì)胞形成幾百個(gè)集落)的濃度作為起始濃度。實(shí)施例5分離編碼跨膜蛋白質(zhì)的cDNApRIG8R1-CD2(圖5A-5D;SEQIDNO7)、pRIG8R2-CD2(圖6A-6C;SEQIDNO8)和pRIG8R3-CD2(圖7A-7C;SEQIDNO9)載體含有可操縱地連接到外顯子上的CMV立即早期啟動(dòng)子,其后是一個(gè)未配對(duì)剪接供體位點(diǎn)。載體上的外顯子編碼一個(gè)信號(hào)肽,該信號(hào)肽連接到CD2的胞外結(jié)構(gòu)域(缺少框內(nèi)終止密碼子)。每個(gè)載體在相對(duì)剪接供體位點(diǎn)來說是不同的讀碼框內(nèi)編碼CD2。為了建立活化基因文庫,用50rads137Cs源照射2×107細(xì)胞,并用15μg線性化的pRIG8R1-CD2(SEQIDNO7)進(jìn)行電穿孔。然后分別用pRIG8R2-CD2(SEQIDNO8),再用pRIG8R3-CD2(SEQIDNO9)重復(fù)該過程。轉(zhuǎn)染后,將三組細(xì)胞合并,以每皿5×106細(xì)胞的濃度鋪入150mm培養(yǎng)皿中,來建立文庫#1。轉(zhuǎn)染后24小時(shí),用500μg/mlG418將文庫#1選擇14天。將含有整合至宿主細(xì)胞基因組中的載體的藥物抗性克隆合并、等分并冷凍以便分析。如上所述建立文庫#2,但其中用pRIG8R1-CD2、pRIG8R2-CD2和pRIG8R3-CD2分別轉(zhuǎn)染3×107細(xì)胞、3×107細(xì)胞和1×107細(xì)胞。為了分離含有編碼完整膜蛋白質(zhì)的活化基因的細(xì)胞,培養(yǎng)來自各文庫的3×106細(xì)胞并如下處理.用4ml胰蛋白酶-EDTA將細(xì)胞胰蛋白酶消化。.在細(xì)胞脫落后,添加8mlαMEM/10%FBS中和胰蛋白酶。.用無菌PBS將細(xì)胞洗一次,經(jīng)800g離心7分鐘收集。將細(xì)胞沉淀重懸于2mlαMEM/10%FBS中。1ml用于分選,另1ml重鋪在含有500μg/mlG418的αMEM/10%FBS中,擴(kuò)展并保存。.將用于分選的細(xì)胞用無菌αMEM/10%FBS洗一次,經(jīng)800g離心7分鐘收集。.吸去上清液,將沉淀重新懸浮于1mlαMEM/10%FBS中。取100μl所述細(xì)胞用同種型對(duì)照物染色。.向900μl細(xì)胞中加入200μl抗-CD2FITC(Pharmingen目錄號(hào)#30054X),而向100μl細(xì)胞中加入20μl小鼠IgG1同種型對(duì)照物(Pharmingen目錄號(hào)#33814X)。將上述細(xì)胞在冰上培養(yǎng)20分鐘。.向含有用抗人CD2FITC染色的細(xì)胞的試管中加入5mlPBS/1%FBS。向同種型對(duì)照物中加入900μlPBS/1%FBS。以600g離心6分鐘收集細(xì)胞。.從試管中吸出上清液。將已用同種型對(duì)照物染色的細(xì)胞重懸于500μlαMEM/10%FBS中,將已用抗CD2FITC染色的細(xì)胞重懸于1.5mlαMEM/10%FBS中。.在FACSVantage流式細(xì)胞計(jì)(BectonDickinsonImmunocytometrySystems;MountainView,CA)上通過連續(xù)分選細(xì)胞5次來分選細(xì)胞。在每次分選中,收集所示的細(xì)胞總數(shù)的百分比的代表熒光最強(qiáng)的細(xì)胞(見下文),將其擴(kuò)展,再分選。分選HT1080細(xì)胞作為陰性對(duì)照物。每次分選中分選并收集到以下細(xì)胞群<tablesid="table1"num="001"><table>文庫#1文庫#2文庫#3#1分選收集到500,000個(gè)細(xì)胞(最高10%)收集到100,000個(gè)細(xì)胞(最高10%)收集到40,000個(gè)細(xì)胞(最高10%)#2分選收集到300,000個(gè)細(xì)胞(最高5%)收集到220,000個(gè)細(xì)胞(最高11%)收集到14,000個(gè)細(xì)胞(最高5%)#3分選收集到90,000個(gè)細(xì)胞(最高5%)收集到40,000個(gè)細(xì)胞(最高的10%)收集到120,000個(gè)細(xì)胞(最高10%)#4分選收集到600,000個(gè)細(xì)胞(最高40%)(a)收集到6,000個(gè)細(xì)胞(最高5%)(b)收集到10,000個(gè)細(xì)胞(次高5%)收集到280,000個(gè)細(xì)胞(最高13%)#5分選(a)收集到260,000個(gè)細(xì)胞(最高10%)(b)收集到530,000個(gè)細(xì)胞(次高25%)(a)從#4分選的(a)組中收集到100,000個(gè)細(xì)胞(最高10%)和350,000個(gè)細(xì)胞(次高35%)(b)從#4分選的(b)組中收集到120,000個(gè)細(xì)胞(最高10%)未做</table></tables>將每個(gè)文庫最后一次分選得到的細(xì)胞擴(kuò)展并保存于液氮中。從FACS分選細(xì)胞中分離活化基因一旦經(jīng)如上所述將細(xì)胞進(jìn)行了分選,通過基于PCR的克隆從所述分選細(xì)胞中分離活化內(nèi)源基因。但本領(lǐng)域技術(shù)人員容易想到,可以等效地使用本領(lǐng)域公知的任何克隆基因的方法來從FACS分選的細(xì)胞中分離活化基因。按照以下方案分離基因(1)利用PolyATractSystem1000mRNA分離試劑盒(Promega),從來自文庫#1和#2的3×107CD2+細(xì)胞(如上所述,通過FACS分選5輪)中分離mRNA。(2)分離mRNA后,通過將0.5μl分離的mRNA稀釋到99.5μl水中并測定OD260來確定mRNA的濃度。從CD2+細(xì)胞回收到21μgmRNA。(3)然后如下合成第一鏈cDNA(a)PCR儀維持在4℃,通過連續(xù)添加以下成分制備第一鏈反應(yīng)混合物41微升DEPC處理過的ddH2O4微升10mM各種dNTP8微升0.1MDTT16微升5xMMLV第一鏈緩沖液(Gibco-BRL)5微升(10pmol/μl)共有區(qū)多腺苷酸化位點(diǎn)引物GDR1(SEQIDNO10)1微升RNAsin(Promega)3微升(1.25μg/μl)mRNA備注GDR1,5’TTTTTTTTTTTTCGTCAGCGGCCGCATCNNNNTTTATT3’(SEQIDNO10)是用于由mRNA合成第一鏈cDNA的“基因開發(fā)”引物;該引物被設(shè)計(jì)成能與多腺苷酸化信號(hào)AATAAA和下游的多腺苷酸區(qū)退火。它能給第一鏈導(dǎo)入一個(gè)NotⅠ位點(diǎn)。一旦制備好樣品,即如下進(jìn)行溫育(b)70℃1分鐘(c)維持于42℃,然后向每份樣品中加入2μl400U/μl的SuperScriptⅡ(Gibco-BRL;Rockville,MD),以產(chǎn)生82μl的最終總體積。大約3分鐘后,如下溫育樣品(d)37℃30分鐘(e)94℃2分鐘(f)4℃5分鐘然后向各樣品中加入2μl20U/μl的RNace-IT(Stratagene),將樣品于37℃溫育10分鐘。(4)第一鏈合成后,用PCR洗滌試劑盒(Qiagen)如下純化cDNA(a)將80μl第一鏈反應(yīng)產(chǎn)物轉(zhuǎn)移入1.7ml硅氧烷化的eppendorf管,并加入400μlPB。(b)然后將樣品移入PCR洗滌柱子,于14000RPM離心2分鐘(c)將柱子拆下,傾析出徑流,向沉淀中加入750μlPE,然后將試管于14000RPM離心2分鐘。(d)將柱子拆下,傾析出徑流,將試管于14000RPM離心2分鐘以便干燥樹脂。(e)用50μlEB通過轉(zhuǎn)移柱將cDNA洗脫至新的硅氧烷化的eppendorf管中,然后以14000RPM離心2分鐘。(5)如下合成第二鏈cDNA(a)于室溫,連續(xù)添加以下成分制備第二鏈反應(yīng)混合物ddH2O55μl10xPCR緩沖液10μl50mMMgCl25μl10mMdNTP2μl25pmol/μlRIG.751-Bio*4μl25pmol/μlGD.R2**4μl第一鏈產(chǎn)物20μl*備注RIG.751-Bio,5’生物素-CAGATCACTAGAAGCTTTATTGCGG3’(SEQIDNO11),在由pRIG載體表達(dá)得到的轉(zhuǎn)錄產(chǎn)物的帽子位點(diǎn)處退火。**備注GD.R2,5’TTTTCGTCAGCGGCCGCATC3’(SEQIDNO12)是用于PCR擴(kuò)增cDNA的引物,所述cDNA是使用引物GDR1(SEQIDNO10)制備的。GD.R2是GDR1的亞序列,其帶有到達(dá)polyA信號(hào)序列前的簡并堿基的配對(duì)序列。(b)開始合成第二鏈94℃1分鐘,加入1μlTaq(5U/μl,Gibco-BRL),加入1μlVentDNApol(0.1U/μl,NewEnglandBiolabs),(c)于63℃溫育2分鐘,(d)于72℃溫育3分鐘,(e)將步驟(b)重復(fù)4次,(f)于72℃溫育6分鐘,(g)于4℃溫育(維持),(h)結(jié)束。(6)用STE洗3次制備200μl1mg/ml鏈霉抗生物素蛋白-Paramagnetic顆粒(SA-PMP)。(7)將第二鏈反應(yīng)產(chǎn)物直接加入SA-PMP中,于室溫溫育30分鐘。(8)結(jié)合后,利用磁體收集SA-PMP,并回收徑流物質(zhì)。(9)用500μlSTE將磁珠洗3次。(10)將磁珠重懸于50μlSTE中,用磁體在試管底部收集磁珠。然后小心地將STE上清液吸出。(11)將磁珠重懸于50μlddH2O中,在100℃水浴中放置2分鐘,從PMP上釋放出純化的cDNA。(12)在磁體上收集PMP,并小心地吸出含有cDNA的上清液,從而回收到純化的cDNA。(13)將純化產(chǎn)物移至干凈試管中,于14000RPM離心2分鐘除去所有殘存的PMP。(14)然后如下進(jìn)行PCR反應(yīng)以便特異擴(kuò)增RIG活化cDNA(a)通過于室溫連續(xù)添加以下成分來制備PCR反應(yīng)混合物H2O59μl10xPCR緩沖液10μl50mMMgCl25μl10mMdNTP2μl25pmol/μlRIG.F781*2μl25pmol/μlGD.R22μl第二鏈產(chǎn)物20μl*備注RIG.F781,5’ACTCATAGGCCATAGAGGCCTATCACAGTTAAATTGCTAACGCAG3’(SEQIDNO13),在GD.F1、GD.F3、GD.F5-Bio以及RIG.F751-Bio的下游退火,并引入一個(gè)SfiⅠ位點(diǎn)用于cDNA的5’克隆。該引物用于巢式PCR擴(kuò)增RIGExonl特異第二鏈cDNA。(b)啟動(dòng)熱循環(huán)器94℃3分鐘,加入1μlTaq(5U/μl,Gibco-BRL),加入1μl0.1U/μl的VentDNA聚合酶(NewEnglandBiolabs),將步驟(c)到(e)循環(huán)10次做PCR(c)94℃30秒,(d)60℃40秒,(e)72℃3分鐘。然后進(jìn)行以下步驟完成PCR(f)94℃30秒,(g)60℃40秒,(h)72℃3分鐘,(i)72℃,每個(gè)循環(huán)20秒,共10個(gè)循環(huán),(j)72℃5分鐘,(k)維持于4℃。(15)用50μlEB將文庫材料洗脫后,加入10μlNEB緩沖液2、40μldH2O和2μlSfiⅠ,并于50℃消化1小時(shí)將樣品進(jìn)行消化,以便在由正向引物(RIG.F781;SEQIDNO13)編碼的SfiⅠ位點(diǎn)處切割cDNA的5’端。(16)SfiⅠ消化后,向每份樣品中加入5μl1MNaCl和2μlNotⅠ,于37℃將樣品消化1小時(shí)以便在由第一鏈引物(GD.R1;SEQIDNO10)所編碼的NotⅠ位點(diǎn)處切割cDNA的3’端。(17)然后,在1%低熔點(diǎn)瓊脂糖膠上分離消化過的cDNA。從膠上切下大小為1.2Kb到8Kb范圍的cDNA。(18)用QiaexⅡGelExtraction(Qiagen)從切下的瓊脂糖膠上回收cDNA。在總共10μl的1XT4連接酶緩沖液(NEB)中,用400單位T4DNA連接酶(NEB)將2μlcDNA(大約30mg)與7μl(35ng)pBS-HSB(用SfiⅠ/NotⅠ線性化過的)連接在一起。(19)用得自步驟(18)的0.5μl連接反應(yīng)混合物轉(zhuǎn)化成大腸桿菌DH10B。(20)回收103個(gè)菌落/0.5μl連接的DNA。(21)用引物M13F20和JH182(RIGExonl特異性)經(jīng)PCR在12.5μl體積中如下篩選這些菌落的外顯子(a)將100μlLB(含有選擇抗生素)分裝到適當(dāng)數(shù)量的96孔培養(yǎng)板中(b)挑選出單菌落,接種到96孔培養(yǎng)板的各個(gè)孔中,將培養(yǎng)板在37℃培養(yǎng)廂中不震蕩放置2-3小時(shí)。(c)在冰上如下制備PCR反應(yīng)的“主混物”<tablesid="table2"num="002"><table>96孔培養(yǎng)板12.5μlPCRrxn的全部#1個(gè)板2個(gè)板3個(gè)板4個(gè)板96192288384dH2O755μl1.47ml2.20ml2.94ml5XPCR預(yù)混液-4250μl500μl750μl1.0mlF引物預(yù)混液(25pmol/微升)10μl20μl30μl40μlR引物預(yù)混液(25pmol/微升)10μl20μl30μl40μlRNace-Itcocktail3.2μl6.3μl9.6μl12.8μlTaq聚合酶(5U/μl)3.2μl6.3μl9.6μl12.8μl總體積(ml)1.012.023.034.04</table></tables>(d)將10μl主混合物分裝到PCR反應(yīng)板的每個(gè)孔中(e)從每份100μl大腸桿菌培養(yǎng)物中取2.5μl移入PCR反應(yīng)板上的相應(yīng)孔中(f)采用典型的PCR循環(huán)條件進(jìn)行PCR反應(yīng)(ⅰ)94℃/2分鐘(細(xì)菌裂解和質(zhì)粒變性),(ⅱ)92℃變性15秒;60℃引物退火20秒;72℃引物延伸40秒;做30個(gè)循環(huán),(ⅲ)72℃最終延伸5分鐘,(ⅳ)維持于4℃。(g)向PCR反應(yīng)中加入溴酚藍(lán);將樣品混勻、離心,然后將全部反應(yīng)混合物裝入瓊脂糖凝膠上。(23)在所篩選的200個(gè)克隆中,78%是載體外顯子陽性的。這些克隆中的96個(gè)作為小量制備物,并依照Qiagen小量制備手冊(cè)(1997年4月)用Qiagen96孔turbo-prep純化。(24)將2μlDNA同時(shí)用NotⅠ、BamHⅠ、XhoⅠ、HindⅢ、EcoRⅠ在NEB緩沖液3中(總體積為22μl)進(jìn)行消化,然后在1%瓊脂糖凝膠上電泳來除去許多重復(fù)克隆。結(jié)果用所述方案篩選兩個(gè)不同的cDNA文庫。在第一個(gè)文庫(TMT#1)中,將分離到的活化基因中的8個(gè)測序。在這8個(gè)基因中,4個(gè)基因編碼已知的完整膜蛋白質(zhì),6個(gè)是新基因。在第二個(gè)文庫(TMT#2)中,將11個(gè)分離到的活化基因進(jìn)行測序。11個(gè)基因中,一個(gè)基因編碼已知的完整膜蛋白質(zhì),一個(gè)基因編碼部分測序的與一個(gè)完整膜蛋白同源的基因,9個(gè)是新基因。在分離出的基因?qū)?yīng)已做鑒定的已知基因的所有情況下,該基因是完整膜蛋白質(zhì)。以下顯示分離自每個(gè)文庫的基因的示范性的顯著性比對(duì)(得自GenBank)TMT#1顯著性比對(duì)179761|gb|M76559|HUMCACNLB人神經(jīng)DHP-敏感性電壓依賴性,鈣通道α-2b亞單位mRNA完整CD長度=3600>gi|3183974|emb|Y10183|HSMEMD人MEMD蛋白質(zhì)的mRNA長度=4235TMT#2顯著性比對(duì)>gi|476590|gb|U06715|HSU06715人細(xì)胞色素B561,HCYTOB561,mRNA部分CD長度=2463>gi|2184843|gb|AA459959|AA459959zx66c01.s1soarestotalfetusNb2HF89w人cDNA克隆7964143’類似于gbJ03171干擾素α受體前體(人)長度=431。為了清楚理解的目的,通過闡述和實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述后,本領(lǐng)域技術(shù)人員容易想到,可以在更寬和等效的條件、配方以及其他參數(shù)范圍內(nèi)對(duì)本發(fā)明進(jìn)行改進(jìn)或變化,而不會(huì)影響本發(fā)明的范圍或其任何具體實(shí)施方案,并且所述改進(jìn)或變化包括在所附權(quán)利要求書的范圍內(nèi)。本說明書提及的所有出版物、專利和專利申請(qǐng)用于表明與本發(fā)明相關(guān)的本領(lǐng)域技術(shù)人員的技術(shù)水平,此處相同程度地引入作為參考文獻(xiàn),并視作每篇出版物、專利和專利申請(qǐng)均是具體并單獨(dú)地引入作為參考文獻(xiàn)。權(quán)利要求1.一種本質(zhì)上由與未配對(duì)的剪接供體序列及一或多個(gè)擴(kuò)增標(biāo)記可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。2.一種本質(zhì)上由與翻譯起始密碼子、分泌信號(hào)序列及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。3.一種本質(zhì)上由與翻譯起始密碼子、表位標(biāo)記及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列組成的載體構(gòu)建體。4.一種含有與翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體構(gòu)建體。5.一種含有與翻譯起始密碼子、分泌信號(hào)序列、表位標(biāo)記、序列特異性蛋白酶位點(diǎn)及未配對(duì)的剪接供體位點(diǎn)可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體構(gòu)建體。6.權(quán)利要求2-5任何一項(xiàng)的載體構(gòu)建體,其中所述構(gòu)建體還包含一個(gè)用于產(chǎn)生多順反子信息的內(nèi)部核糖體進(jìn)入位點(diǎn)。7.權(quán)利要求2-5任何一項(xiàng)的載體構(gòu)建體,其中所述構(gòu)建體還包含一或多個(gè)擴(kuò)增標(biāo)記。8.權(quán)利要求6的載體構(gòu)建體,其中所述構(gòu)建體還包含一或多個(gè)擴(kuò)增標(biāo)記。9.權(quán)利要求1-5任何一項(xiàng)的載體構(gòu)建體,其中所述轉(zhuǎn)錄調(diào)控序列是一個(gè)啟動(dòng)子。10.權(quán)利要求9的載體構(gòu)建體,其中所述啟動(dòng)子是一個(gè)病毒啟動(dòng)子。11.權(quán)利要求10的載體構(gòu)建體,其中所述病毒啟動(dòng)子是一個(gè)巨細(xì)胞病毒立即早期啟動(dòng)子。12.權(quán)利要求9的載體構(gòu)建體,其中所述啟動(dòng)子是一個(gè)非病毒啟動(dòng)子。13.權(quán)利要求9的載體構(gòu)建體,其中所述啟動(dòng)子是一個(gè)誘導(dǎo)型啟動(dòng)子。14.權(quán)利要求1-5任何一項(xiàng)的載體構(gòu)建體,其中所述轉(zhuǎn)錄調(diào)控序列是一個(gè)增強(qiáng)子。15.權(quán)利要求14的載體構(gòu)建體,其中所述增強(qiáng)子是一個(gè)病毒增強(qiáng)子。16.權(quán)利要求15的載體構(gòu)建體,其中所述病毒增強(qiáng)子是一個(gè)巨細(xì)胞病毒立即早期增強(qiáng)子。17.權(quán)利要求14的載體構(gòu)建體,其中所述增強(qiáng)子是一個(gè)非病毒增強(qiáng)子。18.含有權(quán)利要求1-5任何一項(xiàng)所述載體構(gòu)建體的細(xì)胞。19.權(quán)利要求18的細(xì)胞,其中所述載體構(gòu)建體已整合到細(xì)胞基因組中。20.權(quán)利要求19的細(xì)胞,其中通過所述載體構(gòu)建體上的所述轉(zhuǎn)錄調(diào)控序列上調(diào)基因,內(nèi)源基因在該細(xì)胞內(nèi)被過表達(dá)。21.權(quán)利要求18的細(xì)胞,其中所述細(xì)胞是一種分離的細(xì)胞。22.一種制備重組細(xì)胞的方法,包括將權(quán)利要求1-5任何一項(xiàng)所述構(gòu)建體導(dǎo)入細(xì)胞中。23.一種在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因的方法,包括(a)將權(quán)利要求1-5任何一項(xiàng)的構(gòu)建體導(dǎo)入細(xì)胞中;(b)使該構(gòu)建體通過非同源重組整合到所述細(xì)胞的基因組中;和(c)使所述內(nèi)源基因在所述細(xì)胞內(nèi)過表達(dá)。24.權(quán)利要求23的方法,其中所述過表達(dá)在體外完成。25.權(quán)利要求23的方法,其中所述過表達(dá)在體內(nèi)完成。26.一種制備內(nèi)源細(xì)胞基因的分離的表達(dá)產(chǎn)物的方法,包括(a)根據(jù)權(quán)利要求23的方法在細(xì)胞內(nèi)過表達(dá)內(nèi)源基因,其中所述所述內(nèi)源基因的表達(dá)產(chǎn)物由所述細(xì)胞產(chǎn)生;以及(b)從所述細(xì)胞分離所述表達(dá)產(chǎn)物。27.一個(gè)包含用權(quán)利要求1-5任一項(xiàng)的構(gòu)建體轉(zhuǎn)化的細(xì)胞集合的細(xì)胞文庫,其中所述構(gòu)建體通過非同源重組整合到所述細(xì)胞的基因組中。28.一種從細(xì)胞文庫中獲得過表達(dá)基因產(chǎn)物的方法,包括篩選權(quán)利要求27的文庫用于所述基因產(chǎn)物的表達(dá),從所述文庫中篩選過表達(dá)所述基因產(chǎn)物的細(xì)胞,并從所述選擇的細(xì)胞中獲得所述基因產(chǎn)物。29.一種制備內(nèi)源細(xì)胞基因的分離的表達(dá)產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞;(b)使所述載體通過非同源重組整合到所述細(xì)胞的基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞;以及(f)分離所述表達(dá)產(chǎn)物。30.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含非逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞。31.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含與分泌信號(hào)序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使內(nèi)源基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞。32.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含與分泌信號(hào)序列可操縱地連接在一起的非逆轉(zhuǎn)錄病毒轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使所述基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞。33.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含與未配對(duì)剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使所述基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞。34.權(quán)利要求30-33任一項(xiàng)的方法,還包括分離所述表達(dá)產(chǎn)物。35.一種在細(xì)胞中體內(nèi)過表達(dá)內(nèi)源細(xì)胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使所述基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞體內(nèi)過表達(dá)所述內(nèi)源基因的條件下,將所述分離和克隆的細(xì)胞導(dǎo)入動(dòng)物中。36.一種體內(nèi)制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含與未配對(duì)剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使所述基因在細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞體內(nèi)過表達(dá)所述內(nèi)源基因的條件下將所述分離和克隆的細(xì)胞導(dǎo)入動(dòng)物中。37.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列和一或多個(gè)擴(kuò)增標(biāo)記的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;(e)在所述載體和所述基因在所述細(xì)胞內(nèi)發(fā)生擴(kuò)增的條件下培養(yǎng)所述細(xì)胞;以及(f)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞。38.權(quán)利要求37的方法,還包括分離所述表達(dá)產(chǎn)物。39.一種在細(xì)胞中體內(nèi)過表達(dá)內(nèi)源細(xì)胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列和一或多個(gè)擴(kuò)增標(biāo)記的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在有利于所述細(xì)胞體內(nèi)過表達(dá)所述內(nèi)源基因的條件下,將所述分離和克隆的細(xì)胞導(dǎo)入動(dòng)物中。40.權(quán)利要求26、28-33、35-37或39任何一項(xiàng)的方法,其中所述轉(zhuǎn)錄調(diào)控序列是一個(gè)啟動(dòng)子。41.權(quán)利要求40的方法,其中所述啟動(dòng)子是病毒啟動(dòng)子。42.權(quán)利要求41的方法,其中所述病毒啟動(dòng)子是一個(gè)巨細(xì)胞病毒立即早期啟動(dòng)子。43.權(quán)利要求40的方法,其中所述啟動(dòng)子是非病毒啟動(dòng)子。44.權(quán)利要求40的方法,其中所述啟動(dòng)子是誘導(dǎo)型的。45.權(quán)利要求26、28-33、35-37或39任何一項(xiàng)的方法,其中所述轉(zhuǎn)錄調(diào)控序列是一個(gè)增強(qiáng)子。46.權(quán)利要求45的方法,其中所述增強(qiáng)子是一個(gè)病毒增強(qiáng)子。47.權(quán)利要求46的方法,其中所述病毒增強(qiáng)子是一個(gè)巨細(xì)胞病毒立即早期增強(qiáng)子。48.權(quán)利要求45的方法,其中所述增強(qiáng)子是一個(gè)非病毒增強(qiáng)子。49.權(quán)利要求26、28-33、35-37或39任何一項(xiàng)的方法,還包括在所述載體發(fā)生整合之前或同時(shí)向所述細(xì)胞基因組DNA中導(dǎo)入雙鏈斷裂片段。50.由權(quán)利要求26、28-33、35-37或39任何一項(xiàng)的方法制備的細(xì)胞。51.權(quán)利要求29-33、35-37或39任何一項(xiàng)的方法,其中所述載體構(gòu)建體是線性的。52.一種在細(xì)胞內(nèi)過表達(dá)內(nèi)源細(xì)胞基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)在無血清培養(yǎng)基中培養(yǎng)所述細(xì)胞。53.一種制備內(nèi)源細(xì)胞基因的表達(dá)產(chǎn)物的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選過表達(dá)所述內(nèi)源基因的所述細(xì)胞;(e)在有利于所述細(xì)胞產(chǎn)生所述內(nèi)源基因的表達(dá)產(chǎn)物的條件下,培養(yǎng)所述細(xì)胞;以及(f)從相當(dāng)于10升104細(xì)胞/ml的細(xì)胞生物量中分離所述表達(dá)產(chǎn)物。54.一種活化基因表達(dá)的方法,包括(a)將載體導(dǎo)入細(xì)胞基因組,其中所述載體包含調(diào)控序列和未配對(duì)的剪接供體位點(diǎn)并且缺少靶序列;以及(b)篩選表達(dá)基因的所述細(xì)胞。55.權(quán)利要求54的方法,還包括分離產(chǎn)生活化蛋白質(zhì)的細(xì)胞。56.一種活化基因表達(dá)的方法,包括(a)將載體通過非同源重組整合到細(xì)胞內(nèi),其中所述載體含有調(diào)控序列和未配對(duì)的剪接供體位點(diǎn);以及(b)篩選表達(dá)基因的非同源重組細(xì)胞,其中所述基因和該基因的上游區(qū)域與載體沒有同源性。57.一種在細(xì)胞內(nèi)原位增強(qiáng)表型已知的基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對(duì)的剪接供體序列的載體;(b)將載體拷貝遞送至大量細(xì)胞;(c)在允許在插入的載體和細(xì)胞基因組之間發(fā)生非同源重組的條件下,培養(yǎng)細(xì)胞,以及(d)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)已被增強(qiáng)的細(xì)胞。58.權(quán)利要求57的方法,其中所述表型由一個(gè)特定蛋白質(zhì)產(chǎn)生,并通過檢測蛋白質(zhì)產(chǎn)量的增加來進(jìn)行分析。59.一種在細(xì)胞內(nèi)原位增強(qiáng)表型已知的基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對(duì)的剪接供體序列的載體;(b)將載體拷貝遞送至大量細(xì)胞;(c)在能提高在載體和細(xì)胞基因組之間發(fā)生非同源重組可能性的條件下培養(yǎng)細(xì)胞,以及(d)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)已被增強(qiáng)的細(xì)胞。60.一種在細(xì)胞內(nèi)原位活化基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對(duì)的剪接供體序列的載體;(b)使載體通過非同源重組整合到至少100000個(gè)細(xì)胞中;以及(c)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)已被活化的細(xì)胞。61.一種其基因組中包含插入的遺傳構(gòu)建體的分離細(xì)胞,所述遺傳構(gòu)建體包含與未配對(duì)的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中所述構(gòu)建體插入基因或基因的上游區(qū)域并活化該基因的表達(dá),并且該基因和基因的上游區(qū)域不含與遺傳構(gòu)建體同源的核苷酸序列。62.權(quán)利要求61的細(xì)胞,其中整合的遺傳構(gòu)建體另外含有一或多個(gè)擴(kuò)增標(biāo)記。63.一種其基因組中包含插入的遺傳構(gòu)建體的分離細(xì)胞,所述遺傳構(gòu)建體包含與未配對(duì)的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中該構(gòu)建體不合與所述基因或基因的上游區(qū)域同源的核苷酸序列。64.一種活化基因表達(dá)的方法,包括(a)構(gòu)建包含轉(zhuǎn)錄調(diào)控序列和未配對(duì)的剪接供體序列的載體;(b)將所述載體導(dǎo)入細(xì)胞中;(c)在允許在插入的載體和細(xì)胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)細(xì)胞;以及(d)通過分析基因表達(dá)來篩選重組細(xì)胞,其中所述基因和基因的上游區(qū)域沒有與載體同源的核苷酸序列。65.一種其基因組包含插入的遺傳構(gòu)建體的分離細(xì)胞,所述構(gòu)建體包含與未配對(duì)的剪接供體序列可操縱地連接在一起的轉(zhuǎn)錄調(diào)控序列,其中該構(gòu)建體通過非同源重組插入基因或基因的上游區(qū)域中并且所述遺傳構(gòu)建體活化該基因的表達(dá)。66.一種增強(qiáng)基因表達(dá)的方法,包括(a)將載體導(dǎo)入細(xì)胞基因組,所述載體含有一個(gè)增強(qiáng)子序列和一或多個(gè)擴(kuò)增標(biāo)記并且缺少靶序列;以及(b)篩選表達(dá)基因的所述細(xì)胞。67.權(quán)利要求66的方法,還包括分離產(chǎn)生活化蛋白質(zhì)的細(xì)胞。68.一種增強(qiáng)基因表達(dá)的方法,包括(a)使載體通過非同源重組整合到細(xì)胞內(nèi),所述載體含有一個(gè)增強(qiáng)子序列;以及(b)篩選表達(dá)基因的非同源重組細(xì)胞,其中增強(qiáng)子是活性的該基因和該基因的上下游與載體沒有同源性。69.一種在細(xì)胞內(nèi)原位增強(qiáng)表型已知的基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含增強(qiáng)子的載體;(b)將載體拷貝遞送至大量細(xì)胞;(c)在允許在載體和細(xì)胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)所述細(xì)胞,以及(d)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)已被增強(qiáng)的所述細(xì)胞。70.權(quán)利要求69的方法,其中所述表型由一個(gè)特定蛋白質(zhì)產(chǎn)生,并通過檢測蛋白質(zhì)產(chǎn)量的增加來進(jìn)行分析。71.一種在細(xì)胞內(nèi)原位增強(qiáng)表型已知的基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,包括以下步驟(a)構(gòu)建包含增強(qiáng)子的載體;(b)將載體拷貝遞送至大量細(xì)胞;(c)在能提高在載體和細(xì)胞基因組之間發(fā)生非同源重組可能性的條件下培養(yǎng)所述細(xì)胞,以及(d)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)已被增強(qiáng)的所述細(xì)胞。72.一種在細(xì)胞內(nèi)原位增強(qiáng)基因表達(dá)的方法,該方法不需利用該基因的任何序列信息,該方法包括以下步驟(a)構(gòu)建包含增強(qiáng)子的載體;(b)使載體通過非同源重組整合到至少100000個(gè)細(xì)胞中;以及(c)通過分析表型來篩選重組細(xì)胞以便鑒定到其中基因表達(dá)被提高的所述細(xì)胞。73.一種其基因組中包含插入的人工遺傳構(gòu)建體的純化細(xì)胞,所述遺傳構(gòu)建體包含能有效增強(qiáng)基因在細(xì)胞系內(nèi)表達(dá)的增強(qiáng)子,所述遺傳構(gòu)建體插入其中增強(qiáng)子是有效的基因或基因的上下游區(qū)域,該基因及其上下游區(qū)域與遺傳構(gòu)建體中的任何序列沒有同源性。74.權(quán)利要求73的細(xì)胞,其中所述整合遺傳構(gòu)建體另外含有一或多個(gè)擴(kuò)增標(biāo)記。75.一種其基因組中包含插入的人工遺傳構(gòu)建體的分離細(xì)胞,所述遺傳構(gòu)建體包含能有效增強(qiáng)基因在細(xì)胞系內(nèi)表達(dá)的增強(qiáng)子,所述遺傳構(gòu)建體與其中增強(qiáng)子是有效的該基因及其上下游區(qū)域的任何序列沒有同源性。76.一種增強(qiáng)基因表達(dá)的方法,包括(a)構(gòu)建包含增強(qiáng)子的載體;(b)將所述載體導(dǎo)入所述細(xì)胞中;(c)在允許在插入的載體和細(xì)胞基因組之間發(fā)生非同源重組的條件下培養(yǎng)所述細(xì)胞;以及(d)通過分析基因表達(dá)來篩選重組細(xì)胞,在其中增強(qiáng)子是有效的所述基因和該基因的上下游區(qū)域與載體沒有同源性。77.一種其基因組中包含插入的遺傳構(gòu)建體的分離細(xì)胞,所述遺傳構(gòu)建體包含在細(xì)胞系中能有效活化內(nèi)源基因在所述細(xì)胞中表達(dá)的增強(qiáng)子,該遺傳構(gòu)建體通過非同源重組插入基因或基因的上下游區(qū)域。78.權(quán)利要求7的載體構(gòu)建體,其中所述載體構(gòu)建體包含1、2、3、4或5個(gè)擴(kuò)增標(biāo)記。79.權(quán)利要求8的載體構(gòu)建體,其中所述載體構(gòu)建體包含1、2、3、4或5個(gè)擴(kuò)增標(biāo)記。80.權(quán)利要求78或79的載體構(gòu)建體,其中所述載體構(gòu)建體包含1個(gè)擴(kuò)增標(biāo)記。81.權(quán)利要求78或79的載體構(gòu)建體,其中所述載體構(gòu)建體包含2個(gè)擴(kuò)增標(biāo)記。82.權(quán)利要求37、39或66任何一項(xiàng)的方法,其中所述載體構(gòu)建體包含1、2、3、4或5個(gè)擴(kuò)增標(biāo)記。83.權(quán)利要求82的方法,其中所述載體構(gòu)建體包含1個(gè)擴(kuò)增標(biāo)記。84.權(quán)利要求82的方法,其中所述載體構(gòu)建體包含2個(gè)擴(kuò)增標(biāo)記。85.權(quán)利要求62或74的細(xì)胞,其中所述整合遺傳構(gòu)建體包含1、2、3、4或5個(gè)擴(kuò)增標(biāo)記。86.權(quán)利要求85的細(xì)胞,其中所述整合遺傳構(gòu)建體包含1個(gè)擴(kuò)增標(biāo)記。87.權(quán)利要求85的細(xì)胞,其中所述整合遺傳構(gòu)建體包含2個(gè)擴(kuò)增標(biāo)記。88.權(quán)利要求26、28-33、35-37、39、52或53任何一項(xiàng)的方法,其中所述內(nèi)源基因編碼跨膜蛋白。89.權(quán)利要求23的方法,其中所述內(nèi)源基因編碼細(xì)胞跨膜蛋白。90.權(quán)利要求54、56、57、59、60、64、66、68、69、71、72或76任何一項(xiàng)的方法,其中所述基因編碼細(xì)胞跨膜蛋白。91.權(quán)利要求35、36或39任何一項(xiàng)的方法,還包括在將所述細(xì)胞導(dǎo)入動(dòng)物之前分離和克隆該細(xì)胞。92.權(quán)利要求35、36或39任何一項(xiàng)的方法,其中所述動(dòng)物是哺乳動(dòng)物。93.權(quán)利要求92的方法,其中所述哺乳動(dòng)物是人。94.一種鑒定編碼細(xì)胞完整膜蛋白的內(nèi)源基因的方法,包括(a)將包含轉(zhuǎn)錄調(diào)控序列的載體導(dǎo)入細(xì)胞中;(b)使所述載體通過非同源重組整合到所述細(xì)胞基因組中;(c)通過所述轉(zhuǎn)錄調(diào)控序列對(duì)內(nèi)源基因的上調(diào),使該基因在所述細(xì)胞內(nèi)過表達(dá);(d)篩選能過表達(dá)所述內(nèi)源基因的所述細(xì)胞;和(e)鑒定所述活化基因以便確定其與編碼細(xì)胞完整膜蛋白的基因的同一性。95.權(quán)利要求94的方法,其中在所述鑒定前從所述細(xì)胞分離所述活化基因。全文摘要本發(fā)明一般性地涉及通過原位重組法來活化基因表達(dá)或?qū)е禄蜻^表達(dá)。本發(fā)明還一般性地涉及使內(nèi)源基因在細(xì)胞中以高于正常細(xì)胞中所見的水平進(jìn)行表達(dá)的方法。在本發(fā)明的一個(gè)實(shí)施方案中,在整合到細(xì)胞中后,通過活化基因表達(dá)的調(diào)控系列的一個(gè)能活化內(nèi)源基因表達(dá)的調(diào)控序列的非同源或非法重組;來活化或提高該內(nèi)源基因的表達(dá)。在另一個(gè)實(shí)施方案中,通過共整合一或多個(gè)擴(kuò)增標(biāo)記并選擇位于整合載體上的拷貝數(shù)增加的該一或多個(gè)擴(kuò)增標(biāo)記,從而進(jìn)一步提高所述內(nèi)源基因的表達(dá)。本發(fā)明還提供了鑒定和表達(dá)那些用目前技術(shù)無法發(fā)現(xiàn)的基因的方法,因?yàn)檎喜恍枰行蛄?。本發(fā)明還提供了分離編碼跨膜蛋白質(zhì)的核酸分子(特別是cDNA分子)的方法,以及分離能表達(dá)這種可能是其異源跨膜蛋白質(zhì)的跨膜蛋白的細(xì)胞的方法。本發(fā)明還涉及分離的基因、基因產(chǎn)物、核酸分子和含有這些基因、基因產(chǎn)物及核酸分子的組合物,所述組合物可用于多種治療和診斷用途。因此,利用本發(fā)明,可以活化和分離內(nèi)源基因,包括那些與人類疾病和發(fā)育相關(guān)的基因,而不需要預(yù)先知道這些基因的序列、結(jié)構(gòu)、功能或表達(dá)特性。文檔編號(hào)C12P21/00GK1280615SQ98811571公開日2001年1月17日申請(qǐng)日期1998年9月25日優(yōu)先權(quán)日1997年9月26日發(fā)明者約翰·J·哈林頓申請(qǐng)人:阿瑟西斯公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
谢通门县| 巴彦淖尔市| 礼泉县| 开平市| 吴旗县| 西宁市| 临沂市| 霸州市| 紫金县| 蒙自县| 博湖县| 丰镇市| 淮南市| 弥渡县| 喀什市| 新乡县| 宁陵县| 天长市| 榆林市| 惠安县| 廊坊市| 庆元县| 苗栗市| 阳山县| 兰州市| 元氏县| 荣昌县| 沈阳市| 施甸县| 长子县| 旬阳县| 石泉县| 姚安县| 六枝特区| 芜湖市| 德安县| 姜堰市| 宜城市| 宿州市| 屯门区| 普定县|