在真核細胞中產生基因嵌合體的方法
【專利摘要】本發(fā)明涉及一種通過體細胞在體內重組產生基因嵌合體的方法,包括:a)在單個步驟過程中(i)用至少一種基因A轉化一細胞,所述基因A與待重組的另一基因序列同源性小于99.5%,所述待重組的另一基因為細胞基因組的一整體部分或存在于遺傳結構的框架中,(ii)將兩個所述基因重組;(iii)在目標基因組的整合位點處產生基因的基因嵌合體,其中所述至少一種基因A在5'末端或3'末端具有單個旁側目標序列,錨定到所述整合位點的5'或3'末端,以及b)選擇包含所述基因嵌合體的克隆,其中所述細胞為敲除了至少一個DNA修復基因的真核株系。本發(fā)明還涉及一種產生大量基因嵌合體和基因組裝體的方法。
【專利說明】在真核細胞中產生基因嵌合體的方法
【技術領域】
[0001] 本發(fā)明涉及通過真核細胞內的部分同源體內重組產生基因嵌合體的方法。
【背景技術】
[0002] 蛋白質設計的一個主要目標是產生具有新性質或改良性質的蛋白質。賦予蛋白質 或酶所需活性的能力在化學和制藥行業(yè)有大量的實際應用。定向蛋白質進化在蛋白質工程 中作為強大的技術平臺出現(xiàn),其通過實驗搜尋變體庫中具有所需性質的克隆。
[0003] 定向蛋白質進化利用自然選擇的力量來使自然界中沒有找到的帶有所需性質的 蛋白質或核酸進化。已有各種技術用于產生蛋白質突變體和變體以及用于選擇所需的 功能。重組DNA技術能夠將單個結構基因或一整個途徑的基因轉移到合適的代理宿主 (surrogate host)中用于快速增殖和/或高水平蛋白質生產。活性或其它性質的累積性改 進通常通過重復突變和篩選來獲得。定向進化主要應用在學術和工業(yè)實驗室中以改進蛋白 質的穩(wěn)定性和增強活性或增強酶和生物體的整體性能,或改變酶底物特異性,以及用以設 計新的活性。大多數(shù)定向進化項目試圖使在農業(yè)、醫(yī)學或工業(yè)環(huán)境(生物催化)方面對人 類有用的性質進化。
[0004] 整個代謝途徑的進化是一個特別具有吸引力的概念,因為大多數(shù)天然或新的化合 物都是通過各種途徑而不是通過單酶產生的。代謝途徑工程通常需要途徑中的所有酶的協(xié) 同操作。新代謝途徑的進化和生物處理的增強通常是通過重組和篩選或選擇的重復循環(huán)過 程來進行的,以使單獨的基因、整個質粒、多基因簇或甚至整個基因組進化。
[0005] Shao 等人(Nucleic Acids Research37 (2) : el6Epub2008Decl2) [Shao 等人(2008 年12月12日電子出版的《核酸研究》37卷第2期el6頁)]描述了編碼整個生化途徑或基 因組的大重組DNA的組裝,其在單個步驟中在釀酒酵母(Saccharomyces cerevisiae)中通 過5'和3'末端的兩個旁側(錨定)區(qū)域的體內同源重組進行組裝,所述區(qū)域包含相鄰片 段的5'或3'末端的序列。
[0006] Elefanty 等人(Proc. Natl. Acad. Sci. 95, 11897-11902(1998)[Elefanty 等人 (《美國科學院院刊》1998年95期第11897-11902頁)]描述了基因靶向技術以產生突變 小鼠,其中l(wèi)acZ報告基因被敲入SCL基因座。參考他們的文章的圖1,顯示了 SCL-lacZ基 因靶向策略,其采用兩個錨定序列,即5'和3'末端各一個錨定序列。
[0007] 定向進化可在活細胞中進行,稱為體內進化,或根本不包含細胞(體外進化)。體 內進化具有在細胞環(huán)境中選擇性質的優(yōu)勢,當進化的蛋白質或核酸是用在活生物體中時, 這很有用。酵母中的體內同源重組已廣泛用于基因克隆、質粒構建和文庫建立。
[0008] 文庫差異性(diversity)通過誘變或重組獲得。DNA改組(DNA shuffling)能夠 直接重組多基因的有利突變。在DNA改組中,DNA序列群隨機片段化,然后重組裝成全長雜 交序列。
[0009] 為了達到同源重組的目的,使用天然存在的同源基因作為起始差異性的來源。單 基因改組文庫成員通常超過95%相同。但是,家族改組能夠使通常超過60%相同的序列進 行塊交換。功能性序列差異性來自于相關的從自然選擇中存活下來的親本序列;因此,在一 給定的序列中,能容納數(shù)量大得多的突變而不會對結構或功能造成不利影響。
[0010] 高達30%差異性的不同來源的DNA片段的重組描述于W01990007576A1中。雜交 基因通過屬間和/或種間重組,在錯配修復缺陷細菌中或在錯配修復(MMR)系統(tǒng)短暫失活 的細菌中在體內產生。從而,避免了受損DNA的修復過程,否則,將會對不同序列之間的重 組頻率產生抑制作用,即,部分同源重組。
[0011] Kunz 等人(Cell. Mol. Life Sci. 66 (2009) 1021-1038)(《細胞和分子生命科學》 2009年第66期第1021-1038頁)提供了 MMR基本機制的綜述。
[0012] 祀向半同源重組描述于《MMR deficient plants (MMR缺陷植物)》中 (W02006/134496A2)。用高達10%差異的序列靶向一基因座是可能的。
[0013] W003/095658A1公開了同源重組到細菌中用于產生多核苷酸文庫。其產生了一多 核苷酸的表達文庫,其中每個多核苷酸通過同源重組整合到感受態(tài)細菌宿主細胞的基因組 中,其使用包含該多核苷酸和與宿主細胞基因組的區(qū)域同源的兩個旁側序列的非復制型線 性整合盒(cassette)。
[0014] 利用單倍體細胞高效配對引起二倍體生物體形成的能力可增加文庫的差異性。在 其營養(yǎng)生命周期中,釀酒酵母(S.cerevisiae)具有單倍體基因組,即每條染色體都以單拷 貝存在。在某些條件下,單倍體細胞可以配對。通過這種方式,形成二倍體細胞。二倍體細 胞可再次形成單倍體細胞,特別是當某些營養(yǎng)缺失時。然后,它們經歷一稱為減數(shù)分裂的過 程,然后形成孢子,以形成4個單倍體孢子。在減數(shù)分裂過程中,兩個親本基因組的不同染 色體重組。在減數(shù)分裂的重組過程中,DNA片段被交換,導致形成重組的DNA材料。
[0015] W02005/075654A1公開了一種用于在釀酒酵母中產生重組DNA序列的系統(tǒng),其基 于釀酒酵母的有性生殖周期。在誘導減數(shù)分裂和孢子形成過程的條件下培養(yǎng)雜交的二倍體 細胞。減數(shù)分裂的特征通常在于遺傳重組頻率的提高。因此,減數(shù)分裂的產物,即單倍體細 胞或孢子,可包含由兩個分開的DNA序列之間的重組形成的重組DNA序列。通過重復的方 法,選擇重組的單倍體后代并相互配對,將所得的二倍體再次變?yōu)殒咦樱顾鼈兊暮蟠咦?經歷合適的選擇條件以鑒定新的重組事件。此過程在野生型或錯配修復缺陷的釀酒酵母細 胞中描述。因此,目標基因(每個目標基因旁側為兩個選擇標記)被整合到錯配修復缺陷 二倍體株系的兩條姐妹染色體中每一條的相同基因座中。將DNA序列加到新的DNA片段的 5'或3'末端,所述新的DNA片段與DNA必須整合到的基因座的旁側DNA序列100%相同。 這些旁側目標序列長約400-450個核苷酸。然后,細胞進入減數(shù)分裂周期,并被迫啟動孢子 形成。在孢子形成過程中,重組過程發(fā)生。所得孢子和重組序列通過選擇合適的旁側標記 進行辨別。
[0016] 還可利用酵母高效重組同源DNA序列的能力以提高文庫的差異性。當具有89. 9% 同源性的兩個基因通過PCR進行突變并轉化到野生型酵母內時,通過體內同源重組創(chuàng)建 了一 10e7的嵌合文庫,顯示了遍及兩個基因的幾個交換點(Swers等人,Nucleic Acids Research32 (3) e36 (2004)) (Swers 等人,《核酸研究》,2004 年 32 卷第 3 期第 e36 頁)。
[0017] Nicholson 等人(Geneticsl54:133-146(2000))(《遺傳學》2000 年第 154 期第 133-146頁)描述了有絲分裂半同源重組的方法。其研究了短的反向重復序列中包含的限 定的錯配對野生型或MMR缺陷株系(strain)中重組率的影響。
[0018] 本發(fā)明的一個目的是提供一種制備和組裝多種基因嵌合體,特別是用于重組長 DNA片段的改進方法。因此,需要提供各變體的文庫用于選擇改進的重組體。
[0019] 該目標是通過提供本申請的【具體實施方式】來達到的。
【發(fā)明內容】
[0020] 本發(fā)明提供了一種通過在體細胞體內重組而產生基因嵌合體的新方法,包括:
[0021] a)在單個步驟過程中
[0022] (i)用至少一種基因 A轉化一細胞,所述基因 A與待重組的另一基因的序列同源性 小于99. 5%,所述待重組的另一基因為細胞基因組的一整體部分或存在于遺傳結構的框架 中,優(yōu)選采用待重組的至少一種基因 B,
[0023] (ii)將兩種所述基因重組;
[0024] (iii)在目標基因組的整合位點處產生基因的基因嵌合體,其中所述至少一種基 因 A在5'末端或3'末端具有單個旁側目標序列,錨定到所述整合位點的5'或3'末端,以 及
[0025] b)選擇包含所述基因嵌合體的克隆,
[0026] 其中所述細胞為敲除了至少一個DNA修復基因的真核株系。當基因 A要與至少一 個基因 B重組時,基因 A的單個旁側靶向序列優(yōu)選錨定到整合位點的5'末端,而基因 B具 有錨定到3'末端的單個旁側靶向序列。
[0027] 特別地,所述真核株系為敲除了至少一個DNA修復基因的活株系。
[0028] 特別地,所述DNA修復基因為DNA修復機制中包含的基因,例如MSH/Mut、RecQ和 RAD家族的基因。
[0029] 根據(jù)一個特定的方面,DNA修復基因完全或暫時被敲除,優(yōu)選通過突變,例如刪除 和/或插入和/或取代一個或多個核苷酸實現(xiàn)。
[0030] 此處理解的術語"敲除"指DNA結構和/或功能的任何類型的損害。這種損害可通 過至少一個DNA修復基因的突變造成,例如,通過DNA修復基因的刪除,或通過減弱其功能 的工程突變體。替代的方法可以是通過添加各試劑,或過表達其它基因,或通過回避表達所 述基因或其功能來滅活或抑制這種DNA修復。這種敲除可以是完全例如喪失功能性DNA修 復、部分地或暫時地喪失,包括可逆敲除。敲除株系此處特別地理解為敲除了至少一個DNA 修復基因的株系。
[0031] DNA修復基因通常是支持細胞中DNA修復過程并積極應答DNA結構破壞的基因。根 據(jù)強加到DNA的雙螺旋結構上的破壞類型,有多種恢復丟失信息的修復策略。如果可以,細 胞使用DNA或姐妹染色單體未經修飾的互補條帶作為模板來恢復原始信息。不接觸模板, 細胞使用被稱為翻譯合成的易錯恢復機制。對DNA的破壞改變了螺旋的空間構造,而這種 改變可被細胞檢測到。一旦破壞被定位,特定的DNA修復分子結合在破壞位點處或附近,弓丨 起其它分子結合并形成能夠使實際的修復發(fā)生的復合體。DNA修復基因功能的喪失會導致 基因組完整性維護的崩潰。
[0032] 如本發(fā)明使用的真核株系中適當?shù)厍贸倪@種DNA修復基因的實例是螺旋酶,例 如真核生物中螺旋酶的RecQ同源物或RecQ家族,其中有芽殖酵母(budding yeast)例如 釀酒酵母中的Sgsl,以及裂殖酵母例如粟酒裂殖酵母中的Rqhl。進一步的實例是核苷酸剪 切修復中涉及的基因,例如真核生物中的RAD同源物或RAD基因家族。
[0033] 這種DNA修復基因被理解為不同于DNA錯配修正的特定基因,如MutS或MutL。因 此,本發(fā)明使用的真核細胞特別地為無錯配修復缺陷細胞。
[0034] 特別優(yōu)選的敲除是,通過刪除或突變對于DNA修復必不可少的基因,特別是刪除 或突變RAD或RECQ家族基因,例如真核細胞中的RAD1和/或RECQ同源物。根據(jù)本發(fā)明的 一個特定的實施方式,所述DNA修復基因選自RAD1和RECQ的同源物或類似物。
[0035] 優(yōu)選的實施方式是選自真菌、酵母、植物、昆蟲和哺乳類動物的敲除株。
[0036] 特別優(yōu)選的是選自釀酒酵母、裂殖酵母、釀酒酵母、假絲酵母(Candida)、克魯維酵 母(Kluyveromyces)、漢遜氏酵母(Hansenula)、裂殖酵母(Schizosaccaromyces)、耶氏酵 母(Yarrowia)、畢赤酵母(Pichia)、曲霉、果蠅和隱桿線蟲屬的株系。
[0037] 優(yōu)選采用單倍體株系,例如單倍體酵母株系。
[0038] 或者,可使用哺乳動物細胞如HeLa細胞或Jurkat細胞,或植物細胞如擬南芥。
[0039] 優(yōu)選的株系是例如選自敲除了至少SGS1基因的釀酒酵母、敲除了至少RQH1基因 的粟酒裂殖酵母、敲除了至少dmblm基因的黑腹果蠅(Drosophila melanogaster)、敲除了 至少F18C5. 2和T04A11. 6基因之一的秀_隱桿線蟲(Caenorhabditis elegans)、敲除了 至少AtRECQLl-4和4B基因之一的植物以及敲除了至少BLM、WRN、RECQL、RECQL4和RECQL5 基因之一的哺乳動物細胞。
[0040] 特別地,本發(fā)明涉及一種通過在體細胞體內重組產生基因嵌合體的方法,包括:
[0041] a)在單個步驟過程中
[0042] (i)用至少一種基因 A轉化一細胞,所述基因 A與不同的基因 B的序列同源性小于 99. 5%,所述基因 B為細胞基因組的一整體部分或存在于遺傳結構的框架或表達盒中,
[0043] (ii)將兩個所述基因重組;
[0044] (iii)在目標基因組的整合位點處產生基因 A和基因 B的基因嵌合體,其中所述至 少一種基因 A在遺傳構造的5'末端或3'末端連接到單個旁側目標序列,所述單個旁側目 標序列錨定到所述整合位點的5'或3'末端;以及
[0045] b)選擇包含所述基因嵌合體的克隆,
[0046] 其中所述細胞為敲除了至少一個DNA修復基因的真核株系。
[0047] 特別優(yōu)選地,在基因嵌合體中使用選擇標記,并根據(jù)選擇標記的存在選擇克隆。例 如,基因嵌合體包含一選擇標記,例如其中所述基因 A與選擇標記連接?;蛘?,也可通過重 組所得的任何產物的存在來進行選擇,例如通過確定產量或功能性特征。特別是,可用一個 或多個不同的選擇標記來辨別不同類型的基因嵌合體。
[0048] 特別地,本發(fā)明的方法采用所述另一基因,該基因為目標基因組例如細胞基因組 的一部分。在一個優(yōu)選的實施方案中,所述另一基因是基因 B,其為細胞基因組的一部分。 [0049] 根據(jù)另一優(yōu)選實施方案,所述另一基因是與目標基因組分開的遺傳構造,例如線 性多核苷酸,并可選地在重組過程中整合到目標基因組中。
[0050] 根據(jù)本發(fā)明的一個特定實施方案,所述細胞用至少一種基因 A和至少一種基因 B 共轉化,其中基因 A的所述單個旁側目標序列錨定到所述目標基因組整合位點的5'末端, 以及其中基因 B與錨定到整合位點3'末端的單個旁側目標序列連接。
[0051] 特別是,細胞可用帶有選擇標記的至少一種基因 A和至少一種基因 B共轉化,其中 基因 A的所述單個旁側目標序列錨定到所述目標基因組整合位點的5'末端,以及其中基因 B連接到一不同的選擇標記和一單個旁側目標序列,所述單個旁側目標序列錨定到整合位 點的3'末端,以及其中選擇帶有至少兩種選擇標記的克隆。
[0052] 特別是,細胞可用至少兩種不同的基因 A1和A2以及可選地用至少兩種不同的基 因 B1和B2共轉化。
[0053] 根據(jù)一個特定的實施方案,至少又一種基因 C被共轉化,其具有與基因 A和/或所 述另一基因雜交的序列,以將所述又一基因 C組裝到基因 A和/或所述另一基因上,優(yōu)選其 中至少一種組裝基因具有基因內的基因嵌合體。
[0054] 特別是,至少又一種基因 C被共轉化,其具有與基因 A和/或B的序列(例如全長 基因 A或基因 B或基因 A和/或B的部分序列)雜交的序列,以獲得重組并將所述又一基 因 C組裝到基因 A和/或B。
[0055] 特別是,所述基因 C的雜交序列與所述序列的序列同源性小于99. 5%,優(yōu)選至少 30 %序列同源性。
[0056] 特別地,選擇基因內至少一種核苷酸進行了交換或互換(cross-over)的基因嵌 合體,即具有基因內互換的嵌合體,例如包含部分基因 A和部分所結合的所述另一基因的 那些嵌合體,其理解為部分基因的混合物,用以獲得重組的基因內基因嵌合體,例如適用于 以不同的方式表達產物的基因,例如,具有改進的性質或改進的產量。這種基因內基因嵌合 體可由重組產生,優(yōu)選還可通過一系列基因的組裝產生,其中一種或多種組裝的基因具有 這種基因內基因嵌合體。
[0057] 根據(jù)一個優(yōu)選的實施方案,可獲得至少三種不同基因 A和/或B和/或C的嵌合 體。
[0058] 優(yōu)選地,所述基因 A和/或所述另一基因編碼多肽或具有活性的多肽部分。
[0059] 特別地,本發(fā)明方法采用編碼具有活性的多肽部分的基因 A、B和/或C。因此,基 因,例如基因 A和/或B和/或C,優(yōu)選它們全部不單獨編碼生物活性多肽本身,而僅編碼其 部分,并僅在基因組裝后帶來相應的活性或改進的活性。
[0060] 使用本發(fā)明方法,可組裝和重組編碼生化途徑多肽的多種基因。
[0061] 在另一特定的實施方案中,本發(fā)明方法提供了得到非編碼序列的基因重組和可能 的組裝(eventual assembly),例如啟動子、非翻譯區(qū)、核糖體結合位點、終止子等。
[0062] 根據(jù)本發(fā)明,可使用任何重組感受態(tài)真核細胞通過體細胞體內重組產生基因嵌合 體。
[0063] 根據(jù)一個特定的實施方案,旁側目標序列為至少5bp,優(yōu)選至少10bp,更優(yōu)選至 少20bp、50bp、100bp直至5000bp長。特別地,旁側目標序列連接到所述基因,或為所述 基因的整個終端部分。與所述整合位點的錨定序列雜交的所述旁側目標序列優(yōu)選具有 30% -99. 5%,優(yōu)選小于95%,小于90%,小于80%,甚至小于70%或小于60%的同源性或 相應的序列一致性。結果,本發(fā)明的方法提供了高效的基因嵌合體形成和文庫形成,同源性 或相應的序列一致性甚至小于50%,例如同源性為47%,即差異性為53%。優(yōu)選地,同源性 為至少35%或40%。
[0064] 當根據(jù)本發(fā)明使用至少兩種不同的旁側目標序列錨定到基因組的目標整合位點 時,優(yōu)選它們不相互重組,優(yōu)選地,它們具有小于30%的同源性。
[0065] 對本發(fā)明方法有用的選擇標記可選自任何已知營養(yǎng)缺陷性標記、抗生素抗性標 記、熒光標記、敲入標記、活化劑/結合區(qū)域標記和顯性隱性標記和比色標記。優(yōu)選的標記 可以是短暫失活或功能性敲除的,并可重建以恢復其標記性質。進一步優(yōu)選的標記是可追 蹤基因,其中,標記是基因序列A和/或其它基因例如基因 B的功能,不需要用標記功能來 分開序列,這樣,基因嵌合體的表達可直接通過檢測嵌合體自身來確定。在這種情況下,基 因嵌合體是直接可追蹤的。
[0066] 根據(jù)一個特定的實施方案,所述基因包含在線性多核苷酸、載體或酵母人工 染色體中。特別地,基因 A和/或待重組的其它基因的形式是線性多核苷酸,優(yōu)選為 300-20000bp。特別地,不需要構建或采用質?;蚓薮筚|粒。因此,可使用基因本身,即沒有 載體。
[0067] 用于重組和整合的基因也可包含在例如用作載體來攜帶所述基因的任何遺傳構 造中。因此所述基因可包含在一遺傳構造中,例如線性多核苷酸、載體或酵母人工染色體。 這些構造優(yōu)選包括線性多核苷酸、質粒、PCR構造體、人工染色體如酵母人工染色體、病毒載 體或可換位元件。
[0068] 根據(jù)本發(fā)明一個特定的實施方案,目標基因組的整合位點位于任一基因上,例如 在線性多核苷酸、質粒或染色體包括人工染色體內。
[0069] 本發(fā)明方法特別地提供了具有基因內基因嵌合體的至少一種克隆的選擇。特別 地,選擇具有基因組裝體和至少一種基因內基因嵌合體的至少一種克隆。
[0070] 使用本發(fā)明方法,可獲得至少3,優(yōu)選至少9,直至20000個堿基對的基因嵌合 體,以及例如包含至少一種基因內嵌合體的基因嵌合體,優(yōu)選每700個堿基對,更優(yōu)選每 600bp、每500bp或甚至更少堿基對具有至少3個交換事件,優(yōu)選至少4、5或10個交換事件。 一般,高度交換事件提供了大量重組基因,這可用以產生選擇合適文庫成員的文庫。嵌合體 或交換事件的程度可理解為這種文庫的質量參數(shù)。
[0071] 根據(jù)本發(fā)明方法修飾的基因可以是用于科學或工業(yè)目的的任何基因。這些基因 可以是例如非編碼序列,例如,可用于重組表達系統(tǒng)或多肽變體的那些,可以是整體或部 分,包括不編碼具有生物活性的多肽的那些部分序列,其中多肽特別地選自酶、抗體或其部 分、細胞激素、疫苗抗原、生長因子或肽。如果基因被修飾,所述基因編碼作為具有生物活 性的多肽的部分的非編碼序列或氨基酸序列,也稱為"部分基因",優(yōu)選這種部分基因的組 裝具有功能性特征,例如編碼具有生物活性的多肽。優(yōu)選地,重組許多不同的基因,例如不 同的部分基因,大小為3bp-20000bp,特別是至少100bp,優(yōu)選300bp-20000bp,特別地高達 lOOOObp,其中不同基因的數(shù)目為至少2個,更特別地為至少3、4、5、6、7、8、9或至少10個, 以產生重組的基因序列,該基因序列為非編碼或編碼重組多肽,例如具有生物活性,其有利 地被調整,例如生物活性提高。用在此方面的術語"生物活性"特別地指酶活性,例如將特 定底物轉化為特定產物的活性。根據(jù)本發(fā)明差異化的優(yōu)選基因編碼多鏈多肽。
[0072] 本發(fā)明一個特定實施方案提供了基因變體的細胞展示方法,包括使用本發(fā)明方法 在細胞內產生大量基因嵌合體,以及將所述大量基因嵌合體展示在所述細胞表面以獲得嵌 合體文庫。
[0073] 通過這種優(yōu)選展示可獲得的文庫特別地在功能性開放閱讀框(0RF)內包含高百 分比的基因嵌合體,優(yōu)選至少80%。
[0074] 本發(fā)明的文庫特別地可以是任何合適的形式,特別地,生物文庫包括大量含有基 因變體的生物體。本發(fā)明的生物文庫可包含在生物體群中和/或由生物體群表達,以產生 生物體清單(repertoire),其中單獨的生物體包括至少一種文庫成員。
[0075] 本發(fā)明的一個特定方面提供了來自這種文庫的包含基因變體的生物體,例如,選 自生物體清單的生物體。本發(fā)明提供的生物體可用以在合適的表達系統(tǒng)中表達基因表達產 物,例如作為生產宿主細胞。
【專利附圖】
【附圖說明】
[0076] 圖1 :非減數(shù)分裂體內重組
[0077] 半同源基因 A和B(同源性小于99. 5% )被重組。由于標記序列和旁側目標序列 并非同源,因此,重組/組裝僅發(fā)生在基因 A和B之間。結果,雜交體/嵌合體DNA包含重 組的基因 A和B、兩種標記和兩旁側目標序列?;蚯逗象w整合到目標染色體的目標基因座 中。具有整合整個構造的克隆在選擇兩種標記的合適的培養(yǎng)基上生長。
[0078] T5'和T3'對應于酵母基因組(大約400bp)上的目標序列(同源性小于99. 5% ), 處理染色體位點上的同源整合。Ml和M2是旁側標記,用于雙重選擇。基因 A和基因 B是具 有給定同源性(小于99. 5%)的相關半同源版本。重疊序列對應于兩個基因的整個0RF。 通過在MMR缺陷酵母轉化體中的半同源重組組裝后,雙重選擇可以分離重組體。
[0079] 圖2 :通過半同源重組的DNA重組和組裝
[0080] 此圖顯示了一個特定實施方案的示意圖展示,其中細胞用至少兩種基因(此處為 DNA片段A和B)共轉化,這兩種基因在它們的80bp重疊片段上具有小于99. 5%的同源性。 每個DNA片段旁側有一個選擇標記。
[0081] 片段A包含對應于染色體上的5'端正確整合位點的旁側目標序列和與片段B重 疊的雜交區(qū)域,片段B包含對應于3'整合位點的旁側目標序列以及與片段A重疊的雜交區(qū) 域。用所得的片段轉化錯配缺陷型酵母細胞。所得轉化體涂布在培養(yǎng)基上,該培養(yǎng)基對于 兩種標記具有選擇性。分離能夠通過兩種標記被選擇的克隆,通過對選出的重組體基因組 DNA進行分子分析,證實組裝的/整合的基因簇的完整性以及基因 A和B的0RF的重建。
[0082] T5'和T3'對應于酵母基因組(大約400bp)上的目標序列(同源性小于99. 5% ), 負責染色體位點上的同源整合。Ml和M2是旁側標記,用于雙重選擇。DNA片段A和B可以 組裝到一個基因中,該基因可追蹤如GFP,或者代表由這種方法組裝的兩個基因。所有基因 的重疊序列的同源性小于99. 5% (120bp),使得同源重組進行組裝后能夠重建0RF。雙重選 擇可以使重組體分離并用作組裝的初步證實。
[0083] 圖3:基因 A、B和C的重組和組裝
[0084] 此圖顯示了又一基因 C的共轉化,所述基因 C具有與基因 A和/B的旁側序列雜交 的序列,以將所述基因 C組裝到基因 A和B。
[0085] T5'和T3'對應于酵母基因組(大約400bp)上的目標序列(同源性小于99. 5% ), 負責染色體位點上的同源整合。Ml和M2是旁側標記,用于雙重選擇?;?A、基因 B和基 因 C是具有給定同源度(小于99. 5%)的相關同源序列。重疊序列對應于基因的5'部分 和3'部分?;?B連接旁側序列,通過序列相似性重建新的ORF ABC。通過在MMR缺陷酵 母轉化體內的同源重組進行組裝后,雙重選擇可以分離重組體。
[0086] 圖4 :0xa重組底物
[0087] 四種基因編碼β-內酰胺酶的變體。它們是在DNA水平具有不同程度的同源 性(從95 %到47 % )的相關序列。對于0ΧΑ11和0ΧΑ5,父本基因序列的來源是綠膿假 單胞菌(Pseudomonas aeruginosa),對于0ΧΑ7和Oxal,父本基因序列的來源是大腸桿菌 (Escherichia coli)。面板(panel)上部顯示了基因的0RF退火示意圖,比對后產生了系 統(tǒng)樹圖(dendrogramme)?;虻拇笮〖s為800bp。ATG和TAA是起始和終止密碼子。表的 底部顯不了四種基因之間在DNA水平的序列相似性。每種基因的四種DNA序列見圖7。
[0088] 圖5 :基因和蛋白質嵌合體0XA11/0XA7的序列(SEQ ID N0sl-14)
[0089] 來源于0XA7的核苷酸序列加粗并加下劃線,突變核苷酸序列加粗并為斜體。
[0090] 克隆通過雙重選擇和用于擴增和測序的DNA進行分離。只使用兩條條帶中清楚可 讀的序列。所得色譜圖用類Clustal方案進行比對。
[0091] 圖 6 :基因和蛋白質嵌合體 0XA11/0XA5(SEQ ID N0sl5-38)和 0XA11/0XA1(SEQ ID N0s67-70)序列
[0092] 來源于0XA5或0XA1的核苷酸序列加粗和加下劃線,突變核苷酸序列加粗并為斜 體。
[0093] 克隆通過雙重選擇和用于擴增和測序的DNA進行分離。只使用兩條條帶中清楚可 讀的序列。所得色譜圖用類Clustal方案進行比對。
[0094] 圖 7 :父本基因 0XA11、0XA7 和 0XA5 以及 0XA1 (SEQ ID N0s39-41 和 SEQ ID N066) 序列
[0095] 圖8 :包含復合嵌合體基因的克隆序列,對應于半同源組裝的0XA11/0XA5/0XA7
[0096] 序列克隆,以及各蛋白質退火的結果:圖8a)0XAll/0XA5/0XA7的0UL3-05-II (SEQ ID N0s42 和 43),圖 8b)0XAll/0XA5/0XA7 的 0UL3-05-III(SEQ ID N0s44 和 45),圖 8c)0XAll/0XA5/0XA7 的 0UL3-05-IV(SEQ ID N0s46 和 47),圖 8d)0XAll/0XA5/0XA7 的 0UL3-05-IX(SEQ ID N0s48 和 49)和圖 8e)0XAll/0XA5/0XA7 的 0UL3-05-X(SEQ ID N0s50 和 51)。
[0097] 0XA5的核苷酸序列加粗,而對應于0XA7的那些序列加下劃線。非加粗無下劃線的 序列對應于0XA11。
[0098] 圖9 :乳酸克魯維酵母(Kluyveromyces lactis)、釀酒酵母的ADH1基因序列和重 組序列
[0099] 來源于乳酸克魯維酵母的核苷酸序列加下劃線。
[0100] 圖 9a) : (SEQ ID N0s52)ADH 克魯維酵母,圖 9b) : (SEQ ID N0s53)釀酒酵母,圖 9c) :(SEQ ID N0s54)克隆 A02,圖 9d) :(SEQ ID N0s55)A03,圖 9e) :(SEQ ID N0s56)A05, 圖 9f) :(SEQ ID N0s57)A06,圖 9g) :(SEQ ID N0s58)A10,圖 9h) :(SEQ ID N0s59)All。
[0101] 圖10 :包含復合嵌合體基因的克隆序列,對應于釀酒酵母的DNA修復缺陷株中的 半同源組裝 0XA11/0XA5/0XA7。
[0102] 序列顯示了多個互換,甚至帶有同源性小于50 %的基因 。SEQ ID60:0UL-Y00-I(DNA),SEQ ID61:0UL-Y00-I(蛋白質),SEQ ID62:0UL-Y00-IV(DNA),SEQ ID63:0UL-Y00-IV(蛋白質),SEQ ID64:0UL14-15(DNA),SEQ ID65:0UL14-15(蛋白質),SEQ ID N069:0UL-Y00-15(DNA),SEQ ID N070:0UL-Y00-15(蛋白質)。
【具體實施方式】
[0103] 因此,本發(fā)明涉及到一種新的和非常高效的方法,用于半同源DNA序列(S卩,類似 但不相同的序列)的體內重組。以下,術語同源重組(當半同源序列重組時有時稱為半同 源重組),是指具有一定同源性的序列的重組,所述序列可以相同,也可以不同。與傳統(tǒng)克 隆方法依賴于位點特異性消化和連接不同,同源重組將互補序列進行排列,并使片段之間 進行交換。重組嵌合體基因,也稱為雜交基因,在細胞中通過具有錯配堿基的序列雜交而產 生。通過這種有創(chuàng)造力的誘變方法,可以容易地以時間高效的方式建立差異性用于合適的 選擇和目標多肽的再設計。
[0104] 特別地,本發(fā)明通過采用體內重組的功能性系統(tǒng),第一次能夠在單個步驟過程中 有效地重組和形成嵌合體,差異化和組裝不同的基因。
[0105] 術語"單個步驟過程"是指設計重組體的幾個處理步驟,如用基因轉化細胞、基因 重組、產生嵌合體基因和將基因整合到目標基因組內,技術上在一個方法步驟中實施。因 此,在體內重組前就不需要在體外重組DNA載體,或處理步驟的任何重復循環(huán),包括采用減 數(shù)分裂的那些。有利地,可以避免使用減數(shù)分裂的酵母細胞。
[0106] 本發(fā)明單個步驟過程甚至可包括同時通過宿主表達這種經設計的重組體。從而, 不需要進一步的操作以獲得表達產物。
[0107] 本發(fā)明的術語"基因嵌合體"是指發(fā)生至少一次互換事件的至少兩種不同的基因 的結合。特別地,這種交換提供了 DNA序列的結合或混合?;蚯逗象w可通過基因的基因 內混合、基因內的基因嵌合,和/或基因組裝,可選地兩種都用的基因組裝、基因內和基因 間交換或基因嵌合來產生。
[0108] 術語"互換"是指在兩條DNA條帶可交換遺傳信息(即至少一個核苷酸)的位點 處基因之間的重組?;Q過程導致產物嵌合基因具有來源于父本基因的基因或序列的不同 結合。
[0109] 或者,可提供不基于互換的其它修復機制例如核苷酸剪切修復,或非同源末端連 接機制,包括鏈連接后識別不正確的核苷酸、剪切和/或替換。
[0110] 術語"旁側目標序列"是指與目標序列互補的核苷酸序列區(qū)域,例如基因組目標整 合位點,包括基因 A和/或待重組的其它基因、線性多核苷酸、線性或環(huán)形質粒YAC的序列 等的位點。由于具有特定程度的互補或同源性,旁側目標序列可基因雜交并整合到目標整 合位點。
[0111] 術語細胞的"基因組"是指生物體遺傳信息的整體,表示為基因和DNA非編碼序 列,染色體的或非染色體的遺傳元件例如線性多核苷酸,例如包括基因 A和/或其它待重組 的基因、病毒、自復制攜帶體和載體、質粒和可換位元件,包括人工染色體等。人工染色體是 線性或環(huán)狀DNA分子,其包含引入細胞時保持穩(wěn)定所需的全部序列,在細胞中,它們表現(xiàn)得 與天然染色體類似,因此被視為基因組的一部分。
[0112] 術語"同源性"表示兩個或多個核苷酸序列在相應的位置處具有(至一特定程度, 高達100% )相同或保守堿基對。同源序列,也稱為互補序列、對應的序列或配對的序列(如 本發(fā)明所使用),優(yōu)選與同源相對序列雜交,例如,對于全長天然DNA序列或本文公開的DNA 序列片段,其與各自的互補序列具有至少30%序列一致性,但小于99. 5%序列一致性,序 列一致性可低于95%、低于90%、低于85%或低于80%,甚至低于70%、低于60%或低于 50%。序列一致性理解為是指相同或互補序列。百分比序列一致性在本文中也稱為百分比 同源性。優(yōu)選地,本文使用的特定同源性序列具有至少約30%的核苷酸序列一致性,總是包 括相應或互補的一致性,優(yōu)選至少約40%-致性,更優(yōu)選至少約50%-致性,更優(yōu)選至少 約60%-致性,更優(yōu)選至少約70%-致性,更優(yōu)選至少約80%-致性,更優(yōu)選至少約90% 一致性,更優(yōu)選至少約95%-致性。上面提到的上限和下限的優(yōu)選范圍在30% -99. 5%對 應序列一致性的范圍內。如本文所使用的,一致性或同源性的程度總是指相同或互補核苷 酸序列。
[0113] 存在于不同種的基因家族的基因也稱為"同源"。優(yōu)選的DNA修復基因適合的敲除 是如本文描述的特定DNA修復基因的同源物,例如多種不同真核細胞的RAD基因的同源物 或RECQ家族的基因,包括優(yōu)選酵母菌株中的同源物。這些同源物是已知的并存在于許多種 真核生物中,它們互不相同,例如,存在或不存在某些區(qū)域,非保守區(qū)域的長度和序列不同。
[0114] 基因的核苷酸序列的"百分比(%) -致性"定義為候選DNA序列中核苷酸的百分 比,所述候選DNA序列與DNA序列中的核苷酸或其相應的或互補的序列相同,在比對序列和 引入缺口后,如果需要,達到最大百分比序列一致性,并且不將任何保守取代作為序列一致 性的一部分。用于確定百分比核苷酸序列一致性的比對可利用本領域內的各種方法實現(xiàn), 例如,使用公開的可獲得的計算機軟件。本領域技術人員可確定測量比對的合適參數(shù),包括 獲得待比較的全長序列的最大比對需要的任何運算法則。
[0115] 術語"錨定"是指基因或基因嵌合體通過稱為"錨定序列"的具有部分或全部序 列同源性的片段與整合序列結合,以使這種基因或基因嵌合體整合到基因組的整合位點 中。特別地,錨定序列可以是與基因組序列的整合位點同源或部分同源的旁側目標區(qū)域。 優(yōu)選的錨定序列最好與目標整合位點具有至少約70 %的序列同源性,更優(yōu)選地至少80%、 90%、95%直至99. 55%或完全與基因組的雜交部分匹配。
[0116] 整合位點可合適地為限定在宿主基因組上的基因座,其中會發(fā)生高頻的重組事 件。一種優(yōu)選的基因座是,例如,釀酒酵母染色體ΠΙ上的BUD31-HCM1基因座。一般來說, 優(yōu)選顯示出高頻重組但不改變細胞活力的酵母染色體上的任何另外的基因座。
[0117] 術語"表達"或"表達系統(tǒng)"或"表達盒"是指可操縱連鎖中包含所需的編碼序列和 控制序列的核酸分子,使得用這些序列轉化或轉染的宿主能夠產生編碼的蛋白質。為了產 生轉化,表達系統(tǒng)可包含在載體上;但是,相關的DNA接著也會整合到宿主染色體中。
[0118] 術語"基因"還可包括基因的DNA片段,特別是那些部分基因。片段還可包含幾個 相同0RF或不同0RF的重復的開放閱讀框。該術語可特別地包括非編碼(例如非轉錄或非 翻譯序列)或編碼多肽的核苷酸序列,可以是整體的,也可以是部分的。
[0119] 本發(fā)明使用的術語"基因 A"可指非編碼序列或編碼目標多肽或多個多肽的序列的 任何核苷酸序列?;?A的特征在于其展示在遺傳構造的框架內,所述遺傳構造例如表達 盒、線性多核苷酸、質?;蜉d體,其優(yōu)選包含至少一標記序列并具有位于基因 A或遺傳構造 的5'末端或3'末端的單個旁側目標序列。在本發(fā)明的方法中,基因 A通常是用于形成基 因嵌合體的待重組的一些基因的第一基因?;?A與待重組的另一基因是同源的,所述另 一基因最終為基因 A的變體,或根據(jù)情況,為基因匕(:、044、6、!1等的任一種。因此,為了 達到最大的保真度的目的,通常僅為每個基因 A提供一個旁側目標序列?;?A的變體稱 為基因 A1、A2、A3等,其具有某一程度的序列同源性,并可選地具有相似的功能性特點。術 語"至少一種基因 A"指至少基因 A,以及可選的基因 A的變體。
[0120] 本發(fā)明使用的術語"基因 B"指非編碼序列或編碼目標多肽或多個多肽的序列的任 何核苷酸序列,其經選擇用于與待重組的另一基因形成基因嵌合體,所述待重組的另一基 因最終為基因 A、基因 B的變體,或根據(jù)情況,為基因(:、0』、?、6、!1等的任一種?;?與 基因 A或其它基因具有一定程度的同源性,以與基因 A或其它待重組的基因形成嵌合體。在 本發(fā)明的方法中,基因 B通常是用于形成基因嵌合體的待重組的一系列基因的最后基因。 基因 B可以是細胞基因組整體的一部分,或展示在遺傳構造的框架中,所述遺傳構造例如 表達盒、線性多核苷酸、質?;蜉d體,優(yōu)選在基因 B或遺傳構造的5'末端或3'末端包含至 少一標記序列并具有單個旁側目標序列,作為基因 A旁側目標序列的對應物,S卩,在該基因 的相對末端。如果基因 A的旁側目標序列位于基因 A的5'末端,那么,基因 B的旁側目標 序列通常會在3'末端,反之亦然。因此,為了達到最大保真度的目的,通常僅為每個基因 B 提供一個芳側目標序列?;?B可以是基因 A的變體?;?B的變體稱為基因 Bl、B2、B3 等,其具有一定程度的序列同源性,并可選地具有相似的功能性特點。術語"至少一種基因 B"指至少基因 B,以及可選的基因 B的變體。
[0121] 本發(fā)明使用的術語"基因 C "指非編碼序列或編碼目標多肽的序列的任何核苷酸 序列。基因 C的特征在于其展示在遺傳構造的框架中,所述遺傳構造例如表達盒、線性多 核苷酸、質粒或載體,其可選包含標記序列,基因 c進一步的特征在于與基因 A和/或基因 B、基因 C的變體或最終地根據(jù)情況與基因 D、E、F、G、Η等的序列同源的核苷酸序列的片 段?;?C優(yōu)選在基因 C的5'末端或3'末端處具有單個旁側目標序列,或在兩側均具有 旁側目標序列。因此,基因 C可部分或全部與基因 Α和/或待重組的其它基因雜交、連接并 組裝基因。本發(fā)明的方法中,基因 C通常為用于形成基因嵌合體的一系列待重組基因中基 因 A后的第二基因?;?C的變體稱為C1、C2、C3等,其具有一定程度的序列同源性,并可 選地具有相似的功能性特點。
[0122] 另一基因 D可通過其核苷酸序列或其核苷酸序列的片段的雜交額外地被重組并 組裝,所述片段與基因 C、基因 D的變體或根據(jù)情況與最終的其它基因 A、B、E、F、G、Η等的 序列同源,以提供相應的重組和連接?;?D優(yōu)選在基因 D的5'末端或3'末端具有單個 旁側目標序列,或在兩側都具有旁側目標序列。在本發(fā)明的方法中,基因 D通常是用于形成 基因嵌合體的待重組的一系列基因中基因 C后的下一基因?;?D變體稱為D1、D2、D3等, 其具有一定程度的序列同源性,并可選地具有相似的功能性特點。
[0123] 另一基因 E可通過其核苷酸序列的片段額外地被重組并組裝,所述片段與基因 D、 基因 E的變體或根據(jù)情況與最終的其它基因 A、B、C、F、G、H等的序列同源,以提供相應的重 組和連接?;?E優(yōu)選在基因 E的5'末端或3'末端具有單個旁側目標序列,或在兩側都 具有旁側目標序列。在本發(fā)明的方法中,基因 E通常是用于形成基因嵌合體的待重組的一 系列基因中基因 D后的下一基因?;?E的變體稱為E1、E2、E3等,其具有一定程度的序列 同源性,并可選地具有相似的功能性特點。
[0124] 相應地可使用進一步的基因 F、G、H等。進一步的基因系列理解為不受字母數(shù)目的 限制。最終的目標基因鏈可通過與基因 A和B連接來獲得,以在基因組的整合位點處獲得基 因組裝體。這樣組裝的目標基因可操作地連接,以分別支持相應目標多肽和代謝產物的表 達。一個特定的組裝方法通過體內重組采用表達盒的結合來組裝甚至大量的DNA片段,以 獲得尺寸十分大的所需DNA分子。代表重疊序列的盒經合適地設計以覆蓋整個所需序列。 在一個實施方案中,優(yōu)選的重疊為至少約5bp,優(yōu)選地至少約10bp。在另一個實施方案中, 重疊為至少15bp,優(yōu)選地至少20直至lOOObp。
[0125] 在一個優(yōu)選的實施方案中,某些盒經設計包含能夠用于鑒定的標記序列。通常,標 記序列位于容納轉座子插入的位點,以使對最終所需核酸序列的生物作用最小化。
[0126] 在一個特定的實施方案中,宿主細胞能夠重組或組裝甚至大量的帶有重疊序列的 核酸基因或DNA片段(例如,宿主細胞中至少2,優(yōu)選至少3、4、5、6、7、8、9,更優(yōu)選至少10 個基因或核酸片段),其方式是通過與所述基因或片段混合物一起共轉化,并培養(yǎng)所述宿主 至重組或組裝序列被轉化。
[0127] 本發(fā)明使用的整體或部分的基因或DNA片段,可以是雙鏈的或單鏈的。雙鏈核酸 序列通常為300-20000個堿基對,單鏈片段通常較短,范圍為40-10000個核苷酸。例如,數(shù) 量為2Mb直至500Mb的組裝體可在酵母中組裝。
[0128] 來自大量生物體的基因組序列是公開可獲得的,并可用在本發(fā)明的方法中。這些 基因組序列優(yōu)選包括獲自不同宿主細胞株或不同種的信息,以提供具有特定差異性的同源 序列。
[0129] 用作重組底物的最初基因通常為包含基因的變體形式的多核苷酸集合體。變體形 式顯示出在底物之間足以同源重組的相互的相當?shù)男蛄幸恢滦?。多核苷酸之間的差異性 可以是天然的,例如等位基因或種的變體,可以是誘導的,例如易錯PCR或易錯循環(huán)序列重 組、或可以是體外重組的結果。差異性可來自利用其它密碼子編碼天然蛋白的再合成基因。 底物之間應有至少足夠的差異性,這樣,重組可產生比起始材料更多差異性的產物。必須有 至少兩種在至少一個或多個位置上不同的底物。差異性程度取決于將要重組的底物的長度 和待引起的功能性轉變的程度。位置差異性通常高達69%。
[0130] 根據(jù)本發(fā)明方法,優(yōu)選基因 A、B、C和進一步的基因至少在設計用于雜交的特定片 段處具有至少30%的同源性,所述特定片段可包括全長基因。優(yōu)選的同源性百分比為至少 40%,更優(yōu)選為至少50%,更優(yōu)選為至少60%,更優(yōu)選為至少70%,更優(yōu)選為至少80%,更 優(yōu)選為至少90%,甚至更優(yōu)選為至少95%,直至小于99. 5%。
[0131] 根據(jù)本發(fā)明,特別地產生了基因嵌合體,其中具有某一同源性的基因被重組,例如 同源性為至少30%,以及產生了至少一種基因內基因嵌合體。因此,基因,例如基因變體,可 被重組。
[0132] 根據(jù)一個特定的實施方案,產生了一基因嵌合體,其中基因被組裝。在這種情況 下,基因可在待重組的特定區(qū)域內具有同源性或部分同源性,即重疊,或甚至無同源性。優(yōu) 選至少3bp的重疊。在沒有重疊的情況下,基因被組裝以將一個基因的3'末端與另一基因 的5'末端聯(lián)合(align)。
[0133] 從而,編碼不同功能的序列或蛋白質(例如參與微生物代謝途徑的蛋白質)的基 因可優(yōu)選被組裝。
[0134] 本文使用的術語"組裝體"特別地指將核苷酸序列聯(lián)合并可選地融合以產生基因 構造體,這些基因一起發(fā)揮作用以提供相連的活性或處理。因此,本文中基因組裝體理解為 一系列基因(術語"基因"在本文中總是理解為包括非編碼序列、部分基因或基因,例如至 少3直至20000bp)或一串基因,例如一基因隊列,不考慮順序。本發(fā)明的組裝體特別地提供 用于基因內基因嵌合體。優(yōu)選地,用本發(fā)明方法,組裝體額外地提供至少一個基因內基因嵌 合體,例如通過利用基因變體加上各種不同基因以提供兩者,基因內和基因間基因嵌合體。
[0135] 在許多情況下,可能希望簡單地組裝,例如串聯(lián)在一起以及可選地將這些基因與 基因變體混合,以使較大基因差異化,較大基因例如獨立的代謝途徑的成員,或使多重代謝 途徑根據(jù)此方法組裝。在自然界中不存在的代謝途徑可以這種方式構建。因此,一種生物 體中存在的酶,所述酶作用于缺乏這種下游酶的不同生物體產生的目標底物,可以通過構 建基因或部分基因的組裝體以獲得重組酶來編碼在相同的生物體中。因此,可將多種酶包 括在內以構建復合代謝途徑。這是有利的,如果一簇多核苷酸或部分多核苷酸按照途徑內 它們的生物化學功能進行布置。示例性目標基因途徑編碼酶,用于合成工業(yè)目的的次級代 謝產物,例如黃酮醇、大環(huán)內酯、聚酮等。
[0136] 此外,組合文庫可通過混合片段來制備,其中一個或多個片段帶有相同的雜交序 列,但是具有編碼酶或其它蛋白質的不同中間序列。
[0137] 遺傳途徑可以組合方式構建,使得組合文庫的每個成員具有基因變體的不同組 合。例如,變體的組合文庫可從單獨的DNA元件構建,其中不同的片段被重組和組裝,以及 其中每個不同的片段具有幾種變體。代謝途徑的重組和組裝可能不需要存在標記序列來證 實設計成功??尚袑嵤├缫驯砻鞔x產物以所需方式表達。代謝途徑的成功重組和組裝 可,例如,通過檢測細胞培養(yǎng)基中的次級代謝產物來確定。
[0138] 真核宿主細胞被考慮用于本文公開的方法,包括酵母宿主細胞,例如釀酒酵母、 昆蟲宿主細胞,例如草地夜蛾(Spodooptera frugiperda),或人宿主細胞,例如HeLa和 Jurkat〇
[0139] 優(yōu)選的宿主細胞是單倍體細胞,例如來自假絲酵母屬(Candida sp)、畢赤酵母屬 (Pichia sp)和釀酒酵母屬。
[0140] 本發(fā)明方法不使用有性周期或減數(shù)分裂重組。DNA片段可以轉化到單倍體細胞中。 轉化體可立即劃線接種在選擇平板上。然后,通過PCR或其它方法,如缺口修復,分離重組 體。
[0141] 本發(fā)明方法在敲除了 DNA修復基因(優(yōu)選那些RAD1和RECQ基因缺陷同系物)的 任何真核細胞內實施。
[0142] 特別地,DNA修復基因的敲除可為整體或部分基因刪除、這些基因的突變(包括刪 除、插入和/或取代),或任何其它短暫或永久損害DNA修復的策略,包括DNA修復內包含的 基因的突變、用UV線處理、用化學物質例如2-氨基嘌呤處理、誘導表達或抑制DNA修復中 包含的基因,例如通過可調節(jié)的啟動子,其能夠短暫滅活和激活。
[0143] 細菌DNA修復系統(tǒng)已被廣泛地研究。在其它系統(tǒng)例如酵母中,已鑒定出幾種基因, 其產物與細菌DNA修復系統(tǒng)同源,例如參考RAD1或RECQ的同系物。
[0144] 在真核細胞中,RECQ DNA解旋酶包括基因組穩(wěn)定性和抗DNA損傷劑所需的蛋白質 家族。酵母釀酒酵母和粟酒裂殖酵母每種分別包含單個RECQ解旋酶、Sgsl和Rqhl。SGS1 的突變導致重組率和受損孢子率增加,以及對DNA損傷劑的敏感度提高。從DNA合成抑制 恢復通常被認為是RECQ DNA解旋酶的保守功能。因此,令人驚訝的是,根據(jù)本發(fā)明,敲除了 這類基因的真核株系可用作體內重組的宿主以提供基因嵌合體,而無需顯著地損害細胞。
[0145] 優(yōu)選的DNA修復缺陷細胞的實例是特定的酵母細胞,例如刪除了相應基因如 SGS1的釀酒酵母株。示例性宿主細胞可從市面上購買,例如刪除了 SGS1的株系(Acc. N° Y00775, Euroscarf Frankfurt)〇
[0146] 本發(fā)明的方法主要采用標記輔助選擇成功重組的產物。使用工具例如分子標記或 DNA指紋可繪制目標基因圖譜。這能夠篩選大量細胞以獲得具有目標特征的細胞選擇。篩 選基于是否存在或不存在某種基因。
[0147] 本發(fā)明使用的術語"選擇標記"指蛋白質編碼或非編碼DNA序列,其提供了成功整 合后的標記。特別地,蛋白質編碼標記序列選自:營養(yǎng)標記、色素標記、抗生素抗性標記、抗 生素敏感標記、熒光標記、敲入標記、激活劑/結合區(qū)域標記以及顯性隱性標記、比色標記 以及編碼酶的不同亞單元的序列,所述酶僅在兩個或多個亞單元在相同細胞內表達時發(fā)揮 作用。該術語還指待重組的可追蹤基因,其可用于直接確定基因嵌合體,而無需使用另外的 標記序列。
[0148] "營養(yǎng)標記"是編碼基因產物的標記序列,所述基因產物可補償細胞的營養(yǎng)缺陷, 并因此賦予營養(yǎng)缺陷細胞原養(yǎng)型。根據(jù)本發(fā)明,術語"營養(yǎng)缺陷"指細胞必須在包含不能由 營養(yǎng)缺陷細胞自身產生的必須營養(yǎng)素的培養(yǎng)基中生長。營養(yǎng)標記基因的基因產物促進了營 養(yǎng)缺陷細胞中缺失的這種必須營養(yǎng)素的合成。通過成功地表達營養(yǎng)標記基因,就不需要將 這種必須營養(yǎng)素添加到細胞生長的培養(yǎng)基中。
[0149] 優(yōu)選的標記序列是 URA3、LEU2、CAN1、CYH2、TRP1、ADE1 和 ΜΕΤ5。
[0150] 編碼"色素標記"的基因將編碼色素合成中包含的基因產物,其表達時可將細胞染 色。從而提供了成功表達色素標記的細胞的快速表型檢測。
[0151] "抗生素抗性標記"是編碼一基因產物的基因,所述基因產物能夠使細胞在存在一 濃度的抗生素下生長,其中不表達所述產物的細胞不能生長。
[0152] "抗生素敏感標記"是標記基因,其中基因產物在抗生素存在下抑制表達所述標記 的細胞的生長。
[0153] "敲入"標記理解為一核苷酸序列,其代表敲除細胞的缺失連接,從而使細胞在成 功重組后生長和發(fā)揮作用。敲除細胞是經遺傳改造的細胞,其中一個或多個基因通過定向 突變被關閉。這類缺失基因可合適地用作敲入標記。
[0154] "熒光標記"是指編碼熒光團的核苷酸序列,所述熒光團可通過發(fā)射相應的熒光信 號來檢測。在不同熒光標簽的基礎上,細胞可通過熟知的流式細胞技術容易地進行分類。
[0155] 用于差異化或重組的基因可以是非編碼序列或編碼多肽的序列或蛋白質編碼序 列或它們具有足夠序列長度用于成功的重組事件的部分或片段。更特別地,所述基因具有 3bp的最小長度,優(yōu)選至少100bp,更優(yōu)選至少300bp。
[0156] 根據(jù)本發(fā)明獲得的優(yōu)選基因嵌合體為至少3,優(yōu)選多達20000個堿基對,優(yōu)選的范 圍為300-10000bp ;特別優(yōu)選的是至少500bp或至少lOOObp的大DNA序列。
[0157] 特別地優(yōu)選的基因嵌合體的特征在于每700個堿基對至少3個互換事件,優(yōu)選地, 每700個堿基對至少4個互換事件,更優(yōu)選每700個堿基對或每500個堿基對至少5、6、7 個互換事件,包括單個核苷酸或至少1,優(yōu)選至少2、3、4、5、10、20到更多個核苷酸序列的片 段的交叉。
[0158] 根據(jù)本發(fā)明的方法,在一個單次重組的基因內不僅可獲得奇數(shù)而且還可以獲得偶 數(shù)個重組事件。這相對于減數(shù)分裂體內重組來說是一個特別的優(yōu)勢。
[0159] 重組嵌合體的復合形式可通過本發(fā)明方法獲得,在一個單分子內獲得大量不同長 度的重組序列段。此外,可獲得對應于一條模板的核苷酸的點狀取代,作為有關開放閱讀框 的框的差異性的重要來源。嵌合性和點狀交換在蛋白質水平無需是保守的。實際上,不同 極性的新氨基酸可在重組后產生,給予通過這種方法獲得的重組蛋白質新的潛力和酶蛋白 性質。
[0160] 優(yōu)選地,基因為蛋白質編碼序列或其編碼治療或工業(yè)應用的酶和蛋白質的片段部 分。在下文中,術語"多肽"包括具有至少2個氨基酸的目標肽,優(yōu)選至少3個多肽和蛋白 質。優(yōu)選選出目標多肽,但不限于酶、免疫球蛋白超家族的成員,例如抗體或抗體區(qū)域或片 段、細胞因子、疫苗抗原、生長因子和肽。
[0161] 酶催化劑由于具有高選擇性而合適地用在許多工業(yè)過程中。本發(fā)明用于差異化 的優(yōu)選的酶包括蛋白水解酶,例如枯草桿菌蛋白酶;纖維素分解酶,例如紙漿和紙張工業(yè)中 使用的細胞壁松弛酶,葡萄糖內切酶,淀粉蔗糖酶,醛縮酶,糖激酶,纖維素,淀粉酶,木聚糖 酶,葡萄糖脫氫酶和β -葡萄糖苷酶,漆酶;用在精細化合物、農用化學品和藥品合成中的 脂肪酶;酯酶,例如用于生產生物燃料。酶改進的一個優(yōu)選實例是乙醇脫氫酶的生產,其具 有改進的熱穩(wěn)定性。
[0162] 根據(jù)顯示,甚至是編碼具有復雜結構和折疊的多鏈多肽的基因也可以被重組和組 裝。優(yōu)選的實例是免疫球蛋白超家族的成員,其中免疫球蛋白和多肽具有相同的結構特征, 免疫球蛋白具有稱為免疫球蛋白域或折疊的域,包括細胞表面抗原受體、免疫系統(tǒng)的共受 體和共刺激分子、包含于呈遞至淋巴細胞的抗原呈遞中的分子、細胞粘附分子、某些細胞激 素受體和細胞內肌肉蛋白。優(yōu)選地,抗體或抗體片段,如Fab、Fv或scFv被重組和組裝。
[0163] 或者,嵌合體基因也可以是非蛋白編碼序列,例如包括在蛋白編碼序列的表達調 節(jié)中的序列,甚至是作為短或長的非編碼RNA的調節(jié)序列。這些可以是,但不限于是啟動子 序列、內含子序列、編碼用于多腺苷酸化信號的序列。
[0164] 在本發(fā)明的一個優(yōu)選實施方案中,嵌合體基因的組裝、其與宿主基因組的重組,以 及進一步,嵌合體基因的表達在單個步驟過程中進行,以產生目標重組多肽或所述宿主細 胞的代謝產物。
[0165] 根據(jù)本發(fā)明,可以采用本領域中的常規(guī)分子生物學、微生物學、和重組DNA技 術。這些技術在文獻中得到充分的解釋。參見,例如,Maniatis,F(xiàn)ritsch&Sambrook, "《Molecular Cloning:A Laboratory Manual (分子克隆:實驗室手冊)》(1982) "。
[0166] 對于體內重組,利用標準的轉染技術,使用待與基因組或其它基因重組的基因轉 染宿主。在一個合適的實施方案中,提供復制原點的DNA包括在構造體內。復制原點可合 適地由本領域技術人員進行選擇。根據(jù)基因的性質,如果序列已在基因或基因組中存在,其 自身可用作復制原點,可能不需要附加的復制原點。
[0167] 合成核酸序列或盒以及子集可以以線性多核苷酸、質粒、巨大質粒、合成或人工染 色體,例如植物、細菌、哺乳動物或酵母人工染色體的形式產生。
[0168] 當這類DNA引入到細胞內部時,細胞可被外源性或異源性DNA轉化。轉化DNA可 以被整合,也可以不被整合,所述整合即共價連接到細胞基因組內。例如在酵母和哺乳動物 細胞中,轉化DNA可保持在附加元件例如質粒上。對于真核細胞,穩(wěn)定轉化細胞是轉化DNA 已整合到染色體內使得子細胞可通過染色體復制而遺傳的細胞。這種穩(wěn)定性被真核細胞建 立包含轉化DNA的子細胞群的細胞系或克隆的能力所證實。
[0169] 可將不同的基因底物納入質粒內。質粒常為標準克隆載體,例如細菌多拷貝質粒。 底物可納入相同或不同的質粒內。通常使用具有不同類型可選標記的至少兩種不同類型的 質粒,以選擇包含至少兩種類型載體的細胞。
[0170] 包含不同基因底物的質粒開始時通過任何方法(例如,化學轉化、自然能力、電穿 孔、基因槍、包裝到噬菌體或病毒系統(tǒng)內)引入細胞內。通常,質粒以飽和濃度或接近飽和 濃度(相對于最大轉染能力)存在,以提高多于一種質粒進入相同細胞的幾率。包含不同底 物的質??赏瑫r或分多輪進行轉染。例如,在后一種方法中,細胞可用第一等分質粒、選定 并增殖的轉染體轉染,然后用第二等分質粒感染。優(yōu)選的質粒是,例如,pUC和pBluscribe 衍生物如PMXY9、pMXY12以及pMIX-LAM或YAC衍生物如YCp50。
[0171] 可通過使所有基因底物參與重組來提高進化比率。這可通過將轉染的細胞電穿孔 來達到。電穿孔的條件與傳統(tǒng)用來將外源性DNA引入細胞的那些條件相同。進化比率也可 通過融合細胞以引起質粒或染色體交換來提高。
[0172] 融合可通過化學試劑如PEG或病毒蛋白質如流感病毒血球凝集素 HSV-lgB和gD 來誘導。進化比率也可以通過使用突變體宿主細胞(例如,細菌中的Mut L,S,D,T,H,酵母 中的類似突變體以及共濟失調毛細血管擴張癥(Ataxia telangiectasia)人細胞系)來提 商。
[0173] 帶有重組基因的細胞對于所需的功能經歷篩選或選擇。例如,如果設計的底物包 含抗藥性基因,本領域技術人員會對抗藥性進行選擇。
[0174] 一般來說,在本發(fā)明的重組方法中,獲得所需表型的重組的最終產物在 0. 1% -50 %的位置上不同于起始底物,并且比率數(shù)量級超過(例如,超過10倍、100倍、 1000倍或10000倍)自然獲得突變的比率。最終的基因嵌合體產物可轉移到對于利用改組 DNA來生產的目的更理想的另一宿主中。
[0175] 在本發(fā)明優(yōu)選的方法中,利用熟知的細胞展示系統(tǒng),宿主細胞將基因嵌合體展示 在細胞表面上。通過這種雜交的差異化產生了大量變體,其可被合適地展示,以產生這些變 體的文庫。
[0176] 合適的展示方法包括酵母展示和細菌細胞展示。特別優(yōu)選的文庫是酵母表面展示 文庫,其在蛋白質工程和文庫篩選中具有許多應用。這些文庫提供用于多肽變體的合適選 擇,其相對于野生型多肽具有增強的表型性狀。優(yōu)選地,使用基于細胞的選擇方法,例如相 對于表面固定的配體。常用的選擇技術包括分析和比較獲自這種文庫的突變多肽的屬性和 野生型多肽的屬性。改善所需屬性包括改變配體多肽結合屬性的特異性或親和性,所述配 體多肽可以與受體結合。多肽親和性的成熟(maturation)是本發(fā)明的一個特別優(yōu)選實施 方案。變體的進一步所需屬性是穩(wěn)定性,例如熱穩(wěn)定性、pH穩(wěn)定性、蛋白酶穩(wěn)定性、溶解性、 目標重組多肽的產量或分泌水平。
[0177] 本發(fā)明方法獲得的文庫包括高百分比的功能性嵌合基因的潛在先導候選物,其可 在功能性0RF中表達。優(yōu)選的文庫在功能性0RF內具有至少80%的基因嵌合體,優(yōu)選至少 85%、至少90%,甚至至少95%。本發(fā)明提供的文庫特別地進一步的特征在于標記序列的 存在,表明成功雜交的百分比高。根據(jù)本發(fā)明,不僅可獲得奇數(shù)而且可獲得偶數(shù)數(shù)目的嵌合 塊(mosaic patches),其增加了所述方法產生的重組文庫中變體或文庫成員的數(shù)目。
[0178] 通常,本發(fā)明文庫包括基因嵌合體的至少10種變體,優(yōu)選至少100,更優(yōu)選至少 1000,更優(yōu)選至少1〇4,更優(yōu)選至少1〇5,更優(yōu)選至少1〇6,更優(yōu)選至少1〇 7,更優(yōu)選至少1〇8,更 優(yōu)選至少1〇9,更優(yōu)選至少1〇1(1,更優(yōu)選至少10 11,直至1〇12,甚至數(shù)目更高的變體是可行的。
[0179] 本發(fā)明的方法可提供包含至少102個表達基因嵌合體的功能性變體的獨立克隆的 文庫。本發(fā)明還提供了一池(pool)預先選定的獨立克隆,例如親和力成熟的克隆,這池克 隆優(yōu)選包括至少10個,更優(yōu)選至少100個,更優(yōu)選至少1000個,更優(yōu)選至少10000個,甚至 多于100000個獨立克隆。根據(jù)本發(fā)明,那些文庫包含預先選定的池,是選擇高親和力變體 的優(yōu)選來源。
[0180] 本發(fā)明使用的文庫優(yōu)選包括至少1〇2個文庫成員,更優(yōu)選至少1〇3個,更優(yōu)選至少 1〇4個,更優(yōu)選至少1〇5個,更優(yōu)選至少1〇6個文庫成員,更優(yōu)選至少1〇 7個,更優(yōu)選至少1〇8 個,更優(yōu)選至少1〇9個,更優(yōu)選至少101°個,更優(yōu)選至少1011個,直至1〇 12個文庫成員,優(yōu)選 獲自父本基因,以為相應的目標多肽設計新的屬性。
[0181] 優(yōu)選地,文庫為酵母文庫,以及酵母宿主細胞優(yōu)選將有生物活性的目標多肽展示 在細胞表面?;蛘撸a物可停留在細胞內,或分泌到細胞外面。酵母宿主細胞優(yōu)選選自釀 酒酵母屬、畢赤酵母屬、漢遜氏酵母屬、裂殖酵母屬、克魯維酵母屬、耶氏酵母屬和假絲酵母 屬。最優(yōu)選的是,宿主細胞為釀酒酵母。
[0182] 此處描述的實例是對本發(fā)明的說明,并不構成對本發(fā)明的限制。本發(fā)明的不同實 施方案已根據(jù)本發(fā)明進行了描述。對此處描述和闡明的技術的許多改動和變化并不背離本 發(fā)明的精神和范圍。因此,應當理解,實施例僅為說明,并非對發(fā)明范圍的限制。
[0183] 實施例
[0184] 實施例1
[0185] 描述
[0186] 在我們的實驗開始時,我們使用0ΧΑ類的β內酰胺酶基因作為待重組的底物。0ΧΑ 基因的優(yōu)點在于存在可用的不同差異性(從5-50%)的半同源基因。因此,這些基因是良 好的候選物以測試體內重組差異性的極限。這些基因也容易處理(大約800bp長)。
[0187] 圖4顯示了 0ΧΑ重組底物:基因和同源性
[0188] 表1 :0xa基因的序列一致性
[0189]
【權利要求】
1. 一種通過體細胞在體內重組產生基因嵌合體的方法,包括: a) 在單個步驟過程中 (i) 用至少一種基因 A轉化一細胞,所述基因 A與待重組的另一基因的序列同源性小于 99. 5%,所述待重組的另一基因為細胞基因組的一整體部分或存在于遺傳結構的框架中, (ii) 將兩種所述基因重組; (iii) 在目標基因組的整合位點處產生基因的基因嵌合體,其中所述至少一種基因 A 在5'末端或3'末端具有單個旁側目標序列,錨定到所述整合位點的5'或3'末端,以及 b) 選擇包含所述基因嵌合體的克隆, 其中所述細胞為敲除了至少一個DNA修復基因的真核株系。
2. 根據(jù)權利要求1所述的方法,其中所述DNA修復基因完全或短暫被敲除,優(yōu)選通過突 變,例如刪除和/或插入和/或取代一個或多個核苷酸。
3. 根據(jù)權利要求1或2所述的方法,其中所述DNA修復基因選自由RAD1和RECQ的同 源物組成的組。
4. 根據(jù)權利要求1-3中任一項所述的方法,其中所述株系選自:真菌、酵母、植物、昆蟲 和哺乳動物細胞。
5. 根據(jù)權利要求1-3中任一項所述的方法,其中所述株系選自:釀酒酵母、裂殖酵母、 釀酒酵母、假絲酵母、克魯維酵母、漢遜氏酵母、裂殖酵母、耶氏酵母、畢赤酵母、曲霉、果蠅 和隱桿線蟲屬。
6. 根據(jù)權利要求5所述的方法,其中所述株系選自:敲除了至少SGS1基因的釀酒酵 母、敲除了至少RQH1基因的粟酒裂殖酵母、敲除了至少dmblm基因的黒腹果蠅、敲除了至少 F18C5. 2和T04A11. 6基因之一的秀麗隱桿線蟲、敲除了至少AtRECQLl-4和4B基因之一的 植物,以及敲除了至少BLM、WRN、RECQL、RECQL4和RECQL5基因之一的哺乳動物細胞。
7. 根據(jù)權利要求1-6中任一項所述的方法,其中選擇標記用在基因嵌合體中以及根據(jù) 選擇標記的存在選擇克隆。
8. 根據(jù)權利要求1-7中任一項所述的方法,其中所述另一基因為細胞基因組的一部 分。
9. 根據(jù)權利要求1-8中任一項所述的方法,其中所述細胞用至少一種基因 A和至少一 種基因 B共轉化,其中所述基因 A的單個旁側目標序列錨定到所述目標基因組上整合位點 的5'末端,以及其中基因 B與錨定到整合位點3'末端的單個旁側目標序列連接。
10. 根據(jù)權利要求1-9中任一項所述的方法,其中所述細胞用至少兩種不同的基因 A1 和A2以及可選地與至少兩種不同的基因 B1和B2共轉化。
11. 根據(jù)權利要求1-10中任一項所述的方法,其中至少一種又一基因 C被共轉化,所述 基因 C具有與基因 A和/或所述另一基因的序列雜交的序列,以獲得所述又一基因 C與基 因 A和/或所述另一基因的組裝體。
12. 根據(jù)權利要求1-11中任一項所述的方法,其中所述基因 A和/或所述另一基因編 碼多肽或具有活性的多肽部分。
13. 根據(jù)權利要求11或12所述的方法,其中編碼生物化學途徑多肽的多個基因被重組 和組裝。
14. 根據(jù)權利要求1-13中任一項所述的方法,其中所述旁側目標序列為至少5bp。
15. 根據(jù)權利要求1-14中任一項所述的方法,其中所述旁側目標序列與所述整合位點 的錨定序列具有30% -99. 5%的同源性,優(yōu)選至少50%的同源性。
16. 根據(jù)權利要求1-15中任一項所述的方法,其中使用了選擇標記,所述選擇標記選 自:營養(yǎng)缺陷標記、抗生素抗性標記、熒光標記、敲入標記、激活/結合域標記和顯性隱性標 記以及著色標記。
17. 根據(jù)權利要求1-16中任一項所述的方法,其中所述基因包含在線性多核苷酸、載 體或酵母人工染色體中。
18. 根據(jù)權利要求1-17中任一項所述的方法,其中所述基因為線性多核苷酸,優(yōu)選 300-20000bp〇
19. 根據(jù)權利要求1-18中任一項所述的方法,其中具有基因內基因嵌合體的至少一個 克隆被選出。
20. 根據(jù)權利要求1-19中任一項所述的方法,其中具有基因組裝體和至少一個基因內 基因嵌合體的至少一個克隆被選出。
21. 根據(jù)權利要求1-20中任一項所述的方法,其中獲得至少3個直至20000個堿基對 的基因嵌合體,優(yōu)選每700bp至少3個互換事件。
22. 根據(jù)權利要求1-20中任一項所述的方法,其中所述基因為非編碼序列或編碼選自 以下多肽的變體:酶、抗體及其部分、細胞因子、生長因子、疫苗抗原和肽。
23. -種基因變體的細胞展示方法,包括:使用權利要求1-22中任一項所述的方法產 生大量基因嵌合體,以及將所述大量基因嵌合體展示在所述細胞的表面上以獲得嵌合體的 文庫。
24. 可根據(jù)權利要求1-22中任一項所述的方法獲得的基因嵌合體文庫,其中至少80% 的基因嵌合體包含在功能性ORF中。
25. 根據(jù)權利要求24所述的文庫,其包括大量含有所述基因變體的生物體。
26. -種生物體,其包含來自權利要求24或25任一項的文庫的基因變體。
【文檔編號】C12N15/90GK104105793SQ201280054695
【公開日】2014年10月15日 申請日期:2012年10月12日 優(yōu)先權日:2011年10月12日
【發(fā)明者】R·潘查伊坦, A·盧克 申請人:埃微杰尼克斯有限公司