根據35U.S.C.§119,本申請要求2014年2月11日提交的美國臨時申請61/938,608的權益,該申請的全部教導均通過引用并入本文。
背景技術:
大的DNA構建體的理性操作是當前合成生物學和基因組工程工作的主要挑戰(zhàn)。近年來,已經開發(fā)了多種技術來應對這一挑戰(zhàn)并提高能生成突變的特異性和速度。此外,適應性突變是進化的核心驅動因素,但其豐度和對細胞表型的相對貢獻即使在大部分充分研究的生物中也知之甚少。這在很大程度上可以歸因于與觀察和重建這些基因型以及將其存在與感興趣的表型進行關聯相關的技術挑戰(zhàn)。例如,依賴于隨機誘變的基因組編輯方法導致包含許多突變的復雜的基因型,每一個突變的相對貢獻難以解析。而且,由于缺乏關于各個突變的信息,難以確定等位基因之間的上位相互作用(epistatic interactions)。
技術實現要素:
成簇規(guī)律間隔短回文重復序列(Clustered Regularly Interspersed Short Palindromic Repeat)(CRISPR)存在于許多細菌基因組中,并已被發(fā)現在適應性細菌免疫中發(fā)揮重要作用。這些陣列的轉錄產生CRISPR RNA,它引導CRISPR/cas復合物序列特異性結合至細胞中的DNA靶標,導致基因阻抑或DNA裂解。這些復合物的特異性允許針對菌株工程化的新型體內應用。
本文描述了理性、多路操作開放閱讀框內的染色體(例如,以生成蛋白質文庫)或在染色體的任何區(qū)段中的多個基因的方法,其中使用不同的CRISPR系統。這些方法提供了比先前可用的方法更有效的組合基因組工程化。
擴展CRISPR的多路化(multiplexing)能力提出了當前的一個技術挑戰(zhàn),并且將能夠使用這些系統生成高通量格式的理性文庫。這樣的進展對于力圖重構復雜的遺傳網絡以實現最佳生產的代謝和蛋白質工程領域具有廣泛深遠的意義。
所述方法包括向細胞中引入CRISPR系統的組件,包括CRISPR關聯的核酸酶Cas9和序列特異性指導RNA(gRNA),從而利用CRISPR系統誘導序列指導的雙鏈斷裂的能力導致序列指導的雙鏈斷裂。可將CRISPR系統的組件,包括CRISPR關聯的核酸酶Cas9和序列特異性指導RNA(gRNA),引入至細胞中,在一個或多個載體如質粒上編碼。DNA重組工程盒(cassette)或編輯寡核苷酸可被理性地設計為包含位于靶基因座內的所需突變以及可被CRISPR系統識別的在靶基因座外部的常見位置中的突變。所述方法可以用于許多應用,包括改變感興趣的途徑。
在一個實施方案中,所述方法是一種基因組工程化方法,其包括:(a)向細胞中引入載體,該載體編碼:(i)編輯盒,其包含與所述細胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個核苷酸的突變(被稱為所需突變)的區(qū)域,如相對于該靶區(qū)域的、在至少一個密碼子中的至少一個核苷酸的突變,和前間隔區(qū)鄰近基序(protospacer adjacent motif)(PAM)突變;(ii)啟動子;以及(iii)至少一個指導RNA(gRNA),該gRNA包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA),從而產生包含所述載體的細胞;(b)使包含所述載體的細胞維持在表達Cas9的條件下,其中Cas9核酸酶在所述載體上編碼、在第二載體上編碼或在細胞的基因組上編碼,導致產生包含所述載體并且不包含所述PAM突變的細胞和包含所述載體和PAM突變的細胞;(c)在適合于細胞活力的條件下培養(yǎng)(b)的產物,從而產生活細胞;(d)獲得在(c)中產生的活細胞;以及(e)對在(d)中獲得的至少一個活細胞的載體的編輯寡核苷酸進行測序,并鑒定所述至少一個密碼子的突變。
在另一個實施方案中,所述方法是一種通過可追蹤CRISPR富集重組工程化的基因組工程化方法,其包括:(a)向第一細胞群體中引入載體,該載體編碼:(i)至少一個編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個核苷酸的突變的區(qū)域,如相對于該靶區(qū)域在至少一個密碼子中的至少一個核苷酸的突變,和(b)前間隔區(qū)鄰近基序(PAM)突變;(ii)至少一個啟動子;以及(iii)至少一個指導RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA),以及(b)募集Cas9核酸酶的區(qū)域(RNA),從而產生包含所述載體的第二細胞群體;(b)使所述第二細胞群體維持在表達Cas9核酸酶的條件下,其中所述Cas9核酸酶在所述載體、第二載體上或在所述第二細胞群體的細胞的基因組上編碼,導致在不包含PAM突變的細胞中的DNA裂解和這類細胞的死亡;(c)獲得在(b)中產生的活細胞;以及(d)通過對所述第二細胞群體的至少一個細胞的載體的編輯寡核苷酸進行測序,鑒定所述至少一個密碼子的突變。
以上實施方案中的任意一個可以進一步包括合成和/或獲得編輯寡核苷酸群體。任意一個實施方案可以進一步包括擴增所述編輯寡核苷酸群體。在任意一個所述實施方案中,所述載體可以進一步包含間隔區(qū)、至少兩個引發(fā)位點,或間隔區(qū)和至少兩個引發(fā)位點兩者。在一些實施方案中,所述編輯盒包含靶區(qū)域,該靶區(qū)域包含PAM突變的100個核苷酸內的至少一個密碼子的突變。
還描述了一種載體,其包含:
(i)編輯盒,其包含與細胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
進一步的實施方案為一種載體,其包含:
(i)編輯盒,其包含與細胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個密碼子中的至少一個核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
進一步的實施方案為一種載體,其包含:
(i)至少一個編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個核苷酸的突變的區(qū)域,以及(b)前間隔區(qū)鄰近基序(PAM)突變;
(ii)至少一個啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與靶區(qū)域的一部分互補的區(qū)域(RNA),以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
所述載體的另一個實施方案為一種載體,其包含:
(i)至少一個編輯盒,其包含:(a)與核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個密碼子中的至少一個核苷酸的突變的區(qū)域,以及(b)前間隔區(qū)鄰近基序(PAM)突變;
(ii)至少一個啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與靶區(qū)域的一部分互補的區(qū)域(RNA),和(b)募集Cas9核酸酶的區(qū)域(RNA)。
在任意一個所述實施方案中,所述載體可以進一步包含間隔區(qū);至少兩個引發(fā)位點;或間隔區(qū)和至少兩個引發(fā)位點。在突變是在至少一個密碼子中的至少一個核苷酸的突變的那些載體中,所述編輯盒所述突變可以在例如PAM突變的100個核苷酸內。
還描述了一種包含通過本文所述方法產生的細胞群體的文庫。細胞群體的文庫可以包含具有本文所述的任何載體的細胞。例如,細胞群體可以包含一種載體,該載體包含:
(i)編輯盒,其包含與細胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
在進一步的實施方案中,細胞群體可以包含一種載體,該載體包含:
(i)編輯盒,其包含與細胞中核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個密碼子中的至少一個核苷酸的突變(被稱為所需突變)的區(qū)域,和前間隔區(qū)鄰近基序(PAM)突變;
(ii)啟動子;以及
(iii)至少一個指導RNA(gRNA),其包含:(a)與所述靶區(qū)域的一部分互補的區(qū)域(RNA);以及(b)募集Cas9核酸酶的區(qū)域(RNA)。
在進一步的實施方案中,所述方法是一種CRISPR輔助的理性蛋白質工程化(組合基因組工程化)方法,該方法包括:
(a)通過將以下物質引入至第一細胞群體中(例如通過共轉化)來構建包含重組DNA如重組染色體或質粒中的重組DNA的供體文庫:(i)一個或多個編輯寡核苷酸,如理性設計的寡核苷酸,其使第一單個前間隔區(qū)鄰近基序(PAM)的缺失與鄰近PAM的基因(鄰近基因)中的至少一個密碼子的突變偶聯,和(ii)指導RNA(gRNA),其靶向位于染色體的開放閱讀框的5'側的核苷酸序列,從而產生包含第一細胞群體的供體文庫,該第一細胞群體包含具有靶向密碼子突變的重組染色體;
(b)例如通過重組染色體的PCR擴增來擴增在(a)中構建的供體文庫,其使用來自所述編輯寡核苷酸的合成特征,并同時在所述基因的3'末端處并入第二PAM缺失(終點(destination)PAM缺失),從而使靶向密碼子突變與終點PAM缺失直接偶聯如共價偶聯,并產生攜帶所述終點PAM缺失和靶向密碼子突變的重獲(retrieved)的供體文庫;以及
(c)將攜帶終點PAM缺失和靶向密碼子突變的供體文庫與終點gRNA質粒引入(例如,共轉化)至第二細胞群體中,從而產生包含靶向密碼子突變的終點文庫,該第二細胞群體通常為稚細胞群體。
所述第一細胞群體和所述第二細胞群體(例如,稚細胞群體)通常是這樣的群體:其中細胞全部為相同的類型,并且可以是原核生物或真核生物,例如但不限于細菌、哺乳動物細胞、植物細胞、昆蟲細胞。
在一些實施方案中,所述方法進一步包括使所述終點文庫維持在產生蛋白質的條件下。
在一些實施方案中,所述第一細胞表達具有Cas9核酸酶活性的多肽。在一些實施方案中,在誘導型啟動子的控制下表達具有Cas9核酸酶活性的多肽。
在一些實施方案中,所述編輯寡核苷酸與存在于所述第一細胞中的(一個、一個或多個、至少一個)靶核酸互補。在一些實施方案中,所述編輯寡核苷酸靶向所述第一細胞中的多于一個靶位點或基因座。在一些實施方案中,所述編輯寡核苷酸的核酸序列[所需密碼子]包含相對于靶核酸的一個或多個置換、缺失、插入,或置換、缺失和插入的任意組合。在一些實施方案中,理性地設計所述編輯寡核苷酸;在進一步的實施方案中,通過隨機誘變或通過使用簡并引物寡核苷酸產生所述編輯寡核苷酸。在一些實施方案中,所述編輯寡核苷酸來源于核酸的集合(文庫)。
在一些實施方案中,所述gRNA在質粒上編碼。在一些實施方案中,通過轉化,例如通過編輯寡核苷酸和指導(g)RNA的共轉化,將所述編輯寡核苷酸和所述gRNA引入至所述第一細胞中。在一些實施方案中,將所述編輯寡核苷酸和所述gRNA依次引入至所述第一細胞中。在其他實施方案中,將所述編輯寡核苷酸和所述gRNA同時引入至所述第一細胞中。
在一些實施方案中,重獲供體文庫進一步包括(a)篩選細胞以供并入所述編輯寡核苷酸,和(b)選擇被確認已并入所述編輯寡核苷酸的細胞。在一些實施方案中,重獲供體文庫進一步包括處理重獲的供體文庫。
在一些實施方案中,所述終點細胞/稚細胞表達具有Cas9核酸酶活性的多肽。在一些實施方案中,在誘導型啟動子的控制下表達具有Cas9核酸酶活性的多肽。
還描述了一種CRISPR輔助的理性蛋白質工程化方法,其包括:
(a)將(i)包含編輯寡核苷酸的合成dsDNA編輯盒和(ii)表達靶向正好在感興趣的基因上游的基因組序列的指導RNA(gRNA)的載體,在發(fā)生所述編輯寡核苷酸的多路重組工程化和通過gRNA的選擇性富集的條件下引入(例如,共轉化)至第一細胞群體中,從而產生供體文庫;
(b)擴增具有缺失與感興趣的基因的3'端鄰近的前間隔區(qū)鄰近基序(PAM)(終點PAM)的寡核苷酸的供體文庫,從而產生擴增的供體文庫,該擴增的供體文庫包含已缺失終點PAM(具有3’PAM缺失)的dsDNA編輯盒、理性密碼子突變和P1位點;
(c)用酶如限制酶(例如,BsaI)處理所述擴增的供體文庫以去除P1位點;以及
(d)用在(c)中處理的擴增的供體文庫和終點gRNA共轉化稚細胞群體,從而產生共轉化細胞群體,該共轉化細胞群體包含已經缺失終點PAM(具有3'PAM缺失)的dsDNA編輯盒、理性密碼子突變和終點gRNA。
在所描述的全部實施方案中,突變可以是所需的任何類型,如一個或多個插入、缺失、置換,或者前述突變中兩個或三個的任意組合(例如,插入和缺失;插入和置換;缺失和置換;置換和插入;插入、缺失和置換)。插入、缺失和置換可以是任何數目的核苷酸的插入、缺失和置換。它們可以在密碼子(編碼區(qū))中和/或在非編碼區(qū)中。
附圖說明
圖1A和1B顯示了CRISPR輔助的理性蛋白質工程化(CARPE)的概覽。圖1A顯示了供體文庫構建的示意圖。使合成dsDNA編輯盒與表達靶向在感興趣的基因上游的基因組序列的指導RNA(gRNA)的載體共轉化。該共轉化經由編輯寡核苷酸的多路重組工程化生成供體文庫,該編輯寡核苷酸通過gRNA選擇性地富集。隨后使用使得與所述基因的3'端鄰近的PAM(終點PAM)發(fā)生突變(缺失)的寡核苷酸擴增供體文庫。圖1B顯示了最終蛋白質文庫生成的示意圖。用BsaI處理供體文庫以去除P1位點,并將具有3’PAM缺失和理性密碼子突變的dsDNA盒的文庫與終點gRNA共轉化以生成最終蛋白質文庫。
圖2顯示了來自galK供體文庫構建產生的克隆的DNA序列,證實了以高效率并入編輯寡核苷酸的P1特征以及在靶向密碼子位置(下劃線)處的突變。P1的序列由SEQ ID NO:1提供。
圖3A顯示了引物設計。圖3B顯示了相對于引物數目的預期密度。
圖4A顯示了接頭與構建體結果。圖4B顯示了與基于乳液PCR的追蹤相關的10個編輯(edit)。
圖5是用于代謝工程化的理性蛋白質編輯的示意圖。
圖6是生成CRISPR富集的理性蛋白質文庫的示意圖。
圖7是CARPE的設置和證明的示意圖。
圖8顯示了迭代(iterative)CRISPR共選擇的策略。
圖9顯示了使用CARPE的多路蛋白質工程化的策略。
圖10顯示了使用CARPE構建galK供體文庫。
圖11A顯示了使用CARPE的基于CRISPR的多路編輯的示意圖。圖11B顯示了使用通過可追蹤CRISPR富集重組工程化的基因組工程化(GEn-TraCER),基于CRISPR的多路編輯的示意圖。
圖12顯示了代表性的GEn-TraCER載體(構建體),其包含用于編輯galK的密碼子24的編輯盒、啟動子和間隔區(qū)。
圖13顯示了使用GEn-TraCER的galK編輯的結果。上面的圖顯示了來自已經用galK密碼子24編輯GEn-TraCER載體轉化的細胞的染色體和載體(質粒)的DNA測序結果,其表明該載體上的編輯盒(寡核苷酸)可以作為允許高效追蹤所需基因組編輯(突變)的“反式條形碼”被測序。下面的圖示出了細胞的DNA測序色譜,其顯示出未編輯的野生型表型(紅色)。該方法允許鑒定具有既攜帶未編輯的野生型等位基因又攜帶編輯的/突變的等位基因的多個染色體的細胞。
圖14A-14C顯示了GEn-TraCER的示意圖。圖14A顯示了設計組件的概覽。GEn-TraCER盒含有指導RNA(gRNA)序列,以靶向細胞基因組中的特定位點并引起dsDNA裂解。與靶區(qū)域互補的同源性區(qū)域使得PAM和其他附近的所需位點發(fā)生突變。將經歷重組的細胞選擇性地富集為高豐度。對載體中的GEn-TraCER編輯盒的測序使得能夠追蹤基因組編輯/突變。圖14B顯示了針對密碼子145處的大腸桿菌galK基因的示例性編輯盒設計。用最近的可用PAM突變刪除PAM,該突變可以針對在最近的可用PAM位置處的同義變化而進行。這實現了在PAM缺失位點處具有1-2個核苷酸的“沉默疤痕(silent scar)”的誘變。圖14C顯示了可以使用基于陣列的合成方法合成GEn-TraCER盒,從而實現至少104-106個盒的平行合成,以用于系統靶向和同時評價在全基因組規(guī)模下對數以千計的突變的適合性。
圖15A顯示了GEn-TraCER載體的概況。圖15B顯示了用于在大腸桿菌galK基因中生成Y145*突變的代表性GEn-TraCER的一部分,其中該PAM突變和突變的密碼子相隔17個核苷酸。代表性GEn-TraCER的該部分的核酸序列由SEQ ID NO:28提供,而反向互補序列由SEQ ID NO:33提供。
圖16A-16C顯示了GEn-TraCER設計的對照。圖16A顯示了編輯盒的大小對所述方法的效率的影響。圖16B顯示了PAM突變/缺失與所需突變之間的距離對所述方法的效率的影響。圖16C顯示了MutS系統的存在與否對所述方法的效率的影響。
具體實施方式
細菌和古細菌CRISPR系統已成為用于精確基因組編輯的強大的新工具。已經在體外特別好地表征了來自釀膿鏈球菌(Streptococcus pyogenes)的II型CRISPR系統,并且已經建立了簡單的設計規(guī)則以便對其雙鏈DNA(dsDNA)結合活性重編程序(Jinek等人Science(2012)337(6096):816-821)。CRISPR介導的基因組編輯方法在很多種生物中的使用在文獻中快速積累,該生物包括細菌(Cong等人Science(2013)339(6121):819-823)、釀酒酵母(DiCarlo等人Nucleic Acids Res.(2013)41:4336-4343)、秀麗隱桿線蟲(Waaijers等人Genetics(2013)195:1187-1191)和各種哺乳動物細胞系(Cong等人Science(2013)339(6121):819-823;Wang等人Cell(2013)153:910-918)。像其他基于內切核酸酶的基因組編輯技術,如鋅指核酸酶(ZFN)、歸巢核酸酶和TALENS一樣,CRISPR系統介導精確基因組編輯的能力源自于靶標識別的高度特異性的性質。例如,來自大腸桿菌和釀膿鏈球菌系統的I型CRISPR系統要求CRISPR RNA(crRNA)與14-15堿基對識別靶標之間有完全的互補性,這表明自然地采用了CRISPR系統的免疫功能(Jinek等人Science(2012)337(6096):816-821;Brouns等人Science(2008)321:960-964;Semenova等人PNAS(2011)108:10098-10103)。
本文描述了基因組編輯方法,其采用內切核酸酶,如由cas9基因編碼的Cas9核酸酶,以在DNA如基因組DNA中進行定向基因組進化/產生變化(缺失、置換、添加)。cas9基因可以獲自任何來源,如細菌,如細菌釀膿鏈球菌。cas9的核酸序列和/或Cas9的氨基酸序列可以相對于天然存在的cas9和/或Cas9的序列發(fā)生突變;突變可以是例如一個或多個插入、缺失、置換或前述的兩個或三個的任意組合。在這樣的實施方案中,所得到的突變的Cas9可以具有相對于天然存在的Cas9增強或降低的核酸酶活性。
圖1A、1B和11A顯示了被稱為CRISPR輔助的理性蛋白質工程化(CARPE)的CRISPR介導的基因組編輯方法。CARPE是一個兩階段的構建過程,它依賴于將來自單鏈DNA(ssDNA)或雙鏈DNA(dsDNA)編輯盒的定向突變直接并入基因組中的“供體”和“終點”文庫的生成。在供體構建的第一階段(圖1A)中,將理性設計的編輯寡核苷酸與指導RNA(gRNA)共轉化至細胞中,該gRNA雜交至/靶向靶DNA序列,如位于開放閱讀框的5'側的序列或其他感興趣的序列。CARPE的關鍵創(chuàng)新是編輯寡核苷酸的設計,它使單個前間隔區(qū)鄰近基序(PAM)的缺失或突變與鄰近基因中的一個或多個所需密碼子的突變偶聯,從而使得能夠在單一轉化中生成整個供體文庫。隨后使用來自編輯寡核苷酸的合成特征,通過擴增重組染色體,例如通過PCR反應,來重獲供體文庫;同時在所述基因的3'末端處并入第二PAM缺失或突變。因此,該方法將密碼子靶向突變與PAM缺失直接共價偶聯。在CARPE的第二階段(圖1B)中,將攜帶終點PAM缺失/突變和靶向突變(一個或多個核苷酸如在一個或多個密碼子中的一個或多個核苷酸的所需突變)的PCR擴增的供體文庫與終點gRNA載體共轉化至稚細胞中,以生成表達理性設計的蛋白質文庫的細胞群體。
在CRISPR系統中,CRISPR反式激活(tracrRNA)和間隔區(qū)RNA(crRNA)引導靶區(qū)域的選擇。如本文所用的,靶區(qū)域是指細胞或細胞群體的核酸中需要至少一個核苷酸的突變如在至少一個密碼子(一個或多個密碼子)中的至少一個核苷酸的突變的任何基因座。靶區(qū)域可以是例如基因組基因座(靶基因組序列)或染色體外的基因座。tracrRNA和crRNA可被表達為單一的嵌合RNA分子,其被稱為單一指導RNA、指導RNA或gRNA。gRNA的核酸序列包含第一核酸序列(也被稱為第一區(qū)域,它與靶區(qū)域的區(qū)域互補)和第二核酸序列(也被稱為第二區(qū)域,它形成莖環(huán)結構并用來將Cas9募集至靶區(qū)域)。在一些實施方案中,gRNA的第一區(qū)域與在靶基因組序列上游的區(qū)域互補。在一些實施方案中,gRNA的第一區(qū)域與靶區(qū)域的至少一部分互補。gRNA的第一區(qū)域可以與靶基因組序列完全互補(100%互補)或包含一個或多個錯配,條件是它與靶基因組序列充分互補以特異性地雜交/引導和募集Cas9。在一些實施方案中,gRNA的第一區(qū)域為至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29個或至少30個核苷酸的長度。在一些實施方案中,gRNA的第一區(qū)域為至少20個核苷酸的長度。在一些實施方案中,由第二核酸序列形成的莖環(huán)結構為至少50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、7、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100個核苷酸的長度。在特定的實施方案中,該莖環(huán)結構為80至90或82至85個核苷酸的長度,并且在進一步的特定實施方案中,形成莖環(huán)結構的gRNA的第二區(qū)域為83個核苷酸的長度。
在一些實施方案中,使用CARPE方法引入至第一細胞中的(供體文庫的)gRNA的序列與引入至第二細胞/稚細胞中的(終點文庫的)gRNA的序列相同。在一些實施方案中,將多于一個gRNA引入至第一細胞群體和/或第二細胞群體。在一些實施方案中,所述多于一個gRNA分子包含與多于一個靶區(qū)域互補的第一核酸序列。
在CARPE方法中,用于在所述方法中使用的也被稱為編輯寡核苷酸的雙鏈DNA盒可以獲自或來源于許多來源。例如,在一些實施方案中,dsDNA盒來源于已經通過非同源性隨機重組(NRR)多樣化的核酸文庫;這樣的文庫被稱為NRR文庫。在一些實施方案中,例如通過基于陣列的合成來合成所述編輯寡核苷酸。所述編輯寡核苷酸的長度可能依賴于獲得該編輯寡核苷酸所使用的方法。在一些實施方案中,所述編輯寡核苷酸為約50-200個核苷酸、75-150個核苷酸或80-120個核苷酸的長度。
編輯寡核苷酸包含(a)與細胞的核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的至少一個密碼子的突變(被稱為所需突變)的區(qū)域,和(b)前間隔區(qū)鄰近基序(PAM)突變。該PAM突變可以是一個或多個核苷酸的任何插入、缺失或置換,其使PAM的序列發(fā)生突變,使得其不再被CRISPR系統識別。包含這樣的PAM突變的細胞可以被稱為對CRISPR介導的殺傷“有免疫力”。相對于靶區(qū)域的序列的所需突變可以是在靶區(qū)域的至少一個密碼子處的一個或多個核苷酸的插入、缺失和/或置換。
僅為了說明的目的,以下參考細菌基因描述了CARPE方法。所述方法可以應用于任何感興趣的基因,包括來自包括細菌和古細菌在內的任何原核生物或來自任何真核生物的基因,包括酵母和哺乳動物(包括人)基因。對大腸桿菌基因組中的galK基因進行CARPE方法,這部分地是由于針對該基因的活性測定的可用性。使用BW23115親代菌株和pSIM5載體(Datta等人Gene(2008)379:109-115)進行所述方法以介導重組工程化。將cas9基因克隆至pBTBX-2骨架中,處于pBAD啟動子的控制下,以允許通過添加阿拉伯糖控制裂解活性。使用來自NNK文庫的dsDNA盒對選擇性并入合成dsDNA盒(127bp)的能力進行評估,該NNK文庫由簡并引物和/或由作為27,000個成員的文庫的一部分合成的理性設計的寡核苷酸(oligo)經由微陣列技術構建。在這兩種情況下,將寡核苷酸設計為使galK基因產物的活性位點殘基發(fā)生突變。基于用針對galK基因座的引物獲得的擴增子大小的變化,驗證了供體菌株文庫的高度有效的恢復(recovery)。對來自NRR文庫的這些菌落PCR產物的測序表明,來自dsDNA盒的合成引發(fā)位點(P1)以約90-100%的效率并入。這表明可以在不依靠通常在其他基于重組工程化的編輯方法中使用的易錯mutS敲除菌株(Costantino等人PNAS(2003)100:15748-15753;Wang等人Nature(2009)460:894-898)的情況下,以高效率生成這些文庫。密碼子突變的效率有所降低(約20%),這可能是由于在等位基因替換過程中的mutS校正。終點文庫中克隆的初步評估表明,當構建的兩個階段都在mutS+背景下進行時,最終密碼子編輯效率約為10%。
使用不將PAM與密碼子突變共價連接而是依賴于它們在復制過程中彼此的接近性的替代方案,完成與其他近來發(fā)表的可共選擇編輯方案的比較(Wang等人Nat.Methods(2012)9:591-593)。在這些非共價的實驗中,使用與上述相同的編輯寡核苷酸,并使用靶向相同供體/終點PAM位點的ssDNA寡核苷酸努力針對其插入進行共選擇。產生的突變體的菌落篩選揭示了PAM突變體的恢復的高效率。然而,對于dsDNA編輯盒的插入似乎沒有強大的共選擇。這可能是由于PAM缺失寡核苷酸與生成相當大的染色體缺失的編輯盒在相對重組工程化效率上的巨大差異。
可以例如通過在轉移到野生型供體菌株之前在mutS缺乏的菌株中進行供體構建以試圖防止在供體構建階段中突變的損失,來評估改善CARPE方法的最終編輯效率的能力。此外,可以例如通過對包括dxs、metA和folA在內的多個必需基因使用CARPE來評估CARPE方法的通用性。已經使用描述的gRNA設計策略有效地靶向必需基因。結果還表明,盡管在供體文庫創(chuàng)建過程中發(fā)生了基因破壞,但可以在重組工程化后1-3小時內有效地構建并重獲供體文庫。
本文還提供了使用CRISPR介導的系統的可追蹤精確基因組編輯方法,其被稱為通過可追蹤CRISPR富集重組工程化的基因組工程化(GEn-TraCER)。GEn-TraCER方法使用編碼編輯盒和gRNA的單個載體獲得高效率的編輯/突變。當與平行DNA合成如基于陣列的DNA合成一起使用時,GEN-TraCER提供了數以千計的精確編輯/突變的單步生成,并使得通過對載體上的編輯盒進行測序而不是通過對細胞的基因組(基因組DNA)進行測序來定位突變成為可能。所述方法在蛋白質和基因組工程化應用方面以及對于突變如實驗室進化實驗中鑒定的突變的重建具有廣泛應用。
GEn-TraCER方法和載體將包含所需突變和PAM突變的編輯盒與編碼單一載體上的gRNA的基因組合起來,這使得在單一反應中生成突變的文庫成為可能。如圖11B所示,所述方法包括將包含含有所需突變和PAM突變的編輯盒的載體引入至細胞或細胞群體中。在一些實施方案中,引入載體的細胞還編碼Cas9。在一些實施方案中,隨后將編碼Cas9的基因引入至細胞或細胞群體中。在該細胞或細胞群體中包括Cas9和gRNA的CRISPR系統的表達得到激活;gRNA將Cas9募集至靶區(qū)域,在靶區(qū)域中發(fā)生dsDNA裂解。不希望受到任何特定理論的束縛,與靶區(qū)域互補的編輯盒的同源區(qū)域使得PAM和靶區(qū)域的一個或多個密碼子發(fā)生突變。該細胞群體中沒有整合PAM突變的細胞經歷由Cas9介導的dsDNA裂解引起的未編輯的細胞死亡。該細胞群體中整合了PAM突變的細胞不經歷細胞死亡;它們保持存活并且選擇性地富集為高豐度。獲得活細胞并提供靶向突變的文庫。
使用GEn-TraCER的可追蹤基因組編輯方法包括:(a)將編碼至少一個編輯盒、啟動子和至少一個gRNA的載體引入至細胞或細胞群體中,從而產生包含該載體的細胞或細胞群體(第二細胞群體);(b)使第二細胞群體維持在表達Cas9的條件下,其中Cas9核酸酶在該載體、第二載體上或在第二細胞群體的細胞的基因組上編碼,導致第二細胞群體中不包含PAM突變的細胞的DNA裂解和死亡,而第二細胞群體中包含PAM突變的細胞存活;(c)獲得活細胞;以及(d)對第二細胞群體的至少一個細胞中的載體的編輯盒進行測序,以鑒定至少一個密碼子的突變。
在一些實施方案中,還將編碼cas9的單獨載體引入至細胞或細胞群體中。可使用本領域已知的任何方法或技術將載體引入至細胞或細胞群體中。例如,可以通過標準方案如轉化(包括化學轉化和電穿孔)、轉導和粒子轟擊引入載體。
編輯盒包含(a)區(qū)域,該區(qū)域識別(雜交)細胞或細胞群體中核酸的靶區(qū)域,與該細胞的核酸的靶區(qū)域同源并且包含相對于該靶區(qū)域的、在至少一個密碼子中的至少一個核苷酸的突變(被稱為所需突變),和(b)前間隔區(qū)鄰近基序(PAM)突變。該PAM突變可以是一個或多個核苷酸的任何插入、缺失或置換,其使PAM的序列發(fā)生突變,使得突變的PAM(PAM突變)不被CRISPR系統識別。包含如PAM突變的細胞可以被稱為對CRISPR介導的殺傷“有免疫力”。相對于靶區(qū)域的序列的所需突變可以是在靶區(qū)域的至少一個密碼子處的一個或多個核苷酸的插入、缺失和/或置換。在一些實施方案中,所述編輯盒上PAM突變與所需突變之間的距離為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個核苷酸。在一些實施方案中,PAM突變位于距離編輯盒的末端至少9個核苷酸的位置處。在一些實施方案中,所需突變位于距離編輯盒的末端至少9個核苷酸的位置處。
在一些實施方案中,相對于靶區(qū)域的序列的所需突變?yōu)楹怂嵝蛄械牟迦?。插入靶區(qū)域中的核酸序列可以為任意長度。在一些實施方案中,插入的核酸序列為至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或至少2000個核苷酸的長度。在核酸序列插入靶區(qū)域中的實施方案中,所述編輯盒包含長度為至少30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59或至少60個核苷酸并且與靶區(qū)域同源的區(qū)域。
術語“GEn-TraCER盒”可以用來指編輯盒、啟動子、間隔區(qū)序列和編碼gRNA的基因的至少一部分。在一些實施方案中,在GEn-TraCER盒上編碼gRNA的基因的部分編碼gRNA中與靶區(qū)域互補的部分。在一些實施方案中,gRNA中與靶區(qū)域互補的部分為至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或至少30個核苷酸的長度。在一些實施方案中,gRNA中與靶區(qū)域互補的部分為24個核苷酸的長度。在一些實施方案中,GEn-TraCER盒進一步包含至少兩個引發(fā)位點。在一些實施方案中,所述引發(fā)位點可以用于通過例如PCR來擴增GEn-TraCER盒。在一些實施方案中,使用gRNA中與靶區(qū)域互補的部分作為引發(fā)位點。
在GEn-TraCER方法中,用于在所述方法中使用的編輯盒和GEn-TraCER盒可以獲自或來源于許多來源。例如,在一些實施方案中,例如通過基于陣列的合成來合成所述編輯盒。在一些實施方案中,例如通過基于陣列的合成來合成所述GEn-TraCER盒。所述編輯盒和/或GEn-TraCER盒的長度可依賴于獲得編輯盒和/或GEn-TraCER盒所使用的方法。在一些實施方案中,所述編輯盒為約50-300個核苷酸、75-200個核苷酸或80-120個核苷酸的長度。在一些實施方案中,所述GEn-TraCER盒為約50-300個核苷酸、75-200個核苷酸或80-120個核苷酸的長度。
在一些實施方案中,所述方法還包括例如通過基于陣列的合成獲得GEn-TraCER盒以及構建所述載體。構建載體的方法是本領域普通技術人員已知的,并且可以包括將GEn-TraCER盒連接至載體中。在一些實施方案中,在構建載體之前例如通過PCR來擴增GEn-TraCER盒或GEn-TraCER盒的亞組(庫)。
在表達Cas9的條件下維持或培養(yǎng)包含所述載體并且還編碼Cas9的細胞或細胞群體??梢钥刂艭as9表達。本文描述的方法包括使細胞維持在Cas9表達被激活的條件下,這導致產生Cas9。表達Cas9的具體條件將取決于諸如用來調節(jié)Cas9表達的啟動子的性質等因素。在一些實施方案中,在誘導物分子如阿拉伯糖的存在下,Cas9表達受到誘導。當包含編碼Cas9的DNA的細胞或細胞群體在誘導物分子的存在下時,發(fā)生Cas9的表達。在一些實施方案中,在阻抑物分子的存在下,Cas9表達受到抑制。當包含編碼Cas9的DNA的細胞或細胞群體在不存在阻抑Cas9表達的分子時,發(fā)生Cas9的表達。
從經歷由Cas9介導的殺傷引起的未編輯的細胞死亡的細胞中獲得或分離出保持存活的細胞群體的細胞;這可以通過例如將所述細胞群體涂布在培養(yǎng)表面上以允許活細胞生長(該活細胞隨后可用于評估)來完成。
使用GEn-TraCER方法,通過對所述群體的活細胞(整合了PAM突變的細胞)中載體上的編輯盒進行測序,與PAM突變偶聯的所需突變是可追蹤的。這允許在不需要對細胞的基因組進行測序的情況下容易地鑒定突變。所述方法包括對編輯盒進行測序以鑒定一個或多個密碼子的突變。可以對作為所述載體的組件的編輯盒進行測序,或在從所述載體中分離出編輯盒和任選擴增之后進行測序??梢允褂帽绢I域已知的任何測序方法如通過Sanger測序進行測序。
本文所述的方法可以在CRISPR系統可起作用(例如,靶向和裂解DNA)的任何類型的細胞(包括原核細胞和真核細胞)中進行。在一些實施方案中,該細胞是細菌細胞,如埃希氏菌屬的種(Escherichia spp.)(例如,大腸桿菌)。在其他實施方案中,該細胞是真菌細胞,如酵母細胞,例如,酵母屬的種(Saccharomyces spp.)。在其他實施方案中,該細胞是藻細胞、植物細胞、昆蟲細胞或哺乳動物細胞,包括人細胞。
“載體”是包含所需序列或有待遞送至細胞或在細胞中表達的序列的多種核酸中的任意一種。例如,可以通過限制和連接或通過重組將所需序列包含在載體中。載體通常由DNA組成,盡管RNA載體也是可用的。載體包括但不限于:質粒、粘粒(fosmid)、噬菌粒、病毒基因組和人工染色體。
在GEN-TraCER方法中有用的載體包含至少一個如本文所述的編輯盒、啟動子和至少一個編碼gRNA的基因。在一些實施方案中,載體上包含多于一個編輯盒(例如2、3、4、5、6、7、8、9、10個或更多個編輯盒)。在一些實施方案中,所述多于一個編輯盒與不同的靶區(qū)域同源(例如,存在不同的編輯盒,每一個編輯盒與不同的靶區(qū)域同源)??商娲鼗虺酥?,所述載體可以包含編碼多于一個gRNA(例如,2、3、4、5、6、7、8、9、10個或更多個gRNA)的多于一個基因。在一些實施方案中,所述多于一個gRNA含有與不同靶區(qū)域的一部分互補的區(qū)域(例如,存在不同的gRNA,每一個gRNA與不同靶區(qū)域的一部分互補)。
在一些實施方案中,將包含至少一個編輯盒、啟動子和編碼gRNA的一部分的基因的GEn-TraCER盒連接至編碼gRNA的另一部分的載體中。經連接,來自GEn-TraCER盒的gRNA的部分與gRNA的另一部分連接并形成功能性gRNA。
啟動子和編碼gRNA的基因可操作地連接。在一些實施方案中,所述方法包括引入編碼Cas9的第二載體。在這樣的實施方案中,該載體可以進一步包含與編碼Cas9的基因可操作地連接的一個或多個啟動子。如本文所用的,“可操作地”連接意指啟動子影響或調節(jié)諸如編碼gRNA的基因或編碼Cas9的基因等基因的編碼DNA的轉錄。該啟動子可以是天然啟動子(在引入載體的細胞中存在的啟動子)。在一些實施方案中,該啟動子是誘導型或阻抑型啟動子(調節(jié)該啟動子以允許諸如編碼gRNA的基因或編碼Cas9的基因等基因的誘導型或阻抑型轉錄),如通過分子(例如,誘導物或阻抑物)的存在或不存在調節(jié)的啟動子。表達gRNA所需的啟動子的性質可以根據物種或細胞類型而變化,并且將被本領域普通技術人員所認識到。
在一些實施方案中,所述方法包括在引入包含至少一個如本文所述的編輯盒、啟動子和至少一個gRNA的載體之前或同時,將編碼Cas9的單獨載體引入至細胞或細胞群體中。在一些實施方案中,將編碼Cas9的基因整合到細胞或細胞群體的基因組中??稍谝氚辽僖粋€如本文所述的編輯盒、啟動子和至少一個gRNA的載體之前,或在引入包含至少一個如本文所述的編輯盒、啟動子和至少一個gRNA的載體之后,將編碼Cas9的DNA整合到細胞基因組中?;蛘?,核酸分子,如編碼Cas9的DNA,可以由整合到基因組中的DNA表達。在一些實施方案中,將編碼Cas9的基因整合到細胞的基因組中。
在本文所述的GEn-TraCER方法中有用的載體可以進一步包含間隔區(qū)序列、兩個或更多個引發(fā)位點,或者間隔區(qū)序列和兩個或更多個引發(fā)位點兩者。在一些實施方案中,位于GEn-TraCER盒側翼的引發(fā)位點的存在允許編輯盒、啟動子和gRNA核酸序列的擴增。
實施例
實施例1:使用CARPE方法編輯galK
對大腸桿菌基因組中的半乳糖激酶基因galK實施CARPE方法;有許多試驗可用來評估基因產物的活性。使用大腸桿菌BW23115親代菌株和pSIM5載體進行實驗(Datta等人.Gene(2008)379:109-115)以介導重組工程化。將編碼Cas9的基因克隆至pBTBX-2骨架中,處于pBAD啟動子的控制下,以允許通過向培養(yǎng)基中添加阿拉伯糖來控制Cas9裂解活性。
首先,測試選擇性地并入合成dsDNA盒(127bp)的能力。該合成dsDNA盒來源于NNR文庫,該NNR文庫由簡并引物或由作為27,000個成員的文庫的一部分合成的理性設計的寡核苷酸經由微陣列技術構建。在這兩種情況下,將寡核苷酸設計為使galK基因產物的活性位點殘基發(fā)生突變,以及含有合成引發(fā)位點P1(SEQ ID NO:1)?;谑褂冕槍alK基因座的引物通過菌落PCR獲得的擴增子大小的變化,驗證了供體菌株文庫的高度有效的恢復。對來自NNR文庫的菌落PCR產物的測序表明,來自dsDNA盒的合成引發(fā)位點(P1)以約90-100%的效率并入(圖2)。這一驚人且出乎意料的結果表明,可以在不依靠通常在其他基于重組工程化的編輯方法中使用的易錯mutS缺乏的菌株(Costantino等人PNAS(2003)100:15748-15753;Wang等人Nature(2009)460:894-898)的情況下,以高效率生成文庫。然而,密碼子突變的效率有所降低(約20%),這可能是由于在等位基因替換過程中的mutS校正。在此項工作中,當構建的兩個階段都在mutS+背景下進行時,最終密碼子編輯效率約為10%。
為了提高CARPE方法的最終編輯效率和通用性,可以在轉移到mutS+供體菌株之前在mutS缺乏的菌株中進行供體構建,以試圖防止在供體構建階段中突變的損失。
實施例2:使用CARPE方法靶向必需基因
為了測試CARPE方法的通用性,如上所述對包括dxs、metA和folA在內的多種必需基因使用該方法??梢允褂胓RNA設計策略靶向必需基因(圖3)。
來自靶向dxs基因的CARPE實驗的數據也表明,盡管在供體文庫創(chuàng)建過程中發(fā)生基因破壞,但在重組工程化后1-3小時內有效構建并重獲供體文庫是可能的。
實施例3:使用CARPE方法調整異戊烯醇的生產
經由細菌生產尋求用于工業(yè)生產的更好的生物燃料,需要進行現有技術基因組設計、工程化和篩選所需產物的能力。先前我們證明了單獨改變大腸桿菌基因組中每個基因的表達水平的能力(Warner等人Nat.Biotechnol(2010)28:856-862)。該方法(被稱為可追蹤多路重組工程化(TRMR))產生了約8000個基因組修飾的細胞的文庫(約4000個過表達的基因和約4000個敲減的基因)。隨后在不同條件下篩查該文庫,這使得能夠更深入地了解基因產物的活性并在這些選擇下產生表現更好的菌株。TRMR允許改變兩個水平的蛋白質表達(過表達的和敲減的)但不能實現開放閱讀框(ORF)的修飾。在此,我們的目的是產生ORF修飾的大文庫,并對整個代謝途徑進行工程化以最優(yōu)化生物燃料的生產。
產生這樣的理性設計(相比于隨機誘變)的文庫的主要困難是將所需突變插入靶細胞中的效率。重組工程化——在大腸桿菌中進行基因組修飾的典型方法——使用來自λ噬菌體的重組基因來促進外來DNA向宿主基因組中的插入。然而,該方法具有低效率,并且可通過添加抗生素抗性基因隨后選擇(如在TRMR中)或通過遞歸誘導重組事件(即,通過MAGE(Wang等人Nature(2008)460:894-898))來克服。本文所述的CARPE方法提高了重組工程化效率,包括使用CRISPR系統從群體中去除所有非重組細胞。CRISPR是近來發(fā)現的細菌和古細菌針對入侵噬菌體和質粒的基于RNA的適應性防御機制(Bhaya等人Ann.Rev.of Genetics(2011)45:273-297)。該系統經歷巨大工程化,以使得能夠使用兩個質粒來允許序列引導的雙鏈斷裂,一個質粒編碼CRISPR相關的核酸酶Cas9,而第二個質粒編碼序列特異性指導RNA(gRNA),gRNA將Cas9引導至其獨特的位置(Qi等人Cell(2013)45:273-297)。CARPE方法利用CRISPR系統以序列依賴性方式誘導DNA斷裂并因此導致細胞死亡的能力。我們產生了DNA重組工程化盒,它除了ORF內的所需突變以外還包含在被CRISPR機制所針對的基因的開放閱讀框外部的常見位置中的突變。這種將所需突變與由于PAM突變/缺失而避免CRISPR介導的死亡相連接/偶聯的方法使得能夠顯著富集在全部細胞群體內的工程化細胞。
使用DXS途徑進一步闡釋所述方法。DSX途徑導致產生異戊烯焦磷酸(IPP),IPP導致萜類和類萜化合物的生物合成。有趣的是,如果添加所需基因,IPP還可以是番茄紅素或異戊烯醇的前體。番茄紅素使得細菌菌落呈紅色,并因此可容易地篩選,而異戊烯醇被認為是具有比乙醇更高的能量密度和更低的水混溶性的‘第二代’生物燃料。選擇以下三種蛋白質進行工程化:1)DSX,所述途徑的第一個限速酶,2)IspB,其將代謝流從DXS途徑轉移,和3)NudF,已證明其在大腸桿菌和枯草芽孢桿菌(B.subtilis)中均將IPP轉化為異戊烯醇(Withers等人App.Environ.Microbiol(2007)73:6277-6283;Zheng等人Biotechnol.for biofuels(2013)6:57))。將采用針對菌落顏色量化開發(fā)的新的圖像分析工具針對增加的番茄紅素產量來篩選編碼DXS和IspB的基因的突變。NudF活性通過經GC/MS測量異戊烯醇水平而直接測定,并且通過將會用作生物傳感器的異戊烯醇營養(yǎng)缺陷型細胞而間接測定。該方法提供了以高準確度和效率將大的突變文庫理性工程化至大腸桿菌基因組中的能力,以及產生高產率異戊烯醇的菌株。
實施例4:使用GEn-TraCER方法編輯galK
使用GEn-TraCER方法編輯galK基因,galK基因已用作在大腸桿菌中重組工程化的模式系統(Yu等人2000)。構建的第一GEn-TraCER盒被設計為在galK的密碼子24處引入終止密碼子代替框內PAM,被稱為galK_Q24(圖12)。使用自定義的python腳本設計構建體和載體以高通量地生成必要突變。
使用環(huán)形聚合酶克隆(CPEC)法將對照盒克隆至由Qi等人Cell(2013)描述的gRNA載體中。采用以下引物使骨架線性化:CCAGAAATCATCCTTAGCGAAAGCTAAGGAT(SEQ ID NO:29)和GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCT(SEQ ID NO:30)。
GenTRACER盒作為gblock定購,并使用以下引物進行擴增:
ATCACGAGGCAGAATTTCAGATAAAAAAAATCCTTAGCTTTCGCTAAGGATGATTTCTGG(SEQ ID NO:31),
ACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC(SEQ ID NO:32)。
使用CPEC將組件縫合在一起,并將組件轉化至大腸桿菌中以生成載體。使用合并的寡核苷酸文庫以多路的方式執(zhí)行該程序,其中克隆效率為104-105CFU/μg的數量級。
在30℃下,在含有50μg/mL卡那霉素和34μg/mL氯霉素的LB中,使攜帶pSIM5(λ-RED質粒)和X2-cas9質粒的大腸桿菌MG1655細胞生長至對數中期(0.4-0.7OD)。在42℃下誘導pSIM5載體的重組工程化功能15min,隨后在冰上放置10min。隨后通過沉淀并用10mL冷卻H2O洗滌2次而使細胞成為電感受態(tài)細胞。將細胞用100ng的GEn-TraCER質粒(也編碼羧芐青霉素抗性)轉化并在37℃下恢復3hr。將50-100μL的細胞接種到含有50μg/mL卡那霉素和100μg/ml羧芐青霉素的合適的培養(yǎng)基中,以選擇性地富集CRISPR編輯的菌株。在補充有半乳糖的MacConkey瓊脂上使用紅色/白色篩選,計算galK基因的編輯效率。
基于MacConkey瓊脂上的篩選,觀察到galK_Q24*設計有約100%的編輯效率。有趣的是,不同于需要錯配修復敲除來達到高效率的寡核苷酸介導的重組工程化方法(Li等人2003;Sawitzke等人2011;Wang等人2011),在錯配修復機制完整或不完整的情況下在菌株中沒有影響。
隨后通過Sanger測序驗證染色體和載體序列。
如所預期的,載體中設計的突變反映在染色體上(圖13),這表明突變存在于兩個位置中并且該質粒充當反式作用條形碼(反式條形碼)或基因組編輯的記錄。
所述設計適合于通過生成由同義PAM突變(圖14B,ΔPAM)組成的“沉默可選擇疤痕”,在基因組規(guī)模上理性誘變蛋白質編碼框,以針對Cas9介導的裂解“免疫”該細胞,而使翻譯產物未受到干擾。我們推斷沉默疤痕可以允許以高效率共選擇在密碼子附近的編輯或其他感興趣的特征。評估同源性臂長和galK中PAM突變/缺失與所需突變之間的距離的影響,并比較其效率(圖16B)。當用相同的PAM編輯將同源性臂長從80個核苷酸延伸至100個核苷酸時,觀察到在galK位置145處的突變效率顯著增加(分別為約5%和45%)。
實施例5:使用GEn-TraCER方法重建突變
使用自定義的自動化設計軟件將GEn-TraCER方法擴展至基因組規(guī)模,該軟件允許用簡單的用戶輸入定義來靶向基因組周圍的位點。通過重建來自近來報道的大腸桿菌熱適應研究(Tenaillon等人2012)的全部非同義點突變來測試所述方法。該研究表征了在來自獨立繁殖的菌株的115個隔離株中發(fā)生的全套突變。該數據集提供了突變的多樣化來源,該來源的單獨適合性影響進一步闡明了這一復雜表型的機械基礎。在密碼子使用和ΔPAM中,在可能的情況下,這些突變中的每一個均以2倍冗余度重建,以便在下游適合性分析中實現PAM和靶密碼子突變的統計校正。
實施例6:使用GEn-TraCER方法調整遺傳相互作用
通過在大腸桿菌基因組中每個基因的上游整合被環(huán)境因素(氧水平、碳源、應力)動態(tài)調節(jié)的啟動子來生成啟動子重置(rewiring)文庫。使用GEn-TraCER方法生成菌株,該菌株具有可能有利于例如對用于生產的感興趣化學品的耐受性的重置的基因型。