欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

設(shè)計趨異的密碼子優(yōu)化大重復(fù)dna序列的方法

文檔序號:9221191閱讀:1309來源:國知局
設(shè)計趨異的密碼子優(yōu)化大重復(fù)dna序列的方法
【專利說明】
[0001] 優(yōu)先權(quán)聲明
[0002] 本申請要求獲得于2012年6月16日提交的題為"設(shè)計趨異的密碼子優(yōu)化大重復(fù) DNA序列的方法"的美國臨時專利申請系列號61/672, 114的申請日的權(quán)益。
技術(shù)領(lǐng)域
[0003] 本公開一般地涉及用于優(yōu)化基因表達的方法。在特定的實施方案中,本公開涉及 優(yōu)化具有氨基酸重復(fù)結(jié)構(gòu)域的基因產(chǎn)物的表達的方法。
[0004] 背景
[0005] 由于化學(xué)DNA合成技術(shù)的進步,全基因合成的費用已經(jīng)變得往往比試圖從其天然 來源克隆基因更具有成本優(yōu)勢。因此,在植物轉(zhuǎn)化和其他生物技術(shù)領(lǐng)域中,計算機輔助設(shè)計 編碼有價值蛋白質(zhì)的合成DNA序列日益重要。
[0006] 遺傳密碼由稱作密碼子的三核苷酸單位構(gòu)成。有64種可能的密碼子,每一種密碼 子指定20種氨基酸中的一種,或者指定翻譯的結(jié)束("終止密碼子")。因此,至少有一些 密碼子是冗余的。在絕大多數(shù)生物所使用的編碼系統(tǒng)中,有兩種氨基酸分別是由單種密碼 子編碼的,而所有其它的氨基酸則分別由2、3、4或6種密碼子編碼,還有3種終止密碼子。 對于由2、3或4種密碼子表示的氨基酸,密碼子之間的差異在于第三位核苷酸。對于由2 種密碼子表示的氨基酸,兩者的第三位均是嘌呤(A,G)或嘧啶(C,T)。對于三種由6種密碼 子表示的氨基酸(Arg,Leu,和Ser),每一種具有一組由4個密碼子構(gòu)成的組,這些密碼子遵 循上述在第三位變異的模式,再加上一個由2個密碼子構(gòu)成的組。Arg和Leu各自由一個 二密碼子組表示,兩個密碼子的第一和第二位核苷酸不同。絲氨酸(Ser)的二密碼子表示 (two-codon representation)與Arg的二密碼子組的差異僅在于第三位核苷酸。
[0007] 對于特定的某種氨基酸而言,給定的生物對各種可能的密碼子的使用不是均等 的。生物各有各的密碼子使用偏好。密碼子使用偏好的模式對于生物及其近親而言在整個 基因組上是獨特的。例如,在鏈霉菌中,常見的密碼子一般在第三位包括G或C。稀有的密 碼子一般在第三位包括A或T。在其他生物中,第三位優(yōu)選的是A或T。在特定的物種中, 根據(jù)其自身的密碼子偏好,可以有截然不同的基因類別。例如,在大腸桿菌中大概有三類基 因,每一類具有截然不同的密碼子使用標(biāo)志(signature)。一類富含被大量表達的重要蛋白 質(zhì);第二類包括以相對低水平表達的蛋白質(zhì);而第三類包括很可能是新近從其他物種中獲 得的蛋白質(zhì)。
[0008] 在大多數(shù)人造基因設(shè)計策略中,過程試圖使人造基因的密碼子組成與待表達該人 造基因的宿主的基因密碼子組成相匹配。參見例如美國專利公開NO.US2007/0292918A1。 這樣的策略在一些情況下可能導(dǎo)致人造基因在宿主中的表達增加。例如,酵母中的密碼子 優(yōu)化可能顯著提高異源基因轉(zhuǎn)錄本的翻譯,其原因是使得例如氨基酰-tRNA限制和富含AT 序列處的轉(zhuǎn)錄終止等效應(yīng)的最小化。參見例如Daly and Hearn (2004) J. Mol. Recognition 18:119-38。
[0009] 然而,盡管在本領(lǐng)域中普遍共識需要一定的密碼子優(yōu)化,但是從業(yè)人員對于用于 優(yōu)化的一般策略尚未達成統(tǒng)一意見。一些人的首選策略是在設(shè)計異源基因過程中盡可能多 地使用表達宿主物種中的常用密碼子。另一種為另一些人首選的策略對特定的密碼子的上 下文給予最大的重視,從而令表達宿主中頻繁出現(xiàn)的密碼子對的使用最大化。第三種策略 是使新物種中的新編碼序列的密碼子用法與原始物種中的參考編碼序列的密碼子用法相 似。該第三種策略非常強調(diào)要認識到可能需要稀有密碼子來確保轉(zhuǎn)錄本RNA分子的適當(dāng)二 級結(jié)構(gòu)。進一步的策略是使異源基因的密碼子組成與新宿主表達基因的總體密碼子組成相 似。此外,僅使用在異源序列中以相同頻率反復(fù)出現(xiàn)的密碼子,最終獲得的效果可能與選用 稀有密碼子相同;例如過度使用相應(yīng)的tRNA會限制該tRNA的可得性。人們在嘗試對基因 序列的密碼子進行優(yōu)化以用于在宿主生物中表達時,必須平衡這些策略及其潛在的考慮, 以便實現(xiàn)特定的方法學(xué)。
[0010] 除了酵母和其它真核細胞(例如中國倉鼠卵巢細胞(CHO)細胞、人胚胎成視網(wǎng)膜 (HER)細胞和人胚胎腎(HEK)細胞)之外,許多細菌也已被用作宿主細胞,用于制備異源重 組蛋白質(zhì)。許多細菌系統(tǒng)的一個顯著缺點是它們使用稀有密碼子,這些密碼子在人類基因 中不是優(yōu)選的。這些稀有密碼子的使用會導(dǎo)致反映不同密碼子偏好的重組異源基因,例如 人類基因的表達延遲和減少。Sorensen et al. (2003) J. Chromatography B 786:207-14。 為了嘗試克服這一缺點,可以修飾核酸序列使之編碼重組異源多肽變異體,例如其中核酸 序列的特定密碼子被改變成特定宿主優(yōu)選的密碼子,這能夠提高表達水平。參見例如Haas et al. (1996)Curr· Biol. 6:315;和 Yang et al. (1996)Nucleic Acids Res. 24:4592。此 外,設(shè)計過程的反復(fù)迭代性使得人們可以從完工的DNA序列中消除各種序列基序,例如內(nèi) 含子剪切識別位點、mRNA不穩(wěn)定性決定簇、高穩(wěn)定性莖環(huán)結(jié)構(gòu)和限制酶識別位點。見例如 GENESCRIPT?產(chǎn)品說明書。此外,可以在宿主生物中表達編碼稀有tRNA的基因,從而克服 在異源編碼序列中使用稀有密碼子的一些影響。Sorensen et al. (2003),前文。
[0011] 優(yōu)化編碼異源表達蛋白質(zhì)的核苷酸序列的過程對于提高表達產(chǎn)量而言是一個重 要的步驟。然而,一些潛在問題限制了密碼子優(yōu)化對于表達特定基因的有用性。例如,密 碼子優(yōu)化轉(zhuǎn)錄本的二級結(jié)構(gòu)可能會限制轉(zhuǎn)錄本的翻譯。Griswold et al. (2003)Protein Expression and Purification 27:134-42。此外,存在大量在用于異源表達的人造序 列中期望避免的序列基序,包括大腸桿菌中受T7啟動子控制的基因的I和II類轉(zhuǎn)錄終 止位點;Shine-Dalgarno樣序列;潛在剪切信號;多聚腺苷酸信號;和促進核糖體移框 (frameshift)和暫停的序列。Welch et al. (2010) J.R. Soc. Interface 6:S467_76。
[0012] 許多蛋白質(zhì)的序列包含氨基酸重復(fù)模式,包括單氨基酸重復(fù)和串聯(lián)寡肽重 復(fù)。Katti et al. (2000)Protein Science 9:1203-9。簡單的核苷酸序列重復(fù)源 于DNA形成二級結(jié)構(gòu)(例如發(fā)夾或滑移鏈(siipped strand))所導(dǎo)致的不均等交換 (unequal crossing-over)或復(fù)制錯誤。Pearson and Sinden (1998) Curr. Opin. Struct. Biol. 8:321-30。編碼區(qū)中的核苷酸序列重復(fù)可能被翻譯成單氨基酸重復(fù)或串聯(lián)寡肽重復(fù), 可能顯著影響蛋白質(zhì)的結(jié)構(gòu)和功能。據(jù)估計,所有蛋白質(zhì)中有大約14%含有顯著的內(nèi)部 氨基酸重復(fù),在真核生物蛋白質(zhì)中出現(xiàn)的氨基酸重復(fù)比原核生物蛋白質(zhì)多。Marcotte et al. (1999)J. Mol. Biol. 293:151-60。谷氨酰胺、丙氨酸、甘氨酸、谷氨酸和絲氨酸重復(fù)是最 常見的單氨基酸重復(fù),而高疏水性氨基酸的長串聯(lián)重復(fù)是罕見的。Katti et al. (2000),前 文;Green and Wang(1994)Proc. Natl. Acad. Sci. USA 91:4298-302。
[0013] 含有單氨基酸重復(fù)的蛋白質(zhì)包括轉(zhuǎn)錄調(diào)節(jié)蛋白。Katti et al. (2000),前文。 含有串聯(lián)寡肽重復(fù)的蛋白質(zhì)包括來自某些原生動物寄生物的抗原蛋白,結(jié)構(gòu)蛋白(例如, 富含脯氨酸的植物細胞壁結(jié)構(gòu)蛋白、角蛋白、毛透明蛋白(trichohyalin)、彈性蛋白原 (tropoelastin)、蠶蛾絲心蛋白(silk moth fibroin)、果幡唾液腺膠蛋白、酵母細胞壁蛋 白、上皮粘蛋白、和軟骨特異性蛋白聚糖核心蛋白),皮膚表皮角化細胞蛋白質(zhì),外皮蛋白 (involucrin)、兜甲蛋白(loricrin)、repetin蛋白、角質(zhì)蛋白(cornifin)和哺乳動物神經(jīng) 軸突的神經(jīng)微絲三聯(lián)H蛋白(neurofilament triplet-H protein)。同上。除了天然存在 的蛋白質(zhì)之外,一些含有重復(fù)的合成多肽對于生產(chǎn)和在各種用途中的使用可能是期望的。 見,例如,美國專利公開號No. US2009/0093621A1。
[0014] 公開
[0015] 本文描述了可用于設(shè)計人造核酸分子的方法,該人造核酸分子編碼含有至少一 個重復(fù)氨基酸序列區(qū)的多肽。重復(fù)氨基酸序列區(qū)可以是,例如,單氨基酸重復(fù)或串聯(lián)寡肽 重復(fù)。在實施方案中,在預(yù)定的基因設(shè)計參數(shù)的約束之內(nèi),可以設(shè)計多個實質(zhì)上趨異的 (diverged)人造核酸序列。人造核酸序列可以根據(jù)參考核酸序列設(shè)計而得,以便,例如,優(yōu) 化該核酸序列在宿主生物中的異源表達?;蛘?,可以從頭設(shè)計人造核酸序列,以編碼期望的 多肽。關(guān)于多肽設(shè)計的綜述,參見例如Protein Design, Eds. Raphael Guerois and Manuela Lopez de la Paz,2006, Humana Press,Totowa,N. J. 〇
[0016] 在實施方案中,本方法可以包括提供編碼多肽的核酸序列,所述多肽包含至少一 個氨基酸重復(fù)區(qū)。在一些實施方案中,編碼包含至少一個氨基酸重復(fù)區(qū)的多肽的核酸序列 可以通過確定生物中編碼包含至少一個氨基酸重復(fù)區(qū)的多肽的核酸序列來提供(例如通 過克隆該核酸序列,或者通過從序列數(shù)據(jù)庫中提取該序列)。在特定的實施方案中,然后可 以從所提供的核酸序列中提取至少一個編碼該多肽的氨基酸重復(fù)區(qū)的核酸序列,每一個作 為一個單獨的序列。
[0017] 在一些實施方案中,所提取的編碼氨基酸重復(fù)區(qū)的核酸序列可以被導(dǎo)入(例如, 單獨地導(dǎo)入)到計算機實現(xiàn)的軟件程序中,該程序能夠根據(jù)預(yù)定的參數(shù)對編碼序列進行 優(yōu)化。在特定的實施方案中,該計算機實現(xiàn)的軟件程序可以是〇PTGENE?(可購自O(shè)cimum Biosolution)。然后,可以從所提取的每個核酸序列推導(dǎo)(例如通過參考標(biāo)準(zhǔn)遺傳密碼) 樣本氨基酸重復(fù)序列。在特定的實施方案中,可以通過計算機實現(xiàn)的軟件程序從所提取的 每個核酸序列推導(dǎo)樣本氨基酸重復(fù)序列。在進一步的實施方案中,樣本氨基酸重復(fù)序列可 以直接導(dǎo)入到計算機實現(xiàn)的軟件程序中,例如,將感興趣多肽的氨基酸重復(fù)區(qū)的氨基酸序 列導(dǎo)入到該計算機實現(xiàn)的軟件程序中。
[0018] 在其他的實施方案中,可以用樣本氨基酸重復(fù)序列來推導(dǎo)多個編碼氨基酸重復(fù)區(qū) 域的樣本密碼子優(yōu)化核酸序列(例如,根據(jù)遺傳編碼的冗余性和合適的密碼子用法表,從 樣本氨基酸重復(fù)序列獨立地推導(dǎo)出多個不同的編碼氨基酸重復(fù)區(qū)的樣本密碼子優(yōu)化核酸 序列)。在利用計算機實現(xiàn)的軟件程序的實施方案中,可以將每一個編碼氨基酸重復(fù)區(qū)的樣 本密碼子優(yōu)化核酸序列中輸出為文本文件,或以其他方式為從業(yè)者記錄。在設(shè)計人造核酸 分子以優(yōu)化包含至少一個重復(fù)氨基酸序列區(qū)的參考核酸分子的實施方案中,可以對由該參 考核酸分子編碼的每一個多肽的氨基酸重復(fù)區(qū)執(zhí)行上述的推導(dǎo)樣本氨基酸重復(fù)序列的步 驟和推導(dǎo)編碼該氨基酸重復(fù)區(qū)的密碼子優(yōu)化樣本核酸序列的步驟。
[0019] 在進一步的實施方案中,可以通過序列同源性對各個編碼氨基酸重復(fù)區(qū)域的樣本 密碼子優(yōu)化核酸序列進行比對。在特定的實施方案中,可以將對參考核酸分子中的所有重 復(fù)氨基酸序列區(qū)獲得的所有編碼氨基酸重復(fù)區(qū)的樣本密碼子優(yōu)化核酸序列通過序列同源 性彼此進行比對。在某些實施方案中,樣本密碼子優(yōu)化核酸序列可以使用CLUSTALW?程序, Mega 3. 1進行比對??梢詾榻?jīng)過比對的樣本序列組裝鄰接樹??梢詾槊總€來自鄰接樹的深 分支部分的重復(fù)氨基酸序列區(qū)選擇一個編碼氨基酸重復(fù)區(qū)的樣本密碼子優(yōu)化核酸序列。
[0020] 在這些和進一步的實施方案中,在編碼感興趣多肽的密碼子優(yōu)化的核酸序列中可 以組入為重復(fù)氨基酸序列選定的編碼序列,以產(chǎn)生表達被優(yōu)化的核酸序列。在特定的實施 方案中,所述選定的編碼序列可以組入感興趣多肽中的相應(yīng)氨基酸重復(fù)單元的期望位置 處,從而使整個多肽編碼序列保持正確的閱讀框。在一些實施方案中,可以對密碼子優(yōu)化的 序列進行進一步的分析,以便,例如,確認不存在不希望的核酸基序(例如,在由其轉(zhuǎn)錄的 RNA分子中形成不希望的二級結(jié)構(gòu)的核酸基序),確認不存在限制性內(nèi)切酶識別位點,和/ 或確保密碼子和序列多樣性。
[0021] 在一些實施方案中,本發(fā)明的方法可用于設(shè)計編碼感興趣的異源或內(nèi)源多肽的人 造核酸序列。在一些這樣的實施方案中,人造核酸序列可以為了在宿主生物中表達而被優(yōu) 化,例如,通過密碼子優(yōu)化反映表達宿主的密碼子用法。在特定的實施方案中,設(shè)計這樣的 人造核酸序列,其已被優(yōu)化用于在植物細胞中,例如在歐洲油菜(Brassica napus)中異源 表達。在進一步的實施方案中,設(shè)計這樣的人造核酸序列,其已被優(yōu)化用于在細菌宿主細胞 中,例如在熒光假單胞菌中異源表達。在這些和其他的實施方案中,本發(fā)明的設(shè)計方法可用 于設(shè)計編碼感興趣的包含氨基酸重復(fù)區(qū)的新型多肽的人造核酸序列。
[0022] 通過參考附圖進行的下列多個實施方案的詳細描述,本發(fā)明的前述特征和其他特 征將更加不言自明。
[0023] 附圖簡述
[0024] 圖1包括由裂殖壺菌(Schizochytrium)PUFA ORFA編碼的蛋白質(zhì)的圖形表示,其 包括氨基酸重復(fù)結(jié)構(gòu)域和側(cè)翼Pro-Ala重復(fù)的相對位置。應(yīng)當(dāng)注意,重復(fù)1-9在本文中有 時稱為重復(fù)A-I,其中重復(fù)1有時稱為重復(fù)A,重復(fù)2稱為重復(fù)B,等。
[0025] 圖2包括裂殖壺菌(Schizochytrium) PUFA ORFA的10個Pro-Ala重復(fù)的氨基酸 序列。
[0026] 圖3包括裂殖壺菌(Schizochytrium)(美國典型培養(yǎng)物保藏中心保藏號 ATTC_20888) PUFA ORFA的9個寡肽重復(fù)結(jié)構(gòu)域的氨基酸序列的CLUSTALW?比對結(jié)果(在 Vector NTItm軟件套裝中)。
[0027] 圖4包括編碼PUFA ORFA的9個氨基酸重復(fù)結(jié)構(gòu)域中每一個的天然裂殖壺菌DNA 序列的CLUSTALW?比對結(jié)果(在Vector NTI ?軟件套裝中)。比對結(jié)果證明,各DNA序列 100%同源,89. 7%相同。
[0028] 圖5包括程序界面的再現(xiàn)。圖表的最上一行顯示了計算機生成序列的一部分, 該計算機生成序列是通過使用無偏好標(biāo)準(zhǔn)遺傳編碼對裂殖壺菌PUFA ORFA重復(fù)1(SEQ ID N0:11)的氨基酸序列進行逆向翻譯產(chǎn)生的,該序列進一步公開為SEQ ID N0:29。圖表的 第二行顯示了由最上一行的序列編碼的氨基酸序列,因此其代表了裂殖壺菌PUFA ORFA重 復(fù)1(SEQ ID NO: 11)的一部分,并在SEQ ID N0:30中列出。其余行顯示了使用標(biāo)準(zhǔn)遺傳 編碼和歐洲油菜密碼子使用偏好對第二行的多個逆向翻譯結(jié)果。第3-12行分別顯示了 "rptlnapl"至"rptlnaplO"。這些核苷酸序列(分別為SEQ ID N0:31-40)是使用標(biāo)準(zhǔn)遺 傳編碼和歐洲油菜密碼子使用偏好通過對SEQ ID N0:30進行逆向翻譯而獲得的。
[0029] 圖6包括CLUSTALW?程序Mega3. 1的鄰接樹輸出,其對90個裂殖壺菌PUFA ORFA 重復(fù)1-9的歐洲油菜密碼子優(yōu)化序列進行序列比對。重復(fù)1-9的每個重復(fù)用字母表示(例 如,rptA, rptB, rptC, rptD, rptE, rptF, rptG, rptH, rptl),歐洲油菜偏好序列的每次迭代 (iteration)用數(shù)字表不(例如,napl, nap2, nap3, nap4, nap5, nap6, nap7, nap8, nap9, η aplO)。在該實例中選出的趨異序列用箭頭標(biāo)記,并且為了清晰起見,在附圖的右側(cè)指示了選 出的趨異序列的簡稱(例如rptBnaplO稱為B10)。
[0030] 圖7包括裂殖壺菌PUFA ORFA重復(fù)的所選歐洲油菜密碼子優(yōu)化序列的 Smith-Wasserman 同源性。
[0031] 圖8包括編碼裂殖壺菌PUFA ORFA的9個重復(fù)結(jié)構(gòu)域中每一個的再設(shè)計的(趨異 的)DNA序列的CLUSTALW?比對結(jié)果(在Vector NTI ?軟件套裝中)。比對結(jié)果證明,DNA 序列93. 1%同源,61. 7%相同。
[0032] 序列表
[00
當(dāng)前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
铜山县| 多伦县| 土默特右旗| 蕲春县| 威远县| 吴桥县| 东丽区| 右玉县| 瓦房店市| 湖北省| 出国| 寿阳县| 阿瓦提县| 萨迦县| 武夷山市| 万山特区| 文安县| 喀什市| 延边| 融水| 大埔县| 宜春市| 台湾省| 兴业县| 鄂托克前旗| 晋中市| 广元市| 博野县| 五华县| 永丰县| 张掖市| 治多县| 新河县| 旅游| 高州市| 塔河县| 商南县| 沙洋县| 略阳县| 福清市| 浠水县|