專利名稱::遺傳包和其應用的制作方法遺傳包和其應用交叉參考本申請要求2006年3月6日提交美國臨時申請?zhí)?0/743,410的優(yōu)先權,將該申請納入本文作為參考。本申請是2006年9月27日提交的11/528,927和11/528,950的部分繼續(xù)申請,它們要求9/27/2005提交的臨時申請序列號60/721,270、60/721,188以及03/21/06提交的60/743,622的優(yōu)先權,將它們的全文納入本文作為參考。
背景技術:
:已有文獻報道可通過將親水聚合物與蛋白連接可改進蛋白某些性質,特別是血漿清除率及免疫原性(Kochendoerfer,G.(2003)五x;eW(9p/"5/o/7Tzer,3:1253-61),(Gre證ald,R.B.等(2003)廟Z),Z)e/Zviev,55:217-50),(Harris,J.M.等(2003)A^;evDn^iXscov,2:214-21)。被FDA批準用于治療病人的聚合物修飾蛋白的例子是阿達金(Adagen)、昂卡斯帕(Oncaspar)、PEG-內含子、派羅欣(Pegasys)、索馬沃(Somavert)以及紐拉思塔(Neulasta)。更多的聚合物修飾蛋白正處于臨床試驗中。這些聚合物通過增加修飾蛋白相對于未修飾蛋白的流體動力學半徑(也稱作斯托克斯半徑)而降低腎濾過清除率,從而發(fā)揮效能(Yang,K.等(2003)/Vofe/w五"g,16:761-70)。此外,聚合物連接能減少修飾蛋白與其它蛋白、細胞或表面的相互作用。具體說,聚合物連接能減少修飾蛋白與免疫系統(tǒng)的抗體和其它組分相互作用從而降低宿主對修飾蛋白的免疫應答。尤感興趣的是通過PEG化,即連接線性或分枝聚乙二醇聚合物來修飾蛋白。PEG化降低免疫原性的例子如苯丙氨酸解氨酶(Gamez,A.等(2005)Mo/7%^,11:986-9)、抗體(Deckert,P.M.等(2000)/WJCa"cer,87:382-90.)、葡激酶(Collen,D.等(2000)OcM/油'o",102:1766曙72)和血紅蛋白(Jin,C.等(2004)尸nte/"尸W"e",11:353-60)。一般地,在純化未修飾蛋白后,通過化學修飾步驟將此類聚合物與感興趣蛋白連接。可將多種聚合物與蛋白連接。尤感興趣的是具有可變構象并在水溶液中很好水合的親水聚合物。常用的聚合物是聚乙二醇(PEG)。相對其分子量,這些聚合物趨于具有較大的流體動力學半徑(Kubetzko,S.等(2005)Mo/尸/^maco/,68:1439-54)。所連接的聚合物與其連接的蛋白趨于具有有限相互作用,因此聚合物修飾蛋白能保持其相關功能。聚合物與蛋白質的化學偶聯(lián)需要復雜的多步過程。典型地,蛋白組分須在化學偶聯(lián)步驟之前產生并純化。偶聯(lián)步驟可導致產生需要分離的產物混合物,在分離時會引起產物顯著損失。或者,此類混合物可用作最終藥物產品。目前上市的一些例子包括以混合物形式使用的PEG化干擾素-a產品(Wang,B丄.等(1998)J&6m/cT(wcC^o/尸flAo/,30:503-9;Dhalluin,C.等(2005)5/oco"y^gC&m,16:504-17)。此類混合物難以生產鑒定,并且包含降低或無治療活性的異構體。已描述過允許位點特異性增加聚合物如PEG的方法。例子如靶蛋獨特糖基化位點的選擇性PEG化或對工程構建入耙蛋白的非天然氨基酸的選擇性PEG化。在一些情況下可通過仔細控制反應條件選擇性PEG化蛋白質N末端而避免靶蛋白賴氨酸側鏈的PEG化。而另一靶蛋白位點特異性PEG化的方法是引入可選擇性偶聯(lián)的半胱氨酸殘基。所有這些方法都有明顯的局限性。N末端的選擇性PEG化需要仔細的過程控制并難以消除副反應。引入用于PEG化的半胱氨酸可干擾蛋白質生產和/或純化。特異性引入非天然氨基酸需要特定宿主生物體用于蛋白質生產。PEG化的另一局限性是通常PEG以聚合物混合物形式生產,這些混合物長度相似但不一致。其它化學聚合物也具有同一局限性。利用多功能聚合物的化學偶聯(lián)允許合成具有多個蛋白模塊的產物,這種偶聯(lián)比聚合物與單一蛋白結構域偶聯(lián)更為復雜。近來觀察到病原生物體的一些蛋白質含有重復肽序列,這些序列似乎導致包含這些序列的蛋白質血清半衰期相對較長(Alvarez,P.等(2004)J5/oZCtem,279:3375-81)。也表明將基于此類病原體衍生重復序列的寡聚序列與其它蛋白融合可引起血清半衰期增加。然而,這些病原體來源的寡聚體有一些缺陷。病原體來源的序列趨于有免疫原性。也有描述稱修飾這些序列可減少其免疫原性。然而,尚未有報道嘗試從參與免疫反應形成的序列中移除T細胞表位。而且,藥學應用中要求序列具有好的可溶性及對其它靶蛋白的非常低的親合力,而尚未根據此種藥學應用對抗原來源的序列進行優(yōu)化。因此,亟需能夠允許將多個聚合物模塊和多個蛋白質模塊組合成所定義的多結構域產物的組合物和方法。發(fā)明概述本發(fā)明提供含有至少40個毗連氨基酸的非結構化重組聚合物(URP),其中所述URP基本不能與血清蛋白非特異性結合,并且其中(a)URP包含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、絲氨酸(S)、蘇氨酸(T)、谷氨酸(E)和脯氨酸(P)殘基總量超過URP氨基酸總量的約80%;禾口/或(b)Chou-Fasman算法測定至少50%氨基酸缺少二級結構。在相關實施方式中,本發(fā)明提供一種包含至少40個毗連氨基酸的非結構化重組聚合物(URP),其中所述URP的體外血清降解半衰期長于約24小時,并且其中(a)URP中所包含的甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、絲氨酸(S)、蘇氨酸(T)、谷氨酸(E)和脯氨酸(P)殘基的總量超過URP氨基酸總量的約80%;和/或(b)Chou-Fasman算法測定至少50%氨基酸缺少二級結構。主題URP可包含非天然氨基酸序列。所期望的是,選擇URP用于摻入異源蛋白質,一旦URP摻入異源蛋白質后,與未摻入所述URP的對應蛋白質相比,所述異源蛋白質表現(xiàn)出較長的血清分泌半衰期和/或較高的溶解性。半衰期可延長2倍、3倍、5倍、IO倍或更長。在一些例子中,URP摻入異源蛋白質引起經體積排阻色譜估測的表觀分子量提高至少2倍、3倍、4倍、5倍或更多。在一些例子中,URP的T表位評分小于-3.5(如,-4或更低,-5或更低)。在一些例子中,URP可主要包含親水殘基。所期望的是,Chou-Fasman算法測定至少50%氨基酸缺少二級結構。URP中包含的甘氨酸殘基占URP所包含總氨基酸的至少50%。在一些例子中,包含于URP中選自甘氨酸(G)、天冬酰胺(D)、丙氨酸(A)、絲氨酸(S)、蘇氨酸(T)、谷氨酸(E)或脯氨酸(P)的任一類型氨基酸獨自占URP總氨基酸的含量大于約20。/。、30%、40%、50%、60%或更高。在一些例子中,URP包含大于約100、150、200或更多個毗連氨基酸。本發(fā)明也提供含有一個或多個主題URP的蛋白質,其中主題URP與蛋白質為異源。聚集URP總長度可超過約40、50、60、100、150、200或更多個氨基酸。該蛋白可包含一個或多個功能模塊,功能模塊可選自效應模塊、結合模塊、N末端模塊、C末端模塊或其任意組合。所期望的是,主題蛋白含有多個結合模塊,其中單個結合模塊對于同一或不同靶點具有結合特異性。結合模塊可包含由支架內半胱氨酸配對形成的含二硫化物的支架。結合模塊可與選自細胞表面蛋白、分泌蛋白、胞漿蛋白或核蛋白的靶分子結合。靶點可為離子通道和/或GPCR。所期望是的,效應模塊可為毒素。含有主題URP的蛋白的半衰期通常比不含所述URP的對應蛋白長2、3、4、5、IO或更多倍。在獨立的實施方案中,本發(fā)明提供包含至少3個氨基酸序列重復單位的非天然產生的蛋白質,每一重復單位包含至少6個氨基酸,其中一種或多種天然人蛋白中存在包含至少三個重復單位的約6-15個毗連氨基酸的多個區(qū)段。在一方面,一種或多種天然人蛋白中存在多個區(qū)段或每一在重復單位內含有約9-15個毗連氨基酸的區(qū)段。該區(qū)段可包含約9-15個氨基酸。三個重復單位可具有顯著序列同源性,如當比對時序列同一性大于約50%、60%、70%、80%、90%或100%。該非天然蛋白也可包含一種或多種選自結合模塊、效應模塊、多聚化模塊、C末端模塊或N末端模塊的模塊。所期望的是,非天然蛋白質可包含具有主題非結構化重組聚合物(URP)的單個重復單位。本發(fā)明也提供包含編碼主題URP、含URP的蛋白質、微生物蛋白和毒素的重組多核苷酸。本發(fā)明也提供含有主題多核苷酸的載體、攜帶該載體的宿主細胞、展示主題URP的遺傳包、含URP的蛋白質、毒素或本文公開的其它任意蛋白實體。本文還提供本發(fā)明表達載體的選擇性文庫。本發(fā)明也提供了產生包含非結構化重組聚合物(URP)的方法。所述方法包括(i)提供含有編碼所述蛋白的重組多核苷酸的宿主細胞,所述蛋白含有一種或多種URP,所述URP含有至少40個毗連氨基酸,其中所述URP基本不能與血清蛋白非特異性結合,并且其中(a)URP中所含甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、絲氨酸(S)、蘇氨酸(T)、谷氨酸(E)和脯氨酸(P)殘基的總量超過URP總氨基酸量的約80%;禾B/或(b)Chou-Fasman算法測定至少50%氨基酸缺少二級結構;和(ii)在合適條件下,合適培養(yǎng)基中培養(yǎng)所述宿主細胞,以便由所述多核苷酸表達所述蛋白。合適宿主細胞是真核(如CHO細胞)和原核細胞。本發(fā)明也提供延長蛋白質血清分泌半衰期的方法,包括將所述蛋白質與一個或多個非結構化重組聚合物(URP)融合,其中,URP包含至少40個毗連氨基酸,其中(a)URP中所含甘氨酸(G)、天冬氨酸(D)、丙氨酸(A)、絲氨酸(S)、蘇氨酸(T)、谷氨酸(E)和脯氨酸(P)殘基的總量超過URP總氨基酸量的約80%;和/或(b)Chou-Fasman算法測定至少50%氨基酸缺少二級結構;所述URP基本不能與血清蛋白非特異性結合。本發(fā)明也提供檢測遺傳包展示外源性蛋白和靶點之間是否存在特異性互相作用的方法,其中所述蛋白包含一個或多個非結構化重組聚合物(URP),所述方法包括(a)提供展示包含一個或多個非結構化重組聚合物(URP)的蛋白的遺傳包;(b)在適合產生穩(wěn)定的蛋白-靶點復合物的條件下使遺傳包與靶點相接觸;和(c)檢測遺傳包上穩(wěn)定蛋白-靶點復合物的形成,從而檢測特異性互相作用的存在。所述方法還可包括獲得來自遺傳包的編碼外源性蛋白的核苷酸序列。在一些例子中,在URP和包含血清蛋白的靶點間存在或不存在特異性相互作用。在一些例子中,在URP和包含血清蛋白酵的靶點間存在或不存在特異性相互作用。本發(fā)明還包括展示微生物蛋白的遺傳包,其中所述微生物蛋白保持與其天然耙點的結合能力。在一些方面,微生物蛋白展示與至少一個離子通道家族的結合能力,所述離子通道家族選自鈉、鉀、乙酰膽堿或氯通道。所期望的是,所述微生物蛋白是離子通道結合微生物蛋白,并且被修飾以(a)與對應的未修飾的微生物蛋白比,能夠結合不同通道家族;(b)與對應的未修飾的微生物蛋白比,所述微生物蛋白與同一通道家族的不同亞家族結合;(c)與對應的未修飾的微生物蛋白比,所述微生物蛋白與同一通道亞家族的不同種類結合;(d)與對應的未修飾的微生物蛋白比,所述微生物蛋白與同一通道的不同位點結合;和/或(e)與對應的未修飾的微生物蛋白比,所述微生物蛋白與同一通道的同一位點結合,但產生不同的生物學效應。在某些方面,所述微生物蛋白是毒素。本發(fā)明也提供展示主題微生物蛋白和/或毒素的遺傳包文庫。所期望的是,所述遺傳包展示保持部分或全部毒性譜的蛋白毒素。該毒素可來源于單個毒素蛋白,或衍生自毒素家族。本發(fā)明也提供了一種遺傳包文庫,其中所述文庫展示毒素家族,其中所述家族保持部分或全部的天然毒性譜。本發(fā)明還提供了包含多個離子通道結合域的蛋白,其中單個結構域為微生物蛋白結構域,該微生物蛋白結構域被修飾以(a)與對應的未修飾的微生物蛋白結構域比,能夠結合不同通道家族;(b)與對應的未修飾的微生物蛋白結構域比,所述微生物蛋白結構域與同一通道家族的不同亞家族結合;(C)與對應的未修飾的微生物蛋白結構域比,所述微生物蛋白結構域與同一通道亞家族的不同種類結合;(d)與對應的未修飾的微生物蛋白結構域比,所述微生物蛋白結構域與同一通道的不同位點結合;(e)與對應的未修飾的微生物蛋白結構域比,所述微生物蛋白結構域與同一通道的同一位點結合,但產生不同的生物學效應;和/或(f)與對應的未修飾的微生物蛋白結構域比,所述微生物蛋白結構域與同一通道的同一位點結合并產生相同生物學效應。本發(fā)明也涉及獲取具有所需性質的微生物蛋白的方法,所述方法包括(a)提供主題文庫;和(b)篩選選擇性文庫以獲取至少一種展示具有所需性質的微生物蛋白的噬菌體。也提供任一所公開方法中使用的多核苷酸、載體、遺傳包和宿主細胞。納入本文作參考將本說明提及的所有發(fā)表物和專利申請納入本文作參考,就如特別且單獨地將各篇發(fā)表物或專利申請納入本文作參考那樣。附圖簡要說明本發(fā)明的新特征由所附權利要求書具體列出。下述詳細描述列出的使用本發(fā)明原理的說明性實施方式和附圖將使讀者對本發(fā)明的特點和優(yōu)勢有更好的理解,附圖如下圖1顯示MURP的模塊組件。結合模塊、效應模塊以及多聚化模塊以圓圈表示。URP模塊、N末端和C末端模塊以矩形表示。圖2顯示MURP模塊結構示例。一個MURP中的結合模塊(BM)可具有相同或不同的靶點特異性。圖3顯示基于人序列的重復蛋白可包含新氨基酸序列,該序列可包含T細胞表位。這些新序列在相鄰重復單元的連接處形成。圖4展示基于三個人供體序列Dl、D2和D3的重復蛋白的URP序列設計。選擇此URP的重復單元,使跨越相鄰單元連接的均勻(even)9-聚體序列可在至少一種人供體序列中找到。圖5是作為基于三個人蛋白序列的重復蛋白的URP序列的例子。圖下方顯示URP中所有9-聚體亞序列至少出現(xiàn)在一種人供體蛋白中。圖6基于人POU結構域殘基146-182的URP序列的例子。圖7顯示通過在序列間插入URP模塊分隔含有富信息序列的模塊的優(yōu)點。左圖顯示直接將模塊A和B融合在連接區(qū)域得到新序列。這些連接序列可為表位。右圖顯示在模塊A和B間插入URP模塊能防止形成包含來自模塊A和B的部分序列的此類連接序列。取而代之的是,模塊A和B的末端產生包含URP序列的連接序列,因此預測其具有低的免疫原性。圖8顯示基于URP的藥物遞送構建物。六邊形表示的藥物分子與MURP化學偶聯(lián)。圖9顯示包含蛋白酶敏感位點的MURP。設計URP模塊使其阻斷效應模塊功能。蛋白酶切割移除URP模塊的一部分并導致效應子功能活性提高。圖10顯示URP模塊如何在結合模塊和效應模塊間作為接頭。結合模塊可與靶點結合并在靶點附近引起效應模塊的局部濃度升高。圖11顯示從短URP模塊文庫構建編碼URP序列的基因的過程??蓪RP模塊文庫插入到含有綠色熒光蛋白(GFP)的填充載體中,綠色熒光蛋白(GFP)作為報道物有利于高表達URP序列的識別。如圖所示可通過反復二聚化構建長URP序列的編碼基因。圖12顯示含有多個死亡受體結合模塊的MURP。三聚化觸發(fā)死亡受體,因此,含有一個死亡受體的至少三個結合原件的MURP能夠尤其有效的誘導細胞死亡。圖的下方顯示可通過加入一個或多個腫瘤組織特異性結合模塊來提高MURP對于患病組織的特異性。圖13顯示含有四個腫瘤抗原特異性結合模塊(矩形),和效應模塊如白介素2的MURP。圖14顯示構建含288個殘基的URP模塊的流程圖。構建URP模塊與GFP的融合蛋白。首先構建含36個氨基酸的URP模塊文庫,接著通過反復二聚化產生288個氨基酸的URP模塊(rPEG一H288和rPEG_J288)。圖15288個氨基酸的URP模塊(rPEGj288)的氨基酸和核苷酸序列。圖16288個氨基酸的URP模塊(rPEG一H288)的氨基酸和核苷酸序列。圖17人牙本質涎磷蛋白的富絲氨酸序列區(qū)域的氨基酸序列。圖18顯示MURP衍生物儲庫。蛋白質包含兩個能形成弱SS橋的半胱氨酸殘基。加工該蛋白,保持SS橋完整。配制制劑并以還原態(tài)注射給病人。注射后它會在注射位點附近氧化并形成擴散很有限的高分子量聚合物。通過有限制的蛋白酶解或有限制的SS交聯(lián)鍵還原,使活性MURP從注射位點緩慢濾出。圖19顯示MURP的儲庫形式。在注射位點MURP擴散很有限,通過有限制的蛋白酶解可使其從注射位點釋放。圖20顯示含富組氨酸序列的MURP的儲庫形式。將MURP與含固化鎳的不溶性珠配制在一起注射。在注射位點MURP與鎳珠結合并緩慢釋放進入循環(huán)。圖21顯示包含多聚化模塊的MURP。上圖顯示包含一個二聚化序列的MURP。結果是它形成有效倍增其分子量的二聚體。中圖顯示包含兩個多聚化序列的三個MURP的設計。此MURP能形成具有非常高有效分子量的多聚體。下圖顯示包含多個RGD序列的MURP,已知RGD序列能夠結合細胞表面受體,從而延長半衰期。圖22顯示設計用于阻斷或調節(jié)離子通道功能的多種MURP。圓圈表示對離子通道特異性的結合模塊。這些結合模塊起源于或與天然毒素相同,具有對離子通道受體親和力。如圖所示可在離子通道特異性結合模塊任一側加上其它結合域,從而提高MURP對某一細胞類型的功效或特異性。圖23顯示延長半衰期的幾種MURP設計。可通過增加鏈長(A)、化學多聚化(B)、在分子中加入非結合位點分隔開的多拷貝的結合模塊(C),構建類似C的化學多聚體(D,E),包括多聚化序列(F)增加有效分子量。圖24顯示可通過將結合模塊與重組URP序列化學偶聯(lián)形成的MURP。設計該URP序列,以包含多個賴氨酸殘基(K)作為偶聯(lián)位點。圖25顯示2SS結合模塊文庫的設計。該序列中間包含恒定的1SS序列,1SS序列與距1SS核心不同距離的含半胱氨酸的隨機序列側接。圖26顯示2SS結合模塊文庫的設計。該序列中間包含恒定的1SS序列,1SS序列與距1SS核心不同距離的含半胱氨酸的隨機序列側接。圖27顯示1SS結合模塊二聚體文庫的設計。首先,通過兩次PCR反應擴增1SS結合模塊的集合。合并得到的PCR產物并在后續(xù)PCR步驟中產生二聚體。圖28顯示在50%小鼠血清中孵育至多三天后,含288個氨基酸URP序列rPEG—J288的融合蛋白的Western分析。圖29顯示對抗288個氨基酸的URP序列的預存抗體的結合檢測試驗結果。圖30顯示包含一個(單體)、兩個(二聚體)、四個(四聚體)或無(rPEG36)結合模塊的MURP與包被于微量滴定板上的VEGF的特異性結合。圖31顯示對EpCAM有特異性的MURP的氨基酸序列。該序列包含對EpCAM有親和力的四個結合模塊(下劃線)。該序列包含全部序列中僅有的兩個賴氨酸的N末端Flag序列。圖32顯示1SS附加文庫的設計??蓪㈦S機1SS模塊加入預選結合模塊的N或C末端或同時加入兩個末端。圖33顯示三指狀毒素相關序列的比對。該圖也顯示NMR解析的3D結構。圖34顯示基于三指狀毒素的文庫設計。X為隨機殘基。標明每一隨機位置的密碼子選擇。圖35顯示plexin相關序列的比對。圖36顯示基于plexin的文庫設計。X為隨機殘基。標明每一隨機位置的密碼子選擇。圖37顯示對DR4、ErbB2和HGFR有特異性的pexin相關結合模塊的序列。圖38顯示對VEGF有特異性的基于微生物蛋白的結合域的結合試驗。圖39顯示對VEGF有特異性的分離自構建(buildup)文庫的2SS和3SS結合模塊序列。上圖顯示熱解純化的蛋白質的PAGE膠分析。圖40顯示構建URP序列rPEG—J72的克隆步驟。圖41顯示構建具有稱作rPEGj36的36個氨基酸的URP模塊文庫。將三個編碼rPEG—J12的較短區(qū)段及終止模塊連接組裝成為rPEG—J36編碼區(qū)域。圖42顯示填充載體pCW0051的核苷酸序列和翻譯。填充區(qū)域側接于Bsal和BbsI位點,且包含多個終止密碼子。圖43顯示與GFP融合的URPrPEG—J288的純化的PAGE膠。泳道2為細胞裂解物;泳道3:IMAC純化產物;泳道4:抗-Flag純化產物。圖44rPEG—J288與人效應子結構域干擾素ot、G-CSF和人生長激素的融合蛋白的氨基酸序列。圖45顯示rPEG—J288和人生長激素(泳道1和2)、干擾素a(泳道3和4)和GFP(泳道5和6)的融合蛋白表達的Western分析。分析每一蛋白的可溶性和不溶性材料。圖46顯示基于毒素0SK1的MURP的設計。如圖所示可在0SK1任一側加上URP序列和/或結合模塊。圖47描述了含有主題URP的示例性產物形式。發(fā)明詳述盡管本文描述了本發(fā)明的優(yōu)選實施方式,但本領域熟練技術人員應當清楚此類實施方式僅提供作為舉例說明。本領域技術人員可在不背離本發(fā)明的前提下做出不同的變化、更改和替代。應理解,在實施本發(fā)明當中可使用多種本文所述實施方式的另選方案。本文意在利用所附權利要求書定義本發(fā)明的范圍,在這些權利要求范圍內的方法和結構以及其等價形式也因此被覆蓋。一般技術除非另有標明,本發(fā)明實施采用常規(guī)免疫學、生物化學、化學、分子生物學、微生物學、細胞生物學、基因組學以及重組DNA技術,這些均在本領域人員技能范圍之內。參見Sambrook,F(xiàn)ritsch禾BManiatis,MOLECULARCLONING:ALABORATORYMANUAL(分子克隆實驗室手冊),第二版(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY(新編分子生物學方法)(F.M.Ausubel等編,(1987));METHODSINENZYMOLOGY(酶學方法叢書)(學術出版社(AcademicPress)):PCR2:APRACTICALAPPROACH(PCR2:實踐方法)(M丄MacPherson,B.D.Hames和G.R.Taylor編(l995)),Harlow和Lane,編(1988)ANTIBODY,ALABORATORYMANUAL(抗體,實驗室手冊)和ANIMALCELLCULTURE(動物細胞培養(yǎng))(R丄Freshney,編(1987))。定義在說明書和權利要求書中所使用單數(shù)形式"一個"、"一種"和"一"包括其復數(shù)形式,除非上下文另有指示。例如,術語"一個細胞"包括細胞的復數(shù)形式,及其混合物。本文中術語"多肽"、"肽"、"氨基酸序列"和"蛋白質"可互換使用,指任意長度氨基酸的聚合物。該聚合物可為線性或分枝,可包含修飾氨基酸,也可被非氨基酸打斷。該術語也涵蓋修飾的氨基酸聚合物,例如,形成二硫鍵、糖基化、脂化、乙?;⒘姿峄蚱渌魏尾僮?,如與標記組分偶聯(lián)的聚合物。本文所用術語"氨基酸"指天然和/或非天然或合成的氨基酸,包括但不限于甘氨酸和D或L光學異構體,氨基酸類似物和肽模擬物。使用標準單或三字母編碼表示氨基酸。"重復序列"是可被描述為重復肽序列、形成直接重復或反向重復,或多種序列基序交替重復的寡聚體。這些重復的寡聚序列彼此相同或同源,但也可有多種重復基序。重復序列的特征是信息含量極低。重復序列并非URP所需的特點,在某些情況下優(yōu)選非重復序列??筛鶕被岬氖杷员碚靼被?。已發(fā)展數(shù)個尺度范圍。一個尺度范圍的例子由Levitt,M等開發(fā)的(參見Levitt,M(1976)JMolBio1104,59,#3233,列在Hopp,TP等(1981)ProcNatlAcadSciUSA78,3824,#3232)。"親水性氨基酸"的例子為精氨酸、賴氨酸、蘇氨酸、丙氨酸、天冬酰胺和谷胺酰胺。尤感興趣的親水性氨基酸是天冬氨酸、谷氨酸、絲氨酸和甘氨酸。"疏水性氨基酸"的例子為色氨酸、酪氨酸、苯丙氨酸、甲硫氨酸、亮氨酸、異亮氨酸和纈氨酸。術語"變性構象"描述肽在溶液中的一種狀態(tài),其特征是肽主鏈的構象自由度很大。大多數(shù)肽和蛋白質在高濃度變性劑或升高溫度時轉變?yōu)樽冃詷嬒?。處于變性構象的肽具有特征CD譜,通常的特征在于如NMR檢測時缺少長范圍的相互作用。變性構象和未折疊構象為同義詞。本文中術語"非結構化蛋白質(UNP)序列"和"非結構化重組聚合物"(URP)可互換使用。這兩個術語指共有變性肽序列,如在本文詳述的生理條件下具有類似變性肽序列的典型行為的氨基酸序列。URP序列沒有確定的三級結構,并且經Chou-Fasman算法檢測具有有限的二級結構或無二級結構。本文所用術語"細胞表面蛋白"指細胞的質膜組分,涵蓋組成質膜的整合的和外圍的膜蛋白、糖蛋白、多糖和脂質。整合膜蛋白為跨越細胞質膜脂質雙層延伸的跨膜蛋白。一個典型的整合膜蛋白包含至少一個含疏水氨基酸殘基的跨膜片段。外圍膜蛋白不延伸進入脂質雙層疏水內部,通過與其它膜組分的共價或非共價相互作用直接或間接結合于膜表面。應用于細胞蛋白的術語"膜"、"細胞質"、"細胞核"和"分泌"特指該細胞蛋白最多的、主要的或優(yōu)選的胞外和/或亞細胞定位。"細胞表面受體"代表能夠與其各自配體結合的膜蛋白的一個亞組。細胞表面受體是錨定于細胞質膜上或插入細胞質膜中的分子。它們組成了一個大的蛋白、糖蛋白、多糖和脂質家族,它們不僅作為質膜的結構組分,也作為管理多種生物學功能的調控元件。術語"模塊"指蛋白的一個部分,該部分在物理上或功能上區(qū)別于該蛋白或肽的其它部分。一個模塊可包含一個或多個結構域。通常,模塊或結構域可為無關尺寸的單一穩(wěn)定三維結構。典型結構域的三級結構在溶液里保持穩(wěn)定并在分離或與其它結構域共價融合時保持不變。通常,結構域具有由二級結構空間關系(如卩-片層、a-螺旋和非結構化環(huán))形成的特定的三級結構。在微生物蛋白家族結構域中,二硫橋通常是決定三級結構的主要元件。在一些例子中,結構域是能夠產生某些特定功能活性,如親合力(對同一靶點的多個結合位點)、多特異性(對不同耙點的結合位點)、半衰期(使用一個結構域、環(huán)肽或線性肽)、與血清蛋白如人血清白蛋白(HSA)或IgG(hlgGl、2、3或4)或血紅細胞結合的模塊。功能確定結構域具有獨特的生物學功能。例如,受體的配體結合域是結合配體的結構域??乖Y合域指抗原結合單元的部分或者結合抗原的抗體。功能確定結構域無需由毗連氨基酸序列編碼。功能確定結構域可包含一個或多個物理確定的結構域。例如,受體通常分為胞外配體結合域、跨膜結構域和胞內效應結構域。"膜錨定結構域"指介導膜結合的蛋白部分。通常,膜錨定結構域由疏水氨基酸殘基組成?;蛘?,膜錨定結構域可包含修飾氨基酸,如與脂肪酸鏈連接的氨基酸,進而將該蛋白錨定到膜上。用于蛋白的"非天然產生的"指包含至少一個不同于對應野生型或天然蛋白的氨基酸的蛋白。執(zhí)行BLAST搜索檢測非天然序列,例如當比較窗口是感興趣序列(查詢序列)的長度且使用BLAST2.0與Genbank非冗余("nr")數(shù)據庫比較時使用最低最小概率和執(zhí)行BLAST搜索。Altschul等在(1990)J.Mol.Biol.215:403-410中分別描述了BLAST2.0算法。國家生物技術信息中心(NationalCenterforBiotechnologyInformation)向公眾提供執(zhí)行BLAST分析的軟件。"宿主細胞"包括可以是或已經成為主題載體接受體的細胞個體或細胞培養(yǎng)物。宿主細胞包括單個宿主細胞的后代。因為天然、意外或故意的突變,所述后代不一定與原始親本細胞完全相同(形態(tài)上或總DNA基因組上)。宿主細胞包括利用本發(fā)明載體體內轉染的細胞。本文所用術語"分離"指從細胞或其它組分中分離天然狀態(tài)下向關聯(lián)的多核苷酸、肽、多肽、蛋白質、抗體或其片段。本領域技術人員明了非天然產生的多核苷酸、肽、多肽、蛋白質、抗體及其片段無需通過"分離"來與其天然產生的對應物加以區(qū)分。此外,"濃縮的"、"分離的"或"稀釋的"多核苷酸、肽、多肽、蛋白質、抗體或其片段可與其天然產生的對應物加以區(qū)分,因為其每體積的濃度或分子數(shù)大于"濃縮的"或小于"分離的"其天然產生的對應物。本文中"連接的"和"融合的"或"融合"可互換使用。這些術語指通過任意方式包括化學偶聯(lián)或重組方式將兩個以上的化學元件或組分連接在一起。"框內融合"指兩個或多個開放閱讀框(OFR)以保持原始OFR正確閱讀框的方式連接形成一個連續(xù)較長的OFR。因此,所得到的重組融合蛋白是一個包含對應原始OFR編碼多肽的兩個或多個區(qū)段(通常在天然情況下這些區(qū)段并不如此連接)的蛋白。當上下文為多肽時,"線性序列"或"序列"指在多肽中氨基到羧基末端的方向的氨基酸順序,序列中彼此相鄰的殘基是該多肽一級結構的毗連序列。"部分序列"指已知在一個或兩個方向含有額外殘基的多肽部分的線性序列。"異源"指與該實體其余部分相比,衍生自不同基因型的實體。例如,將一段富甘氨酸序列從其天然編碼序列中移除并將其與除該天然編碼序列外的編碼序列操作性連接則得到異源富甘氨酸序列。應用于多核苷酸、多肽的術語"異源"指與該實體其余部分相比,該多核苷酸或多肽衍生自不同基因型的實體。術語"多核苷酸"、"核酸"、"核苷酸"和"寡核苷酸"可互換使用。它們指任意長度的核苷酸,或脫氧核糖核苷酸、核糖核酸或其類似物的聚合形式。多核苷酸可具有任意三維結構,并且可執(zhí)行已知或未知的任意功能。下列為多核苷酸的非限制性例子基因或基因片段的編碼或非編碼區(qū)、連鎖分析定義的基因座、外顯子、內含子、信使RNA(mRNA)、轉運RNA、核糖體RNA、核酶、cDNA、重組多核苷酸、分支多核苷酸、質粒、載體、分離的任意序列的DNA、分離的任意序列的RNA、核酸探針和引物。多核苷酸可包含修飾的核苷酸,如甲基核苷酸和核苷酸類似物。如果存在,可在聚合物組裝前或組裝后修飾核苷酸。非核苷酸組分可打斷核苷酸序列??稍诰酆虾筮M一步修飾多核苷酸,如與標記組分偶聯(lián)。應用于多核苷酸的"重組"指多核苷酸是各種克隆、限制性酶切和/或連接步驟及其它步驟的組合產物,這些步驟產生區(qū)別于自然界中找到的多核苷酸的構建物。本文中術語"基因"或"基因片段"可互換使用。它們指含有至少一個開放閱讀框的在轉錄和翻譯后可編碼特定蛋白的多核苷酸。只要多核苷酸包含至少一個覆蓋整個編碼區(qū)或其片段的開放閱讀框,則該基因或基因片段可以是基因組DNA或cDNA。"融合基因"是一個包含至少兩個連接在一起的異源性多核苷酸的基因。"載體"是將插入核酸分子轉運到宿主細胞中或至宿主細胞之間的優(yōu)選自我復制的核酸分子。該術語包括主要功能為將DNA或RNA插入細胞的載體、主要功能為DNA或RNA復制的復制載體和主要功能為DNA或RNA轉錄和/或翻譯的表達載體。也包括提供一種以上上述功能的載體。"表達載體"是引入合適宿主細胞時可被轉錄和翻譯成多肽的多核苷酸。"表達系統(tǒng)"通常指可用于產生所需表達產物的包含表達載體的合適宿主細胞。上下文為MURP時,"靶點"是結合模塊或URP連接結合模塊可結合,并且結合事件引發(fā)所需的生物學活性的化學分子或結構。靶點可以是被該蛋白抑制、激活或啟動的蛋白配體或受體。靶點的例子為激素、細胞因子、抗體或抗體片段、細胞表面受體、激酶、生長因子和其它具有生物學活性的化學結構。"功能模塊"可為蛋白產物中任意非URP。因此功能模塊可以是結合模塊(BM)、效應模塊(EM)、多聚化模塊(MM)、C末端模塊(CM)、或N末端模塊(NM)。通常,功能模塊的特征是其氨基酸序列的高信息含量,即它們包含許多不同的氨基酸并且這些氨基酸中很多對于功能模塊的功能重要。功能模塊通常具有二級和三級結構,可以是一個折疊蛋白結構域并可包含l、2、3、4、5或更多個二硫鍵。術語"微生物蛋白"指SCOP數(shù)據庫中的分類。微生物蛋白通常是具有固定結構的最小蛋白,通常但不絕對含有少至15個氨基酸及兩個二硫鍵,或多至200個氨基酸及多于10個二硫鍵。微生物蛋白可含一個或多個微生物蛋白結構域。不同的二硫鍵類型造成一些微生物蛋白結構域或結構域家族可具有多個穩(wěn)定性不同和多個相似性不同的結構,因此以相對方式使用術語穩(wěn)定來區(qū)分微生物蛋白與多肽和非微生物蛋白結構域。大多數(shù)微生物蛋白毒素由單一結構域構成,但細胞表面受體微生物蛋白常常具有多個結構域。微生物蛋白可如此之小,因為借助二硫鍵和/或離子如鈣、鎂、錳、銅、鋅、鐵或多種其它多價離子,而非通常的疏水核心使其折疊穩(wěn)定。術語"支架"指在構建蛋白文庫時用作保守共有序列的最小多肽"框架"或"序列基序"??勺兒统兾恢锰幱谥Ъ艿墓潭ɑ虮J貧埢?位置之間。在固定支架之間的可變區(qū)提供大量不同的氨基酸用以提供與靶分子的特異性結合。支架通常通過在序列相關蛋白家族比對時觀察到的保守殘基來限定。折疊或結構也許需要固定殘基,特別是當比對蛋白的功能不同時。對于一個微生物蛋白支架的描述可包含數(shù)量、位置或間距,半胱氨酸的結合模式,以及環(huán)中任一固定殘基的位置和種類,包括離子如鈣的結合位點。微生物蛋白的"折疊"很大程度上由二硫鍵連接模式(即1-4、2-6和3-5)定義。這種模式是拓撲學恒定的,并且在沒有斷開和重連二硫鍵(如通過還原和氧化(氧化還原劑))時通常不易轉化為另外的模式。通常,具有相關序列的天然蛋白采用相同的二硫成鍵模式。主要決定簇是半胱氨酸距離模式(CDP)和一些固定的非cys殘基以及金屬結合位點(如果存在)。在很少的例子中,蛋白折疊也受周圍序列(即前肽)的影響,在一些例子中通過殘基化學衍生化(即Y-羧基化)使蛋白與二價金屬離子(即鈣)結合幫助其折疊。對絕大多數(shù)微生物蛋白來說,此類折疊幫助是不必要的。然而,基于環(huán)的長度和組成的不同,這些具有相同成鍵模式的蛋白也可包含多個折疊,所述環(huán)足夠大,以賦予該蛋白完全不同的結構。一個例子是芋螺毒素、環(huán)毒素(cydotoxin)和anato結構域家族,它們具有相同的DBP但CDP明顯不同,被認為是不同的折疊。蛋白折疊的決定因素是相對于不同折疊極大改變結構,如半胱氨酸的數(shù)量和成鍵模式、半胱氨酸的間距、半胱氨酸間環(huán)的序列基序的不同(特別是折疊所需的固定環(huán)殘基或鈣(或其它金屬或輔因子)結合位點的位置或組成)的任何屬性。術語"二硫鍵成鍵模式"或"DBP"指半胱氨酸的連接模式,以l-n從蛋白質的N末端到C末端進行編號。二硫鍵成鍵模式是拓撲學恒定的,意味著利用如氧化還原條件解開一個或多個二硫鍵才可以對其進行改變。0048-0075段列出可能的2-、3-和4-二硫鍵成鍵模式。術語"半胱氨酸距離模式"或"CDP"指在線性蛋白鏈上分隔半胱氨酸的非半胱氨酸的數(shù)目。使用多種符號C5C0C3C等于C5CC3C等于CxxxxxCCxxxC。術語"位置n6"或"n7=4"指半胱氨酸間環(huán),"n6"指C6和C7間的環(huán);"n7=4"指C7和C8間的環(huán)長度為4個氨基酸(不計半胱氨酸)。血清降解抗性-可通過在血液中降解消除蛋白質,該降解通常涉及血清或血漿中的蛋白酶。通過將蛋白和人(或合適的小鼠、大鼠、猴)的血清或血漿在37。C下混和不同天數(shù)(即0.25、0.5、1、2、4、8、16天)來檢測血清降解抗性。然后,用Western實驗電泳這些時間點的樣品并利用抗體檢測蛋白。抗體可以是蛋白標簽的抗體。如果蛋白在western上顯示與注入蛋白大小相同的單一條帶,則無降解發(fā)生。Western檢測50%蛋白降解的時間點即為該蛋白的血清降解半衰期。血清蛋白結合-雖然MURP通常含有數(shù)個與細胞表面靶點和/或血清蛋白結合的模塊,但我們期望URP基本沒有非期望的活性。應設計URP最小化避免與血清蛋白,包括抗體的互相作用(結合)。利用ELISA篩選不同的URP設計與血清蛋白的結合,固定血清蛋白然后加入URP,孵育,洗滌后檢測結合的URP的量。一種方法是利用識別已加入URP的標簽的抗體檢測URP,一種不同的方法是固定URP(如通過與GFP融合),加入人血清,孵育,洗滌后利用第二抗體如山羊抗人IgG檢測仍結合于URP的人抗體量。利用這些方法我們設計的URP顯示出非常低水平的血清蛋白結合。然而,在一些應用中,需要與血清蛋白或血清接觸蛋白結合,例如,因為可以進一步延長分泌半衰期。在這種情況下,可使用相同實驗來設計與血清蛋白或血清接觸蛋白如HSA或IgG結合的URP。在另一些情況下,可將包含經設計與血清蛋白或血清接觸蛋白如HSA或IgG結合的肽的結合模塊置入MURP中。賴/靴織覆力本發(fā)明的一個方面是非結構化重組聚合物(URP)的設計。在產生具有治療和/或診斷價值的重組蛋白時,主題URP尤其有用。主題URP展示下列一種或多種特點。主題URP含有通常在生理條件下與變性肽序列具有共性的氨基酸序列。URP序列在生理條件下通常與變性肽序列行為類似。在生理條件下,URP序列缺少良好限定的二級和三級結構。本領域已建立多種方法來確定給定多肽的二級和三級結構。例如,利用"遠UV"譜區(qū)(190-250nm)的CD光譜來檢測多肽的二級結構。a-螺旋、p-折疊和隨機巻曲結構各自形成CD譜的特征峰和寬度。同樣可通過某些計算機程序和算法,如Chou-Fasman算法(Chou,P.Y.等(1974)5iocAemf對o;,13:222-45)確定二級結構。對于一個給定的URP序列,該算法能預測是否存在一些或根本不存在二級結構。通常,因為低程度的二級和三級結構,URP序列通常具有類似變性序列的譜。所期望的是能夠設計URP使其在生理條件下具有明顯變性的構象。URP序列通常在生理條件下具有很高程度的構象彈性,與相近分子量的球蛋白相比,它們趨于形成大的流體動力學半徑(Stokes半徑)。本文所用生理條件指一系列模擬活體狀況的條件,包括溫度、鹽濃度、pH。建立了許多體外實驗使用的生理相關條件。通常,生理緩沖液包含生理濃度的鹽并調整至中性pH范圍約6.5-7.8,優(yōu)選約7.0-7.5。Sambrook等(1989)之前列舉過數(shù)種生理緩沖液,在此不再贅述。生理相關溫度范圍從約250C-38^C,優(yōu)選約30。C-370C。主題URP可為低免疫原性序列。低免疫原性是URP序列構象彈性的直接結果。許多抗體識別蛋白抗原中的所謂構象表位。構象表位由含有蛋白抗原的多個不連續(xù)氨基酸序列的蛋白表面區(qū)域形成。蛋白的精確折疊使這些序列成為能被抗體識別的明確的特殊構型。設計優(yōu)選的URP以避免形成構象表位。例如,尤其感興趣的是在水溶液中很少趨于形成致密折疊構象的URP序列。具體說,通過選擇在抗原遞呈細胞中抵抗抗原加工的序列,選擇不與MHC良好結合的序列和/或選擇衍生自人序列的序列獲得低免疫原性。主題URP可為具有高度蛋白酶抗性的序列。蛋白酶抗性也可為URP序列構象彈性的結果??赏ㄟ^避免已知的蛋白酶識別位點設計蛋白酶抗性?;蛘?,可利用噬菌體展示或相關技術從隨機或半隨機序列文庫中選擇蛋白酶抗性序列。需要用于特殊應用,如從蛋白質儲庫中緩慢釋放時,可將血清蛋白酶切割位點構建到URP中。尤其感興趣的是在血液中高度穩(wěn)定(如長血清半衰期、不易被體液中的蛋白酶切割)的URP。主題URP的特征也在于,當摻入蛋白時,與無URP的對應蛋白相比,該蛋白顯示較長的半衰期和/或更高的溶解性。[確定血清半衰期的方法為本領域所失口(參見如Alvarez.P.等(2004)/所o/C/zem,279:3375-81)。通過實施本領域任意可用方法或本文列舉方法,易于測定與未修飾蛋白相比得到的蛋白是否具有較長的血清半衰期。主題URP可為(a)延長含URP蛋白的血清半衰期;(b)提高所得到蛋白的溶解性;(c)提高蛋白酶抗性;和/或(d)降低所得到的含URP蛋白的免疫原性所需的任何長度。通常,主題URP含有約30、40、50、60、70、80、90、100、150、200、300、400或更多個毗連的氨基酸。當摻入蛋白時,可將URP片段化使所得到的蛋白包含多個URP或多個URP片段。一些或所有的單獨URP序列可短于40個氨基酸,只要所得蛋白的所有URP序列的總長度至少為40個氨基酸。所得蛋白質中的URP序列總長度優(yōu)選超過40、50、60、70、80、90、100、150、200或更多個氨基酸。URP的等電點可以為1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、10.5、11.0、11.5、12.0、12.5或甚至13.0。通常,URP序列富含親水性氨基酸并包含低百分率的疏水或芳香族氨基酸。合適的親水性殘基包括但不限于甘氨酸、絲氨酸、天冬氨酸、谷氨酸、賴氨酸、精氨酸和蘇氨酸。構建URP時較不優(yōu)選的疏水性殘基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、異亮氨酸、纈氨酸和甲硫氨酸。URP序列可富含甘氨酸,但也可富含谷氨酸、天冬氨酸、絲氨酸、蘇氨酸、丙氨酸或脯氨酸。因此主要氨基酸可為G、E、D、S、T、A或P。包含脯氨酸殘基趨于降低對蛋白酶解的敏感性。包含親水性殘基通常會增加URP在生理條件下在水和水性介質中的溶解度。因為其氨基酸組成,URP序列在水性制劑中形成聚集的傾向低,URP序列和其它蛋白或肽的融合體趨于提高其溶解度并降低形成聚集體的傾向,這是降低免疫原性的單獨機制。設計URP序列以避免會使蛋白產生不良性質的某些氨基酸。例如,可設計URP序列以包含少量或不含下列氨基酸半胱氨酸(避免二硫鍵形成和氧化)、甲硫氨酸(避免氧化)、天冬酰胺和谷胺酰胺(避免脫氨基)。富甘氨酸t(yī)/iP:在一個實施方式中,主題URP包含富甘氨酸序列(GRS)。例如,主要出現(xiàn)甘氨酸,因此它是感興趣序列中最普遍的殘基。在另一個例子中,設計URP序列使甘氨酸殘基至少占總氨基酸的約30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%。URP也可含100%甘氨酸。在另一例子中,URP含至少30n/。甘氨酸,并且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的總濃度少于20%。在另一例子中,URP含有至少40%甘氨酸,并且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的總濃度少于10%。在另一例子中,URP含有至少50%甘氨酸,并且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的總濃度少于5%。GRS長度可以是約5-200個氨基酸或更多個氨基酸。例如,單個毗連GRS可含5、10、15、20、25、30、35、40、45、50、55、60、70、80、卯,IOO、120、140、160、180、200、240、280、320或400或更多個氨基酸。GRS兩端均可含甘氨酸。GRS也可含有顯著含量的其它氨基酸,例如Ser、Thr、Ala或Pro。GRS可含有顯著含量的帶負電氨基酸,包括但不限于Asp和Glu。GRS可含有顯著含量的帶正電氨基酸,包括但不限于Arg或Lys。所期望的是,設計URP僅包含單一類型的氨基酸(即Gly或Glu),有時僅含幾種類型的氨基酸,如2-5種氨基酸(如選自G、E、D、S、T、A或P),相反,一般蛋白和一般接頭通常由二十種氨基酸的大多數(shù)組成。URP可包含30、25、20、15、12、10、9、8、7、6、5、4、3、2或1。/。氨基酸位置的帶負電氨基酸(Asp,Glu)。通常,含GRS的主題URP具有約30、40、50、60、70、80、90、100、或更多個毗連氨基酸。當摻入蛋白時,URP可被片段化,以使所得蛋白包含多個URP或多個URP片段。一些或所有的單獨URP序列可短于40個氨基酸,只要所得蛋白的所有URP序列的總長度至少為30個氨基酸。所得蛋白質中的URP序列總長度優(yōu)選超過40、50、60、70、80、90、100或更多個氨基酸。尤其對含GRS的URP感興趣,部分因為含甘氨酸肽的構象自由度增加。溶液中的變性肽具有高度的構象自由度。所述肽與靶點如受體、抗體或蛋白酶的結合使大部分構象自由度喪失。這種熵的喪失需要肽及其靶點間互相作用的能量來補償。變性肽構象自由程度由其氨基酸序列決定。與較大側鏈氨基酸組成的肽相比,含有許多小側鏈氨基酸的肽趨于具有更高的構象自由度。含有甘氨酸的肽具有特別大的自由度。預計在溶液中,含甘氨酸的肽鍵的熵比含丙氨酸的相應序列高3.4倍(D'Aquino,J.A.等(1996)/Voto'm,25:143-56)。這個因素隨著序列中甘氨酸殘基的數(shù)目而增加。結果是此類肽在結合靶點時趨于喪失更多的熵,因此減弱了與其它蛋白作用的總體能力以及它們采用確定三維結構的能力。當分析蛋白結構的羅摩占陀羅印圖(Ramachandraplots)時,甘氨酸肽鍵的大構象彈性也很明顯,甘氨酸肽鍵占據的區(qū)域極少被其它肽鍵所占據(Venkatachalam,C.M.等(1969)爿朋wiev5/oc/zem,38:45-82)。Stites等研究了來自61個非同源高分辨率晶體結構的12,320個殘基的數(shù)據庫以檢測20個氨基酸各自的(p、v構象偏好。假定在天然狀態(tài)蛋白中觀察到的分布也反應了變性狀態(tài)中的分布。使用該分布來估算各殘基的能面,以便計算每一殘基相對于甘氨酸的相對構象熵。最極端的情況下,用脯氨酸代替甘氨酸,20°C時-0.82+/-0.08kcal/mol的構象熵變使得與變性狀態(tài)相比穩(wěn)定了天然狀態(tài)(Stites,W.E.等(1995)/Vo&'似,22:132)。這些觀察確認了甘氨酸在20個天然氨基酸中的特殊作用。設計主題URP時可使用天然的或非天然的序列。例如,表l、2、3、4提供了許多高甘氨酸含量的天然序列。本領域技術人員可采用任一序列作為URP或修飾該序列達到期望性質。當對宿主對象的免疫原性感興趣時,優(yōu)選根據衍生自宿主的富甘氨酸序列設計含GRS的URR。含GRS的URP的序列優(yōu)選來自人蛋白或與參考人蛋白相應的富甘氨酸序列有顯著同源性的序列。表l.含富甘氨酸序列的蛋白質的結構分析<table>tableseeoriginaldocumentpage25</column></row><table>登錄號NP—974499ZP—00458077XP—477841NP—910409NP610660生物體洋蔥伯克菌水稻水稻黑腹果蠅Gly(%)6466747566表2:編碼含300個或更多甘氨酸殘基的GRS的開放閱讀框GRS基因長度長度擬南芥509373371368322579518422400610預測功能未知推定的脂蛋白未知推定的細胞壁前體轉座元件表3.人GRS的例子登錄號Gly(%)GRS長度基因長度疏水性NP—00021762135622是NP—6319616173592是NP4764296570629是NP—0004187066316是NP—0569326066638是預測功能角蛋白9TBP相關因子15同種型1角蛋白3兜甲蛋白(loricrin),細胞包膜細胞角蛋白2表4.人GRS的附加例登錄號序列氨基酸數(shù)目NP006228.GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG37NP—787059GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG33NP一00卯60GGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGG32NP——031393GDGGGAGGGGGGGGSGGGGSGGGGGGG27NP—_005850GSGSGSGGGGGGGGGGGGSGGGGGG25NP—_061856GGGRGGRGGGRGGGGRGGGRGGG22NP—787059GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG33NP—00卯60GGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGG32NP——031393GDGGGAGGGGGGGGSGGGGSGGGGGGG27NP——115818GSGGSGGSGGGPGPGPGGGGG21XP—376532GEGGGGGGEGGGAGGGSG18NP—065104GGGGGGGGDGGG12POU結構域,4類,轉錄因子1[智人(i/omo^p/ew)]GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG含2的酵母結構域[智人]GGSGAGGGGGGGGGGGSGSGGGGSTGGGGGTAGGG富AT交互結構域IB(SWII樣)同種型3;BRGl結合蛋白ELD/0SA1;Eld(眼皮)/Osa蛋白[智人]GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG富AT交互結構域IB(SWII樣)同種型2;BRG1結合蛋白ELD/0SA1;Eld(眼皮)/Osa蛋白[智人]GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG富AT交互結構域IB(SWII樣)同種型1;BRG1結合蛋白ELD/OSA1;Eld(眼皮)/Osa蛋白[智人]GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG富嘌呤元件結合蛋白A;富嘌呤單鏈DNA結合蛋白a;轉錄激活蛋白PUR-a[智人]GHPGSGSGSGGGGGGGGGGGGSGGGGGGAPGG調節(jié)因子X1;順式調節(jié)因子1;增強因子C;MHCII類調節(jié)因子RFXGGGGSGGGGGGGGGGGGGGSGSTGGGGSGAG白血病破壞的含鎮(zhèn)靜域(bromodomain)蛋白[智人]GGRGRGGRGRGSRGRGGGGTRGRGRGRGGRG未知蛋白[智人]GSGGSGGSGGGPGPGPGGGGGPSGSGSGPG預測假擬蛋白XP_059256[智人]GGGGGGGGGGGRGGGGRGGGRGGGGEGGG鋅指蛋白281;ZNP-99轉錄因子[智人]GGGGTGSSGGSGSGGGGSGGGGGGGSSQRNA結合蛋白(自身抗原性,致死黃色相關hnRNP)短同種型;RNA結合蛋白(自身抗原性);RNA結合蛋白(自身抗原性,致死黃色相關hnRNP)[智人]GDGGGAGGGGGGGGSGGGGSGGGGGGG信號識別顆粒68kDa[智人]GGGGGGGSGGGGGSGGGGSGGGRGAGGKIAA0265蛋白[智人]GGGAAGAGGGGSGAGGGSGGSGGRGTG鋸齒狀同源物2;鋸齒狀-2[智人]GAGGGRGGGAGGEGGASGAEGGGGAGGRNA結合蛋白(自身抗原性,致死黃色相關hnRNP)長同種型;RNA結合蛋白(自身抗原性);RNA結合蛋白(自身抗原性,致死黃色相關hnRNP)[智人]GDGGGAGGGGGGGGSGGGGSGGGGGGG雄激素受體;二氫睪酮受體[智人]GGGGGGGGGGGGGGGGGGGGGGGEAG同源框D11;同源框4F;Hox-4.6,小鼠,同源物;同源框蛋白Hox-Dll[智人]GGGGGGSAGGGSSGGGPGGGGGGAGG巻曲蛋白8;巻曲蛋白(果蠅)同源物8[智人]GGGGGPGGGGGGGPGGGGGPGGGGG眼發(fā)育相關基因[智人]GRGGAGSGGAGSGAAGGTGSSGGGG同源框B3;同源框2G;同源框蛋白Hox-B3[智人]GGGGGGGGGGGSGGSGGGGGGGGGG染色體2開放閱讀框29[智人]GGSGGGRGGASGPGSGSGGPGGPAGDKFZP564F0522蛋白[智人]GGHHGDRGGGRGGRGGRGGRGGRAG預測與同源框跳過偶數(shù)的(even-skipped)同源蛋白2(EVX-2)相似[智人]GSRGGGGGGGGGGGGGGGGAGAGGGras同源基因家族,U成員;RyuGTP酶;Wnt-l反應性Cdc42同源物;2310026M05Rik;GTP結合蛋白1;CDC42樣GTP酶[智人]GGRGGRGPGEPGGRGRAGGAEGRG抓撓(scratch)2蛋白;轉錄抑制子抓撓2;抓撓(果蠅同源物)2,鋅指蛋白[智人]GGGGGDAGGSGDAGGAGGRAGRAG核仁蛋白家族A,成員1;GAR1蛋白[智人]GGGRGGRGGGRGGGGRGGGRGGG角蛋白l;角蛋白-l;細胞角蛋白1;毛發(fā)a蛋白[智人]GGSGGGGGGSSGGRGSGGGSSGG假擬蛋白FLJ31413[智人]GSGPGTGGGGSGSGGGGGGSGGG單切(onecut)結構域,家族成員2;單切2[智人]GARGGGSGGGGGGGGGGGGGGPGPOU結構域,3類,轉錄因子2[智人]GGGGGGGGGGGGGGGGGGGGGDG預測與THO復合物亞基4(Tho4)(RNA和輸出因子結合蛋白l)(REFl-I)(AML-l禾QLEF-1的聯(lián)盟)(Aly/REF)相似[智人]GGTRGGTRGGTRGGDRGRGRGAG預測與THO復合物亞基4(Tho4)(RNA和輸出因子結合蛋白l)(REFl-I)(AML-l禾卩LEF-1的聯(lián)盟)(Aly/REF)[智人]GGTRGGTRGGTRGGDRGRGRGAGPOU結構域,3類,轉錄因子3[智人]GAGGGGGGGGGGGGGGAGGGGGG核仁蛋白家族A,成員l;GAR1蛋白[智人]GGGRGGRGGGRGGGGRGGGRGGG核仁纖維蛋白;34-kD核仁硬皮病抗原;RNA,U3小核仁相互作用蛋白質l[智人]GRGRGGGGGGGGGGGGGRGGGG鋅指蛋白579[智人]GRGRGRGRGRGRGRGRGRGGAG鈣蛋白酶,小亞基1;鈣激活中性蛋白酶;鈣蛋白酶,小多肽;鈣蛋白酶4,小亞基(30K);鈣依賴性蛋白酶,小亞基[智人]GAGGGGGGGGGGGGGGGGGGGG角蛋白9[智人]GGGSGGGHSGGSGGGHSGGSGG叉頭(forkhead)框Dl;叉頭框相關激活物4;叉頭蛋白,果蠅,同源物樣8;叉頭蛋白(果蠅)樣8[智人]GAGAGGGGGGGGAGGGGSAGSG預測與RIKENcDNAC230094B15相似[智人]GGPGTGSGGGGAGTGGGAGGPGGGGGGGGGGAGGAGGAGSAGGG鈣粘著蛋白22前體;大鼠PB-鈣粘著蛋白直向同源物[智人]GGDGGGSAGGGAGGGSGGGAGAT結合轉錄因子1;AT基序結合因子l[智人]GGGGGGSGGGGGGGGGGGGGG脫中胚蛋白;t盒,腦,2;脫中胚蛋白(非洲爪蟾(Xenopuslaevis))同源物[智人]QPQAQAQSQA^SSGGGGGPG磷脂酰肌醇轉運蛋白,膜結合2;PYK2N末端結構域-相互作用受體3;視網膜變性Ba2(果蠅)[智人]GGGGGGGGGGGSSGGGGSSGG精子相關抗原8同種型2;精子膜蛋白l[智人]預測RNA結合基序蛋白27[智人]APIY亞基結合蛋白1同種型1;Y-synergin;銜接子相關蛋白復合物1Y亞基結合蛋白1[智人]GAGSGGGGAAGAGAGSAGGGGAPIY亞基結合蛋白1同種型2;Y-synergin;銜接子相關蛋白復合物1Y亞基結合蛋白1[智人]GAGSGGGGAAGAGAGSAGGGG包含1的錨定蛋白重復和貧瘠(sterile)a基序結構域;包含1的錨定蛋白重復和SAM結構域[智人]GGGGGGGSGGGGGGSGGGGGG甲基-CpG結合域蛋白2同種型1[智人]三功能結構域(PTPRF相互作用)[智人]GGGGGGGSGGSGGGGGSGGGG叉頭蛋白盒D3[智人]GGEEGGASGGGPGAGSGSAGG精子相關抗原8同種型1;精子膜蛋白1[智人]甲基-CpG結合域蛋白質2睪丸特異性同種型[智人]細胞死亡調節(jié)坑(aven);程序性細胞死亡12[智人]GGGGGGGGDGGGRRGRGRGRG無義轉錄物調節(jié)子1;S解旋酶;向上移碼突變1同源物(釀酒酵母(S.cerevisiae));無義mRNA還原因子1;酵母Upflp同源物[智人〗GGPGGPGGGGAGGPGGAGAG小電導鈣激活鉀通道蛋白2同種型a;蜂毒明肽敏感型小電導Ca2+激活的鉀通道[智人]GTGGGGSTGGGGGGGGSGHGSRY(性別決定區(qū)Y)-盒1;SRY相關性HMG-盒基因1[智人]GPAGAGGGGGGGGGGGGGGG轉錄因子20同種型2;基質溶素-1血小板衍生生長因子響應元件結合蛋白;基質溶素1PDGF響應元件結合蛋白;SPRE結合蛋白;核因子SPBP[智人]GGTGGSSGSSGSGSGGGRRG轉錄因子20同種型1;基質溶素-1血小板衍生生長因子響應元件結合蛋白;基質溶素1PDGF響應元件結合蛋白;SPRE結合蛋白;核因子SPBP[智人]GGTGGSSQSSGSGSGGGRRGRas相互作用蛋白1[智人]QSQTQTTQSSGAGGPGTPGGBMP-2誘導型激酶同種型b[智人]GGSGGGAAGGGAGGAGAGAGBMP-2誘導型激酶同種型a[智人]GGSGGGAAGGGAGGAGAGAG叉頭蛋白盒C1;叉頭蛋白相關激活物3;叉頭蛋白,果蠅,同源物樣7;叉頭蛋白(果蠅)樣7;虹膜發(fā)育不全(iridogoniodysgenesis)l型[智人]QSSGGGGGGAGAAGGAGGAG剪接因子p54;富精氨酸的54kDa核蛋白[智人]QPQPSGGPGGGGGGGGGGGGv-maf肌肉腱膜纖維肉瘤癌基因同源物;禽肌肉腱膜纖維肉瘤(MAF)原癌基因;v-maf肌肉腱膜纖維肉瘤(禽類)癌基因同源物[智人]GGGGGGGGGGGGGGAAGAGG小核核蛋白Dl多肽16kDa;snRNP核心蛋白Dl;Sm-D自身抗原;小核核蛋白Dl多肽(16kD)[智人]GRGRGRGRGRGRGRGRGRGG假擬蛋白H41[智人]QSA巡SSGAAGAAGGGAGAG會漆綠虔殘基游匿(M/;:選擇這些HRS中的非甘氨酸序列以優(yōu)化URP和含有所需URP的蛋白的性質。例如,可優(yōu)化URP序列以提高所得到蛋白對于特定組織、特定細胞類型或細胞譜系的選擇性。例如,可摻入并非廣泛表達但在一種或多種身體組織和患有疾病的所選組織中差異表達的蛋白序列,這些身體組織包括心臟、肝臟、前列腺、肺、腎、骨髓、血液、皮膚、膀胱、腦、肌肉、神經和所選擇的組織,這些疾病包括感染性疾病、自身免疫病、腎病、神經病、心臟病和癌癥等??墒褂么硖囟òl(fā)育起源的序列,如多細胞生物體中在胚胎、成體的外胚層、內胚層和中胚層形成時表達的序列。也可利用涉及特定生物學過程,包括但不限于細胞周期調節(jié)、細胞分化、凋亡、趨化、細胞運動和細胞骨架重排的序列。也可利用其它非廣泛表達的蛋白序列引導所得到的蛋白到達特定的亞細胞位置胞外基質、細胞核、胞質、細胞骨架、胞漿和/或胞內膜結構,包括但不限于包被小窩、高爾基體、內質網、胞內體、溶酶體和線粒體。已知多種組織特異性、細胞類型特異性、亞細胞定位特異性序列并可從數(shù)種蛋白數(shù)據庫中獲取。通過產生隨機或半隨機URP序列文庫、將其注射入動物或病人并檢測組織樣本中具有所需組織選擇性的序列來獲取選擇性URP序列??捎觅|譜檢測序列。使用類似方法可選擇利于口服、含服、腸道、鼻腔、鞘內、腹膜、直腸或皮膚攝取的URP序列。尤感興趣的是有助于細胞攝取或穿膜轉運的含相對富含帶正電精氨酸或賴氨酸區(qū)域的URP序列??稍O計URP序列使其含有一個或多個蛋白酶敏感序列。一旦本發(fā)明產品到達其靶位置,即可切割掉這種URP序列。這種切割可觸發(fā)藥學活性結構域的效能(前藥活化)或增強切割產物與受體的結合。可設計URP序列通過引入天冬氨酸或谷氨酸殘基使其帶過多負電荷。尤其感興趣的是含有多于5%、多于6%、7%、8%、9%、10%、15%、30%或更多谷氨酸且少于2。/。賴氨酸或精氨酸的URP。此類URP攜帶過多負電荷,由于該肽單個負電荷之間的靜電排斥作用使其趨于采取開放構象。此種過多負電荷引起其流體力學半徑有效增加并因此降低此類分子的腎臟清除率。因此,可通過控制URP序列中帶負電氨基酸的頻率及分布來調解URP序列的有效凈電荷及流體力學半徑。人或動物的多數(shù)組織及表面帶過多負電荷。通過設計帶過多負電荷的URP,可將含URP的所得蛋白和不同表面如血管、健康組織或不同受體之間的非特異性相互作用減至最小。URP可含有(基序、形式的重復氨基酸序列,其中序列基序形成直接重復(艮卩ABCABCABCABC)或反向重復(ABCCBAABCCBA),并且這些重復的次數(shù)可為2、3、4、5、6、7、8、9、10、12、14、16、18、20、22、24、26、28、30、35、40、50或更多。URP或URP內部的重復經常僅包含1、2、3、4、5或6種不同類型的氨基酸。URP通常由長度為4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、24、26、28、30、32、34、36或更多個氨基酸的人氨基酸序列重復組成,但URP也可由長度為20、22、24、26、28、30、32、34、36、3840、42、44、46、48、50個氨基酸的非人氨基酸序列組成。臟應乂,層,..URP可衍生自人序列。人基因組包含很多富含特定氨基酸的亞序列。尤其感興趣的是富含親水性氨基酸如絲氨酸、蘇氨酸、谷氨酸、天冬氨酸、或甘氨酸的此類氨基酸序列。尤其感興趣的是幾乎不含疏水性氨基酸的此類亞序列。預計此類亞序列為非結構化并在水性溶液中高度可溶??尚揎棿祟惾藖喰蛄幸赃M一步改進其實用性。圖17顯示富絲氨酸的示例性人序列,可分離作為主題URP。示例性的牙本質涎磷蛋白含670個氨基酸的亞序列,其中64%的殘基為絲氨酸,并且多數(shù)其它位置為親水性氨基酸,如天冬氨酸、天冬酰胺和谷氨酸。該序列極度重復因此信息含量低。可直接利用此類人蛋白的亞序列。所期望的是,以保留其總體特點但使其更適合藥物應用的方式修飾該序列。與牙本質涎磷蛋白相關的序列例子為(SSD)n、(SSDSSN)n、(SSE)。,其中n為約4-200。在設計人個體免疫原性降低的URP時尤其希望使用來自人蛋白的序列。弓I發(fā)對于外來蛋白免疫應答的關鍵步驟是MHC2類受體遞呈所述蛋白的肽片段。這些MHCII結合片段可被T細胞受體檢測,觸發(fā)T輔助細胞的增殖并啟動免疫應答。從藥物蛋白上減少T細胞表位被認為是減少引發(fā)免疫應答風險的方法(Stickler,M.等(2003)J/mmw"o/M"/wcfe,281:95-108)。MHCII受體通常與具有如9個氨基酸的區(qū)域展示肽的表位相互作用。因此,若所有或多數(shù)可能的9聚體亞序列能從人蛋白中找到,這些序列和序列的重復不會被病人認作外源序列,便可減少在病人體內引發(fā)對蛋白的免疫應答的風險。通過寡聚化或連接具有合適氨基酸組成的人序列,可將人序列摻入URP設計。它們可為直接重復或反向重復或不同重復的混合。例如可將表2所示序列寡聚化。此類寡聚物具有低的免疫原風險。然而,單體單元的連接序列仍可包含觸發(fā)免疫反應的T細胞表位,如圖3所示。通過設計基于多重交疊人序列的URP可進一步降低引發(fā)免疫應答的風險。該方法如圖4所示。圖2中URP序列的設計為基于多重人序列設計的寡聚體,因此寡聚體中每一9聚體亞序列可在人蛋白中找到。在這些設計中,每一9聚體亞序列為人序列。圖5顯示基于三個人序列的URP的例子。也可基于單個人序列設計URP序列,因此寡聚URP序列中所有可能的9聚體亞序列均出現(xiàn)在同一人蛋白中。圖6顯示了基于富甘氨酸和脯氨酸的POU結構域的例子。圖6顯示URP序列中重復單體僅為人蛋白的一個片段,其側接序列與重復單位相同。同樣可根據人蛋白設計非寡聚化URP序列。首要條件是所有9聚體亞序列可在人序列中找到。序列的氨基酸組成優(yōu)選幾乎不含疏水性殘基。尤其感興趣的是基于人序列設計的并包含大量甘氨酸殘基的URP序列。利用這個或相似的方案,可設計包含對感興趣宿主具有低免疫原性重復序列的一類URP。感興趣的宿主可為任意動物,包括脊椎動物和無脊椎動物。優(yōu)選宿主為哺乳動物,如靈長類(如黑猩猩和人)、鯨類(如鯨和海豚)、翼手類(如蝙蝠)、奇蹄類(如馬和犀牛)、嚙齒類(如大鼠)和某些食蟲類如地鼠、鼴鼠和刺猬。當選擇人作為宿主時,URP通常含有多個拷貝的重復序列或單元,其中包含約6-15個毗連氨基酸的區(qū)段多數(shù)出現(xiàn)于一種或多種天然人蛋白中。也可設計包含約9-15個毗連氨基酸的區(qū)段多數(shù)出現(xiàn)于一種或多種天然人蛋白中。本文所使用的大部分區(qū)段指多于約50%、優(yōu)選60%、優(yōu)選70%、優(yōu)選80%、優(yōu)選90%、優(yōu)選100%的區(qū)段。期望重復單元內的每一約6-15氨基酸,優(yōu)選約9-15氨基酸的可能區(qū)段均出現(xiàn)在一種或多種天然人蛋白中。URP能包含多個重復單元或序列,例如具有2、3、4、5、6、7、8、9、10活更多個重復單元?;?乂r潘應表位游匿靴._可設計URP序列使其基本不含能被人T細胞識別的表位。例如,可合成含有有助于形成變性的非結構化構象的氨基酸組成的一系列半隨機序列,并評價這些序列中是否存在人T細胞表位以及它們是否為人序列。已描述用于人T細胞表位的實驗(Stickler,M.等(2003)J/7wn朋o/MeAo&,281:95。108)。尤其感興趣的是可在不產生T細胞表位和非人序列的情況下寡聚化的肽序列。通過檢測這些序列直接重復中是否存在T細胞表位和非人6-15聚體,特別是9聚體亞序列,來實現(xiàn)上述目的。另一種方法是利用前述人序列組裝章節(jié)組裝為重復單元的多個肽序列。另一備選方案是設計利用表位預測算法如T表位(TEPITOPE)低評分的URP序歹!j(Sturniolo,T.等(1999)Ato歷ofec/mo/,17:555-61)。另一避免T細胞表位的方法是避免在MHC上肽展示當中用作錨定殘基的氨基酸,如M、I、L、V、F。疏水性氨基酸和帶正電氨基酸經??勺鳛榇祟愬^定殘基,最大程度降低其在URP序列中的頻率減少T細胞表位產生的機會及因此引發(fā)的免疫反應。通常所選URP包含至少在一種人蛋白中找到的亞序列,并包含較低含量的疏水性氨基酸。設計URP序列以優(yōu)化蛋白生產,可通過避免和最大程度降低編碼DNA的重復性達到此目的。URP序列如多聚甘氨酸可具有非常良好的藥物特性,但是編碼GRS的DNA序列中高GC含量以及存在可導致重組的重復DNA序列引起制造的困難。如上所述,可設計在氨基酸水平高度重復的URP序列。因此URP序列具有很低的信息含量并且可降低引發(fā)免疫反應的風險。包含重復氨基酸的URP的非限制性例子為多聚甘氨酸、多聚谷氨酸、多聚天冬氨酸、多聚絲氨酸、多聚蘇氨酸、(GX)n,其中G是甘氨酸且X是絲氨酸、天冬氨酸、谷氨酸、蘇氨酸或脯氨酸,n至少為20;(GGX)n,其中X是絲氨酸、天冬氨酸、谷氨酸、蘇氨酸或脯氨酸,n至少為13;(GGGX)n,其中X是絲氨酸、天冬氨酸、谷氨酸、蘇氨酸或脯氨酸,n至少為10;(GGGGX)n,其中X是絲氨酸、天冬氨酸、谷氨酸、蘇氨酸或脯氨酸,n至少為8;(GzX)n,其中X是絲氨酸、天冬氨酸、谷氨酸、蘇氨酸或脯氨酸,n至少為15,并且z是1-20。這些重復的數(shù)目可為10-100的任意數(shù)字。本發(fā)明產品可包含半隨機序列的URP序歹ij。例子可為包含至少30、40、50、60或70%甘氨酸的半隨機序列,其中甘氨酸分散良好且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的組合總濃度小于70、60、50、40、30、20或10%。優(yōu)選半隨機URP序列包含至少40%甘氨酸并且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的總濃度少于10%。更優(yōu)選的隨機URP序列包含至少50%甘氨酸并且色氨酸、苯丙氨酸、酪氨酸、纈氨酸、亮氨酸和異亮氨酸的總濃度小于5%??赏ㄟ^將兩個或多個短URP序列或URP序列片段合并來設計URP序列。這種合并能夠更好的調節(jié)含URP序列產品的藥物特性并減少編碼URP序列的DNA序列的重復性,從而提高URP編碼序列的表達并減少其重組。設計并選擇具有如下期望特性的URP序列a)編碼序列在生產宿主中的高度遺傳穩(wěn)定性;b)表達水平高;c)低(預測的/計算的)免疫原性;d)在血清蛋白酶和/或其它蛋白酶中具有高穩(wěn)定性;e)生理條件下流體動力學半徑大。一個獲得符合多個標準的URP序列的示范性方法是構建候選序列的文庫并從文庫中鑒定合適的亞序列。文庫可包含隨機和/或半隨機的序列。特別有用的是密碼子文庫,這是包含相同氨基酸殘基多種密碼子的DNA分子文庫。應用密碼子隨機化選擇某種類型的或多數(shù)的或所有的氨基酸位置。真密碼子文庫僅編碼單一氨基酸序列,但易于與氨基酸文庫合并,形成在同樣殘基位置編碼(相關或無關)氨基酸混合物的DNA分子群體。用密碼子文庫可以鑒定在DNA水平低重復性但編碼高重復性氨基酸序列的基因。這點非常有用,因為重復DNA序列趨于重組,引起不穩(wěn)定性。也可構建編碼有限氨基酸多樣性的密碼子文庫。此類文庫允許在序列的某些位置引入有限數(shù)量的氨基酸,然而其它位置允許密碼子變化,但所有密碼子編碼同一氨基酸。在寡核苷酸合成時可通過在同一位置摻入核苷酸混合物合成部分隨機寡核苷酸。此類部分隨機寡核苷酸可通過交疊PCR或基于連接的方法融合。具體說,可多聚化編碼富甘氨酸序列的半隨機寡核苷酸。這些寡核苷酸在長度、序列和密碼子使用上不同。結果是,可獲得候選URP序列的文庫。另一個產生文庫的方法是合成起始序列后再將所述序列部分隨機化??赏ㄟ^在突變株中培育編碼URP序列的基因或通過在誘變環(huán)境中擴增編碼基因實現(xiàn)(Leung,D.等(1989)Technique,1:11-15)。利用數(shù)種方法從文庫中鑒定具有所需性質的URP序列。在生產宿主中培育該文庫富集具有高度遺傳穩(wěn)定性的序列。不穩(wěn)定的序列會累計突變,可通過DNA測序鑒定??墒褂帽绢I域熟練技術人員所知道的方法篩選或選擇,以鑒定可高水平表達的URP序列變體。例如可從培育多個文庫分離物并比較其表達水平。通過凝膠分析、分析色譜或多種基于ELISA的方法測定表達水平。將候選URP序列文庫與諸如myc標簽、His標簽、HA標簽的序列標簽融合有利于測定每種序列變體的表達水平。另一方法是將文庫與酶或其他報告蛋白如綠色熒光蛋白融合。尤其感興趣的是將文庫與選擇性標記如P-內酰胺酶或卡那霉素-?;D移酶融合??衫每股剡x擇來富集表達水平高且遺傳穩(wěn)定性好的變體。與蛋白酶孵育后篩選完整序列以鑒定具有良好蛋白酶抗性的變體。有效鑒定蛋白酶抗性URP序列的途徑是噬菌體展示或相關展示方法。已經描述了可通過噬菌體展示富集發(fā)生快速蛋白酶解的序列的多種系統(tǒng)。容易采用這些方法來富集蛋白酶抗性序列。例如,可在親和標簽和M13噬菌體pIII蛋白之間克隆候選URP序列文庫。然后使該文庫接觸蛋白酶或含蛋白酶的生物樣品如血液或溶酶體制備物。蛋白酶作用后可通過與親和標簽結合捕獲含有蛋白酶抗性序列的噬菌體。尤其感興趣的是能夠抵抗溶酶體制備物降解的序列,因為溶酶體降解是樹突細胞和其他抗原遞呈細胞在抗原遞呈中的關鍵步驟??墒褂檬删w展示鑒定不與特定免疫血清結合的候選URP序列,以鑒定具有低免疫原性的URP序列??衫煤蜻xURP序列或URP序列文庫免疫動物以產生抗文庫中URP序列的抗體。將所得血清用于噬菌體淘選以移除或鑒定被所得免疫血清中抗體識別的序列。也可利用其它方法如細菌展示、酵母展示、核糖體展示識別具有所需特性的URP序列變體。另一方法是利用質譜鑒定感興趣的URP序列。例如,將候選URP序列文庫與感興趣的蛋白酶或生物樣品孵育并利用質譜鑒定抗降解的序列。可利用相似的方法鑒定利于口服攝取的URP序列??蓪⒑蜻xURP序列的混合物飼喂動物或人,并利用質譜鑒定跨組織屏障(即皮膚等)轉運或攝取效率最高的變體。以相似的方式,鑒定利于其它攝取機制如經肺、鼻內、直腸、透皮遞送的URP序列。也可鑒定利于細胞攝取的URP序列或抗細胞攝取的URP序列??赏ㄟ^合并上述方法設計的任意URP序列或URP序列的片段來設計URP序列。此外,可應用半隨機方法對基于上述規(guī)則設計的序列進行優(yōu)化。尤其感興趣的是出于提高增強蛋白的表達及提高編碼基因在生產宿主中的遺傳穩(wěn)定性的目的而進行的密碼子優(yōu)化。對于富含甘氨酸或氨基酸序列重復性非常高的URP序列,密碼子優(yōu)化非常重要??衫糜嬎銠C程序進行密碼子優(yōu)化(Gustafsson,C.等(2004)7>ewA5/otec/mo/,22:346-53),其中一些能最大程度降低核糖體間歇(CodaGenomicsInc.)(考達基因組學公司)。當設計URP序列時可考慮一些性質??勺畲蟪潭冉档途幋aDNA序列的重復性。此外,可避免或最大程度降低使用生產宿主中很少用到的密碼子(即AGG和AGA精氨酸密碼子和大腸桿菌(E.coli)中的一個亮氨酸密碼子)。具有高水平甘氨酸的DNA序列趨于高GC含量,可導致不穩(wěn)定性和表達水平低。因此,可能時優(yōu)先選擇使URP編碼序列的GC含量適合用于制造URP的生產有機體的密碼子??赏ㄟ^全合成或合成加上酶加工,如限制性酶介導的克隆、PCR和交疊延伸,利用一步或多步來制造URP編碼基因。構建URP模塊使URP模塊編碼基因具有低重復性而編碼的氨基酸序列具有高度重復性。圖11顯示該方法。第一步,構建相對短的URP序列文庫。這可以是純密碼子文庫,每一文庫成員具有相同的氨基酸序列但可能有許多種不同的編碼序列。將該文庫與報告蛋白融合有利于鑒定良好表達的文庫成員。合適報道基因的例子有綠色熒光蛋白、螢光素酶、堿性磷酸酶、P-半乳糖苷酶。通過篩選可鑒定能在所選宿主有機體中高濃度表達的短URP序列。然后,生成隨機URP二聚體文庫并重復篩選高水平表達。通過連接、交疊延伸或類似克隆技術來進行二聚化??芍貜蛿?shù)次二聚化過程和后續(xù)的篩選直至所得URP序列達到所需長度。可選地,對文庫內克隆進行測序以消除含有非所需序列的分離物。短URP序列初始文庫允許氨基酸序列變化。例如,可將一些密碼子隨機化使一些親水氨基酸出現(xiàn)在所述位置。在反復多聚化的過程中,除對高水平表達進行篩選外,還可對文庫內成員的其它特性進行篩選,如溶解度、蛋白酶抗性。除了二聚化URP序列外,還可產生更長的多聚物。這能夠更快的增加URP模塊的長度。許多URP序列富含特定氨基酸。因為編碼基因可能含有易受重組的重復序列,因此利用重組技術難以產生此類序列。而且,因為在生產宿主中各自裝載的tRNA有限,所以高頻出現(xiàn)特定密碼子的基因可限制表達。一個例子是GRS的重組生產。4種三連體編碼甘氨酸殘基,它們是GGG、GGC、GGA禾口GGT。結果是編碼GRS的基因趨于具有高GC含量并且重復性特別高。生產宿主的密碼子偏好是另一個挑戰(zhàn)。當(生產宿主為)大腸桿菌時,兩個甘氨酸密碼子GGA和GGG很少被用于高表達蛋白質。因此非常需要對編碼URP序列的基因進行密碼子優(yōu)化??墒褂每紤]密生產宿主碼子偏好的計算機程序優(yōu)化密碼子使用(Gustafsson,C.等(2004)7>e"A5/o&c/z"o/,22:346-53)。此外,可構建密碼子文庫,其所有成員編碼同樣氨基酸序列但使用不同密碼子??珊Y選此類文庫獲得高表達和遺傳穩(wěn)定的成員,它們特別適合大規(guī)模生產含URP產物。多份賴離簠邀歪維證人.如上所述,在設計具有治療價值的蛋白時主題URP是非常有用的模塊。因此,本發(fā)明提供包含一個或多個主題URP的蛋白。本文中此類蛋白命名為非結構化重組蛋白(MURP)。為了構建MURP,將一個或多個URP序列與蛋白N末端或C末端融合,或將其插入到蛋白中間,如插入到蛋白環(huán)中或感興趣蛋白模塊之間,使所得修飾蛋白與未修飾蛋白相比性質改善。連接于蛋白的URP序列的總長度可為40、50、60、70、80、90、100、150、200或更多個氨基酸。主題MURP具有如下詳述的一種或多種改善的性質。改善游舉,教將URP序列加在藥學活性蛋白可改善該蛋白的多種性質。具體說,加入長URP序列能顯著延長蛋白的血清半衰期。此類URP通常包含至少約40、50、60、70、80、90、100、150、200或更多個氨基酸的氨基酸序列??墒筓RP片段化,以使所得蛋白包含多個URP或多個URP片段。一些或所有這些獨立URP序列可短于40個氨基酸,只要所得蛋白中所有URP序列的總長度至少為30個氨基酸。優(yōu)選地,所得蛋白中URP總長度超過40、50、60、70、80、90、100、150、200或更多個氨基酸。在一個方面,融合URP能增加蛋白的流體力學半徑并因此降低腎從血液中清除該蛋白的速率。可利用超速離心、大小排阻色譜或光散射檢測所得融合蛋白流體力學半徑相對于未修飾蛋白的增加。改姜游蘊織透擇絲.-流體力學半徑增加引起組織滲透減少,可利用這點將藥學活性蛋白的副作用降至最小。已有記載,由于增強的透性和滯留(EPR)效應,親水性聚合物趨于選擇性蓄積于腫瘤組織中。EPR效應的潛在原因是腫瘤血管的滲漏屬性(McDonald,D.M.等(2002)CancerRes,62:5381-5)以及腫瘤組織中缺少淋巴流出。因此,通過加入親水性聚合物可增強用于腫瘤組織的藥學活性蛋白的選擇性。同樣,摻入主題URP可提高給定藥學活性蛋白的治療指數(shù)。A李i欲辨嫂頗絲A華爍.'加入URP序列能顯著提高蛋白質的蛋白酶抗性。可設計URP序列使其自身具有蛋白酶抗性,并通過將其與蛋白連接使該蛋白避免接近降解酶??蓪RP序列加入藥學活性蛋白以達到減少蛋白與其它受體或表面的不良相互作用的目的。為了達到這個目的,宜將URP序列加入到藥學活性蛋白中以接近造成此類不良接觸的蛋白位點。具體說,可將URP序列加入到藥學活性蛋白以減少其與免疫系統(tǒng)的任意組分相互作用以阻止對本發(fā)明產物的免疫應答。將URP序列加入到藥學活性蛋白能減少與預存抗體或B細胞受體的相互作用。而且,加入URP序列能減少抗原遞呈細胞對本發(fā)明產物的攝取和加工。優(yōu)選在蛋白中加入一種或多種URP序列以降低其免疫原性,因為它可在很多物種中抑制免疫應答,這使得人們能夠根據動物數(shù)據預測產品在病人中的免疫原性。單獨測試其免疫原性的此類物種不可能用于基于人T細胞表位鑒定或移除或與人序列進行序列比較的方法。/7Wr潘應表位,將URP序列引入蛋白以打斷T細胞表位。對于合并多個分離功能模塊的蛋白這點非常有用。T細胞表位的形成需要蛋白抗原的肽段與MHC結合。MHC分子與遞呈肽中通常為9個毗連殘基的短氨基酸區(qū)段相互作用。蛋白分子中不同結合模塊的直接融合可引起T細胞表位跨越兩個相鄰結構域。如圖7所示利用URP模塊分隔功能模塊阻止此類模塊跨越式T細胞表位的形成。在功能模塊之間插入URP序列也可干擾抗原遞呈細胞中的蛋白酶解加工,引起免疫原性的進一步降低。另一個降低免疫原性風險的方法破壞產物功能模塊內的T細胞表位。當為微生物蛋白時,一種方法是使一些半胱氨酸間環(huán)(不參與靶點結合)富甘氨酸化。在結構中含有少數(shù)半胱氨酸的微生物蛋白中,事實上可將不參與靶點結合的多數(shù)或所有殘基替換為甘氨酸、絲氨酸、谷氨酸和蘇氨酸,從而在不影響耙點親合力的前提下減少免疫原性的可能。例如,可通過對所有殘基進行"甘氨酸掃描"來進行,在這個過程中各殘基被替換成甘氨酸,然后利用噬菌體展示或篩選來挑選保持靶點結合的克隆,并合并所有允許的甘氨酸替換。通常,與URP模塊相比功能模塊包含T細胞表位的概率高得多。通過利用小親水性殘基如gly、ser、ala、glu、asp、asn、gln、thr取代所有或許多非關鍵氨基酸殘基來降低功能模塊中T細胞表位出現(xiàn)的頻率。利用一些隨機或基于結構的蛋白工程方法可鑒定功能模塊中允許取代的位置。連裔游娜度蛋白功能模塊具有有限的溶解度。具體說,結合模塊趨于在表面攜帶疏水性殘基,從而限制其溶解度并導致聚集。利用URP序列隔開或側接此類功能模塊可提高所得產物的總體溶解度。對于攜帶顯著比例的親水性或帶電殘基的URP模塊尤其如此。通過用可溶性URP模塊分隔功能模塊可降低這些功能模塊的分子內相互作用。改害游p//&^及產激冶裔游鉤一絲.-設計URP序列使其攜帶過量的負電荷或正電荷。結果是,它們對融合伙伴產生靜電場,可用于改變酶或結合相互作用的pH性質。而且,帶電URP序列的靜電場可增加蛋白產物表面電荷pKa值的均一性,這將引起配體相互作用的pH性質的銳化(sharpen)和等電聚焦或色譜聚焦分離的銳化。舒產激盧數(shù)鋭——造成改善麟化性處,溶液中的每種氨基酸本身具有單一固定的pKa,這是一半官能團被質子化的pH值。典型的蛋白具有多種類型的殘基,由于相互靠近和蛋白的喘息效應,它們以多種方式改變彼此的有效pKa。因此,在寬范圍的pH條件下,一般蛋白可采取各自具有不同分子量和凈電荷的數(shù)百種不同的離子化形式,因為存在很多種帶電和中性氨基酸殘基的組合。這被稱作寬離子化譜并對該類蛋白的分析(即質譜)和純化造成困難。PEG不帶電并且不影響與其連接的蛋白質質子化譜,使其保持寬的質子化譜。然而,原則上含有高含量Gly和Glu的URP僅以兩種狀態(tài)存在當pH低于谷氨酸pKa時為中性(-COOH),當pH高于谷氨酸pKa時帶負電(-C00—)。URP模塊可形成單一、均勻離子化的分子類型并在質譜中產生單一質量。所需的是,將MURP與單一電荷類型(Glu)以恒定間隔分布在整個URP模塊上的URP融合表達??蛇x擇在每20kDURP中摻入25-50個Glu殘基,并且所有這25-50個殘基具有很相似的pKa。此外,將25-50個帶負電荷加到諸如IFN、hGH或GCSF(僅含20個帶電殘基)等小蛋白中會增加產物的電荷均一性并銳化其等電點,使等電點與游離谷氨酸的pKa非常相近。與傳統(tǒng)的PEG化相比,蛋白群體電荷均一性的提高會帶來有利的加工特性,如在離子交換、等電聚焦、質譜等中的特性。改害游劍^/浙/或遞送;在藥學活性蛋白中加入URP能顯著簡化所得產物的制劑和/或遞送。設計URP序列使其親水性非常高,從而提高人蛋白的(例如)溶解性,這些人蛋白常含用于與其它蛋白結合的疏水斑(patch)。此類人蛋白如抗體的制劑很具挑戰(zhàn)性,經常限制其濃度和遞送選擇。URP可減少產品的沉淀和聚集,并可使用較簡單的包含較少成分的制劑,這些成分是在溶液中穩(wěn)定產物通常所需的。含URP序列產物溶解性的提高使其能夠以更高濃度制劑,因此減少可注射產品的注射體積,這樣可進行僅限于非常小體積注射的家庭注射。加入URP序列也可簡化所得制劑產物的儲存??稍谒帉W活性蛋白中加入URP以利于其口服、肺部、直腸或鼻內攝取。因為允許更高產物濃度和增強了產物的穩(wěn)定性,所以URP序列可利于多種遞送模式。設計利于膜滲透的URP序列可達到進一步改進的目的。改遂主產加入URP序列對所得產物的生產有顯著益處。許多重組產物,尤其是天然人蛋白,在生產過程中趨于形成難以或不能溶解的聚集體,甚至將其從最終產物移除后會再次出現(xiàn)。這常因為這些(天然人)蛋白通過疏水斑與其它(天然人)蛋白接觸,并且出于免疫原性的考慮,突變這些殘基是有風險的。然而,URP能增加此類蛋白的親水性,并且在無需突變人蛋白序列的前提下改善其制劑。URP序列能利于蛋白折疊以達到其天然狀態(tài)。利用重組技術產生的許多藥學活性蛋白是非天然聚集態(tài)。需要對這些產物進行變性,然后在允許其折疊成為天然活性狀態(tài)的條件下孵育。常在復性過程中發(fā)生的副反應是產生聚集體。URP序列與蛋白的融合物顯著降低其形成聚集體的傾向,因此利于產物中藥學活性成分的折疊。與聚合物修飾蛋白相比,含URP的產物更易于制備。在純化活性蛋白之后,化學聚合物修飾需要額外的修飾和純化步驟。相反,URP序列能以重組DNA方法與藥學活性蛋白一起制造。與聚合物修飾產物相比,本發(fā)明產物明顯易于鑒定。因為采用重組生產方法,可獲取多個具有明確分子特征的多種均一產物。URP序列也可利于產物純化。例如,URP序列可包含能被親和色譜捕獲的亞序列。一個例子是富含組氨酸的序列,它可被固化金屬如鎳的樹脂捕獲。可設計URP序列,使其含有過多的帶負電荷或正電荷的氨基酸。因此它們能顯著影響產物的凈電荷,這有利于通過離子交換色譜或制備電泳純化該產物。主題MURP含有多種模塊,包括但不限于結合模塊、效應模塊、多聚化模塊、C末端模塊和N末端模塊。圖1說明具有多個模塊的示例MURP。然而,MURP也可具有如圖2所示的相對簡單的構造。MURP也可包含片段化位點。它們可為蛋白酶敏感序列或化學敏感序列,當MURP到達其耙點時這些序列能夠被優(yōu)先切割。結合模塊(BM,本發(fā)明的MURP可包含一個或多個結合模塊。結合模塊(BM)指能特異性與一個或多個靶點結合的肽或蛋白質序列,所述靶點可為一個或多個治療性耙點或附屬靶點,如用于靶向細胞、組織或器官的靶點。BM可為線性肽或環(huán)肽、半胱氨酸約束肽、微生物蛋白、支架蛋白(如纖連蛋白、錨定蛋白、晶體、鏈霉親和素、抗體片段、結構域抗體)、肽激素、生長因子、細胞因子、或任意類型(人或非人、天然或非天然)的蛋白結構域,它們可基于天然支架或不基于天然支架的,或基于其組合,或者上述任何物質的片段。任選地,這些BM可通過加入、移除或取代一個或多個氨基酸進行工程改造以增強其結合屬性、穩(wěn)定性或其它性質。結合模塊可獲自天然蛋白,通過設計或遺傳包展示,包括噬菌體展示、細胞展示、核糖體展示或其它展示方法獲得。結合模塊可結合于同一靶點的同一拷貝,導致親合或與同一靶點的不同拷貝結合(如果這些拷貝某種程度上由(如)細胞膜聯(lián)系或連接,可導致親合),或它們可與兩個不相關耙點結合(如果這些靶點某種程度上由(如)膜連接,導致親合)。通過篩選或分析肽或蛋白的隨機文庫可鑒定結合模塊。尤其需要的結合模塊是一旦摻入MURP后,MURP產生所需的T表位評分的那些結合模塊。蛋白的T表位評分是該蛋白與多個最常見人MHC等位基因結合Kd(解離常數(shù)、親合力、解離速率)的對數(shù)值,如Stumiolo,T.等(1999)NatureBiotechnology17:555)所述。這些評分范圍覆蓋至少15個對數(shù)值,從約10、9、8、7、6、5、4、3、2、1、0、-1、-2、-3、國4、-5(10e10Kd)至約-5。優(yōu)選MURP產生的評分小于約-3.5[KKW:絕對比例?]尤其感興趣的還有包含由成對的兩個半胱氨酸殘基形成的二硫鍵的結合模塊。在某些實施方式中,結合模塊包含具有高半胱氨酸含量或高二硫鍵密度(HDD)的多肽。HDD家族的結合模塊通常具有5-500/。(5、6、7、8、9、10、12、14、16、18、20、25、30、35、40、45或50%)的半胱氨酸殘基,每一結構域通常含有至少兩個二硫鍵以及任選的輔因子如鈣或其它離子。HDD支架的存在允許這些模塊小但仍采取相對剛性的結構。剛性對于獲取高結合親合力、蛋白酶(包括參與抗原加工的蛋白酶)和熱抗性很重要,因此使這些分子具有低免疫原性或沒有免疫原性。無需多數(shù)模塊內部的大量疏水側鏈相互作用,二硫鍵框架就能折疊該模塊。小尺寸也有利于快速組織滲透和其它任選的遞送途徑,如口服、鼻腔、腸道內、肺部、血腦屏障等。此外,小尺寸也有助于降低免疫原性。通過增加二硫鍵的數(shù)目或利用含有較少氨基酸和同樣數(shù)目二硫鍵的結構域,可獲得較高二硫鍵密度。也需要減少非半胱氨酸固定殘基的數(shù)目,以便使更高比例的氨基酸用于靶點結合。含半胱氨酸的結合模塊能采取各種二硫鍵成鍵模式(DBP)。例如,兩個二硫鍵模塊可具有三種二硫鍵成鍵模式(DBP),三個二硫鍵模塊可有15種不同的DBP,四個二硫鍵模塊可有多至105種不同的DBP。所有2SSDBP、大部分3SSDBP和少于一半的4SSDBP有天然例子。在一個方面,根據公式可計算二硫鍵成鍵模式的總數(shù)錯誤!無法從編輯域代碼中創(chuàng)建對象,其中11=半胱氨酸殘基形成的二硫鍵的預測數(shù)目,其中錯誤!無法從編輯域代碼中創(chuàng)建對象代表(2i-l)的結果,其中i為l-n的正整數(shù)。因此,在一個實施方式中,MURP中使用的模塊為含天然或非天然產生的半胱氨酸(C)的支架,該指甲對靶分子有結合特異性,其中根據選自公式錯誤!無法從編輯域代碼中創(chuàng)建對象代表的一組排列模式,含非天然半胱氨酸(C)的支架包含支架內半胱氨酸,其中n等于半胱氨酸殘基形成二硫鍵的預測數(shù)目,并且錯誤!無法從編輯域代碼中創(chuàng)建對象代表產物(2i-l),其中i為l-n的正整數(shù)。在一個方面,天然或非天然產生的含半胱氨酸的模塊包含具有由多肽中成對半胱氨酸根據選自C1—2'3—4、C1—3'24或C1—4'2—3的模式形成的兩個二硫鍵的多肽,其中兩個由連字符連接的數(shù)字表示從多肽N末端起哪兩個半胱氨酸配對形成二硫鍵。在另一方面,天然或非天然產生的含半胱氨酸的模塊包含具有由成對支架內半胱氨酸根據選自C"2'3—4'5—6、C1—2'3—5'4—6、C"2'3-6'"、c"'"'"、。1-3'2-5,4-6e1—3'2-6'4'5(^1_4'2_3'5-6(^1_4'2_6'3-5(^1_5'2-3'4-6(]1_5'2_4.3-6。1-5'2—6'w、ci-6'2-3'"或ci-6'2-5'3-4的模式形成的三個二硫鍵的多肽,其中兩個由連字符連接的數(shù)字表示從多肽N末端起哪兩個半胱氨酸配對形成二硫鍵。另一方面,天然或非天然產生的含半胱氨酸模塊含有具有由多肽中成對半胱氨酸根據選自上述公式定義的排列模式形成的至少四個二硫鍵的多肽。另一方面,天然的或非天然產生的含半胱氨酸的模塊含有具有由多肽中成對半胱氨酸根據選自上述公式定義的排列模式形成的至少五個、六個或更多個二硫鍵的多肽。共待批申請[系列號11/528,927和11/528,950,全文納入本文作參考]中任何含半胱氨酸蛋白或支架為候選結合模塊。結合模塊可選自在二硫鍵結合的半胱氨酸間有4、5、6、7、8、9、10、11和12個隨機或部分隨機氨基酸的半胱氨酸約束環(huán)肽文庫(如以構建模式),在一些情況下可用數(shù)種方法在胱氨酸對外側構建額外的隨機氨基酸。可利用各種方法,包括噬菌體展示、核糖體展示、酵母展示和其它本領域所知方法鑒定對感興趣靶點具有特異性的文庫成員。可利用此類環(huán)肽作為MURP中的結合模塊。在一個優(yōu)選的實施方式中,可利用使結合模塊含有一個以上二硫鍵的構建方法進一步工程改造半胱氨酸限制肽,以提高其結合親合力、蛋白酶解穩(wěn)定性和/或特異性。圖25顯示了一個特定的構建方法。該方法基于在起先所選環(huán)肽的N末端一側以及C末端一側加上單獨的半胱氨酸及多個隨機殘基??僧a生如圖25所設計的文庫??衫檬删w展示或相似技術鑒定具有改進特性的結合模塊。此類構建文庫可包含在環(huán)肽的N末端一側以及C末端一側的1-12個隨機位置。新加隨機側翼半胱氨酸殘基和環(huán)肽中半胱氨酸殘基之間的距離可在1-12個殘基間變化。此類文庫每一成員包含四個半胱氨酸殘基,兩個來自原始環(huán)肽,兩個位于新加側翼。該方法偏好l-42-3DBP或DBP的變化,打破了現(xiàn)有的1-2個二硫鍵(=4-半胱氨酸構建物中的2-3個)形成1-23-4或1-32-4DBP??衫每寺√禺愋砸镞M行這種構建方法,使得不在文庫區(qū)域間留下固定序列(如圖25所示),或者利用(也因此留下)起先選擇的肽兩側的固定序列的引物進行,因此這些同樣的引物可用于任何起先選擇的克隆,如圖26所示。如圖26所示的方法可應用于對感興趣耙點具有特異性的環(huán)肽集合。已證明這兩種構建方法在構造抗VEGF親和成熟中均能發(fā)揮作用。重復該方法以產生含有六個或更多個半胱氨酸殘基的結合模塊。圖27顯示了另一種將一個二硫鍵構造入2-二硫鍵序列中。該方法包括原先選擇的1-二硫鍵肽庫與其本身的二聚化,以致預選擇肽庫在N末端以及C末端位置終止。該方法利于構建靶點兩個不同表位的2-二硫鍵序列的構造。另一構造方法包括加入包含兩個半胱氨酸的6-15個殘基的(部分)隨機化序列,這兩個半胱氨酸中間相隔4、5、6、7、8、9、或10個氨基酸,在連接的半胱氨酸外還可任選附加隨機位置。在預先選擇肽的N末端一側或C末端一側加上該2-半胱氨酸隨機序列。該方法偏好l-23-4DBP,雖然也會形成其它DBP。重復該方法以產生含有六個或更多半胱氨酸殘基的結合模塊??筛鶕烊坏鞍字Ъ軜嫿ńY合模塊??赏ㄟ^數(shù)據庫檢索鑒定此類支架?;谔烊恢Ъ艿奈膸炜蛇M行噬菌體展示淘選,然后篩選以鑒別特異性結合感興趣耙點的序列。用于構建結合模塊的天然支架選擇范圍很寬。特定支架的選擇依賴于目標耙點。天然支架的非限制性例子包括蛇毒樣蛋白,如蛇毒毒素和人細胞表面受體的胞外結構域。蛇毒毒素的非限制性例子為扁尾蛇毒素B、Y-心臟毒素、抗膽堿酯酶神經毒素、毒蕈堿毒素、半環(huán)扁尾海蛇神經毒素A、神經毒素I、心臟毒素V4II(毒素III)、心臟毒素V、a-眼鏡蛇毒素、長神經毒素l、FS2毒素、金環(huán)蛇毒素、馬來環(huán)蛇毒素、心臟毒素CTXI、心臟毒素CTXIIB、心臟毒素II、心臟毒素III、心臟毒素IV、眼鏡蛇毒素2、a-毒素、神經毒素II(眼鏡蛇毒素B)、毒素B(長神經毒素)、坎多毒素(Candotoxin)、布卡尼。(人)細胞表面受體胞外結構域的非限制性例子包括CD59、II型活化素受體、BMP受體Ia外結構域、TGF-piI型受體胞外結構域。其它天然支架包括但不限于A-結構域、EGF、Ca-EGF、TNF誦R、Notch、DSL、Trefoil、PD、TSP1、TSP2、TSP3、Anato、整聯(lián)蛋白B、甲狀腺球蛋白、抵御素l、抵御素2、植物環(huán)蛋白、SHKT、去整聯(lián)蛋白、肌肉毒素、,硫因、芋螺毒素、ji-芋螺毒素、co-蜘蛛毒素毒素、S-Atraco毒素以及在共待審申請系列號11/528,927和11/528,950公開的家族,全文納入本文的參考文獻。己經描述過如何從大的變體文庫中鑒定結合分子的多種方法。一種方法是化學合成。在珠上合成文庫成員,因此每個珠子攜帶不同的肽序列。利用標記的結合伙伴鑒定攜帶所需特異性配體的珠子。另一方法是產生肽子文庫,以重復過程鑒定特異性結合序列(Pinilla,C.等(1992)歷orec/m/,m,13:901-905)。更常用的是在噬菌體、蛋白或細胞的表面表達變體文庫的展示方法。這些方法的共同點在于編碼文庫中每一變體的DNA或RNA物理連接于配體。這樣可以檢測或獲取感興趣配體并通過對連接的DNA或RNA進行測序來確定其肽序列。本領域熟練技術人員可利用展示方法從大的隨機變體文庫中富集具有所需結合特性的文庫成員。常常,通過篩選富集文庫中具有所需特性的單個分離物可從富集文庫中鑒定具有所需結合特性的變體。展示方法的例子是與lac阻抑物融合(Cull,M.等(l992)尸rac.A^/.Jcac/.L/5L4,89:1865-1869)、細胞表面展示(Wittrup,K.D.(2001)Cm/tQp/wAotec/z"o/,12:395-9)。尤其感興趣的方法是連接于噬菌體顆粒的隨機肽或蛋白。常用的是M13噬菌體(Smith,G.P.等(1997)Ozemiev,97:391-410)和T7噬菌體(Danner,S.等(2001)尸racA^/&/t/SJ,98:12954-9)??衫枚喾N方法在M13噬菌體上展示肽或蛋白。許多情況下,文庫序列與M13噬菌體肽pIII的N末端融合。噬菌體通常攜帶3-5個拷貝的這種蛋白,因此該文庫內的噬菌體在多數(shù)情況下攜帶3-5個拷貝的文庫成員。這種方法是多價展示。另一種方法是文庫由噬菌粒編碼的噬菌粒展示。通過用輔助噬菌體感染攜帶噬菌粒的細胞可形成噬菌體顆粒(Lowman,H.B.等(1991)歷oc/zew/Wo;,30:10832-10838)。這一過程通常引起單價展示。在一些情況下,優(yōu)選單價展示以獲得高親和力的結合子。另一些情況下則優(yōu)選多價展示(O'Connell,D.等(2002)JMo/5〖。/,321:49-56)。已經描述過用噬菌體展示富集具有所需特性的序列的數(shù)種方法??赏ㄟ^結合于免疫管、微孔板、磁珠或其它表面固定感興趣靶點。然后,噬菌體文庫與固定靶點接觸,缺少結合配體的噬菌體被洗去,在多種條件下洗脫攜帶耙點特異性配體的噬菌體。洗脫可在低pH、高pH、尿素或其它趨于打斷蛋白-蛋白接觸的條件下進行。也可加入大腸桿菌細胞洗脫結合的噬菌體,使洗脫噬菌體可直接感染加入的大腸桿菌宿主。一個有趣的試驗方案是利用可降解噬菌體結合配體或固定靶點的蛋白酶洗脫。蛋白酶也可用作富集蛋白酶抗性噬菌體結合配體的工具。例如,在淘選感興趣靶點之前,將噬菌體結合配體文庫與一種或多種(人或小鼠)蛋白酶孵育。這一過程從文庫中降解并移除了蛋白酶不穩(wěn)定性配體(Kristensen,P.等(1998)FoWD^,3:321-8)。也可通過與復雜生物樣品結合富集配體的噬菌體展示庫。例子為在固化細胞膜組分(Tur,M.K.等(2003)/WJMo/M/,11:523-7)或整個細胞(Rasmussen,U.B.等(2002)Ca"cer7T^r,9:606-12;Kelly,K.A.等(2003)A^op/aWa,5:437-44)上進行淘選。在一些情況下,優(yōu)化淘選條件以提高從噬菌體展示庫中富集細胞特異性結合物的效率(Watters,J.M.等(1997)/mww"ofec/wo/ogy,3:21-9)。噬菌體淘選也可在活體病人或動物上進行。這一方法對于鑒定結合于血管靶點的配體尤感興趣(Arap,W.等(2002)AtoMet/,8:121-7)。本領域熟練技術人員可利用數(shù)種克隆方法產生編碼肽文庫的cDNA文庫??墒褂煤塑账岬碾S機混合物合成包含一個或多個隨機位置的寡核苷酸。這一過程可控制隨機位置的數(shù)目及隨機化程度。此外,通過部分消化生物樣品的DNA可獲得隨機或半隨機DNA序列。可使用隨機寡核苷酸構建預先卻帶位置中隨機化的質?;蚴删w的文庫??赏ㄟ^(deKruif,J.等(1995)/Mo/說'o/,248:97-105)所述方法進行PCR融合。其它方法基于DNA連接(Felici,F(xiàn).等(1991)J編編,222:301-10;Kay,B.K.等(1993)G腦128:59-65)。其它常用方法為康可爾(Kunkd)誘變,其中以單鏈環(huán)狀DNA為模板合成質?;蚴删5恼T變鏈。參見Sidhu,S.S.等(2000)M"/zo&£"z_ymo/,328:333-63;Kunkel,T.A.等(1987)M"/zo&五"2ymo/,154:367-82??悼蔂栒T變使用含有可從大腸桿菌菌株如CJ236獲取的隨機摻入尿嘧啶堿基的模板。含尿嘧啶模板鏈優(yōu)選在轉化進入大腸桿菌后降解,而體外合成的誘變鏈被保留。結果多數(shù)轉化細胞攜帶誘變的噬菌?;蚴删w。增加文庫多樣性的有價值的方法是合并多個子文庫。可通過上述任意方法生成這些子文庫,它們可以基于相同或不同支架。.近來已描述產生大的短肽噬菌體文庫的有用方法(Scholle,M.D.等(2005)Cow6C7zew///g/z77zraMg/z;n^^reem8:545-51)。該方法與康可爾方法相關但無需生成包含隨機尿嘧啶堿基的單鏈模板。事實上,該方法從攜帶一個或多個接近誘變區(qū)域突變的模板噬菌體開始,所述突變使噬菌體無感染力。該方法使用某些位置攜帶隨機密碼子并能校正模板中噬菌體失活突變的誘變寡核苷酸。結果是,僅誘變噬菌體顆粒在轉化后具有感染性,極少數(shù)親本噬菌體包含于此類文庫中。還可以數(shù)種途徑進一步修飾該方法。例如,可利用多個誘變寡核苷酸同時誘變噬菌體的多個非毗連區(qū)域。我們進一步利用該方法,將其應用于>25、30、35、40、45、50、55和60個氨基酸的整個微生物蛋白,而非<10、15或20個氨基酸的短肽,這是另一個挑戰(zhàn)。該方法在一次轉化后產生多于10el0個轉化子(最多10ell)的文庫,因此預計10次轉化可得到多樣性為10el2的單一文庫。超力(Scholle)方法的另一變型是設計誘變寡核苷酸,使模板中的琥珀終止密碼子轉化為赭石終止密碼子,下一誘變循環(huán)中則是赭石成為琥珀。這種情況下,模板噬菌體和誘變文庫成員必須培養(yǎng)于不同大腸桿菌抑制子菌株中,赭石抑制子和琥珀抑制子菌株交替。這樣可通過在兩種類型的終止密碼子和兩種抑制子菌株之間交替進行連續(xù)的噬菌體誘變改變。另一種超力方法的變型涉及使用單鏈噬菌體DNA模板及大引物。大引物是產生自前一輪淘選選擇的噬菌體庫的文庫插入物的長ssDNA。目的是從先前的庫中捕獲各種文庫插入物,在一個或多個區(qū)域對它進行誘變并以其它區(qū)域可被誘變的方法將其轉至新文庫中??衫煤懈信d趣基因終止密碼子的相同模板對大引物進行重復數(shù)個循環(huán)的加工。大引物是ssDNA(任選通過PCR產生),包含l)與ssDNA模板互補的至少15個堿基的5'和3'重疊區(qū),2)拷貝自(任選通過PCR)原先選擇的克隆庫的一個或多個原先選擇文庫區(qū)域(l,2,3,4或更多),和3)下一輪淘選中選擇的新誘變的文庫區(qū)域。任選通過以下方法制備大引物l)合成一個或多個編碼新合成文庫區(qū)域的寡核苷酸,2)可選地利用交疊PCR將其與DNA片段融合(可選地通過PCR得到),所述DNA片段包含原先優(yōu)化的其它文庫區(qū)域。利用合并(交疊)PCR產物的失控(Run-off)或單鏈PCR產生包含所有原先優(yōu)化區(qū)域以及將在下一輪淘選實驗中優(yōu)化的其它區(qū)域的新文庫的單鏈大引物。預計該方法能夠利用多次快速文庫創(chuàng)建循環(huán)進行蛋白親和成熟,每一輪生成10ell-10e12的多樣性,然后進行淘選??蓱脭?shù)種方法在(預先選擇或原始)微生物蛋白文庫中引入序列多樣性,或誘變單個微生物蛋白克隆,目的是增強其結合或其它特性,如制造、穩(wěn)定性或免疫原性。原則上,所有可被用于產生文庫的方法也可用于在微生物蛋白富集(原先選擇的)文庫中引入多樣性。具體說,可合成具有所需結合或其它特性的變體并根據這些序列設計部分隨機化寡核苷酸。該過程允許控制隨機化的位置和程度??衫脭?shù)種計算機算法(Jonsson,J.等(1993)Wwc/ez'ci^,21:733-9;Amin,N.等(2004),/Voto'"&/,17:787-93)由多個變體序列數(shù)據推斷蛋白質中單個突變的效用。尤其感興趣用于富集庫再誘變的方法是DNA改組(Stemmer,W.P.C.(1994)淑訓,370:389-391),這將在富集文庫中產生單個序列的重組子。利用多種改良的PCR條件進行改組,并且可部分降解模板以增強重組。另一可選方案是利用基于限制性酶的克隆在預定位置進行重組。尤其感興趣的是利用能在序列識別位點外切割DNA的IIS型限制性酶的方法(Collins,J.等(2001X/歷ofcc/z朋/,74:317-38)。可使用能產生非回文結構突出端的限制性酶在多個位點切割編碼變體混合物的質?;蚱渌麯NA,并且通過連接再組裝完整質粒(Berger,S.L.等(1993M"a/B/oc/zem,214:571-9)。另一引入多樣性的方法是PCR-誘變,在誘變條件下對編碼文庫成員的DNA序列進行PCR。已描述導致相對高突變頻率的PCR條件(Leung,D.等(1989)rec/zm々we,1:11-15)。此外,可使用保真性降低的聚合酶(Vanhercke,T.等(2005)J朋/歷ocAem,339:9-14)。尤其感興趣的方法是基于突變子株的方法(Irving,R.A.等(1996)/mmw"ofec/mo/ogy,2:127-43;Coia,G.等(1997)201:203-9)。這些菌株攜帶一個或多個DNA修復基因突變。這些菌株中的質粒或噬菌體或其它DNA在正常復制的過程中累積突變??煞敝惩蛔冏泳曛械膯蝹€克隆或富集群體以引入遺傳多樣性。上述許多方法可用于重復過程??蓪φ麄€基因或基因的一部分應用多輪誘變和篩選或淘選,或在每一后續(xù)輪次中對蛋白的不同部分進行誘變(Yang,W.P.等(1995)JMo/5Zo/,254:392-403)。進一步處理文庫以減少偽像。噬菌體淘選的已知偽像包括l)基于疏水性的非特異性結合,2)與靶點的多價結合,原因是a)五價pIII噬菌體蛋白,或b)不同微生物蛋白間形成的二硫鍵,產生多聚體,或c)固相支持物上靶點的高密度涂層,并且3)環(huán)境(context)依賴的靶點結合,其中靶點的環(huán)境(context)或微生物蛋白的環(huán)境(context)對于結合或抑制活性至關重要。采取不同的處理步驟以將這些問題的幅度減至最小。例如,此類處理可應用于整個文庫,但一些移除壞克隆的有用處理僅能應用于可溶性蛋白庫或單個可溶性蛋白。含半胱氨酸支架的文庫可能含有游離巰基,巰基通過與其它蛋白交聯(lián)使定向演化變得復雜。一種方法是通過流過游離巰基柱移除文庫中最壞克隆,因此可以移除具有一個或多個游離巰基的所有克隆。有游離SH基團的克隆也可與生物素-SH試劑反應,以便使用鏈霉親和素柱有效移除有反應性SH基團的克隆。另一方法是不移除游離巰基,但可利用巰基反應性化合物如碘乙酸加帽而使其失活。尤其感興趣的是減少非特異性結合或修飾變體的大容量或親水性巰基試劑。環(huán)境(context)依賴性例子為所有的恒定序列,包括pIII蛋白、接頭、肽標簽、生物素-鏈霉親和素、Fc和其它參與相互作用的融合蛋白。避免環(huán)境依賴性的典型方法包括盡量頻繁地變化環(huán)境以避免構建(buildup)??砂ú煌恼故鞠到y(tǒng)之間的改變(即M13對T7,或M13對酵母)、改變所用標簽和接頭、改變固定用的(固體)支持物(如固定化學)以及改變靶蛋白本身(不同的供應商及不同的融合物)。也可使用文庫處理選擇具有優(yōu)選特性的蛋白。一種選擇就是利用蛋白酶處理文庫以從文庫中移除不穩(wěn)定變體。所使用的蛋白酶通常為那些本申請中遇到的蛋白酶。為了進行肺部遞送,可使用(例如)灌肺得到的肺蛋白酶。相似地,可獲得來自血清、唾液、胃、腸、皮膚和鼻腔等的蛋白酶的混合物。大范圍的蛋白酶列表見[附件E]。例外地,噬菌體本身對大多數(shù)蛋白酶和苛刻處理條件具有抗性。例如,可能通過暴露于濃度遞增的還原性試劑(即DTT或P巰基乙醇),首先清除最不穩(wěn)定的結構,來選擇最穩(wěn)定結構的文庫,即那些具有最強的二硫鍵的文庫。通常使用還原性試劑(即DTT、BME和其它試劑)濃度為2.5mM、至5mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM或甚至100mM,這取決于所需的穩(wěn)定性。也可能通過用高水平還原劑還原整個展示文庫,接著逐漸再氧化蛋白文庫以重建二硫鍵,然后去除含有游離SH基團的克隆,來選擇能夠體外有效折疊的克隆??芍貜鸵淮位蚨啻卧撨^程以消除體外折疊效率低的克隆。一種方法是應用遺傳方法來選擇蛋白表達水平、折疊和溶解性,如A.C.Fisher等(2006)"利用雙精氨酸移位通路折疊質控特性進行的蛋白溶解性的遺傳選擇"(Geneticselectionforproteinsolubilityenabledbythefoldingqualitycontrolfeatureofthetwin-arginintranslocationpathway)尸rofe/wSc〖ewce(在纟戔)所述。進行展示文庫淘選(可選)之后,可避免在蛋白水平篩選數(shù)千個克隆的靶點結合、表達水平和折疊。另一個方案是將整個所選插入物庫克隆入卩內酰胺酶融合載體中,當在(3內酰胺上鋪板時,作者證明其對表達良好的、完全二硫鍵鍵合的可溶性蛋白的選擇性。在M13噬菌體展示蛋白文庫和一次或數(shù)次循環(huán)的靶點淘選之后,有數(shù)種途徑可以繼續(xù)進行,包括(l)利用噬菌體ELISA篩選個體噬菌體克隆,這能測定結合于固定耙點的噬菌體顆粒的數(shù)目(利用抗-M13抗體);(2)由M13轉移到T7噬菌體展示文庫。第二種方法在減少基于價態(tài)的假陽性的發(fā)生率方面尤其有用。任何一種文庫格式趨于偏好可與靶點形成高親合力接觸的克隆。盡管很緩慢,但這是篩選溶解蛋白很重要的原因。T7噬菌體展示形成的多價與M13展示中形成的相當不同,T7和M13間的循環(huán)可作為減少基于價態(tài)的假陽性發(fā)生率的絕佳方法。濾膜提升(filterlift)是另一種可用于在大瓊脂板上高密度培養(yǎng)細菌菌落(10e2-10e5)的方法。少量的某些蛋白被分泌進入培養(yǎng)基并最終結合于濾膜上(硝基纖維素或尼龍)。在脫脂牛奶、1。/。酪蛋白水解物或in/。BSA溶液中封閉濾膜,然后與熒光染料或指示酶(通過抗體或生物素-鏈霉親和素直接或間接)標記的靶蛋白培育。通過將濾膜平鋪于平板背面確定菌落的位置,選擇所有的陽性菌落,并用于其它鑒定。濾膜提升的優(yōu)勢在于可通過在洗滌后不同時段讀取信號而將其設計為有親和選擇性。高親和力克隆的信號"衰減"慢,而低親和力克隆的信號則衰減快。此類親和鑒定通常需要三點實驗及基于孔的實驗,并且與基于孔的實驗相比提供了更好的克隆-克隆間的可比性。將菌落劃分成網格陣列是將菌落尺寸和位置帶來的差異最小化的有用方法。主題MURP可包含N末端模塊(NM),在促進MURP產生中特別有用。當產物在大腸桿菌細胞質中表達時,NM可以為單一甲硫氨酸殘基。典型產物的形式是與治療性蛋白融合的URP,它在細菌胞質中表達因此N末端為甲酰甲硫氨酸。甲酰甲硫氨酸可為永久或臨時的(如果被生物或化學加工移除)。NM也可以是為蛋白酶解過程進行工程改造的肽序列,可用于移除標簽或移除融合蛋白。經工程改造,N末端模塊可通過包含親和標簽如Flag-、Myc-、HA-或His-標簽而利于MURP的純化。N末端模塊也可包含用于檢測MURP的親和標簽??蓪M進行工程改造或選擇以高水平表達MURP。也可將其工程改造或選擇以增強所得MURP的蛋白酶抗性。可生產具有利于表達和/或純化的N末端模塊的MURP。在生產過程中利用蛋白酶可將N末端模塊切去,以使最終產物不包含N末端模塊。通過優(yōu)化N末端模塊的氨基酸和密碼子選擇可增加重組產量。N末端模塊也可包含可被特定蛋白酶如Xa因子、凝血酶、或腸激酶、番茄蝕紋病毒(TEV)蛋白酶切割的加工位點??稍O計加工位點以便被化學水解切割。一個例子是可在酸性條件下被切割的氨基酸序列asp-pro。也可設計利于MURP純化的N末端模塊。例如,可設計N末端模塊包含多個his殘基,以便通過固定金屬色譜捕獲產物。N末端模塊可包含能特異性被抗體捕獲或識別的肽序列。例子是FLAG、HA、c-myc。C末纖免'MURP可包含在促進MURP生產中特別有用的C末端模塊。例如,C末端模塊可包含進行蛋白酶解加工移除融合序列、從而提高蛋白質表達或促進純化的切割位點。具體說,C末端模塊也可包含可被特定蛋白酶如Xa因子、凝血酶、TEV蛋白酶或腸激酶切割的加工位點。設計可被化學水解切割的加工位點。例子是可以在酸性條件下切割的氨基酸序列asp-pro。C末端模塊可以是利于MURP純化的親和標簽。例如,可設計C末端模塊以使其包含多個his殘基,以便通過固定金屬色譜捕獲產物。C末端模塊可包含能特異性被抗體捕獲或識別的肽序列。標簽的非限制性例子包括FLAG-、HA-、c-myc或His-標簽。也可工程改造或選擇C末端模塊以增強所得MURP的蛋白酶抗性。所需的是,可將該蛋白的N末端與其自身C末端相連。例如,通過創(chuàng)造氨基酸樣天然連接(肽鍵)或使用外源性連接體將這兩個模塊連接起來。尤其感興趣的是環(huán)肽,它是一類天然發(fā)生的小蛋白家族。預計采用類似環(huán)肽的結構形式能夠提供對抗外源性蛋白酶的更多的穩(wěn)定性。在較低蛋白濃度下這類分子內連接能工作得更好。艦微,MURP可包含一個或多個效應模塊(EM)或根本沒有效應模塊。效應模塊通常不提供靶向,但提供治療效果所需的活性,如細胞殺傷。EM可為藥學活性小分子(即毒性藥物)、肽或蛋白。非限制性例子為完整的細胞因子、抗體酶、生長因子、激素、受體、受體激動劑或拮抗劑,或其片段或結構域。效應模塊也可包含攜帶合成或天然的化學連接小分子藥物的肽序列。可選地,這些效應分子可通過化學接頭與效應模塊連接,可在選定條件下切割或不切割這些接頭,從而釋放毒性活性。EM也可包含放射性同位素及其螯合物,以及用于PET和MRI檢測的不同標記物。效應模塊也可對細胞或組織有毒。尤其感興趣的是包含毒性效應模塊以及與疾病組織或疾病細胞類型特異性結合的結合模塊的MURP。此類MURP可以特異性蓄積于疾病組織或疾病細胞中,并優(yōu)先在疾病細胞或組織中發(fā)揮其毒性作用。下列為效應模塊的例子。^"效應模塊可為酶。尤其感興趣的是降解對細胞生長至關緊要的代謝物,如糖或氨基酸或脂或輔助因子的酶。其它具有酶活性的效應模塊的例子為RNA酶、DNA酶和磷酸酶、天冬酰胺酶、組氨酸酶、精氨酸酶、(3內酰胺酶。具有酶活性的效應模塊當遞送至組織或細胞時可具有毒性。尤其感興趣的是將毒性效應模塊和特異性結合疾病組織的結合模塊組合在一起的MURP。能在腫瘤位點將非活性前藥轉化為活性藥物的酶也是潛在的效應模塊。^",主題MURP可包含藥物作為效應物。所需的是,可設計用于藥物分子的器官選擇性遞送的序列。一個例子見圖8。URP序列可與優(yōu)選結合于疾病組織的蛋白融合。同樣的URP序列可包含經修飾可以與藥物分子結合的一個或多個氨基酸殘基。此類偶聯(lián)物以高度特異性結合于疾病組織,所連接的藥物分子能夠產生局部作用,從而將細胞藥物的全身接觸減至最小。通過引入可在所需作用位點被天然蛋白酶切割的蛋白酶敏感位點,可設計MURP以利于藥物分子的在耙點處的釋放。利用URP序列設計藥物遞送構建物的顯著優(yōu)勢是可避免藥物分子和構建物靶向結構域之間的不良相互作用。可與靶向結構域偶聯(lián)的許多藥物分子具有顯著的疏水性,使得所得偶聯(lián)物趨于聚集。通過將親水性URP序列加入到此類構建物可提高所得遞送構建物的溶解性,從而降低聚集趨勢。而且,通過加上長URP序列可增加與靶向結構域融合的藥物分子的數(shù)目。此外,使用URP序列可優(yōu)化藥物偶聯(lián)位點之間的距離以利于完成偶聯(lián)。適合的藥物列表包括但不限于化療藥,如硫替派和環(huán)磷酰胺(環(huán)磷酰胺TM);烷基磺酸,如白消安、英丙舒凡和哌泊舒凡;吖丙啶,如苯佐替派、卡波醌、美妥替哌和烏瑞替派;氮丙啶和甲蜜胺,包括六甲蜜胺、曲他胺、三亞乙基磷酰胺、三亞乙基硫代磷酸胺和三羥甲蜜胺;氮芥,如苯丁酸氮芥、萘氮芥、氯磷酰胺、雌莫司汀、異環(huán)磷酰胺、雙氯乙基甲胺、鹽酸氧氮芥、美法侖、新恩比興、苯乙酰膽固醇氮芥、潑尼莫司汀、曲磷胺、烏拉莫司??;亞硝基脲,如卡莫司汀、吡葡亞硝脲、福莫司汀、洛莫司汀、尼莫司汀、雷莫司??;抗生素,如阿柔比星、放線菌素、安曲霉素、偶氮絲氨酸、博來霉素、放線菌素c、卡奇霉素、卡拉比星(carabicin)、洋紅霉素、嗜癌霉素、色霉素、放線菌素d、道諾霉素、地托比星、6-重氮-5-氧代-L-正亮氨酸、多柔比星、表柔比星、依索比星、黃膽素、馬賽羅霉素、絲裂霉素、霉酚酸、諾拉霉素、橄欖霉素、培洛霉素、波非羅霉素(potfiromycin)、嘌呤霉素、三鐵阿霉素、羅多比星、鏈黑霉素、鏈佐星、塊菌素、烏苯美司、凈司他丁、佐柔比星;抗代謝物,如甲氨蝶呤和5-氟尿嘧啶(5-FU);葉酸類似物,如二甲葉酸、甲氨蝶呤、蝶羅呤、三甲曲沙;嘌呤類似物,如氟達拉濱、6-巰基嘌呤、硫咪嘌呤、硫鳥嘌呤;嘧啶類似物,如安西他濱、阿扎胞苷、6-氮尿苷、卡莫氟、阿糖胞苷、二脫氧尿苷、去氧氟尿苷、依諾他濱、氟尿苷;雄激素如卡普睪酮、丙酸屈他雄酮、環(huán)硫雄醇、美雄垸、睪內酪;抗腎上腺素藥,如氨魯米特、米托坦、曲洛司坦;葉酸補充物,如葉垸酸;醋葡醛內酯;醛磷酰胺糖苷;氨基乙酰丙酸;安吖啶;貝塔布辛(bestrabucil);比生群;伊達曲沙;地磷酰胺(defofamine);秋水仙胺;地吖醌;多卡霉素(duocarmycin),美登堿(maytansin)、耳他汀(auristatin)、艾佛米新(dfom他ine);依利醋胺;依托格魯;硝酸鎵;羥基脲;蘑菇多糖;氯尼達明;米托胍腙;米托蒽醌;莫哌達醇;二胺硝吖啶;噴司他?。坏鞍钡?;吡柔比星;鬼臼酸;2-乙基酰肼;丙卡巴肼;PSK.R';雷佐生;西佐喃;鍺螺胺;細交鏈孢菌酮酸;三亞胺醌;2,2',2"-三氯三乙基胺;烏拉坦;長春地辛;達卡巴嗪;甘露莫司?。欢甯事洞?;二溴衛(wèi)矛醇;哌泊溴垸;加胞嘧啶;阿糖胞苷("Ara-C");環(huán)磷酰胺;硫替派;紫杉垸,如紫杉醇(紫杉醇,百時美施貴寶腫瘤學部,新澤西州普林斯頓)(Bristol-MyersSquibbOncology,Princeton,N丄))和多西他賽(泰索帝TM,Rhone-PoulencRorer,法國安東尼省)(Antony,F(xiàn)rance));苯丁酸氮芥;吉西他濱;6-硫鳥嘌呤;巰基嘌呤;甲氨蝶呤;鉑類似物,如順鉑和卡鉑;長春堿;鉑;依托泊武(VP-16);異環(huán)磷酰胺;絲裂霉素C;米托蒽醌;長春新堿;長春瑞濱;諾維本;二羥基蒽醌;替尼泊苷;道諾霉素;氨蝶吟;適羅達;伊班膦酸鹽;喜樹堿-1l(CPT-l1);拓樸異構酶抑制劑RFS2000;二氟甲基鳥氨酸(DMFO);視黃酸;埃拉霉素(esperamicins);卡培他濱;和上述物質的藥學上可接受的鹽、酸或衍生物。也包括的合適化療細胞調節(jié)劑,它們是用于調解或抑制激素對腫瘤作用的抗激素試劑,如抗-雌激素,包括如他莫昔芬、雷洛昔芬、芳香酶抑制4(5)-咪唑、4-羥基他莫昔芬、曲沃昔芬、雷洛昔芬鹽酸鹽、LY11701S、奧那司酮和托瑞米芬(Fareston);以及抗雄激素,如氟他胺、尼魯米特、比卡魯胺、亮丙瑞林、戈舍瑞林、多柔比星、道諾霉素、多卡霉素(duocarmycin)、長春新堿和長春堿。其它可用作效應模塊的的藥物包括用于治療感染疾病、心臟病、傳染病、呼吸疾病、自身免疫病、神經和肌肉失常、代謝紊亂以及癌癥的藥物。其它可用作MURP效應物的藥物包括去痛藥和消炎藥,如組胺和組胺拮抗劑、緩激肽和緩激肽拮抗劑、5-羥基色胺(5-羥色胺)、生物轉化選擇性水解膜磷脂的產物所產生的脂質、類花生酸、前列腺素、血栓素、白三烯、阿司匹林、非類固醇消炎劑、撲熱息痛藥、抑制前列腺素和血栓素合成的藥物、誘導性環(huán)加氧酶的選擇性抑制劑、誘導性環(huán)加氧酶2的選擇性抑制劑、自身活性物質、旁分泌激素、促生長素抑制素、胃泌素、在體液和細胞免疫應答中介導相互作用的細胞因子、脂質衍生的自身活性物質、類花生酸、(3-腎上腺素激動劑、異丙托銨、糖皮質激素類、甲基黃嘌呤、鈉通道阻斷劑、阿片受體激動劑、鈣通道阻斷劑、膜穩(wěn)定劑和白三烯抑制劑。其它用作效應物的藥物包括治療消化性潰瘍的藥物、治療胃食管反流病的藥物、胃腸動力藥物、止吐藥、腸易激綜合征用藥、腹瀉用藥、便秘用藥、炎性腸病用藥、膽汁病用藥以及胰腺病用藥。ifc^絲^;素-設計MURP用于放射性核素的組織靶向遞送以及利用放射性核素成像??赏ㄟ^改變URP長度來優(yōu)化半衰期,因此URP是成像的理想材料。多數(shù)成像應用中,可能優(yōu)選中等長度的URP,半衰期為5分鐘至數(shù)小時、而非幾天到數(shù)周。設計MURP使其僅含單個或少量確定數(shù)量的可被放射性同位素如锝、銦、釔(擴展)的螯合劑(如DOTA)修飾的氨基。另一種偶聯(lián)方法是通過保守半胱氨酸側鏈偶聯(lián)??墒褂么祟悢y帶放射性核素的MURP治療腫瘤或其它疾病組織,以及用于成像。許多藥學活性蛋白或蛋白結構域可用作MURP中的效應模塊。例如下列蛋白及其片段細胞因子、生長因子、酶、-受體、微生物蛋白、激素、紅細胞生成素(erythopoetin)、腺苷脫亞胺酶、天冬酰胺酶、精氨酸酶、干擾素、生長激素、生長激素釋放激素、G-CSF、GM-CSM、胰島素、水蛭素、TNF-受體、尿酸酶、拉布立酶、阿索開、RNA酶、DNA酶、磷酸酶、假單胞菌外毒素、蓖麻毒蛋白、白樹毒素、氨普酶、控羅尼酶、凝血酶、凝血酶、VEGF、普洛托品(protropin)、生長激素、阿替普酶、白介素、IIV因子、VIII因子、X因子、IX因子、鏈球菌DNA酶、葡糖腦苷脂酶、促濾泡素、胰高血糖素、促甲狀腺激素、奈西立肽、阿替普酶、甲狀旁腺素、阿加糖酶、拉羅尼酶、甲硫氨酸酶。蚤^艨激薪游MW^:為了提高效應模塊的治療指數(shù),可將蛋白酶不穩(wěn)定序列插入到URP序列中,該URP序列對于在血清或MURP治療的耙組織中優(yōu)先發(fā)現(xiàn)的蛋白酶敏感。該方法見圖9。一些設計可以構建到達耙組織時選擇性激活的蛋白。尤其感興趣的是在疾病位點激活的MURP。為了利于此類靶點特異性激活,可將URP序列連接在效應模塊的活性位點或受體結合位點附近,由此得到的融合蛋白生物學活性有限。尤其感興趣的是在腫瘤位點激活效應模塊。許多腫瘤組織以相對高的濃度表達蛋白酶,可將這些腫瘤蛋白酶特異性切割的序列插入到URP序列中。例如,多數(shù)前列腺腫瘤組織含有高濃度的前列腺特異性抗原(PSA),這是一個絲氨酸蛋白酶。由與抗癌藥物多柔比星偶聯(lián)的PSA不穩(wěn)定性肽組成的前藥可在前列腺組織中選擇性激活[DeFeo-Jones,D.等(2000)NatMed,6:1248]。尤其感興趣的疾病特異性激活是具有細胞生長抑制活性或細胞毒性的蛋白,如TNFa和許多細胞因子和白介素。另一個應用是在炎癥位點或者病毒或細菌感染位點的蛋白選擇性激活。主/^}法-利用本領域熟知的分子生物學方法可生產包含URP序列的MURP??蓪?shù)種克隆載體用于各種表達系統(tǒng)中,如哺乳動物細胞、酵母和微生物。尤其感興趣的表達宿主是大腸桿菌、釀酒酵母、畢赤酵母和中國倉鼠卵巢細胞。尤其感興趣的是經過優(yōu)化擴展其密碼子使用的宿主。尤其感興趣的是經過修飾增強GRS表達的宿主。可通過提供編碼甘氨酸特異性tRNA的DNA達到這一目的。此外,可工程改造宿主以增加甘氨酸特異性tRNA的載量。可將編碼增強蛋白的DNA操作地連接于啟動子序列。編碼增強蛋白的DNA及操作性連接的啟動子可作為質粒載體、病毒載體的一部分或可被插入到宿主的染色體中。在利于增強蛋白生產的條件下培養(yǎng)宿主細胞以進行生產。尤其感興趣的是能提高GRS產量的條件。主題MURP可采用數(shù)種形式。例如,MURP可包含與藥學活性蛋白融合的URP從而得到緩釋產物。此類產物可被局部注射或植入,例如病人皮膚或在皮膚之下。由于其大的流體力學半徑,含URP序列的產物從注射或植入位點緩慢釋放,從而減少了注射或植入的頻率??稍O計URP序列,使其包含與細胞表面或組織結合的區(qū)域以延長藥物在注射位點的局部滯留時間。尤其感興趣的是將含URP的產物制成注射后聚集或沉淀的可溶化合物。改變制劑產品和注射位點的pH可觸發(fā)聚集或沉淀。另一個選擇是可通過改變氧化還原環(huán)境引起沉淀或形成聚集的含URP的產物。另一種方法是通過加入非活性溶質在溶液中穩(wěn)定,但注射后由于增溶溶質擴散引起沉淀或聚集的含URP的產物。另一種方法是設計在URP序列中有一個或多個賴氨酸或半胱氨酸殘基并可在注射前交聯(lián)的含URP的產物。所需的是,在制造、制劑和注射時,MURP是單體(這里指未交聯(lián)),但當皮下注射后,蛋白開始自身交聯(lián)或與天然人蛋白交聯(lián),在皮膚下形成聚合物,活性藥物分子十分緩慢的釋放。這種釋放可以是圖18所示的二硫鍵還原或二硫鍵改組,或由圖19所示蛋白酶解介導,釋放活性片段到循環(huán)中。非常重要的是這些活性片段足夠大,以獲得長半衰期,因為分泌半衰期越長,釋放蛋白的劑量越低,這樣可以使用較低劑量的產物進行注射或注射間隔較長。一種帶來這些優(yōu)勢的方法是二硫鍵介導的蛋白交聯(lián)。例如,可制造含有(一個或多個)環(huán)肽的蛋白藥物。該環(huán)肽可參與或不參與耙點的結合。制造該蛋白,形成環(huán)肽,即氧化形式的蛋白,以簡化純化。然而,還原產物并通過制劑保持蛋白還原態(tài)。非常重要的是在低濃度還原劑,如0.25、0.5、1.0、2.0、4.0或8.0mM二硫蘇糖醇或(3巰基乙醇或半胱氨酸或等同還原劑中還原環(huán)肽,因此可在不還原產物中其它含二硫鍵的蛋白模塊的條件下還原環(huán)肽。優(yōu)選使用FDA批準的還原劑,如半胱氨酸或谷胱甘肽。皮下注射后,低分子量還原劑快速擴散或被人蛋白中和,使藥物在高摩爾濃度時暴露于氧化環(huán)境中,造成不同蛋白鏈中的半胱氨酸交聯(lián),引起藥物在注射位點的聚合。環(huán)肽中半胱氨酸的距離越遠,藥物濃度越高,藥物聚合的程度越高,因為聚合與環(huán)肽的重整(reformation)競爭。一段時間后,二硫鍵的還原和氧化引起二硫鍵改組,這樣使環(huán)肽重整和單體化,并使藥物再溶解??赏ㄟ^創(chuàng)建血清蛋白酶切割位點來靶向、控制或增加藥物經蛋白酶解作用從聚合物的釋放??衫没瘜W蛋白-蛋白交聯(lián)劑進行蛋白交聯(lián),如[表x]所列。理想(的化學交聯(lián)劑)為已被FDA批準的試劑,如那些用于疫苗或化合物與蛋白偶聯(lián)的試劑。除了利用二硫鍵之外,也可使用很多種交聯(lián)劑穩(wěn)定蛋白對抗蛋白酶降解作用。下列多數(shù)試劑由皮爾斯化學品公司(PierceChemicals)以相同名字銷售,其使用說明書可從網上獲得(www.piercenet.com)。導致與二硫鍵所得同樣鏈間距的試劑可用于此應用。短接頭試劑如DFDNB是最理想的。從如www.piercenet.com所示化合物結構易于測定鏈間距。大量聚體化學產品以下列少數(shù)基本反應方案發(fā)揮作用,所有內容均參見www.piercenet.com上的詳述。有用的交聯(lián)劑例子為咪唑、活性鹵素、馬來酰亞胺、二硫吡啶、NHS酯。同源雙功能交聯(lián)劑有兩個相同的反應基團并經常用于一步化學交聯(lián)步驟中。例如,BS3(非可切割水溶性DSS類似物)、BSOCOES(堿基可逆)、DMA(己二亞氨二甲酯二鹽酸)、DMP(庚二胺二甲酯鹽酸)、DMS(辛二硝酸二甲酯二鹽酸)、DSG(DSS的5碳類似物)、DSP(羅曼特試劑(Lomant'sreagent))、DSS(非可切割的)、DST(可被氧化劑切割)、DTBP(二甲基3,3,-二硫代雙丙亞氨酸二甲酯二鹽酸)、DTSSP、EGS、磺基-EGS、THPP、TSAT、DFDNB(1,5-二氟-2,4-二硝基苯)在小空間距離間交聯(lián)時特別有用(Kornblatt,J.A.和Lake,D.F.(1980),利用二氟二硝基苯交聯(lián)細胞色素氧化酶亞對Cross-linkingofcytochromeoxidasesubunitswithdifluorodini加benzene),Can,說'oc/zem.58,219-224)。巰基反應性同源雙功能交聯(lián)劑是與巰基反應的?;隈R來酰亞胺的同源雙功能蛋白交聯(lián)劑,在pH6.5-7.5時與-SH基團反應形成穩(wěn)定的硫醚連接。BM[PEO]3是一個8原子聚醚間隔區(qū),可降低巰基-巰基交聯(lián)應用中偶聯(lián)物沉淀的可能。BM[PEO]4類似但具有11個原子的間隔區(qū)。BMB是一個非可切割的交聯(lián)劑,其具有四碳間隔區(qū)。BMDB形成可被高碘酸鹽切割的連接。BMH是一個廣泛使用的同源雙功能巰基反應性交聯(lián)劑。BMOE具有一個特別短的接頭。DPDPB和DTME是可切割的交聯(lián)劑。HVBS不具有馬來酰亞胺的水解潛能。TMEA是另一個選擇。異源雙功能交聯(lián)劑有兩個不同的反應基團。例子是通過EDC活化的NHS酯和胺/肼、AEDP、ASBA(光反應性,可碘化(iodinatable))、EDC(水溶性碳二亞胺)。胺-巰基反應雙功能交聯(lián)劑是AMAS、APDP、BMPS、EMCA、EMCS、GMBS、K固A、LC-SMCC、LC-SPDP、MBS、SBAP、SIA(特別短)、SIAB、SMCC、SMPB、SMPH、SMPT、SPDP、磺基-EMCS、磺基-GMBS、磺基-KMUS、磺基-LC-SMPT、磺基-LC-SPDP、磺基-MBS、磺基-SIAB、磺基-SMCC、磺基-SMPB。氨基反應性異源雙功能交聯(lián)劑為ANB-NOS、MSA、麗S-ASA、SADP、SAED、SAND、SANPAH、SASD、SFAD、磺基-HSAB、磺基-NHS-LC-ASA、磺基-SADP、磺基-SANPAH、TFCS。一個不同的緩釋形式含有His6標簽標記的藥物,它與鎳-三乙酸腈-偶聯(lián)的珠(Ni-NTA珠)混合并共同注射,GMO版本的珠可購自凱杰公司(Qiagen)。如圖20所示,藥物緩慢從珠子上脫落(teachoff),提供儲庫和緩釋。珠是可選的,可被能組裝成更大聚合物的交聯(lián)聚合鎳-三乙酸腈替代。URP序列可包含已知能夠形成多聚體如a2D[HiU,R.等(1998)JAmChemSoc,120:1138-1145]的序列,用于使抗體片段二聚化[Kubetzko,S.等(2005)Mo1Pharmacol,68:1439-54]。有用的同源二聚肽的例子是序列SKVILFE。有用的異源二聚化序列的例子是肽ARARAR,它可與序列DADADA和相關序列形成二聚體。多聚化可通過增加親合力來提高分子的生物學功能,并可影響所得MURP的藥代動力學性質和組織分布。"多聚化模塊是利于MURP形成二聚體或多聚體的氨基酸序列。多聚化模塊可自身結合形成二聚體或多聚體?;蛘?,多聚化模塊也可與MURP其它模塊結合。這些模塊可為亮氨酸拉鏈或形成反向平行的同源聚合物小肽如Hydra頭激活物衍生物(SKVILF-樣),或形成高度親和的反相平行異源聚合物的肽如RARARA和DADADA。使用一個、兩個或多個拷貝的肽可強制形成蛋白質二聚體、線性多聚體或分枝多聚體。可通過改變肽的類型、長度和組成來改變結合親合力。許多應用需要如圖21所示形成同源二聚體的肽。其它應用需要異源二聚體。在一些情況下,一旦結合,通過在兩條蛋白鏈間(通常在肽的任一側)形成二硫鍵可將肽鎖定在位置上。如圖21所示多聚化模塊可用于連接兩個MURP分子(頭對尾、頭對頭或頭尾對尾)。為形成二聚體,多聚化模塊可位于N或C末端。若兩個末端均有多聚化模塊,則形成長線性聚合物。如果每一蛋白中出現(xiàn)兩個以上多聚化模塊,則可形成分支聚合網絡。如圖23所示,可組合多聚化和化學偶聯(lián)的構思,以便用于延長半衰期、庫存形成、引起活性藥物從儲庫或注射位點緩慢釋放。主題MURP可摻入遺傳的或通用的URP。一種方法是表達含有長URP模塊(提供半衰恥的URP,并包含允許與結合特定靶點的肽(即線性、環(huán)狀、2SS、3SS等)位點特異性偶聯(lián)的多個(通常4-10個)賴氨酸(或其它位點)。該方法的優(yōu)勢是URP模塊是遺傳的并可與其它任意靶點特異性肽偶聯(lián)。理想的,靶點特異性肽與URP的連接是直接連接,因此URP上的殘基僅能與靶點特異性肽的殘基反應,并且窮盡性偶聯(lián)(exhaustivecoupling)只能產生單一種類,即在每個賴氨酸上與肽連接的URP。該復合物行為在結合性質方面類似高親合多聚體,但易于生產。該方法參見圖24。主題MURP也可摻入URP,以便進行跨組織屏障的遞送??晒こ谈脑霼RP以增強跨越皮膚、口腔、口頰、小腸、鼻、血-腦、肺部、鞘、腹膜、直腸、陰道或許多其它組織屏障的遞送??诜鞍走f送的一個主要障礙是多數(shù)蛋白對于消化系統(tǒng)的蛋白酶敏感。與URP序列的偶聯(lián)能提高藥學活性蛋白對蛋白酶的抗性并利于其攝取。已顯示通過加入分子載體可提高蛋白在消化系統(tǒng)中的攝取。這些載體的主要任務是提高透膜性[Stoll,B.R.等(2000)JCow"o/ie/eaw,64:217-28]。因此可將序列包含在提高透膜性的URP序列中。已知許多序列可以提高透膜性,例如富精氨酸序列[Takenobu,T.等(2002)Mo/Ca"cw77zer,1:1043-9]。因此可通過組合兩種功能、減少感興趣蛋白的蛋白酶降解及增加融合產物的透膜性,來設計提高蛋白的細胞或口服攝取的URP序列??蛇x地,可將對優(yōu)選位于感興趣藥物的靶組織的蛋白酶敏感但對消化道蛋白酶穩(wěn)定的序列加入URP序列中。此類URP序列的例子為包含長GRS區(qū)域的序列,以及富含堿性氨基酸尤其是精氨酸并利于膜轉運的序列。可以類似途徑利用URP,以提高蛋白經鼻內、肺內或其它遞送途徑的攝取。-繁體產激示微-Di^/D/5激動劑-DR4和DR5是表達于許多腫瘤細胞的死亡受體??赏ㄟ^三聚化觸發(fā)這些受體,導致細胞死亡和腫瘤消退。可通過噬菌體淘選或其它展示方法獲取DR4或DR5的特異性結合域。如圖12所示,利用URP模塊作為接頭可將這些DR4或DR5特異性結合域多聚化。尤其感興趣的是包含三個或多個對DR4或DR5或兩者具有特異性的結合模塊的MURP。如圖12所示,MURP可包含對腫瘤組織中過度表達的腫瘤抗原具有特異性的其它結合模塊。這樣則可構建特異性蓄積于腫瘤組織中并觸發(fā)細胞死亡的MURP。MURP可包含結合DR4或DR5的模塊。尤其感興趣的是含有同時結合DR4和DR5的結合模塊的MURP。^^^彬/^/^力v素2-白介素2(IL2)是增強對腫瘤組織免疫應答的細胞因子。然而,全身性IL2治療的特征是其顯著的副作用。如圖13所示,可構建包含對腫瘤抗原有特異性的結合域及作為效應模塊的IL2的MURP。此類MURP能選擇性蓄積于腫瘤組織中,并在最大程度降低細胞因子治療全身副作用的同時引發(fā)腫瘤選擇性免疫應答。此類MURP可靶向數(shù)種腫瘤抗原如EpCAM、Her2、CEA、EGFR、湯姆遜弗萊德利奇抗原(ThomsenFriedenreichAntigen)。尤其有用的是結合于顯示緩慢內化的腫瘤抗原的MURP??墒褂闷渌毎蜃踊蚰[瘤壞死因子a作為效應模塊,設計類似MURP。i^f遂擇絲天冬^^《^"使用天冬酰胺酶治療急性白血病人。來自大腸桿菌和歐文菌(Erwinia)的天冬酰胺酶均可用于治療。兩種酶均能導致免疫原性和超敏反應。昂卡斯帕(Oncaspar)是PEG化的天冬酰胺酶,具有降低的免疫原性。然而,該蛋白難以制造并以同種型混合物進行給藥。在末端和/或環(huán)內部加入URP序列允許直接重組制造一種天冬酰胺酶變體,該變體是均質的并具有低的免疫原性。比較不同的URP序列和連接位點以確定URP序列連接的最佳位置。多種其它酶可降解被報道具有抗腫瘤活性的氨基酸。例子是精氨酸酶、甲硫氨酸酶、苯丙氨酸解氨酶和色氨酸酶。尤其感興趣的是海洋鏈霉菌Ofr印tom;;c^m"nY/m—的苯丙氨酸解氨酶,它具有高的特異性活性并無需輔因子[Calabrese,J.C.等(2004)說oc/zem/欲》43:11403-16]。多數(shù)這些酶是細菌或其它非人來源并可能引發(fā)免疫反應。加入一個或多個URP序列可降低這些酶的免疫原性。此外,連接URP序列后增加的流體力學半徑能提高這些酶的治療指數(shù)和PK性質。可設計主題MURP耙向任意細胞蛋白。下面提供的是非限制性列表。VEGF,VEGF-R1,VEGF-R2,VEGF-R3,Her-l,Her-2,Her-3,EGF隱1,EGF-2,EGF-3,A3,cMet,ICOS,CD40L,LFA-1,c隱Met,ICOS,LFA-1,IL-6,B7.1,B7.2,0X40,IL-lb,.TACI,IgE,BAFF或BLys,TPO陽R,CD19,CD20,CD22,CD33,CD28,IL-1-R1,TNFa,TRAIL-R1,補體受體l,F(xiàn)GFa,骨橋蛋白,玻連蛋白,EphrinAl-A5,EphrinBl-B3,a-2-巨球蛋白,CCL1,C(X2,CCL3,CCL4,CCL5,CCL6,CCL7,CXCL8,CXCL9,CXCLIO,CXCLll,CXCL12,CCL13,CCL14,CCL15,CXCU6,CCL16,CCL17,CCL18,CCU9,CCL20,C(X21,CCL22,PDGF,TGFb,GMCSF,SCF,p40(IL12/IL23),ILlb,ILla,ILlra,IL2,IL3,IL4,IL5,IL6,IL8,ILIO,IL12,IL15,IL23,Fas,F(xiàn)asL,F(xiàn)lt3配體,41BB,ACE,ACE-2,KGF,F(xiàn)GF-7,SCF,神經生長因子(netrin)l、2,IFNa、b、g,胱冬酶2、3、7、8、10,ADAMSl,S5、8、9、15,TS1,TS5;Adiponectin,ALCAM,ALK-1,APRIL,膜聯(lián)蛋白V,血管生成素,雙調蛋白,促血管生成素1、2、4,B7-1/CD80,B7-2/CD86,B7-H1,B7-H2,B7-H3,Bcl-2,BACE-1,BAK,BCAM,BDNF,bNGF,bECGF,BMP2、3、4、5、6、7、8;CRP,l丐粘著蛋白6、8、11;組織蛋白酶A、B、C、D、E、L、S、V、X;CDlla/LFA-l,LFA-3,GP2b3a,GH受體,RSVF蛋白,IL-23(p40、p19),IL-12,CD80,CD86,CD28,CTLA-4,a4(51,a4(37,TNF/淋巴毒素,IgE,CD3,CD20,IL-6,IL-6R,BLYS/BAFF,IL-2R,HER2,EGFR,CD33,CD52,地高辛,Rho(D),水痘,肝炎,CMV,破傷風,牛痘,抗蛇毒素,肉毒桿菌,Trail-Rl,Trail-R2,cMet,TNF-R家族,如LANGF陽R,CD27,CD30,CD40,CD95,淋巴毒素a/b受體,Wsl-l,TL1A/TNFSF15,BAFF,BAFF-R/TNFRSF13C,TRAILR2/TNFRSF10B,TRAILR2/TNFRSF10B,F(xiàn)as/TNFRSF6CD27/TNFRSF7,DR3/TNFRSF25,HVEM/TNFRSF14,TROY/TNPRSF19,CD40配體/TNFSF5,BCMA/TNFRSF17,CD30/TNFRSF8,LIGHT/TNFSF14,4-1BB/TNFRSF9,CD40/TNFRSF5,GITR/TNFRSF18,骨保護素/TNFRSF11B,RANK/TNFRSF11A,TRAILR3/TNFRSF10C,TRAIL/TNFSFIO,TRANCE/RANKL/TNFSFll,4-1BB酉己體/TNFSF9,TWEAK/TNFSF12,CD40配體/TNFSF5,F(xiàn)as配體/TNFSF6,RELT/TNFRSF19L,APRIL/TNFSF13,DcR3/TNFRSF6B,TNFRI/TNFRSF1A,TRAILR1/TNFRSF10A,TRAILR4/TNFRSF10D,CD30配體/TNFSF8,GITR配體/TNFSF18,TNFSF18,TACI/TNFRSF13B,NGFR/TNFRSF16,OX40配體/TNFSF4,TRAILR2/TNFRSF10B,TRAILR3/TNFRSF10C,TWEAKR/TNFRSF12,BAFF/BLyS/TNFSF13,DR6/TNFRSF21,TNF-a/TNFSFlA,Pro-TNF-a/TNFSFlA,淋巴毒素卩R/TNFRSF3,淋巴毒素PR(LTbR)/Fc嵌合體,TNFRI/TNFRSF1A,TNF-p/TNFSFlB,PGRP陽S,TNFRI/TNFRSF1A,TNF謂TNFRSF1B,EDA-A2,TNF-a/TNFSFlA,EDAR,XEDAR,TNFRI/TNFRSF1A。尤其感興趣的是以純化形式購得的人靶蛋白。例子如4EBP1、14-3-3;、53BP1、2B4/SLAMF4、CCL21/6Ckine、4-lBB/TNFRSF9、8D6A、4-1BB配體/TNFSF9、8-氧代-dG、4-氨基-l,8-萘酰亞胺、A2B5、氨基肽酶LRAP/ERAP2、A33、氨基肽酶N/ANPEP、Aag、氨基肽酶P2/XPNPEP2、ABCG2、氨基肽酶P1/XPNPEP1、ACE、氨基肽酶PILS/ARTS1、ACE-2、Amnionless、肌動蛋白、雙調蛋白、卩-肌動蛋白、AMPKal/2、活化素A、AMPKal、活化素AB、AMPKa2、活化素B、AMPKpl、活化素C、AMPK(32、活化素RIA7ALK-2、雄激素R/NR3C4、活化素RIB/ALK-4、血管生成素、活化素RIIA、促血管生成素-1、活化素RIIB、促血管生成素-2、ADAM8、促血管生成素-3、ADAM9、促血管生成素-4、ADAMIO、類促血管生成素1、ADAM12、類促血管生成素2、ADAM15、類促血管生成素3、TACE/ADAM17、類促血管生成素4、ADAM19、類促血管生成素7/CDT6、ADAM33、血管抑素、ADAMTS4、膜聯(lián)蛋白Al/膜聯(lián)蛋白I、ADAMTS5、膜聯(lián)蛋白A7、ADAMTS1、膜聯(lián)蛋白AIO、ADAMTSL隱1/Punctin、膜聯(lián)蛋白V、Adiponectin/Acrp30、ANP、AEBSF、AP位點、聚集蛋白聚糖、APAF-1、集聚蛋白、APC、AgRP、APE、AGTR-2、APJ、AIF、APLP-1、Akt、APLP-2、Aktl、載脂蛋白AI、Akt2、載脂蛋白B、Akt3、APP、血清蛋白、APR1L/TNFSF13、ALCAM、ARC、ALK隱1、Artemin、ALK-7、芳基硫酸酯酶A/ARSA、堿性磷酸酶、ASAH2/N-?;拾贝及被饷?2、a2u-球蛋白、ASC、a-l-酸性糖蛋白、ASGR1、甲胎蛋白、ASK1、ALS、ATM、成釉蛋白、ATRIP、AMICA/JAML、AuroraA、AMIGO、AuroraB、AMIG02、Axin-l、AMIG03、Axl、氨基?;?ACYl、天青殺素/CAP37/HBP、氨基肽酶A/ENPEP、B4GALT1、BIM、B7-1/CD80、6-生物素-17-NAD、B7-2/CD86、BLAME/SLAMF8、B7-H1/PD匿L1、CXCL13/BLC/BCA陽1、B7-H2、BLI旨1、B7隱H3、Blk、B7-H4、BMI-1、BACE-1、BMP-1/PCP、BACE-2、B證陽2、Bad、BMP-3、BAFF/TNFSF13B、BMP-3b/GDF-10、BAFFR/TNFRSF13C、BMP-4、Bag-l、BMP隱5、BAK、BMP國6、BAMBI/NMA、BMP-7、BARD1、BMP-8、Bax、BMP-9、BCAM、BMP-IO、Bcl畫lO、BMP-15/GDF-9B、Bcl-2、BMPR陽IA/ALK-3、Bcl-2相關蛋白A1、BMPR-IB/ALK-6、Bcl-w、BMPR-II、Bcl-x、BNIP3L、Bcl-xL、BOC、BCMA/TNFRSF17、BOK、BDNP、BPDE、苯甲酰胺、鼠短尾突變體(Brachyury)、共用|3鏈、B-Raf、|3IG-H3、CXCL14/BRAK、(3動物纖維素、BRCA1、J3-防御素2、BRCA2、BID、BTLA、雙鏈蛋白聚糖、Bub-l、類Bik殺傷蛋白、c-jun、CD90/Thyl、c-Rel、CD94、CCL6/C10、CD97、ClqRl/CD93、CD151、ClqTNFl、CD160、ClqTNF4、CD163、ClqTNF5、CD164、補體成分Clr、CD200、補體成分Cls、CD200R1、補體成分C2、CD229/SLAMF3、補體成分C3a、CD23/FcsRH、補體成分C3d、CD2F-10/SLAMF9、補體成分C5a、CD5L、鈣粘著蛋白-4/R-l丐粘著蛋白、CD69、鈣粘著蛋白-6、CDC2、鈣粘著蛋白-8、CDC25A、鈣粘著蛋白-Il、CDC25B、鈣粘著蛋白-12、CDCP1、鈣粘著蛋白-13、CDO、鈣粘著蛋白-17、CDX4、E-鈣粘著蛋白、CEACAM-l/CD66a、N-鈣粘著蛋白、CEACAM-6、P-鈣粘著蛋白、Cerbems1、VE-鈣粘著蛋白、CFTR、l丐結合素D、cGMP、l丐調磷酸酶A、ChemR23、鈣調磷酸酶B、Chemerin、內質網鈣結合蛋白-2、趨化因子樣品包、CaM激酶II、類殼多糖酶31、cAMP、殼三糖酶/CHITl、大麻素R1、Chkl、大麻素R2/CB2/CNR2、Chk2、CAR/NR113、CHL-l/LlCAM-2、碳酸酐酶I、膽堿乙?;D移酶/ChAT、碳酸酐酶II、Chondrolectin、碳酸酐酶III、Chordin、碳酸酐酶IV、類Chordinl、碳酸酐酶VA、類Chordin2、碳酸酐酶VB、CINC-1、碳酸酐酶VI、CINC-2、碳酸酐酶VII、CINC-3、碳酸酐酶VIII、卡環(huán)(claspin)、碳酸酐酶IX、Claudin-6、碳酸酐酶X、CLC、碳酸酐酶XII、CLEC-1、碳酸酐酶XIII、CLEC-2、碳酸酐酶XIV、CLECSF13/CLEC4F、羧甲基賴氨酸、CLECSF8、羧基肽酶A1/CPA1、CLF-1、羧基肽酶A2、CL隱P1/C0LEC12、羧基肽酶A4、叢生蛋白、羧基肽酶B1、類聚集素l、羧基肽酶E/CPE、CMG-2、羧基肽酶X1、CMVUL146、心肌營養(yǎng)素-1、CMVUL147、肌肽二肽酶1、CNP、Caronte、CNTF、CART、CNTFRa、胱冬酶、凝集因子II/凝血酶、胱冬酶-1、凝集因子III/組織因子、胱冬酶-2、凝集因子VII、胱冬酶-3、凝集因子X、胱冬酶-4、凝集因子XI、胱冬酶-6、凝集因子XIV/蛋白質C、胱冬酶-7、COCO、胱冬酶-8、Cohesin、胱冬酶-9、膠原I、胱冬酶-10、膠原II、胱冬酶-12、膠原IV、胱冬酶-13、公用Y鏈/lL-2Ry、胱冬酶肽抑制劑、COMP/血小板反應蛋白-5、過氧化氫酶、補體成分ClrLP、P-聯(lián)蛋白、補體成分ClqA、組織蛋白酶1、補體成分ClqC、組織蛋白酶3、補體因子D、組織蛋白酶6、補體因子I、組織蛋白酶A、補體MASP3、組織蛋白酶B、連接蛋白43、組織蛋白酶C/DPPI、接觸蛋白-1、組織蛋白酶D、接觸蛋白-2/TAGl、組織蛋白酶E、接觸蛋白-4、組織蛋白酶F、接觸蛋白-5、組織蛋白酶H、Corin、組織蛋白酶L、Cornulin、組織蛋白酶O、CORS26/ClqTNF、3、組織蛋白酶S、大鼠皮層干細胞、組織蛋白酶V、氫化可的松、組織蛋白酶X/Z/P、COUP-TFI/NR2F1、CBP、COUP-TF廳R2F2、CCI、COX-l、CCK國AR、COX-2、CCL28、CRACC/SLAMF7、CCR1、C-反應蛋白、CCR2、肌酸激酶、肌肉/CKMM、CCR3、肌酸酐、CCR4、CREB、CCR5、CREG、CCR6、CRELD1、CCR7、CRELD2、CCR8、CRHBP、CCR9、CRHR-1、CCRIO、CRIM1、CD155/PVR、畸胎癌生長因子(cripto)、CD2、CRISP陽2、CD3、CRISP-3、CD4、橫脈缺失陽2、CD4+/45RA-、CRTAM、CD4+/45RO-、CRTH-2、CD4+/CD62L-/CD44、CRY1、CD4+/CD62L+/CD44、隱蛋白(Cryptic)、CD5、CSB/ERCC6、CD6、CCL27/CTACK、CD8、CTGF/CCN2、CD8+/45RA-、CTLA-4、CD8+/45RO-、Cubilin、CD9、CX3CR1、CD14、CXADR、CD27/TNFRSF7、CXCL16、CD27配體/TNFSF7、CXCR3、CD28、CXCR4、CD30/TNFRSF8、CXCR5、CD30配體/TNFSF8、CXCR6、CD31/PECAM-1、親環(huán)蛋白A、CD34、Cyr61/CCN1、CD36/SR-B3、胱抑素A、CD38、胱抑素B、CD40/TNFRSF5、胱抑素C、CD40配體/TNFSF5、胱抑素D、CD43、胱抑素E/M、CD44、胱抑素F、CD45、胱抑素H、CD46、胱抑素H2、CD47、胱抑素S、CD48/SLAMF2、胱抑素SA、CD55/DAF、胱抑素SN、CD58/LFA-3、細胞色素c、CD59、脫輔基細胞色素c、CD68、成熟細胞色素c、CD72、細胞角蛋白8、CD74、細胞角蛋白14、CD83、細胞角蛋白19、CD84/SLAMF5、Cytonin、D6、DISP1、DAN、Dkk-l、DANCE、Dkk-2、DARPP-32、Dkk-3、DAX1皿0B1、Dkk-4、DCC、DLEC、DCIR/CLEC4A、DLL1、DCAR、DLL4、DcR3/TNFRSF6B、d-螢光素、DC-SIGN、DNA連接酶IV、DC-SIGNR/CD299、DNA聚合酶p、DcTRAILRl/TNFRSF23、DNAM-1、DcTRAILR2/TNFRSF22、DNA-PKcs、DDR1、DNER、DDR2、多巴脫羧酶/DDC、DEC-205、DPCR隱1、Decapentaplegic、DPP6、核心蛋白多糖、DPPA4、Dectin-1/CLEC7A、DPPA5/ESG1、Dectin-2/CLEC6A、DPPII/QPP/DPP7、DEP-1/CD148、DPPIV/CD26、DesertHedgehog、DR3/TNFRSF25、結蛋白、DR6/TNFRSF21、橋粒芯蛋白-1、DSCAM、橋粒芯蛋白-2、DSCAM-L1、橋粒芯蛋白-3、DSPG3、蓬亂蛋白(Dishevelled)-1、D汰、蓬亂蛋白-3、動力素、EAR2/NR2F6、EphA5、ECE陽1、EphA6、ECE-2、EphA7、ECF-L/CHBL3、EphA8、ECM-1、EphBl、Ecotin、EphB2、EDA、EphB3、EDA-A2、EphB4、EDAR、EphB6、EDG-1、Ephrin、EDG-5、Ephrin-Al、EDG隱8、Ephrin-A2、eEF-2、Ephrin-A3、EGF、Ephrin-A4、EGFR、Ephrin-A5、EGR1、Ephrin-B、EG-VEGF/PK1、Ephrin-Bl、elF2a、Ephrin-B2、elF4E、Ephrin-B3、Elk-l、外成蛋白(Epigen)、EMAP-II、表皮形態(tài)發(fā)生素/突觸融合蛋白2、EMMPRIN/CD147、邊條曲菌素、CXCL5/ENA、EPR-1/Xa受體、內皮細胞特異性分子、ErbB2、Endoglin/CD105、ErbB3、內聚糖、ErbB4、核酸內切酶III、ERCC1、核酸內切酶IV、ERCC3、核酸內切酶V、ERK1/ERK2、核酸內切酶VIII、ERK1、Endorepellin/串珠素(perlecan)、ERK2、內皮抑素、ERK3、內皮縮血管肽-1、ERK5/BMK1、鋸齒狀蛋白-2、ERRa/NR3Bl、EN-RAGE、ERR卩/NR3B2、腸肽酶/腸激酶、ERRY/NR3B3、CCLll/趨化胞蛋白(趨化胞蛋白)、紅細胞生成素、CCL24/趨化胞蛋白-2、紅細胞生成素R、CCL26/趨化胞蛋白-3、ESAM、EpCAM/TROP-l、ERa/NR3Al、EPCR、ER(3/NR3A2、Eph、外切核酸酶III、EphAl、類Exostosin2/EXTL2、EphA2、類Exostosin3/EXTL3、EphA3、FABP1、FGF-BP、FABP2、FGFRl-4、FABP3、FGFR1、FABP4、FGFR2、FABP5、FGFR3、FABP7、FGFR4、FABP9、FGFR5、補體因子B、Fgr、FADD、FHR5、FAM3A、纖連蛋白、FAM3B、纖維膠凝蛋白-2、FAM3C、纖維膠凝蛋白-3、FAM3D、FITC、成纖維細胞激活蛋白a/FAP、FKBP38、Fas/TNFRSF6、Flap、Fas配體/TNFSF6、FLIP、FATP1、FLRG、FATP4、FLRT1、FATP5、FLRT2、FcyRI/CD64、FLRT3、FcyRIIB/CD32b、Flt-3、FcyRIIC/CD32c、Flt-3配體、FcyRIIA/CD32a、卵泡抑素、FcyRIII/CD16、卵泡抑素樣蛋白1、FcRHl/IRTA5、FosB/G0S3、FcRH2/IRTA4、FoxD3、FcRH4/IRTAl、FoxJl、FcRH5/IRTA2、FoxP3、Fc受體樣3/CD16-2、Fpg、FEN-l、FPR1、胎球蛋白A、FPRL1、胎球蛋白B、FPRL2、酸性FGF、CX3CL1/Fractalkine、堿性FGF、巻曲蛋白-1、FGF-3、巻曲蛋白-2、FGF-4、巻曲蛋白-3、FGF-5、巻曲蛋白-4、FGF-6、巻曲蛋白-5、FGF-8、巻曲蛋白-6、FGF-9、巻曲蛋白-7、FGF-IO、巻曲蛋白-8、FGF-ll、巻曲蛋白-9、FGF隱12、Frk、FGF-13、sFRP-l、FGF陽16、sFRP-2、FGF-17、sFRP-3、FGF陽19、sFRP陽4、FGF-20、弗林蛋白酶(Furin)、FGF-21、FXR/NR1H4、FGF-22、Fyn、FGF-23、G9a/E畫T2、GFRa-3/GDNFRa國3、GABA-A-Ral、GFRa-4/GDNFRa-4、GABA-A-Ra2、GITR/TNFRSF18、GABA-A-Ra4、GITR配體/TNFSF18、GABA-A-Ra5、GLI-1、GABA-A-Ra6、GLI-2、GABA-A國R(31、GLP/EHMT1、GABA-A-R卩2、GLP-1R、GABA-A-R(33、胰高血糖素、GABA-A-RY2、葡糖胺(N-乙?;?-6-硫酸酯酶/GNS、GABA-B-R2、GluRl、GAD1/GAD67、GluR2/3、GAD2/GAD65、GluR2、GADD45a、GluR3、GADD45p、Glutl、GADD45y、Glut2、半乳凝素-1、Glut3、半乳凝素-2、Glut4、半乳凝素-3、Glut5、半乳凝素-3BP、谷氧還蛋白1、半乳凝素-4、甘氨酸R、半乳凝素-7、血型糖蛋白A、半乳凝素-8、磷脂酰肌醇蛋白聚糖2、半乳凝素-9、磷脂酰肌醇蛋白聚糖3、GalNAc4S-6ST、磷脂酰肌醇蛋白聚糖5、GAP-43、磷脂酰肌醇蛋白聚糖6、GAPDH、GM-CSF、Gasl、GM-CSFRa、Gas6、GMF-p、GASP-1/WFIKKNRP、gpl30、GASP-2/WFIKKN、糖原磷酸化酶BB/GPBB、GATA-1、GPR15、GATA-2、GPR39、GATA-3、GPVI、GATA-4、GR/NR3C1、GATA-5、Gr-1/Ly-6G、GATA-6、顆粒溶素、GBL、粒酶A、GCNF/NR6A1、粒酶B、CXCL6/GCP-2、粒酶D、G-CSF、粒酶G、G-CSFR、粒酶H、GDF-1、GRASP、GDF-3GRB2、GDF-5、小鬼蛋白(G腿lin)、GDF-6、GRO、GDF-7、CXCLl/GROa、GDF-8、CXCL2/GRO卩、GDF-9、CXCL3/GROy、GDF-ll、生長激素、GDF-15、生長激素R、GDNF、GRP75/HSPA9B、GFAP、GSK-3a/卩、GFI-1、GSK國3a、GFRa-l/GDNFRa-l、GSK-3卩、GFRa-2/GDNFRa-2、EZFIT、H2AX、組氨酸、H60、HM74A、HAI-1、HMGA2、HAI-2、畫GB1、HAI-2A、TCF-2麵F陽lp、HAI-2B、HNF-3卩/FoxA2、HAND1、HNF-4a/NR2Al、HAPLN1、HNF-4y/NR2A2、氣道類胰蛋白酶/HAT、HO-l/HMOXl/HSP32、HB-EGF、HO-2/HMOX2、CCL14a/HCC-l、HPRG、CCL14b/HCC陽3、Hrk、CCL16/HCC-4、HRP-1、aHCG、HS6ST2、Hck、HSD-1、HCR/CRAM-A/B、HSD-2、HDGF、HSP10/EPF、血紅蛋白、HSP27、Hepassocin、HSP60、HES-1、HSP70、HES-4、HSP90、HGF、HTRA/蛋白酶Do、HGF激活蛋白、HTRA1/PRSS11、HGFR、HTRA2/Omi、HIF-la、HVEM/TNFRSF14、HIF-2a、乙酰透明質酸、HIN-1/分泌球蛋白3A1、4-羥基壬烯酸、Hip、CCLl/I-309/TCA-3、IL-IO、cIAP(全)、IL-10Ra、cIAP隱l/HIAP-2、IL-10R(3、cIAP-2/HIAP-l、IL-ll、IBSP/唾液酸蛋白II、IL-llRa、ICAM-1/CD54、IL-12、ICAM-2/CD102、IL-12/IL-23p40、ICAM-3/CD50、IL隱12乖、ICAM-5、IL-12R(32、ICAT、IL-13、ICOS、IL-13Ral、艾杜糖醛酸2-硫酸酯酶/IDS、IL-13Ra2、IFN、IL-15、IFN-a、IL-15Ra、IFN-al、IL-16、IFN-a2、IL-17、IFN-a4b、IL陽17R、IFN誦aA、IL-17RC、IFN-aB2、IL-17RD、IFN陽aC、IL-17B、IFN-aD、IL-17BR、IFN陽aF、IL-17C、IFN-aG、IL-17D、IFN-aH2、IL陽17E、IFN-aI、IL-17F、IFN-aJl、IL-18/IL-1F4、IFN-aK、IL-18BPa、IFN-aWA、IL-18BPc、IFN-a/(3Rl、IL-18BPd、IFN-a/J3R2、IL-18Ra/IL-lR5、IFN-(3、IL-18R(3/IL-1R7、IFN-y、IL-19、IFN-yRl、IL-20、IFN-yR2、IL-20Ra、IFN-to、IL-20Rp、IgE、IL-21、IGFBP-1、IL-21R、IGFBP-2、IL-22、IGFBP-3、IL隱22R、IGFBP-4、IL-22BP、IGFBP-5、IL-23、IGFBP-6、IL-23R、IGFBP-L1、IL-24、IGFBP-rpl/IGFBP-7、IL-26/AK155、IGFBP-rPlO、IL-27、IGF-I、IL-28A、IGF-IR、IL-28B、IGF-II、IL-29/IFN-}J、IGF-IIR、IL-31、IgG、IL-31RA、IgM、IL-32a、IGSF2、IL-33、IGSF4A/SynCAM、ILT2/CD85j、IGSF4B、ILT3/CD85k、IGSF8、ILT4/CD85d、IgY、ILT5/CD85a、IkB-卩、ILT6/CD85e、IKKa、印度Hedgehog、IKKs、INSRR、IKKy、胰島素、IL-Ia/IL-1F1、胰島素R/CD220、IL-1(3/IL-1F2、前胰島素、IL-lra/IL-lF3、細胞溶解酶/IDE、IL-1F5/FIL1S、整聯(lián)蛋白a2/CD49b、IL-lF6/FILls、整聯(lián)蛋白a3/CD49c、IL-1F7/FIL1;、整聯(lián)蛋白a3(31/VLA-3、IL-lF8/FILlri、整聯(lián)蛋白a4/CD49d、IL-1F9/IL-1H1、整聯(lián)蛋白a5/CD49e、IL-1F10/IL-1HY2、整聯(lián)蛋白a5卩l(xiāng)、IL-1RI、整聯(lián)蛋白a6/CD49f、IL-IRII、整聯(lián)蛋白a7、IL-lR3/IL-lRAcP、整聯(lián)蛋白a9、IL-1R4/ST2、整聯(lián)蛋白aE/CD103、IL-lR6/IL-lRrp2、整聯(lián)蛋白aL/CDlla、IL-1R8、整聯(lián)蛋白aL(32、IL-1R9、整聯(lián)蛋白aM/CDllb、IL-2、整聯(lián)蛋白aM卩2、IL-2Ra、整聯(lián)蛋白aV/CD51、IL-2RJ3、整聯(lián)蛋白aV(35、IL-3、整聯(lián)蛋白aV(33、IL-3Ra、整聯(lián)蛋白aV|36、IL-3R|3、整聯(lián)蛋白aX/CDllc、IL-4、整聯(lián)蛋白(31/CD29、IL-4R、整聯(lián)蛋白(32/CD18、IL-5、整聯(lián)蛋白卩3/CD61、IL-5Ra、整聯(lián)蛋白|35、IL-6、整聯(lián)蛋白卩6、IL-6R、整聯(lián)蛋白|37、IL-7、CXCL10/IP-10/CRG陽2、IL-7Ra/CD127、IRAKI、CXCR1/IL-8RA、IRAK4、CXCR2/IL-8RB、IRS-1、CXCL8/IL層8、Islet-l、IL扁9、CXCL11/I-TAC、IL-9R、鋸齒蛋白(Jagged)1、JAM-4/IGSF5、鋸齒蛋白2、JNK、JAM-A、JNK1/JNK2、JAM-B/VE-JAM、JNK1、JAM-C、JNK2、激肽原、激肽釋放酶3/PSA、Kininostatin、激肽釋放酶4、KIR7CD158、激肽釋放酶5、KIR2DL1、激肽釋放酶6/甘油磷酸鈣、KIR2DL3、激肽釋放酶7、KIR2DL4/CD158d、激肽釋放酶8/甘油磷酸鈣、KIR2DS4、激肽釋放酶9、KIR3DL1、血漿激肽釋放酶/KLKBl、KIR3DL2、激肽釋放酶IO、Kirrel2、激肽釋放酶11、KLF4、激肽釋放酶12、KLF5、激肽釋放酶13、KLF6、激肽釋放酶14、Klotho、激肽釋放酶15、Klothop、KC、KOR、Keapl、Kremen-l、Kell、Kremen-2、KGF/FGF-7、LAG-3、LINGO-2、LAIR1、Lipin2、LAIR2、脂質運載蛋白(lipocalin)-l、層粘連蛋白a4、脂質運載蛋白-2/NGAL、層粘連蛋白y1、5-脂肪氧合酶、層粘連蛋白I、LXRa/NRlH3、層粘連蛋白S、LXR(3/NR1H2、層粘連蛋白-1、Livin、層粘連蛋白-5、LIX、LAMP、LMIR1/CD300A、Langerin、LMIR2/CD300c、LAR、LMIR3/CD300LF、Latexin、LMIR5/CD300LB、Layilin、LMIR6/CD300LE、LBP、LM02、LDLR、LOX陽1/SR-E1、LECT2、LRH-1艦5A2、LEDGF、LRIG1、Lefty、LRIG3、Lefty-1、LRP-1、Lefty-A、LRP-6、Legumain、LSECtin/CLEC4G、瘦激素、光蛋白聚糖、瘦激素R、CXCL15/Lungkine、白三烯B4、XCLl/淋巴細胞趨化因子、白三烯B4R1、淋巴毒素、LIF、淋巴毒素卩/TNFSF3、LIFRa、淋巴毒素卩R/TNFRSF3、LIGHT/TNFSF14、Lyn、限制蛋白(Limitin)、Lyp、LIMPII/SR-B2、賴氨酰氧化酶同源物、LIN-28、LYVE-1、LINGO-1、a2-巨球蛋白、CXCL9/MIG、MAD2L1、Mimecan、MAdCAM-l、Mindin、Maffi、鹽皮質激素R/NR3C2、MafF、CCL3Ll/MIP隱la同種型LD78卩、MafG、CCL3/MIP陽la、MafK、CCL4L1/LAG-1、MAG/Siglec-4a、CCL4/MIP-1卩、MANF、CCL15/MIP-13、MAP2、CCL9/10/MIP-ly、MAPK、MIP-2、Marapsin/Pancreasin、CCL19/MIP-3(3、MARCKS、CCL20/MIP-3a、MARCO、MIP-I、Mash1、MIP-II、Matrilin-2、MIP-ni、Matrilin-3、MIS/AMH、Matrilin陽4、MISRII、Matriptase/ST14、MIXL1、MBL、MKK3/MKK6、MBL-2、MKK3、黑皮質素3R/MC3R、MKK4、MCAM/CD146、MKK6、MCK-2、MKK7、Mcl陽l、區(qū)P-3、MCP-6、MLH-1、CCL2/MCP-1、MLK4a、MCP-ll、MMP、CCL8/MCP-2、MMP陽1、CCL7/MCP-3/MARC、MMP-2、CCL13/MCP-4、MMP-3、CCL12/MCP-5、MMP-7、M-CSF、MMP-8、M隱CSFR、MMP-9、II型MCV、MMP-IO、固-1、MMP-ll、MD-2、MMP國12、CCL22/MDC、MMP-13、MDL-1/CLEC5A、MMP-14、MDM2、MMP-15、MEA-1、MMP-16/MT3國MMP、MEK1/MEK2、MMP-24/MT5-MMP、MEK1、MMP-25/MT6-MMP、MEK2、MMP-26、貝美噻嗪、MMR、MEPE、MOG、甲丙氨酯a、CCL23/MPIF-1、甲丙氨酯(3、M-Ras/R-Ras3、Mer、Mrell、Mesothelin、MRP1Meteorin、MSK1/MSK2、甲硫氨酸氨基肽酶1、MSK1、甲硫氨酸氨基肽酶、MSK2、甲硫氨酸氨基肽酶2、MSP、MFG-E8、MSPR/Ron、MFRP、Mug、MgcRacGAP、MULT國1、MGL2、武藏蛋白(Musashi)-l、MGMT、武藏蛋白-2、MIA、MuSK、云母、MutYDNA糖基酶、MICB、MyD88、MICL/CLEC12A、髓系過氧化物酶、(32微球蛋白、Myocardin、肝素結合細胞因子、Myocilin、MIF、肌珠蛋白、NAIPNGFI-By/NR4A3、Nanog、NgR2/NgRHl、CXCL7/NAP-2、NgR3/NgRH2、Nbsl、巢蛋白-l/巢蛋白、NCAM-1/CD56、巢蛋白-2、NCAM-L1、氮氧化物、連接素-1、硝基酪氨酸、連接素-2/CD112、NKG2A、連接素-3、NKG2C、連接素-4、NKG2D、Neogenin、NKp30、腦啡肽酶/CD10、NKp44、腦啡肽酶-2/MMELl/MMEL2、NKp46/NCRl、Nestin、NKp80/KLRFl、NET02、NKX2.5、神經突起生長導向因子-1、NMDAR、NR1亞基、神經突起生長導向因子-2、NMDAR、NR2A亞基、神經突起生長導向因子-4、NMDAR、NR2B亞基、神經突起生長導向因子-Gla、NMDAR、NR2C亞基、神經突起生長導向因子-G2a、N-Me-6、7-diOH-TIQ、神經調節(jié)蛋白-1/NRG1、Nodal、神經調節(jié)蛋白-3/NRG3、Noggin、Neuritin、Nogo受體、NeuroDl、Nogo-A、神經束蛋白、NOMO、神經源素-1、Nope、神經源素-2、Norrin、神經源素-3、eNOS、溶神經素、iNOS、(垂體)后葉激素運載蛋白II、nNOS、神經菌毛蛋白-1、Notch-l、神經菌毛蛋白-2、Notch-2、Neuropoietin、Notch-3、Neurotrimin、Notch-4、Neurturin、NOV/CCN3、NFAM1、NRAGE、NF陽H、NrCAM、NFkBl、NRL、NFkB2、NT-3、NF-L、NT國4、NF陽M、NTB-A/SLAMF6、NG2/MCSP、NTH1、NGFR/TNFRSF16、Nucleostemin、卩-NGF、Nurr-1/NR4A2、NGFI-Ba/NR4A1、OAS2、阿立新B、OBCAM、OSCAR、OCAM、OSF-2/Periostin、OCIL/CLEC2d、制瘤素M/OSM、OCILRP2/CLEC2i、OSMR(3、Oct-3/4、Osteo活化素/GPNMB、OGGl、Osteoadherin、Oligl、2、3、骨鈣素、Oligl、Osteocrin、01ig2、骨橋蛋白、01ig3、護骨素/TNFRSFllB、少突膠質細胞標記物Ol、Otx2、少突膠質細胞標記物04、OV-6、OMgp、OX40/TNFRSF4、Opticin、OX40配體/TNFSF4、阿立新A、OAS2、阿立新B、OBCAM、OSCAR、OCAM、OSF-2/Periostin、OCIL/CLEC2d、制瘤素M/OSM、OCILRP2/CLEC2i、OSMR卩、Oct-3/4、骨活化素/GPNMB、OGGl、Osteoadherin、Oligl、2、3、骨l丐素、Oligl、Osteocrin、01ig2、骨橋蛋白、01ig3、護骨素/TNFRSFl1B、少突膠質細胞標記物01、Otx2、少突膠質細胞標記物O4、OV-6、OMgp、OX40/TNFRSF4、Opticin、OX40配體/TNFSF4、阿立新A、RACKl、Ret、Radl、REV-ERBa/NRlDl、Radl7、REV陽ERB卩/NR1D2、Rad51、Rex-l、Rae-l、RGM-A、Rae匿la、RGM-B、Rae-1卩、RGM-C、Rae-lS、Rheb、Rae-ls、核糖體蛋白S6、Rae-ly、RIP1、Raf-l、ROBOl、RAGE、ROB02、RalA/Ra舊、ROB03、RalA、ROB04、RalB、RO謹RlFl陽3(pan)、RANK/TNFRSF11A、RORa歸lFl、CCL5/RANTES、RORy/NRlF3、RaplA/B、類RTK孤兒受體1/RORl、RARa/NRlBl、類RTK孤兒受體2/ROR2、RAR卩/NR1B2、RP105、RARy/NRlB3、RPA2、Ras、RSK(pan)、RBP4、RSK1/RSK2、RECK、RSK1、Reg2/PAP、RSK2、Regl、RSK3、RegII、RSK4、RegIII、R國Spondinl、RegIIIa、R-Spondin2、RegIV、R-Spondin3、松弛素-1、RUNX1/CBFA2、松弛素-2、RUNX2/CBFAl、松弛素-3、RUNX3/CBFA3、RELMa、RXRa/NR2Bl、RELMp、RXR(3/NR2B2、RELT/TNPRSF19L、RXRy/NR2B3、抵抗素、S100A10、SLITRK5、S100A8、SLPI、S100A9、SMAC/Diablo、S100B、Smadl、S100P、Smad2、SALL1、Smad3、S-肌聚糖、Smad4、Sca-1/Ly6、Smad5、SCD-1、Smad7、SCF、Smad8、SCFR/c-kit、SMC1、SCGF、a-平滑肌肌動纖維、SCL/Tal1、SMUG1、SCP3/SYCP3、Snail、CXCL12/SDF-1、鈉鈣交換蛋白1、SDNSF/MCFD2、Soggy-l、a-分泌酶、SonicHedgehog、y-分泌酶、SorCSl、卩-分泌酶、SorCS3、E-選擇素、Sortilin、L-選擇素、SOST、P-選擇素、SOXl、腦信號蛋白3A、SOX2、腦信號蛋白3C、SOX3、腦信號蛋白3E、SOX7、腦信號蛋白3F、SOX9、腦信號蛋白6A、SOX10、腦信號蛋白6B、SOX17、腦信號蛋白6C、SOX21腦信號蛋白6D、SPARC、腦信號蛋白7A、類SPARCl、分離酶、SP-D、絲氨酸/蘇氨酸磷酸酶底物1、Spinesin、絲氨酸蛋白酶抑制劑A1、F-Spondin、絲氨酸蛋白酶抑制劑A3、SR-AI/MSR、絲氨酸蛋白酶抑制劑A4/Kallistatin、Src、絲氨酸蛋白酶抑制劑A5/蛋白C抑制劑、SREC-I/SR-F1、絲氨酸蛋白酶抑制劑A8/血管緊張素原、SREC-II、絲氨酸蛋白酶抑制劑B5、SSEA-1、絲氨酸蛋白酶抑制劑Cl/抗凝血酶-m、SSEA-3、絲氨酸蛋白酶抑制劑Dl/肝素輔因子II、SSEA-4、絲氨酸蛋白酶抑制劑E1/PAI-1、ST7/LRP12、絲氨酸蛋白酶抑制劑E2、美卡拉明-1、絲氨酸蛋白酶抑制劑F1、美卡拉明-2、絲氨酸蛋白酶抑制劑F2、斯鈣素l、絲氨酸蛋白酶抑制劑G1/C1抑制劑、斯鈣素2、絲氨酸蛋白酶抑制劑I2、STAT1、血清淀粉樣Al蛋白、S丁AT2、SF-1/NR5A1、STAT3、SGK、STAT4、SHBG、STAT5a/b、SHIP、STAT5a、SHP維0B2、STAT5b、SHP-1、STAT6、SHP-2、VE抑素、SIGIRR、Stella/Dppa3、Siglec-2/CD22、STR0-1、Siglec-3/CD33、物質P、Siglec-5、硫酸酰胺酶/SGSH、Siglec-6、硫酸酯酶修飾因子1/SUMF1、Siglec-7、硫酸酯酶修飾因子2/SUMF2、Siglec-9、SUMOl、Siglec-lO、SUM02/3/4、Siglec-ll、SUM03、Siglec-F、超氧化物歧化酶、SIGNR1/CD209、超氧化物歧化酶-l/Cu-ZnSOD、SIGNR4、超氧化物歧化酶-2/Mn-SOD、SIRP(31、超氧化物歧化酶-3/EC-SOD、SKI、存活蛋白、SLAM/CD150、突觸蛋白I、睡美人轉座酶、多配體蛋白聚糖-l/CD138、Slit3、多配體蛋白聚糖-2、SLITRK1、多配體蛋白聚糖-3、SLITRK2、多配體蛋白聚糖-4、SLITRK4、TACI/TNFRSF13B、TMEFFl/Tomoregulin-l、TA02、TMEFF2、TAPP1、TNF誦a/TNFSFlA、CCL17/TARC、TNF陽卩/TNFSF1B、Tau、TNFRI/TNFRSF1A、TC21/R-Ras2、TNFRII/TNFRSF1B、TCAM-1、TOR、TCCR7WSX-1、TP-1、TC-PTP、TP63/TP73L、TDG、TR、CCL25/TECK、TRa/NRlAl、結合腕蛋白C、TR卩1/NR1A2、結合腕蛋白R、TR2/NR2C1、TER-119、TR4/NR2C2、TERT、TRA-1陽85、Testican1/SP0CK1、TRADD、Testican2/SPOCK2、TRAF-1、Testican3/SPOCK3、TRAF-2、TFPI、TRAF-3、TFPI-2、TRAF-4、TGF-a、TRAF-6、TGF-f3、TRAIL/TNFSF10、TGF-pl、TRAILR1/TNFRSF10A、LAP(TGF-|31)、TRAILR2/TNFRSF10B、潛伏TGF-(31、TRAILR3/TNFRSF10C、TGF-卩1.2、TRAILR4/TNFRSF10D、TGF-(32、TRANCE/TNFSFll、TGF-p3、TfR(轉鐵蛋白R)、TGF-卩5、脫鐵轉鐵蛋白、潛伏TGF-(3bpl、飽和轉鐵蛋白、潛伏TGF-(3bp2、Trappin-2/Ekfin、潛伏TGF-(3bp4、TREM-1、TGF隱卩RI/ALK-5、TREM-2、TGF-|3Rn、TREM-3、TGF-(3RIIb、TREML1/TLT-1、TGF-卩RIII、TRF-1、嗜熱菌蛋白酶、TRF-2、硫氧還蛋白-1、TRH-降解外向酶/TRHDE、硫氧還蛋白-2、TRIM5、硫氧還蛋白-80、三肽基肽酶I、類硫氧還蛋白5/TRP14、TrkA、TH0P1、TrkB、血栓調節(jié)蛋白/CD141、TrkC、血小板生成素、TR0P-2、血小板生成素R、肌鈣蛋白I肽3、血小板反應蛋白-1、肌鈣蛋白T、血小板反應蛋白-2、TROY/TNFRSF19、血小板反應蛋白-4、胰蛋白酶1、胸腺生成素、胰蛋白酶2/PRSS2、胸腺趨化因子-1、胰蛋白酶3/PRSS3、Tie隱l、類胰蛋白酶-5/Prss32、Tie-2、類胰蛋白酶a/TPSl、TIM-1/KIM-1/HAVCR、類胰蛋白酶(3-l/MCPT-7、TIM-2、類胰蛋白酶卩-2/TPSB2、TIM-3、類胰蛋白酶e/BSSP-4、TIM-4、類胰蛋白酶,1/TPSG1、TIM-5、色氨酸羥化酶、TIM-6、TSC22、TIMP-1、TSG、T旨-2、TSG-6、TI旨-3、TSK、T鮮-4、TSLP、TL1A/TNFSF15、TSLPR、TLR1、TSP50、TLR2、卩-III微管蛋白、TLR3、TWEAK7TNFSF12、TLR4、TWEAKR/TNFRSF12、TLR5、Tyk2、TLR6、磷酸酪氨酸、TLR9、酪氨酸羥化酶、TLX/NR2E1、酪氨酸磷酸酶底物I、泛素、UNC5H3、Ugi、UNC5H4、UGRP1、UNG、ULBP-1、uPA、ULBP曙2、uPAR、ULBP-3、UTIB、UNC5H1、UVDE、UNC5H2、VanilloidRl、VEGFR、VASA、VEGFR1/Flt-1、Vasohibin、VEGFR2/KDR/Flk-1、Vasorin、VEGFR3/Flt-4、血管抑素、多能蛋白聚糖、Vav-l、VG5Q、VCAM-1、VHR、VDR/NR111、波形蛋白、VEGF、玻連蛋白、VEGF-B、VLDLR、VEGF國C、vWF-A2、VEGF-D、Sy薩lein-a、Ku70、WASP、Wnt-7b、WIF-1、Wnt-8aWISP-l/CCN4、Wnt隱8b、WNK1、Wnt-9a、Wnt-l、Wnt陽9b、Wnt-3a、Wnt-10a、Wnt-4、Wnt國10b、Wnt-5a、Wnt-ll、Wnt-5b、wnvNS3、Wnt7a、XCR1、XPE/DDB1、XEDAR、XPE/DDB2、Xg、XPF、XIAP、XPG、XPA、XPV、XPD、XRCC1、Yes、YY1、EphA4。數(shù)種人離子通道是尤其感興趣的靶點。限制性例子包括5-羥色胺3受體B亞基、5-羥色胺3受體前體、5-羥色胺受體3亞基C、AAD14蛋白、乙酰基膽堿受體蛋白、a亞基前體、乙?;憠A受體蛋白、(3亞基前體、乙?;憠A受體蛋白、S亞基前體、乙酰基膽堿受體蛋白、e亞基前體、乙?;憠A受體蛋白、Y亞基前體、酸性感覺離子通道3剪接變體b、酸性感覺離子通道3剪接變體c、酸性感覺離子通道4、ADP-核糖焦磷酸酶、線粒體前體、AlA-電壓依賴性鈣通道、氨氯枇咪敏感型陽離子通道1、神經元氨氯吡咪敏感陽離子通道2、神經元氨氯吡咪敏感陽離子通道4、同種型2、氨氯吡咪敏感鈉通道、氨氯吡咪敏感鈉通道a-亞基、氨氯吡咪敏感鈉通道卩-亞基、氨氯吡咪敏感鈉通道S-亞基、氨氯吡咪敏感鈉通道?亞基、膜聯(lián)蛋白A7、類頂端蛋白、ATP敏感性內向整流鉀通道1、ATP敏感性內向整流鉀通道10、ATP敏感性內向整流鉀通道11、ATP敏感性內向整流鉀通道14、ATP敏感性內向整流鉀通道15、ATP敏感性內向整流鉀通道8、鈣通道al2.2亞基、鈣通道al2.2亞基、銬通道cdE亞基、S19S40S46剪接變體、鈣激活鉀通道a亞基1、鈣激活鉀通道(3亞基1、鈣激活鉀通道(3亞基2、鈣激活鉀通道(3亞基3、,丐-依賴性氯通道-l、陽離子通道TRPM4B、CDNAFLJ90453fis、克隆NT2RP3001542、高度類似包含6的鉀通道四聚化結構域、CDNAFLJ90663fis、克隆PLACE1005031、高度類似氯胞內通道蛋白5、CGMP門控陽離子通道I3亞基、氯通道蛋白、氯通道蛋白2、氯通道蛋白3、氯通道蛋白4、氯通道蛋白5、氯通道蛋白6、氯通道蛋白ClC-Ka、氯通道蛋白ClC-Kb、氯通道蛋白、骨骼肌、氯胞內通道6、氯胞內通道蛋白3、氯胞內通道蛋白4、氯胞內通道蛋白5、CHRNA3蛋白、Clcn3e蛋白、CLCNKB蛋白、CNGA4蛋白、挑選蛋白-5(Cullin-5)、環(huán)GMP門控鉀通道、環(huán)核苷酸門控陽離子通道4、環(huán)核苷酸門控陽離子通道a3、環(huán)核苷酸門控陽離子通道(33、環(huán)核苷酸門控嗅覺通道、囊性纖維化病跨膜電導率調節(jié)物、細胞色素B-245重鏈、二氫吡啶敏感型L型、l丐通道a-2/5亞基前體、含F(xiàn)XYD結構域離子轉運調節(jié)物3前體、含F(xiàn)XYD結構域的離子轉運調節(jié)物5前體、含F(xiàn)XYD結構域的離子轉運調節(jié)物6前體、含F(xiàn)XYD結構域的離子轉運調節(jié)物7、含F(xiàn)XYD結構域的離子轉運調節(jié)物8前體、G蛋白激活內向整流鉀通道l、G蛋白激活內向整流鉀通道2、G蛋白激活內向整流鉀通道3、G蛋白激活內向整流鉀通道4、,氨基丁酸受體a-l亞基前體、?氨基丁酸受體a-2亞基前體、Y-氨基丁酸受體a-3亞基前體、y-氨基丁酸受體a-4亞基前體、y-氨基丁酸受體a-5亞基前體、,氨基丁酸受體a-6亞基前體、?氨基丁酸受體卩"亞基前體、Y-氨基丁酸受體卩-2亞基前體、Y-氨基丁酸受體卩-3亞基前體、Y-氨基丁酸受體5亞基前體、?氨基丁酸受體s亞基前體、Y-氨基丁酸受體Y-1亞基前體、?氨基丁酸受體y-3亞基前體、?氨基丁酸受體兀亞基前體、Y-氨基丁酸受體p-l亞基前體、?氨基丁酸受體P-2亞基前體、Y-氨基丁酸受體e亞基前體、GluR6卡因酸受體、谷氨酸受體l前體、谷氨酸受體2前體、谷氨酸受體3前體、谷氨酸受體4前體、谷氨酸受體7、谷氨酸受體B、谷氨酸受體5-1亞基前體、谷氨酸受體、離子化作用的(ionotropic)卡因酸l前體、谷氨酸受體、離子化作用的卡因酸2前體、谷氨酸受體、離子化作用的卡因酸3前體、谷氨酸受體、離子化作用的卡因酸4前體、谷氨酸受體、離子化作用的卡因酸5前體、谷氨酸[NMDA]受體亞基3A前體、谷氨酸[NMDA]受體亞基3B前體、谷氨酸[NMDA]受體亞基sl前體、谷氨酸[NMDA]受體亞基e2前體、谷氨酸[NMDA]受體亞基£4前體、谷氨酸[NMDA]受體亞基;1前體、甘氨酸受體a-l鏈前體、甘氨酸受體a-2鏈前體、甘氨酸受體a-3鏈前體、甘氨酸受體卩鏈前體、H/ACA核蛋白蛋白復合物亞基1、高親和免疫球蛋白e受體p-亞基、假擬蛋白DKFZp31310334、假擬蛋白DKFZp761M1724、假擬蛋白FLJ12242、假擬蛋白FLJ固9、假擬蛋白FLJ14798、假擬蛋白FLJ14995、假擬蛋白FLJ16180、假擬蛋白FLJ16802、假擬蛋白FLJ32069、假擬蛋白FLJ37401、假擬蛋白FLJ38750、假擬蛋白FLJ40162、假擬蛋白FLJ41415、假擬蛋白FLJ90576、假擬蛋白FLJ90590、假擬蛋白FLJ90622、假擬蛋白KCTD15、假擬蛋白MGC15619、肌醇1、4、5-三磷酸肌醇受體1型、肌醇1、4、5-三磷酸肌醇受體2型、肌醇1、4、5-三磷酸肌醇受體3型、中電導鈣激活鉀通道蛋白4、內向整流鉀通道13、內向整流鉀通道16、內向整流鉀通道4、內向調校K(+)通道負調節(jié)物Kir2.2v、卡因酸受體亞基KA2a、KCNH5蛋白、KCTD17蛋白、KCTD2蛋白、角質形成細胞相關跨膜蛋白1、Kv通道相互作用蛋白4、美拉絲汀(Melastatin)1、膜蛋白MLC1、MGC15619蛋白、Mucolipin-l、Mucolipin-2、Mucolipin-3、多藥耐藥相關蛋白4、N-甲基-D-天冬氨酸受體2C亞基前體、NADPH氧化酶同源l、Navl.5、神經元乙?;憠A受體蛋白、a-10亞基前體、神經元乙?;憠A受體蛋白、a-2亞基前體、神經元乙?;憠A受體蛋白、a-3亞基前體、神經元乙酰基膽堿受體蛋白、a-4亞基前體、神經元乙?;憠A受體蛋白、a-5亞基前體、神經元乙?;憠A受體蛋白、a-6亞基前體、神經元乙?;憠A受體蛋白、a-7亞基前體、神經元乙酰基膽堿受體蛋白、a-9亞基前體、神經元乙?;憠A受體蛋白、(3-2亞基前體、神經元乙酰基膽堿受體蛋白、卩-3亞基前體、神經元乙?;憠A受體蛋白、P-4亞基前體、神經元電壓依賴性鈣通道(X2D亞基、P2X嘌呤受體1、P2X嘌呤受體2、P2X嘌呤受體3、P2X嘌呤受體4、P2X嘌呤受體5、P2X嘌呤受體6、P2X嘌呤受體7、胰腺鉀通道TALK-lb、胰腺鉀通道TALK-lc、胰腺鉀通道TALK-ld、磷酸神經膜前體、漿脂蛋白、多囊腎病2相關蛋白、類多囊腎病l蛋白、類多囊腎病2蛋白、多囊腎病和受體卵膠相關蛋白前體、多囊病蛋白-2、鉀通道調節(jié)蛋白、鉀通道亞家族K成員1、鉀通道亞家族K成員10、鉀通道亞家族K成員12、鉀通道亞家族K成員13、鉀通道亞家族K成員15、鉀通道亞家族K成員16、鉀通道亞家族K成員17、鉀通道亞家族K成員2、鉀通道亞家族K成員3、鉀通道亞家族K成員4、鉀通道亞家族K成員5、鉀通道亞家族K成員6、鉀通道亞家族K成員7、鉀通道亞家族K成員9、包含3的鉀通道四聚體結構域、包含蛋白2的鉀通道四聚體結構域、包含蛋白14的鉀通道四聚體結構域、包含蛋白2的鉀通道四聚體結構域、包含蛋白4的鉀通道四聚體結構域、包含蛋白5的鉀通道四聚體結構域、包含10的鉀通道四聚體結構域、包含蛋白13的鉀通道四聚體結構域、包含1的鉀通道四聚體結構域、鉀電壓門控通道亞家族A成員1、鉀電壓門控通道亞家族A成員2、鉀電壓門控通道亞家族A成員4、鉀電壓門控通道亞家族A成員5、鉀電壓門控通道亞家族A成員6、鉀電壓門控通道亞家族B成員1、鉀電壓門控通道亞家族B成員2、鉀電壓門控通道亞家族C成員1、鉀電壓門控通道亞家族C成員3、鉀電壓門控通道亞家族C成員4、鉀電壓門控通道亞家族D成員1、鉀電壓門控通道亞家族D成員2、鉀電壓門控通道亞家族D成員3、鉀電壓門控通道亞家族E成員1、鉀電壓門控通道亞家族E成員2、鉀電壓門控通道亞家族E成員3、鉀電壓門控通道亞家族E成員4、鉀電壓門控通道亞家族F成員1、鉀電壓門控通道亞家族G成員1、鉀電壓門控通道亞家族G成員2、鉀電壓門控通道亞家族G成員3、鉀電壓門控通道亞家族G成員4、鉀電壓門控通道亞家族H成員1、鉀電壓門控通道亞家族H成員2、鉀電壓門控通道亞家族H成員3、鉀電壓門控通道亞家族H成員4、鉀電壓門控通道亞家族H成員5、鉀電壓門控通道亞家族H成員6、鉀電壓門控通道亞家族H成員7、鉀電壓門控通道亞家族H成員8、鉀電壓門控通道亞家族KQT成員1、鉀電壓門控通道亞家族KQT成員2、鉀電壓門控通道亞家族KQT成員3、鉀電壓門控通道亞家族KQT成員4、鉀電壓門控通道亞家族KQT成員5、鉀電壓門控通道亞家族S成員1、鉀電壓門控通道亞家族S成員2、鉀電壓門控通道亞家族S成員3、鉀電壓門控通道亞家族V成員2、鉀電壓門控通道亞家族H成員7同種型2、鈉鉀超激活激活環(huán)核苷酸-門控通道1、鈉鉀超激活激活環(huán)核苷酸-門控通道2、鈉鉀超激活激活環(huán)核苷酸-門控通道3、鈉鉀超激活激活環(huán)核苷酸-門控通道4、可能線粒體輸入受體亞基TOM40同系物、嘌呤能受體P2X5、同種型A、推定四重復電壓(Putative4repeatvoltage-)門控離子通道、推定氯通道蛋白7、推定GluR6卡因酸受體、推定離子通道蛋白CATSPER2變體1、推定離子通道蛋白CATSPER2變體2、推定離子通道蛋白CATSPER2變體3、推定鉀通道調節(jié)蛋白變體1、推定酪氨酸-蛋白磷酸酶TPTE、蘭尼定受體l、蘭尼定受體2、蘭尼定受體3、SH3KBP1結合蛋白1、短瞬時受體電壓通道l、短瞬時受體電壓通道4、短瞬時受體電壓通道5、短瞬時受體電壓通道6、短瞬時受體電壓通道7、小電導鈣激活鉀通道蛋白1、小電導鈣激活鉀通道蛋白2、同種型b、小電導鈣激活鉀通道蛋白3、同種型b、小電導鈣激活鉀通道SK2、小電導鈣激活鉀通道SK3、鈉通道、鈉通道p-l亞基前體、鈉通道蛋白質IIa型亞基、鈉通道蛋白質IIIa型亞基、鈉通道蛋白IVa型亞基、鈉通道蛋白IXa型亞基、鈉通道蛋白Va型亞基、鈉通道蛋白VIIa型亞基、鈉通道蛋白VIIIa型亞基、鈉通道蛋白Xa型亞基、鈉通道蛋白XIa型亞基、鈉氯激活ATP敏感性鉀通道、鈉/鉀轉運ATP酶Y鏈、精子相關陽離子通道l、精子相關陽離子通道2、同種型4、突觸融合蛋白-lBl、瞬時受體電壓陽離子通道亞家族A成員1、瞬時受體電壓陽離子通道亞家族M成員2、瞬時受體電壓陽離子通道亞家族M成員3、瞬時受體電壓陽離子通道亞家族M成員6、瞬時受體電壓陽離子通道亞家族M成員7、瞬時受體電壓陽離子通道亞家族V成員l、瞬時受體電壓陽離子通道亞家族V成員2、瞬時受體電壓陽離子通道亞家族V成員3、瞬時受體電壓陽離子通道亞家族V成員4、瞬時受體電壓陽離子通道亞家族V成員5、瞬時受體電壓陽離子通道亞家族V成員6、瞬時受體電壓通道4e剪接變體、瞬時受體電壓通道4;剪接變體、瞬時受體電壓通道7Y剪接變體、腫瘤壞死因子、a-誘導蛋白1、內皮兩孔通道蛋白2、VDAC4蛋白、電壓門控鉀通道Kv3.2b、電壓門控鈉通道P1B亞基、電壓依賴性陰離子通道、電壓依賴性陰離子通道2、電壓依賴性陰離子-選擇性通道蛋白1、電壓依賴性陰離子-選擇性通道蛋白2、電壓依賴性陰離子-選擇性通道蛋白3、電壓依賴性鈣通道y-1亞基、電壓依賴性鈣通道,2亞基、電壓依賴性鈣通道,3亞基、電壓依賴性鈣通道y-4亞基、電壓依賴性鈣通道y-5亞基、電壓依賴性鈣通道Y-6亞基、電壓依賴性鈣通道y-7亞基、電壓依賴性鈣通道?8亞基、電壓依賴性L-型鈣通道a-lC亞基、電壓依賴性L-型鈣通道a-lD亞基、電壓依賴性L-型鈣通道a-lS亞基、電壓依賴性L-型鈣通道p-l亞基、電壓依賴性L-型f丐通道p-2亞基、電壓依賴性L-型l丐通道(3-3亞基、電壓依賴性L-型鈣通道卩-4亞基、電壓依賴性N-型鈣通道a-lB亞基、電壓依賴性P/Q-型鈣通道a-lA亞基、電壓依賴性R-型鈣通道a-lE亞基、電壓依賴性T-型鈣通道a-lG亞基、電壓依賴性T-型鈣通道a-lH亞基、電壓依賴性T-型鈣通道a-lI亞基、電壓門控L-型鈣通道a-l亞基、電壓門控鉀通道p-l亞基、電壓門控鉀通道(3-2亞基、電壓門控鉀通道(3-3亞基、電壓門控鉀通道KCNA7。GPRC的例子包括但不限于A類類視紫質受體,如Muse脊椎動物1型乙?;憠A、Muse脊椎動物2型乙?;憠A、Muse脊椎動物3型乙?;憠A、Muse脊椎動物4型乙?;憠A;腎上腺素受體(l型a腎上腺素受體、2型a腎上腺素受體、1型(3腎上腺素受體、2型a腎上腺素受體、3型a腎上腺素受體、l型脊椎動物多巴胺、2型脊椎動物多巴胺、3型脊椎動物多巴胺、4型脊椎動物多巴胺、l型組胺、2型組胺、3型組胺、4型組胺、l型5-羥色胺、2型5-羥色胺、3型5-羥色胺、4型5-羥色胺、5型5-羥色胺、6型5-羥色胺、7型5-羥色胺、8型5-羥色胺、其它型5-羥色胺,痕量胺,l型血管緊張素、2型血管緊張素、鈴蟾肽、緩激肽、C5a過敏毒素、Fmet-leu-phe、類APJ、A型白介素-8、B型白介素-8、其它型白介素-8、l-ll型C-C趨化因子及其它類型、C-X-C趨化因子(2-6型及其它)、C-X3-C趨化因子、膽囊收縮素CCK、A型CCK、B型CCK、其它CCK、內皮縮血管肽、黑素皮質素受體(黑色素細胞刺激激素、促腎上腺皮質激素、黑素皮質素受體激素)、達菲抗原、促乳素釋放肽(GPRIO)、神經肽Y(l-7型)、神經肽Y、其它神經肽Y、神經降壓素、阿片類(D、K、M、X型)、促生長素抑制素(l-5型)、速激肽(底物P(NK1)、底物K(NK2)、神經調節(jié)肽K(NK3)、類速激肽1、類速激肽2、加壓素/催產加壓素(1-2型)、催產加壓素、催產素/中催產素、芋螺抑素(Conopressin)、類甘丙肽、類蛋白酶激活、食欲肽和神經肽FF、QRFP、類趨化因子受體、類神經調節(jié)肽U(神經調節(jié)肽U、PRXamide)、激素蛋白(促卵泡激素、孕酮-絨毛膜雌激素、促甲狀腺激素、I型促性腺素、II型促性腺素)、視蛋白(視紫紅質)、脊椎動物視網膜色素(l-5型)、脊椎動物視網膜色素5型、節(jié)肢動物視網膜色素、節(jié)肢動物視網膜色素1型、節(jié)肢動物視網膜色素2型、節(jié)肢動物視網膜色素3型、軟體動物視網膜色素、視網膜色素、嗅覺(嗅覺IIfaml-13)、前列腺素(前列腺素E2EP1亞型、前歹ij腺素E2/D2EP2亞型、前歹ij月泉素E2EP3亞型、前歹ij月泉素E2EP4亞型、前列腺素F2-cu環(huán)前列腺素、血栓烷、腺苷l-3型、嘌呤受體、嘌呤受體P2RY1-4、6、11GPR91、嘌呤受體P2RY5、8、9、10GPR35、92、174、嘌呤受體P2RY12-14GPR87(UDP-葡萄糖)、大麻素、血小板激活因子、促性腺素釋放激素、促性腺素釋放激素I型、促性腺素釋放激素II型、類脂肪動員激素、Corazonin、促甲狀腺激素釋放激素和促分泌素、促甲狀腺激素釋放激素、生長激素促分泌素、類生長激素促分泌素、蛻皮觸發(fā)激素(ETHR)、褪黑激素、溶血鞘脂和LPA(EDG)、鞘氨醇l-磷酸Edg-l、溶血磷脂酸Edg-2、鞘氨醇l-磷酸Edg-3、溶血磷脂酸Edg-4、鞘氨醇l-磷酸Edg-5、鞘氨醇1-磷酸Edg-6、溶血磷脂酸Edg-7、鞘氨醇1-磷酸Edg-8、Edg其它白三烯B4受體、白三烯B4受體BLT1、白三烯B4受體BLT2、A類孤兒/其它、推定神經傳遞素、SREB、Mas原癌基因和Mas-相關(MRGs)、類GPR45、半胱氨酰白三烯、G-蛋白偶聯(lián)膽酸受體、游離脂肪酸受體(GP40、GP41、GP43)、類促胰液素B類、降鈣素、促腎上腺皮質激素釋放因子、胃抑制肽、胰高血糖素、生長激素釋放激素、甲狀旁腺激素、PACAP、促胰液素、血管活性小腸多肽、Latr叩hilin、1型Latrophilin、2型Latrophilin、3型Latrophilin、ETL受體、腦特異性血管新生抑制劑(BAI)、類瑪士撒拉(Methuselah)蛋白(MTH)、鈣粘著蛋白EGFLAG(CELSR)、極大G蛋白偶聯(lián)受體、C類代謝型谷氨酸/信息素、代謝型谷氨酸I-III組、類鈣感知、胞外鈣感知、信息素、其它類鈣感知、推測信息素受體、GABA-B、GABA-B亞型1、GABA-B亞型2、類GABA-B、孤兒GPRC5、孤兒GPCR6、無七蛋白橋(Brideofsevenlessproteins、BOSS)、味覺受體(T1R)、D型真菌信息素、類真菌信息素因子A(STE2、STE3)、類真菌信息素因子B(BAR、BBR、RCB、PRA)、E類cAMP受體、視覺白化蛋白、巻曲蛋白/平滑家族、巻曲蛋白A組(Fzl、2、4、5和7-9)、巻曲蛋白B組(Fz3和6)、巻曲蛋白C組(其它)、犁鼻受體、線蟲趨化受體、昆蟲氣味受體以及Z類古細菌/細菌/真菌視蛋白??稍O計主題MURP耙向任意細胞蛋白,包括但不限于細胞表面蛋白、分泌蛋白、胞質蛋白和核蛋白。尤其感興趣的O靶點是離子通道。離子通道是一類蛋白質超家族,包括鉀通道(K-通道)家族、鈉通道(Na-通道)家族、鈣通道(Ca-通道)家族、氯通道(Cl-通道)家族和乙酰基膽堿通道家族。這些家族各自包含亞家族,并且每一超家族通常包含起源于單一基因的特定通道。例如,K-通道家族包含名為Kvl.x和Kv3.x的電壓門控K-通道亞家族。亞家族Kvl.x包含Kvl.l、Kvl.2禾BKv1.3通道,對應單一基因的產物,因此稱為"種類"。同樣對Na-、Ca-、Cl-和其它通道家族歸類。根據通道操作機制對離子通道進行歸類。具體地,離子通道蛋白的主要類型的特征在于開閉通道蛋白以允許或阻止特定離子透過通道蛋白和穿過脂質雙層細胞膜所使用的方法。一類重要的通道蛋白是電壓門控通道蛋白,它對跨膜電位改變作出開啟或關閉(門)的反應。尤其感興趣的是作為治療靶點的電壓門控鈉通道1.6(Navl.6)。另一類離子通道蛋白是機械門控通道,蛋白上的機械應力開啟或關閉該通道。另一種類型稱作配體門控通道,特定配體與蛋白結合與否決定其開閉。配體可為胞外部分,如神經遞質,或胞內部分,如離子或核苷酸。離子通道通常允許離子沿化學電勢梯度被動流下,然而離子泵使用ATP逆梯度轉運。包括反向轉運體和協(xié)同轉運體在內的偶聯(lián)轉運體借助其它離子種類順勢運動提供的能量使一種離子種類逆梯度運動。一種幾乎在所有動物細胞膜都能找到的最常見的通道蛋白類型允許鉀離子特異性通過細胞膜。具體說,鉀離子快速通過K+通道蛋白穿透細胞膜(快至每秒l(T8離子)。而且,鉀通道蛋白具有非常準確的鑒別鉀離子和其它小堿金屬離子如Li+或Na+的能力。具體說,鉀離子至少比鈉離子透性大10000倍。鉀通道蛋白通常含有四個(通常一樣的)亞基,因此細胞表面的靶點以四聚體呈現(xiàn),允許MURP的四價結合。一類亞基含有六個長疏水區(qū)段(可為跨膜),而其它類型包含兩個疏水區(qū)段。另一重要通道家族是鈣通道。通常根據電生理特性將鈣通道分為低電壓激活(LVA)或高電壓激活(HVA)通道。HVA通道包括至少三組通道,即已知的L-、N-和P/Q-型通道。根據其藥理學和配體結合特性,已將這些通道在電生理學和生物化學上進行區(qū)分。例如,與L-型l丐通道cn亞基結合的二氫吡啶、二苯基-烷基胺和哌啶阻斷了神經元組織中的被稱為L-型鈣電流的一部分HVA鈣電流。N-型鈣通道對co芋螺肽,但對于二氫吡啶化合物,如尼莫地平和硝苯地相對不敏感平。另一方面,P/Q型通道對二氫吡啶不敏感,但對漏斗形蜘蛛毒素AgaIIIA敏感。由于大的膜去極化激活R-型鈣通道,如L-、N-、P-和Q型通道,因此歸類為高電壓激活(HVA)通道。R型通道通常對二氫吡啶和co芋螺肽不敏感,但如P/Q、L和N通道對漏斗形蜘蛛毒素AgaIVA敏感。免疫細胞化學染色表明這類受體位于整個腦,尤其在深中線結構(尾殼核、丘腦、下丘腦、杏仁核、小腦)以及腹部中腦核腦干的核中。神經元電壓敏感鈣通道通常由中央o^亞基、012/5亞基、(3亞基和95kD亞基組成。另外的非限制性例子包括Kir(內向整流鉀通道)、Kv(電壓門控鉀通道)、Nav(電壓門控鈉通道)、Cav(電壓門控鈣通道)、CNG(環(huán)核苷酸門控通道)、HCN(超極化激活通道)、TRP(瞬時受體電壓通道)、C1C(氯通道)、CFTR(囊性纖維化病跨膜電導率調節(jié)蛋白、氯通道)、IP3R(三磷酸肌醇受體)、RYR(蘭尼定受體)。其它通道類型為2-孔通道、谷氨酸受體(AMPA、NMDA、KA)、M2、連接蛋白和Cys-環(huán)受體。離子通道蛋白,如Kvl.2、Kv3.1、Shaker、TRPC1和TRPC5的通常結構圖是6個如下排列的跨膜區(qū)段N-末端…S1…E1…S2…XI…S3—-E2—S4…X2…S5…E3…S6…C-末端其中Sl-6為跨膜序列,El-3為細胞外表面環(huán),Xl-2為胞內表面環(huán)。E3環(huán)通常是三個胞外環(huán)中最長的并且具有親水性,是藥物和MURP結合的良好靶點。多數(shù)通道的孔形成部分是跨膜a螺旋的多聚(如四聚或五聚體)復合物。通常有孔環(huán),它是蛋白的一個繞回膜形成選擇性濾膜的區(qū)域,決定了哪種離子可以穿透。此類通道被稱為"孔環(huán)"通道。離子通道是藥物設計的有價值的靶點,因為它們涉及廣泛的生理過程。在人體中,存在大約超過三百種離子通道蛋白,其中許多涉及遺傳疾病。例如,已顯示離子通道表達異?;蚬δ芪蓙y引起各種疾病,包括心臟、神經元、肌肉、呼吸代謝疾病。該部分主要描述離子通道,但相同概念和方法同樣可應用于所有膜蛋白,包括7TM、1TM、G-蛋白和G-蛋白偶聯(lián)受體(GPCR)等。一些離子通道為GPCR。離子通道通常形成包含緊密結合附屬蛋白亞基的大分子復合物,此類亞基的聯(lián)合使用造成離子通道的多樣性。這些附屬蛋白也可與主題MURP、微生物蛋白和毒素靶點結合。可設計主題MURP,使其結合本領域已知以及本文指出的任何通道??赏ㄟ^任意本領域己知的重組或生化技術(如表達和展示)選擇具有所所需離子通道結合能力(包括特異性和親合力)的MURP。例如,可通過包括但不限于噬菌體和孢子的遺傳包展示MURP,并進行抗完整細胞膜的淘選,或優(yōu)選完整細胞,如完整哺乳動物細胞。為了移除與其它非靶細胞表面分子結合的噬菌體,標準步驟是對具有受體水平低或無法檢測到的相似細胞系進行消減淘選。然而,P叩kov等(J.Immunol.Methods291:137-151(2004))顯示相關細胞類型對于消減并不理想,因為它們表面的靶點通常會減少但仍為顯著水平,這會降低所需噬菌體克隆的數(shù)目。甚至當淘選轉染靶點編碼基因的細胞,然后對未轉染細胞進行負向選擇/消減時,這個問題也會發(fā)生,特別是當天然靶點基因未被敲除時。同時,Popkov等顯示如果利用過量的與普通淘選(正向選擇)相同的細胞進行操作,負向選擇或消減淘選的效果更好,除非利用高親合力、耙點特異性抑制劑如小分子、肽或抗靶點的抗體將靶點封閉,從而使活性位點不可利用。這個過程被稱作"利用表位遮蔽細胞進行負向選擇",這在選擇具有所需離子通道結合能力的主題MURP時尤其有用。在一個單獨的實施方式中,本發(fā)明提供了微生物蛋白,尤其是對至少一種離子通道家族具有結合能力的微生物蛋白。本發(fā)明也提供了展示此類微生物蛋白的遺傳包。主題微生物蛋白結合的非限制性離子通道的例子是鈉、鉀、鈣、乙酰膽堿和氯通道。尤其感興趣的是那些微生物蛋白及展示此類微生物蛋白的遺傳包,它們對天然靶點具有結合能力。天然耙點通常是已知微生物蛋白能夠結合的天然分子或其片段及衍生物,通常包含文獻中報道的那些已知結合耙本發(fā)明也提供了展示修飾的離子通道結合微生物蛋白的遺傳包。修飾的微生物蛋白可(a)與對應未修飾微生物蛋白相比,與不同的離子通道家族結合;(b)與對應未修飾微生物蛋白相比,與同一通道家族的不同亞家族結合;(C)與對應未修飾微生物蛋白相比,與同一通道亞家族的不同種類結合;(d)與對應未修飾微生物蛋白相比,與同一通道的不同位點結合;和/或(e)與對應未修飾微生物蛋白相比,與同一通道的同一位點結合但產生不同的生物學效應。圖22和46顯示如何將與同一離子通道不同位點結合的微生物蛋白結構域或毒素組合成單一蛋白。這兩種微生物蛋白結合的兩個結合位點可以在來自不同家族的兩個通道、來自同一家族不同亞家族的兩個通道、來自同一亞家族但不同種類(基因產物)的兩個通道、或者在同一通道(種類)上的兩個不同結合位點上,或者因為通道是多聚體,它們可(同時或不同時)結合于同一通道(種類)的同一結合位點。與通道位點結合的結合模塊和結構域可為微生物蛋白結構域(天然的或非天然的,含有2到8個二硫鍵)、單二硫鍵肽或線性肽??瑟毩⒌剡x擇這些模塊或將其合并,或者可在固定的活性結合模塊存在下由文庫中選擇。后一種情況下,展示文庫可展示多種模塊,其中一種模塊可包含變體文庫。典型的目標是從文庫中選擇比起始的活性單體具有更高親和力的二聚體。在另一實施方式中,本發(fā)明提供了包含多個離子通道結合域的蛋白,其中各結構域經修飾以便(a)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與不同通道家族結合;(b)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與同一通道家族的不同亞家族結合;(c)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與同一亞家族的不同種類結合;(d)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與同一通道的不同位點結合;(e)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與同一通道的同一位點結合但產生不同生物學效應;和/或(f)與對應未修飾的微生物蛋白結構域相比,該微生物蛋白結構域與同一通道的同一位點并產生相同的生物學效應。所需的是,微生物蛋白結構域可包含天然的或非天然的序列??赏ㄟ^異源接頭將單個結構域連接起來。單個微生物蛋白結構域可結合相同或不同通道家族、相同或不同通道亞家族、同一亞家族的相同或不同種類、相同通道的相同或不同位點。主題微生物蛋白可為毒素。優(yōu)選地,毒素部分或全部保留了毒性譜。具體說,有毒的動物,如蛇,遇到一些捕食者或入侵者物種時,毒液毒素對不同物種的不同受體產生不同的活性。毒液包含了大量相關或非相關的毒素,每一毒素具有"活性譜",即毒素能產生可測量活性的全部物種的全部受體。"活性譜"中所有的靶點被認為是"天然靶點",這包括任一毒素活性對抗的人靶點。微生物蛋白或毒素的天然靶點包括所有文獻已報道毒素可抑制的靶點。對靶點的親合力或活性越高,耙點越可能是天然、原始的靶點,但很少發(fā)現(xiàn)毒素能夠作用于同一物種的多個耙點。天然靶點可為毒素活性對抗的人或非人的受體。對于與展示載體融合后保留與細胞結合能力的毒素,可能需要使用合成DNA文庫方法測試融合物的N末端和C末端以及不同融合位點(即,如果毒素結構域為含半胱氨酸結構域,毒素結構域中第一個半胱氨酸之前或最后一個半胱氨酸之后的0、1、2、3、4、5、6個氨基酸),優(yōu)選編碼形成最小氨基酸鏈的富甘氨酸接頭文庫是不帶電的,最有可能與毒素和靶點的結合相容。既然N末端氨基和C末端羧基可能參與了靶點結合,則該文庫應當包含模擬帶正電氨基的賴氨酸或精氨酸(以便(or)與毒素N末端融合)和模擬帶負電羧基的谷氨酸或天冬氨酸(以便與毒素C末端融合)。在負向選擇時用于阻斷靶點的抑制劑可為天然或非天然的小分子、肽或蛋白。除了簡單消減外,抑制劑混合物的選擇是控制所設計離子通道抑制劑特異性的有用工具。因為總共有超過300種例子通道具有部分交疊的特異性和序列相似性,并且每個通道具有多個調節(jié)位點,各自具有不同效應,所以特異性的要求很復雜。當修飾毒素活性或當將兩種不同毒素合并為一個蛋白時,這兩種毒素可結合于同一通道的同一位點具有相同的生理效應,或結合于同一通道的同一位點但具有不同的生理效應,或結合于同一通道的不同位點,或結合于屬于同一亞家族的不同通道(即Kvl.3和Kvl.2;意味著不同的基因產物或"種類"),或結合于相同家族的不同通道(即均為K-通道),或結合于屬于不同家族的通道(即K-通道對Na-通道)。離子通道通常具有許多跨膜區(qū)段(鈉通道有24個),因此為調節(jié)物以不同方式改變通道活性提供了數(shù)個不同、非競爭和非交疊的結合位點。一種方法從存在的不同位點的結合物創(chuàng)造相同通道上一個位點的結合物,即使這些位點是無關的。為了達到這個目的,使用現(xiàn)有的毒素作為靶向l-2-3-或4-二硫鍵蛋白文庫的耙向試劑,通過一個5、6、7、8、9、10、12、14、16、18、20、25、30、35、40或50個氨基酸的可變接頭與靶向毒素分隔。當靶向試劑親合力不是很高時這很有用,因此新文庫的親合力對總體親合力有顯著貢獻。另一方法是從其它序列或結構相關的通道的已存在的調節(jié)物來創(chuàng)建新的通道調節(jié)物。例如,芋螺毒素家族包含Ca-、K、Na-通道和煙堿乙酰膽堿受體的序列相關和結構相關的調節(jié)物。似乎利用芋螺毒素衍生物的文庫將K通道調解物轉換為Na通道調節(jié)物是可行的,反之亦然。例如,k-芋螺毒素抑制K-通道,p芋螺毒素和A-芋螺毒素抑制Na-通道,o)-芋螺毒素抑制Ca-通道和a-芋螺毒素抑制乙酰膽堿受體。來自同一離子通道的對通道活性具有不同效應的不同結合位點的接近使利用可變接頭連接抑制劑以產生具有各自結合不同位點的兩個結構域的單個抑制劑很吸引人?;蚓哂袃蓚€結合于相同位點不同拷貝的結構域的單個蛋白,產生二價高親和力的相互作用(親合力)。該方法尚未用于天然毒素,大概因為它們作用迅速,因此為了具有最大組織滲透性需保持很小,但是對于制藥來說,作用速度并不重要,使其成為吸引人的方法。因此可創(chuàng)建各自是天然或修飾的二聚化、三聚化、四聚化或多聚化毒素/調節(jié)物的文庫,并且直接在蛋白水平篩選這些文庫,或利用遺傳包淘選這些文庫中以親和力(親合力,如果同時在多個位點發(fā)生結合)提高的文庫,接著利用蛋白表達和純化以及基于細胞的實驗,包括膜片鉗實驗鑒定這些多聚化克隆的特異性和活性。這些單個模塊可各自分離地獨立淘選和選擇,或可將它們設計為共同存在的形式,因此將新結構域加到也包含用作文庫靶向元件的固定的活性拷貝的展示系統(tǒng)文庫中,并且僅選擇和鑒定顯著優(yōu)于固定的活性單體的克隆。圖46和47顯示了一些可由原始(天然)毒素產生的單體衍生物,一些多聚體可與靶點的多個不同結合位點結合。接頭顯示為富甘氨酸的rPEG,但接頭可為任意序列并可利用分子文庫進行優(yōu)化,然后進行淘選。利用上述多種誘變策略可在活性原始毒素本身內部產生文庫,或在活性毒素的N末端或C末端側創(chuàng)建文庫以擴大與靶點接觸的面積,期望能夠創(chuàng)建與靶點另外的接觸。此類文庫可基于對所述位點具有已知活性的現(xiàn)有毒素,或者它們可為基于非相關微生物蛋白支架的原始l-、2-、3-、4-二硫鍵文庫。這些附加接觸元件可加于活性結構域的一側或兩側,并且可直接與現(xiàn)有調節(jié)結構域相鄰,或通過可變接頭與其隔離?;诮Y構域序列相似性或多聚物結構域靶點特異性,初始多聚物或最終改進的多聚物可為同源多聚物或異源多聚物。因此,包含該多聚物的單體可與同一耙點的相同或不同序列結合。已知10-100種不同天然毒素與各個通道家族結合,并且每個克隆具有2、3、4、5或6個結構域,即便僅使用天然毒素序列,也可創(chuàng)建具有巨大組合多樣性的展示文庫??衫没诎被嵯嗨菩曰蚣易鍍认到y(tǒng)發(fā)生取代率的低水平合成誘變產生高質量的突變體文庫,預計其中絕大部分能保留功能,一些感興趣特性的功能提高概率很大??砂凑誋ill系數(shù)測量主題MURP、微生物蛋白或毒素與給定離子通道的結合能力。Hill系數(shù)反映結合相互作用的化學計量。Hill系數(shù)為2表明兩種抑制劑結合于每一通道。也可評估變構調節(jié),這是由遠端位點結合引起的某一位點的活性調解??衫枚喾N體外和體內實驗評估離子通道的生物學活性或效應及主題MURP、微生物蛋白或毒素調解離子通道活性的能力。例如,可從本領域獲得測量電壓,電流,膜電位,離子流如鉀流、銣流,離子濃度,門控,第二信使和轉錄水平的方法,以及使用電壓敏感染料、放射性示蹤劑和膜片鉗電生理的方法。具體說,這些實驗可用于檢測那些可抑制或激活感興趣離子通道的微生物蛋白和毒素。具體地,可與合適對照相比檢測可能的通道抑制劑或激活劑以測定調解程度。對照樣品可為未用候選激活劑或抑制劑處理的樣品。與對照相比給出的離子通道活性值約為90%、80%、70%、60%、50%、40%、30%、20%、10%或更低時,存在抑制。IC50是用于確定抑制作用的常用單位(降低50。/。離子通道活性的抑制劑濃度)。相似地有IC90。與對照相比,所選給定離子通道活性值增加10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、500%或更多時,實現(xiàn)通道激活。檢測表達感興趣通道的細胞或膜的極化(即電位)變化,以評估離子流的變化。例如,一種檢測細胞極化的方法是利用電壓鉗和膜片鉗技術,以(例如)"細胞貼附"模式、"內翻外"模式或"全細胞"模式測量電流變化(從而測量極化變化)(參見例如,Ackerman等,NewEngl.J.Med.336:1575-1595(1997))。利用標準方法可方便測量全細胞電流(參見例如,Hamil等,Pflugers.Archiv.391:85(1981)。其它已知方法包括放射性標記銣流實驗以及利用電壓敏感染料的熒光實驗(參見例如,Vestergarrd-Bogind等,J.MembraneBiol.88:67-75(1988);Daniel等,J.Pharmacol.Meth.25:185-193(1991);Holevinsky等,J.MembraneBiology137:59-70(1994))。候選MURP、微生物蛋白或毒素對于感興趣通道功能的影響可通過電流或離子流改變或者電流或離子流改變的后果進行測量。候選蛋白對離子流的下游效應可能不同。因此,可利用任意合適的生理學變化評定候選蛋白對測試通道的影響。候選蛋白的影響可由毒素結合實驗測定。當利用完整細胞或動物測定功能性結果時,也可測定數(shù)種效應,如遞質釋放(如多巴胺)、激素釋放(如胰島素)、已知或未鑒定遺傳標記物的轉錄變化(如northern印記)、細胞體積變化(如紅細胞)、免疫應答(如T細胞激活)、細胞代謝變化如細胞生長或pH變化以及胞內第二信使如Ca2+的變化。其它離子通道的關鍵生物學活性是離子選擇性和門控。選擇性是某些通道鑒別離子種類的能力。允許一些離子通過孔道而排除另一些離子。門控則是開放和關閉狀態(tài)的變換??赏ㄟ^本領域已知方法或本文公開方法評估。其它可用于選擇主題MURP、微生物蛋白或毒素的生物學性質是靶通道開關的頻率,稱為門控頻率。門控頻率受到電壓(在通過膜電壓改變而開關的電壓門控通道中)和配體結合的影響。開關狀態(tài)的轉換速率通常<10微秒,但可被其它分子增加或減少。離子通道開啟時通過孔洞的流速(電流)為每秒10e7個離子數(shù)量級上,偶聯(lián)交換物則少很多。開啟后,一些電壓門控通道進入失活的非傳導狀態(tài),這時它們難以進行去極化。實施例實施例基于人序列設計甘氨酸-絲氨酸寡聚體在人類基因組數(shù)據庫中搜索富甘氨酸序列。將三條序列鑒定為合適的供體序列,見表X。表X:GRS設計A的供體序列登錄號序列氨基酸蛋白質NP—009060GGGSGGGSGSGGGG486-499鋅指蛋白Q9Y2X9GSGSGGGGSGG19-31鋅指蛋白CAG38謝SGGGGSGGGSGSG7-19MAP2K4基于表X中的序列,我們設計了包含多個具有序列GGGSGSGGGGS肽A重復的富甘氨酸序列。將肽A寡聚化形成具有式(GGGSGSGGGGS)n的結構,其中n為2-20。圖5顯示表3中所列至少一種蛋白中包含的肽A寡聚體中所有可能的9聚體子序列。因此肽A寡聚體不包含人T細胞表位。檢視圖5揭示基于肽A寡聚體的GRS可在肽A的任意位點開始和結束。實施例基于人序列設計甘氨酸-脯氨酸寡聚體基于序歹UGPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG設計富甘氨酸序列,代表登錄號NP一006228的人4類POU結構域的146-182氨基酸。圖6顯示具有序列GGGGGPGGGGP的肽B寡聚體可用作GRS。POU結構域序列也包含所有具有序列(GGGGGPGGGGP)n的肽中所有可能的9聚體子序列。因此,這類寡聚序列不包含T細胞表位。實施例設計甘氨酸-谷氨酸寡聚體可根據核糖體蛋白S6激酶(登錄號BAD92170)—部分的子序列GAGGEGGGGEGGGPGG設計富甘氨酸序列。例如,具有序列GGGGE的肽C寡聚體形成核糖體蛋白S6激酶序列中包含多數(shù)9聚體子序列的序列。因此,具有一般結構(GGGGE)n的寡聚化GRS具有極低的包含T細胞表位的風險。實施例鑒定人親水性富甘氨酸序列在人蛋白質數(shù)據庫中搜索富甘氨酸殘基的子序列。這些子序列包含至少50%甘氨酸。僅允許GRS中出現(xiàn)如下非甘氨酸殘基ADEHKPRST。鑒定出70種最小長度為20個氨基酸的子序列。附件A中列出這些子序列。可利用它們構建在人體中具有低免疫原潛能的GRS。實施例構建rPEGJ288下述實施例描述構建編碼含288個氨基酸及序列(GSGGEG)4s的URP序列的密碼子優(yōu)化基因。首先,我們構建圖40所示的填充載體pCW0051。圖42顯示了pCW0051中的表達盒序列。該填充載體基于pET載體并包含T7啟動子。該載體編碼Flag序列后隨側接BsaI、Bbsl和Kpnl位點的填充序列。如圖42所示,插入Bsal和Bbsl位點因此在消化后產生相容性突出端。該填充序列后隨His6標簽和綠色熒光蛋白(GFP)基因。該填充序列包含終止密碼子,因此攜帶填充質粒pCW0051的大腸桿菌細胞形成無熒光菌落。利用Bsal和Kpnl消化填充載體pCW0051。如圖41所示構建編碼36個氨基酸長度的URP序列的密碼子文庫。該URP序列編號為rPEG一J36并具有氨基酸序列(GSGGEG)6。將編碼氨基酸序列GSGGEGGSGGEG的合成寡核苷酸對以及編碼Kpnl位點銜接子的一對寡核苷酸退火形成插入物。使用下列寡核苷酸pr一LCW0057正向AGGTAGTGGWGGWGARGGWGGWTCYGGWGGAGAAGG,pr—LCW0057反向ACCTCCTTCTCCWCCRGAWCCWCCYTCWCCWCCACT,pr一3Kpnl終止子正向AGGTTCGTCTTCACTCGAGGGTAC,pr一3Kpnl終止子反向CCTCGAGTGAAGACGA。連接退火的寡核苷酸,得到代表不同重復數(shù)目rPEG一J12重復的不同長度的產物混合物。利用瓊脂糖電泳從混合物中分離對應rPEG—J36長度的產物并將其連接到Bsal/Kpnl消化的填充載體pCW0051中。所得到的指定為LCW0057的文庫中多數(shù)克隆誘導后顯示綠色熒光,這表面序列rPEG—J36已被連接至GFP基因框內。圖14顯示rPEG—J36序列的篩選和重復多聚化過程。我們篩選了來自LCW0057文庫的288種分離物中具有高水平熒光的分離物。對48種具有強熒光的分離物進行PCR分析以證實rPEG—J區(qū)段的長度,并且鑒定出16個克隆具有所需的rPEG—J36長度。這樣得到16種rPEG—J36分離物的集合,顯示出高表達并具有不同的密碼子使用。利用圖40所示方法將分離物匯集并二聚化。使用Bsal/Nco1消化質粒混合物,分離出包含rPEG_J36序列和一部分GFP的片段。利用Bbsl/Ncol消化同一質?;旌衔?,分離出包含rPEG一J36、大部分質粒載體和剩余GFP基因的片段。將兩種片段混和,連接并轉化BL21,篩選分離物的熒光。如圖14所示再進行兩輪二聚化過程。在每一輪中,我們將rPEGj基因長度加倍,最終獲得編碼rPEG_J288的基因集合。rPEG—J288的氨基酸和核苷酸序列如圖15所示??煽吹絩PEG—J288模塊包含氨基酸序列相同、但核苷酸序列不同的rPEG—J36的區(qū)段。因此我們將基因內部同源性最小化,降低自發(fā)性重組的風險。我們培育攜帶編碼rPEGj288質粒的大腸桿菌BL21至少進行了20次倍增,未發(fā)現(xiàn)自發(fā)性重組。實施例構建rPEGH288利用與構建rPEG一J288相同的步驟來構建編碼稱為rPEG_H288A的288個氨基酸URP的基因文庫。rPEG—H288具有氨基酸序列(GSGGEGGSGGSG)24。圖14顯示了構建過程的流程圖。圖16給出了rPEG一H288—個分離物的完整氨基酸序列及核苷酸序列。實施例rPEGJ288的血清穩(wěn)定性包含N末端Flag標簽和與綠色熒光蛋白N末端融合的A融合的URP序列rPEG—J288的融合蛋白在50%小鼠血清中于37。C孵育三天。在不同時間點采集樣品,利用SDSPAGE分析并利用Western分析檢測??筃末端flag標簽的抗體用于Western檢測。結果顯示于圖28,表明具有288個氨基酸的URP序列在血清中至少三天是完全穩(wěn)定的。實施例血清中缺少rPEGJ288的預存抗體抗URP抗體的存在表明可能對富甘氨酸序列產生免疫原性應答。為了檢測血清中是否存在抗體,通過將URP-GFP固定于支持物并接著用30%血清孵育的ELISA來檢測URP-GFP融合物。使用抗IgG馬辣根過氧化物酶抗體及底物檢測與URP-GFP結合抗體的存在。數(shù)據如圖29所示。數(shù)據顯示,融合蛋白可被抗GFP或Flag的抗體檢測到,但無法被鼠血清檢測到。這表明鼠血清中不含具有URP序列的抗體。實施例純化包含rPEGJ288的融合蛋白我們純化結構形如Flag-rPEG—J288-H6-GFP的蛋白。利用大腸桿菌BL21在SB培養(yǎng)基中表達該蛋白。18'C下0.5mMIPTG誘導培養(yǎng)物過夜。離心收集細胞。在含有Bezonase和市售蛋白酶抑制劑混合物的TBS緩沖液中重懸細胞團塊。在7CTC水浴中加熱懸液10分鐘以裂解細胞。離心去除不溶物。利用固定金屬離子特異性(IMAC)柱處理,接著流過固定抗-Flag抗體的柱子,以便純化上清。圖43顯示純化過程的PAGE分析。該過程產生至少90%純度的蛋白。實施例構建rPEGJ288和干擾素-a的融合蛋白利用用于大腸桿菌表達的密碼子優(yōu)化設計編碼人干擾素的基因。將合成基因與編碼rPEG—J288的基因融合。將一個His6標簽置于N末端以利于融合蛋白的檢測和純化。圖44給出融合蛋白的氨基酸序列。實施例構建rPEGJ288-G-CSF融合物利用用于大腸桿菌表達的密碼子優(yōu)化設計編碼人G-CSF的基因。將合成基因與編碼rPEG一J288的基因融合。將一個His6標簽置于N末端以利于融合蛋白的檢測和純化。圖44給出融合蛋白的氨基酸序列。實施例構建rPEGJ288-hGH融合物利用用于大腸桿菌表達的密碼子優(yōu)化設計編碼人生長激素的基因。將合成基因與編碼rPEG—J288的基因融合。將一個His6標簽置于N末端以利于融合蛋白的檢測和純化。圖44給出融合蛋白的氨基酸序列。實施例rPEGJ288和人蛋白的融合蛋白的表達將rPEGj288和兩個人蛋白一干擾素-a和人生長激素的融合蛋白克隆進T7表達載體并轉化大腸桿菌BL21。細胞在37。C生長至光密度為0.50D。然后,將細胞在18"C培養(yǎng)30分鐘。接著加入0.5mMIPTG并將培養(yǎng)物在18'C振蕩培養(yǎng)過夜。離心收集細胞,利用BugBuster(諾瓦基公司)(Novagen)釋放可溶性蛋白,利用SDS-PAGE分離不溶性蛋白和可溶性蛋白成分,通過Western利用抗N-末端His6標簽的抗體檢測融合蛋白。圖45顯示了兩個融合蛋白的Western分析,rPEG_J288-GFP作為對照。融合蛋白均有表達,主要蛋白在可溶性組分中。這是rPEG—J288高溶解性的證據,因為文獻報道很多表達人干擾素-a和人生長激素的多數(shù)嘗試均得到不溶性的包含體。圖45顯示了大部分融合蛋白以全長蛋白的形式表達,即沒有檢測到表明不完全合成或部分蛋白降解的片段。實施例VEGF多聚體的構建和結合如文獻所述[Scholle,M.D.等(2005)Cow6CAem/f/g/TTzrawg/z;^Screen,8:545-51]構建半胱氨酸限制性肽的文庫。用抗人VEGF對這些文庫進行淘選,并發(fā)現(xiàn)由氨基酸序列FTCTNHWCPS或FQCTRHWCPI組成的兩個結合模塊。將編碼氨基酸序列FTCTNHWCPS的寡核苷酸連接到編碼具有序列(GGS)i2的URP序列rPEG—A36的核苷酸序列中。然后利用限制性酶和連接步驟將融合序列二聚化以構建包含以融合于GFP的rPEGA36分隔的4拷貝VEGF結合模塊的分子。圖30比較了包含0-4個VEGF結合單位的融合蛋白的VEGF結合親和力。僅包含與GFP融合的rPEG一A36的融合蛋白未顯示對VEGF的親和力。隨著VEGF結合模塊的增加所得到的融合蛋白親和力也增加。實施例發(fā)現(xiàn)針對治療靶點的1SS結合模塊依照Scholle等[Scholle,M.D.等(2005)Com6CAem///g/z7Tzrawg/^WAreem8:545-51]所述產生隨機肽文庫。原始肽文庫展示了具有被4-10個隨機殘基分隔的半胱氨酸的半胱氨酸限制性肽。下表展示了文庫的設計表X:原始1SS文庫LNG0001XXXCXXCXXXX3CX2CX3麗S麗S麗STGC麗SNNSTGTNNSNNSNNSLNG0002XXCXXXCXXXX2CX3CX3麗SNNSTGCNNS麗SNNSTGTNNSNNSNNSLNG0003XXCXXXXCXXX2CX4CX2麗S麗STGC麗S麗SNNS麗STGTNNS麗SLNG0004XCXXXXXCXXXiCX5CX2麗STGCNNSNNSNNS麗SNNSTGTNNSNNSLNG0005XCXXXXXXCXX,CXsCX,NNSTGCNNS麗SNNS麗SNNSNNSTGT麗SLNG0006CXXXXXXXCXCXCX,TGC麗S麗SNNS麗S麗S,S麗STGTNNSLNG0007CXXXXXXXXCCXSCTGCNNSNNS麗S麗SNNS麗S麗SNNSTGTLNG0008CXXXXXXXXXCCX9CTGCNNS麗S麗SNNSNNSNNSNNS麗S麗STGTLNG0009CXXXXXXXXXXCCX10CTGC麗SNNSNNS麗S麗S麗SNNS麗S麗S麗STGTLNGOO10XXXXXXCXXCXXXXXXX6CX2CX6NNS麗SNNS麗SNNSNNSTGCNNS麗STGTNNS麗S麗SNNSNNSNNSLNG0011XXXXXCXXXCXXXXXXX5CX3CX6麗S麗S麗S麗SNNSTGC麗SNNS麗STGTNNS麗S麗S麗SNNS麗SLNG0012XXXXXCXXXXCXXXXXX5CX4CX5麗S麗S麗S麗SNNSTGCNNS麗S麗S麗STGTNNSNNS麗S麗SNNSLNGOO13XXXXCXXXXXCXXXXXX4CX5CX5麗SNNSNNS麗STGCNNSNNS蘭S麗SNNSTGT麗S麗S麗SNNSNNSLNG0014XXXXCXXXXXXCXXXXX4CX6CX4麗SNNSNNSNNSTGCNNS麗SNNSNNS麗SNNSTGT麗SNNSNNSNNSLNG0015XXXCXXXXXXXCXXXXX3CX7CX4麗SNNSNNSTGCNNSNNS麗SNNSNNS麗S麗STGT麗SNNS麗SNNSLNGOO16XXXCXXXXXXXXCXXXX3CX8CX3NNS函SNNSTGCNNSNNSNNSNNSNNSNNSNNS麗STGT麗SNNSNNSLNG0017XXCXXXXXXXXXCXXXX2CX9CX3麗S麗STGC麗S蘭S麗S顧SNNS麗S麗S麗S麗STGTNNS麗S麗SLNG0018XXCXXXXXXXXXXCXXX2CX10CX2NNS麗STGCNNS麗S麗S麗SNNS麗S麗SNNSNNSNNSTGTNNSNNS使用下述方案針對一系列的治療相關靶點淘選文庫利用含5pg/ml靶點抗原的PBS4"C包被免疫吸附ELISA板孔過夜。用PBS沖洗包被板,用封閉緩沖液(含0.5%BSA或0.5%卵清蛋白的PBS)室溫封閉非特異性位點2h。然后用PBST(含0.05%吐溫20的PBS)沖洗板,在孔中加入含l-5xl012/ml噬菌體顆粒的結合緩沖液(含0.05%吐溫20的封閉緩沖液),室溫下振蕩2h。清空孔并用PBST沖洗。利用100mMHCl室溫下孵育IO分鐘從孔中洗脫結合噬菌體,轉移到滅菌管中并利用1MTRIS堿中和。為了感染,在中和的噬菌體洗脫物中加入在含5pg/ml四環(huán)素的Super肉湯培養(yǎng)的對數(shù)期大腸桿菌SS320中,并于37'C振蕩培養(yǎng)30分鐘。然后將感染的培養(yǎng)物轉移到裝有含5pg/ml四環(huán)素的Super肉湯的更大的管中,37。C振蕩培養(yǎng)過夜。離心過夜培養(yǎng)物去除大腸桿菌,并加入20%PEG和2.5MNaCl溶液至PEG濃度4%,使噬菌體顆粒沉淀。離心收集沉淀噬菌體,并將噬菌體團塊重懸于lmlPBS中,離心去除殘余的大腸桿菌并轉移到新管中。分光光度法估測噬菌體濃度,使用噬菌體進行下一輪選擇。3或4輪噬菌體淘選后,篩選單個克隆對耙點的結合親合力。挑選淘選當中選自噬菌體克隆的單個噬菌斑轉移至含5嗎/ml四環(huán)素Super肉湯中,并在37°C振蕩培養(yǎng)過夜。4'C以3嗎/ml抗原和對照蛋白(BSA、卵清蛋白、IgG)包被ELISA板過夜。用PBS沖洗包被板,用封閉緩沖液室溫封閉非特異性位點(含0.5c/。BSA或0.5M卵清蛋白的PBS)2h。離心去除過夜培養(yǎng)液中的大腸桿菌,用結合緩沖液(含0.05%吐溫20的封閉緩沖液)以1:10稀釋上清并轉移到PBST(含0.05%吐溫20的PBS)沖洗過的ELISA板中。室溫下振蕩孵育板2h。PBST沖洗后,在孔中加入用PBS以l:5000稀釋的抗-M13-HRP(法馬西亞公司)(Pharmacia)抗體。室溫下振蕩孵育該板30分鐘,并利用PBST和PBS先后沖洗。將含50mM磷酸檸檬酸鈉緩沖液配制的0.4mg/mlABTS和0.001%H202的底物溶液加入到孔中,顯色40分鐘后,在405nm讀板。該ELISA讀數(shù)能夠確定克隆特異性,并且可利用成熟商品化方法對抗原特異性克隆進行測序。表X:VEGF特異性結合模塊的序列sNG0025S3.021sNG0026S3.035sNG0026S3.045sNG0026S3.029sNG0026S3.034sNG0026S3.043sNG0026S3.053sNG0026S3.006sNG0026S3.051sNG0026S3.040sNG0026S3.038sNG0026S3.002sNG0026S3.052sNG0026S3.032sNG0025S3.016sNG0026S3.058sNG0026S3馬sNG0026S3.027sNG0026S3.001sNG0026S3.047sNG0026S3.056sNG0026S3.059sNG0026S3.004sNG0026S3.0117245894271166919212211-111012212oooooooooooooo1ooooooGN序塊合結s性L,ANc,p"T表t333333333333333333ssssssssssssssssss7777800888888877788ooooooooooooooooooooooooooooooooooNNNNNNNNNNNNNNNNN特YsPLDPAPHRSHTNLPQPNSIAPPSLARVLPPLYWQRYWWWWWSHFFVcccccccccccLIILLLLLIIIMQNQSHTSSQSGGYGGGGGGGNWILSYHIHAYO-TccccccccccccRRKAQTKWITATGAGAGGNNGPHAPHHRHHRPRRPPPPPGYFccNGcpcQVwwsccpFTCTl-TJRRYMpYsccsNsGDpssFTGIcYVcTSLLLFARSHPSSTLMSLNLSQQFPPHTPSVKQLPPPPPPPPDRLSATIALVLT-ILSI_LILT--VIVYVSDDDDDDDDDDTDAPTGSSGGSSPPRFVHRFVVHYSRCCCCCCCCCCCCCCCCCCCCCCCCFWFLMWWYWWWWFFKKKKSSKGGGQRHQQSSGSSSHGGGGGGGGHHRLRGRRRNHLNLKQFFAHLRNNNGNLFLFFFFFFFFYTSQVRSVSFHVPPPPPPPPPPVLPCCCCCCCCCCDFSNLNNNNNNNNNESRYLVQFRWCCCCCCCCCCCCCCWFFFFFFFFFKQFRLAIFNMVTAVFYFRFQTHHFFFPPPTVHPPPSPPPMPPSPVFYSTSPHMKWKPRATNDPPIPNLLPGTQVRSRSRG<formula>formulaseeoriginaldocumentpage100</formula>表X:TrkA特異性結合模塊的序列KTWDCRNSGHCVITFKsNG0035S3.074ATWDCRDHNFSCVRLSsNG0035S3.089實施例aEpCAM藥物偶聯(lián)物從根據Scholle等[Scholie,M.D.等(2005)Com6Ozem歷g/z7%raMg/z/nrf&ree",8:545-51]產生的隨機肽庫中分離抗-EpCAM肽。原始肽文庫展示了具有被4-10個隨機殘基分隔的半胱氨酸的半胱氨酸限制性肽。對上述文庫進行三輪親和選擇后,分離到數(shù)個EpCAM特異性肽配體(EpCaml)(表X)。EpCaml分離物具有四個氨基酸的保守半胱氨酸間隔(CXXXXC)。利用編碼3-9個殘基的密碼子將EpCaml肽配體柔和(softly)隨機化(除了半胱氨酸位置),并移至噬菌粒載體。接著用EpCAM對噬菌粒文庫進行親和力選擇以分離有利于結合的肽配體(表X,EpCam2)。EpCam2配體包含保守的CXXXXC半胱氨酸間隔物。此外,多數(shù)抗-EpCam序列不含賴氨酸殘基,這樣有利于在結合序列外偶聯(lián)游離胺基。而且,通??蓪⒖?EpCam肽配體與(任意長度的)URP序列融合,并利用重復二聚化進行多聚化。可使用所得抗-EpCAMMURP特異性靶向EpCAM,其親和力高于單體序列。圖31顯示一個四聚體EpCAM-URP氨基酸序列的例子。該序列僅包含兩個位于N末端Flag標簽的賴氨酸殘基。這些賴氨酸殘基的側鏈對于藥物偶聯(lián)尤其合適。表X.抗-EpCam序列名稱序列EpCam1LRCWGMLCYALRCIGQICWRLgCLYNICWVLFCWGNVCHFLTCWGQVCFRRPGMACSGQLCWLNSPPHALQCYGSLC曹SHLRAGITCHGHLCWPITDRPALgCIGTLCSLANPPHGLWCHGSLCHYPLAPHGLICAGSICFWPPPPRNLTCYGQICFQSQHPHNLACQNSICVRLPRPHGLTCTNQICFYGNTEpCam2HSLTCYGQICWVSNIPTLTCYNQVCWVNRTPALRCLGQLCWVTPTPGLRCLGTLCWVPNRRNLTCWNTVCYAYPNRGLKCLGQLCWVSSNPTL&CSGQICWVPPPRNLECLGNVCSLLNQPTETCLNNLCWVPPQRGLKCSGHLCWVTPQHGLTC麗TVCWVHHPHTLECLGNICWVINQHGLTCYNQICWAPRPHGLACYNQLCWVNPHRGLACQGNICWRLNPRAITCLGTLCWPTSPLTLECIGNICYVPHH實施例加入隨機序列通過在結合序列的N末端、C末端或N和C末端加上接頭和隨機序列可使結合模塊親和成熟或延長。圖32顯示將原始半胱氨酸限制性序列加在抗-EpCAM結合模塊上??墒褂脝捂溁螂p鏈DNA克隆方法產生添加隨機序列文庫。一旦產生,可用最初耙蛋白或第二蛋白對文庫進行親和選擇。例如,包含抗-EpCAM結合模塊的添加文庫可用于選擇包含兩個或多個靶蛋白結合位點的序列。實施例構建2SS構建文庫設計一系列的寡核苷酸以構建基于VEGF結合1SS肽FTCTNHWCPS的文庫。以半胱氨酸距離模式向寡核苷酸的側接序列中摻入變異,但VEGF結合肽序列保持固定。正向寡核苷酸LMS70陽1LMS70-2TCCTLMS70-GTGTCCTLMS70-4CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTNHTTTTACTTGTACGAATCATTGGTGTCCTLMS70-5CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTNHTNHTTTTACTTGTACGAATCATTGGTGTCCTLMS70-6CGAATCATTGGTGTCC反向寡核苷酸(反向互補)LMS70-1RLMS70-2RLMS70-3RCAALMS70-4RGTACAALMS70-5RTTCGTACAALMS70-6RAATGATTCGTACAA寡核苷酸溶液混合物l(自lOO(iM母液)100pl70-6,33pl70-5,1170-4,3.66pl70-3,1.2(il70-2,0.4pl70-1。混合物2(自100母液)100pl70-6R,33jal70-5R,Il(il70-4R,3.66pl70-3R,1.2^170陽2R,0.4pl70-lRPCR組裝10.0^模板寡核苷酸(5(iM)、10.0^10X緩沖液、2.0dNTPs(lOmM)、1.0lilcDNA聚合酶(克隆泰克公司)(Clonetech)、77(ilDSH20。PCR程序95°C1分鐘,(95°C15秒,54°C30秒,68°C15秒)x5,68°C1分鐘。PCR擴增引物、10.0^組裝混合物、10.0pi10X緩沖液、2.0dNTPs(10mM)、10.0^LIBPTF(5pM)、10.0piLIBPTR(5pM)、1.0picDNA聚合酶(克隆泰克)、57piDSH20。PCR程序95°C1分鐘,(95°C15秒,54°C30秒,68°C15秒)x25,68°C1分鐘。利用Amican柱YIO純化產物。利用Sfil和BstXI消化產物并連接入噬菌粒載體pMP003。在MJPCR儀器上16"連接過夜。EtOH沉淀純化連接產物。使用電穿孔轉化到新鮮的感受態(tài)ER2738細胞中。如下所述用VEGF對所得文庫進行淘選。鑒定出數(shù)個相對1SS起始序列VEGF結合能力提高的分離物。圖38顯示了結合和表達數(shù)據。圖39顯示了序列和構建克隆的Western分析數(shù)據。實施例構建文庫的噬菌體淘選第一輪淘選1)第一輪,每文庫包被4孔進行篩選。利用含0.25嗎VEGF^抗原的25WPBS包被科斯達(Costar)96-孔ELISA板。用封板膜封板??稍?t:包被過夜或在37t:包被l小時。2)甩出包被溶液后,加入150WPBS/BSAP/。封閉孔。封板并在37。C孵育1小時。3)甩出封閉溶液后,在孔中加入50^新鮮制備的噬菌體(參見文庫再擴增方案)。僅適用于第一輪也加入5pl5。/。的吐溫。封板并在37。C孵育2小時。。同時,將2mlSB培養(yǎng)基加上2pi5mg/ml四環(huán)素以及2piER2738細胞制備物共孵育,37°C250rpm生長2.5h。每一篩選文庫培養(yǎng)一個培養(yǎng)物,包括負性選擇。采取所有措施以避免含噬菌體的培養(yǎng)物受到污染。4)甩出噬菌體溶液,每孔加入150piPBS/吐溫0.5%并劇烈吹打5次。5分鐘后,甩出并重復沖洗步驟。第一輪中,這樣沖洗5次,第二輪10次,第3、4、5輪15次。5)甩出最終沖洗溶液后,加入含50|il新鮮制備的10mg/ml胰蛋白酶的PBS,封板并在37"C孵育30分鐘。劇烈吹打10次,將洗脫物(第一輪4x50pl,第二輪2x50ml,后續(xù)輪1x50nl)轉移到制備的2ml大腸桿菌培養(yǎng)物中,并在室溫下孵育15分鐘。6)加入6ml預熱的SB培養(yǎng)基、1.6pl羧芐青霉素和6pl5mg/ml四環(huán)素。將培養(yǎng)物轉移到50ml聚丙烯管中。7)37°C250rpm振蕩8ml培養(yǎng)物1h,加入2.4pi100mg/ml羧芐青霉素,再于37°C250rpm振蕩1h。8)加入1mlVCSM13輔助噬菌體并轉移到500ml聚丙烯離心瓶中。加入91ml預熱的(37'C)SB培養(yǎng)基和46pi100mg/ml羧節(jié)青霉素及92pi5mg/ml四環(huán)素。37°C300rpm振蕩100ml培養(yǎng)物1/2-2h。9)加入140pl50mg/ml卡那霉素并繼續(xù)37°C300rpm振蕩過夜。10)4。C4000rpm離心15分鐘。將上清轉移到干凈的500ml離心瓶中并加入25ml20%PEG-8000/NaCl2.5M。冰上放置30分鐘。11)4°C9000rpm離心15分鐘。棄去上清,紙巾倒置放干至少,并用紙巾從離心瓶上部擦去剩余液體。12)沿離心瓶一側上下吹打將噬菌體團塊重懸于2mlPBS/BSA0.5%/吐溫0.5%緩沖液中。利用lml移液管進一步上下吹打重懸,4"全速離心1分鐘,上清通過0.2pm濾膜后流入干凈的2ml離心管。13)接步驟3)進行下一輪,并將噬菌體制備物儲存于4'C。加入0.02%(w/v)疊氮化鈉可作長期儲存。每輪僅使用新鮮制備的噬菌體。第二輪淘選第二輪,每文庫包被2孔進行篩選。利用含0.25pgVEGF^抗原的25^1PBS包被科斯達(Costar)96-孔ELISA板。用封板膜封板。可在4。C包被過夜或在37'C包被1小時。每一文庫也封閉2個未包被孔作為計算富集率的陰性對照。第三輪淘選第三輪,每文庫包被1孔進行篩選。利用含0.25嗎VEGFm抗原的25plPBS包被科斯達(Costar)96隱孔ELISA板。用封板膜封板。可在4。C包被過夜或在37'C包被1小時。每一文庫也封閉1個未包被孔作為計算富集率的陰性對照。實施例基于溶液的淘選1.按照生產商說明將耙蛋白生物素化。2.用含1.0嗎中性抗生物素蛋白(皮爾斯公司)(Pierce)的PBS包被一共8孔(每個選擇)并于4'C包被過夜。3.室溫下使用SuperBlock(皮爾斯公司)封閉孔1小時。將包含封閉緩沖液的板儲存待用(步驟6中)。4.使用lOOnM生物素化靶蛋白并加入1012噬菌體/ml(溶于PBST中),使用SuperBlock和0.05%吐溫20使總體積為100-200)il。5.室溫下翻轉混懸噬菌體-耙點混合物至少lh。6.利用700plSuperBlock稀釋100)il噬菌體-靶點,混和并在8個中性抗生物素蛋白(neutravidin)包被板孔中每孔加入100jil(來自步驟3)。7.室溫下孵育5分鐘。8.用PBST沖洗8次。9.用100^1100mMHC1洗脫噬菌體10分鐘。10.加入10^1lMTRISpH=8.0中和。11.感染用于鋪板的細胞,擴增噬菌體用于接下來輪次的溶液淘選。實施例用噬菌體ELISA篩選VEGF陽性克隆1)在96扎深孔板中加入含50pg/ml羧芐青霉素的0.5mlSB。挑選一個克隆并孵育細胞。2)37°C300rmp振蕩含細菌培養(yǎng)物的培養(yǎng)板過夜。3)制備4ng/pl靶點蛋白的PBS溶液。每孔中加入25|il(100ng)蛋白并在4'C孵育過夜。4)甩出包被的ELISA板并用PBS沖洗2次。加入150pl/孔PBS+0.5%BSA(封閉緩沖液)。室溫下封閉lh。5)離心微型管架(3000rpm;20分鐘)。6)制備結合緩沖液(封閉緩沖液+0.5%吐溫20)。在低蛋白結合96孔板中分裝每孔135^1結合緩沖液。7)甩干ELISA板孔并用PBST(PBS+0.5。/。吐溫20)洗滌2次。8)用PBST稀釋來自過夜培養(yǎng)物的15pl噬菌體,吹打混勻并在每一蛋白包被孔中轉移30pl。室溫下溫和振蕩2h。9)用PBST洗板6次。10)每孔加入含M13-HRP1:5000稀釋的50結合緩沖液。室溫下溫和振蕩30分鐘。11)用PBST洗板4次,用1120洗板2次。12)制備6mlABTS溶液(5.88ml擰檬酸鈉緩沖液加120plABTS和2plH202)。每一ELISA板的每孔分裝50nl。13)室溫下孵育并用ELISA讀板機根據信號在合適時間點(至多l(xiāng)h)讀取405nmO.D.。實施例結合模塊的二聚化按照標準方法創(chuàng)建10e9-10ell種環(huán)肽的噬菌體展示文庫,環(huán)肽在二硫鍵半胱氨酸之間包含4、5、6、7、8、9、10、11和12個隨機化或部分隨機化的氨基酸,并且一些情況下在半胱氨酸對外側有其它的隨機化氨基酸。用許多靶點包括人VEGF淘選這些環(huán)肽文庫,可靠地產生特異性結合于hVEGF但不結合BSA、卵清蛋白或IgG的肽。實施例構建和淘選基于plexin的文庫根據Plexin支架設計兩個文庫。如圖35所示使用Pfam蛋白數(shù)據庫對天然產生的plexin結構域進行系統(tǒng)發(fā)生學比對。plexin支架中間部分(Cys24-Gly25-Trp26-Cys27)在兩個文庫設計中保守并用作N-和C-文庫產生時的交叉區(qū)域。圖36顯示兩個plexin文庫的隨機化方案。將編碼兩個文庫的寡核苷酸交疊在交叉區(qū)域,并在pull-thruPCR后進行限制性克隆(Sfil/BstXI),克隆到噬菌粒載體pMP003中,從而得到兩個文庫。所得plexin文庫被稱為LMP031(N末端文庫)和LMP032(C末端文庫),各自的復雜度約為5x108個獨立轉化子。通過PCR對每一未選文庫的約24個Carb抗性克隆進行分析以驗證。對產生正確大小片段(375bp)的克隆進一步進行DNA測序分析。分別從LMP031和LMP032文庫中獲得50%和67%正確全長的plexin序列。以50/50的比例將兩個文庫混和用固定于96孔ELISA板上的VEGF、死亡受體Dr4、ErbB2和HGFR進行平行淘選。進行4輪淘選,第一輪使用1000ng蛋白,第二輪使用500ng蛋白,第三輪使用250ng蛋白,第四輪使用100ng蛋白。最后一輪淘選后,用噬菌體ELISA和偶聯(lián)辣根過氧化物酶的抗-M13多克隆Ab分析每次選擇的192個Carb抗性克隆與100ng固定蛋白靶點、人IgG、卵清蛋白和BSA的結合。獲得的以下靶點的陽性克隆比例最高依次為DR4(69%)、ErbB2(53%)、HGFR(13Q/q)和BoNT靶點(1%)。對陽性克隆進一步進行PCR和DNA測序分析。所有克隆揭示獨特序列,除了一個克隆(針對DR4)衍生自LMP032(C末端文庫)。圖37顯示了一些鑒定的靶點選擇性分離物序列。為了進--步分析,首先將一類選定的靶點特異性結合物亞克隆到蛋白質表達載體pVS001中,然后以可溶性性微生物蛋白的形式生產,最終用熱裂解法進行純化。對純化的耙點特異性微生物蛋白進行蛋白質ELISA分析以確認靶點識別,SDS-PAGE確認單體形成,表面等離振子共振檢測與靶點的親和力。將最好的克隆用于下輪文庫生產以進一步改良其特性。實施例構建基于蛇毒的文庫使用標準方法創(chuàng)建10e8-10e10個三指毒素(3FT)支架的噬菌體展示文庫,其中指1和指2的下降部分或指3和指2的上升部分含有部分隨機化氨基酸。使用兩個3FT支架作為產生3FT文庫的模板(指1和指2結構)。圖33顯示3FT支架的結構和相關序列的多重序列比對。如圖34所示設計文庫使毒素的兩個表面環(huán)隨機化。將編碼四個文庫的寡核苷酸交疊在退火區(qū)域,并進行pull-thruPCR,接著限制性克隆(Sfil/BstXI)到噬菌體載體pMP003中,得到部分隨機化的3FT支架文庫。所得的3FT文庫稱為LMP041。實施例將結合肽嫁接到微生物蛋白支架中-靶點特異性肽輔助的隨機化這里目的是使用已被鑒定對感興趣靶點具有特異性的肽產生3SS加靶點特異性結合物。該策略使用VEGF特異性肽轉移到3FT支架的指1中,并修飾指2的AA殘基,該殘基與靶點特異性序列接近,以產生高親和力的VEGF結合物。利用如上所述標準方法創(chuàng)建10e8-10elO個3指毒素(3FT)支架的噬菌體展示文庫,其中含有指1的VEGF特異性序列和指2的部分隨機下降部分,除了2個隨機指1正向引物被編碼下述序列的F1-VEGF特異性正向引物替代PSGPSCHTTNHWPISAVTCPP。將編碼四個文庫的寡核苷酸交疊在退火區(qū)域并進行pull-thruPCR,然后限制性克隆(Sfil/BstXI)到噬菌體載體pMP003中,得到關注的含有部分隨機化指2的(VEGF特異性)3FT支架文庫。所得的3FT文庫稱為LMP042。實施例MURP的血漿半衰期基本如[Pepinsky,R,B.等(2001)JP/zarmaco/五x;7Tzer,297:1059-66]所述在將MURPi.v.或i.p.注射插管大鼠后測定MURP的血漿半衰期。在不同時間點(5分鐘、15分鐘、30分鐘、l小時、3小時、5小時、l天、2天、3天)取血樣并利用ELISA檢測MURP的血漿濃度。利用WinNonlin2.0版(科學顧問公司)(ScientificConsultingInc.,Apex,NC)計算藥代動力學參數(shù)。為了分析URP的效應,可比較含URP模塊蛋白的血漿半衰期和不含URP模塊的相同蛋白的血漿半衰期。實施例MURP的融解性測試將處于生理緩沖液如磷酸鹽緩沖鹽水中的純化MURP樣品濃縮至范圍在0.01mg/ml-10mg/ml之間的不同濃度,以測定MURP的溶解度。可將樣品孵育長至數(shù)周。濃度超過MURP溶解度的樣品出現(xiàn)渾濁的沉淀,可通過分光光度計測定??赏ㄟ^離心或過濾移除沉淀物質,然后利用蛋白實驗如布拉德夫(Bradford)實驗測定280nm吸光度值,以檢測上清中蛋白濃度??稍?20。C冷凍樣本再融化以加速溶解度研究。該過程經常導致溶解性差的蛋白沉淀。實施例MURP的血清結合活性可用感興趣的MURP包被微孔板,用對照蛋白包被板中的其它孔。然后,在孔中加入感興趣的血清樣本孵育1h。然后,用洗板機洗板。結合的血清蛋白可被加入的己與酶如辣根過氧化物酶或堿性磷酸酶偶聯(lián)的抗血清蛋白抗體檢測到。檢測MURP血清結合的另一方式是加入感興趣的MURP至血清中約lh使其結合。然后,用抗MURP序列中表位的抗體免疫沉淀MURP。對沉淀的樣品進行PAGE分析,任選用Western分析檢測與MURP共沉淀的蛋白。利用質譜可檢測共沉淀的血清蛋白。權利要求1.一種展示微生物蛋白的遺傳包,其中所述微生物蛋白保留與其天然靶點結合的能力。2.如權利要求1所述的遺傳包,其特征在于,所述微生物蛋白與至少一個離子通道家族有結合能力,所述離子通道家族選自鈉、鉀、鈣、乙酰膽堿或氯通道。3.如權利要求1所述的遺傳包,其特征在于,所述微生物蛋白是離子通道結合型微生物蛋白,并且經修飾以使(a)與對應未修飾的微生物蛋白相比,所述微生物蛋白與不同通道家族結合.(b)與對應未修飾的微生物蛋白相比,所述微生物蛋白與同一通道家族的不同亞家族結合;(C)與對應未修飾的微生物蛋白相比,所述微生物蛋白與同一通道亞家族的不同種類結合;(d)與對應未修飾的微生物蛋白相比,所述微生物蛋白與同一通道的不同位點結合;和/或(e)與對應未修飾的微生物蛋白相比,所述微生物蛋白與同一通道的同一位點結合但產生不同生物學效應。4.如權利要求1所述的遺傳包,其特征在于,所述微生物蛋白為毒素。5.如權利要求1-4中任一項所述的遺傳包的文庫。6.—種展示蛋白毒素的遺傳包,其中所述毒素部分或完全保留其毒性譜。7.如權利要求6所述的遺傳包,其特征在于,所述毒素為微生物蛋白。8.如權利要求6所述的遺傳包,其特征在于,所述毒素衍生自一種毒素蛋白,或衍生自毒素家族。9.如權利要求6所述的遺傳包,所述文庫展示毒素家族,其特征在于,所述家族部分或完全保留其天然毒性譜。10.如權利要求9所述的文庫,其特征在于,所述家族成員通過與離子通道結合介導毒性。11.如權利要求io所述的文庫,其特征在于,所述離子通道選自鈉、鉀、鈣、乙酰膽堿或氯通道。12.如權利要求9所述的文庫,其特征在于,所展示的所述毒素家族成員中大部分基本同源。13.—種包含多個離子通道結合結構域的蛋白質,其中單個結構域是修飾的微生物蛋白結構域,以使(a)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與不同通道家族結合;(b)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與同一通道家族的不同亞家族結合;(C)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與同一亞家族的不同種類結合;(d)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與同一通道的不同位點結合;(e)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與同一通道的同一位點結合但產生不同生物學效應;和/或(f)與對應未修飾的微生物蛋白結構域相比,所述微生物蛋白結構域與同一通道的同一位點結合并產生相同的生物學效應。14.如權利要求13所述的蛋白質,其特征在于,所述微生物蛋白結構域包含天然序列。15.如權利要求13所述的蛋白質,其特征在于,所述微生物蛋白結構域包含非天然序列。16.如權利要求13所述的蛋白質,其特征在于,單個結構域通過異源接頭連接在一起。17.如權利要求13所述的蛋白質,其特征在于,單個微生物蛋白結構域與相同通道家族、相同通道亞家族、相同亞家族的相同種類或相同通道的相同位點結合。18.如權利要求13所述的蛋白質,其特征在于,至少一個單個微生物蛋白結構域與不同通道家族、不同通道亞家族、同一亞家族的不同種類或同一通道的不同位點結合。19.一種獲得具有所需特性的微生物蛋白的方法,所述方法包括(a)提供如權利要求5或6所述的文庫;和(b)篩選可選擇文庫以獲得展示具有所需特性的微生物蛋白的至少一種噬菌體。20.如權利要求19所述的方法,其特征在于,所述篩選可選擇文庫還包括分離展示具有所需特性的微生物蛋白的噬菌體。21.如權利要求19所述的方法,其特征在于,所述所需特性是與感興趣靶點的結合特異性。22.—種包含如權利要求1或13所述蛋白質的編碼序列的重組多核苷酸。23.—種包含如權利要求22所述重組多核苷酸的宿主細胞。24.—種包含如權利要求22所述重組多核苷酸的載體。全文摘要本發(fā)明提供了非結構化重組聚合物(URP)以及含有一個或多個URP的蛋白質。本發(fā)明也提供微生物蛋白、毒素和其它相關蛋白實體,以及展示這些實體的遺傳包。本發(fā)明也提供包含編碼主題蛋白實體的載體的重組多肽,以及包含該載體的宿主細胞。主題組合物具有各種應用,包括一系列藥物應用。文檔編號C12N5/06GK101438158SQ200780016243公開日2009年5月20日申請日期2007年3月6日優(yōu)先權日2006年3月6日發(fā)明者A·克拉默,C·-W·王,M·D·肖爾勒,M·波普克弗,N·C·戈登,V·斯切利伯格,W·P·施特默爾申請人:阿穆尼克斯股份有限公司