欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法

文檔序號:40532874發(fā)布日期:2024-12-31 13:49閱讀:20來源:國知局
基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法

本發(fā)明屬于結構生物學,具體涉及一種蛋白質結構預測方法。


背景技術:

1、蛋白質結構預測對于生物學研究至關重要。蛋白質的功能很大程度上取決于其結構,因此獲得蛋白質的三維結構對于理解其功能、相互作用以及病理機制等方面至關重要。目前蛋白質結構預測主要采用深度學習、比較模型、分子動力學模擬等方法。其中深度學習,也就是人工智能和機器學習技術,已經在蛋白質結構預測中發(fā)揮了關鍵作用,但是該技術方法的進步只能歸結為人工智能領域的進步。人工智能方法暫時沒有基于明確的物理和化學機制直接推導出蛋白質的折疊規(guī)律和蛋白質結構預測方法。此外,利用分子動力學模擬嘗試在計算機上模擬蛋白質的折疊過程被認為是基于物理方法解決蛋白質折疊問題的一種途徑。這種途徑需要大量高性能計算資源,模擬多肽鏈分子在一定時間內的運動和相互作用,以推斷最穩(wěn)定的蛋白質結構,但是目前蛋白質折疊動力學模擬法仍然無法精確預測蛋白質的分子結構。

2、當今學術界流行的觀點認為蛋白質折疊的物理驅動力包含疏水作用、氫鍵作用力、靜電力、范德華力、離子鍵力等,基于這種理論進行預測的方式對蛋白質折疊結構進行預測時,效果并不理想。蛋白質精確折疊只發(fā)生在水環(huán)境中,在其他任何非水溶劑中,絕大多數(shù)的蛋白質都無法正確折疊。必須強調的是,水分子有極強的電極性,介電常數(shù)也非常高,有明顯的靜電屏蔽效果,因此能夠看出上述基于氫鍵作用力、靜電力、范德華力、離子鍵力等作用的預測的方式也不能從理論上得到很好的解釋,這也解釋了上述預測方式的預測效果不佳的原因,也印證了上述預測方式從理論就存在預測效果不理想的問題。目前尚沒有且急需開發(fā)一種僅基于氨基酸殘基側鏈之間發(fā)生疏水作用規(guī)律預測蛋白質結構的方法。


技術實現(xiàn)思路

1、本發(fā)明為了解決目前蛋白質折疊結構的預測方法存在預測效果不佳的問題。

2、基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法,所述的預測方法是利用水熵力實現(xiàn)蛋白質結構預測;所述的預測是基于蛋白質一級結構預測蛋白質的二級結構和三級結構;所述的水熵力是指氨基殘基側鏈低熵水合層之間的相互作用吸引力;所述的相互作用吸引力是指低熵水合層的低熵水分子的熵增驅動了氨基酸殘基側鏈之間的側向貼合;所述的側向貼合是指兩個殘基側鏈處于接近平行的狀態(tài)。

3、進一步地,所述的利用水熵力實現(xiàn)蛋白質結構預測的過程包括:

4、一、預測前期準備:

5、首先,對蛋白質一級結構中氨基酸殘基側鏈賦熵值,所述的熵值為氨基酸殘基側鏈外圍的低熵水合層的熵增潛力的相對度量值;

6、然后,將賦熵值后蛋白質一級結構中氨基酸殘基側鏈分成5種殘基形式:

7、微熵增潛力殘基:絲氨酸s、蘇氨酸t(yī)、天冬氨酸d、天冬酰胺n;

8、親水殘基:組氨酸h、精氨酸r、賴氨酸k、谷氨酸e、谷氨酰胺q、天冬氨酸d、天冬酰胺n、酪氨酸y、色氨酸w、絲氨酸s;

9、轉角殘基:甘氨酸g、脯氨酸p;

10、疏水殘基:異亮氨酸i、纈氨酸v、亮氨酸l、苯丙氨酸f、酪氨酸y、色氨酸w、丙氨酸a、蛋氨酸m、半胱氨酸c、組氨酸h;

11、高熵增潛力殘基:異亮氨酸i、纈氨酸v、亮氨酸l、賴氨酸k、精氨酸r、苯丙氨酸f、酪氨酸y、色氨酸w、丙氨酸a、蛋氨酸m、半胱氨酸c、谷氨酸e、谷氨酰胺q、組氨酸h;

12、最后,確定氨基酸殘基側鏈間優(yōu)選配對

13、氨基酸殘基側鏈間優(yōu)選配對為多對氨基酸殘基側鏈之間發(fā)生側向貼合導致多對氨基酸殘基側鏈低熵水合層的充分熵增,多對氨基酸殘基之間的對關系即為所述的氨基酸殘基側鏈間優(yōu)選配對;

14、所述的氨基酸殘基側鏈間優(yōu)選配對包括1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對、1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對和1-2序列位置關系的氨基酸殘基側鏈間優(yōu)選配對;

15、所述的1-4/5序列位置關系指蛋白質一級結構中氨基酸殘基序列的一個殘基側鏈和另一個殘基側鏈的序列位置間隔2個或3個的氨基酸殘基的關系;

16、所述的1-3序列位置關系指蛋白質一級結構中氨基酸殘基序列的一個殘基側鏈和另一個殘基側鏈的序列位置間隔1個的氨基酸殘基的關系;

17、所述的1-2序列位置關系指蛋白質一級結構中氨基酸殘基序列的一個殘基側鏈和相鄰的另一個殘基側鏈的序列位置關系;

18、二、蛋白質二級結構預測:

19、基于步驟一的殘基側鏈的序列位置、氨基酸殘基分類和熵值,以及殘基側鏈間優(yōu)選配對,采用如下過程進行蛋白質二級結構預測:

20、s100、在標記熵值的氨基酸序列下方另起一行,將氨基酸序列中屬于高熵增潛力殘基的氨基酸殘基重復列出,作為高熵增潛力殘基連通片段;然后,另起一行,將氨基酸序列中屬于微熵殘基和轉角殘基的氨基酸殘基重復列出;

21、s200、列出不被阻斷的高熵增潛力殘基連通片段,將列出的不被阻斷的高熵增潛力殘基連通片段分別假設為蛋白質二級結構中的α-螺旋或β-折疊:

22、s201、假設高熵增潛力殘基連通片段形成α-螺旋,若高熵增潛力殘基連通片段中一個殘基側鏈實現(xiàn)了氨基酸殘基側鏈間優(yōu)選配對,在該高熵增潛力殘基連通片段的氨基酸殘基下方標記為*;

23、s202、假設高熵增潛力殘基連通片段形成β-折疊,若高熵增潛力殘基連通片段為1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則在該高熵增潛力殘基連通片段的氨基酸殘基下方標記為&;

24、s203、對標記的*和&進行分析:

25、s2031、若蛋白質一級結構中高熵增潛力殘基連通片段均沒有標記為&-&,且該高熵增潛力殘基連通片段中超過80%的氨基酸殘基標記為*,則預測該高熵增潛力殘基連通片段形成α-螺旋;

26、s2032、若蛋白質一級結構中高熵增潛力殘基連通片段中標記有&-&,則預測該高熵增潛力殘基連通片段形成β-折疊;若蛋白質一級結構中高熵增潛力殘基連通片段中標記的*數(shù)量小于該高熵增潛力殘基連通片段的氨基酸殘基數(shù)量的50%,則預測該高熵增潛力殘基連通片段形成β-折疊;

27、s300、對s200已經預測為形成α-螺旋的高熵增潛力殘基連通片段的兩側的氨基酸側鏈進行搜索,若兩側的氨基酸側鏈中的氨基酸殘基與高熵增潛力殘基連通片段中的氨基酸殘基存在1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則預測1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對形成α-螺旋;

28、s400、對s200假設的預測形成蛋白質二級結構中的α-螺旋或β-折疊進行判定:

29、分別統(tǒng)計出被預測為α-螺旋和β-折疊的蛋白質一級結構中氨基酸殘基的熵增值,比較統(tǒng)計的被預測為α-螺旋的熵值與被預測為β-折疊的熵增值;當二者中相對較大熵增值較另外一個熵增值的數(shù)值大于20%,則以二者中相對較大熵值的預測結果判定為最終預測結果;當二者中相對較大熵增值較另外一個熵增值的數(shù)值小于20%,則判定s200假設的預測形成蛋白質二級結構中的α-螺旋或β-折疊作為一種潛在的結果;

30、其中,β-折疊的熵增值統(tǒng)計方法:蛋白質一級結構中存在1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,將該優(yōu)選配對中的氨基酸殘基的熵值作為熵增值;

31、α-螺旋的熵增值統(tǒng)計方法:蛋白質一級結構中存在1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,將該優(yōu)選配對中的氨基酸殘基的熵值作為熵增值;

32、s500、若蛋白質一級結構中未被預測為α-螺旋的高熵增潛力殘基連通片段中存在連續(xù)兩個微熵增潛力氨基酸殘基,則預測該兩個氨基酸殘基形成轉角,并標記為t;

33、蛋白質一級結構中連續(xù)相鄰的4個及以上親水氨基酸殘基片段被名為“連續(xù)親水殘基片段”;若蛋白質一級結構中未被預測為α-螺旋的高熵增潛力殘基連通片段中存在數(shù)量大于7個氨基酸殘基的片段中,微熵增潛力殘基和/或轉角殘基和/或氨基酸殘基a和/或連續(xù)親水殘基片段中殘基的數(shù)量占該數(shù)量大于7個氨基酸殘基的片段的數(shù)量大于等于50%,則預測該數(shù)量大于7個氨基酸殘基的片段形成無規(guī)則卷曲,并作為一種潛在的預測結果;

34、s600、蛋白質一級結構中由連續(xù)5個或5個以上親水氨基酸殘基組成的片段,若該片段已經被預測為高熵增潛力殘基連通片段,則將該連續(xù)5個或5個以上親水氨基酸殘基組成的片段預測形成無規(guī)則卷曲,并作為一種潛在的預測結果,即完成所述的基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法。

35、進一步地,氨基酸殘基側鏈間優(yōu)選配對包括:

36、f-f,q-q,k-k,e-e,t-t,r-r,a-a,s-s,m-m;

37、m-a,q-e,t-s,r-e,k-r,e-k,f-y,w-y,w-e,r-w,r-y,k-y,h-v,d-e,n-e,d-q,n-q;

38、q-r/k,i/v/l/f-i/v/l/f,i/v/l/f/y-i/v/l/f/y,i/v/l-y,i/v/l-k,i/v/l-r,i/v/l-a,i/v/l-w,i/v/l/f/y-w,i/v/l-m,c-m/y,m-i/v/l,a/t-d/n。

39、進一步地,步驟s201中氨基酸殘基側鏈間優(yōu)選配對是指1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對;若所述的高熵增潛力殘基連通片段中存在1-2序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,或所述的高熵增潛力殘基連通片段中存在i/v/l?1-4/5g/a1-4/5i/v/l/f的序列位置關系,則在該氨基酸下方標記為*。

40、進一步地,s202中所述的1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對為i/v/l/f-i/v/l/f;若以i/v/l/f-i/v/l/f中的氨基酸為起點,在相鄰的高熵增潛力殘基連通片段中存在1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則該1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對上的氨基酸不標記為&。

41、進一步地,s2032中所述的若蛋白質一級結構中高熵增潛力殘基連通片段中標記有&-&,且遠離該被標記&-&的高熵增潛力殘基連通片段的蛋白質一級結構中的氨基酸側鏈區(qū)域上存在85%以上的氨基酸殘基被標記為*,且存在與標記有&-&的無關殘基存在i/v/l/f/y-i/v/l/f/y的1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則預測該被標記&-&的高熵增潛力殘基連通片段形成α-螺旋;其中,所述的遠離是指連續(xù)間隔兩個微熵殘基或轉角殘基,或間隔至少3個親水殘基,或間隔一個氨基酸殘基p;所述的無關殘基是指蛋白質一級結構中除了被標記&-&外的其他氨基酸殘基;所述的氨基酸側鏈區(qū)域是指氨基酸殘基數(shù)量大于5的氨基酸側鏈構成的區(qū)域。

42、進一步地,s2032中所述的高熵增潛力殘基連通片段預測形成β-折疊,且該高熵增潛力殘基連通片段存在連續(xù)兩個微熵殘基天冬氨酸d或天冬酰胺n,則連續(xù)兩個微熵殘基天冬氨酸d或天冬酰胺n被預測為形成轉角,作為一種預測結果。

43、進一步地,s400中所述的β-折疊的熵增值統(tǒng)計中若蛋白質一級結構中同一氨基酸殘基實現(xiàn)了兩1-3序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則該氨基酸殘基的熵增值被累計兩次;

44、α-螺旋的熵增值統(tǒng)計中若蛋白質一級結構中同一氨基酸殘基實現(xiàn)了多個1-4/5序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,則該氨基酸殘基的熵增值被累計兩次。

45、進一步地,s400中所述的α-螺旋的熵增值統(tǒng)計中若蛋白質一級結構中存在1-2序列位置關系的氨基酸殘基側鏈間優(yōu)選配對,且優(yōu)先配對為i/v/l/m-i/v/l/m,則兩對i/v/l/m記作一次熵增值。

46、進一步地,s600中所述的連續(xù)兩個氨基酸殘基中的氨基酸殘基為s、t、n、d、g中的一個或兩個。

47、進一步地,所述的蛋白質一級結構中氨基酸殘基側鏈外圍的低熵水合層的熵增潛力的相對度量值是將蛋白質一級結構中氨基酸殘基側鏈上疏水部分的長度作為相對度量值的度量指標。

48、進一步地,所述的蛋白質一級結構中氨基酸殘基側外圍的低熵水合層的熵增潛力的相對度量值,具體是將蛋白質一級結構中氨基酸殘基鏈上一個碳-碳鍵的數(shù)量作為1個熵值。

49、進一步地,20種氨基酸的熵值具體如下:

50、絲氨酸s=0.5、蘇氨酸t(yī)=0.5、天冬氨酸d=0.5、天冬酰胺n=0.5,甘氨酸g=0,組氨酸h=3、精氨酸r=3、谷氨酸e=3、賴氨酸k=4,色氨酸w=5,異亮氨酸i=6、纈氨酸v=6、亮氨酸l=6、苯丙氨酸f=6,脯氨酸p=0,半胱氨酸c=4,谷氨酰胺q=3,丙氨酸a=1,蛋氨酸m=4,酪氨酸y=5。

51、進一步地,步驟一中所述的充分熵增是指當?shù)鞍踪|一級結構中兩個氨基酸殘基側鏈相似時,兩個殘基側鏈發(fā)生側向貼合,使得這兩個側鏈的低熵水合層發(fā)生充分的熵增;所述的氨基酸殘基側鏈相似是指當兩個氨基酸親水殘基的熵值的差值越小,認為兩個親水殘基越相似;當兩個氨基酸疏水殘基的熵值的差值越小,認為兩個疏水殘基越相似。

52、進一步地,確定不被阻斷的高熵增潛力殘基連通片段的過程中,首先在序列中找出由連續(xù)高熵增潛力殘基相鄰組成的片段,命名原始的“高熵增潛力殘基連通片段”,然后確定不阻斷高熵增潛力殘基連通片段的非高熵增潛力殘基,進而確定不被阻斷的高熵增潛力殘基連通片段,具體包括:

53、(1)當兩個高熵增潛力殘基間只間隔一個氨基酸殘基s或t,該s或t殘基參與組成不被阻斷的高熵增潛力殘基連通片段;

54、(2)當氨基酸序列的兩個高熵增潛力殘基間只間隔一個孤立的n、d或g殘基時,且跨過該d、n或g存在1-3或1-4/5關系的i、v、l、f、y之間的高熵配對,則認為該d、n或g參與組成不被阻斷的高熵增潛力殘基連通片段;

55、(3)當多肽鏈的氨基酸序列中出現(xiàn)s、t、n、d、g中任意一個氨基酸殘基,其和另一個s、t、n、d、g中任意一個氨基酸殘基存在相鄰關系時,查看跨過這兩個相鄰的氨基酸殘基存在的1-4/5序列位置關系,當該1-4/5位置上的兩個氨基酸殘基都為i、v、l、f、y殘基的一種,同時保證其中至少一個氨基酸殘基是i、v或l,則預測這兩個相鄰的氨基酸殘基參與組成不被阻斷的高熵增潛力殘基連通片段;

56、(4)當多肽鏈的氨基酸序列中出現(xiàn)p殘基時,且該p殘基不與d或n殘基處于1-2或1-3的序列位置關系,當跨過該p存在1-4/5序列位置關系,且1-4/5上的氨基酸殘基為i、v、l、f,則該預測p殘基參與組成不被阻斷的高熵增潛力殘基連通片段;

57、(5)當多肽鏈氨基酸序列中出現(xiàn)存在一個g或a殘基,如果在該g或a殘基所在序列中的一側可以找到一個與該殘基形成1-4/5序列位置關系的氨基酸殘基是i、v、l殘基的一種,且在該g或a殘基所在序列中的另一側也可以找到一個與該g或a殘基形成1-4/5序列位置關系的氨基酸殘基是i、v、l、a殘基的一種時,如果在i、v、l殘基之間存在不與其他微熵殘基或轉角殘基相鄰的單個的d、n、g或p殘基,或存在兩個相鄰的s、t、n、d殘基時,則預測這些單個的d、n、g或p殘基或兩個相鄰的s、t、n、d、g殘基參與組成不被阻斷的高熵增潛力殘基連通片段。

58、進一步地,所述的不被阻斷的高熵增潛力殘基連通片段的長度大于等于3個氨基酸殘基。

59、進一步地,若蛋白質一級結構未被預測為α-螺旋和β-轉角的序列中存在數(shù)量大于等于5個氨基酸殘基的片段,當該片段處在未折疊蛋白質的普遍初始熱力學亞穩(wěn)態(tài)狀態(tài)時,若該片段中不存在一個親水氨基酸殘基側鏈的親水原子的高度減去相鄰的疏水殘基側鏈的高度的數(shù)值小于等于1,則該片段預測為β-折疊;其中,殘基側鏈的高度是指該片段中的氨基酸殘基側鏈的頂部原子和其主鏈碳原子間共價鍵連接的最短路徑內的共價鍵個數(shù)為殘基側鏈的高度。

60、基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法,所述的預測方法是利用水熵力實現(xiàn)蛋白質結構預測;所述的預測是基于所述的基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法預測的蛋白質的二級結構進行蛋白質的三級結構預測,包括以下步驟:

61、定義氨基酸殘基側鏈的相似性:兩個親水殘基側鏈的“熵值”的差值越小,認為時兩個親水殘基越相似;兩個疏水殘基側鏈的“熵值”的差值越小,認為時兩個疏水殘基越相似;

62、將已經預測出的二級結構中實現(xiàn)了i/v/l/f間優(yōu)選配對的氨基酸殘基標出,將實現(xiàn)了i/v/l/f氨基酸殘基側鏈之間側向貼合的疏水側鏈團簇的疏水表面標記出并命名為“團簇疏水表面”,預測一個i/v/l/f團簇疏水表面和臨近的另一個i/v/l/f團簇疏水表面發(fā)生表面貼合的為蛋白質結構;

63、當一個β-折疊或α-螺旋二級結構中沒有i/v/l/f間的優(yōu)選配對關系,則搜索該二級結構中是否有i/v/l-y間的優(yōu)選配對關系,如果存在,則將i/v/l-y氨基酸殘基側鏈之間側向貼合的疏水側鏈團簇疏水表面也標記為“團簇疏水表面”;預測一個i/v/l/y團簇疏水表面和臨近的另一個團簇疏水表面發(fā)生表面貼合為蛋白質結構;

64、當一個α-螺旋結構存在2個團簇疏水表面,且2個團簇疏水表面沒有在該α-螺旋的軸向方向連通,則預測其中一個i/v/l/f/y數(shù)量較小的團簇疏水表面不和臨近的一個β-折疊或α-螺旋二級結構中的另一個i/v/lf/團簇疏水表面發(fā)生貼合,作為一種可能的預測結果。

65、進一步地,所述的基于殘基側鏈低熵水合層之間相互吸引關系的蛋白質結構預測方法,還包括以下步驟:

66、針對當前預測為β-折疊的情況,需要標記β-折疊中1-3位置關系優(yōu)選配對連通片段的強疏水殘基,即i/v/l/f/w/y,同時標記出這些通過1-3位置關系相連的疏水片段,比較在序列中相鄰的β-折疊的長度,擬預測長度近似的α-螺旋會折疊成sheet結構,然后基于兩個β-折疊的強疏水殘基側鏈分布,將二者對應位置關系中基于一個β-折疊上最多的強疏水殘基能夠和另一個α-螺旋上的氨基酸殘基側鏈實現(xiàn)優(yōu)選配對的方式側向貼合,兩個β-折疊貼合的狀態(tài)為預測的sheet的折疊結構。

67、本發(fā)明包含以下有益效果:

68、本發(fā)明經過研究,認為只有氨基酸殘基側鏈之間發(fā)生疏水作用才是蛋白質折疊核心驅動力,氫鍵作用力、靜電力、范德華力、離子鍵力等作用是疏水作用的副產物,也就是熵焓補償?shù)漠a物。進而本發(fā)明提出一種僅基于氨基酸殘基側鏈之間發(fā)生疏水作用規(guī)律預測蛋白質結構的方法。本發(fā)明可以精確解析蛋白質結構的折疊動力機制和折疊規(guī)律,從而能夠準確的預測出蛋白質折疊結構,并依據(jù)該規(guī)律給出了蛋白質二級和三級結構的預測方法。有助于科學家設計新的蛋白質和有目的突變現(xiàn)有的蛋白質結構,用于重要的生物學應用。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
普格县| 杭锦后旗| 沐川县| 淳化县| 遂溪县| 翁牛特旗| 博乐市| 辽阳县| 土默特右旗| 吴忠市| 通渭县| 仁布县| 溧水县| 巴楚县| 饶平县| 教育| 漳浦县| 正阳县| 长沙县| 汶川县| 武川县| 玉环县| 尉氏县| 临江市| 蒙城县| 珲春市| 安龙县| 泗水县| 三江| 宜昌市| 资中县| 平和县| 郓城县| 柯坪县| 永济市| 定襄县| 梅州市| 石门县| 凤阳县| 察雅县| 南安市|