本發(fā)明涉及一種用于實施用于確定移植材料的一個或多個受體與一個或多個供體之間的預測非直接識別HLA表位(PIRCHES)的數(shù)量的計算機實現(xiàn)的方法的方法、系統(tǒng)和/或數(shù)據(jù)結構。本文中所描述的方法、系統(tǒng)和數(shù)據(jù)結構可以識別可允許的錯配,因此可以經(jīng)由患者和供體的HLA衍生肽的計算機分析來提供相對安全的移植材料。
因此,本發(fā)明涉及通過快速且可靠的方法、利用新穎的數(shù)據(jù)結構或數(shù)據(jù)源來電子仿真生物學現(xiàn)象的計算機實現(xiàn)的方法的實用實施例。新穎的數(shù)據(jù)結構使得能夠開發(fā)交互式軟件模塊,該交互式軟件模塊根據(jù)錯配的受體HLA等位基因來確定受體或供體特定的HLA衍生肽的數(shù)量,其中錯配的受體HLA等位基因被預測將由共享的(匹配的)HLA分子(PIRCHES)來呈遞(present)。大量的PIRCHES與移植供體材料之后不需要的免疫反應的風險增加相關聯(lián)。因此,通過快速且有效的方式來預測PIRCHES的數(shù)量使得能夠改進安全移植材料的選擇。而且,本發(fā)明詳細說明在現(xiàn)有的HLA配型(例如CordMatch“臍帶血配型”)應用中應當如何整合功能性。
背景技術:
同種異體的細胞、組織以及器官的移植是已經(jīng)成為日益受矚目的治療選擇的發(fā)展中的治療方法。在不遠的將來,預期從不相關供體接收移植的患者數(shù)量將會翻倍。移植之后的同種異體反應性對于臨床效果影響很大,對于病理而言也具有有利效果。已知HLA錯配誘發(fā)移植之后的免疫反應,但是并沒有完全弄清楚在預測不需要的免疫反應的風險中所包括的各個因素。
造血干細胞移植(Hematopoietic Stem Cell Transplantation,HSCT)是快速發(fā)展的治療方法的一個示例。HSCT的主要限制因素仍是移植物抗宿主病(graft-versus-host disease,GVHD),并且由于預期接收HSCT的患者將會增加,所以必須加快提供預防GVHD的新方法。為了克服GVHD的風險,優(yōu)選地是利用所有的HLA等位基因完全匹配的供體與患者進行移植。但是,由于HLA分子在群體中的多樣性,大約40%的患者無法找到這些完全匹配的供體。當無法找到完全匹配供體時,臨床醫(yī)生經(jīng)常必須面對從多個錯配供體之中選擇出最好供體(即,攜帶最低GVHD風險的那個供體)的困難決定。
至今,確定哪一個供體是最適合的供體依賴于需要長達14天實驗室工作的繁重檢測,例如細胞毒性T淋巴細胞前體頻率(cytotoxic T-lymphocyte precursor frequency,CTLpf)檢測。少于或等于每106中一個PBL的CTLpf評分與更好的總體存活相關聯(lián)(Heemskerk等,骨髓移植(Bone Marrow Transplantation),2007年,第40卷,頁:193-200)。雖然能夠通過實驗室方法提供這樣的有用信息,但是分析所需的時間被延長,并且可能導致對于需要移植的患者的進一步傷害或死亡。臨床醫(yī)生在選擇處于由不需要的同種異體反應性所引起的副作用的危險下的臍帶血或臍帶血細胞移植、腎臟移植、或其他移植時,也面臨著相似的問題。為了找到CTLpf檢測的替代方法,已經(jīng)將多個未成功的嘗試用于利用兩種通用的預測程序(HLAMatchmaker和HistoCheck)對于禁用的錯配進行預測。
HLAMatchmaker確定抗體的潛在表位,并且已經(jīng)證明其對于實體器官移植的有效性(Duquesnoy等,人類免疫(Hum.Immunol.),2002年,第60卷,頁:353-63;Duquesnoy等,移植(Transplantation),2003年,第75卷,頁:884-89)。HLAMatchmaker考慮到氨基酸三聯(lián)體作為HLA上的表位的差異。雖然抗體在GVHD的發(fā)病中起作用,但是基于HLAMatchmaker的預測與同種異體性不相關(Guptad等,血液(Blood),2010年,第1卷,第6期,頁1839-48)。
HistoCheck是基于直接識別HLA差異的觀點,也就是供體T細胞識別負載非多態(tài)性肽的完整的錯配HLA分子(Amir等,血液,2011年,第118卷,第6733頁)。HistoCheck在肽結合槽或連接T細胞受體的區(qū)域內(nèi)確定HLA分子的結構差異(Elsner等,骨髓移植(Bone Marrow Transplantation),2004,第33卷,頁:165-69)。通過確定這些結果差異,目的是預測直接識別HLA差異的可能性。利用HistoCheck所獲得的差異性評分也與同種異體反應性無關(Spellman等,血和骨髓移植生物學(Biol.Blood Marrow Transplant),2011年,第17卷,頁:1409-15)。
鑒于現(xiàn)有技術,需要更可靠并且更快速的方法,用于預測與HLA錯配的用于移植的供體材料是否會增加導致移植失敗的風險,例如GVHD的發(fā)病,和/或死亡率增加。
技術實現(xiàn)要素:
鑒于現(xiàn)有技術,本發(fā)明潛在的技術問題是提供改進的或替換的計算機實現(xiàn)的方法,用于選擇具有低風險不利反應的同種異體移植所適合的供體細胞或組織,或者用于預測經(jīng)歷移植過程的患者體內(nèi)的不利的免疫應答,具體是經(jīng)由確定任何給定的供體和受體對之間的PIRCHES的數(shù)量。
通過獨立權利要求的各個特征來解決該技術問題。通過從屬權利要求來提供本發(fā)明的優(yōu)選實施例。
因此,本發(fā)明涉及一種由計算機實現(xiàn)的方法,該方法用于確定移植材料的一個或多個受體與一個或多個供體之間預測的間接識別HLA表位(PIRCHES)的數(shù)量,其中所述PIRCHES是來自錯配的受體HLA等位基因的受體或供體特異性的HLA衍生肽,并且被預測將由共享(匹配)HLA分子進行呈遞,其中所述方法包括:
a)從受體的錯配HLA分子中識別肽;
b)確定a)中所識別出的肽被預測將由已選擇的共享(匹配)HLA分子中的一個或多個進行呈遞;
c)從供體的所有已選擇的HLA分子識別肽;
d)確定c)中所識別出的肽被預測將由已選擇的共享(匹配)HLA分子中的一個或多個進行呈遞;
其中
e)對于每個共享的MHC I類HLA分子:任何不包括在d)中的肽組中的b)中所確定的肽是一個PIRCHE I,或者
對于每個共享的MHC II類HLA分子:任何不包括在d)中的肽組中的b)中所確定的肽是一個PIRCHE II;
其特征在于
f)根據(jù)以圖形數(shù)據(jù)結構進行存儲的信息來執(zhí)行步驟a)到d)。
因此,除了在確定任何給定的對應方法中的PIRCHE數(shù)量的方法中使用圖形數(shù)據(jù)結構之外,本發(fā)明涉及圖形數(shù)據(jù)結構。該數(shù)據(jù)結構可以如所需或所期望用于本文中所述的本發(fā)明的任何方法步驟。本發(fā)明還涉及用于執(zhí)行方法和/或運行如本文中所述的系統(tǒng)的計算機軟件。在一個實施例中,本文中所述的方法其特征在于通過軟件來執(zhí)行步驟f),例如一個或多個軟件模塊。
本發(fā)明的又一實施例涉及選擇和/或篩選用于移植的供體材料的系統(tǒng),例如從HLA錯配的不相關供體來選擇具有可允許的錯配的供體材料,所述系統(tǒng)包括根據(jù)本文中所述的方法的PIRCHE配型和HLA配型的軟件模塊。
在一個實施例中,本文中所述的方法其特征在于,圖形數(shù)據(jù)結構中所存儲的信息是生物數(shù)據(jù)的電子存儲表現(xiàn),或者對應于一個或多個生物實體,或者是一個或多個生物實體的抽象化。因此,本發(fā)明涉及在其中處理與“真實世界”生物實體對應的數(shù)據(jù)的計算機實現(xiàn)方法。這樣的圖形數(shù)據(jù)結構,其特征不僅在于數(shù)據(jù)結構的特定構架,并且在于實體的特定生物背景和結構所體現(xiàn)的關系。
本發(fā)明的新型圖形數(shù)據(jù)結構及其在本文中所述的方法中的使用使得處理時間相比先前所嘗試的方法顯著地改進(縮短)。令人完全驚奇的是,通過本發(fā)明中所使用的數(shù)據(jù)結構能夠將供體與受體之間的PIRCHE的分析提高至如此明顯的程度。
在一個實施例中,本文中所述的方法其特征在于,供體和受體之間的HLA配型已經(jīng)在實現(xiàn)本文中所述的方法之間執(zhí)行。已經(jīng)預先實現(xiàn)此方法的HLA分析數(shù)據(jù),并且隨后經(jīng)由本發(fā)明的方法來處理與HLA分型相關的數(shù)據(jù)。
在一個實施例中,本文中所述的方法其特征在于,通過用于在所述HLA分子內(nèi)預測人類蛋白酶體的切割位點的計算機實現(xiàn)方法,識別來自受體的錯配HLA分子的肽和來自供體HLA分子的肽。這優(yōu)選地參考本文中所述的方法的步驟a)和c)。因此,該切割位點優(yōu)選地涉及由人類蛋白酶體所識別的肽鏈內(nèi)切酶和/或蛋白酶位點。本發(fā)明的該特征的優(yōu)選實施例涉及軟件NetChop或者如本文中所述的可替換軟件的使用,該軟件能夠確定肽序列的蛋白酶體切割。
在一個實施例中,本文中所述的方法其特征在于,利用用于預測所述肽與任何給定HLA分子的結合的計算機實現(xiàn)方法來執(zhí)行權利要求1的步驟b)和步驟d)。本發(fā)明的該特征的優(yōu)選實施例涉及軟件NetMHCpan和/或NetMHC II,或者如本文中所述的可替換軟件的使用,該軟件能夠確定(或者預測)HLA或MHC分子中的任何給定的(優(yōu)選單體的)肽的結合。
其他結合準則可以用于預測肽是否將由該HLA分子進行呈遞。所提供的值是基于先前文獻中所述的結合性質(zhì),但是如果能夠合理地認為PIRCHE結合呈遞HLA,可以得到或使用不同的值。本文中所提到的優(yōu)選值令人吃驚地工作良好。對于每個供體-受體對,識別出可呈遞的受體或供體特定的HLA衍生肽(PIRCHE)。
在一個實施例中,根據(jù)設置,將呈遞的共享HLA等位基因、所預測的源于供體HLA等位基因的結合物視為供體自身的肽,而將受體HLA等位基因視為受體自身的肽,然后從分析中進行排除.通常,對于每個供體-受體對,將可呈遞的受體或供體特定的肽(從錯配的受體HLA等位基因獲得,并且被預測將由共享的HLA進行呈遞)進行計數(shù)從而生成PIRCHES的數(shù)量。
優(yōu)選地通過以下兩個步驟來識別PIRCHE-I:
1)執(zhí)行通過蛋白酶體對于氨基酸序列的預測處理的計算機評估以及經(jīng)由TAP通道的傳輸,優(yōu)選地是利用NetChop。NetChop是一個眾所周知的用于基于序列分析來識別人類蛋白酶體的切割位點的基于軟件的方法。單體肽優(yōu)選地包括在分析中。在優(yōu)選實施例中,確定C末端切割勢能。整個HLA蛋白被切割(在計算機中)并且所有可切割的位置都被標記。從向后被標記的位置,優(yōu)選地識別單體肽,對于單體肽進行分析用于與I類結合。
作為NetChop的替換,在現(xiàn)有技術中已知能夠利用很多基于軟件的方法,諸如MAPP、PaPro或者如Lu等人(J ZheJiang Univ Sci B,2013年9月;14(9),頁:816-28)或Ginodi等人(Bioinformatics,2008年2月15日;24(4),頁:477-83).
2)隨后,利用NetMHCpan,對于具有高度被處理可能性(根據(jù)步驟1)的肽,針對它們將由供體與受體(優(yōu)選的是HLA-A、-B、-C)之間共享的(匹配的)HLA呈遞的能力進行測試.NetMHCpan是眾所周知的利用人工神經(jīng)網(wǎng)絡來識別和/或預測肽與任何已知的MHC分子的結合的方法.該方法在覆蓋超過150個不同的MHC分子的超過150,000的定量結合數(shù)據(jù)。能夠針對HLA-A、HLA-B、HLA-C、HLA-E以及HLA-G等位基因進行預測。預測值能夠以nM IC50值來給出,或者作為對于一組200000個隨機自然肽的%排名。優(yōu)選地,選擇具有IC50結合值<500nM的肽作為相關結合體。
可以如下來識別PIRCHE II:
潛在的15個氨基酸的HLA-DR、HLA-DQ以及HLA-DP結合體的優(yōu)選單肽的結合評分可以優(yōu)選地利用NetMHCIIPan 2.0、NetMHCII 1-0或者NetMHCII 2.2來進行分析。NetMHCII是眾所周知的利用人工神經(jīng)網(wǎng)絡來預測肽與HLA-DR、HLA-DQ、HLA-DP以及鼠MHC II類等位基因的方法。能夠針對覆蓋9個HLA-DR超型(supertype)、6個HLA-DQ、6個HLA-DP以及兩種鼠H2II類等位基因來獲取預測。預測值能夠以nM IC50值來給出,或者作為對于一組1000000個隨機自然肽的%排名。將具有IC50結合值<1000nM的肽視為相關。
在現(xiàn)有技術中已知很多能夠用于確定HLA結合的可替換方法。SYFPEITHI(基于如下文獻中所描述的方法:Rammensee等,Immunogenetics,41,頁:178-228和Rammensee等,Landes Bioscience,1997年)和BIMAS是熟知的替代,并且適合于I類結合但是在II類結合中顯示出一些不足。其他的替代涉及Tepitope(基于Stur-niolo等,1999,Nat.Biotechnol.17:555-561)、TepitopePAN、EpicCapo、PAAQD、POPI、Propred以及Multipred。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中PIRCHE-I肽具有預測的IC50結合值<10μM,優(yōu)選<1000nM,更優(yōu)選<500nM。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中PIRCHE-II肽具有預測的IC50結合值<20μM,優(yōu)選<5μM,更優(yōu)選<1000nM。
隨后在圖形數(shù)據(jù)結構的背景下提供和/或分析HLA衍生肽的識別及其如上所述的潛在的結合屬性。
根據(jù)本發(fā)明,以及在計算機科學中,術語“圖形數(shù)據(jù)結構”是包括節(jié)點(也稱為頂點(vertice))的集合,以及它們之間的連接(稱為邊(edge))的數(shù)據(jù)類型或結構。圖形數(shù)據(jù)結構可以與每個邊的一些邊值(諸如數(shù)值型屬性)相關聯(lián)。
根據(jù)本發(fā)明,優(yōu)選地將數(shù)據(jù)結構的節(jié)點體現(xiàn)為HLA值實體和肽實體,其中優(yōu)選地將該邊體現(xiàn)為HLA值與肽實體之間的關系。
與圖形數(shù)據(jù)相關聯(lián)的典型操作包括“adjacent(G,x,y)”,其測試是否存在從節(jié)點x到節(jié)點y的邊,“neighbors(G,x)”,其列出存在從x到y(tǒng)的邊的所有節(jié)點y,或者“get_node_value(G,x)”,其返回與節(jié)點x相關聯(lián)的值。進一步的操作是可用的并且例如能夠選擇或提供通過如本文中所定義的某些關系所定義的特定節(jié)點,例如當針對給定的供體-受體對,選擇那些將被視為PIRCHES的肽。因此,為了針對任何給點的供體-受體對來確定與PIRCHES的數(shù)量相關的期望信息,本領域技術人員能夠經(jīng)由軟件程序中所執(zhí)行的各種操作,利用本文中所述的圖形數(shù)據(jù)結構。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,圖形數(shù)據(jù)結構包括:
-一個或多個HLA值實體,
-一個或多個肽實體,以及
-所述HLA值與肽實體之間的一個或多個關系,其中每個實體在圖形數(shù)據(jù)結構中以單個實例進行呈遞,并且可以向另一個實體顯示一個或多個關系。
在一個優(yōu)選實施例中,一個或多個HLA值實體優(yōu)選地與HLA等位基因的信息的和/或計算機表示有關。在一個優(yōu)選實施例中,HLA值實體與通過唯一的蛋白質(zhì)序列所定義的等位基因有關,由此在本方法中優(yōu)選地不考慮只顯示DNA序列差異而在對應的蛋白質(zhì)序列中不發(fā)生改變的HLA等位基因。這樣的只顯示DNA序列差異的HLA等位涉及標準HLA命名系統(tǒng)的段3和段4中所述的等位基因特定的特征,該特征與同義DNA序列改變或編碼區(qū)之外的序列變化有關。
在一個優(yōu)選實施例中,一個或多個肽實體優(yōu)選地與源于HLA值實體的肽序列的信息的和/或計算機表示有關,由此可以經(jīng)由計算機方法將任何給定的HLA等位基因的序列進行切割,以便從HLA蛋白質(zhì)序列之中生成給定長度的肽序列,其中優(yōu)選肽的氨基酸長度是5到30,優(yōu)選肽的氨基酸長度是7到11,更優(yōu)選肽的氨基酸長度是9,或者優(yōu)選肽的氨基酸長度是12到18,更優(yōu)選肽的氨基酸長度是15。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,HLA值實體與肽具有關系,但與其他HLA實體沒有,而肽與HLA值具有關系,但是與其他肽沒有。通過這組關系,形成能夠有效的(快速的)查詢的圖形數(shù)據(jù)結構。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,任何給定的HLA值實體“具有”許多個肽(從1到n),其中任何給定的HLA值實體的每個肽(源于任何給定的HLA值實體的每個肽)與所述HLA值實體具有關系。因此,通過每個HLA值實體與它所連接的肽實體之間的關系來限定圖形數(shù)據(jù)結構,優(yōu)選地通過對應的HLA分子的氨基酸序列的預測蛋白酶體切割以及蛋白酶體切割的可能性來限定所述關系。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,通過對應的HLA分子的氨基酸序列的預測蛋白酶體切割來確定每個HLA值實體的肽。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,蛋白酶體切割的可能性是通過從0到1的切割評分來表示的(優(yōu)選地,0到1之間),其中所述評分體現(xiàn)任何給定的HLA值實體與肽實體之間的關系屬性。
在優(yōu)選實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,執(zhí)行權利要求1中的步驟a)和步驟c),以便根據(jù)切割評分來確定所述肽的識別。在一個實施例中,對于任何給定的肽的切割評分(關系性質(zhì)或屬性)優(yōu)選地是>0.5(閾值可以從0到1,優(yōu)選地在0.1到0.9之間,更優(yōu)選地在0.3到0.7之間,最優(yōu)選地為0.5),用于針對所述HLA分子的肽識別是足夠的。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,任何給定的HLA值實體“呈遞”許多個肽(從0到n),其中任何給定的HLA值實體所呈遞的每個肽與所述HLA值實體具有關系。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,通過所述HLA分子對于所述肽的預測結合和呈遞來確定HLA值實體對于肽的呈遞。
在一個優(yōu)選實施例中,通過IC 50評分來表示肽呈遞的可能性,其中IC 50評分體現(xiàn)任何給定HLA值實體與肽實體之間的關系的特性。在一個實施例中,對于權利要求1的步驟b)和步驟d),利用IC 50評分閾值來實現(xiàn)所述肽的確定。
在一個實施例中,如本文中所述的,這樣的方法或圖形數(shù)據(jù)結構,其特征在于,所述閾值對于PIRCHE I優(yōu)選是IC 50評分≤500,和/或對于PIRCHE II優(yōu)選是IC 50評分≤1000,其中這樣的評分足夠進行所述肽的預測呈遞的確定。
在一個優(yōu)選實施例中,所選擇的HLA分子是HLA基因座A*、B*、C*、DRB1*以及DQB1*,并且可選地DPB1*和DRB3/4/5*。
本發(fā)明的另一方面涉及一種用于選擇和/或篩選用于移植的供體材料的系統(tǒng),例如從錯配的不相關供體選擇具有可允許的錯配的供體材料,所述系統(tǒng)包括用于根據(jù)前述權利要求的方法的PIRCHE配型以及HLA配型的軟件模塊。
在一個優(yōu)選實施例中,該用于選擇和/或篩選用于移植的供體材料的系統(tǒng),其特征在于,所述HLA軟件模塊基于高分辨率等位基因編碼來實現(xiàn)供體與受體的HLA分型數(shù)據(jù)之間的HLA配型,優(yōu)選地針對HLA基因座A*、B*、C*、DRB1*以及DQB1*,并且可選地DPB1*和DRB3/4/5*。
更優(yōu)選的是,所述PIRCHE配型并入由所述HLA配型軟件模塊所生成的HLA配型信息,使得PIRCHE配型模塊接受患者、配型配置和HLA配型的供體列表以及優(yōu)選地臍帶血單元(CBU),并且向服務客戶返回含有豐富PIRCHE信息的輸入供體列表作為輸出。
在優(yōu)選實施例中,該系統(tǒng)其特征在于,經(jīng)由共享的服務整合管理軟件模塊來提供患者信息和搜索配置,其中將所述共享的服務整合管理軟件模塊連接到HLA配型和PIRCHE配型模塊兩者,使得患者信息和搜索配置最初由所述HLA配型軟件模塊來進行處理,隨后經(jīng)由用于分析PIRCHE數(shù)量的共享的管理模塊,向所述PIRCHE配型模塊提供患者、配型配置以及HLA配型的供體列表,并且優(yōu)選地臍帶血單元(CBU)。
該系統(tǒng)的各種實施例提供面向HLA配型和PIRCHE配型的組合方法,由此向移植提供者提供唯一的服務,該服務搜索具有低風險的引起不利的同種異體反應的移植材料。本文中所述的系統(tǒng)的技術效果是不僅提高供體數(shù)據(jù)庫的查詢速度,而且提供更安全的移植材料,由此提高已經(jīng)接收同種異體材料移植的患者群體的健康水平。
在本發(fā)明的一個方面中,本文中所述的方法或系統(tǒng),其特征在于,從一個或多個供體配置來獲得與供體HLA值實體對應的信息??梢詫⒐w配置稱為“供體類型”,其涉及個別主體中可能發(fā)生的HLA等位基因和/或單體型的任何給定的潛在組合的電子的(理論的或者根據(jù)實際供體)表現(xiàn)。優(yōu)選地,將供體配置或類型存儲于另外的數(shù)據(jù)結構、數(shù)據(jù)庫、資料庫,和/或包括上述所有可能的供體類型的模擬。
在一個優(yōu)選實施例中,優(yōu)選地將供體配置存儲于另外的數(shù)據(jù)結構、數(shù)據(jù)庫、資料庫,和/或任何給定的一個或多個理論的或實際的供體的HLA值實體和/或肽實體的模擬。在一個實施例中,優(yōu)選地是將多個供體配置或供體類型存儲于供體數(shù)據(jù)結構、數(shù)據(jù)庫、資料庫和/或模擬,基本上包括對于基本上所有可能的基因型或者單體型和/或HLA等位基因的可能組合。
短語“基本上所有”在此背景下涉及大量的,優(yōu)選地所有或者每個已知的,等位基因組的蛋白質(zhì)變體。因此,該方法能夠有效地確定特定的供體或等位基因組是否確實與相對低的PIRCHE值相關聯(lián),并且因此將其本身呈遞為優(yōu)選的選擇。因為本領域的技術人員能夠基于所存儲的數(shù)據(jù)的可靠性,或者根據(jù)某一等位基因的群體頻率,在任何給定的等位基因組中,做出可能的蛋白質(zhì)變體的預選擇,所以該方法不限于等位基因組的所有已知蛋白序列的分析。在一個實施例中,該方法將包括等位基因組中的基本所有已知的(或相關的)蛋白質(zhì)序列的分析。
在該方面的一個優(yōu)選實施例中,本發(fā)明的方法或系統(tǒng)其特征在于,所述方法和/或系統(tǒng)使得能夠針對一個或多個供體配置,利用受體信息(優(yōu)選地與需要移植的生物受體對應)進行搜索,其中所述系統(tǒng)和/或方法的結果(效果)提供關于一個或多個(優(yōu)選地多個)最佳匹配的錯配供體配置的信息,優(yōu)選地是具有最低可能數(shù)量的PIRCHES的9/10錯配供體。
在一個實施例中,本發(fā)明的方法或系統(tǒng)其特征在于,所述方法和/或系統(tǒng)與供體材料的電子寄存器進行功能連接(例如,不具有存儲在PIRCHES上的信息的寄存器),其中根據(jù)前述權利要求的方法和/或系統(tǒng)的結果使得對于與所述結果對應的一個或多個最佳匹配的錯配供體材料,能夠將查詢從所述方法和/或系統(tǒng)的用戶端發(fā)送到所述寄存器。本發(fā)明優(yōu)選地將終端用戶(例如醫(yī)生或移植提供者)與包括關于所述供體材料的造血干細胞或其他供體材料寄存器進行鏈接。
在一個實施例中,本發(fā)明的方法或系統(tǒng)其特征在于,將體現(xiàn)HLA等位基因的任何給定組合(例如,稱為單體型或基因體)在任何一個或多個人類種群(諸如,年齡、性別、種族等)中的頻率的信息,并入到針對供體配置的每個潛在的HLA等位基因組合的所述配置中。
在一個實施例中,本發(fā)明的方法或系統(tǒng)其特征在于,基于利用“低”或“中”分辨率的HLA分型所確定的HLA等位基因的任何給定組合的已知群體頻率,經(jīng)由計算機實現(xiàn)的方法,將利用“低”或“中”分辨率的HLA分型所分型的供體材料的電子存儲HLA分型數(shù)據(jù),轉換為“高”分辨率的相似或類似的HLA分型狀態(tài),由此能夠利用如文中所述的系統(tǒng)和/或方法,查詢先前經(jīng)由“低”或“中”分辨率技術所獲得的HLA分型數(shù)據(jù)。
用于移植所存儲的大量供體樣品當前只進行“低”分辨率分型或“中”分辨率分型。當顯然不存在完全匹配的供體材料時,一些錯配的供體材料可能也適于移植。但是,搜索匹配供體的醫(yī)生在選擇用于移植的“低”或“中”分辨率分型的材料,或者進一步在移植前進行高分辨率分型中面臨著艱難任務。對于醫(yī)生來說,當面對“低”或“中”分辨率分型的供體信息時,確定如下問題仍然是挑戰(zhàn):哪一個供體最可能提供可接受的同種異體材料,或者哪一個錯配的等位基因組最可能與低風險的有害免疫反應相關聯(lián)。因此,本發(fā)明使得能夠進行“低”或“中”分辨率的HLA分型向“高”分辨率數(shù)據(jù)的轉換。
考慮到對于已經(jīng)遭受移植后不利的免疫反應的患者的巨大身體消耗,除了用于實現(xiàn)高分辨率分型的相對高的花費之外,用于預測安全移植材料,以及用于預測哪一個錯配的或潛在錯配的供體與低風險的不希望免疫反應相關聯(lián)的方法,對于醫(yī)學界至關重要。本文中所述的方法使得能夠減少需要進行的任何高分辨率分型的上游以及手術(或治療)的上游風險,由此分別避免患者、醫(yī)生和醫(yī)療機構的巨大健康消耗和經(jīng)濟費用。
在一個實施例中,本發(fā)明的方法或系統(tǒng)其特征在于,所述方法和/或系統(tǒng)包括:a)(優(yōu)選地是供體的)HLA分型數(shù)據(jù)的從“低”或“中”分辨率HLA分型到“高”分辨率數(shù)據(jù)的轉換,b)所述供體信息與受體HLA信息的HLA配型,以及c)根據(jù)本文中所述的系統(tǒng)和/或方法的PIRCHE配型。
本發(fā)明的另一個方面涉及一種方法或系統(tǒng),其特征在于,將體現(xiàn)HLA等位基因的任何給定組合(例如,稱為單體型或基因體)在任何一個或多個人類種群(諸如,年齡、性別、種族等)中的頻率的信息,并入到針對供體配置的每個潛在的HLA等位基因組合的所述配置中,其中優(yōu)選地是,基于利用“低”或“中”分辨率的HLA分型所確定的HLA等位基因的任何給定組合的已知群體頻率,經(jīng)由計算機實現(xiàn)的方法,將利用“低”或“中”分辨率的HLA分型所分型的供體材料的電子存儲HLA分型數(shù)據(jù),轉換為“高”分辨率的相似或類似的HLA分型狀態(tài),由此能夠利用如文中所述的系統(tǒng)和/或方法,查詢先前經(jīng)由“低”或“中”分辨率技術所獲得的HLA分型數(shù)據(jù)。
移植材料可以涉及用于移植的任何給定的生物材料。這樣的生物材料涉及用于移植的細胞、組織、血液、尤其是臍帶血、造血干細胞、或者其他前體細胞或干細胞群體、或者器官。
本發(fā)明的計算機實現(xiàn)使得能夠實現(xiàn)一種有效、快速且可靠的方法,該方法用于識別對于同種異體移植的潛在可允許的供體材料。能夠通過完全或部分自動的方式來處理軟件所處理的數(shù)據(jù),由此使得能夠在優(yōu)選實施例中實現(xiàn)自動的計算機實現(xiàn)的方法。除了針對每個供體-受體對所確定的PIRCHES的數(shù)量之外,關于受體和供體的HLA分型的數(shù)據(jù)能夠被電子存儲并且最終被保持在合適的數(shù)據(jù)庫中。因此,本發(fā)明也涉及能夠實現(xiàn)本文中所述的方法的計算機軟件。本發(fā)明還涉及用于預測移植之后針對人類白細胞抗原(HLA)的免疫反應的優(yōu)選計算機自動實現(xiàn)的方法,其中PIRCHES的數(shù)量與不利的免疫反應的風險相關聯(lián)。
該系統(tǒng)優(yōu)選包括具有所有已發(fā)布的HLA等位基因的信息的一個或多個數(shù)據(jù)庫。當公布新的HLA等位基因序列時,可以對該數(shù)據(jù)庫進行更新。除了調(diào)用所需的各個程序之外,基于任何給定計算語言的計算機軟件也能夠用于生成和/或更新數(shù)據(jù)庫。
本發(fā)明還包括一種用于優(yōu)選地在移植之前預測針對人類白細胞抗原(HLA)的免疫應答的系統(tǒng),其中的免疫應答可能在移植之后發(fā)生。該系統(tǒng)可以包括計算設備、數(shù)據(jù)存儲設備和/或適當?shù)能浖?,例如相互交互以實現(xiàn)本文中所述的方法的單獨軟件模塊。
在一個實施例中,該系統(tǒng)可以包括臍帶血庫的數(shù)據(jù)庫(databanks或者databases),由此針對HLA分型來測試每個樣品并且將信息進行電子存儲。該系統(tǒng)也包括在另外的計算設備之間的連接,例如診所、移植中心或醫(yī)院的設備,在其中存儲受體的HLA分型數(shù)據(jù)。通過多個數(shù)據(jù)庫之間的連接,例如在因特網(wǎng)上,本發(fā)明的方法能夠利用適當?shù)能浖韺崿F(xiàn)??梢詫⒍鄠€潛在供體樣品與患者的HLA分型進行比較,并且確定針對任何給定的供體-受體對的PIRCHE的數(shù)量。鑒于基于本文中所述的方法的分析,能夠做出任何給定的供體材料(例如,臍帶血庫或其他細胞或組織庫中所存儲的那些樣品)是否適合于移植的臨床相關的預測。
在一個實施例中,本發(fā)明涉及本文中所述的一種方法,其中在如下HLA亞型上執(zhí)行HLA分型:HLA-A、HLA-B、HLA-DRB1、HLA-C、HLA-DQB1、HLA-DPB1、-DQA1、-DPA1、-G、-E、-F、MICA、MICB和/或KIR。
在一個實施例中,本發(fā)明涉及本文中所述的一種方法,其中在HLA-A、-B、-C、-DRB1、-DQB1上執(zhí)行HLA分型。這5個等位基因提供了通常所使用的術語“9/10匹配”的基礎,該術語參考9/10匹配的不相關供體。在此情況下,這5個基因的10個等位基因中的9個顯示出匹配,但是仍有一個等位基因錯配。因此,本發(fā)明使得能夠,在優(yōu)選實施例中,確定來自這樣的9/10匹配的不相關供體的材料的使用是否安全,即該錯配對于移植而言是否可允許。
本發(fā)明還涉及本文中所述的方法,該方法用于在存在多于9/10情況的錯配的供體樣品中的可允許HLA錯配。本發(fā)明所包括的潛在供體的一個示例是單體型相合的(Haploidentical)供體,可以利用本文中所述的方法針對可允許的錯配供體材料對該供體進行檢測??梢詫误w型相合的相關供體描述為與患者具有“50%匹配”的供體。這種類型的供體能夠是父母、同胞或子女。通過限定,由于基因物質(zhì)的一半來自每個父母,所以父母或者父母的子女通常是單體型相合的供體。存在50%的可能性同胞是單體型相合的供體。因為90%的父母有單體型相合的家庭成員,所以單體型相合HSCT向更多的人提供HCT的選擇。其他的優(yōu)勢包括:供體立即可獲得;不管種族背景對于所有父母的同等機會;在多個供體之間選擇的能力;以及如果需要獲得另外的細胞的能力??商鎿Q地,臍帶血單元(CBU)可能未顯示出高等級的HLA配型,但是如果這些錯配通過本文中所描述的方法確定是可允許的,仍然適合移植。CBU通常最低為4/6匹配,但是這種匹配能夠在同種異體層次上產(chǎn)生4/10或5/10的情況。
考慮到本文中所描述的方法一定程度上依賴共享的HLA,最少的HLA配型是一個等位匹配。雖然這對于HSCT來說不可能發(fā)生,但是由于可得到的供體材料的數(shù)量有限,這樣的情況對于器官移植來說頻繁發(fā)生。因此,本發(fā)明能夠在具有最少一個等位基因匹配的錯配樣品上執(zhí)行。因此,該錯配供體可以涉及1/10、2/10、3/10、4/10、5/10、6/10、7/10、8/10、9/10或10/10(DP錯配)匹配。如果測試另外的等位基因,供體也可以顯示出任何其他種類的錯配,由此存在至少一個等位基因匹配。對于移植而言優(yōu)選的是具有顯著HLA配型的供體。如果另外的等位基因經(jīng)過分型,因此供體能夠是例如11/12匹配或13/14匹配。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中HLA分型包括血清和/或分子分型。在優(yōu)選實施例中,本發(fā)明涉及本文中所述的方法,其中利用基于序列的分型以高分辨率級別來執(zhí)行HLA分型。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中HLA分型包括針對HLAI類等位基因的外顯子(exon)1-7的序列以及針對HLAII類等位基因的外顯子1-6的序列。在一個實施例中,本發(fā)明涉及本文中所述的方法,其中HLA分型包括針對HLA II類等位基因的外顯子2以及針對HLA I類等位基因的外顯子2和外顯子3的高分辨率HLA-A、-B、-C、-DRB1、-DQB1分型。這些特定的HLA分型方法被描述在本文中所提供的示例中,并且展示出超過早期分型方法的優(yōu)勢,提供對于需要進行分型從而識別其錯配的等位基因的完全覆蓋。
具體實施方式
歷來,HSCT之后的同種異體反應性被認為主要是由于供體T細胞對于HLA差異的直接識別而引起的.意思是移植物T細胞識別錯配HLA,該錯配HLA被表達為宿主細胞的細胞表面的完整分子。但是本發(fā)明特別地基于間接識別。當在共享HLA上將從錯配的宿主HLA等位基因所獲得的肽進行處理并且呈遞,因而被供體T細胞識別時,會引起同種異體反應性。
肽與HLA分子的結合是可預測的。預測出的結合親和性與實驗測量結果之間的差異已經(jīng)被表明與不同實驗室之間的測量結果的差異一樣小。因為HLAI類分子對于九個氨基酸長度的肽(9-mers)具有更嚴格的偏好,并且需要特定的氨基酸作為錨定殘基(anchor residue)位于明確定義的錨定位,所以對于這些分子的可預測性特別高。因為不同長度的肽能夠利用不同位置作為錨定殘基來結合,所以對于HLA II類分子的可識別性較低。因此,難以確定肽如何與HLA II類結合槽進行對準,以及肽中的哪一個氨基酸殘基優(yōu)選作為錨點。為了解決這個技術問題,Nielsen等人使用所謂的“核心預測器(core predictor)”來估計肽如何在II類結合槽中定位。核心預測器使得被稱為NetMHCII的準確的HLA II類預測器得以開發(fā)。
雖然在預測肽與I類和II類HLA分子的肽結合取得了進展,但是在對于供體特異性抗體(DSA)的產(chǎn)生和同種異體反應性中所包括的因素進行評估中仍然存在著很大的不確定性??紤]到當前可用于預測腎臟移植之后的不需要的免疫反應的工具,存在如下需要:提供用于在移植之前評估潛在的不利的反應的更可靠的方法。
概念上而言,錯配的指向HLA的T細胞同種異體反應性是由于HLA差異的直接識別和間接識別引起的。目前為止,旨在解釋和預測對于錯配HLA的臨床同種異體反應性的研究主要集中于HLA差異的直接識別。直接識別包括對于負載非多態(tài)性肽的完整的錯配HLA分子進行識別的供體T細胞。當HLA等位基因引發(fā)肽結合槽的差異時,所呈遞的HLA分子的肽庫(peptide repertoire)會在本質(zhì)上不同。這些不同的肽庫可以引發(fā)T細胞應答。HistoCheck算法在肽結合槽或連接T細胞受體的區(qū)域確定HLA分子的結構差異,從而預測差異評分。但是利用HistoCheck所獲得的差異性評分也與同種異體反應性無關,既不是在體外,也不是在體內(nèi)。
T細胞相關的同種異體反應性也能夠潛在地由錯配HLA等位基因的間接識別來引發(fā)。已經(jīng)針對次要組織相容性(H)抗原對于間接識別進行了詳細地研究。這些HLA呈遞的多態(tài)性蛋白質(zhì)的錯配與aGVHD的風險增加以及復發(fā)的風險降低相關聯(lián)。類似于源自次要H錯配的肽,源自錯配HLA分子的肽也能夠由HLA來呈遞。
錯配HLA抗原的間接識別會引起T細胞相關的同種異體反應性。在間接識別期間,T細胞識別通過共享的(匹配的)HLA分子所呈遞的源自多態(tài)性HLA抗原的肽。源自多態(tài)性HLA抗原的肽經(jīng)常由HLA來呈遞。已經(jīng)將這些可間接識別的HLA表位與實體器官移植中的急性和慢性的移植物失敗進行關聯(lián)。因此,在自身HLA的環(huán)境下間接識別錯配HLA的T細胞在臨床同種異體反應性中起到了重要作用。
因此,本發(fā)明指定被預測呈遞為預測的可間接識別的HLA表位(Predicted Indirectly ReCognizable HLA Epitopes,PIRCHES)的HLA衍生表位。本發(fā)明分別識別由共享的HLAI類所呈遞的PIRCHES(PIRCHES-I)和由共享的HLA II類所呈遞的PIRCHES(PIRCHES-II)。PIRCHES-II被示出誘導腎臟移植之后的同種異體反應性;HLA-DR所呈遞的PIRCHES與供體特定的HLA IgG抗原的從頭發(fā)展相關。
因此,本發(fā)明基于如下發(fā)現(xiàn):HLA衍生肽的識別影響HLA錯配的HSCT之后的臨床同種異體反應性。為此,能夠評估所預測的PIRCHES-I和PIRCHES-II的數(shù)量以及它們在HSCT的各種臨床效果中的影響?;谶@樣的研究,本發(fā)明描述了能夠在HSCT以及其他細胞或器官移植之前預測非容許的HLA錯配的普遍適用方法。
現(xiàn)有技術的方法,諸如評估錯配之間的結構匹配度的HLAMatchmaker,未提供用于預測性確定不需要的免疫反應的風險的有效方法.HLAMatchmaker考慮能夠引發(fā)HLA抗體的HLA抗原上的表面的結構基礎。它通過如下方式進行:將HLA I類抗原視為短序列的組合(三元組,triplets),確定這些三元組之間的差異。三元組的錯配度不與aGVHD顯著相關?,F(xiàn)有技術的另一種方法由Spellman和Askar及同事進行評估的HistoCheck,基于在HLA分子內(nèi)的位置和蛋白質(zhì)中的氨基酸的功能相似性將HLA等位基因產(chǎn)品之間的氨基酸差異進行評價。利用該評價系統(tǒng)所獲得的差異性評分不預測aGVHD。
由于利用計算機方法的先前嘗試不能預測GVHD,本發(fā)明的方法代表如下的第一計算機實現(xiàn)方法之一:該方法利用對于不需要且潛在地危險免疫應答的可靠而高效的移植前預測,提供針對HSCT的改進的供體選擇。而且,先前的嘗試是利用通常評價HLA分子之間的結構/功能差異來進行的(即,基于HLA差異的直接識別或者經(jīng)由抗體進行識別的可能性),本發(fā)明優(yōu)選地是基于HLA錯配分子的預期間接識別。本發(fā)明的方法令人驚訝地適合于預測同種異體反應性,這在以前是不可能的。因此,本發(fā)明基于如下關鍵原則:預測的間接識別的HLA表位(PIRCHES)與移植之后的不需要的免疫應答的可能性相關。
因此,本發(fā)明體現(xiàn)了同種異體反應性的風險與共享HLA分子所呈遞的錯配HLA衍生肽的數(shù)量增加之間的關系的技術應用。這些數(shù)量能夠優(yōu)選地在計算機中進行確定,并且能夠被用作關于同種異體反應性(例如,GVHD)的發(fā)病的預測標記。
本發(fā)明提供了一種優(yōu)選由計算機實現(xiàn)的方法,該方法在無法找到完全匹配的供體時,在不需要繁重的相容性檢測的情況下,確定哪一個供體適于移植。本發(fā)明例如適用于多個移植設置,諸如干細胞、臍帶血細胞或實體器官移植及其他。本發(fā)明基本包括了HLA配型在確定移植后的同種異體反應性或組織排斥性中發(fā)揮作用的任何移植。
考慮到患者由于移植后的不需要的免疫應答所遭受的巨大的健康損害,預測可安全移植的材料的方法對于醫(yī)學界至關重要。如本文中所述的方法能夠使得手術(或治療)的上游風險減少,因此分別避免患者、醫(yī)生和機構的大量健康花費和經(jīng)濟花費。
因此,在一個實施例中,本發(fā)明涉及用于預測移植之后對于人類白細胞抗原(Human leukocyte antigens,HLA)的免疫應答的方法,其中的免疫應答與供體和受體之間HLA錯配的相關聯(lián)(優(yōu)選地,所引發(fā)),其中基于序列分型、優(yōu)選地以高分辨率等級來進行對于供體和受體的HLA分型以便確定錯配,通過確定源于錯配的受體和/或供體HLA等位基因的肽的呈遞和/或結合,利用計算機實現(xiàn)的方法來識別預測的間接識別HLA表位(PIRCHES)的數(shù)量,由此PIRCHES的數(shù)量與所述的免疫應答的可能性相關。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述移植包括造血干細胞移植(HSCT)。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述移植包括臍帶血或者臍帶血細胞移植。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述移植包括腎臟移植。
本發(fā)明的方法也可以用于預測其他醫(yī)學病癥(諸如二次復發(fā)性流產(chǎn))情況下的不需要的免疫應答、孕期的抗體形成,或者用于在角膜移植之前評估風險。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述免疫應答包括不需要的同種異體反應性。
在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述免疫應答包括T細胞介導的應答(同種異體反應性)。在一個實施例中,本發(fā)明涉及本文中所述的方法,其中所述免疫應答導致急性移植物抗宿主病(aGVHD)或慢性移植物抗宿主病(cGVHD)。
基于圖形數(shù)據(jù)結構的本發(fā)明的計算機實現(xiàn)啟用一種用于識別針對同種異體移植的潛在允許供體材料的有效、快速、可靠方法。軟件所處理的數(shù)據(jù)能夠以完全或部分自動的方式進行處理,由此在優(yōu)選實施例中啟用一種自動由計算機來實現(xiàn)的方法。除了針對任何供體-受體對所確定的PIRCHES的數(shù)量以外,與供體和受體的HLA分析有關的數(shù)據(jù)被電子存儲和保持在合適的圖形結構數(shù)據(jù)庫中。
在一個實施例中,該系統(tǒng)包括臍帶血庫的數(shù)據(jù)庫,由此針對HLA分型對于每個樣品進行測試,并且將信息進行電子存儲。該系統(tǒng)也包括與另外的計算設備(諸如診所、移植中心或醫(yī)院的設備)之間的連接,其中存儲受體的HLA分型數(shù)據(jù)。通過兩個數(shù)據(jù)庫之間的連接,例如在因特網(wǎng)上,本發(fā)明的方法能夠利用適當?shù)能浖韺崿F(xiàn)??梢詫⒍鄠€潛在供體樣品與患者的HLA分型進行比較,并且確定針對任何一個特定供體-受體對的PIRCHE的數(shù)量。根據(jù)基于本文中所述的方法的分析,能夠做出給定供體材料(例如,臍帶血庫或其他細胞或組織庫中所存儲的那些樣品)是否適合于移植的臨床相關的預測。本發(fā)明還涉及適合于實現(xiàn)本文中所描述的方法的軟件。
根據(jù)本方面,術語“預測(predication)”意思是關于未來可能發(fā)生的事件的描述.也可以使用術語“預報(forecast)”?!邦A測”從本發(fā)明的意義上來說代表對于移植之后發(fā)生免疫應答的風險或可能性的評估?;谠擃A測或風險評估,能夠在潛在有害事件發(fā)生之前獲得有價值的信息,這些信息能夠用于確定進一步的治療方法。
本發(fā)明中的術語“免疫應答”涉及如本領域技術人員所通常理解的免疫應答。免疫應答可以被理解為當抗原被識別為外源時所發(fā)生的源于免疫系統(tǒng)的一部分對于該抗原的應答,優(yōu)選地是該免疫應答隨后引發(fā)能夠破壞或固定“外源”抗原或使其無害的抗體和/或淋巴細胞的產(chǎn)生。本發(fā)明的免疫應答可以與受體的免疫系統(tǒng)對于被移植材料的應答相關,或者可以與被移植的細胞、組織或器官的細胞所引起的免疫應答相關(例如,在GVHD中移植材料的T細胞反抗和/或攻擊受體抗原或組織).免疫應答可以是保護機體抵抗外源物質(zhì)(諸如,外源組織)的受體的防御功能,或者是被移植的材料的免疫細胞對于受體細胞或組織的反應。
人類白細胞抗原(HLA)系統(tǒng)是人類的主要組織相容性復合體(major histocompatibility complex,MHC)。這個超位點包括與人類的免疫系統(tǒng)功能相關的大量基因。該基因組位于第六號染色體,并且編碼細胞表面的抗原呈遞蛋白,并具有一些其他功能。某些基因所編碼的蛋白由于它們作為器官移植中的因素的歷史發(fā)現(xiàn)也被認為是抗原。主要HLA抗原是免疫功能的主要要素。與MHC I類(A、B和C)對應的HLA呈遞來自細胞內(nèi)部的肽(如存在,包括病毒肽)。這些肽產(chǎn)生自蛋白酶體中所分解的被消化的蛋白質(zhì)。通常,這些特定的肽是小型聚合物,長度約9個氨基酸。外源抗體對于破壞細胞的殺傷T細胞(也稱為CD8陽性或細胞毒性T細胞)進行攻擊。與MHC II類(DP、DM、DOA、DOB、DQ以及DR)對應的HLA將來自細胞外部的肽呈遞到T淋巴細胞.這些特定的抗原刺激輔助性T細胞的增殖,反過來輔助性T細胞刺激產(chǎn)生抗體的B細胞以產(chǎn)生針對特定抗原的抗體。
MHC基因座是哺乳動物中的最多遺傳多變的編碼基因座中的一些,人類HLA基因座也不例外。大多數(shù)的HLA基因座針對每個基因座表現(xiàn)一打或更多的等位基因組。六個基因座具有在人類種群中已檢測到的超過100個等位基因。其中,最多變的是HLA-B和HLA-DRB1。
等位基因是位于基因座上的核苷酸(DNA)序列的變體,如此每個等位基因通過至少一個(單核苷酸多態(tài)性,SNP)位點不同于其他等位基因。這些變化中的多數(shù)會導致氨基酸序列的變化,而氨基酸序列的變化導致蛋白質(zhì)中的主要功能差異。
“HLA”是指位于染色體6p21的人類白細胞抗原,包括用于確定例如組織移植物的受體和供體之間的匹配度的HLA基因(HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1等)?!癏LA等位基因”意為兩個親代染色體中的一個染色體上的基因座中的核苷酸序列。
“HLA分型”意為識別給定位點的HLA等位基因(HLA-A、HLA-B、HLA-C、HLA-DRB1、HLA-DQB1等)??梢詮膩碜怨w和/或受體的血液或其他身體樣品中獲取樣品,隨后對其進行分析。
血清學分型(serotyping,利用抗體識別細胞表面的HLA蛋白)是HLA分型的初始方法,并且仍然被一些中心所使用。表型分型(phenotyping)與針對分型的血清學方法相關。該方法在明確HLA多態(tài)性的方面能力有限,并且與錯誤識別HLA類型的風險相關聯(lián)?,F(xiàn)代的分子學方法更普遍地用于個體的基因型。利用該方法,使用對于DNA的變化區(qū)域特定的PCR引物(稱為PCRSSP)。如果找到合適大小的產(chǎn)品,假設已經(jīng)識別出HLA等位基因/等位基因組。PCR-SSO也用于并入探針雜交。關于HLA分型的技術方法的綜述被提供于以下兩篇文獻:Erilich H,Tissue Antigens(組織抗原),2012年,七月,80(1),頁:1-11,和Dunn P,Int J Immuogenet(國際免疫遺傳學雜志),2011,十二月,38(6),頁:463-73??梢詰没驕y序,并且可以與如下方法關聯(lián):傳統(tǒng)方法,諸如Maxam-Giblert測序法、鏈終止測序法(Chain-termination sequencing);高級方法和從頭測序法,諸如鳥槍法測序(shotgun sequencing)或酶鎖鏈反應法(bridge PCR);或者所謂的“下一代”方法,諸如大規(guī)模并行信號測序法(massively parallel signature sequencing,MPSS)、454焦磷酸測序法(pyrosequencing)、伊魯米那(Illumina或Solexa)測序法、SOLiD測序法以及其他類似方法。
對于HLA分型,從供體本身和/或從之前的供體材料所獲得的樣品,在針對移植的分離/準備期間或之后,可以用于HLA測序,以及隨后與來自受體的HLA分型數(shù)據(jù)進行比較。例如,供體本身的HLA分型可以通過分析唾液、血液或其他體液以獲取HLA信息的方式來進行,可選地、另外地或替換地,在HLA分析期間,可以針對相同和/或互補的HLA類型特征對于旨在移植的從供體所獲得的材料(供體材料)進行分析。
“HLA錯配”被定義為識別供體和受體中的不同的等位基因,其存在于任何給定的等位座中。
根據(jù)本發(fā)明,術語“兩段式特定HLA蛋白分型”關于WHO委員會在2010年正對HLA系統(tǒng)的各個因素所制訂的標準化HLA命名系統(tǒng)。根據(jù)該HLA命名系統(tǒng),進行如下的命名:HLA-基因*段1:段2:段3:段4-后綴。基因涉及HLA基因座(A、B、C、DRB1、DQB1等)。段1涉及等位基因組。段2涉及特定HLA蛋白。段3涉及編碼區(qū)內(nèi)的同義DNA取代。段4用于表示非編碼區(qū)中的差異。后綴用于表示基因表達中的特定特征。
“兩段式特定HLA蛋白分型”中的“兩段式”涉及根據(jù)本文中所使用的標準化WHO命名的段1和段2的HLA分型信息的存在。由于這種分型為本文中所處理的免疫應答提供關于特定蛋白序列的相關信息,因此這種分型通常被稱為“高分辨率分型”或“特定HLA蛋白分型”。
術語“HLA等位基因組”分型涉及只針對HLA基因(基因座)和段1所提供的分型信息。該分型通常被稱為“低分辨率”分型。根據(jù)本發(fā)明,任何血清分型都將被轉變?yōu)榉肿拥摹暗头直媛省狈中汀?/p>
術語“中等分辨率”或“中間分辨率”涉及某些種類的分型信息,其中一些等位基因或等位基因串的存在已經(jīng)通過所使用的分型方法在患者/供體中進行定義。NMDP命名是描述這種級別的分型的一種方法。例如,A*01:AB涉及等位基因01:01或等位基因01:02(01:01/01:02),而患者/供體是這兩個等位基因之一。在一些情況中,NMDP等位基因編碼是通用的,其中一個編碼可以包括位于給定HLA基因座的一些可能的HLA序列(等位基因)。雖然可以對于供體材料進行HLA分型,但是一些NMDP編碼不提供在任何給定HLA實際呈遞哪一個特定蛋白質(zhì)的信息。這種分型信息被稱為中等分辨率分型。
供體通常被理解為提供用于在受體中進行移植的供體材料(或者換言之生物材料,諸如但不限于細胞、組織、器官或其他身體部分、流體和/或制劑)的一個個體或多個個體(例如如下情況:為了有效的治療相關量的用于移植的供體材料,需要多個樣品或制劑,諸如臍帶血單元(CBU))。對于供體或者供體的HLA分型的參考也可以分別涉及供體材料或供體材料的HLA分型。
本方法的對象受體通常是哺乳動物,優(yōu)選地是人。受體通常是遭受具有需要移植的特征的病癥(諸如需要進行移植的器官衰竭)的患者。通過術語“器官”,意思是包括任何身體結構或細胞組,其中包含被組織起來以實現(xiàn)機體特定功能的不同組織,例如心臟、肺、腦、腎臟、皮膚、肝臟、骨髓等。在一個實施例中,移植物是同種異體移植物,即個體和供體是相同種類的。受試者也可能處于如下情況:即使當癥狀本身未被確診為缺乏或喪失內(nèi)源性細胞的特定子集的功能,但是能夠通過細胞移植進行治療。一些疾病是可以通過移植某種干細胞來治愈的,因此這些細胞的天然或內(nèi)源池未必在受體中起作用。
本發(fā)明的方法特別適用于將要接收或被預測需要細胞、組織或器官移植的患者,來預測不利的免疫應答的可能性,諸如源移植物損傷或排異反應,和/或對于非移植物組織的免疫起源損傷。例如,預期該患者將在接下來的一個月、兩個月、三個月、四個月、五個月、六個月或十二個月后接收移植。可替換地,該測定方法適用于已接收移植來預測源移植物損傷或排異反應,和/或對于非移植物組織的免疫起源損傷的個體。移植之后,該方法特別適用于表現(xiàn)出(移植體器官的)急性器官功能障礙或疑似移植體宿主病(GVHD)的跡象的患者,特別是慢性GVHD以及其中移植物是骨髓移植的情況。
移植是出于替換受者損傷或缺失器官的目的,或者出于提供能夠提供治療效果的干細胞、其他細胞、組織或器官的目的,將細胞、組織或器官從一個身體(供體)到另一個身體(受者或患者)的移動,或者是在患者自身的身體上的一個供體位置到另一個位置,或者是從被存儲的供體材料到受者身體。
同種異體移植或同種移植是細胞、組織或器官從同種類的基因不同的供體到受體的移植。移植物被稱為同種異體移植體、同種異系移植體、或同種移植體。大多數(shù)的人體組織和器官移植都是同種異體移植體。同種異體移植體能夠來自活體源或者遺體源。通常,能夠進行移植的器官是心臟、腎臟、肝臟、肺、胰腺、腸以及胸腺。組織包括骨骼、肌腱(統(tǒng)稱為肌骨骼移植物)、角膜、皮膚、心臟瓣膜、神經(jīng)以及血管。
本發(fā)明還包括在篩查經(jīng)由再生藥物所產(chǎn)生的器官、細胞或組織的情景中的方法的使用,例如已經(jīng)在體外進行構造并且用于移植的重構供體材料。干細胞技術使得能夠在體外產(chǎn)生大量醫(yī)學相關的細胞類型或組織。因此,本發(fā)明也能夠用于檢測已經(jīng)通過生物工程和/或組織工程方法生產(chǎn)出的同種異體材料在移植中的適用性。
本發(fā)明包括免疫反應的風險的評價,優(yōu)選地是移植前的風險評價,由此可以將任何給定的干細胞視為用于移植的供體材料。例如,造血干細胞移植(HSCT)是通常源于骨髓、周圍血或臍帶血的多潛能造血干細胞的移植。它是血液學和腫瘤學領域中常見的醫(yī)療過程,最經(jīng)常針對具有某些血液或骨髓癌癥(諸如骨髓瘤或白血病)的病人來執(zhí)行。在這些情況下,通常在移植之前利用輻射或化學療法對于受體的免疫系統(tǒng)進行破壞。感染和移植體抗宿主病是同種異體(allogenic,也稱為allogeneic)HSCT的主要并發(fā)癥。
可以將干細胞理解為未分化的生物細胞,其可以分化為特化細胞,并且能夠(通過有絲分裂)分開以產(chǎn)生更多造血干細胞。高度可塑的成體干細胞通常用于藥物治療,例如在骨髓移植中。現(xiàn)在,能夠通過細胞培養(yǎng)來人工培育造血干細胞,并且將其轉變(分化)為具有與各種組織(諸如,肌肉或神經(jīng))的細胞一致的特征的特化細胞類型。潛在的干細胞移植可以涉及任何給定的干細胞療法,因此存在著很多干細胞療法。醫(yī)學研究人員預期成體和胚胎干細胞將很快能夠治療癌癥、1型糖尿病、帕金森病、亨廷頓病、乳糜瀉、心功能衰竭、肌肉損傷和神經(jīng)紊亂以及其他疾病。
干細胞也稱為體干細胞和生殖系干細胞,能夠在兒童以及成人中找到。多潛能的成體干細胞很稀有,通常數(shù)量少但是能夠在包括臍帶血的一些組織中找到。已經(jīng)發(fā)現(xiàn)骨髓是成體干細胞的豐富的源之一,其已經(jīng)用于治療一些癥狀,包括脊髓損傷、肝硬化、慢性下肢缺血以及終末期心衰。成體干細胞可以是血細胞系限制的(多潛能的),并且通常通過它們的組織起源(間充質(zhì)干細胞、脂肪干細胞、內(nèi)皮干細胞、牙髓干細胞等)來命名。
多潛能的干細胞也被發(fā)現(xiàn)在羊水中。這些干細胞非?;钴S,在沒有供給的情況下廣泛擴張并且是非致腫瘤的。羊水干細胞是多潛能的,能夠分化為成脂細胞、成骨細胞、肌源細胞、內(nèi)皮細胞、肝細胞、以及神經(jīng)系。可以針對供體或針對自體同源的使用來收集羊水干細胞。
臍帶血衍生的多潛能造血干細胞顯示出胚胎和造血特性。表型特征表示(CB-SCs)顯示胚胎細胞標記(例如,轉錄因子OCT-4和Nanog,特異性胚胎抗原(SSEA)-3和SSEA-4)和白細胞共同抗原CD 45,但是它們對于血細胞譜系而言是陰性的。另外,CB-SC顯示出非常低的免疫原性,如非常低水平的主要組織兼容性復合物(MHC)抗原并且不能刺激同種異體淋巴細胞的增值的表達所示。
HSC通常可以從骨髓、外圍血干細胞、羊水或臍帶血獲得。在骨髓移植的情況下,HSC是從供體的大骨被移出,通常是盆骨,通過到達大骨中心的大針來進行。該技術被稱為骨髓采集,在全身麻醉的情況下進行.外圍血干細胞是同種異體HSCT的干細胞的常見來源。它們能夠通過被稱為分離(apheresis)的過程從血液被收集。供體的血液通過手臂上的無菌針來排出,并且通過移除白細胞的設備??梢詫⒓t細胞返回給供體。外周干細胞產(chǎn)量可以利用每天皮下注射粒細胞菌落刺激因子來增加,其中粒細胞菌落刺激因子用于將干細胞從供體骨髓移動到外周循環(huán)。
也能夠從羊水提取造血干細胞。臍帶血是從出生后嬰兒的臍帶血和胎盤來獲得的。臍帶血具有高于通常在成體血液中所找到的HSC的濃度。但是,從臍帶血所獲得的血的少量(通常約50ml)使其與成人相比更適合于向小孩的移植。但是可以使用多個單元。利用臍帶血單元的體外擴增或者使用來自不同供體的兩個臍帶血單元的更新的技術使得臍帶血移植能夠在成人中使用。臍帶血能夠從新生兒的臍帶血中進行收集。
與其他器官不同,骨髓干細胞能夠被長期冷凍(低溫保藏)而不破壞過多的細胞。這對于自體HSC是必要的,因為這些細胞通常是移植手術之前的數(shù)月從受體中收集而來的。在同種異體移植的情況下,為了避免冷凍和解凍過程期間可能發(fā)生的細胞損失,優(yōu)選的是新鮮的HSC。同種異體的臍帶血通常被冷凍保存在臍帶血庫中,因為其只能在分娩時可獲得。為了低溫保藏HSC,必須添加防腐劑DMSO,并且細胞必須在可控速的冰箱中被非常慢地冷卻,以防止在冰晶形成期間發(fā)生滲透細胞損傷。HSC可以在通常使用液氮的低溫冷凍柜中被存儲數(shù)年。鑒于此,本發(fā)明涉及已經(jīng)如文中所述進行存儲的供體材料在被考慮用于移植之前的分型和風險評估。
本發(fā)明包括免疫反應的風險評估,優(yōu)選的是移植前的風險評估,由此可以將任何給定的器官或組織視為用于移植的供體材料。例如,腎臟移植或與腎臟相關的移植是將腎臟植入患者(例如,患有晚期腎臟相關疾病)的器官移植。根據(jù)供體器官的來源,腎臟移植通常被分為已故供體(原名為尸體)移植或活體供體移植。根據(jù)供體與受體之間是否存在生物學關系,活體移植通常被進一步稱為相關(活體相關)移植或非相關(活體非相關)移植。
同種異體反應性被定義為淋巴細胞或者抗體與同種異體抗原的反應,其中同種異體抗原可以被理解為來自外源材料的抗原。同種異體抗原識別可以經(jīng)由直接或間接的同種異體抗原識別來發(fā)生,由此T細胞可以識別同種異體抗原并且潛在地導致器官移植之后的移植排異反應。
移植物抗宿主病(GVHD)是伴隨同種異體細胞、組織或器官移植的相對常見的并發(fā)癥。它通常與干細胞或骨髓移植相關聯(lián),但是該術語也適用于其他形式的組織移植物或器官移植。組織(移植物)中的免疫細胞(通常為白細胞)將受體(宿主)識別為“外源”。接著,被移植的免疫細胞攻擊宿主的體細胞。如果所使用的血液產(chǎn)品未經(jīng)輻照,GVHD也可以發(fā)生在輸血之后。
蛋白酶體是在所有真核細胞和古細菌內(nèi)部存在的,在一些病毒中也存在的蛋白質(zhì)復合物。在真核細胞中,它們位于細胞核和細胞質(zhì)。蛋白酶體的主要功能是通過蛋白酶解(破壞肽鍵的化學反應)來降解不需要的或受損的蛋白質(zhì)。由MHC I類分子所呈遞的大多數(shù)抗體肽是由蛋白酶體對于細胞內(nèi)部的蛋白質(zhì)的降解所產(chǎn)生的。錯配HLA抗原的蛋白酶體降解能夠通過文中所描述的計算工具來進行預測.
附圖說明
圖1:肽的切割和結合的模擬的示意圖
圖2:圖形數(shù)據(jù)結構的示意圖。從功能角度,算法的核心數(shù)據(jù)結構包括HLA值、肽以及這些實體之間的關系。
圖3:圖形數(shù)據(jù)結構的示例包括肽節(jié)點以及HLA值實體,并且“具有”或“呈遞”所述實體之間的關系。
圖4:優(yōu)選地經(jīng)由服務整合管理器(表現(xiàn)層)進行組合的HLA配型和PIRCHE配型軟件模塊的示意圖。
圖5:提供作為示例的潛在系統(tǒng)構架的更詳細總覽。
圖6:提供本發(fā)明的軟件實現(xiàn)的示意圖,具體是與基于網(wǎng)絡的SaaS(網(wǎng)絡即服務)鏈接的PIRCHE模塊,與醫(yī)療咨詢委員會進行組合。
示例
圖形數(shù)據(jù)結構的相關信息
本發(fā)明的圖像數(shù)據(jù)結構基本上包括所有的MHC I類HLA等位基因,并且對于每個等位基因列出具有針對蛋白酶體切割預測的評分值的所有可能的肽。在一個實施例中,預測是基于NetChop C term 3.0預測方法。該信息包括:
·HLA-ID:如IMGT/HLA數(shù)據(jù)庫中所定義的HLA等位基因的ID(訪問號)
○示例:HLA00005
·肽:長度為5至15個氨基酸,優(yōu)選地是7至11個氨基酸,更優(yōu)選地是9個氨基酸的肽。MHC I類所呈遞的肽的最常見長度是7至11個氨基酸。
○示例:MAVMAPRTL(SEQ ID NO 1)
·切割評分:表示針對肽的切割預測的從0.00到1.00的值
○對于MAVMAPRTL(SEQ ID NO 1)的示例評分值:0.583079
○越高的值表示越高的切割可能性。
該評分體現(xiàn)肽與它所來源于的HLA等位基因之間的關系屬性。
除了可以導致肽切割的原始HLA等位基因之外,該數(shù)據(jù)結構還包括可能通過任何給定的MHC I類或MHC II類HLA等位基因所呈遞的所有肽的關系。針對每個可能被呈遞的肽,列出了體現(xiàn)結合親和力的IC 50評分(優(yōu)選地是通過NetMHCpan來生成),其被認為是肽與它被給定的HLA等位基因進行呈遞的可能性之間的關系屬性。
·IC 50評分:表示肽的結合親和力的從0.00到2000.00的值
○MMVLQVSAA(SEQ ID NO 2)的示例評分值:285.57
○越低的值表示越高的親和力。
針對HLAII類分子可以呈遞下面的信息:
·肽:長度優(yōu)選為15個氨基酸的肽。MHC II類分子所呈遞的抗原通常要長于I類分子所呈遞的抗原。因此,對于結合預測,使用15個氨基酸的長度。
○示例:RAYLEGTCVDGLRRY(SEQ ID NO 3)
·評分:表示肽的結合親和力的從0.00到2500.00的值
○RAYLEGTCVDGLRRY(SEQ ID NO 3)的示例評分值:476.80
○越低的值表示越高的結合親和力。
概述1:針對MHC I類HLA確定PIRCHE:
將下面所述的方法設計為以移植物vs宿主(Graft vs.Host,GvH)方向來進行。
確定可能由共享的HLA來呈遞的所有受體特異性肽:
在開始方法之前,找出受體與供體之間的錯配HLA等位基因,或者如方法中的初始步驟,包括例如:
a.HLA等位基因匹配:共享的HLA
b.HLA等位基因錯配:錯配的HLA
1.對于錯配的受體HLA等位基因:
a.確定切割預測>0.5的所有肽(閾值可以調(diào)整)
2.對于受體的每個共享的I類HLA等位基因:
a.針對在1.a中所確定的所有肽篩選是否存在IC 50評分<500的關系(閾值可以調(diào)整)
對于所有供體HLA值,確定可以潛在地由共享的HLA呈遞的肽:
3.對于每一供體HLA等位基因:
a.確定切割預測>0.5的所有肽(閾值可以調(diào)整)
4.對于供體的每個共享的I類HLA等位基因:
a.針對在3.a中所確定的所有肽篩選是否存在IC 50評分<500的關系(閾值可以調(diào)整)
針對每個共享的HLA,將供體與受體的已確定肽進行比較:
5.和6.針對每個共享的HLA等位基因:
a.確定由受體HLA分子所呈遞而未被對應的供體HLA分子所確定的所有肽
針對MHC II類HLA來確定PIRCHE II:
-基本方法與I類HLA相同
-獨立于切割評分來處理所有的肽
-使用15mer肽用于結合預測
優(yōu)選實施例:
-優(yōu)選支持分子高分辨的等位基因編碼(例如,A*02:01)
-優(yōu)選支持基因座A*、B*、DRB1*以及DQB1*
實例:
表1.:HLA錯配的示例
示例概述:
1.必須確定錯配的HLA(C*07:04)的所有受體肽(利用某些閾值)。
2.對于每個共享的HLA(A*01:01、A*11:01、……),必須篩選它能夠潛在呈遞1中所確定的肽中的哪一個(利用某些閾值)。
3.確定供體的所有HLA值的所有肽。
4.對于每個共享的HLA(A*01:01、A*11:01、……),必須篩選它能夠潛在呈遞3中所確定的肽中的哪一個(利用某些閾值)。
5.對于每個共享的I類HLA分子:任何不包括在4的肽組中的2中所確定的肽是PIRCHE I。
6.對于每個共享的II類HLA分子:任何不包括在4的肽組中的2中所確定的肽是PIRCHE II。
這意味著因為一個肽能夠由不只一個HLA分子來呈遞,所以它理論上能夠導致不只一個PIRCHE。
表2.:下表表示只考慮基因座C*和DRB1*的示例,并且基于人工肽數(shù)據(jù)來說明此概念。
示例1:
1.必須確定錯配的HLA(C*07:04)的所有受體肽(利用某些閾值)。
-受體“具有”肽A、B、C、D、E、F、G。
2.對于每個共享的HLA,必須篩選它能夠潛在呈遞1中所確定的肽中的哪一個(利用某些閾值)。
-對于DRB1*03:01的HLA分子能夠潛在呈遞肽C和Y。由于供體不“具有”Y,所以該HLA分子實際上只能呈遞C。對于錯配的HLA分子,被呈遞的肽不相關。
3.確定供體的所有HLA值的所有肽。
-供體具有肽A、B、H、D、E、F、G。
4.對于每個共享的HLA,必須篩選它能夠潛在呈遞3中所確定的肽中的哪一個(利用某些閾值)。
-對于DRB1*03:01的HLA分子能夠潛在呈遞肽C和Y。由于供體不“具有”C或者Y,所以該HLA分子實際上不呈遞任何肽。對于錯配的HLA分子,被呈遞的肽不相關。
5.對于每個共享的I類HLA分子:任何不包括在4的肽組中的2中所確定的肽是PIRCHE I。
6.對于每個共享的II類HLA分子:任何不包括在4的肽組中的2中所確定的肽是PIRCHE II。
-在受體與供體之間將DRB1*03:01的被呈遞肽進行比較導致在受體中僅被呈遞的肽C。由于DRB1*03:01是II類等位基因,因此是PIRCHE II。
示例2:
-在該示例中,假設等位基因C*07:02具有肽A、H以及C,即供體現(xiàn)在“具有”肽“C”。
-DRB1*03:01HLA分子能夠潛在呈遞C肽。
-在受體與供體之間將DRB1*03:01的被呈遞肽進行比較,導致受體的所有肽也被供體所呈遞。因此,對于DRB1*03:01,不存在PIRCHE。
數(shù)據(jù)結構
從功能的角度,算法的核心圖形數(shù)據(jù)結構包括HLA值、肽以及這些實體之間的關系(見圖2)。
HLA值“具有”許多個肽,意味著HLA值的氨基酸序列的蛋白酶切割可以潛在導致相關的肽。對于I類HLA,這種切割的可能性通過切割評分來表示。對于II類HLA切割,由于切割模式可能尚未完全清楚,優(yōu)選地不保持該值。
而且,HLA值可以“呈遞”許多肽,意味著肽可以被綁定到細胞表面的HLA分子并且由其進行呈遞.IC 50評分表示肽與HLA分子的實際結合的可能性。IC 50評分是針對與I類HLA值和II類HLA值的關系來進行確定的。
優(yōu)選地,使用具有9個氨基酸的序列的肽作為由I類HLA所潛在呈遞的肽,而使用具有15個氨基酸的序列的肽作為II類HLA所潛在呈遞的肽。但是其他的肽長度也可以包括在隨后的發(fā)布中。
圖形數(shù)據(jù)結構提供HLA值實體、肽實體以及這些實體之間的關系。該結構包括所有相關的肽,以及針對所有相關的HLA值實體的對應切割評分,包括I類結合預測和II類結合預測。
圖3中的示意圖表示該數(shù)據(jù)圖形的示例片段。該數(shù)據(jù)結構能夠以上面的示意圖中所示的形式被理想地存儲在圖形數(shù)據(jù)庫中??商鎿Q地,適合的存儲概念包括在鍵值存儲中的存儲以及相關的數(shù)據(jù)庫的表中的存儲。
如圖3的示例中所示,通過圖形結構化的數(shù)據(jù)模型對于真實世界實體的抽象化理想地反映了生物學背景。因此,對于系統(tǒng)中數(shù)據(jù)的實際存儲而言優(yōu)選的是圖形數(shù)據(jù)庫。各個實體被存儲為唯一的節(jié)點,因此能夠有效處理數(shù)據(jù)。
鍵值存儲提供數(shù)據(jù)的高效查詢,但是因為各個實體可能被多余地存儲,所以大小就尺寸而言不是最優(yōu)化的。此概念體現(xiàn)本發(fā)明的一個實施例,特別是如果性能成為技術問題并且對于高速緩存而言是理想的。
相關的數(shù)據(jù)庫管理系統(tǒng)針對匯集數(shù)據(jù)進行優(yōu)化,并且也提供理想的存儲,但是將需要針對大數(shù)據(jù)表的頻繁的聯(lián)合(join)操作。這將對性能有負面的影響。
圖形數(shù)據(jù)庫對于高度連接的數(shù)據(jù)是最優(yōu)化的,并且能夠結合理想的最小化存儲大小來進行對于各個關系的高性能訪問。而且,當文中所描述的匹配方法中所待考慮的生物學背景因素被擴展,而域模型變得更加復雜時,圖形結構能夠進行這樣的擴展的理想整合。
應當考慮下面的范圍:
肽:~3.000.000(~1.832.000 9mer肽+15mer肽)
HLA值:~10.000
關系:~10.000*1000
只包括圖形結構中的能夠潛在地由至少一個HLA分子進行呈遞的那些肽是充分的并且是優(yōu)選的。
系統(tǒng)構架
圖4公開了將HLA配型與PIRCHE配型進行組合的軟件模塊的示意表示,優(yōu)選地經(jīng)由服務整合管理器(表現(xiàn)層)。
將PIRCHE配型設計為能夠整合到其他應用中的服務組件。這樣能夠提供PIRCHE配型服務既作為獨立的服務,又整合到如HLA配型系統(tǒng)的現(xiàn)有應用中。
由于PIRCHE配型服務需要具有患者和供體之間的識別出的HLA配型和錯配,整合到現(xiàn)有HLA配型系統(tǒng)是理想的組合。
由于PIRCHE配型服務更喜歡高分辨率分型的HLA等位基因值,而對于一些供體通常無法找到這樣的值,因此高分辨率HLA基因型的評估服務是導致更加復雜的解決方案的另一個服務整合。
HLA配型服務、高分辨率HLA基因型的評估服務、以及PIRCHE配型服務的組合提供如下的新可能性:該方案對于非高分辨率分型的供體進行大規(guī)模登記的實用性,將所有服務的結果整合到一個評分系統(tǒng)中,從而根據(jù)HLA配型、高分辨率HLA評估、PIRCHE以及其他因素(例如,細胞數(shù)、血型、感染疾病標記、性別以及年齡相結合)將供體進行排名。對于搜索協(xié)調(diào)者或者醫(yī)生,這將能夠在更短時間內(nèi)識別更好的HSCT供體,從而得到更好的治療效果。
PIRCHE配型服務接受分子的高分辨率的患者HLA數(shù)據(jù)、搜索配置文件以及(例如,匹配的供體或CBU的)分子高分辨率HLA值的列表,即已經(jīng)識別出的匹配和錯配的HLA值。
基于HLA-肽-圖形,HLA-肽-匹配算法分析每個供體/CBU的PIRCHE I值和PIRCHE II值,并且將富有PIRCHE信息的給定供體/CBU列表返回到服務客戶端。
為了將服務整合到另一個系統(tǒng)中,優(yōu)選的是具有一個優(yōu)越的服務整合管理組件,該組件是服務客戶端,安排它與其他服務(如HLA配型服務和高分辨率HLA基因型評估服務)一同提供復雜的方案。
圖5提供了潛在系統(tǒng)構架的更詳細總覽作為一個示例。
圖5中的示意圖更詳細地描述PIRCHE配型服務組件。該匹配服務包括主服務層和一些子組件,最重要的是肽分析器、被呈遞肽分析器、PIRCHE分析器以及HLA-肽-圖形管理器。而且,它包括HLA-肽-圖形存儲和許多高速緩存來提高性能。
PIRCHE配型服務由客戶利用匹配請求數(shù)據(jù)結構進行調(diào)用,并且提供匹配響應數(shù)據(jù)結構作為結果。
匹配請求數(shù)據(jù)結構包括搜索配置文件和患者/供體HLA配型組的組。搜索配置文件具體說明切割閾值、肽結合親和力的IC 50評分閾值以及所請求的匹配方向(移植體vs宿主或者宿主vs移植體)。
患者/供體HLA配型組包含患者和供體的HLA配型結果。即,它包含患者和供體之間的共享HLA值和錯配HLA值。由于錯配是根據(jù)患者供體組合,必須針對每個待分析的供體進行提供。另外,它包含用于識別目的的患者的ID和供體的ID。
匹配響應包括PIRCHED HLA配型組。每個組包括一組PIRCHED HLA值,每個PIRCHED HLA值包括HLA值以及所確定的PIRCHED I和PIRCHED II的對應數(shù)量。另外,PIRCHED HLA配型組包含針對所考慮的HLA基因座的PIRCHED I和PIRCHED II的總數(shù)量、患者的ID以及供體的ID用于識別目的。
在內(nèi)部,該系統(tǒng)可以由下面的子組件組成:
-HLA-肽-圖形管理器負責創(chuàng)建和更新HLA-肽-圖形。
-肽分析器利用可選的切割閾值,基于針對一組給定的HLA值的HLA-肽-圖形來確定HLA衍生肽。
-被呈遞肽分析器基于HLA-肽-圖形,利用給定的IC 50評分閾值,確定一個給定組中的哪一個肽潛在地被呈遞在一組給定的HLA分子上。該結果包括針對每個給定HLA值的一組潛在被呈遞的肽。
-PIRCHE分析器取得HLA值以及患者和供體的被呈遞肽的對應組,并且針對每個HLA值確定PIRCHED I或PIRCHED II的數(shù)量。
組合的HLA配型/PIRCHE系統(tǒng)的主要使用情況
1.用戶登錄到HLA配型/PIRCHE系統(tǒng)
2.用戶創(chuàng)建新患者
3.用戶輸入患者HLA
4.用戶瀏覽進行搜索
5.用戶配置搜索配置文件并且開始搜索
6.系統(tǒng)利用搜索配置文件設置來執(zhí)行搜索
7.系統(tǒng)顯示搜索結果屏幕
8.用戶能夠在CBU結果列表與供體結果列表之間進行切換
9.用戶將供體輸出為csv文件(可選的)
在一個優(yōu)選實施例中,可以顯示供體搜索結果并且在CBU和供體搜索結果之間進行切換。
供體類型搜索
該方案將包括供體基因型數(shù)據(jù)庫,該供體基因型數(shù)據(jù)庫上能夠針對給定患者來執(zhí)行PIRCHE配型服務,從而確定潛在供體類型列表,該列表具有允許錯配的基因型。
供體搜索結果屏幕的列是:
-供體類型ID
-評分(對于第一版本:PIRCHED I+PIRCHED II,隨后可能進行擴展)
-HvG(宿主vs移植物錯配)
-GvH(移植物vs宿主錯配)
-A*
-B*
-C*
-DRB1*、
-DQB1*
-PIRCHED I
-PIRCHED II
-頻率(基于用于創(chuàng)建供體基因型數(shù)據(jù)庫的單體型頻率的該供體的基因型頻率)
-(供體的種族類型將添加在隨后的發(fā)表中)
供體基因型數(shù)據(jù)庫將能夠搜索具有允許錯配的供體基因型。在實際供體的現(xiàn)有供體登記中的典型搜索將導致根本無法得到10/10匹配的供體基因型,例如如果這樣的一個供體并不存在于進行搜索的注冊中。通過利用HLA和PIRCHE配型來搜索供體基因型數(shù)據(jù)庫,可以確定基因型搜索模板,該模板能夠將進一步的搜索引導至正確的方向,例如通過識別在某些登記中頻繁出現(xiàn)的供體類型,例如因為社會性別(gender)、生理性別(sex)、種族等……
PIRCHE配型模塊還能夠用于匹配真實的CBU和供體。用戶能夠在CBU庫存、真實供體庫存以及供體基因型數(shù)據(jù)庫之間進行切換。
HLA圖形數(shù)據(jù)庫提高PIRCHE速度
出于驗證的目的,生成患者與伴隨的供體的人工測試文件。該文件包含26.000對理論的患者&供體的造血干細胞,在10HLA分型之中的10個中具有1個錯配,以及通過每個配對所生成的PIRCHE I+II值。
構建原則如下?;颊吆凸w在HLA-A基因座中具有1個血清錯配。該錯配固定在位置上,并且這種等位基因貫穿所有下面的配對。下面的患者&供體對通過在患者和供體的位點上同時置換HLA基因座的所有現(xiàn)有等位基因HLA-A、HLA-B、HLA-DRB1以及HLA-DQB1來進行變化。匹配或共享的等位基因的置換即使是針對這種每個對中的單一固定錯配也會引起不同的PIRCHE值。
此文件用于驗證算法從較早的Perl腳本實現(xiàn)轉換到新的HLA圖形數(shù)據(jù)庫結構的正確性。當所有的PIRCHE值在原始的Perl腳本中與在圖形數(shù)據(jù)庫中相同時,給出正確性。
原始的實現(xiàn)需要11小時來執(zhí)行針對所有26,000個對的計算。本文中所描述的利用圖形數(shù)據(jù)的實現(xiàn)只花費10秒來執(zhí)行所有26,000個PIRCHE的計算。
速度的改善以及基于用戶界面的網(wǎng)絡瀏覽器現(xiàn)在使得該算法能夠進行交互式使用?,F(xiàn)在,1個患者與10至100個潛在供體的臨床運行情況運行不到1秒。能夠非??焖俚貙⒒颊吲c不同池的潛在供體進行比較(例如來自不同的登記或不同的國家)。無需等待,答案馬上出來,并且在網(wǎng)絡瀏覽器提供針對網(wǎng)絡的接口的任何位置可以獲得。
因此,圖形數(shù)據(jù)結構不僅提供改進的計算速度。由于數(shù)據(jù)結構的生物背景、數(shù)據(jù)中所呈遞的生物樣品(非直接地,而是假設該數(shù)據(jù)與患者樣品間接對應)、以及最終改進的識別允許的錯配HLA供體材料的速度,本發(fā)明提供出乎意料的技術效果和優(yōu)勢。至今,可允許的錯配HLA供體材料的選擇和匹配的較早方法速度慢并且受限于所使用的生物方法(即,只搜索10/10匹配)以及先前所使用的相對低效的計算方法。
因此,除了為了更快速的計算所使用的新穎數(shù)據(jù)結構以外,通過關于生物背景的新穎特征與識別可允許的錯配(間接呈遞vs直接呈遞)所使用的原理的組合來限定本發(fā)明。這些特征的組合引起意想不到的協(xié)同作用,帶來快得多的處理時間,因此整個新穎的方法朝向從世界各地查詢多個造血干細胞或供體組織數(shù)據(jù)庫以及登記處,努力搜索以找到可允許的供體材料。
軟件實現(xiàn)
將文中所描述的系統(tǒng)并入到能夠訪問潛在的HLA圖形數(shù)據(jù)庫的直觀可視化瀏覽器界面。該可視化界面還引起PIRCHE速度的改進,并且啟用在供體材料搜索期間的更多交互運行的模式。關于HLA配型的先前嘗試和相似的搜索引擎嚴重受限于它們的慢處理時間。根據(jù)自組織的早期系統(tǒng),在發(fā)送請求之后,在最初的一或更多天提供針對特定查詢的結果。
圖形數(shù)據(jù)庫結構啟用測試文件運行時間從11h減少至10sec(≈26.000患者/供體對)。
該系統(tǒng)的軟件實現(xiàn)將“軟件即服務”(Software as a Service,SaaS)Json-REST界面進行并入,允許將PIRCHE整合到任何給定的現(xiàn)有供體選擇系統(tǒng)。因此,可以將本發(fā)明(數(shù)據(jù)結構及其查詢)本身作為能夠與其他HLA配型服務整合的模塊來進行呈遞。