專利名稱:基因芯片用人類白細(xì)胞抗原分型探針的篩選及其應(yīng)用方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種人類白細(xì)胞抗原類型的測試鑒別方法,特別涉及用于基因芯片檢測方面的分型探針篩選和應(yīng)用的方法。
背景技術(shù):
人類白細(xì)胞抗原(Human leukocyte antigen,簡稱HLA)就是人類的主要組織相容性復(fù)合物(Major HistocompatibilityComplex簡稱MHC),它在免疫系統(tǒng)中對T細(xì)胞發(fā)育階段中的篩選、效應(yīng)階段中的活性介導(dǎo)以及對NK細(xì)胞的抑制等方面發(fā)揮非常重要的作用。
人類白細(xì)胞抗原具有非常豐富的多態(tài)性,即在一個(gè)人群當(dāng)中,對于同一種白細(xì)胞抗原,不同的個(gè)體可能攜帶有不同的等位基因。以2003年4月份IMGT/HLA公布的資料為例,HLA-B有519個(gè)等位基因,由于人是雙倍染色體,理論上存在的HLA-B種抗原的數(shù)目為134,940種。HLA的多態(tài)性和其在免疫系統(tǒng)中發(fā)揮的重要作用,決定了不同個(gè)體的免疫系統(tǒng)可能因具有不同的HLA抗原分子而具有不同的免疫優(yōu)勢和劣勢。HLA的多態(tài)性還會(huì)造成了器官移植和骨髓移植中的排斥反應(yīng),若供者和受者具有不同的HLA等位基因,在進(jìn)行器官移植或骨髓移植后就會(huì)有比較強(qiáng)的免疫排斥反應(yīng)發(fā)生,造成移植失敗,因此,在移植前,必須對供者和受者進(jìn)行高精度的HLA分型。
自1958年發(fā)現(xiàn)第一個(gè)白細(xì)胞抗原,人們就開始對白細(xì)胞抗原進(jìn)行分型,其方法也在不斷進(jìn)步。微量淋巴細(xì)胞毒試驗(yàn)70年代就發(fā)展成熟,并在以后成為實(shí)際上的白細(xì)胞抗原分型的技術(shù)標(biāo)準(zhǔn),但由于這種方法分型只能對活細(xì)胞分型且錯(cuò)誤率高,目前正逐漸被基于DNA技術(shù)的各種方法所取代。IHWG(International HistocompatabilityWorking Group,國際組織相容性工作組)目前推薦的分型方法主要有三種SSOP,SBT,SSP,其中以SSOP方法最受推崇。SSOP(SequenceSpecific Oligonucleotide Probe)即序列特異性寡核苷酸。這種方法靈敏度,特異性,穩(wěn)定性都比較好,是目前幾種方法中較優(yōu)的一種,但也存在不少缺點(diǎn),如操作時(shí)間比較長,大概需3個(gè)工作日;需昂貴設(shè)備等等。NMDP(National Marrow Donor Program)是美國國家骨髓庫,其于1992-1993以及1997-1999年期間分別完成了對II白細(xì)胞抗原和I白細(xì)胞抗原分型方法由血清學(xué)技術(shù)(微量淋巴細(xì)胞毒試驗(yàn))到基于DNA技術(shù)(SSOP)的轉(zhuǎn)換。與血清學(xué)技術(shù)方法相比,各種基于DNA技術(shù)的各種方法確實(shí)有諸多優(yōu)點(diǎn),但這也帶來了分型標(biāo)準(zhǔn)的混亂,世界各國的骨髓庫和各地的分型實(shí)驗(yàn)室在使用不同的分型試劑與分型方法來進(jìn)行白細(xì)胞抗原分型,各種分型試劑的分辨率穩(wěn)定性都不相同,給數(shù)據(jù)的交流帶來很多麻煩。
基因芯片技術(shù)是最近于生物技術(shù)領(lǐng)域內(nèi)出現(xiàn)的一種新方法,它能高通量平行性的獲得待測樣本的大量信息,這是傳統(tǒng)的生物學(xué)方法難以達(dá)到的?;蛐酒晒滔噍d體(一般為玻璃)和固定于其上的DNA探針組成,目前主要用于表達(dá)譜分析和突變檢測兩個(gè)領(lǐng)域。用于檢測堿基突變的基因芯片的DNA探針的長度一般為十幾個(gè)到二十幾個(gè)堿基,其序列與待檢測突變位點(diǎn)及突變位點(diǎn)兩側(cè)的序列互補(bǔ),讓待檢測位點(diǎn)位于探針的中間位置(或接近中間),根據(jù)待檢測位點(diǎn)出現(xiàn)的堿基類型,設(shè)計(jì)幾條探針分別與之完全互補(bǔ),這樣,在雜交時(shí),待檢測樣品中的DNA會(huì)與序列與之完全匹配的探針結(jié)合,使該點(diǎn)有較強(qiáng)的熒光信號(hào)強(qiáng)度。根據(jù)各點(diǎn)熒光信號(hào)強(qiáng)度的不同,即可讀出待檢測樣品中的DNA序列。由于HLA各等位基因之間的差異本質(zhì)上是在多態(tài)性位點(diǎn)上的核苷酸的差異,可以利用基因芯片技術(shù)來對其進(jìn)行分型,而且利用基因芯片技術(shù)對HLA分型有許多傳統(tǒng)方法難以比擬的優(yōu)勢,比如操作簡單,只需雜交掃描;效率高,雜交掃描能在兩個(gè)小時(shí)內(nèi)完成,而且可以在同一張芯片上同時(shí)分型好幾份份樣品;自動(dòng)化程度高,掃描以后的工作都可以由計(jì)算機(jī)來處理;成本低,合成一次寡核苷酸探針可以點(diǎn)數(shù)千張芯片,每張芯片都可以檢測幾份樣品。因此基于基因芯片技術(shù)的人類白細(xì)胞抗原分型方法很具有成為人類白細(xì)胞抗原分型技術(shù)標(biāo)準(zhǔn)的潛力。
目前世界上已有不少公司及實(shí)驗(yàn)室在研究用基因芯片技術(shù)分型人類白細(xì)胞抗原的方法,但他們設(shè)計(jì)出的分型探針及由此生產(chǎn)的分型芯片都只達(dá)到中等分辨率水平,而基因芯片用人類白細(xì)胞抗原高分辨率分型探針的設(shè)計(jì)方法尚未有人描述,因?yàn)槿祟惏准?xì)胞抗原高分辨率分型探針比較難以設(shè)計(jì),這主要有兩個(gè)原因第一,人類白細(xì)胞抗原的多態(tài)性非常豐富,在所有已發(fā)現(xiàn)的人類基因中其多態(tài)性最為豐富,如目前登錄的HLA-B抗原的等位基因已達(dá)519條,而且人是雙倍體,由HLA-B抗原的519條等位基因組成的合子與雜合子數(shù)目會(huì)達(dá)134940種之多,要對其設(shè)計(jì)高分辨率分型探針,是一件很艱巨的工作,需要大量運(yùn)算。
第二,人類白細(xì)胞抗原的多態(tài)性位點(diǎn)比較集中,I類白細(xì)胞抗原的多態(tài)性位點(diǎn)幾乎都集中在第二和第三外顯子的340bp內(nèi),II類白細(xì)胞抗原的多態(tài)性位點(diǎn)幾乎都集中在第二外顯子的260bp內(nèi)。這些多態(tài)性位點(diǎn),由于它們相互臨近,在對其中一個(gè)多態(tài)性位點(diǎn)設(shè)計(jì)探針時(shí)總會(huì)受到臨近多態(tài)性位點(diǎn)的干擾,若按照對孤立多態(tài)性位點(diǎn)設(shè)計(jì)探針的方法來進(jìn)行設(shè)計(jì),很難獲得理想的探針,即便設(shè)計(jì)出了探針,也會(huì)對后面的探針調(diào)試,判定閥值確定帶來諸多麻煩。
發(fā)明內(nèi)容
本專利公開了一種人類白細(xì)胞抗原高分辨率、并且探針調(diào)試以及確定判定閥值容易的分型探針篩選及其應(yīng)用方法,很好的解決了上述現(xiàn)有技術(shù)存在的問題。
本發(fā)明的技術(shù)方案如下首先設(shè)計(jì)一種基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,該方法包括如下步驟A.將人類白細(xì)胞抗原各等位基因的序列比對結(jié)果由網(wǎng)絡(luò)中下載到計(jì)算機(jī)的存儲(chǔ)器中,建立一個(gè)數(shù)據(jù)庫;B.讀取數(shù)據(jù)庫中所有白細(xì)胞抗原多態(tài)性位點(diǎn)的信息;C.檢測所有多態(tài)性位點(diǎn),并將所有多態(tài)性位點(diǎn)按堿基位置相互臨近的原則分為若干位點(diǎn)組;D.檢索同一多態(tài)性位點(diǎn)組內(nèi)出現(xiàn)的所有組合,比較每兩種組合,找出堿基類型不相同的堿基位置形成新的數(shù)據(jù)組;E.根據(jù)數(shù)據(jù)組中每個(gè)多態(tài)性位點(diǎn)出現(xiàn)的情況確定分型探針的檢測位點(diǎn);F.根據(jù)探針的檢測位點(diǎn)找出探針的序列;上述探針在基因芯片對人類白細(xì)胞抗原分型時(shí)的應(yīng)用方法,包括以下步驟
①以上述方法確定探針檢測位點(diǎn)以及探針序列;②構(gòu)建各等位基因?qū)εc各條探針匹配關(guān)系的判斷程序;③合成探針并將探針置于固相載體上;④PCR擴(kuò)增樣品DNA,與芯片雜交并掃描;⑤由步驟②所建立的判斷程序判別步驟④掃描出來的結(jié)果,將完全匹配的判斷結(jié)果輸出,從而確定待測樣品的白細(xì)胞抗原型別。
依據(jù)本發(fā)明中設(shè)計(jì)的人類白細(xì)胞抗原分型探針的篩選方法,提出了對多態(tài)性位點(diǎn)進(jìn)行“分組”的解決方案,依此方法設(shè)計(jì)出來的分型探針,檢測位點(diǎn)定位準(zhǔn)確并且包容性較強(qiáng),分辨率高。本發(fā)明的全部篩選過程全部由設(shè)計(jì)的一套計(jì)算機(jī)軟件來執(zhí)行,所以,可以快速準(zhǔn)確地篩選出理想的分型探針。而且本專利還描述了各種匹配關(guān)系表的構(gòu)建方法及如何根據(jù)這些匹配關(guān)系表一步步由芯片雜交結(jié)果判斷出待測樣品的白細(xì)胞抗原類型,解決了該分型探針在實(shí)際工作中的應(yīng)用問題。
圖1是各組合之間的空間位置關(guān)系圖。
圖2是各探針之間的空間位置關(guān)系圖。
具體實(shí)施例方式
本發(fā)明的具體實(shí)施方式
如下一種基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,該方法包括如下步驟A.將人類白細(xì)胞抗原各等位基因的序列比對結(jié)果由網(wǎng)絡(luò)中下載到計(jì)算機(jī)的存儲(chǔ)器中,建立一個(gè)數(shù)據(jù)庫;B.讀取數(shù)據(jù)庫中所有白細(xì)胞抗原多態(tài)性位點(diǎn)的信息;C.檢測所有多態(tài)性位點(diǎn),并將所有多態(tài)性位點(diǎn)按堿基位置相互臨近的原則分為若干位點(diǎn)組;D.檢索同一多態(tài)性位點(diǎn)組內(nèi)出現(xiàn)的所有組合,比較每兩種組合,找出堿基類型不相同的堿基位置形成新的數(shù)據(jù)組;E.根據(jù)數(shù)據(jù)組中每個(gè)多態(tài)性位點(diǎn)出現(xiàn)的情況確定分型探針的檢測位點(diǎn);F.根據(jù)探針的檢測位點(diǎn)找出探針的序列;所有人類白細(xì)胞抗原各等位基因的序列比對結(jié)果都可以從IMGT/HLA的網(wǎng)站上下載。對于I類白細(xì)胞抗原HLA-A,HLA-B,HLA-C等,只需下載第二和第三外顯子的比對結(jié)果,因?yàn)镮類白細(xì)胞抗原的多態(tài)性位點(diǎn)幾乎都集中在第二和第三外顯子;對于II類白細(xì)胞抗原HLA-DRBI等,只需下載第二外顯子的比對結(jié)果,因?yàn)镮I類白細(xì)胞抗原的多態(tài)性位點(diǎn)幾乎都集中在第二外顯子。不管I類白細(xì)胞抗原還是II類白細(xì)胞抗原,在其各自的考察范圍內(nèi),即I類白細(xì)胞抗原的第二和第三外顯子與II類白細(xì)胞抗原的第二外顯子,都存在堿基序列完全相同的等位基因,比如HLA-B抗原的等位基因B*0705和B*0706。在進(jìn)行設(shè)計(jì)探針工作之前,要先合并具有相同堿基序列的等位基因,得到具有唯一序列的等位基因比對結(jié)果。而且,不管I類白細(xì)胞抗原還是II類白細(xì)胞抗原都存在包含有序列插入或序列刪除變異的等位基因。所以,在步驟A中還設(shè)計(jì)有合并和刪除程序,可以先建立一個(gè)二維數(shù)組(比如alleleSeq())和一個(gè)TextStream變量(比如ts),運(yùn)用ts訪問磁盤上的數(shù)據(jù),將每一個(gè)等位基因的序列讀入alleleSeq()的每一行進(jìn)行兩兩比較,合并序列完全相同的等位基因以及刪除包含有序列插入或序列刪除變異的等位基因,得到具有唯一序列的等位基因比對結(jié)果。
所述步驟B中的檢測過程是由計(jì)算機(jī)對步驟A所形成的數(shù)據(jù)庫中的單元位置進(jìn)行掃描,忽略不具多態(tài)性的位點(diǎn),顯示多態(tài)性位點(diǎn)的各相關(guān)信息,所述相關(guān)信息包括,在一致性序列中的堿基類型、變異的堿基類型以及變異堿基出現(xiàn)的次數(shù)。多態(tài)性位點(diǎn)的各相關(guān)信息可以顯示在一Word表格內(nèi),例如表1所示內(nèi)容表1(部分) 在表1中,第一列顯示的是各個(gè)多態(tài)性位點(diǎn)的位置,第二列顯示的是在該位置處占優(yōu)勢的堿基類型,第三到第六列分別顯示A,G,C,T四種堿基類型在各個(gè)多態(tài)性位點(diǎn)出現(xiàn)的次數(shù)。
在設(shè)計(jì)白細(xì)胞抗原分型探針時(shí),經(jīng)常碰到這樣的問題若干個(gè)多態(tài)性位點(diǎn)相距很近,連在一起或僅間隔兩三個(gè)堿基,這時(shí)對其中任一點(diǎn)設(shè)計(jì)探針總會(huì)受到相鄰的多態(tài)性位點(diǎn)的干擾,為解決這一問題,可將這些相互臨近的多態(tài)性位點(diǎn)作為一個(gè)整體來看待,即分為一組。步驟C的分組原則是將兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)目進(jìn)行比較,根據(jù)實(shí)際需要可以將其差數(shù)小于3~6范圍內(nèi)的分為一組,如果將其差數(shù)值確定為4或5,效果最佳。例如以變量pos1代表一個(gè)多態(tài)性位點(diǎn)的位置,以變量pos2代表另一個(gè)多態(tài)性位點(diǎn)的位置,如果(pos2-pos1)的絕對值小于其設(shè)定的差數(shù)值,則將它們歸入一組;表1中的第五列的多態(tài)性位點(diǎn)與第六列多態(tài)性位點(diǎn)之間間隔的堿基數(shù)為1(32-30-1),就應(yīng)將它們劃為一組。根據(jù)以上的分組原則,可以將表(2)中的多態(tài)性位點(diǎn)分為7組,不同的字體表示不同的組。
所述步驟D是針對每個(gè)多態(tài)性位點(diǎn)組,從第一條等位基因開始逐個(gè)考察其組合的類型,記錄下來組合數(shù)以及所出現(xiàn)的新的組合類型,并自動(dòng)形成比照表格,該表格行數(shù)為該組內(nèi)組合數(shù)加一,列數(shù)為組合數(shù)加二;如表1中的多態(tài)性位點(diǎn)30,32,33所組成的一組所示,在多態(tài)性位點(diǎn)30出現(xiàn)了兩種堿基類型,分為G和T;在多態(tài)性位點(diǎn)32出現(xiàn)了兩種堿基類型,分為C和T;在多態(tài)性位點(diǎn)33出現(xiàn)了兩種堿基類型,分為A和G,理論上講這三個(gè)多態(tài)性位點(diǎn)可以組成8種組合,分為GCA,GCG,GTA,GTG,TCA,TCG,TTA,TTG,我們只以已經(jīng)發(fā)現(xiàn)的四種組合為例,分將其為TCG,GCA,GCG,GTA,列成比照表格,如表2所示表2
該表格的第一行以及第一列中分別填入各組合類型,進(jìn)一步將上述組合類型進(jìn)行兩兩比較,找出堿基類型不相同的位置,填入該兩種組合類型相交的單元格內(nèi)。
一個(gè)探針的檢測位點(diǎn)就是該條探針?biāo)獧z測的那個(gè)多態(tài)性位點(diǎn),尋找探針檢測位點(diǎn)的步驟E是根據(jù)上面的比照表格,考察該表格的每一列中的多態(tài)性位點(diǎn),如果存在一個(gè)多態(tài)性位點(diǎn)在該列的所有有效單元格內(nèi)是否都出現(xiàn),如果是則確定該多態(tài)性位點(diǎn)作為該探針的檢測位點(diǎn),并填入該列的最下面一格;否則,就要確定多個(gè)多態(tài)性位點(diǎn),使該列中的任一有效的單元格至少有選定的一個(gè)多態(tài)性位點(diǎn)出現(xiàn),這些被選定的多態(tài)性位點(diǎn)就分別是每條探針的檢測位點(diǎn),例如第二列中的多態(tài)性位點(diǎn)30在第三,四,五行中都出現(xiàn),所以多態(tài)性位點(diǎn)30即可作為所要探針的檢測位點(diǎn),將30寫在該列的最下單元格內(nèi)。對于某一列,如果不存在一個(gè)多態(tài)性位點(diǎn)在所有的單元格都出現(xiàn)(處于左上到右下對角線上的那個(gè)單元格不在考慮范圍內(nèi)),就要確定2個(gè)或更多個(gè)多態(tài)性位點(diǎn),使該列中的任一單元格至少有選定的一個(gè)多態(tài)性位點(diǎn)出現(xiàn),例如第三列中的多態(tài)性位點(diǎn)32和33。統(tǒng)計(jì)該組中所設(shè)計(jì)探針的數(shù)量(即檢測位點(diǎn)的數(shù)目,因?yàn)橐粋€(gè)檢測位點(diǎn)要設(shè)計(jì)一條探針),并可以寫出返回探針數(shù)目的probe()函數(shù)。
所述步驟E后還有優(yōu)化分組程序,包括根據(jù)每組中多態(tài)性位點(diǎn)的數(shù)量多少進(jìn)行優(yōu)化組合和拆分程序,其中優(yōu)化組合程序是對于組內(nèi)多態(tài)性位點(diǎn)數(shù)量較少、兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)目大于3但小于10,暫分為一組,計(jì)算該組所需的探針數(shù)量,調(diào)用函數(shù)probe()進(jìn)行比較,如果前者多則放棄,如果后者多則將它們確定劃歸入同一組;對于組內(nèi)大量多態(tài)性位點(diǎn)擁擠在一起,其中任意相鄰兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)都小于3~6,則將其拆分為多組,計(jì)算拆分后所需的探針數(shù)量,調(diào)用函數(shù)probe()進(jìn)行比較,如果前者多則放棄,如果后者多則按新組劃分,反復(fù)比較,直至找到最佳分組方案后確定;并重新確定探針的檢測位點(diǎn)。例如,如果(pos2-pos1)的絕對值大于等于3但小于10,就要調(diào)用probe()函數(shù),若probe(pos1)加上probe(pos2)大于probe(pos1,pos2),則將它們分入一組;否則將它們分為兩組。
輸出探針初步序列在本專利中,用如下的方式表示一條探針(組合類別,檢測位點(diǎn)位置)。如表2中的6條探針可以分別表示如下(TCG,30),(GCA,32),(GCA,33),(GCC,30),(GCC,33),(GTA,32)。知道了探針的檢測位點(diǎn)后,找出探針的序列就是很簡單的事情了,所述步驟F是以確定的探針檢測位點(diǎn)為中心向左右各延伸6~13個(gè)堿基,確定探針的序列,當(dāng)然,向左右各延伸的堿基數(shù)選擇8或9個(gè),則更為理想。在多態(tài)性位點(diǎn)處的堿基就是組合中顯示的堿基類型,在非多態(tài)性位點(diǎn)處的堿基就是一致序列中的堿基類型。例如,表2中六條探針的初步序列顯示于表3中。
表3
在表3中,有下劃線的表示該位置是所在探針的檢測位點(diǎn);小寫字母的表示該位點(diǎn)是多態(tài)性位點(diǎn),但不是所在探針的檢測位點(diǎn);大寫的字母表示該位點(diǎn)是非多態(tài)性位點(diǎn)。
本專利中對于計(jì)算機(jī)普通技術(shù)人員能夠輕易寫出的軟件程序不再贅述。
一種基因芯片用人類白細(xì)胞抗原分型探針的應(yīng)用方法,包括以下步驟①以上述方法確定探針檢測位點(diǎn)以及探針序列;②構(gòu)建各等位基因?qū)εc各條探針匹配關(guān)系的判斷程序;③合成探針并將探針置于固相載體上;④PCR擴(kuò)增樣品DNA,與芯片雜交并掃描;
表三比較單抗E11C與兩種試劑檢測G145R HBsAg的靈敏度
注結(jié)果以比色后的OD值表示實(shí)施例三乙肝表面抗原檢測試劑盒的制備以本發(fā)明制備的抗突變HBsAg單抗代替常規(guī)乙肝表面抗原檢測試劑盒中的HBsAb,其余試劑和材料與常規(guī)乙肝表面抗原檢測試劑盒中的一樣。檢測方法也與常規(guī)的乙肝表面抗原檢測試劑盒一樣。
b.進(jìn)一步建立雙倍體組合探針匹配關(guān)系表,建立雙倍體組合探針匹配關(guān)系表的方法是將任兩個(gè)組合類型配在一起并將它們與探針的匹配關(guān)系疊加在一起,疊加時(shí)遵循如下原則若一種組合在某一探針處顯示匹配的信號(hào)(P),不管另一種組合在該探針處顯示的信號(hào)是否匹配(P、N或V),則這兩種組合配對后與該探針相匹配(P)。若一種組合在某一探針處顯示不確定信號(hào)(V),則不管另一種組合在該探針處顯示不確定信號(hào)還是不匹配信號(hào)(N或V),這兩種組合配對后都會(huì)使該探針顯示不確定信號(hào)(V);若兩種組合在某一探針處均顯示不匹配信號(hào)(N),則這兩種組合配對后會(huì)使該探針顯示不匹配的信號(hào)(N),如此可由表4派生出表5。
表5-30,32,33這一組內(nèi)的雙倍體組合探針匹配表
按照以上原則,對所有的多態(tài)性位點(diǎn)組都可以建立起組合與探針的雙倍體匹配關(guān)系表,這一步的程序?qū)崿F(xiàn)就是將各組合與各探針依次比較即可。
C.構(gòu)建等位基因與組合的匹配關(guān)系表。比較每一條等位基因與每一組合的序列,判斷各條等位基因與各組合的匹配關(guān)系,若某一條等位基因的堿基類型與某一組合的堿基類型都一致,則該等位基因與該組合相匹配,用“+”號(hào)表示;若某一條等位基因與某一組合在一處或多處堿基類型不相同,則該等位基因與該組合不相匹配。例如HLA-B抗原包含495條等位基因,224種組合,則HLA-B抗原的各等位基因與各組合的匹配關(guān)系表就是495條等位基因與224種組合之間的匹配關(guān)系表。在程序?qū)崿F(xiàn)時(shí),應(yīng)先將各等位基因的序列讀入一個(gè)二維數(shù)組,然后將各組合依次與每條等位基因序列比較,將其結(jié)果輸出Excel表格。例如表6所示的為部分HLA-B抗原等位基因與組合的匹配關(guān)系表,C表示組合(Combination)之意表6
D.構(gòu)建等位基因?qū)εc組合的匹配關(guān)系表。等位基因?qū)褪撬械牡任换蛉我鈨蓛山M合所形成的配對。本步驟只要在步驟C的基礎(chǔ)上,將組成該等位基因?qū)Φ膬煞N等位基因與該組合的匹配關(guān)系疊加起來,即可得到該等位基因?qū)εc該組合的匹配關(guān)系。在程序?qū)崿F(xiàn)時(shí),可以用一個(gè)二維數(shù)組代表整張等位基因與組合的匹配關(guān)系表,然后依次將每兩條等位基因組成的等位基因?qū)εc各組合的匹配關(guān)系疊加輸出Excel表格。例如考察表6中等位基因B*0721與B*0722組成的等位基因?qū)εc組合C14和C15的匹配關(guān)系,發(fā)現(xiàn)B*0721與組合C14匹配,與組合C15不匹配;B*0722與組合C15匹配,與組合C14不匹配。由它們組成的等位基因?qū)t既與C14匹配又與C15匹配。
E.合并處理。對各等位基因?qū)εc各組合的匹配關(guān)系做兩兩比較,合并具有相同組合匹配關(guān)系的等位基因?qū)?,?gòu)建出最終的各等位基因?qū)εc各組合的匹配關(guān)系表。對于這些等位基因?qū)?,由于具有相同的組合匹配關(guān)系,根據(jù)以上設(shè)計(jì)的探針將無法把它們區(qū)分開,例如HLA-B抗原的等位基因?qū)*070201+B*0801與等位基因?qū)*0705+B*0807具有相同的組合匹配關(guān)系,因此無法相互區(qū)分。
F.由芯片雜交結(jié)果判斷出各條探針的正負(fù),根據(jù)雙倍體組合探針匹配關(guān)系表由各條探針的正負(fù)判斷出各組合的正負(fù),根據(jù)最終的各等位基因?qū)εc各組合的匹配關(guān)系表由各組合的正負(fù)判斷出待測樣品的等位基因?qū)Γ创郎y樣品的白細(xì)胞抗原型別。
由圖1和圖2中可知,為了更加直觀清晰地顯示出各組合與各探針在空間位置上的相互關(guān)系,對每一種HLA抗原,最好繪制兩張圖,一張顯示各組合之間的空間位置關(guān)系,一張顯示各探針之間的空間位置關(guān)系。在做這兩張圖時(shí),遵循如下原則對每一組合(或探針),由上到下搜索各條等位基因,直到遇到第一條與該組合(或探針)匹配的等位基因,則在該處顯示該組合(或探針)的名字。圖1顯示的HLA-B抗原各組合空間位置圖表的一部分,圖2顯示的是HLA-B抗原各探針空間位置圖表的一部分。圖1中對組合的命名有一些本專利的約定,以Combi3-2-8為例,Combi表示Combination,即組合之意;3表示第三個(gè)多態(tài)性位點(diǎn)組,HLA-B抗原共152個(gè)多態(tài)性位點(diǎn),被分為40組;2表示該組合是第三個(gè)多態(tài)性位點(diǎn)組中的第二種組合,第三個(gè)多態(tài)性位點(diǎn)組共有4種組合;8表示該組合在HLA-B抗原的所有組合中排在第八位,HLA-B抗原共有224種組合。被一個(gè)組合覆蓋的各堿基用圓圈,小寫字母或方框顯示,圓圈或小寫字母表示該位點(diǎn)是多態(tài)性位點(diǎn),方框表示該位點(diǎn)是非多態(tài)性位點(diǎn)。圖2中對探針的命名也有一些本專利的約定,以Probe4-1-13為例,Probe表示探針之意;4表示該探針是第四個(gè)多態(tài)性位點(diǎn)組所規(guī)定的探針;1表示該探針是第四多態(tài)性位點(diǎn)組規(guī)定的所有探針中的第一條,第四多態(tài)性位點(diǎn)組規(guī)定的探針共6條;13表示在HLA-B抗原的所有探針中該探針排在第13位,HLA-B抗原共有301條探針。被一個(gè)探針覆蓋的各堿基用圓圈,小寫字母,X字或方框顯示,圓圈或小寫字母表示該位點(diǎn)是所在探針的檢測位點(diǎn);X字表示該位點(diǎn)是多態(tài)性位點(diǎn),但不是所在探針檢測位點(diǎn);方框表示該位點(diǎn)是非多態(tài)性位點(diǎn)。
結(jié)果判定分為三步第一步、由各探針位點(diǎn)熒光信號(hào)的強(qiáng)弱來判斷各探針信號(hào)是正還是負(fù),若某一探針位點(diǎn)的熒光信號(hào)值大于判定閥值,則該探針位點(diǎn)信號(hào)為正;若某一探針位點(diǎn)的熒光信號(hào)值小于判定閥值,則該探針位點(diǎn)信號(hào)為負(fù)。判定閥值應(yīng)該由試驗(yàn)來確定。第二步、在本專利中,每條探針都是隸屬于某一多態(tài)性位點(diǎn)組的,要先將隸屬于每一組的各探針都找出,根據(jù)同一多態(tài)性位點(diǎn)組內(nèi)各組合與各探針的雙倍體匹配表,由各條探針信號(hào)的正負(fù)判定各組合的正負(fù),即該組合在待測樣品中的DNA中是否出現(xiàn)。由芯片雜交結(jié)果判斷出的探針的信號(hào)有正負(fù)兩種狀態(tài),在各組合與各探針的雙倍體匹配表中各組合與各探針的匹配關(guān)系有P,N和V三種情況,它們的對應(yīng)關(guān)系如下“P”與“正”對應(yīng);”N”與“負(fù)”對應(yīng);“V”即可與“正”對應(yīng)也可與“負(fù)”對應(yīng)。比如在表5中,從Probe1到Probe6都是多態(tài)性位點(diǎn)30,32,33這一組所規(guī)定的探針,假如在一次雜交結(jié)果中它們的信號(hào)依次為+,-,-,+,+,-,從第二行到第十一行依次檢索表5,發(fā)現(xiàn)只有第七行(P,V,N,P,P,N)與此相匹配,所以該檢測樣品在這個(gè)多態(tài)性位點(diǎn)組的組合必為TCG+GCG,即這一多態(tài)性位點(diǎn)組的四種組合TCG,GCA,GCG,GTA的信號(hào)依次為+,-,+,-。按照以上原則,可依次判斷出每一種組合的正負(fù)信號(hào)。第三步、根據(jù)最終的經(jīng)合并處理的各等位基因?qū)εc各組合的匹配關(guān)系表,由各組合的正負(fù)判斷出到底哪一對等位基因在待測樣品中出現(xiàn),即白細(xì)胞抗原的最終分型結(jié)果。知道各個(gè)組合的正負(fù)信號(hào)后,可以從第一行開始依次檢索各等位基因?qū)εc各組合的匹配關(guān)系表,若在各等位基因?qū)εc各組合的匹配關(guān)系表發(fā)現(xiàn)一等位基因?qū)?,其與各組合的匹配關(guān)系與基因芯片檢測出的各組合的正負(fù)信號(hào)完全一致,則待測樣品的白細(xì)胞抗原即為該等位基因?qū)Φ谋磉_(dá)產(chǎn)物;若在各等位基因?qū)εc各組合的匹配關(guān)系表沒有發(fā)現(xiàn)一等位基因?qū)?,其與各組合的匹配關(guān)系與基因芯片檢測出的各組合的正負(fù)信號(hào)完全一致,則待測樣品的白細(xì)胞抗原可能為新的尚未被登記入人類白細(xì)胞抗原等位基因庫的抗原。
權(quán)利要求
1.一種基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于該方法包括如下步驟A.將人類白細(xì)胞抗原各等位基因的序列比對結(jié)果由網(wǎng)絡(luò)中下載到計(jì)算機(jī)的存儲(chǔ)器中,建立一個(gè)數(shù)據(jù)庫;B.讀取數(shù)據(jù)庫中所有白細(xì)胞抗原多態(tài)性位點(diǎn)的信息;C.檢測所有多態(tài)性位點(diǎn),并將所有多態(tài)性位點(diǎn)按堿基位置相互臨近的原則分為若干位點(diǎn)組;D.檢索同一多態(tài)性位點(diǎn)組內(nèi)出現(xiàn)的所有組合,比較每兩種組合,找出堿基類型不相同的堿基位置形成新的數(shù)據(jù)組;E.根據(jù)數(shù)據(jù)組中每個(gè)多態(tài)性位點(diǎn)出現(xiàn)的情況確定分型探針的檢測位點(diǎn);F.根據(jù)探針的檢測位點(diǎn)找出探針的序列。
2.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟A中還包括有合并和刪除程序,由數(shù)據(jù)庫中的每個(gè)單元數(shù)據(jù)進(jìn)行兩兩比較,刪除序列完全相同的等位基因以及包含有序列插入或序列刪除變異的等位基因,得到具有唯一序列的等位基因比對結(jié)果。
3.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟B中的檢測過程是由計(jì)算機(jī)對步驟A所形成的數(shù)據(jù)庫中的單元位置進(jìn)行掃描,忽略不具多態(tài)性的位點(diǎn),顯示多態(tài)性位點(diǎn)的各相關(guān)信息,所述相關(guān)信息包括,在一致性序列中的堿基類型、變異的堿基類型以及變異堿基出現(xiàn)的次數(shù);所述步驟C包括預(yù)分組程序是將兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)目進(jìn)行比較,其差數(shù)小于3~6的分為一組。
4.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟D是針對每個(gè)多態(tài)性位點(diǎn)組,從第一條等位基因開始逐個(gè)考察其組合的類型,記錄下來所出現(xiàn)的新的組合類型,并自動(dòng)形成比照表格,該表格行數(shù)為該組內(nèi)組合數(shù)加一,列數(shù)為組合數(shù)加二;該表格的第一行以及第一列中分別填入各組合類型,進(jìn)一步將上述組合類型進(jìn)行兩兩比較,找出堿基類型不相同的位置,填入該兩種組合類型相交的單元格內(nèi)。
5.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟E是根據(jù)上面的比照表格,考察該表格的每一列中的多態(tài)性位點(diǎn),判定一個(gè)多態(tài)性位點(diǎn)在該列的所有有效單元格內(nèi)是否都出現(xiàn),如果是則確定該多態(tài)性位點(diǎn)作為該探針的檢測位點(diǎn),并填入該列的最下面一格;否則,就要確定多個(gè)多態(tài)性位點(diǎn),使該列中的任一有效的單元格至少有選定的一個(gè)多態(tài)性位點(diǎn)出現(xiàn),這些被選定的多態(tài)性位點(diǎn)就分別是每條探針的檢測位點(diǎn),統(tǒng)計(jì)該組中所需探針的數(shù)量,并形成函數(shù)probe()。
6.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟E后還有優(yōu)化分組程序,包括根據(jù)每組中多態(tài)性位點(diǎn)的數(shù)量多少進(jìn)行優(yōu)化組合和拆分程序,其中優(yōu)化組合程序是對于組內(nèi)多態(tài)性位點(diǎn)數(shù)量較少、兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)目大于3但小于10,暫分為一組,計(jì)算該組所需的探針數(shù)量,調(diào)用函數(shù)probe()進(jìn)行比較,如果前者多則放棄,如果后者多則將它們確定劃歸入同一組;對于組內(nèi)大量多態(tài)性位點(diǎn)擁擠在一起,其中任意相鄰兩個(gè)多態(tài)性位點(diǎn)之間間隔的堿基數(shù)都小于3~6,則將其拆分為多組,計(jì)算拆分后所需的探針數(shù)量,調(diào)用函數(shù)probe()進(jìn)行比較,如果前者多則放棄,如果后者多則按新組劃分,反復(fù)比較,直至找到最佳分組方案后確定;并重新確定探針的檢測位點(diǎn)。
7.根據(jù)權(quán)利要求1所述的基因芯片用人類白細(xì)胞抗原分型探針的篩選方法,其特征在于所述步驟F是以確定的探針檢測位點(diǎn)為中心向左右各延伸6~13個(gè)堿基,確定探針的序列。
8.一種基因芯片用人類白細(xì)胞抗原分型探針的應(yīng)用方法,其特征在于包括以下步驟①以上述方法確定探針檢測位點(diǎn)以及探針序列;②構(gòu)建各等位基因?qū)εc各條探針匹配關(guān)系的判斷程序;③合成探針并將探針置于固相載體上;④PCR擴(kuò)增樣品DNA,與芯片雜交并掃描;⑤由步驟②所建立的判斷程序判別步驟④掃描出來的結(jié)果,將完全匹配的判斷結(jié)果輸出,從而確定待測樣品的白細(xì)胞抗原型別。
9.根據(jù)權(quán)利要求8所述的基因芯片用人類白細(xì)胞抗原分型探針的應(yīng)用方法,其特征在于將步驟④進(jìn)一步詳細(xì)分成以下步驟a.首先建立各種組合與各條探針的單倍體匹配關(guān)系表,即當(dāng)某一組合的序列與某一探針的序列相同,則雜交時(shí)該組合能使該探針位點(diǎn)亮,確定了該組合與該探針匹配;當(dāng)某一組合與某一探針存在不相同的堿基且該堿基正好是該探針的檢測位點(diǎn),則雜交時(shí)擁有該組合的序列不會(huì)使該探針亮,則表示該組合與該探針不相匹配;當(dāng)某一組合與某一探針存在不相同的堿基且該堿基不是該探針的檢測位點(diǎn),這時(shí)分兩種情況如果這個(gè)不相同的堿基與該探針的檢測位點(diǎn)之間的間隔小于該組分組時(shí)確定的標(biāo)準(zhǔn)間隔堿基數(shù),那么雜交時(shí)擁有該組合的序列會(huì)使該探針擁有不確定的信號(hào),即可能使探針亮,也可能使探針不亮;如果這個(gè)不相同的堿基與該探針的檢測位點(diǎn)之間的間隔大于或等于該組分組時(shí)確定的標(biāo)準(zhǔn)間隔堿基數(shù),那么雜交時(shí)擁有該組合的序列會(huì)使該探針亮;b.進(jìn)一步建立雙倍體組合探針匹配關(guān)系表,建立雙倍體組合探針匹配關(guān)系表的方法是將任兩個(gè)組合類型配在一起并將它們與探針的匹配關(guān)系疊加在一起,疊加時(shí)遵循如下原則若一種組合在某一探針處顯示匹配的信號(hào),不管另一種組合在該探針處顯示的信號(hào)是否匹配,則這兩種組合配對后與該探針相匹配;若一種組合在某一探針處顯示不確定信號(hào),則不管另一種組合在該探針處顯示不確定信號(hào)還是不匹配信號(hào),這兩種組合配對后都會(huì)使該探針顯示不確定信號(hào);若兩種組合在某一探針處的信息均顯示不匹配信號(hào),則這兩種組合配對后會(huì)使該探針顯示不匹配的信號(hào);c.比較每一條等位基因與每一組合的序列,判斷各條等位基因與各組合的匹配關(guān)系,若某一條等位基因的堿基類型與某一組合的堿基類型都一致,則該等位基因與該組合相匹配;若某一條等位基因與某一組合在一處或多處堿基類型不相同,則該等位基因與該組合不相匹配;d.比較每兩種等位基因組成的等位基因?qū)εc各組合的匹配關(guān)系,本步驟只要在步驟C的基礎(chǔ)上,將組成該等位基因?qū)Φ膬煞N等位基因與該組合的匹配關(guān)系疊加起來,即可得到該等位基因?qū)εc該組合的匹配關(guān)系;e.對各等位基因?qū)εc各組合的匹配關(guān)系做兩兩比較,合并具有相同組合匹配關(guān)系的等位基因?qū)?,?gòu)建出最終的各等位基因?qū)εc各組合的匹配關(guān)系表;f.由芯片雜交結(jié)果判斷出各條探針的正負(fù),根據(jù)雙倍體組合探針匹配關(guān)系表,由各條探針的正負(fù)判斷出各組合的正負(fù),根據(jù)最終的各等位基因?qū)εc各組合的匹配關(guān)系表,由各組合的正負(fù)判斷出待測樣品的等位基因?qū)Γ创郎y樣品的白細(xì)胞抗原型別。
全文摘要
本發(fā)明公開了一種人類白細(xì)胞抗原高分辨率、并且探針調(diào)試以及確定判定閥值容易的分型探針篩選及其應(yīng)用方法,提出了對多態(tài)性位點(diǎn)進(jìn)行“分組”的解決方案,依此方法設(shè)計(jì)出來的分型探針,檢測位點(diǎn)定位準(zhǔn)確并且包容性較強(qiáng),分辨率高。本發(fā)明的全部篩選過程全部由設(shè)計(jì)的一套計(jì)算機(jī)軟件來執(zhí)行,所以,可以快速準(zhǔn)確地篩選出理想的分型探針。而且本專利還描述了各種匹配關(guān)系表的構(gòu)建方法及如何根據(jù)這些匹配關(guān)系表一步步由芯片雜交結(jié)果判斷出待測樣品的白細(xì)胞抗原類型,解決了該分型探針在實(shí)際工作中的應(yīng)用問題。
文檔編號(hào)C12Q1/68GK1680589SQ0312680
公開日2005年10月12日 申請日期2003年6月6日 優(yōu)先權(quán)日2003年6月6日
發(fā)明者李志廣 申請人:李志廣