專利名稱:用于預測2型糖尿病易感性的試劑盒及引物的制作方法
技術領域:
本發(fā)明涉及用于預測2型糖尿病易感性的試劑盒及引物,更具體地,本發(fā)明涉及利用新鑒別的2型糖尿病易感基因Cdc212的一個單核苷酸多態(tài)性(SNP)位點設計的預測2型糖尿病易感性的試劑盒和引物。本發(fā)明還涉及Cdc212基因在制備預測2型糖尿病易感性的診斷劑中的應用。
背景技術:
大量流行病學資料表明,糖尿病是一種具有明顯遺傳傾向的復雜的多基因遺傳病。遺傳因素可明顯影響機體對胰島素的敏感性。最近幾年,大多數(shù)研究者致力于通過定位克隆法尋找糖尿病相關基因,即尋找患病家系成員間共享的染色體DNA區(qū)域間的連鎖。已發(fā)現(xiàn)2型糖尿病中的一些相對較少見的單基因形式,稱為青年晚發(fā)型糖尿病(maturity-onset diabetes of the young,MODY),是由于突變導致了β細胞功能低下。這些病人通常在青春期到成人早期發(fā)病,表現(xiàn)為葡萄糖反應性胰島素分泌缺陷。這些致病基因中有6個分別編碼葡萄糖激酶、轉錄因子HNF1α、1β、4α及胰島素啟動因子(IPF1),神經(jīng)細胞分化蛋白(NeuroD1)。這些基因突變最終導致高血糖血癥。這些單基因糖尿病的發(fā)病率還不確切,估計占所有2型糖尿病的5%。但是,單純利用定位克隆的策略來確定多基因遺傳病的成功報道還不多。
除了定位克隆法外,目前對多基因遺傳病的相關基因進行研究還有一種方法最常用的方法,即候選基因法,即直接研究疾病候選基因的變異與疾病表型之間的關系。該法主要基于對家系或人群的病例-對照關聯(lián)分析。關聯(lián)分析不需要大的家系研究而是比較某個或某一套標記在患者和正常個體的分布程度。某種標記如果在患病個體中分布十分明顯,那么就可以認為該標記與疾病表型相關聯(lián)。但是,候選基因法中由于對致病基因所在位置沒有足夠了解,在選擇候選基因上存在較大的盲目性,主要針對與疾病發(fā)生發(fā)展相關的一些代謝通路進行研究。將上述兩種方法相結合的定位候選克隆法在一定程度上彌補了任何單一一種方法的局限性,為目前多基因遺傳病研究中所普遍采用的策略。
同遺傳病研究策略相對應,其研究工具—多態(tài)性標記也從第一代的限制性片段長度多態(tài)性(Restrictive Fragment Length Polymorphism,RFLP),第二代的微衛(wèi)星標記(Microsatellite Marker)發(fā)展到第三代的單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNP)。尤其在對多基因遺傳病進行病例-對照關聯(lián)分析中,需要利用大量高密度的標記物,前兩代多態(tài)性標記已不能滿足這種要求。因此,近年來,SNP作為第三代遺傳圖譜的構建者已越來越引起人們的廣泛關注。
單核苷酸多態(tài)性(SNP)主要是指基因組水平上由單核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種,占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛分布,平均每500-1000個堿基中就有1個,其總數(shù)估計可達300萬個甚至更多。近年來,隨著人類基因組及遺傳學研究的進展,SNP在全面深入地了解個體和群體間基因組的變異或多態(tài)性及疾病研究等方面也越來越顯示出其重要意義。將SNP用于疾病易感基因定位的一個最大的優(yōu)點就是它的分布廣泛性。其次是它有比微衛(wèi)星更高的穩(wěn)定性,可以最大限度地減少遺傳過程中由于序列變異所導致的信息遺失。另外,SNP很容易實現(xiàn)高通量的分型,短時間內(nèi)可以產(chǎn)生大量的結果,這一點是微衛(wèi)星所無法比擬的。SNP的上述特點決定了它非常適合于進行象糖尿病這樣的多基因疾病,尤其是多個微效基因所導致的疾病的定位研究。選擇合適的病例和正常對照,采取關聯(lián)分析的研究方法,對SNP而言,是非常適合的。
本發(fā)明人近幾年來一直從事中國北方漢族人群2型糖尿病(非胰島素依賴型糖尿病,NIDDM)基因定位研究。在先前進行的全基因組掃描工作中,本發(fā)明人已經(jīng)分別鑒定出多個易感基因位點,它們分別位于1號,12號,18號及20號染色體上。其中在1號染色體上共有5個存在易感基因的區(qū)域。在此基礎上,本發(fā)明人嘗試從定位區(qū)域選擇合適的候選基因,利用SNP進行了病例-對照關聯(lián)分析,最終終于鑒定了一個糖尿病易感基因(即CDC2L2基因),以及該基因上的一個與中國北方漢族人2型糖尿病特別相關的SNP位點。由此經(jīng)過深入研究完成了本發(fā)明。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面,提供了一種預測2型糖尿病易感性的試劑盒,所述試劑盒包含基于圖1B或圖1A的序列設計的用于PCR擴增的特異引物以及通過核酸擴增進行檢測的試劑盒所含的常規(guī)組件。所述引物針對圖中所示的SNP位點而設計,長度為18bp-21bp。優(yōu)選地,所述引物選自SEQ ID NO1-16組成的一組,更優(yōu)選地,所述引物為具有SEQ ID NO17,SEQ ID NO18所示序列的單堿基延伸(SBE)引物。
根據(jù)本發(fā)明的另一方面,提供了用于預測2型糖尿病易感性的引物,所述引物為基于圖1B或圖1A的序列設計的用于PCR擴增的特異引物,所述引物針對圖中所示的SNP位點而設計,長度為18bp-21bp。優(yōu)選地,所述引物選自SEQ ID NO1-16組成的一組。根據(jù)本發(fā)明的一個更優(yōu)選的實施方案,本發(fā)明的引物為SEQ ID NO17,SEQID NO18所示的單堿基延伸(SBE)引物。
根據(jù)本發(fā)明的再一方面,提供了Cdc212基因作為2型糖尿病易感基因在制備用于糖尿病診斷的診斷劑中的應用,Cdc212基因的核苷酸序列如SEQ ID NO19所示。
圖1A示出本發(fā)明的SNP位點(R)所在的Cdc212基因區(qū)域的核苷酸序列。
圖1B為圖1A序列的互補序列具體實施方式
定義單核苷酸多態(tài)性(SNP)主要是指基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種,占所有已知多態(tài)性的90%以上。
微衛(wèi)星位點把長度為2-6個核苷酸的串聯(lián)重復序列(VNTR)稱為微衛(wèi)星(Microsatellite),微衛(wèi)星位點有兩個最突出的優(yōu)點一是它出現(xiàn)頻率很高,遍布于整個基因組,而且,由于短序列在進化上不受選擇,因而在同一位點上可變重復單位數(shù)目變化很大,一個位點可能有多達幾十種的等位基因,信息含量高;二是STR兩側的特異性單拷貝序列穩(wěn)定性高,可作為檢測其多態(tài)性的PCR引物。以PCR技術操作,可以實現(xiàn)自動化大規(guī)模操作基因分型及等位基因頻率分布同一種群生物中,相同等位基因核苷酸序列順序分析,在此表示相同SNP位點在不同個體中的組成成分的確定,為基因分型。等位基因頻率是指所研究的同一種類等位基因里,所期望出現(xiàn)的等位基因占的比例,也就是出現(xiàn)變化的等位基因的所占比例。
疾病易感性(糖尿病易感性)人群對疾病容易感受程度。
病例-對照關聯(lián)分析是一種由因及果的回顧性研究。它是先按疾病狀態(tài)確定調查對象,分為病例和對照組,通過比較病例組與對照組間所研究的遺傳標志出現(xiàn)頻率的差異而獲得該標志與疾病間關聯(lián)的信息。
單堿基延伸(SBE)反應它是指在缺乏四種dNTP、存在四種ddNTP的情況下,測序酶可在引物的3’端加上一個ddNTP,但因為不能形成磷酸二酯鍵,故不會繼續(xù)延伸,堿基延伸一個后即告終止。只需檢測這一個堿基即可。又稱微測序法(Minisequencing)。
參數(shù)連鎖分析和非參數(shù)連鎖分析根據(jù)基因的重組率來計算兩個基因之間的染色體圖距即連鎖分析,用分類變量(離散變量)來進行分析,把測量指標按某一標準歸類,計數(shù),然后進行分析為參數(shù)分析,用實際測量后的結果進行的分析為非參數(shù)連鎖分析,2型糖尿病的病因十分復雜,在大多數(shù)情況下都會發(fā)生胰島素抵抗和β細胞的功能缺陷。隨著病情的發(fā)展,β細胞的功能缺陷加劇,使得胰島素的分泌不足,病人必須補充胰島素來維持正常的代謝。研究表明,在出現(xiàn)臨床癥狀之前,β細胞的缺損就已經(jīng)出現(xiàn)了。已經(jīng)通過不同的途徑表現(xiàn)出來在葡萄糖或者其他促分泌劑的刺激下胰島素的分泌減少,胰島素的分泌特點上出現(xiàn)了問題,前胰島素原到胰島素的轉變的效率的改變,還有,胰島細胞淀粉小體多肽(Islet AmyloidPolypeptide,IAPP)釋放的減少。
胰島素的抵抗會引起β細胞分泌功能的提高。這一提高需要胰島素的生物合成和釋放,這一現(xiàn)象提示,經(jīng)過一段時間,和胰島素的抗性的增加引起的對胰島素需求的增加導致了β細胞的“衰竭”,因此最終會失去功能。在沒有遺傳缺陷的個體中在胰島素抵抗的時候,β細胞會有適應性改變,并且防止最終防止發(fā)生高血糖。因為,幾乎在所有的肥胖個體中都有存在不同程度的胰島素抵抗,只有一小部分的個體最終發(fā)展成為糖尿病。這說明,正常的β細胞可以適應胰島素的抵抗,遺傳易感個體攜帶的突變,使得個體無法完全適應胰島素的抵抗,而導致遺傳性的β細胞程序型死亡。這樣,增加的胰島素分泌因此暴露了β細胞功能的缺陷。
血液中葡萄糖不正常的代謝狀態(tài)導致了細胞凋亡的加速。在人的體外培養(yǎng)的人的胰腺的朗罕氏細胞中發(fā)現(xiàn)高糖可以調控bcl基因家族的表達,來誘導細胞的凋亡。有一系列的研究表明在2型糖尿病患者中都發(fā)生減少。β細胞質量的減少導致了胰島素的分泌的減少,然而質量的減少并不能解釋觀測到的所有的功能改變,質量減少的病理學原因可能是多因素的。
CDC2L2基因編碼p34Cdc2蛋白激酶家族成員,位于1p36.3。該激酶家族成員對真核細胞的細胞周期調控起著關鍵的作用。
蛋白激酶p58(CDC2L1)是人的細胞分裂控制相關分子,在結構上和功能上與p34相關。CDC2是蛋白激酶復合體的催化亞基,叫做M-相促進因子,他可以誘導細胞進入有絲分裂,并且在真核生物中普遍存在。P58位于1p36,Eipers①等人通過人鼠體細胞雜交研究發(fā)現(xiàn)一個高度相關的p58序列定位到15號染色體,隨后,在15號染色體上的CDC2L2被hugo命名委員會取消了這個名字。這個名字代表1p36的一個基因。
后期的神經(jīng)細胞瘤和腫瘤細胞系都包含在1號染色體末端的一個缺失。這個缺失總是和增強的轉化的可能性相關,表明有一個抑癌基因失活或者1p上的基因與這些癌癥的致病有關。在研究位于1p上CDC2L1候選的腫瘤抑制基因時,Lahti等人發(fā)現(xiàn)高度相關的基因就位于100kb的區(qū)域內(nèi)。他們把PITSLRE B叫做CDC2L1,遵循命名CDC2相關激酶的慣例,按照CDC2的保守的PSTAIRE框氨基酸序列。相關的基因命名為PITSLRE A,或者CDC2L2。
Xiang等人分離出了多個選擇性剪切的CDC2L2 mRNA。CDC2L2轉錄產(chǎn)物不同的剪切產(chǎn)物編碼5個蛋白的異構體,從65KD到110KD。不同的剪切產(chǎn)物N端長度不同,蛋白激酶的C端結構域是相同的。都包含一個30個殘基的酸性結構域,主要由谷氨酸構成。這些mRNA編碼了3個最大的異構體CDC2L2α2-1,2-2,和2-3,包含了兩個翻譯起始位點由58氨基酸分隔開。亞細胞成分研究表明,110KD蛋白首先定位在核內(nèi),65KD蛋白只有在細胞進行凋亡的時候才檢測到。Northern雜交分析表明,α-2蛋白由3.5,3.7kbmRNA在大多數(shù)的人的細胞系和組織中都有表達,編碼65kdCDC2L2蛋白的mRNAα-1具有更加嚴格的表達方式,另外還檢測到了α-1 mRNA的一個反義mRNA。
CDC2L1和CDC2L2基因編碼幾乎一樣的110KD的蛋白,這個蛋白的C端有一個58KD蛋白的開放閱讀框。Comelis等人發(fā)現(xiàn)p110和p58蛋白是從一個轉錄子上不同的閱讀框翻譯的。
發(fā)現(xiàn)的SNP位于距EXON11下游49bp處的G→A的多態(tài)性位點,該EXON11受到選擇性剪切,其中在異構體2,異構體3,異構體4,異構體5,異構體7,異構體10的mRNA中,而在異構體1,異構體9中不存在。CDC2L2基因的突變也許會對正常的細胞周期調控產(chǎn)生影響。導致細胞在高糖的生理狀態(tài)下更容易滑向凋亡,從而在糖尿病的發(fā)病過程中起到很重要的作用。
本課題組的先期工作表明,1、12、18和20號染色體上均存在有中國北方漢族人2型糖尿病的易感基因位點,其中1號染色體上有4個區(qū)域(1p36、1p31、1q22及1q42-43)顯示與2型糖尿病相連鎖(本組前人作出,不需要文獻)。如下述實施例所示,進一步對該區(qū)域進行的精細掃描結果顯示,其中有3個區(qū)域(1p36.33-36.23、1q24.3-25.1及1q42.12-42.13)仍存在連鎖。
目前有多個公共數(shù)據(jù)庫儲存了幾百萬條SNP信息,人們可以通過多種方式,如以基因名、登記號、染色體號、功能級別等,進行查尋。但是,這些數(shù)據(jù)庫中的SNP絕大多數(shù)只是“候選者”,而非經(jīng)過驗證的真正SNP。它們是利用計算機在對多個克隆序列進行比對時發(fā)掘出來的,其中必然存在一部分假陽性SNP。另外,這些SNP大多數(shù)是利用高加索人和黑人測序尋找的SNP,在中國人群中的分布有些不一定相同,我們利用中國北方漢族人群的糖尿病患者和正常對照,重新測序尋找SNP。并利用我們在中國北方漢族糖尿病人群中發(fā)現(xiàn)的高頻的SNP進行基因分型。
為尋找2型糖尿病易感基因,本發(fā)明人根據(jù)美國國家生物信息學(National Center for Biotechnology Information)中心公布的信息選取位于1p36.23-36.33、1q24.3-25.1及1q42.12-42.13區(qū)域的2型糖尿病34個候選基因,對這些基因的外顯子,Promotor區(qū)2kb,以及臨近的內(nèi)含子的區(qū)域進行測序篩查中國北方漢族人群中的SNP。并對其中部分高頻的SNP進行基因分型,通過SBE反應(包括直接的SBE反映,SnapshotTM試劑盒,SnupeTM試劑盒),酶切,序列測定等方法對其在病例組及對照組進行分型及病例-對照關聯(lián)分析。
如以下實施例所詳細討論的,所選擇的124個高頻的SNP位點中,CDC2L2基因內(nèi)選取了15個位點進行基因分型,發(fā)現(xiàn)本位點和糖尿病相關,分別位于異構體2,異構體3,異構體4,異構體5,的第11號內(nèi)含子的+49位處,在異構體7中是位于第3號內(nèi)含子的第+4199位點,在異構體10中是位于第3號內(nèi)含子的第+49位點,的一個SNP位點(R,即A/G),這是一個全新的SNP,在NCBI的SNP數(shù)據(jù)庫中沒有登錄。其等位基因頻率分布在病例組和對照組中的差異有統(tǒng)計學意義(P<0.05),提示這一SNP位點與2型糖尿病相關,進一步得出結論,其所在基因CDC2L2基因為中國北方人2型糖尿病的易感基因。
因此,本發(fā)明的一個方面涉及糖尿病易感基因CDC2L2基因在預測糖尿病易感性中的應用?;贑DC2L2基因,可以獲得各種診斷劑和試劑盒以用于預測糖尿病易感性。
CDC2L2所在基因組序列如SEQ ID NO19所示,全長為21,444bp,本發(fā)明所揭示的SNP位點(R)位于該序列的15,451-16,950位之間,這一區(qū)域的核苷酸序列如圖1A所示,圖中R為SNP位點,其代表堿基A/G多態(tài)性,即該位點可以為A,也可以為G。這一區(qū)域的互補序列如圖1B所示,圖中Y代表本發(fā)明的SNP位點的互補堿基,其代表堿基T/C。
本發(fā)明還涉及用于預測2型糖尿病易感性的引物。優(yōu)選地,所述引物基于圖1A的序列而設計,由此,PCR擴增后的產(chǎn)物測序可以直接測得SNP位點。當然,本發(fā)明的引物也可以基于圖1B的序列設計,這樣PCR擴增后的產(chǎn)物測序得到SNP的互補堿基。優(yōu)選地,本發(fā)明的引物具有SEQ ID NO1-16所示的序列,特別優(yōu)選的是SEQ IDNO17SEQ ID NO18所示的SBE引物。下表1舉例示出了本發(fā)明的引物的一些組合,引物的解鏈溫度(Tm)以及這些組合得到的產(chǎn)物大小。本領域技術人員能夠理解,本發(fā)明的引物不限于這些列出的引物及其組合。
表1
本發(fā)明進一步涉及包含本發(fā)明的一或多種引物的試劑盒,該試劑盒用于檢測2型糖尿病的易感性。除了本發(fā)明的引物之外,所述試劑盒還包含運用PCR擴增而進行檢測的試劑盒的常規(guī)組件、試劑、緩沖液等,本領域技術人員熟悉這些常規(guī)組件和檢測方法。
以下將參照實施例進一步描述本發(fā)明。
實施例1中國北方漢族人群2型糖尿病易感基因的精細定位1、2型糖尿病家系的收集收集中國北方漢族人群中滿足以下要求的2型糖尿病家系1)家系中連續(xù)2代或2代以上出現(xiàn)2型糖尿病患者,每代至少有一個患者、一個正常人。
2)糖尿病患者應是在正規(guī)醫(yī)院確診的、對胰島素不敏感者(除外1型糖尿病)。入選的對照個體年齡應在35歲以上(以盡量排除尚未發(fā)病的家系成員)。
3)除糖尿病外,不合并其它明顯器質性疾病,如高血壓、冠心病(除外糖尿病所導致的并發(fā)癥)等。
在采集家系前應確保所有家系成員都了解采血目的,即有知情權,血樣提供人在了解了所有情況后,若同意,要在“知情同意書”上簽字,才能實施抽血和其它個人情況的調查。若不同意,則尊重其個人意見。將收集的資料嚴格保密,不對外公布供血成員的姓名、年齡、疾病等所有資料。
對入選家系的每一個成員,除已明確診斷的2型糖尿病患者外,均應進行口服葡萄糖糖耐量試驗(Oral Glucose Tolerance Test,OGTT),以確認每一個成員是否可作為正常對照。OGTT試驗過程抽取空腹靜脈血及口服75g葡萄糖(5分鐘內(nèi)喝完)后30分鐘、60分鐘、120分鐘及180分鐘的靜脈血,觀察血糖濃度的動態(tài)變化情況。此外,記錄每一個體一般情況,包括性別、出生年月、籍貫、發(fā)病年齡、身高、體重、心率、呼吸、血壓、用藥情況、有無合并癥、以及血脂、血電解質等項目,必要時行特殊檢查,以排除合并有高血壓、心臟病、動脈粥樣硬化等疾病的家系。
2型糖尿病的診斷嚴格按照WHO于1985年頒發(fā)的標準執(zhí)行。即空腹血葡萄糖濃度≥7.8mmol/L或餐后2小時血糖≥11.1mmol/L為糖尿病。OGTT的判斷標準為服糖后2小時血葡萄糖濃度<7.8mmol/L為正常,≥11.1mmol/L為糖尿病,在7.8-11.1mmol/L之間為糖耐量低減(impaired glucose tolerance,IGT)。
共采集到60個符合以上條件的2型糖尿病家系,成員共計367人。其中2型糖尿病患者180例,正常人171例,IGT患者16例。這些家系分別來自北京、山東、河北、內(nèi)蒙古、河南等地的漢族人群。繪制所有家系的家系圖,并對每一家系及家系成員進行編號,此編號同DNA入庫號一致。在所收集到的家系中,15%(9/60)為三代家系,85%(51/60)為二代家系。患者中男性為83人,女性為97人;IGT者16人。家系成員平均年齡為50.03歲,其分布情況(分患病和正常)見表2表2 2型糖尿病家系成員年齡構成
取所有家系每一成員的外周血樣備用。
2、PCR擴增微衛(wèi)星片段、基因分型常規(guī)方法提取上述血樣中的基因組DNA,提取后的DNA均溶解于TE緩沖液中,注明樣品所屬家系、編號等資料,-20℃保存待用。
在以往全基因組掃描陽性區(qū)(1p36,1p31,1p12,1q22,1q42-43區(qū),20p12,20q13區(qū),12p12區(qū)及18q23區(qū))選擇雜合度較高、分布較為均勻的微衛(wèi)星位點進行第二輪掃描。共選擇了60個位點,其中1號染色體5個陽性區(qū)域內(nèi)34個,平均密度3.2cM;12號染色體4個,平均密度2.2cM;18號染色體4個,平均密度1.9cM;20號染色體上3個區(qū)域內(nèi)18個,平均密度2.6cM。這些微衛(wèi)星位點的最低雜合度為0.64,最高為0.88,平均值0.748。部分微衛(wèi)星位點的遺傳學位置自http//www-genome.wi.mit.edu查找所得(在“Human PhysicalMapping Project”欄下),部分自法國Genethon的人類多態(tài)性中心的資料上獲得。在所用的60個微衛(wèi)星位點中,16個在ABI公司Version2.0試劑盒中已有引物,46個需新設計合成引物。新合成的一對引物中的一條用熒光物質FAM或HEX標記。所有引物在合成時綜合考量PCR擴增片段長度的大小及可能的合理分組情況來確定熒光標記的顏色。反應所用的引物序列參見法國Genethon遺傳圖譜的Microsatellite Markers Data Set。各微衛(wèi)星位點擴增片段長度及引物信息見表3。
表3 60個微衛(wèi)星位點的大小范圍與標記熒光位點名稱片段大小(bp)標記熒光位點名稱片段大小(bp)標記熒光D1S243 142-170 HEX D1S2709 191-197 FAMD1S468 173-191 HEX D1S2800 195-225 FAMD1S2845 193-233 FAM D1S235 175-195 FAMD1S214 122-152 NED D1S2850 145-153 FAMD1S2663 183-205 FAM D12S1625264-280 FAMD1S472 228-244 FAM D12S77 163-193 FAMD1S2892 93-129 FAM D12S336 117-135 NEDD1S2722 195-223 FAM D12S89 254-288 HEXD1S463 223-233 HEX D18S465 233-251 HEXD1S211 170-198 HEX D18S61 213-243 NEDD1S2627 265-279 FAM D18S1125268-286 FAMD1S2868 210-224 FAM D18S488 239-264 HEXD1S497 250-278 FAM D20S906 229-247 FAMD1S206 208-226 NED D20S842 156-180 HEXD1S495 138-164 FAM D20S889 93-129 FAM
D1S2707 137-159 FAM D20S849 214-236 FAMD1S2878 152-178 NED D20S95 82-100 FAMD1S196 322-338 HEX D20S892 205-223 FAMD1S2815 210-237 FAM D20S115 238-250 NEDD1S218 266-286 NED D20S851 128-150 FAMD1S466 155-175 EAM D20S901 260-268 FAMD1S2692 187-217 HEX D20S186 121-143 HEXD1S245 235-253 FAM D20S852 152-176 HEXD1S205 94-112 FAM D20S112 217-241 FAMD1S425 336-360 NED D20S912 267-283 FAMD1S419 162-194 FAM D20S857 204-220 FAMD1S2860 168-184 FAM D20S840 141-165 FAMD1S2880 113-135 FAM D20S120 213-241 FAMD1S213 107-133 NED D20S100 213-239 HEXD1S2833 92-108 FAM D20S102 169-177 FAMPCR擴增后,在377電泳儀(ABI公司)上進行電泳,用377電泳圖象收集軟件(ABI PrismTM377-96 Collection或ABI PrismTM377XL Collection)收集結果,在GENEHUNTER2.0軟件(美國麻省理工學院遺傳系編寫,從http//cmag.cit.nih.gov上可自由下載)上運算,計算相關的位點與表型連鎖的P值、Z值。結果顯示在所研究的10個區(qū)域中有3個區(qū)域繼續(xù)顯示出與糖尿病連鎖的證據(jù),如表4所示表4 3個陽性區(qū)域內(nèi)有意義位點的遺傳位置、P值及Z值位點名稱距p末端距離(cM)細胞遺傳學位置統(tǒng)計P值統(tǒng)計Z值D1S243 0.01p36.33 0.008341.653D1S468 6.21p36.33 0.0015 2.135D1S2845 11.1 1p36.32 0.033 1.292D1S214 16.4 1p36.31 0.0025 2.005D1S2663 16.9 1p36.23 0.002051.996D1S2815 193.8 1q24.30.001262.17D1S218 196.5 1q25.10.043 1.2
D1S2800 256.21q42.12 0.0128 1.579D1S235 258.71q42.13 0.0547 1.363從上表可以看出,1p36.33-36.23區(qū)有意義(P<0.05)的陽性位點最多,共有5個,最低的P值為0.0015,Z值2.135,5個位點分布在長達16.9cM的區(qū)域內(nèi)。1q243-25.1區(qū)有2個位點,1q42.12-42.13區(qū)有1個位點滿足P<0.05的標準,另外D1S235的P值雖然略高于0.05,但其Z值已達統(tǒng)計學界值(Z>1.36),因此可以認為該位點與糖尿病還是有連鎖關系的。這兩個區(qū)域已分別精細定位至2.7cM(D1S2815-D1S218)和2.5cM(D1S2800-D1S235)的狹窄范圍內(nèi)。引人注目的是在1p36.33-36.23區(qū),連續(xù)5個位點都出現(xiàn)了P值小于0.05的情況,因此下一步選擇此區(qū)域克隆易感基因。
實施例2 2型糖尿病易感基因CDC2L2的鑒定及該基因內(nèi)SNP的相關研究1、中國北方漢族人群2型糖尿病患者及正常對照標本的收集正常組及2型糖尿病組人群外周血樣本均采自北京協(xié)和醫(yī)院內(nèi)分泌科門診。標本來源均為我國北方地區(qū),包括北京、山東、河北、內(nèi)蒙古自治區(qū)等地,以北京為主。糖尿病可為散發(fā),也可為糖尿病家系的成員(但此時每一家系中通常只有一個患者入選,同一家系中沒有任何血緣關系的成員可以選擇一個以上);正常對照來自正常人群,要求其家庭三代以內(nèi)沒有糖尿病患者(包括I型糖尿病),對照組與患病組年齡及性別相匹配。
2型糖尿病診斷同實施例1。入選的每個成員記錄一般情況,包括性別、出生年月、籍貫、發(fā)病年齡、身高、體重、心率、呼吸、血壓、用藥情況、有無合并癥等,對每個成員檢查血脂、血電解質等項目,必要時行特殊檢查,以排除合并有高血壓、心臟病、動脈粥樣硬化等疾病。入選的每個成員都應在“知情同意書”上簽字。
共采集到325份標本,其中病例組173份,對照組152份。兩組在性別、年齡上相匹配,糖尿病患者的平均年齡為51.99歲,正常對照采樣時的平均年齡為48.8歲。在所有成員中,男女的比例為169∶156,病例組男性92人,女性81人;對照組男性77人,女性75人。兩組成員的年齡分布情況如下表5患病組和對照組成員的年齡構成
2、候選基因的確定及候選基因中用于基因分型的SNP位點的選擇基于實施例1的結果,即染色體1p36.33-36.23區(qū)域與2型糖尿病相連鎖,利用生物信息學方法從NCBI SNP數(shù)據(jù)庫(www.ncbi.nlm.nih.gov/SNP)中選出位于這一區(qū)域或其附近的37個與葡萄糖代謝相關基因測定基因的promotor區(qū)2kb,外顯子及其鄰近的內(nèi)含子區(qū),和3’非翻譯區(qū)。并對其中的80個高頻的snp進行基因分型,所述的34個候選基因如下(1)CASP9位于染色體的1p36.3-p36.1,是caspase家族成員的半胱氨酸精氨酸蛋白酶,caspase蛋白的順序活化在凋亡的執(zhí)行階段起到重要的作用。caspase蛋白以無活性的前提蛋白形式村子,通過在保守的精氨酸殘基處斷裂產(chǎn)生兩個亞基,這兩個亞基結合成有活性的蛋白酶。
(2)CDC2L2基因編碼p34Cdc2蛋白激酶家族成員,位于1p36.3。該激酶家族成員對真核細胞的細胞周期調控起著關鍵的作用。
(3)磷酸葡萄糖脫氫酶(PGD)是戊糖磷酸旁路途徑中的第二個脫氫酶,位于人染色體的1p36.3-p36.13。
(4)PRKCZ是蛋白激酶Cζ成員,位于染色體的1p36.33-p36.2位置。是絲氨酸,蘇氨酸蛋白激酶家族中的ζ成員,它參與數(shù)種細胞代謝過程,(5)SAC基因編碼一個與典型的哺乳動物不同的腺苷酸環(huán)化酶,位于染色體的1q24。
(6)Urotensin II基因位于染色體1p36,編碼一個成熟的多肽具有活性的環(huán)12肽,從七腮鰻到人類具有很高的保守性。
(7)GNB1基因位于染色體1p36.33,在信號接受分子和效應分子之間傳遞信號,由三個不同的亞基組成,這個基因編碼beta亞基。
(8)GPR52基因位于染色體1q24,G蛋白耦聯(lián)的受體家族成員。
(9)氨氯吡咪敏感性鈉離子通道δ亞基(dNaCh,SCNN1D)基因位于1p36.32區(qū)NT_002209中,編碼產(chǎn)物屬非電壓敏感型通道蛋白,可被利尿劑氨氯吡咪抑制,介導腔內(nèi)離子的電擴散,以異源四聚體的形式存在于膜上。
(10)乙酰CoA硫酯水解酶(HBACH)基因位于1p36.23區(qū)NT_002530中。編碼產(chǎn)物屬乙酰輔酶家族成員之一,可水解棕櫚酸CoA的CoA硫酯及其它長鏈脂肪酸。
(11)Urotensin II位于1p36.23區(qū)NT_002530中。目前對其蛋白功能所知甚少,但已知其保守性很高。一個G蛋白偶聯(lián)受體GPR14可作為其受體。
(12)DJ-1(RNA結合蛋白調節(jié)亞基)位于1p36.23區(qū)NT_002163中。
(13)5,10-亞甲基四氫葉酸還原酶(MTHFR)基因位于1p36.21區(qū)AL354994克隆中。5,10-亞甲基四氫葉酸還原酶參與葉酸代謝,是同型半胱氨酸葉酸依賴的再甲基化過程的關鍵酶,以同源二聚體形式發(fā)揮催化活性,受S-腺苷蛋氨酸別構調節(jié)。
(14)氯離子通道B(CLCNKB)基因位于1p36.13區(qū)bA254I4.00143(長47068bp,屬unfinished sequence)中,編碼電壓門控型氯離子通道蛋白B型,主要在腎中表達,它和A型有94%的同源性。氯離子通道可參與調節(jié)細胞體積、膜電位穩(wěn)定性、信號傳導及跨上皮轉運等。
(15)TNFSF4位于染色體的1q25,編碼一個腫瘤壞死因子受體超家族的個體。
(16)TNFSF6位于染色體的1q23,編碼一個腫瘤壞死因子受體超家族的個體。
(17)SLC19A2位于染色體的1q23.3,編碼維生素b1的轉運蛋白,屬于葉酸轉運超家族的成員。
(18)CDC42BPA又叫做PK428,位于染色體1q42.11,和肌強直性營養(yǎng)不良相關的蛋白激酶相似,絲氨酸,蘇氨酸蛋白激酶,和cAMP依賴的蛋白激酶相似。
(20)KCNK1位于染色體的1q42-q43,這個基因編碼一個鉀離子通道蛋白超家族的成員,包含有2個形成孔蛋白的p結構域,這個基因的產(chǎn)物看起來不是一個功能性的通道,他需要其他的蛋白的參與才具有活性。
(21)ATP2B4位于染色體的1q25-q32,這個基因編碼一個質膜鈣離子泵。
(22)CACYBP位于染色體的1q24-q25,這個基因編碼一個鈣結合蛋白的結合蛋白,這個蛋白的結合的作用還不清楚。
(23)氯離子通道A(CLCNKA)基因,位于1p36.13區(qū)bA254I4.00143(長47068bp,屬unfinished sequence)中,編碼電壓門控型氯離子通道蛋白A型,主要在腎中表達。
(24)ENO1位于染色體的1p36.3-p36.2,這個基因編碼哺乳動物中的3個烯醇化酶異構酶中的一個,它編碼一個alpha烯醇化酶,一個同源二聚體可溶性酶。
(25)DFFA位于染色體的1p36.3-p36.2,這個基因編碼一個DNA片段化因子DFF,這個是個異源二倍體蛋白包括DFFB和DFFA兩個亞基。
(26)G蛋白伽馬4蛋白(GNG4),是異源三聚體的G蛋白復合體中的一個組分,三聚體蛋白從G蛋白耦聯(lián)的受體產(chǎn)道信號到細胞內(nèi)的效應器。
(27)ICMT異戊基半胱氨酸羰基甲基轉移酶,位于染色體的1p36.21,這個基因編碼一個翻譯后修飾蛋白的轉移酶。
(28)RE2是G蛋白耦聯(lián)的受體,位于染色體的1q23.2,這個基因是視紫質家族的G蛋白耦聯(lián)受體,協(xié)助調控攻擊和進食。
(29)PKLR是肝臟丙酮酸激酶的L型的糖分解酶,位于染色體的1q23.2,將磷酸烯醇式丙酮酸轉變成丙酮酸,并且生成ATP。
(30)ALPL是一種非組織特異性的堿性磷酸酶,位于染色體的1p36.1-p34,在肝臟,骨骼,腎臟都有分布。準確的生理功能現(xiàn)在未知。
(31)PLA2G2D是磷酸酯酶A2,IID組,位于染色體的1p36.12,優(yōu)先水化磷脂的sn-2酯鍵,也許在感染的過程中有重要的功能。
(32)CA14是羰基脫水酶家族中的一個,位于染色體的1q21,催化二氧化碳的可逆性水化,參與數(shù)種不同的生理過程。
(33)CA6是羰基脫水酶家族中的一個,位于染色體的1p36.2,催化二氧化碳的可逆性水化,主要在唾液腺里邊發(fā)現(xiàn)。
(34)PANK4是泛酸酯激酶家族的成員,位于染色體的1p36.23,在細菌和哺乳動物中催化輔酶A的生物合成。并受到輔酶A的反饋調節(jié)。
所選擇的用于基因分型的80個SNP位點如表6所示。
3、SNP位點基因分型分析主要采用3種方法進行SNP的分型長度多重性單堿基延伸(LengthMultiplexed Single Base Extension,LM-SBE)反應,SnaPshot法,限制性片段長度多態(tài)性(Restrictive Fragment Length Polymorphism,RFLP-PCR)及測序分型。
1).LM-SBE反應進行SNP分型1.1)引物設計與合成針對上述23個SNP位點中的每一個SNP位點設計3條引物,其中的2條為PCR引物,用于擴增包含SNP位點的一段序列,另外一條是SBE引物,用于單堿基延伸反應。PCR引物通過Primer 3.0程序在線設計,擴增片段長度為150~300bp。
SBE引物設計原則引物要位于SNP位點的5′端,其3′端的最后一個堿基恰好是與SNP緊鄰的前一個堿基。引物長度在18~46base之間,Tm值在55~80℃之間。預備同組的幾個位點為不同類型交替出現(xiàn),其長度相差4個(或其倍數(shù))堿基,且它們之間不能形成發(fā)卡結構,較長的SBE引物不能形成回折等二級結構。參照文獻(Lindhlad-Toh K,Winchester E,Daly MJ,et al.Lange-scale discoveryand genotyping of single-nucleotide polymorphisms in the mouse.Nat.Genet..2000,24381-386)。
另外,設計用作分子量大小標準的FAM標記的DNA片段,其大小分別為19bp、23bp、27bp、31bp、35bp、39bp、43bp、47bp,所有序列均為AT重復而成。
1.2)PCR反應及產(chǎn)物鑒定將不同類型及不同SBE引物長度的多個SNP位點(一般為3-5個)組合為一組,先進行多重PCR擴增包含SNP位點的相應數(shù)目DNA片段。反應體系5μl,各組分如下名稱 原液濃度加樣量(μl)體系終濃度Mg2+25mM0.63mM緩沖液 10× 0.51×dNTP 2mM 0.075 30nM引物 10μM 0.05×n各0.1μMAmpliGold5U/μl 0.05 0.05U/μl模板 50ng/μl1 5ng/μlddH2O 補齊至5μl采用Touch-down PCR,其程序如下94℃、12分鐘后,進行15個循環(huán)的94℃ 30秒、63℃ 30秒(每一循環(huán)溫度下降0.5℃)、72℃50秒,隨后24個循環(huán)的94℃30秒、56℃30秒、72℃ 50秒,最后72℃10分鐘兩次。反應結束后用1%瓊脂糖電泳鑒定,在UV燈下觀察有無產(chǎn)物,并在紫外凝膠成像儀拍照,記錄時間、位點名稱、樣品號等。
1.3)PCR產(chǎn)物純化PCR反應后體系中殘存的dNTP及沒有參與反應的單鏈引物會影響下一步的SBE反應,故用作SBE反應模板的PCR產(chǎn)物需要清除這兩者。蝦堿性磷酸酶(Shrimp AlkalinePhosphatase,SAP)可以將dNTP 5′端的磷酸基團去除,使之不能形成磷酸二酯鍵,從而不能參與DNA鏈的延伸;核酸外切酶I(Exonuclease I,ExoI)可從單鏈DNA的3′端到5′端方向逐個降解核苷酸,從而避免PCR反應剩余的引物影響下一步的SBE反應。
在每5μl PCR產(chǎn)物中加入2μl酶混合液,其中含SAP 0.5U/μl,Exo I 1U/μl,混勻,置入37℃水浴箱消化1小時,取出后離心,85℃ 15min滅活SAP及Exo I,用作SBE反應模板。
1.4)LM-SBE反應由于體系中只有熒光標記的ddNTP(本實驗中分別為JOE-ddATP,F(xiàn)AM-ddGTP,TAMRA-ddCTP ROX-ddUTP),使用對熒光標記ddNTP摻入率比較高的熱測序酶(ThermoSequenase)來進行反應,可使每個SBE引物在反應中僅延伸一個堿基即告終止。盡管擴增只是線性增長的,但40個循環(huán)后,在ddNTP足量的情況下,其總量也達到了模板的40倍,足以進行檢測。
反應體系為5μl,各組分如下名稱 原液濃度 加樣量(μl) 體系終濃度Mg2+25mM 0.5 2.5mM緩沖液 10× 0.5 1×JOE-ddATP0.12μM 0.1 2.4nMFAM-ddGTP0.12μM 0.1 2.4nMTAMRA-ddCTP 0.12μM 0.1 2.4nMROX-ddUTP0.60μM 0.1 12nMSBE引物 2μM 0.05×n 40nMTheromo Sequenase10U/μl 0.0250.05U/μl模板 1ddH2O 補齊至5μl反應程序為95℃、3分鐘后,進行40個循環(huán)的95℃ 30秒、50℃ 30秒、60℃ 40秒,最后60℃2分鐘。
1.5)電泳SBE產(chǎn)物1μl與上樣緩沖液等比例混合,在377測序儀上進行電泳。加樣時可分別于電泳時及加樣后30分鐘2次加樣,在加樣孔的兩端分別各加一個孔的大小標準。電泳結束后通過觀察SBE產(chǎn)物電泳位置并與大小標準比較,即可判斷是哪一個位點。
1.6)基因型判定及數(shù)據(jù)整理根據(jù)條帶顏色判定SNP基因型,藍色為G/G,綠色為A/A,黃色為C/C,紅色T/T,藍/綠色為A/G,黃/紅色為C/T。將各位點分型結果整理為Excel格式以進行統(tǒng)計處理。
2)SnaPshotTM進行基因分型
SnaPshotTM是PE公司基于單堿基延伸(SBE)的原理開發(fā)的基因分型的試劑盒,多重引物特異性延伸用于多個SNP位點同時做基因分型,必須在ABI3700測序儀上運行。
2.1)需要分型的SNP位點,一般把7~8個位點放入同一個體系中,引物的3’末端必須設計在SNP位點的上游或下游的鄰近位點,規(guī)則同普通的PCR反應。各引物的Tm值最好接近,不能低于50℃;2.2)在引物前加上適當長度的polyT,使各個位點之間至少相差4bp,并盡可能使鄰近的兩個位點沒有重合的堿基,(例如3個位點依次是C/T,A/G,C/T);2.3)分別用常規(guī)方法PCR含有各SNP位點的DNA片段,標定濃度后等量混合、純化;2.4)將各個SNP位點的延伸引物等量混合并稀釋到分別為0.5μM。將SNaPshot反應混合物2μl、引物混合物2μl和純化后的PCR產(chǎn)物混合物1μl混勻,96℃ 10s,50℃ 5s,60℃30s,30個循環(huán)進行引物特異性延伸。反應產(chǎn)物中加入9倍體積的70%乙醇,常溫下靜置20分鐘,4℃4000轉離心45分鐘,棄上清,再加入9倍體積的70%乙醇,靜置20分鐘,同樣條件離心,棄上清,1300轉倒置離心。空氣中晾干30分鐘,加入6μl雙蒸水。
2.5)SNaPshot上樣和判讀每孔加甲酰胺(Hi-Di Formamide)9μl,長度標記0.2μl,SNaPshot反應產(chǎn)物3μl,95℃變性5分鐘,冷卻后在在ABI PRISM 3700 DNA測序儀上進行毛細管電泳,運行Genescan 3.7進行數(shù)據(jù)分析,Genotyper3.7輸出各樣本各位點的基因冷卻后在在ABI PRISM 3700 DNA測序儀上進行毛細管電泳,運行Genescan 3.7進行數(shù)據(jù)分析,Genotyper3.7輸出各樣本各位點的基因型;3)RFLP-PCR進行SNP分型對于改變酶切位點的SNP,可先進行PCR擴增,擴增產(chǎn)物用相應的內(nèi)切酶消化,電泳后根據(jù)條帶位置判定基因型。完全酶切或不能被酶切的為兩種不同的純合型,不完全酶切的為雜合型。
4)測序分型對于不適合用以上兩種方法分型或分型結果不理想的位點進行測序分型。
以上各SNP位點的分型均先在96個隨機選取的正常對照個體中進行。
在病例組和對照組中,上述80個位點均符合Hardy-Weinberg平衡。經(jīng)SPSS統(tǒng)計軟件10.0版(免費下載于http//linkage.rockefeller.edu/soft/)分析,有1個SNP位點位于CDC2L2的第11號內(nèi)含子的第+49位,這是一個全新的SNP,在NCBI的SNP數(shù)據(jù)庫中沒有登錄。等位基因頻率分布在兩組中差異有統(tǒng)計學意義(P<0.05),如表7所示。
表7病例組與對照組SNP分型SPSS統(tǒng)計分析結果等位基因SNP C T A G 總計 P值病例組 96 376472 0.041L9N1SNP1對照組 82 226308總計位于CDC2L2基因的L9N1片斷中的1個SNP位點等位基因頻率在病例組和對照組存在顯著差異,因此提示這一位點與2型糖尿病相關。進而提示CDC2L2基因為一種新的2型糖尿病易感基因。
CDC2L2示的SNP位點(R)位于該基因的15,451-16,950位之間,這一區(qū)域的核苷酸序列如圖1A所示,圖中R為SNP位點,其代表堿基G/A多態(tài)性,即該位點可以為G,也可以為A。這一區(qū)域的互補序列如圖1B所示,圖中Y代表所述SNP位點的互補堿基,其代表堿基C/T。
基于這一SNP位點,可以設計適當長度的引物,用于經(jīng)PCR擴增而預測2型糖尿病易感性。
實施例3預測2型糖尿病易感性引物的設計及2型糖尿病易感性的預測1.SBE引物引物要位于SNP位點的5’端,其3’端的最后一個堿基恰好是與SNP緊鄰的前一個堿基。該引物有一條。長度為18-46個堿基之間。要避免含有過多的G+C,Tm值在50~65℃之間。由于SNP位點中轉換型較多,因此應避免連續(xù)幾個出現(xiàn)相同的序列類型(如連續(xù)幾個C/T型),如遇到準備放入同一個組的幾個位點都是C/T型時,可以將其中的數(shù)個從反鏈設計,即變?yōu)锳/G型,最好是C/T與A/G間隔出現(xiàn)。另外預備同組的幾個位點之間不能有發(fā)卡等形成,較長的SBE引物不能形成回折等二級結構。根據(jù)以上原則設計的一個引物為5′CTG TCT TAG GAG AGG GCT GCT G 3′(SEQ ID NO17),或者5′CCCTCC TTG TCT GTC TCC GAG T3′(SEQ ID NO18)其為該鏈的同序引物,即與其互補鏈結合。以此SBE引物對待測個體基因組DNA進行SBE反應檢測SNP位點的序列。
2、普通PCR擴增引物根據(jù)SNP位點所在的序列(圖1A和1B),設計如SEQ ID NO1-16所示的引物。如表1所示進行各種組合。以所述組合為引物,以得自待測個體血樣的基因組DNA為模板進行PCR擴增,對擴增產(chǎn)物進行測序檢測所述SNP位點的單核苷酸多態(tài)性。
SEQUENCE LISTING<110>中國醫(yī)學科學院基礎醫(yī)學研究所北京諾賽基因組研究中心有限公司國家人類基因組南方研究中心中國醫(yī)學科學院北京協(xié)和醫(yī)院<120>用于預測2型糖尿病易感性的試劑盒及引物<130>I20030512CB<160>19<170>PatentIn version 3.1<210>1<211>21<212>DNA<213>人工序列<400>1ccacctcttg gttggtaaga a21<210>2<211>18<212>DNA<213>人工序列<400>2ctgtggggaa ctggtcct18<210>3<211>21<212>DNA<213>人工序列<400>3atgaaaacca cctcttggtt g21<210>4<211>18<212>DNA
<213>人工序列<400>4gaactggtcc tgggcttc18<210>5<211>21<212>DNA<213>人工序列<400>5ttggttggta agaacctccc t21<210>6<211>18<212>DNA<213>人工序列<400>6aactggtcct gggcttcc18<210>7<211>21<212>DNA<213>人工序列<400>7cagcctccat atccattctt g21<210>8<211>18<212>DNA<213>人工序列<400>8tggtcagcac tgtgcctc18<210>9
<211>21<212>DNA<213>人工序列<400>9ccatatccat tcttgggaac a21<210>10<211>21<212>DNA<213>人工序列<400>10ctccatatcc attcttggga a21<210>11<211>21<212>DNA<213>人工序列<400>11aggacataac ctcactgcct g21<210>12<211>21<212>DNA<213>人工序列<400>12atccattctt gggaacactt g21<210>13<211>21<212>DNA<213>人工序列<400>13ggacataacc tcactgcctg t21
<210>14<211>19<212>DNA<213>人工序列<400>14gtgtcatgtg ggggacaag19<210>15<211>18<212>DNA<213>人工序列<400>15atgctgagct gggaggag18<210>16<211>21<212>DNA<213>人工序列<400>16tccatatcca ttcttgggaa c21<210>17<211>22<212>DNA<213>人工序列<400>17ctgtcttagg agagggctgc tg22<210>18<211>21<212>DNA<213>人工序列<400>18ccctccttgt ctgtctccga g
21<210>19<211>21444<212>DNA<213>Homo sapiens<400>19gatacttctg gcgagcgccg gttgctgttt cttctcaggc tcagggaccg gccgcggccc60cgtaggggtg agttccgact gggcggacca ggtgtgggag cgcgacgaga actgcgcacc120gaggtctttc ttccgagcag gcctcggagc ggggcggacc cgggcccggg ggcgagcgac180accctcgctt ccgcggacag tctcatcccg cacggaactt tgggtggtgg aggcggcggg240tccaaacgct gtctggagcc aacgtctgcc aggctgaacc tcaagtgtgc gggactgaac300ccgaggaaat agcccagtgc ccgggtcagg tggccttgtt cgcgagcaca tctcggagca360tctccccggt ctcaaggtgc agctgtccag tgtgctagtg gcttcacgta gtccaagcgg420tctttctagc agattctgac agtaaaagca gtgtttgatg agtggcaggt cctgagttaa480gagcctttaa acggatgatc tttaatccgc gatcgatact atcacgtagg tgttgttatt540ctggttgtac ggaagactga actgaggtga attacgttac ccaagaccat acaagaatga600cagaaacgag acttgatttc aagcggtcat ttttcagaac ccatcactct tttttgtcgc660ccatgctgca gcgcagtggc tgttcacaag cgcacttcag cctggaactc ctgggctcaa720tcggtctccc atctcagctt gcagagtata tgggactaca ggcgctcgcc accttgcctg780
gcttacaact tatcattctt gttttttttt tttttttttt tttttttttt ttttttgaga840cggggtcttg ctggagtgca gtgacgcgac ctcggctcac cggaacctcc gcctttcgga900ttcaagcgat tctgctgcct cggcctcccg agtagctggg attacaggca cccgccacca960cgcccagcta agttttgtat ttttagtgga gacagggttt tcgccgtgtt ggccaggctg1020gtcttgacct cccgaccttg tgatccaccc gcctcagcct agagcttacc tttttttttt1080ttttttttta accaagtctt actttgttat ctaggctgga gtgcagtggc gcagtcttgg1140ctcattgcag ccttgacctc tctgattcaa gtgatcctcc tgcctctagc agcctccttc1200ctgtagctag gaatacaggc acgcgccacc acactgggct aacttttgta ttttttgtag1260agacgaggtt ttgccatgtt gcccgggctg gtgttgaact ccggaactcc agcgatctgc1320tcgcctcggc ctcccaaagt gctagggtta ccgtcttgag ccactgcgcc gggcacaact1380tcttattctt aatgaggatt tattctgaat ccctcaaaag tgactaggtt caagtgttca1440gcaccatagc ttgctgtgtc ctgatgtagg ctgaattatt tttctttttg cagtgtttta1500actcaaatgg gtgatgaaaa ggactcttgg aaagtgaaaa ctttagatga aattcttcag1560gaaaagaaac gaaggaagga acaagaggag aaagcagaga taaaacgctt aaaaaatgta1620agccatattt ttttaagtaa gtggttttct taaaggagat ttaatttctt tgccctcatt1680tttccattag aacaacgctt cttcggtgaa gttcttttgt acttccaaat gtcgcaggtg1740
agcccaaaat gtattctaat attcagttga cattaaaggc agatttaaca cactaaagct1800gtgtctagat tgagcataca tggagaataa aatacgttga atgttaagtc attagcaaaa1860ctggactaat ttttctcggt tcattattag tatattcata atactatctc taagtatttt1920taatatagtg ggaacttgcc ttgaaattaa tataaatatt ttacgtcttt cttggtttgc1980atggtaatgt actcaggaaa cctttttagt aatttggtaa gaggcattgg caaagtacct2040cttttgctaa gatttgtagc atcatttggg atgttagtga gtacaggcat accttgcact2100tcactttatt atgcttcaca gatattgaaa tttttccaaa ttaaaggttt gtagcaactc2160tgctttgagt atttttccaa tagcatgtgc tcactttgtt agcttttttt ttgtttttga2220gacggaatct cgcactgtcg cccagggcca ggttcacacc attctcctac ctcagcttcc2280tgagtagctg ggactacagg ggctcaccaa catgccaagc taattttttg tatttttagt2340agagatgggg tctctccgtg ttagccagga tggtcttaat gtcctgacct cgtgatccac2400ccgcctcggc ctcccaaagt gctgggatta acaagcgtga gccactgcac ctggccaaaa2460attctttata ttttataaca ctggctcatt cagagtacat gtgaaagttt gttttgggat2520gttgcccagg tttgattatc attaaaaata cttttatcta tgaagaaaaa aaaacttata2580aagaaaatga ttaactttct ctttgcttct tagtctgatg accgggattc caagcgggat2640tcccttgagg agggggagct gagagatcac tgcatggaga tcacaataag gaactccccg2700
tatagaagag aagactcaat ggaagacagg tgagcggatg tacagatgtg caagacccaa2760ctgtacacag ccctggcctg gccagtcctt cctagggtca ctgtgacaac tgtgtgctat2820tgtaactatt aaggtttact ctttcctaga gttaccgtga cagggcgtgt tgtagctgtt2880gtactactga gattactctt tcctaaggtt accgtgacag ggtgtgctgt tgtaactatt2940gaggtttact ctttcctagg gctactgtga cggggtgtgc tgttttaact attgaggttt3000actcttccct agggttacgt gacggggtgt gctattgtaa ctattaaggt ttactctttc3060ctagggttac tgtgacagtg tgctcagtgt gctgttgtaa atactgaagt gtactctttt3120tttttttgag acggtgtctc aagagtcttg ctcacccagg ctggagtgca gtggcgccat3180ctcggctcac tgcaagctcc gcctccctgg ttcacaccat tctcctgcct cagcctcctg3240gctaacacgg tgaaaccccg tctctactaa aaatacaaaa aattagccag gatggtctcg3300atcttctgac ctggtgatcc gtccacctcg gcctcccaaa atgctgggat tacaggtgcg3360agccacgacc taggattact gtgacagggc atgctgttac aactattgag gtttactctt3420tcctagggtt actggtgaaa gcctgtctct actacaaata caaaaattag cctggcatgg3480tggtgtacac ctgtagtccc agctactcag gaggctgagg caggagaatt gcttgaatgt3540gggaggcaaa ggttgcagtg agccaagatt gtgcctctgt attctaccct gggggacata3600gcaagattct gtctgaaaaa aataataagt ccgggtgcga tggctcatgc ctgtaatccc3660
agcactttgg gaggctgagg cgggtggatc atgaggtcat gagtttcaga tcagcctgac3720caatatggtg aaaccccgtc tctactaaaa atataaaaat tagctgggtg tggtagcgca3780cgcctgtact cccagctact ccggaggctg aggcaggaga attgctcgaa cctgggacag3840gaggcagagg ttgcagtgag ccaagattgc gccgctggac tccagcctgg gcaacagagc3900gagactccat ctcaaaaaaa taaatacagg ccgggcgtgg cggctcacac ctgtaatccc3960agcactttgg gaggctgagg cgggcagatc acaaggtcag gagatcgaga ccaccctggc4020taacacagtg aaactccgtc tctactaaaa aatacaaaaa aaattagccg ggcgtggtgg4080tgggcgcctg tagtcccagt tacttggaag gctgaggcag gagaatggca tgaacccagg4140aggtagagct tgtagtgagc cgagagtctc gccactgccc tccagcctgg gcgacagagc4200aagactccaa tctcaaataa aataaataaa taaataaaat taaattaaat aaataagatg4260tgatgtattt ttacatgccc ctgaaactgt caccacagtc aagctaatga acctgcccct4320caccccctgc aggtcctctg agaggcattt cgttccatct gcacaaaaca ttgatttctt4380acatttttca tctgaatctt aagactccta ggccgggcgc ggtggctcac gcctgtaatc4440ccagcacttt gggaagccga ggcaggcaga tcaccaggtt aggagattga gaccatcttg4500gctaacacag tgaaaccccg tctctactaa aaatacaaaa attagctggg tgtggtggcg4560ggtgcctgta gtcccagcta ctccggaggc tgaggcagga gaatggtgtg aacccggaaa4620
ggtggaggtt gcagtgatcc gagatcgcgt gtctacactc cagcctgggt gacagagcga4680gactccgtct aaaaaaaaaa aaaaaaaaag atgcctgaag ttggagaatt aatgtaattt4740tttaaatgat gtttcagctt cgttcctatc tgaatcatgc atttttctgg gttgaaaaaa4800cctcataata gcctgatgct tttccgcact ttctcaagca tgacgcagtg ctgttgtgtt4860ttatttcaga ggagaagaag atgattcttt ggccatcaaa ccaccccagc aaatgtctcg4920gaaagaaaaa gttcatcaca gaaaagatga aaagagaaaa gaaaaatgta ggcatcatag4980ccattcagca gaagggggta cagaagcatt tactttcttt gacatcatgt tcaagtgtgg5040tttctttcct gttcctactc ttctgccttc cccagagcac cactgaaaaa ccagagaaag5100caaactgtag ctgaaagcat aatggtgtca cagaccgttc agaagggcta tagagagaat5160agctgaaagc atgcatgtgt cacagaccat tcagaggggc tatagagagc aaactctagc5220tgaaagcatg tgtgcgtcac agaccgaaaa ccagagagag caaactagct gaaagcatgc5280gtgtgtcaca ggccattcag aagggctata gagagagcaa actctagctg aaagcatgcg5340tgtgtcacag accattcaga agggctatag agagaatact ctagctgaag gccgggcgtg5400gtggctcaag cctgtaatcc cagcactttg ggaggctgag gcgggtggat cacaaggtca5460ggagatcaag accatcctgg ctaacacggt gaaacccagt ctctactaaa aatacaaaaa5520attagccggg cgtggtggcg ggcacctgta gtcccagctg ctctggaggc tgaggcagga5580
gaatggcatg aacctgggag gcggagcttg cagtgagccg ctatcgcacc actgcacact5640ctagcctggg cgacagagca agactccgtc tcaaaaaaaa aaaaaagaat actctagctg5700aaagcatacg tgcgtcacag accgttcaga atggctatag agagaatact ctagctgaaa5760gcgtgcgtgt gtcacagacc gaaaaccaga gagagcaaac tctagctgaa agcgtgcgtg5820tatcacagac cgaaaaccag agagagcaaa ctctagctga aagcgtgcgt gtgtcacaga5880ccattcagaa gggctatgga gagcaaactc tagctaaaag cctgcgtgtg tcacagaccg5940aaaaccagag agagcaaact ccagctgaaa gcatgcgtgt gtcacagacc gttcagaggg6000gctatagaga gaatactcta gctgaaagca tgcgtgtgtc acagaccgaa aaccagagag6060agcaaactcc acctgaaagc atgcgtgtgt cacagaccat tcagaagggc tatagagaga6120ataccctagc tgaaagcatg cgtgtgtcac agaccgaaaa ccagagagag caaactctag6180ctgaaagcat gcgtgtgtca cagaccgaaa accagaaaga gcaaactcta gctgaaagcg6240tgcgtgtgtc acagaccatt cagaagggct atagagagca aactagctaa aagcatgcgt6300gtgtcacaga ccgaaaacca gacagagcaa actccagctg aaagcatgcg tgtgtcacag6360accattcaga agggctatag agagaatact ctagctgaaa gcatgcatgt gtcacagact6420gaaaaccaga gagagcaaac tctagctgaa agcatgcgtg tgtcacagac cgttcagagg6480ggctatagag aggatactct agctgaaagc gtgcgtgtgt cacagaccga aaaccagaga6540
gagcaaactc tagctgaaag catgcgtgtg tcacagaccg ttcagagggg ctatagagag6600gatactccag ctgaaagtgt gcgtgtgtca cagaccgaaa accagagaga gcaaactcta6660gctgaaagca tgcgtgtgtc acagaccgaa aaccagagag agcaaactct agctgaaagc6720gtgcgtgtgt cacagaccat tcagaatggc tagtccattt ttcctctggg gttttctctc6780ccccattata ttgtttggga gcagtttgtt tacatttaaa atgacctgaa ttcaacaagt6840ataggagaaa aacacacccc aaaatgggta tttgctcaag tccaaagaat gggttaggct6900tgagcagttt gatctcgtac caacatcagg agattcttac gggtgttagg aaaattggac6960ctggagcccg attgaaatct cattattata aatacgcttg attaattaat gtggcttcat7020tgcacagtgg agaagcccac tgatagcaaa gctttgttct gtagtctttg tgaagagtgg7080tttttgtatt ataaaactga taattatagt ttattcagta tagaaaattt ttaaaagatg7140aatattacaa ttctcttctg tgatagcaga attgtttttc ttttttcttc tttcttcata7200attagacgct tactgcagat agttttctat tttcaaagtt ttttatttaa cataaaatca7260tgattattcg actgggtgca gtggcccagg cctgtaatcc cagcactttg ggaggacaag7320gatggaggat cacttgagcc caggagttca agaccagctt ggccaatata gtgagaccct7380gtctcttcaa aaaaaaaaaa aaaaagatta ggattactta acatcattat ttaaatattt7440aatgttcttg atttaatttc attttcatgt gatttttttt tttttttttt tttttttttt7500
tttttttttt gagatggagt ctcacttttt cgcccaggct ggagtgcagt ggcacgatct7560cggctcaccg caacctccac ctcccaggtt caagtgattc tacagcctca gcctccctta7620gtacctggga ttacaggtgc ctgccaccac gcccagctaa tttttgtatt tttagtagag7680acggggtttc accatgttgg ccaggctggt tttgaactcc tgacctcagg tgatccaccc7740gcctcggcct cccaaagtgc tgggattaca ggcgtaagcc accgtgcccg gcctcgtgaa7800atttttgaag tgaggtttct ttgcatgaca ctttatttct cattagggaa gcatgctaga7860gtgaaagaaa gagagcacga acgtcggaaa cgacatcgag aagaacagga taaagctcgc7920cgggaatggg aaagacagaa gagaagggaa atggcaaggg agcattccag gagagaaagg7980tgagtgggct gggtcagttg aggactttat gaaagggccg tggtagtgtg tcctgtcaca8040gcaatgaaga agaatttggc aatagaagtc acatttgttg cagaagtggt agacatggaa8100acagcacagt gaacgctgga cgaggctgac caagagaact gtcctgaggg agtgagtttt8160cactgcatct ggaagtaaga acgggtgtga tttgattgag ggaagacaat gaagggatca8220gaaatctgca cgtcccgccg ggcgcagtgg ctcacgctag aattccagca cttacgaggc8280tgaggtggtt ggatcccttg agcctgggag gtcaaggctg cagtaagcta tgaccatgct8340actgcactcc agcctggttg acagagtgag actgtctcaa aaaaaggaga agggagatcc8400caaaaacctt gaaacagtct ggaaatcggg acactggact cctaggactc ctggccatta8460
gtctgtatat tcgttcccct ttatgagcca gattcccaag aaagaacatc ggtgtagccc8520cagatctgtt ctgtgaacca ggaaaaaggc tgtaggccag gtgcgagcag gcccatctcc8580gccttcagag tgagtccaca gaaagcttgc aagctgctcc aggaagagag gagtctgaag8640cggaagggcg tgtgcagcga tgtttgccag cagccagggc tgggtacaca gcatgtaaag8700atgatgagag ggcgctggtt cttgttgatg ccgaagggtg tgggagacac tgaggcccag8760gggtcaaggt ccgagaccgc tgctgggtga gcaaggtttc agttggccta gttcctgtta8820gtgtgtgaaa cattcatgta tgccacgccc tgtgccagac attgagtgtg tcttgtccca8880cgagagtaga gcttgggata gaagtggagg ttggtagatg aaatttgggc tgtcatattg8940atttcccaga aggtaaagac aggagagtga atgaacaaaa attgttgggg gcagacttct9000gggtagggcc gattcagatc agccaatcca gaactgggtg tggtagcata tgctacgtgg9060gaggctaagg ccagaggacc gcatgacgcc agcctgggca acgtagagag accttgtctc9120tgacaaaaag gaaactgata aggataatct gagaagcact gatgcttgga aaactgctga9180gctgtgggta aaagcagtaa gaatctgacc ttctggcctg agagctgctc cctttactgc9240ttccactctg cacttggaag cacggaggtt ccactgggac agggcagctg caggacctgc9300agtttccttg ctgccttgga aggggttact ccgtttagag cagtgggcag tggccttgcc9360caccagcatc ctcagtggag ggaggaaaag gccaagaggt ctgctagaat gaagtacagt9420
gtggttggga gcagctgtga tcccgccaaa gacgtgcagc agagactgga gagagctcga9480gccgccaccc acttgtgacc agccctgagg atgcagctgc gtgaaaggac ctagcagaaa9540atagaagccg ccacagatgc gaatgacgcc tgaacgttca gtgtgctccc tgtccacaca9600cagccgtggg ccaaggaagc cttactgtgc tcgaggtatt tgagcccagc ctttttccag9660tgctggctaa ttgctaagct gtgcagccat ggtggtgacc cctaggaagc caaggttgaa9720aattaaaata ggcatgtggg aaggaacggg gtggccatga gctatgaggg agatggattt9780cacggacaac cagacaggcc ttggtggtaa caacgaaagg gaaaacttag aatccagaat9840tgctacaaat gtattatcta aaatacaaag aagtatgaca gtgtgacccg tactgaggaa9900gaacatcatc agtagaaact gtcttgagtg tccagatgtt gaatttagta aaggcttgga9960aacaacttgt ggatggagca gtagaaatta tccattctga agaacagaga gaaaaaaaca10020agaaaaatgc acagagcctc agaaacccgt ggtacaacat ctgctgtacc aaagcacgtc10080gaatgggggt tccaggagag aggaaagata tttgttacaa taatggttaa aaactttcca10140aattttaatt aaaaaatatg cacattcaag agcacaggaa gtttgaacta gaataaatgc10200aaagtcacat catagtcaaa ctggcaaagg ccaaagagaa aatgttgaaa gggctcagag10260aagaatgacc catcccatga aaggggagct tcaataccgc cagccactga cttcttagaa10320acaatggagg ccagaaggca gtggagtggc atactcaagc tgcttagaga gaagaaccat10380
cagccaggaa tcaaaactgt tctacacaag tgaaagggaa cgaacgacat tccctgagaa10440gcagagactg gtgggattca ttgttggcga aacctgcctt aaaggaaata ctaaaggaag10500accttcaagt tgaatagaaa tgacaccaga cggtaacttg aatcctcagg aaggaaggac10560aggcactgca gatagcaagt gtaggttgac gtcaatatcc tgtaaatatc tctcctcaca10620tcttaggttt tactggaact acgattgtgt aaaataatta cactgttgtc gtggtatgtg10680gcataaatgg actgcacaaa gaagacaggg aatgaagctg tgttacaaca gttttatatt10740gtactggact tgagctagta tcatgaggca tatggtgatc cctagagcaa ccactaagaa10800agttgttttc ttagtgttct aaaaagtaca aataaattaa aatggtatgc taaacgtatg10860taatttaaaa tcaaaaaggg aagaataaaa aagacacaac aaagcaagga aagtaaatcc10920aactgtacgt gtaattatat gacatgtgaa aggtctctgt gccccaaaca gacagggcag10980attatcagat agaaaaacaa gatctaactg tatgctgtct gctagagaac aggaaaagac11040gcagcgtaca aacatcagct gtcataggag agcttgaatg gctgtactca taccagacaa11100aacagatgtt aagaaatatt agaaaccagc ctggccaaca tggtgaaacc ctgtctctag11160taaaaataca aaaatcacct gggtgtggtg gtgcacacct gtaatcccag ctactcggga11220ggctcaggta tgagaatcac ttgaactcgt gagatggagg ttgcagtgag ccgagattgc11280gccactgcac tccagcctgg gtgacaaacc aagaccctgt ctcaaaaaaa aaaaaaaagc11340
tagaaacaag aaggagcaag gacttcacag ccagaaacag gccaatacag caggaagata11400cagcaatgat acatgtgaat gcatctaacc acagagccca aaatccatga agcaaacacc11460gatcgaatgg aaagaaatgg atcatttatt aattagaatt ggaaatggca gctgggcacg11520gtggctcggg cctgtaaacc cagcactttg aaaagcggag gcaggcggat cacgaggtca11580ggagattgag accatcctgg ctaacatggt gaaaccctcg tctctactaa aaatacaaaa11640attagctggg agtacagggc gcacgcctgt aatcccagct actcgggagg ctgaggcagg11700agaatcgctc gaacccggga ggcggaggtt gcagtgagcc gagatcgcgc caccgcactc11760cagcctgggg gacagatgaa gactccgtct caaagaaaat aaaataaaaa aatgaaaaaa11820aaacttcacg gattgaatta cgtagaaagc cagcttacaa atgtggacaa aaacgcgata11880agcaagcttc tgtttagggg gaatgatggc gtgtgcctct tcagggaccg cttggagcag11940ttagaaagga agcgggagcg ggagcgcaag atgcgggagc agcagaagga gcagcgggag12000cagaaggagc gcgagcggcg ggcggaggag cggcgcaagg agcgggaggc ccgcagggaa12060ggtaggcggc gcggtgggca gctgtgctcg gcgggacgcg tgtctgctgc cccctggtgc12120tgggcacttg ctgtcacagg cgggcgcttg gttccggtgc ttgcttttcg cccctgcctt12180tttttttttt tttggaggca gagttttgct cttgtccccc aggctggagt gcggtggcgc12240gatctcggct cactgcaccc tctgcccccc gggttcaagt gatcctcctg cctcagcctc12300
cggagtagca gggattacag gcacccgcca ccatgttcag ctattttttt atatttttag12360tagagacagg gtttcaccgt gttagccaga atagtctctt gatctcttgg cctcgtgatc12420cacccacctc ggcctcccac agtgctgcga ttacaggcgt gagccaccgc ggccggccag12480tacgagcttt tatagtcacc cacgtcctca ccttaatgga gatctttatt tcttcaccca12540gcttccggtt tctgtctcgc gtcctttcct tacaccccac acaactccct ggagcttatt12600cttcaaggca ggtctaggtc tagtagtaat gaactccctc tgcttttgtt tatctgagaa12660tatcctcatt tctccctcat ctttgaagga aagtttgctg gatacgtggt tcttggttga12720caattttgtt gttgttgttt tgagacagag tcttcttctg ttgcccaggc tggagtgcag12780tggagcgatc atagctcact gcaacctcga actcctgggc acaagtgatc ttcccacctc12840agcctcccgc gtagctggga cctacaggcg tagcgtgtgc caccacacct ggctcatttt12900tcagtagaaa caaggtgtcc ctgtattgcc caggctggtc ttgaattcct gggctcaagg12960aaccctcatg cctagctgac agtttttcct tttcacttgg actatttcag cccattgtct13020tctggcctcc aaagtttctg atgagaaatc tgatgatctt atagaggatc ccttggatgc13080tttaatctga tgacctaatt gaggatccct tggatgcttt gaagattctc tttgccttag13140gctttcaact gtttaataat gggttttcct gtgggcctct tgacttcatt ctacctggag13200ttcactgagc ctctctaatg tttatattta cggttttcat ccaatgtggg ggttttgagg13260
aattcttcag ataccctctc tgctcctctc ctccctcctg ggctcccaca gatctgttgg13320ggtccccgag gccgctcagc actgctccct tttcttcagt ctcttctgct ttcttttcct13380cagacgatgt gattttattg tcttcaggct caccgattat ttcttctgcc tgctcacatc13440tgcctgtgag tttctgttgt gaatatttac tttttagtgt ctattgtgag catgtactta13500ttagctctgg aatttctctc tggtttcttg ttggatcttc tgtctctgtt gatatttccg13560tcgtgttcac gcgtcatttt cttgactttc tccacatctt cctttcgttc tctgaggaac13620tgaaggttta agacagttcc ctaaaatctt tgtctgggac atctaccgtc aggtgatttt13680caggaaccgt gtctgttggc ttcttttttt cccctctgaa tgggacatac tgtcctgttt13740ctttgtttct cttgtgtttt tcttagtcaa aaaaatggac atttgattct catgatgtga13800ttcttcctgg tccccactca agggtgtgca cttgttgttt tggttgtgct gggctgtgtc13860tgtggggtcg gcctgttgtg gaaactcagg gtcttcacgg gtcttttctg agcctgagcc13920ttttcctggt cacgtgcagc cactttttaa cgttcccgtc aatacagatg tttttaatgt13980tcttgtcctg aagtgtctgc ctcctaaagg gggaatagag agaaatgaag ggggcaacgg14040gggacgtggt gctcatgccc tggaagtacc ttcagcttgg gggtggccgt ggctgctgcc14100tcttcatgcc tctggggtgg gacacgcagt catcacactg acctcgggtg tgtgtgtccg14160tctgcccacc tgggtccggc gagctgcatg caggctgctg cctgccagcg gggagtgagg14220
tgggagccac taatgtgcga agcggtgacg ttgattaatg aatcacagtt tactctccaa14280gattccccct gaagttgcaa accttcagta gactccagag cacctcagta gttgcacagg14340cctgatcctg tgatgcaagt gttgtctcgg tggggagact gattcccagt gcttcctact14400ccatctttcc agaatcttct cccgcccctt cctttttgac cagtgaagat cagtctagaa14460ggtccacctg ggtcctcggg ctcacggcct ccaggttgga gctttttctc cctgggcttc14520ctgggagacc tctggcctct gaccccgatg ctgtcagcac cctgtgcacg ctgtgggtgt14580gtctgccagg tgcgggtgtg ggagacgagg cagctgtgcc gggtggggcc ttttgaggaa14640ggcagtgctg ctagtgccat ctccctctct gccctgcgcg ccagtgtctg cacatcaccg14700aacgatgaga gaggactaca gcgacaaagt gaaagccagc cactggagtc gcagcccgcc14760tcggccgccg cgggagcggt tcgagttggg agacggccgg aagccaggtg aggccaggcc14820ggcgcctgcg cagaagccag cacagtgtga gtcttttctg ggggatgttt ggcataagtg14880tgtaggattc atttaaagcc cagctaagta accgcttcag aagaaagtga gagatgtgct14940ggctgaagtc ctctcgtgtc gtgagaggga ccgtgagtgt ctgtgtgcgg ccaggacaca15000ggacgtgtgt ttatccgctg ggacattcgc cactggcccc gttagagaag tggcttccag15060cgtctgtgga tgagctggtt tccgaccaag caaagttaat cgttacgtga aaggcactag15120ttttggggtg gtggtagctt gtttgtttaa aaacatttcc ccaaattcac ctttatggtt15180
tatctcataa gtaaaagaag agaaaatgga agaaagggac ctgctgtccg acttacagga15240catcagcgac agcgagagga agaccagctc ggccgagtcc tcgtcaggta cctggaaccg15300cctggccaag gccttgacca ctgctgccca ggaaggccca ggttcaccct ctgctctgct15360gtctttctac agcggaatca ggctcaggtt ctgaggaaga agaggaggag gaggaagagg15420aggaggagga agggagcacc agtgaagaat cagaggagga ggaggaggaa gaggaagagg15480aggaggagga gaccggcagc aactctgagg aggcatcaga gcagtctgcc ggtgaggcac15540cgcgacgact gtgtgaggtg ttgtgacttc actatagtgt tagaaaccgc agagaagtag15600ctggcgggcg ggggagttga aactcccttc tatctaggac tctctcggga cacctccaca15660tcgattcttt ttgtttgttt ttttgagatg gaatcttgat ctgttgccca ggctggagtg15720cagtggcatg atctcggctc actgcaacct ctgcctcccg ggttcaagtg atcctcccgc15780ctcagcctcc caagtagctg ggagtacagg tgtgcgccac cacgcccgga taatttttgt15840atttttagtc gagacggggt ttcaccacgt tggccaggat ggtctcgaac tcctgacctc15900aggtgatcca cccgcctcgg cctcccaaag cactgggatt acaggcgtga gccaccgcgc15960ccagcctcca tatccattct tgggaacact tgttgcttag ctgaagcgga gcccgcatcc16020tgcctgtggc agcactcgcc ccggtgctgg tctgagcaga cgcctccttt ctcttgcaga16080agaagtaagt gaggaagaaa tgagtgaaga tgaagaacga gaaaatgaaa accacctctt16140
ggttggtaag aacctccctg gagacagagc cccctccttg tctgtctccg agtgcagcag16200ccctctccta agacagccgg tcctgcgcgg cgtggggcac gccagggtct gggaggccgc16260ctgattcgtt ggccgctcca ggctgtgccg gtggggcccg cattcctcag cgaggcacag16320tgctgaccaa gggcgtcctg agtgcccagc agggccgagg agctgggaag cccaggacca16380gttccccaca ggggaggccc gtcagatggt ggctccgggc ctgtccctgc agaacagagg16440cctggcccag cctccgacag gcagtgaggt tatgtcctca gcctggtgga cgtggatgtg16500ggcttgtccc ccacatgaca cccgacgcct cctcccagct cagcatccgg gctctgtctc16560agccgagcct gccagcactc ttaggcctcg gtgccctgtg tccaggggac gagagcccag16620cgccagcacc tcccagcggg acacggggca gccctgccac gcgcttgatg cccccggggc16680aggaggaggt tcatgatcct tacttactcc tagcttcgta attaggttca acttttccag16740ttccagagtc acggttcgac cgagattccg gggagagtga agaagcagag gaagaagtgg16800gtgagggaac gccgcagagc agcgccctga cagagggcga ctatgtgccc gactcccctg16860ccctgttgcc catcgagctc aagcaggagc tgcccaagta cctgccggcc ctgcaggtca16920ggccctcccc tcgccccggg ccgctgtccg cattggcagt cggagttacc acaggggctg16980agcgaagcct ggcccccgtg ttggcgtctg tcgcctcaca gggctgctgg gcccactggg17040gcagtgacgg gcgggcacag ccactggccc ctcatgcttc taggtcccgc ctctttctca17100
tgctggacgg aactgggtgg acagggagct gcccgcagga ctgctctgcg gcttgaaagg17160cagcctgggc gtgcggccgc gctgctgtca ctgctgcccg agttgcgtcc tcctccgcac17220tggagagcag tgccttccac ttgacccctg cgtgggcggg ttatgtaggc accaaggcct17280tgttaccggc atctgtgcag ggcttggatg ggggagcggc tacgggagtc agtgtagatg17340tgtgaccaga agccttttgc tcaggcagct atcaataagg caggatattg ttgggagtga17400tttggaaggg acaagcctga gaaggtacca gtggcctcgg gggcctggga gaccggcagg17460gactcggccc cctccttggt gcctgtgggc ggagaggttc tctctggcgc atgcagcagg17520cctctgtcga ctgccctatg ccttgtgagc gcctctgccc cttagtgctg ctgagcgtag17580gcgtcgggcc acaggccacc cagagtacgt gacatccggc ctgggcaccg gccccaaggt17640acaccgaggg gtaggtgccc tggcatgggg catcatgctg cgcctggcag gtagggcccg17700tcctcagtgt catcctggta caagcagggg acacatccac tttgacagag agactctccg17760gatggccttt tttttggaga ctgggtctgt ctctgtcatc caggctggag tggagtggct17820taatcatagc tcactggagc ctccacctcc caggctcaaa caatcctccc atctcagcct17880cctgagtagc tggaactaca ggcgcaagcc accatgcctg gctaattttt ttattttgta17940gagaagagtt ttggccaggc acagtggctc acgcctgtaa tcccagcact ttgggaggcc18000gaggcggtgg gcggatcaga ggtcaggagt tcgagaccag cctggccaat atggtgaaat18060
cctgtctcta ctaaaaatac aaaaattagc ctggcgtggt ggtgcgtacc tatactccca18120gctactaggg aggctgaggc aggagaatcg cctgaaccca ggaggtggag gttgcagtga18180gccgagatct caccattgca ctccagcctg ggtgacagag cgagactcca tctcaaaaag18240aaaaaaagaa aacagagtgt tgctatgttg gccaggctgg tcttgaactc ctgggctcaa18300gcaatcctcc tgccttgccc tcccaaagtg ctggaattac aggcctgagc ccttgcacct18360ggctgggatg gccttttgtt cacactggtt ttgtttcata ataaagtgtc agatggtttt18420gcaaggaaag agactttgaa agaactgagc tgctcccagc tccacccccg gcccagtccc18480aaggctctgc cctgcacctg ccccgtgctg ggtgtgccgt gcctgtggac gcagccgccc18540tccctccagc tggcatggcc actgagacct cacacaggcg cttccttccc agggctgccg18600gagcgtcgag gagttccagt gcctgaacag gatcgaggag ggcacctatg gagtggtcta18660cagagcaaaa gacaagaaaa caggtgggtg gggtcccctc accccacaaa ggcaggggaa18720gtggggcagg ggctggctgc ccgagagctg cgactgcacc tgggcccgct tcacctgagc18780agctactgga ggttggaccc ctcagcacct ctagaagcca gaggtcagcc tggccctggg18840gctttgccac tcccttgcag tagcaggcgg cctgccccac agggccgagg cccagcgcgt18900ggagtggtct gtgccggggc tggtgtgcag gtttgcgttc ccagcgtccc acccaagcag18960gtgtgtgagc cgggaactct gttgggagtc ggccactggg atcccaggtg aggccggctc19020
tgttggggaa gtcgatgtgg agtcggcgtg gccgctggga tcccaggtgg ctgtaggtgg19080ctgtgagtgt ctgtggtgtg ttgagtggga agccgtgggt gttgccgaga cctcagctgg19140ggcgttctcc tggtgcccac gtgcccccac ctagaacgag acccccctcc gtgaaatgct19200ggcgctttgg gcactgcctg cggtcctcac tgaacgagtc cactgttggt accgtgactt19260tgagaatgcc tctcagtgcc gtctgtattt tcttcacaga tgaaattgtg gctctaaagc19320ggctgaagat ggagaaggag aaggagggct tcccgatcac gtccctgagg gagatcaaca19380ccatcctcaa ggcccagcat cccaacattg tcaccgttag agtgagcatg gccccaccac19440gcctggcccc gggtggaagg cttttccgac agggccccgt gctgtcctgg ggccgggtgc19500ttcctacact ctcctgcact tagtggagcc cttcacagac cacacagaag caagtatttg19560cctcccgggt ggcaccggag gtccttactg tccctcagca tctgcgcccg ggtgcagggg19620tgggtggggg cctggaggtg cccagcaccc acagagccgt gccctgcagg agattgtggt19680gggcagcaac atggacaaga tctacatcgt gatgaactac gtggagcacg acctcaagag19740cctgatggag accatgaaac agcccttcct gccaggtaca gccgcgcccc ggggtcctgt19800ctgcgtacaa gtgggggcag tgtcctggtc acccccgcgg tgacagtgct gcagggaggg19860ccagctgcat ccacagggaa agccctgaga agcctctgtt gctgccgagg cgagcgggcc19920accctgagtg ccctgggctt ggggcggccg ggtccacatg ggagcctccc tccctcccag19980
gggaggtgaa gaccctgatg atccagctgc tgcggggggt gaaacacctg cacgacaact20040ggatcctgca ccgtgacctc aagacgtcca acctgctgct gagccacgcc ggcatcctca20100aggtgagccc ccctccgagt ggcccatccc agggtgaccc gcccaggccc acccacagcc20160gcccatctgt cgttgcaggt gggtgatttt gggctggcgc gggagtacgg atcccctctg20220aaggcctaca ccccggtcgt ggtgacccag tggtaccgcg ccccagagct gctgcttggt20280gccaaggtga gtcctgggcg tctgagtgcc tcccctgtcc cccatgcagc ctcccacagc20340ttcgcgggca ctggccttcc tgaacacctc tcctggcgtc ttaggaatac tccacggccg20400tggacatgtg gtcagtgggc tgcatcttcg gggagctgct gactcagaag cctctgttcc20460ccgggaattc ggaaatcgat cagatcaaca aagtgttcaa ggtgggtctg gccctgccgc20520aggtgcgcta tggatttcag aggagttgca ggaatggggc tgcggggcgc acaggtgctg20580ggttgagatg gggaccaggg ccactgagag ccctcctggt ggcttgtctt ctctgacggg20640acacaggtgc caacactgtg ggccacttgg tgtggctgtt gaagcacctc tgtctttcag20700gagctgggga cccccagtga gaaaatctgg cccggctaca gtgagctccc agtagtcaaa20760aagatgacct tcagcgagca cccctacaac aacctccgca agcgcttcgg ggctctgctc20820tcagaccagg gcttcgacct catgaacaag tgagcccagt gcagccgggt ggcgggaggt20880cccgagccat agcggtgact tcccagtccc aggcctacct gctggctcac cacgttccag20940
aactgctctg gtgcctggcg tcccatgccc tgagccccgt cccaacacag cccatctttg21000ggggacccag tggagcacac gagcacctcc tgggcctctg gccctctccc cccaggttcc21060tgacctactt ccccgggagg aggatcagcg ctgaggacgg cctcaagcat gagtatttcc21120gcgagacccc cctccccatc gacccctcca tgttccccac gtggcccgcc aagagcgagc21180agcagcgtgt gaagcggggc accagcccga ggccccctga gggaggcctg ggctacagcc21240agctggtgag gggcctggcg ggtggggcgt gcccacaggt ggggctggct tgggcagggt21300tctcacggta gccgactcgt cccagggtga cgacgacctg aaggagacgg gcttccacct21360taccaccacg aaccaggggg cctctgccgc gggccccggc ttcagcctca agttctgaag21420gtcagagtgg accccgtcat gggg2144權利要求
1.用于預測2型糖尿病易感性的引物,所述引物為基于圖1B或圖1A的序列而設計的用于PCR擴增的特異引物,所述引物針對圖中所示的SNP位點R而設計,長度為18-46個核苷酸。
2.如權利要求1所述的引物,其包含選自SEQ ID NO1-16組成的一組的一種序列。
3.如權利要求2所述的引物,其為具有SEQ ID NO17 SEQ IDNO18所示的序列的單堿基延伸引物。
4.用于預測2型糖尿病易感性的試劑盒,其包含如權利要求1-3任一項所述的引物。
5.CDC2L2基因在制備用于預測2型糖尿病易感性的診斷劑中的應用。
全文摘要
本發(fā)明涉及用于預測2型糖尿病易感性的試劑盒及引物,更具體地,本發(fā)明涉及利用新鑒別的2型糖尿病易感基因CDC2L2的一個單核苷酸多態(tài)性(SNP)位點設計的預測2型糖尿病易感性的試劑盒和引物。本發(fā)明還涉及CDC2L2基因在制備預測2型糖尿病易感性的診斷劑中的應用。
文檔編號C12P19/34GK1548555SQ03136979
公開日2004年11月24日 申請日期2003年5月21日 優(yōu)先權日2003年5月21日
發(fā)明者吳國棟, 李云峰, 左瑾, 方福德, 強伯勤, 沈巖, 姚志建, 陳竺, 黃薇, 王姮 申請人:中國醫(yī)學科學院基礎醫(yī)學研究所, 北京諾賽基因組研究中心有限公司, 國家人類基因組南方研究中心, 中國醫(yī)學科學院北京協(xié)和醫(yī)院