乳腺癌早期診斷的唾液蛋白指紋圖譜模型及其構(gòu)建方法
【專利摘要】本發(fā)明公開了一種乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法,該乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法包括以下步驟:收集乳腺癌和健康對(duì)照者的唾液,離心處理后,與NP20蛋白質(zhì)芯片結(jié)合;采用PBSⅡ型蛋白質(zhì)芯片閱讀儀讀取芯片,得到初步篩選結(jié)果后,對(duì)初步篩選出來的質(zhì)荷比峰進(jìn)行成組數(shù)據(jù)均數(shù)比較秩和檢驗(yàn);數(shù)據(jù)分析:用Biomaker Pattem Software采用決策樹算法計(jì)算出多個(gè)變量變化對(duì)兩樣本的分類價(jià)值;該乳腺癌早期診斷的唾液蛋白指紋圖譜模型包括:質(zhì)荷比(m/z)分別為4849.31,5224.96,3439.02和3559.89的人唾液蛋白質(zhì)。本發(fā)明將檢測(cè)人唾液中相應(yīng)的蛋白質(zhì)的m/z與模型進(jìn)行分析,就可以初步用于乳腺癌的診斷,預(yù)測(cè)準(zhǔn)確率為78.02%,構(gòu)建方法合理可行,操作簡(jiǎn)便,可批量處理。
【專利說明】乳腺癌早期診斷的唾液蛋白指紋圖譜模型及其構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于乳腺癌檢測(cè)【技術(shù)領(lǐng)域】,尤其涉及一種乳腺癌早期診斷的唾液蛋白指紋 圖譜模型及其構(gòu)建方法。
【背景技術(shù)】
[0002] 乳腺癌是女性中最常見的惡性腫瘤。近年來,乳腺癌發(fā)病率在中國,尤其是發(fā)達(dá)地 區(qū),呈現(xiàn)快速增長的趨勢(shì),已躍居女性惡性腫瘤發(fā)病率之首。然而,目前臨床上對(duì)于乳腺癌 的早期診斷缺乏有效的手段。唾液由于其無創(chuàng)傷的體液收集方法在疾病診斷中具有特別的 優(yōu)勢(shì),早在1901年Michaels就率先用檢查唾液成分作為診斷疾病的輔助工具,現(xiàn)唾液作為 疾病診斷標(biāo)本方面的價(jià)值已受到前所未有的重視。唾液是人體不可缺少的一種重要體液, 血液成分如多種激素、氨基酸、電解質(zhì)、免疫球蛋白、肌酐等均可通過毛細(xì)血管壁的進(jìn)入唾 液,作為人體體液的一部分,其成分含量的變化,受體內(nèi)各種病理生理變化的影響。現(xiàn)代醫(yī) 學(xué)研宄顯示唾液是一種復(fù)雜的混合液,除99%是水分外,主要還含有一系列具有重要生物 學(xué)功能的蛋白質(zhì)和多肽。近年來國外唾液蛋白質(zhì)組學(xué)研宄已經(jīng)引起廣泛關(guān)注,2008年,美 國南加州大學(xué)的丹尼(Denny)等研宄顯示人的唾液中有1166種蛋白質(zhì),其中大部分蛋白質(zhì) 能同時(shí)在血漿和淚液中找到,這些唾液蛋白具有多種生物學(xué)功能,在保護(hù)口腔和人體正常 功能中具有重要作用。唾液作為一種成分復(fù)雜、具有多種生物學(xué)功能的重要體液,唾液中獨(dú) 特、豐富的蛋白質(zhì)成分毫無疑問是潛在的腫瘤及疾病的理想的生物標(biāo)記。長期以來,由于原 有的技術(shù)限制了口腔唾液蛋白的通量分析和精確測(cè)定,使大多數(shù)唾液蛋白的生物功能處于 未知狀態(tài),唾液在人體疾病中的診斷和預(yù)后判斷中的潛在作用并未顯現(xiàn)。隨著高通量、高精 度的蛋白質(zhì)組學(xué)的應(yīng)用,使得從唾液蛋白中尋找生物標(biāo)記用于疾病的早期診斷預(yù)防、生物 蛋白革G向治療、預(yù)后監(jiān)測(cè)判斷等均已成為可能。表面增強(qiáng)激光解吸電離(Surfaceenhanced laserdesorption/ionization,SELDI)蛋白質(zhì)芯片技術(shù)是近幾年迅速發(fā)展起來的一種蛋 白質(zhì)組學(xué)研宄的新技術(shù)。SELDI克服了目前多種蛋白質(zhì)檢測(cè)技術(shù)的不足和局限,具有微量 化、高通量、高靈敏度和高特異性的特點(diǎn),而且可以對(duì)各種樣本直接進(jìn)行分析,特別是對(duì)雙 向凝膠電泳等方法難以檢測(cè)的疏水蛋白和低豐度蛋白質(zhì)具有良好分辨檢測(cè)效果,能夠檢測(cè) 分子量〇 - 500kDa范圍內(nèi)的所有已知和未知的各類蛋白質(zhì)。因此,SELDI-TOF-MS技術(shù) 結(jié)合生物信息學(xué)方法有可能篩選出在乳腺癌和健康人唾液之間差異表達(dá)的新的候選腫瘤 標(biāo)志物,并可建立具有較高診斷效力且適用于早期診斷的分類檢測(cè)模型。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明實(shí)施例的目的在于提供一種乳腺癌早期診斷的唾液蛋白指紋圖譜模型及 其構(gòu)建方法,旨在解決現(xiàn)有缺少乳腺癌診斷能力和早期診斷的分類檢測(cè)模型的問題。
[0004] 本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu) 建方法,該乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法包括以下步驟:
[0005] 步驟一,收集乳腺癌和健康對(duì)照者的唾液,離心處理后,與NP20蛋白質(zhì)芯片結(jié)合;
[0006] 步驟二,采用PBSII型蛋白質(zhì)芯片閱讀儀檢測(cè)芯片,在每次采集數(shù)據(jù)使用 ALL-In-One標(biāo)準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè)誤差小于0. 1%,蛋白質(zhì)芯片閱讀 儀設(shè)置激光強(qiáng)度為220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000M/Z?20000M/Z,優(yōu)化范 圍為2000M/Z?15000M/Z,信號(hào)收集位置從20-80,收集總點(diǎn)數(shù)為140次,采用Proteinchip Software3. 2. 1分析軟件自動(dòng)采集數(shù)據(jù),計(jì)算機(jī)以IxlO9Hz的速度從所獲得的原始數(shù)據(jù)快速 精確的繪制出蛋白指紋圖譜,縱坐標(biāo)為峰強(qiáng)度,橫坐標(biāo)為蛋白質(zhì)質(zhì)荷比;
[0007] 步驟三,數(shù)據(jù)分析:所有原始數(shù)據(jù)先用ProteinchipSoftware3. 2. 1做校正,使 總離子強(qiáng)度及分子量達(dá)到均一,對(duì)位于2000Da?20000Da的質(zhì)荷比峰值用Biomarker Wizard3. 1軟件過濾噪音,設(shè)置初始的噪音過濾值為5,二次信噪比為2,允許同一蛋白質(zhì)峰 在不同樣本中的偏差小于〇. 3%,以10%為最小閾值進(jìn)行聚類,得到所有樣本的質(zhì)譜數(shù)據(jù) 在2000Da?20000Da的蛋白質(zhì)峰,得到初步篩選結(jié)果后,由BiomarkerWizard3. 1軟件對(duì)初 步篩選出來的蛋白質(zhì)譜峰M/Z峰強(qiáng)度做用秩和檢驗(yàn),由BiomarkerWizard3. 1軟件自動(dòng)完 成,各組數(shù)據(jù)用J士s表示,應(yīng)用P值評(píng)價(jià)每一個(gè)蛋白質(zhì)峰的相對(duì)重要性,P值越小說明這 個(gè)蛋白質(zhì)峰對(duì)區(qū)分兩類樣本越重要,將BiomarkerWizard3. 1軟件處理后的差異蛋白質(zhì)峰 導(dǎo)入BiomakerPatternSoftware5. 0. 2軟件中,采用決策樹分類算法對(duì)兩組間相同質(zhì)荷比 的差異蛋白質(zhì)峰做分類分析,建立決策樹模型,進(jìn)一步優(yōu)化試驗(yàn)參數(shù)確定最佳的分類模型, 即診斷模型,診斷模型的評(píng)價(jià),評(píng)價(jià)診斷模型采用的指標(biāo)有靈敏度、特異度、Youden指數(shù)。
[0008] 進(jìn)一步,在步驟二中,首先使用ALL-In-One標(biāo)準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分 子量檢測(cè)誤差小于0. 1 %,設(shè)定激光強(qiáng)度為220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為 2000Da?20000Da,優(yōu)化范圍為2000?15000,平均每點(diǎn)收集20次,所有原始數(shù)據(jù)先用 ProteinchiPSoftware3. 2. 1做校正,使總離子強(qiáng)度及分子量達(dá)到均一,對(duì)位于2000? 20000的質(zhì)荷比峰值,用BiomarkerWizard軟件過濾噪音,設(shè)置初始的噪音過濾值為5,二 次信噪比為2,允許同一蛋白質(zhì)峰在不同樣本中的偏差小于0. 3%,以10 %為最小閾值,在 總樣本中出現(xiàn)的比率要>10%進(jìn)行聚類。
[0009] 進(jìn)一步,在步驟三中,對(duì)兩組間相同M/Z的差異表達(dá)蛋白峰值做分類分析,經(jīng)過進(jìn) 一步優(yōu)化實(shí)驗(yàn)參數(shù),確定最佳的分類模型,從而得到篩選乳腺癌早期診斷的唾液蛋白指紋 圖譜模型。
[0010] 進(jìn)一步,該乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法步驟為:
[0011] 步驟一,唾液標(biāo)本的采集、處理和保存
[0012] 所有樣本均在早晨空腹下采集,采集時(shí)間為6 :00AM?8 :00AM,收集前一晚睡前不 再進(jìn)食及服用任何藥物,采集前2h開始禁食水用清水漱口,后靜坐于椅上,前5min內(nèi)的唾 液自然吞下后開始收集,口腔唾液積聚,吐入置于冰浴預(yù)冷的50mL離心管內(nèi),每個(gè)唾液樣 本采集2mL?5mL,每個(gè)樣本采集完立即放入冰盒內(nèi);
[0013] 所有采集的樣品立即放入4°C冰箱靜置Ih后,以lOOOOr/min在4°C下離心lOmin, 冰浴上分裝在ImlEP管中,每管50ul于-80°C冰箱保存,實(shí)驗(yàn)時(shí)由-80°C冰箱取出樣本,冰 上解凍,所有檢測(cè)唾液樣本均1次凍融,4°C下離心5min,備用;
[0014] 步驟二,具體實(shí)驗(yàn)步驟:
[0015] (1)取出NP20芯片,在芯片背后標(biāo)記時(shí)間,芯片種類,操作者的姓名資料,記下芯 片號(hào);
[0016] (2)取處理好的唾液上清,每條芯片的每個(gè)點(diǎn)直接上樣4ul,自然晾干后重復(fù)上樣 一次;
[0017] (3)待干后,將芯片裝入生物芯片處理器,在組裝生物芯片處理器時(shí),注意不要觸 碰加樣孔,同時(shí)要將芯片上帶有A的一頭放在外端,注意密封;
[0018] (4)每孔加入IOul的HPLC水,置振蕩器400轉(zhuǎn)/分?600轉(zhuǎn)/分,冰浴上震蕩 10分鐘,甩去孔中液體,重復(fù)操作一次,立刻甩出,拍干,拆開芯片處理器,取出芯片,自然干 燥;
[0019] (5)待芯片自然干燥后,在每個(gè)加樣孔上加半飽和SPA溶液0. 5ul,待干后重復(fù)點(diǎn) 加一次,自然干燥,上機(jī)檢測(cè);
[0020] 步驟三,數(shù)據(jù)采集和生物信息學(xué)統(tǒng)計(jì)分析
[0021] (1)儀器校正及數(shù)據(jù)的采集
[0022] 采用PBSII型蛋白質(zhì)芯片閱讀儀檢測(cè)芯片,在每次采集數(shù)據(jù)使用ALL-In-One標(biāo)準(zhǔn) 蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè)誤差小于〇. 1%,蛋白質(zhì)芯片閱讀儀設(shè)置激光強(qiáng)度為 220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000M/Z?20000M/Z,優(yōu)化范圍為2000M/Z? 15000M/Z,信號(hào)收集位置從20?80,收集總點(diǎn)數(shù)為140次,采用ProteinchipSoftware3. 2. 1 分析軟件自動(dòng)采集數(shù)據(jù),計(jì)算機(jī)以IxIO9Hz的速度從所獲得的原始數(shù)據(jù)快速精確的繪制出 蛋白指紋圖譜,縱坐標(biāo)為峰強(qiáng)度,橫坐標(biāo)為蛋白質(zhì)質(zhì)荷比;
[0023] (2)生物信息學(xué)統(tǒng)計(jì)分析方法為:
[0024] 第一步,指紋圖譜標(biāo)準(zhǔn)化及蛋白質(zhì)的初步篩選
[0025] 所有原始數(shù)據(jù)先用ProteinchipSoftware3. 2. 1做校正,使總離子強(qiáng)度及分子量 達(dá)到均一,對(duì)位于2000Da?20000Da的質(zhì)荷比峰值用BiomarkerWizard3.1軟件過濾噪音, 設(shè)置初始的噪音過濾值為5,二次信噪比為2,允許同一蛋白質(zhì)峰在不同樣本中的偏差小于 0.3%,以10 %為最小閾值進(jìn)行聚類,得到所有樣本的質(zhì)譜數(shù)據(jù)在2000Da?20000Da的蛋白 質(zhì)峰;
[0026] 第二步,顯著差異蛋白峰的選擇及診斷模型的建立
[0027] 得到初步篩選結(jié)果后,由BiomarkerWizard3. 1軟件對(duì)初步篩選出來的蛋白質(zhì)譜 峰M/Z峰強(qiáng)度做用秩和檢驗(yàn),由BiomarkerWizard3. 1軟件自動(dòng)完成,各組數(shù)據(jù)用Y士 s表 示,應(yīng)用P值評(píng)價(jià)每一個(gè)蛋白質(zhì)峰的相對(duì)重要性,P值越小說明這個(gè)蛋白質(zhì)峰對(duì)區(qū)分兩類樣 本越重要;
[0028] 將BiomarkerWizard3. 1軟件處理后的差異蛋白質(zhì)峰導(dǎo)入BiomakerPattern Software. 0. 2軟件中,采用決策樹分類算法對(duì)兩組間相同質(zhì)荷比的差異蛋白質(zhì)峰做分類 分析,建立決策樹模型,進(jìn)一步優(yōu)化試驗(yàn)參數(shù)確定最佳的分類模型,即診斷模型;
[0029] 第三步,診斷模型的評(píng)價(jià)指標(biāo)
[0030] 評(píng)價(jià)診斷試驗(yàn)的常用指標(biāo)有靈敏度、特異度、Youden指數(shù),
[0031] 靈敏度:實(shí)際患病且被診斷為陽性的概率就是靈敏度,只與病例組有關(guān),反映了診 斷試驗(yàn)檢出病例的能力;
[0032] 特異度:實(shí)際未患病且被診斷為陰性的概率就是特異度;也稱真陰性率,即Spe= TNAFP+TN),只與對(duì)照組有關(guān),反映了診斷試驗(yàn)排除非病例的能力;
[0033]陽性預(yù)測(cè)值:試驗(yàn)陽性的病例中真陽性的比例就是陽性預(yù)測(cè)值,即+PV=TP/ (TP+FP);
[0034] 陰性預(yù)測(cè)值:試驗(yàn)陰性的病例中真陰性的比例就是陰性預(yù)測(cè)值即-PV=TN/ (TN+FN);
[0035] Youdenz指數(shù):真陽性率與假陽性率之差就是Youden指數(shù),即靈敏度與特異度之 和減去1,J=Sen+Spe_l,Youden指數(shù)的取值范圍在(-1,+1)之間,值越接近+1,診斷準(zhǔn)確 性越好;
[0036] ROC曲線:受試者工作特征或相對(duì)工作特征曲線簡(jiǎn)稱ROC曲線,ROC曲線的構(gòu)建是 以假陽性率即(1-特異度)為橫軸,真陽性率即靈敏度為縱軸,橫軸與縱軸長度相等,形成 正方形,可揭示靈敏度和特異度的相互關(guān)系,是反映靈敏度和特異度連續(xù)變量的綜合指標(biāo), 可反映診斷試驗(yàn)的準(zhǔn)確性大小,ROC曲線下面積越大,診斷價(jià)值就越高。
[0037] 本發(fā)明實(shí)施例的另一目的在于提供一種乳腺癌早期診斷的唾液蛋白指紋圖譜 模型,該乳腺癌早期診斷的唾液蛋白指紋圖譜模型包括:質(zhì)荷比(m/z)分別為4849. 31, 5224. 96, 3439. 02和3559. 89的人唾液蛋白質(zhì)。
[0038] 本發(fā)明提供的乳腺癌早期診斷的唾液蛋白指紋圖譜模型及其構(gòu)建方法,提供建立 主要由人唾液蛋白中質(zhì)荷比(m/z)分別為4849. 31,5224. 96, 3439. 02和3559. 89的四個(gè)唾 液蛋白構(gòu)成的蛋白指紋圖譜模型,將檢測(cè)人唾液中相應(yīng)的蛋白質(zhì)的m/z與模型進(jìn)行分析, 就可以初步用于乳腺癌的診斷,預(yù)測(cè)準(zhǔn)確率為78. 02%。本發(fā)明的構(gòu)建方法合理可行,操作 簡(jiǎn)便,可批量處理,較好的解決了現(xiàn)有缺少乳腺癌診斷能力和早期診斷的分類檢測(cè)模型的 問題。
【專利附圖】
【附圖說明】
[0039] 圖1是本發(fā)明實(shí)施例提供的乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方 法流程圖;
[0040] 圖2是本發(fā)明實(shí)施例提供的乳腺癌患者和正常人的唾液蛋白質(zhì)代表性圖譜示意 圖;
[0041]圖3是本發(fā)明實(shí)施例提供的區(qū)分乳腺癌和健康對(duì)照者的決策樹模型;
[0042] 圖4是本發(fā)明實(shí)施例提供的M/Z為蛋白質(zhì)峰4849. 31和5224. 96的質(zhì)譜圖及模擬 膠圖;
[0043] 圖5是本發(fā)明實(shí)施例提供的ROC曲線圖。
【具體實(shí)施方式】
[0044] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合實(shí)施例,對(duì)本發(fā)明 進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于 限定本發(fā)明。
[0045] 下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明的應(yīng)用原理作進(jìn)一步描述。
[0046] 本發(fā)明實(shí)施例的一種乳腺癌早期診斷的唾液蛋白指紋圖譜模型,由蛋白質(zhì)芯片飛 行時(shí)間質(zhì)譜儀系統(tǒng)檢測(cè)的血清蛋白質(zhì)圖譜經(jīng)過軟件統(tǒng)計(jì)分析得到乳腺癌患者多個(gè)唾液特 異蛋白質(zhì),并構(gòu)建診斷模型,由質(zhì)荷比(m/z)分別為4849. 31,5224. 96, 3439. 02和3559. 89 的人唾液蛋白質(zhì)組成。
[0047] 如圖1所示,本發(fā)明實(shí)施例的乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方 法包括以下步驟:
[0048] SlOl:收集乳腺癌和健康對(duì)照者的唾液,離心處理后,與NP20蛋白質(zhì)芯片結(jié)合;
[0049] S102 :采用PBSII型蛋白質(zhì)芯片閱讀儀讀取芯片,得到初步篩選結(jié)果后,對(duì)初步篩 選出來的質(zhì)荷比峰進(jìn)行成組數(shù)據(jù)均數(shù)比較秩和檢驗(yàn);
[0050] S103 :數(shù)據(jù)分析:用BiomakerPatternSoftware采用決策樹算法計(jì)算出多個(gè)變量 變化對(duì)兩樣本的分類價(jià)值。
[0051] 在步驟S102中,首先使用ALL-In-One標(biāo)準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量 檢測(cè)誤差〈0. 1 %,設(shè)定激光強(qiáng)度為220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000Da? 20000Da,優(yōu)化范圍為2000?15000,平均每點(diǎn)收集20次。所有原始數(shù)據(jù)先用ProteinchiP Software3. 2. 1做校正,使總離子強(qiáng)度及分子量達(dá)到均一。對(duì)位于2000?20000的質(zhì)荷比 峰值,用BiomarkerWizard軟件過濾噪音,設(shè)置初始的噪音過濾值為5,二次信噪比為2,允 許同一蛋白質(zhì)峰在不同樣本中的偏差〈〇. 3%,以10%為最小閾值(在總樣本中出現(xiàn)的比率 要>10%)進(jìn)行聚類;
[0052] 在步驟S103中,對(duì)兩組間相同M/Z的差異表達(dá)蛋白峰值做分類分析,經(jīng)過進(jìn)一步 優(yōu)化實(shí)驗(yàn)參數(shù),確定最佳的分類模型,從而得到本發(fā)明篩選乳腺癌早期診斷的唾液蛋白指 紋圖譜模型。
[0053] 以下結(jié)合本發(fā)明的具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步的說明:
[0054] 步驟一,唾液標(biāo)本的采集、處理和保存
[0055] 所有樣本均在早晨空腹下采集,采集時(shí)間為6 :00AM?8 :00AM,收集前一晚睡前不 再進(jìn)食及服用任何藥物,采集前2h開始禁食水用清水漱口,后靜坐于椅上,前5min內(nèi)的唾 液自然吞下后開始收集,口腔唾液積聚至一定量后,吐入置于冰浴預(yù)冷的50mL離心管內(nèi), 每個(gè)唾液樣本采集約2-5mL,每個(gè)樣本采集完立即放入冰盒內(nèi);
[0056] 所有采集的樣品立即放入4°C冰箱靜置Ih后,以lOOOOr/min在4°C下離心lOmin, 冰浴上分裝在ImlEP管中,每管50ul于-80°C冰箱保存,實(shí)驗(yàn)時(shí)由-80°C冰箱取出樣本,冰 上解凍,所有檢測(cè)唾液樣本均1次凍融,4°C下離心5min,備用;
[0057] 步驟二,具體實(shí)驗(yàn)步驟
[0058] (1)小心的取出NP20芯片,在芯片背后標(biāo)記時(shí)間,芯片種類,操作者的姓名等資 料,記下芯片號(hào);
[0059] (6)取處理好的唾液上清,每條芯片的每個(gè)點(diǎn)直接上樣4ul,自然晾干后重復(fù)上樣 一次;
[0060] (7)待干后,將芯片裝入生物芯片處理器(Bio-processor),在組裝生物芯片處理 器時(shí),注意不要觸碰加樣孔,同時(shí)要將芯片上帶有"A"的一頭放在外端,注意密封;
[0061] (8)每孔加入IOul的HPLC水,置振蕩器400-600轉(zhuǎn)/分,冰浴上震蕩10分鐘,甩 去孔中液體(注意不要甩的太干),重復(fù)操作一次,立刻甩出,拍干,拆開芯片處理器,取出 芯片,自然干燥;
[0062] (9)待芯片自然干燥后,在每個(gè)加樣孔上加半飽和SPA溶液0. 5ul,待干后重復(fù)點(diǎn) 加一次,自然干燥,上機(jī)檢測(cè);
[0063] 步驟三,數(shù)據(jù)采集和生物信息學(xué)統(tǒng)計(jì)分析
[0064] (1)儀器校正及數(shù)據(jù)的采集
[0065] 采用PBSII型蛋白質(zhì)芯片閱讀儀檢測(cè)芯片,在每次采集數(shù)據(jù)使用ALL-In-One標(biāo) 準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè)誤差〈0. 1%,蛋白質(zhì)芯片閱讀儀設(shè)置激光強(qiáng)度為 220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000M/Z?20000M/Z,優(yōu)化范圍為2000M/Z? 15000M/Z,信號(hào)收集位置從20?80,收集總點(diǎn)數(shù)為140次,采用ProteinchipSoftware3. 2. 1 分析軟件自動(dòng)采集數(shù)據(jù),計(jì)算機(jī)以IxIO9Hz的速度從所獲得的原始數(shù)據(jù)快速精確的繪制出 蛋白指紋圖譜,縱坐標(biāo)為峰強(qiáng)度(蛋白質(zhì)相對(duì)含量),橫坐標(biāo)為蛋白質(zhì)質(zhì)荷比(M/Z);
[0066] (2)生物信息學(xué)統(tǒng)計(jì)分析
[0067]a.指紋圖譜標(biāo)準(zhǔn)化及蛋白質(zhì)的初步篩選
[0068] 所有原始數(shù)據(jù)先用ProteinchipSoftware3. 2. 1做校正,使總離子強(qiáng)度及分子量 達(dá)到均一,對(duì)位于2000Da?20000Da的質(zhì)荷比峰值用BiomarkerWizard3. 1軟件過濾噪 音,設(shè)置初始的噪音過濾值為5,二次信噪比為2,允許同一蛋白質(zhì)峰在不同樣本中的偏差 〈0. 3%,以10%為最小閾值進(jìn)行聚類,得到所有樣本的質(zhì)譜數(shù)據(jù)在2000Da?20000Da的蛋 白質(zhì)峰;
[0069] b.顯著差異蛋白峰的選擇及診斷模型的建立
[0070] 得到初步篩選結(jié)果后,由BiomarkerWizard3. 1軟件對(duì)初步篩選出來的蛋白質(zhì)譜 峰M/Z峰強(qiáng)度做用秩和檢驗(yàn),由BiomarkerWizard3. 1軟件自動(dòng)完成,各組數(shù)據(jù)用I士s表 示,應(yīng)用P值評(píng)價(jià)每一個(gè)蛋白質(zhì)峰的相對(duì)重要性,P值越小說明這個(gè)蛋白質(zhì)峰對(duì)區(qū)分兩類樣 本越重要;
[0071] 將BiomarkerWizard3. 1軟件處理后的差異蛋白質(zhì)峰導(dǎo)入BiomakerPattern Software. 0. 2軟件中,采用決策樹分類算法對(duì)兩組間相同質(zhì)荷比的差異蛋白質(zhì)峰做分類 分析,建立決策樹模型,進(jìn)一步優(yōu)化試驗(yàn)參數(shù)等確定最佳的分類模型,即診斷模型;
[0072]c.診斷模型的評(píng)價(jià)指標(biāo)
[0073] 評(píng)價(jià)診斷試驗(yàn)的常用指標(biāo)有靈敏度、特異度、Youden指數(shù)等,見診斷2X2四格表 (表 1);
[0074] 表1診斷試驗(yàn)資料的2X2四格表
【權(quán)利要求】
1. 一種乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法,其特征在于,該乳腺癌 早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法包括以下步驟: 步驟一,收集乳腺癌和健康對(duì)照者的唾液,離心處理后,與NP20蛋白質(zhì)芯片結(jié)合; 步驟二,采用PBS II型蛋白質(zhì)芯片閱讀儀檢測(cè)芯片,在每次采集數(shù)據(jù)使用ALL-In-One 標(biāo)準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè)誤差小于0.1%,蛋白質(zhì)芯片閱讀儀設(shè)置激 光強(qiáng)度為220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000M/Z?20000M/Z,優(yōu)化范圍為 2000M/Z?15000M/Z,信號(hào)收集位置從20-80,收集總點(diǎn)數(shù)為140次,采用Proteinchip Software3. 2. 1分析軟件自動(dòng)采集數(shù)據(jù),計(jì)算機(jī)以IxlO9Hz的速度從所獲得的原始數(shù)據(jù)快速 精確的繪制出蛋白指紋圖譜,縱坐標(biāo)為峰強(qiáng)度,橫坐標(biāo)為蛋白質(zhì)質(zhì)荷比; 步驟三,數(shù)據(jù)分析:所有原始數(shù)據(jù)先用Proteinchip Software3. 2. 1做校正,使總離子 強(qiáng)度及分子量達(dá)到均一,對(duì)位于2000Da?20000Da的質(zhì)荷比峰值用Biomarker Wizard3. 1 軟件過濾噪音,設(shè)置初始的噪音過濾值為5,二次信噪比為2,允許同一蛋白質(zhì)峰在不同 樣本中的偏差小于0.3%,以10%為最小閾值進(jìn)行聚類,得到所有樣本的質(zhì)譜數(shù)據(jù)在 2000Da?20000Da的蛋白質(zhì)峰,得到初步篩選結(jié)果后,由Biomarker Wizard3. 1軟件對(duì)初 步篩選出來的蛋白質(zhì)譜峰M/Z峰強(qiáng)度做用秩和檢驗(yàn),由Biomarker Wizard3. 1軟件自動(dòng)完 成,各組數(shù)據(jù)用X 士 s表示,應(yīng)用P值評(píng)價(jià)每一個(gè)蛋白質(zhì)峰的相對(duì)重要性,P值越小說明這 個(gè)蛋白質(zhì)峰對(duì)區(qū)分兩類樣本越重要,將Biomarker Wizard3. 1軟件處理后的差異蛋白質(zhì)峰 導(dǎo)入Biomaker Pattern Software5. 0. 2軟件中,采用決策樹分類算法對(duì)兩組間相同質(zhì)荷比 的差異蛋白質(zhì)峰做分類分析,建立決策樹模型,進(jìn)一步優(yōu)化試驗(yàn)參數(shù)確定最佳的分類模型, 即診斷模型,診斷模型的評(píng)價(jià),評(píng)價(jià)診斷模型采用的指標(biāo)有靈敏度、特異度、Youden指數(shù)。
2. 如權(quán)利要求1所述的乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法,其特 征在于,在步驟二中,首先使用ALL-In-One標(biāo)準(zhǔn)蛋白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè) 誤差小于0. 1 %,設(shè)定激光強(qiáng)度為220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000Da? 20000Da,優(yōu)化范圍為2000M/Z?15000M/Z,平均每點(diǎn)收集20次,所有原始數(shù)據(jù)先用Protein chiP Software3. 2. 1做校正,使總離子強(qiáng)度及分子量達(dá)到均一,對(duì)位于2000Da?20000Da 的質(zhì)荷比峰值,用Biomarker Wizard軟件過濾噪音,設(shè)置初始的噪音過濾值為5,二次信噪 比為2,允許同一蛋白質(zhì)峰在不同樣本中的偏差小于0. 3%,以10%為最小閾值,在總樣本 中出現(xiàn)的比率要大于10%進(jìn)行聚類。
3. 如權(quán)利要求1所述的乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法,其特征 在于,在步驟三中,對(duì)兩組間相同M/Z的差異表達(dá)蛋白峰值做分類分析,經(jīng)過進(jìn)一步優(yōu)化實(shí) 驗(yàn)參數(shù),確定最佳的分類模型,從而得到篩選乳腺癌早期診斷的唾液蛋白指紋圖譜模型。
4. 如權(quán)利要求1所述的乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法,其特征 在于,該乳腺癌早期診斷的唾液蛋白指紋圖譜模型的構(gòu)建方法步驟為: 步驟一,唾液標(biāo)本的采集、處理和保存 所有樣本均在早晨空腹下采集,采集時(shí)間為6 :00AM?8 :00AM,收集前一晚睡前不再進(jìn) 食及服用任何藥物,采集前2h開始禁食水用清水漱口,后靜坐于椅上,前5min內(nèi)的唾液自 然吞下后開始收集,口腔唾液積聚,吐入置于冰浴預(yù)冷的50mL離心管內(nèi),每個(gè)唾液樣本采 集2mL?5mL,每個(gè)樣本采集完立即放入冰盒內(nèi); 所有采集的樣品立即放入4°C冰箱靜置Ih后,以lOOOOr/min在4°C下離心lOmin,冰浴 上分裝在ImlEP管中,每管50ul于-80°C冰箱保存,實(shí)驗(yàn)時(shí)由-80°C冰箱取出樣本,冰上解 凍,所有檢測(cè)唾液樣本均1次凍融,4°C下離心5min,備用; 步驟二,具體實(shí)驗(yàn)步驟: (1) 取出NP20芯片,在芯片背后標(biāo)記時(shí)間,芯片種類,操作者的姓名資料,記下芯片號(hào); (2) 取處理好的唾液上清,每條芯片的每個(gè)點(diǎn)直接上樣4ul,自然晾干后重復(fù)上樣一 次; (3) 待干后,將芯片裝入生物芯片處理器,在組裝生物芯片處理器時(shí),注意不要觸碰加 樣孔,同時(shí)要將芯片上帶有A的一頭放在外端,注意密封; (4) 每孔加入IOul的HPLC水,置振蕩器400轉(zhuǎn)/分?600轉(zhuǎn)/分,冰浴上震蕩10分 鐘,甩去孔中液體,重復(fù)操作一次,立刻甩出,拍干,拆開芯片處理器,取出芯片,自然干燥; (5) 待芯片自然干燥后,在每個(gè)加樣孔上加半飽和SPA溶液0. 5ul,待干后重復(fù)點(diǎn)加一 次,自然干燥,上機(jī)檢測(cè); 步驟三,數(shù)據(jù)采集和生物信息學(xué)統(tǒng)計(jì)分析 (1) 儀器校正及數(shù)據(jù)的采集 采用PBS II型蛋白質(zhì)芯片閱讀儀檢測(cè)芯片,在每次采集數(shù)據(jù)使用ALL-In-One標(biāo)準(zhǔn)蛋 白質(zhì)芯片校正質(zhì)譜儀,使分子量檢測(cè)誤差小于〇. 1%,蛋白質(zhì)芯片閱讀儀設(shè)置激光強(qiáng)度為 220,靈敏度為9,收集數(shù)據(jù)的質(zhì)荷比范圍為2000M/Z?20000M/Z,優(yōu)化范圍為2000M/Z? 15000M/Z,信號(hào)收集位置從20?80,收集總點(diǎn)數(shù)為140次,采用ProteinchipSoftware3. 2. 1 分析軟件自動(dòng)采集數(shù)據(jù),計(jì)算機(jī)以IxIO9Hz的速度從所獲得的原始數(shù)據(jù)快速精確的繪制出 蛋白指紋圖譜,縱坐標(biāo)為峰強(qiáng)度,橫坐標(biāo)為蛋白質(zhì)質(zhì)荷比; (2) 生物信息學(xué)統(tǒng)計(jì)分析方法為: 第一步,指紋圖譜標(biāo)準(zhǔn)化及蛋白質(zhì)的初步篩選 所有原始數(shù)據(jù)先用Proteinchip Software3. 2. 1做校正,使總離子強(qiáng)度及分子量達(dá) 到均一,對(duì)位于2000Da?20000Da的質(zhì)荷比峰值用Biomarker Wizard3. 1軟件過濾噪音, 設(shè)置初始的噪音過濾值為5,二次信噪比為2,允許同一蛋白質(zhì)峰在不同樣本中的偏差小于 0. 3%,以10%為最小閾值進(jìn)行聚類,得到所有樣本的質(zhì)譜數(shù)據(jù)在2000Da?20000Da的蛋白 質(zhì)峰; 第二步,顯著差異蛋白峰的選擇及診斷模型的建立 得到初步篩選結(jié)果后,由BiomarkerWizard3. 1軟件對(duì)初步篩選出來的蛋白質(zhì)譜峰M/Z 峰強(qiáng)度做用秩和檢驗(yàn),由BiomarkerWizard3. 1軟件自動(dòng)完成,各組數(shù)據(jù)用X 士 s表示,應(yīng) 用P值評(píng)價(jià)每一個(gè)蛋白質(zhì)峰的相對(duì)重要性,P值越小說明這個(gè)蛋白質(zhì)峰對(duì)區(qū)分兩類樣本越 重要; 將Biomarker Wizard3. 1軟件處理后的差異蛋白質(zhì)峰導(dǎo)入Biomaker Pattern Software. 0. 2軟件中,采用決策樹分類算法對(duì)兩組間相同質(zhì)荷比的差異蛋白質(zhì)峰做分類 分析,建立決策樹模型,進(jìn)一步優(yōu)化試驗(yàn)參數(shù)確定最佳的分類模型,即診斷模型; 第三步,診斷模型的評(píng)價(jià)指標(biāo) 評(píng)價(jià)診斷試驗(yàn)的常用指標(biāo)有靈敏度、特異度、Youden指數(shù), 靈敏度:實(shí)際患病且被診斷為陽性的概率就是靈敏度,只與病例組有關(guān),反映了診斷試 驗(yàn)檢出病例的能力; 特異度:實(shí)際未患病且被診斷為陰性的概率就是特異度;也稱真陰性率,即Spe = TN/ (FP+TN),只與對(duì)照組有關(guān),反映了診斷試驗(yàn)排除非病例的能力; 陽性預(yù)測(cè)值:試驗(yàn)陽性的病例中真陽性的比例就是陽性預(yù)測(cè)值,即+PV = TP/ (TP+FP); 陰性預(yù)測(cè)值:試驗(yàn)陰性的病例中真陰性的比例就是陰性預(yù)測(cè)值即-PV = TNATN+FN); Youdenz指數(shù):真陽性率與假陽性率之差就是Youden指數(shù),即靈敏度與特異度之和減 去1,J = Sen+Spe-l,Youden指數(shù)的取值范圍在(-1,+1)之間,值越接近+1,診斷準(zhǔn)確性越 好; ROC曲線:受試者工作特征或相對(duì)工作特征曲線簡(jiǎn)稱ROC曲線,ROC曲線的構(gòu)建是以假 陽性率即(1-特異度)為橫軸,真陽性率即靈敏度為縱軸,橫軸與縱軸長度相等,形成正方 形,可揭示靈敏度和特異度的相互關(guān)系,是反映靈敏度和特異度連續(xù)變量的綜合指標(biāo),可反 映診斷試驗(yàn)的準(zhǔn)確性大小,ROC曲線下面積越大,診斷價(jià)值就越高。
5.-種乳腺癌早期診斷的唾液蛋白指紋圖譜模型,其特征在于,該乳腺癌早期診斷的 唾液蛋白指紋圖譜模型包括:質(zhì)荷比(m/z)分別為4849. 31,5224. 96,3439. 02和3559. 89 的人唾液蛋白質(zhì)。
【文檔編號(hào)】G01N27/62GK104515797SQ201410232893
【公開日】2015年4月15日 申請(qǐng)日期:2014年5月29日 優(yōu)先權(quán)日:2014年5月29日
【發(fā)明者】吳正治, 孫珂煥, 曹美群 申請(qǐng)人:深圳市第二人民醫(yī)院