欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

質(zhì)譜成像數(shù)據(jù)的差異分析方法及系統(tǒng)的制作方法

文檔序號(hào):5872920閱讀:296來源:國(guó)知局
專利名稱:質(zhì)譜成像數(shù)據(jù)的差異分析方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及質(zhì)譜分析領(lǐng)域,尤其涉及質(zhì)譜成像數(shù)據(jù)的差異分析方法及系統(tǒng)。
背景技術(shù)
質(zhì)譜分析方法是將物質(zhì)粒子(原子、分子)電離成離子,并通過適當(dāng)?shù)姆€(wěn)定或變化 的電場(chǎng)或磁場(chǎng)將它們按空間位置、時(shí)間先后等實(shí)現(xiàn)質(zhì)荷比分離,并檢測(cè)其強(qiáng)度來作定性、定 量分析的分析方法。由于其直接測(cè)量的本質(zhì)和高靈敏、高分辨、高通量和高適用性的特性, 使得質(zhì)譜儀和質(zhì)譜分析技術(shù)在現(xiàn)代科學(xué)技術(shù)中舉足輕重。隨著生命科學(xué)、環(huán)境科學(xué)、醫(yī)藥科 學(xué)、納米材料等學(xué)科的發(fā)展,以及食品安全、國(guó)家安全、國(guó)際反恐的需要,質(zhì)譜儀已成為增長(zhǎng) 速度飛快的分析儀器之一。尤其是色譜/質(zhì)譜聯(lián)用技術(shù)和儀器的出現(xiàn),因其對(duì)復(fù)雜基體的 高分離功能和檢測(cè)的高靈敏度,更是在上述各領(lǐng)域倍受青睞,甚至不可或缺。對(duì)于復(fù)雜基體的檢測(cè)分析,其分析流程是樣品前處理、色譜分離、質(zhì)譜分析檢測(cè)、 數(shù)據(jù)處理。其中,樣品前處理占大部分工作量,操作環(huán)節(jié)多、而且非常復(fù)雜。不同分析目的, 前處理操作不同,但通常包括取樣、稱量、均勻化、粗分離、提純、濃縮等步驟。復(fù)雜的前處 理很容易對(duì)被測(cè)物產(chǎn)生污染、流失、改性等阻礙真實(shí)、精確反映分析檢測(cè)結(jié)果的影響。利用新興質(zhì)譜技術(shù)在無需任何樣品前處理的情況下對(duì)復(fù)雜基體的樣品的成像則 是當(dāng)前研究的前沿和熱點(diǎn)之一。自 1997 年美國(guó)范德堡大學(xué)(Vanderbilt University)的 Richard Caprioli 等首 次提出MALDI質(zhì)譜分子成像技術(shù)以來,質(zhì)譜成像技術(shù)作為質(zhì)譜技術(shù)中的一個(gè)新領(lǐng)域迅速發(fā) 展,質(zhì)譜成像技術(shù)就廣泛用于樣品表面直接質(zhì)譜分析,特別是生物組織表面直接分析,用于 蛋白組學(xué)、代謝組學(xué)、脂類組學(xué)、藥代動(dòng)力學(xué)等領(lǐng)域研究。質(zhì)譜成像分析的流程是將被用來研究的樣品置于質(zhì)譜儀的靶上或樣品臺(tái)上,按 照預(yù)先定義好的樣品掃描范圍、樣品掃描方式、采樣點(diǎn)掃描時(shí)間間隔和空間間隔,移動(dòng)樣品 臺(tái),對(duì)樣品中的采樣點(diǎn)(微區(qū))進(jìn)行離子化,離子化后的離子進(jìn)入質(zhì)譜儀,采集質(zhì)譜數(shù)據(jù)信 息,如此逐步采集樣品中掃描范圍內(nèi)的其他采樣點(diǎn),最后得到具有空間信息的整個(gè)樣品的 質(zhì)譜數(shù)據(jù),這樣就可以完成對(duì)樣品的“分子成像”,該分子成像圖是3維圖,每個(gè)點(diǎn)的X,y與 其實(shí)際樣品中采樣點(diǎn)的對(duì)應(yīng),相對(duì)位置一樣,ζ軸為m/z軸,表示該點(diǎn)化合物信息。設(shè)定離子m/z的范圍,即可確定該樣品區(qū)域所含分子的種類,并選定峰高或者峰 面積來代表分子的相對(duì)豐度。圖像中的彩色斑點(diǎn)代表化合物的定位,每個(gè)斑點(diǎn)顏色的深淺 與該點(diǎn)上檢測(cè)到的某離子信號(hào)大小相關(guān)。通過增加單位面積上離子化樣品點(diǎn)數(shù)量和像素, 可以獲得更多的樣品信息,例如采用4000像素比200像素能夠得到更好的樣品圖像。質(zhì)譜 分子成像技術(shù)是一種半定量或相對(duì)定量技術(shù),圖像上顏色深的部分表明有更多的生物分子 聚集在樣品的這個(gè)部分。然而,不可能據(jù)此確定分子在樣品的不同部位的實(shí)際絕對(duì)含量。選 擇組織圖像上的任意一個(gè)斑點(diǎn),圖像都能夠給出一個(gè)質(zhì)譜譜圖或者離子譜圖,代表在樣品 的該部位存在這種分子,然后與做指紋圖譜類似,像做指紋圖譜那樣,將樣品的離子譜圖與 已知標(biāo)準(zhǔn)品進(jìn)行對(duì)照,分析差異,從而進(jìn)行生物標(biāo)志物的發(fā)現(xiàn)和藥物作用的監(jiān)控。
對(duì)于復(fù)雜基體樣品質(zhì)譜檢測(cè),相對(duì)于經(jīng)過色譜分離后再質(zhì)譜檢測(cè)的數(shù)據(jù),質(zhì)譜成 像數(shù)據(jù)更復(fù)雜、所包含數(shù)據(jù)信息豐富,每幅質(zhì)譜數(shù)據(jù)往往不是單一組分,是多個(gè)組分的混合 物,在質(zhì)譜圖上有多個(gè)質(zhì)譜峰,給后續(xù)的數(shù)據(jù)處理和數(shù)據(jù)解釋帶來了難度。特別在分析兩 類不同的樣品時(shí),如病變與正常組織切片的差異分析、污染樣品與正常樣品的差異分析,改 性與正常樣品的差異分析、實(shí)驗(yàn)組與對(duì)照組間的差異分析等,存在著很多困難,難以找出差
B. 升。不同樣品質(zhì)譜成像分析的差異有兩類一、是物質(zhì)差異,反映在質(zhì)譜圖上的不同, 種類不同或濃度不同;二是空間分布差異,同種含量的物質(zhì),在樣品上分布明顯不同。當(dāng)前分析質(zhì)譜成像數(shù)據(jù)的差異方法有兩種,假定對(duì)A、B兩類樣品做相同條件的 質(zhì)譜成像分析,獲得A、B兩類質(zhì)譜成像數(shù)據(jù)一將A、B兩類分別做質(zhì)譜圖疊加平均,對(duì)比 這兩類的平均質(zhì)譜圖,找出差異;二是分別在A、B兩類質(zhì)譜成像數(shù)據(jù)圖上選定樣品的區(qū)域 Region of Sample (簡(jiǎn)稱R0S),分別給對(duì)R0S區(qū)域做平均質(zhì)譜圖,對(duì)比R0S內(nèi)的平均質(zhì)譜 圖,找差異。第一種方法的問題是在對(duì)比時(shí)增加了很多無關(guān)的信息,掩蓋或弱化不同樣品 間的真實(shí)差異,容易影響判斷,不容易找出物質(zhì)差異,不能找出空間差異;第二種方法的問 題是,如果R0S選大了,就會(huì)出現(xiàn)第一種方法的問題,如果R0S選小了,就存在選擇的R0S大 小、形狀、位置是否合適的問題,同時(shí)要求A類R0S內(nèi)的數(shù)據(jù)一致性好、B類R0S內(nèi)的數(shù)據(jù)一 致性也好,A類R0S內(nèi)的數(shù)據(jù)與B類R0S內(nèi)的數(shù)據(jù)差異明顯。因此,很難給出兩類樣品的物 質(zhì)差異,更難給出差異的所在區(qū)域。在分析兩類不同的樣品時(shí),找出物質(zhì)差異存時(shí)在如下的 困難一、同類樣品間差異過大,容易掩蓋不同樣品間的差異;二、化學(xué)噪聲或局部污染等 原因產(chǎn)生的差別,能夠被誤判為差異。

發(fā)明內(nèi)容
為了解決上述的技術(shù)問題,提供了質(zhì)譜成像數(shù)據(jù)的差異分析方法及系統(tǒng),其目的 在于計(jì)算出實(shí)驗(yàn)組與對(duì)照組間質(zhì)譜成像數(shù)據(jù)的物質(zhì)差異和空間差異。本發(fā)明提供了質(zhì)譜成像數(shù)據(jù)的差異分析方法,包括步驟1,從第一組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù)集和第二組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù) 集中分別選取進(jìn)行差異分析的區(qū)域;步驟2,設(shè)定代表第一組被測(cè)樣品最小區(qū)域和第二組被測(cè)樣品最小區(qū)域的大小和 形狀;步驟3,在為第一組被測(cè)樣品和第二組被測(cè)樣品所選取的進(jìn)行差異分析的區(qū)域中 選定各最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù);步驟4,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品 中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)分別利用主成分分析方法、因子分析方法或統(tǒng)計(jì)方法比 較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?應(yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異程度是否符合預(yù)設(shè)條件;將符合預(yù)設(shè)條件的最小區(qū)域的空間 信息及相應(yīng)的平均質(zhì)譜圖,或者符合預(yù)設(shè)條件的最小區(qū)域的空間信息及相應(yīng)的樣品點(diǎn)之間 的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入最小區(qū)域信息集;根據(jù)區(qū)域信 息集中的空間信息或者樣品點(diǎn)之間的決定系數(shù)和樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)計(jì)算 得到差異系數(shù);
步驟5,按照差異系數(shù)進(jìn)行排序,選擇與每個(gè)差異系數(shù)對(duì)應(yīng)的第一組被測(cè)樣品中的 最小區(qū)域和二組被測(cè)樣品中的最小區(qū)域;分別以第一組被測(cè)樣品中的最小區(qū)域和第二組被 測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第 二組被測(cè)樣品中的區(qū)域存在的差異程度是否符合預(yù)設(shè)條件;擴(kuò)展后的以第一組被測(cè)樣品中 的區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第一組被測(cè)樣品的界限,擴(kuò)展后的以第二組被測(cè)樣品中 的區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第二組被測(cè)樣品的界限;將擴(kuò)展后的第一組被測(cè)樣品中 的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜圖,或者將擴(kuò)展 后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的 樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入?yún)^(qū)域信息集。步驟4中,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用主成分分析方法比較第一組被測(cè)樣品中的最小 區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差 異系數(shù)是否符合預(yù)設(shè)條件包括步驟21,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品 中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;步驟22,對(duì)合并后的數(shù)據(jù)進(jìn)行主成分分析,得到主成分分析載荷圖信息和主成分 分析得分圖信息;步驟23,設(shè)定以第一主成分為橫坐標(biāo)和以第二主成份為縱坐標(biāo)的平面圖,在該平 面圖上繪制第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn); 樣品點(diǎn)的橫坐標(biāo)值為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主成分上的得分值,樣品點(diǎn)的縱坐 標(biāo)值為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主成份上的得分值;步驟24,在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。步驟4中,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用因子分析方法比較第一組被測(cè)樣品中的最小區(qū) 域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異 系數(shù)是否符合預(yù)設(shè)條件包括步驟31,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品 中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并成數(shù)據(jù)集AB,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;步驟32,對(duì)數(shù)據(jù)集AB進(jìn)行因子分析,得到因子載荷圖信息和因子得分圖信息;步驟33,設(shè)定以第一主因子為橫坐標(biāo)和第二主因子為縱坐標(biāo)的平面圖,在該平面 圖上繪制第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣 品點(diǎn)的橫坐標(biāo)值為該樣品點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主因子上的得分值,縱坐標(biāo)值為該 樣品點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主因子上的得分值;步驟34,在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。利用幾何判別法或聚類法判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第
10二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開。步驟4中,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?應(yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù) 是否符合預(yù)設(shè)條件包括步驟41,對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn),對(duì) 第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn);一致性檢驗(yàn)通過后,執(zhí) 行步驟42 ;步驟42,對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第一 平均質(zhì)譜數(shù)據(jù);對(duì)第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第二平 均質(zhì)譜數(shù)據(jù);步驟43,提取第一平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,提取第二平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰;步驟44,判斷第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類或離子強(qiáng)度 是否存在差異;預(yù)設(shè)條件為第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類存在差 異,或者第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類不存在差異但離子強(qiáng)度存 在差異,離子強(qiáng)度存在差異需要滿足下述條件將第一平均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度和第二 平均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度做相關(guān)性比較后,決定系數(shù)大于或等于0.8。分別以第一組被測(cè)樣品中的最小區(qū)域和第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò) 展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域存在的 差異系數(shù)是否符合預(yù)設(shè)條件具體包括步驟51,選擇一個(gè)第一組被測(cè)樣品中的最小區(qū)域和一個(gè)第二組被測(cè)樣品中的最小 區(qū)域;步驟51,固定所選定的第一組被測(cè)樣品中的最小區(qū)域,以所選定的第二組被測(cè)樣 品中的最小區(qū)域進(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū) 域與所選定的第一組被測(cè)樣品中的最小區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件;步驟52,固定擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域,以 所選定的第一組被測(cè)樣品中的最小區(qū)域?yàn)楹诵倪M(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第一組被測(cè) 樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域與擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹?心的區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件。差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心 與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間的距離除以第一組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積與第二組被測(cè)樣品中的最小區(qū) 域包含的樣品點(diǎn)組成的多邊形的面積之和,或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū) 域包含的樣品點(diǎn)組成的多邊形的重心與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成 的多邊形的重心間的距離減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形 的面積與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積之和。差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均 值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和除以第一組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù),或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)之間的決定系數(shù)平均值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間 的決定系數(shù)平均值之和減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與 第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù)。
本發(fā)明提供了質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),包括差異分析區(qū)域選取模塊,用于從第一組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù)集和第二組被測(cè) 樣品的質(zhì)譜成像數(shù)據(jù)集中分別選取進(jìn)行差異分析的區(qū)域;最小區(qū)域設(shè)定模塊,用于設(shè)定代表第一組被測(cè)樣品最小區(qū)域和第二組被測(cè)樣品最 小區(qū)域的大小和形狀;質(zhì)譜成像數(shù)據(jù)選取模塊,用于在為第一組被測(cè)樣品和第二組被測(cè)樣品所選取的進(jìn) 行差異分析的區(qū)域中選定各最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù);差異程度判決模塊,用于將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和 第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)分別利用主成分分析方法、因子分析方 法或統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品 中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異程度是否符合預(yù)設(shè)條件;將符合預(yù)設(shè)條件的 最小區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜圖,或者符合預(yù)設(shè)條件的最小區(qū)域的空間信息及相 應(yīng)的樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入最小區(qū)域信 息集;根據(jù)區(qū)域信息集中的空間信息或者樣品點(diǎn)之間的決定系數(shù)和樣品點(diǎn)平均質(zhì)譜圖之間 的決定系數(shù)計(jì)算得到差異系數(shù);擴(kuò)展模塊,用于按照差異系數(shù)進(jìn)行排序,選擇與每個(gè)差異系數(shù)對(duì)應(yīng)的第一組被測(cè) 樣品中的最小區(qū)域和二組被測(cè)樣品中的最小區(qū)域;分別以第一組被測(cè)樣品中的最小區(qū)域和 第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò) 展后的第二組被測(cè)樣品中的區(qū)域存在的差異程度是否符合預(yù)設(shè)條件;擴(kuò)展后的以第一組被 測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第一組被測(cè)樣品的界限,擴(kuò)展后的以第二 組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第二組被測(cè)樣品的界限;將擴(kuò)展后的 第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的平均 質(zhì)譜圖,或者將擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的 空間信息及相應(yīng)的樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加 入?yún)^(qū)域信息集。將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最 小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用主成分分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng) 的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是 否符合預(yù)設(shè)條件包括將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的最 小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;對(duì)合并后的數(shù)據(jù)進(jìn)行主成分分析,得到主成分分析載荷圖信息和主成分分析得分 圖信息;設(shè)定以第一主成分為橫坐標(biāo)和以第二主成份為縱坐標(biāo)的平面圖,在該平面圖上繪 制第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品點(diǎn)的橫坐標(biāo)值為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主成分上的得分值,樣品點(diǎn)的縱坐標(biāo)值為該 樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主成份上的得分值;在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣 品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含的 樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最 小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用因子分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的 質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否 符合預(yù)設(shè)條件包括將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的最 小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并成數(shù)據(jù)集AB,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;對(duì)數(shù)據(jù)集AB進(jìn)行因子分析,得到因子載荷圖信息和因子得分圖信息;設(shè)定以第一主因子為橫坐標(biāo)和第二主因子為縱坐標(biāo)的平面圖,在該平面圖上繪制 第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品點(diǎn)的橫 坐標(biāo)值為該樣品點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主因子上的得分值,縱坐標(biāo)值為該樣品點(diǎn)對(duì) 應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主因子上的得分值;在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣 品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含的 樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。差異程度判決模塊利用幾何判別法或聚類法判斷第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開。將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最 小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)利用統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜 成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合 預(yù)設(shè)條件包括對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn),對(duì)第二組被 測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn);一致性檢驗(yàn)通過后,對(duì)第一組被 測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第一平均質(zhì)譜數(shù)據(jù);對(duì)第二組被測(cè) 樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第二平均質(zhì)譜數(shù)據(jù);提取第一平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,提取第二平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰;判斷第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類或離子強(qiáng)度是否存 在差異;預(yù)設(shè)條件為第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類存在差異,或 者第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類不存在差異但離子強(qiáng)度存在差 異,離子強(qiáng)度存在差異需要滿足下述條件將第一平均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度和第二平均 質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度做相關(guān)性比較后,決定系數(shù)大于或等于0. 8。分別以第一組被測(cè)樣品中的最小區(qū)域和第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò) 展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的最小區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的最小區(qū) 域存在的差異系數(shù)是否符合預(yù)設(shè)條件具體包括選擇一個(gè)第一組被測(cè)樣品中的最小區(qū)域和一個(gè)第二組被測(cè)樣品中的最小區(qū)域;
固定所選定的第一組被測(cè)樣品中的最小區(qū)域,以所選定的第二組被測(cè)樣品中的最 小區(qū)域進(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域與所選 定的第一組被測(cè)樣品中的最小區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件;固定擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域,以所選定的 第一組被測(cè)樣品中的最小區(qū)域?yàn)楹诵倪M(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第一組被測(cè)樣品中的 最小區(qū)域?yàn)楹诵牡膮^(qū)域與擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域 存在的差異系數(shù)符合預(yù)設(shè)的條件。差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心 與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間的距離除以第一組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積與第二組被測(cè)樣品中的最小區(qū) 域包含的樣品點(diǎn)組成的多邊形的面積之和,或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū) 域包含的樣品點(diǎn)組成的多邊形的重心與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成 的多邊形的重心間的距離減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形 的面積與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積之和。差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均 值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和除以第一組 被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最小區(qū)域包含 的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù),或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)之間的決定系數(shù)平均值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間 的決定系數(shù)平均值之和減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與 第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù)。本發(fā)明選定樣品對(duì)比區(qū)域(從A類、B類樣品質(zhì)譜成像數(shù)據(jù)圖中分別選定一個(gè)樣 品區(qū)域 Region of Sample,簡(jiǎn)稱 ROS),定義原子區(qū)域(Atom Regionof Sample,簡(jiǎn)稱 AR0S, 能代表樣品的最小的區(qū)域),在A類樣品、B類樣品R0S中分別選取AR0S,對(duì)比這兩個(gè)AR0S 區(qū)域內(nèi)的質(zhì)譜數(shù)據(jù)差異,遍歷對(duì)比A類、B類樣品R0S區(qū)域內(nèi)的所有AR0S,計(jì)算每對(duì)差異參 數(shù),按差異系數(shù)大小排序,對(duì)有顯著差異的AR0S進(jìn)行增長(zhǎng),產(chǎn)生新的成對(duì)的子R0S區(qū)域(存 在顯著差異的最大子區(qū)域),從而獲得精確差異區(qū)域,每對(duì)差異區(qū)域的物質(zhì)差異信息。本發(fā)明所提出的技術(shù)方案,使研究人員準(zhǔn)確、精確分析A類樣品與B類樣品成像數(shù) 據(jù)圖間的顯著差異、差異所在的樣品區(qū)域,物質(zhì)種類與含量差異,對(duì)于復(fù)雜基體,如病變與 正常組織切片的差異分析、污染樣品與正常樣品的差異分析,改性與原始樣品的差異分析、 用藥組織切片與非用藥組織切片的的差異分析,提供了準(zhǔn)確、可靠的方法。


圖1是本發(fā)明分析A樣品與B樣品質(zhì)譜成像數(shù)據(jù)差異的方法流程圖;圖2是主成分分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖;圖3是因子分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖;圖4是統(tǒng)計(jì)分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖;圖5是以AR0S為核心的擴(kuò)增差異區(qū)域的方法流程圖。
1具體實(shí)施例方式目前,兩類復(fù)雜樣品(A類、B類)的質(zhì)譜成像數(shù)據(jù)圖間的顯著差異分析是一個(gè)難 題。本發(fā)明,首先通過選定樣品對(duì)比區(qū)域排除無關(guān)信息干擾,設(shè)定原子區(qū)域,在A類樣品、 B類樣品中找出所有存在顯著差別的原子區(qū)域,再以原子區(qū)域?yàn)楹诵闹鸩綌U(kuò)展區(qū)域,確保存 在顯著差異的前提下最可能的擴(kuò)展區(qū)域,排除重疊的區(qū)域,從而獲得精確差異區(qū)域,每對(duì)差 異區(qū)域的物質(zhì)差異信息。圖1是本發(fā)明分析A樣品與B樣品質(zhì)譜成像數(shù)據(jù)差異的方法流程圖。如圖所示, 包括以下步驟步驟S101,從A樣品質(zhì)譜成像數(shù)據(jù)集、B樣品質(zhì)譜成像數(shù)據(jù)集中分別選取要對(duì)比差 異的區(qū)域R0S。由于質(zhì)譜成像數(shù)據(jù)集,是一張質(zhì)譜成像數(shù)據(jù)圖像(該圖像中每一個(gè)點(diǎn)代表 一幅全掃描質(zhì)譜數(shù)據(jù)),往往是整個(gè)質(zhì)譜分析數(shù)據(jù),真正樣品數(shù)據(jù)包含在質(zhì)譜成像數(shù)據(jù)圖像 中,在質(zhì)譜成像數(shù)據(jù)圖像中選定樣品所在的區(qū)域,避免將與樣品無關(guān)的其他信息納入對(duì)比, 影像判斷。步驟S102,設(shè)定能代表樣品的最小的區(qū)域原子區(qū)域AR0S的大小和形狀。該AR0S 的樣品點(diǎn)個(gè)數(shù)大于或等于1,不宜太大,也不宜太小,太大容易出現(xiàn)在AR0S就包含了多個(gè)不 同差異,太小了,給計(jì)算帶來了負(fù)擔(dān),可以是2*2或2*3、或3*2、或3*3的區(qū)域,具體大小和 形狀視具體實(shí)驗(yàn)特點(diǎn)和目的而定。步驟S103,按照空間順序,分別在A樣品、B樣品質(zhì)譜成像數(shù)據(jù)圖像樣品區(qū)域內(nèi)選 定AR0S區(qū)域的數(shù)據(jù),本步驟僅負(fù)責(zé)按空間順序,分別選取不同的一對(duì)AR0S區(qū)域數(shù)據(jù)。選擇 順序可以是首先在A樣品做上選一個(gè)AR0S區(qū)域,以該區(qū)域?yàn)閷?duì)比對(duì)象,遍歷B樣品上樣品 區(qū)域內(nèi)所有不同的AR0S,每一次選擇不同的一對(duì)AR0S,到步驟S104進(jìn)行該對(duì)AR0S的對(duì)比 計(jì)算,完成后再在A樣品上選下一個(gè)AR0S,以該區(qū)域?yàn)閷?duì)比對(duì)象,遍歷B樣品上樣品區(qū)域內(nèi) 所有不同的AR0S;也可以在B樣品上選一個(gè)AR0S,以該區(qū)域?yàn)閷?duì)比對(duì)象,遍歷A樣品上樣品 區(qū)域內(nèi)所有不同的AR0S的選擇順序。要實(shí)現(xiàn)A樣品區(qū)域內(nèi)所有不同的AR0S與B樣品區(qū)域 內(nèi)所有不同的AR0S進(jìn)行一次對(duì)比,既不遺漏也不重復(fù)。步驟S104,將A類樣品中選定的AR0S與B樣品中選定的AR0S進(jìn)行對(duì)比,可以通過 主成分分析方法處理這兩個(gè)AR0S的質(zhì)譜數(shù)據(jù)來進(jìn)行對(duì)比,判斷是否存在顯著差異(圖2詳 述),可以通過因子分析方法處理這兩個(gè)AR0S的質(zhì)譜數(shù)據(jù)來進(jìn)行對(duì)比(圖3詳述),判斷是 否存在顯著差異,還可以通過統(tǒng)計(jì)方法處理這兩個(gè)AR0S的質(zhì)譜數(shù)據(jù)來進(jìn)行對(duì)比,判斷是否 存在顯著差異(圖4詳述),計(jì)算各自的差別參數(shù)信息,代表其差異程度。如果存在顯著差 異,將該對(duì)AR0S的空間信息及差異參數(shù)加入顯著差異AR0S信息集,繼續(xù)下一對(duì)AR0S的選 擇進(jìn)入步驟S103,直到所有的AR0S對(duì)比都完成,進(jìn)入步驟S105。步驟S105,對(duì)存在顯著差異AR0S信息集,按照差異系數(shù)大小排序,按從大到小選 擇每一對(duì)存在顯著差異的AR0S區(qū)域,以該對(duì)AR0S區(qū)域?yàn)楹诵模詷悠穮^(qū)為邊界,逐步增 加鄰近樣品點(diǎn),判斷增加鄰近樣品點(diǎn)后的區(qū)域是否還存在顯著差別(判斷方法類似步驟 S104),如果存在則該鄰近樣品點(diǎn)增加到AR0S為核心的區(qū)域,形成新區(qū)域,如果不存在則該 樣品點(diǎn)不納入,直到擴(kuò)展到不能再擴(kuò)展為止,將新的區(qū)域信息添加到A樣品與B樣品質(zhì)譜成 像數(shù)據(jù)顯著差異信息集。避免重復(fù)計(jì)算,擴(kuò)增的順序和策略圖5詳述。A樣品與B樣品質(zhì)譜 成像數(shù)據(jù)顯著差異信息集中每一元素表示一對(duì)差異區(qū)域信息,該差異區(qū)域信息該對(duì)區(qū)域在A樣品上的空間位置(記為C1)、該對(duì)區(qū)域在B樣品上的空間位置(記為C2)、該對(duì)區(qū)域 在A樣品上的平均質(zhì)譜圖(記為C3)、該對(duì)區(qū)域在B樣品上的平均質(zhì)譜圖(記為C4),差異 譜(該對(duì)區(qū)域在A樣品上的平均質(zhì)譜圖_該對(duì)區(qū)域在B樣品上的平均質(zhì)譜圖,記為C5)。顯著差異信息集中每一元素形式如下 圖2是主成分分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖。如圖所示, 包括以下步驟步驟S201,將來自A樣品AR0S質(zhì)譜成像數(shù)據(jù)集A與B樣品AR0S質(zhì)譜成像數(shù)據(jù)集 B合并形成數(shù)據(jù)集AB,標(biāo)記哪些數(shù)據(jù)來源于A,哪些數(shù)據(jù)來源于B。步驟S202,對(duì)數(shù)據(jù)集AB進(jìn)行主成分分析(Principal Component Analysis,簡(jiǎn)稱 PCA)。PCA分析對(duì)數(shù)據(jù)具有降維和精簡(jiǎn)數(shù)據(jù)結(jié)果的作用,在PCA之前可以對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù) 標(biāo)準(zhǔn)化等預(yù)處理操作,PCA之后獲得PCA載荷圖信息和PCA得分圖信息,從另一個(gè)角度來重 新表示數(shù)據(jù)集AB。PCA載荷圖信息表示數(shù)據(jù)集AB的特征向量,PCA得分圖信息表示數(shù)據(jù)集 AB在這些特征向量的投影值。PCA的計(jì)算和操作可以參照書籍(任若恩、王惠文.多元統(tǒng) 計(jì)數(shù)據(jù)分析——理論、方法、實(shí)例.北京國(guó)防工業(yè)出版社,1997)。步驟S203,設(shè)定以第一主成分(簡(jiǎn)稱PC1)和第二主成分(簡(jiǎn)稱PC2)為坐標(biāo)軸 (PC1為橫坐標(biāo)軸、PC2為縱坐標(biāo)軸)的平面圖,在該平面圖上繪制樣品點(diǎn),該樣品的橫坐標(biāo) 值為該樣品數(shù)據(jù)在PC1上的得分值,縱坐標(biāo)值為該樣品數(shù)據(jù)在PC2上的得分值。以此將數(shù) 據(jù)集AB上所有樣品點(diǎn)均分布在該平面圖上。步驟S204,在以PC1和PC2為坐標(biāo)軸的平面圖上判斷A類點(diǎn)與B類點(diǎn)能否分開。 如果能分開則認(rèn)為A樣品點(diǎn)與B樣品點(diǎn)存在顯著差異,否則認(rèn)為差異不明顯。判斷的方法很 多如方法一幾何判別法,繪制出包含A樣品所有的點(diǎn)的最小多邊形,繪制包含B樣品所 有的點(diǎn)的最小多邊形,如果這兩個(gè)多變型不相交則認(rèn)為能分開,差異系數(shù)可以用A樣品點(diǎn) 重心到B樣品點(diǎn)重心的距離表示,重心距離越遠(yuǎn),差異越大;方法二聚類法,將這些點(diǎn)聚類, 分成兩類,判斷這兩類是否分別是A樣品點(diǎn)、B樣品點(diǎn),如果是就能分開。如果A樣品點(diǎn)與 B樣品點(diǎn)存在顯著差異則將信息增加到差異信息集中。差異信息集中每一元素代表一對(duì)區(qū) 域差異信息,每對(duì)區(qū)域差異信息包括:A樣品點(diǎn)所在的空間區(qū)域、B樣品點(diǎn)所在的空間區(qū)域, 主成分分析載荷圖信息、A樣品點(diǎn)所占多變形面積、B樣品點(diǎn)所占多變形面積、A樣品點(diǎn)多邊 形與B樣品點(diǎn)多邊形間最近點(diǎn)間的距離,A樣品點(diǎn)多邊形與B樣品點(diǎn)多邊形重心間的距離, 差異系數(shù)。其中差異系數(shù)代表差異的程度,可以是差異系數(shù)=A樣品點(diǎn)多邊形與B樣品點(diǎn) 多邊形重心間的距離/(A樣品點(diǎn)多邊形的面積+B樣品點(diǎn)多邊形的面積),也可以是差異 系數(shù)=A樣品點(diǎn)多邊形與B樣品點(diǎn)多邊形重心間的距離_(A樣品點(diǎn)多邊形的面積+B樣品 點(diǎn)多邊形的面積)。圖3是因子分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖。如圖所示,包 括以下步驟步驟S301,將來自A樣品AR0S質(zhì)譜成像數(shù)據(jù)集A與B樣品AR0S質(zhì)譜成像數(shù)據(jù)集 B合并形成數(shù)據(jù)集AB,標(biāo)記哪些數(shù)據(jù)來源于A,哪些數(shù)據(jù)來源于B。
16
步驟S302,對(duì)數(shù)據(jù)集AB進(jìn)行因子分析。因子分析是一種多元統(tǒng)計(jì)分析的方法,通 過對(duì)數(shù)據(jù)矩陣進(jìn)行特征分析、旋轉(zhuǎn)變換等操作,可獲取數(shù)據(jù)的相關(guān)信息。在因子之前可以對(duì) 數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化等預(yù)處理操作,可以設(shè)定80%以上的因子貢獻(xiàn)率閾值,因子后獲得因 子載荷圖信息和因子得分圖信息,從另一個(gè)角度來重新表示數(shù)據(jù)集AB,因子載荷圖信息表 示數(shù)據(jù)集AB的特征向量,因子得分圖信息表示數(shù)據(jù)集AB在這些特征向量的投影值。因子分 析的計(jì)算和操作可以參照書籍(王學(xué)民.應(yīng)用多元分析.上海上海財(cái)經(jīng)大學(xué)出版社,2009)步驟S303,設(shè)定以第一主因子和第二主因子為坐標(biāo)軸(第一主因子為橫坐標(biāo)軸、 第二主因子為縱坐標(biāo)軸)的平面圖,在該平面圖上繪制樣品點(diǎn),該樣品的橫坐標(biāo)值為該樣 品數(shù)據(jù)在第一主因子上的得分值,縱坐標(biāo)值為該樣品數(shù)據(jù)在第二主因子上的得分值。以此 將數(shù)據(jù)集AB上所有樣品點(diǎn)均分布在該平面圖上。步驟S304,在以第一主因子和第二主因子為坐標(biāo)軸的平面圖上判斷A樣品點(diǎn)與B 樣品點(diǎn)能否分開。如果能分開則認(rèn)為A樣品點(diǎn)與B樣品點(diǎn)存在顯著差異,否則認(rèn)為差異不 明顯。判斷的方法很多如方法一幾何判別法,繪制出包含A樣品所有的點(diǎn)的最小多邊形, 繪制包含B樣品所有的點(diǎn)的最小多邊形,如果這兩個(gè)多變型不相交則認(rèn)為能分開,差異系 數(shù)可以用A樣品點(diǎn)重心到B樣品點(diǎn)重心的距離表示,重心距離越遠(yuǎn),差異越大;方法二聚類 法,將這些點(diǎn)聚類,分成兩類,判斷這兩類是否分別是A樣品點(diǎn)、B樣品點(diǎn),如果是就能分開。 如果A樣品點(diǎn)與B樣品點(diǎn)存在顯著差異則將信息增加到差異信息集中。差異信息集中每一 元素代表一對(duì)區(qū)域差異信息,每對(duì)區(qū)域差異信息包括A樣品點(diǎn)所在的空間區(qū)域、B樣品點(diǎn) 所在的空間區(qū)域,主成分分析載荷圖信息、A樣品點(diǎn)所占多變形面積、B樣品點(diǎn)所占多變形 面積、A樣品點(diǎn)多邊形與B樣品點(diǎn)多邊形間最近點(diǎn)間的距離,A樣品點(diǎn)多邊形與B樣品點(diǎn)多 邊形重心間的距離,差異系數(shù)。其中差異系數(shù)代表差異的程度,可以是差異系數(shù)=A樣品 點(diǎn)多邊形與B樣品點(diǎn)多邊形重心間的距離/(A樣品點(diǎn)多邊形的面積+B樣品點(diǎn)多邊形的面 積),也可以是差異系數(shù)=A樣品點(diǎn)多邊形與B樣品點(diǎn)多邊形重心間的距離_(A樣品點(diǎn)多 邊形的面積+B樣品點(diǎn)多邊形的面積)。圖4是統(tǒng)計(jì)分析計(jì)算差異參數(shù)并判斷差異是否顯著的方法流程圖。如圖所示,包 括以下步驟步驟S401,對(duì)B樣品AR0S質(zhì)譜成像數(shù)據(jù)集B做一致性檢驗(yàn),計(jì)算數(shù)據(jù)集B的相關(guān) 性,如果數(shù)據(jù)集B內(nèi)的數(shù)據(jù)一致性優(yōu)于0. 9,可認(rèn)定為通過一致性檢驗(yàn),認(rèn)為該數(shù)據(jù)集自身 是一樣品數(shù)據(jù),彼此間差異不顯著,否則,退出計(jì)算。步驟S402,對(duì)A樣品AR0S質(zhì)譜成像數(shù)據(jù)集A做一致性檢驗(yàn),計(jì)算數(shù)據(jù)集B的相關(guān) 性,如果數(shù)據(jù)集B內(nèi)的數(shù)據(jù)一致性優(yōu)于0. 9,可認(rèn)定為通過一致性檢驗(yàn),認(rèn)為該數(shù)據(jù)集自身 是一樣品數(shù)據(jù),彼此間差異不顯著,否則,退出計(jì)算。步驟S403,將B樣品AR0S質(zhì)譜成像數(shù)據(jù)集B做平均,獲得平均質(zhì)譜數(shù)據(jù)。步驟S404,將A樣品AR0S質(zhì)譜成像數(shù)據(jù)集A做平均,獲得平均質(zhì)譜數(shù)據(jù)。步驟S405,提取A平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,提取B平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,從離子 (m/z)種類和離子強(qiáng)度進(jìn)行對(duì)比首選對(duì)比離子種類,看A樣品有的離子種類,B樣品是否都 有,B樣品有的離子種類,A樣品是否都有;對(duì)于A、B樣品都有的離子種類,分別比較每一個(gè) 離子的信號(hào)強(qiáng)度是否相同,具體判斷是否存在差異,進(jìn)入步驟406。步驟S406,判斷A、B質(zhì)譜圖是否存在差異。如果離子種類存在差異則認(rèn)為存在顯著差異,如果離子種類沒行差異,但是離子強(qiáng)度存在顯著差異也認(rèn)為存在顯著差異。離子種 類存在差異的判斷方法如果存在A樣品有的離子,B樣品沒有,或者B樣品有的離子,A樣 品沒有則認(rèn)為存在差異;離子強(qiáng)度存在顯著差異的判斷方法將兩組離子強(qiáng)度做相關(guān)性分 析,設(shè)定離子強(qiáng)度表示al(xl,yl),a2 (x2,y2),……、ai (xi,yi)……、an (xn,yn),其中,ai 表示第i種離子,xi表示該離子在A樣品中的信號(hào)強(qiáng)度、yi表示該離子在B樣品中的信號(hào)強(qiáng) 度,計(jì)算其相關(guān)性(倪永年.化學(xué)計(jì)量學(xué)在分析化學(xué)中的應(yīng)用.北京科學(xué)出版社,2004),應(yīng) 用代表相關(guān)程度的決定系數(shù)(相關(guān)系數(shù)的平方)R2的大小來判斷是否相關(guān),如果相關(guān)則認(rèn) 為不存在差異,不過不相關(guān)則認(rèn)為存在差異,若R2小于0. 8則認(rèn)為不相關(guān),存在顯著差異。 將存在顯著差異的對(duì)比信息列入A樣品與B樣品質(zhì)譜成像數(shù)據(jù)顯著差異信息集。差異信息 集中每一元素代表一對(duì)區(qū)域差異信息,每對(duì)區(qū)域差異信息包括:A樣品點(diǎn)所在的空間區(qū)域、 B樣品點(diǎn)所在的空間區(qū)域,A樣品點(diǎn)間的決定系數(shù)平均值、B樣品點(diǎn)間的決定系數(shù)平均值、A 樣品點(diǎn)平均質(zhì)譜圖與B樣品點(diǎn)平均質(zhì)譜圖間決定系數(shù),差異系數(shù)。其中差異系數(shù)代表差異 的程度,可以是差異系數(shù)=(A樣品點(diǎn)間的決定系數(shù)平均值+B樣品點(diǎn)間的決定系數(shù)平均 值)/A樣品點(diǎn)平均質(zhì)譜圖與B樣品點(diǎn)平均質(zhì)譜圖間決定系數(shù),也可以是差異系數(shù)=(A樣 品點(diǎn)間的決定系數(shù)平均值+B樣品點(diǎn)間的決定系數(shù)平均值)_A樣品點(diǎn)平均質(zhì)譜圖與B樣品 點(diǎn)平均質(zhì)譜圖間決定系數(shù)。圖5是以AR0S為核心的擴(kuò)增差異區(qū)域的方法流程圖。如圖所示,包括以下步驟步驟S501,對(duì)A樣品與B樣品AR0S質(zhì)譜成像數(shù)據(jù)顯著差異信息,按照差異系數(shù)從 大到小排序。步驟S502,按序選取一對(duì)AR0S質(zhì)譜成像數(shù)據(jù)顯著差異信息,即按順序分布選取A 樣品AR0S區(qū)域和B樣品AR0S區(qū)域的數(shù)據(jù)信息。步驟S503,判斷步驟S502所選取的AR0S是否已經(jīng)包含在擴(kuò)展的新區(qū)域中,如果存 在就沒有必要繼續(xù)擴(kuò)增,對(duì)下一對(duì)AR0S進(jìn)行擴(kuò)展。判斷的方法是選取A樣品的AR0S,與A 樣品中已成功擴(kuò)增區(qū)域的進(jìn)行比對(duì),若該AR0S包含在任何一個(gè)擴(kuò)增的區(qū)域內(nèi),則進(jìn)入步騾 S502 ;如果不是,選取B樣品的AR0S,與B樣品中已成功擴(kuò)增的區(qū)域的進(jìn)行比對(duì),若該AR0S 包含在任何一個(gè)擴(kuò)增的區(qū)域內(nèi),則進(jìn)入步驟S502,否則進(jìn)入步驟S504。步驟S504,以B樣品AR0S為比較對(duì)象,以A樣品AR0S為核心,逐步擴(kuò)展A樣品的 區(qū)域,可以按照順時(shí)針方向或逆時(shí)針方向,圍繞A樣品AR0S向外臨近區(qū)域擴(kuò)增,每增加一個(gè) 樣品點(diǎn)就應(yīng)用步驟S505所示方法比對(duì)實(shí)驗(yàn)。步驟S505,以B樣品AR0S為比較對(duì)象,對(duì)于以A樣品AR0S為核心新增一個(gè)像素 形成的新區(qū)域,再對(duì)比這新區(qū)域是否存在差異,如果存在則新增像素加入到A樣品區(qū)域,如 果不存在差異,則不需要該像素點(diǎn),標(biāo)記該點(diǎn)以免重復(fù)計(jì)算(該點(diǎn)向外擴(kuò)增的區(qū)域不予考 慮)。如此,進(jìn)入步驟S504,增加下一個(gè)點(diǎn),在保證存在顯著差異的前提下,將以A樣品AR0S 為核心增加到最大,不能超過A樣品區(qū)域邊界,對(duì)已經(jīng)判斷不存在差異的像素點(diǎn)不再向外 擴(kuò)展,形成A樣品的新區(qū)域。步驟S506,以A樣品新區(qū)域?yàn)楸容^對(duì)象,以B樣品AR0S為核心,逐步擴(kuò)展B樣品的 區(qū)域,可以按照順時(shí)針方向或逆時(shí)針方向,圍繞B樣品AR0S向外臨近區(qū)域擴(kuò)增,每增加一個(gè) 樣品點(diǎn)就應(yīng)用步驟S507所示方法比對(duì)實(shí)驗(yàn)。。步驟S507,以A樣品新區(qū)域?yàn)楸容^對(duì)象,對(duì)于以B樣品AR0S為核心新增一個(gè)像素形成的新區(qū)域,再對(duì)比這新區(qū)域是否存在差異,如果存在則新增像素加入到A樣品區(qū)域,如 果不存在差異,則不需要該像素點(diǎn),標(biāo)記該點(diǎn)以免重復(fù)計(jì)算。如此,進(jìn)入步驟S506,增加下一 個(gè)點(diǎn),在保證存在顯著差異的前提下,將以B樣品AR0S為核心增加到最大,不能超過B樣品 區(qū)域邊界,對(duì)已經(jīng)判斷不存在差異的像素點(diǎn)不再向外擴(kuò)展,形成B樣品的新區(qū)域。保存A樣 品的新區(qū)域、B樣品的新區(qū)域的信息到A樣品與B樣品質(zhì)譜成像數(shù)據(jù)顯著差異信息(擴(kuò)增 區(qū)域)。擴(kuò)增區(qū)域信息包括:A樣品的新區(qū)域空間信息、B樣品的新區(qū)域的空間信息。步驟S508,判斷是否所有的AR0S均擴(kuò)增完畢,如果完畢就結(jié)束,沒有就進(jìn)行下一 對(duì)AR0S的擴(kuò)展運(yùn)算,進(jìn)入步驟501。本領(lǐng)域的技術(shù)人員在不脫離權(quán)利要求書確定的本發(fā)明的精神和范圍的條件下,還 可以對(duì)以上內(nèi)容進(jìn)行各種各樣的修改。因此本發(fā)明的范圍并不僅限于以上的說明,而是由 權(quán)利要求書的范圍來確定的。
19
權(quán)利要求
質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,包括步驟1,從第一組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù)集和第二組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù)集中分別選取進(jìn)行差異分析的區(qū)域;步驟2,設(shè)定代表第一組被測(cè)樣品最小區(qū)域和第二組被測(cè)樣品最小區(qū)域的大小和形狀;步驟3,在為第一組被測(cè)樣品和第二組被測(cè)樣品所選取的進(jìn)行差異分析的區(qū)域中選定各最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù);步驟4,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)分別利用主成分分析方法、因子分析方法或統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異程度是否符合預(yù)設(shè)條件;將符合預(yù)設(shè)條件的最小區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜圖,或者符合預(yù)設(shè)條件的最小區(qū)域的空間信息及相應(yīng)的樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入最小區(qū)域信息集;根據(jù)區(qū)域信息集中的空間信息或者樣品點(diǎn)之間的決定系數(shù)和樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)計(jì)算得到差異系數(shù);步驟5,按照差異系數(shù)進(jìn)行排序,選擇與每個(gè)差異系數(shù)對(duì)應(yīng)的第一組被測(cè)樣品中的最小區(qū)域和二組被測(cè)樣品中的最小區(qū)域;分別以第一組被測(cè)樣品中的最小區(qū)域和第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域存在的差異程度是否符合預(yù)設(shè)條件;擴(kuò)展后的以第一組被測(cè)樣品中的區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第一組被測(cè)樣品的界限,擴(kuò)展后的以第二組被測(cè)樣品中的區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第二組被測(cè)樣品的界限;將擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜圖,或者將擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入?yún)^(qū)域信息集。
2.如權(quán)利要求1所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,步驟4中,將第一 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì) 譜成像數(shù)據(jù)利用主成分分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù) 和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件 包括步驟21,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的 最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;步驟22,對(duì)合并后的數(shù)據(jù)進(jìn)行主成分分析,得到主成分分析載荷圖信息和主成分分析 得分圖信息;步驟23,設(shè)定以第一主成分為橫坐標(biāo)和以第二主成份為縱坐標(biāo)的平面圖,在該平面圖 上繪制第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品 點(diǎn)的橫坐標(biāo)值為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主成分上的得分值,樣品點(diǎn)的縱坐標(biāo)值 為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主成份上的得分值;步驟24,在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè) 樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。
3.如權(quán)利要求1所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,步驟4中,將第一 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì) 譜成像數(shù)據(jù)利用因子分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和 第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件包 括步驟31,將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的 最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并成數(shù)據(jù)集AB,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;步驟32,對(duì)數(shù)據(jù)集AB進(jìn)行因子分析,得到因子載荷圖信息和因子得分圖信息;步驟33,設(shè)定以第一主因子為橫坐標(biāo)和第二主因子為縱坐標(biāo)的平面圖,在該平面圖上 繪制第一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品點(diǎn) 的橫坐標(biāo)值為該樣品點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主因子上的得分值,縱坐標(biāo)值為該樣品 點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主因子上的得分值;步驟34,在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè) 樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含 的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。
4.如權(quán)利要求2或3所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,利用幾何判別 法或聚類法判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小 區(qū)域包含的樣品點(diǎn)能否分開。
5.如權(quán)利要求1所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,步驟4中,將第一 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì) 譜成像數(shù)據(jù)利用統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件包括步驟41,對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn),對(duì)第二 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn);一致性檢驗(yàn)通過后,執(zhí)行步 騾42 ;步驟42,對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第一平均 質(zhì)譜數(shù)據(jù);對(duì)第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第二平均質(zhì) 譜數(shù)據(jù);步驟43,提取第一平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,提取第二平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰;步驟44,判斷第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類或離子強(qiáng)度是否 存在差異;預(yù)設(shè)條件為第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類存在差異, 或者第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類不存在差異但離子強(qiáng)度存在 差異,離子強(qiáng)度存在差異需要滿足下述條件將第一平均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度和第二平 均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度做相關(guān)性比較后,決定系數(shù)大于或等于0. 8。
6.如權(quán)利要求1所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,分別以第一組被 測(cè)樣品中的最小區(qū)域和第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組 被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域存在的差異系數(shù)是否符合預(yù)設(shè)條 件具體包括步驟51,選擇一個(gè)第一組被測(cè)樣品中的最小區(qū)域和一個(gè)第二組被測(cè)樣品中的最小區(qū)域;步驟51,固定所選定的第一組被測(cè)樣品中的最小區(qū)域,以所選定的第二組被測(cè)樣品中 的最小區(qū)域進(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域與 所選定的第一組被測(cè)樣品中的最小區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件;步驟52,固定擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域,以所選 定的第一組被測(cè)樣品中的最小區(qū)域?yàn)楹诵倪M(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第一組被測(cè)樣品 中的最小區(qū)域?yàn)楹诵牡膮^(qū)域與擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡?區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件。
7.如權(quán)利要求2或3所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,差異系數(shù)等于 第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心與第二組被測(cè)樣品中的 最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間的距離除以第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)組成的多邊形的面積與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的 多邊形的面積之和,或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的 多邊形的重心與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間的距 離減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積與第二組被測(cè)樣 品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積之和。
8.如權(quán)利要求6所述的質(zhì)譜成像數(shù)據(jù)的差異分析方法,其特征在于,差異系數(shù)等于第 一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值與第二組被測(cè)樣品中的 最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和除以第一組被測(cè)樣品中的最小區(qū)域包 含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之 間的決定系數(shù),或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定 系數(shù)平均值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和減 去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最小 區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù)。
9.質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,包括差異分析區(qū)域選取模塊,用于從第一組被測(cè)樣品的質(zhì)譜成像數(shù)據(jù)集和第二組被測(cè)樣品 的質(zhì)譜成像數(shù)據(jù)集中分別選取進(jìn)行差異分析的區(qū)域;最小區(qū)域設(shè)定模塊,用于設(shè)定代表第一組被測(cè)樣品最小區(qū)域和第二組被測(cè)樣品最小區(qū) 域的大小和形狀;質(zhì)譜成像數(shù)據(jù)選取模塊,用于在為第一組被測(cè)樣品和第二組被測(cè)樣品所選取的進(jìn)行差 異分析的區(qū)域中選定各最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù);差異程度判決模塊,用于將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二 組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)分別利用主成分分析方法、因子分析方法或 統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的 最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異程度是否符合預(yù)設(shè)條件;將符合預(yù)設(shè)條件的最小 區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜圖,或者符合預(yù)設(shè)條件的最小區(qū)域的空間信息及相應(yīng)的 樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入最小區(qū)域信息集; 根據(jù)區(qū)域信息集中的空間信息或者樣品點(diǎn)之間的決定系數(shù)和樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)計(jì)算得到差異系數(shù);擴(kuò)展模塊,用于按照差異系數(shù)進(jìn)行排序,選擇與每個(gè)差異系數(shù)對(duì)應(yīng)的第一組被測(cè)樣品中的最小區(qū)域和二組被測(cè)樣品中的最小區(qū)域;分別以第一組被測(cè)樣品中的最小區(qū)域和第二 組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后 的第二組被測(cè)樣品中的區(qū)域存在的差異程度是否符合預(yù)設(shè)條件;擴(kuò)展后的以第一組被測(cè)樣 品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第一組被測(cè)樣品的界限,擴(kuò)展后的以第二組被 測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域的界限不超出第二組被測(cè)樣品的界限;將擴(kuò)展后的第一 組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間信息及相應(yīng)的平均質(zhì)譜 圖,或者將擴(kuò)展后的第一組被測(cè)樣品中的區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的區(qū)域的空間 信息及相應(yīng)的樣品點(diǎn)之間的決定系數(shù)和相應(yīng)的樣品點(diǎn)平均質(zhì)譜圖之間的決定系數(shù)加入?yún)^(qū) 域信息集。
10.如權(quán)利要求9所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,將第一組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù) 據(jù)利用主成分分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組 被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件包括將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的最小區(qū) 域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源;對(duì)合并后的數(shù)據(jù)進(jìn)行主成分分析,得到主成分分析載荷圖信息和主成分分析得分圖信息;設(shè)定以第一主成分為橫坐標(biāo)和以第二主成份為縱坐標(biāo)的平面圖,在該平面圖上繪制第 一組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品點(diǎn)的橫坐 標(biāo)值為該樣品對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主成分上的得分值,樣品點(diǎn)的縱坐標(biāo)值為該樣品 對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第二主成份上的得分值;在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣品中 的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含的樣品 點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。
11.如權(quán)利要求9所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,將第一組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù) 據(jù)利用因子分析方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被 測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件包括將第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)與第二組被測(cè)樣品中的最小區(qū) 域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)合并成數(shù)據(jù)集AB,并標(biāo)記質(zhì)譜成像數(shù)據(jù)的來源; 對(duì)數(shù)據(jù)集AB進(jìn)行因子分析,得到因子載荷圖信息和因子得分圖信息; 設(shè)定以第一主因子為橫坐標(biāo)和第二主因子為縱坐標(biāo)的平面圖,在該平面圖上繪制第一 組被測(cè)樣品中的最小區(qū)域與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn);樣品點(diǎn)的橫坐標(biāo) 值為該樣品點(diǎn)對(duì)應(yīng)的質(zhì)譜成像數(shù)據(jù)在第一主因子上的得分值,縱坐標(biāo)值為該樣品點(diǎn)對(duì)應(yīng)的 質(zhì)譜成像數(shù)據(jù)在第二主因子上的得分值;在該平面圖上判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣品中 的最小區(qū)域包含的樣品點(diǎn)能否分開;預(yù)設(shè)條件為第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能分開。
12.如權(quán)利要求10或11所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,差異程度 判決模塊利用幾何判別法或聚類法判斷第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)與第 二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)能否分開。
13.如權(quán)利要求9所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,將第一組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù) 據(jù)利用統(tǒng)計(jì)方法比較第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)和第二組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)存在的差異系數(shù)是否符合預(yù)設(shè)條件包括對(duì)第一組被測(cè)樣品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn),對(duì)第二組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做一致性檢驗(yàn);一致性檢驗(yàn)通過后,對(duì)第一組被測(cè)樣 品中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第一平均質(zhì)譜數(shù)據(jù);對(duì)第二組被測(cè)樣品 中的最小區(qū)域?qū)?yīng)的質(zhì)譜成像數(shù)據(jù)做平均,獲得第二平均質(zhì)譜數(shù)據(jù);提取第一平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰,提取第二平均質(zhì)譜數(shù)據(jù)的質(zhì)譜峰;判斷第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類或離子強(qiáng)度是否存在差 異;預(yù)設(shè)條件為第一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類存在差異,或者第 一平均質(zhì)譜數(shù)據(jù)圖和第二平均質(zhì)譜數(shù)據(jù)圖的離子種類不存在差異但離子強(qiáng)度存在差異,離 子強(qiáng)度存在差異需要滿足下述條件將第一平均質(zhì)譜數(shù)據(jù)圖的離子強(qiáng)度和第二平均質(zhì)譜數(shù) 據(jù)圖的離子強(qiáng)度做相關(guān)性比較后,決定系數(shù)大于或等于0. 8。
14.如權(quán)利要求9所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,分別以第一組被 測(cè)樣品中的最小區(qū)域和第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵臄U(kuò)展樣品點(diǎn),擴(kuò)展后的第一組 被測(cè)樣品中的最小區(qū)域和擴(kuò)展后的第二組被測(cè)樣品中的最小區(qū)域存在的差異系數(shù)是否符 合預(yù)設(shè)條件具體包括選擇一個(gè)第一組被測(cè)樣品中的最小區(qū)域和一個(gè)第二組被測(cè)樣品中的最小區(qū)域;固定所選定的第一組被測(cè)樣品中的最小區(qū)域,以所選定的第二組被測(cè)樣品中的最小區(qū) 域進(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域與所選定的 第一組被測(cè)樣品中的最小區(qū)域存在的差異系數(shù)符合預(yù)設(shè)的條件;固定擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域,以所選定的第一 組被測(cè)樣品中的最小區(qū)域?yàn)楹诵倪M(jìn)行擴(kuò)展,擴(kuò)展后的以所選定的第一組被測(cè)樣品中的最小 區(qū)域?yàn)楹诵牡膮^(qū)域與擴(kuò)展后的以所選定的二組被測(cè)樣品中的最小區(qū)域?yàn)楹诵牡膮^(qū)域存在 的差異系數(shù)符合預(yù)設(shè)的條件。
15.如權(quán)利要求10或11所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,差異系數(shù) 等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心與第二組被測(cè)樣品 中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間的距離除以第一組被測(cè)樣品中的最小 區(qū)域包含的樣品點(diǎn)組成的多邊形的面積與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組 成的多邊形的面積之和,或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組 成的多邊形的重心與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的重心間 的距離減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積與第二組被 測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)組成的多邊形的面積之和。
16.如權(quán)利要求13所述的質(zhì)譜成像數(shù)據(jù)的差異分析系統(tǒng),其特征在于,差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值與第二組被測(cè)樣品中 的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和除以第一組被測(cè)樣品中的最小區(qū)域 包含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最小區(qū)域包 含的樣品點(diǎn)的平均質(zhì)譜圖 之間的決定系數(shù),或者差異系數(shù)等于第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決 定系數(shù)平均值與第二組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)之間的決定系數(shù)平均值之和 減去第一組被測(cè)樣品中的最小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖與第二組被測(cè)樣品中的最 小區(qū)域包含的樣品點(diǎn)的平均質(zhì)譜圖之間的決定系數(shù)。
全文摘要
本發(fā)明涉及質(zhì)譜成像數(shù)據(jù)的差異分析方法及系統(tǒng),該方法包括選取需要進(jìn)行差異分析的區(qū)域并確定最小區(qū)域的形狀和大小,得到被測(cè)樣品的質(zhì)譜數(shù)據(jù)集;分析所選定的最小區(qū)域間存在的差異,得到差異系數(shù);按照差異系數(shù)進(jìn)行排序,并以選定的最小區(qū)域?yàn)楹诵倪M(jìn)行擴(kuò)展,判定擴(kuò)展后的區(qū)域之間的差異程度是否符合預(yù)設(shè)的條件。本發(fā)明能夠使研究人員準(zhǔn)確、精確分析不同樣品成像數(shù)據(jù)圖間的顯著差異、差異所在的樣品區(qū)域,物質(zhì)種類與含量差異。
文檔編號(hào)G01N27/62GK101865880SQ20101019463
公開日2010年10月20日 申請(qǐng)日期2010年5月28日 優(yōu)先權(quán)日2010年5月28日
發(fā)明者張玉奎, 方向, 江游, 熊行創(chuàng), 黃澤建 申請(qǐng)人:中國(guó)計(jì)量科學(xué)研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
高青县| 定兴县| 海阳市| 安西县| 梅河口市| 靖西县| 白城市| 托克逊县| 额敏县| 涟水县| 奉化市| 尚志市| 神池县| 太仓市| 佛教| 炉霍县| 扶余县| 岳阳县| 牡丹江市| 施秉县| 奉贤区| 井研县| 清河县| 马山县| 彭州市| 黑水县| 沽源县| 新竹市| 那坡县| 华蓥市| 黑水县| 庆元县| 华亭县| 绵阳市| 富裕县| 宁陵县| 吉安县| SHOW| 米林县| 贵南县| 上杭县|