處理質(zhì)譜數(shù)據(jù)的方法

文檔序號：2925648閱讀：2731來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>照明工業(yè)產(chǎn)品的制造及其應(yīng)用技術(shù)

專利名稱：處理質(zhì)譜數(shù)據(jù)的方法
背景技術(shù)：
本發(fā)明涉及處理質(zhì)譜數(shù)據(jù)的方法，尤其但非排他地涉及處理從傅里葉變換離子回旋共振質(zhì)譜法(FTMS)中獲得的數(shù)據(jù)。
一般光譜測定法，尤其是質(zhì)譜法產(chǎn)生極其豐富的數(shù)據(jù)集。這對諸如使用雙聚焦磁扇形質(zhì)譜測定法(double focussing magnetic sector mass spectrometry)、飛行式質(zhì)譜測定法(time-of-flight mass spectrometry)以及傅里葉變換質(zhì)譜測定法(FTMS)獲取的數(shù)據(jù)等高分辨率質(zhì)譜數(shù)據(jù)尤其如此。例如，從FTMS中m/z200-2000的標(biāo)準(zhǔn)采集涉及對一百萬個數(shù)據(jù)點(diǎn)的測量。每秒一次掃描的測量(液相色譜法/質(zhì)譜測定法(LC/MS)應(yīng)用中典型的)導(dǎo)致以7.2 GB/小時(約170 GB/天)的速率生成原始數(shù)據(jù)。
一般，這些光譜被存儲在計(jì)算機(jī)存儲器或替換計(jì)算機(jī)可讀介質(zhì)中，因此需要大量存儲器以便存儲。這樣的光譜數(shù)據(jù)的大部分(可能99％)不包含有價值的信息，而主要包含除其總體幅度和標(biāo)準(zhǔn)偏差以外的無分析價值的噪聲。
目前，質(zhì)譜儀或者存儲整個數(shù)據(jù)集，或者可能嘗試以兩種方式之一來減小數(shù)據(jù)集的大小。
第一種方式僅存儲質(zhì)譜中找到的峰值的列表(即，存儲每一峰值的位置和大小)。這種方法的缺點(diǎn)在于用戶或軟件不能重新評估數(shù)據(jù)以獲取諸如峰形、背景、信噪比或不能在沒有附加假設(shè)的情況下生成的其它信息等進(jìn)一步的特性。當(dāng)進(jìn)一步手動或自動處理信息時，關(guān)于光譜的非峰值部分的信息是非常有價值的。信噪比給出關(guān)于事件重要性的重要提示。此外，對可以使用遠(yuǎn)超出僅一組內(nèi)的峰值的位置和強(qiáng)度的自動化處理的技巧來評估光譜的熟練用戶，峰值組非常有益。
減小要存儲的數(shù)據(jù)文件的大小的第二種方法通過操作員預(yù)選閾值以及軟件僅存儲光譜中其值大于該閾值的數(shù)據(jù)點(diǎn)來實(shí)現(xiàn)。如果操作員正確地猜測了閾值，則將僅存儲屬于峰值的數(shù)據(jù)點(diǎn)。這具有保存關(guān)于峰形的信息的優(yōu)點(diǎn)。然而，該方法的缺點(diǎn)在于，它依賴于操作員的技巧來正確設(shè)置閾值水平。如果閾值水平設(shè)置得太低，則一般將連同峰值數(shù)據(jù)點(diǎn)一起存儲大量噪聲數(shù)據(jù)點(diǎn)，而如果閾值設(shè)置得太高，則關(guān)于峰形的有價值信息將隨峰底的數(shù)據(jù)點(diǎn)的遺失而丟失。從而，除有經(jīng)驗(yàn)的操作員以外的任何其他人難以成功地使用這樣的軟件。此外，未存儲關(guān)于噪聲的任何信息，使得所有這樣的信息均丟失。
對FTMS數(shù)據(jù)中的噪聲的分析的改進(jìn)由Hanna在1985年9月9-13日Swansea鎮(zhèn)“Advances in Mass Spectrometry 1 985proceedings of the 1 0th International MassSpectrometry Conference”(John Wiley and Sons出版社)中以及1985年5月26-31日美國加利福尼亞州圣地亞哥市的ASMS 33rd Annual Conference on MassSpectrometry and Allied Topics的學(xué)報(bào)中描述。Hanna所述的方法使用對FTMS中存在的噪聲的統(tǒng)計(jì)分析來獲得用作光譜的噪聲排除水平的閾值。峰值列表從該閾值之上的數(shù)據(jù)中獲得。雖然Hanna文章中所述的技術(shù)允許實(shí)現(xiàn)對合適噪聲閾值的更好的估算，但它們?nèi)杂腥舾扇秉c(diǎn)。首先，這種技術(shù)僅導(dǎo)致對峰值位置及其強(qiáng)度的確定，而關(guān)于峰形和光譜噪聲兩者的有價值信息均丟失。其次，由于為獲得噪聲分布的參數(shù)而需要若干次迭代直到這些參數(shù)穩(wěn)定，因此這種技術(shù)在計(jì)算上相當(dāng)昂貴。
發(fā)明概述針對該背景，且從第一方面，本發(fā)明在于一種處理傅里葉變換質(zhì)譜數(shù)據(jù)的方法，它包括(a)對于一質(zhì)荷比范圍獲取時域中FTMS數(shù)據(jù)集；(b)將所獲取的時域數(shù)據(jù)的子集變換到頻域；(c)對該頻域數(shù)據(jù)子集應(yīng)用第一閾值以將噪聲數(shù)據(jù)從指示具有所述范圍的質(zhì)荷比的離子的存在性的峰值數(shù)據(jù)中區(qū)分出來；(d)將所獲得的時域數(shù)據(jù)的基本上全數(shù)據(jù)集變換到頻域；以及(e)標(biāo)識該經(jīng)變換的全數(shù)據(jù)集內(nèi)與步驟(c)中標(biāo)識為包含峰值數(shù)據(jù)的經(jīng)變換的數(shù)據(jù)子集的范圍相對應(yīng)的范圍。
本發(fā)明該方面的處理技術(shù)允許針對隨機(jī)噪聲改進(jìn)區(qū)分度，不論是移除“標(biāo)準(zhǔn)”閾值處的隨機(jī)噪聲尖峰(spike)以便壓縮要存儲的數(shù)據(jù)文件還是使用較低閾值來定位較小的真實(shí)信號(但這樣數(shù)據(jù)文件可能不會被壓縮)。本發(fā)明基于隨著分辨率增加(等價于時域數(shù)據(jù)點(diǎn)的數(shù)目)，在閾值之上找到的隨機(jī)噪聲峰值的數(shù)目增加，但“真實(shí)”信號峰值，即真正表示具有所選范圍內(nèi)的質(zhì)荷比的離子的存在性的峰值的數(shù)目稍有增加或沒有增加的觀察結(jié)果。反之也為真隨著分辨率降低，隨機(jī)峰值的數(shù)目也減少。實(shí)際上，發(fā)現(xiàn)真實(shí)信號峰值的數(shù)目在所有分辨率下相對穩(wěn)定。這是因?yàn)榧俣S機(jī)噪聲是高斯分布的，則存在越多的數(shù)據(jù)點(diǎn)，任何給定閾值之上的數(shù)據(jù)點(diǎn)也越多。頻域數(shù)據(jù)點(diǎn)的數(shù)目與時域數(shù)據(jù)點(diǎn)的數(shù)目成正比。因此，較小的時域數(shù)據(jù)集產(chǎn)生較少的隨機(jī)噪聲峰值，并且這可用作對全數(shù)據(jù)集設(shè)置閾值的基礎(chǔ)。
通過僅將時域中的全部FTMS數(shù)據(jù)集的一部分變換到頻域，由于分辨率的降低，在給定閾值處將出現(xiàn)相對較少數(shù)目的假峰值。一旦標(biāo)識了延及閾值之上的峰值(優(yōu)選地，這些峰值的位置)，將變換全數(shù)據(jù)集，但僅之前較低分辨率處標(biāo)識的位置周圍的數(shù)據(jù)需要被分析和/或保存。換言之，避免了如果閾值僅應(yīng)用于頻域中的全數(shù)據(jù)集而可能找到較大數(shù)目的假峰值的問題，因?yàn)樽鳛楝F(xiàn)有的在較低分辨率處應(yīng)用閾值的結(jié)果，假峰值可被忽略。
在一個實(shí)施例中，可顯示和/或存儲來自全部變換的基本上所有數(shù)據(jù)，但僅部分瞬變的變換中所標(biāo)識的范圍中是“真實(shí)”數(shù)據(jù)(因?yàn)樗鼈兾挥诘谝婚撝抵?。換言之，不需對全部變換應(yīng)用第二強(qiáng)度閾值，并且數(shù)據(jù)總量主要通過例如標(biāo)識所掃描范圍內(nèi)僅包含噪聲數(shù)據(jù)的頻率/質(zhì)量范圍(通過將第一閾值應(yīng)用于部分瞬變變換)以及簡單地在全部瞬變變換中拒絕這些相應(yīng)的范圍而減少。然而，在附加或替換實(shí)施例中，可對全部瞬變變換中的數(shù)據(jù)應(yīng)用第二閾值，且僅第二閾值之上的數(shù)據(jù)被保存以便顯示、存儲等。該第二閾值可以與第一閾值相同或不同。
根據(jù)本發(fā)明的第二方面，提供了一種處理傅里葉變換質(zhì)譜(FTMS)數(shù)據(jù)的方法，包括(a)將對于一質(zhì)荷比(m/z)范圍在時域中所獲得的第一FTMS數(shù)據(jù)集變換到頻域；(b)將不同于所述第一FTMS數(shù)據(jù)集的第二時域FTMS數(shù)據(jù)集變換到頻域；以及(c)將頻域內(nèi)的第一FTMS數(shù)據(jù)集與頻域內(nèi)的第二FTMS數(shù)據(jù)集相關(guān)以便標(biāo)識頻域中每一數(shù)據(jù)集所共有的峰值。
本發(fā)明的這方面充分利用了噪聲基本上是隨機(jī)的這一事實(shí)。這樣，當(dāng)時域中的全數(shù)據(jù)集的不同部分被變換到頻域時，它們應(yīng)展示同一相對位置處的峰值，例如是那些“真實(shí)”峰值的峰值，但從隨機(jī)噪聲得到的數(shù)據(jù)中的峰值相反應(yīng)不會在統(tǒng)計(jì)上出現(xiàn)在全數(shù)據(jù)集的兩個單獨(dú)子集的同一位置上。
第一和第二數(shù)據(jù)集可從相同瞬變的不同部分獲得(盡管有可能有重疊)?；蛘?，第一和第二數(shù)據(jù)集可以是不同瞬變的子集。在后一情況中，當(dāng)然期望每一瞬變中所包括的m/z范圍存在至少部分重疊，使得兩者之間的相關(guān)有意義。
在一個實(shí)施例中，子集可彼此重疊，例如可分別變換并互相關(guān)全數(shù)據(jù)集的前25％和前50％?；蛘撸勺儞Q分開的子集(例如，前25％以及第二個25％)。又或者，第一和第二時域FTMS數(shù)據(jù)集可來自完全不同的瞬變。
還公開了區(qū)分其中出現(xiàn)眾多同位素峰值的較大分子中的峰值的方法，它依賴于兩個閾值。也可以理解，所公開的方法不僅因?yàn)樗鼈冊试S數(shù)據(jù)壓縮(即，通過減少可能被存儲的噪聲數(shù)據(jù)量)而有利。相關(guān)的方法尤其允許檢測強(qiáng)度低于固有噪聲電平的低強(qiáng)度的“真實(shí)”峰值，即使它們在全光譜中出現(xiàn)。
當(dāng)然可以理解，本發(fā)明的第一和第二方面決不互斥。優(yōu)選實(shí)現(xiàn)實(shí)際上組合了這兩個方面。因此，根據(jù)本發(fā)明的第三方面，提供了一種處理質(zhì)譜數(shù)據(jù)的方法，它包括 (a)對于一質(zhì)荷比范圍在時域中獲得一質(zhì)譜數(shù)據(jù)集； (b)將所獲得的時域數(shù)據(jù)的第一子集變換到頻域； (c)將所獲得的時域數(shù)據(jù)的第二子集變換到頻域；(d)將所獲得的時域數(shù)據(jù)的基本上全數(shù)據(jù)集變換到頻域； (e)對頻域中的所述第一和第二子集的至少其中之一應(yīng)用第一閾值以便標(biāo)識該數(shù)據(jù)中包含峰值數(shù)據(jù)的一個或多個區(qū)域；以及(f)將頻域中的第一數(shù)據(jù)子集與頻域中的第二數(shù)據(jù)子集相關(guān)，以標(biāo)識數(shù)據(jù)中對所述子集的每一個所共有的一個或多個區(qū)域。
總而言之，本發(fā)明提供了一種改進(jìn)的對FTMS數(shù)據(jù)定閾值的技術(shù)，即對當(dāng)生成減小的數(shù)據(jù)集時峰值或光譜數(shù)據(jù)是被包括還是被排除的決策過程的改進(jìn)方法。本發(fā)明基于對以下準(zhǔn)則中的兩個或多個的數(shù)學(xué)或邏輯組合1.時域(瞬變)中數(shù)據(jù)子部分的豐度；2.同一數(shù)據(jù)集的不同子部分中的顯著豐度(包括任何類型的重疊子部分)；3.完整數(shù)據(jù)集中的豐度；4.不同數(shù)據(jù)集中的豐度；5.一個以上不同數(shù)據(jù)集中的豐度；6.由之前的準(zhǔn)則限定的峰值之間的相位相關(guān)性；7.關(guān)于頻繁出現(xiàn)的峰值的信息(可總結(jié)或在統(tǒng)計(jì)上評估)；8.關(guān)于在空白中找到的峰值的信息(即，在沒有樣本離子的情況下生成的光譜)。這些可再次被總結(jié)或在統(tǒng)計(jì)上評估。
用于不同準(zhǔn)則的重要程度可以不同。邏輯運(yùn)算可以是任何類型的，例如AND、OR、XOR、NOT、蘊(yùn)涵。數(shù)學(xué)運(yùn)算可以是乘法、加法、變換、將結(jié)果與“主閾值”進(jìn)行比較等。
附圖簡述為了本發(fā)明能被更容易地理解，僅作為示例現(xiàn)在將對附圖進(jìn)行參考，附圖中

圖1示出質(zhì)譜形式的全FTMS數(shù)據(jù)集，包括由于離子存在而得到的峰值以及隨機(jī)噪聲兩者；圖2示出具體化本發(fā)明的第一方面的處理FTMS數(shù)據(jù)的方法的流程圖3示出說明根據(jù)本發(fā)明的第二方面的一個實(shí)施例的數(shù)據(jù)處理方案的流程圖；圖4示出使用根據(jù)現(xiàn)有技術(shù)的閾值確定技術(shù)處理的傅里葉變換質(zhì)譜；圖5示出使用根據(jù)本發(fā)明的實(shí)施例的改進(jìn)的閾值確定技術(shù)處理的傅里葉變換質(zhì)譜；圖6示出說明根據(jù)本發(fā)明的第二方面的另一實(shí)施例的數(shù)據(jù)處理方案的流程圖；圖7示出類似于圖6但有所變化的數(shù)據(jù)處理方案的流程圖；以及圖8示出說明本發(fā)明的第二實(shí)施例的又一實(shí)施例的流程圖。
優(yōu)選實(shí)施例的詳細(xì)描述在傅里葉變換離子回旋共振質(zhì)譜法(FTMS)中，如所公知的，離子在離子源處生成并通常從諸如線性離子阱等存儲裝置被注入到測量單元內(nèi)。對單元中所保存的離子施加均勻磁場和射頻電(激勵)場使離子在該單元中以回旋頻率繞軌道運(yùn)行。這些離子由單元中的檢測電極中的鏡像電流檢測。
通過該技術(shù)獲得的原始數(shù)據(jù)處于時域中并被認(rèn)為是瞬變的。一旦獲得這種瞬變，在現(xiàn)有技術(shù)的FTMS中，通過以下技術(shù)獲得質(zhì)譜。首先，對該瞬變進(jìn)行變跡(apodise)并填0。接著，實(shí)現(xiàn)數(shù)據(jù)到頻域的傅里葉變換。這提供了由實(shí)部和虛部組成的一對值構(gòu)成的復(fù)頻譜。此后，使用表達(dá)式P＝(Im2+Re2)逐點(diǎn)獲得幅度頻譜。通過應(yīng)用校準(zhǔn)公式將其變換為質(zhì)譜。所得的質(zhì)譜的示例在圖1中示出?？梢钥吹?，數(shù)據(jù)包括一個或多個峰值(以圖1中的質(zhì)量數(shù)標(biāo)記)以及大量噪聲。
轉(zhuǎn)換和存儲全FTMS數(shù)據(jù)集是相當(dāng)耗時的任務(wù)，且可能要求非常大的存儲容量。所存儲信息中的大量信息實(shí)際上是分析價值很小或者沒有分析價值的噪聲。為了減少所存儲數(shù)據(jù)的總?cè)萘浚F(xiàn)有技術(shù)僅對頻域中的數(shù)據(jù)應(yīng)用閾值以移除該閾值以下的所有數(shù)據(jù)點(diǎn)。如已在引言中說明的，對固定閾值而言這是遲鈍的機(jī)制，因?yàn)樗爸鴮?shù)據(jù)過度壓縮或壓縮不足的風(fēng)險，使得留下過多噪聲或錯誤地移除了真正的峰值。
圖2示出具體化本發(fā)明的第一方面的處理FTMS數(shù)據(jù)的方法的流程圖。在步驟10處，通過FTMS以上述方式獲取時域中的瞬變。在步驟20處，這些瞬變中的部分而非全部經(jīng)傅里葉變換到頻域。經(jīng)傅里葉變換的瞬變的數(shù)量是計(jì)算速度與準(zhǔn)確性之間的折衷。一方面，變換全部瞬變的相對較小的百分比能夠迅速完成。另一方面，如果將過小百分比的瞬變變換到頻域，則數(shù)據(jù)中的真正峰值可能會丟失。圖2的實(shí)施例采用25％的瞬變，一般為前25％。采用前25％的好處在于，處理器可在獲得全部瞬變的其余部分之前開始著手對該25％瞬變的后續(xù)處理。
頻域中的數(shù)據(jù)包含表示具有處于由FTMS裝置所選來評估的范圍內(nèi)的質(zhì)荷比的離子的存在的峰值。頻域中的數(shù)據(jù)也包含實(shí)際上是隨機(jī)噪聲的結(jié)果但可能被錯誤地確定為真正峰值的多個數(shù)據(jù)點(diǎn)。然而，如在本發(fā)明的概述中所述的，這樣的峰值的數(shù)目隨著分辨率的降低而減少。因此，僅對全部瞬變的25％進(jìn)行傅里葉變換應(yīng)減少隨機(jī)噪聲峰值的數(shù)目。
從而，在步驟30處，對步驟20處獲得的部分傅里葉變換應(yīng)用強(qiáng)度閾值。相對保守地選擇該閾值以便最小化丟棄真正峰值的風(fēng)險。然而，由于部分?jǐn)?shù)據(jù)集中假峰值的數(shù)目減少，減少了該強(qiáng)度閾值之上的假峰值(即，隨機(jī)噪聲峰值)通過的風(fēng)險。
接著，在步驟40處，將全部瞬變傅里葉變換到頻域。然后，在步驟50處，對通過全部瞬變的傅里葉變換而獲得的頻域數(shù)據(jù)應(yīng)用強(qiáng)度閾值。該閾值可與步驟30中所應(yīng)用的閾值相同，或可以稍低。然而，重要的是步驟50處應(yīng)用的閾值僅應(yīng)用于如步驟30中所確定的真正數(shù)據(jù)峰值的位置周圍的頻域光譜(或質(zhì)譜)的區(qū)域中。換言之，落在步驟30中所應(yīng)用的強(qiáng)度閾值之下的這些峰值的區(qū)域之間的數(shù)據(jù)點(diǎn)將不再被檢查。
在步驟60處，存儲落在步驟50處應(yīng)用的閾值之上的峰值數(shù)據(jù)。通過以這種方式去除隨機(jī)噪聲，可實(shí)現(xiàn)約90到95％甚至更高的壓縮，然而與峰值有關(guān)的數(shù)據(jù)本身未受損或被壓縮。而且，如共同待批申請no.PCT/EP04/010736中所述，由于峰值之間的數(shù)據(jù)被假定為隨機(jī)噪聲，因此可通過假定隨機(jī)噪聲數(shù)據(jù)是高斯分布的并使用所確定的高斯參數(shù)重構(gòu)該數(shù)據(jù)來重構(gòu)偽光譜。
圖3示出根據(jù)第二實(shí)施例的處理FTMS數(shù)據(jù)的方法的流程圖。在步驟100處，使用由操作員選擇的全分辨率再一次獲得瞬變(即，獲得全部瞬變)。或者與全部數(shù)據(jù)瞬變的集合同時地，或在此之后，如圖2的步驟20那樣，在步驟110處，將瞬變的前25％轉(zhuǎn)換到頻域。在圖3的步驟120處，對目前處于頻域中的瞬變的前25％應(yīng)用強(qiáng)度閾值，以便定位數(shù)據(jù)中的真正峰值。如前所述，可采用相對保守的閾值，以最小化忽略真正數(shù)據(jù)峰值的風(fēng)險。
在步驟130處，將瞬變的第二個25％轉(zhuǎn)換到頻域。這可以是原始數(shù)據(jù)集的重疊的25％，或之后的25％(即，步驟100處所獲得的原始時域瞬變的25-50％)。也對該數(shù)據(jù)應(yīng)用強(qiáng)度閾值，再一次標(biāo)識該數(shù)據(jù)中的真正數(shù)據(jù)峰值。步驟140處應(yīng)用的閾值可以與步驟120處應(yīng)用的強(qiáng)度閾值相同或不同。尤其當(dāng)相對于步驟110，在步驟130處變換了不同大小的數(shù)據(jù)集(例如，如果在步驟130處變換了原始時域瞬變的50％)時，則步驟140處應(yīng)用的閾值可稍高于步驟120處應(yīng)用的閾值(因?yàn)樵诤笠磺闆r中，由于傅里葉變換了更多的瞬變，因此假數(shù)據(jù)峰值的風(fēng)險增加)。
在步驟150處，比較作為處理步驟120和140的結(jié)果獲取的數(shù)據(jù)集或?qū)⑺鼈兿嚓P(guān)。在隨步驟120和140獲得的光譜的每一個中的同一位置處應(yīng)出現(xiàn)兩個信號。然而，假定噪聲是真正隨機(jī)的且不在全時域數(shù)據(jù)集(瞬變)的不同部分之間相關(guān)，則噪聲峰值將不會出現(xiàn)在兩個不同光譜的同一位置中。因此，通過分別標(biāo)識彼此相關(guān)的峰值在步驟120和140得到的兩個光譜中的位置，并通過丟棄峰值不匹配的數(shù)據(jù)范圍，可生成總數(shù)據(jù)集的“預(yù)濾器”。
然后，在步驟160處，將全部瞬變傅里葉變換到頻域。閾值(可高于步驟120和140處對部分?jǐn)?shù)據(jù)集應(yīng)用的閾值)被應(yīng)用于頻域內(nèi)的全部瞬變，但僅用于使用步驟100到150的預(yù)過濾技術(shù)標(biāo)識的峰值范圍。所存儲的峰值數(shù)據(jù)，即步驟170處所應(yīng)用的強(qiáng)度閾值之上的數(shù)據(jù)在步驟180處被存儲。與圖2的實(shí)施例一樣，所丟棄的隨機(jī)噪聲可通過假定它是高斯分布的而被重構(gòu)。
盡管目前優(yōu)選地對經(jīng)變換的部分瞬變應(yīng)用相對較“松”的閾值(步驟120和140)，但可以理解這不是必要步驟。雖然計(jì)算上是昂貴的，但有可能將來自每一數(shù)據(jù)集的所有數(shù)據(jù)相關(guān)，而不僅是閾值數(shù)據(jù)；該過程可減少錯過真正峰值的風(fēng)險。
圖3的方法的優(yōu)點(diǎn)在圖4和5中示出。圖4示出人工時域信號，包括409.6 kHz處的“真正”峰值以及該真正信號峰值周圍其它位置處的多個隨機(jī)噪聲峰值。409.6kHz處的真正信號的強(qiáng)度剛高于強(qiáng)度閾值。
圖4示出應(yīng)用現(xiàn)有技術(shù)的結(jié)果，其中在沒有任何預(yù)過濾的情況下對經(jīng)傅里葉變換的全部瞬變應(yīng)用閾值。相對于作為全質(zhì)譜的圖1，可見圖4不包含“基線”噪聲(通過應(yīng)用閾值去除了該噪聲)，但存在14個隨機(jī)噪聲峰值，其中多個具有高于409.6 kHz處的真正信號的強(qiáng)度。
應(yīng)用圖3的改進(jìn)方案，其中單獨(dú)變換了全時域數(shù)據(jù)集中的第一和第二個四分之一，通過檢查從時域瞬變到分開的頻域變換創(chuàng)建了一列“有效”峰值。圖5示出了比較的結(jié)果。由于隨機(jī)噪聲引起的所有峰值都消失了，而該質(zhì)荷比范圍內(nèi)的一個有效信號保留。注意到，即使真正信號的強(qiáng)度低于圖4中隨機(jī)噪聲峰值中的任何一個，但它仍保留。因此可以理解，此處所述的方法不僅限于減少數(shù)據(jù)集的大小以便允許存儲減少數(shù)量的數(shù)據(jù)(諸如如上所述的圖8的步驟180)。該方法也可用于生成大小可與標(biāo)準(zhǔn)方法相比的數(shù)據(jù)集，但具有低得多的檢測閾值。這將允許在不增加數(shù)據(jù)總量的情況下檢測目前低于簡單強(qiáng)度閾值的信號。盡管在圖3中，峰值在兩個數(shù)據(jù)子集中的位置被用于標(biāo)識數(shù)據(jù)中的真正峰值，但其它參數(shù)也可相關(guān)，以便標(biāo)識數(shù)據(jù)中的真正峰值。例如，峰值的強(qiáng)度可在兩個數(shù)據(jù)子集之間相關(guān)(使得匹配的峰值強(qiáng)度被標(biāo)識為“真正”峰值)。除此之外或者作為替代，真實(shí)信號的相位將在瞬變的各個段之間一致，而隨機(jī)信號的相位相反應(yīng)是隨機(jī)的。因此，相位一致性可用作附加或者替換的因素。如果可對信號確定電荷狀態(tài)，則可預(yù)測相關(guān)聯(lián)的同位素峰值的位置。這些同位素的窗口然后可被包括在最終閾值確定區(qū)域中，作為進(jìn)一步的改進(jìn)。作為又一改進(jìn)，可采用來自一個以上數(shù)據(jù)集的數(shù)據(jù)。這個概念將在以下結(jié)合圖8進(jìn)一步說明。在優(yōu)選實(shí)施例中，采用了位置和相位(至少)兩者。
圖6示出根據(jù)本發(fā)明的又一實(shí)施例。圖6的實(shí)施例包括對圖3中所述實(shí)施例的進(jìn)一步修改，以著眼于某些信號的特性。具體地，較大的分子產(chǎn)生不尋常的時域信號或瞬變。由于眾多相等間隔的同位素峰值，因此可產(chǎn)生較強(qiáng)的“拍頻波形圖”(見Hofstadler等人所著“Isotopic beat patterns in Fourier transform ion cyclotronresonance mass spectrometryimplications for high resolution mass measurement bybiopolymers”，International Journal of Mass Spectrometry&Ion Processes 132109-127(1994))。使用圖3中所述的兩段閾值方法，這兩個時域數(shù)據(jù)段之一可與全時域數(shù)據(jù)的“腹點(diǎn)(anti-node)”相關(guān)。從而，在該段中不會出現(xiàn)閾值之上的信號，且因此將不會出現(xiàn)“公共”峰值，即使在兩個數(shù)據(jù)集之一中可能出現(xiàn)強(qiáng)信號。不存在提前預(yù)測腹點(diǎn)位置的任何方式，因此不存在保證腹點(diǎn)將不會在時域瞬變的任何所選部分中出現(xiàn)的任何方式。對這個問題的解決方案是使用兩個單獨(dú)的閾值。
參考圖6，在步驟200處，如前所述需要全部瞬變。在步驟210處，將瞬變的前25％變換到頻域，且然后在步驟220處，應(yīng)用第一、較低強(qiáng)度的閾值(閾值1)來標(biāo)識該閾值的峰值。如步驟230中所示，一旦瞬變的第二個25％被轉(zhuǎn)換到頻域之后，即對其應(yīng)用類似的技術(shù)。閾值1在步驟240處應(yīng)用于該頻域數(shù)據(jù)以標(biāo)識其中的峰值。
在步驟250處，將來自步驟220和240的兩個數(shù)據(jù)集相關(guān)以標(biāo)識公共峰值。然而，在步驟260處，還將一較高的閾值(閾值2)應(yīng)用于隨步驟220和240獲得的數(shù)據(jù)子集，使得由于上述強(qiáng)拍頻波形圖而不會錯誤地丟棄較大的峰值(被假定為是真實(shí)峰值)。
一旦生成了經(jīng)修改的預(yù)濾器，即在步驟260處確定了真正峰值的位置之后，在步驟270處，將全部瞬變變換到頻域，然后在步驟280處，對數(shù)據(jù)域內(nèi)的所有數(shù)據(jù)變換但僅在隨步驟250和260確定的區(qū)域內(nèi)應(yīng)用第三閾值。如前所述，可在步驟290處存儲峰值數(shù)據(jù)。
當(dāng)然，盡管描述了類似幅度的兩個部分變換，但可采用不同幅度的時域中的數(shù)據(jù)子集和/或重疊的數(shù)據(jù)集。
在圖7中示出對圖6的方法稍加修改的方法。由于圖6與7之間的相似性，因此采用相同的參考標(biāo)號來表示相似的步驟。
具體地，步驟200到250在圖6與7中相同，即瞬變的兩個單獨(dú)部分被變換到頻域，使用第一、相對較低的閾值(閾值1)檢測峰值，以及然后相關(guān)以定位在每一數(shù)據(jù)集中匹配的峰值。
然而，在步驟265處，并非對每一數(shù)據(jù)子集應(yīng)用較高的閾值，而是將整個瞬變變換到頻域作為下一步驟。然后，在步驟275處，經(jīng)由步驟200-250標(biāo)識為峰值的區(qū)域被從全頻域數(shù)據(jù)集中減去或排除。在步驟285處，對其余的數(shù)據(jù)集應(yīng)用高于第一閾值的第二閾值。這確保如果峰值達(dá)到該第二閾值，甚至預(yù)處理步驟未能定位該閾值，該峰值也不會從全光譜中遺漏。
在步驟295處，存儲來自頻域中全數(shù)據(jù)集但僅處于通過相關(guān)預(yù)處理(步驟200-250)以及對其余數(shù)據(jù)的較高水平閾值處理的組合被標(biāo)識為峰值的區(qū)域中的數(shù)據(jù)。
在圖8的流程圖中示出又一實(shí)施例。此處，將來自兩個完全分開的時域數(shù)據(jù)集的峰值相關(guān)。在步驟300處開始，在從樣本注入到第一離子集的FTMS單元(通常經(jīng)由上游離子過濾器/離子存儲裝置)之后，從這些樣本離子中獲取第一瞬變。這在步驟310處被變換到頻域，且在步驟320處，對頻域中的該傅里葉變換應(yīng)用閾值。在步驟330處，獲取第二瞬變。一般這是從在收集第一瞬變以及隨后對創(chuàng)建該第一瞬變的那些離子單元的清空之后注入到FTMS單元的新的離子集中獲取的。在步驟340處，將第二瞬變變換到頻域。在步驟350處，該閾值也應(yīng)用于該頻域中的傅里葉變換。
步驟320和350處所應(yīng)用的閾值可以相同或不同。同樣，盡管步驟300和330處獲取的第一和第二瞬變可分別被整體轉(zhuǎn)換到頻域，但代替地可將每一單獨(dú)瞬變的僅一部分在應(yīng)用閾值之前在步驟310和340處轉(zhuǎn)換到頻域。而且，盡管一般從中獲取第一瞬變的樣本離子的質(zhì)量范圍對應(yīng)于提供第二瞬變的樣本離子的質(zhì)量范圍，但這些質(zhì)量范圍不必相同。通過調(diào)節(jié)上游離子過濾器/阱的參數(shù)，可將不同的質(zhì)量范圍注入到FTMS單元內(nèi)，盡管當(dāng)然它們至少必須重疊。
在步驟360處，出現(xiàn)來自每一傅里葉變換的相關(guān)或匹配數(shù)據(jù)(這是從中獲得兩個瞬變的質(zhì)量范圍為何必須至少部分重疊的原因)。從中，標(biāo)識了真正峰值的位置，且可在步驟370處存儲關(guān)于這些真正峰值的數(shù)據(jù)。假定在步驟310和340中變換了全部瞬變，則避免了圖3和6的實(shí)施例的兩個步驟過程。然而，圖8的實(shí)施例存在一些缺點(diǎn)。具體地，除非收集了第二數(shù)據(jù)集，否則對第一數(shù)據(jù)集的處理不能完成。
對本領(lǐng)域的讀者而言，各種其它實(shí)施例將是顯而易見的，例如對樣本離子(無論m/z是否已知)，有可能改為分析“空白”光譜(即，沒有任何樣本離子)，而非依賴于相同瞬變或不同瞬變的部分。一般，這可在FTMS裝置的啟動之后進(jìn)行。此時，可在FTMS測量單元中沒有離子的情況下尋找固有噪聲峰值。存儲任何這樣的固有噪聲峰值的位置。一般，如上所述，系統(tǒng)軟件在不同光譜中以變化的相位查找峰值；這些異相信號然后從光譜中減去。這樣的一個好處在于降低單頻電子噪聲(系統(tǒng)中假/噪聲峰值的主要來源)，以及可根據(jù)本發(fā)明的實(shí)施例解決的白噪聲。
盡管結(jié)合對由離子回轉(zhuǎn)共振產(chǎn)生的瞬變的分析描述了本發(fā)明的實(shí)施例，但可以理解，本發(fā)明決不如此限定，例如本發(fā)明可同等地應(yīng)用于從FR-IR、FT-NMR或SAR、諸如Orbitrap(見US-A-5,886,346)等靜電阱(electrostatic trap)中獲得的數(shù)據(jù)，這些數(shù)據(jù)作為時域瞬變被捕捉以便最終(通常)傅里葉變換成質(zhì)譜。這些概念也適于應(yīng)用于從諸如US-A-4,755,670和US-A-6,403,955中所述的電動阱(electrodynamic trap)中獲得的數(shù)據(jù)。實(shí)際上，本發(fā)明可應(yīng)用于靜電飛行式(TOF)質(zhì)譜儀(見，例如Benner，W.H.(1997)“A Gated Electrostatic Ion Trap toRepetitiously Measure the Charge and m/z of Large Electrospray Ions”，AnalyticalChemistry 69第4162-4168頁)的輸出。而且，傅里葉變換不是可采用的頻率變換的唯一形式本發(fā)明可同等地與例如哈達(dá)瑪變換或拉普拉斯變換一起使用。也參見A.Brock、N.Rodriguez和R.N.Zare的“Hadamard Transform Time-of-Flight MassSpectrometry(HT-TOFMS)”Anal Chem.70，3735-3741(1998)。因此，可以理解，本發(fā)明實(shí)際上可應(yīng)用于產(chǎn)生周期性信號的任何MS方法。
權(quán)利要求
1.一種處理質(zhì)譜數(shù)據(jù)的方法，包括a.對于一質(zhì)荷比范圍獲得時域中的質(zhì)譜數(shù)據(jù)集；b.將所獲得的時域數(shù)據(jù)的子集變換到頻域；c.對所述頻域數(shù)據(jù)子集應(yīng)用第一閾值，以區(qū)分噪聲數(shù)據(jù)和指示具有所述范圍的質(zhì)荷比的離子的存在性的峰值數(shù)據(jù)；d.將所獲得的時域數(shù)據(jù)的基本全數(shù)據(jù)集變換到頻域；e.標(biāo)識所述經(jīng)變換的全數(shù)據(jù)集內(nèi)與步驟(c)中標(biāo)識為包含峰值數(shù)據(jù)的經(jīng)變換的數(shù)據(jù)子集的區(qū)域相對應(yīng)的區(qū)域。
2.如權(quán)利要求1所述的方法，其特征在于，還包括存儲和/或顯示來自所述經(jīng)變換的全數(shù)據(jù)集的、位于所述步驟(e)中所標(biāo)識的區(qū)域內(nèi)的數(shù)據(jù)，以及將那些區(qū)域外的數(shù)據(jù)作為噪聲而拒絕。
3.如權(quán)利要求1或權(quán)利要求2所述的方法，其特征在于，還包括對頻域中所述經(jīng)變換的全數(shù)據(jù)集但僅在其所述所標(biāo)識區(qū)域中應(yīng)用第二閾值。
4.一種處理質(zhì)譜數(shù)據(jù)的方法，包括f.將對于一質(zhì)荷比(m/z)范圍在時域中所獲得的第一質(zhì)譜數(shù)據(jù)集變換到頻域；g.將不同于所述第一質(zhì)譜數(shù)據(jù)集的第二時域質(zhì)譜數(shù)據(jù)集變換到頻域；以及h.將頻域內(nèi)的所述第一質(zhì)譜數(shù)據(jù)集與頻域內(nèi)的第二質(zhì)譜數(shù)據(jù)集相關(guān)以便標(biāo)識頻域中每一數(shù)據(jù)集所共有的峰值。
5.如權(quán)利要求4所述的方法，其特征在于，時域中的所述第一和第二質(zhì)譜數(shù)據(jù)集各自包括時域中全數(shù)據(jù)集的不同子集，所述方法還包括在將所述第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)的步驟(c)之后的以下步驟d.將所述全數(shù)據(jù)集的基本所有數(shù)據(jù)從時域變換到頻域；以及e.對所述經(jīng)變換的全數(shù)據(jù)集應(yīng)用第一閾值，這區(qū)分噪聲數(shù)據(jù)和指示具有所述范圍內(nèi)的質(zhì)荷比的離子的存在性的峰值數(shù)據(jù)，所述第一閾值僅應(yīng)用于所述峰值的區(qū)域中。
6.如權(quán)利要求5所述的方法，其特征在于，還包括將所述經(jīng)變換的全數(shù)據(jù)集中在每一標(biāo)識峰值的區(qū)域以外的數(shù)據(jù)作為噪聲數(shù)據(jù)而拒絕。
7.如權(quán)利要求5或權(quán)利要求6所述的方法，其特征在于，所述第一和第二時域數(shù)據(jù)集是時域中所述全數(shù)據(jù)集的基本不重疊的子集。
8.如權(quán)利要求5或權(quán)利要求6所述的方法，其特征在于，所述第一和第二時域數(shù)據(jù)集彼此重疊。
9.如權(quán)利要求8所述的方法，其特征在于，所述時域中的第一數(shù)據(jù)集是所述第二數(shù)據(jù)集的子集，反之亦然。
10.如權(quán)利要求5或權(quán)利要求6所述的方法，其特征在于，所述第一和第二質(zhì)譜數(shù)據(jù)集的至少其中之一不是所述全數(shù)據(jù)集的子集。
11.如權(quán)利要求4到10中任一項(xiàng)所述的方法，其特征在于，所述將頻域中的第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)的步驟(c)包括f.將頻域中所述第一質(zhì)譜數(shù)據(jù)集中的峰值的位置與頻域中所述第二質(zhì)譜數(shù)據(jù)集中峰值的位置進(jìn)行比較；以及g.標(biāo)識在所述第一和第二頻域數(shù)據(jù)集的每一個中具有基本上相同位置的那些峰值。
12.如權(quán)利要求4到11中任一項(xiàng)所述的方法，其特征在于，所述將頻域中的第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)的步驟(c)包括h.將頻域中所述第一質(zhì)譜數(shù)據(jù)集中的峰值的相位與頻域中所述第二質(zhì)譜數(shù)據(jù)集中的峰值的相位進(jìn)行比較；以及g.標(biāo)識在所述第一和第二頻域數(shù)據(jù)集的每一個之間相位一致的那些峰值。
13.如權(quán)利要求4到12中任一項(xiàng)所述的方法，其特征在于，所述將頻域中的第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)的步驟(c)包括，將所述第一頻域集中基本上所有的質(zhì)譜數(shù)據(jù)與所述第二頻域集中基本上所有的質(zhì)譜數(shù)據(jù)進(jìn)行比較。
14.如權(quán)利要求4所述的方法，其特征在于，所述將質(zhì)譜數(shù)據(jù)集相關(guān)的步驟(c)包括將第一閾值應(yīng)用于頻域中的所述第一數(shù)據(jù)集；將第二閾值應(yīng)用于頻域中的所述第二數(shù)據(jù)集；將頻域中所述第一集中在所述第一閾值之上的數(shù)據(jù)與頻域中所述第二集中在所述第二閾值之上的數(shù)據(jù)進(jìn)行比較。
15.如前述權(quán)利要求中任一項(xiàng)所述的方法，其特征在于，還包括在應(yīng)用所述第一閾值之后僅存儲來自所述全數(shù)據(jù)集的峰值數(shù)據(jù)。
16.如權(quán)利要求5所述的方法，其特征在于，除所述將頻域中的第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)以標(biāo)識指示具有所述范圍內(nèi)的質(zhì)荷比的離子的存在性的峰值的步驟(c)以外，所述方法在步驟(d)之前還包括h.將高于所述第一閾值的第二閾值應(yīng)用于頻域中所述第一和第二數(shù)據(jù)集的至少其中之一，以標(biāo)識指示具有位于所述范圍內(nèi)的質(zhì)荷比的離子的存在性但未經(jīng)將第一和第二數(shù)據(jù)集相關(guān)的步驟(c)定位的峰值。
17.如權(quán)利要求5所述的方法，其特征在于，除所述將頻域中的第一和第二質(zhì)譜數(shù)據(jù)集相關(guān)以標(biāo)識指示具有所述范圍內(nèi)的質(zhì)荷比的離子的存在性的峰值的步驟(c)以外，所述方法在步驟(e)之前還包括(i)從所述全數(shù)據(jù)集中減去與每一標(biāo)識的峰值有關(guān)的數(shù)據(jù)；以及(j)將第二閾值應(yīng)用于所述全數(shù)據(jù)集中的其余數(shù)據(jù)。
18.如權(quán)利要求14或權(quán)利要求15所述的方法，其特征在于，還包括存儲超出所述第一閾值的峰值數(shù)據(jù)以及超出所述第二閾值的峰值數(shù)據(jù)，并將來自所述全數(shù)據(jù)集的其余數(shù)據(jù)作為噪聲而拒絕。
19.一種處理質(zhì)譜數(shù)據(jù)的方法，包括(a)對于一質(zhì)荷比范圍在時域中獲得一質(zhì)譜數(shù)據(jù)集；(b)將所獲得的時域數(shù)據(jù)的第一子集變換到頻域；(c)將所獲得的時域數(shù)據(jù)的第二子集變換到頻域；(d)將所獲得的時域數(shù)據(jù)的基本全數(shù)據(jù)集變換到頻域；(e)對頻域中的所述第一和第二子集的至少其中之一應(yīng)用第一閾值以便標(biāo)識所述數(shù)據(jù)中包含峰值數(shù)據(jù)的一個或多個區(qū)域；以及(f)將頻域中第一數(shù)據(jù)子集與頻域中第二數(shù)據(jù)子集相關(guān)，以標(biāo)識所述子集中的每一個所共有的一個或多個數(shù)據(jù)區(qū)域。
20.如權(quán)利要求19所述的方法，其特征在于，還包括標(biāo)識所述經(jīng)變換的全數(shù)據(jù)集中的數(shù)據(jù)中與由步驟(e)或步驟(f)標(biāo)識的每一區(qū)域相對應(yīng)的一個或多個區(qū)域。
21.如權(quán)利要求19所述的方法，其特征在于，還包括標(biāo)識所述經(jīng)變換的全數(shù)據(jù)集中與由步驟(e)且由步驟(f)標(biāo)識的每一區(qū)域相對應(yīng)的一個或多個數(shù)據(jù)區(qū)域。
22.如權(quán)利要求20或21所述的方法，其特征在于，還包括存儲來自所述經(jīng)變換的全數(shù)據(jù)集中由步驟(e)和/或步驟(f)標(biāo)識的數(shù)據(jù)區(qū)域。
23.一種包括程序元素的計(jì)算機(jī)程序，所述程序當(dāng)被執(zhí)行時實(shí)現(xiàn)根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法。
24.一種包含如權(quán)利要求23所述的計(jì)算機(jī)程序的計(jì)算機(jī)程序產(chǎn)品。
25.一種包括被配置成實(shí)現(xiàn)如權(quán)利要求1到22中任一項(xiàng)所述的方法的數(shù)據(jù)處理裝置的傅里葉變換質(zhì)譜儀。
全文摘要
一種處理傅里葉變換質(zhì)譜(FTMS)數(shù)據(jù)的方法包括，對時域瞬變的一部分執(zhí)行傅里葉變換，并標(biāo)識來自經(jīng)變換的數(shù)據(jù)信號中表示離子的存在的峰值。一旦標(biāo)識了峰值，然后變換全部瞬變，且在部分瞬變變換中標(biāo)識的峰值被用于定位經(jīng)變換的全部瞬變中的真正峰值。找出由隨機(jī)噪聲引起的“假”峰值的數(shù)目以與分辨率相關(guān)，使得使用部分瞬變來標(biāo)識真正峰值減少了包括假峰值的風(fēng)險；然而當(dāng)全數(shù)據(jù)集被變換時，該信息可應(yīng)用于全數(shù)據(jù)集。作為替換，全數(shù)據(jù)集的替換、不同部分可被變換并使之相關(guān)；因?yàn)槿魏卧肼暿请S機(jī)的，因此假峰值應(yīng)出現(xiàn)在兩個部分變換的不同位置處。
文檔編號H01J49/38GK101088096SQ200580040696
公開日2007年12月12日申請日期2005年11月23日優(yōu)先權(quán)日2004年11月29日
發(fā)明者O·蘭格, M·W·森柯申請人:薩默費(fèi)尼根有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｏ.蘭格;Ｍ.Ｗ.森柯
技術(shù)所有人：薩默費(fèi)尼根有限公司
我是此專利的發(fā)明人

上一篇：發(fā)光體和發(fā)光系統(tǒng)的制作方法
上一篇：光線改向薄膜及薄膜系統(tǒng)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、高老師：1.電力電子及應(yīng)用 2.嵌入式系統(tǒng)應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

質(zhì)譜數(shù)據(jù)處理相關(guān)技術(shù)

質(zhì)譜數(shù)據(jù)庫相關(guān)技術(shù)

質(zhì)譜數(shù)據(jù)分析相關(guān)技術(shù)

質(zhì)譜數(shù)據(jù)相關(guān)技術(shù)

蛋白質(zhì)譜數(shù)據(jù)庫相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

處理質(zhì)譜數(shù)據(jù)的方法