用于確定混合物譜中的譜成分存在的系統(tǒng)和方法
【專利摘要】本發(fā)明公開了一種系統(tǒng)和方法,用于檢測一種混合物的譜中未知成分的譜和/或用于驗證一種混合物的譜中疑似成分的存在。該系統(tǒng)和方法涉及使用算法執(zhí)行一個包含混合中的這些目標(biāo)譜和已知譜的回歸分析,計算當(dāng)該目標(biāo)譜的系數(shù)為零時的一個殘差,被稱為提取譜,并且對比該提取譜和該目標(biāo)譜。該系統(tǒng)和方法可以與化學(xué)計量學(xué)算法、多個已知譜、和/或多個目標(biāo)譜一起使用。
【專利說明】用于確定混合物譜中的譜成分存在的系統(tǒng)和方法
[0001] 相關(guān)申請的交叉引用
[0002] 本申請要求于2012年5月31日提交的標(biāo)題為"用于確定混合物的譜中的譜成分 存在的算法和方法"的共同未決的美國臨時專利申請序列號61/653743的優(yōu)先權(quán),其披露內(nèi) 容通過引用以其整體結(jié)合在此。
[0003] 所引用的專利和參考資料:
[0004] 以下文件和參考資料通過引用以其整體結(jié)合在此,霍爾特(Hoult)(美國專利 第5, 023, 804號)、伊瓦爾迪(Ivaldi)等人(美國專利第5, 308, 982號)、里特(Ritter) 等人(美國專利第7, 698, 098號)、博通吉奇-塞希奇(Botonjic-Sehic)等人(美國專 利申請第2011/0213746號)、K.田邊(K. Tanabe)等人,分析化學(xué)47,118(1975),、彼得 R.格里菲思(Peter R. Griffiths)等人的"自加權(quán)相關(guān)系數(shù)以及它們對于測量譜相似性的 應(yīng)用(Self-Weighted Correlation Coefficients and Their Application to Measure Spectral Similarity) ",應(yīng)用波譜學(xué)(Appl. Spec.),第 63 卷,第 916 至 919 頁(2009)、 "為使用一種譜搜索算法鑒別的混合物成分估計概率置信度(Estimating Probabilistic Confidence for Mixture Components Identified Using a Spectral Search Algorithm),', 應(yīng)用波譜學(xué),第66卷,第334-340頁(2012)。
【技術(shù)領(lǐng)域】
[0005] 本發(fā)明涉及數(shù)據(jù)分析,并且更具體地是一種用于確定混合物的譜成分的系統(tǒng)和方 法。
【背景技術(shù)】
[0006] 將一種樣品的譜與一個參考譜進行對比以驗證或鑒別該樣品在分析化學(xué)中是一 種常規(guī)做法。用于這個目的的這些類譜的實例包括但不限于紅外譜、近紅外譜、拉曼譜、質(zhì) 譜、紫外-可見譜、以及核磁共振(NMR)譜。有很多用于這種譜對比的度量(metrics),包含 歐氏(Euclidian)距離、最大距離、以及相關(guān)系數(shù)。
[0007] 當(dāng)對比純樣或成分的譜、或混合物的譜,其中該樣品譜和參考譜包含相似濃度的 相同成分時,這些度量效果良好。當(dāng)將一種混合物的樣品譜與包含在該混合物中的一種純 成分的參考譜進行對比時,或者與一種與該樣品譜中成分相同但濃度不同的混合物的參考 譜進行對比時,它們卻表現(xiàn)不佳,并且事實上可能表現(xiàn)非常糟糕。在本文中應(yīng)該注意的是 "混合物"并不必定是指這些成分是物理混合的,而是它們都對該譜有貢獻。
[0008] 當(dāng)使用該術(shù)語譜(或這些譜)時,我們指的是如所測量原樣的這些數(shù)據(jù)和/或是 所述數(shù)據(jù)的任何的后續(xù)數(shù)學(xué)轉(zhuǎn)換,包含導(dǎo)數(shù)(包含一階、二階、三階以及任何后續(xù)導(dǎo)數(shù))、平 滑處理、基線校正等。
[0009] 本發(fā)明是一種改進的對比系統(tǒng)及方法,用于當(dāng)一個樣品譜為多種成分的混合物 時。這樣一種混合物可包含已知存在的成分、疑似存在但其存在需確定的成分、需鑒別的未 知成分、或其任何組合。已知存在的這些成分可能已經(jīng)通過任何方法得以鑒別,包含通過應(yīng) 用以上提到的那些簡單對比度量、或通過應(yīng)用此處描述的對比方法。
[0010] 當(dāng)要被鑒別或確認的成分的濃度相比其他成分的濃度較小時,與其他對比度量相 比本發(fā)明表現(xiàn)特別好。在某些情況下,當(dāng)該樣品譜中的兩個或更多個成分為未知時,它也表 現(xiàn)良好。
【發(fā)明內(nèi)容】
[0011] 這部分的目的是總結(jié)本發(fā)明的一些方面并且簡略介紹一些優(yōu)選實施方式。為避免 模糊這部分的目的可能進行了簡化或省略。這樣的簡化或省略不是有意限制本發(fā)明的范 圍。
[0012] 所有的參考資料,包含在本說明書中所引用的任何專利或?qū)@暾埗纪ㄟ^引用結(jié) 合在此。不承認任何參考資料構(gòu)成現(xiàn)有技術(shù)。對這些參考資料的討論陳述了其作者的主張, 并且諸位 申請人:保留懷疑所引用文件的準確性和針對性的權(quán)利。將會清楚理解的是,盡管 多個現(xiàn)有技術(shù)公開物被引用在此,但是此引用不承認這些文件中的任一個形成在現(xiàn)有技術(shù) 中的公知常識。
[0013] 確認的是術(shù)語"包括"可以(在不同的法律管轄范圍內(nèi))被歸為一種封閉性的或 開放性的意思。對于本發(fā)明的目的,并且除非另有注明,術(shù)語"包括"應(yīng)有包含的意思-即, 將用來指包含不僅它直接引用的這些所列成分,還有其他非指定的成分或元素。當(dāng)術(shù)語"包 括了"或"包括有"與一種方法或工藝中的一個或多個步驟相關(guān)地使用時,也將使用此理論。
[0014] 在一個方面,本發(fā)明是關(guān)于一種用于確定在一種混合物中的譜成分存在的方法, 所述方法包括執(zhí)行一種回歸分析,該回歸分析包含目標(biāo)譜以及一種混合物中存在的一個或 多個已知的其他成分譜,計算提取譜,其中所述提取譜為該目標(biāo)譜的系數(shù)被設(shè)為零的情況 下的殘差(residual),并且使用一種對比度量對比所述提取譜與所述目標(biāo)譜。在另一個 方面,所述對比度量為一個相關(guān)系數(shù)、加權(quán)相關(guān)系數(shù)、歐氏距離和/或最大距離中的至少一 個。又另一個方面,所述加權(quán)相關(guān)系數(shù)中的這些權(quán)重不都相同。
[0015] 在另一個方面,它是關(guān)于對比所述提取譜與殘差譜。在一個方面,所述方法以一種 迭代方式使用。在另一個方面,所述回歸分析包括一個基線譜或其他成分的譜。在一個方 面,所述回歸分析譜包括導(dǎo)數(shù)譜或乘以一個包絡(luò)函數(shù)的導(dǎo)數(shù)譜。又另一個方面,它是關(guān)于使 用一個或多個回歸系數(shù)來計算濃度。在一個方面,該方法進一步包括一種目標(biāo)成分的多個 譜以及一種已知成分的多個譜中的至少一個。
[0016] 在另一個方面,在所述混合物中存在多個目標(biāo)并且對于每個不同目標(biāo)使用不同的 譜區(qū)。在一個方面,使用多個譜區(qū)。又另一個方面,一種鑒別的或目標(biāo)成分的多個譜被因子 化,并且這些因子的一個子集包含在所述回歸分析中。在另一個方面,對不同目標(biāo)成分執(zhí)行 兩次或更多次回歸分析。
[0017] 在一個方面,本發(fā)明關(guān)于該方法進一步包括將多個目標(biāo)譜因子化,將這些要被分 析的譜和這些已知成分的譜投影到因子空間中,在該因子空間中執(zhí)行所述回歸分析,并且 在該因子空間中對比該提取譜和這些目標(biāo)譜,或者將該提取譜投影回到該原始譜空間并且 在該原始譜空間中執(zhí)行在該提取譜與這些目標(biāo)譜之間的對比。
[0018] 在一個方面,該方面進一步包括對于數(shù)個成分中的每一個將數(shù)個目標(biāo)譜分組成 簇,使用這些目標(biāo)譜的平均值、全部目標(biāo)譜或者使用在每個簇中這些目標(biāo)譜的這些因子的 一個子集對每個簇中的這些目標(biāo)譜執(zhí)行所述回歸分析,為每個簇計算提取譜并且對比這些 提取譜與目標(biāo)譜的這些簇來確定該目標(biāo)譜屬于哪一個(如果有的話)簇。又另一個方面, 這些回歸分析中包含一種已知成分的多個譜,或者這些回歸分析中包含一種已知成分的多 個譜的因子載荷(factor loadings)的一個子集。在一個方面,使用一個相關(guān)系數(shù)、一個加 權(quán)的相關(guān)系數(shù)、一個歐氏距離、或最大距離執(zhí)行這些對比。又另一個方面,它進一步包含對 比這些提取譜與這些殘差譜。在另一個方面,這些回歸分析包含一個基線譜或其他成分譜。 在一個方面,使用多個譜區(qū)。在另一個方面,該方法使用一個或多個回歸系數(shù)來計算濃度。
[0019] 在一個發(fā)明,該方面包括對于數(shù)個目標(biāo)成分中的每一個將數(shù)個目標(biāo)譜因子化,將 這些因子分組成簇,將這些要被分析的譜和這些已知成分的譜投影到因子空間中;使用這 些目標(biāo)譜的這些因子的平均值、或這些目標(biāo)譜的全部這些因子,在該因子空間中對每個簇 的這些目標(biāo)譜執(zhí)行所述回歸分析,為每個簇計算該提取譜,并且在該因子空間中對比這些 提取譜和目標(biāo)譜,或者將這些提取譜投影回該原始譜空間并且在該原始譜空間中在這些提 取譜與這些目標(biāo)譜之間執(zhí)行對比,以確定該目標(biāo)譜屬于哪一個(如果有的話)簇。
[0020] 在另一個方面,該回歸分析中包含一種已知成分的多個譜。又另一個方面,使用一 個相關(guān)系數(shù)、一個加權(quán)的相關(guān)系數(shù)、一個歐氏距離、或一個最大距離。在一個方面,它進一步 包括對比這些提取譜與這些殘差譜。又另一個方面,這些回歸分析包含一個基線譜或其他 成分譜。在另一個方面,使用多個譜區(qū)。在另一個方面,該方法包括使用一個或多個回歸系 數(shù)來計算濃度。
[0021] 在一個方面,本發(fā)明是關(guān)于一種用于存儲計算機代碼的非瞬時性計算機可讀存儲 介質(zhì),該計算機代碼用于一種用于確定混合物中譜成分的存在的方法,所述方法包括執(zhí)行 一種回歸分析,該回歸分析包括目標(biāo)譜以及在一種混合物中存在的一個或多個已知的其他 成分譜;計算所述提取譜,其中所述提取譜為該目標(biāo)譜的系數(shù)被設(shè)為零的情況下的殘差; 以及使用一種對比度量來對比所述提取譜與所述目標(biāo)譜。
[0022] 通過結(jié)合附圖對以下一個本發(fā)明實施方式的詳細說明的查看,本發(fā)明的其他特征 和優(yōu)點將變得清晰。
【專利附圖】
【附圖說明】
[0023] 圖1根據(jù)本發(fā)明的一個示例性實施方式展示了在水蒸氣的存在下IOOppm的氧化 亞氮(NO)的譜(虛線)以及水蒸氣的譜(實線)的圖示。
[0024] 圖2根據(jù)本發(fā)明的一個示例性實施方式展示了在水蒸氣的存在下IOOppm的NO的 譜(實線)以及該殘差譜(虛線)的圖示。
[0025] 圖3根據(jù)本發(fā)明的一個示例性實施方式展示了 NO的目標(biāo)譜(虛線)以及提取譜 (實線)的圖示。
[0026] 圖4展示了用于計算NO的部分相關(guān)系數(shù)的這些殘差譜的圖示。
[0027] 圖5A-5C展示了來自在IOOppm的NO樣品譜中一氧化碳和一氧化二氮的分析的這 些譜的圖示。圖5A為一氧化二氮的目標(biāo)譜(虛線)以及來自第二次分析的提取譜(實線)。 圖5B為一氧化碳的目標(biāo)譜(虛線)以及來自第一次分析的提取譜(實線)。圖5C為樣品 譜。以上均為根據(jù)本發(fā)明的示例性實施方式。
[0028] 圖6根據(jù)本發(fā)明的一個示例性實施方式展示了使用拉曼譜儀采集到的一個瓶內(nèi) 的藥品的水溶液的譜(實線)、該瓶的譜(虛線)、水的譜(點虛線)、以及該藥品的目標(biāo)譜 (點線)的圖示。
[0029] 圖7A-7C展示了來自一個瓶中的藥品的水溶液的拉曼譜的分析的這些目標(biāo)譜 (7A)、提取譜(7B)以及殘差譜(7C)的圖示。以上均為根據(jù)本發(fā)明的示例性實施方式。
[0030] 圖8根據(jù)本發(fā)明的一個示例性實施方式展示了來自于未轉(zhuǎn)換的數(shù)據(jù)(底)的該藥 品(頂)目標(biāo)譜以及該提取譜的圖示。
[0031] 圖9-10展示了混合物譜的實例簇,圖9,以及目標(biāo)成分的譜,圖10。
[0032] 從以下詳細說明、附圖、以及所附權(quán)利要求書中,本領(lǐng)域的普通技術(shù)人員將會領(lǐng)會 和理解上述以及其他特征。
【具體實施方式】
[0033] 為提供對本發(fā)明的全面理解,現(xiàn)在將說明某些說明性實施方式和實例。然而,本領(lǐng) 域的普通技術(shù)人員將會理解的是相同或等價的功能和順序可以通過不同的實施方式完成, 這些實施方式也旨在包含于本披露的精神和范圍內(nèi)。這里描述的這些組合物、儀器、系統(tǒng)和 /或方法可以被適配并修改為對于試圖解決的應(yīng)用而言是適當(dāng)?shù)?,并且這里描述的那些可 以用于其他合適的應(yīng)用,并且這樣的其他的添加和修改將不背離本發(fā)明范圍。
[0034] 在一個實施方式中,使S為一種樣品的譜,該樣品由具有譜K1. .. Kn的η個成分組 成。假設(shè)服從比爾-朗伯定律,該樣品譜可被建模為:
【權(quán)利要求】
1. 一種用于確定混合物中譜成分的存在的方法,所述方法包括: 執(zhí)行一種回歸分析,該回歸分析包括目標(biāo)譜以及在一種混合物中存在的一個或多個已 知其他成分譜; 計算提取譜,其中所述提取譜為在該目標(biāo)譜的系數(shù)被設(shè)為零的情況下的殘差;以及 使用一種對比度量來對比所述提取譜與所述目標(biāo)譜。
2. 如權(quán)利要求1所述的方法,其中: 所述對比度量為相關(guān)系數(shù)、加權(quán)的相關(guān)系數(shù)、歐氏距離或絕對最大距離中的至少一個。
3. 如權(quán)利要求2所述的方法,其中: 在所述加權(quán)的相關(guān)系數(shù)中的這些權(quán)重不都相同。
4. 權(quán)利要求1所述的方法,進一步包括: 對比所述提取譜與殘差譜。
5. 權(quán)利要求1所述的方法,其中: 其中所述方法以一種迭代的方式使用。
6. 權(quán)利要求1所述的方法,其中: 所述回歸分析包含一個基線譜或多個其他成分譜。
7. 權(quán)利要求6所述的方法,其中: 所述回歸分析譜包含導(dǎo)數(shù)譜或者乘以一個包絡(luò)函數(shù)的導(dǎo)數(shù)譜。
8. 權(quán)利要求1所述的方法,進一步包括: 使用一個或多個回歸系數(shù)來計算濃度。
9. 權(quán)利要求1所述的方法,其中所述回歸分析包括: 一種目標(biāo)成分的多個譜中的至少一個,以及 一種已知成分的多個譜。
10. 權(quán)利要求1所述的方法,其中: 使用多個譜區(qū)。
11. 權(quán)利要求1所述的方法,其中: 將一種被鑒別的或目標(biāo)成分的多個譜因子化,并且這些因子載荷的一個子集被包含在 所述回歸分析中。
12. 權(quán)利要求1所述的方法,其中: 對不同的目標(biāo)成分執(zhí)行兩次或更多次回歸分析。
13. 權(quán)利要求12所述的方法,其中: 所述混合物內(nèi)存在多個目標(biāo)成分并且對于每個不同的目標(biāo)成分使用不同的譜區(qū)。
14. 權(quán)利要求1所述的方法,進一步包括: 對于數(shù)個目標(biāo)成分中的每一個,將數(shù)個目標(biāo)譜分組成為簇; 使用這些目標(biāo)譜的平均值、全部這些目標(biāo)譜、或者每一個簇中的這些目標(biāo)譜的這些因 子的一個子集,對于每個簇中的這些目標(biāo)譜執(zhí)行所述回歸分析; 對于每一個簇計算該提取譜;以及 對比這些提取譜與目標(biāo)譜的這些簇以確定該目標(biāo)譜屬于哪一個,如果有的話,簇。
15. 權(quán)利要求14所述的方法,其中: 一種已知成分的多個譜被包含在這些回歸分析中,或者一種已知成分的多個譜的因子 載荷的一個子集被包含在這些回歸分析中。
16. 權(quán)利要求14所述的方法,其中: 使用相關(guān)系數(shù)、加權(quán)的相關(guān)系數(shù)、歐氏距離、或最大絕對距離執(zhí)行這些對比。
17. 權(quán)利要求16所述的方法,其中: 對比這些提取譜與殘差譜。
18. 權(quán)利要求14所述的方法,其中: 這些回歸分析包含一個基線譜或其他成分譜。
19. 權(quán)利要求14所述的方法,其中: 使用多個譜區(qū)。
20. 權(quán)利要求14所述的方法,進一步包括 使用一個或多個回歸系數(shù)來計算濃度。
21. 權(quán)利要求1所述的方法,進一步包括: 對于數(shù)個目標(biāo)成分中的每一個,將多個目標(biāo)譜因子化; 將這些因子分組成簇; 將要分析的這些譜以及這些已知成分的譜投影到因子空間中; 使用這些目標(biāo)譜的這些因子載荷的平均值、或者這些目標(biāo)譜的全部因子載荷,對于該 因子空間中的每一個簇中的這些目標(biāo)譜執(zhí)行所述回歸分析; 對于每個簇計算該提取譜;以及 在該因子空間中對比這些提取譜和這些目標(biāo)譜,或者將這些提取譜投影回該原始譜空 間并且在該原始譜空間中執(zhí)行這些提取譜與這些目標(biāo)譜之間的對比,以確定該目標(biāo)譜屬于 哪一個,如果有的話,簇。
22. 權(quán)利要求21所述的方法,其中: 一種已知成分的多個譜被包含在該回歸分析中。
23. 權(quán)利要求21所述的方法,其中: 使用相關(guān)系數(shù)、加權(quán)的相關(guān)系數(shù)、歐氏距離、或最大絕對距離執(zhí)行這些對比。
24. 權(quán)利要求23所述的方法,進一步包括: 對比這些提取譜與殘差譜。
25. 權(quán)利要求21所述的方法,其中: 這些回歸分析包含一個基線譜或其他成分譜。
26. 權(quán)利要求21所述的方法,其中: 使用多個譜區(qū)。
27. 如權(quán)利要求21所述的方法,其中: 使用一個或多個回歸系數(shù)來計算濃度。
28. -種用于存儲計算機代碼的非瞬時性計算機可讀存儲介質(zhì),該計算機代碼用于一 種用于確定混合物中譜成分的存在的方法,所述方法包括: 執(zhí)行一種回歸分析,該回歸分析包括目標(biāo)譜以及在一種混合物中存在的一個或多個已 知其他成分譜; 計算提取譜,其中所述提取譜為在該目標(biāo)譜的系數(shù)被設(shè)為零的情況下的殘差;以及 使用一種對比度量來對比所述提取譜與所述目標(biāo)譜。
【文檔編號】G01J3/00GK104364624SQ201380027527
【公開日】2015年2月18日 申請日期:2013年5月30日 優(yōu)先權(quán)日:2012年5月31日
【發(fā)明者】理查德·杰克遜, 王茜 申請人:理查德·杰克遜, 王茜