本發(fā)明涉及一種利用近紅外分光法同時分析不同原料及形態(tài)的多種食品中營養(yǎng)成分含量的方法。
背景技術:
食品中含有對于生命體的生長、發(fā)達及維持起到重要作用的碳水化合物、蛋白質、脂肪、維生素、無機物等多種營養(yǎng)素。其中,碳水化合物、蛋白質和脂肪作為最基本且最重要的三種營養(yǎng)素,被稱為三大營養(yǎng)素,其成分為人類的生命維持及活動提供所需要的能量。目前食品中含有的碳水化合物、蛋白質及脂肪的定量分析由各個成分用多種分析法來進行含量評價。碳水化合物主要使用利用氣相色譜–質譜法(GC/MS)的分析或根據(jù)美國官方分析化學師協(xié)會(AOAC)法的扣除碳水化合物的方式;蛋白質主要使用考馬斯亮蘭法(Bradford)或基耶達爾法(Kjeldahl)法;脂肪一般使用索氏(Soxhlet)試驗法。
所述各成分分析法被長時間使用且能夠提供較為準確的結果,但其方法存在為進行分析需要復雜的萃取及預處理過程、分析時間長、要求熟練的分析人員及需要大量的分析費用等缺點。
相反,近紅外分光分析法(Near-Infrared Reflectance Spectroscopy,以下稱為‘NIRS’)具有因不需要對樣本進行預處理,能夠迅速分析成分,而且分析的樣本不會被損壞,還可以用于其他分析的優(yōu)點。到目前為止被知曉的與碳水化合物,蛋白質及脂肪的含量有關的近紅外分光分析技術有大米的直鏈淀粉含量分析、大米的淀粉含量分析、小麥的碳水化合物及蛋白質分析、豌豆的蛋白質含量分析、蘇子和花生的蛋白質含量分析、大米與糙米的蛋白質分析、麻風樹種子(Jatropha seed)的蛋白質及脂肪分析、大豆的蛋白質及脂肪分析、土豆片的脂肪分析等。
但是,由于近紅外吸收光譜比紅外線吸收光譜吸收微弱,且因多個泛音或結合音會出現(xiàn)吸收重疊或因氫鍵或分子之間的相互作用引起的特定吸收區(qū)域的移動(shift)而使解析吸收光譜困難,所以到目前為止只公開了只對具有同一形態(tài)及矩陣(matrix)的一種食品或者包括同一主要成分的同一形態(tài)的特定食品群進行成分含量分析的分析方法。
韓國授權專利第10-1000889號公開了一種利用濕稻子來預測精米的蛋白質含量的方法;韓國授權專利第10-1181315號公開了一種同時測量綠茶的咖啡因和兒茶素的個別含量的方法;但是沒有公開過本發(fā)明的利用近紅外分光法同時分析不同原料及形態(tài)的多種食品中營養(yǎng)成分含量的方法。
技術實現(xiàn)要素:
(一)要解決的技術問題
本發(fā)明的目的在于消除分析國內流通的多樣食品或農(nóng)產(chǎn)物資源中營養(yǎng)成分的含量分析過程中分析時間長且無法同時分析多種多樣種類及形態(tài)的食品的問題;更詳細的,提供一種利用近紅外分光分析法對國內流通的不同原料及形態(tài)的多樣的多種食品或農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪等營養(yǎng)成分的含量同時進行非破壞并迅速定量分析的方法。
(二)技術方案
本發(fā)明涉及一種利用近紅外分光法同時分析不同原料及形態(tài)的多種食品或農(nóng)產(chǎn)物資源中營養(yǎng)成分含量的方法。更詳細地,涉及一種利用近紅外分光法同時分析多種食品或農(nóng)產(chǎn)物資源中營養(yǎng)成分含量的方法,其特征在于,包括以下步驟:
(1)通過食品工典所記載的多樣成分試驗法,分析不同原料及形態(tài)的多種多樣食品或農(nóng)產(chǎn)物資源中的營養(yǎng)成分的含量;
(2)將所述多種食品或農(nóng)產(chǎn)物資源分為校正用樣本群和驗證用樣本群;
(3)對所述多種校正用樣本群和驗證用樣本群分別照射近紅外線,同時獲得原始的近紅外吸收光譜;
(4)對在所述步驟(3)中獲得的校正用樣本群的原始的近紅外吸收光譜的散射進行校正;
(5)由所述校正用樣本群的經(jīng)過散射校正的原始吸收光譜獲得導函數(shù),進行以W-X-Y-Z表示的數(shù)學處理后,通過與利用所述步驟(1)中獲得的多樣成分試驗法分析獲得的含量值對比的統(tǒng)計分析來選定第一檢驗式,其中,W表示微分次數(shù),X表示用于測量光譜的波長的間隔(nm),Y表示在對波長間隔的水處理中使光譜的連接柔和的一次平滑化,Z表示在對波長間隔的水處理中使光譜的連接柔和的二次平滑化;
(6)為了驗證在所述步驟(5)中選定的第一檢驗式,將所述第一次選定的檢驗式適用于在所述步驟(3)中獲得的多種驗證用樣本群的原始近紅外吸收光譜中來選定最佳檢驗式;以及
(7)利用所述選定的檢驗式來定量分析多種食品或農(nóng)產(chǎn)物資源中的營養(yǎng)成分的含量。
所述不同原料及形態(tài)的多種食品或農(nóng)產(chǎn)物資源中含有的營養(yǎng)成分優(yōu)選為選自蛋白質、碳水化合物、脂肪、脂肪酸、氨基酸、有機酸、水分、維生素及無機物中的一個以上,但并不限定于此。
所述原始近紅外吸收光譜的獲得應在400-2500nm波長范圍內進行。一般情況下,近紅外吸收光譜使用800-2500nm波長范圍內的吸收光譜,但是本發(fā)明為同時測量多種不同原料及形態(tài)的多樣食品和農(nóng)產(chǎn)物資源的方法,包括可視光線區(qū)域的400-2500nm波長范圍內吸收的影像中包括有利于含量分析的信息,所以將波長范圍限定于800-2500nm是不優(yōu)選。
測量所述近紅外吸收光譜的模式優(yōu)選為選自擴散反射(diffuse reflectance)模式、透射反射(transflectance)模式及透射(transmission)模式中的一種,更優(yōu)選地,選擇擴散反射模式,但是適于測量近紅外吸收光譜,不限于某種方法,可以選擇使用。
在測量所述近紅外吸收光譜時,一般能夠使用的多種測量用模塊都可以使用,但是,當樣本的形態(tài)由固體、液體或者粘滯性半固體等多種原料與形態(tài)構成時,一般使用的垂直測量模塊無法測量液體或粘滯性半固體樣本。
所以,在測量樣本的近紅外吸收光譜時,優(yōu)選使用不受樣本形態(tài)的限制且防止液體或半固體樣本流下的水平DCFA(direct contact food analyzer)模塊。
并且,為了防止蓋子或測量容器的多個測量部位被液體或粘滯性半固體樣本污染,樣本的測量容器優(yōu)選為無蓋的小反射容器(small reflectance vessel),但并不限定于此。
測量所述近紅外吸收光譜時,在將多種多樣不同原料及形態(tài)的食品或農(nóng)產(chǎn)物資源區(qū)分為校正用(calibration)和驗證用(validation)樣本群的階段中,雖沒有對校正用和驗證用(validation)樣本群進行區(qū)分的準確的基準,但是為了與原料及形態(tài)無關地適用多種未知食品或農(nóng)產(chǎn)物資源,優(yōu)選地,校正用樣本群廣泛包括不同原料及形態(tài)的多種多樣的食品及農(nóng)產(chǎn)物資源。,因此,優(yōu)選采用校正用樣本群比驗證用樣本群多的個體樣本群,更優(yōu)選地,校正用和驗證用的比例為2:1至4:1,更優(yōu)選地,按2:1至3:1的比例進行分類。即,校正用樣本數(shù)至少為驗證用樣本數(shù)的2至4倍,因此保證種類的多樣性,導出優(yōu)秀的分析結果,并且可以增加適用范圍。
所述近紅外吸收光譜的散射校正意味著校正扭曲光譜與濕法分析值之間的相互關系的非線性函數(shù),校正散射的方式優(yōu)選為選自標準多元離散修正(standard multiplicative scattering correction,標準MSC)、反相多元離散校正(Inverse MSC)、去除線性分量(Detrend,從各光譜中去除線性或者二次曲率的方式)、標準正態(tài)變量(Standard normal variate,以下簡稱為‘SNV’)校正及加權多元離散校正(weighted multiplicative scattering correction;加權MSC)中的一個以上。
近紅外光譜的范圍比化學性、物理性的位移極其微弱,所以所述導函數(shù)的統(tǒng)計分析優(yōu)選為多變量回歸分析(multivariate regression)。更優(yōu)選地,選自多元線性回歸法(multiple linear regression)、主成分回歸分析法(principal component regression,PCR)、偏最小二乘法(partial least squares,PLS)及改進的偏最小二乘法(modified partial least squares,MPLS)中的一種,當樣本的構成單純且測量的成分有著獨特的峰值時,優(yōu)選多元線性回歸法,由于吸收帶的重疊而光譜復雜時,優(yōu)選主成分回歸分析法或偏最小二乘法。當利用交叉驗證(cross-validation)導出波長的全波段與實驗值之間的相互關系時,會根據(jù)波長變數(shù),得到相關度和交叉驗證結果的誤差,優(yōu)選改進的偏最小二乘法。
并且,優(yōu)選地,當所述營養(yǎng)成分為碳水化合物時,散射校正為加權多元離散校正(weighted multiplicative scattering correction;加權MSC)、數(shù)學處理為從1-4-1-1、1-4-5-1及1-4-10-5中選取的任意一種,優(yōu)選地,當所述營養(yǎng)成分為蛋白質時,散射校正為標準多元離散校正(standard multiplicative scattering correction;標準MSC),數(shù)學處理為從2-5-5-3、2-5-10-1及2-6-1-1中選取的任意一種,優(yōu)選地,當所述營養(yǎng)成分為脂肪時,散射校正為標準正態(tài)變量校正(SNV),數(shù)學處理為從1-1-1-1、1-1-3-1及1-3-10-5中選取的任意一種,但各數(shù)學處理并不限定于此。
本發(fā)明的統(tǒng)計中使用的‘用語’的定義如下。
標準驗證誤差(Standard Error of Calibration,SEC)為用于豎立檢驗式的驗證樣本組(calibration set)被預測為檢驗式時,濕法分析值與近紅外分光分析預測值之間的標準誤差。
決定系數(shù)(Coefficient of Determination,RSQ,R2)表示檢驗式組中的變異的量,而且,當RSQ為1時,檢驗式樣本所包含的100%的組成成分變異用近紅外分光分析檢驗式來說明。
交叉檢驗標準誤差(Standard Error of Cross Validation,SECV)為樣本在制定檢驗式的過程中,被依次除去時,檢驗式食品群的濕法分析值與近紅外分光分析預測值之間的標準誤差。
1-方差比(1-Variance Ratio,以下簡稱為‘1-VR’)意味著用近紅外分光分析檢驗式能夠說明多少構成成分的變異,且在1-VR為1時,意味著在交叉檢驗(cross validation)過程中檢驗式食品群包含的100%(全部)的組成成分的變異都由近紅外分光分析檢驗式來說明。
標準預測誤差(Standard Error of Prediction,SEP)意味著獨立的食品群的濕法分析值與近紅外分光分析預測值之間的標準誤差;且在豎立檢驗式的過程中分析未使用的獨立食品群時被使用。
(三)有益效果
本發(fā)明涉及一種利用近紅外分光法同時分析多種多樣的不同原料及形態(tài)的食品或農(nóng)產(chǎn)物資源中的營養(yǎng)成分含量的方法,其優(yōu)點在于:使用無需萃取食品或農(nóng)產(chǎn)品資源中含有的成分或不需要化學反應等的近紅外分光分析法來實現(xiàn)非破壞性分析,并且,可同時且迅速的測量對多種多樣的不同原料及形態(tài)的食品或農(nóng)產(chǎn)物資源中的蛋白質、碳水化合物、脂肪、脂肪酸、氨基酸、有機酸、水分、維生素及無機物等多種營養(yǎng)成分的分析。而且,被測量的食品可以原樣回收來使用于同一食品或農(nóng)產(chǎn)物資源的反復分析或者營養(yǎng)成分外的其他功能性成分等的分析,確保了分析的再現(xiàn)性和成分驗證的多樣性。
附圖說明
圖1是校正(calibration)用樣本群412種食品的原始的近紅外吸收光譜,是確認在986、1194及1930nm波段出現(xiàn)吸光度的圖。
圖2是表示對圖1中所示的412種校正用樣本群的近紅外原始吸收光譜進行一次微分(1-4-5-1,標準MSC)來校正的光譜的圖。并且是表示在1144、1398及1888nm波段吸光度差距大,與928nm附近的脂肪有關的C-H3次泛音帶區(qū)域、與1020、1510及2048nm波段的蛋白質有關的N-H區(qū)域、與1888及2258nm波段的碳水化合物(淀粉)有關的區(qū)域和與952及1452nm波段水有關的區(qū)域中的吸光度的圖。
圖3為對校正用樣本群412種食品中含有的碳水化合物的從近紅外吸收光譜中獲得的含量值與根據(jù)濕法分析測量的碳水化合物的含量值進行對比的散點圖。
圖4為校正用樣本群412種食品中含有的碳水化合物含量值與根據(jù)濕法分析測量的碳水化合物含量值之間的差的柱狀圖。
圖5為對校正用樣本群412種食品中含有的蛋白質的從近紅外吸收光譜中獲得的含量值與根據(jù)濕法分析測量的蛋白質含量值進行對比的散點圖。
圖6為表示校正用樣本群412種食品中含有的蛋白質含量值與根據(jù)濕式分析測量的蛋白質含量值之間的差的柱狀圖。
圖7為對校正用樣本群412種食品中含有的脂肪的從近紅外吸收光譜中獲得的含量值與根據(jù)濕法分析測量的脂肪含量值進行對比的散點圖。
圖8為表示校正用樣本群412種食品中含有的脂肪含量值與根據(jù)濕法分析測量的脂肪含量值之間的差的柱狀圖。
圖9為對校正用樣本群412種食品中含有的碳水化合物的從近紅外吸收光譜中獲得的含量值與162種驗證用食品中含有的碳水化合物的從近紅外吸收光譜中獲得的含量值進行對比的散點圖。
圖10為對校正用樣本群412種食品中含有的蛋白質的從近紅外吸收光譜中獲得的含量值與162種驗證用食品中含有的蛋白質的從近紅外吸收光譜中獲得的含量值進行對比的散點圖。
圖11為對校正用樣本群412種食品中含有的脂肪的從近紅外吸收光譜中獲得的含量值與162種驗證用食品中含有的脂肪的從近紅外吸收光譜中獲得的含量值進行對比的散點圖。
具體實施方式
下面,利用實施例來對本發(fā)明進行詳細說明。這些實施例僅是為更加具體的說明本發(fā)明,本發(fā)明的范圍并不限于所述實施例,這對于本發(fā)明所屬技術領域的普通技術人員來說是顯而易見的。
實施例1.對于國內流通的食品中含有的碳水化合物、蛋白質及脂肪的含量分析
1.準備樣本
樣本使用了在國內流通的包含固體狀、液體狀及粘滯性半固體狀的574種多種原料及形態(tài)的食品和農(nóng)產(chǎn)品資源,其中包含72種飯類、17種粥類、36種羹類、52種肉類及相關產(chǎn)品、47種魚貝類、62種蔬菜類、106種菜肴類、13種泡菜類、12種調料類、11種湯類、55種加工食品類、20種油炸類及45種調味類。
并且,用于分析的各樣本是回收大量的樣本并經(jīng)過均質化過程來構成的代表樣本。
所述574種多樣原料及形態(tài)的食品和農(nóng)產(chǎn)物資源樣本以其內的碳水化合物、蛋白質及脂肪的含量值為相似值的基準分類為約2:1的比例,其結果被區(qū)分為412種檢驗式校正用樣本群和162種驗證用(validation)樣本群。所述被分類的多種原料及形態(tài)的食品和農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的平均含量(%)、范圍程度、標準差(SD)相似(參照表1)。
表1:
在近紅外分光分析中使用的校正用及驗證用樣本群的營養(yǎng)成分含量的比較。
校正用樣本群中碳水化合物、蛋白質及脂肪的含量范圍為0.04-90.57%、0.11-33.86%及0.02-38.96%,其變動范圍分布順序為碳水化合物、脂肪、蛋白質,校正用樣本群的各含量范圍包括了驗證用樣本群的含量范圍,確保了可以包括脫離了驗證用群范圍的含量范圍的廣泛的條件。
2.根據(jù)濕法化學分析法來分析食品中含有的碳水化合物、蛋白質、脂肪、水分及灰分(參考值)。
對于所述574種食品,根據(jù)食品工典中一般成分試驗法來分析了碳水化合物、蛋白質、脂肪、水分及灰分的含量,并對每個樣本進行了三次反復分析。
①蛋白質含量的分析
利用半微量克氏(semi-micro Kjeldahl)試驗法對食品中的氮含量進行定量后,換算為蛋白質含量。
最通常的氮的系數(shù)為6.25,是在蛋白質包含16%(w/v)的氮的條件下得到的系數(shù)。包含氮的除了蛋白質外還包括有核酸內嘌呤(purine)及嘧啶(pyrimidine)堿的衍生物,所以并非純蛋白質,稱為粗蛋白質。分析方法為分解、蒸餾、中和及滴定四個階段,對于每個氮(N)含量為2-3mg的樣本加入0.5g的分解促進劑、3-5ml的98%(v/v)硫酸、1ml的30%(v/v)過氧化氫。將溫度調高至看不到試料的碳水化合物,在分解液變?yōu)榈嗌珪r,繼續(xù)加熱1-2小時。之后冷卻分解液后加入20ml的水,并連接到蒸餾裝置。在蒸餾裝置的吸收燒瓶中加入10ml的0.05N硫酸,滴入2-3滴的布倫斯維克試液,將冷卻器的末端浸漬在液面底部,用小漏斗加入25ml的30%氫氧化鈉溶液后,將水器中的乳液用0.05N氫氧化鈉溶液滴定至布倫斯維克試液變?yōu)榫G色。用相同的方法進行空試驗(0.05N硫酸1ml=0.7003mg N),由以下式1來算出蛋白質量。
氮(%)=0.7003×(a-b)×[100/樣本量(mg)] 式(1)
A表示空白實驗中中和所需的0.05N氫氧化鈉的ml數(shù),b表示本實驗中中和所需的0.05N氫氧化鈉的ml數(shù)。
在所述獲得的氮含量上乘以各食品的氮的系數(shù)來獲得粗蛋白質的含量(參照以下式(2))。
粗蛋白質(%)=N(%)×氮系數(shù) 式(2)
②脂肪的含量分析
脂肪含量的分析使用索氏(Soxhlet)萃取裝置對乙醚進行純化來萃取樣本中的脂肪,從而進行定量。融化于乙醚中而被萃取的并非只是油脂,還包含極少量的有機酸、乙醇類、低油、色素、脂溶性維生素等,所以用這種方法定量的脂肪稱為粗脂肪(crude fat)或者乙醚萃取物。將2-10g的樣本分別放入圓柱形過濾紙中,用脫脂棉蓋住樣本的上部并將其放入容器內,在100-105℃的干燥器中干燥2-3小時。將其在干燥器中放涼再放入索氏萃取裝置的萃取管中,在接收器皿(水器)中放入一半容量程度的無水乙醚來裝置,并萃取8小時。在萃取結束后,將冷卻器摘下,用鑷子將萃取管內的圓柱形過濾紙取出,重新將冷卻器連接到萃取管中,待乙醚全部移到萃取管中后,分離并使用連接有恒溫水池的濃縮機來完全蒸發(fā)掉乙醚。用紗布擦拭干凈水器的外部后,將其放入98-100℃的干燥器中,干燥約1小時使其恒重后在干燥器中放冷后對水器的重量進行定量。粗脂肪的量由以下式(3)來算出。
粗脂肪(g)={(W1-W0)/S}×100 式(3)
W0為接收器皿(水器)的重量(g),W1為萃取干燥的粗脂肪的接收器皿的重量(g),S為樣本的采取量(g)。
③水分的含量分析
水分含量利用常壓加熱干燥法分析法來分析,所述常壓加熱干燥法視水分為唯一揮發(fā)成分,將試料在比水的沸點高的溫度中進行常壓干燥而減少的量為水分含量。并且,根據(jù)食品的種類、性質,加熱溫度不同,動物性食品和蛋白質含量高的食品在98-100℃、蔗糖和糖分含量高的食品在100-103℃、植物性食品在105℃左右(100-110℃)、谷類在110℃以上(135℃)進行加熱。分析方法為在預先加熱的恒重的稱重盤中放入3-5g的試料并稍微開好蓋子,并將每個食品放入規(guī)定溫度的干燥機中干燥3-5小時,然后在干燥器中放涼約30分鐘再進行稱重。再將稱重盤干燥1-2小時,重復進行同樣的操作,直至稱重盤恒重,從而求值,水分量可以由以下式(4)來算出。
水分(g)=(b-c)/(b-a)×100 式(4)
A表示稱重盤的重量(g),b表示稱重盤與試料的重量(g),c表示干燥后恒重時的重量(g)。
④灰分的含量分析
指將試料放入灰化容器中,在550-600℃的溫度下進行完全灰化處理時的灰分的量,其分析方法為,將灰化容器在600℃以上的電爐中強加熱后移入干燥器中降溫至室溫后稱重。重復進行此過程,直至恒重,將試料放入灰化容器中。在500-550℃的灰化爐中加熱數(shù)小時,直至從白色變?yōu)榛野咨?,然后放涼?00℃后移入干燥器中稱重?;曳值牧坑梢韵率?5)來算出。
灰分(g)={(W1-W0)/S}×100 式(5)
W0表示恒重后的灰化容器的重量(g),W1表示灰化后灰化容器與灰分的重量(g),S表示樣本的采取量(g)。
⑤碳水化合物的含量分析
另外,碳水化合物的含量是通過在100g的試料中減去粗蛋白質、粗脂肪、水分及灰分含量的減除計算法即以下式(6)來算出的。
碳水化合物(g)=100g-[粗蛋白質+粗脂肪+水分+灰分](g)式(6)
3.利用近紅外分光器的食品內營養(yǎng)成分的含量分析
①近紅外吸收光譜的測量與預處理
所述準備的多種原料及形態(tài)的國內流通食品及農(nóng)產(chǎn)物資源574種的近紅外光譜的測量使用了近紅外(NIRS)系統(tǒng)模型6500分光器(Foss NIRS systems Ins.,Silver Spring,MD)。分析前,在水平DCFA(direct contact food analyzer)模塊中運行WinISIⅡ(1.5版本,F(xiàn)oss and Infrasoft International LLC,Stage Collgeg,PA)軟件,通過自我診斷過程使機器穩(wěn)定化。若處于全部通過反應試驗(Response test)、波長的準確性、反復性(repeatability)測試的狀態(tài),可判斷為可以進行分析的狀態(tài)。在完成機器的穩(wěn)定化測試后,在水平DCFA(direct contact food analyzer)模塊中可以使用固體、液體及粘滯性半固體試料的小的反射容器(small reflectance vessel)里將試料放入容器的一半并在室溫條件下測量了400-2500nm范圍的近紅外吸收光譜。
對于所述574種食品試料,以根據(jù)韓國食品標準法典中一般成分試驗法來得到的碳水化合物、蛋白質、脂肪含量值為基準,將取值相仿的各成分,以約2:1的比例來隨機分類。隨機區(qū)分為412種檢驗式校正用食品群和162種驗證用(validation)食品群后,獲得各個食品群的原始的近紅外吸收光譜。
②近紅外光譜的測量及檢驗式的確立
獲得用于制定檢驗式的412種食品及農(nóng)產(chǎn)物資源在400-2500nm區(qū)域的吸收光譜(參照圖1)。近紅外分光分析光譜的測量與試料形態(tài)無關,但是會因吸收譜帶的重疊或測量物質的化學成分、粒子的大小及密度等物理因素,在基線引起變化。為了減少這種變化且分離重疊在一起的波長,進行了水處理。圖2為將圖1的近紅外原始吸收光譜進行數(shù)學預處理的,利用標準多元離散校正(MSC)來校正由于粒度差異引起的散射,將各個光譜的各區(qū)域重疊中產(chǎn)生的誤差進行一次微分(1st derivatives、4nm gap,5point smoothing、1point second smoothing),使用回歸方法中的改進的偏最小二乘法(MPLS)來校正了光譜。
由于所述改進的偏最小二乘法(MPLS)在利用交叉驗證來誘導從近紅外分光分析的全體波長(400-2500nm)中獲得的結果與使用食品工典中一般成分試驗法獲得的各營養(yǎng)成分的分析含量結果之間的相互關系的過程中,選擇最佳因子(factor)來防止過擬合(overfitting)并提高準確度,因此最小化在光譜中出現(xiàn)的基線的變化、散射及重疊引起的影響,使決定系數(shù)(Coefficient of determination;RSQ,R2)最大化。以測量得的光譜的原始(log 1/R)光譜、進行一次微分(D1log 1/R)的光譜及二次微分(D2log 1/R)的光譜為對象通過多種散射修正(Scatter correction)與水處理,將光譜在各區(qū)域最小化因重疊產(chǎn)生的噪聲(noise)和偏差(bias)來樹立對于碳水化合物、蛋白質及脂肪含量的近紅外分光分析(NIRS)檢驗式。檢驗式以標準驗證誤差(Standard Error of Calibration;SEC)、決定系數(shù)(Coefficient of Determination;RSQ,R2)、1-VR(one minus the radio of unexplained variance to total variance)的統(tǒng)計值為基準來分選。
所述412種檢驗式校正用食品及農(nóng)產(chǎn)物資源的原始光譜中,在986、1194、1930nm波長出現(xiàn)吸光度;與原始光譜不同,一次微分光譜中各波長出現(xiàn)微弱的吸光度差異,在1144、1398、1888nm中出現(xiàn)很大的吸光度差異。在與脂肪有關的928nm附近的C-H官能基的3次泛音帶、與蛋白質有關的N-H官能基的1020、1510、2048nm區(qū)域,與碳水化合物的淀粉有關的1888、2258nm區(qū)域、與O-H有關的952、1452nm區(qū)域存在吸光度差異,并該區(qū)域的波長有效地利用于檢驗式的制定。
利用所述412種的一次微分光譜來算出用于分析國內流通的食品及農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的最佳的近紅外分光分析檢驗式,首先利用改進的偏最小二乘法(MPLS),再利用多種水處理及散射校正。最佳的檢驗式為校正用決定系數(shù)(R2)值接近于1,檢驗式標準誤差(SEC)值小且交叉驗證中1-分散比(1-VR)的值大,交叉驗證標準誤差(SECV)值小的檢驗式。
國內流通食品及農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的近紅外分光分析檢驗式利用通過食品工典中一般成分試驗法獲得的含量值與近紅外分析值之間的決定系數(shù)與檢驗式標準誤差(SEC)值來選定最佳的檢驗式。在圖3至圖8中示出了對412種食品及農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的從近紅外吸收光譜中獲得的含量值與通過濕法化學分析測得的碳水化合物、蛋白質及脂肪的含量值進行比較的散點圖和柱狀圖。
表2:從412種食品及農(nóng)產(chǎn)物資源的近紅外吸收光譜選定用于分析碳水化合物含量的檢驗式候選的例子。
aSEC:標準驗證誤差(Standard error of calibration)
bR2:決定系數(shù)(Coefficient of determination in calibration)
c1-VR:1-分散比(One minus the ratio of unexplained variance to total variance)
dSECV:交叉檢驗標準誤差(Standard error of cross-validation)
表3
從412種食品及農(nóng)產(chǎn)物資源的近紅外吸收光譜選定用于分析蛋白質含量的檢驗式候選的例子。
aSEC:標準驗證誤差(Standard error of calibration)
bR2:決定系數(shù)(Coefficient of determination in calibration)
c1-VR:1-分散比(One minus the ratio of unexplained variance to total variance)
dSECV:交叉檢驗標準誤差(Standard error of cross-validation)
表4
從412種食品及農(nóng)產(chǎn)物資源的近紅外吸收光譜選定用于分析脂肪含量的檢驗式候選的例子。
aSEC:標準驗證誤差(Standard error of calibration)
bR2:決定系數(shù)(Coefficient of determination in calibration)
c1-VR:1-分散比(One minus the ratio of unexplained variance to total variance)
dSECV:交叉檢驗標準誤差(Standard error of cross-validation)
為了制定最佳的近紅外分光分析檢驗式,使用了回歸分析法中的MPLS法,其結果是,碳水化合物在原始光譜的散射方式為加權(weighted)多元離散校正(multiplicative scatter correction,MSC)方法,水處理在使用1-4-5-1(1st derivative、4nm gap、5points smoothing、1point second smoothing)實施的條件下,決定系數(shù)為0.971,最高,標準誤差(SEC)值為4.066,最低,顯示著比其他散射方式及水處理條件優(yōu)異的結果。
蛋白質在原始光譜的散射方式為標準(Standard)MSC方式;水處理在使用2-5-5-3(2nd derivative、5nm gap、5points smoothing、3point second smoothing)實施的條件下,決定系數(shù)(R2)值為0.974,最高,檢驗式標準誤差(SEC)值為1.080,最低,顯示著比其他散射方式及水處理條件優(yōu)異的分析結果。
脂肪在原始光譜的散射方式為標準正態(tài)變量(Standard normal variate,SNV)校正方法,水處理在使用1-1-1-1(1st derivative、1nm gap、1points smoothing、1point second smoothing)實施的條件下,決定系數(shù)為0.937,最高,檢驗式標準誤差值為1.890,最小。
③利用162種檢驗用食品及農(nóng)產(chǎn)品資源確立檢驗式
為了評價所述用412種食品及農(nóng)產(chǎn)物資源選出的一次近紅外分光分析檢驗式對未知食品及農(nóng)產(chǎn)物資源的適用可能性,利用在一次近紅外分光分析檢驗式的選定中沒有使用的162種食品及農(nóng)產(chǎn)物資源來進行驗證。利用了WinISIⅡ軟件的監(jiān)控(monitor)程序,檢驗式的適用可能性的驗證是利用標準預測誤差(Standard error of prediction,SEP)、決定系數(shù)(coefficient of determination in prediction,R2)、偏差(average difference between reference及NIRS values,Bias)、標準偏差(Standard deviation,SD)的統(tǒng)計值來驗證檢驗式對未知樣本的適用性及正確性。
表5
對從162種驗證用食品及農(nóng)產(chǎn)物資源一次選定的檢驗式進行驗證而獲得的多種多樣的原料及形態(tài)的多種食品及農(nóng)產(chǎn)物資源中含有的營養(yǎng)成分(碳水化合物、蛋白質及脂肪)的含量分析用最佳候選檢驗式的選定。
表6
162種食品及農(nóng)產(chǎn)物資源對于被選定的最佳近紅外分光分析檢驗式的檢驗結果。
標準偏差:Standard deviation(SD)
偏差(Bias):average difference between reference及NIRS values
決定系數(shù)(R2):Coefficient of Determination in prediction
標準誤差(SEP(C)):Corrected Standard error of prediction
斜率(Slope):Steepness of a straight line curve
將決定系數(shù)與預測標準誤差作為近紅外分光分析檢驗式的預測值分析的正確性檢查的標準。將最佳的近紅外分光分析檢驗式適用在未知樣本的結果被確認為:碳水化合物的決定系數(shù)值為0.987,更高于校正用檢驗式的決定系數(shù)值0.971;且檢驗式預測標準誤差值為2.515,低于校正用檢驗式標準誤差值4.066,表現(xiàn)出對于未知樣本的預測值分析可以更加精確。蛋白質的決定系數(shù)值為0.970,稍微低于校正檢驗式的決定系數(shù)值0.974,檢驗式預測標準誤差值為1.144,小于檢驗式標準誤差值1.080的1.3倍的1.404,表現(xiàn)出良好的結果。脂肪的決定系數(shù)值為0.947,比校正檢驗式的決定系數(shù)值大0.01,檢驗式預測標準誤差值為1.370,變得低于校正時的檢驗式標準誤差值1.890。通過以所述結果可知,所述檢驗式可有效的適用于未知樣本(食品及農(nóng)產(chǎn)物資源)的含量分析。
圖9至圖11表示將所述412種校正用食品及農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的從近紅外吸收光譜中獲得的含量值與162種驗證用食品及農(nóng)產(chǎn)物資源中含有的碳水化合物、蛋白質及脂肪的從近紅外吸收光譜中獲得的各含量值進行比較的散點圖。