基于高光譜成像技術(shù)檢測(cè)花生中蛋白質(zhì)含量分布的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種檢測(cè)花生中蛋白質(zhì)含量的方法,具體地說(shuō),設(shè)及基于高光譜成像 技術(shù)檢測(cè)花生中蛋白質(zhì)含量分布的方法。
【背景技術(shù)】
[0002] 2013年我國(guó)花生產(chǎn)量1697萬(wàn)噸,位居世界第一。花生中含有大量的營(yíng)養(yǎng)物質(zhì),其 中蛋白質(zhì)含量高達(dá)24%~36%。對(duì)花生蛋白質(zhì)的營(yíng)養(yǎng)價(jià)值研究證明,花生蛋白的生物價(jià) 度V)為59,蛋白質(zhì)的凈利用率(NPD)為51,純消化率可達(dá)90%,與動(dòng)物蛋白相近,比大豆蛋 白更容易吸收。傳統(tǒng)測(cè)定花生中蛋白質(zhì)含量的方法包括:凱氏定氮法和分光光度法,但運(yùn)些 方法存在分析速度慢,操作步驟繁瑣,成本高破壞性強(qiáng),使用試劑污染環(huán)境等缺點(diǎn)。因此,急 需尋找一種快速,非破壞性的方法為花生蛋白質(zhì)含量的測(cè)定提供依據(jù)。
[0003] 高光譜成像技術(shù)結(jié)合了光譜學(xué)和成像技術(shù),是一口新興的快速,無(wú)損檢測(cè)方法。高 光譜圖像是由一系列連續(xù)的波段圖像組成的=維圖像數(shù)據(jù)塊,其具有某個(gè)特定波長(zhǎng)下的圖 像信息,并且針對(duì)平面內(nèi)某個(gè)特定像素又具有不同波長(zhǎng)下的光譜信息。其原理是利用花生 蛋白質(zhì)中CH、0H等基團(tuán)在近紅外光譜區(qū)的光譜吸收特性,確定光譜與蛋白質(zhì)含量之間的定 量關(guān)系,從而預(yù)測(cè)花生中蛋白質(zhì)含量和分布。
[0004] 中國(guó)專利CN102621077A公布了高光譜反射圖像采集系統(tǒng)及基于該系統(tǒng)的玉米種 子純度無(wú)損檢測(cè)方法;中國(guó)專利CN1995987公布了基于高光譜圖像技術(shù)的農(nóng)畜產(chǎn)品無(wú)損檢 測(cè)方法及裝置;中國(guó)專利CN103636315A公布了一種基于高光譜的種子發(fā)芽率在線檢測(cè)裝 置及方法。W上發(fā)明采用高光譜圖像技術(shù)檢測(cè)產(chǎn)品指標(biāo),避免了傳統(tǒng)方法的局限性。但研 究主要集中在種子純度方面,經(jīng)檢索,到目前為止,國(guó)內(nèi)外還沒有用高光譜成像技術(shù)檢測(cè)花 生蛋白質(zhì)含量分布的報(bào)道。
【發(fā)明內(nèi)容】
[0005] 為了解決現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的是提供基于高光譜成像技術(shù)檢測(cè) 花生中蛋白質(zhì)含量分布的方法。
[0006] 為了實(shí)現(xiàn)本發(fā)明目的,本發(fā)明第一方面是提供一種基于高光譜成像技術(shù)建立花生 中蛋白質(zhì)含量分布定量模型的方法,該方法包括W下步驟:
[0007] 1. 1收集具有代表性的花生樣品,用高光譜儀掃描獲得花生樣品中每個(gè)像素點(diǎn)在 各波長(zhǎng)下的圖像信息,得到花生樣品的原始高光譜=維圖像;
[0008] 優(yōu)選地,所述高光譜儀掃描的波長(zhǎng)范圍為900-1700nm,掃描方式為線掃描;
[0009] 1. 2對(duì)所述花生樣品的原始高光譜=維圖像進(jìn)行校正和背景刪除后,提取花生樣 品圖像平均光譜;
[0010] 優(yōu)選地,所述校正是對(duì)所述花生樣品的原始高光譜=維圖像Ifji行黑白校正; 具體方法為對(duì)反射率為99%的標(biāo)準(zhǔn)校正板進(jìn)行采集,得到全白的標(biāo)定圖像Uit。,然后關(guān)閉 鏡頭采集,得到全黑標(biāo)定圖像Id。^,根據(jù)下述公式計(jì)算校正后圖像I。。?: CN105115910A說(shuō)明書 2/8 頁(yè)
[0012] 優(yōu)選地,所述背景刪除具體步驟為:采用主成分分析,確定背景與花生的邊界,刪 除背景,得到花生樣品圖像;
[0013] 1. 3對(duì)所述花生樣品圖像平均光譜進(jìn)行二階導(dǎo)數(shù)預(yù)處理;
[0014] 進(jìn)行二階導(dǎo)數(shù)預(yù)處理可W有效地消除基線和其他背景的干擾,分辨重疊峰,提高 分辨率和靈敏度;
[0015] 1.4采用常規(guī)方法檢測(cè)所述花生樣品的蛋白質(zhì)含量,得到花生樣品的蛋白質(zhì)含 量;
[0016] 優(yōu)選地,所述檢測(cè)花生樣品的蛋白質(zhì)含量方法為根據(jù)GB/T5009. 5-2010進(jìn)行,進(jìn) 一步優(yōu)選為根據(jù)GB/T5009. 5-2010中第一法凱氏定氮法進(jìn)行;
[0017] 1. 5將所述花生樣品隨機(jī)分為校正集和驗(yàn)證集,W所述校正集花生樣品的所述預(yù) 處理后的花生樣品圖像平均光譜為自變量,W所述校正集的花生樣品的蛋白質(zhì)含量為因變 量,通過(guò)偏最小二乘法建立所述自變量和因變量的偏最小二乘法回歸模型;利用所述驗(yàn)證 集對(duì)所述偏最小二乘法回歸模型進(jìn)行驗(yàn)證;
[001引優(yōu)選地,所述校正集與驗(yàn)證集花生樣品的比例為1:3-1:2 ;
[0019] 1. 6根據(jù)所述偏最小二乘法回歸模型的回歸系數(shù),選擇對(duì)所述回歸模型貢獻(xiàn)率絕 對(duì)值最大的波長(zhǎng)為特征波長(zhǎng);并通過(guò)偏最小二乘法建立花生中蛋白質(zhì)含量分布定量模型; 利用所述驗(yàn)證集對(duì)所述花生中蛋白質(zhì)含量分布定量模型建立的模型進(jìn)行驗(yàn)證。
[0020] 該蛋白質(zhì)含量分布定量模型表示所述校正集花生樣品的蛋白質(zhì)含量與所述特征 波長(zhǎng)處的光譜反射值的定量關(guān)系。
[0021] 特征波長(zhǎng)選取過(guò)多或過(guò)少都不宜;若特征波長(zhǎng)選取過(guò)多,則增加計(jì)算復(fù)雜度;若 特征波長(zhǎng)選取過(guò)少,則會(huì)降低檢測(cè)結(jié)果準(zhǔn)確度。
[0022] 優(yōu)選地,選取所述特征波長(zhǎng)分別為:931nm、934nm、941nm、944nm、1020nm、1120nm、 1137nm、1207nm、1273nm、1370nm、1380nm、1594nm、1654nm、1678墜。
[0023] 優(yōu)選地,所建立的花生中蛋白質(zhì)含量分布定量模型如下:
[0024]Yp"= 10 2X(34. 78R93inm-31. 72R934nm-25. 63R9"nm+l〇8. 46R944nm+195. 93Ri〇2〇nm-l〇7Ru2 0?+83. 44Rii37nni-13. 72Ri2〇7nm+182. 89Ri273nm+41. 09Ri37〇nm_79. 21R口細(xì)nm+16. 585Ri5g4nm_93. 84Rw54nm -71. 93Rie78tini)+26. 625
[00巧]其中,Ypro為花生樣BFI的蛋白質(zhì)旨里,R931nni、R934?、R94I?、R944?、Ri〇20?、Ri120?、Rll37nni、 Rl207nni、Rl273nni、Ri37。?、Ri38。?、Rl594nni、Rl654nni、Rl678nni分力iJ為花生樣品在特化波k931nm、934nm、 941nm、944nm、1020nm、1120nm、1137nm、1207nm、1273nm、1370nm、1380nm、1594nm、1654nm、 1678nm處的經(jīng)過(guò)預(yù)處理后的光譜反射值。
[00%] 所述驗(yàn)證的目的是確保所述定量模型準(zhǔn)確性和穩(wěn)定性。一般地,經(jīng)驗(yàn)證后若建立 的所述定量模型準(zhǔn)確、穩(wěn)定,則可用于檢測(cè)花生中蛋白質(zhì)含量分布;若建立的所述定量模型 準(zhǔn)確度和穩(wěn)定性不佳,則需要重新按照上述步驟建立所述回歸模型或所述定量模型。
[0027] 具體地,通過(guò)計(jì)算所述校正集的相關(guān)系數(shù)R。。郝驗(yàn)證集的相關(guān)系數(shù)RV。山及校正 集的標(biāo)準(zhǔn)偏差SEC和驗(yàn)證集的標(biāo)準(zhǔn)偏差沈P來(lái)判斷所述回歸模型和所述定量模型準(zhǔn)確度和 穩(wěn)定性。一般地,當(dāng)相關(guān)系數(shù)巧。。1或Rw) > 0. 8,標(biāo)準(zhǔn)偏差(SEC或SE巧《2時(shí),表明所述 回歸模型或所述定量模型準(zhǔn)確度高、穩(wěn)定性好。
[0028] 本發(fā)明采用下述公式(1)計(jì)算相關(guān)系數(shù)化。1或RyJ;公式似計(jì)算標(biāo)準(zhǔn)偏差(SEC 或SE巧。
[0030] 式(1)中,為第i個(gè)樣品高光譜方法預(yù)測(cè)值,玄是預(yù)測(cè)值的平均值;為第i個(gè) 樣品常規(guī)方法的測(cè)定值,歹是測(cè)定值的平均值;n為兩個(gè)變量的樣本值的個(gè)數(shù)。如果樣本為 校正集,則R為Real;如果樣本為驗(yàn)證集,則R為RW。
[0032]式(2)中,為校正集第i樣品高光譜方法的預(yù)測(cè)值,y1為校正集第i樣品常規(guī) 方法的測(cè)定值,n為校正集的樣品數(shù)。如果為驗(yàn)證集第i樣品高光譜方法的預(yù)測(cè)值,n為 驗(yàn)證集的樣品數(shù),則公式(2)表示的是SEP。
[0033] 本發(fā)明第二方面是提供上述定量模型在檢測(cè)花生中蛋白質(zhì)含量分布中的應(yīng)用。
[0034] 本發(fā)明第=方面是提供基于高光譜成像技術(shù)檢測(cè)花生中蛋白質(zhì)含量分布的方法, 所述方法包括:
[0035] 1)采集待測(cè)花生樣品在下列特征波長(zhǎng)處的光譜圖像:931nm、934nm、941nm、 944nm、1020nm、1120nm、1137nm、1207nm、1273nm、1370nm、1380nm、1594nm、1654nm、1678nm;
[0