一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法
【專利摘要】本發(fā)明提供了一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法,包括下列步驟:步驟①信息提??;步驟②變量篩選與優(yōu)化;步驟③建立判別模型;步驟④驗證模型;步驟⑤鑒別;上述方法應用于對酒曲中大曲的質(zhì)量鑒別。本發(fā)明利用454高通量測序技術(shù),解決了第一代測序技術(shù)不能全面準確反映大曲微生物的組成信息;通過偏最小二乘法對微生物變量進行篩選與優(yōu)化,同時結(jié)合二次判別分析構(gòu)建大曲質(zhì)量鑒別評價模型并應用于大曲質(zhì)量等級鑒別,構(gòu)建了一套適用于成品曲、出倉黃曲和出倉白曲等級鑒別的判別方法,具有操作使用簡單、判別準確率高等優(yōu)點。
【專利說明】一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及屬于大曲質(zhì)量鑒別的【技術(shù)領(lǐng)域】,具體涉及應用大曲微生物組成信息, 結(jié)合多元統(tǒng)計方法實現(xiàn)大曲質(zhì)量鑒別的方法。
【背景技術(shù)】
[0002] 大曲是白酒釀造不可或缺的一部分,起著①接種微生物;②產(chǎn)生酶系;③提供風 味物質(zhì)以及前體和④補充物料的作用。這前三種功能與大曲中的微生物群落區(qū)系結(jié)構(gòu)有極 大的關(guān)聯(lián)性,因此大曲微生物組成差異可以一定程度上反應其質(zhì)量。
[0003] 454高通量測序方法是近些年來發(fā)展的新一代DNA測序技術(shù),以其數(shù)字化信號、高 數(shù)據(jù)通量、高測序深度、高準確率等特點,可實現(xiàn)大規(guī)模多樣本的群落分析,廣泛應用于人 體和動物腸道菌群、海洋微生物菌群組成的比較分析中。部分研究結(jié)果發(fā)表在《Nature》、 《PNAS》、《GenomeRes》、《Gut》、《Gastroenterology》等國際頂尖雜志。
[0004] 多元統(tǒng)計方法是從經(jīng)典統(tǒng)計學中發(fā)展起來的一個分支,是一種綜合分析方法,它 能夠在多個對象和多個指標互相關(guān)聯(lián)的情況下分析它們的統(tǒng)計規(guī)律。其中,偏最小二乘法 是一種新型的多元統(tǒng)計數(shù)據(jù)分析方法,其變量投影重要性指標VIP值是反映自變量在解釋 因變量作用時的重要性,可以根據(jù)VIP大小篩選與優(yōu)化判別模型中自變量的數(shù)量。判別分 析是利用已知類別的樣本建立判別模型,為未知類別的樣本判別的一種多元統(tǒng)計方法?,F(xiàn) 有技術(shù)中利用454高通量測序技術(shù)和多元統(tǒng)計分析鑒別大曲質(zhì)量的方法尚未見報道。
[0005] 如在專利號為201310201060. 5、專利名稱為"一種構(gòu)建判別模型鑒別大曲質(zhì)量的 方法"的中國發(fā)明專利提供了一種應用固相微萃取和判別分析鑒別大曲質(zhì)量,該方法是通 過大曲風味物質(zhì)對大曲質(zhì)量進行評價,這種方法成本高而判準率相對于其成本而言實在讓 人難以接受。在專利號為200910228701. X、專利名稱為"一種醬香型白酒大曲生產(chǎn)的質(zhì)量 控制方法"的中國發(fā)明專利提供了一種應用大曲微生物的DGGE建立標準指紋圖譜,并將測 定所得圖譜與標準圖譜進行比對得到合格產(chǎn)品的方法,該方法中DGGE技術(shù)只能檢測到樣 品中十幾種優(yōu)勢菌;如果要獲悉具體的菌種信息,還需進行克隆、測序,實驗操作繁瑣;并 且采用這種方法不能反映微生物的豐度情況。另外,該方案中的圖譜比對只是簡單比對,對 于一些較為特別的情況判準率難以有效提高。
【發(fā)明內(nèi)容】
[0006] 為解決上述技術(shù)問題,本發(fā)明提供了一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法,該 鑒別大曲質(zhì)量的方法通過建立多元統(tǒng)計判別模型對大曲樣本進行比對分析,使得對大曲質(zhì) 量的判別可以低成本、高判準率的方式進行,并且操作簡單。
[0007] 本發(fā)明通過以下技術(shù)方案得以實現(xiàn)。
[0008] 本發(fā)明提供的一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法,包括下列步驟:
[0009] 步驟①信息提?。翰捎肈NA測序技術(shù)獲取大曲樣品的微生物組成信息;
[0010] 步驟②變量篩選與優(yōu)化:基于步驟①所得的微生物組成信息與樣品質(zhì)量等級,對 微生物變量指標進行篩選與優(yōu)化,獲取對樣品質(zhì)量分類貢獻大的變量指標;
[0011] 步驟③建立判別模型:基于步驟②所優(yōu)化的變量信息與樣品質(zhì)量等級,構(gòu)建大曲 質(zhì)量等級鑒別的判別模型,確定判別準則;
[0012] 步驟④驗證模型:對建模樣品進行回判,以驗證判別效果;
[0013] 步驟⑤鑒別:使用判別模型對測試樣品進行判別;
[0014] 上述方法應用于對酒曲中大曲的質(zhì)量鑒別。
[0015] 步驟①中所述DNA測序技術(shù)為454高通量測序技術(shù)。
[0016] 步驟②中所述對微生物變量指標進行篩選與優(yōu)化采用偏最小二乘法。
[0017] 步驟③中所述判別模型的構(gòu)建采用貝葉斯分類。
[0018] 所述判別模型的構(gòu)建具體使用二次判別分析法。
[0019] 所述步驟①中大曲樣品為高溫大曲,即成品曲、出倉黃曲、出倉白曲的任一種。
[0020] 步驟②中所述對微生物變量指標進行篩選與優(yōu)化的原則為變量投影重要性指標 值彡1,
[0021] 步驟②中所述變量篩選通過SIMCA-P軟件實現(xiàn)。
[0022] 步驟③中所述判別模型由R語言構(gòu)建。
[0023] 本發(fā)明的有益效果在于:
[0024] (1)利用454高通量測序技術(shù),解決了第一代測序技術(shù)不能全面準確反映大曲微 生物的組成信息。
[0025] (2)通過偏最小二乘法對微生物變量進行篩選與優(yōu)化,同時結(jié)合二次判別分析構(gòu) 建大曲質(zhì)量鑒別評價模型并應用于大曲質(zhì)量等級鑒別,構(gòu)建了一套適用于成品曲、出倉黃 曲和出倉白曲等級鑒別的判別方法,具有操作使用簡單、判別準確率高等優(yōu)點。
【專利附圖】
【附圖說明】
[0026] 圖1為實驗例中變量投影重要性指標(VIP)值彡1的變量圖示。
【具體實施方式】
[0027] 下面進一步描述本發(fā)明的技術(shù)方案,但要求保護的范圍并不局限于所述。
[0028] 本發(fā)明提供的一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法,包括下列步驟:
[0029] 步驟①信息提?。翰捎肈NA測序技術(shù)獲取大曲樣品的微生物組成信息;
[0030] 步驟②變量篩選與優(yōu)化:基于步驟①所得的微生物組成信息與樣品質(zhì)量等級,對 微生物變量指標進行篩選與優(yōu)化,獲取對樣品質(zhì)量分類貢獻大的變量指標;
[0031] 步驟③建立判別模型:基于步驟②所優(yōu)化的變量信息與樣品質(zhì)量等級,構(gòu)建大曲 質(zhì)量等級鑒別的判別模型,確定判別準則;
[0032] 步驟④驗證模型:對建模樣品進行回判,以驗證判別效果;
[0033] 步驟⑤鑒別:使用判別模型對測試樣品進行判別;
[0034] 上述方法應用于對酒曲中大曲的質(zhì)量鑒別。
[0035] 步驟①中所述DNA測序技術(shù)為454高通量測序技術(shù)。
[0036] 步驟②中所述對微生物變量指標進行篩選與優(yōu)化采用偏最小二乘法。
[0037] 步驟③中所述判別模型的構(gòu)建采用貝葉斯分類。
[0038] 所述判別模型的構(gòu)建具體使用二次判別分析法。
[0039] 所述步驟①中大曲樣品為高溫大曲,即成品曲、出倉黃曲、出倉白曲的任一種。
[0040] 步驟②中所述對微生物變量指標進行篩選與優(yōu)化的原則為變量投影重要性指標 VIP值彡1,
[0041] 步驟②中所述變量篩選通過SIMCA-P軟件實現(xiàn)。
[0042] 步驟③中所述判別模型由R語言構(gòu)建。
[0043] 實驗例1
[0044] 1.樣品信息
[0045] 本實施例中的樣品來源于貴州茅臺酒股份有限公司提供的113個高溫大曲,其中 樣品包括:
[0046] 建模樣品:成品曲37個、出倉黃曲21個、出倉白曲20個;
[0047] 測試樣品:成品曲20個、出倉黃曲8個、出倉白曲7個。
[0048] 2.信息提取
[0049] 利用454高通量測序技術(shù),對所有樣品進行測序分析,共獲得580類微生物種類 (微生物編號為xl,x2, x3,…,x580)與相對含量。
[0050] 3.變量篩選與優(yōu)化
[0051] 將變量與樣品信息輸入SIMCA-P軟件,利用偏最小二乘法,對獲得的微生物變量 進行篩選與優(yōu)化,根據(jù)變量投影重要性指標(VIP)值> 1的原則,如圖1所示,共得到14類 微生物變量。
[0052] 4.建立判別模型
[0053] 通過R語言,采用二次判別分析方法,以上述14類微生物數(shù)據(jù)為自變量,以3種高 溫大曲的判斷為因變量,進行二次判別分析,構(gòu)建大曲質(zhì)量等級的判別模型。
[0054] 5.驗證模型
[0055] 首先利用交叉驗證對建模樣品進行回判,以驗證判別效果,結(jié)果見表1。
[0056] 表1建模樣品交叉驗證結(jié)果
[0057]
【權(quán)利要求】
1. 一種構(gòu)建判別模型鑒別大曲質(zhì)量的方法,其特征在于:包括下列步驟: 步驟①信息提?。翰捎肈NA測序技術(shù)獲取大曲樣品的微生物組成信息; 步驟②變量篩選與優(yōu)化:基于步驟①所得的微生物組成信息與樣品質(zhì)量等級,對微生 物變量指標進行篩選與優(yōu)化,獲取對樣品質(zhì)量分類貢獻大的變量指標; 步驟③建立判別模型:基于步驟②所優(yōu)化的變量信息與樣品質(zhì)量等級,構(gòu)建大曲質(zhì)量 等級鑒別的判別模型,確定判別準則; 步驟④驗證模型:對建模樣品進行回判,以驗證判別效果; 步驟⑤鑒別:使用判別模型對測試樣品進行判別; 上述方法應用于對酒曲中大曲的質(zhì)量鑒別。
2. 如權(quán)利要求1所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟①中所述DNA測序技 術(shù)為454高通量測序技術(shù)。
3. 如權(quán)利要求1所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟②中所述對微生物變 量指標進行篩選與優(yōu)化采用偏最小二乘法。
4. 如權(quán)利要求1所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟③中所述判別模型的 構(gòu)建采用貝葉斯分類。
5. 如權(quán)利要求4所述的鑒別大曲質(zhì)量的方法,其特征在于:所述判別模型的構(gòu)建具體 使用二次判別分析法。
6. 如權(quán)利要求1所述的鑒別大曲質(zhì)量的方法,其特征在于:所述步驟①中大曲樣品為 高溫大曲,即成品曲、出倉黃曲、出倉白曲的任一種。
7. 如權(quán)利要求1或3中任意一項所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟②中 所述對微生物變量指標進行篩選與優(yōu)化的原則為變量投影重要性指標(VIP)值> 1。
8. 如權(quán)利要求7所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟②中所述變量篩選通 過SIMCA-P軟件實現(xiàn)。
9. 如權(quán)利要求1、4或5中任意一項所述的鑒別大曲質(zhì)量的方法,其特征在于:步驟③ 中所述判別模型由R語言構(gòu)建。
【文檔編號】C12Q1/68GK104372075SQ201410419220
【公開日】2015年2月25日 申請日期:2014年8月22日 優(yōu)先權(quán)日:2014年8月22日
【發(fā)明者】王莉, 楊帆, 韓瑩, 劉華, 陳良強, 王和玉, 汪地強, 金桃, 徐進 申請人:貴州茅臺酒股份有限公司