本發(fā)明涉及模式識別與光譜分析領(lǐng)域,具體涉及食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法及系統(tǒng)。
背景技術(shù):
口感和風味是人類對食物的一種高級體驗??诟惺侵甘澄镌谌藗兛谇粌?nèi),由觸覺和咀嚼而產(chǎn)生的直接感受,是獨立于味覺之外的另一種體驗。而風味是人們品嘗食物的味覺和嗅覺感受。對于食物的主觀評價,需要將口感和風味聯(lián)合在一起建立評價體系。以往由于食物口感和風味的主觀評價與客觀數(shù)據(jù)沒有建立關(guān)聯(lián),對于食物的感受依賴描述性語言,尚無可量化的主觀評價指標。
技術(shù)實現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題是:為了解決食物口感和風味的主觀評價缺乏可量化的主觀評價問題,本發(fā)明利用光譜數(shù)據(jù)的分子特征信息,提出了食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法及系統(tǒng)。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法,包括以下步驟:
獲取某種食物的光譜數(shù)據(jù)di,獲取主觀評價參評人信息,建立對應(yīng)食物口感和風味的主觀評價標簽;
大量采集不同食物的光譜數(shù)據(jù)di和主觀評價參評人信息,并建立對應(yīng)食物口感和風味的主觀評價標簽,進行機器學(xué)習(xí)算法建模,在已知食物光譜數(shù)據(jù)和主觀評價參評人信息的情況下,預(yù)測主觀評價標簽結(jié)果。
所述光譜數(shù)據(jù)di,為每組食物的紅外光譜反射率導(dǎo)數(shù)數(shù)據(jù),其中i=1,2,…,n,為采樣點個數(shù);使用余弦距離表示光譜數(shù)據(jù)向量之間的差異,將異常數(shù)據(jù)剔除;導(dǎo)數(shù)計算使用直接差分方法,利用光譜數(shù)據(jù)逐點相減得到:
其中,r是每組食物的紅外光譜原始反射率,i=1,2,…,n,為采樣點個數(shù),λ是采樣時的光譜波長,δλ是波長采樣的最小間隔。
所述主觀評價參評人信息按照信息量轉(zhuǎn)化為數(shù)值:
性別xa:男,女,數(shù)值為1,2,默認值0;
年齡xb:按照填寫的數(shù)值,1,2……,不設(shè)上限,默認值0;
籍貫xc:中國共有34個省,數(shù)值為1,2,…34,后續(xù)如果新增其他國家省份,依次順延,默認值為0;
民族xd:中國共有56個民族,數(shù)值為1,2,…56,后續(xù)如果新增其他民族,依次順延,默認值為0。
所述對應(yīng)食物口感和風味的主觀評價標簽,包括,食物口感的兩個基本方面——冷熱程度和軟硬程度,以及食物風味的兩類信息——味覺和嗅覺。
將對食物口感的主觀評價由描述性語言轉(zhuǎn)化為可量化的指標,按照食物口感的兩個方面,食物冷熱程度和軟硬程度,進行指標分解,由參評人分別進行評分:
食物冷熱程度α,5分制,從低到高對應(yīng)為冰、涼、溫、熱、燙五個區(qū)域;
食物軟硬程度β,10分制,從低到高對應(yīng)為稀、稠、軟、糯、嫩、滑、彈牙、酥、脆、硬十個區(qū)域;
建立食物口感分類標簽yi=(α,β),一一對應(yīng)冷熱和軟硬程度各區(qū)域;
將對食物風味的主觀評價由描述性語言轉(zhuǎn)化為可量化的指標,按照食物風味的兩類信息,對食物的味覺和嗅覺,進行指標分解,由參評人分別進行評分:
對食物的味覺δ,進行酸、甜、苦、辣、咸5項打分,每項5分制,共計25種情況;
對食物的嗅覺ε,10分制,從低到高對應(yīng)為臭、無味、香十個等級情況;
建立食物風味分類標簽yii=(δ,ε),一一對應(yīng)味覺和嗅覺各種情況。
所述機器學(xué)習(xí)算法建模,對于每種食物口感和風味的主觀評價標簽y=(yi,yii)=(α,β,δ,ε),對應(yīng)參評人信息和光譜數(shù)據(jù)x=(xa,xb,xc,xd,d1,d2,…,dn),樣本集t=(x1,y1),(x2,y2),…,(xm,ym),其中,xm代表第m個樣本,ym表示第m個樣本的類別,m是樣本個數(shù);建立不同主觀評價標簽和輸入數(shù)據(jù)之間的分類準則,算法選用近鄰法或svm(支持向量機);
所述近鄰法,生成各類別之間的判據(jù)k,對于待測數(shù)據(jù),與已知類別的數(shù)據(jù)逐一計算距離,根據(jù)統(tǒng)一的距離判別準則找到和已知樣本最接近k個的數(shù)據(jù),并且以這個該已知數(shù)據(jù)的類別作為待測數(shù)據(jù)的類別;
具體表述為:樣本集t=(x1,y1),(x2,y2),…,(xm,ym),xi代表第i個樣本,yi表示第i個樣本的類別,m個樣本向量x1~xm協(xié)方差矩陣記為s,判斷準則函數(shù)使用馬氏距離判別,其中樣本xi到xj的馬氏距離δ(xi,xj)為,
在分類中,選擇前k個最近的樣本,對這k個樣本所屬的類別進行投票,得票率最多的類別是待測樣品的類別,其中k的選取根據(jù)訓(xùn)練樣本不斷優(yōu)化得到,k取2~5;knn(近鄰法)比較好的地方是,它可以把我們之前計算的距離判據(jù)演化成一種相似度依據(jù),對以后我們衡量不同樹種之間的相似度有一個直觀的認識。另外當我們的樣本數(shù)量足夠多的時候,knn的結(jié)果是結(jié)果就更加準確。算法時間復(fù)雜度為o(n),無需訓(xùn)練,簡單有效,在樣本很多的情況下,可以保證較高的準確度。
所述svm算法,本身是一個兩類問題的判別方法,但本發(fā)明數(shù)據(jù)分類中是一個多類問題。因此,選用“一對一”方法,對于n類樣本,兩兩類別訓(xùn)練一個兩類分類器,共訓(xùn)練n*(n-1)/2個分類器,對測試樣本逐一進行測試并進行投票,得票最多的類別即為其類別標簽;
對于兩類分類的問題,svm分類的思想是找到這個使得兩類別樣本間隔最大的超平面,此時,訓(xùn)練數(shù)據(jù)為(x1,y1),(x2,y2),…,(xm,ym),y∈{+1,-1};求取最大間隔的問題就是一個尋優(yōu)的問題,最優(yōu)分類面的方程:
wx+b=0
其中w和b未知,轉(zhuǎn)換后的待求解的最優(yōu)化問題:
使得滿足yi[(wxi)+b]-1≥0(i=1,2,…,m)
m為樣本個數(shù),求解得w和b,即得到最優(yōu)分類面;
對于一些在低維空間中線性不可分的情況,通過核函數(shù)將其映射到高維空間中使其變?yōu)榫€性可分的問題;常用的核函數(shù)k(x,xi)有多項式內(nèi)積核函數(shù)、徑向基核函數(shù)(rbf)和sigmoid內(nèi)積核函數(shù):(k(x,xi)表示核函數(shù))
多項式內(nèi)積核函數(shù):
徑向基核函數(shù):
sigmoid內(nèi)積核函數(shù):
本發(fā)明選用libsvm軟件包進行svm核函數(shù)參數(shù)求取,使用的步驟是:
1)按照libsvm軟件包所要求的格式準備數(shù)據(jù)集;
2)對數(shù)據(jù)進行簡單的縮放操作;
3)考慮選用rbf核函數(shù);
4)采用交叉驗證選擇最佳參數(shù)c與g;
5)采用最佳參數(shù)c與g對整個訓(xùn)練集進行訓(xùn)練獲取支持向量機模型;
6)利用獲取的模型進行測試與預(yù)測。
一種食物口感和風味的主觀評價及光譜數(shù)據(jù)建模系統(tǒng),包括:主觀評價參評人信息收集模塊,光譜采集模塊,主觀評價標簽輸入模塊,數(shù)據(jù)存儲模塊,數(shù)據(jù)處理模塊,以及主觀評價標簽預(yù)測輸出模塊;
所述主觀評價參評人信息收集模塊,用于收集參評人信息,包括性別xa,年齡xb,籍貫xc和民族xd;可以通過各種終端,包括手機app軟件、電腦軟件、智能手環(huán)等多種終端獲取。
所述光譜采集模塊,用于獲取食物的紅外光譜反射率導(dǎo)數(shù)數(shù)據(jù),通過光譜傳感器,以及特定光源環(huán)境,收集食物的反射光譜,得到對應(yīng)波長的原始反射率,再通過插分法計算得到導(dǎo)數(shù)數(shù)據(jù);
所述主觀評價標簽輸入模塊,用于獲取參評人對該種食物口感和風味的評價量化信息,包括食物冷熱、軟硬程度,以及食物的味覺和嗅覺評分;
所述數(shù)據(jù)存儲模塊,用于存儲訓(xùn)練集數(shù)據(jù),以及算法模型參數(shù),可以采用本地存儲空間或者云端存儲空間;
所述數(shù)據(jù)處理模塊,用于使用算法模型判據(jù),對新的參評人和光譜數(shù)據(jù),預(yù)測主觀評價標簽;
所述主觀評價標簽預(yù)測輸出模塊,用于顯示主觀評價標簽,并將經(jīng)過參評人修訂的主觀評價標簽及對應(yīng)參評人信息和光譜數(shù)據(jù)輸出至數(shù)據(jù)存儲模塊,作為訓(xùn)練集數(shù)據(jù)存儲,實現(xiàn)數(shù)據(jù)模型的積累。
本發(fā)明的目的就是通過將本征食物特征的光譜數(shù)據(jù)與食物口感和風味建立數(shù)據(jù)模型,實現(xiàn)科學(xué)可量化的食物口感和品味評價體系。
口感一般包括食物的冷熱程度和軟硬程度兩個基本方面:描述食物冷熱程度的詞語如溫涼熱燙等;描述食物軟硬程度的詞語如軟糯酥滑脆嫩等。風味所包含的味覺和嗅覺體驗,一般包括五味——酸、甜、苦、辣、咸,以及無味、香、臭。針對口感的兩個基本方面和風味的兩類信息,光譜數(shù)據(jù)包含了其中的關(guān)鍵信息——物質(zhì)的分子特征。食物冷熱程度,在微觀上是分子熱運動的劇烈程度;而食物軟硬程度,是分子的結(jié)構(gòu)信息。食物的味覺和嗅覺則是各類分子組成和含量的體現(xiàn)。光譜能夠表征物質(zhì)表面的分子特征,當入射光與物質(zhì)表面分子發(fā)生作用后,反射光的光譜中就包含了物質(zhì)的分子特征信息,可以進行數(shù)據(jù)建模。依靠采集的客觀數(shù)據(jù),當收集大量的光譜數(shù)據(jù)信息后,結(jié)合與之關(guān)聯(lián)的主觀評價,利用機器學(xué)習(xí)的方法實現(xiàn)數(shù)據(jù)的預(yù)測。光譜分析結(jié)合主觀評價,將大大發(fā)揮光譜數(shù)據(jù)的應(yīng)用潛力。
本發(fā)明的有益效果是,本發(fā)明的食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法及系統(tǒng),與現(xiàn)有技術(shù)相比,本發(fā)明食物口感和風味主觀評價指標可量化;因其與本征食物分子特征的光譜數(shù)據(jù)進行建模,可以進行口感和風味的預(yù)測;對于食物的分析,獲取光譜數(shù)據(jù)及分析過程,快速、無損;隨著數(shù)據(jù)增多,模型分類準確率可以提升;可以對于特定人群,對食物進行推薦和建議。
附圖說明
下面結(jié)合附圖和實施例對本發(fā)明進一步說明。
圖1是本發(fā)明的一種食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法的流程圖。
具體實施方式
現(xiàn)在結(jié)合附圖對本發(fā)明作進一步詳細的說明。
如圖1所示,本發(fā)明的一種食物口感和風味的主觀評價及光譜數(shù)據(jù)建模方法,包括以下步驟:
獲取某種食物的光譜數(shù)據(jù)di,獲取主觀評價參評人信息,建立對應(yīng)食物口感和風味的主觀評價標簽;
大量采集不同食物的光譜數(shù)據(jù)di和主觀評價參評人信息,并建立對應(yīng)食物口感和風味的主觀評價標簽,進行機器學(xué)習(xí)算法建模,在已知食物光譜數(shù)據(jù)和主觀評價參評人信息的情況下,預(yù)測主觀評價標簽結(jié)果。
所述光譜數(shù)據(jù)di,為每組食物的紅外光譜反射率導(dǎo)數(shù)數(shù)據(jù),其中i=1,2,…,n,為采樣點個數(shù);使用余弦距離表示光譜數(shù)據(jù)向量之間的差異,將異常數(shù)據(jù)剔除;導(dǎo)數(shù)計算使用直接差分方法,利用光譜數(shù)據(jù)逐點相減得到:
其中,r是每組食物的紅外光譜原始反射率,i=1,2,…,n,為采樣點個數(shù),λ是采樣時的光譜波長,δλ是波長采樣的最小間隔。
所述主觀評價參評人信息按照信息量轉(zhuǎn)化為數(shù)值:
性別xa:男,女,數(shù)值為1,2,默認值0;
年齡xb:按照填寫的數(shù)值,1,2……,不設(shè)上限,默認值0;
籍貫xc:中國共有34個省,數(shù)值為1,2,…34,后續(xù)如果新增其他國家省份,依次順延,默認值為0;
民族xd:中國共有56個民族,數(shù)值為1,2,…56,后續(xù)如果新增其他民族,依次順延,默認值為0。
所述對應(yīng)食物口感和風味的主觀評價標簽,包括,食物口感的兩個基本方面——冷熱程度和軟硬程度,以及食物風味的兩類信息——味覺和嗅覺。
將對食物口感的主觀評價由描述性語言轉(zhuǎn)化為可量化的指標,按照食物口感的兩個方面,食物冷熱程度和軟硬程度,進行指標分解,由參評人分別進行評分:
食物冷熱程度α,5分制,從低到高對應(yīng)為冰、涼、溫、熱、燙五個區(qū)域;
食物軟硬程度β,10分制,從低到高對應(yīng)為稀、稠、軟、糯、嫩、滑、彈牙、酥、脆、硬十個區(qū)域;
建立食物口感分類標簽yi=(α,β),一一對應(yīng)冷熱和軟硬程度各區(qū)域;
將對食物風味的主觀評價由描述性語言轉(zhuǎn)化為可量化的指標,按照食物風味的兩類信息,對食物的味覺和嗅覺,進行指標分解,由參評人分別進行評分:
對食物的味覺δ,進行酸、甜、苦、辣、咸5項打分,每項5分制,共計25種情況;
對食物的嗅覺ε,10分制,從低到高對應(yīng)為臭、無味、香十個等級情況;
建立食物風味分類標簽yii=(δ,ε),一一對應(yīng)味覺和嗅覺各種情況。
所述機器學(xué)習(xí)算法建模,對于每種食物口感和風味的主觀評價標簽y=(yi,yii)=(α,β,δ,ε),對應(yīng)參評人信息和光譜數(shù)據(jù)x=(xa,xb,xc,xd,d1,d2,…,dn),樣本集t=(x1,y1),(x2,y2),…,(xm,ym),其中,xm代表第m個樣本,ym表示第m個樣本的類別,m是樣本個數(shù);建立不同主觀評價標簽和輸入數(shù)據(jù)之間的分類準則,算法選用近鄰法或svm(支持向量機);
所述近鄰法,生成各類別之間的判據(jù)k,對于待測數(shù)據(jù),與已知類別的數(shù)據(jù)逐一計算距離,根據(jù)統(tǒng)一的距離判別準則找到和已知樣本最接近k個的數(shù)據(jù),并且以這個該已知數(shù)據(jù)的類別作為待測數(shù)據(jù)的類別;
具體表述為:樣本集t=(x1,y1),(x2,y2),…,(xm,ym),xi代表第i個樣本,yi表示第i個樣本的類別,m個樣本向量x1~xm協(xié)方差矩陣記為s,判斷準則函數(shù)使用馬氏距離判別,其中樣本xi到xj的馬氏距離δ(xi,xj)為,
在分類中,選擇前k個最近的樣本,對這k個樣本所屬的類別進行投票,得票率最多的類別是待測樣品的類別,其中k的選取根據(jù)訓(xùn)練樣本不斷優(yōu)化得到,k取2~5;knn(近鄰法)比較好的地方是,它可以把我們之前計算的距離判據(jù)演化成一種相似度依據(jù),對以后我們衡量不同樹種之間的相似度有一個直觀的認識。另外當我們的樣本數(shù)量足夠多的時候,knn的結(jié)果是結(jié)果就更加準確。算法時間復(fù)雜度為o(n),無需訓(xùn)練,簡單有效,在樣本很多的情況下,可以保證較高的準確度。
所述svm算法,本身是一個兩類問題的判別方法,但本發(fā)明數(shù)據(jù)分類中是一個多類問題。因此,選用“一對一”方法,對于n類樣本,兩兩類別訓(xùn)練一個兩類分類器,共訓(xùn)練n*(n-1)/2個分類器,對測試樣本逐一進行測試并進行投票,得票最多的類別即為其類別標簽;
對于兩類分類的問題,svm分類的思想是找到這個使得兩類別樣本間隔最大的超平面,此時,訓(xùn)練數(shù)據(jù)為(x1,y1),(x2,y2),…,(xm,ym),y∈{+1,-1};求取最大間隔的問題就是一個尋優(yōu)的問題,最優(yōu)分類面的方程:
wx+b=0
其中w和b未知,轉(zhuǎn)換后的待求解的最優(yōu)化問題:
使得滿足yi[(wxi)+b]-1≥0(i=1,2,…,m)
m為樣本個數(shù),求解得w和b,即得到最優(yōu)分類面;
對于一些在低維空間中線性不可分的情況,通過核函數(shù)將其映射到高維空間中使其變?yōu)榫€性可分的問題;常用的核函數(shù)k(x,xi)有多項式內(nèi)積核函數(shù)、徑向基核函數(shù)(rbf)和sigmoid內(nèi)積核函數(shù):(k(x,xi)表示核函數(shù))
多項式內(nèi)積核函數(shù):
徑向基核函數(shù):
sigmoid內(nèi)積核函數(shù):
本發(fā)明選用libsvm軟件包進行svm核函數(shù)參數(shù)求取,使用的步驟是:
1)按照libsvm軟件包所要求的格式準備數(shù)據(jù)集;
2)對數(shù)據(jù)進行簡單的縮放操作;
3)考慮選用rbf核函數(shù);
4)采用交叉驗證選擇最佳參數(shù)c與g;
5)采用最佳參數(shù)c與g對整個訓(xùn)練集進行訓(xùn)練獲取支持向量機模型;
6)利用獲取的模型進行測試與預(yù)測。
一種食物口感和風味的主觀評價及光譜數(shù)據(jù)建模系統(tǒng),包括:主觀評價參評人信息收集模塊,光譜采集模塊,主觀評價標簽輸入模塊,數(shù)據(jù)存儲模塊,數(shù)據(jù)處理模塊,以及主觀評價標簽預(yù)測輸出模塊;
所述主觀評價參評人信息收集模塊,用于收集參評人信息,包括性別xa,年齡xb,籍貫xc和民族xd;可以通過各種終端,包括手機app軟件、電腦軟件、智能手環(huán)等多種終端獲取。
所述光譜采集模塊,用于獲取食物的紅外光譜反射率導(dǎo)數(shù)數(shù)據(jù),通過光譜傳感器,以及特定光源環(huán)境,收集食物的反射光譜,得到對應(yīng)波長的原始反射率,再通過插分法計算得到導(dǎo)數(shù)數(shù)據(jù);
所述主觀評價標簽輸入模塊,用于獲取參評人對該種食物口感和風味的評價量化信息,包括食物冷熱、軟硬程度,以及食物的味覺和嗅覺評分;
所述數(shù)據(jù)存儲模塊,用于存儲訓(xùn)練集數(shù)據(jù),以及算法模型參數(shù),可以采用本地存儲空間或者云端存儲空間;
所述數(shù)據(jù)處理模塊,用于使用算法模型判據(jù),對新的參評人和光譜數(shù)據(jù),預(yù)測主觀評價標簽;
所述主觀評價標簽預(yù)測輸出模塊,用于顯示主觀評價標簽,并將經(jīng)過參評人修訂的主觀評價標簽及對應(yīng)參評人信息和光譜數(shù)據(jù)輸出至數(shù)據(jù)存儲模塊,作為訓(xùn)練集數(shù)據(jù)存儲,實現(xiàn)數(shù)據(jù)模型的積累。
本發(fā)明的具體實施方式中,主觀評價參評人信息可以通過手機app用戶端獲取;光譜采集模塊采用濱松fpi器件實現(xiàn),配合藍牙通訊,將光譜數(shù)據(jù)傳輸至手機app;數(shù)據(jù)存儲模塊及數(shù)據(jù)處理在云服務(wù)器端,數(shù)據(jù)建模使用libsvm求得建模參數(shù),云服務(wù)后臺進行數(shù)據(jù)建模,手機app具有主觀評價標簽輸入、顯示和修訂的功能,實現(xiàn)主觀評價數(shù)據(jù)的持續(xù)更新和積累。
與現(xiàn)有技術(shù)相比,本發(fā)明食物口感和風味主觀評價指標可量化;因其與本征食物分子特征的光譜數(shù)據(jù)進行建模,可以進行口感和風味的預(yù)測;對于食物的分析,獲取光譜數(shù)據(jù)及分析過程,快速、無損;隨著數(shù)據(jù)增多,模型分類準確率可以提升;可以對于特定人群,對食物進行推薦和建議。
以上述依據(jù)本發(fā)明的理想實施例為啟示,通過上述的說明內(nèi)容,相關(guān)工作人員完全可以在不偏離本項發(fā)明技術(shù)思想的范圍內(nèi),進行多樣的變更以及修改。本項發(fā)明的技術(shù)性范圍并不局限于說明書上的內(nèi)容,必須要根據(jù)權(quán)利要求范圍來確定其技術(shù)性范圍。