本發(fā)明涉及沙棘全成分提取,更具體地說,本發(fā)明涉及一種沙棘全成分提取過程智能優(yōu)化方法及系統(tǒng)。
背景技術(shù):
1、目前沙棘提取主要采用超臨界co2萃取、溶劑提取和水提等方法,存在提取效率低、能耗高、溶劑殘留等問題。此外,不同品種產(chǎn)地的沙棘原料性狀差異大,固定的提取工藝難以適應(yīng)多變的原料,導(dǎo)致提取率和產(chǎn)品質(zhì)量不穩(wěn)定。因此,亟需開發(fā)一種智能化的沙棘全成分提取優(yōu)化方法,能夠根據(jù)原料特性和目標(biāo)產(chǎn)品動(dòng)態(tài)調(diào)整工藝參數(shù),實(shí)現(xiàn)提取過程的自動(dòng)優(yōu)化控制。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明提供一種沙棘全成分提取過程智能優(yōu)化方法及系統(tǒng)。本發(fā)明的沙棘全成分提取智能優(yōu)化方法通過全面收集提取過程關(guān)鍵特征,構(gòu)建新特征如壓力溫度比、溶劑極性指數(shù)等,并進(jìn)行數(shù)據(jù)預(yù)處理,解決了原始數(shù)據(jù)不完整、質(zhì)量差等問題。引入異質(zhì)圖和圖神經(jīng)網(wǎng)絡(luò)對(duì)沙棘品種、產(chǎn)地間的關(guān)聯(lián)性進(jìn)行建模,克服了現(xiàn)有方法忽視原料差異性的不足。構(gòu)建沙棘全成分提取預(yù)測(cè)模型實(shí)現(xiàn)提取產(chǎn)品類型和提取率的精準(zhǔn)預(yù)測(cè),并基于偏差反饋實(shí)時(shí)優(yōu)化調(diào)整提取工藝參數(shù),較傳統(tǒng)方法大大提高了生產(chǎn)效率和質(zhì)量穩(wěn)定性,具有顯著的技術(shù)和經(jīng)濟(jì)效益。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種沙棘全成分提取過程智能優(yōu)化方法,包括:
4、s10:獲取沙棘全成分提取工藝過程的特征集,所述特征集包括連續(xù)型特征和離散型特征;
5、s20:構(gòu)建沙棘全成分提取工藝過程的新特征,所述新特征包括壓力溫度比、溶劑的極性指數(shù)和體積表面積比;
6、s30:對(duì)沙棘全成分提取工藝過程的特征集和新特征進(jìn)行預(yù)處理;
7、s40:對(duì)沙棘品種、產(chǎn)地、品種間的相似性和品種-產(chǎn)地間的關(guān)聯(lián)性進(jìn)行編碼;
8、s50:構(gòu)建特征矩陣,基于特征矩陣和沙棘全成分提取預(yù)測(cè)模型,預(yù)測(cè)提取產(chǎn)品類型和提取率;
9、s60:基于預(yù)測(cè)的提取產(chǎn)品類型和提取率動(dòng)態(tài)優(yōu)化沙棘全成分提取工藝流程。
10、進(jìn)一步地,所述對(duì)沙棘全成分提取工藝過程的特征集和新特征進(jìn)行預(yù)處理的過程包括:異常值處理、標(biāo)準(zhǔn)化處理和類別編碼;所述異常值處理的方法包含加權(quán)異常值處理方法;所述標(biāo)準(zhǔn)化處理的方法包含自適應(yīng)標(biāo)準(zhǔn)化處理方法;
11、所述加權(quán)異常值處理方法包括:計(jì)算特征向量中樣本的加權(quán)歐氏距離,計(jì)算所有樣本加權(quán)歐氏距離的均值和標(biāo)準(zhǔn)差,判斷和處理異常值;
12、所述計(jì)算特征向量中樣本的加權(quán)歐氏距離方法包括:
13、
14、其中,為第i個(gè)樣本的加權(quán)歐氏距離,x為連續(xù)型特征的特征向量,n為樣本數(shù),p為特征數(shù),為第i個(gè)樣本的第k個(gè)特征值,為第j個(gè)樣本的第k個(gè)特征值,為樣本的權(quán)重。
15、進(jìn)一步地,所述判斷和處理異常值的方法包括:
16、
17、其中,為樣本加權(quán)歐氏距離的均值,為樣本加權(quán)歐氏距離的標(biāo)準(zhǔn)差,為第i個(gè)樣本的加權(quán)歐氏距離,z為z-score值;設(shè)置為異常閾值;
18、若,則為異常值,檢測(cè)出異常值后將其剔除或用其他樣本的平均值替代;
19、所述自適應(yīng)標(biāo)準(zhǔn)化處理方法包括:
20、
21、
22、其中,為自適應(yīng)參數(shù),為第i個(gè)樣本的第k個(gè)特征值,為第i個(gè)樣本的第k個(gè)特征標(biāo)準(zhǔn)化后的值,為第k個(gè)特征的均值,為第k個(gè)特征的標(biāo)準(zhǔn)差。
23、進(jìn)一步地,所述對(duì)沙棘品種、產(chǎn)地、品種間的相似性和品種-產(chǎn)地間的關(guān)聯(lián)性進(jìn)行編碼的方法包括:構(gòu)建沙棘品種-產(chǎn)地異質(zhì)圖,使用圖神經(jīng)網(wǎng)絡(luò)算法學(xué)習(xí)品種和產(chǎn)地節(jié)點(diǎn)的嵌入表示,得到最終的品種-產(chǎn)地表示;
24、所述構(gòu)建沙棘品種-產(chǎn)地異質(zhì)圖的方法包括:獲取品種-品種相似度邊信息和獲取品種-產(chǎn)地關(guān)聯(lián)邊信息;
25、所述獲取品種-品種相似度邊信息的方法包括:獲取不同沙棘品種的基因組信息,根據(jù)基因組信息計(jì)算不同沙棘品種之間的遺傳距離,基于遺傳距離獲得品種之間的相似度。
26、進(jìn)一步地,所述獲取品種-產(chǎn)地關(guān)聯(lián)邊信息的方法包括:統(tǒng)計(jì)每個(gè)沙棘品種在不同產(chǎn)地的種植面積占比,構(gòu)建一個(gè)的矩陣a,其中為品種數(shù)量,q為產(chǎn)地?cái)?shù)量,表示第個(gè)品種在第個(gè)產(chǎn)地的種植面積占比;
27、所述計(jì)算不同沙棘品種之間的遺傳距離的方法包括:
28、假設(shè)有個(gè)沙棘品種,每個(gè)品種的基因組用一個(gè)長(zhǎng)度為s的二進(jìn)制向量表示,記為,其中,;表示品種在第r個(gè)基因位點(diǎn)上有變異,表示無(wú)變異,品種和品種之間的遺傳距離用以下公式來度量:
29、
30、其中表示兩個(gè)沙棘品種在變異位點(diǎn)上的交集數(shù)量,表示兩個(gè)沙棘品種在變異位點(diǎn)上的并集數(shù)量;
31、所述基于遺傳距離獲得品種之間的相似度的方法包括:
32、
33、其中,為品種和品種之間的相似度,為高斯核的帶寬參數(shù),為指數(shù)函數(shù)。
34、進(jìn)一步地,所述基于預(yù)測(cè)的提取產(chǎn)品類型和提取率動(dòng)態(tài)優(yōu)化沙棘全成分提取工藝流程的方法包括:將預(yù)測(cè)提取產(chǎn)品類型和提取率與目標(biāo)提取產(chǎn)品類型和提取率進(jìn)行比較,計(jì)算偏差,獲得產(chǎn)品類型預(yù)測(cè)偏差向量和提取率預(yù)測(cè)偏差;基于產(chǎn)品類型預(yù)測(cè)偏差向量和提取率預(yù)測(cè)偏差,計(jì)算工藝參數(shù)的調(diào)控量;對(duì)工藝參數(shù)的調(diào)控量進(jìn)行解耦計(jì)算,得到工藝參數(shù)調(diào)整量,將計(jì)算得到的工藝參數(shù)調(diào)整量應(yīng)用于實(shí)際生產(chǎn)過程,動(dòng)態(tài)優(yōu)化提取工藝。
35、進(jìn)一步地,所述將預(yù)測(cè)提取產(chǎn)品類型和提取率與目標(biāo)提取產(chǎn)品類型和提取率進(jìn)行比較,計(jì)算偏差,獲得產(chǎn)品類型預(yù)測(cè)偏差向量和提取率預(yù)測(cè)偏差的方法包括:
36、
37、
38、其中,為目標(biāo)提取產(chǎn)品類型的編碼向量,為目標(biāo)提取率,為產(chǎn)品類型預(yù)測(cè)偏差向量,為提取率預(yù)測(cè)偏差,為預(yù)測(cè)的提取產(chǎn)品類型編碼向量,為預(yù)測(cè)的提取率;
39、所述基于產(chǎn)品類型預(yù)測(cè)偏差向量和提取率預(yù)測(cè)偏差,計(jì)算工藝參數(shù)的調(diào)控量方法包括:
40、
41、
42、其中,為當(dāng)前時(shí)刻,為當(dāng)前時(shí)刻工藝參數(shù)的調(diào)控量向量,當(dāng)前時(shí)刻為綜合偏差,為過去某一時(shí)刻的綜合偏差,為產(chǎn)品類型預(yù)測(cè)偏差的權(quán)重矩陣,為產(chǎn)品類型預(yù)測(cè)偏差平衡因子,為提取率預(yù)測(cè)偏差平衡因子,為比例系數(shù),為積分系數(shù),為微分系數(shù),為當(dāng)前時(shí)刻產(chǎn)品類型預(yù)測(cè)偏差向量,為當(dāng)前時(shí)刻提取率預(yù)測(cè)偏差。
43、一種沙棘全成分提取過程智能優(yōu)化系統(tǒng),其用于實(shí)現(xiàn)上述的一種沙棘全成分提取過程智能優(yōu)化方法,包括:
44、工藝特征集獲取模塊:用于全面收集影響沙棘提取結(jié)果的各種關(guān)鍵特征,包括提取方法、提取條件、預(yù)處理工藝、沙棘原料、沙棘品種和產(chǎn)地等,為后續(xù)分析奠定數(shù)據(jù)基礎(chǔ),避免遺漏重要信息;
45、新特征構(gòu)建模塊:用于獲取沙棘全成分提取工藝參數(shù)中的新特征,包括壓力溫度比、溶劑的極性指數(shù)和體積表面積比,豐富原有特征空間,為模型提供更多維度的信息,有利于提高預(yù)測(cè)精度和泛化能力;
46、數(shù)據(jù)預(yù)處理模塊:用于對(duì)沙棘全成分提取工藝的特征集和新特征進(jìn)行異常值處理、標(biāo)準(zhǔn)化處理和編碼,提高數(shù)據(jù)質(zhì)量;
47、沙棘成分提取預(yù)測(cè)模塊:用于構(gòu)建特征矩陣,基于特征矩陣和沙棘全成分提取預(yù)測(cè)模型,預(yù)測(cè)提取產(chǎn)品類型和提取率;
48、工藝參數(shù)動(dòng)態(tài)優(yōu)化模塊:用于根據(jù)預(yù)測(cè)的沙棘提取產(chǎn)品類型和提取率動(dòng)態(tài)優(yōu)化沙棘全成分提取工藝流程,使得提取過程能夠?qū)崿F(xiàn)自動(dòng)化和智能化,提高生產(chǎn)效率和質(zhì)量穩(wěn)定性。
49、一種電子設(shè)備,包括存儲(chǔ)器、中央處理器以及存儲(chǔ)在存儲(chǔ)器上并可在中央處理器上運(yùn)行的計(jì)算機(jī)程序,所述中央處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述的一種沙棘全成分提取過程智能優(yōu)化方法。
50、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被執(zhí)行時(shí)實(shí)現(xiàn)上述一種沙棘全成分提取過程智能優(yōu)化方法。
51、相比于現(xiàn)有技術(shù),本發(fā)明的有益效果為:
52、本發(fā)明通過全面收集沙棘提取過程的關(guān)鍵特征,構(gòu)建新特征,并進(jìn)行數(shù)據(jù)預(yù)處理,解決了原始數(shù)據(jù)不完整、質(zhì)量差等問題,為后續(xù)分析奠定了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
53、本發(fā)明創(chuàng)新性地引入異質(zhì)圖和圖神經(jīng)網(wǎng)絡(luò)對(duì)沙棘品種、產(chǎn)地間的相似性和關(guān)聯(lián)性進(jìn)行建模,克服了現(xiàn)有方法忽視原料差異性的不足,充分利用了原料屬性信息,提高了優(yōu)化決策的針對(duì)性。
54、本發(fā)明構(gòu)建了沙棘全成分提取預(yù)測(cè)模型,可實(shí)現(xiàn)提取產(chǎn)品類型和提取率的精準(zhǔn)預(yù)測(cè),為動(dòng)態(tài)優(yōu)化提取工藝提供了可靠依據(jù)。基于模型預(yù)測(cè)偏差反饋實(shí)時(shí)調(diào)整提取工藝參數(shù),實(shí)現(xiàn)了提取過程的自動(dòng)化、智能化閉環(huán)優(yōu)化控制。
55、與傳統(tǒng)的固定工藝相比,本發(fā)明能夠根據(jù)原料特性和目標(biāo)產(chǎn)品靈活調(diào)整工藝參數(shù),提高了提取效率,降低了能耗,減少了溶劑殘留,提升了產(chǎn)品質(zhì)量的穩(wěn)定性,具有顯著的技術(shù)和經(jīng)濟(jì)效益。