一種基于稀疏最小二乘支持向量機(jī)的4-cba含量的軟測量方法
【專利摘要】本發(fā)明公開了一種基于稀疏最小二乘支持向量機(jī)的4-CBA含量軟測量方法,該方法選擇PX氧化過程有關(guān)過程變量作為模型的輸入,要預(yù)測的4-CBA含量作為模型的輸出,選取歷史運(yùn)行數(shù)據(jù)作為初始訓(xùn)練樣本;采用遺傳算法對(duì)最小二乘支持向量機(jī)模型進(jìn)行稀疏化和參數(shù)優(yōu)化,定義了包括稀疏率、訓(xùn)練誤差及測試誤差在內(nèi)的適應(yīng)度函數(shù),取適應(yīng)度最小的個(gè)體對(duì)應(yīng)的保留的訓(xùn)練樣本及優(yōu)化參數(shù)建立最小二乘支持向量機(jī)模型。本發(fā)明提出的稀疏最小二乘支持向量機(jī)軟測量方法能同時(shí)實(shí)現(xiàn)稀疏化和參數(shù)優(yōu)化,能極大地減小最小二乘支持向量機(jī)模型的規(guī)模,同時(shí)能實(shí)現(xiàn)對(duì)4-CBA含量的精確預(yù)測。
【專利說明】-種基于稀疏最小二乘支持向量機(jī)的4-CBA含量的軟測量 方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明提出了一種基于稀疏最小二乘支持向量機(jī)的4-CBA含量的軟測量方法,屬 于化學(xué)工程領(lǐng)域。
【背景技術(shù)】
[000引 支持向量機(jī)(Suppod Vector Machine, SVM)是由Vapnik等提出的基于統(tǒng)計(jì)學(xué)習(xí) 和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的建模方法,該方法在有限樣本情況下,同時(shí)兼顧算法的經(jīng)驗(yàn)風(fēng)險(xiǎn) 和推廣能力,廣泛應(yīng)用于解決模式分類問題和回歸建模問題。標(biāo)準(zhǔn)的支持向量機(jī)采用求解 二次規(guī)劃問題的求解方法,最終求出包含少量支持向量的模型,但是算法的復(fù)雜度隨著樣 本個(gè)數(shù)的增加而增加。Suykens在標(biāo)準(zhǔn)SVM的目標(biāo)函數(shù)中用誤差平方和項(xiàng)取代誤差的絕對(duì) 值項(xiàng),提出了最小二乘支持向量機(jī)(LSSVM)方法,由于采用等式約束,LSSVM采用求解線性 方程組的方法求解,但是如果訓(xùn)練樣本多,求出的LSSVM模型規(guī)模龐大,每個(gè)訓(xùn)練樣本都是 支持向量,不具有標(biāo)準(zhǔn)支持向量機(jī)的稀疏性解。針對(duì)該一問題,有采用剪枝方法實(shí)現(xiàn)對(duì)最小 二乘支持向量的稀疏,即先求出非稀疏解,得到一系列核系數(shù),刪除核系數(shù)小的樣本,然后 對(duì)剩下的訓(xùn)練樣本重新建模,反復(fù)迭代直到滿足要求。Gavin C等人提出了一種改進(jìn)的稀疏 化方法,但仍然W剪枝方法為基礎(chǔ),在重新建模時(shí)考慮總的訓(xùn)練樣本的殘差平方,而不是稀 疏后保留的訓(xùn)練樣本的殘差平方和,從而提高模型的推廣能力。甘良志等提出通過在特征 空間中尋找樣本的最大無關(guān)組來解決解的稀疏性問題。
[0003] 最小二乘支持向量機(jī)的預(yù)測精度與正則化參數(shù)和核函數(shù)參數(shù)的選取有一定的關(guān) 系,在最小二乘支持向量機(jī)的應(yīng)用中,常用的參數(shù)選擇方法有經(jīng)驗(yàn)法,網(wǎng)格捜索法和智能算 法如遺傳算法和差分進(jìn)化算法等。經(jīng)驗(yàn)法通過試湊進(jìn)行賦值,帶有一定的盲目性,而網(wǎng)格捜 索法計(jì)算量很大,智能算法可W縮短計(jì)算時(shí)間,但是大多數(shù)文獻(xiàn)要么采用智能方法進(jìn)行最 小二乘支持向量機(jī)的稀疏化,而參數(shù)采用經(jīng)驗(yàn)法選擇;要么僅僅采用智能方法進(jìn)行正則化 參數(shù)和核參數(shù)的優(yōu)化,根本就不考慮稀疏化問題。
[0004] PX氧化是在反應(yīng)溫度為190攝氏度左右,壓力為1. 258MPa,在鉆、鋪等催化劑作 用下W醋酸為溶劑,用空氣中的氧氣將PX氧化為TA(對(duì)苯二甲酸),TA進(jìn)一步純化后得到 PTA(精對(duì)苯二甲酸)的過程。PX氧化反應(yīng)主要由四個(gè)反應(yīng)組成,除原料PX和最終產(chǎn)品AT 夕F,還有其它中間產(chǎn)物:AT (對(duì)甲基苯甲醒)、PT (對(duì)甲基苯甲酸)和4-CBA (對(duì)哲基苯甲醒)。 其中4-CBA含量是PTA產(chǎn)品中的重要質(zhì)量指標(biāo),4-CBA含量過低,則氧化反應(yīng)程度加深,副反 應(yīng)加劇,能耗及醋酸、PX單耗增加。4-CBA含量過高,則PTA產(chǎn)品的質(zhì)量達(dá)不到要求。為了 節(jié)能降耗,并保證PTA的產(chǎn)品純度,非常必要對(duì)4-CBA含量進(jìn)行實(shí)時(shí)監(jiān)控。
[0005] 4-CBA含量無法用常規(guī)的傳感器在線測量,而是通過實(shí)驗(yàn)室分析化驗(yàn)出來,化驗(yàn)時(shí) 間比較長;同時(shí)由于化驗(yàn)成本較高,其采樣間隔較長,比如某工廠對(duì)4-CBA含量的采樣周期 為8小時(shí),每天固定在0點(diǎn),8點(diǎn)和16點(diǎn)采樣,因此一天最多只有S個(gè)滯后數(shù)小時(shí)的4-CBA 含量的分析值。需要采用軟測量技術(shù)在線估計(jì)4-CBA含量。
【發(fā)明內(nèi)容】
[0006] 技術(shù)問題;本發(fā)明的目的是提供一種基于稀疏化最小二乘支持向量機(jī)的4-CBA含 量的軟測量方法,該方法可W實(shí)現(xiàn)最小二乘支持向量機(jī)的稀疏化和參數(shù)優(yōu)化,獲得高效的 4-CBA含量軟測量模型。
[0007] 技術(shù)方案;本方案包括如下步驟
[000引 (1)選擇PX氧化過程中的氧化反應(yīng)器物料進(jìn)料流量,催化劑濃度,氧化反應(yīng)器液 位,氧化反應(yīng)器溫度,氧化反應(yīng)器尾氧含量,第=冷凝器排出水量,第一結(jié)晶器溫度,第一結(jié) 晶器尾氧含量,反應(yīng)生成的C02含量,反應(yīng)生成的CO含量共10個(gè)過程變量作為軟測量模型 的輸入變量。輸出量為4-CBA的含量。采集N組輸入變量所對(duì)應(yīng)的歷史運(yùn)行數(shù)據(jù)和4-CBA 的含量的分析數(shù)據(jù)作為初始訓(xùn)練樣本。
[0009] (2)給每個(gè)初始的訓(xùn)練樣本提供一個(gè)需要優(yōu)化的概率變量,該變量的取值區(qū)間為 [0, 1],概率變量總個(gè)數(shù)為初始訓(xùn)練樣本的總個(gè)數(shù)N。
[0010] (3)對(duì)N個(gè)概率變量和最小二乘支持向量機(jī)中的參數(shù)采用實(shí)數(shù)編碼方法進(jìn)行編 碼;對(duì)于概率變量在區(qū)間[0,1]內(nèi)隨機(jī)選取一個(gè)值,對(duì)于最小二乘支持向量機(jī)的參數(shù)在區(qū) 間[0.01,1000]內(nèi)隨機(jī)取值。
[0011] (4)對(duì)N個(gè)概率變量的值與0. 5進(jìn)行比較,如果某個(gè)概率小于0. 5,則對(duì)應(yīng)的樣本 作為測試樣本,概率大于或等于0. 5的樣本作為保留的訓(xùn)練樣本。
[0012] (5)定義包括稀疏率、保留的訓(xùn)練樣本誤差及測試誤差在內(nèi)的適應(yīng)度函數(shù):
[001 引
【權(quán)利要求】
1. 一種基于稀疏最小二乘支持向量機(jī)的4-CBA含量的軟測量方法,其特征在于,包括 如下步驟: 1) 、選擇PX氧化過程中的氧化反應(yīng)器物料進(jìn)料流量,催化劑濃度,氧化反應(yīng)器液位,氧 化反應(yīng)器溫度,氧化反應(yīng)器尾氧含量,第三冷凝器排出水量,第一結(jié)晶器溫度,第一結(jié)晶器 尾氧含量,反應(yīng)生成的C02含量,反應(yīng)生成的CO含量共10個(gè)過程變量作為軟測量模型的輸 入變量;輸出量為4-CBA的含量;采集N組輸入變量所對(duì)應(yīng)的歷史運(yùn)行數(shù)據(jù)和4-CBA的含量 的分析數(shù)據(jù)作為初始訓(xùn)練樣本; 2) 、給每個(gè)初始的訓(xùn)練樣本提供一個(gè)需要優(yōu)化的概率變量,該變量的取值區(qū)間為 [〇, 1],概率變量總個(gè)數(shù)為初始訓(xùn)練樣本的總個(gè)數(shù)N; 3) 、對(duì)N個(gè)概率變量和最小二乘支持向量機(jī)中的參數(shù)采用實(shí)數(shù)編碼方法進(jìn)行編碼: 對(duì)于概率變量在區(qū)間[〇,1]內(nèi)隨機(jī)選取一個(gè)值,對(duì)于最小二乘支持向量機(jī)的參數(shù)在區(qū)間 [0.01,1000]內(nèi)隨機(jī)取值; 4) 、對(duì)N個(gè)概率變量的值與0. 5進(jìn)行比較,如果某個(gè)概率小于0. 5,則對(duì)應(yīng)的樣本作為測 試樣本,概率大于或等于0. 5的樣本作為保留的訓(xùn)練樣本; 5) 、定義包括稀疏率、保留的訓(xùn)練樣本誤差及測試誤差在內(nèi)的適應(yīng)度函數(shù):
其中,N為初始訓(xùn)練樣本總數(shù),M為稀疏后保留的訓(xùn)練樣本數(shù),71為保留的訓(xùn)練樣本的輸 出值,丸為為保留的訓(xùn)練樣本的估計(jì)值,&為測試樣本的輸出值,元:為測試樣本的估計(jì)值; 6) 采用遺傳算法對(duì)N個(gè)概率變量和最小二乘支持向量機(jī)的參數(shù)進(jìn)行整體優(yōu)化,取適應(yīng) 度最小的個(gè)體對(duì)應(yīng)的保留的訓(xùn)練樣本及優(yōu)化參數(shù)建立最小二乘支持向量機(jī)模型。
【文檔編號(hào)】G01N31/10GK104504232SQ201410580152
【公開日】2015年4月8日 申請(qǐng)日期:2014年10月25日 優(yōu)先權(quán)日:2014年10月25日
【發(fā)明者】劉瑞蘭, 戎舟, 唐超 申請(qǐng)人:南京郵電大學(xué)