一種基于逐步回歸分析的大數(shù)據(jù)處理方法
【專利摘要】本發(fā)明涉及一種基于逐步回歸分析的大數(shù)據(jù)處理方法,其按照以下步驟進(jìn)行:先收集工廠操作參數(shù)的數(shù)據(jù),并對(duì)收集的操作參數(shù)進(jìn)行編號(hào);然后,將上述收集的操作參數(shù)一部分作為因變量,其它的操作參數(shù)作為自變量,各參數(shù)之間成線性關(guān)系,列出方程式;再將上述方程式以及對(duì)應(yīng)的數(shù)據(jù)逐個(gè)導(dǎo)入Matlab軟件,進(jìn)行逐步回歸分析運(yùn)算,計(jì)算出各個(gè)方程自變量前的系數(shù)及截距;最后進(jìn)行結(jié)果分析得出對(duì)應(yīng)操作參數(shù)的最優(yōu)值。本發(fā)明的方法利用收集大量的數(shù)據(jù),通過逐步回歸分析及處理大數(shù)據(jù),并結(jié)合運(yùn)用Matlab軟件,可通過定量判斷工廠DCS各個(gè)操作參數(shù)之間的影響,定量判斷改變某參數(shù)的大小對(duì)其它參數(shù)的影響,而確定工廠DCS操作參數(shù)的最優(yōu)值。
【專利說(shuō)明】
一種基于逐步回歸分析的大數(shù)據(jù)處理方法
技術(shù)領(lǐng)域:
[0001] 本發(fā)明涉及工業(yè)生產(chǎn)中處理大數(shù)據(jù)的方法,具體涉及一種基于逐步回歸分析的大 數(shù)據(jù)處理方法。
【背景技術(shù)】:
[0002] 回歸分析是處理多變量間相關(guān)關(guān)系的一種數(shù)學(xué)方法。這種相關(guān)關(guān)系不同于函數(shù)關(guān) 系,后者反映變量間的嚴(yán)格依存性,而前者則表現(xiàn)出一定程度的波動(dòng)性或隨機(jī)性,對(duì)自變量 的每一取值,因變量可以有多個(gè)數(shù)值與之相對(duì)應(yīng)。當(dāng)自變量為非隨機(jī)變量、因變量為隨機(jī)變 量時(shí),分析它們的關(guān)系稱為回歸分析;當(dāng)兩者都是隨機(jī)變量時(shí),稱為相關(guān)分析。在統(tǒng)計(jì)上研 究相關(guān)關(guān)系可以運(yùn)用回歸分析和相關(guān)分析。具有相關(guān)關(guān)系的變量之間雖然具有某種不確定 性,但是,通過對(duì)現(xiàn)象的不斷觀察可以探索出它們之間的統(tǒng)計(jì)規(guī)律,這類統(tǒng)計(jì)規(guī)律稱為回歸 關(guān)系。在一個(gè)多元線性回歸模型中,并不是所有的自變量都與因變量有顯著關(guān)系,有時(shí)有些 自變量的作用可以忽略。這就產(chǎn)生了怎樣從大量可能有關(guān)的自變量中挑選出對(duì)因變量有顯 著影響的部分自變量的問題,在可能自變量的整個(gè)集合中元素很多,使用"最優(yōu)"子集的算 法可能行不通。那么逐步產(chǎn)生回歸模型要含有的X變量子集的自動(dòng)搜索方法卻可能是有效 的。這就是求適度好的自變量子集時(shí),同所有可能回歸的方法比較,為節(jié)省計(jì)算工作量而產(chǎn) 生的,這就是逐步回歸。
[0003] 現(xiàn)代化工業(yè)生產(chǎn)的環(huán)節(jié)都是密切相關(guān),有機(jī)聯(lián)系的。其最重要的表征是自動(dòng)化和 大數(shù)據(jù)。在化工行業(yè),通過現(xiàn)代自動(dòng)化技術(shù),將生產(chǎn)工藝、設(shè)備、控制與管理連成為一個(gè)有 機(jī)的整體,會(huì)同時(shí)產(chǎn)生海量的數(shù)據(jù)。這些海量的數(shù)據(jù)從應(yīng)用的觀點(diǎn)上可分為三類:可調(diào)參 數(shù)、必控參數(shù)和參考參數(shù)。其中,可調(diào)參數(shù)是人為可調(diào),無(wú)論是自動(dòng),半自動(dòng),或全手動(dòng),包括 閥門開度,電壓,電流,電阻,頻率等,其唯一目的是保證生產(chǎn)安全、穩(wěn)定、和產(chǎn)品質(zhì)量達(dá)標(biāo)。 必控參數(shù)是在預(yù)先規(guī)定的工況條件下進(jìn)行操作的工藝參數(shù),即化工生產(chǎn)過程中,各類工藝 參數(shù)必須在預(yù)先規(guī)定的工況條件下進(jìn)行操作才能保證生產(chǎn)安全、高效地進(jìn)行,如儲(chǔ)罐和容 器(包括油罐、水箱、鍋爐汽包等)液位要求維持在規(guī)定的范圍;生化過程中發(fā)酵罐的溫度、 壓力、pH等要符合工藝要求。參考參數(shù)是除了上述的兩種參數(shù)以外的參數(shù)就是參考參數(shù)。因 為生產(chǎn)過程工藝流程線上的各個(gè)設(shè)備、各個(gè)環(huán)節(jié)都與前后的設(shè)備、環(huán)節(jié)緊密相連,涉及整個(gè) 流程、眾多的被控變量和操縱變量。要切實(shí)考慮如何保證產(chǎn)品質(zhì)量、提高產(chǎn)量、節(jié)能和穩(wěn)定 操作,考慮和綜合各個(gè)工序、設(shè)備、環(huán)節(jié)之間的聯(lián)系和相互影響,從而合理安排各個(gè)系統(tǒng),使 之互相配合、協(xié)調(diào)一致,行之有效,就需要用好這些參考參數(shù)。因此,為了①加快生產(chǎn)速度, 降低生產(chǎn)成本,提高產(chǎn)品的產(chǎn)量和質(zhì)量;②減輕勞動(dòng)強(qiáng)度,改善勞動(dòng)條件;③能夠保證生產(chǎn) 安全,防止事故發(fā)生或擴(kuò)大,達(dá)到延長(zhǎng)設(shè)備使用壽命,提高設(shè)備利用能力的目的;④生產(chǎn)過 程自動(dòng)化的實(shí)現(xiàn),能根本改變勞動(dòng)方式,提高工人文化技術(shù)水平,為逐步地消滅體力勞動(dòng)和 腦力勞動(dòng)之間的差別創(chuàng)造條件,亟需提供一種處理這些大數(shù)據(jù)的方法,通過收集大量的數(shù) 據(jù)運(yùn)用逐步回歸分析,從而解決以上實(shí)際問題。
【發(fā)明內(nèi)容】
:
[0004] 本發(fā)明提供一種基于逐步回歸分析的大數(shù)據(jù)處理方法,能夠有效對(duì)大量數(shù)據(jù)進(jìn)行 分析處理,定量判斷工廠DCS各個(gè)操作參數(shù)之間和判斷改變某參數(shù)的大小對(duì)其它參數(shù)的影 響,從而確定工廠DCS操作參數(shù)的最優(yōu)值。
[0005] 為解決上述技術(shù)問題,本發(fā)明采取以下技術(shù)方案:
[0006] 一種基于逐步回歸分析的大數(shù)據(jù)處理方法,按照以下步驟進(jìn)行:
[0007] S1:收集工廠操作參數(shù)的數(shù)據(jù),并對(duì)收集的操作參數(shù)進(jìn)行編號(hào),分別記為1、2、 3、......、n;
[0008] S2:數(shù)據(jù)處理:將上述收集的操作參數(shù)一部分作為因變量,其它的操作參數(shù)作為自 變量,各參數(shù)之間成線性關(guān)系,列出如下方程式:
[0010]其中:x為自變量;y為因變量;a為自變量前的系數(shù);b為截距;
[0011] S3:將上述方程式以及對(duì)應(yīng)的數(shù)據(jù)逐個(gè)導(dǎo)入Matlab軟件,進(jìn)行逐步回歸分析運(yùn)算, 計(jì)算出各個(gè)方程自變量前的系數(shù)及截距;
[0012] S4:結(jié)果分析:
[0013] (1)當(dāng)自變量前的系數(shù)為零時(shí),說(shuō)明該自變量對(duì)相應(yīng)的因變量不產(chǎn)生影響,系數(shù)正 負(fù)反應(yīng)影響的正反方向,系數(shù)的大小反應(yīng)影響的大小,因此通過上述運(yùn)算結(jié)果可以找出影 響因變量的最大操作參數(shù)及操作參數(shù)個(gè)數(shù);
[0014] (2)將上述求得系數(shù)的方程組作如下變化:
[0016]將該方程組寫成矩陣的形式,如下式:
[0018] 用Matlab軟件解上式,計(jì)算中需加入?yún)?shù)取值范圍作為約束條件,得到的解即為 對(duì)應(yīng)操作參數(shù)的最優(yōu)值。
[0019] 本發(fā)明的方法利用收集大量的數(shù)據(jù),通過逐步回歸分析及處理大數(shù)據(jù),并結(jié)合運(yùn) 用Matlab軟件,可通過定量判斷工廠DCS各個(gè)操作參數(shù)之間的影響,定量判斷改變某參數(shù)的 大小對(duì)其它參數(shù)的影響,而確定工廠DCS操作參數(shù)的最優(yōu)值。從而解決實(shí)際生產(chǎn)中出現(xiàn)的數(shù) 據(jù)量大分析難度大、勞動(dòng)力耗費(fèi)大、生產(chǎn)效率低、生產(chǎn)條件不佳和設(shè)備利用率低等問題,加 快生產(chǎn)速度,降低生產(chǎn)成本,提高產(chǎn)品的產(chǎn)量和質(zhì)量;減輕勞動(dòng)強(qiáng)度,改善勞動(dòng)條件。同時(shí), 推廣應(yīng)用該方法能夠保證生產(chǎn)安全,防止事故發(fā)生或擴(kuò)大,達(dá)到延長(zhǎng)設(shè)備使用壽命,提高設(shè) 備利用能力的目的,可實(shí)現(xiàn)生產(chǎn)過程的自動(dòng)化,改變勞動(dòng)方式,提高工人文化技術(shù)水平。
【具體實(shí)施方式】:
[0020] 下面對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說(shuō)明。
[0021] 實(shí)施例1
[0022] 運(yùn)用基于逐步回歸分析的大數(shù)據(jù)處理方法,先收集某煤粉廠磨機(jī)數(shù)據(jù),該磨機(jī)共 有19個(gè)參數(shù),對(duì)各參數(shù)編號(hào)如下表1:
[0025]分別將表1中1 _ 19號(hào)參數(shù)當(dāng)作因變量,剩余參數(shù)當(dāng)作自變量,可得如下方程式:
[0027] 其中:111=18,11 = 19,7和1下角標(biāo)表示參數(shù)的編號(hào),13為截距。
[0028]將上述方程式以及對(duì)應(yīng)的數(shù)據(jù)逐個(gè)導(dǎo)入Matlab軟件,進(jìn)行逐步回歸分析運(yùn)算,求 出自變量前的系數(shù),若某自變量對(duì)因變量沒有影響則該自變量前的系數(shù)為零,最后得如下 結(jié)果:
[0029] yi9 = 9.01+0.7459xi8
[0030] yi8 = -l 10 ? 699-0 ? lx2-0 ? 007x4-0 ? 013x6+0 ? 373x8+0 ? 527xi5-〇 ? 02xi6+4 ? 91xi7+ 0.25xi9
[0031] yi7= 19.427-0.0013x3-0.0007x4+0.1567x7+0.0195x8+0.0021x9+0.0179x14+ 0.0132x15+0.0009x16+0.0203x18
[0032] y16 = 5 ? 77+0 ? 0356x6+0 ? 8161xi4
[0033] y15 = 〇 ? 481+0 ? 0061x9+0 ? 7972xi2+0 ? 0659xi4+0 ? 1041xi8
[0034] y14 = 29 ? 407-0 ? 3469x7+0 ? 0097x9+0 ? 6419xi2+0 ? 1659xi5+l ? 8141xi7
[0035] yi3 = -l 185.61-34.212x7-25.249xs
[0036] y12 = 13?3586+0?0395x1-0?0047x3+0?0029x4+0?0046x6-0?28031x7+0?0052x9+ 0.2043xi4+0.5627xi5
[0037] yn = 1.8995-0.0303xi4
[0038] yi〇 = -35 ? 0614-0 ? 5407x3-0 ? 0570x6+2 ? 2395x7+0 ? 5132xi8
[0039] y9 = -522 ? 62+0 ? 1531x4+0 ? 0437x6-6 ? 7397x7+2 ? 5759x8+2 ? 0845xi6+19 ? 4179xi7+ 1 ? 8276xi2-〇 ? 005xi3-〇 ? 0655xi6
[0040] y8 = -16.355-0.0063x4-0.0009x5+0.0145x6+0.5751x7+0.0177xg-〇 . 0005xi3-0.0636xi5+l. 1788xi7+0.0819xi8
[0041 ] y7 = -44.0176+0.0992xi+0.0082x4+0.0003x5+0.0023x6+0.1533x8-〇 . 0133xg-0 ? 0761xi2+0 ? 0526xi4+2 ? 4382xi7+0 ? 0246xi8
[0042] y6 = -459.437-2.9828x1+0.0072x2+0.2244x3-0.1105x4+0.0278x5+7.155x7+ 13 ? 47x8+0 ? 26x9_0 ? 302xi〇+6 ? 302xi2+2 ? 771xi5_3 ? 235xi8
[0043] y5 = -429.54+1.1742x6+41.7394x7-35.5218x8
[0044] y4= 1244 ? 5-5 ? 695xi+5 ? 5625x3-0 ? 2278x6+46 ? 7195x7-8 ? 4274x8+1 ? 7503x9+ 3 ? 3865xi2-56 ? 1883xi7-4 ? 4394xi8
[0045] y3= 194 ? 78+2 ? 5697xi+0 ? 1021x4-1 ? 0547x10-2 ? 7895xi2+l ? 6788x15-12 ? 0286xi7
[0046] y2 = -0.596x4+1.0683x6
[0047] yi = -l .779+0.0273x3-0.0099x4-0 ? 0101x6+1.0875x7+0.1942x8+0 ? 2186x12-0.0872xi8
[0048] 上述各個(gè)方程式反應(yīng)作為因變量的參數(shù)受自變量參數(shù)的影響,并且根據(jù)自變量前 系數(shù)判斷影響的方向及大小。
[0049] 將上述方程組轉(zhuǎn)化為如下形式:
[0051 ]將該方程組轉(zhuǎn)化為矩陣:
[0053]用Matlab軟件求解該矩陣,計(jì)算中需加入?yún)?shù)取值范圍作為約束條件,得到的解 即為對(duì)應(yīng)操作參數(shù)的最優(yōu)值。
[0054] 結(jié)果分析:由上表1可知,通過該方法先收集該磨機(jī)的19個(gè)操作參數(shù),通過逐步回 歸分析運(yùn)算,求出自變量前的系數(shù),用Matlab軟件求解矩陣,得到對(duì)應(yīng)操作參數(shù)的最優(yōu)值。 從而,在實(shí)際生產(chǎn)過程中解決出現(xiàn)的數(shù)據(jù)量大分析難度大、勞動(dòng)力耗費(fèi)大、生產(chǎn)效率低、生 產(chǎn)條件不佳和設(shè)備利用率低等問題。
[0055] 實(shí)施例2
[0056]運(yùn)用基于逐步回歸分析的大數(shù)據(jù)處理方法,收集某供熱公司煤粉鍋爐操作數(shù)據(jù), 該煤粉鍋爐共有65個(gè)參數(shù),對(duì)各參數(shù)編號(hào)如下表2:
[0058]分別將上述1-65號(hào)參數(shù)當(dāng)作因變量,剩余參數(shù)當(dāng)作自變量,可得如下方程式:
[0060]其中:y和X下角標(biāo)表示參數(shù)的編號(hào),b為截距。
[0061]將上述方程式以及對(duì)應(yīng)的數(shù)據(jù)逐個(gè)導(dǎo)入Matlab軟件,進(jìn)行逐步回歸分析運(yùn)算,求 出自變量前的系數(shù),若某自變量對(duì)因變量沒有影響則該自變量前的系數(shù)為零,最后得如下 結(jié)果:
[0063]上述各個(gè)方程式反應(yīng)作為因變量的參數(shù)受自變量參數(shù)的影響,并且根據(jù)自變量前 系數(shù)判斷影響的方向及大小。
[0064] 將上述方程組轉(zhuǎn)化為如下形式:
[0066]將該方程組轉(zhuǎn)化為矩陣:
[0068]用Matlab軟件求解該矩陣,計(jì)算中需加入?yún)?shù)取值范圍作為約束條件,得到的解 即為對(duì)應(yīng)操作參數(shù)的最優(yōu)值。
【主權(quán)項(xiàng)】
1. 一種基于逐步回歸分析的大數(shù)據(jù)處理方法,其特征在于:按照以下步驟進(jìn)行: S1:收集工廠操作參數(shù)的數(shù)據(jù),并對(duì)收集的操作參數(shù)進(jìn)行編號(hào),分別記為1、2、3、……、 n; S2:數(shù)據(jù)處理:將上述收集的操作參數(shù)一部分作為因變量,其它的操作參數(shù)作為自變 量,各參數(shù)之間成線性關(guān)系,列出如下方程式:其中:x為自變量;y為因變量;a為自變量前的系數(shù);b為截距; S3:將上述方程式以及對(duì)應(yīng)的數(shù)據(jù)逐個(gè)導(dǎo)入Matlab軟件,進(jìn)行逐步回歸分析運(yùn)算,計(jì)算 出各個(gè)方程自變量前的系數(shù)及截距; S4:結(jié)果分析: (1) 當(dāng)自變量前的系數(shù)為零時(shí),說(shuō)明該自變量對(duì)相應(yīng)的因變量不產(chǎn)生影響,系數(shù)正負(fù)反 應(yīng)影響的正反方向,系數(shù)的大小反應(yīng)影響的大小,因此通過上述運(yùn)算結(jié)果可以找出影響因 變量的最大操作參數(shù)及操作參數(shù)個(gè)數(shù); (2) 將上述求得系數(shù)的方程組作如下變化:將該方程組寫成矩陣的形式,如下式:用Matlab軟件解上式,得到的解即為對(duì)應(yīng)操作參數(shù)的最優(yōu)值。
【文檔編號(hào)】G06F17/18GK106055525SQ201610479051
【公開日】2016年10月26日
【申請(qǐng)日】2016年6月27日
【發(fā)明人】魏亞玲, 李 東, 張學(xué)梅, 苗澤凱, 程實(shí), 馬青華
【申請(qǐng)人】中國(guó)礦業(yè)大學(xué)銀川學(xué)院