本發(fā)明屬于風(fēng)電機(jī)組故障預(yù)警,具體涉及風(fēng)電機(jī)組齒輪箱油池溫度預(yù)測(cè)方法。
背景技術(shù):
1、齒輪箱是風(fēng)電機(jī)組的重要部件,由于受惡劣的運(yùn)行環(huán)境和多變的工況等因素影響,導(dǎo)致齒輪箱故障頻發(fā),且齒輪箱發(fā)生故障后,機(jī)組停機(jī)時(shí)間長(zhǎng),維修費(fèi)用高,對(duì)風(fēng)電場(chǎng)安全可靠性和運(yùn)行效率造成較大影響。
2、風(fēng)電機(jī)組齒輪箱在運(yùn)行時(shí),由于摩擦生熱、環(huán)境溫度波動(dòng)、載荷及轉(zhuǎn)速變化等因素,會(huì)在齒輪和潤(rùn)滑油之間將產(chǎn)生的熱量進(jìn)行傳導(dǎo)。風(fēng)電機(jī)組scada系統(tǒng)采集了風(fēng)電機(jī)組、變電站、氣象站等設(shè)備的運(yùn)行參數(shù),通過對(duì)scada數(shù)據(jù)的挖掘分析,可實(shí)現(xiàn)對(duì)風(fēng)電機(jī)組齒輪箱的運(yùn)行狀況評(píng)估,是對(duì)風(fēng)電機(jī)組齒輪箱進(jìn)行故障診斷和優(yōu)化調(diào)度的重要依據(jù)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供了風(fēng)電機(jī)組齒輪箱油池溫度預(yù)測(cè)方法,采用四分位法和基于數(shù)據(jù)離散度的縱向?yàn)V波方法對(duì)風(fēng)速-功率數(shù)據(jù)進(jìn)行清洗,并通過距離相關(guān)系數(shù)進(jìn)行特征選擇,構(gòu)建貝葉斯優(yōu)化lightgbm的油池溫度預(yù)測(cè)模型,旨在充分挖掘數(shù)據(jù)之間的相關(guān)性,提高了風(fēng)電機(jī)組齒輪箱運(yùn)行工況監(jiān)測(cè)的可靠性。
2、本發(fā)明所采用的技術(shù)方案是,風(fēng)電機(jī)組齒輪箱油池溫度預(yù)測(cè)方法,具體步驟如下:
3、s1、獲取風(fēng)電機(jī)組基本信息數(shù)據(jù);
4、s2、對(duì)風(fēng)電機(jī)組基本信息數(shù)據(jù)進(jìn)行清洗,剔除風(fēng)電機(jī)組非正常工況運(yùn)行數(shù)據(jù);
5、s3、利用距離相關(guān)系數(shù)算法,計(jì)算齒輪箱油池溫度與待選參數(shù)之間的相關(guān)性,篩選出與齒輪箱油池溫度的相關(guān)性大于閾值的參數(shù)作為輸入?yún)?shù);
6、s4、以s3中篩選得到的參數(shù)為預(yù)測(cè)模型的輸入?yún)?shù),以齒輪箱油池溫度為輸出參數(shù),采用lightgbm算法建立齒輪箱油池溫度預(yù)測(cè)模型;
7、s5、采用tpe算法優(yōu)化齒輪箱油池溫度預(yù)測(cè)模型參數(shù)設(shè)置,提升齒輪箱油池溫度預(yù)測(cè)模型的預(yù)測(cè)精度。
8、本發(fā)明的特點(diǎn)還在于:
9、s1中風(fēng)電機(jī)組基本信息數(shù)據(jù)包括風(fēng)電機(jī)組切入風(fēng)速、額定風(fēng)速、切出風(fēng)速、功率曲線和機(jī)組scada數(shù)據(jù)。
10、s2為根據(jù)風(fēng)速-功率曲線分布,剔除風(fēng)電機(jī)組非正常工況運(yùn)行數(shù)據(jù),得到機(jī)組正常工況下的運(yùn)行數(shù)據(jù),具體操作步驟為:
11、s2.1、對(duì)風(fēng)速-功率進(jìn)行基于四分位法的第一次清洗,具體如下:
12、首先剔除風(fēng)速小于切入風(fēng)速和大于切除風(fēng)速的數(shù)據(jù)點(diǎn),根據(jù)風(fēng)速-功率數(shù)據(jù)分布情況,再將風(fēng)速軸劃分為[切入風(fēng)速,額定風(fēng)速]和[額定風(fēng)速,切出風(fēng)速]兩個(gè)風(fēng)速段,將各風(fēng)速段數(shù)據(jù)按功率值大小平均劃分成四部分,處于三個(gè)分割點(diǎn)位置的數(shù)值,依次為下分位數(shù)q1、中位數(shù)q2和上分位q3,對(duì)于一個(gè)按照升序排列的樣本x={x1,x2,…,xn-1,xn},序列中xi<xi+1,n為樣本總數(shù),i表示序列中的某一點(diǎn),
13、首先計(jì)算第二個(gè)中位數(shù):
14、
15、然后計(jì)算下分位數(shù)q1與上分位數(shù)q3,
16、q1和q3表示樣本x中分隔前后25%數(shù)據(jù)點(diǎn)的位置所表示的數(shù)值,當(dāng)n=2k(k=0,1,2…)時(shí),有
17、
18、當(dāng)n=4k+1(k=0,1,2…)時(shí),有
19、
20、通過式(2)與式(3)的計(jì)算,四分位距iqr,即:
21、iqr=q3-q1?????????????????????????????(4)
22、在統(tǒng)計(jì)學(xué)中,用iqr確定序列x的內(nèi)限范圍,即:
23、[f1,fu]=[q1-ω1iqr,q3+ω2iqr]?????????????????(5)
24、式中:f1為四分位法確定的x的下限值;fu為x的上限值;w1和w2為權(quán)值,
25、取ω1=ω2=1.5,如果判定為異常數(shù)據(jù),剔除;反之xi保留,完成對(duì)風(fēng)速-功率進(jìn)行基于四分位法的第一次清洗;
26、s2.2、采用基于數(shù)據(jù)離散度的縱向?yàn)V波方法進(jìn)行第二次清洗,
27、對(duì)每個(gè)風(fēng)速子區(qū)間內(nèi)的功率值,計(jì)算其均值和方差,即:
28、
29、式(6)中:σi為第i個(gè)區(qū)間的功率均方差;ni為第i個(gè)區(qū)間的散點(diǎn)量;xj為第i個(gè)區(qū)間的第j個(gè)功率值;μi為第i個(gè)區(qū)間的功率均值,
30、機(jī)組正常運(yùn)行時(shí),風(fēng)速與功率散點(diǎn)正態(tài)分布于功率帶周圍,即95%的數(shù)據(jù)在均值上下兩個(gè)均方差所覆蓋的置信區(qū)間內(nèi),據(jù)此,各風(fēng)速區(qū)間以功率均值μi為中心,實(shí)現(xiàn)有效剔除功率帶周圍離散型數(shù)據(jù)。
31、s3的具體方法為:
32、設(shè)兩個(gè)變量為x和y,兩個(gè)變量之間的相關(guān)性記為dcor(x,y),當(dāng)dcor(x,y)=0時(shí),表示兩個(gè)變量x和y之間獨(dú)立,dcor(x,y)越大,表示變量x和y的相關(guān)性越強(qiáng),距離相關(guān)系數(shù)的算法如式(7):
33、
34、式中:dcor(x,y)為x與y的距離相關(guān)系數(shù);dcov(x,y)為x與y的距離協(xié)方差;dvar(x)為x的方差;dvar(y)為y的方差;
35、取閾值為0.5,取dcor(x,y)>0.5的參數(shù)作為預(yù)測(cè)模型輸入?yún)?shù)。
36、s4的具體操作方法為:
37、lightgbm通過單邊梯度下降和互斥特征捆綁兩種改進(jìn)技術(shù)使得gbdt算法更加的高效,單邊梯度下降算法如下:
38、假設(shè)訓(xùn)練集數(shù)據(jù)s={(x1,y1),(x2,y2),…,(xn,yn)},其中x為輸入特征向量,y為輸出數(shù)據(jù),lightgbm模型優(yōu)化過程的目標(biāo)是找到一個(gè)函數(shù)使損失函數(shù)l(y,f(x))最小化,若模型預(yù)測(cè)值記為f(x),則函數(shù)可表示為:
39、
40、假設(shè)模型的決策樹的數(shù)量為m,因模型使用前向分布算法,在第m棵樹時(shí)模型的輸出值可以表示為:
41、
42、在第m棵樹時(shí),模型的損失函數(shù)記為:
43、
44、在lightgbm模型中,函數(shù)是用牛頓法逼近的,在移除上述公式中的常數(shù)項(xiàng)后,損失函數(shù)可以等價(jià)為:
45、
46、其中,gi,hi表示損失函數(shù)的一階與二階梯度,因?yàn)槟P鸵詻Q策樹為基函數(shù),每顆樹都可以表示為:wq(x),q∈{1,2,…,j},j表示決策樹中葉子的數(shù)量,q代表決策規(guī)則,w表示葉節(jié)點(diǎn)組成的權(quán)值向量,因此,公式(11)可轉(zhuǎn)化為:
47、
48、對(duì)于一個(gè)特定結(jié)構(gòu)的樹,每個(gè)葉子節(jié)點(diǎn)的最優(yōu)權(quán)值wj*和損失函數(shù)的極值γk可以求解為:
49、
50、其中,可以看作是衡量樹結(jié)構(gòu)質(zhì)量的評(píng)分函數(shù),最后,損失函數(shù)被分割后的公式為:
51、
52、il,ir分別為左右分支的樣本集,通過引入單邊梯度下降算法,模型訓(xùn)練速度得到進(jìn)一步的提升,同時(shí)增加了弱學(xué)習(xí)器的多樣性,模型的泛化能力有了進(jìn)一步的提升。
53、s5中tpe算法的主要原理是通過對(duì)目標(biāo)函數(shù)進(jìn)行建模并使用貝葉斯定理不斷更新先驗(yàn)概率分布,以便在下一步選擇更有可能產(chǎn)生最佳結(jié)果的搜索點(diǎn),主要流程如下:
54、將目標(biāo)函數(shù)f(x)小于某一閾值y*的期望作為算法的評(píng)價(jià)指標(biāo),記為ei(expectedimprovement):
55、
56、定義如下兩個(gè)概率密度:
57、
58、其中,g(x)表示為目標(biāo)函數(shù)f(xi)值大于等于閾值y*所對(duì)應(yīng)的{xi}集合的概率密度;l(x)則相反,表示小于閾值y*所對(duì)應(yīng)的{xi}集合的概率密度;
59、因p(y|x)的概率無法直接得到,需利用貝葉斯公式將上述公式轉(zhuǎn)換為:
60、
61、現(xiàn)將小于閾值y*的概率記為γ=p(y<y*),則:
62、p(x)=∫p(x|y)p(y)dy=γl(x)+(1-γ)g(x)????????(19)
63、經(jīng)推導(dǎo)得出:
64、
65、由公式(20)可以看出,評(píng)價(jià)指標(biāo)的大小取決于概率密度函數(shù)g(x)和l(x),g(x)與l(x)的比值越小,評(píng)價(jià)指標(biāo)ei越大;
66、在tpe算法中,概率密度函數(shù)g(x)和l(x)使用樹結(jié)構(gòu)表示,這種表示方法會(huì)比較方便的根據(jù)l(x)進(jìn)行采樣,通過此方法在每一輪迭代都能獲得使評(píng)價(jià)指標(biāo)ei最大的x*。
67、本發(fā)明的有益效果是:
68、(1)本發(fā)明提供的風(fēng)電機(jī)組齒輪箱油池溫度預(yù)測(cè)方法,采用四分位法和基于數(shù)據(jù)離散度的縱向?yàn)V波方法對(duì)風(fēng)速-功率數(shù)據(jù)進(jìn)行清洗,并通過距離相關(guān)系數(shù)進(jìn)行特征選擇,構(gòu)建貝葉斯優(yōu)化lightgbm的油池溫度預(yù)測(cè)模型,旨在充分挖掘數(shù)據(jù)之間的相關(guān)性,提高風(fēng)電機(jī)組齒輪箱運(yùn)行工況監(jiān)測(cè)的可靠性;
69、(2)本發(fā)明風(fēng)電機(jī)組齒輪箱油池溫度預(yù)測(cè)方法,可有效挖掘風(fēng)電機(jī)組scada數(shù)據(jù),對(duì)齒輪箱油池溫度快速、精確預(yù)測(cè),實(shí)時(shí)監(jiān)控齒輪箱運(yùn)行狀態(tài),及時(shí)發(fā)現(xiàn)異常情況并采取相應(yīng)措施,減少設(shè)備停機(jī)時(shí)間,提高機(jī)組的運(yùn)行效率;同時(shí)減少現(xiàn)場(chǎng)運(yùn)維人員的工作量,降低人力成本,進(jìn)而提升風(fēng)電場(chǎng)運(yùn)行效益。