本發(fā)明屬于鋼材力學(xué)性能預(yù)測(cè),涉及一種基于數(shù)據(jù)預(yù)處理和雙向遞歸神經(jīng)網(wǎng)絡(luò)的hrb400e鋼材力學(xué)性能預(yù)測(cè)方法。
背景技術(shù):
1、近年來,隨著建筑行業(yè)的飛速發(fā)展,建筑用鋼的產(chǎn)量也居高不下,其中hrb400e鋼材在建筑行業(yè)中的應(yīng)用十分廣泛。得益于計(jì)算機(jī)技術(shù)的迅猛進(jìn)步,鋼鐵領(lǐng)域的數(shù)字化水平不斷提高,使得鋼鐵生產(chǎn)過程中產(chǎn)生的大量數(shù)據(jù)得以被采集和存儲(chǔ)。這些數(shù)據(jù)全面反映了鋼鐵生產(chǎn)各環(huán)節(jié)之間的內(nèi)在聯(lián)系,具有巨大的應(yīng)用潛力。然而,在鋼鐵企業(yè)中,各生產(chǎn)管理系統(tǒng)之間的通信困難,難以協(xié)調(diào)工作,生產(chǎn)數(shù)據(jù)被封閉在各個(gè)系統(tǒng)中,形成“信息孤島”,增加了生產(chǎn)、技術(shù)、管理人員獲取數(shù)據(jù)的難度,且由于缺乏合適的數(shù)據(jù)挖掘手段,結(jié)合鋼鐵生產(chǎn)工藝特點(diǎn)對(duì)生產(chǎn)數(shù)據(jù)進(jìn)行分析和挖掘更是無從談起。
2、傳統(tǒng)研究熱軋鋼材力學(xué)性能預(yù)測(cè)技術(shù)的研究主要是基于傳統(tǒng)的物理冶金機(jī)理模型,即通過耗費(fèi)大量人力、時(shí)間和經(jīng)濟(jì)成本開展物理實(shí)驗(yàn),建立描述熱軋過程中發(fā)生的各種物理冶金現(xiàn)象的數(shù)學(xué)模型,并結(jié)合軋制過程發(fā)生的換熱模型實(shí)現(xiàn)熱軋鋼材顯微組織和力學(xué)性能的預(yù)測(cè)。而隨著人工智能技術(shù)的興起,基于工業(yè)生產(chǎn)數(shù)據(jù)建立熱軋鋼材力學(xué)性能預(yù)測(cè)模型已成為現(xiàn)下研究的熱點(diǎn)。但已有的一些人工智能算法缺乏對(duì)工業(yè)數(shù)據(jù)的清洗、挖掘手段,導(dǎo)致模型的精度不高、魯棒性不足、通用性差。因此,亟需開發(fā)出一種能從這些大量的hrb400e工業(yè)生產(chǎn)數(shù)據(jù)中挖掘出有用信息的方法,以實(shí)現(xiàn)產(chǎn)品力學(xué)性能的精準(zhǔn)預(yù)測(cè)和穩(wěn)定性控制的人工智能算法。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于數(shù)據(jù)預(yù)處理和雙向遞歸神經(jīng)網(wǎng)絡(luò)的hrb400e鋼材力學(xué)性能預(yù)測(cè)方法,用于解決依靠傳統(tǒng)物理冶金模型實(shí)現(xiàn)力學(xué)性能預(yù)測(cè)時(shí)的成本高、耗時(shí)長、精度差以及依靠現(xiàn)有人工智能技術(shù)實(shí)現(xiàn)力學(xué)性能預(yù)測(cè)時(shí)的模型魯棒性不足、通用性差等技術(shù)問題。通過優(yōu)化數(shù)據(jù)處理流程和采用更先進(jìn)的機(jī)器學(xué)習(xí)算法,本發(fā)明力求在提升預(yù)測(cè)精度和效率的同時(shí),增強(qiáng)模型的魯棒性和適用性。
2、為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種基于數(shù)據(jù)預(yù)處理和雙向遞歸神經(jīng)網(wǎng)絡(luò)的hrb400e鋼材力學(xué)性能預(yù)測(cè)方法,具體包括以下步驟:
4、s1:數(shù)據(jù)收集:從某鋼廠棒材生產(chǎn)線收集不同規(guī)格的hrb400e生產(chǎn)數(shù)據(jù);
5、s2:數(shù)據(jù)預(yù)處理:對(duì)步驟s1中采集到的原始數(shù)據(jù)進(jìn)行處理,將關(guān)鍵成分、關(guān)鍵溫度和力學(xué)性能缺失的樣本直接刪除;對(duì)于設(shè)備參數(shù)和工藝參數(shù)缺失的樣本,使用同規(guī)格下的參數(shù)均值進(jìn)行替代;
6、s3:數(shù)據(jù)挖掘:對(duì)經(jīng)步驟s2處理后的數(shù)據(jù)進(jìn)行分層聚類、異常值剔除和數(shù)據(jù)均衡化處理;
7、s4:特征篩選:利用前向選擇算法篩選模型輸入?yún)?shù);
8、s5:構(gòu)建brnn模型,利用brnn模型對(duì)經(jīng)步驟s4前向選擇算法的特征數(shù)據(jù)集合進(jìn)行模型訓(xùn)練,采用貝葉斯優(yōu)化方法確定模型最優(yōu)超參數(shù),從而得到hrb400e力學(xué)性能預(yù)測(cè)最終模型,利用該模型實(shí)現(xiàn)hrb400e力學(xué)性能預(yù)測(cè);其中,brnn表示雙向遞歸神經(jīng)網(wǎng)絡(luò)。
9、進(jìn)一步,步驟s1中,收集的生產(chǎn)數(shù)據(jù)包括化學(xué)成分、工藝參數(shù)、設(shè)備參數(shù)以及鋼材的屈服強(qiáng)度、抗拉強(qiáng)度和agt(鋼筋最大力總伸長率)。
10、進(jìn)一步,步驟s3中,采用分層聚類前,需對(duì)數(shù)據(jù)集合進(jìn)行min-max標(biāo)準(zhǔn)化處理。
11、進(jìn)一步,步驟s3中,所述分層聚類具體包括:將數(shù)據(jù)中的每個(gè)樣本當(dāng)作一個(gè)初始聚類簇,通過計(jì)算樣本之間的馬氏距離,根據(jù)合并準(zhǔn)則,在算法運(yùn)行的每一步找到距離最近的兩個(gè)聚類簇,并將其合并成一個(gè)更大的類,反復(fù)合并,直到得到合適的聚類,從而實(shí)現(xiàn)數(shù)據(jù)的聚類。
12、進(jìn)一步,步驟s3中,所述異常值剔除具體包括:采用分層聚類得到的聚類簇,當(dāng)聚類簇中的樣本數(shù)據(jù)大于30時(shí),采用3σ準(zhǔn)則進(jìn)行異常值剔除,否則采用格拉布斯準(zhǔn)則進(jìn)行異常值剔除。
13、進(jìn)一步,步驟s3中,所述數(shù)據(jù)均衡化處理具體包括:將異常值剔除后的數(shù)據(jù)采用k-medoids算法尋找簇內(nèi)質(zhì)心,作為該聚類簇的代表工況,然后采用梯度下降算法進(jìn)行數(shù)據(jù)均衡化處理。
14、進(jìn)一步,步驟s4中,利用前向選擇算法篩選模型輸入?yún)?shù),具體包括:首先通過建立單個(gè)參數(shù)和目標(biāo)參數(shù)之間的線性相關(guān)模型,根據(jù)回歸模型的均方誤差mse來衡量該參數(shù)的相關(guān)程度,選擇mse最小的參數(shù)作為首個(gè)特征;再將已確定的首個(gè)特征參數(shù)和其他參數(shù)結(jié)合,構(gòu)建二元回歸模型,選擇二元回歸模型均方誤差mse最小值對(duì)應(yīng)的特征,作為第二個(gè)特征參數(shù);類似于上述過程,依次構(gòu)建多元回歸模型,選擇特征輸入?yún)?shù)集合,當(dāng)均方誤差值的變化小于1%時(shí),則停止前向篩選過程,從而得到模型的關(guān)鍵輸入?yún)?shù)。
15、進(jìn)一步,步驟s5中,將數(shù)據(jù)集合隨機(jī)按照4:1的比例劃分為訓(xùn)練集和測(cè)試集。
16、進(jìn)一步,步驟s5中,構(gòu)建的brnn模型的損失函數(shù)中加入了l2正則化項(xiàng)。
17、進(jìn)一步,步驟s5中,在模型訓(xùn)練過程中,采用貝葉斯優(yōu)化方法迭代更新權(quán)值和閾值,最小化目標(biāo)函數(shù),提高模型預(yù)測(cè)精度。
18、本發(fā)明的有益效果在于:
19、1)數(shù)據(jù)質(zhì)量提升:本發(fā)明通過聚類分析、異常值刪除和數(shù)據(jù)均衡處理等數(shù)據(jù)處理方法,對(duì)原始數(shù)據(jù)進(jìn)行清洗和優(yōu)化,有效地去除了噪聲數(shù)據(jù),確保了模型訓(xùn)練的準(zhǔn)確性和可靠性,顯著提高了建模數(shù)據(jù)的質(zhì)量。
20、2)高精度預(yù)測(cè):本發(fā)明利用雙向遞歸神經(jīng)網(wǎng)絡(luò)(brnn)模型構(gòu)建hrb400e力學(xué)性能預(yù)測(cè)模型,能夠更好地捕捉數(shù)據(jù)中的時(shí)間序列特征和復(fù)雜的非線性關(guān)系。相比傳統(tǒng)的單向神經(jīng)網(wǎng)絡(luò),brnn在處理具有時(shí)間依賴性的工業(yè)數(shù)據(jù)時(shí)表現(xiàn)出更高的精度和穩(wěn)定性。
21、3)自學(xué)習(xí)和自適應(yīng)能力:本發(fā)明基于人工智能技術(shù)的數(shù)據(jù)驅(qū)動(dòng)模型具有自學(xué)習(xí)和自適應(yīng)能力,能夠隨著數(shù)據(jù)的不斷更新和增加,自動(dòng)調(diào)整模型參數(shù),提高預(yù)測(cè)的準(zhǔn)確性和適應(yīng)性。
22、4)工業(yè)實(shí)用性強(qiáng):hrb400e力學(xué)性能預(yù)測(cè)模型是基于實(shí)際工業(yè)生產(chǎn)數(shù)據(jù)進(jìn)行訓(xùn)練和驗(yàn)證,具有較高的工業(yè)實(shí)用性。相比于基于實(shí)驗(yàn)室數(shù)據(jù)的傳統(tǒng)冶金機(jī)理模型,本發(fā)明的數(shù)據(jù)驅(qū)動(dòng)模型在實(shí)際生產(chǎn)環(huán)境中的應(yīng)用效果更好,能夠提供更為準(zhǔn)確的預(yù)測(cè)結(jié)果。
23、5)節(jié)約時(shí)間和成本:減少實(shí)驗(yàn)室試驗(yàn):傳統(tǒng)的冶金機(jī)理模型需要大量的實(shí)驗(yàn)室破壞性試驗(yàn),耗費(fèi)大量人力和時(shí)間、經(jīng)濟(jì)成本。而本發(fā)明的數(shù)據(jù)驅(qū)動(dòng)模型通過利用現(xiàn)有的生產(chǎn)數(shù)據(jù)進(jìn)行建模和預(yù)測(cè),減少了對(duì)實(shí)驗(yàn)室試驗(yàn)的依賴,節(jié)約了時(shí)間和成本。
24、6)應(yīng)用前景廣泛:本發(fā)明主要針對(duì)hrb400e鋼材進(jìn)行研究,但所提出的方法具有較強(qiáng)的通用性,可以推廣應(yīng)用于其他類型鋼材的力學(xué)性能預(yù)測(cè),具有廣泛的應(yīng)用前景。
25、7)提高生產(chǎn)效率和產(chǎn)品質(zhì)量:本發(fā)明通過對(duì)hrb400e鋼材力學(xué)性能的精準(zhǔn)預(yù)測(cè),生產(chǎn)企業(yè)可以更好地控制生產(chǎn)過程,提高產(chǎn)品質(zhì)量和生產(chǎn)效率,減少不合格產(chǎn)品的產(chǎn)生,提升市場(chǎng)競(jìng)爭(zhēng)力。
26、8)本發(fā)明不僅在數(shù)據(jù)處理和模型構(gòu)建方面具有顯著優(yōu)勢(shì),而且在實(shí)際工業(yè)應(yīng)用中表現(xiàn)出較高的實(shí)用性和經(jīng)濟(jì)效益,具有廣泛的應(yīng)用前景和市場(chǎng)價(jià)值,為鋼鐵行業(yè)的智能化和數(shù)字化發(fā)展提供了有力支持。
27、本發(fā)明的其他優(yōu)點(diǎn)、目標(biāo)和特征在某種程度上將在隨后的說明書中進(jìn)行闡述,并且在某種程度上,基于對(duì)下文的考察研究對(duì)本領(lǐng)域技術(shù)人員而言將是顯而易見的,或者可以從本發(fā)明的實(shí)踐中得到教導(dǎo)。本發(fā)明的目標(biāo)和其他優(yōu)點(diǎn)可以通過下面的說明書來實(shí)現(xiàn)和獲得。