本發(fā)明涉及厚度計量。更具體地,本發(fā)明涉及一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量系統(tǒng)及方法。
背景技術(shù):
1、煤膠質(zhì)層測量技術(shù)是評估煉焦煤質(zhì)量的關(guān)鍵手段,其核心在于考察煤在高溫下的軟化、熔融和固化行為,尤其是形成膠質(zhì)體的過程。傳統(tǒng)的煤膠質(zhì)層測量方法如gieseler塑性儀法,涉及將煤樣置于特定容器中,在單側(cè)加熱條件下形成一系列等溫層面,由此觀察煤樣的軟化、膠質(zhì)體生成和固化過程,測量重點包括膠質(zhì)體的最大厚度、膨脹壓力及體積變化曲線,這些數(shù)據(jù)有助于評定煤的膠質(zhì)體特性,進而推斷其煉焦性能。近年來,隨著科技的進步,計算機視覺與圖像處理技術(shù)在煤膠質(zhì)層測量的應(yīng)用方面得到了顯著提升,實現(xiàn)了膠質(zhì)層指數(shù)測量的自動化,提高了精確度與效率。其中,測量未知煤樣的膠質(zhì)層厚度是煤膠質(zhì)層測量中非常關(guān)鍵的一個部分,它涉及到對一個未知煤樣的最大膠質(zhì)層厚度以及需要溫度的準確預(yù)測,進一步控制焦化條件,預(yù)測的精準性對于未知煤樣的膠質(zhì)層特性和煉焦性能分析至關(guān)重要。
2、申請公布號為cn116973541a的專利申請文件公開了煙煤膠質(zhì)層最大厚度的檢測方法,具體是對煤樣進行加熱處理,并利用探針檢測煤樣的上部層面高度和下部層面高度,以獲取煙煤膠質(zhì)層最大厚度。上述方案中是直接對煤樣進行加熱處理,并直接進行測量。需要說明的是,不同的煤樣均需要進行測量,使得煤樣膠質(zhì)層的檢測效率低下,且在進行測量時,對測量條件要求較高,如升溫速度、煤樣粒度、壓力、煤杯的材質(zhì)和煤杯外圍爐磚的耐火材料的熱性質(zhì)等都顯著影響測定結(jié)果;即當測量條件不準時,使得準確率并不高。
3、因此,如何提高煤樣膠質(zhì)層的檢測效率以及檢測結(jié)果的準確率是尤為重要的。
技術(shù)實現(xiàn)思路
1、為解決上述背景技術(shù)中提出的當測量條件不準時,使得準確率并不高的問題,本發(fā)明在如下的多個方面中提供方案。
2、在第一方面中,本發(fā)明提供了一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,包括:獲取待檢測煤樣不同溫度下的煤化學(xué)特征數(shù)據(jù);
3、將所述煤化學(xué)特征數(shù)據(jù)輸入機器學(xué)習(xí)模型,得到待檢測煤樣的厚度;其中,機器學(xué)習(xí)模型的訓(xùn)練過程包括:采集多個煤樣不同溫度下的煤化學(xué)特征數(shù)據(jù);設(shè)定多個鄰域半徑,基于所述鄰域半徑對多個煤樣進行聚類,得到各鄰域半徑下的聚類簇;利用改進的ch指數(shù)對各鄰域半徑下的聚類簇進行評估,得到對應(yīng)的聚類質(zhì)量指標,將聚類質(zhì)量指標最大的簇及其對應(yīng)的厚度作為訓(xùn)練集;將訓(xùn)練集輸入機器學(xué)習(xí)模型進行訓(xùn)練,得到訓(xùn)練好的機器學(xué)習(xí)模型;其中,改進的ch指數(shù)包括利用特征權(quán)重對聚類簇內(nèi)離散度矩陣的跡進行加權(quán);所述特征權(quán)重為:
4、;
5、式中,表示第個煤樣的特征權(quán)重,表示第個煤樣的方差,表示第個煤樣的標準差,表示方差的集合,表示標準差的集合,表示調(diào)整參數(shù),表示取集合中的最大值,表示取集合中的最小值。
6、通過上述方法,可以顯著提高煤膠質(zhì)層厚度預(yù)測的精度,并適用于各種不同類型的煤樣,具有廣泛的應(yīng)用前景。
7、進一步地,所述多個鄰域半徑的獲取過程為:
8、根據(jù)閔可夫斯基算法,選擇不同參數(shù)p,分別計算任意兩個煤樣的煤化學(xué)特征數(shù)據(jù)之間的距離值,并對所述距離值進行升序處理后繪制距離分布圖;獲取所述距離分布圖中的拐點,將所述拐點對應(yīng)的距離值作為鄰域半徑,進而得到不同參數(shù)p下的多個鄰域半徑。
9、通過閔可夫斯基算法選擇不同參數(shù)p,分別計算任意兩個煤樣的煤化學(xué)特征數(shù)據(jù)之間的距離值,并對這些距離值進行升序處理后繪制距離分布圖。通過差分法檢測距離分布圖中的拐點,確定多個鄰域半徑。此外,通過不同參數(shù)p下的鄰域半徑選擇,能夠動態(tài)適應(yīng)不同數(shù)據(jù)集的特點,從而選出不同參數(shù)p下比較合適的鄰域半徑,確保后續(xù)的聚類效果的穩(wěn)定性和可靠性。
10、進一步地,獲取所述距離分布圖中的拐點采用差分法、曲率法或插值法。
11、進一步地,基于所述鄰域半徑對多個煤樣進行聚類的算法為dbscan算法。
12、采用dbscan算法進行聚類分析,dbscan是一種密度聚類算法,能夠有效識別任意形狀的聚類簇,特別適用于具有噪聲的數(shù)據(jù)集。通過設(shè)定鄰域半徑和最小樣本點數(shù),dbscan算法能夠自適應(yīng)調(diào)整,適應(yīng)不同數(shù)據(jù)集的特征,確保聚類效果的穩(wěn)定性和魯棒性。這種高效聚類方法顯著提高了煤樣數(shù)據(jù)的聚類分析質(zhì)量,為機器學(xué)習(xí)模型的訓(xùn)練提供了可靠的數(shù)據(jù)基礎(chǔ)。
13、進一步地,還包括對所述聚類質(zhì)量指標進行調(diào)整,得到最終的聚類質(zhì)量指標的步驟,具體為:計算第二評價指標,基于聚類質(zhì)量指標和第二評價指標得到最終的聚類質(zhì)量指標,其公式如下:
14、;
15、式中,score表示最終的聚類質(zhì)量指標,表示權(quán)重,表示改進的ch指數(shù),表示第二評價指標,log表示對數(shù)函數(shù)。
16、通過結(jié)合改進的ch指數(shù)和第二評價指標,并引入權(quán)重調(diào)整,計算出最終的聚類質(zhì)量指標,能夠綜合考慮聚類結(jié)果的內(nèi)部一致性和分離度,多維度地評估聚類質(zhì)量,從而提供更全面和靈活的聚類性能評估,提升了聚類結(jié)果的準確性和可靠性。
17、進一步地,所述計算第二評價指標采用蘭德指數(shù)算法、調(diào)整蘭德指數(shù)算法、調(diào)整互信息分數(shù)或dunn指數(shù)算法。
18、進一步地,所述機器學(xué)習(xí)模型包括:線性回歸模型、支持向量機模型和隨機森林模型。
19、提供多種機器學(xué)習(xí)模型選擇,包括線性回歸模型、支持向量機模型和隨機森林模型。不同模型具有不同的優(yōu)缺點,通過靈活選擇最適合的模型,可以提高預(yù)測的精度和適用性。多模型選擇增強了方法的魯棒性,通過結(jié)合多種模型的預(yù)測結(jié)果,可以提升預(yù)測的穩(wěn)健性和可靠性,避免單一模型可能帶來的誤差和不穩(wěn)定性。
20、在第二方面中,本發(fā)明提供了一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量系統(tǒng),包括存儲器和處理器,所述存儲器內(nèi)存儲有計算機程序指令,當所述計算機程序指令被所述處理器執(zhí)行時實現(xiàn)以上任一項所述的基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法。
21、本發(fā)明的有益效果在于:
22、本發(fā)明通過采集煤樣不同溫度下的煤化學(xué)特征數(shù)據(jù),設(shè)定多個鄰域半徑進行聚類,并利用改進的ch指數(shù)進行評估,選擇聚類質(zhì)量指標最大的簇及其對應(yīng)的厚度作為訓(xùn)練集,訓(xùn)練機器學(xué)習(xí)模型來預(yù)測煤樣厚度。該方法有效整合了大數(shù)據(jù)分析與機器學(xué)習(xí)技術(shù),通過閔可夫斯基算法和dbscan聚類算法優(yōu)化聚類過程,改進的ch指數(shù)和第二評價指標相結(jié)合,使聚類質(zhì)量評估更加準確,進而能夠精確預(yù)測煤樣的厚度,提高了測量精度和效率。
1.一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,所述多個鄰域半徑的獲取過程為:
3.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,所述煤化學(xué)特征數(shù)據(jù)包括揮發(fā)分數(shù)據(jù)、灰分數(shù)據(jù)和硫分數(shù)據(jù)中的至少一種。
4.根據(jù)權(quán)利要求2所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,獲取所述距離分布圖中的拐點采用差分法、曲率法或插值法。
5.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,基于所述鄰域半徑對多個煤樣進行聚類的算法為dbscan算法。
6.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,還包括對所述聚類質(zhì)量指標進行調(diào)整,得到最終的聚類質(zhì)量指標的步驟,具體為:
7.根據(jù)權(quán)利要求6所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,所述計算第二評價指標采用蘭德指數(shù)算法、調(diào)整蘭德指數(shù)算法、調(diào)整互信息分數(shù)或dunn指數(shù)算法。
8.根據(jù)權(quán)利要求1所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法,其特征在于,所述機器學(xué)習(xí)模型包括:線性回歸模型、支持向量機模型和隨機森林模型。
9.一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量系統(tǒng),其特征在于,包括存儲器和處理器,所述存儲器內(nèi)存儲有計算機程序指令,當所述計算機程序指令被所述處理器執(zhí)行時實現(xiàn)權(quán)利要求1~8任意一項所述的一種基于大數(shù)據(jù)的煤膠質(zhì)層厚度測量方法。