本發(fā)明涉及機器視覺,特別是指一種基于礦石圖像特征的品位等級智能分類方法。
背景技術(shù):
1、在礦業(yè)生產(chǎn)中,選礦階段作為礦物開采加工源頭之一,其分選精度和生產(chǎn)效率與礦石的品位信息有著緊密的聯(lián)系,且分選的好壞直接影響到最終產(chǎn)品的品質(zhì)和市場競爭力,通過優(yōu)化分選工藝,及時檢測獲取礦石的品位信息并進行等級分類,可以為后續(xù)生產(chǎn)提供指導(dǎo),獲得更適合不同特定應(yīng)用需求的礦物產(chǎn)品,從而滿足不同行業(yè)的需要。其中品位是指礦石中關(guān)鍵物質(zhì)所占的比例,以石墨礦的碳品位為例,就是其中碳含量的比例。目前傳統(tǒng)的品位檢測方法主要是通過化工實驗或物理性儀器進行檢測,采用此方法,技術(shù)人員需要每日定期進行大量采樣化驗,其優(yōu)點在于分析結(jié)果精確、有效,但是這種技術(shù)面臨兩個顯著缺點:1)隨機性大:當前采礦車間通過人工采樣來進行品位測定,采樣具有較大的隨機性,且受到人為參與因素的影響較大;2)時效性低:整個“采樣—制樣—化驗”分析鏈條較長,通常存在數(shù)個小時的延遲?;灲Y(jié)果出來后,該檢驗批次礦石與后續(xù)多個班次礦石混合,難以及時把握出礦的平均品位。這導(dǎo)致后續(xù)可能難以有效指導(dǎo)采礦場上的出礦流程,難以有效指導(dǎo)生產(chǎn)計劃。
2、隨著計算機視覺及深度學(xué)習(xí)技術(shù)的飛躍式發(fā)展,采用深度學(xué)習(xí)技術(shù)直接應(yīng)用到礦石圖像上進行品位等級的分類已經(jīng)成為可能,高效的卷積神經(jīng)網(wǎng)絡(luò)通過不同大小的卷積核的連續(xù)卷積,每一個卷積都是在上一個卷積的基礎(chǔ)上進行的運算,從而逐步提取礦石上的各種特征,通過這些特征結(jié)合對應(yīng)的品位信息實現(xiàn)品位等級的綜合分類。這種方法的高效體現(xiàn)在其分類的實時性和準確性,實現(xiàn)對出礦品位信息的快速記錄與量化評價,降低人工成本與流程復(fù)雜性。這類方法的優(yōu)點在于其對礦石品位的等級分類非常迅速,在采集了相對足夠的礦石圖像集之后,通過訓(xùn)練人工智能算法,可在毫秒級的響應(yīng)時間內(nèi)實現(xiàn)對礦石的品位等級分類,并且可以結(jié)合軟硬件系統(tǒng)部署在礦石運輸生產(chǎn)線上,實現(xiàn)對礦石的實時分選。這類方法的缺點是模型在樣本數(shù)量規(guī)模有限的情況下,容易產(chǎn)生過擬合,從而難以保證礦石品位分級的可靠性。同時,由于不同品位等級間的礦石特征差異小,且礦石的品位屬性屬于圖像的高級語義特征,這種特征又依賴于各種復(fù)雜的低層特征(如紋理、解理、顏色等),僅依靠持續(xù)的卷積操作提取圖像低層特征,難以實現(xiàn)這種高級語義的表達,并且可能遺漏某些重要的分級特征,導(dǎo)致提取的特征不夠全面、充分,影響分級準確率的提升;反之,如果在少量樣本的情況下,過于關(guān)注高級語義導(dǎo)致對于物體細節(jié)疏忽并且存在著過擬合,在進行后續(xù)分類時會影響模型判斷,導(dǎo)致效果的提升不明顯,因此缺少泛化性和通用性。其次,深度學(xué)習(xí)模型尤其是卷積神經(jīng)網(wǎng)絡(luò)可能需要顯著的計算資源用于訓(xùn)練和推斷,這意味著,傳統(tǒng)深度學(xué)習(xí)模型需要有效的、比較高的層數(shù),在樣本數(shù)量較少的情況下,提升效果有限,并且提升所需的代價,是模型參數(shù)量和模型復(fù)雜度的激增。這在有限的硬件資源,特別是像礦石運輸生產(chǎn)線上這樣的移動或嵌入式環(huán)境中是個限制因素,這可能影響模型在實時應(yīng)用中的性能。
3、綜上所述,現(xiàn)有的基于深度學(xué)習(xí)的礦石品位等級分類方法存在容易產(chǎn)生過擬合,從而難以保證礦石品位分級的可靠性,以及可能遺漏某些重要的分級特征,導(dǎo)致提取的特征不夠全面、充分,影響分級準確率的問題。對此,如何利用較少的層數(shù)在較少樣本數(shù)據(jù)上取得較好的效果,是探究提升模型表現(xiàn)的一個重要方向。因此,為了實現(xiàn)基于深度學(xué)習(xí)的礦石品位等級分類方法快速、精確的可靠特性,在幾種礦石圖像樣本有限的情況下,從技術(shù)手段上抑制模型的過擬合傾向,引導(dǎo)模型尋找泛化性更好的特征并且不遺漏任何有用的分級特征,從而保證識別準確率和在不同礦石上的通用性是一項亟需解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種基于礦石圖像特征的品位等級智能分類方法,以解決現(xiàn)有的基于深度學(xué)習(xí)的礦石品位等級分類方法存在容易產(chǎn)生過擬合,從而難以保證礦石品位分級的可靠性,以及可能遺漏某些重要的分級特征,導(dǎo)致提取的特征不夠全面、充分,影響分級準確率的技術(shù)問題。
2、為解決上述技術(shù)問題,本發(fā)明提供了如下技術(shù)方案:
3、一方面,本發(fā)明提供了一種基于礦石圖像特征的品位等級智能分類方法,所述基于礦石圖像特征的品位等級智能分類方法包括:
4、構(gòu)建礦石圖像數(shù)據(jù)集,將所述礦石圖像數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,并對訓(xùn)練集、驗證集和測試集中的礦石圖像數(shù)據(jù)分別進行預(yù)處理操作;
5、構(gòu)建一個多分支結(jié)構(gòu)的殘差神經(jīng)網(wǎng)絡(luò)模型,作為礦石品位等級檢測模型;
6、基于所述礦石圖像數(shù)據(jù)集對所述礦石品位等級檢測模型進行訓(xùn)練;
7、利用訓(xùn)練好的礦石品位等級檢測模型對待測礦石的品位等級進行檢測。
8、進一步地,構(gòu)建礦石圖像數(shù)據(jù)集,將所述礦石圖像數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集,包括:
9、在礦山中采樣隨機分布的礦石,拍攝礦石的圖像,并測定其品位等級,構(gòu)建數(shù)量充足、等級分布均勻以及標注品位等級標簽的礦石圖像數(shù)據(jù)集;
10、將所述礦石圖像數(shù)據(jù)集按照6:2:2的比例劃分為訓(xùn)練集、驗證集和測試集三個子集,確保每個子集中不存在其他子集的圖像數(shù)據(jù),并使用圖像哈希技術(shù)比較各子集中的圖像數(shù)據(jù),二次檢驗各子集中是否存在相同的圖像數(shù)據(jù),避免數(shù)據(jù)污染。
11、進一步地,對訓(xùn)練集、驗證集和測試集中的礦石圖像數(shù)據(jù)分別進行預(yù)處理操作,包括:
12、對訓(xùn)練集中的礦石圖像數(shù)據(jù)進行隨機的尺寸縮放并裁剪,并對其中的礦石圖像數(shù)據(jù)按80%的概率進行隨機亮度或?qū)Ρ榷茸儞Q以及隨機水平翻轉(zhuǎn);
13、對驗證集和測試集中的礦石圖像數(shù)據(jù)僅作尺寸縮放和中心裁剪處理。
14、進一步地,所述礦石品位等級檢測模型包括依次連接的主干塊、5個ir_a-mbconv-block塊、第一降采樣塊、10個ir_b-block塊、第二降采樣塊、5個ir_c-block塊、1×1卷積塊、全局平均池化層和全連接層。
15、進一步地,主干塊包括依次連接的三個3×3convbnact塊、一個步長為2的maxpool層、一個1×1卷積塊、一個步長為2的3×3maxpool層和多個分支,其中,所述主干塊中的分支一為一個1×1卷積塊,分支二包含依次連接的一個1×1卷積塊和一個5×5卷積塊,分支三包含依次連接的一個1×1卷積塊和兩個mbconv塊,分支四包含依次連接的一個步長為1、填充為1的3×3avgpool層和一個1×1卷積塊,各分支輸出的特征數(shù)據(jù)最后根據(jù)通道維度進行特征拼接。
16、進一步地,所述ir_a-mbconv-block塊、所述ir_b-block塊和所述ir_c-block塊均為多分支殘差結(jié)構(gòu),分別包含一個保持原始輸出的主干和若干個分支;其中,
17、ir_a-mbconv-block塊中的分支一為一個1×1卷積塊,分支二包含依次連接的一個1×1卷積塊和一個mbconv塊,分支三包含依次連接的一個1×1卷積塊和兩個mbconv塊,分支四包含依次連接的一個步長為1、填充為1的3×3平均池化層和一個1×1卷積塊,各分支輸出的特征數(shù)據(jù)根據(jù)通道維度進行特征拼接后,通過一個1×1卷積層,再與主干塊進行殘差連接后輸入激活函數(shù)中;
18、ir_b-block塊相比ir_a-mbconv-block塊,去除了ir_a-mbconv-block塊中的分支二,并將ir_a-mbconv-block塊中的分支三的兩個mbconv塊調(diào)整為一個1×7卷積塊和一個7×1卷積塊;
19、ir_c-block塊相比ir_a-mbconv-block塊,去除了ir_a-mbconv-block塊中的分支二,并將ir_a-mbconv-block塊中的分支三的兩個mbconv塊調(diào)整為一個1×3卷積塊和一個3×1卷積塊;其中,所述礦石品位等級檢測模型中的5個ir_c-block塊中的最后一個,在最后通過1×1卷積層后不使用激活函數(shù)。
20、進一步地,所述第一降采樣塊和所述第二降采樣塊均為多分支結(jié)構(gòu);其中,
21、第一降采樣塊中的分支一為一個1×1卷積塊,分支二包含依次連接的一個1×1卷積塊和兩個mbconv塊,分支三為一個步長為2、填充為1的3×3最大池化層,各分支輸出的特征數(shù)據(jù)最后根據(jù)通道維度進行特征拼接;
22、第二降采樣塊中的分支一和分支二都是由依次連接的一個1×1卷積塊和一個mbconv塊組成,分支三包含依次連接的一個1×1卷積塊和兩個mbconv塊,分支四為一個步長為2、填充為1的3×3最大池化層,各分支輸出的特征數(shù)據(jù)最后根據(jù)通道維度進行特征拼接。
23、進一步地,卷積塊包含依次連接的一個卷積層、一個bn標準化層和激活函數(shù);
24、mbconv塊包括一個包含依次連接的跳躍連接的擴展卷積層、一個3×3深度可分離卷積層、一個壓縮和激勵模塊以及一個逐點卷積層;
25、所述激活函數(shù)為leakyrelu函數(shù)。
26、進一步地,基于礦石圖像數(shù)據(jù)集對礦石品位等級檢測模型進行訓(xùn)練,包括:
27、使用遷移學(xué)習(xí)策略,先在大型數(shù)據(jù)集imagenet-1k上,對構(gòu)建的礦石品位等級檢測模型進行充分訓(xùn)練,得到訓(xùn)練參數(shù);
28、重新構(gòu)建一個添加eca注意力機制模塊的礦石品位等級檢測模型;
29、利用所述訓(xùn)練參數(shù)對重新構(gòu)建的礦石品位等級檢測模型進行初始化,然后基于學(xué)習(xí)率下降策略,結(jié)合權(quán)重衰減機制,同時使用預(yù)處理后的訓(xùn)練集和驗證集的礦石圖像數(shù)據(jù)對模型進行訓(xùn)練及參數(shù)調(diào)整,直至最優(yōu)情況;
30、將測試集中的礦石圖像數(shù)據(jù)輸入到訓(xùn)練后的模型中,進行模型的泛化性和魯棒性測試,對測試集中的每一張礦石圖像數(shù)據(jù)進行品位等級分類。
31、進一步地,所述eca注意力機制模塊添加在ir_c-block和1×1卷積塊之間。
32、再一方面,本發(fā)明還提供了一種電子設(shè)備,其包括處理器和存儲器;其中,存儲器中存儲有至少一條指令,所述指令由處理器加載并執(zhí)行,以實現(xiàn)上述方法。
33、又一方面,本發(fā)明還提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令,所述指令由處理器加載并執(zhí)行,以實現(xiàn)上述方法。
34、本發(fā)明提供的技術(shù)方案帶來的有益效果至少包括:
35、1、基于多分支結(jié)構(gòu)(inception)和殘差結(jié)構(gòu)(residual)構(gòu)建了用于礦石品位等級智能分類的模型,實現(xiàn)了對多種礦石品位等級分類的快速、準確的識別;通過對多層多角度圖像特征的理解,結(jié)合遷移學(xué)習(xí)理論訓(xùn)練模型,實現(xiàn)了對圖像多級特征知識的高效遷移和再利用,有效降低了模型的訓(xùn)練復(fù)雜度,提高了模型的識別性能;
36、2、將inception-resnet_v2模型進行合理的改進,合理的改進了部分卷積操作,添加部分分支特征提取功能,使用高效通道注意力eca來關(guān)注相鄰礦石品位之間的細小特征差異,既降低了參數(shù)量和計算量,又提高了模型的分類準確率和實時性;
37、3、使用余弦退火學(xué)習(xí)率下降策略和自動混合精度訓(xùn)練技巧,這樣平滑的學(xué)習(xí)率曲線下降策略,有效加快了訓(xùn)練進度并減少內(nèi)存使用,充分釋放了模型的性能潛力;
38、4、使用隨機裁剪、翻轉(zhuǎn)、旋轉(zhuǎn)、亮度與對比度變換等基本數(shù)據(jù)增強手段的同時,增加80%概率進行隨機亮度或?qū)Ρ榷茸儞Q,有效模仿實際應(yīng)用時的現(xiàn)場光照變換,增加模型訓(xùn)練時對數(shù)據(jù)的新穎性,防止了模型在數(shù)據(jù)集數(shù)量不足時過擬合,確保模型的魯棒性和通用性。