本發(fā)明屬于農(nóng)業(yè)嵌入式篩選系統(tǒng),具體涉及一種基于隨機(jī)森林的嵌入式設(shè)備蠶豆篩選方法。
背景技術(shù):
1、隨著社會(huì)經(jīng)濟(jì)的發(fā)展,人們對(duì)食品安全和健康飲食的重視程度日益增加,作為主要消費(fèi)豆類之一的蠶豆,其產(chǎn)量也逐年提升,其出口份額以及市場(chǎng)規(guī)模也在連續(xù)增長(zhǎng)。然而在蠶豆收貨后的運(yùn)輸及儲(chǔ)存階段會(huì)有變質(zhì)現(xiàn)象發(fā)生,且收獲后未經(jīng)處理的蠶豆良莠不齊、優(yōu)劣混雜,影響到了不同等級(jí)蠶豆的經(jīng)濟(jì)用途分配。因此,對(duì)蠶豆進(jìn)行等級(jí)篩選的研究十分有必要,有助于提升國(guó)內(nèi)蠶豆相關(guān)制品及篩選設(shè)備制造行業(yè)的市場(chǎng)競(jìng)爭(zhēng)力,保障人民的飲食健康和食品安全。
2、作物分選的效率及準(zhǔn)確性受到多方面的影響,物料的大小、形狀、顏色、紋理等因素都可能影響篩選效果,為解決色選機(jī)在實(shí)際應(yīng)用中面臨的挑戰(zhàn),近年來(lái)眾多研究者嘗試引入先進(jìn)的圖像處理算法,結(jié)合對(duì)應(yīng)物料特性的深度學(xué)習(xí)模型,提高色選機(jī)對(duì)不同物料的識(shí)別能力。機(jī)器學(xué)習(xí)算法可以通過(guò)對(duì)大量數(shù)據(jù)的學(xué)習(xí),提高色選機(jī)的識(shí)別能力和適應(yīng)性,使其在不同場(chǎng)景下都能夠表現(xiàn)出色。
3、在農(nóng)作物篩選領(lǐng)域,尤其是面對(duì)簡(jiǎn)單背景和不復(fù)雜目標(biāo)的場(chǎng)景,傳統(tǒng)的機(jī)器學(xué)習(xí)方法,如支持向量機(jī)(svm)、k近鄰算法(knn)等,雖然可以在一定程度上完成任務(wù),但存在諸多不足。首先,這些方法通常依賴于手工設(shè)計(jì)的特征,對(duì)于較為簡(jiǎn)單的背景,傳統(tǒng)方法往往會(huì)出現(xiàn)過(guò)度擬合的問(wèn)題,導(dǎo)致模型在實(shí)際應(yīng)用中的泛化能力不足。其次,由于這些方法對(duì)特征選擇的依賴性較強(qiáng),特征提取過(guò)程可能會(huì)忽略某些關(guān)鍵特征,進(jìn)而影響篩選的精度。此外,傳統(tǒng)機(jī)器學(xué)習(xí)方法的計(jì)算復(fù)雜度較高,對(duì)于實(shí)時(shí)性要求較高的篩選任務(wù),它們的效率往往難以令人滿意。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于隨機(jī)森林的嵌入式設(shè)備蠶豆篩選方法,解決了傳統(tǒng)篩選方法分選效率低及手工設(shè)計(jì)特征計(jì)算復(fù)雜度高的技術(shù)問(wèn)題。
2、本發(fā)明所采用的技術(shù)方案是,基于隨機(jī)森林的嵌入式設(shè)備蠶豆篩選方法,具體按照以下步驟實(shí)施:
3、s1,采集原始圖像,并對(duì)原始圖像進(jìn)行預(yù)處理,得到數(shù)據(jù)集;
4、s2,對(duì)s1構(gòu)建的數(shù)據(jù)集進(jìn)行特征提取,使用皮爾遜相關(guān)系數(shù)計(jì)算特征的重要性,對(duì)特征數(shù)據(jù)進(jìn)行特征選擇以去除冗余特征,獲得對(duì)篩選準(zhǔn)確性貢獻(xiàn)高的特征;
5、s3,構(gòu)建隨機(jī)森林模型,根據(jù)s2獲得的圖像特征計(jì)算特征增益,確定特征的決策順序,通過(guò)訓(xùn)練調(diào)整確定隨機(jī)森林模型的結(jié)構(gòu)和參數(shù);
6、s4,對(duì)s3訓(xùn)練后的隨機(jī)森林模型進(jìn)行參數(shù)量化,對(duì)量化后的模型進(jìn)行嵌入式設(shè)備并行部署;
7、s5,使用s4部署好的隨機(jī)森林篩選模型對(duì)輸入的圖像數(shù)據(jù)進(jìn)行篩選,根據(jù)決策后輸出的目標(biāo)類別使用氣動(dòng)方式進(jìn)行剔除,完成篩選。
8、本發(fā)明的特點(diǎn)還在于:
9、s1中預(yù)處理具體為:
10、對(duì)采集到的原始圖像進(jìn)行濾波,如式(1.1)所示:
11、
12、式(1.1)中,i′(x,y)表示濾波后的像素值,i(x,y)表示原圖像的像素值,n(x,y)是包含像素(x,y)的鄰域,n是鄰域內(nèi)的像素?cái)?shù);
13、對(duì)進(jìn)行濾波后的原始圖像進(jìn)行如式(1.2)所示的線性歸一化操作,將原始圖像的像素值調(diào)整到標(biāo)準(zhǔn)范圍內(nèi):
14、
15、式(1.2)中,i′(x,y)是歸一化后的像素值,imax是圖像中最大像素值,imin圖像中最小像素值,a和b是歸一化的目標(biāo)范圍;
16、對(duì)歸一化后的原始圖像進(jìn)行如式(1.3)所示的伽馬校正,調(diào)整原始圖像的色彩失真:
17、i′(x,y)=i(x,y)γ?(1.3)
18、式(1.3)中,γ是伽馬值,通常范圍為0.8≤γ≤2.2。
19、s2中特征提取具體為:提取s1數(shù)據(jù)集中圖像的顏色直方圖、形狀輪廓和紋理特征,獲得訓(xùn)練集的圖像特征數(shù)據(jù)。
20、s3具體為:
21、s3.1,構(gòu)建隨機(jī)森林模型,設(shè)定隨機(jī)森林模型使用的決策樹(shù)數(shù)量、決策樹(shù)最大深度、最大特征數(shù)和最小樣本分裂數(shù);
22、s3.2,計(jì)算s2中準(zhǔn)確性貢獻(xiàn)高的顏色直方圖、形狀輪廓和紋理特征的信息增益,如式(3.1)、式(3.2)和式(3.3)所示:
23、
24、式(3.1)中,d是當(dāng)前數(shù)據(jù)集,pi是數(shù)據(jù)集中第i類別的概率,即第i類別的樣本數(shù)除以總樣本數(shù),n是類別的數(shù)量;
25、根據(jù)式(3.1)得到的熵,計(jì)算特征的條件熵,如式(3.2)所示:
26、
27、式(3.2)中,values(a)是特征a的所有可能取值,dυ是在特征a取值為υ時(shí)的數(shù)據(jù)子集,|dv|是數(shù)據(jù)子集dv的樣本數(shù),|d|是原數(shù)據(jù)集d的樣本數(shù),h(dv)是數(shù)據(jù)子集dv的熵;
28、根據(jù)式(3.2)得到的條件熵,計(jì)算特征信息增益,如式(3.3)所示:
29、ig(d,a)=h(d)-h(d|a)?(3.3)
30、式(3.3)中,ig(d,a)是特征a對(duì)數(shù)據(jù)集d的信息增益,h(d)是數(shù)據(jù)集d的熵,h(d|a)是特征a的條件熵;
31、根據(jù)信息增益確定決策時(shí)使用的特征的決策順序;
32、s3.3,將s1經(jīng)過(guò)預(yù)處理的圖像數(shù)據(jù)集按照一定比例分割為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于構(gòu)建隨機(jī)森林模型,測(cè)試集用于評(píng)估模型的性能,在訓(xùn)練模型之前,對(duì)隨機(jī)森林模型的參數(shù)進(jìn)行初始化,其中,參數(shù)包括樹(shù)的數(shù)量、最大深度、最大特征數(shù)和最小樣本分裂數(shù);
33、使用訓(xùn)練集對(duì)初始化的隨機(jī)森林模型進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程中,隨機(jī)森林模型通過(guò)隨機(jī)選擇樣本和特征,生成多棵決策樹(shù),并利用袋外數(shù)據(jù)進(jìn)行模型誤差估計(jì),通過(guò)多次迭代,確定各參數(shù)的最優(yōu)值,獲得最優(yōu)的模型結(jié)構(gòu)和分類性能。
34、s4具體為:首先對(duì)s3完成訓(xùn)練的隨機(jī)森林模型進(jìn)行參數(shù)范圍分析,分析訓(xùn)練好的隨機(jī)森林模型中各層參數(shù)的分布范圍,確定每個(gè)參數(shù)的最小值、最大值以及動(dòng)態(tài)范圍;根據(jù)嵌入式設(shè)備的處理能力和內(nèi)存限制,選擇定點(diǎn)量化位寬,將浮點(diǎn)數(shù)參數(shù)映射到定點(diǎn)表示,如式(4)所示:
35、q=round(x×scale)?(4)
36、式(4)中,x為浮點(diǎn)數(shù),scale為縮放因子,q為定點(diǎn)表示;
37、量化完成后,使用量化后的隨機(jī)森林模型在驗(yàn)證集上進(jìn)行評(píng)估,計(jì)算隨機(jī)森林模型的量化誤差并與浮點(diǎn)數(shù)形式的模型進(jìn)行性能對(duì)比,若量化導(dǎo)致性能顯著下降,可調(diào)整量化位寬或縮放因子,在完成隨機(jī)森林模型參數(shù)的定點(diǎn)量化后,將隨機(jī)森林模型部署到目標(biāo)嵌入式設(shè)備上。
38、s5具體為:使用嵌入式設(shè)備上的圖像傳感器,連續(xù)采集蠶豆樣本的圖像,將采集到的圖像數(shù)據(jù)轉(zhuǎn)換為與隨機(jī)森林模型輸入格式相匹配的數(shù)據(jù)格式,對(duì)轉(zhuǎn)換后的圖像數(shù)據(jù)進(jìn)行特征提取,提取的特征將作為隨機(jī)森林模型的輸入,將提取的特征向量輸入到s4訓(xùn)練好的隨機(jī)森林模型中進(jìn)行推理,隨機(jī)森林模型根據(jù)輸入特征做出分類決策,輸出篩選結(jié)果,根據(jù)隨機(jī)森林模型的決策輸出,將樣本分類為合格或不合格,合格樣本保留,不合格樣本標(biāo)記為需要剔除的目標(biāo),在隨機(jī)森林模型決策后,實(shí)時(shí)定位并標(biāo)記不合格樣本在圖像中的位置,當(dāng)標(biāo)記的樣本經(jīng)過(guò)預(yù)定位置時(shí),控制系統(tǒng)觸發(fā)氣動(dòng)裝置,產(chǎn)生高壓氣流,將不合格樣本從傳送帶上剔除,剔除后,記錄篩選結(jié)果,對(duì)合格和不合格樣本進(jìn)行分類統(tǒng)計(jì),通過(guò)統(tǒng)計(jì)結(jié)果,評(píng)估篩選模型和氣動(dòng)剔除機(jī)制的整體效果。
39、本發(fā)明的有益效果是:
40、本發(fā)明針對(duì)當(dāng)前篩選設(shè)備分選方式單一、分選效率提升乏力的問(wèn)題,提出使用基于機(jī)器學(xué)習(xí)方法的蠶豆分選算法,將機(jī)器學(xué)習(xí)技術(shù)與蠶豆分選任務(wù)相結(jié)合,將針對(duì)蠶豆常見(jiàn)形態(tài)而改進(jìn)的形狀特征,以及紋理特征和顏色特征進(jìn)行結(jié)合,進(jìn)行了改進(jìn)的形狀特征以及顏色和紋理特征的參數(shù)量?jī)?yōu)化研究。通過(guò)減少特征參數(shù)降低計(jì)算復(fù)雜度以及進(jìn)行參數(shù)定點(diǎn)量化,使得該篩選模型能夠進(jìn)行嵌入式設(shè)備部署,高效利用現(xiàn)場(chǎng)可編程邏輯門陣列(field-programmable?gate?array,fpga)的并行計(jì)算特性,實(shí)現(xiàn)了快速高效的蠶豆篩選。