本發(fā)明涉及植物病害檢測,更具體的說是涉及一種基于自監(jiān)督學習的植物病害目標檢測方法。
背景技術:
1、在農(nóng)業(yè)生產(chǎn)中,植物病害是影響作物產(chǎn)量和質(zhì)量的重要因素之一。為了及時發(fā)現(xiàn)和防治植物病害,研究人員和農(nóng)業(yè)從業(yè)者一直在探索有效的病害檢測方法。傳統(tǒng)的植物病害檢測方法主要依賴于人工巡查和經(jīng)驗判斷,這不僅耗時耗力,而且準確性受限于檢測人員的經(jīng)驗和專業(yè)水平。近年來,隨著計算機視覺和人工智能技術的迅速發(fā)展,基于圖像的植物病害檢測方法逐漸成為研究的熱點。這些方法通過對植物葉片、果實等部位的圖像進行分析,自動識別和分類不同類型的病害,為農(nóng)業(yè)生產(chǎn)提供了更高效的技術支持。
2、現(xiàn)有的基于深度學習的植物病害檢測方法大多采用有監(jiān)督學習方式,需要大量標注數(shù)據(jù)進行訓練。然而,獲取高質(zhì)量的標注數(shù)據(jù)在實際應用中面臨諸多挑戰(zhàn)。首先,植物病害種類繁多,不同病害在不同植物上可能表現(xiàn)出不同的癥狀,這使得數(shù)據(jù)標注的工作量極為龐大。其次,標注數(shù)據(jù)的質(zhì)量直接影響目標檢測模型的訓練效果,人工標注難以避免主觀偏差,且標注過程耗時長,成本高。此外,由于植物病害在不同生長階段、不同環(huán)境條件下的表現(xiàn)可能會有所不同,現(xiàn)有方法在泛化能力方面也存在不足,難以在復雜的實際場景中保持高效的檢測性能。針對這些問題,自監(jiān)督學習作為一種新興的機器學習方法,為植物病害檢測提供了一種新的思路。自監(jiān)督學習通過構造代理任務,利用大量未標注的數(shù)據(jù)進行特征學習,從而減少對人工標注數(shù)據(jù)的依賴,降低數(shù)據(jù)準備成本。此外,自監(jiān)督學習能夠從未標注數(shù)據(jù)中提取出具有普遍性的特征表示,提高目標檢測模型在不同場景下的泛化能力。然而,現(xiàn)有的自監(jiān)督學習方法在應用于植物病害檢測時仍然面臨一些技術挑戰(zhàn)。例如,自監(jiān)督學習方法需要設計合理的代理任務,以確保所學特征對目標檢測任務有足夠的區(qū)分能力。此外,在實際應用中,如何有效結合自監(jiān)督學習和有監(jiān)督學習,以充分利用少量標注數(shù)據(jù)進行目標檢測模型優(yōu)化,也還沒有被解決。因此,如何提供一種基于自監(jiān)督學習的植物病害目標檢測方法是本領域技術人員亟需解決的問題。
技術實現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種基于自監(jiān)督學習的植物病害目標檢測方法,通過多階段訓練策略優(yōu)化目標檢測模型性能的有益效果,實現(xiàn)植物病害的自動化精準檢測。
2、為了實現(xiàn)上述目的,本發(fā)明提供如下技術方案:
3、一種基于自監(jiān)督學習的植物病害目標檢測方法,包括以下步驟:
4、s1、采集包含不同植物病害的植物圖像數(shù)據(jù)集;
5、s2、對植物圖像數(shù)據(jù)集進行去噪、圖像增強和規(guī)范化處理;
6、s3、構建目標檢測模型,將植物圖像數(shù)據(jù)集中的圖像劃分為多個區(qū)域塊,通過優(yōu)化分塊策略,最大化覆蓋植物病害的關鍵區(qū)域,利用基于detectron2框架的特征提取網(wǎng)絡對每個區(qū)域塊進行特征提??;
7、s4、使用未標注的植物圖像數(shù)據(jù)集,通過自監(jiān)督學習算法進行目標檢測模型的預訓練,生成弱標簽,并提取植物圖像數(shù)據(jù)集中的有用特征表示,將有用特征與生成的弱標簽結合,進行有監(jiān)督訓練;
8、s5、在不同植物和病害類型之間進行遷移學習,設定源域和目標域數(shù)據(jù)集,利用源域特征與目標域特征進行特征對齊,通過遷移損失項強化特征共享性,優(yōu)化目標檢測模型的跨品種、跨地域適應性;
9、s6、在目標域中進行自監(jiān)督學習,通過目標檢測模型生成的弱標簽對目標域數(shù)據(jù)集進行標注,并與源域標簽進行聯(lián)合訓練,通過聯(lián)合監(jiān)督學習損失函數(shù)和遷移損失項優(yōu)化目標檢測模型性能;
10、s7、在實際農(nóng)業(yè)場景中,應用訓練完成的目標檢測模型實時處理田間的植物圖像數(shù)據(jù),識別并定位病害區(qū)域,生成包含病害類型、嚴重程度和病害區(qū)域信息的檢測報告。
11、可選的,s1具體為:
12、s11、利用攝像設備或無人機采集植物圖像,總樣本數(shù)n為:
13、
14、式中,m為病害種類,ni為第i中病害的樣本數(shù)量,i∈[1,m];
15、s12、構建包含多樣化植物病害的植物圖像數(shù)據(jù)集x:
16、x={(x1,y1),(x2,y2),…,(xn,yn)};
17、式中,x1為第1張圖像,y1為x1對應的病害類型標簽。
18、可選的,s3具體為:
19、s31、構建目標檢測模型,植物圖像數(shù)據(jù)集x,將植物圖像數(shù)據(jù)集x中的每張圖像xi劃分為多個區(qū)域塊,每張圖像xi生成的區(qū)域塊數(shù)為ki,通過優(yōu)化分塊策略,最大化覆蓋植物病害的關鍵區(qū)域:
20、
21、式中,wi和hi分別為xi的寬度和高度,s為區(qū)域塊尺寸,p和q為邊緣擴展參數(shù),overlapx和overlapy分別為水平方向和垂直方向的重疊率;
22、s32、利用基于detectron2框架的特征提取網(wǎng)絡,對植物圖像數(shù)據(jù)集x中的每個區(qū)域塊rij進行特征提取,生成特征表示zij,特征提取公式引入了局部增強因子αij和全局上下文感知因子βij:
23、
24、式中,f(·)表示基于detectron2框架的特征提取網(wǎng)絡,用于從植物圖像數(shù)據(jù)集x的區(qū)域塊中提取有用的特征,αij為局部增強因子,λ1為正則化系數(shù),表示區(qū)域塊內(nèi)像素梯度變化,βij為全局上下文感知因子,為感知平滑參數(shù)。
25、可選的,s32具體為:
26、s321、利用基于detectron2框架的特征提取網(wǎng)絡,對植物圖像數(shù)據(jù)集x中的每個區(qū)域塊rij進行特征提取,生成特征表示zij;
27、s322、局部增強因子αij根據(jù)植物圖像數(shù)據(jù)集x中區(qū)域塊的邊緣信息和紋理特征進行計算,用于加強植物病害區(qū)域的顯著性:
28、
29、式中,μ1為局部增強系數(shù),為區(qū)域塊rij內(nèi)的梯度模平方,反映了區(qū)域塊內(nèi)的邊緣強度,v為增強平滑參數(shù),用于控制局部增強因子αij的影響范圍;
30、s323、全局上下文感知因子βij用于捕捉其他區(qū)域塊rik對當前區(qū)域塊rij的影響:
31、
32、s324、正則化系數(shù)λ1用于平衡局部增強因子αij和全局上下文感知因子βij對最終特征表示的貢獻,通過交叉驗證確定,用于在特征提取過程中維持全局與局部信息的一致性。
33、可選的,s4具體為:
34、s41、將同一圖像中所有區(qū)域塊的特征表示zij進行聚合,生成全圖的特征表示zi,聚合過程引入了權重系數(shù)wij,用于優(yōu)化病害區(qū)域?qū)ψ罱K特征的影響:
35、
36、式中,ki為圖像xi生成的區(qū)域塊數(shù),μ2為特征平滑因子,為特征梯度模,為特征平滑參數(shù);
37、s42、將聚合后的全圖特征表示zi輸入到目標檢測模型中,結合已標注的植物病害圖像數(shù)據(jù)進行監(jiān)督訓練,損失函數(shù)引入了區(qū)域級別的加權因子η,用于增強目標檢測模型對植物圖像數(shù)據(jù)集x中病害區(qū)域的關注:
38、
39、式中,ηij為植物圖像數(shù)據(jù)集x中區(qū)域塊的加權因子,g(zi)為目標檢測模型的輸出,yi為圖像的病害標簽,ρ1為正則化系數(shù),θ為目標檢測模型參數(shù),crossentropy表示交叉熵損失函數(shù);
40、s43、通過區(qū)域級別的特征學習和聚合,優(yōu)化目標檢測模型對葉片上微小病害的檢測精度,最終的檢測結果綜合了植物圖像數(shù)據(jù)集x中區(qū)域塊的特征表示zij和全圖特征表示zi,通過融合策略得到最終的檢測輸出di:
41、
42、其中,λ2和λ3為融合系數(shù),反映全圖特征與區(qū)域塊特征的重要性,∈為防零極小數(shù)。
43、可選的,s5具體為:
44、s51、在不同植物種類和病害類型之間進行遷移學習,設定源域數(shù)據(jù)集xs和目標域數(shù)據(jù)集xt,其中源域數(shù)據(jù)集xs包含已標注的植物病害圖像,目標域數(shù)據(jù)集xt包含跨品種、跨地域的未標注植物病害圖像;
45、s52、利用源域數(shù)據(jù)集xs中的特征表示zs和目標域數(shù)據(jù)集xt中的特征表示zt進行特征對齊,通過最大均值差異損失函數(shù)來最小化兩個域之間的分布差異:
46、
47、式中,ns和nt分別為源域和目標域的樣本數(shù)量,f(·)表示特征提取網(wǎng)絡函數(shù),和分別為源域和目標域中樣本的區(qū)域塊。
48、可選的,s6具體為:
49、s61、在目標域中進行自監(jiān)督學習,通過目標檢測模型生成的弱標簽對目標域數(shù)據(jù)集進行標注,并將弱標簽與源域中的標簽進行聯(lián)合訓練,訓練損失函數(shù)引入遷移損失項用于加強跨域特征的共享性:
50、
51、式中,為有監(jiān)督學習損失,zs和zt分別為源域和目標域的特征表示,ys為源域標簽,為目標域的弱標簽,λ4為權衡系數(shù),用于調(diào)節(jié)源域和目標域之間的貢獻比例;
52、s62、通過遷移學習增強目標檢測模型的跨品種和跨地域適應性,最終生成的遷移學習目標檢測模型在目標域中識別和檢測植物病害。
53、可選的,s61具體為:
54、s611、在目標域數(shù)據(jù)集xt上進行自監(jiān)督學習,通過目標檢測模型生成的弱標簽每個弱標簽對應于目標域圖像中的潛在病害類別:
55、
56、s612、將生成的弱標簽與源域數(shù)據(jù)集中的標簽ys進行聯(lián)合訓練,結合源域特征表示zs和目標域特征表示zt,計算聯(lián)合監(jiān)督學習損失
57、
58、式中,g為目標檢測模型的輸出層,crossentropy為交叉熵損失函數(shù),用于衡量預測輸出與實際標簽之間的差異,為;
59、s613、引入遷移損失項強化源域和目標域之間的特征共享性,通過權衡系數(shù)λ4調(diào)節(jié)源域和目標域的貢獻比例。
60、可選的,s7具體為:
61、s71、在實際農(nóng)業(yè)場景中利用攝像設備或無人機采集田間的實時植物圖像數(shù)據(jù)集xreal;
62、s72、將采集的實時植物圖像數(shù)據(jù)集xreal輸入到目標檢測模型中,生成每個圖像的特征表示然后通過目標檢測模型對圖像中的病害區(qū)域進行識別和定位,定位信息包括邊界框和病害類型標簽;
63、s73、結合目標檢測模型的輸出結果,生成檢測報告,其中檢測報告內(nèi)容包括每張圖像的病害類型、病害嚴重程度評分以及病害區(qū)域的定位信息:
64、
65、式中,為病害區(qū)域的數(shù)量,為病害區(qū)域內(nèi)的特征表示,severity為評分函數(shù),用于評估病害區(qū)域的嚴重程度;
66、s74、根據(jù)生成的檢測報告,提供可視化的病害分布圖,顯示病害在田間的分布情況。
67、經(jīng)由上述的技術方案可知,與現(xiàn)有技術相比,本發(fā)明提供了一種基于自監(jiān)督學習的植物病害目標檢測方法,具有以下有益效果:
68、(1)本發(fā)明方法通過自監(jiān)督學習技術,利用大量未標注的植物圖像數(shù)據(jù)集進行特征提取和目標檢測模型預訓練,有效減少了對人工標注數(shù)據(jù)的依賴,構建目標檢測模型時,將植物圖像數(shù)據(jù)集劃分為多個區(qū)域塊,通過基于detectron2框架的特征提取網(wǎng)絡,對每個區(qū)域塊進行特征提取,并通過自監(jiān)督學習生成弱標簽,顯著減少了人工參與的標注工作量,大幅降低了數(shù)據(jù)標注成本,同時,由于自監(jiān)督學習能夠在大量未標注數(shù)據(jù)中提取有效的特征表示,目標檢測模型在預訓練階段便能夠?qū)W習到與病害檢測任務相關的特征,從而提高后續(xù)有監(jiān)督學習的訓練效率;
69、(2)本發(fā)明方法通過引入遷移學習,在不同植物種類和病害類型之間進行特征共享和對齊,從而增強了目標檢測模型的跨域適應性,通過設定源域和目標域數(shù)據(jù)集,利用源域特征與目標域特征進行特征對齊,并引入遷移損失項來強化特征共享性,優(yōu)化目標檢測模型在跨品種、跨地域的病害檢測中的表現(xiàn),對齊策略通過最大化源域和目標域之間的特征分布一致性,使得目標檢測模型在遷移至新的植物種類和生長環(huán)境時,依然能夠保持高效的檢測性能,提升了目標檢測模型的泛化能力;
70、(3)本發(fā)明方法在實際農(nóng)業(yè)場景中應用經(jīng)過訓練的目標檢測模型,實時處理田間的植物圖像數(shù)據(jù),識別并定位病害區(qū)域,不僅確保了檢測的實時性,還通過對病害區(qū)域的特征表示和嚴重程度進行詳細分析,生成包含病害類型、嚴重程度和病害區(qū)域信息的檢測報告,通過遷移學習和自監(jiān)督學習優(yōu)化后的目標檢測模型,使得病害檢測結果更加準確和穩(wěn)定,即使在復雜的農(nóng)業(yè)環(huán)境中,也能保持較高的檢測精度;
71、(4)本發(fā)明提出的多階段訓練策略,即先進行自監(jiān)督學習進行特征提取,再結合有監(jiān)督學習進行目標檢測模型的優(yōu)化訓練,通過這種訓練方式,目標檢測模型能夠充分利用未標注數(shù)據(jù)和少量標注數(shù)據(jù)的結合,提高了對不同植物病害類型的檢測能力,同時,通過遷移學習的應用,使得目標檢測模型能夠適應不同種類的植物和病害類型,顯著提升了目標檢測模型的魯棒性和適應性。