本發(fā)明涉及目標(biāo)檢測,更具體地說,本發(fā)明涉及一種大規(guī)模目標(biāo)檢測數(shù)據(jù)樣本的生成方法。
背景技術(shù):
1、目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域中的重要研究方向,廣泛應(yīng)用于自動駕駛、安防監(jiān)控、智能制造等場景。在目標(biāo)檢測任務(wù)中,訓(xùn)練模型通常依賴于大規(guī)模圖像數(shù)據(jù)集。然而,現(xiàn)有技術(shù)中圖像數(shù)據(jù)集的類別分布往往呈現(xiàn)長尾分布,即少數(shù)類別樣本數(shù)量極少,而多數(shù)類別樣本數(shù)量豐富。這種數(shù)據(jù)分布不均會導(dǎo)致稀有類別樣本在訓(xùn)練過程中權(quán)重不足,從而影響模型對稀有類別的檢測能力。
2、為了提升數(shù)據(jù)集的均衡性,現(xiàn)有技術(shù)常通過數(shù)據(jù)增強(qiáng)方法生成合成圖像,通常未充分考慮目標(biāo)對象與背景之間的整體匹配關(guān)系及其對數(shù)據(jù)質(zhì)量的影響,容易導(dǎo)致合成圖像中目標(biāo)對象與背景的融合效果不佳。這樣會造成合成數(shù)據(jù)質(zhì)量不高,進(jìn)而影響模型對稀有類別目標(biāo)的檢測性能。
3、為了解決上述問題,現(xiàn)提供一種技術(shù)方案。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實(shí)施例提供一種大規(guī)模目標(biāo)檢測數(shù)據(jù)樣本的生成方法以解決上述背景技術(shù)中提出的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、一種大規(guī)模目標(biāo)檢測數(shù)據(jù)樣本的生成方法,包括如下步驟:
4、s1:獲取包含多類別目標(biāo)對象標(biāo)注的初始圖像數(shù)據(jù)集,計(jì)算各類別目標(biāo)對象的出現(xiàn)頻率,確定出現(xiàn)頻率低于預(yù)設(shè)閾值的類別為稀有類別;
5、s2:對包含稀有類別目標(biāo)對象的圖像:通過對目標(biāo)對象與背景的運(yùn)動特性進(jìn)行分析,評估目標(biāo)對象與背景的動態(tài)行為是否存在異常;通過對目標(biāo)對象與背景的幾何復(fù)雜度進(jìn)行分析,評估目標(biāo)對象在背景中的結(jié)構(gòu)特性是否匹配;
6、s3:基于目標(biāo)對象與背景的動態(tài)行為是否存在異常和目標(biāo)對象在背景中的結(jié)構(gòu)特性是否匹配,判斷目標(biāo)對象與背景的可區(qū)分程度是否異常;
7、s4:對目標(biāo)對象與背景的可區(qū)分程度異常的目標(biāo)對象,采用對比度增強(qiáng)算法調(diào)整目標(biāo)對象的像素強(qiáng)度,并基于場景匹配算法篩選得到符合目標(biāo)對象特征的背景圖像;
8、s5:將調(diào)整后的目標(biāo)對象嵌入篩選出的背景圖像中生成合成圖像,并將合成圖像加入初始圖像數(shù)據(jù)集,形成擴(kuò)充后的圖像數(shù)據(jù)集。
9、在一個(gè)優(yōu)選的實(shí)施方式中,獲取包含多類別目標(biāo)對象標(biāo)注的初始圖像數(shù)據(jù)集,計(jì)算各類別目標(biāo)對象的出現(xiàn)頻率,確定出現(xiàn)頻率低于預(yù)設(shè)閾值的類別為稀有類別,具體為:
10、采集包含多類別目標(biāo)對象的原始圖像,并對采集的原始圖像進(jìn)行預(yù)處理,預(yù)處理包括圖像質(zhì)量校正、尺寸標(biāo)準(zhǔn)化和噪聲過濾;
11、對預(yù)處理后的原始圖像進(jìn)行目標(biāo)標(biāo)注,標(biāo)注信息包括目標(biāo)對象的類別和在圖像中的位置信息,形成標(biāo)注圖像數(shù)據(jù);
12、將標(biāo)注圖像數(shù)據(jù)整合為初始圖像數(shù)據(jù)集,并對初始圖像數(shù)據(jù)集中的目標(biāo)對象類別進(jìn)行統(tǒng)計(jì)分析,計(jì)算每個(gè)目標(biāo)對象類別在整個(gè)初始圖像數(shù)據(jù)集中的出現(xiàn)頻率;
13、將出現(xiàn)頻率低于預(yù)設(shè)閾值的目標(biāo)對象類別確定為稀有類別。
14、在一個(gè)優(yōu)選的實(shí)施方式中,通過對目標(biāo)對象與背景的運(yùn)動特性進(jìn)行分析,評估目標(biāo)對象與背景的動態(tài)行為是否存在異常,具體為:
15、提取包含稀有類別目標(biāo)對象的圖像序列,并通過光流算法計(jì)算目標(biāo)對象和背景的運(yùn)動矢量場;
16、對目標(biāo)對象的運(yùn)動矢量進(jìn)行軌跡建模,生成基于時(shí)序特征的目標(biāo)對象運(yùn)動軌跡;
17、通過背景區(qū)域的運(yùn)動矢量場進(jìn)行聚類分析,構(gòu)建背景運(yùn)動模式并提取背景動態(tài)行為特征;
18、將目標(biāo)對象運(yùn)動軌跡與背景動態(tài)行為特征進(jìn)行對比分析,計(jì)算運(yùn)動匹配度并記錄差異特征;
19、根據(jù)運(yùn)動匹配度判斷目標(biāo)對象與背景的動態(tài)行為是否存在異常。
20、在一個(gè)優(yōu)選的實(shí)施方式中,通過對目標(biāo)對象與背景的幾何復(fù)雜度進(jìn)行分析,評估目標(biāo)對象在背景中的結(jié)構(gòu)特性是否匹配,具體為:
21、提取稀有類別目標(biāo)對象及其所在圖像的區(qū)域特征,分離目標(biāo)對象區(qū)域和背景區(qū)域;
22、分別計(jì)算目標(biāo)對象區(qū)域和背景區(qū)域的幾何復(fù)雜度,幾何復(fù)雜度包括邊緣密度和分形維數(shù);
23、對目標(biāo)對象區(qū)域和背景區(qū)域的幾何復(fù)雜度進(jìn)行對比分析,量化目標(biāo)對象區(qū)域和背景區(qū)域的復(fù)雜度差異;
24、基于目標(biāo)對象區(qū)域和背景區(qū)域的復(fù)雜度差異計(jì)算幾何匹配度;
25、根據(jù)幾何匹配度的偏離程度,判斷目標(biāo)對象在背景中的結(jié)構(gòu)特性是否匹配。
26、在一個(gè)優(yōu)選的實(shí)施方式中,基于目標(biāo)對象與背景的動態(tài)行為是否存在異常和目標(biāo)對象在背景中的結(jié)構(gòu)特性是否匹配,判斷目標(biāo)對象與背景的可區(qū)分程度是否異常,具體為:
27、當(dāng)目標(biāo)對象與背景的動態(tài)行為不存在異常,且目標(biāo)對象在背景中的結(jié)構(gòu)特性匹配時(shí),則判定目標(biāo)對象與背景的可區(qū)分程度正常;否則,則判定目標(biāo)對象與背景的可區(qū)分程度異常。
28、在一個(gè)優(yōu)選的實(shí)施方式中,對目標(biāo)對象與背景的可區(qū)分程度異常的目標(biāo)對象,采用對比度增強(qiáng)算法調(diào)整目標(biāo)對象的像素強(qiáng)度,具體為:
29、提取目標(biāo)對象所在區(qū)域的像素值,基于直方圖均衡化方法重新分布像素強(qiáng)度值,以拉伸目標(biāo)對象的像素對比度范圍;
30、進(jìn)一步對像素值進(jìn)行自適應(yīng)對比度限制處理,避免過度增強(qiáng)導(dǎo)致的圖像偽影;
31、將調(diào)整后的目標(biāo)對象像素值替換原始圖像中對應(yīng)區(qū)域的像素值,形成經(jīng)過對比度增強(qiáng)的目標(biāo)對象區(qū)域。
32、在一個(gè)優(yōu)選的實(shí)施方式中,基于場景匹配算法篩選得到符合目標(biāo)對象特征的背景圖像,具體為:
33、通過提取目標(biāo)對象的特征信息生成目標(biāo)對象的多維特征向量,目標(biāo)對象的特征信息包括顏色分布、紋理特征和形狀特征;
34、從背景圖像數(shù)據(jù)庫中提取每幅背景圖像的特征信息,并將每幅背景圖像表示為特征向量;
35、基于目標(biāo)對象的多維特征向量與背景圖像特征向量的相似性計(jì)算結(jié)果,通過預(yù)設(shè)的相似性度量標(biāo)準(zhǔn)進(jìn)行匹配,篩選相似度最高的背景圖像,確定符合目標(biāo)對象特征的背景圖像。
36、在一個(gè)優(yōu)選的實(shí)施方式中,將調(diào)整后的目標(biāo)對象嵌入篩選出的背景圖像中生成合成圖像,并將合成圖像加入初始圖像數(shù)據(jù)集,形成擴(kuò)充后的圖像數(shù)據(jù)集,具體為:
37、對調(diào)整后的目標(biāo)對象進(jìn)行透明化處理,提取目標(biāo)對象的像素信息和輪廓特性;
38、根據(jù)目標(biāo)對象與篩選出的背景圖像的幾何匹配關(guān)系,確定目標(biāo)對象在背景圖像中的嵌入位置;
39、將目標(biāo)對象按照預(yù)設(shè)比例縮放至目標(biāo)尺寸,以保持目標(biāo)對象與背景圖像的比例協(xié)調(diào);
40、利用圖像融合算法將目標(biāo)對象嵌入至背景圖像中,融合時(shí)根據(jù)背景區(qū)域的顏色特征調(diào)整目標(biāo)對象的邊緣像素;
41、將生成的合成圖像加入初始圖像數(shù)據(jù)集,更新擴(kuò)充后的圖像數(shù)據(jù)集結(jié)構(gòu),并標(biāo)記新增圖像的類別信息和位置關(guān)系。
42、本發(fā)明一種大規(guī)模目標(biāo)檢測數(shù)據(jù)樣本的生成方法的技術(shù)效果和優(yōu)點(diǎn):
43、1、本發(fā)明通過綜合分析目標(biāo)對象與背景之間的動態(tài)行為和幾何復(fù)雜度特性,結(jié)合對目標(biāo)對象與背景可區(qū)分程度的評估結(jié)果,優(yōu)化了稀有類別目標(biāo)對象在合成圖像中的呈現(xiàn)效果。相比于現(xiàn)有技術(shù)單純依賴隨機(jī)數(shù)據(jù)增強(qiáng)或簡單幾何變換的方法,本發(fā)明能夠有效解決目標(biāo)對象與背景之間匹配關(guān)系不佳的問題。通過動態(tài)行為分析,確保目標(biāo)對象與背景在運(yùn)動模式上的一致性;通過幾何復(fù)雜度分析,優(yōu)化目標(biāo)對象在背景中的結(jié)構(gòu)特性。該綜合性分析顯著提升了目標(biāo)對象與背景的融合自然度,從而提高了合成圖像的質(zhì)量,為后續(xù)目標(biāo)檢測模型提供了更加可靠的訓(xùn)練數(shù)據(jù)。
44、2、通過采用基于場景匹配算法的目標(biāo)對象嵌入策略,篩選得到最符合目標(biāo)對象特征的背景圖像,并結(jié)合對比度增強(qiáng)算法對目標(biāo)對象的像素強(qiáng)度進(jìn)行調(diào)整,使目標(biāo)對象在合成圖像中更加清晰可見,提升了稀有類別目標(biāo)的可檢測性。通過將生成的合成圖像加入初始數(shù)據(jù)集并形成擴(kuò)充后的圖像數(shù)據(jù)集,本發(fā)明顯著提高了數(shù)據(jù)集的均衡性,特別是在稀有類別樣本的擴(kuò)充質(zhì)量和數(shù)量上具有明顯優(yōu)勢,為目標(biāo)檢測模型的訓(xùn)練提供了高效、精準(zhǔn)的數(shù)據(jù)支持。