欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法及系統(tǒng)的制作方法

文檔序號:8528444閱讀:440來源:國知局
一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻、圖像處理技術(shù)領(lǐng)域,尤其涉及一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著I nternet和數(shù)字圖像技術(shù)的發(fā)展,圖像數(shù)據(jù)呈現(xiàn)海量增長,對于很多機(jī)器學(xué)習(xí)領(lǐng)域的學(xué)者而言,從海量的視頻或圖像數(shù)據(jù)中采集到我們所需的目標(biāo)的樣本集,是一件費(fèi)時費(fèi)力的事,而且往往最終得到的樣本集不一定夠數(shù)或者不一定全都有效。采集之前首先要對視頻或圖片集進(jìn)行標(biāo)注,視頻標(biāo)注可以分為手動標(biāo)注和自動標(biāo)注兩類。傳統(tǒng)的人工標(biāo)注方法每次只能對一幅圖像中的物體區(qū)域進(jìn)行標(biāo)注,僅僅使用人工來進(jìn)行標(biāo)注越來越費(fèi)時耗力。因此越來越多的學(xué)者研宄通過利用機(jī)器學(xué)習(xí)方法來進(jìn)行自動圖像標(biāo)注,但是使用統(tǒng)計學(xué)習(xí)方法也需要大量的已標(biāo)注樣本作為訓(xùn)練集,然而,目前存在的已標(biāo)注數(shù)據(jù)集相對較少。

【發(fā)明內(nèi)容】

[0003]本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法及系統(tǒng)。
[0004]本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法,包括如下步驟:
[0005]步驟1,利用半自動軟件工具標(biāo)注原始數(shù)據(jù)集中的目標(biāo);
[0006]步驟2,對已標(biāo)注的原始數(shù)據(jù)集進(jìn)行粗采集,得到正樣本集和負(fù)樣本集;
[0007]步驟3,利用正樣本集和負(fù)樣本集進(jìn)行訓(xùn)練,得到目標(biāo)檢測器;
[0008]步驟4,利用目標(biāo)檢測器對原始數(shù)據(jù)集進(jìn)行精采集,更新正樣本集和負(fù)樣本集;
[0009]步驟5,判斷正樣本集中的樣本數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量或檢測器性能是否達(dá)到預(yù)設(shè)標(biāo)準(zhǔn),如果未達(dá)到,返回步驟3,否則結(jié)束迭代。
[0010]本發(fā)明的有益效果是:本發(fā)明通過半自動方式標(biāo)注視頻或圖片集中的目標(biāo)之后,先“粗采集”部分?jǐn)?shù)據(jù)來訓(xùn)練生成檢測器,再通過檢測器“精采集”來精確獲取更多的目標(biāo)的樣本,通過迭代“精采集”的過程,利用新得到的樣本訓(xùn)練出新的更精確的檢測器進(jìn)一步檢測、切割目標(biāo)。本發(fā)明利用軟件工具使得標(biāo)注工作更快速更高效,整個過程不但提高了標(biāo)注和采集的速度,節(jié)省了人力成本,通過粗采集和精采集的結(jié)合提高了樣本的精確性。
[0011]在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0012]進(jìn)一步,步驟I對目標(biāo)在原始數(shù)據(jù)集中出現(xiàn)的時間和位置進(jìn)行標(biāo)注,將目標(biāo)信息保存在標(biāo)注文檔中。
[0013]采用上述進(jìn)一步方案的有益效果:為目標(biāo)的切割提供依據(jù),實現(xiàn)對目標(biāo)的精準(zhǔn)切害J,形成正樣本集和負(fù)樣本集。
[0014]進(jìn)一步,步驟2中對已標(biāo)注的原始數(shù)據(jù)集進(jìn)行粗采集,得到正樣本集和負(fù)樣本集的具體操作為:
[0015]步驟2.1,從已標(biāo)注的原始數(shù)據(jù)集中切割目標(biāo),得到的正樣本形成一次正樣本集;
[0016]步驟2.2,從原始數(shù)據(jù)集中切割不含目標(biāo)的圖片作為負(fù)樣本集。
[0017]采用上述進(jìn)一步方案的有益效果:
[0018]進(jìn)一步,步驟4中利用目標(biāo)檢測器對原始數(shù)據(jù)集進(jìn)行精采集,更新正樣本集和負(fù)樣本集的具體操作為:
[0019]步驟4.1,利用檢測器對原始數(shù)據(jù)集進(jìn)行檢測;
[0020]步驟4.2,將原始數(shù)據(jù)集中檢測到的目標(biāo)切割下來,更新正樣本集;
[0021]步驟4.3,從原始數(shù)據(jù)集中切割不含目標(biāo)的圖片,更新負(fù)樣本集。
[0022]采用上述進(jìn)一步方案的有益效果:
[0023]進(jìn)一步,上述技術(shù)方案還包括利用檢測器對原始數(shù)據(jù)集進(jìn)行檢測過程中,為所有得到的目標(biāo)打分,并按分?jǐn)?shù)高低進(jìn)行排序;步驟4.2中將原始數(shù)據(jù)集中檢測到的目標(biāo)切割下來得到檢測所得正樣本集,檢測所述檢測所得正樣本集中是否存在分?jǐn)?shù)低于閾值的樣本,如果存在,將其作為負(fù)樣本移入負(fù)樣本集,剩下的分?jǐn)?shù)高于閾值的樣本即為正樣本,用于更新正樣本集,否則直接用檢測所得正樣本集更新正樣本集。
[0024]采用上述進(jìn)一步方案的有益效果:防止誤將非目標(biāo)的樣本作為目標(biāo)樣本放入正樣本集,進(jìn)一步提尚樣本的準(zhǔn)確性。
[0025]本發(fā)明解決上述技術(shù)問題的另一技術(shù)方案如下:一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注系統(tǒng),包括標(biāo)注模塊、粗采集模塊、目標(biāo)檢測器生成模塊、精采集模塊和迭代控制豐吳塊;
[0026]所述標(biāo)注模塊,用于利用半自動軟件工具標(biāo)注原始數(shù)據(jù)集中的目標(biāo);
[0027]所述粗采集模塊,用于對已標(biāo)注的原始數(shù)據(jù)集進(jìn)行粗采集,得到正樣本集和負(fù)樣本集;
[0028]所述目標(biāo)檢測器生成模塊,用于利用正樣本集和負(fù)樣本集進(jìn)行訓(xùn)練,得到目標(biāo)檢測器;
[0029]所述精采集模塊,用于利用目標(biāo)檢測器對原始數(shù)據(jù)集進(jìn)行精采集,更新正樣本集和負(fù)樣本集;
[0030]所述迭代控制模塊,用于判斷正樣本集中樣本數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量或檢測器性能是否達(dá)到預(yù)設(shè)標(biāo)準(zhǔn),如果未達(dá)到控制目標(biāo)檢測器生成模塊和精采集模塊迭代,直至滿足預(yù)設(shè)數(shù)量或預(yù)設(shè)標(biāo)準(zhǔn)。
[0031]在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0032]進(jìn)一步,所述標(biāo)注模塊對目標(biāo)在原始數(shù)據(jù)集中出現(xiàn)的時間和位置進(jìn)行標(biāo)注,將目標(biāo)信息保存在標(biāo)注文檔中。
[0033]進(jìn)一步,所述粗采集模塊包括第一切割單元和第二切割單元:所述第一切割單元,用于從已標(biāo)注的原始數(shù)據(jù)集中切割目標(biāo),得到的正樣本形成一次正樣本集;所述第二切割單元,用于從原始數(shù)據(jù)集中切割不含目標(biāo)的圖片作為負(fù)樣本集。
[0034]進(jìn)一步,所述精采集模塊包括檢測單元、第三切割單元和第四切割單元;所述檢測單元,利用檢測器對原始數(shù)據(jù)集進(jìn)行檢測;所述第三切割單元,用于將原始數(shù)據(jù)集中檢測到的目標(biāo)切割下來,更新正樣本集;所述第四切割單元,從原始數(shù)據(jù)集中切割不含目標(biāo)的圖片,更新負(fù)樣本集。
[0035]進(jìn)一步,所述精采集模塊還包括排序單元和監(jiān)督單元;所述排序單元,用于在檢測器對原始數(shù)據(jù)集進(jìn)行檢測過程中,為所有得到的目標(biāo)打分,并按分?jǐn)?shù)高低進(jìn)行排序;所述監(jiān)督單元,用于將原始數(shù)據(jù)集中檢測到的目標(biāo)切割下來得到檢測所得正樣本集,檢測所述檢測所得正樣本集中是否存在分?jǐn)?shù)低于閾值的樣本,如果存在,將其作為負(fù)樣本移入負(fù)樣本集,剩下的分?jǐn)?shù)高于閾值的樣本即為正樣本,用于更新正樣本集,否則直接用檢測所得正樣本集更新正樣本集。
【附圖說明】
[0036]圖1為本發(fā)明所述一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法流程圖;
[0037]圖2為本發(fā)明所述一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注系統(tǒng)框圖。
[0038]附圖中,各標(biāo)號所代表的部件列表如下:
[0039]1、標(biāo)注模塊,2、粗采集模塊,3、目標(biāo)檢測器生成模塊,4、精采集模塊,5、迭代控制模塊,21、第一切割單元,22、第二切割單元,41、檢測單元,42、第三切割單元,43、第四切割單元,44、排序單元,45、監(jiān)督單元。
【具體實施方式】
[0040]以下結(jié)合附圖對本發(fā)明的原理和特征進(jìn)行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0041]如圖1所示,一種基于分級迭代的大規(guī)模圖像樣本標(biāo)注方法,包括如下步驟:
[0042]步驟1,利用半自動軟件工具標(biāo)注原始數(shù)據(jù)集中的目標(biāo);
[0043]步驟2,對已標(biāo)注的原始數(shù)據(jù)集進(jìn)行粗采集,得到正樣本集和負(fù)樣本集;
[0044]步驟3,利用正樣本集和負(fù)樣本集進(jìn)行訓(xùn)練,得到目標(biāo)檢測器;
[0045]步驟4,利用目標(biāo)檢測器對原始數(shù)據(jù)集進(jìn)行精采集,更新正樣本集和負(fù)樣本集;
[0046]步驟5,判斷正樣本集中的樣本數(shù)量是否達(dá)到預(yù)設(shè)數(shù)量或檢測器性能是否達(dá)到預(yù)設(shè)標(biāo)準(zhǔn),如果未達(dá)到,返回步驟3,否則結(jié)束迭代。
[0047]具體地,實現(xiàn)流程如下:
[0048]標(biāo)注過程:
[0049]1.收集或網(wǎng)上下載一部分包含目標(biāo)的視頻集或圖片集,作為原始數(shù)據(jù)集,用于采集目標(biāo)。
[0050]2.通過自制軟件工具標(biāo)注部分原始數(shù)據(jù)集中的目標(biāo)。如果是視頻集,標(biāo)注出目標(biāo)所在的視頻幀范圍、在幀上的空間坐標(biāo)點(diǎn);具體的,標(biāo)注后會將目標(biāo)的信息保存在標(biāo)注文檔中,保存的信息有:目標(biāo)類別、目標(biāo)出現(xiàn)開始幀、目標(biāo)出現(xiàn)結(jié)束幀、目標(biāo)在圖像幀中位置的左上角坐標(biāo)(x,y)、標(biāo)注矩形的寬W和高H和視頻名稱。如果是圖片集,標(biāo)注出目標(biāo)所在圖片的空間坐標(biāo)點(diǎn);具體的,標(biāo)注后會將目標(biāo)的信息保存在標(biāo)注文檔中,保存的信息有:目標(biāo)類另O、目標(biāo)在圖像幀中位置的左上角坐標(biāo)U,y)、標(biāo)注矩形的寬W和高H和圖片名稱。
[0051]粗采集過程:
[0052]3.根據(jù)上述標(biāo)注文檔中的目標(biāo)信息,利用自制的切割工具從原始數(shù)據(jù)集中切割目標(biāo),實現(xiàn)目標(biāo)樣本的粗采集,得到的正樣本形成“正樣本集”。
[0053]4.依然
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
靖边县| 高碑店市| 长乐市| 讷河市| 乌拉特后旗| 芜湖县| 西丰县| 威信县| 龙里县| 昭平县| 连山| 台州市| 什邡市| 略阳县| 同仁县| 巴东县| 常州市| 裕民县| 武宣县| 游戏| 彭山县| 五大连池市| 双峰县| 木里| 太和县| 莎车县| 庆阳市| 富源县| 荃湾区| 革吉县| 江永县| 集贤县| 云和县| 乌鲁木齐市| 大安市| 巴彦县| 蓬莱市| 增城市| 甘洛县| 新丰县| 凤阳县|