本發(fā)明涉及圖像檢測識別的,具體而言,涉及一種用于圖像檢測識別的算法開發(fā)方法及系統(tǒng)、電子設(shè)備。
背景技術(shù):
1、算法定制開發(fā)是指根據(jù)特定需求和應(yīng)用場景,為用戶提供量身定制的算法解決方案。這種開發(fā)方式通常涉及對現(xiàn)有算法的調(diào)整和優(yōu)化,以滿足客戶的獨特需求,從而提高算法的適用性和效果。
2、以用于圖像檢測識別的算法開發(fā)方法為例,在算法開發(fā)過程中所需的數(shù)據(jù)量一般取決于算法類型、應(yīng)用場景以及具體任務(wù)的需求。
3、但發(fā)明人發(fā)現(xiàn),目前算法開發(fā)的數(shù)據(jù)量一般是基于人工經(jīng)驗值所確定的,但基于人工經(jīng)驗值所確定的數(shù)據(jù)量與實際數(shù)據(jù)量需求偏差較大,導(dǎo)致算法開發(fā)成本與預(yù)估成本偏差較大,以及在算法開發(fā)過程中,目前的算法的迭代需要提前數(shù)據(jù)投入或者需要頻繁地進行迭代,也存在算法模型迭代的成本較高的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種用于圖像檢測識別的算法開發(fā)方法及系統(tǒng)、電子設(shè)備,用于解決目前在算法開發(fā)過程中所存在的算法開發(fā)成本與預(yù)期估算成本偏差較大,以及算法模型迭代的成本較高的問題。
2、本發(fā)明的一方面提供了一種用于圖像檢測識別的算法開發(fā)方法,包括:確定目標(biāo)算法的采集數(shù)據(jù)的數(shù)據(jù)量,采集數(shù)據(jù)至少包括圖像數(shù)據(jù);獲取基于第一預(yù)設(shè)采集要求所采集的數(shù)據(jù)量的采集數(shù)據(jù),以得到算法開發(fā)數(shù)據(jù)集;根據(jù)算法開發(fā)數(shù)據(jù)集得到算法標(biāo)注數(shù)據(jù)集;基于算法標(biāo)注數(shù)據(jù)集進行算法開發(fā),以得到初始開發(fā)算法;在初始開發(fā)算法的開發(fā)精度滿足預(yù)設(shè)精度要求的情況下,生成目標(biāo)算法;在初始開發(fā)算法的開發(fā)精度不滿足預(yù)設(shè)精度要求的情況下,確定目標(biāo)算法的迭代數(shù)據(jù)的迭代數(shù)據(jù)量;獲取基于第二預(yù)設(shè)采集要求所采集的迭代數(shù)據(jù)量的迭代數(shù)據(jù),以得到算法迭代數(shù)據(jù)集;根據(jù)算法迭代數(shù)據(jù)集對初始開發(fā)算法進行算法迭代,以生成開發(fā)精度滿足預(yù)設(shè)精度要求的目標(biāo)算法。
3、根據(jù)本發(fā)明的一些實施例,采集數(shù)據(jù)的數(shù)據(jù)量為:
4、;
5、;
6、;
7、;
8、其中,n為采集數(shù)據(jù)的數(shù)據(jù)量,n1為正樣本數(shù)據(jù)量,n2為負(fù)樣本數(shù)據(jù)量;a為目標(biāo)物類別數(shù)量,a為所有目標(biāo)物大類的子類之和;b為場景不重復(fù)的攝像頭點位數(shù)量;c為每個場景同時出現(xiàn)目標(biāo)物類別數(shù)量;k1為每個點位非模擬數(shù)據(jù)的百分比;d1為每個點位非模擬采集的數(shù)量;k2為每個點位模擬數(shù)據(jù)的百分比;d2為每個點位模擬采集的數(shù)量;k1+k2=1,且k1≥0,k2≥0;q1為每個點位同時出現(xiàn)目標(biāo)物類別數(shù)量,q2為每個同時出現(xiàn)目標(biāo)物類別采集的數(shù)量;q3為可以同時模擬的目標(biāo)物類別數(shù)量;q4為每個可以同時模擬的目標(biāo)物類別采集的數(shù)量。
9、根據(jù)本發(fā)明的一些實施例,第一預(yù)設(shè)采集要求包括通用采集要求,包括:對于模擬采集和非模擬采集的采集數(shù)據(jù),每個目標(biāo)物類別均采集數(shù)據(jù),且每個目標(biāo)物類別中有至少一個目標(biāo)物;以及
10、;
11、;
12、其中,f1為平均每個目標(biāo)物類別數(shù)量;f2為每個目標(biāo)物類別數(shù)量偏差比例,0<f2<1。
13、根據(jù)本發(fā)明的一些實施例,對于每個點位非模擬采集的數(shù)量,第一預(yù)設(shè)采集要求還包括精細(xì)采集要求,包括:每個同時出現(xiàn)目標(biāo)物類別采集的數(shù)量至少包括不同視角采集的視角采集數(shù)量、不同光線采集的光線采集數(shù)量、不同距離采集的距離采集數(shù)量、不同朝向采集的朝向采集數(shù)量、不同質(zhì)量采集的質(zhì)量采集數(shù)量和不同姿態(tài)采集的姿態(tài)采集數(shù)量;其中:;為視角采集數(shù)量*光線采集數(shù)量*距離采集數(shù)量*朝向采集數(shù)量*質(zhì)量采集數(shù)量*姿態(tài)采集數(shù)量;對于每個點位模擬采集的數(shù)量,第一預(yù)設(shè)采集要求還包括精細(xì)采集要求,包括:每個可以同時模擬的目標(biāo)物類別采集的數(shù)量至少包括不同視角采集的視角采集數(shù)量、不同光線采集的光線采集數(shù)量、不同距離采集的距離采集數(shù)量、不同朝向采集的朝向采集數(shù)量、不同質(zhì)量采集的質(zhì)量采集數(shù)量和不同姿態(tài)采集的姿態(tài)采集數(shù)量;其中:
14、;或
15、
16、為視角采集數(shù)量*光線采集數(shù)量*距離采集數(shù)量*朝向采集數(shù)量*質(zhì)量采集數(shù)量*姿態(tài)采集數(shù)量。
17、根據(jù)本發(fā)明的一些實施例,對于負(fù)樣本數(shù)據(jù)量,第一預(yù)設(shè)采集要求還包括精細(xì)采集要求,包括:負(fù)樣本數(shù)據(jù)量至少包括不同光線采集的光線采集數(shù)量;其中,在分類任務(wù)的應(yīng)用場景中,每個點位的正樣本數(shù)據(jù)量與負(fù)樣本數(shù)據(jù)量的比例為1:1;在非分類任務(wù)的應(yīng)用場景中,每個點位的正樣本數(shù)據(jù)量與負(fù)樣本數(shù)據(jù)量的比例為8:2。
18、根據(jù)本發(fā)明的一些實施例,在數(shù)據(jù)誤報的情況下,迭代數(shù)據(jù)的迭代數(shù)據(jù)量為:;其中,m1為在數(shù)據(jù)誤報的情況下,迭代數(shù)據(jù)的迭代數(shù)據(jù)量;p1為誤報類別數(shù)量;p2為誤報點位數(shù)量;p3為每個點位同時出現(xiàn)誤報類別數(shù)量;p4為每個點位采集的數(shù)量;在數(shù)據(jù)漏報的情況下,迭代數(shù)據(jù)的迭代數(shù)據(jù)量為:
19、;
20、;
21、;
22、其中,m2為在數(shù)據(jù)漏報的情況下,迭代數(shù)據(jù)的迭代數(shù)據(jù)量;r1為漏報目標(biāo)物類別數(shù)量,r1為所有目標(biāo)物大類的漏報子類之和;r2為漏報點位數(shù)量;r3為每個點位同時出現(xiàn)漏報目標(biāo)物類別數(shù);d3為在數(shù)據(jù)漏報的情況下,每個點位非模擬采集的數(shù)量;q5為每個場景或者點位同時出現(xiàn)漏報目標(biāo)物類別數(shù)量;q6為每個同時出現(xiàn)漏報目標(biāo)物類別采集的數(shù)量;d4為在數(shù)據(jù)漏報的情況下,每個點位模擬采集的數(shù)量;q7為可以同時模擬的漏報目標(biāo)物類別數(shù)量;q8為每個可以同時模擬的漏報目標(biāo)物類別采集的數(shù)量。
23、根據(jù)本發(fā)明的一些實施例,在數(shù)據(jù)誤報的情況下,第二預(yù)設(shè)采集要求包括通用采集要求,包括:對于非模擬采集的采集數(shù)據(jù),每個誤報目標(biāo)物類別均采集數(shù)據(jù),且每個誤報目標(biāo)物類別中至少有一個目標(biāo)物;以及
24、;
25、;
26、其中,w1為平均每個誤報類別數(shù)量;w2為每個誤報類別數(shù)量偏差比例,0<w2<1。
27、在數(shù)據(jù)漏報的情況下,第二預(yù)設(shè)采集要求包括通用采集要求,包括:對于模擬采集和非模擬采集的采集數(shù)據(jù),每個漏報目標(biāo)物類別均采集數(shù)據(jù),且每個漏報目標(biāo)物類別中有至少一個目標(biāo)物;以及
28、;
29、;
30、其中,w3為平均每個漏報目標(biāo)物類別數(shù)量;w4為每個漏報目標(biāo)物類別數(shù)量偏差比例,0<w4<1。
31、根據(jù)本發(fā)明的一些實施例,在數(shù)據(jù)漏報的情況下,對于每個點位非模擬采集的數(shù)量,第二預(yù)設(shè)采集要求還包括精細(xì)采集要求,包括:每個同時出現(xiàn)漏報目標(biāo)物類別采集的數(shù)量至少包括不同視角采集的視角采集數(shù)量、不同光線采集的光線采集數(shù)量、不同距離采集的距離采集數(shù)量、不同朝向采集的朝向采集數(shù)量、不同質(zhì)量采集的質(zhì)量采集數(shù)量和不同姿態(tài)采集的姿態(tài)采集數(shù)量;其中,在數(shù)據(jù)漏報的情況下:;為視角采集數(shù)量*光線采集數(shù)量*距離采集數(shù)量*朝向采集數(shù)量*質(zhì)量采集數(shù)量*姿態(tài)采集數(shù)量;在數(shù)據(jù)漏報的情況下,對于每個點位模擬采集的數(shù)量,第二預(yù)設(shè)采集要求還包括精細(xì)采集要求,包括:每個可以同時模擬的漏報目標(biāo)物類別采集的數(shù)量至少包括不同視角采集的視角采集數(shù)量、不同光線采集的光線采集數(shù)量、不同距離采集的距離采集數(shù)量、不同朝向采集的朝向采集數(shù)量、不同質(zhì)量采集的質(zhì)量采集數(shù)量和不同姿態(tài)采集的姿態(tài)采集數(shù)量;其中:
32、;
33、為視角采集數(shù)量*光線采集數(shù)量*距離采集數(shù)量*朝向采集數(shù)量*質(zhì)量采集數(shù)量*姿態(tài)采集數(shù)量。
34、本發(fā)明的另一方面提供了一種用于圖像檢測識別的算法開發(fā)系統(tǒng),包括數(shù)據(jù)處理模塊和算法開發(fā)模塊。數(shù)據(jù)處理模塊確定目標(biāo)算法的采集數(shù)據(jù)的數(shù)據(jù)量;獲取基于第一預(yù)設(shè)采集要求所采集的數(shù)據(jù)量的采集數(shù)據(jù),以得到算法開發(fā)數(shù)據(jù)集;以及根據(jù)算法開發(fā)數(shù)據(jù)集得到算法標(biāo)注數(shù)據(jù)集;算法開發(fā)模塊基于算法標(biāo)注數(shù)據(jù)集進行算法開發(fā),以得到初始開發(fā)算法;在初始開發(fā)算法的開發(fā)精度滿足預(yù)設(shè)精度要求的情況下,生成目標(biāo)算法;數(shù)據(jù)處理模塊在初始開發(fā)算法的開發(fā)精度不滿足預(yù)設(shè)精度要求的情況下,確定目標(biāo)算法的采集數(shù)據(jù)的迭代數(shù)據(jù)量;以及獲取基于第二預(yù)設(shè)采集要求所采集的迭代數(shù)據(jù)量的迭代數(shù)據(jù),以得到算法迭代數(shù)據(jù)集;算法開發(fā)模塊根據(jù)算法迭代數(shù)據(jù)集對初始開發(fā)算法進行算法迭代,以生成開發(fā)精度滿足預(yù)設(shè)精度要求的目標(biāo)算法。
35、本發(fā)明的又一方面還提供了一種電子設(shè)備。電子設(shè)備包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當(dāng)一個或多個程序被一個或多個處理器執(zhí)行時,使得一個或多個處理器,能夠?qū)崿F(xiàn)如上文所述的算法開發(fā)方法。
36、本發(fā)明的又一方面還提供了一種非易失性計算機可讀存儲介質(zhì)。該存儲介質(zhì)上存儲有計算機程序,該計算機程序被處理器執(zhí)行時能夠?qū)崿F(xiàn)如上文所述的算法開發(fā)方法。
37、本發(fā)明通過確定目標(biāo)算法的采集數(shù)據(jù)的數(shù)據(jù)量,獲取基于第一預(yù)設(shè)采集要求所采集的該數(shù)據(jù)量的采集數(shù)據(jù),以得到算法開發(fā)數(shù)據(jù)集。本發(fā)明通過算法開發(fā)數(shù)據(jù)集可以開發(fā)得到初始開發(fā)算法,在初始開發(fā)算法的開發(fā)精度不滿足預(yù)設(shè)精度要求的情況下,獲取基于第二預(yù)設(shè)采集要求所采集的迭代數(shù)據(jù)量的迭代數(shù)據(jù),通過該迭代數(shù)據(jù)量的迭代數(shù)據(jù)可以完成初始開發(fā)算法的多次迭代,以得到滿足預(yù)設(shè)精度要求的目標(biāo)算法,從而可以完成算法開發(fā)。
38、本發(fā)明通過精準(zhǔn)的數(shù)據(jù)量的設(shè)置和第一預(yù)設(shè)采集要求,可以精準(zhǔn)的得到滿足算法開發(fā)需求的算法開發(fā)數(shù)據(jù)集,可以使得實際算法開發(fā)成本與預(yù)估成本較為接近,以符合用戶預(yù)期;以及本發(fā)明可以在初始開發(fā)算法的開發(fā)精度不滿足預(yù)設(shè)精度要求的情況下,通過精準(zhǔn)的迭代數(shù)據(jù)量的設(shè)置和第二預(yù)設(shè)采集要求,可以精準(zhǔn)的得到滿足算法迭代的算法迭代數(shù)據(jù)集,使得對于不滿足預(yù)設(shè)精度要求的初始開發(fā)算法,在迭代數(shù)據(jù)達到一定要求的情況下,才會啟動算法定制或者迭代,可以避免提前工作量的投入或者頻繁進行算法迭代,可以節(jié)省算法開發(fā)成本。