本申請涉及人工智能,尤其涉及一種圖像標注方法、裝置、計算裝置、存儲介質(zhì)與計算機程序產(chǎn)品。
背景技術(shù):
1、人工智能(artificial?intelligence,ai)檢測或分割技術(shù)被廣泛應(yīng)用到機器視覺中,能夠?qū)崿F(xiàn)對感興趣目標的檢測。例如,通過目標檢測或語義分割可實現(xiàn)對產(chǎn)品外觀的缺陷檢測,從而能夠及時監(jiān)控產(chǎn)品的生產(chǎn)質(zhì)量,確保產(chǎn)品符合質(zhì)量標準和客戶要求。
2、相關(guān)技術(shù)中,感興趣目標檢測方法通常依賴于標注人員手動標注產(chǎn)品外觀圖像中的感興趣區(qū)域,并通過模型訓(xùn)練實現(xiàn)感興趣目標的檢測,例如缺陷檢測、包裹分割等。
3、然而,標注人員在實際標注過程中會面臨諸多挑戰(zhàn)。這些挑戰(zhàn)主要體現(xiàn)在標注工作不僅耗時費力,而且容易受到到標注人員主觀因素的影響,導(dǎo)致標注結(jié)果的不一致性。尤其在多人標注的過程中,由于不同標注人員的經(jīng)驗和判斷標準不同,標注結(jié)果的精度和一致性難以保證。特別是在面對微小缺陷或復(fù)雜背景的情況時,難以實現(xiàn)高精度的標注。
技術(shù)實現(xiàn)思路
1、本申請實施例提供一種圖像標注方法、裝置、計算裝置、存儲介質(zhì)與計算機程序產(chǎn)品,用以解決相關(guān)技術(shù)中的標注方法難以實現(xiàn)高精度標注的問題。
2、本申請實施例采用下述技術(shù)方案:
3、第一方面,本申請?zhí)峁┮环N圖像標注方法,包括:
4、獲取待標注的第一圖像中的感興趣目標的初始邊界框信息,所述初始邊界框信息為基于標注人員的標注得到;
5、通過圖像分割模型的圖像編碼器基于所述第一圖像,生成圖像嵌入向量;
6、通過圖像分割模型的提示編碼器基于所述初始邊界框信息,生成稀疏嵌入向量;
7、通過圖像分割模型的掩碼解碼器基于所述圖像嵌入向量和所述稀疏嵌入向量,生成所述第一圖像中的感興趣目標的掩碼,以及基于所述第一圖像中的感興趣目標的掩碼,對所述第一圖像中的感興趣目標進行標注。
8、第二方面,本申請?zhí)峁┮环N圖像標注裝置,包括:
9、信息獲取模塊,用于獲取待標注的第一圖像中的感興趣目標的初始邊界框信息,所述初始邊界框信息為基于標注人員的標注得到;
10、第一生成模塊,用于通過圖像分割模型的圖像編碼器基于所述第一圖像,生成圖像嵌入向量;
11、第二生成模塊,用于通過圖像分割模型的提示編碼器基于所述初始邊界框信息,生成稀疏嵌入向量;
12、圖像標注模塊,用于通過圖像分割模型的掩碼解碼器基于所述圖像嵌入向量和所述稀疏嵌入向量,生成所述第一圖像中的感興趣目標的掩碼,以及基于所述第一圖像中的感興趣目標的掩碼,對所述第一圖像中的感興趣目標進行標注。
13、第三方面,本申請?zhí)峁┮环N計算裝置,包括:存儲器和處理器;
14、所述存儲器,用于存儲計算機程序;
15、所述處理器,與所述存儲器耦合,用于執(zhí)行所述計算機程序,以用于:
16、獲取待標注的第一圖像中的感興趣目標的初始邊界框信息,所述初始邊界框信息為基于標注人員的標注得到;
17、通過圖像分割模型的圖像編碼器基于所述第一圖像,生成圖像嵌入向量;
18、通過圖像分割模型的提示編碼器基于所述初始邊界框信息,生成稀疏嵌入向量;
19、通過圖像分割模型的掩碼解碼器基于所述圖像嵌入向量和所述稀疏嵌入向量,生成所述第一圖像中的感興趣目標的掩碼,以及基于所述第一圖像中的感興趣目標的掩碼,對所述第一圖像中的感興趣目標進行標注。
20、第四方面,本申請?zhí)峁┮环N計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上第一方面所述的圖像標注方法中的步驟。
21、第五方面,本申請?zhí)峁┮环N計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上第一方面所述的圖像標注方法中的步驟。
22、本申請實施例采用的上述至少一個技術(shù)方案能夠達到以下有益效果:
23、采用本申請實施例提供的圖像標注方法,能夠獲取待標注的第一圖像中標注人員的標注得到的感興趣目標的初始邊界框信息,以及通過圖像分割模型的圖像編碼器基于第一圖像,生成圖像嵌入向量,并通過圖像分割模型的提示編碼器基于初始邊界框信息,生成稀疏嵌入向量,最后通過圖像分割模型的掩碼解碼器以稀疏嵌入向量作為感興趣目標的提示信息,在圖像嵌入向量中進行檢索,便可生成第一圖像中的感興趣目標的掩碼,最后基于第一圖像中的感興趣目標的掩碼,便可實現(xiàn)對第一圖像中的感興趣目標的精準標注。由于能夠利用圖像分割模型以初始邊界框信息為提示信息在第一圖像中預(yù)測更為精準的感興趣目標的掩碼,使得最終基于該感興趣目標的掩碼確定的標注信息更加貼合感興趣目標的形狀,保證了標注結(jié)果的精確度,同時也能減少標注人員因經(jīng)驗和判斷標準不同影響標注結(jié)果的可靠性。
1.一種圖像標注方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取待標注的第一圖像中的感興趣目標的初始邊界框信息,包括:
3.如權(quán)利要求1所述的方法,其特征在于,所述通過圖像分割模型的圖像編碼器基于所述第一圖像,生成圖像嵌入向量,包括:
4.如權(quán)利要求1所述的方法,其特征在于,所述獲取待標注的第一圖像中的感興趣目標的初始邊界框信息,包括:
5.如權(quán)利要求3所述的方法,其特征在于,所述基于所述第一圖像中的感興趣目標的掩碼,對所述第一圖像中的感興趣目標進行標注,包括:
6.如權(quán)利要求3所述的方法,其特征在于,所述基于所述第一圖像中的感興趣目標的掩碼,對所述第一圖像中的感興趣目標進行標注,包括:
7.一種圖像標注裝置,其特征在于,包括:
8.一種計算裝置,其特征在于,包括:存儲器和處理器;
9.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的方法中的步驟。
10.一種計算機程序產(chǎn)品,其特征在于,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6任一項所述的方法中的步驟。