本發(fā)明涉及與通過使用機(jī)器學(xué)習(xí)來檢測特定被攝體的經(jīng)訓(xùn)練模型相關(guān)的圖像處理設(shè)備、攝像設(shè)備以及這些設(shè)備的控制方法。
背景技術(shù):
1、被攝體檢測是計(jì)算機(jī)視覺研究的一個領(lǐng)域,并且目前已被廣泛研究。計(jì)算機(jī)視覺是一種理解已經(jīng)輸入到計(jì)算機(jī)的圖像并自動識別圖像的各種特征的技術(shù)。在該技術(shù)中,被攝體檢測是用于估計(jì)圖像中存在的被攝體的位置和類型的任務(wù)。被攝體檢測被應(yīng)用于攝像設(shè)備的自動調(diào)焦技術(shù)等。
2、近年來,已知有通過以神經(jīng)網(wǎng)絡(luò)等為代表的機(jī)器學(xué)習(xí)方案來檢測被攝體的圖像處理設(shè)備。通過使用與特定被攝體相對應(yīng)的經(jīng)訓(xùn)練模型(詞典數(shù)據(jù)),這種圖像處理設(shè)備檢測特定被攝體以進(jìn)行攝像控制。作為特定被攝體的類型,人物、諸如狗或貓等的動物、或者諸如汽車等的運(yùn)載工具是代表性的,這是對于攝像設(shè)備的自動調(diào)焦(af)功能需求高的被攝體。
3、日本特開2021-57672公開了一種從用戶收集圖像并通過附加學(xué)習(xí)檢測適合用戶的af點(diǎn)的圖像處理設(shè)備。然而,由于圖像被自動分類以進(jìn)行學(xué)習(xí),所以難以檢測用戶期望檢測的任何新被攝體。
4、引文列表
5、專利文獻(xiàn)
6、專利文獻(xiàn)1:日本特開2021-57672
技術(shù)實(shí)現(xiàn)思路
1、發(fā)明要解決的問題
2、此外,為了生成能夠檢測用戶期望檢測的任何新被攝體的詞典數(shù)據(jù),用戶需要提供該被攝體的教師數(shù)據(jù)。然而,在一些情況下,用戶可以準(zhǔn)備的數(shù)據(jù)(正實(shí)例的教師數(shù)據(jù))的數(shù)量少,并且出現(xiàn)了未獲取具有足夠檢測性能水平的詞典數(shù)據(jù)的問題。
3、用于解決問題的方案
4、本發(fā)明的目的是提供一種能夠從少量的正實(shí)例數(shù)據(jù)生成或使用具有一定水平或更高的檢測性能的詞典數(shù)據(jù)的圖像處理設(shè)備。
5、為實(shí)現(xiàn)上述目的,本發(fā)明的圖像處理設(shè)備包括:第一獲取部件,用于獲取包括針對第一對象的正實(shí)例的圖像數(shù)據(jù)的第一教師數(shù)據(jù);第二獲取部件,用于獲取包括針對所述第一對象的負(fù)實(shí)例的圖像數(shù)據(jù)的第二教師數(shù)據(jù);以及生成部件,用于基于所述第一獲取部件和所述第二獲取部件所獲取的教師數(shù)據(jù),來生成用于檢測所述第一對象的第一詞典數(shù)據(jù),所述圖像處理設(shè)備的特征在于,所述學(xué)習(xí)部件對第二詞典數(shù)據(jù)進(jìn)行附加學(xué)習(xí)以生成所述第一詞典數(shù)據(jù),并且所述第一獲取部件所獲取的第一教師數(shù)據(jù)的數(shù)量小于所述第二獲取部件所獲取的第二教師數(shù)據(jù)的數(shù)量。
6、發(fā)明的效果
7、根據(jù)本發(fā)明,可以從少量的正實(shí)例數(shù)據(jù)生成或使用具有一定水平或更高的檢測性能的詞典數(shù)據(jù)。
1.一種圖像處理設(shè)備,包括:
2.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其特征在于,獲取到所述第一教師數(shù)據(jù)的位置與獲取到所述第二教師數(shù)據(jù)的位置不同。
3.根據(jù)權(quán)利要求1或2所述的圖像處理設(shè)備,其特征在于,所述第一教師數(shù)據(jù)中的至少一個是從用戶提供的教師數(shù)據(jù)。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述第二獲取部件獲取預(yù)先準(zhǔn)備的數(shù)據(jù)。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,除所獲取的第一教師數(shù)據(jù)之外,所述第一獲取部件還獲取所述第二教師數(shù)據(jù)。
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述第二對象是通過進(jìn)一步限制所述第一對象而獲得的。
7.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述第一對象是特征性被攝體區(qū)域。
8.根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述第一對象是特定被攝體。
9.根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述學(xué)習(xí)部件包括判斷部件,所述判斷部件用于判斷除所述第二獲取部件所獲取的第二教師數(shù)據(jù)之外,是否還由所述第二獲取部件進(jìn)一步獲取包括負(fù)實(shí)例的圖像數(shù)據(jù)的第二教師數(shù)據(jù)。
10.根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述第一獲取部件所獲取的第一教師數(shù)據(jù)的數(shù)量是100或少于100,并且所述第二獲取部件所獲取的數(shù)據(jù)的數(shù)量是101或多于101。
11.根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,包括控制部件,所述控制部件用于基于所述學(xué)習(xí)部件所生成的詞典數(shù)據(jù)來進(jìn)行被攝體檢測以進(jìn)行拍攝控制。
12.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的圖像處理設(shè)備,其特征在于,所述學(xué)習(xí)部件將利用所述第一獲取部件所獲取的數(shù)據(jù)進(jìn)行學(xué)習(xí)的情況下的損失函數(shù)的系數(shù)設(shè)置為大于利用所述第二獲取部件所獲取的數(shù)據(jù)進(jìn)行學(xué)習(xí)的情況下的損失函數(shù)的系數(shù)。
13.一種攝像設(shè)備,包括:
14.一種圖像處理設(shè)備的控制方法,所述控制方法包括:
15.一種攝像設(shè)備的控制方法,所述控制方法包括: