本技術(shù)涉及計算機,尤其涉及圖像識別和模型訓(xùn)練方法及裝置。
背景技術(shù):
1、圖像識別,是指識別圖像所示內(nèi)容的特征或類別等。為進(jìn)行圖像識別,常采用神經(jīng)網(wǎng)絡(luò)進(jìn)行識別。然而利用神經(jīng)網(wǎng)絡(luò)進(jìn)行識別時,依賴于神經(jīng)網(wǎng)絡(luò)的識別能力,也即訓(xùn)練神經(jīng)網(wǎng)絡(luò)所采用的訓(xùn)練數(shù)據(jù)。若該訓(xùn)練數(shù)據(jù)的場景不完整或者分布不均勻等,得到的神經(jīng)網(wǎng)絡(luò)將僅能識別某一場景下的圖像。因此,在輸入神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)與前述訓(xùn)練數(shù)據(jù)所屬場景不同時,神經(jīng)網(wǎng)絡(luò)對該輸入數(shù)據(jù)的識別效果將較差。因此,如何提高模型對圖像的識別效果成為目前亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供了圖像識別和模型訓(xùn)練方法及裝置,以解決在屬于多種場景下的待處理數(shù)據(jù)輸入模型時,由于訓(xùn)練模型所采用的訓(xùn)練數(shù)據(jù)場景單一,導(dǎo)致該模型對待處理數(shù)據(jù)的識別效果較差的問題。
2、第一方面,本技術(shù)提供了一種圖像識別方法。該圖像識別方法可應(yīng)用于圖像識別系統(tǒng)或應(yīng)用于支持該圖像識別系統(tǒng)實現(xiàn)圖像識別方法的計算設(shè)備。該計算設(shè)備如服務(wù)器或終端等。該圖像識別方法包括:獲取待處理圖像,調(diào)整該待處理圖像中像素點的像素值,得到預(yù)處理圖像,進(jìn)而將該預(yù)處理圖像輸入識別模型,得到待處理圖像所屬的類別。其中,該預(yù)處理圖像的特征與識別模型的源域的特征間相似度達(dá)到第一閾值,該識別模型用于識別圖像所屬的類別。
3、在本技術(shù)中,通過對待處理圖像的像素進(jìn)行了調(diào)整,使得到的預(yù)處理圖像的特征與識別模型的源域的特征相似度達(dá)到第一閾值,進(jìn)而,該預(yù)處理圖像貼近識別模型的源域,從而提高了識別模型對待處理圖像的識別準(zhǔn)確度和識別模型進(jìn)行圖像識別的魯棒性。以及,在識別模型對屬于源域的圖像識別率較高時,由于該預(yù)處理圖像貼近源域,因此識別模型對該預(yù)處理圖像的識別率同樣較高,從而進(jìn)一步提高了識別模型得到不同領(lǐng)域的待處理圖像所屬類別的準(zhǔn)確度。
4、在一種可能的實現(xiàn)方式中,上述調(diào)整待處理圖像中像素點的像素值,得到預(yù)處理圖像,包括:將待處理圖像輸入預(yù)處理模型,得到預(yù)處理圖像。其中,該預(yù)處理模型用于調(diào)整圖像中像素點的像素值,該預(yù)處理模型經(jīng)過待處理圖像所屬領(lǐng)域的訓(xùn)練數(shù)據(jù)訓(xùn)練。
5、在本技術(shù)中,由于該預(yù)處理模型經(jīng)待處理圖像所屬領(lǐng)域的訓(xùn)練數(shù)據(jù)訓(xùn)練,因此,該預(yù)處理模型學(xué)習(xí)到了對該待處理圖像所屬領(lǐng)域的圖像進(jìn)行調(diào)整的能力,利用該預(yù)處理模型對待處理模型的像素點進(jìn)行調(diào)整,得到的預(yù)處理圖像的特征與上述源域的特征相似度達(dá)到第一閾值,進(jìn)而提高了識別模型得到該待處理圖像所屬類別的準(zhǔn)確度。
6、在一種可能的情形中,在訓(xùn)練過程中,該預(yù)處理模型可利用上述訓(xùn)練數(shù)據(jù)進(jìn)行單獨訓(xùn)練,或者將預(yù)處理模型與識別模型結(jié)合進(jìn)行訓(xùn)練。在將預(yù)處理模型與識別模型結(jié)合進(jìn)行訓(xùn)練時,該識別模型將被凍結(jié),即該識別模型的參數(shù)在訓(xùn)練過程中不會變化。
7、示例性的,在上述訓(xùn)練過程中,若預(yù)處理模型的損失函數(shù)收斂、訓(xùn)練數(shù)據(jù)使用完畢或者訓(xùn)練時迭代次數(shù)達(dá)到設(shè)定閾值等時,結(jié)束對預(yù)處理模型的訓(xùn)練。
8、在一種可能的實現(xiàn)方式中,上述將待處理圖像輸入預(yù)處理模型,得到預(yù)處理圖像,包括:將待處理圖像輸入預(yù)處理模型,并由預(yù)處理模型識別待處理圖像該待處理圖像所屬的領(lǐng)域,進(jìn)而采用與待處理圖像所屬的領(lǐng)域匹配的調(diào)整策略,對該待處理圖像中的像素點對應(yīng)調(diào)整,從而得到預(yù)處理圖像。
9、在本技術(shù)中,預(yù)處理模型針對不同領(lǐng)域的圖像分別采用對應(yīng)調(diào)整策略,來對圖像的像素點進(jìn)行調(diào)整,實現(xiàn)根據(jù)待處理圖像所屬的領(lǐng)域進(jìn)行適應(yīng)性調(diào)整,以確保調(diào)整后的預(yù)處理圖像的特征與上述源域的特征間相似度達(dá)到第一閾值,進(jìn)而提高了識別模型確定該待處理圖像所屬類別的準(zhǔn)確度。
10、在一種可能的實現(xiàn)方式中,上述預(yù)處理模型包括第一子模型和第二子模型;該第一子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度低于第二閾值部分對應(yīng)一個或多個像素點的像素值,該待處理圖像中的多個像素點對應(yīng)待處理圖像的一個特征;該第二子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度達(dá)到第二閾值部分對應(yīng)一個或多個像素點的像素值。
11、在本技術(shù)中,利用第一子模型和第二子模型對不同的特征對應(yīng)的像素點進(jìn)行差異化調(diào)整,以確保經(jīng)第一子模型和第二子模型調(diào)整得到的預(yù)處理圖像的特征與上述源域的特征相似度達(dá)到第一閾值,進(jìn)而提高了識別模型確定該待處理圖像所屬類別的準(zhǔn)確度。
12、在一種可能的實現(xiàn)方式中,上述第一子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù);上述第二子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù)與穩(wěn)態(tài)正則項,該穩(wěn)態(tài)正則項用于指示:若訓(xùn)練過程中訓(xùn)練數(shù)據(jù)所屬領(lǐng)域變化,調(diào)整預(yù)處理模型中變化范圍超出第三閾值的參數(shù)。
13、在本技術(shù)中,通過對第一子模型和第二子模型設(shè)置不同的損失函數(shù),以使第一子模型和第二子模型分別學(xué)習(xí)到待處理圖像的特征中,與源域的特征相似度低于第二閾值部分特征的差異,以及相似度達(dá)到第二閾值部分特征的差異,從而實現(xiàn)第一子模型和第二子模型分別對不同的特征對應(yīng)的像素點進(jìn)行差異化調(diào)整。
14、第二方面,本技術(shù)提供了一種圖像識別的模型訓(xùn)練方法。該圖像識別的模型訓(xùn)練方法可應(yīng)用于圖像識別系統(tǒng)或應(yīng)用于支持該圖像識別系統(tǒng)實現(xiàn)圖像識別的模型訓(xùn)練方法的計算設(shè)備。該計算設(shè)備如服務(wù)器或終端等。該圖像識別的模型訓(xùn)練方法包括:獲取多種領(lǐng)域的訓(xùn)練數(shù)據(jù),利用該多種領(lǐng)域的訓(xùn)練數(shù)據(jù)對預(yù)處理模型進(jìn)行訓(xùn)練。其中,該預(yù)處理模型用于調(diào)整圖像中像素點的像素值,待處理圖像輸入訓(xùn)練后的預(yù)處理模型,得到預(yù)處理圖像的特征與識別模型的源域的特征相似度達(dá)到第一閾值,該識別模型用于識別圖像所屬的類別。
15、在本技術(shù)中,利用多種領(lǐng)域的訓(xùn)練數(shù)據(jù)僅對預(yù)處理模型進(jìn)行訓(xùn)練,而識別模型不會進(jìn)行訓(xùn)練,進(jìn)而避免了在多領(lǐng)域適應(yīng)時對識別模型進(jìn)行訓(xùn)練,導(dǎo)致的該識別模型退化和災(zāi)難性遺忘的問題,即識別模型對屬于源域的圖像的識別精度不會變化。經(jīng)訓(xùn)練后的預(yù)處理模型調(diào)整得到的預(yù)處理圖像的特征與源域的特征相似度達(dá)到第一閾值,即預(yù)處理圖像貼近識別模型的源域,從而提高了識別模型對該預(yù)處理圖像的識別準(zhǔn)確度。
16、示例性的,可將上述預(yù)處理模型進(jìn)行單獨訓(xùn)練,或者將預(yù)處理模型與識別模型結(jié)合進(jìn)行訓(xùn)練。在將預(yù)處理模型與識別模型結(jié)合進(jìn)行訓(xùn)練時,該識別模型將被凍結(jié),即該識別模型的參數(shù)在訓(xùn)練過程中不會變化。
17、在一種可能的實現(xiàn)方式中,上述預(yù)處理模型包括第一子模型和第二子模型;該第一子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度低于第二閾值部分對應(yīng)一個或多個像素點的像素值,該待處理圖像中的多個像素點對應(yīng)待處理圖像的一個特征;該第二子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度達(dá)到第二閾值部分對應(yīng)一個或多個像素點的像素值。
18、在本技術(shù)中,利用第一子模型和第二子模型對不同的特征對應(yīng)的像素點進(jìn)行差異化調(diào)整,以確保經(jīng)第一子模型和第二子模型調(diào)整得到的預(yù)處理圖像的特征與上述源域的特征相似度達(dá)到第一閾值,進(jìn)而提高了識別模型確定該待處理圖像所屬類別的準(zhǔn)確度。
19、在一種可能的實現(xiàn)方式中,上述第一子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù);上述第二子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù)與穩(wěn)態(tài)正則項,該穩(wěn)態(tài)正則項用于指示:若訓(xùn)練過程中訓(xùn)練數(shù)據(jù)所屬領(lǐng)域變化,調(diào)整預(yù)處理模型中變化范圍超出第三閾值的參數(shù)。
20、在本技術(shù)中,通過對第一子模型和第二子模型設(shè)置不同的損失函數(shù),以使第一子模型和第二子模型分別學(xué)習(xí)到待處理圖像的特征中,與源域的特征相似度低于第二閾值部分特征的差異,以及相似度達(dá)到第二閾值部分特征的差異,從而實現(xiàn)第一子模型和第二子模型分別對不同的特征對應(yīng)的像素點進(jìn)行差異化調(diào)整。
21、第三方面,本技術(shù)提供了一種圖像識別裝置,該圖像識別裝置應(yīng)用于計算設(shè)備或應(yīng)用于支持該識別系統(tǒng)實現(xiàn)圖像識別方法的計算設(shè)備,該圖像識別裝置包括用于執(zhí)行第一方面或第一方面任一種可選實現(xiàn)方式中的定位方法的各個模塊。示例的,該圖像識別裝置包括:獲取模塊、調(diào)整模塊和識別模塊。其中,
22、該獲取模塊,用于獲取待處理圖像。
23、該調(diào)整模塊,用于調(diào)整該待處理圖像中像素點的像素值,得到預(yù)處理圖像;該預(yù)處理圖像的特征與識別模型的源域的特征間相似度達(dá)到第一閾值;該識別模型用于識別圖像所屬的類別。
24、該識別模塊,用于將預(yù)處理圖像輸入識別模型,得到待處理圖像所屬的類別。
25、在一種可能的實現(xiàn)方式中,上述調(diào)整模塊,具體用于將待處理圖像輸入預(yù)處理模型,得到預(yù)處理圖像;其中,該預(yù)處理模型用于調(diào)整圖像中像素點的像素值,預(yù)處理模型經(jīng)過待處理圖像所屬領(lǐng)域的訓(xùn)練數(shù)據(jù)訓(xùn)練。
26、在一種可能的實現(xiàn)方式中,上述調(diào)整模塊,還具體用于將待處理圖像輸入預(yù)處理模型;并由預(yù)處理模型識別待處理圖像所屬的領(lǐng)域,進(jìn)而采用與待處理圖像所屬的領(lǐng)域匹配的調(diào)整策略,對待處理圖像中的像素點對應(yīng)調(diào)整,從而得到預(yù)處理圖像。
27、在一種可能的實現(xiàn)方式中,上述預(yù)處理模型包括第一子模型和第二子模型;該第一子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度低于第二閾值部分對應(yīng)一個或多個像素點的像素值,該待處理圖像中的多個像素點對應(yīng)待處理圖像的一個特征;該第二子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度達(dá)到第二閾值部分對應(yīng)一個或多個像素點的像素值。
28、在一種可能的實現(xiàn)方式中,上述第一子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù);上述第二子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù)與穩(wěn)態(tài)正則項,該穩(wěn)態(tài)正則項用于指示:若訓(xùn)練過程中訓(xùn)練數(shù)據(jù)所屬領(lǐng)域變化,調(diào)整預(yù)處理模型中變化范圍超出第三閾值的參數(shù)。
29、第四方面,本技術(shù)提供了一種圖像識別的模型訓(xùn)練裝置。該圖像識別的模型訓(xùn)練裝置應(yīng)用于計算設(shè)備或應(yīng)用于支持該識別系統(tǒng)實現(xiàn)圖像識別的模型訓(xùn)練方法的計算設(shè)備,該圖像識別的模型訓(xùn)練裝置包括用于執(zhí)行第一方面或第一方面任一種可選實現(xiàn)方式中的圖像識別的模型訓(xùn)練方法的各個模塊。示例的,該圖像識別的模型訓(xùn)練裝置包括:獲取模塊和訓(xùn)練模塊。其中,
30、該獲取模塊,用于獲取多種領(lǐng)域的訓(xùn)練數(shù)據(jù)。
31、該訓(xùn)練模塊,用于利用多種領(lǐng)域的訓(xùn)練數(shù)據(jù)對預(yù)處理模型進(jìn)行訓(xùn)練;該預(yù)處理模型用于調(diào)整圖像中像素點的像素值;其中,待處理圖像輸入訓(xùn)練后的預(yù)處理模型,得到的預(yù)處理圖像的特征與識別模型的源域的特征相似度達(dá)到第一閾值,該識別模型用于識別圖像所屬的類別。
32、在一種可能的實現(xiàn)方式中,上述預(yù)處理模型包括第一子模型和第二子模型;該第一子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度低于第二閾值部分對應(yīng)一個或多個像素點的像素值,該待處理圖像中的多個像素點對應(yīng)待處理圖像的一個特征;該第二子模型用于調(diào)整待處理圖像的特征中,與源域的特征相似度達(dá)到第二閾值部分對應(yīng)一個或多個像素點的像素值。
33、在一種可能的實現(xiàn)方式中,上述第一子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù);上述第二子模型對應(yīng)的損失函數(shù)為交叉熵?fù)p失函數(shù)與穩(wěn)態(tài)正則項,該穩(wěn)態(tài)正則項用于指示:若訓(xùn)練過程中訓(xùn)練數(shù)據(jù)所屬領(lǐng)域變化,調(diào)整預(yù)處理模型中變化范圍超出第三閾值的參數(shù)。
34、第五方面,本技術(shù)提供一種芯片,該芯片包括:接口電路和供電電路;該接口電路用于獲取分析請求,該控制電路用于執(zhí)行上述第一方面或第一方面中任一種可能實現(xiàn)方式中的方法,或者,上述第二方面或第二方面中任一種可能實現(xiàn)方式中的方法。
35、第六方面,本技術(shù)提供了一種計算設(shè)備。該計算設(shè)備包括存儲器和處理器,該存儲器用于存儲計算機指令;該處理器執(zhí)行計算機指令時,實現(xiàn)上述第一方面或第一方面中任一種可能實現(xiàn)方式中的方法,或者,上述第二方面或第二方面中任一種可能實現(xiàn)方式中的方法。該計算設(shè)備可以是指服務(wù)器、個人電腦。
36、第七方面,提供了一種圖像識別系統(tǒng),圖像識別系統(tǒng)包括訓(xùn)練設(shè)備和至少一個終端,至少一個終端與訓(xùn)練設(shè)備連接,該至少一個終端用于執(zhí)行第一方面或第一方面中任一種可能實現(xiàn)方式中的方法,該訓(xùn)練設(shè)備用于執(zhí)行第二方面或第二方面中任一種可能實現(xiàn)方式中的方法。
37、第八方面,本技術(shù)提供一種計算機可讀存儲介質(zhì),該存儲介質(zhì)中存儲有計算機程序或指令,當(dāng)計算機程序或指令被計算設(shè)備執(zhí)行時,實現(xiàn)上述第一方面或第一方面中任一種可能實現(xiàn)方式中的方法,或者,第二方面或第二方面中任一種可能實現(xiàn)方式中的方法。
38、第九方面,本技術(shù)提供一種計算機程序產(chǎn)品,該計算程序產(chǎn)品包括計算機程序或指令,當(dāng)該計算機程序或指令被計算設(shè)備執(zhí)行時,實現(xiàn)上述第一方面或第一方面中任一種可選實現(xiàn)方式中的方法,或者,第二方面或第二方面中任一種可能實現(xiàn)方式中的方法。
39、以上第三方面至第九方面的有益效果可參照第一方面或第一方面中任一種實現(xiàn)方式的描述,在此不予贅述。本技術(shù)在上述各方面提供的實現(xiàn)方式的基礎(chǔ)上,還可以進(jìn)行進(jìn)一步組合以提供更多實現(xiàn)方式。