本公開涉及機(jī)器視覺技術(shù),尤其涉及一種識(shí)別模型確定方法及裝置。
背景技術(shù):
隨著計(jì)算機(jī)技術(shù)的發(fā)展,可以通過機(jī)器學(xué)習(xí)的方法確定識(shí)別模型,再采用該識(shí)別模型對(duì)圖像中的目標(biāo)物體或文字進(jìn)行識(shí)別。
相關(guān)技術(shù)中,采用以下方法確定識(shí)別模型:對(duì)樣本集進(jìn)行標(biāo)定,確定標(biāo)定結(jié)果,確定一個(gè)初始的識(shí)別模型,再將樣本集中的每個(gè)樣本輸入該初始的識(shí)別模型,確定識(shí)別結(jié)果,根據(jù)標(biāo)定結(jié)果及識(shí)別結(jié)果確定損失函數(shù),再根據(jù)損失函數(shù)對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的模型,重復(fù)上述步驟,直至損失函數(shù)收斂,最終會(huì)確定一個(gè)識(shí)別模型。
技術(shù)實(shí)現(xiàn)要素:
為克服相關(guān)技術(shù)中存在的問題,本公開提供一種識(shí)別模型確定方法及裝置。
根據(jù)本公開實(shí)施例的第一方面,提供一種識(shí)別模型確定方法,包括:
將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果;
根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值;
根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定所述N個(gè)樣本的損失函數(shù);
根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法對(duì)所述初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從所述樣本集中再次選擇任意N個(gè)樣本輸入所述更新后的識(shí)別模型,確定所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂;
采用收斂的損失函數(shù)確定最終的識(shí)別模型。
結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值,包括:
若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定所述樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值;
若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定所述樣本的權(quán)重值為所述預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù);其中,所述預(yù)設(shè)參數(shù)為大于1的數(shù)。
結(jié)合第一方面,在第一方面的第二種可能的實(shí)現(xiàn)方式中,所述根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值,包括:
若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定所述樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù);其中,所述第二預(yù)設(shè)參數(shù)為小于1的數(shù);
若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定所述樣本的權(quán)重值為所述預(yù)設(shè)權(quán)重初始值除以所述第二預(yù)設(shè)參數(shù)。
結(jié)合第一方面或第一方面的第一種可能的實(shí)現(xiàn)方式或第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定所述N個(gè)樣本的損失函數(shù),包括:
根據(jù)樣本的標(biāo)定結(jié)果及樣本的識(shí)別結(jié)果確定所述樣本的初始損失函數(shù);
根據(jù)所述樣本的初始損失函數(shù)及所述樣本的權(quán)重值確定所述樣本的最終損失函數(shù);
將每個(gè)樣本的最終損失函數(shù)進(jìn)行相加,確定所述N個(gè)樣本的損失函數(shù)。
結(jié)合第一方面的第三種可能的實(shí)現(xiàn)方式,在第一方面的第四種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述樣本的初始損失函數(shù)及所述樣本的權(quán)重值確定所述樣本的最終損失函數(shù),包括:
將所述樣本的初始損失函數(shù)乘以所述樣本的權(quán)重值獲取所述樣本的最終損失函數(shù)。
結(jié)合第一方面,在第一方面的第五種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法對(duì)所述初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,包括:
根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法確定所述初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值;
根據(jù)所述初始的識(shí)別模型中的各所述初始參數(shù)的學(xué)習(xí)力及各所述初始參數(shù)對(duì)應(yīng)的梯度值確定所述初始的識(shí)別模型中各更新后的參數(shù);
用各所述更新后的參數(shù)替換各所述初始參數(shù)獲取所述更新后的識(shí)別模型。
結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第一方面的第六種可能的實(shí)現(xiàn)方式中,所述根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,包括:
若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值;
若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以所述第一預(yù)設(shè)參數(shù)。
結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第一方面的第七種可能的實(shí)現(xiàn)方式中,所述根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,包括:
若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以所述第二預(yù)設(shè)參數(shù);
若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值除以所述第二預(yù)設(shè)參數(shù)。
根據(jù)本公開實(shí)施例的第二方面,提供一種識(shí)別模型確定裝置,包括:
獲取模塊,被配置為將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果;
第一確定模塊,被配置為根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及根據(jù)所述獲取模塊獲取的每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值;
第二確定模塊,被配置為根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、根據(jù)所述獲取模塊獲取的識(shí)別結(jié)果及根據(jù)所述第一確定模塊確定的權(quán)重值確定所述N個(gè)樣本的損失函數(shù);
第三確定模塊,被配置為根據(jù)所述第二確定模塊確定的損失函數(shù)及隨機(jī)梯度下降方法對(duì)所述初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從所述樣本集中再次選擇任意N個(gè)樣本輸入所述更新后的識(shí)別模型,確定所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂;
第四確定模塊,被配置為采用收斂的損失函數(shù)確定最終的識(shí)別模型。
結(jié)合第二方面,在第二方面的第一種可能的實(shí)現(xiàn)方式中,所述第一確定模塊包括:
第一確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定所述樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值;
第二確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定所述樣本的權(quán)重值為所述預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù);其中,所述預(yù)設(shè)參數(shù)為大于1的數(shù)。
結(jié)合第二方面,在第二方面的第二種可能的實(shí)現(xiàn)方式中,所述第一確定模塊包括:
第三確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定所述樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù);其中,所述第二預(yù)設(shè)參數(shù)為小于1的數(shù);
第四確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定所述樣本的權(quán)重值為所述預(yù)設(shè)權(quán)重初始值除以所述第二預(yù)設(shè)參數(shù)。
結(jié)合第二方面或第二方面的第一種可能的實(shí)現(xiàn)方式或第二方面的第二種可能的實(shí)現(xiàn)方式,在第二方面的第三種可能的實(shí)現(xiàn)方式中,所述第二確定模塊包括:
第五確定子模塊,被配置為根據(jù)樣本的標(biāo)定結(jié)果及樣本的識(shí)別結(jié)果確定所述樣本的初始損失函數(shù);
第六確定子模塊,被配置為根據(jù)所述第五確定子模塊確定的樣本的初始損失函數(shù)及所述樣本的權(quán)重值確定所述樣本的最終損失函數(shù);
第七確定子模塊,被配置為將所述第六確定子模塊確定的每個(gè)樣本的最終損失函數(shù)進(jìn)行相加,確定所述N個(gè)樣本的損失函數(shù)。
結(jié)合第二方面的第三種可能的實(shí)現(xiàn)方式,在第二方面的第四種可能的實(shí)現(xiàn)方式中,所述第六確定子模塊包括:
獲取單元,被配置為將所述樣本的初始損失函數(shù)乘以所述樣本的權(quán)重值獲取所述樣本的最終損失函數(shù)。
結(jié)合第二方面,在第二方面的第五種可能的實(shí)現(xiàn)方式中,所述第三確定模塊包括:
第八確定子模塊,被配置為根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法確定所述初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值;
第九確定子模塊,被配置為根據(jù)所述初始的識(shí)別模型中的各所述初始參數(shù)的學(xué)習(xí)力及所述第八確定子模塊確定的各所述初始參數(shù)對(duì)應(yīng)的梯度值確定所述初始的識(shí)別模型中各更新后的參數(shù);
獲取子模塊,被配置為用根據(jù)所述第九確定子模塊確定的各所述更新后的參數(shù)替換各所述初始參數(shù)獲取所述更新后的識(shí)別模型。
結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二方面的第六種可能的實(shí)現(xiàn)方式中,所述第三確定模塊包括:
第十確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值;
第十一確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以所述第一預(yù)設(shè)參數(shù)。
結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第二方面的第七種可能的實(shí)現(xiàn)方式中,所述第三確定模塊包括:
第十二確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以所述第二預(yù)設(shè)參數(shù);
第十三確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定所述樣本的更新后的權(quán)重值為上一次確定的權(quán)重值除以所述第二預(yù)設(shè)參數(shù)。
根據(jù)本公開實(shí)施例的第三方面,提供一種識(shí)別模型確定裝置,包括:
處理器;
用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:
將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果;
根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值;
根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定所述N個(gè)樣本的損失函數(shù);
根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法對(duì)所述初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從所述樣本集中再次選擇任意N個(gè)樣本輸入所述更新后的識(shí)別模型,確定所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂;
采用收斂的損失函數(shù)確定最終的識(shí)別模型。
本公開的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
一個(gè)實(shí)施例中,通過將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定N個(gè)樣本的損失函數(shù),根據(jù)損失函數(shù)及隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從樣本集中再次選擇任意N個(gè)樣本輸入更新后的識(shí)別模型,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂,采用收斂的損失函數(shù)確定最終的識(shí)別模型,實(shí)現(xiàn)了在確定最終的識(shí)別模型的過程中,可以根據(jù)識(shí)別結(jié)果和標(biāo)定結(jié)果確定樣本的權(quán)重值,在確定損失函數(shù)時(shí),考慮到樣本的權(quán)重值,使得在根據(jù)損失函數(shù)和隨機(jī)梯度下降算法更新識(shí)別模型時(shí),會(huì)往正確的方向更新,從而會(huì)使損失函數(shù)收斂得更快,提高了確定識(shí)別模型的效率。另外,由于在識(shí)別模型確定的過程中,損失函數(shù)與樣本的權(quán)重值有關(guān),從而,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
附圖說明
此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實(shí)施例,并與說明書一起用于解釋本公開的原理。
圖1是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定方法的流程圖;
圖2是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖3是根據(jù)另一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖4是根據(jù)又一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖5是根據(jù)再一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖6是根據(jù)另一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖7是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖8是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖;
圖9是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。
通過上述附圖,已示出本公開明確的實(shí)施例,后文中將有更詳細(xì)的描述。這些附圖和文字描述并不是為了通過任何方式限制本公開構(gòu)思的范圍,而是通過參考特定實(shí)施例為本領(lǐng)域技術(shù)人員說明本公開的概念。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本公開相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。
圖1是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定方法的流程圖。如圖1所示,本公開實(shí)施例提供的識(shí)別模型確定方法包括以下步驟:
在步驟101中,將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果。
本公開實(shí)施例中的識(shí)別模型確定方法可以由具有計(jì)算能力的計(jì)算設(shè)備執(zhí)行,例如,計(jì)算機(jī)、終端設(shè)備及個(gè)人數(shù)字助理等。本公開實(shí)施例中可以采用改進(jìn)后的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network;簡稱:CNN)訓(xùn)練方法確定出識(shí)別模型。在采用改進(jìn)后的CNN訓(xùn)練方法確定識(shí)別模型的過程中,可以采用深度學(xué)習(xí)算法中的過程,輸入樣本集,進(jìn)行模型訓(xùn)練。最終確定出一個(gè)通過對(duì)海量樣本進(jìn)行學(xué)習(xí)、訓(xùn)練而獲得的識(shí)別模型。
可選的,本公開實(shí)施例中的樣本為圖像。樣本集由多個(gè)樣本組成。
初始的識(shí)別模型為參數(shù)是隨機(jī)配置的識(shí)別模型??蓪⑦@些隨機(jī)配置的參數(shù)稱為初始參數(shù)。將樣本集中的任意N個(gè)樣本均輸入初始化后的識(shí)別模型中,N即為批量大小(batchsize)。N為大于1的整數(shù)。同時(shí),還可以配置各參數(shù)對(duì)應(yīng)的學(xué)習(xí)力。學(xué)習(xí)力即為各參數(shù)在后續(xù)訓(xùn)練過程中的調(diào)整步長。在將樣本集中的樣本輸入初始的識(shí)別模型后,會(huì)輸出識(shí)別結(jié)果,則可獲取N個(gè)樣本中每個(gè)樣本的識(shí)別結(jié)果。該識(shí)別結(jié)果即為該初始的識(shí)別模型對(duì)該樣本學(xué)習(xí)后的結(jié)果。該過程也可以稱為第一次迭代的過程。
在一種實(shí)現(xiàn)方式中,初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果可以是一個(gè)介于0-1之間的值。舉例來說,N個(gè)樣本中有些樣本中有人像,有些樣本中沒有人像,需要確定出的最終的識(shí)別模型用于識(shí)別圖像中的人像,則在該第一次迭代過程中,對(duì)于某個(gè)樣本,該初始的識(shí)別模型的識(shí)別結(jié)果可以是0.8,其代表初始的識(shí)別模型認(rèn)為該樣本中,有人像的概率為0.8,對(duì)于另外一個(gè)樣本,該初始的識(shí)別模型的識(shí)別結(jié)果可以是0.2,其代表初始的識(shí)別模型認(rèn)為該樣本中,有人像的概率為0.2。
在另一種實(shí)現(xiàn)方式中,初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果可以是0或1。0代表初始的識(shí)別模型認(rèn)為該樣本中沒有目標(biāo)物體;1代表初始的識(shí)別模型認(rèn)為該樣本中具有目標(biāo)物體。這里的目標(biāo)物體可以是人像或其他需要識(shí)別的物體。
在步驟102中,根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值。
該每個(gè)樣本的標(biāo)定結(jié)果是預(yù)先獲取的。在步驟102之前,首先對(duì)樣本集中的每個(gè)樣本進(jìn)行標(biāo)定,獲取標(biāo)定結(jié)果。對(duì)每個(gè)樣本進(jìn)行標(biāo)定的意思是可以采用一段程序確定樣本集中的每個(gè)樣本的真值。舉例來說,如果需要訓(xùn)練識(shí)別模型識(shí)別人像,則樣本集中的樣本中有的是有人像的,有的是沒有人像的,可以采用程序?qū)颖居袩o人像確定出來,當(dāng)然,也可以人工進(jìn)行確定,確定樣本中有無人像的結(jié)果即為標(biāo)定結(jié)果。
根據(jù)步驟101和步驟102,初始的識(shí)別模型對(duì)N個(gè)樣本中的每個(gè)樣本有一個(gè)識(shí)別結(jié)果,每個(gè)樣本有一個(gè)標(biāo)定結(jié)果,此時(shí),可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值。在本公開實(shí)施例中,每個(gè)樣本的權(quán)重值表示的是在后續(xù)步驟中計(jì)算損失函數(shù)時(shí),識(shí)別模型對(duì)該樣本的識(shí)別結(jié)果產(chǎn)生的誤差在損失函數(shù)中所占的比例。
可以采用以下兩種可能的實(shí)現(xiàn)方式確定每個(gè)樣本的權(quán)重值:
在第一種可能的實(shí)現(xiàn)方式中,若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值;若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù);其中,預(yù)設(shè)參數(shù)為大于1的數(shù)。
當(dāng)初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果是介于0-1之間的值時(shí),可以預(yù)先確定一個(gè)閾值。如果識(shí)別結(jié)果大于該閾值,則認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果一致;如果識(shí)別結(jié)果小于或等于該閾值,則認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果不一致。當(dāng)初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果是0或1時(shí),當(dāng)樣本的識(shí)別結(jié)果是1時(shí),認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果一致;當(dāng)樣本的識(shí)別結(jié)果是0時(shí),認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果不一致。樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,代表該初始的識(shí)別模型對(duì)該樣本的識(shí)別是正確的,該樣本是一個(gè)比較容易識(shí)別的樣本;樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,代表該初始的識(shí)別模型對(duì)該樣本的識(shí)別是錯(cuò)誤的,該樣本是一個(gè)較難識(shí)別的樣本。
在本實(shí)現(xiàn)方式中,如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,即該樣本是一個(gè)比較容易識(shí)別的樣本,則確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值。如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,即該樣本是一個(gè)較難識(shí)別的樣本,則確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù),該預(yù)設(shè)參數(shù)為大于1的數(shù),即在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變大。需要說明的是,樣本集中所有樣本的預(yù)設(shè)權(quán)重初始值都是一樣的??蛇x的,該預(yù)設(shè)權(quán)重初始值可以是1。當(dāng)然,預(yù)設(shè)權(quán)重初始值也可以為其他的數(shù)值,本實(shí)施例對(duì)此不做限制。
在第二種可能的實(shí)現(xiàn)方式中,若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù);其中,第二預(yù)設(shè)參數(shù)為小于1的數(shù);若樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值除以第二預(yù)設(shè)參數(shù)。該實(shí)現(xiàn)方式與第一種可能的實(shí)現(xiàn)方式的區(qū)別在于,在第一種實(shí)現(xiàn)方式中,如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值,而在此種實(shí)現(xiàn)方式中,如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù),其中,第二預(yù)設(shè)參數(shù)為小于1的數(shù)。即,當(dāng)樣本是一個(gè)容易識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變??;當(dāng)樣本是一個(gè)較難識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變大。
在步驟103中,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定N個(gè)樣本的損失函數(shù)。
在確定出每個(gè)樣本的權(quán)重值之后,可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、每個(gè)樣本的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定N個(gè)樣本的損失函數(shù)。在本公開實(shí)施例中,損失函數(shù)表示的是N個(gè)樣本中標(biāo)定結(jié)果和識(shí)別結(jié)果之間誤差的程度、可以減小誤差的方向以及每個(gè)樣本的識(shí)別結(jié)果產(chǎn)生的誤差在損失函數(shù)中所占的比例。在一種可能的實(shí)現(xiàn)方式中,可以采用softmax網(wǎng)絡(luò)計(jì)算損失函數(shù)。
可選的,可以采用以下方式確定N個(gè)樣本的損失函數(shù):根據(jù)樣本的標(biāo)定結(jié)果及樣本的識(shí)別結(jié)果確定樣本的初始損失函數(shù);根據(jù)樣本的初始損失函數(shù)及樣本的權(quán)重值確定樣本的最終損失函數(shù);將每個(gè)樣本的最終損失函數(shù)進(jìn)行相加,確定N個(gè)樣本的損失函數(shù)。N個(gè)樣本的損失函數(shù)時(shí)每個(gè)樣本的最終損失函數(shù)進(jìn)行相加的結(jié)果。在根據(jù)樣本的初始損失函數(shù)及樣本的權(quán)重值確定樣本的最終損失函數(shù)時(shí),可以是將樣本的初始損失函數(shù)乘以樣本的權(quán)重值獲取該樣本的最終損失函數(shù)。即,在本公開實(shí)施例中,在確定損失函數(shù)時(shí),相較于相關(guān)技術(shù)中,根據(jù)識(shí)別結(jié)果和標(biāo)定結(jié)果確定N個(gè)樣本的損失函數(shù)的方式,考慮到了樣本的權(quán)重值。
在步驟104中,根據(jù)損失函數(shù)及隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從樣本集中再次選擇任意N個(gè)樣本輸入更新后的識(shí)別模型,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂。
在確定出損失函數(shù)后,可以對(duì)損失函數(shù)采用隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型的參數(shù)進(jìn)行調(diào)整,即對(duì)初始的識(shí)別模型進(jìn)行更新,得到更新后的識(shí)別模型。
在獲取更新后的識(shí)別模型中,一種可選的實(shí)現(xiàn)方式為:首先根據(jù)損失函數(shù)及隨機(jī)梯度下降方法確定初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值;根據(jù)初始的識(shí)別模型中的各初始參數(shù)的學(xué)習(xí)力及各初始參數(shù)對(duì)應(yīng)的梯度值確定初始的識(shí)別模型中各更新后的參數(shù),例如,可以采用學(xué)習(xí)力與梯度值相乘的方式,確定更新后的參數(shù);用各更新后的參數(shù)替換各初始參數(shù)獲取更新后的識(shí)別模型。
在獲取到更新后的識(shí)別模型后,再將樣本集中的任意N個(gè)樣本輸入該更新后的識(shí)別模型中,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果。該獲取識(shí)別結(jié)果的步驟與步驟101除了一個(gè)為更新后的識(shí)別模型、一個(gè)為初始的識(shí)別模型之外,其他的實(shí)現(xiàn)過程和技術(shù)原理類似。
需要說明的是,本步驟中的N個(gè)樣本可以是和步驟101中的N個(gè)樣本相同的N個(gè)樣本,也可以是和步驟101中的N個(gè)樣本中的部分樣本相同的N個(gè)樣本,也可以是和步驟101中的N個(gè)樣本中每個(gè)樣本都不同的N個(gè)樣本。本實(shí)施例對(duì)此不做限制。
更新后的識(shí)別模型對(duì)N個(gè)樣本中的每個(gè)樣本有一個(gè)識(shí)別結(jié)果,此時(shí),可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、每個(gè)樣本采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定每個(gè)樣本更新后的權(quán)重值。
可以采用以下兩種可能的實(shí)現(xiàn)方式確定每個(gè)樣本更新后的權(quán)重值:
在第一種可能的實(shí)現(xiàn)方式中,其與步驟102中的第一種可能的實(shí)現(xiàn)方式對(duì)應(yīng)。若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值;若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第一預(yù)設(shè)參數(shù)。
在第二種可能的實(shí)現(xiàn)方式中,其與步驟102中的第二種可能的實(shí)現(xiàn)方式對(duì)應(yīng)。若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第二預(yù)設(shè)參數(shù);若樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值除以第二預(yù)設(shè)參數(shù)。
需要說明的是,在第二次迭代中,上一次確定的權(quán)重值即為在第一次迭代中確定的樣本的權(quán)重值。在第M次迭代中,上一次確定的權(quán)重值即為在第M-1次迭代中確定的樣本的權(quán)重值。舉例來說,假設(shè)樣本的權(quán)重初始值均為1,對(duì)于某個(gè)樣本來說,在采用第一種可能的實(shí)現(xiàn)方式時(shí),在第一次迭代中,初始的識(shí)別模型對(duì)該樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,則該樣本的權(quán)重值還是1;在第二次迭代中,更新后的識(shí)別模型對(duì)該樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,則該樣本的權(quán)重值為上一次確定的權(quán)重值乘以預(yù)設(shè)的第一參數(shù),即第一次迭代中確定的權(quán)重值乘以預(yù)設(shè)的第一參數(shù)。
本步驟中確定更新后的損失函數(shù)的過程與步驟103的實(shí)現(xiàn)過程和技術(shù)原理類似,區(qū)別在于在本步驟的該過程中,每個(gè)樣本的識(shí)別結(jié)果為采用更新后的識(shí)別模型得到的識(shí)別結(jié)果,每個(gè)樣本的權(quán)重值為更新后的權(quán)重值。
之后,重復(fù)步驟104,直至更新后的損失函數(shù)收斂。每重復(fù)一次步驟104可以稱為一次迭代。
在步驟105中,采用收斂的損失函數(shù)確定最終的識(shí)別模型。
經(jīng)過多次迭代后,將更新后的損失函數(shù)收斂時(shí)的識(shí)別模型確定為最終的識(shí)別模型。
本公開實(shí)施例提供的識(shí)別模型確定方法中,在確定損失函數(shù)時(shí),考慮到了樣本的權(quán)重值,將識(shí)別正確的樣本的權(quán)重值減小或保持不變,將識(shí)別錯(cuò)誤的樣本的權(quán)重值增加,即,將容易識(shí)別的樣本的權(quán)重值減小或保持不變,將較難識(shí)別的樣本的權(quán)重值增加,使得在根據(jù)損失函數(shù)和隨機(jī)梯度下降算法更新識(shí)別模型時(shí),會(huì)往正確的方向更新,從而會(huì)使損失函數(shù)收斂得更快,提高了確定識(shí)別模型的效率。另外,由于在識(shí)別模型確定的過程中,更關(guān)注較難識(shí)別的樣本,最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
可選的,在確定出識(shí)別模型后,即可以根據(jù)該識(shí)別模型對(duì)輸入的圖像中的目標(biāo)物體進(jìn)行識(shí)別,以確定出目標(biāo)物體的信息。這里的目標(biāo)物體的信息可以是目標(biāo)物體在輸入的圖像中所處的位置、目標(biāo)物體上的子目標(biāo)物體的位置、目標(biāo)物體的放置狀態(tài)以及目標(biāo)物體上的文字等信息。本公開實(shí)施例對(duì)此不做限制。例如,在購物網(wǎng)站進(jìn)行實(shí)名制的過程中,可以采用該識(shí)別模型對(duì)用戶上傳了大量的圖像進(jìn)行識(shí)別,確定出有身份證的圖像,以獲取用戶的身份證號(hào)及身份證的有效期限。
本公開實(shí)施例提供的識(shí)別模型確定方法,通過將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定N個(gè)樣本的損失函數(shù),根據(jù)損失函數(shù)及隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從樣本集中再次選擇任意N個(gè)樣本輸入更新后的識(shí)別模型,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂,采用收斂的損失函數(shù)確定最終的識(shí)別模型,實(shí)現(xiàn)了在確定最終的識(shí)別模型的過程中,可以根據(jù)識(shí)別結(jié)果和標(biāo)定結(jié)果確定樣本的權(quán)重值,在確定損失函數(shù)時(shí),考慮到樣本的權(quán)重值,使得在根據(jù)損失函數(shù)和隨機(jī)梯度下降算法更新識(shí)別模型時(shí),會(huì)往正確的方向更新,從而會(huì)使損失函數(shù)收斂得更快,提高了確定識(shí)別模型的效率。另外,由于在識(shí)別模型確定的過程中,損失函數(shù)與樣本的權(quán)重值有關(guān),從而,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
下述為本公開裝置實(shí)施例,可以用于執(zhí)行本公開方法實(shí)施例。對(duì)于本公開裝置實(shí)施例中未披露的細(xì)節(jié),請參照本公開方法實(shí)施例。
圖2是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。如圖2所示,本公開實(shí)施例提供的識(shí)別模型確定裝置包括如下模塊:
獲取模塊21,被配置為將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果。
本公開實(shí)施例中可以采用改進(jìn)后的CNN訓(xùn)練方法確定出識(shí)別模型。在采用改進(jìn)后的CNN訓(xùn)練方法確定識(shí)別模型的過程中,可以采用深度學(xué)習(xí)算法中的過程,輸入樣本集,進(jìn)行模型訓(xùn)練。最終確定出一個(gè)通過對(duì)海量樣本進(jìn)行學(xué)習(xí)、訓(xùn)練而獲得的識(shí)別模型。
可選的,本公開實(shí)施例中的樣本為圖像。樣本集由多個(gè)樣本組成。
初始的識(shí)別模型為參數(shù)是隨機(jī)配置的識(shí)別模型??蓪⑦@些隨機(jī)配置的參數(shù)稱為初始參數(shù)。將樣本集中的任意N個(gè)樣本均輸入初始化后的識(shí)別模型中,N即為批量大小。N為大于1的整數(shù)。同時(shí),還可以配置各參數(shù)對(duì)應(yīng)的學(xué)習(xí)力。學(xué)習(xí)力即為各參數(shù)在后續(xù)訓(xùn)練過程中的調(diào)整步長。在將樣本集中的樣本輸入初始的識(shí)別模型后,會(huì)輸出識(shí)別結(jié)果,則獲取模塊21可獲取N個(gè)樣本中每個(gè)樣本的識(shí)別結(jié)果。該識(shí)別結(jié)果即為該初始的識(shí)別模型對(duì)該樣本學(xué)習(xí)后的結(jié)果。該過程也可以稱為第一次迭代的過程。
第一確定模塊22,被配置為根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及根據(jù)獲取模塊21獲取的每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值。
該每個(gè)樣本的標(biāo)定結(jié)果是預(yù)先獲取的。首先對(duì)樣本集中的每個(gè)樣本進(jìn)行標(biāo)定,獲取標(biāo)定結(jié)果。對(duì)每個(gè)樣本進(jìn)行標(biāo)定的意思是可以采用一段程序確定樣本集中的每個(gè)樣本的真值。舉例來說,如果需要訓(xùn)練識(shí)別模型識(shí)別人像,則樣本集中的樣本中有的是有人像的,有的是沒有人像的,可以采用程序?qū)颖居袩o人像確定出來,當(dāng)然,也可以人工進(jìn)行確定,確定樣本中有無人像的結(jié)果即為標(biāo)定結(jié)果。
初始的識(shí)別模型對(duì)N個(gè)樣本中的每個(gè)樣本有一個(gè)識(shí)別結(jié)果,每個(gè)樣本有一個(gè)標(biāo)定結(jié)果,此時(shí),可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值。在本公開實(shí)施例中,每個(gè)樣本的權(quán)重值表示的是在后續(xù)步驟中計(jì)算損失函數(shù)時(shí),識(shí)別模型對(duì)該樣本的識(shí)別結(jié)果產(chǎn)生的誤差在損失函數(shù)中所占的比例。
第二確定模塊23,被配置為根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、根據(jù)獲取模塊21獲取的識(shí)別結(jié)果及根據(jù)第一確定模塊22確定的權(quán)重值確定N個(gè)樣本的損失函數(shù)。
在確定出每個(gè)樣本的權(quán)重值之后,第二確定模塊23可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、每個(gè)樣本的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定N個(gè)樣本的損失函數(shù)。在本公開實(shí)施例中,損失函數(shù)表示的是N個(gè)樣本中標(biāo)定結(jié)果和識(shí)別結(jié)果之間誤差的程度、可以減小誤差的方向以及每個(gè)樣本的識(shí)別結(jié)果產(chǎn)生的誤差在損失函數(shù)中所占的比例。在一種可能的實(shí)現(xiàn)方式中,第二確定模塊23可以采用softmax網(wǎng)絡(luò)計(jì)算損失函數(shù)。
第三確定模塊24,被配置為根據(jù)第二確定模塊23確定的損失函數(shù)及隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從樣本集中再次選擇任意N個(gè)樣本輸入更新后的識(shí)別模型,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂。
在確定出損失函數(shù)后,第三確定模塊24可以對(duì)損失函數(shù)采用隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型的參數(shù)進(jìn)行調(diào)整,即對(duì)初始的識(shí)別模型進(jìn)行更新,得到更新后的識(shí)別模型。在獲取到更新后的識(shí)別模型后,再將樣本集中的任意N個(gè)樣本輸入該更新后的識(shí)別模型中,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果。
更新后的識(shí)別模型對(duì)N個(gè)樣本中的每個(gè)樣本有一個(gè)識(shí)別結(jié)果,此時(shí),可以根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、每個(gè)樣本采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定每個(gè)樣本更新后的權(quán)重值。
第四確定模塊25,被配置為采用收斂的損失函數(shù)確定最終的識(shí)別模型。
經(jīng)過多次迭代后,將更新后的損失函數(shù)收斂時(shí)的識(shí)別模型確定為最終的識(shí)別模型。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置獲取模塊,被配置為將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,第一確定模塊,被配置為根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及根據(jù)獲取模塊獲取的每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值,第二確定模塊,被配置為根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、根據(jù)獲取模塊獲取的識(shí)別結(jié)果及根據(jù)第一確定模塊確定的權(quán)重值確定N個(gè)樣本的損失函數(shù),第三確定模塊,被配置為根據(jù)第二確定模塊確定的損失函數(shù)及隨機(jī)梯度下降方法對(duì)初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從樣本集中再次選擇任意N個(gè)樣本輸入更新后的識(shí)別模型,確定N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂,第四確定模塊,被配置為采用收斂的損失函數(shù)確定最終的識(shí)別模型,實(shí)現(xiàn)了在確定最終的識(shí)別模型的過程中,可以根據(jù)識(shí)別結(jié)果和標(biāo)定結(jié)果確定樣本的權(quán)重值,在確定損失函數(shù)時(shí),考慮到樣本的權(quán)重值,使得在根據(jù)損失函數(shù)和隨機(jī)梯度下降算法更新識(shí)別模型時(shí),會(huì)往正確的方向更新,從而會(huì)使損失函數(shù)收斂得更快,提高了確定識(shí)別模型的效率。另外,由于在識(shí)別模型確定的過程中,損失函數(shù)與樣本的權(quán)重值有關(guān),從而,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
圖3是根據(jù)另一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。本公開實(shí)施例在圖2所示實(shí)施例的基礎(chǔ)上,對(duì)第一確定模塊22的具體組成作一詳細(xì)說明。如圖3所示,本公開實(shí)施例提供的識(shí)別模型確定裝置中,第一確定模塊22包括:
第一確定子模塊221,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值。
第二確定子模塊222,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù)。其中,預(yù)設(shè)參數(shù)為大于1的數(shù)。
當(dāng)初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果是介于0-1之間的值時(shí),可以預(yù)先確定一個(gè)閾值。如果識(shí)別結(jié)果大于該閾值,則認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果一致;如果識(shí)別結(jié)果小于或等于該閾值,則認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果不一致。當(dāng)初始的識(shí)別模型對(duì)每個(gè)樣本的識(shí)別結(jié)果是0或1時(shí),當(dāng)樣本的識(shí)別結(jié)果是1時(shí),認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果一致;當(dāng)樣本的識(shí)別結(jié)果是0時(shí),認(rèn)為識(shí)別結(jié)果與標(biāo)定結(jié)果不一致。樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,代表該初始的識(shí)別模型對(duì)該樣本的識(shí)別是正確的,該樣本是一個(gè)比較容易識(shí)別的樣本;樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,代表該初始的識(shí)別模型對(duì)該樣本的識(shí)別是錯(cuò)誤的,該樣本是一個(gè)較難識(shí)別的樣本。
在本實(shí)現(xiàn)方式中,如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致,即該樣本是一個(gè)比較容易識(shí)別的樣本,則確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值。如果樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致,即該樣本是一個(gè)較難識(shí)別的樣本,則確定該樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù),該預(yù)設(shè)參數(shù)為大于1的數(shù),即在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變大。需要說明的是,樣本集中所有樣本的預(yù)設(shè)權(quán)重初始值都是一樣的??蛇x的,該預(yù)設(shè)權(quán)重初始值可以是1。當(dāng)然,預(yù)設(shè)權(quán)重初始值也可以為其他的數(shù)值,本實(shí)施例對(duì)此不做限制。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置第一確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值,第二確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第一預(yù)設(shè)參數(shù),其中,預(yù)設(shè)參數(shù)為大于1的數(shù),實(shí)現(xiàn)了當(dāng)樣本為較難識(shí)別的樣本時(shí),將樣本的權(quán)重值變大,當(dāng)樣本為容易識(shí)別的樣本時(shí),將樣本的權(quán)重值保持不變,從而,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率提高。
圖4是根據(jù)又一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。本公開實(shí)施例在圖2所示實(shí)施例的基礎(chǔ)上,對(duì)第一確定模塊22的具體組成作一詳細(xì)說明。如圖4所示,本公開實(shí)施例提供的識(shí)別模型確定裝置中,第一確定模塊22包括:
第三確定子模塊223,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù)。其中,第二預(yù)設(shè)參數(shù)為小于1的數(shù)。
第四確定子模塊224,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值除以第二預(yù)設(shè)參數(shù)。
當(dāng)樣本是一個(gè)容易識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變?。划?dāng)樣本是一個(gè)較難識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變大。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置第三確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值乘以第二預(yù)設(shè)參數(shù)。其中,第二預(yù)設(shè)參數(shù)為小于1的數(shù),第四確定子模塊,被配置為當(dāng)樣本的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的權(quán)重值為預(yù)設(shè)權(quán)重初始值除以第二預(yù)設(shè)參數(shù),實(shí)現(xiàn)了當(dāng)樣本是一個(gè)容易識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變小,當(dāng)樣本是一個(gè)較難識(shí)別的樣本時(shí),在預(yù)設(shè)權(quán)重初始值的基礎(chǔ)上,將該樣本的權(quán)重值變大,從而,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率提高。
圖5是根據(jù)再一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。本公開實(shí)施例在圖2-圖4所示實(shí)施例的基礎(chǔ)上,對(duì)第二確定模塊23的具體組成作一詳細(xì)說明。如圖5所示,本公開實(shí)施例中,第二確定模塊23包括:
第五確定子模塊231,被配置為根據(jù)樣本的標(biāo)定結(jié)果及樣本的識(shí)別結(jié)果確定樣本的初始損失函數(shù)。
第六確定子模塊232,被配置為根據(jù)第五確定子模塊231確定的樣本的初始損失函數(shù)及樣本的權(quán)重值確定樣本的最終損失函數(shù)。
第七確定子模塊233,被配置為將第六確定子模塊232確定的每個(gè)樣本的最終損失函數(shù)進(jìn)行相加,確定N個(gè)樣本的損失函數(shù)。
可選的,第六確定子模塊232包括:獲取單元2321,被配置為將樣本的初始損失函數(shù)乘以樣本的權(quán)重值獲取樣本的最終損失函數(shù)。
在本公開實(shí)施例中,在確定損失函數(shù)時(shí),相較于相關(guān)技術(shù)中,根據(jù)識(shí)別結(jié)果和標(biāo)定結(jié)果確定N個(gè)樣本的損失函數(shù)的方式,考慮到了樣本的權(quán)重值。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置第二確定模塊包括:第五確定子模塊,被配置為根據(jù)樣本的標(biāo)定結(jié)果及樣本的識(shí)別結(jié)果確定樣本的初始損失函數(shù),第六確定子模塊,被配置為根據(jù)第五確定子模塊確定的樣本的初始損失函數(shù)及樣本的權(quán)重值確定樣本的最終損失函數(shù),第七確定子模塊,被配置為將第六確定子模塊確定的每個(gè)樣本的最終損失函數(shù)進(jìn)行相加,確定N個(gè)樣本的損失函數(shù),第六確定子模塊包括:獲取單元,被配置為將樣本的初始損失函數(shù)乘以樣本的權(quán)重值獲取樣本的最終損失函數(shù),實(shí)現(xiàn)了在確定N個(gè)樣本的損失函數(shù)時(shí)考慮到樣本的權(quán)重值,使得在根據(jù)損失函數(shù)和隨機(jī)梯度下降算法更新識(shí)別模型時(shí),會(huì)往正確的方向更新,從而會(huì)使損失函數(shù)收斂得更快,提高了確定識(shí)別模型的效率。
圖6是根據(jù)另一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。本公開實(shí)施例在圖2所示實(shí)施例的基礎(chǔ)上,對(duì)第三確定模塊24的具體組成作一詳細(xì)說明。如圖6所示,本公開實(shí)施例中第三確定模塊24包括:
第八確定子模塊241,被配置為根據(jù)損失函數(shù)及隨機(jī)梯度下降方法確定初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值。
第九確定子模塊242,被配置為根據(jù)初始的識(shí)別模型中的各初始參數(shù)的學(xué)習(xí)力及第八確定子模塊241確定的各初始參數(shù)對(duì)應(yīng)的梯度值確定初始的識(shí)別模型中各更新后的參數(shù)。
獲取子模塊243,被配置為用根據(jù)第九確定子模塊242確定的各更新后的參數(shù)替換各初始參數(shù)獲取更新后的識(shí)別模型。
第十確定子模塊244,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值。
第十一確定子模塊245,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第一預(yù)設(shè)參數(shù)。
需要說明的是,在第二次迭代中,上一次確定的權(quán)重值即為在第一次迭代中確定的樣本的權(quán)重值。在第M次迭代中,上一次確定的權(quán)重值即為在第M-1次迭代中確定的樣本的權(quán)重值。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置第三確定模塊包括:第八確定子模塊,被配置為根據(jù)損失函數(shù)及隨機(jī)梯度下降方法確定初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值,第九確定子模塊,被配置為根據(jù)初始的識(shí)別模型中的各初始參數(shù)的學(xué)習(xí)力及第八確定子模塊確定的各初始參數(shù)對(duì)應(yīng)的梯度值確定初始的識(shí)別模型中各更新后的參數(shù),獲取子模塊,被配置為用根據(jù)第九確定子模塊確定的各更新后的參數(shù)替換各初始參數(shù)獲取更新后的識(shí)別模型,第十確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值,第十一確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第一預(yù)設(shè)參數(shù),實(shí)現(xiàn)了高效地獲取更新后的識(shí)別模型,以及,確定樣本的更新后的權(quán)重值,從而,提高了確定識(shí)別模型的效率,以及,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
圖7是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。本公開實(shí)施例在圖2所示實(shí)施例的基礎(chǔ)上,對(duì)第三確定模塊24的具體組成作一詳細(xì)說明。如圖7所示,本公開實(shí)施例中第三確定模塊24包括:
第八確定子模塊241,被配置為根據(jù)損失函數(shù)及隨機(jī)梯度下降方法確定初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值。
第九確定子模塊242,被配置為根據(jù)初始的識(shí)別模型中的各初始參數(shù)的學(xué)習(xí)力及第八確定子模塊241確定的各初始參數(shù)對(duì)應(yīng)的梯度值確定初始的識(shí)別模型中各更新后的參數(shù)。
獲取子模塊243,被配置為用根據(jù)第九確定子模塊242確定的各更新后的參數(shù)替換各初始參數(shù)獲取更新后的識(shí)別模型。
第十二確定子模塊246,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第二預(yù)設(shè)參數(shù)。
第十三確定子模塊247,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值除以第二預(yù)設(shè)參數(shù)。
本公開實(shí)施例提供的識(shí)別模型確定裝置,通過設(shè)置第三確定模塊包括:第八確定子模塊,被配置為根據(jù)損失函數(shù)及隨機(jī)梯度下降方法確定初始的識(shí)別模型中各初始參數(shù)對(duì)應(yīng)的梯度值,第九確定子模塊,被配置為根據(jù)初始的識(shí)別模型中的各初始參數(shù)的學(xué)習(xí)力及第八確定子模塊確定的各初始參數(shù)對(duì)應(yīng)的梯度值確定初始的識(shí)別模型中各更新后的參數(shù),獲取子模塊,被配置為用根據(jù)第九確定子模塊確定的各更新后的參數(shù)替換各初始參數(shù)獲取更新后的識(shí)別模型,第十二確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值乘以第二預(yù)設(shè)參數(shù),第十三確定子模塊,被配置為當(dāng)樣本的采用更新后的識(shí)別模型得到的識(shí)別結(jié)果與標(biāo)定結(jié)果不一致時(shí),確定樣本的更新后的權(quán)重值為上一次確定的權(quán)重值除以第二預(yù)設(shè)參數(shù),實(shí)現(xiàn)了高效地獲取更新后的識(shí)別模型,以及,確定樣本的更新后的權(quán)重值,從而,提高了確定識(shí)別模型的效率,以及,使得最終確定出的識(shí)別模型的識(shí)別準(zhǔn)確率也會(huì)更高。
以上描述了識(shí)別模型確定裝置的內(nèi)部功能和結(jié)構(gòu),圖8是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。如圖8所示,該識(shí)別模型確定裝置可實(shí)現(xiàn)為:
處理器81;
用于存儲(chǔ)處理器81可執(zhí)行指令的存儲(chǔ)器82;
其中,處理器81被配置為:
將樣本集中的任意N個(gè)樣本均輸入初始的識(shí)別模型,獲取所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果;根據(jù)預(yù)先獲取的每個(gè)樣本的標(biāo)定結(jié)果及每個(gè)樣本的識(shí)別結(jié)果,確定每個(gè)樣本的權(quán)重值;根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、識(shí)別結(jié)果及權(quán)重值確定所述N個(gè)樣本的損失函數(shù);根據(jù)所述損失函數(shù)及隨機(jī)梯度下降方法對(duì)所述初始的識(shí)別模型進(jìn)行更新,獲取更新后的識(shí)別模型,從所述樣本集中再次選擇任意N個(gè)樣本輸入所述更新后的識(shí)別模型,確定所述N個(gè)樣本中的每個(gè)樣本的識(shí)別結(jié)果,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的權(quán)重值確定其更新后的權(quán)重值,根據(jù)每個(gè)樣本的標(biāo)定結(jié)果、采用所述更新后的識(shí)別模型得到的識(shí)別結(jié)果及每個(gè)樣本的更新后的權(quán)重值確定更新后的損失函數(shù),重復(fù)此步驟,直至更新后的損失函數(shù)收斂;采用收斂的損失函數(shù)確定最終的識(shí)別模型。
圖9是根據(jù)一示例性實(shí)施例示出的一種識(shí)別模型確定裝置的框圖。例如,識(shí)別模型確定裝置1900可以被提供為一服務(wù)器。參照圖9,裝置1900包括處理組件1922,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲(chǔ)器1932所代表的存儲(chǔ)器資源,用于存儲(chǔ)可由處理組件1922的執(zhí)行的指令,例如應(yīng)用程序。存儲(chǔ)器1932中存儲(chǔ)的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對(duì)應(yīng)于一組指令的模塊。此外,處理組件1922被配置為執(zhí)行指令,以執(zhí)行上述識(shí)別模型確定方法。
裝置1900還可以包括一個(gè)電源組件1926被配置為執(zhí)行裝置1900的電源管理,一個(gè)有線或無線網(wǎng)絡(luò)接口1950被配置為將裝置1900連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(I/O)接口1958。裝置1900可以操作基于存儲(chǔ)在存儲(chǔ)器1932的操作系統(tǒng),例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。
一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由識(shí)別模型確定裝置的處理器執(zhí)行時(shí),使得識(shí)別模型確定裝置能夠執(zhí)行上述識(shí)別模型確定方法。
本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求書指出。
應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求書來限制。