遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

文檔序號(hào)：40567807發(fā)布日期：2025-01-03 11:28閱讀：11來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

本申請(qǐng)涉及深度學(xué)習(xí)，具體地，涉及一種遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)。

背景技術(shù)：

1、深度學(xué)習(xí)可以通過(guò)構(gòu)建和訓(xùn)練模型來(lái)擬合輸入與輸出之間的映射關(guān)系，在實(shí)際應(yīng)用中，由于樣本數(shù)據(jù)有限，通常利用在線的遷移學(xué)習(xí)技術(shù)將通用場(chǎng)景對(duì)應(yīng)的通用模型的能力遷移到新的遷移場(chǎng)景。

2、然而，由于遷移場(chǎng)景的樣本稀缺、遷移場(chǎng)景與通用場(chǎng)景的差異性較大等原因，模型在線訓(xùn)練時(shí)容易導(dǎo)致模型僅對(duì)已經(jīng)訓(xùn)練的通用場(chǎng)景有效而失去對(duì)遷移場(chǎng)景的泛化能力。

技術(shù)實(shí)現(xiàn)思路

1、鑒于以上內(nèi)容，有必要提出一種遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)，能夠解決由于遷移場(chǎng)景的樣本稀缺、遷移場(chǎng)景與通用場(chǎng)景的差異性較大等原因?qū)е碌脑诰€訓(xùn)練得到的模型泛化能力不足的技術(shù)問(wèn)題。

2、本申請(qǐng)的實(shí)施例提供一種遷移模型訓(xùn)練方法，所述方法包括：基于元模型對(duì)輸入圖像的預(yù)測(cè)結(jié)果以及用戶對(duì)所述預(yù)測(cè)結(jié)果的校驗(yàn)結(jié)果，對(duì)所述輸入圖像進(jìn)行預(yù)處理，獲得訓(xùn)練樣本，其中，所述輸入圖像包括遷移場(chǎng)景對(duì)應(yīng)的圖像；利用所述元模型對(duì)應(yīng)的歷史樣本與所述訓(xùn)練樣本對(duì)所述元模型進(jìn)行訓(xùn)練，得到所述歷史樣本對(duì)應(yīng)的歷史梯度及所述訓(xùn)練樣本對(duì)應(yīng)的遷移梯度；根據(jù)所述歷史梯度與所述遷移梯度的相似度，確定所述歷史梯度與所述遷移梯度的混合梯度，及基于所述混合梯度對(duì)所述元模型的模型參數(shù)進(jìn)行更新，基于更新后的模型參數(shù)訓(xùn)練所述遷移場(chǎng)景對(duì)應(yīng)的遷移模型。

3、在一個(gè)實(shí)施例中，對(duì)所述元模型進(jìn)行的每個(gè)周期的訓(xùn)練包括：從所述訓(xùn)練樣本中依序采樣獲得每個(gè)批次的訓(xùn)練樣本，及從所述歷史樣本中依序采樣獲得所述每個(gè)批次的歷史樣本，直至所述訓(xùn)練樣本被全部采樣完畢，完成對(duì)所述元模型的當(dāng)前周期的更新。

4、在一個(gè)實(shí)施例中，所述方法還包括根據(jù)所述預(yù)測(cè)結(jié)果與所述校驗(yàn)結(jié)果確定所述輸入圖像的類別，包括：若所述校驗(yàn)結(jié)果指示所述預(yù)測(cè)結(jié)果與目標(biāo)對(duì)象相對(duì)應(yīng)，確定所述輸入圖像的類別為正確樣本；若所述校驗(yàn)結(jié)果指示所述預(yù)測(cè)結(jié)果沒(méi)有預(yù)測(cè)到所述目標(biāo)對(duì)象，確定所述輸入圖像的類別為漏檢樣本；若所述校驗(yàn)結(jié)果指示所述預(yù)測(cè)結(jié)果錯(cuò)誤地將其他對(duì)象預(yù)測(cè)為所述目標(biāo)對(duì)象，確定所述輸入圖像的類別為誤檢樣本。

5、在一個(gè)實(shí)施例中，所述預(yù)處理包括：若所述輸入圖像的類別為正確樣本，使用所述元模型對(duì)所述正確樣本的低于預(yù)設(shè)置信度閾值的邊界框進(jìn)行預(yù)測(cè)，從低于預(yù)設(shè)置信度閾值的邊界框中選擇與用戶標(biāo)注框的交并比大于預(yù)設(shè)交并比閾值的邊界框，將選擇的邊界框中置信度最高的邊界框作為所述正確樣本的標(biāo)注信息，得到所述訓(xùn)練樣本。

6、在一個(gè)實(shí)施例中，所述預(yù)處理還包括：若所述輸入圖像的類別為漏檢樣本，將所述漏檢樣本對(duì)應(yīng)的用戶標(biāo)注框作為所述漏檢樣本的標(biāo)注信息，得到所述訓(xùn)練樣本。

7、本申請(qǐng)的實(shí)施例提供一種遷移模型訓(xùn)練裝置，所述裝置包括：輸入模塊，用于基于元模型對(duì)輸入圖像的預(yù)測(cè)結(jié)果以及用戶對(duì)所述預(yù)測(cè)結(jié)果的校驗(yàn)結(jié)果，對(duì)所述輸入圖像進(jìn)行預(yù)處理，獲得訓(xùn)練樣本，其中，所述輸入圖像包括遷移場(chǎng)景對(duì)應(yīng)的圖像；梯度確定模塊，用于利用所述元模型對(duì)應(yīng)的歷史樣本與所述訓(xùn)練樣本對(duì)所述元模型進(jìn)行訓(xùn)練，得到所述歷史樣本對(duì)應(yīng)的歷史梯度及所述訓(xùn)練樣本對(duì)應(yīng)的遷移梯度；參數(shù)更新模塊，用于根據(jù)所述歷史梯度與所述遷移梯度的相似度，確定所述歷史梯度與所述遷移梯度的混合梯度，及基于所述混合梯度對(duì)所述元模型的模型參數(shù)進(jìn)行更新，基于更新后的模型參數(shù)訓(xùn)練所述遷移場(chǎng)景對(duì)應(yīng)的遷移模型。

8、本申請(qǐng)的實(shí)施例提供一種電子設(shè)備，所述電子設(shè)備包括處理器和存儲(chǔ)器，所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)所述遷移模型訓(xùn)練方法。

9、本申請(qǐng)的實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述遷移模型訓(xùn)練方法。

10、綜上所述，本申請(qǐng)所述的遷移模型訓(xùn)練方法，通過(guò)元模型獲得遷移場(chǎng)景對(duì)應(yīng)的輸入圖像的預(yù)測(cè)結(jié)果，基于用戶對(duì)預(yù)測(cè)結(jié)果的校驗(yàn)結(jié)果對(duì)輸入圖像進(jìn)行預(yù)處理，從而獲得訓(xùn)練樣本；利用元模型對(duì)應(yīng)的歷史樣本與訓(xùn)練樣本對(duì)元模型進(jìn)行訓(xùn)練，獲得訓(xùn)練過(guò)程中歷史樣本對(duì)應(yīng)的歷史梯度與訓(xùn)練樣本對(duì)應(yīng)的遷移梯度；通過(guò)歷史梯度與遷移梯度之間的相似度確定混合梯度，基于混合梯度對(duì)元模型的模型參數(shù)進(jìn)行更新，從而實(shí)現(xiàn)基于對(duì)元模型的在線訓(xùn)練獲得遷移場(chǎng)景對(duì)應(yīng)的遷移模型。能夠減少模型遷移過(guò)程中的遺忘和偏見現(xiàn)象，進(jìn)而減少模型從通用場(chǎng)景遷移到遷移場(chǎng)景所需的數(shù)據(jù)量，實(shí)現(xiàn)降低場(chǎng)景遷移成本并提升遷移效果的作用。

技術(shù)特征：

1.一種遷移模型訓(xùn)練方法，其特征在于，所述方法包括：

2.根據(jù)權(quán)利要求1所述的遷移模型訓(xùn)練方法，其特征在于，所述根據(jù)所述歷史梯度與所述遷移梯度的相似度，確定所述歷史梯度與所述遷移梯度的混合梯度，包括：

3.根據(jù)權(quán)利要求1所述的遷移模型訓(xùn)練方法，其特征在于，所述方法還包括：

4.根據(jù)權(quán)利要求1所述的遷移模型訓(xùn)練方法，其特征在于，所述方法還包括：

5.根據(jù)權(quán)利要求2所述的遷移模型訓(xùn)練方法，其特征在于，所述根據(jù)所述相似度確定所述歷史梯度對(duì)應(yīng)的權(quán)重與所述遷移梯度對(duì)應(yīng)的權(quán)重，包括：

6.根據(jù)權(quán)利要求4所述的遷移模型訓(xùn)練方法，其特征在于，所述根據(jù)所述歷史樣本對(duì)應(yīng)的歷史梯度及所述訓(xùn)練樣本對(duì)應(yīng)的遷移梯度對(duì)所述歷史樣本庫(kù)進(jìn)行更新，包括：

7.根據(jù)權(quán)利要求1所述的遷移模型訓(xùn)練方法，其特征在于，所述預(yù)測(cè)結(jié)果包括目標(biāo)對(duì)象對(duì)應(yīng)的預(yù)測(cè)邊界框與預(yù)測(cè)對(duì)象類別，所述預(yù)測(cè)邊界框包括置信度高于預(yù)設(shè)置信度閾值的邊界框。

8.根據(jù)權(quán)利要求7所述的遷移模型訓(xùn)練方法，其特征在于，所述方法還包括：

9.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括：

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，其特征在于，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序，所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至8中任一項(xiàng)所述的遷移模型訓(xùn)練方法。

技術(shù)總結(jié)
本申請(qǐng)涉及深度學(xué)習(xí)技術(shù)領(lǐng)域，提供一種遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)，所述方法通過(guò)元模型獲得遷移場(chǎng)景對(duì)應(yīng)的輸入圖像的預(yù)測(cè)結(jié)果，基于用戶對(duì)預(yù)測(cè)結(jié)果的校驗(yàn)結(jié)果對(duì)輸入圖像進(jìn)行預(yù)處理，從而獲得訓(xùn)練樣本；利用元模型對(duì)應(yīng)的歷史樣本與訓(xùn)練樣本對(duì)元模型進(jìn)行訓(xùn)練，獲得訓(xùn)練過(guò)程中歷史樣本對(duì)應(yīng)的歷史梯度與訓(xùn)練樣本對(duì)應(yīng)的遷移梯度；通過(guò)歷史梯度與遷移梯度之間的相似度確定混合梯度，基于混合梯度對(duì)元模型的模型參數(shù)進(jìn)行更新，從而實(shí)現(xiàn)基于對(duì)元模型的在線訓(xùn)練獲得遷移場(chǎng)景對(duì)應(yīng)的遷移模型。利用上述方法能夠降低模型的場(chǎng)景遷移成本并提升遷移效果。

技術(shù)研發(fā)人員：李濱君,余曉填,肖嶸
受保護(hù)的技術(shù)使用者：深圳云天勵(lì)飛技術(shù)股份有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/2

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李濱君,余曉填,肖嶸
技術(shù)所有人：深圳云天勵(lì)飛技術(shù)股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)與流程

遷移模型訓(xùn)練方法、電子設(shè)備及存儲(chǔ)介質(zhì)與流程