圖像處理方法、裝置及電子設(shè)備與流程

文檔序號：40448149發(fā)布日期：2024-12-24 16:05閱讀：60121來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本公開實施例涉及圖像處理，尤其涉及一種圖像處理方法、裝置及電子設(shè)備。

背景技術(shù)：

1、多模態(tài)生成技術(shù)是指模型可以生成多種不同形式的數(shù)據(jù)。例如，模型可以將文本轉(zhuǎn)換為圖像，模型也可以將語音轉(zhuǎn)換為圖像等。

2、目前，電子設(shè)備可以基于訓(xùn)練樣本，對多模態(tài)模型進行訓(xùn)練。例如，電子設(shè)備可以基于樣本文本和樣本文本對應(yīng)的圖像，對文本轉(zhuǎn)圖像模型進行訓(xùn)練，在訓(xùn)練結(jié)束時，該文本轉(zhuǎn)圖像模型可以將文本轉(zhuǎn)換為圖像。但是，多模態(tài)生成的模型的步數(shù)較多，模型在推理過程中所需的時間較長，進而導(dǎo)致模型處理的效率較低。

技術(shù)實現(xiàn)思路

1、本公開提供一種圖像處理方法、裝置及電子設(shè)備，用于解決現(xiàn)有技術(shù)中的一個或多個技術(shù)問題。

2、第一方面，本公開提供一種圖像處理方法，該方法包括：

3、獲取將文本轉(zhuǎn)換為圖像的第一模型、待訓(xùn)練的文本轉(zhuǎn)圖像模型和第一文本，所述第一模型的模型步數(shù)為m*n，所述文本轉(zhuǎn)圖像模型的模型步數(shù)為n，所述m為大于1的整數(shù)，所述n為大于0的整數(shù)；

4、根據(jù)所述第一模型對所述第一文本進行處理，確定所述第一模型每步生成的第一預(yù)測圖像，得到m*n個第一預(yù)測圖像；

5、根據(jù)所述文本轉(zhuǎn)圖像模型對所述第一文本進行處理，確定所述文本轉(zhuǎn)圖像模型每步生成的第二預(yù)測圖像，得到n個第二預(yù)測圖像；

6、根據(jù)所述m*n個第一預(yù)測圖像和n個第二預(yù)測圖像，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新。

7、第二方面，本公開提供一種圖像處理裝置，該圖像處理裝置包括獲取模塊、第一確定模塊、第二確定模塊和更新模塊，其中：

8、所述獲取模塊用于，獲取將文本轉(zhuǎn)換為圖像的第一模型、待訓(xùn)練的文本轉(zhuǎn)圖像模型和第一文本，所述第一模型的模型步數(shù)為m*n，所述文本轉(zhuǎn)圖像模型的模型步數(shù)為n，所述m為大于1的整數(shù)，所述n為大于0的整數(shù)；

9、所述第一確定模塊用于，根據(jù)所述第一模型對所述第一文本進行處理，確定所述第一模型每步生成的第一預(yù)測圖像，得到m*n個第一預(yù)測圖像；

10、所述第二確定模塊用于，根據(jù)所述文本轉(zhuǎn)圖像模型對所述第一文本進行處理，確定所述文本轉(zhuǎn)圖像模型每步生成的第二預(yù)測圖像，得到n個第二預(yù)測圖像；

11、所述更新模塊用于，根據(jù)所述m*n個第一預(yù)測圖像和n個第二預(yù)測圖像，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新。

12、第三方面，本公開實施例提供一種電子設(shè)備包括：處理器和存儲器；

13、所述存儲器存儲計算機執(zhí)行指令；

14、所述處理器執(zhí)行所述存儲器存儲的計算機執(zhí)行指令，使得所述至少一個處理器執(zhí)行如上第一方面以及第一方面各種可能涉及的所述圖像處理方法。

15、第四方面，本公開實施例提供一種計算機可讀存儲介質(zhì)，所述計算機可讀存儲介質(zhì)中存儲有計算機執(zhí)行指令，當處理器執(zhí)行所述計算機執(zhí)行指令時，實現(xiàn)如上第一方面以及第一方面各種可能涉及的所述圖像處理方法。

16、本公開提供一種圖像處理方法、裝置及電子設(shè)備，電子設(shè)備可以獲取將文本轉(zhuǎn)換為圖像的第一模型、待訓(xùn)練的文本轉(zhuǎn)圖像模型和第一文本，其中，第一模型的模型步數(shù)為m*n，文本轉(zhuǎn)圖像模型的模型步數(shù)為n，m為大于1的整數(shù)，n為大于0的整數(shù)，根據(jù)第一模型對第一文本進行處理，確定第一模型每步生成的第一預(yù)測圖像，得到m*n個第一預(yù)測圖像，根據(jù)文本轉(zhuǎn)圖像模型對第一文本進行處理，確定文本轉(zhuǎn)圖像模型每步生成的第二預(yù)測圖像，得到n個第二預(yù)測圖像，根據(jù)m*n個第一預(yù)測圖像和n個第二預(yù)測圖像，對文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新。在上述方法中，由于文本轉(zhuǎn)圖像模型的模型步數(shù)小于第一模型的模型步數(shù)，并且，電子設(shè)備可以基于第一模型的多步的輸出結(jié)果，對文本轉(zhuǎn)圖像模型的每步輸出進行監(jiān)督，因此，文本轉(zhuǎn)圖像模型可以學(xué)習到第一模型的能力，并且，文本轉(zhuǎn)圖像模型的步數(shù)較少，模型推理所需的時間較少，進而可以提高文本轉(zhuǎn)圖像模型的處理效率。

技術(shù)特征：

1.一種圖像處理方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述m*n個第一預(yù)測圖像和n個第二預(yù)測圖像，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新，包括：

3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述在所述m*n個第一預(yù)測圖像中確定n個目標預(yù)測圖像，包括：

4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)所述n個目標預(yù)測圖像和所述n個第二預(yù)測圖像，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新，包括：

5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述根據(jù)所述n個目標損失，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新，包括：

6.根據(jù)權(quán)利要求1-5任一項所述的方法，其特征在于，所述獲取將文本轉(zhuǎn)換為圖像的第一模型，包括：

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述根據(jù)所述第二模型和所述多個第二文本，對所述初始模型進行訓(xùn)練，包括：

8.一種圖像處理模型，其特征在于，包括獲取模塊、第一確定模塊、第二確定模塊和更新模塊，其中：

9.一種電子設(shè)備，其特征在于，包括：處理器和存儲器；

10.一種計算機可讀存儲介質(zhì)，其特征在于，所述計算機可讀存儲介質(zhì)中存儲有計算機執(zhí)行指令，當處理器執(zhí)行所述計算機執(zhí)行指令時，實現(xiàn)如權(quán)利要求1-7任一項所述的圖像處理方法。

技術(shù)總結(jié)
本公開提供一種圖像處理方法、裝置及電子設(shè)備，該方法包括：獲取將文本轉(zhuǎn)換為圖像的第一模型、待訓(xùn)練的文本轉(zhuǎn)圖像模型和第一文本，所述第一模型的模型步數(shù)為M*N，所述文本轉(zhuǎn)圖像模型的模型步數(shù)為N，所述M為大于1的整數(shù)，所述N為大于0的整數(shù)；根據(jù)所述第一模型對所述第一文本進行處理，確定所述第一模型每步生成的第一預(yù)測圖像，得到M*N個第一預(yù)測圖像；根據(jù)所述文本轉(zhuǎn)圖像模型對所述第一文本進行處理，確定所述文本轉(zhuǎn)圖像模型每步生成的第二預(yù)測圖像，得到N個第二預(yù)測圖像；根據(jù)所述M*N個第一預(yù)測圖像和N個第二預(yù)測圖像，對所述文本轉(zhuǎn)圖像模型的模型參數(shù)進行更新。提高文本轉(zhuǎn)圖像的效率。

技術(shù)研發(fā)人員：吳捷
受保護的技術(shù)使用者：北京字跳網(wǎng)絡(luò)技術(shù)有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/23

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：吳捷
技術(shù)所有人：北京字跳網(wǎng)絡(luò)技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：車輛的制作方法
上一篇：一種基于循環(huán)隊列和狀態(tài)機的報文解析方法及系統(tǒng)與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像處理方法、裝置及電子設(shè)備與流程