本公開(kāi)涉及計(jì)算機(jī),具體而言,涉及一種圖像處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著生成式人工智能(artificial?intelligence?generated?content,aigc)技術(shù)的發(fā)展,越來(lái)越多的人開(kāi)始通過(guò)aigc的方式來(lái)生成圖像。一般的,用戶可以向模型輸入圖像描述信息,模型可以根據(jù)圖像描述信息生成對(duì)應(yīng)的目標(biāo)圖像。然而由于模型在訓(xùn)練時(shí),是基于海量的圖像訓(xùn)練的,因此這樣訓(xùn)練的模型生成的目標(biāo)圖像的風(fēng)格化特征不突出,可能無(wú)法滿足用戶的圖像需求。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)實(shí)施例至少提供一種圖像處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
2、第一方面,本公開(kāi)實(shí)施例提供了一種圖像處理方法,包括:
3、獲取多張第一參考圖像,以及所述第一參考圖像對(duì)應(yīng)的風(fēng)格描述信息和內(nèi)容描述信息;其中,所述多張第一參考圖像的風(fēng)格描述信息相同;
4、基于所述風(fēng)格描述信息和所述內(nèi)容描述信息,構(gòu)建所述第一參考圖像對(duì)應(yīng)的第一提示信息;
5、將所述第一提示信息輸入至初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像,所述第一預(yù)測(cè)圖像用于對(duì)所述初始風(fēng)格化模型的模型參數(shù)進(jìn)行調(diào)整,以確定目標(biāo)風(fēng)格化模型;其中,所述目標(biāo)風(fēng)格化模型用于生成符合所述風(fēng)格描述信息的圖像。
6、一種可能的實(shí)施方式中,所述將所述第一提示信息輸入至初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像,包括:
7、將所述第一參考圖像和所述第一參考圖像對(duì)應(yīng)的第一提示信息輸入至所述初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像。
8、一種可能的實(shí)施方式中,所述獲取多張第一參考圖像,包括:
9、確定所述初始風(fēng)格化模型對(duì)應(yīng)的待優(yōu)化實(shí)體類別;
10、獲取包含所述待優(yōu)化實(shí)體類別對(duì)應(yīng)的實(shí)體的第一參考圖像。
11、一種可能的實(shí)施方式中,所述確定所述初始風(fēng)格化模型對(duì)應(yīng)的待優(yōu)化實(shí)體類別,包括:
12、獲取多個(gè)第一待生成圖像的內(nèi)容描述信息;其中,所述內(nèi)容描述信息包含實(shí)體類別;
13、將所述內(nèi)容描述信息輸入至所述初始風(fēng)格化模型,確定第二預(yù)測(cè)圖像;
14、將不符合預(yù)設(shè)規(guī)則的第二預(yù)測(cè)圖像對(duì)應(yīng)的內(nèi)容描述信息中所包含的實(shí)體類別,作為所述待優(yōu)化實(shí)體類別。
15、一種可能的實(shí)施方式中,所述方法還包括根據(jù)以下方法確定所述第一參考圖像對(duì)應(yīng)的第一提示信息:
16、將所述待優(yōu)化實(shí)體類別對(duì)應(yīng)的類別信息,作為所述第一參考圖像對(duì)應(yīng)的第一提示信息。
17、一種可能的實(shí)施方式中,所述方法還包括:
18、獲取第二待生成圖像的內(nèi)容描述信息;
19、基于所述內(nèi)容描述信息和所述風(fēng)格描述信息,構(gòu)建第二提示信息;
20、將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像。
21、一種可能的實(shí)施方式中,在訓(xùn)練的目標(biāo)風(fēng)格化模型有多個(gè)的情況下,所述獲取第二待生成圖像的內(nèi)容描述信息,包括:
22、獲取第二待生成圖像的內(nèi)容描述信息,以及目標(biāo)風(fēng)格描述信息;
23、所述基于所述內(nèi)容描述信息和風(fēng)格描述信息,構(gòu)建第二提示信息,包括:
24、基于所述內(nèi)容描述信息和所述目標(biāo)風(fēng)格描述信息,構(gòu)建第二提示信息;
25、所述將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像,包括:
26、將所述第二提示信息輸入至與所述目標(biāo)風(fēng)格描述信息對(duì)應(yīng)目標(biāo)風(fēng)格化模型中,生成所述第二待生成圖像;其中,不同目標(biāo)風(fēng)格化模型匹配的風(fēng)格描述信息不同。
27、一種可能的實(shí)施方式中,所述獲取第二待生成圖像的內(nèi)容描述信息,包括:
28、獲取第二待生成圖像的內(nèi)容描述信息,和所述第二待生成圖像對(duì)應(yīng)的第二參考圖像;
29、所述將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像,包括:
30、將所述第二提示信息和所述第二參考圖像輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像。
31、第二方面,本公開(kāi)實(shí)施例還提供一種圖像處理裝置,包括:
32、獲取模塊,用于獲取多張第一參考圖像,以及所述第一參考圖像對(duì)應(yīng)的風(fēng)格描述信息和內(nèi)容描述信息;其中,所述多張第一參考圖像的風(fēng)格描述信息相同;
33、構(gòu)建模塊,用于基于所述風(fēng)格描述信息和所述內(nèi)容描述信息,構(gòu)建所述第一參考圖像對(duì)應(yīng)的第一提示信息;
34、確定模塊,用于將所述第一提示信息輸入至初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像,所述第一預(yù)測(cè)圖像用于對(duì)所述初始風(fēng)格化模型的模型參數(shù)進(jìn)行調(diào)整,以確定目標(biāo)風(fēng)格化模型;其中,所述目標(biāo)風(fēng)格化模型用于生成符合所述風(fēng)格描述信息的圖像。
35、一種可能的實(shí)施方式中,所述確定模塊,在將所述第一提示信息輸入至初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像時(shí),用于:
36、將所述第一參考圖像和所述第一參考圖像對(duì)應(yīng)的第一提示信息輸入至所述初始風(fēng)格化模型中,確定所述初始風(fēng)格化模型生成的第一預(yù)測(cè)圖像。
37、一種可能的實(shí)施方式中,所述獲取模塊,在獲取多張第一參考圖像時(shí),用于:
38、確定所述初始風(fēng)格化模型對(duì)應(yīng)的待優(yōu)化實(shí)體類別;
39、獲取包含所述待優(yōu)化實(shí)體類別對(duì)應(yīng)的實(shí)體的第一參考圖像。
40、一種可能的實(shí)施方式中,所述獲取模塊,在確定所述初始風(fēng)格化模型對(duì)應(yīng)的待優(yōu)化實(shí)體類別時(shí),用于:
41、獲取多個(gè)第一待生成圖像的內(nèi)容描述信息;其中,所述內(nèi)容描述信息包含實(shí)體類別;
42、將所述內(nèi)容描述信息輸入至所述初始風(fēng)格化模型,確定第二預(yù)測(cè)圖像;
43、將不符合預(yù)設(shè)規(guī)則的第二預(yù)測(cè)圖像對(duì)應(yīng)的內(nèi)容描述信息中所包含的實(shí)體類別,作為所述待優(yōu)化實(shí)體類別。
44、一種可能的實(shí)施方式中,所述獲取模塊還用于根據(jù)以下方法確定所述第一參考圖像對(duì)應(yīng)的第一提示信息:
45、將所述待優(yōu)化實(shí)體類別對(duì)應(yīng)的類別信息,作為所述第一參考圖像對(duì)應(yīng)的第一提示信息。
46、一種可能的實(shí)施方式中,所述裝置還包括推理模塊,用于:
47、獲取第二待生成圖像的內(nèi)容描述信息;
48、基于所述內(nèi)容描述信息和所述風(fēng)格描述信息,構(gòu)建第二提示信息;
49、將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像。
50、一種可能的實(shí)施方式中,在訓(xùn)練的目標(biāo)風(fēng)格化模型有多個(gè)的情況下,所述推理模塊,在獲取第二待生成圖像的內(nèi)容描述信息時(shí),用于:
51、獲取第二待生成圖像的內(nèi)容描述信息,以及目標(biāo)風(fēng)格描述信息;
52、所述推理模塊,在基于所述內(nèi)容描述信息和風(fēng)格描述信息,構(gòu)建第二提示信息時(shí),用于:
53、基于所述內(nèi)容描述信息和所述目標(biāo)風(fēng)格描述信息,構(gòu)建第二提示信息;
54、所述推理模塊,在將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像時(shí),用于:
55、將所述第二提示信息輸入至與所述目標(biāo)風(fēng)格描述信息對(duì)應(yīng)目標(biāo)風(fēng)格化模型中,生成所述第二待生成圖像;其中,不同目標(biāo)風(fēng)格化模型匹配的風(fēng)格描述信息不同。
56、一種可能的實(shí)施方式中,所述推理模塊,在獲取第二待生成圖像的內(nèi)容描述信息時(shí),用于:
57、獲取第二待生成圖像的內(nèi)容描述信息,和所述第二待生成圖像對(duì)應(yīng)的第二參考圖像;
58、所述推理模塊,在將所述第二提示信息輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像時(shí),用于:
59、將所述第二提示信息和所述第二參考圖像輸入至所述目標(biāo)風(fēng)格化模型,生成所述第二待生成圖像。
60、第三方面,本公開(kāi)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,包括:處理器、存儲(chǔ)器和總線,所述存儲(chǔ)器存儲(chǔ)有所述處理器可執(zhí)行的機(jī)器可讀指令,當(dāng)計(jì)算機(jī)設(shè)備運(yùn)行時(shí),所述處理器與所述存儲(chǔ)器之間通過(guò)總線通信,所述機(jī)器可讀指令被所述處理器執(zhí)行時(shí)執(zhí)行上述第一方面,或第一方面中任一種可能的實(shí)施方式中的步驟。
61、第四方面,本公開(kāi)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器運(yùn)行時(shí)執(zhí)行上述第一方面,或第一方面中任一種可能的實(shí)施方式中的步驟。
62、本公開(kāi)實(shí)施例提供的圖像處理方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),第一參考圖像對(duì)應(yīng)的第一提示信息中包含第一參考圖像的風(fēng)格描述信息,這樣,在基于第一參考圖像和第一次參考圖像的第一提示信息確定目標(biāo)風(fēng)格化模型時(shí),可以對(duì)目標(biāo)風(fēng)格化模型所需要學(xué)習(xí)的風(fēng)格進(jìn)行顯性的約束,從而使得目標(biāo)風(fēng)格化模型生成的圖像能夠更加專注于風(fēng)格描述信息對(duì)應(yīng)的風(fēng)格,提升了圖像的風(fēng)格化處理效果。
63、為使本公開(kāi)的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說(shuō)明如下。