圖像生成方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品與流程

文檔序號：40653844發(fā)布日期：2025-01-10 19:02閱讀：3來源：國知局

本公開涉及人工智能，尤其涉及計算機視覺、深度學習、大模型等，可應用于aigc（artificial?intelligence?generative?content）、基于人工智能的內(nèi)容生成等場景。

背景技術(shù)：

1、隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展，用戶可以通過智能手機、平板電腦等智能終端設備來便捷地挑選想要觀看的視頻資源。例如可以通過智能終端來瀏覽視頻資源的海報圖像來了解視頻資源內(nèi)容，并針對海報圖像進行點擊開始瀏覽視頻。

技術(shù)實現(xiàn)思路

1、本公開提供了一種圖像生成方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品。

2、根據(jù)本公開的一方面，提供了一種圖像生成方法，包括：響應于海報生成請求，利用大模型處理視頻素材，得到海報圖像和標題文本；基于海報圖像中關(guān)鍵視覺元素的元素屬性，在海報圖像中確定用于展示標題文本的標題區(qū)域，關(guān)鍵視覺元素是通過對海報圖像進行目標識別得到的；以及基于標題區(qū)域融合海報圖像和標題文本，得到目標圖像。

3、根據(jù)本公開的另一方面，提供了一種圖像生成裝置，包括：圖像與文本獲得模塊，用于響應于海報生成請求，利用大模型處理視頻素材，得到海報圖像和標題文本；標題區(qū)域獲得模塊，用于基于海報圖像中關(guān)鍵視覺元素的元素屬性，在海報圖像中確定用于展示標題文本的標題區(qū)域，關(guān)鍵視覺元素是通過對海報圖像進行目標識別得到的；以及目標圖像獲得模塊，用于基于標題區(qū)域融合海報圖像和標題文本，得到目標圖像。

4、根據(jù)本公開的另一方面，提供了一種電子設備，包括：至少一個處理器；以及與所述至少一個處理器通信連接的存儲器；其中，所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令，所述指令被所述至少一個處理器執(zhí)行，以使所述至少一個處理器能夠執(zhí)行本公開實施例提供的方法。

5、根據(jù)本公開的另一方面，提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì)，其中，所述計算機指令用于使所述計算機執(zhí)行本公開實施例提供的方法。

6、根據(jù)本公開的另一方面，提供了一種計算機程序產(chǎn)品，包括計算機程序，所述計算機程序在被處理器執(zhí)行時實現(xiàn)本公開實施例提供的方法。

7、應當理解，本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征，也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。

技術(shù)特征：

1.一種圖像生成方法，包括：

2.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述海報圖像中關(guān)鍵視覺元素的元素屬性，在所述海報圖像中確定用于展示所述標題文本的標題區(qū)域包括：

3.根據(jù)權(quán)利要求2所述的方法，其中，所述基于多個所述初始標題區(qū)域各自的區(qū)域面積，從多個所述初始標題區(qū)域中確定所述標題區(qū)域包括：

4.根據(jù)權(quán)利要求3所述的方法，其中，所述指定圖像元素包括以下至少一項：

5.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述海報圖像中關(guān)鍵視覺元素的元素屬性，在所述海報圖像中確定用于展示所述標題文本的標題區(qū)域包括：

6.根據(jù)權(quán)利要求5所述的方法，其中，所述標題區(qū)域滿足以下至少一項形態(tài)適配條件：

7.根據(jù)權(quán)利要求1所述的方法，其中，所述基于所述標題區(qū)域融合所述海報圖像和所述標題文本，得到目標圖像包括：

8.根據(jù)權(quán)利要求7所述的方法，其中，所述基于所述標題區(qū)域的區(qū)域形態(tài)屬性確定標題排列方式包括：

9.根據(jù)權(quán)利要求7所述的方法，其中，所述標題文本元素是基于如下操作確定的：

10.根據(jù)權(quán)利要求1所述的方法，其中，所述利用大模型處理視頻素材，得到海報圖像和標題文本包括：

11.一種圖像生成裝置，包括：

12.根據(jù)權(quán)利要求11所述的裝置，其中，所述標題區(qū)域獲得模塊包括：

13.根據(jù)權(quán)利要求12所述的裝置，其中，所述第一標題區(qū)域獲得子模塊包括：

14.根據(jù)權(quán)利要求11所述的裝置，其中，所述標題區(qū)域獲得模塊包括：

15.根據(jù)權(quán)利要求14所述的裝置，其中，所述標題區(qū)域滿足以下至少一項形態(tài)適配條件：

16.根據(jù)權(quán)利要求11所述的裝置，其中，所述目標圖像獲得模塊包括：

17.根據(jù)權(quán)利要求16所述的裝置，其中，所述標題排列方式確定子模塊包括：

18.一種電子設備，包括：

19.一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì)，其中，所述計算機指令用于使所述計算機執(zhí)行根據(jù)權(quán)利要求1至10中任一項所述的方法。

20.一種計算機程序產(chǎn)品，包括計算機程序，所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1至10中任一項所述的方法。

技術(shù)總結(jié)
本公開提供了圖像生成方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品，涉及人工智能技術(shù)領(lǐng)域，尤其涉及計算機視覺、深度學習、大模型等技術(shù)領(lǐng)域，可應用于AIGC、基于人工智能的內(nèi)容生成等場景。具體實現(xiàn)方案為：響應于海報生成請求，利用大模型處理視頻素材，得到海報圖像和標題文本；基于海報圖像中關(guān)鍵視覺元素的元素屬性，在海報圖像中確定用于展示標題文本的標題區(qū)域，關(guān)鍵視覺元素是通過對海報圖像進行目標識別得到的；以及基于標題區(qū)域融合海報圖像和標題文本，得到目標圖像。

技術(shù)研發(fā)人員：鐘銘,宋雨鑫
受保護的技術(shù)使用者：北京百度網(wǎng)訊科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/9

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鐘銘,宋雨鑫
技術(shù)所有人：北京百度網(wǎng)訊科技有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像生成方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品與流程

圖像生成方法、裝置、電子設備、存儲介質(zhì)及程序產(chǎn)品與流程