1.一種歌曲內(nèi)容生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的歌曲內(nèi)容生成方法,其特征在于,所述利用多模態(tài)大語(yǔ)言模型對(duì)所述文本指令進(jìn)行編碼以得到文本特征向量,包括:
3.根據(jù)權(quán)利要求1所述的歌曲內(nèi)容生成方法,其特征在于,所述對(duì)所述文本特征序列進(jìn)行解碼以生成目標(biāo)歌詞之后,還包括:
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的歌曲內(nèi)容生成方法,其特征在于,所述對(duì)所述目標(biāo)圖片進(jìn)行編碼得到圖片特征向量,包括:
5.根據(jù)權(quán)利要求4所述的歌曲內(nèi)容生成方法,其特征在于,所述利用圖片編碼器對(duì)所述目標(biāo)圖片進(jìn)行編碼得到圖片特征向量,包括:
6.根據(jù)權(quán)利要求4所述的歌曲內(nèi)容生成方法,其特征在于,所述利用所述多模態(tài)大語(yǔ)言模型對(duì)所述文本特征序列進(jìn)行解碼以生成目標(biāo)歌詞,包括:
7.根據(jù)權(quán)利要求4所述的歌曲內(nèi)容生成方法,其特征在于,還包括:
8.根據(jù)權(quán)利要求7所述的歌曲內(nèi)容生成方法,其特征在于,所述對(duì)所述初始生成模型進(jìn)行訓(xùn)練,以得到預(yù)先訓(xùn)練好的所述預(yù)設(shè)生成模型,包括:
9.根據(jù)權(quán)利要求8所述的歌曲內(nèi)容生成方法,其特征在于,所述基于所述訓(xùn)練文本特征序列對(duì)所述多模態(tài)大語(yǔ)言模型進(jìn)行訓(xùn)練,包括:
10.根據(jù)權(quán)利要求8所述的歌曲內(nèi)容生成方法,其特征在于,所述基于所述訓(xùn)練圖片特征序列對(duì)所述圖片解碼器進(jìn)行訓(xùn)練,包括:
11.根據(jù)權(quán)利要求7所述的歌曲內(nèi)容生成方法,其特征在于,所述對(duì)所述初始生成模型進(jìn)行訓(xùn)練,以得到預(yù)先訓(xùn)練好的所述預(yù)設(shè)生成模型,包括:
12.一種電子設(shè)備,其特征在于,包括:
13.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,用于保存計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至11任一項(xiàng)所述的歌曲內(nèi)容生成方法。