本技術(shù)涉及人工智能開發(fā)與金融科技領(lǐng)域,尤其涉及基于人工智能的文案生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在保險(xiǎn)金融領(lǐng)域,隨著數(shù)字化進(jìn)程的加速,營(yíng)銷文案的自動(dòng)化生成已成為提升營(yíng)銷效率、增強(qiáng)客戶互動(dòng)性的重要手段。為了實(shí)現(xiàn)這一目標(biāo),業(yè)界廣泛采用基于深度學(xué)習(xí),特別是基于transformer結(jié)構(gòu)的生成式模型來(lái)構(gòu)建文案創(chuàng)作系統(tǒng)。這類模型以其強(qiáng)大的序列建模能力,在理解和生成自然語(yǔ)言文本方面展現(xiàn)出了卓越的性能。
2、在生成式模型的解碼過(guò)程中,一個(gè)核心策略是通過(guò)最大化文案中所有詞的聯(lián)合概率來(lái)搜索最優(yōu)解,這一過(guò)程稱為“束搜索”(beam?search)。束搜索算法通過(guò)維護(hù)一個(gè)固定大小的候選集(即beam?size,記為n),在每一步解碼時(shí)僅保留當(dāng)前概率最高的n個(gè)詞作為后續(xù)解碼的起點(diǎn),從而有效限制了解碼空間的規(guī)模,提高了生成效率。
3、然而,束搜索算法中的beam?size參數(shù)n的設(shè)置,成為了一個(gè)需要權(quán)衡的問(wèn)題。傳統(tǒng)上,n是一個(gè)需要手動(dòng)調(diào)整的超參數(shù),其取值直接影響到生成文案的質(zhì)量和多樣性。具體來(lái)說(shuō),當(dāng)n設(shè)置得較大時(shí),會(huì)導(dǎo)致模型在推理的過(guò)程非常慢,使得文案文本生成的速度較慢,而如果n設(shè)定的太小,則會(huì)導(dǎo)致文本文案的多樣性較差。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提出一種基于人工智能的文案生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),以解決現(xiàn)有的基于生成式模型與束搜索算法的文案生成方式存在文案文本生成的速度較慢,且文本文案的多樣性較差,的技術(shù)問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例提供一種基于人工智能的文案生成方法,采用了如下所述的技術(shù)方案:
3、獲取用戶輸入的需求文本;
4、基于預(yù)設(shè)的文案生成模型中的編碼器對(duì)所述需求文本進(jìn)行編碼,得到對(duì)應(yīng)的文本向量;
5、設(shè)置與所述文案生成模型中的解碼器對(duì)應(yīng)的候選詞數(shù)量,并設(shè)置所述解碼器的初始狀態(tài);
6、基于所述解碼器對(duì)所述文本向量進(jìn)行處理,以在每個(gè)解碼時(shí)間步,基于當(dāng)前狀態(tài)生成與所述候選詞數(shù)量對(duì)應(yīng)的候選詞列表;
7、對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值;
8、從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞,將所述指定候選詞作為下一個(gè)解碼時(shí)間步的候選詞,并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新;
9、在檢測(cè)到符合解碼結(jié)束條件時(shí),獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值;
10、從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案。
11、進(jìn)一步的,所述計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度的步驟,具體包括:
12、調(diào)用預(yù)設(shè)的喚醒模型;
13、基于所述喚醒模型對(duì)所述候選詞進(jìn)行喚醒計(jì)算處理,得到所述候選詞的喚醒分?jǐn)?shù);
14、獲取預(yù)設(shè)的困惑度函數(shù);
15、獲取與所述候選詞對(duì)應(yīng)的指定候選序列;
16、基于所述困惑度函數(shù)對(duì)所述指定候選序列進(jìn)行計(jì)算處理,得到所述候選詞的困惑度。
17、進(jìn)一步的,所述基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值的步驟,具體包括:
18、獲取預(yù)設(shè)的綜合處理函數(shù);
19、獲取與所述綜合處理函數(shù)對(duì)應(yīng)的第一預(yù)設(shè)超參數(shù)數(shù)值與第二預(yù)設(shè)超參數(shù)數(shù)值;
20、基于所述候選詞數(shù)量、所述綜合處理函數(shù),所述第一預(yù)設(shè)超參數(shù)數(shù)值以及所述第二預(yù)設(shè)超參數(shù)數(shù)值對(duì)所述候選詞的喚醒分?jǐn)?shù)與困惑度進(jìn)行計(jì)算處理,得到對(duì)應(yīng)的計(jì)算結(jié)果;
21、將所述計(jì)算結(jié)果作為與所述候選詞對(duì)應(yīng)的綜合分值。
22、進(jìn)一步的,所述獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值的步驟,具體包括:
23、獲取所有生成的候選序列;
24、將所有所述候選序列劃分為與預(yù)設(shè)數(shù)量對(duì)應(yīng)的批次;其中,每個(gè)所述批次包含一定數(shù)量的候選序列;
25、獲取預(yù)設(shè)的并行計(jì)算策略;
26、基于所述并行計(jì)算策略計(jì)算各個(gè)所述批次中的候選序列內(nèi)包含的所有候選詞的綜合分值的總和,得到各個(gè)所述批次中的候選序列的目標(biāo)綜合分值。
27、進(jìn)一步的,所述基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案的步驟,具體包括:
28、對(duì)所述目標(biāo)候選序列進(jìn)行無(wú)用信息去除處理,得到對(duì)應(yīng)的第一文本;
29、對(duì)所述第一文本進(jìn)行格式調(diào)整處理,得到對(duì)應(yīng)的第二文本;
30、基于預(yù)設(shè)的優(yōu)化策略對(duì)所述第二文本進(jìn)行優(yōu)化處理,得到對(duì)應(yīng)的第三文本;
31、基于所述第三文本生成與所述需求文本對(duì)應(yīng)的所述目標(biāo)文案。
32、進(jìn)一步的,所述基于所述第三文本生成與所述需求文本對(duì)應(yīng)的所述目標(biāo)文案的步驟,具體包括:
33、調(diào)用預(yù)設(shè)的模板庫(kù);
34、從所述模板庫(kù)中篩選出與所述第三文本匹配的目標(biāo)模板;
35、基于所述目標(biāo)文案對(duì)所述目標(biāo)模板進(jìn)行內(nèi)容填充處理,得到填充后的第一文案;
36、對(duì)所述第一文案進(jìn)行微調(diào)處理,得到對(duì)應(yīng)的第二文案;
37、將所述第二文案作為所述目標(biāo)文案。
38、進(jìn)一步的,在所述從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案的步驟之后,還包括:
39、獲取所述用戶的用戶信息;
40、基于所述用戶信息獲取所述用戶的通訊信息;
41、調(diào)用預(yù)設(shè)的用戶接口;
42、基于所述通訊信息,使用所述用戶接口將所述目標(biāo)文案推送給所述用戶。
43、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種基于人工智能的文案生成裝置,采用了如下所述的技術(shù)方案:
44、第一獲取模塊,用于獲取用戶輸入的需求文本;
45、編碼模塊,用于基于預(yù)設(shè)的文案生成模型中的編碼器對(duì)所述需求文本進(jìn)行編碼,得到對(duì)應(yīng)的文本向量;
46、設(shè)置模塊,用于設(shè)置與所述文案生成模型中的解碼器對(duì)應(yīng)的候選詞數(shù)量,并設(shè)置所述解碼器的初始狀態(tài);
47、第一處理模塊,用于基于所述解碼器對(duì)所述文本向量進(jìn)行處理,以在每個(gè)解碼時(shí)間步,基于當(dāng)前狀態(tài)生成與所述候選詞數(shù)量對(duì)應(yīng)的候選詞列表;
48、計(jì)算模塊,用于對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值;
49、第二處理模塊,用于從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞,將所述指定候選詞作為下一個(gè)解碼時(shí)間步的候選詞,并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新;
50、統(tǒng)計(jì)模塊,用于在檢測(cè)到符合解碼結(jié)束條件時(shí),獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值;
51、生成模塊,用于從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案。
52、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
53、獲取用戶輸入的需求文本;
54、基于預(yù)設(shè)的文案生成模型中的編碼器對(duì)所述需求文本進(jìn)行編碼,得到對(duì)應(yīng)的文本向量;
55、設(shè)置與所述文案生成模型中的解碼器對(duì)應(yīng)的候選詞數(shù)量,并設(shè)置所述解碼器的初始狀態(tài);
56、基于所述解碼器對(duì)所述文本向量進(jìn)行處理,以在每個(gè)解碼時(shí)間步,基于當(dāng)前狀態(tài)生成與所述候選詞數(shù)量對(duì)應(yīng)的候選詞列表;
57、對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值;
58、從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞,將所述指定候選詞作為下一個(gè)解碼時(shí)間步的候選詞,并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新;
59、在檢測(cè)到符合解碼結(jié)束條件時(shí),獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值;
60、從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案。
61、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用了如下所述的技術(shù)方案:
62、獲取用戶輸入的需求文本;
63、基于預(yù)設(shè)的文案生成模型中的編碼器對(duì)所述需求文本進(jìn)行編碼,得到對(duì)應(yīng)的文本向量;
64、設(shè)置與所述文案生成模型中的解碼器對(duì)應(yīng)的候選詞數(shù)量,并設(shè)置所述解碼器的初始狀態(tài);
65、基于所述解碼器對(duì)所述文本向量進(jìn)行處理,以在每個(gè)解碼時(shí)間步,基于當(dāng)前狀態(tài)生成與所述候選詞數(shù)量對(duì)應(yīng)的候選詞列表;
66、對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值;
67、從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞,將所述指定候選詞作為下一個(gè)解碼時(shí)間步的候選詞,并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新;
68、在檢測(cè)到符合解碼結(jié)束條件時(shí),獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值;
69、從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案。
70、與現(xiàn)有技術(shù)相比,本技術(shù)實(shí)施例主要有以下有益效果:
71、本技術(shù)首先獲取用戶輸入的需求文本,并基于預(yù)設(shè)的文案生成模型中的編碼器對(duì)所述需求文本進(jìn)行編碼,得到對(duì)應(yīng)的文本向量;然后設(shè)置與所述文案生成模型中的解碼器對(duì)應(yīng)的候選詞數(shù)量,并設(shè)置所述解碼器的初始狀態(tài);之后基于所述解碼器對(duì)所述文本向量進(jìn)行處理,以在每個(gè)解碼時(shí)間步,基于當(dāng)前狀態(tài)生成與所述候選詞數(shù)量對(duì)應(yīng)的候選詞列表;對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值;后續(xù)從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞,將所述指定候選詞作為下一個(gè)解碼時(shí)間步的候選詞,并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新;在檢測(cè)到符合解碼結(jié)束條件時(shí),獲取所有生成的候選序列,并統(tǒng)計(jì)各所述候選序列的目標(biāo)綜合分值;最后從所述候選序列中篩選出目標(biāo)綜合分值最高的目標(biāo)候選序列,并基于所述目標(biāo)候選序列生成與所述需求文本對(duì)應(yīng)的目標(biāo)文案。本技術(shù)在使用文案生成模型的編碼器對(duì)用戶輸入的需求文本所對(duì)應(yīng)的文本向量進(jìn)行處理得到候選詞列表時(shí),通過(guò)對(duì)于所述候選詞列表中的每個(gè)候選詞,計(jì)算與所述候選詞對(duì)應(yīng)的喚醒分?jǐn)?shù)與困惑度,并基于所述候選詞的喚醒分?jǐn)?shù)與困惑度計(jì)算出與所述候選詞對(duì)應(yīng)的綜合分值,進(jìn)而從所有所述候選詞中篩選出綜合分值最高的指定數(shù)量的指定候選詞并基于所述指定數(shù)量對(duì)所述候選詞數(shù)量進(jìn)行更新,實(shí)現(xiàn)了候選詞數(shù)量的動(dòng)態(tài)更新,使得能夠大大提升文案生成模型的推理速度,進(jìn)而提高目標(biāo)文案的生成效率。另外,通過(guò)引入動(dòng)態(tài)的候選詞數(shù)量,能有效增加文案內(nèi)容生成的多樣性。