本技術(shù)涉及自然語(yǔ)言處理,尤其涉及一種應(yīng)用于對(duì)話的摘要生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、目前,隨著電子設(shè)備錄制音頻或錄制視頻來(lái)記錄事件的普及,記錄會(huì)議的方式又變得多種多樣,除了文字記錄的方式,音頻和視頻也越來(lái)越多的被使用。例如:對(duì)大型內(nèi)容進(jìn)行速記形式的文字記錄,方便文字直播或發(fā)表新聞稿;或者,對(duì)每周例會(huì)進(jìn)行音視頻錄制,方便日后查檔調(diào)閱等等。
2、現(xiàn)有一種會(huì)議摘要生成方法,即使用人工智能模型生成對(duì)話摘要,例如會(huì)議摘要,會(huì)對(duì)會(huì)議內(nèi)容整體的重點(diǎn)部分進(jìn)行摘要生成。
3、然而,申請(qǐng)人發(fā)現(xiàn)傳統(tǒng)的會(huì)議摘要生成方法并不會(huì)區(qū)分會(huì)議上說(shuō)話人的不同。因?yàn)榇祟?lèi)對(duì)話類(lèi)型的數(shù)據(jù)有不同的說(shuō)話人,每個(gè)說(shuō)話人的對(duì)對(duì)話內(nèi)容的關(guān)注點(diǎn)是不一致的,特別是在多人對(duì)話中,說(shuō)話人a的關(guān)注點(diǎn)會(huì)更多的放在自己說(shuō)話內(nèi)容的上下文中,對(duì)其他人之間互動(dòng)內(nèi)容關(guān)注較少。
4、由此可見(jiàn),傳統(tǒng)的會(huì)議摘要生成方法無(wú)法生成與不同角色對(duì)應(yīng)的會(huì)議摘要。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的目的在于提出一種應(yīng)用于對(duì)話的摘要生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),傳統(tǒng)的會(huì)議摘要生成方法無(wú)法生成與不同角色對(duì)應(yīng)的會(huì)議摘要的問(wèn)題。
2、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例提供一種應(yīng)用于對(duì)話的摘要生成方法,采用了如下所述的技術(shù)方案:
3、獲取待處理的原始對(duì)話數(shù)據(jù);
4、對(duì)所述原始對(duì)話數(shù)據(jù)進(jìn)行標(biāo)注操作,得到標(biāo)注對(duì)話數(shù)據(jù);
5、根據(jù)所述標(biāo)注對(duì)話數(shù)據(jù)構(gòu)建levi?graph圖,并根據(jù)所述levi?graph圖對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行圖編碼操作,得到圖編碼數(shù)據(jù);
6、對(duì)所述圖編碼數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到第一加權(quán)特征向量;
7、根據(jù)bart模型的編碼器對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行文本編碼操作,得到文本編碼數(shù)據(jù);
8、對(duì)所述文本編碼數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量;
9、根據(jù)otk融合模型對(duì)所述第一加權(quán)特征向量以及所述第二加權(quán)特征向量進(jìn)行拼接操作,得到拼接特征向量;
10、根據(jù)bart模型的解碼器對(duì)所述拼接特征向量進(jìn)行解碼操作,得到會(huì)議摘要生成文本。
11、進(jìn)一步的,所述對(duì)所述圖編碼數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到第一加權(quán)特征向量的步驟,具體包括下述步驟:
12、將所述圖編碼數(shù)據(jù)輸入至rgcn層進(jìn)行最大池化操作,得到最大池化數(shù)據(jù);
13、將所述最大池化數(shù)據(jù)輸入至第一密度層進(jìn)行第一線性變換操作,得到第一線性變化數(shù)據(jù);
14、根據(jù)自注意力機(jī)制對(duì)所述第一線性變化數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到所述第一加權(quán)特征向量。
15、進(jìn)一步的,所述對(duì)所述文本編碼數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量的步驟,具體包括下述步驟:
16、將所述文本編碼數(shù)據(jù)輸入至第二密度層進(jìn)行第二線性變化操作,得到第二線性變化數(shù)據(jù);
17、根據(jù)自注意力機(jī)制對(duì)所述第二線性變化數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量。
18、進(jìn)一步的,在所述根據(jù)otk融合模型對(duì)所述第一加權(quán)特征向量以及所述第二加權(quán)特征向量進(jìn)行拼接操作,得到拼接特征向量的步驟之后,還包括下述步驟:
19、將所述拼接特征向量分別輸入兩個(gè)多層感知機(jī)層,得到兩個(gè)多層感知特征;
20、分別將所述兩個(gè)多層感知特征映射到特征向量維度的一般特征上,得到加強(qiáng)拼接特征向量;
21、所述根據(jù)bart模型的解碼器對(duì)所述拼接特征向量進(jìn)行解碼操作,得到會(huì)議摘要生成文本的步驟,具體包括下述步驟:
22、根據(jù)bart模型的解碼器對(duì)所述加強(qiáng)拼接特征向量進(jìn)行解碼操作,得到所述會(huì)議摘要生成文本。
23、進(jìn)一步的,所述根據(jù)bart模型的解碼器對(duì)所述拼接特征向量進(jìn)行解碼操作,得到會(huì)議摘要生成文本的步驟,具體包括下述步驟:
24、將所述拼接特征向量輸入至第三密度層進(jìn)行第三線性變化操作,得到第三線性變化數(shù)據(jù);
25、根據(jù)自注意力機(jī)制對(duì)所述第三線性變化數(shù)據(jù)進(jìn)行第三特征加權(quán)操作,得到第三加權(quán)特征向量;
26、將所述第三加權(quán)特征向量輸入至bart模型的解碼器進(jìn)行解碼操作,得到會(huì)議摘要生成結(jié)果。
27、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種應(yīng)用于對(duì)話的摘要生成裝置,采用了如下所述的技術(shù)方案:
28、原始數(shù)據(jù)獲取模塊,用于獲取待處理的原始對(duì)話數(shù)據(jù);
29、標(biāo)注模塊,用于對(duì)所述原始對(duì)話數(shù)據(jù)進(jìn)行標(biāo)注操作,得到標(biāo)注對(duì)話數(shù)據(jù);
30、圖編碼模塊,用于根據(jù)所述標(biāo)注對(duì)話數(shù)據(jù)構(gòu)建levi?graph圖,并根據(jù)所述levigraph圖對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行圖編碼操作,得到圖編碼數(shù)據(jù);
31、第一特征加權(quán)模塊,用于對(duì)所述圖編碼數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到第一加權(quán)特征向量;
32、文本編碼模塊,用于根據(jù)bart模型的編碼器對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行文本編碼操作,得到文本編碼數(shù)據(jù);
33、第二特征加權(quán)模塊,用于對(duì)所述文本編碼數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量;
34、特征拼接模塊,用于根據(jù)otk融合模型對(duì)所述第一加權(quán)特征向量以及所述第二加權(quán)特征向量進(jìn)行拼接操作,得到拼接特征向量;
35、解碼模塊,用于根據(jù)bart模型的解碼器對(duì)所述拼接特征向量進(jìn)行解碼操作,得到會(huì)議摘要生成文本。
36、進(jìn)一步的,所述第一特征加權(quán)模塊包括:
37、最大池化子模塊,用于將所述圖編碼數(shù)據(jù)輸入至rgcn層進(jìn)行最大池化操作,得到最大池化數(shù)據(jù);
38、第一線性變換子模塊,用于將所述最大池化數(shù)據(jù)輸入至第一密度層進(jìn)行第一線性變換操作,得到第一線性變化數(shù)據(jù);
39、第一特征加權(quán)子模塊,用于根據(jù)自注意力機(jī)制對(duì)所述第一線性變化數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到所述第一加權(quán)特征向量。
40、進(jìn)一步的,所述第二特征加權(quán)模塊包括:
41、第二線性變化子模塊,用于將所述文本編碼數(shù)據(jù)輸入至第二密度層進(jìn)行第二線性變化操作,得到第二線性變化數(shù)據(jù);
42、第二特征加權(quán)子模塊,用于根據(jù)自注意力機(jī)制對(duì)所述第二線性變化數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量。
43、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)設(shè)備,采用了如下所述的技術(shù)方案:
44、包括存儲(chǔ)器和處理器,所述存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)可讀指令,所述處理器執(zhí)行所述計(jì)算機(jī)可讀指令時(shí)實(shí)現(xiàn)如上所述的應(yīng)用于對(duì)話的摘要生成方法的步驟。
45、為了解決上述技術(shù)問(wèn)題,本技術(shù)實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),采用了如下所述的技術(shù)方案:
46、所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的應(yīng)用于對(duì)話的摘要生成方法的步驟。
47、本技術(shù)提供了一種應(yīng)用于對(duì)話的摘要生成方法,包括:獲取待處理的原始對(duì)話數(shù)據(jù);對(duì)所述原始對(duì)話數(shù)據(jù)進(jìn)行標(biāo)注操作,得到標(biāo)注對(duì)話數(shù)據(jù);根據(jù)所述標(biāo)注對(duì)話數(shù)據(jù)構(gòu)建levi?graph圖,并根據(jù)所述levi?graph圖對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行圖編碼操作,得到圖編碼數(shù)據(jù);對(duì)所述圖編碼數(shù)據(jù)進(jìn)行第一特征加權(quán)操作,得到第一加權(quán)特征向量;根據(jù)bart模型的編碼器對(duì)所述標(biāo)注對(duì)話數(shù)據(jù)進(jìn)行文本編碼操作,得到文本編碼數(shù)據(jù);對(duì)所述文本編碼數(shù)據(jù)進(jìn)行第二特征加權(quán)操作,得到第二加權(quán)特征向量;根據(jù)otk融合模型對(duì)所述第一加權(quán)特征向量以及所述第二加權(quán)特征向量進(jìn)行拼接操作,得到拼接特征向量;根據(jù)bart模型的解碼器對(duì)所述拼接特征向量進(jìn)行解碼操作,得到會(huì)議摘要生成文本。與現(xiàn)有技術(shù)相比,本技術(shù)通過(guò)對(duì)不同視角的說(shuō)話人進(jìn)行l(wèi)evi?graph圖編碼,將視角編碼特征作為輸入控制解碼器對(duì)不同角色看待相同會(huì)議內(nèi)容的摘要生成。