本申請涉及人工智能,尤其涉及一種基于多維特征挖掘的數(shù)據(jù)報告智能生成方法及相關(guān)設(shè)備。
背景技術(shù):
1、隨著信息時代的到來,數(shù)據(jù)的數(shù)量和復(fù)雜性日益增加,尤其是在社會治理和法律領(lǐng)域,面對大量的事件和相關(guān)線索,傳統(tǒng)的手工處理和分析方法已經(jīng)無法滿足快速響應(yīng)和處理的需求。尤其是在生成針對特定政法線索的分析報告時,傳統(tǒng)方法往往效率低下,容易出錯,且難以適應(yīng)數(shù)據(jù)特征的快速變化。
2、此外,手動編制報告不僅耗時耗力,還難以保證報告內(nèi)容的時效性和深度。隨著數(shù)據(jù)量的激增,從這些數(shù)據(jù)中提取關(guān)鍵信息、生成有洞察力的報告成為了一個主要挑戰(zhàn)。這些報告通常需要反映最新的數(shù)據(jù)洞察和趨勢,為決策提供支持,而手動方法在處理大量復(fù)雜數(shù)據(jù)時常常力不從心。
技術(shù)實現(xiàn)思路
1、有鑒于此,本申請的目的在于提出一種基于多維特征挖掘的數(shù)據(jù)報告智能生成方法及相關(guān)設(shè)備,以解決分析報告生成效率低且時效性較差的問題。
2、基于上述目的,本申請的第一方面提供了一種基于多維特征挖掘的數(shù)據(jù)報告智能生成方法,包括:
3、獲取待處理的線索數(shù)據(jù);
4、根據(jù)預(yù)先提取的核心分析要素確定在所述線索數(shù)據(jù)中待抽取的實體和屬性,并建立實體之間的關(guān)聯(lián)關(guān)系;其中,所述核心分析要素是根據(jù)歷史報告數(shù)據(jù)確定的;
5、根據(jù)所述實體、所述屬性、所述關(guān)聯(lián)關(guān)系和所述線索數(shù)據(jù)構(gòu)建第一提示詞,將所述第一提示詞輸入至大語言模型,通過所述大語言模型輸出所述線索數(shù)據(jù)對應(yīng)的關(guān)鍵數(shù)據(jù);其中,所述第一提示詞用于指示所述大語言模型根據(jù)實體、所述屬性和所述關(guān)聯(lián)關(guān)系從所述線索數(shù)據(jù)中提取關(guān)鍵數(shù)據(jù);
6、利用統(tǒng)計算法對所述關(guān)鍵數(shù)據(jù)進行統(tǒng)計分析,得到統(tǒng)計分析結(jié)果;
7、根據(jù)所述統(tǒng)計分析結(jié)果對預(yù)先構(gòu)建的第一分析模版進行更新,得到第二分析模版;其中,所述第一分析模版是根據(jù)歷史報告數(shù)據(jù)確定的;
8、基于所述關(guān)鍵數(shù)據(jù)對所述第二分析模版進行填充,生成所述分析報告。
9、本申請的第二方面提供了一種基于多維特征挖掘的數(shù)據(jù)報告智能生成裝置,包括:
10、獲取模塊,被配置為獲取待處理的線索數(shù)據(jù);
11、確定模塊,被配置為根據(jù)預(yù)先提取的核心分析要素確定在所述線索數(shù)據(jù)中待抽取的實體和屬性,并建立實體之間的關(guān)聯(lián)關(guān)系;其中,所述核心分析要素是根據(jù)歷史報告數(shù)據(jù)確定的;
12、提取模塊,被配置為根據(jù)所述實體、所述屬性、所述關(guān)聯(lián)關(guān)系和所述線索數(shù)據(jù)構(gòu)建第一提示詞,將所述第一提示詞輸入至大語言模型,通過所述大語言模型輸出所述線索數(shù)據(jù)對應(yīng)的關(guān)鍵數(shù)據(jù);其中,所述第一提示詞用于指示所述大語言模型根據(jù)實體、所述屬性和所述關(guān)聯(lián)關(guān)系從所述線索數(shù)據(jù)中提取關(guān)鍵數(shù)據(jù);
13、分析模塊,被配置為利用統(tǒng)計算法對所述關(guān)鍵數(shù)據(jù)進行統(tǒng)計分析,得到統(tǒng)計分析結(jié)果;
14、更新模塊,被配置為根據(jù)所述統(tǒng)計分析結(jié)果對預(yù)先構(gòu)建的第一分析模版進行更新,得到第二分析模版;其中,所述第一分析模版是根據(jù)歷史報告數(shù)據(jù)確定的;
15、生成模塊,被配置為基于所述關(guān)鍵數(shù)據(jù)對所述第二分析模版進行填充,生成所述分析報告。
16、本申請的第三方面還提供了一種電子設(shè)備,包括存儲器、處理器及存儲在所述存儲器上并可由所述處理器執(zhí)行的計算機程序,所述處理器在執(zhí)行所述計算機程序時實現(xiàn)如第一方面所述的方法。
17、本申請還提供了一種非暫態(tài)計算機可讀存儲介質(zhì),所述非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,所述計算機指令用于使計算機執(zhí)行如第一方面所述的方法。
18、從上面所述可以看出,本申請?zhí)峁┑幕诙嗑S特征挖掘的數(shù)據(jù)報告智能生成方法及相關(guān)設(shè)備,所述方法包括獲取待處理的線索數(shù)據(jù);根據(jù)預(yù)先提取的核心分析要素確定在所述線索數(shù)據(jù)中待抽取的實體和屬性,并建立實體之間的關(guān)聯(lián)關(guān)系;其中,所述核心分析要素是根據(jù)歷史報告數(shù)據(jù)確定的,便于準確確定需要從線索數(shù)據(jù)中抽取的具體內(nèi)容。根據(jù)所述實體、所述屬性、所述關(guān)聯(lián)關(guān)系和所述線索數(shù)據(jù)構(gòu)建第一提示詞,將所述第一提示詞輸入至大語言模型,通過所述大語言模型輸出所述線索數(shù)據(jù)對應(yīng)的關(guān)鍵數(shù)據(jù);其中,所述第一提示詞用于指示所述大語言模型根據(jù)實體、所述屬性和所述關(guān)聯(lián)關(guān)系從所述線索數(shù)據(jù)中提取關(guān)鍵數(shù)據(jù)。利用大語言模型的理解能力,通過第一提示詞指示大語言模型提取關(guān)鍵數(shù)據(jù),以為后續(xù)生成分析報告提供數(shù)據(jù)基礎(chǔ)。利用統(tǒng)計算法對所述關(guān)鍵數(shù)據(jù)進行統(tǒng)計分析,挖掘關(guān)鍵數(shù)據(jù)中的新趨勢和新內(nèi)容,得到統(tǒng)計分析結(jié)果。根據(jù)所述統(tǒng)計分析結(jié)果對預(yù)先構(gòu)建的第一分析模版進行更新,得到第二分析模版;其中,所述第一分析模版是根據(jù)歷史報告數(shù)據(jù)確定的;實現(xiàn)了分析模版的動態(tài)調(diào)節(jié),以適應(yīng)線索數(shù)據(jù)的實時變化趨勢。基于所述關(guān)鍵數(shù)據(jù)對所述第二分析模版進行填充,生成所述分析報告。自動生成分析報告,有助于提升分析報告的生成速率和準確性,確保報告內(nèi)容隨著數(shù)據(jù)的更新而更新,滿足快速變化的決策環(huán)境的需要。
1.一種基于多維特征挖掘的數(shù)據(jù)報告智能生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第一分析模版中包括多個模版要素;所述根據(jù)所述統(tǒng)計分析結(jié)果對預(yù)先構(gòu)建的第一分析模版進行更新,得到第二分析模版,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述核心分析要素的確定方法,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)經(jīng)過數(shù)據(jù)清洗的歷史報告數(shù)據(jù)確定初始分析模版,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,對所述歷史報告數(shù)據(jù)進行數(shù)據(jù)清洗,包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述針對每個類簇中的文本段落,利用大語言模型提取得到所述類簇中文本段落對應(yīng)的核心分析信息,包括:
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述第一分析模版的確定方法,包括:
8.一種基于多維特征挖掘的數(shù)據(jù)報告智能生成裝置,其特征在于,包括:
9.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述程序時實現(xiàn)如權(quán)利要求1至7任意一項所述的方法。
10.一種非暫態(tài)計算機可讀存儲介質(zhì),所述非暫態(tài)計算機可讀存儲介質(zhì)存儲計算機指令,其特征在于,所述計算機指令用于使計算機執(zhí)行權(quán)利要求1至7任一所述方法。