本技術(shù)涉及人工智能領(lǐng)域,具體涉及一種基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法及裝置。
背景技術(shù):
1、數(shù)據(jù)可視化作為數(shù)據(jù)分析和商業(yè)智能領(lǐng)域的重要組成部分,在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的商業(yè)環(huán)境中扮演著越來(lái)越關(guān)鍵的角色。它能夠?qū)?fù)雜的數(shù)據(jù)集轉(zhuǎn)化為直觀、易懂的圖形表示,幫助決策者快速理解數(shù)據(jù)中的模式、趨勢(shì)和異常。然而,盡管數(shù)據(jù)可視化技術(shù)在近年來(lái)取得了顯著進(jìn)展,現(xiàn)有的方法在面對(duì)快速變化的業(yè)務(wù)需求和日益復(fù)雜的數(shù)據(jù)結(jié)構(gòu)時(shí),仍然存在諸多局限性和挑戰(zhàn)。
2、首先,傳統(tǒng)的數(shù)據(jù)可視化方法通常依賴于專業(yè)的數(shù)據(jù)分析師或可視化專家。這些專業(yè)人員需要深入理解數(shù)據(jù)結(jié)構(gòu)、業(yè)務(wù)需求,并掌握復(fù)雜的可視化工具和技術(shù)。這種方法雖然能夠產(chǎn)生高質(zhì)量的可視化結(jié)果,但存在明顯的缺陷:耗時(shí)耗力,成本高昂,且難以快速響應(yīng)不斷變化的業(yè)務(wù)需求。在當(dāng)今快節(jié)奏的商業(yè)環(huán)境中,這種傳統(tǒng)方法的效率已經(jīng)難以滿足企業(yè)的實(shí)時(shí)決策需求。
3、其次,市場(chǎng)上存在許多自動(dòng)化數(shù)據(jù)可視化工具,旨在簡(jiǎn)化可視化過(guò)程。這些工具通常提供一系列預(yù)定義的圖表類型和模板,用戶只需導(dǎo)入數(shù)據(jù)并選擇所需的圖表類型即可。雖然這些工具提高了生成可視化的速度,但它們往往缺乏對(duì)業(yè)務(wù)語(yǔ)境的深入理解。結(jié)果是,它們可能生成在技術(shù)上正確但在業(yè)務(wù)意義上難以理解或不相關(guān)的可視化結(jié)果。這種脫離業(yè)務(wù)語(yǔ)境的可視化不僅無(wú)法為決策提供有效支持,還可能導(dǎo)致誤解和錯(cuò)誤的決策。
4、綜上所述,盡管數(shù)據(jù)可視化技術(shù)在過(guò)去幾年取得了顯著進(jìn)展,但在面對(duì)現(xiàn)代企業(yè)復(fù)雜多變的數(shù)據(jù)分析需求時(shí),現(xiàn)有方法仍存在諸多局限性。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中的問(wèn)題,本技術(shù)提供一種基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法及裝置,能夠高效、準(zhǔn)確實(shí)現(xiàn)數(shù)據(jù)可視化。
2、為了解決上述問(wèn)題中的至少一個(gè),本技術(shù)提供以下技術(shù)方案:
3、第一方面,本技術(shù)提供一種基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法,包括:
4、獲取用戶歷史數(shù)據(jù)分析需求的原始數(shù)據(jù)特征,對(duì)所述原始數(shù)據(jù)特征進(jìn)行特征分析,確定所述原始數(shù)據(jù)特征的指標(biāo)相關(guān)性、特征重要性以及主成分貢獻(xiàn)度,將所述指標(biāo)相關(guān)性、所述特征重要性以及所述主成分貢獻(xiàn)度輸入多層感知機(jī)模型的輸入層進(jìn)行模型訓(xùn)練,得到需求分類模型;
5、接收并解析用戶發(fā)送的數(shù)據(jù)分析需求,將所述數(shù)據(jù)分析需求中的目標(biāo)業(yè)務(wù)指標(biāo)和目標(biāo)業(yè)務(wù)維度信息輸入需求分類模型,得到所述需求分類模型輸出的類型指標(biāo)和度量指標(biāo);
6、根據(jù)所述類型指標(biāo)間的邏輯關(guān)系,確定報(bào)表的層次結(jié)構(gòu)和布局,根據(jù)所述度量指標(biāo)的計(jì)算公式、聚合方式和展示格式,為所述報(bào)表添加計(jì)算邏輯,生成對(duì)應(yīng)的業(yè)務(wù)報(bào)表。
7、進(jìn)一步地,所述對(duì)所述原始數(shù)據(jù)特征進(jìn)行特征分析,確定所述原始數(shù)據(jù)特征的指標(biāo)相關(guān)性、特征重要性以及主成分貢獻(xiàn)度,包括:
8、根據(jù)所述原始數(shù)據(jù)特征與目標(biāo)業(yè)務(wù)指標(biāo)之間的線性相關(guān)程度,確定各所述原始數(shù)據(jù)特征的指標(biāo)相關(guān)性;
9、根據(jù)所述原始數(shù)據(jù)特征在預(yù)設(shè)決策樹(shù)節(jié)點(diǎn)分裂時(shí)產(chǎn)生的基尼指數(shù)增益,確定各所述原始數(shù)據(jù)特征的特征重要性,根據(jù)所述原始數(shù)據(jù)特征所相應(yīng)的協(xié)方差矩陣的特征值和特征向量,確定各所述原始數(shù)據(jù)特征的主成分貢獻(xiàn)度。
10、進(jìn)一步地,所述將所述指標(biāo)相關(guān)性、所述特征重要性以及所述主成分貢獻(xiàn)度輸入多層感知機(jī)模型的輸入層進(jìn)行模型訓(xùn)練,得到需求分類模型,包括:
11、構(gòu)建節(jié)點(diǎn)數(shù)與所述指標(biāo)相關(guān)性、所述特征重要性以及所述主成分貢獻(xiàn)度的特征數(shù)量相匹配的模型輸入層,構(gòu)建節(jié)點(diǎn)數(shù)與可能的類型指標(biāo)和度量指標(biāo)的數(shù)量相對(duì)應(yīng)的模型輸出層,根據(jù)所述模型輸入層、所述模型輸出層以及預(yù)設(shè)模型隱藏層構(gòu)建得到初始分類模型;
12、將所述指標(biāo)相關(guān)性、所述特征重要性以及所述主成分貢獻(xiàn)度輸入多層感知機(jī)模型的模型輸入層并采用小批量梯度下降法進(jìn)行模型訓(xùn)練,通過(guò)反向傳播算法更新模型參數(shù),得到需求分類模型。
13、進(jìn)一步地,所述將所述數(shù)據(jù)分析需求中的目標(biāo)業(yè)務(wù)指標(biāo)和目標(biāo)業(yè)務(wù)維度信息輸入需求分類模型,得到所述需求分類模型輸出的類型指標(biāo)和度量指標(biāo),包括:
14、通過(guò)預(yù)設(shè)自然語(yǔ)義識(shí)別算法對(duì)所述數(shù)據(jù)分析需求進(jìn)行語(yǔ)義識(shí)別,確定對(duì)應(yīng)的目標(biāo)業(yè)務(wù)指標(biāo)和目標(biāo)業(yè)務(wù)維度并轉(zhuǎn)換為特征向量;
15、將該特征向量輸入經(jīng)過(guò)模型訓(xùn)練后的需求分類模型中,以使該需求分類模型通過(guò)前向傳播計(jì)算,在每個(gè)隱藏層應(yīng)用激活函數(shù),最終在輸出層輸出類型指標(biāo)和度量指標(biāo)。
16、進(jìn)一步地,所述根據(jù)所述類型指標(biāo)間的邏輯關(guān)系,確定報(bào)表的層次結(jié)構(gòu)和布局,包括:
17、通過(guò)預(yù)定義的業(yè)務(wù)知識(shí)圖譜識(shí)別類型指標(biāo)之間的層級(jí)關(guān)系、從屬關(guān)系和關(guān)聯(lián)關(guān)系,根據(jù)所述層級(jí)關(guān)系、所述從屬關(guān)系和所述關(guān)聯(lián)關(guān)系構(gòu)建關(guān)系網(wǎng)絡(luò);
18、將所述關(guān)系網(wǎng)絡(luò)中最高層級(jí)的類型指標(biāo)作為主維度確定報(bào)表層次結(jié)構(gòu)和結(jié)構(gòu)。
19、進(jìn)一步地,所述根據(jù)所述度量指標(biāo)的計(jì)算公式、聚合方式和展示格式,為所述報(bào)表添加計(jì)算邏輯,包括:
20、根據(jù)所述度量指標(biāo)的計(jì)算公式確定所需的原始數(shù)據(jù)項(xiàng)和中間計(jì)算步驟,根據(jù)所述度量指標(biāo)的聚合方式確定對(duì)應(yīng)的聚合函數(shù)和聚合層級(jí),根據(jù)所述度量指標(biāo)的展示格式確定對(duì)應(yīng)的樹(shù)形結(jié)構(gòu)或有向圖結(jié)構(gòu);
21、根據(jù)所需的原始數(shù)據(jù)項(xiàng)和中間計(jì)算步驟、對(duì)應(yīng)的聚合函數(shù)和聚合層級(jí)以及對(duì)應(yīng)的樹(shù)形結(jié)構(gòu)或有向圖結(jié)構(gòu)為所述報(bào)表添加計(jì)算邏輯。
22、進(jìn)一步地,所述生成對(duì)應(yīng)的業(yè)務(wù)報(bào)表,還包括:
23、分析每個(gè)度量指標(biāo)的計(jì)算公式和聚合方式,確定相應(yīng)的數(shù)據(jù)處理流程并從數(shù)據(jù)源提取所需的原始數(shù)據(jù),按照預(yù)定義的計(jì)算順序,實(shí)現(xiàn)每個(gè)度量指標(biāo)的計(jì)算過(guò)程,包括中間計(jì)算步驟和最終聚合;
24、處理不同維度組合下的計(jì)算邏輯并采用并行計(jì)算或預(yù)計(jì)算策略,將計(jì)算結(jié)果填充到報(bào)表結(jié)構(gòu)中,并應(yīng)用預(yù)設(shè)的數(shù)據(jù)格式和展示樣式,生成對(duì)應(yīng)的業(yè)務(wù)報(bào)表。
25、第二方面,本技術(shù)提供一種基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成裝置,包括:
26、模型構(gòu)建模塊,用于獲取用戶歷史數(shù)據(jù)分析需求的原始數(shù)據(jù)特征,對(duì)所述原始數(shù)據(jù)特征進(jìn)行特征分析,確定所述原始數(shù)據(jù)特征的指標(biāo)相關(guān)性、特征重要性以及主成分貢獻(xiàn)度,將所述指標(biāo)相關(guān)性、所述特征重要性以及所述主成分貢獻(xiàn)度輸入多層感知機(jī)模型的輸入層進(jìn)行模型訓(xùn)練,得到需求分類模型;
27、指標(biāo)確定模塊,用于接收并解析用戶發(fā)送的數(shù)據(jù)分析需求,將所述數(shù)據(jù)分析需求中的目標(biāo)業(yè)務(wù)指標(biāo)和目標(biāo)業(yè)務(wù)維度信息輸入需求分類模型,得到所述需求分類模型輸出的類型指標(biāo)和度量指標(biāo);
28、報(bào)表生成模塊,用于根據(jù)所述類型指標(biāo)間的邏輯關(guān)系,確定報(bào)表的層次結(jié)構(gòu)和布局,根據(jù)所述度量指標(biāo)的計(jì)算公式、聚合方式和展示格式,為所述報(bào)表添加計(jì)算邏輯,生成對(duì)應(yīng)的業(yè)務(wù)報(bào)表。
29、第三方面,本技術(shù)提供一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)所述的基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法的步驟。
30、第四方面,本技術(shù)提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述的基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法的步驟。
31、第五方面,本技術(shù)提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述的基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法的步驟。
32、由上述技術(shù)方案可知,本技術(shù)提供一種基于大語(yǔ)言模型的快速數(shù)據(jù)可視化生成方法及裝置,通過(guò)接收并解析用戶發(fā)送的數(shù)據(jù)分析需求,將數(shù)據(jù)分析需求中的目標(biāo)業(yè)務(wù)指標(biāo)和目標(biāo)業(yè)務(wù)維度信息輸入需求分類模型,得到需求分類模型輸出的類型指標(biāo)和度量指標(biāo);根據(jù)類型指標(biāo)間的邏輯關(guān)系,確定報(bào)表的層次結(jié)構(gòu)和布局,根據(jù)度量指標(biāo)的計(jì)算公式、聚合方式和展示格式,為報(bào)表添加計(jì)算邏輯,生成對(duì)應(yīng)的業(yè)務(wù)報(bào)表,由此能夠高效、準(zhǔn)確實(shí)現(xiàn)數(shù)據(jù)可視化。