本技術(shù)涉及海洋生態(tài),特別是涉及海洋生態(tài)多智體的構(gòu)建方法及其交互系統(tǒng)。
背景技術(shù):
1、海洋生態(tài)保護(hù)作為全球性問(wèn)題,已經(jīng)吸引了越來(lái)越多的關(guān)注,特別是在結(jié)合ai技術(shù)進(jìn)行研究與應(yīng)用方面。然而,現(xiàn)有的“ai+海洋生態(tài)”技術(shù)仍存在諸多不足,未能充分解決領(lǐng)域內(nèi)的關(guān)鍵問(wèn)題。
2、在“ai+海洋生態(tài)”領(lǐng)域,支持向量機(jī)svm、隨機(jī)森林rf、人工神經(jīng)網(wǎng)絡(luò)ann等傳統(tǒng)的機(jī)器學(xué)習(xí)方法已經(jīng)應(yīng)用于物種分布預(yù)測(cè)的研究中,幫助科學(xué)家預(yù)測(cè)物種的潛在分布、評(píng)估物種豐富度,及探討物種棲息地選擇與景觀格局變化的關(guān)系。同時(shí),圖像識(shí)別技術(shù)在物種識(shí)別和數(shù)量統(tǒng)計(jì)、海洋污染物監(jiān)測(cè)等方面也有所應(yīng)用。這些ai技術(shù)為海洋生態(tài)資源管理、生態(tài)系統(tǒng)預(yù)測(cè)和海洋環(huán)境保護(hù)提供了決策支持,顯示出越來(lái)越大的應(yīng)用潛力。
3、然而,盡管ai技術(shù)在海洋生態(tài)保護(hù)領(lǐng)域取得了一些進(jìn)展,但其應(yīng)用發(fā)展依然面臨一系列問(wèn)題與挑戰(zhàn):
4、如,海洋生態(tài)領(lǐng)域的數(shù)據(jù)資源有限,數(shù)據(jù)孤島現(xiàn)象嚴(yán)重。ai模型的有效訓(xùn)練往往依賴于大規(guī)模、高質(zhì)量的數(shù)據(jù),但由于海洋生態(tài)數(shù)據(jù)的獲取需要大量的野外調(diào)查工作,這不僅耗時(shí)且成本高,導(dǎo)致數(shù)據(jù)規(guī)模難以滿足ai模型的訓(xùn)練需求,進(jìn)而影響模型的預(yù)測(cè)精度和泛化能力。
5、再如,現(xiàn)有的“ai+海洋生態(tài)”模型多采用傳統(tǒng)機(jī)器學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)(cnn)和長(zhǎng)短期記憶網(wǎng)絡(luò)(lstm)等方法,技術(shù)相對(duì)滯后,無(wú)法應(yīng)對(duì)復(fù)雜多變的海洋生態(tài)環(huán)境。特別是在應(yīng)對(duì)臺(tái)風(fēng)、風(fēng)暴潮以及人類活動(dòng)等干擾因素時(shí),模型的精度和穩(wěn)定性表現(xiàn)不佳,且未能充分利用業(yè)務(wù)化數(shù)據(jù)庫(kù)和互聯(lián)網(wǎng)數(shù)據(jù)。
6、此外,目前,海洋生物分布預(yù)測(cè)、物種識(shí)別、種群分析和污染物監(jiān)測(cè)等細(xì)分領(lǐng)域的ai模型,往往由多個(gè)獨(dú)立的小型模型分別實(shí)現(xiàn)。這些模型之間缺乏數(shù)據(jù)共享和耦合,無(wú)法形成統(tǒng)一的分析框架,導(dǎo)致“ai+海洋生態(tài)”應(yīng)用無(wú)法系統(tǒng)化發(fā)展,極大限制了科學(xué)研究和產(chǎn)業(yè)化應(yīng)用的進(jìn)展。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供了一種海洋生態(tài)多智體的構(gòu)建方法及其交互系統(tǒng),旨在解決數(shù)據(jù)匱乏、模型精度和穩(wěn)定性差、應(yīng)用碎片化等關(guān)鍵難題,為海洋生態(tài)保護(hù)提供更高效、更精準(zhǔn)的技術(shù)支持。
2、第一方面,本技術(shù)實(shí)施例提供了一種海洋生態(tài)多智體的構(gòu)建方法,包括:
3、海洋生態(tài)大模型構(gòu)建步驟,構(gòu)建微調(diào)數(shù)據(jù)集,基于微調(diào)數(shù)據(jù)集訓(xùn)練選定的大語(yǔ)言模型得到海洋生態(tài)大模型;
4、并行應(yīng)用模塊構(gòu)建步驟,構(gòu)建領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體并搭建多模態(tài)大模型,將并行應(yīng)用模塊的領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體、多模態(tài)大模型與所述海洋生態(tài)大模型以多元化并行部署方式部署于gpu服務(wù)器,
5、其中,所述領(lǐng)域知識(shí)庫(kù)的知識(shí)數(shù)據(jù)集包括:海洋環(huán)境數(shù)據(jù)、人類活動(dòng)壓力數(shù)據(jù),所述人類活動(dòng)壓力數(shù)據(jù)包括:社會(huì)經(jīng)濟(jì)數(shù)據(jù)、人類活動(dòng)數(shù)據(jù),所述海洋生態(tài)多智體包括:預(yù)先封裝的基礎(chǔ)功能智能體、互聯(lián)網(wǎng)功能智能體、海洋生態(tài)功能智能體,其中,基礎(chǔ)功能智能體用于實(shí)現(xiàn)業(yè)務(wù)化數(shù)據(jù)庫(kù)信息檢索、數(shù)學(xué)計(jì)算、服務(wù)器基礎(chǔ)設(shè)置、運(yùn)維等?;ヂ?lián)網(wǎng)功能智能體用于實(shí)現(xiàn)語(yǔ)言翻譯、天氣查詢、搜索引擎、地圖服務(wù)、論文檢索、維基百科等,海洋生態(tài)功能智能體用于實(shí)現(xiàn)漁業(yè)資源和海洋生態(tài)保護(hù)領(lǐng)域的功能,可以支持?jǐn)?shù)量統(tǒng)計(jì)、物種識(shí)別、生境模擬、物種分布預(yù)測(cè)、污染物監(jiān)測(cè)、極端天氣預(yù)測(cè)、生態(tài)災(zāi)難預(yù)警等功能;所述多模態(tài)大模型包括多模態(tài)模型、文生圖模型、文本語(yǔ)音模型、文生視頻模型,用于支持多模態(tài)大模型實(shí)現(xiàn)視覺(jué)問(wèn)答、文字到圖片、語(yǔ)音、視頻的相互轉(zhuǎn)換生成;
6、所述海洋生態(tài)大模型用于對(duì)用戶請(qǐng)求進(jìn)行解析并分發(fā)至所述并行應(yīng)用模塊,觸發(fā)所述并行應(yīng)用模塊中的領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體、多模態(tài)大模型中任一者或其任意組合生成響應(yīng)結(jié)果反饋至所述海洋生態(tài)大模型進(jìn)行整合語(yǔ)義后輸出。
7、基于上述步驟,本技術(shù)實(shí)施例為了解決現(xiàn)有模型技術(shù)滯后、模型精度和穩(wěn)定性差等問(wèn)題,構(gòu)建海洋生態(tài)大模型并采用大模型并行應(yīng)用架構(gòu),提高海洋生態(tài)領(lǐng)域的智能化水平,利用海洋生態(tài)大模型捕捉到傳統(tǒng)模型難以捕捉的細(xì)微變化和長(zhǎng)期趨勢(shì),從而提高模型的預(yù)測(cè)精度,并行應(yīng)用架構(gòu)可以支持更大規(guī)模的數(shù)據(jù)處理和更復(fù)雜的模型訓(xùn)練,進(jìn)一步增強(qiáng)模型的預(yù)測(cè)能力,使得預(yù)測(cè)結(jié)果更加準(zhǔn)確可靠,并行應(yīng)用架構(gòu)能夠充分利用多計(jì)算節(jié)點(diǎn)的計(jì)算資源,實(shí)現(xiàn)模型的并行訓(xùn)練和推理,從而顯著縮短模型訓(xùn)練和推理的時(shí)間,提高模型的響應(yīng)速度。
8、在其中一些實(shí)施例中,所述微調(diào)數(shù)據(jù)集的構(gòu)建過(guò)程包括:
9、數(shù)據(jù)獲取步驟,獲取海洋生態(tài)領(lǐng)域文獻(xiàn),并解析提取所述海洋生態(tài)領(lǐng)域文獻(xiàn)中的文本內(nèi)容;
10、文獻(xiàn)數(shù)據(jù)處理步驟,將文本內(nèi)容切分為段內(nèi)容并對(duì)應(yīng)提取每一段內(nèi)容的摘要,
11、微調(diào)數(shù)據(jù)集構(gòu)建步驟,將所述段內(nèi)容及其摘要存儲(chǔ)為json格式,得到微調(diào)數(shù)據(jù)集。
12、在其中一些實(shí)施例中,所述領(lǐng)域知識(shí)庫(kù)的構(gòu)建過(guò)程包括:
13、知識(shí)數(shù)據(jù)集獲取步驟,通過(guò)文檔加載器獲取海洋環(huán)境數(shù)據(jù)、人類活動(dòng)壓力數(shù)據(jù);
14、數(shù)據(jù)向量化步驟,使用分詞器將所述海洋環(huán)境數(shù)據(jù)、人類活動(dòng)壓力數(shù)據(jù)轉(zhuǎn)換成文本塊,并基于embedding模型進(jìn)行向量化處理,得到文本向量;
15、其中,所述領(lǐng)域知識(shí)庫(kù)獲取到分發(fā)的用戶請(qǐng)求時(shí),將用戶請(qǐng)求進(jìn)行向量化并對(duì)領(lǐng)域知識(shí)庫(kù)中的所述文本向量進(jìn)行相似性匹配,利用rerank模型對(duì)匹配結(jié)果進(jìn)行排序得到高相似性的文本向量后,利用提示詞工程將文本進(jìn)行內(nèi)容整合后發(fā)送至海洋生態(tài)大模型。
16、在其中一些實(shí)施例中,海洋生態(tài)大模型構(gòu)建步驟中采用lora微調(diào)方法基于llama_factory框架進(jìn)行訓(xùn)練。
17、在其中一些實(shí)施例中,通過(guò)一開(kāi)始節(jié)點(diǎn)、結(jié)束節(jié)點(diǎn)配置開(kāi)啟或關(guān)閉所述并行應(yīng)用模塊的工作流,通過(guò)一llm節(jié)點(diǎn)設(shè)置所述領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體、多模態(tài)大模型的主模型為所述海洋生態(tài)大模型,并分別為所述領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體、多模態(tài)大模型配置一開(kāi)關(guān)節(jié)點(diǎn),用于分別控制所述領(lǐng)域知識(shí)庫(kù)、海洋生態(tài)多智體、多模態(tài)大模型的工作流是否開(kāi)啟。
18、在其中一些實(shí)施例中,所述海洋生態(tài)多智體還配置有一觸發(fā)器,所述觸發(fā)器配置為關(guān)鍵詞觸發(fā),當(dāng)所述海洋生態(tài)多智體的開(kāi)關(guān)節(jié)點(diǎn)開(kāi)啟時(shí),經(jīng)所述觸發(fā)器開(kāi)啟所述海洋生態(tài)多智體中對(duì)應(yīng)的智能體。
19、在其中一些實(shí)施例中,所述基礎(chǔ)功能智能體包括:業(yè)務(wù)化數(shù)據(jù)庫(kù)處理智能體、數(shù)學(xué)計(jì)算智能體及服務(wù)器基礎(chǔ)設(shè)置智能體,其中:
20、所述業(yè)務(wù)化數(shù)據(jù)庫(kù)處理智能體是通過(guò)將海洋生態(tài)業(yè)務(wù)化數(shù)據(jù)庫(kù)api接口封裝為智能體得到,所述海洋生態(tài)業(yè)務(wù)化數(shù)據(jù)庫(kù)包括:海洋牧場(chǎng)監(jiān)測(cè)數(shù)據(jù)庫(kù)和污染物監(jiān)測(cè)數(shù)據(jù)庫(kù)、全球生物多樣性數(shù)據(jù)庫(kù);
21、所述數(shù)學(xué)計(jì)算技能題是通過(guò)將計(jì)算器封裝為智能體得到;
22、所述服務(wù)器基礎(chǔ)設(shè)置智能體是通過(guò)將服務(wù)器系統(tǒng)查詢命令封裝為智能體得到。
23、在其中一些實(shí)施例中,所述互聯(lián)網(wǎng)功能智能體包括語(yǔ)言翻譯智能體、天氣查詢智能體、搜索引擎智能體、地圖服務(wù)智能體、論文檢索智能體、知識(shí)百科智能體,其中,
24、所述語(yǔ)言翻譯智能體是通過(guò)將翻譯平臺(tái)api接口封裝為智能體得到;
25、所述天氣查詢智能體是通過(guò)將天氣預(yù)測(cè)平臺(tái)api接口封裝為智能體得到;
26、所述搜索引擎智能體是通過(guò)將搜索引擎api封裝為智能體得到;
27、所述地圖服務(wù)智能體是通過(guò)將地圖平臺(tái)poi服務(wù)api封裝為智能體得到;
28、所述論文檢索智能體是通過(guò)將圖書(shū)館數(shù)據(jù)庫(kù)api封裝為智能體得到;
29、所述知識(shí)百科智能體是通過(guò)將維基百科數(shù)據(jù)庫(kù)api接口封裝為智能體得到。
30、在其中一些實(shí)施例中,所述海洋生態(tài)功能智能體包括:數(shù)量統(tǒng)計(jì)智能體、物種識(shí)別智能體、生境模擬智能體、物種分布預(yù)測(cè)智能體,用于實(shí)現(xiàn)漁業(yè)資源保護(hù)的目的;其中,
31、所述數(shù)量統(tǒng)計(jì)智能體是通過(guò)將魚(yú)類細(xì)粒度識(shí)別模型封裝為智能體得到;
32、所述物種識(shí)別智能體是通過(guò)將海洋物種識(shí)別模型封裝為智能體得到;
33、所述生境模擬智能體是通過(guò)將海洋生境預(yù)測(cè)模擬分析模型封裝為智能體得到;
34、所述物種分布預(yù)測(cè)智能體是通過(guò)將物種分布預(yù)測(cè)模型封裝為智能體得到。
35、在其中一些實(shí)施例中,所述海洋生態(tài)功能智能體還包括:污染物監(jiān)測(cè)智能體、極端天氣預(yù)測(cè)智能體、生態(tài)災(zāi)難預(yù)警智能體,用于實(shí)現(xiàn)污染物監(jiān)測(cè)的目的;其中,
36、所述污染物監(jiān)測(cè)智能體是通過(guò)獲取海洋環(huán)境監(jiān)測(cè)中心的海水水質(zhì)監(jiān)測(cè)、海水浴場(chǎng)水質(zhì)信息封裝為智能體得到;
37、所述極端天氣預(yù)測(cè)智能體是通過(guò)將極端天氣預(yù)測(cè)模型封裝為智能體得到;
38、所述生態(tài)災(zāi)難預(yù)警智能體是通過(guò)將生態(tài)災(zāi)難監(jiān)測(cè)預(yù)警系統(tǒng)接口封裝為智能體得到。
39、第二方面,本技術(shù)實(shí)施例提供了一種海洋生態(tài)多智體交互系統(tǒng),基于如上第一方面所述的海洋生態(tài)多智體的構(gòu)建方法,包括:
40、數(shù)據(jù)層,用于基于數(shù)據(jù)源生成微調(diào)數(shù)據(jù)、領(lǐng)域知識(shí)庫(kù)及業(yè)務(wù)化數(shù)據(jù)庫(kù),數(shù)據(jù)源包括所述微調(diào)數(shù)據(jù)集、知識(shí)數(shù)據(jù)集及海洋生態(tài)多智體的數(shù)據(jù)源;
41、模型層,用于搭建所述海洋生態(tài)大模型、領(lǐng)域知識(shí)庫(kù)、多模態(tài)大模型及封裝基礎(chǔ)功能智能體、互聯(lián)網(wǎng)功能智能體、海洋生態(tài)功能智能體所需的子智能體,所述子智能體包括:業(yè)務(wù)化數(shù)據(jù)庫(kù)處理智能體、數(shù)學(xué)計(jì)算智能體及服務(wù)器基礎(chǔ)設(shè)置智能體、語(yǔ)言翻譯智能體、天氣查詢智能體、搜索引擎智能體、地圖服務(wù)智能體、論文檢索智能體、知識(shí)百科智能體、數(shù)量統(tǒng)計(jì)智能體、物種識(shí)別智能體、生境模擬智能體及物種分布預(yù)測(cè)智能體;
42、智能體層,用于在所述模型層的基礎(chǔ)上,融合所述子智能體搭建所述基礎(chǔ)功能智能體、互聯(lián)網(wǎng)功能智能體、海洋生態(tài)功能智能體;
43、應(yīng)用層,至少包括漁業(yè)資源保護(hù)應(yīng)用模塊、生態(tài)保護(hù)應(yīng)用模塊,所述漁業(yè)資源保護(hù)應(yīng)用模塊包括:海洋生物數(shù)量統(tǒng)計(jì)單元、物種識(shí)別單元、生境模擬單元、物種分布預(yù)測(cè)單元,生態(tài)保護(hù)應(yīng)用模塊包括:污染物監(jiān)測(cè)單元、極端天氣預(yù)測(cè)單元、生態(tài)災(zāi)難預(yù)警單元;
44、交互層,通過(guò)一前端交互界面提供模型配置、多模態(tài)對(duì)話、領(lǐng)域知識(shí)對(duì)話及知識(shí)庫(kù)的管理。
45、在其中一些實(shí)施例中,所述前端交互界面至少包括:
46、模型配置單元,用于選擇海洋生態(tài)大模型;
47、多模態(tài)對(duì)話配置單元,用于配置多模態(tài)大模型;
48、領(lǐng)域知識(shí)庫(kù)對(duì)話配置單元,用于配置至少一個(gè)知識(shí)庫(kù),并基于配置的知識(shí)庫(kù)進(jìn)行問(wèn)答服務(wù),新知識(shí)庫(kù)的自定義和現(xiàn)有知識(shí)庫(kù)的編輯可以通過(guò)一領(lǐng)域知識(shí)庫(kù)管理單元實(shí)現(xiàn);
49、多智體配置單元,通過(guò)選擇框獲取多智體啟用請(qǐng)求,并提供一多智體列表用于選擇至少一個(gè)智能體;
50、對(duì)話交互單元,通過(guò)文本輸入框或文件傳輸按鈕上傳文件并與所述海洋生態(tài)大模型進(jìn)行對(duì)話,獲取用戶請(qǐng)求,并發(fā)送至海洋生態(tài)大模型,獲取海洋生態(tài)大模型整合語(yǔ)義后的輸出結(jié)果。
51、本技術(shù)的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)在以下附圖和描述中提出,以使本技術(shù)的其他特征、目的和優(yōu)點(diǎn)更加簡(jiǎn)明易懂。