本發(fā)明涉及教育管理,特別指一種基于混合大模型的學生綜合素質(zhì)評價方法及系統(tǒng)。
背景技術:
1、為了對學生進行因材施教、查漏補缺、考核學習成果,需要對學生的綜合素質(zhì)進行評價。針對學生綜合素質(zhì)的評價,傳統(tǒng)上依賴于教師主觀判斷、標準化測試以及量表(問卷),傳統(tǒng)方法在評價的全面性和客觀性上存在局限性,已無法滿足當下的評價需求。
2、隨著大型語言模型在自然語言理解和生成任務中展現(xiàn)出強大的能力,利用大型語言模型進行學生綜合素質(zhì)評價成為未來的發(fā)展方向。然而,現(xiàn)有的大型語言模型應用在學生綜合素質(zhì)評價時,存在如下缺點:
3、1、單一的大型語言模型往往受限于其訓練數(shù)據(jù)和模型結構,難以全面覆蓋學生綜合素質(zhì)的多個維度和多模態(tài)數(shù)據(jù),且不同來源、格式的學生數(shù)據(jù)難以有效融合,使得評價的客觀性和全面性有待提升;2、面對復雜多元的評價場景時,往往受到模型容量限制、訓練數(shù)據(jù)偏見等因素的影響,難以全面捕捉個體的綜合素質(zhì);3、不同學生具有獨特的成長背景和發(fā)展需求,單一的大型語言模型難以提供高度個性化的評價和建議,靈活性不佳。
4、因此,如何提供一種基于混合大模型的學生綜合素質(zhì)評價方法及系統(tǒng),實現(xiàn)提升學生綜合素質(zhì)評價的客觀性、全面性以及靈活性,成為一個亟待解決的技術問題。
技術實現(xiàn)思路
1、本發(fā)明要解決的技術問題,在于提供一種基于混合大模型的學生綜合素質(zhì)評價方法及系統(tǒng),實現(xiàn)提升學生綜合素質(zhì)評價的客觀性、全面性以及靈活性。
2、第一方面,本發(fā)明提供了一種基于混合大模型的學生綜合素質(zhì)評價方法,包括如下步驟:
3、步驟s1、基于評價目標構建一用于學生綜合素質(zhì)評價的評價指標體系;
4、步驟s2、通過rag技術,基于所述評價指標體系構建一大模型知識庫;
5、步驟s3、構建一包括輸入層、分析層、討論層以及聚合層的混合評價大模型;所述輸入層包括三個第一大型語言模型,用于輸入學生數(shù)據(jù)以及提示詞;所述分析層包括三個第二大型語言模型,用于依據(jù)所述提示詞調(diào)用大模型知識庫對學生數(shù)據(jù)進行多維度評價,得到各維度的初步評價結果;所述討論層包括三個第三大型語言模型,用于對各所述初步評價結果進行對比和整合,得到若干個優(yōu)化評價結果;所述聚合層包括一個第四大型語言模型,用于依據(jù)各所述優(yōu)化評價結果輸出綜合素質(zhì)評價結果;
6、步驟s4、獲取待評價學生數(shù)據(jù),對所述待評價學生數(shù)據(jù)進行預處理;
7、步驟s5、將預處理后的所述待評價學生數(shù)據(jù)輸入混合評價大模型,輸出綜合素質(zhì)評價結果。
8、進一步的,所述步驟s1具體為:
9、基于思想品德、學業(yè)水平、身心健康、藝術素養(yǎng)、社會實踐以及勞動素養(yǎng)這六個維度設定評價目標,為各所述評價目標設定至少包括指標定義、評分標準以及權重的評價指標,按預設的邏輯結構對各所述評價指標進行組織,以構建一用于學生綜合素質(zhì)評價的評價指標體系。
10、進一步的,所述步驟s2具體為:
11、獲取大量的至少包括思想品德數(shù)據(jù)、學業(yè)水平數(shù)據(jù)、身心健康數(shù)據(jù)、藝術素養(yǎng)數(shù)據(jù)、社會實踐數(shù)據(jù)以及勞動素養(yǎng)數(shù)據(jù)的學生歷史數(shù)據(jù),對各所述學生歷史數(shù)據(jù)進行至少包括異常數(shù)據(jù)檢測、數(shù)據(jù)清洗以及格式轉(zhuǎn)換的預處理后,通過rag技術將各所述學生歷史數(shù)據(jù)映射到評價指標體系對應的評價指標上,以構建一用于被分析層進行調(diào)用的大模型知識庫,并基于最新的學生數(shù)據(jù)不斷更新所述大模型知識庫;
12、所述思想品德數(shù)據(jù)至少包括活動項目數(shù)據(jù)、獎勵項目數(shù)據(jù)以及違規(guī)違紀數(shù)據(jù);所述學業(yè)水平數(shù)據(jù)至少包括學科競賽數(shù)據(jù)、選修課程數(shù)據(jù)、考試成績;所述身心健康數(shù)據(jù)至少包括心理健康數(shù)據(jù)、體育成績以及體育愛好;所述藝術素養(yǎng)數(shù)據(jù)至少包括藝術團隊、藝術活動、藝術愛好以及藝術成績;所述社會實踐數(shù)據(jù)至少包括實踐活動、研究性成果、科技創(chuàng)新以及創(chuàng)造發(fā)明;所述勞動素養(yǎng)數(shù)據(jù)至少包括勞動競賽數(shù)據(jù)、勞動成果、能力技術證書以及實踐項目。
13、進一步的,所述步驟s3中,三個所述第一大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接;三個所述第二大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接;三個所述第三大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接。
14、進一步的,所述步驟s4具體為:
15、通過數(shù)據(jù)庫獲取待評價學生數(shù)據(jù),對所述待評價學生數(shù)據(jù)進行至少包括異常數(shù)據(jù)檢測、數(shù)據(jù)清洗以及格式轉(zhuǎn)換的預處理;
16、所述步驟s5具體為:
17、將預處理后的所述待評價學生數(shù)據(jù)實時輸入混合評價大模型,輸出綜合素質(zhì)評價結果,通過可視化界面以圖表或者圖形的形式展示所述綜合素質(zhì)評價結果,并對所述綜合素質(zhì)評價結果進行存儲和備份。
18、第二方面,本發(fā)明提供了一種基于混合大模型的學生綜合素質(zhì)評價系統(tǒng),包括如下模塊:
19、評價指標體系構建模塊,用于基于評價目標構建一用于學生綜合素質(zhì)評價的評價指標體系;
20、大模型知識庫構建模塊,用于通過rag技術,基于所述評價指標體系構建一大模型知識庫;
21、混合評價大模型構建模塊,用于構建一包括輸入層、分析層、討論層以及聚合層的混合評價大模型;所述輸入層包括三個第一大型語言模型,用于輸入學生數(shù)據(jù)以及提示詞;所述分析層包括三個第二大型語言模型,用于依據(jù)所述提示詞調(diào)用大模型知識庫對學生數(shù)據(jù)進行多維度評價,得到各維度的初步評價結果;所述討論層包括三個第三大型語言模型,用于對各所述初步評價結果進行對比和整合,得到若干個優(yōu)化評價結果;所述聚合層包括一個第四大型語言模型,用于依據(jù)各所述優(yōu)化評價結果輸出綜合素質(zhì)評價結果;
22、待評價學生數(shù)據(jù)預處理模塊,用于獲取待評價學生數(shù)據(jù),對所述待評價學生數(shù)據(jù)進行預處理;
23、綜合素質(zhì)評價模塊,用于將預處理后的所述待評價學生數(shù)據(jù)輸入混合評價大模型,輸出綜合素質(zhì)評價結果。
24、進一步的,所述評價指標體系構建模塊具體用于:
25、基于思想品德、學業(yè)水平、身心健康、藝術素養(yǎng)、社會實踐以及勞動素養(yǎng)這六個維度設定評價目標,為各所述評價目標設定至少包括指標定義、評分標準以及權重的評價指標,按預設的邏輯結構對各所述評價指標進行組織,以構建一用于學生綜合素質(zhì)評價的評價指標體系。
26、進一步的,所述大模型知識庫構建模塊具體用于:
27、獲取大量的至少包括思想品德數(shù)據(jù)、學業(yè)水平數(shù)據(jù)、身心健康數(shù)據(jù)、藝術素養(yǎng)數(shù)據(jù)、社會實踐數(shù)據(jù)以及勞動素養(yǎng)數(shù)據(jù)的學生歷史數(shù)據(jù),對各所述學生歷史數(shù)據(jù)進行至少包括異常數(shù)據(jù)檢測、數(shù)據(jù)清洗以及格式轉(zhuǎn)換的預處理后,通過rag技術將各所述學生歷史數(shù)據(jù)映射到評價指標體系對應的評價指標上,以構建一用于被分析層進行調(diào)用的大模型知識庫,并基于最新的學生數(shù)據(jù)不斷更新所述大模型知識庫;
28、所述思想品德數(shù)據(jù)至少包括活動項目數(shù)據(jù)、獎勵項目數(shù)據(jù)以及違規(guī)違紀數(shù)據(jù);所述學業(yè)水平數(shù)據(jù)至少包括學科競賽數(shù)據(jù)、選修課程數(shù)據(jù)、考試成績;所述身心健康數(shù)據(jù)至少包括心理健康數(shù)據(jù)、體育成績以及體育愛好;所述藝術素養(yǎng)數(shù)據(jù)至少包括藝術團隊、藝術活動、藝術愛好以及藝術成績;所述社會實踐數(shù)據(jù)至少包括實踐活動、研究性成果、科技創(chuàng)新以及創(chuàng)造發(fā)明;所述勞動素養(yǎng)數(shù)據(jù)至少包括勞動競賽數(shù)據(jù)、勞動成果、能力技術證書以及實踐項目。
29、進一步的,所述混合評價大模型構建模塊中,三個所述第一大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接;三個所述第二大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接;三個所述第三大型語言模型采取串行協(xié)作、并行融合或者混合協(xié)作的方式連接。
30、進一步的,所述待評價學生數(shù)據(jù)預處理模塊具體用于:
31、通過數(shù)據(jù)庫獲取待評價學生數(shù)據(jù),對所述待評價學生數(shù)據(jù)進行至少包括異常數(shù)據(jù)檢測、數(shù)據(jù)清洗以及格式轉(zhuǎn)換的預處理;
32、所述綜合素質(zhì)評價模塊具體用于:
33、將預處理后的所述待評價學生數(shù)據(jù)實時輸入混合評價大模型,輸出綜合素質(zhì)評價結果,通過可視化界面以圖表或者圖形的形式展示所述綜合素質(zhì)評價結果,并對所述綜合素質(zhì)評價結果進行存儲和備份。
34、本發(fā)明的優(yōu)點在于:
35、通過構建用于學生綜合素質(zhì)評價的評價指標體系,接著通過rag技術,基于評價指標體系構建大模型知識庫,接著構建包括輸入層、分析層、討論層以及聚合層的混合評價大模型;輸入層包括三個第一大型語言模型,用于輸入學生數(shù)據(jù)以及提示詞;分析層包括三個第二大型語言模型,用于依據(jù)提示詞調(diào)用大模型知識庫對學生數(shù)據(jù)進行多維度評價,得到各維度的初步評價結果;討論層包括三個第三大型語言模型,用于對各初步評價結果進行對比和整合,得到若干個優(yōu)化評價結果;聚合層包括一個第四大型語言模型,用于依據(jù)各優(yōu)化評價結果輸出綜合素質(zhì)評價結果;最后獲取待評價學生數(shù)據(jù)并進行預處理后輸入混合評價大模型,輸出綜合素質(zhì)評價結果;即本發(fā)明通過集合若干個第一大型語言模型、第二大型語言模型、第三大型語言模型以及第四大型語言模型的混合評價大模型,對輸入的待評價學生數(shù)據(jù)進行多維度的綜合素質(zhì)評價,結合不同大型語言模型的優(yōu)點,可以提供高度個性化的評價和建議,且通過評價指標體系構建的大模型知識庫對混合評價大模型的綜合素質(zhì)評價進行輔助,以提升綜合素質(zhì)評價結果的準確性和可靠性,最終極大的提升了學生綜合素質(zhì)評價的客觀性、全面性以及靈活性。