本發(fā)明涉及健康醫(yī)療與人工智能,尤其涉及一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng)及其陪伴方法。
背景技術(shù):
1、數(shù)字人技術(shù)是一種基于人工智能技術(shù)的虛擬形象技術(shù),能夠模擬人類的外貌、聲音和行為。其技術(shù)基于強(qiáng)大的計(jì)算機(jī)圖形渲染及動(dòng)捕技術(shù),綜合運(yùn)用大數(shù)據(jù)技術(shù)和人工智能技術(shù),實(shí)現(xiàn)與真實(shí)人類的擬人化交互。
2、一方面,數(shù)字人借助機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)技術(shù),ai能夠?qū)A繑?shù)據(jù)進(jìn)行高效處理與分析,提煉出人類行為的特征與規(guī)律,使數(shù)字人能夠模擬人類的思維過程,并做出相應(yīng)決策與行為。同時(shí),語音識(shí)別、自然語言處理及計(jì)算機(jī)視覺等ai技術(shù)的集成,賦予了數(shù)字人更加自然流暢的交互能力,使其能夠與用戶進(jìn)行深度對(duì)話和理解復(fù)雜指令。
3、另一方面,隨著大數(shù)據(jù)技術(shù)、人工智能技術(shù)的快速發(fā)展以及數(shù)據(jù)基礎(chǔ)設(shè)施的不斷完善,在健康醫(yī)療領(lǐng)域,數(shù)字人能夠?qū)τ脩艚】?、行為等多元化?shù)據(jù)進(jìn)行深度挖掘與分析,進(jìn)而實(shí)現(xiàn)為服務(wù)對(duì)象提供問題解答、健康服務(wù)助理、數(shù)據(jù)處理分析等系列功能,滿足了使用者對(duì)數(shù)字人個(gè)性化服務(wù)的較高能力要求。
4、目前,隨著人工智能技術(shù)的快速發(fā)展、算力基礎(chǔ)的極大提升,各類健康醫(yī)療問答系統(tǒng)層出不窮,服務(wù)范圍幾乎涵蓋了從預(yù)問診、患者分流到藥品適用說明等就醫(yī)全流程各個(gè)環(huán)節(jié)。但是現(xiàn)有的各類技術(shù)系統(tǒng),無論是純粹的問答大模型,還是現(xiàn)有的數(shù)字人,在處理孕產(chǎn)婦的管理咨詢以及情感安撫保障上,均存在著一定缺陷。
5、目前市場(chǎng)上主流的健康醫(yī)療大模型有科大訊飛的訊飛星火醫(yī)療大模型、百度靈醫(yī)大模型、騰訊混元醫(yī)療大模型、商湯大醫(yī)大模型等。這些大模型一般以問答框或者網(wǎng)頁系統(tǒng)的形式呈現(xiàn),其主要任務(wù)是完成結(jié)構(gòu)化的病歷生成、各類影像、醫(yī)學(xué)檢驗(yàn)報(bào)告的輔助診斷、健康以及亞健康人群的健康管理咨詢服務(wù)以及醫(yī)院的數(shù)字化智能化管理服務(wù)。這些大模型均能較好地處理非情感類的業(yè)務(wù)交互服務(wù)以及簡(jiǎn)單的問答咨詢服務(wù),但是基本不具備多環(huán)境多情況下的孕產(chǎn)婦情感關(guān)懷以及細(xì)節(jié)性指導(dǎo)功能。
6、在數(shù)據(jù)人方面,目前較為成功的有由浙江省衛(wèi)健委與螞蟻集團(tuán)聯(lián)合開發(fā)的數(shù)據(jù)健康人“安診兒”,其具備簡(jiǎn)單的語音對(duì)話功能,并能提供智能導(dǎo)診、在線取號(hào)、排隊(duì)叫號(hào)、報(bào)告查詢、醫(yī)保支付等流程性功能,但無法實(shí)現(xiàn)孕產(chǎn)婦所需要的孕產(chǎn)期關(guān)懷、答疑解惑等功能,以及不具備孕產(chǎn)婦的個(gè)性化服務(wù)能力。
7、綜上所述,目前并沒有一款專門針對(duì)孕產(chǎn)婦的建議、服務(wù)、宣教、管理等多功能合一的數(shù)字人?,F(xiàn)有數(shù)字人相關(guān)產(chǎn)品的技術(shù)基礎(chǔ)雖然相同,但是缺乏針對(duì)孕產(chǎn)婦的病情、環(huán)境的個(gè)性化訓(xùn)練。
8、針對(duì)上述技術(shù)問題,本發(fā)明提出了一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng)及其陪伴方法。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的缺陷,提供了一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng)及其陪伴方法。
2、為了實(shí)現(xiàn)以上目的,本發(fā)明采用以下技術(shù)方案:
3、一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng),包括:
4、數(shù)據(jù)收集模塊,用于獲取與孕產(chǎn)婦陪伴相對(duì)應(yīng)的數(shù)據(jù)信息,并對(duì)獲取的數(shù)據(jù)信息進(jìn)行脫敏、去重、可用性評(píng)估處理,得到處理后的文本數(shù)據(jù);
5、數(shù)據(jù)處理模塊,用于將處理后的文本數(shù)據(jù)進(jìn)行關(guān)系抽取、實(shí)體識(shí)別、文本分類處理,得到結(jié)構(gòu)化處理后的文本數(shù)據(jù);
6、訓(xùn)練模塊,用于將結(jié)構(gòu)化處理后的文本數(shù)據(jù)輸入chatglm智能模型,并采用lora方法進(jìn)行微調(diào)訓(xùn)練,得到微調(diào)后的chatglm智能模型;
7、優(yōu)化模塊,用于采用人類反饋的強(qiáng)化學(xué)習(xí)、提示詞模板對(duì)微調(diào)后的chatglm智能模型進(jìn)行優(yōu)化處理,得到孕產(chǎn)婦陪伴擬人模型。
8、進(jìn)一步的,所述數(shù)據(jù)收集模塊包括:
9、文本處理模塊,用于獲取數(shù)據(jù)信息中的文本數(shù)據(jù);
10、脫敏處理模塊,用于刪除文本數(shù)據(jù)中的敏感數(shù)據(jù),得到脫敏后的文本數(shù)據(jù);
11、可用性評(píng)估模塊,用于基于詞袋模型對(duì)脫敏后文本數(shù)據(jù)對(duì)應(yīng)關(guān)鍵詞的可用性進(jìn)行評(píng)估;
12、去重處理模塊,用于對(duì)評(píng)估后的關(guān)鍵詞進(jìn)行查重,刪除重復(fù)的關(guān)鍵詞,得到去重后的文本數(shù)據(jù)。
13、進(jìn)一步的,所述可用性評(píng)估模塊中對(duì)脫敏后關(guān)鍵詞的可用性進(jìn)行評(píng)估具體為:判斷文本塊對(duì)應(yīng)的關(guān)鍵詞是否正常,并將關(guān)鍵詞異常超過預(yù)設(shè)閾值區(qū)間的文本塊剔除,表示為:
14、;
15、其中,k表示每條數(shù)據(jù)的關(guān)鍵詞異常值;w表示關(guān)鍵詞數(shù)量;w表示關(guān)鍵詞序號(hào);unw表示第n個(gè)數(shù)據(jù)中第w個(gè)關(guān)鍵詞的向量余弦距離;t表示預(yù)設(shè)閾值區(qū)間;表示不在預(yù)設(shè)閾值區(qū)間內(nèi)的關(guān)鍵詞數(shù)量。
16、進(jìn)一步的,所述去重處理模塊中對(duì)評(píng)估后的關(guān)鍵詞進(jìn)行查重,刪除重復(fù)的關(guān)鍵詞,表示為:
17、;
18、其中,un表示第n個(gè)數(shù)據(jù);unw=un-1w表示第n個(gè)數(shù)據(jù)和第n-1個(gè)數(shù)據(jù)完全相同,則將第n個(gè)數(shù)據(jù)刪除。
19、進(jìn)一步的,所述數(shù)據(jù)處理模塊具體包括:
20、關(guān)系抽取模塊,用于使用抽取模型對(duì)文本數(shù)據(jù)進(jìn)行關(guān)系抽取,完成數(shù)據(jù)關(guān)系的抽取任務(wù);
21、實(shí)體識(shí)別模塊,用于使用向量模型將完成數(shù)據(jù)關(guān)系抽取的文本數(shù)據(jù)進(jìn)行語義信息的識(shí)別;
22、文本分類模塊,用于將識(shí)別后的文本數(shù)據(jù)按照文本類別以及數(shù)據(jù)格式分別存入關(guān)系數(shù)據(jù)庫、圖數(shù)據(jù)庫、向量數(shù)據(jù)庫中。
23、進(jìn)一步的,所述訓(xùn)練模塊中的chatglm智能模型為chatglm3-7b智能模型。
24、進(jìn)一步的,所述優(yōu)化模塊中基于人類反饋的強(qiáng)化學(xué)習(xí)對(duì)微調(diào)后的chatglm智能模型進(jìn)行優(yōu)化處理具體為:
25、通過人類反饋的強(qiáng)化學(xué)習(xí)rlhf來優(yōu)化結(jié)合微調(diào)后的chatglm智能模型的決策過程,以使微調(diào)后的chatglm智能模型根據(jù)反饋?zhàn)晕业鷮W(xué)習(xí)。
26、進(jìn)一步的,所述優(yōu)化模塊中基于提示詞模板對(duì)微調(diào)后的chatglm智能模型進(jìn)行優(yōu)化處理具體為:通過預(yù)設(shè)的規(guī)則和約束條件,為微調(diào)后的chatglm智能模型設(shè)定回復(fù)模板。
27、進(jìn)一步的,還包括生成模塊,用于根據(jù)得到的結(jié)構(gòu)化處理后的文本數(shù)據(jù)后,生成孕婦畫像生和孕產(chǎn)婦健康數(shù)據(jù)可視化管理。
28、相應(yīng)的,還提供一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng)的陪伴方法,用于通過一種擬人大模型孕產(chǎn)婦陪伴數(shù)字人系統(tǒng)實(shí)現(xiàn),所述陪伴方法包括:
29、s1.孕產(chǎn)婦陪伴擬人模型獲取用戶提出的問題,并對(duì)獲取的問題進(jìn)行文本解析,得到與文本相對(duì)應(yīng)的關(guān)鍵詞;
30、s2.孕產(chǎn)婦陪伴擬人模型判斷得到的關(guān)鍵詞是否合規(guī),若否,則提醒用戶并結(jié)束對(duì)話,不記錄相關(guān)信息;若是,則判斷關(guān)鍵字檢索數(shù)據(jù)庫中是否有與關(guān)鍵字檢索關(guān)鍵字相對(duì)應(yīng)的相關(guān)知識(shí),若是,則執(zhí)行步驟s3;
31、s3.孕產(chǎn)婦陪伴擬人模型根據(jù)提示模板形成具體回答內(nèi)容;
32、s4.孕產(chǎn)婦陪伴擬人模型根據(jù)回答內(nèi)容推薦相關(guān)科普內(nèi)容,并記錄對(duì)話文本。
33、與現(xiàn)有技術(shù)相比,本發(fā)明在完成基座層、醫(yī)療中臺(tái)模型、孕產(chǎn)婦陪伴擬人大模型的構(gòu)建后,具備四大能力模塊:多模態(tài)疑惑解答系統(tǒng)、孕產(chǎn)婦健康服務(wù)助理、數(shù)據(jù)收集與分析平臺(tái)、用戶數(shù)據(jù)駕駛艙。通過四大能力模塊實(shí)現(xiàn)孕產(chǎn)婦實(shí)時(shí)問答、孕期健康建議、孕期健康知識(shí)科普、跨科室孕產(chǎn)婦醫(yī)療數(shù)據(jù)聯(lián)合處理、孕產(chǎn)婦健康畫像生成、孕產(chǎn)婦健康數(shù)據(jù)可視化管理六大主要功能,具體效果歸納如下:
34、1.?本發(fā)明通過構(gòu)建一套基座-中臺(tái)-前端的三級(jí)大模型聯(lián)合處置系統(tǒng),實(shí)現(xiàn)對(duì)孕產(chǎn)婦數(shù)據(jù)的綜合處理分析,并通過深度學(xué)習(xí)的方法使系統(tǒng)具備和孕產(chǎn)婦進(jìn)行實(shí)時(shí)多輪多模態(tài)擬人化問答的能力。通過數(shù)字人的方式與孕產(chǎn)婦進(jìn)行交互,有效解決孕產(chǎn)婦各類疑問,緩解孕產(chǎn)婦精神焦慮。
35、2.?系統(tǒng)通過強(qiáng)化學(xué)習(xí)和知識(shí)圖譜的方式,在系統(tǒng)獲取孕產(chǎn)婦當(dāng)前健康數(shù)據(jù)并與孕產(chǎn)婦進(jìn)行多輪對(duì)話后,能夠通過擬人化的方式向孕產(chǎn)婦提供孕期健康建議(包括但不限于推薦每日攝入能量總額、推薦食材、重要營(yíng)養(yǎng)素提醒等功能)。并根據(jù)孕產(chǎn)婦所提問題和上傳的相關(guān)健康醫(yī)療文本或圖像進(jìn)行相關(guān)的孕產(chǎn)期健康知識(shí)宣傳科普。
36、3.?系統(tǒng)通過強(qiáng)大的醫(yī)療中臺(tái)模型,打通信息壁壘,獲取孕產(chǎn)婦各科室的就診數(shù)據(jù)、檢驗(yàn)檢查數(shù)據(jù),并通過數(shù)據(jù)關(guān)系抽取模型對(duì)相關(guān)健康醫(yī)療數(shù)據(jù)進(jìn)行聯(lián)合處理,借助知識(shí)圖譜技術(shù)對(duì)孕產(chǎn)婦當(dāng)前的狀態(tài)進(jìn)行文字化描述,并通過相關(guān)健康醫(yī)療數(shù)據(jù)對(duì)孕產(chǎn)婦進(jìn)行產(chǎn)前畫像,方便孕產(chǎn)婦了解自身的具體情況,有助于孕產(chǎn)婦在就醫(yī)、營(yíng)養(yǎng)安排、休息時(shí)間安排等方面做出適合自身和胎兒的選擇。
37、4.系統(tǒng)通過對(duì)數(shù)據(jù)的收集和分析,構(gòu)建用戶數(shù)據(jù)駕駛艙,方便相關(guān)醫(yī)護(hù)人員、孕產(chǎn)婦及其家屬對(duì)懷孕以來的全過程歷史數(shù)據(jù)有一個(gè)準(zhǔn)確清晰的了解。一方面降低孕產(chǎn)婦主管醫(yī)生的工作強(qiáng)度,快速收集和分析孕產(chǎn)婦相關(guān)數(shù)據(jù),輔助其做出更優(yōu)醫(yī)學(xué)決策。另一方面有助于孕產(chǎn)婦及其家屬了解懷孕生產(chǎn)的全過程情況,有助于其規(guī)避風(fēng)險(xiǎn),緩解焦慮。