本發(fā)明涉及數(shù)字人交互,具體是涉及一種交互式數(shù)字人驅(qū)動(dòng)方法。
背景技術(shù):
1、數(shù)字人交互指的是通過(guò)數(shù)字化的方式與虛擬或人工智能驅(qū)動(dòng)的角色進(jìn)行互動(dòng),這些數(shù)字人通常是通過(guò)虛擬形象、3d模型、語(yǔ)音助手或聊天機(jī)器人等形式存在,可以模擬人類的對(duì)話和行為,人機(jī)交互技術(shù)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù),人機(jī)交互技術(shù)包括機(jī)器通過(guò)輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請(qǐng)示等,人通過(guò)輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問(wèn)題及提示請(qǐng)示等,人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一,人機(jī)交互技術(shù)是指通過(guò)計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對(duì)話的技術(shù),人機(jī)交互技術(shù)包括機(jī)器通過(guò)輸出或顯示設(shè)備給人提供大量有關(guān)信息及提示請(qǐng)示等,人通過(guò)輸入設(shè)備給機(jī)器輸入有關(guān)信息,回答問(wèn)題及提示請(qǐng)示等,人機(jī)交互技術(shù)是計(jì)算機(jī)用戶界面設(shè)計(jì)中的重要內(nèi)容之一,隨著社會(huì)的發(fā)展,數(shù)字人的需求越來(lái)越大。
2、現(xiàn)有的數(shù)字人在進(jìn)行交互時(shí),綜合性不強(qiáng),不能根據(jù)多方面的因素進(jìn)行預(yù)測(cè)推薦,從而使數(shù)字人的推薦效率不高。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問(wèn)題,提供一種交互式數(shù)字人驅(qū)動(dòng)方法,本技術(shù)方案解決了上述的問(wèn)題。
2、為達(dá)到以上目的,本發(fā)明采用的技術(shù)方案為:
3、一種交互式數(shù)字人驅(qū)動(dòng)方法,包括:
4、s1:系統(tǒng)捕捉并記錄用戶通過(guò)語(yǔ)音、文字與觸屏指令的輸入方式與數(shù)字人互動(dòng),對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理;
5、s2:利用自然語(yǔ)言處理技術(shù)識(shí)別用戶的意圖和情感,確定用戶的需求;
6、s3:根據(jù)識(shí)別的意圖和上下文,生成響應(yīng),判斷用戶的需求和情感狀態(tài);
7、s4:生成響應(yīng)內(nèi)容,將生成的響應(yīng)反饋給用戶,展示在界面上;
8、s5:更新對(duì)話狀態(tài)和上下文。
9、優(yōu)選地,s1具體包括:
10、接收用戶的語(yǔ)音、文字與觸屏輸入;
11、使用傳感器和攝像頭結(jié)合輸入方式,使用加權(quán)平均將手勢(shì)識(shí)別與觸屏輸入結(jié)合;
12、結(jié)合公式為:f總=αf1+(1-α)f2
13、其中,f總為觸摸輸入和手勢(shì)識(shí)別數(shù)據(jù)的綜合結(jié)果,α為融合權(quán)重,1-α為手勢(shì)特征在融合中的權(quán)重,f1為觸摸輸入特征,f2為手勢(shì)特征;
14、對(duì)輸入數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)換;
15、使用自然語(yǔ)言技術(shù)自動(dòng)糾正用戶輸入中的拼寫(xiě)錯(cuò)誤和語(yǔ)法錯(cuò)誤;
16、使用高級(jí)數(shù)據(jù)索引和存儲(chǔ)技術(shù),將處理后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中。
17、優(yōu)選地,s2具體包括:
18、從文本中提取有助于理解意圖的特征,包括關(guān)鍵詞、短語(yǔ)與上下文信息;
19、基于意圖的特征,使用分類算法進(jìn)行意圖分類;
20、從文本中提取情感相關(guān)的特征,包括情感詞匯與情感強(qiáng)度;
21、基于情感特性,使用情感分析模型來(lái)判斷文本的情感傾向,所述情感傾向包括積極、消極與中立;
22、情感分析模型公式為:
23、式中,t為待分析的文本數(shù)據(jù),s(t)為文本t的最終情感分類結(jié)果,p為確定文本被分類為積極情感的閾值,n為確定文本被分類為消極情感的閾值;
24、基于情感分析模型,識(shí)別的意圖和情感,推斷用戶的具體需求。
25、優(yōu)選地,基于意圖的特征,使用分類算法進(jìn)行意圖分類包括:
26、基于意圖的特征,建立分類模型;
27、分類模型表達(dá)式為:
28、式中,w為權(quán)重向量,x為特征向量,wtx為權(quán)重向量和特征向量的點(diǎn)積,b為偏置項(xiàng),z為線性組合的結(jié)果,為預(yù)測(cè)的概率值,e為自然對(duì)數(shù),樣本屬于類別1的概率,e為自然對(duì)數(shù),σ(z)為邏輯函數(shù),p(y=1x)表示給定特征x的情況下,樣本屬于類別1的概率;
29、基于模型的輸出結(jié)果,進(jìn)行分類。
30、優(yōu)選地,s3具體包括:
31、獲取用戶之前的對(duì)話記錄;
32、基于用戶的個(gè)人信息的背景數(shù)據(jù)進(jìn)行分析;
33、基于計(jì)算出的情感分析結(jié)果和分類結(jié)果,以及數(shù)據(jù)分析結(jié)果,識(shí)別的意圖和情感,推斷用戶的具體需求;
34、基于用戶的具體需求,判斷用戶需求的緊急程度和優(yōu)先級(jí);
35、基于用戶的具體需求與優(yōu)先級(jí)選擇響應(yīng)模板;
36、根據(jù)上下文信息調(diào)整響應(yīng)內(nèi)容,確保個(gè)性化和相關(guān)性;
37、使用自然語(yǔ)言生成技術(shù)生成自然且符合上下文的響應(yīng);
38、基于用戶的情感狀態(tài)調(diào)整響應(yīng)的語(yǔ)氣,包括對(duì)于負(fù)面情緒的用戶,使用安撫和理解的語(yǔ)氣,對(duì)于積極情緒的用戶,使用鼓勵(lì)和積極的語(yǔ)氣;
39、提供情感支持,所述感支持包括道歉、感謝與安撫;
40、建立用戶反饋測(cè)試來(lái)評(píng)估響應(yīng)的效果。
41、優(yōu)選地,基于用戶的個(gè)人信息的背景數(shù)據(jù)進(jìn)行分析包括:
42、基于用戶的歷史使用數(shù)據(jù),對(duì)用戶的行為進(jìn)行預(yù)測(cè)評(píng)分;
43、預(yù)測(cè)評(píng)分公式為:
44、
45、其中,為預(yù)測(cè)評(píng)分,α和β分別為c與b的權(quán)重系數(shù),c為協(xié)同過(guò)濾方法的預(yù)測(cè)評(píng)分,b為基于內(nèi)容的方法的預(yù)測(cè)評(píng)分;
46、基于預(yù)測(cè)評(píng)分,判斷用戶的下一步的操作。
47、優(yōu)選地,s4具體包括:
48、使用模型生成響應(yīng)內(nèi)容;
49、將生成的響應(yīng)內(nèi)容格式化為合適html的數(shù)據(jù)結(jié)構(gòu);
50、將動(dòng)態(tài)數(shù)據(jù)嵌入響應(yīng)中;
51、將格式化后的響應(yīng)通過(guò)api傳輸?shù)角岸藨?yīng)用;
52、前端接收響應(yīng)并在用戶界面上渲染內(nèi)容。
53、優(yōu)選地,前端接收響應(yīng)并在用戶界面上渲染內(nèi)容包括:
54、根據(jù)響應(yīng)內(nèi)容選擇前端組件與元素,包括文本框、對(duì)話框、列表與表單;將處理后的數(shù)據(jù)傳遞給前端組件,進(jìn)行渲染,包括:
55、將文本內(nèi)容插入到適當(dāng)?shù)膆tml元素中;
56、設(shè)置圖像的src屬性,顯示圖片;
57、更新動(dòng)態(tài)數(shù)據(jù),應(yīng)用動(dòng)畫(huà)與動(dòng)態(tài)效果;
58、綁定用戶交互事件到相應(yīng)的前端組件,響應(yīng)用戶操作。
59、優(yōu)選地,s5具體包括:
60、捕獲用戶的新消息與指令;
61、分析用戶的輸入,識(shí)別關(guān)鍵信息和意圖;
62、將用戶輸入和相關(guān)數(shù)據(jù)存儲(chǔ)到當(dāng)前對(duì)話狀態(tài)中;
63、記錄用戶的行為、上下文信息和系統(tǒng)的響應(yīng);
64、根據(jù)輸入調(diào)整上下文,包括添加或修改會(huì)話歷史與用戶偏好;
65、將更新后的對(duì)話狀態(tài)和上下文信息保存到數(shù)據(jù)庫(kù)或內(nèi)存中;
66、使用更新后的上下文生成適當(dāng)?shù)捻憫?yīng)內(nèi)容。
67、優(yōu)選地,使用更新后的上下文生成適當(dāng)?shù)捻憫?yīng)內(nèi)容包括:
68、獲取更新后的上下文;
69、從對(duì)話狀態(tài)中提取最新的上下文信息,包括用戶的先前消息、情感狀態(tài)、意圖和分類結(jié)果;
70、將生成的內(nèi)容進(jìn)行格式,包括分段、列點(diǎn)、與使用的視覺(jué)元素;
71、進(jìn)行語(yǔ)法檢查和語(yǔ)言優(yōu)化;
72、將格式化后的響應(yīng)通過(guò)api或直接傳輸?shù)角岸藨?yīng)用;
73、在用戶界面上展示生成的響應(yīng)內(nèi)容;
74、記錄生成的響應(yīng)和用戶的反饋;
75、收集用戶的反饋。
76、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
77、本發(fā)明提出綜合情感分析,基于意圖的特征,建立分類模型與對(duì)用戶的行為進(jìn)行預(yù)測(cè)評(píng)分,能對(duì)用戶的下一步操作進(jìn)行精準(zhǔn)預(yù)測(cè),從而提高了數(shù)字人在使用過(guò)程中的智能性,使數(shù)字人的推薦效率更高。