本發(fā)明實施例涉及數(shù)據(jù)處理,尤其涉及一種基于評論文本與評分融合的汽車個性化推薦方法。
背景技術(shù):
1、目前,隨著社會經(jīng)濟(jì)增長,以及當(dāng)前新能源汽車的飛速發(fā)展,汽車駕駛?cè)藬?shù)正逐步增長。汽車作為一種大額消費(fèi)品,用戶評論對于其他消費(fèi)者的購車決策具有重要參考價值。因此,對汽車用戶評論文本的情感極性、確定性分析以及用戶星級評分的研究具有重要意義。
2、對于用戶評分,評分作為一種直觀、易于理解的信息,對于消費(fèi)者購車決策同樣具有重要參考價值。而有限的評分區(qū)分度無法讓用戶比較好的區(qū)分產(chǎn)品,由于評分通常只有五個或其它幾個等級,這可能導(dǎo)致用戶在表達(dá)對產(chǎn)品滿意或不滿意時的細(xì)微差別無法被充分體現(xiàn)。例如,用戶可能對兩個不同產(chǎn)品的滿意度相近,但由于評分等級的限制,他們可能給出相同的評分。且用戶時間精力有限,在線上線下的了解會有局限,可能導(dǎo)致一些較好的車型和評價沒有進(jìn)入用戶的眼中而被忽略掉。
3、可見,亟需一種推薦精準(zhǔn)度和全面性高的基于評論文本與評分融合的汽車個性化推薦方法。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明實施例提供一種基于評論文本與評分融合的汽車個性化推薦方法,至少部分解決現(xiàn)有技術(shù)中存在推薦精準(zhǔn)度和全面性較差的問題。
2、本發(fā)明實施例提供了一種基于評論文本與評分融合的汽車個性化推薦方法,包括:
3、步驟1,獲取多個咨詢平臺中的用戶星級評分、評論文本數(shù)據(jù)和用戶特征數(shù)據(jù),其中,所述用戶星級評分包括汽車空間、操控、駕駛感受、舒適性、油耗、外觀、內(nèi)飾、性價比和配置的屬性,所述用戶特征數(shù)據(jù)包括用戶認(rèn)證信息、平臺對評論的推薦等級、文本評論交互信息;
4、步驟2,基于structbert大語言模型對預(yù)處理后的評論文本數(shù)據(jù)進(jìn)行情感極性分析,得到評論文本數(shù)據(jù)對應(yīng)的情感分?jǐn)?shù)向量,其中,所述情感分?jǐn)?shù)向量包括正面、中性和負(fù)面三個維度;
5、步驟3,通過人工標(biāo)注構(gòu)建評論文本確定性詞典,基于詞頻統(tǒng)計和確定性詞典,獲取評論文本數(shù)據(jù)對應(yīng)的確定性分?jǐn)?shù)向量,其中,所述確定性分?jǐn)?shù)向量包括確定性詞語的確定性分?jǐn)?shù)總分、確定性詞語數(shù)、確定性分?jǐn)?shù)最大值、確定性分?jǐn)?shù)最小值和確定性分?jǐn)?shù)均值五個維度;
6、步驟4,基于文本評論數(shù)據(jù)的情感分?jǐn)?shù)向量、確定性分?jǐn)?shù)向量和文本長度,計算不同用戶的評論文本數(shù)據(jù)之間的相似度,據(jù)此構(gòu)建以用戶為節(jié)點、相似度為節(jié)點關(guān)系的無向網(wǎng)絡(luò),運(yùn)用louvain算法劃分同一星級評分的用戶群體得到多個社區(qū);
7、步驟5,根據(jù)用戶特征數(shù)據(jù)計算社區(qū)內(nèi)每個用戶的聚合權(quán)重,據(jù)此通過加權(quán)平均算子聚合獲取每個社區(qū)的第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度;
8、步驟6,根據(jù)第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度的標(biāo)準(zhǔn)差以及社區(qū)用戶數(shù),計算每個社區(qū)的聚合權(quán)重并據(jù)此通過加權(quán)平均算子聚合來獲取同一星級評分下的第二綜合文本情感分?jǐn)?shù)向量和第二確定性分?jǐn)?shù)向量;
9、步驟7,基于第二綜合文本情感分?jǐn)?shù)向量與星級評分之間距離,結(jié)合第二確定性分?jǐn)?shù)向量計算星級評分t的折扣系數(shù),基于星級評分t的用戶數(shù)量計算每個星級評分的聚合權(quán)重,基于折扣系數(shù)和每個星級評分的聚合權(quán)重,通過加權(quán)平均算子聚合來獲取汽車在每個屬性下的綜合評分;
10、步驟8,基于用戶設(shè)置的個性化屬性權(quán)重和綜合評分,通過加權(quán)平均算子聚合獲取所有備選汽車的綜合評分,進(jìn)而獲取所有汽車的排序,推薦最優(yōu)汽車。
11、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟2具體包括:
12、運(yùn)用structbert模型獲取評論文本數(shù)據(jù)的情感分?jǐn)?shù)向量,其滿足:
13、
14、其中,,表示星級評分?對應(yīng)的評論文本數(shù)據(jù),星級評分表示汽車屬性下用戶?給出的星級評分t,t=1,2,3,4,5。
15、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟3具體包括:
16、步驟3.1,通過人工標(biāo)注,構(gòu)建每個屬性的確定性詞典,其中,所述確定性詞典包括詞語集=及其相對應(yīng)的確定性分?jǐn)?shù)向量集,其中表示屬性的第個確定性詞語,表示確定性詞語的確定性分?jǐn)?shù)向量;
17、步驟3.2,基于詞頻統(tǒng)計和確定性詞典,獲取評論文本數(shù)據(jù)對應(yīng)的確定性分?jǐn)?shù)向量;
18、
19、其中,表示評論文本數(shù)據(jù)中所有確定性詞語的確定性分?jǐn)?shù)總分,表示確定性詞語數(shù),表示確定性分?jǐn)?shù)最大值,表示確定性分?jǐn)?shù)最小值,表示確定性分?jǐn)?shù)均值。
20、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟4具體包括:
21、步驟4.1,分別根據(jù)文本評論數(shù)據(jù)的情感分?jǐn)?shù)向量、確定性分?jǐn)?shù)向量和文本長度計算不同用戶的評論文本數(shù)據(jù)和之間的情感分?jǐn)?shù)向量相似度、確定性分?jǐn)?shù)向量相似度以及文本長度相似度,其中,所述情感分?jǐn)?shù)向量相似度的表達(dá)式為
22、;
23、其中,表示評論文本數(shù)據(jù)的情感分?jǐn)?shù)向量,表示評論文本數(shù)據(jù)的情感分?jǐn)?shù)向量;
24、所述確定性分?jǐn)?shù)向量相似度的表達(dá)式為
25、?;
26、其中,表示評論文本數(shù)據(jù)的情感分?jǐn)?shù)向量,表示評論文本數(shù)據(jù)的情感分?jǐn)?shù)向量;
27、所述文本長度相似度的表達(dá)式為
28、
29、其中,表示評論文本數(shù)據(jù)的文本長度,表示評論文本數(shù)據(jù)的文本長度;
30、步驟4.2,根據(jù)情感分?jǐn)?shù)向量相似度、確定性分?jǐn)?shù)向量相似度以及文本長度相似度矩陣計算閾值;
31、步驟4.3,根據(jù)閾值構(gòu)建以用戶為節(jié)點、以評論文本之間的相似度為節(jié)點關(guān)系的無向網(wǎng)絡(luò),其鄰接矩陣滿足:
32、
33、步驟4.4,運(yùn)用louvain社區(qū)發(fā)現(xiàn)算法劃分同一星級評分的用戶群體;
34、得到g個社區(qū);
35、,;
36、與社區(qū)對應(yīng)的文本集滿足:
37、?;
38、其中,文本對應(yīng)的情感分?jǐn)?shù)向量為、確定性分?jǐn)?shù)向量為??和長度為。
39、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟5具體包括:
40、步驟5.1,基于用戶認(rèn)證信息、平臺對用戶評論的推薦等級以及文本評論交互數(shù)據(jù)計算用戶的聚合權(quán)重;
41、
42、其中,為文本的推薦等級值,為平臺對的認(rèn)證值,為文本收獲其他用戶的交互值,其中,所述交互值包括文本收獲其他用戶的點贊、瀏覽和二次評論;
43、步驟5.2,基于聚合權(quán)重獲取社區(qū)的第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度。
44、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟6具體包括:
45、步驟6.1,計算每個社區(qū)聚合權(quán)重;
46、
47、其中,調(diào)節(jié)參數(shù)?,為基于社區(qū)用戶數(shù)的權(quán)重,滿足?,為基于社區(qū)內(nèi)所有文本的情感分?jǐn)?shù)向量的標(biāo)準(zhǔn)差、確定性分?jǐn)?shù)向量標(biāo)準(zhǔn)差、長度標(biāo)準(zhǔn)差所構(gòu)建的綜合標(biāo)準(zhǔn)差,且進(jìn)行了歸一化,滿足:
48、
49、其中:
50、
51、分別表示社區(qū)內(nèi)所有文本的第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度的標(biāo)準(zhǔn)差;
52、步驟6.2,基于每個社區(qū)的聚合權(quán)重計算同一星級評分下的第二綜合文本情感分?jǐn)?shù)向量和第二確定性分?jǐn)?shù)向量:
53、。
54、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟7具體包括:
55、步驟7.1,根據(jù)星級評分?與其對應(yīng)的第二綜合文本情感分?jǐn)?shù)向量的距離,計算星級評分?的折扣系數(shù):
56、
57、其中,為確定性分?jǐn)?shù)均值,表示情感分?jǐn)?shù)向量的歸一化值
58、
59、;
60、步驟7.2,根據(jù)星級評分對應(yīng)的用戶數(shù)量,計算星級評分的聚合權(quán)重;
61、=;
62、步驟7.3,根據(jù)折扣系數(shù)和每個星級評分的聚合權(quán)重計算汽車的屬性?的綜合評分
63、。
64、根據(jù)本發(fā)明實施例的一種具體實現(xiàn)方式,所述步驟8具體包括:
65、步驟8.1,根據(jù)用戶個性化需求設(shè)置屬性的權(quán)重;
66、步驟8.2,基于加權(quán)平均算子聚合獲取備選汽車的綜合評分;
67、;
68、步驟8.3,根據(jù)綜合評分對所有備選汽車進(jìn)行排序,并根據(jù)所有汽車的排序推薦最優(yōu)汽車。
69、本發(fā)明實施例中的基于評論文本與評分融合的汽車個性化推薦方案,包括:步驟1,獲取多個咨詢平臺中的用戶星級評分、評論文本數(shù)據(jù)和用戶特征數(shù)據(jù),其中,所述用戶星級評分包括汽車空間、操控、駕駛感受、舒適性、油耗、外觀、內(nèi)飾、性價比和配置的屬性,所述用戶特征數(shù)據(jù)包括用戶認(rèn)證信息、平臺對評論的推薦等級、文本評論交互信息;步驟2,基于structbert大語言模型對預(yù)處理后的評論文本數(shù)據(jù)進(jìn)行情感極性分析,得到評論文本數(shù)據(jù)對應(yīng)的情感分?jǐn)?shù)向量,其中,所述情感分?jǐn)?shù)向量包括正面、中性和負(fù)面三個維度;步驟3,通過人工標(biāo)注構(gòu)建評論文本確定性詞典,基于詞頻統(tǒng)計和確定性詞典,獲取評論文本數(shù)據(jù)對應(yīng)的確定性分?jǐn)?shù)向量,其中,所述確定性分?jǐn)?shù)向量包括確定性詞語的確定性分?jǐn)?shù)總分、確定性詞語數(shù)、確定性分?jǐn)?shù)最大值、確定性分?jǐn)?shù)最小值和確定性分?jǐn)?shù)均值五個維度;步驟4,基于文本評論數(shù)據(jù)的情感分?jǐn)?shù)向量、確定性分?jǐn)?shù)向量和文本長度,計算不同用戶的評論文本數(shù)據(jù)之間的相似度,據(jù)此構(gòu)建以用戶為節(jié)點、相似度為節(jié)點關(guān)系的無向網(wǎng)絡(luò),運(yùn)用louvain算法劃分同一星級評分的用戶群體得到多個社區(qū);步驟5,根據(jù)用戶特征數(shù)據(jù)計算社區(qū)內(nèi)每個用戶的聚合權(quán)重,據(jù)此通過加權(quán)平均算子聚合獲取每個社區(qū)的第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度;步驟6,根據(jù)第一綜合文本情感分?jǐn)?shù)向量、第一綜合確定性分?jǐn)?shù)向量和第一綜合長度的標(biāo)準(zhǔn)差以及社區(qū)用戶數(shù),計算每個社區(qū)的聚合權(quán)重并據(jù)此通過加權(quán)平均算子聚合來獲取同一星級評分下的第二綜合文本情感分?jǐn)?shù)向量和第二確定性分?jǐn)?shù)向量;步驟7,基于第二綜合文本情感分?jǐn)?shù)向量與星級評分之間距離,結(jié)合第二確定性分?jǐn)?shù)向量計算星級評分t的折扣系數(shù),基于星級評分t的用戶數(shù)量計算每個星級評分的聚合權(quán)重,基于折扣系數(shù)和每個星級評分的聚合權(quán)重,通過加權(quán)平均算子聚合來獲取汽車在每個屬性下的綜合評分;步驟8,基于用戶設(shè)置的個性化屬性權(quán)重和綜合評分,通過加權(quán)平均算子聚合獲取所有備選汽車的綜合評分,進(jìn)而獲取所有汽車的排序,推薦最優(yōu)汽車。
70、本發(fā)明實施例的有益效果為:通過本發(fā)明的方案,基于多個咨詢平臺中汽車多個屬性的用戶星級評分、評論文本數(shù)據(jù)以及用戶認(rèn)證信息、平臺對評論的推薦等級、文本評論交互信息等用戶特征數(shù)據(jù);對評論文本數(shù)據(jù)提取和預(yù)處理;根據(jù)自然語言處理技術(shù),基于structbert大語言模型對評論進(jìn)行情感極性分析,獲取評論情感分?jǐn)?shù)向量;根據(jù)評論文本的詞頻統(tǒng)計結(jié)果以及人工標(biāo)注構(gòu)建評論文本確定性詞典,得到預(yù)處理后評論文本的確定性分?jǐn)?shù)向量;根據(jù)評論文本的情感分?jǐn)?shù)向量、確定性分?jǐn)?shù)向量以長度計算出相似度矩陣,以用戶為節(jié)點、相似度為節(jié)點關(guān)系構(gòu)建圖網(wǎng)絡(luò),以相似度閾值為基準(zhǔn)進(jìn)行社區(qū)發(fā)現(xiàn)算法劃分;根據(jù)用戶認(rèn)證信息、平臺對用戶評論文本的推薦等級、評論交互信息等用戶特征數(shù)據(jù),獲取同一星級評分下每個社區(qū)的綜合文本情感分?jǐn)?shù)向量、確定性分?jǐn)?shù)向量以及長度;根據(jù)每個社區(qū)用戶評論文本的情感分?jǐn)?shù)、確定性分?jǐn)?shù)以及長度的標(biāo)準(zhǔn)差,結(jié)合社區(qū)用戶數(shù)計算每個社區(qū)的聚合權(quán)重,通過加權(quán)平均算子聚合來獲取同一星級評分下的綜合文本情感分?jǐn)?shù)、確定性分?jǐn)?shù);根據(jù)評論文本情感分?jǐn)?shù)與星級評分之間距離,結(jié)合確定性分?jǐn)?shù),獲取星級評分的折扣系數(shù),基于星級評分的用戶數(shù)量的聚合權(quán)重,得到該車型下的每個屬性下的綜合評分;基于個性化屬性權(quán)重,通過加權(quán)平均算子聚合獲取所有備選汽車的綜合評分,進(jìn)而獲取所有汽車的排序,推薦出最優(yōu)汽車,為消費(fèi)者提供更全面的購車參考信息。與現(xiàn)有技術(shù)相比,本發(fā)明從用戶評分和評論文本上多方面考慮為用戶提供便捷高效的評論文本分析和汽車推薦,提高了汽車推薦的全面性。