欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于微博情感分析的形象評價算法的制作方法

文檔序號:12364040閱讀:753來源:國知局

本發(fā)明涉及一種基于微博情感分析的形象評價算法,屬于計算機(jī)應(yīng)用技術(shù)領(lǐng)域。



背景技術(shù):

社交網(wǎng)站具備快捷的信息反饋能力,形成了對社會輿論巨大的影響力,網(wǎng)絡(luò)言論一定程度上反映一個企業(yè)的社會認(rèn)可度。如何通過對社交網(wǎng)站海量客戶評論進(jìn)行識別和分析,從而判斷企業(yè)形象已經(jīng)成為網(wǎng)絡(luò)時代背景下企業(yè)改善自身形象的重要挑戰(zhàn)和機(jī)遇。

現(xiàn)階段對于網(wǎng)絡(luò)言論的使用主要集中在抱怨處理,而沒有對這些網(wǎng)絡(luò)言論造成的企業(yè)形象的整體變化進(jìn)行量化。本專利提出一種基于微博情感分析的企業(yè)形象評價算法,通過獲取微博相關(guān)言論和傳播信息,計算一段時間內(nèi)的企業(yè)形象得分,從而可以從宏觀上把握網(wǎng)絡(luò)輿論對企業(yè)形象造成的影響,了解企業(yè)在競爭同行中的位置,進(jìn)一步的可以更深入的鉆取和判斷是哪些方面的因素造成的影響,為企業(yè)決策提供輔助支持。

在計算機(jī)領(lǐng)域,輿情挖掘和情感分析主要考察如何運(yùn)用自然語言處理、文本挖掘、機(jī)器學(xué)習(xí)、人工智能、自動化內(nèi)容分析等信息技術(shù)方法對社交網(wǎng)絡(luò)上個體評論信息進(jìn)行情感分類及體系構(gòu)建。處于對企業(yè)日常工作指導(dǎo)的價值,這類研究針對的主要是客戶抱怨評論,通過加強(qiáng)對顧客抱怨信息的識別、搜集及反饋能力,優(yōu)化企業(yè)決策。本專利通過將用戶評論內(nèi)容(正面與負(fù)面)與企業(yè)運(yùn)營業(yè)務(wù)分類相關(guān)聯(lián),獲取各業(yè)務(wù)關(guān)注點(diǎn)情感分值與對企業(yè)形象的貢獻(xiàn)度。

傳統(tǒng)的企業(yè)形象評價一般采取問卷調(diào)查的方式進(jìn)行企業(yè)形象評價。而隨著大數(shù)據(jù)時代的來臨,企業(yè)通過網(wǎng)絡(luò)獲取用戶行為數(shù)據(jù)變得越來越容易。因此,基于真實(shí)情境大樣本數(shù)據(jù)的實(shí)證分析更能夠?qū)ζ髽I(yè)形象管理提供科學(xué)合理的優(yōu)化策略啟示。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明針對現(xiàn)有技術(shù)中存在的問題,提供一種構(gòu)建基于微博情感分析的企業(yè)形象評分算法,為供電企業(yè)判斷自身形象并有針對性的采取解決措施提供技術(shù)手段。

為此本發(fā)明采用的技術(shù)方案是:本發(fā)明按照以下步驟進(jìn)行:

1)收集微博客戶信息;

2)構(gòu)建相關(guān)微博關(guān)鍵詞庫;

3)計算微博情感分值并判斷微博言論情感傾向類型;

4)劃分微博言論類型,關(guān)聯(lián)匹配企業(yè)服務(wù)事件;

5)計算形象評分。

所述1)步驟中:通過計算機(jī)爬蟲程序模擬人工搜索和瀏覽實(shí)現(xiàn)數(shù)據(jù)的自動抓取,所有抓取數(shù)據(jù)都是微博博主對外公開的信息,不涉及隱私信息。

微博客戶信息主要包括用戶身份、微博內(nèi)容以及用戶行為信息;

其中,用戶身份信息包括用戶名、用戶行業(yè)、用戶性別、賬號類別,微博內(nèi)容數(shù)據(jù)包括微博發(fā)布時間和文本內(nèi)容,用戶行為數(shù)據(jù)包括關(guān)注數(shù)、粉絲數(shù)、評論數(shù)量、轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量。

所述2)步驟中:關(guān)鍵詞庫即是客戶對電網(wǎng)相關(guān)評論的關(guān)鍵“詞語庫”,包括停電、來電、95598客服態(tài)度、鋪設(shè)電纜擾民、竊電、抄電表出錯、營業(yè)廳人員、錯峰、詐騙、電壓不穩(wěn)。

所述3)步驟中:客戶評論情感傾向可以劃分為正面、負(fù)面和中立三類;

采取詞庫法開展客戶評論情感傾向判斷,具體工作步驟為:隨機(jī)篩選部分相關(guān)微博,由供電服務(wù)專家進(jìn)行人工分類和情感標(biāo)定;隨機(jī)選取部分微博作為樣本,利用分詞技術(shù)和計算機(jī)統(tǒng)計算法初步建立情感詞庫,并賦予每個詞一定情感極性權(quán)重—權(quán)重分正負(fù),越大表示正面感情越強(qiáng)烈,無感情則情感值為0;供電服務(wù)專家對詞庫中所有詞進(jìn)行人工校對,確保準(zhǔn)確性,減少評判誤差;一條微博包含詞庫中某類詞的權(quán)重之和為本條微博情感分值,當(dāng)情感分值達(dá)到一定臨界值,則可以對客戶言論中包含的情感進(jìn)行判別。

所述4)步驟中:運(yùn)用基于分詞技術(shù)的微博分類算法,將通過搜索關(guān)鍵詞庫獲取的微博經(jīng)過分類關(guān)鍵詞識別,從而進(jìn)一步判斷該條微博所描述內(nèi)容的類別,將每條微博的類別對應(yīng)到相應(yīng)的業(yè)務(wù)分類能夠更精準(zhǔn)的輔助業(yè)務(wù)提升。

所述5)步驟中具體步驟如下:

(1)將情感分值歸一化:通過分析大量微博數(shù)據(jù),發(fā)現(xiàn)所有微博情感分值為 的時候已經(jīng)可以表達(dá)極強(qiáng)烈的正面和負(fù)面情緒,因此對任意一條情感分為的微博,將其情感分歸一化為 ;

(2)計算單條微博的影響力:單條微博影響力的計算公式為:。其中為此微博博主身份,在本專利中普通用戶設(shè)為1,VIP用戶設(shè)為10;分別為粉絲數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)和點(diǎn)贊數(shù),權(quán)重按經(jīng)驗(yàn)分別設(shè)為0.3,0.2,0.2,0.3;

(3)計算單條微博對企業(yè)的形象評價分值:;

(4)計算一類微博對企業(yè)的形象評價分值:,為屬于類別j的所有微博形象評價分值之和經(jīng)過歸一化之后的結(jié)果;

(5)計算企業(yè)形象評價分值。為所有微博形象評價分值之和經(jīng)過歸一化后的結(jié)果,公式如下:

。

本發(fā)明的優(yōu)點(diǎn)是:本發(fā)明以用戶對電網(wǎng)相關(guān)的微博評論作為研究對象,采用文本挖掘技術(shù)和情感分析相結(jié)合的方法,構(gòu)建基于微博情感分析的企業(yè)形象評分算法,為供電企業(yè)判斷自身形象并有針對性的采取解決措施提供了堅強(qiáng)的技術(shù)手段。

具體實(shí)施方式

研究方法及算法:

主要目標(biāo)為基于客戶微博言論構(gòu)建企業(yè)形象評價,主要步驟為 :1)收集微博客戶信息;2)構(gòu)建電網(wǎng)相關(guān)微博關(guān)鍵詞庫;3)計算微博情感分值并判斷微博言論情感傾向類型;4)劃分微博言論類型,關(guān)聯(lián)匹配企業(yè)服務(wù)事件;5)計算企業(yè)形象評分。

1)微博客戶信息收集:

通過計算機(jī)爬蟲程序模擬人工搜索和瀏覽實(shí)現(xiàn)數(shù)據(jù)的自動抓取,所有抓取數(shù)據(jù)都是微博博主對外公開的信息,不涉及隱私信息。本專利收集的微博客戶信息主要包括用戶身份、微博內(nèi)容以及用戶行為信息。其中,用戶身份信息包括用戶名、用戶行業(yè)、用戶性別、賬號類別,微博內(nèi)容數(shù)據(jù)包括微博發(fā)布時間和文本內(nèi)容,用戶行為數(shù)據(jù)包括關(guān)注數(shù)、粉絲數(shù)、評論數(shù)量、轉(zhuǎn)發(fā)數(shù)量、點(diǎn)贊數(shù)量。

2)構(gòu)建電網(wǎng)相關(guān)微博關(guān)鍵詞庫:

關(guān)鍵詞庫即是客戶對電網(wǎng)相關(guān)評論的關(guān)鍵“詞語庫”,包括停電、來電、95598客服態(tài)度好、鋪設(shè)電纜擾民等,能夠在一定程度上反映對電網(wǎng)的評價。根據(jù)某電網(wǎng)業(yè)務(wù)范圍,在客戶重點(diǎn)關(guān)注領(lǐng)域構(gòu)建微博關(guān)鍵詞庫。本專利使用的關(guān)鍵詞庫主要包含以下方面:竊電、抄電表出錯、95598、營業(yè)廳人員、錯峰、詐騙、電壓不穩(wěn)等21類。

3)獲取客戶言論情感分值:

客戶評論情感傾向可以劃分為正面、負(fù)面和中立三類。目前存在三種識別顧客評論情感傾向的方法:基于詞庫、基于語料和基于層面。本專利采取詞庫法開展客戶評論情感傾向判斷,具體工作步驟為:隨機(jī)篩選部分相關(guān)微博,由供電服務(wù)專家進(jìn)行人工分類和情感標(biāo)定;隨機(jī)選取部分微博作為樣本,利用分詞技術(shù)和計算機(jī)統(tǒng)計算法初步建立情感詞庫,并賦予每個詞一定情感極性權(quán)重—權(quán)重分正負(fù),越大表示正面感情越強(qiáng)烈,無感情則情感值為0;供電服務(wù)專家對詞庫中所有詞進(jìn)行人工校對,確保準(zhǔn)確性,減少評判誤差;一條微博包含詞庫中某類詞的權(quán)重之和為本條微博情感分值,當(dāng)情感分值達(dá)到一定臨界值,則可以對客戶言論中包含的情感進(jìn)行判別(正面或者負(fù)面)。

4)劃分微博言論類型:

本專利運(yùn)用基于分詞技術(shù)的微博分類算法,將通過搜索關(guān)鍵詞庫獲取的微博經(jīng)過分類關(guān)鍵詞識別,從而進(jìn)一步判斷該條微博所描述內(nèi)容的類別,將每條微博的類別對應(yīng)到相應(yīng)的業(yè)務(wù)分類能夠更精準(zhǔn)的輔助業(yè)務(wù)提升。

5) 計算企業(yè)形象評分:

本專利基于以下兩條假設(shè)形成企業(yè)形象評分算法。首先,每一條正面或負(fù)面的微博都從積極或消極的方面影響著一個企業(yè)的形象評分;其次,微博轉(zhuǎn)發(fā)、評論、點(diǎn)贊數(shù)和博主身份、粉絲數(shù)都對一條微博的影響力有著貢獻(xiàn),而影響力越大對企業(yè)形象造成的波動也越大。因此,我們可以通過前一步驟獲取的每一條微博情感企業(yè)形象得分和微博影響力的大小計算企業(yè)形象得分,具體步驟如下:

(1)將情感分值歸一化。通過分析大量微博數(shù)據(jù),發(fā)現(xiàn)所有微博情感分值為 的時候已經(jīng)可以表達(dá)極強(qiáng)烈的正面和負(fù)面情緒,因此對任意一條情感分為的微博,將其情感分歸一化為 。

(2)計算單條微博的影響力。單條微博影響力的計算公式為:。其中為此微博博主身份,在本專利中普通用戶設(shè)為1,VIP用戶設(shè)為10;分別為粉絲數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)和點(diǎn)贊數(shù),權(quán)重按經(jīng)驗(yàn)分別設(shè)為0.3,0.2,0.2,0.3。

(3)計算單條微博對企業(yè)的形象評價分值。。

(4)計算一類微博對企業(yè)的形象評價分值。,為屬于類別j的所有微博形象評價分值之和經(jīng)過歸一化之后的結(jié)果。

(5)計算企業(yè)形象評價分值。為所有微博形象評價分值之和經(jīng)過歸一化后的結(jié)果,公式如下:

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
富民县| 荣昌县| 鄱阳县| 卓尼县| 广安市| 阿坝| 汉阴县| 遵义市| 加查县| 磐石市| 英超| 无为县| 苏尼特左旗| 浙江省| 松桃| 乐平市| 蛟河市| 嘉鱼县| 清远市| 浏阳市| 甘肃省| 隆子县| 襄汾县| 荥经县| 枞阳县| 和平县| 屏东市| 永嘉县| 乌拉特后旗| 称多县| 南溪县| 封丘县| 张家界市| 泸溪县| 太和县| 高要市| 琼结县| 金坛市| 宜都市| 盐津县| 锦屏县|