欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種新聞文本情緒傾向分析方法

文檔序號(hào):6514526閱讀:1851來(lái)源:國(guó)知局
一種新聞文本情緒傾向分析方法
【專(zhuān)利摘要】本發(fā)明提出了一種新聞文本情緒傾向分析方法,該方法包括以下步驟:拆解文本成若干個(gè)句子,每個(gè)句子包括至少一個(gè)分句,且每個(gè)分句包括至少一個(gè)詞匯;分析每個(gè)詞匯的屬性,其中屬性為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、非情緒詞匯及否定修飾詞匯中的一種;累計(jì)每個(gè)分句中所有詞匯的屬性,以推算出每個(gè)分句的情緒傾向;以單個(gè)句子為單位累加每個(gè)分句的情緒傾向,從而計(jì)算出文本情緒傾向熵值,以決定文本的情緒傾向。
【專(zhuān)利說(shuō)明】一種新聞文本情緒傾向分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種新聞文本情緒傾向分析方法,尤其涉及一種使用有限狀態(tài)自動(dòng)機(jī)與熵值的新聞文本情緒傾向分析方法。
【背景技術(shù)】
[0002]財(cái)經(jīng)領(lǐng)域的新聞文本情緒傾向分析的相關(guān)研究證實(shí),財(cái)經(jīng)新聞的內(nèi)容常會(huì)影響金融市場(chǎng)的股票價(jià)格、交易量,甚至公司未來(lái)的營(yíng)收;因此具有重要的實(shí)際運(yùn)用價(jià)值。
[0003]目前有關(guān)新聞文本情緒傾向分析的現(xiàn)有技術(shù)中,已存在利用機(jī)器學(xué)習(xí)技術(shù)來(lái)自動(dòng)判斷財(cái)經(jīng)新聞的情緒傾向?yàn)闃?lè)觀(guān)或悲觀(guān)的技術(shù)。但是該技術(shù)尚須經(jīng)過(guò)情緒語(yǔ)言的模型訓(xùn)練與測(cè)試,所以必須收集相當(dāng)大數(shù)量的歷史數(shù)據(jù)用于訓(xùn)練,以及必須先行計(jì)算語(yǔ)料的詞匯機(jī)率分布等數(shù)據(jù),故其應(yīng)用上較受限制,存在進(jìn)一步改善的空間。
[0004]因此,如何進(jìn)一步改善新聞文本情緒傾向分析的現(xiàn)有技術(shù),以使其無(wú)須經(jīng)過(guò)情緒語(yǔ)言的模型訓(xùn)練與測(cè)試,以及無(wú)須計(jì)算語(yǔ)料的詞匯機(jī)率分布,并提高使用效率,是需要進(jìn)一步探討的課題。

【發(fā)明內(nèi)容】

[0005]本發(fā)明主要目的在于提出一種新聞文本情緒傾向分析方法。
[0006]本發(fā)明提供的新聞文本情緒傾向分析方法,包括以下步驟:提供一情緒詞匯庫(kù)、一否定修飾詞匯庫(kù)與一有限狀態(tài)自動(dòng)機(jī)(finite state automata);對(duì)新聞文本進(jìn)行分句分詞處理,以產(chǎn)生若干個(gè)句子,其中每個(gè)句子包括至少一個(gè)子句,且每個(gè)子句包括至少一個(gè)詞匯;使用情緒詞匯庫(kù)與否定修飾詞匯庫(kù)對(duì)若干個(gè)句子以及每個(gè)分句的每個(gè)詞匯進(jìn)行詞匯比對(duì),以標(biāo)示每個(gè)詞匯為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、非情緒詞匯或否定修飾詞匯;依據(jù)詞匯比對(duì)結(jié)果,將每個(gè)詞匯分別轉(zhuǎn)換為一個(gè)代表符號(hào);使用有限狀態(tài)自動(dòng)機(jī)與代表符號(hào),以推算每個(gè)分句的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性;以句子為單位分別累加新聞文本中每個(gè)句子所包含的每個(gè)分句的每種情緒傾向后,計(jì)算經(jīng)累加后所有句子所對(duì)應(yīng)的每種情緒傾向的熵(entropy)值;依據(jù)計(jì)算出的熵值決定新聞文本的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性。
[0007]可選的,本發(fā)明提供的新聞文本情緒傾向分析方法中,每個(gè)分句的情緒傾向的判定過(guò)程是在每個(gè)分句的目前狀態(tài)基礎(chǔ)上加入分句的下一個(gè)詞匯后,由有限狀態(tài)自動(dòng)機(jī)根據(jù)最新加入的詞匯轉(zhuǎn)換下一狀態(tài);而在進(jìn)一步加入再下一個(gè)詞匯前,下一狀態(tài)又取代原有目前狀態(tài)成為目前狀態(tài),如此循環(huán)運(yùn)作,直至所有分句均被判定完畢;當(dāng)分句的目前狀態(tài)為樂(lè)觀(guān),分句的下一個(gè)詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成樂(lè)觀(guān)、悲觀(guān)、悲觀(guān)和樂(lè)觀(guān);當(dāng)分句的目前狀態(tài)為悲觀(guān),分句的下一詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成悲觀(guān)、悲觀(guān)、樂(lè)觀(guān)和悲觀(guān);當(dāng)分句的目前狀態(tài)為中性,分句的下一個(gè)詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成樂(lè)觀(guān)、悲觀(guān)、悲觀(guān)和中性;每個(gè)分句的情緒傾向起始狀態(tài)均為中性,當(dāng)某一個(gè)特定分句的最終狀態(tài)為樂(lè)觀(guān)時(shí),表示該特定分句的情緒傾向?yàn)闃?lè)觀(guān);當(dāng)特定分句的最終狀態(tài)為悲觀(guān)時(shí),表示該特定分句的情緒傾向?yàn)楸^(guān);當(dāng)特定分句的最終狀態(tài)為中性時(shí),表示該特定分句的情緒傾向?yàn)橹行浴?br> [0008]可選的,本發(fā)明提供的新聞文本情緒傾向分析方法中,以句子為單位分別累加的步驟進(jìn)一步包含下列步驟:
[0009]對(duì)每種情緒傾向在新聞文本內(nèi)的出現(xiàn)頻率作正規(guī)化處理,并將正規(guī)化后的出現(xiàn)頻率轉(zhuǎn)化成發(fā)生機(jī)率pi j ;由Pij計(jì)算每種情緒傾向的熵值:
【權(quán)利要求】
1.一種新聞文本情緒傾向分析方法,其特征在于,包括以下步驟:提供一情緒詞匯庫(kù)、一否定修飾詞匯庫(kù)與一有限狀態(tài)自動(dòng)機(jī);對(duì)新聞文本進(jìn)行分句分詞處理,以產(chǎn)生若干個(gè)句子,其中每個(gè)句子包括至少一個(gè)子句,且每個(gè)子句包括至少一個(gè)詞匯;使用所述情緒詞匯庫(kù)與所述否定修飾詞匯庫(kù)對(duì)所述若干個(gè)句子以及每個(gè)分句的每個(gè)詞匯進(jìn)行詞匯比對(duì),以標(biāo)示每個(gè)詞匯為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、非情緒詞匯或否定修飾詞匯;依據(jù)詞匯比對(duì)結(jié)果,將每個(gè)詞匯分別轉(zhuǎn)換為一個(gè)代表符號(hào);使用所述有限狀態(tài)自動(dòng)機(jī)與所述代表符號(hào),以推算每個(gè)分句的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性;以句子為單位分別累加新聞文本中每個(gè)句子所包含的每個(gè)分句的每種情緒傾向后,計(jì)算經(jīng)累加后所有句子所對(duì)應(yīng)的每種情緒傾向的熵值;依據(jù)計(jì)算出的熵值決定所述新聞文本的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性。
2.根據(jù)權(quán)利要求1所述的新聞文本情緒傾向分析方法,其特征在于,所述每個(gè)分句的情緒傾向的判定過(guò)程是在每個(gè)分句的目前狀態(tài)基礎(chǔ)上加入該分句的下一個(gè)詞匯后,由所述有限狀態(tài)自動(dòng)機(jī)根據(jù)最新加入的詞匯轉(zhuǎn)換下一狀態(tài);而在進(jìn)一步加入再下一個(gè)詞匯前,所述下一狀態(tài)又取代原有目前狀態(tài)成為目前狀態(tài),如此循環(huán)運(yùn)作,直至所有分句均被判定完畢;當(dāng)分句的目前狀態(tài)為樂(lè)觀(guān),分句的下一個(gè)詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成樂(lè)觀(guān)、悲觀(guān)、悲觀(guān)和樂(lè)觀(guān);當(dāng)分句的目前狀態(tài)為悲觀(guān),分句的下一詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成悲觀(guān)、悲觀(guān)、樂(lè)觀(guān)和悲觀(guān);當(dāng)分句的目前狀態(tài)為中性,分句的下一個(gè)詞匯分別為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、否定修飾詞匯和非情緒詞匯時(shí),加入下一個(gè)詞匯后,分句的下一狀態(tài)分別變成樂(lè)觀(guān)、悲觀(guān)、悲觀(guān)和中性;每個(gè)分句的情緒傾向起始狀態(tài)均為中性,當(dāng)某一個(gè)特定分句的最終狀態(tài)為樂(lè)觀(guān)時(shí),表示該特定分句的情緒傾向?yàn)闃?lè)觀(guān);當(dāng)特定分句的最終狀態(tài)為悲觀(guān)時(shí),表示該特定分句的情緒傾向?yàn)楸^(guān);當(dāng)特定分句的最終狀態(tài)為中性時(shí),表示該特定分句的情緒傾向?yàn)橹行浴?br> 3.根據(jù)權(quán)利要求1或2所述的新聞文本情緒傾向分析方法,其特征在于,其中所述以句子為單位分別累加的步驟進(jìn)一步包含下列步驟: 對(duì)每種情緒傾向在所述新聞文本內(nèi)的出現(xiàn)頻率作正規(guī)化處理,并將正規(guī)化后的出現(xiàn)頻率轉(zhuǎn)化成發(fā)生機(jī)率Pij ;由Pij計(jì)算每種情緒傾向的熵值:
m 〒-kIpM

?=\ 其中k=l/ln(m), i=l, 2,3…m, m表示句子的總數(shù)目,j=l, 2,3…η, η表示每種情緒傾向的總數(shù)目; 求算評(píng)估值=(熵值+_熵值_) / (熵值++熵值_) 其中“熵值+”為情緒傾向?yàn)闃?lè)觀(guān)時(shí)的熵值,“熵值為情緒傾向?yàn)楸^(guān)時(shí)的熵值,當(dāng)評(píng)估值大于第一門(mén)坎值時(shí),所述新聞文本的情緒傾向?yàn)闃?lè)觀(guān),當(dāng)評(píng)估值小于第二門(mén)坎值時(shí),所述新聞文本的情緒傾向?yàn)楸^(guān)。
4.根據(jù)權(quán)利要求1-3所述的新聞文本情緒傾向分析方法,其特征在于,其中所述第一門(mén)坎值為一個(gè)正實(shí)數(shù)值,所述第二門(mén)坎值為一個(gè)負(fù)實(shí)數(shù)值。
5.根據(jù)權(quán)利要求1-4所述的新聞文本情緒傾向分析方法,其特征在于,其中所述新聞文本為財(cái)經(jīng)新聞、政治新聞或國(guó)際新聞中的一種,所述新聞文本中的每個(gè)句子以句號(hào)與其他句子彼此分隔,每個(gè)句子中的每個(gè)分句以逗號(hào)或分號(hào)與該句子的其他分句彼此分隔。
6.一種新聞文本情緒傾向分析方法,其特征在于,包括以下步驟:提供一情緒詞匯庫(kù)、一否定修飾詞匯庫(kù)與一有限狀態(tài)自動(dòng)機(jī);對(duì)新聞文本進(jìn)行分句分詞處理,以產(chǎn)生若干個(gè)句子,其中每個(gè)句子包括至少一個(gè)子句,每個(gè)子句包括至少一個(gè)詞匯;使用所述否定修飾詞匯庫(kù)與所述情緒詞匯庫(kù)對(duì)所述若干個(gè)句子進(jìn)行詞匯比對(duì),以標(biāo)示每個(gè)詞匯為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、非情緒詞匯或否定修飾詞匯;依據(jù)詞匯比對(duì)結(jié)果,將每個(gè)詞匯分別轉(zhuǎn)換為一個(gè)代表符號(hào);使用所述有限狀態(tài)自動(dòng)機(jī)與每個(gè)分句的每個(gè)詞匯的代表符號(hào)來(lái)推算每個(gè)分句的情緒傾向。
7.根據(jù)權(quán)利要求6所述的新聞文本情緒傾向分析方法,其特征在于,進(jìn)一步包括以下步驟:經(jīng)累加所述新聞文本中每個(gè)句子所包含的每個(gè)分句的每種情緒傾向后,計(jì)算新聞文本中每種情緒傾向的熵值,以決定所述新聞文本的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性。
8.一種分析文本的方法,其特征在于,包括以下步驟:提供若干個(gè)詞匯庫(kù)以及一有限狀態(tài)自動(dòng)機(jī);分析所述文本以產(chǎn)生若干個(gè)句子,每個(gè)句子包括至少一個(gè)分句,每個(gè)分句包括至少一個(gè)詞匯;將每個(gè)詞匯與若干個(gè)復(fù)數(shù)詞匯庫(kù)進(jìn)行比對(duì),以標(biāo)示每個(gè)詞匯的屬性以及對(duì)應(yīng)該屬性的代號(hào);使用所述有限狀態(tài)自動(dòng)機(jī)比對(duì)每個(gè)代號(hào),以推算每個(gè)分句的情緒傾向;以單個(gè)句子為單位累加每種情緒傾向從而計(jì)算出所述文本中每種情緒傾向的熵值;依據(jù)熵值決定所述文本的情緒狀態(tài)。
9.根據(jù)權(quán)利要求8所述的分析文本的方法,其特征在于,其中所述文本為新聞聞本,所述若干個(gè)詞匯庫(kù)包括一情緒詞匯庫(kù)與一否定修飾詞匯庫(kù),所述情緒詞匯庫(kù)包括若干個(gè)樂(lè)觀(guān)詞匯與若干個(gè)悲觀(guān)詞匯,所述否定修飾詞匯庫(kù)包括若干個(gè)否定修飾詞匯,所述文本的情緒傾向?qū)儆跇?lè)觀(guān)、悲觀(guān)或中性。
10.一種分析文本的方法,其特征在于,包括以下步驟:拆解所述文本成若干個(gè)句子,每個(gè)句子包括至少 一個(gè)分句,且每個(gè)分句包括至少一個(gè)詞匯;分析每個(gè)詞匯的屬性,其中所述屬性為樂(lè)觀(guān)詞匯、悲觀(guān)詞匯、非情緒詞匯及否定修飾詞匯中的一種;累加每個(gè)分句中每個(gè)詞匯的屬性,以推算每個(gè)分句的情緒傾向;以單個(gè)句子為單位累加每個(gè)分句的每種情緒傾向,從而計(jì)算出所述文本中每種情緒傾向的熵值,以決定所述文本的情緒傾向。
【文檔編號(hào)】G06F17/27GK103793371SQ201310462920
【公開(kāi)日】2014年5月14日 申請(qǐng)日期:2013年9月30日 優(yōu)先權(quán)日:2012年10月30日
【發(fā)明者】盧陽(yáng)正, 陳振南, 柯淑津, 魏裕珍 申請(qǐng)人:銘傳大學(xué)
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沽源县| 蓬安县| 通榆县| 遂川县| 淅川县| 益阳市| 苗栗市| 团风县| 金坛市| 潜山县| 涞源县| 新兴县| 栾川县| 喀什市| 湖北省| 兰考县| 额济纳旗| 九龙城区| 嘉鱼县| 禹城市| 阜康市| 白城市| 盐源县| 台北市| 弥勒县| 宁强县| 盐津县| 腾冲县| 麦盖提县| 保亭| 九龙城区| 永丰县| 凤冈县| 万安县| 谷城县| 比如县| 尼木县| 凯里市| 类乌齐县| 鸡东县| 鸡东县|