欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法

文檔序號(hào):8487897閱讀:307來(lái)源:國(guó)知局
一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自然語(yǔ)言處理及機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,特別涉及一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的高速發(fā)展,人們?cè)絹?lái)越傾向于在社交網(wǎng)站上發(fā)表自己的情感,從微博、微信上的一句短句,到長(zhǎng)篇的博客,這些大量的文本信息中蘊(yùn)含著作者大量的情緒信息。
[0003]目前按照情緒標(biāo)簽對(duì)文本信息進(jìn)行分類(lèi)的研宄開(kāi)始逐漸增多,但普遍都是對(duì)文本信息自身的情緒特征進(jìn)行分析。由于人類(lèi)對(duì)語(yǔ)言文字的組織運(yùn)用是帶有主觀性和多樣性的,使得不少文本信息自身的表面情緒特征往往與作者真實(shí)的情緒是不一致的。所以,如果僅僅是對(duì)文本信息自身的情緒特征進(jìn)行分析,便有可能造成錯(cuò)誤的分類(lèi)結(jié)果。
[0004]綜上所述可以看出,在按照情緒標(biāo)簽對(duì)文本信息進(jìn)行分類(lèi)時(shí),如何改善文本信息的情緒分類(lèi)效果是目前亟待解決的問(wèn)題。

【發(fā)明內(nèi)容】

[0005]有鑒于此,本發(fā)明的目的在于提供一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法,在按照情緒標(biāo)簽對(duì)文本信息進(jìn)行分類(lèi)時(shí),改善了文本信息的情緒分類(lèi)效果。其具體方案如下:
[0006]一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法,
[0007]利用預(yù)先基于已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集建立的分類(lèi)器,對(duì)待標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行預(yù)分類(lèi),得到預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本;
[0008]利用預(yù)先基于所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集計(jì)算得到的句子間情緒轉(zhuǎn)移概率,對(duì)所述預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行優(yōu)化分類(lèi),得到優(yōu)化分類(lèi)結(jié)果。
[0009]優(yōu)選的,所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集包括N組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本,其中,N為正整數(shù),每組所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本均包括兩個(gè)已標(biāo)注情緒標(biāo)簽的文本句子。
[0010]優(yōu)選的,所述N組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本為不小于1000組的已標(biāo)注情緒標(biāo)簽的句子級(jí)文本。
[0011]優(yōu)選的,用于對(duì)所述已標(biāo)注情緒標(biāo)簽的文本句子進(jìn)行標(biāo)注的情緒標(biāo)簽包括M種情緒標(biāo)簽,其中,M為不小于2的正整數(shù);且每一個(gè)已標(biāo)注情緒標(biāo)簽的文本句子只被標(biāo)注上一種情緒標(biāo)簽。
[0012]優(yōu)選的,所述M種情緒標(biāo)簽為8種情緒標(biāo)簽,所述8種情緒標(biāo)簽為高興、討厭、喜歡、悲傷、焦慮、驚奇、生氣和渴望。
[0013]優(yōu)選的,基于所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集計(jì)算所述句子間情緒轉(zhuǎn)移概率的過(guò)程包括:
[0014]記錄每組所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本中的兩個(gè)文本句子的情緒對(duì)應(yīng)關(guān)系;
[0015]按照所述情緒對(duì)應(yīng)關(guān)系的種類(lèi)對(duì)所述N組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行分類(lèi),得到多類(lèi)句子級(jí)文本類(lèi);每一類(lèi)所述句子級(jí)文本類(lèi)包括一組或多組所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本;
[0016]計(jì)算每類(lèi)所述句子級(jí)文本類(lèi)中含有的句子級(jí)文本的數(shù)量占所述句子級(jí)文本集中含有的句子級(jí)文本的總量的比例,得到每類(lèi)所述句子級(jí)文本類(lèi)的所述句子間情緒轉(zhuǎn)移概率。
[0017]優(yōu)選的,基于所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集建立所述分類(lèi)器的過(guò)程為:
[0018]在所述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集上執(zhí)行機(jī)器學(xué)習(xí)分類(lèi)算法,得到所述分類(lèi)器。
[0019]優(yōu)選的,所述機(jī)器學(xué)習(xí)分類(lèi)算法為最大熵分類(lèi)算法。
[0020]本發(fā)明中,在利用分類(lèi)器對(duì)待標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行預(yù)分類(lèi)后,也即,在對(duì)待標(biāo)注情緒標(biāo)簽的句子級(jí)文本自身的情緒特征進(jìn)行分析后,還利用預(yù)先計(jì)算的句子間情緒轉(zhuǎn)移概率對(duì)預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行優(yōu)化分類(lèi),從而得到最終的優(yōu)化分類(lèi)結(jié)果,可見(jiàn),最終的優(yōu)化分類(lèi)結(jié)果是在既考慮了文本信息自身的情緒特征對(duì)文本分類(lèi)的影響,又考慮到了前后兩個(gè)句子間的情緒轉(zhuǎn)移概率對(duì)文本分類(lèi)的影響的情況下得到的,從而改善了文本信息的情緒分類(lèi)效果。
【附圖說(shuō)明】
[0021]為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
[0022]圖1為本發(fā)明實(shí)施例公開(kāi)的一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法流程圖;
[0023]圖2為本發(fā)明實(shí)施例公開(kāi)的一種句子間情緒轉(zhuǎn)移概率的計(jì)算方法流程圖。
【具體實(shí)施方式】
[0024]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0025]本發(fā)明實(shí)施例公開(kāi)了一種基于句子間情緒轉(zhuǎn)移概率的句子級(jí)情緒分類(lèi)方法,參見(jiàn)圖1所示,上述方法包括:
[0026]步驟SlOl:利用預(yù)先基于已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集建立的分類(lèi)器,對(duì)待標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行預(yù)分類(lèi),得到預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本。
[0027]本實(shí)施例中,已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集包括N組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本,其中,N為正整數(shù),每組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本均包括兩個(gè)已標(biāo)注情緒標(biāo)簽的文本句子。優(yōu)選的,上述N組已標(biāo)注情緒標(biāo)簽的句子級(jí)文本為不小于1000組的已標(biāo)注情緒標(biāo)簽的句子級(jí)文本。上述已標(biāo)注情緒標(biāo)簽的句子級(jí)文本可以是從相關(guān)已有的文本數(shù)據(jù)庫(kù)中獲取,也可以通過(guò)自行標(biāo)注的方式獲得。
[0028]另外,用于對(duì)已標(biāo)注情緒標(biāo)簽的文本句子進(jìn)彳丁標(biāo)注的情緒標(biāo)簽包括M種情緒標(biāo)簽,其中,M為不小于2的正整數(shù);且每一個(gè)已標(biāo)注情緒標(biāo)簽的文本句子只被標(biāo)注上一種情緒標(biāo)簽。優(yōu)選的,M種情緒標(biāo)簽為8種情緒標(biāo)簽,8種情緒標(biāo)簽為尚興、討厭、喜歡、悲傷、焦慮、驚奇、生氣和渴望。
[0029]本實(shí)施例中,基于已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集建立分類(lèi)器的過(guò)程為:在已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集上執(zhí)行機(jī)器學(xué)習(xí)分類(lèi)算法,得到分類(lèi)器。優(yōu)選的機(jī)器學(xué)習(xí)分類(lèi)算法為最大熵分類(lèi)算法。最大熵分類(lèi)算法適合融合各種不一樣的情緒特征,而無(wú)需考慮情緒特征之間的影響。由于最大熵分類(lèi)算法是一種現(xiàn)有技術(shù),在此不再對(duì)其進(jìn)行贅述。
[0030]在步驟SlOl中,利用分類(lèi)器對(duì)待標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行預(yù)分類(lèi),例如,待標(biāo)注情緒標(biāo)簽的句子級(jí)文本包括呈上下句關(guān)系的文本句子A和文本句子B。文本句子A經(jīng)過(guò)分類(lèi)器的預(yù)分類(lèi)處理后,被標(biāo)上“渴望”的概率為100%,文本句子B經(jīng)過(guò)分類(lèi)器的預(yù)分類(lèi)處理后,被標(biāo)上“喜歡”的概率為55%,而被標(biāo)上“討厭”的概率為45%。那么,經(jīng)過(guò)預(yù)分類(lèi)后得到的預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本包括被標(biāo)上“渴望”的概率為100%的文本句子A以及被標(biāo)上“喜歡”的概率為55%和被標(biāo)上“討厭”的概率為45%的文本句子B。此時(shí)文本句子B的情緒標(biāo)簽還未最終確定,需要經(jīng)過(guò)后續(xù)的優(yōu)化分類(lèi)處理才能最終確定。
[0031]步驟S102:利用預(yù)先基于已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集計(jì)算得到的句子間情緒轉(zhuǎn)移概率,對(duì)預(yù)標(biāo)注情緒標(biāo)簽的句子級(jí)文本進(jìn)行優(yōu)化分類(lèi),得到優(yōu)化分類(lèi)結(jié)果。
[0032]同樣以上述步驟SlOl中提到的例子為例,如果預(yù)先基于已標(biāo)注情緒標(biāo)簽的句子級(jí)文本集計(jì)算得到的句子間情緒轉(zhuǎn)移概率中,文本句子間的情緒標(biāo)簽從“渴望”轉(zhuǎn)移到“喜
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
突泉县| 全椒县| 湟中县| 五常市| 塔城市| 青铜峡市| 丘北县| 襄汾县| 宿迁市| 盱眙县| 涿鹿县| 河北省| 西畴县| 大连市| 清原| 洛阳市| 新闻| 安乡县| 巫山县| 白银市| 栾城县| 留坝县| 收藏| 五台县| 喀喇沁旗| 综艺| 彭山县| 鄂托克旗| 东乌| 望江县| 洛浦县| 海城市| 佳木斯市| 武安市| 岳阳市| 唐海县| 会同县| 万宁市| 新郑市| 稷山县| 云霄县|