情感數(shù)據(jù)分類方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種情感數(shù)據(jù)分類方法和系統(tǒng),所述方法包括:構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖,所述文檔-文檔圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度,所述詞-詞圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的詞,邊的幾何信息表示詞之間的相關(guān)度;根據(jù)所述文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項;對所述目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣;獲取測試數(shù)據(jù)集中的文檔,根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。采用該方法和系統(tǒng),能夠提高情感分類精度。
【專利說明】情感數(shù)據(jù)分類方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自然語言處理技術(shù),特別是涉及一種情感數(shù)據(jù)分類方法和系統(tǒng)。
【背景技術(shù)】
[0002]隨著Web2.0的發(fā)展,越來越多的用戶在網(wǎng)頁中產(chǎn)生具有情感的數(shù)據(jù),這些數(shù)據(jù)通常以網(wǎng)絡(luò)中的評論、博客數(shù)據(jù)的形式存在。情感分類指的是自動預(yù)測用戶產(chǎn)生的情感數(shù)據(jù)的情感傾向,比如,預(yù)測一條評論是積極的還是消極的。
[0003]近期,情感分類在自然語言處理中獲得了普遍關(guān)注,情感分類方法可分為有監(jiān)督的情感分析和無監(jiān)督的情感分析。有監(jiān)督的情感分析依賴于人工標(biāo)注的訓(xùn)練數(shù)據(jù),而在一些情況下,標(biāo)注工作是費(fèi)時和昂貴的,這促使了無監(jiān)督或半監(jiān)督的情感分析。
[0004]傳統(tǒng)的無監(jiān)督(或半監(jiān)督)的情感分析的方法是基于詞典的方法。基于詞典的方法采用情感詞匯來確定文檔的整體情感傾向。然而,很難去界定一個普適的最佳情感詞匯來涵蓋從不同領(lǐng)域的所有單詞。此外,大多數(shù)半自動的基于詞典的方法,都得不到令人滿意的結(jié)果。傳統(tǒng)的較為先進(jìn)的基于詞典的方法是基于約束的非負(fù)矩陣三因子分解(Constrained Non-negative Matrix Tr1-factorizat1n,簡稱 CNMTF)的情感分類方法,其將與領(lǐng)域無關(guān)的情感詞匯作為先驗知識進(jìn)行情感分類,然而實驗表明,基于CNMTF的情感分類方法的情感分類精度仍有待于提高。
【發(fā)明內(nèi)容】
[0005]基于此,有必要針對上述問題,提供一種能提高分類精度的情感數(shù)據(jù)分類方法和系統(tǒng)。
[0006]一種情感數(shù)據(jù)分類方法,所述方法包括:
[0007]構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖,所述文檔-文檔圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度,所述詞-詞圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的詞,邊的幾何信息表示詞之間的相關(guān)度;
[0008]根據(jù)所述文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項;
[0009]對所述目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣;
[0010]獲取測試數(shù)據(jù)集中的文檔,根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。
[0011]一種情感數(shù)據(jù)分類系統(tǒng),所述系統(tǒng)包括:
[0012]圖構(gòu)造模塊,用于構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖,所述文檔-文檔圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度,所述詞-詞圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的詞,邊屬性表示詞之間的相關(guān)度;
[0013]正則化項構(gòu)造模塊,用于根據(jù)所述文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項;
[0014]優(yōu)化處理模塊,用于對所述目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣;
[0015]情感傾向確定模塊,用于獲取測試數(shù)據(jù)集中的文檔,根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。
[0016]上述情感數(shù)據(jù)分類方法和系統(tǒng),通過構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的兩個圖,即文檔-文檔圖和詞-詞圖,在構(gòu)造目標(biāo)函數(shù)時,充分考慮到了文檔空間和詞空間中的幾何信息,利用了鄰近的詞或文檔往往有著相同的情感傾向的原理,對目標(biāo)函數(shù)進(jìn)行優(yōu)化處理后,輸出的文檔-情感矩陣更加精確,使得對于測試數(shù)據(jù)集中的文檔,確定對應(yīng)的情感傾向更加準(zhǔn)確,從而提高了情感數(shù)據(jù)的分類精度。
【專利附圖】
【附圖說明】
[0017]圖1為一個實施例中情感數(shù)據(jù)分類方法的流程示意圖;
[0018]圖2為一個實施例中情感數(shù)據(jù)分類系統(tǒng)的結(jié)構(gòu)框圖;
[0019]圖3為在兩個不同的數(shù)據(jù)集上的不同參數(shù)下的情感分類精度的對比示意圖;
[0020]圖4為在兩個不同數(shù)據(jù)集上的不同最鄰近值下的情感分類精度的對比示意圖;
[0021]圖5為在兩個數(shù)據(jù)集上的GNMTF的參數(shù)分析的對比示意圖;
[0022]圖6為半監(jiān)督模式下具有不同百分比標(biāo)記文件下的情感分類精度的對比示意圖。
【具體實施方式】
[0023]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0024]本發(fā)明實施例所提供的情感數(shù)據(jù)分類方法,可以對測試數(shù)據(jù)集中的文檔,確定其對應(yīng)的情感傾向。測試數(shù)據(jù)集可以是用戶在互聯(lián)網(wǎng)中所產(chǎn)生的情感數(shù)據(jù)所組成的集合,比如,互聯(lián)網(wǎng)中存在的評論數(shù)據(jù)、博客數(shù)據(jù)等。情感數(shù)據(jù)分類方法則可對諸如評論的文檔確定其對應(yīng)的情感傾向,比如確定是積極的還是消極的。具體的,先對訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)集可以是互聯(lián)網(wǎng)中已經(jīng)存在的大量的情感數(shù)據(jù)所組成的集合,對這些數(shù)據(jù)進(jìn)行訓(xùn)練可以得到文檔-情感矩陣,該文檔-情感矩陣則為最優(yōu)的文檔-情感矩陣,使用最優(yōu)的文檔-情感數(shù)據(jù)對測試數(shù)據(jù)集中的文檔確定其對應(yīng)的情感傾向,能夠獲得更為準(zhǔn)確的分類結(jié)果。在訓(xùn)練過程中,考慮到鄰近的詞或文檔往往有著相同的情感傾向,因此對訓(xùn)練數(shù)據(jù)集構(gòu)造兩個圖,即文檔-文檔圖和詞-詞圖,這兩個圖具有密切關(guān)系,且分別包含了文檔空間和詞空間中的幾何信息。將這兩個圖作為非負(fù)矩陣三因子分解的正則化,從而構(gòu)造出目標(biāo)函數(shù)中的基于圖的正則化項,再對目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,從而可以得到最優(yōu)的文檔-情感矩陣。由于構(gòu)造了兩個圖,且構(gòu)造的目標(biāo)函數(shù)中除了非負(fù)矩陣三因子分解項外,還包含了基于圖的正則化項,因此本發(fā)明實施例所采用的算法也稱之為基于圖正則化的非負(fù)矩陣三因子分角軍(Graph Co-regularized Non-negative Matrix Tr1-factorizat1n,簡稱GNMTF)算法,本發(fā)明實施例提出了一種基于圖正則化非負(fù)矩陣三因子分解的情感數(shù)據(jù)分類方法。
[0025]如圖1所示,在一個實施例中,提供了一種情感數(shù)據(jù)分類方法,包括:
[0026]步驟102,構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖。
[0027]訓(xùn)練數(shù)據(jù)集是用來進(jìn)行訓(xùn)練的數(shù)據(jù)集合,可選取互聯(lián)網(wǎng)中已存在的大量的情感數(shù)據(jù)作為訓(xùn)練樣本,這些訓(xùn)練樣本也可包含一些進(jìn)行了人工標(biāo)注的文檔。本實施例中,文檔-文檔圖中,節(jié)點表示訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度。詞-詞圖中,節(jié)點表示訓(xùn)練數(shù)據(jù)集中的詞,邊屬性表示詞之間的相關(guān)度。因此,構(gòu)造的這兩個圖中分別保留了文檔空間和詞空間中的幾何信息。
[0028]步驟104,根據(jù)文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)的基于圖的正則化項。
[0029]本實施例中,在構(gòu)造目標(biāo)函數(shù)時,在CNMTF基礎(chǔ)上增加基于圖的正則化項。CNMTF是指約束的非負(fù)矩陣三因子分解,其構(gòu)造的目標(biāo)函數(shù)包含非負(fù)矩陣三因子分解項和詞匯先驗知識項。具體的,可根據(jù)文檔-文檔圖獲取對應(yīng)的相關(guān)度矩陣,根據(jù)詞-詞圖獲取對應(yīng)的相關(guān)度矩陣,根據(jù)這兩個相關(guān)度矩陣獲取對應(yīng)圖的拉普拉斯矩陣,再根據(jù)拉普拉斯矩陣構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項,從而保留了文檔空間和詞空間中的幾何信息。
[0030]步驟106,對目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣。
[0031]具體的,單調(diào)減少所構(gòu)造的目標(biāo)函數(shù)直至收斂,最終得到使得目標(biāo)函數(shù)最小化對應(yīng)的參數(shù),這些參數(shù)中包含文檔-情感矩陣。該文檔-情感矩陣即為最優(yōu)的文檔-情感矩陣,標(biāo)識了一個文檔所對應(yīng)的情感(即情感傾向)。
[0032]步驟108,獲取測試數(shù)據(jù)集中的文檔,根據(jù)輸出的文檔-情感矩陣獲取與測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。
[0033]測試數(shù)據(jù)集是指需要確定其中文檔對應(yīng)的情感傾向的數(shù)據(jù)組成的集合。對于測試數(shù)據(jù)集中的一個文檔,根據(jù)輸出的文檔-情感矩陣可找到該文檔對應(yīng)的行,根據(jù)該行找到取最大值的情感傾向,即為該文檔對應(yīng)的情感傾向。情感傾向為正,則表明該文檔對應(yīng)的情感是積極的,情感傾向為負(fù),表明該文檔對應(yīng)的情感是消極的,以此實現(xiàn)對文檔的情感分類。
[0034]本實施例中,通過構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的兩個圖,即文檔-文檔圖和詞-詞圖,在構(gòu)造目標(biāo)函數(shù)時,充分考慮到了文檔空間和詞空間中的幾何信息,利用了鄰近的詞或文檔往往有著相同的情感傾向的原理,對目標(biāo)函數(shù)進(jìn)行優(yōu)化處理后,輸出的最優(yōu)的文檔-情感矩陣更加精確,使得對于測試數(shù)據(jù)集中的文檔,確定對應(yīng)的情感傾向更加準(zhǔn)確,從而提高了情感數(shù)據(jù)的分類精度。
[0035]由于本發(fā)明實施例所提出的GNMTF算法是在CNMTF基礎(chǔ)上提出的,而CNMTF是約束的 NMTF (Non-negative Matrix Tr1-factorizat1n,非負(fù)矩陣三因子分解)。為了更加清楚的理解本發(fā)明,以下相應(yīng)的對NMTF和CNMTF進(jìn)行說明以及介紹一些基本概念。
[0036]非負(fù)矩陣三因子分解(NMTF)可用于無監(jiān)督(或半監(jiān)督)情感分析,在這些模型中,一個詞-文檔矩陣可以近似為三因子矩陣,通過求解公式(I)中的優(yōu)化問題來對詞和文檔指定類別標(biāo)注:
[0037]
n mi參 οO = |X - UHVr||f— + ,T1 IjUrU - + CT2IVtV -1||J— υ:ΗΛ'~Μ(I)
[0038]其中,詞-文檔矩陣1=自,m為詞的個數(shù),η為文檔的個數(shù)。σ:和σ 2是收縮正則化參數(shù)。t/ 二 [&...,&] GiCd+是詞-情感矩陣,F(xiàn) = R,...,FJeiC*是文檔-情感矩陣,k是文檔的情感類別數(shù)量,k = 2,即情感分類包含兩類:正和負(fù)。例如,Vil =
I(或Uil = I)表示文檔i (或詞i)的情感傾向為正,Vi2 = I (或Ui2 = I)表示文檔i (或詞i)的情感傾向為負(fù)。Vi# = 0(或Uw = O)表示未知,即:文檔i (或詞i)既不為正也不為負(fù)。Il.I If是Frobenius范數(shù),I是所有條目都為I的單位矩陣。
[0039]對于公式(I),基于收縮技術(shù),可通過防止第二項和第三項過于龐大以近似滿足U和V的正交約束。由于拉格朗日乘法,給定任意£1和ε2,有適當(dāng)?shù)?1和Q2,使得滿足
II和lirV —/Ilpi2。
[0040]有關(guān)NMTF的一些概念如下:
[0041]給定一個矩陣Ze]R_,X的蹤跡計算為:
[0042]
【權(quán)利要求】
1.一種情感數(shù)據(jù)分類方法,所述方法包括: 構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖,所述文檔-文檔圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度,所述詞-詞圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的詞,邊的幾何信息表示詞之間的相關(guān)度; 根據(jù)所述文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項; 對所述目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣; 獲取測試數(shù)據(jù)集中的文檔,根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述文檔-文檔圖的相關(guān)度矩陣定義為:如果兩個文檔,其中任何一個文檔為另外一個文檔的最近鄰居,則這兩個文檔的相關(guān)度為這兩個文檔之間的余弦,否則相關(guān)度為O ; 所述詞-詞圖的相關(guān)度矩陣定義為:如果兩個詞,其中任何一個詞為另外一個詞的最近鄰居,則這兩個詞的相關(guān)度為這兩個詞之間的余弦,否則相關(guān)度為O。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項的步驟,包括: 構(gòu)造所述訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-情感矩陣和詞-情感矩陣; 獲取所述文檔-文檔圖的拉普拉斯矩陣和所述詞-詞圖的拉普拉斯矩陣; 根據(jù)所述訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-情感矩陣和所述文檔-文檔圖的拉普拉斯矩陣構(gòu)造所述目標(biāo)函數(shù)中基于文檔-文檔圖的正則化項,以及根據(jù)所述訓(xùn)練數(shù)據(jù)集對應(yīng)的詞-情感矩陣和所述詞-詞圖的拉普拉斯矩陣構(gòu)造所述目標(biāo)函數(shù)中基于詞-詞圖的正則化項。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于文檔-文檔圖的正則化項為預(yù)設(shè)的文檔空間的控制參數(shù)與第一蹤跡的乘積,所述基于詞-詞圖的正則化項為預(yù)設(shè)的詞空間的控制參數(shù)與第二蹤跡的乘積; 所述基于圖的正則化項為預(yù)設(shè)的文檔空間的控制參數(shù)與第一蹤跡的乘積和預(yù)設(shè)的詞空間的控制參數(shù)與第二蹤跡的乘積之和; 其中,所述第一蹤跡為將所述文檔-情感矩陣、文檔-情感矩陣的轉(zhuǎn)置矩陣、文檔-文檔圖的拉普拉斯矩陣相乘得到的矩陣的蹤跡,所述第二蹤跡為將所述詞-情感矩陣、詞-情感矩陣的轉(zhuǎn)置矩陣、詞-詞圖的拉普拉斯矩陣相乘得到的矩陣的蹤跡。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣的步驟,包括: 按照預(yù)設(shè)次數(shù)進(jìn)行迭代運(yùn)算,不斷更新文檔-情感矩陣、詞-情感矩陣和文檔情感矩陣與詞-情感矩陣之間的關(guān)聯(lián)矩陣,根據(jù)更新的文檔-情感矩陣、詞-情感那矩陣和所述關(guān)聯(lián)矩陣單調(diào)減少所述目標(biāo)函數(shù)直到收斂,輸出使得所述目標(biāo)函數(shù)最小化的文檔-情感矩陣。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向的步驟為: 對于所述測試數(shù)據(jù)集中的一個文檔,獲取該文檔在所述文檔-情感矩陣中所處的行,獲取所述行中對應(yīng)的取最大值的情感傾向作為所述文檔對應(yīng)的情感傾向。
7.一種情感數(shù)據(jù)分類系統(tǒng),其特征在于,所述系統(tǒng)包括: 圖構(gòu)造模塊,用于構(gòu)造訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-文檔圖和詞-詞圖,所述文檔-文檔圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的文檔,邊的幾何信息表示文檔之間的相關(guān)度,所述詞-詞圖中,節(jié)點表示所述訓(xùn)練數(shù)據(jù)集中的詞,邊的幾何信息表示詞之間的相關(guān)度; 正則化項構(gòu)造模塊,用于根據(jù)所述文檔-文檔圖和詞-詞圖的幾何信息構(gòu)造目標(biāo)函數(shù)中的基于圖的正則化項; 優(yōu)化處理模塊,用于對所述目標(biāo)函數(shù)進(jìn)行優(yōu)化處理,輸出文檔-情感矩陣; 情感傾向確定模塊,用于獲取測試數(shù)據(jù)集中的文檔,根據(jù)所述文檔-情感矩陣獲取與所述測試數(shù)據(jù)集中的文檔對應(yīng)的情感傾向。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述文檔-文檔圖的相關(guān)度矩陣定義為:如果兩個文檔,其中任何一個文檔為另外一個文檔的最近鄰居,則這兩個文檔的相關(guān)度為這兩個文檔之間的余弦,否則相關(guān)度為O ; 所述詞-詞圖的相關(guān)度矩陣定義為:如果兩個詞,其中任何一個詞為另外一個詞的最近鄰居,則這兩個詞的相關(guān)度為這兩個詞之間的余弦,否則相關(guān)度為O。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述正則化項構(gòu)造模塊用于構(gòu)造所述訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-情感矩陣和詞-情感矩陣;獲取所述文檔-文檔圖的拉普拉斯矩陣和所述詞-詞圖的拉普拉斯矩陣;根據(jù)所述訓(xùn)練數(shù)據(jù)集對應(yīng)的文檔-情感矩陣和所述文檔-文檔圖的拉普拉斯矩陣構(gòu)造所述目標(biāo)函數(shù)中基于文檔-文檔圖的正則化項,以及根據(jù)所述訓(xùn)練數(shù)據(jù)集對應(yīng)的詞-情感矩陣和所述詞-詞圖的拉普拉斯矩陣構(gòu)造所述目標(biāo)函數(shù)中基于詞-詞圖的正則化項。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述基于文檔-文檔圖的正則化項為預(yù)設(shè)的文檔空間的控制參數(shù)與第一蹤跡的乘積,所述基于詞-詞圖的正則化項為預(yù)設(shè)的詞空間的控制參數(shù)與第二蹤跡的乘積; 所述基于圖的正則化項為預(yù)設(shè)的文檔空間的控制參數(shù)與第一蹤跡的乘積和預(yù)設(shè)的詞空間的控制參數(shù)與第二蹤跡的乘積之和; 其中,所述第一蹤跡為將所述文檔-情感矩陣、文檔-情感矩陣的轉(zhuǎn)置矩陣、文檔-文檔圖的拉普拉斯矩陣相乘得到的矩陣的蹤跡,所述第二蹤跡為將所述詞-情感矩陣、詞-情感矩陣的轉(zhuǎn)置矩陣、詞-詞圖的拉普拉斯矩陣相乘得到的矩陣的蹤跡。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述優(yōu)化處理模塊用于按照預(yù)設(shè)次數(shù)進(jìn)行迭代運(yùn)算,不斷更新文檔-情感矩陣、詞-情感矩陣和文檔情感矩陣與詞-情感矩陣之間的關(guān)聯(lián)矩陣,根據(jù)更新的文檔-情感矩陣、詞-情感那矩陣和所述關(guān)聯(lián)矩陣單調(diào)減少所述目標(biāo)函數(shù)直到收斂,輸出使得所述目標(biāo)函數(shù)最小化的文檔-情感矩陣。
12.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述情感傾向確定模塊用于對于所述測試數(shù)據(jù)集中的一個文檔,獲取該文檔在所述文檔-情感矩陣中所處的行,獲取所述行中對應(yīng)的取最大值的情感傾向作為所述文檔對應(yīng)的情感傾向。
【文檔編號】G06F17/30GK104199829SQ201410361587
【公開日】2014年12月10日 申請日期:2014年7月25日 優(yōu)先權(quán)日:2014年7月25日
【發(fā)明者】周光有, 王巨宏, 蔣杰, 薛偉, 管剛, 趙軍 申請人:中國科學(xué)院自動化研究所, 騰訊科技(深圳)有限公司