欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種文本情緒極性的識別方法及裝置的制造方法

文檔序號:8223475閱讀:335來源:國知局
一種文本情緒極性的識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及自然語言分析技術(shù)領(lǐng)域,尤其是一種文本情緒極性的識別方法及裝 置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)中出現(xiàn)了大量對于人物、事件、產(chǎn)品等內(nèi)容進(jìn)行的評 論,一些數(shù)據(jù)監(jiān)測系統(tǒng)需要收集評論信息,并需要對評論信息進(jìn)行情緒極性的分析,從而了 解評論者對于被評論對象的觀點(diǎn)或態(tài)度。
[0003] 其中,情緒極性指的是評論者通過文本表達(dá)出的情緒類型,如褒義情緒(正極性 情緒)或貶義情緒(正極性情緒)。例如,評論內(nèi)容為"聽到昨晚發(fā)生的上海外灘踩踏事件, 我感到非常悲痛",該評論文本的情緒極性為貶義情緒。又如,評論內(nèi)容為"我非常期待這次 產(chǎn)品發(fā)布會,因?yàn)樵跁蠈l(fā)布運(yùn)用了最新定位技術(shù)的導(dǎo)航儀",該評論文本的情緒極性為 褒義情緒。
[0004] 為了實(shí)現(xiàn)數(shù)據(jù)監(jiān)測系統(tǒng)對網(wǎng)絡(luò)文本的監(jiān)測,需要對網(wǎng)絡(luò)文本的情緒極性進(jìn)行識 別。

【發(fā)明內(nèi)容】

[0005] 有鑒于此,本申請?zhí)峁┝艘环N文本情緒識別方法及裝置,用以實(shí)現(xiàn)對文本表達(dá)情 緒極性的識別。為實(shí)現(xiàn)所述目的,本發(fā)明提供的技術(shù)方案如下:
[0006] -種文本情緒極性的識別方法,包括:
[0007] 獲取多條待識別文本;
[0008] 利用預(yù)先構(gòu)建的分類器,分別確定每條所述待識別文本各自的多個極性概率值;
[0009] 將各自的多個極性概率值中的最大值對應(yīng)的情緒極性確定為每條所述待識別文 本各自的情緒極性。
[0010] 可選地,上述的文本情緒極性的識別方法中,所述分類器的構(gòu)建方法包括:
[0011] 獲取已標(biāo)注的第一語言類型的語料,并將所述第一語言類型的語料翻譯為第二語 言類型的語料;其中,所述已標(biāo)注的第一語言類型的語料具有情緒極性標(biāo)簽;
[0012] 當(dāng)存在已確定出情緒極性的文本時,將所述第二語言類型的語料及所述文本確定 為訓(xùn)練集;
[0013] 當(dāng)不存在已確定出情緒極性的文本時,將所述第二語言類型的語料確定為訓(xùn)練 集;
[0014] 利用預(yù)設(shè)訓(xùn)練算法,對所述訓(xùn)練集進(jìn)行訓(xùn)練,獲得分類器。
[0015] 可選地,上述的文本情緒極性的識別方法中,所述第一語言類型的語料為英文語 料,所述第二語言類型的語料為中文語料。
[0016] 可選地,上述的文本情緒極性的識別方法中,所述利用預(yù)先構(gòu)建的分類器,分別確 定每條所述待識別文本各自的多個極性概率值包括:
[0017] 利用預(yù)先構(gòu)建的最大熵分類器,分別確定每條所述待識別文本各自的多個極性概 率值。
[0018] 本申請還提供了一種文本情緒極性的識別裝置,包括:
[0019] 待識別文本獲取單元,用于獲取多條待識別文本;
[0020] 分類器分類單元,用于利用預(yù)先構(gòu)建的分類器,分別確定每條所述待識別文本各 自的多個極性概率值;
[0021] 情緒極性確定單元,用于將各自的多個極性概率值中的最大值對應(yīng)的情緒極性確 定為每條所述待識別文本各自的情緒極性。
[0022] 可選地,上述的文本情緒極性的識別裝置中,包括分類器構(gòu)建單元,用于構(gòu)建分類 器;其中,所述分類器構(gòu)建單元包括:
[0023] 第二語料獲取子單元,用于獲取已標(biāo)注的第一語言類型的語料,并將所述第一語 言類型的語料翻譯為第二語言類型的語料;其中,所述已標(biāo)注的第一語言類型的語料具有 情緒極性標(biāo)簽;
[0024] 第一訓(xùn)練集確定子單元,用于當(dāng)存在已確定出情緒極性的文本時,將所述第二語 言類型的語料及所述文本確定為訓(xùn)練集;
[0025] 第二訓(xùn)練集確定子單元,用于當(dāng)不存在已確定出情緒極性的文本時,將所述第二 語言類型的語料確定為訓(xùn)練集;
[0026] 分類器構(gòu)建子單元,用于利用預(yù)設(shè)訓(xùn)練算法,對所述訓(xùn)練集進(jìn)行訓(xùn)練,獲得分類 器。
[0027] 可選地,上述的文本情緒極性的識別裝置中,所述第二語料獲取子單元獲取到的 第一語言類型的語料為英文語料,所述第二語料獲取子單元翻譯為的第二語言類型的語料 為中文語料。
[0028] 可選地,上述的文本情緒極性的識別裝置中,所述分類器分類單元包括:
[0029] 最大熵分類器分類子單元,用于利用預(yù)先構(gòu)建的最大熵分類器,分別確定每條所 述待識別文本各自的多個極性概率值。
[0030] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:
[0031] 由以上可知,本發(fā)明提供的文本情緒極性的識別方法,利用預(yù)先構(gòu)建的分類器,可 以確定出待識別文本在不同情緒極性類別中的極性概率值,將最大極性概率值對應(yīng)的情緒 極性確定為待識別文本的情緒極性,從而確定出了待識別文本的情緒極性。
【附圖說明】
[0032] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù) 提供的附圖獲得其他的附圖。
[0033] 圖1為本申請?zhí)峁┑奈谋厩榫w極性的識別方法的流程圖;
[0034] 圖2為本申請?zhí)峁┑臉?gòu)建分類器的流程圖;
[0035] 圖3為本申請?zhí)峁┑奈谋厩榫w極性的識別裝置的結(jié)構(gòu)示意圖;
[0036] 圖4為本申請?zhí)峁┑奈谋厩榫w極性的識別裝置的另一結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0037] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于 本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0038] 見圖1,其示出了本發(fā)明實(shí)施例提供的文本情緒極性的識別方法的流程,具體包括 以下步驟:
[0039] 步驟S101 :獲取多條待識別文本。
[0040] 其中,待識別文本為從網(wǎng)絡(luò)中抓取到的文本,如微博、論壇、貼吧等,當(dāng)然,本實(shí)施 并不局限于網(wǎng)絡(luò)文本,還可以是其他各種載體中的信息文本,如報刊、雜志等。
[0041] 需要說明的是,待識別文本可以理解為一條語句,如"聽到昨晚發(fā)生的人群踩踏事 件,我感到非常悲痛",也就是說,本步驟中獲取到多條語句。
[0042]步驟S102 :利用預(yù)先構(gòu)建的分類器,分別確定每條所述待識別文本各自的多個極 性概率值。
[0043]其中,分類器是利用訓(xùn)練方法對訓(xùn)練集進(jìn)行學(xué)習(xí)訓(xùn)練生成的分類模型,可以對輸 入的待識別文本進(jìn)行分類。分類器自身可以識別出多個情緒類別,情緒類別也就是情緒極 性,如正極性情緒、中極性情緒以及負(fù)極性情緒。本步驟中,計(jì)算待識別文本在每種情緒類 別中的概率值,從而獲得多個極性概率值。可見,極性概率值表征的是待識別文本分別屬于 各個不同情緒類別的概率。
[0044] 需要說明的是,針對每個待識別文本,均計(jì)算在每種情緒類別中的概率值。從而, 每個待識別文本具有各自的多個極性概率值。例如,待識別文本分別為文本1及文本2,其 中,文本1的多個極性概率值為Pll、P12及P13,文本2的多個極性概率值為P21、P22及 P23〇
[0045] 步驟S103 :將各自的多個極性概率值中的最大值對應(yīng)的情緒極性確定為每條所 述待識別文本各自的情緒極性。
[0046] 其中,針對每個待識別文本,確定各自的多個極性概率值中的最大值,并確定出每 個最大值分別對應(yīng)的情緒極性,進(jìn)而,將各個情緒極性分別確定為各自的待識別文本的情 緒極性。需要說明的是,分類器計(jì)算出的極性概率值具有情緒極性標(biāo)簽,利用情緒極性標(biāo) 簽,可以確定出極性概率值對應(yīng)的情緒極性。
[0047] 例如,文本1的多個極性概率值為P11、P12及P13,最大值為P11,且最大值P11的 情緒極性標(biāo)簽為正情緒極性,進(jìn)而將正情緒極性確定為文本1的情緒極性。
[0048] 由以上的技術(shù)方案可知,本實(shí)施例提供的文本情緒極性的識別方法,利用預(yù)先構(gòu) 建的分類器,可以確定出待識別文本在不同情緒極性類別中的極性概率值,將最大極性概 率值對應(yīng)的情緒極性確定為待識別文本的情緒極性,從而確定出了待識別文本的情緒極 性。
[0
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
平潭县| 文成县| 南华县| 雅江县| 恩平市| 绵竹市| 九台市| 鄱阳县| 溆浦县| 青州市| 清河县| 辛集市| 萨嘎县| 德令哈市| 商丘市| 明溪县| 望谟县| 南宫市| 思南县| 抚州市| 平江县| 晋宁县| 陇南市| 迭部县| 灌阳县| 望城县| 讷河市| 三都| 龙陵县| 清河县| 山西省| 黑水县| 孙吴县| 怀仁县| 绍兴县| 黄冈市| 深圳市| 罗源县| 达孜县| 咸丰县| 屏东市|