用于通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的系統(tǒng)和方法
【專利摘要】本發(fā)明提出了一種新的方法,其構(gòu)思了各種系統(tǒng)和方法,以提供檢測、測量、聚合和規(guī)格化由一組用戶在社交網(wǎng)絡(luò)中對某個事件或話題所表達的情緒的能力,使得規(guī)格化的情緒真實地反映公眾對該特定事件或話題的情緒。此外,也可相對于基線情緒對所收集和測量的個體用戶在社交網(wǎng)絡(luò)中表達的情緒進行規(guī)格化,以便真實地反映個體用戶在其表達時的情緒。
【專利說明】用于通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的系統(tǒng)和 方法
[0001] 相關(guān)申請的交叉引用
[0002] 本申請要求于2011年10月26日提交的美國臨時專利申請No. 61/551,833和于 2012年10月25日提交的美國專利申請No. 13/660,533的優(yōu)先權(quán),并且據(jù)此以引用方式并 入本文。
【背景技術(shù)】
[0003] 社交媒體網(wǎng)絡(luò),例如Facebook、Twitter和Google+,近年來作為基于Web的通信 平臺呈指數(shù)級增長。數(shù)以億計的人每天都在使用各種形式的社交媒體網(wǎng)絡(luò)彼此通信和保持 聯(lián)系。因此,用戶在社交媒體網(wǎng)絡(luò)中發(fā)生的活動,例如在Twitter上張貼推文,已經(jīng)成為一 種現(xiàn)象,并且可收集它們以用于各種測量和分析。具體地,可通過其相應(yīng)的公開可用的應(yīng)用 編程接口(API)從社交網(wǎng)絡(luò)的社交數(shù)據(jù)源來檢索這些用戶活動數(shù)據(jù),對其進行索引、處理 并在本地存儲以用于進一步分析。
[0004] 這些從社交網(wǎng)絡(luò)實時收集的流數(shù)據(jù)與隨時間推移(overtime)收集和存儲的那些 數(shù)據(jù)一起提供了用于各種測量和分析的基礎(chǔ)。用于測量和分析的一些度量包括但不限于:
[0005] ?提及的次數(shù)-提及關(guān)鍵字、術(shù)語或鏈接的總次數(shù);
[0006] ?由影響者提及的次數(shù)-有影響力的用戶提及關(guān)鍵字、術(shù)語或鏈接的總次數(shù);
[0007] ?重要帖子提及的次數(shù)-已重新發(fā)布或包含鏈接的推文提及關(guān)鍵字、術(shù)語或鏈接 的總次數(shù);
[0008] ?速度-在先前的時間窗口(如七天)中,關(guān)鍵字、術(shù)語或鏈接"復(fù)制"(taking off)的程度。
[0009] 除了對數(shù)據(jù)內(nèi)容執(zhí)行上述測量和分析之外,分析用戶通過其在社交網(wǎng)絡(luò)中的活動 (如推文和帖子)表達的所聚合的情緒也同樣重要。作為非限制性實例,可由一組用戶在 一定時間段內(nèi)關(guān)于某個話題表達的推文的百分比來測量這種所聚合的情緒,分為積極、中 性和消極。盡管對用戶通過社交網(wǎng)絡(luò)表達的情緒進行的此類測量提供了對其看法/觀點 的實時計量,但此類測量可能由于各種因素而有偏差,所述各種因素包括但不限于最活躍, 從而最可能在社交網(wǎng)絡(luò)中表達其感受的用戶的類型、每個個體用戶表達的時機和優(yōu)選方式 等。因此,如測量的那樣,用戶在社交網(wǎng)絡(luò)中對某些問題或事件表達的情緒可能不是大多數(shù) 公眾情緒的真實和準確的反映。
[0010] 相關(guān)領(lǐng)域的上述實例以及與其相關(guān)的局限性旨在為例證性的而非排他性的。在閱 讀說明書并研究附圖后,相關(guān)領(lǐng)域的其他局限性將變得顯而易見。
【專利附圖】
【附圖說明】
[0011] 圖1示出了用以支持通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的一種系統(tǒng)圖示 的實例。
[0012] 圖2示出了用以支持通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的一種過程的流 程圖的實例。
【具體實施方式】
[0013] 在附圖的圖示中通過舉例而非限制的方式例示了該方法,其中類似附圖標記表示 類似元件。應(yīng)該指出的是,本公開中提到"一個"或"一些"實施例未必是同一實施例,并且 此類引用表示至少一個。
[0014] 本發(fā)明提出了一種新的方法,該方法設(shè)想了各種系統(tǒng)和方法以提供對一組用戶在 社交網(wǎng)絡(luò)中對于某個事件或話題表達的情緒進行檢測、測量、聚合和規(guī)格化的能力,使得規(guī) 格化的情緒真實地反映公眾對該特定事件或話題的情緒。在本文中,可基于表達用戶觀點 所在的社交網(wǎng)絡(luò)的一種或多種的自然偏差、所討論的事件或話題的性質(zhì)、以及用戶在社交 網(wǎng)絡(luò)中的活動時機,對用戶表達的所聚合的情緒的測量進行規(guī)格化。此外,也可相對于基線 情緒對所收集和測量的個體用戶在社交網(wǎng)絡(luò)中表達的情緒進行規(guī)格化,該基線情緒反映每 個個體用戶的自然傾向和/或在鏈接到個體用戶的其他內(nèi)容中表達的情緒,以便真實地反 映用戶在其表達時的情緒。
[0015] 如下文所提及,社交媒體網(wǎng)絡(luò)或社交網(wǎng)絡(luò)可以是任何可公開訪問的基于Web的平 臺或社區(qū),使它的用戶/成員能夠發(fā)貼、共享、交流以及與彼此進行交互。作為非限制性實 例,此類社交媒體網(wǎng)絡(luò)可以是但不限于Facebook、Google+、Tweeter、Linkedln、博客、論壇 或任何其他基于Web的社區(qū)。
[0016] 如下文所提及,用戶在社交媒體網(wǎng)絡(luò)中的活動包括但不限于發(fā)布推文、對推文進 行回復(fù)和/或轉(zhuǎn)發(fā)、發(fā)帖、評論其他用戶的帖子、發(fā)表觀點(如喜歡)、供稿、聯(lián)系(如添加其 他用戶為好友)、引用、鏈接到其他網(wǎng)站或應(yīng)用,或社交網(wǎng)絡(luò)中的任何其他活動。與創(chuàng)建時間 可能不會始終與內(nèi)容明確相關(guān)的典型Web內(nèi)容相比,用戶在社交網(wǎng)絡(luò)中的活動的一個獨有 特性是,存在與每個活動相關(guān)聯(lián)的明確時間戳,使得可以建立在社交網(wǎng)絡(luò)中的隨時間推移 的用戶活動的模式。
[0017] 圖1示出了支持通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的一種系統(tǒng)圖示的實 例。盡管圖示將組件示出為在功能上是獨立的,但此類示出僅用于說明性目的。顯而易見 的是,該圖中所描繪的組件可以任意組合或劃分成獨立的軟件、固件和/或硬件組件。此 夕卜,同樣顯而易見的是,無論此類組件如何組合或劃分,其都可以在相同的主機或多個主機 上執(zhí)行,并且其中多個主機可通過一個或多個網(wǎng)絡(luò)進行連接。
[0018] 在圖1的實例中,系統(tǒng)100包括至少數(shù)據(jù)收集引擎102和情緒分析引擎104。如本 文所用,術(shù)語"引擎"是指用于實現(xiàn)某一目的的軟件、固件、硬件或其他組件。引擎通常將包 括存儲于非易失性存儲器(也稱為輔助存儲器)中的軟件指令。在執(zhí)行軟件指令時,處理 器將軟件指令的至少一個子集加載到存儲器(也稱為主存儲器)中。處理器然后執(zhí)行存儲 器中的軟件指令。處理器可以是共享處理器、專用處理器、或者共享或?qū)S锰幚砥鞯慕M合。 典型的程序?qū)▽τ布M件(如I/O設(shè)備)的調(diào)用,這通常需要執(zhí)行驅(qū)動程序。驅(qū)動程 序可以被視為或不被視為引擎的一部分,但區(qū)別不是關(guān)鍵性的。
[0019] 在圖1的實例中,每個引擎都可以在一個或多個托管設(shè)備(主機)上運行。在本 文中,主機可以是計算設(shè)備、通信設(shè)備、存儲設(shè)備、或能夠運行軟件組件的任何電子設(shè)備。作 為非限制性實例,計算設(shè)備可以是但不限于膝上型PC、臺式PC、平板電腦、iPod、iPhone和 iPad、G〇〇gle的Android設(shè)備、PDA或服務(wù)器。存儲設(shè)備可以是但不限于硬盤驅(qū)動器、閃存 驅(qū)動器、或任何便攜式存儲設(shè)備。通信設(shè)備可以是但不限于移動電話。
[0020] 在圖1的實例中,數(shù)據(jù)收集引擎102和情緒分析引擎104均具有通信接口(未示 出),該通信接口是一個軟件組件,其使得引擎能夠遵循某些通信協(xié)議,例如TCP/IP協(xié)議, 通過一個或多個通信網(wǎng)絡(luò)(未示出)彼此相互通信。在本文中,通信網(wǎng)絡(luò)可以是但不限于 互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)、廣域網(wǎng)(WAN)、局域網(wǎng)(LAN)、無線網(wǎng)絡(luò)、藍牙、WiFi和移動通信網(wǎng)絡(luò)。網(wǎng)絡(luò) 的物理連接和通信協(xié)議是本領(lǐng)域的技術(shù)人員所熟知的。
[0021] 在圖1的實例中,數(shù)據(jù)收集引擎102通過周期性地采集社交網(wǎng)絡(luò)信息以收集來自 每個用戶的最新活動數(shù)據(jù)來收集關(guān)于用戶在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)??紤]到社交媒體網(wǎng) 絡(luò)中的巨大數(shù)量的可訪問數(shù)據(jù),數(shù)據(jù)收集引擎102可基于針對用戶的活動收集計劃表選擇 性地收集來自每個個體用戶的數(shù)據(jù)。如果未在信息采集的時刻根據(jù)用戶的活動收集計劃表 收集用戶的活動,則數(shù)據(jù)收集引擎102將跳過與該用戶相關(guān)的內(nèi)容并繼續(xù)移動到要根據(jù)他 /她的計劃表收集其活動的下一用戶。數(shù)據(jù)收集引擎102對數(shù)據(jù)的此類選擇性收集減少了 每輪信息采集所需的時間和資源,而不會損害(comprising)所收集數(shù)據(jù)的新鮮度。在一些 實施例中,數(shù)據(jù)收集引擎102可以運行和協(xié)調(diào)來自不同互聯(lián)網(wǎng)地址(IP)的多個信息采集器 以便收集盡可能多的數(shù)據(jù)。社交媒體信息采集引擎106也可最大化每次(HTTP)請求收集 的新數(shù)據(jù)的量。
[0022] 在一些實施例中,數(shù)據(jù)收集引擎102可基于與用戶在社交網(wǎng)絡(luò)中的活動相關(guān)聯(lián)的 時間戳,針對每個用戶來建立隨時間推移的活動分布模式/模型。這種隨時間推移的活動 分布模式可反映出每個個體用戶在社交網(wǎng)絡(luò)中何時最活躍或最不活躍以及用戶在社交網(wǎng) 絡(luò)中的活動頻率,并可用于為用戶制定活動收集計劃表。作為非限制性實例,用戶可能在晚 上8-12點之間在社交網(wǎng)絡(luò)中最活躍,而在清晨期間可能最不活躍,或者用戶在周末而非工 作日最活躍。
[0023] 在一些實施例中,數(shù)據(jù)收集引擎102還可以確定在發(fā)生某些事件時每個個體用戶 是否和/或何時可能最活躍,所述某些事件例如是用戶追隨的某項體育賽事或產(chǎn)品新聞 (如iPhone發(fā)布)。作為另外一種選擇,數(shù)據(jù)收集引擎102可以確定用戶的活動與該用戶 在社交網(wǎng)絡(luò)中聯(lián)系的一個或多個好友的活動密切相關(guān)。作為非限制性實例,如果該用戶的 一個或多個好友變得活躍,例如開始一個有趣的討論或參與在線游戲,還可能使用戶也主 動參與進去。
[0024] 在一些實施例中,數(shù)據(jù)收集引擎102可利用由社交網(wǎng)絡(luò)提供的應(yīng)用編程接口 (API)收集關(guān)于用戶在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。作為非限制性實例,由Facebook提供的 OpenGraph API暴露了社交網(wǎng)絡(luò)中的多個資源(即與用戶活動相關(guān)的數(shù)據(jù)),其中每種資源 都具有ID,并且內(nèi)省法可用于了解其上可用的類型和方法。在本文中,ID可以是用戶名和 /或編號。由于所有資源都具有編號的ID并且只有部分資源具有命名的ID,因此僅使用編 號的ID來指代資源。
[0025] 在圖1的實例中,情緒分析引擎104通過多個種情緒文本計分方案檢測和識別用 戶在所收集的他們在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中表達的關(guān)于/對于某個特定事件或話題 的情緒,所述計分方案考慮了通常人們在社交媒體網(wǎng)絡(luò)中,尤其在Twitter中如何表達自 己的方式和細微差別。在Twitter的非限制性實例中,在傳統(tǒng)情緒測量技術(shù)無法很好處理 的推文的140字符約束之內(nèi),人們表達自己的方式存在顯著差異?;跀?shù)據(jù)收集引擎102 實時收集的并隨時間推移存儲的海量數(shù)據(jù)的分析和測試,情緒分析引擎104能夠識別推文 中的多個"推客用語"(twitterisms),即在所收集的數(shù)據(jù)中的情緒表達的具體特征,所述具 體特征不僅指示人們對某個事件或某些事物的感受,而且也是人們?nèi)绾卧谥T如Twitter等 社交網(wǎng)絡(luò)中使用推文表達自己所特有的。由多個情緒文本計分方案利用這些識別的情緒表 達的特征來檢測用戶在社交網(wǎng)絡(luò)中表達的情緒。在本文中,每位用戶的情緒以非常積極、積 極、平常、消極、非常消極來表征。
[0026] -旦基于所收集的用戶活動檢測到了用戶的情緒,情緒分析引擎104將評估和聚 合用戶對特定事件或話題的情緒(積極或消極情緒)。作為非限制性實例,在新的iPhone發(fā) 布時間前后分析Twitter上與iPhone相關(guān)的推文可以表明,21%的用戶是積極的,而18% 的用戶是消極的。如果將該時間段擴展到發(fā)布之后的一個星期或一個月,社交情緒分數(shù)可 能指向不同的情緒分數(shù)(用戶積極或消極的更高百分比),因為用戶有更多時間體驗新的 iPhone〇
[0027] 在一些實施例中,情緒分析引擎104相對于基線情緒對用戶的所聚合的情緒和/ 或每個個體用戶的情緒進行規(guī)格化,所述基線情緒考慮了一個或多個因素/偏差,其包括 但不限于用戶表達觀點所在的社交網(wǎng)絡(luò)的自然偏差、所討論的事件或話題的性質(zhì)、以及用 戶在社交網(wǎng)絡(luò)中的活動的時機。在本文中,各種統(tǒng)計度量,例如中數(shù)、平均數(shù)、標準偏差、相 關(guān)度或這些度量的任意組合,可由情緒分析引擎104使用以對用戶的隨時間推移而測量的 情緒進行規(guī)格化。為了獲得每個個體用戶和/或公眾對特定事件的情緒的準確測量,此類 情緒規(guī)格化是必要的。此外,情緒分析引擎104可相對于每個個體用戶的自然傾向和/或在 鏈接到個體用戶的其他內(nèi)容中表達的情緒,對每個個體用戶的所測量的情緒進行規(guī)格化。
[0028] 在一些實施例中,情緒分析引擎104基于每個個體用戶或一組用戶的情緒的規(guī)格 化測量,計算對于事件或話題的社交情緒分數(shù)。在本文中,對于事件的社交情緒分數(shù)代表一 個或多個個體用戶在社交網(wǎng)絡(luò)中對當前事件和/或在一定時間段內(nèi)(根據(jù)被分析的用戶活 動的時間戳)表達的規(guī)格化情緒,其中這種社交情緒分數(shù)反映個體用戶的真實情緒或公眾 的情緒。
[0029] 在發(fā)布新iPhone前后分析用戶情緒的前一實例中,基于用戶在Twitter上的推文 所測量的情緒對于iPhone發(fā)布而言僅僅稍顯積極(21 %積極,18%消極)。不過,由于在 Twitter上表達的情緒往往比公眾的情緒更消極,因此在情緒分析引擎104相對于Twitter 的消極偏差進行規(guī)格化時,稍顯積極的情緒讀數(shù)實際上要積極得多。
[0030] 作為另一個非限制性實例,用戶在Twitter上表達的最強烈的消極情緒往往針對 與政治相關(guān)的事物,而最強烈的積極情緒不像消極情緒那樣強烈,并且集中在無爭議的話 題上,例如旅行、攝影等。因此,在對情緒分析引擎104所測量的情緒分數(shù)進行規(guī)格化時必 須要考慮到這一點,并且在圍繞政治問題的大部分情緒呈壓倒性消極的情況下進行規(guī)格化 時,政治事件稍顯積極的讀數(shù)事實上可能指示該事件深受歡迎。
[0031] 作為另一個非限制性實例,如果用戶1在遣詞造句時往往更積極(如他/她經(jīng)常 會講"太好了"),而用戶2在遣詞造句時往往更保守(如他/她經(jīng)常會講"還可以"),那么 在由情緒分析引擎104相對于其消極偏差進行規(guī)格化時,用戶2的積極表達(例如"太好 了")實際上相當積極,而在相對于其積極偏差進行規(guī)格化時,用戶1的相同表達可能僅僅 是中性的。
[0032] 圖2示出了支持通過社交網(wǎng)絡(luò)進行情緒檢測、測量和規(guī)格化的一種過程的流程圖 的實例。盡管此圖示為了例示目的按照特定順序示出了功能步驟,但該過程不限于步驟的 任何特定順序或排列。相關(guān)領(lǐng)域的技術(shù)人員將會知道,可以通過各種方式省略、重新排列、 組合和/或調(diào)整此圖示中描繪的各個步驟。
[0033] 在圖2的實例中,流程圖200開始于方框202,在該方框202中收集關(guān)于多個用戶 在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。流程圖200繼續(xù)至方框204,在該方框204中檢測并測量如在 所收集的用戶在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中所表達的他們中的每一個對某個事件或話題 的情緒。流程圖200繼續(xù)至方框206,在該方框206中任選地聚合所檢測到的多個用戶對事 件或話題的情緒。流程圖200結(jié)束于方框208,在該方框208中相對于基線情緒對用戶的所 聚合的情緒和/或每個個體用戶的情緒進行規(guī)格化,使得規(guī)格化的情緒真實地反映公眾和 /或個體用戶對事件或話題的情緒。
[0034] 對于計算機領(lǐng)域中的技術(shù)人員顯而易見的是,可利用本公開的教導(dǎo)編程的常規(guī)通 用或?qū)S脭?shù)字計算機或一個或多個微處理器來實施一個實施例。對于軟件領(lǐng)域的技術(shù)人員 顯而易見的是,熟練的程序員基于本公開的教導(dǎo)能夠容易地準備適當?shù)能浖幋a。對于本 領(lǐng)域的技術(shù)人員顯而易見的是,也可通過制備集成電路或?qū)⒊R?guī)組件電路的適當網(wǎng)絡(luò)進行 互聯(lián)來實施本發(fā)明。
[0035] -個實施例包括計算機程序產(chǎn)品,該計算機程序產(chǎn)品是在其上/其中存儲有指令 的一種或多種機器可讀介質(zhì),其可用于對一個或多個主機進行編程以執(zhí)行本文給出的任何 特征。機器可讀介質(zhì)可包括但不限于一種或多種磁盤,包括軟盤、光盤、DVDXD-R0M、微驅(qū)動 器和磁光盤、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、閃存設(shè)備、磁卡或光卡、納米系統(tǒng)(包括 分子存儲器1C),或適于存儲指令和/或數(shù)據(jù)的任何類型的介質(zhì)或設(shè)備。本發(fā)明包括存儲在 一種或多種計算機可讀介質(zhì)中的任一種上的軟件,以用于控制通用或?qū)S糜嬎銠C或微處理 器的硬件,并用于使計算機或微處理器與人類觀察者或利用本發(fā)明的結(jié)果的其他機構(gòu)進行 交互。此類軟件可包括但不限于設(shè)備驅(qū)動程序、操作系統(tǒng)、執(zhí)行環(huán)境/容器和應(yīng)用。
【權(quán)利要求】
1. 一種系統(tǒng),包括: 數(shù)據(jù)收集引擎,所述數(shù)據(jù)收集引擎在運行時收集關(guān)于多個用戶在社交網(wǎng)絡(luò)中的活動的 數(shù)據(jù); 情緒分析引擎,所述情緒分析引擎在運行時, 檢測并測量如在所收集的所述多個用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中所表達的 他們中的每一個對某個事件或話題的情緒; 聚合所檢測到的所述多個用戶對所述事件或話題的情緒; 相對于基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,使得規(guī)格化的情緒真實地反 映公眾對所述事件或話題的情緒。
2. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述社交網(wǎng)絡(luò)是可公開訪問的基于Web的平臺或社區(qū),所述平臺或社區(qū)使得其用戶/ 成員能夠發(fā)帖、共享、交流以及與彼此進行交互。
3. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述社交網(wǎng)絡(luò)是以下之一 :Facebook、Google+、Tweeter、Linkedln、博客、論壇或任何 其他基于Web的社區(qū)。
4. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述用戶在社交媒體網(wǎng)絡(luò)中的活動包括以下中的一者或多者:發(fā)布推文、對推文進行 回復(fù)和/或轉(zhuǎn)發(fā)、發(fā)帖、評論其他用戶的帖子、發(fā)表觀點、供稿、聯(lián)系、引用、鏈接到其他網(wǎng)站 或應(yīng)用、或所述社交網(wǎng)絡(luò)中的任何其他活動。
5. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述數(shù)據(jù)收集引擎通過周期性地采集所述社交網(wǎng)絡(luò)的信息以收集來自所述用戶的最 新活動數(shù)據(jù),來收集關(guān)于所述用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。
6. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述數(shù)據(jù)收集引擎通過利用由所述社交網(wǎng)絡(luò)提供的應(yīng)用編程接口(API)來收集關(guān)于 所述用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。
7. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述情緒分析引擎通過多個情緒文本計分方案檢測并識別所述用戶在所收集的他們 在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中表達的情緒,所述情緒文本計分方案考慮了人們在社交 媒體網(wǎng)絡(luò)中表達自己的方式。
8. 根據(jù)權(quán)利要求7所述的系統(tǒng),其中: 所述多個情緒文本計分方案利用在所收集的數(shù)據(jù)中識別的情緒表達的具體特征來檢 測所述用戶在所述社交網(wǎng)絡(luò)中表達的情緒。
9. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述情緒分析引擎相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述 基線情緒考慮了表達所述用戶觀點所在的所述社交網(wǎng)絡(luò)的自然偏差。
10. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述情緒分析引擎相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述 基線情緒考慮了所述事件或話題的性質(zhì)。
11. 根據(jù)權(quán)利要求1所述的方法,其中: 所述情緒分析引擎相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述 基線情緒考慮了所述用戶在所述社交網(wǎng)絡(luò)中的活動時機。
12. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 所述情緒分析引擎基于所述用戶的所述情緒的規(guī)格化測量,計算針對所述事件或話題 的社交情緒分數(shù)。
13. -種系統(tǒng),包括: 數(shù)據(jù)收集引擎,所述數(shù)據(jù)收集引擎在運行時收集關(guān)于用戶在社交網(wǎng)絡(luò)中的活動的數(shù) 據(jù); 情緒分析引擎,所述情緒分析引擎在運行時, 檢測并測量如在所收集的所述用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中所表達的所述 用戶對某個事件或話題的情緒; 相對于基線情緒對所述用戶的所測量的情緒進行規(guī)格化,使得規(guī)格化的情緒真實地反 映所述用戶對所述事件或話題的真實情緒。
14. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述數(shù)據(jù)收集引擎基于針對所述用戶的活動收集計劃表選擇性地收集來自所述用戶 的數(shù)據(jù)。
15. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述數(shù)據(jù)收集引擎基于與所述用戶在所述社交網(wǎng)絡(luò)中的活動相關(guān)聯(lián)的時間戳來建立 所述用戶的隨時間推移的活動分布模式。
16. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述數(shù)據(jù)收集引擎確定在發(fā)生某些事件時所述用戶是否和/或何時可能最活躍。
17. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述情緒分析引擎相對于在鏈接到個體用戶的其他內(nèi)容中表達的情緒來對所述用戶 的所測量的情緒進行規(guī)格化。
18. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中: 所述情緒分析引擎相對于所述基線情緒對所述用戶的所測量的情緒進行規(guī)格化,所述 基線情緒考慮了所述用戶的自然傾向。
19. 一種方法,包括: 收集關(guān)于多個用戶在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù); 檢測并測量如在所收集的所述多個用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中所表達的 他們中的每一個對某個事件或話題的情緒; 聚合所檢測到的所述多個用戶對所述事件或話題的情緒; 相對于基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,使得規(guī)格化的情緒真實地反 映公眾對所述事件或話題的情緒。
20. 根據(jù)權(quán)利要求19所述的方法,還包括: 通過周期性地采集所述社交網(wǎng)絡(luò)的信息以收集來自所述用戶的最新活動數(shù)據(jù),來收集 關(guān)于所述用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。
21. 根據(jù)權(quán)利要求19所述的方法,還包括: 通過利用由所述社交網(wǎng)絡(luò)提供的應(yīng)用編程接口(API)來收集關(guān)于所述用戶在所述社 交網(wǎng)絡(luò)中的活動的數(shù)據(jù)。
22. 根據(jù)權(quán)利要求19所述的方法,還包括: 通過多個情緒文本計分方案檢測并識別所述用戶在所收集的他們在所述社交網(wǎng)絡(luò)中 的活動的數(shù)據(jù)中表達的情緒,所述情緒文本計分方案考慮了人們在社交媒體網(wǎng)絡(luò)中表達自 己的方式。
23. 根據(jù)權(quán)利要求19所述的方法,還包括: 利用在所收集的數(shù)據(jù)中識別的情緒表達的具體特征來檢測所述用戶在所述社交網(wǎng)絡(luò) 中表達的情緒。
24. 根據(jù)權(quán)利要求19所述的方法,還包括: 相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述基線情緒考慮了表 達所述用戶觀點所在的所述社交網(wǎng)絡(luò)的自然偏差。
25. 根據(jù)權(quán)利要求19所述的方法,還包括: 相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述基線情緒考慮了所 述事件或話題的性質(zhì)。
26. 根據(jù)權(quán)利要求19所述的方法,還包括: 相對于所述基線情緒對所述用戶的所聚合的情緒進行規(guī)格化,所述基線情緒考慮了所 述用戶在所述社交網(wǎng)絡(luò)中的活動時機。
27. 根據(jù)權(quán)利要求19所述的方法,還包括: 基于所述用戶的所述情緒的規(guī)格化測量,計算針對所述事件或話題的社交情緒分數(shù)。
28. -種方法,包括: 收集關(guān)于用戶在社交網(wǎng)絡(luò)中的活動的數(shù)據(jù); 檢測并測量如在所收集的所述用戶在所述社交網(wǎng)絡(luò)中的活動的數(shù)據(jù)中所表達的所述 用戶對某個事件或話題的情緒; 相對于基線情緒對所述用戶的所測量的情緒進行規(guī)格化,使得所述規(guī)格化的情緒真實 地反映所述用戶對所述事件或話題的真實情緒。
29. 根據(jù)權(quán)利要求28所述的方法,還包括: 基于針對所述用戶的活動收集計劃表,選擇性地收集來自所述用戶的數(shù)據(jù)。
30. 根據(jù)權(quán)利要求28所述的方法,還包括: 基于與所述用戶在所述社交網(wǎng)絡(luò)中的活動相關(guān)聯(lián)的時間戳,建立所述用戶的隨時間推 移的活動分布模式。
31. 根據(jù)權(quán)利要求28所述的方法,還包括: 確定當發(fā)生某些事件時所述用戶是否和/或何時可能最活躍。
32. 根據(jù)權(quán)利要求28所述的方法,還包括: 相對于在鏈接到個體用戶的其他內(nèi)容中表達的情緒,對所述用戶的所測量的情緒進行 規(guī)格化。
33. 根據(jù)權(quán)利要求28所述的方法,還包括: 相對于所述基線情緒對所述用戶的所測量的情緒進行規(guī)格化,所述基線情緒考慮了所 述用戶的自然傾向。
【文檔編號】G06F17/30GK104145264SQ201280059775
【公開日】2014年11月12日 申請日期:2012年10月26日 優(yōu)先權(quán)日:2011年10月26日
【發(fā)明者】R·A·戈時, S·P·曼雷 申請人:托普西實驗室股份有限公司