專利名稱:數(shù)據(jù)分析設備和方法
技術(shù)領域:
本發(fā)明涉及數(shù)據(jù)分析領域,具體涉及一種應用于客戶服務中心的數(shù)據(jù)分析設備和方法。
背景技術(shù):
電信、網(wǎng)店、銀行、保險等多個行業(yè)都具有各自的客服中心??头行慕?jīng)常接收到客戶對企業(yè)服務/產(chǎn)品的投訴及咨詢,這些投訴/咨詢往往是自然語言的形式,例如“如何開通GPRS ? ”、“我的GPRS上網(wǎng)怎么這么慢,你們也太過分了 ! ”。客服中心可以針對客戶自然語言形式的投訴/咨詢數(shù)據(jù),挖掘出客戶對服務/產(chǎn)品的意見。通過對客戶的投訴/咨詢數(shù)據(jù)的分析,可以幫助企業(yè)發(fā)現(xiàn)哪些客戶對服務/產(chǎn)品感興趣或不感興趣,從而滿足客戶個性化需求,為客戶提供更好的服務。當前,已經(jīng)存在一些相關(guān)的數(shù)據(jù)分析方法。其中一些方法可以從客戶的投訴/咨詢數(shù)據(jù)中分析出客戶的顯式需求(即,客戶在問什么)。例如,從“GPRS還有流量,為什么還要扣費”中分析出“業(yè)務=GPRS,問題=扣費”。但是,當前的方法不能分析客戶的隱含需求并基于分析結(jié)果提供進一步的個性化業(yè)務。另一些方法可以基于客戶的購買歷史/基本信息等結(jié)構(gòu)化數(shù)據(jù)提供個性化業(yè)務,但不能基于客戶的投訴/咨詢數(shù)據(jù)提供個性化業(yè)務。T. Nasukawa在IBM SYSTEMS JOURNAL發(fā)表的論文中提到了一種從客戶的投訴/咨詢數(shù)據(jù)中分析客戶顯式需求的方法,但不能分析客戶的隱含需求并基于分析結(jié)果來提供個性化業(yè)務。專利文獻W02002073331A2描述了一種從客戶的投訴/咨詢數(shù)據(jù)中分析客戶顯式需求的方法,但同樣不能分析客戶的隱含需求并基于分析結(jié)果來提供個性化業(yè)務。專利文獻US7536002B1描述了一種基于客戶的賬戶/行為數(shù)據(jù)來進行個性化業(yè)務的方法,但不能基于客戶的投訴/咨詢數(shù)據(jù)來提供個性化業(yè)務。因此,存在對來自客戶的投訴/咨詢數(shù)據(jù)進行分析以獲取用戶的隱含需求、并提供個性化業(yè)務的需求。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提出了一種對客戶的投訴/咨詢數(shù)據(jù)進行分析以獲得客戶的隱含需求,并可以提供進一步的個性化業(yè)務的數(shù)據(jù)分析設備和方法。在本發(fā)明中,“隱含需求”的定義與現(xiàn)有技術(shù)中的“顯式需求”有所不同。“顯式需求”是指僅理解用戶表面上的需求,即與用戶在咨詢或投訴的業(yè)務有關(guān)的需求;而“隱含需求”是指用戶的咨詢/投訴背后所隱藏的信息,如用戶對所投訴的業(yè)務的價格敏感度、接受度等等,下文對此有更加詳細的描述。即,“隱含需求”能夠更加準確和深入的信息。根據(jù)本發(fā)明的一個方面,提供了一種數(shù)據(jù)分析設備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題;隱含特征計算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務、主題和子主題來計算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。優(yōu)選地,該隱含特征計算單元包括敏感度計算子單元,計算客戶的價格敏感度和質(zhì)量敏感度;使用水平計算子單元,計算客戶對所識別的業(yè)務的使用水平;接受度計算子單元,計算客戶對所識別的業(yè)務的接受度;以及不滿原因獲取子單元,獲取客戶對所識別的業(yè)務的不滿原因。優(yōu)選地,該數(shù)據(jù)分析設備還包括隱含需求統(tǒng)計單元,對客戶的隱含需求進行統(tǒng)計。更優(yōu)選地,該隱含需求統(tǒng)計單元進行以下至少一項統(tǒng)計業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計和客戶分群統(tǒng)計。優(yōu)選地,該數(shù)據(jù)分析設備還包括個性化業(yè)務推薦單元,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。更優(yōu)選地,個性化業(yè)務推薦單元提供以下至少一項業(yè)務更高質(zhì)量的業(yè)務、價格更實惠的業(yè)務、升級現(xiàn)有業(yè)務、語義相關(guān)業(yè)務、提升現(xiàn)有業(yè)務價值和挽留業(yè)務。優(yōu)選地,該數(shù)據(jù)分析設備還包括個性化業(yè)務效果評價單元,根據(jù)客戶對個性化業(yè)務推薦單元推薦的業(yè)務的反饋,評價個性化業(yè)務推薦的效果。根據(jù)本發(fā)明的另一個方面,提供了一種數(shù)據(jù)分析方法,包括基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題;基于語義知識和情緒字典, 根據(jù)所識別的業(yè)務、主題和子主題來計算客戶的隱含特征;以及將客戶的隱含特征匯總以獲取客戶的隱含需求。優(yōu)選地,隱含特征包括客戶的價格敏感度和質(zhì)量敏感度、客戶對所識別的業(yè)務的使用水平、客戶對所識別的業(yè)務的接受度和客戶對所識別的業(yè)務的不滿原因。優(yōu)選地,該數(shù)據(jù)分析方法還包括對客戶的隱含需求進行統(tǒng)計。更優(yōu)選地,該統(tǒng)計包括以下至少一項業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計和客戶分群統(tǒng)計。優(yōu)選地,該數(shù)據(jù)分析方法還包括根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。 更優(yōu)選地,個性化業(yè)務包括以下至少一項業(yè)務更高質(zhì)量的業(yè)務、價格更實惠的業(yè)務、升級現(xiàn)有業(yè)務、語義相關(guān)業(yè)務、提升現(xiàn)有業(yè)務價值和挽留業(yè)務。優(yōu)選地,該數(shù)據(jù)分析方法還包括根據(jù)客戶對所推薦的個性化業(yè)務的反饋,評價個性化業(yè)務推薦的效果。根據(jù)本發(fā)明的數(shù)據(jù)分析設備和方法可以根據(jù)來自客戶的投訴/咨詢數(shù)據(jù)準確地理解客戶的隱含需求。此外,還可以根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。因此, 本發(fā)明能夠更加準確地識別客戶的需求并提供具有針對性的服務,從而極大地提升了客戶的使用感受。
通過下文結(jié)合附圖的詳細描述,本發(fā)明的上述和其它特征將會變得更加明顯,其中圖1是示出了根據(jù)本發(fā)明第一實施例的數(shù)據(jù)分析設備的框圖;圖2是示出了投訴/咨詢數(shù)據(jù)的具體示例的示意圖;圖3是示出了根據(jù)本發(fā)明第一實施例的本體庫單元中存儲的語義知識的示例的示意圖;圖4是示出了根據(jù)本發(fā)明第一實施例的語言庫單元中存儲的語言模型的示例的示意圖;圖5是示出了根據(jù)本發(fā)明第一實施例的情緒字典單元中存儲的關(guān)系表的示例的示意圖;圖6是詳細示出圖1中的隱含特征計算單元的內(nèi)部結(jié)構(gòu)的框圖;圖7是示出了根據(jù)本發(fā)明第一實施例的識別單元執(zhí)行業(yè)務、主題和子主題識別的示意圖;圖8是示出了根據(jù)本發(fā)明第一實施例的敏感度計算子單元計算客戶的敏感度的示意圖;圖9是示出了根據(jù)本發(fā)明第一實施例的使用水平計算子單元計算客戶的使用水平的示意圖;圖10是示出了根據(jù)本發(fā)明第一實施例的接受度計算子單元計算客戶的接受度的示意圖;圖11是示出了根據(jù)本發(fā)明第一實施例的不滿原因獲取子單元獲取客戶的不滿原因的示意圖;圖12是示出了根據(jù)本發(fā)明第一實施例的隱含需求獲取單元獲取隱含需求的示意圖;圖13是示出了根據(jù)本發(fā)明第二實施例的數(shù)據(jù)分析設備的框圖;圖14是示出了根據(jù)本發(fā)明第二實施例的隱含需求統(tǒng)計單元執(zhí)行隱含需求統(tǒng)計的示意圖;圖15是示出了根據(jù)本發(fā)明第三實施例的數(shù)據(jù)分析設備的框圖;圖16是示出了根據(jù)本發(fā)明第三實施例的個性化業(yè)務推薦單元所推薦的個性化業(yè)務的示意圖;圖17是示出了根據(jù)本發(fā)明第三實施例的個性化業(yè)務推薦單元推薦個性化業(yè)務的示意圖;圖18是示出了根據(jù)本發(fā)明第四實施例的數(shù)據(jù)分析設備的框圖;圖19是示出了根據(jù)本發(fā)明第四實施例的個性化業(yè)務效果評價單元執(zhí)行個性化業(yè)務推薦效果評價的示意圖;以及圖20是示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)分析方法的流程圖。
具體實施例方式下面,通過結(jié)合附圖對本發(fā)明的具體實施例的描述,本發(fā)明的原理和實現(xiàn)將會變得明顯。應當注意的是,本發(fā)明不應局限于下文所述的具體實施例。另外,為了簡便起見, 省略了對公知元件的描述。首先,結(jié)合附圖1-18來描述根據(jù)本發(fā)明的若干實施例的數(shù)據(jù)分析設備。第一實施例圖1是示出了根據(jù)本發(fā)明第一實施例的數(shù)據(jù)分析設備1的框圖。如圖1所示,本實施例中的數(shù)據(jù)分析設備1包括識別單元210、隱含特征計算單元200和隱含需求獲取單元沈0。識別單元210輸入是來自客戶的投訴/咨詢數(shù)據(jù),該數(shù)據(jù)至少包括客戶的投訴 /咨詢時間、客戶編號和投訴/咨詢的內(nèi)容。其中,投訴/咨詢的內(nèi)容是以自然語言的形式描述的。例如,圖2示出了投訴/咨詢數(shù)據(jù)的一個具體示例,其中某條投訴/咨詢數(shù)據(jù)是 “2010/06/0518:20:15,客戶135XXXX1234提交了一條投訴/咨詢,內(nèi)容是,怎么飛信經(jīng)常無法成功登陸呢’”。如圖1所示,在本實施例中,存儲設備10包括本體庫單元110,用于存儲企業(yè)客服中心的語義知識;語言庫單元120,用于存儲理解投訴/咨詢數(shù)據(jù)的語言模型;以及情緒字典單元130,用于存儲各個情緒詞語及其屬于各種情緒的概率關(guān)系表。下面結(jié)合附圖3-5 詳細說明各個單元的結(jié)構(gòu)和功能。本體庫單元110存儲客服中心的語義知識。其中,語義知識包括兩部分類別樹和主題樹。類別樹是存儲所有的服務或產(chǎn)品的樹狀結(jié)構(gòu),由類別和實例組成。其中,實例是葉子結(jié)點,類別是非葉子結(jié)點。每個實例屬于一個類別,小類別還可以屬于一個大類別。圖3 中示出了某個電信行業(yè)的客服中心類別樹的例子,其包括某電信運營商的所有業(yè)務及業(yè)務類別。例如,如圖3上半部分所示,所有業(yè)務分為上網(wǎng)類業(yè)務、彩鈴類業(yè)務等,其中上網(wǎng)類業(yè)務進一步包括GPRS、G3上網(wǎng)等業(yè)務。主題樹是存儲所有服務或產(chǎn)品的相關(guān)主題和子主題的樹狀結(jié)構(gòu),由類別、主題和子主題組成。每個類別可以定義一組主題,用來描述該類別的各個方面。一個主題又可以進一步細分為多個子主題。屬于某類別的所有子類別或?qū)嵗梢岳^承該類別的主題和子主題。圖3中示出了某個電信行業(yè)客服中心主題樹的例子,其包括某電信運營商各業(yè)務類別的主題及子主題。例如,如圖3下半部分所示,上網(wǎng)類業(yè)務包括的主題有“使用”、“資費”、 “優(yōu)惠”等,“資費”進一步包括的子主題有“資費標準”和“錯誤扣費”,這些主題和子主題可以適用于所有的上網(wǎng)類業(yè)務,如GPRS、G3上網(wǎng)等。本體庫單元110中存儲的信息可以手工地生成,或采用本領域中其他的公知方法生成。為了簡便起見,本文省略了對本體庫單元110的具體生成過程的描述。 語言庫單元120存儲用于分析投訴/咨詢內(nèi)容的語言模型,具體包括兩部分業(yè)務術(shù)語映射規(guī)則和子主題提取規(guī)則。客戶的投訴/咨詢數(shù)據(jù)中可能不直接出現(xiàn)業(yè)務的名稱,而是以其他術(shù)語出現(xiàn)。例如“充100送30”對應的業(yè)務是“充值優(yōu)惠”,“短號網(wǎng)”對應的業(yè)務是“短號集群網(wǎng)”。業(yè)務術(shù)語映射規(guī)則使用靈活的文法方式來描述各業(yè)務術(shù)語與業(yè)務的對應關(guān)系。每條業(yè)務術(shù)語映射規(guī)則由術(shù)語文法和業(yè)務名稱組成,其含義為“當業(yè)務術(shù)語和某術(shù)語文法匹配時,則為該術(shù)語文法對應的業(yè)務”。在術(shù)語文法中,定義了一些特殊的符號“<X>”指此處可以出現(xiàn)的詞;“<X1 |X2 I…〉”指此處可以出現(xiàn)XI,X2等詞之一;“< ?數(shù)字 >”指此處可以是任意數(shù)字;“ [m-n] ”指的是此處可以出現(xiàn)介于m到η之間的任意一個字符;{k}指的是前面的詞需要出現(xiàn)k遍。圖4示出了客服中心業(yè)務術(shù)語映射規(guī)則的例子。例如,業(yè)務術(shù)語“充100送30”可以與規(guī)則“〈充>< 數(shù)字 >< 贈I送>< 數(shù)字 >—充值優(yōu)惠”匹配,其對應的業(yè)務是“充值優(yōu)惠”。業(yè)務術(shù)語“GS13661209810”可以與規(guī)則“GS[l-9]
{10}—查詢歸屬地”匹配, 其對應的業(yè)務是“查詢歸屬地”。子主題提取規(guī)則由特征詞序列和子主題組成,其含義為“當客戶的投訴/咨詢內(nèi)容中出現(xiàn)某特征詞序列時,則為該特征詞序列對應的子主題”。在特征詞序列中定義了一些特殊的符號“<X>”此處可以出現(xiàn)的詞;“〈XIIX2 I…〉”指此處可以出現(xiàn)XI,X2等詞之一;“ ; ”是不同特征詞之間的間隔符;“ [] ”指的是在“[”和“]”中間的內(nèi)容可有可無。圖4示出了某個電信行業(yè)客服中心子主題提取規(guī)則的例子。例如,客戶投訴/咨詢內(nèi)容“GPRS上網(wǎng)怎么這么慢”可以與“< 上網(wǎng) > ;< 慢I不快 > —上網(wǎng)速度”匹配,其對應的子主題是“上網(wǎng)速度”。語言庫單元120中存儲的信息可以手工地生成,或采用本領域中其他的公知方法生成。為了簡便起見,本文省略了對語言庫單元120的具體生成過程的描述。情緒字典單元130存儲各個情緒詞及其屬于各種情緒類型的概率的關(guān)系表。圖5 示出了情緒字典單元130的例子。例如,如圖5所示,情緒詞“過分”屬于憤怒的概率是0. 8, 屬于失望的概率是0. 2,而情緒詞“滿意”屬于高興的概率是1。情緒字典單元130中存儲的信息可以手工地生成,或采用本領域中其他的公知方法生成。為了簡便起見,本文省略了對情緒字典單元130的具體生成過程的描述?;氐綀D1,識別單元210基于本體庫單元110和語言庫單元120中存儲的信息,從每條投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題的名稱。具體地,識別單元210首先從投訴/咨詢數(shù)據(jù)中提取出業(yè)務術(shù)語,其關(guān)鍵在于確定業(yè)務術(shù)語在投訴/咨詢數(shù)據(jù)中的左右邊界。例如,其具體過程可以包括首先收集一組投訴/咨詢數(shù)據(jù)作為訓練語料,并進行分詞, 轉(zhuǎn)換成CRF模型可訓練的文件格式,人工標注每個詞的標簽(B_NP代表術(shù)語的開始,I_NP代表術(shù)語的中間或結(jié)尾,NN代表非術(shù)語詞);然后用CRF工具訓練出一個模型;接下來,對投訴/咨詢數(shù)據(jù)進行分詞,基于訓練模型得到各詞的標簽;最后,根據(jù)各詞的標簽,得到業(yè)務術(shù)語(依據(jù)業(yè)務術(shù)語中各詞的標簽序列是“B_NP I_NP I_NP…I_NP”)。接下來,識別單元210從投訴/咨詢內(nèi)容中識別出業(yè)務名稱。例如,其具體過程可以包括將業(yè)務術(shù)語與語言庫單元120中各個業(yè)務映射規(guī)則的術(shù)語文法進行匹配,匹配方法是檢查業(yè)務術(shù)語中包含的各詞是否在術(shù)語文法的相應位置;若匹配了某項映射規(guī)則,則將該規(guī)則的業(yè)務名稱作為業(yè)務識別結(jié)果。然后,識別單元210從投訴/咨詢內(nèi)容中識別出子主題名稱。具體過程可以包括 將投訴/咨詢數(shù)據(jù)與語言庫單元120中各個子主題提取規(guī)則的特征詞序列進行匹配,匹配方法是檢查特征詞序列中的各個特征詞是否出現(xiàn)在投訴/咨詢數(shù)據(jù)中,然后得到所有候選的子主題提取規(guī)則;當匹配到多個子主題提取規(guī)則時,通過如下步驟從所有候選的子主題提取規(guī)則中挑選出最優(yōu)規(guī)則基于詞性和詞長來計算投訴/咨詢內(nèi)容中各詞的權(quán)重(例如, 詞長度越大,則權(quán)重越高;名詞和動詞的權(quán)重大于形容詞和副詞;等等),計算每個候選子主題提取規(guī)則的匹配度(匹配度=投訴咨詢數(shù)據(jù)與候選規(guī)則的特征詞序列匹配上的各特征詞的權(quán)重之和/投訴咨詢數(shù)據(jù)中各詞的權(quán)重之和),以及選取匹配度最高的候選子主題提取規(guī)則作為最優(yōu)規(guī)則,然后將最優(yōu)規(guī)則的子主題作為子主題識別結(jié)果。最后,識別單元210根據(jù)業(yè)務識別結(jié)果和子主題識別結(jié)果,從本體庫單元110中找到關(guān)聯(lián)的主題。
圖7示出了由識別單元210執(zhí)行業(yè)務、主題和子主題識別的例子。對于客戶的投訴/咨詢數(shù)據(jù)“集群怎么取消失??? ”,識別單元210首先執(zhí)行分詞,得到“集/名詞群/名詞怎么/疑問詞取消/動詞失敗/動詞”,根據(jù)訓練模型可知“集群”是一個業(yè)務術(shù)語,然后和業(yè)務術(shù)語映射規(guī)則“〈短號網(wǎng)I集群 >—短號集群網(wǎng)”匹配成功,從而識別出業(yè)務“短號集群網(wǎng)”。然后,識別單元210通過與子主題提取規(guī)則匹配,找到兩條候選規(guī)則“〈怎么I如何 > ;<取消I退訂 > —取消方法”和“[< 怎么I如何 >];< 取消I退訂 > ;< 失敗I不了 > —取消失敗”,經(jīng)過匹配度計算發(fā)現(xiàn)第二條規(guī)則的匹配度要高于第一條規(guī)則,因此將“取消失敗” 作為子主題。最后,識別單元210通過查找本體庫單元110得到“類別=所有業(yè)務,主題= 取消,子主題=取消失敗”,從而將“取消”作為主題。下面,結(jié)合附圖6-11詳細描述圖1中所示的隱含特征計算單元200的結(jié)構(gòu)和功能。圖6詳細示出了圖1所示的隱含特征計算單元200的內(nèi)部結(jié)構(gòu)圖。如圖6所示, 隱含特征計算單元200包括敏感度計算子單元220、使用水平計算子單元230、接受度計算子單元MO以及不滿原因獲取子單元250。下面分別對這些單元和子單元進行詳細描述。隱含特征計算單元200基于存儲設備10 (本體庫單元110、語言庫單元120和情緒字典單元130)中存儲的信息,針對每個客戶的投訴/咨詢數(shù)據(jù),提取每個客戶的隱含特征。例如,隱含特征可以包括敏感度(包括價格敏感度和質(zhì)量敏感度)、對具體業(yè)務的使用水平、對具體業(yè)務的接受度以及對具體業(yè)務的不滿原因。敏感度計算子單元220基于本體庫單元110和情緒字典單元130中存儲的信息, 根據(jù)每個客戶的投訴/咨詢歷史及業(yè)務、主題、子主題識別結(jié)果,計算該客戶的價格敏感度和質(zhì)量敏感度。具體地,敏感度計算子單元220基于情緒字典單元130以及投訴/咨詢數(shù)據(jù)是否與價格相關(guān),針對客戶的投訴/咨詢歷史中的每條記錄,計算價格敏感度如果投訴 /咨詢數(shù)據(jù)與價格不相關(guān),則價格敏感值為0 ;否則,價格敏感值等于該客戶的情緒值。投訴/咨詢數(shù)據(jù)與價格相關(guān)的判斷準則是主題為“資費”或“優(yōu)惠”,或者子主題中包含“資費”、“優(yōu)惠”、“扣費”、“話費”或“收費”,或者業(yè)務中包含“優(yōu)惠”、“資費”、“話費”、 “欠費”或“套餐”??蛻羟榫w值的計算準則是首先基于情緒字典單元130找到投訴/咨詢數(shù)據(jù)中出現(xiàn)的所有情緒詞,然后利用程度詞對情緒詞加權(quán)重(例如“太過分”比“過分”屬于“憤怒”的概率更大),接下來根據(jù)否定詞轉(zhuǎn)變情緒詞的情緒類型(例如“滿意”屬于“高興”,但“不滿意”屬于“憤怒”),然后通過累加投訴/咨詢數(shù)據(jù)中所有情緒詞屬于每種情緒類型的概率,得到投訴/咨詢內(nèi)容屬于每種情緒類型的概率,最后選擇概率最大的情緒類型并賦予一個相應的分值(例如無情緒為1,失望為2,憤怒為3,威脅為4),作為客戶情緒值。敏感度計算子單元220把客戶投訴/咨詢歷史中每條記錄的價格敏感值乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域為W-i],其中記錄的時間離現(xiàn)在時間越遠,時間衰減參數(shù)值越小),然后求和得到總體價格敏感值,最后根據(jù)總體價格敏感值的大小依次劃分為 “低度敏感”、“中度敏感”和“高度敏感”,以獲得價格敏感度。另一方面,敏感度計算子單元220計算質(zhì)量敏感度,其過程類似于價格敏感度的計算首先,基于情緒字典單元130以及投訴/咨詢數(shù)據(jù)是否與質(zhì)量相關(guān),針對客戶投訴/ 咨詢歷史中的每條記錄計算質(zhì)量敏感值。具體地,如果投訴/咨詢與質(zhì)量不相關(guān),則質(zhì)量敏感值為0 ;否則質(zhì)量敏感值等于該客戶的情緒值。投訴/咨詢與質(zhì)量相關(guān)的判斷準則是主題為“使用”,或者子主題中包含“質(zhì)量”。 此外,客戶情緒值的計算與價格敏感度中的計算過程相同。敏感度計算子單元220把對客戶投訴/咨詢歷史中每條記錄的質(zhì)量敏感值乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域為W-i],其中記錄的時間離現(xiàn)在時間越遠,時間衰減參數(shù)值越小),然后求和得到總體質(zhì)量敏感值,最后根據(jù)值大小依次劃分為“低度敏感”、 “中度敏感”和“高度敏感”,以獲得質(zhì)量敏感度。圖8示出了敏感度計算子單元220計算客戶的敏感度的例子。如圖8中所示,某客戶曾經(jīng)投訴/咨詢過“怎么飛信經(jīng)常無法成功登陸呢”、“我的GPRS還有流量,為什么還要扣我費?”和“GPRS上網(wǎng)怎么這么慢,你們也太過分了! ”。其中第一條投訴/咨詢的主題是 “使用”,因此與質(zhì)量相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“成功”屬于高興情緒,但前面的否定詞“無法”和程度詞“經(jīng)?!笔埂敖?jīng)常無法成功”變成了憤怒情緒,因此質(zhì)量敏感值為3。第二條投訴/咨詢的主題是“資費”,因此與價格相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“為什么”和“扣”,這兩個情緒詞屬于失望情緒的概率之和最高(0. 2+0. 8 = 1),因此價格敏感值為2。第三條投訴/咨詢的主題是“使用”,因此與質(zhì)量相關(guān),另外投訴/咨詢內(nèi)容中出現(xiàn)了情緒詞“慢”(前面的程度詞為“這么”,“這么慢”為憤怒情緒)和“過分”(前面的程度詞為“太”,“太過分”為憤怒情緒),因此質(zhì)量敏感值為3。最后,敏感度計算子單元 220對這三條投訴/咨詢數(shù)據(jù)進行處理,得到該客戶的價格敏感度是中度敏感,質(zhì)量敏感度是高度敏感。使用水平計算子單元230基于本體庫單元110中存儲的信息,根據(jù)每個客戶對每個業(yè)務的投訴/咨詢歷史及業(yè)務、主題、子主題識別結(jié)果,計算出該客戶對該業(yè)務的使用水平。具體地,使用水平計算子單元230執(zhí)行以下計算 子主題基礎性計算使用水平計算子單元230基于本體庫單元110,計算某客戶對某業(yè)務投訴/咨詢過的每個子主題的基礎性。子主題的基礎性可以通過有該子主題的業(yè)務數(shù)量來衡量越多的業(yè)務有共同的子主題,則該子主題越基礎。子主題基礎性的計算準則為本體庫中有該子主題的業(yè)務的個數(shù)/本體庫中所有業(yè)務的個數(shù)。 子主題典型性計算使用水平計算子單元230基于所有用戶的投訴/咨詢歷史及業(yè)務、主題、子主題識別結(jié)果,計算某客戶對某業(yè)務投訴/咨詢過的每個子主題的典型性。子主題的典型性可以通過所有客戶咨詢過該子主題的次數(shù)來衡量某子主題被投訴/ 咨詢過的次數(shù)越多,則該子主題越典型。子主題典型性的計算準則為所有客戶投訴/咨詢過該子主題的次數(shù)/所有客戶的投訴/咨詢總數(shù)。 業(yè)務的使用水平計算使用水平計算子單元230針對某客戶對某業(yè)務投訴/咨詢過的所有子主題的基礎性和典型性,求平均得到客戶對該業(yè)務的使用水平值,然后根據(jù)使用水平值大小將使用水平依次劃分為“初級”、“中等”和“熟練”。圖9示出了使用水平計算子單元230計算客戶對業(yè)務的使用水平的例子。如圖9 所示,某客戶對GPRS業(yè)務曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費? ”、 “GPRS上網(wǎng)怎么這么慢,你們也太過分了 !”子主題分別為“錯誤扣費”和“上網(wǎng)速度”。圖9 的本體庫單元中包括4個業(yè)務,其中3個業(yè)務具有子主題“錯誤扣費”,2個業(yè)務具有子主題 “上網(wǎng)速度”;因此,使用水平計算子單元230計算出“錯誤扣費”的基礎性為3/4 = 0. 75,“上網(wǎng)速度”的基礎性為2/4 = 0. 5。另外,圖9的所有客戶投訴/咨詢歷史中包括3條記錄,其中2條的子主題是“錯誤扣費”,1條是“上網(wǎng)速度”,因此使用水平計算子單元230計算出“錯誤扣費”的典型性為2/3 = 0. 67,“上網(wǎng)速度”的典型性為1/3 = 0. 33。最后,使用水平計算子單元230將上述各個子主題的基礎性和典型性求平均,得到該客戶對GPRS的使用水平為(0. 75+0. 5+0.67+0. 33)/4 = 0. 56,為“中等”使用水平。接受度計算子單元240基于情緒字典單元130中存儲的信息,根據(jù)每個客戶對每個業(yè)務的投訴/咨詢歷史及業(yè)務、主題、子主題識別結(jié)果,計算出該客戶對該業(yè)務的接受度。具體地,接受度計算子單元240執(zhí)行以下計算 各個投訴/咨詢數(shù)據(jù)的接受度計算每條投訴/咨詢數(shù)據(jù)的接受度可以基于情緒字典單元130和本體庫單元110來計算。首先,接受度計算子單元240基于情緒字典單元130計算客戶情緒值,計算方法與上文中描述的價格敏感度的計算相同,此處不再詳述。 其次,接受度計算子單元240判斷投訴/咨詢數(shù)據(jù)的主題是否為“取消”。最后,結(jié)合客戶情緒值以及主題是否為取消,接受度計算子單元240計算每條投訴/咨詢數(shù)據(jù)的接受度??蛻羟榫w值越高,則客戶對該業(yè)務的接受度越差;主題若為取消,說明客戶準備取消該業(yè)務, 則客戶對該業(yè)務的接受度很差。每條投訴/咨詢數(shù)據(jù)的接受度計算準則例如可以是1/(客戶情緒值+取消值),其中取消值可人為設定,例如當主題為取消時為10,否則為0。 客戶對業(yè)務的接受度計算接受度計算子單元240把上述各個投訴/咨詢數(shù)據(jù)的接受度乘以一個時間衰減參數(shù)(時間衰減參數(shù)的值域為W-i],記錄的時間離現(xiàn)在時間越遠,時間衰減參數(shù)值越小),然后求平均得到總體接受度。最后,接受度計算子單元240根據(jù)總體接受度值的大小將接受度依次劃分為“拒絕”、“弱接受”和“強接受”。圖10示出了接受度計算子單元240計算客戶對業(yè)務的接受度的例子。如圖 10中所示,某客戶對GPRS業(yè)務曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費?”、“GPRS上網(wǎng)怎么這么慢,你們也太過分了! ”、“如何取消GPRS”,其中第一條數(shù)據(jù)的客戶情緒值為3 (憤怒),主題不為取消,因此接受度為1/3 = 0. 33,類似地第二條和第三條數(shù)據(jù)的接受度分別為1/3 = 0. 33和1/10 = 0.1o假設2010年6月和2010年7 月的時間衰減參數(shù)分別為2/3和1,則對各個數(shù)據(jù)的接受度求和平均得到總體接受度為 (0. 33*2/3+0. 33*1+0. 1*1) /3 = 0. 2 (拒絕)。不滿原因獲取子單元250基于情緒字典單元130中存儲的信息,根據(jù)每個客戶對每個業(yè)務的投訴/咨詢歷史及業(yè)務、主題、子主題識別結(jié)果,獲取該客戶對該業(yè)務的不滿原因。具體地,不滿原因獲取子單元250執(zhí)行以下處理 各個投訴/咨詢數(shù)據(jù)的投訴/咨詢分類首先,不滿原因獲取子單元250基于情緒字典單元I30來計算客戶情緒值,該計算過程與上文描述的價格敏感度的計算相同,此處不再詳述。其次,不滿原因獲取子單元250按情緒值大小,將其依次分類為“咨詢”或“投訴”。 客戶對業(yè)務不滿原因的獲取針對分類為“投訴”的各個投訴/咨詢數(shù)據(jù),不滿原因獲取子單元250獲取其子主題作為客戶對該業(yè)務的不滿原因。圖11示出了不滿原因獲取子單元250獲取客戶對業(yè)務的不滿原因的例子。如圖 11所示,某客戶對GPRS業(yè)務曾經(jīng)投訴/咨詢過“我的GPRS還有流量,為什么還要扣我費?”、 "GPRS上網(wǎng)怎么這么慢,你們也太過分了 ! ”、“如何取消GPRS”,不滿原因獲取子單元250將這些投訴/咨詢數(shù)據(jù)分別被歸類為“投訴”、“投訴”和“咨詢”。因此,該客戶對GPRS的不滿原因為錯誤扣費、上網(wǎng)速度。返回圖1,隱含需求獲取單元260將隱含特征計算單元200所計算得到的客戶的隱含特征加以匯總,以獲取客戶的隱含需求。圖12示出了隱含需求獲取單元獲取隱含需求的一個具體示例。將客戶135XXXX1234的敏感度計算結(jié)果“價格敏感度中度敏感;質(zhì)量敏感度高度敏感”、使用水平計算結(jié)果“客戶對GPRS的使用水平0. 56 (中等)”、接受度計算結(jié)果“客戶對GPRS的接受度0.2(拒絕)”和不滿原因獲取結(jié)果“客戶對GPRS的不滿原因 錯誤扣費、上網(wǎng)速度”合并到一起,生成隱含需求。第二實施例圖13示出了根據(jù)本發(fā)明第二實施例的數(shù)據(jù)分析設備2的框圖。如圖13所示,本實施例中的數(shù)據(jù)分析設備2與第一實施例中的數(shù)據(jù)分析設備1的不同之處在于還包含隱含需求統(tǒng)計單元300。由于第二實施例中除了隱含需求統(tǒng)計單元300之外的其他組件與第一實施例中的相同,因此這里不再對其進行詳細描述。隱含需求統(tǒng)計單元300根據(jù)隱含特征計算單元200的輸出,針對所有客戶的隱含需求,進行各方面的統(tǒng)計。例如,這些統(tǒng)計結(jié)果可以為企業(yè)客服中心提供決策支持。在本實施例中,統(tǒng)計功能包括以下至少一項業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計、客戶分群。具體地, 業(yè)務接受度統(tǒng)計隱含需求統(tǒng)計單元300根據(jù)所有客戶對每個業(yè)務的接受度, 統(tǒng)計得到每個業(yè)務的接受客戶比例(例如,該比例的計算準則是接受度不為“拒絕”的客戶的個數(shù)/所有客戶的個數(shù))。 業(yè)務不滿原因統(tǒng)計隱含需求統(tǒng)計單元300根據(jù)所有客戶的不滿原因,統(tǒng)計得到每個業(yè)務及每種不滿原因的不滿客戶的個數(shù)。 客戶分群隱含需求統(tǒng)計單元300根據(jù)所有客戶的價格敏感度和質(zhì)量敏感度, 對所有客戶進行分群。例如價格高度敏感客戶群、價格低度敏感客戶群、質(zhì)量高度敏感客戶軒寸。圖14是示出了根據(jù)本發(fā)明第二實施例的隱含需求統(tǒng)計單元執(zhí)行隱含需求統(tǒng)計的示意圖。在業(yè)務接受度統(tǒng)計中,有76%的客戶對GPRS的接受度為“強接受”或“弱接受”,
的客戶對GPRS的接受度為“拒絕”,因此GPRS的接受客戶比例為76%。在業(yè)務不滿原因統(tǒng)計中,135XXXX1234等512個客戶的不滿原因中有GPRS的上網(wǎng)速度,因此GPRS的上網(wǎng)速度的不滿客戶數(shù)為512。在客戶分群中,客戶135XXXX1234和135XXXX9120的價格敏感度為中度敏感,因此分到價格中度敏感客戶群。第三實施例圖15示出了根據(jù)本發(fā)明第三實施例的數(shù)據(jù)分析設備3的框圖。如圖15所示,本實施例中的數(shù)據(jù)分析設備3與第一實施例中的數(shù)據(jù)分析設備1的不同之處在于還包含個性化業(yè)務推薦單元400。由于第三實施例中除了個性化業(yè)務推薦單元400之外的其他組件與第一實施例中的相同,因此這里不再對其進行詳細描述。個性化業(yè)務推薦單元400基于客戶的隱含需求,查找推薦策略庫從而找到適合的推薦策略,然后向該客戶推薦個性化業(yè)務。如圖16所示,推薦個性化業(yè)務包括以下至少一項
推薦更高質(zhì)量的業(yè)務若客戶對質(zhì)量敏感,而且客戶對某業(yè)務的接受度差,而且可以分析出客戶對該業(yè)務的不滿原因,則向該客戶推薦一個在客戶不滿方面有更高滿意度的同類業(yè)務。其中,兩個業(yè)務是否同類需要查找本體庫得到,業(yè)務在不滿方面是否有更高滿意度需要根據(jù)業(yè)務不滿原因統(tǒng)計結(jié)果得到。推薦類型設為“更高質(zhì)量業(yè)務”。 推薦價格更實惠的業(yè)務若客戶對價格的敏感度很高,則基于外部的價格數(shù)據(jù)庫,向該客戶推薦價格更加實惠的業(yè)務。推薦類型設為“價格實惠業(yè)務”。 升級現(xiàn)有業(yè)務若客戶對某業(yè)務的接受度很高,則基于外部的業(yè)務數(shù)據(jù)庫,當該業(yè)務出現(xiàn)了升級業(yè)務時,向客戶推薦升級業(yè)務。推薦類型設為“升級現(xiàn)有業(yè)務”。 推薦語義相關(guān)業(yè)務若客戶對某業(yè)務的接受度很高,則基于外部的業(yè)務數(shù)據(jù)庫, 向該客戶推薦與當前業(yè)務語義相關(guān)的其他業(yè)務。推薦類型設為“語義相關(guān)業(yè)務”。 提升現(xiàn)有業(yè)務價值若客戶對某業(yè)務的使用水平很低,則基于外部的業(yè)務數(shù)據(jù)庫,給該客戶發(fā)送該業(yè)務的深入介紹,以幫助客戶熟練使用該業(yè)務。推薦類型設為“提升現(xiàn)有業(yè)務價值”。 提供挽留業(yè)務若客戶對某業(yè)務的接受度很差,則基于外部的挽留策略數(shù)據(jù)庫, 對該客戶進行促銷、贈送等挽留策略。推薦類型設為“挽留”。圖17示出了根據(jù)本發(fā)明第三實施例的個性化業(yè)務推薦單元推薦個性化業(yè)務的例子。某客戶的質(zhì)量敏感度為高度敏感,對GPRS業(yè)務的接受度為0. 2 (拒絕),對GPRS業(yè)務的不滿原因是上網(wǎng)速度。從業(yè)務不滿原因統(tǒng)計結(jié)果中發(fā)現(xiàn)G3上網(wǎng)業(yè)務的上網(wǎng)速度的不滿客戶數(shù)很少,因此,個性化業(yè)務推薦單元向該客戶推薦G3上網(wǎng)業(yè)務。第四實施例圖18示出了根據(jù)本發(fā)明第四實施例的數(shù)據(jù)分析設備4的框圖。如圖18所示,本實施例中的數(shù)據(jù)分析設備4與第三實施例中的數(shù)據(jù)分析設備3的不同之處在于還包括個性化業(yè)務效果評價單元500。由于第四實施例中除了個性化業(yè)務效果評價單元500之外的組件與第三實施例中的相同,因此這里不再對其進行詳細描述。在本實施例中,個性化業(yè)務效果評價單元500根據(jù)客戶對個性化業(yè)務推薦單元 400所推薦的業(yè)務的反饋,評價個性化業(yè)務推薦的效果。具體地,客戶在收到推薦的個性化業(yè)務后,通常會做出一些反饋動作(例如,是否使用該業(yè)務)。根據(jù)所有客戶的反饋,可以對以下效果進行自動評價 推薦業(yè)務的效果統(tǒng)計各個推薦業(yè)務的推薦次數(shù)、成功次數(shù)(例如,推薦成功判定方式可以是客戶收到推薦業(yè)務后不久就開通了該業(yè)務)、成功率。 推薦類型的效果統(tǒng)計各個推薦類型的推薦次數(shù)、成功次數(shù)(例如,推薦成功判定方式可以是客戶收到系統(tǒng)使用推薦類型所產(chǎn)生的推薦業(yè)務后不久就開通了該業(yè)務)、 成功率。圖19示出了根據(jù)本發(fā)明第四實施例的個性化業(yè)務效果評價單元執(zhí)行個性化業(yè)務推薦效果評價的例子。如圖19所示,通過對所有客戶的反饋歷史進行統(tǒng)計,個性化業(yè)務效果評價單元500可以得到各個推薦業(yè)務及各個推薦類型的推薦效果。下面,結(jié)合附圖20來描述根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)分析方法。圖20是示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)分析方法19的流程圖。例如,該方法19可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設備來執(zhí)行。
最初,方法19從步驟S1900開始。在步驟S1901,基于語義知識、語言模型等已存儲的信息,從客戶的投訴/咨詢數(shù)據(jù)中識別業(yè)務、主題和子主題的名稱。該步驟例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設備中的識別單元來執(zhí)行。具體過程可參見上文的相應描述,此處不再重復說明。在步驟S1902-S1905,基于步驟S1901的結(jié)果,計算客戶的隱含特征,具體包括計算客戶的價格敏感度和質(zhì)量敏感度、計算客戶對所識別的業(yè)務的使用水平、計算客戶對所識別的業(yè)務的接受度并獲取客戶對所識別的業(yè)務的不滿原因。隱含特征的計算例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設備中的隱含特征計算單元來執(zhí)行。具體過程可參見上文的相應描述,此處不再重復說明。需要指出,雖然步驟S1902-S1905在附圖20中是依次示出的,然而可以理解的是, 這些步驟不一定全部執(zhí)行,而且不一定按照附圖19中所示的順序來執(zhí)行。例如,可以根據(jù)實際需要僅執(zhí)行所示步驟S1902-S1905中的一個或更多個步驟,而且可以按照不同的順序來執(zhí)行或者以并行的方式來執(zhí)行。接下來,在步驟S1906處,可根據(jù)需要決定是否執(zhí)行對客戶的隱含需求的統(tǒng)計。如果要執(zhí)行統(tǒng)計,則方法進行至步驟S1907。在步驟S1907,可以執(zhí)行業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計和客戶分群統(tǒng)計,等等。這些統(tǒng)計例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設備中的隱含需求統(tǒng)計單元來執(zhí)行。具體過程可參見上文的相應描述,此處不再重復說明。之后,方法進行至步驟S1908。否則,如果不需要執(zhí)行統(tǒng)計,則方法直接來到步驟S1908。在步驟S1908,判斷是否向客戶推薦個性化業(yè)務。如果是,則方法進行至步驟S1909。在步驟S1909,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務,包括更高質(zhì)量的業(yè)務、價格更實惠的業(yè)務、升級現(xiàn)有業(yè)務、語義相關(guān)業(yè)務、提升現(xiàn)有業(yè)務價值和挽留業(yè)務,等等??蛇x地,還可接收客戶對所推薦的個性化業(yè)務的反饋,以評價個性化業(yè)務推薦的效果。步驟S1909例如可以由上文描述的根據(jù)本發(fā)明的數(shù)據(jù)分析設備中的個性化業(yè)務推薦單元和個性化業(yè)務效果評價單元來執(zhí)行。具體過程可參見上文的相應描述,此處不再重復說明。在此之后,方法進行至步驟S1910并結(jié)束。否則,如果不需要推薦個性化業(yè)務,則該方法在步驟S1908后直接進行到步驟 S1910并結(jié)束。綜上所述,根據(jù)本發(fā)明的數(shù)據(jù)分析設備和方法可以根據(jù)來自客戶的投訴/咨詢數(shù)據(jù)準確地理解客戶的隱含需求。此外,還可以根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。因此,本發(fā)明能夠極大地提升客戶的使用感受。盡管以上已經(jīng)結(jié)合本發(fā)明的優(yōu)選實施例示出了本發(fā)明,但是本領域的技術(shù)人員將會理解,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明進行各種修改、替換和改變。因此,本發(fā)明不應由上述實施例來限定,而應由所附權(quán)利要求及其等價物來限定。
權(quán)利要求
1.一種數(shù)據(jù)分析設備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題;隱含特征計算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務、主題和子主題來計算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。
2.如權(quán)利要求1所述的數(shù)據(jù)分析設備,其中,所述隱含特征計算單元包括 敏感度計算子單元,計算客戶的價格敏感度和質(zhì)量敏感度;使用水平計算子單元,計算客戶對所識別的業(yè)務的使用水平; 接受度計算子單元,計算客戶對所識別的業(yè)務的接受度;以及不滿原因獲取子單元,獲取客戶對所識別的業(yè)務的不滿原因。
3.如權(quán)利要求1所述的數(shù)據(jù)分析設備,還包括 隱含需求統(tǒng)計單元,對客戶的隱含需求進行統(tǒng)計。
4.如權(quán)利要求3所述的數(shù)據(jù)分析設備,其中,所述隱含需求統(tǒng)計單元進行以下至少一項統(tǒng)計業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計和客戶分群統(tǒng)計。
5.如權(quán)利要求1所述的數(shù)據(jù)分析設備,還包括個性化業(yè)務推薦單元,根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。
6.如權(quán)利要求5所述的數(shù)據(jù)分析設備,其中,所述個性化業(yè)務推薦單元提供以下至少一項業(yè)務更高質(zhì)量的業(yè)務、價格更實惠的業(yè)務、升級現(xiàn)有業(yè)務、語義相關(guān)業(yè)務、提升現(xiàn)有業(yè)務價值和挽留業(yè)務。
7.如權(quán)利要求5所述的數(shù)據(jù)分析設備,還包括個性化業(yè)務效果評價單元,根據(jù)客戶對所述個性化業(yè)務推薦單元推薦的業(yè)務的反饋, 評價個性化業(yè)務推薦的效果。
8.一種數(shù)據(jù)分析方法,包括基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題; 基于語義知識和情緒字典,根據(jù)所識別的業(yè)務、主題和子主題來計算客戶的隱含特征;以及將客戶的隱含特征匯總以獲取客戶的隱含需求。
9.如權(quán)利要求8所述的數(shù)據(jù)分析方法,其中,所述隱含特征包括客戶的價格敏感度和質(zhì)量敏感度、客戶對所識別的業(yè)務的使用水平、客戶對所識別的業(yè)務的接受度和客戶對所識別的業(yè)務的不滿原因。
10.如權(quán)利要求8所述的數(shù)據(jù)分析方法,還包括 對客戶的隱含需求進行統(tǒng)計。
11.如權(quán)利要求10所述的數(shù)據(jù)分析方法,其中,所述統(tǒng)計包括以下至少一項業(yè)務接受度統(tǒng)計、業(yè)務不滿原因統(tǒng)計和客戶分群統(tǒng)計。
12.如權(quán)利要求8所述的數(shù)據(jù)分析方法,還包括 根據(jù)客戶的隱含需求,向客戶推薦個性化業(yè)務。
13.如權(quán)利要求12所述的數(shù)據(jù)分析方法,其中,所述個性化業(yè)務包括以下至少一項業(yè)務更高質(zhì)量的業(yè)務、價格更實惠的業(yè)務、升級現(xiàn)有業(yè)務、語義相關(guān)業(yè)務、提升現(xiàn)有業(yè)務價值和挽留業(yè)務。
14.如權(quán)利要求12所述的數(shù)據(jù)分析方法,還包括 根據(jù)客戶對所推薦的個性化業(yè)務的反饋,評價個性化業(yè)務推薦的效果。
全文摘要
本發(fā)明提供了一種數(shù)據(jù)分析設備,包括識別單元,基于語義知識和語言模型,從客戶的投訴/咨詢數(shù)據(jù)中識別出業(yè)務、主題和子主題;隱含特征計算單元,基于語義知識和情緒字典,根據(jù)所識別的業(yè)務、主題和子主題來計算客戶的隱含特征;以及隱含需求獲取單元,將客戶的隱含特征匯總以獲取客戶的隱含需求。本發(fā)明還提供了一種數(shù)據(jù)分析方法。
文檔編號G06Q10/00GK102402717SQ20101028292
公開日2012年4月4日 申請日期2010年9月13日 優(yōu)先權(quán)日2010年9月13日
發(fā)明者豐強澤, 何滔, 趙凱, 趙岷, 齊紅威 申請人:日電(中國)有限公司