本發(fā)明涉及網(wǎng)絡(luò)信息分析與數(shù)據(jù)挖掘
技術(shù)領(lǐng)域:
,特別是涉及一種用戶評(píng)價(jià)方法、裝置及系統(tǒng)。
背景技術(shù):
:隨著計(jì)算機(jī)網(wǎng)絡(luò)的不斷發(fā)展,網(wǎng)絡(luò)信息成為日常生活中的重要組成部分,互聯(lián)網(wǎng)以及成為人們獲取信息、交流溝通的重要場(chǎng)所。用戶可以在各種主題的論壇中發(fā)布信息、獲取信息、交流經(jīng)驗(yàn)等,在這些海量的帖子蘊(yùn)含著巨大的潛在價(jià)值。同樣,發(fā)布帖子的用戶也同樣具有相應(yīng)的價(jià)值。現(xiàn)有用戶行為評(píng)價(jià)的方法,基本上是基于有限的數(shù)據(jù)量,采用主動(dòng)降維、人工抽取權(quán)重因子的方式。但是,該方式需要的人工量大,而且不利于自動(dòng)化、快速的迭代。技術(shù)實(shí)現(xiàn)要素:本發(fā)明主要解決的技術(shù)問題是提供一種用戶行為評(píng)價(jià)方法、裝置及系統(tǒng),能夠快速根據(jù)論壇帖子的相關(guān)信息對(duì)用戶行為進(jìn)行評(píng)價(jià)。為解決上述技術(shù)問題,本發(fā)明采用的一個(gè)技術(shù)方案是:提供一種用戶行為評(píng)價(jià)方法,所述方法包括:服務(wù)器獲取用戶請(qǐng)求日志,根據(jù)所述用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志;根據(jù)所述用戶行為日志統(tǒng)計(jì)所述用戶的操作行為;根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià)。其中,所述根據(jù)所述用戶行為日志統(tǒng)計(jì)所述用戶的操作行為的步驟具體為:根據(jù)所述用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并計(jì)算各因子的相關(guān)系數(shù)矩陣,以保留相關(guān)性滿足第一預(yù)設(shè)條件的因子;計(jì)算保留下來的各因子的貢獻(xiàn)率;以及根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為。其中,根據(jù)所述用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并計(jì)算各因子的相關(guān)系數(shù)矩陣,以保留相關(guān)性滿足第一預(yù)設(shè)條件的因子的步驟之后,所述方法還包括:對(duì)保留下來的因子進(jìn)行檢驗(yàn)統(tǒng)計(jì)量KMO的檢測(cè),以保留相關(guān)性滿足第二預(yù)設(shè)條件的因子。其中,所述根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為的步驟具體為:根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率;計(jì)算各因子的載荷矩陣,獲得各主成分因子的權(quán)重向量,以統(tǒng)計(jì)所述用戶的操作行為;所述根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià)的步驟具體為:根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果以及所述權(quán)重向量確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià)。其中,所述方法還包括:將評(píng)分滿足第四預(yù)定條件的用戶的用戶信息/用戶行為發(fā)送至另一服務(wù)器,使所述另一服務(wù)器對(duì)所述用戶信息/用戶行為進(jìn)行分析以獲取相關(guān)信息。其中,所述方法還包括:根據(jù)所述用戶行為的評(píng)價(jià)結(jié)果進(jìn)行排序,以確定置信閾值;其中,所述置信閾值用于預(yù)測(cè)所述用戶接下來的用戶生成內(nèi)容是否屬于有價(jià)值的信息。為解決上述技術(shù)問題,本發(fā)明采用的另一個(gè)技術(shù)方案是:提供一種用戶行為評(píng)價(jià)裝置,所述裝置包括:獲取模塊,用于獲取用戶請(qǐng)求日志,根據(jù)所述用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志;統(tǒng)計(jì)模塊,用于對(duì)所述獲取模塊生成的用戶行為日志進(jìn)行統(tǒng)計(jì)而得到所述用戶的操作行為;評(píng)價(jià)模塊,用于根據(jù)所述統(tǒng)計(jì)模塊得到的所述用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià)。其中,所述統(tǒng)計(jì)模塊用于根據(jù)該用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并計(jì)算各因子的相關(guān)系數(shù)矩陣,以保留相關(guān)性滿足預(yù)設(shè)條件的因子;根據(jù)用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并根據(jù)各因子的相關(guān)系數(shù)矩陣提取相關(guān)性較強(qiáng)的因子,過濾掉相關(guān)性較低的因子;計(jì)算保留下來的各因子的貢獻(xiàn)率;以及根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為。其中,所述統(tǒng)計(jì)模塊根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率;根據(jù)所述各因子的累積貢獻(xiàn)率獲得各主成分因子的權(quán)重向量;所述評(píng)價(jià)模塊用于根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果以及所述權(quán)重向量確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià)。為解決上述技術(shù)問題,本發(fā)明采用的另一個(gè)技術(shù)方案是:提供一種用戶行為評(píng)價(jià)系統(tǒng),所述系統(tǒng)包括第一服務(wù)器和第二服務(wù)器,其中,所述第一服務(wù)器包括:獲取模塊,用于獲取用戶請(qǐng)求日志,根據(jù)所述用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志;統(tǒng)計(jì)模塊,用于對(duì)所述獲取模塊生成的用戶行為日志進(jìn)行統(tǒng)計(jì)而得到所述用戶的操作行為;評(píng)價(jià)模塊,用于根據(jù)所述統(tǒng)計(jì)模塊得到的所述用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用所述評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià);以及傳送模塊,用于發(fā)送包括所述用戶評(píng)分的用戶信息至所述第二服務(wù)器,使所述第二服務(wù)器對(duì)所述用戶信息進(jìn)行分析以確定相關(guān)信息。本發(fā)明的有益效果是:本發(fā)明提供的一種用戶行為評(píng)價(jià)方法、裝置及系統(tǒng),通過對(duì)根據(jù)用戶請(qǐng)求日志記錄的用戶操作行為生成的用戶行為日志統(tǒng)計(jì)用戶的操作行為,并根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià),從而自動(dòng)、快速地分離有效的用戶行為及其影響權(quán)重,具有很強(qiáng)的自動(dòng)化和魯棒性。附圖說明圖1是本發(fā)明一種用戶行為評(píng)價(jià)方法的第一實(shí)施方式的流程圖;圖2是圖1所示的一種用戶行為評(píng)價(jià)方法中統(tǒng)計(jì)用戶操作行為的方法的流程圖;圖3是本發(fā)明一種用戶行為評(píng)價(jià)方法的第二實(shí)施方式的流程圖;圖4是本發(fā)明一種用戶行為評(píng)價(jià)裝置的第一實(shí)施方式的結(jié)構(gòu)示意圖;圖5是本發(fā)明一種用戶行為評(píng)價(jià)裝置的第二實(shí)施方式的結(jié)構(gòu)示意圖;圖6是本發(fā)明一種用戶行為評(píng)價(jià)系統(tǒng)一實(shí)施方式的結(jié)構(gòu)示意圖。具體實(shí)施方式首先,對(duì)本發(fā)明實(shí)施方式中出現(xiàn)的相關(guān)技術(shù)名詞進(jìn)行解釋說明。KMO檢測(cè),檢驗(yàn)統(tǒng)計(jì)量(Kaiser-Meyer-Olkin)檢測(cè),KMO是用于比較變量間簡(jiǎn)單相關(guān)系數(shù)和偏相關(guān)系數(shù)的指標(biāo)。KMO統(tǒng)計(jì)量是取值在0和1之間。當(dāng)所有變量間的簡(jiǎn)單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)系數(shù)平方和時(shí),KMO值接近1。KMO值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;當(dāng)所有變量間的簡(jiǎn)單相關(guān)系數(shù)平方和接近0時(shí),KMO值接近0.KMO值越接近于0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。Kaiser給出了常用的KMO度量標(biāo)準(zhǔn):0.9以上表示非常適合;0.8表示適合;0.7表示一般;0.6表示不太適合;0.5以下表示極不適合。球形檢測(cè),又稱巴特利特球形檢驗(yàn),是一種檢驗(yàn)各個(gè)變量之間相關(guān)性程度的檢驗(yàn)方法。一般在做因子分析之前都要進(jìn)行巴特利特球形檢驗(yàn),用于判斷變量是否適合用于做因子分析。巴特利特球形檢驗(yàn)是以變量的相關(guān)系數(shù)矩陣為出發(fā)點(diǎn)的。它的零假設(shè)相關(guān)系數(shù)矩陣是一個(gè)單位陣,即相關(guān)系數(shù)矩陣對(duì)角線上的所有元素都是1,所有非對(duì)角線上的元素都為零。巴特利特球形檢驗(yàn)的統(tǒng)計(jì)量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對(duì)應(yīng)的相伴概率值小于用戶心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)不可能是單位陣,即原始變量之間存在相關(guān)性,適合于作因子分析,相反不適合作因子分析。下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明進(jìn)行詳細(xì)說明。請(qǐng)參閱圖1,為本發(fā)明一種用戶行為評(píng)價(jià)方法的第一實(shí)施方式的流程圖,該實(shí)施方式示出的方法包括:步驟S10:服務(wù)器獲取用戶請(qǐng)求日志,根據(jù)該用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志。其中,該用戶行為日志記錄了用戶對(duì)應(yīng)用程序各個(gè)功能點(diǎn)的操作行為記錄,包括功能點(diǎn)、操作時(shí)間和操作時(shí)長(zhǎng)等信息。用戶登錄服務(wù)器運(yùn)行的論壇等信息發(fā)布平臺(tái)發(fā)布帖子,發(fā)布的帖子通常包括標(biāo)題、內(nèi)容、發(fā)布者的身份信息ID,例如,用戶名、用戶的網(wǎng)絡(luò)地址等。并且,服務(wù)器根據(jù)該需要被評(píng)價(jià)的用戶發(fā)布帖子的時(shí)間、數(shù)量以及對(duì)發(fā)布的帖子的回復(fù)、瀏覽、收藏等記錄用戶的操作行為,形成該用戶請(qǐng)求日志。服務(wù)器根據(jù)該用戶請(qǐng)求日志,整理出用戶在應(yīng)用程序上的操作行為,以形成該用戶行為日志。在本實(shí)施方式中,該用戶行為日志包括該需要被評(píng)價(jià)的用戶如下11項(xiàng)因子:總活躍天數(shù)、歷史活躍發(fā)表帖子天數(shù)、歷史發(fā)表帖子次數(shù)、近三十天天瀏覽帖子次數(shù)、近三十天回復(fù)天數(shù)、近三十天回復(fù)次數(shù)、近三十天收藏天數(shù)、近三十天收藏的次數(shù)。在本實(shí)施方式中,根據(jù)帖子內(nèi)容和用戶行為特點(diǎn),同時(shí)選取如上所述的11個(gè)因子作為評(píng)價(jià)該用戶的因子,還可以從如上所述的11個(gè)因子中選擇一個(gè)或多個(gè)因子作為帖子的特征。但是,在其他實(shí)施方式中,可以根據(jù)情況選擇因子,并不僅限于如上列出的11個(gè)因子。進(jìn)一步地,在步驟S10中,服務(wù)器還過濾數(shù)據(jù)不全的用戶請(qǐng)求日志,以保留下有效的日志項(xiàng),從而得到用戶行為日志。步驟S11,根據(jù)該用戶行為日志統(tǒng)計(jì)該用戶的操作行為。在步驟S11中,根據(jù)用戶行為日志統(tǒng)計(jì)用戶的操作行為,具體為:以天為單位,根據(jù)用戶行為日志統(tǒng)計(jì)該用戶當(dāng)天對(duì)各項(xiàng)功能點(diǎn)進(jìn)行操作的操作次數(shù)和時(shí)長(zhǎng)統(tǒng)計(jì),按周和月的時(shí)間粒度對(duì)操作次數(shù)和時(shí)長(zhǎng)統(tǒng)計(jì)結(jié)果進(jìn)行兩重統(tǒng)計(jì)匯總,得到用戶的操作行為。請(qǐng)同時(shí)參閱圖2,步驟S11,即,根據(jù)該用戶行為日志統(tǒng)計(jì)該用戶的操作行為,具體通過如下步驟實(shí)現(xiàn):步驟S110,根據(jù)該用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并計(jì)算各因子的相關(guān)系數(shù)矩陣,以保留相關(guān)性滿足第一預(yù)設(shè)條件的因子。在步驟S110中,服務(wù)器根據(jù)用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并根據(jù)各因子的相關(guān)系數(shù)矩陣提取相關(guān)性較強(qiáng)的因子,過濾掉相關(guān)性較低的因子。其中,設(shè)定相關(guān)系數(shù)閾值為0.3,即,第一預(yù)設(shè)條件為相關(guān)性系數(shù)高于0.3,因此將相關(guān)性系數(shù)高于0.3的因子保留下來,形成相關(guān)性較強(qiáng)的因子組合,同時(shí)將相關(guān)性系數(shù)低于0.3的因子過濾。進(jìn)一步地,對(duì)保留下來的因子進(jìn)行KMO檢驗(yàn)統(tǒng)計(jì)量和球形檢測(cè)。如果KMO檢測(cè)值能達(dá)到0.7以上,則說明這樣的因子組合可解釋度很高,可以進(jìn)入下一步計(jì)算。步驟S111,計(jì)算保留下來的各因子的貢獻(xiàn)率。在步驟S111中,計(jì)算保留下來的各因子的相關(guān)性系數(shù)矩陣的特征根,并提取特征值大于0.1的成分因子,然后計(jì)算各特征值對(duì)應(yīng)的成分因子的貢獻(xiàn)率。步驟S112,根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為。根據(jù)步驟111的計(jì)算結(jié)果,統(tǒng)計(jì)所有特征值大于0.1的成分因子的累積貢獻(xiàn)率,如果該貢獻(xiàn)率達(dá)到70%以上,則認(rèn)可該因子組合方式。所以,根據(jù)認(rèn)可的因子組合方式確定對(duì)應(yīng)的用戶操作行為,即,由認(rèn)可的選定的因子以得到評(píng)價(jià)用戶行為的參考對(duì)象(用戶操作行為)。步驟S113,計(jì)算各因子的載荷矩陣,以統(tǒng)計(jì)該用戶的操作行為。其中,選取的因子為如步驟S110至S112確定的因子。使用主成分計(jì)算各因子的載荷矩陣,可以獲得各主成分下各因子的權(quán)重值,如果各成分的典型代表變量不是很突出,各指標(biāo)前幾個(gè)公共因子上均有相當(dāng)程度的載荷值,是難以合理解釋其實(shí)際意義,此時(shí)需要進(jìn)一步進(jìn)行選擇。選擇方差最大化方法進(jìn)行因子旋轉(zhuǎn),得到旋轉(zhuǎn)后的因子載荷矩陣,然后根據(jù)上述判斷方式,如果各成分的典型代表向量突出,則認(rèn)可該模型結(jié)果,從而獲得各主成分因子的權(quán)重向量。步驟S12,根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用該評(píng)分對(duì)該用戶進(jìn)行評(píng)價(jià)。在步驟S12中,結(jié)合用戶的操作行為的統(tǒng)計(jì)結(jié)果和主成分因子權(quán)重向量,即可計(jì)算用戶置信分(評(píng)分)。由于一般的應(yīng)用程序功能點(diǎn)很多,統(tǒng)計(jì)項(xiàng)也非常多,很難給出合理的解釋,本發(fā)明實(shí)施方式中采用因子分析法,計(jì)算出相關(guān)系數(shù)矩陣的特征值、貢獻(xiàn)率、累計(jì)貢獻(xiàn)率、因子載荷矩陣等,最終求得綜合評(píng)價(jià)值,實(shí)現(xiàn)對(duì)用戶行為的評(píng)價(jià)。利用本發(fā)明實(shí)施方式,通過對(duì)根據(jù)用戶請(qǐng)求日志記錄的用戶操作行為生成的用戶行為日志統(tǒng)計(jì)用戶的操作行為,并根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià),從而自動(dòng)、快速地分離有效的用戶行為及其影響權(quán)重,具有很強(qiáng)的自動(dòng)化和魯棒性。下面對(duì)本發(fā)明實(shí)施方式中的用戶行為評(píng)價(jià)方法進(jìn)行舉例說明。例如,起初選定的涉及用戶行為評(píng)價(jià)的基礎(chǔ)因子包括:總活躍天數(shù)、歷史活躍發(fā)表帖子天數(shù)、歷史發(fā)表帖子次數(shù)、近三十天瀏覽帖子次數(shù)、近三十天回復(fù)天數(shù)、近三十天回復(fù)次數(shù)、近三十天收藏天數(shù)、近三十天收藏的次數(shù)等11項(xiàng),都是用戶在UGC(UserGeneratedContent,用戶生成內(nèi)容)社區(qū)中的行為統(tǒng)計(jì)結(jié)果。并從UGC社區(qū)中隨機(jī)抽取5萬個(gè)用戶行為統(tǒng)計(jì)數(shù)據(jù)做測(cè)試。首先,根據(jù)用戶行為日志中記錄的如上所述的因子及對(duì)應(yīng)的數(shù)據(jù),計(jì)算各因子的相關(guān)系數(shù)矩陣,結(jié)果如下:由此可以看出,在這11個(gè)因子當(dāng)中,前9個(gè)因子之間存在較強(qiáng)的相關(guān)關(guān)系,最后兩個(gè)因子與其他因子的相關(guān)性系數(shù)偏離性較大,所以過濾掉這兩個(gè)因子(近三十天收藏天數(shù)和近三十天收藏次數(shù))的相關(guān)數(shù)據(jù)。這兩項(xiàng)與其他項(xiàng)的相關(guān)度低是因?yàn)橄嚓P(guān)系數(shù)大多數(shù)小于0.3,而其余9個(gè)因子的相關(guān)系數(shù)大多在0.3以上,由此可知,這9個(gè)因子之間存在較強(qiáng)的相關(guān)關(guān)系。利用剔除最后兩項(xiàng)因子的剩余9項(xiàng)數(shù)據(jù)進(jìn)行計(jì)算,得出相關(guān)系數(shù)矩陣,如下:CorrelationMatrix然后對(duì)保留下來的因子做KMO檢測(cè),結(jié)果如下:KMOandBartlett'sTest其中,KMO檢驗(yàn)值為0.763,大于0.7,則說明這9項(xiàng)因子的組合可解釋度很高,非常適合用于做因子分析以統(tǒng)計(jì)用戶行為。因此,繼續(xù)計(jì)算保留下來的因子載荷矩陣,如下:ComponentMatrixa由此可以看出,各個(gè)公共因子的典型代表變量不是很突出,各因子前幾個(gè)公共因子上均有相當(dāng)程度的載荷值,難以合理解釋其實(shí)際意義,所以需要進(jìn)一步進(jìn)行旋轉(zhuǎn)。選擇方差最大化方法進(jìn)行因子旋轉(zhuǎn),得到旋轉(zhuǎn)后的因子載荷矩陣如下:RotatedComponentMatrixa根據(jù)旋轉(zhuǎn)后的因子載荷矩陣表,可將指標(biāo)集分為三個(gè)主因子,第一主因子在“近三十天發(fā)表帖子天數(shù)”、“近三十天天發(fā)表帖子次數(shù)”、“近三十天回復(fù)天數(shù)”、“近三十天回復(fù)次數(shù)”四個(gè)指標(biāo)上具有很大載荷,從各指標(biāo)的含義可知反映了用戶近期在論壇上的發(fā)帖和回復(fù)行為,將其定義為內(nèi)容產(chǎn)出行為;第二主因子在“總活躍天數(shù)”、“近三十天瀏覽帖子天數(shù)”、“近三十天瀏覽帖子次數(shù)”上有較大載荷,從各指標(biāo)的含義可知反映了用戶瀏覽行為,將其定義為內(nèi)容消費(fèi)行為;第三主因子在“歷史活躍發(fā)表帖子天數(shù)”、“歷史發(fā)表帖子次數(shù)”比重上載荷較大,從各指標(biāo)的含義可知時(shí)反映用戶的歷史活躍程度,將其定義為歷史行為。使用旋轉(zhuǎn)結(jié)果,得到各因子權(quán)重如下(注:未歸一化):總活躍天數(shù)0.26197032歷史活躍發(fā)表帖子天數(shù)0.2944206歷史發(fā)表帖子次數(shù)0.32751438近三十天發(fā)表帖子天數(shù)0.56119506近三十天發(fā)表帖子次數(shù)0.54647568近三十天瀏覽帖子天數(shù)0.32128377近三十天瀏覽帖子次數(shù)0.30641238近三十天回復(fù)天數(shù)0.53242188近三十天回復(fù)次數(shù)0.56202837然后構(gòu)建用戶綜合評(píng)價(jià)模型,算出因子得分并排序。具體地,確定因子得分系數(shù)矩陣為:F=57.52%*F1+19.17%*F2+11.46%*F3F1=0.691*X1+0.718*X2+0.729*X3+0.797*X4+0.757*X5+0.744*X6+0.709*X7+0.844*X8+0.821*X9F2=0.613*X1-0.265*X2-0.358*X3-0.426*X4-0.460*X5+0.612*X6+0.594*X7-0.015*X8-0.180*X9F3=0.126*X1+0.613*X2+0.555*X3-0.251*X4-0.259*X5-0.005*X6-0.012*X7-0.276*X8-0.354*X9請(qǐng)參閱圖3,為本發(fā)明一種用戶行為評(píng)價(jià)方法的第二實(shí)施方式的流程圖,該實(shí)施方式與圖1所示的實(shí)施方式相比,還包括如下步驟:步驟S23,根據(jù)用戶行為的評(píng)價(jià)結(jié)果進(jìn)行排序,以確定置信閾值。其中,該置信閾值用于預(yù)測(cè)該用戶在接下來的UGC(用戶生成內(nèi)容)是否屬于垃圾信息。圖2中的其他步驟可以參閱圖1及對(duì)應(yīng)的文字說明。進(jìn)一步地,服務(wù)器還可以將評(píng)分滿足第四預(yù)定條件的用戶的用戶信息/用戶行為發(fā)送至另一服務(wù)器,使另一服務(wù)器對(duì)該用戶信息/用戶行為進(jìn)行分析以獲取相關(guān)信息。具體地,根據(jù)該用戶行為的評(píng)價(jià)結(jié)果進(jìn)行排序,以確定評(píng)分滿足該第四預(yù)定條件的用戶信息,并將評(píng)分滿足第四預(yù)定條件的用戶信息及/或用戶行為發(fā)送至該另一服務(wù)器,使該另一服務(wù)器對(duì)用戶信息和/或用戶行為進(jìn)行分析以獲取相關(guān)信息。在本實(shí)施方式中,按照評(píng)分從高到低的順序進(jìn)行排列,該第四預(yù)定條件為評(píng)分最高的用戶的信息,其中,該用戶信息至少包括用戶名。在其他實(shí)施方式中,該第四預(yù)定信息為根據(jù)排序結(jié)果確定前N個(gè)的用戶的信息,N為自然數(shù)。當(dāng)確定評(píng)分滿足第四預(yù)定條件的用戶的信息時(shí),即,評(píng)價(jià)最高的一個(gè)(或幾個(gè))用戶時(shí),服務(wù)器還將這些用戶信息/用戶行為發(fā)送至相應(yīng)的服務(wù)器進(jìn)行信息分析、保存、操作、管理等相關(guān)操作。例如,當(dāng)論壇為生理健康知識(shí)相關(guān)的論壇時(shí),用戶在該論壇中發(fā)布的帖子基本上均為養(yǎng)生、治療、癥狀等相關(guān)內(nèi)容的帖子。根據(jù)如上所述的用戶行為評(píng)價(jià)方法對(duì)每個(gè)(或從中抽取的特定數(shù)量的)用戶的用戶行為進(jìn)行評(píng)價(jià)而得到對(duì)應(yīng)的評(píng)價(jià)分?jǐn)?shù)。該服務(wù)器將這些用戶的用戶信息/用戶行為發(fā)送至一醫(yī)院網(wǎng)站服務(wù)器,使該醫(yī)院網(wǎng)站服務(wù)器從這些用戶信息/用戶行為提取帖子摘要關(guān)鍵字,或者用戶ID等帖子特征,并進(jìn)行相關(guān)的數(shù)據(jù)分析以得到所需信息,如,哪些用戶正在的關(guān)注的醫(yī)療領(lǐng)域,并向這些用戶推送相關(guān)的醫(yī)藥產(chǎn)品、廣告等。請(qǐng)參閱圖4,為本發(fā)明實(shí)施方式的一種用戶行為評(píng)價(jià)裝置的結(jié)構(gòu)示意圖,該裝置30包括:獲取模塊31、統(tǒng)計(jì)模塊32以及評(píng)價(jià)模塊33。該獲取模塊31用于用戶請(qǐng)求日志,根據(jù)該用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志。其中,該用戶行為日志記錄了用戶對(duì)應(yīng)用程序各個(gè)功能點(diǎn)的操作行為記錄,包括功能點(diǎn)、操作時(shí)間和操作時(shí)長(zhǎng)等信息。用戶登錄服務(wù)器運(yùn)行的論壇等信息發(fā)布平臺(tái)發(fā)布帖子,發(fā)布的帖子通常包括標(biāo)題、內(nèi)容、發(fā)布者的身份信息ID,例如,用戶名、用戶的網(wǎng)絡(luò)地址等。并且,服務(wù)器根據(jù)該需要被評(píng)價(jià)的用戶發(fā)布帖子的時(shí)間、數(shù)量以及對(duì)發(fā)布的帖子的回復(fù)、瀏覽、收藏等記錄用戶的操作行為,形成該用戶請(qǐng)求日志。獲取模塊31根據(jù)該用戶請(qǐng)求日志,整理出用戶在應(yīng)用程序上的操作行為,以形成該用戶行為日志。在本實(shí)施方式中,該用戶行為日志包括該需要被評(píng)價(jià)的用戶如下11項(xiàng)因子:總活躍天數(shù)、歷史活躍發(fā)表帖子天數(shù)、歷史發(fā)表帖子次數(shù)、近三十天天瀏覽帖子次數(shù)、近三十天回復(fù)天數(shù)、近三十天回復(fù)次數(shù)、近三十天收藏天數(shù)、近三十天收藏的次數(shù)。在本實(shí)施方式中,根據(jù)帖子內(nèi)容和用戶行為特點(diǎn),同時(shí)選取如上所述的11個(gè)因子作為評(píng)價(jià)該用戶的因子,還可以從如上所述的11個(gè)因子中選擇一個(gè)或多個(gè)因子作為帖子的特征。但是,在其他實(shí)施方式中,可以根據(jù)情況選擇因子,并不僅限于如上列出的11個(gè)因子。進(jìn)一步地,獲取模塊31還過濾數(shù)據(jù)不全的用戶請(qǐng)求日志,以保留下有效的日志項(xiàng),從而得到用戶行為日志。該統(tǒng)計(jì)模塊32用于根據(jù)該獲取模塊31生成的用戶行為日志進(jìn)行統(tǒng)計(jì)而得到用戶的操作行為。該統(tǒng)計(jì)模塊32根據(jù)用戶行為日志統(tǒng)計(jì)用戶的操作行為,具體為:以天為單位,根據(jù)用戶行為日志統(tǒng)計(jì)該用戶當(dāng)天對(duì)各項(xiàng)功能點(diǎn)進(jìn)行操作的操作次數(shù)和時(shí)長(zhǎng)統(tǒng)計(jì),按周和月的時(shí)間粒度對(duì)操作次數(shù)和時(shí)長(zhǎng)統(tǒng)計(jì)結(jié)果進(jìn)行兩重統(tǒng)計(jì)匯總,得到用戶的操作行為。該統(tǒng)計(jì)模塊32具體用于:根據(jù)該用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并計(jì)算各因子的相關(guān)系數(shù)矩陣,以保留相關(guān)性滿足第一預(yù)設(shè)條件的因子;計(jì)算保留下來的各因子的貢獻(xiàn)率;據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為;以及計(jì)算各因子的載荷矩陣,以統(tǒng)計(jì)該用戶的操作行為。其中,該統(tǒng)計(jì)模塊32根據(jù)用戶行為日志確定用于評(píng)價(jià)用戶行為的因子,并根據(jù)各因子的相關(guān)系數(shù)矩陣提取相關(guān)性較強(qiáng)的因子,過濾掉相關(guān)性較低的因子。其中,設(shè)定相關(guān)系數(shù)閾值為0.3,即,第一預(yù)設(shè)條件為相關(guān)性系數(shù)高于0.3,因此將相關(guān)性系數(shù)高于0.3的因子保留下來,形成相關(guān)性較強(qiáng)的因子組合,同時(shí)將相關(guān)性系數(shù)低于0.3的因子過濾。進(jìn)一步地,該統(tǒng)計(jì)模塊32對(duì)保留下來的因子進(jìn)行KMO檢驗(yàn)統(tǒng)計(jì)量和球形檢測(cè)。如果KMO檢測(cè)值能達(dá)到0.7以上,則說明這樣的因子組合可解釋度很高,可以進(jìn)入下一步計(jì)算。該統(tǒng)計(jì)模塊32計(jì)算保留下來的各因子的相關(guān)性系數(shù)矩陣的特征根,并提取特征值大于0.1的成分因子,然后計(jì)算各特征值對(duì)應(yīng)的成分因子的貢獻(xiàn)率。該統(tǒng)計(jì)模塊32根據(jù)計(jì)算得到的保留下來的各因子的貢獻(xiàn)率,確定各因子的累積貢獻(xiàn)率,以統(tǒng)計(jì)所述用戶的操作行為。具體地,該統(tǒng)計(jì)模塊32統(tǒng)計(jì)所有特征值大于0.1的成分因子的累積貢獻(xiàn)率,如果該貢獻(xiàn)率達(dá)到70%以上,則認(rèn)可該因子組合方式。所以,根據(jù)認(rèn)可的因子組合方式確定對(duì)應(yīng)的用戶操作行為,即,由認(rèn)可的選定的因子以得到評(píng)價(jià)用戶行為的參考對(duì)象(用戶操作行為)。該評(píng)價(jià)模塊33用于根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用該評(píng)分對(duì)該用戶進(jìn)行評(píng)價(jià)。具體地,該評(píng)價(jià)模塊33結(jié)合用戶的操作行為的統(tǒng)計(jì)結(jié)果和主成分因子權(quán)重向量,即可計(jì)算用戶置信分(評(píng)分)。請(qǐng)參閱圖5,為本發(fā)明一種用戶行為評(píng)價(jià)裝置的第二實(shí)施方式的結(jié)構(gòu)示意圖,該實(shí)施方式與圖5所示的實(shí)施方式相比,還包括排序模塊44。該排序模塊44用于根據(jù)用戶行為的評(píng)價(jià)結(jié)果進(jìn)行排序,以確定置信閾值。其中,該置信閾值用于預(yù)測(cè)該用戶在接下來的UGC(用戶生成內(nèi)容)是否屬于垃圾信息。圖5中的其他步驟可以參閱圖4及對(duì)應(yīng)的文字說明。進(jìn)一步地,該裝置還可以將評(píng)分滿足第四預(yù)定條件的用戶的用戶信息/用戶行為發(fā)送至另一服務(wù)器,使另一服務(wù)器對(duì)該用戶信息/用戶行為進(jìn)行分析以獲取相關(guān)信息。具體地,該裝置根據(jù)所述用戶行為的評(píng)價(jià)結(jié)果進(jìn)行排序,以確定評(píng)分滿足該第四預(yù)定條件的用戶信息;以及將評(píng)分滿足第四預(yù)定條件的用戶信息及/或用戶行為發(fā)送至該另一服務(wù)器,使該另一服務(wù)器對(duì)用戶信息和/或用戶行為進(jìn)行分析以獲取相關(guān)信息。在本實(shí)施方式中,該裝置按照評(píng)分從高到低的順序進(jìn)行排列,該第四預(yù)定條件為評(píng)分最高的用戶的信息,其中,該用戶信息至少包括用戶名。在其他實(shí)施方式中,該第四預(yù)定信息為根據(jù)排序結(jié)果確定前N個(gè)的用戶的信息,N為自然數(shù)。當(dāng)確定評(píng)分滿足第四預(yù)定條件的用戶的信息時(shí),即,評(píng)價(jià)最高的一個(gè)(或幾個(gè))用戶子時(shí),服務(wù)器還將這些用戶信息/用戶行為發(fā)送至相應(yīng)的服務(wù)器進(jìn)行信息分析、保存、操作、管理等相關(guān)操作。請(qǐng)參閱圖6,為本發(fā)明一種用戶行為評(píng)價(jià)系統(tǒng)的結(jié)構(gòu)示意圖,該實(shí)施方式示出的系統(tǒng)50包括第一服務(wù)器51和第二服務(wù)器52。該第一服務(wù)器51包括獲取模塊510、統(tǒng)計(jì)模塊511、評(píng)價(jià)模塊512以及傳送模塊513。該第二服務(wù)器52為醫(yī)院網(wǎng)站服務(wù)器、學(xué)校網(wǎng)站服務(wù)器等專業(yè)機(jī)構(gòu)服務(wù)器,該第二服務(wù)器52的類型還可以根據(jù)該第一服務(wù)器51進(jìn)行評(píng)價(jià)的帖子所在論壇的類型進(jìn)行選擇。該獲取模塊51用于用戶請(qǐng)求日志,根據(jù)該用戶請(qǐng)求日志記錄的用戶操作行為生成用戶行為日志。其中,該用戶行為日志記錄了用戶對(duì)應(yīng)用程序各個(gè)功能點(diǎn)的操作行為記錄,包括功能點(diǎn)、操作時(shí)間和操作時(shí)長(zhǎng)等信息。該統(tǒng)計(jì)模塊52用于根據(jù)該獲取模塊51生成的用戶行為日志進(jìn)行統(tǒng)計(jì)而得到用戶的操作行為。該評(píng)價(jià)模塊53用于根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用該評(píng)分對(duì)該用戶進(jìn)行評(píng)價(jià)。該傳送模塊513用于將評(píng)分滿足第四預(yù)定條件的用戶的用戶信息/用戶行為發(fā)送至第二服務(wù)器52,使第二服務(wù)器52對(duì)該用戶信息/用戶行為進(jìn)行分析以獲取相關(guān)信息。本發(fā)明提供的一種用戶行為評(píng)價(jià)方法、裝置及系統(tǒng),通過對(duì)根據(jù)用戶請(qǐng)求日志記錄的用戶操作行為生成的用戶行為日志統(tǒng)計(jì)用戶的操作行為,并根據(jù)用戶的操作行為的統(tǒng)計(jì)結(jié)果確定評(píng)分,以利用評(píng)分對(duì)所述用戶進(jìn)行行為評(píng)價(jià),從而自動(dòng)、快速地分離有效的用戶行為及其影響權(quán)重,具有很強(qiáng)的自動(dòng)化和魯棒性。以上所述僅為本發(fā)明的實(shí)施方式,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的
技術(shù)領(lǐng)域:
,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。當(dāng)前第1頁1 2 3