一種關(guān)鍵詞篩選的方法、裝置和設(shè)備的制作方法
【專利摘要】本發(fā)明實施例公開了一種篩選關(guān)鍵詞的方法,包括:采集日志中用戶輸入的關(guān)鍵詞集合;根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。采用本發(fā)明,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率。
【專利說明】一種關(guān)鍵詞篩選的方法、裝置和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機(jī)領(lǐng)域,尤其涉及關(guān)鍵詞篩選的方法、裝置和設(shè)備。
【背景技術(shù)】
[0002]現(xiàn)有很多電子商務(wù)網(wǎng)站采用分析日志統(tǒng)計關(guān)鍵詞,然后根據(jù)統(tǒng)計結(jié)果進(jìn)行人工配置的方式來收集關(guān)鍵詞得到提示詞集合。
[0003]冷門關(guān)鍵詞指用戶很少搜索的關(guān)鍵詞,只能給網(wǎng)站帶來很少的流量,網(wǎng)站的大部分流量都是由熱門關(guān)鍵詞引入的,因此為了優(yōu)化網(wǎng)站的資源,往往需要人工配置收集關(guān)鍵詞的方法以保證較高的精準(zhǔn)度,但是工作量極大,存在著無法及時更新和淘汰已成為冷門關(guān)鍵詞的問題,特別是對于有海量數(shù)據(jù)的電子商務(wù)網(wǎng)站。
【發(fā)明內(nèi)容】
[0004]本發(fā)明實施例所要解決的技術(shù)問題在于,提供一種關(guān)鍵詞篩選的方法、裝置和設(shè)備。可自動淘汰冷門關(guān)鍵詞。
[0005]為了解決上述技術(shù)問題,本發(fā)明實施例提供了一種篩選關(guān)鍵詞的方法,包括:
[0006]采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合;
[0007]根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;
[0008]若所述目標(biāo)關(guān)鍵詞 的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵
ο
[0009]其中,還包括:
[0010]若所述目標(biāo)關(guān)鍵詞的得分大于所述第一預(yù)置值且小于第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合;
[0011]若所述目標(biāo)關(guān)鍵詞的得分大于所述第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至提示詞集合。
[0012]其中,計算所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
[0013]FScore (χ) = a ^FCommdiyScore (χ) + a 2*FQueryScore (χ) + α 3*FHotSaleScore (x);
[0014]其中α ρ α 2和α 3為權(quán)重參數(shù),且α ^ α 2+ α 3 = I ;
[0015]FScore(X)為目標(biāo)關(guān)鍵詞χ的得分,FCommdiyScore (χ)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到的;
[0016]FQueryScore (χ)為查詢熱度得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)計算得到的;
[0017]FHotSaleScore (χ)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率計算得到的。[0018]其中,根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到所述相關(guān)性得分包括:
[0019]根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量和排名為前N位的關(guān)鍵詞的檢索數(shù)量的總和計算得到;
[0020]其中,N為預(yù)置的關(guān)鍵詞的數(shù)量,關(guān)鍵詞的檢索數(shù)量越多則該關(guān)鍵詞的排名越靠
N /.刖。
[0021]其中,根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到所述查詢熱度得分包括:
[0022]根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)和上次目標(biāo)關(guān)鍵詞X的查詢熱度得分計算得到。
[0023]其中,根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量計算得到所述轉(zhuǎn)化率得分包括:
[0024]所根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率和預(yù)置的關(guān)鍵詞的數(shù)量N計算得到。
[0025]相應(yīng)地,本發(fā)明實施例還提供了一種關(guān)鍵詞篩選裝置,包括:
[0026]采集模塊,用于采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合;
[0027]計算模塊,用于根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;
[0028]刪除模塊,用于若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞 。
[0029]其中,還包括:
[0030]判斷模塊,用于若所述目標(biāo)關(guān)鍵詞的得分大于所述第一預(yù)置值且小于第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合,若所述目標(biāo)關(guān)鍵詞的得分大于所述第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至提示詞集合。
[0031]其中,所述計算模塊包括:
[0032]獲取單元,用于獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率三個參數(shù);
[0033]計算單元,用于根據(jù)所述獲取單元獲取的關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;
[0034]其中,所述計算單元計算所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
[0035]FScore (χ) = a I^FCommdiyScore(χ) + a 2*FQueryScore(χ) + α 3*FHotSaleScore(X),其中Ct P Ct 2和α 3為權(quán)重參數(shù),且α ι+α 2+α 3 = I,F(xiàn)Score(X)為目標(biāo)關(guān)鍵詞χ的得分;FC0mmdiySc0re(X)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到的;FQuerySC0re(X)為查詢檢索次數(shù)得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)計算得到的;FH0tSaleSC0re(X)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率計算得到的。
[0036]相應(yīng)地,本發(fā)明實施例還提供了一種電子設(shè)備,,包括上述任一種裝置
[0037]實施本發(fā)明實施例,具有如下有益效果:
[0038]實施本發(fā)明的實施例,通過采集日志中用戶輸入的關(guān)鍵詞集合,并根據(jù)關(guān)鍵詞集合獲取目標(biāo)關(guān)鍵詞檢索數(shù) 量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算目標(biāo)關(guān)鍵詞的得分,通過比較得分確定是否淘汰該目標(biāo)關(guān)鍵詞,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率?!緦@綀D】
【附圖說明】
[0039]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0040]圖1是本發(fā)明的一種關(guān)鍵詞篩選的方法的流程示意圖;
[0041]圖2是本發(fā)明的一種關(guān)鍵詞篩選方法的另一種流程示意圖;
[0042]圖3是本發(fā)明的一種關(guān)鍵詞篩選裝置的結(jié)構(gòu)示意圖;
[0043]圖4是本發(fā)明實施例的一種關(guān)鍵詞篩選裝置的另一結(jié)構(gòu)示意圖;
[0044]圖5是圖4中計算模塊的結(jié)構(gòu)示意圖。
【具體實施方式】
[0045]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0046]參見圖1,本發(fā)明的一種關(guān)鍵詞的篩選方法的流程示意圖,該方法包括:
[0047]步驟101、采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合。
[0048]具體的,服務(wù)器的日志中記錄有用戶的訪問記錄,從日志中獲取一個時段的關(guān)鍵詞集合,所述關(guān)鍵詞集合中包括各用戶的輸入的關(guān)鍵詞和根據(jù)該關(guān)鍵詞得到的搜索結(jié)果等信息,所述關(guān)鍵詞檢索數(shù)量指用戶輸入一個關(guān)鍵詞得到的檢索結(jié)果的數(shù)量。
[0049]步驟102、根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分。
[0050]具體的,目標(biāo)關(guān)鍵詞指在關(guān)鍵詞集合中用戶輸入的關(guān)鍵詞中的任意一個,目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率指由關(guān)鍵詞引入的流量與該關(guān)鍵詞最終達(dá)成的實際轉(zhuǎn)化的比率,比如在電子商務(wù)網(wǎng)站中,使用目標(biāo)關(guān)鍵詞檢索的次數(shù)與達(dá)成交易數(shù)的比率。根據(jù)目標(biāo)關(guān)鍵詞檢索數(shù)量,目標(biāo)關(guān)鍵詞的檢索次數(shù)和目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率這3個參數(shù),利用預(yù)置的公式計算出該目標(biāo)關(guān)鍵詞的得分,將目標(biāo)關(guān)鍵詞進(jìn)行量化。
[0051]步驟103、若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從所述關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。
[0052]具體的,當(dāng)所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值時,則確定該目標(biāo)關(guān)鍵詞為冷門關(guān)鍵詞,則將該目標(biāo)關(guān)鍵詞從關(guān)鍵詞集合中刪除。
[0053]實施本發(fā)明的實施例,通過采集日志中用戶輸入的關(guān)鍵詞集合,并根據(jù)關(guān)鍵詞集合獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算目標(biāo)關(guān)鍵詞的得分,通過比較得分確定是否淘汰該目標(biāo)關(guān)鍵詞,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率。
[0054]參見圖2,為本發(fā)明實施例的一種關(guān)鍵詞篩選方法的另一流程示意圖,該方法包括:
[0055]步驟201、采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合。
[0056]具體的,服務(wù)器的日志中記錄有用戶的訪問記錄,從日志中獲取一個時段的關(guān)鍵詞集合,所述關(guān)鍵詞集合中包括各用戶的輸入的關(guān)鍵詞和根據(jù)該關(guān)鍵詞得到的搜索結(jié)果等信息,例如關(guān)鍵詞集合包括李寧、耐克、喬丹、阿迪達(dá)斯和匡威5個關(guān)鍵詞,同時還包括根據(jù)這5個關(guān)鍵詞得到的搜索信息,如關(guān)鍵詞“李寧”的搜索次數(shù)、關(guān)鍵詞“李寧”的檢索數(shù)量和關(guān)鍵詞“李寧”的轉(zhuǎn)化率。
[0057]步驟201、根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分。
[0058]具體的,所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
[0059]FScore (χ) = a ^FCommdiyScore (χ) + a 2*FQueryScore (χ) + α 3*FHotSaleScore (X),其中α 1、α 2和α 3為權(quán)重參數(shù),且α ^ α 2+α 3 = I,F(xiàn)Score(X)為目標(biāo)關(guān)鍵詞χ的得分,F(xiàn)CommdiyScore (χ)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到的;FQuerySC0re(X)為查詢檢索次數(shù)得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)計算得到的;FH0tSaleSC0re(X)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率計算得到的。
[0060]進(jìn)一步的,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量和排名為前N位的關(guān)鍵詞的檢索數(shù)量的總和計算得到的,其中,N為預(yù)置的關(guān)鍵詞的數(shù)量,關(guān)鍵詞的檢索數(shù)量越多則該關(guān)鍵詞的排名越靠前。例如目標(biāo)關(guān)鍵詞χ為“李寧”,假設(shè)預(yù)置關(guān)鍵詞的數(shù)量為100,則排名第I為的關(guān)鍵詞,其該關(guān)鍵詞的檢索數(shù)量最多。所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)和上次目標(biāo)`關(guān)鍵詞χ的查詢熱度得分計算得到的。所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率和預(yù)置的關(guān)鍵詞的數(shù)量計算得到的。
[0061]進(jìn)一步具體的,F(xiàn)CommdiyScore(x) = BaseScore^v/ (v+m),其中,BaseScore 為網(wǎng)站自定義的基礎(chǔ)得分,V為目標(biāo)關(guān)鍵詞χ的檢索數(shù)量,m為排名為如N位的關(guān)鍵詞的檢索數(shù)量的總和,其中,N為預(yù)置的關(guān)鍵詞的數(shù)量,關(guān)鍵詞的檢索數(shù)量越多則該關(guān)鍵詞的排名越靠前。假設(shè)關(guān)鍵詞χ為“李寧”,Basescore = 500,N = 100,m = 100000,假設(shè)關(guān)鍵詞“李寧”商品數(shù)為1000,即V = 1000,那么該關(guān)鍵詞的相關(guān)性得分FCommdiyScore (X)=500*1000(1000+100000) = 4.95。
[0062]FQueryScore(x) = q+e_aT*LastFQueryScore (χ),其中 q 為目標(biāo)關(guān)鍵詞 x檢索次數(shù),a為衰減系數(shù),T為本次計算和上次計算的時間間隔,一般以天為單位LastFQueryScore(X)為上次目標(biāo)關(guān)鍵詞χ的查詢熱度得分。假設(shè)關(guān)鍵詞李寧的檢索次數(shù)為100次,即q = 100。
[0063]衰減系數(shù)a是用來針對很久沒有用戶檢索的冷詞、生僻詞和曾經(jīng)是時效性極強(qiáng)的熱點詞的查詢得分作衰減處理,衰減系數(shù)a可以根據(jù)如下方法確定:根據(jù)預(yù)定時間內(nèi)統(tǒng)計的目標(biāo)關(guān)鍵詞的查詢熱度得分平均分為500,需要在100天內(nèi)衰減到I分,通過方程500*e_al°° = I來求解衰減系數(shù)a的值。查詢熱度得分的計算公式可以對時效性很強(qiáng)的熱點詞衰減其得分,而對于目前正在變?yōu)闊狳c的關(guān)鍵詞,由于其檢索次數(shù)很高(即q值比較大),衰減因子對其影響幾乎可以忽略,因此可以準(zhǔn)確的對冷門關(guān)鍵詞進(jìn)行衰減處理。
[0064]目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率得分的計算公式包括:[0065]FHotSaleScore (x) = G* {1-[t (x)-1]/N},其中,G為預(yù)置的轉(zhuǎn)化率得分的最大值,t(x)為目標(biāo)關(guān)鍵詞X的轉(zhuǎn)化率的排名順序,N為預(yù)置的關(guān)鍵詞的數(shù)量,其中關(guān)鍵詞的轉(zhuǎn)化率越高則該關(guān)鍵詞的排名越靠前。
[0066]假設(shè)電商網(wǎng)站預(yù)置的轉(zhuǎn)化率得分的最大值為1000,預(yù)置的關(guān)鍵詞的數(shù)量N= 100,則計算轉(zhuǎn)化率排名在100位的關(guān)鍵詞的轉(zhuǎn)化率得分FHotSaleScore(X) = 1000(1-0/100)=1000,轉(zhuǎn)化率排名第50位關(guān)鍵詞的轉(zhuǎn)化率得分為FHotSaleScore (X) = 1000(1-49/100)=510,以此類推,排名在100位之后的關(guān)鍵詞的轉(zhuǎn)化率得分為負(fù)值,為了計算的方便,可以規(guī)定這種情況下的為轉(zhuǎn)化率得分為O。
[0067]步驟203、得分是否大于第二預(yù)置值,當(dāng)判斷為是時,執(zhí)行步驟205,當(dāng)判斷為否時執(zhí)行步驟204。
[0068]步驟204、當(dāng)目標(biāo)關(guān)鍵詞的得分大于第一預(yù)置值時,繼續(xù)判斷所述目標(biāo)關(guān)鍵詞的得分是否小于第一預(yù)置值,若為否,執(zhí)行步驟207,若為是,執(zhí)行步驟206。
[0069]步驟205、將所述目標(biāo)關(guān)鍵詞保存至提示詞集合。
[0070]具體的,當(dāng)目標(biāo)關(guān)鍵詞的得分大于第二預(yù)置值時,表明該目標(biāo)關(guān)鍵詞為熱門關(guān)鍵詞,將其保存在服務(wù)器中的提示詞集合中,用于用戶在下次輸入該目標(biāo)關(guān)鍵詞的前綴時,補(bǔ)充后綴以提示用戶輸入。設(shè)置好閾值后,系統(tǒng)能自動搜集生成關(guān)鍵詞詞典,有利于節(jié)省人力,高效運(yùn)營
[0071]步驟206、從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。
[0072]當(dāng)目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值時,表明該目標(biāo)關(guān)鍵詞為冷門詞,從關(guān)鍵詞集合中刪除該目標(biāo)關(guān)鍵詞。
[0073]步驟207、將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合;
[0074]當(dāng)目標(biāo)關(guān)鍵詞的得分小于第二預(yù)置值且大于第一預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合。
[0075]實施本發(fā)明的實施例,通過采集日志中用戶輸入的關(guān)鍵詞集合,并根據(jù)關(guān)鍵詞集合獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算目標(biāo)關(guān)鍵詞的得分,通過比較得分確定是否淘汰該目標(biāo)關(guān)鍵詞,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率。
[0076]參見圖3,為本發(fā)明實施例的一種關(guān)鍵詞篩選裝置的結(jié)構(gòu)示意圖,該裝置包括:
[0077]采集模塊11,用于采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合。
[0078]具體的,服務(wù)器的日志中記錄有用戶的訪問記錄,采集模塊11從日志中獲取一個時段的關(guān)鍵詞集合,所述關(guān)鍵詞集合中包括各用戶的輸入的關(guān)鍵詞和根據(jù)該關(guān)鍵詞得到的搜索結(jié)果等信息,例如關(guān)鍵詞集合包括李寧、耐克、喬丹、阿迪達(dá)斯和匡威5個關(guān)鍵詞,同時還包括根據(jù)這5個關(guān)鍵詞得到的搜索信息,如關(guān)鍵詞“李寧”的搜索次數(shù)、包含關(guān)鍵詞“李寧”的檢索數(shù)量和關(guān)鍵詞“李寧”的轉(zhuǎn)化率。
[0079]計算模塊12,用于根據(jù)采集模塊11采集的所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分。
[0080]具體的,目標(biāo)關(guān)鍵詞指在關(guān)鍵詞集合中用戶輸入的關(guān)鍵詞中的任意一個,目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率指由關(guān)鍵詞引入的流量與該關(guān)鍵詞最終達(dá)成的實際轉(zhuǎn)化的比率,比如在電子商務(wù)網(wǎng)站中,使用目標(biāo)關(guān)鍵詞檢索的次數(shù)與達(dá)成交易數(shù)的比率。根據(jù)目標(biāo)關(guān)鍵詞檢索數(shù)量,目標(biāo)關(guān)鍵詞的檢索次數(shù)和目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率這3個參數(shù),計算模塊12利用預(yù)置的公式計算出該目標(biāo)關(guān)鍵詞的得分,將目標(biāo)關(guān)鍵詞進(jìn)行量化。
[0081]刪除模塊13,用于若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。
[0082]具體的,刪除模塊13判斷所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值時,則確定該目標(biāo)關(guān)鍵詞為冷門關(guān)鍵詞,將該目標(biāo)關(guān)鍵詞從關(guān)鍵詞集合中刪除。
[0083]實施本發(fā)明的實施例,通過采集日志中用戶輸入的關(guān)鍵詞集合,并根據(jù)關(guān)鍵詞集合獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算目標(biāo)關(guān)鍵詞的得分,通過比較得分確定是否淘汰該目標(biāo)關(guān)鍵詞,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率。
[0084]進(jìn)一步的,參見圖4和圖5,所述關(guān)鍵詞篩選裝置還包括;
[0085]判斷模塊14,用于若所述目標(biāo)關(guān)鍵詞的得分大于所述第一預(yù)置值且小于第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合,若所述目標(biāo)關(guān)鍵詞的得分大于所述第二預(yù)置值時,將所述得分對用的關(guān)鍵詞保存至提示詞集合。
[0086]其中,所述計算模塊12包括:
[0087]獲取單元121,用于獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率三個參數(shù);
[0088]計算單元122,用于根據(jù)所述獲取單元121獲取的關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;`
[0089]其中,所述計算單元122計算所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
[0090]FScore (x) = a I^FCommdiyScore(χ) + a 2*FQueryScore(χ) + α 3*FHotSaleScore(X),其中Ct P Ct 2和α 3為權(quán)重參數(shù),且α ι+α 2+α 3 = I,F(xiàn)Score(X)為目標(biāo)關(guān)鍵詞χ的得分;FC0mmdiySc0re(X)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到的;FQuerySC0re(X)為查詢檢索次數(shù)得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)計算得到的;FH0tSaleSC0re(X)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率計算得到的。
[0091]具體的,F(xiàn)CommdiyScore(x)= BaseScore^v/(v+m),其中,BaseScore 為網(wǎng)站自定義的基礎(chǔ)得分,V為目標(biāo)關(guān)鍵詞χ的檢索數(shù)量,m為包含排名為如N位的關(guān)鍵詞的檢索數(shù)量的總和,其中,N為預(yù)置的關(guān)鍵詞的數(shù)量,包含關(guān)鍵詞的檢索數(shù)量越多則該關(guān)鍵詞的排名越靠前。假設(shè)關(guān)鍵詞χ為“李寧”,Basescore = 500,N = 100,m = 100000,假設(shè)關(guān)鍵詞“李寧”商品數(shù)為1000,即V = 1000,那么該關(guān)鍵詞的相關(guān)性得分FCommdiyScore (X)=500*1000(1000+100000) = 4.95。
[0092]FQueryScore(x) = q+e_aT*LastFQueryScore (χ),其中 q 為目標(biāo)關(guān)鍵詞 x檢索次數(shù),a為衰減系數(shù),T為本次計算和上次計算的時間間隔,一般以天為單位LastFQueryScore(X)為上次目標(biāo)關(guān)鍵詞χ的查詢熱度得分。假設(shè)關(guān)鍵詞李寧的檢索次數(shù)為100次,即q = 100。
[0093]衰減系數(shù)a是用來針對很久沒有用戶檢索的冷詞、生僻詞和曾經(jīng)是時效性極強(qiáng)的熱點詞的查詢得分作衰減處理,衰減系數(shù)a可以根據(jù)如下方法確定:根據(jù)預(yù)定時間內(nèi)統(tǒng)計的目標(biāo)關(guān)鍵詞的查詢熱度得分平均分為500,需要在100天內(nèi)衰減到I分,通過方程500*e_al°° = I來求解衰減系數(shù)a的值。查詢熱度得分的計算公式可以對時效性很強(qiáng)的熱點詞衰減其得分,而對于目前正在變?yōu)闊狳c的關(guān)鍵詞,由于其檢索次數(shù)很高(即q值比較大),衰減因子對其影響幾乎可以忽略,因此可以準(zhǔn)確的對冷門關(guān)鍵詞進(jìn)行衰減處理。
[0094]目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率得分的計算公式包括:
[0095]FHotSaleScore(X) = G* {1-[t (χ)-1]/N},其中,G為預(yù)置的轉(zhuǎn)化率得分的最大值,t(x)為目標(biāo)關(guān)鍵詞X的轉(zhuǎn)化率的排名順序,N為預(yù)置的關(guān)鍵詞的數(shù)量,其中關(guān)鍵詞的轉(zhuǎn)化率越高則該關(guān)鍵詞的排名越靠前。
[0096]假設(shè)電商網(wǎng)站預(yù)置的轉(zhuǎn)化率得分的最大值為1000,預(yù)置的關(guān)鍵詞的數(shù)量N= 100,則計算轉(zhuǎn)化率排名在100位的關(guān)鍵詞的轉(zhuǎn)化率得分FHotSaleScore(X) = 1000(1-0/100)=1000,轉(zhuǎn)化率排名第50位關(guān)鍵詞的轉(zhuǎn)化率得分為FHotSaleScore (χ) = 1000(1-49/100)=510,以此類推,排名在100位之后的關(guān)鍵詞的轉(zhuǎn)化率得分為負(fù)值,為了計算的方便,可以規(guī)定這種情況下的為轉(zhuǎn)化率得分為O。
[0097]實施本發(fā)明的實施例,通過采集日志中用戶輸入的關(guān)鍵詞集合,并根據(jù)關(guān)鍵詞集合獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和包含所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算目標(biāo)關(guān)鍵詞的得分,通過比較得分確定是否淘汰該目標(biāo)關(guān)鍵詞,能迅速準(zhǔn)確的淘汰掉成為冷門的關(guān)鍵詞,避免過多了占用服務(wù)器的空間,提高了運(yùn)行的效率。
[0098]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例方法中的全部或部分流程,是可以通過計算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計算機(jī)可讀取存儲介質(zhì)中,該程序在執(zhí)行時,可包括如上述各方法的實施例的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory, ROM)或隨機(jī)存儲記憶體(Random AccessMemory, RAM)等。
[0099]以上所揭露的僅為本發(fā)明一種較佳實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分流程,并依本發(fā)明權(quán)利要求所作的等同變化,仍屬于發(fā)明所涵蓋的范圍。
【權(quán)利要求】
1.一種關(guān)鍵詞篩選的方法,其特征在于,包括: 采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合; 根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分; 若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。
2.如權(quán)利要求1所述的方法,其特征在于,還包括: 若所述目標(biāo)關(guān)鍵詞的得分大于所述第一預(yù)置值且小于第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合; 若所述目標(biāo)關(guān)鍵詞的得分大于所述第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至提示詞集入口 ο
3.如權(quán)利要求2所述的方法,其特征在于,計算所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
FScore(x) = a ^FCommdiyScore (x) + a 2*FQueryScore (x) + a 3*FHotSaleScore (x);
其中a p a 2和a 3為權(quán)重參數(shù),且a汴a 2+ a 3 = I ; FScore (x)為目標(biāo)關(guān)鍵詞x的得分,FCommdiyScore (x)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量計算得到的; FQueryScore (x)為查詢熱度得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞x的檢索次數(shù)計算得到的; FHotSaleScore (x)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞x的轉(zhuǎn)化率計算得到的。
4.如權(quán)利要求3所述的方法,其特征在于,根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量計算得到所述相關(guān)性得分包括: 根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量和排名為前N位的關(guān)鍵詞的檢索數(shù)量的總和計算得到; 其中,N為預(yù)置的關(guān)鍵詞的數(shù)量,關(guān)鍵詞的檢索數(shù)量越多則該關(guān)鍵詞的排名越靠前。
5.如權(quán)利要求3所述的方法,其特征在于,根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量計算得到所述查詢熱度得分包括: 根據(jù)目標(biāo)關(guān)鍵詞X的檢索次數(shù)和上次目標(biāo)關(guān)鍵詞X的查詢熱度得分計算得到。
6.如權(quán)利要求3所述的方法,其特征在于,根據(jù)目標(biāo)關(guān)鍵詞X的檢索數(shù)量計算得到所述轉(zhuǎn)化率得分包括: 根據(jù)目標(biāo)關(guān)鍵詞X的轉(zhuǎn)化率和預(yù)置的關(guān)鍵詞的數(shù)量N計算得到。
7.—種關(guān)鍵詞篩選裝置,其特征在于,包括: 采集模塊,用于采集日志中用戶輸入的至少包括關(guān)鍵詞檢索數(shù)量、關(guān)鍵詞檢索次數(shù)和關(guān)鍵詞轉(zhuǎn)化率的關(guān)鍵詞集合; 計算模塊,用于根據(jù)所述關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分; 刪除模塊,用于若所述目標(biāo)關(guān)鍵詞的得分小于第一預(yù)置值,則從關(guān)鍵詞集合中刪除所述目標(biāo)關(guān)鍵詞。
8.如權(quán)利要求7所述的裝置,其特征在于,還包括:判斷模塊,用于若所述目標(biāo)關(guān)鍵詞的得分大于所述第一預(yù)置值且小于第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至觀察詞集合,若所述目標(biāo)關(guān)鍵詞的得分大于所述第二預(yù)置值時,將所述目標(biāo)關(guān)鍵詞保存至提示詞集合。
9.如權(quán)利要求8所述的裝置,其特征在于,所述計算模塊包括: 獲取單元,用于獲取目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率三個參數(shù); 計算單元,用于根據(jù)所述獲取單元獲取的關(guān)鍵詞集合中包含的目標(biāo)關(guān)鍵詞檢索數(shù)量、所述目標(biāo)關(guān)鍵詞的檢索次數(shù)和所述目標(biāo)關(guān)鍵詞的轉(zhuǎn)化率來計算所述目標(biāo)關(guān)鍵詞的得分;其中,所述計算單元計算所述目標(biāo)關(guān)鍵詞的得分的計算公式包括:
FScore(x) = a I^FCommdiyScore(χ) + α 2*FQueryScore(χ) + α 3*FHotSaleScore(χ),其中α η α 2和α 3為權(quán)重參數(shù),且ct ^ α 2+α 3 = I,F(xiàn)Score(x)為目標(biāo)關(guān)鍵詞χ的得分;FCommdiyScore (χ)為相關(guān)性得分,所述相關(guān)性得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索數(shù)量計算得到的;FQuerySC0re(X)為查詢檢索次數(shù)得分,所述查詢檢索次數(shù)得分是根據(jù)目標(biāo)關(guān)鍵詞χ的檢索次數(shù)計算得到的;FH0tSaleSC0re(X)為轉(zhuǎn)化率得分的,所述轉(zhuǎn)化率得分是根據(jù)目標(biāo)關(guān)鍵詞χ的轉(zhuǎn)化率計算得到的。
10.一種電子設(shè)備,·其特征在于,包括如權(quán)利要求7-9任一項所述的裝置。
【文檔編號】G06F17/30GK103823803SQ201210464019
【公開日】2014年5月28日 申請日期:2012年11月16日 優(yōu)先權(quán)日:2012年11月16日
【發(fā)明者】姚小龍, 馬超, 朱正平, 胡德鳳 申請人:騰訊科技(深圳)有限公司