欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

點擊率預估模型建立方法、裝置及信息提供方法、系統(tǒng)的制作方法

文檔序號:9376007閱讀:279來源:國知局
點擊率預估模型建立方法、裝置及信息提供方法、系統(tǒng)的制作方法
【技術領域】
[0001] 本申請涉及網絡技術領域,尤其涉及一種點擊率(Click Through Ratio,CTR)預估 模型建立方法、裝置及信息提供方法、系統(tǒng)。
【背景技術】
[0002] 隨著電子商務的全球化發(fā)展,越來越多的電子商務網站采用多個語言頻道,例如 某電子商務網站可以同時提供中文、西班牙文、英文、法文、日文、韓文六個語言頻道,由于 面向地區(qū)的差異,這些語言頻道中包含的信息可能不完全相同。
[0003] 若用戶在電子商務網站上搜索需要的商品,可以通過搜索引擎輸入搜索詞 (query),服務器根據(jù)該query挑選出相關的展示信息并對這些展示信息進行CTR預估,按 照CTR預估結果將排序后的展示信息提供給用戶,以供用戶選擇。將展示信息在電子商務 網站上被點擊次數(shù)與被展示次數(shù)的比值定義為CTR,用來表征展示信息被關注的程度。CTR 預估是電子商務網站提供展示信息時非常重要的一個環(huán)節(jié),在對展示信息進行CTR預估時 需要使用CTR預估模型,而CTR預估模型準確性的高低會直接影響提供展示信息的準確性 和用戶體驗。
[0004] 目前,CTR預估模型大多是基于反饋特征的線性模型,首先由人工從歷史特征中 排定出有效特征,并獲取這些有效特征的歷史點擊率(Historical Click Through Ratio, HCTR),將基于有效特征的HCTR作為線性模型的輸入特征,通過邏輯回歸模型(Logistic Regression,LR)訓練,由人工建立一個CTR預估模型。當電子商務網站包括多個語言頻道 時,針對每個語言頻道都需要建立一個CTR預估模型,每個語言頻道的歷史特征都要由人 工確定,這種方式過分受限于人為因素,導致建立CTR預估模型的效率和CTR預估模型的準 確性都非常低。因此,目前亟需一種適用于多個語言頻道的CTR預估模型自動建立方法。

【發(fā)明內容】

[0005] 本申請實施例提供一種CTR預估模型建立方法、裝置及信息提供方法、系統(tǒng),用以 實現(xiàn)自動建立適用于多個語言頻道的CTR預估模型。
[0006] 根據(jù)本申請實施例,提供一種信息提供方法,包括:
[0007] 從與當前語言頻道對應的歷史數(shù)據(jù)中提取出基礎特征,組合所述基礎特征得到組 合特征;
[0008] 根據(jù)所述基礎特征和所述組合特征得到有效高階特征,并計算所述有效高階特征 的權重;以及
[0009] 將所述有效高階特征及其對應的權重帶入到點擊率CTR計算公式中,得到所述當 前語言頻道的CTR預估模型。
[0010] 具體的,從與當前語言頻道對應的歷史數(shù)據(jù)中提取出基礎特征,具體包括:
[0011] 獲取所述歷史數(shù)據(jù)包括的歷史特征;
[0012] 將所述歷史特征按照最小語義單元進行分割,得到所述基礎特征。
[0013] 具體的,組合所述基礎特征得到組合特征,具體包括:
[0014] 組合任意兩個所述基礎特征得到候選組合特征;
[0015] 從所述歷史數(shù)據(jù)包括的歷史特征的歷史CTR中查找所述候選組合特征的歷史 CTR ;
[0016] 根據(jù)所述基礎特征的預設權重、所述候選組合特征的歷史CTR和回歸函數(shù)計算所 述候選組合特征的權重;
[0017] 選取權重大于第一設定閾值的候選組合特征得到所述組合特征。
[0018] 具體的,根據(jù)所述基礎特征和所述組合特征得到有效高階特征,并計算所述有效 高階特征的權重,具體包括:
[0019] 組合所述基礎特征和所述組合特征中的至少一者得到候選高階特征;
[0020] 從所述候選高階特征中選取出有效高階特征;
[0021] 從所述歷史數(shù)據(jù)包括的歷史特征的歷史CTR中查找所述有效高階特征的歷史 CTR ;
[0022] 根據(jù)所述有效高階特征的歷史CTR和CTR計算公式計算所述有效高階特征的權 重。
[0023] 具體的,從所述候選高階特征中選取出有效高階特征,具體包括至少一種:
[0024] 從所述歷史特征的歷史CTR中獲取所述候選高階特征的歷史CTR,選取歷史CTR大 于第二設定閾值的候選高階特征得到所述有效高階特征;
[0025] 將所述候選高階特征分別帶入包括損失函數(shù)和正則化項的目標函數(shù)中,對所述目 標函數(shù)求梯度,選取所述損失函數(shù)的梯度的絕對值大于所述正則化項的系數(shù)對應的候選高 階特征得到所述有效高階特征。
[0026] 可選的,得到所述當前語言頻道的CTR預估模型之后,還包括:
[0027] 評估所述當前語言頻道的CTR預估模型是否合格;
[0028] 若所述當前語言頻道的CTR預估模型不合格,則重新執(zhí)行所述從與當前語言頻道 對應的歷史數(shù)據(jù)中提取出基礎特征的步驟。
[0029] 具體的,評估所述當前語言頻道的CTR預估模型是否合格,具體包括:
[0030] 若所述有效高階特征的數(shù)量未達到設定數(shù)值,根據(jù)所述有效高階特征及其對應的 權重繪制受試者工作特征ROC曲線,計算所述ROC曲線的曲線下面積AUC值,若AUC值大于 第三設定閾值,則確定所述當前語言頻道的CTR預估模型合格,若AUC值小于或者等于所述 第三設定閾值,則確定所述當前語言頻道的CTR預估模型不合格;或者,
[0031] 若所述有效高階特征的數(shù)量未達到所述設定數(shù)值,將所述有效高階特征帶入所述 當前語言頻道的CTR預估模型中計算所述有效高階特征的預估CTR,從所述歷史數(shù)據(jù)包括 的歷史特征的歷史CTR中獲取所述有效高階特征的歷史CTR,計算所述有效高階特征的歷 史CTR與預估CTR的均方誤差MSE,若所述MSE小于第四設定閾值,則確定所述當前語言頻 道的CTR預估模型合格,若所述MSE小于或者等于所述第四設定閾值,則確定所述當前語言 頻道的CTR預估模型不合格。
[0032] 還提供一種點擊率預估模型建立裝置,包括:
[0033] 提取組合單元,用于從與當前語言頻道對應的歷史數(shù)據(jù)中提取出基礎特征,組合 所述基礎特征得到組合特征;
[0034] 計算單元,用于根據(jù)所述基礎特征和所述組合特征得到有效高階特征,并計算有 效高階特征的權重;以及
[0035] 獲取單元,用于將所述有效高階特征及其對應的權重帶入到點擊率CTR計算公式 中,得到所述當前語言頻道的CTR預估模型。
[0036] 具體的,所述提取組合單元,具體用于:
[0037] 獲取所述歷史數(shù)據(jù)包括的歷史特征;
[0038] 將所述歷史特征按照最小語義單元進行分割,得到所述基礎特征。
[0039] 具體的,所述提取組合單元,具體用于:
[0040] 組合任意兩個所述基礎特征組合得到候選組合特征;
[0041] 從所述歷史數(shù)據(jù)包括的歷史特征的歷史CTR中查找所述候選組合特征的歷史 CTR ;
[0042] 根據(jù)所述基礎特征的預設權重、所述候選組合特征的歷史CTR和回歸函數(shù)計算所 述候選組合特征的權重;
[0043] 選取權重大于第一設定閾值的候選組合特征得到所述組合特征。
[0044] 具體的,所述計算單元,具體用于:
[0045] 組合所述基礎特征和所述組合特征中的至少一者得到候選高階特征;
[0046] 從所述候選高階特征中選取出有效高階特征;
[0047] 從所述歷史數(shù)據(jù)包括的歷史特征的歷史CTR中查找所述有效高階特征的歷史 CTR ;
[0048] 根據(jù)所述有效高階特征的歷史CTR和CTR計算公式計算所述有效高階特征的權 重。
[0049] 具體的,所述計算單元,用于從所述候選高階特征中選取出有效高階特征,具體用 于至少一種:
[0050] 從所述歷史特征的歷史CTR中獲取所述候選高階特征的歷史CTR,選取歷史CTR大 于第二設定閾值的候選高階特征得到所述有效高階特征;
[0051] 將所述候選高階特征分別帶入包括損失函數(shù)和正則化項的目標函數(shù)中,對所述目 標函數(shù)求梯度,選取所述損失函數(shù)的梯度的絕對值大于所述正則化項的系數(shù)對應的候選高 階特征得到所述有效高階特征。
[0052] 可選的,還包括評估單元,用于:
[0053] 評估所述當前語言頻道的CTR預估模型是否合格;
[0054] 若所述當前語言頻道的CTR預估模型不合格,則重新轉向所述提取組合單元。
[0055] 具體的,所述評估單元,具體用于:
[0056] 若所述有效高階特征的數(shù)量未達到設定數(shù)值,根據(jù)所述有效高階特征及其對應的 權重繪制受試者工作特征ROC曲線,計算所述ROC曲線的曲線下面積AUC值,若AUC值大于 第三設定閾值,則確定所述當前語言頻道的CTR預估模型合格,若AUC值小于或者等于所述 第三設定閾值,則確定所述當前語言頻道的CTR預估模型不合格;或者,
[0057] 若所述有效高階特征的數(shù)量未達到所述設定數(shù)值,將所述有效高階特征帶入所述 當前語言頻道的CTR預估模型中計算所述有效高階特征的預估CTR,從所述歷史數(shù)據(jù)包括 的歷史特征的歷史CTR中獲取所述有效高階特征的歷史CTR,計算所述有效高階特征的歷 史CTR與預估CTR的均方誤差MSE,若所述MSE小于第四設定閾值,則確定所述當前語言頻 道的CTR預估模型合格,若所述MSE小于或者等于所述第四設定閾值,則確定所述當前語言 頻道的CTR預估模型不合格。
[0058] 還提供一種信息提供方法,包括:
[0059] 根據(jù)用戶輸入的搜索信息,確定與所述搜索信息匹配的語言頻道以及候選展示信 息;
[0060] 獲取所述語言頻道的點擊率CTR預估模型,并使用所述CTR預估模型計算每個候 選展示信息的預估CTR,其中,
當前第1頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
塔河县| 焦作市| 竹溪县| 绩溪县| 阳新县| 芦溪县| 安阳县| 枣庄市| 宝鸡市| 兴和县| 永城市| 纳雍县| 洛扎县| 千阳县| 苍溪县| 靖西县| 佛冈县| 诏安县| 江华| 会泽县| 波密县| 平阳县| 本溪| 临沧市| 瑞丽市| 浦城县| 丰台区| 乳山市| 永城市| 丹东市| 冀州市| 平顺县| 大渡口区| 武城县| 泾川县| 溧阳市| 新宁县| 鲁甸县| 昭觉县| 阜宁县| 西青区|