1.一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,包括:
2.根據(jù)權利要求1所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述根據(jù)提取的資源信息特征進行分類模型加權,包括通過計算每個特征在不同類別中的出現(xiàn)頻率和卡方統(tǒng)計量,篩選出具有區(qū)分能力的特征,通過貝葉斯分類計算每個詞在不同類別中的先驗概率和后驗概率,選擇后驗概率最大的類別作為文檔的分類,所述貝葉斯分類的計算公式為:
3.根據(jù)權利要求2所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述根據(jù)提取的資源信息特征進行分類模型加權,還包括利根據(jù)欄目信息對業(yè)務的重要性設置欄目系數(shù),通過將貝葉斯后驗概率與欄目系數(shù)相乘,得到每個文檔的初步權重。
4.根據(jù)權利要求3所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述根據(jù)提取的資源信息特征進行資源熱度加權,包括獲取搜索日志統(tǒng)計資源近期訪問量,并設置資源熱度超參數(shù),用于調(diào)整資源熱度的權重,基于資源近期訪問量和熱度超參數(shù)進行資源熱度加權的計算,所述計算公式為:
5.根據(jù)權利要求4所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述將分類模型加權結果和資源熱度加權結果進行模型整合,包括將分類模型加權得到的初步權重?作為基礎權重,通過乘法運算結合資源熱度加權的結果得到整合后的最終權重,所述最終權重表示為:
6.根據(jù)權利要求5所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述利用模型整合后的權重進行精排打分,包括根據(jù)匹配規(guī)則計算粗排結果中的打分,利用模型整合后的權重計算最終的精排打分,并根據(jù)最終的打分結果,對召回的資源進行排序,所述計算最終的精排打分公式為:
7.根據(jù)權利要求6所述的一種基于多維度特征的垂直搜索引擎精排方法,其特征在于,所述根據(jù)匹配規(guī)則計算粗排結果中的打分,包括選擇匹配規(guī)則并根據(jù)匹配規(guī)則確定匹配得分,利用詞頻-逆文檔頻率將文檔和關鍵詞轉換為向量,通過余弦相似度計算相關性得分,根據(jù)匹配得分和相關性得分確定粗排結果中的打分,設定得分閾值并剔除打分小于閾值的資源信息。
8.一種基于多維度特征的垂直搜索引擎精排系統(tǒng),其特征在于,包括:
9.一種計算機可讀存儲介質,其中存儲有多條指令,其特征在于,所述指令適于由終端設備的處理器加載并執(zhí)行如權利要求1所述的一種基于多維度特征的垂直搜索引擎精排方法。
10.一種終端設備,包括處理器和計算機可讀存儲介質,處理器用于實現(xiàn)各指令;計算機可讀存儲介質用于存儲多條指令,其特征在于,所述指令適于由處理器加載并執(zhí)行如權利要求1所述的一種基于多維度特征的垂直搜索引擎精排方法。