技術(shù)總結(jié)
本發(fā)明涉及推薦系統(tǒng)領(lǐng)域,公開了一種特征詞提取方法及裝置,以解決現(xiàn)有技術(shù)中對于非熱點(diǎn)類特征詞提取不夠準(zhǔn)確的技術(shù)問題。該方法包括:獲取預(yù)設(shè)時(shí)間段內(nèi)第一用戶所訪問的文檔中包含的M個(gè)特征詞,M為正整數(shù);確定所述預(yù)設(shè)時(shí)間段內(nèi)特征詞i出現(xiàn)的總文檔數(shù),i為1至M的整數(shù);確定所述預(yù)設(shè)時(shí)間段內(nèi)所述第一用戶訪問的包含所述特征詞i的第i文檔數(shù);至少基于所述總文檔數(shù)、所述第i文檔數(shù)從所述M個(gè)特征詞中提取出N個(gè)特征詞以用于表征所述第一用戶的興趣,N為小于等于M的正整數(shù)。達(dá)到了提高非熱點(diǎn)類特征詞作為用戶興趣的召回率的技術(shù)效果。
技術(shù)研發(fā)人員:孟二利;商勝
受保護(hù)的技術(shù)使用者:北京搜狗科技發(fā)展有限公司
文檔號(hào)碼:201510357910
技術(shù)研發(fā)日:2015.06.25
技術(shù)公布日:2017.01.11