技術(shù)總結(jié)
本發(fā)明提供一種基于內(nèi)容及用戶行為的文本類推薦方法,該方法包括步驟:獲取待分析的文檔集合,對文檔集合中的文檔進行中文分詞得到多個詞項;對文檔集合中的詞項進行信息增益計算,按照信息增益量的大小排序篩選多個詞項作為基準向量;根據(jù)基準向量,將文檔集合中的文本轉(zhuǎn)換為多維的空間向量模型;對空間向量模型進行TF?IDF計算,得到文本向量矩陣;計算不同的文本向量矩陣之間的相似度,形成文檔關(guān)系矩陣;分析用戶行為數(shù)據(jù),結(jié)合文檔關(guān)系矩陣,形成推薦列表推薦給用戶。該裝置包括分詞模塊、IG計算模塊、降維模塊、TF?IDF計算模塊、相似度計算模塊和推薦模塊。該方法和裝置,能夠提升用戶文本內(nèi)容推薦的有效性。
技術(shù)研發(fā)人員:張達;亓開元;蘇志遠
受保護的技術(shù)使用者:浪潮電子信息產(chǎn)業(yè)股份有限公司
文檔號碼:201610635123
技術(shù)研發(fā)日:2016.08.05
技術(shù)公布日:2016.12.21