技術(shù)總結(jié)
本申請公開了一種計算文本主題模型的方法及裝置,方法包括:獲取目標(biāo)文本,所述目標(biāo)文本中含有多個目標(biāo)詞;獲取訓(xùn)練文本集合中每個訓(xùn)練文本的訓(xùn)練主題的分布概率;獲取所述訓(xùn)練文本集合中每個訓(xùn)練主題的訓(xùn)練詞的分布概率;基于所述訓(xùn)練文本集合中每個訓(xùn)練主題的訓(xùn)練詞的分布概率,獲取每個所述訓(xùn)練主題中每個所述目標(biāo)詞的分布概率,其中的目標(biāo)詞為出現(xiàn)在所述訓(xùn)練詞中的詞;獲取所述訓(xùn)練文本集合各個所述訓(xùn)練主題的分布概率;獲取所述目標(biāo)文本中每個所述目標(biāo)詞在各個所述訓(xùn)練主題的分布概率;獲取所述目標(biāo)文本中各個訓(xùn)練主題的分布概率,以得到所述目標(biāo)文本的主題模型。
技術(shù)研發(fā)人員:趙耕弘;張霞;趙立軍;崔朝輝
受保護的技術(shù)使用者:東軟集團股份有限公司
文檔號碼:201611261218
技術(shù)研發(fā)日:2016.12.30
技術(shù)公布日:2017.06.06