技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明提供一種基于詞向量、卷積神經(jīng)網(wǎng)絡(luò)的實(shí)體消歧方法,包括實(shí)體識別階段、實(shí)體語義表示階段、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練階段和實(shí)體分類階段等四個(gè)階段。本方法依托word2vec訓(xùn)練的詞向量和卷積神經(jīng)網(wǎng)絡(luò),分別針對待消歧實(shí)體上下文和知識庫中候選實(shí)體摘要信息構(gòu)造語義特征向量。在實(shí)體分類階段計(jì)算特征向量的余弦相似度,取相似度最大的候選實(shí)體作為待消歧實(shí)體的最終目標(biāo)實(shí)體。通過本發(fā)明的方法,大大提高了實(shí)體的語義表示能力,進(jìn)而提高了后續(xù)消歧的準(zhǔn)確率。
技術(shù)研發(fā)人員:張雷;高揚(yáng);唐馳;謝俊元
受保護(hù)的技術(shù)使用者:南京大學(xué)
技術(shù)研發(fā)日:2017.05.24
技術(shù)公布日:2017.08.29