技術(shù)總結(jié)
本發(fā)明公開了一種圖文知識點標(biāo)注方法和裝置、圖文標(biāo)注的修正方法和系統(tǒng)。所述圖文知識點標(biāo)注方法包括:構(gòu)建知識圖譜知識節(jié)點標(biāo)注模型;判斷待標(biāo)注圖文單元的類型為文本文件或者圖像文件;根據(jù)待標(biāo)注圖文單元的類型提取待標(biāo)注圖文單元中命名實體的顯性關(guān)鍵特征的預(yù)處理特征,其中,所述預(yù)處理特征用于概括圖文單元的隱含內(nèi)容;基于所述知識節(jié)點標(biāo)注模型標(biāo)注圖文單元隱含內(nèi)容主題的知識點標(biāo)簽。本發(fā)明在細(xì)顆粒度上對圖文資料所涉及的概念類命名實體及對象實例命名實體進行提取,并將提取的特征輸入到知識圖譜標(biāo)注模型中,得出概括該圖文單內(nèi)容的多維的主題知識點標(biāo)注。
技術(shù)研發(fā)人員:唐先明;陶鵬;王曉麗;鄧達康;郭攀紅;韓寶東;陳長勝;趙志成;成堯
受保護的技術(shù)使用者:中國石油化工股份有限公司;中國石油化工股份有限公司石油勘探開發(fā)研究院
文檔號碼:201510420322
技術(shù)研發(fā)日:2015.07.16
技術(shù)公布日:2017.01.25