技術編號:6377235
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及知識庫擴展、網(wǎng)絡抓取、淺層語言處理技術(實體識別、分詞)、數(shù)值統(tǒng)計等,具體的說是一種基于關系關鍵詞擴展的元組精化方法。背景技術隨著互聯(lián)網(wǎng)的快速發(fā)展,如何從海量的無結(jié)構(gòu)的數(shù)據(jù)里抽取出結(jié)構(gòu)化的數(shù)據(jù)成為當前的研究熱點,目前信息抽取的主要研究方向是命名實體識別、指代消解、實體關系抽取等,其中實體關系抽取是當前的重要的研究內(nèi)容。而當前實體關系抽取有基于知識工程的方法和基于機器學習的方法。但是基于知識工程的方法需要大量人力同時需要構(gòu)建專業(yè)知識,使得領域的可移...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權(quán),增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。