欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種實體與知識庫項的關(guān)聯(lián)方法及裝置的制造方法_2

文檔序號:8395897閱讀:來源:國知局
個例子對本步驟進(jìn)行說明,參見表1所示的訓(xùn)練數(shù)據(jù)集合,該訓(xùn)練數(shù)據(jù) 集合包括第一匹配對<A1,B1>,第二匹配對<A2,B2>,第三匹配對<A3,B3>,第四匹配對〈A4, B4>以及第五匹配對<A5,B5>。實體Al、A2和A3都為人名且詞性為名詞,以及實體A4和 A5都為地名且詞性為名詞。
[0037] 對于實體A1,獲取實體A1的詞性為名詞,以及從文檔庫中找出包括實體A1的文 檔;假設(shè)該文檔包括詞Cl、C2、Al、C3和C4,且在文檔中的順序為C1C2A1C3C4,以及預(yù)設(shè)第 二個數(shù)為2,則從該文檔中獲取在實體A1之前且與實體A1最接近的兩個詞C1和C2以及在 實體A1之后且與實體A1最接近的兩個詞C3和C4,將獲取的詞Cl、C2、C3和C4作為實體 A1的上下文信息,將實體A1的詞性為名詞以及上下文信息包括的詞Cl、C2、C3和C4組成 實體A1的實體類型特征向量1,且實體類型特征向量1可以表示為[名詞,C1,C2,C3,C4]。 對于實體A2、A3、A4和A5,按上述方法分別得到實體A2的實體類型特征向量2、實體A3的 實體類型特征向量3、實體A4的實體類型特征向量4和實體A5的實體類型特征向量5。
[0038]表1
[0039]
【主權(quán)項】
1. 一種實體與知識庫項的關(guān)聯(lián)方法,其特征在于,所述方法包括: 獲取至少一個侯選匹配對,所述侯選匹配對包括待匹配實體和知識庫項; 根據(jù)所述待匹配實體的實體類型特征向量,獲取關(guān)聯(lián)模型集合,所述獲取的關(guān)聯(lián)模型 集合對應(yīng)的實體類型與所述待匹配實體的實體類型之間滿足預(yù)設(shè)近似條件; 通過所述獲取的關(guān)聯(lián)模型集合,從所述至少一個侯選匹配對中選擇一個侯選匹配對作 為實體與知識庫項的關(guān)聯(lián)結(jié)果。
2. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述待匹配實體的特征向量,獲取 關(guān)聯(lián)模型集合,包括: 根據(jù)關(guān)聯(lián)模塊集合與特征分布參數(shù)的對應(yīng)關(guān)系,獲取其中的每個關(guān)聯(lián)模型集合對應(yīng)的 實體類型所滿足的特征分布參數(shù); 根據(jù)所述待匹配實體的實體類型特征向量和所述每個關(guān)聯(lián)模型集合對應(yīng)的實體類型 所滿足的特征分布參數(shù),分別計算所述待匹配實體的實體類型與所述每個關(guān)聯(lián)模型集合對 應(yīng)的實體類型之間的匹配度; 選擇匹配度最大的預(yù)設(shè)第一個數(shù)個關(guān)聯(lián)模型集合或匹配度大于預(yù)設(shè)闊值的關(guān)聯(lián)模型 集合。
3. 如權(quán)利要求1所述的方法,其特征在于,所述通過所述獲取的關(guān)聯(lián)模型集合,從所述 至少一個侯選匹配對中選擇一個侯選匹配對作為實體與知識庫項的關(guān)聯(lián)結(jié)果,包括: 基于所述獲取的每個關(guān)聯(lián)模型集合對侯選匹配對進(jìn)行關(guān)聯(lián)分析,得到所述每個關(guān)聯(lián)模 型集合對所述侯選匹配對打分的匹配分?jǐn)?shù)和權(quán)重; 根據(jù)所述每個關(guān)聯(lián)模型集合對所述侯選匹配對打分的匹配分?jǐn)?shù)和權(quán)重,W及所述每個 關(guān)聯(lián)模型集合對應(yīng)的實體類型與所述待匹配實體的實體類型之間的匹配度,計算所述侯選 匹配對的最終分?jǐn)?shù); 選擇最終分?jǐn)?shù)最大的侯選匹配對作為實體與知識庫項的關(guān)聯(lián)結(jié)果。
4. 如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述待匹配實體的實體類型特征 向量,獲取關(guān)聯(lián)模型集合之前,還包括: 通過聚類算法對預(yù)設(shè)的多個匹配對中的實體進(jìn)行聚類,得到至少一個匹配對集合和每 個匹配對集合對應(yīng)的特征分布參數(shù),所述匹配對集合包含的實體的實體類型相同; 通過預(yù)設(shè)的至少一種學(xué)習(xí)算法對所述每個匹配對集合進(jìn)行訓(xùn)練,得到所述每個匹配對 集合對應(yīng)的一個關(guān)聯(lián)模型集合; 將所述每個匹配對集合對應(yīng)的特征分布參數(shù)和關(guān)聯(lián)模型集合組成特征分布參數(shù)與關(guān) 聯(lián)模型集合的對應(yīng)關(guān)系。
5. 如權(quán)要求4所述的方法,其特征在于,所述通過聚類算法對預(yù)設(shè)的多個匹配對中的 實體進(jìn)行聚類,得到至少一個匹配對集合,包括: 獲取預(yù)設(shè)的每個匹配對中的實體的實體類型特征向量; 根據(jù)所述預(yù)設(shè)的每個匹配對中的實體的實體類型特征向量,通過聚類算法對所述預(yù)設(shè) 的多個匹配對進(jìn)行聚類,得到至少一個匹配對集合。
6. -種實體與知識庫項的匹配裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于獲取至少一個侯選匹配對,所述侯選匹配對包括待匹配實體和知 識庫項; 第二獲取模塊,用于根據(jù)所述待匹配實體的實體類型特征向量,獲取關(guān)聯(lián)模型集合,所 述獲取的關(guān)聯(lián)模型集合對應(yīng)的實體類型與所述待匹配實體的實體類型之間滿足預(yù)設(shè)近似 條件; 選擇模塊,用于通過所述獲取的關(guān)聯(lián)模型集合,從所述至少一個侯選匹配對中選擇一 個侯選匹配對作為實體與知識庫項的關(guān)聯(lián)結(jié)果。
7. 如權(quán)利要求6所述的裝置,其特征在于,所述第二獲取模塊包括: 第一獲取單元,用于根據(jù)關(guān)聯(lián)模塊集合與特征分布參數(shù)的對應(yīng)關(guān)系,獲取其中的每個 關(guān)聯(lián)模型集合對應(yīng)的實體類型所滿足的特征分布參數(shù); 第一計算單元,用于根據(jù)所述待匹配實體的實體類型特征向量和所述每個關(guān)聯(lián)模型集 合對應(yīng)的實體類型所滿足的特征分布參數(shù),分別計算所述待匹配實體的實體類型與所述每 個關(guān)聯(lián)模型集合對應(yīng)的實體類型之間的匹配度; 第一選擇單元,用于選擇匹配度最大的預(yù)設(shè)第一個數(shù)個關(guān)聯(lián)模型集合或匹配度大于預(yù) 設(shè)闊值的關(guān)聯(lián)模型集合。
8. 如權(quán)利要求6所述的裝置,其特征在于,所述選擇模塊包括: 分析單元,用于基于所述獲取的每個關(guān)聯(lián)模型集合對侯選匹配對進(jìn)行關(guān)聯(lián)分析,得到 所述每個關(guān)聯(lián)模型集合對所述侯選匹配對打分的匹配分?jǐn)?shù)和權(quán)重; 第二計算單元,用于根據(jù)所述每個關(guān)聯(lián)模型集合對所述侯選匹配對打分的匹配分?jǐn)?shù)和 權(quán)重,W及所述每個關(guān)聯(lián)模型集合對應(yīng)的實體類型與所述待匹配實體的實體類型之間的匹 配度,計算所述侯選匹配對的最終分?jǐn)?shù); 第二選擇單元,用于選擇最終分?jǐn)?shù)最大的侯選匹配對作為實體與知識庫項的關(guān)聯(lián)結(jié) 果。
9. 如權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括: 聚類模塊,用于通過聚類算法對預(yù)設(shè)的多個匹配對中的實體進(jìn)行聚類,得到至少一個 匹配對集合和每個匹配對集合對應(yīng)的特征分布參數(shù),所述匹配對集合包含的實體的實體類 型相同; 訓(xùn)練模塊,用于通過預(yù)設(shè)的至少一種學(xué)習(xí)算法對所述每個匹配對集合進(jìn)行訓(xùn)練,得到 所述每個匹配對集合對應(yīng)的一個關(guān)聯(lián)模型集合; 組成模塊,用于將所述每個匹配對集合對應(yīng)的特征分布參數(shù)和關(guān)聯(lián)模型集合組成特征 分布參數(shù)與關(guān)聯(lián)模型集合的對應(yīng)關(guān)系。
10. 如權(quán)要求9所述的裝置,其特征在于,所述聚類模塊包括: 第二獲取單元,用于獲取預(yù)設(shè)的每個匹配對中的實體的實體類型特征向量; 聚類單元,用于根據(jù)所述預(yù)設(shè)的每個匹配對中的實體的實體類型特征向量,通過聚類 算法對所述預(yù)設(shè)的多個匹配對進(jìn)行聚類,得到至少一個匹配對集合。
【專利摘要】本發(fā)明公開了一種實體與知識庫項的關(guān)聯(lián)方法及裝置,屬于計算機(jī)領(lǐng)域。所述方法包括:獲取至少一個侯選匹配對,所述侯選匹配對包括待匹配實體和知識庫項;根據(jù)所述待匹配實體的實體類型特征向量,獲取關(guān)聯(lián)模型集合,所述獲取的關(guān)聯(lián)模型集合對應(yīng)的實體類型與所述待匹配實體的實體類型之間滿足預(yù)設(shè)近似條件;通過所述獲取的關(guān)聯(lián)模型集合,從所述至少一個侯選匹配對中選擇一個侯選匹配對作為實體與知識庫項的關(guān)聯(lián)結(jié)果。所述裝置包括:第一獲取模塊、第二獲取模塊和選擇模塊。本發(fā)明能夠提高實體與知識庫項關(guān)聯(lián)結(jié)果的準(zhǔn)確度。
【IPC分類】G06F17-30
【公開號】CN104714977
【申請?zhí)枴緾N201310692697
【發(fā)明人】劉春辰, 李建強(qiáng), 劉博
【申請人】日本電氣株式會社
【公開日】2015年6月17日
【申請日】2013年12月17日
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
同心县| 尖扎县| 金华市| 奉新县| 广昌县| 西林县| 邹平县| 环江| 高密市| 玉林市| 常州市| 临西县| 扎鲁特旗| 张家川| 肇庆市| 黔东| 潮州市| 乌拉特前旗| 独山县| 莲花县| 玉龙| 浦北县| 施甸县| 星子县| 滨州市| 绥滨县| 日喀则市| 娱乐| 呈贡县| 武川县| 晋州市| 保靖县| 新安县| 新安县| 屏东市| 瑞安市| 鸡西市| 茶陵县| 读书| 安徽省| 临潭县|