欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法及裝置的制造方法

文檔序號(hào):8395897閱讀:178來(lái)源:國(guó)知局
一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,特別涉及一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法及裝置。
【背景技術(shù)】
[0002] 當(dāng)前,文本數(shù)據(jù)出現(xiàn)爆炸式增長(zhǎng),人們迫切需要優(yōu)秀的文本分析技術(shù),來(lái)幫助理解 數(shù)據(jù)的真實(shí)含義。實(shí)體關(guān)聯(lián)技術(shù)是一種文本分析技術(shù),它將文本數(shù)據(jù)中出現(xiàn)的詞或詞組作 為實(shí)體,將對(duì)該實(shí)體進(jìn)行說明的說明內(nèi)容的標(biāo)題或摘要作為KB(Knowledgebase,知識(shí)庫(kù)) 項(xiàng),并將該實(shí)體和該KB項(xiàng)組成匹配對(duì)。如此,人們可以通過該匹配對(duì)來(lái)理解文本數(shù)據(jù)的真 實(shí)含義。例如,對(duì)于一段文本數(shù)據(jù)"早上好,JamesParsons!",實(shí)體關(guān)聯(lián)技術(shù)可以將該段文 本數(shù)據(jù)中出現(xiàn)的"JamesParsons"作為實(shí)體,將對(duì)"JamesParsons"進(jìn)行說明的說明內(nèi)容 的標(biāo)題"演員JamesParsons"作為KB項(xiàng),并將該實(shí)體和該KB項(xiàng)組成匹配對(duì)。人們可以根 據(jù)該匹配對(duì)確定"JamesParsons"為"演員",從而理解該實(shí)體的真實(shí)含義。
[0003]目前,實(shí)體關(guān)聯(lián)技術(shù)可以通過如下方法將實(shí)體和KB項(xiàng)組成匹配對(duì),包括:設(shè)置一 個(gè)訓(xùn)練數(shù)據(jù)集合,該訓(xùn)練數(shù)據(jù)集合包括多個(gè)匹配對(duì),且這些匹配對(duì)都為實(shí)體與KB項(xiàng)的匹配 對(duì),通過多種學(xué)習(xí)算法對(duì)整個(gè)訓(xùn)練數(shù)據(jù)集合進(jìn)行訓(xùn)練得到一個(gè)關(guān)聯(lián)模型集合,關(guān)聯(lián)模型集 合包括多個(gè)關(guān)聯(lián)模型,每個(gè)關(guān)聯(lián)模型為匹配實(shí)體與KB項(xiàng)的算法;對(duì)于一個(gè)待匹配實(shí)體,利 用詞性匹配和/或文本語(yǔ)義分析等技術(shù),從知識(shí)庫(kù)中獲取與待匹配實(shí)體可能匹配的KB項(xiàng), 并將待匹配實(shí)體與獲取的每個(gè)KB項(xiàng)組成候選匹配對(duì);通過經(jīng)過訓(xùn)練得到的一個(gè)關(guān)聯(lián)模型 集合從組成的侯選匹配對(duì)中選擇一個(gè)侯選匹配對(duì)作為實(shí)體與KB項(xiàng)的關(guān)聯(lián)結(jié)果。
[0004] 在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0005]目前通過多種學(xué)習(xí)算法對(duì)整個(gè)訓(xùn)練數(shù)據(jù)集合進(jìn)行訓(xùn)練得到一個(gè)關(guān)聯(lián)模型集合,而 在對(duì)實(shí)體和KB項(xiàng)的進(jìn)行關(guān)聯(lián)時(shí),因?yàn)榇嬖诙喾N多樣的實(shí)體,通過訓(xùn)練得到的一個(gè)關(guān)聯(lián)模型 集合對(duì)所有的實(shí)體進(jìn)行關(guān)聯(lián),得到的關(guān)聯(lián)結(jié)果的準(zhǔn)確度較低。

【發(fā)明內(nèi)容】

[0006] 為了提高實(shí)體與知識(shí)庫(kù)項(xiàng)關(guān)聯(lián)結(jié)果的準(zhǔn)確度,本發(fā)明提供了一種實(shí)體與知識(shí)庫(kù)項(xiàng) 的關(guān)聯(lián)方法及裝置。所述技術(shù)方案如下:
[0007] -種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法,所述方法包括:
[0008] 獲取至少一個(gè)侯選匹配對(duì),所述侯選匹配對(duì)包括待匹配實(shí)體和知識(shí)庫(kù)項(xiàng);
[0009] 根據(jù)所述待匹配實(shí)體的實(shí)體類型特征向量,獲取關(guān)聯(lián)模型集合,所述獲取的關(guān)聯(lián) 模型集合對(duì)應(yīng)的實(shí)體類型與所述待匹配實(shí)體的實(shí)體類型之間滿足預(yù)設(shè)近似條件;
[0010] 通過所述獲取的關(guān)聯(lián)模型集合,從所述至少一個(gè)侯選匹配對(duì)中選擇一個(gè)侯選匹配 對(duì)作為實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)結(jié)果。
[0011] 一種實(shí)體與知識(shí)庫(kù)項(xiàng)的匹配裝置,所述裝置包括:
[0012] 第一獲取模塊,用于獲取至少一個(gè)侯選匹配對(duì),所述侯選匹配對(duì)包括待匹配實(shí)體 和知識(shí)庫(kù)項(xiàng);
[0013] 第二獲取模塊,用于根據(jù)所述待匹配實(shí)體的實(shí)體類型特征向量,獲取關(guān)聯(lián)模型集 合,所述獲取的關(guān)聯(lián)模型集合對(duì)應(yīng)的實(shí)體類型與所述待匹配實(shí)體的實(shí)體類型之間滿足預(yù)設(shè) 近似條件;
[0014] 選擇模塊,用于通過所述獲取的關(guān)聯(lián)模型集合,從所述至少一個(gè)侯選匹配對(duì)中選 擇一個(gè)侯選匹配對(duì)作為實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)結(jié)果。
[0015] 在本發(fā)明實(shí)施例中,由于根據(jù)待匹配實(shí)體的實(shí)體類型特征向量,獲取實(shí)體類型與 待匹配實(shí)體的實(shí)體類型之間滿足預(yù)設(shè)近似條件的關(guān)聯(lián)模型集合,從而能夠獲取到實(shí)體類型 與待匹配實(shí)體的實(shí)體類型相近的關(guān)聯(lián)模型集合,并通過獲取的關(guān)聯(lián)模型集合匹配實(shí)體與知 識(shí)庫(kù)項(xiàng)的匹配對(duì),從而提高實(shí)體與知識(shí)庫(kù)項(xiàng)關(guān)聯(lián)結(jié)果的準(zhǔn)確度。
【附圖說明】
[0016] 圖1是本發(fā)明實(shí)施例1提供的一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法流程圖;
[0017] 圖2是本發(fā)明實(shí)施例2提供的一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法流程圖;
[0018] 圖3是本發(fā)明實(shí)施例3提供的第一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)裝置結(jié)構(gòu)示意圖;
[0019] 圖4是本發(fā)明實(shí)施例3提供的第二種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)裝置結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0020] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方 式作進(jìn)一步地詳細(xì)描述。
[0021] 實(shí)施例1
[0022] 參見圖1,本發(fā)明實(shí)施例提供了一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法,包括:
[0023] 步驟101:獲取至少一個(gè)侯選匹配對(duì),該侯選匹配對(duì)包括待匹配實(shí)體和知識(shí)庫(kù)項(xiàng);
[0024] 步驟102:根據(jù)待匹配實(shí)體的實(shí)體類型特征向量,獲取關(guān)聯(lián)模型集合,獲取的關(guān)聯(lián) 模型集合對(duì)應(yīng)的實(shí)體類型與待匹配實(shí)體的實(shí)體類型之間滿足預(yù)設(shè)近似條件;
[0025] 步驟103:通過獲取的關(guān)聯(lián)模型集合,從至少一個(gè)侯選匹配對(duì)中選擇侯選匹配對(duì) 作為實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)結(jié)果。
[0026] 在本發(fā)明實(shí)施例中,由于根據(jù)待匹配實(shí)體的實(shí)體類型特征向量,獲取實(shí)體類型與 待匹配實(shí)體的實(shí)體類型之間滿足預(yù)設(shè)近似條件的關(guān)聯(lián)模型集合,從而能夠獲取到實(shí)體類型 與待匹配實(shí)體的實(shí)體類型相近的關(guān)聯(lián)模型集合,并通過獲取的關(guān)聯(lián)模型集合匹配實(shí)體與知 識(shí)庫(kù)項(xiàng)的匹配對(duì),從而提高實(shí)體與知識(shí)庫(kù)項(xiàng)關(guān)聯(lián)結(jié)果的準(zhǔn)確度。
[0027] 實(shí)施例2
[0028] 參見圖2,本發(fā)明實(shí)施例提供了一種實(shí)體與知識(shí)庫(kù)項(xiàng)的關(guān)聯(lián)方法,包括:
[0029] 步驟201:獲取訓(xùn)練數(shù)據(jù)集合包括的每個(gè)匹配對(duì)中的實(shí)體的實(shí)體類型特征向量;
[0030] 訓(xùn)練數(shù)據(jù)集合是用于訓(xùn)練關(guān)聯(lián)模型集合的文本數(shù)據(jù)庫(kù),訓(xùn)練數(shù)據(jù)集合包括多個(gè)預(yù) 設(shè)的匹配對(duì),且預(yù)設(shè)的匹配對(duì)都為實(shí)體與KB項(xiàng)的匹配對(duì)。實(shí)體可以為文本中出現(xiàn)的某一 詞或詞組等,KB項(xiàng)可以是對(duì)實(shí)體進(jìn)行說明的說明內(nèi)容的標(biāo)題或摘要等信息,且KB項(xiàng)可以為 詞、詞組、短句或段落等,實(shí)體與KB項(xiàng)的匹配對(duì)可以幫助用戶理解實(shí)體的真實(shí)含義。
[0031] 例如,一篇文本中出現(xiàn)的某個(gè)詞為"JamesParsons",該詞可以為一個(gè)實(shí)體,存在 一個(gè)標(biāo)題為"演員JamesParsons"的網(wǎng)頁(yè)頁(yè)面,該網(wǎng)頁(yè)頁(yè)面對(duì)"JamesParsons"進(jìn)行詳細(xì) 說明,將該網(wǎng)頁(yè)頁(yè)面的標(biāo)題作為KB項(xiàng),由"JamesParsons"和"演員JamesParsons"組成 的實(shí)體與KB項(xiàng)的匹配對(duì)用于說明"JamesParsons"為"演員JamesParsons",從而幫助用 戶理解實(shí)體"JamesParsons"的真實(shí)含義。
[0032] 本步驟可以具體為,對(duì)于訓(xùn)練數(shù)據(jù)集合包括的每一個(gè)匹配對(duì),獲取該匹配對(duì)中的 實(shí)體的特征,該實(shí)體的特征包括該實(shí)體的詞性和/或上下文信息等,再將該實(shí)體的特征組 成該實(shí)體的實(shí)體類型特征向量。
[0033] 對(duì)于該實(shí)體的詞性,可以通過用于判定詞性的算法來(lái)獲取該實(shí)體的詞性。
[0034] 對(duì)于該實(shí)體的上下文信息,可以通過如下方式獲取該實(shí)體的上下文信息,包括:
[0035] 事先設(shè)置一個(gè)文檔庫(kù),該文檔庫(kù)中包括多篇文檔,從文檔庫(kù)中找出包括該實(shí)體的 文檔,在找出的文檔中獲取在該實(shí)體之前且與該實(shí)體最接近的預(yù)設(shè)第二個(gè)數(shù)個(gè)詞以及在該 實(shí)體之后且與該實(shí)體最接近的預(yù)設(shè)第二個(gè)數(shù)個(gè)詞,例如,預(yù)設(shè)第二個(gè)數(shù)可以為2或4等數(shù) 值,將獲取的詞或獲取的詞的詞性作為該實(shí)體的上下文信息。
[0036] 例如,用一
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
仪陇县| 泾阳县| 正镶白旗| 邛崃市| 永平县| 阳江市| 泰宁县| 安仁县| 突泉县| 赤壁市| 五华县| 炎陵县| 姜堰市| 常山县| 百色市| 高密市| 饶河县| 龙泉市| 准格尔旗| 文水县| 丹凤县| 彭山县| 肇东市| 谷城县| 化隆| 海口市| 新巴尔虎左旗| 肥城市| 古田县| 临西县| 平阳县| 西乌| 科技| 班戈县| 炎陵县| 玛多县| 靖宇县| 建阳市| 株洲县| 新巴尔虎右旗| 淅川县|