欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于用戶定制的本體匹配系統(tǒng)及方法

文檔序號(hào):6653969閱讀:674來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):基于用戶定制的本體匹配系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明涉及語(yǔ)義萬(wàn)維網(wǎng)技術(shù)領(lǐng)域,特別涉及一種基于用戶定制的本體匹配系統(tǒng)及 方法。
背景技術(shù)
語(yǔ)義Wfeb由萬(wàn)維網(wǎng)的創(chuàng)始人Tim Berners-Lee提出,是探索新一代互聯(lián)網(wǎng)發(fā)展的 重要技術(shù)。語(yǔ)義Web的目標(biāo)在于通過(guò)相應(yīng)技術(shù)使得當(dāng)前萬(wàn)維網(wǎng)上的信息中的語(yǔ)義能夠被機(jī) 器理解,從而使得網(wǎng)絡(luò)上的數(shù)據(jù)能夠被機(jī)器直接或間接地處理。目前語(yǔ)義Web技術(shù)已經(jīng)得 到了廣泛的發(fā)展,并涌現(xiàn)出大量的實(shí)際應(yīng)用,如LinkedData、語(yǔ)義維基等。本體為用戶描述 特定領(lǐng)域的萬(wàn)維網(wǎng)數(shù)據(jù)語(yǔ)義提供了基本的概念模型和共享詞匯。它作為語(yǔ)義Web中的語(yǔ)義 表示形式,是語(yǔ)義Web體系結(jié)構(gòu)中的核心元素,是實(shí)現(xiàn)知識(shí)共享、協(xié)同工作的關(guān)鍵。但是由 于現(xiàn)實(shí)世界中本體自身與生俱來(lái)的分布性和異構(gòu)性,又極大地限制了數(shù)據(jù)的共享與集成。 為了實(shí)現(xiàn)異構(gòu)本體中的語(yǔ)義互操作,需要在異構(gòu)本體間建立實(shí)體對(duì)應(yīng)關(guān)系,這就是本體匹 配。目前國(guó)內(nèi)外已有很多關(guān)于本體匹配方法的研究,并且有不少的本體匹配系統(tǒng)被開(kāi) 發(fā)出來(lái)并得到應(yīng)用,比較著名的系統(tǒng)包括COMA++,ASMOV, Falcon, Lily, Η-Match, CIDER等 等,這些系統(tǒng)采用了不同的本體匹配方法或方法組合來(lái)發(fā)現(xiàn)異構(gòu)本體匹配中的實(shí)體對(duì)應(yīng)關(guān) 系。但是這些系統(tǒng)并不能在所有的本體匹配任務(wù)中都獲得令人滿意的匹配結(jié)果。首先是這 些方法和系統(tǒng)往往利用了本體的一部分信息,并不能實(shí)現(xiàn)對(duì)本體信息的充分探索;其次這 些系統(tǒng)的匹配流程一般都是固定的,對(duì)于特定的本體并不能進(jìn)行適當(dāng)?shù)恼{(diào)整,例如大多數(shù) 系統(tǒng)都采用了基于實(shí)體名稱(chēng)的字符串匹配方法,但是如果本體中的實(shí)體名稱(chēng)并沒(méi)有實(shí)際意 義,那么再利用這種方法可能對(duì)最終結(jié)果造成干擾。

發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題本發(fā)明要解決的技術(shù)問(wèn)題是如何實(shí)現(xiàn)對(duì)本體信息的充分探索,并根據(jù)需求對(duì)匹 配流程進(jìn)行組裝,以獲得精確地匹配結(jié)果。( 二 )技術(shù)方案為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種基于用戶定制的本體匹配系統(tǒng),包括本體模塊,包括原子組件本體操作接口子模塊和本體API子模塊;與所述本體模塊連接的原子組件模塊,用于通過(guò)原子組件本體操作接口子模塊調(diào) 用本體API子模塊的本體API實(shí)現(xiàn)原子組件;與所述原子組件模塊連接的用戶接口模塊,用于接收用戶上傳的待匹配本體和用 戶自行實(shí)現(xiàn)的原子組件;與所述原子組件模塊和用戶接口模塊連接的匹配執(zhí)行模塊,用于根據(jù)所述待匹配 本體生成匹配任務(wù)描述文件,并根據(jù)所述匹配任務(wù)描述文件選擇所述原子組件或所述自行
4實(shí)現(xiàn)的原子組件來(lái)執(zhí)行匹配任務(wù),生成匹配結(jié)果,所述匹配任務(wù)描述文件包括待匹配本體 O1和A的URI位置、匹配參數(shù)和匹配流程。其中,所述原子組件模塊包括的組件類(lèi)型為預(yù)處理器,用于在完成實(shí)際的匹配操作執(zhí)行前初始化匹配任務(wù),包括,解析本體、 規(guī)范化本體中術(shù)語(yǔ)、去噪音以及具體的匹配器中所用到的數(shù)據(jù)結(jié)構(gòu)的建立;匹配器,用于實(shí)現(xiàn)具體的本體匹配方法包括基于編輯距離相似度的匹配器、基于 WordNet相似度的匹配器、基于向量空間的匹配器及基于相似度傳播的匹配器;匹配結(jié)果聚合器,用于對(duì)多個(gè)本體匹配方法獲得的匹配結(jié)果進(jìn)行聚合;后處理器,用于對(duì)初始匹配結(jié)果進(jìn)行處理,從初始結(jié)果中提取最終的匹配和對(duì)匹 配結(jié)果進(jìn)行優(yōu)化;匹配結(jié)果評(píng)估器,用于依據(jù)指定的評(píng)價(jià)指標(biāo)對(duì)優(yōu)化后的本體匹配結(jié)果進(jìn)行評(píng)估。其中,所述原子組件模塊包括描述文件生成子模塊,用于生成并存儲(chǔ)所述原子組 件的描述文件。 其中,所述匹配任務(wù)描述文件還包括參考匹配參數(shù)。 本發(fā)明還提供了一種基于用戶定制的本體匹配方法,包括以下步驟 Sl 接收用戶上傳的待匹配本體,并根據(jù)所述待匹配本體生成匹配任務(wù)描述文件;S2:解析所述匹配任務(wù)描述文件,并根據(jù)匹配任務(wù)描述文件執(zhí)行匹配,所述匹配任 務(wù)描述文件包括待匹配本體O1和A的URI位置、匹配參數(shù)和匹配流程。其中,所述步驟S2具體包括S21 解析待匹配本體O1和O2的序列化文件,為本體中的每個(gè)實(shí)體生成描述,計(jì)算 兩個(gè)本體的名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子;S22 通過(guò)所述名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子選擇匹配方法進(jìn)行匹配,并將匹 配結(jié)果進(jìn)行聚合;S23 對(duì)所述聚合的匹配結(jié)果進(jìn)行相似度傳播;S24 對(duì)相似度傳播后的匹配結(jié)果進(jìn)行選擇優(yōu)化。其中,所述步驟S21中計(jì)算兩個(gè)本體的名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子的方式 為
權(quán)利要求
1.一種基于用戶定制的本體匹配系統(tǒng),其特征在于,包括本體模塊,包括原子組件本體操作接口子模塊和本體API子模塊;與所述本體模塊連接的原子組件模塊,用于通過(guò)原子組件本體操作接口子模塊調(diào)用本 體API子模塊的本體API實(shí)現(xiàn)原子組件;與所述原子組件模塊連接的用戶接口模塊,用于接收用戶上傳的待匹配本體和用戶自 行實(shí)現(xiàn)的原子組件;與所述原子組件模塊和用戶接口模塊連接的匹配執(zhí)行模塊,用于根據(jù)所述待匹配本體 生成匹配任務(wù)描述文件,并根據(jù)所述匹配任務(wù)描述文件選擇所述原子組件或所述自行實(shí)現(xiàn) 的原子組件來(lái)執(zhí)行匹配任務(wù),生成匹配結(jié)果,所述匹配任務(wù)描述文件包括待匹配本體01 和02的URI位置、匹配參數(shù)和匹配流程。
2.如權(quán)利要求1所述的基于用戶定制的本體匹配系統(tǒng),其特征在于,所述原子組件模 塊包括的組件類(lèi)型為預(yù)處理器,用于在完成實(shí)際的匹配操作執(zhí)行前初始化匹配任務(wù),包括,解析本體、規(guī)范 化本體中術(shù)語(yǔ)、去噪音以及具體的匹配器中所用到的數(shù)據(jù)結(jié)構(gòu)的建立;匹配器,用于實(shí)現(xiàn)具體的本體匹配方法包括基于編輯距離相似度的匹配器、基于 WordNet相似度的匹配器、基于向量空間的匹配器及基于相似度傳播的匹配器;匹配結(jié)果聚合器,用于對(duì)多個(gè)本體匹配方法獲得的匹配結(jié)果進(jìn)行聚合;后處理器,用于對(duì)初始匹配結(jié)果進(jìn)行處理,從初始結(jié)果中提取最終的匹配和對(duì)匹配結(jié) 果進(jìn)行優(yōu)化;匹配結(jié)果評(píng)估器,用于依據(jù)指定的評(píng)價(jià)指標(biāo)對(duì)優(yōu)化后的本體匹配結(jié)果進(jìn)行評(píng)估。
3.如權(quán)利要求1所述的基于用戶定制的本體匹配系統(tǒng),其特征在于,所述原子組件模 塊包括描述文件生成子模塊,用于生成并存儲(chǔ)所述原子組件的描述文件。
4.如權(quán)利要求1所述的基于用戶定制的本體匹配系統(tǒng),其特征在于,所述匹配任務(wù)描 述文件還包括參考匹配參數(shù)。
5.一種基于用戶定制的本體匹配方法,其特征在于,包括以下步驟S1接收用戶上傳的待匹配本體,并根據(jù)所述待匹配本體生成匹配任務(wù)描述文件;S2解析所述匹配任務(wù)描述文件,并根據(jù)匹配任務(wù)描述文件執(zhí)行匹配,所述匹配任務(wù)描 述文件包括待匹配本體O1和A的URI位置、匹配參數(shù)和匹配流程。
6.如權(quán)利要求5所述的基于用戶定制的本體匹配方法,其特征在于,所述步驟S2具體 包括S21解析待匹配本體O1和O2的序列化文件,為本體中的每個(gè)實(shí)體生成描述,計(jì)算兩個(gè) 本體的名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子;S22通過(guò)所述名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子選擇匹配方法進(jìn)行匹配,并將匹配結(jié) 果進(jìn)行聚合;S23對(duì)所述聚合的匹配結(jié)果進(jìn)行相似度傳播;S24對(duì)相似度傳播后的匹配結(jié)果進(jìn)行選擇優(yōu)化。
7.如權(quán)利要求6所述的基于用戶定制的本體匹配方法,其特征在于,所述步驟S21中計(jì) 算兩個(gè)本體的名稱(chēng)相似度因子和結(jié)構(gòu)相似度因子的方式為i7 (O O ) - Num(Common(cy) + Num(Common、p)) k ” 2 Num(Cl) + Num(J)l) + Num(C2) + Numip2)F (O O ) ^um(Common(cs)) + Num{Common{ps)) ss ” 2 ~ Numicsl ) + Num(p;) + Num(cs2) + Num(ps2)'其中,c、C1和ρ、P1分別表示本體中的概念和屬性;Common (c)和Common(P)分別表是 兩個(gè)本體中名稱(chēng)相同的概念和實(shí)例;分子中Num(Common(C))和Num(Common(ρ))的和表示 名稱(chēng)相同的概念和屬性的總數(shù);分母是兩個(gè)本體中所有概念和屬性的總數(shù),Cs和ps表示本 體中非葉子結(jié)點(diǎn)的概念和屬性;Common(Cs)和Common(ps)分別表是兩個(gè)本體中子結(jié)點(diǎn)數(shù)目 相同的非葉子結(jié)點(diǎn)的概念和實(shí)例;分子表示所述相同概念和實(shí)例的數(shù)目總數(shù),分母則表示 兩個(gè)本體中所有非葉子結(jié)點(diǎn)的概念和屬性的總數(shù)。
8.如權(quán)利要求6所述的基于用戶定制的本體匹配方法,其特征在于,所述步驟S22中選 擇匹配方法時(shí),若選擇多個(gè)匹配方法,則選擇的多個(gè)匹配方法并行執(zhí)行。
9.如權(quán)利要求8所述的基于用戶定制的本體匹配方法,其特征在于,所述匹配方法包 括基于編輯距離的匹配方法、基于向量空間的匹配方法、基于WordNet的匹配方法及基于 機(jī)器學(xué)習(xí)的匹配方法。
全文摘要
本發(fā)明公開(kāi)了一種基于用戶定制的本體匹配系統(tǒng),涉及語(yǔ)義萬(wàn)維網(wǎng)技術(shù)領(lǐng)域,包括本體模塊,包括原子組件本體操作接口子模塊和本體API子模塊;原子組件模塊,用于通過(guò)原子組件本體操作接口子模塊調(diào)用本體API子模塊的本體API實(shí)現(xiàn)原子組件;用戶接口模塊,用于接收用戶上傳的待匹配本體和自行實(shí)現(xiàn)的原子組件;匹配執(zhí)行模塊,用于根據(jù)待匹配本體生成匹配任務(wù)描述文件,并根據(jù)匹配任務(wù)描述文件選擇原子組件或自行實(shí)現(xiàn)的原子組件來(lái)執(zhí)行匹配任務(wù),生成匹配結(jié)果。本發(fā)明使用戶能夠根據(jù)匹配本體的特征,對(duì)這些原子組件進(jìn)行定制和組裝來(lái)設(shè)計(jì)自己需要的本體匹配流程,生成合適的匹配任務(wù)并得到精確地匹配結(jié)果。
文檔編號(hào)G06F9/46GK102135905SQ20111006482
公開(kāi)日2011年7月27日 申請(qǐng)日期2011年3月17日 優(yōu)先權(quán)日2011年3月17日
發(fā)明者侯磊, 唐杰, 張嘯, 李涓子, 李虎, 王志春 申請(qǐng)人:清華大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
合作市| 晋宁县| 寿宁县| 泗阳县| 邵阳县| 桂林市| 会同县| 平江县| 墨竹工卡县| 平罗县| 蛟河市| 朝阳县| 临邑县| 抚远县| 兰西县| 怀仁县| 太仓市| 昌都县| 宜昌市| 和林格尔县| 汕尾市| 庄河市| 子长县| 龙胜| 兴化市| 金华市| 佛冈县| 威信县| 衡南县| 察隅县| 莫力| 大兴区| 福泉市| 德昌县| 晴隆县| 潮安县| 天水市| 星子县| 泰来县| 九寨沟县| 永清县|