欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

實(shí)體集合擴(kuò)展方法_2

文檔序號(hào):8472996閱讀:來源:國(guó)知局
化處理,從而能夠?qū)崿F(xiàn)動(dòng)態(tài)內(nèi)容生成,XML可以使我們能夠更準(zhǔn)確的搜索,更方便的傳送 軟件組件,更好的描述一些事物,例如電子商務(wù)交易等。
[0024]RDF使用XML語(yǔ)法和RDF架構(gòu)(RDFschema,簡(jiǎn)稱RDFS)來將元數(shù)據(jù)描述成為數(shù)據(jù) 模型。所謂元數(shù)據(jù),就是"描述數(shù)據(jù)的數(shù)據(jù)"或者"描述信息的信息"。舉個(gè)簡(jiǎn)單的例子,書 的內(nèi)容是書的數(shù)據(jù),而作者的名字、出版社的地址或版權(quán)信息就是書的元數(shù)據(jù)。數(shù)據(jù)和元數(shù) 據(jù)的劃分不是絕對(duì)的,有些數(shù)據(jù)既可以作為數(shù)據(jù)處理,也可以作為元數(shù)據(jù)處理,例如可以將 作者的名字作為數(shù)據(jù)而不是元數(shù)據(jù)處理。
[0025]眾所周知,對(duì)資源的描述是領(lǐng)域和應(yīng)用相關(guān)的,比如對(duì)一本書的描述和對(duì)一個(gè)Web站點(diǎn)的描述是不一樣的,即對(duì)不同資源的描述需要采取不同的詞匯表。因此RDF規(guī)范并沒 有定義描述資源所用的詞匯表,而是定義了一些規(guī)則,這些規(guī)則是各領(lǐng)域和應(yīng)用定義用于 描述資源的詞匯表時(shí)必須遵循的。當(dāng)然,RDF也提供了描述資源時(shí)具有基礎(chǔ)性的詞匯表。
[0026] 簡(jiǎn)單而言,一個(gè)RDF文件包含多個(gè)資源描述,而一個(gè)資源描述是由多個(gè)語(yǔ)句構(gòu)成, 一個(gè)語(yǔ)句是由資源、屬性類型、屬性值構(gòu)成的三元組,表示資源具有的一個(gè)屬性特征。通過 RDF,人們可以使用自己的詞匯表描述任何資源,由于使用的是結(jié)構(gòu)化的XML數(shù)據(jù),搜索引 擎可以理解元數(shù)據(jù)的精確含義,使得搜索變得更為智能和準(zhǔn)確。
[0027] 圖1為本發(fā)明實(shí)施例提供的一實(shí)體集合擴(kuò)展方法的流程示意圖,如圖1所示,本實(shí) 施例提供的實(shí)體集合擴(kuò)展方法包括:
[0028]S101,獲取用戶輸入的種子實(shí)體集合,所述種子實(shí)體集合中包含的種子實(shí)體的數(shù) 量為至少兩個(gè);
[0029]示例性的,用戶可以通過訪問操作來間接輸入種子實(shí)體,也可以直接通過用戶終 端設(shè)備直接輸入種子實(shí)體。舉例來說,用戶先后訪問了淘寶網(wǎng)、京東商城、一號(hào)店和亞馬遜, 則實(shí)體集合擴(kuò)展裝置可以根據(jù)用戶的訪問獲取包含淘寶網(wǎng)、京東商城、一號(hào)店和亞馬遜四 個(gè)種子實(shí)體的種子實(shí)體集合。用戶也可以在終端設(shè)備相應(yīng)的種子實(shí)體輸入框中直接輸入種 子實(shí)體淘寶網(wǎng)、京東商城、一號(hào)店和亞馬遜??梢岳斫?,種子實(shí)體集合中包含的種子實(shí)體的 個(gè)數(shù)可以是基于用戶的歷史訪問記錄,或是用戶的輸入,需要說明的是,本實(shí)施例中種子實(shí) 體集合中包含的種子實(shí)體的數(shù)量為至少兩個(gè)。
[0030] S102,根據(jù)種子實(shí)體集合中每個(gè)種子實(shí)體的實(shí)體名,在RDF知識(shí)庫(kù)中確定每個(gè)種 子實(shí)體對(duì)應(yīng)的屬性信息,所述屬性信息中包括至少一個(gè)屬性特征,所述RDF知識(shí)庫(kù)中存儲(chǔ) 有預(yù)先建立的每個(gè)實(shí)體的實(shí)體名和屬性信息的關(guān)聯(lián)關(guān)系;
[0031] S103,根據(jù)每個(gè)種子實(shí)體對(duì)應(yīng)的屬性信息,確定種子實(shí)體集合對(duì)應(yīng)的相同屬性特 征,所述相同屬性特征包括至少兩個(gè)種子實(shí)體所具有的相同的屬性特征;
[0032] 在實(shí)際應(yīng)用中,作為一種優(yōu)選的實(shí)施方式,可以將所使用的RDF知識(shí)庫(kù)下載到實(shí) 體集合擴(kuò)展裝置的存儲(chǔ)器中,以供進(jìn)行實(shí)體集合擴(kuò)展時(shí)使用,例如可以將RDF知識(shí)庫(kù)存儲(chǔ) 在一臺(tái)或多臺(tái)支持云平臺(tái)的計(jì)算機(jī)中。RDF知識(shí)庫(kù)中包含多個(gè)實(shí)體信息,換句話說,RDF知 識(shí)庫(kù)中的每一個(gè)資源都有對(duì)應(yīng)的實(shí)體名和屬性信息。
[0033] 示例性的,實(shí)體集合擴(kuò)展裝置執(zhí)行SlOl獲取用戶輸入的種子實(shí)體集合包括"中 國(guó)、美國(guó)、俄羅斯、印度"四個(gè)種子實(shí)體;根據(jù)這四個(gè)種子實(shí)體,可以確定出四個(gè)種子實(shí)體包 括如下相同屬性特征:國(guó)家、聯(lián)合國(guó)安理會(huì)常任理事會(huì)成員、有核武器的國(guó)家、領(lǐng)土面積排 名前10名的國(guó)家、……受限于知識(shí)庫(kù)的數(shù)量和質(zhì)量等因素,根據(jù)種子節(jié)點(diǎn)實(shí)體找到的特征 可以不要求所有的種子都滿足,以便獲取更多的相同屬性特征,豐富擴(kuò)展結(jié)果。
[0034] 優(yōu)選的,本實(shí)施例中設(shè)定所獲取的種子實(shí)體集合對(duì)應(yīng)的相同屬性特征包括至少兩 個(gè)種子實(shí)體所具有的相同的屬性特征。請(qǐng)繼續(xù)參照上述示例,實(shí)體集合擴(kuò)展裝置執(zhí)行S102 和S103可以獲取該種子實(shí)體集合對(duì)應(yīng)的相同屬性特征包括:國(guó)家、聯(lián)合國(guó)安理會(huì)常任理 事會(huì)成員、有核武器的國(guó)家、領(lǐng)土面積排名前10名的國(guó)家、與朝鮮接壤的國(guó)家、八國(guó)聯(lián)軍成 員、領(lǐng)土面積排名前3名的國(guó)家、……
[0035]另外,當(dāng)獲取的種子實(shí)體集合之間沒有所有種子實(shí)體都滿足的屬性特征時(shí),例如 種子實(shí)體集合為"中國(guó)、華盛頓、首爾、巴黎、喬布斯、金泰熙、奧黛麗?赫本",實(shí)體集合擴(kuò)展 裝置執(zhí)行S102和S103依然可以確定出所述種子實(shí)體集合對(duì)應(yīng)的相同屬性特征,如首都城 市(華盛頓、首爾和巴黎)、以人名命名的地名(華盛頓和巴黎)、影視劇演員(金泰熙和奧 黛麗?赫本)、美國(guó)著名的人物(華盛頓和喬布斯)等等。
[0036] S104,確定RDF知識(shí)庫(kù)中具有所述相同屬性特征的其他實(shí)體構(gòu)成擴(kuò)展實(shí)體集合;
[0037] S105,將所述擴(kuò)展實(shí)體集合中包括的實(shí)體添加到所述種子實(shí)體集合中,得到擴(kuò)展 后的實(shí)體集合;
[0038] S106,將所述擴(kuò)展后的實(shí)體集合發(fā)送給用戶終端設(shè)備。
[0039] 舉例來說,具有相同屬性特征"領(lǐng)土面積排名前10名的國(guó)家"的其他實(shí)體包括加 拿大、巴西、澳大利亞、阿根廷、哈薩克斯坦和蘇丹6個(gè)國(guó)家。所有具有種子實(shí)體集合對(duì)應(yīng)的 相同屬性特征的其他實(shí)體都可以作為候選實(shí)體,構(gòu)成擴(kuò)展實(shí)體集合,將擴(kuò)展實(shí)體集合中包 括的實(shí)體添加到所述種子實(shí)體集合中,得到擴(kuò)展后的實(shí)體集合,將擴(kuò)展后的實(shí)體集合發(fā)送 給用戶終端設(shè)備。例如輸出至顯示器或者打印機(jī),以提供給用戶。
[0040] 可以理解,如果根據(jù)用戶輸入的種子實(shí)體集合未在RDF知識(shí)庫(kù)中查找到種子實(shí)體 集合對(duì)應(yīng)的相同屬性特征,則得到的擴(kuò)展實(shí)體集合為空集,也就是擴(kuò)展后的實(shí)體集合依然 是原來的種子實(shí)體集合。
[0041] 本實(shí)施例提供的實(shí)體集合擴(kuò)展方法通過以種子實(shí)體為關(guān)鍵字,在RDF知識(shí)庫(kù)中查 詢種子實(shí)體集合對(duì)應(yīng)的的相同屬性特征,并且根據(jù)相同屬性特征信息在RDF知識(shí)庫(kù)中查詢 候選實(shí)體,由候選實(shí)體構(gòu)成擴(kuò)展實(shí)體集合進(jìn)行實(shí)體集合擴(kuò)展。由于RDF知識(shí)庫(kù)使用的是結(jié) 構(gòu)化的XML數(shù)據(jù),在進(jìn)行實(shí)體集合擴(kuò)展時(shí),可以挖掘出種子實(shí)體之間的語(yǔ)義信息,使得擴(kuò)展 結(jié)果變得更為智能和準(zhǔn)確,而且結(jié)構(gòu)化的數(shù)據(jù)更易于處理,保證了實(shí)體集合擴(kuò)展的效率。
[0042] 在實(shí)際應(yīng)用中,根據(jù)種子實(shí)體集合,在RDF知識(shí)庫(kù)中確定該種子實(shí)體集合具有的 相同屬性特征可能包含多個(gè),也可能為零個(gè)。圖2為本發(fā)明實(shí)施例提供的另一實(shí)體集合擴(kuò) 展方法的流程示意圖,本實(shí)施例在圖1所示實(shí)施例的基礎(chǔ)上,較佳的,根據(jù)種子實(shí)體集合, 在RDF知識(shí)庫(kù)中至少可以確定該種子實(shí)體集合具有的一個(gè)相同屬性特征,可以將種子實(shí)體 集合具有的相同屬性特征的數(shù)量記為N,顯然N為大于0的整數(shù)。此時(shí),上述實(shí)施例S104具 體可以包括如下步驟:
[0043]S1041,分別確定各相同屬性特征對(duì)應(yīng)的候選實(shí)體集合;
[0044]S1042,分別確定每個(gè)所述候選實(shí)體集合中包含的實(shí)體的數(shù)量,并根據(jù)所述數(shù)量確 定每個(gè)候選實(shí)體的第一權(quán)重值,所述候選實(shí)體屬于至少一個(gè)候選實(shí)體集合;
[0045]S1043,根據(jù)每個(gè)所述候選實(shí)體的第一權(quán)重值的大小確定所述擴(kuò)展實(shí)體集合。
[0046] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將通過數(shù)學(xué)描述和具體示例 對(duì)本發(fā)明實(shí)施例的技術(shù)方案做詳細(xì)介紹。
[0047] 首先,可以先給出一些合適的定義:
[0048] 定義1:設(shè)種子實(shí)體集合為M=Ie1,e2,......,em},其中e"e2,......,emSm個(gè) 種子實(shí)體;
[0049] 定義2:設(shè)M對(duì)應(yīng)的相同屬性特征為JT;
[0050]
當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
金坛市| 九台市| 修水县| 宜阳县| 滁州市| 闻喜县| 安阳市| 沽源县| 孟连| 宁强县| 东乡族自治县| 徐闻县| 靖边县| 新巴尔虎右旗| 富裕县| 托里县| 南充市| 满洲里市| 阿图什市| 涡阳县| 遂平县| 若羌县| 黑山县| 西盟| 永宁县| 云南省| 仁布县| 灌阳县| 枣庄市| 福鼎市| 永登县| 万安县| 庆阳市| 博爱县| 左云县| 宁夏| 新津县| 久治县| 北票市| 万山特区| 潮安县|