欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

知識(shí)抽取方法及裝置與流程

文檔序號(hào):12612223閱讀:來(lái)源:國(guó)知局

技術(shù)特征:

1.一種知識(shí)抽取方法,其特征在于,所述方法包括:

獲取表格數(shù)據(jù)的語(yǔ)義相似度,根據(jù)所述語(yǔ)義相似度確定表格結(jié)構(gòu);

根據(jù)所述表格結(jié)構(gòu)確定表頭屬性名稱;

抽取所述表頭屬性名稱及所述表頭屬性名稱對(duì)應(yīng)的表格內(nèi)容分別作為知識(shí)屬性名稱和屬性值。

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取表格數(shù)據(jù)的語(yǔ)義相似度,根據(jù)所述語(yǔ)義相似度確定表格結(jié)構(gòu)包括:

將表格數(shù)據(jù)按照橫表結(jié)構(gòu)拆分為第一表頭和多個(gè)第一表格內(nèi)容時(shí),獲取所述第一表頭與各所述第一表格內(nèi)容間的語(yǔ)義相似度、及各所述第一表格內(nèi)容之間的語(yǔ)義相似度;

將所述表格數(shù)據(jù)按照豎表結(jié)構(gòu)拆分為第二表頭和多個(gè)第二表格內(nèi)容時(shí),獲取所述第二表頭與各所述第二表格內(nèi)容間的語(yǔ)義相似度、及各所述第二表格內(nèi)容之間的語(yǔ)義相似度;

根據(jù)所述第一表頭與各所述第一表格內(nèi)容間的語(yǔ)義相似度、各所述第一表格內(nèi)容之間的語(yǔ)義相似度、所述第二表頭與各所述第二表格內(nèi)容間的語(yǔ)義相似度、各所述第二表格內(nèi)容之間的語(yǔ)義相似度,及預(yù)設(shè)的表頭與表格內(nèi)容間的語(yǔ)義相似度閾值和表格內(nèi)容之間的語(yǔ)義相似度閾值,確定表格結(jié)構(gòu)。

3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述表格結(jié)構(gòu)確定表頭屬性名稱包括:

根據(jù)所述表格結(jié)構(gòu)確定所述表格數(shù)據(jù)的初始表頭;

在確定所述初始表頭存在屬性名稱的總分結(jié)構(gòu)時(shí),對(duì)所述初始表頭進(jìn)行屬性合并,確定表頭屬性名稱。

4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述抽取所述表頭屬性名稱及所述表頭屬性名稱對(duì)應(yīng)的表格內(nèi)容分別作為知識(shí)屬性名稱和屬性值之前,所述方法還包括:根據(jù)所述表頭屬性名稱,對(duì)所述表頭屬性名稱對(duì)應(yīng)的表格內(nèi)容 進(jìn)行合并。

5.一種知識(shí)抽取裝置,其特征在于,所述裝置包括:

獲取模塊,用于獲取表格數(shù)據(jù)的語(yǔ)義相似度;

確定模塊,用于根據(jù)所述獲取模塊獲取的所述語(yǔ)義相似度確定表格結(jié)構(gòu);還用于根據(jù)所述表格結(jié)構(gòu)確定表頭屬性名稱;

抽取模塊,用于抽取所述表頭屬性名稱及所述表頭屬性名稱對(duì)應(yīng)的表格內(nèi)容分別作為知識(shí)屬性名稱和屬性值。

6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述獲取模塊,具體用于將表格數(shù)據(jù)按照橫表結(jié)構(gòu)拆分為第一表頭和多個(gè)第一表格內(nèi)容時(shí),獲取所述第一表頭與各所述第一表格內(nèi)容間的語(yǔ)義相似度、及各所述第一表格內(nèi)容之間的語(yǔ)義相似度;將所述表格數(shù)據(jù)按照豎表結(jié)構(gòu)拆分為第二表頭和多個(gè)第二表格內(nèi)容時(shí),獲取所述第二表頭與各所述第二表格內(nèi)容間的語(yǔ)義相似度、及各所述第二表格內(nèi)容之間的語(yǔ)義相似度;

所述確定模塊,具體用于根據(jù)所述第一表頭與各所述第一表格內(nèi)容間的語(yǔ)義相似度、各所述第一表格內(nèi)容之間的語(yǔ)義相似度、所述第二表頭與各所述第二表格內(nèi)容間的語(yǔ)義相似度、各所述第二表格內(nèi)容之間的語(yǔ)義相似度,及預(yù)設(shè)的表頭與表格內(nèi)容間的語(yǔ)義相似度閾值和表格內(nèi)容之間的語(yǔ)義相似度閾值,確定表格結(jié)構(gòu)。

7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述確定模塊,具體用于根據(jù)所述表格結(jié)構(gòu)確定所述表格數(shù)據(jù)的初始表頭;在確定所述初始表頭存在屬性名稱的總分結(jié)構(gòu)時(shí),對(duì)所述表格數(shù)據(jù)的初始表頭進(jìn)行合并,確定表頭屬性名稱。

8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述裝置還包括:

對(duì)齊模塊,用于根據(jù)所述表頭屬性名稱,對(duì)所述表頭屬性名稱對(duì)應(yīng)的表格內(nèi)容進(jìn)行合并。

當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
西乌珠穆沁旗| 仁寿县| 永昌县| 葵青区| 徐闻县| 五莲县| 和龙市| 辽中县| 赤峰市| 盐源县| 静乐县| 柳河县| 射阳县| 海晏县| 邯郸市| 辽宁省| 宁海县| 金沙县| 西昌市| 合作市| 平陆县| 仁怀市| 西和县| 喀喇沁旗| 措美县| 清水县| 马关县| 平阳县| 吉水县| 巢湖市| 镇远县| 正宁县| 惠来县| 固阳县| 大同县| 潜山县| 嘉善县| 江源县| 壤塘县| 安龙县| 定南县|