基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法與流程

文檔序號(hào)：12612303閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法與流程

技術(shù)特征：

1.一種基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法，其特征在于，包括以下步驟：

步驟1：基于位置描述結(jié)構(gòu)本體建模，總結(jié)位置概念顯著性結(jié)構(gòu)及其順序，自定義顯著性語(yǔ)法語(yǔ)言，在程序初始化時(shí)讀取并生成相應(yīng)的類；實(shí)現(xiàn)顯著性結(jié)構(gòu)打分方法構(gòu)建，為同一位置概念的不同顯著性結(jié)構(gòu)表達(dá)尋求一個(gè)最佳匹配結(jié)果，獲得位置描述模型；

步驟2：映射位置結(jié)構(gòu)概念本體生成規(guī)則類，每一條規(guī)則類對(duì)應(yīng)一個(gè)位置實(shí)體概念本體，最終生成規(guī)則集合；

位置概念本體代表與位置有關(guān)對(duì)象的基本組成和層次關(guān)系，分為位置基礎(chǔ)概念本體和位置實(shí)體概念本體，其中位置實(shí)體概念本體對(duì)應(yīng)實(shí)際的空間實(shí)體或空間關(guān)系；位置結(jié)構(gòu)概念本體是對(duì)位置實(shí)體概念本體具體組成方式的句法模式表達(dá)，其代表了這個(gè)位置實(shí)體概念本體的組成規(guī)則；

步驟3：對(duì)規(guī)則集合進(jìn)行分類，重新劃分為若干個(gè)規(guī)則組，形成規(guī)則檢索依賴圖；

步驟4：以任意自然語(yǔ)言文本位置描述語(yǔ)句和原始的自然語(yǔ)言文本位置描述語(yǔ)句作為輸入，利用基于位置描述顯著性結(jié)構(gòu)的規(guī)則匹配算法進(jìn)行匹配，通過(guò)打分排序完成位置信息的結(jié)構(gòu)化提取。

2.根據(jù)權(quán)利要求1所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法，其特征在于，步驟3中所述對(duì)規(guī)則集合進(jìn)行分類，是利用規(guī)則分組依賴圖，首先對(duì)所有節(jié)點(diǎn)之間依賴關(guān)系建立節(jié)點(diǎn)，然后采用貪婪的形式建立規(guī)則組，通過(guò)規(guī)則組的依賴關(guān)系合并存在交叉依賴的規(guī)則組；其中，每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)規(guī)則集合，節(jié)點(diǎn)之間依賴關(guān)系是指上層的規(guī)則組中的與下層規(guī)則組中的存在交集，且上層的規(guī)則組中的與下層規(guī)則組中的不存在交集。

3.根據(jù)權(quán)利要求1所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法，其特征在于，步驟4中所述基于位置描述顯著性結(jié)構(gòu)的規(guī)則匹配算法進(jìn)行匹配，其具體實(shí)現(xiàn)包括以下子步驟：

步驟4.1：輸入位置基礎(chǔ)概念本體的S實(shí)例、原子概念集W，將作為位置基礎(chǔ)概念本體的S和原子概念集合W進(jìn)行匹配，得出結(jié)果集合G；其中，原子概念集是位置基礎(chǔ)概念本體對(duì)應(yīng)語(yǔ)義位置的原子組成詞匯的集合；

將位置基礎(chǔ)概念本體的S實(shí)例和W進(jìn)行匹配，根據(jù)規(guī)則匹配生成匹配樹(shù)集，將匹配樹(shù)與相應(yīng)概念的顯著性結(jié)構(gòu)進(jìn)行選擇、過(guò)濾和查詢，獲取具備顯著特征的候選假對(duì)象；基于具備顯著性特征的候選假對(duì)象，對(duì)其進(jìn)行概念集、感興趣類型、顯著性概念集合和顯著性結(jié)構(gòu)要求的判斷，獲取最終候選假對(duì)象實(shí)例并加入待選集合G中；

步驟4.2：基于待選集合G中候選假對(duì)象實(shí)例，根據(jù)各類位置概念顯著性結(jié)構(gòu)優(yōu)先級(jí)，調(diào)用顯著性結(jié)構(gòu)評(píng)分函數(shù)對(duì)精確符合顯著性結(jié)構(gòu)的實(shí)例對(duì)象的進(jìn)行評(píng)分與排序；按照排序結(jié)果，采用裁剪對(duì)象查詢選擇最優(yōu)評(píng)分的對(duì)象作為最終實(shí)例。

4.根據(jù)權(quán)利要求3所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法，其特征在于，步驟4.1中所述獲取具備顯著特征的候選假對(duì)象，其具體實(shí)現(xiàn)包括以下子步驟：

步驟4.1.1：遍歷G中源節(jié)點(diǎn)N，獲取N下的子節(jié)點(diǎn)n；如果n符合概念節(jié)點(diǎn)C要求，則被納入概念集類型f中；否則，繼續(xù)遍歷下一個(gè)節(jié)點(diǎn)；其中，概念節(jié)點(diǎn)C由兩部分形成：一部分為L(zhǎng)O-Trie中查詢到的基礎(chǔ)概念對(duì)象，另一部分為規(guī)則匹配得出的實(shí)體概念對(duì)象；

步驟4.1.2：判斷當(dāng)前n的概念集類型f是否為感興趣類型；如果是，標(biāo)識(shí)flag為true；否則默認(rèn)為false；其中，flag表示判斷后結(jié)果存儲(chǔ)的地方；

步驟4.1.3：判斷概念集類型f是否為顯著性概念集合；如果是，繼續(xù)判斷f作為一個(gè)假對(duì)象是否滿足顯著性結(jié)構(gòu)條件，如果滿足條件，則作為候選假對(duì)象實(shí)例i，加入到規(guī)則匹配圖中。

5.根據(jù)權(quán)利要求3所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法，其特征在于，步驟4.2的具體實(shí)現(xiàn)包括以下子步驟：

步驟4.2.1：獲取符合組內(nèi)假對(duì)象的顯著性結(jié)構(gòu)s，并創(chuàng)建用于存儲(chǔ)實(shí)例顯著性概念集合g；

步驟4.2.2：遍歷s獲取相應(yīng)顯著性名稱所對(duì)應(yīng)的實(shí)例顯著性概念對(duì)象ss；如果ss不為空，則繼續(xù)對(duì)其遍歷判斷是否精確符合顯著性結(jié)構(gòu)s，如果判斷結(jié)果不為空，將ss添加到實(shí)例顯著性概念集合g中；

步驟4.2.3：判斷g是否為空；如果不為空，再調(diào)用顯著性結(jié)構(gòu)評(píng)分函數(shù)，獲取假對(duì)象顯著性分?jǐn)?shù)并排序；

所述顯著性結(jié)構(gòu)評(píng)分函數(shù)是依據(jù)概念型分類和排序，同類概念的顯著性結(jié)構(gòu)之間再進(jìn)行打分排序；分組相同時(shí)，根據(jù)匹配的有效字符串長(zhǎng)度進(jìn)行排序；

步驟4.2.4：按照排序結(jié)果，采用裁剪對(duì)象進(jìn)行查詢選擇最高評(píng)分的對(duì)象作為最終結(jié)果。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁(yè)1 2 3

相關(guān)技術(shù)