1.一種基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法,其特征在于,包括以下步驟:
步驟1:基于位置描述結(jié)構(gòu)本體建模,總結(jié)位置概念顯著性結(jié)構(gòu)及其順序,自定義顯著性語(yǔ)法語(yǔ)言,在程序初始化時(shí)讀取并生成相應(yīng)的類;實(shí)現(xiàn)顯著性結(jié)構(gòu)打分方法構(gòu)建,為同一位置概念的不同顯著性結(jié)構(gòu)表達(dá)尋求一個(gè)最佳匹配結(jié)果,獲得位置描述模型;
步驟2:映射位置結(jié)構(gòu)概念本體生成規(guī)則類,每一條規(guī)則類對(duì)應(yīng)一個(gè)位置實(shí)體概念本體,最終生成規(guī)則集合;
位置概念本體代表與位置有關(guān)對(duì)象的基本組成和層次關(guān)系,分為位置基礎(chǔ)概念本體和位置實(shí)體概念本體,其中位置實(shí)體概念本體對(duì)應(yīng)實(shí)際的空間實(shí)體或空間關(guān)系;位置結(jié)構(gòu)概念本體是對(duì)位置實(shí)體概念本體具體組成方式的句法模式表達(dá),其代表了這個(gè)位置實(shí)體概念本體的組成規(guī)則;
步驟3:對(duì)規(guī)則集合進(jìn)行分類,重新劃分為若干個(gè)規(guī)則組,形成規(guī)則檢索依賴圖;
步驟4:以任意自然語(yǔ)言文本位置描述語(yǔ)句和原始的自然語(yǔ)言文本位置描述語(yǔ)句作為輸入,利用基于位置描述顯著性結(jié)構(gòu)的規(guī)則匹配算法進(jìn)行匹配,通過(guò)打分排序完成位置信息的結(jié)構(gòu)化提取。
2.根據(jù)權(quán)利要求1所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法,其特征在于,步驟3中所述對(duì)規(guī)則集合進(jìn)行分類,是利用規(guī)則分組依賴圖,首先對(duì)所有節(jié)點(diǎn)之間依賴關(guān)系建立節(jié)點(diǎn),然后采用貪婪的形式建立規(guī)則組,通過(guò)規(guī)則組的依賴關(guān)系合并存在交叉依賴的規(guī)則組;其中,每個(gè)節(jié)點(diǎn)對(duì)應(yīng)一個(gè)規(guī)則集合,節(jié)點(diǎn)之間依賴關(guān)系是指上層的規(guī)則組中的與下層規(guī)則組中的存在交集,且上層的規(guī)則組中的與下層規(guī)則組中的不存在交集。
3.根據(jù)權(quán)利要求1所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法,其特征在于,步驟4中所述基于位置描述顯著性結(jié)構(gòu)的規(guī)則匹配算法進(jìn)行匹配,其具體實(shí)現(xiàn)包括以下子步驟:
步驟4.1:輸入位置基礎(chǔ)概念本體的S實(shí)例、原子概念集W,將作為位置基礎(chǔ)概念本體的S和原子概念集合W進(jìn)行匹配,得出結(jié)果集合G;其中,原子概念集是位置基礎(chǔ)概念本體對(duì)應(yīng)語(yǔ)義位置的原子組成詞匯的集合;
將位置基礎(chǔ)概念本體的S實(shí)例和W進(jìn)行匹配,根據(jù)規(guī)則匹配生成匹配樹(shù)集,將匹配樹(shù)與相應(yīng)概念的顯著性結(jié)構(gòu)進(jìn)行選擇、過(guò)濾和查詢,獲取具備顯著特征的候選假對(duì)象;基于具備顯著性特征的候選假對(duì)象,對(duì)其進(jìn)行概念集、感興趣類型、顯著性概念集合和顯著性結(jié)構(gòu)要求的判斷,獲取最終候選假對(duì)象實(shí)例并加入待選集合G中;
步驟4.2:基于待選集合G中候選假對(duì)象實(shí)例,根據(jù)各類位置概念顯著性結(jié)構(gòu)優(yōu)先級(jí),調(diào)用顯著性結(jié)構(gòu)評(píng)分函數(shù)對(duì)精確符合顯著性結(jié)構(gòu)的實(shí)例對(duì)象的進(jìn)行評(píng)分與排序;按照排序結(jié)果,采用裁剪對(duì)象查詢選擇最優(yōu)評(píng)分的對(duì)象作為最終實(shí)例。
4.根據(jù)權(quán)利要求3所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法,其特征在于,步驟4.1中所述獲取具備顯著特征的候選假對(duì)象,其具體實(shí)現(xiàn)包括以下子步驟:
步驟4.1.1:遍歷G中源節(jié)點(diǎn)N,獲取N下的子節(jié)點(diǎn)n;如果n符合概念節(jié)點(diǎn)C要求,則被納入概念集類型f中;否則,繼續(xù)遍歷下一個(gè)節(jié)點(diǎn);其中,概念節(jié)點(diǎn)C由兩部分形成:一部分為L(zhǎng)O-Trie中查詢到的基礎(chǔ)概念對(duì)象,另一部分為規(guī)則匹配得出的實(shí)體概念對(duì)象;
步驟4.1.2:判斷當(dāng)前n的概念集類型f是否為感興趣類型;如果是,標(biāo)識(shí)flag為true;否則默認(rèn)為false;其中,flag表示判斷后結(jié)果存儲(chǔ)的地方;
步驟4.1.3:判斷概念集類型f是否為顯著性概念集合;如果是,繼續(xù)判斷f作為一個(gè)假對(duì)象是否滿足顯著性結(jié)構(gòu)條件,如果滿足條件,則作為候選假對(duì)象實(shí)例i,加入到規(guī)則匹配圖中。
5.根據(jù)權(quán)利要求3所述的基于位置描述的顯著性結(jié)構(gòu)的位置概念結(jié)構(gòu)化提取方法,其特征在于,步驟4.2的具體實(shí)現(xiàn)包括以下子步驟:
步驟4.2.1:獲取符合組內(nèi)假對(duì)象的顯著性結(jié)構(gòu)s,并創(chuàng)建用于存儲(chǔ)實(shí)例顯著性概念集合g;
步驟4.2.2:遍歷s獲取相應(yīng)顯著性名稱所對(duì)應(yīng)的實(shí)例顯著性概念對(duì)象ss;如果ss不為空,則繼續(xù)對(duì)其遍歷判斷是否精確符合顯著性結(jié)構(gòu)s,如果判斷結(jié)果不為空,將ss添加到實(shí)例顯著性概念集合g中;
步驟4.2.3:判斷g是否為空;如果不為空,再調(diào)用顯著性結(jié)構(gòu)評(píng)分函數(shù),獲取假對(duì)象顯著性分?jǐn)?shù)并排序;
所述顯著性結(jié)構(gòu)評(píng)分函數(shù)是依據(jù)概念型分類和排序,同類概念的顯著性結(jié)構(gòu)之間再進(jìn)行打分排序;分組相同時(shí),根據(jù)匹配的有效字符串長(zhǎng)度進(jìn)行排序;
步驟4.2.4:按照排序結(jié)果,采用裁剪對(duì)象進(jìn)行查詢選擇最高評(píng)分的對(duì)象作為最終結(jié)果。