基于動(dòng)態(tài)屬性分析的信息檢索方法
【專利摘要】本發(fā)明提供一種基于動(dòng)態(tài)屬性分析的信息檢索方法。本發(fā)明將通過分析每次信息檢索條件的動(dòng)態(tài)屬性重要程度,基于動(dòng)態(tài)屬性分析的信息檢索算法通過分析檢索時(shí)動(dòng)態(tài)信息熵增量方向,實(shí)現(xiàn)對(duì)待檢索的信息屬性動(dòng)態(tài)重要程度的計(jì)算來形成信息檢索規(guī)則,使得信息檢索可以按照檢索信息動(dòng)態(tài)信息增量最大方向快速搜索。本發(fā)明能建立出快速、準(zhǔn)確的信息檢索規(guī)則,該規(guī)則將按照動(dòng)態(tài)更新下的信息檢索最優(yōu)方向進(jìn)行信息的快速檢索,從而獲得更快捷、更準(zhǔn)確的信息檢索。
【專利說明】基于動(dòng)態(tài)屬性分析的信息檢索方法
【背景技術(shù)】
[0001]目前對(duì)于信息需求主要矛盾不在于信息數(shù)量的限制,而在于如何精確、便捷的定位所需的信息,即如何根據(jù)搜索條件建立信息檢索規(guī)則。信息檢索目前的方式是基于被檢索信息的靜態(tài)屬性分析結(jié)果來進(jìn)行的。該方法的理論基礎(chǔ)是粗糙集Rough Set。Rough Set建立了一個(gè)融合上近似集和下近似集的定義方式來將難以確認(rèn)歸屬的數(shù)據(jù)進(jìn)行劃分。上近似集和下近似集通過等價(jià)關(guān)系可以寫出明確的公式,這樣邊界數(shù)據(jù)的不確定特性就可以被計(jì)算出來,從而便于來考證系統(tǒng)對(duì)事物的了解程度。
[0002]解讀數(shù)據(jù)集中的屬性重要性是Rough Set理論中一項(xiàng)重要的分析,Rough Set通過分析不同屬性組合對(duì)決策的支持力度來區(qū)分不同屬性的重要性。屬性重要性分析都是基于全局分析的,也就是說對(duì)屬性重要性的確定是根據(jù)數(shù)據(jù)集中的所有樣例數(shù)據(jù)得到的固定值,即靜態(tài)屬性。
[0003]目前的基于靜態(tài)屬性的信息檢索方法通過對(duì)條件屬性按照其對(duì)于最終信息決策的重要程度來進(jìn)行區(qū)分,按照各條件屬性的重要程度作為信息檢索的搜索方向,即每次檢索均選用當(dāng)前重要程度最高的條件屬性進(jìn)行檢索。這種方式是一種平均上的最優(yōu)形式,其保證了信息檢索從整體上來看是最優(yōu)。但是,這種方式難以保證每次檢索都是最優(yōu)的,某些情況下全局的重要性跟中獲得部分知識(shí)前提的局部分析上來說是不相符的,無法建立最優(yōu)的信息檢索規(guī)則更快地得到檢索結(jié)果。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是,提供一種提高信息檢索的準(zhǔn)確性和效率的信息檢索方法。
[0005]本發(fā)明為解決上述技術(shù)問題所采樣的技術(shù)方案是,基于動(dòng)態(tài)屬性分析的信息檢索方法,包括以下步驟:
[0006]I)建立模糊等價(jià)關(guān)系,預(yù)先確定所有在不同條件屬性組合以及不同條件屬性值組合下的信息熵增量;
[0007]2)初始化信息檢索的所有條件屬性的屬性重要值;
[0008]3)獲取輸入的條件屬性及其屬性值,使用在當(dāng)前未使用的輸入條件屬性中選擇最大屬性重要值所對(duì)應(yīng)的條件屬性及其屬性值進(jìn)行檢索;
[0009]4)判斷信息檢索是否完成,如是,輸出檢索結(jié)果,如否,進(jìn)行步驟5);所述信息檢索完成為檢索出唯一的結(jié)果屬性或者所有輸入的條件屬性均已使用且無新輸入的條件屬性及其屬性值;
[0010]5)通過計(jì)算本次檢索后的信息熵增量來動(dòng)態(tài)更新未使用的條件屬性的屬性重要值后,返回步驟3)。
[0011]具體的,更新未使用的條件屬性的屬性重要值的方法為:[0012]
【權(quán)利要求】
1.基于動(dòng)態(tài)屬性分析的信息檢索方法,其特征在于,包括以下步驟: 1)建立模糊等價(jià)關(guān)系,預(yù)先確定所有在不同條件屬性組合以及不同條件屬性值組合下的信息熵增量; 2)初始化信息檢索的所有條件屬性的屬性重要值; 3)獲取輸入的條件屬性及其屬性值,使用在當(dāng)前未使用的輸入條件屬性中選擇最大屬性重要值所對(duì)應(yīng)的條件屬性及其屬性值進(jìn)行檢索; 4)判斷信息檢索是否完成,如是,輸出檢索結(jié)果,如否,進(jìn)行步驟5);所述信息檢索完成為檢索出唯一的結(jié)果屬性或者所有輸入的條件屬性均已使用且無新輸入的條件屬性及其屬性值; 5)通過計(jì)算本次檢索后的信息熵增量來動(dòng)態(tài)更新未使用的條件屬性的屬性重要值后,返回步驟3)。
2.如權(quán)利要求1所述基于動(dòng)態(tài)屬性分析的信息檢索方法,其特征在于,更新未使用的條件屬性的屬性重要值的方法為:
【文檔編號(hào)】G06F17/30GK103793480SQ201410018199
【公開日】2014年5月14日 申請(qǐng)日期:2014年1月15日 優(yōu)先權(quán)日:2014年1月15日
【發(fā)明者】赫熙煦, 張民, 賈海濤, 陳雷霆 申請(qǐng)人:電子科技大學(xué)