專利名稱:一種土地質(zhì)量評(píng)價(jià)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)挖掘及模糊匹配技術(shù)領(lǐng)域,尤其涉及一種土地質(zhì)量評(píng)價(jià)方 法及系統(tǒng)。
背景技術(shù):
土地質(zhì)量評(píng)價(jià)是指通過對(duì)土地的自然屬性和社會(huì)經(jīng)濟(jì)因素的綜合鑒定評(píng)定 土地對(duì)某種特定用途的適宜程度、限制因子及利用潛力,即評(píng)定出土地對(duì)發(fā)展
農(nóng)、林、牧、漁業(yè)的價(jià)值,它與土地經(jīng)濟(jì)綜合評(píng)價(jià)不同;土地質(zhì)量評(píng)價(jià)的影響 因素眾多,在土地評(píng)價(jià)的過程中,不同地區(qū)有著不同的影響因素,各影響因素 對(duì)不同的生產(chǎn)目標(biāo)又存在不同的作用,而且大多數(shù)土地質(zhì)量評(píng)價(jià)中還摻入了人 為主觀因素,從而影響到土地評(píng)價(jià)的準(zhǔn)確性。雖然現(xiàn)在有新的方法被應(yīng)用到土 地評(píng)價(jià)當(dāng)中去,而且在一定程度上提高了土地評(píng)價(jià)的精度,但是所獲得的土地 評(píng)價(jià)知識(shí)表達(dá)的可解釋性較差,實(shí)際應(yīng)用中還存在很多問題。
發(fā)明內(nèi)容
基于現(xiàn)有技術(shù)的不足,本發(fā)明需要解決的問題是提供一種能夠提高土地 評(píng)價(jià)知識(shí)表達(dá)的可解釋性和土地評(píng)價(jià)有效性的土地質(zhì)量評(píng)價(jià)方法及系統(tǒng)。
為解決上述問題,本發(fā)明提供了一種土地質(zhì)量評(píng)價(jià)方法,其包括以下步驟
A、 從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);
B、 對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;
C、 輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù),計(jì)算其與各關(guān)聯(lián)規(guī)則的匹配程度,找 出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地 等級(jí)。
5具體地,土地評(píng)價(jià)屬性數(shù)據(jù)支持連續(xù)的、缺失的、標(biāo)稱值的、離散的、序
數(shù)的、數(shù)值型、字符型數(shù)據(jù)以及其他與土地評(píng)價(jià)相關(guān)的數(shù)據(jù)類型;所述土地樣 本的屬性數(shù)據(jù)包括以下屬性類別高程、地面坡度、土壤質(zhì)地、土壤酸堿度、 土壤有機(jī)質(zhì)含量、土壤利用類型、地形、土層厚度、土壤表層質(zhì)地、有機(jī)質(zhì)含 量、剖面構(gòu)型、坡向、坡位、灌溉保證率、土壤排水條件、地下水位、植被類 型、地表侵蝕度、可及度。屬性數(shù)據(jù)的選取可根據(jù)實(shí)際情況選取以上列舉部分 或者全部數(shù)據(jù),當(dāng)實(shí)際情況需要增加自然屬性、經(jīng)濟(jì)屬性或者社會(huì)屬性評(píng)價(jià)因 素時(shí),可根據(jù)實(shí)際需要將該影響因素列入屬性數(shù)據(jù)中。 所述步驟B具體包括
Bl、根據(jù)獲取的各個(gè)土地樣本的屬性數(shù)據(jù),分別對(duì)各個(gè)土地樣本屬性數(shù)據(jù) 進(jìn)行土地質(zhì)量分等定級(jí);
B2、設(shè)定最小支持度的閾值; B3、分別統(tǒng)計(jì)各種屬性值的數(shù)量;
B4、計(jì)算每一種屬性值的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小 于所述最小支持度的值,則保留對(duì)應(yīng)的屬性值,否則去除;
B5、將保留下來的屬性值分別與另外一組屬性數(shù)據(jù)進(jìn)行組合,分別統(tǒng)計(jì)各 種組合的數(shù)量;
B6、計(jì)算每一種組合的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于 所述最小支持度的值,則保留對(duì)應(yīng)的組合,否則去除;
B7、將保留下來的組合分別與其他屬性類別的屬性值進(jìn)行組合,分別統(tǒng)計(jì) 各種組合的數(shù)量;返回步驟B6,直到得到最后保留的所有屬性以及土地質(zhì)量等 級(jí)的組合即為生成的關(guān)聯(lián)MJ'J 。
所述步驟C具體包括 C1 、輸入待評(píng)4介土地樣本的屬性數(shù)據(jù);
C2、計(jì)算出待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬
度;
C3、分別計(jì)算每條關(guān)聯(lián)規(guī)則的各屬性對(duì)應(yīng)的隸屬度相乘,即得到與各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則的模糊匹配程度;
C4、在所有的關(guān)聯(lián)規(guī)則中,取模糊匹配程度最大那條關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地 質(zhì)量等級(jí),作為待評(píng)價(jià)土地樣本的評(píng)價(jià)結(jié)果。
所述步驟C2是利用模糊隸屬函數(shù)來計(jì)算待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng) 價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬度的。
本發(fā)明還提供一種土地質(zhì)量評(píng)價(jià)系統(tǒng),其包括
數(shù)據(jù)導(dǎo)入模塊,用于從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);
關(guān)聯(lián)規(guī)則生成模塊,用于對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若 干條關(guān)聯(lián)規(guī)則;
輸入模塊,用于輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù);
模糊判決模塊,用于計(jì)算所述待評(píng)價(jià)土地樣本的屬性數(shù)據(jù)與各關(guān)聯(lián)規(guī)則的 匹配程度,找出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則 所對(duì)應(yīng)的土地等級(jí)。
本發(fā)明利用數(shù)據(jù)挖掘的方法從土地樣本屬性數(shù)據(jù)中挖掘出關(guān)聯(lián):規(guī)則,然后 將待評(píng)價(jià)的土地樣本與生成的關(guān)聯(lián)規(guī)則進(jìn)行模糊判決,得到待評(píng)價(jià)土地樣本的 土地質(zhì)量等級(jí),與現(xiàn)有技術(shù)相比較,本發(fā)明能夠提高土地評(píng)價(jià)知識(shí)表達(dá)的可解 釋性和土地評(píng)價(jià)有效性。
下面結(jié)合附圖詳細(xì)說明本發(fā)明,其作為本說明書的一部分,通過實(shí)施例來說 明本發(fā)明的原理,本發(fā)明的其他方面、特征及其優(yōu)點(diǎn)通過該詳細(xì)說明將會(huì)變得 一目了然。
圖1為本發(fā)明一種土地質(zhì)量評(píng)價(jià)方法在一個(gè)優(yōu)選實(shí)施例中的流程圖; 圖2為本發(fā)明一種土地質(zhì)量評(píng)價(jià)系統(tǒng)在一個(gè)優(yōu)選實(shí)施例中的框架圖; 圖3為本發(fā)明一種土地質(zhì)量評(píng)價(jià)系統(tǒng)在一個(gè)優(yōu)選實(shí)施例中的詳細(xì)結(jié)構(gòu)框架圖。
圖4為本發(fā)明一種土地質(zhì)量評(píng)價(jià)方法中精簡(jiǎn)模糊分類關(guān)聯(lián)規(guī)則算法 具體流程圖。
具體實(shí)施例方式
現(xiàn)結(jié)合附圖來說明本發(fā)明的優(yōu)選實(shí)施例。
本發(fā)明提供了一種土地質(zhì)量評(píng)價(jià)方法,其包括以下步驟 SOl、從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);以廣東省第二次土壤 普查成果資料為主要數(shù)據(jù)源,結(jié)合廣東省統(tǒng)計(jì)年鑒等社會(huì)經(jīng)濟(jì)資料,建立土壤 資源數(shù)據(jù)庫;土地評(píng)價(jià)屬性數(shù)據(jù)支持連續(xù)的、缺失的、標(biāo)稱值的、離散的、序 數(shù)的、數(shù)值型、字符型數(shù)據(jù)以及其他與土地評(píng)價(jià)相關(guān)的數(shù)據(jù)類型;所述土地樣 本的屬性數(shù)據(jù)包括以下屬性類別高程、地面坡度、土壤質(zhì)地、土壤酸堿度、 土壤有機(jī)質(zhì)含量、土壤利用類型、地形、土層厚度、土壤表層質(zhì)地、有機(jī)質(zhì)含 量、剖面構(gòu)型、坡向、坡位、灌溉保證率、土壤排水條件、地下水位、植被類 型、地表侵蝕度、可及度。屬性數(shù)據(jù)的選取可根據(jù)實(shí)際情況選取以上列舉部分 或者全部數(shù)據(jù),當(dāng)實(shí)際情況需要增加自然屬性、經(jīng)濟(jì)屬性或者社會(huì)屬性評(píng)價(jià)因 素時(shí),可根據(jù)實(shí)際需要將該影響因素列入屬性數(shù)據(jù)中。根據(jù)土壤資源的實(shí)際特 點(diǎn),可采用高程(ELE)、地面坡度(SLE)、 土壤質(zhì)地(TEE)、 土壤酸堿度(PHE)、 土壤有機(jī)質(zhì)含量(0ME) 、 土壤利用類型(LUE)等六個(gè)指標(biāo)作為評(píng)價(jià)因子;其中高 程、地面坡度、土壤酸堿度、土壤有機(jī)質(zhì)含量的數(shù)據(jù)為連續(xù)屬性,土壤質(zhì)地和 土壤利用類型則為標(biāo)稱屬性;本發(fā)明將連續(xù)屬性劃分為不同的區(qū)段值,并將各 區(qū)段用質(zhì)量等級(jí)來表示;例如分級(jí)為1表示土壤質(zhì)量指標(biāo)最優(yōu),分級(jí)為5表示 最差,將標(biāo)稱屬性也用相應(yīng)的等級(jí)來表示,如下表表l所示
表1叛穩(wěn) 織菌總魔土纏 ±壊有機(jī) ^攄 ±嫌琳
ab/《?!? .鸚總質(zhì)含纛/%嚴(yán)~ rt幾型
|^繼 豳嫌荊
分級(jí)
502、 輸入最小支持度minsup;本發(fā)明通過在設(shè)定的最小支持度下對(duì)數(shù)據(jù)樣 本屬性逐次進(jìn)行統(tǒng)計(jì)、剪枝、連接,最后實(shí)現(xiàn)頻繁項(xiàng)集的抽取。其中,最小支 持度指的是在海量數(shù)據(jù)中統(tǒng)計(jì)出指定的屬性或者規(guī)則的事務(wù)數(shù)量與所有的屬性 或規(guī)則的事務(wù)數(shù)數(shù)量比值,可以記為Sup(A=>B), A、 B都是項(xiàng)集。此外,還需 要涉及最小置信度,它指的是在包含A的事務(wù)同時(shí)也包含B的比例關(guān)系,即條 件概率,可以記為Conf (A=〉B);
503、 對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;由于 土地評(píng)價(jià)數(shù)據(jù)庫中影響評(píng)價(jià)結(jié)果的屬性眾多,而最主要的屬性有高程(ELE)、 地面坡度(SLE)、 土壤質(zhì)地(TEE)、 土壤酸堿度(PHE)、 土壤有機(jī)質(zhì)含量(0ME)、 土壤利用類型(LUE),因此,抽取這六個(gè)屬性的基礎(chǔ)上加上評(píng)價(jià)結(jié)果組成新的數(shù) 據(jù)庫,在新的數(shù)據(jù)庫中進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;
504、 輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù);及輸入待評(píng)價(jià)土地樣本的高程(ELE )、 地面坡度(SLE)、 土壤質(zhì)地(TEE)、 土壤酸堿度(PHE)、 土壤有機(jī)質(zhì)含量(OME)、 土i裏利用類型(LUE)這六個(gè)屬性的數(shù)據(jù);
505、 計(jì)算待評(píng)價(jià)土地樣本與各關(guān)聯(lián)規(guī)則的匹配程度,找出最匹配的關(guān)聯(lián)規(guī) 則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地等級(jí)。
具體的,所述步驟S03具體包括以下的步驟
根據(jù)獲取的各個(gè)土地樣本的屬性數(shù)據(jù),分別對(duì)各個(gè)土地樣本進(jìn)行土地質(zhì)量 分級(jí);
分別統(tǒng)計(jì)高程ELE的各種屬性值的數(shù)量,即把高程的各種屬性值記為
9
《01 4 >1卿 》25
4 6;3 XS 耕維 !》
M 5fs, 8嫵 2
1.0~3Jft' 櫞地 3
格l 4.3~5J教J Jfi 4
瀾綴地
壤讓壤iii .雜 土
輕沙中童拓中ELE[i];統(tǒng)計(jì)每一種ELE[i]下屬性值的數(shù)量NELE[i],其中i=l, 2, 3......;
計(jì)算每一種高程屬性值的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不'J、 于所述最小支持度minsup的值,則保留對(duì)應(yīng)的高程屬性值,否則去除;
將保留下來的高程屬性值分別與各個(gè)地面坡度的屬性值進(jìn)行組合,分別統(tǒng) 計(jì)各種組合的數(shù)量;
計(jì)算每一種組合的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述
最小支持度的值,則保留對(duì)應(yīng)的組合,否則去除;
將保留下來的組合分別與其他屬性類別的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種 組合的數(shù)量;直到得到最后保留的所有屬性以及土地質(zhì)量等級(jí)的組合即為生成 的關(guān)聯(lián)規(guī)則;即進(jìn)行逐層搜索迭代,由兩個(gè)屬性的組合逐步擴(kuò)展到所有屬性以及 土地質(zhì)量等級(jí)的組合,最后得到相應(yīng)的頻繁項(xiàng)集。在最小支持度為0. 01的情況 下,挖掘出的關(guān)聯(lián)規(guī)則數(shù)量為19條,其中部分土地評(píng)價(jià)規(guī)則列舉如下 IF (ELE is 800 - 1000 m and SLE is >25° and OME is 1.0%~3. 0% and TEE is 重壤、輕勦and PHE is 4. 5 ~ 5. 5 and LUE is林地)THEN ( CLASS-4 ); IF (ELE is <200 m and SLE is <3。 and OME is 1.0%~3. 0% and TEE is沙 壤、中i裏and PHE is 4. 5 ~ 5. 5 and LUE is林地)THEN ( CLASS=3 ); IF (ELE is <200 m and SLE is <3。 and OME is 1. 0%~3. 0% and TEE is沙 壤、中i裏and PHE is 4. 5 ~ 5. 5 and LUE is耕地)THEN ( CLASS=2 ); IF (ELE is <200 m and SLE is <3。 and OME is 1.0%~3.0% and TEE is沙 壤、中壤and PHE is 5. 5 ~ 6. 5或7. 5 ~ 8. 5 and LUE is耕地)THEN ( CLASS=1 )。
挖掘出土地評(píng)價(jià)關(guān)聯(lián)規(guī)則后,即可利用這些評(píng)價(jià)規(guī)則對(duì)土地樣本進(jìn)行評(píng)價(jià), 具體地,所評(píng)價(jià)樣本與哪條評(píng)價(jià)規(guī)則條件相匹配,便可將所評(píng)價(jià)樣本評(píng)價(jià)為該 規(guī)則結(jié)果所對(duì)應(yīng)的等級(jí)。這種匹配分為精確匹配和模糊匹配。精確匹配即要 求所評(píng)價(jià)土地樣本嚴(yán)格與評(píng)價(jià)規(guī)則中的某條評(píng)價(jià)規(guī)則條件完全匹配。而人們?cè)?對(duì)事物做出判斷時(shí),往往并不要求該事物的特征與標(biāo)準(zhǔn)模式完全匹配,而是判 斷該事物的特征更與哪個(gè)標(biāo)準(zhǔn)模式接近就屬于哪一類。因此本發(fā)明用模糊判決 的方法,即利用模糊推理的方法,給出模糊匹配程度的概念,計(jì)算出被評(píng)價(jià)土
10地樣本與各評(píng)價(jià)規(guī)則匹配的模糊程度,然后從中找出模糊匹配程度最大的所對(duì) 應(yīng)的規(guī)則,被評(píng)價(jià)樣本即可被評(píng)價(jià)為該規(guī)則的結(jié)果所示的土地等級(jí)。
使離散數(shù)據(jù)模糊化的方法有很多,例如隸屬三角形、梯形、高斯曲線和鐘型
等。本發(fā)明采用高斯曲線的隸屬函數(shù),則論域中的元素x對(duì)模糊子集F的隸屬度
為
<formula>formula see original document page 11</formula>
式中cj為方差;c為中心值。由于模糊判決的最大隸屬度乘積法便于計(jì)算,故 本發(fā)明采用該方法進(jìn)行模糊匹配程度計(jì)算。具體地,模糊匹配程度定義為關(guān)聯(lián) 規(guī)則中各屬性隸屬度乘積,然后選擇模糊匹配程度最高的那條規(guī)則所對(duì)應(yīng)的結(jié) 果作為判決結(jié)果輸出。假設(shè)挖掘出N條關(guān)聯(lián)規(guī)則,待評(píng)價(jià)土地樣本模糊判決的 實(shí)現(xiàn)步驟是S05具體包括
1 )計(jì)算出待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬
度;
2) 分別計(jì)算每條關(guān)聯(lián)規(guī)則的各屬性對(duì)應(yīng)的隸屬度相乘,即得到與各條土地 評(píng)價(jià)關(guān)聯(lián)規(guī)則的模糊匹配程度;
3) 在所有的關(guān)聯(lián)規(guī)則中,取模糊匹配程度最大那條關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地 質(zhì)量等級(jí),作為待評(píng)價(jià)土地樣本的評(píng)價(jià)結(jié)果。
在不同最小支持度下得到不同條數(shù)的評(píng)價(jià)規(guī)則。在模糊判決算法中把所有 屬性都劃分為5個(gè)模糊子集,對(duì)土地評(píng)價(jià)數(shù)據(jù)庫中的所有16652條樣本分別進(jìn)行 評(píng)價(jià),其結(jié)果如表2所示。其中第4列的"數(shù)量"表示正確判斷土地樣本的數(shù)量; "面積,,表示正確評(píng)價(jià)的面積;"%,,表示一定最小支持度情況下,相應(yīng)的土壤 質(zhì)量等級(jí)的正確評(píng)價(jià)面積占總面積的百分比。例如支持度為O. Ol時(shí),提取關(guān)聯(lián) 規(guī)則數(shù)為19條,等級(jí)1中有2680條、面積為22803. 19 km'的土地樣本可被正確評(píng) 價(jià),正確評(píng)價(jià)土地的面積占總面積173654. 01 kn^的13. 13%。
由表2可以看出,當(dāng)最小支持度分別為0.01、 0,006、 0.005、 0.003、 0.001 時(shí),分別挖掘出19、 28、 32、 54和126條體地評(píng)價(jià)關(guān)聯(lián)規(guī)則,對(duì)整個(gè)數(shù)據(jù)庫所有樣本進(jìn)行模糊判決得到的評(píng)價(jià)的面積正確率分別為78.88%、 81.27%、 86.80%、 92.51°/。、 95.25%。隨著MJ'J的增加,it糊判決的準(zhǔn)確率也隨之增加,這與一般 邏輯相符合。
表2
最小支持鷹親w數(shù)鄉(xiāng)歙蹇細(xì)輛
i纖M913,13
—鄉(xiāng)房
0.013機(jī)撒鵬
4鄉(xiāng)鵬亂M5,
S畫l術(shù)細(xì)應(yīng).鼸
1麗13.
2鵬鵬L 42L24
o.鵬2834S417腿說
4饑咖J4535
S観
i^^^^^a彩
24鵬3激32.482U0
o.鵬.32 鵬',1S40.4S
4旭8'n.秀
S麗1娜7秘覷
1娜
25郷2i秘
o.鵬544773簡(jiǎn)繊4!掘
4 S2灘7讓1433
STIMi鵬92J1
'12腦,4314.
2滅旌75
1263幼?74581.7342J 5
4加M24S5J81412
SUM15淑165411.129125
當(dāng)利用54條關(guān)聯(lián)規(guī)則進(jìn)行土地評(píng)價(jià)時(shí),即可獲得較理想的土地評(píng)價(jià)正確率 92.51%,當(dāng)對(duì)評(píng)價(jià)精度要求不是特別高時(shí),僅僅54條規(guī)則就能滿足土地評(píng)價(jià)的 實(shí)際應(yīng)用要求,如此少的土地評(píng)價(jià)關(guān)聯(lián)規(guī)則數(shù),不僅提高了土地評(píng)價(jià)計(jì)算得速 度,而且非常易于土地評(píng)價(jià)人員對(duì)評(píng)價(jià)規(guī)則的理解和應(yīng)用。當(dāng)關(guān)聯(lián)規(guī)則達(dá)到126 條時(shí),便可達(dá)到理想的土地評(píng)價(jià)正確率95.25°/ 。試-瞼表明,本發(fā)明的土地評(píng)價(jià) 方法大大提高土地評(píng)價(jià)知識(shí)表達(dá)的可解釋性,降低了評(píng)價(jià)人員對(duì)土地評(píng)價(jià)領(lǐng)域 知識(shí)的要求,并且能獲得理想的土地評(píng)價(jià)正確率。 結(jié)合實(shí)際情況,關(guān)聯(lián)規(guī)則挖掘步驟可總結(jié)如下(1 )數(shù)據(jù)預(yù)處理。
數(shù)據(jù)預(yù)處理主要的目的是形成規(guī)范化的數(shù)據(jù)庫,包括數(shù)據(jù)清理(填充缺值、 平滑數(shù)據(jù)、尋找孤立點(diǎn)、糾正數(shù)據(jù)不一致性)、數(shù)據(jù)集成(元數(shù)據(jù)、相關(guān)分析、 數(shù)據(jù)沖突檢測(cè)、語義異種性解釋)、數(shù)據(jù)變換(數(shù)據(jù)規(guī)范化、特征構(gòu)造、數(shù)據(jù)泛 化)和數(shù)據(jù)歸約(數(shù)據(jù)立方體聚類、維歸約、數(shù)據(jù)壓縮、數(shù)值歸約、離散化和 產(chǎn)生概念分層)幾個(gè)過程。
(2)根據(jù)所設(shè)置的最小支持度,找出所有滿足的頻繁項(xiàng)集,該過程可由
Apriori算法完成。
Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法。算法的 名字基于這樣的事實(shí)算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識(shí),Apriori使用一種稱 作逐層搜索的迭代方法,*-項(xiàng)集用于探索^ + 1)—項(xiàng)集。首先,找出頻繁l-項(xiàng)集 的集合,該集合記作A。 A用于找頻繁2-項(xiàng)集的集合A,而A用于找A,如此
下去,直到不能找到頻繁^-項(xiàng)集。找到每個(gè)^需要一次數(shù)據(jù)庫掃描。需要注意 的是,頻繁項(xiàng)集的所有非空子集都必須也是頻繁的。
通過Apriori算法找出所有滿足的頻繁項(xiàng)集有時(shí)候數(shù)量是相當(dāng)巨大的,為 了能以最簡(jiǎn)形式表達(dá)出所有相應(yīng)的知識(shí),近年一直在研究挖掘壓縮的頻繁模式 集的方法。頻繁集壓縮主要方法是在掃描過程中壓縮未來迭代掃描的事務(wù)數(shù), 而且,不包含任何頻繁*項(xiàng)集的事務(wù)不可能包含任何頻繁"+ 1)項(xiàng)集,因此,這
種事務(wù)在其后考慮時(shí)可以加上標(biāo)記或者刪除,因?yàn)楫a(chǎn)生7'項(xiàng)集0'>"的數(shù)據(jù)庫掃 描不再需要它們。。
(3 )根據(jù)所設(shè)置的最小置信度,從頻繁項(xiàng)集中挖掘出滿足條件的強(qiáng)規(guī)則, 形成規(guī)則集。
一旦由數(shù)據(jù)庫"中的事務(wù)找出頻繁項(xiàng)集,由它們產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則是直截了 當(dāng)?shù)?強(qiáng)關(guān)聯(lián)規(guī)則滿足最小支持度和最小置信度)。對(duì)于置信度,可以用下式計(jì) 算,其中條件概率用項(xiàng)集支持度計(jì)數(shù)表示其中,s,oW _麵""j U S)是包含項(xiàng)集」U S的事務(wù)數(shù),s,。W — c麵"v4)是包
含項(xiàng)集A的事務(wù)數(shù)。根據(jù)該式,關(guān)聯(lián)規(guī)則可以產(chǎn)生如下 對(duì)于每個(gè)頻繁項(xiàng)集"產(chǎn)生/的所有非空子集。
~^-=-^ 2 mm— co"/
對(duì)于/的每個(gè)非空子集、如果^^oW-CO""巾) - ,則輸出規(guī)則
力"。其中,min一co"/是最小置信度閾值。
由于規(guī)則由頻繁項(xiàng)集產(chǎn)生,每個(gè)規(guī)則都自動(dòng)滿足最小支持度。頻繁項(xiàng)集連 同它們的支持度預(yù)先存放在散列表中,使得它們可以快速被訪問。
布爾關(guān)聯(lián)規(guī)則實(shí)際上是量化關(guān)聯(lián)規(guī)則的挖掘方法的一種特殊情況。由于布 爾關(guān)聯(lián)規(guī)則具備自然、簡(jiǎn)明和易于理解等優(yōu)點(diǎn),研究者們大多將量化關(guān)聯(lián)規(guī)則 問題轉(zhuǎn)化為布爾型關(guān)聯(lián)規(guī)則問題。主要的方法有兩種
第一種方法,使用預(yù)定義的概念分層對(duì)量化屬性離散化。使用概念分層離 散化數(shù)據(jù)必須在挖掘之前進(jìn)行。例如,在廣東省第二次土壤普查成果資料中, 對(duì)于土地評(píng)價(jià)屬性高程的概念分層,用區(qū)間"〈200米"、"200—500米"、"500—800 米"等區(qū)間替代原來的數(shù)值。概念分層的離散化是靜態(tài)和預(yù)確定的,離散化的 數(shù)值屬性具備區(qū)間標(biāo)記,可以像分類屬性一樣處理。
第二種方法,根據(jù)數(shù)據(jù)分布將量化屬性離散化或聚類到"箱"。數(shù)據(jù)變換后,
多維數(shù)據(jù)可以構(gòu)造數(shù)據(jù)立方體,每一個(gè)模式對(duì)應(yīng)數(shù)據(jù)立方體上的一個(gè)位置,即
"箱"。每一個(gè)"箱"代表一個(gè)不同的分組,具備不同的動(dòng)態(tài)區(qū)間長(zhǎng)度和大致數(shù)
量相同的數(shù)值,在挖掘期間它們可以進(jìn)一步合并。主要采用密度測(cè)量、簇投影、
模糊劃分等數(shù)值類型轉(zhuǎn)化方法將屬性的取值域進(jìn)行區(qū)間劃分,然后在每個(gè)區(qū)間
上搜索映射點(diǎn)的聚類,利用已有的挖掘布爾型關(guān)聯(lián)規(guī)則的方法得到有價(jià)值的信 自
另外, 一些不同于傳統(tǒng)Apriori方法并且可伸縮的頻繁項(xiàng)集挖掘算法相繼 被提出。如PF增長(zhǎng)是一種挖掘頻繁項(xiàng)集而不產(chǎn)生候選的模式增長(zhǎng)算法,它構(gòu)造
14一個(gè)高度壓縮的數(shù)據(jù)結(jié)構(gòu)(PF樹)來壓縮原來的事務(wù)^L據(jù)庫,為避免高代價(jià)的 候選產(chǎn)生,不使用類Apriori算法的產(chǎn)生-測(cè)試策略,而聚焦于頻繁模式(段) 增長(zhǎng),獲得更高的效率;ECLAT算法使用垂直數(shù)據(jù)格式挖掘頻繁模式將給定的、 用77D項(xiàng)集形式的水平數(shù)據(jù)格式事務(wù)數(shù)據(jù)集變換成項(xiàng)r/"集形式的垂直數(shù)據(jù)格 式,根據(jù)Apriori性質(zhì)和附加的優(yōu)化技術(shù),對(duì)變換后的數(shù)據(jù)集進(jìn)行挖掘。
實(shí)際的數(shù)據(jù)(如土地評(píng)價(jià)數(shù)據(jù))是多維數(shù)據(jù),包含連續(xù)值的、離散值的以 及帶標(biāo)稱值的屬性。 一般的處理方法是,把連繞值的和帶標(biāo)稱值的屬性劃分為 若干區(qū)間段(甚至有一些離散值的數(shù)據(jù)也要?jiǎng)澐?,把多維關(guān)聯(lián)規(guī)則挖掘問題轉(zhuǎn) 化為布爾關(guān)聯(lián)規(guī)則問題挖掘問題,通過Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
然而,對(duì)連續(xù)值屬性進(jìn)行區(qū)段的劃分過程中,容易造成"尖銳邊界(Sharp Boundary)"問題。 一方面,如果區(qū)間劃分過大,會(huì)使包含此區(qū)間的規(guī)則的置信 度很低,從而造成規(guī)則產(chǎn)生的數(shù)量過少;如區(qū)間劃分過大,規(guī)則所包含的信息 量也會(huì)相應(yīng)地減少。如果區(qū)間劃分過少,會(huì)使包含此區(qū)間的規(guī)則的支持度很低, 從而會(huì)造成規(guī)則產(chǎn)生的數(shù)量過少;即使在區(qū)間的劃分上用以上的兩個(gè)因素進(jìn)行 了平衡,但如何合理、有效地劃分連續(xù)值屬性區(qū)間,使其能夠真實(shí)地反映此屬 性中數(shù)據(jù)在定義域中的實(shí)際分布是挖掘連續(xù)值屬性關(guān)聯(lián)規(guī)則的關(guān)鍵問題。另一 方面,如果將連續(xù)值屬性的論域劃分成不重疊的區(qū)間,由于明顯的區(qū)間劃分會(huì) 將某些區(qū)間附近潛在的元素排斥在外,從而導(dǎo)致一些有意義的區(qū)間被忽略掉; 如果將連續(xù)值屬性的論域劃分成重疊的區(qū)間,這樣處于邊界的元素就有可能同 時(shí)處于兩個(gè)區(qū)間,這些元素同時(shí)對(duì)兩個(gè)區(qū)間都對(duì)關(guān)聯(lián)關(guān)見則的挖掘產(chǎn)生影響,從 而導(dǎo)致某些區(qū)間本來不是頻繁項(xiàng)集的可能就成為頻繁項(xiàng)集。
對(duì)于離散值屬性和標(biāo)稱值屬性,雖然也存在以上的問題,但是連續(xù)值屬性 表現(xiàn)得更為突出。
解決"尖銳邊界"問題主要引進(jìn)了模糊集的概念來軟化數(shù)量型屬性(包括 連續(xù)值屬性和離散值屬性)的劃分邊界,并采用不同的算法來挖掘^t糊關(guān)聯(lián)規(guī) 則,包括模糊聚類、擴(kuò)展數(shù)據(jù)庫各屬性的模糊分割算法、自組織特征映射網(wǎng)絡(luò)
15算法、MTA算法、FGBRM (Fuzzy Grids Based Rules Mining)算法、遺傳算法 (Genetic Algorithms, GA)等。結(jié)合土地評(píng)價(jià)數(shù)據(jù)庫的實(shí)際情況,土地評(píng)價(jià) 中的模糊關(guān)聯(lián)規(guī)則挖掘描述如下
設(shè)""i"'2,…,"是含有附個(gè)屬性的項(xiàng)集,相關(guān)事務(wù)數(shù)據(jù)"-W,《,…,W是一 個(gè)數(shù)據(jù)庫事務(wù)的集合,其中,《包含每一個(gè)事務(wù)有惟一的一個(gè)標(biāo)識(shí)符^和事務(wù) 數(shù)據(jù)屬性值f,即《,ecfom(/i)xd,(。x…x^m(〔),"。附(〔)是屬性〔的一 組才莫糊區(qū)間。
設(shè)事務(wù)數(shù)據(jù)^^W,"2,…,^的模糊概念集為^^""^…,W,其中,模糊集
A=V,A,}, A是^屬于A的隸屬度。"模式Z『AAA…A^是一組非空模糊概 念集。從挖掘連續(xù)數(shù)值屬性模糊關(guān)聯(lián)規(guī)則出發(fā),研究了支持度和置信度的函數(shù)
逼近和模式分類問題,提出模糊模式y(tǒng)的支持度定義為<formula>formula see original document page 16</formula>改進(jìn)算法為<formula>formula see original document page 16</formula>其中,s為指定的閾值;D是事務(wù)數(shù)據(jù)庫總集;l"l是事務(wù)總數(shù); 叢(力=min^"力I《£ "指樣本"對(duì)模糊集X的模糊隸屬度。
由此可得模糊關(guān)聯(lián)規(guī)則蘊(yùn)涵式^^丑的支持度定義如式(2.21) (Wang et al, 2003 ):
<formula>formula see original document page 16</formula>同理可得模糊關(guān)聯(lián)規(guī)則蘊(yùn)涵式J-S的置信度定義如式(2. 22 ):^ (2.22)
其中,e為指定的閾值;"是事務(wù)數(shù)據(jù)庫總集;l"l是事務(wù)總數(shù);A(")指樣 本"對(duì)模糊集^的模糊隸屬度;^^")指樣本J對(duì)模糊集^B的模糊隸屬度;
^ 是項(xiàng)集中Z^sW)大于指疋閾值S的和;
^ 是項(xiàng)集j中^(")大于指定閾值e的和。
挖掘模糊關(guān)聯(lián)規(guī)則的步驟與Apriori算法類似,兩個(gè)步驟 步驟一找出支持度不小于最小支持度的模式集丄; 步驟二由丄產(chǎn)生才莫糊關(guān)聯(lián)規(guī)則。 挖掘模糊關(guān)聯(lián)規(guī)則的偽代碼 算法模糊關(guān)聯(lián)規(guī)則挖掘算法
輸入事務(wù)數(shù)據(jù)庫D,模糊概念集F,最小支持度值minS"P 輸出頻繁模式集丄
1) C'=F;
2) For each xeC! do &00 = A^; = 0;};
3) For each do
4) For each xeCi do
5) If then
6) {Add A(^) to Swp(x) = S p(x) + //;c(flO;};
7) ^ = {x I x e q W 《min% };〃丄"頻繁模糊A: _模式集;
9) For ("2;4-i—;"+) do {
10) " —; & 〃 、頻繁模糊"模式集;、A的W序列集
17丄D c; = {C = ,[2]…幣- l腿-1] I
P[l] = 尸[2] = g[2],…,_ 2] = — 2], _ 1] < — 1] and P e, , g e ;, and VC e丄4—
where C is a (A — 1) sub-pattern of }.
〃 候選模糊"模式集;
12) For all CeC* do {
13) % (C) = 0;
14) J-C[l]C[2]…C[/:-2]CM:-l];// C[;']: C模糊模式中第/個(gè)模糊概念
15) 5 = C[1]C[2]--C|>-2]C[A:]; //從C中選捧兩組A:-l個(gè)次模式
16) For each element pair (W,^,^W))"")肌d (《X/^(^》es(萬) and《,/7V/ =《
dc) {add (4,賦min(/^ (《),〃B (W2))) to s(C);
Sm/7(C) = + min(/^ (《),//s (d2))}
18) & = Wx)lx""}
19) Z = UZ" 〃丄頻繁模糊模式集
偽代碼中,1)—8)步通過掃描事務(wù)數(shù)據(jù)庫"獲得第一個(gè)頻繁^i式A和A的 第一個(gè)^序列集;9)—18)步在*^2情況下獲得第*個(gè)頻繁模式^和4的第*個(gè) "W序列集,并且候選模糊"模式集&首先從V!產(chǎn)生。對(duì)于每一個(gè)候選模式 CeC、 s(C)都可以從C中選擇兩組t-l個(gè)次模式中獲得。如果^(C)^minS";7,那 么和C都分別保留下來并繼續(xù)分別參與&和A的運(yùn)算,否則,<C)就會(huì)從A刪 除。此外,對(duì)于每一個(gè)與最小支持度比較的模糊模式義,算法會(huì)產(chǎn)生一個(gè)序列
=&(力)I Z)}來保存滿足模式Z和滿足模式X的紀(jì)錄數(shù)量。
朝出頻繁模式集丄后,就可以由丄產(chǎn)生模糊關(guān)聯(lián)規(guī)則。偽代碼如下輸入頻繁才莫式集Z,最小置信度min。"/ 輸出模糊關(guān)聯(lián)規(guī)則集^ '
1) 及,
2) For each "Z do {
3) For each ") and (1^)
do { If S)2minCo"/ Add <S,《_S> t0及; Else * =及}}
得到模糊分類關(guān)聯(lián)規(guī)則后,即可利用這些評(píng)價(jià)規(guī)則對(duì)土地樣本進(jìn)行評(píng)價(jià)。具 體地,所評(píng)價(jià)樣本與哪條評(píng)價(jià)規(guī)則條件相匹配,便可將所評(píng)價(jià)樣本評(píng)價(jià)為該規(guī) 則結(jié)果所對(duì)應(yīng)的等級(jí)。這種匹配分為精確匹配和模糊匹配。精確匹配即要求 所評(píng)價(jià)土地樣本嚴(yán)格與評(píng)價(jià)規(guī)則中的某評(píng)價(jià)規(guī)則條件匹配。而人們?cè)谂袛嘁粋€(gè) 事務(wù)屬于哪一類(模式)時(shí),往往并不要求該事務(wù)的特征與標(biāo)準(zhǔn)模式完全匹配, 而是判斷該事務(wù)的特征更與哪個(gè)標(biāo)準(zhǔn)模式接近就屬于哪一類(或模式)。因此采 用模糊判決的方法,利用模糊推理的方法,給出模糊匹配程度的概念,計(jì)算出 被評(píng)價(jià)土地樣本與各評(píng)價(jià)規(guī)則匹配的模糊程度,然后從中找出模糊匹配程度最 大的所對(duì)應(yīng)的規(guī)則,被評(píng)價(jià)樣本即可被評(píng)價(jià)為該規(guī)則的結(jié)果所示的土地等級(jí)。
模糊隸屬函數(shù)形式很多,例如隸屬三角形、梯形、高斯曲線和鐘型等。本文 采用高斯曲線的隸屬函數(shù),則論域中的元素x對(duì)模糊子集F的隸屬度為
<formula>formula see original document page 19</formula>
其中。為方差,c為中心值。
由于模糊判決的最大隸屬度乘積法便于計(jì)算,故采用該方法進(jìn)行模糊匹配程 度計(jì)算。模糊匹配中第y條規(guī)則隸屬度乘積的數(shù)學(xué)表達(dá)式如式(2.24):
<formula>formula see original document page 19</formula>其中,A是樣本的屬性數(shù)量, '是測(cè)試樣本在第J'條規(guī)則第Z'個(gè)屬性下得到
的隸屬度;"為方差,A為中心值;^(力是在第y條規(guī)則下7個(gè)屬性得到的隸屬 度乘積。
計(jì)算出模糊匹配程度后,即可選擇模糊匹配程度最高的那條規(guī)則所對(duì)應(yīng)的結(jié) 果作為判決結(jié)果輸出。Z條規(guī)則中的最大隸屬度乘積F"定義為式(2.25):
上述的模糊分類關(guān)聯(lián)規(guī)則還可以進(jìn)行精簡(jiǎn)處理;由于挖掘模糊分類關(guān)聯(lián)規(guī)則 的算法中各屬性之間的運(yùn)算存在先后關(guān)系,發(fā)現(xiàn)的模糊分類關(guān)聯(lián)規(guī)則必然存在 冗余規(guī)則。冗余規(guī)則使計(jì)算開銷增加,提出模糊分類關(guān)聯(lián)規(guī)則的精筒方法,即 在保證模糊判決準(zhǔn)確率不下降的情況下,把所有規(guī)則對(duì)自身進(jìn)行準(zhǔn)確性檢驗(yàn)的 精簡(jiǎn)規(guī)則方法,步驟如下(參考圖4):
(1) 按照支持度大小原則排列模糊分類關(guān)聯(lián)規(guī)則,定義可去除規(guī)則的閾值;
(2) 去掉第一條規(guī)則,把所有樣本放在去掉第一條規(guī)則的規(guī)則集中進(jìn)行模 糊判決,若最后得到的準(zhǔn)確率不下降或者準(zhǔn)確率下降的數(shù)值小于可去規(guī)則的閾 值,則該規(guī)則可去,如果得到準(zhǔn)確率下降的數(shù)值大于可去除規(guī)則的閾值,則保 留該規(guī)則;
(3) 建立新的規(guī)則集,保存第一條規(guī)則。從包含第一條規(guī)則原始規(guī)則集中 去掉第二條規(guī)則,用.同樣的方法判決第二條規(guī)則的去留;
(4) 如此類推,重復(fù)(2)、 (3),直到最后一條規(guī)則。
對(duì)應(yīng)地,本發(fā)明還提供了一種土地評(píng)價(jià)的系統(tǒng),參考圖2,其包括 數(shù)據(jù)導(dǎo)入模塊1,用于從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù); 關(guān)聯(lián)規(guī)則生成模塊2,用于對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若 干條關(guān)聯(lián)規(guī)則;
輸入模塊3,用于輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù);
20模糊判決模塊4,用于計(jì)算所述待評(píng)價(jià)土地樣本的屬性數(shù)據(jù)與各關(guān)聯(lián)規(guī)則的匹配程度,找出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地等級(jí)。
參考圖3,所述關(guān)聯(lián)規(guī)則生成模塊2包括
土地質(zhì)量分級(jí)單元21,用于根據(jù)獲取的各個(gè)土地樣本的屬性數(shù)據(jù),分別對(duì)各個(gè)土地樣本進(jìn)行土地質(zhì)量分級(jí);
輸入單元22,用于設(shè)定最小支持度的值;
數(shù)據(jù)挖掘單元23,用于分別統(tǒng)計(jì)高程的各種屬性值的數(shù)量;計(jì)算每一種高程屬性值的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的值,則保留對(duì)應(yīng)的高程屬性值,否則去除;將保留下來的高程屬性值分別與各個(gè)地面坡度的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;計(jì)算每一種組合的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的值,貝'J保留對(duì)應(yīng)的組合,否則去除;將保留下來的組合分別與其他屬性類別的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;直到得到最后保留的所有屬性以及土地質(zhì)量等級(jí)的組合即為生成的關(guān)聯(lián)規(guī)則。
所述模糊判決模塊4包括
隸屬度計(jì)算單元41,用于計(jì)算出待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬度;
匹配程度計(jì)算單元42,用于分別計(jì)算每條關(guān)聯(lián)規(guī)則的各屬性對(duì)應(yīng)的隸屬度相乘,即得到與各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則的模糊匹配程度;
評(píng)價(jià)單元43,用于在所有的關(guān)聯(lián)規(guī)則中,取模糊匹配程度最大那條關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地質(zhì)量等級(jí),作為待評(píng)價(jià)土地樣本的評(píng)價(jià)結(jié)果。
以上所揭露的僅為本發(fā)明的較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明申請(qǐng)專利范圍所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
經(jīng)實(shí)驗(yàn)驗(yàn)證,本發(fā)明已可以應(yīng)用在土地質(zhì)量評(píng)價(jià)、土地資源評(píng)價(jià)、土壤質(zhì)量評(píng)價(jià)、宗地評(píng)估、土地覆蓋分類、農(nóng)用地分等、土壤侵蝕評(píng)估、土地估價(jià)、
21水土流失評(píng)價(jià)、土地使用影響評(píng)價(jià)、土地腐蝕性評(píng)價(jià)、土地資源配制、土地適宜性評(píng)價(jià)、土地鹽堿化程度評(píng)估等各種與土地評(píng)價(jià)相關(guān)的領(lǐng)域上,因此以上所述主題仍屬本發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種土地質(zhì)量評(píng)價(jià)方法,其特征在于包括以下步驟A、從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);B、對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;C、輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù),計(jì)算其與各關(guān)聯(lián)規(guī)則的匹配程度,找出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地等級(jí)。
2. 如權(quán)利要求1所述的土地質(zhì)量評(píng)價(jià)方法,其特征在于,所述土地樣本的屬性數(shù)據(jù)包括以下屬性類別高程、地面坡度、土壤質(zhì)地、土壤酸堿度、土壤有機(jī)質(zhì)含量、土壤利用類型、地形、土層厚度、土壤表層質(zhì)地、有機(jī)質(zhì)含量、剖面構(gòu)型、坡向、坡位、灌溉保證率、土壤排水條件、地下水位、植被類型、地表侵蝕度、可及度。
3. 如權(quán)利要求2所述的土地質(zhì)量評(píng)價(jià)方法,其特征在于,所述步驟B具體包括Bl、根據(jù)獲取的各個(gè)土地樣本的屬性數(shù)據(jù),分別對(duì)各個(gè)土地樣本進(jìn)行土地質(zhì)量分等定級(jí);B2、設(shè)定最小支持度的闊值;B3、分別統(tǒng)計(jì)高程的各種屬性值的數(shù)量;B4、計(jì)算每一種高程屬性值的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的值,則保留對(duì)應(yīng)的高程屬性值,否則去除;B5、將保留下來的高程屬性值分別與各個(gè)地面坡度的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;B6、計(jì)算每一種組合的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的值,則保留對(duì)應(yīng)的組合,否則去除;B7、將保留下來的組合分別與其他屬性類別的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;返回步驟B6,直到得到最后保留的所有屬性以及土地質(zhì)量等級(jí)的組合即為生成的關(guān)聯(lián)規(guī)則。
4. 如權(quán)利要求3所述的土地質(zhì)量評(píng)價(jià)方法,其特征在于,所述步驟C具體包括Cl、輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù);C2、計(jì)算出待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬度;C3、分別計(jì)算每條關(guān)聯(lián)規(guī)則的各屬性對(duì)應(yīng)的隸屬度相乘,即得到與各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則的模糊匹配程度;C4、在所有的關(guān)聯(lián)規(guī)則中,取模糊匹配程度最大那條關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地質(zhì)量等級(jí),作為待評(píng)價(jià)土地樣本的評(píng)價(jià)結(jié)果。
5. 如權(quán)利要求4所述的土地質(zhì)量評(píng)價(jià)方法,其特征在于,所述步驟C2是利用模糊隸屬函數(shù)來計(jì)算待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則中各屬性的隸屬度的。
6. —種土地質(zhì)量評(píng)價(jià)系統(tǒng),其特征在于包括數(shù)據(jù)導(dǎo)入模塊,用于從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);關(guān)聯(lián)規(guī)則生成模塊,用于對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;輸入模塊,用于輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù);模糊判決模塊,用于計(jì)算所述待評(píng)價(jià)土地樣本的屬性數(shù)據(jù)與各關(guān)聯(lián)規(guī)則的匹配程度,找出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地等級(jí)。
7、如權(quán)利要求6所述的土地質(zhì)量評(píng)價(jià)系統(tǒng),其特征在于,所述土地樣本的屬性數(shù)據(jù)包括以下屬性類別高程、地面坡度、土壤質(zhì)地、土壤酸堿度、土壤有機(jī)質(zhì)含量、土壤利用類型。
8、 如權(quán)利要求7所述的土地質(zhì)量評(píng)價(jià)系統(tǒng),其特征在于,所述關(guān)聯(lián)規(guī)則生成模 塊包括土地質(zhì)量分級(jí)單元,用于根據(jù)獲取的各個(gè)土地樣本的屬性數(shù)據(jù),分別對(duì)各 個(gè)土地樣本進(jìn)行土地質(zhì)量分級(jí);輸入單元,用于設(shè)定最小支持度的值;數(shù)據(jù)挖掘單元,用于分別統(tǒng)計(jì)高程的各種屬性值的數(shù)量;計(jì)算每一種高程 屬性值的數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的 值,則保留對(duì)應(yīng)的高程屬性值,否則去除;將保留下來的高程屬性值分別與各 個(gè)地面坡度的屬性值進(jìn)行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;計(jì)算每一種組合的 數(shù)量與土地樣本總數(shù)量的比值,如果該比值不小于所述最小支持度的值,則保 留對(duì)應(yīng)的組合,否則去除;將保留下來的組合分別與其他屬性類別的屬性值進(jìn) 行組合,分別統(tǒng)計(jì)各種組合的數(shù)量;直到得到最后保留的所有屬性以及土地質(zhì) 量等級(jí)的組合即為生成的關(guān)聯(lián)規(guī)則。
9、 如權(quán)利要求8所述的土地質(zhì)量評(píng)價(jià)系統(tǒng),其特征在于,所述模糊判決模塊包 括隸屬度計(jì)算單元,用于計(jì)算出待評(píng)價(jià)土地樣本相應(yīng)的各條土地評(píng)價(jià)關(guān)聯(lián)規(guī) 則中各屬性的隸屬度;匹配程度計(jì)算單元,用于分別計(jì)算每條關(guān)聯(lián)規(guī)則的各屬性對(duì)應(yīng)的隸屬度相 乘,即得到與各條土地評(píng)價(jià)關(guān)聯(lián)規(guī)則的模糊匹配程度;評(píng)價(jià)單元,用于在所有的關(guān)聯(lián)規(guī)則中,取模糊匹配程度最大那條關(guān)聯(lián)規(guī)則 所對(duì)應(yīng)的土地質(zhì)量等級(jí),作為待評(píng)價(jià)土地樣本的評(píng)價(jià)結(jié)果。
全文摘要
本發(fā)明涉及一種土地質(zhì)量評(píng)價(jià)方法,其包括以下步驟A.從土地資源數(shù)據(jù)庫中獲取土地樣本的屬性數(shù)據(jù);B.對(duì)所述土地樣本的屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘生成若干條關(guān)聯(lián)規(guī)則;C.輸入待評(píng)價(jià)土地樣本的屬性數(shù)據(jù),計(jì)算其與各關(guān)聯(lián)規(guī)則的匹配程度,找出最匹配的關(guān)聯(lián)規(guī)則,將該土地樣本評(píng)價(jià)為與其最匹配關(guān)聯(lián)規(guī)則所對(duì)應(yīng)的土地等級(jí)。本發(fā)明還提供一種土地質(zhì)量評(píng)價(jià)系統(tǒng)。本發(fā)明能夠提高土地評(píng)價(jià)知識(shí)表達(dá)的可解釋性和土地評(píng)價(jià)有效性。
文檔編號(hào)G06F17/30GK101650748SQ200910192289
公開日2010年2月17日 申請(qǐng)日期2009年9月14日 優(yōu)先權(quán)日2009年9月14日
發(fā)明者楊敬鋒, 薛月菊 申請(qǐng)人:楊敬鋒