本發(fā)明涉及礦產(chǎn)勘查,更具體地,涉及一種基于關(guān)聯(lián)規(guī)則算法和知識圖譜技術(shù)的智能找礦方法及系統(tǒng)。
背景技術(shù):
1、在礦產(chǎn)勘查領(lǐng)域,找礦的思想有三種,一種是“求同”,一種是“求異”,最后一種則是這兩種思想的結(jié)合。“求同”是指同一種礦床具有相似的成礦背景和成礦環(huán)境,通過類比預(yù)測區(qū)和已知區(qū)的相似性來判斷預(yù)測區(qū)的成礦可能性,強(qiáng)調(diào)的是礦床形成的內(nèi)因;“求異”則是通過礦床形成以后,表現(xiàn)出來的地球物理、地球化學(xué)等方面的異常信息,來確定找礦標(biāo)志,進(jìn)而靶區(qū)圈定;第三種思想則是既“求同”,也“求異”,既考慮致礦因素,也考慮礦致因素,講究“內(nèi)外兼修”。
2、傳統(tǒng)的找礦思維模式中,多依賴于強(qiáng)因果關(guān)系的推理,也即如下所示:
3、
4、在上述思維范式中,a推到b推到c,都是有嚴(yán)格的因果關(guān)系。
5、傳統(tǒng)的找礦方法中,在所有前期的數(shù)據(jù)準(zhǔn)備完成以后,需要地質(zhì)工作者經(jīng)過數(shù)據(jù)處理后,使用商業(yè)軟件,繪制各種地質(zhì)圖件,還要考慮采用哪些插值方法,人工參與度過高,工作量巨大,就算繪制完所有圖件,還需要資質(zhì)較高的科研人員綜合所有數(shù)據(jù),來確定區(qū)域的找礦標(biāo)志,進(jìn)而服務(wù)于找礦工作,對團(tuán)隊的整體專業(yè)水平要求過高,而且主觀性強(qiáng),可能會造成找礦標(biāo)志的不全面,不精準(zhǔn)。
6、然而隨著大數(shù)據(jù)時代的來臨,這種思維范式逐漸轉(zhuǎn)變?yōu)橄嚓P(guān)關(guān)系,即如下所示:
7、
8、這種思維范式中,d推到c,不以因果關(guān)系為主導(dǎo),而是相關(guān)關(guān)系,再加上成礦理論的知識約束,來確認(rèn)c的準(zhǔn)確性。
9、目前在礦產(chǎn)勘查領(lǐng)域多使用關(guān)聯(lián)規(guī)則算法用于地球化學(xué)數(shù)據(jù)分析,使用知識圖譜技術(shù)用于礦床知識庫構(gòu)建及基于知識庫的智能問答等。
10、但是目前的關(guān)聯(lián)規(guī)則在找礦過程中存在許多問題,首先因為找礦工作涉及的地質(zhì)數(shù)據(jù),往往具有多源異構(gòu)難以融合的特點,比如:各種地質(zhì)圖件,文本描述,數(shù)據(jù)表格,很難把所有的數(shù)據(jù)都體現(xiàn)在一張圖件上,也就很難使用關(guān)聯(lián)規(guī)則算法挖掘出頻繁項集,同時還因為通過關(guān)聯(lián)規(guī)則算法挖掘出的強(qiáng)關(guān)聯(lián)規(guī)則往往有成千上萬條,具體哪些有用或者要用哪幾條一般是人為確定,這種選擇充滿了主觀性,被摒棄的強(qiáng)關(guān)聯(lián)規(guī)則則是一種數(shù)據(jù)丟失,而且礦床形成過程極其復(fù)雜,單獨挑選的幾條規(guī)則可能只是礦床形成過程中的局部事件、特殊事件,以這些規(guī)則作為找礦標(biāo)志能否直接應(yīng)用于區(qū)域性找礦還有待商榷。而知識圖譜在礦床領(lǐng)域的研究,也大多停留在知識庫的建立上。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的之一是提供一種基于關(guān)聯(lián)規(guī)則算法和知識圖譜技術(shù)的智能找礦方法,解決現(xiàn)有技術(shù)中因個人篩選強(qiáng)關(guān)聯(lián)規(guī)則的主觀性對區(qū)域找礦的誤導(dǎo)問題;本發(fā)明的目的之二是一種基于關(guān)聯(lián)規(guī)則算法和知識圖譜技術(shù)的智能找礦系統(tǒng)。
2、為解決上述技術(shù)問題,本發(fā)明的技術(shù)方案如下:
3、本發(fā)明的第一方面提供一種基于關(guān)聯(lián)規(guī)則算法和知識圖譜技術(shù)的智能找礦方法,包括以下步驟:
4、收集礦產(chǎn)勘查區(qū)中各個采樣點的礦床相關(guān)數(shù)據(jù);
5、將所述各個采樣點的礦床相關(guān)數(shù)據(jù)的每一個地質(zhì)元素符號化和融合后,得到關(guān)聯(lián)規(guī)則數(shù)據(jù)表;
6、使用關(guān)聯(lián)規(guī)則算法,在所述關(guān)聯(lián)規(guī)則數(shù)據(jù)表中獲取所有導(dǎo)致待尋找元素出現(xiàn)時的強(qiáng)關(guān)聯(lián)規(guī)則;
7、根據(jù)所有所述強(qiáng)關(guān)聯(lián)規(guī)則,構(gòu)建知識圖譜;
8、從所述知識圖譜中獲取與所述待尋找元素的規(guī)則團(tuán),所述規(guī)則團(tuán)作為在所述礦產(chǎn)勘查區(qū)中尋找所述待尋找元素的找礦標(biāo)志。
9、在上述技術(shù)手段中,將關(guān)聯(lián)規(guī)則算法和知識圖譜結(jié)合起來,通過關(guān)聯(lián)規(guī)則來挖掘出和礦床相關(guān)的強(qiáng)關(guān)聯(lián)規(guī)則,從數(shù)據(jù)的角度來說,每一條強(qiáng)關(guān)聯(lián)規(guī)則都具有很高的價值,因此所有強(qiáng)關(guān)聯(lián)規(guī)則都應(yīng)該應(yīng)用于找礦工作,所以根據(jù)所有的強(qiáng)關(guān)聯(lián)規(guī)則,創(chuàng)建為知識圖譜,再利用知識圖譜的聚類算法,就可以發(fā)現(xiàn)實體之間的聚類團(tuán)體,這種聚類團(tuán)體,因為是在和礦床成礦事件相關(guān)性極高的強(qiáng)關(guān)聯(lián)規(guī)則中進(jìn)一步聚類得到的,因此這種聚類團(tuán)體,才是區(qū)域上和成礦事件相關(guān)性極高的找礦標(biāo)志。
10、進(jìn)一步地,所述礦床相關(guān)數(shù)據(jù)包括多個地質(zhì)元素,所述地質(zhì)元素包括地質(zhì)構(gòu)造數(shù)據(jù)、地球物理數(shù)據(jù)和地球化學(xué)數(shù)據(jù)。
11、進(jìn)一步地,將所述各個采樣點的礦床相關(guān)數(shù)據(jù)的每一個地質(zhì)元素符號化,包括:
12、將所述各個采樣點的礦床相關(guān)數(shù)據(jù)的每一個地質(zhì)元素使用不同的符號進(jìn)行表示,對于需要分級的地質(zhì)元素,采用符號下標(biāo)數(shù)字的方法進(jìn)行表示。
13、進(jìn)一步地,所述關(guān)聯(lián)規(guī)則數(shù)據(jù)表,包括:
14、將每一個樣點的礦床相關(guān)數(shù)據(jù)的每一個地質(zhì)元素符號化后的數(shù)據(jù)形成一行行數(shù)據(jù),將所有樣點形成的行數(shù)據(jù)組合,形成所述關(guān)聯(lián)規(guī)則數(shù)據(jù)表。
15、進(jìn)一步地,所述關(guān)聯(lián)規(guī)則算法,包括:
16、令a和b為同一規(guī)則下的兩個事件,其中a為待尋找元素,則事件a發(fā)生的支持度為:
17、support(b→a)=p(b∩a)
18、事件a發(fā)生的置信度為:
19、confidence(a→b)=p(b|a)
20、以所述關(guān)聯(lián)規(guī)則數(shù)據(jù)表中的每一行為一條規(guī)則,計算每一個規(guī)則下,事件a發(fā)生的支持度和置信度;
21、將事件a發(fā)生的支持度大于預(yù)設(shè)支持度的規(guī)則稱為頻繁項集;
22、將所述頻繁項集中事件a發(fā)生的置信度大于預(yù)設(shè)置信度的規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則。
23、進(jìn)一步地,所述關(guān)聯(lián)規(guī)則算法包括apriori算法、eclat算法或fpgrowth算法。
24、進(jìn)一步地,根據(jù)所有所述強(qiáng)關(guān)聯(lián)規(guī)則,構(gòu)建知識圖譜,包括:
25、以所述強(qiáng)關(guān)聯(lián)規(guī)則的前項和后項為實體,以對應(yīng)的支持度和置信度為關(guān)系,將每一條所述強(qiáng)關(guān)聯(lián)規(guī)則作為三元組保存后,構(gòu)建知識圖譜。
26、進(jìn)一步地,從所述知識圖譜中獲取與所述待尋找元素的規(guī)則團(tuán),包括:
27、利用聚類算法對所述知識圖譜進(jìn)行處理,得到聚類后的知識圖譜;
28、根據(jù)所述聚類后的知識圖譜,得到相關(guān)性高的聚類團(tuán),所述聚類團(tuán)對應(yīng)的規(guī)則則為所述待尋找元素的規(guī)則團(tuán)。
29、進(jìn)一步地,所述聚類算法包括社區(qū)發(fā)現(xiàn)算法、圖譜聚類算法或者隨機(jī)游走算法結(jié)合深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型。
30、本發(fā)明的第二方面提供一種基于關(guān)聯(lián)規(guī)則算法和知識圖譜技術(shù)的智能找礦系統(tǒng),包括:
31、數(shù)據(jù)收集模塊,所述數(shù)據(jù)收集模塊收集礦產(chǎn)勘查區(qū)中各個采樣點的礦床相關(guān)數(shù)據(jù);
32、數(shù)據(jù)符號化和融合模塊,所述數(shù)據(jù)符號化和融合模塊將所述各個采樣點的礦床相關(guān)數(shù)據(jù)的每一個地質(zhì)元素符號化和融合后,得到關(guān)聯(lián)規(guī)則數(shù)據(jù)表;
33、強(qiáng)關(guān)聯(lián)規(guī)則獲取模塊,所述強(qiáng)關(guān)聯(lián)規(guī)則獲取模塊使用關(guān)聯(lián)規(guī)則算法,在所述關(guān)聯(lián)規(guī)則數(shù)據(jù)表中獲取所有導(dǎo)致待尋找元素出現(xiàn)時的強(qiáng)關(guān)聯(lián)規(guī)則;
34、圖構(gòu)建模塊,所述圖構(gòu)建模塊根據(jù)所有所述強(qiáng)關(guān)聯(lián)規(guī)則,構(gòu)建知識圖譜;
35、找礦標(biāo)志模塊,所述找礦標(biāo)志模塊從所述知識圖譜中獲取與所述待尋找元素的規(guī)則團(tuán),所述規(guī)則團(tuán)作為在所述礦產(chǎn)勘查區(qū)中尋找所述待尋找元素的找礦標(biāo)志。
36、與現(xiàn)有技術(shù)相比,本發(fā)明技術(shù)方案的有益效果是:
37、本發(fā)明實現(xiàn)了礦床多源異構(gòu)數(shù)據(jù)的融合,使得所有的強(qiáng)關(guān)聯(lián)規(guī)則都參與到找礦中,既解決了數(shù)據(jù)丟失的問題,也克服了因個人篩選強(qiáng)關(guān)聯(lián)規(guī)則的主觀性對區(qū)域找礦的誤導(dǎo)問題,也解決了單條強(qiáng)關(guān)聯(lián)規(guī)則無法泛化到區(qū)域找礦的限制,使得原來的利用單條或多條關(guān)聯(lián)規(guī)則找礦轉(zhuǎn)變?yōu)閷ふ覅^(qū)域強(qiáng)關(guān)聯(lián)規(guī)則團(tuán)來指導(dǎo)找礦,且能從本發(fā)明中同時看到單條強(qiáng)關(guān)聯(lián)規(guī)則和強(qiáng)關(guān)聯(lián)規(guī)則團(tuán),顯示了從局部到區(qū)域找礦的變化,且能看出分級元素級別變化過程中其他元素的變化,同時具備了相關(guān)性分析、聚類分析等多項功能。