本發(fā)明涉及地理空間數(shù)據(jù)匹配,特別涉及一種基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法及系統(tǒng)。
背景技術(shù):
1、地理空間數(shù)據(jù)匹配在多尺度空間數(shù)據(jù)集成、融合、尺度變換和更新中扮演著關(guān)鍵角色,是維護(hù)已建數(shù)據(jù)庫現(xiàn)勢性、準(zhǔn)確性的核心技術(shù)。地球富含多種類型的水資源,因此地理空間數(shù)據(jù)庫中包含大量的水系數(shù)據(jù)。網(wǎng)狀河系是人類對自然水系進(jìn)行改造而形成的,其在形態(tài)結(jié)構(gòu)上與自然河系有著明顯的區(qū)別。這種河系結(jié)構(gòu)在荷蘭、我國江蘇等地廣泛分布,主要分布于城鎮(zhèn)及其周邊地帶,對于保障城鄉(xiāng)供水、防洪排澇以及維持水資源生態(tài)健康等方面具有重要意義。匹配模式是指在不同尺度數(shù)據(jù)庫中,同名實體之間的數(shù)量對應(yīng)關(guān)系。同名實體是指在多種數(shù)據(jù)源中反映現(xiàn)實世界同一地物的空間實體。由于同名實體在不同尺度下存在顯著的幾何和語義特征差異,因此它們之間的匹配模式有多種,可分為1:0、1:1、m:1等。
2、目前,對網(wǎng)狀河系的匹配研究相對較少,而對道路網(wǎng)等線狀要素的匹配研究更為廣泛。事實上,網(wǎng)狀河系與道路網(wǎng)在形態(tài)結(jié)構(gòu)上具有相似性,它們都由一系列相互連接的線段組成,形成了復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。雖然網(wǎng)狀河系與道路網(wǎng)在細(xì)節(jié)上存在一些差異,例如網(wǎng)狀河系中并不存在復(fù)雜的空間結(jié)構(gòu),如立交橋或環(huán)島等,但總體而言,網(wǎng)狀河系的匹配方法與道路網(wǎng)的匹配方法存在共通之處,彼此間可以相互借鑒。對道路網(wǎng)等線狀要素的匹配研究主要分為兩類,一是對兩個線要素進(jìn)行特征相似性度量,通過與設(shè)定的相似性閾值進(jìn)行比較,完成匹配關(guān)系的判定。在相似性特征選擇方面,幾何、拓?fù)浜驼Z義等特征被廣泛使用。然而,在相似性閾值的設(shè)定上,需要大量的先驗知識來獲得合適的閾值,如果設(shè)置不當(dāng),可能會影響匹配結(jié)果。二是將匹配問題視為全局優(yōu)化問題,即尋找一種最佳的匹配方案,使得兩個數(shù)據(jù)集中所有要素之間的差異最小化,而不是進(jìn)行要素間的相似性度量。該方法的優(yōu)勢是克服前一種匹配方法的次優(yōu)性和貪婪性,同時能利用約束條件對模糊匹配進(jìn)行過濾,提高匹配效率。不同匹配模式的地理實體在匹配時的難度是有差異的。然而,上述研究并未主動計算匹配模式,而是根據(jù)其算法得到的匹配結(jié)果,將已匹配成功的歸為簡單匹配模式(如1:0),未匹配的則被視為復(fù)雜匹配模式(如m:1),影響匹配的準(zhǔn)確性。為此,亟需一種能夠預(yù)先確定同名實體匹配手段,以高效、準(zhǔn)確完成網(wǎng)狀河系的匹配過程。
技術(shù)實現(xiàn)思路
1、為此,本發(fā)明提供一種基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法及系統(tǒng),針對現(xiàn)有地理空間匹配過程中不同匹配模式的地理實體匹配存在的難度大、準(zhǔn)確度不理想等問題,依據(jù)網(wǎng)狀河系特征與匹配模式之間的關(guān)系對河段采取不同的匹配策略,得到不同尺度數(shù)據(jù)中同名實體的匹配結(jié)果,提高網(wǎng)狀河系匹配的準(zhǔn)確率和效率。
2、按照本發(fā)明所提供的設(shè)計方案,一方面,提供一種基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,包含:
3、將待匹配大比例尺網(wǎng)狀河系數(shù)據(jù)構(gòu)建為圖結(jié)構(gòu),依據(jù)網(wǎng)狀河系特征指標(biāo)提取圖節(jié)點(diǎn)標(biāo)簽,所述網(wǎng)狀河系特征指標(biāo)包括河段等級、河段流域密度、河段連通度、河段最大長度、河段整體彎曲度和河段與道路相近關(guān)系;
4、利用預(yù)訓(xùn)練的匹配模式分類模型并根據(jù)圖節(jié)點(diǎn)標(biāo)簽對大比例尺網(wǎng)狀河系數(shù)據(jù)圖結(jié)構(gòu)進(jìn)行分類識別,建立圖結(jié)構(gòu)特征與匹配模式之間的映射關(guān)系,根據(jù)待匹配大比例尺網(wǎng)狀河系各河段的匹配模式并基于空間鄰近和幾何相似性執(zhí)行匹配模式對應(yīng)的匹配策略,以實現(xiàn)與被匹配的小比例尺網(wǎng)狀河系的匹配。
5、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,將待匹配大比例尺網(wǎng)狀河系數(shù)據(jù)構(gòu)建為圖結(jié)構(gòu),包含:
6、對大比例尺網(wǎng)狀河系數(shù)據(jù)進(jìn)行預(yù)處理,以去除網(wǎng)狀河系數(shù)據(jù)中的異常數(shù)據(jù),所述預(yù)處理包括刪除無序線、斷裂河段連接和拓?fù)錂z查,所述異常數(shù)據(jù)包括虛假節(jié)點(diǎn)和/或自相交邊;
7、依據(jù)網(wǎng)狀河系的匯流節(jié)點(diǎn)和等級變化將網(wǎng)狀河系分割為河段,將每條河段視為圖節(jié)點(diǎn),將河段的連接視為邊,構(gòu)建網(wǎng)狀河系的對偶圖。
8、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,依據(jù)網(wǎng)狀河系特征指標(biāo)提取圖節(jié)點(diǎn)標(biāo)簽,包含:
9、以河寬對網(wǎng)狀河系進(jìn)行層級結(jié)構(gòu)劃分,獲取各河段在網(wǎng)狀河系中的河段等級,所述河段等級為河段在網(wǎng)狀河系層次結(jié)構(gòu)中所處層級;
10、根據(jù)河段的首末點(diǎn)連接線建立河段格網(wǎng),依據(jù)格網(wǎng)中河段的總長度和格網(wǎng)面積獲取河段流域密度;
11、依據(jù)圖結(jié)構(gòu)中河段節(jié)點(diǎn)之間的連接情況獲取河段連通度,并依據(jù)圖結(jié)構(gòu)中語義約束和角度約束構(gòu)建河段平滑鏈stroke,依據(jù)河段平滑鏈stroke長度獲取河段的最大長度;
12、依據(jù)河段平滑鏈stroke首末點(diǎn)連接線的長度及所圍成形狀的面積、和網(wǎng)狀河系中平滑鏈stroke平均長度和平均面積獲取河段整體彎曲度;并依據(jù)河段中點(diǎn)與道路之間的最小距離獲取河段與道路的相近關(guān)系。
13、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,利用預(yù)訓(xùn)練的匹配模式分類模型并根據(jù)圖節(jié)點(diǎn)標(biāo)簽對大比例尺網(wǎng)狀河系數(shù)據(jù)圖結(jié)構(gòu)進(jìn)行分類識別之前,還包含:
14、獲取大比例尺遙感影像數(shù)據(jù)和小比例尺地形數(shù)據(jù),對數(shù)據(jù)進(jìn)行預(yù)處理和河段分割,并將預(yù)處理和河段分割后的大比例尺遙感影像數(shù)據(jù)構(gòu)建為圖結(jié)構(gòu),采用人工和/或機(jī)器方式識別大比例尺遙感影像數(shù)據(jù)中各河段的匹配模式,將大比例尺遙感影像數(shù)據(jù)網(wǎng)狀河系特征指標(biāo)作為圖節(jié)點(diǎn)標(biāo)簽,利用圖結(jié)構(gòu)和圖節(jié)點(diǎn)標(biāo)簽構(gòu)建圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練的河段樣本數(shù)據(jù)集;
15、基于graphsage構(gòu)建圖神經(jīng)網(wǎng)絡(luò)模型,依據(jù)模型損失函數(shù)并利用河段樣本數(shù)據(jù)集對圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,將訓(xùn)練后的圖神經(jīng)網(wǎng)絡(luò)模型作為預(yù)訓(xùn)練的匹配模式分類模型。
16、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,所述圖神經(jīng)網(wǎng)絡(luò)模型包含:輸入層、隱藏層和輸出層,其中,輸入層用于接收圖結(jié)構(gòu)和圖節(jié)點(diǎn)標(biāo)簽數(shù)據(jù),隱藏層包含三個graphsage卷積層和一個全連接層,輸出層以隱藏層輸入為輸入并利用softmax函數(shù)生成節(jié)點(diǎn)分類概率分布。
17、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,利用河段樣本數(shù)據(jù)集對圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,包含:
18、將圖結(jié)構(gòu)和圖節(jié)點(diǎn)標(biāo)簽作為模型輸入,以圖結(jié)構(gòu)中每個節(jié)點(diǎn)為核心節(jié)點(diǎn),將圖結(jié)構(gòu)由內(nèi)向外劃分為k層次,依據(jù)采樣數(shù)量從鄰居節(jié)點(diǎn)中選取采樣節(jié)點(diǎn);將第k層采樣節(jié)點(diǎn)特征聚合到對應(yīng)的k-1層的節(jié)點(diǎn)上,將k-1層采樣節(jié)點(diǎn)特征聚合到核心節(jié)點(diǎn);根據(jù)核心節(jié)點(diǎn)在k-1層的采樣節(jié)點(diǎn)特征聚合為核心節(jié)點(diǎn)的整體特征;利用分類函數(shù)將聚合后的特征信息映射到匹配模式類別概率上,輸出網(wǎng)絡(luò)河系匹配模式分類類型,將模型的輸出與真實匹配模式進(jìn)行比較,并計算出損失函數(shù);根據(jù)計算的損失函數(shù),利用鏈?zhǔn)椒▌t從模型輸出層向模型輸入層傳播梯度,以依據(jù)梯度更新模型參數(shù)。
19、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,根據(jù)待匹配大比例尺網(wǎng)狀河系各河段的匹配模式并基于空間鄰近和幾何相似性執(zhí)行匹配模式對應(yīng)的匹配策略,包含:
20、當(dāng)匹配模式為1:1時,獲取該匹配模式下的各目標(biāo)河段候選匹配集,將各目標(biāo)河段與對應(yīng)候選匹配集中的小比例尺網(wǎng)狀河系河段進(jìn)行相似性度量,依據(jù)相似性選取對應(yīng)目標(biāo)河段匹配項中的小比例尺網(wǎng)狀河系河段;若多條目標(biāo)河段匹配上同一條小比例尺網(wǎng)狀河系河段,則將相似性最大的目標(biāo)河段認(rèn)定為1:1匹配模式,將該多跳目標(biāo)河段中的其他目標(biāo)河段匹配模式劃入m:1,若存在目標(biāo)河段未匹配上小比例尺網(wǎng)狀河系河段,則將該目標(biāo)河段匹配模式劃入1:0;
21、當(dāng)匹配模式為m:1時,判斷該類別的目標(biāo)河段是否與其他m:1河段相鄰,若不存在相鄰的情形,則將該目標(biāo)河段的匹配模式劃入1:1,并采取對應(yīng)的匹配策略;若存在相鄰的情形,則獲取m:1匹配模式下的各目標(biāo)河段候選匹配集,合并與目標(biāo)河段連通的其他x條目標(biāo)河段,依據(jù)連通的目標(biāo)河段組合來進(jìn)行河段匹配,并未匹配成功的目標(biāo)河段的匹配模式劃入1:0;
22、當(dāng)匹配模式為1:0時,識別匹配模式誤分類的河段并尋找其匹配項,通過獲取1:1匹配模式下的各目標(biāo)河段候選匹配集合,將各目標(biāo)河段與對應(yīng)候選匹配集中的小比例尺網(wǎng)狀河系河段進(jìn)行相似性度量,以依據(jù)相似性獲取目標(biāo)河段匹配項。
23、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,獲取匹配模式下的各目標(biāo)河段候選匹配集,包含:
24、構(gòu)建河段緩沖區(qū),且將每一條該類別的目標(biāo)河段緩沖區(qū)內(nèi)至少包含一條對應(yīng)的小比例尺網(wǎng)狀河系河段數(shù)據(jù),將落入各目標(biāo)河段緩沖區(qū)中的小比例尺網(wǎng)狀河系河段作為對應(yīng)匹配模式下的各目標(biāo)河段候選匹配集。
25、作為本發(fā)明基于匹配模式分類的跨尺度網(wǎng)狀河系匹配方法,進(jìn)一步地,依據(jù)連通的目標(biāo)河段組合來進(jìn)行河段匹配,包含:
26、當(dāng)x>1且該x條目標(biāo)河段合并成一條相同等級的y河段線時,將y河段線與候選匹配集中的小比例尺網(wǎng)狀河系河段進(jìn)行相似性度量,然后計算由x-1條相連的河段合并后的線與候選匹配集中小比例尺網(wǎng)狀河系河段進(jìn)行相似性度量,并循環(huán)進(jìn)行z次,直到x-z等于1為止,并記錄并比較相似性的大小,選擇相似性最大的目標(biāo)河段組合,作為與小比例尺網(wǎng)狀河系河段匹配成功的目標(biāo)河段,對應(yīng)的小比例尺網(wǎng)狀河系河段作為目標(biāo)河段的匹配項。
27、再一方面,本發(fā)明還提供一種基于匹配模式分類的跨尺度網(wǎng)狀河系匹配系統(tǒng),包含:圖構(gòu)建模塊和圖匹配模塊,其中,
28、圖構(gòu)建模塊,用于將待匹配大比例尺網(wǎng)狀河系數(shù)據(jù)構(gòu)建為圖結(jié)構(gòu),依據(jù)網(wǎng)狀河系特征指標(biāo)提取圖節(jié)點(diǎn)標(biāo)簽,所述網(wǎng)狀河系特征指標(biāo)包括河段等級、河段流域密度、河段連通度、河段最大長度、河段整體彎曲度和河段與道路相近關(guān)系;
29、圖匹配模塊,用于利用預(yù)訓(xùn)練的匹配模式分類模型并根據(jù)圖節(jié)點(diǎn)標(biāo)簽對大比例尺網(wǎng)狀河系數(shù)據(jù)圖結(jié)構(gòu)進(jìn)行分類識別,建立圖結(jié)構(gòu)特征與匹配模式之間的映射關(guān)系,根據(jù)待匹配大比例尺網(wǎng)狀河系各河段的匹配模式并基于空間鄰近和幾何相似性執(zhí)行匹配模式對應(yīng)的匹配策略,以實現(xiàn)與被匹配的小比例尺網(wǎng)狀河系的匹配。
30、本發(fā)明的有益效果:
31、本發(fā)明利用圖神經(jīng)網(wǎng)絡(luò)識別大比例尺網(wǎng)狀河系的匹配模式,針對不同的匹配模式采取相應(yīng)的匹配策略,以獲得更精確的匹配結(jié)果。并進(jìn)一步通過試驗及相關(guān)分析表明:本案方案能夠有效地識別大比例尺河段的匹配模式,特別是對于1:1和1:0河段具有較高的分類準(zhǔn)確率;針對不同匹配模式所設(shè)計的匹配策略,能夠充分利用各種匹配方法的優(yōu)勢,使得整體匹配精度達(dá)到了95%;通過對不同匹配模式的河段采取不同的匹配順序,可以有效避免因人為設(shè)置閾值而造成的不確定性因素,在地里空間數(shù)據(jù)匹配中具有較好的應(yīng)用前景。