本發(fā)明屬于計算機應用的相關領域,具體地說,是一種基于互聯(lián)網(wǎng)信息的重要船只目標動態(tài)監(jiān)測方法,可應用于海面交通監(jiān)控、船只搜救和漁業(yè)管理等領域。
背景技術:
海面船只目標動態(tài)監(jiān)測是遙感圖像處理與分析領域備受關注的課題,其核心任務是判斷遙感圖像中是否存在目標船只,并對其進行監(jiān)測、分類與精確定位。
船舶自動識別系統(tǒng)(automaticidentificationsystem,簡稱ais系統(tǒng))是基于gps技術、甚高頻(vhf)技術和自組織時分多址技術(sotdma)的一種新型輔助導航系統(tǒng),具有識別跟蹤船舶、避免碰撞、環(huán)境保護和搜索救援等功能。按照平臺不同可分為船載、空載、岸基和星載。
雖然星載sar、光學遙感與ais在船只監(jiān)測應用中具有顯著的優(yōu)點,但是受技術發(fā)展水平的限制,ais數(shù)據(jù)存在一定的錯誤和漏檢率,sar圖像解譯算法還不成熟等。因此,通過將星載sar、光學遙感圖像與ais進行信息融合使其優(yōu)勢互補,已成為目前海洋目標船只監(jiān)測領域的研究熱點之一。
由于星載sar、光學遙感圖像、ais、互聯(lián)網(wǎng)文本等信息情報數(shù)據(jù)的多源性、異構性、多維以及動態(tài)性,使得海洋戰(zhàn)略環(huán)境下各類海上平臺的資源共享與信息集成過程非常復雜,亟需探索基于海量遙感數(shù)據(jù)、ais數(shù)據(jù)、文本數(shù)據(jù)等多源異構信息的新型艦船目標動態(tài)監(jiān)測方法。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種有效發(fā)現(xiàn)重要船只的動態(tài)監(jiān)測方法。
實現(xiàn)本發(fā)明目的的技術解決方案為:一種基于互聯(lián)網(wǎng)信息的重要船只目標動態(tài)監(jiān)測方法,
步驟1:采用網(wǎng)絡爬蟲方法從互聯(lián)網(wǎng)上獲取與目標船只相關的時空數(shù)據(jù);步驟2:針對步驟1獲得的時空數(shù)據(jù),采用元數(shù)據(jù)方法即按照船只的元數(shù)據(jù)標準對原數(shù)據(jù)進行統(tǒng)一化處理,得到統(tǒng)一化數(shù)據(jù);
步驟3:構建本體語義框架:首先,收集與船只概念相近的詞匯,構建船只詞匯庫;然后,在語義網(wǎng)中注冊船只本體;最后,構建語義搜索引擎;針對所述步驟2得到的統(tǒng)一化數(shù)據(jù),將其經(jīng)過本體語義框架進行語義映射,得到轉義數(shù)據(jù);
步驟4:針對步驟3得到的轉義數(shù)據(jù),采用特征層融合的方法對其進行融合,包括兩個步驟:首先,提取船只的相關參數(shù),包含幾何參數(shù)、地理參數(shù)、運動參數(shù);然后,對提取的參數(shù)采用模糊融合法得到融合數(shù)據(jù);
步驟5:根據(jù)步驟4中的地理參數(shù),得到目標船只所在的區(qū)域,針對步驟4得到的融合數(shù)據(jù)使用頻繁模式挖掘算法即t-模式挖掘算法,得到目標船只的頻繁軌跡模式,使用動態(tài)存儲結構dpt來存儲軌跡模式;
步驟6:根據(jù)步驟5的船只頻繁模式,采用船只的預測算法預測船只的下一個位置。
步驟1所述與目標船只相關的時空數(shù)據(jù)形式包括:文本、可見光圖像、多/高光譜圖像、紅外圖像、民用ais圖像、網(wǎng)絡社區(qū)圖像和視頻。
步驟2所述船只元數(shù)據(jù)是對船只資源的規(guī)范化描述,是按照船只元數(shù)據(jù)標準,從船只資源中抽取出相應的特征,組成的一個特征元素集合;船只的元數(shù)據(jù)標準內容包括船只的坐標、速度、行駛方向、類別、用途和天氣情況。
步驟5所述t-模式即一種頻繁軌跡模式,是一個時間和區(qū)域(r,a)組成的序列;其中r=r0,r1,…rn是區(qū)域序列,
所述dpt是由三元組(n,e,root)組成的結構樹,n是節(jié)點的集合,e是帶標志的邊集,root∈n是虛擬的根節(jié)點,每一條集合e的邊都以時間間隔interval為標志;
每一個節(jié)點nodev∈n,除了根節(jié)點,都包含{區(qū)域,支持度,子節(jié)點}:
區(qū)域:代表t-模式的一個區(qū)域;
支持度:t-模式支持度;
子節(jié)點:節(jié)點nodev的子節(jié)點列表;
每一條邊e∈e,連接父節(jié)點和子節(jié)點,它的interval形式是[timemin,timemax];連接根節(jié)點和它的子節(jié)點的邊是空標志,它的interval為
利用dpt插入規(guī)則創(chuàng)建結構樹:每個輸入的t-模式簡稱tp,在dpt中查找與它的最長前綴相符的路徑,然后給剩下的tp的元素添加一個分支;如果模式樹是tp的前綴,tp則被附加到這棵樹的一條路徑中;
dpt更新規(guī)則:設定δ為模式的最小支持度,現(xiàn)有動態(tài)產(chǎn)生tp:〈r,i〉support:a,在dpt中查找與其最長前綴區(qū)域相符的路徑p,若
步驟6所述的預測船只下一個位置的具體方法為:
設定匹配度閾值γ;找到dpt樹上的最佳路徑;在待選路徑中計算出軌跡的最佳匹配度;如果最佳匹配度不小于閾值γ,那個預測出的最佳節(jié)點的子節(jié)點就是預測的該軌跡下一個位置。
本發(fā)明與現(xiàn)有技術相比,其顯著優(yōu)點為:(1)本發(fā)明能夠快速準確地提取船只目標。(2)能夠在保持完整數(shù)據(jù)原有特征的同時,大大減少計算開銷和網(wǎng)絡數(shù)據(jù)傳輸量,滿足資源受限環(huán)境下快速監(jiān)測重要船只目標的查詢需求。
附圖說明
圖1是多源船只目標數(shù)據(jù)集成的本體語義框架圖。
圖2是數(shù)據(jù)編碼技術流程圖。
圖3是數(shù)據(jù)整合整體框架圖。
圖4是軌跡動態(tài)預測模型。
圖5是軌跡模式挖掘流程圖。
圖6是動態(tài)模式樹示例。
具體實施方式
本發(fā)明基于互聯(lián)網(wǎng)信息的重要船只目標動態(tài)監(jiān)測方法,它包括基于互聯(lián)網(wǎng)信息的船只目標海量時空數(shù)據(jù)自動發(fā)現(xiàn)、大數(shù)據(jù)環(huán)境下多源船只目標信息統(tǒng)一數(shù)據(jù)表示、時空數(shù)據(jù)融合下的船只目標深度關聯(lián)與動態(tài)監(jiān)測、多源船只目標軌跡分析與探測、基于感知壓縮理論的快速船只目標監(jiān)測方法。
首先是利用網(wǎng)絡爬蟲的相關技術從互聯(lián)網(wǎng)上(包括web新聞或者twitter、facebook等社交媒體、ais系統(tǒng)及遙感衛(wèi)星網(wǎng)站等信息數(shù)據(jù)來源)獲取到目標船只相關的海量時空數(shù)據(jù),針對時空相關搜索需求,挖掘出在數(shù)據(jù)集成過程中自動發(fā)現(xiàn)相關分布自治數(shù)據(jù)源的機理以及元數(shù)據(jù)管理方法,分析eu-mis和ioos等應用系統(tǒng)中的海洋現(xiàn)場船只觀測、傳感、地理影像數(shù)據(jù)的元數(shù)據(jù)標準,確定切實可行的多源船只目標元數(shù)據(jù)標準,并在數(shù)據(jù)虛擬化平臺構建元數(shù)據(jù)時,按照選擇的元數(shù)據(jù)標準規(guī)范進行,以便生成高質量的元數(shù)據(jù)文檔(庫),為進一步的時空配準與數(shù)據(jù)融合打基礎。
在公開信息中提取的多源異構數(shù)據(jù)類型不同,可以分為空間數(shù)據(jù)和非空間數(shù)據(jù)??臻g數(shù)據(jù)收集可以通過文件傳輸和空間數(shù)據(jù)引擎實現(xiàn),文件傳輸方法使用空間交換格式或常見的矢量格式,如shapefile。非空間數(shù)據(jù)包括傳統(tǒng)的關系數(shù)據(jù)庫和文檔數(shù)據(jù)。使用地理編碼技術將獨立的空間數(shù)據(jù)和非空間數(shù)據(jù)相關聯(lián),采用placename-addressmatching地理編碼方法建立相關性,并且利用時空數(shù)據(jù)深度關聯(lián)的etl技術,對原始數(shù)據(jù)進行清理、轉化和整合。
在融合數(shù)據(jù)時,提出了基于特征層融合的多源船只目標識別。特征層融合指的是對目標特征與數(shù)據(jù)進行配準和關聯(lián),增加描述目標特征的維數(shù),獲得了特征矢量,使得目標知識更趨完備。采用模糊綜合法實現(xiàn)星載光學遙感圖像、光學圖像與ais數(shù)據(jù)關聯(lián),具體過程包括構造因素集、確定權重和形成評價集。
在探測目標船只軌跡與狀態(tài)時,首先要提取軌跡頻繁模式,然后設計蘊含時空信息的數(shù)據(jù)結構存儲和查詢移動物體的t-模式,并提出預測算法計算最佳匹配度,得到移動對象軌跡的預測位置,預測移動物體的未來位置。
下面結合附圖對本發(fā)明作進一步說明。
本發(fā)明的技術路線按照異構信息的統(tǒng)一描述→基于本體語義框架的多源船只目標數(shù)據(jù)集成→多源船只目標數(shù)據(jù)的時空一致與配準→特征級多態(tài)數(shù)據(jù)融合→基于軌跡頻繁模式的預測方法。
首先是利用網(wǎng)絡爬蟲的相關技術從互聯(lián)網(wǎng)上(包括web新聞或者twitter、facebook等社交媒體、ais系統(tǒng)及遙感衛(wèi)星網(wǎng)站等信息數(shù)據(jù)來源)獲取到目標船只相關的海量時空數(shù)據(jù)。數(shù)據(jù)類型包括結構化數(shù)據(jù)庫數(shù)據(jù)外,也包括非結構化、半結構文檔、電子郵件和視頻等多種類型數(shù)據(jù)。使用元數(shù)據(jù)“標簽”來集成不同類型數(shù)據(jù),對非結構化數(shù)據(jù)那些可以被鏈接的屬性進行“標簽化”,然后鏈接到數(shù)據(jù)庫中的主鍵和索引,從而將結構化數(shù)據(jù)和非結構化數(shù)據(jù)融合。
在大數(shù)據(jù)環(huán)境下多源船只目標信息數(shù)據(jù)的形式各異,采用本體語義框架來解決海洋目標船只監(jiān)測領域內的概念和術語上的分歧,使不同的用戶之間可以順暢的溝通和交流并保持語義等效性,同時讓不同的工具軟件和應用系統(tǒng)之間實現(xiàn)互操作,有助于集成系統(tǒng)的構建。
擬采用如下本體語義框架的構建方法:借鑒數(shù)據(jù)管理框架oodt的元數(shù)據(jù)實現(xiàn)原理、架構思想,參照mmi語義框架,需研究的內容有:對現(xiàn)有開源語義框架或mmi語義框架擴展并集成到數(shù)據(jù)虛擬化平臺中去;實現(xiàn)海洋環(huán)境監(jiān)測專業(yè)詞匯庫構建、注冊(產(chǎn)生符合owl標準的語義內容,一般采用rdf/xml格式);實現(xiàn)語義映射(詞匯和詞匯之間的映射),多源船只數(shù)目標據(jù)集成的本體語義框架,參考圖1。
多源異構數(shù)據(jù)采集方法:
為滿足大范圍異構數(shù)據(jù)整合的需求,設計公共信息平臺數(shù)據(jù)中心的數(shù)據(jù)搜集方法,針對實時數(shù)據(jù)更新,持續(xù)的數(shù)據(jù)服務,包括多媒體數(shù)據(jù)、文本數(shù)據(jù)和其他類型的數(shù)據(jù)源的數(shù)據(jù)進行整合。
1)多源異構數(shù)據(jù)整合成空間數(shù)據(jù)和非空間數(shù)據(jù)
采用時間戳的方法實現(xiàn)增長式提??;采用池機制來防止數(shù)據(jù)提取過程中的數(shù)據(jù)更新過于頻繁。在數(shù)據(jù)轉化集中階段中統(tǒng)一化處理數(shù)據(jù)歧義性、冗余性、非完整性、邏輯規(guī)則和其他問題。
2)多源異構數(shù)據(jù)采集的空間相關性
通過地理編碼將獨立的空間數(shù)據(jù)和非空間數(shù)據(jù)相關聯(lián)。采用placename-addressmatching地理編碼方法建立相關性。
數(shù)據(jù)編碼方法:
編碼是空間數(shù)據(jù)和非空間數(shù)據(jù)關聯(lián)的基礎。屬性數(shù)據(jù)通過地理編碼和分配空間屬性到非空間數(shù)據(jù)來獲取空間信息。
數(shù)據(jù)編碼是數(shù)據(jù)組織和應用的基礎??臻g數(shù)據(jù)編碼可以實現(xiàn)快速定位、篩選和統(tǒng)計功能。非空間數(shù)據(jù)編碼可以得到空間相關性,實現(xiàn)業(yè)務數(shù)據(jù)的空間分析和統(tǒng)計功能。
編碼管理主要包含兩個功能,空間編碼和空間相關性??臻g編碼處理位置、幾何、類別、區(qū)域劃分、水平和其它空間基本數(shù)據(jù)。在編碼過程中,進行數(shù)據(jù)提取、轉換和空間分析。屬性數(shù)據(jù)被地理名稱和地址定位,并通過空間分析與空間元素代碼相結合的方法與空間數(shù)據(jù)進行相關聯(lián),參考圖2。
算法具體流程:
1)首先對于數(shù)據(jù)進行統(tǒng)一的形式化編碼。
2)通過對幾何字符進行編碼,得到編碼之后的幾何中心。
3)根據(jù)幾何中心,將數(shù)據(jù)進行分區(qū)操作,確定分區(qū)數(shù)據(jù)范圍
4)對分區(qū)之后的數(shù)據(jù)進行網(wǎng)格編碼,編碼完成,判斷編碼是否重復,如果重復先進行順序編碼,然后進入下一步,如果不重復則直接進入下一步操作。
5)進行行政區(qū)域編碼,比如最常見的地理名稱和地址,一般情況下使用經(jīng)緯度來標定船只地點。
6)最后進行分級的編碼,根據(jù)目標數(shù)據(jù)屬性對于目標進行分級處理,完成統(tǒng)一編碼。
基于多源異構數(shù)據(jù)集合的信息平臺實現(xiàn)從不同源數(shù)據(jù)庫中提取的空間數(shù)據(jù)和非空間數(shù)據(jù)的相關性研究。多源異構數(shù)據(jù)集合中包括不同的源數(shù)據(jù)庫中空間數(shù)據(jù)及非空間數(shù)據(jù)的數(shù)據(jù)提取,數(shù)據(jù)轉換、數(shù)據(jù)加載和數(shù)據(jù)融合。數(shù)據(jù)收集實現(xiàn)公共平臺和業(yè)務系統(tǒng)的關聯(lián)。收集和更新平臺上的數(shù)據(jù),保證了數(shù)據(jù)的完整性和實時性。
數(shù)據(jù)收集包含兩類,空間數(shù)據(jù)收集和非空間數(shù)據(jù)收集??臻g數(shù)據(jù)收集可以通過文件傳輸和空間數(shù)據(jù)引擎實現(xiàn)。文件傳輸方法使用空間交換格式或常見的矢量格式,如shapefile。非空間數(shù)據(jù)包括傳統(tǒng)的關系數(shù)據(jù)庫和文檔數(shù)據(jù)。數(shù)據(jù)整合整體框架請參考圖3
在融合數(shù)據(jù)時,選用基于特征層融合的多源船只目標識別技術,特征層融合指的是目標特征對數(shù)據(jù)進行配準和關聯(lián),增加描述目標特征的維數(shù),獲得特征矢量,使得目標知識更趨完備。該模型包括數(shù)據(jù)獲取、融合決策和目標識別3個環(huán)節(jié)。
數(shù)據(jù)獲取需采用宇宙時間坐標(universaltimecoordinated,utc),以保持精確同步。融合決策包括數(shù)據(jù)配準和多目標數(shù)據(jù)關聯(lián)。數(shù)據(jù)配準為數(shù)據(jù)關聯(lián)提取圖像時需要進行幾何校正和相干斑抑制預處理。ais數(shù)據(jù)預處理包括根據(jù)光學遙感圖像場景時空信息對ais數(shù)據(jù)進行篩選;驗證ais報告數(shù)據(jù)有效性,然后對預處理后的光學遙感圖像進行目標檢測和特征參數(shù)提取,并利用ais數(shù)據(jù)直接提取目標特征。數(shù)據(jù)配準后得到了光學遙感圖像目標特征集和ais目標特征集,即可進行基于單個特征或多特征信息融合的多目標數(shù)據(jù)關聯(lián)處理。融合決策結果除了輸出還要進行反饋,以不斷檢查和提高決策的有效性。
在探測多源船只目標軌跡與狀態(tài)時,首先提取軌跡頻繁模式,然后設計蘊含時空信息的數(shù)據(jù)結構存儲和查詢移動物體的t-模式,并提出預測算法計算最佳匹配度,得到移動對象軌跡的預測位置。通過預測移動物體的未來位置。
針對特定區(qū)域全部對象的移動軌跡,挖掘群體時空模式,使用數(shù)據(jù)結構軌跡模式樹進行存儲,在此基礎上,對移動對象的未來軌跡進行近似預測。由于不確定性,個體的路線沒有絕對的相似或相同,從靜態(tài)的角度分析會降低預測準確性,提出動態(tài)更新存儲。
圖4給出p1、p2這兩個移動對象軌跡頻繁模式,以及待預測的移動對象軌跡b,其中軌跡b包含六個帶時間戳的軌跡點。通過對待預測軌跡與軌跡模式做匹配度計算,預測軌跡b的下一個位置。如果靜態(tài)地分析,與b最匹配的模式是p2,預測結果也將最接近p2;然而,如果按照時間戳增大的順序動態(tài)地分析這條軌跡,并把新挖掘到的頻繁模式信息更新到存儲數(shù)據(jù)結構中,得到軌跡模式dp,實際上前三個時間戳與b最匹配的模式是p1,后三個時間戳中最匹配的模式是p2,預測結果b1也更加接近b。
參考圖5可得,從移動用戶軌跡集挖掘時空軌跡頻繁模式,提取一組區(qū)域、時間注釋對—軌跡模式。每一個軌跡模式的提取都是從時間(運動持續(xù)時間)和空間(運動期間的空間訪問區(qū)域)上描述用戶頻繁移動行為。
根據(jù)軌跡模式提取方法,得到軌跡模式樹,請參考圖6,依據(jù)模式樹,對新的軌跡在空間和時間上預測移動對象位置。預測方法的主要思路是:設定匹配度閾值γ;找到樹上的最佳路徑(跟給出軌跡匹配的最佳模式);對于給出的軌跡,在待選路徑中計算出最佳匹配度;如果最佳匹配度不小于閾值γ,那個預測出的最佳節(jié)點的子節(jié)點就是預測的該軌跡下一個位置。
本發(fā)明的方法通過挖掘通過公開渠道獲得的新聞文本、全球海量衛(wèi)星數(shù)據(jù)中與艦船目標相關的信息,彌補艦船目標動態(tài)監(jiān)測情報信息的不足,以國內外互聯(lián)網(wǎng)上多種公開衛(wèi)星時空數(shù)據(jù)為數(shù)據(jù)源,充分利用文本、光學、多/高光譜、紅外、sar、ais、電子偵察數(shù)據(jù)等多種數(shù)據(jù)源,開展基于大數(shù)據(jù)的多源異構信息挖掘技術,提高重點艦船目標動態(tài)監(jiān)測中時空數(shù)據(jù)深度關聯(lián)的正確率,縮短對重要目標數(shù)據(jù)的預警時間,提升艦船目標軌跡探測的精度,為海面重點艦船目標偵察監(jiān)視補充手段提供技術支撐。