本申請涉及數據分析領域,具體涉及一種用于污染物溯源的設備和方法。
背景技術:
目前,大氣、水源等污染狀況日益嚴重。污染的形成受排放物、擴散條件、地理環(huán)境等因素影響,其成因復雜多樣,這為準確地分析某地區(qū)污染的分布和擴散趨勢帶來了困難。
現有的方法主要基于高斯模型建立大氣污染擴散模型。然而,該方法僅適用于對較大區(qū)域(市區(qū)與城鎮(zhèn))進行較長時間且尺度較大(以月份為單位)的污染擴散分析,無法用于短時間、細時空粒度的污染物溯源。
技術實現要素:
本發(fā)明提出一種對不同監(jiān)測站點所監(jiān)測到的污染物進行溯源的技術方案。主要思想是:通過迭代計算不同監(jiān)測點污染濃度在相鄰時間窗的相關性,找出污染源頭。另外,本發(fā)明的技術方案同樣也適用于針對與大氣污染具有相似時序特征數據(如水源污染、交通擁塞流等)的事故源定位追蹤。
根據本發(fā)明的一個方面,提供了一種用于污染物溯源的設備,包括:獲取單元,被配置為獲取監(jiān)測點的監(jiān)測數據;計算單元,被配置為計算相鄰時間窗之間的所有監(jiān)測點之間的相關性;以及確定單元,被配置為找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,計算單元被配置為:設定時間窗和時間間隔,計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。確定單元被配置為:根據相關性矩陣中的數值大小,找出目標時刻的最相關的監(jiān)測點對,并且 依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,計算單元被配置為:計算污染濃度向量以及污染濃度矩陣;以及根據污染濃度向量以及污染濃度矩陣,計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。
在一個實施例中,確定單元被配置為:設定最相關的監(jiān)測點對的個數為n,其中n為大于1的正整數;根據相關性矩陣中的數值大小,找出目標時刻的n個最相關的監(jiān)測點對;以及依次向前移動時間窗以找出前一時刻的n個最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,計算單元被配置為:采用余弦相似性來計算相關性矩陣。
根據本發(fā)明的另一個方面,提供了一種用于污染物溯源的方法,包括:獲取監(jiān)測點的監(jiān)測數據;計算相鄰時間窗之間的所有監(jiān)測點之間的相關性;以及找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,設定時間窗和時間間隔,計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣;根據相關性矩陣中的數值大小,找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,計算污染濃度向量以及污染濃度矩陣;以及根據污染濃度向量以及污染濃度矩陣,計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。
在一個實施例中,設定最相關的監(jiān)測點對的個數為n,其中n為大于1的正整數;根據相關性矩陣中的數值大小,找出目標時刻的n個最相關的監(jiān)測點對;以及依次向前移動時間窗以找出前一時刻的n個最相關的監(jiān)測點對,直到所有時間窗被追溯。
在一個實施例中,采用余弦相似性來計算相關性矩陣。
采用本發(fā)明的技術方案,能夠實現較短時間(例如數小時)、細時空粒度(例如1km*1km,每15分鐘)上的污染物溯源。
附圖說明
通過下文結合附圖的詳細描述,本發(fā)明的上述和其它特征將會變得更加明顯,其中:
圖1是示出了根據本發(fā)明的用于污染物溯源的設備的框圖。
圖2是示出了根據本發(fā)明的用于污染物溯源的方法的流程圖。
圖3-6是示出了根據本發(fā)明一個具體示例的數據計算結果的示意圖。
具體實施方式
下面,通過結合附圖對本發(fā)明的具體實施例的描述,本發(fā)明的原理和實現將會變得明顯。應當注意的是,本發(fā)明不應局限于下文所述的具體實施例。另外,為了簡便起見,省略了與本發(fā)明無關的公知技術的詳細描述。
圖1是示出了根據本發(fā)明一個實施例的用于污染物溯源的設備的框圖。如圖1所示,設備10包括獲取單元110、計算單元120和確定單元130。下面,詳細描述設備10中的各個單元的操作。
獲取單元110被配置為獲取監(jiān)測點的監(jiān)測數據,該監(jiān)測數據例如可以是時空數據。在本申請中,“時空數據”是指同時具有時間和空間維度的數據,例如大氣污染監(jiān)測數據、交通流量數據等等。
在一個示例中,對于大氣污染監(jiān)測站點來說,監(jiān)測點的時空數據可以包括6種主要大氣污染物(pm2.5、pm10、so2、no2、co、o3)的濃度及其對應空氣質量指數(iaqi)值。
計算單元120被配置為計算相鄰時間窗之間的所有監(jiān)測點之間的相關性。例如,相關性可以用相關性矩陣來表示,這將在下文詳細描述。需要說明,上述示例僅僅是“相關性”的示例表示。本領域的技術人員可以理解,也可以采用其他方式來表示監(jiān)測點之間的相關性。
確定單元130被配置為找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。從而,最終確定污染源頭。
下面,以相關性矩陣作為監(jiān)測點之間的相關性的示例,描述圖1所示的設備10的操作。
在本實施例中,用相關性矩陣來表示監(jiān)測點之間的相關性。如上所述,獲取單元110獲取多個監(jiān)測點的監(jiān)測數據。就大氣污染監(jiān)測站點來說,獲取單元110可以獲取6種主要大氣污染物(pm2.5,pm10,so2,no2,co,o3)的濃度及其對應空氣質量指數(iaqi)值。
計算單元120設定時間窗和時間間隔,并計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。在一個示例中,計算單元120計算污染濃度向量以及污染濃度矩陣,以及根據污染濃度向量以及污染濃度矩陣來計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。
具體地,計算單元120首先將所有監(jiān)測點的污染物濃度在t時刻映射為一個n維向量
然后,計算單元120設定時間窗itv,其由以t時刻為終點時刻的m個時間間隔構成。第i個監(jiān)測點的污染物濃度在時間窗itv里可表示為:
相應地,時間窗itv內n個監(jiān)測點在m個間隔(即m+1個時刻)的n*(m+1)維污染物濃度矩陣politv(t)可表示為:
即
接下來,計算單元120計算以目標時刻t為終點時刻的時間窗與以上一時刻(t-1)為終點時刻的時間窗的所有監(jiān)測點之間的相關性,得到相關性矩陣cov(t):
優(yōu)選地,計算單元120可以采用余弦相似性來計算相關性矩陣。假設設向量a=(a1,a2,...,an),b=(b1,b2,...,bn),則a和b的余弦相似性為:
確定單元130根據相關性矩陣中的數值大小,找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。例如,確定單元130可以設定最相關的監(jiān)測點對的個數為n,其中n為大于1的正整數。然后,根據相關性矩陣中的數值大小,找出目標時刻的n個最相關的監(jiān)測點對。即,找出目標時間窗(即以目標時刻為終點時刻的時間窗)的相關性矩陣cov(t)中相關值最大的前n對監(jiān)測點,每對監(jiān)測點中,對應較早時刻的監(jiān)測點為另一監(jiān)測點污染物的源頭。例如,監(jiān)測點a和b監(jiān)測點間的相關值較大,在該對監(jiān)測點中,監(jiān)測點b對應時刻t-1早于監(jiān)測點a的時刻t,則監(jiān)測點b為監(jiān)測點a處污染的源頭。
接下來,確定單元130依次向前移動時間窗以找出前一時刻的n個最相關的監(jiān)測點對,直到所有時間窗被追溯。即,找到在前一時間窗的相關矩陣cov(t-1)中與其相關值最大的n對監(jiān)測點,再以找到的監(jiān)測點為目標,迭代執(zhí)行直至所有時間窗被追溯完成,從而找到目標時刻污染的最終源頭。
下面,以一個具體示例來詳細說明本實施例中的設備10的操作。
假設獲取單元110獲取1號至5號監(jiān)測站點2014年7月1日15:00-21:00(共6小時)的so2濃度數據。
計算單元120設定時間窗長度為150分鐘,每個時間窗包含5個時間間隔,每個間隔長度為30分鐘,因而包含6個時刻:t,t-1,t-2,t-3,t-4,t-5。這樣,2014年7月1日15:00-21:00(共6小時)共有8個時間窗,如圖3所示。
在本示例中,計算單元120計算得到目標時刻t(即2014年7月1日21:00)的污染物濃度向量為polt=(aqi1t,......,aqi5t)=(18.757,14.581,18.228,11.083,12.153)。
計算單元120計算以目標時刻t(即2014年7月1日21:00)為終點時刻的時間窗內所有監(jiān)測點的污染物濃度矩陣politv(t),如圖4所示。以第1個監(jiān)測點為例,其在該時間窗內的污染物濃度向量為:
計算單元120計算以時刻t-1(即2014年7月1日20:30)為終點時刻的時間窗內所有監(jiān)測點的污染物濃度矩陣politv(t-1),如圖5所示。
計算單元120計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。例如,圖6示出了以目標時刻t(2014.7.121:00)為終點時刻的時間窗與以其上一時刻t-1(2014.7.120:30)為終點時刻的時間窗之間的所有監(jiān)測點之間的相關性矩陣cov(t)。以監(jiān)測點1和2為例,根據矩陣politv(t),politv(t-1)計算得到:
則t時刻監(jiān)測點1與t-1時刻監(jiān)測點2的相關性為:
確定單元130根據相關性矩陣中數值大小,迭代計算出前一時刻的n個最相關監(jiān)測點,最終確定污染源頭。例如,本示例中可以設置n=3。
確定單元130確定目標時刻t的相關性矩陣cov(t)中相關值最大的前3對監(jiān)測點為:1->4,2->4,3->4。其中,又以3->4的相關性值最大(0.992637),這表明監(jiān)測點3為監(jiān)測點4的源頭的可能性最大。
接著,確定單元130以監(jiān)測點3為目標,找到cov(t-1)中監(jiān)測點3與t-2時刻的所有監(jiān)測點相關性最大的3對監(jiān)測點。依次類推,確定單元130得到3->2->4->5->2->1->3->4。則,確定單元130最終確定目標時刻t的污染源的位置位于監(jiān)測點3。
采用本發(fā)明的技術方案,能夠實現較短時間(例如數小時)、細時空粒度(例如1km*1km,每15分鐘)上的污染物溯源。
圖2是示出了根據本發(fā)明一個實施例的用于污染物溯源的方法的流程圖。如圖2所示,方法20在步驟s210處開始。
在步驟s220,獲取監(jiān)測點的監(jiān)測數據。例如,該監(jiān)測數據可以包括大氣污染監(jiān)測數據或交通數據。
在步驟s230,計算相鄰時間窗之間的所有監(jiān)測點之間的相關性。
例如,可以設定時間窗和時間間隔,并計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。優(yōu)選地,計算污染濃度向量以及污染濃度矩陣,以及根據污染濃度向量以及污染濃度矩陣,計算所有相鄰時間窗之間的所有監(jiān)測點間的相關性矩陣。可以采用余弦相似性來計算相關性矩陣。
在步驟s240,找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
例如,可以根據相關性矩陣中的數值大小,找出目標時刻的最相關的監(jiān)測點對,并且依次向前移動時間窗以找出前一時刻的最相關的監(jiān)測點對,直到所有時間窗被追溯。
最后,方法20在步驟s250處結束。
應該理解,本發(fā)明的上述實施例可以通過軟件、硬件或者軟件和硬件兩者的結合來實現。例如,上述實施例中的系統(tǒng)內的各種組件可以通過多種器件來實現,這些器件包括但不限于:模擬電路、數字電路、通用處理器、數字信號處理(dsp)電路、可編程處理器、專用集成電路(asic)、現場可編程門陣列(fpga)、可編程邏輯器件(cpld),等等。
另外,本領域的技術人員可以理解,本發(fā)明實施例中描述的初始參數可以存儲在本地數據庫中,也可以存儲在分布式數據庫中或者可以存儲在遠程數據庫中。
此外,這里所公開的本發(fā)明的實施例可以在計算機程序產品上實現。更具體地,該計算機程序產品是如下的一種產品:具有計算機可讀介質,計算機可讀介質上編碼有計算機程序邏輯,當在計算設備上執(zhí)行時,該計算機程序邏輯提供相關的操作以實現本發(fā)明的上述技術方案。當在計算系統(tǒng)的至少一個處理器上執(zhí)行時,計算機程序邏輯使得處理器執(zhí)行本發(fā)明實施例所述的操作(方法)。本發(fā)明的這種設置典型地提供為設置或編碼在例如光介質(例如cd-rom)、軟盤或硬盤等的計算機可讀介質上的軟件、代碼和/或其他數據結構、或者諸如一個或多個rom或ram或prom芯片上的固 件或微代碼的其他介質、或一個或多個模塊中的可下載的軟件圖像、共享數據庫等。軟件或固件或這種配置可安裝在計算設備上,以使得計算設備中的一個或多個處理器執(zhí)行本發(fā)明實施例所描述的技術方案。
盡管以上已經結合本發(fā)明的優(yōu)選實施例示出了本發(fā)明,但是本領域的技術人員將會理解,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明進行各種修改、替換和改變。因此,本發(fā)明不應由上述實施例來限定,而應由所附權利要求及其等價物來限定。