本發(fā)明涉及技術(shù)ip定位技術(shù)領(lǐng)域,具體地,涉及一種面向動(dòng)態(tài)ip多區(qū)域性分布的地理位置定位方法。
背景技術(shù):
ip定位技術(shù),是通過設(shè)備的ip地址來確定其地理位置。超高精度的ip定位技術(shù)應(yīng)用領(lǐng)域非常廣泛,政府部門,通過該服務(wù)可以對(duì)人民的網(wǎng)絡(luò)行為進(jìn)行社區(qū)粒度的輿情分析,從而充分地了解民意,做出更加利國(guó)利民的政策;安全部門,通過該服務(wù)能夠獲取網(wǎng)絡(luò)攻擊的源目標(biāo)位置,提升網(wǎng)絡(luò)安全防御能力;商業(yè)端的在線支付,通過該服務(wù)可以實(shí)現(xiàn)用戶異地登錄預(yù)警,提升交易的安全性;商業(yè)端的在線廣告,通過該服務(wù)可以實(shí)現(xiàn)基于用戶實(shí)時(shí)位置的廣告推送,提升廣告的投放精確度,獲取最大的商業(yè)盈利。根據(jù)ip的區(qū)域性分布特性,ip可分為動(dòng)態(tài)和靜態(tài)分布兩種狀態(tài)。靜態(tài)ip,在一個(gè)固定時(shí)間段內(nèi),該類ip將固定在一個(gè)地方使用;如,學(xué)校使用的ip,這些ip將長(zhǎng)時(shí)間在學(xué)校范圍內(nèi)使用。動(dòng)態(tài)ip,在一段時(shí)間內(nèi),動(dòng)態(tài)地分布在多個(gè)區(qū)域且被共享使用;如,移動(dòng)ip,在河南省范圍內(nèi)共享使用;住宅用ip,在若干個(gè)相鄰小區(qū)范圍內(nèi)共享使用。
現(xiàn)有的ip定位產(chǎn)品大多是將ip定位到寬泛或具體的地理位置,將ip與經(jīng)緯度做綁定。一般定位精度有定到國(guó)家、省份、城市,甚至是街道。但是這種單點(diǎn)ip定位方式并不能客觀反映一些ip真實(shí)的地理位置。比如:從動(dòng)態(tài)ip的分配使用方面分析可知,移動(dòng)網(wǎng)絡(luò)、住宅用戶、wlan等典型net端口轉(zhuǎn)換的ip,傳統(tǒng)的單點(diǎn)定位方式容易造成定位偏差大,不能客觀地反映多區(qū)域性分布動(dòng)態(tài)ip的真實(shí)位置。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,針對(duì)上述問題,提出一種面向動(dòng)態(tài)ip多區(qū)域性分布的地理位置定位方法,以實(shí)現(xiàn)客觀地反映多區(qū)域性動(dòng)態(tài)ip的真實(shí)地理位置。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種面向動(dòng)態(tài)ip多區(qū)域性分布的地理位置定位方法,主要包括:
步驟1:獲取一段時(shí)間內(nèi)多個(gè)數(shù)據(jù)源的ip位置分布情況信息;
步驟2:將多個(gè)數(shù)據(jù)源的基礎(chǔ)數(shù)據(jù)匯總在一起,統(tǒng)一將經(jīng)緯度轉(zhuǎn)換到國(guó)際坐標(biāo)系下,并對(duì)其進(jìn)行z-score標(biāo)準(zhǔn)化,得到標(biāo)準(zhǔn)化后的數(shù)據(jù);
步驟3:基于步驟2,使用dbscan聚類算法對(duì)ip位置的分布情況信息進(jìn)行聚類,得出ip的真實(shí)分布范圍并定位。
進(jìn)一步地,所述步驟3包括如下步驟:
步驟31:使用dbscan聚類算法對(duì)步驟2中標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行密度聚類;
步驟32:將步驟31中的聚類結(jié)果進(jìn)行整理,對(duì)聚類的基礎(chǔ)數(shù)據(jù)進(jìn)行標(biāo)記,剔除異常點(diǎn);
步驟33:計(jì)算聚類后每個(gè)組的最小外接圓作為該區(qū)域的定位結(jié)果,在地圖上展示結(jié)果。
進(jìn)一步地,所述步驟1中,通過分布式網(wǎng)絡(luò)爬蟲技術(shù)和人工采集的方式,獲取多個(gè)數(shù)據(jù)源的ip位置分布情況信息。
進(jìn)一步地,所述國(guó)際坐標(biāo)系為wgs-84。
本發(fā)明各實(shí)施例的一種面向動(dòng)態(tài)ip多區(qū)域性分布的地理位置定位方法,基于動(dòng)態(tài)ip在一段時(shí)間內(nèi)的歷史分布情況,通過使用dbscan聚類算法進(jìn)行聚類,得出動(dòng)態(tài)ip真實(shí)位置的分布范圍(以圓形描述該覆蓋范圍),并認(rèn)為ip的分布范圍作為動(dòng)態(tài)ip的定位結(jié)果。從而可以克服現(xiàn)有技術(shù)中ip定位產(chǎn)品使用單點(diǎn)ip定位方式造成的不準(zhǔn)確性;單點(diǎn)ip定位方式的定位精度有定到國(guó)家、省份、城市,甚至是街道。但是這種單點(diǎn)ip定位方式并不能客觀地反映多區(qū)域性動(dòng)態(tài)ip的真實(shí)地理位置。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。
下面通過附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
附圖說明
附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中:
圖1為本發(fā)明具體實(shí)施例所述的動(dòng)態(tài)ip多區(qū)域性的分布圖;
圖2為本發(fā)明具體實(shí)施例所述的dbscan聚類算法的效果圖;
圖3為本發(fā)明具體實(shí)施例所述的動(dòng)態(tài)ip多區(qū)域性分布的定位效果圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
以實(shí)例的形式加入說明。對(duì)于一個(gè)動(dòng)態(tài)ip而言,
1)獲取一段時(shí)間內(nèi)多個(gè)數(shù)據(jù)源(多個(gè)數(shù)據(jù)源,如百度,高德和搜狗等在線地圖)的ip位置分布情況;
該步驟通過分布式網(wǎng)絡(luò)爬蟲技術(shù)和人工采集的方式,獲取多個(gè)來源的ip位置分布情況。
2)數(shù)據(jù)預(yù)處理;
將多個(gè)數(shù)據(jù)源的基礎(chǔ)數(shù)據(jù)(ip位置分布情況)匯總在一起,統(tǒng)一將經(jīng)緯度轉(zhuǎn)換到國(guó)際坐標(biāo)系(wgs-84)下。為消除經(jīng)緯度在數(shù)值上的差異性對(duì)其進(jìn)行z-score標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化后的結(jié)果(如圖1)使之在經(jīng)度和緯度上都看起來像標(biāo)準(zhǔn)正態(tài)分布的數(shù)據(jù),便于對(duì)其進(jìn)行密度聚類。
3)使用dbscan聚類算法(該算法的距離效果如圖2)對(duì)ip位置的分布情況進(jìn)行聚類,得出ip的真實(shí)分布范圍并定位
首先,使用dbscan聚類算法對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行密度聚類;其次,將聚類結(jié)果進(jìn)行整理,對(duì)聚類的基礎(chǔ)數(shù)據(jù)進(jìn)行標(biāo)記,剔除異常點(diǎn)(噪音點(diǎn));最后,計(jì)算聚類后每個(gè)組(類)的最小外接圓作為該區(qū)域的定位結(jié)果,在地圖上將結(jié)果展示(如圖3)。
至少可以達(dá)到以下有益效果:克服了之前所忽略的動(dòng)態(tài)ip多區(qū)域分布特點(diǎn),解決ip定位產(chǎn)品無法對(duì)多區(qū)域分布ip進(jìn)行準(zhǔn)確定位的問題。本放通過聚類算法將這個(gè)特征加以分析,得到動(dòng)態(tài)ip多區(qū)域分布的真實(shí)定位。這樣可以提高定位的信心度。同時(shí),避免縮小動(dòng)態(tài)ip所覆蓋的區(qū)域范圍而造成的定位不準(zhǔn)確。
最后應(yīng)說明的是:以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,對(duì)于本領(lǐng)域的技術(shù)人員來說,其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。