專利名稱:一種眾源位置簽到數(shù)據(jù)質(zhì)量分析方法
技術(shù)領(lǐng)域:
本發(fā)明涉及測(cè)繪技術(shù)領(lǐng)域,尤其涉及一種眾源位置簽到數(shù)據(jù)質(zhì)量分析方法。
背景技術(shù):
隨著Web2.0技術(shù)的日益成熟和普及,LBS (Location Based Service,基于位置服務(wù))成為了當(dāng)下發(fā)展最為迅猛的科技應(yīng)用之一?;谖恢玫姆?wù)是當(dāng)今發(fā)展比較成熟、普及程度較高的地理位置服務(wù)業(yè)務(wù)。隨著LBS的快速發(fā)展,其對(duì)位置信息數(shù)量以及時(shí)效性的要求也越來(lái)越高。POI (Point Of Interest,興趣點(diǎn))作為當(dāng)前位置信息的重要載體,已被廣泛應(yīng)用于車載導(dǎo)航系統(tǒng)等LBS應(yīng)用中,POI數(shù)據(jù)的實(shí)時(shí)性、數(shù)據(jù)來(lái)源的可靠性和廣泛性直接影響著LBS業(yè)務(wù)的發(fā)展,POI的質(zhì)量在一定程度上決定了位置服務(wù)的質(zhì)量。傳統(tǒng)POI更新主要依靠人工現(xiàn)場(chǎng)采集后入庫(kù)的方法,與其他類型GIS數(shù)據(jù)一樣主要通過專業(yè)測(cè)繪部門采集管理,不僅費(fèi)時(shí)費(fèi)力、效率低下,其現(xiàn)勢(shì)性也已無(wú)法滿足位置服務(wù)和行業(yè)GIS應(yīng)用的整體需求。位置簽到數(shù)據(jù)來(lái)自大量用戶帶有GPS定位功能的智能移動(dòng)終端上傳的信息,具有數(shù)據(jù)量大、現(xiàn)勢(shì)性高、具有社會(huì)化屬性等特點(diǎn),使其成為實(shí)現(xiàn)POI高效高質(zhì)更新的一種潛在可用數(shù)據(jù)源。眾源位置數(shù)據(jù)由用戶參自愿上傳,用戶參與程度較高,其數(shù)據(jù)容量以及數(shù)據(jù)時(shí)效性是傳統(tǒng)采集方式得到的數(shù)據(jù)所難以比擬的,而這也正是POI更新亟待解決的問題,但是由于上傳數(shù)據(jù)的用戶缺乏測(cè)繪及Gis相關(guān)背景和知識(shí),加之智能手機(jī)等移動(dòng)客戶端定位精度有限,使得眾源位置簽到數(shù)據(jù)的質(zhì)量無(wú)法與傳統(tǒng)的POI采集方式相比擬,因此要想利用眾源位置簽到數(shù)據(jù)實(shí)現(xiàn)POI的快速更新,就要實(shí)現(xiàn)對(duì)眾源位置數(shù)據(jù)的質(zhì)量進(jìn)行分析,但目前尚未有較為完善的眾源位置數(shù)據(jù)的質(zhì)量分析方法。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種眾源位置簽到數(shù)據(jù)質(zhì)量分析的方法模型與質(zhì)量指標(biāo),從而滿足利用眾源簽到數(shù)據(jù)進(jìn)行便捷、快速、高效的進(jìn)行POI更新的社會(huì)及LBS等行業(yè)需求。本發(fā)明的技術(shù)方案為一種眾源位置簽到數(shù)據(jù)質(zhì)量分析的方法,其特征在于,包括以下步驟:步驟1:進(jìn)行眾源位置簽到數(shù)據(jù)預(yù)處理;步驟2:進(jìn)行所述的眾源位置簽到數(shù)據(jù)地理配準(zhǔn)并進(jìn)行整體定位精度評(píng)定;步驟3:進(jìn)行所述的眾源位置簽到數(shù)據(jù)匹配建模;步驟4:進(jìn)行所述的眾源位置簽到數(shù)據(jù)的類別精度評(píng)定;步驟5:進(jìn)行所述的眾源位置簽到數(shù)據(jù)的定位精度評(píng)定。作為優(yōu)選,所述的步驟I進(jìn)一步包括以下子步驟:步驟1.1:根據(jù)標(biāo)準(zhǔn)興趣點(diǎn)數(shù)據(jù)的覆蓋范圍對(duì)所述的眾源簽到數(shù)據(jù)進(jìn)行裁剪;步驟1.2:去除簽到次數(shù)未達(dá)到閾值的所述的眾源位置簽到數(shù)據(jù);步驟1.3:去除屬性信息不完整的所述的眾源位置簽到數(shù)據(jù);
步驟1.4:對(duì)重復(fù)的所述的眾源位置簽到數(shù)據(jù)進(jìn)行合并處理;
步驟1.5:對(duì)所述的眾源位置簽到數(shù)據(jù)根據(jù)其屬性進(jìn)行分類整理。
作為優(yōu)選,所述的步驟2進(jìn)一步包括以下子步驟:
步驟2.1:將所述的位置簽到數(shù)據(jù)、標(biāo)準(zhǔn)POI數(shù)據(jù)與底圖統(tǒng)一坐標(biāo)系;
步驟2.2:提取出名稱屬性完全匹配的所述的位置簽到數(shù)據(jù)和POI數(shù)據(jù)庫(kù)中對(duì)應(yīng)POI數(shù)據(jù),得到數(shù)據(jù)點(diǎn)對(duì)集;
步驟2.3:根據(jù)所述的數(shù)據(jù)點(diǎn)對(duì)集,采用RANSAC算法對(duì)所述的位置簽到數(shù)據(jù)和對(duì)應(yīng)POI數(shù)據(jù)的仿射變換關(guān)系模型進(jìn)行估算,迭代出最優(yōu)模型參數(shù);
步驟2.4:利用仿射變換參數(shù)對(duì)所述的位置簽到數(shù)據(jù)進(jìn)行整體地理配準(zhǔn);
步驟2.5:利用配準(zhǔn)前后所述的位置簽到數(shù)據(jù)與對(duì)應(yīng)POI的距離偏差均值和標(biāo)準(zhǔn)差作為整體定位精度評(píng)定的參數(shù)。
作為優(yōu)選,所述的步驟3進(jìn)一步包括以下子步驟:
步驟3.1:將所述的位置簽到數(shù)據(jù)進(jìn)行空間匹配,獲取空間匹配度;
步驟3.2:對(duì)空間匹配失敗的眾源位置簽到數(shù)據(jù)進(jìn)行屬性匹配,獲得所述的失敗簽到數(shù)據(jù)指標(biāo)和屬性匹配度。
作為優(yōu)選,所述的步驟4進(jìn)一步包括以下子步驟
步驟4.1:對(duì)空間匹配成功的眾源位置簽到數(shù)據(jù)與其對(duì)應(yīng)的標(biāo)準(zhǔn)POI數(shù)據(jù)進(jìn)行類別比較;
步驟4.2:計(jì)算出各類別的類別匹配精度。
作為優(yōu)選,所述的步驟5進(jìn)一步包括以下子步驟:
步驟5.1:利用空間匹配成功的眾源位置簽到數(shù)據(jù),根據(jù)類別劃分結(jié)果,計(jì)算出類別定位精度;
步驟5.2:利用屬性匹配成功的眾源位置簽到數(shù)據(jù),計(jì)算出定位偏差均值以及類內(nèi)定位偏差均值,從而進(jìn)一步求解出整體定位精度的誤差極大值,以及類內(nèi)定位偏差的極大值。
本發(fā)明具有的優(yōu)點(diǎn)和積極效果為:本發(fā)明給出了較為詳盡的眾源位置簽到數(shù)據(jù)質(zhì)量分析的方法、過程及標(biāo)準(zhǔn),為突破POI原有的人工實(shí)地考察而采用眾源位置簽到數(shù)據(jù)實(shí)現(xiàn)便捷、快速、高效的POI更新奠定了基礎(chǔ),以便解決POI獲取無(wú)法滿足社會(huì)及LBS等行業(yè)領(lǐng)域需求的問題。
圖1是本發(fā)明的實(shí)施例流程圖。
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例詳細(xì)說明本發(fā)明技術(shù)方案。
本發(fā)明以當(dāng)前用戶參與數(shù)眾多的社交網(wǎng)絡(luò)為數(shù)據(jù)平臺(tái),提出了一種針對(duì)眾源位置簽到數(shù)據(jù)質(zhì)量的分析方法。
請(qǐng)見圖1,本實(shí)施例的流程具體包括以下步驟:
步驟1:進(jìn)行眾源位置簽到數(shù)據(jù)預(yù)處理;
該步驟進(jìn)一步包括以下子步驟:步驟1.1:根據(jù)標(biāo)準(zhǔn)POI數(shù)據(jù)的覆蓋范圍對(duì)眾源簽到數(shù)據(jù)進(jìn)行裁剪,去除掉標(biāo)準(zhǔn)POI覆蓋區(qū)域范圍外的眾源位置簽到數(shù)據(jù);步驟1.2:對(duì)眾源位置簽到數(shù)據(jù)設(shè)置簽到次數(shù)的閾值,去除簽到次數(shù)未達(dá)到閾值的眾源位置簽到數(shù)據(jù),以篩選剔除一部分沒有意義或者簽到次數(shù)很少,關(guān)注度低的數(shù)據(jù)。當(dāng)然,在具體實(shí)施時(shí),本領(lǐng)域技術(shù)人員可以預(yù)設(shè)簽到次數(shù)的閾值,執(zhí)行流程時(shí)自動(dòng)導(dǎo)入;步驟1.3:檢查眾源位置簽到數(shù)據(jù)的屬性信息(如名稱,地理坐標(biāo),簽到人數(shù)等),信息是否齊全,去除屬性信息不完整的所述的眾源位置簽到數(shù)據(jù);因?yàn)榭赡苡腥笔У男畔?,可以預(yù)先建立一個(gè)標(biāo)準(zhǔn)格式來(lái)篩選出有效的眾源位置簽到數(shù)據(jù),并且對(duì)需要進(jìn)行保留的眾源位置簽到數(shù)據(jù)按照標(biāo)準(zhǔn)格式進(jìn)行修改;步驟1.4:對(duì)大量的重復(fù)位置簽到數(shù)據(jù)進(jìn)行數(shù)據(jù)合并處理,利用POI數(shù)據(jù)字典與位置簽到數(shù)據(jù)進(jìn)行比對(duì)識(shí)別,將對(duì)應(yīng)于同一地理目標(biāo)的不同別名、俗稱與標(biāo)準(zhǔn)名稱進(jìn)行合并,以降低數(shù)據(jù)的冗余度;步驟1.5:對(duì)眾源位置簽到數(shù)據(jù)根據(jù)其屬性進(jìn)行分類整理,完善簽到數(shù)據(jù)的分類信息,根據(jù)整體情況確定類別數(shù)目以及每個(gè)類別所含眾源位置簽到數(shù)據(jù)的最小值,對(duì)于不滿足要求的眾源位置簽到數(shù)據(jù)進(jìn)行類別歸并處理。步驟2:進(jìn)行眾源位置簽到數(shù)據(jù)地理配準(zhǔn)并進(jìn)行整體定位精度評(píng)定;該步驟進(jìn)一步包括以下子步驟:步驟2.1:將眾源位置簽到數(shù)據(jù)、標(biāo)準(zhǔn)POI數(shù)據(jù)與底圖統(tǒng)一坐標(biāo)系;步驟2.2:將眾源位置簽到數(shù)據(jù)與已有POI數(shù)據(jù)庫(kù)按名稱屬性進(jìn)行連接,提取出名稱屬性完全匹配的眾源位置簽到數(shù)據(jù)和對(duì)應(yīng)POI數(shù)據(jù);步驟2.3:采用RANSAC算法對(duì)眾源位置簽到數(shù)據(jù)和對(duì)應(yīng)POI數(shù)據(jù)的仿射變換關(guān)系模型進(jìn)行估算,迭代出最優(yōu)模型參數(shù);RANSAC算法為現(xiàn)有技術(shù),為便于實(shí)施參考起見,現(xiàn)將實(shí)現(xiàn)過程簡(jiǎn)要說明如下:預(yù)設(shè)迭代次數(shù)閾值N、內(nèi)點(diǎn)判斷參數(shù)diserror的閾值D,以及最少內(nèi)點(diǎn)數(shù)閾值Z ;將所有名稱屬性完全匹配的眾源位置簽到數(shù)據(jù)和對(duì)應(yīng)POI數(shù)據(jù)作為點(diǎn)對(duì)樣本,得到數(shù)據(jù)點(diǎn)對(duì)集S;①?gòu)狞c(diǎn)對(duì)集S中隨機(jī)選取4個(gè)點(diǎn)對(duì)樣本,加入內(nèi)點(diǎn)集Si (i=l,2,3……,N,表示當(dāng)前的迭代次數(shù))。構(gòu)建仿射變換模型M:X=a0+a1x/ +a2y' , Y=b0+b1x/ +b2y',其中,%、%、%、V Vb2S仿射變換模型參數(shù),X’,γ,為眾源位置簽到數(shù)據(jù)的坐標(biāo)值,X、Y為眾源位置簽到數(shù)據(jù)經(jīng)仿射變換轉(zhuǎn)換后得到的坐標(biāo)值。本方法采用仿射變換公式作為模型,求解6個(gè)參數(shù)至少需要4個(gè)點(diǎn)對(duì)。根據(jù)這4個(gè)點(diǎn)對(duì)樣本的坐標(biāo)值,利用間接平差初始化仿射變換模型M,8個(gè)方程可以求解出6個(gè)未知的仿射變換模型參數(shù),并得到擬合精度誤差,將初始化所得模型設(shè)為最優(yōu)模型,初始化所得擬合精度誤差設(shè)為最小誤差minerror ;
②從數(shù)據(jù)點(diǎn)對(duì)集S中繼續(xù)隨機(jī)取出點(diǎn)對(duì)樣本,如果點(diǎn)對(duì)樣本的內(nèi)點(diǎn)判斷參數(shù)diserror小于閾值D,將該點(diǎn)對(duì)樣本加入符合當(dāng)前模型的內(nèi)點(diǎn)集Si (i=l, 2,3......, N,表示當(dāng)前的迭代次數(shù))。
內(nèi)點(diǎn)條件閾值diserror具體確定公式為:
權(quán)利要求
1.一種眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于,包括以下步驟: 步驟1:進(jìn)行眾源位置簽到數(shù)據(jù)預(yù)處理; 步驟2:進(jìn)行所述的眾源位置簽到數(shù)據(jù)地理配準(zhǔn)并進(jìn)行整體定位精度評(píng)定; 步驟3:進(jìn)行所述的眾源位置簽到數(shù)據(jù)匹配建模; 步驟4:進(jìn)行所述的眾源位置簽到數(shù)據(jù)的類別精度評(píng)定; 步驟5:進(jìn)行所述的眾源位置簽到數(shù)據(jù)的定位精度評(píng)定。
2.根據(jù)權(quán)利要求1所述的眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于:所述的步驟I進(jìn)一步包括以下子步驟: 步驟1.1:根據(jù)標(biāo)準(zhǔn)興趣點(diǎn)數(shù)據(jù)的覆蓋范圍對(duì)所述的眾源簽到數(shù)據(jù)進(jìn)行裁剪; 步驟1.2:去除簽到次數(shù)未達(dá)到閾值的所述的眾源位置簽到數(shù)據(jù); 步驟1.3:去除屬性信息不完整的所述的眾源位置簽到數(shù)據(jù); 步驟1.4:對(duì)重復(fù)的所述的眾源位置簽到數(shù)據(jù)進(jìn)行合并處理; 步驟1.5:對(duì)所述的眾源位置簽到數(shù)據(jù)根據(jù)其屬性進(jìn)行分類整理。
3.根據(jù)權(quán)利要求1所述的眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于:所述的步驟2進(jìn)一步包括以下子步驟: 步驟2.1:將所述的位置簽到數(shù)據(jù)、標(biāo)準(zhǔn)興趣點(diǎn)數(shù)據(jù)與底圖統(tǒng)一坐標(biāo)系; 步驟2.2:提取出名稱屬性完全匹配的所述的位置簽到數(shù)據(jù)和興趣點(diǎn)數(shù)據(jù)庫(kù)中對(duì)應(yīng)興趣點(diǎn)數(shù)據(jù),得到數(shù)據(jù)點(diǎn)對(duì)集; 步驟2.3:根據(jù)所述的數(shù)據(jù)點(diǎn)對(duì)集,采用RANSAC算法對(duì)所述的位置簽到數(shù)據(jù)和對(duì)應(yīng)興趣點(diǎn)數(shù)據(jù)的仿射變換關(guān)系模型進(jìn)行估算,迭代出最優(yōu)模型參數(shù); 步驟2.4:利用仿射變換參數(shù)對(duì)所述的位置簽到數(shù)據(jù)進(jìn)行整體地理配準(zhǔn); 步驟2.5:利用配準(zhǔn)前后所述的位置簽到數(shù)據(jù)與對(duì)應(yīng)興趣點(diǎn)的距離偏差均值和標(biāo)準(zhǔn)差作為整體定位精度評(píng)定的參數(shù)。
4.根據(jù)權(quán)利要求1所述的眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于:所述的步驟3進(jìn)一步包括以下子步驟: 步驟3.1:將所述的位置簽到數(shù)據(jù)進(jìn)行空間匹配,獲取空間匹配度; 步驟3.2:對(duì)空間匹配失敗的眾源位置簽到數(shù)據(jù)進(jìn)行屬性匹配,獲得所述的失敗簽到數(shù)據(jù)指標(biāo)和屬性匹配度。
5.根據(jù)權(quán)利要求1所述的眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于:所述的步驟4進(jìn)一步包括以下子步驟 步驟4.1:對(duì)空間匹配成功的眾源位置簽到數(shù)據(jù)與其對(duì)應(yīng)的標(biāo)準(zhǔn)興趣點(diǎn)數(shù)據(jù)進(jìn)行類別比較; 步驟4.2:計(jì)算出各類別的類別匹配精度。
6.根據(jù)權(quán)利要求1所述的眾源位置簽到數(shù)據(jù)質(zhì)量分析方法,其特征在于:所述的步驟5進(jìn)一步包括以下子步驟: 步驟5.1:利用空間匹配成功的眾源位置簽到數(shù)據(jù),根據(jù)類別劃分結(jié)果,計(jì)算出類別定位精度; 步驟5.2:利用屬性匹配成功的眾源位置簽到數(shù)據(jù),計(jì)算出定位偏差均值以及類內(nèi)定位偏差均值,從而進(jìn)一步求解出整體定位精度的誤差極大值,以及類內(nèi)定位偏差的極大值。
全文摘要
本發(fā)明涉及測(cè)繪技術(shù)領(lǐng)域,尤其涉及一種眾源位置簽到數(shù)據(jù)質(zhì)量分析方法。包括以下步驟步驟1進(jìn)行眾源位置簽到數(shù)據(jù)預(yù)處理;步驟2進(jìn)行所述的眾源位置簽到數(shù)據(jù)地理配準(zhǔn)并進(jìn)行整體定位精度評(píng)定;步驟3進(jìn)行所述的眾源位置簽到數(shù)據(jù)匹配建模;步驟4進(jìn)行所述的眾源位置簽到數(shù)據(jù)的類別精度評(píng)定;步驟5進(jìn)行所述的眾源位置簽到數(shù)據(jù)的定位精度評(píng)定。本發(fā)明給出了較為詳盡的眾源位置簽到數(shù)據(jù)質(zhì)量分析的方法、過程及標(biāo)準(zhǔn),為突破POI原有的人工實(shí)地考察而采用眾源位置簽到數(shù)據(jù)實(shí)現(xiàn)便捷、快速、高效的POI更新奠定了基礎(chǔ),以便解決POI獲取無(wú)法滿足社會(huì)及LBS等行業(yè)領(lǐng)域需求的問題。
文檔編號(hào)G06F19/00GK103177189SQ201310121309
公開日2013年6月26日 申請(qǐng)日期2013年4月9日 優(yōu)先權(quán)日2013年4月9日
發(fā)明者武紅宇, 曹勁舟 申請(qǐng)人:武漢大學(xué)