本發(fā)明涉及到信息技術(shù)、智能交通技術(shù)、先進的交通管理與控制技術(shù)、交通基礎(chǔ)信息采集、網(wǎng)頁數(shù)據(jù)挖掘及相關(guān)軟件技術(shù)領(lǐng)域,提出了一種在大數(shù)據(jù)背景下,基于百度地圖開發(fā)的可以使出行者快速知曉目的地區(qū)域停車難易程度的方法。
背景技術(shù):
土地利用信息是城市規(guī)劃、交通規(guī)劃、交通出行需求預(yù)測以及停車需求預(yù)測不可或缺的基礎(chǔ)數(shù)據(jù)。傳統(tǒng)土地利用信息獲取主要采用查閱規(guī)劃數(shù)據(jù)檔案或者人工實地調(diào)查與測量的方法,往往耗費大量的人力、物力、財力和時間。隨著GPS、遙感衛(wèi)星圖像、地理信息系統(tǒng)技術(shù)和無人機航拍等方法日漸成熟,土地利用信息獲取的精度和效率逐漸提高,獲取方式也逐漸多元化。但是,以上方法還是需要消耗大量資源才能完成信息獲取工作,成本高昂。近年來,隨著我國城市化發(fā)展進程的加快,城市土地開發(fā)和利用情況的變化也隨之加快,如何獲取及時和準確的土地利用信息成為政府、企業(yè)界以及學術(shù)界的共同難題。大數(shù)據(jù)背景下,各種數(shù)據(jù)資源越來越豐富,開放性也越來越強,數(shù)據(jù)挖掘與分析技術(shù)的發(fā)展使得突破這一難題成為可能。
百度地圖提供豐富的興趣點(Point of Interest,簡稱POI)數(shù)據(jù)信息,這些興趣點包括居民小區(qū)、辦公樓、商業(yè)、醫(yī)院、學校、餐飲、娛樂等數(shù)十類土地利用、建筑設(shè)施、以及各類工商企業(yè)機構(gòu)。倘若能夠利用網(wǎng)頁數(shù)據(jù)挖掘技術(shù),進一步挖掘與這些POI相對應(yīng)且更詳盡的信息,包括其位置、規(guī)模、人員數(shù)量、建筑面積、土地利用甚至經(jīng)營情況等等,就可以利用這些POI數(shù)據(jù)信息和科學的預(yù)測方法,對指定區(qū)域的停車需求進行準確預(yù)測。
目前,將網(wǎng)頁數(shù)據(jù)挖掘技術(shù)應(yīng)用于獲取地理信息的研究取得了一定進展。例如Wu Y和Niu Z在文獻[Wu A Y,Niu Z.Extending a geocoding database by Web information extraction[J].Proceedings of SPIE-The International Society for Optical Engineering,2008.]中介紹了如何提取Web文檔的地理信息來擴展地理編碼數(shù)據(jù)庫,以提供更好的本地網(wǎng)絡(luò)搜索服務(wù)。Sagara等人在文獻[Sagara T,Kitsuregawa M.Yellow page driven methods of collecting and scoring spatial Web documents[C]//Workshop on Geographic Information Retrieval SIGIR.2004:4-8.]中建立了一個可以提取網(wǎng)頁內(nèi)容中的地理信息的系統(tǒng)。Woodruff和Plaunt在文獻[Woodruff A,Plaunt C.GIPSY:Automated geographic indexing of text documents[J].JASIS,1994,45(9):645-655.]中開發(fā)了地理參考信息處理系統(tǒng)(GIPSY),可以從網(wǎng)頁文本信息中自動提取地理位置的坐標檢索關(guān)鍵詞,以支持地理參考信息的文件索引和檢索。但是,通過文獻和專利檢索我們發(fā)現(xiàn),將網(wǎng)頁數(shù)據(jù)挖掘技術(shù)應(yīng)用于獲取精細化POI信息方面的研究和應(yīng)用技術(shù)還比較匱乏,而將精細化的POI信息應(yīng)用來預(yù)測區(qū)域停車需求,并進一步計算區(qū)域停車難易指數(shù)的技術(shù)還沒有先例。當前的停車需求預(yù)測主要基于土地的利用類型以及不同利用類型的土地面積、建筑面積、城市的機動車擁有量、停車吸引率以及停車位的供應(yīng)、價格和位置、城市的人口及就業(yè)情況,包括城市的人口數(shù)、戶數(shù)及就業(yè)崗位數(shù)、單位雇員數(shù)等數(shù)據(jù)進行預(yù)測,而數(shù)據(jù)的有效性和時效性一直存在較大的問題。
基于上述精細化POI信息的重要性以及現(xiàn)有停車需求預(yù)測技術(shù)的不足之處,本發(fā)明從百度地圖API開發(fā)著手,利用網(wǎng)頁數(shù)據(jù)挖掘技術(shù),開發(fā)出一種大數(shù)據(jù)背景下快速有效獲取城市土地利用信息數(shù)據(jù),并將其應(yīng)用于停車難易程度指數(shù)計算的方法,以實現(xiàn)兩個主要目的:1)發(fā)明區(qū)域停車難易指數(shù)這一重要指標,為駕駛員提供出行決策參考;2)通過利用百度地圖API和網(wǎng)頁數(shù)據(jù)挖掘,提升停車需求預(yù)測的精度和區(qū)域停車難易指數(shù)的精度。
技術(shù)實現(xiàn)要素:
本發(fā)明提出了一種在大數(shù)據(jù)背景下,將Web數(shù)據(jù)挖掘技術(shù)獲取的互聯(lián)網(wǎng)中準確、精細化的土地利用信息應(yīng)用于計算區(qū)域停車難易指數(shù),并依據(jù)區(qū)域停車難易指數(shù)繪制區(qū)域停車難易程度地圖,直觀表征區(qū)域停車難易程度的新方法。本發(fā)明的技術(shù)路線如圖1所示。
本發(fā)明的技術(shù)方案:
基于百度地圖開放數(shù)據(jù)與Web數(shù)據(jù)挖掘的區(qū)域停車難易指數(shù)的分析方法,步驟如下:
步驟一:土地利用信息挖掘
1)挖掘POI信息
在百度地圖開放平臺基礎(chǔ)上,進一步開發(fā)獲取POI信息,包括名稱、類別、地址、經(jīng)度、緯度和UID六部分;
2)挖掘POI對應(yīng)的詳細土地利用信息
步驟1)挖掘得到的UID為其對應(yīng)的POI的ID,是唯一的;在每個UID的前后添加網(wǎng)址,獲得原始網(wǎng)址,即可抵達百度地圖詳細信息頁面;將所有原始網(wǎng)址導(dǎo)入網(wǎng)頁數(shù)據(jù)采集器,通過數(shù)據(jù)采集器對原始網(wǎng)址進一步挖掘,得到挖掘POI對應(yīng)的詳細土地利用信息;
3)POI信息與對應(yīng)的詳細土地利用信息匹配
POI信息與對應(yīng)的詳細土地利用信息不一一對應(yīng),依據(jù)步驟2)中原始網(wǎng)址和POI名稱,將POI信息與對應(yīng)的詳細土地利用信息進行匹配,為區(qū)域停車難易指數(shù)計算提供基礎(chǔ)數(shù)據(jù);
步驟二:區(qū)域停車需求建模
綜合利用已有模型的優(yōu)點,在停車生成率模型和多因素的停車需求分析預(yù)測模型的基礎(chǔ)上,兼顧相關(guān)分析法,研究用地與交通影響分析模型,通過多元線性回歸方法確定各區(qū)域及其功能小區(qū)不同類型用地間相互作用后的動態(tài)發(fā)生率,在土地利用—停車需求模型基礎(chǔ)上,建立適用于精細化土地利用信息的區(qū)域停車需求模型為區(qū)域停車指數(shù)的計算提供基礎(chǔ),公式如下:
其中:Rij是i類用地屬性j區(qū)域停車需求;Bij是第i區(qū)j類性質(zhì)用地單位停車需求數(shù)量,即停車產(chǎn)生率,通過查閱相關(guān)城市規(guī)劃標準與準則得到;Lij是第i區(qū)j類性質(zhì)用地數(shù)量(建筑面積、土地面積),通過步驟一挖掘得到;Aij是第i區(qū)j類性質(zhì)用地單位雇員停車需求數(shù)量,即停車產(chǎn)生率,通過查閱相關(guān)城市規(guī)劃標準與準則得到;Rij是第i區(qū)j類性質(zhì)用地數(shù)量(營業(yè)額、戶數(shù)、單位雇員數(shù)或就業(yè)崗位),通過步驟一挖掘得到;kij為修正系數(shù),由計算并通過現(xiàn)有數(shù)據(jù)進行校正得到。
步驟三:區(qū)域停車供給分析
通過相關(guān)部門的數(shù)據(jù)資料庫、走訪調(diào)查、問卷調(diào)查和實地調(diào)查等多方式結(jié)合的方法獲取路內(nèi)停車、路外停車設(shè)施(包括建筑物配建停車場、社會公共停車場及路內(nèi)停車位)的現(xiàn)狀基礎(chǔ)數(shù)據(jù)及使用情況,得到區(qū)域停車供給Sij。
步驟四:區(qū)域停車難易指數(shù)的計算與制圖
根據(jù)區(qū)域停車需求、區(qū)域停車供給、停車周轉(zhuǎn)及停車特征等數(shù)據(jù)特點,定義區(qū)域停車難易指數(shù)并建立計算模型,公式如下:
其中:Pij是i類用地屬性j區(qū)域停車指數(shù)值;Rij是i類用地屬性j區(qū)域停車需求,由步驟二得到;Sij是i類用地屬性j區(qū)域停車供給,由步驟三得到;Zi是i類用地屬性停車周轉(zhuǎn)率,通過調(diào)查或查找相關(guān)部門資料庫得到;K1i是i類用地屬性停車周轉(zhuǎn)率修正系數(shù),由計算并通過現(xiàn)有數(shù)據(jù)校正得到;K2i是i類用地屬性停車指數(shù)值修正系數(shù),由計算并通過現(xiàn)有數(shù)據(jù)校正得到。
步驟五:區(qū)域停車難易程度地圖繪制
將步驟四得到的停車難易指數(shù)按數(shù)值分級,繪制區(qū)域停車難易程度地圖,用不同顏色表示不同的區(qū)域停車難易程度。
本發(fā)明的有益效果:
1)通過區(qū)域停車難易程度地圖展示區(qū)域停車難易程度,出行者能夠更加方便、快捷、直觀地了解目的地區(qū)域和周邊地區(qū)的停車難易程度,從而采用更科學合理的出行方案出行,例如:a)改變出行方式,由駕駛小汽車改為乘坐公交、地鐵或者采用自行車、步行方式;b)改變出行時間,錯開高峰時段;或者c)取消出行。這些出行決策的變化,都將促進城市交通擁堵的緩解,減少交通所產(chǎn)生的碳排放,提高居民的交通出行滿意度。
2)城市建設(shè)者可通過本發(fā)明改善停車費率決策和停車設(shè)施規(guī)劃,為解決目前城市日漸顯著的“停車難”問題提供輔助決策依據(jù)。
3)本發(fā)明所提供的方法以及所得到的詳細土地利用信息數(shù)據(jù),可以為城市規(guī)劃、城市交通相關(guān)的決策以及與交通相關(guān)的科學研究提供有效支持。
附圖說明
圖1為基于百度地圖開放數(shù)據(jù)與Web數(shù)據(jù)挖掘的區(qū)域停車難易指數(shù)的總技術(shù)路線。
圖2為土地利用信息挖掘技術(shù)路線圖。
圖3為區(qū)域分區(qū)示意圖。
圖4為區(qū)域停車難易程度展示圖。
具體實施方式
以下結(jié)合附圖和技術(shù)方案,進一步說明本發(fā)明的具體實施方式。
一種基于百度地圖開放數(shù)據(jù)與Web數(shù)據(jù)挖掘的區(qū)域停車難易指數(shù)的分析方法,步驟如下:
步驟一:土地利用信息挖掘
土地利用信息挖掘技術(shù)路線如圖2所示。
1)POI信息挖掘
首先,利用百度地圖API開放平臺,加載百度地圖,通過添加覆蓋物功能添加任意多邊形區(qū)域模擬小區(qū),并對添加的多邊形邊界進行分析,按照指定密度獲取小區(qū)內(nèi)所有興趣點的坐標,通常將密度設(shè)置為0.0005,這是因為在確定兩個相鄰POI點距離的時候,經(jīng)過計算當R取半徑平均值6371km時,地球表面上同一經(jīng)線圈上相差1"兩點間的距離約為30.887米,地球表面上同一緯線圈上相差1"兩點間的距離約為30.887m×cos(緯度)。百度地圖的坐標精確到小數(shù)點后6位,本發(fā)明的獲取精度為0.0005,相當于每五十米獲取一次POI信息。POI的獲取半徑為四個點構(gòu)成正方形的對角線的一半,應(yīng)該取值為35米,本發(fā)明中取值為40米,保證了獲取信息的準確和完整性。
然后,采用逆地址解析功能與獲取指定點周圍POI信息功能,獲取上一步所得到的每個點周圍指定半徑指定數(shù)量的POI信息,調(diào)用ActiveX,將獲取的POI信息按照編號分別寫入到不同TXT文件中。
最后,利用Excel VBA對上一步獲取的POI數(shù)據(jù)進行數(shù)據(jù)清洗(整合、刪重及統(tǒng)計),得到各小區(qū)無重復(fù)的POI信息。
2)POI對應(yīng)的詳細土地利用信息挖掘
首先,利用Excel將每個POI的UID與網(wǎng)址結(jié)構(gòu)整合,生成原始網(wǎng)址作為火車頭數(shù)據(jù)采集器的0級網(wǎng)址。
然后,將原始網(wǎng)址導(dǎo)入火車頭數(shù)據(jù)采集器中,根據(jù)所需進行參數(shù)設(shè)置,對數(shù)據(jù)來源為安居客、搜房網(wǎng)、新浪樂居等網(wǎng)站的建筑物進行數(shù)據(jù)挖掘,選擇性的獲取小區(qū)名、地址、容積率、總建筑面積、總戶數(shù)、當期戶數(shù)、容積率、占地面積、車位數(shù)、車位配比、均價、物業(yè)費和網(wǎng)址等信息。
最后,將挖掘到的土地利用詳細信息發(fā)布到Excel中,生成Excel文件;利用Excel VBA進行土地利用詳細信息數(shù)據(jù)的進一步清洗(整合、刪重與統(tǒng)計),完成土地利用詳細信息挖掘。
3)POI信息與對應(yīng)的詳細土地利用信息匹配
利用Excel的VLOOKUP功能完成POI信息與對應(yīng)的詳細土地利用信息匹配工作。
在數(shù)據(jù)匹配的過程中,會出現(xiàn)以下兩大問題:
1)數(shù)據(jù)挖掘重復(fù)值處理:針對一個建筑物不同樓層多次獲取信息、不同網(wǎng)站提供的信息不同等情況。
2)數(shù)據(jù)挖掘缺失值處理:主要因是在百度地圖的POI不完善、網(wǎng)站上POI對應(yīng)的詳細土地利用信息不完整。
對于第一種問題,數(shù)據(jù)挖掘重復(fù)值處理,在本文中優(yōu)先保存詳細土地利用信息中包含容積率、建筑面積、用地面積和人口信息的數(shù)據(jù),如果出現(xiàn)多條包含此類信息的數(shù)據(jù),根據(jù)相應(yīng)情況,采取出現(xiàn)頻率最多的數(shù)據(jù)。此方法結(jié)合Excel中MAX、COUNTIF和VLOOKUP函數(shù)既可以實現(xiàn)。采用此方法,保證通過重復(fù)值處理后,每個POI點的名稱在每一列只出現(xiàn)一次。對于第二種問題,數(shù)據(jù)挖掘缺失值處理。產(chǎn)生問題的主要原因是在百度地圖中,一些POI點只有地名和經(jīng)緯度信息,具體POI點詳情還沒有使用者將其上傳,同時這些POI點在網(wǎng)上也難以找到具體的建筑面積、容積率、用地面積和人口等信息。對于這些點,在本文中根據(jù)相應(yīng)情況采取不同的方法進行信息填補,其中主要的方法是根據(jù)不同的屬性設(shè)置缺省屬性。
步驟二:區(qū)域停車需求建模
計算區(qū)域停車需求的方法是根據(jù)經(jīng)緯度的數(shù)值大小,將研究區(qū)域劃分為若干個小區(qū),分別計算每個小區(qū)的停車需求。建立坐標系,取西南角對應(yīng)的坐標為零點,從左往右為經(jīng)度遞增,Δx取0.005精度,從下往上為緯度遞增,Δy取0.005緯度,每個區(qū)域近似接近于正方形,區(qū)域分區(qū)示意圖如圖3所示,hizj表示橫排經(jīng)度第i(i=0,1,2,3…)分區(qū)縱排緯度第j(i=0,1,2,3…)分區(qū)??芍?,每個分區(qū)的中心坐標可表示為(x0+i·Δx+0.0025,y0+j·Δy+0.0025)。
利用發(fā)明內(nèi)容步驟二的公式(1)進行區(qū)域停車需求計算,將容積率、建筑面積和占地面積統(tǒng)一格式為建筑面積,計算時依據(jù)以下幾種原則和順序:
1)先整體計算,在將計算結(jié)果按照經(jīng)緯度所在小區(qū)分配到其所屬小區(qū)并進行累加。
2)同時存在建筑面積和人口總數(shù)時取需求量大的值作為結(jié)果。
步驟三:區(qū)域停車供給分析
停車供給數(shù)據(jù)分公共停車場、配建停車場以及路內(nèi)停車位三方面進行獲取,具體獲取方法如下:
公共停車場:建筑物配建停車場是指建筑物依據(jù)建筑物配建停車位標準所附設(shè)的面向本建筑物使用者和公眾服務(wù)的供機動車停放的停車場。獲取方法為結(jié)合法定圖則、內(nèi)業(yè)梳理與現(xiàn)場核查。
配建停車場:社會公共停車場是指位于道路紅線以外、面向公眾服務(wù)的供機動車停放的停車場。獲取方法為收集經(jīng)營性停車場數(shù)據(jù)與外業(yè)補充調(diào)查。
路內(nèi)停車位:路內(nèi)停車位是指在道路紅線以內(nèi)劃設(shè)的面向公眾服務(wù)的供機動車停放的停車空間。獲取方法為區(qū)運輸局正在編制的《路內(nèi)停車規(guī)劃》與外業(yè)補充調(diào)查。
步驟四:區(qū)域停車難易指數(shù)的計算
以區(qū)域為單位,利用發(fā)明內(nèi)容步驟四中公式(2)進行停車難易指數(shù)的計算,按數(shù)值大小將停車難易指數(shù)分為五級,停車難易指數(shù)為1級,表明目標區(qū)域的靜態(tài)停車難易程度為非常容易、停車難易指數(shù)為2級,表明目標區(qū)域的靜態(tài)停車難易程度為容易、停車難易指數(shù)為3級,表明目標區(qū)域的靜態(tài)停車難易程度為難度適中、停車難易指數(shù)為4級,表明目標區(qū)域的靜態(tài)停車難易程度為難、停車難易指數(shù)為5級,表明目標區(qū)域的靜態(tài)停車難易程度為比較難。
步驟五:區(qū)域停車難易程度地圖繪制
根據(jù)停車難易指數(shù)分級繪制停車難易程度地圖,用不同顏色表示不同區(qū)域的停車難易程度,停車難易程度從1級到5級采用從綠色到紅色過渡的方式表示,最后呈現(xiàn)的效果圖以深圳市坪山區(qū)為例進行展示,如圖4所示。