基于出租車gps記錄的機場巴士站點及路線規(guī)劃方法
【專利摘要】本發(fā)明公開了一種基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法,包括以下步驟:步驟1:獲取數(shù)據(jù)集;步驟2:采用數(shù)據(jù)過濾算法對所有的出租車GPS記錄進行過濾;步驟3:對過濾后的數(shù)據(jù)集合按照上車和下車地點為機場進行分類,分為進入機場數(shù)據(jù)集和出機場數(shù)據(jù)集;步驟4:對進入進場數(shù)據(jù)集的PDRs通過聚類算法進行聚類,得到聚類中心和聚類集合,聚類中心集合即為機場巴士候選站點;步驟5:根據(jù)站點設置規(guī)則和優(yōu)化算法對候選站點集進行修正優(yōu)化;步驟6:對于優(yōu)化后的站點,通過路徑規(guī)劃算法對機場巴士的進入機場線路進行規(guī)劃;步驟7:對于出進場數(shù)據(jù)集,重復步驟4,5,6得到機場巴士的出機場巴士線路規(guī)劃方案。
【專利說明】基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法
【技術領域】
[0001]本發(fā)明涉及計算機大數(shù)據(jù)領域,特別是一種基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法。
【背景技術】
[0002]大數(shù)據(jù)(Big data),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)規(guī)模巨大到無法通過人工,在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息。在總數(shù)據(jù)量相同的情況下,與個別分析獨立的小型數(shù)據(jù)集(data set)相比,將各個小型數(shù)據(jù)集合并后進行分析可得出許多額外的信息和數(shù)據(jù)關系性,可用來察覺商業(yè)趨勢、判定研究質量、避免疾病擴散、打擊犯罪或測定實時交通路況等;這樣的用途正是大型數(shù)據(jù)集盛行的原因。
[0003]大數(shù)據(jù)在交通領域的發(fā)展是隨著近年來機動車輛的爆炸式增加、車載GPS設備的大面積普及、交通攝像頭、RFID等設備的部署同步發(fā)展的。尤其是近年來,城市建設的加快,交通壓力越來越大,環(huán)境污染越來越嚴重,發(fā)展公共交通刻不容緩,亟待改善城市交通規(guī)劃,而應用大數(shù)據(jù)方法解決交通問題越來越普遍而有效。
[0004]對于公交線路規(guī)劃和設計是一個大數(shù)據(jù)潛在的應用場景。傳統(tǒng)的公交線路規(guī)劃往往需要在前期投入大量的人力進行OD調查和數(shù)據(jù)收集。特別是在出租車大面積普及后,對于OD流量數(shù)據(jù)完全可以從車載GPS設備中采集到相關的交通流量和流向數(shù)據(jù),包括乘客的起點、終點以及時間等信息。對于一個上千萬人口的大城市而言,每天的流量數(shù)據(jù)都會相當大,單一分析一天的數(shù)據(jù)可能沒有相關的價值,而分析一個周期的數(shù)據(jù)趨勢變化則會相當有價值。結合交通流量流向數(shù)據(jù)趨勢變化,可以很好的幫助公交部門進行公交運營線路的設計規(guī)劃和調整,換乘站的設計等很多內容。這個方法可能很早就有人想到,但是在出租車OD信息采集沒有普及或海量數(shù)據(jù)處理和計算能力沒有跟上的時候確實很難實際落地操作,而現(xiàn)在隨著大數(shù)據(jù)技術的成熟和OD信息收集可以進行實際操作。
[0005]據(jù)IBM行業(yè)分析顯示,使用出租車和自備車進出機場的旅客占到了 80% ;在中國2013年旅客吞吐量超過一千萬人次以上的機場已多達24個,而出租車和自備車出行會給交通帶來極大的壓力以及帶來更多的環(huán)境問題。本文中通過對基于出租車GPS記錄的研究,通過大數(shù)據(jù)處理方法確定機場巴士站點位置,并在此基礎上給出一個機場巴士線路規(guī)劃方案來解決旅客進出機場問題。之前的很多針對于GPS記錄的數(shù)據(jù)挖掘工作有很多:研究乘客出行模式,如 H.Wen Chang 等人在 “Context-aware taxi demand hotspotspredict1n (Int.J.Bus.1ntell.Data Mining, vol.5, n0.1, pp.3 - 18, Dec.2010)中使用GPS記錄來挖掘城市熱點問題;研究交通狀況,如J.Aslam等人在“City-scale trafficestimat1n from a roving sensor network (in Proc.ACM SenSys, 2012, pp.141 - 154.),,中對交通狀況信息的預測;研究出租車出行軌跡,如H.Hu等人在“Pick-up tree basedroute recommendat1n from taxi trajectories(in Proc.Web-Age Inf.Manage., 2012, v
ol.7418,pp.471 - 483.) ”提供建議讓乘客更快找到出租車或者出租車更快找到乘客。
[0006]目前的對于出租車GPS記錄的研究領域主要是出租車乘客的OD出行模式、交通狀況預測以及出行軌跡研究等方面。而本文著眼于旅客公交出行方面的考慮,運用大數(shù)據(jù)處理來設計機場巴士線路,解決以往巴士??空军c不合理、線路規(guī)劃不完善等問題,達到減少自備車和出租車進出進場比例、引導公共交通出行的目的。
[0007]隨著大數(shù)據(jù)技術的發(fā)展和成熟,城市規(guī)模的發(fā)展和交通壓力以及日益嚴重環(huán)境問題,研究機場巴士站點設置和線路規(guī)劃問題是比較符合當前實際情況的。
【發(fā)明內容】
[0008]本發(fā)明旨在克服現(xiàn)有機場巴士站點設置和線路規(guī)劃存在的不足,提供一種基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法。
[0009]本發(fā)明公開了一種基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法,包括以下步驟:
[0010]步驟1:獲取數(shù)據(jù)集,數(shù)據(jù)集由一個城市的所有出租車GPS的歷史記錄組成,GPS記錄包括數(shù)據(jù)即乘客的上、下車數(shù)據(jù),即出租車的OD信息都通過GPS設備上傳到服務器,所述OD信息包括出發(fā)地和目的地信息;
[0011]步驟2:采用數(shù)據(jù)過濾算法對所有的出租車包含OD信息的GPS記錄數(shù)據(jù)進行篩選,過濾掉乘車記錄中無效信息和無關信息數(shù)據(jù);
[0012]步驟3:對過濾后的數(shù)據(jù)集合按照上車和下車地點為機場進行分類,分為進入機場數(shù)據(jù)集和出機場數(shù)據(jù)集;
[0013]步驟4:對于進入機場數(shù)據(jù)集,對得到的TORs數(shù)據(jù)進行聚類得到聚類中心和聚類集合,聚類中心集合即為進入機場巴士候選站點集;
[0014]步驟5:對聚類算法得到的聚類中心,根據(jù)站點設置規(guī)則和優(yōu)化算法對候選站點集進行修正優(yōu)化;
[0015]步驟6:對于優(yōu)化后的站點,在現(xiàn)有線路信息的基礎條件下,通過路徑規(guī)劃算法規(guī)劃機場巴士的進入機場路線的規(guī)劃;
[0016]步驟7:對于出機場數(shù)據(jù)集,重復步驟4,5,6得到機場巴士的出機場線路規(guī)劃方案。
[0017]本發(fā)明中,所述的包含OD信息的出租車GPS記錄數(shù)據(jù),每條記錄具體描述為rn =(X1, X2,…,Xm),其中,rn表示出租車GPS記錄的第η條歷史記錄,Xm表示第m維出租車記錄PDR屬性值,m表示出租車記錄PDR屬性的維數(shù),m、η取值自然數(shù)。
[0018]本發(fā)明中,采用數(shù)據(jù)過濾算法對包含OD信息的GPS記錄數(shù)據(jù)進行篩選過濾,祛除無效信息和無關信息,分為兩歩:
[0019]第一步過濾掉OD信息中和機場無關的GPS記錄,判斷出租車GPS記錄是否是進出機場的乘車記錄,即上車點或下車點位置是否在機場范圍內的記錄;
[0020]第二步在第一步結果基礎上過濾掉無效記錄,無效記錄包括時間和路線完全相同的重復記錄,以及歷史記錄中乘車距離dist(r)小于閾值Sci或者乘車時間Time Cr)小于閾值Tci的記錄;
[0021]將篩選后得到的TORs數(shù)據(jù)集合記為Suse,描述為Ir1, r2, r3,…,rj,其中,z表示篩選后的GPS記錄的個數(shù)。
[0022]本發(fā)明中,對于數(shù)據(jù)集合S.,根據(jù)是進入還是出機場把數(shù)據(jù)集分為進入機場數(shù)據(jù)集Sd和出機場數(shù)據(jù)集S。。
[0023]本發(fā)明中,對進入機場數(shù)據(jù)集Sd采用k-means方法進行聚類;
[0024]隨機從進入機場數(shù)據(jù)集Sd選取k個聚類中心點集Iu1, U2,…,Uk},k的取值為I?SdI之間的自然數(shù),Uk表示第k個中心點;
[0025]K-means是基于距離的聚類方法,對距離的計算采用歐氏距離,對于每個乘車記錄IV計算其和聚類中心的距離,公式為:
[0026]d(r,u/) = ^(X1-y{)2+(X2-V2)2+...+ (\ -ym),
[0027]其中,(Kri, Uj)表示記錄A和聚類中心點Uj的距離,j取值范圍為I?k, !Ti表示為(XpX2,…xm),其中xm表示記錄A的第m維屬性值,m是記錄!Ti的維度;聚類中心點Uj表示為(yi,y2,…ym),其中ym表示記錄?的第m維屬性值,屬性值包括經(jīng)度和緯度;
[0028]根據(jù)以下公式確定記錄&所屬的類別:
k
[0029]Ci 二 arg min d( u.),
j=i J
[0030]其中Ci表示記錄ri所屬的類別,選擇k個距離中與聚類中心距離最小的那個聚類中心所在的類作為記錄^的類別;
[0031]確定所有記錄的類別后,得到一個類集合{P},類集合{P}擁有k個子集合,對于每一個類別下的所有記錄的集合{Pk},計算新的聚類中心點:
Σ化'
[0032]JJ _ Ir=I
k— I巧I,
[0033]其中,IpJ表示聚類后屬于類別Ck的記錄個數(shù);Pkw表示集合Pk中第W個元素,Uk即為類別Ck新的中心點;
[0034]重復進行聚類,直到達到聚類停止條件,即所有的聚類中心點都不再變化。
[0035]本發(fā)明中,首先,對于在進入機場數(shù)據(jù)集Sd上聚類后得到的類集合{P},類集合{P}擁有k個子集合;
[0036]{PJ是集合{P}的一個子集合,a是自然數(shù),取值范圍I?k;從子集合中選取子集合區(qū)域內的點所在區(qū)域每小時出租車TORs數(shù)據(jù)中在此地??看螖?shù)大于50條的地點為站點的候選集L,得到的候選點集合表示為L = (I1, I2,…,IJ ,通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點Iil的可達性為:
I
[0037]Al = ~
—-YjClistOn,lu]), /1 = 1,2,...,5,
mI ~ lUl=I
ul^i
[0038]其中Hi1是集合{Pa}元素數(shù)目,Ul是集合{Pa}中的元素下標,取值范圍為I?Hi1 ;s是站點的候選集L中元素數(shù)目,s取值范圍為I?HinAil表示第il個候選站點Iil的可達性值;
[0039]根據(jù)公式計算站點的候選集L中所有候選站點的可達性值,值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點;
[0040]對于類集合{P}中所有子集合,通過上述可達性指標進行優(yōu)化得到進入機場的巴士站點集合A1 ;
[0041]對于通過k-means算法在出機場數(shù)據(jù)集S。上獲得的類集合{Q},類集合{Q}擁有t個子集合:
[0042]首先,對于在出機場數(shù)據(jù)集S。上聚類后得到的類集合{Q},{QJ是集合{Q}的一個子集合,b是自然數(shù),取值范圍I?t;從集合中選取集合區(qū)域內人流量每小時的roRs數(shù)據(jù)大于50條的地點作為站點的候選集D,將站點的候選集表示為D = W1, d2,…,dv},通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點di2的可達性為:
I mI
[0043]Ai2 — 2 dist、dj2,dul), 12 —1,2,...,v,
m2 _ J "2=1
η?φ?
[0044]其中m2是集合{Qa}中元素數(shù)目,u2是集合{Qa}中的元素下標,取值范圍為I?m2 ;v是站點的候選集D中元素數(shù)目,V取值范圍為I?m2, Ai2表示第i2個候選站點di2的可達性值;
[0045]根據(jù)公式計算站點的候選集D中所有候選站點的可達性值,可達性值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點;
[0046]對于類集合{Q}中所有子集合區(qū)域,通過上述可達性值進行優(yōu)化得到出機場的巴士站點集合A2。
[0047]本發(fā)明中,對修正后的進入機場巴士站點集合A1,按照公交公司給定的去機場線路條數(shù)B1,以及所述B1條機場線路的起點,根據(jù)得到的進入機場巴士站點集合A1,隨機生成B1條到達機場的運營線路圖;把所述線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到優(yōu)化的進入機場的機場巴士線路規(guī)劃方案。
[0048]本發(fā)明中,對于出機場數(shù)據(jù)集,對修正后的出機場的機場巴士站點集合A2,按照公交公司給定的出機場線路條數(shù)B2以及所述B2條機場線路的終點,根據(jù)得到的站點集合A2,隨機生成B2條出機場的運營線路圖;把這些線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到優(yōu)化的出機場的機場巴士線路規(guī)劃方案。
[0049]本發(fā)明的思想為:首先通過對出租車GPS記錄集合的篩選得到本次實驗的數(shù)據(jù)集合,即OD信息是機場的有效I3DRs ;對于OD信息時機場的有效I3DRs分為進入機場數(shù)據(jù)集和出機場數(shù)據(jù)集;對于以上兩個數(shù)據(jù)集分別采用k-means聚類算法進行聚類,然后對每個聚類的中心進行修正優(yōu)化;最后對得到的優(yōu)化后的機場巴士站點候選集進行機場巴士線路規(guī)劃,得到機場巴士的進入機場路線規(guī)劃方案和出機場兩個路線規(guī)劃方案。
[0050]與現(xiàn)有技術相比,本發(fā)明的效果體現(xiàn)在:
[0051]I)機場巴士站點確定方法是基于出租車GPS的OD信息數(shù)據(jù),數(shù)據(jù)量比較大,采用大數(shù)據(jù)處理方式,是可信的、科學的。
[0052]2)采用出租車的GPS記錄可以有效挖掘用戶出行模式和OD規(guī)律,通過此方式設置的機場巴士站點比較符合乘客需求和城市公共交通建設要求的,大大減少乘客出行費用,同時還能減少環(huán)境污染,大力發(fā)展公共交通。
[0053]3)本次路徑規(guī)劃分為進入機場線路和出機場線路,從乘客對進、出不同的需求進行了滿足,既方便了進入機場的乘客也方便了出機場的乘客的需求。
【專利附圖】
【附圖說明】
[0054]圖1本發(fā)明流程圖。
【具體實施方式】
:
[0055]本發(fā)明基于出租車GPS記錄的機場巴士站點設置和路徑規(guī)劃方法包括以下步驟:
[0056]步驟1:獲取數(shù)據(jù)集,數(shù)據(jù)集由某城市的所有出租車GPS記錄組成,GPS記錄包括乘客的上 / 下車信息(pick/drop records, F1DRs),即出租車的 OD (origin-destinat1n)信息都會通過GPS設備上傳到服務器;包含出租車OD信息的GPS記錄來源與一個城市所有出租車,并且數(shù)據(jù)采集時間足夠長,從而保證了設計方案的科學性和可信度。出租車的TORs的屬性包含很多信息,例如上車時間、設備號、車牌號、上車點經(jīng)緯度、下車時間、下車點經(jīng)緯度等信息。
[0057]本發(fā)明包含機場巴士站點選擇、進入機場巴士線路規(guī)劃方案和出機場巴士線路規(guī)劃,即機場巴士站點選擇完成后進行進/出機場巴士線路規(guī)劃。包含出租車OD信息的乘車記錄集合F1DRs記為為Sall,可以描述為Ir1, r2, r3,…,rh,…,rn},其中,rh表示第h個記錄,η表示GPS記錄的個數(shù)。每條記錄具體描述為rn = (X1, x2,…,xm),其中,rn表示出租車GPS記錄的第η條歷史記錄,xm表示第m維出租車記錄PDR屬性值表示出租車記錄PDR屬性的維數(shù),m、η取值自然數(shù)。
[0058]步驟2:采用數(shù)據(jù)過濾算法對所有的出租車包含OD信息的乘車記錄TORs進行篩選,過濾掉乘車記錄中無效信息和無關信息數(shù)據(jù)。過濾主要分為兩歩:第一步過濾掉OD信息和機場無關的GPS記錄;第二步在第一步結果基礎上過濾掉無效記錄。
[0059]步驟2中采用數(shù)據(jù)篩選算法主要是為了降低無關數(shù)據(jù)對實驗準確性的干擾。首先判定是否是相關信息,即判斷出租車GPS記錄是否是進出機場的乘車記錄,上車點或下車點經(jīng)緯度在機場范圍內的記錄;
[0060]Loc (rh) E Loc (airport)
[0061]其中rh是GPS記錄的第h條記錄,Loc (rh)表示這條記錄的起點或終點,本公式判斷上車點或下車點是否在機場的地理范圍內,機場的位置根據(jù)官方的經(jīng)緯度來確定;其次,過濾掉無效記錄,無效記錄有以下幾個方面原因:某一時刻乘客乘坐出租車,出租車GPS設備可能會上傳多條相同記錄,這些記錄是重復的,需要過濾掉;歷史記錄中乘車距離dist (rh)小于閾值Stl或者乘車時間Time (rh)小于閾值Ttl的記錄需要過濾來降低對實驗精確性的干擾,公式如下:
[0062]dist(rh)>S。andTime (rh) >T0
[0063]篩選后得到的TORs數(shù)據(jù)集合記為Suse,描述為Ir1, r2, r3,…,rj,z表示篩選后的GPS記錄的個數(shù)。每個PDR記錄仍表示為rz = (X1, x2,…,xm),其中,rz表示過濾后的出租車GPS的第z條歷史記錄,Xm表示出租車GPS記錄第m維屬性值,m表示出租車GPS記錄F1DR的維數(shù),m取值自然數(shù),z取值I?η之間的自然數(shù)。
[0064]步驟3:篩選后得到的TORs數(shù)據(jù)集合記為Suse,根據(jù)是進入還是出機場把數(shù)據(jù)集合分為進入機場數(shù)據(jù)集Sd和出機場數(shù)據(jù)集S。;
[0065]步驟4:對進入機場的出租車GPS記錄集St^P S。,采用k-means聚類算法進行聚類得到聚類中心和類集合,聚類算法停止后得到的聚類中心集合即為機場巴士候選站點集,得到的類集合即為每個候選站點的GPS記錄集;
[0066]在對篩選后的出租車GPS記錄篩選后得到的數(shù)據(jù)集Sd采用k-means方法進行聚類時,首先要隨機從進入機場數(shù)據(jù)集Sd選取k個聚類中心點集Iu1, U2,…,uk},k的取值為I?|Sd|之間的自然數(shù),Uk表示第k個中心點;
[0067]在本發(fā)明中要通過算法自我收斂找到最優(yōu)的k值I^pt,一般難以直接找到最佳聚類數(shù)k_,因此需要確定一個搜索范圍,就是設定一fkmax,如何確定kmax尚無明確理論公式,多數(shù)學者采用經(jīng)驗規(guī)則為公式:
[0068]and kopl < kmax
[0069]其中,n是聚類集合的元素個數(shù),初始值設定k = 2 ;
[0070]K-means是基于距離的聚類方法,對距離的計算采用歐氏距離,對于每個乘車記錄IV計算其和聚類中心的距離,公式為:
[0071]CiirnUj) ^ -J1)2+(Y - ! ) +…丄(Y -Jffl)2,
[0072]其中,(Kri, Uj)表示記錄A和聚類中心點Uj的距離,j取值范圍為I?k, !Ti表示為(XpX2,…xm),其中xm表示記錄A的第m維屬性值,m是記錄!Ti的維度;聚類中心點Uj表示為(yi,y2,…ym),其中ym表示記錄七的第m維屬性值,屬性值有經(jīng)度和緯度;
[0073]根據(jù)以下公式確定記錄ri所屬的類別:
k
[0074]Cj = arg min d( Ui),
j=i J
[0075]其中Ci表示記錄ri所屬的類別,選擇k個距離中與聚類中心距離最小的那個聚類中心所在的類作為記錄^的類別;
[0076]確定所有記錄的類別后,得到一個類集合{P},對于每一個類別下的所有記錄的集合{Pk},計算新的聚類中心點:
[0077]U — w=l
k I巧 I,
[0078]其中,IpJ表示聚類后屬于類別Ck的記錄個數(shù);Pkw表示集合Pk中第W個元素,Uk即為類別Ck新的中心點;
[0079]重復進行聚類,直到達到聚類停止條件,即所有的聚類中心點都不再變化。
[0080]如果聚類中心的距離不滿足站點設置規(guī)則,即任意兩個相鄰聚類中心點的距離要大于閾值S1,公式如下:
[0081]dist (ue, uf) >S!
[0082]ue和Uf表示聚類中心集合中的任意兩個元素,e和f的取值范圍為I?k ;如果不滿足上式,則k = k+Ι,重復步驟4過程,直到滿足所有條件。
[0083]通過k-means算法,在進入機場數(shù)據(jù)集Sd上得到一個類集合{P},擁有k個子集合;在出機場數(shù)據(jù)集S。上得到一個類集合{Q},擁有t個子集合。
[0084]步驟5:由聚類算法k-means得到的聚類中心即為機場巴士站點候選集,根據(jù)站點設置規(guī)則和優(yōu)化算法對候選站點集進行修正優(yōu)化;
[0085]步驟5中通過k-means方法獲得的聚類中心集合C是通過算法計算出來的,需要進行優(yōu)化,優(yōu)化步驟如下:
[0086]首先,對于在進入機場數(shù)據(jù)集Sd上聚類后得到的類集合{P},類集合{P}擁有k個子集合。
[0087]{PJ是集合{P}的一個子集合,a是自然數(shù),取值范圍I?k;從集合中選取集合區(qū)域內的點所在區(qū)域每小時出租車TORs記錄中在此地停靠次數(shù)大于50條的地點為站點的候選集L,得到的候選點集合表示為L = (I1, I2,…,IJ,通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點Iil的可達性為:
I mI
[0088]Al = IT Σ d_n ,U, Π = 1,2,…,.V,
肌I _ I wl=l
[0089]其中Hi1是集合{Pa}元素數(shù)目,Ul是集合{Pa}中的元素下標,取值范圍為I?Hi1 ;s是站點的候選集L中元素數(shù)目,s取值范圍為I?HinAil表示第il個候選站點Iil的可達性;
[0090]根據(jù)公式計算站點的候選集L中所有候選站點的可達性值,值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點;
[0091]對于類集合{P}中所有子集合,通過上述可達性指標進行優(yōu)化得到進入機場的巴士站點集合A1 ;
[0092]對于通過k-means算法在出機場數(shù)據(jù)集S。上獲得的類集合{Q},類集合{Q}擁有t個子集合:
[0093]首先,對于在出機場數(shù)據(jù)集S。上聚類后得到的類集合{Q},{QJ是集合{Q}的一個子集合,b是自然數(shù),取值范圍I?t;從集合中選取集合區(qū)域內人流量每小時的roRs記錄大于50條的地點作為站點的候選集D,將站點的候選集表示為D = W1, d2,…,dv},通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點di2的可達性為:
j m2
[0094]4-2 = -—7 Σ dist〈di2,0, ?2 = h 2,...,V,
m2 — 1 m2=1
Η?Φ?
[0095]其中m2是集合{Qa}中元素數(shù)目,u2是集合{Qa}中的元素下標,取值范圍為I?m2 ;v是站點的候選集D中元素數(shù)目,V取值范圍為I?m2, Ai2表示第i2個候選站點di2的可達性值;
[0096]根據(jù)公式計算站點的候選集D中所有候選站點的可達性值,可達性值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點;
[0097]對于類集合{Q}中所有子集合區(qū)域,通過上述可達性值進行優(yōu)化得到出機場的巴士站點集合A2。
[0098]步驟6:對優(yōu)化后的進入機場巴士站點集合A1,首先按照公交公司給定的去機場線路條數(shù)B1,以及這&條線的起點,根據(jù)得到的站點集合A1,隨機生成B1條到達機場的運營線路圖,即為初始線路;
[0099]采用模擬退火算法對初始線路進行路徑的優(yōu)化:
[0100]本發(fā)明采用的模擬退火法(Simulated Annealing, SA)是模擬熱力學中經(jīng)典粒子系統(tǒng)的降溫過程,來求解規(guī)劃問題的極值。當孤立粒子系統(tǒng)的溫度以足夠慢的速度下降時,系統(tǒng)近似處于熱力學平衡狀態(tài),最后系統(tǒng)將達到本身的最低能量狀態(tài),即基態(tài),這相當于能量函數(shù)的全局極小點。模擬退火求解局部最優(yōu)解的過程如下:
[0101]①設定初始溫度h為100度;使用上一階段獲得的初始線路集合,并計算該初試線路的目標函數(shù)值f(x),目標函數(shù)f(x)為線路距離的和函數(shù)f(x) =Σ Clij,
[0102]其中i,j為某一線路上兩個不同的站點,Clij為站點之間的距離。
[0103]②隨機產(chǎn)生擾動Λ χ,即隨機替換改變線路中的某個站點,得到新線路集合X’,計算新線路集合目標函數(shù)值f(x’),及函數(shù)值差Af = f(X’)_f(x)。
[0104]③若Λ f〈 = 0,則接受新的線路,并作為下一次模擬的初始線路。
[0105]④若Δ?>0,則計算新線路的接受概率:P (Af) = exp(_Af/t),其中t為當前溫度;產(chǎn)生[0,1]區(qū)間上均勻分布的偽隨機數(shù)r, r[0, I],如果p(Af)> = r,則接受新點作為下一次模擬的初始線路;否則放棄新線路,仍取原來的線路作為下一次模擬的初始線路。
[0106]按照每次退火溫度Λ t = 2的退火方案減低溫度,重復②③④過程直到當前溫度t = 0,就構成了完整的模擬退火算法,最終獲得線路則為優(yōu)化后的規(guī)劃方案。
[0107]通過本算法得到優(yōu)化的進入機場的機場巴士線路規(guī)劃方案。
[0108]步驟7:對于出機場數(shù)據(jù)集,對于出機場數(shù)據(jù)集,對修正后的出機場的機場巴士站點集合A2,按照公交公司給定的出機場線路條數(shù)B2以及這B2條線的終點,根據(jù)得到的站點集合A2,隨機生成B2條出機場的運營線路圖;再把這些線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到優(yōu)化的出機場的機場巴士線路規(guī)劃方案。
[0109]實施例
[0110]本實施例使用了 A城市的所有出租車在一周時間里產(chǎn)生的數(shù)據(jù)集進行實驗。
[0111]對于拿到的原始數(shù)據(jù)集,首先過濾掉無效數(shù)據(jù):在地圖上用藍色的圓點代表起點,紅色的圓點代表終點,把這些數(shù)據(jù)記錄顯示到地圖后,有許多記錄的起點和終點都不在機場出租車??奎c區(qū)域內;此時以機場??奎c為中心,Ikm為半徑畫一個圓形區(qū)域,把起點或終點在這個圓形區(qū)域內的數(shù)據(jù)篩選出來;篩選出來的數(shù)據(jù)把部分起點和終點距離小于Ikm以及一條記錄的行車時間小于5min的數(shù)據(jù)進行剔除,最重得到需要的數(shù)據(jù)集S.。
[0112]其次,把數(shù)據(jù)集Suse拆分成兩部分數(shù)據(jù)集,根據(jù)在機場??奎c區(qū)域的圓點顯示的顏色是藍色或紅色來歸類,即起點是藍色的圓點集是出機場數(shù)據(jù)集S。和終點是紅色的圓點集是進入進場數(shù)據(jù)集sd。
[0113]再次,進行聚類,對Sd和S。進行聚類,首先根據(jù)A城市的實際情況進行聚類,A城市有三條機場巴士線進出機場,進機場三條線一共有9個站點,出機場的三條線路中一共有12個站點;在對Sd進行聚類時選擇的聚類中心為9,對Sd進行聚類時選擇的聚類中心為12,并把聚類后的中心和區(qū)域顯示在地圖上。
[0114]接下來是站點的優(yōu)化,上一步得到的聚類中心需要修正優(yōu)化,以Sd的一個聚類中心和區(qū)域為例:選取了區(qū)域內符合人流量大于50的條件的四個酒店作為本區(qū)域站點的候選點,分別為君樂大酒店、楚源大酒店、翠湖大酒店和銀天大酒店,計算的可達性值為{900.97,955.67,1105.29,1049.81},所以選擇可達性值最小的君樂大酒店所在的位置為本區(qū)域的機場巴士站點。在本過程中對Sd的所有聚類中心進行優(yōu)化得到進入機場站點集A1,對S。的所有聚類中心進行優(yōu)化得到出機場站點集A2。
[0115]最后,對得到的站點集進行路徑規(guī)劃,由于在A城市中進出機場都只有三條線路,本次實例中仍舊以三條線為例。對優(yōu)化后的進機場的機場巴士站點集合A1,按照已有三條線以及這三條機場線路的起點,隨機生成三條到達機場的運營線路圖;把這三條線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到優(yōu)化的進入機場的機場巴士線路規(guī)劃方案;對優(yōu)化后的出機場的機場巴士站點集合A2,按照已有的三條線以及這三條條機場線路的終點,隨機生成三條出機場的運營線路圖;把這三條線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到優(yōu)化的出機場的機場巴士線路規(guī)劃方案。
【權利要求】
1.一種基于出租車GPS記錄的機場巴士站點及路線規(guī)劃方法,其特征在于:包括以下步驟: 步驟1:獲取數(shù)據(jù)集,數(shù)據(jù)集由一個城市的所有出租車GPS的歷史記錄組成,GPS記錄包括數(shù)據(jù)即乘客的上、下車數(shù)據(jù),即出租車的OD信息都通過GPS設備上傳到服務器,所述OD信息包括出發(fā)地和目的地信息; 步驟2:采用數(shù)據(jù)過濾算法對所有的出租車包含OD信息的GPS記錄數(shù)據(jù)進行篩選,過濾掉乘車記錄中無效信息和無關信息數(shù)據(jù); 步驟3:對過濾后的數(shù)據(jù)集合按照上車和下車地點為機場進行分類,分為進入機場數(shù)據(jù)集和出機場數(shù)據(jù)集; 步驟4:對于進入機場數(shù)據(jù)集,對得到的TORs數(shù)據(jù)進行聚類得到聚類中心和聚類集合,聚類中心集合即為進入機場巴士候選站點集; 步驟5:對聚類算法得到的聚類中心,根據(jù)站點設置規(guī)則和優(yōu)化算法對候選站點集進行修正優(yōu)化; 步驟6:對于優(yōu)化后的站點,在現(xiàn)有線路信息的基礎條件下,通過路徑規(guī)劃算法規(guī)劃機場巴士的進入機場路線的規(guī)劃; 步驟7:對于出機場數(shù)據(jù)集,重復步驟4,5,6得到機場巴士的出機場線路規(guī)劃方案。
2.根據(jù)權利要求1所述的方法,其特征在于,所述的包含OD信息的出租車GPS記錄數(shù)據(jù),每條記錄具體描述為rn = (X1, x2,…,xm),其中,rn表示出租車GPS記錄的第η條歷史記錄,Xm表示第m維出租車記錄F1DR屬性值,m表示出租車記錄PDR屬性的維數(shù),m、η取值自然數(shù)。
3.根據(jù)權利要求2所述的方法,其特征在于,采用數(shù)據(jù)過濾算法對包含OD信息的GPS記錄數(shù)據(jù)進行篩選過濾,祛除無效信息和無關信息,分為兩歩: 第一步過濾掉OD信息中和機場無關的GPS記錄,判斷出租車GPS記錄是否是進出機場的乘車記錄,即上車點或下車點位置是否在機場范圍內的記錄; 第二步在第一步結果基礎上過濾掉無效記錄,無效記錄包括時間和路線完全相同的重復記錄,以及歷史記錄中乘車距離dist (r)小于閾值Sci或者乘車時間Time (r)小于閾值Ttl的記錄; 將篩選后得到的TORs數(shù)據(jù)集合記為Suse,描述為Ir1, r2, r3,…,rj,其中,z表示篩選后的GPS記錄的個數(shù)。
4.根據(jù)權利要求3所述的方法,其特征在于,對于數(shù)據(jù)集合S.,根據(jù)是進入還是出機場把數(shù)據(jù)集分為進入機場數(shù)據(jù)集Sd和出機場數(shù)據(jù)集S。。
5.根據(jù)權利要求4所述的方法,其特征在于,對進入機場數(shù)據(jù)集Sd采用k-means方法進行聚類; 隨機從進入機場數(shù)據(jù)集Sd選取k個聚類中心點集{Ul,u2,…,uk},k的取值為I?|Sd|之間的自然數(shù),Uk表示第k個中心點; K-means是基于距離的聚類方法,對距離的計算采用歐氏距離,對于每個乘車記錄ri;計算其和聚類中心的距離,公式為:
d(η,Uj)=」(-V1 — V1 )2 +U2 -J2)2 +...+ (\ -y,u), 其中,(Kri, Uj)表示記錄η和聚類中心點Uj的距離,j取值范圍為I?k, η表示為(XpX2,…xm),其中Xm表示記錄A的第m維屬性值,m是記錄!Ti的維度;聚類中心點Uj表示為(yi,y2,…ym),其中7111表示記錄屮的第m維屬性值,屬性值包括經(jīng)度和緯度; 根據(jù)以下公式確定記錄A所屬的類別:
k
C1- aminint/(r., u;),
j=l J 其中Ci表示記錄^所屬的類別,選擇k個距離中與聚類中心距離最小的那個聚類中心所在的類作為記錄^的類別; 確定所有記錄的類別后,得到一個類集合{P},類集合{P}擁有k個子集合,對于每一個類別下的所有記錄的集合{Pk},計算新的聚類中心點:
TJ — ^=1 r Iill ’ 其中,IPkI表示聚類后屬于類別ck的記錄個數(shù)屮!?表示集合Pk中第w個元素,Uk即為類別Ck新的中心點; 重復進行聚類,直到達到聚類停止條件,即所有的聚類中心點都不再變化。
6.根據(jù)權利要求5所述的方法,其特征在于,首先,對于在進入機場數(shù)據(jù)集Sd上聚類后得到的類集合{P},類集合{P}擁有k個子集合; {PJ是集合{P}的一個子集合,a是自然數(shù),取值范圍I?k ;從子集合中選取子集合區(qū)域內的點所在區(qū)域每小時出租車TORs數(shù)據(jù)中在此地??看螖?shù)大于50條的地點為站點的候選集L,得到的候選點集合表示為L = (I1, I2,…,IJ,通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點Iil的可達性為: 4, = —?.Σ dist(lnJu[), /I = 1,2”
mi —1 wl=l
uM 其中Hl1是集合{PJ元素數(shù)目,Ul是集合{PJ中的元素下標,取值范圍為I?Hl1 ;s是站點的候選集L中元素數(shù)目,S取值范圍為I?HI1, Ail表示第il個候選站點Iil的可達性值; 根據(jù)公式計算站點的候選集L中所有候選站點的可達性值,值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點; 對于類集合{P}中所有子集合,通過上述可達性指標進行優(yōu)化得到進入機場的巴士站點集合A1 ; 對于通過k-means算法在出機場數(shù)據(jù)集S。上獲得的類集合{Q},類集合{Q}擁有t個子集合: 首先,對于在出機場數(shù)據(jù)集S。上聚類后得到的類集合{Q},{QJ是集合{Q}的一個子集合,b是自然數(shù),取值范圍I?t ;從集合中選取集合區(qū)域內人流量每小時的TORs數(shù)據(jù)大于50條的地點作為站點的候選集D,將站點的候選集表示為D = W1, d2,…,dv},通過可達性的度量值來選擇最優(yōu)的點作為本集合區(qū)域的站點,根據(jù)可達性的計算公式候選站點di2的可達性為:
I mI All =-- Y dist(dnJlP), il = 1,2,...,ν,
W2-1 急 L
ιι?ψι 其中m2是集合{Qa}中元素數(shù)目,u2是集合{Qa}中的元素下標,取值范圍為I?m2 ;v是站點的候選集D中元素數(shù)目,V取值范圍為I?m2,Ai2表示第i2個候選站點di2的可達性值; 根據(jù)公式計算站點的候選集D中所有候選站點的可達性值,可達性值最小的點即為最優(yōu)的點,即為本區(qū)域集合的機場巴士站點; 對于類集合{Q}中所有子集合區(qū)域,通過上述可達性值進行優(yōu)化得到出機場的巴士站點集合A2。
7.根據(jù)權利要求6所述的方法,其特征在于,對修正后的進入機場巴士站點集合A1,按照公交公司給定的去機場線路條數(shù)B1,以及所述B1條機場線路的起點,根據(jù)得到的進入機場巴士站點集合A1,隨機生成B1條到達機場的運營線路圖;把所述線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到機場巴士的進入機場的優(yōu)化的線路規(guī)劃方案。
8.根據(jù)權利要求7所述的方法,其特征在于,對于出機場數(shù)據(jù)集,對修正后的出機場的機場巴士站點集合A2,按照公交公司給定的出機場線路條數(shù)B2以及所述B2條機場線路的終點,根據(jù)得到的站點集合A2,隨機生成B2條出機場的運營線路圖;把這些線路圖作為初始線路,采用模擬退火算法對初始線路進行路徑的優(yōu)化,得到機場巴士的出機場的優(yōu)化的線路規(guī)劃方案。
【文檔編號】G06Q10/04GK104318324SQ201410539844
【公開日】2015年1月28日 申請日期:2014年10月13日 優(yōu)先權日:2014年10月13日
【發(fā)明者】竇萬春, 劉巖 申請人:南京大學