一種基于信息熵的出行周期檢測方法與流程

文檔序號：11216251閱讀：844來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及智能交通控制領(lǐng)域，更具體地，涉及一種基于信息熵的出行周期檢測方法。

背景技術(shù)：

在大數(shù)據(jù)時代，信息獲取的手段非常多，信息的感知工具非常普及，這使得收集各式各樣的數(shù)據(jù)變得可能。同時，由此帶來的數(shù)據(jù)產(chǎn)品非常豐富，其中包括許多事件組成的序列。

日常生活中，許多出行的發(fā)生都是存在著周期的，例如一個公司職員小王每周(7天)的工作日(5天)都會在早上乘坐地鐵前往公司上班，這是在時空兩個維度上的周期行為；又例如，王阿姨每個周日都會去某個(也許不是同一個)超市購置生活用品，這是在時間維度上的周期行為。

檢測某個事件的發(fā)生是否存在周期以及其周期模式是怎樣的，對于這類事件的管理，有著重要的意義，對相應(yīng)系統(tǒng)的改進、提升有著指導(dǎo)意義。例如，可以通過一個區(qū)域居民的通勤出行情況對城市交通出行進行預(yù)測，并且對城市交通系統(tǒng)提出有針對性的改進、完善。

在交通系統(tǒng)中，出行者被諸如卡口、線圈等固定的感知、檢測設(shè)備所感知。而具體到公共交通系統(tǒng)，獲取到的是出行者的各階段出行的od點信息。

目前常見的出行軌跡時空分析方法是將空間區(qū)域進行編號，再在軌跡上依照一定的規(guī)則取點(事實上，常常先有點，后有軌跡)，按照所屬的區(qū)域獲得編號屬性。通過上述步驟將一個時空出行軌跡轉(zhuǎn)化成一個符號序列。最后通過符號序列來分析軌跡。

這種方法有如下缺點：首先過大、過小的空間區(qū)域劃分容易使得信息存在丟失與冗余。同時，出行軌跡存在著一定的噪聲，在該方法現(xiàn)有的框架下難以剔除噪聲。一個個體的出行有著很多不同的出行目的、習(xí)慣，不加以區(qū)分而對所有的出行進行全局的周期檢測、周期模式識別，大大增加了周期檢測難度。

其次，過于關(guān)注軌跡的細節(jié)部分。從一個大范圍、全局宏觀的視角來看，一個城市的出行量十分巨大。先不說如此龐大的計算量，城市管理者、交通部門的決策者，往往更關(guān)心的是中觀的指標(biāo)，例如某個區(qū)域有多少通勤量發(fā)生、通勤的起訖點，而不是具體到地點的出行軌跡。

因此，本發(fā)明采用了基于中觀層面，將一個出行者的出行軌跡序列在某個時間窗下抽象為01序列的檢測方法。該方法是本發(fā)明提出的周期檢測方法的基礎(chǔ)。

首先將同一次出行目的的出行階段進行合并(如換乘出行合并)，將個體出行信息轉(zhuǎn)化為基于出行目的的個體出行鏈。對一個出行者的出行鏈進行模式聚類、劃分(這里的模式可看做是一類目的的出行，例如小王上班，與具體聚類的劃分的標(biāo)準(zhǔn)有關(guān))。在觀測時間窗內(nèi)，某天，該模式的出行發(fā)生則標(biāo)記為1，否則標(biāo)記為0。這種方法從中觀的角度出發(fā)，很好地滿足了城市管理者、交通決策者的需求。

至此，得到了每個出行者的不同模式下的出行01序列。

在周期的檢測上，目前國內(nèi)外主要著重于檢測時間序列、符號序列與交易序列的周期及周期模式，針對于01序列周期檢測的方法還比較少?，F(xiàn)介紹一下常用的適用于01序列的周期檢測方法：

方法一：自相關(guān)函數(shù)與快速傅里葉變換。

先求出序列的自相關(guān)函數(shù)，基于“周期信號的自相關(guān)函數(shù)是周期函數(shù)，且周期與周期信號相同”這一原理，通過對序列的自相關(guān)函數(shù)進行快速傅里葉變換，得到主頻率，而周期為求得的主頻率的倒數(shù)。

方法二：在生物界中，生物學(xué)家認為基因在dna上的重復(fù)出現(xiàn)對遺傳形狀具有重要意義。因此，在基因領(lǐng)域，將基因在dna中的出現(xiàn)與否標(biāo)記為1和0，提出了一種基于信息論的方法，去檢測01序列的周期。特別的是，此類序列是異常稀疏的序列，0與1的比值在1000這個數(shù)量級。

方法一是目前對于01序列(信號)周期檢測最常用到的方法，但是其并不能滿足需求。這一方法在把序列看作一個不可分割的流動，使得無法獲得序列的周期模式。再者，對于某些序列，自相關(guān)函數(shù)的主頻與次主頻間的區(qū)分并不是很明顯，其適應(yīng)性有待加強：考慮序列“0,0,1,0,0,0,1,0,0,1,0,0,0,1,0,0,1,0,0,0,1,0,0,1,0,0,0,1”，其周期為7，周期模式為0,0,1,0,0,0,1。而在該方法下，該序列的自相關(guān)函數(shù)與fft頻譜圖像如圖1、2所示。

顯然，在該方法的檢測下，檢測出的周期為3.5，與7不符。

方法二對于01序列的檢測具有很強的魯邦性，但是其關(guān)注點在于極度稀疏的序列，并且這也正是方法的適用的前提。

技術(shù)實現(xiàn)要素：

本發(fā)明為解決以上現(xiàn)有技術(shù)提供的周期檢測方法無法有效及準(zhǔn)確地檢測出出行周期的缺陷，提供了一種基于信息熵的出行周期檢測方法。

為實現(xiàn)以上發(fā)明目的，采用的技術(shù)方案是：

一種基于信息熵的出行周期檢測方法，包括以下步驟：

s1.將出行的發(fā)生與否分別標(biāo)記為1和0，對于給定長度為l的出行序列，設(shè)其可能的周期為p，將出行序列存儲成一個的矩陣mp；

s2.對于矩陣mp的每一列c，為其定義一個概率：

其中m(c,j)表示矩陣mp中的第c行第j列的值；

s3.計算當(dāng)前矩陣mp的信息熵為：

s4.取矩陣mp中概率大于設(shè)定的第一閾值的所有列進行飽和度fp的計算；

s5.p＝p+1，重復(fù)執(zhí)行步驟s1～s5，直至p大于l/2；

s6.求得可能的周期集合p＝{p|在p處的信息熵不比在p+1和p-1處的信息熵高，并且p對應(yīng)的飽和度fp>第二閾值}，其中集合p中最小的值為周期值。

與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果是：

本發(fā)明從中觀的視角，將出行信息轉(zhuǎn)化成01序列。并且基于信息論的知識，提出一種基于信息熵的出行周期檢測方法，該方法能夠有效地檢測出出行的周期以及周期模式，并且對隨機噪聲有較強的適應(yīng)性。

附圖說明

圖1為序列的相關(guān)函數(shù)圖。

圖2為序列的fft頻譜圖。

圖3為方法的流程圖。

圖4為序列s在p＝7時的矩陣化形式圖。

圖5為序列s在p＝8時的矩陣化形式圖。

圖6為序列s在p＝7時在縱向上的重合度示意圖。

圖7為序列s在p＝8時在縱向上的重合度示意圖。

圖8為矩陣每列的概率的示意圖。

具體實施方式

附圖僅用于示例性說明，不能理解為對本專利的限制；

以下結(jié)合附圖和實施例對本發(fā)明做進一步的闡述。

實施例1

圖3為本發(fā)明提供的方法的流程示意圖。如圖3所示，給定長度為l的出行序列s，設(shè)s可能的周期為p，將序列存儲成一個的矩陣mp，剩余的部分補0。例如，序列“0,0,1,0,0,0,1,0,0,1,0,0,0,1,0,0,1,0,0,0,1,0,0,1,0,0,0,1”在p＝7的矩陣化形式如圖4所示，在p＝8的矩陣化形式如圖5所示。

若p＝7為s的周期，如圖6所示，其0/1分布在縱向上的重合度很高。若p＝8不為s的周期，如圖7所示，其0/1分布在縱向上的重合度很差。

為了衡量這個“重合度”，本發(fā)明引入了信息熵判定這一步驟。

信息熵是用來量化不確定度、信息量大小的。信息熵就是平均而言，發(fā)生一個事件得到的信息量大小。所以數(shù)學(xué)上，信息熵其實是信息量的期望。

信息熵的定義為：

h＝-σp(x)logp(x)

例如，“明天99％會下雨”，和“明天幾乎不會下雨”是比較確定的，其信息量是很低的。

h＝-(0.99log0.99+0.01log0.01)

＝0.024

而，“明天25％下雨，25％晴天，50％多云”的不確定性較大，具有較大的信息量。

h＝-(0.5log0.5+0.25log0.25+0.25log0.25)

＝0.45

因此給矩陣mp的每一列c定義一個概率

c＝1,2,……p，具體如圖8所示。

當(dāng)pc接近1或者接近0，該列的出行事件的發(fā)生與否的確定性高，信息量較低。只有p值為周期值或其整數(shù)倍時方才使然。因此，嘗試用信息熵來衡量待檢測序列s在當(dāng)前的可能周期值下的確定性的高低。

定義矩陣mp的信息熵：

然后取矩陣mp中概率大于設(shè)定的第一閾值的所有列進行飽和度fp的計算；使每一個可能的周期值p重復(fù)執(zhí)行上述過程，直至p大于l/2；求得可能的周期集合p＝{p|在p處的信息熵不比在p+1和p-1處的信息熵高，并且p對應(yīng)的飽和度fp>第二閾值}，其中集合p中最小的值為周期值。

上述計算飽和度的具體過程如下：

fp＝出行事件數(shù)/提取的列包含的總的事件數(shù)

如圖8所示，pm＝7的情況下，該矩陣的飽和度fp為0.875，周期模式為3、7。

實施例2

本實施例人工制造一些長度為112的周期序列對實施例1的方法進行了測試。其中m為原始序列的周期值，n為原始序列中一個周期中的出行事件發(fā)生的個數(shù)。

并添加隨機噪聲——01交換。定義噪聲比η：

其中，l為序列的長度，noise為序列中發(fā)生0/1交換的個數(shù)，即添加的噪聲的程度與原始序列中出行事件發(fā)生的個數(shù)有關(guān)。

實驗結(jié)果如下所示：

通過上述結(jié)果可以看出，本發(fā)明提供的方法對噪聲有一定的適應(yīng)能力。在25％的噪聲中仍然能有80％以上的表現(xiàn)；甚至一些測試樣本在25％的噪聲中仍保持著100％的正確率。其優(yōu)勢不言而喻。

同時，從結(jié)果可以得到啟示：在一些周期為奇數(shù)的序列中，該方法表現(xiàn)得比周期為偶數(shù)的序列要好，這意味著該方法在檢測特定周期時可以有更好的表現(xiàn)。

例如：嘗試去檢測一個序列的周期是否為6。鑒于奇數(shù)的適應(yīng)度比偶數(shù)的高，可以在序列的每間隔6個位置插入0。如果該序列本身的周期為6，則檢測出來的周期應(yīng)為7。經(jīng)過實驗，噪聲比為25％,m＝6,n＝4的序列經(jīng)過上述引申方法處理后，檢測的正確率由0.862提升到了0.996。

顯然，本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例，而并非是對本發(fā)明的實施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說，在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等，均應(yīng)包含在本發(fā)明權(quán)利要求的保護范圍之內(nèi)。

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：何兆成;鄧紫坤;余暢
技術(shù)所有人：中山大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

細胞周期檢測方法相關(guān)技術(shù)

信息熵相關(guān)技術(shù)

信息熵公式相關(guān)技術(shù)

圖像信息熵相關(guān)技術(shù)

信息熵計算公式相關(guān)技術(shù)

互信息熵相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于信息熵的出行周期檢測方法與流程