欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng)的制作方法

文檔序號(hào):11833723閱讀:502來源:國知局
一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng)的制作方法與工藝

本發(fā)明涉及智慧交通與數(shù)據(jù)挖掘以及自然語言處理領(lǐng)域,特別涉及一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng)。



背景技術(shù):

隨著日益激烈的媒體競爭,廣播電臺(tái)正朝著節(jié)目多元化,頻道專業(yè)化的方向發(fā)展,廣播以時(shí)效性強(qiáng),參與度高為特點(diǎn),為聽眾(特別是出租車司機(jī)、私家車車主)提供及時(shí)、有效的各類信息。對于交通廣播電臺(tái)而言,提供及時(shí)、有效的實(shí)時(shí)路況信息是其最主要的任務(wù)。

隨著社會(huì)的發(fā)展,汽車的數(shù)量迅速增加,交通擁堵已經(jīng)成為各大城市面臨的重大課題。各路段的實(shí)時(shí)路況和擁堵情況,已經(jīng)成為司機(jī)行車是否選擇該路段的重要指標(biāo)。

智能時(shí)代的來臨讓傳統(tǒng)行業(yè)面臨著轉(zhuǎn)型升級,如何高效的使用緊缺的人力和高效快速的計(jì)算機(jī)資源是各行各業(yè)所面臨的問題。計(jì)算機(jī)可以代替人類進(jìn)行一些復(fù)雜繁瑣的工作,使得人從繁瑣的工作中解放出來,利用人類能動(dòng)性的大腦,創(chuàng)造更多的價(jià)值。

傳統(tǒng)的路況管理系統(tǒng),很大程度上依賴于人工操作,耗時(shí)、耗力。傳統(tǒng)的路況分析是在相應(yīng)的關(guān)鍵路段安裝攝像頭等視頻監(jiān)控設(shè)備,通過這些監(jiān)控設(shè)備,相關(guān)部門及人員可以得知放置有監(jiān)控設(shè)備路段的交通狀況。這樣的方法存在許多缺點(diǎn),例如:需要人工監(jiān)視各個(gè)十字路口的交通狀況,再進(jìn)行人工分析,通過播音主持廣播消息發(fā)給出行的駕駛者。這一過程使得消息具有很大的滯后性。再者,人工監(jiān)控效率低、容易出錯(cuò),同時(shí)人工監(jiān)控成本非常高。

然而,基于大數(shù)據(jù)、全球定位系統(tǒng)(GPS)、無線網(wǎng)絡(luò)通信技術(shù)建立了地理信息與車載系統(tǒng)為核心的智能交通路況管理平臺(tái),可以通過綜合的分析車輛行駛的信息進(jìn)行實(shí)時(shí)的路況信息播送。

社交媒體作為新聞資訊的重要傳播者,在互聯(lián)網(wǎng)的平臺(tái)上已經(jīng)展示出范圍大,傳播速度快等優(yōu)點(diǎn),如何利用社交網(wǎng)絡(luò)收集整理信息也是非常重要以及必要的渠道。微信由于其獨(dú)特的開放性和交互性,使其成為很好的信息收集平臺(tái)。

本系統(tǒng)使用微信收集路況信息,通過智能語義分析對微信平臺(tái)上大量冗雜的數(shù)據(jù)進(jìn)行分析,抽取出有用的數(shù)據(jù)信息使用。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提出一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng),以解決目前路況管理系統(tǒng)信息發(fā)布的滯后性、耗力、耗時(shí)等不足,實(shí)現(xiàn)了大量復(fù)雜的交通路況數(shù)據(jù)的高效管理和運(yùn)用。

為實(shí)現(xiàn)上述目的,本發(fā)明提出了一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng),包括實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)、繞行方案信息管理子系統(tǒng);

實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)用于提取設(shè)定區(qū)域內(nèi)的擁堵路段信息,并結(jié)合對應(yīng)路段的歷史數(shù)據(jù)分析擁堵路段的擁堵情況變化趨勢;具體包括構(gòu)建存儲(chǔ)信息數(shù)據(jù)庫和擁堵狀況的展示;

構(gòu)建存儲(chǔ)信息數(shù)據(jù)庫:

以固定頻率獲取設(shè)定區(qū)域內(nèi)各主要路段的擁堵情況數(shù)據(jù),并將所獲得的擁堵情況數(shù)據(jù)經(jīng)過數(shù)據(jù)處理后存入存儲(chǔ)信息數(shù)據(jù)庫;所述擁堵情況數(shù)據(jù)包括二次網(wǎng)格號(hào)、路鏈級別、路鏈號(hào)、路鏈長度、車速、旅行時(shí)間、擁堵程度、擁堵路段數(shù)、終端距離及路段長度信息;

擁堵狀況的展示:

以固定頻率獲取設(shè)定區(qū)域內(nèi)各主要路段當(dāng)前的擁堵情況數(shù)據(jù),并將所獲得的擁堵情況數(shù)據(jù)經(jīng)過數(shù)據(jù)處理后存入存儲(chǔ)信息數(shù)據(jù)庫,同時(shí)根據(jù)擁堵程度在地圖上以不同顏色進(jìn)行展示;

繞行方案信息管理子系統(tǒng)包括編輯人員終端和主持人使用展示終端;

編輯人員終端用于錄入擁堵路段多種包含地名的繞行路線方案,并自動(dòng)識(shí)別所包含的地名,并對錄入各方案中的地名進(jìn)行繞行路線生成和繞行方案的旅行時(shí)間計(jì)算,選擇繞行方案的旅行時(shí)間最短且該繞行方案中平均每公里旅行時(shí)間滿足設(shè)定閾值的方案推送至主持人使用展示終端;

主持人使用展示終端用于接收和顯示編輯人員終端發(fā)送的擁堵路段的旅行時(shí)間最短的繞行方案。

所述的存儲(chǔ)信息數(shù)據(jù)庫由24張表構(gòu)成,對應(yīng)每天24小時(shí),每個(gè)表記錄對應(yīng)的一小時(shí)內(nèi)的擁堵情況數(shù)據(jù)。

擁堵情況數(shù)據(jù)的數(shù)據(jù)處理方法為:對相鄰的道路入口和出口之間的多個(gè)路段進(jìn)行合并形成新的路段,使一組相鄰的道路入口和出口之間的道路信息只有一條;對新的路段的路鏈號(hào)進(jìn)行上行和下行的區(qū)分處理;

分別構(gòu)建數(shù)據(jù)索引信息表和路名索引信息表,其中數(shù)據(jù)索引信息表包括路鏈號(hào)、路鏈級別;路名索引信息表包括二次網(wǎng)格號(hào)、路鏈號(hào)、路名、起點(diǎn)、終點(diǎn)、方向。

本發(fā)明的一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng)還包括路況修改編輯子系統(tǒng),該子系統(tǒng)用于對存儲(chǔ)信息數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行讀取和修改。

本發(fā)明的一種基于數(shù)據(jù)分析的智能路況管理系統(tǒng)還包括微信路況信息智能處理子系統(tǒng),該子系統(tǒng)對獲取微信用戶發(fā)來的文字信息并對其進(jìn)行智能語義分析處理,分析出屬于交通事故、施工信息、交通管制的信息,并自動(dòng)推送給路況編輯終端設(shè)備,以供路況編輯人員對該條信息進(jìn)行審核;

該子系統(tǒng)包含利用人工標(biāo)注的交通路況信息分類數(shù)據(jù)訓(xùn)練好的樸素貝葉斯模型,對輸入的文字信息進(jìn)行篩選的方法包括以下步驟:

步驟S21,使用斯坦福漢語分詞系統(tǒng)對獲取的文字信息進(jìn)行分詞以及詞性標(biāo)注;

步驟S22,將步驟S21中得到的分詞以及詞性標(biāo)注后的文字信息輸入樸素貝葉斯模型,對輸入的文字信息分別計(jì)算其屬于交通事故、施工信息、交通管制各類別的概率,并依據(jù)概率對輸入的文字信息的分類。

本發(fā)明中利用人工標(biāo)注的交通路況信息分類數(shù)據(jù)訓(xùn)練樸素貝葉斯模型的方法為:

通過人工標(biāo)注的交通路況信息分類數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集,該分類數(shù)據(jù)包括文字信息、分詞、詞性標(biāo)注;將訓(xùn)練數(shù)據(jù)集中的分類數(shù)據(jù)訓(xùn)練樸素貝葉斯模型,得出不同特征詞表征不同分類可能性的條件概率,其公式為:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>|</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>,</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

其中,w為一個(gè)詞語;label為分類標(biāo)簽,分為交通事故、施工信息、交通管制和其他四類;s為一條文字信息。

本發(fā)明中對輸入的文字信息分別計(jì)算其屬于交通事故、施工信息、交通管制各類別的概率的方法為:通過模糊匹配,選擇匹配概率大于60%的特征詞為匹配詞,并且使用其參數(shù)作為分類概率,然后根據(jù)匹配度進(jìn)行線性加權(quán)計(jì)算分類概率,公式如下所示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> </munder> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>&times;</mo> <mfrac> <mi>n</mi> <mi>N</mi> </mfrac> <mo>&times;</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>|</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> </mrow>

其中n是匹配的字符數(shù),N為總字符數(shù),αi為加權(quán)系數(shù);

根據(jù)TF-IDF統(tǒng)計(jì)方法計(jì)算得到輸入的文字信息的分類。

所述繞行方案信息管理子系統(tǒng)中繞行路線生成的方法為:基于預(yù)先構(gòu)建的由各路名及對應(yīng)道路上地名構(gòu)成的混合數(shù)據(jù)庫,通過模糊匹配,根據(jù)編輯人員終端錄入的各條繞行路線方案中包含的地名,匹配出最吻合的地名,并判斷匹配出的地名是否是連成一條繞行路線,如不能則向編輯人員終端發(fā)送重新錄入的信息提示;根據(jù)實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)生成的路名索引信息表匹配繞行路線的二次網(wǎng)格號(hào)、路鏈號(hào),生成各繞行方案的路線信息;

所述繞行方案信息管理子系統(tǒng)中繞行方案的旅行時(shí)間計(jì)算的方法為:根據(jù)各繞行方案的路線信息和繞行路線中各路段的路長及最新的車速,計(jì)算對應(yīng)繞行方案的旅行時(shí)間,計(jì)算公式為

<mrow> <mi>T</mi> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>V</mi> <mi>i</mi> </msub> </mrow>

其中T為總旅行時(shí)間,n表示該繞行路線有n個(gè)路段,Pi為第i個(gè)路段的路徑長,Vi為第i個(gè)路段的平均車速。

本發(fā)明解決了目前路況管理系統(tǒng)信息發(fā)布的滯后性、耗力、耗時(shí)等不足,實(shí)現(xiàn)了大量復(fù)雜的交通路況數(shù)據(jù)的高效管理和運(yùn)用。

附圖說明

圖1是本實(shí)施例系統(tǒng)框架示意圖;

圖2是本實(shí)施例擁堵路段情況數(shù)據(jù)處理流程示意圖;

圖3是本實(shí)施例微信路況信息智能處理流程示意圖;

圖4是本實(shí)施例擁堵路段繞行方案處理流程圖。

具體實(shí)施方式

下面將結(jié)合附圖對本發(fā)明加以詳細(xì)說明,應(yīng)指出的是,所描述的實(shí)施例僅旨在便于對本發(fā)明的理解,而對其不起任何限定作用。

為了實(shí)現(xiàn)本發(fā)明方法,實(shí)施例考慮到處理步驟以及涉及的用戶數(shù)量和資源數(shù)量,如果在單機(jī)實(shí)現(xiàn)應(yīng)該最好保證處理器不低于2GHz,內(nèi)存不小于6GB,可以采用任何語言編寫,本例使用java語言實(shí)現(xiàn)。

本發(fā)明的基于數(shù)據(jù)分析的智能路況管理系統(tǒng)包括實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)、繞行方案信息管理子系統(tǒng),進(jìn)一步優(yōu)化后還包括路況修改編輯子系統(tǒng)、微信路況信息智能處理子系統(tǒng),為了更完善的進(jìn)行技術(shù)方案的描述,本實(shí)施例將對包含四個(gè)子系統(tǒng)的基于數(shù)據(jù)分析的智能路況管理系統(tǒng),并以北京市交通信息為例子進(jìn)行詳細(xì)描述。

本實(shí)施例的基于數(shù)據(jù)分析的智能路況管理系統(tǒng)包括實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)、繞行方案信息管理子系統(tǒng)、路況修改編輯子系統(tǒng)、微信路況信息智能處理子系統(tǒng),如圖1所示。

1、實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)

實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)用于提取設(shè)定區(qū)域內(nèi)的擁堵路段信息,并結(jié)合對應(yīng)路段的歷史數(shù)據(jù)分析擁堵路段的擁堵情況變化趨勢;具體包括構(gòu)建存儲(chǔ)信息數(shù)據(jù)庫和擁堵狀況的展示;

構(gòu)建存儲(chǔ)信息數(shù)據(jù)庫:

以固定頻率從北京市交通委獲取北京市各主要路段擁堵情況數(shù)據(jù),并將所獲得的擁堵情況數(shù)據(jù)經(jīng)過數(shù)據(jù)處理后存入存儲(chǔ)信息數(shù)據(jù)庫;所述擁堵情況數(shù)據(jù)包括二次網(wǎng)格號(hào)、路鏈級別、路鏈號(hào)、路鏈長度、車速、旅行時(shí)間、擁堵程度、擁堵路段數(shù)、終端距離及路段長度信息。

本實(shí)施例的擁堵情況數(shù)據(jù)的數(shù)據(jù)處理如圖2所示。

在獲得擁堵情況數(shù)據(jù)時(shí)進(jìn)行數(shù)據(jù)驗(yàn)證:將獲得擁堵情況數(shù)據(jù)按定義錯(cuò)誤糾正協(xié)議,即重復(fù)發(fā)送一個(gè)屬性的數(shù)據(jù),通過兩次接收到的數(shù)據(jù)進(jìn)行對比,如果兩次數(shù)據(jù)一致則認(rèn)為數(shù)據(jù)接收成功,錄入存儲(chǔ)信息數(shù)據(jù)庫;否則標(biāo)注該條數(shù)據(jù)無效,拋棄錯(cuò)誤數(shù)據(jù)。存儲(chǔ)信息數(shù)據(jù)庫在系統(tǒng)運(yùn)行之前執(zhí)行SQL腳本構(gòu)建,存儲(chǔ)信息數(shù)據(jù)庫字段內(nèi)容和交通路況數(shù)據(jù)完全一致。

對獲得的擁堵情況數(shù)據(jù)進(jìn)行分析處理的方法是:去除重復(fù)數(shù)據(jù);并對相鄰的道路入口和出口之間的多個(gè)路段進(jìn)行合并形成新的路段,使一組相鄰的道路入口和出口之間的道路信息只有一條,實(shí)現(xiàn)擁堵情況數(shù)據(jù)的單一化處理;對新的路段的路鏈號(hào)進(jìn)行上行和下行的區(qū)分,實(shí)現(xiàn)擁堵情況數(shù)據(jù)的不重復(fù)處理;生成單一且不重復(fù)的路鏈號(hào)、路鏈級別形成索引信息表,包括數(shù)據(jù)索引信息表和路名索引信息表,其中數(shù)據(jù)索引信息表包括路鏈號(hào)、路鏈級別,路名索引信息表包括二次網(wǎng)格號(hào)、路鏈號(hào)、路名、起點(diǎn)、終點(diǎn)、方向。由于數(shù)據(jù)量較大,通過索引方式可以加速后續(xù)檢索速度。

單一化處理的目的在于:有的路很長,如高速,他們具有相同的起點(diǎn)和終點(diǎn),但對應(yīng)著不同的路段,每個(gè)路段劃分很細(xì),這樣雖然利于數(shù)據(jù)展示,卻不利于用戶問路況的查詢;因此將此類路段合并,將具有相同的起點(diǎn)和終點(diǎn)的路段合并后形成單一化的路段。不重復(fù)處理的目的在于:由于一條路的雙向有完全一致的二次網(wǎng)格號(hào)和路鏈號(hào),因此將此類數(shù)據(jù)去重,即對路鏈號(hào)進(jìn)行處理,本實(shí)施例中將下行數(shù)據(jù)加上10000、上行數(shù)據(jù)為原始值進(jìn)行區(qū)分。

本實(shí)施例在數(shù)據(jù)處理過程包含了索引表的抽取、緩存表向地圖及歷史信息數(shù)據(jù)庫的數(shù)據(jù)傳送。由于接受數(shù)據(jù)的頻率較高及數(shù)據(jù)量較大,以北京地區(qū)為例,平均2分鐘從北京市交通委的交通路況信息系統(tǒng)接收14萬條數(shù)據(jù),如果使用時(shí)根據(jù)路鏈號(hào)以及網(wǎng)格號(hào)查詢數(shù)據(jù)會(huì)降低系統(tǒng)性能,因此系統(tǒng)初始化時(shí)會(huì)對介入的數(shù)據(jù)進(jìn)行分析,抽取其索引與數(shù)據(jù)庫存儲(chǔ)ID的關(guān)系,形成索引表,以達(dá)到加速后期檢索速度的目的。索引表包括二次網(wǎng)格號(hào)、路鏈號(hào)、數(shù)據(jù)存儲(chǔ)ID等信息。緩存表的設(shè)計(jì)主要為了數(shù)據(jù)的完備性,因?yàn)榕c數(shù)據(jù)源連接的速度沒有達(dá)到理想水平,導(dǎo)致14萬條數(shù)據(jù)的接收需要持續(xù)一段時(shí)間,此時(shí)如果進(jìn)行數(shù)據(jù)的檢索有的地區(qū)會(huì)出現(xiàn)空數(shù)據(jù),因此系統(tǒng)需要去調(diào)用舊數(shù)據(jù)造成效率低下,在設(shè)計(jì)延時(shí)允許的條件下,緩存表接受所有數(shù)據(jù)后再向數(shù)據(jù)庫中轉(zhuǎn)存。

擁堵狀況的展示:

以固定頻率獲取設(shè)定區(qū)域內(nèi)各主要路段當(dāng)前的擁堵情況數(shù)據(jù),并將所獲得的擁堵情況數(shù)據(jù)經(jīng)過數(shù)據(jù)處理后存入存儲(chǔ)信息數(shù)據(jù)庫,同時(shí)根據(jù)擁堵程度在地圖上以紅綠黃等不同顏色進(jìn)行展示;本實(shí)施例中依據(jù)歷史數(shù)據(jù)通過差分分類分析與折線圖組合的方式分析路段擁堵情況變化趨勢;

所述的存儲(chǔ)信息數(shù)據(jù)庫由24張表構(gòu)成,對應(yīng)每天24小時(shí),每個(gè)表記錄對應(yīng)的一小時(shí)內(nèi)的擁堵情況數(shù)據(jù)。采用該設(shè)計(jì)主要是由于數(shù)據(jù)量大,對歷史數(shù)據(jù)進(jìn)行挖掘時(shí)數(shù)據(jù)庫效率較低,為了降低數(shù)據(jù)庫長度,便于數(shù)據(jù)分時(shí)間端分析,以及利于并行處理,因此按照每天24小時(shí),將數(shù)據(jù)庫設(shè)計(jì)為24張表,每個(gè)表記錄每天本小時(shí)的數(shù)據(jù),系統(tǒng)使用最新數(shù)據(jù)只需要通過當(dāng)前時(shí)間找到其對應(yīng)的數(shù)據(jù)表,然后讀取最新的數(shù)據(jù)。

2、微信路況信息智能處理子系統(tǒng)

該系統(tǒng)針對微信信息數(shù)據(jù)雜亂的特點(diǎn),對微信數(shù)據(jù)進(jìn)行智能語義分析處理,選出有用的數(shù)據(jù),并且進(jìn)行數(shù)據(jù)的預(yù)分類,將處理后的信息提交給編輯使用如附圖4所示。

對獲取微信用戶發(fā)來的文字信息并對其進(jìn)行智能語義分析處理,分析出屬于交通事故、施工信息、交通管制的信息和其他信息四類,若為交通事故、施工信息、交通管制信息則自動(dòng)推送給路況編輯終端設(shè)備,以供路況編輯人員對該條信息進(jìn)行審核;若為其他信息則刪除該信息。

該子系統(tǒng)包含利用人工標(biāo)注的交通路況信息分類數(shù)據(jù)訓(xùn)練好的樸素貝葉斯模型,對輸入的文字信息進(jìn)行篩選的方法包括以下步驟:

步驟S21,使用斯坦福漢語分詞系統(tǒng)對獲取的文字信息進(jìn)行分詞以及詞性標(biāo)注。如“建國門附近發(fā)生交通事故”,被系統(tǒng)標(biāo)注為“建國門/地名附近/位置發(fā)生/動(dòng)詞交通/形容詞事故/名詞”。

步驟S22,將步驟S21中得到的分詞以及詞性標(biāo)注后的文字信息輸入樸素貝葉斯模型,對輸入的文字信息分別計(jì)算其屬于交通事故、施工信息、交通管制各類別的概率,并依據(jù)概率對輸入的文字信息的分類。

利用人工標(biāo)注的交通路況信息分類數(shù)據(jù)訓(xùn)練樸素貝葉斯模型的方法為:通過人工標(biāo)注的交通路況信息分類數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集,該分類數(shù)據(jù)包括文字信息、分詞、詞性標(biāo)注;將訓(xùn)練數(shù)據(jù)集中的分類數(shù)據(jù)訓(xùn)練樸素貝葉斯模型,得出不同特征詞表征不同分類可能性的條件概率,其公式如公式(1)所示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>|</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>,</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>c</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中,w為一個(gè)詞語;label為分類標(biāo)簽,分為交通事故、施工信息、交通管制和其他四類;s為一條文字信息。

對輸入的文字信息分別計(jì)算其屬于交通事故、施工信息、交通管制各類別的概率的方法為:通過模糊匹配,選擇匹配概率大于60%的特征詞為匹配詞,并且使用其參數(shù)作為分類概率,然后根據(jù)匹配度進(jìn)行線性加權(quán)計(jì)算分類概率,如公式(2)所示:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> </munder> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>&times;</mo> <mfrac> <mi>n</mi> <mi>N</mi> </mfrac> <mo>&times;</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>s</mi> <mo>=</mo> <mi>l</mi> <mi>a</mi> <mi>b</mi> <mi>e</mi> <mi>l</mi> <mo>|</mo> <mi>w</mi> <mo>&Element;</mo> <mi>s</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

其中n是匹配的字符數(shù),N為總字符數(shù),αi為加權(quán)系數(shù);

根據(jù)TF-IDF統(tǒng)計(jì)方法計(jì)算得到輸入的文字信息的分類。

3、繞行方案信息管理子系統(tǒng)

該系統(tǒng)包括編輯人員終端和主持人使用展示終端;

如圖4所示是本實(shí)施例擁堵路段繞行方案處理流程示意圖。

編輯人員終端用于錄入北京市擁堵路段多種包含地名的繞行路線方案,如保福寺橋到學(xué)院橋,并自動(dòng)識(shí)別所包含的地名,并對錄入各方案中的地名進(jìn)行繞行路線生成和繞行方案的旅行時(shí)間計(jì)算,選擇繞行方案的旅行時(shí)間最短且該繞行方案中平均每公里旅行時(shí)間滿足設(shè)定閾值的方案推送至主持人使用展示終端;在本實(shí)施例中,此處所設(shè)定閾值為根據(jù)不同路況下的平均車輛時(shí)速計(jì)算的每公里的旅行時(shí)間,例如北京統(tǒng)計(jì)的各時(shí)段的平均時(shí)速為30km/h,即平均每公里旅行時(shí)間為2分鐘為所設(shè)定的閾值。

主持人使用展示終端用于接收和顯示編輯人員終端發(fā)送的擁堵路段的旅行時(shí)間最短的繞行方案。

所述繞行方案信息管理子系統(tǒng)中繞行路線生成的方法為:基于預(yù)先構(gòu)建的由各路名及對應(yīng)道路上地名構(gòu)成的混合數(shù)據(jù)庫,通過模糊匹配,根據(jù)編輯人員終端錄入的各條繞行路線方案中包含的地名,匹配出最吻合的地名,并判斷匹配出的地名是否是連成一條繞行路線,如不能則向編輯人員終端發(fā)送重新錄入的信息提示;根據(jù)實(shí)時(shí)路況數(shù)據(jù)處理子系統(tǒng)生成的路名索引信息表匹配繞行路線的二次網(wǎng)格號(hào)、路鏈號(hào),生成各繞行方案的路線信息;

本實(shí)施例中所構(gòu)建的包含北京地名和路名的混合數(shù)據(jù)庫,所存儲(chǔ)的主要內(nèi)容是道路上的節(jié)點(diǎn)地名以及其向路名的映射,數(shù)據(jù)庫中地名和對應(yīng)的路名分別對應(yīng)地名字段和路名字段,表示地名對應(yīng)到路名,同時(shí)路名也作為地名的一種加入地名字段,便于系統(tǒng)檢索使用。

所述繞行方案信息管理子系統(tǒng)中繞行方案的旅行時(shí)間計(jì)算的方法為:根據(jù)各繞行方案的路線信息和繞行路線中各路段的路長及最新的車速,計(jì)算對應(yīng)繞行方案的旅行時(shí)間,計(jì)算公式如公式(3)所示

<mrow> <mi>T</mi> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>/</mo> <msub> <mi>V</mi> <mi>i</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

其中T為總旅行時(shí)間,n表示該繞行路線有n個(gè)路段,Pi為第i個(gè)路段的路徑長,Vi為第i個(gè)路段的平均車速。

以上所述,僅為本發(fā)明中的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉該技術(shù)的人在本發(fā)明所揭露的技術(shù)范圍內(nèi),可理解想到的變換或替換,都應(yīng)涵蓋在本發(fā)明的包含范圍之內(nèi),因此,本發(fā)明的保護(hù)范圍應(yīng)該以權(quán)利要求書的保護(hù)范圍為準(zhǔn)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
定兴县| 凯里市| 沙河市| 大洼县| 茶陵县| 林州市| 伊通| 安溪县| 淮南市| 清远市| 马尔康县| 灌南县| 原阳县| 高唐县| 溆浦县| 龙海市| 望奎县| 浦东新区| 齐齐哈尔市| 贵州省| 定兴县| 武夷山市| 印江| 云霄县| 遂宁市| 彩票| 高州市| 会理县| 祁连县| 鄱阳县| 池州市| 会昌县| 枣庄市| 栾川县| 高陵县| 临湘市| 文昌市| 华阴市| 榆中县| 奇台县| 汉沽区|