本發(fā)明涉及一種信息分析方法,尤其是涉及一種一種基于信息內(nèi)涵度的數(shù)據(jù)分析及預(yù)警方法。
背景技術(shù):
通信信息的研究起步較早,上世紀(jì)中葉香農(nóng)提出的信息理論,提供給通信領(lǐng)域一個較為完整的信息概念,也為通信奠定了理論基礎(chǔ)。
香農(nóng)首先指出信息是可度量的,并給出了信息量的明確定義。他認為信息量H與消息出現(xiàn)的概率p(x)的關(guān)系應(yīng)反映如下規(guī)律:
H=loga[1/p(x)]=-loga p(x) a=2,H單位為比特
這一理論揭示了信息的屬性定義,并且明確了信息可度量的先見,在其通信模型學(xué)說中,又提到信息通常可利用電信信號傳輸,當(dāng)p(x)=1/4時,I=2bit,需用2位二進制脈沖傳送??梢姰?dāng)消息的信息量用比特表示時,可以用最少二進制脈沖數(shù)來表示。在此,信息就轉(zhuǎn)換成電信號的比特流了。信息的采集、傳輸、處理、存儲、加工、顯示,即通信系統(tǒng)的工作過程。
在香農(nóng)提出的通信理論的第二定理中,C=B·log2(1+S/N),其中C為信道容量,B為帶寬,S/N為信噪比。
由此得出:當(dāng)信道的信息傳輸率小于信道容量時,采用合適的信道編碼方法可以實現(xiàn)任意高的傳輸可靠性(或誤差率接近0),反之也然;若在信道容量一定的條件下,要增加通信帶寬,則必須減少信噪強度,反之也然。
香農(nóng)提出的通信系統(tǒng)模型,如附圖1,明確定義了從信源到信宿的模塊功能及系統(tǒng)組成,成為通信理論的經(jīng)典學(xué)說和基礎(chǔ)知識。然而隨著現(xiàn)代信息數(shù)據(jù)爆炸式的增長,相應(yīng)的模塊功能內(nèi)涵也有了極大變化。從早先點對點的通信模式,已演進為單點對多點,多點(群)對多點(群),多點對單點的信息交互模式;信源和信宿也已發(fā)展成為全雙工的兼有收發(fā)功能或含原單工的單元模塊;從通信量有限的單信道的傳輸已變成為網(wǎng)絡(luò)交換的海量信息傳遞交互?,F(xiàn)代信息通信的理論研究已經(jīng)落后于時代的狀況和社會的需求,尤其是信息內(nèi)涵及度量成為了大數(shù)據(jù)通信應(yīng)用的主要瓶頸,多媒體通信、移動互動應(yīng)用、社交平臺、位置服務(wù)等新型應(yīng)用的推進,使信息內(nèi)涵確定、預(yù)知信息發(fā)生可能趨勢,以及使用信息內(nèi)涵進行分析、預(yù)測、預(yù)警等成為需要解決的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種能夠從海量信息中提取事物特征的基于信息內(nèi)涵度的數(shù)據(jù)分析及預(yù)警方法。
本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
一種基于信息內(nèi)涵度的數(shù)據(jù)分析方法,包括以下步驟:
S1,采集一段時間內(nèi)的信息數(shù)據(jù),所述的信息數(shù)據(jù)為待分析事物的信源點在不同時間點依次發(fā)送的數(shù)據(jù)。
S2,對信息數(shù)據(jù)進行處理、存儲,并計算每個信息數(shù)據(jù)的信息內(nèi)涵度,對于某信息數(shù)據(jù),其信息內(nèi)涵度計算式為:
其中,I為信息內(nèi)涵度,m為信息數(shù)據(jù)的信息量,單位為bit,t為采集本信息數(shù)據(jù)到采集下個信息數(shù)據(jù)之間的時間間隔,單位為s(秒),μ為信息安全因子,p為事物信息的出現(xiàn)概率;
上述計算式理論依據(jù)包括以下:
1)基于信息是被反映的物質(zhì)屬性原理以及事物信息可用最小單位bit表述,而事物的消息m(massage)是由許多bit組成,由此顯見,m隨bit的增加而增大,即m與bit成正比關(guān)系。
2)事物的信息I(information)是由許多事物消息m而形成,當(dāng)m增加,則I也會增加,即I與m成正比關(guān)系。
3)由香農(nóng)理論可知,事物的信息與其發(fā)生的概率為反向關(guān)系,即發(fā)生概率越小的事件,一當(dāng)真正發(fā)生,其信息量是非常巨大,即信息I與其事件發(fā)生的概率p成反比關(guān)系。
4)由信息論學(xué)說可知,事物的信息更新周期越快(時間t越短),即此事物的信息量則越大,反之則越小,故推導(dǎo)出I與t成反比。
5)事物的(若干或許多)消息只有安全地被信宿所接收和存儲,才能更全面地表述該事物的屬性,由此產(chǎn)生出事物信息的安全因子μ,信息安全因子越高,事物信息越全,即演繹出事物信息I與μ成正比關(guān)系。
由上述多維度考慮和結(jié)合,從而設(shè)計推導(dǎo)出,信息內(nèi)涵度量公式如上(1)。它能更加全面反映信息是客觀事物普遍屬性的表征。
S3,根據(jù)步驟S2的結(jié)果進行數(shù)據(jù)統(tǒng)計分析,得到信息內(nèi)涵度I的統(tǒng)計趨勢,作為信息數(shù)據(jù)所反映的事物特征。
所述的步驟S2中,所述的事物信息出現(xiàn)的概率p符合香農(nóng)信息理論:H=-log2 p。其中H為信息量。
所述的信息安全因子μ根據(jù)國際信息安全等級的規(guī)則確定。
一種基于信息內(nèi)涵度的預(yù)警方法,包括以下步驟:
S1,采集待分析事物的信源的當(dāng)前信息數(shù)據(jù),所述的信息數(shù)據(jù)為當(dāng)前一段時間內(nèi)不同時間點由信源依次發(fā)送的數(shù)據(jù);
S2,對信息數(shù)據(jù)進行處理、存儲,并計算每個信息數(shù)據(jù)的信息內(nèi)涵度,對于某個信息數(shù)據(jù),所述的信息內(nèi)涵度計算式為:
其中,I為信息內(nèi)涵度,m為數(shù)據(jù)的信息量,單位為bit,t為采集本數(shù)據(jù)到采集下個數(shù)據(jù)之間的時間間隔,單位為s(秒),μ為信息安全因子,p為信息出現(xiàn)概率;
S3,將步驟S2的結(jié)果與根據(jù)歷史信息數(shù)據(jù)得到的信息內(nèi)涵度統(tǒng)計趨勢進行對比,若當(dāng)前一段時間內(nèi)的信息內(nèi)涵度變化趨勢與歷史數(shù)據(jù)信息差異超過設(shè)定范圍,一般前后兩次數(shù)據(jù)差異>20%時,就認為差異較大,發(fā)出預(yù)警。
所述的步驟S2中,所述的p符合香農(nóng)信息理論。
所述的信息安全因子μ根據(jù)國際信息安全等級的規(guī)則確定。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
(1)首次提出的信息歸集定義和表達式,即:信息是客觀事物普遍屬性的表征;信息是被反映的物質(zhì)屬性;信息出現(xiàn)的幾率越低,其信息內(nèi)涵值就越高;信息內(nèi)涵隨著信息的安全越高而增長。其信息內(nèi)涵歸集表達式為:I::={Mc,Mt,Mq,Ms}。而Mc、Mt、Mq、Ms分別表示為信息的內(nèi)容、信息的傳遞對象、信息的幾率、信息的安全。由此歸集定義更能反映出信息多維度的特征。
(2)采用信息內(nèi)涵度計算結(jié)果及其統(tǒng)計分析得到的統(tǒng)計趨勢,全面地表示了現(xiàn)代信息通信時代的信息內(nèi)涵特征,該特征考慮了信息量、出現(xiàn)概率等因素,準(zhǔn)確反映出事物的特征及變化規(guī)律,使信息具體化、數(shù)字化、可視化。
(3)對香農(nóng)信息理論中的信息量加以利用,具有良好的理論基礎(chǔ)。
(4)信息安全因子μ根據(jù)國際信息安全等級的規(guī)則確定,符合信息化時代數(shù)據(jù)安全的量定。
(5)首次提出的信息內(nèi)涵度量技術(shù),用數(shù)學(xué)語言簡潔明了給出了信息內(nèi)涵值與信息量、出現(xiàn)幾率、出現(xiàn)時間及安全因子之間的關(guān)系,直觀、易用。
附圖說明
圖1為香農(nóng)提出的通信系統(tǒng)模型;
圖2為本實施例1道路交通擁塞信息管理系統(tǒng)布置圖;
圖3為本實施例1道路交通擁塞信息管理系統(tǒng)A道區(qū)在8時前后數(shù)據(jù)趨勢;
圖4為本實施例1道路交通擁塞信息管理系統(tǒng)A道區(qū)在14時前后數(shù)據(jù)趨勢;
圖5為本實施例2山體及橋梁信息監(jiān)測報警系統(tǒng)布置圖;
圖6為本發(fā)明預(yù)警方法流程圖。
附圖標(biāo)記:1為數(shù)據(jù)采集器;2為圖像采集器;3為集中轉(zhuǎn)發(fā)器;4為山體;5為橋梁。
具體實施方式
下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細說明。本實施例以本發(fā)明技術(shù)方案為前提進行實施,給出了詳細的實施方式和具體的操作過程,但本發(fā)明的保護范圍不限于下述的實施例。
實施例1
如圖2所示,在道路交通擁塞信息管理系統(tǒng)中,設(shè)定在某一主要道路口四條道路上,各距道口50米范圍,每條路上在相隔10米處,安置線圈感應(yīng)傳感器,每當(dāng)車輛經(jīng)過這些傳感器時,獲得電磁感應(yīng)信號,表示通過的車輛數(shù),在一個傳感器上,車輛經(jīng)過的時間間隔越大,則車速越慢,反之亦然。此感應(yīng)信號通過網(wǎng)絡(luò)傳至交通管理中心,加以分析比較,進行實時交通管理。
采用流程如圖6所示的預(yù)警方法,對道路交通擁塞進行預(yù)警,包括以下步驟:
S1,采集信息數(shù)據(jù),信息數(shù)據(jù)為針對待分析事物依次采集的數(shù)據(jù),傳感器將經(jīng)過其的車輛信息數(shù)據(jù)經(jīng)網(wǎng)絡(luò)回傳至管理中心。
S2,對信息數(shù)據(jù)進行處理、存儲,并計算每個信息數(shù)據(jù)的信息內(nèi)涵度,對于收到的車輛信息數(shù)據(jù),由電腦通過信息內(nèi)涵度量公式做運算,公式如下:
其中,I為信息內(nèi)涵度,m為數(shù)據(jù)的信息量,單位為bit,在此,每個傳感器回傳數(shù)據(jù)設(shè)定為500bit;t為采集本數(shù)據(jù)到采集下個數(shù)據(jù)之間的時間間隔,單位為秒s,在此設(shè)定兩個時段作為樣本信息分析運算:7時到9時、13時到15時;μ為信息安全因子,根據(jù)信息安全標(biāo)準(zhǔn)設(shè)置為C2級,取值為3;p為信息的出現(xiàn)概率,根據(jù)交通擁塞業(yè)務(wù)特性為高幾率事件,p取0.8。由此得到運算結(jié)果如下:
S2.1,A道區(qū)在8時前后,從各點傳感器傳出的信號時間間隔而得到對應(yīng)的In值分別為:31.25,20.83,15.63,12.50,10.42。In值趨小,車輛速度減慢,擁塞趨勢增加。數(shù)據(jù)趨勢如圖3所示,其中縱軸為In值,橫軸為信號回傳間隔(單位:秒)。
S2.2,A道區(qū)在14時前后,從各點傳感器傳出的信號時間間隔而得到對應(yīng)的In值分別為:20.83;25.00;31.25;37.50;46.88。In值趨大,車輛速度增加,路況趨勢正常。如圖4所示。
S2.3,此上為簡單起見,均采集兩整點予以運算分析。同理可得到8點(或14點)前后十分鐘,二十分鐘,三十分鐘等等的相關(guān)In值。
S2.4,同樣,可獲得B道區(qū),C道區(qū),D道區(qū)的各In值,得知道路擁塞與否的情況。
S3,根據(jù)步驟S2的結(jié)果進行數(shù)據(jù)統(tǒng)計分析,得到信息內(nèi)涵度I的統(tǒng)計趨勢,作為信息數(shù)據(jù)所反映的事物特征。I值通過μ、p、t和m的四個維度考量,較全面反映事物特征;考慮事件出現(xiàn)的概率,這一特性更結(jié)合實際應(yīng)用的行業(yè)不同屬性。通過I趨勢值可判斷,及與歷史數(shù)據(jù)比較,可預(yù)知事件趨勢性方向。
S3.1,交通信息管理中心計算機通過長期的存儲In值數(shù)據(jù)比較分析,得到相應(yīng)A道區(qū)的擁塞狀況統(tǒng)計規(guī)律,即7時到9時和下午16時到18時為擁塞嚴重時段。
S3.2,同樣,得到B,C和D道區(qū)的相應(yīng)數(shù)據(jù)統(tǒng)計規(guī)律。
S3.3,如將四個道區(qū)的歷史數(shù)據(jù)作比較,在同樣時段均為In值為低值,說明整個區(qū)域交通擁塞情況嚴重;反之亦然。
由此可見,一個交通擁塞的社會現(xiàn)象,通過信息傳遞和運算,變成一個數(shù)字現(xiàn)象;又經(jīng)過I數(shù)據(jù)庫的比較、分析,變成一個信息特征現(xiàn)象;得到事物的規(guī)律性內(nèi)涵。所以信息內(nèi)涵度量對于物聯(lián)網(wǎng)大數(shù)據(jù)時代的應(yīng)用具有非常大的現(xiàn)實意義。
實施例2
將本發(fā)明的預(yù)警方法運用于山體及橋梁信息監(jiān)測報警系統(tǒng)中,此山情包括塌方,地震,泥石流等及橋梁受力等情況。
山體橋梁信息監(jiān)測報警系統(tǒng)包括依次連接的四個單元,A單元:信源接入部分/前端子系統(tǒng);B單元:交互通信網(wǎng)絡(luò);C單元:信宿接入部分;D單元:信息監(jiān)測中心。
如圖5所示,現(xiàn)設(shè)定在山體4相應(yīng)重要部位安置數(shù)據(jù)采集器1(即壓力傳感器)十個,用于監(jiān)測各點受力狀況信息,同樣橋梁5各關(guān)鍵位置安置八個數(shù)據(jù)采集器1,觀測各支點和節(jié)點的受力信息。為對山體4和橋梁5重要部位的裂縫加以監(jiān)測,設(shè)置共十個圖像采集器2(即圖像傳感器)于相應(yīng)部位。并在此區(qū)域安置一集中轉(zhuǎn)發(fā)器3,由此構(gòu)成山情橋梁信息傳輸及監(jiān)測系統(tǒng)的前端子系統(tǒng)。
在整個信息監(jiān)測報警系統(tǒng)中,A單元的信源接入部分主要用于前端數(shù)據(jù)及圖像的采集和發(fā)送,并通過集中轉(zhuǎn)發(fā)器將所有信息傳輸?shù)紹單元交互通信網(wǎng)絡(luò),經(jīng)過網(wǎng)絡(luò)傳輸,信息進入C單元的信宿接入部分,然后,所有信息傳輸?shù)紻單元信息監(jiān)測中心,將數(shù)據(jù)圖像分離,并作信息分析和度量計算,在屏幕上顯示數(shù)據(jù)、圖像、統(tǒng)計趨勢,以管理山體橋梁信息,達到安全預(yù)防和運行的目的??紤]到信息安全地傳輸至中心,而且根據(jù)數(shù)據(jù)流量和圖像流量的大小和差異性,設(shè)計十八路數(shù)據(jù)信息通過通信網(wǎng)中的無線網(wǎng)如GPRS傳輸至后端子系統(tǒng),而圖像信息則通過通信網(wǎng)中的互聯(lián)網(wǎng)傳輸至后端子系統(tǒng),雙網(wǎng)備份,增加信息通信可靠性。
具體實施步驟:
S1,安置各帶有編號的采集器于相應(yīng)重要位置,各路數(shù)據(jù)和圖像采集器將變化的信息傳輸?shù)郊衅鳌?/p>
S2,集中器對數(shù)據(jù)和圖像信息進行相應(yīng)編碼和調(diào)制技術(shù)處理,并作分離后,傳至通信網(wǎng)中的GPRS網(wǎng)和互聯(lián)網(wǎng)。
S3,通信網(wǎng)再將此技術(shù)處理后的信號傳輸交換至后端子系統(tǒng)。
S4,后端子系統(tǒng)經(jīng)過對收到的信號作解調(diào)和解碼,傳到信息監(jiān)測中心。數(shù)據(jù)信息傳至m類電腦,圖像信息至n類電腦。
S5,電腦對收到的信息進行度量技術(shù)作運算,例如受力大小、裂縫長度、寬度計算等,并作分析統(tǒng)計,顯示監(jiān)測的信息和趨勢。
在此案例中,山體橋梁實際情況為十年內(nèi)無發(fā)生重大災(zāi)情,二十年內(nèi)則有一次發(fā)生的背景,信息監(jiān)測中心根據(jù)此應(yīng)用業(yè)務(wù),設(shè)定信息幾率系數(shù)p為低類,取系數(shù)值為0.3;根據(jù)業(yè)務(wù)性質(zhì)和國際信息安全規(guī)則,設(shè)定安全因子μ為B1級,取值為4;時間t為二次上傳的間隔長度,即顯示時長,此設(shè)定為三天,即通常三天采集傳輸一次數(shù)據(jù),但遇到數(shù)據(jù)變化較大時,如5-10%變化,即刻回傳變化的數(shù)據(jù)。通常此可由傳感器靈敏度調(diào)節(jié)設(shè)置。每條信息m設(shè)定為數(shù)據(jù)為10Kb,圖像為500Kb。由此計算機根據(jù)上述信息內(nèi)涵度量公式進行相應(yīng)計算,得出度量值并作分析對比。具體實施步驟如下:
S5.1,計算機將收到的數(shù)據(jù)信息存儲,并根據(jù)I公式,計算出該采集點的I1d值約為5.1。對該點做出受力變化判斷。
S5.2,同理,計算機對收到的其他采集點作運算,得出相應(yīng)Imd值。作出各點受力變化判斷。
S5.3,計算機將收到的圖像信息存儲,并根據(jù)I公式,計算出該采集點的I1p值約為257.2。對該點做出裂縫變化判斷。
S5.4,同理,計算機對收到的其他采集點作運算,得出相應(yīng)Inp值。對各點做出裂縫變化判斷。
S5.5,同樣,計算機對該次收到的所有采集點作統(tǒng)計,得出總的Imd值,對整個山體橋梁受力作出判斷。
S5.6,同樣,計算機對該次收到的所有采集點作統(tǒng)計,得出總的Inp值,對整個山體橋梁作出裂縫判斷。
S5.7,如表1所示,I1d點的值在二天內(nèi)和24小時內(nèi)分別跳變到7.8和15.5,電腦則可判斷該點會發(fā)生事故,發(fā)出黃色警示標(biāo)記,提醒現(xiàn)場處置。由下表可見,傳感器回傳間隔由大至小,說明該點山體活動越頻繁,I1d和I1p的壓力和裂縫變化越大,發(fā)生重大災(zāi)害幾率越大。
表1 I1d和I1p變化趨勢
S5.8,當(dāng)某時段頻繁收到整個區(qū)域信息,而且信息變化較大,即可判斷整體監(jiān)測區(qū)將會發(fā)生重大的災(zāi)害,電腦閃爍紅色告警,管理人員啟動安全預(yù)案機制,實施區(qū)域安全緊急管理。
由此可見,本專利通過多維度模型,度量計算技術(shù),獲得信息內(nèi)涵值,使事物信息更加反映事物的特征,使信息具體化,數(shù)字化,可視化。對于當(dāng)今信息社會和數(shù)字時代,具有極大的應(yīng)用意義。