一種基于動(dòng)態(tài)特征的異構(gòu)物聯(lián)網(wǎng)標(biāo)識識別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于物聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于動(dòng)態(tài)特征的異構(gòu)物聯(lián)網(wǎng)標(biāo)識識別 方法及系統(tǒng)。
【背景技術(shù)】
[0002] 物聯(lián)網(wǎng)的本質(zhì)就是通過RFID(RadioFrequencyIdentification,射頻識別)、無 線傳感器以及衛(wèi)星定位等自動(dòng)識別和感知技術(shù)獲取物品的名稱與地址等標(biāo)識信息以及物 品自身和周邊的相關(guān)屬性信息,并借助各種通訊技術(shù)將物品相關(guān)信息集成到信息網(wǎng)絡(luò)中, 進(jìn)而通過類似互聯(lián)網(wǎng)中解析、尋址、搜索等標(biāo)識信息服務(wù),實(shí)現(xiàn)海量物品相關(guān)信息的智能索 引和整合,并利用云計(jì)算、模糊識別、數(shù)據(jù)挖掘以及語義分析等各種智能計(jì)算技術(shù),對海量 物品相關(guān)信息進(jìn)行分析處理,最終實(shí)現(xiàn)對物理世界智能化的決策和控制。
[0003] 物聯(lián)網(wǎng)環(huán)境中的各種感知信息組成了海量的物聯(lián)網(wǎng)資源,這是物聯(lián)網(wǎng)的典型特 征。在同一個(gè)物聯(lián)網(wǎng)應(yīng)用領(lǐng)域內(nèi)部,或不同應(yīng)用領(lǐng)域之間,海量物聯(lián)網(wǎng)資源的互聯(lián)互通將是 物聯(lián)網(wǎng)發(fā)展面臨的核心難題,是物聯(lián)網(wǎng)"物物互聯(lián)"的關(guān)鍵所在。和傳統(tǒng)互聯(lián)網(wǎng)類似,任何 物聯(lián)網(wǎng)感知資源均需要進(jìn)行統(tǒng)一標(biāo)識和解析,如互聯(lián)網(wǎng)中的域名系統(tǒng),一旦域名系統(tǒng)出現(xiàn) 故障,互聯(lián)網(wǎng)"物理基礎(chǔ)設(shè)施層"被割裂,各類互聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用將無法開展,網(wǎng)絡(luò)間將無法互 聯(lián)互通,互聯(lián)網(wǎng)將會面臨癱瘓。因此,海量物聯(lián)網(wǎng)資源的標(biāo)識、解析等技術(shù)是促進(jìn)物聯(lián)網(wǎng)發(fā) 展的核心支撐。
[0004] 由于政治、經(jīng)濟(jì)及軍事等多方面原因,物聯(lián)網(wǎng)中的標(biāo)識類別非常多,不同國家之間 甚至一個(gè)國家的內(nèi)部都有很多種異構(gòu)標(biāo)識。為實(shí)現(xiàn)對各類異構(gòu)標(biāo)識的兼容、統(tǒng)一解析,迫切 需要一種能自動(dòng)識別各類物聯(lián)網(wǎng)標(biāo)識編碼所屬物聯(lián)網(wǎng)標(biāo)識種類的方法,從而為后續(xù)進(jìn)一步 的處理奠定基礎(chǔ)。
【發(fā)明內(nèi)容】
[0005] 為了解決上述問題,本發(fā)明提供了一種基于動(dòng)態(tài)特征的異構(gòu)物聯(lián)網(wǎng)標(biāo)識識別方法 及系統(tǒng),解決了物聯(lián)網(wǎng)標(biāo)識碼(IoTID)在命名空間發(fā)生沖突情況下的IoTID識別問題,使用 特征向量描述物聯(lián)網(wǎng)標(biāo)識類型和待識別IoTID,通過向量距離刻畫待識別IoTID對發(fā)生沖 突的標(biāo)識類型的隸屬度。
[0006] 物聯(lián)網(wǎng)編碼命名空間是由各行業(yè)的編碼標(biāo)準(zhǔn)文件規(guī)定的,標(biāo)準(zhǔn)文件規(guī)定了IoTID 的長度,每一位或幾位取值范圍以及取值規(guī)則。在標(biāo)準(zhǔn)文件中,將IoTID分成了若干部分, 每一部分都代表一定的現(xiàn)實(shí)含義。如手機(jī)號13810380001可以被分為三個(gè)部分,第一部分 " 138"代表運(yùn)營商,第二部分" 1038"代表地區(qū),第三部分"0001"是隨機(jī)數(shù)。我們將每一部 分稱為一個(gè)分片,分片的邊界成為切分點(diǎn)。
[0007] 由于沒有統(tǒng)一的管理,兩個(gè)或者多個(gè)不相關(guān)的物聯(lián)網(wǎng)標(biāo)識類型的編碼空間可能是 沖突的。因而,依據(jù)標(biāo)準(zhǔn)文件中規(guī)定的長度和范圍的取值規(guī)則對待識別IoTID進(jìn)行正則判 定,得到的符合規(guī)則條件的物聯(lián)網(wǎng)標(biāo)識類型是一個(gè)命名空間沖突的結(jié)果集,我們稱之為沖 突域。得到?jīng)_突域的過程我們稱之為靜態(tài)識別。
[0008] 然而實(shí)際中我們發(fā)現(xiàn),現(xiàn)實(shí)世界(RealWorld)中,IoTID實(shí)際使用的編碼空間可 能僅僅占用了理論編碼空間的非常小的一部分。比如,肉類蔬菜流通追溯碼由行政區(qū)域 編碼+流通節(jié)點(diǎn)碼+經(jīng)營者編碼+交易流水號構(gòu)成,其中"經(jīng)營者編碼"理論編碼空間是 0000-9999,然而在現(xiàn)實(shí)世界中,我們注意到,除去少數(shù)超大型的超市、市場,絕大多數(shù)的流 通節(jié)點(diǎn)不能擁有近萬家商戶。所以,當(dāng)待識別IoTID的經(jīng)營者編碼位的取值超過一定值時(shí), 它屬于肉類蔬菜流通追溯碼的分類的可能性就會相對降低(盡管該IoTID滿足肉類蔬菜流 通追溯碼每一部分的取值要求);當(dāng)這幾位的取值在一定范圍之內(nèi)時(shí),它屬于肉類蔬菜流 通追溯碼分類的可能性就會增加。我們將現(xiàn)實(shí)世界的取值空間的分布稱為動(dòng)態(tài)特征。
[0009] 擁有了這樣的動(dòng)態(tài)特征后,使得在靜態(tài)識別基礎(chǔ)上得到?jīng)_突域后進(jìn)行進(jìn)一步的識 別成為可能。
[0010] 為了實(shí)現(xiàn)"進(jìn)一步"地識別(我們稱作動(dòng)態(tài)識別),本發(fā)明將IoTID與物聯(lián)網(wǎng)類型 分別進(jìn)行特征表示得到在某一類型下的IoTID特征向量和物聯(lián)網(wǎng)類型中心向量,然后求取 在一個(gè)沖突域下,待識別IoTID屬于每一個(gè)類型的特征向量與沖突域所有類型的類中心向 量的距離,距離的大小與對于該類型的隸屬度成反比。
[0011] 具體采用以下技術(shù)方案:
[0012] -種基于動(dòng)態(tài)特征的異構(gòu)物聯(lián)網(wǎng)標(biāo)識識別方法,包括以下步驟:
[0013] 1)對待識別的IoTID進(jìn)行靜態(tài)識別,得到待識別IoTID的物聯(lián)網(wǎng)標(biāo)識類型所屬沖 關(guān)域;
[0014] 2)根據(jù)沖突域中每一種類型的類型切分點(diǎn),對待識別IoTID依次進(jìn)行切分,得到 IoTID分片,進(jìn)而求出待識別IoTID在每一種類型下的特征向量;
[0015] 3)計(jì)算在一個(gè)沖突域下,待識別IoTID在每一個(gè)類型下的特征向量與該類型的類 中心向量的距離;
[0016] 4)根據(jù)上述距離的大小得到待識別IoTID對于各物聯(lián)網(wǎng)標(biāo)識類型的隸屬度,完成 對物聯(lián)網(wǎng)標(biāo)識的識別。
[0017] 進(jìn)一步地,上述靜態(tài)識別包括:依據(jù)物聯(lián)網(wǎng)編碼標(biāo)準(zhǔn)文件中規(guī)定的長度和范圍的 取值規(guī)則對待識別IoTID進(jìn)行正則判定,得到符合規(guī)則條件的物聯(lián)網(wǎng)標(biāo)識類型。
[0018]進(jìn)一步地,待識別IoTID在某類型下的特征向量U1,t2,. . .,tk,. . .,tm)通過以下 方法求得:
[0019]其中,m表示待識別IoTID共有m個(gè)分片,tk表示第k個(gè)分片的特征值,
[0021] XiR表一個(gè)分片,巾(X;)為1;在64位位圖表示下的取值,i= 1,2, . . .,1,所述 64位位圖用于表示根據(jù)物聯(lián)網(wǎng)編碼標(biāo)準(zhǔn)文件劃分的IoTID的每一分片的特征值,IoTID中 的每一位唯一的用0-61中的一個(gè)數(shù)字表示,62、63為保留位。
[0022] 我們希望物聯(lián)網(wǎng)分類的特征可以精準(zhǔn)的描述現(xiàn)實(shí)世界中的IoTID的分布情況,因 而我們需要獲取大量現(xiàn)實(shí)世界IoTID作為訓(xùn)練數(shù)據(jù)集,按照物聯(lián)網(wǎng)分類進(jìn)行分組,將其按 照公式(1)求出分片的特征值和特征向量,最后求出每組的組平均向量作為該物理網(wǎng)分類 的特征,也稱作類中心向量。
[0023] 所述類中心特征向量通過以下方法得出:
[0024] 1)獲取大量現(xiàn)實(shí)世界中的IoTID作為輸入訓(xùn)練樣本,根據(jù)其切分點(diǎn)進(jìn)行分片操 作,得出每個(gè)輸入訓(xùn)練樣本的特征向量;
[0025] 2)求出每一個(gè)類型的平均特征向量作為類中心特征向量。
[0026] 進(jìn)一步地,上述方法還包括從標(biāo)準(zhǔn)文獻(xiàn)中提取物聯(lián)網(wǎng)分類的切分點(diǎn)保存到數(shù)據(jù) 庫。
[0027] 這樣的類中心向量是可以作為線下處理的(off-the-shelf),僅需要將類中心向 量保存到數(shù)據(jù)庫中。如果現(xiàn)實(shí)世界數(shù)據(jù)集數(shù)量不足,可以使用模擬數(shù)據(jù)補(bǔ)充。補(bǔ)充的原則是 根據(jù)調(diào)研的實(shí)際情況,通過截?cái)?,擬合分布等手段,盡量模擬真實(shí)世界的IoTID的分布。等 日后獲取到足夠多的現(xiàn)實(shí)世界的IoTID或者現(xiàn)實(shí)世界數(shù)據(jù)集發(fā)生更新的時(shí)候,可以進(jìn)行替 換與類中心向量的重新計(jì)算。
[0028] 進(jìn)一步地,在一個(gè)沖突域下,待識別IoTID屬于某一個(gè)類型的特征向量與沖突域 所有類型的類中心向量的距離通過以下公式計(jì)算:
[0029]
[0030] 其中,Cl1表示待識別IoTID與第i個(gè)類型的類中心向量的距離,Tlk表示第i個(gè) 類型的類中心向量的第k個(gè)分量,tik表示待識別IoTID在類型i下的特征向量的第k個(gè)分 量,i<n,n表示沖突域中的物聯(lián)網(wǎng)標(biāo)識類型的個(gè)數(shù)。
[0031] 進(jìn)一步地,待識別IoTID對于某一類型的隸屬度通過以下公式計(jì)算:
[0032]
[0033] 其中,yi表示待識別IoTID對于類型i的隸屬度,di表示待識別IoTID與第i個(gè) 類型的類中心向量的距離,d,表示待識別IoTID與第j個(gè)類型的類中心向量的距離。
[0034] 一種基于動(dòng)態(tài)特征的異構(gòu)物聯(lián)網(wǎng)標(biāo)識識別系統(tǒng),包括:
[0035] 靜態(tài)識別模塊,用于對待識別的IoTID進(jìn)行靜態(tài)識別,得到待識別IoTID的物聯(lián)網(wǎng) 標(biāo)識類型所屬沖突域;
[0036] IoTID切分模塊,用于根據(jù)沖突域中每一種類型的類型切分點(diǎn),對待識別IoTID依 次進(jìn)行切分,得到IoTID分片;
[0037] 特征向量轉(zhuǎn)化模塊,用于將IoTID分片轉(zhuǎn)化為特征向量;
[0038] 類中心向量計(jì)算模塊,用于計(jì)算每一個(gè)類型的平均特征向量作為類中心特征向 量;
[0039] 距離計(jì)算模塊,用于計(jì)算待識別IoTID屬于每一個(gè)類型的特征向量與沖突域所有 類型的類中心向量的距離;
[0040] 結(jié)果轉(zhuǎn)換模塊,用于將待識別