本申請要求2014年8月14日提交的題為“Dynamic Feature Set Management(動態(tài)特征集管理)”的美國非臨時申請?zhí)?4/459,933的優(yōu)先權(quán),所述申請通過引用結(jié)合在此。
技術(shù)領(lǐng)域
本申請涉及數(shù)據(jù)自動化領(lǐng)域,并且更具體地涉及一種用于動態(tài)特征集管理的系統(tǒng)和方法。
背景技術(shù):
在某些已知或歷史系統(tǒng)中,數(shù)據(jù)收集由將多個定制的傳感器有目的地放置在已知位置處、以及配置控制系統(tǒng)來從傳感器中收集數(shù)據(jù)組成。這些可以被用作例如開環(huán)或閉環(huán)控制系統(tǒng)的輸入。眾所周知的示例包括放置在有空調(diào)房間中的恒溫器。所述恒溫器測量房間中的溫度,并且打開或關(guān)閉空調(diào)以便補償當前溫度。
在某些示例中,使用定制的傳感器需要開發(fā)和部署定制軟件。隨著傳感器數(shù)量的增加,軟件的復雜度也增加。
附圖說明
當與附圖一起閱讀時,將從以下詳細描述中更好地理解本公開。強調(diào)的是,根據(jù)行業(yè)中的標準實踐,不同特征未按比例繪制,并且僅用于說明性目的。實際上,為了討論清楚,不同特征的尺寸可以被任意放大或減小。
圖1是根據(jù)本說明書的一個或多個示例的被監(jiān)測網(wǎng)絡(luò)的網(wǎng)絡(luò)圖。
圖2A是根據(jù)本說明書的一個或多個示例的數(shù)據(jù)源的框圖。
圖2B是根據(jù)本說明書的一個或多個示例的數(shù)據(jù)聚合器的框圖。
圖3是根據(jù)本說明書的一個或多個示例的聚合引擎的框圖。
圖4是根據(jù)本說明書的一個或多個示例的專家系統(tǒng)的框圖。
圖5是根據(jù)本說明書的一個或多個示例的特征合并和拆分的框圖。
圖6是根據(jù)本說明書的一個或多個示例的特征類的圖解視圖。
圖7是根據(jù)本說明書的一個或多個示例的特征類的圖解視圖。
圖8是根據(jù)本說明書的一個或多個示例的方法的流程圖。
具體實施方式
本公開的示例實施例
以下公開內(nèi)容提供了用于實施本公開的不同特征的許多不同實施例或示例。以下描述了部件和安排的具體示例以便簡化本公開。當然,這些僅是示例并且并不旨在是限制性的。另外,本公開在不同示例中可以重復參考標號和/或字母。這種重復是出于簡明性和清楚性的目的,并且本身并不決定所討論的不同實施例和/或配置之間的關(guān)系。
不同實施例可以具有不同優(yōu)點,并且不必需要任何實施例的特定優(yōu)點。
物聯(lián)網(wǎng)(IoT)的發(fā)展引起數(shù)百萬乃至數(shù)十億設(shè)備上網(wǎng)。這些設(shè)備可以生成大量不同類型的數(shù)據(jù)。由于設(shè)備的數(shù)量和類型不斷增長,并且由于數(shù)據(jù)的量和種類也變得大且笨拙,因此可能遇到與這些不同設(shè)備的操作相關(guān)聯(lián)的數(shù)據(jù)偽像。應(yīng)對這樣的環(huán)境可能需要獲得不同類型的數(shù)據(jù)偽像并對其進行語義映射,并且需要基于所述映射數(shù)據(jù)進行情景分析和響應(yīng)生成。
說明性示例是IoT環(huán)境中的安全性。一種安全性相關(guān)活動是實時檢測異?,F(xiàn)象以及相關(guān)聯(lián)的硬件和/或軟件故障和攻擊,所述安全性相關(guān)活動可以通過使用先進的數(shù)值分析和大數(shù)據(jù)IoT環(huán)境完成。為了檢測新類型的攻擊和異?,F(xiàn)象,并且為了有效阻止集中攻擊(由短時間跨度和非常新的目標來表征),系統(tǒng)可能需要能夠迅速地消耗新輸入(本文中指“特征”)。
大量且各種各樣的特征使得手動地配置所有特征和輸出并且手動地合并相似數(shù)據(jù)類型越來越不切實際。進一步地,可能需要對新特征進行自動評估、語義映射和智能應(yīng)用??赡苄枰喜⒂杏锰卣?包括重疊特征),同時可能需要拆分或丟棄無效或錯誤特征。
在某些已知系統(tǒng)中,多特征問題的一種解決方案可能采用安全信息和事件管理系統(tǒng)(SIEM)的形式,所述解決方案使用在所述系統(tǒng)的數(shù)據(jù)采集層部件中執(zhí)行的每數(shù)據(jù)源靜態(tài)語義映射器來標準化并規(guī)范化特征。然而,在本說明書中應(yīng)認識到,在某些實施例中,這種方法可能存在一些缺點,如比較昂貴且緩慢。在一些情況下,SIEM可能需要對多個產(chǎn)品做出相關(guān)改變。此外,隨著數(shù)據(jù)表示標準的改變,通常需要對傳統(tǒng)數(shù)據(jù)進行追溯修改。這還可能導致擴展的特征集以及增加的計算成本(每個特征通常是機器學習算法中的額外維度,有可能導致所需計算資源的顯著增加)。對流體特征集的有效管理(如語義映射、創(chuàng)建、合并、傳遞、存儲和刪除)可能是互聯(lián)網(wǎng)規(guī)模數(shù)據(jù)管理中的重大挑戰(zhàn)。
根據(jù)本說明書的示例系統(tǒng)和方法,提供了用于提供如以下有用特征的能力:
自動評估新特征;
合并完全相同、相關(guān)或重疊特征,如通過語義映射;
相比于拆分的特征,評估合并特征的系統(tǒng)效率;以及
拆分錯誤合并的特征。
為此,提供了一種網(wǎng)絡(luò),如互聯(lián)網(wǎng)或本地網(wǎng)。多個數(shù)據(jù)源被連接至網(wǎng)絡(luò),并且可以包括如傳感器、計算機、換能器、數(shù)據(jù)聚合器以及其他類似類型的設(shè)備等不同設(shè)備。即使在單個設(shè)備類中,也可以提供各種各樣的輸出。例如,在傳感器類中,僅通過非限制性示例的方式,可能存在溫度傳感器、濕度傳感器、污染傳感器、水分傳感器、運動傳感器、音頻傳感器、電磁干擾傳感器、紅外傳感器以及振動傳感器。
所述多個數(shù)據(jù)源中的每個數(shù)據(jù)源可以來自不同供應(yīng)商,并且可以采用不同格式提供輸出。每個數(shù)據(jù)源還可以通過不同類型的連接而連接至網(wǎng)絡(luò),并且可以具有不同目的。因此,隨著數(shù)據(jù)源的數(shù)量大大增加,聚合數(shù)據(jù)源并提供對現(xiàn)實世界現(xiàn)象的有用簡況、同時使用戶或系統(tǒng)能夠采用適當行動來響應(yīng)那些現(xiàn)實世界現(xiàn)象變得越來越難。
僅采用一個示例,考慮服務(wù)器群的情況。通過非限制性示例的方式,服務(wù)器群自身可以托管許多不同類型的服務(wù)器,如機架式服務(wù)器、刀片式服務(wù)器、獨立服務(wù)器、專用存儲設(shè)備,并且每個服務(wù)器都具有若干種操作系統(tǒng)中的一種操作系統(tǒng),如Microsoft Windows、企業(yè)UNIX、Linux或?qū)崟r操作系統(tǒng)。
每個服務(wù)器都可以生成可用于網(wǎng)絡(luò)的多個輸出作為特征。例如,通過非限制性示例的方式,每個服務(wù)器都可以具有測量硬盤速度、CPU溫度、防病毒狀態(tài)、磁盤使用率、存儲器使用率、外圍設(shè)備連接以及正常運行時間的內(nèi)部傳感器。
除了由服務(wù)器自身所提供的輸出外,許多其他設(shè)備可以在服務(wù)器群內(nèi)可操作。例如,可以提供具有移動感應(yīng)圖像捕獲算法的許多安全攝像機,這些移動感應(yīng)圖像捕獲算法可操作用于當人員或物體在服務(wù)器群房間內(nèi)移動時進行檢測,并且用于捕獲圖像。然后,所述攝像機可以連同所述圖像一起提供警告,指示服務(wù)器群中可能存在未授權(quán)人員。通過非限制性示例的方式,其他重要因素可能是HVAC(加熱、通風以及空調(diào))狀態(tài)、環(huán)境溫度、外部溫度、電源狀態(tài)和波動、環(huán)境條件(如輻射和污染)、入侵檢測警告狀態(tài)、其他環(huán)境傳感器(如輻射傳感器、污染傳感器、濕度傳感器、臭氧探測器以及煙霧探測器)的狀態(tài)。還可能存在網(wǎng)絡(luò)健康指示器、關(guān)于操作和訪問服務(wù)器的多個用戶的數(shù)據(jù)、關(guān)于外圍設(shè)備的狀態(tài)的數(shù)據(jù)以及具有各種用處的其他度量。
僅在一種環(huán)境中處理、聚合并有效地應(yīng)用對數(shù)據(jù)的這種大量且不同的收集對人類操作員來說可能變得過于難管理。因此,有利的是使自動聚合和專家系統(tǒng)可用于智能地收集和聚合輸入,并且智能地將它們應(yīng)用于有源系統(tǒng)。
在一個示例中,存在連接至網(wǎng)絡(luò)的數(shù)據(jù)聚合器,通過非限制性示例的方式,所述數(shù)據(jù)聚合器可以包括鑒別器、合并器、拆分器、轉(zhuǎn)換器和評估器。所述數(shù)據(jù)聚合器可以被配置成用于接收大量特征,包括在一些實施例中描述每個特征的元數(shù)據(jù)。在一些情況下,元數(shù)據(jù)可以采用符合標準的格式(如可擴展標記語言(XML))來提供。例如,XML特征描述可以如下:
″featurename=featurel″,″id=1″,″previousid=NUL″,
″type=unsigned32″,″sourceproductgroup=SIEM″,
″sourceversion=9.3″,″min=0″,″max=10000″,
″keywords=SIEM,featurel″,″attributel=NUL″,
″featurecreated=2014-01-01T13:10:02.47″,
″lastmerged=2014-01-15T15:15:05.06″
在另一個特征的示例中,描述可以是:
″featurename=detectionname″,″id=2″,″previousid=NUL″,
″type=string″,″sourceproductgroup=virusscan″,
″sourceversion=8.8″,
″keywords=malware,irus,detection,name″
″featurecreated=2014-01-01T13:10:02.05″,
″lastmerged=2014-01-15T15:15:05.06″
數(shù)據(jù)聚合器可以可操作用于智能地掃描元數(shù)據(jù),并且做出關(guān)于應(yīng)當合并哪些特征以及出于反饋目的應(yīng)當向某些控制系統(tǒng)提供哪些特征的明智決策。例如,對人類用戶來說可能明顯的是,以上描述的兩個特征是不同的并且不應(yīng)當被合并。
盡管顯而易見的是本說明書公開的系統(tǒng)和方法廣泛的應(yīng)用于各種各樣的系統(tǒng),但是可以通過說明和示例的方式有效地考慮服務(wù)器群的加熱、通風以及空調(diào)(HVAC)系統(tǒng)。示例HVAC可以受益于遍及服務(wù)器群放置的多個溫度傳感器。
然而,其他溫度輸入可以從其他設(shè)備獲得,并且如果其他溫度輸入能夠有效地與來自HVAC的定制溫度傳感器的數(shù)據(jù)相關(guān)或聚合,那么它們可以為HVAC控制器提供更精確的反饋。因此,可以提供數(shù)據(jù)聚合器來聚合可組合特征。然而,可組合特征不可能總是采用兼容格式。例如,HVAC的定制溫度傳感器可以使用XML字段“featurename=temp_hvac”來標識溫度特征,而獨立溫度傳感器可以使用如“output_type=temperature等XML字段。對人類用戶來說可能明顯的是,這些特征是合并器的良好候選項。
本說明書的聚合器可以被配置成用于識別“featurename”和“output_type”兩者均標識所討論的特征,并且“temp_hvac”和“temperature”兩者均標識溫度測量。聚合器還可以得出其他有用結(jié)論。例如,例如,在意大利的溫度傳感器對基于加利福尼亞州圣何塞市的服務(wù)器群中操作的HVAC具有很少或者沒有有用數(shù)據(jù)。實際上,將意大利數(shù)據(jù)與圣何塞數(shù)據(jù)進行聚合可能導致降低的運行效率。
因此,聚合器可以被配置有處理這些狀況的智能等級。首先,聚合器可以從其他元數(shù)據(jù)中推斷位置,如找到“sensor_location”字段(如果可用),或者確定傳感器的IP地址可能將其放置在服務(wù)器群中或附近。聚合器還可以接收反饋來確定合并的有效性。例如,在不經(jīng)意地將意大利數(shù)據(jù)與圣何塞數(shù)據(jù)進行合并后,HVAC可能開始更加努力地工作以改變圣何塞服務(wù)器群中的溫度,但是對聚合數(shù)據(jù)集的效果卻差強人意。圣何塞傳感器還可以顯示與彼此的強跟蹤,而意大利傳感器可能對圣何塞HVAC的操作極不敏感。因此,聚合器可以確定具有意大利傳感器的合并器沒有幫助,并且可以拆分所述數(shù)據(jù)集。
在另一個示例中,數(shù)據(jù)聚合器可以確定CPU溫度傳感器應(yīng)當與HVAC傳感器相聚合。這可能使HVAC控制器相信在服務(wù)器房間中存在很大的溫度瞬變,因為通常CPU溫度將比周圍環(huán)境溫度高很多。因此,HVAC可以急劇地改變其冷卻輸出以試圖補償錯誤的溫度瞬變。CPU溫度傳感器可以在某種程度上響應(yīng)此增加的輸出,像它們在服務(wù)器群中一樣,但是所述響應(yīng)可能是相對非彈性的,從而,相比于為所述結(jié)果占用的能量,在聚合特征中提供不滿意的響應(yīng)。因此,可以拆分所述特征,增加HVAC的效率。
圖1是根據(jù)本說明書的一個或多個示例的被監(jiān)測網(wǎng)絡(luò)100的網(wǎng)絡(luò)層次圖。被監(jiān)測網(wǎng)絡(luò)100包括連接至網(wǎng)絡(luò)170的多個數(shù)據(jù)源120。同樣連接至網(wǎng)絡(luò)170的是數(shù)據(jù)聚合器110,所述數(shù)據(jù)聚合器通信地耦合至控制受控系統(tǒng)140的專家系統(tǒng)130。受控系統(tǒng)140向數(shù)據(jù)聚合器110提供反饋142。
在一個或多個示例中,公開了數(shù)據(jù)源120-1至120-N。這是為了說明數(shù)據(jù)源120的數(shù)量可能很大,并且可能隨著新數(shù)據(jù)源120添加到被監(jiān)測網(wǎng)絡(luò)100或從被監(jiān)測網(wǎng)絡(luò)100中移除而不斷波動。如以上所描述的,通過大量數(shù)據(jù)源120以及通過被監(jiān)測網(wǎng)絡(luò)100的動態(tài)特性來管理數(shù)據(jù)源120可能都比較復雜。因此,在某些實施例中,對人類管理員來說,監(jiān)測并管理各個數(shù)據(jù)源120中的所有數(shù)據(jù)源可能是不切實際的。此外,數(shù)據(jù)源120不可能靜態(tài)地位于網(wǎng)絡(luò)170上。例如,許多汽車運載數(shù)據(jù)收集設(shè)備,并且隨著它們在移動網(wǎng)絡(luò)上從節(jié)點跳到節(jié)點,可以向網(wǎng)絡(luò)170提供數(shù)據(jù)。因此,提前預測數(shù)據(jù)將從哪個方向來或數(shù)據(jù)的特性可能是什么可能是不現(xiàn)實的。
通過進一步復雜化,多個數(shù)據(jù)源120可以提供類似或完全相同類型但格式稍微不同的數(shù)據(jù)特征。在一個示例中,每個數(shù)據(jù)源120被配置成用于提供數(shù)據(jù)流,伴隨有標識數(shù)據(jù)類型和數(shù)據(jù)源的元數(shù)據(jù)包。然而,可能不存在針對這些元數(shù)據(jù)包的全球?qū)嵤┗蚩蓪嵤藴省T谝粋€示例中,數(shù)據(jù)源120可以至少在遞送格式上針對元數(shù)據(jù)進行標準化,如XML或類似的符合標準的數(shù)據(jù)格式。在這種情況下,元數(shù)據(jù)可以具有許多可識別字段名,從中可以推斷出特征類型和源。還應(yīng)注意的是,在一些情況下,數(shù)據(jù)源120可以提供屬于兼容類型但采用不同格式的特征。此種情況的示例是由一個數(shù)據(jù)源120-1以華氏度提供的溫度特征,以及由第二個數(shù)據(jù)源120-2以攝氏度提供的第二特性。以下任何情況都可能遭遇類似問題:兩個或更多個數(shù)據(jù)源傳送類似的特征,一個數(shù)據(jù)源以公制單位提供特征,并且另一個數(shù)據(jù)源以英制單位或美國常用單位提供特征。
來自不同源并且采用不同格式的不同類型的此較大特征集合經(jīng)由網(wǎng)絡(luò)170傳送至數(shù)據(jù)聚合器110。數(shù)據(jù)聚合器110收集所述許多特征,并且嘗試根據(jù)有用的分類法對這些特征進行分類。在一種情況下,數(shù)據(jù)聚合器110定義了具有任意數(shù)量分類等級的分類法,如類、子類、類屬以及種類。例如,環(huán)境數(shù)據(jù)類可以包括溫度子類,所述子類可以按照位置或源包括進一步的溫度種類。在一個示例中,將所有環(huán)境特征分類為環(huán)境特征,將溫度特征分類為溫度特征,并且可以通過數(shù)據(jù)聚合器110將普通種類的溫度特征聚合為可以有效地組合的種類。然后,數(shù)據(jù)聚合器110可以向?qū)<蚁到y(tǒng)130提供一個或多個輸出。
專家系統(tǒng)130可以包括可操作用于收集特征并控制一個或多個受控系統(tǒng)140的一個或多個設(shè)備。專家系統(tǒng)130可以基于查找表、計算機模型、算法或機器學習技術(shù)做出決策。由數(shù)據(jù)聚合器110提供的特征可以將鍵盤輸入提供到專家系統(tǒng)130必須做出的決策中。
受控系統(tǒng)140可以包括許多現(xiàn)實世界系統(tǒng),如空調(diào)系統(tǒng)、環(huán)境系統(tǒng)、安全系統(tǒng)、交通系統(tǒng)、基于空間的系統(tǒng)、以及經(jīng)受自動控制或數(shù)據(jù)驅(qū)動操作的任何其他系統(tǒng)。在某些實施例中,受控系統(tǒng)140可以包括用于測量受控系統(tǒng)140對來自專家系統(tǒng)130的輸入的響應(yīng)的設(shè)施。然后,受控系統(tǒng)140可以向數(shù)據(jù)聚合器110提供反饋142。這可能允許數(shù)據(jù)聚合器110測量組合或交叉關(guān)聯(lián)某些特征的效果。在數(shù)據(jù)聚合器110確定組合或交叉關(guān)聯(lián)某些特征對受控系統(tǒng)140產(chǎn)生最小影響或在某些情況下甚至對受控系統(tǒng)140產(chǎn)生負面影響的情況下,數(shù)據(jù)聚合器110可以選擇拆分沒有被發(fā)現(xiàn)是有用組合的某些特征。
圖2A是根據(jù)本說明書的一個或多個示例的數(shù)據(jù)源120的框圖。在各個實施例中,通過非限制性示例的方式,“數(shù)據(jù)源”可以是或者包括:傳感器、檢測器、外圍設(shè)備、監(jiān)測設(shè)備、換能器、智能控制系統(tǒng)、監(jiān)測系統(tǒng)、衛(wèi)星或基于空間的系統(tǒng)、計算機、嵌入式計算機、嵌入式控制器、嵌入式傳感器、個人數(shù)字助理(PDA)、膝上型計算機、蜂窩電話、IP電話、智能電話、平板計算機、可轉(zhuǎn)換平板計算機、手持式計算器、或用于處理和傳遞數(shù)據(jù)的任何其他電子、微電子或微機電設(shè)備。根據(jù)本說明書的數(shù)據(jù)源的定義特性是其根據(jù)本說明書的系統(tǒng)和方法提供了一個或多個特征。
數(shù)據(jù)源120包括連接至存儲器220的處理器210,所述存儲器具有存儲在其中的用于提供操作系統(tǒng)222和數(shù)據(jù)收集引擎224的可執(zhí)行指令。數(shù)據(jù)源120的其他部件包括存儲設(shè)備250、網(wǎng)絡(luò)接口280和外圍設(shè)備接口240。
在示例中,處理器210經(jīng)由存儲器總線270-3通信地耦合至存儲器220,所述存儲器總線可以是例如直接存儲器訪問(DMA)總線。處理器210可以經(jīng)由系統(tǒng)總線270-1通信地耦合至其他設(shè)備。如貫穿本說明書所使用的,“總線”包括任何有線或無線互連線、網(wǎng)絡(luò)、連接、束、單條總線、多條總線、交叉式網(wǎng)絡(luò)、單級網(wǎng)絡(luò)、多級網(wǎng)絡(luò)或可操作用于在計算設(shè)備的各個部分之間或計算設(shè)備之間承載數(shù)據(jù)、信號或功率的其他傳導介質(zhì)。應(yīng)當注意的是,這些使用僅僅通過非限制性示例的方式公開,并且一些實施例可以省略前述總線中的一種或多種總線,而其他實施例可以采用附加或不同總線。
在各個示例中,“處理器”可以包括硬件、軟件或提供可編程邏輯的固件的任何組合,通過非限制性示例的方式,包括微處理器、數(shù)字信號處理器、現(xiàn)場可編程門陣列、可編程邏輯陣列、專用集成電路或虛擬機處理器。
處理器210可以經(jīng)由存儲器總線270-3連接至DMA配置中的存儲器220。為了簡化本公開,存儲器220被公開為單個邏輯塊,但是在物理實施例中可以包括任何合適的易失性或非易失性存儲器技術(shù)(或多項技術(shù))的一個或多個塊,包括例如DDR RAM、SRAM、DRAM、緩存、L1或L2存儲器、片上存儲器、寄存器、閃存、ROM、光介質(zhì)、虛擬存儲器區(qū)域、磁或磁帶存儲器或類似的存儲設(shè)備。在某些實施例中,存儲器220可以包括相對低延遲易失性主存儲器,而存儲設(shè)備250可以包括相對較高延遲非易失性存儲器。然而,存儲器220和存儲設(shè)備250不需要是物理上獨立的設(shè)備,并且在一些示例中,可能僅表示功能的邏輯分離。還應(yīng)注意的是,盡管通過非限制性示例的方式公開了DMA,但是DMA不是與本說明書相一致的唯一協(xié)議,并且其他存儲器架構(gòu)是可用的。
存儲設(shè)備250可以是任何種類的存儲器220,或者可以是分離的設(shè)備,如硬盤驅(qū)動器、固態(tài)驅(qū)動器、外部存儲設(shè)備、獨立磁盤冗余陣列(RAID)、網(wǎng)絡(luò)附接存儲設(shè)備、光學存儲設(shè)備、磁帶驅(qū)動器、備份系統(tǒng)、云存儲設(shè)備、或前述任何組合。存儲設(shè)備250可以是或者其中可以包括一個或多個數(shù)據(jù)庫或者存儲在其他配置中的數(shù)據(jù),并且可以包括操作軟件的存儲副本,如操作系統(tǒng)和操作系統(tǒng)222的副本以及數(shù)據(jù)收集引擎224的軟件部分。許多其他配置也是可能的,并且旨在被涵蓋在本說明書的廣義范圍內(nèi)。
可以提供網(wǎng)絡(luò)接口280來將數(shù)據(jù)源120與有線或無線網(wǎng)絡(luò)通信地耦合。如貫穿本說明書所使用的“網(wǎng)絡(luò)”可以包括可操作用于在計算設(shè)備內(nèi)或在計算設(shè)備之間交換數(shù)據(jù)或信息的任何通信平臺,通過非限制性示例的方式包括自組織本地網(wǎng)、提供具有電交互能力的通信設(shè)備的互聯(lián)網(wǎng)架構(gòu)、簡易老式電話系統(tǒng)(POTS)(計算設(shè)備可以使用所述簡易老式電話系統(tǒng)來執(zhí)行交易,在所述交易中它們可以由人類操作員來幫助或在所述交易中它們可以自動地將數(shù)據(jù)鍵入到電話或其他合適的電子設(shè)備中)、提供通信接口或在系統(tǒng)中的任何兩個節(jié)點之間進行交換的任何分組數(shù)據(jù)網(wǎng)絡(luò)(PDN)、或任何局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、無線局域網(wǎng)(WLAN)、虛擬專用網(wǎng)(VPN)、內(nèi)聯(lián)網(wǎng)、本地數(shù)據(jù)總線或促進網(wǎng)絡(luò)或電話環(huán)境中的通信的任何其他適當?shù)募軜?gòu)或系統(tǒng)。
在一個示例中,數(shù)據(jù)收集引擎224是執(zhí)行根據(jù)本說明書的方法的工具或程序。在各個實施例中,數(shù)據(jù)收集引擎224可以在硬件、軟件、固件或其一些組合中被具體化。例如,在一些情況下,數(shù)據(jù)收集引擎224可以包括被設(shè)計成用于執(zhí)行方法的專用集成電路,并且還可以包括可操作用于指示處理器執(zhí)行所述方法的軟件指令。可以將所述軟件提供為“守護進程”程序,包括任何程序或一系列可執(zhí)行指令,無論在硬件、軟件、固件或其任何組合中實施與否,那些可執(zhí)行指令都作為后臺進程、終止并駐留程序、服務(wù)、系統(tǒng)擴展、控制面板、啟動程序、BIOS子程序、或沒有直接用戶交互操作的任何類似程序的運行。還應(yīng)注意的是,數(shù)據(jù)收集引擎224僅通過非限制性示例的方式被提供,并且包括交互式或用戶模式軟件的其他硬件和軟件還可以結(jié)合、除了或替代數(shù)據(jù)收集引擎224而被提供,以便執(zhí)行根據(jù)本說明書的方法。
在一個示例中,數(shù)據(jù)收集引擎224包括存儲在可操作用于執(zhí)行圖8的方法800、或其軟件部分、或根據(jù)本說明書的類似方法的非瞬態(tài)介質(zhì)上的可執(zhí)行指令。在適當時間上(如根據(jù)啟動數(shù)據(jù)源120或根據(jù)來自操作系統(tǒng)或用戶的命令),處理器210可以從存儲設(shè)備250中檢索數(shù)據(jù)收集引擎224(或其軟件部分)的副本并將其加載到存儲器220中。然后,處理器210可以迭代地執(zhí)行數(shù)據(jù)收集引擎224的指令。
外圍設(shè)備接口240包括連接至數(shù)據(jù)源120但不一定是數(shù)據(jù)源120的核心架構(gòu)的一部分的任何輔助設(shè)備。外圍設(shè)備可以可操作用于向數(shù)據(jù)源120提供擴展功能,并且可以或可以不完全依賴于數(shù)據(jù)源120。在一些情況下,外圍設(shè)備可以是其自身的計算設(shè)備。通過非限制性示例的方式,外圍設(shè)備可以包括輸入和輸出設(shè)備,如顯示器、終端、打印機、鍵盤、鼠標、調(diào)制解調(diào)器、網(wǎng)絡(luò)控制器、傳感器、換能器、致動器、控制器、數(shù)據(jù)采集總線、照相機、麥克風、揚聲器、或外部存儲設(shè)備。在示例中,外圍設(shè)備包括一個或多個傳感器290,所述一個或多個傳感器可以被配置并且可操作用于收集關(guān)于現(xiàn)實世界現(xiàn)象的數(shù)據(jù)并且將數(shù)據(jù)處理成數(shù)字形式。
在一個操作性示例中,數(shù)據(jù)收集引擎224經(jīng)由外圍設(shè)備接口240從傳感器290處收集數(shù)據(jù)。然后,將所收集的數(shù)據(jù)存儲在存儲設(shè)備250中和/或?qū)⑵浒l(fā)送通過網(wǎng)絡(luò)接口280。
圖2B是根據(jù)本說明書的一個或多個示例的數(shù)據(jù)聚合器110的框圖。在示例中,數(shù)據(jù)聚合器110是計算設(shè)備。如貫穿本說明書所使用的,通過非限制性示例的方式,“計算設(shè)備”可以是或者包括:計算機、嵌入式計算機、嵌入式控制器、嵌入式傳感器、個人數(shù)字助理(PDA)、膝上型計算機、蜂窩電話、IP電話、智能電話、平板計算機、可轉(zhuǎn)換平板計算機、手持式計算器、或用于處理和傳遞數(shù)據(jù)的任何其他電子、微電子或微機電設(shè)備。還參考圖2A的相關(guān)聯(lián)描述,其中,示例和定義還可以應(yīng)用于圖2B(在它們相關(guān)的程度上)。
數(shù)據(jù)聚合器110包括連接至存儲器320的處理器310,所述存儲器具有存儲在其中的用于提供操作系統(tǒng)322和聚合引擎324的可執(zhí)行指令。數(shù)據(jù)聚合器110的其他部件包括存儲設(shè)備350、網(wǎng)絡(luò)接口380和外圍設(shè)備接口340。
在示例中,處理器310經(jīng)由存儲器總線370-3通信地耦合至存儲器320,所述存儲器總線可以是例如直接存儲器訪問(DMA)總線。處理器310可以經(jīng)由系統(tǒng)總線370-1通信地耦合至其他設(shè)備。
處理器310可以經(jīng)由存儲器總線370-3連接至DMA配置中的存儲器320。為了簡化本公開,存儲器320被公開為單個邏輯塊,但是在物理實施例中可以包括任何合適的易失性或非易失性存儲器技術(shù)(或多項技術(shù))的一個或多個塊。
存儲設(shè)備350可以是任何種類的存儲器320,或者可以是分離的設(shè)備。存儲設(shè)備350可以是或其中可以包括一個或多個數(shù)據(jù)庫或存儲在其他配置中的數(shù)據(jù),并且可以包括操作軟件的存儲副本,如操作系統(tǒng)和操作系統(tǒng)322的副本以及聚合引擎324的軟件部分。許多其他配置也是可能的,并且旨在被涵蓋在本說明書的廣義范圍內(nèi)。
可以提供網(wǎng)絡(luò)接口380來將數(shù)據(jù)聚合器110與有線或無線網(wǎng)絡(luò)通信地耦合。
在一個示例中,聚合引擎324是執(zhí)行根據(jù)本說明書的方法的工具或程序。在各個實施例中,聚合引擎324可以是硬件、軟件、固件或其一些組合。例如,在一些情況下,聚合引擎324可以包括被設(shè)計成用于執(zhí)行方法的專用集成電路,并且還可以包括可操作用于指示處理器執(zhí)行所述方法的軟件指令。還應(yīng)當注意的是,聚合引擎324僅通過非限制性示例的方式被提供,并且包括交互式或用戶模式軟件的其他硬件和軟件還可以結(jié)合、除了或替代聚合引擎324而被提供,以便執(zhí)行根據(jù)本說明書的方法。
在一個示例中,聚合引擎324包括存儲在可操作用于執(zhí)行圖8的方法800、或其軟件部分、或根據(jù)本說明書的類似方法的非瞬態(tài)介質(zhì)上的可執(zhí)行指令。在適當時間上(如根據(jù)啟動數(shù)據(jù)聚合器110或根據(jù)來自操作系統(tǒng)或用戶的命令),處理器310可以從存儲設(shè)備350中檢索聚合引擎324(或其軟件部分)的副本并將其加載到存儲器320中。然后,處理器310可以迭代的執(zhí)行聚合引擎324的指令。
圖3是根據(jù)本說明書的一個或多個示例的聚合引擎324的框圖。應(yīng)當注意的是,如以上描述的,聚合引擎324可以包括硬件、軟件、固件或可操作用于提供聚合引擎324的功能的其他控制系統(tǒng)的任何組合。因此,本說明書的意圖是,術(shù)語“聚合引擎”涵蓋硬件、軟件、固件或被配置并且可操作用于執(zhí)行如在此描述的聚合引擎324的方法的其他結(jié)構(gòu)。
在一些情況下,聚合引擎324可以是離散且分離的單元,如片上系統(tǒng)、單板計算機、專用集成電路、獨立計算機設(shè)備或類似單元。在其他情況下,聚合引擎324的功能可以遍布計算設(shè)備或網(wǎng)絡(luò)分布。因此,例如,可以由數(shù)據(jù)庫服務(wù)器提供某種數(shù)據(jù),同時可以由一個或多個串聯(lián)操作的處理器提供一定的智能。因此,應(yīng)當理解的是,聚合引擎324不一定需要是與被監(jiān)測網(wǎng)絡(luò)100的其他部件分離的單個單元。本領(lǐng)域的技術(shù)人員將理解到許多其他配置是可能的。
圖3通過示例的方式公開了提供給聚合引擎324的新特征331。這是僅通過示例的方式公開的,并且在一些情況下,可以將多個新特征331作為單元或者分離地提供給聚合引擎324。
在本示例中,將新特征331提供給特征數(shù)據(jù)庫330。特征數(shù)據(jù)庫330通信地耦合至鑒別器332,所述鑒別器通信地耦合至合并器334。可以將合并器334通信地耦合至轉(zhuǎn)換器339和專家系統(tǒng)130。還可以將轉(zhuǎn)換器339通信地耦合至專家系統(tǒng)130。專家系統(tǒng)130控制受控系統(tǒng)140,所述受控系統(tǒng)向評估器338提供反饋。評估器338提供拆分器336,所述拆分器也通信地耦合至專家系統(tǒng)130以便提供拆分特征。應(yīng)當注意的是,為了說明性目的,這種安排僅通過示例的方式提供,并且實際信號路徑和操作細節(jié)可能與圖3中公開的安排顯著不同。
在示例中,鑒別器332可操作用于接收來自特征數(shù)據(jù)庫330的一個或多個特征。來自特征數(shù)據(jù)庫330的特征可以包括新特征331。然后,鑒別器332可以根據(jù)在此所公開的分類法和方法來對新特征331進行分類。例如,鑒別器332可以確定被以不同方式標記(如在“featurename”字段中具有不同值,或具有多個不同值,一個在“featurename”字段中并且一個在“name”字段中)的兩個特征是合并器的候選項。動態(tài)特征管理的有效性明顯地取決于由鑒別器332所提供的鑒別質(zhì)量。為了幫助鑒別器332做出正確的決策,可以提供特征的靜態(tài)元數(shù)據(jù)描述。例如:
特征的元語言(例如,類型、標簽、名稱、描述、標記和關(guān)鍵詞)的屬性。任何組合都可以提供特征語義相關(guān)性的有用提示和/或針對可適用分析活動的線索。例如,一個特征中的“用戶名(user name)”可以是另一個特征中的“用戶名(username)”、第三個特征中的“登錄名(login name)”以及第四個特征中的“賬戶(account)”。
內(nèi)容的直接分析。例如,不同登錄日志中的直接匹配(其中,一個標識為“username=j(luò)ohndoe”,并且另一個具有“account=j(luò)ohndoe”)將提示“username”==“account”,并且這是可能的特征重疊。
特征詞庫。使用針對特征的詞庫可以提供“模糊”匹配,有可能具有伴隨置信水平。例如,詞庫可以指示“username”==“account”具有98%置信度。關(guān)聯(lián)可以由外部源驅(qū)動,如云安全服務(wù)或互聯(lián)網(wǎng)眾包。詞庫可以基于特征的元語言描述中的語義相似度來幫助對特征進行分組。
在由專家系統(tǒng)130所使用的算法中的特征的適用性或?qū)嵱眯浴?/p>
合并器334從鑒別器332處接收已經(jīng)被標識為合并器候選項的兩個或更多個特征。然后,合并器334可以做出關(guān)于新特征331是否可以與其他現(xiàn)有特征有效地合并的判定。如果合并器334確定新特征331可以有效地與其他特征組合,則合并器334可以形成新動態(tài)特征337。
如果合并器334確定新特征331與現(xiàn)有特征兼容,但它們采用不同格式(如使用不同單位),則合并器334可以向轉(zhuǎn)換器339提供這些特征。轉(zhuǎn)換器339可以將新特征331轉(zhuǎn)換為使得其可以與現(xiàn)有特征進行合并的格式。然后,聚合引擎324提供經(jīng)轉(zhuǎn)換且合并的特征作為動態(tài)特征337。
在示例中,合并器334保留關(guān)于合并過程的足夠信息以便稍后如果需要則回退所述合并。
如本說明書中所描述的,然后,專家系統(tǒng)130可以基于動態(tài)特征337下發(fā)控制。在空調(diào)系統(tǒng)的示例中,專家系統(tǒng)130可以確定一旦動態(tài)特征337的值下降至低于某個溫度,那么應(yīng)當打開空調(diào)或應(yīng)當增加空調(diào)的功率。然后,專家系統(tǒng)130將控制信號下發(fā)至受控系統(tǒng)140(在HVAC的情況下)以便嘗試實現(xiàn)期望的現(xiàn)實世界現(xiàn)象(在這種情況下,將溫度調(diào)節(jié)至期望值)。應(yīng)當注意的是,專家系統(tǒng)130不需要是集中式的或單個專家系統(tǒng)。在一些情況下,每個受控系統(tǒng)140可以具有其自身的專家系統(tǒng)130,如內(nèi)部控制器。因此,盡管這樣的系統(tǒng)被預期為一個示例,但其并不旨在將本說明書限制在提供單個、單片式、集中式專家系統(tǒng)130的應(yīng)用。
由于受控系統(tǒng)140執(zhí)行專家系統(tǒng)130的指令,因此其可以經(jīng)歷效果和效率的可測量改變。例如,如果證明動態(tài)特征337是有用的合并,則相比于將先前單獨靜態(tài)特征操作為輸入,利用動態(tài)特征337操作為輸入,受控系統(tǒng)140可以更有效或更有效率地運行。然而,如果動態(tài)特征337提供很小的效率或有效性變化或者沒有提供所述變化,或者甚至具有負面影響,則可能期望將這些特征拆分。
評估器338根據(jù)動態(tài)特征337評估受控系統(tǒng)140的有效性。因為并不期望合并器334是完美的,因此它有時將在其合并決策中犯錯。如果評估器338確定動態(tài)特征337是無用的、幾乎無用的、或有害的,則其可以向拆分器336提供動態(tài)特征337。一種標識此類錯誤的方法是采用可以在監(jiān)督模式或非監(jiān)督模式之一中操作的機器學習。評估器338還可以可操作用于確認基于合并的特征的異常檢測在容忍度內(nèi)具有與合并的特征相同的質(zhì)量。
拆分器336可操作并被配置成用于從動態(tài)特征337中拆分新特征331。然后,拆分器336可以向?qū)<蚁到y(tǒng)130提供拆分的特征。
圖4是根據(jù)本說明書的一個或多個示例的專家系統(tǒng)130的框圖。在示例中,數(shù)據(jù)聚合器110是計算設(shè)備。還參考圖2A和圖2B的相關(guān)聯(lián)描述,其中,示例和定義還可以應(yīng)用于圖4(在它們相關(guān)的程度上)。
專家系統(tǒng)130包括連接至存儲器420的處理器410,所述存儲器具有存儲在其中的用于提供操作系統(tǒng)422和專家系統(tǒng)引擎424的可執(zhí)行指令。數(shù)據(jù)聚合器110的其他部件包括存儲設(shè)備450、網(wǎng)絡(luò)接口480和外圍設(shè)備接口440。
在示例中,處理器410經(jīng)由存儲器總線470-3通信地耦合至存儲器420,所述存儲器總線可以是例如直接存儲器訪問(DMA)總線。處理器410可以經(jīng)由系統(tǒng)總線470-1通信地耦合至其他設(shè)備。
處理器410可以經(jīng)由存儲器總線470-3連接至DMA配置中的存儲器420。為了簡化本公開,存儲器420被公開為單個邏輯塊,但是在物理實施例中可以包括任何合適的易失性或非易失性存儲器技術(shù)(或多項技術(shù))的一個或多個塊。
存儲設(shè)備450可以是任何種類的存儲器420,或者可以是分離的設(shè)備。存儲設(shè)備450可以是或其中可以包括一個或多個數(shù)據(jù)庫或存儲在其他配置中的數(shù)據(jù),并且可以包括操作軟件的存儲副本,如操作系統(tǒng)和操作系統(tǒng)422的副本以及專家系統(tǒng)引擎424的軟件部分。許多其他配置也是可能的,并且旨在被涵蓋在本說明書的廣義范圍內(nèi)。
可以提供網(wǎng)絡(luò)接口480來將數(shù)據(jù)聚合器110與有線或無線網(wǎng)絡(luò)通信地耦合。
在一個示例中,專家系統(tǒng)引擎424是執(zhí)行根據(jù)本說明書的方法的工具或程序。在各個實施例中,專家系統(tǒng)引擎424可以在硬件、軟件、固件或其一些組合中被具體化。例如,在一些情況下,專家系統(tǒng)引擎424可以包括被設(shè)計成用于執(zhí)行方法的專用集成電路,并且還可以包括可操作用于指示處理器執(zhí)行所述方法的軟件指令。還應(yīng)當注意的是,專家系統(tǒng)引擎424僅通過非限制性示例的方式被提供,并且包括交互式或用戶模式軟件的其他硬件和軟件還可以結(jié)合、除了或替代專家系統(tǒng)引擎424而被提供,以便執(zhí)行根據(jù)本說明書的方法。
在一個示例中,專家系統(tǒng)引擎424包括存儲在可操作用于執(zhí)行圖8的方法800、或其軟件部分、或根據(jù)本說明書的類似方法的非瞬態(tài)介質(zhì)上的可執(zhí)行指令。在適當時間上(如根據(jù)啟動數(shù)據(jù)聚合器110或根據(jù)來自操作系統(tǒng)或用戶的命令),處理器410可以從存儲設(shè)備450中檢索專家系統(tǒng)引擎424(或其軟件部分)的副本并將其加載到存儲器420中。然后,處理器410可以迭代的執(zhí)行專家系統(tǒng)引擎424的指令。
圖5是根據(jù)本說明書的一個或多個示例的特征合并的框圖。示出了多個靜態(tài)特征512-1至512-N,在本示例中,每個靜態(tài)特征源自不同的數(shù)據(jù)源120。靜態(tài)特征512被提供給數(shù)據(jù)聚合器110。數(shù)據(jù)聚合器110經(jīng)由合并/拆分137來適當?shù)睾喜⑻卣?,以便提供動態(tài)特征510。合并動作可能僅需要將特征標記為與特征的元數(shù)據(jù)存儲設(shè)備中完全相同??蛇x地,除了以上內(nèi)容以外,可以提供用于將一個特征轉(zhuǎn)換成另一個特征的規(guī)則。作為非限制性示例,規(guī)則可以被表示為用于將以攝氏度表達的溫度轉(zhuǎn)換成華氏度的公式。在數(shù)據(jù)聚合器110進行的這種標記之后(以及在可選轉(zhuǎn)換之后),專家系統(tǒng)130將把這些特征視為完全相同。代替標記,還可以在不同數(shù)據(jù)位置之間轉(zhuǎn)移特征(例如,從一個數(shù)據(jù)庫表/行復制到另一個數(shù)據(jù)庫表/行中)。標記是用于拆分特征的簡便方法——通過丟棄所述標記,可以快速且無縫地拆分特征。
在受控系統(tǒng)140已經(jīng)使用動態(tài)特征510充分時間之后,向數(shù)據(jù)聚合器110提供反饋142。基于反饋142,數(shù)據(jù)聚合器110可以維護合并的特征、合并新特征、或拆分特征。
圖6是根據(jù)本說明書的一個或多個示例的多個上層類的維恩類型圖。如在本示例中所展示的,提供了六個頂層類:設(shè)備健康610、網(wǎng)絡(luò)健康620、網(wǎng)絡(luò)安全630、物理安全640、用戶數(shù)據(jù)650、和環(huán)境數(shù)據(jù)660。在此示例中,設(shè)備健康610、網(wǎng)絡(luò)健康620、和環(huán)境數(shù)據(jù)660都在某種程度上相互重疊。網(wǎng)絡(luò)健康620還在某種程度上與網(wǎng)絡(luò)安全630重疊。網(wǎng)絡(luò)安全630在某種程度上與物理安全640重疊。在本示例中,用戶數(shù)據(jù)650不與其他類別中的任何類相重疊。而且,在本示例中,物理安全640不與環(huán)境數(shù)據(jù)660、網(wǎng)絡(luò)健康620、或設(shè)備健康610重疊。應(yīng)當注意的是,這些分類、重疊和非重疊僅通過示例的方式提供。在其他實施例中,存在其他配置是可能的情況。
圖7是根據(jù)本說明書的一個或多個示例的若干類的維恩圖。在這種情況下,為了說明和討論的目的而更加詳細地公開了設(shè)備健康610和環(huán)境數(shù)據(jù)660。如前所述,應(yīng)當注意的是,這些分類僅通過示例的方式提供,并且并不旨在是限制性的。
在這種情況下,設(shè)備健康610和環(huán)境660具有重疊區(qū)域710。重疊區(qū)域710包括如環(huán)境溫度712、環(huán)境濕度714和輻射716等特征。這些重疊因為環(huán)境溫度而可以是環(huán)境因素以及可能對設(shè)備健康有影響的因素兩者。例如,環(huán)境溫度712可能影響計算系統(tǒng)中的處理器的工作溫度、以及人類操作員的舒適和對其他機械的操作。
應(yīng)當注意的是,不一定暗示雙向關(guān)聯(lián),特別是對于特定受控系統(tǒng)140。例如,雖然環(huán)境溫度可能對處理器具有重大影響,但是單個處理器的工作溫度可能對環(huán)境溫度712不具有重大影響。因此,環(huán)境溫度712既是設(shè)備健康也是環(huán)境特征,而處理器溫度740被嚴格維持為設(shè)備健康特征。對計算機冷卻系統(tǒng)進行操作的專家系統(tǒng)130可以得益于將環(huán)境溫度712接收作為合并的特征337,而HVAC控制器無法得益于接收處理器溫度740。
類似地,環(huán)境溫度既是環(huán)境特征本身,也是可能影響計算機的性能和設(shè)備健康的特征。再次,計算機內(nèi)的濕度控制器由此可以得益于包括環(huán)境濕度714的動態(tài)特征337。
最后,輻射716既是環(huán)境特征本身,對人類安全和幸福具有直接和重大影響,同時也直接影響設(shè)備健康610。在這種情況下,因為適當運行的計算機本身就不是實質(zhì)輻射源(特別是電離輻射),所以計算設(shè)備內(nèi)的輻射傳感器可以有效地與環(huán)境輻射傳感器合并。如果這些傳感器中的任一傳感器檢測到實質(zhì)性輻射增加,那么向在所述區(qū)域內(nèi)進行操作的用戶提供警報以便向他們警告增加的輻射是有用的。這是雙向有效的特征合并的示例。
在另一方面,附加環(huán)境特征不可能有效地與設(shè)備健康特征合并。例如,子類污染水平720還包括煙霧722,煙霧不可能對計算機造成重大影響。類似地,雖然環(huán)境光水平730對人類操作員極其重要,但是其對計算機基本上無意義。
在設(shè)備健康類別中,從環(huán)境情境來看,存在同樣無意義的許多特征。通過非限制性示例的方式,這些特征包括處理器溫度740、計算機正常運行時間742、附接打印機中的調(diào)色劑水平744、存儲器使用率746、磁盤使用率750、和處理器使用率760。
圖8是根據(jù)本說明書的一個或多個示例的方法800的流程圖。應(yīng)當注意的是,方法800可由一個或多個設(shè)備執(zhí)行。例如,元塊804可由一個或多個數(shù)據(jù)源120執(zhí)行,而元塊806在各個實施例中可由結(jié)合專家系統(tǒng)130工作的數(shù)據(jù)聚合器110執(zhí)行。
在元塊804中,在框810處,數(shù)據(jù)源120可以發(fā)送信息,請求描述當前支持的特征的當前元數(shù)據(jù)列表??梢越?jīng)由來自任何鄰居的客戶端-服務(wù)器請求或采用對等方式來完成這一點。無論哪種方式,數(shù)據(jù)源120等待新特征數(shù)據(jù)可用,例如,可從特征數(shù)據(jù)庫330中獲得,并當其變得可用時收集所述特征數(shù)據(jù)。
在框820中,數(shù)據(jù)源120解析出特征元數(shù)據(jù)。
在框822中,數(shù)據(jù)源120檢查所檢測到的特征是否為現(xiàn)有特征。如果其是現(xiàn)有特征,那么可以立刻開始傳輸,并且在框842中,數(shù)據(jù)源120例如向數(shù)據(jù)聚合器110提交特征。在其他示例中,數(shù)據(jù)聚合器110可以與數(shù)據(jù)源120串聯(lián)或并聯(lián)工作,從而使得數(shù)據(jù)源120直接向?qū)<蚁到y(tǒng)130提交特征,而同時,數(shù)據(jù)聚合器110操作用于對特征進行分類、歸類并以其他方式進行管理。
返回到框822,如果這不是現(xiàn)有特征,那么在框830中,數(shù)據(jù)源120可以使用自動或手動特征輸入來填充特征元數(shù)據(jù),并發(fā)布新的經(jīng)更新的元數(shù)據(jù)。
在框840中,數(shù)據(jù)源120傳遞經(jīng)更新的元數(shù)據(jù),并且在框842中,數(shù)據(jù)源120例如在數(shù)據(jù)包中向數(shù)據(jù)聚合器110提交特征數(shù)據(jù)。
在元塊806中,在框850中,數(shù)據(jù)聚合器110的鑒別器332等待新特征數(shù)據(jù)并接收新特征數(shù)據(jù)。
在框852中,如果特征所到達的數(shù)據(jù)包包括元數(shù)據(jù),那么數(shù)據(jù)聚合器110從所述數(shù)據(jù)包中解析出元數(shù)據(jù)。然而,注意,分離地從數(shù)據(jù)包中提供元數(shù)據(jù)可能是方便的。然后,鑒別器332查看現(xiàn)有元數(shù)據(jù)標簽并確定相似之處。其還可以例如檢查數(shù)據(jù)本身,以便判定合并是否合適。
在框854中,評估器338可以將合并質(zhì)量評估器應(yīng)用到現(xiàn)有特征元數(shù)據(jù)上。在框860中,評估器338可以判定特征是否需要拆分。如果需要,則在框862中,拆分器336更新特征元數(shù)據(jù)并拆分來自動態(tài)特征337的特征(例如,通過移除以上所描述的標簽和規(guī)則來執(zhí)行)。然后,控制傳送至框890,在所述框中,數(shù)據(jù)聚合器110將特征存儲在特征數(shù)據(jù)庫330中。如果特征不需要拆分,那么在框870中,合并器334更新特征“拆分”元數(shù)據(jù),其可以在必要時用于進行拆分。注意,在某些實施例中,框854、860、862和870可以被執(zhí)行為并行過程。還應(yīng)當注意的是,在某些實施例中,框854、860、862、870為可選的。
在框872中,數(shù)據(jù)聚合器110將特征鑒別器應(yīng)用到元數(shù)據(jù)和特征數(shù)據(jù)上,以便判定合并是否合適。
在框880中,如果特征需要合并,那么在框882中,合并器334更新特征的元數(shù)據(jù)和合并數(shù)據(jù)(借助于通過在元數(shù)據(jù)中標記完全相同的特征來對這些特征進行標記并且可選地提供可由專家系統(tǒng)130創(chuàng)建的或者從像本地創(chuàng)建的或在網(wǎng)絡(luò)上或在互聯(lián)網(wǎng)或云中提供的關(guān)聯(lián)表那樣的任何其他源中檢索的轉(zhuǎn)換規(guī)則),其可以包括關(guān)于合并器的足以在需要時執(zhí)行未來拆分的數(shù)據(jù)。
在框890中,數(shù)據(jù)聚合器110將數(shù)據(jù)存儲在特征數(shù)據(jù)庫330中。返回到框880,如果特征不需要合并,那么控制傳送回框850,以便等待新特征。
前述內(nèi)容概述了若干實施例的特征,從而使得本領(lǐng)域的技術(shù)人員可以更好地理解本公開的方面。本領(lǐng)域的技術(shù)人員應(yīng)該認識到,他們可以容易地將本公開用作設(shè)計或修改其他過程以及結(jié)構(gòu)的基礎(chǔ),以便于實施相同的目的和/或?qū)崿F(xiàn)在此介紹的實施例的相同優(yōu)點。本領(lǐng)域的技術(shù)人員還應(yīng)意識到,這些等同構(gòu)造沒有背離本公開的精神和范圍,并且在不背離本公開的精神和范圍的情況下,可在此做出各種改變、替換和替代。
本公開的特定實施例可以容易地包括片上系統(tǒng)(SOC)中央處理單元(CPU)封裝體。SOC表示將計算機或其他電子系統(tǒng)的部件整合到單個芯片中的集成電路(IC)。其可以包含數(shù)字、模擬、混合信號、以及射頻功能,所有這些功能都可以在單個芯片基底上提供。其他實施例可以包括多芯片模塊(MCM),多個芯片位于單個電子封裝體內(nèi)并且被配置成用于通過電子封裝體彼此密切交互。在各個其他實施例中,數(shù)字信號處理功能可以在專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)和其他半導體芯片中的一個或多個硅核中實施。
在示例實施方式中,在此概述的處理活動的至少一些部分也可以在軟件中實施。在一些實施例中,這些特征中的一個或多個特征可以在所公開的附圖的元件外部提供的或者采用任何適當方式合并的硬件中實施,以便實現(xiàn)預期功能。各個元件可以包括可以協(xié)調(diào)以便實現(xiàn)如在此概述的操作的軟件(或往復式軟件)。在仍其他實施例中,這些元件可以包括促進其操作的任何適合的算法、硬件、軟件、部件、模塊、接口或?qū)ο蟆?/p>
此外,可以移除或者以其他方式合并與所描述的微處理器相關(guān)聯(lián)的部件中的一些部件。在一般意義上,在附圖中描繪的安排在其表示上可以更合邏輯,而物理架構(gòu)可以包括各種排列、組合和/或這些元件的混合。必須注意,可以使用無數(shù)可能的設(shè)計配置來實現(xiàn)在此概述的操作目標。相應(yīng)地,相關(guān)聯(lián)的基礎(chǔ)設(shè)施具有大量替代安排、設(shè)計選擇、設(shè)備可能性、硬件配置、軟件實施方式、設(shè)備選項等。
任何適當配置的處理器部件可以執(zhí)行與數(shù)據(jù)相關(guān)聯(lián)的任何類型的指令以便實現(xiàn)在此詳細說明的操作。在此公開的任何處理器可以將元件或物品(例如,數(shù)據(jù))從一個狀態(tài)或一種東西轉(zhuǎn)換為另一個狀態(tài)或另一種東西。在另一個示例中,在此概述的一些活動可以利用固定邏輯或可編程邏輯(例如,由處理器執(zhí)行的軟件和/或計算機指令)實現(xiàn),并且在此標識的元件可以是某種類型的可編程處理器;可編程數(shù)字邏輯(例如,現(xiàn)場可編程門陣列(FPGA);可擦除可編程只讀存儲器(EPROM);電可擦除可編程只讀存儲器(EEPROM);包括數(shù)字邏輯、軟件、代碼、電子指令、閃速存儲器、光盤、CD-ROM、DVD ROM、磁性或光學卡、適合于存儲電子指令的其他類型的機器可讀介質(zhì)、或其任何合適組合的ASIC。在操作中,處理器可以將信息存儲在任何合適類型的非瞬態(tài)存儲介質(zhì)(例如,隨機存取存儲器(RAM)、只讀存儲器(ROM)、現(xiàn)場可編程門陣列(FPGA)、可擦除可編程只讀存儲器(EPROM)、電可擦除可編程ROM(EEPROM)等)、軟件、硬件中或者在適當情況下并基于特定需要存儲在任何其他合適的部件、設(shè)備、元件或物體中。進一步地,基于特定需要和實施方式,可以在任何數(shù)據(jù)庫、寄存器、表格、緩存器、隊列、控制列表、或存儲結(jié)構(gòu)(所有這些可以在任何合適的時間幀被引用)中提供在處理器中被跟蹤、發(fā)送、接收或存儲的信息。在此所討論的存儲器項中的任何存儲器項應(yīng)當被解釋為涵蓋在寬泛術(shù)語‘存儲器’內(nèi)。類似地,在此所描述的可能的處理元件、模塊、和機器中的任何一者應(yīng)當被解釋為涵蓋在寬泛術(shù)語‘微處理器’或‘處理器’內(nèi)。此外,在各個實施例中,在此描述的處理器、存儲器、網(wǎng)卡、總線、存儲設(shè)備、相關(guān)外圍設(shè)備、以及其他硬件元件可由軟件或固件配置來模仿或虛擬化這些硬件元件的功能的處理器、存儲器和其他相關(guān)設(shè)備來實現(xiàn)。
采用各種形式來具體化實施在此描述的功能中的所有或部分功能的計算機程序邏輯,包括但決不限于源代碼形式、計算機可執(zhí)行的形式、以及各種中間形式(例如,由匯編器、編輯器、鏈接器或定位器生成的形式)。在示例中,源代碼包括以各種編程語言實施的一系列計算機程序指令,如目標代碼、匯編語言、或高級語言(比如,與各種操作系統(tǒng)或操作環(huán)境一起使用的OpenCL、Fortran、C、C++、JAVA或HTML)。源代碼可以限定并使用各種數(shù)據(jù)結(jié)構(gòu)和通信消息。源代碼可以采用計算機可執(zhí)行的形式(例如,經(jīng)由解釋器),或者源代碼可以被轉(zhuǎn)換(例如,經(jīng)由轉(zhuǎn)換器、匯編器、或編譯器)成計算機可執(zhí)行的形式。
在對以上實施例的討論中,可以容易地替換、替代或以其他方式修改電容器、緩沖器、圖形元件、互連板、時鐘、DDR、相機傳感器、除法器、電感器、電阻器、放大器、開關(guān)、數(shù)字核、晶體管和/或其他部件,以便滿足特定電路需要。此外,應(yīng)當注意的是,對互補電子設(shè)備、硬件、非瞬態(tài)軟件等的使用提供了同等可行的選項,以便實施本公開的教導。
在一個示例實施例中,可以在相關(guān)聯(lián)的電子設(shè)備的板上實施附圖的任何數(shù)量的電路。所述板可以是能夠容納電子設(shè)備的內(nèi)部電子系統(tǒng)的各個部件并進一步為其他外圍設(shè)備提供連接器的一般電路板。更具體地,所述板可以提供電連接,系統(tǒng)的其他部件可以通過這些電連接來進行電通信??梢曰谔囟ㄅ渲眯枰⑻幚硇枨?、計算機設(shè)計等來將任何合適的處理器(包括數(shù)字信號處理器、微處理器、支持芯片組等)、存儲器元件等適當?shù)伛詈现了霭?。如外部存儲設(shè)備、附加傳感器、用于音頻/視頻顯示的控制器、以及外圍設(shè)備等其他部件可以作為插入卡而經(jīng)由線纜附接至所述板,或者整合到所述板本身中。在另一個示例實施例中,附圖的電路可以被實施為獨立的模塊(例如,具有相關(guān)聯(lián)的部件的設(shè)備和被配置成用于執(zhí)行特定應(yīng)用或功能的電路),或者被實施為到電子設(shè)備的專用硬件的插入模塊。
注意,使用在此所提供的許多示例,可以關(guān)于兩個、三個、四個或更多個電氣部件來對交互進行描述。然而,這樣做只是出于清楚和示例的目的。應(yīng)理解的是,可以采用任何合適方式來合并所述系統(tǒng)。根據(jù)類似的設(shè)計替代方案,可以在各個可能的配置中組合附圖中所展示的部件、模塊和元件中的任一者,所有這些配置在本說明書的廣泛范圍內(nèi)。在某些情況下,通過僅參照有限數(shù)量的電氣元件,可能更容易描述一組給定流程的功能中的一個或多個功能。應(yīng)當理解的是,附圖的電路及其教導是可容易擴展的,并且可以容納大量部件以及更復雜/成熟的安排和配置。相應(yīng)地,所提供的示例不應(yīng)限制如潛在地應(yīng)用到無數(shù)其他架構(gòu)上的電路的范圍或抑制其寬泛教導。
本領(lǐng)域技術(shù)人員可以確定各種其他改變型式、替換型式、變化型式、更改型式和修改型式,并且本公開旨在涵蓋如落入所附權(quán)利要求范圍內(nèi)的所有這種改變型式、替換型式、變化型式、更改型式和修改型式。為了幫助美國專利和商標局(USPTO)以及另外在此申請上發(fā)布的任何專利的任何閱讀者解釋在此所附權(quán)利要求書,申請人希望注意的是,申請人:(a)并不旨在所附權(quán)利要求書中的任何一項當出現(xiàn)于其提交日期時調(diào)用美國專利法第35章第112節(jié)第(6)段,除非具體權(quán)利要求中特別適用了單詞“用于……的裝置”或“用于……的步驟”;并且(b)并不旨在借助說明書中的任何聲明以任何所附權(quán)利要求書中未另外反應(yīng)的方式限制本公開。
示例實施例
示例1中公開了一種裝置,包括:
特征數(shù)據(jù)庫;以及
鑒別器,所述鑒別器可操作用于:
接收新特征;并且
根據(jù)特征分類法對所述新特征進行分類,其中,分類包括:檢查特征元數(shù)據(jù),將所述特征與所述特征數(shù)據(jù)庫中的現(xiàn)有特征進行比較,并且基于所述比較為所述特征分配類或種類。
示例2中公開了如示例1所述的裝置,進一步包括合并器,所述合并器可操作用于將所述新特征與所述現(xiàn)有特征進行合并以便創(chuàng)建組合特征。
示例3中公開了如示例2所述的裝置,進一步包括網(wǎng)絡(luò)接口,并且其中,所述裝置可操作用于通過所述網(wǎng)絡(luò)接口發(fā)送所述組合特征。
示例4中公開了如示例3所述的裝置,進一步包括評估器,所述評估器可操作用于從所述網(wǎng)絡(luò)接口處接收反饋,并且消耗來自所述合并器的所述組合特征。
示例5中公開了如示例4所述的裝置,進一步包括拆分器,所述拆分器可操作用于確定用于創(chuàng)建所述組合特征的所述合并不是實質(zhì)有益的,并且用于將所述組合特征拆分成所述新特征和所述現(xiàn)有特征。
示例6中公開了如示例1所述的裝置,進一步包括轉(zhuǎn)換器,所述轉(zhuǎn)換器可操作用于將所述新特征轉(zhuǎn)換為與所述現(xiàn)有特征的值相兼容的形式。
示例7中公開了如示例6所述的裝置,其中,轉(zhuǎn)換所述新特征包括從一個單位系統(tǒng)轉(zhuǎn)換到另一個單位系統(tǒng)。
示例8中公開了如示例1所述的裝置,其中,特征轉(zhuǎn)換可操作用于使用所述分類法將所述特征與其他特征進行合并。
示例9中公開了如示例1所述的裝置,其中,所述特征元數(shù)據(jù)采用符合標準的格式。
示例10中公開了如示例9所述的裝置,其中,所述格式是可擴展標記語言。
示例11中公開了如示例1所述的裝置,其中,分類進一步包括基于所述元數(shù)據(jù)中的特征名稱來推斷分類。
示例12中公開了如示例1所述的裝置,其中,分類進一步包括基于所述元數(shù)據(jù)中的數(shù)據(jù)類型名稱來推斷分類。
示例13中公開了如示例12所述的裝置,其中,分類包括模糊匹配。
示例14公開了一種或多種計算機可讀介質(zhì),具有存儲在其上的可執(zhí)行指令,所述可執(zhí)行指令可操作用于指示處理器執(zhí)行以下操作:
接收新特征;并且
根據(jù)特征分類法對所述新特征進行分類,其中,分類包括:檢查特征元數(shù)據(jù),將所述特征與特征數(shù)據(jù)庫中的現(xiàn)有特征進行比較,并且基于所述比較為所述特征分配類或種類。
示例15中公開了如示例14所述的一種或多種介質(zhì),進一步可操作用于將所述新特征與所述現(xiàn)有特征進行合并以便創(chuàng)建組合特征。
示例16中公開了如示例15所述的一種或多種介質(zhì),進一步可操作用于通過網(wǎng)絡(luò)接口發(fā)送所述組合特征。
示例17中公開了如示例16所述的一種或多種介質(zhì),進一步可操作用于從所述網(wǎng)絡(luò)接口處接收反饋,并且用于判定用于創(chuàng)建所述組合特征的所述合并是否是實質(zhì)有益的。
示例18中公開了如示例17所述的一種或多種介質(zhì),進一步可操作用于確定用于創(chuàng)建所述組合特征的所述合并不是實質(zhì)有益的,并且用于將所述組合特征拆分成所述新特征和所述現(xiàn)有特征。
示例19中公開了如示例14所述的一種或多種介質(zhì),進一步可操作用于將所述新特征轉(zhuǎn)換為與所述現(xiàn)有特征相兼容的形式。
示例20中公開了如示例19所述的一種或多種介質(zhì),其中,轉(zhuǎn)換所述新特征包括從一個單位系統(tǒng)轉(zhuǎn)換到另一個單位系統(tǒng)。
示例21中公開了如示例14所述的一種或多種介質(zhì),其中,所述特征元數(shù)據(jù)采用符合標準的格式。
示例22中公開了如示例14所述的一種或多種介質(zhì),其中,分類進一步包括基于所述元數(shù)據(jù)中的特征名稱來推斷分類。
示例23中公開了如示例14所述的一種或多種介質(zhì),其中,分類進一步包括基于所述元數(shù)據(jù)中的數(shù)據(jù)類型名稱來推斷分類。
一種方法,包括:
接收新特征;以及
根據(jù)特征分類法對所述新特征進行分類,其中,分類包括:檢查特征元數(shù)據(jù),將所述特征與特征數(shù)據(jù)庫中的現(xiàn)有特征進行比較,并且基于所述比較為所述特征分配類或種類。
如示例24所述的方法,進一步包括:
將所述新特征與所述現(xiàn)有特征進行合并以便創(chuàng)建組合特征;通過網(wǎng)絡(luò)接口發(fā)送所述組合特征;
從所述網(wǎng)絡(luò)接口處接收反饋,并且用于判定用于創(chuàng)建所述組合特征的所述合并是否是實質(zhì)有益的;以及
確定用于創(chuàng)建所述組合特征的所述合并不是實質(zhì)有益的,并且用于將所述組合特征拆分成所述新特征和所述現(xiàn)有特征。