本申請涉及時序數(shù)據(jù)處理,特別涉及一種基于本體的時序數(shù)據(jù)抽取方法、系統(tǒng)、設(shè)備和存儲介質(zhì)。
背景技術(shù):
1、隨著信息技術(shù)的飛速發(fā)展,時序數(shù)據(jù)在各個領(lǐng)域中的應(yīng)用越來越廣泛,在對時序數(shù)據(jù)進行處理和分析時,時序數(shù)據(jù)抽取為知識(知識圖譜)進行處理。
2、然而,由于時序數(shù)據(jù)缺乏明確的語義信息和數(shù)據(jù)表示方法的多樣性,使數(shù)據(jù)在不同抽取系統(tǒng)的應(yīng)用之間的互操作性差,且數(shù)據(jù)整合和共享變得困難。并且,現(xiàn)有的數(shù)據(jù)抽取方法可能依賴于大量的人工干預(yù)和樣本訓(xùn)練集,自動化程度低,效率低下,抽取規(guī)則往往難以適應(yīng)復(fù)雜多變的數(shù)據(jù)環(huán)境,導(dǎo)致抽取結(jié)果不準確。
3、因此,亟需一種高效、準確的時序數(shù)據(jù)抽取方法。
技術(shù)實現(xiàn)思路
1、鑒于上述問題,本申請實施例提供了一種基于本體的時序數(shù)據(jù)抽取方法、系統(tǒng)、設(shè)備和存儲介質(zhì),以便克服上述問題或者至少部分地解決上述問題。
2、本申請實施例的第一方面,公開了一種基于本體的時序數(shù)據(jù)抽取方法,所述方法包括:
3、構(gòu)建本體模型,所述本體模型包括:概念、概念屬性、概念關(guān)系;
4、確定所述本體模型和時序數(shù)據(jù)之間的數(shù)據(jù)抽取規(guī)則,所述抽取規(guī)則包括:使用的本體模型、以及所述使用的本體模型下的概念名稱;
5、根據(jù)所述數(shù)據(jù)抽取規(guī)則,對所述時序數(shù)據(jù)進行知識抽取,得到時序數(shù)據(jù)本體模型,所述時序數(shù)據(jù)本體模型表征從抽取的知識圖譜。
6、可選地,構(gòu)建本體模型,包括:
7、根據(jù)業(yè)務(wù)需求和數(shù)據(jù)特點,定義時序數(shù)據(jù)中涉及的概念,所述概念包括:時間序列、數(shù)據(jù)點和時間單位;
8、定義所述概念的概念屬性,所述概念屬性包括:時間序列的起始時間和結(jié)束時間、采樣頻率;
9、定義所述概念之間的概念關(guān)系,所述概念關(guān)系包括:時間序列之間的相關(guān)性、數(shù)據(jù)點之間的順序關(guān)系。
10、可選地,根據(jù)所述數(shù)據(jù)抽取規(guī)則,對所述時序數(shù)據(jù)進行知識抽取,得到時序數(shù)據(jù)本體模型,包括:
11、根據(jù)所述概念名稱,將所述時序數(shù)據(jù)實例化到所述使用的本體模型,所述實例包括實體和實體屬性;
12、在所述實例之間建立關(guān)系,得到時序數(shù)據(jù)本體模型,所述關(guān)系包括:相關(guān)性關(guān)系、因果關(guān)系。
13、可選地,所述方法還包括:
14、對所述時序數(shù)據(jù)進行預(yù)處理,得到預(yù)處理時序數(shù)據(jù);
15、對所述預(yù)處理時序數(shù)據(jù)進行特征提取,得到數(shù)據(jù)特征;
16、根據(jù)所述概念名稱,將所述時序數(shù)據(jù)實例化到所述使用的本體模型,包括:
17、根據(jù)所述概念名稱和所述數(shù)據(jù)特征,將所述時序數(shù)據(jù)實例化到所述使用的本體模型。
18、可選地,對所述預(yù)處理時序數(shù)據(jù)進行特征提取,得到數(shù)據(jù)特征,包括:
19、從所述預(yù)處理時序數(shù)據(jù)中提取統(tǒng)計特征,所述統(tǒng)計特征在本體模型中以概念屬性的形式表示;
20、分析所述預(yù)處理時序數(shù)據(jù)的趨勢特征,所述趨勢特征通過所述本體模型中的概念關(guān)系或特定概念屬性進行表示。
21、可選地,所述方法還包括:
22、在所述時序數(shù)據(jù)具有周期性的情況下,提取所述預(yù)處理時序數(shù)據(jù)的周期長度和周期內(nèi)的變化模式,得到周期性特征,所述周期性特征在本體模型中以概念屬性的形式表示。
23、可選地,所述方法還包括:
24、根據(jù)所述時序數(shù)據(jù)本體模型進行數(shù)據(jù)查詢;
25、根據(jù)所述時序數(shù)據(jù)本體模型分析所述時序數(shù)據(jù)的潛在規(guī)律,以基于所述潛在規(guī)律進行時序數(shù)據(jù)的趨勢預(yù)測和異常發(fā)現(xiàn)。
26、本申請實施例的第二方面,公開了一種基于本體的時序數(shù)據(jù)抽取系統(tǒng),所述系統(tǒng)包括:
27、本體構(gòu)建模塊,用于構(gòu)建本體模型,所述本體模型包括:概念、概念屬性、概念關(guān)系;
28、規(guī)則確定模塊,用于確定所述本體模型和時序數(shù)據(jù)之間的數(shù)據(jù)抽取規(guī)則,所述抽取規(guī)則包括:使用的本體模型、以及所述使用的本體模型下的概念名稱
29、知識抽取模塊,用于根據(jù)所述數(shù)據(jù)抽取規(guī)則,對所述時序數(shù)據(jù)進行知識抽取,得到時序數(shù)據(jù)本體模型,所述時序數(shù)據(jù)本體模型表征從抽取的知識圖譜。
30、本申請實施例的第三方面,公開了一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)本申請實施例的第一方面所述的基于本體的時序數(shù)據(jù)抽取方法的步驟。
31、本申請實施例的第四方面,公開了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)本申請實施例的第一方面所述的基于本體的時序數(shù)據(jù)抽取方法的步驟。
32、本申請實施例包括以下優(yōu)點:
33、在本申請實施例中,本體模型包括概念、概念屬性、概念關(guān)系,通過構(gòu)建本體模型為時序數(shù)據(jù)提供了明確的語義信息,從而實現(xiàn)對時序數(shù)據(jù)的標準化和規(guī)范化處理,以此提供了時序數(shù)據(jù)在不同系統(tǒng)和應(yīng)用之間的互操作性,促進數(shù)據(jù)的整合和共享。并且,根據(jù)本體模型和時序數(shù)據(jù)之間的數(shù)據(jù)抽取規(guī)則,對時序數(shù)據(jù)進行知識抽取,減少人工干預(yù),提高抽取過程的自動化和智能化水平。而且該數(shù)據(jù)抽取規(guī)則是根據(jù)本體模型確定的,能夠更好地適應(yīng)復(fù)雜多變的數(shù)據(jù)環(huán)境,提高抽取結(jié)果的準確性和可靠性。
1.一種基于本體的時序數(shù)據(jù)抽取方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,構(gòu)建本體模型,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述數(shù)據(jù)抽取規(guī)則,對所述時序數(shù)據(jù)進行知識抽取,得到時序數(shù)據(jù)本體模型,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,對所述預(yù)處理時序數(shù)據(jù)進行特征提取,得到數(shù)據(jù)特征,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種基于本體的時序數(shù)據(jù)抽取系統(tǒng),其特征在于,所述系統(tǒng)包括:
9.一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權(quán)利要求1-7任一項所述的基于本體的時序數(shù)據(jù)抽取方法的步驟。
10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1-7任一項所述的基于本體的時序數(shù)據(jù)抽取方法的步驟。