本技術(shù)涉及大數(shù)據(jù)處理,尤其涉及一種將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的方法、系統(tǒng)、智能終端及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù):
1、csv(comma-separated?values,逗號分隔值)格式是一種常見的電子表格數(shù)據(jù)存儲方式,其格式簡單易懂,而且大多數(shù)電子表格應(yīng)用程序都支持導(dǎo)入和導(dǎo)出csv文件,它已成為許多應(yīng)用程序中數(shù)據(jù)交換的標(biāo)準(zhǔn)格式之一。
2、目前csv數(shù)據(jù)進(jìn)行處理以及存儲時,由于數(shù)據(jù)本身沒有綁定到數(shù)據(jù)對象中,導(dǎo)致在處理數(shù)據(jù)時要通過人工干預(yù)來實(shí)現(xiàn)數(shù)據(jù)與數(shù)據(jù)對象的對應(yīng),從而使得csv數(shù)據(jù)在采集時極為不便,影響用戶對csv數(shù)據(jù)的使用。
3、因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)的主要目的在于提供一種將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的方法、系統(tǒng)、智能終端及計算機(jī)可讀存儲介質(zhì),旨在解決現(xiàn)有技術(shù)中在處理csv數(shù)據(jù)時由于數(shù)據(jù)本身未綁定到數(shù)據(jù)對象中導(dǎo)致在處理數(shù)據(jù)時要通過人工干預(yù)來實(shí)現(xiàn)數(shù)據(jù)與數(shù)據(jù)對象的對應(yīng),從而使得csv數(shù)據(jù)在采集時極為不便,影響用戶對csv數(shù)據(jù)使用的問題。
2、本技術(shù)第一方面實(shí)施例提供一種將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的方法,包括以下步驟:獲取目標(biāo)數(shù)據(jù)對象,對所述目標(biāo)數(shù)據(jù)對象進(jìn)行定義,得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù);根據(jù)所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),構(gòu)建所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的綁定規(guī)則;獲取待綁定csv數(shù)據(jù),根據(jù)所述綁定規(guī)則,將所述待綁定csv數(shù)據(jù)綁定到所述目標(biāo)數(shù)據(jù)對象。
3、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以通過定義得到的目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)對待綁定csv數(shù)據(jù)進(jìn)行處理,讓待綁定csv數(shù)據(jù)通過制定的綁定規(guī)則準(zhǔn)確的綁定到要綁定的目標(biāo)數(shù)據(jù)對象上,從而解決了在處理csv數(shù)據(jù)時由于數(shù)據(jù)本身未綁定到數(shù)據(jù)對象中導(dǎo)致在處理數(shù)據(jù)時要通過人工干預(yù)來實(shí)現(xiàn)數(shù)據(jù)與數(shù)據(jù)對象的對應(yīng),從而使得csv數(shù)據(jù)在采集時極為不便,影響用戶對csv數(shù)據(jù)使用的問題。
4、可選地,在本技術(shù)的一個實(shí)施例中,所述獲取目標(biāo)數(shù)據(jù)對象,對所述目標(biāo)數(shù)據(jù)對象進(jìn)行定義,得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),具體包括:根據(jù)所述目標(biāo)數(shù)據(jù)對象,獲取所述目標(biāo)數(shù)據(jù)對象的屬性信息,根據(jù)所述目標(biāo)數(shù)據(jù)對象的屬性信息計算所述目標(biāo)數(shù)據(jù)對象的加密值;獲取所述目標(biāo)數(shù)據(jù)對象的元數(shù)據(jù)存儲表,根據(jù)所述加密值,遍歷所述元數(shù)據(jù)存儲表,判斷所述目標(biāo)數(shù)據(jù)對象是否存在元數(shù)據(jù)信息;若所述目標(biāo)數(shù)據(jù)對象中存在元數(shù)據(jù)信息,則獲取所述元數(shù)據(jù)信息,并將所述元數(shù)據(jù)信息定義為目標(biāo)數(shù)據(jù)對象元數(shù)據(jù);若所述目標(biāo)數(shù)據(jù)對象中不存在元數(shù)據(jù)信息,則將所述屬性信息定義為目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)。
5、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以在將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的過程中通過加密值判斷目標(biāo)數(shù)據(jù)對象是否存在元數(shù)據(jù)信息,從而可以通過已有的元數(shù)據(jù)信息得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),節(jié)約了定義目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的功耗;同時對不存在元數(shù)據(jù)信息的目標(biāo)數(shù)據(jù)對象的也進(jìn)行定義得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),保證目標(biāo)數(shù)據(jù)對象可以與所有待綁定csv數(shù)據(jù)綁定。
6、可選地,在本技術(shù)的一個實(shí)施例中,所述獲取目標(biāo)數(shù)據(jù)對象,對所述目標(biāo)數(shù)據(jù)對象進(jìn)行定義,得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),之后還包括:遍歷所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),為所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)中的屬性進(jìn)行畫像,得到所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性畫像,并將所述屬性畫像存儲到所述元數(shù)據(jù)存儲表中,其中,所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性包括屬性名稱、屬性描述、屬性類型、屬性約束規(guī)則和枚舉類型。
7、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以通過對目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)中的屬性進(jìn)行畫像,從而將數(shù)據(jù)對象標(biāo)簽化,讓每一個數(shù)據(jù)對象元數(shù)據(jù)中的屬性更加清晰明確。
8、可選地,在本技術(shù)的一個實(shí)施例中,所述根據(jù)所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),構(gòu)建所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的綁定規(guī)則,具體包括:判斷所述目標(biāo)數(shù)據(jù)對象是否包含有數(shù)據(jù)架構(gòu);若所述目標(biāo)數(shù)據(jù)對象包含有數(shù)據(jù)架構(gòu),則根據(jù)所述目標(biāo)數(shù)據(jù)對象對應(yīng)的數(shù)據(jù)架構(gòu),定義所述屬性畫像的第一識別規(guī)則;若所述目標(biāo)數(shù)據(jù)對象不包含數(shù)據(jù)架構(gòu),則對無數(shù)據(jù)架構(gòu)的目標(biāo)數(shù)據(jù)對象建立標(biāo)注信息,根據(jù)所述標(biāo)注信息選擇或構(gòu)建算法模型定義所述屬性畫像的第二識別規(guī)則;將所述第一識別規(guī)則和所述第二識別規(guī)則作為所述綁定規(guī)則;將所述綁定規(guī)則存儲到所述元數(shù)據(jù)存儲表中的屬性畫像中。
9、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以為目標(biāo)數(shù)據(jù)對象構(gòu)建目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的綁定規(guī)則,并且在綁定過程中對于有數(shù)據(jù)架構(gòu)的數(shù)據(jù)通過數(shù)據(jù)架構(gòu)定義出對應(yīng)的識別規(guī)則,對于沒有數(shù)據(jù)架構(gòu)的目標(biāo)數(shù)據(jù)對象通過標(biāo)注后對應(yīng)通過算法模型來定義出識別規(guī)則,通過上述識別規(guī)則的制定,使得目標(biāo)數(shù)據(jù)對象可以定義出全面完整的目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的綁定規(guī)則,讓綁定過程更加完整準(zhǔn)確。
10、可選地,在本技術(shù)的一個實(shí)施例中,所述獲取待綁定csv數(shù)據(jù),根據(jù)所述綁定規(guī)則,將所述待綁定csv數(shù)據(jù)綁定到所述目標(biāo)數(shù)據(jù)對象,具體包括:將所述待綁定csv數(shù)據(jù)轉(zhuǎn)化為數(shù)組;對所述數(shù)組進(jìn)行隨機(jī)抽樣,得到抽樣數(shù)據(jù),并對所述抽樣數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換,將相同索引的每一列數(shù)據(jù)作為一組分析對象;根據(jù)所述綁定規(guī)則將所述分析對象與所述屬性畫像進(jìn)行匹配,得到匹配結(jié)果;根據(jù)所述匹配結(jié)果,將所述分析對象所在列的csv數(shù)據(jù)與對應(yīng)的目標(biāo)數(shù)據(jù)對象進(jìn)行綁定。
11、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以無需對整個csv數(shù)據(jù)進(jìn)行識別,只需要對每一列中抽樣到的數(shù)據(jù)進(jìn)行處理,就可以將該列綁定到對應(yīng)的目標(biāo)數(shù)據(jù)對象上,從而節(jié)約了處理時間,也減小了數(shù)據(jù)處理消耗。
12、可選地,在本技術(shù)的一個實(shí)施例中,所述根據(jù)所述綁定規(guī)則將所述分析對象與所述屬性畫像進(jìn)行匹配,具體包括:獲取索引,根據(jù)所述元數(shù)據(jù)存儲表中的屬性畫像,將分析對象與對應(yīng)的屬性畫像進(jìn)行匹配得到匹配結(jié)果,并根據(jù)匹配結(jié)果,通過所述索引對所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行標(biāo)記;將未對目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行標(biāo)記的索引進(jìn)行對應(yīng)標(biāo)記;記錄所述索引與所述屬性的標(biāo)記關(guān)系,將分析對象所在列的csv數(shù)據(jù)與目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行匹配。
13、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以通過元數(shù)據(jù)存儲表中的屬性畫像,對分析對象進(jìn)行處理,讓分析對象與對應(yīng)的屬性進(jìn)行匹配,同時通過索引對目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行標(biāo)記,進(jìn)而讓csv數(shù)據(jù)通過索引與目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行一一對應(yīng),即實(shí)現(xiàn)了將待綁定csv數(shù)據(jù)綁定到目標(biāo)數(shù)據(jù)對象的效果。
14、可選地,在本技術(shù)的一個實(shí)施例中,所述根據(jù)元數(shù)據(jù)存儲表中的屬性畫像,將分析對象與對應(yīng)的屬性畫像進(jìn)行匹配得到匹配結(jié)果,具體包括:當(dāng)所述分析對象與屬性畫像進(jìn)行匹配時,判斷采用的匹配規(guī)則為第一識別規(guī)則還是第二識別規(guī)則;若采用所述第一識別規(guī)則進(jìn)行匹配,當(dāng)所述分析對象中的數(shù)據(jù)與所述目標(biāo)數(shù)據(jù)對象的數(shù)據(jù)架構(gòu)一致時,匹配成功;若采用所述第二識別規(guī)則進(jìn)行匹配,當(dāng)所述分析對象中的數(shù)據(jù)與所述算法模型的匹配準(zhǔn)確度達(dá)到預(yù)定閾值時,匹配成功。
15、根據(jù)上述技術(shù)手段,本技術(shù)實(shí)施例可以在將分析對象與屬性畫像進(jìn)行匹配時,對于由數(shù)據(jù)架構(gòu)對應(yīng)的屬性畫像的識別規(guī)則進(jìn)行直接匹配,而對于通過算法模型進(jìn)行匹配的數(shù)據(jù)在其達(dá)到一定的準(zhǔn)確值后認(rèn)為匹配成功,從而讓在csv數(shù)據(jù)中沒有數(shù)據(jù)架構(gòu)的數(shù)據(jù)也可以靈活的通過算法模型進(jìn)行自動匹配。
16、本技術(shù)第二方面實(shí)施例提供一種將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的系統(tǒng),所述將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的系統(tǒng)包括:元數(shù)據(jù)定義模塊,用于獲取目標(biāo)數(shù)據(jù)對象,對所述目標(biāo)數(shù)據(jù)對象進(jìn)行定義,得到目標(biāo)數(shù)據(jù)對象元數(shù)據(jù);規(guī)則構(gòu)建模塊,用于根據(jù)所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),構(gòu)建所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的綁定規(guī)則;數(shù)據(jù)綁定模塊,用于獲取待綁定csv數(shù)據(jù),根據(jù)所述綁定規(guī)則,將所述待綁定csv數(shù)據(jù)綁定到所述目標(biāo)數(shù)據(jù)對象。
17、可選地,在本技術(shù)的一個實(shí)施例中,所述元數(shù)據(jù)定義模塊包括:加密值計算單元,用于根據(jù)所述目標(biāo)數(shù)據(jù)對象,獲取所述目標(biāo)數(shù)據(jù)對象的屬性信息,根據(jù)所述目標(biāo)數(shù)據(jù)對象的屬性信息計算所述目標(biāo)數(shù)據(jù)對象的加密值;信息判別單元,用于獲取所述目標(biāo)數(shù)據(jù)對象的元數(shù)據(jù)存儲表,根據(jù)所述加密值,遍歷所述元數(shù)據(jù)存儲表,判斷所述目標(biāo)數(shù)據(jù)對象是否存在元數(shù)據(jù)信息;第一定義單元,用于若所述目標(biāo)數(shù)據(jù)對象中存在元數(shù)據(jù)信息,則獲取所述元數(shù)據(jù)信息,并將所述元數(shù)據(jù)信息定義為目標(biāo)數(shù)據(jù)對象元數(shù)據(jù);第二定義單元,用于若所述目標(biāo)數(shù)據(jù)對象中不存在元數(shù)據(jù)信息,則將所述屬性信息定義為目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)。
18、可選地,在本技術(shù)的一個實(shí)施例中,本技術(shù)實(shí)施例的將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的系統(tǒng)還包括:屬性畫像單元,用于遍歷所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù),為所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)中的屬性進(jìn)行畫像,得到所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性畫像,并將所述屬性畫像存儲到所述元數(shù)據(jù)存儲表中,其中,所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性包括屬性名稱、屬性描述、屬性類型、屬性約束規(guī)則和枚舉類型。
19、可選地,在本技術(shù)的一個實(shí)施例中,所述規(guī)則構(gòu)建模塊包括:數(shù)據(jù)架構(gòu)判斷單元,用于判斷所述目標(biāo)數(shù)據(jù)對象是否包含有數(shù)據(jù)架構(gòu);第一畫像定義單元,用于若所述目標(biāo)數(shù)據(jù)對象包含有數(shù)據(jù)架構(gòu),則根據(jù)所述目標(biāo)數(shù)據(jù)對象對應(yīng)的數(shù)據(jù)架構(gòu),定義所述屬性畫像的第一識別規(guī)則;第二畫像定義單元,用于若所述目標(biāo)數(shù)據(jù)對象不包含數(shù)據(jù)架構(gòu),則對無數(shù)據(jù)架構(gòu)的目標(biāo)數(shù)據(jù)對象建立標(biāo)注信息,根據(jù)所述標(biāo)注信息選擇或構(gòu)建算法模型定義所述屬性畫像的第二識別規(guī)則;綁定單元,用于將所述第一識別規(guī)則和所述第二識別規(guī)則作為所述綁定規(guī)則;綁定存儲單元,用于將所述綁定規(guī)則存儲到所述元數(shù)據(jù)存儲表中的屬性畫像中。
20、可選地,在本技術(shù)的一個實(shí)施例中,所述數(shù)據(jù)綁定模塊包括:轉(zhuǎn)化單元,用于將所述待綁定csv數(shù)據(jù)轉(zhuǎn)化為數(shù)組;分析對象生成單元,用于對所述數(shù)組進(jìn)行隨機(jī)抽樣,得到抽樣數(shù)據(jù),并對所述抽樣數(shù)據(jù)進(jìn)行行列轉(zhuǎn)換,將相同索引的每一列數(shù)據(jù)作為一組分析對象;分析對象匹配單元,用于根據(jù)所述綁定規(guī)則將所述分析對象與所述屬性畫像進(jìn)行匹配,得到匹配結(jié)果;分析對象綁定單元,用于根據(jù)所述匹配結(jié)果,將所述分析對象所在列的csv數(shù)據(jù)與對應(yīng)的目標(biāo)數(shù)據(jù)對象進(jìn)行綁定。
21、可選地,在本技術(shù)的一個實(shí)施例中,所述分析對象匹配單元包括:第一標(biāo)記單元,用于獲取索引,根據(jù)元數(shù)據(jù)存儲表中的屬性畫像,將分析對象與對應(yīng)的屬性畫像進(jìn)行匹配得到匹配結(jié)果,并根據(jù)匹配結(jié)果,通過所述索引對所述目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行標(biāo)記;第二標(biāo)記單元,用于將未對目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行標(biāo)記的索引進(jìn)行對應(yīng)標(biāo)記;標(biāo)記匹配單元,用于記錄所述索引與所述屬性的標(biāo)記關(guān)系,將分析對象所在列的csv數(shù)據(jù)與目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)的屬性進(jìn)行匹配。
22、可選地,在本技術(shù)的一個實(shí)施例中,所述第一標(biāo)記單元包括:規(guī)則判斷單元,用于當(dāng)所述分析對象與屬性畫像進(jìn)行匹配時,判斷采用的匹配規(guī)則為第一識別規(guī)則還是第二識別規(guī)則;數(shù)據(jù)架構(gòu)匹配單元,用于若采用所述第一識別規(guī)則進(jìn)行匹配,當(dāng)所述分析對象中的數(shù)據(jù)與所述目標(biāo)數(shù)據(jù)對象的數(shù)據(jù)架構(gòu)一致時,匹配成功;算法模型匹配單元,用于若采用所述第二識別規(guī)則進(jìn)行匹配,當(dāng)所述分析對象中的數(shù)據(jù)與所述算法模型的匹配準(zhǔn)確度達(dá)到預(yù)定閾值時,匹配成功。
23、本技術(shù)第三方面實(shí)施例提供一種智能終端,所述智能終端包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運(yùn)行的將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的程序,所述將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的程序被所述處理器執(zhí)行時實(shí)現(xiàn)如上述實(shí)施例所述的將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的方法的步驟。
24、本技術(shù)第四方面實(shí)施例提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的程序,所述將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的程序被處理器執(zhí)行時實(shí)現(xiàn)如上述實(shí)施例所述的將csv數(shù)據(jù)綁定到數(shù)據(jù)對象的方法的步驟。
25、本技術(shù)的有益效果:
26、本技術(shù)實(shí)施例可以通過元數(shù)據(jù)作為中間橋梁,將待綁定的csv數(shù)據(jù)通過由目標(biāo)數(shù)據(jù)對象元數(shù)據(jù)得到的綁定規(guī)則綁定到目標(biāo)數(shù)據(jù)對象上,從而解決了在處理csv數(shù)據(jù)時由于數(shù)據(jù)本身未綁定到數(shù)據(jù)對象中導(dǎo)致在處理數(shù)據(jù)時要通過人工干預(yù)來實(shí)現(xiàn)數(shù)據(jù)與數(shù)據(jù)對象的對應(yīng),從而使得csv數(shù)據(jù)在采集時極為不便,影響用戶對csv數(shù)據(jù)使用的問題,讓用戶在使用時可以直接將大量的csv數(shù)據(jù)與目標(biāo)數(shù)據(jù)對象進(jìn)行綁定,進(jìn)而讓用戶可以方便快速的進(jìn)行之后的存儲或者是其他處理過程。進(jìn)一步的,本技術(shù)實(shí)施例中在將csv數(shù)據(jù)綁定到數(shù)據(jù)對象時,在指定綁定規(guī)則時,針對有數(shù)據(jù)架構(gòu)的目標(biāo)數(shù)據(jù)對象,通過數(shù)據(jù)架構(gòu)來定義綁定規(guī)則,而對于無數(shù)據(jù)架構(gòu)的則對應(yīng)的通過算法模型來定義綁定規(guī)則,從而讓數(shù)據(jù)對象對應(yīng)的綁定規(guī)則可以覆蓋全部的待綁定csv數(shù)據(jù)。
27、本技術(shù)附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本技術(shù)的實(shí)踐了解到。