本發(fā)明涉及數(shù)據(jù)處理,更具體地說,涉及一種數(shù)據(jù)篩選方法、裝置、計算機程序產(chǎn)品、設(shè)備及介質(zhì)。
背景技術(shù):
1、隨著數(shù)據(jù)來源的增多,數(shù)據(jù)規(guī)模也隨之增大,雖然更容易的獲取到數(shù)據(jù),但也帶來了新的問題,比如各種各樣的數(shù)據(jù)會影響所需數(shù)據(jù)的獲取,導(dǎo)致數(shù)據(jù)篩選的準(zhǔn)確性變差。
2、綜上所述,如何準(zhǔn)確對數(shù)據(jù)進行篩選是目前本領(lǐng)域技術(shù)人員亟待解決的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是提供一種數(shù)據(jù)篩選方法,其能在一定程度上解決如何準(zhǔn)確對數(shù)據(jù)進行篩選的技術(shù)問題。本發(fā)明還提供了一種數(shù)據(jù)篩選裝置、計算機程序產(chǎn)品、電子設(shè)備及計算機非易失性可讀存儲介質(zhì)。
2、為了實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、第一方面,提供一種數(shù)據(jù)篩選方法,應(yīng)用于計算卡,包括:
4、獲取操作界面?zhèn)鬏數(shù)拇幚淼哪繕?biāo)數(shù)據(jù)集;
5、確定所述目標(biāo)數(shù)據(jù)集的篩選方式;
6、按照所述篩選方式,對所述目標(biāo)數(shù)據(jù)集進行權(quán)重調(diào)整、誤差補償和數(shù)據(jù)區(qū)分,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;
7、獲取對所述目標(biāo)數(shù)據(jù)集進行篩選的參照特征集;
8、對所述目標(biāo)特征集和所述參照特征集進行比較,得到比較結(jié)果;
9、根據(jù)所述比較結(jié)果對所述目標(biāo)數(shù)據(jù)集進行篩選,得到篩選結(jié)果,傳輸所述篩選結(jié)果至所述操作界面。
10、另一方面,對所述目標(biāo)數(shù)據(jù)集進行權(quán)重調(diào)整、誤差補償和數(shù)據(jù)區(qū)分,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集,包括:
11、對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算、線性變換和非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;
12、其中,權(quán)重運算用于根據(jù)數(shù)據(jù)權(quán)重對數(shù)據(jù)進行權(quán)重調(diào)整;線性變換用于對數(shù)據(jù)進行誤差補償;非線性變換用于對數(shù)據(jù)進行區(qū)分。
13、另一方面,所述篩選方式包括進行重要程度篩選的方式;對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算、線性變換和非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集,包括:
14、對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算,得到第一權(quán)重運算結(jié)果;
15、確定所述目標(biāo)數(shù)據(jù)集對應(yīng)的第一補償數(shù)據(jù);
16、對所述第一補償數(shù)據(jù)和所述第一權(quán)重運算結(jié)果進行線性變換,得到第一線性變換結(jié)果;
17、對所述第一線性變換結(jié)果進行非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;所述非線性變換用于將所述第一線性變換結(jié)果中的非負值進行放大,且將所述第一線性變換結(jié)果中的負值進行縮小。
18、另一方面,對所述目標(biāo)特征集和所述參照特征集進行比較,得到比較結(jié)果,包括:
19、對于所述目標(biāo)數(shù)據(jù)集中的每個數(shù)據(jù),在所述目標(biāo)特征集中確定數(shù)據(jù)的目標(biāo)特征,在所述參照特征集中確定數(shù)據(jù)的參照特征;
20、生成所述參照特征與所述目標(biāo)特征間的第一差值,根據(jù)所述第一差值生成數(shù)據(jù)的第一誤差率;
21、檢測所述第一誤差率是否小于等于第一標(biāo)準(zhǔn)值;
22、響應(yīng)于所述第一誤差率小于等于所述第一標(biāo)準(zhǔn)值,則得到表征數(shù)據(jù)屬于重要數(shù)據(jù)的比較結(jié)果;
23、響應(yīng)于所述第一誤差率大于所述第一標(biāo)準(zhǔn)值,則得到表征數(shù)據(jù)屬于非重要數(shù)據(jù)的比較結(jié)果。
24、另一方面,根據(jù)所述比較結(jié)果對所述目標(biāo)數(shù)據(jù)集進行篩選,得到篩選結(jié)果之后,還包括:
25、對所述目標(biāo)數(shù)據(jù)集中的重要數(shù)據(jù)進行加密,并對所述目標(biāo)數(shù)據(jù)集中的非重要數(shù)據(jù)進行脫敏處理。
26、另一方面,所述篩選方式包括進行安全數(shù)據(jù)篩選的方式;對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算、線性變換和非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集,包括:
27、對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算,得到第二權(quán)重運算結(jié)果;
28、確定所述目標(biāo)數(shù)據(jù)集對應(yīng)的第二補償數(shù)據(jù);
29、對所述第二補償數(shù)據(jù)和所述第二權(quán)重運算結(jié)果進行線性變換,得到第二線性變換結(jié)果;
30、對所述第二線性變換結(jié)果進行非線性變換,得到第一非線性變換結(jié)果;所述非線性變換用于將所述第二線性變換結(jié)果映射為小于等于1的正數(shù);
31、對所述第一非線性變換結(jié)果進行權(quán)重運算,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集。
32、另一方面,對所述目標(biāo)特征集和所述參照特征集進行比較,得到比較結(jié)果,包括:
33、對于所述目標(biāo)數(shù)據(jù)集中的每組數(shù)據(jù),在所述目標(biāo)特征集中確定數(shù)據(jù)組的目標(biāo)特征組,在所述參照特征集中確定數(shù)據(jù)組的參照特征組;
34、生成所述參照特征組與所述目標(biāo)特征組間的第二差值,根據(jù)所述第二差值生成數(shù)據(jù)組的第二誤差率;
35、檢測所述第二誤差率是否小于等于第二標(biāo)準(zhǔn)值;
36、響應(yīng)于所述第二誤差率小于等于所述第二標(biāo)準(zhǔn)值,則得到表征數(shù)據(jù)組安全的比較結(jié)果;
37、響應(yīng)于所述第二誤差率大于所述第二標(biāo)準(zhǔn)值,則得到表征數(shù)據(jù)組危險的比較結(jié)果。
38、另一方面,根據(jù)所述比較結(jié)果對所述目標(biāo)數(shù)據(jù)集進行篩選,得到篩選結(jié)果之后,還包括:
39、將所述目標(biāo)數(shù)據(jù)集中危險數(shù)據(jù)組的目標(biāo)特征組作為待凈化數(shù)據(jù)組;
40、對待凈化數(shù)據(jù)組進行權(quán)重運算、線性變換和非線性變換,得到待凈化數(shù)據(jù)組對應(yīng)的凈化特征集;
41、對凈化特征集和所述參照特征集進行比較,根據(jù)比較結(jié)果檢測待凈化數(shù)據(jù)組是否均安全;
42、響應(yīng)于待凈化數(shù)據(jù)組均安全,則將待凈化數(shù)據(jù)組作為安全數(shù)據(jù)組;
43、響應(yīng)于待凈化數(shù)據(jù)組存在危險數(shù)據(jù)組,則將待凈化數(shù)據(jù)組中危險數(shù)據(jù)組的凈化特征集作為新的待凈化數(shù)據(jù)組,返回執(zhí)行所述對待凈化數(shù)據(jù)組進行權(quán)重運算、線性變換和非線性變換,得到待凈化數(shù)據(jù)組對應(yīng)的凈化特征集的步驟。
44、另一方面,所述篩選方式包括進行設(shè)定數(shù)據(jù)篩選的方式;對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算、線性變換和非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集,包括:
45、對所述目標(biāo)數(shù)據(jù)集進行權(quán)重運算,得到第三權(quán)重運算結(jié)果;
46、確定所述目標(biāo)數(shù)據(jù)集對應(yīng)的第三補償數(shù)據(jù);
47、對所述第三補償數(shù)據(jù)和所述第三權(quán)重運算結(jié)果進行線性變換,得到第三線性變換結(jié)果;
48、對所述第三線性變換結(jié)果進行非線性變換,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;所述非線性變換用于將所述第三線性變換結(jié)果映射為小于等于1的正數(shù)。
49、另一方面,對所述目標(biāo)特征集和所述參照特征集進行比較,得到比較結(jié)果,包括:
50、確定詞向量的長度值;
51、在所述目標(biāo)特征集中,讀取出長度等于所述長度值的特征詞組;
52、對于每個所述特征詞組,檢測所述特征詞組是否包含所述參照特征集中的設(shè)定特征,若是,則得到表征所述特征詞組在所述目標(biāo)數(shù)據(jù)集中的對應(yīng)數(shù)據(jù)組存在設(shè)定數(shù)據(jù)的比較結(jié)果,若否,則得到表征所述特征詞組在所述目標(biāo)數(shù)據(jù)集中的對應(yīng)數(shù)據(jù)組不存在設(shè)定數(shù)據(jù)的比較結(jié)果。
53、另一方面,根據(jù)所述比較結(jié)果對所述目標(biāo)數(shù)據(jù)集進行篩選,得到篩選結(jié)果之后,還包括:
54、將所述目標(biāo)數(shù)據(jù)集中的存在設(shè)定數(shù)據(jù)的數(shù)據(jù)組進行過濾,得到處理后數(shù)據(jù)集。
55、另一方面,獲取對所述目標(biāo)數(shù)據(jù)集進行篩選的參照特征集,包括:
56、獲取攜帶設(shè)定數(shù)據(jù)的實際數(shù)據(jù)集;
57、對所述實際數(shù)據(jù)集進行權(quán)重運算,得到第四權(quán)重運算結(jié)果;
58、確定所述實際數(shù)據(jù)集對應(yīng)的第四補償數(shù)據(jù);
59、對所述第四補償數(shù)據(jù)和所述第四權(quán)重運算結(jié)果進行線性變換,得到第四線性變換結(jié)果;
60、對所述第四線性變換結(jié)果進行非線性變換,得到所述實際數(shù)據(jù)集對應(yīng)的實際特征集;所述非線性變換用于將所述第四線性變換結(jié)果映射為小于等于1的正數(shù);
61、獲取設(shè)定特征集,并將同時存在所述實際特征集和所述設(shè)定特征集中的特征組成參照特征集。
62、第二方面,提供一種數(shù)據(jù)篩選裝置,包括計算卡、與所述計算卡連接的電源模塊和時鐘模塊、與所述計算卡連接的操作界面;且所述計算卡、所述電源模塊和所述時鐘模塊搭載在板卡上;
63、所述操作界面,用于對待處理的目標(biāo)數(shù)據(jù)集和篩選結(jié)果進行操作;
64、所述計算卡,用于確定所述目標(biāo)數(shù)據(jù)集的篩選方式;按照所述篩選方式,對所述目標(biāo)數(shù)據(jù)集進行權(quán)重調(diào)整、誤差補償和數(shù)據(jù)區(qū)分,得到所述目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;獲取對所述目標(biāo)數(shù)據(jù)集進行篩選的參照特征集;對所述目標(biāo)特征集和所述參照特征集進行比較,得到比較結(jié)果;根據(jù)所述比較結(jié)果對所述目標(biāo)數(shù)據(jù)集進行篩選,得到所述篩選結(jié)果。
65、第三方面,提供一種計算機程序產(chǎn)品,包括計算機程序/指令,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)如上任一所述數(shù)據(jù)篩選方法的步驟。
66、第四方面,提供一種電子設(shè)備,包括:
67、存儲器,用于存儲計算機程序;
68、處理器,用于執(zhí)行所述計算機程序時實現(xiàn)如上任一所述數(shù)據(jù)篩選方法的步驟。
69、第五方面,提供一種計算機非易失性可讀存儲介質(zhì),所述計算機非易失性可讀存儲介質(zhì)中存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上任一所述數(shù)據(jù)篩選方法的步驟。
70、本發(fā)明提供的一種數(shù)據(jù)篩選方法,應(yīng)用于計算卡,獲取操作界面?zhèn)鬏數(shù)拇幚淼哪繕?biāo)數(shù)據(jù)集;確定目標(biāo)數(shù)據(jù)集的篩選方式;按照篩選方式,對目標(biāo)數(shù)據(jù)集進行權(quán)重調(diào)整、誤差補償和數(shù)據(jù)區(qū)分,得到目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集;獲取對目標(biāo)數(shù)據(jù)集進行篩選的參照特征集;對目標(biāo)特征集和參照特征集進行比較,得到比較結(jié)果;根據(jù)比較結(jié)果對目標(biāo)數(shù)據(jù)集進行篩選,得到篩選結(jié)果,傳輸篩選結(jié)果至操作界面。本發(fā)明的有益效果是:由于經(jīng)權(quán)重調(diào)整后的數(shù)據(jù)更易被準(zhǔn)確區(qū)分開來,經(jīng)誤差補償后的數(shù)據(jù)更準(zhǔn)確,經(jīng)數(shù)據(jù)區(qū)分后的數(shù)據(jù)與篩選方式間的關(guān)系更明確,如此一來,計算卡借助權(quán)重調(diào)整、誤差補償和數(shù)據(jù)區(qū)分來對目標(biāo)數(shù)據(jù)集進行處理后,可以準(zhǔn)確提取出目標(biāo)數(shù)據(jù)集對應(yīng)的目標(biāo)特征集,且可以對目標(biāo)特征集中與篩選相關(guān)和無關(guān)的特征進行區(qū)分,便于后續(xù)應(yīng)用目標(biāo)特征集準(zhǔn)確對數(shù)據(jù)進行篩選;此外,將此目標(biāo)特征集與參照特征集進行比較,便可以對目標(biāo)數(shù)據(jù)集進行對應(yīng)篩選,換言之,只需根據(jù)篩選方式調(diào)整參照特征集,便可以調(diào)整對數(shù)據(jù)的篩選結(jié)果,靈活性好,實現(xiàn)了借助計算卡來為操作界面提供準(zhǔn)確、靈活的數(shù)據(jù)篩選結(jié)果,從而便于操作界面對數(shù)據(jù)集進行處理。本發(fā)明提供的一種數(shù)據(jù)篩選裝置、計算機程序產(chǎn)品、電子設(shè)備及計算機非易失性可讀存儲介質(zhì)也解決了相應(yīng)技術(shù)問題。