] ^ 0. 9525 ;
[0119] 計(jì)算各個(gè)篩選參數(shù)對(duì)應(yīng)的信息增益值L,則所述L(標(biāo)簽)=K-W(標(biāo)簽)=0. 003, L(贊)=K-W(贊)=0.001,L(評(píng)論)=K-W(評(píng)論)=0.002,L(瀏覽數(shù))=K-W(瀏覽 數(shù))=0,L(收藏?cái)?shù))=K-W(收藏?cái)?shù))=0. 0015,則各個(gè)篩選參數(shù)的優(yōu)先級(jí)為標(biāo)簽一評(píng)論 -收藏?cái)?shù)一贊一瀏覽數(shù)。
[0120] 生成模塊30,用于基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略。
[0121] 在基于篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略時(shí),直接將各個(gè)篩選參數(shù)作為篩選節(jié)點(diǎn)生成 數(shù)據(jù)篩選樹(shù)形結(jié)果如圖4所示。
[0122] 本實(shí)施例提出的數(shù)據(jù)篩選策略生成裝置,獲取各個(gè)樣本數(shù)據(jù)的對(duì)應(yīng)的第一篩選結(jié) 果,以及各個(gè)所述樣本數(shù)據(jù)對(duì)應(yīng)篩選參數(shù)的第二篩選結(jié)果,并基于所述第一篩選結(jié)果以及 所述第二篩選結(jié)果計(jì)算各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí),基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策 略,終端在進(jìn)行數(shù)據(jù)篩選時(shí),直接基于各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí)進(jìn)行篩選,在有篩選參數(shù) 不匹配時(shí),即判定數(shù)據(jù)不匹配,篩選過(guò)程非常簡(jiǎn)便。
[0123] 需要說(shuō)明的是,在本文中,術(shù)語(yǔ)"包括"、"包含"或者其任何其他變體意在涵蓋非排 他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者裝置不僅包括那些要素,而 且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者裝置所固有 的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句"包括一個(gè)……"限定的要素,并不排除在包括 該要素的過(guò)程、方法、物品或者裝置中還存在另外的相同要素。
[0124] 上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0125] 通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方 法可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下 前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做 出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì) (如R0M/RAM、磁碟、光盤(pán))中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī), 服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0126] 以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專(zhuān)利范圍,凡是利用本發(fā) 明說(shuō)明書(shū)及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技 術(shù)領(lǐng)域,均同理包括在本發(fā)明的專(zhuān)利保護(hù)范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種數(shù)據(jù)篩選策略生成方法,其特征在于,所述數(shù)據(jù)篩選策略生成方法包括以下步 驟: 獲取各個(gè)樣本數(shù)據(jù)的對(duì)應(yīng)的第一篩選結(jié)果,以及各個(gè)所述樣本數(shù)據(jù)對(duì)應(yīng)篩選參數(shù)的第 二篩選結(jié)果; 基于所述第一篩選結(jié)果以及所述第二篩選結(jié)果計(jì)算各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí); 基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略。2. 如權(quán)利要求1所述的數(shù)據(jù)篩選策略生成方法,其特征在于,所述基于所述第一篩選 結(jié)果以及所述第二篩選結(jié)果計(jì)算各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí)的步驟包括: 基于所述第一篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算標(biāo)準(zhǔn)樣本值; 基于所述第二篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算各個(gè)篩選參數(shù)對(duì)應(yīng)的信息熵; 基于各個(gè)所述篩選參數(shù)的信息熵以及所述標(biāo)準(zhǔn)樣本值計(jì)算各個(gè)所述篩選參數(shù)對(duì)應(yīng)的 信息增益值; 基于所述信息增益值生成各個(gè)所述篩選參數(shù)的篩選優(yōu)先級(jí)。其中所述增機(jī)值越大所述 篩選優(yōu)先級(jí)越大。3. 如權(quán)利要求2所述的數(shù)據(jù)篩選策略生成方法,其特征在于,所述基于所述第一篩選 結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算標(biāo)準(zhǔn)樣本值的公式如下: K(P1,P2,......,Pn)=-Pllog2 (Pl)-P21og2 (P2)-......-PnIog2 (Pn); 其中,Pn為各個(gè)樣本數(shù)據(jù)中第一篩選結(jié)果相同的樣本數(shù)據(jù)的個(gè)數(shù)與所述樣本數(shù)據(jù)總個(gè) 數(shù)的比值。4. 如權(quán)利要求2所述的數(shù)據(jù)篩選策略生成方法,其特征在于,所述基于所述第一篩選 結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算標(biāo)準(zhǔn)樣本值的步驟包括: 依次提取每個(gè)篩選參數(shù)對(duì)應(yīng)的第二篩選結(jié)果; 在每次提取到每個(gè)篩選參數(shù)對(duì)應(yīng)的第二篩選結(jié)果時(shí),獲取第一篩選結(jié)果相同的樣本數(shù) 據(jù)的數(shù)量作為第一計(jì)算值; 獲取第一篩選結(jié)果相同的樣本數(shù)據(jù)中第二篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量作為第二 計(jì)算值; 基于所述第一計(jì)算值和第二計(jì)算值計(jì)算提取的所述篩選參數(shù)對(duì)應(yīng)的信息熵; 繼續(xù)提取下一篩選參數(shù)對(duì)應(yīng)的第二篩選結(jié)果,直至提取完所有樣本數(shù)據(jù)的篩選結(jié)果。5. 如權(quán)利要求4所述的數(shù)據(jù)篩選策略生成方法,其特征在于,所述第三基于所述第一 計(jì)算值和第二計(jì)算值計(jì)算提取的所述篩選參數(shù)對(duì)應(yīng)的信息熵的計(jì)算公式如下: W=HlK(P1,P2, ......,Pn)+H2K(Pl,P2,......,Pn)+......+HnK(Pl,P2,......,Pn); 其中,所述Hn為所述第一計(jì)算值與樣本數(shù)據(jù)總數(shù)之間的比值,Pn為第二計(jì)算值與第一 計(jì)算值之間的比值。6. -種數(shù)據(jù)篩選策略生成裝置,其特征在于,所述數(shù)據(jù)篩選策略生成裝置包括: 獲取模塊,用于獲取各個(gè)樣本數(shù)據(jù)的對(duì)應(yīng)的第一篩選結(jié)果,以及各個(gè)所述樣本數(shù)據(jù)對(duì) 應(yīng)篩選參數(shù)的第二篩選結(jié)果; 計(jì)算模塊,用于基于所述第一篩選結(jié)果以及所述第二篩選結(jié)果計(jì)算個(gè)篩選參數(shù)的篩選 優(yōu)先級(jí); 生成模塊,用于基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略。7. 如權(quán)利要求6所述的數(shù)據(jù)篩選策略生成裝置,其特征在于,所述計(jì)算模塊包括: 計(jì)算子模塊,用于基于所述第一篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算標(biāo)準(zhǔn)樣本值;基 于所述第二篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量計(jì)算各個(gè)篩選參數(shù)對(duì)應(yīng)的信息熵,以及基于 各個(gè)所述篩選參數(shù)的信息熵以及所述標(biāo)準(zhǔn)樣本值計(jì)算各個(gè)所述篩選參數(shù)對(duì)應(yīng)的信息增益 值; 生成子模塊,用于基于所述信息增益值生成各個(gè)所述篩選參數(shù)的篩選優(yōu)先級(jí)。其中所 述增機(jī)值越大所述篩選優(yōu)先級(jí)越大。8. 如權(quán)利要求7所述的數(shù)據(jù)篩選策略生成裝置,其特征在于,所述計(jì)算子模塊計(jì)算標(biāo) 準(zhǔn)樣本值的公式如下: K(P1,P2,......,Pn)=-Pllog2 (Pl)-P21og2 (P2)-......-PnIog2 (Pn); 其中,Pn為各個(gè)樣本數(shù)據(jù)中第一篩選結(jié)果相同的樣本數(shù)據(jù)的個(gè)數(shù)與所述樣本數(shù)據(jù)總個(gè) 數(shù)的比值。9. 如權(quán)利要求8所述的數(shù)據(jù)篩選策略生成裝置,其特征在于,所述計(jì)算子模塊包括: 提取單元,用于依次提取每個(gè)篩選參數(shù)對(duì)應(yīng)的第二篩選結(jié)果; 獲取單元,用于在每次提取到每個(gè)篩選參數(shù)對(duì)應(yīng)的第二篩選結(jié)果時(shí),獲取第一篩選結(jié) 果相同的樣本數(shù)據(jù)的數(shù)量作為第一計(jì)算值,以及獲取第一篩選結(jié)果相同的樣本數(shù)據(jù)中第二 篩選結(jié)果相同的樣本數(shù)據(jù)的數(shù)量作為第二計(jì)算值; 計(jì)算單元,用于基于所述第一計(jì)算值和第二計(jì)算值計(jì)算提取的所述篩選參數(shù)對(duì)應(yīng)的信 息摘; 所述提取單元,還用于在所述計(jì)算單元計(jì)算出所述信息熵后,繼續(xù)提取下一篩選參數(shù) 對(duì)應(yīng)的第二篩選結(jié)果,直至提取完所有樣本數(shù)據(jù)的篩選結(jié)果。10. 如權(quán)利要求9所述的數(shù)據(jù)篩選策略生成裝置,其特征在于,所述計(jì)算單元計(jì)算信息 熵的計(jì)算公式如下: W=HlK(P1,P2, ......,Pn)+H2K(Pl,P2,......,Pn)+......+HnK(Pl,P2,......,Pn); 其中,所述Hn為所述第一計(jì)算值與樣本數(shù)據(jù)總數(shù)之間的比值,Pn為第二計(jì)算值與第一 計(jì)算值之間的比值。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種數(shù)據(jù)篩選策略生成方法,所述數(shù)據(jù)篩選策略生成方法包括以下步驟:獲取各個(gè)樣本數(shù)據(jù)的對(duì)應(yīng)的第一篩選結(jié)果,以及各個(gè)所述樣本數(shù)據(jù)對(duì)應(yīng)篩選參數(shù)的第二篩選結(jié)果;基于所述第一篩選結(jié)果以及所述第二篩選結(jié)果計(jì)算各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí);基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略。本發(fā)明還公開(kāi)了一種數(shù)據(jù)篩選策略生成裝置。本發(fā)明基于所述篩選優(yōu)先級(jí)生成數(shù)據(jù)篩選策略,終端在進(jìn)行數(shù)據(jù)篩選時(shí),直接基于各個(gè)篩選參數(shù)的篩選優(yōu)先級(jí)進(jìn)行篩選,在有篩選參數(shù)不匹配時(shí),即判定數(shù)據(jù)不匹配,篩選過(guò)程非常簡(jiǎn)便。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN104933165
【申請(qǐng)?zhí)枴緾N201510367386
【發(fā)明人】劉孟焱
【申請(qǐng)人】努比亞技術(shù)有限公司
【公開(kāi)日】2015年9月23日
【申請(qǐng)日】2015年6月29日