1.一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,包括如下步驟;
S11,基于學(xué)習(xí)數(shù)據(jù)確定每種數(shù)據(jù)對應(yīng)的第一特征詞群;
S12,根據(jù)第一特征詞群對學(xué)習(xí)數(shù)據(jù)進行數(shù)據(jù)分類;
S13,判斷學(xué)習(xí)數(shù)據(jù)的分類是否正確,如果是,至步驟S15;如果否,調(diào)整第一特征詞群,至步驟S12;
S15,基于第一特征詞群建立數(shù)據(jù)分類模型。
2.根據(jù)權(quán)利要求1所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,所述步驟S11包括:
S111,從學(xué)習(xí)數(shù)據(jù)中的每種數(shù)據(jù)中讀取N份數(shù)據(jù),將其中的詞匯按照權(quán)重排序;
S112,將S111中排序前X位詞匯選取為第一特征詞群。
3.根據(jù)權(quán)利要求2所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,所述步驟S112還包括用戶根據(jù)需要對S111中排序前X位詞匯進行篩選獲得第一特征詞群。
4.根據(jù)權(quán)利要求1-3任意一項所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,當(dāng)步驟S13判斷學(xué)習(xí)數(shù)據(jù)分類正確時,至步驟S14,所述步驟S14包括,讀取通過S12分好類的學(xué)習(xí)數(shù)據(jù)的內(nèi)容,將每一類數(shù)據(jù)中的詞匯按照權(quán)重排序,將排序后前Y位詞匯選取為第二特征詞群。
5.根據(jù)權(quán)利要求4所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,用戶根據(jù)需要對S14中排序前Y位詞匯進行篩選獲得第二特征詞群。
6.根據(jù)權(quán)利要求4或5所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,所述步驟S15為基于第二特征詞群建立數(shù)據(jù)分類模型。
7.一種基于機器學(xué)習(xí)的數(shù)據(jù)分類設(shè)備,其特征在于,包括:
第一特征詞群確定模塊:用于基于學(xué)習(xí)數(shù)據(jù)確定每種數(shù)據(jù)對應(yīng)的第一特征詞群;
第一數(shù)據(jù)分類模塊:用于根據(jù)第一特征詞群對學(xué)習(xí)數(shù)據(jù)進行數(shù)據(jù)分類;
判斷分類模塊:用于判斷學(xué)習(xí)數(shù)據(jù)的分類是否正確,如果是,至建模模塊;如果否,調(diào)整第一特征詞群,至第一數(shù)據(jù)分類模塊;
建模模塊:用于基于第一特征詞群建立數(shù)據(jù)分類模型。
8.根據(jù)權(quán)利要求7所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類設(shè)備,其特征在于,所述數(shù)據(jù)分類模塊包括:
權(quán)重排序單元:用于從學(xué)習(xí)數(shù)據(jù)中的每種數(shù)據(jù)中讀取N份數(shù)據(jù),將其中的詞匯按照權(quán)重排序;
第一特征詞群選取單元:用于將權(quán)重排序單元中排序前X位詞匯選取為第一特征詞群。
9.根據(jù)權(quán)利要求8所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類設(shè)備,其特征在于,所述第一特征詞群選取單元還用于用戶根據(jù)需要將權(quán)重排序單元排序前X位詞匯進行篩選獲得第一特征詞群。
10.根據(jù)權(quán)利要求7-9任意一項所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類設(shè)備,其特征在于,當(dāng)判斷分類模塊判斷學(xué)習(xí)數(shù)據(jù)分類正確時,至第二特征詞群確定模塊,所述第二特征詞群確定模塊用于讀取第一數(shù)據(jù)分類模塊分好類的學(xué)習(xí)數(shù)據(jù)的內(nèi)容,將每一類數(shù)據(jù)中的詞匯按照權(quán)重排序,將排序后前Y位詞匯選取為第二特征詞群。
11.根據(jù)權(quán)利要求10所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類設(shè)備,其特征在于,用戶根據(jù)需要對第二特征詞群確定模塊中排序前Y位詞匯進行篩選獲得第二特征詞群。
12.根據(jù)權(quán)利要求10或11所述的一種基于機器學(xué)習(xí)的數(shù)據(jù)分類方法,其特征在于,所述建模模塊用于基于第二特征詞群建立數(shù)據(jù)分類模型。