1.一種核范數(shù)驅(qū)動的數(shù)據(jù)分類方法,其特征在于,基于核范數(shù)作為距離度量的思想,該方法包括:
依據(jù)訓(xùn)練集中訓(xùn)練樣本的初始標(biāo)簽信息確定初始類別矩陣Y,以及通過對所有所述訓(xùn)練樣本執(zhí)行近鄰搜索操作構(gòu)造得到相似度量矩陣,并對所述相似度量矩陣進(jìn)行對稱化、歸一化處理得到權(quán)重系數(shù)矩陣W;其中,所述訓(xùn)練集包括有標(biāo)簽訓(xùn)練樣本和無標(biāo)簽訓(xùn)練樣本,所述權(quán)重系數(shù)矩陣W用于表征樣本間的近鄰特性;
基于所述初始類別矩陣Y和所述權(quán)重系數(shù)矩陣W,通過平衡近鄰重構(gòu)項和標(biāo)簽擬合項建立直推式標(biāo)簽傳播模型,利用所述直推式標(biāo)簽傳播模型進(jìn)行迭代優(yōu)化得到所述訓(xùn)練集的軟類別標(biāo)簽預(yù)測矩陣F;其中,所述近鄰重構(gòu)項是可靠的核范數(shù)度量的重構(gòu)錯誤項,用于定義流形平滑項,所述標(biāo)簽擬合項是基于加權(quán)L2,1范數(shù)正則化的標(biāo)簽擬合項;
利用所述軟類別標(biāo)簽預(yù)測矩陣F,計算得到測試樣本的軟類別標(biāo)簽向量,根據(jù)軟類別標(biāo)簽向量中概率的最大值對應(yīng)的類別確定所述測試樣本的類別,得到最準(zhǔn)確的分類結(jié)果;其中,所述軟類別標(biāo)簽向量中的元素為所述測試樣本歸屬各個類別的概率。
2.如權(quán)利要求1所述的方法,其特征在于,所述通過對所有所述訓(xùn)練樣本執(zhí)行近鄰搜索操作構(gòu)造得到相似度量矩陣,并對所述相似度量矩陣進(jìn)行對稱化、歸一化處理得到權(quán)重系數(shù)矩陣W,包括:
對所述訓(xùn)練集中每個樣本進(jìn)行K近鄰搜索,找出每個樣本在所述訓(xùn)練集中的K個距離最近的樣本;
采用LLE-重構(gòu)權(quán)的構(gòu)造算法,構(gòu)造相似近鄰圖的相似度量矩陣;
對所述相似度量矩陣進(jìn)行對稱化、歸一化處理,得到所述權(quán)重系數(shù)矩陣W。
3.如權(quán)利要求1或2所述的方法,其特征在于,通過解決以下目標(biāo)函數(shù)最小化問題實現(xiàn)所述平衡近鄰重構(gòu)項和標(biāo)簽擬合項:
其中,||FT-WFT||*為所述近鄰重構(gòu)項,tr((FT-YT)TUV(FT-YT))為所述標(biāo)簽擬合項;U是以μi為元素的平衡近鄰重構(gòu)項和標(biāo)簽擬合項之間的正權(quán)衡參數(shù)矩陣;V是以Vi,i=1/2||hi||2(i=1,2,...,l+μ)為元素的對角矩陣,hi為矩陣FΤ-YΤ的第i個行向量。
4.一種核范數(shù)驅(qū)動的數(shù)據(jù)分類系統(tǒng),其特征在于,基于核范數(shù)作為距離度量的思想,該系統(tǒng)包括:
訓(xùn)練預(yù)處理模塊,用于依據(jù)訓(xùn)練集中訓(xùn)練樣本的初始標(biāo)簽信息確定初始類別矩陣Y,以及通過對所有所述訓(xùn)練樣本執(zhí)行近鄰搜索操作構(gòu)造得到相似度量矩陣,并對所述相似度量矩陣進(jìn)行對稱化、歸一化處理得到權(quán)重系數(shù)矩陣W;其中,所述訓(xùn)練集包括有標(biāo)簽訓(xùn)練樣本和無標(biāo)簽訓(xùn)練樣本,所述權(quán)重系數(shù)矩陣W用于表征樣本間的近鄰特性;
訓(xùn)練模塊,用于基于所述初始類別矩陣Y和所述權(quán)重系數(shù)矩陣W,通過平衡近鄰重構(gòu)項和標(biāo)簽擬合項建立直推式標(biāo)簽傳播模型,利用所述直推式標(biāo)簽傳播模型進(jìn)行迭代優(yōu)化得到所述訓(xùn)練集的軟類別標(biāo)簽預(yù)測矩陣F;其中,所述近鄰重構(gòu)項是可靠的核范數(shù)度量的重構(gòu)錯誤項,用于定義流形平滑項,所述標(biāo)簽擬合項是基于加權(quán)L2,1范數(shù)正則化的標(biāo)簽擬合項;
類別確定模塊,用于利用所述軟類別標(biāo)簽預(yù)測矩陣F,計算得到測試樣本的軟類別標(biāo)簽向量,根據(jù)軟類別標(biāo)簽向量中概率的最大值對應(yīng)的類別確定所述測試樣本的類別,得到最準(zhǔn)確的分類結(jié)果;其中,所述軟類別標(biāo)簽向量中的元素為所述測試樣本歸屬各個類別的概率。