1.一種模糊支持向量機隸屬度函數(shù)的獲取方法,其特征在于,包括以下步驟:
(1)、樣本數(shù)據(jù)輸入:在支持向量機中的目標(biāo)函數(shù)引入松弛變量ζ,建立軟間隔分類器,并為了限制其取值加入了懲罰參數(shù)C,目標(biāo)函數(shù)表示為:
s.t. y(i)(wTx(i)+b)≥1-ξi,i=1,...,m
ξi≥0,i=1,...,m
支持向量機中的樣本數(shù)據(jù){x1,x2,x3,...},每個樣本xi有一個標(biāo)簽yi,{(x1,y1),(x2,y2),...};
(2)、利用k-means確定正負(fù)樣本的類中心;
(3)、引入系數(shù)消除樣本不平衡:加入了一個隸屬度值si(0<si≤1),對于樣本數(shù)據(jù)則有{(x1,y1,s1),(x2,y2,s2),...},那么求解的目標(biāo)函數(shù)則為:
s.t. y(i)(wTx(i)+b)≥1-ξi,i=1,...,m
ξi≥0,i=1,...,m;
(4)、區(qū)分“支持向量”和“噪聲點”:計算每個正樣本和負(fù)樣本之間的距離,距離達(dá)到兩類樣本間最小距離的樣本即為“支持向量”;
(5)、判斷隸屬度大??;
(6)、獲取隸屬度,從而提高樣本分類能力。
2.根據(jù)權(quán)利要求1所述的模糊支持向量機隸屬度函數(shù)的獲取方法,其特征在于,所述的步驟(2)中,基于k-means的樣本類中心選擇算法包括以下步驟:
a、計算兩兩樣本之間的距離d(xi,xj);
b、計算樣本間距離的平均值:
c、計算每個樣本的密度參數(shù):
d、具有最大密度參數(shù)的樣本被選為樣本類中心。
3.根據(jù)權(quán)利要求1所述的模糊支持向量機隸屬度函數(shù)的獲取方法,其特征在于,所述的步驟(5)中,對“支持向量”和“噪聲點”進(jìn)行不同的隸屬度計算:
Φ(xi+)表示了特征空間中的正樣本,Φ(xi-)表示了特征空間中的負(fù)樣本;是特征空間中正樣本中心,而表示了負(fù)樣本中心;正樣本中的支持向量,是負(fù)樣本中的支持向量;
di表示了樣本與類中心的距離,di*表示了樣本到類邊緣的距離。