欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

自適應(yīng)向量投影的線性支持向量選取方法

文檔序號(hào):8430898閱讀:350來源:國(guó)知局
自適應(yīng)向量投影的線性支持向量選取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于支持向量機(jī)的學(xué)習(xí)方法,具體涉及一種自適應(yīng)向量投影的線性支持向 量選取方法。
【背景技術(shù)】
[0002] 統(tǒng)計(jì)學(xué)習(xí)理論最早提出于20世紀(jì)60年代,它是針對(duì)小樣本進(jìn)行研宄,20世紀(jì)90 年代中期,Vapnik基于此理論提出了新的學(xué)習(xí)算法--支持向量機(jī)。近年來,支持向量機(jī) 的研宄獲得了越來越多的關(guān)注,支持向量機(jī)已經(jīng)成功應(yīng)用于許多實(shí)際問題,例如人臉識(shí)別、 手寫體識(shí)別,文本分類等。文本分類是信息過濾、信息檢索、搜索引擎、文本數(shù)據(jù)庫、數(shù)字化 圖書管等領(lǐng)域的技術(shù)基礎(chǔ),而支持向量機(jī)是文本分類的最主要最簡(jiǎn)單的手段之一。
[0003] 然而,標(biāo)準(zhǔn)支持向量機(jī)的訓(xùn)練速度比較慢,在實(shí)際應(yīng)用中受到極大限制,通過研 宄發(fā)現(xiàn),支持向量機(jī)在訓(xùn)練的時(shí)候,僅僅由位于邊界的支持向量決定,因此如果能預(yù)先確 定支持向量,能夠極大的加快支持向量機(jī)的訓(xùn)練速度。目前很多相關(guān)的算法被提出,例如 Chunking算法,Decomposing算法和序列最小最優(yōu)化算法,這些算法獲得支持向量需要多 次迭代。為了加快獲得支持向量的時(shí)間,研宄者提出了一種改進(jìn)的支持向量機(jī)BS-SVM(見 參考文獻(xiàn)1)、基于向量投影的支撐向量預(yù)選取方法(見參考文獻(xiàn)2)。然而在實(shí)際中,由于 樣本分布難以預(yù)測(cè),如何選取邊界向量代替支持向量成為研宄的關(guān)鍵。在文獻(xiàn)2中采用類 中心向量作為投影方向,但是當(dāng)樣本分散時(shí),類中心并不能反映該樣本的原始特征,降低分 類精度。
[0004] 針對(duì)樣本分布不均勻和離散度大的問題,在選取支持向量時(shí),難以確定包含原始 樣本特征的邊界向量,從而造成分類速度低下。而隨著科技的日益發(fā)展,在信息過濾、信息 檢索、搜索引擎、文本數(shù)據(jù)庫、數(shù)字化圖書管等領(lǐng)域,都其渴望一種更快速、分類更精確的方 法來提尚其彳目息過濾、彳目息檢索、搜索的速率和效果。
[0005] 故一種分類精度高、分類速度快的自適應(yīng)向量投影的線性支持向量選取方法亟待 提出。
[0006] 參考文獻(xiàn)1:郭亞琴,王正群,一種改進(jìn)的支持向量機(jī)BS-SVM[J].微電子學(xué)與計(jì)算 機(jī),2010, 28(6) :54-56。
[0007] 參考文獻(xiàn)2:李青,焦李成,周偉達(dá).基于向量投影的支撐向量預(yù)選取[J].計(jì)算機(jī) 學(xué)報(bào),2005, 28(2) :145-151。

【發(fā)明內(nèi)容】

[0008] 為了解決上述技術(shù)問題,本發(fā)明提出了自適應(yīng)向量投影的線性支持向量選取方 法,該方法相較于現(xiàn)有的支持向量機(jī)的方法,針對(duì)線性可分的數(shù)據(jù),其分類精度更高,分類 速度更快,更適用于人臉識(shí)別、手寫體識(shí)別,文本分類等領(lǐng)域內(nèi)。
[0009] 為了達(dá)到上述目的,本發(fā)明的技術(shù)方案如下:
[0010] 自適應(yīng)向量投影的線性支持向量選取方法,方法用于線性數(shù)據(jù)的文本分類,包括 以下步驟:
[0011] (1)對(duì)原始樣本建立數(shù)據(jù)模型;
[0012] (2)對(duì)數(shù)據(jù)模型進(jìn)行計(jì)算,得到最佳自適應(yīng)投影直線;
[0013] (3)將原始樣本投影到最佳自適應(yīng)投影直線后,在一維空間內(nèi)選取具有原始特征 的邊界樣本;
[0014] (4)利用支持向量機(jī)對(duì)邊界樣本進(jìn)行訓(xùn)練,得到分類結(jié)果。
[0015] 本發(fā)明一種自適應(yīng)向量投影的線性支持向量選取方法,運(yùn)用自適應(yīng)投影方法,從 原始樣本中提取出包含樣本特征的邊界樣本作為新的訓(xùn)練樣本,在保證原始樣本所有特征 的同時(shí)限制邊界樣本數(shù)量,以提高訓(xùn)練速度和分類精度。
[0016] 在上述技術(shù)方案的基礎(chǔ)上,還可做如下改進(jìn):
[0017]作為優(yōu)選的方案,在步驟(1)中的數(shù)據(jù)模型為
[0018]
【主權(quán)項(xiàng)】
1. 自適應(yīng)向量投影的線性支持向量選取方法,所述方法用于線性數(shù)據(jù)的文本分類,其 特征在于,包括以下步驟: (1) 對(duì)原始樣本建立數(shù)據(jù)模型; (2) 對(duì)所述數(shù)據(jù)模型進(jìn)行計(jì)算,得到最佳自適應(yīng)投影直線; (3) 將原始樣本投影到所述最佳自適應(yīng)投影直線后,在一維空間內(nèi)選取具有原始特征 的邊界樣本; (4) 利用支持向量機(jī)對(duì)邊界樣本進(jìn)行訓(xùn)練,得到分類結(jié)果。
2. 根據(jù)權(quán)利要求1所述的自適應(yīng)向量投影的線性支持向量選取方法,其特征在于,在 所述步驟(1)中的數(shù)據(jù)模型為
為兩類原始樣本,
為原始樣本的均值; W= {¥1,¥2,1^,'\¥(1}1^1? (1為自適應(yīng)投影向量。
3. 根據(jù)權(quán)利要求2所述的自適應(yīng)向量投影的線性支持向量選取方法,其特 征在于,在所述步驟(2)中,對(duì)數(shù)據(jù)模型中的各式求和,得到自適應(yīng)函數(shù)J(W t),
;當(dāng)j屬于第i類時(shí),au= 0,當(dāng)j 不屬于第i類時(shí),au= 1。
4. 根據(jù)權(quán)利要求3所述的自適應(yīng)向量投影的線性支持向量選取方法,其特征 在于,對(duì)所述自適應(yīng)函數(shù)J(Wt)進(jìn)行求導(dǎo)后取零,得到所述最佳自適應(yīng)投影直線,
5. 根據(jù)權(quán)利要求4所述的自適應(yīng)向量投影的線性支持向量選取方法,其特征在于,在 所述步驟(3)中:將所有原始樣本投影到所述最佳自適應(yīng)投影直線上后,得到:
計(jì)算類和 < 之間的最小距離. Φ,類和g的類內(nèi)最大距離戎?°)和 J(C0)o
6. 根據(jù)權(quán)利要求5所述的自適應(yīng)向量投影的線性支持向量選取方法,其特征在于,利 用下式來選取所述邊界樣本:
其中=Q1為投影后的樣本中點(diǎn),λ λ 2,用于控制邊界樣本的數(shù)量。
7. 根據(jù)權(quán)利要求5或6所述的自適應(yīng)向量投影的線性支持向量選取方法,其特征在于, 距離的計(jì)算選用標(biāo)準(zhǔn)的歐式距離。
【專利摘要】本發(fā)明公開了自適應(yīng)向量投影的線性支持向量選取方法,方法用于線性數(shù)據(jù)的文本分類,包括以下步驟:(1)對(duì)原始樣本建立數(shù)據(jù)模型;(2)對(duì)數(shù)據(jù)模型進(jìn)行計(jì)算,得到最佳自適應(yīng)投影直線;(3)將原始樣本投影到最佳自適應(yīng)投影直線后,在一維空間內(nèi)選取具有原始特征的邊界樣本;(4)利用支持向量機(jī)對(duì)邊界樣本進(jìn)行訓(xùn)練,得到分類結(jié)果。本發(fā)明自適應(yīng)向量投影的線性支持向量選取方法相較于現(xiàn)有的支持向量機(jī)的方法,針對(duì)線性可分的數(shù)據(jù),其分類精度更高,分類速度更快,更適用于人臉識(shí)別、手寫體識(shí)別、文本分類等領(lǐng)域內(nèi)。
【IPC分類】G06F17-30
【公開號(hào)】CN104750867
【申請(qǐng)?zhí)枴緾N201510182575
【發(fā)明人】郭亞琴, 秦燕, 顧娜
【申請(qǐng)人】南通理工學(xué)院
【公開日】2015年7月1日
【申請(qǐng)日】2015年4月16日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
佛山市| 景德镇市| 宁阳县| 新沂市| 长汀县| 南郑县| 方城县| 云霄县| 深水埗区| 昆山市| 蓬莱市| 西城区| 剑河县| 阿克| 财经| 同心县| 陆川县| 石渠县| 衡阳市| 开化县| 祥云县| 屯昌县| 哈尔滨市| 达尔| 凌源市| 克拉玛依市| 长岛县| 陇川县| 凤翔县| 房山区| 曲麻莱县| 浦东新区| 胶州市| 利川市| 龙井市| 洱源县| 垫江县| 襄汾县| 衡山县| 哈尔滨市| 静安区|