欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于score輸出值百分比的可控置信機(jī)器算法

文檔序號(hào):8282737閱讀:164來源:國(guó)知局
基于score輸出值百分比的可控置信機(jī)器算法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于機(jī)器學(xué)習(xí)領(lǐng)域,尤其涉及一種基于score輸出值百分比的可控置信機(jī) 器算法。
【背景技術(shù)】
[0002] 置信機(jī)器就是在機(jī)器學(xué)習(xí)的過程中對(duì)學(xué)習(xí)的結(jié)果同時(shí)提供一個(gè)可信的程度判斷 或可以對(duì)學(xué)習(xí)結(jié)果進(jìn)行預(yù)設(shè)的分類處理。置信機(jī)器在醫(yī)療診斷等高風(fēng)險(xiǎn)的應(yīng)用領(lǐng)域有著重 要的現(xiàn)實(shí)意義。置信機(jī)器是機(jī)器學(xué)習(xí)領(lǐng)域中研宄時(shí)間不長(zhǎng)的一個(gè)分支,實(shí)現(xiàn)置信機(jī)器學(xué)習(xí) 的理論基礎(chǔ)與方法并不多。有直接構(gòu)造置信度的方法,有間接構(gòu)造置信度的方法,有通過 設(shè)置拒絕選項(xiàng),可以進(jìn)行預(yù)設(shè)的分類處理,來排除低可信的部分,從而提高剩余部分的可信 度,實(shí)現(xiàn)置信分類。簡(jiǎn)捷有效的置信機(jī)器學(xué)習(xí)是置信機(jī)器研宄的目標(biāo)之一。
[0003] 2005 年由 Vladimir Vovk,Alexander Gammerman,Glenn Shafer 出版了關(guān)于信任 機(jī)器學(xué)習(xí)的專著《Algorithmic Learning in a Random World》。2004年邱德紅等在計(jì)算 機(jī)研宄與發(fā)展期刊Vol. 41,No. 9中發(fā)表了《基于算法隨機(jī)性理論和奇異描述的置信學(xué)習(xí)機(jī) 器》,根據(jù)Kolmogorov算法隨機(jī)性理論,為學(xué)習(xí)機(jī)器建立了一種置信機(jī)制,描述了置信學(xué)習(xí) 機(jī)器的算法。
[0004] 在實(shí)現(xiàn)現(xiàn)有技術(shù)的方案中,發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下的技術(shù)問題:
[0005] (1)置信控制的精度不夠。目前上述的置信機(jī)器學(xué)習(xí)方法是通過設(shè)置Bin的方法 來計(jì)算錯(cuò)分率,并根據(jù)計(jì)算結(jié)果設(shè)置閾值,但最后總的錯(cuò)分率控制與當(dāng)初預(yù)設(shè)值比較,有時(shí) 差距會(huì)很大。
[0006] (2)置信控制不夠靈活。設(shè)置Bin的方法有一定的限制,不能任意設(shè)置數(shù)值,進(jìn)行 靈活多變的控制,滿足不同的要求。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明實(shí)施例的目的在于提供一種基于score輸出值百分比的可控置信機(jī)器算 法,其解決現(xiàn)有技術(shù)的置信度控制精度不高和不夠靈活的問題。
[0008] 本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一方面,一種基于score輸出值百分比的可控置信 機(jī)器算法,所述方法包括如下步驟:
[0009] 對(duì)二元樣本采用二元分類器進(jìn)行分類;
[0010] 將二元分類器的分類結(jié)果轉(zhuǎn)成輸出值Output Score ;
[0011] 獲取未知二元樣本的理想錯(cuò)分率,以最小輸出值或最大輸出值為基準(zhǔn),向原點(diǎn)向 右或向左一步步的移動(dòng)閾值范圍(_tl,tl),當(dāng)閾值(_tl,tl)滿足已知二元樣本的理想錯(cuò) 分率時(shí),確定閾值(-tl,tl)為未知二元樣本的理想錯(cuò)分率對(duì)應(yīng)的閾值范圍(_tl,tl);所述 向右或向左一步步的移動(dòng)閾值范圍( -tl,tl)中每步移動(dòng)所跨越的Output Score為設(shè)定 Score百分比值;
[0012] 如未知二元樣本的輸出值Output Score屬于該閾值范圍,將未知樣本分配到拒絕 域,如未知二元樣本的輸出值Output Score不屬于該閾值范圍,將未知樣本分配到接受域。
[0013] 可選的,所述以最小輸出值或最大輸出值為基準(zhǔn),以等距離步長(zhǎng)向原點(diǎn)向右或向 左一步步的移動(dòng)閾值范圍(-tl,tl)具體包括:
[0014] 如向左移動(dòng)閾值范圍的已知二元樣本的錯(cuò)分率多,則先向右移動(dòng)閾值,然后再向 左移動(dòng)閾值;
[0015] 如向右移動(dòng)閾值范圍的已知二元樣本的錯(cuò)分率多,則先向左移動(dòng)閾值,然后再向 右移動(dòng)閾值。
[0016] 本發(fā)明提供的技術(shù)方案具有精度高,可靠性高的優(yōu)點(diǎn)。
【附圖說明】
[0017] 圖1是本發(fā)明提供的一種基于score輸出值百分比的可控置信機(jī)器算法的流程 圖;
[0018] 圖2是本發(fā)明提供的一種置信機(jī)器算法示意圖;
[0019] 圖3是本發(fā)明提供的置信機(jī)器算法的流程示意圖。
【具體實(shí)施方式】
[0020] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0021] 本發(fā)明【具體實(shí)施方式】提供一種基于score輸出值百分比的可控置信機(jī)器算法,上 述方法由置信機(jī)器執(zhí)行,該方法如圖1所示,包括如下步驟:
[0022] 101、對(duì)二元樣本采用二元分類器進(jìn)行分類;
[0023] 102、將二元分類器的分類結(jié)果轉(zhuǎn)成score輸出值(Output Score);
[0024] 103、獲取未知二元樣本的理想錯(cuò)分率,以最小輸出值或最大輸出值為基準(zhǔn),向原 點(diǎn)向右或向左一步步的移動(dòng)閾值范圍(_tl,tl),當(dāng)閾值(_tl,tl)滿足已知二元樣本的理 想錯(cuò)分率時(shí),確定閾值(_tl,tl)為未知二元樣本的理想錯(cuò)分率對(duì)應(yīng)的閾值范圍(_tl,tl), 所述向右或向左一步步的移動(dòng)閾值范圍( -tl,tl)中每步移動(dòng)所跨越的Output Score為設(shè) 定Score百分比值;
[0025] 104、如未知二元樣本的輸出值(Output Score)屬于該閾值范圍,將未知樣本分配 到拒絕域,如未知二元樣本的輸出值(Output Score)不屬于該閾值范圍,將未知樣本分配 到接受域。
[0026] 本發(fā)明采用的置信分類通過區(qū)分可信樣例與不可信樣例、劃分接受域與拒絕域, 達(dá)到對(duì)分類結(jié)果的預(yù)設(shè)分類處理,實(shí)現(xiàn)置信分類。本發(fā)明實(shí)施例的目的在于提供一種基于 score輸出值百分比的可控置信機(jī)器算法,以提高現(xiàn)有技術(shù)的置信度控制精度和靈活性。
[0027] 該方法的原理圖如圖2所示,其具體算法流程圖如圖3所示。
[0028] 可選的,上述以最小輸出值或最大輸出值為基準(zhǔn),以等距離步長(zhǎng)向原點(diǎn)向右或向 左一步步的移動(dòng)閾值范圍(_tl,tl)具體可以為:
[0029] 如向左移動(dòng)閾值范圍的已知二元樣本的錯(cuò)分率多,則先向右移動(dòng)閾值,然后再向 左移動(dòng)閾值;
[0030] 如向右移動(dòng)閾值范圍的已知二元樣本的錯(cuò)分率多,則先向左移動(dòng)閾值,然后再向 右移動(dòng)閾值。
[0031] 軟件算法流程如下:
[0032] 訓(xùn)練算法流程:
[0033] 輸入
[0034] X :二元訓(xùn)練數(shù)據(jù)樣本
[0035] Y :二元訓(xùn)練樣本標(biāo)簽
[0036] Train Set : (X, Y)
[0037] ρ :score輸出百分比
[0038] 輸出
[0039] 正例閾值:t
[0040] 負(fù)例閾值:_t
[0041] 過程
[0042] 1、用Train Set訓(xùn)練二類分類器,取得二元分類器的有關(guān)參數(shù)值
[0043] 2、用二類分類器在訓(xùn)練集Train Set上進(jìn)行分類
[0044] 3、將分類結(jié)果轉(zhuǎn)換成score輸出
[0045] 4、四種情況判斷
[0046] 5、計(jì)算score輸出百分比來確定閾值
[0047] 6、輸出 t 和-t
[0048] 7、結(jié)束
[0049] 分類算法流程:
[0050] 輸入
[0051] X :未知樣本
[0052] 輸出
[0053] 未知樣本的類別
[0054] or
[0055] 人工處理未知樣本
[0056] 過程
[0057] 1、用二元分類器對(duì)未知X進(jìn)行分類
[0058] 2、將分類結(jié)果轉(zhuǎn)換成score輸出
[0059] 3、if score 值〈=_t or score 值 > =t
[0060] 輸出未知樣本的類別
[0061] else
[0062] 人工處理
[0063] endif
[0064] 4、結(jié)束
[0065] 實(shí)驗(yàn)情況
[0066] 表1實(shí)驗(yàn)使用數(shù)據(jù)集情況表
[0067]
【主權(quán)項(xiàng)】
1. 一種基于score輸出值百分比的可控置信機(jī)器算法,其特征在于,所述方法包括如 下步驟: 對(duì)二元樣本采用二元分類器進(jìn)行分類; 將二元分類器的分類結(jié)果轉(zhuǎn)成輸出值Ou化ut Score ; 獲取未知二元樣本的理想錯(cuò)分率,W最小輸出值或最大輸出值為基準(zhǔn),向原點(diǎn)向右或 向左一步步的移動(dòng)闊值范圍(-tl,tl),當(dāng)闊值(-tl,tl)滿足已知二元樣本的理想錯(cuò)分率 時(shí),確定闊值為未知二元樣本的理想錯(cuò)分率對(duì)應(yīng)的闊值范圍所述向右 或向左一步步的移動(dòng)闊值范圍中每步移動(dòng)所跨越的Ou化ut Score為設(shè)定Score 百分比值; 如未知二元樣本的輸出值Ou化ut Score屬于該闊值范圍,將未知樣本分配到拒絕域, 如未知二元樣本的輸出值Ou化ut Score不屬于該闊值范圍,將未知樣本分配到接受域。
2. 根據(jù)權(quán)利要求1所述的算法,其特征在于,所述W最小輸出值或最大輸出值為基準(zhǔn), W等距離步長(zhǎng)向原點(diǎn)向右或向左一步步的移動(dòng)闊值范圍具體包括: 如向左移動(dòng)闊值范圍的已知二元樣本的錯(cuò)分率多,則先向右移動(dòng)闊值,然后再向左移 動(dòng)闊值; 如向右移動(dòng)闊值范圍的已知二元樣本的錯(cuò)分率多,則先向左移動(dòng)闊值,然后再向右移 動(dòng)闊值。
【專利摘要】本發(fā)明適用機(jī)器學(xué)習(xí)領(lǐng)域,提供了一種基于score輸出值百分比的可控置信機(jī)器算法,所述方法包括如下步驟:對(duì)二元樣本采用二元分類器進(jìn)行分類;將二元分類器的分類結(jié)果轉(zhuǎn)成score輸出值;獲取未知二元樣本的理想錯(cuò)分率,分別以最小輸出值和最大輸出值為基準(zhǔn),向著原點(diǎn)的方向以等距離步長(zhǎng)(設(shè)定score的百分比)分別向右或向左一步步的移動(dòng),當(dāng)滿足理想錯(cuò)分率,確定閾值范圍;如未知二元樣本的score輸出值屬于該閾值范圍,將未知樣本分配到拒絕域,如未知二元樣本的score輸出值不屬于該閾值范圍,將未知樣本分配到接受域。本發(fā)明提供的技術(shù)方案具有精度高,可靠性高的優(yōu)點(diǎn)。
【IPC分類】G06K9-62
【公開號(hào)】CN104598923
【申請(qǐng)?zhí)枴緾N201510012276
【發(fā)明人】蔣方純
【申請(qǐng)人】深圳信息職業(yè)技術(shù)學(xué)院
【公開日】2015年5月6日
【申請(qǐng)日】2015年1月8日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
虎林市| 马关县| 西贡区| 南宁市| 卢湾区| 肥东县| 石台县| 正安县| 遂昌县| 焦作市| 乐至县| 临颍县| 汤原县| 邢台市| 兰州市| 南澳县| 普宁市| 黔东| 铜川市| 桐柏县| 洞口县| 泸西县| 承德县| 土默特左旗| 武胜县| 宜城市| 新密市| 岱山县| 吉林市| 临泉县| 白朗县| 泰州市| 丹凤县| 昌宁县| 东阳市| 宁晋县| 梧州市| 东港市| 常德市| 定边县| 襄汾县|