欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于眾包主動(dòng)學(xué)習(xí)用于檢測(cè)異常圖片的方法_3

文檔序號(hào):9453472閱讀:來源:國(guó)知局
公式(3) (4),計(jì)算樣本xn在已標(biāo)記樣本集合S中的領(lǐng)域集合為N(x|S)= {x1;x2,…,xn},其對(duì)應(yīng)標(biāo)簽為Y= {y1;y2,…,yj,貝丨J
[0115]
(6)
[0116]根據(jù)公式(3) (4),計(jì)算樣本x在已標(biāo)記樣本集合S中的領(lǐng)域集合為 N(x|S) ={xnx2,…,xj,其中N(x|S)中和樣本x屬于同一圖像特征的集合為 義1 = …,氣;h統(tǒng)計(jì)XI在圖像特征中位于樣本x前后e范圍內(nèi)的樣本數(shù)量 SN,,貝It
"
[0117] T(x|S) =SN/2e(7)
[0118] 密度熵計(jì)算
[0119] 根據(jù)公式(3) (4),計(jì)算未標(biāo)記樣本xn在未標(biāo)記集合C中的近鄰樣本集合N(xi|UN) -{Xl,X2,…,XrJ°
[0120] 則基未標(biāo)注樣本xn的近鄰密度表示為:
[0121]
(8)
[0122] 信息熵計(jì)算
[0123] 樣本包含的信息量表示為時(shí)序密度、近鄰熵與近鄰密度的乘積:
[0124] Information(x) =H(x)*p(x) * (1_D(x)) (9)
[0125] 根據(jù)公式(10)在未標(biāo)記樣本集合UN中選擇信息熵最大的樣本乂"進(jìn)行標(biāo)記
[0126]
(10)
[0127] 2分類算法
[0128] 結(jié)果可信度計(jì)算
[0129] 標(biāo)記樣本X;的用戶集合為U={uuu2,…,uj,用戶U;的可信度為creditui,回答 函數(shù)ANS(i〇,
[0130] 最終結(jié)果為"yes"的可信度
[0131] 最終結(jié)果為"no"的可信度為
[0132] 根據(jù)公式(13)標(biāo)記樣本xn
[0133] (丨3)
[0134] 最終樣本Xl標(biāo)記結(jié)果可信度計(jì)算公式如下:
[0135] (14 )
[0136] 用戶信用度更新
[0137] 根據(jù)采樣樣本的權(quán)重平均值A(chǔ)W以及閾值A(chǔ),更新用戶信用度。
[0138] 對(duì)于標(biāo)記正確的用戶群Utnjf;={uu2,…,um},用戶11;的信用度的更新公式為:
[0139]
(15)
[0140] 對(duì)于標(biāo)記正確的用戶群Ufals(;= {Ui,%,…,ud},用戶~的信用度的更新公式為:
[0141]
(16)
[0142] 可信分類迭代算法
[0143] 輸入:算法迭代次數(shù)T
[0144] 輸出:分類器C
[0145] 說明t代表第t次迭代
[0146] 1、根據(jù)公式(13),標(biāo)記樣本x1;
[0147] 2、根據(jù)公式(14),計(jì)算標(biāo)記樣本xn的結(jié)果可信度TU(xJ;
[0148] 3、將樣本Xl加入到對(duì)應(yīng)的訓(xùn)練集樣本中,其初始權(quán)值wt(Xl) =l_TU(Xl);
[0149] 4、歸一化權(quán)重,訓(xùn)練弱分類器Ct;
[0150] 5、計(jì)算帶權(quán)分類誤差,計(jì)算公式為1^=5:¥々;)1[(:々#7;)];
[0151] 6、計(jì)算弱分類器對(duì)應(yīng)的權(quán)重,計(jì)算公式為》, = Zij}
[0152] 7、更新樣本權(quán)重,更新公式為
歸一化權(quán)重,并記錄新加進(jìn)去的樣本的權(quán)重值,
[0153] 8、如果迭代次數(shù)不到T,則轉(zhuǎn)到第(5)步,否則,繼續(xù)下一步; ^w
[0154] 9、計(jì)算新加進(jìn)去樣本T次權(quán)重的平均值如果大于閾值A(chǔ),則舍棄 T5 該樣本,重新采樣;否則將其加入訓(xùn)練集,權(quán)重為AW,并更新S和Y。
[0155] 10、分別根據(jù)公式(15) (16)更新用戶信用度。
[0156] 11、輸出分類荖
[0157] 3基于眾包的主動(dòng)學(xué)習(xí)算法
[0158] 定義3迭代終止條件:以分類器的穩(wěn)定性或是置信度作為標(biāo)準(zhǔn),一旦分類器的準(zhǔn) 確率達(dá)到85 %時(shí),主動(dòng)學(xué)習(xí)迭代過程將立即終止。
[0159] 輸入:未標(biāo)記樣本集合UN,已標(biāo)注好的測(cè)試集T,已標(biāo)記樣本集合S= {Xl,x2,… ,xj,其對(duì)應(yīng)標(biāo)簽為Y= {y:,y2,…,yn}初始化S=傘;
[0160] 輸出:標(biāo)記訓(xùn)練集S
[0161] 1、初始化S,用k-means算法在U中選出有代表性的樣本S。,標(biāo)注S=S。,未標(biāo)記 樣本集U=U-S。
[0162] 2、根據(jù)公式(10),在UN中找到最值得標(biāo)記的樣本xn;
[0163] 3、調(diào)用可信分類迭代算法,得到分類器C,
[0164] 4、用測(cè)試集T對(duì)分類器進(jìn)行測(cè)試,如果滿足終止條件,則終止;否則,跳到第(2) 步。
[0165] 結(jié)果判定
[0166] 眾包通過大量自由工作者的智慧解決實(shí)際問題,但是有些工作者因?yàn)閷I(yè)技能不 足,或者使自己利益最大化,提交結(jié)果質(zhì)量低下,因此如何評(píng)判結(jié)果質(zhì)量很重要。
[0167] 對(duì)于出血圖片與正常圖片,采取不同的判定標(biāo)準(zhǔn)。由于相對(duì)于正常圖片來說,出血 圖片對(duì)于我們更有意義。對(duì)于病人和醫(yī)生來說,出血圖片的覆蓋率比分類的正確率更重要, 因此將圖片判定為正常圖片的條件要嚴(yán)格些。
[0168]標(biāo)準(zhǔn):結(jié)果為'否'(即判斷為正常提片)的人數(shù)超過100人,且結(jié)果的可信度大于 0。7,則平臺(tái)返回結(jié)果'否'。
[0169] 結(jié)果為'是'(即判斷為出血圖片)的人數(shù)超過50人,且結(jié)果的可信度大于0。5, 則平臺(tái)返回結(jié)果'是'。
[0170]否則,不返回結(jié)果,交由專家進(jìn)行判定。
[0171]假設(shè)普通用戶中結(jié)果為'是'(出血)的人數(shù)為yl,'否'(正常)的人數(shù)為nl;職 業(yè)用戶中結(jié)果為'是'(出血)的人數(shù)為y2, '否'(正常)的人數(shù)為n2 ;專業(yè)用戶中結(jié)果為 '是'(出血)的人數(shù)為y3, '否'(正常)的人數(shù)為n3 ;
[0172] 可信度的計(jì)算公式:
[0173]通過計(jì)算結(jié)果為'是'的可信度:該公式為(0.l*yl+0. 3*y2+0. 6*y3)/(0.l*(yl+n1) +0? 3*(y2+n2)+0? 6*(y3+n3))。
[0174]通過計(jì)算結(jié)果為'否'的可信度:該公式為(0?l*nl+0. 3*n2+0. 6*n3V(0.l*(yl+n1) +0? 3*(y2+n2)+0? 6*(y3+n3))。
[0175] 眾包是互聯(lián)網(wǎng)帶來的一種分布式問題解決和生產(chǎn)組織模式,所謂眾包指的是一個(gè) 公司或機(jī)構(gòu)把過去由員工執(zhí)行的工作任務(wù),以自由自愿的形式外包給非特定的(而且通常 是大型的)大眾網(wǎng)絡(luò)的做法。企業(yè)和組織可以通過互聯(lián)網(wǎng)利用志愿者群體的創(chuàng)意和能力, 這些志愿者具備完成任務(wù)的技能,愿意利用自己的業(yè)余時(shí)間工作,滿足于對(duì)其服務(wù)收取小 額報(bào)酬,或者暫時(shí)并無報(bào)酬,甚至僅僅滿足于未來能夠獲取更多報(bào)酬的前景。眾包提供了一 種組織勞動(dòng)力的全新方式。
[0176] 主動(dòng)學(xué)習(xí)算法雖然可以讓專家只對(duì)有價(jià)值的圖片進(jìn)行標(biāo)注,但采樣過程耗時(shí)較 長(zhǎng),如果整個(gè)過程只由專家一人完成,那將耗費(fèi)專家大量時(shí)間。對(duì)我們的算法來說最消耗時(shí) 間的不是對(duì)圖片進(jìn)行標(biāo)記,而是采樣過程。在這里如果使用眾包,那么這個(gè)問題可以被很好 的解決。使用眾包之后,人不再需要守在電腦前等采樣結(jié)果,然后對(duì)采樣的樣本進(jìn)行標(biāo)記。 在采樣過程結(jié)束之后,會(huì)將采樣得到的需要標(biāo)記的樣本放到我們搭建的眾包平臺(tái)上,由登 錄平臺(tái)的用戶進(jìn)行標(biāo)記,由平臺(tái)返回,然后根據(jù)某種質(zhì)量評(píng)估方法,判斷是否采用。
[0177] 用戶通過移動(dòng)設(shè)備登錄之后,接收到的任務(wù)非常簡(jiǎn)單,只需要回答是或者否,不需 要進(jìn)行復(fù)雜的思考,占用很長(zhǎng)時(shí)間,幾秒就可以完成,有利于平臺(tái)是推廣和提高用戶參與的 積極性。任務(wù)簡(jiǎn)單也可以一定程度提高結(jié)果的質(zhì)量。
[0178] 在本說明書的描述中,參考術(shù)語"一個(gè)實(shí)施例"、"一些實(shí)施例"、"示例"、"具體示 例"、或"一些示例"等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材
當(dāng)前第3頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
芦山县| 白山市| 喀喇沁旗| 古蔺县| 晋州市| 铁力市| 正镶白旗| 阳信县| 土默特右旗| 和硕县| 新绛县| 伊宁县| 称多县| 佛坪县| 句容市| 固镇县| 天等县| 都兰县| 泰来县| 比如县| 呼图壁县| 宜良县| 修武县| 赤城县| 修文县| 建湖县| 东兰县| 清水河县| 忻州市| 宝坻区| 万州区| 鲁甸县| 图们市| 鞍山市| 营山县| 郴州市| 蒙阴县| 苗栗县| 辉南县| 凌源市| 奉贤区|