3-1,根據(jù)公式 R記樣本
[0059]S3-2,根據(jù)公式
' 計(jì)算標(biāo)記樣本X;的結(jié)果可信度TU(x;);
[0060] S3-3,將樣本Xl加入到對應(yīng)的訓(xùn)練集樣本中,其初始權(quán)值wt(Xl) =l-TU(Xl);
[0061]S3-4,歸一化權(quán)重,訓(xùn)練弱分類器Ct;
[0062] 33-5,計(jì)算帶權(quán)分類誤差1^=5:¥上,_)1[(:上,_乒7,_)];
[0063]S3-6,計(jì)算弱分類器對應(yīng)的權(quán).
[0064]S3-7,繼續(xù)執(zhí)行更新樣本權(quán)重的步驟,其中更新的公式如下:
[0065]
歸一化權(quán)重,并記錄新加進(jìn)去 的樣本的權(quán)重值,
[0066]S3-8,如果迭代次數(shù)不到T,則轉(zhuǎn)到第S3-5步,否則,繼續(xù)下一步;
[0067]S3-9,計(jì)算新加進(jìn)去樣本T次權(quán)重的平均彳
:卩果大于閾值A(chǔ),則 舍棄該樣本,重新采樣;否則將其加入訓(xùn)練集,權(quán)重為AW,并更新S和Y;
[0068] S3-10,分別根據(jù)公式
[0069] '
[0070] E新用戶信用度;
[0071] S3-11,輸出初始分類君
[0072] 所述的基于眾包主動(dòng)學(xué)習(xí)用于檢測異常圖片的方法,優(yōu)選的,所述S4包括:
[0073] 輸入:未標(biāo)記樣本集合UN,已標(biāo)注好的測試集T,已標(biāo)記樣本集合S= {Xl,x2,… ,xj,其對應(yīng)標(biāo)簽為Y= {y:,y2,…,yn}初始化S=傘;
[0074] 輸出:標(biāo)記訓(xùn)練集S,輸出最終分類器C,
[0075] A、初始化S,用k-means算法在U中選出有代表性的樣本S。,標(biāo)注S=S。,未標(biāo)記 樣本集U=U-S;
[0076] B、根據(jù)公另 EUN中找到 最值得標(biāo)記的樣本xn;
[0077] C、調(diào)用可信分類迭代算法,得到最終分類器C,
[0078] D、用測試集T對分類器進(jìn)行測試,如果滿足終止條件,則終止;否則,跳到B步。
[0079] 綜上所述,由于采用了上述技術(shù)方案,本發(fā)明的有益效果是:
[0080] 主動(dòng)學(xué)習(xí)算法使用眾包,很好的解決判定準(zhǔn)確性和實(shí)效性。使用眾包之后,人不再 需要守在電腦前等采樣結(jié)果,然后對采樣的樣本進(jìn)行標(biāo)記。在采樣過程結(jié)束之后,會(huì)將采樣 得到的需要標(biāo)記的樣本放到我們搭建的眾包平臺(tái)上,由登錄平臺(tái)的用戶進(jìn)行標(biāo)記,由平臺(tái) 返回,然后根據(jù)某種質(zhì)量評估方法,判斷是否采用。
[0081] 本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0082] 本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0083] 圖1是本發(fā)明總體示意圖。
【具體實(shí)施方式】
[0084] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
[0085] 在本發(fā)明的描述中,需要理解的是,術(shù)語"縱向"、"橫向"、"上"、"下"、"前"、"后"、 "左"、"右"、"豎直"、"水平"、"頂"、"底" "內(nèi)"、"外"等指示的方位或位置關(guān)系為基于附圖所 示的方位或位置關(guān)系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝 置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限 制。
[0086]在本發(fā)明的描述中,除非另有規(guī)定和限定,需要說明的是,術(shù)語"安裝"、"相連"、 "連接"應(yīng)做廣義理解,例如,可以是機(jī)械連接或電連接,也可以是兩個(gè)元件內(nèi)部的連通,可 以是直接相連,也可以通過中間媒介間接相連,對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù) 具體情況理解上述術(shù)語的具體含義。
[0087]如圖1所示,一種基于眾包主動(dòng)學(xué)習(xí)用于檢測異常圖片的方法,其包括如下步驟: [0088] S1,獲取圖像特征,從圖像特征中提取二進(jìn)制向量,選取色調(diào)和飽和度作為圖像特 征,合并色調(diào)和飽和度圖像特征來形成一個(gè)二維色調(diào)飽和度直方圖;
[0089]S2,計(jì)算每個(gè)圖像特征周圍的已標(biāo)記樣本密度,對已標(biāo)記樣本密度低于閾值的樣 本,計(jì)算信息熵,選擇信息熵最大的樣本放到眾包平臺(tái),由用戶進(jìn)行標(biāo)記;
[0090]S3,根據(jù)眾包平臺(tái)用戶的標(biāo)記和結(jié)果可信度計(jì)算方法,確定樣本的標(biāo)簽,并臨時(shí)放 入訓(xùn)練集,根據(jù)可信分類迭代算法,確定該標(biāo)記樣本最終是否采用,并更新眾包平臺(tái)用戶的 信用度,并經(jīng)由眾包平臺(tái)返回給用戶,輸出初始分類器,當(dāng)初始分類器達(dá)到一定閾值后執(zhí)行 S4 ;
[0091]S4,當(dāng)S1-S3步驟執(zhí)行完畢后,輸出標(biāo)記訓(xùn)練集,輸出最終分類器。
[0092] 特征提取
[0093] 顏色空間選取
[0094] 取一個(gè)二進(jìn)制向量來表示W(wǎng)CE圖像特征。顏色空間選擇HSI顏色空間,因?yàn)檫@種 彩色描述對人來說是自然而直觀的,它反映了人的視覺系統(tǒng)感知彩色的方式,以色調(diào)H、飽 和度S和強(qiáng)度I三種基本特征量來感知顏色。可從平面和強(qiáng)度平面分別提取顏色信息,換 句話說色調(diào)不因?yàn)楣庹諒?qiáng)度的變化而變化。因此我們只選取色調(diào)(H)和飽和度(S)信息作 為特征。
[0095] 特征直方圖構(gòu)建
[0096] 我們合并H和S兩個(gè)特征來形成一個(gè)2Dh-s直方圖,而不是單獨(dú)H直方圖和S直 方圖。這樣能更精確的描述WCE圖像。
[0097]我們不選取顏色空間的整個(gè)光譜,基于大量實(shí)驗(yàn)發(fā)現(xiàn)紅色對于出血檢測來說最有 用,其他顏色(綠色和紅色)對于醫(yī)生來說用處不大,將他們認(rèn)為是噪音。我們可以看到區(qū) 分正常與出血的最有意義的色調(diào)范圍是【0-40】和【350-0】。H空間縮減到了原來的14%。 當(dāng)飽和度S很低時(shí),色調(diào)H是不穩(wěn)定的。對于這個(gè)難題,有很多解決方案,在這兒我們選擇 簡單的閾值策略,采用這個(gè)方法不用計(jì)算灰度信息。通過實(shí)驗(yàn),將〇. 2作為飽和度S的最小 值。最終飽和度S的范圍為【0.2,1】。
[0098] 1采樣
[0099]時(shí)序密度計(jì)算
[0100] 在采樣之前,對于某一未標(biāo)記圖片,根據(jù)其所在圖像特征中的圖片序號,分別在其 前后e張之內(nèi)查看,計(jì)算這范圍內(nèi)已標(biāo)記樣本的密度。
[0101] 所有圖像特征集合為H= {Hi,H2,…,Hk},圖像特征嘸中樣本集1={Hu,Hl2,… ,Hiji,Hij,Hij+1,…,Hn},對于樣本Hij,在Hi中HijE至Hij+ E范圍內(nèi)查看已被標(biāo)記的樣本數(shù)量AN,并根據(jù)公式1,計(jì)算其周圍被標(biāo)記樣本的密度
[0102] D(Hxj) =AN/2e(1)
[0103] 基于時(shí)序的不確定性熵計(jì)算
[0104] 基于時(shí)序的Shannon信息熵表示為:
[0105]
2)
[0106] 其中,p(yi|Xj)表示在給定樣本X/倩況下其標(biāo)簽屬于yi的可能性,T(x」S)表示樣 本在集合S中的時(shí)序密度,S表示x在已標(biāo)記樣本集中的領(lǐng)域集合。
[0107]對于樣本集合X={xdx2,…,xn},中的樣本xn,通過計(jì)算X中所有樣本之間的距 離并求其平均得到avg_distance,計(jì)算公式如下:
[0108]
:(3.)
[0109] 定義1樣本集合X={xdx2,…,xj,中樣本鄰域樣本集合表示為:
[0110] N(Xj|X) = {xj|xjGX(x1;x2, ???,x; !,xi+1, ???,xn)} ,d(xi,Xj) ^avg_distance(4)
[0111] 其中d(Xl,x])為樣本之間距離度量,本文選取歐式距離。
[0112] 定義2標(biāo)記函數(shù)I
[0113]
(5J:
[0114] 根據(jù)