本發(fā)明涉及醫(yī)療診斷領(lǐng)域,更具體地說(shuō),涉及一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法及裝置。
背景技術(shù):
:隨著人工智能的發(fā)展,計(jì)算機(jī)技術(shù)也在醫(yī)療領(lǐng)域中起到了重要的作用,實(shí)現(xiàn)醫(yī)療領(lǐng)域中的人工智能。計(jì)算機(jī)技術(shù)與眾多領(lǐng)域的人類(lèi)醫(yī)學(xué)專(zhuān)家的大量權(quán)威知識(shí)經(jīng)驗(yàn)相融合,開(kāi)發(fā)出醫(yī)療診斷系統(tǒng),可以有效地解決各種臨床問(wèn)題,起到了輔助醫(yī)生診斷的作用。在醫(yī)療診斷系統(tǒng)中,引入了dna微陣列技術(shù),即基因芯片,應(yīng)用基因芯片就可以在同一時(shí)間定量的分析大量的基因表達(dá)數(shù)據(jù)的水平,通過(guò)這些數(shù)據(jù)就可以研究生物的本質(zhì)。但是由于dna微陣列技術(shù)的發(fā)展,導(dǎo)致了基因表達(dá)數(shù)據(jù)的爆炸性增長(zhǎng),在這些大量的基因表達(dá)數(shù)據(jù)中選擇出重要的基因,對(duì)于現(xiàn)有技術(shù)提出了新的挑戰(zhàn)。局部超平面(localhyperlane,lh-relief)算法可以實(shí)現(xiàn)對(duì)大量基因表達(dá)數(shù)據(jù)進(jìn)行降維,即篩選掉沒(méi)有用的基因表達(dá)數(shù)據(jù),選擇出重要的基因,減小冗余度的問(wèn)題。但是該算法對(duì)含有噪聲的數(shù)據(jù)以及高位數(shù)據(jù)的應(yīng)用中,收斂性不能得到保證,導(dǎo)致算法的計(jì)算復(fù)雜度高。因此,如何實(shí)現(xiàn)對(duì)大量基因數(shù)據(jù)降維的同時(shí),降低算法的計(jì)算復(fù)雜度,是本領(lǐng)域技術(shù)人員需要解決的問(wèn)題。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,以實(shí)現(xiàn)對(duì)大量基因數(shù)據(jù)降維的同時(shí)降低算法的計(jì)算復(fù)雜度。為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了如下技術(shù)方案:一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,包括:s101:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性;s102:設(shè)置所述第一樣本屬性的初始權(quán)重向量,將所述初始權(quán)重向量作為本次權(quán)重向量;s103:通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量;s104:判斷確定規(guī)則是否成立,若是,則將所次權(quán)重向量作為最終權(quán)重向量,執(zhí)行s105;若否,則將下次權(quán)重向量作為本次權(quán)重向量,返回s103;其中||wt+1-wt||≤θ為確定規(guī)則,wt為本次權(quán)重向量,wt+1為下次權(quán)重向量,θ為停止準(zhǔn)則;s105:根據(jù)所述最終權(quán)重向量進(jìn)行特征選擇,得到特征索引子集;s106:將所述第一樣本集根據(jù)所述特征索引子集進(jìn)行特征選擇,得到特征選擇后的第二樣本集;s107:獲取第一待評(píng)估數(shù)據(jù),并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù);s108:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。優(yōu)選地,所述獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性,包括:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性,并對(duì)所述第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理;優(yōu)選地,所述通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量,包括:通過(guò)規(guī)則對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量wt+1,j(w)為優(yōu)化目標(biāo)函數(shù),通過(guò)最大化j(w)=(zit+1)twt+1計(jì)算得到。優(yōu)選地,所述獲取第一待評(píng)估數(shù)據(jù),并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù),包括:獲取第一待評(píng)估數(shù)據(jù),進(jìn)行離差標(biāo)準(zhǔn)化處理,并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。優(yōu)選地,在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,包括:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)利用k近鄰分類(lèi)器進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,包括:第一樣本集獲取模塊,用于獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性;初始權(quán)重限量設(shè)置模塊,用于設(shè)置所述第一樣本屬性的初始權(quán)重向量,將所述初始權(quán)重向量作為本次權(quán)重向量;下次權(quán)重向量獲取模塊,用于通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量;判斷模塊,用于判斷確定規(guī)則是否成立,若是,則將所述下次權(quán)重向量作為最終權(quán)重向量,調(diào)用特征索引子集獲取模塊;若否,則將下次權(quán)重向量作為本次權(quán)重向量,調(diào)用所述下次權(quán)重向量獲取模塊;其中確定規(guī)則為||wt+1-wt||≤θ,wt為本次權(quán)重向量,wt+1為下次權(quán)重向量,θ為停止準(zhǔn)則;所述特征索引子集獲取模塊,用于根據(jù)所述最終權(quán)重向量進(jìn)行特征選擇,得到特征索引子集;第二樣本集獲取模塊,用于將所述第一樣本集根據(jù)所述特征索引子集進(jìn)行特征選擇,得到特征選擇后的第二樣本集;第二待評(píng)估數(shù)據(jù)獲取模塊,用于獲取第一待評(píng)估數(shù)據(jù),并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù);分類(lèi)模塊,用于在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。優(yōu)選地,所述第一樣本集獲取模塊具體用于:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性,并對(duì)所述第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理。優(yōu)選地,所述下次權(quán)重向量獲取模塊具體用于:通過(guò)規(guī)則對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量wt+1,j(w)為優(yōu)化目標(biāo)函數(shù),通過(guò)最大化j(w)=(zit+1)twt+1計(jì)算得到。優(yōu)選地,所述第二待評(píng)估數(shù)據(jù)獲取模塊具體用于:獲取第一待評(píng)估數(shù)據(jù),進(jìn)行離差標(biāo)準(zhǔn)化處理,并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。優(yōu)選地,所述分類(lèi)模塊具體用于:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)利用k近鄰分類(lèi)器進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。通過(guò)以上方案可知,本發(fā)明實(shí)施例提供的一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,首先根據(jù)訓(xùn)練樣本集得到樣本的屬性值,根據(jù)屬性值利用梯度下降的權(quán)重更新方式計(jì)算屬性對(duì)應(yīng)的權(quán)重向量,因此可以保證收斂性,可以較快地達(dá)到算法的停止準(zhǔn)則,減少計(jì)算時(shí)間,降低計(jì)算復(fù)雜度;根據(jù)計(jì)算出的權(quán)重向量進(jìn)行特征選擇得到最優(yōu)特征集,將待評(píng)估數(shù)據(jù)樣本進(jìn)行標(biāo)準(zhǔn)化后再最優(yōu)特征子集中進(jìn)行特征選擇,再將特征選擇后的待評(píng)估數(shù)據(jù)樣本進(jìn)行分類(lèi)就可以使數(shù)據(jù)樣本實(shí)現(xiàn)降維,因此本發(fā)明實(shí)施例提供的方法實(shí)現(xiàn)降維的同時(shí)又降低了計(jì)算的復(fù)雜度,減少了計(jì)算時(shí)間。本發(fā)明還提供了一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,同樣可以實(shí)現(xiàn)上述技術(shù)效果。附圖說(shuō)明為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例公開(kāi)的一種醫(yī)療數(shù)據(jù)分類(lèi)方法流程圖;圖2為本發(fā)明實(shí)施例公開(kāi)的一種醫(yī)療數(shù)據(jù)分類(lèi)裝置結(jié)構(gòu)示意圖;圖3為本發(fā)明實(shí)施例公開(kāi)的一種醫(yī)療數(shù)據(jù)分類(lèi)方法與lh-relief的收斂結(jié)果對(duì)比圖。圖4為本發(fā)明實(shí)施例公開(kāi)的一種醫(yī)療數(shù)據(jù)分類(lèi)方法與lh-relief的平均性能性能對(duì)比圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。參見(jiàn)圖1,本發(fā)明實(shí)施例公開(kāi)了一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法。具體地:s101:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性。具體地,獲取醫(yī)療數(shù)據(jù)的第一樣本集得到第一樣本集的樣本屬性,作為第一樣本屬性。其中xi∈ri,yi∈{1,2,...,c}是xi的標(biāo)簽,表明xi的類(lèi)別,n是訓(xùn)練樣本的個(gè)數(shù),i是樣本的維數(shù),c是類(lèi)別總數(shù)。s102:設(shè)置所述第一樣本屬性的初始權(quán)重向量,將所述初始權(quán)重向量作為本次權(quán)重向量。具體地,設(shè)置初始權(quán)重向量w0=[1/i,1/i,...,1/i]t,其中t為迭代次數(shù),當(dāng)前t=0,即沒(méi)有開(kāi)始迭代,將初始權(quán)重向量w0作為本次權(quán)重向量wt。s103:通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量。具體地,進(jìn)行一次迭代,即將本次權(quán)重向量wt使用梯度下降的更新方式進(jìn)行一次更新,得到下次權(quán)重向量wt+1。s104:判斷確定規(guī)則是否成立,若是,則將所次權(quán)重向量作為最終權(quán)重向量,執(zhí)行s105;若否,則將下次權(quán)重向量作為本次權(quán)重向量,返回s103;其中確定規(guī)則為||wt+1-wt||≤θ,wt為本次權(quán)重向量,wt+1為下次權(quán)重向量,θ為停止準(zhǔn)則。具體地,設(shè)置一個(gè)停止準(zhǔn)則θ,并判斷||wt+1-wt||≤θ是否成立,如果成立,則將下次權(quán)重向量wt+1作為最終權(quán)重向量w,w=[w1,w2,...,wi]t∈r,進(jìn)行s105;如果不成立,則將下次權(quán)重向量wt+1作為本次權(quán)重向量wt,并返回s103,進(jìn)行新的一次迭代。s105:根據(jù)所述最終權(quán)重向量進(jìn)行特征選擇,得到特征索引子集。具體地,根據(jù)最終權(quán)重向量w通過(guò)分類(lèi)精度進(jìn)行特征選擇,得到對(duì)應(yīng)的特征索引子集實(shí)現(xiàn)對(duì)第一樣本的特征降維,從而減少計(jì)算量以及計(jì)算時(shí)間。s106:將所述第一樣本集根據(jù)所述特征索引子集進(jìn)行特征選擇,得到特征選擇后的第二樣本集。具體地,將第一樣本集根據(jù)特征索引子集進(jìn)行特征選擇,得到第二樣本集其中每一個(gè)樣本xi∈r|f|,|f|<i。s107:獲取第一待評(píng)估數(shù)據(jù),并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。具體地,獲取第一待評(píng)估數(shù)據(jù)樣本x,x∈ri,當(dāng)前樣本x未進(jìn)行降維處理,樣本維數(shù)為i。將數(shù)據(jù)樣本根據(jù)特征索引子集進(jìn)行特征選擇,得到第二待評(píng)估數(shù)據(jù)x′。s108:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。具體地,在第二樣本集對(duì)第二待評(píng)估數(shù)據(jù)x′進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,得到分類(lèi)結(jié)果??梢岳眠@個(gè)分類(lèi)結(jié)果對(duì)第一待評(píng)估數(shù)據(jù)樣本x進(jìn)行診斷。因此,本發(fā)明實(shí)施例提供的一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,首先根據(jù)訓(xùn)練樣本集得到樣本的屬性值,根據(jù)屬性值利用梯度下降的權(quán)重更新方式計(jì)算屬性對(duì)應(yīng)的權(quán)重向量,因此可以保證收斂性,可以較快地達(dá)到算法的停止準(zhǔn)則,減少計(jì)算時(shí)間,降低計(jì)算復(fù)雜度;根據(jù)計(jì)算出的權(quán)重向量進(jìn)行特征選擇得到最優(yōu)特征集,將待評(píng)估數(shù)據(jù)樣本進(jìn)行標(biāo)準(zhǔn)化后再最優(yōu)特征子集中進(jìn)行特征選擇,再將特征選擇后的待評(píng)估數(shù)據(jù)樣本進(jìn)行分類(lèi)就可以使數(shù)據(jù)樣本實(shí)現(xiàn)降維,因此本發(fā)明實(shí)施例提供的方法實(shí)現(xiàn)降維的同時(shí)又降低了計(jì)算的復(fù)雜度,減少了計(jì)算時(shí)間。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)s101做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。具體地,s101包括:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性,并對(duì)所述第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理;具體地,獲取醫(yī)療數(shù)據(jù)的第一樣本集得到第一樣本集的樣本屬性,作為第一樣本屬性。其中xi∈ri,yi∈{1,2,...,c}是xi的標(biāo)簽,表明xi的類(lèi)別,n是訓(xùn)練樣本的個(gè)數(shù),i是樣本的維數(shù),c是類(lèi)別總數(shù)。需要說(shuō)明的是,不同的特征屬性往往具有不同的量綱和量綱單位,這樣的情況會(huì)影響到數(shù)據(jù)分析的結(jié)果,為了消除不同量綱及量綱單位造成的影響,需要對(duì)第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理,以解決特征屬性數(shù)據(jù)之間的可比性。離差標(biāo)準(zhǔn)化處理的轉(zhuǎn)換函數(shù)為其中,xij為第i個(gè)樣本的第j個(gè)屬性,為取所有訓(xùn)練樣本數(shù)據(jù)中屬性j的最大值,為所有數(shù)據(jù)中屬性j的最小值。進(jìn)行標(biāo)準(zhǔn)化處理后,特征數(shù)據(jù)的各指標(biāo)都是同一個(gè)數(shù)量級(jí),更利于對(duì)這些數(shù)據(jù)進(jìn)行綜合對(duì)比評(píng)價(jià),本發(fā)明實(shí)施例所用的特征數(shù)據(jù)均為進(jìn)行離差標(biāo)準(zhǔn)化處理后的數(shù)據(jù)。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)s103做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。具體地,s103包括:通過(guò)規(guī)則對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量wt+1,j(w)為優(yōu)化目標(biāo)函數(shù),通過(guò)最大化j(w)=(zit+1)twt+1計(jì)算得到。具體地,最大化求解j(w),對(duì)下次權(quán)重向量wt+1進(jìn)行更新。其中和分別是樣本xi在異類(lèi)樣本以及同類(lèi)樣本中的近鄰樣本矩陣,k是先驗(yàn)設(shè)置的近鄰個(gè)數(shù)。αi和βi分別是異類(lèi)樣本以及同類(lèi)樣本xi關(guān)于的系數(shù)向量。求解的優(yōu)化問(wèn)題可以獲得αi;求解的優(yōu)化問(wèn)題可以獲得βi,因此可以通過(guò)優(yōu)化目標(biāo)函數(shù)j(w),利用公式對(duì)本次權(quán)重向量wt進(jìn)行更新得到迭代一次后的下次權(quán)重向量wt+1。利用梯度下降的權(quán)重更新方式能夠保證收斂性,當(dāng)收斂性可以保證時(shí),就能夠較快地達(dá)到算法的停止準(zhǔn)則,因此就可以降低計(jì)算的復(fù)雜度,減少計(jì)算的時(shí)間。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)s107做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。具體地,s107包括:獲取第一待評(píng)估數(shù)據(jù),進(jìn)行離差標(biāo)準(zhǔn)化處理,并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。具體地,獲得待評(píng)估信用數(shù)據(jù)樣本x,作為第一待評(píng)估數(shù)據(jù),其中x∈ri,對(duì)第一待評(píng)估數(shù)據(jù)利用上述實(shí)施例介紹的離差標(biāo)準(zhǔn)化的方法進(jìn)行標(biāo)準(zhǔn)化處理,即需要說(shuō)明的是,本發(fā)明所用的第一待評(píng)估數(shù)據(jù)均為進(jìn)行利差標(biāo)準(zhǔn)化處理后的數(shù)據(jù),對(duì)第一待評(píng)估數(shù)據(jù)進(jìn)行離差標(biāo)準(zhǔn)化處理,同樣避免了特征數(shù)據(jù)之間量綱與量綱單位的不同影響數(shù)據(jù)分析結(jié)果,將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,是待評(píng)估數(shù)據(jù)的各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)s108做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。具體地,s108包括:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)利用k近鄰分類(lèi)器進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。具體地,在第二樣本集的基礎(chǔ)上,利用k近鄰分類(lèi)器對(duì)第二待評(píng)估數(shù)據(jù)x′進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,得到分類(lèi)結(jié)果??梢岳眠@個(gè)分類(lèi)結(jié)果對(duì)第一待評(píng)估數(shù)據(jù)樣本x進(jìn)行診斷。下面對(duì)本發(fā)明實(shí)施例提供的一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置進(jìn)行介紹,下文描述的一種醫(yī)療數(shù)據(jù)分類(lèi)裝置與上文描述的一種醫(yī)療數(shù)據(jù)分類(lèi)方法可以相互參照。參見(jiàn)圖2,本發(fā)明實(shí)施例提供的一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,具體包括:第一樣本集獲取模塊201,用于獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性。具體地,第一樣本集獲取模塊201獲取醫(yī)療數(shù)據(jù)的第一樣本集得到第一樣本集的樣本屬性,作為第一樣本屬性。其中xi∈ri,yi∈{1,2,...,c}是xi的標(biāo)簽,表明xi的類(lèi)別,n是訓(xùn)練樣本的個(gè)數(shù),i是樣本的維數(shù),c是類(lèi)別總數(shù)。初始權(quán)重限量設(shè)置模塊202,用于設(shè)置所述第一樣本屬性的初始權(quán)重向量,將所述初始權(quán)重向量作為本次權(quán)重向量。具體地,初始權(quán)重限量設(shè)置模塊202對(duì)初始權(quán)重向量設(shè)置,即初始權(quán)重向量為w0=[1/i,1/i,...,1/i]t,其中t為迭代次數(shù),當(dāng)前t=0,即沒(méi)有開(kāi)始迭代,將初始權(quán)重向量w0作為本次權(quán)重向量wt。下次權(quán)重向量獲取模塊203,用于通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量。具體地,通過(guò)下次權(quán)重向量獲取模塊203對(duì)本次權(quán)重向量進(jìn)行一次迭代,即將本次權(quán)重向量wt使用梯度下降的更新方式進(jìn)行一次更新,得到下次權(quán)重向量wt+1。判斷模塊204,用于判斷去定規(guī)則是否成立,若是,則將所述下次權(quán)重向量作為最終權(quán)重向量,調(diào)用特征索引子集獲取模塊;若否,則將下次權(quán)重向量作為本次權(quán)重向量,調(diào)用所述下次權(quán)重向量獲取模塊;其中確定規(guī)則為||wt+1-wt||≤θ,wt為本次權(quán)重向量,wt+1為下次權(quán)重向量,θ為停止準(zhǔn)則。具體地,在判斷模塊204中設(shè)置一個(gè)停止準(zhǔn)則θ,判斷||wt+1-wt||≤θ是否成立,如果是,則將下次權(quán)重向量wt+1作為最終權(quán)重向量w,w=[w1,w2,...,wi]t∈r,調(diào)用特征索引子集獲取模塊205,;如果否,則將下次權(quán)重向量wt+1作為本次權(quán)重向量wt,再次調(diào)用下次權(quán)重向量獲取模塊203,進(jìn)行新的一次迭代。所述特征索引子集獲取模塊205,用于根據(jù)所述最終權(quán)重向量進(jìn)行特征選擇,得到特征索引子集。具體地,特征索引子集獲取模塊205根據(jù)最終權(quán)重向量w通過(guò)分類(lèi)精度進(jìn)行特征選擇,得到對(duì)應(yīng)的特征索引子集實(shí)現(xiàn)對(duì)第一樣本的特征降維,從而減少計(jì)算量以及計(jì)算時(shí)間。第二樣本集獲取模塊206,用于將所述第一樣本集根據(jù)所述特征索引子集進(jìn)行特征選擇,得到特征選擇后的第二樣本集。具體地,在第二樣本集獲取模塊206中,將第一樣本集根據(jù)特征索引子集進(jìn)行特征選擇,得到第二樣本集其中每一個(gè)樣本xi∈r|f|,|f|<i。第二待評(píng)估數(shù)據(jù)獲取模塊207,用于獲取第一待評(píng)估數(shù)據(jù),并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。具體地,第二待評(píng)估數(shù)據(jù)獲取模塊207獲取第一待評(píng)估數(shù)據(jù)樣本x,x∈ri,當(dāng)前樣本x未進(jìn)行降維處理,樣本維數(shù)為i。將數(shù)據(jù)樣本根據(jù)特征索引子集進(jìn)行特征選擇,得到第二待評(píng)估數(shù)據(jù)x′。分類(lèi)模塊208,用于在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。具體地,分類(lèi)模塊208將第二待評(píng)估數(shù)據(jù)x′在第二樣本集進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,得到分類(lèi)結(jié)果??梢岳眠@個(gè)分類(lèi)結(jié)果對(duì)第一待評(píng)估數(shù)據(jù)樣本x進(jìn)行診斷。因此,本發(fā)明實(shí)施例提供的一種基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)方法,首先通過(guò)第一樣本集獲取模塊201得到樣本的屬性值,根據(jù)屬性值在下次權(quán)重向量獲取模塊203中,利用梯度下降的權(quán)重更新方式計(jì)算屬性對(duì)應(yīng)的權(quán)重向量,因此可以保證收斂性,可以較快地達(dá)到算法的停止準(zhǔn)則,減少計(jì)算時(shí)間,降低計(jì)算復(fù)雜度;第二樣本集獲取模塊206根據(jù)計(jì)算出的權(quán)重向量進(jìn)行特征選擇得到最優(yōu)特征集,第二待評(píng)估數(shù)據(jù)獲取模塊207將待評(píng)估數(shù)據(jù)樣本進(jìn)行標(biāo)準(zhǔn)化后再最優(yōu)特征子集中進(jìn)行特征選擇,再將特征選擇后的待評(píng)估數(shù)據(jù)樣本進(jìn)行分類(lèi)就可以使數(shù)據(jù)樣本實(shí)現(xiàn)降維,因此本發(fā)明實(shí)施例提供的方法實(shí)現(xiàn)降維的同時(shí)又降低了計(jì)算的復(fù)雜度,減少了計(jì)算時(shí)間。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)第一樣本集獲取模塊201做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。上述第一樣本集獲取模塊201具體用于:獲取醫(yī)療數(shù)據(jù)的第一樣本集,得到第一樣本屬性,并對(duì)所述第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理。具體地,第一樣本集獲取模塊201獲取醫(yī)療數(shù)據(jù)的第一樣本集得到第一樣本集的樣本屬性,作為第一樣本屬性。其中xi∈ri,yi∈{1,2,...,c}是xi的標(biāo)簽,表明xi的類(lèi)別,n是訓(xùn)練樣本的個(gè)數(shù),i是樣本的維數(shù),c是類(lèi)別總數(shù)。需要說(shuō)明的是,不同的特征屬性往往具有不同的量綱和量綱單位,這樣的情況會(huì)影響到數(shù)據(jù)分析的結(jié)果,為了消除不同量綱及量綱單位造成的影響,需要對(duì)第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理,以解決特征屬性數(shù)據(jù)之間的可比性。離差標(biāo)準(zhǔn)化處理的轉(zhuǎn)換函數(shù)為其中,xij為第i個(gè)樣本的第j個(gè)屬性,為取所有訓(xùn)練樣本數(shù)據(jù)中屬性j的最大值,為所有數(shù)據(jù)中屬性j的最小值。進(jìn)行標(biāo)準(zhǔn)化處理后,特征數(shù)據(jù)的各指標(biāo)都是同一個(gè)數(shù)量級(jí),更利于對(duì)這些數(shù)據(jù)進(jìn)行綜合對(duì)比評(píng)價(jià),本發(fā)明實(shí)施例所用的特征數(shù)據(jù)均為進(jìn)行離差標(biāo)準(zhǔn)化處理后的數(shù)據(jù)。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)下次權(quán)重向量獲取模塊203做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。上述下次權(quán)重向量獲取模塊203具體用于:通過(guò)規(guī)則對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量wt+1,j(w)通過(guò)最大化優(yōu)化目標(biāo)函數(shù)j(w)=(zit+1)twt+1計(jì)算得到。具體地,在下次權(quán)重向量獲取模塊203中,首先最大化求解j(w),對(duì)下次權(quán)重向量wt+1進(jìn)行更新。其中和分別是樣本xi在異類(lèi)樣本以及同類(lèi)樣本中的近鄰樣本矩陣,k是先驗(yàn)設(shè)置的近鄰個(gè)數(shù)。αi和βi分別是異類(lèi)樣本以及同類(lèi)樣本xi關(guān)于的系數(shù)向量。求解的優(yōu)化問(wèn)題可以獲得αi;求解的優(yōu)化問(wèn)題可以獲得βi,因此可以通過(guò)j(w),利用公式對(duì)本次權(quán)重向量wt進(jìn)行更新得到迭代一次后的下次權(quán)重向量wt+1。其中,優(yōu)化目標(biāo)函數(shù)j(w)通過(guò)最大化j(w)=(zit+1)twt+1計(jì)算得到。利用梯度下降的權(quán)重更新方式能夠保證收斂性,當(dāng)收斂性可以保證時(shí),就能夠較快地達(dá)到算法的停止準(zhǔn)則,因此就可以降低計(jì)算的復(fù)雜度,減少計(jì)算的時(shí)間。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)第二待評(píng)估數(shù)據(jù)獲取模塊207做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。上述第二待評(píng)估數(shù)據(jù)獲取模塊207具體用于:獲取第一待評(píng)估數(shù)據(jù),進(jìn)行離差標(biāo)準(zhǔn)化處理,并根據(jù)所述特征索引子集進(jìn)行特征選擇得到第二待評(píng)估數(shù)據(jù)。具體地,第二待評(píng)估數(shù)據(jù)獲取模塊207獲得待評(píng)估信用數(shù)據(jù)樣本x,作為第一待評(píng)估數(shù)據(jù),其中x∈ri,對(duì)第一待評(píng)估數(shù)據(jù)利用上述實(shí)施例介紹的離差標(biāo)準(zhǔn)化的方法進(jìn)行標(biāo)準(zhǔn)化處理,即需要說(shuō)明的是,本發(fā)明所用的第一待評(píng)估數(shù)據(jù)均為進(jìn)行利差標(biāo)準(zhǔn)化處理后的數(shù)據(jù),對(duì)第一待評(píng)估數(shù)據(jù)進(jìn)行離差標(biāo)準(zhǔn)化處理,同樣避免了特征數(shù)據(jù)之間量綱與量綱單位的不同影響數(shù)據(jù)分析結(jié)果,將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,是待評(píng)估數(shù)據(jù)的各指標(biāo)處于同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。本發(fā)明實(shí)施例公開(kāi)了一種具體的基于局部學(xué)習(xí)特征權(quán)重選擇的醫(yī)療數(shù)據(jù)分類(lèi)裝置,區(qū)別于上一實(shí)施例,本發(fā)明對(duì)分類(lèi)模塊208做了具體的限定,其他步驟內(nèi)容與上一實(shí)施例大致相同,詳細(xì)內(nèi)容可以參見(jiàn)上一實(shí)施例,此處不再贅述。上述分類(lèi)模塊208具體用于:在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)利用k近鄰分類(lèi)器進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。具體地,分類(lèi)模塊208在第二樣本集的基礎(chǔ)上,利用k近鄰分類(lèi)器對(duì)第二待評(píng)估數(shù)據(jù)x′進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,得到分類(lèi)結(jié)果??梢岳眠@個(gè)分類(lèi)結(jié)果對(duì)第一待評(píng)估數(shù)據(jù)樣本x進(jìn)行診斷。本發(fā)明實(shí)施例公開(kāi)了一種基于局部學(xué)習(xí)特征權(quán)重的醫(yī)療數(shù)據(jù)分類(lèi)方法,具體包括:本發(fā)明實(shí)施例在胚數(shù)據(jù)集(cns)數(shù)據(jù)集中進(jìn)行了測(cè)試,該數(shù)據(jù)集中共包含34名患者樣本,每個(gè)樣本有7129個(gè)基因。這34個(gè)樣本包括25個(gè)經(jīng)典型髓母細(xì)胞瘤(c)以及9個(gè)促結(jié)締組織增生性成神經(jīng)管細(xì)胞瘤(d),因此共有2類(lèi)。cns數(shù)據(jù)集分為兩個(gè)子集:23個(gè)訓(xùn)練樣本(6個(gè)c,17個(gè)d),用來(lái)選擇基因和調(diào)整分類(lèi)器的權(quán)重,11個(gè)測(cè)試樣本(3個(gè)c,8個(gè)d),用來(lái)評(píng)價(jià)系統(tǒng)所得結(jié)果的性能。每個(gè)樣本均有都有7129個(gè)特征。我們將c視為第一類(lèi),d視為第二類(lèi)。具體實(shí)施步驟分為兩個(gè)模塊進(jìn)行,具體如下:模型訓(xùn)練模塊:s301,輸入醫(yī)療數(shù)據(jù)樣本集作為第一樣本集,其中xi∈ri,yi∈{1,2,...,c}是xi的標(biāo)簽,表明xi的類(lèi)別,n是訓(xùn)練樣本的個(gè)數(shù),i是樣本的維數(shù),c是類(lèi)別總數(shù)。這里n=23,i=7129,c=2。s302,對(duì)所述第一樣本集進(jìn)行離差標(biāo)準(zhǔn)化處理,轉(zhuǎn)換函數(shù)為其中,xij為第i個(gè)樣本的第j個(gè)屬性,為取所有訓(xùn)練樣本數(shù)據(jù)中屬性j的最大值,為所有數(shù)據(jù)中屬性j的最小值。s303,設(shè)置所述第一樣本屬性的初始權(quán)重向量w0=[1/i,1/i,...,1/i]t,將所述初始權(quán)重向量作為本次權(quán)重向量。其中t為迭代次數(shù),當(dāng)前t=0,即沒(méi)有開(kāi)始迭代,將初始權(quán)重向量w0作為本次權(quán)重向量wt,迭代次數(shù)一共為30次,即一共進(jìn)行30次迭代。s304,通過(guò)梯度下降的更新方式對(duì)本次權(quán)重向量進(jìn)行更新,得到迭代一次后的下次權(quán)重向量。具體地,最大化求解優(yōu)化目標(biāo)函數(shù)j(w),對(duì)下次權(quán)重向量wt+1進(jìn)行更新。其中和分別是樣本xi在異類(lèi)樣本以及同類(lèi)樣本中的近鄰樣本矩陣,k是先驗(yàn)設(shè)置的近鄰個(gè)數(shù)。αi和βi分別是異類(lèi)樣本以及同類(lèi)樣本xi關(guān)于的系數(shù)向量。求解的優(yōu)化問(wèn)題可以獲得αi;求解的優(yōu)化問(wèn)題可以獲得βi,因此可以通過(guò)j(w),利用公式對(duì)本次權(quán)重向量wt進(jìn)行更新得到迭代一次后的下次權(quán)重向量wt+1。s305,判斷確定規(guī)則是否成立,若是,則將所次權(quán)重向量作為最終權(quán)重向量,執(zhí)行s306;若否,則將下次權(quán)重向量作為本次權(quán)重向量,返回s304;其中確定規(guī)則為||wt+1-wt||≤θ,wt為本次權(quán)重向量,wt+1為下次權(quán)重向量,θ為停止準(zhǔn)則。具體地,設(shè)置一個(gè)停止準(zhǔn)則θ=0.001,并判斷||wt+1-wt||≤θ是否成立,如果成立,則將下次權(quán)重向量wt+1作為最終權(quán)重向量w,w=[w1,w2,...,wi]t∈r7129,進(jìn)行s306;如果不成立,則將下次權(quán)重向量wt+1作為本次權(quán)重向量wt,并返回s304,進(jìn)行新的一次迭代。s306,根據(jù)所述最終權(quán)重向量進(jìn)行特征選擇,得到特征索引子集。具體地,根據(jù)最終權(quán)重向量w通過(guò)分類(lèi)精度進(jìn)行特征選擇,得到對(duì)應(yīng)的特征索引子集實(shí)現(xiàn)對(duì)第一樣本的特征降維,從而減少計(jì)算量以及計(jì)算時(shí)間。s307,將所述第一樣本集根據(jù)所述特征索引子集進(jìn)行特征選擇,得到特征選擇后的第二樣本集。具體地,將第一樣本集根據(jù)特征索引子集進(jìn)行特征選擇,得到第二樣本集其中每一個(gè)樣本xi∈r|f|,|f|<7129。評(píng)估模塊:s308,獲取第一待評(píng)估數(shù)據(jù)。具體地,輸入待評(píng)估信用數(shù)據(jù)樣本x作為第一待評(píng)估數(shù)據(jù)樣本,x∈ri。s309,對(duì)第一待評(píng)估數(shù)據(jù)進(jìn)行離差標(biāo)準(zhǔn)化處理。具體地,獲得待評(píng)估信用數(shù)據(jù)樣本x,作為第一待評(píng)估數(shù)據(jù),其中x∈ri,對(duì)第一待評(píng)估數(shù)據(jù)利用上述實(shí)施例介紹的離差標(biāo)準(zhǔn)化的方法進(jìn)行標(biāo)準(zhǔn)化處理,即s310,根據(jù)特征索引子集對(duì)第一待評(píng)估數(shù)據(jù)進(jìn)行特征選擇,得到第二待評(píng)估數(shù)據(jù)x′。s311,在所述第二樣本集上對(duì)第二待評(píng)估數(shù)據(jù)利用k近鄰分類(lèi)器進(jìn)行分類(lèi),得到分類(lèi)結(jié)果。具體地,在第二樣本集的基礎(chǔ)上,利用k近鄰分類(lèi)器對(duì)第二待評(píng)估數(shù)據(jù)x′進(jìn)行分類(lèi),得到分類(lèi)結(jié)果,得到分類(lèi)結(jié)果??梢岳眠@個(gè)分類(lèi)結(jié)果對(duì)第一待評(píng)估數(shù)據(jù)樣本x進(jìn)行診斷。通過(guò)本發(fā)明提出一種基于局部學(xué)習(xí)特征權(quán)重的醫(yī)療數(shù)據(jù)分類(lèi)方法,對(duì)lh-relief的特征選擇方法進(jìn)行了改進(jìn),提取23個(gè)7129維的訓(xùn)練樣本中的特征的組合f,1≤length(f)≤7129,對(duì)11個(gè)7129維的測(cè)試樣本進(jìn)行分類(lèi)。本實(shí)驗(yàn)提出的方法與lh-relief算法在相同的數(shù)據(jù)集上做比較,隨機(jī)取78個(gè)訓(xùn)練樣本10次,平均收斂結(jié)果如圖3所示,平均性能結(jié)果如圖4所示??梢钥吹奖景l(fā)明比msvm-rfe算法收斂得更快,在相同選擇了相同基因個(gè)數(shù)的情況下,具有更好的分類(lèi)性能。表1給出了兩種方法各自獲得的最好平均分類(lèi)性能時(shí)的對(duì)比。本發(fā)明比lh-relief方法提高了大約2個(gè)百分點(diǎn)。表1lh-relief和本發(fā)明最好分類(lèi)性能的對(duì)比方法識(shí)別率(%)本發(fā)明70.91(10)lh-relief69.09(10)本說(shuō)明書(shū)中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見(jiàn)即可。對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專(zhuān)業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。當(dāng)前第1頁(yè)12