1.一種基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取方法,其特征在于,包括以下步驟:
步驟S1:給定一個(gè)中等規(guī)模以上的乳腺超聲病灶區(qū)域圖像集,所述中等規(guī)模表示該圖像集至少含有200幅以上的乳腺超聲診斷圖像;
步驟S2:手動(dòng)提取步驟S1中圖像集里每一張乳腺超聲診斷圖像的病灶區(qū)域圖像ROI;
步驟S3:從每一張乳腺超聲病灶區(qū)域圖像ROI中提取手工淺層特征作為一個(gè)訓(xùn)練樣本,構(gòu)成訓(xùn)練樣本集set_unlabeled={x(1),x(2),…,x(n)},第i個(gè)樣本x(i)∈[0,1]d,i=1,2,…,n;其中d表示樣本的特征維度,n表示訓(xùn)練集樣本個(gè)數(shù);
步驟S4:基于訓(xùn)練樣本集,訓(xùn)練第一個(gè)降噪自編碼器DAE1;
步驟S5:訓(xùn)練完第一個(gè)降噪自編碼器后,重新輸入訓(xùn)練樣本集,根據(jù)步驟S4訓(xùn)練好的編碼器提取所有樣本的隱層學(xué)習(xí)得到的特征表示,構(gòu)成新的樣本{y(1),y(2),…,y(n)},將其作為第二個(gè)降噪自編碼器的輸入,訓(xùn)練第二個(gè)降噪自編碼器DAE2;
步驟S6:將完成訓(xùn)練的兩個(gè)降噪自編碼器DAE1和DAE2堆疊得到三層的SDAE結(jié)構(gòu),對(duì)應(yīng)第一層為輸入層,維度為d;第二層為DAE1中的隱層,維度為dh1;第三層為DAE2中對(duì)應(yīng)的隱層,維度為dh2;通過該SDAE結(jié)構(gòu),給定乳腺鉬靶圖像的手工淺層特征,前向反饋后得到基于堆疊降噪自編碼器的高層抽象的語義特征表示
2.根據(jù)權(quán)利要求1所述的基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取方法,其特征在于:
所述步驟S3為:分別提取每個(gè)ROI圖像的GLCM、小波、小波包、MPEG-7四種手工淺層特征,級(jí)聯(lián)為一個(gè)d維的特征向量作為一個(gè)樣本。
3.根據(jù)權(quán)利要求1所述的基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取方法,其特征在于:
所述步驟S4中,第一個(gè)降噪自編碼器由三層網(wǎng)絡(luò)構(gòu)成,對(duì)應(yīng)輸入層x、隱層y、輸出層z的神經(jīng)元個(gè)數(shù)分別為d、dh1、d,其中輸入層的輸入為訓(xùn)練樣本集中的某個(gè)樣本x(i)∈[0,1]d,i=1,2,…,n;輸入層人為地引入了噪聲;參數(shù)θ1={W1,b1},θ2={W2,b2},b1、b2為分別為隱層和輸出層的偏置向量,大小分別為dh1和d維,W1、W2分別為輸入層到隱層的權(quán)值連接矩陣和隱層到輸出層的權(quán)值連接矩陣,大小分別為d×dh1、dh1×d;激活函數(shù)均采用sigmoid函數(shù);
步驟S4包括以下步驟:
步驟S41:對(duì)訓(xùn)練樣本集進(jìn)行分割,具體步驟為:將超聲圖像的訓(xùn)練樣本集隨機(jī)分割為num個(gè)batch,每個(gè)batchi∈[0,1]batch_size×d,i=1,2,…,num;
步驟S42:網(wǎng)絡(luò)參數(shù)初始化;具體設(shè)置為:
learningrate=1;
b1=0,b2=0;
其中,leanningrate表示學(xué)習(xí)率,rand(m,n)函數(shù)為隨機(jī)生成[0,1]的m×n階矩陣;
步驟43:設(shè)置最大循環(huán)次數(shù)NN;
步驟44:外重循環(huán)t=1to NN;
內(nèi)重循環(huán)s=1to num;
步驟441:腐蝕數(shù)據(jù):通過二進(jìn)制掩蔽噪聲方式,以一定概率將輸入特征向量x中某些值隨機(jī)地重設(shè)為0;具體為:
batchs=batchs×(rand(batch_size,d)>threashold),一個(gè)batchs構(gòu)成batch_size×d階矩陣,threashold為設(shè)定的閾值,具體設(shè)定為0.2;如果隨機(jī)生成的矩陣A=rand(batch_size,d)中的元素Aij小于threashold,則矩陣batchs中對(duì)應(yīng)位置的元素重設(shè)為0;定義batchs中第i個(gè)樣本為x(i),腐蝕后為
步驟442:前向反饋:
步驟443:反向傳輸:
步驟444:更新參數(shù)
其中,分別表示第i個(gè)樣本對(duì)應(yīng)輸出層和隱層第j個(gè)節(jié)點(diǎn)的殘差。
4.一種基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取系統(tǒng),其特征在于,包括以下模塊:
圖像集給定模塊:用于給定一個(gè)中等規(guī)模以上的乳腺超聲病灶區(qū)域圖像集,所述中等規(guī)模表示該圖像集至少含有200幅以上的乳腺超聲診斷圖像;
病灶區(qū)域提取模塊:用于手動(dòng)提取步驟S1中圖像集里每一張乳腺超聲診斷圖像的病灶區(qū)域圖像ROI;
樣本訓(xùn)練模塊:用于從每一張乳腺超聲病灶區(qū)域圖像ROI中提取手工淺層特征作為一個(gè)訓(xùn)練樣本,構(gòu)成訓(xùn)練樣本集set_unlabeled={x(1),x(2),…,x(n)},第i個(gè)樣本x(i)∈[0,1]d,i=1,2,…,n;其中d表示樣本的特征維度,n表示訓(xùn)練集樣本個(gè)數(shù);
第一編碼器訓(xùn)練模塊:用于基于訓(xùn)練樣本集,訓(xùn)練第一個(gè)降噪自編碼器DAE1;
第二編碼器訓(xùn)練模塊:用于訓(xùn)練完第一個(gè)降噪自編碼器后,重新輸入訓(xùn)練樣本集,根據(jù)步驟S4訓(xùn)練好的編碼器提取所有樣本的隱層學(xué)習(xí)得到的特征表示,構(gòu)成新的樣本{y(1),y(2),…,y(n)},將其作為第二個(gè)降噪自編碼器的輸入,訓(xùn)練第二個(gè)降噪自編碼器DAE2;
語義特征生成模塊:用于將完成訓(xùn)練的兩個(gè)降噪自編碼器DAE1和DAE2堆疊得到三層的SDAE結(jié)構(gòu),對(duì)應(yīng)第一層為輸入層,維度為d;第二層為DAE1中的隱層,維度為dh1;第三層為DAE2中對(duì)應(yīng)的隱層,維度為dh2;通過該SDAE結(jié)構(gòu),給定乳腺鉬靶圖像的手工淺層特征,前向反饋后得到基于堆疊降噪自編碼器的高層抽象的語義特征表示
5.根據(jù)權(quán)利要求4所述的基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取系統(tǒng),其特征在于:
所述樣本訓(xùn)練模塊:還用于分別提取每個(gè)ROI圖像的GLCM、小波、小波包、MPEG-7四種手工淺層特征,級(jí)聯(lián)為一個(gè)d維的特征向量作為一個(gè)樣本。
6.根據(jù)權(quán)利要求4所述的基于堆疊降噪自編碼器的乳腺超聲圖像特征自學(xué)習(xí)提取系統(tǒng),其特征在于:
所述第一編碼器訓(xùn)練模塊中,第一個(gè)降噪自編碼器由三層網(wǎng)絡(luò)構(gòu)成,對(duì)應(yīng)輸入層x、隱層y、輸出層z的神經(jīng)元個(gè)數(shù)分別為d、dh1、d,其中輸入層的輸入為訓(xùn)練樣本集中的某個(gè)樣本x(i)∈[0,1]d,i=1,2,…,n;輸入層人為地引入了噪聲;參數(shù)θ1={W1,b1},θ2={W2,b2},b1、b2為分別為隱層和輸出層的偏置向量,大小分別為dh1和d維,W1、W2分別為輸入層到隱層的權(quán)值連接矩陣和隱層到輸出層的權(quán)值連接矩陣,大小分別為d×dh1、dh1×d;激活函數(shù)均采用sigmoid函數(shù);
第一編碼器訓(xùn)練模塊包括以下單元:
樣本分割單元:用于對(duì)訓(xùn)練樣本集進(jìn)行分割,具體步驟為:將超聲圖像的訓(xùn)練樣本集隨機(jī)分割為num個(gè)batch,每個(gè)batchi∈[0,1]batch_size×d,i=1,2,…,num;
網(wǎng)絡(luò)參數(shù)初始化單元:用于網(wǎng)絡(luò)參數(shù)初始化;具體設(shè)置為:
learningrate=1;
b1=0,b2=0;
其中,leanningrate表示學(xué)習(xí)率,rand(m,n)函數(shù)為隨機(jī)生成[0,1]的m×n階矩陣;
循環(huán)次數(shù)設(shè)置單元:用于設(shè)置最大循環(huán)次數(shù)NN;
內(nèi)外重循環(huán)設(shè)置單元:用于設(shè)置外重循環(huán)t=1to NN;
用于設(shè)置內(nèi)重循環(huán)s=1to num;
腐蝕數(shù)據(jù)單元:用于腐蝕數(shù)據(jù):通過二進(jìn)制掩蔽噪聲方式,以一定概率將輸入特征向量x中某些值隨機(jī)地重設(shè)為0;具體為:
batchs=batchs×(rand(batch_size,d)>threashold),一個(gè)batchs構(gòu)成batch_size×d階矩陣,threashold為設(shè)定的閾值,具體設(shè)定為0.2;如果隨機(jī)生成的矩陣A=rand(batch_size,d)中的元素Aij小于threashold,則矩陣batchs中對(duì)應(yīng)位置的元素重設(shè)為0;定義batchs中第i個(gè)樣本為x(i),腐蝕后為
前向反饋單元:用于前向反饋:
z(i)=sigmoid(W2Ty(i)+b2),i=1,2,…,batch_size;
反向傳輸單元:用于反向傳輸:
更新參數(shù)單元:用于更新參數(shù)
其中,分別表示第i個(gè)樣本對(duì)應(yīng)輸出層和隱層第j個(gè)節(jié)點(diǎn)的殘差。