欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法

文檔序號(hào):40603141發(fā)布日期:2025-01-07 20:43閱讀:來源:國知局

技術(shù)特征:

1.一種基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,步驟s1中,基于多視圖癌癥亞型數(shù)據(jù)的原始數(shù)據(jù)集,對(duì)于每個(gè)特征,計(jì)算缺失值的比例,如果某個(gè)特征的缺失值比例超過20%,則刪除該特征;使用python函數(shù)fillna填充原始數(shù)據(jù)集中dna甲基化數(shù)據(jù)的缺失值,使用knnimpute函數(shù)處理原始數(shù)據(jù)集中mirna-seq數(shù)據(jù),最后刪除缺失生存數(shù)據(jù)的樣本;使用基因標(biāo)準(zhǔn)差sd統(tǒng)計(jì)量選擇原始數(shù)據(jù)集中信息量較大的基因,對(duì)于原始數(shù)據(jù)集中每種組學(xué)數(shù)據(jù),選擇最高sd的基因數(shù)目;對(duì)原始數(shù)據(jù)集中每種組學(xué)數(shù)據(jù)進(jìn)行最大最小歸一化處理,使數(shù)據(jù)值范圍在[0,1]之間。

3.根據(jù)權(quán)利要求1或2所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,步驟s1中,使用pearson相關(guān)系數(shù),對(duì)多組學(xué)數(shù)據(jù)的特征進(jìn)行重新排列的具體實(shí)現(xiàn)方式如下:

4.根據(jù)權(quán)利要求3所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,pearson相關(guān)系數(shù)定義為:

5.根據(jù)權(quán)利要求1所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,步驟s2中,基于處理后的數(shù)據(jù)集即重新排列后的多組學(xué)數(shù)據(jù)通過卷積自編碼器訓(xùn)練教師模型,生成多視圖數(shù)據(jù)的特征表示;將每種組學(xué)數(shù)據(jù)的隱藏特征進(jìn)行連接,形成一個(gè)新的多組學(xué)特征矩陣;通過最小化重建損失函數(shù)和蒸餾損失函數(shù),利用知識(shí)蒸餾學(xué)習(xí)教師模型的特征表示,并通過聚類損失優(yōu)化學(xué)生模型的特征表示。

6.根據(jù)權(quán)利要求1或5所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,所述卷積自編碼器,具體實(shí)現(xiàn)如下:

7.根據(jù)權(quán)利要求1或5所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,所述知識(shí)蒸餾算法,具體實(shí)現(xiàn)如下:

8.根據(jù)權(quán)利要求1所述的基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,其特征在于,步驟s3中,從學(xué)生模型中提取特征,并使用kl散度來度量樣本之間的相似性,使用student?t分布來計(jì)算樣本與聚類中心之間的相似性;總損失函數(shù)包括重建損失、知識(shí)蒸餾損失和聚類損失的加權(quán)和,用于優(yōu)化特征表示以便于聚類任務(wù);通過最小化總損失函數(shù),利用知識(shí)蒸餾損失學(xué)習(xí)教師模型的特征表示,并通過聚類損失優(yōu)化學(xué)生模型的特征表示,實(shí)現(xiàn)高效且準(zhǔn)確的多視圖癌癥亞型數(shù)據(jù)聚類;利用kl散度作為聚類損失,使學(xué)生模型的特征表示更適合聚類;具體如下:

9.一種基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類系統(tǒng),其特征在于,包括存儲(chǔ)器、處理器以及存儲(chǔ)于存儲(chǔ)器上并能夠被處理器運(yùn)行的計(jì)算機(jī)程序指令,當(dāng)處理器運(yùn)行該計(jì)算機(jī)程序指令時(shí),能夠?qū)崿F(xiàn)如權(quán)利要求1-8任一所述的方法步驟。

10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有能夠被處理器運(yùn)行的計(jì)算機(jī)程序指令,當(dāng)處理器運(yùn)行該計(jì)算機(jī)程序指令時(shí),能夠?qū)崿F(xiàn)如權(quán)利要求1-8任一所述的方法步驟。


技術(shù)總結(jié)
本發(fā)明涉及一種基于卷積自編碼器和知識(shí)蒸餾的多視圖癌癥亞型數(shù)據(jù)聚類方法,屬于機(jī)器學(xué)習(xí)領(lǐng)域。該方法包括:使用皮爾遜相關(guān)系數(shù)對(duì)多組學(xué)數(shù)據(jù)的特征進(jìn)行重新排列,減少數(shù)據(jù)的冗余性并提高特征的代表性。將重新排列后的多組學(xué)數(shù)據(jù)輸入卷積自編碼器模型,訓(xùn)練教師模型以捕捉數(shù)據(jù)的高維結(jié)構(gòu)和特征。使用知識(shí)蒸餾算法將教師模型中的知識(shí)傳遞給一個(gè)較輕量級(jí)的學(xué)生模型,通過優(yōu)化損失函數(shù)(包括重建誤差和蒸餾損失)來訓(xùn)練學(xué)生模型。基于訓(xùn)練好的學(xué)生模型,使用KL散度對(duì)多視圖癌癥亞型數(shù)據(jù)進(jìn)行聚類分析,得到最終的聚類結(jié)果。

技術(shù)研發(fā)人員:許力,林賢龍,汪曉丁,李家印
受保護(hù)的技術(shù)使用者:福建師范大學(xué)
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安溪县| 岫岩| 阿鲁科尔沁旗| 惠来县| 建始县| 壶关县| 东方市| 太仓市| 达拉特旗| 茌平县| 当涂县| 桂平市| 望奎县| 皮山县| 祁连县| 福安市| 三亚市| 吐鲁番市| 佛冈县| 阜南县| 上杭县| 宁陵县| 修水县| 大化| 高碑店市| 哈尔滨市| 锡林郭勒盟| 湛江市| 叶城县| 枣庄市| 东山县| 东乌珠穆沁旗| 同仁县| 新和县| 河北区| 利川市| 若尔盖县| 威信县| 交口县| 乌拉特后旗| 图们市|