本發(fā)明涉及細(xì)胞間通訊,具體涉及一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法及裝置。
背景技術(shù):
1、細(xì)胞細(xì)胞通訊對(duì)多細(xì)胞生物的發(fā)育和穩(wěn)態(tài)至關(guān)重要,并在許多生物過(guò)程中起著關(guān)鍵作用。例如,腫瘤相關(guān)巨噬細(xì)胞和癌變相關(guān)成纖維細(xì)胞在腫瘤微環(huán)境的疾病進(jìn)展中發(fā)揮重要作用。因此,對(duì)疾病發(fā)展和進(jìn)展過(guò)程中的細(xì)胞細(xì)胞通訊進(jìn)行全面分析可以提高我們對(duì)疾病機(jī)制的理解,并有助于確定新的治療策略。
2、細(xì)胞細(xì)胞通訊通常是由不同蛋白質(zhì)之間的相互作用促進(jìn)的,如受體-受體相互作用、細(xì)胞外基質(zhì)-受體相互作用和配體-受體相互作用。具體來(lái)說(shuō),兩個(gè)細(xì)胞之間的通信可以通過(guò)檢查所有參與調(diào)節(jié)這一過(guò)程的配體-受體相互作用來(lái)量化。
3、目前,通過(guò)傳統(tǒng)的實(shí)驗(yàn)方法進(jìn)行細(xì)胞細(xì)胞通訊研究耗時(shí)耗力并且成本高昂,單細(xì)胞rna測(cè)序數(shù)據(jù)的進(jìn)展導(dǎo)致了各種計(jì)算方法的發(fā)展。通過(guò)計(jì)算方法分析和推斷細(xì)胞細(xì)胞通訊的過(guò)程主要包括兩個(gè)主要步驟:篩選配體-受體相互作用和測(cè)量配體-受體相互作用介導(dǎo)的細(xì)胞細(xì)胞通訊的強(qiáng)度。通過(guò)建立一個(gè)全面可靠的配體-受體相互作用數(shù)據(jù)庫(kù),在此基礎(chǔ)上,可以利用配體-受體相互作用資源來(lái)測(cè)量細(xì)胞細(xì)胞通訊的強(qiáng)度。大量的研究工作致力于構(gòu)建高質(zhì)量的lri數(shù)據(jù)庫(kù),cellphonedb采用了一種排列方法來(lái)計(jì)算基于配體和受體表達(dá)的配體-受體相互作用評(píng)分,并使用由此得到的評(píng)分來(lái)評(píng)估配體-受體相互作用的特異性。italk首先識(shí)別高表達(dá)或差異表達(dá)的基因,然后使用其配體-受體數(shù)據(jù)庫(kù)來(lái)匹配和關(guān)聯(lián)這些基因,從而檢測(cè)到顯著的配體-受體相互作用。此外,celldialog以蛋白質(zhì)特征為輸入,采用基于樹(shù)增強(qiáng)和混合效應(yīng)模型的特征選擇方法對(duì)這些特征進(jìn)行降維,最后使用ktboost算法預(yù)測(cè)配體-受體相互作用。隨著這些配體-受體相互作用數(shù)據(jù)庫(kù)的開(kāi)發(fā),已經(jīng)使用這些數(shù)據(jù)庫(kù)開(kāi)發(fā)了許多細(xì)胞細(xì)胞通訊推理方法,例如,cellphonedb通過(guò)檢測(cè)在細(xì)胞類(lèi)型之間高度富集的配體-受體相互作用來(lái)識(shí)別細(xì)胞細(xì)胞通訊,natmi構(gòu)建了復(fù)雜的網(wǎng)絡(luò)模型來(lái)評(píng)估配體-受體相互作用介導(dǎo)的細(xì)胞細(xì)胞通訊。圖卷積網(wǎng)絡(luò)通過(guò)在圖結(jié)構(gòu)中進(jìn)行卷積操作,能夠捕捉節(jié)點(diǎn)及其鄰居之間的關(guān)系和特征,以更高的準(zhǔn)確率識(shí)別配體-受體相互作用,從而構(gòu)建更全面可靠的配體-受體相互作用數(shù)據(jù)庫(kù),進(jìn)一步可以基于此配體-受體相互作用資源進(jìn)行細(xì)胞細(xì)胞通訊分析。
4、因此,如何設(shè)計(jì)一種基于圖卷積網(wǎng)絡(luò)分析配體-受體相互作用介導(dǎo)的細(xì)胞細(xì)胞通訊的方法,在降低成本的同時(shí),實(shí)現(xiàn)對(duì)細(xì)胞細(xì)胞通訊分析可視化,成為亟需解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、為此,本發(fā)明提供一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法及裝置,能夠在降低成本的同時(shí),獲得相對(duì)準(zhǔn)確的細(xì)胞細(xì)胞通訊分析結(jié)果,并提供多種可視化。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法,包括:
3、從設(shè)定數(shù)據(jù)庫(kù)中下載蛋白質(zhì)的配體和受體序列信息;通過(guò)ifeature對(duì)蛋白質(zhì)的所述配體和受體序列信息進(jìn)行處理,獲得配體和受體的數(shù)字特征;根據(jù)所述配體和受體的數(shù)字特征,構(gòu)建配體和受體初始特征矩陣;收集蛋白質(zhì)的初始配體-受體相互作用對(duì),并構(gòu)建配體-受體相互作用鄰接矩陣;
4、基于圖卷積網(wǎng)絡(luò),構(gòu)建配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)所述配體和受體初始特征矩陣及所述配體-受體相互作用鄰接矩陣,對(duì)所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)處理,獲得存在相互作用的預(yù)測(cè)配體-受體相互作用對(duì);
5、通過(guò)單細(xì)胞rna測(cè)序數(shù)據(jù)對(duì)收集的所述初始配體-受體相互作用對(duì)及所述預(yù)測(cè)配體-受體相互作用對(duì)進(jìn)行識(shí)別過(guò)濾,獲得滿(mǎn)足設(shè)定要求的配體-受體相互作用對(duì);
6、對(duì)滿(mǎn)足設(shè)定要求的所述配體-受體相互作用對(duì)進(jìn)行細(xì)胞細(xì)胞通訊評(píng)分計(jì)算,獲得細(xì)胞類(lèi)型之間的若干配體受體的細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分、表達(dá)產(chǎn)物評(píng)分和細(xì)胞表達(dá)評(píng)分;將細(xì)胞類(lèi)型間通信的若干相應(yīng)評(píng)分相加,獲得細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果;根據(jù)細(xì)胞細(xì)胞通訊的所述表達(dá)閾值結(jié)果、所述表達(dá)產(chǎn)物結(jié)果以及所述細(xì)胞表達(dá)結(jié)果,通過(guò)三點(diǎn)估計(jì)法測(cè)量獲得細(xì)胞細(xì)胞通訊強(qiáng)度;
7、根據(jù)所述細(xì)胞細(xì)胞通訊強(qiáng)度,構(gòu)建細(xì)胞細(xì)胞通訊熱圖;通過(guò)所述細(xì)胞細(xì)胞通訊熱圖分析兩兩細(xì)胞類(lèi)型通訊中最活躍的配體-受體相互作用對(duì),完成細(xì)胞細(xì)胞通訊可視化分析。
8、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法的優(yōu)選方案,所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型包含兩層圖卷積層和三層全連接層,且所述卷積層中設(shè)置有跳躍連接;
9、帶有跳躍連接的卷積層輸出表達(dá)式為:
10、
11、式中,x為配體和受體初始特征矩陣;a為配體-受體相互作用鄰接矩陣;d為相互作用鄰接矩陣a的度矩陣;θ,b,b',w均為可學(xué)習(xí)的參數(shù);relu為深度學(xué)習(xí)中常用的激活函數(shù)。
12、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法的優(yōu)選方案,所述配體受體的細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分、表達(dá)產(chǎn)物評(píng)分和細(xì)胞表達(dá)評(píng)分的計(jì)算公式分別為:
13、
14、
15、式中,為細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分;為細(xì)胞細(xì)胞通訊的表達(dá)產(chǎn)物評(píng)分;為細(xì)胞細(xì)胞通訊的細(xì)胞表達(dá)評(píng)分;a,b均為細(xì)胞類(lèi)型;a為配體;b為受體;ma,a為a在細(xì)胞類(lèi)型a中的平均表達(dá)量;mb,b為b在細(xì)胞類(lèi)型b中的平均表達(dá)量;ma和mb分別為所有細(xì)胞中配體a和受體b的平均表達(dá)量;σa和σb分別為所有細(xì)胞中配體a和受體b的表達(dá)量的標(biāo)準(zhǔn)差,當(dāng)兩個(gè)不等式都滿(mǎn)足時(shí)結(jié)果為1,否則為0;na,a為配體a在細(xì)胞類(lèi)型a中表達(dá)值大于0的細(xì)胞個(gè)數(shù);nb,b為受體b在細(xì)胞類(lèi)型b中表達(dá)值大于0的細(xì)胞個(gè)數(shù);na和nb分別為細(xì)胞類(lèi)型a和細(xì)胞類(lèi)型b中細(xì)胞的個(gè)數(shù)。
16、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法的優(yōu)選方案,所述細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果的表達(dá)式分別為:
17、
18、式中,m為參與介導(dǎo)細(xì)胞細(xì)胞通訊的配體-受體相互作用對(duì)數(shù)量。
19、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法的優(yōu)選方案,所述細(xì)胞細(xì)胞通訊強(qiáng)度的表達(dá)式為:
20、
21、式中,rmax、rmin和rmed分別為將細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果歸一化后的標(biāo)準(zhǔn)細(xì)胞細(xì)胞通訊結(jié)果的最大值、最小值和中值。
22、本發(fā)明還提供一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析裝置,基于以上一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析方法,包括:
23、配體和受體初始特征矩陣及配體-受體相互作用鄰接矩陣構(gòu)建模塊,用于從設(shè)定數(shù)據(jù)庫(kù)中下載蛋白質(zhì)的配體和受體序列信息;通過(guò)ifeature對(duì)蛋白質(zhì)的所述配體和受體序列信息進(jìn)行處理,獲得配體和受體的數(shù)字特征;根據(jù)所述配體和受體的數(shù)字特征,構(gòu)建配體和受體初始特征矩陣;收集蛋白質(zhì)的初始配體-受體相互作用對(duì),并構(gòu)建配體-受體相互作用鄰接矩陣;
24、配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型構(gòu)建及處理模塊,用于基于圖卷積網(wǎng)絡(luò),構(gòu)建配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)所述配體和受體初始特征矩陣及所述配體-受體相互作用鄰接矩陣,對(duì)所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)處理,獲得存在相互作用的預(yù)測(cè)配體-受體相互作用對(duì);
25、配體-受體相互作用對(duì)識(shí)別過(guò)濾模塊,用于通過(guò)單細(xì)胞rna測(cè)序數(shù)據(jù)對(duì)收集的所述初始配體-受體相互作用對(duì)及所述預(yù)測(cè)配體-受體相互作用對(duì)進(jìn)行識(shí)別過(guò)濾,獲得滿(mǎn)足設(shè)定要求的配體-受體相互作用對(duì);
26、細(xì)胞細(xì)胞通訊強(qiáng)度獲取模塊,用于對(duì)滿(mǎn)足設(shè)定要求的所述配體-受體相互作用對(duì)進(jìn)行細(xì)胞細(xì)胞通訊評(píng)分計(jì)算,獲得細(xì)胞類(lèi)型之間的若干配體受體的細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分、表達(dá)產(chǎn)物評(píng)分和細(xì)胞表達(dá)評(píng)分;將細(xì)胞類(lèi)型間通信的若干相應(yīng)評(píng)分相加,獲得細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果;根據(jù)細(xì)胞細(xì)胞通訊的所述表達(dá)閾值結(jié)果、所述表達(dá)產(chǎn)物結(jié)果以及所述細(xì)胞表達(dá)結(jié)果,通過(guò)三點(diǎn)估計(jì)法測(cè)量獲得細(xì)胞細(xì)胞通訊強(qiáng)度;
27、細(xì)胞細(xì)胞通訊熱圖構(gòu)建及分析模塊,用于根據(jù)所述細(xì)胞細(xì)胞通訊強(qiáng)度,構(gòu)建細(xì)胞細(xì)胞通訊熱圖;通過(guò)所述細(xì)胞細(xì)胞通訊熱圖分析兩兩細(xì)胞類(lèi)型通訊中最活躍的配體-受體相互作用對(duì),完成細(xì)胞細(xì)胞通訊可視化分析。
28、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析裝置的優(yōu)選方案,所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型構(gòu)建及處理模塊中,所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型包含兩層圖卷積層和三層全連接層,且所述卷積層中設(shè)置有跳躍連接;
29、帶有跳躍連接的卷積層輸出表達(dá)式為:
30、
31、式中,x為配體和受體初始特征矩陣;a為配體-受體相互作用鄰接矩陣;d為相互作用鄰接矩陣a的度矩陣;θ,b,b',w均為可學(xué)習(xí)的參數(shù);relu為深度學(xué)習(xí)中常用的激活函數(shù)。
32、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析裝置的優(yōu)選方案,所述細(xì)胞細(xì)胞通訊強(qiáng)度獲取模塊中,所述配體受體的細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分、表達(dá)產(chǎn)物評(píng)分和細(xì)胞表達(dá)評(píng)分的計(jì)算公式分別為:
33、
34、
35、式中,為細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分;為細(xì)胞細(xì)胞通訊的表達(dá)產(chǎn)物評(píng)分;為細(xì)胞細(xì)胞通訊的細(xì)胞表達(dá)評(píng)分;a,b均為細(xì)胞類(lèi)型;a為配體;b為受體;ma,a為a在細(xì)胞類(lèi)型a中的平均表達(dá)量;mb,b為b在細(xì)胞類(lèi)型b中的平均表達(dá)量;ma和mb分別為所有細(xì)胞中配體a和受體b的平均表達(dá)量;σa和σb分別為所有細(xì)胞中配體a和受體b的表達(dá)量的標(biāo)準(zhǔn)差,當(dāng)兩個(gè)不等式都滿(mǎn)足時(shí)結(jié)果為1,否則為0;na,a為配體a在細(xì)胞類(lèi)型a中表達(dá)值大于0的細(xì)胞個(gè)數(shù);nb,b為受體b在細(xì)胞類(lèi)型b中表達(dá)值大于0的細(xì)胞個(gè)數(shù);na和nb分別為細(xì)胞類(lèi)型a和細(xì)胞類(lèi)型b中細(xì)胞的個(gè)數(shù)。
36、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析裝置的優(yōu)選方案,所述細(xì)胞細(xì)胞通訊強(qiáng)度獲取模塊中,所述細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果的表達(dá)式分別為:
37、
38、式中,n為參與介導(dǎo)細(xì)胞細(xì)胞通訊的配體-受體相互作用對(duì)數(shù)量。
39、作為一種基于圖卷積網(wǎng)絡(luò)的細(xì)胞間通訊分析裝置的優(yōu)選方案,所述細(xì)胞細(xì)胞通訊強(qiáng)度獲取模塊中,所述細(xì)胞細(xì)胞通訊強(qiáng)度的表達(dá)式為:
40、
41、式中,rmax、rmin和rmed分別為將細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果歸一化后的標(biāo)準(zhǔn)細(xì)胞細(xì)胞通訊結(jié)果的最大值、最小值和中值。
42、本發(fā)明具有如下優(yōu)點(diǎn):從設(shè)定數(shù)據(jù)庫(kù)中下載蛋白質(zhì)的配體和受體序列信息;通過(guò)ifeature對(duì)蛋白質(zhì)的所述配體和受體序列信息進(jìn)行處理,獲得配體和受體的數(shù)字特征;根據(jù)所述配體和受體的數(shù)字特征,構(gòu)建配體和受體初始特征矩陣;收集蛋白質(zhì)的初始配體-受體相互作用對(duì),并構(gòu)建配體-受體相互作用鄰接矩陣;基于圖卷積網(wǎng)絡(luò),構(gòu)建配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)所述配體和受體初始特征矩陣及所述配體-受體相互作用鄰接矩陣,對(duì)所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,獲得訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型;通過(guò)訓(xùn)練好的所述配體-受體相互作用預(yù)測(cè)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)處理,獲得存在相互作用的預(yù)測(cè)配體-受體相互作用對(duì);通過(guò)單細(xì)胞rna測(cè)序數(shù)據(jù)對(duì)收集的所述初始配體-受體相互作用對(duì)及所述預(yù)測(cè)配體-受體相互作用對(duì)進(jìn)行識(shí)別過(guò)濾,獲得滿(mǎn)足設(shè)定要求的配體-受體相互作用對(duì);對(duì)滿(mǎn)足設(shè)定要求的所述配體-受體相互作用對(duì)進(jìn)行細(xì)胞細(xì)胞通訊評(píng)分計(jì)算,獲得細(xì)胞類(lèi)型之間的若干配體受體的細(xì)胞細(xì)胞通訊的表達(dá)閾值評(píng)分、表達(dá)產(chǎn)物評(píng)分和細(xì)胞表達(dá)評(píng)分;將細(xì)胞類(lèi)型間通信的若干相應(yīng)評(píng)分相加,獲得細(xì)胞細(xì)胞通訊的表達(dá)閾值結(jié)果、表達(dá)產(chǎn)物結(jié)果以及細(xì)胞表達(dá)結(jié)果;根據(jù)細(xì)胞細(xì)胞通訊的所述表達(dá)閾值結(jié)果、所述表達(dá)產(chǎn)物結(jié)果以及所述細(xì)胞表達(dá)結(jié)果,通過(guò)三點(diǎn)估計(jì)法測(cè)量獲得細(xì)胞細(xì)胞通訊強(qiáng)度;根據(jù)所述細(xì)胞細(xì)胞通訊強(qiáng)度,構(gòu)建細(xì)胞細(xì)胞通訊熱圖;通過(guò)所述細(xì)胞細(xì)胞通訊熱圖分析兩兩細(xì)胞類(lèi)型通訊中最活躍的配體-受體相互作用對(duì),完成細(xì)胞細(xì)胞通訊可視化分析。本發(fā)明通過(guò)識(shí)別出的高置信度的配體-受體相互作用對(duì)和單細(xì)胞rna測(cè)序數(shù)據(jù)來(lái)測(cè)量這些配體-受體相互作用介導(dǎo)的細(xì)胞細(xì)胞通訊強(qiáng)度,進(jìn)一步進(jìn)行細(xì)胞細(xì)胞通訊分析。本發(fā)明首次使用圖卷積網(wǎng)絡(luò),利用配體和受體的多維度特征作為初始嵌入,為單細(xì)胞rna測(cè)序數(shù)據(jù)獲得更完整、可靠和組織良好的配體-受體相互作用數(shù)據(jù)庫(kù)。本發(fā)明通過(guò)過(guò)濾的配體-受體相互作用資源,使用三點(diǎn)評(píng)價(jià)方法計(jì)算細(xì)胞細(xì)胞通訊強(qiáng)度,與其他流行工具相比,獲得相對(duì)準(zhǔn)確的細(xì)胞細(xì)胞通訊分析結(jié)果,并提供多種可視化。