本技術(shù)涉及生物領(lǐng)域,尤其涉及一種基于空間轉(zhuǎn)錄組的聚類簇著色方法、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、在目前的聚類簇著色方案中,空間轉(zhuǎn)錄組數(shù)據(jù)的聚類標(biāo)簽通常較多,seurat、scanpy等軟件容易將預(yù)定義的色盤中相似的顏色分配到相鄰或交錯(cuò)的聚類標(biāo)簽中,相鄰或交錯(cuò)的聚類標(biāo)簽對(duì)應(yīng)的聚類簇通常也是相似的,而且預(yù)定義色盤往往追求所有顏色之間的差異都較平均,因此在聚類標(biāo)簽數(shù)較大時(shí),分配到相鄰或交錯(cuò)類別中的顏色的色差會(huì)全局減小,從而導(dǎo)致相似度高的聚類簇在可視化顯示時(shí)難以進(jìn)行區(qū)分。
2、此外,palo等方法中使用簡(jiǎn)單的相鄰關(guān)系來定義空間轉(zhuǎn)錄組數(shù)據(jù)的聚類標(biāo)簽之間的重疊現(xiàn)象,這種定義方式無法充分表達(dá)出聚類標(biāo)簽之間的拓?fù)潢P(guān)系,導(dǎo)致聚類簇著色質(zhì)量不佳。而且隨著聚類標(biāo)簽數(shù)量不斷增加,palo等方法采用隨機(jī)打亂著色尋找最優(yōu)著色方案的方法,其時(shí)間開銷呈指數(shù)級(jí)增加,效率較低。
技術(shù)實(shí)現(xiàn)思路
1、鑒于以上內(nèi)容,有必要提供一種基于空間轉(zhuǎn)錄組的聚類簇著色方法、電子設(shè)備及存儲(chǔ)介質(zhì),能夠解決相似度高的聚類簇在可視化顯示時(shí)難以進(jìn)行區(qū)分以及最優(yōu)著色方案的查找效率不高的技術(shù)問題。
2、一方面,本技術(shù)提供一種基于空間轉(zhuǎn)錄組的聚類簇著色方法,所述方法包括:獲取空間轉(zhuǎn)錄組數(shù)據(jù),所述空間轉(zhuǎn)錄組數(shù)據(jù)包括多個(gè)聚類簇以及所述多個(gè)聚類簇中每個(gè)聚類簇對(duì)應(yīng)的聚類標(biāo)簽,根據(jù)多個(gè)聚類標(biāo)簽的數(shù)量獲取多個(gè)預(yù)設(shè)顏色,根據(jù)所述多個(gè)聚類標(biāo)簽構(gòu)建聚類標(biāo)簽混淆矩陣,并根據(jù)所述多個(gè)預(yù)設(shè)顏色構(gòu)建色彩視覺差異矩陣,構(gòu)建所述聚類標(biāo)簽混淆矩陣的聚類標(biāo)簽環(huán)路圖,求取所述聚類標(biāo)簽環(huán)路圖的第一環(huán)路,并生成所述色彩視覺差異矩陣對(duì)應(yīng)的第二環(huán)路,所述第一環(huán)路中的每個(gè)頂點(diǎn)對(duì)應(yīng)一個(gè)聚類標(biāo)簽,所述第二環(huán)路中的每個(gè)頂點(diǎn)對(duì)應(yīng)一個(gè)預(yù)設(shè)顏色,將所述第一環(huán)路與所述第二環(huán)路進(jìn)行保序映射,得到多種初始映射關(guān)系,每種初始映射關(guān)系中每個(gè)聚類標(biāo)簽對(duì)應(yīng)一預(yù)設(shè)顏色,根據(jù)每種初始映射關(guān)系對(duì)齊所述聚類標(biāo)簽混淆矩陣與所述色彩視覺差異矩陣,并根據(jù)每次對(duì)齊后的聚類標(biāo)簽混淆矩陣和色彩視覺差異矩陣,計(jì)算對(duì)應(yīng)的初始映射關(guān)系的誤差,根據(jù)計(jì)算得到的多個(gè)誤差從所述多個(gè)初始映射關(guān)系中確定目標(biāo)映射關(guān)系,并根據(jù)所述目標(biāo)映射關(guān)系對(duì)所述多個(gè)聚類簇進(jìn)行著色處理。
3、在一些實(shí)施例中,所述根據(jù)所述多個(gè)聚類標(biāo)簽構(gòu)建聚類標(biāo)簽混淆矩陣包括:根據(jù)所述多個(gè)聚類標(biāo)簽的數(shù)量構(gòu)建初始空矩陣,令所述初始空矩陣的每行和每列均對(duì)應(yīng)一聚類標(biāo)簽且任意兩行或任意兩列對(duì)應(yīng)的聚類標(biāo)簽不同,在所述初始空矩陣中填入相應(yīng)元素值,包括:選擇所述初始空矩陣的任一元素位置,確定選擇的元素位置對(duì)應(yīng)的行聚類標(biāo)簽與列聚類標(biāo)簽,根據(jù)所述列聚類標(biāo)簽確定所述行聚類標(biāo)簽中任一聚類簇對(duì)應(yīng)的相鄰聚類簇,統(tǒng)計(jì)所述行聚類標(biāo)簽中所有聚類簇對(duì)應(yīng)的相鄰聚類簇的總數(shù)值,將所述行聚類標(biāo)簽的總數(shù)值寫入所述選擇的元素位置,重復(fù)執(zhí)行在所述初始空矩陣中填入相應(yīng)元素值的步驟,直至所有的元素位置均已寫入相應(yīng)的元素值,得到所述聚類標(biāo)簽混淆矩陣。
4、在一些實(shí)施例中,所述根據(jù)所述列聚類標(biāo)簽確定所述行聚類標(biāo)簽中任一聚類簇對(duì)應(yīng)的相鄰聚類簇包括:計(jì)算所述多個(gè)聚類簇中除了所述任一聚類簇之外的其余聚類簇與所述任一聚類簇之間的聚類簇距離,根據(jù)多個(gè)聚類簇距離對(duì)所述多個(gè)聚類簇中除了所述任一聚類簇之外的其余聚類簇進(jìn)行排序,從排序后的聚類簇中選取距離所述任一聚類簇最近的預(yù)設(shè)數(shù)量個(gè)聚類簇,根據(jù)預(yù)設(shè)數(shù)值對(duì)選取得到的聚類簇進(jìn)行篩選,并將篩選得到的聚類簇中屬于所述列聚類標(biāo)簽的聚類簇確定為所述相鄰聚類簇。
5、在一些實(shí)施例中,所述構(gòu)建所述聚類標(biāo)簽混淆矩陣的聚類標(biāo)簽環(huán)路圖包括:根據(jù)所述多個(gè)聚類標(biāo)簽的數(shù)量構(gòu)建相應(yīng)數(shù)量的頂點(diǎn),根據(jù)任一行與任一列在所述聚類標(biāo)簽混淆矩陣中對(duì)應(yīng)的總數(shù)值,確定是否連接所述任一行與所述任一列對(duì)應(yīng)的兩個(gè)頂點(diǎn),若任意兩個(gè)頂點(diǎn)相互連接,將相互連接的兩個(gè)頂點(diǎn)對(duì)應(yīng)的總數(shù)值作為所述相互連接的兩個(gè)頂點(diǎn)之間的邊權(quán),得到所述聚類標(biāo)簽環(huán)路圖。
6、在一些實(shí)施例中,所述將所述第一環(huán)路與所述第二環(huán)路進(jìn)行保序映射,得到多種初始映射關(guān)系包括:保持所述第一環(huán)路不變,對(duì)所述第二環(huán)路中的所有頂點(diǎn)進(jìn)行錯(cuò)位排列,得到多條目標(biāo)環(huán)路,其中,任意兩條目標(biāo)環(huán)路中同一個(gè)位置上對(duì)應(yīng)的預(yù)設(shè)顏色不相同;建立所述第一環(huán)路中每個(gè)位置上的頂點(diǎn)對(duì)應(yīng)的聚類標(biāo)簽與任一目標(biāo)環(huán)路中對(duì)應(yīng)位置上的頂點(diǎn)對(duì)應(yīng)的預(yù)設(shè)顏色之間的對(duì)應(yīng)關(guān)系,得到任一初始映射關(guān)系,或者,保持所述第二環(huán)路不變,對(duì)所述第一環(huán)路中的所有頂點(diǎn)進(jìn)行錯(cuò)位排列,得到多條目標(biāo)環(huán)路,其中,任意兩條目標(biāo)環(huán)路中同一個(gè)位置上對(duì)應(yīng)的聚類標(biāo)簽不相同;建立所述第二環(huán)路中每個(gè)位置上的頂點(diǎn)對(duì)應(yīng)的預(yù)設(shè)顏色與任一目標(biāo)環(huán)路中對(duì)應(yīng)位置上的頂點(diǎn)對(duì)應(yīng)的聚類標(biāo)簽之間的對(duì)應(yīng)關(guān)系,得到任一初始映射關(guān)系。
7、在一些實(shí)施例中,所述色彩視覺差異矩陣包括色彩差異值,所述根據(jù)每種初始映射關(guān)系對(duì)齊所述聚類標(biāo)簽混淆矩陣與所述色彩視覺差異矩陣包括:保持所述色彩視覺差異矩陣不變,根據(jù)每種初始映射關(guān)系將所述聚類標(biāo)簽混淆矩陣中總數(shù)值的位置進(jìn)行變換,得到每次對(duì)齊后的聚類標(biāo)簽混淆矩陣和色彩視覺差異矩陣,或者,保持所述聚類標(biāo)簽混淆矩陣不變,根據(jù)每種初始映射關(guān)系將所述色彩視覺差異矩陣中色彩差異值的位置進(jìn)行變換,得到每次對(duì)齊后的聚類標(biāo)簽混淆矩陣和色彩視覺差異矩陣。
8、在一些實(shí)施例中,所述根據(jù)計(jì)算得到的多個(gè)誤差從所述多個(gè)初始映射關(guān)系中確定目標(biāo)映射關(guān)系,并根據(jù)所述目標(biāo)映射關(guān)系對(duì)所述多個(gè)聚類簇進(jìn)行著色處理包括:將最小的誤差對(duì)應(yīng)的初始映射關(guān)系確定為所述目標(biāo)映射關(guān)系,根據(jù)所述目標(biāo)映射關(guān)系中每個(gè)聚類標(biāo)簽對(duì)應(yīng)的預(yù)設(shè)顏色對(duì)所述聚類標(biāo)簽對(duì)應(yīng)的聚類簇進(jìn)行著色處理。
9、在一些實(shí)施例中,所述方法還包括:將所述聚類標(biāo)簽混淆矩陣嵌入至三維坐標(biāo)空間,得到每個(gè)聚類標(biāo)簽對(duì)應(yīng)的三維坐標(biāo),將多個(gè)三維坐標(biāo)調(diào)整至預(yù)設(shè)的色彩空間,得到每個(gè)聚類標(biāo)簽對(duì)應(yīng)的目標(biāo)顏色,根據(jù)每個(gè)聚類標(biāo)簽對(duì)應(yīng)的目標(biāo)顏色對(duì)所述聚類標(biāo)簽對(duì)應(yīng)的聚類簇進(jìn)行著色處理。
10、另一方面,本技術(shù)提供一種基于空間轉(zhuǎn)錄組的聚類簇著色裝置,所述裝置包括:獲取單元,用于獲取空間轉(zhuǎn)錄組數(shù)據(jù),所述空間轉(zhuǎn)錄組數(shù)據(jù)包括多個(gè)聚類簇以及所述多個(gè)聚類簇中每個(gè)聚類簇對(duì)應(yīng)的聚類標(biāo)簽,構(gòu)建單元,用于根據(jù)多個(gè)聚類標(biāo)簽的數(shù)量獲取多個(gè)預(yù)設(shè)顏色,根據(jù)所述多個(gè)聚類標(biāo)簽構(gòu)建聚類標(biāo)簽混淆矩陣,并根據(jù)所述多個(gè)預(yù)設(shè)顏色構(gòu)建色彩視覺差異矩陣,生成單元,用于構(gòu)建所述聚類標(biāo)簽混淆矩陣的聚類標(biāo)簽環(huán)路圖,求取所述聚類標(biāo)簽環(huán)路圖的第一環(huán)路,并生成所述色彩視覺差異矩陣對(duì)應(yīng)的第二環(huán)路,所述第一環(huán)路中的每個(gè)頂點(diǎn)對(duì)應(yīng)一個(gè)聚類標(biāo)簽,所述第二環(huán)路中的每個(gè)頂點(diǎn)對(duì)應(yīng)一個(gè)預(yù)設(shè)顏色,映射單元,用于將所述第一環(huán)路與所述第二環(huán)路進(jìn)行保序映射,得到多種初始映射關(guān)系,每種初始映射關(guān)系中每個(gè)聚類標(biāo)簽對(duì)應(yīng)一預(yù)設(shè)顏色,對(duì)齊單元,用于根據(jù)每種初始映射關(guān)系對(duì)齊所述聚類標(biāo)簽混淆矩陣與所述色彩視覺差異矩陣,計(jì)算單元,用于根據(jù)每次對(duì)齊后的聚類標(biāo)簽混淆矩陣和色彩視覺差異矩陣,計(jì)算對(duì)應(yīng)的初始映射關(guān)系的誤差,確定單元,用于根據(jù)計(jì)算得到的多個(gè)誤差從所述多個(gè)初始映射關(guān)系中確定目標(biāo)映射關(guān)系,著色單元,用于根據(jù)所述目標(biāo)映射關(guān)系對(duì)所述多個(gè)聚類簇進(jìn)行著色處理。
11、另一方面,本技術(shù)提供一種電子設(shè)備,所述電子設(shè)備包括:存儲(chǔ)器,存儲(chǔ)至少一個(gè)指令;及處理器,執(zhí)行所述至少一個(gè)指令以實(shí)現(xiàn)所述的基于空間轉(zhuǎn)錄組的聚類簇著色方法。
12、另一方面,本技術(shù)提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一個(gè)指令,所述至少一個(gè)指令被電子設(shè)備中的處理器執(zhí)行以實(shí)現(xiàn)所述的基于空間轉(zhuǎn)錄組的聚類簇著色方法。
13、通過上述實(shí)施方式,所述聚類標(biāo)簽混淆矩陣中的每個(gè)元素值代表任意兩個(gè)不同的聚類標(biāo)簽之間的相似度大小(重疊范圍大小),所述聚類標(biāo)簽混淆矩陣中的元素值越大,代表對(duì)應(yīng)的兩個(gè)聚類標(biāo)簽之間的相似程度越高,所述色彩視覺差異矩陣中的每個(gè)元素值代表任意兩個(gè)不同的預(yù)設(shè)顏色之間的色彩差異大小,所述色彩視覺差異矩陣中的元素值越大,代表對(duì)應(yīng)的兩個(gè)預(yù)設(shè)顏色之間的色彩差異越大。將所述第一環(huán)路與所述第二環(huán)路進(jìn)行保序映射,能夠建立相應(yīng)位置上的聚類標(biāo)簽與預(yù)設(shè)顏色之間的初始映射關(guān)系(對(duì)應(yīng)關(guān)系),由于通過保序映射得到的多條初始映射關(guān)系的數(shù)量相對(duì)于palo等方法通過隨機(jī)打亂的方式得到映射關(guān)系的數(shù)量較少,因此能夠節(jié)約時(shí)間,提高效率。本技術(shù)通過構(gòu)建聚類標(biāo)簽混淆矩陣進(jìn)而構(gòu)建環(huán)路圖的方式,能夠準(zhǔn)確地表達(dá)多個(gè)聚類標(biāo)簽之間的關(guān)聯(lián)關(guān)系,而并非相關(guān)技術(shù)中的palo等方法使用簡(jiǎn)單的相鄰關(guān)系來定義多個(gè)聚類標(biāo)簽之間的重疊關(guān)系,通過對(duì)多個(gè)聚類標(biāo)簽之間準(zhǔn)確的關(guān)聯(lián)關(guān)系進(jìn)行分析,能夠提高聚類簇著色質(zhì)量。在將誤差最小的初始映射關(guān)系確定為目標(biāo)映射關(guān)系時(shí),能夠使得所述目標(biāo)映射關(guān)系中色彩差異最大的預(yù)設(shè)顏色與相似程度最高的聚類標(biāo)簽相對(duì)應(yīng)或者所述目標(biāo)映射關(guān)系中色彩差異最小的預(yù)設(shè)顏色與相似程度最低的聚類標(biāo)簽相對(duì)應(yīng),使用色彩差異程度最高的預(yù)設(shè)顏色對(duì)相似程度最高的聚類標(biāo)簽對(duì)應(yīng)的聚類簇進(jìn)行著色,能夠提高聚類簇的區(qū)分度,使得用戶能夠更好地區(qū)分相似程度較高的聚類簇。