本技術(shù)涉及人工智能,特別是涉及一種用戶分類模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、人工智能技術(shù)的發(fā)展為人群健康管理提供了強(qiáng)大的支持,主要體現(xiàn)在海量的醫(yī)療健康數(shù)據(jù)集被用于人工智能模型的構(gòu)建并助力各類疾病及其危險(xiǎn)因素的防控和管理。在這一領(lǐng)域內(nèi),對(duì)不同醫(yī)療健康機(jī)構(gòu)和場(chǎng)景的數(shù)字化電子病歷系統(tǒng),如何在跨人群、跨機(jī)構(gòu)快速有效部署人工智能方法面臨挑戰(zhàn)。特別是存在人群分布差異的條件下,在一個(gè)數(shù)據(jù)集訓(xùn)練好的人工智能方法通常面臨泛化性降低的問(wèn)題。
2、相關(guān)技術(shù)中,在跨人群、跨機(jī)構(gòu)中應(yīng)用人工智能模型的主要方式為持續(xù)學(xué)習(xí),但該方法需要以模型訓(xùn)練的每個(gè)批次(batch)為單位更新緩沖區(qū)(buffer)中的數(shù)據(jù)與采樣下一批次中的回放數(shù)據(jù)。這樣的方式在面對(duì)大樣本量的數(shù)據(jù)訓(xùn)練任務(wù)時(shí),顯著地降低了模型訓(xùn)練的速度。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述方法的模型訓(xùn)練速度較低的技術(shù)問(wèn)題,提供一種用戶分類模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。
2、第一方面,本技術(shù)提供了一種用戶分類模型的訓(xùn)練方法。所述方法包括:
3、獲取訓(xùn)練數(shù)據(jù)集;所述訓(xùn)練數(shù)據(jù)集包括不同醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集以及醫(yī)療機(jī)構(gòu)外的多個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集對(duì)應(yīng)有至少兩個(gè)群體;
4、確定每個(gè)訓(xùn)練集對(duì)分類模型的訓(xùn)練為一個(gè)任務(wù),確定各個(gè)任務(wù)的執(zhí)行順序;
5、按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
6、在其中一個(gè)實(shí)施例中,所述確定各個(gè)任務(wù)的執(zhí)行順序,包括:
7、按照從醫(yī)療機(jī)構(gòu)內(nèi)到醫(yī)療機(jī)構(gòu)外的順序,對(duì)各個(gè)任務(wù)進(jìn)行排序,得到第一排序結(jié)果;
8、按照不同醫(yī)療機(jī)構(gòu)的樣本優(yōu)先級(jí)順序,對(duì)不同醫(yī)療機(jī)構(gòu)之間的訓(xùn)練集進(jìn)行排序,得到第二排序結(jié)果;
9、按照樣本采集時(shí)間的先后順序,或者采用隨機(jī)排序的方式,對(duì)所述醫(yī)療機(jī)構(gòu)外,以及同一醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集進(jìn)行排序,得到各個(gè)任務(wù)的執(zhí)行順序。
10、在其中一個(gè)實(shí)施例中,所述按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型,包括:
11、按照所述執(zhí)行順序確定當(dāng)前任務(wù),以及從緩沖區(qū)中采樣回放數(shù)據(jù);
12、根據(jù)所述回放數(shù)據(jù)和所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)上一個(gè)任務(wù)訓(xùn)練的分類模型進(jìn)行訓(xùn)練,得到更新的分類模型;
13、對(duì)所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集進(jìn)行樣本采樣,以更新所述緩沖區(qū)中的數(shù)據(jù),以及,從更新的緩沖區(qū)中采樣下次訓(xùn)練的回放數(shù)據(jù);
14、根據(jù)所述下次訓(xùn)練的回放數(shù)據(jù)和下一個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集,對(duì)所述更新的分類模型進(jìn)行訓(xùn)練,直至所有任務(wù)對(duì)應(yīng)的訓(xùn)練集均完成分類模型的訓(xùn)練。
15、在其中一個(gè)實(shí)施例中,所述根據(jù)所述回放數(shù)據(jù)和所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)上一個(gè)任務(wù)訓(xùn)練的分類模型進(jìn)行訓(xùn)練,得到更新的分類模型,包括:
16、分別將所述回放數(shù)據(jù)中的第一樣本和第二樣本,以及所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集輸入上一個(gè)任務(wù)訓(xùn)練的分類模型,輸出所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集的預(yù)測(cè)結(jié)果、所述第一樣本對(duì)應(yīng)的當(dāng)前預(yù)測(cè)概率,以及所述第二樣本對(duì)應(yīng)的預(yù)測(cè)類別;所述當(dāng)前預(yù)測(cè)概率表示所述第一樣本中的用戶屬于各個(gè)類別的概率;
17、基于所述當(dāng)前任務(wù)對(duì)應(yīng)的訓(xùn)練集的預(yù)測(cè)結(jié)果獲取在所述當(dāng)前任務(wù)中的第一損失值,基于所述第一樣本對(duì)應(yīng)的當(dāng)前預(yù)測(cè)概率和存儲(chǔ)的預(yù)測(cè)概率獲取第二損失值,基于所述第二樣本對(duì)應(yīng)的預(yù)測(cè)類別和真實(shí)類別標(biāo)簽獲取第三損失值;
18、根據(jù)所述第一損失值、所述第二損失值和所述第三損失值,對(duì)所述上一個(gè)任務(wù)訓(xùn)練的分類模型的參數(shù)進(jìn)行調(diào)整,得到更新的分類模型。
19、在其中一個(gè)實(shí)施例中,所述獲取在所述當(dāng)前任務(wù)中的第一損失值,包括:
20、獲取所述任務(wù)中的對(duì)比損失值和分類損失值;
21、對(duì)所述對(duì)比損失值和所述分類損失值進(jìn)行求和,得到所述第一損失值。
22、在其中一個(gè)實(shí)施例中,所述方法還包括:
23、獲取待識(shí)別用戶的醫(yī)學(xué)數(shù)據(jù);
24、將所述醫(yī)學(xué)數(shù)據(jù)輸入所述訓(xùn)練好的分類模型,得到所述待識(shí)別用戶的類別。
25、第二方面,本技術(shù)還提供了一種用戶分類模型的訓(xùn)練裝置。所述裝置包括:
26、獲取模塊,用于獲取訓(xùn)練數(shù)據(jù)集;所述訓(xùn)練數(shù)據(jù)集包括不同醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集以及醫(yī)療機(jī)構(gòu)外的多個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集對(duì)應(yīng)有至少兩個(gè)群體;
27、排序模塊,用于確定每個(gè)訓(xùn)練集對(duì)分類模型的訓(xùn)練為一個(gè)任務(wù),確定各個(gè)任務(wù)的執(zhí)行順序;
28、訓(xùn)練模塊,用于按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
29、第三方面,本技術(shù)還提供了一種計(jì)算機(jī)設(shè)備。所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)以下步驟:
30、獲取訓(xùn)練數(shù)據(jù)集;所述訓(xùn)練數(shù)據(jù)集包括不同醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集以及醫(yī)療機(jī)構(gòu)外的多個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集對(duì)應(yīng)有至少兩個(gè)群體;
31、確定每個(gè)訓(xùn)練集對(duì)分類模型的訓(xùn)練為一個(gè)任務(wù),確定各個(gè)任務(wù)的執(zhí)行順序;
32、按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
33、第四方面,本技術(shù)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
34、獲取訓(xùn)練數(shù)據(jù)集;所述訓(xùn)練數(shù)據(jù)集包括不同醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集以及醫(yī)療機(jī)構(gòu)外的多個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集對(duì)應(yīng)有至少兩個(gè)群體;
35、確定每個(gè)訓(xùn)練集對(duì)分類模型的訓(xùn)練為一個(gè)任務(wù),確定各個(gè)任務(wù)的執(zhí)行順序;
36、按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
37、第五方面,本技術(shù)還提供了一種計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下步驟:
38、獲取訓(xùn)練數(shù)據(jù)集;所述訓(xùn)練數(shù)據(jù)集包括不同醫(yī)療機(jī)構(gòu)內(nèi)的多個(gè)訓(xùn)練集以及醫(yī)療機(jī)構(gòu)外的多個(gè)訓(xùn)練集,各個(gè)訓(xùn)練集對(duì)應(yīng)有至少兩個(gè)群體;
39、確定每個(gè)訓(xùn)練集對(duì)分類模型的訓(xùn)練為一個(gè)任務(wù),確定各個(gè)任務(wù)的執(zhí)行順序;
40、按照所述執(zhí)行順序,依次采用每個(gè)任務(wù)對(duì)應(yīng)的訓(xùn)練集對(duì)預(yù)先構(gòu)建的分類模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的分類模型。
41、上述用戶分類模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備、存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品,通過(guò)獲取來(lái)自不同醫(yī)療機(jī)構(gòu)和群體的豐富樣本數(shù)據(jù)進(jìn)行分類模型的訓(xùn)練,使訓(xùn)練得到的分類模型能夠用于跨人群跨醫(yī)療機(jī)構(gòu)的連續(xù)學(xué)習(xí),適用于在醫(yī)療資源缺乏場(chǎng)景下對(duì)醫(yī)療機(jī)構(gòu)外的人群的分類;進(jìn)一步地,在跨人群、跨醫(yī)療機(jī)構(gòu)下收集的數(shù)據(jù)集上,提出采用基于回放的連續(xù)學(xué)習(xí)策略進(jìn)行模型訓(xùn)練,使模型能夠達(dá)到較高的累計(jì)準(zhǔn)確率;進(jìn)一步地,在基于回放的連續(xù)學(xué)習(xí)策略的基礎(chǔ)上,采用任務(wù)級(jí)別進(jìn)行模型訓(xùn)練,能夠在保持較高的分類性能的基礎(chǔ)上,提高訓(xùn)練效率。此外,該方法在跨醫(yī)療機(jī)構(gòu)所提供的訓(xùn)練數(shù)據(jù)集較少時(shí),同樣可以利用持續(xù)學(xué)習(xí)機(jī)制,實(shí)現(xiàn)較滿意的模型辨識(shí)性能。