本發(fā)明適用于深度學(xué)習(xí)算法優(yōu)化和自動(dòng)機(jī)器學(xué)習(xí)方法設(shè)計(jì)領(lǐng)域,尤其涉及一種基于增量學(xué)習(xí)和無(wú)訓(xùn)練評(píng)價(jià)的半監(jiān)督機(jī)器學(xué)習(xí)方法。
背景技術(shù):
1、隨著大數(shù)據(jù)和人工智能算法的不斷發(fā)展,以及pytorch、tensorflow和飛槳paddlepaddle等深度學(xué)習(xí)框架功能的不斷豐富和完善,深度學(xué)習(xí)已取得巨大成功,并已廣泛應(yīng)用于各行各業(yè),包括智能安防、金融、自動(dòng)駕駛、智能制造和醫(yī)藥研發(fā)等等。然而,面對(duì)海量的大數(shù)據(jù)應(yīng)用場(chǎng)景,設(shè)計(jì)和優(yōu)化深度學(xué)習(xí)算法是一個(gè)非常復(fù)雜且耗時(shí)的過(guò)程。特別是在面對(duì)不同的應(yīng)用場(chǎng)景時(shí),如何設(shè)計(jì)類(lèi)似chatgpt功能的自動(dòng)機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)和參數(shù)的自動(dòng)化學(xué)習(xí)和優(yōu)化,這更加充滿(mǎn)挑戰(zhàn)??紤]到不同深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)具有不同表征潛力,具有強(qiáng)歸納偏置的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),甚至不用訓(xùn)練網(wǎng)絡(luò)參數(shù)就能獲得較好的建模效果。由此可見(jiàn),研究高效的自動(dòng)機(jī)器學(xué)習(xí)方法,具有重要的理論和應(yīng)用價(jià)值。
2、目前,已有許多自動(dòng)機(jī)器學(xué)習(xí)的方法和工具。比如,基于強(qiáng)化學(xué)習(xí)、貝葉斯優(yōu)化和進(jìn)化算法的自動(dòng)機(jī)器學(xué)習(xí)方法以及開(kāi)源的auto-keras和vega等自動(dòng)機(jī)器學(xué)習(xí)庫(kù)。但是,現(xiàn)有方法依然存在不足。比如,不同的深度學(xué)習(xí)算法往往具有不同的網(wǎng)絡(luò)架構(gòu),但現(xiàn)有工作往往針對(duì)某一類(lèi)或某幾類(lèi)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的學(xué)習(xí)和優(yōu)化問(wèn)題,研究自動(dòng)機(jī)器學(xué)習(xí)方法。顯然,針對(duì)不同的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),建立更具代表性和廣泛性的神經(jīng)架構(gòu)搜索空間,并設(shè)計(jì)相適應(yīng)的自動(dòng)機(jī)器學(xué)習(xí)方法更有理論和應(yīng)用研究?jī)r(jià)值。此外,在實(shí)際應(yīng)用中,當(dāng)有新數(shù)據(jù)時(shí),重頭開(kāi)始訓(xùn)練深度學(xué)習(xí)算法的成本,評(píng)價(jià)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的成本以及標(biāo)注數(shù)據(jù)的成本,這些成本都很高。現(xiàn)有自動(dòng)機(jī)器學(xué)習(xí)方法的研究主要包括深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)搜索空間的編碼設(shè)計(jì)、搜索優(yōu)化和模型評(píng)價(jià)等內(nèi)容。這也是本發(fā)明主要涉及的技術(shù)內(nèi)容。在這3個(gè)方面,與本發(fā)明最相近似的實(shí)現(xiàn)方案及存在的問(wèn)題和缺點(diǎn),總結(jié)如下。
3、1)在深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)搜索空間的編碼設(shè)計(jì)方面,針對(duì)基于細(xì)胞(cell)的卷積神經(jīng)網(wǎng)絡(luò)搜索空間設(shè)計(jì)二進(jìn)制的編碼策略,實(shí)現(xiàn)不同卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的統(tǒng)一編碼,并根據(jù)不同問(wèn)題實(shí)現(xiàn)自適應(yīng)調(diào)整。
4、這種方案雖然可實(shí)現(xiàn)不同卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的自適應(yīng)編碼,但是這種編碼策略會(huì)存在對(duì)某些卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)具有偏向性,沒(méi)法實(shí)現(xiàn)對(duì)所有不同網(wǎng)絡(luò)架構(gòu)進(jìn)行統(tǒng)一公平的選擇和優(yōu)化,從而引入網(wǎng)絡(luò)架構(gòu)偏差,以致影響深度學(xué)習(xí)算法性能。
5、2)在搜索優(yōu)化算法方面,通過(guò)強(qiáng)化學(xué)習(xí)輔助進(jìn)化算法的學(xué)習(xí),從而實(shí)現(xiàn)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的搜索優(yōu)化。這種方案雖然可利用強(qiáng)化學(xué)習(xí)提高進(jìn)化算法的搜索效率,但是也會(huì)因強(qiáng)化學(xué)習(xí)自身高昂的計(jì)算成本制約深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的搜索效率。
6、3)在模型評(píng)價(jià)方面,通過(guò)前饋神經(jīng)網(wǎng)絡(luò)建立半監(jiān)督評(píng)價(jià)模型,并用于評(píng)價(jià)不同深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)。這種方案雖可實(shí)現(xiàn)半監(jiān)督評(píng)價(jià)學(xué)習(xí),但沒(méi)法實(shí)現(xiàn)半監(jiān)督代理評(píng)價(jià)模型的增量學(xué)習(xí);而只能以高昂的學(xué)習(xí)成本,利用新舊數(shù)據(jù)一起重新學(xué)習(xí)建立半監(jiān)督代理評(píng)價(jià)模型。這種模型的學(xué)習(xí)成本較高還體現(xiàn)在:模型需要先通過(guò)具有高昂時(shí)間成本的訓(xùn)練學(xué)習(xí),在實(shí)現(xiàn)模型學(xué)習(xí)優(yōu)化后才能用于評(píng)價(jià)。雖然無(wú)訓(xùn)練評(píng)價(jià)的方法可有效提高半監(jiān)督代理評(píng)價(jià)模型的效率,但這種無(wú)訓(xùn)練的評(píng)價(jià)方法沒(méi)有直接用于半監(jiān)督代理評(píng)價(jià)模型的學(xué)習(xí)與建立。
7、因此,研究利用少量具有標(biāo)簽的數(shù)據(jù),設(shè)計(jì)半監(jiān)督的高效自動(dòng)機(jī)器學(xué)習(xí)方法,并在有新數(shù)據(jù)時(shí),實(shí)現(xiàn)具有增量學(xué)習(xí)能力的自動(dòng)機(jī)器學(xué)習(xí),具有重要的理論和實(shí)用價(jià)值。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種基于增量學(xué)習(xí)和無(wú)訓(xùn)練評(píng)價(jià)的半監(jiān)督機(jī)器學(xué)習(xí)方法,旨在解決現(xiàn)有的自動(dòng)機(jī)器學(xué)習(xí)方法中僅能針對(duì)某一類(lèi)或某幾類(lèi)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的學(xué)習(xí)和優(yōu)化問(wèn)題以及訓(xùn)練和評(píng)價(jià)深度學(xué)習(xí)算法成本高的問(wèn)題。
2、該方法包括以下步驟:
3、s1、獲取多個(gè)深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及對(duì)應(yīng)的超參數(shù)的可供選擇范圍;
4、s2、通過(guò)預(yù)設(shè)編碼策略對(duì)多個(gè)所述深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及對(duì)應(yīng)的超參數(shù)的可供選擇范圍進(jìn)行編碼,得到神經(jīng)架構(gòu)搜索空間;
5、s3、獲取進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法,根據(jù)預(yù)設(shè)方法對(duì)所述進(jìn)化網(wǎng)絡(luò)搜索算法進(jìn)行優(yōu)化,得到優(yōu)化搜索算法;
6、s4、通過(guò)所述優(yōu)化搜索算法對(duì)所述神經(jīng)架構(gòu)搜索空間進(jìn)行搜索,得到多個(gè)網(wǎng)絡(luò)架構(gòu);
7、s5、建立半監(jiān)督代理評(píng)價(jià)模型,通過(guò)所述半監(jiān)督代理評(píng)價(jià)模型對(duì)多個(gè)所述網(wǎng)絡(luò)架構(gòu)進(jìn)行評(píng)價(jià),得到評(píng)價(jià)結(jié)果;
8、s6、根據(jù)評(píng)價(jià)結(jié)果對(duì)多個(gè)所述網(wǎng)絡(luò)架構(gòu)進(jìn)行迭代更新并返回步驟s4,直至滿(mǎn)足預(yù)設(shè)條件,得到最優(yōu)深度學(xué)習(xí)網(wǎng)絡(luò)。
9、優(yōu)選的,所述預(yù)設(shè)編碼策略為:
10、將所述深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)中的每一神經(jīng)單元的二進(jìn)制編碼進(jìn)行鏈?zhǔn)竭B接;其中,所述神經(jīng)單元中包括多個(gè)節(jié)點(diǎn),所述節(jié)點(diǎn)表示特征信息;
11、將不同的所述節(jié)點(diǎn)之間通過(guò)基于層次結(jié)構(gòu)的多分支方式進(jìn)行連接,形成具有不同網(wǎng)絡(luò)拓?fù)溥B接的所述神經(jīng)單元;
12、其中,所述節(jié)點(diǎn)按順序編號(hào),并且僅序號(hào)小的所述節(jié)點(diǎn)可連向序號(hào)大的所述節(jié)點(diǎn)。
13、優(yōu)選的,所述神經(jīng)單元的二進(jìn)制編碼包括第一部分、第二部分以及第三部分;所述第一部分用于表示所述神經(jīng)單元是否存在;所述第二部分用于表示可選擇的所述深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及對(duì)應(yīng)的超參數(shù);所述第三部分用于表示與其他節(jié)點(diǎn)的連接關(guān)系。
14、優(yōu)選的,所述預(yù)設(shè)方法為:
15、將所述進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法中的搜索算子根據(jù)側(cè)重進(jìn)行分類(lèi),分為收斂算子和多樣算子;其中,所述進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法包括至少1個(gè)所述收斂算子和1個(gè)所述多樣算子;
16、根據(jù)預(yù)設(shè)計(jì)算公式和所述搜索算子的搜索結(jié)果,對(duì)所述搜索算子給予正向獎(jiǎng)勵(lì)或反向懲罰;所述正向獎(jiǎng)勵(lì)用于提高執(zhí)行概率,所述反向懲罰用于降低執(zhí)行概率。
17、優(yōu)選的,定義所述進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法的種群數(shù)為np,代表個(gè)體i(i∈[1,np])在第t時(shí)刻選擇不同所述搜索算子的狀態(tài);則所述預(yù)設(shè)計(jì)算公式如下:
18、
19、pi(t)=pi(t-1)+δpi(t)
20、
21、其中,參數(shù)wi(t)的學(xué)習(xí)算法具體如下,
22、wi(t)=wi(t-1)+δwi(t)
23、
24、其中,表示個(gè)體i在第t時(shí)刻取時(shí)的概率,pi(t)則表示個(gè)體i在t時(shí)刻的概率取值;δpi(t)表示個(gè)體i在第t時(shí)刻相比第t-1時(shí)刻的概率變化大?。沪潜硎敬笥?的算法超參數(shù);bi表示個(gè)體i獲得反饋獎(jiǎng)勵(lì)的初始值;wi(t)表示個(gè)體i在第t時(shí)刻待學(xué)習(xí)的參數(shù);表示反饋獎(jiǎng)勵(lì)。
25、優(yōu)選的,步驟s5中,建立所述半監(jiān)督代理評(píng)價(jià)模型包括以下子步驟:
26、s51、獲取多個(gè)數(shù)據(jù)樣本,將多個(gè)所述數(shù)據(jù)樣本隨機(jī)輸入至不同的所述網(wǎng)絡(luò)架構(gòu),根據(jù)輸入的所述網(wǎng)絡(luò)架構(gòu)中層數(shù)的先后順序以及對(duì)應(yīng)的所述網(wǎng)絡(luò)架構(gòu)中激活函數(shù)的總個(gè)數(shù)進(jìn)行計(jì)算,計(jì)算得到多個(gè)二進(jìn)制串;
27、s52、根據(jù)距離度量公式計(jì)算不同的所述二進(jìn)制串之間的差距,得到對(duì)比矩陣,所述對(duì)比矩陣用于度量所述數(shù)據(jù)樣本經(jīng)過(guò)所述網(wǎng)絡(luò)架構(gòu)處理后的相似程度;
28、s53、對(duì)每一所述網(wǎng)絡(luò)架構(gòu)的性能進(jìn)行計(jì)算,得到每一所述網(wǎng)絡(luò)架構(gòu)對(duì)應(yīng)的性能結(jié)果;
29、s54、從多個(gè)所述網(wǎng)絡(luò)架構(gòu)中隨機(jī)選擇出一部分網(wǎng)絡(luò)架構(gòu)進(jìn)行訓(xùn)練并對(duì)訓(xùn)練后的網(wǎng)絡(luò)架構(gòu)的性能進(jìn)行計(jì)算;通過(guò)訓(xùn)練后的網(wǎng)絡(luò)架構(gòu)的性能結(jié)果對(duì)訓(xùn)練前的網(wǎng)絡(luò)架構(gòu)的性能結(jié)果進(jìn)行糾正,將所有的所述網(wǎng)絡(luò)架構(gòu)作為網(wǎng)絡(luò)架構(gòu)集合;
30、s55、通過(guò)寬度學(xué)習(xí)算法對(duì)所述網(wǎng)絡(luò)架構(gòu)集合及對(duì)應(yīng)的性能結(jié)果組成的數(shù)據(jù)對(duì)進(jìn)行學(xué)習(xí),得到所述半監(jiān)督代理評(píng)價(jià)模型。
31、優(yōu)選的,所述網(wǎng)絡(luò)架構(gòu)的性能的計(jì)算公式如下:
32、y=log|a|
33、其中,y表示所述網(wǎng)絡(luò)架構(gòu)的性能,a表示對(duì)比矩陣。
34、優(yōu)選的,所述半監(jiān)督代理評(píng)價(jià)模型通過(guò)增量寬度學(xué)習(xí)算法和新增的所述數(shù)據(jù)對(duì)進(jìn)行增量學(xué)習(xí)。
35、與現(xiàn)有技術(shù)相比,本發(fā)明提出面向不同深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及其超參數(shù)的自適應(yīng)可擴(kuò)展統(tǒng)一編碼策略,解決不同深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及其超參數(shù)的統(tǒng)一編碼問(wèn)題,并根據(jù)不同問(wèn)題和不同類(lèi)型深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)自適應(yīng)的網(wǎng)絡(luò)架構(gòu)擴(kuò)展。設(shè)計(jì)基于簡(jiǎn)化強(qiáng)化學(xué)習(xí)的進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法,通過(guò)利用深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)搜索過(guò)程中的反饋信息,指導(dǎo)進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法的尋優(yōu)過(guò)程,從而提高進(jìn)化網(wǎng)絡(luò)架構(gòu)搜索算法的尋優(yōu)效率和精度,解決深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的搜索優(yōu)化問(wèn)題。建立基于增量寬度學(xué)習(xí)和無(wú)訓(xùn)練評(píng)價(jià)的半監(jiān)督代理評(píng)價(jià)模型,通過(guò)寬度學(xué)習(xí)算法,建立深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)及其超參數(shù)的半監(jiān)督代理評(píng)價(jià)模型,并借助無(wú)訓(xùn)練評(píng)價(jià)的方式,提高代理評(píng)價(jià)模型的學(xué)習(xí)效率。同時(shí),通過(guò)增量寬度學(xué)習(xí)算法,在新增網(wǎng)絡(luò)架構(gòu)及其性能數(shù)據(jù)時(shí),實(shí)現(xiàn)半監(jiān)督代理評(píng)價(jià)模型的增量更新,降低模型從頭訓(xùn)練的高昂增量學(xué)習(xí)成本。