技術(shù)編號(hào):40624381
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本公開總體上涉及機(jī)器學(xué)習(xí)。更具體地,本公開涉及用于校準(zhǔn)從教師模型到學(xué)生模型的蒸餾學(xué)習(xí)的技術(shù)。背景技術(shù)、在機(jī)器學(xué)習(xí)中,知識(shí)蒸餾通??芍复鷮⒅R(shí)(例如,經(jīng)由蒸餾訓(xùn)練)從教師模型轉(zhuǎn)移到學(xué)生模型的過程。通常,盡管不一定,但是教師模型會(huì)比學(xué)生模型更大(例如,就參數(shù)的數(shù)量而言)。具體地,雖然大型模型(諸如非常深的神經(jīng)網(wǎng)絡(luò)或許多模型的集成)比小型模型具有更高的知識(shí)容量,但是這種容量可能不會(huì)在所有情況下都得到充分利用或都是需要的。例如,由于較小模型評(píng)估成本較低,因此可將它們部署在功能較弱的硬件(諸如移動(dòng)裝置)...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。