1.一種語言模型訓練方法,其特征在于,所述語言模型訓練方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述訓練數(shù)據(jù)訓練深層卷積神經(jīng)網(wǎng)絡模型,得到訓練后的深層卷積神經(jīng)網(wǎng)絡模型的步驟,包括:
3.如權(quán)利要求2所述的方法,其特征在于,所述基于所述統(tǒng)計池化層和所述深層卷積神經(jīng)網(wǎng)絡模型的全連接層對所述訓練數(shù)據(jù)進行特征提取和特征融合,得到所述訓練數(shù)據(jù)的融合特征數(shù)據(jù)的步驟,包括:
4.如權(quán)利要求1所述的方法,其特征在于,所述通過所述訓練后的深層卷積神經(jīng)網(wǎng)絡模型對預設(shè)的淺層卷積神經(jīng)網(wǎng)絡模型進行知識蒸餾訓練,得到訓練后的淺層卷積神經(jīng)網(wǎng)絡模型的步驟,包括:
5.如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標標簽損失和所述目標標簽的概率分布損失計算損失函數(shù),并根據(jù)所述損失函數(shù)優(yōu)化所述淺層卷積神經(jīng)網(wǎng)絡模型,得到訓練后的淺層卷積神經(jīng)網(wǎng)絡模型的步驟,包括:
6.如權(quán)利要求1所述的方法,其特征在于,所述對所述訓練后的淺層卷積神經(jīng)網(wǎng)絡模型進行量化處理,得到量化后的淺層卷積神經(jīng)網(wǎng)絡模型的步驟,包括:
7.一種語言模型訓練裝置,其特征在于,所述語言模型訓練裝置包括:
8.一種語言模型訓練設(shè)備,其特征在于,所述語言模型訓練設(shè)備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序配置為實現(xiàn)如權(quán)利要求1至6中任一項所述的語言模型訓練方法的步驟。
9.一種存儲介質(zhì),其特征在于,所述存儲介質(zhì)為計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的語言模型訓練方法的步驟。
10.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至6中任一項所述的語言模型訓練方法的步驟。