技術(shù)特征:
技術(shù)總結(jié)
本公開是關(guān)于一種語(yǔ)音識(shí)別方法及裝置。該方法包括獲取語(yǔ)音識(shí)別模型中待輸入深度神經(jīng)網(wǎng)絡(luò)DNN第i層網(wǎng)絡(luò)的M個(gè)語(yǔ)音數(shù)據(jù),每個(gè)語(yǔ)音數(shù)據(jù)包括語(yǔ)音的持續(xù)時(shí)間、語(yǔ)音頻率和語(yǔ)音強(qiáng)度;對(duì)M個(gè)語(yǔ)音數(shù)據(jù)包括的M個(gè)語(yǔ)音強(qiáng)度進(jìn)行正則化處理,獲取M個(gè)正則語(yǔ)音數(shù)據(jù),每個(gè)正則語(yǔ)音數(shù)據(jù)包括語(yǔ)音的持續(xù)時(shí)間、語(yǔ)音頻率和正則語(yǔ)音強(qiáng)度;根據(jù)M個(gè)正則語(yǔ)音數(shù)據(jù),獲取輸入DNN第i層網(wǎng)絡(luò)的M個(gè)輸入語(yǔ)音數(shù)據(jù)。該技術(shù)方案中,通過(guò)對(duì)待輸入DNN網(wǎng)絡(luò)中第i層網(wǎng)絡(luò)的語(yǔ)音數(shù)據(jù)進(jìn)行正則化處理,并根據(jù)正則化后的語(yǔ)音數(shù)據(jù)獲取第i層網(wǎng)絡(luò)的輸入語(yǔ)音數(shù)據(jù),提高了DNN網(wǎng)絡(luò)的訓(xùn)練速度,降低了輸入的語(yǔ)音數(shù)據(jù)中聲音強(qiáng)度對(duì)語(yǔ)音識(shí)別的影響,進(jìn)而提高了語(yǔ)音識(shí)別的準(zhǔn)確率。
技術(shù)研發(fā)人員:萬(wàn)韶華
受保護(hù)的技術(shù)使用者:北京小米移動(dòng)軟件有限公司
技術(shù)研發(fā)日:2017.03.29
技術(shù)公布日:2017.07.28