1.基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s1中情緒語音識(shí)別數(shù)據(jù)集中包括等樣本數(shù)的憤怒、厭惡、恐懼、幸福、悲傷、驚訝和中立情感;
3.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s2中的去噪聲使用音頻去噪算法去除背景噪聲;
4.根據(jù)權(quán)利要求3所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述去噪聲采用的是卷積濾波算法,所述卷積濾波算法的計(jì)算公式如下:
5.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s3中的stft的計(jì)算公式如下:
6.根據(jù)權(quán)利要求5所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述stft計(jì)算的結(jié)果是一個(gè)復(fù)數(shù)矩陣,每個(gè)元素由幅度和相位組成,幅度表示頻率成分的強(qiáng)度,相位表示信號(hào)在頻率下的相對(duì)位置;
7.根據(jù)權(quán)利要求6所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s4中卷積神經(jīng)網(wǎng)絡(luò)從聲譜圖中提取局部特征的計(jì)算如下:
8.根據(jù)權(quán)利要求1所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s4中能量信息進(jìn)行形成集合的計(jì)算如下:
9.根據(jù)權(quán)利要求8所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s6中的混合矩陣中的橫軸和縱軸分別表示為預(yù)測(cè)標(biāo)簽和實(shí)際標(biāo)簽;根據(jù)大量的模型預(yù)測(cè)結(jié)果將預(yù)測(cè)的數(shù)值填充到混合矩陣中,并且混合矩陣的對(duì)角線設(shè)為預(yù)測(cè)為正類,實(shí)際也為正類的樣本數(shù),表示模型正確地識(shí)別了正類樣本,且設(shè)有;非對(duì)角線上的預(yù)測(cè)為負(fù)類,即預(yù)測(cè)為負(fù)類,但實(shí)際為正類的樣本數(shù),表示預(yù)測(cè)錯(cuò)誤的負(fù)類樣本,且設(shè)有。
10.根據(jù)權(quán)利要求9所述的基于ai的語音情緒識(shí)別模型的訓(xùn)練方法,其特征在于:所述s6中的精確率、召回率和f1分?jǐn)?shù)的計(jì)算公式如下: