1.一種音頻聲音事件檢測(cè)方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的音頻聲音事件檢測(cè)方法,其特征在于,所述特征提取網(wǎng)絡(luò)包括依次相連的第一二維卷積塊、第二二維卷積塊、十字交叉注意力機(jī)制網(wǎng)絡(luò)層和多個(gè)多尺度條帶卷積殘差模塊;
3.根據(jù)權(quán)利要求1所述的音頻聲音事件檢測(cè)方法,其特征在于,所述獲取訓(xùn)練音頻樣本的第一音頻特征圖、與第一音頻特征圖對(duì)應(yīng)的真實(shí)時(shí)間標(biāo)簽,包括:
4.根據(jù)權(quán)利要求1所述的音頻聲音事件檢測(cè)方法,其特征在于,所述將第一音頻特征圖輸入目標(biāo)特征提取網(wǎng)絡(luò)中,獲取第二音頻特征圖,包括:
5.根據(jù)權(quán)利要求4所述的音頻聲音事件檢測(cè)方法,其特征在于,所述基于第一空間維度張量、第二空間維度張量,得到中間音頻特征圖,包括:
6.根據(jù)權(quán)利要求4所述的音頻聲音事件檢測(cè)方法,其特征在于,所述基于第三空間維度張量、中間音頻特征圖,得到第二音頻特征圖,包括:
7.根據(jù)權(quán)利要求2所述的音頻聲音事件檢測(cè)方法,其特征在于,所述通過(guò)真實(shí)時(shí)間標(biāo)簽、預(yù)測(cè)時(shí)間標(biāo)簽訓(xùn)練目標(biāo)特征提取網(wǎng)絡(luò),直到目標(biāo)特征提取網(wǎng)絡(luò)生成滿足要求的第二音頻特征圖,包括:
8.一種音頻聲音事件檢測(cè)裝置,其特征在于,包括:
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的音頻聲音事件檢測(cè)方法。
10.一種計(jì)算機(jī)設(shè)備,其特征在于,包括: