本申請涉及語音數(shù)據(jù)處理,尤其涉及一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在外呼場景中,坐席用戶可以是業(yè)務(wù)方的工作人員,負責(zé)在呼叫中為業(yè)務(wù)方的客戶提供服務(wù)。業(yè)務(wù)方需要監(jiān)督坐席用戶的發(fā)言,以確保坐席用戶所說的話符合業(yè)務(wù)方要求。因此,業(yè)務(wù)方往往將坐席用戶的錄音數(shù)據(jù)與客戶的錄音數(shù)據(jù)分別存儲,并對坐席用戶的錄音數(shù)據(jù)進行質(zhì)檢處理。但坐席錄音數(shù)據(jù)可能會偶爾混入該坐席用戶本人之外的聲音,比如客戶的聲音??紤]到業(yè)務(wù)方對坐席用戶發(fā)言的要求僅約束坐席用戶,客戶不受其影響,若客戶的語音串到坐席錄音數(shù)據(jù)中,可能導(dǎo)致質(zhì)檢結(jié)果出現(xiàn)誤判。
2、因此,業(yè)務(wù)方存在準確識別坐席錄音數(shù)據(jù)是否出現(xiàn)客戶串音的需求,若識別客戶串音的準確性不高,不利于后續(xù)的運維、數(shù)據(jù)分析和業(yè)務(wù)優(yōu)化。
技術(shù)實現(xiàn)思路
1、本申請實施例提供了一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲介質(zhì),以在檢測坐席錄音數(shù)據(jù)中的雜音來源時提高檢測準確性。
2、第一方面,本申請實施例提供了一種數(shù)據(jù)處理方法,包括:
3、獲取坐席錄音數(shù)據(jù);所述坐席錄音數(shù)據(jù)是指當坐席用戶與客戶在溝通時,所述坐席用戶的說話時段的音頻數(shù)據(jù);
4、若所述坐席錄音數(shù)據(jù)對應(yīng)于至少兩個說話人且所述至少兩個說話人包括所述坐席用戶和非坐席用戶,則確定所述非坐席用戶在所述坐席錄音數(shù)據(jù)中對應(yīng)的目標時間段;
5、獲取客戶錄音數(shù)據(jù);所述客戶錄音數(shù)據(jù)是指當所述坐席用戶與所述客戶在溝通時,所述客戶的說話時段的音頻數(shù)據(jù);
6、根據(jù)所述目標時間段與所述客戶的說話時段的重合率,以及所述非坐席用戶的聲紋與所述客戶的聲紋之間的相似度,確定所述坐席錄音數(shù)據(jù)中是否串入所述客戶的音頻數(shù)據(jù)。
7、第二方面,本申請實施例提供了一種數(shù)據(jù)處理裝置,所述裝置包括:
8、獲取單元,用于獲取坐席錄音數(shù)據(jù);所述坐席錄音數(shù)據(jù)是指當坐席用戶與客戶在溝通時,所述坐席用戶的說話時段的音頻數(shù)據(jù);
9、確定單元,用于若所述坐席錄音數(shù)據(jù)對應(yīng)于至少兩個說話人且所述至少兩個說話人包括所述坐席用戶和非坐席用戶,則確定所述非坐席用戶在所述坐席錄音數(shù)據(jù)中對應(yīng)的目標時間段;
10、所述獲取單元,還用于獲取客戶錄音數(shù)據(jù);所述客戶錄音數(shù)據(jù)是指當所述坐席用戶與所述客戶在溝通時,所述客戶的說話時段的音頻數(shù)據(jù);
11、所述確定單元,還用于根據(jù)所述目標時間段與所述客戶的說話時段的重合率,以及所述非坐席用戶的聲紋與所述客戶的聲紋之間的相似度,確定所述坐席錄音數(shù)據(jù)中是否串入所述客戶的音頻數(shù)據(jù)。
12、第三方面,本申請實施例提供了一種電子設(shè)備,包括:處理器;以及,被配置為存儲計算機可執(zhí)行指令的存儲器,所述計算機可執(zhí)行指令在被執(zhí)行時使所述處理器執(zhí)行如第一方面所述的數(shù)據(jù)處理方法。
13、第四方面,本申請實施例提供了一種計算機可讀存儲介質(zhì),用于存儲計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器執(zhí)行時實現(xiàn)如第一方面所述的數(shù)據(jù)處理方法。
14、可以看出,在本申請實施例中,首先,獲取坐席錄音數(shù)據(jù);坐席錄音數(shù)據(jù)是指當坐席用戶與客戶在溝通時,坐席用戶的說話時段的音頻數(shù)據(jù);若坐席錄音數(shù)據(jù)對應(yīng)于至少兩個說話人且至少兩個說話人包括坐席用戶和非坐席用戶,則確定非坐席用戶在坐席錄音數(shù)據(jù)中對應(yīng)的目標時間段;接著,獲取客戶錄音數(shù)據(jù);客戶錄音數(shù)據(jù)是指當坐席用戶與客戶在溝通時,客戶的說話時段的音頻數(shù)據(jù);最后,根據(jù)目標時間段與客戶的說話時段的重合率,以及非坐席用戶的聲紋與客戶的聲紋之間的相似度,確定坐席錄音數(shù)據(jù)中是否串入客戶的音頻數(shù)據(jù)。以此,在確定坐席錄音數(shù)據(jù)對應(yīng)于至少兩個說話人的情況下,可以確定坐席錄音數(shù)據(jù)中混有雜音,該雜音可能來源于客戶,也可能來源于位于坐席用戶旁邊的其他坐席用戶,不同的雜音來源可能是由不同的異常導(dǎo)致的,準確地識別雜音來源有利于后續(xù)運維,另外,將坐席錄音數(shù)據(jù)與客戶錄音數(shù)據(jù)分離存儲的目的包括對坐席錄音數(shù)據(jù)進行質(zhì)檢以監(jiān)督坐席用戶的服務(wù)質(zhì)量,考慮到客戶被誤判為坐席用戶的情況下更可能影響坐席用戶的坐席錄音數(shù)據(jù)的質(zhì)檢結(jié)果,因此,確定該雜音是否來自客戶的重要性較高,通過發(fā)出該雜音的非坐席用戶在坐席錄音數(shù)據(jù)中對應(yīng)的目標時間段與客戶的說話時段的重合率、以及非坐席用戶的聲紋與客戶的聲紋之間的相似度,可以從多個維度共同確定坐席錄音數(shù)據(jù)中是否串入客戶的錄音數(shù)據(jù),提高了雜音來源的識別準確性。
1.一種數(shù)據(jù)處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取坐席錄音數(shù)據(jù)之后,所述確定所述非坐席用戶在所述坐席錄音數(shù)據(jù)中對應(yīng)的目標時間段之前,還包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標時間段與所述客戶的說話時段的重合率,以及所述非坐席用戶的聲紋與所述客戶的聲紋之間的相似度,確定所述坐席錄音數(shù)據(jù)中是否串入所述客戶的音頻數(shù)據(jù),包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述目標時間段與所述客戶的說話時段的重合率,以及所述非坐席用戶的聲紋與所述客戶的聲紋之間的相似度,確定所述坐席錄音數(shù)據(jù)中是否串入所述客戶的音頻數(shù)據(jù)之前,還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取坐席錄音數(shù)據(jù)之前,還包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種數(shù)據(jù)處理裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述設(shè)備包括:
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)用于存儲計算機可執(zhí)行指令,所述計算機可執(zhí)行指令在被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1-7任一項所述的數(shù)據(jù)處理方法。