本申請涉及語音識別,尤其涉及一種數(shù)據(jù)提取方法、裝置及電子設(shè)備。
背景技術(shù):
1、目前,語音分離技術(shù)針對不同分離難易程度的語音,都是采用同一個識別模型對混合音頻進行多次降采樣和升采樣的方式來完成目標(biāo)說話人的語音分離。但這種方式進行語音分離需要耗費較多的資源,如何能夠降低語音分離過程中不必要的資源耗費是本領(lǐng)域技術(shù)人員需要解決的技術(shù)問題。
技術(shù)實現(xiàn)思路
1、有鑒于此,本申請實施例提供了一種數(shù)據(jù)提取方法、裝置及電子設(shè)備。
2、根據(jù)本申請第一方面,本申請實施例提供了一種數(shù)據(jù)提取方法,包括:
3、獲得待提取聲音數(shù)據(jù)以及參考聲音數(shù)據(jù);基于第一識別模型提取待提取聲音數(shù)據(jù)中與參考聲音數(shù)據(jù)對應(yīng)的第一聲音特征,及其他聲音特征,以及確定第一聲音特征對應(yīng)的目標(biāo)信息;其他聲音特征為待提取聲音數(shù)據(jù)中除第一聲音特征之外的聲音特征;若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)匹配,基于第一聲音特征,形成目標(biāo)聲音數(shù)據(jù);
4、若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)不匹配,基于第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征;基于第二聲音特征,形成目標(biāo)聲音數(shù)據(jù);其中,第二識別模型工作時占用的資源,高于第一識別模型工作時占用的資源。
5、可選地,數(shù)據(jù)提取方法包括:
6、若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)中包含的聲音特征的相似度大于或等于第一預(yù)設(shè)閾值,確定目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)匹配;
7、若目標(biāo)信息表征第一聲音數(shù)據(jù)與參考聲音數(shù)據(jù)中包含的聲音特征的相似度小于第一預(yù)設(shè)閾值,確定目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)不匹配。
8、可選地,數(shù)據(jù)提取方法包括:
9、若目標(biāo)信息表征第一聲音特征與其他聲音特征的差異度大于或等于第二預(yù)設(shè)閾值,確定目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)匹配;
10、若目標(biāo)信息表征第一聲音特征與其他聲音特征的差異度小于第二預(yù)設(shè)閾值,確定目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)不匹配。
11、可選地,基于第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征,包括:
12、基于第二識別模型確定與參考聲音數(shù)據(jù)對應(yīng)的第三聲音特征,其中第三聲音特征為與參考聲音數(shù)據(jù)中包含的聲音特征滿足相似度條件的聲音特征,且第三聲音特征對應(yīng)的聲音數(shù)據(jù)的語音時長大于參考聲音數(shù)據(jù)對應(yīng)的語音時長;
13、基于第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與第三聲音特征對應(yīng)的聲音特征,得到第一聲音特征中與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征。
14、可選地,基于第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征,包括:
15、在第二識別模型對第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征進行處理的至少一部分處理時刻,以上一處理時刻提取到的聲音特征為參考聲音特征,采用第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中的聲音特征;
16、基于每個處理時刻提取到的聲音特征,形成第一聲音特征或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征。
17、可選地,基于第二識別模型確定與參考聲音數(shù)據(jù)對應(yīng)的第三聲音特征,包括:
18、基于第二識別模型確定參考聲音數(shù)據(jù)中包含的聲音特征;
19、基于第二識別模型確定與參考聲音數(shù)據(jù)中包含的聲音特征滿足相似度條件的第三聲音特征。
20、可選地,基于第二識別模型確定與參考聲音數(shù)據(jù)中包含的聲音特征滿足相似度條件的第三聲音特征,包括:
21、從第二識別模型中查找與參考聲音數(shù)據(jù)中包含的聲音特征滿足相似度條件的第三聲音特征。
22、可選地,第二識別模型工作時的能耗,高于第一識別模型工作時的能耗。
23、根據(jù)本申請第二方面,本申請實施例提供了一種電子設(shè)備,包括:
24、第一編碼器,第二編碼器以及處理器;
25、第一編碼器用于獲得待提取聲音數(shù)據(jù)以及參考聲音數(shù)據(jù);提取待提取聲音數(shù)據(jù)中與參考聲音數(shù)據(jù)對應(yīng)的第一聲音特征,及其他聲音特征,以及確定第一聲音特征對應(yīng)的目標(biāo)信息;其他聲音特征為待提取聲音數(shù)據(jù)中除第一聲音特征之外的聲音特征;
26、處理器用于若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)匹配,基于第一聲音特征,形成目標(biāo)聲音數(shù)據(jù);若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)不匹配,基于第二編碼器提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征;基于第二聲音特征,形成目標(biāo)聲音數(shù)據(jù);
27、其中,第二編碼器工作時占用的資源,高于第一編碼器工作時占用的資源。
28、根據(jù)本申請第三方面,本申請實施例提供了一種數(shù)據(jù)提取裝置,包括:
29、獲得模塊,用于獲得待提取聲音數(shù)據(jù)以及參考聲音數(shù)據(jù);
30、第一提取模塊,用于基于第一識別模型提取待提取聲音數(shù)據(jù)中與參考聲音數(shù)據(jù)對應(yīng)的第一聲音特征,及其他聲音特征,以及確定第一聲音特征對應(yīng)的目標(biāo)信息;其他聲音特征為待提取聲音數(shù)據(jù)中除第一聲音特征之外的聲音特征;
31、形成模塊,用于若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)匹配,基于第一聲音特征,形成目標(biāo)聲音數(shù)據(jù);
32、第二提取模塊,用于若目標(biāo)信息表征第一聲音特征與參考聲音數(shù)據(jù)不匹配,基于第二識別模型提取第一聲音特征或待提取聲音數(shù)據(jù)或第一聲音特征與其他聲音特征組合的聲音特征中,與參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征;基于第二聲音特征,形成目標(biāo)聲音數(shù)據(jù);其中,第二識別模型工作時占用的資源,高于第一識別模型工作時占用的資源。
33、本公開實施例的另一個方面提供了一種電子設(shè)備,包括:一個或多個處理器;存儲器,用于存儲一個或多個程序,其中,當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行時,使得一個或多個處理器執(zhí)行上述數(shù)據(jù)提取方法。
34、本公開實施例的另一個方面還提供了一種計算機可讀存儲介質(zhì),其上存儲有可執(zhí)行指令,該指令被處理器執(zhí)行時使處理器執(zhí)行上述音頻信息識別方法。
35、本公開實施例的另一個方面還提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上述數(shù)據(jù)提取方法。
36、上述說明僅是本申請技術(shù)方案的概述,為了能夠更清楚了解本申請的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本申請的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本申請的具體實施方式。
1.一種數(shù)據(jù)提取方法,包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)提取方法,所述方法包括:
3.根據(jù)權(quán)利要求1所述的數(shù)據(jù)提取方法,所述方法包括:
4.根據(jù)權(quán)利要求1所述的數(shù)據(jù)提取方法,基于第二識別模型提取所述第一聲音特征或所述待提取聲音數(shù)據(jù)或所述第一聲音特征與所述其他聲音特征組合的聲音特征中,與所述參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征,包括:
5.根據(jù)權(quán)利要求1-4任一項所述的數(shù)據(jù)提取方法,基于第二識別模型提取所述第一聲音特征或所述待提取聲音數(shù)據(jù)或所述第一聲音特征與所述其他聲音特征組合的聲音特征中,與所述參考聲音數(shù)據(jù)對應(yīng)的第二聲音特征,包括:
6.根據(jù)權(quán)利要求4所述的數(shù)據(jù)提取方法,基于第二識別模型確定與所述參考聲音數(shù)據(jù)對應(yīng)的第三聲音特征,包括:
7.根據(jù)權(quán)利要求6所述的數(shù)據(jù)提取方法,基于第二識別模型確定與所述參考聲音數(shù)據(jù)中包含的聲音特征滿足相似度條件的第三聲音特征,包括:
8.根據(jù)權(quán)利要求1所述的數(shù)據(jù)提取方法,
9.一種電子設(shè)備,包括:
10.一種數(shù)據(jù)提取裝置,包括: