本文件涉及計(jì)算機(jī),尤其涉及一種語(yǔ)音的防偽攻擊檢測(cè)方法、裝置及設(shè)備。
背景技術(shù):
1、當(dāng)前,生成式人工智能(aigc,artificial?intelligence?generated?content)是一種人工智能技術(shù),它能夠自主地從數(shù)據(jù)中學(xué)習(xí)和生成新的內(nèi)容(包括圖像、聲音、文字等),因此,偽造聲音或合成語(yǔ)音在aigc時(shí)代也存在安全隱患。偽造聲音或合成語(yǔ)音可能帶來(lái)的潛在風(fēng)險(xiǎn)包括虛假信息傳播、歧視偏見、用戶隱私泄露、破壞社交信任等,為此,需要提供一種能夠有效規(guī)避上述潛在風(fēng)險(xiǎn)的語(yǔ)音防偽攻擊檢測(cè)方案,以保護(hù)個(gè)人隱私數(shù)據(jù)的安全,防止以偽造聲音或合成語(yǔ)音進(jìn)行的攻擊,并可以防止上述人工智能技術(shù)的濫用。
技術(shù)實(shí)現(xiàn)思路
1、本說(shuō)明書實(shí)施例的目的是提供一種能夠有效規(guī)避上述潛在風(fēng)險(xiǎn)的語(yǔ)音防偽攻擊檢測(cè)方案,以保護(hù)個(gè)人隱私數(shù)據(jù)的安全,防止以偽造聲音或合成語(yǔ)音進(jìn)行的攻擊,并可以防止上述人工智能技術(shù)的濫用。
2、為了實(shí)現(xiàn)上述技術(shù)方案,本說(shuō)明書實(shí)施例是這樣實(shí)現(xiàn)的:
3、本說(shuō)明書實(shí)施例提供的一種語(yǔ)音的防偽攻擊檢測(cè)方法,所述方法包括:獲取待檢測(cè)的語(yǔ)音數(shù)據(jù)。將所述語(yǔ)音數(shù)據(jù)輸入到語(yǔ)音防偽攻擊檢測(cè)模型中的由多個(gè)編碼塊串聯(lián)構(gòu)成的第一編碼子模型中,獲取每個(gè)編碼塊輸出的語(yǔ)音編碼信息?;谒龆鄠€(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果。
4、本說(shuō)明書實(shí)施例提供的一種語(yǔ)音的防偽攻擊檢測(cè)裝置,所述裝置包括:數(shù)據(jù)獲取模塊,獲取待檢測(cè)的語(yǔ)音數(shù)據(jù)。編碼模塊,將所述語(yǔ)音數(shù)據(jù)輸入到語(yǔ)音防偽攻擊檢測(cè)模型中的由多個(gè)編碼塊串聯(lián)構(gòu)成的第一編碼子模型中,獲取每個(gè)編碼塊輸出的語(yǔ)音編碼信息。防偽檢測(cè)模塊,基于所述多個(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果。
5、本說(shuō)明書實(shí)施例提供的一種語(yǔ)音的防偽攻擊檢測(cè)設(shè)備,所述語(yǔ)音的防偽攻擊檢測(cè)設(shè)備包括:處理器;以及被安排成存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令的存儲(chǔ)器,所述可執(zhí)行指令在被執(zhí)行時(shí)使所述處理器:獲取待檢測(cè)的語(yǔ)音數(shù)據(jù)。將所述語(yǔ)音數(shù)據(jù)輸入到語(yǔ)音防偽攻擊檢測(cè)模型中的由多個(gè)編碼塊串聯(lián)構(gòu)成的第一編碼子模型中,獲取每個(gè)編碼塊輸出的語(yǔ)音編碼信息?;谒龆鄠€(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果。
6、本說(shuō)明書實(shí)施例還提供了一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)用于存儲(chǔ)計(jì)算機(jī)可執(zhí)行指令,所述可執(zhí)行指令在被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下流程:獲取待檢測(cè)的語(yǔ)音數(shù)據(jù)。將所述語(yǔ)音數(shù)據(jù)輸入到語(yǔ)音防偽攻擊檢測(cè)模型中的由多個(gè)編碼塊串聯(lián)構(gòu)成的第一編碼子模型中,獲取每個(gè)編碼塊輸出的語(yǔ)音編碼信息?;谒龆鄠€(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果。
7、本說(shuō)明書實(shí)施例還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)以下流程:獲取待檢測(cè)的語(yǔ)音數(shù)據(jù)。將所述語(yǔ)音數(shù)據(jù)輸入到語(yǔ)音防偽攻擊檢測(cè)模型中的由多個(gè)編碼塊串聯(lián)構(gòu)成的第一編碼子模型中,獲取每個(gè)編碼塊輸出的語(yǔ)音編碼信息?;谒龆鄠€(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果。
1.一種語(yǔ)音的防偽攻擊檢測(cè)方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,所述多個(gè)編碼塊中每個(gè)編碼塊由transformer塊構(gòu)成,所述transformer塊包括注意力層和前饋神經(jīng)網(wǎng)絡(luò)層,所述語(yǔ)音處理子模型由多個(gè)解碼塊串聯(lián)構(gòu)成,所述多個(gè)解碼塊中每個(gè)解碼塊由transformer塊構(gòu)成。
3.根據(jù)權(quán)利要求2所述的方法,所述基于所述多個(gè)編碼塊中每個(gè)編碼塊輸出的語(yǔ)音編碼信息,通過(guò)所述語(yǔ)音識(shí)別模型中的語(yǔ)音處理子模型對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行防偽攻擊檢測(cè)處理,得到所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的檢測(cè)結(jié)果,包括:
4.根據(jù)權(quán)利要求3所述的方法,所述特征處理模塊是針對(duì)時(shí)間序列數(shù)據(jù)的特征處理模塊,所述與所述語(yǔ)音數(shù)據(jù)的防偽攻擊檢測(cè)的結(jié)果之間的關(guān)聯(lián)度高于預(yù)設(shè)關(guān)聯(lián)閾值的特征包括與所述語(yǔ)音數(shù)據(jù)的防偽攻擊檢測(cè)的結(jié)果之間的關(guān)聯(lián)度高于預(yù)設(shè)關(guān)聯(lián)閾值的時(shí)間特征;和/或,所述特征處理模塊是針對(duì)不同網(wǎng)絡(luò)層之間的數(shù)據(jù)的特征處理模塊,所述與所述語(yǔ)音數(shù)據(jù)的防偽攻擊檢測(cè)的結(jié)果之間的關(guān)聯(lián)度高于預(yù)設(shè)關(guān)聯(lián)閾值的特征包括與所述語(yǔ)音數(shù)據(jù)的防偽攻擊檢測(cè)的結(jié)果之間的關(guān)聯(lián)度高于預(yù)設(shè)關(guān)聯(lián)閾值的層級(jí)關(guān)聯(lián)特征。
5.根據(jù)權(quán)利要求3所述的方法,所述特征處理模塊包括多個(gè),多個(gè)所述特征處理模塊串聯(lián),每個(gè)所述特征處理模塊包括歸一化層、多頭自注意力層和多層感知機(jī)層。
6.根據(jù)權(quán)利要求4所述的方法,所述方法還包括:
7.根據(jù)權(quán)利要求6所述的方法,所述獲取語(yǔ)音數(shù)據(jù)樣本,包括:
8.根據(jù)權(quán)利要求1所述的方法,所述獲取待檢測(cè)的語(yǔ)音數(shù)據(jù),包括:
9.一種語(yǔ)音的防偽攻擊檢測(cè)裝置,所述裝置包括:
10.一種語(yǔ)音的防偽攻擊檢測(cè)設(shè)備,所述語(yǔ)音的防偽攻擊檢測(cè)設(shè)備包括: