欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

建立聲紋模型的方法和裝置與流程

文檔序號:12475970閱讀:868來源:國知局
建立聲紋模型的方法和裝置與流程

本發(fā)明涉及身份識別技術(shù)領(lǐng)域,尤其涉及一種建立聲紋模型的方法和裝置。



背景技術(shù):

隨著科學(xué)技術(shù)的發(fā)展,現(xiàn)在很多銀行業(yè)務(wù)都可以不去銀行柜臺辦理,比如銀行卡查詢業(yè)務(wù),凍結(jié)業(yè)務(wù),開戶業(yè)務(wù)等,用戶可直接通過電話或者在互聯(lián)網(wǎng)上辦理各項業(yè)務(wù)。但是,現(xiàn)有的通過電話或者在互聯(lián)網(wǎng)上辦理各項業(yè)務(wù),都需要輸入銀行卡賬號和密碼,如果銀行卡賬號輸入錯誤或者密碼輸入錯誤,則需要重新輸入。而且,當(dāng)用戶輸入3次密碼都錯誤時,銀行卡將會被鎖定,用戶則不可以再辦理相應(yīng)的業(yè)務(wù),直至用戶去銀行柜臺解鎖銀行卡。因此,現(xiàn)有的解決方案只能通過人臉識別來確認(rèn)用戶的身份。

上述內(nèi)容僅用于輔助理解本發(fā)明的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的在于提供一種建立聲紋模型的方法和裝置,旨在解決如何在人臉識別的基礎(chǔ)上提高識別用戶準(zhǔn)確率的技術(shù)問題。

為實現(xiàn)上述目的,本發(fā)明提供的一種建立聲紋模型的方法,所述建立聲紋模型的方法包括:

當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;

輸出提示信息,以提示審核人員審核所述人臉視頻;

當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型的步驟包括:

當(dāng)接收到所述人臉視頻審核通過的通知消息時,判斷是否已存在聲紋模型;

若未存在聲紋模型,則根據(jù)所述第一音頻文件建立聲紋模型;

若已存在聲紋模型,則刪除已存在的聲紋模型,提取所存儲的第二音頻文件,其中,所述第二音頻文件為注冊成功的音頻文件;

根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型。

優(yōu)選地,所述提取所存儲的第二音頻文件的步驟包括:

判斷是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件;

若存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則所述根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型的步驟包括:

根據(jù)最近所存儲預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述判斷是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件的步驟之后,還包括:

若未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則獲取所存儲的所有所述第二音頻文件;

所述根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型的步驟包括:

根據(jù)所獲取的所有所述第二音頻文件和所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件的步驟之后,還包括:

判斷是否已存在聲紋模型;

若未存在聲紋模型,則執(zhí)行輸出提示信息,以提示審核人員審核所述人臉視頻的步驟;

若已存在聲紋模型,則提取與所述聲紋模型對應(yīng)的音頻文件,記為第三音頻文件;

將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度;

將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng),并執(zhí)行輸出提示信息,以提示審核人員審核所述人臉視頻的步驟。

此外,為實現(xiàn)上述目的,本發(fā)明還提供一種建立聲紋模型的裝置,所述建立聲紋模型的裝置包括:

提取模塊,用于當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;

輸出模塊,用于輸出提示信息,以提示審核人員審核所述人臉視頻;

建立模塊,用于當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述建立模塊包括:

判斷單元,用于當(dāng)接收到所述人臉視頻審核通過的通知消息時,判斷是否已存在聲紋模型;

建立單元,用于若未存在聲紋模型,則根據(jù)所述第一音頻文件建立聲紋模型;

提取單元,用于若已存在聲紋模型,則刪除已存在的聲紋模型,提取所存儲的第二音頻文件,其中,所述第二音頻文件為注冊成功的音頻文件;

所述建立單元還用于根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型。

優(yōu)選地,所述判斷單元還用于判斷是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件;

所述建立單元還用于若存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則根據(jù)最近所存儲預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述建立模塊還包括:

獲取單元,用于若未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則獲取所存儲的所有所述第二音頻文件;

所述建立單元還用于根據(jù)所獲取的所有所述第二音頻文件和所述第一音頻文件建立聲紋模型。

優(yōu)選地,所述建立聲紋模型的裝置還包括:

判斷模塊,用于判斷是否已存在聲紋模型;

所述輸出模塊還用于若未存在聲紋模型,則輸出提示信息,以提示審核人員審核所述人臉視頻;

所述提取模塊還用于若已存在聲紋模型,則提取與所述聲紋模型對應(yīng)的音頻文件,記為第三音頻文件;

所述建立聲紋模型的裝置還包括:

對比模塊,用于將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度;

發(fā)送模塊,用于將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng)。

本發(fā)明通過當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;輸出提示信息,以提示審核人員審核所述人臉視頻;當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。實現(xiàn)了在人臉識別的基礎(chǔ)上,進(jìn)一步獲取用戶的音頻文件,根據(jù)所獲取的音頻文件建立聲紋模型,當(dāng)下次接收到用戶的人臉視頻時,只有當(dāng)人臉視頻中的人臉圖像識別成功,且人臉視頻中的音頻文件與所建立的聲紋模型吻合時,確認(rèn)用戶為真實的用戶,以提高用戶識別的準(zhǔn)確性。

附圖說明

圖1為本發(fā)明建立聲紋模型的方法的第一實施例的流程示意圖;

圖2為本發(fā)明建立聲紋模型的方法的第二實施例的流程示意圖;

圖3為本發(fā)明建立聲紋模型的裝置的第一實施例的功能模塊示意圖;

圖4為本發(fā)明建立聲紋模型的裝置的第二實施例的功能模塊示意圖。

本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進(jìn)一步說明。

具體實施方式

應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

參照圖1,圖1為本發(fā)明建立聲紋模型的方法的第一實施例的流程示意圖。

在本實施例中,所述建立聲紋模型的方法包括:

步驟S10,當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;

當(dāng)用戶需要通過電話或者互聯(lián)網(wǎng)辦理銀行業(yè)務(wù)時,銀行所在的服務(wù)器提示用戶所持的移動終端調(diào)用攝像頭獲取用戶的人臉視頻,其中,所述人臉視頻中包括用戶的人臉圖像和音頻文件。需要說明的是,所述服務(wù)器獲取所述人臉視頻的方法可為:在提取用戶人臉圖像過程中,使所述移動終端的屏幕中顯示相應(yīng)的數(shù)字或者文字,讓用戶在一定的時間內(nèi)讀出所顯示的數(shù)字或者文字;或者在提取用戶人臉圖像過程中,使所述移動終端的屏幕中輸出提示信息,提示用戶在一定的時間內(nèi)讀出預(yù)定數(shù)目的話語。所述移動終端包括但不限于智能手機(jī)和平板電腦。

當(dāng)獲取到所述人臉視頻時,所述服務(wù)器提取所述人臉視頻中的人臉圖像,將所提取的人臉圖像與預(yù)先存儲該用戶的人臉圖像進(jìn)行對比,其中,將預(yù)先存儲的用戶的人臉圖像記為預(yù)存人臉圖像。當(dāng)所述人臉圖像與預(yù)存人臉圖像之間的相似度大于或者等于預(yù)設(shè)相似度時,所述服務(wù)器確認(rèn)所述人臉圖像識別成功;當(dāng)所述人臉圖像與預(yù)存人臉圖像之間的相似度小于所述預(yù)設(shè)相似度時,所述服務(wù)器確認(rèn)所述人臉圖像識別失敗。所述預(yù)設(shè)相似度可根據(jù)具體需要而設(shè)置,如可設(shè)置為60%,70%,或者80%等。

當(dāng)成功識別所述人臉圖像時,所述服務(wù)器提取所述人臉視頻中的音頻文件,并將從所述人臉視頻中所提取的音頻文件記為第一音頻文件。

步驟S20,輸出提示信息,以提示審核人員審核所述人臉視頻;

當(dāng)?shù)玫剿龅谝灰纛l文件時,所述服務(wù)器輸出提示信息至異步審核系統(tǒng),以提示異步審核工作人員審核所述人臉視頻的真實性。需要說明的是,當(dāng)所述審核工作人員在審核所述人臉視頻的真實性的過程中,所述審核工作人員可將所述人臉視頻中的人臉圖像與預(yù)先存儲的人臉圖像進(jìn)行對比。其中,預(yù)先存儲的所述人臉圖像可為一幅,也可為多幅。當(dāng)所述審核工作人員確認(rèn)所述人臉視頻中的人臉圖像是真實的,是用戶本人時,所述審核工作人員通過所述異步審核系統(tǒng)返回審核通過的通知消息給所述服務(wù)器;當(dāng)所述審核工作人員確認(rèn)所述人臉視頻中的人臉圖像不是用戶本人時,所述審核工作人員通過所述異步審核系統(tǒng)返回審核失敗的通知消息給所述服務(wù)器。

當(dāng)所述服務(wù)器接收到所述異步審核系統(tǒng)所發(fā)送的通知消息,根據(jù)所述通知消息確定所述人臉視頻審核失敗時,所述服務(wù)器結(jié)束聲紋模型的建立流程。

在本實施例中,所述服務(wù)器先在所述人臉視頻中提取音頻文件,然后才輸出提示信息。在其它實施例中,所述服務(wù)器也可以先輸出提示信息,當(dāng)所述人臉視頻審核通過后,所述服務(wù)器再從所述人臉視頻中提取人臉圖像。

步驟S30,當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。

當(dāng)所述服務(wù)器接收到所述異步審核系統(tǒng)所發(fā)送的人臉視頻審核通過的通知消息時,所述服務(wù)器根據(jù)從所述人臉視頻中提取的第一音頻文件建立聲紋模型。

進(jìn)一步地,所述步驟S30包括:

步驟a,當(dāng)接收到所述人臉視頻審核通過的通知消息時,判斷是否已存在聲紋模型;

步驟b,若未存在聲紋模型,則根據(jù)所述第一音頻文件建立聲紋模型;

步驟c,若已存在聲紋模型,則刪除已存在的聲紋模型,提取所存儲的第二音頻文件,其中,所述第二音頻文件為注冊成功的音頻文件;

步驟d,根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型。

進(jìn)一步地,當(dāng)所述服務(wù)器接收到所述人臉視頻審核通過的通知消息時,所述服務(wù)器判斷數(shù)據(jù)庫中是否已存在聲紋模型。當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,所述服務(wù)器根據(jù)所述第一音頻文件建立聲紋模型。當(dāng)所述數(shù)據(jù)庫中已存在聲紋模型時,所述服務(wù)器刪除所述數(shù)據(jù)庫中的聲紋模型。當(dāng)所述服務(wù)器刪除所述數(shù)據(jù)庫中的聲紋模型后,所述服務(wù)器在所述數(shù)據(jù)庫中提取所存儲的第二音頻文件,其中,所述第二音頻文件為所述數(shù)據(jù)庫中注冊成功的音頻文件。需要說明的是,注冊成功的音頻文件是已建立過聲紋模型的音頻文件,即注冊成功的音頻文件是所刪除的歷史聲紋模型所對應(yīng)的音頻文件。當(dāng)所述服務(wù)器得到所述第二音頻文件時,所述服務(wù)器將所述第一音頻文件和所述第二音頻文件進(jìn)行疊加,得到聲紋模型。通過所述第一音頻文件和所述第二音頻進(jìn)行疊加得到聲紋模型,優(yōu)化所述服務(wù)器中的聲紋模型,使所建立的聲紋模型更符合用戶的聲音特征。

進(jìn)一步地,所述提取所存儲的第二音頻文件的步驟包括:

步驟e,判斷是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件;

若存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則所述步驟d包括:

步驟f,根據(jù)最近所存儲預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件建立聲紋模型。

進(jìn)一步地,所述服務(wù)器在提取所存儲的第二音頻文件的過程中,所述服務(wù)器判斷所述數(shù)據(jù)庫中是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件。所述預(yù)設(shè)數(shù)目可根據(jù)具體需要而設(shè)置,如可設(shè)置為3,5或者6等。當(dāng)所述數(shù)據(jù)庫中存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件時,所述服務(wù)器將最近所存儲的預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立聲紋模型。如當(dāng)所述預(yù)設(shè)數(shù)目設(shè)置為5時,且數(shù)據(jù)中存儲有至少5個所述第二音頻文件時,所述服務(wù)器將從當(dāng)前時間起算,提取最近5次所存儲的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立所述聲紋模型。

進(jìn)一步地,所述建立聲紋模型的方法還包括

步驟g,若未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則獲取所存儲的所有所述第二音頻文件;

所述步驟d包括:

步驟h,根據(jù)所獲取的所有所述第二音頻文件和所述第一音頻文件建立聲紋模型。

當(dāng)所述數(shù)據(jù)庫中未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件時,所述服務(wù)器獲取所述數(shù)據(jù)庫中存儲的所有的第二音頻文件,將所獲取的所有的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立聲紋模型。如當(dāng)所述數(shù)據(jù)庫中只存儲有三個所述第二音頻文件時,所述服務(wù)器則將三個第二音頻文件和所述第一音頻文件進(jìn)行疊加,建議聲紋模型。

本實施例通過當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;輸出提示信息,以提示審核人員審核所述人臉視頻;當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。實現(xiàn)了在人臉識別的基礎(chǔ)上,進(jìn)一步獲取用戶的音頻文件,根據(jù)所獲取的音頻文件建立聲紋模型,當(dāng)下次接收到用戶的人臉視頻時,只有當(dāng)人臉視頻中的人臉圖像識別成功,且人臉視頻中的音頻文件與所建立的聲紋模型吻合時,確認(rèn)用戶為真實的用戶,以提高用戶識別的準(zhǔn)確性。

進(jìn)一步地,參照圖2,圖2為本發(fā)明建立聲紋模型的方法的第二實施例的流程示意圖,基于第一實施例提出本發(fā)明建立聲紋模型的方法的第二實施例。

在本實施例中,所述建立聲紋模型的方法還包括:

步驟S40,判斷是否已存在聲紋模型;

若未存在聲紋模型,則執(zhí)行步驟S20;

步驟S50,若已存在聲紋模型,則提取與所述聲紋模型對應(yīng)的音頻文件,記為第三音頻文件;

步驟S60,將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度;

步驟S70,將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng)。

在本實施例中,當(dāng)執(zhí)行完步驟S70,執(zhí)行步驟S20。

當(dāng)所述服務(wù)器從所述人臉視頻中提取到所述人臉圖像時,所述服務(wù)器判斷所述數(shù)據(jù)庫中是否已存在聲紋模型。當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,所述服務(wù)器輸出提示信息至異步審核系統(tǒng),以供所述異步審核系統(tǒng)提示審核人員審核所述人臉視頻??梢岳斫獾氖?,當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,表示所述服務(wù)器第一次獲取到用戶的人臉視頻。需要說明的是,所述服務(wù)器和所述異步審核系統(tǒng)可同處于一臺計算機(jī)中,也可以處于兩臺計算機(jī)中。

當(dāng)所述數(shù)據(jù)庫中已存在聲紋模型時,所述服務(wù)器提取與所述聲紋模型對應(yīng)的音頻文件,即提取建立所述聲紋模型的音頻文件,記為第三音頻文件。當(dāng)?shù)玫剿龅谌纛l文件時,所述服務(wù)器將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度。將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng),所述服務(wù)器輸出提示信息至所述異步審核系統(tǒng),以供所述異步審核系統(tǒng)提示審核人員審核所述人臉視頻;當(dāng)所述異步審核結(jié)果通過時,所述服務(wù)器則建立聲紋模型,當(dāng)所述異步審核結(jié)果不通過時,所述服務(wù)器則結(jié)束建立聲紋模型的流程。所述預(yù)設(shè)閾值可根據(jù)具體需要而設(shè)置,如可設(shè)置為60%,70%,或者85%等。

本實施例通過在提取到所述人臉視頻中的第一音頻文件,且服務(wù)器的數(shù)據(jù)庫中已存在聲紋模型時,提取與所述聲紋模型對應(yīng)的第三音頻文件,將所述第三音頻文件與所述第一音頻文件進(jìn)行對比,根據(jù)對比結(jié)果進(jìn)行后續(xù)操作。提高了所建立的聲紋模型的準(zhǔn)確率,使所建立的聲紋模型更符合用戶真實的聲音特征。

本發(fā)明進(jìn)一步提供一種建立聲紋模型的裝置。

參照圖3,圖3為本發(fā)明建立聲紋模型的裝置的第一實施例的功能模塊示意圖。

在本實施例中,所述建立聲紋模型的裝置包括:

提取模塊10,用于當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;

當(dāng)用戶需要通過電話或者互聯(lián)網(wǎng)辦理銀行業(yè)務(wù)時,銀行所在的服務(wù)器提示用戶所持的移動終端調(diào)用攝像頭獲取用戶的人臉視頻,其中,所述人臉視頻中包括用戶的人臉圖像和音頻文件。需要說明的是,所述服務(wù)器獲取所述人臉視頻的方法可為:在提取用戶人臉圖像過程中,使所述移動終端的屏幕中顯示相應(yīng)的數(shù)字或者文字,讓用戶在一定的時間內(nèi)讀出所顯示的數(shù)字或者文字;或者在提取用戶人臉圖像過程中,使所述移動終端的屏幕中輸出提示信息,提示用戶在一定的時間內(nèi)讀出預(yù)定數(shù)目的話語。所述移動終端包括但不限于智能手機(jī)和平板電腦。

當(dāng)獲取到所述人臉視頻時,所述服務(wù)器提取所述人臉視頻中的人臉圖像,將所提取的人臉圖像與預(yù)先存儲該用戶的人臉圖像進(jìn)行對比,其中,將預(yù)先存儲的用戶的人臉圖像記為預(yù)存人臉圖像。當(dāng)所述人臉圖像與預(yù)存人臉圖像之間的相似度大于或者等于預(yù)設(shè)相似度時,所述服務(wù)器確認(rèn)所述人臉圖像識別成功;當(dāng)所述人臉圖像與預(yù)存人臉圖像之間的相似度小于所述預(yù)設(shè)相似度時,所述服務(wù)器確認(rèn)所述人臉圖像識別失敗。所述預(yù)設(shè)相似度可根據(jù)具體需要而設(shè)置,如可設(shè)置為60%,70%,或者80%等。

當(dāng)成功識別所述人臉圖像時,所述服務(wù)器提取所述人臉視頻中的音頻文件,并將從所述人臉視頻中所提取的音頻文件記為第一音頻文件。

輸出模塊20,用于輸出提示信息,以提示審核人員審核所述人臉視頻;

當(dāng)?shù)玫剿龅谝灰纛l文件時,所述服務(wù)器輸出提示信息至異步審核系統(tǒng),以提示異步審核工作人員審核所述人臉視頻的真實性。需要說明的是,當(dāng)所述審核工作人員在審核所述人臉視頻的真實性的過程中,所述審核工作人員可將所述人臉視頻中的人臉圖像與預(yù)先存儲的人臉圖像進(jìn)行對比。其中,預(yù)先存儲的所述人臉圖像可為一幅,也可為多幅。當(dāng)所述審核工作人員確認(rèn)所述人臉視頻中的人臉圖像是真實的,是用戶本人時,所述審核工作人員通過所述異步審核系統(tǒng)返回審核通過的通知消息給所述服務(wù)器;當(dāng)所述審核工作人員確認(rèn)所述人臉視頻中的人臉圖像不是用戶本人時,所述審核工作人員通過所述異步審核系統(tǒng)返回審核失敗的通知消息給所述服務(wù)器。

當(dāng)所述服務(wù)器接收到所述異步審核系統(tǒng)所發(fā)送的通知消息,根據(jù)所述通知消息確定所述人臉視頻審核失敗時,所述服務(wù)器結(jié)束聲紋模型的建立流程。

在本實施例中,所述服務(wù)器先在所述人臉視頻中提取音頻文件,然后才輸出提示信息。在其它實施例中,所述服務(wù)器也可以先輸出提示信息,當(dāng)所述人臉視頻審核通過后,所述服務(wù)器再從所述人臉視頻中提取人臉圖像。

建立模塊30,用于當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。

當(dāng)所述服務(wù)器接收到所述異步審核系統(tǒng)所發(fā)送的人臉視頻審核通過的通知消息時,所述服務(wù)器根據(jù)從所述人臉視頻中提取的第一音頻文件建立聲紋模型。

進(jìn)一步地,所述建立模塊30包括:

判斷單元,用于當(dāng)接收到所述人臉視頻審核通過的通知消息時,判斷是否已存在聲紋模型;

建立單元,用于若未存在聲紋模型,則根據(jù)所述第一音頻文件建立聲紋模型;

提取單元,用于若已存在聲紋模型,則刪除已存在的聲紋模型,提取所存儲的第二音頻文件,其中,所述第二音頻文件為注冊成功的音頻文件;

所述建立單元還用于根據(jù)所述第一音頻文件和所述第二音頻文件建立聲紋模型。

進(jìn)一步地,當(dāng)所述服務(wù)器接收到所述人臉視頻審核通過的通知消息時,所述服務(wù)器判斷數(shù)據(jù)庫中是否已存在聲紋模型。當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,所述服務(wù)器根據(jù)所述第一音頻文件建立聲紋模型。當(dāng)所述數(shù)據(jù)庫中已存在聲紋模型時,所述服務(wù)器刪除所述數(shù)據(jù)庫中的聲紋模型。當(dāng)所述服務(wù)器刪除所述數(shù)據(jù)庫中的聲紋模型后,所述服務(wù)器在所述數(shù)據(jù)庫中提取所存儲的第二音頻文件,其中,所述第二音頻文件為所述數(shù)據(jù)庫中注冊成功的音頻文件。需要說明的是,注冊成功的音頻文件是已建立過聲紋模型的音頻文件,即注冊成功的音頻文件是所刪除的歷史聲紋模型所對應(yīng)的音頻文件。當(dāng)所述服務(wù)器得到所述第二音頻文件時,所述服務(wù)器將所述第一音頻文件和所述第二音頻文件進(jìn)行疊加,得到聲紋模型。通過所述第一音頻文件和所述第二音頻進(jìn)行疊加得到聲紋模型,優(yōu)化所述服務(wù)器中的聲紋模型,使所建立的聲紋模型更符合用戶的聲音特征。

進(jìn)一步地,所述判斷單元還用于判斷是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件;

所述建立單元還用于若存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則根據(jù)最近所存儲預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件建立聲紋模型。

進(jìn)一步地,所述服務(wù)器在提取所存儲的第二音頻文件的過程中,所述服務(wù)器判斷所述數(shù)據(jù)庫中是否存儲有預(yù)設(shè)數(shù)目的所述第二音頻文件。所述預(yù)設(shè)數(shù)目可根據(jù)具體需要而設(shè)置,如可設(shè)置為3,5或者6等。當(dāng)所述數(shù)據(jù)庫中存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件時,所述服務(wù)器將最近所存儲的預(yù)設(shè)數(shù)目的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立聲紋模型。如當(dāng)所述預(yù)設(shè)數(shù)目設(shè)置為5時,且數(shù)據(jù)中存儲有至少5個所述第二音頻文件時,所述服務(wù)器將從當(dāng)前時間起算,提取最近5次所存儲的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立所述聲紋模型。

進(jìn)一步地,所述建立模塊30還包括:

獲取單元,用于若未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件,則獲取所存儲的所有所述第二音頻文件;

所述建立單元還用于根據(jù)所獲取的所有所述第二音頻文件和所述第一音頻文件建立聲紋模型。

當(dāng)所述數(shù)據(jù)庫中未存儲有所述預(yù)設(shè)數(shù)目的所述第二音頻文件時,所述服務(wù)器獲取所述數(shù)據(jù)庫中存儲的所有的第二音頻文件,將所獲取的所有的所述第二音頻文件和所述第一音頻文件進(jìn)行疊加,建立聲紋模型。如當(dāng)所述數(shù)據(jù)庫中只存儲有三個所述第二音頻文件時,所述服務(wù)器則將三個第二音頻文件和所述第一音頻文件進(jìn)行疊加,建議聲紋模型。

本實施例通過當(dāng)獲取到人臉視頻,且成功識別所述人臉視頻的人臉圖像時,提取所述人臉視頻中的音頻文件,記為第一音頻文件;輸出提示信息,以提示審核人員審核所述人臉視頻;當(dāng)接收到所述人臉視頻審核通過的通知消息時,根據(jù)所述第一音頻文件建立聲紋模型。實現(xiàn)了在人臉識別的基礎(chǔ)上,進(jìn)一步獲取用戶的音頻文件,根據(jù)所獲取的音頻文件建立聲紋模型,當(dāng)下次接收到用戶的人臉視頻時,只有當(dāng)人臉視頻中的人臉圖像識別成功,且人臉視頻中的音頻文件與所建立的聲紋模型吻合時,確認(rèn)用戶為真實的用戶,以提高用戶識別的準(zhǔn)確性。

參照圖4,圖4為本發(fā)明建立聲紋模型的裝置的第二實施例的功能模塊示意圖,基于第一實施例提出本發(fā)明建立聲紋模型的裝置的第二實施例。

在本實施例中,所述建立聲紋模型的裝置還包括:

判斷模塊40,用于判斷是否已存在聲紋模型;

所述輸出模塊20還用于若未存在聲紋模型,則輸出提示信息,以提示審核人員審核所述人臉視頻;

所述提取模塊10還用于若已存在聲紋模型,則提取與所述聲紋模型對應(yīng)的音頻文件,記為第三音頻文件;

所述建立聲紋模型的裝置還包括:

對比模塊50,用于將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度;

發(fā)送模塊60,用于將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng)。

當(dāng)所述服務(wù)器從所述人臉視頻中提取到所述人臉圖像時,所述服務(wù)器判斷所述數(shù)據(jù)庫中是否已存在聲紋模型。當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,所述服務(wù)器輸出提示信息至異步審核系統(tǒng),以供所述異步審核系統(tǒng)提示審核人員審核所述人臉視頻。可以理解的是,當(dāng)所述數(shù)據(jù)庫中未存在聲紋模型時,表示所述服務(wù)器第一次獲取到用戶的人臉視頻。需要說明的是,所述服務(wù)器和所述異步審核系統(tǒng)可同處于一臺計算機(jī)中,也可以處于兩臺計算機(jī)中。

當(dāng)所述數(shù)據(jù)庫中已存在聲紋模型時,所述服務(wù)器提取與所述聲紋模型對應(yīng)的音頻文件,即提取建立所述聲紋模型的音頻文件,記為第三音頻文件。當(dāng)?shù)玫剿龅谌纛l文件時,所述服務(wù)器將所述第一音頻文件與所述第三音頻文件進(jìn)行對比,得到所述第一音頻文件與所述第三音頻文件之間的相似度。將所述第一音頻文件與所述第三音頻文件之間的相似度發(fā)送給異步審核系統(tǒng),所述服務(wù)器輸出提示信息至所述異步審核系統(tǒng),以供所述異步審核系統(tǒng)提示審核人員審核所述人臉視頻;當(dāng)所述異步審核結(jié)果通過時,所述服務(wù)器則建立聲紋模型,當(dāng)所述異步審核結(jié)果不通過時,所述服務(wù)器則結(jié)束建立聲紋模型的流程。所述預(yù)設(shè)閾值可根據(jù)具體需要而設(shè)置,如可設(shè)置為60%,70%,或者85%等。

本實施例通過在提取到所述人臉視頻中的第一音頻文件,且服務(wù)器的數(shù)據(jù)庫中已存在聲紋模型時,提取與所述聲紋模型對應(yīng)的第三音頻文件,將所述第三音頻文件與所述第一音頻文件進(jìn)行對比,根據(jù)對比結(jié)果進(jìn)行后續(xù)操作。提高了所建立的聲紋模型的準(zhǔn)確率,使所建立的聲紋模型更符合用戶真實的聲音特征。

上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在一個存儲介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺終端設(shè)備(可以是手機(jī),計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。

以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
辉南县| 通河县| 中阳县| 凤台县| 樟树市| 宝应县| 独山县| 赤城县| 辰溪县| 青岛市| 海盐县| 三门县| 左云县| 自治县| 满城县| 游戏| 无为县| 合肥市| 九台市| 巴楚县| 天镇县| 土默特右旗| 海原县| 新建县| 达日县| 应用必备| 尖扎县| 宜兰县| 新宁县| 仲巴县| 栾川县| 都兰县| 清河县| 寻甸| 莆田市| 突泉县| 崇仁县| 永登县| 张家界市| 钟山县| 宜兰县|