本技術(shù)涉及計(jì)算機(jī),特別是涉及一種語(yǔ)音處理方法、計(jì)算機(jī)程序產(chǎn)品、設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù):
1、近年來(lái),深度學(xué)習(xí)模型在多個(gè)領(lǐng)域取得了顯著的應(yīng)用進(jìn)展,無(wú)論是圖像分類(lèi)、語(yǔ)音處理還是自然語(yǔ)言處理,深度學(xué)習(xí)技術(shù)推動(dòng)了人工智能的快速發(fā)展。然而,隨著模型規(guī)模和復(fù)雜性的增加,模型性能和訓(xùn)練效率的優(yōu)化需求也日益提升。
2、在語(yǔ)音處理模型的訓(xùn)練過(guò)程中,需要調(diào)整大量參數(shù)以?xún)?yōu)化訓(xùn)練性能。然而,常見(jiàn)的調(diào)優(yōu)過(guò)程通常依賴(lài)手動(dòng)操作,耗時(shí)耗力,且難以準(zhǔn)確找到最優(yōu)參數(shù)組合,導(dǎo)致訓(xùn)練效率低下,模型性能不穩(wěn)定,因此,有待于進(jìn)一步的優(yōu)化。
技術(shù)實(shí)現(xiàn)思路
1、基于此,有必要針對(duì)上述技術(shù)問(wèn)題,提供一種能夠提高語(yǔ)音處理精確度的語(yǔ)音處理方法、計(jì)算機(jī)程序產(chǎn)品、設(shè)備和存儲(chǔ)介質(zhì)。
2、為了解決上述技術(shù)問(wèn)題,第一方面,提供一種語(yǔ)音處理方法,方法包括:
3、對(duì)語(yǔ)音訓(xùn)練集中的多個(gè)語(yǔ)音樣本進(jìn)行處理,得到每一語(yǔ)音樣本的得分,基于每一語(yǔ)音樣本的得分計(jì)算語(yǔ)音樣本的損失;
4、確定語(yǔ)音處理模型關(guān)鍵參數(shù)組合,關(guān)鍵參數(shù)組合包括多個(gè)關(guān)鍵參數(shù),為關(guān)鍵參數(shù)組合中的每個(gè)關(guān)鍵參數(shù)設(shè)定參數(shù)搜索空間;
5、基于每個(gè)關(guān)鍵參數(shù)的參數(shù)搜索空間選取多個(gè)初始點(diǎn),對(duì)初始點(diǎn)進(jìn)行評(píng)估,基于初始點(diǎn)評(píng)估結(jié)果以及語(yǔ)音處理模型構(gòu)建混合核函數(shù)代理模型,混合核函數(shù)代理模型的核函數(shù)是基于徑向基函數(shù)核以及馬特恩核構(gòu)建的混合核函數(shù);
6、基于混合核函數(shù)代理模型確定采集函數(shù),基于采集函數(shù)進(jìn)行目標(biāo)點(diǎn)的選取;
7、基于目標(biāo)點(diǎn)的關(guān)鍵參數(shù)組合對(duì)應(yīng)的參數(shù)值對(duì)混合核函數(shù)代理模型進(jìn)行訓(xùn)練,當(dāng)滿(mǎn)足混合核函數(shù)代理模型訓(xùn)練終止條件時(shí),混合核函數(shù)代理模型輸出關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值;
8、根據(jù)語(yǔ)音樣本的損失以及關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值對(duì)語(yǔ)音處理模型進(jìn)行訓(xùn)練,得到目標(biāo)語(yǔ)音處理模型,利用目標(biāo)語(yǔ)音處理模型對(duì)目標(biāo)語(yǔ)音進(jìn)行處理。
9、在其中一個(gè)實(shí)施例中,確定語(yǔ)音處理模型的關(guān)鍵參數(shù)組合包括:
10、獲取待選取的關(guān)鍵參數(shù)組合,待選取的關(guān)鍵參數(shù)組合包括多個(gè)待選取的關(guān)鍵參數(shù),將每一待選取的關(guān)鍵參數(shù)設(shè)置為多個(gè)目標(biāo)離散取值點(diǎn),基于多個(gè)目標(biāo)離散取值點(diǎn)生成多個(gè)采樣組合;
11、對(duì)多個(gè)采樣組合進(jìn)行測(cè)試,得到采樣組合的性能指標(biāo);
12、對(duì)采樣組合的性能指標(biāo)進(jìn)行分析,確定每個(gè)待選取的關(guān)鍵參數(shù)的敏感指數(shù);
13、基于每個(gè)待選取的關(guān)鍵參數(shù)的敏感指數(shù)從待選取的關(guān)鍵參數(shù)集合中確定語(yǔ)音處理模型的關(guān)鍵參數(shù)組合。
14、在其中一個(gè)實(shí)施例中,為關(guān)鍵參數(shù)組合中的每個(gè)關(guān)鍵參數(shù)設(shè)定參數(shù)搜索空間包括:
15、利用貝葉斯優(yōu)化方法對(duì)關(guān)鍵參數(shù)組合中的每個(gè)關(guān)鍵參數(shù)的目標(biāo)離散取值點(diǎn)進(jìn)行搜索,尋找每個(gè)關(guān)鍵參數(shù)對(duì)應(yīng)的參數(shù)搜索空間。
16、在其中一個(gè)實(shí)施例中,方法還包括:構(gòu)建混合核函數(shù),構(gòu)建混合核函數(shù)包括:
17、確定徑向基函數(shù)核對(duì)應(yīng)的第一權(quán)重值以及馬特恩核對(duì)應(yīng)的第二權(quán)重值;
18、基于徑向基函數(shù)核、第一權(quán)重值、馬特恩核以及第二權(quán)重值構(gòu)建混合核函數(shù)公式;
19、計(jì)算多個(gè)初始點(diǎn)之間的距離值,將多個(gè)初始點(diǎn)之間的距離值輸入混合協(xié)方差矩陣中,得到混合協(xié)方差矩陣值。
20、在其中一個(gè)實(shí)施例中,混合核函數(shù)公式如下所示:
21、;
22、;
23、;
24、其中,表示混合核函數(shù),表示徑向基函數(shù),表示馬特恩核函數(shù),表示初始點(diǎn)與初始點(diǎn)之間的歐式距離,表示輸出的方差,表示長(zhǎng)度尺度,為第一權(quán)重值,為第二權(quán)重值。
25、在其中一個(gè)實(shí)施例中,基于初始點(diǎn)評(píng)估結(jié)果以及語(yǔ)音處理模型構(gòu)建混合核函數(shù)代理模型包括:
26、基于自適應(yīng)采樣策略選取預(yù)測(cè)點(diǎn);
27、計(jì)算預(yù)測(cè)點(diǎn)與初始點(diǎn)之間的距離值,基于預(yù)測(cè)點(diǎn)與初始點(diǎn)之間的距離值、預(yù)測(cè)均值公式以及預(yù)測(cè)方差公式計(jì)算預(yù)測(cè)點(diǎn)的預(yù)測(cè)結(jié)果;
28、預(yù)測(cè)均值公式如下所示:
29、;
30、預(yù)測(cè)方差公式如下所示:
31、;
32、其中,表示預(yù)測(cè)點(diǎn)的預(yù)測(cè)均值,表示預(yù)測(cè)點(diǎn)的預(yù)測(cè)方差,表示預(yù)測(cè)點(diǎn)與初始點(diǎn)之間的協(xié)方差向量,表示關(guān)鍵參數(shù)的協(xié)方差矩陣的逆矩陣,是初始點(diǎn)的評(píng)估結(jié)果向量,表示預(yù)測(cè)點(diǎn)的自協(xié)方差,表示預(yù)測(cè)點(diǎn)與初始點(diǎn)之間的協(xié)方差減去協(xié)方差調(diào)整項(xiàng)。
33、在其中一個(gè)實(shí)施例中,基于混合核函數(shù)代理模型確定采集函數(shù)包括:確定采集函數(shù)類(lèi)型,根據(jù)采集函數(shù)類(lèi)型以及混合核函數(shù)代理模型確定采集函數(shù),采集函數(shù)如下所示:
34、;
35、;
36、其中,表示對(duì)預(yù)測(cè)點(diǎn)及采樣后最優(yōu)點(diǎn)獲得提升的期望,表示預(yù)測(cè)點(diǎn)的預(yù)測(cè)均值,表示預(yù)測(cè)點(diǎn)的預(yù)測(cè)標(biāo)準(zhǔn)差,表示已知最優(yōu)評(píng)估結(jié)果,表示標(biāo)準(zhǔn)正態(tài)分布的累積分布函數(shù),表示標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),表示標(biāo)準(zhǔn)化后的改進(jìn)量。
37、在其中一個(gè)實(shí)施例中,基于采集函數(shù)進(jìn)行目標(biāo)點(diǎn)的選取包括:
38、利用采集函數(shù)計(jì)算預(yù)測(cè)點(diǎn)的預(yù)測(cè)值,預(yù)測(cè)值為預(yù)測(cè)點(diǎn)采樣后最優(yōu)點(diǎn)獲得提升的期望;
39、判斷預(yù)測(cè)點(diǎn)的預(yù)測(cè)值是否大于預(yù)設(shè)閾值;
40、將預(yù)測(cè)點(diǎn)的預(yù)測(cè)值大于預(yù)設(shè)閾值的預(yù)測(cè)點(diǎn)作為目標(biāo)點(diǎn)。
41、在其中一個(gè)實(shí)施例中,基于自適應(yīng)采樣策略選取預(yù)測(cè)點(diǎn)包括:
42、將關(guān)鍵參數(shù)的參數(shù)搜索空間進(jìn)行劃分,得到多個(gè)子參數(shù)搜索空間;
43、根據(jù)子參數(shù)搜索空間中確定為目標(biāo)點(diǎn)的預(yù)測(cè)點(diǎn)數(shù)量確定子參數(shù)搜索空間的級(jí)別;
44、當(dāng)在任意子參數(shù)搜索空間的級(jí)別低于預(yù)設(shè)級(jí)別時(shí),減少在級(jí)別低于預(yù)設(shè)級(jí)別的子參數(shù)搜索空間進(jìn)行預(yù)測(cè)點(diǎn)采樣。
45、在其中一個(gè)實(shí)施例中,基于目標(biāo)點(diǎn)的關(guān)鍵參數(shù)組合對(duì)應(yīng)的參數(shù)值對(duì)混合核函數(shù)代理模型進(jìn)行訓(xùn)練包括:
46、將目標(biāo)點(diǎn)的關(guān)鍵參數(shù)組合對(duì)應(yīng)的參數(shù)值輸入代理模型中進(jìn)行訓(xùn)練,得到目標(biāo)點(diǎn)評(píng)估結(jié)果;
47、基于目標(biāo)點(diǎn)評(píng)估結(jié)果更新數(shù)據(jù)集,利用更新后的數(shù)據(jù)集訓(xùn)練混合核函數(shù)代理模型,得到更新的混合核函數(shù)代理模型;
48、構(gòu)建更新的混合協(xié)方差矩陣,基于更新的混合協(xié)方差矩陣以及更新后的數(shù)據(jù)集計(jì)算更新的混合核函數(shù)代理模型對(duì)應(yīng)的預(yù)測(cè)均值以及預(yù)測(cè)方差;
49、利用更新的混合核函數(shù)代理模型對(duì)應(yīng)的預(yù)測(cè)均值以及預(yù)測(cè)方差計(jì)算新的預(yù)測(cè)點(diǎn)的預(yù)測(cè)結(jié)果。
50、在其中一個(gè)實(shí)施例中,當(dāng)滿(mǎn)足混合核函數(shù)代理模型訓(xùn)練終止條件時(shí),混合核函數(shù)代理模型輸出關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值包括:
51、響應(yīng)于混合核函數(shù)代理模型迭代次數(shù)大于迭代閾值或者在一定混合核函數(shù)代理模型迭代次數(shù)內(nèi),預(yù)測(cè)點(diǎn)的預(yù)測(cè)值小于預(yù)設(shè)值時(shí),認(rèn)為滿(mǎn)足混合核函數(shù)代理模型訓(xùn)練終止條件,混合核函數(shù)代理模型輸出迭代過(guò)程中關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值。
52、在其中一個(gè)實(shí)施例中,對(duì)采樣組合的性能指標(biāo)進(jìn)行分析,確定待選取的關(guān)鍵參數(shù)的敏感指數(shù)包括:
53、基于采樣組合的性能指標(biāo)、第一敏感性指數(shù)計(jì)算公式、第二敏感性指數(shù)計(jì)算公式計(jì)算待選取的關(guān)鍵參數(shù)的第一敏感性指數(shù)、第二敏感性指數(shù);
54、第一敏感性指數(shù)計(jì)算公式如下所示:
55、;
56、第二敏感性指數(shù)計(jì)算公式如下所示:
57、;
58、其中,表示因輸入?yún)?shù)變化引起的輸出方差,表示輸出的總方差,表示批處理大小,表示排除輸入?yún)?shù)之外的其他參數(shù)變化引起的輸出方差,表示性能影響大小。
59、為了解決上述技術(shù)問(wèn)題,第二方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的方法的步驟。
60、為了解決上述技術(shù)問(wèn)題,第三方面,提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,處理器執(zhí)行計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)以下步驟:所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述方法的步驟。
61、為了解決上述技術(shù)問(wèn)題,第四方面,本技術(shù)提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的方法的步驟。
62、區(qū)別于現(xiàn)有技術(shù),本技術(shù)中通過(guò)對(duì)語(yǔ)音訓(xùn)練集中的多個(gè)語(yǔ)音樣本進(jìn)行處理,得到每一語(yǔ)音樣本的得分,基于每一語(yǔ)音樣本的得分計(jì)算語(yǔ)音樣本的損失;確定語(yǔ)音處理模型的關(guān)鍵參數(shù)組合,關(guān)鍵參數(shù)組合包括多個(gè)關(guān)鍵參數(shù),為關(guān)鍵參數(shù)組合中的每個(gè)關(guān)鍵參數(shù)設(shè)定參數(shù)搜索空間;基于每個(gè)關(guān)鍵參數(shù)的參數(shù)搜索空間選取多個(gè)初始點(diǎn),對(duì)初始點(diǎn)進(jìn)行評(píng)估,基于初始點(diǎn)評(píng)估結(jié)果以及語(yǔ)音處理模型構(gòu)建混合核函數(shù)代理模型,混合核函數(shù)代理模型的核函數(shù)是基于徑向基函數(shù)核以及馬特恩核構(gòu)建的混合核函數(shù);基于混合核函數(shù)代理模型確定采集函數(shù),基于采集函數(shù)進(jìn)行目標(biāo)點(diǎn)的選取;基于目標(biāo)點(diǎn)的關(guān)鍵參數(shù)組合對(duì)應(yīng)的參數(shù)值對(duì)混合核函數(shù)代理模型進(jìn)行訓(xùn)練,當(dāng)滿(mǎn)足混合核函數(shù)代理模型訓(xùn)練終止條件時(shí),混合核函數(shù)代理模型輸出關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值;根據(jù)語(yǔ)音樣本的損失以及關(guān)鍵參數(shù)組合的目標(biāo)參數(shù)值對(duì)語(yǔ)音處理模型進(jìn)行訓(xùn)練,得到目標(biāo)語(yǔ)音處理模型,利用目標(biāo)語(yǔ)音處理模型對(duì)目標(biāo)語(yǔ)音進(jìn)行處理。如此,應(yīng)用徑向基函數(shù)核以及馬特恩核構(gòu)建的混合核函數(shù)可以提高混合核函數(shù)代理模型的平滑性和魯棒性,從而提高了參數(shù)優(yōu)化的精確度;應(yīng)用基于采集函數(shù)以及自適應(yīng)采樣策略進(jìn)行目標(biāo)點(diǎn)的選取,可以自適應(yīng)地探索參數(shù)搜索空間,自動(dòng)找到最優(yōu)的參數(shù)組合,顯著提升語(yǔ)音處理模型的訓(xùn)練性能,提高語(yǔ)音處理精度。同時(shí)減少資源消耗和人為干預(yù)。