本申請涉及商用車,特別是涉及一種車機系統(tǒng)的配置方法、裝置、計算機設(shè)備、介質(zhì)和產(chǎn)品。
背景技術(shù):
1、隨著科技的飛速進(jìn)步與消費者需求的日益多樣化,汽車行業(yè)正經(jīng)歷著前所未有的變革,智能化與網(wǎng)聯(lián)化已成為不可逆轉(zhuǎn)的發(fā)展趨勢。這種轉(zhuǎn)變要求汽車制造商不僅要在硬件技術(shù)上不斷創(chuàng)新,更需在軟件服務(wù)尤其是車載智能系統(tǒng)方面實現(xiàn)突破,以滿足用戶對于個性化、情感化及高度互動性的需求。
2、目前市場上的車機系統(tǒng),雖然已普遍具備車輛控制、高精度導(dǎo)航、多媒體娛樂等基礎(chǔ)功能,顯著提升了駕駛的便捷性與樂趣,但在情感交互層面仍顯不足。大多數(shù)車機系統(tǒng)局限于執(zhí)行預(yù)設(shè)任務(wù)與提供基本信息服務(wù),缺乏對用戶情感狀態(tài)的識別與響應(yīng)能力,難以建立起深層次的人機情感聯(lián)系,無法滿足用戶的情感需求。
技術(shù)實現(xiàn)思路
1、基于此,有必要針對上述技術(shù)問題,提供一種能夠滿足用戶個性化需求的車機系統(tǒng)的配置方法、裝置、計算機設(shè)備、介質(zhì)和產(chǎn)品。
2、第一方面,本申請?zhí)峁┝艘环N車機系統(tǒng)的配置方法,包括:
3、獲取目標(biāo)對象的影音數(shù)據(jù);影音數(shù)據(jù)包括目標(biāo)對象的圖像數(shù)據(jù)和語音數(shù)據(jù);
4、對影音數(shù)據(jù)進(jìn)行特征提取,得到目標(biāo)對象的候選面部特征和候選聲音特征;
5、基于目標(biāo)面部特征和目標(biāo)聲音特征,為車機系統(tǒng)配置人工智能模型。
6、在其中一個實施例中,圖像數(shù)據(jù)包括目標(biāo)對象在多種預(yù)設(shè)場景下的面部照片和視頻圖像;預(yù)設(shè)場景包括目標(biāo)對象處于預(yù)設(shè)表情、預(yù)設(shè)姿勢下通過預(yù)設(shè)角度獲取圖像數(shù)據(jù)。
7、在其中一個實施例中,對影音數(shù)據(jù)進(jìn)行特征提取,得到目標(biāo)對象的候選面部特征和候選聲音特征的步驟,包括:
8、對圖像數(shù)據(jù)進(jìn)行面部檢測和面部定位,得到目標(biāo)對象的面部關(guān)鍵點;
9、對所有面部關(guān)鍵點進(jìn)行面部對齊處理,并通過神經(jīng)網(wǎng)絡(luò)模型進(jìn)行特征提取,得到目標(biāo)對象的候選面部特征;
10、對語音數(shù)據(jù)進(jìn)行音頻屬性提取,得到目標(biāo)對象的候選聲音特征。
11、在其中一個實施例中,基于目標(biāo)面部特征和目標(biāo)聲音特征,為車機系統(tǒng)配置人工智能模型的步驟,包括:
12、獲取車機系統(tǒng)的人工智能模型,并獲取人工智能模型中源對象的面部結(jié)構(gòu);
13、根據(jù)目標(biāo)面部特征配置面部結(jié)構(gòu),并根據(jù)目標(biāo)聲音特征為源對象配置人物語音。
14、在其中一個實施例中,根據(jù)目標(biāo)面部特征配置面部結(jié)構(gòu)的步驟,包括:
15、通過深度學(xué)習(xí)模型將候選面部特征與面部結(jié)構(gòu)進(jìn)行融合,得到合成圖像數(shù)據(jù);
16、對合成圖像數(shù)據(jù)進(jìn)行圖像處理,根據(jù)處理后的圖像數(shù)據(jù)生成源對象的目標(biāo)形象,并為人工智能模型配置目標(biāo)形象。
17、在其中一個實施例中,根據(jù)目標(biāo)聲音特征為源對象配置人物語音的步驟,包括:
18、根據(jù)目標(biāo)聲音特征合成源對象的語音數(shù)據(jù);
19、對語音數(shù)據(jù)進(jìn)行優(yōu)化處理,根據(jù)處理后的語音數(shù)據(jù)生成源對象的目標(biāo)語音,并為人工智能模型配置目標(biāo)語音。
20、第二方面,本申請還提供了一種車機系統(tǒng)的配置裝置,包括:
21、數(shù)據(jù)獲取模塊,用于獲取目標(biāo)對象的影音數(shù)據(jù);影音數(shù)據(jù)包括目標(biāo)對象的圖像數(shù)據(jù)和語音數(shù)據(jù);
22、特征提取模塊,用于對影音數(shù)據(jù)進(jìn)行特征提取,得到目標(biāo)對象的候選面部特征和候選聲音特征;
23、車機配置模塊,用于基于目標(biāo)面部特征和目標(biāo)聲音特征,為車機系統(tǒng)配置人工智能模型。
24、第三方面,本申請還提供了一種計算機設(shè)備,包括存儲器和處理器,存儲器存儲有計算機程序,處理器執(zhí)行計算機程序時實現(xiàn)第一方面中任意一項的方法步驟。
25、第四方面,本申請還提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,計算機程序被處理器執(zhí)行時實現(xiàn)第一方面中任意一項的方法步驟。
26、第五方面,本申請還提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)第一方面中任意一項的方法步驟。
27、上述車機語音系統(tǒng)的配置方法、裝置、計算機設(shè)備、介質(zhì)和產(chǎn)品,通過獲取目標(biāo)對象的影音數(shù)據(jù),對影音數(shù)據(jù)進(jìn)行特征提取,得到目標(biāo)對象的候選面部特征和候選聲音特征,基于目標(biāo)面部特征和目標(biāo)聲音特征,為車機系統(tǒng)配置人工智能模型,能夠準(zhǔn)確模擬目標(biāo)對象的面部特征和聲音特征,通過人工智能模型的引入使得車機系統(tǒng)能夠更加智能地理解用戶需求,提供更加精準(zhǔn)和高效的服務(wù),從而滿足用戶個性化需求。
1.一種車機系統(tǒng)的配置方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述圖像數(shù)據(jù)包括所述目標(biāo)對象在多種預(yù)設(shè)場景下的面部照片和視頻圖像;所述預(yù)設(shè)場景包括所述目標(biāo)對象處于預(yù)設(shè)表情、預(yù)設(shè)姿勢下通過預(yù)設(shè)角度獲取圖像數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述影音數(shù)據(jù)進(jìn)行特征提取,得到所述目標(biāo)對象的候選面部特征和候選聲音特征,包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述目標(biāo)面部特征和所述目標(biāo)聲音特征,為車機系統(tǒng)配置人工智能模型,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標(biāo)面部特征配置所述面部結(jié)構(gòu),包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述目標(biāo)聲音特征為所述源對象配置人物語音,包括:
7.一種車機系統(tǒng)的配置裝置,其特征在于,所述裝置包括:
8.一種計算機設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。
9.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。
10.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至6中任一項所述的方法的步驟。