本申請(qǐng)涉及人工智能,尤其涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù):
1、用戶可以使用人工智能模型對(duì)三維場(chǎng)景進(jìn)行處理。例如,在三維場(chǎng)景中添加物體或者修改三維場(chǎng)景中的物體顏色或放置位置等。
2、但是,這需要用戶先手動(dòng)操作三維場(chǎng)景,如拖拽三維場(chǎng)景的視角,進(jìn)而將物體從三維場(chǎng)景中呈現(xiàn)出來(lái),才能進(jìn)行下一步操作,這就導(dǎo)致用戶操作的復(fù)雜度較高。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本申請(qǐng)?zhí)峁┮环N數(shù)據(jù)處理方法及裝置,如下:
2、一種數(shù)據(jù)處理方法,包括:
3、獲得針對(duì)三維場(chǎng)景的輸入數(shù)據(jù),所述輸入數(shù)據(jù)中包括目標(biāo)對(duì)象對(duì)應(yīng)的信息;
4、根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,所述目標(biāo)位置信息表征所述目標(biāo)對(duì)象在所述三維場(chǎng)景中的位置,所述目標(biāo)模型能夠根據(jù)接收到的自然語(yǔ)言指令生成輸出結(jié)果;
5、根據(jù)所述目標(biāo)位置信息,確定目標(biāo)視角信息;
6、通過(guò)所述三維場(chǎng)景對(duì)應(yīng)的三維模型,渲染與所述目標(biāo)視角信息對(duì)應(yīng)的目標(biāo)圖像。
7、上述方法,優(yōu)選的,根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,包括:
8、把所述輸入數(shù)據(jù)輸入目標(biāo)模型,以得到所述目標(biāo)模型輸出的目標(biāo)位置信息;
9、其中,所述目標(biāo)模型利用所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息進(jìn)行優(yōu)化。
10、上述方法,優(yōu)選的,根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,包括:
11、根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息和所述輸入數(shù)據(jù),獲得第一提示信息;
12、將所述第一提示信息輸入到目標(biāo)模型,以得到所述目標(biāo)模型輸出的目標(biāo)位置信息。
13、上述方法,優(yōu)選的,在通過(guò)所述三維場(chǎng)景對(duì)應(yīng)的三維模型,渲染與所述目標(biāo)視角信息對(duì)應(yīng)的目標(biāo)圖像之后,所述方法還包括:
14、根據(jù)操作提示信息,對(duì)所述目標(biāo)對(duì)象執(zhí)行相應(yīng)的操作;
15、其中,所述操作提示信息至少根據(jù)所述三維模型的操作文本、輸入數(shù)據(jù)和所述目標(biāo)模型獲得,所述操作文本表征所述三維模型對(duì)應(yīng)的操作流程。
16、上述方法,優(yōu)選的,所述操作提示信息通過(guò)以下方式獲得:
17、將所述輸入數(shù)據(jù)輸入所述目標(biāo)模型,以得到所述目標(biāo)模型輸出的操作提示信息;
18、其中,所述目標(biāo)模型利用所述操作文本和所述場(chǎng)景語(yǔ)義信息進(jìn)行優(yōu)化。
19、上述方法,優(yōu)選的,所述操作提示信息通過(guò)以下方式獲得:
20、從所述操作文本中,提取操作關(guān)鍵信息;
21、根據(jù)所述操作關(guān)鍵信息、所述場(chǎng)景語(yǔ)義信息和所述輸入數(shù)據(jù),獲得第二提示信息;
22、將所述第二提示信息輸入到所述目標(biāo)模型,以得到所述目標(biāo)模型輸出的操作提示信息。
23、上述方法,優(yōu)選的,所述方法還包括:
24、根據(jù)所述輸入數(shù)據(jù)和所述操作提示信息,更新所述場(chǎng)景語(yǔ)義信息。
25、上述方法,優(yōu)選的,所述場(chǎng)景語(yǔ)義信息通過(guò)以下方式獲得:
26、獲得所述三維場(chǎng)景分別在多個(gè)視角下的掃描圖像;
27、對(duì)所述掃描圖像中的視覺(jué)內(nèi)容進(jìn)行語(yǔ)義解析,以得到場(chǎng)景語(yǔ)義信息;
28、其中,所述場(chǎng)景語(yǔ)義信息包含以下至少一項(xiàng):
29、所述三維場(chǎng)景的場(chǎng)景描述信息;
30、所述三維場(chǎng)景中所包含的對(duì)象的對(duì)象描述信息;
31、所述三維場(chǎng)景中所包含的對(duì)象的三維坐標(biāo)信息;
32、所述三維場(chǎng)景所包含的對(duì)象之間的相對(duì)位置關(guān)系。
33、上述方法,優(yōu)選的,所述方法還包括:
34、如果所述三維場(chǎng)景的當(dāng)前視角信息區(qū)別于所述掃描圖像對(duì)應(yīng)的視角信息,對(duì)所述三維場(chǎng)景在所述當(dāng)前視角信息下進(jìn)行圖像掃描,以得到新的掃描圖像;
35、根據(jù)所述新的掃描圖像,更新所述場(chǎng)景語(yǔ)義信息。
36、一種數(shù)據(jù)處理裝置,包括:
37、數(shù)據(jù)獲得單元,用于獲得針對(duì)三維場(chǎng)景的輸入數(shù)據(jù),所述輸入數(shù)據(jù)中包括目標(biāo)對(duì)象對(duì)應(yīng)的信息;
38、位置獲得單元,用于根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,所述目標(biāo)位置信息表征所述目標(biāo)對(duì)象在所述三維場(chǎng)景中的位置,所述目標(biāo)模型能夠根據(jù)接收到的自然語(yǔ)言指令生成輸出結(jié)果;
39、視角獲得單元,用于根據(jù)所述目標(biāo)位置信息,確定目標(biāo)視角信息;
40、圖像渲染單元,用于通過(guò)所述三維場(chǎng)景對(duì)應(yīng)的三維模型,渲染與所述目標(biāo)視角信息對(duì)應(yīng)的目標(biāo)圖像。
41、一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)可讀指令,當(dāng)所述計(jì)算機(jī)可讀指令在電子設(shè)備上運(yùn)行時(shí),使得所述電子設(shè)備實(shí)現(xiàn)上述任意一項(xiàng)所述的數(shù)據(jù)處理方法。
42、一種電子設(shè)備,包括至少一個(gè)處理器和與所述處理器連接的存儲(chǔ)器,其中:
43、所述存儲(chǔ)器用于存儲(chǔ)計(jì)算機(jī)程序;
44、所述處理器用于執(zhí)行所述計(jì)算機(jī)程序,以使所述電子設(shè)備能夠?qū)崿F(xiàn)上述任意一項(xiàng)所述的數(shù)據(jù)處理方法。
45、一種計(jì)算機(jī)存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)承載有一個(gè)或多個(gè)計(jì)算機(jī)程序,當(dāng)所述一個(gè)或多個(gè)計(jì)算機(jī)程序被電子設(shè)備執(zhí)行時(shí),能夠使所述電子設(shè)備實(shí)現(xiàn)上述任意一項(xiàng)所述的數(shù)據(jù)處理方法。
46、從上述技術(shù)方案可以看出,本申請(qǐng)公開(kāi)的一種數(shù)據(jù)處理方法及裝置中,在獲得針對(duì)三維場(chǎng)景的輸入數(shù)據(jù)之后,可以根據(jù)三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、輸入數(shù)據(jù)以及能夠根據(jù)接收到的自然語(yǔ)言指令生成輸出結(jié)果的目標(biāo)模型,獲得表征目標(biāo)對(duì)象在三維場(chǎng)景中位置的目標(biāo)位置信息,這樣根據(jù)目標(biāo)位置信息確定目標(biāo)視角信息,由此通過(guò)三維場(chǎng)景對(duì)應(yīng)的三維模型,渲染與目標(biāo)視角信息對(duì)應(yīng)的目標(biāo)圖像??梢?jiàn),本申請(qǐng)中可以根據(jù)三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、輸入數(shù)據(jù)和目標(biāo)模型,渲染出目標(biāo)對(duì)象所在位置上的目標(biāo)圖像,對(duì)用戶來(lái)說(shuō),只需要輸入目標(biāo)對(duì)象對(duì)應(yīng)的信息,不需要用戶拖拽三維場(chǎng)景尋找目標(biāo)對(duì)象就可以渲染出相應(yīng)的目標(biāo)圖像,從而能夠降低用戶對(duì)三維模型的操作復(fù)雜度,改善用戶使用體驗(yàn)。
1.一種數(shù)據(jù)處理方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,包括:
3.根據(jù)權(quán)利要求1所述的方法,根據(jù)所述三維場(chǎng)景的場(chǎng)景語(yǔ)義信息、所述輸入數(shù)據(jù)和目標(biāo)模型,獲得目標(biāo)位置信息,包括:
4.根據(jù)權(quán)利要求1、2或3所述的方法,在通過(guò)所述三維場(chǎng)景對(duì)應(yīng)的三維模型,渲染與所述目標(biāo)視角信息對(duì)應(yīng)的目標(biāo)圖像之后,所述方法還包括:
5.根據(jù)權(quán)利要求4所述的方法,所述操作提示信息通過(guò)以下方式獲得:
6.根據(jù)權(quán)利要求4所述的方法,所述操作提示信息通過(guò)以下方式獲得:
7.根據(jù)權(quán)利要求4所述的方法,所述方法還包括:
8.根據(jù)權(quán)利要求1、2或3所述的方法,所述場(chǎng)景語(yǔ)義信息通過(guò)以下方式獲得:
9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:
10.一種數(shù)據(jù)處理裝置,包括: