本公開涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法、裝置、系統(tǒng)、存儲介質(zhì)和程序產(chǎn)品。
背景技術(shù):
1、基于lidar(light?detection?and?ranging,激光雷達(dá))的3d目標(biāo)檢測在自動駕駛系統(tǒng)中扮演著至關(guān)重要的角色。lidar是一種使用激光脈沖測量物體距離的技術(shù),它能夠提供關(guān)于周圍環(huán)境的三維信息。這些信息對于車輛導(dǎo)航、避障和決策至關(guān)重要。
2、在不同的應(yīng)用場景中,lidar系統(tǒng)可能會遇到各種不同的配置,比如不同的激光束數(shù)量、不同的視角覆蓋范圍以及不同的分辨率。由于目標(biāo)檢測模型的性能很大程度上依賴于數(shù)據(jù)的質(zhì)量和特征提取的能力,因此,這些差異會導(dǎo)致在一種配置下訓(xùn)練的3d目標(biāo)檢測模型在另一種配置下表現(xiàn)不佳。同時在不同領(lǐng)域都有充足的訓(xùn)練數(shù)據(jù)成本是非常昂貴的,更真實(shí)的場景是在源領(lǐng)域中有充足的訓(xùn)練樣本,而在目標(biāo)領(lǐng)域中只有有限的訓(xùn)練樣本。源領(lǐng)域是模型最初訓(xùn)練的數(shù)據(jù)集,而目標(biāo)領(lǐng)域則是模型將要應(yīng)用的新環(huán)境。目前研究人員開始探索領(lǐng)域適應(yīng)技術(shù),這種技術(shù)允許模型在源領(lǐng)域(如16線數(shù)據(jù))以及有限目標(biāo)領(lǐng)域數(shù)據(jù)(如32線數(shù)據(jù))中訓(xùn)練,然后在目標(biāo)領(lǐng)域中進(jìn)行適應(yīng)和推廣。
技術(shù)實(shí)現(xiàn)思路
1、本公開要解決的一個技術(shù)問題是,提供一種數(shù)據(jù)處理方法、裝置、系統(tǒng)、存儲介質(zhì)和程序產(chǎn)品,能夠提高目標(biāo)檢測模型在目標(biāo)域的適應(yīng)性。
2、根據(jù)本公開一方面,提出一種數(shù)據(jù)處理方法,包括:在目標(biāo)域樣本集中選擇第一樣本集;在源域樣本集中去除第二樣本集,得到第三樣本集,其中,第一樣本集對應(yīng)的第一區(qū)域范圍和第二樣本集對應(yīng)的第二區(qū)域范圍相同;將第一樣本集與第三樣本集進(jìn)行融合,得到融合樣本集,用于訓(xùn)練目標(biāo)檢測模型。
3、在一些實(shí)施例中,將第一樣本集與第三樣本集進(jìn)行融合,得到融合樣本集包括:將第一樣本集對應(yīng)的第一數(shù)據(jù),與第三樣本集對應(yīng)的第二數(shù)據(jù)進(jìn)行融合,得到融合數(shù)據(jù);將第一樣本集對應(yīng)的第一標(biāo)簽信息,與第三樣本集對應(yīng)的第二標(biāo)簽信息進(jìn)行融合,得到融合標(biāo)簽信息;以及將融合標(biāo)簽信息,作為融合數(shù)據(jù)的標(biāo)簽信息。
4、在一些實(shí)施例中,目標(biāo)域樣本集為通過第一雷達(dá)傳感器掃描得到的第一點(diǎn)云樣本集,在目標(biāo)域樣本集中選擇第一樣本集包括:在第一點(diǎn)云樣本集中選擇一個點(diǎn)作為第一中心點(diǎn);以及以目標(biāo)域的鳥瞰圖為基礎(chǔ),圍繞第一中心點(diǎn),選擇第一區(qū)域范圍的點(diǎn)云,作為第一樣本集。
5、在一些實(shí)施例中,源域樣本集為通過第二雷達(dá)傳感器掃描得到的第二點(diǎn)云樣本集,在源域樣本集中去除第二樣本集,得到第三樣本集包括:在第二點(diǎn)云樣本集中選擇一個點(diǎn)作為第二中心點(diǎn);以及以源域的鳥瞰圖為基礎(chǔ),圍繞第二中心點(diǎn),去除第二區(qū)域范圍內(nèi)的點(diǎn)云,得到第三樣本集。
6、在一些實(shí)施例中,第二中心點(diǎn)基于第一中心點(diǎn)的選擇得到;或者第一中心點(diǎn)基于第二中心點(diǎn)的選擇得到。
7、在一些實(shí)施例中,第一中心點(diǎn)相對于第一雷達(dá)傳感器的方向,與第二中心點(diǎn)相對于第二雷達(dá)傳感器的方向一致;第一中心點(diǎn)相對于第一雷達(dá)傳感器的距離,與第二中心點(diǎn)相對于第二雷達(dá)傳感器的距離一致。
8、在一些實(shí)施例中,利用訓(xùn)練好的目標(biāo)檢測模型,檢測目標(biāo)域內(nèi)的目標(biāo)。
9、根據(jù)本公開的另一方面,還提出一種數(shù)據(jù)處理裝置,包括:樣本集獲取模塊,被配置為在目標(biāo)域樣本集中選擇第一樣本集,在源域樣本集中去除第二樣本集,得到第三樣本集,其中,第一樣本集對應(yīng)的第一區(qū)域范圍和第二樣本集對應(yīng)的第二區(qū)域范圍相同;樣本集融合模塊,被配置為將第一樣本集與第三樣本集進(jìn)行融合,得到融合樣本集,用于訓(xùn)練目標(biāo)檢測模型。
10、根據(jù)本公開的另一方面,還提出一種數(shù)據(jù)處理裝置,包括:存儲器;以及耦接至存儲器的處理器,處理器被配置為基于存儲在存儲器的指令執(zhí)行如上述的數(shù)據(jù)處理方法。
11、根據(jù)本公開的另一方面,還提出一種自動駕駛系統(tǒng),包括:上述的數(shù)據(jù)處理裝置。
12、根據(jù)本公開的另一方面,還提出一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序指令,該指令被處理器執(zhí)行時實(shí)現(xiàn)如上述的數(shù)據(jù)處理方法。
13、根據(jù)本公開的另一方面,還提出一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序或指令,計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)上述的數(shù)據(jù)處理方法。
14、本公開實(shí)施例中,將源域樣本集中的第三樣本集與目標(biāo)域樣本集中的第一樣本集進(jìn)行融合,并利用融合的樣本集對目標(biāo)檢測模型進(jìn)行訓(xùn)練,能夠減少源域樣本集主導(dǎo)網(wǎng)絡(luò)訓(xùn)練的問題,另外,由于實(shí)現(xiàn)了源域樣本集和目標(biāo)域樣本集之間的融合,因此,能夠有效對齊不同領(lǐng)域之間的偏差,并且,雖然源域樣本集和目標(biāo)域樣本集分布不一致,但具有相同的遷移信息,因此,實(shí)現(xiàn)了學(xué)習(xí)領(lǐng)域不變表示,使得目標(biāo)檢測模型學(xué)習(xí)到不依賴于特定配置或環(huán)境的域不變的通用特征,從而提高了模型在目標(biāo)域的適應(yīng)性能。
15、通過以下參照附圖對本公開的示例性實(shí)施例的詳細(xì)描述,本公開的其它特征及其優(yōu)點(diǎn)將會變得清楚。
1.一種數(shù)據(jù)處理方法,包括:
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理方法,其中,所述將所述第一樣本集與所述第三樣本集進(jìn)行融合,得到融合樣本集包括:
3.根據(jù)權(quán)利要求1或2所述的數(shù)據(jù)處理方法,其中,所述目標(biāo)域樣本集為通過第一雷達(dá)傳感器掃描得到的第一點(diǎn)云樣本集,所述在目標(biāo)域樣本集中選擇第一樣本集包括:
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)處理方法,其中,所述源域樣本集為通過第二雷達(dá)傳感器掃描得到的第二點(diǎn)云樣本集,所述在源域樣本集中去除第二樣本集,得到第三樣本集包括:
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)處理方法,其中,
6.根據(jù)權(quán)利要求5所述的數(shù)據(jù)處理方法,其中,
7.根據(jù)權(quán)利要求1或2所述的數(shù)據(jù)處理方法,還包括:
8.一種數(shù)據(jù)處理裝置,包括:
9.一種數(shù)據(jù)處理裝置,包括:
10.一種自動駕駛系統(tǒng),包括:
11.一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序指令,該指令被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至7任一所述的數(shù)據(jù)處理方法。
12.一種計算機(jī)程序產(chǎn)品,包括計算機(jī)程序或指令,所述計算機(jī)程序或指令被處理器執(zhí)行時實(shí)現(xiàn)權(quán)利要求1至7任一所述的數(shù)據(jù)處理方法。