欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法與流程

文檔序號:40444144發(fā)布日期:2024-12-24 15:18閱讀:41來源:國知局
一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法與流程

本發(fā)明涉及機(jī)器視覺,尤其涉及一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法。


背景技術(shù):

1、視頻多目標(biāo)跟蹤(multi-object?tracking,mot)是計(jì)算機(jī)視覺領(lǐng)域極具有挑戰(zhàn)性的問題。mot技術(shù)通過對視頻序列中多個目標(biāo)狀態(tài)進(jìn)行持續(xù)跟蹤,進(jìn)而生成目標(biāo)的運(yùn)動軌跡,該技術(shù)在視頻監(jiān)控、自動駕駛、人機(jī)交互等領(lǐng)域具有重要應(yīng)用前景。由于復(fù)雜場景中的遮擋、光照變化、運(yùn)動模糊以及背景干擾,實(shí)現(xiàn)有效的多目標(biāo)跟蹤仍然是一個具有挑戰(zhàn)性的問題。

2、目前,視頻多目標(biāo)跟蹤方法主要分為基于目標(biāo)檢測與數(shù)據(jù)關(guān)聯(lián)的跟蹤方法、基于聯(lián)合目標(biāo)檢測與數(shù)據(jù)關(guān)聯(lián)的一體化跟蹤方法以及基于注意力機(jī)制的跟蹤方法。(1)基于目標(biāo)檢測與數(shù)據(jù)關(guān)聯(lián)的跟蹤方法在目標(biāo)檢測結(jié)果的基礎(chǔ)上進(jìn)行數(shù)據(jù)關(guān)聯(lián),屬于兩階段多目標(biāo)跟蹤。因此,模型跟蹤效果很大程度上依賴于檢測器性能,在頻繁遮擋、外觀變化等復(fù)雜場景下的跟蹤穩(wěn)健性尚存在不足。(2)基于聯(lián)合目標(biāo)檢測與數(shù)據(jù)關(guān)聯(lián)的一體化跟蹤方法將目標(biāo)檢測和數(shù)據(jù)關(guān)聯(lián)結(jié)合在一起,實(shí)現(xiàn)一體化的多目標(biāo)跟蹤;該類跟蹤方法的主要問題在于目標(biāo)檢測與數(shù)據(jù)關(guān)聯(lián)子任務(wù)之間存在對抗。(3)基于注意力機(jī)制的多目標(biāo)跟蹤方法是一種端到端的跟蹤范式,其引入object?query(目標(biāo)查詢)和track?query(跟蹤查詢)實(shí)現(xiàn)一體化的目標(biāo)檢測和數(shù)據(jù)關(guān)聯(lián)。然而,該類跟蹤方法中object?query(目標(biāo)查詢)和track?query(跟蹤查詢)的參考點(diǎn)分別存在著缺乏位置先驗(yàn)和不準(zhǔn)確的問題。首先,對于object?query(目標(biāo)查詢),其參考點(diǎn)由隨機(jī)初始化生成,缺乏明確的位置先驗(yàn)信息,導(dǎo)致目標(biāo)定位和模型優(yōu)化困難。其次,對于track?query(跟蹤查詢),其參考點(diǎn)被設(shè)置為上一幀中已跟蹤目標(biāo)的邊界框中心;然而,由于目標(biāo)的運(yùn)動,特別是在目標(biāo)高速運(yùn)動和低幀率場景下,相鄰視頻幀之間同一目標(biāo)的中心位置存在差異,導(dǎo)致track?query(跟蹤查詢)的參考點(diǎn)與待關(guān)聯(lián)目標(biāo)的實(shí)際中心位置存在定位誤差,進(jìn)而影響數(shù)據(jù)關(guān)聯(lián)性能。

3、基于注意力機(jī)制的多目標(biāo)跟蹤方法是當(dāng)前視頻多目標(biāo)跟蹤領(lǐng)域的主流方法。然而,如何解決該類跟蹤方法中參考點(diǎn)缺乏位置先驗(yàn)和不準(zhǔn)確的問題,成為當(dāng)前研究亟需解決的關(guān)鍵問題。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明提供一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法,解決的技術(shù)問題在于:傳統(tǒng)基于注意力機(jī)制的多目標(biāo)跟蹤方法其目標(biāo)查詢的參考點(diǎn)缺乏位置先驗(yàn)信息,以及跟蹤查詢的參考點(diǎn)不準(zhǔn)確,影響多目標(biāo)跟蹤性能。

2、為解決以上技術(shù)問題,本發(fā)明提供一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法,其包括:構(gòu)建多目標(biāo)跟蹤網(wǎng)絡(luò);

3、所述多目標(biāo)跟蹤網(wǎng)絡(luò)包括骨干網(wǎng)絡(luò)、形變注意力網(wǎng)絡(luò)、先驗(yàn)位置生成網(wǎng)絡(luò)、跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò)和預(yù)測頭,所述形變注意力網(wǎng)絡(luò)包括編碼器和解碼器;所述骨干網(wǎng)絡(luò)、所述編碼器和所述解碼器順序連接,所述骨干網(wǎng)絡(luò)和所述編碼器用于對輸入圖像分別進(jìn)行特征提取和特征編碼聚合,得到聚合特征輸出至所述解碼器;所述先驗(yàn)位置生成網(wǎng)絡(luò)和所述跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò)均連接所述解碼器;所述先驗(yàn)位置生成網(wǎng)絡(luò)用于對每一幀的初始化的目標(biāo)查詢產(chǎn)生具有先驗(yàn)位置信息的目標(biāo)查詢輸出至所述解碼器;所述跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò)對前一幀輸出的跟蹤查詢生成當(dāng)前幀的跟蹤參考點(diǎn)輸出至所述解碼器;

4、在初始幀時,所述解碼器根據(jù)具有先驗(yàn)位置信息的目標(biāo)查詢和初始幀的聚合特征,生成輸出嵌入至所述預(yù)測頭;所述預(yù)測頭根據(jù)初始幀的輸出嵌入生成對應(yīng)目標(biāo)的邊界框和類別,并初始化為后一幀的跟蹤查詢;

5、在非初始幀的當(dāng)前幀時,所述解碼器根據(jù)當(dāng)前幀的跟蹤參考點(diǎn)、前一幀的目標(biāo)查詢、當(dāng)前幀的具有先驗(yàn)位置信息的目標(biāo)查詢,生成當(dāng)前幀的輸出嵌入至所述預(yù)測頭,所述預(yù)測頭根據(jù)當(dāng)前幀的輸出嵌入生成對應(yīng)目標(biāo)的邊界框和類別,并初始化為后一幀的跟蹤查詢。

6、進(jìn)一步地,所述先驗(yàn)位置生成網(wǎng)絡(luò)生成的目標(biāo)查詢qdet包括內(nèi)容查詢cdet和位置查詢pdet,位置查詢pdet表示為:

7、

8、其中,rdet表示目標(biāo)查詢的所有參考點(diǎn),gsin(·)表示位置編碼操作,表示位置嵌入操作。

9、進(jìn)一步地,令則pdet具體為:

10、

11、其中,w1和w2分別為第一層線性映射和第二層線性映射的權(quán)值,b1和b2分別為第一層線性映射和第二層線性映射的偏置項(xiàng),relu(·)表示relu激活函數(shù)。

12、進(jìn)一步地,所述跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò)對當(dāng)前幀的所有跟蹤參考點(diǎn)rtck進(jìn)行調(diào)整,得到調(diào)整后的參考點(diǎn)

13、

14、其中,δrtck為基于跟蹤查詢qtck預(yù)測的跟蹤參考點(diǎn)偏移量,具體表示為:

15、δrtck=ψθ(qtck)

16、其中,ψθ(·)表示跟蹤參考點(diǎn)預(yù)測模型,θ為該模型的參數(shù)。

17、進(jìn)一步地,δrtck具體表示為:

18、δrtck=ψθ(qtck)=(w5(relu(w4(relu(w3qtck+b3))+b4))+b5)

19、其中,表示跟蹤參考點(diǎn)預(yù)測模型的第一層、第二層和第三層線性映射的權(quán)值和偏置項(xiàng),即參數(shù)θ。

20、進(jìn)一步地,該方法還包括:

21、對構(gòu)建的所述多目標(biāo)跟蹤網(wǎng)絡(luò)進(jìn)行訓(xùn)練;

22、相鄰t-1幀和t幀經(jīng)過多目標(biāo)跟蹤網(wǎng)絡(luò)的預(yù)測集合表示為其中n=ntck+ndet表示跟蹤目標(biāo)個數(shù)ntck與檢測目標(biāo)個數(shù)ndet的總體個數(shù);在訓(xùn)練過程中,對多目標(biāo)跟蹤網(wǎng)絡(luò)的優(yōu)化目標(biāo)為:逐個將預(yù)測集合中的預(yù)測結(jié)果與真實(shí)標(biāo)簽集合中的標(biāo)簽yj進(jìn)行準(zhǔn)確關(guān)聯(lián),k為當(dāng)前幀的真實(shí)目標(biāo)總個數(shù)。

23、進(jìn)一步地,對預(yù)測集合和真實(shí)標(biāo)簽集合y的最優(yōu)關(guān)聯(lián)結(jié)果表示為:

24、

25、其中,表示第j個真實(shí)標(biāo)簽yj與第σ(j)個預(yù)測標(biāo)簽之間的匹配代價函數(shù),σ(j)為預(yù)測標(biāo)簽的匹配索引。

26、進(jìn)一步地,匹配代價函數(shù)表示為:

27、

28、其中,cj表示該j索引對應(yīng)的真實(shí)標(biāo)簽中的具體目標(biāo),表示目標(biāo)類型為cj的預(yù)測概率,λcls為超參數(shù),為相匹配的真實(shí)標(biāo)簽yj的真實(shí)邊界框bj與預(yù)測標(biāo)簽的預(yù)測邊界框之間的差異。

29、進(jìn)一步地,表示為:

30、

31、其中,表示真實(shí)邊界框bj與預(yù)測邊界框之間的廣義交并比代價函數(shù),‖·‖1表示1范數(shù),λgiou和為超參數(shù)。

32、進(jìn)一步地,對于預(yù)測集合總體損失函數(shù)表示為:

33、

34、本發(fā)明提供的一種參考點(diǎn)先驗(yàn)位置嵌入與自適應(yīng)更新的多目標(biāo)跟蹤方法,在傳統(tǒng)基于注意力機(jī)制的多目標(biāo)跟蹤網(wǎng)絡(luò)架構(gòu)上,構(gòu)建了多目標(biāo)跟蹤網(wǎng)絡(luò)用于多目標(biāo)跟蹤,在該多目標(biāo)跟蹤網(wǎng)絡(luò)中設(shè)計(jì)了基于目標(biāo)查詢的參考點(diǎn)的先驗(yàn)位置生成網(wǎng)絡(luò),該先驗(yàn)位置生成網(wǎng)絡(luò)產(chǎn)生具有明確先驗(yàn)位置信息的目標(biāo)查詢,該位置先驗(yàn)信息有助于有效的關(guān)鍵點(diǎn)采樣,可解決目標(biāo)查詢的參考點(diǎn)缺乏先驗(yàn)位置信息的問題,進(jìn)而提升目標(biāo)檢測性能;還設(shè)計(jì)了基于跟蹤查詢的參考點(diǎn)的跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò),該跟蹤參考點(diǎn)預(yù)測網(wǎng)絡(luò)對跟蹤查詢生成新的跟蹤查詢參考點(diǎn),可有效減小跟蹤參考點(diǎn)位置與目標(biāo)中心位置的偏差,實(shí)現(xiàn)跟蹤參考點(diǎn)的準(zhǔn)確定位,進(jìn)而提升目標(biāo)跟蹤性能。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
鱼台县| 和顺县| 理塘县| 邢台市| 木兰县| 寿光市| 邯郸市| 稻城县| 阳新县| 高淳县| 仁化县| 隆子县| 定襄县| 天气| 合作市| 边坝县| 从江县| 城口县| 宜兰市| 大新县| 阜宁县| 潞西市| 鹤庆县| 北宁市| 门源| 游戏| 织金县| 炉霍县| 宜宾市| 炎陵县| 平江县| 房产| 合江县| 贡觉县| 牟定县| 大埔县| 资中县| 神农架林区| 渑池县| 依安县| 察雅县|