本技術(shù)的實(shí)施例涉及圖像處理,特別涉及一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法。
背景技術(shù):
1、局部圖像特征描述和匹配是計(jì)算機(jī)視覺應(yīng)用的關(guān)鍵。這類任務(wù)主要包括三個(gè)步驟:特征檢測(cè)、特征描述和特征匹配。對(duì)于特征檢測(cè)步驟,需要一個(gè)可靠的特征檢測(cè)器來對(duì)具有不同光度變換或幾何變換的相同圖像場(chǎng)景準(zhǔn)確地提取出一致的特征點(diǎn)(即關(guān)鍵點(diǎn))。而特征描述步驟則是通過將圖像特征點(diǎn)鄰域的局部圖像信息映射成一個(gè)高維的特征向量(通常稱為特征描述符),以此來完成對(duì)特征點(diǎn)的描述。特征描述符與特征檢測(cè)器同樣重要,需要對(duì)常見的光度變換(例如光照、噪聲、壓縮和模糊變換等)和幾何變換(例如縮放、旋轉(zhuǎn)、平移和仿射變換等)具有魯棒性,確保特征描述符的獨(dú)特性,以便于在最后一步的特征匹配中,找出相同的特征點(diǎn)。
2、作為計(jì)算機(jī)視覺應(yīng)用的基礎(chǔ),國(guó)內(nèi)外研究團(tuán)隊(duì)已經(jīng)提出了大量的特征檢測(cè)器和特征描述符。sift算法(scale?invariant?feature?transform,尺度不變特征變換算法)作為性能最好的特征檢測(cè)算法之一,通過在所有可能的尺度空間搜索穩(wěn)定的特征,能夠使得圖像特征對(duì)尺度變換具有不變性。也正是因?yàn)樾枰阉鲌D像的尺度空間,sift算法面臨著計(jì)算復(fù)雜度高的問題。surf算法(speeded?up?robust?features,加速魯棒特征算法)則可以實(shí)現(xiàn)更高的計(jì)算能力,該算法通過使用積分圖像和盒子濾波器來近似高斯卷積的二階偏導(dǎo),可以大大提高計(jì)算效率,但是surf算法的精度有所降低。為了進(jìn)一步提高計(jì)算效率,大量的快速檢測(cè)器和特征描述符被提出,包括但不限于freak算法(fast?retina?keypoint,快速視網(wǎng)膜關(guān)鍵點(diǎn)檢測(cè)算法)、brief算法(binary?robust?independent?elementaryfeatures,二進(jìn)制魯棒獨(dú)立元素特征檢測(cè)算法)、orb算法(oriented?fast?and?rotatedbrief,定向快速旋轉(zhuǎn)特征檢測(cè)算法)、以及brisk算法(binary?robust?invariantscalable?keypoints,二進(jìn)制魯棒尺度不變關(guān)鍵點(diǎn)檢測(cè)算法)等,這些算法使用二進(jìn)制描述符描述圖像的局部特征,但這些算法都是以降低匹配精度為代價(jià)來換取更高的計(jì)算能力的。隨著人工智能技術(shù)的突飛猛進(jìn),基于深度學(xué)習(xí)的方案在特征描述和匹配方面取得了巨大進(jìn)展。然而,這類方法受到泛化相關(guān)問題的困擾,需要很長(zhǎng)時(shí)間的學(xué)習(xí)、訓(xùn)練過程,使其不適合部分實(shí)時(shí)系統(tǒng)。綜上所述,目前已提出的特征檢測(cè)算法的性能已經(jīng)很好并值得信賴,但其特征描述符的性能往往與特征檢測(cè)器的性能不匹配。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本技術(shù)的實(shí)施例提出了一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法,旨在提高特征描述符的性能,使其對(duì)于常見的光度變換和幾何變換具有更好的魯棒性,同時(shí)提高特征描述符的匹配效率,使其具有更低的維度和更高的執(zhí)行速度。
2、為了實(shí)現(xiàn)上述目的,本技術(shù)的實(shí)施例提出了一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法,所述方法包括以下步驟:使用預(yù)設(shè)的特征點(diǎn)檢測(cè)算法對(duì)目標(biāo)圖像進(jìn)行特征點(diǎn)檢測(cè),確定目標(biāo)圖像中的特征點(diǎn);遍歷各特征點(diǎn),將當(dāng)前特征點(diǎn)及其鄰域內(nèi)的圖像信息映射到預(yù)設(shè)大小的標(biāo)準(zhǔn)圖像塊中,并將標(biāo)準(zhǔn)圖像塊按照預(yù)設(shè)比例的尺度因子進(jìn)行截取并取整,得到以當(dāng)前特征點(diǎn)為中心的若干個(gè)嵌套在一起的不同尺寸大小的圖像塊;分別對(duì)各圖像塊進(jìn)行dct變換(discrete?cosine?transform,離散余弦變換),基于各圖像塊的dct系數(shù)生成dct系數(shù)矩陣;遍歷各圖像塊,采用z字形掃描方式從左上角開始掃描當(dāng)前圖像塊的dct系數(shù)矩陣,獲得掃描出的dct系數(shù),并剔除直流項(xiàng)系數(shù);基于當(dāng)前圖像塊的尺寸確定篩選比例,按照篩選比例對(duì)保留的各dct系數(shù)進(jìn)行篩選,得到篩選出的dct系數(shù),并進(jìn)行歸一化處理,形成當(dāng)前圖像塊的特征向量;將各圖像塊的特征向量級(jí)聯(lián)在一起,得到當(dāng)前特征點(diǎn)的idctf(improved?discrete?cosine?transform?features,改進(jìn)的離散余弦變換特征)特征描述符,進(jìn)而得到目標(biāo)圖像中的各特征點(diǎn)的idctf特征描述符。
3、為了實(shí)現(xiàn)上述目的,本技術(shù)的實(shí)施例還提供了一種基于離散余弦變換的圖像特征描述符的構(gòu)建系統(tǒng),所述系統(tǒng)包括:特征點(diǎn)檢測(cè)單元,用于使用預(yù)設(shè)的特征點(diǎn)檢測(cè)算法對(duì)目標(biāo)圖像進(jìn)行特征點(diǎn)檢測(cè),確定目標(biāo)圖像中的特征點(diǎn);映射單元,用于遍歷各特征點(diǎn),將當(dāng)前特征點(diǎn)及其鄰域內(nèi)的圖像信息映射到預(yù)設(shè)大小的標(biāo)準(zhǔn)圖像塊中,并將標(biāo)準(zhǔn)圖像塊按照預(yù)設(shè)比例的尺度因子進(jìn)行截取并取整,得到以當(dāng)前特征點(diǎn)為中心的五個(gè)嵌套在一起的不同尺寸大小的圖像塊;dct變換單元,用于分別對(duì)各圖像塊進(jìn)行dct變換,基于各圖像塊的dct系數(shù)生成dct系數(shù)矩陣;掃描單元,用于遍歷各圖像塊,采用z字形掃描方式從左上角開始掃描當(dāng)前圖像塊的dct系數(shù)矩陣,獲得掃描出的dct系數(shù),并剔除直流項(xiàng)系數(shù);特征向量構(gòu)建單元,用于基于當(dāng)前圖像塊的尺寸確定篩選比例,按照篩選比例對(duì)保留的各dct系數(shù)進(jìn)行篩選,得到篩選出的dct系數(shù),并進(jìn)行歸一化處理,形成當(dāng)前圖像塊的特征向量;特征描述符構(gòu)建單元,用于將各圖像塊的特征向量級(jí)聯(lián)在一起,得到當(dāng)前特征點(diǎn)的idctf特征描述符,進(jìn)而得到目標(biāo)圖像中的各特征點(diǎn)的idctf特征描述符。
4、為了實(shí)現(xiàn)上述目的,本技術(shù)的實(shí)施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:至少一個(gè)處理器;以及,與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行如上述所述的一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法。
5、為了實(shí)現(xiàn)上述目的,本技術(shù)的實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),能夠?qū)崿F(xiàn)如上述所述的一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法。
6、本技術(shù)的實(shí)施例提出的一種基于離散余弦變換的圖像特征描述符的構(gòu)建方法,利用dct變換對(duì)信息的壓縮性質(zhì),保留了頻域中更多有用的主要信息,形成了一個(gè)緊湊的特征向量作為idctf特征描述符,該特征描述符非常緊湊,維度很小,其維度幾乎僅為sift特征描述符的二分之一,因此其計(jì)算量小,計(jì)算效率非常高。該特征描述符可以和任意的特征檢測(cè)器配合使用,以完成圖像特征匹配,通用性強(qiáng),普適性強(qiáng)。該特征描述符的性能穩(wěn)定,構(gòu)建特征描述符的過程中的歸一化處理可以很好地消除光照差異帶來的影響,使得構(gòu)建出的特征描述符對(duì)于常見的光度變換和幾何變換具有更好的魯棒性,使用idctf特征描述符能夠進(jìn)行高精度的圖像特征匹配,可以很好地滿足高精度高速度場(chǎng)景下的圖像特征匹配需求。
7、在一些可選的實(shí)施例中,標(biāo)準(zhǔn)圖像塊的尺寸大小為32×32,預(yù)設(shè)的尺度因子為1.5,將標(biāo)準(zhǔn)圖像塊按照預(yù)設(shè)比例的尺度因子進(jìn)行截取并取整,得到以當(dāng)前特征點(diǎn)為中心的若干個(gè)嵌套在一起的不同尺寸大小的圖像塊,包括:將標(biāo)準(zhǔn)圖像塊分別按照一倍、二倍、三倍、四倍的尺度因子進(jìn)行截取并取整,得到以當(dāng)前特征點(diǎn)為中心的五個(gè)嵌套在一起的不同尺寸大小的圖像塊,五個(gè)嵌套在一起的不同尺寸大小的圖像塊包括尺寸大小為32×32的第一圖像塊、尺寸大小為21×21的第二圖像塊、尺寸大小為14×14的第三圖像塊、尺寸大小為9×9的第四圖像塊、以及尺寸大小為6×6的第五圖像塊。五個(gè)圖像塊的設(shè)計(jì)可以很好地兼顧idctf特征描述符構(gòu)建速度和構(gòu)建的idctf特征描述符的性能。
8、在一些可選的實(shí)施例中,基基于當(dāng)前圖像塊的尺寸確定篩選比例,按照篩選比例對(duì)保留的各dct系數(shù)進(jìn)行篩選,得到篩選出的dct系數(shù),包括:基于當(dāng)前圖像塊的尺寸確定篩選比例,并基于篩選比例和當(dāng)前圖像塊的dct系數(shù)矩陣中的dct系數(shù)的個(gè)數(shù),確定篩選個(gè)數(shù),;按照z字形掃描的先后順序?qū)ΡA舻母鱠ct系數(shù)進(jìn)行排序,得到當(dāng)前圖像塊的待篩選序列,篩選出當(dāng)前圖像塊的待篩選序列中的前個(gè)dct系數(shù)作為篩選出的dct系數(shù);其中,第一圖像塊對(duì)應(yīng)的篩選比例為2%,第二圖像塊對(duì)應(yīng)的篩選比例為4.5%,第三圖像塊對(duì)應(yīng)的篩選比例為7%,第四圖像塊對(duì)應(yīng)的篩選比例為17%,第五圖像塊對(duì)應(yīng)的篩選比例為25%。在構(gòu)建idctf特征描述符的過程中,充分考慮了不同圖像塊對(duì)于特征描述符構(gòu)建的貢獻(xiàn)大小,對(duì)不同尺寸的圖像塊的dct矩陣系數(shù)采取不同比例的篩選方式,篩選出的dct系數(shù)的個(gè)數(shù)依據(jù)每個(gè)圖像塊的能量來考慮,更加具有獨(dú)特性。
9、在一些可選的實(shí)施例中,進(jìn)行歸一化處理,形成當(dāng)前圖像塊的特征向量,包括:基于篩選出的dct系數(shù)中的模值的最大值對(duì)篩選出的各dct系數(shù)進(jìn)行歸一化處理,并按照篩選順序組成當(dāng)前圖像塊的特征向量。
10、在一些可選的實(shí)施例中,將各圖像塊的特征向量級(jí)聯(lián)在一起,得到當(dāng)前特征點(diǎn)的idctf特征描述符,通過以下公式實(shí)現(xiàn):
11、;
12、;
13、;
14、;
15、其中,表示第個(gè)特征點(diǎn)的第個(gè)圖像塊,表示特征點(diǎn)的總數(shù),表示第個(gè)特征點(diǎn)的第個(gè)圖像塊的dct矩陣,表示z字形掃描,表示篩選操作,表示歸一化操作,表示第個(gè)特征點(diǎn)的第個(gè)圖像塊的特征向量,表示第個(gè)特征點(diǎn)的idctf特征描述符。
16、在一些可選的實(shí)施例中,分別對(duì)各圖像塊進(jìn)行dct變換,基于各圖像塊的dct系數(shù)生成dct系數(shù)矩陣,通過以下公式實(shí)現(xiàn):
17、;
18、;
19、其中,和分別為第個(gè)特征點(diǎn)的第個(gè)圖像塊的寬和高,表示第個(gè)特征點(diǎn)的第個(gè)圖像塊中點(diǎn)的灰度值,和為歸一化系數(shù),表示第個(gè)特征點(diǎn)的第個(gè)圖像塊的dct系數(shù)矩陣中第行第列的dct系數(shù)。
20、在一些可選的實(shí)施例中,獲取參考圖像和待匹配圖像,使用預(yù)設(shè)的特征點(diǎn)檢測(cè)算法對(duì)參考圖像和待匹配圖像進(jìn)行特征點(diǎn)檢測(cè),確定參考圖像中的參考特征點(diǎn)和待匹配圖像中的待匹配特征點(diǎn);分別構(gòu)建參考圖像中的各參考特征點(diǎn)的idctf特征描述符,以及待匹配圖像中的各待匹配特征點(diǎn)的idctf特征描述符;遍歷參考圖像中的各參考特征點(diǎn),計(jì)算當(dāng)前參考特征點(diǎn)的idctf特征描述符與待匹配圖像中的各待匹配特征點(diǎn)的idctf特征描述符之間的l2范數(shù)特征距離;將各l2范數(shù)特征距離中的最小值和次小值,分別確定為最近鄰特征距離和次近鄰特征距離,并將最近鄰特征距離和次近鄰特征距離對(duì)應(yīng)的待匹配特征點(diǎn)的idctf特征描述符,分別確定為最近鄰特征描述符和次近鄰特征描述符;將最近鄰特征距離和次近鄰特征距離之間的比值確定為最近鄰特征描述符對(duì)應(yīng)的相似性度量標(biāo)準(zhǔn),并判斷相似性度量標(biāo)準(zhǔn)是否小于預(yù)設(shè)的度量閾值,若判定相似性度量標(biāo)準(zhǔn)小于預(yù)設(shè)的度量閾值,則將最近鄰特征描述符確定為最佳匹配。idctf特征描述符和相似性度量標(biāo)準(zhǔn)的使用,大大提升了圖像特征匹配的精度和穩(wěn)定性,為計(jì)算機(jī)視覺技術(shù)領(lǐng)域提供了可靠的基礎(chǔ)技術(shù)手段。