一種基于局部pca白化的圖像表示方法和處理裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及圖像處理領(lǐng)域,具體涉及一種基于局部PCA(PrincipalComponent Analysis,主成分分析)白化的圖像表示方法和處理裝置。
【背景技術(shù)】
[0002] 在計(jì)算機(jī)視覺(jué)研究中,圖像表示是一個(gè)非?;镜膬?nèi)容。無(wú)論是對(duì)于圖像分類(lèi)、圖 像檢索或是物體識(shí)別,都需要對(duì)圖像做一個(gè)抽象的表示。目前,VLAD(vectoroflocally aggregateddescriptors,局部特征聚合描述符)圖像表示方法在很多研究中得到了運(yùn)用。
[0003] 對(duì)于原始的VLAD方法,首先在一個(gè)數(shù)據(jù)集上用K-means算法構(gòu)建詞典:
[0004]C= {cj,c2,. . .,cj
[0005] 其中,(^為詞典中的單詞。對(duì)于每張圖片,首先采取局部特征,通常采用 SIFT(Scale-invariantfeaturetransform,尺度不變特征變換)特征,得到該圖片對(duì)應(yīng)的 一個(gè)特征集合:
[0006] I={xj,x2, . . . ,xm}
[0007] 其中,Xni為特征集合中的特征。然后計(jì)算每個(gè)特征到詞典中單詞的距離,并將該特 征賦給最近的單詞。最后,對(duì)于每個(gè)單詞對(duì)應(yīng)的所有特征,做如下計(jì)算:
[0008]
[0009]其中q(x) = (^表示特征x最近的單詞是cVi則是第i個(gè)單詞對(duì)應(yīng)的向量,將所 有單詞對(duì)應(yīng)向量連接起來(lái)就得到了最后的VLAD表示。
[0010] 然而,對(duì)于VLAD圖像表示方法,對(duì)于每個(gè)單詞對(duì)應(yīng)的特征冗余以及噪聲消除問(wèn)題 一直尚未解決,其性能有待提尚。
【發(fā)明內(nèi)容】
[0011] 根據(jù)本申請(qǐng)的第一方面,本申請(qǐng)?zhí)峁┝艘环N基于局部PCA白化的圖像表示方法, 包括:
[0012] 構(gòu)造詞典,將每個(gè)特征賦給相應(yīng)的單詞,將單詞和特征映射到一個(gè)高維度空間,所 述高維度空間的維度高于單詞和特征的當(dāng)前空間的維度;
[0013] 在對(duì)應(yīng)的每個(gè)單詞空間中進(jìn)行主成分分析,得到投影矩陣;
[0014] 根據(jù)所述詞典計(jì)算VLAD圖像表示向量;
[0015] 將所述VLAD圖像表示向量映射到所述高維度空間中;
[0016] 根據(jù)所述投影矩陣將投影得到的VLAD圖像表示向量進(jìn)行投影變換;
[0017] 將投影變換得到的特征進(jìn)行歸一化,得到最后的圖像表示向量。
[0018] 根據(jù)本申請(qǐng)的第二方面,本申請(qǐng)?zhí)峁┝艘环N基于局部PCA白化的圖像表示處理裝 置,包括:
[0019] 第一映射模塊,用于構(gòu)造詞典,將每個(gè)特征賦給相應(yīng)的單詞,將單詞和特征映射到 一個(gè)高維度空間,所述高維度空間的維度高于單詞和特征的當(dāng)前空間的維度;
[0020] 主成分分析模塊,用于在對(duì)應(yīng)的每個(gè)單詞空間中進(jìn)行主成分分析,得到投影矩 陣;
[0021] VLAD計(jì)算模塊,用于根據(jù)所述詞典計(jì)算VLAD圖像表示向量;
[0022] 第二映射模塊,用于將所述VLAD圖像表示向量映射到所述高維度空間中;
[0023] 投影變換模塊,用于根據(jù)所述投影矩陣將投影得到的VLAD圖像表示向量進(jìn)行投 影變換;
[0024] 歸一化處理模塊,用于將投影變換得到的特征進(jìn)行歸一化,得到最后的圖像表示 向量。
[0025] 本申請(qǐng)?zhí)峁┑幕诰植縋CA白化的圖像表示方法和處理裝置,其中,第一映射模 塊構(gòu)造詞典,將每個(gè)特征賦給相應(yīng)的單詞,將單詞和特征映射到一個(gè)高維度空間;主成分分 析模塊在對(duì)應(yīng)的每個(gè)單詞空間中進(jìn)行主成分分析,得到投影矩陣;VLAD計(jì)算模塊根據(jù)所述 詞典計(jì)算VLAD圖像表示向量;第二映射模塊將所述VLAD圖像表示向量映射到所述高維度 空間中;投影變換模塊根據(jù)所述投影矩陣將投影得到的VLAD圖像表示向量進(jìn)行投影變換; 歸一化處理模塊將投影變換得到的特征進(jìn)行歸一化,得到最后的圖像表示向量。對(duì)于得到 的圖像表示向量,首先將其投影到一個(gè)高維度空間中,然后對(duì)提前計(jì)算好的投影矩陣,對(duì)每 個(gè)單詞對(duì)應(yīng)向量進(jìn)行投影變換,得到一個(gè)低維度的向量,這樣使得每個(gè)單詞對(duì)應(yīng)的向量是 一致的。該方法和處理裝置具有更好的魯棒性和更高的性能。
【附圖說(shuō)明】
[0026] 圖1為本申請(qǐng)一種實(shí)施例中基于局部PCA白化的圖像表示處理裝置的模塊示意 圖;
[0027] 圖2為本申請(qǐng)一種實(shí)施例中基于局部PCA白化的圖像表示方法的流程示意圖;
[0028] 圖3為在K-means聚類(lèi)產(chǎn)生的不同單詞空間中,特征的分布示意圖;
[0029] 圖4為在Holidays數(shù)據(jù)集上不同詞典大小的不同方法的比較結(jié)果;
[0030] 圖5為在UKbench數(shù)據(jù)集上不同詞典大小的不同方法的比較結(jié)果;
[0031] 圖6為在Holidays數(shù)據(jù)集上不同詞典大小下使用局部PCA白化和未使用局部PCA 白化的比較結(jié)果;
[0032] 圖7為在UKbench數(shù)據(jù)集上不同詞典大小下使用局部PCA白化和未使用局部PCA 白化的比較結(jié)果。
【具體實(shí)施方式】
[0033] 下面通過(guò)【具體實(shí)施方式】結(jié)合附圖對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)說(shuō)明。
[0034] 本實(shí)施例提供了一種基于局部PCA白化的圖像表示方法和處理裝置。
[0035] 請(qǐng)參考圖1,基于局部PCA白化的圖像表示處理裝置包括第一映射模塊101、主成 分分析模塊l〇2、VLAD計(jì)算模塊103、第二映射模塊104、投影變換模塊105和歸一化處理模 塊 106〇
[0036] 第一映射模塊101用于構(gòu)造詞典,將每個(gè)特征賦給相應(yīng)的單詞,將單詞和特征映 射到一個(gè)高維度空間,高維度空間的維度高于單詞和特征的當(dāng)前空間的維度。
[0037] 主成分分析模塊102用于在對(duì)應(yīng)的每個(gè)單詞空間中進(jìn)行主成分分析,得到投影矩 陣。
[0038]VLAD計(jì)算模塊103用于根據(jù)詞典計(jì)算VLAD圖像表示向量。
[0039] 第二映射模塊104用于將VLAD圖像表示向量映射到高維度空間中。
[0040] 投影變換模塊105用于根據(jù)投影矩陣將投影得到的VLAD圖像表示向量進(jìn)行投影 變換。
[0041] 歸一化處理模塊106用于將投影變換得到的特征進(jìn)行歸一化,得到最后的圖像表 示向量。
[0042] 為了更好地對(duì)本申請(qǐng)進(jìn)行說(shuō)明,下面將基于局部PCA白化的圖像表示方法及其處 理裝置相結(jié)合,對(duì)本申請(qǐng)進(jìn)行說(shuō)明。
[0043] 請(qǐng)參考圖2,基于局部PCA白化的圖像表示方法包括下面步驟:
[0044] 步驟1. 1:第一映射模塊101構(gòu)造詞典,將每個(gè)特征賦給相應(yīng)的單詞,將單詞和特 征映射到一個(gè)高維度空間。高維度空間的維度高于單詞和特征的當(dāng)前空間的維度。
[0045] 本實(shí)施例中,利用K-means算法構(gòu)造詞典,將每個(gè)訓(xùn)練所用特征賦給距離最近的 單詞,將單詞以及特征都顯式映射到一個(gè)高維度空間。具體的,該高維度空間可以是單詞和 特征的當(dāng)前空間的維度的3倍維度。
[0046] 步驟1. 1中,主成分分析模塊102還在對(duì)應(yīng)的每個(gè)單詞空間中進(jìn)行主成分分析,得 到投影矩陣。
[0047] 本實(shí)施例中,投影矩陣通過(guò)下面方式計(jì)算得到:
[0048] 首先根據(jù)下面式子計(jì)算過(guò)渡矩陣&,
[0049]
[0050] 其中q是第i個(gè)單詞,x為賦給該單詞的所有特征,D為特征維度。當(dāng)選擇SIFT 算法進(jìn)行特征描述時(shí),D通常為128。
[0051] 根據(jù)下面式子對(duì)矩陣&做特征分解,得到特征值eigval(GJ和特征向量 eigvect(GJ,按照特征值從大到小的順序排列。
[0052] (Aj, A^) ~~
[0053] (t4; < ?4:)i ^[0054] 根據(jù)下面式子計(jì)算投影矩陣[0055] if -Ll Ui[0056]其中,
[0057]
[0058]
[0059]e和t為預(yù)設(shè)參數(shù),例如設(shè)置e= 0. 00001,t屬于特征維度,可以根據(jù)實(shí)際應(yīng)用 進(jìn)行調(diào)整。
[0060] 步驟1. 2 :VLAD計(jì)算模塊103根據(jù)步驟1. 1構(gòu)造的詞典計(jì)算原始的VLAD圖像表示 向量X。步驟1. 3中采用現(xiàn)有技術(shù)中的VLAD圖像表示方法得到原始的VLAD圖像表示向量 x〇
[0061] 步驟1. 4 :第二映射