欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于稀疏降維的譜哈希索引方法

文檔序號(hào):6603946閱讀:186來(lái)源:國(guó)知局

專利名稱::基于稀疏降維的譜哈希索引方法
技術(shù)領(lǐng)域
:本發(fā)明涉及圖像搜索方法,尤其涉及一種基于稀疏降維的譜哈希索引方法。
背景技術(shù)
:隨著互聯(lián)網(wǎng)的不斷發(fā)展,傳統(tǒng)圖像搜索方法中索引機(jī)制已很難滿足用戶高層次需求,以指數(shù)級(jí)迅猛增長(zhǎng)的海量數(shù)據(jù)給提高搜索引擎效率帶來(lái)了巨大挑戰(zhàn)。當(dāng)前,海量圖像數(shù)據(jù)呈現(xiàn)高維、多階特性。對(duì)于給定的互聯(lián)網(wǎng)圖像數(shù)據(jù),其中提取的視覺特征等動(dòng)輒成百上千,這些高維數(shù)據(jù)給圖像的相似度計(jì)算和語(yǔ)義分析帶來(lái)了諸多困難。為了提高高維圖像數(shù)據(jù)處理效率,下述三種方法被廣泛研究,成為國(guó)際國(guó)內(nèi)學(xué)術(shù)執(zhí)占·1)流形學(xué)習(xí)。近來(lái),研究者已普遍認(rèn)識(shí)到數(shù)據(jù)所具有高維特征本質(zhì)上被有限自由度決定,分析數(shù)據(jù)幾何拓?fù)浞植冀Y(jié)構(gòu)不僅能優(yōu)化數(shù)據(jù)間相似性計(jì)算,也能夠大大降低計(jì)算復(fù)雜度,這一方面代表性工作是“流形學(xué)習(xí)”。流形學(xué)習(xí)理論通過構(gòu)建離散數(shù)據(jù)間形成的相鄰圖,應(yīng)用譜分析手段獲得高維特征內(nèi)嵌子空間,包括等距映射(IS0MAP)、局部線性嵌入(LLE)和保局投影(LPP)等代表性方法。作為一種有效的高維降維手段,流形學(xué)習(xí)在圖像語(yǔ)義理解和計(jì)算機(jī)視覺等領(lǐng)域得到了深入研究和廣泛應(yīng)用。2)變量選擇(VariableSelection)。在數(shù)據(jù)分析過程中,當(dāng)樣本特征維數(shù)遠(yuǎn)遠(yuǎn)大于樣本數(shù)目時(shí),傳統(tǒng)方法難以準(zhǔn)確進(jìn)行數(shù)據(jù)預(yù)測(cè)與識(shí)別,斯坦福大學(xué)Tibshirani和加州大學(xué)伯克利分校Breiman幾乎同時(shí)提出了對(duì)特征系數(shù)施以I1-范式約束的lassoQeastabsolutionshrinkageandselectionoperator)思想,促使被選擇出來(lái)的特征盡可能稀疏,以保證結(jié)果穩(wěn)定性和提高數(shù)據(jù)處理過程的可解釋性(interpretable)。由于從圖像中可提取特征眾多,如何從高維數(shù)據(jù)中尋找有效稀疏表達(dá),在稀疏表達(dá)基礎(chǔ)上理解圖像所蘊(yùn)含語(yǔ)義,成為當(dāng)前計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域一個(gè)發(fā)展趨勢(shì)。3)高維索引。與海量環(huán)境中文本檢索可以按照字典序通過倒排表和Pat數(shù)組等模型進(jìn)行高效索引不同,從多媒體數(shù)據(jù)提取的無(wú)序高維特征難以進(jìn)行以字典序?yàn)榛A(chǔ)高效索引。目前以R樹、K-D-B樹及X樹等樹形結(jié)構(gòu)為代表的多維索引技術(shù)雖然取得了一些進(jìn)展,然而研究表明大多數(shù)多維索引結(jié)構(gòu)的時(shí)間開銷為指數(shù)級(jí),不適合維數(shù)過高的情況(比如幾十維),其查詢效率甚至低于對(duì)原始數(shù)據(jù)進(jìn)行順序掃描的查詢效率。同時(shí),如何保證數(shù)據(jù)的語(yǔ)義索引(SemanticHashing),即在索引空間中所計(jì)算相似度與在原始高維空間中所計(jì)算相似度保持一致,成為熱點(diǎn)問題。如何利用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)高維數(shù)據(jù)的“語(yǔ)義索引”。為了提高高維數(shù)據(jù)相似度匹配的效率,一些索引方法被相繼提出。在這一方面,LSH(LocalitySensitiveHash)是一種代表性的高維特征索引技術(shù)。LSH通過一組哈希函數(shù)的映射結(jié)果達(dá)到高維索引目的。在LSH中,所使用的哈希函數(shù)必須滿足如下條件任意兩個(gè)高維數(shù)據(jù)通過哈希函數(shù)作映射時(shí)發(fā)生沖突概率正比于數(shù)據(jù)點(diǎn)在原始高維空間之間距離。這樣,任意兩個(gè)相似的高維數(shù)據(jù)通過哈希函數(shù)會(huì)以很大概率被分配到哈希表中同一項(xiàng)中。由于LSH是基于概率模型產(chǎn)生編碼,在實(shí)際應(yīng)用中難以保證穩(wěn)定的表現(xiàn),往往會(huì)產(chǎn)生令人難以滿意的結(jié)果。從圖1可以看出,隨著編碼位數(shù)的上升,LSH的準(zhǔn)確率提升比較緩慢,而迭代收斂的速度也可能非常慢。機(jī)器學(xué)習(xí)的思路被引入索引方法后產(chǎn)生了RBM(restrictedBoltzmannmachine-RBM)和stumpBoostingSSC等方法。RBM利用一種兩層無(wú)向圖形學(xué)的模型,產(chǎn)生RBM機(jī)來(lái)處理指數(shù)型分布族。該模型最底層代表原空間向量,最高層代表得到的數(shù)據(jù)二進(jìn)制編碼,最頂上的兩層形成了一個(gè)無(wú)向兩偶圖,其余層形成了一個(gè)有向的自上而下聯(lián)系的信念網(wǎng)絡(luò)。每層均通過訓(xùn)練RBM機(jī),得到隱藏變量。預(yù)處理完,每一層各自的RBM展開用以建立一個(gè)深的自動(dòng)編碼器。如果隨機(jī)的二進(jìn)制特征活動(dòng)是確定的、實(shí)值概率,那么我們可以通過整個(gè)網(wǎng)絡(luò)反向傳播來(lái)微調(diào)計(jì)數(shù)數(shù)據(jù)的最佳重建的權(quán)重。為了讓編碼成為二進(jìn)制編碼,可從底層向高層的輸入加入高斯噪聲,由每個(gè)編碼單元接受。圖1顯示了RBM相較于LSH有更好的表現(xiàn)。將RBM應(yīng)用于海量數(shù)據(jù)檢索,可較之LSH取得幾個(gè)數(shù)量級(jí)的效率提高。但是由于RBM自身方法的復(fù)雜性,在保證精確的同時(shí)大大地犧牲了效率。“Boosting”是一種提高任何學(xué)習(xí)方法性能的常用方法。它通過在訓(xùn)練數(shù)據(jù)的不同分布上反復(fù)運(yùn)行一個(gè)給定的弱學(xué)習(xí)方法來(lái)工作的,然后結(jié)合由弱學(xué)習(xí)器產(chǎn)生的單個(gè)復(fù)合的分類器。在Boosting方法中,每個(gè)弱學(xué)習(xí)器是一個(gè)決定樁(decisionstump),對(duì)于輸入數(shù)據(jù),所有弱學(xué)習(xí)器的輸出是一個(gè)二進(jìn)制編碼。圖1顯示了這種Boosting程序同樣比LSH編碼奏效,但是稍弱于RBM。但是,Boosting仍然面臨方法復(fù)雜度較高和高維索引效率較低的問題。為了克服上述問題,基于譜分析的哈希函數(shù)(spectralhashing)被提出。譜哈希對(duì)高維數(shù)據(jù)樣本集引入特征函數(shù)(eigenfunction),通過主成份分析(Principlecomponentanalysis,PCA)對(duì)高維數(shù)據(jù)降維后的結(jié)果直接進(jìn)行二元編碼,不僅提高了索引效率,而且在索引空間中所計(jì)算樣本距離與高維空間所計(jì)算樣本距離能保持一致。但是,譜哈希編碼過程中將使用PCA對(duì)原始空間進(jìn)行降維。PCA雖然是常用的數(shù)據(jù)降維方式,但PCA求得的主成分是幾乎所有原始變量的線性組合,而實(shí)際中降維所得的變量往往僅與原始的某幾個(gè)變量有關(guān)?;谶@點(diǎn),本發(fā)明引入SparsePCA(SPCA)的方法,對(duì)譜哈希方法進(jìn)行了改進(jìn)。
發(fā)明內(nèi)容本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提供一種基于稀疏降維的譜哈希索引方法?;谙∈璞磉_(dá)和拉普拉斯圖的哈希索引方法包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對(duì)于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(X,y,σ)=G(x,yσ)*Ι(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),G(xjp)=^^e+2+^/2σ2(x,y)是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下D(x,y,σ)=(G(χ,y,kσ)-G(χ,y,σ))ΦΙ(χ,y)=L(χ,y,kσ)-L(χ,y,σ)k為不同尺度空間的變化系數(shù),計(jì)算每個(gè)像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個(gè)像素點(diǎn)以及相鄰尺度空間的9個(gè)像素點(diǎn),共26個(gè)像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個(gè)方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個(gè)關(guān)鍵像素點(diǎn)為中心,四周取64個(gè)像素點(diǎn),每相鄰的4個(gè)像素點(diǎn)為一像素組,共得到16像素組,每個(gè)像素組的四個(gè)像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個(gè)關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下八個(gè)方向上,得到8個(gè)坐標(biāo)值,共得到128個(gè)坐標(biāo)值,為一個(gè)圖像底層特征。所述的對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個(gè)作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個(gè)聚類中心的距離,并將其加入距離最近的一類中,取各個(gè)類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時(shí)所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個(gè)視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來(lái)表示原始圖像。所述的利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測(cè)試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣ΣΣ=E[(X-E[X])(X-E(X))τ]其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣ΣΣ=Σ-(PtΣρ)ρρτ重復(fù)這一過程直到找到Σ的m個(gè)稀疏主成分{Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B。所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個(gè)列向量為Β(:,」),則<可以定義如下,2S2π§k其中k=1,...和巧"J分別表示B(:,j0的最大值和最小值,ε是一個(gè)常數(shù)。這樣對(duì)于每一個(gè)列向量Β(:,Λ,求得,因此共得到NXm個(gè)=…iV;/=l,…w)。排序《,取前m個(gè)巧記為,...,《in},假設(shè)對(duì)應(yīng)于Xi的二元編碼是yie{_l,l}m,則其第j個(gè)映射值y(i,j)由如下映射函數(shù)求得^rKTTy('·’J)=(Sfa,B(U0)-sin(-+———B(i,t))1BCJ)其中Vn為{W..,《m}的第j個(gè)最小值,它由k和B的第t列求得,和分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(l,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。所述的對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{_1,1}組成的向量,向量之間的距離用漢明距離來(lái)度量,即將同維度向量之間不同元素的個(gè)數(shù)作為向量之間的距離,對(duì)于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個(gè)向量所對(duì)應(yīng)的原始圖像,如果有多個(gè)向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。本發(fā)明與現(xiàn)有技術(shù)相比具有的有益效果1)本發(fā)明用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性;2)本發(fā)明將歐氏空間的搜索問題映射到漢明空間,大大提高了搜索效率。圖1是LSH、RBM、stumpsboostingSSC方法的比較。在海明距離2作為搜索半徑,隨著維度增加各種方法的準(zhǔn)確率;圖2是本發(fā)明與譜哈希和RBM方法在Fl評(píng)價(jià)系統(tǒng)下的對(duì)比結(jié)果,其中點(diǎn)劃線為本發(fā)明結(jié)果,實(shí)線為譜哈希結(jié)果,虛線為RBM結(jié)果;圖3是本發(fā)明與譜哈希和RBM方法在AUC評(píng)價(jià)系統(tǒng)下的對(duì)比結(jié)果,其中點(diǎn)劃線為本發(fā)明結(jié)果,實(shí)線為譜哈希結(jié)果,虛線為RBM結(jié)果。具體實(shí)施例方式基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對(duì)于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(X,y,σ)=G(x,yσ)*Ι(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),((χ,;;,σ)二/2σ2(x,y)是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下D(x,y,σ)=(G(χ,y,kσ)-G(χ,y,σ))ΦΙ(χ,y)=L(χ,y,kσ)-L(χ,y,σ)k為不同尺度空間的變化系數(shù),計(jì)算每個(gè)像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個(gè)像素點(diǎn)以及相鄰尺度空間的9個(gè)像素點(diǎn),共26個(gè)像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個(gè)方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個(gè)關(guān)鍵像素點(diǎn)為中心,四周取64個(gè)像素點(diǎn),每相鄰的4個(gè)像素點(diǎn)為一像素組,共得到16像素組,每個(gè)像素組的四個(gè)像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個(gè)關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下八個(gè)方向上,得到8個(gè)坐標(biāo)值,共得到128個(gè)坐標(biāo)值,為一個(gè)圖像底層特征。所述的對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個(gè)作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個(gè)聚類中心的距離,并將其加入距離最近的一類中,取各個(gè)類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時(shí)所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個(gè)視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來(lái)表示原始圖像。所述的利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測(cè)試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣ΣΣ=E[(X-E[X])(X-E(X))τ]其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣ΣΣ=Σ-(PtΣρ)ρρτ重復(fù)這一過程直到找到Σ的m個(gè)稀疏主成分{Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B0所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個(gè)列向量為8(:」.),則<可以定義如下£2knk~TB^-BmJnSj=l-e其中k=1,...隊(duì)巧二和巧分別表示B(:,j0的最大值和最小值,ε是一個(gè)常數(shù)。這樣對(duì)于每一個(gè)列向量Β(:』,求得N個(gè)^,因此共得到NXm個(gè)《0=l,…iV;_/=l,…m)。排m],取前m個(gè)《記為,...,Cin},假設(shè)對(duì)應(yīng)于Xi的二元編碼是yie{_l,l}m,則其第j個(gè)映射值y(i,j)由如下映射函數(shù)求得ητΚ.7Γy(Uj)二Θ(Vn,B(i,0)-sin(-+B(i,t))2\t)其中^"in為丨丨的第j個(gè)最小值,它由k和B的第t列求得,A=和Sg分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(l,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。所述的對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{_1,1}組成的向量,向量之間的距離用漢明距離來(lái)度量,即將同維度向量之間不同元素的個(gè)數(shù)作為向量之間的距離,對(duì)于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個(gè)向量所對(duì)應(yīng)的原始圖像,如果有多個(gè)向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。實(shí)施例我們?cè)赥REC-V2009數(shù)據(jù)集上具體實(shí)現(xiàn)了上述方法。在所有關(guān)鍵幀中隨機(jī)選取3047幅圖像作為原始圖像,利用度可變高斯函數(shù)計(jì)算每一個(gè)像素點(diǎn),得到關(guān)鍵像素點(diǎn),提取圖像底層特征,再用k-means方法表示為300維空間的視覺單詞的向量,從而形成原始圖像特征矩陣X。再通過下述方法步驟得到漢明空間向量。輸入原始訓(xùn)練圖像集合X和編碼長(zhǎng)度m;輸出每幅圖像的二元編碼;方法描述步驟1計(jì)算X的協(xié)方差矩陣Σ;步驟2計(jì)算Σ的m個(gè)稀疏主成分得到矩陣M;步驟3:B=XXM;步驟4計(jì)算矩陣Σ的NXm個(gè)《并升序排列;步驟5將B映射到漢明空間。另外隨機(jī)抽取45幅圖像作為待檢索圖像,計(jì)算求得待檢索圖像與原始圖像的漢明距離,返回相似圖像。返回結(jié)果與現(xiàn)有技術(shù)譜哈希、RBM的對(duì)比結(jié)果如圖2、圖3所示??梢钥闯?,我們的方法優(yōu)于現(xiàn)有方法。權(quán)利要求一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法,其特點(diǎn)在于包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征;2)對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用Kmeans方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量;3)利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量;4)利用有權(quán)重的拉普拉斯貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量;5)對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像。2.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的將原始圖像利用SIFT方法提取圖像底層特征,得到具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征步驟為對(duì)于包含N幅原始圖像的訓(xùn)練集,定義圖像的尺度空間L(x,y,σ)為如下公式L(x,y,σ)=G(χ,yσ(χ,y)其中G(x,y,σ)是尺度可變高斯函數(shù),是空間坐標(biāo),σ是尺度坐標(biāo),I(x,y)是圖像的像素值,則利用不同尺度坐標(biāo)生成高斯差分尺度空間D(x,y,σ),公式如下k為不同尺度空間的變化系數(shù),計(jì)算每個(gè)像素點(diǎn)的D(χ,y,σ),并與其相鄰的8個(gè)像素點(diǎn)以及相鄰尺度空間的9個(gè)像素點(diǎn),共26個(gè)像素點(diǎn)進(jìn)行比較,找到變化最大的像素點(diǎn),即為原始圖像的關(guān)鍵像素點(diǎn);關(guān)鍵像素點(diǎn)26個(gè)方向中變化最大的方向作為關(guān)鍵像素點(diǎn)的變化方向,以每個(gè)關(guān)鍵像素點(diǎn)為中心,四周取64個(gè)像素點(diǎn),每相鄰的4個(gè)像素點(diǎn)為一像素組,共得到16像素組,每個(gè)像素組的四個(gè)像素點(diǎn)的方向做向量相加得到像素組的方向,再投射到每個(gè)關(guān)鍵像素點(diǎn)的上、下、左、右、左上、右上、左下、右下Λ個(gè)方向上,得到8個(gè)坐標(biāo)值,共得到128個(gè)坐標(biāo)值,為一個(gè)圖像底層特征。3.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特征在于所述的對(duì)具有旋轉(zhuǎn)不變性和規(guī)模不變性的圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞,從而將原始圖像表示為高維空間的視覺單詞的向量步驟為用m表示降維的維度,將所有圖像底層特征中的前m個(gè)作為m類,各自為自己的聚類中心,然后將剩余的圖像底層特征分別計(jì)算與各個(gè)聚類中心的距離,并將其加入距離最近的一類中,取各個(gè)類所有圖像底層特征的算術(shù)平均作為新的聚類中心,重復(fù)這一過程直至收斂,此時(shí)所有圖像底層特征聚為m類,將每類的中心作為視覺單詞,統(tǒng)計(jì)每幅圖像中每個(gè)視覺單詞出現(xiàn)的次數(shù),得到的m維向量用來(lái)表示原始圖像。4.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的利用直接的稀疏主成分分析方法對(duì)高維空間的視覺單詞的向量進(jìn)行降維并稀疏化,得到低維空間的視覺單詞的稀疏向量步驟為將原始圖像構(gòu)成的向量作為行向量將訓(xùn)練集和測(cè)試集表示成矩陣形式,即原集合的特征矩陣X,根據(jù)如下公式計(jì)算特征矩陣的協(xié)方差矩陣Σ其中E表示期望計(jì)算,T表示矩陣轉(zhuǎn)置,利用半正定約束近似計(jì)算協(xié)方差矩陣Σ的稀疏主成分P,并利用如下公式更新矩陣Σ重復(fù)這一過程直到找到Σ的m個(gè)稀疏主成分(Pl,...,pm},將這些主成分向量作為矩陣的列向量,得到矩陣M,從而通過B=XXM得到新的NXm的低維空間的稀疏向量矩陣B。5.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的利用有權(quán)重的拉普拉斯_貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),從而將低維空間的視覺單詞的稀疏向量轉(zhuǎn)化為低維漢明空間向量步驟為定義矩陣B的第j個(gè)列向量為Β(:,Λ,則<可以定義如下其中k=1,...N,巧1^和巧分別表示B(…)的最大值和最小值,ε是一個(gè)常數(shù)。這樣對(duì)于每一個(gè)列向量Β(:,」),求得N個(gè)《,因此共得到NXm個(gè)==...m)。排序<,取前m個(gè)<記為WZnin,...,δΓ},假設(shè)對(duì)應(yīng)于Xi的二元編碼是Yie{-l,l}m,則其第j個(gè)映射值y(i,j)由如下映射函數(shù)求得其中為{f,...jj3}的第j個(gè)最小值,它由k和B的第t列求得,《廠和辟分別表示B(:,t)的最大值和最小值,i=(i,...N),j=(1,...m),以0作為閾值,所得值大于0則用1表示,否則則用-1表示,將歐式空間向量其轉(zhuǎn)化為二元編碼,即是漢明空間向量。6.根據(jù)權(quán)利要求1所述的一種基于稀疏表達(dá)和拉普拉斯圖的哈希方法,其特點(diǎn)在于所述的對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果,得到待檢索的圖像的相似圖像步驟為漢明空間向量是由{-1,1}組成的向量,向量之間的距離用漢明距離來(lái)度量,即將同維度向量之間不同元素的個(gè)數(shù)作為向量之間的距離,對(duì)于待檢索的圖像,得到漢明空間向量與原始圖像的漢明空間向量之間的漢明距離,返回漢明距離最近的一個(gè)向量所對(duì)應(yīng)的原始圖像,如果有多個(gè)向量與待檢索圖像的漢明距離相等,則全部作為待檢索的圖像的相似圖像返回。全文摘要本發(fā)明公開了一種基于稀疏表達(dá)和拉普拉斯圖的哈希索引方法。包括如下步驟1)將原始圖像利用SIFT方法提取圖像底層特征;2)對(duì)圖像底層特征利用K-means方法進(jìn)行聚類,用每個(gè)聚類中心作為視覺單詞;3)利用直接的稀疏主成分分析方法對(duì)視覺單詞的向量進(jìn)行降維并稀疏化;4)利用有權(quán)重的拉普拉斯-貝爾特拉米算子的特征方程和特征根,求得歐氏空間到漢明空間的映射函數(shù),得到低維漢明空間向量;5)對(duì)于待檢索的圖像,在低維漢明空間中計(jì)算待檢索的圖像與原始圖像的漢明距離,作為圖像相似度計(jì)算結(jié)果。本發(fā)明用稀疏降維方式代替譜哈希的主成分分析降維方式,增加了結(jié)果的可解釋性;將歐氏空間的搜索問題映射到漢明空間,大大提高了搜索效率。文檔編號(hào)G06F17/30GK101894130SQ201010196539公開日2010年11月24日申請(qǐng)日期2010年6月8日優(yōu)先權(quán)日2010年6月8日發(fā)明者吳飛,張嘯,邵健申請(qǐng)人:浙江大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
志丹县| 吴桥县| 南皮县| 清涧县| 铜梁县| 宜城市| 桃江县| 林州市| 延川县| 疏附县| 文昌市| 普安县| 高密市| 邯郸市| 靖边县| 山阳县| 镇远县| 哈巴河县| 阿拉尔市| 满洲里市| 株洲县| 陇西县| 瓮安县| 常德市| 万荣县| 台北县| 于田县| 宁安市| 大洼县| 仙游县| 瓮安县| 故城县| 勐海县| 云梦县| 洛南县| 博罗县| 怀安县| 怀安县| 峨眉山市| 娄烦县| 聂荣县|