專利名稱:圖像檢索方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像檢索技術(shù),特別是涉及一種圖像檢索方法和裝置。
背景技術(shù):
基于關(guān)鍵詞的圖像檢索技術(shù)是當(dāng)前主流的圖像檢索技術(shù),然而由于錯(cuò)誤標(biāo)簽的存在以及檢索關(guān)鍵詞語言的模糊性,通過基于關(guān)鍵詞的圖像檢索技術(shù)檢索得到圖像通常不夠準(zhǔn)確。
發(fā)明內(nèi)容
基于此,有必要針對現(xiàn)有圖像檢索技術(shù)的檢索結(jié)果不夠準(zhǔn)確的問題,提供一種能夠提高檢索精度的圖像檢索方法和裝置。一種圖像檢索方法,包括如下步驟獲取檢索關(guān)鍵字,并根據(jù)檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合;根據(jù)圖像特征建立圖像集合的第一譜圖模型,得到圖像集合中的兩兩圖像之間的相似關(guān)系;根據(jù)相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型;根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,得到去噪圖像集合;返回去噪圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。一種圖像檢索裝置,包括獲取模塊,用于獲取檢索關(guān)鍵字,并根據(jù)檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合;建模模塊,用于根據(jù)圖像特征建立圖像集合的第一譜圖模型,得到圖像集合中的兩兩圖像之間的相似關(guān)系;學(xué)習(xí)模塊,用于根據(jù)相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型;去噪模塊,用于根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,得到去噪圖像集合;發(fā)送模塊,用于返回去噪圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。上述圖像檢索方法和裝置,通過獲取檢索關(guān)鍵字,并根據(jù)檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合,根據(jù)圖像特征建立圖像集合的第一譜圖模型,得到圖像集合中的兩兩圖像之間的相似關(guān)系,根據(jù)相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型,根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,得到去噪圖像集合,返回去噪圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果,通過在對檢索到的圖像集合進(jìn)行全局去噪,提高了圖像檢索的精確度。
圖1為一個(gè)實(shí)施例中圖像檢索方法流程示意圖;圖2為一個(gè)實(shí)施例中圖像檢索裝置結(jié)構(gòu)示意圖;圖3為在另一個(gè)實(shí)施例中圖像檢索方法的流程示意圖。
具體實(shí)施例方式下面結(jié)合具體的實(shí)施例及附圖對圖像檢索方法和裝置的技術(shù)方案進(jìn)行詳細(xì)的描述,以使其更加清楚。如圖1所示,在一個(gè)實(shí)施例中,一種圖像檢索方法,包括如下步驟S110,獲取檢索關(guān)鍵字,并根據(jù)檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合。本實(shí)施例中,獲取用戶在搜索引擎中輸入的用于檢索圖像的字詞作為關(guān)鍵字,根據(jù)該關(guān)鍵字從圖像數(shù)據(jù)庫中或者其他包含有圖的數(shù)據(jù)庫中篩選圖像,可以是根據(jù)對圖像的描述、圖像名稱、圖像所在網(wǎng)頁的內(nèi)容等基于文本的檢索技術(shù)。S130,根據(jù)圖像特征建立圖像集合的第一譜圖模型,得到圖像集合中的兩兩圖像之間的相似關(guān)系。本實(shí)施例中,先獲取圖像集合中的獲取圖像特征值,如圖像的RGB值(紅綠藍(lán)三個(gè)顏色的強(qiáng)度值)、亮度值、色調(diào)、飽和度或者圖層數(shù)等圖像特征。根據(jù)該圖像特征值建立圖像的特征向量,該特征向量是多維向量,每一維通過一種圖像特征值表示。根據(jù)特征向量將圖像集合通過第一節(jié)點(diǎn)集合X = (X1, ···, XnI表示,其中Xn是一個(gè)多維向量,每個(gè)Xn代表一張圖像,Xn的一個(gè)維度表示一個(gè)特征值,將圖像通過節(jié)點(diǎn)集合中的一個(gè)向量表示,便于后續(xù)計(jì)算。根據(jù)第一節(jié)點(diǎn)集合建立關(guān)系矩陣W,當(dāng)i關(guān)j時(shí),Wij = exp (-1 | X1-Xj | |2/ σ 2),當(dāng)i=j時(shí),Wij = 0,通過關(guān)系矩陣W表示各圖像之間的相似度關(guān)系。進(jìn)一步的,對相似矩陣W做歸一化處理,將圖像之間的相似度關(guān)系通過O與I之間的數(shù)據(jù)表示,得第一歸一化邊矩陣
S = D_1/2WD_1/2,其中D是對角元素為4 =U; 的對角矩陣,即該對角元素為Wij所在列的所有元素的和。歸一化邊矩陣是基于兩兩節(jié)點(diǎn)之間的相互關(guān)系建立的,可用于發(fā)掘節(jié)點(diǎn)集合的內(nèi)部結(jié)構(gòu)。 S150,根據(jù)相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型。本實(shí)施例中,先獲取第一節(jié)點(diǎn)集合中前P個(gè)節(jié)點(diǎn),將P個(gè)節(jié)點(diǎn)標(biāo)定為正樣本,例如,對于η個(gè)節(jié)點(diǎn)的集合X = (X1,…,χρ, χρ+1,…,χη},其前P個(gè)節(jié)點(diǎn)被標(biāo)定為正樣本,P可為預(yù)設(shè)值,也可通過譜聚類算法對節(jié)點(diǎn)結(jié)合進(jìn)行計(jì)算得到。定義查詢向量y,y是一個(gè)多維向量,對于已標(biāo)定節(jié)點(diǎn),y = Yi = I (i ^ P),對于未標(biāo)定節(jié)點(diǎn),y = yu = O (p+1 ^ u ^ η), Yi或者yu是多維向量y中的一個(gè)維度的值。定義預(yù)測標(biāo)簽向量f,其中fi(l i η)表示節(jié)點(diǎn)Xi預(yù)測標(biāo)簽,f是多維向量。進(jìn)一步的,根據(jù)定義的y和f建立預(yù)測標(biāo)簽向量f的能量函數(shù)
nff. 2Π
令—~/=)λ)2其中μ是平衡因子,可以是預(yù)設(shè)值,
hM λ/^ιιμ卜丨
f f 2
d =Yil WI彳是平滑風(fēng)險(xiǎn)項(xiàng),若Xi和Xj有較大的Wij,則保持仁和仁更
U V /-尸 I ' ψη 扎
η
接近-ΣΚ -Λ):是經(jīng)驗(yàn)風(fēng)險(xiǎn)項(xiàng),保持f與原始的標(biāo)定I相比變化不大。最后,根據(jù)該能量函數(shù)E(f)對f求微分可得E(f)的全局最小解f= (1-α)(1-aSrY也就是得到的半監(jiān)督學(xué)習(xí)模型,其中a = 1/(1+μ),I是單位矩陣,S =D-l/2WD-l/2,其中D是對角元素為4 =[; t %的對角矩陣。將檢索得到的圖像集合中排在前P位的圖像作為正樣本,設(shè)置其標(biāo)簽為1,將圖像集合中其他圖像的標(biāo)簽設(shè)置為0,將設(shè)置好標(biāo)簽的圖像集合組成二進(jìn)制向量y,通過半監(jiān)督學(xué)習(xí)模型計(jì)算,可以求得重新排序分?jǐn)?shù)f。對f種的每以維數(shù)值從大到小排序,可得節(jié)點(diǎn)序列,可以對圖像集合進(jìn)行重新排序,排在前列的節(jié)點(diǎn)和正樣本中的節(jié)點(diǎn)排列順序比較接近。S170,根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,得到去噪圖像集合。在一個(gè)實(shí)施例中,上述步驟S170具體包括以下步驟根據(jù)半監(jiān)督學(xué)習(xí)模型獲取單節(jié)點(diǎn)預(yù)測的標(biāo)簽,得到標(biāo)簽矩陣F* = (1-QS)-1Ly1.…,yi,-,yn] = (1-asr1其中是基于單節(jié)點(diǎn)標(biāo)定的查詢向量V而對Xi的預(yù)測標(biāo)簽;根據(jù)標(biāo)簽矩陣進(jìn)行譜聚類分析,得到多個(gè)類團(tuán);
ryscore 1V、^ t -*根據(jù)所簽矩陣及類團(tuán)定義所述節(jié)點(diǎn)的主導(dǎo)分?jǐn)?shù)為乃 =LjJ,-根據(jù)不等式Aif)</ 杉(¥(/·'',)判斷噪聲類團(tuán),其中Af(該示對類團(tuán)c中的數(shù)據(jù)取平均,IfU表示對k個(gè)類團(tuán)取平均,β是預(yù)設(shè)值;去除噪聲類團(tuán)所對應(yīng)的噪聲圖像集合,得到去噪圖像集合。本實(shí)施例中,半監(jiān)督模型中的節(jié)點(diǎn)通常會形成主要的類團(tuán),而噪聲圖像對應(yīng)的節(jié)點(diǎn)會稀釋類團(tuán)的密度,可以將位于同一幾何形狀內(nèi)的節(jié)點(diǎn)當(dāng)作同一個(gè)類團(tuán),而噪聲則是離散的異常值。具體可以通過學(xué)習(xí)一個(gè)映射g(·)將原始空間扭曲到新的空間熾力「R",使得所有的異常值能形成一個(gè)新的類團(tuán),且所有的類團(tuán)相互分開,這樣便于將噪聲去除。根據(jù)半監(jiān)督學(xué)習(xí)模型獲取單節(jié)點(diǎn)預(yù)測的標(biāo)簽,得到標(biāo)簽矩陣F* = (1-QS)-1Ly1.…,Yi, -,Yn] = (1-a Sr1其中,/·:,4是基于單節(jié)點(diǎn)標(biāo)定的查詢向量V而對Xi的預(yù)測標(biāo)簽,如果Xi和\屬于同一類團(tuán)的值應(yīng)較大,且<和在各維度k = 1,…,η的值較相近,而異常節(jié)點(diǎn)在幾乎所有維度的值應(yīng)該較小。定義映射g: X -Rn,:然后基于x* = g(x)建立譜圖,得到歸一化邊矩陣s*和歸一化圖拉普拉斯L* =1-S*,令Ην,ΛΧ ι}為L*的特征值和特征向量對,且λ i彡…(λη。L*是塊狀對角矩陣,同一類團(tuán)之間的元素?fù)碛休^大的絕對值。L*較小的部分特征值對應(yīng)的特征向量保持著同樣的塊狀結(jié)構(gòu),令其組成Uk= [Vl,V2,…,vk],其中k是X*中類團(tuán)的數(shù)量,可由L*的從小到大排列的特征值中`第k個(gè)與第k+Ι個(gè)出現(xiàn)最大間隔值所決定。然后用K均值法將{(人(/,·)};!,聚成k類,其中包括由離散的噪聲節(jié)點(diǎn)形成的類。如果對F*每行求和,噪聲對應(yīng)的行其和較小。根據(jù)標(biāo)簽矩陣及類團(tuán)定義Xi的主導(dǎo)分?jǐn)?shù)為Mk胃:同時(shí)用C e {I,…,k}
表示類團(tuán)的標(biāo)號。則可以根據(jù)不等式¥ η < β硬(η)判斷噪聲類團(tuán),其中f 表示對類團(tuán)C中的數(shù)據(jù)取平均,f ο表示對k個(gè)類團(tuán)取平均,β是閾值因子,可以是預(yù)設(shè)值,去除噪聲類團(tuán)所對應(yīng)的噪聲圖像集合后,即得到去噪圖像集合。S190,返回去噪圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。
本實(shí)施例中,將去噪后的圖像集合返回給搜索引擎,作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果,即完成圖像的檢索。上述圖像檢索方法,通過獲取檢索關(guān)鍵字,并根據(jù)檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得至IJ圖像集合,根據(jù)圖像特征建立圖像集合的第一譜圖模型,得到圖像集合中的兩兩圖像之間的相似關(guān)系,根據(jù)相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型,根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,得到去噪圖像集合,返回去噪圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果,通過在對檢索到的圖像集合進(jìn)行全局去噪,提高了圖像檢索的精確度。在一個(gè)實(shí)施例中,上述步驟S190具體包括以下步驟對去噪圖像集合建立第二譜圖模型,得到去噪圖像集合所對應(yīng)的第二節(jié)點(diǎn)集合X ’以及基于X ’的第二歸一化邊矩陣S’ ;根據(jù)譜圖模型建立最大化函數(shù)
權(quán)利要求
1.一種圖像檢索方法,包括如下步驟 獲取檢索關(guān)鍵字,并根據(jù)所述檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合; 根據(jù)圖像特征建立所述圖像集合的第一譜圖模型,得到所述圖像集合中的兩兩圖像之間的相似關(guān)系; 根據(jù)所述相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型; 根據(jù)所述半監(jiān)督學(xué)習(xí)模型對所述圖像集合進(jìn)行去噪,得到去噪圖像集合; 返回所述去噪圖像集合作為所述檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的圖像檢索方法,其特征在于,所述根據(jù)圖像特征建立所述圖像集合的第一譜圖模型,得到所述圖像集合中的兩兩圖像之間的相似關(guān)系的步驟包括 獲取圖像特征值,建立圖像的特征向量; 根據(jù)所述特征向量將所述圖像集合通過第一節(jié)點(diǎn)集合X = (X1, ···, χη}表示,其中χη是一個(gè)多維向量,χη的一個(gè)維度表示一個(gè)特征值; 根據(jù)所述第一節(jié)點(diǎn)集合建立關(guān)系矩陣W,其中,當(dāng)i關(guān)j時(shí),Wij = exp (- |χ「χ」| V σ 2);當(dāng) i = j 時(shí),Wij = O ; 對所述相似矩陣W做歸一化處理得第一歸一化邊矩陣S = D_1/2WD_1/2,其中D是對角元素為
3.根據(jù)權(quán)利要求2所述的圖像檢索方法,其特征在于,所述根據(jù)所述相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型的步驟包括 獲取所述第一節(jié)點(diǎn)集合中前P個(gè)節(jié)點(diǎn),將所述P個(gè)節(jié)點(diǎn)標(biāo)定為正樣本; 定義查詢向量y,其中對于已標(biāo)定節(jié)點(diǎn),y = Yi = I (i≤ p),對于未標(biāo)定節(jié)點(diǎn),y = yu =O(p+1 ≤ u ≤ η); 定義預(yù)測標(biāo)簽向量f,其中fi(l ≤ i ≤ η)表示節(jié)點(diǎn)xi預(yù)測標(biāo)簽; 建立所述預(yù)測標(biāo)簽向量f的能量函數(shù)
4.根據(jù)權(quán)利要求3所述的圖像檢索方法,其特征在于,所述根據(jù)所述半監(jiān)督學(xué)習(xí)模型對所述圖像集合進(jìn)行去噪,得到去噪圖像集合的步驟為 根據(jù)所述半監(jiān)督學(xué)習(xí)模型獲取單節(jié)點(diǎn)預(yù)測的標(biāo)簽,得到標(biāo)簽矩陣F* = (1-QS)-1Ly1.…,Y1, -,yn] = (1-asr1其中是基于單節(jié)點(diǎn)標(biāo)定的查詢向量V而對Xi的預(yù)測標(biāo)簽;根據(jù)所述標(biāo)簽矩陣進(jìn)行譜聚類分析,得到多個(gè)類團(tuán); 根據(jù)所述標(biāo)簽矩陣及類團(tuán)定義所述節(jié)點(diǎn)的主導(dǎo)分?jǐn)?shù)為
5.根據(jù)權(quán)力要求4所述的圖像檢索方法,其特征在于,所述返回所述去噪圖像集合作為所述檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果的步驟為 對所述去噪圖像集合建立第二譜圖模型,得到所述去噪圖像集合所對應(yīng)的第二節(jié)點(diǎn)集合X ’以及基于X ’的第二歸一化邊矩陣s’ ;根據(jù)所述第二譜醒型建立最大化函數(shù)
6.一種圖像檢索裝置,包括 獲取模塊,用于獲取檢索關(guān)鍵字,并根據(jù)所述檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合; 建模模塊,用于根據(jù)圖像特征建立所述圖像集合的第一譜圖模型,得到所述圖像集合中的兩兩圖像之間的相似關(guān)系; 學(xué)習(xí)模塊,用于根據(jù)所述相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型; 去噪模塊,用于根據(jù)所述半監(jiān)督學(xué)習(xí)模型對所述圖像集合進(jìn)行去噪,得到去噪圖像集合; 發(fā)送模塊,用于返回所述去噪圖像集合作為所述檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。
7.根據(jù)權(quán)利要求6所述的圖像檢索裝置,其特征在于,所述建模模塊還用于獲取圖像特征值,建立圖像的特征向量,根據(jù)所述特征向量將所述圖像集合通過第一節(jié)點(diǎn)集合X ={χ1; ···, xj表示,其中χη是一個(gè)多維向量,χη的一個(gè)維度表示一個(gè)特征值,根據(jù)所述第一節(jié)點(diǎn)集合建立關(guān)系矩陣W,其中,當(dāng)i關(guān)j時(shí),Wij = exp (- |χ「χ」| I2/。2);當(dāng)i = j時(shí),Wij=0,對所述相似矩陣W做歸一化處理得第一歸一化邊矩陣S = D_1/2WD_1/2,其中D是對角元素為
8.根據(jù)權(quán)利要求7所述的圖像檢索裝置,其特征在于,所述根據(jù)所述學(xué)習(xí)模塊還用于獲取所述第一節(jié)點(diǎn)集合中前P個(gè)節(jié)點(diǎn),將所述P個(gè)節(jié)點(diǎn)標(biāo)定為正樣本,定義查詢向量y,其中對于已標(biāo)定節(jié)點(diǎn),y = Yi = I (i p),對于未標(biāo)定節(jié)點(diǎn),y = yu = O (p+1彡u彡η),定義預(yù)測標(biāo)簽向量f,其中fi(l < i < η)表示節(jié)點(diǎn)Xi預(yù)測標(biāo)簽,建立所述預(yù)測標(biāo)簽向量f的能量 函數(shù)
9.根據(jù)權(quán)利要求8所述的圖像檢索轉(zhuǎn)裝置,其特征在于,所述根據(jù)所述去噪模塊還用于根據(jù)所述半監(jiān)督學(xué)習(xí)模型獲取單節(jié)點(diǎn)預(yù)測的標(biāo)簽,得到標(biāo)簽矩陣F*= (1-QS)-1Ly1.-,yi,-,yn] = (1-aSr1其中,<是基于單節(jié)點(diǎn)標(biāo)定的查詢向量V而對Xi的預(yù)測標(biāo)簽,根據(jù)所述標(biāo)簽矩陣進(jìn)行譜聚類分析,得到多個(gè)類團(tuán),根據(jù)所述標(biāo)簽矩陣及類團(tuán)定義所述節(jié)點(diǎn)的主導(dǎo)分?jǐn)?shù)為
10.根據(jù)權(quán)力要求9所述的圖像檢索裝置,其特征在于,所述發(fā)送模塊還用于對所述去噪圖像集合建立第二譜圖模型,得到所述去噪圖像集合所對應(yīng)的第二節(jié)點(diǎn)集合X’以及基于X’的第二歸一化邊矩陣s',根據(jù)所述第二譜圖模型建立最大化函數(shù)
全文摘要
本發(fā)明提供一種圖像檢索方法和裝置。所述方法包括獲取檢索關(guān)鍵字,并根據(jù)所述檢索關(guān)鍵字從數(shù)據(jù)庫中篩選得到圖像集合;根據(jù)圖像特征建立所述圖像集合的第一譜圖模型,得到所述圖像集合中的兩兩圖像之間的相似關(guān)系;根據(jù)所述相似關(guān)系建立半監(jiān)督學(xué)習(xí)模型;根據(jù)所述半監(jiān)督學(xué)習(xí)模型對所述圖像集合進(jìn)行去噪,得到去噪圖像集合;返回所述去噪圖像集合作為所述檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果。上述圖像檢索方法和裝置,通過建立圖像集合的譜圖模型,建立半監(jiān)督學(xué)習(xí)模型,根據(jù)半監(jiān)督學(xué)習(xí)模型對圖像集合進(jìn)行去噪,返回去噪后的圖像集合作為檢索關(guān)鍵字所對應(yīng)的檢索結(jié)果,在對檢索到的圖像集合進(jìn)行全局去噪,提高了圖像檢索的精確度。
文檔編號G06F17/30GK103064941SQ20121057237
公開日2013年4月24日 申請日期2012年12月25日 優(yōu)先權(quán)日2012年12月25日
發(fā)明者陳世峰, 曹琛 申請人:深圳先進(jìn)技術(shù)研究院