一種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法
【專利摘要】本發(fā)明公開一種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法,通過提取包含若干子空間的數(shù)據(jù)集不同視角下的特征;然后將特征學(xué)習(xí)嵌入字典學(xué)習(xí),聯(lián)合學(xué)習(xí)語義投影矩陣和非負(fù)特征投影;加入一致性約束和局部幾何保持約束學(xué)習(xí)多視角所共享的公共聚類標(biāo)簽,在多個(gè)約束下學(xué)習(xí)各視角的語義投影矩陣、參數(shù)表示矩陣及多視角共享的語義投影矩陣,完成多視角聚類。該方法可以挖掘出多視角所共享的公共語義標(biāo)簽,并且加入一致性約束,減少單獨(dú)的聚類標(biāo)簽與公共語義標(biāo)簽之間的差異性,同時(shí)加入局部幾何保持約束,使得具有相似結(jié)構(gòu)的數(shù)據(jù)更大概率分到相同的類。
【專利說明】
-種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及模式識(shí)別技術(shù)領(lǐng)域,尤其是一種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚 類方法。
【背景技術(shù)】
[0002] 在現(xiàn)實(shí)中,很多數(shù)據(jù)都有多個(gè)模態(tài),例如,文章可W被翻譯成多種語言、新聞可W 從多個(gè)視角報(bào)道、圖片可W由多種描述子描述。一般而言,多視角數(shù)據(jù)可W提供互補(bǔ)和兼容 的信息。多視角聚類是一種無監(jiān)督的多視角學(xué)習(xí)方法,已經(jīng)引起了人們的關(guān)注。過去的工作 主要分為兩類:基于回歸的方法和基于子空間的方法。雖然運(yùn)些方法都取得了顯著的提高, 但是它們是有局限性的。因?yàn)檫\(yùn)些方法都假設(shè)所給的特征是無噪聲的,運(yùn)些數(shù)據(jù)可W掲示 潛在的聚類結(jié)構(gòu)。但不幸的是,現(xiàn)實(shí)生活中的特征常常是冗余的且含有噪聲,運(yùn)極大地降低 了上述方法的性能。因此亟需一種高效魯棒的多視角聚類方法。
【發(fā)明內(nèi)容】
[0003] 鑒于W往方法不能有效的滿足魯棒多視角聚類的需要,本發(fā)明提出了一種基于非 負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法。該方法用特征投影學(xué)習(xí)聚類標(biāo)簽,使用語義投影探 索潛在語義信息,同時(shí)加入一致性約束和局部幾何保持約束W生成一個(gè)多視角共享的公共 聚類標(biāo)簽,從而實(shí)現(xiàn)多視角聚類。
[0004] 本發(fā)明是運(yùn)樣實(shí)現(xiàn)的,一種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法,包括W 下步驟:
[0005] SI,提取多模態(tài)數(shù)據(jù)庫中的多模態(tài)特征;
[0006] S2,基于所述多模態(tài)數(shù)據(jù)庫中的特征向量,通過字典學(xué)習(xí)得到語義投影矩陣和參 數(shù)表示矩陣;
[0007] S3,向所述多模態(tài)數(shù)據(jù)庫嵌入非負(fù)特征投影W處理噪聲特征;
[000引S4,根據(jù)所述參數(shù)表示矩陣,創(chuàng)建一致性約束,用于描述多視角下各個(gè)樣本聚類標(biāo) 簽與多視角所共享的公共標(biāo)簽之間的一致性;
[0009] S5,根據(jù)所述多模態(tài)數(shù)據(jù)庫中各個(gè)模態(tài)的特征,創(chuàng)建局部幾何保持約束,用于描述 每個(gè)視角下樣本間結(jié)構(gòu)的相似性;
[0010] S6,根據(jù)所述語義投影矩陣、非負(fù)特征投影、一致性約束和局部幾何保持約束,得 到統(tǒng)一的目標(biāo)函數(shù);
[0011] S7,求解所述目標(biāo)函數(shù)得到公共語義標(biāo)簽,根據(jù)所述公共語義標(biāo)簽,得到公共的聚 類結(jié)果,完成多視角聚類。
[0012] 本發(fā)明方法假設(shè)數(shù)據(jù)是冗余的且有噪聲,通過學(xué)習(xí)非負(fù)特征投影處理噪聲特征, 利用一致性約束最小化單獨(dú)聚類標(biāo)簽與共享標(biāo)簽之間的差異,利用局部幾何保持約束保持 數(shù)據(jù)的局部一致性,使得相似數(shù)據(jù)具有較大概率,具有相同的語義標(biāo)簽;同時(shí)考慮特征投 影、一致性約束和局部幾何保持約束,將其納入到統(tǒng)一的子空間聚類框架,采用近端交替線 性最小化算法優(yōu)化目標(biāo)函數(shù),得到公共語義標(biāo)簽,完成多視角聚類。
[0013] 根據(jù)本發(fā)明的方法,可挖掘出多視角所共享的公共語義標(biāo)簽,并且加入一致性約 束,減少單獨(dú)的聚類標(biāo)簽與公共語義標(biāo)簽之間的差異性,同時(shí)加入局部幾何保持約束,使得 具有相似結(jié)構(gòu)的數(shù)據(jù)更大概率分到相同的類。
【附圖說明】
[0014] 圖1是基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法流程圖。
【具體實(shí)施方式】
[0015] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,W下結(jié)合具體實(shí)施例,并參照 附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
[0016] 如圖1所示,本發(fā)明的基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法包括W下步驟:
[0017] 步驟SI,提取包含若干子空間的多模態(tài)數(shù)據(jù)庫中的多模態(tài)特征;
[0018] 多模態(tài)數(shù)據(jù)即同一數(shù)據(jù)有不同的表現(xiàn)形式,如視頻數(shù)據(jù)可由音頻和圖像流組成, 圖片數(shù)據(jù)可由圖像本身視覺信息和標(biāo)記單詞信息組成。對(duì)不同模態(tài)的數(shù)據(jù)分別提取特征, 如提取圖片視覺信息的GIST特征,標(biāo)記單詞的詞頻特征等。
[0019] 多模態(tài)特征是包括含有圖片和標(biāo)記單詞一一對(duì)應(yīng)的圖像標(biāo)記對(duì)。
[0020] 步驟S2,基于所述多模態(tài)數(shù)據(jù)庫中的特征向量,通過字典學(xué)習(xí)得到語義投影矩陣 和參數(shù)表示矩陣;
[0021] 在該步驟中,采用字典學(xué)習(xí)方法來學(xué)習(xí)多模態(tài)數(shù)據(jù)庫中的特征向量的語義投影矩 陣和參數(shù)表示矩陣。語義投影矩陣是探索模態(tài)特征的語義信息,在字典學(xué)習(xí)中是字典;參數(shù) 表示矩陣是模態(tài)特征在所學(xué)字典上的表達(dá)。
[0022] 所述字典學(xué)習(xí)的目標(biāo)函數(shù)為:
[0023]
>
[0024] 其中,義=扣..一,,]居0<''^"為始隹的非負(fù)訓(xùn)練數(shù)據(jù),11為樣本數(shù)目,[/扣&'為語義投 影矩陣,r為聚類標(biāo)簽個(gè)數(shù),F(xiàn)e日""為參數(shù)表示矩陣,I I ? Mf為求取F-范數(shù)操作,Q {U,V} 代表約束項(xiàng)。
[0025] 步驟S3,向所述多模態(tài)數(shù)據(jù)庫嵌入非負(fù)特征投影;
[0026] 所述的非負(fù)特征投影是原始噪聲數(shù)據(jù)到所述參數(shù)表達(dá)的線性投影V = WTx, W為線 性投影矩陣,WT為矩陣W的轉(zhuǎn)置,可有效處理含有噪聲的數(shù)據(jù)。
[0027] 步驟S4,根據(jù)所述參數(shù)表示矩陣,創(chuàng)建一致性約束,用于描述多視角下各個(gè)樣本聚 類標(biāo)簽與多視角所共享的公共標(biāo)簽之間的一致性;
[0028] 該步驟中,一致性約束是描述多視角下各個(gè)樣本聚類標(biāo)簽與多視角所共享的公共 標(biāo)簽之間的一致性,因?yàn)槎鄠€(gè)視角隱含地表達(dá)相同的對(duì)象。所述一致性約束公式如下:
[0029]
[0030] 其中,C為模態(tài)序號(hào),Wc為第C個(gè)模態(tài)的特征投影矩陣,Wj為矩陣Wc的轉(zhuǎn)置,Xc為第C 個(gè)模態(tài)的特征,公共語義標(biāo)簽。
[0031 ]步驟S5,根據(jù)所述多模態(tài)數(shù)據(jù)庫中各個(gè)模態(tài)的特征,創(chuàng)建局部幾何保持約束,用于 描述每個(gè)視角下樣本間結(jié)構(gòu)的相似性。
[0032] 在該步驟中,局部幾何保持約束描述每個(gè)視角下樣本間結(jié)構(gòu)的相似性,假設(shè)具有 相似結(jié)構(gòu)的樣本具有相似的語義,因此,具有相似結(jié)構(gòu)的樣本更大概率屬于同一聚類標(biāo)簽。
[0033]
[0034] 其中m是模態(tài)數(shù)目,i J為樣本序號(hào),n為樣本數(shù)目,A。為第C個(gè)模態(tài)的權(quán)重系數(shù),V* (:,i)表示矩陣八的第i列,V"是矩陣轉(zhuǎn)置,Lc = Dc-Sc是親和矩陣Sc的拉普拉斯矩陣,D。 為第C個(gè)模態(tài)的對(duì)角矩陣,Dc(U) = EAQJ),第C個(gè)模態(tài)的親和矩陣Sc如下定義:
[0035]
','
[0036] 其中,Nk(X)為樣本X的k近鄰。
[0037] 步驟S6,根據(jù)所述語義投影矩陣、非負(fù)特征投影、一致性約束和局部幾何保持約 束,得到統(tǒng)一的目標(biāo)函數(shù)。
[003引所述目標(biāo)函數(shù)為:
[0039]
,
[0040] 其中,Uc為第C個(gè)模態(tài)的語義投影矩陣,Wc是第C個(gè)模態(tài)特征的線性投影矩陣,a, 0為 權(quán)重參數(shù),〇,0£[10^,104],瓜為第(3個(gè)模態(tài)的特征,¥^3公共語義標(biāo)簽,||.1|2,1為求取矩 陣的2,1范數(shù)操作,L是每個(gè)模態(tài)拉普拉斯矩陣的加權(quán)和,I為單位矩陣。
[0041] 所述統(tǒng)一的目標(biāo)函數(shù)放縮處理后如下:
[00491
,.
[004引其中,J為目標(biāo)函數(shù),V。為第C個(gè)模態(tài)的輔助變量。
[0044] 步驟S7,求解所述目標(biāo)函數(shù)得到公共語義標(biāo)簽,根據(jù)所述公共語義標(biāo)簽,得到公共 的聚類結(jié)果,完成多視角聚類。
[0045] 該步驟中,求解所述統(tǒng)一的目標(biāo)函數(shù)方法可W是采用近端交替線性最小化算法, 具體步驟如下:
[0046] S71,初始化W,取V咚,F(xiàn)*。,e = 1,...,m,和迭代次數(shù)N,上標(biāo)0表示第0次迭代;
[0047] S72,求解第t+1次迭代第C個(gè)模態(tài)的投影矩陣t/.'+i:
[004引
[0049] 其中,叫>1是常數(shù)
曼目標(biāo)函數(shù)J關(guān)于Uc的偏導(dǎo)數(shù),巧『是矩陣 巧的轉(zhuǎn)置,巧為第t次迭代的第C個(gè)模態(tài)的投影矩陣,巧是第t次迭代的第C個(gè)模態(tài)的輔助變 量,利普席茨模量 [0化0] S73,求解 W/";
[0化1 ]
,
[0化2]其中,Wc'+I為第t+1次迭代的第C個(gè)模態(tài)的投影矩陣,Qw是常數(shù),取值范圍是Qw>l, 目標(biāo)函數(shù)J關(guān)于W。的偏導(dǎo)數(shù)J和利普席茨模量與計(jì)算如下:
[0化3]
[0化4]
[005引其中,a,e為權(quán)重參數(shù),X。為第C個(gè)模態(tài)的特征向量,Oft為對(duì)角矩陣
'其中!^'(人:)為矩陣形的第j行,I I . Ih為求取矩陣的2范數(shù),W/為 第t次迭代的第C個(gè)模態(tài)的投影矩陣。[0化6] S74,求解巧+1:
[0化7]
[0化引
[0化9]其中,Qv>l是常數(shù),1%是Vc的利普席茨模量,Vg J是目標(biāo)函數(shù)相對(duì)于Vc的偏導(dǎo)數(shù), 是第t+1次迭代的第C個(gè)模態(tài)的中間變量,F(xiàn)Ti是第t+1次迭代的第C個(gè)模態(tài)的輔助變量。
[0060] S75,求解
[0061]
[0062]
[006;3]其中,(V節(jié)"是第t+1次迭代的公共語義標(biāo)簽,是常數(shù),取值范圍心/ >1,與?是公 共語義標(biāo)簽V巧勺利普席茨模量,Vj是目標(biāo)函數(shù)J相對(duì)于公共語義標(biāo)簽勺偏導(dǎo)數(shù)。
[0064] S76,轉(zhuǎn) S72,直至t = N,N為迭代次數(shù),N=30。
[0065] 通過W上目標(biāo)函數(shù)的求解得到公共語義標(biāo)簽后,根據(jù)所述公共語義標(biāo)簽,得到公 共的聚類結(jié)果,即可完成多視角聚類。
[0066] 為了驗(yàn)證本發(fā)明的實(shí)施效果,接下來W化seal V0C2007數(shù)據(jù)庫為例說明。該數(shù)據(jù) 庫包含9963個(gè)圖像-文本對(duì),共計(jì)20類,即對(duì)應(yīng)20個(gè)語義標(biāo)簽。具體步驟如下:
[0067] SI,將訓(xùn)練集中多類別的圖片W及沒有標(biāo)記詞對(duì)應(yīng)的圖片去除,得到5649圖像和 標(biāo)記詞對(duì)。提取圖片的GIST特征W及標(biāo)記詞的詞頻特征。
[006引S2,給定參數(shù)日,0,丫,、W及聚類數(shù)目m,k = l,. . .,m)。
[0069] S3,初始化戶。,仁= :1,...,機(jī),和迭代次數(shù)N=30。
[0070] S4,迭代執(zhí)行步驟S72-S75,得出公共語義標(biāo)簽。
[0071] S5,根據(jù)公共語義標(biāo)簽完成多視角聚類。
[0072] W上所述的具體實(shí)施例,對(duì)本發(fā)明的目的、技術(shù)方案和效果進(jìn)行了進(jìn)一步詳細(xì)說 明,所應(yīng)理解的是,W上所述僅為本發(fā)明的具體實(shí)施例而已,并不用于限制本發(fā)明,凡在本 發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范 圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于非負(fù)字典對(duì)學(xué)習(xí)的魯棒多視角聚類方法,包括步驟: Sl,提取多模態(tài)數(shù)據(jù)庫中的多模態(tài)特征; 52, 基于所述多模態(tài)數(shù)據(jù)庫中的特征向量,通過字典學(xué)習(xí)得到語義投影矩陣和參數(shù)表 示矩陣; 53, 向所述多模態(tài)數(shù)據(jù)庫嵌入非負(fù)特征投影以處理噪聲特征; S4,根據(jù)所述參數(shù)表示矩陣,創(chuàng)建一致性約束,用于描述多視角下各個(gè)樣本聚類標(biāo)簽與 多視角所共享的公共標(biāo)簽之間的一致性; 55, 根據(jù)所述多模態(tài)數(shù)據(jù)庫中各個(gè)模態(tài)的特征,創(chuàng)建局部幾何保持約束,用于描述每個(gè) 視角下樣本間結(jié)構(gòu)的相似性; 56, 根據(jù)所述語義投影矩陣、非負(fù)特征投影、一致性約束和局部幾何保持約束,得到統(tǒng) 一的目標(biāo)函數(shù); S7,采用近端交替線性最小化算法求解優(yōu)化所述目標(biāo)函數(shù),得到公共語義標(biāo)簽,根據(jù)所 述公共語義標(biāo)簽,得到公共的聚類結(jié)果,完成多視角聚類。2. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述字典學(xué)習(xí)的目標(biāo)函數(shù)為: mm\\X-UV\fF + a{U,V\ , \j .V 其中,工二匕…七:^口^為狀隹的非負(fù)訓(xùn)練數(shù)據(jù)^為樣本數(shù)目"如~為語義投影矩 陣,r為聚類標(biāo)簽個(gè)數(shù),F(xiàn)eD yxn為參數(shù)表示矩陣,I I · I |F為求取F-范數(shù)操作,Ω{υ,ν}代表 約束項(xiàng)。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟S3中所述非負(fù)特征投影是非負(fù)線性投 影V=WtX,W為線性投影矩陣,W t為矩陣W的轉(zhuǎn)置。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,步驟S4中,所述一致性約束公式如下:其中,c為模態(tài)序號(hào),W。為第c個(gè)模態(tài)的特征投影矩陣,Wct為矩陣W。的轉(zhuǎn)置,X。為第c個(gè)模 態(tài)的特征,f為公共語義標(biāo)簽。5. 根據(jù)權(quán)利要求4所述方法,其特征在于,步驟S5中所述局部幾何保持約束如下:其中m是模態(tài)數(shù)目,i,j為樣本序號(hào),η為樣本數(shù)目,λ。為第c個(gè)模態(tài)的權(quán)重系數(shù),:,i) 表示矩陣f的第i列,V#是矩陣f的轉(zhuǎn)置,U = DrSc^是親和矩陣S。的拉普拉斯矩陣,D。為第c 個(gè)模態(tài)的對(duì)角矩陣,DJ i,i) = Σ $。( i,j),第c個(gè)模態(tài)的親和矩陣S。如下定義: 其中,Nk(X)為樣本X的k近鄰。6. 根據(jù)權(quán)利要求5所述方法,其特征在于,步驟S6中,所述統(tǒng)一的目標(biāo)函數(shù)如下表示:其中,U。為第c個(gè)模態(tài)的語義投影矩陣,W。是第c個(gè)模態(tài)特征的線性投影矩陣,α,β為權(quán)重 參數(shù),〇#^[1〇4,1〇4],1為第(3個(gè)模態(tài)的特征,,為公共語義標(biāo)簽,||叫| 2,1為求取矩陣的 2,1范數(shù)操作,L是每個(gè)模態(tài)拉普拉斯矩陣的加權(quán)和,I為單位矩陣; 所述統(tǒng)一的目標(biāo)函數(shù)放縮處理后如下:其中,J為目標(biāo)函數(shù),V。為第c個(gè)模態(tài)的輔助變量。7.根據(jù)權(quán)利要求6所述方法,其特征在于,所述近端交替線性最小化算法采用如下求 解: S71,初始化W,= ...,m,和迭代次數(shù)N,上標(biāo)O表示第O次迭代; 572, 求解第t+Ι次迭代第c個(gè)模態(tài)的投影矩陣CC1:其中,au>l是常數(shù)是目標(biāo)函數(shù)J關(guān)于U。的偏導(dǎo)數(shù),是矩陣E的 轉(zhuǎn)置,£/:為第t次迭代的第c個(gè)模態(tài)的投影矩陣,K是第t次迭代的第c個(gè)模態(tài)的輔助變量, 利普席茨模I573, 求解 fF/+1 :其中,廣為第t+1次迭代的第c個(gè)模態(tài)的投影矩陣,aw是常數(shù),取值范圍是aw>1,目標(biāo) 函數(shù)J關(guān)于W。的偏導(dǎo)數(shù)和利普席茨模量計(jì)算如下:其中,a,β為權(quán)重參數(shù),X。為第c個(gè)模態(tài)的特征向量,為對(duì)角矩陣!其中<(./,:)為矩陣醉的第j行,U · I h為求取矩陣的2范數(shù),<為 第t次迭代的第c個(gè)模態(tài)的投影矩陣; 574, 求解 Ff1i其中,αν>ι是常數(shù),&是V。的利普席茨模量,'Jr是目標(biāo)函數(shù)相對(duì)于V。的偏導(dǎo)數(shù),if 1 是第t+1次迭代的第C個(gè)模態(tài)的中間變量,Jf1是第t+1次迭代的第C個(gè)模態(tài)的輔助變量; 375,求解(〇*+1:其中,)t+1是第t+Ι次迭代的公共語義標(biāo)簽,%是常數(shù),取值范圍《V >1,卜是公共語 義標(biāo)簽f的利普席茨模量,是目標(biāo)函數(shù)J相對(duì)于語義標(biāo)簽f的偏導(dǎo)數(shù)。 S76,轉(zhuǎn)S72,直至t = N,N為迭代次數(shù),N=30。
【文檔編號(hào)】G06K9/62GK106022351SQ201610270303
【公開日】2016年10月12日
【申請(qǐng)日】2016年4月27日
【發(fā)明人】譚鐵牛, 曹冬, 赫然, 孫哲南, 李志航
【申請(qǐng)人】天津中科智能識(shí)別產(chǎn)業(yè)技術(shù)研究院有限公司