一種社會媒體下的圖像集摘要生成算法
【專利摘要】本發(fā)明公開了一種社會媒體下的圖像集摘要生成算法,首先提取社會媒體下的圖像集中圖像的視覺特征;然后對提取的局部特征和全局特征進行融合和匹配;接著利用最優(yōu)特征點的空間約束關(guān)系構(gòu)成空間位置地圖并構(gòu)成簡化的幾何約束代表數(shù)據(jù)集,進一步濾除噪聲點;其次建立基于近鄰傳播的自動聚類模型;最后采用聚類有效性指標(biāo)查找一組最優(yōu)類中心。本發(fā)明能夠充分利用圖像的多模態(tài)特征,對社會媒體下的圖像集中大量相關(guān)圖像進行摘要,從而準(zhǔn)確生成一組最優(yōu)代表性圖像。
【專利說明】一種社會媒體下的圖像集摘要生成算法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及社會媒體圖像集的分析與檢索領(lǐng)域,具體是一種社會媒體下的圖像集 摘要生成算法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展和多媒體技術(shù)的廣泛應(yīng)用,互聯(lián)網(wǎng)地位不斷提升,并 成為人們交流和共享信息的主要平臺。網(wǎng)絡(luò)用戶自發(fā)貢獻圖片和視頻等多媒體資料,并通 過分享、評價、討論等方式傳播,從而海量的圖片潮水般的涌向網(wǎng)絡(luò)。在如此浩瀚的圖片海 洋中,找到那個我們想要的圖片并非易事。當(dāng)我們發(fā)起一個查詢,返回給我們的是一個龐大 的多媒體圖片集隊列,并且有大量內(nèi)容重復(fù)或部分重復(fù)的數(shù)據(jù),同時也包含相當(dāng)數(shù)量與查 詢內(nèi)容弱相關(guān)或不相關(guān)的數(shù)據(jù)。如何快速并且準(zhǔn)確地從這樣一個充斥著大量冗余和噪聲數(shù) 據(jù)的大規(guī)模圖片集合中瀏覽和獲取用戶所需信息,已經(jīng)成為迫切需要解決的問題。
[0003] 近年來,圖像集摘要作為一種有效的信息處理方法,得到了學(xué)術(shù)界越來越多的關(guān) 注。目前存在的圖像集的摘要技術(shù),主要使用尺度不變的局部SIFT特征作為圖像的視覺特 征,SIFT特征雖然有較好的穩(wěn)定性,但由其特征維度較高,所以計算代價較大。
[0004] 在數(shù)據(jù)挖掘領(lǐng)域,聚類是一種非常有效的將輸入空間劃分成簇的無監(jiān)督模式分類 方法,被廣泛應(yīng)用于模式識別、數(shù)據(jù)分析、信息檢索等領(lǐng)域。聚類分析從數(shù)據(jù)集中發(fā)現(xiàn)數(shù)據(jù) 間的相似性,并根據(jù)相似性對數(shù)據(jù)進行分類,同一簇內(nèi)的數(shù)據(jù)盡可能相似,不同簇間的數(shù)據(jù) 盡可能的相異,其目標(biāo)是識別數(shù)據(jù)集的自然結(jié)構(gòu)。但是,目前所提出的聚類分析用于圖像集 摘要生成時,存在以下的缺陷和不足:
[0005] 第一,傳統(tǒng)的聚類方法需要預(yù)先給定簇的個數(shù),或者對一個基本的數(shù)據(jù)集假設(shè)一 些可能的分布。這些需求具有不可操作性,因為用戶在聚類分析之前可能并沒有這方面的 信息。很多聚類方法只能憑經(jīng)驗指定簇個數(shù)。簇個數(shù)越少使得計算簡單但數(shù)據(jù)集劃分的準(zhǔn) 確度低,簇個數(shù)越高使得數(shù)據(jù)集的劃分準(zhǔn)確度高但摘要圖像有冗余。
[0006] 第二、傳統(tǒng)的聚類算法依賴于初始聚類中心,所以結(jié)果往往不穩(wěn)定。
[0007] 第三,一個最優(yōu)的聚類算法是不存在的,沒有一個聚類方法適合于所有的數(shù)據(jù)集。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的是提供一種社會媒體下的圖像集摘要生成算法,以避免現(xiàn)有技術(shù)所 存在的不足之處,能夠充分利用圖像的視覺特征,對互聯(lián)網(wǎng)平臺的社會化圖像集自動生成 摘要,從而準(zhǔn)確地表示出與事件最相關(guān)的一組社會化圖像。
[0009] 為了達到上述目的,本發(fā)明所采用的技術(shù)方案為:
[0010] 一種社會媒體下的圖像集摘要生成算法,其特征在于:包括以下步驟:
[0011] ⑴、提取社會媒體圖像集I中圖像Ii (1彡i彡η)的視覺特征,其中包括局部SURF 特征、全局顏色特征和紋理特征,然后構(gòu)建特征空間矩陣;
[0012] (2)、匹配特征空間,用最近鄰比率找到一組最優(yōu)匹配點對,構(gòu)造空間地圖,對于任
[0013] 意N個匹配點,第i個和第j個匹配點的位置關(guān)系使得空間信息表Μ中元素取值如公式(1)、 公式⑵所示,
【權(quán)利要求】
1. 一種社會媒體下的圖像集摘要生成算法,其特征在于:包括以下步驟: (1) 、提取社會媒體圖像集I中圖像Ii (1 < i < Π )的視覺特征,其中包括局部SURF特 征、全局顏色特征和紋理特征,然后構(gòu)建特征空間矩陣; (2) 、匹配特征空間,用最近鄰比率找到一組最優(yōu)匹配點對,構(gòu)造空間地圖,對于任意N 個匹配點,第i個和第j個匹配點的位置關(guān)系使得空間信息表Μ中元素取值如公式(1)、公 式⑵所示,
其中^為Μ矩陣的第i行第j列的元素,Xi、yi分別是匹配點i的坐標(biāo),\、t分別是 匹配點j的坐標(biāo),根據(jù)匹配點最近鄰比率越小正確率越高的特點,挑選前T個最優(yōu)匹配點, 兩兩組合分別構(gòu)造 A'=(彳個參考坐標(biāo),對應(yīng)兩個匹配點a和b,且a〈b,以a點為中心,a點指 向b點的方向作為X軸正方向,從而確定了坐標(biāo)旋轉(zhuǎn)角度β如公式(3)所示:
其中,xa、ya是a點坐標(biāo),xb、yb是b點坐標(biāo)。 匹配點(x,y)在新坐標(biāo)系下的坐標(biāo)(xk,yk)如公式⑷所示:
那么形成了 3維空間約束矩陣Μ如公式(5)、公式(6)所示:
其中,k e l,2,L,K; (3) 簡化隨機抽樣一致性擬合初始模型參數(shù)的過程,選擇少數(shù)最優(yōu)匹配點作為初始樣 本數(shù)據(jù),可以通過設(shè)置盡量少的迭代次數(shù)來得到盡量真實的單應(yīng)性矩陣參數(shù), 選擇投影變換矩陣作為圖像變換模型,變換關(guān)系如公式(7)所示:
這里,(x2,y2)是原圖像中點坐標(biāo)(Xl,yi)經(jīng)過投影變換后的點坐標(biāo),A,h 8是單 應(yīng)性矩陣參數(shù),ω為尺度因子。這是8個參數(shù)的投影變換,至少需要4個匹配對來生成,利 用最小二乘法求解這8個參數(shù),如公式(8)所示:
其中,
Η = IX h2 h3 h4 h5 h6 h7 h8] (10)
先設(shè)尺度因子ω = 1,得到H的一組值,再用此值計算出ω的值,進行多次迭代求出穩(wěn) 定的Η, 初始樣本數(shù)據(jù)數(shù)目η由公式(12)所示: n = min {N0, max {n0, n0 log2yN0}} (12) 這里隊是一次匹配的匹配點數(shù)目,并且隊彡4,?為樣本數(shù)目步長,μ為比例因數(shù); (4) 、待配準(zhǔn)的兩幅圖像根據(jù)相應(yīng)的匹配對分別產(chǎn)生空間約束矩陣,和Μ,對,和Μ 矩陣中的異值點進行統(tǒng)計,生成異值矩陣W如公式(13)所示:, W(i,j,k)=M,(i, j,k) ? M(i, j,k) (13) 為了確保匹配精度,K值選擇應(yīng)大于2,但考慮到運算速度,K取值又不能過大,一般選 擇K = 3,最后得到特征點在空間約束矩陣下的錯誤率為屯如公式(14)所示:
設(shè)模型參數(shù)變換得到匹配點坐標(biāo)值與實際坐標(biāo)的距離值為+,根據(jù)式(15)進行匹配點 判別,由于透視變換矩陣僅為少數(shù)數(shù)據(jù)得出,不能保證求得最精確的結(jié)果,所以采用兩個約 束條件相互補充,如公式(15)所示: φ · djd+α )< y (15) 公式中a為比例因子,γ均為距離閾值; (5) 、建立基于近鄰傳播的自動聚類模型,采用對分搜索方法輸出一系列簇數(shù)目的聚類 結(jié)果,設(shè)定有效性指標(biāo)L,通過對結(jié)果的L指標(biāo)分析進而確定最佳簇數(shù)目如公式(16)所示:
其中,ACID為平均最小類間距離,ACOD為平均類間距離,如公式(17)、(18)所示:
(6) 、根據(jù)有效性指標(biāo)找到最優(yōu)的聚類數(shù)目對應(yīng)著對圖像集的分類,同時獲得一組聚類 中心作為這個數(shù)據(jù)集的一組代表圖像,并構(gòu)成圖像集摘要。
【文檔編號】G06F17/30GK104123382SQ201410376990
【公開日】2014年10月29日 申請日期:2014年7月31日 優(yōu)先權(quán)日:2014年7月31日
【發(fā)明者】趙燁, 洪日昌, 汪萌, 劉學(xué)亮, 郝世杰 申請人:合肥工業(yè)大學(xué)