欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

面向Web2.0標(biāo)簽圖片共享空間的圖片檢索聚類方法

文檔序號:6579066閱讀:175來源:國知局

專利名稱::面向Web2.0標(biāo)簽圖片共享空間的圖片檢索聚類方法
技術(shù)領(lǐng)域
:本發(fā)明涉及對海量圖片進(jìn)行檢索聚類處理相關(guān)的技術(shù),特別是涉及一種面向Web2.0標(biāo)簽圖片共享空間的圖片結(jié)果聚類方法。
背景技術(shù)
:近年來,互聯(lián)網(wǎng)上出現(xiàn)了越來越多的針對文本和多媒體內(nèi)容的標(biāo)簽應(yīng)用系統(tǒng),比如,Del.icio.us提供網(wǎng)頁書簽的聯(lián)合標(biāo)簽,同樣的,有像針對學(xué)術(shù)論文發(fā)表領(lǐng)域的CiteUlike,針對圖像標(biāo)簽共享的Flickr,以及針對視頻標(biāo)簽共享的Youtube,等等,這些商業(yè)應(yīng)用的成功也印證了打標(biāo)簽是一項(xiàng)很好的聯(lián)合共享途徑,標(biāo)簽檢索已成為信息檢索領(lǐng)域一種普遍而受歡迎的方法,然而,基于標(biāo)簽的檢索普遍存在著語義偏差和一定的局限性,比如,不同用戶使用不同標(biāo)簽(比如同義詞、單復(fù)數(shù)等)描述同一個事物,因此打標(biāo)簽本身存在不一致性,標(biāo)簽本身的多義性也導(dǎo)致查詢語義模糊,如何在檢索時捕獲這種不一致性,并快速對檢索結(jié)果進(jìn)行聚類,有效區(qū)分多義性成為學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注的問題之一;目前已有許多圖像檢索系統(tǒng)研究采用圖像聚類的圖像檢索算法,聚類算法基本上是基于設(shè)定的距離度量,距離度量方法的選擇決定了什么樣的圖片被聚集在一起,比如常見的歐拉距離,曼哈頓距離等等,但是,這些方法都不能很好的適應(yīng)于高動態(tài)性、海量的Web2.0標(biāo)簽系統(tǒng),F(xiàn)lickr挖掘標(biāo)簽信息來對圖片檢索結(jié)果進(jìn)行聚類,然而,F(xiàn)lickr的這種聚類應(yīng)用不但沒有考慮所打標(biāo)簽本身的不一致性問題,而且僅適應(yīng)于對單個標(biāo)簽檢索結(jié)果的聚類;
發(fā)明內(nèi)容本發(fā)明的目的在于提供一種面向Web2.0標(biāo)簽圖片共享空間的圖片結(jié)果聚類方法。本發(fā)明解決其技術(shù)問題采用的技術(shù)方案是,該方法的步驟如下1)對圖片數(shù)據(jù)庫建立倒排索引,對圖片數(shù)據(jù)庫內(nèi)的標(biāo)簽集合進(jìn)行預(yù)處理分析,包括第一步,構(gòu)建標(biāo)簽的詞匯關(guān)系結(jié)構(gòu)用于查詢擴(kuò)展,首先借助已有詞匯關(guān)聯(lián)知識和詞形變化知識構(gòu)建包含同義詞、詞形變化和語義相近詞匯關(guān)系的標(biāo)簽詞典,根據(jù)標(biāo)簽詞典構(gòu)建詞匯關(guān)系的最小結(jié)構(gòu)標(biāo)簽原子人,它是一個標(biāo)簽的集合,滿足下列條件a)如果一個標(biāo)簽原子A包含一個標(biāo)簽t,它必須也包含標(biāo)簽辭典中所有與標(biāo)簽t詞匯相關(guān)的標(biāo)簽;b)對A中任意兩個標(biāo)簽^和t2,它們必須詞匯相關(guān);—個標(biāo)簽可能出現(xiàn)在多個標(biāo)簽原子中,因?yàn)樗跇?biāo)簽辭典中可能具有多種詞義。對所有標(biāo)簽原子構(gòu)建標(biāo)簽與標(biāo)簽原子之間的建立倒排索引表〈ti,人u的id,人i,2的id,...〉,其中人ij包含標(biāo)簽ti的標(biāo)簽原子,稱此倒排表為標(biāo)簽原子倒排表;第二步,計(jì)算標(biāo)簽間的關(guān)聯(lián)矩陣以用于聚類計(jì)算,標(biāo)簽間的關(guān)聯(lián)度值采用Jaccard系數(shù)計(jì)算,對于標(biāo)簽ti和tj,I(ti)表示含有標(biāo)簽ti的圖片集,I(tj)是含有標(biāo)簽tj的圖片集,標(biāo)簽ti與tj間的關(guān)聯(lián)度值aff(ti,tj)為I(ti)nI(tj)|/|l(ti)UI(tj)l;2)對圖片基于標(biāo)簽檢索,并進(jìn)行結(jié)果聚類的操作過程第一步,對于查詢標(biāo)簽通過構(gòu)建的標(biāo)簽間的詞匯關(guān)系結(jié)構(gòu)進(jìn)行查詢擴(kuò)展,用擴(kuò)展后的標(biāo)簽查詢獲得跟查詢可能相關(guān)的所有候選圖片集Can_I,步驟如下a)對于含有n個查詢標(biāo)簽的查詢q(tpt2,...,tn),通過標(biāo)簽原子倒排索引表TAIL得到所有被查詢q支持的查詢q'(t'pt'2,...,t'n),其中t'i和ti同屬于一個標(biāo)簽原子;b)對于查詢q或每個被查詢q支持的查詢q',通過圖片倒排索引獲得包含一個查詢中所有標(biāo)簽詞的圖片,查詢q與其支持的所有查詢q'獲得的結(jié)果圖片集合并作為候選圖片集Can_I;第二步,根據(jù)標(biāo)簽t與查詢q之間的一種相關(guān)度計(jì)算度量rel(t,q),從候選圖片集包含的標(biāo)簽集Can_T中選出前K個與查詢最相關(guān)的標(biāo)簽,相關(guān)度計(jì)算如下a)計(jì)算標(biāo)簽和擴(kuò)展后查詢之間共同出現(xiàn)的頻率,等同于計(jì)算該標(biāo)簽在候選圖片集內(nèi)的使用頻率f(t);b)將標(biāo)簽在候選集的使用頻率f(t)和該標(biāo)簽在整個圖片數(shù)據(jù)庫被使用的倒文檔頻率idf(t)的乘積作為該標(biāo)簽與查詢間的相關(guān)度值rel(t,q);第三步,取出前K個最相關(guān)的標(biāo)簽的關(guān)聯(lián)子矩陣,如果將K個標(biāo)簽看作K個頂點(diǎn),兩標(biāo)簽ti與tj間的關(guān)聯(lián)度值看作兩標(biāo)簽相連邊的權(quán)重w(i,j),對K個標(biāo)簽的聚類問題看作是對含K個頂點(diǎn)的帶權(quán)重?zé)o向圖的劃分問題,采用一種自定向下的圖劃分算法來聚類K個標(biāo)簽,首先介紹劃分過程中的一個重要概念假設(shè)圖G被劃分為k個頂點(diǎn)集合,給這個劃分P定義一個度量值g(尸j)=g[U—(]其中A(V',V〃)是兩個頂點(diǎn)集合V',V"之間所有邊的權(quán)重之和;Q值越大表示圖劃分的結(jié)果越好,所以采用自頂向下的啟發(fā)式劃分算法,能快速的找到聚類數(shù)不超過閥值e的最優(yōu)的k劃分結(jié)果,步驟如下a)采用依次二分劃分的方法,最初k值2,初始劃分P就是整個圖G作為一個聚類,然后重復(fù)以下過程(1)對于任意一個屬于劃分P的集合Vc,采用經(jīng)典的k平均聚類方法將集合Vc二分,分裂得到兩個更小的集合Vcl和Vc2;(2)將集合Vcl和Vc2取代劃分P中的集合Vc得到新的劃分P';(3)如果Q(P')〉Q(P),則接受此次劃分,更新劃分P,否則保持劃分P不變;b)如果k>e或者劃分P不能在繼續(xù)被劃分則算法停止;c)將劃分P內(nèi)的集合根據(jù)集合的聚合度排序,聚合度按照計(jì)算公式第四步,根據(jù)以上K個標(biāo)簽被劃分的k個聚類結(jié)果,候選圖片集Can_I的聚類過程可以描述如下5a)對于K個標(biāo)簽一個聚類Clusterj,候選圖片集中的任意圖片如果含有m個或者m個以上屬于聚類Clusterj的標(biāo)簽,則該圖片歸為聚類Clusterj;b)最后候選圖片集合中不被歸為任何一個聚類Cluster」的圖片被統(tǒng)一歸為聚類Cluster—other;c)最終候選圖片結(jié)果被劃分為k+1個聚類。本發(fā)明與
背景技術(shù)
相比,具有的有益的效果是(1)本發(fā)明支持多個標(biāo)簽的查詢,聚類過程考慮最相關(guān)元素的策略和啟發(fā)式的算法不但大幅度提高計(jì)算速度也能有效去掉非相關(guān)元素產(chǎn)生的噪音影響,從而達(dá)到更加滿意的圖片聚類結(jié)果。(2)本發(fā)明實(shí)現(xiàn)了有效的查詢擴(kuò)充一定程度上解決了Web2.0標(biāo)簽空間的表述不一致問題,結(jié)果聚類通過對相關(guān)聯(lián)標(biāo)簽的計(jì)算分析,也能一定程度解決查詢語義模糊的問題。附圖是圖片檢索聚類的數(shù)據(jù)流程圖。具體實(shí)施例方式在面向Web2.0標(biāo)簽圖片共享空間的檢索系統(tǒng)中,采用本發(fā)明所提供的檢索聚類方法,可以實(shí)現(xiàn)對高動態(tài),海量標(biāo)簽圖片進(jìn)行快速、有效的檢索,一定程度解決標(biāo)簽空間中標(biāo)簽本身語義的一致性問題和查詢語義模糊的問題,以Flickr圖片共享網(wǎng)站的圖片數(shù)據(jù)集為例,具體的實(shí)施步驟如下1)系統(tǒng)首先對獲得的Flickr圖片數(shù)據(jù)集建立標(biāo)簽關(guān)鍵詞的倒排索引,對圖片數(shù)據(jù)庫內(nèi)的標(biāo)簽集合進(jìn)行預(yù)處理分析第一步,通過已有詞匯關(guān)聯(lián)知識、詞形變換知識等構(gòu)建標(biāo)簽倒排索引表TAIL用于查詢擴(kuò)展,F(xiàn)lickr圖片基本是英文標(biāo)簽,可以通過英文標(biāo)準(zhǔn)詞匯數(shù)據(jù)庫WordNet里定義的詞匯關(guān)系結(jié)構(gòu)得到標(biāo)簽集里的同義詞形式標(biāo)簽原子,比如"flower,bloom,blossom"、"baby,babe,infant",利用一些后綴處理等詞形處理算法找到單復(fù)數(shù)、動名詞等詞形變換形式的標(biāo)簽原子,還可根據(jù)一般常識得到語義高相關(guān)性的標(biāo)簽原子,比如"movie,film",由所得標(biāo)簽原子集即可得到標(biāo)簽倒排索引TAIL;第二步,計(jì)算標(biāo)簽與標(biāo)簽間的關(guān)聯(lián)度值,得到整個標(biāo)簽集合的關(guān)聯(lián)矩陣,用Jaccard系數(shù)計(jì)算標(biāo)簽間的關(guān)聯(lián)度值,其中含有標(biāo)簽ti的圖片集通過以標(biāo)簽為關(guān)鍵詞的圖片倒排索引得到,標(biāo)簽ti和tj的關(guān)聯(lián)度值aff(ti,tj)是同時包含兩個標(biāo)簽的圖片集的數(shù)目與至少包含其中一個標(biāo)簽的圖片集的數(shù)目的比值;2)系統(tǒng)對已獲得的Flickr圖片數(shù)據(jù)集進(jìn)行查詢聚類,附圖給出了查詢聚類的總體數(shù)據(jù)流程圖,具體過程如下第一步,對于查詢標(biāo)簽通過構(gòu)建的標(biāo)簽間的詞匯關(guān)系結(jié)構(gòu)進(jìn)行查詢擴(kuò)展,用擴(kuò)展后查詢標(biāo)簽通過圖片倒排索引獲得跟查詢可能相關(guān)的所有候選圖片集CaruI,步驟如下a)對于含有n個查詢標(biāo)簽的查詢q(tpt2,...,tn),通過標(biāo)簽原子倒排索引表TAIL得到所有被查詢q支持的查詢q'(t'pt'2,...,t'n),其中t'i和ti同屬于一個標(biāo)簽原6子,比如查詢q(flower,summer)所支持的查詢q,有(flowers,summer)、(bloom,summer)、(blossom,summer)、(flower,summertime)、(flowers,summertime)、(bloom,summertime)坐坐寸寸;b)對于查詢q或每個被查詢q支持的查詢q',通過圖片倒排索引獲得包含一個查詢中所有標(biāo)簽詞的圖片,查詢q與其支持的所有查詢q'獲得的結(jié)果圖片集合并作為候選圖片集CaruI,候選圖片集的圖片可能不包含查詢標(biāo)簽t本身而只包含和查詢標(biāo)簽t同屬于一個標(biāo)簽原子的其他標(biāo)簽;第二步,計(jì)算標(biāo)簽t與查詢q之間的相關(guān)度rel(t,q),從候選圖片集包含的候選標(biāo)簽集Can_T中選出前K個與查詢最相關(guān)的標(biāo)簽,過程如下a)計(jì)算標(biāo)簽t在候選圖片集Can_I內(nèi)的使用頻率f(t);b)結(jié)合標(biāo)簽t在整個圖片數(shù)據(jù)庫被使用的倒文檔頻率idf(t)計(jì)算得到相關(guān)度值rel(t,q)為f(t)idf(t);c)根據(jù)ref(t,q)值選出前K個與查詢最相關(guān)的標(biāo)簽;第三步,取出所選的前K個最相關(guān)標(biāo)簽的關(guān)聯(lián)子矩陣,表1給出了關(guān)聯(lián)矩陣示意表,tl、t2.......tK是所選的前K個最相關(guān)的標(biāo)簽,w(ti,tj)既是標(biāo)簽ti與tj間的關(guān)聯(lián)度aff(ti,tj),如下給出了K值取100時的標(biāo)簽選擇實(shí)例和聚類實(shí)例表l標(biāo)簽間的關(guān)聯(lián)矩陣示意表<table>tableseeoriginaldocumentpage7</column></row><table>a)對于任意給出的若干簡單查詢,表2列出了相對應(yīng)的部分標(biāo)簽選擇結(jié)果,比如對于查詢"applemac"選出的標(biāo)簽包含了蘋果公司各種產(chǎn)品;表2若干查詢的部分標(biāo)簽選擇結(jié)果實(shí)例<table>tableseeoriginaldocumentpage7</column></row><table>查詢標(biāo)簽相關(guān)標(biāo)簽列表babyfamilyjackchristmascute—bor—aitchildgirlkids".babycatChicagobirthdayEuropeEnglandkitten…windowstorefashionlightolddisplayglasswindowsshoppingmannequin…dogcorgipuppybasenjipetdogsDalmatiananimalwelshcoigicutepoodle…dogpoodlePetanima—0dleStan—OCn印0—demaCkt,…b)表3給出了當(dāng)聚類上限值設(shè)為10時的部分查詢的聚類結(jié)果;表3若干查詢的部分標(biāo)簽聚類結(jié)果實(shí)例查詢標(biāo)簽聚類結(jié)果apple(maciphoneipodmacbook…}{piefoodapplepiebaking"-}(fruitapples…}{picking."}applemac{macintoshibookmicrosoftapplemacintosh…}(imaciphoneipod…}(speakersdjdjsando…}(:roomwiixboxdvds…}window{storefashiondisplaywindowsshopping…}(viewairplanecondo…}(whitegreenredNikoncanonblue…}(PolandstainedglassKrakow…}第四步,根據(jù)以上K個標(biāo)簽被劃分的聚類結(jié)果,得到候選圖片集的聚類結(jié)果,具體過程如下a)對于K個標(biāo)簽一個聚類Clusterj,候選圖片集中的任意圖片如果含有m個或者m個以上屬于聚類Clusterj的標(biāo)簽,則該圖片歸為聚類Clusterj;b)最后候選圖片集合中不被歸為任何一個聚類Cluster」的圖片被統(tǒng)一歸為聚類Cluster—other;c)最終候選圖片結(jié)果集被劃分為k+l個聚類,值得注意的是一幅圖片可能屬于多8個類別。權(quán)利要求一種面向Web2.0標(biāo)簽圖片共享空間的圖片結(jié)果聚類方法,其特征在于該方法的步驟如下1)對圖片數(shù)據(jù)庫建立倒排索引,對圖片數(shù)據(jù)庫內(nèi)的標(biāo)簽集合進(jìn)行預(yù)處理分析,包括第一步,構(gòu)建標(biāo)簽的詞匯關(guān)系結(jié)構(gòu)用于查詢擴(kuò)展,首先借助已有詞匯關(guān)聯(lián)知識和詞形變化知識構(gòu)建包含同義詞、詞形變化和語義相近詞匯關(guān)系的標(biāo)簽詞典,根據(jù)標(biāo)簽詞典構(gòu)建詞匯關(guān)系的最小結(jié)構(gòu)標(biāo)簽原子它是一個標(biāo)簽的集合,滿足下列條件a)如果一個標(biāo)簽原子包含一個標(biāo)簽t,它必須也包含標(biāo)簽辭典中所有與標(biāo)簽t詞匯相關(guān)的標(biāo)簽;b)對中任意兩個標(biāo)簽t1和t2,它們必須詞匯相關(guān);一個標(biāo)簽可能出現(xiàn)在多個標(biāo)簽原子中,因?yàn)樗跇?biāo)簽辭典中可能具有多種詞義。對所有標(biāo)簽原子構(gòu)建標(biāo)簽與標(biāo)簽原子之間的建立倒排索引表<ti,的id,的id,...>,其中包含標(biāo)簽ti的標(biāo)簽原子,稱此倒排表為標(biāo)簽原子倒排表;第二步,計(jì)算標(biāo)簽間的關(guān)聯(lián)矩陣以用于聚類計(jì)算,標(biāo)簽間的關(guān)聯(lián)度值采用Jaccard系數(shù)計(jì)算,對于標(biāo)簽ti和tj,I(ti)表示含有標(biāo)簽ti的圖片集,I(tj)是含有標(biāo)簽tj的圖片集,標(biāo)簽ti與tj間的關(guān)聯(lián)度值aff(ti,tj)為|I(ti)∩I(tj)|/|I(ti)∪I(tj)|;2)對圖片基于標(biāo)簽檢索,并進(jìn)行結(jié)果聚類的操作過程第一步,對于查詢標(biāo)簽通過構(gòu)建的標(biāo)簽間的詞匯關(guān)系結(jié)構(gòu)進(jìn)行查詢擴(kuò)展,用擴(kuò)展后的標(biāo)簽查詢獲得跟查詢可能相關(guān)的所有候選圖片集Can_I,步驟如下a)對于含有n個查詢標(biāo)簽的查詢q(t1,t2,...,tn),通過標(biāo)簽原子倒排索引表TAIL得到所有被查詢q支持的查詢q’(t’1,t’2,...,t’n),其中t’i和ti同屬于一個標(biāo)簽原子;b)對于查詢q或每個被查詢q支持的查詢q’,通過圖片倒排索引獲得包含一個查詢中所有標(biāo)簽詞的圖片,查詢q與其支持的所有查詢q’獲得的結(jié)果圖片集合并作為候選圖片集Can_I;第二步,根據(jù)標(biāo)簽t與查詢q之間的一種相關(guān)度計(jì)算度量rel(t,q),從候選圖片集包含的標(biāo)簽集Can_T中選出前K個與查詢最相關(guān)的標(biāo)簽,相關(guān)度計(jì)算如下a)計(jì)算標(biāo)簽和擴(kuò)展后查詢之間共同出現(xiàn)的頻率,等同于計(jì)算該標(biāo)簽在候選圖片集內(nèi)的使用頻率f(t);b)將標(biāo)簽在候選集的使用頻率f(t)和該標(biāo)簽在整個圖片數(shù)據(jù)庫被使用的倒文檔頻率idf(t)的乘積作為該標(biāo)簽與查詢間的相關(guān)度值rel(t,q);第三步,取出前K個最相關(guān)的標(biāo)簽的關(guān)聯(lián)子矩陣,如果將K個標(biāo)簽看作K個頂點(diǎn),兩標(biāo)簽ti與tj間的關(guān)聯(lián)度值看作兩標(biāo)簽相連邊的權(quán)重w(i,j),對K個標(biāo)簽的聚類問題看作是對含K個頂點(diǎn)的帶權(quán)重?zé)o向圖的劃分問題,采用一種自定向下的圖劃分算法來聚類K個標(biāo)簽,首先介紹劃分過程中的一個重要概念假設(shè)圖G被劃分為k個頂點(diǎn)集合,給這個劃分P定義一個度量值其中A(V′,V″)是兩個頂點(diǎn)集合V′,V″之間所有邊的權(quán)重之和;Q值越大表示圖劃分的結(jié)果越好,所以采用自頂向下的啟發(fā)式劃分算法,能快速的找到聚類數(shù)不超過閥值θ的最優(yōu)的k劃分結(jié)果,步驟如下a)采用依次二分劃分的方法,最初k值2,初始劃分P就是整個圖G作為一個聚類,然后重復(fù)以下過程(1)對于任意一個屬于劃分P的集合Vc,采用經(jīng)典的k平均聚類方法將集合Vc二分,分裂得到兩個更小的集合Vc1和Vc2;(2)將集合Vc1和Vc2取代劃分P中的集合Vc得到新的劃分P’;(3)如果Q(P’)>Q(P),則接受此次劃分,更新劃分P,否則保持劃分P不變;b)如果k>θ或者劃分P不能在繼續(xù)被劃分則算法停止;c)將劃分P內(nèi)的集合根據(jù)集合的聚合度排序,聚合度按照計(jì)算公式<mrow><mi>Cohesion</mi><mrow><mo>(</mo><mi>Vc</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mfrac><mrow><mi>A</mi><mrow><mo>(</mo><mi>Vc</mi><mo>,</mo><mi>Vc</mi><mo>)</mo></mrow></mrow><mrow><mi>A</mi><mrow><mo>(</mo><mi>V</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><msup><mrow><mo>(</mo><mfrac><mrow><mi>A</mi><mrow><mo>(</mo><mi>Vc</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow><mrow><mi>A</mi><mrow><mo>(</mo><mi>V</mi><mo>,</mo><mi>V</mi><mo>)</mo></mrow></mrow></mfrac><mo>)</mo></mrow><mn>2</mn></msup><mo>)</mo></mrow><mo>&times;</mo><mi>log</mi><mfrac><mrow><mo>|</mo><mi>V</mi><mo>|</mo></mrow><mrow><mo>|</mo><mi>Vc</mi><mo>|</mo></mrow></mfrac></mrow>得到;第四步,根據(jù)以上K個標(biāo)簽被劃分的k個聚類結(jié)果,候選圖片集Can_I的聚類過程可以描述如下a)對于K個標(biāo)簽一個聚類Cluster_i,候選圖片集中的任意圖片如果含有m個或者m個以上屬于聚類Cluster_i的標(biāo)簽,則該圖片歸為聚類Cluster_i;b)最后候選圖片集合中不被歸為任何一個聚類Cluster_i的圖片被統(tǒng)一歸為聚類Cluster_other;c)最終候選圖片結(jié)果被劃分為k+1個聚類。全文摘要本發(fā)明公開了一種面向Web2.0標(biāo)簽圖片共享空間的檢索結(jié)果聚類方法。挖掘標(biāo)簽間的詞匯關(guān)系及關(guān)聯(lián)關(guān)系,查詢標(biāo)簽根據(jù)標(biāo)簽間詞匯關(guān)系得到擴(kuò)展的查詢標(biāo)簽集;用擴(kuò)展的查詢標(biāo)簽集得到與查詢相關(guān)的候選圖像集;根據(jù)查詢標(biāo)簽與候選圖像集內(nèi)標(biāo)簽的相關(guān)度度量,選出前K個最相關(guān)的標(biāo)簽;根據(jù)這K個標(biāo)簽兩兩之間的關(guān)聯(lián)度,采用一種自頂向下基于圖劃分的聚類算法,自動將K個標(biāo)簽分成最優(yōu)的聚類結(jié)果;候選圖像集也相應(yīng)地根據(jù)聚類標(biāo)簽被聚類。針對標(biāo)簽表達(dá)不一致問題實(shí)現(xiàn)有效的查詢擴(kuò)充,基于最相關(guān)標(biāo)簽集聚類的圖像聚類方法解決了標(biāo)簽語義多樣性的問題。相比于傳統(tǒng)方法,本發(fā)明提供用戶在Web2.0標(biāo)簽圖片共享空間內(nèi)快速有效的進(jìn)行圖片檢索和瀏覽。文檔編號G06F17/30GK101694657SQ20091015288公開日2010年4月14日申請日期2009年9月18日優(yōu)先權(quán)日2009年9月18日發(fā)明者壽黎但,李曉燕,胡天磊,陳剛,陳珂申請人:浙江大學(xué);
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
岫岩| 贵阳市| 信宜市| 武强县| 海丰县| 石景山区| 石景山区| 新巴尔虎右旗| 富川| 邯郸县| 武汉市| 丹阳市| 曲松县| 谢通门县| 金阳县| 通许县| 卢龙县| 乐陵市| 平罗县| 邳州市| 洱源县| 太仓市| 含山县| 丰顺县| 冀州市| 扬州市| 托克托县| 瓮安县| 安新县| 晋州市| 台南县| 宣城市| 阜宁县| 金平| 湖南省| 温州市| 岳西县| 莱州市| 蓝山县| 阳春市| 瓦房店市|