本發(fā)明涉及三維模型檢索領(lǐng)域,尤其涉及一種基于lire(luceneimageretrieval,基于lucene檢索引擎的圖片檢索系統(tǒng))的三維模型檢索方法。
背景技術(shù):
近幾年,隨著計(jì)算機(jī)硬件的快速發(fā)展以及三維掃描技術(shù)的提高,三維模型不僅在科研、工業(yè)和醫(yī)學(xué)中得到廣泛應(yīng)用,在生活中也隨處可見,甚至一些購(gòu)物網(wǎng)站推出三維試衣間,三維電視也即將進(jìn)入市場(chǎng)。市場(chǎng)對(duì)三維模型應(yīng)用需求不斷擴(kuò)大,用戶對(duì)模型設(shè)計(jì)和實(shí)現(xiàn)的速度和質(zhì)量都提出了更高的要求。同時(shí)隨著三維數(shù)據(jù)獲取技術(shù)、三維圖形建模方法及圖形硬件技術(shù)的發(fā)展,已經(jīng)產(chǎn)生了越來越多的三維物體模型庫(kù),如虛擬現(xiàn)實(shí)環(huán)境(virtualreality)、三維游戲(3dgame)、工業(yè)實(shí)體cad模型庫(kù)等等。此外,在生物、化學(xué)、考古學(xué)以及地理學(xué)等多個(gè)領(lǐng)域,三維數(shù)據(jù)模型庫(kù)也已經(jīng)越來越普遍,在互聯(lián)網(wǎng)上,也涌現(xiàn)出越來越多的三維模型庫(kù)[1]。
三維模型與二維圖像相比,三維模型更適用于人類的視覺感知和思維模式,但是建立精確、逼真的三維模型卻比二維圖像費(fèi)時(shí)費(fèi)力。為了簡(jiǎn)化建模過程,可以在已有的相似模型的基礎(chǔ)上重建模。但是,隨著三維模型的增多,在龐大的數(shù)據(jù)庫(kù)查找所需模型將變得非常困難[2]。因此研究三維模型檢索技術(shù)(content-based3dretrieva1),幫助用戶快速準(zhǔn)確地獲取符合設(shè)計(jì)意圖的三維模型,實(shí)現(xiàn)資源重用,成為當(dāng)前研究的熱點(diǎn)[3]。
三維模型的檢索方式同其他的多媒體數(shù)據(jù)檢索技術(shù)一樣,主要分為基于文本的檢索和基于內(nèi)容的檢索?;谖谋镜臋z索方式把模型作為數(shù)據(jù)庫(kù)中存儲(chǔ)的一個(gè)對(duì)象,用關(guān)鍵字或文本對(duì)模型進(jìn)行描述。在模型的存儲(chǔ)路徑和模型的關(guān)鍵字之間建立聯(lián)系,關(guān)鍵字選取具有很大的主觀性和片面性,而且可靠性和效率都不高,面對(duì)目前三維模型數(shù)量越來越多以及互聯(lián)網(wǎng)搜索引擎規(guī)模與復(fù)雜性日益增強(qiáng)的情況,顯然難以勝任。20世紀(jì)90年代初,為適應(yīng)圖像、視頻等二維多媒體信息檢索的需要,基于內(nèi)容的多媒體檢索技術(shù)應(yīng)運(yùn)而生,并很快在理論研究和實(shí)際應(yīng)用中得到快速發(fā)展[4,5]。
基于內(nèi)容的三維模型檢索技術(shù)是利用機(jī)器自動(dòng)提取并計(jì)算三維模型的內(nèi)在特征,如形狀、拓?fù)潢P(guān)系、模型表面信息等,通過對(duì)待查詢模型和目標(biāo)模型特征之間的相似性匹配來自動(dòng)建立特征檢索索引,實(shí)現(xiàn)對(duì)三維模型數(shù)據(jù)庫(kù)的瀏覽和檢索。這種方法有人工干預(yù)少、貼近直覺、檢索準(zhǔn)確率高的特點(diǎn),基于內(nèi)容的三維模型檢索過程如圖1所示。
同時(shí)基于內(nèi)容的三維模型檢索技術(shù)又可以分為三大類:(1)基于形狀的檢索技術(shù);(2)基于拓?fù)浣Y(jié)構(gòu)的檢索技術(shù);(3)基于圖像比較的檢索技術(shù)[6]?;趦?nèi)容的圖像檢索相比較基于文本的圖像檢索,檢索速度有所下降。因?yàn)樾枰紤]圖像的旋轉(zhuǎn)不變形和尺度不變性等,技術(shù)也更加的復(fù)雜,實(shí)現(xiàn)難度更大。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種基于lire的三維模型檢索方法,本發(fā)明在保證檢索速度的同時(shí),有效的提高了三維模型檢索的查準(zhǔn)率和查全率,詳見下文描述:
一種基于lire的三維模型檢索方法,所述方法包括以下步驟:
利用基于opengl開發(fā)的程序,從數(shù)據(jù)庫(kù)三維模型中提取各個(gè)視角圖片;
利用lire創(chuàng)建基于圖像特性的lucene索引,獲得與該圖片相似度最大的前50張圖片的索引項(xiàng);
統(tǒng)計(jì)檢索各個(gè)視角圖片的檢索結(jié)果;
將檢索結(jié)果中出現(xiàn)的三維模型按照權(quán)重從小到大排序,權(quán)重最小的三維模型表示與要檢索的三維模型相似度最高,以此類推,權(quán)重越小表示相似度越高。
其中,所述方法使用的是phog特征,每張圖片對(duì)應(yīng)一個(gè)索引項(xiàng),索引項(xiàng)包含有如下信息:由phog特征計(jì)算出來的特征值、該圖片所屬的三維模型信息。
所述統(tǒng)計(jì)檢索各個(gè)視角圖片的檢索結(jié)果的步驟具體為:
按照相似度給予索引項(xiàng)權(quán)重,越相似的索引項(xiàng)權(quán)重值越小;統(tǒng)計(jì)檢索出的所有索引項(xiàng),每個(gè)三維模型的索引項(xiàng)進(jìn)行權(quán)重加和。
本發(fā)明提供的技術(shù)方案的有益效果是:
1、有效避免了相似模型的不同類型之間的干擾,具有很好的檢索查準(zhǔn)率和查全率;
2、利用了lire檢索框架,并在此之上進(jìn)行改進(jìn),檢索速度較其他三維模型檢索系統(tǒng)有較大的提高。
附圖說明
圖1是基于內(nèi)容的三維模型檢索系統(tǒng)框架圖;
圖2是一種基于lire的三維模型檢索方法的流程圖;
圖3是檢索的三維模型;
圖4為從三維模型中提取出來的各個(gè)視角的圖片;
圖5為三維模型檢索結(jié)果的示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
實(shí)施例1
本發(fā)明實(shí)施例提供了一種基于lire的三維模型檢索方法,參見圖2,該方法包括以下步驟:
101:利用基于opengl(opengraphicslibrary,開放圖形庫(kù))開發(fā)的程序,從數(shù)據(jù)庫(kù)三維模型中提取各個(gè)視角圖片;
其中,數(shù)據(jù)庫(kù)三維模型可以為obj(三維模型文件格式)文件,每個(gè)三維模型可以提取12張,具體實(shí)現(xiàn)時(shí),本發(fā)明實(shí)施例對(duì)文件的類型、以及提取的張數(shù)不做限制,根據(jù)實(shí)際應(yīng)用中的需要進(jìn)行設(shè)定。
102:利用lire創(chuàng)建基于圖像特性的lucene(一種開放源代碼的全文檢索引擎工具包)索引,獲得與該圖片相似度最大的前50張圖片的索引項(xiàng);
其中,本發(fā)明實(shí)施例所使用的是phog(pyramidhistogramoforientedgradients,分層梯度方向直方圖)特征,每張圖片對(duì)應(yīng)一個(gè)索引項(xiàng),索引項(xiàng)中包含有如下信息:由phog特征計(jì)算出來的特征值、該圖片所屬的三維模型信息。
103:統(tǒng)計(jì)檢索各個(gè)視角圖片的檢索結(jié)果;
其中,每張圖片對(duì)應(yīng)50個(gè)最相似的索引項(xiàng)。按照相似度給予索引項(xiàng)權(quán)重,越相似的索引項(xiàng)權(quán)重值越小。統(tǒng)計(jì)檢索出的所有索引項(xiàng),每個(gè)三維模型的索引項(xiàng)進(jìn)行權(quán)重加和。
104:將檢索結(jié)果中出現(xiàn)的三維模型按照權(quán)重從小到大排序,權(quán)重最小的三維模型表示與要檢索的三維模型相似度最高,以此類推,權(quán)重越小表示相似度越高。
綜上所述,本發(fā)明實(shí)施例通過上述步驟101-步驟104在保證檢索速度的同時(shí),有效的提高了三維模型檢索的查準(zhǔn)率和查全率。
實(shí)施例2
下面結(jié)合圖3-圖5對(duì)實(shí)施例1中的方案進(jìn)行進(jìn)一步地介紹,詳見下文描述:
建立索引是利用lire檢索框架,它是在lucene的基礎(chǔ)上開發(fā)出的圖片檢索框架。lucene是一款非常優(yōu)秀的成熟、開源且免費(fèi)的純java語言的全文索引檢索工具包。它是一個(gè)高性能、可伸縮的信息搜索庫(kù)(irinformationretrievallibrary)。它具有添加索引和搜索能力。
建立索引的第一步是利用基于opengl的圖片提取程序,從數(shù)據(jù)庫(kù)的每個(gè)三維模型中提取12個(gè)不同視角的圖片,保存在和三維模型對(duì)應(yīng)的目錄下。
第二步是利用lire框架,提取所有圖片的phog特征,然后建立索引項(xiàng),生成索引文件。每個(gè)索引項(xiàng)中包含由phog特征計(jì)算出來的特征值以及該圖片所屬的三維模型等信息。
首先利用基于opengl庫(kù)的程序,從三維模型中提取各個(gè)時(shí)間的圖片,其原理是使三維模型旋轉(zhuǎn)不同角度,然后保存截圖。參見圖3,程序輸入為三維模型文件(該實(shí)例為obj文件),輸出為三維模型12個(gè)不同視角的圖片,如圖4a~4l所示。
隨后,對(duì)每一張圖片提取phog特征,然后利用lire(luceneimageretrieval)檢索框架檢索數(shù)據(jù)庫(kù)中與該三維模型相似的索引項(xiàng),取與該圖片最相似的前50個(gè)索引項(xiàng),按照相似度從大到小排序。相似度越大分配的權(quán)值越小。即假設(shè)檢索結(jié)果按照相似度排序?yàn)閕ndex1~index10,則index1所代表的圖片與檢索圖片最相似,分配的權(quán)值w1最小。
12張圖片檢索完畢后,一共檢索出12×50個(gè)索引項(xiàng),每個(gè)索引項(xiàng)擁有一個(gè)對(duì)應(yīng)的權(quán)值。然后對(duì)于檢索結(jié)果進(jìn)行統(tǒng)計(jì)。每個(gè)索引項(xiàng)代表一張圖片,其中包含由phog特征計(jì)算出來的特征值和該圖片所屬的三維模型信息。對(duì)檢索結(jié)果中出現(xiàn)的每一類三維模型的所有權(quán)值進(jìn)行加和。
該實(shí)例檢索結(jié)果中共出現(xiàn)10種三維模型,每一種三維模型對(duì)應(yīng)若干索引項(xiàng),對(duì)這些索引項(xiàng)的權(quán)值進(jìn)行加和,得到三維模型的權(quán)重。然后按照權(quán)重由小到大,對(duì)三維模型進(jìn)行排序,權(quán)值最小的三維模型,即表示與檢索的三維模型相似度最大。檢索結(jié)果如圖5所示。由結(jié)果可見,數(shù)據(jù)庫(kù)中該種類模型共七個(gè),全部被檢索到。后面三個(gè)由于某一視角與檢索模型相似,因此也被檢索出,但三維模型的權(quán)值較小排在后面。
參考文獻(xiàn):
[1]minp,haldermanja,kazhdanm,etal.earlyexperienceswitha3dmodelsearchengine[c]//web3d/vrmlsymposium.2003:7-ff.
[2]王慧玲.基于內(nèi)容的3d模型檢索概述[j].伊犁師范學(xué)院學(xué)報(bào):自然科學(xué)版,2010(3):54-57.
[3]楊育彬,林輝,朱慶.基于內(nèi)容的三維模型檢索綜述[j].計(jì)算機(jī)報(bào),2004,27(10):1297-1310.
[4]盧漢清,孔維新,廖明,馬頌德.基于內(nèi)容的視頻信號(hào)與圖像庫(kù)檢索中的圖像技術(shù).自動(dòng)化學(xué)報(bào),2001,21(1):56~69)
[5]楊育彬.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)及其應(yīng)用研究[博士學(xué)位論文].南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系,南京,2003)
[6]鄭伯川,彭維,張引,等.3d模型檢索技術(shù)綜述[j].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2004,16(7):873-881.
本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施例的示意圖,上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。