專利名稱:一種基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,涉及的是一種三維模型檢索性能的評(píng)價(jià)方法。
背景技術(shù):
隨著計(jì)算機(jī)軟硬件的發(fā)展,三維模型在多個(gè)領(lǐng)域中得到了廣泛的應(yīng)用。如何實(shí)現(xiàn)快 速準(zhǔn)確地從大規(guī)模的三維模型庫(kù)中檢索出符合用戶需求的三維模型成為了近年來(lái)多媒 體信息檢索領(lǐng)域的一個(gè)研究熱點(diǎn)?;趦?nèi)容的三維模型檢索的一個(gè)關(guān)鍵問(wèn)題是三維模型 的特征提取。目前世界各地的研究人員已經(jīng)提出了大量的特征提取算法,并且都認(rèn)為其 提出的算法具有良好的檢索性能表現(xiàn),但是各自采用的測(cè)試集不同,具體采用的性能評(píng) 價(jià)方法也不同,這導(dǎo)致其結(jié)論的說(shuō)服力大大減弱。那么如何對(duì)各式各樣的特征提取算法 進(jìn)行客觀真實(shí)地評(píng)價(jià)呢 早期的研究人員在對(duì)其提出的特征提取算法進(jìn)行檢索性能評(píng)價(jià) 時(shí)大多采用自建的測(cè)試集,這使得其實(shí)驗(yàn)結(jié)果的說(shuō)服力有限。2004年,普林斯頓大學(xué)形 狀檢索與分析研究組(Shape Retrieval and Analysis Group)發(fā)布了形狀基準(zhǔn)數(shù)據(jù)庫(kù) (Princeton Shape Benchmark, PSB),受到了廣大研究者的肯定。越來(lái)越多的研究人員采 用PSB作為檢驗(yàn)其算法檢索性能的工具。但是,PSB的分類方法存在著不可忽視的缺 陷。PSB中的模型分類可以視作一棵分類樹,在分類樹的高層類別劃分的依據(jù)是模型的 語(yǔ)義特征,而在底層則是模型的形狀特征。因此,語(yǔ)義特征不同但形狀特征相似的模型 總被劃分在不同的類別。而在PSB的檢索性能評(píng)價(jià)過(guò)程中,只有位于同一類別中的三維 模型才被視為是相關(guān)的,否則就判定為不相關(guān)。其后果是,即使檢索結(jié)果集全是形狀確 實(shí)相似的模型但由于其語(yǔ)義類別不同,該檢索結(jié)果仍是一個(gè)差的結(jié)果。究其原因,就在 于PSB的分類方法不考慮類別間的相似性(即語(yǔ)義上不相關(guān)的類別它們也可能存在形狀 上的相似性)。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于內(nèi)容的三維模型檢索性能評(píng)價(jià)方法,從 而使得研究人員提出的各種特征提取算法有一個(gè)客觀真實(shí)的評(píng)價(jià)。
為解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案如下 一種基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法,包括如下步驟(1)測(cè)試集的構(gòu)造
(a) 收集三維模型文件,將所有三維模型文件轉(zhuǎn)換成相同的文件格式;
(b) 對(duì)三維模型文件進(jìn)行基于語(yǔ)義的分類,得到一個(gè)基本語(yǔ)義分類表;
(C)將基本語(yǔ)義分類表轉(zhuǎn)換成為基于形狀的分類表,具體步驟如下(i)將基本語(yǔ) 義分類表中的全部類別復(fù)制到一張新的表中;(ii)對(duì)新表中的每個(gè)類別執(zhí)行以下操作, 直到所有的類別都執(zhí)行了一遍如果該類別中的全部三維模型的形狀都足夠相似,則重 復(fù)執(zhí)行(ii);否則將該類別分裂成為若干個(gè)類別,使得每個(gè)類別中模型之間的相似度都 非常髙(每個(gè)三維模型依據(jù)其視覺(jué)特性,總可以分為若干個(gè)有意義的子區(qū)域,例如在一 個(gè)茶壺的三維模型中,它可以劃分為壺嘴、壺身、壺蓋、壺把。如果兩個(gè)三維模型它們 的子區(qū)域間具有對(duì)應(yīng)關(guān)系的比例達(dá)到90%以上,則認(rèn)為這兩個(gè)三維模型的相似性足夠 高,可以將其歸為同一類別);
(d)對(duì)基于形狀的分類表中的每一個(gè)類別,標(biāo)注該類別與表中其它類別的相似度; 所述的相似度按如下方式定義將相同類別的三維模型間的相似度定義為字母S; 將不同類別的三維模型間的相似度定為5個(gè)級(jí)別,分別用字母A、 B、 C、 D、 E表示, 其中,A表示的兩個(gè)三維模型之間的相似度最高,E為兩個(gè)三維模型毫不相似,其它的 字母所表達(dá)的相似度介于A與E之間;則按照相似度由高到低的排列順序?yàn)?S>A>B>C>D>E;
在本發(fā)明中,S、 A、 B、 C、 D和E這六個(gè)英文大寫字母被用來(lái)描述兩個(gè)類別之間 的相似性,稱之為相似性字母(Similarity Letter, SL)。由相似性字母組成的字符串稱為 相似性序列(Similarity Sequence, SS)。在相似性序列中, 一個(gè)相似性字母的后繼 (Subsequence)定義為該相似性字母后的字符子串。當(dāng)一個(gè)相似性序列是按照相似性降序 排列時(shí)(即高相似性的字母排在前面,低相似性的字母排在后面),稱該序列為最好相似 性序列(Perfect Similarity Sequence, PSS);反之,當(dāng)一個(gè)相似性序列時(shí)按照相似性升序排 列時(shí),則稱該序列為最壞相似性序歹U(Temble Similarity Sequence, TSS)。顯然,對(duì)于任 意給定的一個(gè)SS,只要對(duì)該序列中的相似性字母按照相似性大小重新排列就能得到其 對(duì)應(yīng)的PSS和TSS;
標(biāo)注該類別與表中其它類別的相似度的方法如下從每一個(gè)類別中任選一個(gè)模型出 來(lái),然后比較這些模型之間的相似度作為類別間的相似度。對(duì)于一個(gè)物體,可以分為若 干個(gè)有意義的局部區(qū)域;如果兩個(gè)物體的區(qū)域之間小于等于20%的對(duì)應(yīng)關(guān)系,則這兩個(gè)模型之間具有E的相似度;如果兩個(gè)模型的區(qū)域之間有大于20%、而小于等于40% 的對(duì)應(yīng)關(guān)系,則這兩個(gè)模型之間就具有D的相似度;如果對(duì)應(yīng)的區(qū)域數(shù)大于40%小于 等于60。/。則相似度為C;如果對(duì)應(yīng)的區(qū)域數(shù)大于60%小于等于80%,則相似度為B;如 果對(duì)應(yīng)的區(qū)域數(shù)大于80%則相似度為A。
(2)評(píng)價(jià)指標(biāo)的設(shè)計(jì)
(a) 用一種特征提取算法對(duì)步驟(ld)得到測(cè)試集中的每一個(gè)模型作出査詢,對(duì) 于包含N個(gè)三維模型的測(cè)試集,得到N個(gè)檢索結(jié)果;
(b) 根據(jù)步驟(ld)得到的相似度標(biāo)注結(jié)果,將檢索結(jié)果列表轉(zhuǎn)換為相應(yīng)的相似
性序列,具體步驟如下依據(jù)檢索結(jié)果列表的排列順序,從上到下逐一比較特征提取算
法中所査詢的模型與檢索結(jié)果列表中的模型的相似度,該相似度遵循步驟(ld)所標(biāo)注
的相似度,并將該相似度記錄下來(lái)形成相應(yīng)的相似性序列;
(C)按如下方式對(duì)相似性序列中的每一個(gè)相似性字母的得分率S進(jìn)行計(jì)算
記Scwe「島SA)表示相似性序列中相似性字母的得分,它的值為相似性字母的后繼
中比該相似性字母小的相似性字母的個(gè)數(shù),艮P:
<formula>formula see original document page 6</formula>
其中,SS表示相似性序列,SL表示相似性字母;
記Scow0》表示相似性序列的得分,它的值為相似性序列中每一個(gè)相似性字母的得
分的總和,即
<formula>formula see original document page 6</formula>
其中,SS表示相似性序列;
貝J,相似性序列中每一個(gè)相似性字母的得分率S定義為Scor"S》/Scow(PS》, 其中,PSS為與相似性序列所對(duì)應(yīng)的最好相似性序列,即將該相似性序列中的所有 字母按照相似性降序排列;
(d)對(duì)于包含N個(gè)三維模型的測(cè)試集,按照步驟(2c)的算法,得到N個(gè)相似性字母的得分率A,/^,…,/7w,則對(duì)于步驟(2a)中所使用的特征提取算法最終評(píng)價(jià)結(jié)果為:
有益效果本發(fā)明為如何對(duì)基于內(nèi)容的三維模型檢索算法進(jìn)行評(píng)價(jià)給出了一個(gè)切實(shí) 可行的解決方案,具有以下的幾點(diǎn)優(yōu)點(diǎn)1)傳統(tǒng)的評(píng)價(jià)方法將兩個(gè)模型之間的相似度 只定義為相關(guān)或者不相關(guān),而本發(fā)明則考慮了模型之間存在多種級(jí)別的相似性;2)傳
統(tǒng)的評(píng)價(jià)方法只考慮同一類別的模型之間存在相似性,而忽視了不同類別間也可能是存 在著相似性,而本發(fā)明考慮到了這點(diǎn)。本發(fā)明可應(yīng)用于三維模型檢索算法的評(píng)價(jià),從而 促進(jìn)基于內(nèi)容三維模型研究的進(jìn)一步發(fā)展。
圖l本發(fā)明整體結(jié)構(gòu)圖。
圖2本發(fā)明測(cè)試集的構(gòu)造流程圖。 圖3本發(fā)明評(píng)價(jià)的流程圖。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。
本發(fā)明的基于內(nèi)容的三維模型檢索性能評(píng)價(jià)方法主要由兩個(gè)部分組成,測(cè)試集的構(gòu) 造和評(píng)價(jià)指標(biāo)的設(shè)計(jì)。前者提供進(jìn)行評(píng)價(jià)的數(shù)據(jù)基礎(chǔ),而后者則是給出具體的評(píng)價(jià)流程。 圖1是本發(fā)明的整體結(jié)果圖。研究人員設(shè)計(jì)了一個(gè)基于內(nèi)容的三維模型檢索算法之后, 首先使用本發(fā)明的三維模型測(cè)試集中的每一個(gè)模型作為査詢,這樣可以得到若干個(gè)檢索 結(jié)果。然后再利用本發(fā)明的評(píng)價(jià)方法對(duì)得到的檢索結(jié)果進(jìn)行評(píng)價(jià),最后便可以得到關(guān)于 待評(píng)測(cè)算法的一個(gè)評(píng)價(jià)結(jié)果。
圖2是本發(fā)明測(cè)試集的構(gòu)造流程。步驟1收集三維模型文件,這可通過(guò)網(wǎng)絡(luò)爬蟲程 序從互聯(lián)網(wǎng)上下載,或者是使用三維模型建模軟件創(chuàng)建。步驟2將各種文件格式的三維 模型文件轉(zhuǎn)換為統(tǒng)一的文件格式,例如OFF、 OBJ、 PLY等三維模型文件格式。步驟3 對(duì)已收集的三維模型進(jìn)行手工的基于語(yǔ)義的分類,即依照人的知識(shí)判斷,為每一個(gè)三維 模型標(biāo)注它所屬的類別,例如對(duì)一個(gè)蘋果模型,則將其類別標(biāo)注為"蘋果",得到一個(gè) 基本的語(yǔ)義分類表。步驟4設(shè)置一計(jì)數(shù)器i,賦初值為0。步驟5判斷計(jì)數(shù)器i所指向的 類別是否足夠純,即同一類別中的模型相似度非常高(每個(gè)三維模型依據(jù)其視覺(jué)特性,總可以分為若干個(gè)有意義的子區(qū)域,例如在一個(gè)茶壺的三維模型中,它可以劃分為壺嘴、 壺身、壺蓋、壺把。如果兩個(gè)三維模型它們的子區(qū)域間具有對(duì)應(yīng)關(guān)系的比例達(dá)到90%以 上,則認(rèn)為這兩個(gè)三維模型的相似性足夠高,可以將其歸為同一類別)。對(duì)于那些不純 的類別執(zhí)行步驟6將該類別分裂成為若干個(gè)子類別,使得每一個(gè)子類別都非常純。如果 步驟5中該類別已經(jīng)足夠純則直接進(jìn)入步驟7。步驟7檢測(cè)是否還有類別沒(méi)有處理,即 i小于類別總數(shù),若是則執(zhí)行步驟8讓i自增l,否則進(jìn)入步驟9,標(biāo)注每一個(gè)類別與其 它類別間的相似度。所述的相似度按如下方式定義將相同類別的三維模型間的相似度 定義為字母S;將不同類別的三維模型間的相似度定為5個(gè)級(jí)別,分別用字母A、 B、 C、 D、 E表示,其中,A表示的兩個(gè)三維模型之間的相似度最高,E為兩個(gè)三維模型毫不 相似,其它的字母所表達(dá)的相似度介于A與E之間;則按照相似度由高到低的排列順 序?yàn)镾>A>B>C>D>E。標(biāo)注該類別與表中其它類別的相似度的方法如下對(duì)于一個(gè)物 體,可以分為若干個(gè)有意義的局部區(qū)域;對(duì)于一個(gè)物體,可以分為若干個(gè)有意義的局部 區(qū)域;如果兩個(gè)物體的區(qū)域之間小于等于20%的對(duì)應(yīng)關(guān)系,則這兩個(gè)模型之間具有E 的相似度;如果兩個(gè)模型的區(qū)域之間有大于20%、而小于等于40%的對(duì)應(yīng)關(guān)系,則這兩 個(gè)模型之間就具有D的相似度;如果對(duì)應(yīng)的區(qū)域數(shù)大于40%小于等于60%則相似度為C; 如果對(duì)應(yīng)的區(qū)域數(shù)大于60%小于等于80%,則相似度為B;如果對(duì)應(yīng)的區(qū)域數(shù)大于80% 則相似度為A。
通過(guò)如上的步驟,本發(fā)明可以得到一個(gè)具有統(tǒng)一格式的三維模型數(shù)據(jù)集,而且三維 模型之間的相似關(guān)系通過(guò)分類表記錄下來(lái)。
下面結(jié)合圖3介紹如何結(jié)合上述測(cè)試集對(duì)研究人員提出的一個(gè)基于內(nèi)容的三維模型 特征提取算法(如算法Alg)進(jìn)行評(píng)價(jià)。
步驟10設(shè)置計(jì)數(shù)器i,初值為0,以及一個(gè)記錄總得分率的變量sum,初值也為0。 步驟11將測(cè)試集中的第i個(gè)模型作為Alg的査詢,那么Alg將會(huì)返回一個(gè)檢索結(jié)果。該 檢索結(jié)果是對(duì)測(cè)試集中所有模型依照它們與Alg査詢之間相似性的一個(gè)排序表,與査詢 最相似的被排在表的最上方,最不相似的放在表的最下方,該排序表由特征提取算法自 身形成的排序。步驟12將檢索結(jié)果列表轉(zhuǎn)換成為相應(yīng)的相似性序列。具體的方法是 依據(jù)檢索結(jié)果列表的排列順序,從上到下逐一比較Alg所使用的査詢模型與檢索結(jié)果列 表中的模型的相似度,該相似度遵循步驟9所標(biāo)注的相似度,并將該相似度記錄下來(lái)形 成相應(yīng)的相似性序列。步驟13計(jì)算上一步驟得到的相似性序列中的每一個(gè)相似性字母的得分率W:
<formula>formula see original document page 9</formula>, 其中,PSS表示^S的最好相似性庠列;
其中,&0^(5^表示相似性序列的得分,它的值為相似性序列中每一個(gè)相似性字母 的得分的總和,即
<formula>formula see original document page 9</formula>
其中,&0^島1^表示相似性序列中相似性字母的得分,它的值為相似性字母的后
繼中比該相似性字母小的相似性字母的個(gè)數(shù),即
<formula>formula see original document page 9</formula>
步驟14將p'加到總得分率變量sum中。步驟15檢測(cè)i是否小于測(cè)試集中的模型總數(shù)N, 若是則執(zhí)行步驟16讓i自增l,否則執(zhí)行步驟17。步驟17將sum的值除以測(cè)試集的模 型總數(shù)N即可得到三維模型檢索算法的平均得分率。
權(quán)利要求
1、一種基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法,其特征在于該方法包括如下步驟(1)測(cè)試集的構(gòu)造(a)收集三維模型文件,將所有三維模型文件轉(zhuǎn)換成相同的文件格式;(b)對(duì)三維模型文件進(jìn)行基于語(yǔ)義的分類,得到一個(gè)基本語(yǔ)義分類表;(c)將基本語(yǔ)義分類表轉(zhuǎn)換成為基于形狀的分類表;(d)對(duì)基于形狀的分類表中的每一個(gè)類別,標(biāo)注該類別與表中其它類別的相似度;所述的相似度按如下方式定義將相同類別的三維模型間的相似度定義為字母S;將不同類別的三維模型間的相似度定為5個(gè)級(jí)別,分別用字母A、B、C、D、E表示,其中,A表示的兩個(gè)三維模型之間的相似度最高,E為兩個(gè)三維模型毫不相似,其它的字母所表達(dá)的相似度介于A與E之間;則按照相似度由高到低的排列順序?yàn)镾>A>B>C>D>E;(2)評(píng)價(jià)指標(biāo)的設(shè)計(jì)(a)用一種特征提取算法對(duì)步驟(1d)得到測(cè)試集中的每一個(gè)模型作出查詢,對(duì)于包含N個(gè)三維模型的測(cè)試集,得到N個(gè)檢索結(jié)果;(b)根據(jù)步驟(1d)得到的相似度標(biāo)注結(jié)果,將檢索結(jié)果列表轉(zhuǎn)換為相應(yīng)的相似性序列;(c)按如下方式對(duì)相似性序列中的每一個(gè)相似性字母的得分率S進(jìn)行計(jì)算記Score(SS,SL)表示相似性序列中相似性字母的得分,它的值為相似性字母的后繼中比該相似性字母小的相似性字母的個(gè)數(shù),即其中其中,SS表示相似性序列,SL表示相似性字母;記Score(SS)表示相似性序列的得分,它的值為相似性序列中每一個(gè)相似性字母的得分的總和,即其中,SS表示相似性序列;則,相似性序列中每一個(gè)相似性字母的得分率S定義為Score(SS)/Score(PSS),其中,PSS為與相似性序列所對(duì)應(yīng)的最好相似性序列,即將該相似性序列中的所有字母按照相似性降序排列;(d)對(duì)于包含N個(gè)三維模型的測(cè)試集,按照步驟(2c)的算法,得到N個(gè)相似性字母的得分率S1,S2,...,SN,則對(duì)于步驟(2a)中所使用的特征提取算法最終評(píng)價(jià)結(jié)果為
2、 根據(jù)權(quán)利要求l所述的基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方f ,其特征在于 步驟(lc)所述的將基本語(yǔ)義分類表轉(zhuǎn)換成為基于形狀的分類表的方法包括如下步驟(i) 將基本語(yǔ)義分類表中的全部類別復(fù)制到一張新的表中;(ii) 對(duì)新表中的每個(gè)類別執(zhí)行以下操作,直到所有的類別都執(zhí)行了一遍如果該 類別中的全部三維模型的形狀都足夠相似,則重復(fù)執(zhí)行(ii);否則將該類別分裂成為若 干個(gè)類別,使得每個(gè)類別中模型之間的相似度都很高。
3、 根據(jù)權(quán)利要求l所述的基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法,其特征在于 步驟(ld)按照如下方式標(biāo)注該類別與表中其它類別的相似度對(duì)于一個(gè)物體,可以分 為若干個(gè)有意義的局部區(qū)域;如果兩個(gè)物體的區(qū)域之間少于等于20%的對(duì)應(yīng)關(guān)系,則 這兩個(gè)模型之間具有E的相似度;如果兩個(gè)模型的區(qū)域之間有大于20%、而小于等于 40%的對(duì)應(yīng)關(guān)系,則這兩個(gè)模型之間就具有D的相似度;如果對(duì)應(yīng)的區(qū)域數(shù)大于40%小 于等于60%則相似度為C;如果對(duì)應(yīng)的區(qū)域數(shù)大于60%小于等于80%,則相似度為B; 如果對(duì)應(yīng)的區(qū)域數(shù)大于80%則相似度為A。
4、 根據(jù)權(quán)利要求l所述的基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法,其特征在于 步驟(2b)所述的將檢索結(jié)果列表轉(zhuǎn)換為相應(yīng)的相似性序列,方法如下依據(jù)檢索結(jié)果 列表的排列順序,從上到下逐一比較特征提取算法中所查詢的模型與檢索結(jié)果列表中的 模型的相似度,該相似度遵循步驟(ld)所標(biāo)注的相似度,并將該相似度記錄下來(lái)形成 相應(yīng)的相似性序列。
全文摘要
本發(fā)明公開了一種基于內(nèi)容的三維模型檢索性能的評(píng)價(jià)方法,由測(cè)試集的構(gòu)造和評(píng)價(jià)指標(biāo)的設(shè)計(jì)兩個(gè)部分組成,測(cè)試集的構(gòu)造和評(píng)價(jià)指標(biāo)的設(shè)計(jì)。前者提供進(jìn)行評(píng)價(jià)的數(shù)據(jù)基礎(chǔ),而后者則是給出具體的評(píng)價(jià)流程。本發(fā)明為如何對(duì)基于內(nèi)容的三維模型檢索算法進(jìn)行評(píng)價(jià)給出了一個(gè)切實(shí)可行的解決方案,具有以下的幾點(diǎn)優(yōu)點(diǎn)1)傳統(tǒng)的評(píng)價(jià)方法將兩個(gè)模型之間的相似度只定義為相關(guān)或者不相關(guān),而本發(fā)明則考慮了模型之間存在多種級(jí)別的相似性;2)傳統(tǒng)的評(píng)價(jià)方法只考慮同一類別的模型之間存在相似性,而忽視了不同類別間也可能是存在著相似性,而本發(fā)明考慮到了這點(diǎn)。本發(fā)明可應(yīng)用于三維模型檢索算法的評(píng)價(jià),從而促進(jìn)基于內(nèi)容三維模型研究的進(jìn)一步發(fā)展。
文檔編號(hào)G06F17/30GK101436213SQ200810243868
公開日2009年5月20日 申請(qǐng)日期2008年12月16日 優(yōu)先權(quán)日2008年12月16日
發(fā)明者楊育彬, 林金杰 申請(qǐng)人:南京大學(xué)