一種2d圖像與3d圖像的識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種識(shí)別方法,尤其涉及一種2D圖像與3D圖像的識(shí)別方法。
【背景技術(shù)】
[0002] 3D圖像、3D視頻由于其獨(dú)特的立體顯示效果而越來越受到大眾的歡迎。現(xiàn)有各種 圖像瀏覽設(shè)備往往不能自動(dòng)識(shí)別2D圖像和3D圖像,而需要用戶進(jìn)行手動(dòng)切換,造成瀏覽圖 像不便。
【發(fā)明內(nèi)容】
[0003] 有鑒于此,確有必要提供一種可應(yīng)用于各種圖像瀏覽設(shè)備的自動(dòng)識(shí)別2D圖像與3D 圖像的方法。
[0004] 本發(fā)明提供一種2D圖像與3D圖像的識(shí)別方法,其包括以下步驟:
[0005] (1)將多幅2D圖像和多幅3D圖像作為樣本圖像集;
[0006] (2)將所述樣本圖像集合中的每一幅圖像分為大小相同的左半圖樣本和右半圖樣 本,并分別對(duì)所述左半圖樣本和右半圖樣本提取顏色自相關(guān)圖特征;
[0007] (3)計(jì)算所述左半圖樣本的顏色自相關(guān)圖特征和右半圖樣本的顏色自相關(guān)圖特征 之間的差異性&,以及所述左半圖樣本、右半圖樣本之間的相關(guān)系數(shù)(: 2,并將&、(:2作為評(píng)價(jià) 指標(biāo);
[0008] (4)將評(píng)價(jià)指標(biāo)CjPC2綜合并構(gòu)建決策模型,得到最優(yōu)分類邊界;以及
[0009] (5)通過提取待識(shí)別圖像的左半圖和右半圖的顏色自相關(guān)圖特征及相關(guān)系數(shù)特 征,以最優(yōu)分類邊界為依據(jù)對(duì)該待識(shí)別圖像進(jìn)行分類以及標(biāo)記。
[0010]與現(xiàn)有技術(shù)相比較,本發(fā)明提供的2D圖像與3D圖像的識(shí)別方法具有以下優(yōu)點(diǎn):通 過對(duì)多幅2D圖像和3D圖像進(jìn)行左、右半圖樣本的顏色自相關(guān)圖特征分析,計(jì)算左、右半圖樣 本的顏色自相關(guān)圖之間的差異性G,并進(jìn)一步分析左、右半圖樣本的相關(guān)系數(shù)特征(^以心 和(: 2構(gòu)建決策模型得到最優(yōu)分類邊界。以該最優(yōu)分類邊界作為參考來對(duì)待識(shí)別圖像進(jìn)行分 類。該方法可實(shí)現(xiàn)對(duì)2D圖像和3D圖像的自動(dòng)識(shí)別,精確度較高,簡(jiǎn)單方便,大量減少了用戶 的手動(dòng)切換,為瀏覽圖像提供了便利。該方法可應(yīng)用于各種圖像瀏覽設(shè)備中。
【附圖說明】
[0011 ]圖1為本發(fā)明所述2D圖像與3D圖像的識(shí)別方法的流程圖。
[0012] 圖2至圖5為本實(shí)施例樣本圖像集中的2D圖像以及3D圖像。
[0013] 圖6至圖9分別為圖2至圖5的左、右半圖樣本的顏色自相關(guān)圖的直方圖(其中圖6對(duì) 應(yīng)于圖2,圖7對(duì)應(yīng)于圖3,圖8對(duì)應(yīng)于圖4,圖9對(duì)應(yīng)于圖5,圖6至圖9中"左"代表左半圖樣本, "右"代表右半圖樣本)。
[0014] 如下具體實(shí)施例將結(jié)合上述附圖進(jìn)一步說明本發(fā)明。
【具體實(shí)施方式】
[0015]以下將對(duì)本發(fā)明提供的2D圖像與3D圖像的識(shí)別方法作進(jìn)一步說明。
[0016]本發(fā)明提供一種2D圖像與3D圖像的識(shí)別方法。該方法包括以下步驟:
[0017] S1,將多幅2D圖像和多幅3D圖像作為樣本圖像集;
[0018] S2,將所述樣本圖像集合中的每一幅圖像分為大小相同的左半圖樣本和右半圖樣 本,分別對(duì)所述左半圖樣本和右半圖樣本提取顏色自相關(guān)圖特征;
[0019] S3,計(jì)算所述左半圖樣本的顏色自相關(guān)圖特征和右半圖樣本的顏色自相關(guān)圖特征 之間的差異性&,同時(shí)計(jì)算所述左半圖樣本、右半圖樣本之間的相關(guān)系數(shù)&,并將作為 評(píng)價(jià)指標(biāo);
[0020] S4,將評(píng)價(jià)指標(biāo)&和&綜合并構(gòu)建決策模型,得到最優(yōu)分類邊界;以及
[0021] S5,通過提取待識(shí)別圖像的左半圖和右半圖的顏色自相關(guān)圖特征及相關(guān)系數(shù)特 征,以最優(yōu)分類邊界為依據(jù)對(duì)該待識(shí)別圖像進(jìn)行分類以及標(biāo)記。
[0022]在步驟S1中,將該樣本圖像集作為研究對(duì)象,以獲得多幅圖像的CjPC2,從而更好 的構(gòu)建決策模型。
[0023]在步驟S1之后步驟S2之前還包括一對(duì)所述樣本圖像集合中的每一幅圖像進(jìn)行降 采樣處理的步驟。具體來說,將所述樣本圖像集合中所有的圖像降采樣到固定大小。
[0024]在步驟S2中,相對(duì)于普通的2D圖像,左右格式的3D圖像明顯的不同在于,左半圖與 右半圖具有相同的內(nèi)容,只是存在一定的視差,因此本方法利用3D圖像的這個(gè)特性來進(jìn)行 特征提取,從而實(shí)現(xiàn)自動(dòng)識(shí)別2D圖像與3D圖像。
[0025] 所述顏色自相關(guān)圖特征是指利用相同顏色對(duì)的空間關(guān)系,將顏色和空間信息結(jié)合 起來對(duì)圖像進(jìn)行描述。具體的,將降采樣后得到圖像依中線分為左、右兩部分,分別稱為左 半圖樣本、右半圖樣本。對(duì)左、右半圖樣本分別用顏色自相關(guān)圖特征進(jìn)行描述,比較兩者之 間的相似性。
[0026] 在步驟S3中,可用歐式距離衡量所述左半圖樣本的顏色自相關(guān)圖特征和右半圖樣 本的顏色自相關(guān)圖特征之間的差異性&,即所述左半圖樣本的顏色自相關(guān)圖特征和右半圖 樣本的顏色自相關(guān)圖特征之間的距離為&。將&、&共同作為評(píng)價(jià)指標(biāo)的原因在于:&與&可 起到互補(bǔ)的作用,防止內(nèi)容上相似的2D圖像(如圖3)以及顏色上具有對(duì)稱性的2D圖像(如圖 4)對(duì)識(shí)別產(chǎn)生干擾。
[0027] 本實(shí)施例中,以圖2至圖5為例,計(jì)算得到的&和&值如下表1所示:
[0028] 表 1
[0030]圖6至圖9分別給出了圖2至圖5的左半圖樣本、右半圖樣本的顏色自相關(guān)圖的直方 圖。其中圖4的左、右半圖樣本顏色自相關(guān)圖特征(如圖7)之間具有明顯的相似性,但其左、 右半圖樣本的相關(guān)系數(shù)僅為0.3047(見表1);而圖3的左、右半圖樣本之間的相關(guān)系數(shù)為 0.7767,但是通過左、右半圖樣本顏色自相關(guān)圖特征,可以區(qū)分其并非左右格式圖像。這說 明將Cl、C2同時(shí)作為評(píng)價(jià)指標(biāo)這一方法對(duì)具有干擾性的圖像有一定的魯棒性(robustness)。 [0031]由表1、圖6至圖9可見,本方法中所述的&和&之間確實(shí)起到了互補(bǔ)的作用,將&和 C 2同時(shí)作為評(píng)價(jià)指標(biāo)可以有效保證圖像分類的正確率。
[0032]在步驟S4中,將評(píng)價(jià)指標(biāo)CjPC2綜合并構(gòu)建決策模型具體為:將評(píng)價(jià)指標(biāo)CjPC2綜 合并通過決策樹模型來構(gòu)建所述決策模型或者通過支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)或貝葉斯方 法構(gòu)建所述決策模型。以決策樹模型為例,將評(píng)價(jià)指標(biāo)&、(: 2及其相應(yīng)的類別屬性輸入決策 樹模型,即可得到最優(yōu)分類邊界。將此決策樹模型存儲(chǔ)于圖像瀏覽設(shè)備之中。
[0033] 本實(shí)施例中,所獲取的最優(yōu)分類邊界為C!小于0.31,C2大于0.485,可識(shí)別出3D圖 像,測(cè)試精度達(dá)到95.24%。經(jīng)交叉驗(yàn)證,識(shí)別率均在90%以上。
[0034] 在步驟S5中,以最優(yōu)分類邊界為依據(jù)可對(duì)圖像瀏覽設(shè)備中待瀏覽文件夾下所有待 識(shí)別圖像進(jìn)行標(biāo)記。通過存儲(chǔ)于圖像瀏覽設(shè)備中的決策模型對(duì)該待識(shí)別圖像進(jìn)行自動(dòng)標(biāo) 記。具體的,將標(biāo)記結(jié)果存儲(chǔ)為當(dāng)前待識(shí)別圖像的圖像信息的一部分;對(duì)待瀏覽文件夾進(jìn)行 篩選以實(shí)現(xiàn)對(duì)未標(biāo)記的圖像進(jìn)行分類以及標(biāo)記,以避免重復(fù)標(biāo)記;最終實(shí)現(xiàn)對(duì)待瀏覽文件 夾下所有圖像的標(biāo)記。
[0035] 為了應(yīng)對(duì)識(shí)別錯(cuò)誤的情形,在步驟S5之后還可包括一對(duì)待識(shí)別圖像誤標(biāo)記時(shí)進(jìn)行 更正的步驟。具體的對(duì)于錯(cuò)誤標(biāo)記的圖像,其在瀏覽時(shí)以錯(cuò)誤的瀏覽方式顯示,用戶可自行 更正當(dāng)前圖像的標(biāo)記,此時(shí)只需將標(biāo)記的接口開放給用戶即可。
[0036]與現(xiàn)有技術(shù)相比較,本發(fā)明提供的2D圖像與3D圖像的識(shí)別方法具有以下優(yōu)點(diǎn):通 過對(duì)多幅2D圖像和3D圖像進(jìn)行左、右半圖樣本的顏色自相關(guān)圖特征分析,計(jì)算左、右半圖樣 本的顏色自相關(guān)圖之間的差異性Q,并進(jìn)一步分析左、右半圖樣本的相關(guān)系數(shù)特征(^,以心 和(: 2構(gòu)建決策模型得到最優(yōu)分類邊界。以該最優(yōu)分類邊界作為參考來對(duì)待識(shí)別圖像進(jìn)行分 類。該方法可實(shí)現(xiàn)對(duì)2D圖像和3D圖像的自動(dòng)識(shí)別,精確度較高,簡(jiǎn)單方便,大量減少了用戶 的手動(dòng)切換,為瀏覽圖像提供了便利,從而保證了用戶獲得較高的體驗(yàn)滿意度。
[0037]以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對(duì) 于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對(duì)本發(fā)明進(jìn)行 若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。
[0038]對(duì)所公開的實(shí)施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。 對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的 一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明 將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一 致的最寬的范圍。
【主權(quán)項(xiàng)】
1. 一種2D圖像與3D圖像的識(shí)別方法,其包括以下步驟: (1) 將多幅2D圖像和多幅3D圖像作為樣本圖像集; (2) 將所述樣本圖像集合中的每一幅圖像分為大小相同的左半圖樣本和右半圖樣本, 分別對(duì)所述左半圖樣本和右半圖樣本提取顏色自相關(guān)圖特征; (3) 計(jì)算所述左半圖樣本的顏色自相關(guān)圖特征和右半圖樣本的顏色自相關(guān)圖特征之間 的差異性心,以及所述左半圖樣本、右半圖樣本之間的相關(guān)系數(shù)(: 2,并將作為評(píng)價(jià)指 標(biāo); (4) 將評(píng)價(jià)指標(biāo)CjPC2綜合并構(gòu)建決策模型,得到最優(yōu)分類邊界;以及 (5) 通過提取待識(shí)別圖像的左半圖和右半圖的顏色自相關(guān)圖特征及相關(guān)系數(shù)特征,以 最優(yōu)分類邊界為依據(jù)對(duì)該待識(shí)別圖像進(jìn)行分類以及標(biāo)記。2. 如權(quán)利要求1所述的識(shí)別方法,其特征在于,在步驟(1)之后步驟(2)之前還包括一對(duì) 所述樣本圖像集合中的每一幅圖像進(jìn)行降采樣處理的步驟。3. 如權(quán)利要求1所述的識(shí)別方法,其特征在于,在步驟(4)中將評(píng)價(jià)指標(biāo)&和(:2綜合并構(gòu) 建決策模型具體為:將評(píng)價(jià)指標(biāo)&和(: 2綜合并通過決策樹模型來構(gòu)建所述決策模型或者通 過支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)或貝葉斯方法構(gòu)建所述決策模型。4. 如權(quán)利要求1所述的識(shí)別方法,其特征在于,在步驟(5)中當(dāng)待識(shí)別圖像位于待瀏覽 文件夾中時(shí),以最優(yōu)分類邊界為依據(jù)對(duì)該待識(shí)別圖像進(jìn)行分類以及標(biāo)記之后并將該標(biāo)記結(jié) 果儲(chǔ)存,通過對(duì)待瀏覽文件夾的篩選以實(shí)現(xiàn)對(duì)未標(biāo)記的圖像進(jìn)行分類以及標(biāo)記。5. 如權(quán)利要求1所述的識(shí)別方法,其特征在于,在步驟(5)之后還包括一對(duì)待識(shí)別圖像 誤標(biāo)記時(shí)進(jìn)行更正的步驟。
【專利摘要】本發(fā)明涉及一種2D圖像與3D圖像的識(shí)別方法,其包括以下步驟:(1)將多幅2D圖像和多幅3D圖像作為樣本圖像集;(2)將所述樣本圖像集合中的每一幅圖像分為大小相同的左、右半圖樣本,分別對(duì)所述左、右半圖樣本提取顏色自相關(guān)圖特征;(3)計(jì)算所述左、右半圖樣本的顏色自相關(guān)圖特征之間的差異性C1,及所述左半圖樣本、右半圖樣本之間的相關(guān)系數(shù)C2,并將C1、C2作為評(píng)價(jià)指標(biāo);(4)將C1和C2綜合并構(gòu)建決策模型,得到最優(yōu)分類邊界;以及(5)通過提取待識(shí)別圖像的左半圖和右半圖的顏色自相關(guān)圖特征及相關(guān)系數(shù)特征,并以最優(yōu)分類邊界為依據(jù)對(duì)該待識(shí)別圖像進(jìn)行分類以及標(biāo)記。
【IPC分類】G06K9/62, G06K9/46
【公開號(hào)】CN105550706
【申請(qǐng)?zhí)枴緾N201510924850
【發(fā)明人】陸晶, 趙佳俊
【申請(qǐng)人】大巨龍立體科技有限公司
【公開日】2016年5月4日
【申請(qǐng)日】2015年12月13日