一種商標(biāo)圖像識(shí)別方法

文檔序號(hào)：9922295閱讀：2663來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種商標(biāo)圖像識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于視覺(jué)目標(biāo)檢測(cè)與識(shí)別技術(shù)領(lǐng)域，具體涉及一種商標(biāo)圖像識(shí)別方法。
【背景技術(shù)】
[0002] 近年來(lái)，隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和普及，尤其是社交網(wǎng)站的不斷推廣和應(yīng)用，網(wǎng)絡(luò)上的圖像呈快速增長(zhǎng)趨勢(shì)，這使得網(wǎng)絡(luò)媒體成為最具潛力的廣告及商業(yè)平臺(tái)。品牌跟蹤是近些年出現(xiàn)的一種服務(wù)，通過(guò)分析品牌在媒體上曝光的頻繁程度以及用戶的評(píng)價(jià)來(lái)評(píng) 估品牌的成長(zhǎng)。傳統(tǒng)的分析方法有兩種，一種是依靠人工進(jìn)行分析和統(tǒng)計(jì)，由于網(wǎng)絡(luò)媒體數(shù) 量巨大，這種方式需要耗費(fèi)大量的人力和時(shí)間；第二種方式是通過(guò)網(wǎng)站的關(guān)鍵詞搜索功能檢索相關(guān)的圖像，然而關(guān)鍵詞并不一定與內(nèi)容密切相關(guān):一方面搜索結(jié)果中含有大量噪聲，盡管含有關(guān)鍵詞，但經(jīng)常與品牌并不相關(guān)，另一方面大量含有商標(biāo)的圖像無(wú)法檢索到。因此設(shè)計(jì)一種對(duì)圖像內(nèi)容進(jìn)行分析，自動(dòng)識(shí)別其中所含商標(biāo)的方法，具有重要的商業(yè)應(yīng)用價(jià)值。
[0003] 近年來(lái)，研究人員提出了一些基于"詞袋模型"的商標(biāo)識(shí)別方法:首先從圖像中提取SIFT或SURF特征，然后對(duì)這些特征進(jìn)行聚類(lèi)，形成視覺(jué)詞，然后將原始特征進(jìn)行量化得到這些視覺(jué)詞，這樣每張圖像就可以表示成視覺(jué)詞的集合。跟直接使用原始的特征相比，量化后的特征維度大大降低，可以用于大規(guī)模的商標(biāo)識(shí)別任務(wù)。但是，基于"詞袋模型"的方法存在兩點(diǎn)不足:一是量化過(guò)程在降低原始特征維度的同時(shí)，也在一定程度上降低了原始特征的表示能力，導(dǎo)致兩個(gè)原本不同的特征在量化后可能會(huì)被認(rèn)為是相同的，稱(chēng)為"誤匹配"。為了盡可能地減少這些誤匹配，研究者們提出了一系列方法。代表作包括S.Romberg等人2013 年在文獻(xiàn)"Bundle min-hashing for logo recognition"中提出的同時(shí)考慮相鄰的多個(gè)關(guān) 鍵點(diǎn)的方法，以及C.Wan等人2013年在文獻(xiàn)"Tree-based shape descriptor for scalable logo detection"中提出的將空間位置滿足一定條件的四個(gè)關(guān)鍵點(diǎn)組合成一種樹(shù)形結(jié)構(gòu)的方法。這些方法能在一定程度上緩解誤匹配的問(wèn)題，但是它們對(duì)圖像的仿射變換以及關(guān)鍵點(diǎn)缺失的魯棒性還有不足。
[0004] 基于"詞袋模型"的方法的第二個(gè)不足之處在于圖像中存在大量與商標(biāo)不相關(guān)的關(guān)鍵點(diǎn)，這些關(guān)鍵點(diǎn)不僅會(huì)干擾商標(biāo)的正確識(shí)別，同時(shí)也會(huì)嚴(yán)重影響識(shí)別速度。為了去除這些不相關(guān)的關(guān)鍵點(diǎn)，比較直接的做法是僅考慮出現(xiàn)在商標(biāo)區(qū)域中的那些關(guān)鍵點(diǎn)，但是，對(duì)于不同類(lèi)型的商標(biāo)，檢測(cè)出來(lái)的關(guān)鍵點(diǎn)數(shù)量差異很大，如果太少會(huì)影響識(shí)別效果，如果太多會(huì) 降低識(shí)別速度;另外，那些出現(xiàn)在商標(biāo)區(qū)域內(nèi)的關(guān)鍵點(diǎn)有很多是與背景相關(guān)的，它們與商標(biāo) 本身并沒(méi)有什么相關(guān)性。所以，只考慮出現(xiàn)在商標(biāo)區(qū)域內(nèi)的關(guān)鍵點(diǎn)的方法并不能很好地去除那些商標(biāo)無(wú)關(guān)的關(guān)鍵點(diǎn)。
[0005] 綜上所述，現(xiàn)有的商標(biāo)識(shí)別技術(shù)存在兩個(gè)不足之處:一是沒(méi)有一種對(duì)圖像仿射變換和關(guān)鍵點(diǎn)缺失具有較好魯棒性的誤匹配消除方法;二是沒(méi)有在識(shí)別過(guò)程中能有效過(guò)濾那些與商標(biāo)不相關(guān)關(guān)鍵點(diǎn)的方法。

【發(fā)明內(nèi)容】

[0006] 針對(duì)現(xiàn)有技術(shù)的不足，本發(fā)明提出了一種新的商標(biāo)圖像識(shí)別方法，該技術(shù)采用首先使用基于互信息的特征選擇方法來(lái)過(guò)濾掉大量與商標(biāo)不相關(guān)的特征點(diǎn)，然后使用一種新的拓?fù)浼s束方法來(lái)消除誤匹配，通過(guò)二者的結(jié)合，能夠達(dá)到識(shí)別速度快、識(shí)別率高的效果。
[0007] 本發(fā)明的一種商標(biāo)圖像識(shí)別方法，包括如下步驟：
[0008] 首先采用基于互信息的特征選擇方法來(lái)過(guò)濾掉大量與商標(biāo)不相關(guān)的特征點(diǎn)，包含以下步驟：
[0009] (1)對(duì)于待識(shí)別的每種商標(biāo)，準(zhǔn)備一定數(shù)量(不少于5張）的訓(xùn)練樣本，保證商標(biāo)在每張樣本中至少出現(xiàn)一次；
[0010] (2)對(duì)每張訓(xùn)練樣本提取局部特征，如SIFT(Scale_Invariant Feature Transform)、SURF(Speeded Up Robust Features)特征，并對(duì)特征進(jìn)行聚類(lèi)和量化，將每張訓(xùn)練樣本表示成視覺(jué)詞集合；
[0011] (3)對(duì)于每種商標(biāo)，將包含該商標(biāo)的樣本作為正樣本，不包含該商標(biāo)的樣本作為負(fù) 樣本，計(jì)算正樣本所包含的所有視覺(jué)詞的互信息，基于互信息對(duì)這些視覺(jué)詞進(jìn)行排序，選取互信息值最大的前η(默認(rèn)100)個(gè)作為識(shí)別這種商標(biāo)的特征。
[0012] 進(jìn)一步，基于選取出來(lái)的特征對(duì)測(cè)試圖片進(jìn)行商標(biāo)識(shí)別，包含以下步驟：
[0013] (4)對(duì)每張測(cè)試圖像提取相同的局部特征，然后利用步驟(2)得到的聚類(lèi)中心對(duì)這些特征進(jìn)行量化，將測(cè)試圖像表示成視覺(jué)詞的集合；
[0014] (5)關(guān)鍵點(diǎn)匹配:首先利用步驟(3)中選取出來(lái)的前η個(gè)視覺(jué)詞特征對(duì)測(cè)試圖像的關(guān)鍵點(diǎn)進(jìn)行過(guò)濾，僅保留那些包含在這η個(gè)視覺(jué)詞集合中的關(guān)鍵點(diǎn)。對(duì)測(cè)試圖像與待識(shí)別商標(biāo)的每張正樣本進(jìn)行匹配，得到初始匹配點(diǎn)對(duì)，并記錄匹配關(guān)鍵點(diǎn)對(duì)的位置信息。
[0015] 進(jìn)一步，利用特征點(diǎn)的拓?fù)潢P(guān)系來(lái)消除誤匹配的方法，具體步驟如下：
[0016] (6)對(duì)于步驟(5)中得到的每對(duì)匹配點(diǎn)，找到它們?cè)诟髯詧D像中距離最近的k(默認(rèn) 10)個(gè)關(guān)鍵點(diǎn)，對(duì)這k個(gè)關(guān)鍵點(diǎn)各添加一個(gè)關(guān)于中心點(diǎn)（匹配點(diǎn)）的對(duì)稱(chēng)點(diǎn)，然后對(duì)著2k個(gè)關(guān) 鍵點(diǎn)按順時(shí)針?lè)较蜻M(jìn)行排序，分別得到兩個(gè)2k長(zhǎng)度，并且首尾相連的序列；
[0017] (7)對(duì)步驟(6)中得到的兩個(gè)序列求最長(zhǎng)公共子序列(LCS)，再求出最長(zhǎng)公共子序列占所有2k個(gè)關(guān)鍵點(diǎn)的比例，作為匹配點(diǎn)對(duì)之間的匹配度，如果匹配度小于閾值α(默認(rèn) 0.6)，則認(rèn)為是誤匹配，將它們從匹配點(diǎn)對(duì)中剔除;本發(fā)明中的消除誤匹配的方法也可以單獨(dú)使用，用于去除錯(cuò)誤匹配的關(guān)鍵點(diǎn)對(duì)；
[0018] (8)統(tǒng)計(jì)保留下來(lái)的匹配點(diǎn)對(duì)中不同視覺(jué)詞的數(shù)目作為測(cè)試圖像與樣本之間的相似度；
[0019] (9)計(jì)算測(cè)試圖像與待識(shí)別商標(biāo)的所有正樣本之間的最大相似度，作為判斷測(cè)試圖像是否包含該商標(biāo)的置信度，如果置信度大于閾值β，則認(rèn)為測(cè)試圖像包含這種商標(biāo)。
[0020] 本發(fā)明的有益效果在于：能夠快速準(zhǔn)確地從圖像中自動(dòng)識(shí)別出是否包含某種商標(biāo)，在普通PC機(jī)上識(shí)別一類(lèi)商標(biāo)的速度約為20ms/張，識(shí)別精度可以達(dá)到90%以上，達(dá)到了實(shí)際應(yīng)用水平。本發(fā)明之所以具有上述效果，其原因在于:本發(fā)明采用特征選擇來(lái)過(guò)濾掉大量與目標(biāo)商標(biāo)不相關(guān)的特征點(diǎn)，降低了它們對(duì)識(shí)別結(jié)果的干擾，同時(shí)降低了后續(xù)步驟的時(shí) 間復(fù)雜度;在此基礎(chǔ)上，利用一種對(duì)圖像仿射變換和關(guān)鍵點(diǎn)缺失都具有較好魯棒性的拓?fù)?約束來(lái)消除錯(cuò)誤匹配，能夠進(jìn)一步提高識(shí)別精度。
【附圖說(shuō)明】
[0021] 圖1是本發(fā)明的技術(shù)流程圖。
[0022] 圖2是采用具體圖像的技術(shù)流程圖。
[0023]圖3是特征選擇效果圖。
[0024]圖4是添加對(duì)稱(chēng)點(diǎn)示意圖。
[0025]圖5是拓?fù)浼s束示意圖。
[0026]圖6是消除誤匹配效果圖。
【具體實(shí)施方式】
[0027]下面結(jié)合附圖和具體實(shí)例對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述。
[0028]本發(fā)明是一種商標(biāo)圖像識(shí)別方法，其技術(shù)流程如圖1和圖2所示，具體包含以下步驟：
[0029] (1)準(zhǔn)備正樣本，提取視覺(jué)特征
[0030] 對(duì)待識(shí)別的每種商標(biāo)準(zhǔn)備一定數(shù)量的訓(xùn)練樣本，并對(duì)這些訓(xùn)練樣本提取一種局部特征，如SIFT特征或者SURF特征，然后對(duì)提取出來(lái)的特征進(jìn)行聚類(lèi)和量化，得到關(guān)鍵點(diǎn)的視覺(jué)詞表示，如公式一所示：
[0031] 公式一 :k={P(k)，S(k)，I(k)}
[0032] 其中，k表示第k個(gè)關(guān)鍵點(diǎn)，P(k)表示位置，S(k)表示尺度，I(k)表示最近的聚類(lèi)中心。
[0033] (2)基于互信息的特征選擇
[0034]對(duì)于每種商標(biāo)，將所有訓(xùn)練樣本中包含該商標(biāo)的樣本作為正樣本，不包含該商標(biāo) 的樣本作為負(fù)樣本，計(jì)算正樣本中所有視覺(jué)詞的互信息，計(jì)算方法如公式二所示：
[0036]其中，c表示正樣本所屬類(lèi)別，t表示正樣本中的某個(gè)視覺(jué)詞;表示包含或不包含 (i = l表示包含，i = 〇表示不包含)視覺(jué)詞t并且屬于或不屬于（j = l表示屬于，j = 0表示不屬于)正樣本的圖片數(shù)量。舉例來(lái)說(shuō)，N1Q表示包含視覺(jué)詞t但不屬于類(lèi)別c的圖片數(shù)量，以此類(lèi)推。Ni. =Ni〇+Nii，N. j = N〇j+Nij，Ν=Νοο+Νοι+Νιο+Νιι〇
[0037]接著我們按照I(t，c)從大到小對(duì)所有視覺(jué)詞進(jìn)行排序，選取前n(默認(rèn)100,也可以是其它值)個(gè)視覺(jué)詞作為后續(xù)識(shí)別這種商標(biāo)的特征。因?yàn)榛バ畔⑹呛饬刻卣髋c類(lèi)別相關(guān)性的重要指標(biāo)，互信息值越大，表示特征與類(lèi)別的相關(guān)性越大，在分類(lèi)(識(shí)別)過(guò)程中對(duì)結(jié)果的影響也越大，所以利用特征選擇，能夠過(guò)濾掉大量與目標(biāo)商標(biāo)不相關(guān)的視覺(jué)詞(對(duì)應(yīng)的關(guān)鍵點(diǎn)也隨之被過(guò)濾掉），一方面能夠降低它們對(duì)識(shí)別結(jié)果的干擾，另一方面能夠極大地縮短后續(xù)匹配和校驗(yàn)的時(shí)間，進(jìn)而提高整體的識(shí)別速度。特征選擇的效果如圖3所示，圖中共有四對(duì)圖像，每對(duì)圖像中左圖為特征選擇前的圖像，右圖為特征選擇后的圖像。
[0038] (3)關(guān)鍵點(diǎn)匹配
[0039]對(duì)于測(cè)試圖片，在識(shí)別它是否包含某種商標(biāo)的時(shí)候，需要計(jì)算它與這種商標(biāo)的所有正樣本之間的相似度，然后基于最大相似度來(lái)判斷它是否包含這種商標(biāo)，如果大于閾值 β，則認(rèn)為測(cè)試圖像包含這種商標(biāo)。計(jì)算測(cè)試圖片與正樣本之間相似度的流程如下：
[0040] 同（1)，首先對(duì)測(cè)試圖片提取相同的局部特征，然后利用（1)中得到的聚類(lèi)中心對(duì) 特征進(jìn)行量化，將測(cè)試圖片表示成視覺(jué)詞集合。然后利用（2)中得到的η個(gè)特征對(duì)測(cè)試圖片進(jìn)行關(guān)鍵點(diǎn)過(guò)濾，僅保留那些在這η個(gè)視覺(jué)詞范圍內(nèi)的關(guān)鍵點(diǎn)，這樣測(cè)試圖片與正樣本中剩下的關(guān)鍵點(diǎn)數(shù)目跟η在同一個(gè)數(shù)量級(jí)。<

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：唐攀攀;彭宇新;
技術(shù)所有人：北京大學(xué);
我是此專(zhuān)利的發(fā)明人

上一篇：一種基于蒙特卡羅數(shù)據(jù)均衡的圖像自動(dòng)標(biāo)注方法
上一篇：單面英文碎紙片拼接識(shí)別方法

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像識(shí)別方法相關(guān)技術(shù)

圖像識(shí)別的方法相關(guān)技術(shù)

安檢圖像識(shí)別方法相關(guān)技術(shù)

圖像識(shí)別常用的方法相關(guān)技術(shù)

箭頭圖像識(shí)別方法相關(guān)技術(shù)

安檢機(jī)圖像識(shí)別方法相關(guān)技術(shù)

車(chē)牌識(shí)別圖像分割方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種商標(biāo)圖像識(shí)別方法