生成圖像指紋及基于此進行相似圖像檢索的方法
【專利摘要】本發(fā)明提供了一種生成圖像指紋及基于該方法進行相似圖像檢索以用于圖像盜用識別的方法,所述圖像具有M行N列像素,包括如下步驟:a)對所述圖像中的每個像素點Xij,其中i=2,3,……M,j=2,3,……N,比較所述像素點與其左像素及上像素的灰度值大小,其中,左像素表示在所述一個像素的相鄰的方位上下左右的四個像素中左邊的像素,上像素表示在所述一個像素的相鄰的方位上下左右的四個像素中上邊的像素;b)根據(jù)不同的比較結果為所述像素點Xij賦予指紋值Zij;c)將所述每個像素點的指紋值Zij組合為序列得到長度為(M-1)×(N-1)的所述圖像的指紋。利用本發(fā)明的圖像盜用識別方法,能夠精準而高效地識別相似圖像,防止圖像盜用行為。
【專利說明】生成圖像指紋及基于此進行相似圖像檢索的方法
【技術領域】
[0001]本發(fā)明涉及計算機圖像檢索領域,特別是一種圖像盜用識別方法。
【背景技術】
[0002]隨著數(shù)碼拍攝設備的普及,數(shù)字圖像已經(jīng)成為重要的信息存儲和傳遞的媒介,同時數(shù)字圖像也越來越多地被發(fā)布到互聯(lián)網(wǎng)上。在海量網(wǎng)絡圖像數(shù)據(jù)的檢索過程中,如何在返回的檢索結果集中去除復制的或者相似的圖像來提高檢索的有效性具有重要的實際意義。例如在網(wǎng)絡商品交易平臺中,用戶通過自己發(fā)帖來進行物品的交換或買賣,在這種自由的環(huán)境中,很多用戶在發(fā)帖時使用的圖像并不是符合自己物品的真實圖像,而是盜用別人的圖像,這樣就會對想買這個東西的人形成一定的欺騙。另外,在很多實際應用中制作的圖像具有商業(yè)用途,并受版權保護,該類圖像是被禁止隨意拷貝和發(fā)布的。
[0003]現(xiàn)有的一種用于圖像盜用識別的技術是采用數(shù)字簽名方法。數(shù)字簽名方法是從圖像中提取不變特征,然后生成摘要,并將摘要與圖像捆綁在一起。最為常用數(shù)字簽名方法是根據(jù)圖像內容生成Md5值,并將Md5值作為圖像的簽名。然而,該類方法不能應對圖像變換的影響,只要對原圖稍作修改,例如在圖像中添加水印等,重新生成的圖像就會有截然不同的Md5值。所以該方法不能有效地檢測相似圖像。
[0004]現(xiàn)有的另外一種用于圖像盜用識別的技術方法是采用基于內容的圖像復制檢測方法,能夠較準確地檢索盜用的圖像。該類方法根據(jù)圖像的內容生成一個指紋來檢測待測圖像是否為原圖像的盜用。然而,若圖像庫中指紋過多時,對相似圖像的檢索需要耗費大量時間,使得盜用圖像的檢索效率較低。
[0005]因此,需要一種精準又高效的圖像盜用識別方法。
【發(fā)明內容】
[0006]本發(fā)明的目的是提供一種生成圖像指紋的方法,所述圖像具有M行N列像素,包括如下步驟:a)對所述圖像中的每個像素點Xij,其中i=2,3,……M,j=2,3,……N,比較所述像素點與其左像素及上像素的灰度值大小,其中,左像素表示在所述一個像素的相鄰的方位上下左右的四個像素中左邊的像素,上像素表示在所述一個像素的相鄰的方位上下左右的四個像素中上邊的像素;b)根據(jù)不同的比較結果為所述像素點Xu賦予指紋值Zu ;c)將所述每個像素點的指紋值合為序列得到長度為(M-1)*(N-1)的所述圖像的指紋。
[0007]優(yōu)選地,在所述步驟b中當“X≤A且X≤B”則賦予指紋值Zij=O ;若X≤A且X>B”則賦予指紋值Zu=I ?’若“X>A且X≤B”則賦予指紋值Zu=2 ?’若“X>A且X>B”則賦予指紋值Zu=3,其中X表示 所述像素點的灰度值,A表示所述像素點左像素的灰度值,B表示所述像素點上像素的灰度值。
[0008]根據(jù)本發(fā)明的另一個方面,提供了一種為圖像生成指紋并存儲的方法,其特征在于,包括如下步驟:a)將所述圖像縮放為統(tǒng)一大??;b)將所述圖像灰度化;c)生成圖像指紋,生成所述圖像指紋的方法如權利要求1所述;d)對所述圖像指紋進行兩次分解,生成(n+1) (n+2)個指紋片段,其中η代表任意兩個指紋相似的圖像漢明距離的差異值閾值;e)將所述指紋片段存入信息搜索庫,并建立所述指紋片段到所述圖像指紋的倒排索引。
[0009]優(yōu)選地,在步驟b中,計算灰度值的公式為:
[0010]灰度值=0.3R+0.58G+0.1lB (I)
[0011]其中R、G、B分別為該像素的紅色、綠色和藍色像素值。
[0012]優(yōu)選地,在所述步驟d中,對所述圖像指紋進行兩次分解的步驟包括:dl)將所述圖像指紋分解為n+1個指紋片段;和d2)將所述圖像指紋減去所述n+1個指紋片段中的每個指紋片段,并將與所述每個指紋片段對應的每個所述圖像指紋中的剩余的部分分解為n+1個片段。
[0013]優(yōu)選地,在所述步驟e中,在所述指紋片段中添加業(yè)務類別號。
[0014]根據(jù)本發(fā)明的又一方面,提供了一種相似圖像檢索方法,包括如下步驟:a)將所述圖像縮放為統(tǒng)一大小山)將所述圖像灰度化;c)生成圖像指紋,生成所述圖像指紋的方法如權利要求1所述;d)對所述圖像指紋進行兩次分解,生成(n+1) (n+2)個指紋片段,其中η代表任意兩個指紋相似的圖像漢明距離的差異值閾值;e)通過所述指紋片段的倒排索引,查詢具有相同所述指紋片段的圖像指紋的結果集;和f)計算待檢測圖像指紋與所述結果集中的圖像指紋的漢明距離,在所述結果集中,找出與所述待檢測圖像指紋的漢明距離小于η的圖像指紋,將其作為相似圖像。 [0015]優(yōu)選地,在所述步驟d中,對所述圖像指紋進行兩次分解的步驟包括:dl)將所述圖像指紋分解為n+1個指紋片段;和d2)將所述圖像指紋減去所述n+1個指紋片段中的每個指紋片段,并將與所述每個指紋片段對應的每個所述圖像指紋中的剩余的部分分解為n+1個片段。
[0016]優(yōu)選地,在所述步驟e中,通過所述指紋片段的倒排索引,查詢具有組合的指紋的結果集,其中,Bi (i ^ 1&&? ( n+1)表示步驟dl中分解得到的n+1個指紋片段中的任意一個,VQ≥IMi ( n+1, j≥l&&j ( n+1)表示步驟d2中分解得到的n+1個指紋片段中的任意一個。
[0017]優(yōu)選地,在所述步驟b中,計算灰度值的公式為:
[0018]灰度值=0.3R+0.58G+0.1lB (I)
[0019]其中R、G、B分別為該像素的紅色、綠色和藍色像素值。
[0020]利用本發(fā)明的圖像盜用識別方法,能夠精準而高效地識別相似圖像,防止圖像盜用行為。
【專利附圖】
【附圖說明】
[0021]參考隨附的附圖,本發(fā)明更多的目的、功能和優(yōu)點將通過本發(fā)明實施方式的如下描述得以闡明,其中:
[0022]圖1示意性示出了本發(fā)明的為圖像生成指紋并存儲的方法的流程圖。
[0023]圖2示意性示出了本發(fā)明的相似圖像檢索的流程圖。
【具體實施方式】
[0024]通過參考示范性實施例,本發(fā)明的目的和功能以及用于實現(xiàn)這些目的和功能的方法將得以闡明。然而,本發(fā)明并不受限于以下所公開的示范性實施例;可以通過不同形式來對其加以實現(xiàn)。說明書的實質僅僅是幫助相關領域技術人員綜合理解本發(fā)明的具體細節(jié)。
[0025]在下文中,將參考附圖描述本發(fā)明的實施例。在附圖中,相同的附圖標記代表相同或類似的部件,或者相同或類似的步驟。
[0026]本發(fā)明的圖像盜用識別方法實現(xiàn)精準且高效的圖像盜用識別的基本方法如下:對于某圖像,首先生成自定義的精準的圖像指紋,然后求出指紋的指紋片段,接著檢索出具有相同指紋片段的指紋的結果集,最后將該圖像的圖像指紋與結果集中的圖像指紋進行比對來找出相似圖像。
[0027]圖1示意性示出了本發(fā)明的為圖像生成指紋并存儲的方法流程圖。如圖1所示:
[0028]步驟110,將圖像縮放為統(tǒng)一大小。將所有的圖像統(tǒng)一縮放為M*N的小圖像。其中,M表示M行像素,N表示N列像素。例如將所有圖像縮放為10*9的小圖像。
[0029]步驟120,將圖像灰度化。圖像的灰度化是將圖像的每個像素點的RGB值通過計算轉化為一灰度值,用該灰度值來表示每個像素。優(yōu)選地,采用如下公式計算得到圖像的每個像素的灰度值。
[0030]灰度值=0.3R+0.58G+0.1lB (I)
[0031]其中R、G、B分別表示該像素的紅色、綠色和藍色像素值。
[0032]步驟130,生成自定義的圖像指紋。生成指紋的算法如下:
[0033]a)對于圖像中的某個像素X,比較像素X與其左像素A的根據(jù)步驟120計算得到的灰度值大小,以及像素X與其上像素B的灰度值大小,可以得出四種不同的比較結果,SP“X〈A且X〈B”、“X〈A且X>B”、“X>A且X〈B”及“X>A且X>B”。其中,左像素表示在某個像素的相鄰的方位上下左右四個像素中左邊的像素,上像素表示在某個像素的相鄰的方位上下左右四個像素中上邊的像素。
[0034]b)根據(jù)比較結果對像素X賦予指紋值Z。這里,比較結果的賦值可以是任何值,只要能夠區(qū)分四種比較結果即可。例如,若“X≤A且X≤B”則賦予指紋值Z=O ;若1≤A且X>B”則賦予指紋值Z=I ^“X>A且X≤B”則賦予指紋值Z=2 ^“X>A且X>B”則賦予指紋值 Z=3 ;
[0035]c)對圖像中的除了第一行和第一列以外所有的像素點執(zhí)行步驟a及步驟b的操作,將每個像素的指紋值Z組合為序列得到長度為(M-1)*(N-1)的一系列的值的組合,即該圖像的指紋。
[0036]步驟140,對圖像指紋進行分解,生成多個指紋片段。
[0037]優(yōu)選地,對圖像指紋進行兩次分解,生成多個指紋片段。若將兩個圖像的漢明距離的差異值小于等于η (η可以為用戶定義的值)的兩個指紋認為相似,則將指紋分解為指紋片段的算法如下所示:
[0038]a)將指紋L先分解為n+1個片段得到B1......an+1,即Bi (i≥1&&? ≤ n+1);其中,
“分解”是指把圖像指紋的(M-1)*(N-1)個值按順序劃分成若干個片段。比如,對于圖像的指紋{3,I, O, 2,3,O, 1, 2,1, 2, 1, 2},若將可以認為兩個指紋相似的圖像漢明距離的差異值閾值N設定為3,則將該圖像指紋分解為4個片段,分別為{3,1,0},{2, 3,0}, {1,2, 1}和{2,1,2}。
[0039]b)將總的 指紋L減去每個片段%之后剩余的部分分解為n+1片段得到b/……bf'即V(i≥1&&? ( n+1, j≥l&&j ( n+1)。從而得到一個完整的指紋的(n+1) (n+2)個指紋片段。
[0040]步驟150,將指紋片段存入信息搜索庫,并建立指紋片段到指紋的倒排索引。利用該倒排索引,可以直接通過某指紋片段找到包含該指紋片段的指紋的結果集。
[0041]優(yōu)選地,在每個圖像片段中都添加業(yè)務類別號,從而在搜索時只需在該業(yè)務類別的圖像片段中進行相似性檢索即可。具體地,信息搜索庫中存在所有業(yè)務的圖像的片段,為了與業(yè)務結合,在每個圖像片段中都添加一個業(yè)務類別號,搜索時只需要在相關業(yè)務的圖像片段內進行相似性檢索即可,例如,在進行房產(chǎn)類別的圖片的相似性檢索時,只需對含有房產(chǎn)類別號的圖像片段進行相似性檢索即可。從而能夠實現(xiàn)業(yè)務邏輯與技術結合。
[0042]圖2示意性示出了本發(fā)明的相似圖像檢索的流程圖。如圖2所示:
[0043]步驟210,將圖像縮放為統(tǒng)一大小。將待檢索的圖像統(tǒng)一縮放為M*N的小圖像。
[0044]步驟220,將圖像灰度化。優(yōu)選采用0.3R+0.58G+0.1lB計算得到圖像灰度值。
[0045]步驟230,生成自定義的圖像指紋。具體算法如步驟130所述。
[0046]步驟240,對圖像指紋進行分解,生成多個指紋片段。具體算法如步驟140所述。
[0047]步驟250,查詢具有相同指紋片段的指紋的結果集。通過指紋片段的倒排索引找到具有相同指紋片段的指紋的結果集。
[0048]優(yōu)選地,通過指紋片段的倒排索,查詢具有ai&&b?組合的指紋的結果集,即同時具有指紋片段aji≥1&&? ( n+1)以及指紋片段V(i≥1&&? ( n+1, j≥l&&j ( n+1)的指紋的結果集。
[0049]步驟260,計算與結果集中的指紋的漢明距離,找出相似圖像。若漢明距離小于可以認為兩張圖像相似的最大漢明距離的差異值n,則兩張圖像相似。例如,若可以認為是相似圖像的漢明距離的差異值的最大值η為10,而圖像A與結果集中的圖像B的指紋的漢明距離為7,則圖像A與圖像B相似。
[0050]利用本發(fā)明的圖像盜用識別方法,能夠精準而高效地識別相似圖像,防止圖像盜用行為。
[0051]結合這里披露的本發(fā)明的說明和實踐,本發(fā)明的其他實施例對于本領域技術人員都是易于想到和理解的。說明和實施例僅被認為是示例性的,本發(fā)明的真正范圍和主旨均由權利要求所限定。
【權利要求】
1.一種生成圖像指紋的方法,其特征在于,所述圖像具有M行N列像素,包括如下步驟: a)對所述圖像中的每個像素點Xij,其中i=2,3,......M,j=2,3,......N,比較所述像素點與其左像素及上像素的灰度值大小,其中,左像素表示在所述一個像素的相鄰的方位上下左右的四個像素中左邊的像素,上像素表示在所述一個像素的相鄰的方位上下左右的四個像素中上邊的像素; b)根據(jù)不同的比較結果為所述像素點Xu賦予指紋值Zu; c)將所述每個像素點的指紋值ZiJi合為序列得到長度為(M-1)*(N-1)的所述圖像的指紋。
2.如權利要求1所述的方法,其中在所述步驟b中當“X< A且X < B”則賦予指紋值Zij=O ;若1≤A且X>B”則賦予指紋值Zu=1-MuT>k且X≤B”則賦予指紋值Zu=2 ;^"Χ>Α且Χ>Β”則賦予指紋值Zu=3,其中X表示所述像素點的灰度值,A表示所述像素點左像素的灰度值,B表示所述像素點上像素的灰度值。
3.一種為圖像生成指紋并存儲的方法,其特征在于,包括如下步驟: a)將所述圖像縮放為統(tǒng)一大小; b)將所述圖像灰度化; c)生成圖像指紋,生成所述圖像指紋的方法如權利要求1所述; d)對所述圖像指紋進行兩次分解,生成(n+1)(n+2)個指紋片段,其中η代表任意兩個指紋相似的圖像漢明距離的差異值閾值; e)將所述指紋片段存入信息搜索庫,并建立所述指紋片段到所述圖像指紋的倒排索引。
4.根據(jù)權利要求3所述的方法,其特征在于,在步驟b中,計算灰度值的公式為: 灰度值=0.3R+0.58G+0.1lB (I) 其中R、G、B分別為該像素的紅色、綠色和藍色像素值。
5.根據(jù)權利要求3所述的方法,其特征在于,在步驟d中,對所述圖像指紋進行兩次分解的步驟包括: dl)將所述圖像指紋分解為n+1個指紋片段; d2)將所述圖像指紋減去所述n+1個指紋片段中的每個指紋片段,并將與所述每個指紋片段對應的每個所述圖像指紋中的剩余的部分分解為n+1個片段。
6.根據(jù)權利要求3所述的方法,其特征在于,在步驟e中,在所述指紋片段中添加業(yè)務類別號。
7.一種相似圖像檢索方法,其特征在于,包括如下步驟: a)將所述圖像縮放為統(tǒng)一大??; b)將所述圖像灰度化; c)生成圖像指紋,生成所述圖像指紋的方法如權利要求1所述; d)對所述圖像指紋進行兩次分解,生成(n+1)(n+2)個指紋片段,其中η代表任意兩個指紋相似的圖像漢明距離的差異值閾值; e)通過所述指紋片段的倒排索引,查詢具有相同所述指紋片段的圖像指紋的結果集; f)計算待檢測圖像指紋與所述結果集中的圖像指紋的漢明距離,在所述結果集中,找出與所述待檢測圖像指紋的漢明距離小于η的圖像指紋,將其作為相似圖像。
8.根據(jù)權利要求7所述的方法,其特征在于,在步驟d中,對所述圖像指紋進行兩次分解的步驟包括: dl)將所述圖像指紋分解為n+1個指紋片段; d2)將所述圖像指紋減去所述n+1個指紋片段中的每個指紋片段,并將與所述每個指紋片段對應的每個所述圖像指紋中的剩余的部分分解為n+1個片段。
9.根據(jù)權利要求10所述的方法,其特征在于,在步驟e中,通過所述指紋片段的倒排索弓丨,查詢具有組合的指紋的結果集,其中,aji≤I&&i ( n+1)表示步驟dl中分解得到的n+1個指紋片段中的任意一個,biJ (i≤IMi ( n+1, j≤l&&j ( n+1)表示步驟d2中分解得到的n+1個指紋片段中的任意一個。
10.根據(jù)權利要求7所述的方法,其特征在于,在步驟b中,計算灰度值的公式為: 灰度值=0.3R+0.58G+0.1lB (I) 其中R、G、B分別為該像素的紅色、綠色和藍色像素值。
【文檔編號】G06K9/62GK103699691SQ201410012144
【公開日】2014年4月2日 申請日期:2014年1月10日 優(yōu)先權日:2014年1月10日
【發(fā)明者】王永康, 張美琦, 張愛華, 何松, 張月 申請人:五八同城信息技術有限公司