一種圖像附加信息的邊框型編碼與智能識別方法
【專利摘要】本發(fā)明提供一種圖像附加信息的邊框型編碼與智能識別方法,其中編碼部分,用戶提供一張將要打印或印刷的圖像與需隱藏的信息。在圖像三個(gè)角加上定位點(diǎn)、寬高比信息點(diǎn)以及含有循環(huán)冗余校驗(yàn)碼的信息點(diǎn)后,即可印刷該圖像。識別部分,首先使用手機(jī)對含有編碼信息的圖像進(jìn)行拍攝,接著校正該圖像的幾何變形,接著對填涂位置進(jìn)行局部自適應(yīng)二值化操作,并檢測相應(yīng)信息點(diǎn),最后輸出經(jīng)循環(huán)冗余檢驗(yàn)正確的數(shù)據(jù)。本發(fā)明利用圖像邊框編碼信息,在美觀與識別效果上取得了平衡,識別準(zhǔn)確率高且計(jì)算量較小,適合手機(jī)使用,本發(fā)明圖像內(nèi)容不作修改,滿足新聞報(bào)紙等對圖片真實(shí)性的需求,出版商只需為圖像加上邊框即可實(shí)現(xiàn)手機(jī)閱讀與傳統(tǒng)閱讀的無縫銜接。
【專利說明】一種圖像附加信息的邊框型編碼與智能識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明一般涉及計(jì)算機(jī)模式識別與圖像處理領(lǐng)域,具體涉及圖像附加信息的邊框 型編碼與智能識別方法。
【背景技術(shù)】
[0002] 閱讀一直是人類獲得知識和信息、提升自我的重要途徑。隨著人類文明的發(fā)展, 人類的閱讀方式隨著載體而不斷變化。從最早的石頭、木頭上的簡單刻畫,到竹簡、帛,及 至紙張和印刷術(shù)的發(fā)明,再到多媒體計(jì)算機(jī)的出現(xiàn)。近年來逐漸流行的手機(jī)閱讀方式又成 為了閱讀史上的一個(gè)突破。手機(jī)閱讀一方面給傳統(tǒng)閱讀帶來了很大的沖擊,另一方面又帶 來了傳統(tǒng)閱讀升級的機(jī)遇。許多出版商紛紛推出了與傳統(tǒng)閱讀相結(jié)合的手機(jī)閱讀軟件,用 戶通過對感興趣的新聞內(nèi)容(如新聞圖片、二維碼等)的拍攝,即可轉(zhuǎn)到相應(yīng)的網(wǎng)頁,查看 傳統(tǒng)閱讀不能提供的視頻與相關(guān)報(bào)道等詳細(xì)信息。
[0003] 目前該技術(shù)的實(shí)現(xiàn)方法主要分為兩種:圖像隱寫技術(shù)、二維碼技術(shù)。
[0004] 圖像隱寫技術(shù)直接將網(wǎng)址嵌入在圖像中,不需要附加其他內(nèi)容,對新聞排版影響 小、美觀,但也存在一些缺點(diǎn):1)該方法需在頻率域?qū)D像進(jìn)行信息的嵌入,到頻率域的 正、反變換計(jì)算量對于手機(jī)來說較大;2)容易受到印刷質(zhì)量、手機(jī)攝像頭成像條件等因素 的影響,網(wǎng)址提取的成功率不高,3)可能會對原圖的真實(shí)性產(chǎn)生影響,違背了新聞圖片的原 則。
[0005] 二維碼技術(shù)將信息用一個(gè)正方形區(qū)域內(nèi)的若干個(gè)黑白塊表示,該技術(shù)是為識別而 設(shè)計(jì),具有簡單可靠,計(jì)算量小的特點(diǎn),但二維碼具有不美觀,增加排版工作量等缺點(diǎn)。
[0006] 基于圖像邊框的信息編碼與識別是一項(xiàng)新技術(shù)。它利用圖像邊框編碼信息,在美 觀與識別效果上取得了平衡,不但可以克服圖像隱寫技術(shù)計(jì)算量大、信息提取成功率不高、 對原始圖像有影響等缺陷;而且有著二維碼技術(shù)所不具備的,無需修改印刷排版,相對美觀 等優(yōu)勢。該技術(shù)將在廣告、手機(jī)閱讀、傳媒及其它領(lǐng)域中顯示出其良好的應(yīng)用前景。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明針對目前圖像附加信息編碼與識別技術(shù)的不足,提供了一種圖像附加信息 的邊框型編碼與智能識別方法。本發(fā)明的目的在于使用計(jì)算機(jī)圖像處理技術(shù)解決圖像附加 信息的快速識別問題,克服現(xiàn)有的圖像隱寫技術(shù)與二維碼技術(shù)的缺陷,提供一個(gè)可靠的、美 觀的、計(jì)算量小的圖像附加信息編碼與識別方案,具體技術(shù)方案如下。
[0008] 圖像附加信息的邊框型編碼與智能識別方法,包括以下步驟:
[0009] (a)從本地磁盤讀入一個(gè)待印刷的圖像文件,用戶鍵入需要加入的信息;
[0010] (b)根據(jù)用戶輸入信息長度,選擇對應(yīng)的生成多項(xiàng)式,生成循環(huán)冗余校驗(yàn)和;
[0011] (C)在圖像四周加入由定位點(diǎn)與邊框,所述邊框根據(jù)圖像寬高比與校驗(yàn)和編碼的 信息點(diǎn)組成;
[0012] (d)印刷步驟(c)得到的帶邊框的圖像;
[0013] (e)通過手機(jī)拍攝步驟(d)得到的印刷品中帶信息邊框的圖像;
[0014] (f)對步驟(e)中得到的圖像進(jìn)行定位點(diǎn)檢測與幾何形變校正;
[0015] (g)在步驟(f)中得到的圖像中定位與裁切編碼;
[0016] (h)對步驟(g)得到的編碼圖像進(jìn)行自適應(yīng)閾值色塊檢測與解碼。
[0017] 上述圖像附加信息的邊框型編碼與智能識別方法中,步驟(b)包括以下步驟:
[0018] (b-ι)將用戶輸入的信息根據(jù)ascii碼表轉(zhuǎn)換為二進(jìn)制字符串;
[0019] (b_2)根據(jù)步驟(b-Ι)得到的二進(jìn)制字符串長度選擇合適的生成多項(xiàng)式。若二進(jìn) 制字符串長度小于256,選擇CRC-16標(biāo)準(zhǔn)的生成多項(xiàng)式,否則,選用CRC-32標(biāo)準(zhǔn)的生成多項(xiàng) 式;
[0020] (b-3)對步驟(b-3)得到的碼字,進(jìn)行循環(huán)冗余編碼,生成二進(jìn)制校驗(yàn)和;
[0021] 上述圖像附加信息的邊框型編碼與智能識別方法中,步驟(c)包括以下步驟:
[0022] (c-Ι)根據(jù)用戶輸入的印刷分辨率,計(jì)算信息點(diǎn)的大小與單邊容量,計(jì)算方法分別 為:s = min(w, h) X0. 6%,c = min(w, h) +s,其中w、h分別為圖像的寬、高,s為信息點(diǎn)的 大小,單位為像素,c為單邊容量。
[0023] (c-2)根據(jù)圖像大小,計(jì)算加入邊框后的新圖像的大小,并創(chuàng)建新圖像,將源圖像 置于新圖像正中。新圖像大小計(jì)算方法為:h d = hs+sX8、wd = ws+sX8,其中hd和hs分別 為新圖像與源圖像的高,《,和^分別為新圖像與源圖像的寬,s為步驟3、(c-1)中計(jì)算得 到的信息點(diǎn)的像素?cái)?shù);
[0024] (c-3)根據(jù)圖像的寬高比,選取對應(yīng)的寬高比信息點(diǎn),并將三個(gè)定位點(diǎn)置于圖像的 左上、右上與右下角,寬高比信息點(diǎn)置于圖像的左下角。定位點(diǎn)與寬高比信息點(diǎn)由4行4列 共16個(gè)信息點(diǎn)組成,定位點(diǎn)除二、三行的二三列的信息點(diǎn)為白色外其余信息點(diǎn)為黑色;寬 高比信息點(diǎn)一、四行信息點(diǎn)以及二三行的一四列定位點(diǎn)為黑色,二三行的二三列信息點(diǎn)對 應(yīng)用戶預(yù)定義的15種寬高比。
[0025] (c-4)對步驟(b)得到的二進(jìn)制校驗(yàn)和構(gòu)造信息點(diǎn),信息點(diǎn)的構(gòu)造方法為:校驗(yàn)和 為1信息點(diǎn)為黑,否則為白,每四個(gè)信息點(diǎn)一列,若信息點(diǎn)數(shù)量小于單邊容量,將其分別置 于左上定位點(diǎn)的右側(cè)及下側(cè)、右上定位點(diǎn)的下冊、右下角定位點(diǎn)的左側(cè),否則,將信息點(diǎn)分 為兩段,第一段長度為水平方向最大容量第二段為余下信息點(diǎn),并將第一段信息點(diǎn)置于左 上定位點(diǎn)的右側(cè)及右下定位點(diǎn)的左側(cè),第二段信息點(diǎn)置于右上定位點(diǎn)的下側(cè)與左上定位點(diǎn) 的下側(cè),最終得到帶有信息邊框的圖像。
[0026] 上述圖像附加信息的邊框型編碼與智能識別方法中,步驟(f)包括以下步驟:
[0027] (f_l)對圖像進(jìn)行局部自適應(yīng)二值化,其計(jì)算方法為:將圖像分為若干個(gè)NXN的 小塊,N = 2Xs, s為步驟(c-Ι)中計(jì)算得到的信息點(diǎn)的像素?cái)?shù),以每個(gè)小塊中像素的灰度 均值作為閾值,圖像中的像素若大于該塊閾值則賦值為〇,否則賦值為1,得到二值圖像;
[0028] (f_2)對步驟(f-Ι)得到的二值圖像去除面積小于閾值Ta_的連通域,其中T aMa =(sXO. 3)2, s為步驟(c-1)中計(jì)算得到的信息點(diǎn)的像素?cái)?shù);
[0029] (f_3)計(jì)算二值圖像中所有連通域的外接矩形、面積、填充后面積以及歐拉數(shù),取 出滿足條件
【權(quán)利要求】
1. 一種圖像附加信息的邊框型編碼與智能識別方法,其特征在于包括以下步驟: (a) 從本地磁盤讀入一個(gè)待印刷的圖像文件,用戶鍵入需要加入的信息; (b) 根據(jù)用戶輸入信息長度,選擇對應(yīng)的生成多項(xiàng)式,生成循環(huán)冗余校驗(yàn)和; (c) 在圖像四周加入由定位點(diǎn)與邊框,所述邊框根據(jù)圖像寬高比與校驗(yàn)和編碼的信息 點(diǎn)組成; (d) 印刷步驟(c)得到帶邊框的圖像; (e) 通過手機(jī)拍攝步驟(d)得到的印刷品中帶信息邊框的圖像; (f) 對步驟(e)中得到的圖像進(jìn)行定位點(diǎn)檢測與幾何形變校正; (g) 在步驟(f)得到的圖像中定位與裁切編碼; (h) 對步驟(g)得到的編碼圖像進(jìn)行自適應(yīng)閾值色塊檢測與解碼。
2. 根據(jù)權(quán)利要求1所述圖像附加信息的邊框型編碼與智能識別方法,其特征在于,步 驟(b)包括以下步驟: (b-Ι)將用戶輸入的信息根據(jù)ascii碼表轉(zhuǎn)換為二進(jìn)制字符串; (b_2)根據(jù)步驟(b-Ι)得到的二進(jìn)制字符串長度選擇合適的生成多項(xiàng)式,若二進(jìn)制字 符串長度小于256,選擇CRC-16標(biāo)準(zhǔn)的生成多項(xiàng)式,否則,選用CRC-32標(biāo)準(zhǔn)的生成多項(xiàng)式; (b-3)對步驟(b-3)得到的碼字,進(jìn)行循環(huán)冗余編碼,生成二進(jìn)制校驗(yàn)和。
3. 根據(jù)權(quán)利要求1所述一種圖像附加信息的邊框型編碼與智能識別方法,其特征在 于:步驟(c)包括以下步驟: (c-Ι)根據(jù)用戶輸入的印刷分辨率,計(jì)算信息點(diǎn)的大小與單邊容量;信息點(diǎn)的大小與 單邊容量計(jì)算方法分別為:s = min(w, h) X0. 6%,c = min(w, h) +s,其中w、h分別為圖像 的寬、高,s為信息點(diǎn)的大小,單位為像素,c為單邊容量; (c-2)根據(jù)圖像大小,計(jì)算加入邊框后的新圖像的大小,并創(chuàng)建新圖像,將源圖像置于 新圖像正中,新圖像大小計(jì)算方法為:hd = hs+sX8、wd = ws+sX8,其中匕和hs分別為新圖 像與源圖像的高,《,和^分別為新圖像與源圖像的寬,s為步驟(c-Ι)中計(jì)算得到的信息 點(diǎn)的像素?cái)?shù); (c-3)根據(jù)圖像的寬高比,選取對應(yīng)的寬高比信息點(diǎn),并將三個(gè)定位點(diǎn)置于圖像的左 上、右上與右下角,寬高比信息點(diǎn)置于圖像的左下角,定位點(diǎn)與寬高比信息點(diǎn)由4行4列共 16個(gè)信息點(diǎn)組成,其中,定位點(diǎn)除二、三行的二三列的信息點(diǎn)為白色外其余信息點(diǎn)為黑色; 寬高比信息點(diǎn)一、四行信息點(diǎn)以及二三行的一四列定位點(diǎn)為黑色,二三行的二三列信息點(diǎn) 對應(yīng)用戶預(yù)定義的15種寬高比; (c-4)對步驟(b)得到的二進(jìn)制校驗(yàn)和構(gòu)造信息點(diǎn),構(gòu)造方法為:校驗(yàn)和為1信息點(diǎn)為 黑,否則為白,每四個(gè)信息點(diǎn)一列,若信息點(diǎn)數(shù)量小于單邊容量,將其分別置于左上定位點(diǎn) 的右側(cè)及下側(cè)、右上定位點(diǎn)的下側(cè)、右下角定位點(diǎn)的左側(cè),否則,將信息點(diǎn)分為兩段,第一段 長度為水平方向最大容量,第二段為余下信息點(diǎn),并將第一段信息點(diǎn)置于左上定位點(diǎn)的右 側(cè)及右下定位點(diǎn)的左側(cè),第二段信息點(diǎn)置于右上定位點(diǎn)的下側(cè)與左上定位點(diǎn)的下側(cè),最終 得到帶有信息邊框的圖像。
4. 根據(jù)權(quán)利要求1所述一種圖像附加信息的邊框型編碼與智能識別方法,其特征在 于:步驟(f)包括以下步驟: (f-Ι)對圖像進(jìn)行局部自適應(yīng)二值化,其計(jì)算方法為:將圖像分為若干個(gè)NXN的小塊, N = 2Xs,S為信息點(diǎn)的像素?cái)?shù),以每個(gè)小塊中像素的灰度均值作為閾值,圖像中的像素若 大于該塊閾值則賦值為〇,否則賦值為1,得到二值圖像; (f-2)對步驟(f-Ι)得到的二值圖像去除面積小于閾值Ta_的連通域,其中Ta_ = (sXO. 3)2, s為步驟(c-1)中計(jì)算得到的信息點(diǎn)的像素?cái)?shù); (f-3)計(jì)算二值圖像中所有連通域的外接矩形、面積、填充后面積以及歐拉數(shù),取出滿 足條件
的連通域作為候選連通域,其中h、w分別為 圖像的高和寬,Area、Areaf分別為連通域的面積和填充后面積,E為連通域的歐拉數(shù); (f-4)將步驟(f-2)中得到的候選連通域按填充大小進(jìn)行排序,取最大的三個(gè)連通域 進(jìn)行定位點(diǎn)匹配,匹配方法為:計(jì)算兩兩連通域中心的距離,設(shè)圖像左上角為坐標(biāo)原點(diǎn),水 平向右為X軸正方向,堅(jiān)直向下為y軸正方向,A&、A&分別為左上、右上、右下定位點(diǎn), 除距離最大的兩個(gè)連通域外,剩余的連通域?qū)?yīng)為右上定位點(diǎn),隨機(jī)將距離最大的兩個(gè) 連通域的中心坐標(biāo)賦予Ρρ P3, A&的中心坐標(biāo)賦予P2 ; Ρ! = (X!,y!)、P2 = (x2, y2)、P3 = (x3, y3),計(jì)算 fc = (X2-X!) X (y3-y2) - (yry!) X (x3-x2), 若f。> 0則Pi對應(yīng)A^,P3對應(yīng)A&,若f。< 0則Pi對應(yīng)P3對應(yīng)A^,得到匹配后的A^、 Ao2、Aq3 定位點(diǎn)坐標(biāo) P/、P2'、P3'; (f_5)將步驟(f_4)得到的三個(gè)定位點(diǎn)坐標(biāo)P' pP' 2、P' 3與步驟(c)中定位點(diǎn)的 原始坐標(biāo)分別代入χ/ zad+alX+a&y' zbd+bj+t^y。得到六元一次方程組,解 出a。、、a2、kh、b2,將圖像坐標(biāo)--代入,計(jì)算出仿射變換后的坐標(biāo),得到新的圖像。
5. 根據(jù)權(quán)利要求1所述一種圖像附加信息的邊框型編碼與智能識別方法,其特征在于 步驟(g)中根據(jù)左上定位點(diǎn)右側(cè)信息點(diǎn)與右上定位點(diǎn)下側(cè)信息點(diǎn)的差異,判斷是否需要將 兩端信息點(diǎn)拼接,判斷方法:取左上定位點(diǎn)右側(cè)信息點(diǎn)區(qū)域與右上定位點(diǎn)下側(cè)信息點(diǎn)區(qū)域, 將右上定位點(diǎn)下側(cè)信息點(diǎn)區(qū)域逆時(shí)針旋轉(zhuǎn)90度,設(shè) Wl,&分別為兩個(gè)區(qū)域的寬,計(jì)算兩區(qū)域 的平均像素灰度差異方法為
其中I(i,j)、J(i,j)分別為兩 個(gè)區(qū)域i行j列像素的灰度值,s為信息點(diǎn)的像素?cái)?shù),若Davg > 100,則拼接兩區(qū)域,否則無 須拼接。
6. 根據(jù)權(quán)利要求6所述一種圖像附加信息的邊框型編碼與智能識別方法,其特征在 于:步驟(h)包括以下步驟: (h-Ι)對步驟(g)裁切得到的編碼區(qū)域進(jìn)行自適應(yīng)二值化操作:將圖像分為若干 個(gè)NXN區(qū)域,N = min(w, h),其中w, h分別為信息區(qū)域的寬、高,計(jì)算每個(gè)NXN區(qū)域二 值化閾值,
其中Offset為均值偏移值,設(shè)為10,二值化圖像
(h-2)計(jì)算各個(gè)信息點(diǎn)的二進(jìn)制值,計(jì)算方法為:
其中BW為步驟(h-Ι)中計(jì) 算得到的信息區(qū)域的二值化圖像,S為信息點(diǎn)的像素?cái)?shù); (h-3)步驟(h-2)中得到的二進(jìn)制串,每8位組成一組,取出不全為零的組得到新的二 進(jìn)制串,若新的二進(jìn)制串的長度小于272,選擇CRC-16的生成多項(xiàng)式,否則選擇CRC-32的生 成多項(xiàng)式; (h-4)使用步驟(h-3)得到的生成多項(xiàng)式對步驟(h-3)中去零后的二進(jìn)制字符串進(jìn)行 循環(huán)冗余校驗(yàn),若校驗(yàn)結(jié)果沒有出錯(cuò),將二進(jìn)制串根據(jù)ascii碼表,轉(zhuǎn)換為字符串,并輸出 結(jié)果,否則繼續(xù)對其他信息點(diǎn)區(qū)域重復(fù)步驟(h)的方法。
【文檔編號】G06T9/00GK104143200SQ201410339208
【公開日】2014年11月12日 申請日期:2014年7月16日 優(yōu)先權(quán)日:2014年7月16日
【發(fā)明者】黃翰, 梁椅輝, 郝志峰 申請人:華南理工大學(xué)