基于surf詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)及其實現(xiàn)方法
【專利摘要】本發(fā)明公開了一種基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)及其實現(xiàn)方法,主要解決了現(xiàn)有技術(shù)中存在的臺標識別方法響應(yīng)時間較長,綜合性能較差,的問題。該基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的實現(xiàn)方法包括以下步驟:第一級SURF詞匯樹索引模塊提取非相似臺標訓(xùn)練集合中的SURF特征,通過Kmeans算法將提取的SURF特征聚類成詞匯樹,當(dāng)待匹配的圖片到達時,遍歷詞匯樹返回給第二級模板匹配索引模塊待識別圖片所屬的電視臺;第二級模板匹配索引模塊根據(jù)返回的非相似臺標的信息,到指定電視臺目錄下進行模板匹配,找到最相似的頻道。通過上述方案,本發(fā)明達到了高正確率、響應(yīng)時間較快的目的,具有很高的實用價值和推廣價值。
【專利說明】基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng) 及其實現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種電視臺臺標識別方法,具體地說,是涉及一種基于SURF詞匯樹和 模板匹配的快速電視臺臺標識別系統(tǒng)及其實現(xiàn)方法。
【背景技術(shù)】
[0002] 隨著智能電視的日益普及,臺標作為電視臺和電視欄目的標志,在媒體數(shù)據(jù)挖掘 領(lǐng)域已經(jīng)成為了一個很重要的元素,而臺標識別技術(shù)則成為了近年來的研究熱點之一。將 計算機視覺理論結(jié)合圖像處理技術(shù),可以很好地解決電視臺臺標識別問題。
[0003] 在計算機視覺領(lǐng)域,SIFT描述符成功地應(yīng)用于對象識別和3D場景重建,而SURF是 SIFT的加速版本,具有尺度不變等很好的特性。通過SURF描述符,將兩幅圖像的匹配問題 歸結(jié)于尋找特征點間相似問題,即近鄰問題。而對于大規(guī)模高維數(shù)據(jù)近鄰問題,一個比較成 熟的方案就是通過樹結(jié)構(gòu)劃分數(shù)據(jù)空間,即SURF詞匯樹方案。
[0004] 模板匹配算法是一項非常重要的圖像處理技術(shù),它能夠在一幅圖像中尋找與另一 幅模板圖像最匹配部分的技術(shù)。因為模板匹配不具備像SURF那樣的尺度不變性,一般采用 圖像金字塔技術(shù)來彌補這一缺陷。
[0005] 現(xiàn)今,衡量一個電視臺臺標識別方法好壞的具體指標如下: 1、正確率:給定了一個待識別的臺標圖片,算法返回的結(jié)果是正確的概率。
[0006] 2、失敗率:給定了一個待識別的臺標圖片,由于圖像質(zhì)量等原因算法無法識別的 概率。
[0007] 3、錯誤率:給定了一個待識別的臺標圖片,算法返回的結(jié)果是錯誤的概率。
[0008] 4、響應(yīng)時間:給定一個待識別的臺標圖片,算法的響應(yīng)時間,即匹配時間;還包括 算法準備的時間,即訓(xùn)練時間。
[0009] 5、可擴展性:當(dāng)在大數(shù)據(jù)量高并發(fā)的情況下,采用的方案能否擴展到分布式方案 來適應(yīng)需求的變化。
[0010] 以上五點,其中前三點是核心技術(shù)指標,第四點是保證了用戶體驗和整體效能,第 五點則關(guān)注方案將來的可擴展性。
[0011] 目前的臺標識別方法都在以上五個方面做了自己的折衷:SURF詞匯樹算法能夠 在很短的時間對非相似臺標做很高正確率、低錯誤率的識別,但是存在訓(xùn)練時間過長,并且 對相似臺標存在高錯誤率的情況。模板匹配算法能夠?qū)ο嗨婆_標做出很高正確率的識別, 但是存在計算量過大,識別的時間過長的問題。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的目的在于提供一種基于SURF詞匯樹和模板匹配的快速電視臺臺標識別 系統(tǒng)及其實現(xiàn)方法,主要解決現(xiàn)有技術(shù)中存在的臺標識別方法響應(yīng)時間較長,綜合性能較 差,不能滿足實際需求的問題。
[0013] 為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下: 基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng),包括: 預(yù)處理模塊:對終端采集的臺標圖片進行預(yù)處理,訓(xùn)練階段對待訓(xùn)練圖片進行預(yù)處理; 匹配階段將待識別的圖片進行預(yù)處理后發(fā)送給第一級SURF詞匯樹索引模塊; 第一級SURF詞匯樹索引模塊:負責(zé)各個電視臺信息的索引;訓(xùn)練階段,提取訓(xùn)練圖片 的SURF特征點,利用Kmeans算法將提取的SURF特征點聚類成詞匯樹;匹配階段,當(dāng)有待識 別的圖片到達時,在所訓(xùn)練的SURF詞匯樹上找到圖片所對應(yīng)的電視臺信息,之后將待識別 圖片及查找出的所屬電視臺信息發(fā)送至第二級模板匹配索引模塊; 第二級模板匹配索引模塊:負責(zé)具體的電視臺下的各個頻道信息的索引;訓(xùn)練階段, 從訓(xùn)練圖片中提取模板匹配所需要的模板,以電視臺為單位按照目錄的形式加載到內(nèi)存; 匹配階段,在接收到待識別的圖片和圖片所屬的電視臺信息時,到具體的電視臺目錄下進 行模板匹配,找到圖片所屬的電視臺的具體頻道,將結(jié)果返回給用戶。
[0014] 基于上述系統(tǒng),本發(fā)明公開了一種基于SURF詞匯樹和模板匹配的快速電視臺臺 標識別系統(tǒng)的實現(xiàn)方法,包括以下步驟: 根據(jù)SURF詞匯樹算法以及模板匹配算法的特性,將電視臺臺標分為兩類:非相似臺 標和相似臺標,其中,非相似臺標為不同電視臺下的頻道;相似臺標為同一電視臺的多個頻 道; (1) 第一級SURF詞匯樹索引模塊提取非相似臺標訓(xùn)練集合中的SURF特征,通過Kmeans 算法將提取的SURF特征聚類成詞匯樹,當(dāng)待匹配的圖片到達時,遍歷詞匯樹返回給第二級 模板匹配索引模塊待識別圖片所屬的電視臺; (2) 第二級模板匹配索引模塊根據(jù)返回的非相似臺標的信息,到指定電視臺目錄下進 行模板匹配,找到最相似的頻道。
[0015] 進一步地,所述步驟(2)具體包括以下步驟: (2a)從輸入的圖像的左上角(0,0)開始,切割一塊(0,0)到(x,y)的臨時圖像; (2b)用臨時圖像和模板圖像進行對比,度量函數(shù)為h,對比的結(jié)果為c ; (2c)記錄結(jié)果c,即圖像(0,0)的匹配結(jié)果; (2d)切割輸入圖像從(0,1)到(x+1,y+Ι)的臨時圖像,返回步驟(2b),直至完成整個 圖像的計算。
[0016] 具體地說,所述第一級SURF詞匯樹索引模塊的訓(xùn)練方法如下: (la) 將訓(xùn)練集中每張圖片與其所屬電視臺臺標標識的ID進行關(guān)聯(lián); (lb) 提取每張圖片的SURF特征,得到一個特征集合F={fi}以及相應(yīng)的圖片ID集合 imgID={idi},它表示提取到的第i個特征出現(xiàn)在ID為idi的圖片中; (lc) 對特征集合F進行分層聚類,采用Kmeans算法聚類成詞匯樹。
[0017] 本發(fā)明中,所述分層聚類算法的具體實現(xiàn)步驟如下: (lcl)初始時,在樹的第1層對特征集合F進行Kmeans聚類,把特征集合F分成K份 {Fi | i〈=i〈=k}; (lc2)計算出每個簇集的中心向量Ci ; (lc3)利用Kmeans聚類將每個簇集分成K個簇集,不斷重復(fù)上述操作直到樹的深度達 到預(yù)先設(shè)定的值,若樹中某個簇集內(nèi)的向量小于k,則這個節(jié)點就不再分裂。
[0018] 所述步驟(1)中,若第一級SURF詞匯樹索引模塊未在所訓(xùn)練的SURF詞匯樹上找 到所對應(yīng)的臺標的電視臺信息,則直接返回終端匹配失??;若第二級模板匹配索引模塊找 到最相似頻道的相似度低于預(yù)設(shè)值,則返回終端匹配失敗。
[0019] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果: (1)通過使用本發(fā)明,在大數(shù)據(jù)量高并發(fā)情況下,可以很容易地擴展到分布式方案來適 應(yīng)需求的變化,使得系統(tǒng)仍然保持著高正確率、低錯誤率,以及快速的響應(yīng)時間,符合實際 需求。
【專利附圖】
【附圖說明】
[0020] 圖1為本發(fā)明的系統(tǒng)框圖。
【具體實施方式】
[0021] 下面結(jié)合附圖和實施例對本發(fā)明作進一步說明,本發(fā)明的實施方式包括但不限于 下列實施例。 實施例
[0022] 如圖1所示,本發(fā)明公開了一種在【背景技術(shù)】五個方面都有著出色表現(xiàn)的基于SURF 詞匯樹和模板匹配的快速電視臺臺標識別方法,通過該方法實現(xiàn)的系統(tǒng)在大數(shù)據(jù)量高并發(fā) 情況下,可以很容易地擴展到分布式方案來適應(yīng)需求的變化,使得系統(tǒng)仍然保持著高正確 率、低錯誤率,以及快速的響應(yīng)時間。
[0023] 在本申請中,根據(jù)SURF詞匯樹算法以及模板匹配算法的特性,把電視臺臺標分為 兩類:第一類是非相似臺標,即不同電視臺下的頻道,如AHNU、CCTV1 ;第二類是相似臺標, 即同一電視臺的多個頻道,如CCTVUCCTV2。相應(yīng)地將臺標索引也分為兩級索引:第一級索 引是基于SURF特征的詞匯樹索引,通過提取非相似臺標訓(xùn)練集合中的SURF特征,然后通過 Kmeans算法聚類成詞匯樹,當(dāng)待匹配的圖片到達時,通過遍歷詞匯樹返回給第二級索引待 識別圖片所屬的電視臺,再由第二級索引最后返回具體所屬于的頻道;第二級索引是基于 模板匹配的模板索引,根據(jù)第一級索引返回的非相似臺標的信息,到指定電視臺目錄下進 行模板匹配,找到最相似的頻道。
[0024] 具體地說,上述匹配流程如下: 終端發(fā)送待識別的圖片到預(yù)處理模塊;預(yù)處理模塊對圖片進行去噪處理,如果信噪比 超出預(yù)先設(shè)置的范圍,則直接返回終端匹配失敗,否則將處理過的圖片發(fā)送到第一級SURF 詞匯樹索引模塊;第一級SURF詞匯樹索引模塊接收到預(yù)處理模塊處理過后的圖片,提取 SURF特征,然后到SURF詞匯樹上匹配它所屬于的哪個電視臺,要么匹配失敗,失敗則直接 返回終端匹配失敗,匹配成功則將電視臺信息和待識別的圖片發(fā)送給第二級模板匹配索引 模塊;第二級模板匹配索引模塊接收到第一級索引模塊傳來的待識別的圖片和所屬于的電 視臺信息,然后到指定的電視臺目錄下進行模塊匹配,返回相似度最大的頻道,如果相似度 低于預(yù)設(shè)的范圍則返回終端匹配失敗。
[0025] 該基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)主要由預(yù)處理模塊, 第一級SURF詞匯樹索引模塊和第二級模板匹配索引模塊構(gòu)成。在系統(tǒng)中,首先由預(yù)處理模 塊對終端收集過來的臺標圖片進行預(yù)處理,之后將待識別的圖片發(fā)送到第一級SURF詞匯 樹索引模塊,SURF詞匯樹索引模塊判斷出所屬的電視臺,連同圖片一起交給第二級模板匹 配索引模塊,第二級模板匹配索引模塊在指定電視臺下進行模板匹配,找出所屬的頻道。系 統(tǒng)中各部分的具體功能如下: 預(yù)處理模塊:對終端采集上來的圖片進行預(yù)處理,包括定位臺標的區(qū)域,對圖片進行去 噪處理,如果信噪比大于一定閥值可以直接判斷匹配失?。ㄩ撝蹈鶕?jù)實際情況進行設(shè)定); 第一級SURF詞匯樹索引模塊:系統(tǒng)初始時由管理員組織訓(xùn)練圖片,然后提取SURF特征 點,利用Kmeans算法進行有效地聚類,聚類成詞匯樹。當(dāng)有待識別的圖片到達時,在所訓(xùn)練 的SURF詞匯樹上找到所對應(yīng)的臺標的電視臺信息,之后到具體的電視臺上進行模板匹配 找到具體的頻道; 第二級模板匹配索引模塊:系統(tǒng)初始時由管理員組織訓(xùn)練圖片,然后提取模板匹配所 需要的模板,加載到內(nèi)存,之后處理由第一級SURF詞匯樹索引模塊發(fā)送過來的識別,第一 級SURF詞匯樹索引模塊返回待識別的圖片和圖片所屬于的電視臺,第二級模板匹配索引 在具體的電視臺目錄下進行模板匹配,找到具體的頻道,將結(jié)果返回給用戶。
[0026] 本發(fā)明中,第一級SURF詞匯樹索引原理如下: SIFT特征是圖像的局部特征,它對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、 仿射變換、噪聲也保持一定的穩(wěn)定性。作為尺度不變特征變換算法SIFT算法的加速版本, SURF算法在適中的條件下完成兩幅圖像中的匹配,基本實現(xiàn)了實時處理,其快速的基礎(chǔ)實 際上只有一個,對積分圖像haar求導(dǎo)。Hessian矩陣是SURF算法的核心。
[0027] Bag-of-words模型源于文本分類技術(shù),對于一個文本,忽略其詞序和語法、句法, 將其僅僅看作一個詞的集合,文本中的每個詞的出現(xiàn)都是獨立的。
[0028] 考慮將Bag-of-words模型應(yīng)用于圖像表示,為了表示一副圖像,我們可以將圖像 看作文檔,即若干個視覺詞匯的集合,視覺詞匯之間沒有順序,利用SURF算法,對每張訓(xùn)練 圖片提取視覺詞匯,然后將所有的視覺詞匯集合在一起,之后再利用Kmeans算法構(gòu)造詞 典,Kmeans算法是一種基于樣本間相似性度量的聚類方法,最后利用字典中的詞匯表示圖 像,利用SURF算法,可以從每幅圖像中提取多個特征點,這些特征點都可以用字典中的單 詞近似代替,通過統(tǒng)計字典中每個單詞在圖像中出現(xiàn)的次數(shù),可以將圖像表示成一個向量, 根據(jù)這個向量,可以很快判定出圖像所屬的分類信息。
[0029] 第二級模板匹配索引原理如下: 模板匹配是一項在一副圖像中尋找與另一幅模板圖像最匹配部分的技術(shù)。模板匹配的 工作方式和直方圖的反向投影基本一樣,通過在輸入圖像中滑動圖像塊對實際的圖像塊和 輸入圖像進行匹配。大致的流程如下: 從輸入的圖像的左上角(〇,〇)開始,切割一塊(〇,〇)到(X,y)的臨時圖像;用臨時圖像 和模板圖像進行對比,度量函數(shù)為h,對比的結(jié)果為c ;記錄結(jié)果c,就是圖像(0,0)的匹配 結(jié)果;切割輸入圖像從(〇,1)到(x+l,y+l)的臨時圖像,再進行上述的計算過程,直到完成 整個圖像的計算。
[0030] 常用的度量函數(shù)h主要有平方差匹配、標準平方差匹配、相關(guān)匹配、標準相關(guān)匹配 等。
[0031] 本發(fā)明中,第一級SURF詞匯樹索引的訓(xùn)練流程如下: 訓(xùn)練集中每張圖片用它所屬電視臺臺標標識的ID進行關(guān)聯(lián);對每張圖片都提取SURF 特征,得到一個特征集合F={fi}以及相應(yīng)的圖片ID集合imgID={idi},它表示提取到的第i 個特征出現(xiàn)在ID為idi的圖片中;對特征集合F進行分層聚類,采用Kmeans算法聚類成詞 匯樹。
[0032] 其中,分層聚類算法如下: 初始時,在樹的第1層對特征集合F進行Kmeans聚類,把特征集合F分成K份{Fi i〈=i〈=k}; 計算出每個簇集的中心向量Ci ; 對每個簇集再利用Kmeans聚類分成K個簇集,不斷重復(fù)上述操作知道樹的深度達到預(yù) 先設(shè)定的L值,若樹中某個簇集內(nèi)的向量小于k,則這個節(jié)點就不再分裂。其中,設(shè)定的值, 最小閾值k均根據(jù)實際情況進行設(shè)定。
[0033] 第二級模板匹配索引的訓(xùn)練流程如下: 針對每個相似臺標根據(jù)預(yù)先設(shè)定的大小和位置提取臺標模板,為了提高精確度,一個 臺標可以對應(yīng)多個臺標模板;將臺標模板加載到內(nèi)存中。
[〇〇34] 按照上述實施例,便可很好地實現(xiàn)本發(fā)明。
【權(quán)利要求】
1. 基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng),其特征在于,包括: 預(yù)處理模塊:對終端采集的臺標圖片進行預(yù)處理,訓(xùn)練階段對待訓(xùn)練圖片進行預(yù)處理; 匹配階段將待識別的圖片進行預(yù)處理后發(fā)送給第一級SURF詞匯樹索引模塊; 第一級SURF詞匯樹索引模塊:負責(zé)各個電視臺信息的索引;訓(xùn)練階段,提取訓(xùn)練圖片 的SURF特征點,利用Kmeans算法將提取的SURF特征點聚類成詞匯樹;匹配階段,當(dāng)有待識 別的圖片到達時,在所訓(xùn)練的SURF詞匯樹上找到圖片所對應(yīng)的電視臺信息,之后將待識別 圖片及查找出的所屬電視臺信息發(fā)送至第二級模板匹配索引模塊; 第二級模板匹配索引模塊:負責(zé)具體的電視臺下的各個頻道信息的索引;訓(xùn)練階段, 從訓(xùn)練圖片中提取模板匹配所需要的模板,以電視臺為單位按照目錄的形式加載到內(nèi)存; 匹配階段,在接收到待識別的圖片和圖片所屬的電視臺信息時,到具體的電視臺目錄下進 行模板匹配,找到圖片所屬的電視臺的具體頻道,將結(jié)果返回給用戶。
2. 權(quán)利要求1所述的基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的實現(xiàn) 方法,其特征在于,包括以下步驟: 根據(jù)SURF詞匯樹算法以及模板匹配算法的特性,將電視臺臺標分為兩類:非相似臺 標和相似臺標,其中,非相似臺標為不同電視臺下的頻道;相似臺標為同一電視臺的多個頻 道; (1)第一級SURF詞匯樹索引模塊提取非相似臺標訓(xùn)練集合中的SURF特征,通過Kmeans 算法將提取的SURF特征聚類成詞匯樹,當(dāng)待匹配的圖片到達時,遍歷詞匯樹返回給第二級 模板匹配索引模塊待識別圖片所屬的電視臺; (2)第二級模板匹配索引模塊根據(jù)返回的非相似臺標的信息,到指定電視臺目錄下進 行模板匹配,找到最相似的頻道。
3. 根據(jù)權(quán)利要求2所述的基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的 實現(xiàn)方法,其特征在于,所述步驟(2)具體包括以下步驟: (2a)從輸入的圖像的左上角(0,0)開始,切割一塊(0,0)到(x,y)的臨時圖像; (2b)用臨時圖像和模板圖像進行對比,度量函數(shù)為h,對比的結(jié)果為c ; (2c)記錄結(jié)果c,即圖像(0,0)的匹配結(jié)果; (2d)切割輸入圖像從(0,1)到(x+1,y+Ι)的臨時圖像,返回步驟(2b),直至完成整個 圖像的計算。
4. 根據(jù)權(quán)利要求3所述的基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的 實現(xiàn)方法,其特征在于,所述第一級SURF詞匯樹索引模塊的訓(xùn)練方法如下: (la) 將訓(xùn)練集中每張圖片與其所屬電視臺臺標標識的ID進行關(guān)聯(lián); (lb) 提取每張圖片的SURF特征,得到一個特征集合F={fi}以及相應(yīng)的圖片ID集合 imgID={idi},它表示提取到的第i個特征出現(xiàn)在ID為idi的圖片中; (lc) 對特征集合F進行分層聚類,采用Kmeans算法聚類成詞匯樹。
5. 根據(jù)權(quán)利要求4所述的基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的 識別方法,其特征在于,所述分層聚類算法的具體實現(xiàn)步驟如下: (lcl)初始時,在樹的第1層對特征集合F進行Kmeans聚類,把特征集合F分成K份 {Fi | i〈=i〈=k}; (lc2)計算出每個簇集的中心向量Ci ; (lc3)利用Kmeans聚類將每個簇集分成K個簇集,不斷重復(fù)上述操作直到樹的深度達 到預(yù)先設(shè)定的值,若樹中某個簇集內(nèi)的向量小于k,則這個節(jié)點就不再分裂。
6.根據(jù)權(quán)利要求5所述的基于SURF詞匯樹和模板匹配的快速電視臺臺標識別系統(tǒng)的 識別方法,其特征在于,所述步驟(1)中,若第一級SURF詞匯樹索引模塊未在所訓(xùn)練的SURF 詞匯樹上找到所對應(yīng)的臺標的電視臺信息,則直接返回終端匹配失?。蝗舻诙壞0迤ヅ?索引模塊找到最相似頻道的相似度低于預(yù)設(shè)值,則返回終端匹配失敗。
【文檔編號】G06K9/00GK104063701SQ201410332809
【公開日】2014年9月24日 申請日期:2014年7月14日 優(yōu)先權(quán)日:2014年7月14日
【發(fā)明者】段翰聰, 梁堯, 張苗, 張 杰, 李曉東, 孟慶康, 劉威 申請人:電子科技大學(xué)