欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種視頻圖像文字的檢測方法和裝置的制造方法

文檔序號:8445868閱讀:399來源:國知局
一種視頻圖像文字的檢測方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及視頻文字處理技術(shù)領(lǐng)域,特別是涉及一種視頻圖像文字的檢測方法和 裝置。
【背景技術(shù)】
[0002] 隨著數(shù)字化網(wǎng)絡(luò)化的發(fā)展,數(shù)字圖像和視頻越來越多,圖片或視頻中的文字能夠 提供直接的高層語義信息,因此開發(fā)視頻圖像文字的檢測技術(shù),有助于對視頻圖像進(jìn)行理 解和管理。
[0003] 現(xiàn)有的光學(xué)字符識別技術(shù)(OpticalCharacterRecognition,OCR)主要針對的 是圖像,尤其是照片中文字的檢測,并且對圖像預(yù)處理效果較為敏感。若想獲得較好的文字 識別效果,必須通過圖像處理技術(shù),將文字與背景清晰的分割出來。然而,對于視頻文字檢 測,由于背景較為復(fù)雜,視頻壓縮造成的畫質(zhì)損失,以及為了視覺效果在視頻文字的邊緣加 入陰影等處理,使得通用的文字檢測技術(shù)如OCR,很難取得滿意的檢測效果。
[0004] 此外,還有一個比較重要的影響因素是光照變化,因此必須考慮文字顏色的變化 問題。而視頻文字一般為后期添加,雖然背景比較復(fù)雜,但是文字顏色比較均一,因此,若使 用針對圖像的檢測方法,由于考慮了不必要的因素,會導(dǎo)致檢測精度有所降低。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明實施例所要解決的技術(shù)問題是提供一種視頻圖像文字的檢測方法和裝置, 能夠提高視頻圖像文字檢測的效果。
[0006] 為了解決上述問題,本發(fā)明公開了一種視頻圖像文字的檢測方法,包括:
[0007] 對視頻圖像進(jìn)行文字檢測,確定所述視頻圖像的文本區(qū)域;
[0008] 利用所述視頻圖像的顏色信息對所述視頻圖像的文本區(qū)域進(jìn)行文字和背景分割, 得到二值化文字圖像;
[0009] 對所述二值化文字圖像進(jìn)行過濾處理,得到過濾后的文字圖像。
[0010] 優(yōu)選地,所述確定所述視頻圖像的文本區(qū)域之后,還包括:
[0011] 對所述視頻圖像的文本區(qū)域進(jìn)行侵蝕處理,得到侵蝕后的文本區(qū)域。
[0012] 優(yōu)選地,所述利用所述視頻圖像的顏色信息對所述視頻圖像的文本區(qū)域進(jìn)行文字 和背景分割,得到二值化文字圖像的步驟,包括:
[0013] 確定所述視頻圖像文字對應(yīng)的三通道中心像素值;
[0014] 判斷所述文本區(qū)域中每個像素點(diǎn)與所述中心像素值是否符合預(yù)置條件,若符合, 則確定當(dāng)前像素點(diǎn)為文字;若不符合,則確定當(dāng)前像素點(diǎn)為背景。
[0015] 優(yōu)選地,所述確定所述視頻圖像文字對應(yīng)的三通道中心像素值的步驟,包括:
[0016] 利用所述文本區(qū)域作為掩板,從所述視頻圖像中過濾掉背景,得到文字;
[0017] 提取所述文字的三通道像素值;
[0018] 對每個通道提取的像素值進(jìn)行排序,并依據(jù)排序結(jié)果確定中位數(shù)為所述文字對應(yīng) 的三通道中心像素值。
[0019] 優(yōu)選地,所述對所述二值化文字圖像進(jìn)行過濾處理,得到過濾后的文字圖像的步 驟,包括:
[0020] 依據(jù)對所述文本區(qū)域分割出的文字,獲取所述文字的筆畫寬度信息以及所述文字 的寬度信息;
[0021] 依據(jù)所述文字的筆畫寬度信息和所述文字的寬度信息,對所述文本區(qū)域的文字進(jìn) 行切割緊縮處理;
[0022] 對所述切割緊縮處理后的文本區(qū)域進(jìn)行去噪處理,得到過濾后的文字圖像。
[0023] 優(yōu)選地,所述得到過濾后的文字圖像之后,還包括:
[0024] 利用所述過濾后的文字圖像作為掩板,從所述視頻圖像中獲取文字顏色信息,得 到彩色文字圖像。
[0025] 優(yōu)選地,所述對視頻圖像進(jìn)行文字檢測,確定所述視頻圖像的文本區(qū)域的步驟,包 括:
[0026] 利用筆畫寬度變換的檢測方法對所述視頻圖像進(jìn)行文字檢測,確定所述視頻圖 像的文本區(qū)域。
[0027] 依據(jù)本發(fā)明的另一個方面,提供了一種視頻圖像文字的檢測裝置,包括:
[0028] 檢測模塊,用于對視頻圖像進(jìn)行文字檢測,確定所述視頻圖像的文本區(qū)域;
[0029] 分割模塊,用于利用所述視頻圖像的顏色信息對所述視頻圖像的文本區(qū)域進(jìn)行文 字和背景分割,得到二值化文字圖像;
[0030] 過濾模塊,用于對所述二值化文字圖像進(jìn)行過濾處理,得到過濾后的文字圖像。
[0031] 優(yōu)選地,所述裝置還包括:
[0032] 侵蝕模塊,用于對所述視頻圖像的文本區(qū)域進(jìn)行侵蝕處理,得到侵蝕后的文本區(qū) 域。
[0033] 優(yōu)選地,所述分割模塊,具體包括:
[0034] 中心確定子模塊,用于確定所述視頻圖像文字對應(yīng)的三通道中心像素值;
[0035] 判斷子模塊,用于判斷所述文本區(qū)域中每個像素點(diǎn)與所述中心像素值是否符合預(yù) 置條件,若符合,則確定當(dāng)前像素點(diǎn)為文字;若不符合,則確定當(dāng)前像素點(diǎn)為背景。
[0036] 優(yōu)選地,所述中心確定子模塊,具體包括:
[0037] 背景過濾單元,用于利用所述文本區(qū)域作為掩板,從所述視頻圖像中過濾掉背景, 得到文字;
[0038] 提取單元,用于提取所述文字的三通道像素值;
[0039] 中心確定單元,用于對每個通道提取的像素值進(jìn)行排序,并依據(jù)排序結(jié)果確定中 位數(shù)為所述文字對應(yīng)的三通道中心像素值。
[0040] 優(yōu)選地,所述過濾模塊,具體包括:
[0041] 文字信息獲取子模塊,用于依據(jù)對所述文本區(qū)域分割出的文字,獲取所述文字的 筆畫寬度信息以及所述文字的寬度信息;
[0042] 切割緊縮子模塊,用于依據(jù)所述文字的筆畫寬度信息和所述文字的寬度信息,對 所述文本區(qū)域的文字進(jìn)行切割緊縮處理;
[0043] 去噪子模塊,用于對所述切割緊縮處理后的文本區(qū)域進(jìn)行去噪處理,得到過濾后 的文字圖像。
[0044] 優(yōu)選地,所述裝置還包括:
[0045] 顏色獲取模塊,用于利用所述過濾后的文字圖像作為掩板,從所述視頻圖像中獲 取文字顏色信息,得到彩色文字圖像。
[0046] 優(yōu)選地,所述檢測模塊,具體包括:
[0047] 檢測子模塊,用于利用筆畫寬度變換的檢測方法對所述視頻圖像進(jìn)行文字檢測, 確定所述視頻圖像的文本區(qū)域。
[0048] 與現(xiàn)有技術(shù)相比,本發(fā)明實施例包括以下優(yōu)點(diǎn):
[0049] 本發(fā)明實施例首先對視頻圖像進(jìn)行文字檢測,確定文本區(qū)域,然后利用顏色信息 對文本區(qū)域的文字和背景進(jìn)行分割,得到二值化文字圖像,最后對二值化文字圖像進(jìn)行過 濾得到去除噪點(diǎn)的文字圖像。由于視頻圖像文字具有背景復(fù)雜、文字顏色均一的特點(diǎn),而本 發(fā)明實施例在對視頻圖像進(jìn)行文字檢測之后,再利用顏色信息進(jìn)行圖像分割,可以進(jìn)一步 地區(qū)分文字和復(fù)雜的背景,避免單獨(dú)利用針對圖像的邊緣檢測方法如OCR導(dǎo)致檢測效果較 差的問題;此外,由于視頻文字顏色均一,利用顏色信息進(jìn)行圖像分割,還可以避免光照變 化對于檢測效果的影響,從而可以提高視頻圖像文字檢測的效果。
【附圖說明】
[0050] 圖1示出了本發(fā)明的一種視頻圖像文字的檢測方法實施例的步驟流程圖;
[0051] 圖2示出了兩幅視頻圖像的局部圖像示意圖;
[0052] 圖3示出了應(yīng)用SWT算法對圖2中的視頻圖像進(jìn)行文字檢測的結(jié)果示意圖;
[0053] 圖4示出了本發(fā)明的一種基于顏色信息進(jìn)行圖像分割后得到的二值化文字圖像 示意圖;
[0054] 圖5示出了本發(fā)明的一種對ROI侵蝕處理后的結(jié)果示意圖;
[0055] 圖6示出了本發(fā)明利用所述視頻圖像的顏色信息對所述視頻圖像的文本區(qū)域進(jìn) 行文字和背景分割,得到二值化文字圖像的步驟流程圖;
[0056] 圖7示出了本發(fā)明對二值化文字圖像進(jìn)行過濾處理,得到過濾后的文字圖像的步 驟流程圖;
[0057] 圖8示出了本發(fā)明的一種獲取文字筆畫寬度的示意圖;
[0058] 圖9示出了本發(fā)明的一種文字垂直方向灰度投影的結(jié)果示意圖;
[0059] 圖10示出了本發(fā)明的一種文字水平方向灰度投影的結(jié)果示意圖;
[0060] 圖11示出了本發(fā)明的一種切割粘連文字的結(jié)果示意圖;
[0061] 圖12示出了本發(fā)明對二值化文字圖像去除噪音后的結(jié)果示意圖;
[0062] 圖13示出了本發(fā)明的一種視頻圖像文字的檢測方法系統(tǒng)流程圖;
[0063] 圖14示出了圖13對應(yīng)的檢測方法步驟流程圖;及
[0064] 圖15示出了本發(fā)明一種視頻圖像文字的檢測裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0065] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實 施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0066] 實施例一
[0067] 參照圖1,示出了本發(fā)明的一種視頻圖像文字的檢測方法實施例的步驟流程圖,具 體可以包括:
[0068] 步驟101、對視頻圖像進(jìn)行文字檢測,確定所述視頻圖像的文本區(qū)域;
[0069] 本發(fā)明實施例可以應(yīng)用于公司新聞拆分系統(tǒng)等各種應(yīng)用場景中,用于提高應(yīng)用場 景中視頻圖像文字檢測的效果。例如,在應(yīng)用于公司新聞拆分系統(tǒng)時,一方面,由于標(biāo)題一 般出現(xiàn)在相關(guān)新聞段落的開頭,所以可以采用本發(fā)明實施例識別出每個新聞段落的標(biāo)題, 從而可以分割開各標(biāo)題對應(yīng)的新聞段落;另一方面,文字檢測結(jié)果還可以作為分割出來的 新聞段落的標(biāo)題,因此,本發(fā)明實施例能夠減輕編輯手工輸入新聞標(biāo)題的工作量。
[0070] 在具體實現(xiàn)中,對視頻圖像進(jìn)行文字檢測的算法很多,比如基于梯度、基于能量或 基于學(xué)習(xí)模型的文字檢測算法等。但是有的算法速度較慢,比如基于能量的算法,有的算 法的檢測精度不能滿足要求,有的算法需要大量樣本,如學(xué)習(xí)模型的文字檢測算法,在綜 合考慮了各個算法的效果和效率后,本發(fā)明實施例優(yōu)選采用筆畫寬度變換(strokeWidth TranSf〇rm,SWT)的算法對視頻圖像進(jìn)行文字檢測。當(dāng)然,本領(lǐng)域技術(shù)人員可以靈活選擇文 字檢測算法,本發(fā)明對文字檢測的具體算法不加以限制。
[0071] SWT算法是一種通用的效果較好的文字檢測算法,一般情況下,應(yīng)用該算法能夠很 好的找到視頻圖像中文字所在的位置,本發(fā)明實施例利用其檢測文字,作為進(jìn)一步圖像分 割的基礎(chǔ)。參照圖2,示出了兩幅視頻圖像的局部圖像示意圖,以及參照圖3,示出了應(yīng)用 SWT算法對圖2中的視頻圖像進(jìn)行文字檢測的結(jié)果示意圖,從圖3中可以看出,SWT算法可 以初步檢測出文字的大體輪廓,但是單獨(dú)使用SWT算法等基于邊緣的檢測方法,視頻圖像 的文字檢測效果較差,例如圖3中的文字還有部分殘缺
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
民乐县| 景洪市| 都昌县| 罗城| 武冈市| 茂名市| 屏山县| 襄垣县| 博爱县| 庆阳市| 阳泉市| 梅河口市| 钟山县| 通辽市| 克东县| 闸北区| 富裕县| 秦安县| 上杭县| 玛纳斯县| 星子县| 滨海县| 绿春县| 湾仔区| 太和县| 西昌市| 共和县| 商南县| 合阳县| 容城县| 汶上县| 武城县| 汤原县| 昌宁县| 舟曲县| 万载县| 石阡县| 旬阳县| 萨嘎县| 宁阳县| 夏邑县|