一種圖像文本識別翻譯眼鏡的制作方法
【技術(shù)領(lǐng)域】
[0001]本實(shí)用新型涉及圖像文本識別翻譯領(lǐng)域,尤其涉及一種圖像文本識別翻譯眼鏡。
【背景技術(shù)】
[0002]目前,用戶有很高的翻譯請求,即使是學(xué)術(shù)非常高的醫(yī)生、教授專家,在長時間不接觸外文知識和年齡高的情況下,看一些外文資料和文獻(xiàn),或是觀光于國內(nèi)外景區(qū)和酒店等眾多場合,都會遇到不認(rèn)識的中文文本或外文文本資料信息及帶有文本的圖片信息,采用攝像頭拍攝帶有中文文本或外文文本的資料信息和帶有文本圖片圖像信息,采集到有文本的資料和圖片圖像的應(yīng)用越來越廣泛,圖像文本識別技術(shù)將圖像中的文本進(jìn)行識別,轉(zhuǎn)換為文本,減輕了用戶輸入對應(yīng)文本信息的負(fù)擔(dān),通過翻譯處理,輸出中文文本或外文文本的翻譯結(jié)果,顯示在屏幕上。
[0003]最接近的圖像文本識別翻譯技術(shù)是借助谷歌眼鏡,用語音輸入待翻譯的文本,由谷歌眼鏡輸出翻譯文本于屏幕或文本語音輸出信息;還有日本的NEC翻譯眼鏡和百度眼鏡依靠后臺的服務(wù)器系統(tǒng),根據(jù)語音輸入、攝像、定位、自學(xué)習(xí)輸出最接近的文本語音信息。
[0004]但是,在需要翻譯的現(xiàn)場,上述兩種翻譯方法存在的冋題是:(1)面對有文本的資料和文本的圖片圖像,若沒有語音文本輸入信息時,谷歌眼鏡便無法輸出翻譯后的文本信息;(2)在不能連接到互聯(lián)網(wǎng)和局域網(wǎng)環(huán)境下,日本的NEC翻譯眼鏡和百度眼鏡便不能輸出翻譯后的文本信息;有文本的資料和帶文本的圖片圖像資料,攝像頭提取的文本信息圖像,很難在現(xiàn)場看到翻譯后的文本信息。
【實(shí)用新型內(nèi)容】
[0005]本實(shí)用新型旨在至少解決上述技術(shù)問題之一。
[0006]為此,本實(shí)用新型的第一個目的在于提出一種圖像文本識別翻譯眼鏡。包括:在圖像文本識別翻譯眼鏡的框架上安裝的ARMll處理器的硬件電路Tl ;在圖像文本識別翻譯眼鏡中安裝的高精度微型攝像頭T2,高精度微型攝像頭T2與硬件電路Tl相連接;在圖像文本識別翻譯眼鏡中安裝的透明視像鏡片T3,在圖像文本識別翻譯眼鏡中安裝的語音輸出耳機(jī)T4和T5 ;帶有高精度攝像頭的智能手機(jī)。該眼鏡在兩個鏡片中央安裝了一個高精度微型攝像頭,兩個鏡片是透明視像鏡片,在眼鏡框架上安裝有ARMll處理器的硬件電路,高精度微型攝像頭與硬件電路相連接,透明視像鏡片與硬件電路相連接,硬件電路具有操作系統(tǒng)和大容量存儲器,大容量存儲器下載存儲有本地知識庫和在線網(wǎng)絡(luò)知識庫的譯文數(shù)據(jù)庫,通過高精度微型攝像頭提取有文本的資料圖片或帶有文本的圖像信息,經(jīng)具有操作系統(tǒng)硬件電路的功能軟件獲取待識別圖像中的文本區(qū)域、利用識別結(jié)果查詢知識庫獲得識別結(jié)果對應(yīng)的知識信息、在返回所述識別結(jié)果時,推送包含所述知識信息的知識拓展詞包,知識拓展詞包是英譯漢、漢譯英、多語言翻譯、中文解釋等詞包,輸出翻譯結(jié)果文本信息到視像鏡片,讓用戶從視像鏡片中看到翻譯結(jié)果的文本信息,還可以語音輸出翻譯信息。
[0007]本實(shí)用新型的第二個目的在于提出一種翻譯方法。為了實(shí)現(xiàn)上述目的,本實(shí)用新型第一個目的實(shí)施的翻譯方法,適合于帶有高精度攝像頭的智能手機(jī),在現(xiàn)場實(shí)現(xiàn)可視翻譯方法,具體實(shí)現(xiàn)是:高精度攝像頭提取有文本的資料圖片或帶有文本的圖像信息,智能手機(jī)屏幕看到翻譯結(jié)果文本信息,智能手機(jī)具有大容量存儲器下載存儲有本地知識庫和在線網(wǎng)絡(luò)知識庫的譯文數(shù)據(jù)庫,智能手機(jī)操作系統(tǒng)具有功能軟件獲取待識別圖像中的文本區(qū)域、利用識別結(jié)果查詢知識庫獲得識別結(jié)果對應(yīng)的知識信息、在返回所述識別結(jié)果時,推送包含所述知識信息的知識拓展詞包,知識拓展詞包是英譯漢、漢譯英、多語言翻譯、中文解釋等詞包,輸出翻譯結(jié)果文本信息到智能手機(jī)屏幕,讓用戶從智能手機(jī)屏幕中看到翻譯結(jié)果的文本信息,還可以語音輸出翻譯信息。
[0008]由以上技術(shù)方案可以看出,本實(shí)用新型利用文本識別的結(jié)果查詢知識庫獲得識別結(jié)果對應(yīng)的翻譯文本知識信息,并包含在翻譯文本知識拓展詞包中連同識別結(jié)果一起返回給用戶的圖像文本識別翻譯眼鏡視像鏡片上或從智能手機(jī)屏幕中看到翻譯結(jié)果的文本信息,使得用戶在現(xiàn)場獲取圖像中文本識別結(jié)果的同時,能夠獲取到對應(yīng)的翻譯文本知識信息和語音信息,而無需進(jìn)一步通過手工的方式獲得知識信息,顯然更加方便和省力。
【附圖說明】
[0009]圖1為本實(shí)用新型實(shí)施例提供的圖像文本識別翻譯眼鏡示意圖。
[0010]圖2為本實(shí)用新型實(shí)施例提供的圖像文本識別翻譯的方法流程圖。
【具體實(shí)施方式】
[0011]為了使本實(shí)用新型的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對本實(shí)用新型進(jìn)行詳細(xì)描述。
[0012]如圖1所示,本實(shí)用新型實(shí)施例提供的圖像文本識別翻譯眼鏡示意圖。包括:在圖像文本識別翻譯眼鏡的框架上安裝的ARMll處理器的硬件電路Tl ;在圖像文本識別翻譯眼鏡中安裝的高精度微型攝像頭T2,高精度微型攝像頭T2與硬件電路Tl相連接;在圖像文本識別翻譯眼鏡中安裝的透明視像鏡片T3,在圖像文本識別翻譯眼鏡中安裝的語音輸出耳機(jī)T4和T5 ;帶有高精度攝像頭的智能手機(jī)。
[0013]為了順利實(shí)現(xiàn)圖1所示的圖像文本識別翻譯眼鏡和使用帶有高精度攝像頭的智能手機(jī)實(shí)現(xiàn)現(xiàn)場可視翻譯方法,采用了圖2所示的圖像文本識別翻譯的方法流程圖。
[0014]包括如下步驟:
[0015]步驟SI,翻譯眼鏡存儲器下載存儲有本地知識庫和在線的網(wǎng)絡(luò)知識庫譯文數(shù)據(jù)庫,優(yōu)選地,在本實(shí)用新型的一個實(shí)施例中,下載存儲有本地知識數(shù)據(jù)庫和在線的網(wǎng)絡(luò)數(shù)據(jù)庫可包括海量的生物、物理、化學(xué)、計算機(jī)、醫(yī)療、文史、經(jīng)濟(jì)、政治、新聞、綜合等方面的英譯漢、漢譯英、多語言翻譯、中文解釋等詞包信息數(shù)據(jù)庫。
[0016]步驟S2,翻譯眼鏡攝像頭根據(jù)人體視線獲取待識別有文本圖像中的文本區(qū)域獲取文本圖像。成熟的技術(shù)是獲取待識別文本圖像的灰度圖,其中圖像中用灰度表示的圖像稱作灰度圖。
[0017]步驟S3,使用多種圖像預(yù)處理方法來處理文本圖像,以獲得多組二值圖像,包括:二值化計算縱橫比,畸變校正,校正補(bǔ)償。
[0018]在一般的文本圖像識別系統(tǒng)中,對圖像僅進(jìn)行一次二值化處理。即使該二值化處理中所使用的閾值對文本圖像中的文本整體識別率是最優(yōu)的,使用不同的圖像預(yù)處理方法來處理文本圖像,獲得不同的兩組或兩組以上的二值圖像,以保證待識別的文本圖像中的每個字符都能有較佳的識別結(jié)果。
[0019]具體地,文本圖像通過二值化處理將彩色圖像轉(zhuǎn)化為黑白圖像。二值化包括兩部分,A、圖形轉(zhuǎn)為黑白,一般通過使用一個判別函數(shù),接收一個色值,返回真/假的布爾結(jié)果.分別表示黑(字符)和白(背景).因?yàn)椴煌?yàn)證碼這部分不同,一般使用配置的方法.常見的如以下幾種中根據(jù)情況具體選一種:1、直接取黑色為黑,非黑色(包括灰色)為白.(這種在部分圖片中可能讓字體變細(xì)并出現(xiàn)斷掉的問題);2、直接取白色為白,非白色(包括灰)為黑,(這種在一些情況下會讓原本不相連的兩個字符連在一起了);3、亮度超過某個臨界值的顏色為白,其他為黑(這種相當(dāng)于上面兩種的折中,關(guān)鍵在于這個臨界值到底取多少,取決于具體驗(yàn)證碼);4、前述第3種會產(chǎn)生的問題是如果背景和字符亮度一樣就會失效(比如相同亮度的藍(lán)色背景和紅色字符).所以不用亮度而是取一個色彩通道(比如紅/綠/蘭其中一個)的值,跟一個臨界值比較.至于取哪個值只要按照圖片的顏色來定一個區(qū)分度高的即可;5、混合使用亮度,灰度,色度等值,通過加權(quán)運(yùn)算后與臨界值比較,效果好,通用性高但運(yùn)算量較大,以上1-4都不能實(shí)現(xiàn)時用這種方法。B、去除噪點(diǎn).其實(shí)轉(zhuǎn)黑白的過程已經(jīng)有一定的去除噪點(diǎn)的作用(這就是為什么把轉(zhuǎn)黑白放在第一步而去噪點(diǎn)放第二步)剩下的噪點(diǎn)可通過對每個黑點(diǎn)判斷周圍8個位置(上,下,左,右,左上,右上,左下,右下)的