欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于圖片的文字信息識(shí)別方法及裝置與流程

文檔序號(hào):11261957閱讀:229來源:國(guó)知局
一種基于圖片的文字信息識(shí)別方法及裝置與流程

本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種基于圖片的文字信息識(shí)別方法及裝置。



背景技術(shù):

目前,對(duì)于某些網(wǎng)站開發(fā)者和發(fā)布者,為加速網(wǎng)頁(yè)發(fā)布和避免瀏覽器兼容性等問題,常常把發(fā)布的文字信息直接放在圖片中。用戶無法直接查看圖片所包含的文字信息,需要將網(wǎng)頁(yè)中的圖片保存到本地,再通過第三方的圖片解析工具對(duì)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息,操作繁瑣,文字信息的識(shí)別效率較低。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例所要解決的技術(shù)問題在于,提供一種基于圖片的文字信息識(shí)別方法及裝置,可在線識(shí)別網(wǎng)頁(yè)界面中圖片所包含的文字信息,操作便捷。

為了解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種基于圖片的文字信息識(shí)別方法,所述方法應(yīng)用于瀏覽器插件,包括:

接收用戶輸入的搜索關(guān)鍵字;

對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)所述圖片所包含的文字信息;

將所述搜索關(guān)鍵字與各個(gè)所述圖片所包含的文字信息進(jìn)行比較,確定與所述搜索關(guān)鍵字匹配的文字信息所屬的第一圖片;

顯示所述第一圖片所包含的文字信息。

相應(yīng)地,本發(fā)明實(shí)施例還提供了一種基于圖片的文字信息識(shí)別裝置,包括:

關(guān)鍵字接收單元,用于接收用戶輸入的搜索關(guān)鍵字;

文字信息獲取單元,用于對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)所述圖片所包含的文字信息;

比較單元,用于將所述搜索關(guān)鍵字與各個(gè)所述圖片所包含的文字信息進(jìn)行 比較,確定與所述搜索關(guān)鍵字匹配的文字信息所屬的第一圖片;

文字信息顯示單元,用于顯示所述第一圖片所包含的文字信息。

實(shí)施本發(fā)明實(shí)施例,通過接收用戶輸入的搜索關(guān)鍵字,對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息,將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,顯示第一圖片所包含的文字信息,可在線識(shí)別網(wǎng)頁(yè)界面中圖片所包含的文字信息,操作便捷。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖;

圖1是本發(fā)明實(shí)施例中提供的一種終端的結(jié)構(gòu)示意圖;

圖2是本發(fā)明另一實(shí)施例中提供的一種終端的結(jié)構(gòu)示意圖;

圖3是本發(fā)明實(shí)施例中提供的一種基于圖片的文字信息識(shí)別方法的流程示意圖;

圖4是本發(fā)明實(shí)施例中提供的一種基于圖片的文字信息識(shí)別裝置的結(jié)構(gòu)示意圖;

圖5是本發(fā)明另一實(shí)施例中提供的一種終端的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

上述基于圖片的文字信息識(shí)別方法可以運(yùn)行在平板電腦、手機(jī)或個(gè)人計(jì)算機(jī)(personalcomputer,pc)等終端中,也可以運(yùn)行在qq瀏覽器或谷歌瀏覽器等客戶端中。

請(qǐng)參見圖1,圖1是本發(fā)明實(shí)施例中的一種終端的結(jié)構(gòu)示意圖,該終端可以 為瀏覽器插件,如圖所示本發(fā)明實(shí)施例中的終端可以包括輸入模塊101、邏輯控制模塊102、內(nèi)容存儲(chǔ)模塊103、應(yīng)用程序編程接口(applicationprogramminginterface,api)104以及輸出模塊105,其中輸入模塊101以及輸出模塊105和邏輯控制模塊102連接,邏輯控制模塊102和內(nèi)容存儲(chǔ)模塊103連接,內(nèi)容存儲(chǔ)模塊103和api104連接,其中:

輸入模塊101用于實(shí)現(xiàn)用戶與終端的交互和/或信息輸入到終端中。例如,輸入模塊101可以接收用戶輸入的數(shù)字或字符信息,以產(chǎn)生與用戶設(shè)置或功能控制有關(guān)的信號(hào)輸入。在本發(fā)明具體實(shí)施方式中,輸入模塊101至少包括觸控面板和/或其他人機(jī)交互界面,例如實(shí)體輸入鍵、麥克風(fēng)等。

觸控面板,也稱為觸摸屏或觸控屏,可收集用戶在其上觸摸或接近的操作動(dòng)作。比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板上或接近觸控面板的位置的操作動(dòng)作,并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置。可選的,觸控面板可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸操作,并將檢測(cè)到的觸摸操作轉(zhuǎn)換為電信號(hào),以及將所述電信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收所述電信號(hào),并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器。所述觸摸控制器還可以接收處理器發(fā)來的命令并執(zhí)行。此外,可以采用電阻式、電容式、紅外線(infrared)以及表面聲波等多種類型實(shí)現(xiàn)觸控面板。在本發(fā)明的其他實(shí)施方式中,輸入模塊101所采用的實(shí)體輸入鍵可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。麥克風(fēng)形式的輸入模塊101可以收集用戶或環(huán)境輸入的語(yǔ)音并將其轉(zhuǎn)換成電信號(hào)形式的、邏輯控制模塊可執(zhí)行的命令。

邏輯控制模塊102為終端的控制中心,利用各種接口和線路連接整個(gè)終端的各個(gè)部分。

內(nèi)容存儲(chǔ)模塊103可用于存儲(chǔ)軟件程序以及數(shù)據(jù),內(nèi)容存儲(chǔ)模塊103主要包括程序存儲(chǔ)區(qū)和數(shù)據(jù)存儲(chǔ)區(qū),其中,程序存儲(chǔ)區(qū)可存儲(chǔ)操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序,比如聲音播放程序、圖像播放程序等等;數(shù)據(jù)存儲(chǔ)區(qū)可存儲(chǔ)根據(jù)終端的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。

輸出模塊105包括但不限于影像輸出單元和聲音輸出單元。影像輸出單元用于輸出文字、圖片和/或視頻。本發(fā)明實(shí)施例中的影像輸出單元至少包括顯示 屏,例如采用lcd(liquidcrystaldisplay,液晶顯示器)、oled(organiclight-emittingdiode,有機(jī)發(fā)光二極管)、場(chǎng)發(fā)射顯示器(fieldemissiondisplay,簡(jiǎn)稱fed)等形式來配置的顯示屏?;蛘咚鲇跋褫敵鰡卧梢园ǚ瓷涫斤@示器,例如電泳式(electrophoretic)顯示器,或利用光干涉調(diào)變技術(shù)(interferometricmodulationoflight)的顯示器。所述影像輸出單元可以包括單個(gè)顯示器或不同尺寸的多個(gè)顯示器。在本發(fā)明的具體實(shí)施方式中,上述輸入模塊101所采用的觸控面板和輸出單元105所采用的顯示屏可以統(tǒng)稱為顯示器。當(dāng)觸控面板檢測(cè)到在其上的觸摸或接近的手勢(shì)操作后,傳送給邏輯控制模塊102以確定觸摸事件的類型,隨后邏輯控制模塊102根據(jù)觸摸事件的類型在顯示屏上提供相應(yīng)的視覺輸出。雖然在圖1中,輸入模塊101與輸出模塊105是作為兩個(gè)獨(dú)立的部件來實(shí)現(xiàn)終端的輸入和輸出功能,但是在某些實(shí)施例中,可以將觸控面板與顯示屏集成一體而實(shí)現(xiàn)終端的輸入和輸出功能。例如,所述影像輸出單元可以顯示各種圖形化用戶接口(graphicaluserinterface,gui)以作為虛擬控制組件,包括但不限于窗口、卷動(dòng)軸、圖標(biāo)及剪貼簿,以供用戶通過觸控方式進(jìn)行操作。

在一種可能的實(shí)現(xiàn)方式中,用戶可以通過輸入模塊101輸入搜索關(guān)鍵字,邏輯控制模塊102接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器103,內(nèi)容存儲(chǔ)器103根據(jù)識(shí)別指令確定網(wǎng)頁(yè)界面中的各個(gè)圖片,邏輯控制模塊102調(diào)用api,并通過api對(duì)各個(gè)圖片進(jìn)行動(dòng)態(tài)加載和解析,以獲取各個(gè)圖片所包含的文字信息。進(jìn)一步的,邏輯控制模塊102將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,邏輯控制模塊102將第一圖片所包含的文字信息發(fā)送給內(nèi)容存儲(chǔ)器103,內(nèi)容存儲(chǔ)器103將第一圖片所包含的文字信息通過輸出模塊105進(jìn)行顯示。

在一種可能的實(shí)現(xiàn)方式中,輸出模塊105顯示包含圖片的網(wǎng)頁(yè)界面之后,用戶可以通過輸入模塊101輸入針對(duì)需要文字信息識(shí)別的圖片的識(shí)別事件,邏輯控制模塊102接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器103,內(nèi)容存儲(chǔ)器103根據(jù)識(shí)別指令攜帶的需要文字信息識(shí)別的圖片的圖片標(biāo)識(shí)信息,確定需要文字信息識(shí)別的圖片,邏輯控制模塊102調(diào)用api,并通過api對(duì)需要文字信息識(shí)別的圖片進(jìn)行動(dòng)態(tài)加載和解析,以獲取需要文字信息識(shí)別的圖片所包含的文字信息。

在一種可能的實(shí)現(xiàn)方式中,輸出模塊105顯示包含圖片的網(wǎng)頁(yè)界面之后,可以生成對(duì)當(dāng)前顯示的網(wǎng)頁(yè)界面中的所有圖片進(jìn)行文字信息識(shí)別的事件,邏輯控制模塊102接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器103,內(nèi)容存儲(chǔ)器103根據(jù)識(shí)別指令攜帶的各個(gè)圖片的圖片標(biāo)識(shí)信息,確定需要文字信息識(shí)別的圖片,邏輯控制模塊102調(diào)用api,并通過api對(duì)需要文字信息識(shí)別的圖片進(jìn)行動(dòng)態(tài)加載和解析,以獲取需要文字信息識(shí)別的圖片所包含的文字信息。

其中,上述終端所包含的源代碼經(jīng)鑒權(quán)可以被修改,則可以將api集成在終端中,無需通過文字信息識(shí)別驅(qū)動(dòng)對(duì)圖片進(jìn)行文字信息識(shí)別,以便于升級(jí)或者維護(hù)。具體的,邏輯控制模塊102可以包含background.html文件,用于指示在html語(yǔ)言下,background用于保持背景圖案和背景顏色。內(nèi)容存儲(chǔ)模塊103可以包含contentscript文件(內(nèi)容腳本),可以用于通過后臺(tái)管理頁(yè)抓取圖片標(biāo)識(shí)信息對(duì)應(yīng)的圖片。api104可以包含文字信息識(shí)別函數(shù),用于對(duì)需要文字信息識(shí)別的圖片進(jìn)行文字信息識(shí)別。

其中,圖片標(biāo)識(shí)信息可以用于唯一標(biāo)識(shí)該圖片,例如圖片名稱、存儲(chǔ)路徑或者數(shù)據(jù)容量等。

可理解的是,在該實(shí)現(xiàn)方式中,終端的各功能模塊的功能可根據(jù)圖3所示方法實(shí)施例中的方法具體實(shí)現(xiàn),可以具體對(duì)應(yīng)圖3的相關(guān)描述,此處不再贅述。

請(qǐng)參見圖2,圖2是本發(fā)明實(shí)施例中的一種終端的結(jié)構(gòu)示意圖,該終端可以為瀏覽器插件,如圖所示本發(fā)明實(shí)施例中的終端可以包括輸入模塊201、邏輯控制模塊202、內(nèi)容存儲(chǔ)模塊203、文字信息識(shí)別驅(qū)動(dòng)204以及輸出模塊205,其中輸入模塊201以及輸出模塊205和邏輯控制模塊202連接,邏輯控制模塊202和內(nèi)容存儲(chǔ)模塊203連接,內(nèi)容存儲(chǔ)模塊203以及文字信息識(shí)別驅(qū)動(dòng)204和輸出模塊205連接,其中:

在一種可能的實(shí)現(xiàn)方式中,用戶可以通過輸入模塊201輸入搜索關(guān)鍵字,邏輯控制模塊202接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器203,內(nèi)容存儲(chǔ)器203根據(jù)識(shí)別指令確定網(wǎng)頁(yè)界面中的各個(gè)圖片,輸出模塊205對(duì)內(nèi)容存儲(chǔ)器203確定的各個(gè)圖片進(jìn)行格式轉(zhuǎn)換得到圖片流,并將圖片流發(fā)送給文字信息識(shí)別驅(qū)動(dòng)104,文字信息識(shí)別驅(qū)動(dòng)204對(duì)各個(gè)圖片進(jìn)行動(dòng) 態(tài)加載和解析,以獲取需要文字信息識(shí)別的圖片所包含的文字信息,并將文字信息進(jìn)行格式轉(zhuǎn)換得到數(shù)據(jù)流,并將數(shù)據(jù)流通過輸出模塊205發(fā)送給內(nèi)容存儲(chǔ)模塊203。進(jìn)一步的,內(nèi)容存儲(chǔ)模塊203將各個(gè)圖片所包含的文字信息發(fā)送給邏輯控制模塊202,邏輯控制模塊202將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,邏輯控制模塊102將第一圖片所包含的文字信息發(fā)送給內(nèi)容存儲(chǔ)器203,內(nèi)容存儲(chǔ)器203將第一圖片所包含的文字信息通過輸出模塊205進(jìn)行顯示。

在一種可能的實(shí)現(xiàn)方式中,輸出模塊205顯示包含圖片的網(wǎng)頁(yè)界面之后,用戶可以通過輸入模塊201輸入針對(duì)需要文字信息識(shí)別的圖片的識(shí)別事件,邏輯控制模塊202接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器203,內(nèi)容存儲(chǔ)器203根據(jù)識(shí)別指令攜帶的需要文字信息識(shí)別的圖片的圖片標(biāo)識(shí)信息,確定需要文字信息識(shí)別的圖片,輸出模塊205對(duì)內(nèi)容存儲(chǔ)器203確定的圖片進(jìn)行格式轉(zhuǎn)換得到圖片流,并將圖片流發(fā)送給文字信息識(shí)別驅(qū)動(dòng)204,文字信息識(shí)別驅(qū)動(dòng)204對(duì)需要文字信息識(shí)別的圖片進(jìn)行動(dòng)態(tài)加載和解析,以獲取需要文字信息識(shí)別的圖片所包含的文字信息,并將文字信息進(jìn)行格式轉(zhuǎn)換得到數(shù)據(jù)流,并將數(shù)據(jù)流通過輸出模塊205發(fā)送給內(nèi)容存儲(chǔ)模塊203。

在一種可能的實(shí)現(xiàn)方式中,輸出模塊205顯示網(wǎng)頁(yè)界面之后,可以生成對(duì)當(dāng)前顯示的網(wǎng)頁(yè)界面中的所有圖片進(jìn)行文字信息識(shí)別的事件,邏輯控制模塊202接收并確定事件的類型之后,將該事件中的識(shí)別指令發(fā)送給內(nèi)容存儲(chǔ)器203,內(nèi)容存儲(chǔ)器203根據(jù)識(shí)別指令攜帶的各個(gè)圖片的圖片標(biāo)識(shí)信息,確定需要文字信息識(shí)別的圖片,輸出模塊205對(duì)內(nèi)容存儲(chǔ)器203確定的圖片進(jìn)行格式轉(zhuǎn)換得到圖片流,并將圖片流發(fā)送給文字信息識(shí)別驅(qū)動(dòng)204,文字信息識(shí)別驅(qū)動(dòng)204對(duì)需要文字信息識(shí)別的圖片進(jìn)行動(dòng)態(tài)加載和解析,以獲取需要文字信息識(shí)別的圖片所包含的文字信息,并將文字信息進(jìn)行格式轉(zhuǎn)換得到數(shù)據(jù)流,并將數(shù)據(jù)流通過輸出模塊205發(fā)送給內(nèi)容存儲(chǔ)模塊203。

其中,上述終端所包含的源代碼經(jīng)鑒權(quán)不可以被修改,則需要通過文字信息識(shí)別驅(qū)動(dòng)對(duì)圖片進(jìn)行文字信息識(shí)別,以實(shí)現(xiàn)在線識(shí)別網(wǎng)頁(yè)界面中圖片所包含的文字信息。具體的,邏輯控制模塊202可以包含background.html文件,用于指示在html語(yǔ)言下,background用于保持背景圖案和背景顏色。內(nèi)容存儲(chǔ)模塊203可以包含contentscript文件(內(nèi)容腳本),可以用于通過后臺(tái)管理頁(yè)抓取圖 片標(biāo)識(shí)信息對(duì)應(yīng)的圖片。文字信息識(shí)別驅(qū)動(dòng)204用于對(duì)需要文字信息識(shí)別的圖片進(jìn)行文字信息識(shí)別。

可理解的是,在該實(shí)現(xiàn)方式中,終端的各功能模塊的功能可根據(jù)圖3所示方法實(shí)施例中的方法具體實(shí)現(xiàn),可以具體對(duì)應(yīng)圖3的相關(guān)描述,此處不再贅述。

請(qǐng)參見圖3,圖3是本發(fā)明實(shí)施例中的一種基于圖片的文字信息識(shí)別方法的流程示意圖,所述方法應(yīng)用于瀏覽器插件,如圖所示本發(fā)明實(shí)施例中的基于圖片的文字信息識(shí)別方法可以包括:

s301,接收用戶輸入的搜索關(guān)鍵字。

終端可以接收用戶輸入的搜索關(guān)鍵字。其中,關(guān)鍵字就是用戶在使用搜索引擎時(shí)輸入的、能夠最大程度概括用戶所要查找的信息內(nèi)容的字或者詞,例如“k”或者“智能”等。具體實(shí)現(xiàn)中,終端可以繪制網(wǎng)頁(yè)浮窗,以便用戶輸入搜索關(guān)鍵字,用戶需要檢索包含指定文字信息的圖片時(shí),可以通過網(wǎng)頁(yè)浮窗輸入搜索關(guān)鍵字。

s302,對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息。

終端接收到用戶輸入的搜索關(guān)鍵字之后,可以獲取網(wǎng)頁(yè)界面中的所有圖片,對(duì)上述各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息。其中,網(wǎng)頁(yè)是構(gòu)成網(wǎng)站的基本元素,是承載各種網(wǎng)站應(yīng)用的平臺(tái)。在終端的顯示屏上顯示的網(wǎng)頁(yè)可以為網(wǎng)頁(yè)界面,網(wǎng)頁(yè)界面是人與機(jī)器(例如計(jì)算機(jī))之間傳遞和交換信息的媒介,網(wǎng)頁(yè)界面可以包括文字、圖片和/或動(dòng)畫等。圖片可以包含文字信息,且用戶無法在當(dāng)前顯示的網(wǎng)頁(yè)界面直接查看圖片所包含的文字信息。其中,網(wǎng)頁(yè)界面可以為當(dāng)前顯示的網(wǎng)頁(yè)界面,可選的,網(wǎng)頁(yè)界面可以包括網(wǎng)站所包含的所有網(wǎng)頁(yè)界面,例如主網(wǎng)頁(yè),子網(wǎng)頁(yè)等等。

在可選實(shí)施例中,終端得到各個(gè)圖片所包含的文字信息之后,可以將識(shí)別得到的文字信息存儲(chǔ)到本地,以便終端再次接收到用戶輸入的搜索關(guān)鍵字時(shí),可以直接在本地獲取各個(gè)圖片所包含的文字信息,無需每次接收到用戶輸入的搜索關(guān)鍵字之后,都對(duì)網(wǎng)頁(yè)界面中的圖片進(jìn)行文字信息識(shí)別,本發(fā)明實(shí)施例可提高資源利用率。

s303,將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索 關(guān)鍵字匹配的文字信息所屬的第一圖片。

終端可以將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片。例如,如果搜索關(guān)鍵字為“智能”,終端可以判斷各個(gè)圖片所包含的文字信息中是否包括字符“智能”,如果存在包括字符“智能”的文字信息,終端可以將該文字信息所屬的圖片確認(rèn)為第一圖片。

在可選實(shí)施例中,終端將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,如果不存在與搜索關(guān)鍵字匹配的文字信息,終端可以將搜索關(guān)鍵字與網(wǎng)頁(yè)界面中的各個(gè)網(wǎng)頁(yè)內(nèi)容進(jìn)行比較,確定與搜索關(guān)鍵字匹配的網(wǎng)頁(yè)內(nèi)容,并顯示該網(wǎng)頁(yè)內(nèi)容。其中,網(wǎng)頁(yè)內(nèi)容可以包括文本、動(dòng)畫、音頻或者視頻等,網(wǎng)頁(yè)內(nèi)容還可以包括圖片所包含的人臉、建筑或者景色等。

在可選實(shí)施例中,終端對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息之后,可以將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,并將搜索關(guān)鍵字與網(wǎng)頁(yè)界面中的各個(gè)網(wǎng)頁(yè)內(nèi)容進(jìn)行比較,確定與搜索關(guān)鍵字匹配的網(wǎng)頁(yè)內(nèi)容。

s304,顯示第一圖片所包含的文字信息。

終端確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片之后,可以顯示第一圖片所包含的文字信息。例如,終端可以高亮顯示第一圖片所包含的文字信息。又如,終端可以將第一圖片所包含的文字信息轉(zhuǎn)換為語(yǔ)音,進(jìn)而通過麥克風(fēng)播放該語(yǔ)音。又如,終端可以創(chuàng)建懸浮框,在懸浮框中顯示第一圖片所包含的文字信息,其中懸浮框可以位于終端的顯示屏幕的最前端。

可選的,終端確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片之后,可以顯示第一圖片和/或第一圖片所包含的文字信息。

在可選實(shí)施例中,終端可以在當(dāng)前顯示的網(wǎng)頁(yè)界面中確定需要文字信息識(shí)別的圖片,對(duì)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。具體實(shí)現(xiàn)中,終端可以顯示網(wǎng)頁(yè)界面,并在當(dāng)前顯示的網(wǎng)頁(yè)界面中確定需要文字信息識(shí)別的圖片,如果本地存儲(chǔ)有上述確定得到的圖片所包含的文字信息,終端可以直接在本地獲取該圖片所包含的文字信息;如果本地未存儲(chǔ)上述確定得到的圖片所包含的文字信息,終端可以對(duì)該圖片進(jìn)行文字信息識(shí)別,得到該圖片所包 含的文字信息,進(jìn)而將該圖片所包含的文字信息存儲(chǔ)到本地。

在可選實(shí)施例中,終端顯示網(wǎng)頁(yè)界面之后,可以在該網(wǎng)頁(yè)界面中確定所有包含文字信息的圖片,并將上述各個(gè)圖片作為需要文字信息識(shí)別的圖片,對(duì)上述各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息。

在可選實(shí)施例中,終端可以接收用戶對(duì)網(wǎng)頁(yè)界面中的第二圖片提交的文字信息識(shí)別指令,將第二圖片確定為需要文字信息識(shí)別的圖片。例如,終端顯示網(wǎng)頁(yè)界面之后,用戶需要查看網(wǎng)頁(yè)界面中第二圖片所包含的文字信息時(shí),可以針對(duì)第二圖片輸入文字信息識(shí)別指令,針對(duì)根據(jù)文子信息識(shí)別指令將第二圖片確定為需要文字信息識(shí)別的圖片。其中,用戶針對(duì)第二圖片輸入文字信息識(shí)別指令具體可以為:用戶通過鼠標(biāo)將光標(biāo)放置在第二圖片所屬位置,點(diǎn)擊網(wǎng)頁(yè)右鍵菜單以輸入文字信息識(shí)別指令??蛇x的,用戶針對(duì)第二圖片輸入文字信息識(shí)別指令也可以為:用戶長(zhǎng)按第二圖片以輸入文字信息識(shí)別指令,等等,具體不受本發(fā)明實(shí)施例的限制。

在可選實(shí)施例中,終端可以調(diào)用預(yù)設(shè)api,并通過預(yù)設(shè)api對(duì)該圖片進(jìn)行文字信息識(shí)別,得到該圖片所包含的文字信息。本發(fā)明實(shí)施例無需安裝文字信息識(shí)別驅(qū)動(dòng),可便于升級(jí)或者維護(hù)。

在可選實(shí)施例中,終端可以對(duì)圖片進(jìn)行格式轉(zhuǎn)換,得到圖片流,通過文字信息識(shí)別驅(qū)動(dòng)對(duì)圖片流進(jìn)行文字信息識(shí)別,得到該圖片所包含的文字信息。

本發(fā)明實(shí)施例中,接收用戶輸入的搜索關(guān)鍵字,對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息,將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,顯示第一圖片所包含的文字信息,可在線識(shí)別網(wǎng)頁(yè)界面中圖片所包含的文字信息,操作便捷。

請(qǐng)參見圖4,圖4是本發(fā)明實(shí)施例中提供的一種基于圖片的文字信息識(shí)別裝置的結(jié)構(gòu)示意圖,本發(fā)明實(shí)施例中的基于圖片的文字信息識(shí)別裝置可以包括平板電腦、手機(jī)或個(gè)人計(jì)算機(jī)等終端,也可以包括瀏覽器等客戶端,如圖所示本實(shí)施例中的基于圖片的文字信息識(shí)別裝置至少可以包括關(guān)鍵字接收單元401、文字信息獲取單元402、比較單元403以及文字信息顯示單元404,其中:

關(guān)鍵字接收單元401,用于接收用戶輸入的搜索關(guān)鍵字。

文字信息獲取單元402,用于對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息。

比較單元403,用于將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片。

文字信息顯示單元404,用于顯示第一圖片所包含的文字信息。

在可選實(shí)施例中,本發(fā)明實(shí)施例中的基于圖片的文字信息識(shí)別裝置還可以包括:

圖片確定單元405,用于在當(dāng)前顯示的網(wǎng)頁(yè)界面中確定需要文字信息識(shí)別的圖片。

文字信息獲取單元402,還用于對(duì)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

在可選實(shí)施例中,圖片確定單元401,具體用于:

接收用戶對(duì)網(wǎng)頁(yè)界面中的第二圖片提交的文字信息識(shí)別指令。

將第二圖片確定為需要文字信息識(shí)別的圖片。

在可選實(shí)施例中,圖片識(shí)別單元402,具體用于:

調(diào)用預(yù)設(shè)api,并通過預(yù)設(shè)api對(duì)各個(gè)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

在可選實(shí)施例中,圖片識(shí)別單元402,具體用于:

對(duì)各個(gè)圖片進(jìn)行格式轉(zhuǎn)換,得到圖片流。

通過文字信息識(shí)別驅(qū)動(dòng)對(duì)圖片流進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

本發(fā)明實(shí)施例中,關(guān)鍵字接收單元401接收用戶輸入的搜索關(guān)鍵字,文字信息獲取單元402對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息,比較單元403將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片,文字信息顯示單元404顯示第一圖片所包含的文字信息,可在線識(shí)別網(wǎng)頁(yè)界面中圖片所包含的文字信息,操作便捷。

請(qǐng)參見圖5,圖5為本發(fā)明另一實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖,本發(fā)明實(shí)施例提供的終端可以用于實(shí)施上述圖3所示的本發(fā)明實(shí)施例實(shí)現(xiàn)的方法, 為了便于說明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,具體技術(shù)細(xì)節(jié)未揭示的,請(qǐng)參照?qǐng)D3所示的本發(fā)明實(shí)施例。

如圖5所示,該終端包括:至少一個(gè)處理器501,例如cpu,至少一個(gè)輸入裝置503,至少一個(gè)輸出裝置504,存儲(chǔ)器505,至少一個(gè)通信總線502。其中,通信總線502用于實(shí)現(xiàn)這些組件之間的連接通信。其中,輸入裝置503具體可以為網(wǎng)絡(luò)接口,用于與外部網(wǎng)絡(luò)進(jìn)行通信。其中,輸出裝置504具體可以為顯示屏,用于顯示圖像。其中,存儲(chǔ)器505可能包含高速ram存儲(chǔ)器,也可能還包括非不穩(wěn)定的存儲(chǔ)器,例如至少一個(gè)磁盤存儲(chǔ)器,具體用于存儲(chǔ)二值化圖像。存儲(chǔ)器505可選的可以包含至少一個(gè)位于遠(yuǎn)離前述處理器501的存儲(chǔ)裝置。處理器501可以結(jié)合圖4所示的基于圖像的背景信息識(shí)別裝置。存儲(chǔ)器505中存儲(chǔ)一組程序代碼,且處理器501調(diào)用存儲(chǔ)器505中存儲(chǔ)的程序代碼,用于執(zhí)行以下操作:

輸入裝置503接收用戶輸入的搜索關(guān)鍵字。

處理器501對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息。

處理器501將搜索關(guān)鍵字與各個(gè)圖片所包含的文字信息進(jìn)行比較,確定與搜索關(guān)鍵字匹配的文字信息所屬的第一圖片。

輸出裝置504顯示第一圖片所包含的文字信息。

在可選實(shí)施例中,處理器501還可以執(zhí)行以下操作:

處理器501在當(dāng)前顯示的網(wǎng)頁(yè)界面中確定需要文字信息識(shí)別的圖片。

處理器501對(duì)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

在可選實(shí)施例中,處理器501在當(dāng)前顯示的網(wǎng)頁(yè)界面中確定需要文字信息識(shí)別的圖片,具體可以為:

輸入裝置503接收用戶對(duì)網(wǎng)頁(yè)界面中的第二圖片提交的文字信息識(shí)別指令。

處理器501將第二圖片確定為需要文字信息識(shí)別的圖片。

在可選實(shí)施例中,處理器501對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別,得到各個(gè)圖片所包含的文字信息,具體可以為:

處理器501調(diào)用預(yù)設(shè)api,并通過預(yù)設(shè)api對(duì)各個(gè)圖片進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

在可選實(shí)施例中,處理器501對(duì)網(wǎng)頁(yè)界面中的各個(gè)圖片進(jìn)行文字信息識(shí)別, 得到各個(gè)圖片所包含的文字信息,具體可以為:

處理器501對(duì)各個(gè)圖片進(jìn)行格式轉(zhuǎn)換,得到圖片流。

處理器501通過文字信息識(shí)別驅(qū)動(dòng)對(duì)圖片流進(jìn)行文字信息識(shí)別,得到圖片所包含的文字信息。

具體的,本發(fā)明實(shí)施例中介紹的終端可以用以實(shí)施本發(fā)明結(jié)合圖3介紹的方法實(shí)施例中的部分或全部流程。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存儲(chǔ)記憶體(randomaccessmemory,ram)等。

以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
鄢陵县| 株洲县| 图们市| 十堰市| 邯郸县| 枞阳县| 蒙阴县| 新田县| 西青区| 中山市| 河池市| 皮山县| 措勤县| 普格县| 永新县| 桓台县| 武定县| 芜湖市| 溆浦县| 利川市| 西青区| 富平县| 简阳市| 福海县| 石景山区| 二手房| 临泽县| 宜宾市| 稻城县| 交口县| 墨脱县| 墨玉县| 铁力市| 花莲市| 综艺| 阜康市| 中卫市| 镇坪县| 长武县| 凤凰县| 子长县|