專利名稱:識別方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通過便攜式電子設(shè)備實(shí)現(xiàn)的計(jì)算機(jī)視覺系統(tǒng),尤其涉及用于減少計(jì)算機(jī)視覺系統(tǒng)的復(fù)雜性和應(yīng)用相關(guān)計(jì)算機(jī)視覺應(yīng)用系統(tǒng)的識別方法和識別裝置。
背景技術(shù):
根據(jù)相關(guān)現(xiàn)有技術(shù),配備了觸摸屏的便攜式電子設(shè)備(例如,多功能手機(jī)、個(gè)人數(shù)字助理(PDA)、平板電腦等)可以用于顯示供終端用戶閱讀的文件或消息。在某些情況下,終端用戶需要獲得一些信息,并試圖通過在觸摸屏上實(shí)際鍵入一些虛擬鍵/按鈕來請求該信息,這可能會導(dǎo)致一些問題發(fā)生,例如,終端用戶通常必須使用一只手來握持該便攜式電子設(shè)備,并用另一只手來控制該便攜式電子設(shè)備以滿足上述情況。然,當(dāng)該終端用戶需要該另一只手來做其他的事情時(shí),就會造成不便。在另一個(gè)例子中,由于不容易在短時(shí)間內(nèi)完成在觸摸屏上實(shí)際鍵入該些虛擬鍵/按鈕的操作,使得該終端用戶可能會被迫浪費(fèi)時(shí)間。在又一個(gè)例子中,假設(shè)終端用戶不熟悉外語,當(dāng)終端用戶進(jìn)入一家餐廳并想要點(diǎn)食物的時(shí)候,由于菜單是采用上面提到的不熟悉的外語來寫(或打印)的,終端用戶可能會發(fā)現(xiàn)他/她讀 不懂。此時(shí),因?yàn)椴皇煜ど鲜龅耐庹Z,要終端用戶能夠?qū)⒉藛蔚囊恍┰~輸入到便攜式電子設(shè)備中似乎不大可能。由于上述的相關(guān)翻譯操作對于便攜式電子設(shè)備來說過于復(fù)雜,因此需要具有很高計(jì)算速度(而不是便攜式電子設(shè)備)的個(gè)人電腦來識別和翻譯菜單上的所有詞。此外,強(qiáng)行使用便攜式電子設(shè)備以執(zhí)行相關(guān)的操作,可能會導(dǎo)致低識別率,從而導(dǎo)致翻譯錯(cuò)誤??傊?,現(xiàn)有的技術(shù)不能很好地為終端用戶服務(wù)。因此,需要一種新的方法來加強(qiáng)便攜式電子設(shè)備的信息訪問控制。
發(fā)明內(nèi)容
有鑒于此,需要一種識別方法及識別裝置,以解決上述技術(shù)問題。本發(fā)明提供一種識別方法,該識別方法包括獲得一指令信息,該指令信息用于一計(jì)算機(jī)視覺應(yīng)用;獲得一圖像數(shù)據(jù),以及根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域;輸出該至少一個(gè)識別區(qū)域的識別結(jié)果;以及根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫,以實(shí)現(xiàn)該計(jì)算機(jī)視覺應(yīng)用。本發(fā)明還提供一種識別裝置,包括指令信息產(chǎn)生器,用于獲得一指令信息,其中該指令信息用于一計(jì)算機(jī)視覺應(yīng)用;處理電路,用于獲得一圖像數(shù)據(jù),以及根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域,其中該處理電路進(jìn)一步用于輸出該至少一個(gè)識別區(qū)域的識別結(jié)果;以及數(shù)據(jù)庫管理模塊,根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫,以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。本發(fā)明一個(gè)有益效果在于該識別方法和識別裝置能夠允許用戶通過確定考慮中的圖像上的識別區(qū)域,來自由控制該便攜式電子設(shè)備,從而能夠減少應(yīng)用計(jì)算機(jī)視覺系統(tǒng)的復(fù)雜性。由此,用戶可以快速訪問所需的信息,從而解決現(xiàn)有技術(shù)中出現(xiàn)的問題。
圖I是本發(fā)明一實(shí)施例的識別裝置的示意圖;圖2是本發(fā)明一實(shí)施例的識別方法的流程圖;圖3顯示圖I的裝置和涉及到圖2的方法的一些示例性的識別區(qū)域;圖4顯示本發(fā)明一實(shí)施例的涉及到圖2的方法的一些示例性的識別區(qū)域;圖5顯示本發(fā)明另一實(shí)施例的涉及到圖2的方法的一示例性的識別區(qū)域; 圖6顯示本發(fā)明又一實(shí)施例的涉及到圖2的方法的一示例性的識別區(qū)域;以及圖7顯示本發(fā)明又一實(shí)施例的涉及到圖2的方法的一示例性的識別區(qū)域;圖8顯示本發(fā)明再一實(shí)施例的涉及到圖2的方法的一示例性的識別區(qū)域。
具體實(shí)施例方式在本說明書以及權(quán)利要求書當(dāng)中使用了某些詞匯來指代特定的組件。本領(lǐng)域的技術(shù)人員應(yīng)可理解,硬件制造商可能會用不同的名詞來稱呼同樣的組件。本說明書及權(quán)利要求并不以名稱的差異作為區(qū)分組件的方式,而是以組件在功能上的差異作為區(qū)分的準(zhǔn)則。在通篇說明書及權(quán)利要求當(dāng)中所提及的“包含”是一個(gè)開放式之用語,因此應(yīng)解釋成“包含但不限定于”。另外,“耦接”一詞在此包含任何直接及間接的電氣連接手段。因此,若文中描述第一裝置耦接于第二裝置,則代表第一裝置可以直接電氣連接于第二裝置,或通過其它裝置或連接手段間接地電氣連接至第二裝置。請參考圖1,其顯示本發(fā)明第一實(shí)施例的用于減少計(jì)算機(jī)視覺系統(tǒng)的復(fù)雜性和應(yīng)用相關(guān)計(jì)算機(jī)視覺應(yīng)用的識別裝置100的示意圖。其中,該識別裝置100包括該計(jì)算機(jī)視覺系統(tǒng)的至少一個(gè)部分(如部分或全部)。如圖I所示,識別裝置100包括一指令信息產(chǎn)生器110、一處理電路120、一數(shù)據(jù)庫管理模塊130、一存儲器140和一通信模塊180。該處理電路120包括一校正模塊120C,該存儲器140包括一本地?cái)?shù)據(jù)庫140D。根據(jù)不同實(shí)施例(例如第一實(shí)施例或一些其他變化實(shí)施例),識別裝置100可包括一電子設(shè)備(如便攜式電子設(shè)備)的至少一部分(例如部分或全部),其中上述的計(jì)算機(jī)視覺系統(tǒng)可以是整個(gè)所述電子設(shè)備(如便攜式電子設(shè)備)。例如,識別裝置100可包括上面提到的電子設(shè)備的一部分,特別是,識別裝置100可以是電子設(shè)備內(nèi)的一控制電路(例如集成電路(1C))。在另一個(gè)例子中,該識別裝置100可以是整個(gè)上述的電子設(shè)備。在又一個(gè)例子中,該識別裝置100可以是包括上面提到的電子設(shè)備的一個(gè)音頻/視頻系統(tǒng)。該電子設(shè)備的例子可包括(但不局限于)手機(jī)(例如一多功能手機(jī))、個(gè)人數(shù)字助理(PDA)、便攜式電子設(shè)備(如平板電腦(基于廣義的定義))、以及個(gè)人電腦(例如平板個(gè)人電腦,也可簡稱為平板電腦)、筆記本電腦或者臺式電腦。本實(shí)施例中,該指令信息產(chǎn)生器110用于獲得指令信息,該指令信息被計(jì)算機(jī)視覺應(yīng)用采用。此外,該處理電路120用于控制該電子設(shè)備(如便攜式電子設(shè)備)的操作。更特別的,該處理電路120用于從一相機(jī)模塊(未顯示)獲得圖像數(shù)據(jù),并通過在觸摸感應(yīng)顯示器(如觸摸屏,圖I未示)上輸入的用戶手勢來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域(如一個(gè)或多個(gè)識別區(qū)域)。該處理電路120進(jìn)一步用于輸出對應(yīng)于上述的至少一個(gè)識別區(qū)域的識別結(jié)果。此外,該校正模塊120C用于通過提供用戶界面,以允許用戶在觸摸感應(yīng)顯示器(如觸摸屏)上添加手勢輸入而更改識別結(jié)果,從而選擇性地對識別結(jié)果進(jìn)行校正。本實(shí)施例中,該數(shù)據(jù)庫管理模塊130用于根據(jù)識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫。特別的,該數(shù)據(jù)庫管理模塊130可以管理本地或互聯(lián)網(wǎng)數(shù)據(jù)庫訪問,以執(zhí)行計(jì)算機(jī)視覺應(yīng)用。例如,在一種情況下,該數(shù)據(jù)庫管理模塊130自動判斷利用一互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)以執(zhí)行計(jì)算機(jī)視覺應(yīng)用,該數(shù)據(jù)庫管理模塊130將該計(jì)算機(jī)視覺應(yīng)用的結(jié)果暫時(shí)存儲到一本地?cái)?shù)據(jù)庫中,以供后續(xù)使用。在本實(shí)施例中,該存儲器140用于存儲臨時(shí)信息,且該本地?cái)?shù)據(jù)庫140D可以作為上述的本地?cái)?shù)據(jù)庫的一個(gè)例子。在實(shí)際應(yīng)用中,存儲器140可以是內(nèi)存(例如易失性內(nèi)存(如隨機(jī)存取存儲器(RAM)),或非易失性內(nèi)存(如閃存內(nèi)存)),或者可以是一個(gè)硬盤驅(qū)動器(HDD)。此外,根據(jù)計(jì)算機(jī)視覺系統(tǒng)的電源管理信息,該數(shù)據(jù)庫管理模塊130可以自動判斷是利用該本地?cái)?shù)據(jù)庫140D或是上述的互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器),以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。此外,該通信模塊180被用來通過互聯(lián)網(wǎng)發(fā)送或接收信息以進(jìn)行通信。根據(jù)圖I所示的架構(gòu),該數(shù)據(jù)庫管理模塊130能夠選擇性獲得來自上述互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)或來自該本地?cái)?shù)據(jù)庫140D的一個(gè)或多個(gè)查找結(jié)果,以完成執(zhí)行對應(yīng)于從指令信息產(chǎn)生器110獲得的指令信息的該計(jì)算機(jī)視覺應(yīng)用。圖2為用于減少計(jì)算機(jī)視覺系統(tǒng)的復(fù)雜性和應(yīng)用相關(guān)計(jì)算機(jī)視覺應(yīng)用的識別方法200的流程圖。圖2所示的識別方法200可應(yīng)用于圖I所示的識別裝置100。該方法詳 細(xì)描述如下。在步驟210中,該指令信息產(chǎn)生器110獲得如上所述的指令信息,其中該指令信息被利用于該計(jì)算機(jī)視覺應(yīng)用。例如,該指令信息產(chǎn)生器110可包括一全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS)接收機(jī)(如全球定位系統(tǒng)(GPS)接收器),且從該GNSS接收機(jī)獲得該指令信息的至少一部分。其中,該指令信息可包括該識別裝置100的位置信息。在另一個(gè)例子中,指令信息產(chǎn)生器110可包括一音頻輸入模塊,且指令信息的至少一部分(如部分或全部)是從該音頻輸入模塊獲得。該指令信息可包括該識別裝置100通過該音頻輸入模塊從該用戶接收的一個(gè)音頻指令。在另一個(gè)例子中,該指令信息產(chǎn)生器110可包括上述觸摸感應(yīng)顯示器,如上面提到的觸摸屏,且該指令信息的至少一部分(如部分或全部)是從該觸摸屏獲得的,其中,該指令信息可包括識別裝置100通過該音頻輸入模塊從該用戶接收的一個(gè)指令。計(jì)算機(jī)視覺應(yīng)用的類型(例如,查找的特定類型)可能會基于不同的應(yīng)用而有所不同。具體的,計(jì)算機(jī)視覺應(yīng)用的類型可以由用戶確定,或由該識別裝置100(更具體的,該處理電路120)自動確定。例如,該計(jì)算機(jī)視覺應(yīng)用可以用于翻譯。在另一個(gè)例子中,該計(jì)算機(jī)視覺應(yīng)用可以是匯率換算(更具體地說,不同貨幣之間的匯率換算)。在另一個(gè)例子中,該計(jì)算機(jī)視覺應(yīng)用可以是最優(yōu)惠價(jià)格搜索(更特別的,用于尋找相同產(chǎn)品的最優(yōu)惠價(jià)格的搜索)。在又一個(gè)例子中,該計(jì)算機(jī)視覺應(yīng)用可以是信息搜索。在再一個(gè)例子中,該計(jì)算機(jī)視覺應(yīng)用可以用于瀏覽地圖。在另一個(gè)例子中,該計(jì)算機(jī)視覺應(yīng)用可以用于搜索視頻預(yù)告片。在步驟220中,該處理電路120可以從相機(jī)模塊上獲得如上面提到的圖像數(shù)據(jù),并通過在觸摸感應(yīng)顯示器(如觸摸屏)上輸入的用戶手勢來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域(如一個(gè)或多個(gè)識別區(qū)域)。例如,用戶可以一次或多次觸碰該觸摸感應(yīng)顯示器(如觸摸屏),更特別的,觸摸該觸摸感應(yīng)顯示器(如觸摸屏)上顯示的圖像的一個(gè)或多個(gè)部分,以定義上述至少一個(gè)識別區(qū)域(如一個(gè)或多個(gè)識別區(qū)域)作為該圖像的一個(gè)或多個(gè)部分。因此,上述至少一個(gè)識別區(qū)域(如一個(gè)或多個(gè)識別區(qū)域)可以由用戶任意確定。關(guān)于涉及到上述至少一個(gè)識別區(qū)域的識別(更特別的是,基于處理電路120執(zhí)行的識別),其可能會根據(jù)不同的應(yīng)用而有所不同,該識別類型可以由用戶決定或由該識別裝置100 (更特別的是,該處理電路120)自動確定。例如,該處理電路120可以在對應(yīng)于該圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行文本文字識別,以產(chǎn)生識別結(jié)果,其中,該識別結(jié)果是一個(gè)目標(biāo)圖像上的文字的文本識別結(jié)果。在另一個(gè)例子中,處理電路120可以在對應(yīng)于圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行對象識別操作,以生成識別結(jié)果,其中,該識別結(jié)果是代表一個(gè)對象的文本字符串。此僅供參考,并非是對本發(fā)明的限制。根據(jù)一些變化的實(shí)施例,在一般情況下,識別結(jié)果可包括至少一個(gè)字符串、至少一個(gè)字符、和/或至少一個(gè)數(shù)字。步驟230中,處理電路120將該至少一個(gè)識別區(qū)域的識別結(jié)果輸出到上述的觸摸感應(yīng)顯示器(如觸摸屏)。因此,用戶可以判斷該識別結(jié)果是否正確,并能通過輸入新增用戶手勢到該觸摸感應(yīng)顯示器(如觸摸屏)上而選擇性地改變該識別結(jié)果。例如,在用戶已確認(rèn)識別結(jié)果的情況下,該校正模塊120C利用確認(rèn)過的識別結(jié)果來作為識別區(qū)域的代表信息。另一個(gè)例子是,在用戶直接寫入代表該識別區(qū)域的對象的一文本字符串的情況下,該校正模塊120C執(zhí)行再識別(如步驟220),以獲得改變的識別結(jié)果,并利用改變的識別結(jié)果作為識別區(qū)域的代表信息。
在步驟240中,數(shù)據(jù)庫管理模塊130根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫(如上面提到的)。更特別的是,數(shù)據(jù)庫管理模塊130可以管理本地或互聯(lián)網(wǎng)數(shù)據(jù)庫訪問以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。根據(jù)圖I所示的架構(gòu),數(shù)據(jù)庫管理模塊130選擇性地從上述互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)或從本地?cái)?shù)據(jù)庫140D獲得一個(gè)或多個(gè)查找結(jié)果。在實(shí)際應(yīng)用中,該數(shù)據(jù)庫管理模塊130可以默認(rèn)從上述互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)獲得一個(gè)或多個(gè)查找結(jié)果,并在互聯(lián)網(wǎng)訪問是不可用的情況下,數(shù)據(jù)庫管理模塊130嘗試從本地?cái)?shù)據(jù)庫140D獲得該一個(gè)或多個(gè)查找結(jié)果。在步驟250中,處理電路120決定是否繼續(xù)。例如,處理電路120可以默認(rèn)決定繼續(xù),且在用戶觸碰停止圖標(biāo)的情況下,處理電路120再決定停止由步驟220、步驟230、步驟240以及步驟250形成的循環(huán)流程的重復(fù)操作。當(dāng)決定繼續(xù)時(shí),步驟220重新進(jìn)入,否則,如圖2所示,工作流程結(jié)束。在本實(shí)施例中,處理電路120可提供一用戶界面,該用戶界面允許用戶通過在上述觸摸感應(yīng)顯示器(如觸摸屏)上添加手勢輸入來改變該識別結(jié)果。且該處理電路120可以通過儲存校正信息來執(zhí)行學(xué)習(xí)(learning)操作,該校正信息對應(yīng)于該識別結(jié)果和該改變的識別結(jié)果之間的映射關(guān)系,以進(jìn)一步使用識別結(jié)果的自動校正。更特別的,校正的信息可以用來將識別結(jié)果映射到改變的識別結(jié)果,且該校正模塊120C可以利用該校正的信息來執(zhí)行識別結(jié)果自動校正。這里僅供參考,并不意味著是對本發(fā)明的限制。根據(jù)一些變化的實(shí)施例,該處理電路120提供該用戶界面并進(jìn)行文本識別,該用戶界面允許用戶通過在上述的觸摸感應(yīng)顯示器(如觸摸屏)上添加手勢輸入而直接寫入代表識別對象的文本字符串。如前所述,該數(shù)據(jù)庫管理模塊130可以默認(rèn)從上述互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)獲得一個(gè)或多個(gè)查找結(jié)果,并在互聯(lián)網(wǎng)訪問是不可用的情況下,數(shù)據(jù)庫管理模塊130嘗試從本地?cái)?shù)據(jù)庫140D獲得該一個(gè)或多個(gè)查找結(jié)果。這僅供參考,并不意味著是對本發(fā)明的限制。根據(jù)一些變化實(shí)施例,數(shù)據(jù)庫管理模塊130可以自動判斷是利用本地?cái)?shù)據(jù)庫140D還是互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)以執(zhí)行計(jì)算機(jī)視覺應(yīng)用。更特別的是,根據(jù)計(jì)算機(jī)視覺系統(tǒng)的電源管理信息(在本實(shí)施例中,例如該電子設(shè)備(如該便攜式電子設(shè)備)),數(shù)據(jù)庫管理模塊130自動確定利用本地?cái)?shù)據(jù)庫140D或互聯(lián)網(wǎng)上的服務(wù)器(例如,云服務(wù)器)進(jìn)行查找。實(shí)際應(yīng)用中,在數(shù)據(jù)庫管理模塊130自動確定利用互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)以執(zhí)行查找的情況下,數(shù)據(jù)庫管理模塊130從互聯(lián)網(wǎng)上的服務(wù)器(例如云服務(wù)器)上獲得該查找結(jié)果,然后將該查找結(jié)果暫時(shí)存儲到本地?cái)?shù)據(jù)庫140D,為后續(xù)查找使用。類似變化實(shí)施例的細(xì)節(jié)將不再贅述。圖3顯示圖I的識別裝置100以及涉及到圖2的識別方法200的識別區(qū)域50。在本實(shí)施例中,該識別裝置100是手機(jī),更特別的,是一個(gè)多功能手機(jī)。根據(jù)本實(shí)施例,該識別裝置100的相機(jī)模塊(未顯示)設(shè)置在該識別裝置100的背面。此外,觸摸屏150作為第一實(shí)施例所述的觸摸屏,該觸摸屏150安裝在識別裝置100內(nèi),且可以用于顯示多個(gè)預(yù)覽圖像或拍攝到的圖像。在實(shí)際應(yīng)用中,相機(jī)模塊可以用于執(zhí)行預(yù)覽操作,以生成預(yù)覽圖像的圖像數(shù)據(jù),以顯示在觸摸屏150上,或者可以用于執(zhí)行拍攝操作以生成其中一個(gè)拍攝到的圖像的數(shù)據(jù)?;谧R別方法200的輔助,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)圖3所示的觸摸屏150上顯示的圖像的一個(gè)或多個(gè)區(qū)域(如本實(shí)施例中的識別區(qū)域50)時(shí),處理電路120可立即輸出查找結(jié)果(例如文本識別結(jié)果的翻譯)到觸摸屏150,以顯示該查找結(jié) 果。因此,用戶可以立即了解考慮中的目標(biāo),從而沒有必要在觸摸屏150上實(shí)際鍵入一些虛擬鍵/按鈕。類似實(shí)施例的細(xì)節(jié)描述將不再贅述。圖4為本發(fā)明實(shí)施例提供的涉及到圖2所示的識別方法200的識別區(qū)域50。本實(shí)施例中,識別區(qū)域50包括顯示在圖3所示的觸摸屏150上的菜單圖像400 (請參閱圖4)的一部分。其中,該菜單圖像400所代表的菜單包括一特定語言的文本。根據(jù)在步驟220中提到的用戶手勢輸入,處理電路120定義上述的至少一個(gè)識別區(qū)域(如圖4所示的菜單圖像400內(nèi)的識別區(qū)域50),也就是將該識別區(qū)域50定義為至少一個(gè)斷句區(qū)域(make pause),從而為文本識別操作提供斷句區(qū)域,每個(gè)斷句區(qū)域?qū)?yīng)所述文本數(shù)據(jù)的一部分。本實(shí)施例中,將“DEDESAYUN0” (圖4中的“50”)分別定義成“DE”和“DESAYUN0”兩個(gè)斷句區(qū)域。由此,可以幫助縮小文本識別范圍,提高識別率。假設(shè)用戶不熟悉該特定語言,則本實(shí)施例中的計(jì)算機(jī)視覺應(yīng)用可以用于翻譯。在識別方法200的操作的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)圖4所示的菜單圖像400上的識別區(qū)域50時(shí),處理電路120能立即輸出該查找結(jié)果(例如,字詞的翻譯分別在識別區(qū)域50內(nèi))到該觸摸屏150,以顯示該查找(翻譯)結(jié)果。因此,用戶可以立即了解正在考慮的字詞,從而沒有必要在觸摸屏150上實(shí)際鍵入一些虛擬鍵/按鈕。類似描述的細(xì)節(jié)將不再贅述。圖5為本發(fā)明實(shí)施例提供的涉及到圖2所示的識別方法200的識別區(qū)域50。在本實(shí)施例中,該識別區(qū)域50包括顯示在圖3所示的觸摸屏150上的對象。根據(jù)步驟220中提到的用戶手勢輸入,處理電路120定義上述的至少一個(gè)識別區(qū)域(如圖5所示的對象圖像500內(nèi)的識別區(qū)域50),從而為對象識別操作確定對象輪廓。因此,處理電路120可以對正在考慮的對象(在本實(shí)施例中,如識別區(qū)域50表示的圓柱體)執(zhí)行對象識別操作。例如,在操作識別方法200的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)識別區(qū)域50時(shí),處理電路120可以立即輸出該查找結(jié)果到該觸摸屏150,以顯示該查找結(jié)果。因此,用戶可以立即讀取對應(yīng)到所考慮的對象的查找結(jié)果,例如詞、短語或句子(例如對應(yīng)的外語單詞,或與對象相關(guān)聯(lián)的短語或句子)。在另一個(gè)例子中,在識別方法200的操作的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)識別區(qū)域50時(shí),處理電路120可以立即輸出該查找結(jié)果到該音頻輸出模塊,以回放該查找結(jié)果。因此,用戶可以立即聽到對應(yīng)到所考慮的對象的查找結(jié)果,例如詞、短語或句子(例如對應(yīng)的外語單詞,或與對象相關(guān)聯(lián)的短語或句子)。類似實(shí)施例的細(xì)節(jié)將不再贅述。圖6為本發(fā)明另一實(shí)施例提供的涉及到圖2所示的識別方法200的識別區(qū)域50。其中該識別區(qū)域50包括顯示在圖3所示的觸摸屏150上的人臉圖像。根據(jù)在步驟220中提到的用戶手勢輸入,處理電路120定義上述至少一個(gè)識別區(qū)域(如圖6的照片圖像600內(nèi)的識別區(qū)域50),也就是在該識別區(qū)域中定義至少一對象輪廓,從而為對象識別操作確定對象的輪廓。因此,處理電路120可以對正在考慮的對象(本實(shí)施例中,如識別區(qū)域50表示的人臉)執(zhí)行對象識別操作。在識別方法200的操作的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)識別區(qū)域50時(shí),處理電路120可以立即輸出該查找結(jié)果到該觸摸屏150,以顯示該查找結(jié)果。因此,用戶可以立即讀取對應(yīng)到所考慮的人臉的查找結(jié)果,包括詞、短語或句子(例如,名字、電話號碼、喜歡的食物、喜歡的歌或人臉在該識別區(qū)域50內(nèi)的人的問候)。在另一個(gè)例子中,在識別方法200的操作的輔助下,當(dāng)用戶定義(更特別的,使用他 /她的手指滑動)識別區(qū)域50時(shí),處理電路120可以立即輸出該查找結(jié)果到該音頻輸出模塊,以回放該查找結(jié)果。因此,用戶可以立即聽到對應(yīng)到所考慮的對象的查找結(jié)果,包括詞、短語或句子(例如名字、電話號碼、喜歡的食物、喜歡的歌或人臉在該識別區(qū)域50內(nèi)的人的問候)。類似實(shí)施例的細(xì)節(jié)將不再贅述。圖7為本發(fā)明實(shí)施例提供的涉及到圖2所示的識別方法200的識別區(qū)域50。該識別區(qū)域50包括顯示在圖3的觸摸屏上的一標(biāo)簽圖像的一部分。在圖7所示的圖像中,包括有一些產(chǎn)品510、520以及與其相關(guān)聯(lián)的標(biāo)簽515和525。例如,本實(shí)施例中,被考慮的標(biāo)簽可以是標(biāo)簽515,其中本實(shí)施例中的識別區(qū)域50可以是標(biāo)簽515的部分圖像。假設(shè)用戶不熟悉不同貨幣之間的匯率轉(zhuǎn)換,以及不能確定產(chǎn)品510關(guān)于用戶所在國的貨幣的價(jià)格,則本實(shí)施例的計(jì)算機(jī)視覺應(yīng)用可以對不同貨幣進(jìn)行匯率轉(zhuǎn)換。在識別方法200的操作的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)本實(shí)施例中的識別區(qū)域50時(shí),處理電路120立即輸出該查找結(jié)果到該觸摸屏150,以顯示該查找結(jié)果。在本實(shí)施例中,該查找結(jié)果可以是識別區(qū)域50中的價(jià)格的匯率轉(zhuǎn)換結(jié)果。更特別的,查找結(jié)果可以是關(guān)于用戶所在國家的貨幣的價(jià)格。因此,用戶可以立即知道產(chǎn)品510需要花多少他/她所在國家的貨幣,而沒有必要到觸摸屏150上實(shí)際鍵入一些虛擬鍵/按鈕。類似實(shí)施例的細(xì)節(jié)將不再贅述。圖8為本發(fā)明另一實(shí)施例提供的涉及到圖2所示的識別方法200的識別區(qū)域50,該識別區(qū)域50包括顯示在圖3的觸摸屏上的一標(biāo)簽圖像的一部分。在圖8所示的圖像中,包括一些產(chǎn)品510、520以及與其相關(guān)聯(lián)的標(biāo)簽515和525。例如,本實(shí)施例中,被考慮的標(biāo)簽可以是標(biāo)簽515,其中本實(shí)施例中的識別區(qū)域50可以是標(biāo)簽515的部分圖像。假設(shè)用戶不熟悉分別在不同百貨商店的相同產(chǎn)品510的價(jià)格,則本實(shí)施例的計(jì)算機(jī)視覺應(yīng)用可以搜索最優(yōu)惠價(jià)格。在操作識別方法200的輔助下,當(dāng)用戶定義(更特別的,使用他/她的手指滑動)本實(shí)施例中的識別區(qū)域50時(shí),處理電路120立即輸出該查找結(jié)果到該觸摸屏150,以顯示該查找結(jié)果。在本實(shí)施例中,該查找結(jié)果可以是特定商店(如用戶所停留的商店,或其他商店)的相同商品510的最優(yōu)惠價(jià)格及其相關(guān)聯(lián)信息(例如,特定商店的名稱、地點(diǎn)、和/或電話號碼),或是在多個(gè)商店內(nèi)的相同產(chǎn)品的最優(yōu)惠價(jià)格及其相關(guān)信息(例如,該多個(gè)商店的名稱、地點(diǎn)、和/或電話號碼)。因此,用戶可以立即知道標(biāo)簽515上的價(jià)格是否是最優(yōu)惠的價(jià)格,而沒有必要到觸摸屏150上實(shí)際鍵入一些虛擬鍵/按鈕。類似實(shí)施例的細(xì)節(jié)將不再贅述。本發(fā)明一個(gè)有益效果在于該識別方法和識別裝置能夠允許用戶通過確定考慮中的圖像上的識別區(qū)域,來自由控制該便攜式電子設(shè)備。因此,用戶可以快速訪問所需的信 息,而不引入任何現(xiàn)有技術(shù)存在的問題。雖然本發(fā)明已以較佳實(shí)施方式揭露如上,然其并非用以限定本發(fā)明,任何所屬技術(shù)領(lǐng)域中的技術(shù)人員,在不脫離本發(fā)明的范圍內(nèi),可以做一些改動,因此本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求所界定的范圍為準(zhǔn)。
權(quán)利要求
1.一種識別方法,該識別方法包括 獲得一指令信息,該指令信息用于一計(jì)算機(jī)視覺應(yīng)用; 獲得一圖像數(shù)據(jù),以及根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域; 輸出該至少一個(gè)識別區(qū)域的識別結(jié)果;以及 根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫,以實(shí)現(xiàn)該計(jì)算機(jī)視覺應(yīng)用。
2.如權(quán)利要求I所述的識別方法,其特征在于,該指令信息的至少一部分是從一全球?qū)Ш叫l(wèi)星系統(tǒng)接收機(jī)、一音頻輸入模塊或一觸摸感應(yīng)顯示器獲得的。
3.如權(quán)利要求I所述的識別方法,其特征在于,該計(jì)算機(jī)視覺應(yīng)用用于提供翻譯、匯率轉(zhuǎn)換、最優(yōu)惠價(jià)格搜索、信息搜索、地圖瀏覽和視頻預(yù)告片搜索功能其中之一者。
4.如權(quán)利要求I所述的識別方法,進(jìn)一步包括 在對應(yīng)于該圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行文本文字識別,以產(chǎn)生一文本識別結(jié)果。
5.如權(quán)利要求I所述的識別方法,進(jìn)一步包括 在對應(yīng)于圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行對象識別操作,以生成該識別結(jié)果,該識別結(jié)果是代表一個(gè)對象的文本字符串。
6.如權(quán)利要求I所述的識別方法,其特征在于,所述根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域的步驟包括 當(dāng)所述圖像數(shù)據(jù)為文本數(shù)據(jù)時(shí),將該至少一個(gè)識別區(qū)域定義為至少一個(gè)斷句區(qū)域,每個(gè)斷句區(qū)域?qū)?yīng)所述文本數(shù)據(jù)的一部分。
7.如權(quán)利要求I所述的識別方法,其特征在于,所述根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域的步驟進(jìn)一步包括 在該識別區(qū)域中定義至少一對象輪廓,從而為對象識別操作確定對象輪廓。
8.如權(quán)利要求I所述的識別方法,其特征在于,所述輸出該至少一個(gè)識別區(qū)域的識別結(jié)果的步驟包括 提供一用戶界面,以允許用戶通過在一觸摸感應(yīng)顯示器上添加用戶手勢輸入來改變該識別結(jié)果。
9.如權(quán)利要求8所述的識別方法,其特征在于,所述提供用戶界面以允許用戶通過在觸摸感應(yīng)顯示器上添加用戶手勢輸入來改變該識別結(jié)果的步驟進(jìn)一步包括 在該用戶界面上直接寫入識別文本的識別結(jié)果并進(jìn)行對寫入文本的文本識別。
10.如權(quán)利要求8所述的識別方法,其特征在于,所述提供用戶界面以允許用戶通過在觸摸感應(yīng)顯示器上添加用戶手勢輸入來改變該識別結(jié)果的步驟進(jìn)一步包括 在該用戶界面上直接寫入代表一識別對象的文本字符串并進(jìn)行對寫入文本字符串的文本識別。
11.如權(quán)利要求8所述的識別方法,其特征在于,所述改變該識別結(jié)果的步驟進(jìn)一步包括 通過儲存對應(yīng)于識別結(jié)果和改變的識別結(jié)果之間的映射關(guān)系的校正信息來執(zhí)行一學(xué)習(xí)操作,以進(jìn)一步對該識別結(jié)果進(jìn)行自動校正。
12.如權(quán)利要求I所述的識別方法,其特征在于,所述根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫的步驟進(jìn)一步包括自動判斷利用一本地?cái)?shù)據(jù)庫或是一互聯(lián)網(wǎng)服務(wù)器來執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
13.如權(quán)利要求12所述的識別方法,其特征在于,所述自動判斷利用一本地?cái)?shù)據(jù)庫或是一互聯(lián)網(wǎng)服務(wù)器來執(zhí)行該計(jì)算機(jī)視覺應(yīng)用的步驟進(jìn)一步包括 在自動判斷利用一互聯(lián)網(wǎng)服務(wù)器以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用的情況下,將一計(jì)算機(jī)視覺應(yīng)用結(jié)果暫時(shí)存儲到一本地?cái)?shù)據(jù)庫,以供后續(xù)使用。
14.如權(quán)利要求12所述的識別方法,其特征在于,所述管理本地或互聯(lián)網(wǎng)數(shù)據(jù)庫訪問以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用的步驟進(jìn)一步包括 根據(jù)計(jì)算機(jī)視覺應(yīng)用的電源管理信息,自動確定是利用本地?cái)?shù)據(jù)庫還是互聯(lián)網(wǎng)上的服務(wù)器執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
15.如權(quán)利要求I所述的識別方法,其特征在于,所述根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫的步驟進(jìn)一步包括 根據(jù)對本地或互聯(lián)網(wǎng)數(shù)據(jù)庫訪問的管理來執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
16.一種識別裝置,包括 指令信息產(chǎn)生器,用于獲得一指令信息,其中該指令信息用于一計(jì)算機(jī)視覺應(yīng)用; 處理電路,用于獲得一圖像數(shù)據(jù),以及根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域,其中該處理電路進(jìn)一步用于輸出該至少一個(gè)識別區(qū)域的識別結(jié)果;以及 數(shù)據(jù)庫管理模塊,根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫,以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
17.如權(quán)利要求16所述的識別裝置,其特征在于,該指令信息的至少一部分從一全球?qū)Ш叫l(wèi)星系統(tǒng)接收機(jī)、一音頻輸入模塊或一觸摸感應(yīng)顯示器獲得。
18.如權(quán)利要求16所述的識別裝置,其特征在于,該計(jì)算機(jī)視覺應(yīng)用用于提供翻譯、匯率轉(zhuǎn)換、最優(yōu)惠價(jià)格搜索、信息搜索、地圖瀏覽和視頻預(yù)告片搜索功能其中之一者。
19.如權(quán)利要求16所述的識別裝置,其特征在于,該處理電路在對應(yīng)于該圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行文本文字識別操作,以產(chǎn)生一文本識別結(jié)果。
20.如權(quán)利要求16所述的識別裝置,其特征在于,該處理電路在對應(yīng)于圖像數(shù)據(jù)的識別區(qū)域上執(zhí)行對象識別操作,以生成代表一個(gè)對象的文本字符串的識別結(jié)果。
21.如權(quán)利要求16所述的裝置,其特征在于,當(dāng)所述圖像數(shù)據(jù)為文本數(shù)據(jù)時(shí),該處理電路將該識別區(qū)域定義為至少一個(gè)斷句區(qū)域,每個(gè)斷句區(qū)域?qū)?yīng)所述文本數(shù)據(jù)的一部分。
22.如權(quán)利要求16所述的裝置,其特征在于,該處理電路在該識別區(qū)域中定義至少一對象輪廓,從而為對象識別操作確定對象輪廓。
23.如權(quán)利要求16所述的識別裝置,其特征在于,該處理電路提供一用戶界面,以允許用戶通過在一觸摸感應(yīng)顯示器上添加用戶手勢輸入來改變該識別結(jié)果。
24.如權(quán)利要求23所述的識別裝置,其特征在于,該處理電路提供該用戶界面以允許用戶直接寫入識別文本的識別結(jié)果,或直接寫入代表一識別對象的文本字符串,并進(jìn)一步進(jìn)行文本識別。
25.如權(quán)利要求23所述的識別裝置,其特征在于,該處理電路通過儲存對應(yīng)于識別結(jié)果和改變的識別結(jié)果之間的映射關(guān)系的校正信息來執(zhí)行一學(xué)習(xí)操作,以進(jìn)一步對識別結(jié)果進(jìn)行自動校正。
26.如權(quán)利要求16所述的識別裝置,其特征在于,該數(shù)據(jù)庫管理模塊自動判斷是利用一本地?cái)?shù)據(jù)庫還是利用一互聯(lián)網(wǎng)服務(wù)器來執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
27.如權(quán)利要求26所述的識別裝置,其特征在于,該數(shù)據(jù)庫管理模塊在自動判斷利用一互聯(lián)網(wǎng)服務(wù)器以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用的情況下,將一計(jì)算機(jī)視覺應(yīng)用結(jié)果暫時(shí)存儲到一本地?cái)?shù)據(jù)庫,以供后續(xù)使用。
28.如權(quán)利要求26所述的識別裝置,其特征在于,該數(shù)據(jù)庫管理模塊根據(jù)計(jì)算機(jī)視覺應(yīng)用的電源管理信息,自動確定是利用本地?cái)?shù)據(jù)庫還是互聯(lián)網(wǎng)服務(wù)器執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
29.如權(quán)利要求16所述的裝置,其特征在于,該數(shù)據(jù)庫管理模塊管理本地或互聯(lián)網(wǎng)數(shù)據(jù)庫訪問以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。
全文摘要
一種識別方法,該方法包括下列步驟獲得一指令信息,該指令信息用于一計(jì)算機(jī)視覺應(yīng)用;獲得一圖像數(shù)據(jù),以及根據(jù)一用戶手勢輸入來定義對應(yīng)于該圖像數(shù)據(jù)的至少一個(gè)識別區(qū)域;輸出該至少一個(gè)識別區(qū)域的識別結(jié)果;以及根據(jù)該識別結(jié)果搜索至少一個(gè)數(shù)據(jù)庫,以執(zhí)行該計(jì)算機(jī)視覺應(yīng)用。本發(fā)明還提供一種用于減少計(jì)算機(jī)視覺系統(tǒng)的復(fù)雜性的和應(yīng)用相關(guān)計(jì)算機(jī)視覺應(yīng)用系統(tǒng)的識別裝置。
文檔編號G06F3/0488GK102968266SQ20121026502
公開日2013年3月13日 申請日期2012年7月27日 優(yōu)先權(quán)日2011年8月8日
發(fā)明者何鎮(zhèn)在, 陳鼎勻, 朱啟誠 申請人:聯(lián)發(fā)科技股份有限公司