圖像處理裝置、圖像處理方法和程序的制作方法

文檔序號：6496585閱讀：188來源：國知局

圖像處理裝置、圖像處理方法和程序的制作方法
【專利摘要】一種信息處理系統(tǒng)：獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
【專利說明】圖像處理裝置、圖像處理方法和程序
【技術領域】
[0001]本公開涉及圖像處理裝置、圖像處理方法和程序。
【背景技術】
[0002]近年來，對通過將附加信息疊加在真實世界上來向用戶呈現(xiàn)這類信息的被稱為增強現(xiàn)實(AR)的技術已經(jīng)得到關注。由AR技術呈現(xiàn)給用戶的信息可以使用諸如文本、圖標和動畫的各種形態(tài)的虛擬對象來可視化。
[0003]JP2011-081557A是與顯示AR對象有關的文檔的一個例子。在引用公開文獻所公開的技術中，AR對象在與真實世界中存在的真實對象相關聯(lián)的位置處顯示。
[0004]引文列表
[0005]專利文獻
[0006]PTLl JP2011-081557A

【發(fā)明內容】

[0007]技術問題
[0008]在許多AR應用中，基于使用輸入圖像的圖像識別來選擇和布置AR對象。這意味著輸入圖像的合成(其取決于視角、縮放位置和相機朝向等)影響AR應用的有效操作。因此，如果能夠在用戶調整輸入圖像合成的同時執(zhí)行圖像識別，將變得能夠以更高的可靠性向用戶提供有用信息。
[0009]問題的解決方案
[0010]一種信息處理系統(tǒng):獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0011]一種由信息處理系統(tǒng)執(zhí)行的信息處理方法，所述方法包括:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0012]一種包括計算機程序指令的非暫態(tài)計算機可讀介質，所述計算機程序指令在由信息處理系統(tǒng)執(zhí)行時使得所述信息處理系統(tǒng)執(zhí)行一種方法，所述方法包括:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0013]根據(jù)上述實施例，使得AR應用能夠更為可靠地向用戶提供有用信息。
【專利附圖】

【附圖說明】[0014]圖1是用于說明根據(jù)本公開一個實施例的圖像處理裝置的概要的圖示。
[0015]圖2是示出了根據(jù)同一實施例的圖像處理裝置的硬件配置的一個例子的框圖。
[0016]圖3是示出了根據(jù)同一實施例的信息處理裝置的邏輯功能配置的一個例子的框圖。
[0017]圖4A是用于說明輸入圖像中出現(xiàn)的對象的第一例的圖示。
[0018]圖4B是用于說明與圖4A所示對象相對應的模板的一個例子的圖示。
[0019]圖5A是用于說明輸入圖像中出現(xiàn)的對象的第二例的圖示。
[0020]圖5B是用于說明與圖5A所不對象相對應的模板的一個例子的圖不。
[0021]圖6A是用于說明輸入圖像中出現(xiàn)的對象的第三例的圖示。
[0022]圖6B是用于說明與圖6A所示對象相對應的模板的一個例子的圖示。
[0023]圖7是用于說明根據(jù)同一實施例的顯示識別結果的第一例的圖示。
[0024]圖8A是用于說明根據(jù)同一實施例的顯示識別結果的第二例的圖示。
[0025]圖SB是用于說明根據(jù)同一實施例的顯示識別結果的第三例的圖示。
[0026]圖9是用于說明根據(jù)同一實施例的顯示識別結果的第四例的圖示。
[0027]圖10是用于說明根據(jù)同一實施例的顯示識別結果的第五例的圖示。
[0028]圖11是用于說明根據(jù)同一實施例的能被顯示的相關信息的第一例的圖示。
[0029]圖12是用于說明根據(jù)同一實施例的能被顯示的相關信息的第二例的圖示。
[0030]圖13是用于說明根據(jù)同一實施例的能被顯示的相關信息的第三例的圖示。
[0031]圖14是示出了根據(jù)同一實施例的圖像處理流程的一個例子的流程圖。
[0032]圖15是示出了圖14所示字段識別處理的詳細流程的一個例子的流程圖。
【具體實施方式】
[0033]其后，將參考附圖詳細描述本公開的優(yōu)選實施例。注意到，在本說明書和附圖中，具有基本相同功能和結構的結構性元件由相同的參考編號所指示，并由此省略對這些結構性元件的重復解釋。
[0034]隨后的描述以如下所示的次序給出。
[0035]1.概要
[0036]2.根據(jù)本公開實施例的圖像處理裝置的示例性配置
[0037]2-1.硬件配置
[0038]2-2.功能配置
[0039]2-3.處理流程
[0040]3.結論
[0041]1.概要
[0042]圖1是用于說明本公開實施例的概要的圖示。圖1示出了由真實世界I中的用戶攜帶的圖像處理裝置100。
[0043]圖像處理裝置100是一種在屏幕上顯示通過對真實世界進行圖像拾取而產(chǎn)生的圖像的裝置。圖像處理裝置100可以是諸如智能電話、PDA (個人數(shù)字助理)、PND (便攜式導航設備)、游戲控制臺或便攜式音樂播放器的終端裝置，或者可以是諸如PC (個人計算機)或工作站的信息處理裝置。[0044]真實世界I是其中可以使用圖像處理裝置100的空間的一個例子。真實對象IOa和IOb存在于該真實世界I中。真實對象IOa是提供導航信息的真實對象。作為示例，真實對象IOa可以是用于在車站顯示列車換乘的布告牌、用于交通或路線信息的路邊布告板、或是商業(yè)設施內用作店鋪導覽的海報。真實對象IOb是顯示圖像IOc的信息機器。作為示例，真實對象IOb可以是數(shù)字標記監(jiān)視器、PC (個人計算機)、智能電話或電視機。圖像IOc是向用戶提供某類信息的被顯示對象。
[0045]在本實施例中，由真實對象IOa提供的導航信息被可視化以具有與同類導航信息共有的可視結構。作為一例，在外觀上，在A車站、B車站和C車站設置的布告板將會具有共同的結構。由此，只是由這些布告板顯示的信息內容將會是不同的。圖1所示的圖像處理裝置100使用隨后描述的模版來識別真實對象IOa的結構并標識該真實對象10a。以相同方式，由真實對象IOb顯示的圖像IOc被可視化以具有與同類導航信息共有的可視結構。作為一例，在外觀上，在網(wǎng)站上提供餐廳信息的各單獨餐廳的網(wǎng)頁將會具有共同的結構。由此，只是由這些單獨網(wǎng)頁提供的信息內容將會是不同的。圖1所示的圖像處理裝置100使用隨后描述的模板來識別這類圖像IOc的結構以標識圖像10c。圖像處理裝置100將基于這類對象的標識結果來實現(xiàn)各類AR應用。2.根據(jù)本公開實施例的圖像處理裝置的示例性配置
[0046]2-1.硬件配置
[0047]圖2是示出了根據(jù)本實施例的圖像處理裝置100的硬件配置的一個例子的框圖。如圖2所示，圖像處理裝置100包括圖像拾取單元102、傳感器單元104、輸入單元106、存儲單元108、顯示單元110、通信單元112、總線116和控制單元118。
[0048](I)圖像拾取單元
[0049]圖像拾取單元102是拾取圖像的相機模塊。圖像拾取單元102使用諸如CXD (電荷耦合器件)或CMOS (互補金屬氧化物半導體)的圖像拾取元件來拾取真實世界的圖像，以生成拾取圖像。由圖像拾取單元102生成的拾取圖像是要由控制單元118進行圖像處理的輸入圖像。注意到圖像拾取單元102沒有必要是圖像處理裝置100的一部分。作為一例，無線或使用有線連接至圖像處理裝置100的圖像拾取裝置可被看作是圖像拾取單元102。
[0050](2)傳感器單元
[0051]傳感器單元104可以包括諸如定位傳感器、加速度傳感器和陀螺傳感器之類的各種傳感器。例如，傳感器單元104可以包括接收GPS (全球定位系統(tǒng))信號并測量圖像處理裝置100的全球位置的GPS傳感器。傳感器單元104可以包括基于從一個或多個無線接入點接收到的無線信號的強度來測量該圖像處理裝置100的位置的定位傳感器。
[0052](3)輸入單元
[0053]輸入單元106是用戶用來操作圖像處理裝置100或向圖像處理裝置100輸入信息的輸入設備。作為一例，輸入單元106可以包括檢測由用戶在顯示單元110的屏幕上做出的觸摸的觸摸傳感器。作為其代替(或是附加)，輸入單元106可以包括諸如鼠標或觸摸板的定點設備。此外，輸入單元106還可以包括另一類型的輸入設備，諸如鍵盤、小鍵盤、一個或多個按鈕、或一個或多個開關。
[0054](4)存儲單元
[0055]存儲單元108由諸如半導體存儲器或硬盤驅動器的存儲介質組成并且存儲用于由圖像處理裝置100處理的程序和數(shù)據(jù)。由存儲單元108存儲的數(shù)據(jù)可以包括隨后描述的拾取圖像數(shù)據(jù)、傳感器數(shù)據(jù)以及各類數(shù)據(jù)庫(DB)中的數(shù)據(jù)。注意到作為在存儲單元108中存儲的代替，本說明書中描述的某些程序和數(shù)據(jù)可由從外部數(shù)據(jù)源(例如，數(shù)據(jù)服務器、網(wǎng)絡存儲裝置或外部存儲器)獲取。
[0056](5)顯示單元
[0057]顯示單元110是包括諸如IXD (液晶顯示器)、0LED (有機發(fā)光二極管)或CRT (陰極射線管)的顯示器的顯示模塊。作為一例，顯示單元110被用于顯示由圖像處理裝置100生成的AR應用的圖像。注意到顯示單元110沒有必要是圖像處理裝置100的一部分。作為一例，無線或使用有線連接至圖像處理裝置100的顯示裝置可被看作是顯示單元110。
[0058](6)通信單元
[0059]通信單元112是用作該圖像處理裝置100與其他裝置的居間傳遞者的通信接口。通信單元112支持任意無線通信協(xié)議或有線通信協(xié)議并且建立與其他裝置的通信連接。
[0060](7)總線
[0061]總線116將圖像拾取單元102、傳感器單元104、輸入單元106、存儲單元108、顯示單元110、通信單元112和控制單元118彼此連接。
[0062](8)控制單元
[0063]控制單元118與諸如CPU (中央處理單元)或DSP (數(shù)字信號處理器)的處理器相對應。通過執(zhí)行存儲在存儲單元108或其他存儲介質中的程序，控制單元118使得該圖像處理裝置100以如下描述的各種方式起作用。
[0064]2-2.功能配置
[0065]圖3是示出由圖2所示圖像處理裝置100的存儲單元108和控制單元118實現(xiàn)的邏輯功能配置的一個例子。如圖3所示，圖像處理裝置100包括圖像獲取單元120、模板數(shù)據(jù)庫(DB) 125、模板獲取單元130、模板匹配單元140、參考圖像DB145、識別單元150、顯示控制單元160、相關信息DB165和信息獲取單元170。
[0066](I)圖像獲取單元
[0067]圖像獲取單元120獲取由圖像拾取單元102生成的拾取圖像作為輸入圖像。由圖像獲取單元120獲取的輸入圖像是由真實世界的圖像拾取產(chǎn)生的圖像。每幅輸入圖像可以是靜止圖像，也可以是組成視頻圖像的一幀。圖像獲取單元120將獲取的輸入圖像輸出至模板匹配單元140、識別單元150和顯示控制單元160。
[0068](2)模板 DB
[0069]模板DB125是存儲多個模板的數(shù)據(jù)庫，每個模版各自表示具有真實世界中可視結構的對象結構?？梢缘湫偷蒯槍Ω鞣N類型的對象定義模板。例如，可以預先定義針對諸如由于顯示換乘信息的布告牌、用于交通或路線信息的路邊布告牌、用于店鋪導覽的海報和提供餐館信息的網(wǎng)頁之類的各類對象的模板。在本實施例中，存儲在模板DB125中的每個模板包括至少一個字段，且每個字段都與由相應對象可視化的信息相關聯(lián)。每個模板中包括的一個或多個字段是標識字段并且與使對象能被唯一標識的信息相關聯(lián)。
[0070]在本說明書中，表達“對象的標識”指的是從可視化各種不同信息的多個對象中指定具體對象。作為一例，在車站A、車站B和車站C內分別設置的布告牌中指定特定車站內設置的布告牌就使用上述表達“對象的標識”來表達。如下將參考圖4A至6B描述由可由模板DB 125存儲的模板的三個例子。
[0071](2-1)第一例
[0072]圖4A是用于說明輸入圖像中出現(xiàn)的對象的第一例的圖示。圖4B是用于說明與圖4A所示對象相對應的模板的一個例子的圖示。
[0073]如圖4A所示的對象12a是車站內的向導布告牌。對象12a包括其上書寫車站名的柱狀部和其上書寫向導信息的板狀部。在圖4A左側的板狀部上，書寫的向導信息已被分成多個部分。
[0074]圖4B所示的模板Tl是示出了作為存在于真實世界的真實對象的對象12a的可視結構的模板。模板Tl包括十個字段FlO至F19。字段F10(Station_Name_text (車站名文本))是標識字段并且與車站名相關聯(lián)。字段Fll (Title_text (標題文本))是常規(guī)字段并且與標題字符串相關聯(lián)。字段F12 (Left_SubTitle_text(左副標題文本))和字段F13(Right_SubTitle_text(右副標題文本))是常規(guī)字段并且與副標題字符串相關聯(lián)。字段F14 (Left_Contents_text (左內容文本))和字段 F15 (Right_Contents_text (右內容文本))是常規(guī)字段并且與向導信息的內容相關聯(lián)。字段F16至F19是常規(guī)字段并且與廣告信息相關聯(lián)。模板是定義這一個或多個字段與對應字段的屬性之間的位置關系的數(shù)據(jù)。模板還可以包括被共同包括在相應對象內的字符和符號等的圖像(例如，模板Tl中的“i”符號)。
[0075](2-2)第二例
[0076]圖5A是用于說明輸入圖像中出現(xiàn)的對象的第二例的圖示。圖5B是用于說明與圖5A所示對象相對應的模板的一個例子的圖示。
[0077]圖5A所示的對象12b是由存在真實世界中的信息機器Ilb顯示的有關餐館信息的網(wǎng)頁。對象12b包括網(wǎng)頁的標題、標識餐館的標識信息以及餐館信息的內容。
[0078]圖5B所示的模板T2是表達作為網(wǎng)頁的對象12b的可視信息的模板。模板T2包括六個字段F20至F25。字段F20 (Area_text (區(qū)域文本))是一個標識字段并且與區(qū)域名相關聯(lián)。字段F21(Name_teXt (名稱文本))是另一標識字段并且與餐館名相關聯(lián)。字段F22(Title_text (標題文本))是常規(guī)字段并且與標題字符串相關聯(lián)。字段F23 (Contents,text (內容文本))是常規(guī)字段并且與餐館信息的內容相關聯(lián)。字段F24(Ph0t0l_image (照片I圖像))和字段F25 (Photo2_image (照片2圖像))是常規(guī)字段并且與圖像信息相關聯(lián)。以此方式，一個模板可以包括多個標識字段。包括在該模板中的各字段可以與文本信息相關聯(lián)，也可以與圖像信息相關聯(lián)。
[0079](2-3)第三實施例
[0080]圖6A是用于說明輸入圖像中出現(xiàn)的對象的第三例的圖示。圖6B是用于說明與圖6A所示對象相對應的模板的一個例子的圖示。
[0081]圖6A所示的對象12c是由存在于真實世界中的信息機器Ilb顯示的有關社交網(wǎng)絡的網(wǎng)頁。對象12c包括網(wǎng)頁的標題、標識個人的標識信息、朋友信息和簡檔信息等。
[0082]圖6B所示的模板T3是表達作為網(wǎng)頁的對象12c的可視結構的模板。模板T3包括十個字段F30至F39。字段F30 (Portraitjmage (肖像圖像))是一個標識字段并且與個人面部圖像相關聯(lián)。字段F31 (Nicknamejext (昵稱文本))是常規(guī)字段并且與昵稱相關聯(lián)。字段F32 (Titlel_text (標題I文本))和字段F34 (Title2_text (標題2文本))是常規(guī)字段并且與標題字符串相關聯(lián)。字段F33 (Contentsltext (內容I文本))和字段F35 (ContentS2_text (內容2文本))是常規(guī)字段并且與各類信息的內容相關聯(lián)。字段F36 (Friendl_image (朋友I圖像))和字段F38 (Friend2_image (朋友2圖像))是常規(guī)字段并且與朋友的面部圖像相關聯(lián)。字段F37 (Friendl_text (朋友I文本))和字段F39(Friend2_text (朋友2文本))是常規(guī)字段并且與朋友的昵稱相關聯(lián)。以此方式，與模板內包括的各字段中的圖像信息相關聯(lián)的字段可以是標識字段。
[0083](3)模板獲取單元
[0084]當由圖像處理裝置100執(zhí)行圖像處理時，模板獲取單元130獲取存儲在模板DB125中的上述至少一個模板。模板獲取單兀130隨后將獲取的一個或多個模板輸出至模板匹配單元140。
[0085](4)模板匹配單元
[0086]模板匹配單元140將由圖像獲取單元120獲取的輸入圖像與由模板獲取單元130獲取的一個或多個模板相匹配。例如模板匹配單元140可以從輸入圖像中提取邊緣。接下來，模板匹配單元140在三維地改變各模板的位置和姿勢的同時，確定從輸入圖像中提取的邊緣與各模板中包括的字段框架之間的匹配程度。如果存在匹配程度超過規(guī)定匹配程度的模板，模板匹配單元140則在隨后確定輸入圖像中出現(xiàn)的與模板相對應的對象。模板匹配單元140將匹配結果(例如，匹配模板的標識符、位置及姿勢)輸出至識別單元150。
[0087](5)參考圖像DB
[0088]參考圖像DB145是存儲由識別單元150執(zhí)行的字段識別處理所參考的現(xiàn)有圖像的數(shù)據(jù)庫。作為一例，參考圖像DB145可以存儲將餐館外觀照片與餐館標識符關聯(lián)生成的圖像。參考圖像DB145還可以與個人標識符關聯(lián)地存儲該人的面部圖像。注意到在由識別單元150執(zhí)行的字段識別處理中參考的圖像不限于這些例子并且可以是其他類型的圖像。
[0089](6)識別單元
[0090]如果模板之一與輸入圖像相匹配，則識別單元150就從輸入圖像中識別與包括在匹配模板中的至少一個字段相關聯(lián)的信息。作為一例，識別單元150通過對與文本信息相關聯(lián)的字段執(zhí)行OCR (光學字符識別)來識別與這些字段相關聯(lián)的文本信息。同樣地，識別單元150通過將與關聯(lián)圖像信息的字段相對應的輸入圖像部分與由參考圖像DB145存儲的圖像相匹配來識別與這些字段相關聯(lián)的信息。作為一例，識別單元150可以通過保持與輸入圖像匹配的模板姿勢以使得對象的相應表面直接面對圖像拾取面并使得經(jīng)處理的輸入圖像經(jīng)歷OCR或與現(xiàn)有圖像的匹配來處理輸入圖像。
[0091]在本實施例中，識別單元150基于使用模板從輸入圖像中識別出的信息來標識輸入圖像中出現(xiàn)的對象。作為一例，如果圖4B所示模板Tl與輸入圖像相匹配，則識別單元150可以基于從標識字段FlO讀取的車站名來標識其向導布告牌被識別出來的車站作為輸入圖像中出現(xiàn)的對象。另舉一例，如果圖5B所示模板T2與輸入圖像匹配，則識別單元150可以基于從標識字段F20和F21讀取的區(qū)域名和餐館名來標識作為被識別的網(wǎng)頁主體的餐館來作為輸入圖像中出現(xiàn)的對象，該餐館是被識別的網(wǎng)頁主題。再舉一例，如果圖6B所示模板T3與輸入圖像匹配，則識別單元150可以基于對應于標識字段F30的圖像部分與現(xiàn)有面部圖像的匹配結果來標識個人作為輸入圖像中出現(xiàn)的對象，該個人是所識別的網(wǎng)頁主題。注意到如果已經(jīng)從非標識字段中識別出用于標識對象的充足信息，那么該識別單元150也可以基于這些信息來標識對象。
[0092]由識別單元150進行的與各字段相關聯(lián)的信息識別并不總是成功。例如，如果與模板中一個或多個字段相對應的位置沒有在輸入圖像中出現(xiàn)，則識別單元150可能無法識別與這些字段相關聯(lián)的信息。同樣地，在其中與某些字段相對應的部分在輸入圖像中看起來很小的情況下，或是在其中對象表面不直接面對圖像拾取面的情況下，可能難以識別與這些字段相關聯(lián)的信息。出于這些原因，為了讓用戶調整輸入圖像的構圖，識別單元150向顯示控制單元160輸出與各字段相關聯(lián)的信息識別成功與否的通知。
[0093](7)顯示控制單元
[0094]顯示控制單元160在顯示單元110的顯示器上顯示識別單元150對至少一個字段的識別結果。例如，如果輸入圖像中沒有出現(xiàn)標識字段，顯示控制單元160可以具有敦促用戶在使得這一標識字段在顯示器上顯示的方向上移動圖像拾取單元102的指示，使得用戶能夠支持由識別單元150進行的對象標識。同樣地，如果輸入圖像中出現(xiàn)的標識字段尺寸較小，顯示控制單元160可以在顯示器上顯示敦促用戶讓標識字段在拾取圖像中更大的指示。在看到這一指示之后，用戶可以移動圖像拾取單元102或改變縮放比例，由此促進與標識字段相關聯(lián)的信息的識別。如果與標識字段相關聯(lián)的信息識別已經(jīng)成功，則顯示控制單元160還可以指導用戶促進對這一標識字段之外的其他字段的識別。例如，通過在輸入圖像上疊加表達對每個字段的關聯(lián)信息識別成功與否的指示，顯示控制單元160就能夠引導用戶支持相關信息識別失敗的字段的識別。
[0095]圖7是用于說明顯示控制單元160的識別結果的顯示的第一例的圖示。在圖7左偵牝其中出現(xiàn)了對象12a的圖像Imll在圖像處理裝置100的顯示器上顯示。在此，對象12a的標識字段(與其對應的部分)沒有充分出現(xiàn)在圖像Imll中。出于這一原因，顯示控制單元160在圖像Imll上疊加敦促用戶在輸入圖像中定位對象12a的標識字段的指示D1。在看見這一指示Dl后，用戶可以例如移動或旋轉該圖像處理裝置100，以在輸入圖像中定位對象12a的標識字段。在圖7右側，示出基于從標識字段中識別出的信息而成功標識對象12a的指示D2被疊加在出現(xiàn)該對象12a的圖像Iml2上。
[0096]圖8A是用于說明顯示控制單元160的識別結果的顯示的第二例的圖示。在圖8A所示的圖像Im21中，半透明矩形指示被疊加在信息識別已經(jīng)成功的字段上，而透明矩形指示則被疊加在信息識別已經(jīng)失敗的字段上。在看見這類指示之后，用戶可以操作該圖像處理裝置100 (或圖像拾取單元102)來使得與信息識別失敗的字段對應的圖像部分在輸入圖像上看起來更大或更清楚。圖8B是用于說明顯示控制單元160的識別結果的顯示的第三例的圖示。在圖8B的例子中，指示沒有疊加在信息識別成功的字段上，并且透明矩形指示僅疊加在信息識別失敗的字段上。同樣在此情況下，通過移除指示來告知用戶信息識別成功與否，就能夠引導用戶促進對信息識別失敗字段的識別。
[0097]圖9是用于說明顯示控制單元160的識別結果的顯示的第四例的圖示。其中出現(xiàn)了由存在于真實世界2中的信息機器Ilb顯示的對象12c的圖像Im31如圖9所示在圖像處理裝置100的顯示器上顯示。雖然對象12c的標識字段F30 (與其對應的部分)出現(xiàn)在圖像Im31中，但該字段很小，使得對標識字段F30的信息的識別可能失敗。為此，顯示控制單元160將指示D3覆蓋在圖像Im31上，以敦促用戶使得標識字段F30在輸入圖像中看上去更大。在看見這一指示D3之后，用戶可以例如將圖像處理裝置100靠近信息機器Ilb或改變縮放比例，以使得標識字段F30在輸入圖像中看上去更大。由此，對標識字段F30的信息的識別將會更可靠地成功。
[0098]圖10是用于說明顯示控制單元160的識別結果的顯示的第五例的圖示。如圖10所示，其中出現(xiàn)對象12c的圖像Im41被顯示在圖像處理裝置100的顯示器上。雖然對象12c出現(xiàn)在圖像Im41中，但是由于該對象12c的尺寸過大，而使得沒有模板與該對象12c相匹配。為此，顯示控制單元160將指示D4覆蓋在圖像Im41上，以敦促用戶使得對象12c在輸入圖像中看上去更小。在看見這一指示D4之后，用戶可以使得整個對象12c出現(xiàn)在輸入圖像內以使得例如圖6B所示模板T3與輸入圖像中出現(xiàn)的對象12c相匹配。
[0099]如果通過上述顯示控制單元160和用戶之間的協(xié)作已經(jīng)成功識別對象，或者如果全部必須信息已由識別單元150識別，則可以開始AR應用的執(zhí)行。例如，顯示控制單元160使得信息獲取單元170獲取與由識別單元150標識的對象相關的相關信息。在此之后，顯示控制單元160在顯示器上顯示由信息獲取單元170獲取的相關信息。
[0100](8)相關信息DB
[0101]相關信息DB165是存儲要為AR應用顯示的各類信息的數(shù)據(jù)庫。在該相關信息DB165中，每條相關信息都與對象之一或通過可視化對象之一生成的信息相關聯(lián)。相關信息例如可以是AR應用的注解。例如，如果已在輸入圖像中標識關聯(lián)對象，則可將注解疊加在該輸入圖像上以布置在該對象周圍。另外，該相關信息也可以是表示比拾取(輸入)圖像更高質量的關聯(lián)對象圖像的圖像信息。作為一例，如果在輸入圖像中出現(xiàn)的對象被識別，則可以在顯示器上輸入圖像處顯示比輸入圖像更高質量的對象圖像。相關信息DB165可以存儲根據(jù)圖像處理裝置100的位置動態(tài)獲取的相關信息。
[0102](9)信息獲取單元
[0103]信息獲取單元170從相關信息DB165或外部服務器獲取與識別單元150標識的對象相關的相關信息。信息獲取單元170將獲取的相關信息輸出至顯示控制單元160并使得顯示控制單元160執(zhí)行用于AR應用的顯示處理。作為一例，由信息獲取單元170獲取的相關信息可以包括在前描述的注解、圖像信息或經(jīng)由通信單元112從網(wǎng)站獲取的信息。
[0104]圖11是用于說明可在本實施例中顯示的相關信息的第一例的圖示。在圖11左側，在圖像處理裝置100的顯示器上顯示的是圖7例示的圖像Iml2。圖像Iml2的指示D2示出了識別單元150對圖像Iml2中出現(xiàn)的對象12a的標識成功的指示。對象12a例如是位于東京站的布告牌。如果對象12a的標識已成功，則信息獲取單元170獲取與該對象12a相關的相關信息。顯示控制單元160隨后將由信息獲取單元170獲取的相關信息疊加在輸入圖像上。在圖11的右側，相關信息Al被疊加在圖像Iml3上。作為一例，相關信息Al是列車到達和離開東京站的服務信息。
[0105]圖12是用于說明可在本實施例中顯示的相關信息的第二例的圖示。在圖12左偵牝在圖像處理裝置100的顯示器上顯示的是圖7例示的圖像Iml2。如果對象12a的標識已成功，則信息獲取單元170獲取表示對象12a的更高質量圖像的圖像信息作為相關信息。顯示控制單元160隨后使用從信息獲取單元170輸入的該圖像信息來顯示對象12a的更高質量圖像來代替所述輸入圖像。在圖12右側，在圖像處理裝置100的顯示器上顯示的是對象12a的更高質量圖像Iml4。顯示控制單元160還可以將諸如圖11所示的相關信息疊加在圖像Iml4上。[0106]圖13是用于說明可在本實施例中顯示的相關信息的第三例的圖示。在圖13左側，在圖像處理裝置100的顯示器上顯示的是其中出現(xiàn)了對象12c的圖像Im32。圖像Im32中的指示D3示出了識別單元150對對象12c的識別已經(jīng)成功。對象12c是提供關于特定個體的個人信息的網(wǎng)頁。如果對象12c的識別已成功，則信息獲取單元170獲取與該對象12c相關的相關信息。對象的識別例如可以包括從對象12c提取面部圖像并將所提取的面部圖像與圖像數(shù)據(jù)的數(shù)據(jù)庫相比較以標識特定個體的面部識別處理。隨后，例如信息獲取單元170可以將請求傳送識別單元150標識的個人的網(wǎng)頁的HTTP (超文本傳輸協(xié)議)請求傳送給社交網(wǎng)絡的網(wǎng)站以獲取與對象12c相同的網(wǎng)頁。顯示控制單元160隨后在圖像處理裝置100的顯示器上顯示由信息獲取單元170獲取的網(wǎng)頁。在圖13右側，顯示的是該網(wǎng)頁的圖像Im33。另舉一例，對象的識別可以包括從對象12c識別網(wǎng)站的登錄信息。隨后，例如信息獲取單元170可以將包括由識別單元150標識的登錄信息的HTTP (超文本傳輸協(xié)議)請求傳送給網(wǎng)站以登錄到該網(wǎng)頁中。顯示控制單元160隨后在圖像處理裝置100的顯示器上顯示由信息獲取單元170獲取的網(wǎng)頁。
[0107]注意到由信息獲取單元170從網(wǎng)站獲取的信息并不需要是該網(wǎng)頁本身。作為一例，如果已經(jīng)標識出提供餐館信息的網(wǎng)站上單個餐館的網(wǎng)頁，則可以獲取該餐館的優(yōu)惠券信息。
[0108]2-3.處理流程
[0109]圖14是示出了根據(jù)本實施例的由圖像處理裝置100進行的圖像處理流程的一個例子的流程圖。
[0110]如圖14所示，首先圖像獲取單元120獲取由圖像拾取單元102生成的拾取圖像作為輸入圖像(步驟S102)。圖像獲取單元120隨后將獲取的輸入圖像輸出至模板匹配單元140、識別單元150和顯示控制單元160。同樣地，模板獲取單元130在圖像處理裝置100進行圖像處理期間獲取由模板DB125存儲的一個或多個模板(步驟S104)。模板獲取單元130隨后將獲取的一個或多個模板輸出至模板匹配單元140。
[0111]接下來，模板匹配單元140將從圖像獲取單元120輸入的輸入圖像與從模板獲取單元130輸入的各模板進行匹配(步驟S106)。模板匹配單元140隨后將匹配結果輸出至識別單元150。
[0112]在此之后，識別單元150基于從模板匹配單元140輸入的匹配結果判定是否存在與輸入圖像相匹配的模板(步驟S108)。在此，如果不存在與輸入圖像相匹配的模板，則該處理返回到步驟S102并且可以獲取下一個輸入圖像。注意到在下一個處理迭代中可以省略步驟S104中的模板獲取。
[0113]如果在步驟S108，存在與輸入圖像相匹配的模板，則識別單元150從輸入圖像中識別與包括在匹配模板中的字段相關聯(lián)的信息(步驟S110)。隨后將更詳細地描述在此執(zhí)行的字段識別處理。接下來，識別單元150基于使用模板從輸入圖像中識別出的信息來標識輸入圖像中出現(xiàn)的對象(步驟S120)。識別單元150隨后將各字段的識別結果以及對象的標識結果輸出至顯示控制單元160。
[0114]接下來，顯示控制單元160判定是否已經(jīng)標識出輸入圖像中出現(xiàn)的對象(步驟S122)。在此，如果尚未標識出輸入圖像中出現(xiàn)的對象，顯示控制單元160就在顯示器上顯示指導用戶以促進標識字段的識別的指示，由此支持對象標識(步驟S124)。[0115]另外，如果已經(jīng)標識出輸入圖像中出現(xiàn)的對象，顯示控制單元160就判定是否完成對AR應用執(zhí)行的準備(步驟S126)。例如，在一個或多個標識字段之外的其他字段中的信息識別沒有成功而無法執(zhí)行AR應用的情況下，可以在對任意字段的信息識別沒有成功時判定沒有完成對AR應用執(zhí)行的準備。在此情況下，顯示控制單元160在顯示器上顯示用于指導用戶以促進對一個或多個標識字段之外的其他字段識別的指示(步驟S128)。
[0116]如果在步驟S126中，完成了對AR應用執(zhí)行的準備，則執(zhí)行該AR應用(步驟S130)。例如，由信息獲取單元170獲取與標識對象相關的相關信息并由顯示控制單元160在顯示器上顯示獲取的相關信息。
[0117]圖15是示出了圖14的步驟SllO中由識別單元150執(zhí)行的字段識別處理的詳細流程的一個例子的流程圖。
[0118]為包括在與輸入圖像匹配的模板中的每個字段重復圖15所示步驟S112至步驟S114的處理(步驟S111)。首先，識別單元150判定該模板中是文本信息還是圖像信息與當前處理的字段相關聯(lián)(步驟S112)。如果當前處理的字段與文本信息相關聯(lián)，則識別單元150對輸入圖像與這一字段相對應的部分應用OCR并識別與這一字段相關聯(lián)的文本信息(步驟S113)。然而，如果當前處理的字段與圖像信息相關聯(lián)，則識別單元150將輸入圖像與這一字段相對應的部分與存儲在參考圖像DB145中的現(xiàn)有圖像相匹配以識別與這一字段相關聯(lián)的信息(步驟S114)。
[0119]當已經(jīng)為包括在與輸入圖像匹配的模板中的每個字段完成了步驟S112至步驟S114中的處理時，識別單元150判定對一個或多個標識字段的識別已經(jīng)成功(步驟S115)。在此，如果對一個或多個標識字段的識別已經(jīng)成功，則識別單元150基于從一個或多個標識字段中識別出的信息進一步標識輸入圖像中出現(xiàn)的對象(步驟S116)。識別單元150隨后將各個字段的識別結果以及對象的標識結果輸出至顯示控制單元160。
[0120]3.結論
[0121]已經(jīng)參考圖1至圖15詳細描述了本公開的優(yōu)選實施例。根據(jù)本公開的該實施例，使用表達真實世界中對象的可視結構的模板來檢測輸入圖像中出現(xiàn)的對象，并且為包括在該模板中的每個字段識別該對象上的可視化信息。在這樣做時，由于至少一個字段的識別結果在顯示器上顯示，因此用戶能夠調整輸入圖像的構圖以使得AR應用有效操作。因此，AR應用就能夠向用戶更可靠地提供有用信息。具體地，通過不僅顯示對象標識是否已經(jīng)成功還顯示作為對象成功標識前提的各字段識別的中間結果，使得用戶能夠有效支持AR應用進行的圖像處理。
[0122]同樣地,根據(jù)本實施例，模板包括與能夠唯一標識對象的信息相關聯(lián)的一個或多個標識字段。根據(jù)這一配置，具有共享可見結構且所提供信息內容不同的多個對象能夠使用單個模板來標識。由此，在從大量對象中標識對象的情況下，就能夠降低定義模板的負載并避免模板使用的數(shù)據(jù)總量的過度增加。還可以引導用戶來促進對與輸入圖像匹配的模板的標識字段的識別。由于對象成功識別變得容易，因此能夠為用戶提供更多的機會享受AR應用帶來的益處(例如，有用信息的提供)。
[0123]根據(jù)本實施例，對于與文本信息相關聯(lián)的字段，能夠使用OCR技術來識別這些字段內的信息。同樣地，對于與圖像信息相關聯(lián)的字段，能夠使用現(xiàn)有圖像信息來識別這些字段內的信息。通過以此方式在各字段的識別方法之間切換，能夠使用模板標識各種各樣的對象。
[0124]根據(jù)本實施例，能夠標識真實世界中存在的真實對象，并且能夠顯示與信息機器顯示的圖像相對應的對象。例如，如果顯示的對象是網(wǎng)頁，則基于使用模板對該網(wǎng)頁的標識結果，使得已經(jīng)拾取了輸入圖像的裝置能夠容易地獲取在輸入圖像中出現(xiàn)的網(wǎng)頁或與該網(wǎng)頁相關的信息。換句話說，沒有必要執(zhí)行諸如輸入URL或搜索網(wǎng)頁之類的麻煩的操作。
[0125]注意到在前描述的圖像處理裝置100的某些邏輯功能可以在云計算環(huán)境中存在的裝置處實現(xiàn)，作為在圖像處理裝置本身處實現(xiàn)的代替。以此方式，邏輯功能之間交換的信息可以經(jīng)由圖12所示的通信單元112在各裝置之間發(fā)送或接收。
[0126]由在本說明書中描述的各裝置執(zhí)行的一系列控制處理可由軟件、硬件或軟硬件的結合實現(xiàn)。組成軟件的程序可被例如預先存儲在設置在各裝置內部或外部的存儲介質上。作為一例，在執(zhí)行期間，這些程序可被寫入RAM (隨機存取存儲器)并由諸如CPU的處理器執(zhí)行。
[0127]雖然業(yè)已參考附圖對本公開的優(yōu)選實施例進行了描述，但是本公開的技術范圍不受這些實施例所限。
[0128]本領域技術人員應該理解的是，取決于設計要求和其他因素，會出現(xiàn)各種修改、組合、子組合和變化，而這些修改、組合、子組合和變化仍將位于所附權利要求或其等效方案的范圍內。
[0129]此外，本技術還可如下構成。
[0130](I) 一種信息處理系統(tǒng)，包括:一個或多個處理單元，用于:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0131](2)如(I)所述的信息處理系統(tǒng)，其中所述圖像包括對象并且所述一個或多個處理單元識別所述對象的結構。
[0132](3)如(2)所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過檢測在所述對象中包括的一個或多個字段來識別所述對象的結構。
[0133](4)如(I)至(3)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像提取邊緣。
[0134](5)如(4)所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。
[0135](6)如(4)至(5)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過在改變所述一個或多個模板的位置的同時確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。
[0136](7)如(4)至(6)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過在改變所述一個或多個模板的姿勢的同時確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。[0137](8)如⑴至(7)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像中識別與匹配模板中包括的至少一個字段相關聯(lián)的信息。
[0138](9)如(8)所述的信息處理系統(tǒng)，其中所述至少一個字段是基于識別所述匹配模板而選擇的字段。
[0139](10)如(I)至(9)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過對所述圖像的與匹配模板中包括的至少一個字段相關聯(lián)的部分執(zhí)行光學字符識別(OCR)來從所述圖像中識別與所述至少一個字段相關聯(lián)的信息。
[0140](11)如⑴至(10)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過將所述圖像的與匹配模板中包括的至少一個字段相關聯(lián)的部分與存儲的圖像信息進行匹配來從所述圖像中識別與所述至少一個字段相關聯(lián)的信息。
[0141](12)如⑴至(11)中任一項所述的信息處理系統(tǒng)，其中與所述至少一個字段相關聯(lián)的圖像是面部圖像，并且所述面部圖像與存儲的面部圖像信息匹配。
[0142](13)如(I)至(8)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元控制顯示器以在所述圖像上疊加所識別的信息。
[0143](14)如(I)至(13)中任一項所述的信息處理系統(tǒng)，其中所述一個或多個處理單元基于所述比較的結果生成用于指導所述圖像拾取單元的用戶調整所述圖像拾取單元的輔助信息。
[0144](15)如(14)所述的信息處理系統(tǒng)，其中所述輔助信息指示用戶改變所述圖像拾取單元的朝向。
[0145](16)如(14)至(15)中任一項所述的信息處理系統(tǒng)，其中所述輔助信息指示用戶改變所述圖像拾取單元的位置和設置中的至少一種以改變由所述圖像拾取單元所捕捉的圖像的大小。
[0146](17)如(I)至(16)中任一項所述的信息處理系統(tǒng)，其中基于所述比較輸出的結果包括控制顯示器以將識別成功的一個或多個字段與識別沒有成功的一個或多個字段不同地顯示。
[0147](18)如⑴至(17)中任一項所述的信息處理系統(tǒng)，其中捕捉到的圖像和所述一個或多個模板與網(wǎng)頁相對應。
[0148](19)如(18)所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像中識別與對應于所述網(wǎng)頁的匹配模板中包括的至少一個字段相關聯(lián)的信息。
[0149](20)如(19)所述的信息處理系統(tǒng)，其中所述一個或多個處理單元基于識別的信息控制訪問所述網(wǎng)頁的處理。
[0150](21)如(19)至(20)中任一項所述的信息處理系統(tǒng)，其中識別的信息與所述網(wǎng)頁的登錄信息相對應。
[0151](22)如⑴至(21)中任一項所述的信息處理系統(tǒng)，其中所述信息處理系統(tǒng)是移動電話并且所述一個或多個處理單元是所述移動電話中的處理器。
[0152](23)如(I)至(22)中任一項所述的信息處理系統(tǒng)，其中所述信息處理系統(tǒng)包括客戶機和服務器。
[0153](24)如(I)至(23)中任一項所述的信息處理系統(tǒng)，其中所述客戶機包括:所述圖像拾取單元；以及將所述圖像發(fā)送至所述服務器的第一通信接口；并且所述服務器包括:從所述客戶機接收所述圖像的第二通信接口；所述一個或多個處理單元中的至少一個，該至少一個處理單元從存儲器獲取所述一個或多個模板，將所述圖像與所述一個或多個模板進行比較，并且基于所述比較控制所述第二通信接口將所述結果輸出至所述客戶機。
[0154](25) 一種由信息處理系統(tǒng)執(zhí)行的信息處理方法，所述方法包括:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0155](26) 一種包括計算機程序指令的非暫態(tài)計算機可讀介質，所述計算機程序指令在由信息處理系統(tǒng)執(zhí)行時使得所述信息處理系統(tǒng)執(zhí)行一種方法，所述方法包括:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
[0156]參考標記列表
[0157]100圖像處理裝置
[0158]120圖像獲取單元
[0159]130模板獲取單元
[0160]140模板匹配單元
[0161]150識別單元
[0162]160顯示控制單元
[0163]170信息獲取單元
[0164]T1，T2，T3 模板
【權利要求】
1.一種信息處理系統(tǒng),包括: 一個或多個處理單元，用于: 獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
2.如權利要求1所述的信息處理系統(tǒng)，其中所述圖像包括對象并且所述一個或多個處理單元識別所述對象的結構。
3.如權利要求2所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過檢測在所述對象中包括的一個或多個字段來識別所述對象的結構。
4.如權利要求1所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像提取邊緣。
5.如權利要求4所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。
6.如權利要求4所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過在改變所述一個或多個模板的位置的同時確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。
7.如權利要求4所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過在改變所述一個或多個模板的姿勢的同時確定從所述圖像提取的邊緣與所述一個或多個模板中包括的字段的框架之間的匹配程度而將所述圖像與所述一個或多個模板進行比較。
8.如權利要求1所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像中識別與匹配模板中包括的至少一個字段相關聯(lián)的息。
9.如權利要求8所述的信息處理系統(tǒng)，其中所述至少一個字段是基于識別所述匹配模板而選擇的字段。
10.如權利要求1所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過對所述圖像的與匹配模板中包括的至少一個字段相關聯(lián)的部分執(zhí)行光學字符識別(OCR)來從所述圖像中識別與所述至少一個字段相關聯(lián)的信肩、O
11.如權利要求1所述的信息處理系統(tǒng)，其中所述一個或多個處理單元通過將所述圖像的與匹配模板中包括的至少一個字段相關聯(lián)的部分與存儲的圖像信息進行匹配來從所述圖像中識別與所述至少一個字段相關聯(lián)的信息。
12.如權利要求1所述的信息處理系統(tǒng)，其中與所述至少一個字段相關聯(lián)的圖像是面部圖像，并且所述面部圖像與存儲的面部圖像信息匹配。
13.如權利要求8所述的信息處理系統(tǒng)，其中所述一個或多個處理單元控制顯示器以在所述圖像上疊加所識別的信息。
14.如權利要求1所述的信息處理系統(tǒng)，其中所述一個或多個處理單元基于所述比較的結果生成用于指導所述圖像拾取單元的用戶調整所述圖像拾取單元的輔助信息。
15.如權利要求14所述的信息處理系統(tǒng)，其中所述輔助信息指示用戶改變所述圖像拾取單元的朝向。
16.如權利要求14所述的信息處理系統(tǒng)，其中所述輔助信息指示用戶改變所述圖像拾取單元的位置和設置中的至少一種以改變由所述圖像拾取單元所捕捉的圖像的大小。
17.如權利要求1所述的信息處理系統(tǒng)，其中基于所述比較輸出的結果包括控制顯示器以將識別成功的一個或多個字段與識別沒有成功的一個或多個字段不同地顯示。
18.如權利要求1所述的信息處理系統(tǒng)，其中捕捉到的圖像和所述一個或多個模板與網(wǎng)頁相對應。
19.如權利要求18所述的信息處理系統(tǒng)，其中所述一個或多個處理單元從所述圖像中識別與對應于所述網(wǎng)頁的匹配模板中包括的至少一個字段相關聯(lián)的信息。
20.如權利要求19所述的信息處理系統(tǒng)，其中所述一個或多個處理單元基于識別的信息控制訪問所述網(wǎng)頁的處理。
21.如權利要求19所述的信息處理系統(tǒng)，其中識別的信息與所述網(wǎng)頁的登錄信息相對應。
22.如權利要求1所述的信息處理系統(tǒng)，其中所述信息處理系統(tǒng)是移動電話并且所述一個或多個處理單元是所述移動電話中的處理器。
23.如權利要求1所述的信息處理系統(tǒng)，其中所述信息處理系統(tǒng)包括客戶機和服務器。
24.如權利要求23所述的信息處理系統(tǒng)，其中所述客戶機包括所述圖像拾取單元；以及將所述圖像發(fā)送至所述服務器的第一通信接口；并且所述服務器包括從所述客戶機接收所述圖像的第二通信接口；所述一個或多個處理單元中的至少一個，該至少一個處理單元從存儲器獲取所述一個或多個模板，將所述圖像與所述一個或多個模板進行比較，并且基于所述比較控制所述第二通信接口將所述結果輸出至所述客戶機。
25.—種由信息處理系統(tǒng)執(zhí)行的信息處理方法,所述方法包括:獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
26.—種包括計算機程序指令的非暫態(tài)計算機可讀介質，所述計算機程序指令在由信息處理系統(tǒng)執(zhí)行時使得所述信息處理系統(tǒng)執(zhí)行一種方法，所述方法包括: 獲取由圖像拾取單元捕捉的圖像；獲取各自包括一個或多個字段的一個或多個模板；將所述圖像與所述一個或多個模板相比較；以及基于所述比較輸出結果，所述結果指示對所述一個或多個模板的一個或多個字段中每個字段的識別是否成功。
【文檔編號】G06F17/30GK103842991SQ201280046751
【公開日】2014年6月4日申請日期:2012年8月15日優(yōu)先權日:2011年10月3日
【發(fā)明者】笠原俊一申請人:索尼公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：笠原俊一;
技術所有人：索尼公司;
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像處理裝置、圖像處理方法和程序的制作方法

圖像處理裝置、圖像處理方法和程序的制作方法