用于在便攜式終端中表現(xiàn)圖像的設(shè)備和方法

文檔序號：6380856閱讀：131來源：國知局

專利名稱：用于在便攜式終端中表現(xiàn)圖像的設(shè)備和方法
技術(shù)領(lǐng)域：
本申請涉及一種用于表現(xiàn)便攜式終端的圖像的設(shè)備和方法，更具體地講，涉及一種用于通過按照目標區(qū)域區(qū)分圖像的信息來將圖像的信息表現(xiàn)為語音的設(shè)備和方法。
背景技術(shù)：
通常，便攜式終端已經(jīng)發(fā)展為通過使用圖像執(zhí)行各種功能的智能電話的形式。便攜式終端中當前使用的相機具有高分辨率和高質(zhì)量的圖像。然而，視障者無法使用相機功能。一般來說，視障者可能完全看不見或具有有限的視覺能力。然而，存在對于可被視障者使用的智能電話的不斷增長的需求。換句話說，具有有限的視覺能力的人可通過使用相機的縮放功能識別標志和環(huán)境信息，或者完全失明的人可拍攝對象或環(huán)境，并將對象或環(huán)境的圖像發(fā)送給朋友，以將他們的情況通知給朋友，因此將相機用作他們的眼睛。因此，使用便攜式終端的相機功能的行人導航應用預計對于視障者來說很有用。此外，這樣的行人導航功能對于正常人也會是有用的。

發(fā)明內(nèi)容
考慮到以上問題而提出本發(fā)明以解決以上問題，并本發(fā)明提供這樣一種方法和設(shè)備:用于識別包括在由相機捕獲或從外部源下載的圖像中的字符或與字符有關(guān)的信息，并用于將識別的結(jié)果轉(zhuǎn)換為將被輸出的語音。為此，本發(fā)明的示例性實施例包括這樣的一種設(shè)備和方法，其中，當用戶通過相機獲得圖像時，識別獲得的圖像中具有特定功能的區(qū)域，并根據(jù)用戶的選擇將識別的區(qū)域的信息轉(zhuǎn)換為將被引導的語音。根據(jù)本發(fā)明的一方面，一種用于在便攜式終端中顯示圖像的設(shè)備，包括:相機，被配置用于拍攝圖像；觸摸屏，被配置用于顯示圖像并允許選擇顯示的圖像的目標區(qū)域；存儲器，被配置用于存儲圖像；控制器，被配置用于當顯示相機或存儲器的圖像時，檢測圖像之內(nèi)的至少一個目標區(qū)域，并被配置用于將目標信息識別為檢測的目標區(qū)域的字符數(shù)據(jù)，以將所述字符數(shù)據(jù)轉(zhuǎn)換為語音；音頻處理單元，被配置用于輸出語音。所述控制器包括:區(qū)域檢測單元，被配置用于檢測包括在圖像之內(nèi)的目標的區(qū)域；位置識別單元，被配置用于識別檢測的區(qū)域的位置；對象識別單元，被配置用于將識別的目標區(qū)域的圖像信息識別和轉(zhuǎn)換為字符數(shù)據(jù)；語音轉(zhuǎn)換單元，被配置用于將字符數(shù)據(jù)轉(zhuǎn)換為語音。根據(jù)本發(fā)明的另一方面，一種用于在便攜式終端中表現(xiàn)圖像的方法包括:當顯示圖像時，檢查所述圖像是否將被表現(xiàn)為語音；當圖像將被表現(xiàn)為語音時，檢測圖像的至少一個目標區(qū)域；通過識別檢測的圖像的位置，顯示目標區(qū)域被彼此區(qū)分的圖像；當選擇圖像的目標區(qū)域時，將選擇的區(qū)域的目標信息識別為字符數(shù)據(jù)；將識別的字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。

從結(jié)合附圖的下面的詳細描述中，本發(fā)明的目標、特征和優(yōu)點將更加清楚，在附圖中:圖1是示出根據(jù)本發(fā)明的示例性實施例的便攜式終端的配置的視圖；圖2是示出根據(jù)本發(fā)明的示例性實施例的在便攜式終端中將捕捉讀取器(shotreader)圖像的目標信息表現(xiàn)為語音的示例的視圖；圖3是示出根據(jù)本發(fā)明的示例性實施例的用于將由控制器獲得的圖像轉(zhuǎn)換為語音的配置的視圖；圖4A至圖4C是示出根據(jù)本發(fā)明的示例性實施例的捕捉讀取器功能中顯示的示例屏幕的視圖；圖5是示出根據(jù)本發(fā)明的示例性實施例的便攜式終端中的菜單的配置的視圖；圖6是示出根據(jù)本發(fā)明的示例性實施例的識別顯示捕捉讀取器圖像的選擇的區(qū)域的目標信息并將目標信息輸出為語音的示例的視圖；圖7是示出根據(jù)本發(fā)明的示例性實施例的識別便攜式終端的捕捉讀取器圖像的目標區(qū)域并對識別的目標區(qū)域的目標信息進行轉(zhuǎn)換而將目標信息輸出為語音的處理的流程圖；圖8是示出圖7中將目標區(qū)域的信息識別和轉(zhuǎn)換為語音的流程圖。
具體實施例方式以下參照附圖詳細描述本發(fā)明的優(yōu)選實施例。在整個附圖中使用相同的標號以表示相同或相似的部件?？墒÷院喜⑴c此的公知的功能和結(jié)構(gòu)的詳細描述，以避免使本發(fā)明的主題不清楚。然而，本發(fā)明可被實施為很多不同的形式，并不應被解釋為限于在此闡述的示例性實施例。此外，可根據(jù)用戶和操作者的意圖和實踐不同地實施在此描述的考慮本發(fā)明的功能而定義的術(shù)語。因此，應基于整個說明書中的公開來理解所述術(shù)語。在不脫離本發(fā)明的范圍的情況下，可在各種眾多的實施例中采用本發(fā)明的原理和特點。此外，雖然附圖表示本發(fā)明的示例性實施例，但附圖不必按比例繪制，并且可夸大或省略某些特點，以更清楚地示出和解釋本發(fā)明。在此闡述的術(shù)語中，終端是指能夠處理發(fā)送到外部實體或從外部實體接收的數(shù)據(jù)的任何類型的裝置。終端可在屏幕上顯示存儲的數(shù)據(jù)和各種可執(zhí)行功能被分配或映射到的圖標或菜単。終端可包括計算機、筆記本、平板PC、移動裝置等。在此闡述的術(shù)語中，屏幕是指顯示器或其它輸出裝置，其中，所述顯示器或其它輸出裝置向用戶可視地顯示信息，并且選擇性地能夠接收并電子處理使用觸摸筆(stylo)、用戶的手指或用于將得自用戶的用戶選擇傳達給輸出裝置的其它技術(shù)的用戶的觸覺輸入。在此闡述的術(shù)語中，圖標是指諸如顯示在裝置的屏幕上的圖形或符號的圖形元素，使得用戶可容易地選擇期望的功能或數(shù)據(jù)。具體來說，每個圖標具有與裝置中可執(zhí)行的任何功能或存儲在裝置中的任何數(shù)據(jù)的映射關(guān)系，并用于在裝置中處理功能或選擇數(shù)據(jù)。當用戶選擇顯示的圖標之ー時，裝置識別與選擇的圖標關(guān)聯(lián)的特定的功能或數(shù)據(jù)。隨后，裝置執(zhí)行識別的功能或顯示識別的數(shù)據(jù)。在此闡述的術(shù)語中，數(shù)據(jù)是指由裝置處理的任何類型的信息，包括從外部實體接收的文本和/或圖像、發(fā)送或接收的消息以及在裝置執(zhí)行特定功能時創(chuàng)建的信息。在本發(fā)明的示例性實施例中，通過使用相機獲得信息，將所述信息轉(zhuǎn)換為將被輸出的語音。示例性實施例中，用于將圖像信息轉(zhuǎn)換為語音的圖像在此被稱為捕捉讀取器圖像。在本發(fā)明的示例性實施例中，相機模式包括捕捉讀取器模式，圖像顯示模式包括捕捉讀取器顯示模式。例如，根據(jù)本發(fā)明的示例性實施例，當相機模式被設(shè)置為捕捉讀取器模式時，在顯示由相機拍攝獲得的圖像時，將包括在獲得的圖像中的信息表現(xiàn)為語音。此外，根據(jù)本發(fā)明的示例性實施例，當圖像顯示模式被設(shè)置為捕捉讀取器顯示模式時，將包括在顯示的圖像中的信息表現(xiàn)為語音。此外，根據(jù)本發(fā)明的示例性實施例，當顯示捕捉讀取器圖像時，便攜式終端區(qū)分和檢測組成圖像的區(qū)域，識別檢測的區(qū)域的信息，并根據(jù)識別結(jié)果將信息表現(xiàn)為語音。在此，當字符圖像被包括在區(qū)域之內(nèi)時，識別方法用于識別所述字符圖像并將識別的字符轉(zhuǎn)換為將被輸出的語音。此外，在區(qū)域之內(nèi)的識別符號(在此稱為“符號”)是例如交通標志、入口或出口，并且每個符號的信息被轉(zhuǎn)換和表現(xiàn)為語音。在此，可將符號的信息存儲在存儲器中。此外，當便攜式終端不具有圖像的信息時，便攜式終端通過web搜索提取相應的信息，將提取的web信息轉(zhuǎn)換為字符信息的形式，并將提取的web信息轉(zhuǎn)換為將被輸出的語音。在此，術(shù)語“目標區(qū)域”和“區(qū)域”是指在圖像之內(nèi)具有其它圖像信息的區(qū)域，術(shù)語“目標信息”是指區(qū)域之內(nèi)的圖像信息。此外，根據(jù)本發(fā)明的示例性實施例，術(shù)語“捕捉讀取器圖像”是指存儲在相機或存儲器中的圖像，其中，按照目標區(qū)域識別所述圖像并將其轉(zhuǎn)換為語音。此外，術(shù)語“捕捉讀取器圖像”將與術(shù)語“可表現(xiàn)為語音的圖像”互換使用。根據(jù)本發(fā)明的示例性實施例，描述用于將獲得的捕捉讀取器圖像轉(zhuǎn)換和輸出為語音的配置和操作。圖1是示出根據(jù)本發(fā)明的示例性實施例的便攜式終端的各種組件的配置的視圖。參照圖1，通信單元150執(zhí)行與外部基站或其它外部裝置的無線電通信功能。這里，通信單元150可包括或被連接到天線以及用于執(zhí)行發(fā)送信號的頻率上轉(zhuǎn)換和放大的發(fā)送器單元和用于執(zhí)行接收信號的低噪聲放大和頻率下轉(zhuǎn)換的接收器單元。此外，通信單元150可包括調(diào)制器單元和解調(diào)器單元。這里，調(diào)制器單元對將被發(fā)送到發(fā)送器單元的發(fā)送信號進行調(diào)制，解調(diào)器單元對通過接收器單元接收的信號進行解調(diào)。在這種情況下，調(diào)制器單元/解調(diào)器單元可實現(xiàn)LTE、WCDMA或GSM。此外，調(diào)制器單元/解調(diào)器單元可實現(xiàn)WIF1、WIBR0, NFC 或藍牙?？刂破?00控制便攜式終端的整體操作，并根據(jù)本發(fā)明的示例性實施例控制捕捉讀取器圖像拍攝和捕捉讀取器圖像顯示的操作?？刂破?00可包括用于控制便攜式終端的通信功能的通信控制器以及用于控制便攜式終端的應用的執(zhí)行的應用處理器。在這種情況下，可由應用處理器執(zhí)行本發(fā)明的示例性實施例的功能和操作。存儲器110可包括程序存儲器和數(shù)據(jù)存儲器，其中，程序存儲器存儲便攜式終端的操作程序和實施本發(fā)明的示例性實施例的應用程序，數(shù)據(jù)存儲器存儲用于操作便攜式終端的表和在操作程序的執(zhí)行期間產(chǎn)生的數(shù)據(jù)。具體地講，存儲器110在控制器100的控制下，存儲捕捉讀取器圖像并存儲用于將捕捉讀取器圖像的符號信息轉(zhuǎn)換為語音的信息。相機120在控制器100的控制下拍攝捕捉讀取器圖像。觸摸屏130可包括用于檢測用戶的觸摸輸入的觸摸面板以及用于顯示在操作程序的執(zhí)行期間產(chǎn)生的數(shù)據(jù)和圖像的顯示單元。觸摸屏130顯示用于處理根據(jù)本發(fā)明的示例性實施例的捕捉讀取器圖像的各種交互。音頻處理単元140在控制器100的控制下處理便攜式終端的音頻信號。傳感器160檢測便攜式終端的狀態(tài)，并且傳感器160可以是例如用于檢測便攜式終端的任何物理移動和/或物理方向的加速度傳感器和/或地磁傳感器。圖2是示出根據(jù)本發(fā)明的示例性實施例的捕捉讀取器圖像的示例的視圖。在捕捉讀取器圖像拍攝模式下，控制器100在觸摸屏130上顯示諸如語音快門圖標211的圖標。這里，作為用于顯示捕捉讀取器圖像拍攝模式的圖標的圖標211與用于ー般相機模式的圖標不同。在圖2的示例性實施例中，捕捉讀取器圖像拍攝模式的圖標211顯示麥克風，以指示拍攝的圖像也被表現(xiàn)為語音。當圖標211被觸摸時，控制器100獲得由相機120拍攝的圖像，通過例如使用本領(lǐng)域公知的文本識別方法對圖像中的字符進行文本識別，來識別包括在獲得的圖像中的字符圖像213，并將識別的字符圖像和關(guān)聯(lián)的文本轉(zhuǎn)換為語音，其中，使用本領(lǐng)域公知的文本到語音產(chǎn)生方法來將所述語音輸出為文本到語音形式的音頻215。例如，在捕捉讀取器圖像拍攝模式下，將包括在獲得的圖像中的字符圖像和符號圖像轉(zhuǎn)換為將被表現(xiàn)的語音。圖3是示出根據(jù)本發(fā)明的示例性實施例的用于轉(zhuǎn)換由控制器100獲得的圖像的配置的視圖。參照圖3，區(qū)域檢測單元210檢測包括在捕捉讀取器圖像中的區(qū)域。這里，所述區(qū)域可以是位于圖像之內(nèi)的目標區(qū)域，并且目標區(qū)域可被配置為字符和/或符號。這里，區(qū)域檢測單元210可使用本領(lǐng)域公知的區(qū)域檢測方法通過提取每個目標區(qū)域的輪廓和/或分析顔色的邊界，來檢測所述區(qū)域。位置識別單元320使用本領(lǐng)域公知的位置識別方法，例如根據(jù)顯示的圖像的x_y平面上的像素坐標，來識別圖像之內(nèi)的檢測的目標區(qū)域的位置。位置識別單元320識別捕捉讀取器圖像之內(nèi)的區(qū)域的位置，井根據(jù)識別結(jié)果產(chǎn)生每個目標區(qū)域的位置信息。目標識別単元330執(zhí)行以下功能:識別由位置識別單元320識別的每個目標區(qū)域之內(nèi)的字符圖像和符號圖像，并將識別的字符圖像和符號圖像轉(zhuǎn)換為字符數(shù)據(jù)。這里，可以以本領(lǐng)域公知的方式通過使用光學字符識別(OCR)功能，來實現(xiàn)目標識別単元330。此外，當目標區(qū)域之內(nèi)的圖像是符號吋，目標識別単元330可識別存儲在存儲器110中的信息，以產(chǎn)生符號字符信息。此外，目標識別単元330可通過web捜索來識別目標區(qū)域之內(nèi)的信息。語音轉(zhuǎn)換單元340執(zhí)行以下功能:將由目標識別単元330識別的目標字符信息轉(zhuǎn)換為將被輸出的語音。這里，可通過使用采用本領(lǐng)域公知的文本到語音(TTS)方法的TTS功能來實現(xiàn)語音轉(zhuǎn)換單元340。便攜式終端的用戶可在設(shè)置模式下設(shè)置捕捉讀取器圖像模式。例如，當用戶從便攜式終端的菜單選擇設(shè)置模式，并在設(shè)置模式下選擇可訪問/捕捉讀取器功能時，控制器100在相機120的拍攝模式或圖像顯示模式下，執(zhí)行根據(jù)本發(fā)明的示例性實施例的捕捉讀取器圖像顯示功能。在此，將針對處理由相機120拍攝的捕捉讀取器圖像的步驟進行以下描述。當捕捉讀取器功能被設(shè)置吋，如圖4A至圖4C中的示例屏幕所示，控制器100將由相機120拍攝的圖像顯示在觸摸屏130上。圖4A至圖4C是示出根據(jù)本發(fā)明的示例性實施例的在捕捉讀取器功能下顯示的示例屏幕的視圖。
當圖像通過相機120被獲得時，如圖4A所示，控制器100在觸摸屏130上顯示獲得的圖像410。這里,控制器100顯示水平對齊(horizontal alignment)狀態(tài)圖標411以與由相機120拍攝的圖像重疊，并顯示包括閃光按鈕413、快門按鈕415和快速瀏覽按鈕417的軟按鈕顯示圖標。這里，當圖像的水平對齊超出用于識別的目標區(qū)域的范圍時，水平對齊狀態(tài)圖標411通過將圖標的顏色改變?yōu)椴煌念伾?例如，紅色)來警告用戶。此外，關(guān)于軟按鈕的配置，閃光按鈕413獨立于相機閃光燈被驅(qū)動，并且當拍攝圖像時，根據(jù)用戶的觸摸打開/關(guān)閉閃光燈?？扉T按鈕415是用于拍攝捕捉讀取器圖像的按鈕。當快門按鈕415被觸摸時，控制器100根據(jù)本發(fā)明執(zhí)行將圖像轉(zhuǎn)換為語音的功能?？焖贋g覽按鈕417是用于顯示捕捉讀取器圖像的列表的按鈕。當快門按鈕415被觸摸時，控制器100檢測包括在圖像410中的目標區(qū)域，并分別如圖4B和圖4C中示出的圖像420、430所示在觸摸屏130的修改的屏幕中顯示這樣的目標區(qū)域。這里，由區(qū)域檢測單元310執(zhí)行目標區(qū)域的檢測，位置識別單元320識別檢測的目標區(qū)域的位置信息。這里，可如圖4C中的圖像430所示顯示至少一個目標區(qū)域431，并且可顯示至少一個目標區(qū)域431，使得每個目標區(qū)域431的邊界被表示為具有與目標圖像430不同的顏色的邊框。此外，用戶可選擇將被表現(xiàn)為語音的拍攝的圖像之內(nèi)的每個目標區(qū)域431。這里，選擇各個目標區(qū)域的方法可包括如圖4B的圖像420中所示的通過由用戶直接觸摸特定目標區(qū)域來進行選擇。此外，可如圖4C的圖像430所示通過顯示虛擬板(virtualpad) 433來覆蓋圖像430并在虛擬板433上執(zhí)行輕彈操作，來選擇目標區(qū)域431。此外，可在設(shè)置模式下確定虛擬板433的顯示，并且當顯示虛擬板433時，在完成圖像430的處理之后虛擬板433覆蓋在圖像430上。此外，當通過在目標或虛擬板433上的觸摸或敲擊手勢選擇特定目標區(qū)域435時，如圖像420和/或圖4C中的圖像430的虛擬板433中所示，控制器100突出顯示觸摸的目標區(qū)域。圖4C是示出在虛擬板打開的狀態(tài)下按壓快門時的示例的視圖。目標區(qū)域431指示識別的目標或文本的指示符邊框，虛擬板433指示用于移動焦點的虛擬板。其中，可在設(shè)置(默認為關(guān)閉)中啟用虛擬板，并且當圖像處理超時時彈出所述虛擬板。特定目標區(qū)域435指示在TTS首先讀取所有識別的目標之后，最左邊的目標被默認突出顯示(聚焦)。圖5是示出根據(jù)本發(fā)明的示例性實施例的便攜式終端中的菜單的配置的視圖。參照圖5，用戶可從菜單500選擇存儲在存儲器110中的捕捉讀取器圖像，并設(shè)置是否存儲捕捉讀取器圖像和是否顯示虛擬板。在菜單500中，加載按鈕510可允許選擇存儲在存儲器110中的圖像，設(shè)置按鈕530可允許用戶設(shè)置是否使用捕捉讀取器圖像和虛擬板，并且?guī)椭粹o550激活用于解釋捕捉讀取器模式中的操作的菜單的顯示。當例如通過敲擊手勢從菜單500選擇設(shè)置按鈕530時,如顯示的窗口 531所示,啟用設(shè)置用于存儲捕捉讀取器圖像的存儲器110和設(shè)置是否使用虛擬板。這里，當選擇安全數(shù)字(SD)卡時，將其后產(chǎn)生的捕捉讀取器圖像存儲在SD卡中，其中，所述SD卡可被連接到圖1的便攜式終端或被包括在圖1的便攜式終端中，或可選擇地，所述SD卡可被包括在存儲器110中或被連接到存儲器110。此外，如果選擇虛擬板，則例如如圖4C所示，虛擬板覆蓋在觸摸屏130上顯示的圖像上。這里，當在捕捉讀取器圖像中選擇目標區(qū)域時，可設(shè)置便攜式終端，使得在虛擬板被打開時，觸摸操作不被執(zhí)行。例如，可設(shè)置便攜式終端，使得在虛擬板被打開時，目標區(qū)域上的觸摸將不被處理。此外，虛擬板和觸摸操作可被設(shè)置為彼此獨立地被執(zhí)行。此外，當選擇菜單500中的加載按鈕510時，如窗ロ 513中所示，存儲在存儲器中的圖像類別被顯示在觸摸屏130上。這里，當例如通過敲擊手勢在窗ロ 513中的圖像類別中選擇捕捉讀取器圖像時，捕捉讀取器圖像被顯示在窗ロ 515中，當通過敲擊手勢在窗ロ 515中選擇特定圖像時，如在窗ロ或屏幕517中顯示選擇的捕捉讀取器圖像。這里，當如通過產(chǎn)生和顯示窗ロ 515所示來執(zhí)行顯示操作時，控制器100檢測窗ロ 517中的選擇的圖像之內(nèi)的目標區(qū)域并識別選擇的圖像中的目標區(qū)域的位置。接下來，在檢測目標區(qū)域及其位置之后，控制器100如在窗ロ或屏幕517中顯示檢測的目標區(qū)域。這里，控制器100可通過字符和符號識別或web捜索來識別每個目標區(qū)域的目標信息，將識別的目標信息轉(zhuǎn)換為將被輸出的語音，并根據(jù)用戶的選擇來選擇目標區(qū)域。這里，在如窗ロ或屏幕517顯示圖像的步驟中可省略TTS功能。在這種情況下，控制器100可在對應于相機文件夾的保存圖像的選擇的圖像中檢測目標區(qū)域，執(zhí)行識別目標區(qū)域的位置的操作，并在檢測目標區(qū)域和識別目標區(qū)域的位置之后，如在窗ロ或屏幕517中顯示檢測的目標區(qū)域，其中，通過敲擊窗ロ 513中的相機圖像文件夾圖標上的圓圈上來表現(xiàn)選擇的圖像?？蓛H針對由用戶通過觸摸或虛擬板上的輕彈選擇的目標信息執(zhí)行TTS功能。然而，如圖5所示，如果在預定的超時時段之后沒有檢測到目標區(qū)域和/或沒有發(fā)現(xiàn)窗ロ或屏幕517的圖像中的檢測的目標的位置，則識別位置的操作超時，并且便攜式終端在屏幕519中顯示原始的選擇的圖像。在屏幕519中，顯示了 TTS首先讀取所有識別的項目。當TTS首先讀取所有識別的項目時，焦點相應地移動。圖6是示出根據(jù)本發(fā)明的示例性實施例的識別顯示捕捉讀取器圖像的選擇的區(qū)域的目標信息并將目標信息輸出為語音的示例的視圖。參照圖6，當顯示由相機獲得的捕捉讀取器圖像或存儲在存儲器110中的捕捉讀取器圖像時，控制器100可將由用戶選擇的目標區(qū)域的信息轉(zhuǎn)換為將被輸出的語音。當顯示捕捉讀取器圖像610并且用戶觸摸捕捉讀取器圖像610中的特定目標區(qū)域或通過使用虛擬板例如執(zhí)行敲擊手勢來選擇特定目標區(qū)域時，控制器100檢測敲擊手勢并將選擇的目標區(qū)域突出顯示在觸摸屏130上。在圖6中，捕捉讀取器圖像610對應于用戶觸摸或敲擊目標區(qū)域的情況，所述目標區(qū)域隨后被突出顯示和/或改變顏色，如在與捕捉讀取器圖像610中的皇后中城隧道交通標志相應的目標區(qū)域使用陰影線顯示圖標所示。接下來，控制器100識別選擇的目標區(qū)域的信息以轉(zhuǎn)換為字符數(shù)據(jù)，并將轉(zhuǎn)換后的字符數(shù)據(jù)轉(zhuǎn)換為通過輸出TTS消息620 (諸如“皇后中城隧道，交通標志”)表現(xiàn)的語音，其中，通過語音處理單元140輸出語音。這里，識別目標區(qū)域的信息的方法包括:在字符圖像的情況下，識別字符并將其轉(zhuǎn)換為字符數(shù)據(jù)；在符號的情況下，捜索存儲在存儲器100中的符號，以訪問相應的符號的字符數(shù)據(jù)。此外，當目標信息不是字符圖像或存儲在存儲器HO中的圖像時，控制器100可通過web捜索來識別相應的目標信息，并將識別的信息轉(zhuǎn)換為字符數(shù)據(jù)。如上所述，在將圖像之內(nèi)的由用戶選擇的目標區(qū)域的信息轉(zhuǎn)換為將被輸出的語音之后，如圖像630所示，控制器100終止突出顯示選擇的目標區(qū)域，并準備下ー個狀態(tài)。圖7是示出根據(jù)本發(fā)明的示例性實施例的處理捕捉讀取器圖像的過程的流程圖。參照圖7，當顯示圖像時，在步驟711，控制器100檢查圖像是否是執(zhí)行語音引導的捕捉讀取器圖像。這里，捕捉讀取器圖像可以是在捕捉讀取器模式下由相機120拍攝的圖像或在存儲器110中存儲為捕捉讀取器圖像的圖像。如果圖像不是捕捉讀取器圖像，從而無法提供語音引導，則方法執(zhí)行便攜式終端的相應或不同的功能。否則，例如，如果在步驟711圖像需要語音引導，以從捕捉讀取器圖像產(chǎn)生語音，則在步驟713，控制器100檢測捕捉讀取器圖像之內(nèi)的目標區(qū)域。這里，區(qū)域檢測方法可被設(shè)置為例如檢測圖像之內(nèi)的輪廓的方法和/或使用色差的方法。例如，具有一個或多個含義的塊圖像可存在于捕捉讀取器圖像之內(nèi)。在圖2中，如圖4A至圖4C的圖像430的目標區(qū)域431更詳細地所示，存在三個目標區(qū)域。在這種情況下，在步驟713，控制器100檢測捕捉讀取器圖像之內(nèi)的目標區(qū)域，并在步驟715識別檢測的目標區(qū)域的位置。這里，識別位置信息的原因在于，當用戶通過使用虛擬板或觸摸屏130上的圖標或目標區(qū)域的觸摸來選擇特定目標區(qū)域時，移動目標區(qū)域的單元和/或識別相應的目標區(qū)域之內(nèi)的圖像信息。如上所述，當檢測捕捉讀取器圖像之內(nèi)的目標區(qū)域并識別目標區(qū)域的位置時，控制器100可將每個檢測的目標區(qū)域顯示在在觸摸屏130上顯示的捕捉讀取器圖像中。在如上所述識別目標區(qū)域的位置之后，在步驟717，控制器100執(zhí)行識別為字符數(shù)據(jù)并將目標區(qū)域的信息轉(zhuǎn)換為用于語音引導的語音的操作。圖8是示出在圖7的步驟717識別目標區(qū)域的信息并將目標區(qū)域的信息轉(zhuǎn)換為用于語音引導的語音的處理的流程圖。參照圖8，首先，在步驟811，控制器100分析檢測的目標區(qū)域。這里，當目標區(qū)域的信息是字符圖像時，在步驟813，控制器100首先檢測到該信息是字符圖像，在步驟815，識別字符圖像并將其轉(zhuǎn)換為字符數(shù)據(jù)，并進行到步驟817。然而，在步驟813，當目標信息不是字符圖像時，在步驟821，控制器100搜索存儲器110，以確定目標信息是否存儲在存儲器110中。這里，存儲在存儲器110中的目標信息可以是字符、符號、統(tǒng)一資源定位符(URL)等。在這種情況下，在步驟823，控制器100訪問存儲在存儲器100中的目標信息的字符數(shù)據(jù)，并進行到步驟817。然而，在步驟821，當目標信息不是字符圖像并且沒有被存儲在存儲器110中時，在步驟831執(zhí)行針對該目標信息的web搜索。在可選擇的實施例中，web搜索可以是由用戶設(shè)置的選項，并且當沒有設(shè)置web搜索時，可省略步驟831到步驟839。在另一可選擇的實施例中，在步驟831，控制器100可將是否執(zhí)行web搜索顯示為在觸摸屏130上顯示的向用戶的詢問。當用戶停止執(zhí)行web搜索時，控制器100可跳過步驟831至839。否則，在本發(fā)明的示例性實施例中，當web搜索被設(shè)置時，在步驟831，控制器100自動執(zhí)行web搜索。在這種情況下，當目標信息是URL時，可直接訪問相應的網(wǎng)站，以進行搜索。此外，如果目標信息是特定名稱(例如，人名和/或地址)，則可根據(jù)預設(shè)的用戶設(shè)置執(zhí)行web搜索。在步驟831執(zhí)行web搜索之后，在步驟833識別目標信息，并且在步驟835，控制器100確定目標信息是否可啟用語音引導。這里，如果目標信息可啟用語音引導，從而語音引導可用，則在步驟837將目標信息轉(zhuǎn)換為用于語音引導的語音形式的字符消息，并且如果在步驟835語音引導不可用，則在步驟839將目標信息轉(zhuǎn)換為字符數(shù)據(jù)形式的錯誤消息，并顯示錯誤消息。在步驟837或步驟839之后，方法進行到步驟817。如上所述，將捕捉讀取器圖像之內(nèi)的每個檢測的區(qū)域的目標信息識別和轉(zhuǎn)換為字符數(shù)據(jù)，并且在步驟817，控制器100將每個區(qū)域的目標信息轉(zhuǎn)換為將被輸出的語音。隨后，方法進行到圖7中的步驟719。
接下來，當用戶通過例如虛擬板指示觸摸屏130上的目標區(qū)域的移動時，在步驟719，控制器100檢測該移動，并在步驟721顯示移動的目標區(qū)域。隨后方法進行到步驟723。然而，如果在步驟719沒有指示或檢測到移動，則方法直接進行到步驟723。在步驟723，如果用戶沒有選擇顯示的目標區(qū)域，則方法進行到步驟727，以檢測終止命令。否則，當用戶選擇通過虛擬板或用戶的觸摸來選擇顯示的目標區(qū)域時，在步驟723控制器100檢測這樣的選擇，在步驟725將選擇的目標區(qū)域的信息識別為字符數(shù)據(jù)，并將識別的字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。例如，當在圖6中示出的屏幕610上觸摸特定目標區(qū)域時，控制器100分析觸摸的或選擇的目標區(qū)域的信息。這里，在字符圖像的情況下，控制器100執(zhí)行圖8的步驟815和817，以將字符圖像識別為字符數(shù)據(jù)，并將識別的字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。此外，在存儲在存儲器110中的目標信息的情況下，控制器100執(zhí)行步驟823和步驟817，以訪問與存儲器110中的目標信息相應的字符數(shù)據(jù)，并將字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。此外，當需要web搜索時，控制器100執(zhí)行步驟831至839和817，以將通過web搜索捜索到的信息轉(zhuǎn)換為將被輸出的語音。當執(zhí)行以上操作以執(zhí)行步驟725時，將捕捉讀取器圖像之內(nèi)的目標區(qū)域的信息識別為字符數(shù)據(jù)，并將其轉(zhuǎn)換和輸出為語音，然后，當用戶產(chǎn)生終止命令吋，在步驟727，控制器100檢測終止命令的輸入，并終止捕捉讀取器圖像顯示。然而，在步驟727，如果終止命令沒有被輸入，則方法回到步驟719。這里，在圖8中更詳細示出的圖7的步驟717中，將捕捉讀取器圖像之內(nèi)的每個目標區(qū)域的信息轉(zhuǎn)換為字符數(shù)據(jù)，并再次將轉(zhuǎn)換后的字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音，其中，在觸摸屏130上顯示初始的捕捉讀取器圖像時，顯示所述捕捉讀取器圖像。然而，可省略圖7的步驟717。在這種情況下，可僅在根據(jù)用戶的選擇將目標區(qū)域的信息轉(zhuǎn)換為語音時，執(zhí)行在步驟719至步驟725的操作和功能。如上所述，根據(jù)本發(fā)明的便攜式終端可在設(shè)置模式下設(shè)置捕捉讀取器圖像顯示模式。當捕捉讀取器圖像顯示模式被設(shè)置并且用戶通過相機拍攝捕捉讀取器圖像或顯示存儲在存儲器110中的捕捉讀取器圖像時，控制器100檢測捕捉讀取器圖像之內(nèi)的目標區(qū)域，識別目標區(qū)域的位置，識別識別的區(qū)域的目標信息，并將目標信息轉(zhuǎn)換為將被輸出的語音。這里，表現(xiàn)捕捉讀取器圖像的示例可包括讀取標志、讀取公告和識別面部。首先，在標志讀取的情況下，當在街上或在停止的車輛中通過使用相機120拍攝捕捉讀取器圖像時，便攜式終端將圖像的信息轉(zhuǎn)換為字符數(shù)據(jù)，并將字符數(shù)據(jù)轉(zhuǎn)換為語音，以將捕捉讀取器圖像表現(xiàn)為語音。這里，當電話號碼包括在捕捉讀取器圖像之內(nèi)時，可通過使用便攜式終端的呼叫發(fā)起按鈕或命令，執(zhí)行呼叫發(fā)起功能。此外，在公告讀取的情況下，用戶可將有用的信息的圖像(例如，地鉄路線圖或路標)拍攝為捕捉讀取器圖像，并將拍攝的圖像的信息表現(xiàn)為語音，從而在沒有另一人的幫助的情況下，識別和確定信息。此外，在面部識別的情況下，可通過使用縮放功能拍攝位于遠距離的人的面部，并將其與存儲在存儲器110中的面部(例如，存儲在便攜式終端的電話本中的人的面部或登記的面部)進行比較，以確定人的身份。本發(fā)明提供的以上描述的功能對于視障者來說是有用的。在根據(jù)示例性實施例的用于表現(xiàn)便攜式終端的圖像的方法和設(shè)備中，捕捉讀取器圖像表現(xiàn)模式被提供，以表現(xiàn)圖像并將圖像或圖像中的目標轉(zhuǎn)換為語音，使得在顯示圖像時，圖像之內(nèi)的每個目標區(qū)域被檢測，以識別每個目標區(qū)域的位置，并且當用戶選擇目標區(qū)域吋，將相應的目標區(qū)域的圖像信息轉(zhuǎn)換為字符數(shù)據(jù)，并且將字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。因此，由相機拍攝的圖像可被行人導航功能采用，并且當高分辨率相機被提供時，多種應用可提供這樣的圖像。具體地講，對于視障者，專用相機功能可被提供，以有效地執(zhí)行例如方向引導。可以以硬件、固件實現(xiàn)根據(jù)本發(fā)明的上述設(shè)備和方法，或者所述設(shè)備和方法可被實現(xiàn)為可被存儲在記錄介質(zhì)(諸如，CD ROM、RAM、ROM、軟盤、DVD、硬盤、磁存儲介質(zhì)、光記錄介質(zhì)或磁光盤)中的軟件或計算機代碼、或最初存儲在遠程記錄介質(zhì)、計算機可讀記錄介質(zhì)或非暫時性機器可讀介質(zhì)上而通過網(wǎng)絡下載并存儲到本地記錄介質(zhì)的計算機可讀代碼，從而可使用通用計算機、數(shù)字計算機或?qū)ｉT的處理器在存儲在記錄介質(zhì)上的軟件中實施在此描述的方法，或者在可編程或?qū)Ｓ玫挠布?諸如，ASIC或FPGA)中實施在此描述的方法。如本領(lǐng)域的技術(shù)人員所理解，計算機、處理器、微處理器控制器或可編程硬件包括存儲器組件(例如，可存儲或接收軟件或計算機代碼的RAM、R0M、閃存等，當由計算機、處理器或硬件訪問或執(zhí)行所述軟件或計算機代碼時，可實施在此描述的處理方法)。另外，將認識到，當通用計算機訪問用于實現(xiàn)在此示出的處理的代碼時，代碼的執(zhí)行將通用計算機變換為用于執(zhí)行在此示出的處理的專用計算機。雖然以上已詳細描述了本發(fā)明的示例性實施例，但是應清楚地理解，對于本領(lǐng)域的技術(shù)人員來說顯然的在此教導的基本發(fā)明構(gòu)思的很多變化和修改，仍將落入權(quán)利要求限定的本發(fā)明的精神和范圍之內(nèi)。
權(quán)利要求
1.一種用于在便攜式終端中顯示圖像的設(shè)備，所述設(shè)備包括: 相機，被配置用于拍攝圖像；觸摸屏，被配置用于顯示圖像并允許選擇顯示的圖像的目標區(qū)域；存儲器，被配置用于存儲圖像；控制器，被配置用于當顯示得自相機或存儲器的圖像時，檢測圖像之內(nèi)的目標區(qū)域，并被配置用于將檢測的目標區(qū)域的目標信息識別為字符數(shù)據(jù)，以將所述字符數(shù)據(jù)轉(zhuǎn)換為語曰；音頻處理單元，被配置用于輸出語音。
2.按權(quán)利要求1所述的設(shè)備，其中，控制器包括: 區(qū)域檢測單元，被配置用于檢測包括在圖像之內(nèi)的目標的區(qū)域；位置識別單元，被配置用于識別檢測的圖像之內(nèi)的區(qū)域的位置；對象識別單元，被配置用于將識別的目標區(qū)域的圖像信息識別和轉(zhuǎn)換為字符數(shù)據(jù)；語音轉(zhuǎn)換單元，被配置用于將字符數(shù)據(jù)轉(zhuǎn)換為語音。
3.按權(quán)利要求2所述的設(shè)備，其中，目標識別單元包括用于將目標信息的字符圖像轉(zhuǎn)換為字符數(shù)據(jù)的光學字符識別(OCR)引擎。
4.按權(quán)利要求3所述的設(shè)備，其中，控制器顯示與顯示的圖像重疊的虛擬板，并顯示通過虛擬板上的輕彈的目標區(qū)域的移動。
5.按權(quán)利要求4所述的設(shè)備，其中，當檢測到觸摸屏上的觸摸時，控制器將在檢測的觸摸位置處的目標區(qū)域的信息轉(zhuǎn)換為字符數(shù)據(jù)，并將轉(zhuǎn)換后的字符數(shù)據(jù)轉(zhuǎn)換為語音。
6.一種用于在便攜式終端中表現(xiàn)圖像的方法，所述方法包括: 當顯示圖像時，檢查所述圖像是否將被表現(xiàn)為語音；當圖像將被表現(xiàn)為語音時，檢測圖像的多個目標區(qū)域；通過識別檢測的圖像之內(nèi)的每個目標區(qū)域的位置，顯示每個目標區(qū)域與至少一個其它目標區(qū)域區(qū)分的圖像；當接收圖像的目標區(qū)域的選擇時，將選擇的目標區(qū)域的目標信息識別為字符數(shù)據(jù)；將識別的字符數(shù)據(jù)轉(zhuǎn)換為將被輸出的語音。
7.按權(quán)力要求6所述的方法，其中，將目標信息識別為字符數(shù)據(jù)的步驟包括: 將目標信息的字符圖像轉(zhuǎn)換為字符數(shù)據(jù)。
8.按權(quán)利要求6所述的方法，其中，將目標信息識別為字符數(shù)據(jù)的步驟包括: 當目標信息是字符圖像時，將字符圖像轉(zhuǎn)換為字符數(shù)據(jù)；當目標信息存儲在存儲器中時，訪問存儲器中的相應的字符數(shù)據(jù)；當目標信息不是字符圖像并且沒有存儲在存儲器中時，執(zhí)行web搜索，并將通過web搜索提取的信息轉(zhuǎn)換為字符數(shù)據(jù)。
9.按權(quán)利要求8所述的方法，在顯示每個目標區(qū)域與至少一個其它目標區(qū)域區(qū)分的圖像之后，還包括: 分析目標區(qū)域的信息；當目標信息是字符圖像時，將字符圖像轉(zhuǎn)換為字符數(shù)據(jù)；當目標信息存儲在存儲器中時，訪問存儲器中的相應的字符數(shù)據(jù)；當目標信息不是字符圖像并且沒有存儲在存儲器中時，執(zhí)行web搜索，并將通過web搜索提取的信息轉(zhuǎn)換為將被隨后輸出的字符數(shù)據(jù)；依次將目標區(qū)域的轉(zhuǎn)換后的字符數(shù)據(jù)輸出為語音。
10.按權(quán)利要求8所述的方法，還包括: 顯示與顯示的圖像重疊的虛擬板，并顯示通過虛擬板上的輕彈的目標區(qū)域的移動。
全文摘要
提供用于在便攜式終端中表現(xiàn)圖像的設(shè)備和方法。一種用于在便攜式終端中顯示圖像的設(shè)備包括相機，用于拍攝圖像；觸摸屏，用于顯示圖像并允許選擇顯示的圖像的目標區(qū)域；存儲器，用于存儲圖像；控制器，用于當顯示相機或存儲器的圖像時，檢測圖像之內(nèi)的至少一個目標區(qū)域，并用于識別檢測的目標區(qū)域的目標信息，以將其轉(zhuǎn)換為語音；音頻處理單元，用于輸出語音。
文檔編號G06F3/16GK103092507SQ20121044305
公開日2013年5月8日申請日期2012年11月8日優(yōu)先權(quán)日2011年11月8日
發(fā)明者樸賢美, 高祥赫申請人:三星電子株式會社

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：樸賢美;高祥赫
技術(shù)所有人：三星電子株式會社
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

不可用于多終端共享相關(guān)技術(shù)

便攜式移動執(zhí)法終端相關(guān)技術(shù)

便攜式數(shù)據(jù)終端相關(guān)技術(shù)

便攜式衛(wèi)星通信終端相關(guān)技術(shù)

移動終端便攜式打印機相關(guān)技術(shù)

便攜式無線網(wǎng)測試終端相關(guān)技術(shù)

便攜式終端相關(guān)技術(shù)

終端設(shè)備相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于在便攜式終端中表現(xiàn)圖像的設(shè)備和方法