欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理裝置、信息處理方法及軟件產(chǎn)品的制作方法

文檔序號:6419484閱讀:113來源:國知局
專利名稱:信息處理裝置、信息處理方法及軟件產(chǎn)品的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種諸如蜂窩電話,PHS(個人手持電話系統(tǒng)),PDA(個人數(shù)字助理),或膝上型電腦或手持個人計算機(jī)這樣的信息處理裝置,以及該裝置所采用的信息處理方法和該裝置中使用的軟件。
背景技術(shù)
日本專利公開No.2002-252691公開了一種便攜式電話終端,能夠通過OCR(光學(xué)字符識別)功能而輸入諸如地址,電話號碼和URL(統(tǒng)一資源定位符)這樣的印刷信息。
但上述文獻(xiàn)并未描述處理快門聲音的方法。
在日本公開了一種具有照相機(jī)的蜂窩電話。該蜂窩電話可輸出一種快門聲音以便避免在用戶照相時誤用照相機(jī)。該照相機(jī)只有在提供了提示其他人該操作的聲音后才能使用,因此,用戶就不能秘密地對其他人照相。然而,如果在每次使用OCR功能時都輸出快門聲音,則該聲音可能會使用戶感到厭煩。
因此需要一種改進(jìn)的信息處理裝置。

發(fā)明內(nèi)容
上述需要可通過下面提供的信息處理裝置得到滿足,該裝置包括照相機(jī),用于輸出圖像信息;選擇器,用于從多個模式中選擇照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于辨別照相機(jī)輸出圖像信息中所包含字符的識別模式;和揚聲器,用于輸出提示音。該信息處理裝置包括CPU,用于執(zhí)行控制以便當(dāng)用戶操作快門按鈕來使用照相機(jī)時,如果選擇了普通圖像獲取模式,則揚聲器以第一輸出級別輸出該提示音,如果選擇了識別模式,則揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。


圖1是表示信息處理裝置的結(jié)構(gòu)的框圖。
圖2是表示信息處理裝置的處理過程的流程圖。
圖3是表示信息處理裝置的示例性顯示屏的示意圖。
圖4是表示信息處理裝置的處理過程的流程圖。
圖5是表示信息處理裝置的示例性顯示屏的示意圖。
圖6是表示信息處理裝置的示例性顯示屏的示意圖。
圖7是表示在識別字符和顯示圖像之間的關(guān)系的表格。
圖8是表示顯示信息處理裝置中的識別結(jié)果的示例性顯示屏的示意圖。
圖9是表示顯示信息處理裝置中的字符識別結(jié)果的示例性顯示屏的示意圖。
圖10是表示信息處理裝置的示例性顯示屏的示意圖。
圖11是表示信息處理裝置的簡要示意圖。
具體實施例方式
下面將參照附圖詳細(xì)說明諸如蜂窩電話,PHS,PDA和膝上型電腦或手持個人計算機(jī)這樣的信息處理裝置的優(yōu)選實施例。在所有附圖中,相同的結(jié)構(gòu)元件將采用相同的參考標(biāo)記。
圖1是表示信息處理裝置10的結(jié)構(gòu)的框圖。
輸入單元101包括快門按鈕,電源按鈕,和包括數(shù)字鍵的多個按鍵。用戶操作輸入單元101以輸入各種信息,例如請求照相機(jī)103獲取圖像的圖像獲取命令,電源開/關(guān)命令,電話號碼和郵件地址等等。CPU(中央處理單元)102通過執(zhí)行存儲器104中存儲的程序來控制信息處理裝置100的各部件。
照相機(jī)103將拍攝的目標(biāo)轉(zhuǎn)換為YUV系統(tǒng)的圖像信息,并將該圖像信息提供到CPU 102。拍攝目標(biāo)的例子包括人的面部,一幅景色和字符等等。YUV系統(tǒng)的圖像是由亮度信號(Y),亮度信號和紅色分量之間的差值(U)以及亮度信號和藍(lán)色分量之間的差值(V)來表示的3條信息。
照相機(jī)103可轉(zhuǎn)換的圖像信息并不局限于YUV系統(tǒng)。只要CPU 102可以處理該圖像信息,拍攝的目標(biāo)可以被轉(zhuǎn)換為任何形式的圖像信息。
CPU 102將YUV系統(tǒng)的圖像信息轉(zhuǎn)換為RGB(紅綠藍(lán))等系統(tǒng)的圖像信息,并將轉(zhuǎn)換后的圖像信息輸出到顯示器107。
當(dāng)觀看輸出到顯示器107的圖像信息時,用戶選擇將要拍攝的圖像并按下快門按鈕。當(dāng)用戶按下快門按鈕時,存儲器104存儲照相機(jī)103輸出的圖像信息。
存儲器104通常是一個ROM(只讀存儲器)或RAM(隨機(jī)存儲器)。存儲器104也可用于存儲視頻和/或音頻數(shù)據(jù),以及CPU 102將要執(zhí)行的軟件等,以便進(jìn)行操作。
圖像識別存儲器105存儲CPU 102執(zhí)行OCR(光學(xué)字符識別)功能的軟件程序。OCR功能是一種用于識別包括字母,記號,符號,標(biāo)記,數(shù)字和圖像中包含的識別信息的功能。
識別信息的例子可以是主頁地址,郵件地址,郵政地址,電話號碼,地理信息等等。識別信息的范圍并不局限于這些例子。只要該信息可以被用于識別事物,所述識別信息可以是任何信息。
字符識別包括以下步驟,由照相機(jī)103獲取的圖像識別包括字符的地點,將該包含字符部分的圖像數(shù)據(jù)劃分成預(yù)定的多個部分,將這些部分的每個數(shù)據(jù)轉(zhuǎn)換為參數(shù)值,并根據(jù)該參數(shù)值來判斷各部分中包含的信息。
作為例子,下面將說明圖像中包含的字符‘a(chǎn)bc’的識別。首先,識別該圖像中包含的字符‘a(chǎn)bc’的位置。然后,包含字符‘a(chǎn)bc’的該圖像數(shù)據(jù)部分被分割為包含字符‘a(chǎn)’,‘b’,‘c’的多個部分。將包含字符‘a(chǎn)’,‘b’,‘c’的數(shù)據(jù)部分轉(zhuǎn)換為各自的參數(shù)值。例如,參數(shù)值數(shù)字‘0’表示字符的白色部分,‘1’表示字符的黑色部分。對于每個部分,在字符模式數(shù)據(jù)內(nèi)包含的字符中選擇與該參數(shù)值最相近的字符。字符模式數(shù)據(jù)是將每個參數(shù)值與一個字符相關(guān)聯(lián)的數(shù)據(jù),該字符例如是對應(yīng)于參數(shù)值的字母符號??蓪⒆址J綌?shù)據(jù)預(yù)先存儲在存儲器104中,或者由用戶下載或安裝。
在此例子中,將專用于圖像處理軟件的存儲器作為圖像識別存儲器105?;蛘?,在CPU 102或存儲器104中內(nèi)置有圖像處理軟件,以便向CPU102提供OCR功能。通過在CPU 102或存儲器104中內(nèi)置圖像處理軟件,可以減少元件的數(shù)目,并能夠降低制造成本。
在此例中,為縮減電路規(guī)模,由CPU 102執(zhí)行OCR功能。然而,本發(fā)明的結(jié)構(gòu)并不局限于該例子。例如可以使用專用的處理器來實施OCR功能。
揚聲器106可輸出例如快門音和呼入音等聲音??梢苑謩e提供多個揚聲器來輸出呼叫音和輸出例如MP3文件、來電旋律這樣的再現(xiàn)聲音。作為另一種選擇,揚聲器不僅可以被設(shè)置成單聲道再現(xiàn)還可以被設(shè)置成立體聲再現(xiàn)。
顯示器107可顯示照相機(jī)103獲取的圖像及CPU 102辨別的識別信息。顯示器107還顯示使用該信息處理裝置的功能所需的屏幕。該屏幕包括各種信息,例如電源狀態(tài),電波強(qiáng)度,電池中的剩余電荷量,服務(wù)器連接狀態(tài),出現(xiàn)未讀郵件,呼入的電話號碼,郵件的目的地,發(fā)送郵件的文本,從呼叫者接收的呼入電話的電話號碼,接收郵件的文本和從連接的互聯(lián)網(wǎng)屏幕接收的數(shù)據(jù)。
以下說明描述了存在兩種圖像獲取模式的情況,即識別模式,用于獲取將要識別的圖像的識別模式,和普通圖像獲取模式,用于獲取普通照相功能將要存儲的人物和場景等的圖像。然而,本發(fā)明的范圍并不局限于這些模式。標(biāo)識存儲器108是一個存儲模式判斷標(biāo)識的存儲器,CPU 102使用該模式判斷標(biāo)識來判斷模式種類。模式判斷標(biāo)識在存儲器104存儲的軟件程序中被作為變量來處理。識別模式使用的模式判斷標(biāo)識的值不同于普通圖像獲取模式的值。CPU 102根據(jù)此變量來判斷該圖像獲取模式是識別模式還是普通圖像獲取模式。在此例子中,設(shè)置一個專用存儲器。然而,模式判斷標(biāo)識也可被存儲在存儲器104中。
通過參閱圖2所示的流程圖,以下的說明描述了根據(jù)該圖像獲取模式的種類的處理過程。
該信息處理裝置的用戶按下輸入單元101的快門按鈕(步驟S201)。然后,CPU 102從標(biāo)識存儲器108讀出模式判斷標(biāo)識的值,并判斷該圖像獲取模式是識別模式還是普通圖像獲取模式(步驟S202)。
如果該圖像獲取模式是識別模式,則CPU 102向照相機(jī)103發(fā)出一個圖像命令(步驟S203)。在此例子中,CPU 102執(zhí)行控制,以避免輸出快門聲音。然后將照相機(jī)103獲取并轉(zhuǎn)換的圖像存儲在存儲器104中。
CPU 102提取圖像中的字符(步驟S204)。字符的例子可以是郵件地址,例如通常被印刷在名片上的‘yamazaki@..yokohama.ne.jp’。將這些字符保存在存儲器104中作為識別的結(jié)果。在顯示器107上顯示識別的結(jié)果(步驟S205)。
例如,用戶將顯示器107中心處出現(xiàn)的標(biāo)記如‘+’、‘?’等等放在例如名字、郵件地址等等這樣的字符上面的位置處。這樣,可將顯示器107用作一個取景器。或者,用戶可操作輸入單元101來移動顯示器上的光標(biāo)以便指定將要識別的區(qū)域。
在用戶通過標(biāo)記或光標(biāo)指定區(qū)域后,當(dāng)用戶按下快門按鈕時,照相機(jī)103將圖像信息輸出到CPU 102,CPU 102執(zhí)行字符的識別。當(dāng)字符包含‘@’標(biāo)記時,CPU 102識別‘@’標(biāo)記之前和之后的字符作為郵件地址。
如果在移動圖像的再現(xiàn)期間執(zhí)行識別信息的識別處理,則再現(xiàn)模式切換到幀提供模式。從幀提供模式中顯示的靜止圖像中選擇識別信息的識別目標(biāo)。
也可以提供一種用戶不需按下快門按鈕的結(jié)構(gòu)。而是使用標(biāo)記或光標(biāo)來自動識別用戶指定的信息。
此外,也可以提供一種當(dāng)用戶按下快門按鈕時執(zhí)行識別范圍指定的結(jié)構(gòu)。該識別處理是在用戶再次按下快門按鈕或按下其他鍵之后執(zhí)行的。用戶可能會錯誤地將標(biāo)記或光標(biāo)移動到除了所需識別目標(biāo)位置之外的其他位置。通過確認(rèn)識別目標(biāo),就可以避免執(zhí)行多余的識別處理。
如果步驟S202中圖像獲取模式是普通的圖像獲取模式,則揚聲器106根據(jù)CPU 102發(fā)出的命令而輸出快門聲音(步驟S206)。照相機(jī)103獲取拍攝目標(biāo)的圖像(步驟S207)。將照相機(jī)103輸出的圖像存儲在存儲器104中(步驟S208)。
例如,在識別模式中,可將該信息處理裝置用作電子詞典。在此情況下,如果每次用戶試圖在詞典中查找單詞時都輸出快門聲音,則該聲音會使用戶感到厭煩。另外,在例如圖書館這樣的安靜場所中產(chǎn)生的快門聲音會使周圍的人產(chǎn)生不愉快的感覺。另外,人們希望僅僅是字符識別時產(chǎn)生的快門聲音不會使周圍的人誤以為被拍了照片。
通過上述的在普通圖像獲取模式中輸出快門聲音并避免在識別模式中輸出快門聲音,就可以避免用戶和周圍的人產(chǎn)生不愉快的感覺。
根據(jù)此例子中的識別模式,在拍照之前,用戶將顯示器107上的識別區(qū)域指定為一個取景器,從而可以避免用戶不發(fā)出快門聲音就秘密地拍照。最好,用戶能夠切換到其他操作過程,在該其他操作中,用戶能夠在拍照之后選擇識別區(qū)域。對用戶來說,將照相機(jī)103瞄準(zhǔn)紙張時使用標(biāo)記或光標(biāo)來指定識別區(qū)域可能是很困難的。在拍照之后,通過允許用戶指示識別區(qū)域,用戶就可以很容易地指定該區(qū)域。在此情況下,將圖像臨時地存儲在存儲器104中,并在三分鐘或五分鐘的預(yù)定時間之后刪除該圖像。即使在預(yù)定的時間段之前從信息處理裝置100輸出該圖像也是禁止的。通過禁止圖像的輸出,可以避免用戶的誤用。
在上述例子中,執(zhí)行控制以避免產(chǎn)生快門聲音。應(yīng)當(dāng)注意,也可以執(zhí)行控制來降低快門聲音的輸出級別(減少音量)。在此情況下,當(dāng)CPU 102判斷圖像獲取模式是識別模式時,CPU 102將快門聲音的輸出級別降低到低于普通圖像獲取模式的輸出級別。例如,CPU 102執(zhí)行控制以產(chǎn)生最低輸出級別的快門聲音。在此情況下,通過將作為識別目標(biāo)的字符封閉在閉合線中,并顯示該封閉的字符,用戶能夠很容易地得知從顯示器識別出了哪個字符。
圖3示出信息處理裝置的示例性顯示屏幕。屏幕301到303示出從普通圖像獲取模式變?yōu)樽R別模式的操作過程。屏幕304到306顯示出向顯示器107輸出在識別模式中對URL或郵件地址的字符識別結(jié)果的操作過程。
用戶操作輸入單元101從而在顯示器107上輸出特定的菜單屏幕。例如,用戶按下位于信息處理裝置的背面上的開關(guān)。通過選擇例如“開始照相”的菜單項目,顯示屏幕301。如果按下位于屏幕301右下角的“菜單”按鈕,則顯示屏幕302。屏幕302示出涉及圖像獲取操作的菜單。如果選擇了“(1)識別模式”,則顯示屏幕303。
屏幕303用于提示用戶已經(jīng)將識別模式設(shè)定為圖像獲取模式。當(dāng)按下“識別”按鈕時,顯示屏幕304。屏幕304示出識別模式已經(jīng)開始后的狀態(tài)。當(dāng)按下“識別”按鈕時,顯示屏幕305但不發(fā)出快門聲音。屏幕305用于提示用戶正在執(zhí)行識別處理。當(dāng)識別處理結(jié)束時,顯示屏幕306。屏幕306顯示出識別處理的結(jié)果。
通過向顯示器107輸出上述的顯示屏幕,用戶可以很容易地選擇識別模式,識別作為識別目標(biāo)的標(biāo)識符,例如郵件地址和URL。
圖4示出當(dāng)將識別模式設(shè)定為圖像獲取模式時,編輯所獲取的圖像并顯示作為編輯處理結(jié)果而得到的圖像的處理過程的流程圖。
信息處理裝置在存儲器104存儲有用于執(zhí)行圖像編輯處理所需的軟件。CPU 102執(zhí)行基于該軟件的處理。在該例子中,為了縮小電路規(guī)模,將圖像編輯功能嵌入到CPU 102中。但是,本發(fā)明的結(jié)構(gòu)并不局限于該例子。例如,可以使用專用芯片來執(zhí)行圖像處理功能。
當(dāng)按下快門按鈕時,CPU 102向照相機(jī)103發(fā)出獲取圖像的命令(步驟S401)。照相機(jī)103將照相目標(biāo)轉(zhuǎn)換為圖像信息并將該圖像信息存儲在存儲器104中(步驟S402)。
CPU 102執(zhí)行圖像識別存儲器105中的程序,并從存儲器104中所存儲的圖像信息中確定作為識別目標(biāo)的包括字符的目標(biāo)范圍(步驟S403)。例如,假設(shè)將一矩形范圍確定為目標(biāo)范圍。該矩形范圍具有一對角線,該對角線將在右方向上偏離圖像左上角處的原點x0個像素且在下方向上偏離該原點Y0個像素的點與在右方向上偏離該原點X1個像素且在下方向上偏離該原點Y1個像素的另一個點連接起來。在該例子中,圖像識別操作自動確定目標(biāo)范圍。但是,用戶通??梢酝ㄟ^使用光標(biāo)來任意地設(shè)定目標(biāo)范圍。
CPU 102識別該圖像的目標(biāo)范圍內(nèi)的字符并將識別結(jié)果存儲在存儲器104中(步驟S404)。CPU 102編輯識別范圍以外的部分,產(chǎn)生不同于原始圖像的新圖像,并將該新圖像存儲在存儲器104中。
然后,CPU 102從存儲器104中讀出該新圖像和識別目標(biāo)的圖像,在顯示器107上顯示這些圖像(步驟S406)。最后,在下一步驟S407中,CPU102從存儲器104中讀出字符識別處理的結(jié)果并將該結(jié)果輸出到顯示器107。
圖5示出信息處理裝置的示例性顯示屏幕。說明書中解釋了從例如名片等紙上讀出印刷在該紙上的例如URL等字符的情況。
屏幕501示出顯示出已經(jīng)啟動了識別模式的狀態(tài)的屏幕。當(dāng)按下屏幕501上的“識別”按鈕時,顯示出屏幕502。屏幕502顯示出正在執(zhí)行識別處理。當(dāng)識別處理結(jié)束時,顯示屏幕503。屏幕503是用于編輯除了如字符這樣的識別目標(biāo)以外的一部分圖像并將識別結(jié)果與作為編輯結(jié)果的所獲得的圖像一起顯示出來的屏幕。
下面的描述解釋了在識別模式中對一個人照相的情況。當(dāng)如在屏幕504中所示的屏幕107上顯示一個人時操作“識別”按鈕時,顯示屏幕505。屏幕505示出正在執(zhí)行識別處理。如果例如字符等識別信息沒有出現(xiàn)如對一個人照相的情況下,則利用黑色對所獲取圖像的整個屏幕著色,從而顯示出例如屏幕506這樣的屏幕。
應(yīng)當(dāng)注意,如果可以在很短的時間內(nèi)執(zhí)行識別處理,則CPU 102可以從揚聲器106中發(fā)出快門聲音,而不是顯示不同于所獲取圖像的圖像。
識別模式用于偷拍操作等,因為可以在不發(fā)出快門聲音或發(fā)出很小的快門聲音的情況下拍照。即使執(zhí)行了偷拍操作,也不會顯示除了字符和符號之外的圖像,或者會發(fā)出快門聲音。因此,可以防止偷拍操作。
應(yīng)當(dāng)注意識別目標(biāo)以外的部分的顏色并不局限于黑色。就是說可以利用例如紅色或黃色等其他顏色來對該部分進(jìn)行著色?;蛘?,可以將該部分表現(xiàn)為如圖6所示的格子圖案、條紋圖案或圓點花樣圖案。另外,如果可以肉眼檢測到作為識別目標(biāo)的字符,則可以利用馬賽克顯示出該部分?;蛘?,可以顯示另外圖像的圖案或一部分。
另外,為了使識別的結(jié)果容易理解,可以通過將黑色轉(zhuǎn)變?yōu)榘咨驅(qū)咨D(zhuǎn)變?yōu)楹谏珡亩癸@示反轉(zhuǎn),或者可以改變顯示畫面的顏色。但是,本發(fā)明并不局限于上述的通常顯示畫面??梢詫⒆R別的結(jié)果顯示在任何顯示畫面中,只要在該圖像中可以清楚的辨認(rèn)出該識別結(jié)果即可。例如,除了顯示對字符的識別結(jié)果外,還可以將識別結(jié)果顯示為花體字符,靜態(tài)圖像或動態(tài)圖像來表現(xiàn)該結(jié)果。
圖7示出表示所識別的字符和所顯示的圖像之間的關(guān)系的表格。該表格將CPU 102所識別出的標(biāo)識信息701的類型與圖像文件名稱702聯(lián)系起來,該圖像文件名稱702是包含所顯示圖像的文件的名稱。該表格存儲在存儲器104中。例如,CPU 102根據(jù)標(biāo)識信息中出現(xiàn)的字符“http”或字符“@”,識別該標(biāo)識信息的類型。
圖8示出顯示字符識別結(jié)果的屏幕。在該屏幕中,確定作為識別目標(biāo)的字符為郵件地址。從存儲器104中讀出該郵件地址的圖像文件名稱e-mail.jpg。
通過以這種方式顯示與識別目標(biāo)相關(guān)的圖像,用戶可以直觀地知道所需字符的識別結(jié)果。另外,如果提供了用于將把各郵件地址與該郵件地址所指定的個人圖像相關(guān)聯(lián)起來的關(guān)系分類的表格,則用戶可以很容易的知道從識別結(jié)果所獲得的郵件地址所指定的個人。這樣,用戶就可以高度方便地使用該信息處理裝置。
或者,將從所照的圖像中隨機(jī)選擇出的圖像顯示在除了作為識別目標(biāo)的字符以外的部分上。當(dāng)在識別模式中識別出字符以后,向CPU 102施加表示識別處理結(jié)束的識別結(jié)束信號。CPU 102接收該識別結(jié)束信號,然后隨機(jī)選擇存儲在存儲器104中的圖像,并將該圖像顯示在顯示器107上。由于所顯示的圖像隨識別而改變,因此用戶并不熟悉每次識別標(biāo)識時所顯示的圖像。因此,用戶并不會由于每次識別所顯示的圖像都相同而對所顯示的圖像感到厭倦。因此,用戶可以更好地享受該信息處理裝置。
應(yīng)當(dāng)注意在識別目標(biāo)以外的部分中所顯示的圖像并不一定是預(yù)先存儲在存儲器104中的圖像。例如,圖像也可以是用戶利用圖像生成軟件所創(chuàng)造的圖像或者從互聯(lián)網(wǎng)上下載的圖像。因此,所顯示的圖像變化數(shù)目增加,從而允許用戶更方便地使用該信息處理裝置。
另外,可以將例如字符等識別目標(biāo)按照放大或縮小的尺寸顯示。放大顯示畫面的例子是利用2×2像素的顯示畫面來顯示1×1的原始顯示畫面。通過顯示放大或縮小尺寸的識別目標(biāo),用戶可以很容易地識別該識別結(jié)果。另外,如果將所識別的字符放大,則可以隱藏原始獲取的圖像的大部分,從而可以也可以實現(xiàn)避免偷拍操作。
下面將解釋與該識別結(jié)果相關(guān)的信息和該結(jié)果一起顯示的例子。
存儲器104存儲了字典數(shù)據(jù),例如英-英字典。當(dāng)利用字符識別功能識別出單詞時,從存儲器104中讀出該單詞的解釋。將該單詞和解釋分別作為識別結(jié)果和與該結(jié)果相關(guān)的信息顯示出來。存儲器104可以存儲出了英-英字典之外的多種字典日期,例如英-日字典和英-西字典等。例如,當(dāng)選擇英-日字典且識別出英語單詞時,可以將日語翻譯作為與該識別結(jié)果相關(guān)的信息顯示出來。
在該情況下,該單詞的解釋的量可能非常大,以至于在一或兩行內(nèi)顯示不下。為了解決這種問題,可以將用于顯示識別結(jié)果的位置移到顯示器107的屏幕的頂部、底部、左側(cè)或右側(cè),從而可以為顯示與該識別結(jié)果相關(guān)的信息提供更大的空間。
圖9示出用于識別字符的處理的典型顯示屏幕。屏幕901顯示出一個狀態(tài),其中正在監(jiān)視的一頁紙的頁面。該頁面包含單詞。如果在利用標(biāo)記或光標(biāo)指示顯示屏107上的字符“識別”時按下“識別”按鈕時,開始識別字符的處理并顯示屏幕902以替換屏幕901。當(dāng)識別字符的處理結(jié)束時,顯示屏幕903以替換屏幕902。在屏幕903上,將所獲得的圖像的全部顯示畫面向上移,從而提供可用于顯示單詞“識別”的定義的空間,該單詞“識別”作為識別的目標(biāo)。通過以這種方式移動顯示位置,可以顯示與識別目標(biāo)相關(guān)的信息,從而使用戶可以更自由地使用該信息處理裝置。
應(yīng)注意,在該例子中,預(yù)先在存儲器104中存儲了顯示位置位移的數(shù)據(jù)。該顯示位置位移數(shù)據(jù)包括所識別的字符的位移方向、距離和目的地。CPU 102根據(jù)該顯示位置位移數(shù)據(jù)對作為識別目標(biāo)的字符執(zhí)行位移。但是本發(fā)明并不局限于該例子。例如,根據(jù)所獲得的圖像信息的量和/或相關(guān)信息的量,還可以得到最佳新位置和/或位移距離。這樣,根據(jù)顯示內(nèi)容,CPU 102就可以將作為識別目標(biāo)的字符移位到用戶可以很容易地看到的新位置。
在這種情況下,需要提供這樣一種結(jié)構(gòu),它可以通過保持識別目標(biāo)和未改變的目標(biāo)圖像之間的位置關(guān)系不變,來將作為識別目標(biāo)的字符移位。這樣,用戶就可以很容易地知道哪些字符已經(jīng)被識別,從而更方便地使用該信息處理裝置。如果例如已經(jīng)識別出不同字符,則很容易知道需要識別的字符位置與誤識別的字符的位置之間的關(guān)系。這樣,用戶就可以很容易地利用光標(biāo)等將識別范圍移動到所需字符處。
圖10示出顯示字符識別結(jié)果的示例性屏幕。屏幕1001示出所監(jiān)視的寫有單詞的紙頁的屏幕。當(dāng)執(zhí)行字符識別處理時,可以顯示屏幕1002以替換屏幕1001。在字符識別處理結(jié)束時,顯示屏幕1003來替換屏幕1002。
在屏幕1003上,在與監(jiān)視處理過程中相同的位置處顯示出作為識別目標(biāo)的字符串“識別”。屏幕1004和1005顯示出一個狀態(tài),其中整個圖像逐步向上移動。然后,如圖1006所示,僅顯示出作為識別目標(biāo)的字符串“識別”的圖像部分,可用空間可用于顯示相關(guān)信息,例如單詞的解釋。
通過以這種方式逐步改變顯示格式,用戶可以知道識別目標(biāo)的位置,且即使在具有很小屏幕的終端上也可以顯示與該識別結(jié)果相關(guān)的大量信息。因此,用戶可以更方便地使用該信息處理裝置。
另外,可以提供音頻合成單元,作為用于從揚聲器106輸出聲音的裝置,該聲音作為字符的替換物?;蛘撸€可以提供一按照摩爾斯信號震動的震動單元,或產(chǎn)生光的燈?;蛘?,可以提供用于根據(jù)字符信息創(chuàng)建盲文的盲文發(fā)生單元和用于通過改變形狀來顯示盲文的盲文顯示器。在該結(jié)構(gòu)中,盲文用作字符的替代物。
除了顯示以外,還可以提供其他結(jié)果提示方法,包括一種提示技術(shù)或多種提示技術(shù)的組合。這樣,僅僅懂得一點語言的孩子或者視力和聽覺比較差的人就可以很容易地獲知識別結(jié)果。
圖11示出信息處理裝置的外部示圖。該信息處理裝置包括具有顯示器107的外殼200和具有輸入單元101的外殼201。該外殼200和201利用鉸鏈1103彼此結(jié)合在一起,從而可以使外殼200和201折疊。另外,信息處理裝置具有普通照相按鈕1101和識別圖像按鈕1102。
當(dāng)按下普通照相按鈕1101時,照相機(jī)103對作為照相目標(biāo)的物體照相,并將獲取的圖像存儲在存儲器104中。如果需要,可以顯示該所獲取的圖像。相反,如果按下識別圖像按鈕1102,則照相機(jī)103對作為識別目標(biāo)的物體照相,在CPU 102執(zhí)行識別處理之后,將識別結(jié)果顯示在顯示器107上。
通過如上所述提供專用于識別模式和普通圖像獲取模式的獨立按鈕,用戶可以很容易地選擇這些模式中的一個,從而高度方便地使用該信息處理裝置。另外,通過如圖11所示,在信息處理裝置的側(cè)表面上提供按鈕,用戶可以在不考慮該信息處理裝置打開還是折疊的情況下執(zhí)行相同的操作,從而高度方便地使用該信息處理裝置。
理想情況下應(yīng)當(dāng)將普通照相按鈕1101和識別圖像按鈕1102作為不同的按鈕來提供。但是,也可以利用單一按鈕來替換該普通照相按鈕1101和識別圖像按鈕1102。通過利用單一按鈕來替換該普通照相按鈕1101和識別圖像按鈕1102,可以節(jié)約空間,使得信息處理裝置的大小減小。在這種情況下,需要將一個按鈕的操作區(qū)分為正常照相和用于識別的按鈕操作。例如,可以根據(jù)按鈕按下的持續(xù)時間或按下按鈕的次數(shù),即根據(jù)按鈕是單擊操作還是雙擊操作將模式從普通圖像獲取模式轉(zhuǎn)換為識別模式,反之亦然。該普通照相按鈕1101和識別圖像按鈕1102可以是屬于信息處理裝置100的多個傳感器中的任意幾個,只要用戶可以區(qū)分他們即可。
另外,在信息處理裝置具有呼叫功能,即是蜂窩電話的情況下,存在正在執(zhí)行OCR功能的同時打入電話的情況。在這種情況下,當(dāng)利用圖中未示出的通信單元通知電話進(jìn)入時,CPU 102中斷識別模式,將例如圖像信息或字符參數(shù)值等數(shù)據(jù)存儲在存儲器104中,并處理該呼叫。在電話結(jié)束時,重新恢復(fù)識別模式狀態(tài)。
這樣,即使在正在執(zhí)行OCR的時候有電話打入,也可以響應(yīng)該打入的電話。另外,在接收和處理電話的處理過程結(jié)束之后,可以恢復(fù)在電話打入之前的狀態(tài)。因此,不再需要故意重新開始識別模式。因此,用戶可以很方便地使用該信息處理裝置。
另外,在信息處理裝置可以同時執(zhí)行聲音通信和數(shù)據(jù)通信的情況下,CPU 102可以執(zhí)行處理從而同時執(zhí)行OCR功能和電話功能。這樣,用戶就可以在進(jìn)行電話交流的同時,利用OCR功能識別印刷在名片上的信息。
另外,還可以提供這樣一種結(jié)構(gòu),其中利用信息處理裝置例如蜂窩電話中給出的郵件功能,可以將OCR功能所給出的識別結(jié)果發(fā)送到指定目的地。
在這種情況下,當(dāng)用戶在電話期間對輸入單元101執(zhí)行預(yù)定操作時,CPU 102可以執(zhí)行處理從而轉(zhuǎn)換到識別模式。然后,在識別了字符之后,用戶可以操作輸入單元101以啟動郵件功能。當(dāng)郵件功能啟動時,CPU 102執(zhí)行存儲在存儲器104中的郵件功能,在顯示器107上顯示郵件創(chuàng)建屏幕。此時,如果已經(jīng)識別出名片等上所寫的郵件地址,則CPU 102執(zhí)行處理從而自動地將作為識別結(jié)果而獲得的郵件地址插入到正在創(chuàng)建的郵件的主文本區(qū)域。
或者,還可以提供這樣一種結(jié)構(gòu),其中用戶可以從預(yù)先存儲在存儲器104中的地址信息中選擇出郵件地址,并將該郵件地址插入到地址區(qū)域中。該地址信息包括名字、電話號碼和郵件地址。
如上所述,可以通過執(zhí)行簡單的操作,將OCR產(chǎn)生的識別結(jié)果發(fā)送給所需的通信對方。這樣,用戶就可以高度方便地使用該信息處理裝置。另外,如果可以將目標(biāo)描述自動插入到主題區(qū)域,則可以省略輸入該主題描述的操作。因此,用戶可以更方便地使用該信息處理裝置。在這種情況下,目標(biāo)的描述可以是“OCR結(jié)果”等。
另外,在上述描述中,考慮到了主文本區(qū)域、地址區(qū)域和主題區(qū)域。但是,所創(chuàng)建的郵件的區(qū)域并不局限于這三個區(qū)域。即,也可以提供其他區(qū)域。在這種情況下,可以提供將對應(yīng)該新提供的區(qū)域的信息自動插入到該新區(qū)域中的結(jié)構(gòu)。
另外,根據(jù)上述描述,提供了可以將例如郵件地址等識別結(jié)果自動插入到郵件創(chuàng)建屏幕的區(qū)域中的結(jié)構(gòu)。但是,該結(jié)構(gòu)并不局限于此。例如,用戶可以通過操作輸入單元101輸入其他信息,例如注釋。就是說,發(fā)送到電話對方的信息并不僅包括由OCR功能產(chǎn)生的識別結(jié)果,還有例如對該識別結(jié)果的注釋等信息。應(yīng)當(dāng)注意在這種情況下,如果使用了預(yù)先存儲在存儲器104中的預(yù)定短語、花體字符等,則可以更方便地使用該信息處理裝置。
還應(yīng)當(dāng)注意為了實現(xiàn)上述例子功能而執(zhí)行的軟件并不必須地預(yù)先存儲在存儲器104中。相反,可以在用戶購買信息處理裝置之后,利用互聯(lián)網(wǎng)或記錄介質(zhì)在該信息處理裝置中安裝該軟件。在這種情況下,不需要新購買其他信息處理裝置。由于可以將新的功能增加到所購買的信息處理裝置中,因此可以降低費用。
這里使用的詞匯“記錄介質(zhì)”是指在實現(xiàn)該處理中所用到的任何介質(zhì)。這種介質(zhì)可以采用很多中形式,包括但不局限于非易失介質(zhì)、易失介質(zhì)和傳輸介質(zhì),非易失介質(zhì)包括例如光盤或磁盤。易失介質(zhì)包括動態(tài)存儲器。傳輸介質(zhì)可包括同軸電纜;銅線和光纖以及在這些物理連接中傳輸?shù)碾姟㈦姶呕蚬庑盘?。傳輸介質(zhì)還可以采用例如那些在射頻和紅外無線數(shù)據(jù)通信中所產(chǎn)生的電或電磁信號或者聲音或光波的形式。機(jī)器可讀介質(zhì)的通常形式包括例如軟盤、軟盤、硬盤、磁盤、磁帶、任何其他磁介質(zhì)、CD-ROM、DVD、任何其他光介質(zhì)、RAM、PROM、FLASH-EPROM、任何其他存儲芯片或盒式磁帶、載波傳輸數(shù)據(jù)或指令。
如上所述,可以提供一種信息處理裝置,它可以高度方便地被使用。
應(yīng)當(dāng)注意本發(fā)明的范圍并不局限于上述的例子,相反,在該說明書中描述的新的特征和原理包括著更為廣泛的技術(shù)范圍。
權(quán)利要求
1.一種信息處理裝置,包括照相機(jī),用于輸出圖像信息;選擇器,用于從多個模式中選擇照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出圖像信息中所包含字符的識別模式;和揚聲器,用于輸出提示音;和CPU,用于執(zhí)行控制從而當(dāng)用戶操作快門按鈕來操作照相機(jī)時,如果選擇了普通圖像獲取模式,則揚聲器以第一輸出級別輸出該提示音,如果選擇了識別模式,則揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。
2.如權(quán)利要求1所述的信息處理裝置,還包括存儲器,用于存儲至少一個圖像;和顯示器,其中在識別模式中,當(dāng)用戶操作快門按鈕時,顯示器在第一顯示區(qū)域中顯示包括在照相機(jī)所輸出的圖像信息中的字符,并在第二顯示區(qū)域中顯示存儲器中所存儲的圖像。
3.如權(quán)利要求2所述的信息處理裝置,其中在識別模式中,所述存儲器存儲與多個字符相關(guān)聯(lián)的多個圖像,并且當(dāng)用戶操作快門按鈕時,顯示器在第二顯示區(qū)域中顯示與照相機(jī)所輸出的圖像信息中所包括的字符相關(guān)聯(lián)的圖像。
4.如權(quán)利要求1所述的信息處理裝置,還包括存儲器,用于存儲多個圖像;和顯示器,在選擇了識別模式并同時操作了快門按鈕時,該顯示器在第一顯示區(qū)域中顯示包括在照相機(jī)所輸出的圖像信息中的字符,并在第二顯示區(qū)域中顯示一個圖像,該圖像是從存儲器中所存儲的多個圖像中隨機(jī)選擇出來的。
5.如權(quán)利要求1所述的信息處理裝置,還包括顯示器,其中在識別模式中,該顯示器在用戶操作快門按鈕之前作為相機(jī)取景器顯示字符,并在用戶操作快門按鈕之后使該字符的顯示位置移位。
6.如權(quán)利要求1所述的信息處理裝置,其中該字符包括字母、符號、記號、標(biāo)記、數(shù)字和識別信息中的至少一個。
7.一種信息處理裝置,包括照相機(jī),用于輸出圖像信息;選擇器,用于從多個模式中選擇照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出圖像信息中所包含字符的識別模式;存儲器,用于存儲至少一個圖像;和顯示器,如果選擇了識別模式,則當(dāng)用戶操作了照相機(jī)的快門按鈕時,顯示器在第一顯示區(qū)域中顯示包括在照相機(jī)所輸出的圖像信息中的字符,并在第二顯示區(qū)域中顯示存儲器中所存儲的圖像。
8.如權(quán)利要求7所述的信息處理裝置,其中存儲器存儲與多個字符相關(guān)聯(lián)的多個圖像;如果選擇了識別模式,則當(dāng)用戶操作快門按鈕時,顯示器在第二顯示區(qū)域中顯示與照相機(jī)所輸出的圖像信息中所包括的字符相關(guān)聯(lián)的圖像。
9.如權(quán)利要求7所述的信息處理裝置,其中存儲器存儲與多個字符相關(guān)聯(lián)的多個圖像;如果選擇了識別模式,則當(dāng)用戶操作了快門按鈕時,該顯示器在第二顯示區(qū)域中顯示一個圖像,該圖像是從存儲器中所存儲的多個圖像中隨機(jī)選擇出來的。
10.一種信息處理方法,包括以下步驟從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出圖像信息中所包含字符的識別模式;和當(dāng)照相機(jī)用戶操作快門按鈕時,如果選擇了普通圖像獲取模式,則控制信息處理裝置的揚聲器以第一輸出級別輸出提示音;如果選擇了識別模式,則控制揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。
11.一種信息處理方法,包括以下步驟在信息處理裝置的存儲器中存儲至少一個圖像;和從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于識別照相機(jī)輸出圖像信息中所包含字符的識別模式;如果選擇了識別模式,則當(dāng)用戶操作快門按鈕時,識別在照相機(jī)所輸出的圖像信息中所包括的字符;在第一顯示區(qū)域中顯示所識別的字符,并在第二顯示區(qū)域中顯示存儲器中所存儲的圖像。
12.一種軟件產(chǎn)品,包括記錄介質(zhì);由記錄介質(zhì)記錄并由信息處理裝置執(zhí)行的程序編碼,其中執(zhí)行程序編碼從而使信息處理裝置執(zhí)行一系列步驟,這些步驟包括從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出的圖像信息中所包含字符的識別模式;和當(dāng)照相機(jī)用戶操作快門按鈕時,如果選擇了普通圖像獲取模式,則控制信息處理裝置的揚聲器以第一輸出級別輸出提示音,以及如果選擇了識別模式,則控制揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。
13.一種軟件產(chǎn)品,包括記錄介質(zhì);由記錄介質(zhì)記錄并由信息處理裝置執(zhí)行的程序編碼,其中執(zhí)行程序編碼從而使信息處理裝置執(zhí)行一系列步驟,這些步驟包括在信息處理裝置的存儲器中存儲至少一個圖像;和從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于識別照相機(jī)輸出的圖像信息中所包含的字符的識別模式;如果選擇了識別模式,則當(dāng)用戶操作快門按鈕時,識別在照相機(jī)所輸出的圖像信息中所包括的字符;在第一顯示區(qū)域中顯示所識別的字符,并在第二顯示區(qū)域中顯示存儲器中所存儲的圖像。
14.一種包括可執(zhí)行指令的產(chǎn)品,其中執(zhí)行程序編碼從而使信息處理裝置執(zhí)行一系列步驟,這些步驟包括從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出的圖像信息中所包含字符的識別模式;和當(dāng)照相機(jī)用戶操作快門按鈕時,如果選擇了普通圖像獲取模式,則控制信息處理裝置的揚聲器以第一輸出級別輸出提示音,以及如果選擇了識別模式,則控制揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。
15.一種包括可執(zhí)行指令的產(chǎn)品,其中執(zhí)行程序編碼從而使信息處理裝置執(zhí)行一系列步驟,這些步驟包括在信息處理裝置的存儲器中存儲至少一個圖像;和從多個模式中選擇信息處理裝置中的照相機(jī)的一種模式,該多個模式包含用于識別照相機(jī)輸出的圖像信息中所包含字符的識別模式;如果選擇了識別模式,則當(dāng)用戶操作快門按鈕時,識別在照相機(jī)所輸出的圖像信息中所包括的字符;在第一顯示區(qū)域中顯示所識別的字符,并在第二顯示區(qū)域中顯示存儲器中所存儲的圖像。
全文摘要
一種信息處理裝置,包括照相機(jī),用于輸出圖像信息;選擇器,用于從多個模式中選擇照相機(jī)的一種模式,該多個模式包含用于作為普通照相機(jī)功能而獲取圖像的普通圖像獲取模式,和用于識別照相機(jī)輸出圖像信息中所包含的字符的識別模式;和揚聲器,用于輸出提示音。該信息處理裝置包括CPU,用于執(zhí)行控制從而當(dāng)用戶操作快門按鈕來使用照相機(jī)時,如果選擇了普通圖像獲取模式,則揚聲器以第一輸出級別輸出該提示音,以及如果選擇了識別模式,則揚聲器不輸出提示音或以低于第一輸出級別的第二輸出級別來輸出提示音。
文檔編號G06F17/00GK1578347SQ20041006351
公開日2005年2月9日 申請日期2004年7月9日 優(yōu)先權(quán)日2003年7月9日
發(fā)明者山崎正裕, 桑本英樹 申請人:株式會社日立制作所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
滨海县| 济阳县| 姜堰市| 中宁县| 社会| 杭州市| 铅山县| 遂昌县| 饶河县| 新平| 日喀则市| 舟曲县| 沂南县| 宾川县| 淮安市| 巫山县| 浏阳市| 灵川县| 左权县| 石林| 德庆县| 盐边县| 名山县| 麻城市| 潜山县| 红桥区| 望城县| 海盐县| 那坡县| 保山市| 博野县| 卢氏县| 黑水县| 灌阳县| 万安县| 长兴县| 金坛市| 横峰县| 济阳县| 广宗县| 平原县|