專利名稱:用于與移動電話相關(guān)聯(lián)的照相機(jī)的音頻控制的系統(tǒng)和方法
背景當(dāng)今移動電話包括被設(shè)計用于加強(qiáng)用戶體驗的成熟的硬件和軟件。較新型移動電話的一個較為流行的特征是集成的照相機(jī)或者可附上的照相機(jī)附件。能夠即興拍照和共享照片已經(jīng)引起了移動電話消費(fèi)者的興趣。隨著大多數(shù)移動電話上強(qiáng)有力的數(shù)據(jù)應(yīng)用,共享移動電話拍下的照片變得更加容易。目前在許多移動電話上,至因特網(wǎng)或者其它移動電話的相對較高速度的數(shù)據(jù)連接已經(jīng)成為標(biāo)準(zhǔn)功能。這使得前所未有地易于拍下照片并將照片從一個移動電話發(fā)送到另一個移動電話或者發(fā)送到因特網(wǎng)電子郵件地址。雖然移動電話照相機(jī)功能的進(jìn)步非常突出,但是仍然需要用戶人工操作照相機(jī)功能以及人工制作并將照片發(fā)送到遠(yuǎn)端目的地。
拍照一般借助于特定的一系列擊鍵,通過手工開動照相機(jī)功能來完成。此外,由于用戶需要操作照相機(jī),因此用戶在許多照片中被排除在外。存在有線或無線控制來幫助操作照相機(jī),但是這需要配上另一種移動電話附件。
因此需要一種裝置,用于使用話音命令來操作移動電話的照相機(jī)功能。話音命令不需要使用單獨的附件并允許用戶在拍照和發(fā)送照片時更加靈活。
發(fā)明內(nèi)容
本發(fā)明的特征是移動電話和數(shù)字照相機(jī)的組合,其中可以通過音頻或者話音控制來控制數(shù)字照相機(jī)。數(shù)字照相機(jī)即可以集成到移動電話中或者也可以作為附件附屬于移動電話上。由于發(fā)明本質(zhì)的核心在于話音控制,因此移動電話至少包括一個麥克風(fēng),用于檢測音頻輸入。麥克風(fēng)可以是已經(jīng)駐留在移動電話上并由移動電話用來完成會話的麥克風(fēng)?;蛘啕溈孙L(fēng)可以是額外的集成到移動電話或者照相機(jī)附件上專用于照相機(jī)控制目的的麥克風(fēng)。
檢測到的音頻輸入被轉(zhuǎn)換成電信號并發(fā)送到處理器。處理器可以訪問存儲介質(zhì),所述存儲介質(zhì)包含致使處理器對檢測到的音頻輸入而進(jìn)行操作的軟件。處理器將檢測到的音頻輸入和照相機(jī)命令數(shù)據(jù)庫相對比來確定檢測到的音頻輸入是否與數(shù)據(jù)庫中的一個照相機(jī)命令相匹配。如果存在匹配,那么處理器執(zhí)行與照相機(jī)命令相關(guān)聯(lián)的一個指令集來完成期望的功能。
數(shù)據(jù)庫照相機(jī)命令代表許多功能,包括但是不限于,拍照、保存照片、刪除照片、以照片作為附件來構(gòu)造(compose)消息、以及調(diào)整照相機(jī)設(shè)置(例如,閃光燈、焦距等等)。每個數(shù)據(jù)庫命令與使處理器完成期望的功能的編碼指令相關(guān)聯(lián)。
附圖簡述
圖1圖示了具有照相機(jī)功能的移動電話的前視圖。
圖2圖示了具有照相機(jī)功能的移動電話的后視圖。
圖3是描述音頻控制與移動電話相關(guān)聯(lián)的照相機(jī)或照相機(jī)附件的過程的流程圖。
圖4是描述識別預(yù)定將操作照相機(jī)或照相機(jī)附件的音頻命令的過程的流程圖。
圖5是描述實施或執(zhí)行識別出的照相機(jī)命令的過程的流程圖。
詳細(xì)說明圖1圖示了具有照相機(jī)功能的移動電話的前視圖。在此圖示中,移動電話100被示為具有顯示區(qū)域102。移動電話還包括其它單元和特征,比如揚(yáng)聲器104、麥克風(fēng)106、標(biāo)準(zhǔn)數(shù)字鍵盤108以及控制移動電話的一個方面或多個方面的專用鍵110。其中一個專用鍵可以作為快門釋放按鈕112,它能夠拍照。
圖2圖示了圖1所示移動電話的后視圖。在該實施例中,移動電話和照相機(jī)集成到一個單獨單元上。其它的移動電話可以和能夠附到移動電話上的照相機(jī)附件一起行使功能。為了本發(fā)明,不用管照相機(jī)是集成到移動電話或者是作為附件附到移動電話,因為本發(fā)明著重于照相機(jī)控制而不是照相機(jī)本身。移動電話100的后面包括一個鏡頭114、一個電池蓋116、和第二麥克風(fēng)118。在圖1中鏡頭114的朝向只是舉例說明而已。鏡頭可以有不同的朝向,諸如,例如移動電話前面或者作為附到移動電話中的獨立附件。
麥克風(fēng)118是可選的并且它在移動電話上的朝向并不局限于圖2中所示。麥克風(fēng)118的目的是檢測預(yù)定要操作照相機(jī)的音頻命令。圖1所示的麥克風(fēng)106除了主要負(fù)責(zé)拾取在語音呼叫中發(fā)射的音頻之外,完全有可能也能夠適應(yīng)本發(fā)明。
沒有圖示出鏈接和控制各種外部特征的內(nèi)部處理單元。處理器和處理器可讀存儲介質(zhì)在內(nèi)部耦合到一起。記錄在處理器可讀存儲介質(zhì)中的代碼形式的指令致使事件根據(jù)調(diào)用的指令集而發(fā)生。還存在處理器可訪問的額外的存儲介質(zhì),用來保存諸如照相機(jī)拍攝的數(shù)字照片之類的數(shù)據(jù)。該存儲器也可以保存電話本或者聯(lián)系表(contact list)數(shù)據(jù),以幫助將照片從移動電話發(fā)送到其它目的地。聯(lián)系表數(shù)據(jù)能夠被保存在其它地方,例如保存在網(wǎng)站上,只要處理器能夠訪問數(shù)據(jù)來幫助構(gòu)造消息。
在集成到移動電話的照相機(jī)的標(biāo)準(zhǔn)操作中,用戶在將鏡頭114指向照片的目標(biāo)時,顯示器102用作取景器。因此,鏡頭114面對目標(biāo),而用戶能夠通過觀看顯示器102來調(diào)整拍攝(shot)。用戶一般將照相機(jī)握在一只手中來將鏡頭114對準(zhǔn)目標(biāo)。在調(diào)整拍攝,用戶的拇指(或者另一個指頭)能夠停留在快門按鈕112上。當(dāng)用戶滿意顯示器102上示出的拍攝時,她能夠按壓快門按鈕112來拍照。上述的所有步驟需要人工操縱移動電話以拍照。
一旦拍好了照片,用戶能夠決定對照片做些什么。一些選項包括刪除、保存和/或者將照片發(fā)送到另一個或多個目的地/接收者。這些功能一般由用戶使用鍵盤和顯示器提示來執(zhí)行。發(fā)送照片還要求用戶訪問他的聯(lián)系表來選擇向哪個接收者發(fā)送照片,或者手工輸入需要的聯(lián)系數(shù)據(jù)。
本發(fā)明的目的是提供一種替換方法來執(zhí)行上述(或其他)任務(wù),即不要求用戶過多地直接操縱移動電話。這可以通過由移動電話使用音頻控制照相機(jī)功能以及與拍照和發(fā)送照片相關(guān)聯(lián)的其它特征來完成。音頻控制減輕了對人工操縱移動電話來實現(xiàn)期望的結(jié)果的需要。
為了幫助用戶撥出,已經(jīng)在一些移動電話上實施了音頻控制,主要是作為允許用戶以“免提”方式操作移動電話的方便和/或者安全特征。本發(fā)明運(yùn)用相似的技術(shù)來控制照相機(jī)的操作以及與照相機(jī)相關(guān)聯(lián)的任務(wù),比如操縱照相機(jī)設(shè)置,記錄圖像和執(zhí)行任務(wù)。此外,音頻控制可以實施成使用語音識別,其中只有一個授權(quán)用戶能夠給出音頻命令,或者沒有語音識別,其中移動電話將接受來自多個用戶的輸入或者允許對同樣的話(words)執(zhí)行不同的功能。
圖3是描述音頻控制與移動電話相關(guān)聯(lián)的照相機(jī)或照相機(jī)附件的過程的流程圖。第一步,在框302圖示,啟動或者激活移動電話照相機(jī)或者照相機(jī)附件。雖然一般這是通過啟動移動電話上的一個開關(guān)、按鈕或者按鍵來實現(xiàn),但是如果移動電話已經(jīng)設(shè)置成接收音頻命令,該步驟也可以是通過發(fā)出“打開照相機(jī)”命令的話音激活。移動電話接著通過顯示消息來提示用戶,用戶是希望以標(biāo)準(zhǔn)模式操作照相機(jī)還是以音頻控制模式來操作照相機(jī),如在判斷框304中所示。如果用戶選擇以標(biāo)準(zhǔn)模式操作照相機(jī),那么標(biāo)準(zhǔn)照相機(jī)接口被激活306,并且用戶手工操作按鍵來操作照相機(jī)。否則,在照相機(jī)試圖檢測音頻命令時,將其設(shè)置成音頻控制308并進(jìn)入等待狀態(tài)310。麥克風(fēng)每次檢測到音頻輸入時,由判斷框312處理該音頻輸入,它判斷音頻命令是不是識別出的照相機(jī)命令。如果判斷框312的結(jié)果是否定的,那么照相機(jī)返回框310描述的等待狀態(tài)。如果判斷框312的結(jié)果是肯定的,那么照相機(jī)執(zhí)行如框314所示的識別出的照相機(jī)命令。
圖4是描述識別預(yù)定要操作照相機(jī)或照相機(jī)附件的音頻命令的過程的流程圖。該子過程是圖3的判斷框312產(chǎn)生出來的。為了識別照相機(jī)命令,移動電話首先檢測在麥克風(fēng)402的音頻輸入。之后該過程檢驗是否已經(jīng)調(diào)用了語音識別選項404。如果語音識別是激活的,則檢測到的音頻輸入被處理來判斷是否識別出說話者406。如果沒有識別出說話者,那么移動電話向用戶指示并且請求用戶重復(fù)命令408。之后控制返回到圖3的框310的等待狀態(tài)。如果識別出了說話者,下一步驟將檢測到的音頻輸入410與照相機(jī)命令數(shù)據(jù)庫412進(jìn)行對比。如果在框404沒有調(diào)用語音識別,那么也要執(zhí)行該步驟。判斷框414判斷在檢測到的音頻輸入和照相機(jī)命令數(shù)據(jù)庫412的一個條目之間是否存在數(shù)據(jù)庫匹配。如果沒有發(fā)現(xiàn)匹配,那么移動電話向用戶指示該結(jié)果,并請求用戶重復(fù)命令408。如果發(fā)現(xiàn)匹配,那么控制返回到圖3所示的主過程,識別出的命令在此被設(shè)置成被執(zhí)行。
圖5是描述實施或執(zhí)行識別出的照相機(jī)命令的過程的流程圖。該子過程是通過圖3的框314產(chǎn)生出來的。移動電話的負(fù)責(zé)操作照相機(jī)功能的內(nèi)部處理器首先查找與識別出的照相機(jī)命令502相關(guān)聯(lián)的指令。然后,指令被執(zhí)行504,并且控制返回到圖3的框310的等待狀態(tài)來等待另一條命令。
照相機(jī)命令能夠與照相機(jī)本身的設(shè)置和操作相關(guān)聯(lián),或者與對照相機(jī)所拍的照片的處理相關(guān)聯(lián)。屬于前者的命令包括但不限于,設(shè)置閃光設(shè)置,設(shè)置焦距并拍攝照片。屬于后者的命令包括但不限于,刪除、保存和/或?qū)⒄掌l(fā)送到一個或更多目的地/接收者。用戶能夠建立接收者的群組或者列表來發(fā)送某些照片。例如,通過調(diào)用像“發(fā)送到家庭”的命令,用戶孩子的照片能夠被發(fā)送到其他家庭成員。已經(jīng)創(chuàng)建了“家庭”列表,并且該列表包括每個接收者的必需的電子地址(或者其它聯(lián)系方式),比如但不限于電子郵件地址、另一個移動電話的多媒體消息服務(wù)(MMS)地址、或者網(wǎng)站。命令的第一部分“發(fā)送”,將調(diào)用移動電話的消息構(gòu)造功能。命令的“到家庭”部分指示電話將照片發(fā)送到家庭列表中的每個成員。一旦構(gòu)造了消息并附上了照片,那么移動電話將嘗試使用移動電話預(yù)訂的數(shù)據(jù)服務(wù)來自動地發(fā)送消息。消息構(gòu)造還包括添加或者插入文本或者音頻。為了同時創(chuàng)建文本或音頻內(nèi)容來伴隨被發(fā)送的照片,文本和/或者音頻能夠被預(yù)先確定并鏈接到指令的命令,或者消息構(gòu)造能夠打開一個模板或者話音記錄對話。
標(biāo)準(zhǔn)的文本和音頻消息能夠包括諸如“希望你在這里”、“我要遲到(I’m running late)”等等之類的短語。用戶可以自由地構(gòu)造儲備的文本或者音頻短語并將它們附到命令上。
當(dāng)用戶不再想用聲音或者音頻控制時,用戶能夠停用(deactivate)所述控制。音頻控制的停用是必需的,以便不在無意時執(zhí)行照相機(jī)功能,從而節(jié)約電池電源。停用能夠通過諸如“關(guān)閉照相機(jī)”之類的音頻命令,或者通過用戶啟動的擊鍵(或者一組擊鍵),或者通過預(yù)先設(shè)定的跟在最后執(zhí)行的命令后的超時周期來進(jìn)行。
已經(jīng)參照與移動電話相關(guān)聯(lián)的數(shù)字照相機(jī)的音頻控制來描述了本發(fā)明。不應(yīng)該將本發(fā)明解釋成局限于照相機(jī)或者照相機(jī)附件的音頻控制。諸如視頻和音頻之類的其它媒體形式能夠類似地在移動電話中被音頻控制。不用話音控制來操作照相機(jī),移動電話用戶能夠用音頻操作移動電話的音頻記錄功能以能夠進(jìn)行消息的話音記錄。移動電話用戶使移動電話能夠進(jìn)行音頻記錄,并用關(guān)鍵詞來開始和結(jié)束該過程。之后所述記錄能夠被附到照片來創(chuàng)建多媒體消息,這些多媒體消息能夠從移動電話發(fā)送或者作為電子郵件發(fā)送。
類似地,如果移動電話能夠捕捉視頻以及靜止圖像,那么能夠?qū)嵤┰捯艨刂苼砜刂埔曨l功能。諸如“開始拍攝”和“停止拍攝”之類的命令能夠使得移動電話的視頻功能在命令之間的時間期間記錄視頻。
如果移動電話支持在圖像、視頻和音頻特征及其組合上的多媒體音頻控制,那么可以創(chuàng)建附加的數(shù)據(jù)庫命令來管理多個媒體格式。例如,能夠通過附上圖像和相關(guān)聯(lián)的音頻記錄來構(gòu)造消息。用戶能夠發(fā)出諸如“打開消息模板”、“尋址家庭”“附上圖像”、“附上音頻記錄”、最后“發(fā)送消息”之類的命令。該命令序列使得移動電話創(chuàng)建、構(gòu)造和發(fā)送多媒體消息到由用戶定義的一組接收者而不必用手工錄入任何擊鍵。
本發(fā)明的計算機(jī)程序單元可以包含在硬件和/或軟件中(包括固件、常駐的軟件、微代碼等等)。本發(fā)明可以采用計算機(jī)程序產(chǎn)品的形式,它可以由計算機(jī)可用的或者計算機(jī)可讀存儲介質(zhì)來實現(xiàn),該存儲介質(zhì)具有包含在介質(zhì)中的計算機(jī)可用或者計算機(jī)可讀程序指令、“代碼”或者“計算機(jī)程序”,由指令執(zhí)行系統(tǒng)使用或者結(jié)合指令執(zhí)行系統(tǒng)使用。在本文獻(xiàn)的上下文中,計算機(jī)可用的或者計算機(jī)可讀介質(zhì)可以是能夠包含、保存、通信、傳播或者傳送程序的任何介質(zhì),所述程序由指令執(zhí)行系統(tǒng)、裝置和設(shè)備使用或者結(jié)合指令執(zhí)行系統(tǒng)、裝置和設(shè)備使用。計算機(jī)可用的或者計算機(jī)可讀介質(zhì)可以是,例如電、磁、光、電磁、紅外或者半導(dǎo)體系統(tǒng)、裝置和設(shè)備,或者是諸如因特網(wǎng)之類的傳播介質(zhì),但是不局限于此。應(yīng)當(dāng)指出計算機(jī)可用的或者計算機(jī)可讀介質(zhì)甚至可以是程序可以在其上打印的紙張或者另一種適合的介質(zhì),因為程序可以被電子捕獲,比如通過光掃描紙或者其它介質(zhì),之后編譯、解釋或者另外以其它適當(dāng)?shù)姆绞教幚?。在此描述的計算機(jī)程序產(chǎn)品和任何軟件和硬件形成各種裝置用來完成例示實施例中的本發(fā)明的功能。
在此公開了本發(fā)明的特定實施例。本領(lǐng)域普通技術(shù)人員能夠容易地認(rèn)識到本發(fā)明可以在其它環(huán)境中具有其它應(yīng)用。事實上,許多實施方式和實現(xiàn)都是可能的。下列權(quán)利要求并不是想將本發(fā)明的范圍局限于上面描述的特定實施例。此外,使用“用于......裝置”的任何敘述是打算引起裝置加功能地閱讀元件和權(quán)利要求,相反,沒有特別使用“用于......裝置”的敘述的任何單元不打算被讀作裝置加功能元件,即使權(quán)利要求另外包括了詞“裝置”。
權(quán)利要求
1.一種移動電話100和數(shù)字照相機(jī)114的組合,包括麥克風(fēng)106、108,用于檢測音頻輸入;數(shù)據(jù)庫412,包括表征為照相機(jī)命令的條目;和處理器,用于處理檢測到的音頻輸入;將檢測到的音頻輸入與照相機(jī)命令的數(shù)據(jù)庫進(jìn)行比較410;確定檢測到的音頻輸入是否與數(shù)據(jù)庫中的一個照相機(jī)命令相匹配414;和執(zhí)行與已經(jīng)匹配了檢測到的音頻輸入的照相機(jī)命令相關(guān)聯(lián)的一系列指令504。
2.權(quán)利要求1所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,所述一系列指令包括拍照。
3.權(quán)利要求1所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,所述一系列指令包括構(gòu)造消息;和附加照片到該消息。
4.權(quán)利要求3所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,構(gòu)造消息包括將消息尋址到一個或多個接收者;和插入文本到該消息中。
5.權(quán)利要求3所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,構(gòu)造消息包括將消息尋址到一個或多個接收者;和將聲音附到消息上。
6.權(quán)利要求3所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,所述消息是電子郵件消息。
7.權(quán)利要求3所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,所述消息是MMS消息。
8.權(quán)利要求1所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,照相機(jī)114被集成到移動電話100。
9.權(quán)利要求1所述的移動電話100和數(shù)字照相機(jī)114的組合,其中,照相機(jī)114作為附件被附到移動電話100。
全文摘要
移動電話(100)和數(shù)字照相機(jī)(114)的組合,其中數(shù)字照相機(jī)(114)能夠通過音頻或話音控制來控制。移動電話(100)包括至少一個麥克風(fēng)(106,118)來檢測音頻輸入。檢測到的音頻輸入被轉(zhuǎn)換成電信號并被發(fā)送到處理器。處理器可以訪問存儲介質(zhì),存儲介質(zhì)包括使處理器對檢測到的音頻輸入進(jìn)行操作的軟件。處理器將檢測到的音頻輸入與照相機(jī)命令數(shù)據(jù)庫(412)進(jìn)行對比來確定檢測到的音頻輸入是否與數(shù)據(jù)庫中的一個照相機(jī)命令相匹配(414)。如果存在匹配,那么處理器執(zhí)行(504)與照相機(jī)命令相關(guān)聯(lián)的一個指令集來完成期望的功能。
文檔編號H04M1/725GK1890951SQ200480035660
公開日2007年1月3日 申請日期2004年7月29日 優(yōu)先權(quán)日2003年12月2日
發(fā)明者D·斯蒂芬斯 申請人:索尼愛立信移動通訊股份有限公司