專利名稱:圖像處理裝置、圖像處理方法和程序的制作方法
技術(shù)領(lǐng)域:
本技術(shù)涉及圖像處理裝置、圖像處理方法和程序,并且特別涉及能夠更容易地向動(dòng)態(tài)圖像添加效果的圖像處理裝置、圖像處理方法和程序。
背景技術(shù):
移動(dòng)電話、攝錄像機(jī)、數(shù)碼相機(jī)等作為能夠拍攝動(dòng)態(tài)圖像的設(shè)備而熟知。例如,提出能夠拍攝動(dòng)態(tài)圖像的移動(dòng)電話,該移動(dòng)電話通過(guò)在借助于兩個(gè)麥克風(fēng)拾取的聲音中設(shè)置具有較高聲級(jí)的聲音作為關(guān)聯(lián)于動(dòng)態(tài)圖像的聲音來(lái)拍攝動(dòng)態(tài)圖像(例如,參考專利文件I)。引用列表專利文件專利文件1:日本專利申請(qǐng)?zhí)亻_(kāi)2004-201015號(hào)
發(fā)明內(nèi)容
本發(fā)明要解決的問(wèn)題盡管存在向動(dòng)態(tài)圖像添加諸如聲音效果之類的效果的情況,但是一般來(lái)說(shuō),經(jīng)常在拍攝動(dòng)態(tài)圖像之后向動(dòng)態(tài)圖像添加效果,例如在編輯動(dòng)態(tài)圖像時(shí)。然而,向動(dòng)態(tài)圖像添加效果的這種工作是麻煩的。例如,當(dāng)要在拍攝之后添加效果時(shí),用戶必須選擇添加效果的場(chǎng)景并且進(jìn)行操作以指定要添加的效果,同時(shí)重現(xiàn)動(dòng)態(tài)圖像。同樣,隨著在視頻分發(fā)方式中最近的改變,實(shí)時(shí)分發(fā)所拍攝的動(dòng)態(tài)圖像的應(yīng)用在增長(zhǎng)。因而,要求容易和快速地向所拍攝的動(dòng)態(tài)圖像添加效果的技術(shù)??紤]這樣的情形實(shí)現(xiàn)本技術(shù),并且這更加容易地向動(dòng)態(tài)圖像添加效果。問(wèn)題的解決方案向根據(jù)本技術(shù)的一個(gè)方面的圖像處理裝置提供關(guān)鍵字檢測(cè)單元,其從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音預(yù)先確定的關(guān)鍵字,所述聲音拾取單元不同于用于拾取環(huán)境聲音的聲音拾取單元,該環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與動(dòng)態(tài)圖像關(guān)聯(lián)的聲音;和效果添加單元,其向動(dòng)態(tài)圖像或環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果。可以進(jìn)一步向圖像處理裝置提供聲音效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成聲音效果,其中該效果添加單??梢院铣陕曇粜Ч铜h(huán)境聲音??梢赃M(jìn)一步向圖像處理裝置提供圖像效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成圖像效果,其中效果添加單元可以將圖像效果疊加在動(dòng)態(tài)圖像上??梢赃M(jìn)一步向圖像處理裝置提供拍攝動(dòng)態(tài)圖像的拍攝單元;拾取環(huán)境聲音的第一聲音拾取單元;和拾取由用戶發(fā)出的語(yǔ)音的第二聲音拾取單元。可以進(jìn)一步向圖像處理裝置提供接收動(dòng)態(tài)圖像、環(huán)境聲音和由用戶發(fā)出的語(yǔ)音的接收單元。根據(jù)本技術(shù)的一個(gè)方面的圖像處理方法或程序包括如下步驟:從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,所述聲音拾取單元不同于用于拾取環(huán)境聲音的聲音拾取單元,該環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與動(dòng)態(tài)圖像關(guān)聯(lián)的聲音;和向動(dòng)態(tài)圖像或環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果。根據(jù)本技術(shù)的一個(gè)方面,從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,所述聲音拾取單兀不同于用于拾取環(huán)境聲音的聲音拾取單兀,該環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與動(dòng)態(tài)圖像關(guān)聯(lián)的聲音;和向動(dòng)態(tài)圖像或環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果。有益效果根據(jù)本技術(shù)的一個(gè)方面,可以更容易地向動(dòng)態(tài)圖像添加效果。
圖1是用于圖示本技術(shù)的概要的視圖。圖2是圖示向動(dòng)態(tài)圖像添加效果的視圖。圖3是圖示便攜式終端設(shè)備的配置示例的視圖。圖4是圖示效果添加處理的流程圖。圖5是圖不聲音效果對(duì)應(yīng)表格的不例的視圖。圖6是圖不圖像效果對(duì)應(yīng)表格的不例的視圖。圖7是圖示分發(fā)系統(tǒng)的配置示例的視圖。圖8是圖示拍攝處理和效果添加處理的流程圖。圖9是圖示計(jì)算機(jī)的配置示例的視圖
具體實(shí)施例方式以下參考附圖描述應(yīng)用本技術(shù)的實(shí)施例。〈第一實(shí)施例〉[技術(shù)概要]如圖1所示,本技術(shù)向由便攜式終端設(shè)備11拍攝的動(dòng)態(tài)圖像施加聲音效果和圖像效果,該便攜式終端設(shè)備11例如由移動(dòng)電話、攝錄像機(jī)、數(shù)碼相機(jī)等構(gòu)成。在圖1中的示例中,操作便攜式終端設(shè)備11的用戶12拍攝參與游泳比賽的選手的動(dòng)態(tài)圖像作為箭頭All所指的被攝體。即,便攜式終端設(shè)備11根據(jù)用戶12的操作拍攝被攝體的動(dòng)態(tài)圖像(視頻)并且拾取周圍聲音(以下,稱為環(huán)境聲音)作為與動(dòng)態(tài)圖像關(guān)聯(lián)的聲音。同樣,在動(dòng)態(tài)圖像的拍攝期間,當(dāng)用戶希望向由動(dòng)態(tài)圖像和環(huán)境聲音構(gòu)成的內(nèi)容添加效果時(shí),用戶12發(fā)出對(duì)要添加的效果預(yù)先確定的詞、短語(yǔ)等(以下,稱為關(guān)鍵字)以通過(guò)語(yǔ)音輸入關(guān)鍵字。通過(guò)便攜式終端設(shè)備11拾取以此方式由用戶12發(fā)出的關(guān)鍵字。同時(shí),由用戶12發(fā)出的關(guān)鍵字和與動(dòng)態(tài)圖像關(guān)聯(lián)的環(huán)境聲音由不同聲音拾取單兀拾取。例如,拾取環(huán)境聲音的聲音拾取單兀和拾取關(guān)鍵字的聲音拾取單兀在便攜式終端設(shè)備11的相對(duì)表面上提供。當(dāng)在動(dòng)態(tài)圖像的拍攝期間從由聲音拾取單元為了檢測(cè)關(guān)鍵字而獲得的聲音關(guān)鍵字檢測(cè)到關(guān)鍵字時(shí),便攜式終端設(shè)備11向通過(guò)拍攝獲得的動(dòng)態(tài)圖像和環(huán)境聲音添加由關(guān)鍵字指定的圖像效果和聲音效果。具體地,例如,假定,當(dāng)游泳比賽的開(kāi)始場(chǎng)景被拍攝時(shí),聲音Mll “各就各位”、聲音M12 “嘟”、聲音M13 “撲通”和聲音M14 “啪嚓”被拾取為環(huán)境聲音,如圖2所示。同時(shí),在圖2中,水平方向代表時(shí)間方向并且在該時(shí)間方向上的每個(gè)位置上指示環(huán)境聲音、關(guān)鍵字、聲音效果和添加了效果的環(huán)境聲音。例如,聲音Mll和聲音M12是指不比賽的開(kāi)始的語(yǔ)音和哨聲,并且聲音M13和聲音M14是在選手跳入泳池時(shí)生成的聲音和當(dāng)選手開(kāi)始游泳時(shí)生成的聲音。同樣,在圖2的示例中,在指示比賽的開(kāi)始的哨的聲音M12被拾取后立即拾取由用戶發(fā)出的關(guān)鍵字Κ1?!隆保⑶一旧吓c在選手入水時(shí)聲音M13的拾取同時(shí)地拾取由用戶發(fā)出的關(guān)鍵字K12 “啪嚓”。進(jìn)一步,假設(shè)引起被攝體跳水的狀態(tài)的聲音效果Ell “啵嚶”預(yù)先與關(guān)鍵字Kll關(guān)聯(lián),并且引起出現(xiàn)水花飛濺的狀態(tài)的聲音效果E12 “啪嚓”預(yù)先與關(guān)鍵字K12關(guān)聯(lián)。在這樣的情況下,便攜式終端設(shè)備11將聲音效果Ell和聲音效果E12分別與由在輸入關(guān)鍵字Kll和關(guān)鍵字K12的時(shí)候所拾取的聲音Mll到M14構(gòu)成的環(huán)境聲音合成,以獲得添加了效果的環(huán)境聲音。因而,當(dāng)重現(xiàn)添加了效果的、最終獲得的環(huán)境聲音時(shí),聲音Mil、聲音M12、聲音效果E11、聲音M13、聲音效果E12和聲音M14以此順序重現(xiàn)。同時(shí),當(dāng)用 于施加圖像效果(以下,稱為圖像效果)的圖像預(yù)先與關(guān)鍵字關(guān)聯(lián)時(shí),將與所檢測(cè)的關(guān)鍵字關(guān)聯(lián)的圖像效果與通過(guò)拍攝獲得的動(dòng)態(tài)圖像合成。[便攜式終端設(shè)備的配置示例]接著,描述向所拍攝的動(dòng)態(tài)圖像施加效果的便攜式終端設(shè)備11的具體配置。圖3是圖示便攜式終端設(shè)備11的配置示例的視圖。便攜式終端設(shè)備11由拍攝單元21、聲音拾取單元22及23、分離單元24、關(guān)鍵字檢測(cè)單元25、效果生成單元26、效果添加單元27和傳輸單元28構(gòu)成。拍攝單元21根據(jù)用戶的操作拍攝便攜式終端設(shè)備11周圍的被攝體,并且向效果生成單元26提供作為結(jié)果獲得的動(dòng)態(tài)圖像的圖像數(shù)據(jù)。由麥克風(fēng)等構(gòu)成的聲音拾取單元22例如在拍攝動(dòng)態(tài)圖像時(shí)拾取便攜式終端設(shè)備11的周圍聲音作為環(huán)境聲音,并且向分離單元24提供作為結(jié)果獲得的聲音數(shù)據(jù)。由麥克風(fēng)等構(gòu)成的聲音拾取單元23例如在動(dòng)態(tài)圖像的拍攝期間拾取由操作便攜式終端設(shè)備11的用戶發(fā)出的語(yǔ)音(關(guān)鍵字),并且向分離單元24提供作為結(jié)果獲得的聲音數(shù)據(jù)。同時(shí),盡管在便攜式終端設(shè)備11的不同表面上提供聲音拾取單元22和23,但是例如不僅環(huán)境聲音而且由用戶發(fā)出的語(yǔ)音也到達(dá)聲音拾取單元22,并且不僅由用戶發(fā)出的語(yǔ)音而且環(huán)境聲音也到達(dá)聲音拾取單元23。因而,更詳細(xì)地,由聲音拾取單元22獲得的聲音不僅包括環(huán)境聲音還略微包括由用戶發(fā)出的關(guān)鍵字的語(yǔ)音,并且類似地,由聲音拾取單元23獲得的聲音不僅包括關(guān)鍵字的語(yǔ)音還略微包括環(huán)境聲音。分離單元24基于從聲音拾取單元22提供的聲音數(shù)據(jù)和從聲音拾取單元23提供的聲音數(shù)據(jù),將環(huán)境聲音和由用戶發(fā)出的語(yǔ)音彼此分離。即,分離單元24通過(guò)使用來(lái)自聲音拾取單元23的聲音數(shù)據(jù),從來(lái)自聲音拾取單兀22的聲音數(shù)據(jù)提取環(huán)境聲音的聲音數(shù)據(jù),并且向效果生成單兀26提供環(huán)境聲音的聲音數(shù)據(jù)。同樣,分離單元24通過(guò)使用來(lái)自聲音拾取單元22的聲音數(shù)據(jù),從來(lái)自聲音拾取單元23的聲音數(shù)據(jù)提取由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù),并且向關(guān)鍵字檢測(cè)單元25提供由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。關(guān)鍵字檢測(cè)單元25基于從分離單元24提供的聲音數(shù)據(jù)從語(yǔ)音檢測(cè)關(guān)鍵字,并且向效果生成單元26提供檢測(cè)結(jié)果。效果生成單元26向效果添加單元27提供來(lái)自拍攝單元21的動(dòng)態(tài)圖像的圖像數(shù)據(jù)和來(lái)自分離單元24的環(huán)境聲音的聲音數(shù)據(jù),并且基于來(lái)自關(guān)鍵字檢測(cè)單元25的關(guān)鍵字的檢測(cè)結(jié)果生成要向動(dòng)態(tài)圖像添加的效果,以向效果添加單元27提供。向效果生成單元26提供延遲單元41、圖像效果生成單元42、延遲單元43和聲音效果生成單元44。延遲單元41臨時(shí)保存從拍攝單元21提供的動(dòng)態(tài)圖像的圖像數(shù)據(jù)以延遲,并且向效果添加單元27提供該圖像數(shù)據(jù)。圖像效果生成單元42基于從關(guān)鍵字檢測(cè)單元25提供的檢測(cè)結(jié)果生成圖像效果的圖像數(shù)據(jù)用于施加圖像效果,并且向效果添加單元27提供該圖像數(shù)據(jù)。延遲單元43臨時(shí)保存從分離單元24提供的環(huán)境聲音的聲音數(shù)據(jù)以延遲,并且向效果添加單元27提供該聲音數(shù)據(jù)。聲音效果生成單元44基于從關(guān)鍵字檢測(cè)單元25提供的檢測(cè)結(jié)果生成聲音效果的聲音數(shù)據(jù),用于施加聲音效果,并且向效果添加單元27提供該聲音數(shù)據(jù)。效果添加單元27基于動(dòng)態(tài)圖像、環(huán)境聲音、圖像效果和從效果生成單元26提供的聲音效果,向動(dòng)態(tài)圖像和環(huán)境聲音添加效果,并且向發(fā)送單元28提供該效果。向效果添加單元27提供圖像效果疊加單元51和聲音效果合成單元52。圖像效果疊加單元51在從延遲單元41提供的動(dòng)態(tài)圖像的圖像數(shù)據(jù)上疊加從圖像效果生成單元42提供的圖像效果的圖像數(shù)據(jù),并且向發(fā)送單元28提供該圖像數(shù)據(jù)。聲音效果合成單元52將從聲音效果生成單元44提供的聲音效果的聲音數(shù)據(jù)與從延遲單元43提供的環(huán)境聲音的聲音數(shù)據(jù)合成,并且向發(fā)送單元28提供該聲音數(shù)據(jù)。發(fā)送單元28向外部設(shè)備發(fā)送從圖像效果疊加單元51提供的圖像數(shù)據(jù)和從聲音效果合成單元52提供的聲音數(shù)據(jù),作為由視頻和聲音構(gòu)成的一個(gè)內(nèi)容。[效果添加處理的描述]當(dāng)用戶操作便攜式終端設(shè)備11以給出用以開(kāi)始拍攝動(dòng)態(tài)圖像的指令時(shí),便攜式終端設(shè)備11拍攝動(dòng)態(tài)圖像,并且進(jìn)行效果添加處理,以根據(jù)由用戶發(fā)出的關(guān)鍵字向通過(guò)拍攝獲得的動(dòng)態(tài)圖像添加效果。便攜式終端設(shè)備11的效果添加處理以下參考圖4中的流程圖描述。在步驟SI I,拍攝單元21開(kāi)始拍攝動(dòng)態(tài)圖像,向延遲單元41提供通過(guò)拍攝獲得的圖像數(shù)據(jù),并且允許延遲單元41保存數(shù)據(jù)。當(dāng)動(dòng)態(tài)圖像的拍攝開(kāi)始時(shí),聲音拾取單元22和23也開(kāi)始拾取周圍聲音,并且向分離單元24提供所獲得的聲音數(shù)據(jù)。即,聲音拾取單元22拾取環(huán)境聲音作為與動(dòng)態(tài)圖像關(guān)聯(lián)的聲音,而聲音拾取單元23拾取由用戶發(fā)出的關(guān)鍵字(語(yǔ)音)。進(jìn)一步,分離單元24通過(guò)利用聲音等的聲壓的差異,基于來(lái)自聲音拾取單元23的聲音數(shù)據(jù),從來(lái)自聲音拾取單元22的聲音數(shù)據(jù)移除由用戶發(fā)出的語(yǔ)音(關(guān)鍵字)的分量,向延遲單元43提供作為結(jié)果獲得的環(huán)境聲音的聲音數(shù)據(jù)并且允許延遲單元43保存該數(shù)據(jù)。類似地,分離單元24通過(guò)使用來(lái)自聲音拾取單元22的聲音數(shù)據(jù),從來(lái)自聲音拾取單元23的聲音數(shù)據(jù)移除環(huán)境聲音的分量,并且提供作為結(jié)果獲得的、由用戶發(fā)出的語(yǔ)音(關(guān)鍵字)的聲音數(shù)據(jù)。通過(guò)該處理,環(huán)境聲音和關(guān)鍵字彼此分離。在步驟S12,關(guān)鍵字檢測(cè)單元25通過(guò)進(jìn)行從分離單元24提供的聲音數(shù)據(jù)的語(yǔ)音識(shí)別處理等,從由用戶發(fā)出的語(yǔ)音檢測(cè)關(guān)鍵字。例如,從由用戶發(fā)出的語(yǔ)音檢測(cè)圖2所示的預(yù)先確定的關(guān)鍵字,諸如關(guān)鍵字Kll和關(guān)鍵字K12。在步驟S13,關(guān)鍵字檢測(cè)單元25判斷是否檢測(cè)到關(guān)鍵字。當(dāng)判斷在步驟S13檢測(cè)到關(guān)鍵字時(shí),關(guān)鍵字檢測(cè)單元25向圖像效果生成單元42和聲音效果生成單元44提供指定檢測(cè)到的關(guān)鍵字的信息,并且過(guò)程移動(dòng)到步驟S14。在步驟S14,聲音效果生成單元44基于從關(guān)鍵字檢測(cè)單元25提供的信息生成聲音效果,并且向聲音效果合成單元52提供該聲音效果。例如,聲音效果生成單元44記錄聲音效果對(duì)應(yīng)表格,在該對(duì)應(yīng)表格中,預(yù)先確定的關(guān)鍵字和由關(guān)鍵字指定的聲音效果如圖5所示地那樣彼此關(guān)聯(lián)。在圖5的示例中,聲音效果“聲音效果A”與關(guān)鍵字“啵嚶”關(guān)聯(lián)而聲音效果“聲音效果B”與關(guān)鍵字“啪嚓”關(guān)聯(lián)。聲音效果生成單元44通過(guò)參考聲音效果對(duì)應(yīng)表格,指定與關(guān)鍵字對(duì)應(yīng)的聲音效果,該關(guān)鍵字由從關(guān)鍵字檢測(cè)單元25提供的信息指示,并且從預(yù)先記錄的多個(gè)聲音效果之中讀出所指定的聲音效果,以向聲音效果合成單元52提供。因而,當(dāng)由關(guān)鍵字檢測(cè)單元25檢測(cè)到關(guān)鍵字“啵嚶”時(shí),例如,聲音效果生成單元44向聲音效果合成單元52提供與“啵嚶”對(duì)應(yīng)的“聲音效果A”的聲音數(shù)據(jù)。在步驟S15,圖像效果生成單元42基于從關(guān)鍵字檢測(cè)單元25提供的信息生成圖像效果,并且向圖像效果疊加單元51提供該圖像效果。例如,圖像效果生成單元42記錄圖像效果對(duì)應(yīng)表格,其中,預(yù)先確定的關(guān)鍵字和由關(guān)鍵字指定的圖像效果如圖6所示地那樣彼此關(guān)聯(lián)。在圖6的示例中,圖像效果“圖像效果A”與關(guān)鍵字“啵嚶”關(guān)聯(lián)而圖像效果“圖像效果B”與關(guān)鍵字“啪嚓”關(guān)聯(lián)。例如,圖像效果是包括指示關(guān)鍵字的字符、有關(guān)關(guān)鍵字的動(dòng)畫(huà)圖像等的圖像。圖像效果生成單元42通過(guò)參考圖像效果對(duì)應(yīng)表格,指定與關(guān)鍵字對(duì)應(yīng)的圖像效果,該關(guān)鍵字由來(lái)自關(guān)鍵字檢測(cè)單元25提供的信息指示,并且從預(yù)先記錄的多個(gè)圖像效果之中讀出所指定的圖像效果以向圖像效果疊加單元51提供。同時(shí),盡管由聲音效果生成單元44和圖像效果生成單元42分別讀出關(guān)鍵字所指定的聲音效果和圖像效果的情況作為示例描述,但是也可以基于所檢測(cè)的關(guān)鍵字和預(yù)先記錄的數(shù)據(jù)生成聲音效果和圖像效果。也可以的是,聲音效果和圖像效果二者與每一個(gè)關(guān)鍵字關(guān)聯(lián),并且聲音效果和圖像效果的任一個(gè)與每一個(gè)關(guān)鍵字關(guān)聯(lián)。例如,當(dāng)僅聲音效果與預(yù)定關(guān)鍵字關(guān)聯(lián)時(shí),圖像效果生成單元42即使當(dāng)檢測(cè)到關(guān)鍵字時(shí)也不生成圖像效果,并且在動(dòng)態(tài)圖像和環(huán)境聲音之中僅向環(huán)境聲音施加該效果。再次描述圖4的流程圖;在步驟S16,聲音效果合成單元52從延遲單元43獲得環(huán)境聲音的聲音數(shù)據(jù),并且將獲得的聲音數(shù)據(jù)與從聲音效果生成單元44提供的聲音效果的聲音數(shù)據(jù)合成以向發(fā)送單元28提供。
此時(shí),聲音效果合成單元52在將環(huán)境聲音的聲音數(shù)據(jù)與聲音效果的聲音數(shù)據(jù)合成時(shí)進(jìn)行合成處理,從而當(dāng)重現(xiàn)合成了聲音效果的環(huán)境聲音時(shí),在動(dòng)態(tài)圖像的拍攝期間由用戶發(fā)出關(guān)鍵字的時(shí)間(重現(xiàn)時(shí)間)重現(xiàn)聲音效果。通過(guò)這樣的合成處理獲得重現(xiàn)環(huán)境聲音和聲音效果的聲音數(shù)據(jù)。即,獲得如下聲音:用聲音效果替代當(dāng)拍攝動(dòng)態(tài)圖像時(shí)周圍聲音中由用戶發(fā)出的關(guān)鍵字。在步驟S17,圖像效果疊加單元51從延遲單元41獲得動(dòng)態(tài)圖像的圖像數(shù)據(jù),并且將從圖像效果生成單元42提供的圖像效果的圖像數(shù)據(jù)疊加在所獲得的圖像數(shù)據(jù)上,以向發(fā)送單元28提供。此時(shí),圖像效果疊加單元51進(jìn)行疊加處理,同時(shí)將動(dòng)態(tài)圖像的圖像數(shù)據(jù)與圖像效果的圖像數(shù)據(jù)合成,從而當(dāng)重現(xiàn)合成了圖像效果的動(dòng)態(tài)圖像時(shí),在動(dòng)態(tài)圖像的拍攝期間用戶發(fā)出關(guān)鍵字的時(shí)間顯示圖像效果。通過(guò)這樣的疊加處理,獲得動(dòng)態(tài)圖像的圖像數(shù)據(jù),在該動(dòng)態(tài)圖像中,與拍攝的被攝體一起顯示指示關(guān)鍵字的諸如字符“啵嚶”之類的圖像效果。同時(shí),用于所拍攝的動(dòng)態(tài)圖像的圖像效果不限于圖像效果的疊加,并且它們可以是諸如淡入效果之類的任何類型的效果,并且可以使用用于動(dòng)態(tài)圖像的閃光效果。例如,當(dāng)?shù)胄Чc作為圖像效果的預(yù)定關(guān)鍵字關(guān)聯(lián)時(shí),圖像效果生成單元42向圖像效果疊加單元51提供指示將淡入效果施加于動(dòng)態(tài)圖像的信息。然后,圖像效果疊加單元51基于從圖像效果生成單元42提供的信息進(jìn)行圖像處理以向來(lái)自延遲單元41的動(dòng)態(tài)圖像施加淡化效果O當(dāng)以上述方式向所拍攝的動(dòng)態(tài)圖像和環(huán)境聲音施加效果時(shí),過(guò)程移動(dòng)到步驟S17到步驟S18。同樣,當(dāng)判斷在步驟S13未檢測(cè)到關(guān)鍵字時(shí),不添加圖像效果和聲音效果,從而不進(jìn)行從步驟S14到步驟S17的處理,并且過(guò)程移動(dòng)到步驟S18。此時(shí),圖像效果疊加單元51從延遲單元41獲得動(dòng)態(tài)圖像,并且向發(fā)送單元28提供該動(dòng)態(tài)圖像,并且聲音效果合成單元52從延遲單元43獲得環(huán)境聲音并且向發(fā)送單元28提供該環(huán)境聲音。當(dāng)判斷在步驟S13未檢測(cè)到關(guān)鍵字時(shí)或當(dāng)在步驟S17疊加圖像效果時(shí),發(fā)送單元28在步驟S18發(fā)送來(lái)自圖像效果疊加單元51的動(dòng)態(tài)圖像和來(lái)自聲音效果合成單元52的環(huán)境聲音。S卩,傳輸單元28復(fù)用來(lái)自圖像效果疊加單元51的動(dòng)態(tài)圖像的圖像數(shù)據(jù)和來(lái)自聲音效果合成單元52的環(huán)境聲音的聲音數(shù)據(jù),以制作一個(gè)內(nèi)容的數(shù)據(jù)。然后,發(fā)送單元28通過(guò)網(wǎng)絡(luò)向多個(gè)終端設(shè)備分發(fā)所獲得的數(shù)據(jù)或者向分發(fā)內(nèi)容的服務(wù)器上傳該數(shù)據(jù)。在步驟S19,便攜式終端設(shè)備11判斷是否結(jié)束向動(dòng)態(tài)圖像添加效果的處理。例如,當(dāng)用戶操作便攜式終端設(shè)備11以發(fā)出結(jié)束拍攝動(dòng)態(tài)圖像的指令時(shí),判斷出結(jié)束處理。當(dāng)在步驟S19判斷出尚未結(jié)束處理時(shí),過(guò)程回到步驟S12并且重復(fù)上述處理。即,進(jìn)行向新拍攝的動(dòng)態(tài)圖像和新拾取的環(huán)境聲音分別施加圖像效果和聲音效果的處理。另一方面,當(dāng)判斷處理在步驟S19結(jié)束時(shí),便攜式終端設(shè)備11的每一個(gè)單元停止正在進(jìn)行的處理,并且結(jié)束效果添加處理。以此方式,便攜式終端設(shè)備11拾取在動(dòng)態(tài)圖像的拍攝期間由用戶發(fā)出的關(guān)鍵字并且向所拍攝的動(dòng)態(tài)圖像和所拾取的環(huán)境聲音添加與該關(guān)鍵字對(duì)應(yīng)的效果。據(jù)此,用戶可以僅通過(guò)在動(dòng)態(tài)圖像的拍攝期間發(fā)出與期望效果對(duì)應(yīng)的關(guān)鍵字來(lái)容易地和快速地添加效果O當(dāng)用戶以此方式通過(guò)語(yǔ)音輸入關(guān)鍵字時(shí),不需要用戶指定添加效果的地點(diǎn)和在拍攝之后要通過(guò)重現(xiàn)動(dòng)態(tài)圖像添加的效果。不需要麻煩的操作(諸如,對(duì)于很多按鈕等登記效果和在重現(xiàn)動(dòng)態(tài)圖像時(shí)按下與想要添加的效果對(duì)應(yīng)的按鈕),從而可以高效地向動(dòng)態(tài)圖像添加效果。同樣,盡管當(dāng)對(duì)于每一按鈕登記效果時(shí)可以登記的效果的數(shù)量受按鈕的數(shù)量限制,但是如果效果與關(guān)鍵字關(guān)聯(lián),就可以登記更多效果。進(jìn)一步,便攜式終端設(shè)備11能夠與動(dòng)態(tài)圖像的拍攝同時(shí)地向動(dòng)態(tài)圖像添加效果,從而這可以分發(fā)實(shí)時(shí)地添加效果的動(dòng)態(tài)圖像?!吹诙?shí)施例〉[分發(fā)系統(tǒng)的配置示例]同時(shí),盡管以上描述了向拍攝動(dòng)態(tài)圖像的便攜式終端設(shè)備中的動(dòng)態(tài)圖像添加效果的情況,但是也可以將通過(guò)拍攝獲得的動(dòng)態(tài)圖像、環(huán)境聲音和關(guān)鍵字的語(yǔ)音發(fā)送到服務(wù)器并且在服務(wù)器側(cè)添加效果。在此情況下,例如,由拍攝動(dòng)態(tài)圖像的便攜式終端設(shè)備和向動(dòng)態(tài)圖像添加效果的服務(wù)器構(gòu)成的動(dòng)態(tài)圖像的分發(fā)系統(tǒng)如圖7所示地那樣構(gòu)成。同時(shí),在圖7中,將相同的附圖標(biāo)記分配給與圖3中的部件對(duì)應(yīng)的部件,并且恰當(dāng)?shù)厥÷云涿枋觥D7所示的分發(fā)系統(tǒng)由便攜式終端設(shè)備81和服務(wù)器82構(gòu)成,并且便攜式終端設(shè)備81和服務(wù)器82通過(guò)諸如因特網(wǎng)之類的通信網(wǎng)絡(luò)彼此連接。便攜式終端設(shè)備81由拍攝單元21、聲音拾取單元22及23、分離單元24和發(fā)送單元91構(gòu)成。發(fā)送單元91向服務(wù)器82發(fā)送從拍攝單元21提供的動(dòng)態(tài)圖像的圖像數(shù)據(jù)、從分離單元24提供的環(huán)境聲音的聲音數(shù)據(jù)以及由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。同樣,服務(wù)器82由接收單元101、關(guān)鍵字檢測(cè)單元25、效果生成單元26、效果添加單元27和發(fā)送單元28構(gòu)成。同時(shí),服務(wù)器82的效果生成單元26和效果添加單元27的配置與圖3中的便攜式終端設(shè)備11的效果生成單元26和效果添加單元27的配置相同。即,在服務(wù)器82的效果生成單元26上提供延遲單元41、圖像效果生成單元42、延遲單元43和聲音效果生成單元44,并且在服務(wù)器82的效果添加單元27上提供圖像效果疊加單元51和聲音效果合成單元52。接收單元101接收從便攜式終端設(shè)備81發(fā)送的動(dòng)態(tài)圖像的圖像數(shù)據(jù)、環(huán)境聲音的聲音數(shù)據(jù)和由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù),并且向延遲單元41及43和關(guān)鍵字檢測(cè)單元25分別提供接收到的數(shù)據(jù)。[拍攝處理和效果添加處理的描述]接著,參考圖8中的流程圖描述便攜式終端設(shè)備81的拍攝處理和服務(wù)器82的效果添加處理。在步驟S41,拍攝單元21根據(jù)用戶的操作開(kāi)始拍攝動(dòng)態(tài)圖像,并且發(fā)送單元19將通過(guò)拍攝獲得的動(dòng)態(tài)圖像的圖像數(shù)據(jù)提供到發(fā)送單元91。當(dāng)開(kāi)始動(dòng)態(tài)圖像的拍攝時(shí),聲音拾取單元22和23也開(kāi)始拾取周圍聲音,并向分離單元24提供所獲得的聲音數(shù)據(jù)。進(jìn)一步,分離單元24基于從聲音拾取單元22和23提供的聲音數(shù)據(jù),提取環(huán)境聲音的聲音數(shù)據(jù)和由用戶發(fā)出的語(yǔ)音(關(guān)鍵字)的聲音數(shù)據(jù),并且向發(fā)送單元91提供該聲音數(shù)據(jù)。更詳細(xì)地,分離單元24向環(huán)境聲音的聲音數(shù)據(jù)添加指定信息,指示這是環(huán)境聲音的聲音數(shù)據(jù),并且向由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)添加指定信息,指示這是關(guān)鍵字的聲音數(shù)據(jù)。然后,向發(fā)送單元91提供添加了指定信息的聲音數(shù)據(jù)。在步驟S42,發(fā)送單元91向服務(wù)器82發(fā)送所拍攝的動(dòng)態(tài)圖像。即,如果需要的話,發(fā)送單元91存儲(chǔ)從拍攝單元21提供的動(dòng)態(tài)圖像的圖像數(shù)據(jù)、以包(packet)等從分離單元24提供的環(huán)境聲音的聲音數(shù)據(jù)以及由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù),并且向服務(wù)器82發(fā)送它們。在步驟S43,便攜式終端設(shè)備81判斷是否結(jié)束向服務(wù)器82發(fā)送動(dòng)態(tài)圖像的處理。例如,當(dāng)用戶給出結(jié)束拍攝動(dòng)態(tài)圖像的指令時(shí),判斷處理結(jié)束。當(dāng)在步驟S43判斷處理未結(jié)束時(shí),過(guò)程返回到步驟S42,并且重復(fù)上述處理。S卩,向服務(wù)器82發(fā)送新拍攝的動(dòng)態(tài)圖像和新拾取的環(huán)境聲音等。另一方面,當(dāng)在步驟S43判斷處理結(jié)束時(shí),發(fā)送單元91向服務(wù)器82發(fā)送指示動(dòng)態(tài)圖像的發(fā)送完成的信息,并且拍攝處理結(jié)束。同樣,當(dāng)在步驟S42向服務(wù)器82發(fā)送圖像數(shù)據(jù)和聲音數(shù)據(jù)時(shí),服務(wù)器82響應(yīng)于它們進(jìn)行效果添加處理。S卩,在步驟S51,接收單元101接收從便攜式終端設(shè)備81的發(fā)送單元91發(fā)送的動(dòng)態(tài)圖像的圖像數(shù)據(jù)、環(huán)境聲音的聲音數(shù)據(jù)以及由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。然后,接收單元101向延遲單元41提供所接收的動(dòng)態(tài)圖像的圖像數(shù)據(jù),并且允許該延遲單元41保存數(shù)據(jù),并且向延遲單元43提供接收到的環(huán)境聲音的聲音數(shù)據(jù),并且允許延遲單元43保存數(shù)據(jù)。接收單元101也向關(guān)鍵字檢測(cè)單元25提供接收到的由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。同時(shí),由添加到聲音數(shù)據(jù)的指定信息指定環(huán)境聲音的聲音數(shù)據(jù)和由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。當(dāng)接收動(dòng)態(tài)圖像時(shí),之后進(jìn)行從步驟S52到步驟S58的處理,并且向動(dòng)態(tài)圖像和環(huán)境聲音添加效果;然而,因?yàn)檫@些處理類似于圖4中從步驟S12到步驟S18的處理,所以省略其描述。在步驟S59,服務(wù)器82判斷是否結(jié)束向動(dòng)態(tài)圖像添加效果的處理。例如,當(dāng)接收單元101接收到指示完成動(dòng)態(tài)圖像的傳輸?shù)男畔r(shí),判斷處理結(jié)束。當(dāng)在步驟S59判斷處理尚未完成時(shí),過(guò)程返回到步驟S51并且重復(fù)上述處理。SP,接收到從便攜式終端設(shè)備81發(fā)送的新動(dòng)態(tài)圖像并且向動(dòng)態(tài)圖像添加效果。另一方面,當(dāng)在步驟S59判斷處理結(jié)束時(shí),服務(wù)器82的每一個(gè)單元停止正在進(jìn)行的處理,并且結(jié)束效果添加處理。同時(shí),也可以的是,在服務(wù)器82上記錄添加了效果的動(dòng)態(tài)圖像或者將其原樣發(fā)送到便攜式終端設(shè)備81。以此方式,便攜式終端設(shè)備81拍攝動(dòng)態(tài)圖像,拾取周圍聲音,并且向服務(wù)器82發(fā)送所獲得的圖像數(shù)據(jù)和聲音數(shù)據(jù)。同樣,服務(wù)器82接收從便攜式終端設(shè)備81發(fā)送的圖像數(shù)據(jù)和聲音數(shù)據(jù),并且根據(jù)在聲音中包括的關(guān)鍵字向動(dòng)態(tài)圖像和環(huán)境聲音添加效果。以此方式,同樣在服務(wù)器82接收動(dòng)態(tài)圖像等時(shí),用戶僅通過(guò)在動(dòng)態(tài)圖像的拍攝期間發(fā)出與想要添加的效果對(duì)應(yīng)的關(guān)鍵字,就可以容易地并且快速地添加效果。
同時(shí),盡管在第二實(shí)施例中描述了將圖像數(shù)據(jù)和兩個(gè)聲音數(shù)據(jù)發(fā)送到服務(wù)器82以進(jìn)行處理的示例,但是也可以向便攜式終端設(shè)備81提供關(guān)鍵字檢測(cè)單元25,并且在便攜式終端設(shè)備81側(cè)檢測(cè)關(guān)鍵字。在這種情況下,關(guān)鍵字檢測(cè)單元25基于分離單元24提取的、由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)檢測(cè)關(guān)鍵字,并且例如向發(fā)送單元91提供指示所檢測(cè)的關(guān)鍵字的信息,諸如指定關(guān)鍵字的代碼。然后,發(fā)送單元91向服務(wù)器82發(fā)送來(lái)自拍攝單元21的動(dòng)態(tài)圖像、指示從關(guān)鍵字檢測(cè)單元25提供的關(guān)鍵字的信息以及來(lái)自分離單元24的環(huán)境聲音。同樣,接收動(dòng)態(tài)圖像、指示關(guān)鍵字的信息以及環(huán)境聲音的服務(wù)器82基于由接收到的信息指定的關(guān)鍵字向動(dòng)態(tài)圖像和環(huán)境聲音添加效果。進(jìn)一步,也可以在服務(wù)器82上提供分離單元24,從而在服務(wù)器82側(cè)將環(huán)境聲音和由用戶發(fā)出的語(yǔ)音彼此分離。在此情況下,便攜式終端設(shè)備81的發(fā)送單元91向服務(wù)器82發(fā)送由拍攝單元21獲得的動(dòng)態(tài)圖像的圖像數(shù)據(jù)、由聲音拾取單元22獲得的聲音數(shù)據(jù)以及由聲音拾取單元23獲得的聲音數(shù)據(jù)。此時(shí),發(fā)送單元91向每一個(gè)聲音數(shù)據(jù)添加用于指定聲音拾取單元(拾取聲音數(shù)據(jù)的聲音)的指定信息。例如,向由聲音拾取單兀22獲得的聲音數(shù)據(jù)添加指不用于拾取環(huán)境聲音的聲音拾取單元22的指定信息。據(jù)此,在服務(wù)器82側(cè)的分離單元24指定由接收單元101接收到的聲音數(shù)據(jù)是由用于拾取環(huán)境聲音的聲音拾取單元22拾取的聲音的聲音數(shù)據(jù)還是由用于拾取關(guān)鍵字的聲音拾取單元23拾取的聲音的聲音數(shù)據(jù)。當(dāng)在服務(wù)器82側(cè)的分離單元24基于由接收單元101接收到的聲音數(shù)據(jù)分離聲音時(shí),分離單元24向延遲單元43提供作為結(jié)果獲得的環(huán)境聲音的聲音數(shù)據(jù),并且向關(guān)鍵字檢測(cè)單元25提供由用戶發(fā)出的語(yǔ)音的聲音數(shù)據(jù)。進(jìn)一步,可以由硬件執(zhí)行或者可以由軟件執(zhí)行上述一系列處理。當(dāng)由軟件執(zhí)行一系列處理時(shí),在嵌入在專用硬件中的計(jì)算機(jī)或者通用個(gè)人計(jì)算機(jī)(例如,其能夠執(zhí)行以安裝的各種程序執(zhí)行各種功能)上從程序記錄介質(zhì)安裝構(gòu)成軟件的程序。圖9是圖示計(jì)算機(jī)的硬件的配置示例的框圖,該計(jì)算機(jī)通過(guò)程序執(zhí)行上述一系列處理。在此計(jì)算機(jī)中,CPU (中央處理器)301、ROM (只讀存儲(chǔ)器)302以及RAM (隨機(jī)存取存儲(chǔ)器)303通過(guò)總線304互相連接。輸入/輸出接口 305進(jìn)一步連接到總線304。由鍵盤(pán)、鼠標(biāo)、麥克風(fēng)、相機(jī)等構(gòu)成的輸入單元306、由顯示器、揚(yáng)聲器等構(gòu)成的輸出單元307、由硬盤(pán)、非易失性存儲(chǔ)器等構(gòu)成的記錄單元308、由網(wǎng)絡(luò)接口等構(gòu)成的通信單元309以及驅(qū)動(dòng)諸如磁盤(pán)、光盤(pán)、磁光盤(pán)或者半導(dǎo)體存儲(chǔ)器之類的可移除介質(zhì)311的驅(qū)動(dòng)器310連接到輸入/輸出接口 305。在如上所述地配置的計(jì)算機(jī)中,例如,CPU301通過(guò)輸入/輸出接口 305和總線304將在記錄單元308上記錄的程序載入到RAM303以執(zhí)行,并且據(jù)此,進(jìn)行上述一系列處理。在被記錄在可移除介質(zhì)311上的狀態(tài)下,或者通過(guò)諸如局域網(wǎng)、因特網(wǎng)和數(shù)字衛(wèi)星廣播之類的有線或無(wú)線傳輸介質(zhì)提供由計(jì)算機(jī)(CPU301)執(zhí)行的程序,該可移除介質(zhì)311是由例如磁盤(pán)(包括軟盤(pán))、光盤(pán)(⑶-ROM (密致盤(pán)-只讀存儲(chǔ)器)、DVD (數(shù)字多功能盤(pán))等)、磁光盤(pán)或半導(dǎo)體存儲(chǔ)器構(gòu)成的包介質(zhì)。
借助在驅(qū)動(dòng)器310上安裝可移除介質(zhì)311,通過(guò)輸入/輸出接口 305可以在記錄單元308上安裝程序。同樣,可以由通信單元309通過(guò)有線或無(wú)線傳輸介質(zhì)接收程序以安裝在記錄單元308上。另外,可以在R0M302和記錄單元308上預(yù)先安裝程序。同時(shí),由計(jì)算機(jī)執(zhí)行的程序可以是以此描述中描述的順序按時(shí)間順序進(jìn)行處理的程序,或者可以是并行或當(dāng)需要時(shí)(如當(dāng)發(fā)布調(diào)用時(shí))進(jìn)行處理的程序。同樣,此技術(shù)的實(shí)施例不限于上述實(shí)施例并且可以做出各種變型而不背離本技術(shù)的范圍。進(jìn)一步,此技術(shù)可以具有以下配置。[I]一種圖像處理裝置,包括:關(guān)鍵字檢測(cè)單元,其由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,所述聲音拾取單兀不同于用于拾取環(huán)境聲音的聲音拾取單兀,所述環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與所述動(dòng)態(tài)圖像關(guān)聯(lián)的聲首;和效果添加單元,其向所述動(dòng)態(tài)圖像或所述環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果。[2]根據(jù)[I]所述的圖像處理裝置,進(jìn)一步包括:聲音效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成聲音效果,其中所述效果添加單元將所述聲音效果與所述環(huán)境聲音合成。[3]根據(jù)[I]所述的圖像處理裝置,進(jìn)一步包括:圖像效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成圖像效果,其中所述效果添加單元將所述圖像效果疊加在所述動(dòng)態(tài)圖像上。[4]根據(jù)[I]到[3]的任一項(xiàng)所述的圖像處理裝置,進(jìn)一步包括:拍攝單元,其拍攝所述動(dòng)態(tài)圖像;第一聲音拾取單兀,其拾取所述環(huán)境聲音;和第二聲音拾取單元,其拾取由所述用戶發(fā)出的語(yǔ)音。[5]根據(jù)[I]到[3]的任一項(xiàng)所述的圖像處理裝置,進(jìn)一步包括:接收單元,其接收所述動(dòng)態(tài)圖像、所述環(huán)境聲音和由所述用戶發(fā)出的語(yǔ)音。附圖標(biāo)記列表11便攜式終端設(shè)備、21拍攝單元、22聲音拾取單元、23聲音拾取單元、24、分離單元、25關(guān)鍵字檢測(cè)單元、26效果生成單元、27效果添加單元、28發(fā)送單元、42圖像效果生成單元、44聲音效果生成單元、51圖像效果疊加單元、52聲音效果合成單元、82服務(wù)器、101接收單元
權(quán)利要求
1.一種圖像處理裝置,包括: 關(guān)鍵字檢測(cè)單元,其從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,該所述聲音拾取單兀不同于用于拾取環(huán)境聲音的聲音拾取單兀,所述環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與所述動(dòng)態(tài)圖像關(guān)聯(lián)的聲首;和 效果添加單元,其向所述動(dòng)態(tài)圖像或所述環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果O
2.根據(jù)權(quán)利要求1所述的圖像處理裝置,進(jìn)一步包括: 聲音效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成聲音效果,其中 所述效果添加單元將所述聲音效果與所述環(huán)境聲音合成。
3.根據(jù)權(quán)利要求2所述的圖像處理裝置,進(jìn)一步包括: 圖像效果生成單元,其基于檢測(cè)到的關(guān)鍵字生成圖像效果,其中 所述效果添加單元將所述圖像效果疊加在所述動(dòng)態(tài)圖像上。
4.根據(jù)權(quán)利要求3所述的圖像處理裝置,進(jìn)一步包括: 拍攝單元,其拍攝所述動(dòng)態(tài)圖像; 第一聲音拾取單兀,其拾取所述環(huán)境聲音;和 第二聲音拾取單元,其拾取由所述用戶發(fā)出的語(yǔ)音。
5.根據(jù)權(quán)利要求3所述的圖像處理裝置,進(jìn)一步包括: 接收單元,其接收所述動(dòng)態(tài)圖像、所述環(huán)境聲音和由所述用戶發(fā)出的語(yǔ)音。
6.一種圖像處理方法,由圖像處理裝置執(zhí)行,所述圖像處理裝置包括: 關(guān)鍵字檢測(cè)單元,其從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,所述聲音拾取單兀不同于用于拾取環(huán)境聲音的聲音拾取單兀,所述環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與所述動(dòng)態(tài)圖像關(guān)聯(lián)的聲首;和 效果添加單元,其向所述動(dòng)態(tài)圖像或所述環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果, 所述圖像處理方法包括如下步驟: 所述關(guān)鍵字檢測(cè)單元檢測(cè)所述關(guān)鍵字;以及 所述效果添加單元向所述動(dòng)態(tài)圖像或所述環(huán)境聲音添加所述效果。
7.一種用于使得計(jì)算機(jī)執(zhí)行包括如下步驟的處理的程序: 從由用戶發(fā)出且由聲音拾取單元拾取的語(yǔ)音檢測(cè)預(yù)先確定的關(guān)鍵字,所述聲音拾取單元不同于用于拾取環(huán)境聲音的聲音拾取單元,所述環(huán)境聲音是當(dāng)拍攝動(dòng)態(tài)圖像時(shí)與所述動(dòng)態(tài)圖像關(guān)聯(lián)的聲首;和 向所述動(dòng)態(tài)圖像或所述環(huán)境聲音添加對(duì)于檢測(cè)到的關(guān)鍵字確定的效果。
全文摘要
本發(fā)明涉及圖像處理裝置、方法和程序,其使得能夠更簡(jiǎn)單地向動(dòng)態(tài)圖像添加效果。在便攜式終端設(shè)備中,當(dāng)正在拍攝動(dòng)態(tài)圖像時(shí),周圍環(huán)境聲音和由用戶發(fā)出的語(yǔ)音通過(guò)不同的聲音拾取單元拾取。關(guān)鍵字檢測(cè)器從由用戶發(fā)出的語(yǔ)音檢測(cè)預(yù)定的關(guān)鍵字,并且效果生成器生成與檢測(cè)到的關(guān)鍵字關(guān)聯(lián)的效果圖像和效果聲音。效果添加單元在所拍攝的動(dòng)態(tài)圖像上疊加所生成的效果圖像,并且將所生成的效果聲音與環(huán)境聲音合成,由此向動(dòng)態(tài)圖像施加圖像效果和聲音效果。根據(jù)便攜式終端設(shè)備,可以僅通過(guò)在拍攝動(dòng)態(tài)圖像時(shí)發(fā)出關(guān)鍵字,容易地向動(dòng)態(tài)圖像施加期待的效果。本技術(shù)可以應(yīng)用于移動(dòng)電話。
文檔編號(hào)H04N5/91GK103155536SQ201280003268
公開(kāi)日2013年6月12日 申請(qǐng)日期2012年8月1日 優(yōu)先權(quán)日2011年8月16日
發(fā)明者木原信之, 櫻庭洋平, 山口健, 加藤靖彥 申請(qǐng)人:索尼公司