圖像攝取設備及其控制方法

文檔序號：2829470閱讀：190來源：國知局

專利名稱：圖像攝取設備及其控制方法
技術領域：
本發(fā)明涉及圖像攝取技術。
背景技術：
關于圖像攝取設備的控制，以往有例如這樣的技術(參照日本特開2002-165122號公報)在按下快門時，再現(xiàn)預先登錄好的聲音信號，在再現(xiàn)結束的同時進行攝影。該技術通過用聲音對被攝物體指示攝影時刻，被攝物體在聲音再現(xiàn)結束時作出表情，能夠拍攝最佳的圖像。
但是，為了使攝像更簡便地進行，最好連快門的按下也省略掉。另外，有時也希望不使被攝物體在意照相機的攝影時刻，而在適當?shù)臅r刻拍攝自然的表情或動作。

發(fā)明內(nèi)容
本發(fā)明是為實現(xiàn)這樣的目的而完成的，目的在于提供一種用于更簡便地進行攝像的技術。
為達到本發(fā)明的目的，例如，本發(fā)明的圖像攝取設備具有以下結構。
即，提供一種圖像攝取設備，其特征在于，包括第1收集裝置，從上述圖像攝取設備的攝像環(huán)境收集第1攝像環(huán)境信息；第2收集裝置，從上述圖像攝取設備的攝像環(huán)境收集第2攝像環(huán)境信息；以及攝像裝置，當上述第1攝像環(huán)境信息和上述第2攝像環(huán)境信息都滿足各自的攝像條件時，進行拍攝對象的攝像。
為達到本發(fā)明的目的，例如，本發(fā)明的圖像攝取設備具有以下結構。
即，提供一種圖像攝取設備，其特征在于，包括聲音收集裝置，收集攝像環(huán)境中的聲音；聲音識別裝置，識別由上述聲音收集裝置收集的聲音；動圖像收集裝置，收集拍攝對象的動圖像；判斷裝置，基于由上述動圖像收集裝置收集到的動圖像的各幀的圖像，判斷上述拍攝對象是否滿足攝像條件；攝像裝置，當由上述聲音收集裝置收集到的聲音是預定的聲音，且上述拍攝對象滿足攝像條件時，進行上述拍攝對象的攝像。
為達到本發(fā)明的目的，例如，本發(fā)明的圖像攝取設備的控制方法具有以下結構。
即，提供一種圖像攝取設備的控制方法，其特征在于，包括第1收集步驟，從上述圖像攝取設備的攝像環(huán)境收集第1攝像環(huán)境信息；第2收集步驟，從上述圖像攝取設備的攝像環(huán)境收集第2攝像環(huán)境信息；以及攝像步驟，當上述第1攝像環(huán)境信息和上述第2攝像環(huán)境信息都滿足各自的攝像條件時，進行拍攝對象的攝像。
為達到本發(fā)明的目的，例如，本發(fā)明的圖像攝取設備的控制方法具有以下結構。
即，提供一種圖像攝取設備的控制方法，其特征在于，包括聲音收集步驟，收集攝像環(huán)境中的聲音；聲音識別步驟，識別在上述聲音收集步驟收集的聲音；動圖像收集步驟，收集拍攝對象的動圖像；判斷步驟，基于由上述動圖像收集步驟收集到的動圖像的各幀的圖像，判斷上述拍攝對象是否滿足攝像條件；攝像步驟，當由上述聲音收集步驟收集到的聲音是預定的聲音，且上述拍攝對象滿足攝像條件時，進行上述拍攝對象的攝像。
本發(fā)明的其他特征和優(yōu)點可以通過下面參照附圖對優(yōu)選實施例進行的說明而得到明確，在以下所有附圖中，對相同或相似的部分標記相同的參照標號。

附圖包含在說明書內(nèi)構成其一部分，表示本發(fā)明的實施方式，并與其記述一起用于說明本發(fā)明的原理。
圖1是表示本發(fā)明的實施例1的圖像攝取設備的硬件結構的框圖。
圖2是表示圖像攝取設備的功能結構的框圖。
圖3是表示傳感數(shù)據(jù)分析部101的功能結構的框圖。
圖4是表示為說明聲音識別處理而使用的聲音波形的一例的圖。
圖5是表示為說明個人識別處理而使用的圖像的一例的圖。
圖6是表示為說明身體動作識別處理而使用的圖像的一例的圖。
圖7是表示為說明身體動作識別處理而使用的圖像的一例的圖。
圖8是表示為說明表情識別處理而使用的圖像的一例的圖。
圖9是表示模式的選擇畫面顯示例的圖。
圖10是圖像攝取設備為拍攝被攝物體而進行的一系列處理的流程圖。
圖11是圖像攝取設備為拍攝被攝物體而進行的一系列處理的流程圖。
具體實施例方式
以下參照附圖詳細說明本發(fā)明的優(yōu)選實施例。
在以下的各實施例中，說明在圖像攝取設備的周邊環(huán)境(攝像環(huán)境)中收集第1攝像環(huán)境信息、第2攝像環(huán)境信息，當所收集的第1攝像環(huán)境信息、第2攝像環(huán)境信息滿足預定的條件時才開始攝像的圖像攝取設備。以下，作為該第1攝像環(huán)境信息、第2攝像環(huán)境信息，表示了其一例，但并不限定于此，這可以通過以下的說明而更加明確。
圖1是表示本發(fā)明的實施例1的圖像攝取設備的硬件結構的框圖。如該圖所示，本實施例的圖像攝取設備由CPU700、橋連接器(bridge)701、CPU總線702、RAM704、視頻輸入部709、視頻輸入接口部710、聲音輸入部707、聲音輸入接口部708、EEPROM705、操作部706、系統(tǒng)總線703構成。首先，對上述各部進行簡單說明。
CPU700使用存儲在RAM704、EEPROM705中的程序、數(shù)據(jù)，進行圖像攝取設備整體的控制，并執(zhí)行圖像攝取設備所進行的后述各處理。
橋連接器701是用于連接CPU總線702和系統(tǒng)總線703的結構，其中，CPU總線702用于以較高速度進行數(shù)據(jù)傳送，系統(tǒng)總線703進行比CPU總線702低的速度的數(shù)據(jù)傳送。另外，橋連接器701還具有存儲器控制器的功能，具有進行對與橋連接器701連接的RAM704的訪問控制的DMA(Direct Memory Access存儲器直接訪問)功能。
RAM704是由SDRAM(Synchronous DRAM)/DDR(Double DataRate)/RDRAM(Rambus DRAM)等大容量高速存儲器構成的，具有用于暫時存儲程序和數(shù)據(jù)的區(qū)域，并且具有CPU700執(zhí)行各種處理時使用的工作區(qū)。
EEPROM705存儲有用于使CPU700執(zhí)行后述的各種處理的程序和數(shù)據(jù)，并且也具有用于暫時存儲各種數(shù)據(jù)的區(qū)域。所拍攝的圖像和聲音作為數(shù)據(jù)記錄在該區(qū)域中。
操作部706是能夠通過圖像攝取設備的操作者進行操作而向CPU700輸入各種指示的、作為操作接口發(fā)揮功能的結構，其具有操作按鈕，通過按下按鈕，視頻輸入部709、聲音輸入部707開始進行動作，開始圖像、聲音的輸入。
視頻輸入部709包括CCD(Charge-Coupled Devices)/CMOS(Complimentary Metal Oxide Semiconductor)傳感器等光電變換器件、控制該光電變換器件的驅動電路、以及負責各種圖像修正的信號處理電路。通過該結構，視頻輸入部709拍攝現(xiàn)實空間的動圖像，并將所拍攝的動圖像的各幀的圖像信號輸出到視頻輸入接口部710。
視頻輸入接口部710將從視頻輸入部709輸出的各幀的圖像信號變換成數(shù)字圖像數(shù)據(jù)，進行緩存。然后，例如使用橋連接器701所具有的DMA功能，順次傳送到RAM704中的預定地址。
聲音輸入部707例如是麥克風，收集圖像攝取設備周圍的聲音，將其作為模擬信號輸出到聲音輸入接口部708。聲音輸入接口部708將該聲音信號變換成數(shù)字聲音數(shù)據(jù)，并對其進行緩存。然后，例如使用橋連接器701所具有的DMA功能，順次傳送到RAM704中的預定地址。
下面對使用具有上述結構的圖像攝取設備拍攝被攝物體(這里將人作為被攝物體)的情況進行簡單說明。圖像攝取設備的操作者操作操作部706，使視頻輸入部709和聲音輸入部707開始動作后，如上述那樣，各幀的圖像數(shù)據(jù)和聲音數(shù)據(jù)順次存儲到RAM704中。
CPU700順次檢查存儲在RAM704中的圖像數(shù)據(jù)、聲音數(shù)據(jù)，在一者滿足預定的攝像條件時，即識別到被攝物體(拍攝對象)的攝影意圖時，轉移到攝像的準備狀態(tài)，進而在另一者滿足了預定條件時，即識別到攝影的指示時，將此時所參照的圖像數(shù)據(jù)和聲音數(shù)據(jù)傳送給EEPROM705。由此，能夠拍攝進行了攝影指示時的圖像(此處所謂“拍攝”是指將圖像記錄到EEPROM705中)，并且能夠對此時的聲音數(shù)據(jù)也進行記錄。
圖2是表示圖像攝取設備的功能結構的框圖。傳感數(shù)據(jù)取得部100取得數(shù)字圖像數(shù)據(jù)和數(shù)字聲音數(shù)據(jù)，其中，所述數(shù)字圖像數(shù)據(jù)是對從成像光學系統(tǒng)和固體攝像元件得到的圖像信號進行A/D轉換而得到的，所述數(shù)字聲音數(shù)據(jù)是將從麥克風得到的聲音轉換成電信號而得到的。
傳感數(shù)據(jù)分析部101對傳感數(shù)據(jù)取得部100取得的圖像、聲音進行后述的各種識別處理。傳感數(shù)據(jù)分析部101可以由例如FPGA(FieldProgrammable Gate Array場可編譯門陣列)、或ASIC(ApplicationSpecific Integrated Circuit專用集成電路)等專用硬件構成。
圖3是表示傳感數(shù)據(jù)分析部101的功能結構的框圖。如該圖所示，傳感數(shù)據(jù)分析部101包括表情識別部110、身體動作識別部111、個人識別部112、以及聲音識別部113。即，包括使用圖像信息進行識別處理的部分(表情識別部110、身體動作識別部111、個人識別部112)、和使用聲音信息進行識別處理的部分(聲音識別部113)。
使用圖像信息的識別，是個人識別、姿態(tài)手勢等身體動作識別、表情識別。
首先說明個人識別處理。圖5是表示為說明個人識別處理而使用的圖像的一例的圖。關于個人的識別，是以下這樣的方法例如在圖像中進行膚色檢索后，在膚色范圍220內(nèi)通過使用了眼睛模板221、嘴模板等的匹配來確定眼睛、嘴的候選，并根據(jù)各個候選位置的空間配置關系，進行眼睛、嘴的位置、即臉部位置的檢測，接下來，基于眼睛、嘴的位置，設定若干個特征點，在這些特征點中，如“利用計算機的臉部識別-測量-”(日本電子信息通信學會雜志Vol.j80-ANo.8pp.1215-1230 Aug.1997)中所記載的那樣，通過進行伽柏小波變換(Gabor Wavelet Transformation)，抽取圖案的局部周期性、方向性等特征量，將該特征量與預先登錄了的數(shù)據(jù)進行比較，由此進行個人識別。個人識別部112進行這樣的個人識別處理。另外，個人識別的方法并不限于此。
接下來，說明身體動作識別。圖6、圖7是表示為說明身體動作識別處理而使用的圖像的一例的圖。有這樣的一種方法如圖6所示，當被攝物體240進行手的姿勢241時，如圖7所示那樣，以檢測到人的臉部260的位置為基準，從其周邊范圍內(nèi)使用檢測手姿勢的模板262識別被攝物體的手的姿勢261。另外，關于姿態(tài)手勢等的識別技術，有“基于動作變化的利用View-based Aspect Model的動作識別”(日本電子信息通信學會雜志Vol.j84-D2 No.10 pp.2212-2223Oct.2001)等。另外，此處所示的身體動作，可以是姿勢等某瞬間的特定身體部位的形狀，也可以是姿態(tài)手勢等連續(xù)的一連串動作。身體動作識別部111進行這樣的身體動作識別處理。另外，關于身體動作識別的方法，不限于此。
接下來，說明表情識別處理。圖8是表示為說明表情識別處理而使用的圖像的一例的圖。表情識別，例如“基于人和計算機的面部表情的識別III-利用計算機的面部表情識別技術(2)面部的表情動作的識別-”(日本電子信息通信學會雜志Vol.85 No.12 pp.936-941 Dec.2002)所記載的那樣，是這樣的方法根據(jù)圖8所示的眼睛、嘴的位置，抽取出各個眼睛、嘴的位置的周邊范圍內(nèi)的眼尾、眼角、嘴端點等多個特征點后，算出描述臉部特征的形狀或配置的變化的特征參數(shù)，準備輸入層和神經(jīng)網(wǎng)絡來識別表情，其中，上述輸入層將上述特征參數(shù)作為輸入；上述神經(jīng)網(wǎng)絡，將在P.Ekman and W.V.Friesen的“Facial Action Coding System(FACS)”(Consulting PsychologistsPress，1978)中提出的動作單元(Action Unit)的檢測的有無作為輸出。另外，關于表情，除了喜怒哀樂外，也可以識別閉眼等。表情識別部110進行這樣的處理。另外，表情識別處理并不限于這些方法，也可以使用其他方法。
如以上說明的那樣，表情識別部110、身體動作識別部111、個人識別部112根據(jù)圖像信息進行各個識別處理。在以上說明的基于圖像信息的識別處理中，并不一定使用構成圖像的全部像素，例如如果生成按每個像素間取后的縮略像，使用該縮略像進行識別處理，則識別處理時所參照的像素數(shù)少于原來的圖像，所以能夠更加高速地進行識別處理。
接下來，說明使用了聲音信息的識別處理。圖4是表示為說明聲音識別處理而使用的聲音波形的一例的圖。以往已知有這樣的方法如該圖所示，對于在時刻t[s]與t+1[s]之間得到的一定幀長的聲音信號200，如在“聲音識別研究的動向”(Vol.j83-D2 No.2 pp.433-457Feb.2000)中記載的那樣，通過采用使用了HMM(Hidden MarkovModel)的概率模型等，識別由“あ”、“い”等元音構成的單詞、語句、以及特定說話者。例如進行所得到的聲音信息是否為“請進行拍攝”這樣的語句的判定。在聲音識別處理中可以使用任意的識別處理，可以進行由元音構成的單詞、語句的識別，以及這之外的“好！”等發(fā)聲的識別，甚至可以進行特定說話者的識別。聲音識別部113進行這樣的聲音識別處理。
返回到圖2，當由傳感數(shù)據(jù)分析部101進行的上述識別處理完成后，傳感數(shù)據(jù)分析部101，判斷識別的結果是否為識別到來自被攝物體的攝影意圖(所謂攝影意圖，是指被攝物體有現(xiàn)在想要進行攝影這樣的被攝物體自身的想法)，在識別到攝影意圖時，進行指示使得攝影準備信號發(fā)生部102產(chǎn)生攝影準備信號。攝影準備信號發(fā)生部102，按照該指示將攝影準備信號輸出給攝影信號發(fā)生部103。
該攝影準備信號相當于以往的照相機中、在半按下快門按鈕時照相機內(nèi)所產(chǎn)生的控制信號，例如，相當于AF或AE的動作控制信號、或圖像傳感數(shù)據(jù)的緩沖存儲器存儲等控制信號。
并且，傳感數(shù)據(jù)分析部101在識別到攝影意圖后，還對傳感數(shù)據(jù)取得部100取得的圖像、聲音進行上述識別處理，這一次判斷是否識別到來自被攝物體的攝影指示，當識別到攝影指示時，進行指示使得攝影信號發(fā)生部103產(chǎn)生攝影信號。攝影信號發(fā)生部103接收該指示，并接收來自攝影準備信號發(fā)生部102的攝影準備信號后，產(chǎn)生攝影信號，進行指示使得將識別所使用的圖像、聲音存儲到存儲部104中，因此，存儲部104接受該指示，對所指示的圖像、聲音進行存儲。
該攝影信號相當于以往的照相機中、在按下快門按鈕時照相機內(nèi)所產(chǎn)生的控制信號，在本實施例的情況下，例如相當于在被攝物體的人物表情為笑臉的瞬間，將圖像數(shù)據(jù)和聲音信號存儲到存儲器等中。
存儲部104相當于例如閃速存儲器(flash memory)，但不限于此。
圖10是以上說明的、圖像攝取設備為拍攝被攝物體而進行的一系列處理的流程圖。用于使CPU700執(zhí)行符合該圖的流程的處理的程序和數(shù)據(jù)，被存儲在EEPROM705中，CPU700使用這些程序和數(shù)據(jù)進行處理，由此，本實施例的圖像攝取設備執(zhí)行以下說明的各處理。
在圖10的流程圖中，圖像攝取設備的操作者操作操作部706，選擇用于轉移到上述攝影準備狀態(tài)的模式，和用于從攝影準備狀態(tài)轉移到實際進行攝影的狀態(tài)的模式。例如，操作部706設有液晶畫面，在此顯示如圖9所示那樣的GUI，使操作者選擇任一個模式。關于選擇方法，可以是例如以觸摸屏的形式構成該液晶畫面，在液晶畫面上進行觸摸，也可以是用操作部706所具備的按鈕組進行選擇。圖9是表示模式的選擇畫面顯示例的圖。這里，為轉移到上述攝影準備狀態(tài)而選擇聲音識別模式，為從攝影準備狀態(tài)轉移到實際進行攝影的狀態(tài)而選擇表情識別模式。
當CPU700檢測到上述各模式的選擇指示后，CPU700將所設定的各模式的數(shù)據(jù)暫時存儲在RAM704中(步驟S300)。
然后，因為選擇了聲音識別模式，所以控制聲音輸入部707，開始聲音的收集(步驟S301)。由此，圖像攝取設備周圍的聲音信息作為聲音信號從聲音輸入部707輸入到聲音輸入接口部708，所以聲音輸入接口部708將其轉換成數(shù)字聲音數(shù)據(jù)，輸出到RAM704。
CPU700對已取入到RAM704中的該聲音數(shù)據(jù)進行上述聲音識別處理，判斷被攝物體發(fā)出的聲音是否為預定的語句(sentence)(符合預先作為數(shù)據(jù)而登錄在EEPROM705中的語句數(shù)據(jù)的語句)、例如是否為“請進行拍攝”這樣的語句(步驟S303)。
其結果，當判斷為沒有發(fā)出預定的語句時，使處理返回到步驟S301，反復進行以后的處理。另一方面，當判斷為發(fā)出了預定的語句時，進入步驟S304，CPU700產(chǎn)生攝影準備信號(步驟S304)，使圖像攝取設備成為攝影準備狀態(tài)。關于用于使圖像攝取設備成為攝影準備狀態(tài)的處理，如上所述。
然后，CPU700這次對視頻輸入部709進行控制，開始圖像的收集(步驟S305)。由此，現(xiàn)實空間的動圖像以幀單位作為圖像信號從視頻輸入部709輸入到視頻輸入接口部710，因此，視頻輸入接口部710將其轉換成數(shù)字圖像數(shù)據(jù)，輸出到RAM704。
然后，CPU700對該圖像數(shù)據(jù)進行上述識別處理，但此處設定了表情識別模式，所以識別圖像中的被攝物體的面部表情(步驟S306)，判斷其是否為預定的表情，例如是否為笑臉(步驟S307)。
其結果，當不是預定的表情時，使處理返回到步驟S305，反復進行以后的處理。另一方面，當是預定的表情時，使處理進入步驟S308，CPU700產(chǎn)生攝影信號(步驟S308)，使圖像攝取設備成為攝影狀態(tài)。然后，CPU700將在步驟S306中進行識別處理時所使用過的圖像的數(shù)據(jù)、在步驟S302中進行識別處理時使用過的聲音的數(shù)據(jù)，從RAM704移動到EEPROM705中，由此進行圖像、聲音的記錄處理(步驟S309)。
通過以上的處理，不必進行例如快門的按下等操作，僅以聲音信息、圖像信息就能進行被攝物體的拍攝，因此，與以往相比能夠更加簡便地進行被攝物體的拍攝。
另外，在本實施例中，視頻輸入部709是在步驟S303中判斷為發(fā)出了預定的語句后才開始動作的，但不限于此，也可以是在聲音輸入部707開始動作的同時進行動作。
另外，在本實施例中，是將圖像、聲音一起記錄的，但也可以僅記錄一者。
在本實施例中，為了轉移到上述攝影準備狀態(tài)而選擇個人識別模式，并且，為了從攝影準備狀態(tài)轉移到實際進行攝影的狀態(tài)而選擇身體動作識別模式。
圖11是當設定了這樣的模式時，圖像攝取設備為拍攝被攝物體而進行的一系列處理的流程圖。用于使CPU700執(zhí)行符合該圖的流程的處理的程序和數(shù)據(jù)，被存儲在EEPROM705中，CPU700使用該程序和數(shù)據(jù)進行處理，由此，本實施例的圖像攝取設備執(zhí)行以下說明的各處理。
當CPU700檢測到上述各模式的選擇指示后，CPU700將所設定的各模式的數(shù)據(jù)暫時存儲在RAM704中(步驟S500)。
然后，因為個人識別模式被選中了，所以控制視頻輸入部709，開始圖像的收集(步驟S501)。由此，現(xiàn)實空間的動圖像以幀單位作為圖像信號從視頻輸入部709輸入到視頻輸入接口部710，因此，視頻輸入接口部710將其轉換成數(shù)字圖像數(shù)據(jù)，輸出到RAM704。
然后，CPU700對該圖像數(shù)據(jù)進行上述識別處理，但此處設定了個人識別模式，所以識別圖像中的被攝物體的臉是哪一人的臉(步驟S502)，判斷其是否為預定的個人的臉(步驟S503)。
其結果，當不是預定的臉時，使處理返回到步驟S501，反復進行以后的處理。另一方面，當是預定的臉時，使處理進入步驟S504，CPU700產(chǎn)生攝影準備信號(步驟S504)，使圖像攝取設備成為攝影準備狀態(tài)。關于用于使圖像攝取設備成為攝影準備狀態(tài)的處理，如上所述。
然后，CPU700再繼續(xù)進行數(shù)字圖像數(shù)據(jù)的收集(步驟S505)，對取入到RAM704中的圖像數(shù)據(jù)進行上述識別處理，但此處設定為身體動作識別模式，因此識別圖像中的被攝物體的身體動作(步驟S506)，判斷其是否為預定的身體動作，例如是否取“V”手勢的姿勢(步驟S507)。
其結果，當不是預定的身體動作時，使處理返回步驟S505，反復進行以后的處理。另一方面，當是預定的身體動作時，使處理進入步驟S808，CPU700產(chǎn)生攝影信號(步驟S508)，使圖像攝取設備成為攝影狀態(tài)。然后，CPU700將在步驟S506中進行識別處理時所使用過的圖像的數(shù)據(jù)從RAM704移動到EEPROM705中，由此進行圖像的記錄處理(步驟S509)。
另外，當在開始本流程的處理的同時也開始聲音輸入部707的動作的情況下，也可以使得將與取得在步驟S506中進行識別處理時所使用過的圖像的數(shù)據(jù)的時刻大致同時取得的聲音的數(shù)據(jù)，也記錄在EEPROM705中。
另外，在上述各實施例中，分別單獨使用圖像信息、聲音信息，由CPU700進行向攝影準備狀態(tài)的轉移、向攝影狀態(tài)的轉移，但也可以組合它們來進行轉移。例如，除通過基于圖像的臉部識別進行個人識別外，也可以并用通過聲音來進行說話者識別的方式。即，上述各實施例的本質在于，使用圖像信息、聲音信息，由CPU700進行向攝影準備狀態(tài)的轉移、向攝影狀態(tài)的轉移，而關于如何使用它們，并不作特別限定。
另外，本發(fā)明的目的顯然也可以通過下述方式來達到，即，將記錄了實現(xiàn)上述實施例的功能的軟件的程序代碼的記錄介質(或存儲介質)，提供給系統(tǒng)或者裝置，該系統(tǒng)或者裝置的計算機(或者CPU、MPU)讀出并執(zhí)行存儲在存儲介質中的程序代碼。在這種情況下，從記錄介質中讀出的程序代碼本身就實現(xiàn)上述實施方式的功能，記錄了該程序代碼的記錄介質就構成本發(fā)明。
而且，不僅通過計算機執(zhí)行讀出的程序代碼，能夠實現(xiàn)上述實施方式的功能，根據(jù)該程序代碼的指示，在計算機上運行的操作系統(tǒng)(OS)等進行實際處理的一部分或全部，通過該處理實現(xiàn)上述實施方式的功能的情況顯然也包含在本發(fā)明的范圍內(nèi)。
進而，在從存儲介質讀出的程序代碼，被寫入到插在計算機中的功能擴展卡或連接在計算機上的功能擴展單元所具備的存儲器中后，根據(jù)該程序代碼的指示，該功能擴展卡或功能擴展單元所具有的CPU等進行實際處理的一部分或全部，通過該處理來實現(xiàn)上述實施方式的功能的情況顯然也包含在本發(fā)明的范圍內(nèi)。
將本發(fā)明適用于上述記錄介質時，與之前說明的流程對應的程序代碼就被存儲在該記錄介質中。
以上，通過優(yōu)選實施方式對本發(fā)明進行了詳細的說明，在不脫離本發(fā)明的精神和范圍的前提下，本發(fā)明可以進行各種不同的變更，并且應該理解為，本發(fā)明不受上述特定的實施方式的限定，其范圍由所附的權利要求限定。
權利要求
1.一種圖像攝取設備，其特征在于，包括第1收集裝置，從上述圖像攝取設備的攝像環(huán)境收集第1攝像環(huán)境信息；第2收集裝置，從上述圖像攝取設備的攝像環(huán)境收集第2攝像環(huán)境信息；以及攝像裝置，當上述第1攝像環(huán)境信息和上述第2攝像環(huán)境信息都滿足各自的攝像條件時，進行拍攝對象的攝像。
2.根據(jù)權利要求1所述的圖像攝取設備，其特征在于上述第1攝像環(huán)境信息、上述第2攝像環(huán)境信息分別是拍攝對象的圖像信息、聲音信息的任一者。
3.根據(jù)權利要求1所述的圖像攝取設備，其特征在于還包括選擇裝置，選擇上述第1收集裝置收集的上述第1攝像環(huán)境信息、上述第2收集裝置收集的上述第2攝像環(huán)境信息。
4.根據(jù)權利要求1所述的圖像攝取設備，其特征在于上述第1攝像環(huán)境信息是來自上述拍攝對象的聲音，上述第2攝像環(huán)境信息是上述拍攝對象的表情，上述攝像裝置，在上述聲音是表達預定的語句的聲音，且上述表情是預定的表情時，進行上述拍攝對象的攝像。
5.根據(jù)權利要求1所述的圖像攝取設備，其特征在于上述第1攝像環(huán)境信息是作為上述拍攝對象的人的外觀，上述第2攝像環(huán)境信息是上述人的身體動作，上述攝像裝置，在關于上述人的外觀的信息是預定的信息，且上述身體動作是預定的動作時，進行上述拍攝對象的攝像。
6.根據(jù)權利要求5所述的圖像攝取設備，其特征在于上述人的外觀包括臉或表情。
7.一種圖像攝取設備，其特征在于，包括聲音收集裝置，收集攝像環(huán)境中的聲音；聲音識別裝置，識別由上述聲音收集裝置收集的聲音；動圖像收集裝置，收集拍攝對象的動圖像；判斷裝置，基于由上述動圖像收集裝置收集到的動圖像的各幀的圖像，判斷上述拍攝對象是否滿足攝像條件；攝像裝置，當由上述聲音收集裝置收集到的聲音是預定的聲音，且上述拍攝對象滿足攝像條件時，進行上述拍攝對象的攝像。
8.一種圖像攝取設備的控制方法，其特征在于，包括第1收集步驟，從上述圖像攝取設備的攝像環(huán)境收集第1攝像環(huán)境信息；第2收集步驟，從上述圖像攝取設備的攝像環(huán)境收集第2攝像環(huán)境信息；以及攝像步驟，當上述第1攝像環(huán)境信息和上述第2攝像環(huán)境信息都滿足各自的攝像條件時，進行拍攝對象的攝像。
9.一種圖像攝取設備的控制方法，其特征在于，包括聲音收集步驟，收集攝像環(huán)境中的聲音；聲音識別步驟，識別在上述聲音收集步驟收集的聲音；動圖像收集步驟，收集拍攝對象的動圖像；判斷步驟，基于由上述動圖像收集步驟收集到的動圖像的各幀的圖像，判斷上述拍攝對象是否滿足攝像條件；攝像步驟，當由上述聲音收集步驟收集到的聲音是預定的聲音，且上述拍攝對象滿足攝像條件時，進行上述拍攝對象的攝像。
全文摘要
本發(fā)明提供一種圖像攝取設備及其控制方法，收集作為被攝物體的人物的聲音和圖像，進行所收集到的聲音的識別，當識別結果為識別出該聲音表達預定的語句時，進行所收集到的圖像的識別，當識別結果為識別出該圖像是表示預定的表情的人物的臉時，記錄該圖像、聲音。
文檔編號G10L13/00GK1841187SQ200610067039
公開日2006年10月4日申請日期2006年3月31日優(yōu)先權日2005年4月1日
發(fā)明者金田雄司, 真繼優(yōu)和, 加藤政美, 森克彥, 佐藤博, 御手洗裕輔申請人:佳能株式會社

完整全部詳細技術資料下載