欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理裝置、信息處理方法和信息處理程序的制作方法

文檔序號:6331516閱讀:116來源:國知局
專利名稱:信息處理裝置、信息處理方法和信息處理程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理裝置、信息處理方法和信息處理程序。本發(fā)明可理想地應(yīng) 用到例如數(shù)字?jǐn)z像機或打印裝置。
背景技術(shù)
已知的圖像分類設(shè)備從每個積累和存儲的圖像中檢測人物的臉部部分,并且還 提取檢測到的臉部部分作為臉部圖像。另外,圖像分類設(shè)備基于臉部圖像的特征點,按 人物對圖像分類。
圖像分類設(shè)備在圖像再現(xiàn)模式中顯示各個人物的臉部圖像的列表,如果在此狀 態(tài)中期望人物作為臉部圖像被選擇,那么根據(jù)該選擇檢索期望人物的圖像,并且以縮略 圖的形式顯示圖像的列表(例如,參見JP-A-2008-71112 (第11至17頁以及圖6和7))。發(fā)明內(nèi)容
當(dāng)一個人變?yōu)槌扇藭r,臉部外觀幾乎不會隨著年歲的流逝而變化。同時,當(dāng)一 個人從孩童成長為成人時,臉部外觀往往會在成長期間變化。
實際上,即使在同一人物的情況下,如果該人孩童時代的臉部和該人變?yōu)槌扇?后的臉部以臉部圖像的特征點的形式被相互比較,那么這些臉部被判定為不同人物的臉 部。即,臉部外觀可能在成長期間變化。
如上配置的圖像分類設(shè)備僅通過使用臉部圖像的特征點來確定各個人物。因 此,當(dāng)一個人孩童時代的圖像和該人變?yōu)槌扇撕蟮膱D像被存儲時,該圖像分類設(shè)備可能 基于該人孩童時代的臉部圖像的特征點和該人變?yōu)槌扇撕蟮哪槻繄D像的特征點而將這些 圖像分類成不同人物的圖像。
從而,即使當(dāng)同一人物在不同圖像中時,如果該人的臉部外觀變化,那么圖像 分類設(shè)備可能不能準(zhǔn)確地檢索出同一人物的圖像。
因此,希望提供一種能夠準(zhǔn)確地檢索出同一人物的圖像的信息處理裝置、信息 處理方法和信息處理程序。
根據(jù)本發(fā)明的一個實施例,獲取通過拍攝作為被攝物的人物而生成的圖像數(shù) 據(jù),并且檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物。確定從圖像中檢測到的每個 人物,并且判定從圖像中檢測到的多個人物之間的關(guān)系。當(dāng)從圖像中檢測到的多個人物 之中的至少一個人物被確定而另一人物未能被確定時,基于所判定的多個人物之間的關(guān) 系和存儲在存儲介質(zhì)中的表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信息來確定 另一人物。
因此,根據(jù)本發(fā)明的實施例,即使當(dāng)從一圖像中檢測到的人物與從另一圖像中 檢測到的人物是同一人物但臉部外觀變化了時,也可以基于人物之間的關(guān)系把從該圖像 中檢測到的人物與從另一圖像中檢測到的人物確定為同一人物。
根據(jù)本發(fā)明的實施例,如果獲取了通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù),那么檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物,并且還判定從圖像中檢測到 的多個人物之間的關(guān)系。然后,基于從圖像中檢測到的人物的數(shù)目和所判定的多個人物 之間的關(guān)系來選擇圖像的打印份數(shù)。
因此,根據(jù)本發(fā)明的實施例,對于圖像中的多個人物的每個群組,可以只打印 一份圖像,并且可以為不屬于任何群組的人物單獨打印圖像。結(jié)果,可以為每個群組中 的多個人物單獨打印圖像,防止了浪費打印的圖像。
根據(jù)本發(fā)明的實施例,獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù),并 且檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物。確定從圖像中檢測到的每個人物, 并且還判定從圖像中檢測到的多個人物之間的關(guān)系。當(dāng)從圖像中檢測到的多個人物之中 的至少一個人物被確定而另一人物未能被確定時,基于所判定的多個人物之間的關(guān)系和 存儲在存儲介質(zhì)中的表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信息來確定另一 人物。因此,可以實現(xiàn)一種信息處理裝置、信息處理方法和信息處理程序,即使當(dāng)從圖 像中檢測到的人物與從另一圖像中檢測到的人物是同一人物但臉部外觀變化了時,它們 也能夠基于人物之間的關(guān)系把從該圖像中檢測到的人物與從另一圖像中檢測到的人物確 定為同一人物,從而準(zhǔn)確地檢索同一人物的圖像。
根據(jù)本發(fā)明的實施例,如果獲取了通過拍攝作為被攝物的人物而生成的圖像數(shù) 據(jù),那么檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物,并且判定從圖像中檢測到的 多個人物之間的關(guān)系。基于從圖像中檢測到的人物的數(shù)目和所判定的多個人物之間的關(guān) 系來選擇圖像的打印份數(shù)。因此,對于圖像中的多個人物的每個群組,可以只打印一份 圖像,并且可以為不屬于任何群組的人物單獨打印圖像。結(jié)果,可以為每個群組中的多 個人物單獨打印圖像,從而防止了浪費打印的圖像并且為每個群組或個人準(zhǔn)確地打印了 圖像。



圖16是示出動作分析/關(guān)系推定處理子過程的流程圖。圖17是示出關(guān)系判定處理子過程的流程圖。

圖18是示出人物確定處理子過程的流程圖。圖19是示出人生影集創(chuàng)建處理過程的流程圖。圖20是按打印裝置的硬件電路塊示出電路配置的框圖。圖21是按用于描述控制單元的功能的功能電路塊示出電路配置的框圖。圖22是用于描述多個靜止圖像中多個人物之間的關(guān)系的示意圖。圖23示出了用于描述多個靜止圖像中多個人物的組合的示意圖。圖24是用于描述作為夫妻的人物A和人物B的靜止圖像的打印的示意圖。圖25是用于描述人物C的靜止圖像的打印的示意圖。圖26是示出份數(shù)選擇/打印處理過程(1)的流程圖。圖27是示出份數(shù)選擇/打印處理過程(2)的流程圖。圖28是示出份數(shù)選擇/打印處理過程(3)的流程圖。圖29是示出份數(shù)選擇/打印處理過程⑷的流程圖。圖30是示出份數(shù)選擇/打印處理過程(5)的流程圖。
具體實施例方式下面,將參考附圖描述用于實現(xiàn)本發(fā)明的方式(以下稱之為實施例)。將按以下 順序提供描述。1.實施例概要2.第一實施例3.第二實施例4.變體<1.實施例概要>首先,將描述實施例的概要。在描述概要之后,將提供對作為此實施例的具體 示例的第一實施例和第二實施例的描述。在圖1中,標(biāo)號1整體上表示根據(jù)該實施例的信息處理裝置。在信息處理裝置1 中,存儲單元2在存儲介質(zhì)3中存儲表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信 息。存儲介質(zhì)3被結(jié)合到信息處理裝置1中,或者被可移除地附接到信息處理裝置1。在信息處理裝置1中,獲取單元4獲取通過拍攝作為被攝物的人物而生成的圖像 數(shù)據(jù)。在信息處理裝置1中,檢測單元5基于由獲取單元4獲取的圖像數(shù)據(jù)來檢測圖像 中的每個人物。在信息處理裝置1中,確定單元6確定由檢測單元5從圖像中檢測到的每個人 物。在信息處理裝置1中,判定單元7判定由檢測單元5從圖像中檢測到的多個人物之 間的關(guān)系。在信息處理裝置1中,當(dāng)由檢測單元5從圖像中檢測到的多個人物中的至少一個 人物被確定,而另一人物不能被確定時,確定單元6基于由判定單元7判定的多個人物之 間的關(guān)系和存儲在存儲介質(zhì)3中的人物關(guān)系信息來確定另一人物。利用此配置,即使當(dāng)從一圖像中檢測到的人物與從另一圖像中檢測到的人物是同一人物但臉部外觀變化了時,信息處理裝置1也可以基于人物之間的關(guān)系把從該圖像 中檢測到的人物與從另一圖像中檢測到的人物確定為同一人物。因此,信息處理裝置1 可以準(zhǔn)確地檢索出同一人物的圖像。<2.第 一實施例>[2-1數(shù)字?jǐn)z像機的電路配置]接下來,將參考圖2描述作為信息處理裝置1 (圖1)的具體示例的數(shù)字?jǐn)z像機10 的按硬件電路塊的電路配置。如圖2所示,數(shù)字?jǐn)z像機10例如具有由微處理器構(gòu)成的控 制單元11??刂茊卧?1執(zhí)行對數(shù)字?jǐn)z像機10的整體控制并且根據(jù)預(yù)先存儲在內(nèi)部存儲器 (未示出)中的各種程序來執(zhí)行預(yù)定的運算處理??刂茊卧?1加載根據(jù)對例如設(shè)置在數(shù) 字?jǐn)z像機10的外殼中的操作鍵12的操作而輸入的輸入信號,并且根據(jù)該輸入信號執(zhí)行各 種處理。作為操作鍵12,數(shù)字?jǐn)z像機10的外殼設(shè)置有用于指示電源開/關(guān)的電源鍵以及 用于指示開始和結(jié)束對拍攝的存儲的拍攝存儲鍵。數(shù)字?jǐn)z像機10的外殼還設(shè)置有用于指示切換操作模式的模式切換鍵、用于指示 對由在拍攝被攝物時生成和存儲的運動圖像數(shù)據(jù)和聲音數(shù)據(jù)構(gòu)成的視頻數(shù)據(jù)進行再現(xiàn)的 再現(xiàn)鍵,等等。實際上,如果電源鍵被操作以指示電源開啟,那么控制單元11例如被加電并且 在拍攝模式中被激活。如果用戶在再現(xiàn)模式中操作模式切換鍵以指示將操作模式切換到 拍攝模式,那么控制單元11被從再現(xiàn)模式切換到拍攝模式。在拍攝模式中,控制單元11適當(dāng)?shù)仳?qū)動和控制其中設(shè)置有拍攝透鏡13A、光圈 快門、聚焦透鏡等等的透鏡單元13,以針對被攝物自動地調(diào)整焦點或曝光。從而,在針對被攝物自動調(diào)整焦點或曝光的狀態(tài)中,控制單元11通過透鏡單元 13在成像元件14的光接收表面處接收從包括被攝物的拍攝范圍傳入的成像光Li。成像 元件14是CCD (電荷耦合器件)圖像傳感器、CMOS (互補金屬氧化物半導(dǎo)體)圖像傳感
m 坐坐
^fr,O此時,成像元件14在控制單元11的控制下,以預(yù)定的周期對在光接收表面處接 收的成像光Ll進行光電轉(zhuǎn)換,以根據(jù)成像光Ll順次生成模擬成像信號。成像元件14還 通過模數(shù)轉(zhuǎn)換單元15將順次生成的成像信號轉(zhuǎn)換成數(shù)字成像數(shù)據(jù)并將數(shù)字成像數(shù)據(jù)發(fā)送 給數(shù)字處理單元16。數(shù)字處理單元16在每次成像數(shù)據(jù)通過模數(shù)轉(zhuǎn)換單元15從成像元件14提供來時 對成像數(shù)據(jù)執(zhí)行預(yù)定的數(shù)字處理,例如降噪處理或斑點校正處理。從而,數(shù)字處理單元 16基于從成像元件14順次提供來的成像數(shù)據(jù),生成構(gòu)成運動圖像的時間連續(xù)單位圖像的 單位圖像數(shù)據(jù)。數(shù)字處理單元16以這種方式基于成像數(shù)據(jù)順次生成單位圖像數(shù)據(jù)并且將所生成 的單位圖像數(shù)據(jù)的數(shù)據(jù)串作為用于拍攝狀態(tài)確認的運動圖像的運動圖像數(shù)據(jù)發(fā)送到控制 單元11。在以下描述中,用于拍攝狀態(tài)確認的運動圖像也被稱為拍攝狀態(tài)提示圖像,并 且拍攝狀態(tài)提示圖像的運動圖像數(shù)據(jù)也被稱為拍攝狀態(tài)提示圖像數(shù)據(jù)??刂茊卧?1把從數(shù)字處理單元16提供來的拍攝狀態(tài)提示圖像數(shù)據(jù)發(fā)送給顯示單元17。顯示單元17是液晶顯示器、有機EL (電致發(fā)光)顯示器等等。從而,控制單元11在顯示單元17上顯示基于拍攝狀態(tài)提示圖像數(shù)據(jù)的拍攝狀態(tài) 提示圖像(即,順次切換基于單位圖像數(shù)據(jù)的單位圖像作為拍攝狀態(tài)提示圖像)。這樣,控制單元11可以連續(xù)地拍攝包括被攝物的拍攝范圍并且在顯示單元17上 顯示拍攝狀態(tài)提示圖像??刂茊卧?1還可允許用戶通過拍攝狀態(tài)提示圖像確認相對于被 攝物的拍攝范圍或構(gòu)圖以及諸如焦點之類的拍攝狀態(tài)。 在拍攝模式中,如果用戶操作拍攝存儲鍵以指示開始存儲,那么控制單元11開 始存儲對被攝物的拍攝,而如果用戶再次操作拍攝存儲鍵以指示結(jié)束存儲,那么控制單 元11結(jié)束拍攝存儲。在根據(jù)拍攝模式中用戶對拍攝存儲鍵的操作從拍攝存儲開始直到拍攝存儲結(jié)束 的時段期間,控制單元11控制諸如數(shù)字處理單元16和編解碼器18之類的各個單元,以 便存儲對被攝物的拍攝。從而,在從存儲開始直到存儲結(jié)束的時段期間,數(shù)字處理單元16在每次成像數(shù) 據(jù)從成像元件14提供來時以上述方式基于成像數(shù)據(jù)生成單位圖像數(shù)據(jù)。然后,數(shù)字處理 單元16將單位圖像數(shù)據(jù)的數(shù)據(jù)串作為拍攝狀態(tài)提示圖像數(shù)據(jù)發(fā)送給控制單元11??刂茊卧?1在從存儲開始直到存儲結(jié)束的時段期間在顯示單元17上顯示拍攝狀 態(tài)提示圖像。從而,控制單元11可允許用戶在被攝物的拍攝存儲期間通過拍攝狀態(tài)提示 圖像確認被攝物的拍攝狀態(tài)。在從存儲開始直到存儲結(jié)束的時段期間,數(shù)字處理單元16在每次單位圖像數(shù)據(jù) 被順次生成時依次向單位圖像數(shù)據(jù)添加用于再現(xiàn)控制的時刻信息(即,時間碼)。數(shù)字處理單元16向編解碼器18發(fā)送帶有時刻信息的單位圖像數(shù)據(jù)的數(shù)據(jù)串作為 用于存儲的運動圖像的運動圖像數(shù)據(jù)。在以下描述中,用于存儲的運動圖像也被稱為存 儲運動圖像,并且存儲運動圖像的運動圖像數(shù)據(jù)也被稱為存儲運動圖像數(shù)據(jù)。數(shù)字?jǐn)z像機10在外殼正面(未示出)設(shè)置有拍攝透鏡13A。數(shù)字?jǐn)z像機10在 外殼正面的拍攝透鏡13A的光軸的右側(cè)和左側(cè)還設(shè)置有用于收集數(shù)字?jǐn)z像機10周圍的聲 音的兩個麥克風(fēng)19和20。數(shù)字?jǐn)z像機10在外殼背面(未示出)還設(shè)置有用于收集數(shù)字?jǐn)z像機10周圍的聲 音的至少一個麥克風(fēng)21。當(dāng)數(shù)字?jǐn)z像機10在外殼背面設(shè)置有一個麥克風(fēng)21時,麥克風(fēng) 21例如被布置在外殼背面的中央。在以下描述中,在設(shè)置于外殼正面的兩個麥克風(fēng)19和20中,當(dāng)外殼正面朝著被 攝物時位于右側(cè)的麥克風(fēng)19也被稱為右麥克風(fēng)19。在以下描述中,在設(shè)置于外殼正面的兩個麥克風(fēng)19和20中,當(dāng)外殼正面朝著被 攝物時位于左側(cè)的麥克風(fēng)20也被稱為左麥克風(fēng)20。在以下描述中,設(shè)置于外殼背面的麥 克風(fēng)21也被稱為后麥克風(fēng)21。右麥克風(fēng)19在從存儲開始直到存儲結(jié)束的時段期間收集環(huán)境聲以生成模擬聲音 信號(以下也稱為右聲音信號)。右麥克風(fēng)19通過模數(shù)轉(zhuǎn)換單元22將右聲音信號轉(zhuǎn)換成 數(shù)字聲音數(shù)據(jù)(以下也稱為右聲音數(shù)據(jù)),并且將數(shù)字聲音數(shù)據(jù)發(fā)送給控制單元11。左麥克風(fēng)20在從存儲開始直到存儲結(jié)束的時段期間收集環(huán)境聲以生成模擬聲音 信號(以下也稱為左聲音信號)。左麥克風(fēng)20通過模數(shù)轉(zhuǎn)換單元23將左聲音信號轉(zhuǎn)換成數(shù)字聲音數(shù)據(jù)(以下也稱為左聲音數(shù)據(jù)),并且將數(shù)字聲音數(shù)據(jù)發(fā)送給控制單元11。后麥克風(fēng)21在從存儲開始直到存儲結(jié)束的時段期間收集環(huán)境聲以生成模擬聲音 信號(以下也稱為后聲音信號)。后麥克風(fēng)21通過模數(shù)轉(zhuǎn)換單元24將后聲音信號轉(zhuǎn)換成 數(shù)字聲音數(shù)據(jù)(以下也稱為后聲音數(shù)據(jù)),并且將數(shù)字聲音數(shù)據(jù)發(fā)送給控制單元11。如果右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)被從右麥克風(fēng)19、左麥克風(fēng)20和后 麥克風(fēng)21提供來,那么控制單元11針對每個預(yù)定的單位對右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后 聲音數(shù)據(jù)分段??刂茊卧?1向右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)中每一個從頭到尾的每個 預(yù)定單位部分依次添加用于在再現(xiàn)時與存儲運動圖像數(shù)據(jù)同步的時刻信息??刂茊卧?1 把帶有時刻信息的右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)發(fā)送給編解碼器18。編解碼器18在從存儲開始直到存儲結(jié)束的時段期間按預(yù)定的壓縮編碼方法對從 數(shù)字處理單元16提供來的存儲運動圖像數(shù)據(jù)進行壓縮和編碼,以生成壓縮圖像數(shù)據(jù)。編解碼器18在從存儲開始直到存儲結(jié)束的時段期間按預(yù)定的壓縮編碼方法對從 控制單元11提供來的右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)進行壓縮和編碼以生成壓縮 右聲音數(shù)據(jù)、壓縮左聲音數(shù)據(jù)和壓縮后聲音數(shù)據(jù)。編解碼器18在生成壓縮圖像數(shù)據(jù)、壓縮右聲音數(shù)據(jù)、壓縮左聲音數(shù)據(jù)和壓縮后 聲音數(shù)據(jù)的同時執(zhí)行時分復(fù)用以生成視頻數(shù)據(jù),并且將所生成的視頻數(shù)據(jù)發(fā)送給控制單元11。如果視頻數(shù)據(jù)被從編解碼器18提供來,那么控制單元11生成頭部數(shù)據(jù),頭部數(shù) 據(jù)中存儲了視頻數(shù)據(jù)的屬性信息(以下也稱為視頻屬性信息)??刂茊卧?1將頭部數(shù)據(jù) 添加到視頻數(shù)據(jù)的頭部以生成視頻文件。實際上,如果視頻數(shù)據(jù)被從編解碼器18提供來,那么此時,控制單元11生成用 于分別標(biāo)識基于視頻數(shù)據(jù)生成的視頻文件的標(biāo)識信息(例如,文件名)。在以下描述中, 用于分別標(biāo)識視頻文件的標(biāo)識信息也被稱為文件標(biāo)識信息??刂茊卧?1利用內(nèi)部定時器計算當(dāng)前日期和時刻??刂茊卧?1檢測存儲開始 時的日期和時刻作為被攝物被拍攝以便存儲的拍攝日期和時刻。在從存儲開始直到存儲結(jié)束的時段期間,控制單元11在通過GPS(全球定位系 統(tǒng))接收器25與用于GPS的衛(wèi)星通信的同時,順次檢測在單位圖像數(shù)據(jù)生成時刻數(shù)字?jǐn)z 像機10的位置。在拍攝存儲時順次檢測的數(shù)字?jǐn)z像機10的位置由緯度和經(jīng)度來表達。在以下描 述中,在拍攝存儲時順次檢測的數(shù)字?jǐn)z像機10的位置也被稱為拍攝位置。在從存儲開始直到存儲結(jié)束的時段期間,控制單元11利用方向傳感器26順次檢 測在單位圖像數(shù)據(jù)生成時刻數(shù)字?jǐn)z像機10的拍攝透鏡13A(即,成像光Ll的入射表面) 的方向。在拍攝存儲時順次檢測的數(shù)字?jǐn)z像機10的拍攝透鏡13A的方向由東、西、南、 北來表達。在以下描述中,在拍攝存儲時順次檢測的數(shù)字?jǐn)z像機10的拍攝透鏡13A的方 向也被稱為拍攝方向。在以下描述中,數(shù)字?jǐn)z像機10的拍攝透鏡13A朝著的那一側(cè)被稱 為相機正面。如果在單位圖像數(shù)據(jù)的生成時刻順次檢測到一組拍攝位置和拍攝方向,那么控制單元11將 該組檢測到的拍攝位置和拍攝方向與添加到在檢測時生成的單位圖像數(shù)據(jù)的 時刻信息相關(guān)聯(lián)。當(dāng)視頻文件被生成時,控制單元11在添加到視頻數(shù)據(jù)的頭部數(shù)據(jù)中存儲作為視 頻屬性信息的文件標(biāo)識信息和表示拍攝日期和時刻的拍攝日期和時刻信息。控制單元11 在頭部數(shù)據(jù)中存儲表示多組拍攝位置和拍攝方向以及相關(guān)聯(lián)的時刻信息的拍攝位置/方 向信息作為視頻屬性信息。如果被攝物被拍攝并且視頻文件被生成,那么控制單元11將所生成的視頻文件 發(fā)送給存儲/再現(xiàn)單元27,并且存儲/再現(xiàn)單元27將視頻文件存儲在存儲介質(zhì)28中。 數(shù)字?jǐn)z像機10拍攝的被攝物的示例包括諸如人物、動物和昆蟲之類的生物、諸如山脈、 河流和海洋這類的自然物、諸如建筑物和展示物之類的人造物,等等。存儲/再現(xiàn)單元27例如是結(jié)合到數(shù)字?jǐn)z像機10中的硬盤驅(qū)動器,并且存儲介質(zhì) 28是設(shè)置在該硬盤驅(qū)動器中的硬盤。同時,如果用戶在拍攝模式中操作模式切換鍵以指示將操作模式切換到再現(xiàn)模 式,那么控制單元11根據(jù)該指示將操作模式從拍攝模式改變到再現(xiàn)模式。如果在再現(xiàn)模式中操作再現(xiàn)鍵以指示再現(xiàn)期望的視頻文件,那么控制單元11通 過存儲/再現(xiàn)單元27從存儲介質(zhì)28中讀取用戶選擇的視頻文件。控制單元11從視頻文 件中加載視頻數(shù)據(jù)并且將所加載的視頻數(shù)據(jù)發(fā)送給編解碼器18。如果視頻數(shù)據(jù)被從控制單元11提供來,那么編解碼器18將視頻數(shù)據(jù)分離成壓縮 圖像數(shù)據(jù)、壓縮右聲音數(shù)據(jù)、壓縮左聲音數(shù)據(jù)和壓縮后聲音數(shù)據(jù),并且對壓縮圖像數(shù)據(jù) 進行解壓縮和解碼以生成原始存儲運動圖像數(shù)據(jù)。編解碼器18對壓縮右聲音數(shù)據(jù)、壓縮左聲音數(shù)據(jù)和壓縮后聲音數(shù)據(jù)進行解壓縮 和解碼以生成原始右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)。編解碼器18將存儲運動圖像 數(shù)據(jù)、右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)發(fā)送給控制單元11。如果存儲運動圖像數(shù)據(jù)、右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)被從編解碼器 18提供來,那么控制單元11將存儲運動圖像數(shù)據(jù)發(fā)送給顯示單元17。控制單元11基于 右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)生成用于立體聲音的右聲道數(shù)據(jù)和左聲道數(shù)據(jù), 并且將右聲道數(shù)據(jù)和左聲道數(shù)據(jù)發(fā)送給聲音處理部件29。從而,控制單元11在顯示單元 17上顯示基于存儲運動圖像數(shù)據(jù)的存儲運動圖像。聲音處理部件29對從控制單元11提供來的右聲道數(shù)據(jù)和左聲道數(shù)據(jù)執(zhí)行預(yù)定的 聲音處理,例如數(shù)模轉(zhuǎn)換處理和放大處理。聲音處理部件29例如向一對立體聲揚聲器30 和31發(fā)送通過聲音處理獲得的用于立體聲音的右聲道信號和左聲道信號。從而,與存儲運動圖像的顯示同步地,控制單元11通過一對揚聲器30和31輸 出基于右聲道信號和左聲道信號的立體聲音。這樣,控制單元11可允許用戶觀看在拍 攝被攝物時生成和存儲的存儲運動圖像,以及在拍攝時存儲的數(shù)字?jǐn)z像機10周圍的聲音 (立體聲音)。[2-2被攝人物確定處理]接下來,將描述被攝人物確定處理,其中,當(dāng)作為被攝物的人物被拍攝并且視 頻文件被存儲在存儲介質(zhì)28中時,基于視頻文件來判定誰作為被攝物被拍攝。例如,如果在被攝物在拍攝模式中被拍攝以便存儲并且視頻文件被存儲在存儲介質(zhì)28中之后用戶操作電源鍵以指示電源關(guān)斷,那么控制單元11每次執(zhí)行被攝人物確定處理。此時,控制單元11根據(jù)預(yù)先存儲在內(nèi)部存儲器中的被攝人物確定程序執(zhí)行各種 處理作為被攝人物確定處理,以實現(xiàn)各種功能。在以下描述中,為了方便,控制單元11 根據(jù)被攝人物確定程序?qū)崿F(xiàn)的各種功能被稱為圖3至5的功能電路塊,并且控制單元11 執(zhí)行的各種處理被稱為將由這些功能電路塊執(zhí)行的處理。如果指示了電源關(guān)斷,那么視頻文件生成單元35把在從指示電源接通直到剛才 指示電源關(guān)斷的一系列操作期間存儲在存儲介質(zhì)28中的一個或多個視頻文件的文件標(biāo)識 信息順次通知給存儲/再現(xiàn)控制單元36。每當(dāng)文件標(biāo)識信息被從視頻文件生成單元35通知來時,存儲/再現(xiàn)控制單元36 就通過存儲/再現(xiàn)單元27從存儲介質(zhì)28中讀取由所通知的文件標(biāo)識信息所標(biāo)識的視頻文 件。存儲/再現(xiàn)控制單元36將該視頻文件發(fā)送給視頻文件生成單元35。 每當(dāng)視頻文件被從存儲/再現(xiàn)控制單元36提供來時,視頻文件生成單元35就從 該視頻文件中加載視頻數(shù)據(jù)并且將所加載的視頻數(shù)據(jù)發(fā)送給編解碼器18。視頻文件生成 單元35還從視頻文件中加載被添加到視頻數(shù)據(jù)的頭部的頭部數(shù)據(jù)。此時,編解碼器18以與再現(xiàn)模式中相同的方式,基于從視頻文件生成單元35提 供來的視頻數(shù)據(jù),生成原始存儲運動圖像數(shù)據(jù)和原始右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音 數(shù)據(jù)。編解碼器18把存儲運動圖像數(shù)據(jù)、右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)發(fā)送給 視頻文件生成單元35。每當(dāng)以這種方式讀取視頻文件時,視頻文件生成單元35就利用編解碼器18來獲 得原始存儲運動圖像數(shù)據(jù)、右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)。每當(dāng)以這種方式獲得存儲運動圖像數(shù)據(jù)、右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù) 據(jù)時,視頻文件生成單元35就將存儲運動圖像數(shù)據(jù)與頭部數(shù)據(jù)中存儲的拍攝位置/方向 信息一起發(fā)送給被攝物檢測單元37。視頻文件生成單元35還將頭部數(shù)據(jù)發(fā)送給人物確定 單元39。如上所述,當(dāng)基于存儲運動圖像數(shù)據(jù)中的存儲運動圖像的人物被檢測到時,視 頻文件生成單元35將存儲運動圖像數(shù)據(jù)與右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)一起發(fā) 送給人物關(guān)系判定單元38。如圖4所示,作為被攝人物確定處理的一部分,被攝物檢測單元37通過分析存 儲運動圖像以檢測被攝物來執(zhí)行被攝物檢測處理。實際上,每當(dāng)存儲運動圖像數(shù)據(jù)被從 視頻文件生成單元35提供來時,被攝物檢測單元37就將存儲運動圖像數(shù)據(jù)加載到特征量 提取單元45中。此時,被攝物檢測單元37還把與存儲運動圖像數(shù)據(jù)一起從視頻文件生 成單元35提供來的拍攝位置/方向信息加載到被攝物推定單元46中。對于構(gòu)成存儲運動圖像數(shù)據(jù)的每條單位圖像數(shù)據(jù),特征量提取單元45執(zhí)行用于 從基于單位圖像數(shù)據(jù)的單位圖像中提取圖像的特征量的特征量提取處理。實際上,特征 量提取單元45存儲表示人物的臉部的大致亮度分布和臉部的大致結(jié)構(gòu)的圖案的臉部信 息。從而,特征量提取單元45基于臉部信息在單位圖像中檢測被假定為是人物的臉部的 一個或多個區(qū)域(以下也稱之為假定區(qū)域)。如果在單位圖像中檢測到一個或多個假定區(qū)域,那么對于每個檢測到的假定區(qū)域,特征量提取單元45生成表示假定區(qū)域在單位圖像中的位置的區(qū)域位置信息。對于單 位圖像的每個假定區(qū)域,特征量提取單元45從假定區(qū)域中提取例如多個輪廓的形狀、多 個輪廓之間的位置關(guān)系以及顏色,作為圖像的特征量。在以下描述中,從單位圖像的每 個假定區(qū)域中提取的圖像的特征量被具體稱為假定區(qū)域特征量。如果以這種方式從單位圖像的一個或多個假定區(qū)域中提取了假定區(qū)域特征量, 那么對于每個假定區(qū)域,特征量提取單元45通過把從假定區(qū)域中提取的假定區(qū)域特征量 與表示假定區(qū)域的位置的區(qū)域位置信息相關(guān)聯(lián)來生成假定區(qū)域信息。如果檢測到一個或多個假定區(qū)域,那么特征量提取單元45從單位圖像的除一個 或多個假定區(qū)域以外的部分中提取例如多個輪廓的形狀、多個輪廓之間的位置關(guān)系以及 顏色,作為圖像的特征量。在以下描述中,單位圖像中除一個或多個假定區(qū)域以外的部 分也被稱為假定區(qū)域外部分。如果在單位圖像中沒有檢測到任何假定區(qū)域,那么特征量提取單元45從整個單 位圖像中檢測例如多個輪廓的形狀、多個輪廓之間的位置關(guān)系以及顏色,作為圖像的特 征量。在以下描述中,從單位圖像的假定區(qū)域外部分提取的圖像的特征量和從整個單位 圖像提取的圖像的特征量被具體統(tǒng)稱為區(qū)域外特征量。特征量提取單元45例如將單位圖像中的每個像素與周圍像素順次比較以檢索出 相同顏色的一系列像素。如果在單位圖像中檢測到相同顏色的一系列像素,那么特征量 提取單元45例如通過字符識別方法來檢測一系列像素是否是字符串。

結(jié)果,如果檢測到單位圖像中的一個或多個字符串,那么特征量提取單元45提 取這些字符串作為文本。即,特征量提取單元45從單位圖像中提取在單位圖像中的標(biāo) 牌、橫幅或姓名標(biāo)簽上繪出的一個或多個字符串來作為文本。如果從單位圖像中提取出一個或多個字符串,那么對于每個提取出的字符串, 特征量提取單元45通過將每個字符串(即,文本)與表示字符串在單位圖像中的提取位 置的提取位置信息相關(guān)聯(lián)來生成字符串提取信息。這樣,如果從單位圖像中提取出區(qū)域外特征量或假定區(qū)域特征量和字符串,那 么特征量提取單元45把區(qū)域外特征量或假定區(qū)域特征量和字符串提取信息與對應(yīng)于用于 提取的單位圖像的時刻信息一起發(fā)送給被攝物推定單元46。被攝物檢測單元37預(yù)先存儲地圖數(shù)據(jù)庫47和臉部特征數(shù)據(jù)庫48,用于推定存儲 運動圖像中的被攝物。被攝物檢測單元37還預(yù)先存儲名稱數(shù)據(jù)庫49,用于以字符串的形 式檢測存儲運動圖像中的事件的名稱(以下也稱為事件名稱)或人物的姓名。地圖數(shù)據(jù)庫47預(yù)先登記例如表示除人物以外的拍攝對象(比如國外或國內(nèi)的建 筑物、展示物、風(fēng)景等等)的所在地(由緯度和經(jīng)度表示的位置)的所在地信息。地圖 數(shù)據(jù)庫47還把表示拍攝對象的所在地的地名的地名信息以字符串(例如,文本)的形式 與表示拍攝對象的所在地的所在地信息相關(guān)聯(lián)地登記。地圖數(shù)據(jù)庫47還把表示拍攝對象的名稱(以下也稱為拍攝對象名稱)的拍攝對 象名稱信息以字符串(例如,文本)的形式與表示拍攝對象的所在地的所在地信息相關(guān)聯(lián) 地登記。地圖數(shù)據(jù)庫47還把基于拍攝對象的圖像生成的拍攝對象特征量(形狀或圖案、 其間的位置關(guān)系、顏色等等)與表示拍攝對象的所在地的所在地信息相關(guān)聯(lián)地登記。拍攝對象特征量例如是通過基于從拍攝對象的多個圖像中提取的圖像的特征量進行學(xué)習(xí)而 生成的。臉部特征數(shù)據(jù)庫48預(yù)先登記用于檢測存儲運動圖像中的男性或女性的臉部的多 類特征量(以下也稱為臉部檢測特征量)。臉部檢測特征量包括關(guān)于臉部的形狀、眼睛、 鼻子、嘴巴、眉毛等等的信息、其間的位置關(guān)系等等。用于檢測男性的臉部的臉部檢測特征量例如是通過基于從按年齡的多個男性的 臉部的圖像中提取的圖像的特征量進行學(xué)習(xí)來生成的。用于檢測女性的臉部的臉部檢測 特征量例如是通過基于從按年齡的多個女性的臉部的圖像中提取的圖像的特征量進行學(xué) 習(xí)來生成的。名稱數(shù)據(jù)庫49預(yù)先以字符串(即,文本)的形式登記諸如開學(xué)典禮、畢業(yè)典 禮、運動會、表演會之類的各種事件的事件名稱以及表示多個人物的姓名的多種名稱信 息。如果區(qū)域外特征量與時刻信息一起被從特征量提取單元45提供來,那么被攝物 推定單元46從拍攝位置/方向信息所表示的多組拍攝位置和拍攝方向中選擇與該時刻信 息相關(guān)聯(lián)的一組拍攝位置和拍攝方向。被攝物推定單元46通過利用所選擇的那組拍攝位置和拍攝方向來設(shè)定用于搜索 能夠被該組拍攝位置和拍攝方向拍攝到的拍攝對象的搜索范圍。此時,被攝物推定單元 46例如將一扇形范圍定義為搜索范圍,該扇形范圍以拍攝位置作為中心點,按照預(yù)定的 半徑和預(yù)定的中心角在拍攝方向上逐漸變寬。被攝物推定單元46將搜索范圍與地圖數(shù)據(jù)庫47中的所在地信息相比較,并且判 定是否存在能夠被此時選擇的那組拍攝位置和拍攝方向拍攝的拍攝對象。結(jié)果,如果在地圖數(shù)據(jù)庫47中檢測到表示搜索范圍中的所在地的所在地信息, 那么被攝物推定單元46判定存在能夠被用于設(shè)定的搜索范圍的那組拍攝位置和拍攝方向 拍攝的拍攝對象。換言之,當(dāng)基于搜索范圍檢測到所在地信息時,被攝物推定單元46判定拍攝對 象有可能被拍攝并且拍攝對象有可能作為被攝物在單位圖像中。如果存在能夠被該組拍攝位置和拍攝方向拍攝的拍攝對象,那么被攝物推定單 元46從地圖數(shù)據(jù)庫47中讀取與檢測到的所在地信息相關(guān)聯(lián)的拍攝對象特征量。被攝物推定單元46基于區(qū)域外特征量和拍攝對象特征量執(zhí)行預(yù)定的運算處理。 從而,被攝物推定單元46計算準(zhǔn)確度,該準(zhǔn)確度表示整個單位圖像中或者假定區(qū)域外部 分中的被攝物有多大可能作為由拍攝對象特征量表示的拍攝對象。被攝物推定單元46將計算出的準(zhǔn)確度與預(yù)先選擇的第一閾值相比較。結(jié)果,如 果準(zhǔn)確度等于或大于第一閾值,那么被攝物推定單元46推定整個單位圖像或假定區(qū)域外 部分中的被攝物是由拍攝對象特征量表示的拍攝對象。即,被攝物推定單元46檢測到整 個單位圖像或假定區(qū)域外部分中作為被攝物的拍攝對象。相反,如果準(zhǔn)確度小于第一閾值,那么被攝物推定單元46判定整個單位圖像或 假定區(qū)域外部分中的被攝物不是拍攝對象特征量表示的拍攝對象。如果拍攝對象例如是諸如大樓或橋梁之類的建筑物,那么繪出拍攝對象名稱的 標(biāo)牌或板子可能被附著到該拍攝對象。如果拍攝對象例如是可被認為是旅游名勝的風(fēng)景,那么繪出拍攝對象名稱的標(biāo)牌或板子可能被設(shè)置在能夠看到拍攝對象的地方。從而,如果此時一種或多種字符串提取信息與區(qū)域外特征量和時刻信息一起被 從特征量提取單元45提供來,那么被攝物推定單元46通過字符匹配方法將字符串提取信 息所表示的字 符串與拍攝對象名稱信息所表示的拍攝對象名稱相比較。結(jié)果,如果字符串提取信息所表示的字符串與拍攝對象名稱信息所表示的拍攝 對象名稱一致,那么被攝物推定單元46同樣判定整個單位圖像或假定區(qū)域外部分中的被 攝物是由拍攝對象特征量表示的拍攝對象。S卩,如果拍攝對象名稱在單位圖像中,那么拍攝對象也與拍攝對象名稱一起出 現(xiàn),但是拍攝對象可能在另一被攝物(例如,人物)的陰影下并且可能幾乎看不到。因此,即使當(dāng)判定在單位圖像中沒有拍攝對象時,如果檢測到表示拍攝對象的 拍攝對象名稱在單位圖像中,那么被攝物推定單元46也同樣推定單位圖像中的被攝物是 拍攝對象。即,被攝物推定單元46檢測整個單位圖像或假定區(qū)域外部分中作為被攝物的 拍攝對象。如果以這種方式檢測到單位圖像中的拍攝對象,那么被攝物推定單元46從地圖 數(shù)據(jù)庫47中讀取與此時檢測到的所在地信息相對應(yīng)的拍攝對象名稱信息和地名信息,并 且將拍攝對象名稱信息和地名信息與單位圖像的時刻信息關(guān)聯(lián)起來。如果字符串提取信息所表示的任何字符串都不與拍攝對象名稱信息所表示的拍 攝對象名稱一致,那么被攝物推定單元46同樣判定整個單位圖像或假定區(qū)域外部分中的 被攝物不是由拍攝對象特征量表示的拍攝對象。同時,如果在地圖數(shù)據(jù)庫47中無法檢測到表示搜索范圍中的所在地的所在地信 息,那么被攝物推定單元46判定不存在能夠被用于設(shè)定搜索范圍的那組拍攝位置和拍攝 方向所拍攝的拍攝對象。換言之,當(dāng)基于搜索范圍無法檢測到所在地信息時,被攝物推定單元46判定拍 攝對象作為被攝物在單位圖像中,因為拍攝對象未被拍攝。如果不存在能夠被該組拍攝位置和拍攝方向拍攝的拍攝對象,被攝物推定單元 46則不從地圖數(shù)據(jù)庫47中讀取拍攝對象特征量。從而,即使當(dāng)此時區(qū)域外特征量與時刻 信息一起被從特征量提取單元45提供來時,被攝物推定單元46也不執(zhí)行用于在整個單位 圖像或假定區(qū)域外部分中檢測被攝物的處理。如果區(qū)域外特征量以這種方式與時刻信息一起被從特征量提取單元45提供來, 那么被攝物推定單元46每次以相同方式執(zhí)行處理以適當(dāng)?shù)貦z測整個單位圖像或假定區(qū)域 外部分中作為被攝物的拍攝對象。如果一種或多種假定區(qū)域信息與時刻信息被從特征量提取單元45提供來,那么 被攝物推定單元46從臉部特征數(shù)據(jù)庫48中讀取多類臉部檢測特征量。被攝物推定單元 46通過依次使用多類臉部檢測特征量,基于臉部檢測特征量和由假定區(qū)域信息表示的假 定區(qū)域特征量,來執(zhí)行運算處理。從而,對于單位圖像的每個假定區(qū)域,被攝物推定單元46計算表示該假定區(qū)域 中的被攝物有多大可能是按年齡的男性或女性的臉部的多個準(zhǔn)確度。被攝物推定單元46 把為每個假定區(qū)域計算的多個準(zhǔn)確度與預(yù)先選擇的第二閾值相比較。結(jié)果,如果為單位圖像中的任何假定區(qū)域計算的多個準(zhǔn)確度中的至少一個等于或大于第二閾值,那么被攝物推 定單元46推定單位圖像中的該假定區(qū)域中的被攝物是人 物的臉部。此時,如果多個準(zhǔn)確度中只有一個等于或大于第二閾值,那么被攝物推定單元 46根據(jù)在計算準(zhǔn)確度時使用的臉部檢測特征量的類型,將被攝物推定為一定年齡的男性 或女性的人物,例如二十來歲的男性的臉部或者四十來歲的女性的臉部。如果多個準(zhǔn)確度中的兩個或更多個準(zhǔn)確度等于或大于第二閾值,那么被攝物推 定單元46從等于或大于第二閾值的準(zhǔn)確度中選擇最大準(zhǔn)確度。被攝物推定單元46以相 同的方式根據(jù)在計算該最大準(zhǔn)確度時使用的臉部檢測特征量的類型將被攝物推定為一定 年齡的男性或女性的臉部。S卩,被攝物推定單元46檢測單位圖像的假定區(qū)域中的人物的臉部,從而在確定 年齡和性別的同時檢測單位圖像中的人物。如果檢測到單位圖像的假定區(qū)域中的人物的 臉部,那么被攝物推定單元46把表示由該檢測所確定的人物的年齡和性別的年齡/性別 信息與此時從特征量提取單元45提供來的時刻信息關(guān)聯(lián)起來。如果檢測到單位圖像的假定區(qū)域中的人物的臉部,那么被攝物推定單元46把從 假定區(qū)域中提取的假定區(qū)域特征量作為人物的臉部的特征量與此時從特征量提取單元45 提供來的時刻信息關(guān)聯(lián)起來。在以下描述中,人物的臉部的特征量也被稱為人物臉部特征量。如果為單位圖像的任何假定區(qū)域計算的多個準(zhǔn)確度全都小于第二閾值,那么被 攝物推定單元46判定單位圖像的假定區(qū)域中的被攝物不是人物的臉部。S卩,被攝物推定 單元46判定在單位圖像中不存在人物。如果判定單位圖像的任何假定區(qū)域中的被攝物都不是人物的臉部,那么被攝物 推定單元46丟棄從假定區(qū)域中提取的假定區(qū)域特征量,而不設(shè)定為人物臉部特征量。如果一種或多種假定區(qū)域信息以這種方式與時刻信息一起被從特征量提取單元 45提供來,那么被攝物推定單元46每次以相同的方式執(zhí)行處理以適當(dāng)?shù)貦z測單位圖像的 假定區(qū)域中的人物的臉部,從而檢測單位圖像中的人物。如果一種或多種字符串提取信息與時刻信息一起被從特征量提取單元45提供 來,那么被攝物推定單元46從名稱數(shù)據(jù)庫49中讀取名稱信息。被攝物推定單元46通過 字符匹配方法把字符串提取信息所表示的字符串與名稱信息所表示的事件名稱或人物姓 名相比較。從而,被攝物推定單元46檢測單位圖像中的一個或多個字符串是否是事件名稱 或人物姓名。即,當(dāng)繪出事件名稱的橫幅或標(biāo)牌在單位圖像中時,或者寫有孩童或成人 的姓名的姓名標(biāo)簽在單位圖像中時,被攝物推定單元46可以檢測事件名稱或人物姓名。如果一種或多種字符串提取信息以這種方式與時刻信息一起從特征量提取單元 45提供來,那么被攝物推定單元46每次以相同方式執(zhí)行處理以適當(dāng)?shù)貦z測單位圖像中的 事件名稱或人物姓名。如果檢測到存儲運動圖像中作為被攝物的拍攝對象,那么被攝物推定單元46基 于與單位圖像的時刻信息相關(guān)聯(lián)的拍攝對象名稱信息和地名信息生成表示檢測到的拍攝 對象的拍攝對象檢測信息。此時,被攝物推定單元46在拍攝對象檢測信息中存儲與檢測到的拍攝對象相對應(yīng)的拍攝對象名稱信息和地名信息。被攝物推定單元46還在拍攝對象檢測信息中存儲 存在時段信息,該存在時段信息利用存在時段開頭處的單位圖像的時刻信息和存在時段 的結(jié)尾處的單位圖像的時刻信息來表示拍攝對象在存儲運動圖像中的一個或多個存在時 段。如果基于人物的臉部檢測到存儲運動圖像中作為被攝物的一個或多個人物,那 么被攝物推定單元46順次比較與單位圖像的時刻信息相關(guān)聯(lián)的人物臉部特征量,并且針 對每個人物對人物臉部特征量分類。被攝物推定單元46基于分類結(jié)果檢測具有同一人物的臉部的單位圖像。被攝物 推定單元46針對在人物臉部特征量被分類的情況下的每個人物,生成表示基于臉部檢測 到的人物的臉部檢測信息。此時,被攝物推定單元46在臉部檢測信息中存儲表示人物的臉部的人物臉部特 征量和表示人物的年齡和性別的年齡/性別信息作為表示人物的信息。被攝物推定單元 46在臉部檢測信息中存儲表示在存在時段開頭處在單位圖像中提取出人物臉部特征量的 假定區(qū)域中的位置的假定位置信息。被攝物推定單元46在臉部檢測信息中存儲存在時段信息,該存在時段信息利用 存在時段 開頭處的單位圖像的時刻信息和存在時段的結(jié)尾處的單位圖像的時刻信息來表 示人物的臉部在存儲運動圖像中的一個或多個存在時段。如果檢測到在存儲運動圖像中有事件名稱的字符串,那么對于每個事件名稱, 被攝物推定單元46生成表示檢測到的事件名稱的事件名稱檢測信息。此時,被攝物推定 單元46將表示事件名稱的事件名稱信息以字符串的形式存儲在事件名稱檢測信息中。被攝物推定單元46還在事件名稱檢測信息中存儲存在時段信息,該存在時段信 息利用存在時段開頭處的單位圖像的時刻信息和存在時段的結(jié)尾處的單位圖像的時刻信 息來表示事件名稱在存儲運動圖像中的一個或多個存在時段。如果檢測到在存儲運動圖像中有人物姓名的字符串,那么對于每個人物姓名, 被攝物推定單元46生成表示檢測到的人物姓名的姓名檢測信息。此時,被攝物推定單元46在姓名檢測信息中存儲表示人物姓名的字符串和表示 在具有該人物姓名一個或多個存在時段中在多個單位圖像中的每一個中該字符串的提取 位置的提取位置信息。被攝物推定單元46還在姓名檢測信息中存儲存在時段信息,該存在時段信息利 用存在時段開頭處的單位圖像的時刻信息和存在時段的結(jié)尾處的單位圖像的時刻信息來 表示人物姓名在存儲運動圖像中的一個或多個存在時段。如果檢測到存儲運動圖像中的拍攝對象,那么被攝物推定單元46將這樣生成的 拍攝對象檢測信息(或事件名稱檢測信息)發(fā)送給人物確定單元39。如果檢測到存儲運動圖像中的人物,那么被攝物推定單元46將這樣生成的臉部 檢測信息或者姓名檢測信息和事件名稱檢測信息發(fā)送給人物關(guān)系判定單元38。這樣,每當(dāng)存儲運動圖像數(shù)據(jù)被從視頻文件生成單元35提供來時,37就獲得拍 攝對象檢測信息、臉部檢測信息或者姓名檢測信息,并且將獲得的信息發(fā)送給人物確定 單元39或人物關(guān)系判定單元38。如果以這種方式生成了拍攝對象檢測信息或臉部檢測信息、事件名稱檢測信息和姓名檢測信息,那么被攝物推定單元46將這樣生成的拍攝對象檢測信息或事件名稱檢測信息發(fā)送給人物確定單元39。此時,被攝物推定單元46將臉部檢測信息或姓名檢測信 息發(fā)送給人物關(guān)系判定單元38。這樣,每當(dāng)存儲運動圖像數(shù)據(jù)被從視頻文件生成單元35提供來時,被攝物檢測 單元37就獲得拍攝對象檢測信息或事件名稱檢測信息以及臉部檢測信息或姓名檢測信 息,并將所獲得的信息發(fā)送給人物確定單元39或人物關(guān)系判定單元38。如圖5所示,如果被攝物檢測單元37檢測到存儲運動圖像中的一個或多個人 物,那么人物關(guān)系判定單元38基于被攝人物的發(fā)聲和動作,來執(zhí)行作為被攝人物確定處 理的一部分的用于判定人物之間的關(guān)系的人物關(guān)系判定處理。在此情況下,人物關(guān)系判定單元38還把從被攝物推定單元46提供來的姓名檢測 信息加載到發(fā)聲分析單元55中。人物關(guān)系判定單元38向視頻文件生成單元35請示右聲 音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù),并且作為結(jié)果,把從視頻文件生成單元35提供來的 右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)加載到發(fā)聲分析單元55中。人物關(guān)系判定單元38還把從被攝物推定單元46提供來的臉部檢測信息加載到動 作分析單元56中。人物關(guān)系判定單元38向視頻文件生成單元35請求存儲運動圖像數(shù) 據(jù),并且作為結(jié)果,把從視頻文件生成單元35提供來的存儲運動圖像數(shù)據(jù)加載到動作分 析單元56中。人物關(guān)系判定單元38還預(yù)先存儲姓名數(shù)據(jù)庫57,該姓名數(shù)據(jù)庫57用于根據(jù)拍攝 存儲期間的發(fā)聲來推定作為被攝物被拍攝的人物的姓名。人物關(guān)系判定單元38預(yù)先存儲 昵稱數(shù)據(jù)庫58,該昵稱數(shù)據(jù)庫58用于根據(jù)拍攝存儲期間的發(fā)聲來推定作為被攝物被拍攝 的人物的昵稱。人物關(guān)系判定單元38還預(yù)先存儲語言數(shù)據(jù)庫59,該語言數(shù)據(jù)庫59用于根據(jù)拍攝 存儲期間的發(fā)聲來檢測作為被攝物被拍攝的人物所說的語言(標(biāo)準(zhǔn)語言或方言)。人物關(guān)系判定單元38還預(yù)先存儲數(shù)據(jù)庫60,該數(shù)據(jù)庫60登記用于根據(jù)拍攝存儲 期間的發(fā)聲來推定作為被攝物被拍攝的多個人物之間的關(guān)系的語句。在以下描述中,用于推定存儲運動圖像中的多個人物之間的關(guān)系(例如家人或 親戚、朋友或情侶)的語句也被稱為關(guān)系推定語句。在以下描述中,登記關(guān)系推定語句 的數(shù)據(jù)庫60也被稱為關(guān)系推定語句數(shù)據(jù)庫60。人物關(guān)系判定單元38還預(yù)先存儲數(shù)據(jù)庫61,該數(shù)據(jù)庫61登記用于根據(jù)拍攝存儲 期間的發(fā)聲推定作為被攝物被拍攝的人物的動作的語句。在以下描述中,用于推定動作的語句也被稱為動作推定語句。在以下描述中, 登記動作推定語句的數(shù)據(jù)庫61也被稱為動作推定語句數(shù)據(jù)庫61。人物關(guān)系判定單元38預(yù)先存儲親密度數(shù)據(jù)庫62,該親密度數(shù)據(jù)庫62用于根據(jù)拍 攝存儲期間的發(fā)聲來判定作為被攝物被拍攝的多個人物之間的親密度。人物關(guān)系判定單元38還預(yù)先存儲動作數(shù)據(jù)庫63,該動作數(shù)據(jù)庫63用于推定拍 攝存儲期間作為被攝物被拍攝的人物的各種動作,例如“擁抱”、“肩背”、“交叉手 臂”、“點頭”、“舉手”。人物關(guān)系判定單元38還預(yù)先存儲關(guān)系判定數(shù)據(jù)庫64,該關(guān)系判定數(shù)據(jù)庫64用于 利用拍攝存儲期間作為被攝物被拍攝的多個人物中的至少一個人物的動作來判定多個人物之間的關(guān)系。姓名數(shù)據(jù)庫57預(yù)先登記多種姓名信息,其中利用字符串(即,文本)表示多個 人物姓名。姓名數(shù)據(jù)庫57還登記接尾詞信息,其中利用字符串(即,文本)表示了在稱 呼人物的姓名時附加的接 尾詞,例如“KUN”、“SAN”禾Π “CHAN”。昵稱數(shù)據(jù)庫58預(yù)先登記多種昵稱信息,其中利用字符串(即,文本)表示了多 個人物昵稱。語言數(shù)據(jù)庫59預(yù)先登記多種方言信息和標(biāo)準(zhǔn)語言信息,在方言信息中利用 字符串(即,文本)表示了各種語句的方言單詞,例如固有名稱或語氣,而在標(biāo)準(zhǔn)語言信 息中利用標(biāo)準(zhǔn)語言的字符串(即,文本)表示了各種語句的標(biāo)準(zhǔn)語言單詞,例如固有名稱 或語氣。關(guān)系推定語句數(shù)據(jù)庫60預(yù)先登記多種關(guān)系推定語句信息,其中利用字符串 (即,文本)表示了作為關(guān)系推定語句的另一方的稱呼,例如“媽媽”、“母親”、“爸 爸”、“奶奶”和“兄弟”。動作推定語句數(shù)據(jù)庫61預(yù)先登記多種動作推定語句信息,其中利用字符串 (即,文本)表示了作為動作推定語句的語句,例如“擁抱”、“肩背”和“騎在肩 上”。如圖6所示,親密度數(shù)據(jù)庫62預(yù)先登記表示用于根據(jù)交談來判定一個人有多喜 愛另一方的多種說話方式的項目CO,其中類別CA包括“語言”、“姓名的敬稱”、
“語氣”、“人物關(guān)系”等等。在以下描述中,登記在親密度數(shù)據(jù)庫62中的表示說話方式的項目CO也被稱為 友好判定項目CO。友好判定項目CO所表示的說話方式指示出在交談期間一個人使用了 何種語言(方言或標(biāo)準(zhǔn)語言),以及在交談期間一個人如何稱呼另一方的姓名(昵稱或沒 有敬稱)。由友好判定項目CO表示的說話方式還指示出在交談期間一個人使用了何種語 言,以及一個人如何稱呼另一人。親密度數(shù)據(jù)庫62將每個友好判定項目CO與評估值VA 相關(guān)聯(lián)地登記,評估值VA數(shù)值地表示出按照由友好判定項目CO表示的說話方式的友好 程度。動作數(shù)據(jù)庫63預(yù)先登記用于推定諸如“擁抱”和“肩背”之類的各種動作的 多個動作推定數(shù)據(jù)。動作推定數(shù)據(jù)是針對每種動作生成的,并且存儲了表示動作的名稱 的動作名稱信息和充當(dāng)用于動作推定的比較標(biāo)準(zhǔn)的動作模型。如圖7所示,關(guān)系判定數(shù)據(jù)庫64預(yù)先登記了表示人物的各種動作的名稱的動作 名稱信息M0,例如“擁抱”、“肩背”、“牽手”和“相互交臂”。關(guān)系判定數(shù)據(jù)庫64預(yù)先將關(guān)系信息RE與表示動作的名稱的動作名稱信息MO相 關(guān)聯(lián)地登記,登記關(guān)系信息RE表示一個或多個關(guān)系,例如“親子”、“朋友”和“情 侶”。如果右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)被從視頻文件生成單元35提供來, 那么發(fā)聲分析單元55基于右聲音數(shù)據(jù)、左聲音數(shù)據(jù)和后聲音數(shù)據(jù)執(zhí)行用于分析每個人物 的發(fā)聲的發(fā)聲分析/關(guān)系推定處理,以推定人物之間的關(guān)系。在此情況下,如圖8所示,發(fā)聲分析單元55例如基于聲音強度來檢測右聲音數(shù) 據(jù)D1、左聲音數(shù)據(jù)D2和后聲音數(shù)據(jù)D3的每一個中的聲音時段和靜默時段之間的切換位置作為時刻信息(圖8中的(A))。

發(fā)聲分析單元55基于檢測到的切換位置從右聲音數(shù)據(jù)D1、左聲音數(shù)據(jù)D2和后 聲音數(shù)據(jù)D3中提取一個或多個聲音時段作為右聲音時段數(shù)據(jù)D4、左聲音時段數(shù)據(jù)D5和 后聲音時段數(shù)據(jù)D6 (圖8中的(B))。發(fā)聲分析單元55在適當(dāng)?shù)乜刂葡辔坏耐瑫r例如通過波束成形方法來對右聲音時 段數(shù)據(jù)D4、左聲音時段數(shù)據(jù)D5和后聲音時段數(shù)據(jù)D6執(zhí)行加法處理。從而,發(fā)聲分析單元55通過適當(dāng)?shù)胤糯笤谂臄z存儲時在數(shù)字?jǐn)z像機10周圍的各 種位置處發(fā)出的聲音來生成一個或多個相加聲音數(shù)據(jù)D7(圖8中的(C))。發(fā)聲分析單元55將作為相加聲音數(shù)據(jù)D7的源的右聲音時段數(shù)據(jù)D4、左聲音時 段數(shù)據(jù)D5和后聲音時段數(shù)據(jù)D6中從頭到尾的多種時刻信息依次添加到相加聲音數(shù)據(jù)D7 中從頭到尾的各個預(yù)定的單位部分。發(fā)聲分析單元55基于右聲音時段數(shù)據(jù)D4、左聲音時段數(shù)據(jù)D5和后聲音時段數(shù) 據(jù)D6的加法處理期間相位控制的存在與否和控制量來檢測基于相加聲音數(shù)據(jù)D7發(fā)出聲 音的人所在的方向。實際上,如果右聲音時段數(shù)據(jù)D4和左聲音時段數(shù)據(jù)D5的相位在加法處理期間 未被控制,并且后聲音時段數(shù)據(jù)D6的相位提前,那么發(fā)聲分析單元55檢測到基于相加聲 音數(shù)據(jù)D7發(fā)出聲音的人基本上處在相機正面的中央。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是在相機正面 中央被拍攝的人物。如果在加法處理期間右聲音時段數(shù)據(jù)D4的相位提前并且后聲音時段數(shù)據(jù)D6的 相位更提前,那么發(fā)聲分析單元55檢測到基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物處在相機 正面中央的左側(cè)。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是在相機正面 中央的左側(cè)被拍攝的人物。如果在加法處理期間左聲音時段數(shù)據(jù)D5的相位提前并且后聲音時段數(shù)據(jù)D6的 相位更提前,那么發(fā)聲分析單元55檢測到基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物處在相機 正面中央的右側(cè)。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是在相機正面 中央的右側(cè)被拍攝的人物。如果在加法處理期間右聲音時段數(shù)據(jù)D4和左聲音時段數(shù)據(jù)D5的相位提前基本 相同的量,那么發(fā)聲分析單元55檢測到基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物處在數(shù)字?jǐn)z 像機10的背面的中央。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是使用數(shù)字?jǐn)z 像機10的攝影師(攝影者)。如果在加法處理期間左聲音時段數(shù)據(jù)D5的相位提前并且右聲音時段數(shù)據(jù)D4的 相位更提前要,那么發(fā)聲分析單元55檢測到基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物處在數(shù) 字?jǐn)z像機10的左側(cè)。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是在數(shù)字?jǐn)z像 機10的左側(cè)未被拍攝的人物。
如果在加法處理期間右聲音時段數(shù)據(jù)D4的相位提前并且左聲音時段數(shù)據(jù)D5的 相位更提前要,那么發(fā)聲分析單元55檢測到基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物處在數(shù) 字?jǐn)z像機10的右側(cè)。此時,發(fā)聲分析單元55推定基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物是在數(shù)字?jǐn)z像 機10的右側(cè)未被拍攝的人物。如果以這種方式檢測了基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物所在的方向,那么
發(fā)聲分析單元55基于方向的檢測結(jié)果來檢測基于相加聲音數(shù)據(jù)D7發(fā)出聲音的人物的數(shù) 目。當(dāng)兩個或更多個人物基于相加聲音數(shù)據(jù)D7發(fā)出聲音時,發(fā)聲分析單元55基于方 向的檢測結(jié)果進一步檢測相加聲音數(shù)據(jù)D7中各個人物發(fā)出的聲音時段的切換位置作為時 刻信息(圖8中的(D))。這樣,發(fā)聲分析單元55例如檢測為了自我介紹而單獨被拍攝的人物所發(fā)出的聲 音的相加聲音數(shù)據(jù)D7。發(fā)聲分析單元55檢測一起被拍攝的多個人物之間的交談期間的 聲音的相加聲音數(shù)據(jù)D7。發(fā)聲分析單元55還檢測被拍攝的人物和未被拍攝的作為旁觀者或攝影師的人物 之間的交談期間的聲音的相加聲音數(shù)據(jù)D7。這樣,對于此時生成的一個或多個相加聲音 數(shù)據(jù)D7,發(fā)聲分析單元55基于發(fā)出聲音的人所在的方向的檢測結(jié)果,來檢測發(fā)出構(gòu)成相 加聲音數(shù)據(jù)D7的聲音的狀況。在以下描述中,被拍攝的人物也被適當(dāng)?shù)胤Q為被攝人物。在以下描述中,像攝 影師或旁觀者那樣,發(fā)出被作為相加聲音數(shù)據(jù)D7存儲的聲音但未被拍攝的人物也被適當(dāng) 地稱為拍攝排除人物。此時,例如,如果檢測到為了自我介紹而由單個人獨自發(fā)出的聲音的相加聲音 數(shù)據(jù)D7,那么發(fā)聲分析單元55將相加聲音數(shù)據(jù)D7定義為表示人物的發(fā)聲的內(nèi)容的發(fā)聲 數(shù)據(jù)(以下具體稱為單獨發(fā)聲數(shù)據(jù))。此時,如果檢測到多個人物發(fā)出的交談的聲音的相加聲音數(shù)據(jù)D7,那么發(fā)聲分 析單元55基于切換位置將相加聲音數(shù)據(jù)D7提取到各個人物的聲音時段中,以生成表示各 個人物的發(fā)聲的內(nèi)容的發(fā)聲數(shù)據(jù)D8和D9(圖8中的(E))。S卩,發(fā)聲分析單元55基于多個人物之間的交談的相加聲音數(shù)據(jù)D7,針對各個人 物,生成其中布置了交談期間接連著的聲音時段的發(fā)聲數(shù)據(jù)D8和D9。在以下描述中, 兩個或更多個人物發(fā)出的聲音(即,交談)的相加聲音數(shù)據(jù)D7的聲音時段被具體稱為交 談時段。在以下描述中,從交談的相加聲音數(shù)據(jù)D7中提取出的各個人物的聲音時段被具 體稱為交談中發(fā)聲時段。在以下描述中,以這種方式基于多個人物之間的交談生成的各 個人物的發(fā)聲數(shù)據(jù)D8和D9被具體稱為交談中數(shù)據(jù)D8和D9。這樣,發(fā)聲分析單元55基于為了自我介紹由每個人單獨發(fā)出的聲音的相加聲音 數(shù)據(jù)D7或者多個人物之間的交談的相加聲音數(shù)據(jù)D7來獲得每個人的單獨發(fā)聲數(shù)據(jù)或者 交談中發(fā)聲數(shù)據(jù)D8和D9。如果獲得了每個人物的單獨發(fā)聲數(shù)據(jù),那么發(fā)聲分析單元55針對帶有時刻信息 的每個預(yù)定單位順次分析單獨發(fā)聲數(shù)據(jù)。從而,發(fā)聲分析單元55通過對基于單獨發(fā)聲數(shù)據(jù)的聲音進行錄音打字來生成字符串(即,文本)。如果獲得了各個人物的交談中發(fā)聲數(shù)據(jù)D8和D9,那么發(fā)聲分析單元55針對帶有時刻信息的每個預(yù)定單位順次分析交談中發(fā)聲數(shù)據(jù)D8和D9的各個交談中發(fā)聲時段。 從而,發(fā)聲分析單元55還針對每個交談中發(fā)聲時段,通過對基于交談中發(fā)聲數(shù)據(jù)D8和 D9的聲音進行錄音打字來生成字符串(即,文本)。在以下描述中,基于單獨發(fā)聲數(shù)據(jù)的聲音的字符串也被稱為單獨發(fā)聲文本。在 以下描述中,基于交談中發(fā)聲數(shù)據(jù)D8和D9的聲音的所有字符串也被稱為交談中發(fā)聲文 本,并且針對每個交談中發(fā)聲時段的交談中發(fā)聲數(shù)據(jù)D8和D9的聲音的字符串也被稱為 時段發(fā)聲文本。當(dāng)生成人物的單獨發(fā)聲文本時,發(fā)聲分析單元55將先前檢測到的表示該人物所 在的方向的人物方向信息添加到所生成的單獨發(fā)聲文本。發(fā)聲分析單元55向單獨發(fā)聲文本中與單獨發(fā)聲數(shù)據(jù)的帶有時刻信息的預(yù)定單位 相對應(yīng)的單位對應(yīng)部分(即,從單獨發(fā)聲數(shù)據(jù)的預(yù)定單位中對聲音進行錄音打字的部分) 順次添加被添加到該預(yù)定單位的時刻信息。當(dāng)生成人物的交談中發(fā)聲文本時,發(fā)聲分析單元55將先前檢測到的表示該人物 所在的方向的人物方向信息添加到所生成的交談中發(fā)聲文本。發(fā)聲分析單元55還將利用交談時段的開頭和結(jié)尾處的時刻信息表示原始相加聲 音數(shù)據(jù)D7的交談時段的交談時段信息添加到每個人物的交談中發(fā)聲文本。發(fā)聲分析單元55還以相同方式向交談中發(fā)聲文本中交談中發(fā)聲數(shù)據(jù)D8和D9的 帶有時刻信息的單位對應(yīng)部分(即,從預(yù)定單位中對聲音進行錄音打字的部分)順次添加 時刻信息。此時,對于交談中的每個人物,發(fā)聲分析單元55基于交談中發(fā)聲數(shù)據(jù),以時間 序列形式檢測該人物的語音的音高。對于交談中的每個人物,發(fā)聲分析單元55還基于添 加到表示該人物的發(fā)聲的交談中發(fā)聲數(shù)據(jù)的時刻信息,來檢測交談所需的總時間(即, 各個交談中發(fā)聲時段的時間的總和)。對于每個人物,發(fā)聲分析單元55還檢測表示該人物的發(fā)聲的交談中發(fā)聲文本中 包括的字符的總數(shù)(即,交談中說出的字符的總數(shù))。對于每個人物,發(fā)聲分析單元55 將交談中說出的字符的總數(shù)除以交談所需的總時間,以計算發(fā)聲的速度。同時,發(fā)聲分析單元55預(yù)先存儲字典數(shù)據(jù),該字典數(shù)據(jù)是通過列出帶有單詞屬 性信息(例如詞性)的單詞來生成的。因此,當(dāng)生成單獨發(fā)聲文本時,發(fā)聲分析單元55 基于字典數(shù)據(jù)對單獨發(fā)聲文本進行詞素分析。從而,發(fā)聲分析單元55將單獨發(fā)聲文本劃分成詞素(即,具有作為單詞的含義 的最小單位)并且將所劃分的詞素與單詞屬性信息關(guān)聯(lián)起來。即使當(dāng)生成交談中發(fā)聲文本時,發(fā)聲分析單元55也基于字典數(shù)據(jù)以時段發(fā)聲文 本為單位對交談中發(fā)聲文本進行詞素分析。從而,發(fā)聲分析單元55把構(gòu)成交談中發(fā)聲文 本的各個時段發(fā)聲文本劃分成詞素,并且將所劃分的詞素與單詞屬性信息關(guān)聯(lián)起來。當(dāng)獲得單獨發(fā)聲文本時,發(fā)聲分析單元55在發(fā)聲分析/關(guān)系推定處理期間,在 以下描述的用于實際推定人物之間的關(guān)系的推定處理中,單獨使用該單獨發(fā)聲文本。發(fā)聲分析單元55還在發(fā)聲分析/關(guān)系推定處理期間,以交談為單位在以下描述的推定處理中使用交談中發(fā)聲文本(即,從同一交談一起獲得的文本)。下面,將描述在推定處理中使用單獨發(fā)聲文本的情況。然后,將描述以交談為 單位在推定處理中使用交談中發(fā)聲文本的情況。當(dāng)在推定處理中使用單獨發(fā)聲文本時,發(fā)聲分析單元55基于與詞素相關(guān)聯(lián)的 單詞屬性信息,從單獨發(fā)聲文本中提取諸如名詞、動詞、接尾詞和語氣之類的各種語句 (以下這些語句被稱為單詞)。發(fā)聲分析單元55從姓名數(shù)據(jù)庫57中讀取多種姓名信息。發(fā)聲分析單元55通過 字符匹配方法將從單獨發(fā)聲文本中提取的各種單詞與姓名信息所表示的各種人物姓名相 比較。

從而,當(dāng)在從單獨發(fā)聲文本中提取的各種單詞中存在與姓名數(shù)據(jù)庫57中登記的 人物的姓名相一致的單詞時,發(fā)聲分析單元55將該單詞檢測為人物的姓名。同時,當(dāng)基于單獨發(fā)聲文本檢測到人物的姓名時,如果姓名檢測信息被從被攝 物推定單元46提供來,那么發(fā)聲分析單元55從姓名檢測信息中加載存在時段信息。發(fā)聲分析單元55檢測單獨發(fā)聲文本中與檢測到的人物姓名相關(guān)的所有單位對應(yīng) 部分,并且還檢測添加到所有檢測到的單位對應(yīng)部分的時刻信息。發(fā)聲分析單元55基于檢測到的姓名信息來檢測其中此時檢測到的人物姓名作為 聲音被發(fā)出的姓名發(fā)聲時段。發(fā)聲分析單元55將存在時段信息所表示的存在時段(即, 時刻信息)與姓名發(fā)聲時段(即,時刻信息)相比較。結(jié)果,如果存在時段和姓名發(fā)聲時段至少部分相互重疊,那么發(fā)聲分析單元55 通過字符匹配方法將姓名檢測信息所表示的人物的姓名(字符串)與此時檢測到的人物的 姓名相比較。從而,如果姓名檢測信息所表示的人物的姓名和檢測到的人物的姓名相互一 致,那么發(fā)聲分析單元55檢測到此時檢測出的姓名被繪在被拍攝的人物所佩戴的姓名標(biāo)簽上。換言之,發(fā)聲分析單元55檢測到基于單獨發(fā)聲文本檢測出的姓名是被拍攝的單 獨發(fā)聲的人物的姓名。然后,發(fā)聲分析單元55確定被拍攝的人物為具有此時檢測到的姓 名的人物。如果以這種方式確定了誰被拍攝(S卩,姓名),那么發(fā)聲分析單元55生成表示所 確定人物的所確定人物信息。此時,發(fā)聲分析單元55在所確定人物信息中存儲利用字符 串(即,文本)表示此時檢測到的人物的姓名的姓名信息和利用時刻信息表示姓名發(fā)聲時 段的姓名發(fā)聲時段信息。發(fā)聲分析單元55還基于姓名檢測信息在所確定人物信息中存儲存在時段信息, 該存在時段信息利用存在時段開頭和結(jié)尾處的時刻信息表示了存在時段,在存在時段中 表示所確定人物的姓名的字符串在存儲運動圖像中。發(fā)聲分析單元55還在所確定人物信息中存儲提取位置信息,該提取位置信息表 示了在存在時段的單位圖像中表示所確定人物的姓名的字符串的提取位置。發(fā)聲分析單 元55將所確定人物信息發(fā)送給動作分析單元56。被單獨拍攝的人物在拍攝期間可能說出其自己的姓名或者可能說出另一人物的 姓名。因此,發(fā)聲分析單元55僅通過基于單獨發(fā)聲文本檢測人物的姓名,是難以確定該姓名是被拍攝的人物的姓名還是另一人物的姓名的。從而,在基于單獨發(fā)聲文本檢測人物的姓名時,如果姓名檢測信息未被從被攝 物推定單元46提供來,那么發(fā)聲分析單元55不將檢測到的姓名通知給動作分析單元56。即使當(dāng)姓名檢測信息被提供來時,如果存在時段的時刻信息和姓名發(fā)聲時段的 時刻信息相互不同,發(fā)聲分析單元55也不把檢測到的姓名通知給動作分析單元56。另 夕卜,如果姓名檢測信息所表示的人物的姓名不與檢測到的人物的姓名相一致,那么發(fā)聲 分析單元55不把檢測到的姓名通知給動作分析單元56。同時,推定處理如下所述通常伴隨著隨后將執(zhí)行的處理。然而,當(dāng)單獨發(fā)聲文 本被用于推定處理中時,由于難以通過單個人物的發(fā)聲來推定多個人物之間的關(guān)系,因 此發(fā)聲分析單元55在上述處理完成時結(jié)束利用單獨發(fā)聲文本的處理。接下來,將描述基于同一交談(即,以交談為單位)獲得的多種交談中發(fā)聲文本 被用 于推定處理中的情況。如果基于同一交談獲得的多種交談中發(fā)聲文本被用于推定處 理中,那么發(fā)聲分析單元55基于與詞素相關(guān)聯(lián)的單詞屬性信息,從多種交談中發(fā)聲文本 中的每一種中提取單詞。發(fā)聲分析單元55從姓名數(shù)據(jù)庫57中讀取多種姓名信息和多種接尾詞信息。發(fā) 聲分析單元55還從昵稱數(shù)據(jù)庫58中讀取多種昵稱信息。發(fā)聲分析單元55通過字符匹配方法將從每個交談中發(fā)聲文本中提取的各種單詞 與姓名信息所表示的各種人物姓名或者昵稱信息所表示的各種昵稱相比較。如果在從每個交談中發(fā)聲文本中提取的各種單詞中存在與姓名數(shù)據(jù)庫57或昵稱 數(shù)據(jù)庫58中登記的人物姓名或昵稱相一致的單詞,那么發(fā)聲分析單元55將該單詞檢測為 人物姓名或昵稱。如果基于每個交談中發(fā)聲文本檢測到人物姓名,那么發(fā)聲分析單元55通過字符 匹配方法將緊接該姓名之后的單詞與接尾詞信息所表示的各種接尾詞相比較。從而,發(fā)聲分析單元55檢測該人物在沒有敬稱的情況下稱呼該姓名還是該人物 用諸如“KUN”、“SAN”或“CHAN”之類的接尾詞來稱呼該姓名。同時,在拍攝存儲時,拍攝排除人物可能用其姓名或昵稱來稱呼被拍攝的人物 (作為被攝人物的孩童或成人),以便其臉部轉(zhuǎn)向數(shù)字?jǐn)z像機10。如果在諸如開學(xué)典禮或畢業(yè)典禮之類的事件上進行拍攝存儲,那么事件的組織 者等等可能為了介紹而用其姓名來稱呼被拍攝的人物(作為被攝人物的孩童或成人)。在拍攝存儲時,一起被拍攝的另一人物或者未被一起拍攝的另一人物可能用其 姓名或昵稱來稱呼被拍攝的人物。多個人物之間的交談往往基本上是在多個人物之間交 替進行的,從而任何人物向另一人物說話,并且另一人物回復(fù)。因此,如果基于表示任何人物的發(fā)聲的交談中發(fā)聲文本檢測到人物的姓名,那 么發(fā)聲分析單元55以與上述相同的方式檢測交談中發(fā)聲文本中包括檢測到的姓名的姓名 發(fā)聲時段。此時,如果姓名檢測信息被從被攝物推定單元46提供來,那么發(fā)聲分析單元55 以與上述相同的方式將存在時段的時刻信息與姓名發(fā)聲時段的時刻信息相比較。如果存 在時段和姓名發(fā)聲時段至少部分相互重疊,那么發(fā)聲分析單元55通過字符匹配方法將姓 名檢測信息所表示的人物姓名與檢測到的人物姓名相比較。
如果姓名檢測信息所表示的人物姓名與檢測到的人物姓名相一致,那么發(fā)聲分析單元55把帶有繪出由姓名檢測信息所表示的姓名的姓名標(biāo)簽的被拍攝的人物確定為具 有檢測到的姓名的人物。如果確定了誰是該人物(即,姓名),那么發(fā)聲分析單元55以 與上述相同的方式生成所確定人物信息并且將所確定人物信息發(fā)送給動作分析單元56。此時,如果姓名檢測信息未被從被攝物推定單元46提供來,那么發(fā)聲分析單元 55連同檢測到的姓名生成表示說出該姓名的人物的姓名發(fā)聲信息。此時,發(fā)聲分析單元55在姓名發(fā)聲信息中存儲姓名信息,該姓名信息利用字符 串(即,文本)表示檢測到的人物的姓名(如果附加了諸如“KUN”或“SAN”之類的 接尾詞,那么也表示附加了接尾詞)。發(fā)聲分析單元55還在姓名發(fā)聲信息中存儲利用時 刻信息表示姓名發(fā)聲時段的姓名發(fā)聲時段信息。發(fā)聲分析單元55還在姓名發(fā)聲信息中存儲表示說出檢測到的姓名的人物所在的 方向的人物方向信息。發(fā)聲分析單元55將姓名發(fā)聲信息發(fā)送給動作分析單元56。即使當(dāng)姓名檢測信息被提供來時,如果存在時段的時刻信息和姓名發(fā)聲時段的 時刻信息相互不同,那么發(fā)聲分析單元55也生成姓名發(fā)聲信息并且將姓名發(fā)聲信息發(fā)送 給動作分析單元56。另外,如果姓名檢測信息所表示的人物姓名與檢測到的人物姓名 不一致,那么發(fā)聲分析單元55生成姓名發(fā)聲信息并將姓名發(fā)聲信息發(fā)送給動作分析單元 56。如果基于任何交談中發(fā)聲文本檢測到昵稱,那么發(fā)聲分析單元55檢測包括昵稱 的交談中發(fā)聲文本中與昵稱相關(guān)的所有單位對應(yīng)部分以及附加的時刻信息。發(fā)聲分析單元55基于檢測到的時刻信息來檢測此時檢測到的昵稱作為聲音被發(fā) 出的昵稱發(fā)聲時段。發(fā)聲分析單元55連同檢測到的昵稱生成表示說出昵稱的人物的昵稱
發(fā)聲信息。此時,發(fā)聲分析單元55在昵稱發(fā)聲信息中存儲利用字符串(即,文本)表示此 時檢測到的昵稱的昵稱信息和利用時刻信息表示昵稱發(fā)聲時段的昵稱發(fā)聲時段信息。發(fā)聲分析單元55還在昵稱發(fā)聲信息中存儲表示說出檢測到的昵稱的人物所在的 方向的人物方向信息。發(fā)聲分析單元55將昵稱發(fā)聲信息發(fā)送給動作分析單元56。如果以這種方式檢測到人物的姓名或昵稱,那么接下來,發(fā)聲分析單元55從語 言數(shù)據(jù)庫59中讀取多種方言信息和標(biāo)準(zhǔn)語言信息。發(fā)聲分析單元55通過字符匹配方法 將從每個交談中發(fā)聲文本中提取出的各種單詞與方言信息所表示的各種方言單詞或者標(biāo) 準(zhǔn)語言信息所表示的各種標(biāo)準(zhǔn)語言單詞相比較。從而,如果在從每個交談中發(fā)聲文本提取出的各種單詞中存在與語言數(shù)據(jù)庫59 中登記的方言單詞或標(biāo)準(zhǔn)語言單詞相一致的單詞,那么發(fā)聲分析單元55將該單詞檢測為 用于推定人物之間的關(guān)系的方言單詞或標(biāo)準(zhǔn)語言單詞。發(fā)聲分析單元55從關(guān)系推定語句數(shù)據(jù)庫60中讀取多種關(guān)系推定語句信息。發(fā) 聲分析單元55通過字符匹配方法將從每個交談中發(fā)聲文本中提取的各種單詞與關(guān)系推定 語句信息所表示的各種關(guān)系推定語句(另一方的稱呼)(例如“媽媽”、“母親”、“爸 爸”、“奶奶”和“哥哥”)相比較。從而,如果在從每個交談中發(fā)聲文本提取的各種單詞中存在與關(guān)系推定語句數(shù) 據(jù)庫60中登記的關(guān)系推定語句相一致的單詞,那么發(fā)聲分析單元55將該單詞檢測為用于推定人物之間的關(guān)系的關(guān)系推定語句。如果檢測到關(guān)系推定語句,發(fā)聲分析單元55則檢測包括檢測到的關(guān)系推定語句的交談中發(fā)聲文本中的與檢測到的關(guān)系推定語句相關(guān)的所有單位對應(yīng)部分和附加的時刻 信息。發(fā)聲分析單元55基于檢測的時刻信息來檢測此時檢測到的關(guān)系推定語句被作為聲 音發(fā)出的關(guān)系發(fā)聲時段。發(fā)聲分析單元55連同檢測到的關(guān)系推定語句生成表示說出該關(guān)系推定語句的人 物的關(guān)系發(fā)聲信息。此時,發(fā)聲分析單元55在關(guān)系發(fā)聲信息中存儲利用字符串(即,文 本)表示此時檢測到的關(guān)系推定語句的關(guān)系推定語句信息和利用時刻信息表示關(guān)系發(fā)聲 時段的關(guān)系發(fā)聲時段信息。發(fā)聲分析單元55還在關(guān)系發(fā)聲信息中存儲表示說出檢測到的關(guān)系推定語句的人 物所在的方向的人物方向信息。發(fā)聲分析單元55將關(guān)系發(fā)聲信息發(fā)送給動作分析單元 56。發(fā)聲分析單元55從動作推定語句數(shù)據(jù)庫61中讀取多種動作推定語句信息。發(fā) 聲分析單元55通過字符匹配方法將從每個交談中發(fā)聲文本中提取的各種單詞與動作推定 語句信息所表示的各種動作推定語句(例如“擁抱”、“肩背”)相比較。從而,如果在從每個交談中發(fā)聲文本提取的各種單詞中存在與動作推定語句數(shù) 據(jù)庫61中登記的動作推定語句相一致的單詞,那么發(fā)聲分析單元55將該單詞檢測為用于 推定人物的動作的動作推定語句,如下所述。如果檢測到動作推定語句,發(fā)聲分析單元55則檢測包括檢測到的動作推定語句 的交談中發(fā)聲文本中的與檢測到的動作推定語句相關(guān)的所有單位對應(yīng)部分和附加的時刻 信息。發(fā)聲分析單元55基于檢測的時刻信息來檢測此時檢測到的動作推定語句被作為聲 音發(fā)出的聲動作發(fā)聲時段。發(fā)聲分析單元55連同檢測到的動作推定語句生成表示說出該動作推定語句的人 物的動作發(fā)聲信息。此時,發(fā)聲分析單元55在動作發(fā)聲信息中存儲利用字符串(即,文 本)表示此時檢測到的動作推定語句的動作推定語句信息和利用時刻信息表示動作發(fā)聲 時段的動作發(fā)聲時段信息。發(fā)聲分析單元55將動作發(fā)聲信息發(fā)送給動作分析單元56。這樣,發(fā)聲分析單元55基于每個人物的交談中發(fā)聲文本,檢測姓名或昵稱、姓 名的敬稱的形式、方言、語氣等等。如果基于每個人物的交談中發(fā)聲文本檢測到的昵 稱、姓名的敬稱的形式等等,那么發(fā)聲分析單元55按照人物來對檢測到的昵稱、姓名的 敬稱的形式等等分類,并且定義用于檢測人物的說話方式的發(fā)聲信息。此時,對于每個人物,發(fā)聲分析單元55基于發(fā)聲信息從親密度數(shù)據(jù)庫62的多個 友好判定項目CO中檢測表示該人物的說話方式的友好判定項目CO。對于每個人物,發(fā) 聲分析單元55從親密度數(shù)據(jù)庫62中讀取與表示該人物的說話方式的友好判定項目CO相 對應(yīng)的所有評估值VA。此外,發(fā)聲分析單元55針對每個人物,基于上述的交談速度和語音的音高, 通過使用概述模型來推定交談時的感情。針對每個人物推定交談時的感情的方法例如 在 Jack Breese 禾口 Gene Ball 的論文“BayesianNetworks for Modeling Emotional State and Personality”中有所記載。當(dāng)為友好判定項目CO所屬的每個類別CA預(yù)先選擇的加權(quán)函數(shù)為ω、評估值VA為ν、并且表示一個人有多喜愛另一方的友好值為K時,對于交談中的每個人物,發(fā) 聲分析單元55通過根據(jù)相應(yīng)的加權(quán)函數(shù)對基于該人物的說話方式獲取的所有評估值VA 順次加權(quán)并且將加權(quán)值相加,來計算友好值,如以下式(1)所示。
權(quán)利要求
1.一種信息處理裝置,包括存儲單元,該存儲單元在存儲介質(zhì)中存儲表示作為被攝物的多個人物之間的關(guān)系的 人物關(guān)系信息;獲取單元,該獲取單元獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù);檢測單元,該檢測單元檢測基于由所述獲取單元獲取的圖像數(shù)據(jù)的圖像中的每個人物;確定單元,該確定單元確定由所述檢測單元從所述圖像中檢測到的每個人物;以及判定單元,該判定單元判定由所述檢測單元從所述圖像中檢測到的多個人物之間的 關(guān)系,其中,當(dāng)由所述檢測單元從所述圖像中檢測到的多個人物之中的至少一個人物被確 定而另一人物未能被確定時,所述確定單元基于由所述判定單元判定的多個人物之間的 關(guān)系和存儲在所述存儲介質(zhì)中的人物關(guān)系信息來確定另一人物。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,還包括動作推定單元,該動作推定單元分析由所述獲取單元獲取的圖像數(shù)據(jù)以推定由所述 檢測單元檢測到的每個人物的動作,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作來判定多 個人物之間的關(guān)系。
3.根據(jù)權(quán)利要求2所述的信息處理裝置,其中,所述獲取單元獲取通過拍攝人物而與圖像數(shù)據(jù)一起生成的聲音數(shù)據(jù),并且所述判定單元基于由所述動作推定單元推定的每個人物的特定動作和由所述獲取單 元獲取的聲音數(shù)據(jù)來判定多個人物之間的關(guān)系。
4.根據(jù)權(quán)利要求3所述的信息處理裝置,包括發(fā)聲提取單元,該發(fā)聲提取單元分析由所述獲取單元獲取的聲音數(shù)據(jù)以提取每個人 物的發(fā)聲;以及親密度計算單元,該親密度計算單元基于由所述發(fā)聲提取單元提取的多個人物之間 的交談的發(fā)聲來計算多個人物之間的親密度,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作和由所述 親密度計算單元計算出的多個人物之間的親密度來判定多個人物之間的關(guān)系。
5.根據(jù)權(quán)利要求4所述的信息處理裝置,還包括親密程度提取單元,該親密程度提取單元從基于圖像數(shù)據(jù)的圖像中提取表示多個人 物之間的親密程度的親密程度信息,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作、由所述 親密度計算單元計算出的多個人物之間的親密度以及由所述親密程度提取單元提取的多 個人物之間的親密程度信息,來判定多個人物之間的關(guān)系。
6.根據(jù)權(quán)利要求5所述的信息處理裝置,還包括份數(shù)選擇單元,該份數(shù)選擇單元基于由所述檢測單元從所述圖像中檢測到的人物的 數(shù)目和由所述判定單元判定的多個人物之間的關(guān)系來選擇所述圖像的打印份數(shù)。
7.根據(jù)權(quán)利要求3所述的信息處理裝置,還包括發(fā)聲提取單元,該發(fā)聲提取單元分析由所述獲取單元獲取的聲音數(shù)據(jù)以提取每個人物的發(fā)聲,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作和由所述 發(fā)聲提取單元提取的每個人物的發(fā)聲來判定多個人物之間的關(guān)系。
8.根據(jù)權(quán)利要求7所述的信息處理裝置,還包括親密度計算單元,該親密度計算單元基于由所述發(fā)聲提取單元提取的多個人物之間 的交談的發(fā)聲來計算多個人物之間的親密度,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作、由所述 發(fā)聲提取單元提取的每個人物的發(fā)聲以及由所述親密度計算單元計算出的多個人物之間 的親密度,來判定多個人物之間的關(guān)系。
9.根據(jù)權(quán)利要求8所述的信息處理裝置,還包括親密程度提取單元,該親密程度提取單元從基于圖像數(shù)據(jù)的圖像中提取表示多個人 物之間的親密程度的親密程度信息,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作、由所述 發(fā)聲提取單元提取的每個人物的發(fā)聲、由所述親密度計算單元計算出的多個人物之間的 親密度以及由所述親密程度提取單元提取的多個人物之間的親密程度信息,來判定多個 人物之間的關(guān)系。
10.根據(jù)權(quán)利要求9所述的信息處理裝置,還包括份數(shù)選擇單元,該份數(shù)選擇單元基于由所述檢測單元從所述圖像中檢測到的人物的 數(shù)目和由所述判定單元判定的多個人物之間的關(guān)系來選擇所述圖像的打印份數(shù)。
11.一種信息處理方法,包括以下步驟在存儲介質(zhì)中存儲表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信息;獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù);檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物;確定從所述圖像中檢測到的每個人物;判定從所述圖像中檢測到的多個人物之間的關(guān)系;以及當(dāng)從所述圖像中檢測到的多個人物之中的至少一個人物被確定而另一人物未能被確 定時,基于所判定的多個人物之間的關(guān)系和存儲在所述存儲介質(zhì)中的人物關(guān)系信息來確 定另一人物。
12.一種使得計算機執(zhí)行以下步驟的信息處理程序在存儲介質(zhì)中存儲表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信息;獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù);檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物;確定從所述圖像中檢測到的每個人物;判定從所述圖像中檢測到的多個人物之間的關(guān)系;以及當(dāng)從所述圖像中檢測到的多個人物之中的至少一個人物被確定而另一人物未能被確 定時,基于所判定的多個人物之間的關(guān)系和存儲在所述存儲介質(zhì)中的人物關(guān)系信息來確 定另一人物。
13.—種信息處理裝置,包括獲取單元,該獲取單元獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù);檢測單元,該檢測單元檢測基于由所述獲取單元獲取的圖像數(shù)據(jù)的圖像中的每個人物;判定單元,該判定單元判定由所述檢測單元從所述圖像中檢測到的多個人物之間的 關(guān)系;以及份數(shù)選擇單元,該份數(shù)選擇單元基于由所述檢測單元從所述圖像中檢測到的人物的 數(shù)目和由所述判定單元判定的多個人物之間的關(guān)系來選擇所述圖像的打印份數(shù)。
14.根據(jù)權(quán)利要求13所述的信息處理裝置,還包括存儲單元,該存儲單元在存儲介質(zhì)中存儲表示作為被攝物的多個人物之間的關(guān)系的 人物關(guān)系信息,其中,所述判定單元基于存儲在所述存儲介質(zhì)中的人物關(guān)系信息來判定由所述檢測 單元檢測到的多個人物之間的關(guān)系。
15.根據(jù)權(quán)利要求14所述的信息處理裝置,還包括動作推定單元,該動作推定單元分析由所述獲取單元獲取的圖像數(shù)據(jù)以推定由所述 檢測單元檢測到的每個人物的動作,其中,所述判定單元基于由所述動作推定單元推定的每個人物的特定動作來判定多 個人物之間的關(guān)系。
16.根據(jù)權(quán)利要求15所述的信息處理裝置,其中,所述獲取單元獲取通過拍攝人物而與圖像數(shù)據(jù)一起生成的聲音數(shù)據(jù),并且 所述判定單元基于由所述動作推定單元推定的每個人物的特定動作和由所述獲取單 元獲取的聲音數(shù)據(jù)來判定多個人物之間的關(guān)系。
17.—種信息處理方法,包括以下步驟獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù); 檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物; 判定從所述圖像中檢測到的多個人物之間的關(guān)系;以及基于從所述圖像中檢測到的人物的數(shù)目和所判定的多個人物之間的關(guān)系來選擇所述 圖像的打印份數(shù)。
18.一種使得計算機執(zhí)行以下步驟的信息處理程序 獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù); 檢測基于所獲取的圖像數(shù)據(jù)的圖像中的每個人物; 判定從所述圖像中檢測到的多個人物之間的關(guān)系;以及基于從所述圖像中檢測到的人物的數(shù)目和所判定的多個人物之間的關(guān)系來選擇所述 圖像的打印份數(shù)。
全文摘要
本發(fā)明提供了信息處理裝置、信息處理方法和信息處理程序。一種信息處理裝置包括存儲單元,在存儲介質(zhì)中存儲表示作為被攝物的多個人物之間的關(guān)系的人物關(guān)系信息;獲取單元,獲取通過拍攝作為被攝物的人物而生成的圖像數(shù)據(jù);檢測單元,檢測基于由獲取單元獲取的圖像數(shù)據(jù)的圖像中的每個人物;確定單元,確定由檢測單元從圖像中檢測到的每個人物;以及判定單元,判定由檢測單元從圖像中檢測到的多個人物之間的關(guān)系,其中,當(dāng)由檢測單元從圖像中檢測到的多個人物之中的至少一個人物被確定而另一人物未能被確定時,確定單元基于由判定單元判定的多個人物之間的關(guān)系和存儲在存儲介質(zhì)中的人物關(guān)系信息來確定另一人物。
文檔編號G06K9/72GK102024157SQ201010273769
公開日2011年4月20日 申請日期2010年9月2日 優(yōu)先權(quán)日2009年9月9日
發(fā)明者酒井康雄 申請人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
东港市| 昆明市| 渝北区| 安多县| 孝昌县| 札达县| 昆山市| 长宁区| 瑞金市| 四子王旗| 宜城市| 苏尼特左旗| 新竹县| 余江县| 安庆市| 秭归县| 湘阴县| 岳阳市| 雅江县| 云林县| 油尖旺区| 长武县| 龙南县| 澄迈县| 灌云县| 仪征市| 泽库县| 乐山市| 区。| 泾川县| 中超| 河曲县| 东山县| 江永县| 镇沅| 中卫市| 双柏县| 绩溪县| 米脂县| 杭锦后旗| 会东县|