專(zhuān)利名稱(chēng):用于識(shí)別對(duì)象及另一低級(jí)別對(duì)象的模式識(shí)別裝置及其方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種模式識(shí)別裝置及其方法,所述模式識(shí)別裝置及其方法被配置為基于輸入模式來(lái)識(shí)別預(yù)定對(duì)象,并且進(jìn)一步識(shí)別級(jí)別比該預(yù)定對(duì)象的級(jí)別低的特定對(duì)象。
背景技術(shù):
在檢測(cè)人物的面部時(shí),可以利用基于圖像來(lái)檢測(cè)特定對(duì)象模式的圖像處理方法。 因此,能夠在諸如電信會(huì)議、人機(jī)接口、安全系統(tǒng)和跟蹤人物的面部的監(jiān)視系統(tǒng)等的各種場(chǎng)合和技術(shù)領(lǐng)域,來(lái)使用該圖像處理方法。為了檢測(cè)圖像中的人物的面部,例如,可以使用在Yang et al, “ Detecting Faces in Images :A Survey" , IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 24,NO. 1,JANUARY 2002中討論的方法。這種方法基于幾個(gè)顯著特征 (例如人物的面部的眼睛、嘴和鼻子)以及這些特征之間的幾何位置關(guān)系,來(lái)檢測(cè)人物的面部。另夕卜,Yang et al, “ Detecting Faces in Images :A Survey " , IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 24, NO. 1,JANUARY 2002討論了如下的方法,即基于人物的面部的對(duì)稱(chēng)特征和人物的面部的顏色的特征,利用模板匹配方法和神經(jīng)網(wǎng)絡(luò)方法,來(lái)檢測(cè)人物的面部。近年來(lái),期望有如下的方法,即除了簡(jiǎn)單地檢測(cè)人物的面部之外,還能夠基于檢測(cè)到的人物的面部來(lái)區(qū)分并識(shí)別特定人物。更具體地說(shuō),如果能夠從拍攝的多個(gè)人物的圖像中區(qū)分并識(shí)別特定人物,則用于識(shí)別使用照相機(jī)在圖像中拍攝的人物的面部、并且被配置為根據(jù)識(shí)別出的面部執(zhí)行適當(dāng)?shù)钠毓夂途劢箍刂频膽?yīng)用,能夠執(zhí)行適合于特定人物的控制。然而,當(dāng)前無(wú)法容易地實(shí)現(xiàn)對(duì)人物的面部和特定人物的面部的識(shí)別。更具體地說(shuō), 日本專(zhuān)利申請(qǐng)?zhí)亻_(kāi)第2007-115109號(hào)公報(bào)討論了如下方法,即基于人物的膚色的特征來(lái)識(shí)別人物的面部,獲取識(shí)別出的面部的關(guān)注區(qū)域,并且基于用作特征量的所獲取的關(guān)注區(qū)域的位置來(lái)識(shí)別特定人物的面部。這種方法分開(kāi)執(zhí)行對(duì)人物的面部的識(shí)別和對(duì)特定人物的面部的識(shí)別。如果簡(jiǎn)單地組合使用識(shí)別圖像中的特定人物的面部的處理,則需要在各個(gè)處理中計(jì)算特征量并且執(zhí)行面部識(shí)別。因此,在這種情況下,需要執(zhí)行復(fù)雜的處理。通常,不僅在組合執(zhí)行面部識(shí)別和對(duì)特定人物的面部的識(shí)別時(shí),而且在組合執(zhí)行對(duì)高級(jí)別的對(duì)象和低級(jí)別的另一對(duì)象的識(shí)別時(shí),都出現(xiàn)上述問(wèn)題。換句話(huà)說(shuō),期望面部識(shí)別應(yīng)用能夠在識(shí)別諸如人物的面部的高級(jí)別對(duì)象之后,識(shí)別諸如特定人物的面部的低級(jí)別對(duì)象。此外,對(duì)于通過(guò)從大量圖像之中識(shí)別動(dòng)物的圖像來(lái)搜索動(dòng)物的圖像的應(yīng)用,期望搜索屬于比動(dòng)物圖像的類(lèi)別低的類(lèi)別的狗的圖像。另外,對(duì)于識(shí)別并強(qiáng)調(diào)在運(yùn)行車(chē)輛的場(chǎng)景的視頻中拍攝的交通標(biāo)志和指示牌的車(chē)輛導(dǎo)航應(yīng)用,期望區(qū)分并強(qiáng)調(diào)特定指示牌。
[引用文獻(xiàn)列表][專(zhuān)利文獻(xiàn)][PTL 1]日本專(zhuān)利申請(qǐng)?zhí)亻_(kāi)第2007-115109號(hào)公報(bào)[非專(zhuān)利文獻(xiàn)][NPL 1]Yang et al, “ Detecting Faces in Images :A Survey" , IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 24,NO. 1,JANUARY 2002[NPL 2]Viola and Jones, " Rapid Object Detection using Boosted Cascade of Simple Features" , Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR' 01)
發(fā)明內(nèi)容
本發(fā)明旨在提供一種能夠使用簡(jiǎn)單的配置來(lái)實(shí)現(xiàn)對(duì)高級(jí)別類(lèi)別對(duì)象的識(shí)別和對(duì)屬于低級(jí)別類(lèi)別的特定對(duì)象的識(shí)別的模式識(shí)別裝置。根據(jù)本發(fā)明的一方面,提供了一種模式識(shí)別裝置,該模式識(shí)別裝置包括特征量計(jì)算單元,被配置為計(jì)算輸入模式的特征量;基于預(yù)定對(duì)象的特征量的分布而生成的對(duì)象字典;基于所述預(yù)定對(duì)象中的特定對(duì)象的特征量的分布而生成的特定對(duì)象字典;第一似然性計(jì)算單元,被配置為通過(guò)參照所述對(duì)象字典,基于由所述特征量計(jì)算單元計(jì)算出的特征量, 來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算第一似然性;第一對(duì)象確定單元,被配置為基于所述第一似然性,來(lái)確定所述輸入模式是否是所述預(yù)定對(duì)象的;第二似然性計(jì)算單元,被配置為如果所述第一對(duì)象確定單元確定所述輸入模式是所述預(yù)定對(duì)象的,則通過(guò)參照所述特定對(duì)象字典,基于由所述特征量計(jì)算單元計(jì)算出的所述特征量,來(lái)對(duì)于所述輸入模式是否是所述特定對(duì)象的計(jì)算第二似然性;以及第二對(duì)象確定單元,被配置為基于所述第二似然性,來(lái)確定所述輸入模式是否是所述特定對(duì)象的。從以下參照附圖對(duì)示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征和方面將變得清林疋。
包含在說(shuō)明書(shū)中、構(gòu)成說(shuō)明書(shū)的一部分的附圖,示出了本發(fā)明的示例性實(shí)施例、特征和方面,并且與文字說(shuō)明一起,用于解釋本發(fā)明的原理。圖1示出了模式識(shí)別裝置的示例性配置。圖2是示出識(shí)別預(yù)定對(duì)象的方法的示例性處理流的流程圖。圖3示出了在圖像中搜索面部模式的方法的示例。圖4示出了人物的面部的特征量的示例。圖5示出了用于計(jì)算對(duì)象的似然性的參照表的示例。圖6示出了識(shí)別結(jié)果的輸出的示例。圖7是示出執(zhí)行用于識(shí)別特定對(duì)象的設(shè)置的方法的示例性處理流的流程圖。
圖8示出了用于計(jì)算特定對(duì)象的似然性的參照表的示例。圖9是示出識(shí)別特定對(duì)象的方法的示例性處理流的流程圖。圖10示出了人物的面部和特定人物的面部的識(shí)別結(jié)果的輸出的示例。圖11示出了模式識(shí)別裝置的配置的另一示例。
具體實(shí)施例方式下面,將參照附圖詳細(xì)描述本發(fā)明的各種示例性實(shí)施例、特征和方面。圖1是示出根據(jù)本發(fā)明的示例性實(shí)施例的模式識(shí)別裝置的示例性配置的框圖。參照?qǐng)D1,模式識(shí)別裝置包括圖像輸入單元10、模式提取單元20、特征量計(jì)算單元 30、似然性計(jì)算單元40、對(duì)象確定單元50、識(shí)別結(jié)果輸出單元60、對(duì)象字典100、特定對(duì)象字典110和字典生成單元200。圖像輸入單元10獲取由照相機(jī)的攝像單元(未示出)拍攝的圖像的數(shù)據(jù)。模式提取單元20從由圖像輸入單元10獲取的圖像數(shù)據(jù)中,剪取要進(jìn)行模式識(shí)別的部分圖像。特征量計(jì)算單元30計(jì)算如下的特征量,該特征量用來(lái)從由模式提取單元20剪取的部分圖像中識(shí)別期望的對(duì)象。似然性計(jì)算單元40基于由特征量計(jì)算單元30計(jì)算的特征量,計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性。對(duì)象確定單元50基于由40計(jì)算的對(duì)象的似然性,來(lái)確定由模式提取單元20剪取的部分圖像是否是要識(shí)別的對(duì)象。識(shí)別結(jié)果輸出單元60輸出由對(duì)象確定單元50進(jìn)行的識(shí)別的結(jié)果。更具體地說(shuō), 如果對(duì)象確定單元50確定識(shí)別出的對(duì)象是期望的對(duì)象,則識(shí)別結(jié)果輸出單元60以能夠?qū)⒉糠謭D像區(qū)域與其它圖像區(qū)域區(qū)分開(kāi)來(lái)的方式,在模式識(shí)別裝置的顯示器上顯示部分圖像的區(qū)域。對(duì)象字典100和特定對(duì)象字典110存儲(chǔ)似然性計(jì)算單元40在計(jì)算似然性時(shí)使用的期望的識(shí)別目標(biāo)對(duì)象的特征??梢曰诙鄠€(gè)對(duì)象的模式,通過(guò)機(jī)器學(xué)習(xí)事先生成對(duì)象字典 100。字典生成單元200生成用來(lái)基于由特征量計(jì)算單元30計(jì)算的特征量來(lái)識(shí)別特定對(duì)象的特定對(duì)象字典110。由模式識(shí)別裝置的控制單元(未示出)控制這些單元中的各個(gè)的操作。現(xiàn)在,將在下面詳細(xì)描述具有上述配置的模式識(shí)別裝置的操作。模式識(shí)別裝置執(zhí)行以下操作(1)使用事先存儲(chǔ)的對(duì)象字典對(duì)預(yù)定對(duì)象的識(shí)別;(2)用于執(zhí)行對(duì)屬于低級(jí)別類(lèi)別的特定對(duì)象的識(shí)別的設(shè)置;以及(3)對(duì)屬于低級(jí)別類(lèi)別的特定對(duì)象的識(shí)別?,F(xiàn)在,將在下面詳細(xì)描述上述項(xiàng)目操作(1),即對(duì)預(yù)定對(duì)象的識(shí)別。圖2是示出使用事先存儲(chǔ)的對(duì)象字典來(lái)識(shí)別預(yù)定對(duì)象的方法的示例性處理流的流程圖。在本示例性實(shí)施例中,將描述識(shí)別圖像中的人物的面部的方法。參照?qǐng)D2,在步驟SlOl中,圖像輸入單元10獲取由攝像單元(未示出)拍攝的圖像的數(shù)據(jù)。圖像數(shù)據(jù)包括包含8位像素的二維排列的數(shù)據(jù)。圖像數(shù)據(jù)包括紅色(R)、綠色 (G)和藍(lán)色(B) (RGB)圖像平面。
更具體地說(shuō),圖像輸入單元10將RGB圖像數(shù)據(jù)轉(zhuǎn)換為亮度圖像數(shù)據(jù)。將亮度圖像數(shù)據(jù)存儲(chǔ)在圖像存儲(chǔ)器(未示出)上,并在后續(xù)處理中使用。如果獲取了 YUV圖像數(shù)據(jù)作為圖像數(shù)據(jù),則也可以將Y分量按原樣用作亮度數(shù)據(jù)。在步驟S102中,模式提取單元20從圖像存儲(chǔ)器加載在步驟SlOl中獲取的圖像數(shù)據(jù),并且從圖像數(shù)據(jù)中剪取作為對(duì)象識(shí)別的目標(biāo)區(qū)域的部分圖像。更具體地說(shuō),在步驟S102 中,模式提取單元20依次在垂直方向和水平方向上掃描整個(gè)圖像,如圖3所示。由此,模式提取單元20從圖像數(shù)據(jù)中檢測(cè)人物的面部,并且確定剪取的位置(范圍)。此外,為了檢測(cè)具有不同大小的面部,還可以如圖3所示,將加載的圖像數(shù)據(jù)依次以預(yù)定縮小比率縮小,并且以前述方式掃描用于面部檢測(cè)的圖像。通過(guò)上述處理剪取的部分圖像,成為在稍后的階段中執(zhí)行的識(shí)別中的關(guān)于圖像是否包括人物的面部的確定的目標(biāo)。在步驟S103中,特征量計(jì)算單元30計(jì)算如下的特征量,該特征量用來(lái)從由模式提取單元20剪取的部分圖像中識(shí)別期望的對(duì)象。對(duì)于用來(lái)識(shí)別人物的面部的特征量,可以使用諸如眼睛之間的距離與從嘴到眼睛的高度(距離)的比率的面部的特征。下面,參照?qǐng)D4,來(lái)描述獲取眼睛之間的距離與從嘴到眼睛的距離的比率的方法。 如圖4所示,特征量計(jì)算單元30從由模式提取單元20所剪取的部分圖像R中,提取亮度比周?chē)糠值牧炼劝档娜齻€(gè)部分,作為眼睛和嘴的候選對(duì)象。此外,特征量計(jì)算單元30計(jì)算眼睛之間的距離Ll和從眼睛到嘴的距離L2(圖4)。另外,特征量計(jì)算單元30通過(guò)下面的表達(dá)式(1)計(jì)算用于面部區(qū)分的特征量f:[數(shù)學(xué)式1]f = L1/L2在圖4所示的示例中,部分圖像R是人物的面部的圖像(面部圖像)。然而,如果部分圖像R不是面部圖像,則特征量計(jì)算單元30執(zhí)行對(duì)眼睛和嘴的候選對(duì)象的三個(gè)部分的提取以及對(duì)特征量f的計(jì)算。另外,通過(guò)使用指示人物的面部的多個(gè)特征量的組合,能夠以高精度執(zhí)行對(duì)人物的面部的識(shí)別。更具體地說(shuō),還可以利用Viola and Jones, “ Rapid Object Detection using Boosted Cascade of Simple Features“ , Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR' 01)討論的、組合使用多個(gè)特征量的傳統(tǒng)方法。在這種傳統(tǒng)方法中,組合使用六千或更多個(gè)指示特定區(qū)域中的明度對(duì)比的特征量。在步驟S104中,似然性計(jì)算單元40基于由特征量計(jì)算單元30計(jì)算的特征量,并且使用對(duì)象字典100,來(lái)計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性。對(duì)象字典100(在本示例性實(shí)施例中,對(duì)象字典100是包括人物的面部的數(shù)據(jù)的字典)事先將與特征量f的值相對(duì)應(yīng)的似然性(指示包括人物的面部的部分圖像的似然性的值)存儲(chǔ)為表。在本示例性實(shí)施例中,似然性計(jì)算單元40基于特征量f的值來(lái)確定用于參照的表的箱(bin),并且計(jì)算存儲(chǔ)在所確定的箱中的值作為似然性。圖5示出了表的示例。參照?qǐng)D5,似然性在垂直軸C上取值。以如下方式來(lái)生成表。提供要識(shí)別的對(duì)象(在本示例性實(shí)施例中為人物的面部的圖像)的多個(gè)樣本圖像
7模式,以及識(shí)別目標(biāo)對(duì)象之外的對(duì)象的多個(gè)樣本圖像模式。可以提供一萬(wàn)或更多個(gè)模式,作為識(shí)別目標(biāo)樣本模式和識(shí)別非目標(biāo)樣本模式中的各個(gè)。此外,特征量計(jì)算單元30基于圖像模式中的各個(gè)來(lái)計(jì)算特征量f。似然性計(jì)算單元40基于識(shí)別目標(biāo)對(duì)象(面部)的所有圖像模式之中的特征量f的值,確定用于參照的表的箱的位置。另外,似然性計(jì)算單元40計(jì)算特征量f的頻率的分布,作為面部概率分布 Pr (f I If)。在本示例性實(shí)施例中,“I/,表示面部圖像模式,而“Pr (f I If) ”表示面部圖像模式的特征量f的概率分布。另外,似然性計(jì)算單元40基于識(shí)別目標(biāo)對(duì)象(面部)之外的對(duì)象的所有圖像模式的特征量f的值,來(lái)確定用于參照的表的箱的位置,并且計(jì)算頻率的分布,作為非面部概率分布Pr (f I Inf)。在本示例性實(shí)施例中,“ In,表示非面部圖像模式,而"Pr (f | Inf),,表示非面部圖像模式的特征量f的概率分布。可以由下面的表達(dá)式( 計(jì)算面部似然性C:[數(shù)學(xué)式2]C = log [ {Pr (f | IF)} / {Pr (f | INF)}]因此,可以針對(duì)特征量f的各個(gè)箱,對(duì)對(duì)象字典設(shè)置通過(guò)表達(dá)式(2)計(jì)算的似然性 C的值。如前所述,通過(guò)組合使用人物的面部的特征的多個(gè)特征量,能夠以高精度執(zhí)行面部識(shí)別。在計(jì)算似然性時(shí)組合使用多個(gè)特征量時(shí),似然性計(jì)算單元40計(jì)算多個(gè)特征量中的各個(gè)的似然性,并且將似然性值的總和設(shè)置為面部似然性。更具體地說(shuō),可以由下面的表達(dá)式⑶計(jì)算面部似然性C [數(shù)學(xué)式3]C::XCk(fk)其中,“fk”表示第k個(gè)特征量,“Ck(fk) ”表示與特征量fk相對(duì)應(yīng)的似然性。在步驟S105中,對(duì)象確定單元50基于在步驟S104中由似然性計(jì)算單元40計(jì)算的對(duì)象的似然性,來(lái)確定由模式提取單元20剪取的部分圖像是否是識(shí)別目標(biāo)對(duì)象。更具體地說(shuō),如果確定在步驟S104中計(jì)算的面部似然性C大于預(yù)定閾值T,則確定要對(duì)照的部分圖像模式是面部圖像。另一方面,如果確定面部似然性C等于或小于預(yù)定閾值T,則確定要對(duì)照的部分圖像模式是非面部圖像。在步驟S106中,如果確定部分圖像是面部圖像(步驟S105中的“是”),則對(duì)象確定單元50將部分圖像的位置作為識(shí)別結(jié)果存儲(chǔ)在存儲(chǔ)單元(未示出)中。另一方面,如果對(duì)象確定單元50確定部分圖像是非面部圖像(步驟S105中的“否”),則處理返回到步驟 S102。在如圖3所示的圖像內(nèi),依次重復(fù)執(zhí)行步驟S102直到步驟S106中的處理。在步驟S107中,識(shí)別結(jié)果輸出單元60在顯示器上顯示存儲(chǔ)在存儲(chǔ)單元(未示出) 上的識(shí)別結(jié)果(被確定是面部圖像的部分圖像的位置),如圖6所示。圖6所示的示例中的矩形部分指示重疊顯示在輸入圖像上的面部識(shí)別的結(jié)果?,F(xiàn)在,將在下面詳細(xì)描述上述操作(2),即用于識(shí)別屬于低級(jí)別類(lèi)別的特定對(duì)象的設(shè)置。圖7是示出執(zhí)行用于識(shí)別屬于低級(jí)別類(lèi)別的特定對(duì)象的設(shè)置的處理的示例的流程圖。在本示例性實(shí)施例中,將描述識(shí)別圖像中的特定人物的面部的方法。參照?qǐng)D7,在根據(jù)本示例性實(shí)施例的方法中,在步驟SlOl中,圖像輸入單元10獲取由攝像單元拍攝的圖像的數(shù)據(jù)。在本示例性實(shí)施例中,假設(shè)圖像輸入單元10獲取特定人物 (例如人物A)的面部的圖像的數(shù)據(jù)。將圖像數(shù)據(jù)存儲(chǔ)在圖像存儲(chǔ)器(未示出)上。在步驟S102中,模式提取單元20從圖像存儲(chǔ)器加載在步驟SlOl中獲取的圖像數(shù)據(jù),并且從圖像數(shù)據(jù)中剪取作為對(duì)象識(shí)別的目標(biāo)區(qū)域的部分圖像。在步驟S103中,特征量計(jì)算單元30計(jì)算用來(lái)從由模式提取單元20剪取的部分圖像中識(shí)別特定人物的面部的特征量。在步驟S201中,特征量計(jì)算單元30將計(jì)算的特征量值臨時(shí)存儲(chǔ)在存儲(chǔ)單元(未示出)上。在步驟S104中,似然性計(jì)算單元40基于由特征量計(jì)算單元30計(jì)算的特征量,并且使用對(duì)象字典100,來(lái)計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性。在步驟S105中,對(duì)象確定單元 50基于在步驟S104中由似然性計(jì)算單元40計(jì)算的對(duì)象的似然性,來(lái)確定由模式提取單元 20剪取的部分圖像是否是識(shí)別目標(biāo)對(duì)象。如果對(duì)象確定單元50確定部分圖像是面部圖像(步驟S105中的“是”),則處理前進(jìn)到步驟S202。在步驟S202中,字典生成單元200基于在步驟S201中臨時(shí)存儲(chǔ)的特征量來(lái)生成字典。另一方面,如果對(duì)象確定單元50確定部分圖像是非面部圖像(步驟S105 中的“否”),則處理返回到步驟S102。在如圖3所示的圖像內(nèi)依次重復(fù)執(zhí)行步驟S102直到步驟S202中的處理。如果被確定是非面部圖像的部分圖像或者在生成字典時(shí)使用的部分圖像是圖像的最后的部分圖像,則處理返回到步驟S101。在步驟SlOl中,圖像輸入單元10獲取拍攝了人物A的面部的另一圖像,并且重復(fù)步驟SlOl直到步驟S202中的處理。通過(guò)執(zhí)行上述方法,本示例性實(shí)施例能夠使用特定人物(人物A)的面部圖像,來(lái)生成專(zhuān)門(mén)包括人物A的面部的圖像的數(shù)據(jù)的字典。更具體地說(shuō),似然性計(jì)算單元40使用基于在步驟S201中存儲(chǔ)的人物A的面部圖像模式而計(jì)算的特征量f,來(lái)確定用于參照的表的箱的位置。另外,似然性計(jì)算單元40計(jì)算人物A的面部的圖像的特征量f的頻率的分布,作為面部概率分布ft" (f I Ifa)。在本示例性實(shí)施例中,“ Ifa”表示人物A的面部圖像模式,而“ft· (f I Ifa) ”表示面部圖像模式的特征量f的概率分布。可以通過(guò)下面的表達(dá)式(4)來(lái)計(jì)算人物A的面部似然性Ca [數(shù)學(xué)式4]CA = log [ {Pr (f | IFA)} / {Pr (f | INF)}]其中,“ft~(f |INF) ”表示非面部圖像模式的特征量f的概率分布。因此,可以針對(duì)特征量f的各個(gè)箱,對(duì)對(duì)象字典設(shè)置通過(guò)表達(dá)式(4)計(jì)算的似然性Ca的值。在通過(guò)組合使用多個(gè)特征量來(lái)執(zhí)行識(shí)別時(shí),可以針對(duì)各個(gè)特征量生成針對(duì)特定人物的字典。通過(guò)獲取并使用盡可能多的特定人物的樣本圖像,能夠以高精度執(zhí)行對(duì)特定人物的識(shí)別。還可以對(duì)在步驟S105中被確定是面部圖像的部分圖像模式執(zhí)行諸如校正預(yù)定量的圖像位置偏移、變倍和亮度轉(zhuǎn)換等的圖像處理,基于一個(gè)部分面部圖像來(lái)生成多個(gè)部分面部圖像,并且計(jì)算并獲取多個(gè)特征量。然而,如果僅獲取了少量的特征量的樣本,則概率分布的精度無(wú)法變高。因此,還可以在生成字典時(shí),使用利用如下的正態(tài)分布而進(jìn)行了近似的概率分布,其中,所述正態(tài)分布是基于獲取的特征量的值而計(jì)算的。如果人物A的面部比一般人物的面部長(zhǎng),則指示特征量f的似然性的表還可以具有特征量f的如下分布,該分布與圖5所示的面部圖像表相比偏向小值,如圖8所示。在步驟S203中,控制單元將在步驟S202中生成的特定對(duì)象字典存儲(chǔ)在特定對(duì)象字典110上。在執(zhí)行上述處理之后,執(zhí)行用于識(shí)別屬于低級(jí)別類(lèi)別的特定對(duì)象的設(shè)置的處
理結(jié)束?,F(xiàn)在,將在下面詳細(xì)描述操作(3),即識(shí)別屬于低級(jí)別類(lèi)別的特定對(duì)象的方法。圖9是示出根據(jù)針對(duì)屬于低級(jí)別類(lèi)別的特定對(duì)象的字典中的設(shè)置、來(lái)識(shí)別屬于低級(jí)別類(lèi)別的特定對(duì)象的處理的示例的流程圖。在圖9所示的處理中,在步驟SlOl中,圖像輸入單元10獲取由攝像單元(未示出)拍攝的圖像的數(shù)據(jù)。在步驟S102中,模式提取單元20從圖像存儲(chǔ)器加載在步驟SlOl 中獲取的圖像數(shù)據(jù),并且從圖像數(shù)據(jù)中剪取作為對(duì)象識(shí)別的目標(biāo)區(qū)域的部分圖像,作為輸入模式。在步驟S103中,特征量計(jì)算單元30計(jì)算如下的特征量,該特征量用來(lái)從由模式提取單元20剪取的部分圖像中識(shí)別期望的對(duì)象。在步驟S201中,控制單元(未示出)將特征量計(jì)算單元30計(jì)算的特征量的值臨時(shí)存儲(chǔ)在存儲(chǔ)單元(未示出)上。在步驟S104中,似然性計(jì)算單元40基于由特征量計(jì)算單元30計(jì)算的特征量,并且使用事先存儲(chǔ)的對(duì)象字典100,來(lái)計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性。在步驟S105中,對(duì)象確定單元50基于在步驟S104中由似然性計(jì)算單元40計(jì)算的對(duì)象的似然性,來(lái)確定由模式提取單元20剪取的部分圖像是否是識(shí)別目標(biāo)對(duì)象。更具體地說(shuō),對(duì)象確定單元50確定部分圖像是否是人物的面部的圖像。如果對(duì)象確定單元50確定部分圖像是面部圖像(步驟S105中的“是”),則處理前進(jìn)到步驟S106。在步驟S106中,控制單元(未示出)將面部圖像的位置作為識(shí)別結(jié)果存儲(chǔ)在存儲(chǔ)單元(未示出)上。另一方面,如果對(duì)象確定單元50確定部分圖像是非面部圖像 (步驟S105中的“否”),則處理返回到步驟S102。在步驟S301中,似然性計(jì)算單元40使用特定對(duì)象字典110,基于在步驟S201中臨時(shí)存儲(chǔ)的特征量,來(lái)計(jì)算識(shí)別目標(biāo)對(duì)象的似然性。更具體地說(shuō),在步驟S301中,通過(guò)事先在特定對(duì)象字典110(在本示例性實(shí)施例中為針對(duì)人物A的面部的圖像的字典)中設(shè)置與特征量f的值相對(duì)應(yīng)的似然性作為表,似然性計(jì)算單元40根據(jù)特征量f的值確定用于參照的表的箱的位置,并且計(jì)算存儲(chǔ)在所確定的箱中的值作為似然性。在計(jì)算似然性時(shí)組合使用多個(gè)特征量時(shí),似然性計(jì)算單元40計(jì)算多個(gè)特征量中的各個(gè)的似然性,并且將似然性值的總和設(shè)置為面部似然性。更具體地說(shuō),可以通過(guò)下面的表達(dá)式( 來(lái)計(jì)算人物A的面部似然性Ca [數(shù)學(xué)式5]Ca - ICAk(Fk)
k其中,“fk”表示第k個(gè)特征量,"CAk (fk) ”表示與特征量fk相對(duì)應(yīng)的似然性。
還可以強(qiáng)調(diào)專(zhuān)門(mén)針對(duì)人物A計(jì)算的特征量,以與一般人物的面部的特征量的分布進(jìn)行區(qū)別。在這種情況下,可以利用下面的表達(dá)式(6)并基于面部似然性,來(lái)對(duì)各個(gè)特征量的似然性分配權(quán)重[數(shù)學(xué)式6]
權(quán)利要求
1.一種模式識(shí)別裝置,該模式識(shí)別裝置包括特征量計(jì)算單元,被配置為計(jì)算輸入模式的特征量; 基于預(yù)定對(duì)象的特征量的分布而生成的對(duì)象字典; 基于所述預(yù)定對(duì)象中的特定對(duì)象的特征量的分布而生成的特定對(duì)象字典; 第一似然性計(jì)算單元,被配置為通過(guò)參照所述對(duì)象字典,基于由所述特征量計(jì)算單元計(jì)算出的特征量,來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算第一似然性;第一對(duì)象確定單元,被配置為基于所述第一似然性,來(lái)確定所述輸入模式是否是所述預(yù)定對(duì)象的;第二似然性計(jì)算單元,被配置為如果所述第一對(duì)象確定單元確定所述輸入模式是所述預(yù)定對(duì)象的,則通過(guò)參照所述特定對(duì)象字典,基于由所述特征量計(jì)算單元計(jì)算出的所述特征量,來(lái)對(duì)于所述輸入模式是否是所述特定對(duì)象的計(jì)算第二似然性;以及第二對(duì)象確定單元,被配置為基于所述第二似然性,來(lái)確定所述輸入模式是否是所述特定對(duì)象的。
2.根據(jù)權(quán)利要求1所述的模式識(shí)別裝置,該模式識(shí)別裝置還包括字典生成單元,該字典生成單元被配置為針對(duì)所述特定對(duì)象的多個(gè)輸入模式,基于由所述特征量計(jì)算單元計(jì)算出的所述特征量的分布,來(lái)生成所述特定對(duì)象的字典。
3.根據(jù)權(quán)利要求1或權(quán)利要求2所述的模式識(shí)別裝置,其中,所述特征量計(jì)算單元被配置成基于所述輸入模式,來(lái)計(jì)算多個(gè)特征量, 其中,所述第一似然性計(jì)算單元被配置成針對(duì)由所述特征量計(jì)算單元計(jì)算出的各個(gè)特征量,來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算似然性,并且,所述第一似然性計(jì)算單元被配置成基于針對(duì)各個(gè)特征量的似然性,來(lái)計(jì)算所述第一似然性,并且,其中,所述第二似然性計(jì)算單元被配置成針對(duì)由所述特征量計(jì)算單元計(jì)算出的各個(gè)特征量,來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算似然性,并且,所述第二似然性計(jì)算單元被配置成基于針對(duì)各個(gè)特征量的似然性,來(lái)計(jì)算所述第二似然性。
4.根據(jù)權(quán)利要求1至權(quán)利要求3所述的模式識(shí)別裝置,其中,所述預(yù)定對(duì)象是人物的面部,并且,所述特定對(duì)象是特定人物的面部。
5.一種用于模式識(shí)別的方法,該方法包括以下步驟 計(jì)算輸入模式的特征量;通過(guò)參照基于預(yù)定對(duì)象的特征量的分布而生成的對(duì)象字典,基于所計(jì)算出的特征量, 來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算第一似然性;基于所述第一似然性,來(lái)確定所述輸入模式是否是所述預(yù)定對(duì)象的; 如果確定所述輸入模式是所述預(yù)定對(duì)象的,則通過(guò)參照基于所述預(yù)定對(duì)象中的特定對(duì)象的特征量的分布而生成的特定對(duì)象字典,基于所計(jì)算出的特征量,來(lái)對(duì)于所述輸入模式是否是所述特定對(duì)象的計(jì)算第二似然性;以及基于所述第二似然性,來(lái)確定所述輸入模式是否是所述特定對(duì)象的。
6.一種計(jì)算機(jī)可執(zhí)行程序,用于使計(jì)算機(jī)執(zhí)行操作,所述操作包括 計(jì)算輸入模式的特征量;通過(guò)參照基于預(yù)定對(duì)象的特征量的分布而生成的對(duì)象字典,基于所計(jì)算出的特征量, 來(lái)對(duì)于所述輸入模式是否是所述預(yù)定對(duì)象的計(jì)算第一似然性;基于所述第一似然性,來(lái)確定所述輸入模式是否是所述預(yù)定對(duì)象的; 如果確定所述輸入模式是所述預(yù)定對(duì)象的,則通過(guò)參照基于所述預(yù)定對(duì)象中的特定對(duì)象的特征量的分布而生成的特定對(duì)象字典,基于所計(jì)算出的特征量,來(lái)對(duì)于所述輸入模式是否是所述特定對(duì)象的計(jì)算第二似然性;以及基于所述第二似然性,來(lái)確定所述輸入模式是否是所述特定對(duì)象的。
7. 一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其存儲(chǔ)根據(jù)權(quán)利要求6所述的計(jì)算機(jī)可執(zhí)行程序。
全文摘要
在模式識(shí)別裝置中,特征量計(jì)算單元計(jì)算如下的特征量,該特征量用于從輸入模式中剪取的部分圖像中識(shí)別期望的對(duì)象,似然性計(jì)算單元通過(guò)參照對(duì)象字典,根據(jù)由特征量計(jì)算單元計(jì)算出的特征量,來(lái)計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性,并且,對(duì)象確定單元基于由似然性計(jì)算單元計(jì)算出的對(duì)象的似然性,來(lái)確定該部分圖像是否是作為識(shí)別目標(biāo)的對(duì)象。似然性計(jì)算單元通過(guò)參照特定對(duì)象字典,根據(jù)由特征量計(jì)算單元計(jì)算出的特征量,來(lái)計(jì)算作為識(shí)別目標(biāo)的對(duì)象的似然性。對(duì)象確定單元基于由似然性計(jì)算單元計(jì)算出的對(duì)象的似然性,來(lái)確定該部分圖像是否是作為識(shí)別目標(biāo)的特定對(duì)象。
文檔編號(hào)G06T1/00GK102422325SQ20108002109
公開(kāi)日2012年4月18日 申請(qǐng)日期2010年5月6日 優(yōu)先權(quán)日2009年5月11日
發(fā)明者矢野光太郎 申請(qǐng)人:佳能株式會(huì)社