專利名稱:模式識別方法、參數(shù)學(xué)習(xí)方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種諸如圖像識別的用于識別輸入信號的模 式的參數(shù)學(xué)習(xí)方法和使用該參數(shù)學(xué)習(xí)方法的模式識別方法。
背景技術(shù):
作為用于將輸入數(shù)據(jù)分類成預(yù)定類的模式識別方法,迄今 為止已提出了諸如字符識別、臉部4全測和步態(tài)認(rèn)證的許多技術(shù), 并且為了達到提高處理速度和增強分類精度的目標(biāo),仍在提出各種新技術(shù)。例如,Viola & Jones (2001) "Rapid Object Detection using a Boosted Cascade of Simple Features", Computer Vision and Pattern identification (以下稱之為文獻l)才是出了通過4吏用可 以在短時間內(nèi)進行計算的弱分類方法組合基于AdaBoost的學(xué)習(xí) 方法和用于級聯(lián)弱分類器的技術(shù)來實現(xiàn)高速、高精度的模式識 別方法。還提出了另一方法,在該方法中,以樹狀結(jié)構(gòu)連接弱分類 器來實現(xiàn)分類成三個或更多個類的分類。例如,根據(jù)Huang, Ai, Li & Lao (2005) "Vector Boosting for Rotation Invariant Multi-View Face Detection", International Conference on Computer Vision (以下稱之為文獻2),學(xué)習(xí)標(biāo)記有方向和傾斜度 的臉部圖像,檢測測試圖像中的臉部,并且確定該臉部的方向 和傾斜度。如上所述,提出了用于對輸入圖像進行高速、高精度的模 式識別的技術(shù)。例如,需要高速、高精度地識別在輸入圖像中 有無臉部或有無特定模式(紋理),以利用攝像設(shè)備很好地拍攝 人臉部的圖像,或者校正臉部圖像。然而,如上所述的傳統(tǒng)技 術(shù)不令人滿意。 發(fā)明內(nèi)容考慮到上述情況做出本發(fā)明,并且本發(fā)明的目的是實現(xiàn)用 于高速、高精度地識別屬于兩個類中的任何 一 個類的輸入數(shù)據(jù) 的模式識別處理。根據(jù)本發(fā)明的一方面, 一種模式識別方法,用于通過依次 執(zhí)行多個分類處理的組合將輸入數(shù)據(jù)分類成第 一 類或第二類,其中,所述多個分類處理中的至少一個分類處理包括映射步驟,用于在n維特征空間中將所述輸入數(shù)據(jù)映射為對 應(yīng)點,其中,n是等于或大于2的整數(shù);判斷步驟,用于基于在所述映射步驟中映射得到的所述對 應(yīng)點在所述n維特征空間中的位置,判斷是所述輸入數(shù)據(jù)屬于所 述第一類還是應(yīng)當(dāng)執(zhí)行下一分類處理;以及選擇步驟,用于當(dāng)在所述判斷步驟中判斷為應(yīng)當(dāng)執(zhí)行下一 分類處理時,基于所述對應(yīng)點的所述位置,選擇接下來應(yīng)當(dāng)執(zhí) 行的分類處理。根據(jù)本發(fā)明的另一方面, 一種參數(shù)學(xué)習(xí)方法,用于學(xué)習(xí)用 于將輸入數(shù)據(jù)分類為第 一 類或第二類的模式識別的參數(shù),所述 參數(shù)學(xué)習(xí)方法包括輸入步驟,用于輸入被標(biāo)記為所述第一類或所述第二類的 多個學(xué)習(xí)數(shù)據(jù)項;映射步驟,用于在n維特征空間中將所述學(xué)習(xí)數(shù)據(jù)項映射為 對應(yīng)點,其中,n是等于或大于l的整數(shù);以及學(xué)習(xí)步驟,用于學(xué)習(xí)用于將所述n維特征空間劃分成均由被 標(biāo)記為同一類的所述對應(yīng)點占據(jù)的特征空間的模式識別參數(shù)。
根據(jù)本發(fā)明的另 一方面, 一種用于模式識別的參數(shù)學(xué)習(xí)方 法,所迷模式識別將輸入數(shù)據(jù)分類為第一類或第二類,所述參 數(shù)學(xué)習(xí)方法包括輸入步驟,用于輸入被標(biāo)記為所述第一類或所述第二類的多個學(xué)習(xí)數(shù)據(jù)項;第一映射步驟,用于在Nr維特征空間中將被標(biāo)記為所述第 二類的多個學(xué)習(xí)數(shù)據(jù)項臨時映射為對應(yīng)點,其中,Nr是等于或 大于l的整數(shù);第一學(xué)習(xí)步驟,用于基于在所述第一映射步驟中映射得到的對應(yīng)點在所述Nr維特征空間中的分布,學(xué)習(xí)用于劃分所述Nr維特征空間的臨時參數(shù);確定步驟,用于基于所述臨時參數(shù),來確定要用于識別的n 維特征空間;第二映射步驟,用于在所述n維特征空間中將被標(biāo)記為所述 第一類的學(xué)習(xí)數(shù)據(jù)項映射為對應(yīng)點;以及第二學(xué)習(xí)步驟,用于基于在所述第二映射步驟中映射得到的對應(yīng)點的分布,學(xué)習(xí)用于劃分所述n維特征空間的參數(shù)。根據(jù)本發(fā)明的另一方面, 一種模式識別設(shè)備,其通過依次 執(zhí)行多個分類處理的組合將輸入數(shù)據(jù)分類為第一類或第二類, 所述模式識別設(shè)備包括映射部件,用于在n維特征空間中將所述輸入數(shù)據(jù)映射為對 應(yīng)點,其中,n是等于或大于2的整數(shù);判斷部件,用于基于由所述映射部件映射得到的所述對應(yīng) 點在所述n維特征空間中的分布,判斷是所述輸入數(shù)據(jù)屬于所述 第一類還是應(yīng)當(dāng)執(zhí)行下一分類處理;以及選擇部件,用于當(dāng)所述判斷部件判斷為應(yīng)當(dāng)執(zhí)行下一分類 處理時,基于所述對應(yīng)點的所述分布,選擇接下來要執(zhí)行的分
類處理。根據(jù)本發(fā)明的另 一方面, 一種學(xué)習(xí)用于模式識別的參數(shù)的 參數(shù)學(xué)習(xí)設(shè)備,所述模式識別將輸入數(shù)據(jù)分類為第 一 類或第二類,所述參數(shù)學(xué)習(xí)設(shè)備包括輸入部件,用于輸入被標(biāo)記為所述第一類或所述第二類的多個學(xué)習(xí)數(shù)據(jù)項;映射部件,用于在n維特征空間中將所述學(xué)習(xí)數(shù)據(jù)項映射為 對應(yīng)點,其中,n是等于或大于l的整數(shù);以及學(xué)習(xí)部件,用于學(xué)習(xí)用于將所述n維特征空間劃分成均由被 標(biāo)記為同一類的對應(yīng)點占據(jù)的特征空間的模式識別參數(shù)。根據(jù)本發(fā)明的另 一方面, 一種學(xué)習(xí)用于模式識別的參數(shù)的 參數(shù)學(xué)習(xí)設(shè)備,所述模式識別將輸入數(shù)據(jù)分類為第 一 類或第二 類,所述參數(shù)學(xué)習(xí)設(shè)備包括輸入部件,用于輸入被標(biāo)記為所述第一類或所述第二類的 多個學(xué)習(xí)數(shù)據(jù)項;第一映射部件,用于在Nr維特征空間中將被標(biāo)記為所述第 二類的多個學(xué)習(xí)數(shù)據(jù)項臨時映射為對應(yīng)點,其中,Nr是等于或大于l的整數(shù);第一學(xué)習(xí)部件,用于基于由所述第一映射部件映射得到的對應(yīng)點在所述Nr維特征空間中的分布,學(xué)習(xí)用于劃分所述Nr維特征空間的臨時參數(shù);確定部件,用于基于所述臨時參數(shù),來確定要用于識別的n 維特征空間;第二映射部件,用于在所述n維特征空間中將被標(biāo)記為所述第一類的學(xué)習(xí)數(shù)據(jù)項映射為對應(yīng)點;以及第二學(xué)習(xí)部件,用于基于由所述第二映射部件映射得到的所述對應(yīng)點的分布,學(xué)習(xí)用于劃分所述n維特征空間的參數(shù)。
通過下面參考附圖對示例性實施例的說明,本發(fā)明的其它 特征將顯而易見。
圖l是用于示出根據(jù)實施例l的信息處理設(shè)備的硬件配置的例子的框圖;圖2是示出根據(jù)實施例1的臉部檢測處理的流程的流程圖; 圖3是以數(shù)據(jù)流圖的形式示出圖2所示的臉部檢測處理的圖;圖4是示出根據(jù)實施例1的模式識別參數(shù)的結(jié)構(gòu)的圖;圖5是示出T2型節(jié)點的數(shù)據(jù)結(jié)構(gòu)的圖;圖6A和6B是詳細(xì)示出圖2的步驟S203的流程圖;圖7是示出根據(jù)實施例1的學(xué)習(xí)過程的流程圖;圖8是示出根據(jù)實施例2的紋理檢測處理的流程的流程圖;圖9是以數(shù)據(jù)流圖的形式示出圖8所示的紋理檢測處理的圖;圖10是示出將根據(jù)實施例2的紋理檢測處理的結(jié)果顯示在顯示器上的例子的圖;圖ll是示出圖8的步驟S213的內(nèi)容的流程圖;圖12是示出根據(jù)實施例2的學(xué)習(xí)中所使用的圖像的例子的圖;以及圖13是示出根據(jù)實施例2的學(xué)習(xí)過程的流程圖。
具體實施方式
現(xiàn)在將根據(jù)附圖詳細(xì)說明本發(fā)明的示例性實施例。 實施例1實施例1示出判斷輸入圖像是否包括臉部的信息處理設(shè)備
的例子。為了簡化本實施例的說明,假定如果輸入圖像中包 括臉部,則該臉部具有預(yù)定大小,并且一皮布置在大致中心的位 置處,如護照照片一樣。當(dāng)然,可以通過掃描或放大/縮小圖像 來檢測位于任何位置處的任意大小的臉部。圖l是用于示出根據(jù)實施例l的信息處理設(shè)備的硬件配置的例子的框圖。在圖1中,附圖標(biāo)記100表示根據(jù)程序執(zhí)行本實 施例中所述的信息處理方法的CPU(中央處理單元)。附圖標(biāo)記 IOI表示存儲由CPU IOO執(zhí)行的程序的程序存儲器。附圖標(biāo)記 102表示RAM,其提供在CPU IOO執(zhí)行程序時臨時存儲各種信息 的存儲器。附圖標(biāo)記103表示硬盤,是用于保存圖像文件和模式 識別參數(shù)等的存儲介質(zhì)。附圖標(biāo)記104表示顯示器,是向用戶提 供本實施例的處理結(jié)果的設(shè)備。附圖標(biāo)記110表示將上述單元連 接到CPU 100的控制總線/數(shù)據(jù)總線。將參考圖2的流程圖來說明如上配置的信息處理設(shè)備所執(zhí) 行的用于檢測臉部的處理的流程。首先,在步驟S201中,CPU 100將圖像數(shù)據(jù)從硬盤103裝載到RAM 102中。將該圖像數(shù)據(jù)作 為二維陣列存儲在RAM 102中。在接下來的步驟S202中,CPU 10 0將通過后面所述的學(xué)習(xí)方法所創(chuàng)建的模式識別參數(shù)從硬盤 103裝載到RAM 102中。在步驟S203中,CPU IOO使用在步驟 S202中所裝載的模式識別參數(shù),判斷由在步驟S201中所裝載的 圖像數(shù)據(jù)所表示的圖像中是否包括臉部。在接下來的步驟S204 中,CPU 100將在步驟S203中所執(zhí)行的臉部檢測的結(jié)果顯示在 顯示器104上。圖3示出以數(shù)據(jù)流圖的形式表示的圖2的處理。圖像205與 保存在硬盤103中的圖像數(shù)據(jù)相對應(yīng)。通過圖像裝載處理201, 將保存在硬盤103中的圖像205存儲在RAM 102中,作為輸入圖 像I(步驟S201)。在硬盤103中保存了模式識別參數(shù)209。在模式 識別參數(shù)裝載處理210中,裝載保存在硬盤103中的模式識別參 數(shù)209,并且將其存儲在RAM 102中,作為模式識別參數(shù)211(步 驟S202)。在檢測處理203中,使用輸入圖像I和模式識別參數(shù)211 判斷輸入圖像I中是否包括臉部,并且將判斷結(jié)果寫入RAM 102 中,作為檢測結(jié)果207(步驟S203)。在檢測結(jié)果顯示處理204中, 將檢測結(jié)果207的內(nèi)容顯示在顯示器104上(步驟S204)?,F(xiàn)在將參考圖4和圖5來說明模式識別參數(shù)211的內(nèi)容。將 在后面說明用于創(chuàng)建模式識別參數(shù)211的方法。如圖4所示,表 示模式識別參數(shù)211的數(shù)據(jù)具有這樣的結(jié)構(gòu)以樹狀結(jié)構(gòu)連接由 T1和T 2表示的兩種類型的節(jié)點。T1型節(jié)點僅連接到 一 個節(jié)點。 T2型節(jié)點連接到多個節(jié)點。由N3表示的節(jié)點屬于T2型節(jié)點。如 上所述,通過依次執(zhí)行多個節(jié)點,即多個分類處理的組合,根 據(jù)本實施例的模式識別處理將輸入數(shù)據(jù)分類成第 一 類(例如,不 包括臉部的圖像)或第二類(例如,包括臉部的圖像)。不管T1型 的類型如何,都可以應(yīng)用本實施例,因此在此省略對T1型節(jié)點 的詳細(xì)說明。作為T1型節(jié)點,例如,可以^吏用如文獻1中所述 的弱分類器,其中,如果判斷為將輸入數(shù)據(jù)分類為第一類,則 終止該處理,如果判斷為將輸入數(shù)據(jù)分類為第二類,則處理進 入下 一 節(jié)點。圖5示出T2型節(jié)點的數(shù)據(jù)結(jié)構(gòu)。將多個該數(shù)據(jù)存儲在以圖1 中的RAM 102為代表的存儲器中。通常,各節(jié)點的數(shù)據(jù)具有不 同值。節(jié)點類型存儲在頂部。在這種情況下,節(jié)點是T2型的節(jié) 點,存儲表示T2的符號作為節(jié)點類型。接著存儲矩形信息。在 矩形信息的頭中,存儲矩形的數(shù)量n(其中,n為等于或大于2的 整數(shù)),隨后是這n個矩形的坐標(biāo)(左上點、右下點)。從而定義 了這n個矩形的位置和大小。將這多個矩形統(tǒng)稱為"矩形組"。接 著存儲后面將說明的用于刪切(censor)的參數(shù)。在刪切參數(shù)的頭
中,存儲閾值e。然后,隨后是分別對應(yīng)于這n個矩形的刪切系 數(shù)。然后跟著是分支目標(biāo)的數(shù)量m和與等于m-l的數(shù)量相對應(yīng)的 分支參數(shù)。在各分支參數(shù)中,類似于刪切參數(shù),存儲其閾值和 與矩形的數(shù)量相對應(yīng)的系數(shù),并且,除此之外,還存儲指向分 支目標(biāo)節(jié)點的指針。在該指針?biāo)甘镜墓?jié)點中,存儲另一節(jié)點 的參數(shù)。最后,存儲指向第m個分支目標(biāo)節(jié)點的另 一指針(指向 最后一個分支目標(biāo)節(jié)點的指針)。在說明用于創(chuàng)建參數(shù)的方法(學(xué)習(xí)方法)之前,對用于使用 該參數(shù)檢測臉部的方法進行說明。圖6A和6B是詳細(xì)示出圖2的 步驟S203(用于檢測圖像中的臉部的處理)的流程圖。首先,在 步驟D01中,CPU 100初始化指針變量p,使得指針變量p指示第 一節(jié)點。在接下來的步驟D02中,檢查p所指示的節(jié)點的類型。 如果p所指示的節(jié)點是Tl型,則處理進入步驟D03。如果p所指 示的節(jié)點是T2型,則處理進入步驟Dll。在步驟D03中,對T1 型節(jié)點執(zhí)行處理,但是該處理是眾所周知的,因此在此省略對 其的詳細(xì)說明。在完成步驟D03的處理之后,在步驟D04中, CPU IOO檢查是否已處理了所有的節(jié)點。如果已處理了所有的 節(jié)點,則處理進入步驟D06,在步驟D06中,CPU IOO將值 TRUE("真")寫入檢測結(jié)果207中。這表示檢測到了臉部。如果 還未處理所有的節(jié)點,則在步驟D05中,CPU100改變指針變量 p,使得指針變量p指示下一節(jié)點。然后,處理返回到步驟D02。另一方面,如果p所指示的節(jié)點是T2型,則在步驟D11中, CPU 100將變量c初始化成0。然后,將步驟D12 ~步驟D15的循 環(huán)重復(fù)與矩形的數(shù)量相對應(yīng)的n次。將表示處于循環(huán)中的矩形的 循環(huán)變量設(shè)置為i。在步驟D13中,CPU IOO從圖5的節(jié)點信息獲 得矩形i的對角線的坐標(biāo)(XiL,yiT)、 (xiR,yiB)。然后,從輸入圖像I 提取與矩形i相對應(yīng)的矩形圖像,并且確定該矩形圖像的亮度值
的和(總值)。將第i個矩形圖像的亮度值的和設(shè)置為bi??梢允?用如文獻l所述的積分圖像(integral image)快速確定bj。在步驟 D14中,CPU 100將通過使bi乘以矩形i的系數(shù)ai所獲得的積加到 變量c。簡而言之,在步驟D12 步驟D15的循環(huán)中所確定的是 下面的內(nèi)禾口、。公式1在步驟D16中,CPU 100判斷內(nèi)積c是否超過圖5的刪切參數(shù)的閾值e。如果內(nèi)積c超過闊值e,則處理進入步驟Di7,在步驟D17中,CPU 100將值FALSE("假")寫入檢測結(jié)果207中。這表示 沒有檢測到臉部,也就是說,輸入圖像I被分類為第一類。因此, 在此終止圖4所示的樹狀結(jié)構(gòu)的處理。如果在步驟D16中判斷為 內(nèi)積c沒有超過閾值e,則處理進入步驟D18,以選擇接下來要 使用的節(jié)點。換而言之,上述處理包括在登記在參數(shù)中的矩形的數(shù)量 為n的情況下,.將從輸入數(shù)據(jù)(輸入圖像I)所獲得的n個部分?jǐn)?shù)據(jù)項(矩形) 中的每一個的特征量(亮度值的和)映射成在n維特征空間中具 有坐標(biāo)(h,b2,…bn)的對應(yīng)點;以及-通過對對應(yīng)點的坐標(biāo)值應(yīng)用例如判別函數(shù)(內(nèi)積的計算), 基于映射得到的對應(yīng)點在n維特征空間中的坐標(biāo)位置,判斷是輸 入圖像I屬于非臉部圖像的第 一 類(應(yīng)當(dāng)停止處理)還是執(zhí)行下 一節(jié)點的分類處理。如果在上述步驟D16中判斷為應(yīng)當(dāng)執(zhí)行下一分類處理(節(jié) 點),則如下將說明的,基于對應(yīng)點的位置選擇接下來要執(zhí)行的
分類處理(節(jié)點)。首先,在步驟D18中,CPU IOO檢查是否已處理了所有的節(jié) 點。如果已處理了所有的節(jié)點,則處理進入步驟D19,在步驟 D19中,CPU 100將值TRUE寫入檢測結(jié)果207中。這表示檢測到 了臉部,也就是說,輸入圖像I被分類為第二類。另 一 方面,如果在步驟D18中判斷為還未處理所有的節(jié)點, 則執(zhí)行從步驟D20開始的循環(huán)。將步驟D20 步驟D27的循環(huán)最 多重復(fù)m-l次。這里,m是圖5的分支目標(biāo)的數(shù)量m。將表示處 于步驟D20 步驟D27的循環(huán)中的分支目標(biāo)的變量設(shè)為k。在該 循環(huán)的步驟D21中,CPU 100將變量c初始化成0。然后,如步驟 D12~步驟D15的循環(huán)一樣,在步驟D22 步驟D25的循環(huán)中確 定下面的內(nèi)積。公式2在該公式中,作為bi值,可以再次使用為上面的公式l的bi 所確定的值。在步驟D26中,檢查內(nèi)積c是否超過閾值0k。如果 內(nèi)積c沒有超過閾值e k ,則繼續(xù)執(zhí)行步驟D 2 0 ~步驟D 2 7的循環(huán)。 如果內(nèi)積c超過閾值9k,則處理進入步驟D28。在步驟D28中, CPU IOO將指向分支目標(biāo)k的指針值分配給指針變量p。然后, 對分支目標(biāo)k的節(jié)點再次開始從步驟D02開始的處理。如果在步 驟D26中判斷為內(nèi)積c沒有超過閾值ek,并且完成了在步驟D27 結(jié)束的循環(huán),則處理進入步驟D30。在步驟D30中,CPU100將 指向圖5的最后一個分支目標(biāo)節(jié)點的指針值分配給指針變量p。 然后,再次開始從步驟D02開始的處理。通過上述處理,依次 處理了圖4所示的樹狀結(jié)構(gòu)的節(jié)點。 將說明用于創(chuàng)建圖4和圖5中所使用的模式識別參數(shù)的學(xué)習(xí)過程。首先,假定準(zhǔn)備了學(xué)習(xí)臉部圖像fj的集合F={fj|j = l..Nf} 和學(xué)習(xí)非臉部圖像gj的集合G={gj|j = l..Ng}。還假定預(yù)先準(zhǔn)備 了如圖5的矩形信息所表示的矩形組cps的集合0={(ps|s=l.。 還々支定預(yù)先確定了圖4的樹狀結(jié)構(gòu),并且已在RAM 102中分配 了用于存儲參數(shù)的存儲區(qū)域。此時,已確定了圖5的各指針值, 因此可以存儲它們。這里,假定已學(xué)習(xí)了圖4中從T1所表示的 節(jié)點到N3所表示的節(jié)點的前一節(jié)點(T2所表示的節(jié)點)的節(jié)點。 為了學(xué)習(xí)T1型節(jié)點,可以^使用如文獻l所述的才支術(shù)。通過應(yīng)用上述檢測處理,在N3前面的節(jié)點中一些學(xué)習(xí)圖像 因為是非臉部圖像而被放棄(刪切),或者通過T2型節(jié)點被發(fā)送 到其它分支目標(biāo)。在節(jié)點N3中,^吏用在N3前面的節(jié)點中未^皮力欠 棄或者未被發(fā)送到其它分支目標(biāo)的臉部圖像f廣的集合 F+={fj+|j = l ..Nf+}和非臉部圖像g廣的集合G+={gj+|j = l..Ng+}來進 行學(xué)習(xí)。這里所使用的"臉部圖像,,是指存在人臉的圖像,"非臉 部圖像,,是指沒有人臉的圖像。圖7示出用于說明該學(xué)習(xí)過程的流程圖。對屬于O的矩形組 (Ps(s-l..Ncp)中的每個重復(fù)步驟C00 步驟C30的循環(huán)的處理。步 驟COl ~步驟C07的循環(huán)是對屬于F+的臉部圖像fj+的處理。對矩 形組cps的各矩形i重復(fù)步驟C03 ~步驟C05的循環(huán)。在步驟C04 中,CPU 100將臉部圖像fj+的矩形i中的像素的總亮度值分配給 三維陣列中的元素bj/。在本實施例中,使用總亮度值作為矩形 的特征量的例子,但是可以使用其它特征量。步驟C10 步驟 C16的循環(huán)是對屬于Gj+的非臉部圖像gj+的處理。類似地,如在 步驟COl ~步驟C07的循環(huán)中一樣,CPU 100將非臉部圖像gj+的 矩形i中的像素的總亮度值分配給三維陣列中的元素bjj。通過 上述處理,可以獲得各臉部圖像f,和各非臉部圖像g/的對應(yīng)點 (bjs/,…,bjsnf)和(bjs^,…,bjs/)在n維空間中的分布。換而言之,對 于作為被標(biāo)記為第 一 類的學(xué)習(xí)數(shù)據(jù)的非臉部圖像gj+和作為被標(biāo)記為第二類的學(xué)習(xí)數(shù)據(jù)的臉部圖像f,,在n維特征空間(n = Ncp) 中映射對應(yīng)點。在步驟C17中,CPU IOO將作為線性判別函數(shù)的LDA應(yīng)用于 這兩個類的分布(通過映射對應(yīng)點所獲得的結(jié)果),以獲得用于 在n維空間中分離這兩個類的超平面。這里所使用的LDA是線性 判別分析的縮寫。將該超平面的法向向量表示為(aA…,anS)。在步驟ci8中,cpu ioo確定閾值e3??梢酝ㄟ^發(fā)現(xiàn)這樣的一個值來確定閾值93:在該值時,在通過精細(xì)地設(shè)置閾值并將該閾值 與2aibi進行比較來對學(xué)習(xí)圖像分類之后,失敗總數(shù)為最小。這 里所使用的"失敗總數(shù)"是"被分類為非臉部圖像的臉部圖像的 總數(shù)"和"被分類為臉部圖像的非臉部圖像的總數(shù)"的和。可選 地,可以確定閾值0s,使得在接近被分類為非臉部圖像的臉部 圖像的預(yù)定比的閾值中,被分類為臉部圖像的非臉部圖像的總 數(shù)最小。在步驟C19中,CPU 100從為各矩形組(ps所確定的閾值65中 選擇失敗總數(shù)最小的s,并且將其設(shè)為s,??蛇x地,可以選擇被 分類為臉部圖像的非臉部圖像的總數(shù)最小的s。將與s'相對應(yīng)的 對應(yīng)點(a/,…,a/)和其閾值es'分別設(shè)置為圖5的刪切參數(shù)(a^…,an) 和閾值e。這樣就學(xué)習(xí)了n維特征空間中的模式識別參數(shù),該模 式識別參數(shù)劃分被標(biāo)記為同 一 類的對應(yīng)點所占據(jù)的特征空間。 這里,假定滿足下面的公式的空間對應(yīng)于F+,不滿足下面的 公式的空間對應(yīng)于G+。公式3<formula>formula see original document page 18</formula>
在該公式中,bi為第i個對應(yīng)點的坐標(biāo)值。如果未能獲得上 述關(guān)系,則可以反轉(zhuǎn)法向向量的方向。在步驟C20中,CPU IOO通過聚類來將通過直到此時的處理 所獲得的臉部圖像的對應(yīng)點(bjslf,-,bjsnf)的分布劃分成m個群 集。換而言之,將4皮標(biāo)記為同一類的對應(yīng)點分成多個群集。m 是為節(jié)點N3預(yù)先確定的值。 一個群集對應(yīng)于一個分支目標(biāo)。作 為聚類方法,可以使用k平均法(k-means)等。作為聚類的結(jié)果,將所有臉部圖像fi+與群集C!........ Cm中的任意一個相關(guān)聯(lián)。對各分支目標(biāo)k重復(fù)步驟C21 ~步驟C24的循環(huán)。在每次循環(huán)后 將k加l。在該循環(huán)的步驟C22中,利用根據(jù)LDA的超平面分離 與屬于兩個類Ck和Ck^U…UCm的臉部圖像相對應(yīng)的對應(yīng)點。然 后,將這樣所獲得的超平面的法向向量作為(aw,…,akn)存儲在圖 5的相應(yīng)區(qū)域中。隨后,在步驟C23中,例如,確定失敗總數(shù)最 小的閾值0k。這里,假定滿足下面的公式的空間對應(yīng)于Ck,不滿足下面的公式的空間對應(yīng)于Ck+iU…UCm。這樣,在步驟C21 ~ C24中,就學(xué)習(xí)了將被標(biāo)記為同 一類的學(xué)習(xí)數(shù)據(jù)的對應(yīng)點 進一 步分成多個群集的模式識別參數(shù)(分離參數(shù)學(xué)習(xí)),并且使 用該模式識別參數(shù)作為圖5中的分支目標(biāo)的參數(shù)。公式4另夕卜,可以反專爭該法向向量的方向。如上所述,根據(jù)實施例l,可以通過計算負(fù)荷相對小的處 理,檢測輸入圖^象中所包括的臉部。在本實施例中,使用臉部 作為具體例子,但是本實施例可用于^r測諸如頭部或車輛的其 它物體。在如級聯(lián)弱分類器的文獻l所述的檢測器中,已知重要 的是在早期階段刪切較多的非臉部圖像。考慮到此,在本實施 例中,即使采用分支結(jié)構(gòu),也選擇打算刪切的矩形組,并且使 用它進行分支。因此,實現(xiàn)了高速、高精度的模式識別。 實施例2實施例2說明用于從輸入圖像檢測具有特定紋理的物體的信息處理設(shè)備的例子。與實施例l不同,在實施例2中,待4全測的物體可以不位于輸入圖^象的預(yù)定位置。此外,在實施例l中,需要預(yù)先確定矩形組的集合,然而在實施例2中,通過僅準(zhǔn)備用作元素候選項的矩形,并設(shè)置單個矩形組中所包括的矩形的數(shù) 量,自動生成在識別處理中各節(jié)點所使用的矩形組。為了簡化,實施例2對二叉樹進行說明,但是根據(jù)實施例1可以容易地想到, 可以將本實施例應(yīng)用于多叉樹。根據(jù)實施例2的信息處理設(shè)備與實施例1的信息處理設(shè)備 具有相同的硬件配置(圖l)。因此,對各單元的說明應(yīng)當(dāng)參考實 施例1。圖8示出說明用于檢測紋理的處理的流程的流程圖。首先, 在步驟S211中,CPU 100將圖像從硬盤103裝載到RAM 102中。 將圖像作為二維陣列存儲在RAM 102中。在步驟S212中,CPU 10 0將通過后面所述的學(xué)習(xí)方法所創(chuàng)建的模式識別參數(shù)從硬盤 103裝載到RAM 102中。在步驟S213中,CPU100使用在前一步 驟中所裝載的模式識別參數(shù),對在步驟S 211中所裝載的圖像搜 索存在預(yù)定紋理的區(qū)域。在步驟S214中,CPU IOO將搜索結(jié)果 顯示在顯示器104上。圖9示出以數(shù)據(jù)流圖的形式所表示的圖8的處理。附圖標(biāo)記 225表示保存在圖1的硬盤103中的圖像。在圖像裝載處理221中, 將保存在硬盤中的圖像225存儲在RAM 102中,作為輸入圖像I (步驟S211)。附圖標(biāo)記229表示保存在硬盤103中的模式識別參
數(shù)。在模式識別參數(shù)裝載處理230中,將保存在硬盤中的模式識 別參數(shù)229存儲在RAM 102中,作為模式識別參數(shù)231 (步驟 S212)。在搜索處理223中,利用輸入圖像I和模式識別參數(shù)231, 在輸入圖像I中進行預(yù)定紋理的搜索,并且將發(fā)現(xiàn)預(yù)定紋理的位 置寫入RAM102中,作為搜索結(jié)果227(步驟S213)。在本實施例 中,將不包括預(yù)定紋理的區(qū)域分類為第一類,將包括預(yù)定紋理 的區(qū)域分類為第二類。搜索結(jié)果227是黑白值的二維陣列。在搜 索結(jié)果顯示處理224中,將搜索結(jié)果227的內(nèi)容顯示在顯示器104 上(步驟S214)。圖10示出顯示在顯示器104上的信息的例子。這僅是用于 說明實施例2的操作的示意圖,并且本實施例不是必須提供圖10 所示的結(jié)果。在左邊的區(qū)域1001中,顯示輸入圖像I的內(nèi)容。在 右邊的區(qū)域1002中,顯示搜索結(jié)果227的內(nèi)容。在區(qū)域1002中所 示的搜索結(jié)果中,以黑色示出存在輸入圖像的網(wǎng)格模式的區(qū)域。圖ll是示出圖8的步驟S213(用于搜索圖像中的模式的處理) 的內(nèi)容的流程圖。在步驟LOl ~ L07的循環(huán)中,對輸入圖像I上 的各點(x, y)重復(fù)步驟L02 ~ L06所示的處理。在步驟L02中,CPU IOO剪切出輸入圖像I上的作為目標(biāo)像素的點(x, y)附近的區(qū)域, 作為檢測用圖像R。圖像R的大小與后面所述的學(xué)習(xí)圖像的大小 相同。步驟L03是檢測處理。除對剪切出的圖像R而不是對輸入 圖像I進行檢測處理之外,該檢測處理與實施例l的圖6A和6B所 示的檢測處理相同。隨后,在步驟L04中,CPU100判斷在步驟 LO 3所獲得的檢測結(jié)果是TRUE還是FAL SE(即,是分類為第二類 還是第一類)。如果判斷為該結(jié)果是TRUE,則處理進入步驟L05, 在步驟L05中,CPU 100將BLACK("黑")寫入搜索結(jié)果227的(x, y)要素(目標(biāo)像素)中。相反,如果在步驟L04中判斷為該結(jié)果是 FALSE,則處理進入步驟L06,在步驟L06中,CPU IOO將WHITE("白")寫入搜索結(jié)果M7的(x, y)要素(目標(biāo)像素)中。這 樣,獲得寫入了 WHITE或BLACK的圖像,作為搜索結(jié)果227。接著說明才艮據(jù)實施例2的學(xué)習(xí)過程。根據(jù)實施例2的模式識 別參數(shù)231的內(nèi)容具有與實施例1的圖4和圖5所示的相同結(jié)構(gòu)。 圖12示出用于學(xué)習(xí)的圖像的例子。用于學(xué)習(xí)的所有圖像具有相 同的大小。這些圖像表示需要檢測的模式。相反,作為不需要 檢測的模式,使用通過從圖10的區(qū)域10 01所示的輸入圖像的背 景中進行剪切所獲得的圖像。將包括需要檢測的模式的學(xué)習(xí)圖像表示為Pj,并且將該學(xué) 習(xí)圖像的集合表示為P-(Pj[hl,…,Np)。同樣,將不包括需要檢 測的模式的學(xué)習(xí)圖像表示為qj,并且將該學(xué)習(xí)圖像的集合表示為Q^qjlhl,…,Nq)。此外,將由圖5中的矩形坐標(biāo)(XiL,yiT)、 (xiR,ym)所表示的矩形表示為ri ,并且將該矩形的集合表示為 R={ri|i=l,'-,>U。假定預(yù)先確定了圖4的樹狀結(jié)構(gòu),并且已在 RAM 102中分配了用于存儲參數(shù)的存儲器。此時,已確定了圖5 的各指針值,因此可以存儲它們。這里,還假定已學(xué)習(xí)了圖4 中的從T1所表示的節(jié)點到N3所表示的節(jié)點的前一節(jié)點的節(jié)點。通過應(yīng)用上述檢測處理,在N3前面的節(jié)點中一些學(xué)習(xí)圖像 因為不包括需要檢測的模式而被放棄(刪切),或者通過T2型節(jié) 點被發(fā)送到其它分支目標(biāo)。因此,在節(jié)點N3中,使用在前面的 節(jié)點中未被放棄或者未被發(fā)送到其它分支目標(biāo)的模式圖像p, 的集合P+={Pj+|j = l..Np+}和非模式圖像qj+的集合 Q+={qj+|j = l..Nq+},來進行學(xué)習(xí)。圖13示出根據(jù)實施例2的學(xué)習(xí)的流程圖。根據(jù)實施例2的學(xué) 習(xí)包括.第一映射處理和第一學(xué)習(xí)處理,其中,使用臨時的矩形組 臨時映射學(xué)習(xí)數(shù)據(jù),以學(xué)習(xí)參數(shù),并且提取要使用的矩形組; 以及.第二映射處理和第二學(xué)習(xí)處理,其中,使用所提取的矩形 組映射學(xué)習(xí)數(shù)據(jù),以學(xué)習(xí)參數(shù)。通過步驟TOl ~步驟T08的處理,通過第一映射處理和第一 學(xué)習(xí)處理來選擇被推測為對于確定分支目標(biāo)有效的矩形組。通 過步驟TIO ~ T18的處理,通過第二映射處理和第二學(xué)習(xí)處理確 定刪切參數(shù)。通過步驟T21 ~ T24的最后的處理,確定各分支目 標(biāo)的參數(shù)。下面將逐一說明這些步驟。首先,對集合P+的各模式圖像Pi+重復(fù)步驟T01 ~ T07的循 環(huán)。對集合R的各矩形ri重復(fù)上述循環(huán)中的步驟T03 ~ T05的循 環(huán)。在該循環(huán)的步驟T04中,將模式圖像pi+的矩形ri的平均亮度 值存儲在二維陣列的元素b/中。這里應(yīng)該注意,與實施例l不 同,本實施例使用通過利用像素的數(shù)量標(biāo)準(zhǔn)化亮度值所獲得的 值(平均亮度)。因此,可以吸收像素單位之間的差異。上述處 理中所執(zhí)行的映射是用于選擇實際使用的矩形組的臨時映射。 換而言之,步驟TOl ~ T07的處理包括.通過從屬于P+的圖像數(shù)據(jù)(被標(biāo)記為第二類的學(xué)習(xí)數(shù)據(jù))提 取Nr個矩形圖像(其中,Nr是等于或大于l的整數(shù)),來確定特征 量(平均亮度);以及-在Nr維特征空間中臨時映射對應(yīng)點(第一映射)。隨后,在步-驟T20中,CPU IOO將在前一循環(huán)中所確定的Nr維向量(b/,…,bjN/)的分布聚類成多個群集。換而言之,基于 臨時映射的對應(yīng)點在Nr維特征空間中的分布,學(xué)習(xí)劃分Nr維特征空間的臨時模式識別參數(shù)(第一學(xué)習(xí))。因為在該例子中生成二叉樹,因而將分布聚類成2個群集(111= 2)。作為聚類方法,可 以使用k平均法。盡管使用歐幾里德距離來確定向量之間的距離 看似自然,但是還可以使用例如閔可夫斯基(Minkowski)度量。 然后,可以將集合P+中的所有模式圖像分配到群集(d或C2), 從而可以利用SVM(支持向量機)等來獲得分離兩個群集的超平面。將該超平面的Nr維法向向量表示為(a/,…,aNrP)。這里假定 自然數(shù)d和實數(shù)u(u^O)是針對節(jié)點N3預(yù)先確定的常數(shù)。在步驟T08中,CPU IOO從以上獲得的法向向量的元素中, 以大小的降序選擇絕對值,并且在所選擇的元素的和等于或小 于u并等于或大于-u時,或者在所選擇的元素的個數(shù)達到d時, 停止選擇。然后,選擇與所選擇的元素《a。相對應(yīng)的矩形{rj。 如果通過這種方式選擇了 n個矩形,則可以將這些矩形表示為矩 形組9={^|卜1,'—,11}。如上所述,在步驟T20和T08中,使用基 于臨時映射所獲得的臨時參數(shù),來確定在識別處理中節(jié)點所使 用的n維特征空間。隨后,對集合Q+的各非模式圖像qj +重復(fù)步驟T10 T16的循 環(huán)。對先前選擇的矩形組(p的各矩形rj重復(fù)上述循環(huán)中的步驟 T12 T14的循環(huán)。在步驟T13中,將非模式圖像qj +的矩形r^的 總亮度值分配給二維陣列的元素bj^。換而言之,步驟T10 步 驟T16的處理是用于將屬于Q +的圖像數(shù)據(jù)(被標(biāo)記為第 一 類的 學(xué)習(xí)數(shù)據(jù))映射為n維特征空間中的對應(yīng)點的處理。然后,在步驟T17中,計算將(bj/,…,bjnP)的分布與(bjA…,bjnq) 的分布分離的超平面。將這樣獲得的超平面的法向向量作為 (af,an)存儲在圖5的相應(yīng)區(qū)域(刪切參數(shù))中。換而言之,基于 映射得到的對應(yīng)點在n維特征空間中的分布,學(xué)習(xí)劃分n維特征 空間的模式識別參數(shù),并且將模式識別參數(shù)存儲為刪切參數(shù)(第 二學(xué)習(xí))。在步驟T18中,如實施例l的情況一樣,確定刪切參數(shù) 的閾值e。如上所述,根據(jù)步驟T10 T18,將作為被標(biāo)記為第 一類的學(xué)習(xí)數(shù)據(jù)的非模式圖像q/映射為n維特征空間上的對應(yīng) 點。通過這種方式,基于映射得到的對應(yīng)點的分布來學(xué)習(xí)劃分n維特征空間的模式識別參數(shù)。除使用SVM而不是使用LDA來獲取分離群集的超平面以 外,步驟T21 ~步驟T24的處理與實施例l的圖7中的步驟C21 ~ C24的處理相同。聚類時的群集的數(shù)量為2(111 = 2)。如上所述,根據(jù)本實施例,可以通過計算負(fù)荷相對小的處 理,搜索輸入圖像中所包括的預(yù)定模式。即使模式在人看來是 相同的,當(dāng)模式具有不同傾斜度時,在比較像素時也存在很大 的差異。根據(jù)本實施例,可以通過使用不預(yù)先確定矩形組的非 監(jiān)督式的學(xué)習(xí)和分支型的檢測器來吸收該差異。以上已經(jīng)詳細(xì)說明了本發(fā)明的實施例,但是本發(fā)明可以采 用系統(tǒng)、設(shè)備、方法、程序和存儲介質(zhì)等形式。具體地,本發(fā) 明可應(yīng)用于由多個裝置構(gòu)成的系統(tǒng)或由單個裝置構(gòu)成的設(shè)備。本發(fā)明包括這樣的情況通過向系統(tǒng)或設(shè)備直接或遠(yuǎn)程提 供軟件程序,并且通過該系統(tǒng)或設(shè)備中的計算機裝載和執(zhí)行所 提供的程序代碼,來實現(xiàn)上述實施例的功能。在這種情況下, 所提供的程序是與實施例的附圖中所示的流程圖相對應(yīng)的計算 機程序。因此,安裝在計算機中以通過計算機實現(xiàn)本發(fā)明的功能處 理的程序代碼本身同樣實現(xiàn)本發(fā)明。換而言之,實現(xiàn)本發(fā)明的 功能處理的計算機程序本身也落入本發(fā)明的范圍內(nèi)。在這種情況下,可以使用通過目標(biāo)代碼、解釋程序所執(zhí)行 的程序、向OS提供的腳本數(shù)據(jù)等,只要其具有程序的功能??梢杂糜谔峁┰撚嬎銠C程序的計算機可讀存儲介質(zhì)的例 子包括軟盤(floppy⑧)、硬盤、光盤、磁光盤、MO、 CD-ROM、 CD-R 、 CD-RW 、 f茲帶、非易失性存儲卡、ROM以及 DVD(DVD-ROM、 DVD-R)。可選地,使用與因特網(wǎng)網(wǎng)站連接的客戶計算機的瀏覽器,
并且將本發(fā)明的計算機程序從該網(wǎng)站下載到硬盤等記錄介質(zhì), 這可以作為提供該程序的另 一方法。在這種情況下,下載的程 序可以是包含自動安裝功能的壓縮文件。此外,還可以將構(gòu)成 本發(fā)明的程序的程序代碼分成多個文件,并且從不同網(wǎng)站下載 各文件。換而言之,允許多個用戶下載用于通過計算機實現(xiàn)本 發(fā)明的功能處理的程序文件的WWW服務(wù)器也落入本發(fā)明的范 圍內(nèi)。此外,可以加密本發(fā)明的程序,將其存儲在CD-ROM等存 儲介質(zhì)中,并且將其分發(fā)給用戶。在這種情況下,允許滿足預(yù) 定條件的用戶通過因特網(wǎng)從網(wǎng)站下載用于解密的密鑰信息,使 用該密鑰信息執(zhí)行解密程序,并且將該程序安裝在計算機上。另外,除通過使用計算機執(zhí)行所裝載的程序以外,還可以 通過基于該程序的指令與運行在計算機上的OS等的協(xié)作,來實 現(xiàn)本實施例的功能。在這種情況下,OS等執(zhí)行部分或全部實際 處理,并且通過該處理實現(xiàn)上述實施例的功能。此外,將從存儲介質(zhì)裝載的程序?qū)懭胗嬎銠C中安裝的功能 擴展板中或與計算機連接的功能擴展單元中所配置的存儲器 中,從而可以實現(xiàn)上述實施例的部分或全部功能。在這種情況 下,在將該程序?qū)懭牍δ軘U展板或功能擴展單元之后,包括在 該功能擴展板或功能擴展單元中的C P U等基于該程序的指令, 執(zhí)行部分或全部實際處理。根據(jù)本發(fā)明,可以實現(xiàn)用于高速、高精度地識別屬于兩個 類中的任何 一 個類的輸入數(shù)據(jù)的模式識別處理。盡管已經(jīng)參考示例性實施例說明了本發(fā)明,但是應(yīng)該理 解,本發(fā)明不局限于所公開的示例性實施例。所附權(quán)利要求書 的范圍符合最寬的解釋,以包含所有這類修改以及等同結(jié)構(gòu)和 功能。
權(quán)利要求
1. 一種模式識別方法,用于通過依次執(zhí)行多個分類處理的組合將輸入數(shù)據(jù)分類成第一類或第二類,其中,所述多個分類處理中的至少一個分類處理包括映射步驟,用于在n維特征空間中將所述輸入數(shù)據(jù)映射為對應(yīng)點,其中,n是等于或大于2的整數(shù);判斷步驟,用于基于在所述映射步驟中映射得到的所述對應(yīng)點在所述n維特征空間中的位置,判斷是所述輸入數(shù)據(jù)屬于所述第一類還是應(yīng)當(dāng)執(zhí)行下一分類處理;以及選擇步驟,用于當(dāng)在所述判斷步驟中判斷為應(yīng)當(dāng)執(zhí)行下一分類處理時,基于所述對應(yīng)點的所述位置,選擇接下來應(yīng)當(dāng)執(zhí)行的分類處理。
2. 根據(jù)權(quán)利要求l所述的模式識別方法,其特征在于,所述映射步驟包括計算將所述輸入數(shù)據(jù)的n個部分?jǐn)?shù)據(jù)項 中的各部分?jǐn)?shù)據(jù)項的特征量用作坐標(biāo)值的對應(yīng)點。
3. 根據(jù)權(quán)利要求2所述的模式識別方法,其特征在于, 在所述判斷步驟中,通過對所述對應(yīng)點的所述坐標(biāo)值應(yīng)用線性判別函數(shù),來進行關(guān)于是所述輸入數(shù)據(jù)屬于所述第一類還 是應(yīng)當(dāng)執(zhí)行下一分類處理的判斷。
4. 根據(jù)權(quán)利要求2所述的模式識別方法,其特征在于, 所述輸入數(shù)據(jù)是圖像數(shù)據(jù),所述n個部分?jǐn)?shù)據(jù)項是根據(jù)各自的預(yù)定位置和預(yù)定大小從 所述圖像數(shù)據(jù)所提取的矩形圖像,以及所述特征量是各矩形圖像中的亮度的總值或平均值。
5. 根據(jù)權(quán)利要求1到4中任一項所述的模式識別方法,其特 征在于,還包括剪切步驟,用于從輸入圖像剪切目標(biāo)像素的圖像數(shù)據(jù),以 使用所剪切出的圖像數(shù)據(jù)作為所述輸入數(shù)據(jù), 其中,將各目標(biāo)像素判斷為屬于所述第一類或所述第二類。
6. —種參數(shù)學(xué)習(xí)方法,用于學(xué)習(xí)用于將輸入數(shù)據(jù)分類為第一類或第二類的模式識別的參數(shù),所述參數(shù)學(xué)習(xí)方法包括輸入步驟,用于輸入被標(biāo)記為所述第一類或所述第二類的多個學(xué)習(xí)數(shù)據(jù)項;映射步驟,用于在n維特征空間中將所述學(xué)習(xí)數(shù)據(jù)項映射為 對應(yīng)點,其中,n是等于或大于l的整數(shù);以及學(xué)習(xí)步驟,用于學(xué)習(xí)用于將所述n維特征空間劃分成均由被 標(biāo)記為同 一 類的所述對應(yīng)點占據(jù)的特征空間的模式識別參數(shù)。
7. 根據(jù)權(quán)利要求6所述的參數(shù)學(xué)習(xí)方法,其特征在于, 所述映射步驟包括計算將從所述輸入數(shù)據(jù)所獲得的n個部分?jǐn)?shù)據(jù)項的特征量用作坐標(biāo)值的對應(yīng)點。
8. 根據(jù)權(quán)利要求6或7所述的參數(shù)學(xué)習(xí)方法,其特征在于, 在所述學(xué)習(xí)步驟中,通過對所述對應(yīng)點應(yīng)用線性判別函數(shù),學(xué)習(xí)用于將所述n維特征空間劃分成均由被標(biāo)記為同 一類的所 述對應(yīng)點占據(jù)的特征空間的參數(shù)。
9. 根據(jù)權(quán)利要求6或7所迷的參數(shù)學(xué)習(xí)方法,其特征在于, 還包括聚類步驟,用于將被標(biāo)記為同一類的所述對應(yīng)點分成多個 群集;以及分離參數(shù)學(xué)習(xí)步驟,用于學(xué)習(xí)這樣的參數(shù)該參數(shù)用于從 所述n維特征空間的由被標(biāo)記為同 一類的對應(yīng)點占據(jù)的所述特 征空間,分離與所述多個群集中的各群集相對應(yīng)的特征空間。
10. 根據(jù)權(quán)利要求9所述的參數(shù)學(xué)習(xí)方法,其特征在于, 在所述分離參數(shù)學(xué)習(xí)步驟中,通過對所述對應(yīng)點應(yīng)用線性判別函數(shù),學(xué)習(xí)用于分離與所述多個群集中的各群集相對應(yīng)的 特征空間的參數(shù)。
11. 一種用于模式識別的參數(shù)學(xué)習(xí)方法,所述模式識別將輸入數(shù)據(jù)分類為第一類或第二類,所述參數(shù)學(xué)習(xí)方法包括輸入步驟,用于輸入被標(biāo)記為所述第一類或所述第二類的多個學(xué)習(xí)數(shù)據(jù)項;第一映射步驟,用于在Nr維特征空間中將被標(biāo)記為所述第二類的多個學(xué)習(xí)數(shù)據(jù)項臨時映射為對應(yīng)點,其中,Nr是等于或大于l的整數(shù);第一學(xué)習(xí)步驟,用于基于在所述第一映射步驟中映射得到 的對應(yīng)點在所述Nr維特4i空間中的分布,學(xué)習(xí)用于劃分所述Nr 維特征空間的臨時參數(shù);確定步驟,用于基于所述臨時參數(shù),來確定要用于識別的n 維特征空間;第二映射步驟,用于在所迷n維特征空間中將被標(biāo)記為所述 第一類的學(xué)習(xí)數(shù)據(jù)項映射為對應(yīng)點;以及第二學(xué)習(xí)步驟,用于基于在所迷第二映射步驟中映射得到的對應(yīng)點的分布,學(xué)習(xí)用于劃分所述n維特征空間的參數(shù)。
12. 根據(jù)權(quán)利要求ll所述的參數(shù)學(xué)習(xí)方法,其特征在于, 所述第 一 映射步驟包括計算將所述輸入數(shù)據(jù)的N r個部分?jǐn)?shù)據(jù)項的特征量用作坐標(biāo)的對應(yīng)點。
13. 根據(jù)權(quán)利要求ll所述的參數(shù)學(xué)習(xí)方法,其特征在于, 所述第二映射步驟包括計算將所述輸入數(shù)據(jù)的n個部分?jǐn)?shù)據(jù)項的特征量用作坐標(biāo)的對應(yīng)點。
14. 根據(jù)權(quán)利要求ll到13中任一項所述的參數(shù)學(xué)習(xí)方法, 其特征在于,在所述第一學(xué)習(xí)步驟中,通過對所述對應(yīng)點應(yīng)用線性判別 函數(shù),學(xué)習(xí)用于劃分所述N r維特征空間的臨時模式識別參數(shù), 以及在所述確定步驟中,基于所述臨時模式識別參數(shù)的元素的值的大小,來確定所述n。
15. —種模式識別設(shè)備,其通過依次執(zhí)行多個分類處理的 組合將輸入數(shù)據(jù)分類為第 一 類或第二類,所述模式識別設(shè)備包 括映射部件,用于在n維特征空間中將所述輸入數(shù)據(jù)映射為對 應(yīng)點,其中,n是等于或大于2的整數(shù);判斷部件,用于基于由所述映射部件映射得到的所述對應(yīng) 點在所述n維特征空間中的分布,判斷是所述輸入數(shù)據(jù)屬于所述第一類還是應(yīng)當(dāng)執(zhí)行下一分類處理;以及選擇部件,用于當(dāng)所述判斷部件判斷為應(yīng)當(dāng)執(zhí)行下一分類處理時,基于所述對應(yīng)點的所述分布,選4奪接下來要執(zhí)行的分 類處理。
16. —種學(xué)習(xí)用于模式識別的參數(shù)的參數(shù)學(xué)習(xí)設(shè)備,所述 模式識別將輸入數(shù)據(jù)分類為第 一 類或第二類,所述參數(shù)學(xué)習(xí)設(shè) 備包括輸入部件,用于輸入被標(biāo)記為所述第一類或所述第二類的 多個學(xué)習(xí)數(shù)據(jù)項;映射部件,用于在n維特征空間中將所述學(xué)習(xí)數(shù)據(jù)項映射為 對應(yīng)點,其中,n是等于或大于l的整數(shù);以及學(xué)習(xí)部件,用于學(xué)習(xí)用于將所述n維特征空間劃分成均由被 標(biāo)記為同 一 類的對應(yīng)點占據(jù)的特征空間的模式識別參數(shù)。
17. —種學(xué)習(xí)用于模式識別的參數(shù)的參數(shù)學(xué)習(xí)設(shè)備,所述 模式識別將輸入數(shù)據(jù)分類為第 一 類或第二類,所述參數(shù)學(xué)習(xí)設(shè) 備包括輸入部件,用于輸入被標(biāo)記為所述第一類或所述第二類的 多個學(xué)習(xí)數(shù)據(jù)項;第一映射部件,用于在Nr維特征空間中將被標(biāo)記為所述第 二類的多個學(xué)習(xí)數(shù)據(jù)項臨時映射為對應(yīng)點,其中,Nf是等于或大于l的整數(shù);第一學(xué)習(xí)部件,用于基于由所述第一映射部件映射得到的對應(yīng)點在所述Nr維特;f正空間中的分布,學(xué)習(xí)用于劃分所述Nr維特征空間的臨時參數(shù);確定部件,用于基于所述臨時參數(shù),來確定要用于識別的n 維特征空間;第二映射部件,用于在所述n維特征空間中將被標(biāo)記為所述第一類的學(xué)習(xí)數(shù)據(jù)項映射為對應(yīng)點;以及第二學(xué)習(xí)部件,用于基于由所述第二映射部件映射得到的所述對應(yīng)點的分布,學(xué)習(xí)用于劃分所述n維特征空間的參數(shù)。
全文摘要
本發(fā)明提供一種模式識別方法、參數(shù)學(xué)習(xí)方法和設(shè)備。在通過依次執(zhí)行多個分類處理的組合將輸入數(shù)據(jù)分類為預(yù)定類的模式識別方法中,至少一個所述分類處理包括映射步驟,用于在N(N≥2)維特征空間中將輸入數(shù)據(jù)映射為對應(yīng)點;判斷步驟,用于基于對應(yīng)點,判斷是否執(zhí)行下一分類處理;以及選擇步驟,用于當(dāng)在判斷步驟中判斷為應(yīng)當(dāng)執(zhí)行下一分類處理時,基于對應(yīng)點選擇接下來要執(zhí)行的分類處理。
文檔編號G06K9/62GK101398900SQ20081014886
公開日2009年4月1日 申請日期2008年9月27日 優(yōu)先權(quán)日2007年9月27日
發(fā)明者佐藤博, 御手洗裕輔, 森克彥, 金田雄司, 鈴木崇士, 鳥居寬 申請人:佳能株式會社