一起用于解釋本公開的原理。
[0053]圖1是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類方法的流程圖;
[0054]圖2是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類方法的流程圖;
[0055]圖3是根據(jù)一示例性實施例示出的一種隨機森林分類器的決策樹的示意圖;
[0056]圖4是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類裝置的框圖;
[0057]圖5是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類裝置的框圖;
[0058]圖6是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類裝置的框圖;
[0059]圖7是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類裝置的框圖。
【具體實施方式】
[0060]為使本公開的目的、技術(shù)方案和優(yōu)點更加清楚明白,下面結(jié)合實施方式和附圖,對本公開做進一步詳細說明。在此,本公開的示意性實施方式及其說明用于解釋本公開,但并不作為對本公開的限定。
[0061]本公開實施例提供一種基于隨機森林分類器的分類方法及裝置,以下結(jié)合附圖對本公開進行詳細說明。
[0062]圖1是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類方法的流程圖,如圖1所示,基于隨機森林分類器的分類方法用于測試裝置中,包括以下步驟:
[0063]在步驟101中,獲取已訓(xùn)練的隨機森林分類器中的多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。
[0064]其中,該分裂維度索引用于唯一確定分裂維度,該分裂維度和該分裂條件用于從對應(yīng)節(jié)點的分支節(jié)點中確定待遍歷的下一節(jié)點。
[0065]在步驟102中,根據(jù)該隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到該樣本圖像在該第一節(jié)點的分裂維度上的特征值。
[0066]在步驟103中,根據(jù)該第一節(jié)點的分裂條件對該特征值進行判斷,根據(jù)判斷結(jié)果從該第一節(jié)點的分支節(jié)點中確定待遍歷的第二節(jié)點。
[0067]在步驟104中,根據(jù)當(dāng)前所確定節(jié)點的分裂維度索引和分裂條件,繼續(xù)提取該樣本圖像的特征值并確定待遍歷的下一節(jié)點,直至獲取到該樣本圖像的分類結(jié)果。
[0068]隨機森林分類器由多個決策樹組成,而每個決策樹中包括多個節(jié)點,多個節(jié)點之間具有層級關(guān)系。
[0069]其中,對于每個節(jié)點來說,該節(jié)點可以與上一層的某一節(jié)點連接,作為上一層節(jié)點的分支節(jié)點,且該節(jié)點可以與下一層的至少一個分支節(jié)點連接。除最后一層節(jié)點之外的節(jié)點具有分裂維度和分裂條件,該分裂維度和分裂條件用于從節(jié)點的分支節(jié)點中確定樣本圖像需遍歷的下一個節(jié)點,即確定樣本圖像應(yīng)進入下一層的哪個節(jié)點。而最后一層節(jié)點具有對應(yīng)的分類結(jié)果。
[0070]在相關(guān)技術(shù)中,對圖像進行分類時,通常先對該圖像的每個區(qū)域進行特征提取,得到該圖像所有區(qū)域的特征向量,再將所有區(qū)域的特征向量進行組合,得到該圖像的特征向量,將該特征向量輸入到隨機森林分類器中每個決策樹的第一層節(jié)點中,根據(jù)該特征向量以及每一層節(jié)點的分裂維度和分裂條件進行判斷,確定待遍歷的下一個節(jié)點,在下一個節(jié)點中繼續(xù)進行判斷,以此類推,直至確定隨機森林分類器的最后一層節(jié)點,從而確定該圖像在每個決策樹中的分類結(jié)果,根據(jù)多個決策樹的分類結(jié)果確定圖像的最終分類結(jié)果。
[0071]其中,計算樣本圖像的特征向量時,需要對樣本圖像中的每個區(qū)域進行特征提取,得到每個區(qū)域的特征向量,再將所有區(qū)域的特征向量組成一個特征向量,輸入到隨機森林分類器中。而如果提取的特征維度很高,則每個區(qū)域的特征維度都很高,會導(dǎo)致計算量過大,測試速度很慢。
[0072]而且,由于隨機森林分類器具有特征選擇性,在每個節(jié)點處只需對樣本圖像在分裂維度上的特征值進行判斷,而無需關(guān)注樣本圖像在其他維度上的特征值,則預(yù)先計算出樣本圖像在所有維度上的特征值會造成不必要的計算量。
[0073]因此,為了減小計算量,提高測試速度,本實施例中不會預(yù)先計算出樣本圖像在所有維度上的特征值,而是當(dāng)樣本圖像到達當(dāng)前的第一節(jié)點時,確定該第一節(jié)點的分裂維度,從而在對該樣本圖像進行特征提取時,只需對該分裂維度所在的區(qū)域進行特征提取,僅提取該樣本圖像在該分裂維度上的特征值,直接根據(jù)第一節(jié)點的分裂條件對該特征值進行判斷即可。也即是,每當(dāng)?shù)竭_一個節(jié)點時,只需對該節(jié)點的分裂維度所對應(yīng)的一個區(qū)域進行特征提取,而無需對其他區(qū)域進行特征提取,減小了特征維度的數(shù)目,避免了進行不必要的計算,大大減小了計算量,提高了測試速度。
[0074]本實施例提供的方法,通過根據(jù)隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到該樣本圖像在該第一節(jié)點的分裂維度上的特征值,根據(jù)該第一節(jié)點的分裂條件對該特征值進行判斷,從而確定待遍歷的第二節(jié)點,以此類推,直至獲取到該樣本圖像的分類結(jié)果,無需預(yù)先計算出樣本圖像在所有維度上的特征值,避免了進行不必要的計算,大大減小了計算量,提高了測試速度。
[0075]在另一實施例中,該獲取已訓(xùn)練的隨機森林分類器中的多個決策樹以及每個決策樹中節(jié)點的分裂維度索引和分裂條件,包括:
[0076]獲取已訓(xùn)練的隨機森林分類器的模型文件,該模型文件中至少包括該多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。
[0077]在另一實施例中,該根據(jù)該隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到該樣本圖像在該第一節(jié)點的分裂維度上的特征值,包括:
[0078]根據(jù)該隨機森林分類器中第一節(jié)點的分裂維度索引,確定該分裂維度索引對應(yīng)的區(qū)域位置索引和偏置位置索引,該區(qū)域位置索引用于確定該第一節(jié)點的分裂維度對應(yīng)的提取區(qū)域的位置,該偏置位置索引用于確定該分裂維度對應(yīng)的細胞單元在該提取區(qū)域中的位置,每個提取區(qū)域包括多個細胞單元;
[0079]根據(jù)該區(qū)域位置索引,對該樣本圖像中與該區(qū)域位置索引對應(yīng)的提取區(qū)域進行特征提取,得到特征向量,并從該特征向量中提取該偏置位置索引對應(yīng)的特征值,作為該樣本圖像在該第一節(jié)點的分裂維度上的特征值。
[0080]在另一實施例中,該根據(jù)該隨機森林分類器中第一節(jié)點的分裂維度索引,確定該分裂維度索引對應(yīng)的區(qū)域位置索引和偏置位置索引,包括:
[0081]對該分裂維度索引與提取區(qū)域的總維度數(shù)目之間的商值進行取整運算,得到整數(shù)商值,將該整數(shù)商值加I后得到的數(shù)值作為該分裂維度索引對應(yīng)的區(qū)域位置索引;
[0082]根據(jù)該分裂維度索引,對該總維度數(shù)目進行取余運算,得到該分裂維度索引對應(yīng)的偏置位置索引。
[0083]在另一實施例中,該根據(jù)該區(qū)域位置索引,對該樣本圖像中與該區(qū)域位置索引對應(yīng)的提取區(qū)域進行特征提取,得到特征向量,包括:
[0084]確定該樣本圖像中與該區(qū)域位置索引對應(yīng)的提取區(qū)域;
[0085]采用預(yù)設(shè)特征提取算法,對該提取區(qū)域進行特征提取,得到特征向量。
[0086]在另一實施例中,該確定該樣本圖像中與該區(qū)域位置索引對應(yīng)的提取區(qū)域,包括:
[0087]根據(jù)預(yù)設(shè)對應(yīng)關(guān)系,確定該樣本圖像中與該區(qū)域位置索引對應(yīng)的提取區(qū)域,該預(yù)設(shè)對應(yīng)關(guān)系包括每個提取區(qū)域?qū)?yīng)的區(qū)域位置索引。
[0088]在另一實施例中,該預(yù)設(shè)特征提取算法為H0G(Hi stogram of OrientedGradient,方向梯度直方圖)特征提取算法。
[0089]上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本公開的可選實施例,在此不再
--贅述。
[0090]圖2是根據(jù)一示例性實施例示出的一種基于隨機森林分類器的分類方法的流程圖,如圖2所示,基于隨機森林分類器的分類方法用于測試裝置中,包括以下步驟:
[0091]在步驟201中,獲取已訓(xùn)練的隨機森林分類器的模型文件,該模型文件中至少包括該多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。
[0092]其中,該測試裝置用于根據(jù)樣本圖像對隨機森林分類器進行測試,可以為計算機、服務(wù)器等設(shè)備,本實施例對此不做限定。
[0093]該測試裝置可以根據(jù)多張圖像進行訓(xùn)練,獲取到多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件,該多個決策樹即可組成隨機森林分類器。
[0094]或者,還可以由該測試裝置或者其他設(shè)備訓(xùn)練得到隨機森林分類器后,根據(jù)該隨機森林分類器中的多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件,生成模型文件。該測試裝置可以獲取該模型文件,從該模型文件中獲取該多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。本實施例對該測試裝置獲取隨機森林分類器的方式不做限定。
[0095]其中,可以采用隨機森林算法訓(xùn)練隨機森林分類器,具體訓(xùn)練過程在此不再贅述。
[0096]其中,該分裂維度索引用于唯一確定分裂維度,可以為維度的序號或者ID(Identity,序列號)等,該分裂維度索引所屬的范圍為[0,N-1],N為最大維度數(shù)目。本實施例對此不做限定。
[0097]每個節(jié)點的分裂維度和分裂條件用于從對應(yīng)節(jié)點的分支節(jié)點中確定待遍歷的下一節(jié)點,可以通過訓(xùn)練確定。其中,節(jié)點的分裂條件可以包括與該節(jié)點的多個分支節(jié)點分別對應(yīng)的多個條件,或者該分裂條件可以包括分裂函數(shù),根據(jù)該分裂函數(shù)算出的不同計算結(jié)果分別對應(yīng)于該節(jié)點的多個分支節(jié)點。本實施例對此不做限定。
[0098]在步驟202中,根據(jù)該隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到該樣本圖像在該第一節(jié)點的分裂維度上的特征值。
[0099]當(dāng)要對樣本圖像進行測試分類時,需要將樣本圖像輸入到每個決策樹的第一層節(jié)點中,并依次確定待遍歷的下一層節(jié)點,直至遍歷到最后一層節(jié)點時,可以確定該樣本圖像的分類結(jié)果。
[0100]則對于當(dāng)前遍歷到的第一節(jié)點,該測試裝置可以獲取該第一節(jié)點的分裂維度索弓丨,從而確定該第一節(jié)點的分裂維度是哪一