基于隨機森林分類器的分類方法及裝置的制造方法
【技術領域】
[0001]本公開是關于分類領域,具體來說是關于一種基于隨機森林分類器的分類方法及
目.0
【背景技術】
[0002]隨機森林分類器由多個決策樹構(gòu)成,具有分類結(jié)果準確、訓練過程快速等特點,可以廣泛應用于圖像分類。
[0003]實際應用中,為了保證隨機森林分類器的準確率,通常會在訓練出隨機森林分類器之后,應用該隨機森林分類器對測試樣本進行分類測試,得到測試樣本的分類結(jié)果,根據(jù)該測試樣本的分類結(jié)果和該測試樣本實際所屬的類別,對該隨機森林分類器進行調(diào)整。也即是,獲取隨機森林分類器的過程通??梢园ㄒ韵虏襟E:
[0004]1、根據(jù)多個訓練樣本,訓練出隨機森林分類器:
[0005]對多個訓練樣本進行特征提取,得到多個訓練樣本的特征向量,再采用隨機森林算法,對多個特征向量進行訓練,得到模型文件,該模型文件中包括多個決策樹以及每個決策樹中每個節(jié)點的分裂維度和分裂條件,該多個決策樹即可組成隨機森林分類器。
[0006]2、應用訓練出的隨機森林分類器,對測試樣本進行分類,得到分類結(jié)果:
[0007]對該測試樣本的每個區(qū)域進行特征提取,得到該測試樣本所有區(qū)域的特征向量,將所有區(qū)域的特征向量組合成一個特征向量,則組合得到的特征向量中包括該測試樣本在所有維度上的特征值。之后,在該隨機森林分類器中的每個節(jié)點上,根據(jù)該節(jié)點的分裂維度,從該測試樣本的特征向量中提取在該分裂維度上的特征值,根據(jù)該節(jié)點的分裂條件對該特征值進行判斷,從而確定該測試樣本需要進入的下一層節(jié)點,在下一層節(jié)點中繼續(xù)進行上述計算特征值及根據(jù)分裂條件進行判斷的過程,直至進入該隨機森林分類器的最后一層,得到該測試樣本的分類結(jié)果。
【發(fā)明內(nèi)容】
[0008]為了解決相關技術中存在的問題,本公開提供了一種基于隨機森林分類器的分類方法及裝置。所述技術方案如下:
[0009]根據(jù)本公開實施例的第一方面,提供了一種基于隨機森林分類器的分類方法,所述方法包括:
[0010]獲取已訓練的隨機森林分類器中的多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件,所述分裂維度索引用于唯一確定分裂維度,所述分裂維度和所述分裂條件用于從對應節(jié)點的分支節(jié)點中確定待遍歷的下一節(jié)點;
[0011]根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值;
[0012]根據(jù)所述第一節(jié)點的分裂條件對所述特征值進行判斷,根據(jù)判斷結(jié)果從所述第一節(jié)點的分支節(jié)點中確定待遍歷的第二節(jié)點;
[0013]根據(jù)當前所確定節(jié)點的分裂維度索引和分裂條件,繼續(xù)提取所述樣本圖像的特征值并確定待遍歷的下一節(jié)點,直至獲取到所述樣本圖像的分類結(jié)果。
[0014]在另一實施例中,所述獲取已訓練的隨機森林分類器中的多個決策樹以及每個決策樹中節(jié)點的分裂維度索引和分裂條件,包括:
[0015]獲取已訓練的隨機森林分類器的模型文件,所述模型文件中至少包括所述多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。
[0016]在另一實施例中,所述根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值,包括:
[0017]根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,確定所述分裂維度索引對應的區(qū)域位置索引和偏置位置索引,所述區(qū)域位置索引用于確定所述第一節(jié)點的分裂維度對應的提取區(qū)域的位置,所述偏置位置索引用于確定所述分裂維度對應的細胞單元在所述提取區(qū)域中的位置,每個提取區(qū)域包括多個細胞單元;
[0018]根據(jù)所述區(qū)域位置索引,對所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域進行特征提取,得到特征向量,并從所述特征向量中提取所述偏置位置索引對應的特征值,作為所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值。
[0019]在另一實施例中,所述根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,確定所述分裂維度索引對應的區(qū)域位置索引和偏置位置索引,包括:
[0020]對所述分裂維度索引與提取區(qū)域的總維度數(shù)目之間的商值進行取整運算,得到整數(shù)商值,將所述整數(shù)商值加I后得到的數(shù)值作為所述分裂維度索引對應的區(qū)域位置索引;[0021 ]根據(jù)所述分裂維度索引,對所述總維度數(shù)目進行取余運算,得到所述分裂維度索引對應的偏置位置索引。
[0022]在另一實施例中,所述根據(jù)所述區(qū)域位置索引,對所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域進行特征提取,得到特征向量,包括:
[0023]確定所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域;
[0024]采用預設特征提取算法,對所述提取區(qū)域進行特征提取,得到特征向量。
[0025]在另一實施例中,所述確定所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域,包括:
[0026]根據(jù)預設對應關系,確定所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域,所述預設對應關系包括每個提取區(qū)域?qū)膮^(qū)域位置索引。
[0027]在另一實施例中,所述預設特征提取算法為方向梯度直方圖HOG特征提取算法。
[0028]根據(jù)本公開實施例的第二方面,提供了一種基于隨機森林分類器的分類裝置,所述裝置包括:
[0029]獲取模塊,用于獲取已訓練的隨機森林分類器中的多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件,所述分裂維度索引用于唯一確定分裂維度,所述分裂維度和所述分裂條件用于從對應節(jié)點的分支節(jié)點中確定待遍歷的下一節(jié)點;
[0030]特征提取模塊,用于根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值;[0031 ]分裂模塊,用于根據(jù)所述第一節(jié)點的分裂條件對所述特征值進行判斷,根據(jù)判斷結(jié)果從所述第一節(jié)點的分支節(jié)點中確定待遍歷的第二節(jié)點;
[0032]循環(huán)模塊,用于根據(jù)當前所確定節(jié)點的分裂維度索引和分裂條件,繼續(xù)提取所述樣本圖像的特征值并確定待遍歷的下一節(jié)點,直至獲取到所述樣本圖像的分類結(jié)果。
[0033]在另一實施例中,所述獲取模塊還用于獲取已訓練的隨機森林分類器的模型文件,所述模型文件中至少包括所述多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件。
[0034]在另一實施例中,所述特征提取模塊包括:
[0035]確定單元,用于根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,確定所述分裂維度索引對應的區(qū)域位置索引和偏置位置索引,所述區(qū)域位置索引用于確定所述第一節(jié)點的分裂維度對應的提取區(qū)域的位置,所述偏置位置索引用于確定所述分裂維度對應的細胞單元在所述提取區(qū)域中的位置,每個提取區(qū)域包括多個細胞單元;
[0036]提取單元,用于根據(jù)所述區(qū)域位置索引,對所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域進行特征提取,得到特征向量,并從所述特征向量中提取所述偏置位置索引對應的特征值,作為所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值。
[0037]在另一實施例中,所述確定單元還用于對所述分裂維度索引與提取區(qū)域的總維度數(shù)目之間的商值進行取整運算,得到整數(shù)商值,將所述整數(shù)商值加I后得到的數(shù)值作為所述分裂維度索引對應的區(qū)域位置索引;根據(jù)所述分裂維度索引,對所述總維度數(shù)目進行取余運算,得到所述分裂維度索引對應的偏置位置索引。
[0038]在另一實施例中,所述提取單元還用于確定所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域;采用預設特征提取算法,對所述提取區(qū)域進行特征提取,得到特征向量。
[0039]在另一實施例中,所述提取單元還用于根據(jù)預設對應關系,確定所述樣本圖像中與所述區(qū)域位置索引對應的提取區(qū)域,所述預設對應關系包括每個提取區(qū)域?qū)膮^(qū)域位置索引。
[0040]在另一實施例中,所述預設特征提取算法為方向梯度直方圖HOG特征提取算法。[0041 ]根據(jù)本公開實施例的第三方面,提供了一種基于隨機森林分類器的分類裝置,所述裝置包括:
[0042]處理器;
[0043]用于存儲處理器可執(zhí)行指令的存儲器;
[0044]其中,所述處理器被配置為:
[0045]獲取已訓練的隨機森林分類器中的多個決策樹以及每個決策樹中至少一層節(jié)點的分裂維度索引和分裂條件,所述分裂維度索引用于唯一確定分裂維度,所述分裂維度和所述分裂條件用于從對應節(jié)點的分支節(jié)點中確定待遍歷的下一節(jié)點;
[0046]根據(jù)所述隨機森林分類器中第一節(jié)點的分裂維度索引,對待測試的樣本圖像進行特征提取,得到所述樣本圖像在所述第一節(jié)點的分裂維度上的特征值;
[0047]根據(jù)所述第一節(jié)點的分裂條件對所述特征值進行判斷,根據(jù)判斷結(jié)果從所述第一節(jié)點的分支節(jié)點中確定待遍歷的第二節(jié)點;
[0048]根據(jù)當前所確定節(jié)點的分裂維度索引和分裂條件,繼續(xù)提取所述樣本圖像的特征值并確定待遍歷的下一節(jié)點,直至獲取到所述樣本圖像的分類結(jié)果。
[0049]本公開的實施例提供的技術方案可以包括以下有益效果:
[0050]本實施例提供的方法及裝置,通過根據(jù)隨機森林分類器中第一節(jié)點的分裂維度索弓I,對待測試的樣本圖像進行特征提取,得到該樣本圖像在該第一節(jié)點的分裂維度上的特征值,根據(jù)該第一節(jié)點的分裂條件對該特征值進行判斷,從而確定待遍歷的第二節(jié)點,以此類推,直至獲取到該樣本圖像的分類結(jié)果,無需預先計算出樣本圖像在所有維度上的特征值,避免了進行不必要的計算,大大減小了計算量,提高了測試速度。
[0051]應當理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性的,并不能限制本公開。
【附圖說明】
[0052]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本公開的實施例,并與說明書