一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法

文檔序號：6512194閱讀：372來源：國知局

一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法
【專利摘要】本發(fā)明公開了一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法包括以下步驟：（1）訓練信息的采集；（2）樣本數(shù)據(jù)正則化處理；（3）特征三維向量集的提??；（4）動作識別及認定。該實現(xiàn)方法采用降精度離散化坐標算法以簡化運動信息表示和減少特征提取算法的計算量，同時采用多層次特征匹配算法以加快識別速度。本發(fā)明的實現(xiàn)方法的邏輯設計及算法簡單合理，可行可靠、易實現(xiàn)。
【專利說明】一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法
【技術領域】
[0001]本發(fā)明屬于計算機工程【技術領域】，涉及了一種基于機器學習的、用于長產生特定人體動作識別器的訓練系統(tǒng)的實現(xiàn)方法。
【背景技術】
[0002]動作識別是近年來非常熱門的研究領域，通過圖像捕捉設備，在較短的時間內完成對人體動作的識別過程，并轉換為計算機等設備的操作指令；從而被作為一種有效的輸入手段被應用到游戲、電影制作等廣泛的應用領域中。
[0003]動作識別首先要解決的問題是找到人體動作的部位，人體動作的部位是動作識別的依據(jù)，一般稱為“關注位置”。因為通常關注位置為人臉、手等裸露的部位，其顏色跟環(huán)境、衣服有比較大的區(qū)別，所以可以從顏色上把關注位置與非關注位置區(qū)分開，對于關注位置的確定，一般采用基于顏色分布統(tǒng)計的色彩直方圖為依據(jù)，具體來說，是將人體動作捕捉為靜態(tài)的待識別圖像，根據(jù)圖像不同區(qū)域(兩區(qū)域中心位置、大小有任意一項不同則這兩個區(qū)域為不同區(qū)域)的顏色統(tǒng)計出色彩直方圖，然后把各區(qū)域的統(tǒng)計直方圖與預設的直方圖做比較，尋找最相似的區(qū)域作為最后的關注位置。
[0004]但這種方法對顏色要求很高，人穿著與膚色相近的衣服、周圍環(huán)境與膚色相近、環(huán)境光色調單一等等因素都會導致識別率大幅下降，且該方法只能獲得所關注位置在圖像的哪個位置，而無法獲得關注位置的具體表達含義。
[0005]為消除顏色對圖像識別的影響，現(xiàn)有的識別技術通常先把待識別圖像轉化為灰度圖，然后對得到的灰度圖進行識別。待識別圖像被轉化為灰度圖后，需要用經過神經網(wǎng)絡等人工智能技術訓練的識別系統(tǒng)從整體中根據(jù)輪廓線條走向、各部分位置關系等特征尋找到關注位置，例如從人的全身像里找到臉或者手。
[0006]目前，在開源計算機視覺庫項目中，采用了一種基于簡單特征級聯(lián)的圖像識別算法，采用該算法的動作識別過程大致可分為兩部分，首先要通過訓練過程生成特征文件，之后通過識別過程根據(jù)生成的特征文件對捕獲的圖像進行識別，得到識別結果。該算法取得了較好的效果，但是其還是存在著一些不足，如特征文件的計算量比較大、識別速度比較慢等。因此，市場上仍需一種計算量少、識別速度快的圖像訓練識別算法。

【發(fā)明內容】

[0007]本發(fā)明的目的在于針對現(xiàn)有技術的不足，提供了一種降精度離散化坐標算法以簡化運動信息表示和減少特征提取算法的計算量，同時采用多層次特征匹配算法以加快識別速度的人體動作識別訓練系統(tǒng)的實現(xiàn)方法。
[0008]為了實現(xiàn)上述目的，本發(fā)明采用了以下技術方案:
一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法，包括以下步驟:
(I)訓練信息的采集:
通過深度探測攝像頭及第三方SDK采集需要被識別的各種動作樣本，并且在將采集到的樣本數(shù)據(jù)進行存儲時，其存儲格式包括以下字段:動作ID(Action ID:1nt32)、動作名稱(Action Name: String)、動作信息幀的對數(shù)(Frame Count:1nteger)、深度信息幀(DepthFrame #n:1nteger Array)和骨豁信息中貞(Skeleton Frame #n:1nteger Array)；
(2)樣本數(shù)據(jù)正則化處理:
a.統(tǒng)一坐標系，即對每幀的深度信息數(shù)據(jù)和骨骼信息數(shù)據(jù)進行坐標變換，將它們統(tǒng)一到同一世界坐標系中；
b.離散化骨骼點坐標，即對當前幀中每個骨骼信息數(shù)據(jù)點坐標進行離散化處理，離散化的步驟為:
i)根據(jù)前后相鄰的各一幀中的同一骨骼點坐標，計算該骨骼點的運動向量；
?)查找該骨骼點對應的目標離散坐標系中的單位立方體；
iii)把該骨骼點的運動向量合成到單位立方體的當前運動向量中；
c.離散化深度信息數(shù)據(jù)坐標，即在離散化骨骼點坐標時，如果該骨骼點為手部點，則將該骨骼點附近的深度數(shù)據(jù)點也進行離散化，離散化后的對應于深度信息數(shù)據(jù)的單位立方體擁有與該骨骼點相同的運動向量；
d.對每一幀重復上述a、b、c步驟,對每一個待識別動作生成一個對應的樣本三維向量
集;
(3)特征三維向量集的提取:
通過訓練樣本數(shù)據(jù)結構中的動作ID，獲知正則化后的樣本三維向量集所對應的人體動作，對于該動作所有的訓練樣本生成的所有三維向量集，都將作為該動作對應的樣本三維向量集；對樣本三維向量集進行特征提取，獲取該動作的特征三維向量集，具體提取算法如下:
a.計算每個三維坐標點在全部三維向量集中出現(xiàn)的次數(shù)；
b.根據(jù)其出現(xiàn)次數(shù)計算其特征系數(shù)，即，特征系數(shù)=三維坐標點出現(xiàn)次數(shù)/該動作三維向量集的個數(shù)；
c.如果特征系數(shù)大于50%，則認為該點的三維向量集屬于特征三維向量集；
(4)動作識別及認定:
對于任意一個待識別的動作，通過步驟(1)、(2)得到它的三維向量集，然后采用以下算法進行識別:
a.快速進行識別
計算該三維向量集與當前系統(tǒng)中所有的特征三維向量的距離，如果該距離小于該特征三維向量所對應的閥值，那么將此特征三維向量對應的動作作為一個候選動作；
b.精細識別
對所有候選動作，根據(jù)距離由小到大進行排序，然后依次對每個候選動作中的樣本三維向量集，計算它與待識別動作的三維向量集的距離，如果其中最小距離小于預設的閥值，那么系統(tǒng)自動認定待識別動作為當前候選動作。
[0009]上述方法中進一步補充說明，所述的深度信息幀中的每個元素都是其對應坐標上的深度信息。
[0010]上述方法中進一步補充說明，所述的骨骼信息幀有人體骨骼點坐標數(shù)據(jù)組成。
[0011]上述方法中進一步補充說明，所述的動作信息幀的對數(shù)是指一個動作中有多少對深度信息幀和骨骼信息幀。
[0012]SDK, Software Development Kit的縮寫，中文即“軟件開發(fā)工具包”。廣義上指輔助開發(fā)某一類軟件的相關文檔、范例和工具的集合。SDK是一些被軟件工程師用于為特定的軟件包、軟件框架、硬件平臺、操作系統(tǒng)等創(chuàng)建應用軟件的開發(fā)工具的集合，一般而言SDK即開發(fā)Windows平臺下的應用程序所使用的SDK。它可以簡單的為某個程序設計語言提供應用程序接口 API的一些文件，但也可能包括能與某種嵌入式系統(tǒng)通訊的復雜的硬件。一般的工具包括用于調試和其他用途的實用工具。SDK還經常包括示例代碼、支持性的技術注解或者其他的為基本參考資料澄清疑點的支持文檔。
[0013]本發(fā)明是基于由特定的硬件采集的多幀深度圖像數(shù)據(jù)與人體骨骼數(shù)據(jù)，通過本發(fā)明中針對動作識別領域而專門設計的算法，實現(xiàn)一個人體動作訓練與識別系統(tǒng)。
[0014]本發(fā)明的優(yōu)點:
1.在本發(fā)明的實現(xiàn)方法中，對原始數(shù)據(jù)進行降精度離散化處理，這樣不僅能夠減少原始數(shù)據(jù)的噪聲還可以降低運算量，以加快識別速度。
[0015]2.在本發(fā)明的實現(xiàn)方法中，采用了多層次特征匹配算法，進一步加快了動作訓練識別速度。
[0016]3.本發(fā)明的實現(xiàn)方法的邏輯設計及算法簡單合理，可行可靠、易實現(xiàn)。
【專利附圖】

【附圖說明】
[0017]圖1是本發(fā)明中樣本數(shù)據(jù)存儲結構示意圖。
[0018]圖2是本發(fā)明中坐標離散化示意圖。
[0019]圖3是本發(fā)明中動作三維向量集示意圖。
[0020]在圖2、圖3中:A-單位立方體；B-原始坐標中不同的高精度點，經過離散化后，可能會被映射到同一單位立方體中；C-動作離散化后的三維向量集。
【具體實施方式】
[0021 ] 下面結合實施例和附圖對本發(fā)明進一步說明。
[0022]實施例1:
一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法，包括以下步驟:
(1)訓練信息的采集:
通過深度探測攝像頭及第三方SDK采集需要被識別的各種動作樣本，并且在將采集到的樣本數(shù)據(jù)進行存儲時，其存儲格式包括以下字段:動作ID(Action ID:1nt32)、動作名稱(Action Name: String)、動作信息巾貞的對數(shù)(Frame Count:1nteger)、深度信息巾貞(DepthFrame #n:1nteger Array)和骨豁信息中貞(Skeleton Frame #n:1nteger Array)；
(2)樣本數(shù)據(jù)正則化處理:
a.統(tǒng)一坐標系，即對每幀的深度信息數(shù)據(jù)和骨骼信息數(shù)據(jù)進行坐標變換，將它們統(tǒng)一到同一世界坐標系中；
b.離散化骨骼點坐標，即對當前幀中每個骨骼信息數(shù)據(jù)點坐標進行離散化處理，離散化的步驟為:
i)根據(jù)前后相鄰的各一幀中的同一骨骼點坐標，計算該骨骼點的運動向量； ii)查找該骨骼點對應的目標離散坐標系中的單位立方體；
iii)把該骨骼點的運動向量合成到單位立方體的當前運動向量中；
c.離散化深度信息數(shù)據(jù)坐標，即在離散化骨骼點坐標時，如果該骨骼點為手部點，則將該骨骼點附近的深度數(shù)據(jù)點也進行離散化，離散化后的對應于深度信息數(shù)據(jù)的單位立方體擁有與該骨骼點相同的運動向量；
d.對每一巾貞重復上述a、b、c步驟,對每一個待識別動作生成一個對應的樣本三維向量
集;
(3)特征三維向量集的提取:
通過訓練樣本數(shù)據(jù)結構中的動作ID，獲知正則化后的樣本三維向量集所對應的人體動作，對于該動作所有的訓練樣本生成的所有三維向量集，都將作為該動作對應的樣本三維向量集；對樣本三維向量集進行特征提取，獲取該動作的特征三維向量集，具體提取算法如下:
a.計算每個三維坐標點在全部三維向量集中出現(xiàn)的次數(shù)；
b.根據(jù)其出現(xiàn)次數(shù)計算其特征系數(shù)，即，特征系數(shù)=三維坐標點出現(xiàn)次數(shù)/該動作三維向量集的個數(shù)；
c.如果特征系數(shù)大于50%，則認為該點的三維向量集屬于特征三維向量集；
(4)動作識別及認定:
對于任意一個待識別的動作，通過步驟(1)、(2)得到它的三維向量集，然后采用以下算法進行識別:
a.快速進行識別
計算該三維向量集與當前系統(tǒng)中所有的特征三維向量的距離，如果該距離小于該特征三維向量所對應的閥值，那么將此特征三維向量對應的動作作為一個候選動作；
b.精細識別
對所有候選動作，根據(jù)距離由小到大進行排序，然后依次對每個候選動作中的樣本三維向量集，計算它與待識別動作的三維向量集的距離，如果其中最小距離小于預設的閥值，那么系統(tǒng)自動認定待識別動作為當前候選動作。
[0023]上述方法中進一步補充說明，所述的深度信息幀中的每個元素都是其對應坐標上的深度信息。
[0024]上述方法中進一步補充說明，所述的骨骼信息幀有人體骨骼點坐標數(shù)據(jù)組成。
[0025]上述方法中進一步補充說明，所述的動作信息幀的對數(shù)是指一個動作中有多少對深度信息幀和骨骼信息幀。
【權利要求】
1.一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法，其特征在于，該實現(xiàn)方法包括以下步驟: (1)訓練信息的采集: 通過深度探測攝像頭及第三方SDK采集需要被識別的各種動作樣本，并且在將采集到的樣本數(shù)據(jù)進行存儲時，其存儲格式包括以下字段:動作ID、動作名稱、動作信息幀的對數(shù)、深度信息幀和骨骼信息幀； (2)樣本數(shù)據(jù)正則化處理: a.統(tǒng)一坐標系，即對每幀的深度信息數(shù)據(jù)和骨骼信息數(shù)據(jù)進行坐標變換，將它們統(tǒng)一到同一世界坐標系中； b.離散化骨骼點坐標，即對當前幀中每個骨骼信息數(shù)據(jù)點坐標進行離散化處理，離散化的步驟為: i)根據(jù)前后相鄰的各一幀中的同一骨骼點坐標，計算該骨骼點的運動向量； ii)查找該骨骼點對應的目標離散坐標系中的單位立方體； iii)把該骨骼點的運動向量合成到單位立方體的當前運動向量中； c.離散化深度信息數(shù)據(jù)坐標，即在離散化骨骼點坐標時，如果該骨骼點為手部點，則將該骨骼點附近的深度數(shù)據(jù)點也進行離散化，離散化后的對應于深度信息數(shù)據(jù)的單位立方體擁有與該骨骼點相同的運動向量； d.對每一幀重復上述a、b、c步驟,對每一個待識別動作生成一個對應的樣本三維向量集; (3)特征三維向量集的提取: 通過訓練樣本數(shù)據(jù)結構中的動作ID，獲知正則化后的樣本三維向量集所對應的人體動作，對于該動作所有的訓練樣本生成的所有三維向量集，都將作為該動作對應的樣本三維向量集；對樣本三維向量集進行特征提取，獲取該動作的特征三維向量集，具體提取算法如下: a.計算每個三維坐標點在全部三維向量集中出現(xiàn)的次數(shù)； b.根據(jù)其出現(xiàn)次數(shù)計算其特征系數(shù)，即，特征系數(shù)=三維坐標點出現(xiàn)次數(shù)/該動作三維向量集的個數(shù)； c.如果特征系數(shù)大于50%，則認為該點的三維向量集屬于特征三維向量集； (4)動作識別及認定: 對于任意一個待識別的動作，通過步驟(1)、(2)得到它的三維向量集，然后采用以下算法進行識別: a.快速進行識別計算該三維向量集與當前系統(tǒng)中所有的特征三維向量的距離，如果該距離小于該特征三維向量所對應的閥值，那么將此特征三維向量對應的動作作為一個候選動作； b.精細識別對所有候選動作，根據(jù)距離由小到大進行排序，然后依次對每個候選動作中的樣本三維向量集，計算它與待識別動作的三維向量集的距離，如果其中最小距離小于預設的閥值，那么系統(tǒng)自動認定待識別動作為當前候選動作。
2.根據(jù)權利要求1所述的人體動作識別訓練系統(tǒng)的實現(xiàn)方法，其特征在于:所述的深度信息幀中的每個元素都是其對應坐標上的深度信息。
3.根據(jù)權利要求1所述的人體動作識別訓練系統(tǒng)的實現(xiàn)方法，其特征在于:所述的骨骼信息幀有人體骨骼點坐標數(shù)據(jù)組成。
4.根據(jù)權利要求1-3任一所述的人體動作識別訓練系統(tǒng)的實現(xiàn)方法，其特征在于:所述的動作信息幀的對數(shù)是指一個`動作中有多少對深度信息幀和骨骼信息幀。
【文檔編號】G06K9/62GK103489000SQ201310428277
【公開日】2014年1月1日申請日期:2013年9月18日優(yōu)先權日:2013年9月18日
【發(fā)明者】覃祖茂, 劉為, 袁增偉, 杜怡曼, 何佳, 李東娥, 劉曉, 黃益農, 黃華峰申請人:柳州市博源環(huán)科科技有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：覃祖茂;劉為;袁增偉;杜怡曼;何佳;李東娥;劉曉;黃益農;黃華峰
技術所有人：柳州市博源環(huán)科科技有限公司
我是此專利的發(fā)明人

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

人體動作姿態(tài)識別綜述相關技術

手臂訓練10套最佳動作相關技術

python對人體動作識別相關技術

人體動作識別數(shù)據(jù)庫相關技術

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種人體動作識別訓練系統(tǒng)的實現(xiàn)方法