技術(shù)總結(jié)
本發(fā)明適用于計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域,提供了基于視頻的行為識(shí)別方法及裝置,包括:提取所有采樣時(shí)刻視頻幀的深度特征,所述深度特征包括所述采樣時(shí)刻視頻幀中行為的高層語義特征和細(xì)節(jié)特征;基于所述采樣時(shí)刻視頻幀的細(xì)節(jié)特征,獲取用于表達(dá)當(dāng)前時(shí)刻視頻幀的行為的時(shí)空特征;將所述時(shí)空特征與所述高層語義特征一同輸入LSTM模型,以對(duì)所述當(dāng)前時(shí)刻視頻幀進(jìn)行行為識(shí)別。本發(fā)明使時(shí)空特征和高層語義特征互補(bǔ)協(xié)作,以增強(qiáng)RNN識(shí)別復(fù)雜行為的能力。
技術(shù)研發(fā)人員:喬宇;杜文斌;王亞立
受保護(hù)的技術(shù)使用者:中國科學(xué)院深圳先進(jìn)技術(shù)研究院
文檔號(hào)碼:201611239337
技術(shù)研發(fā)日:2016.12.28
技術(shù)公布日:2017.05.24