基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備

文檔序號：40542847發(fā)布日期：2025-01-03 11:02閱讀：9來源：國知局

本申請涉及圖像處理，特別是涉及一種基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備。

背景技術：

1、目前，吸毒檢測技術往往是通過毛發(fā)、血液、尿液等生物檢材對受檢測人員是否吸毒進行識別。但是，這些方法存在以下缺點：（1）采集用于檢測的生物檢材的過程需要受檢測人員密切配合，較為繁瑣，同時受檢測人員會有一定的心理負擔；（2）檢測過程需要用到特殊的化學試劑和專業(yè)設備，成本較高；（3）檢測流程耗時較長，效率不高；（4）不太適用于針對海量人員的吸毒情況進行快速篩查。

2、圖像處理技術在特征檢測上的應用已經(jīng)非常廣泛，通過特征檢測，可以從圖像或視頻序列中提取出關鍵信息，如物體的形狀、顏色、位置等，為后續(xù)的目標識別、行為分析等任務提供支持。同時，隨著深度學習的發(fā)展，出現(xiàn)了利用吸毒者面部痙攣、精神萎靡等面部表情進行吸毒特征檢測的方法，根據(jù)檢測結(jié)果識別毒癮發(fā)作的行為，為戒毒所提供智能化與自動化管理方法。在基于圖像處理技術進行吸毒特征檢測的研究過程中，人們往往僅從面部表情圖像中檢測其中含有的吸毒特征，而很少關注視頻中的其他特征如言語特征，僅依據(jù)面部表情進行吸毒特征檢測會漏掉一些關鍵特征，導致檢測結(jié)果不夠準確。

技術實現(xiàn)思路

1、基于此，有必要針對上述技術問題，提供一種基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備。

2、一種基于多模態(tài)信息的吸毒特征檢測方法，方法包括：

3、輸入待檢測視頻圖像。

4、獲取待檢測視頻圖像中的目標人物的人臉表情圖像和語音信號。

5、對語音信號進行預處理后進行語音特征提取，得到語音模態(tài)特征。

6、采用輕量級深度學習神經(jīng)網(wǎng)絡提取人臉表情圖像的人臉表情模態(tài)特征。

7、根據(jù)語音模態(tài)特征和人臉表情模態(tài)特征，采用交叉注意力機制，得到語音模態(tài)交互特征和人臉表情模態(tài)交互特征。

8、將語音模態(tài)交互特征、人臉表情模態(tài)交互特征、語音模態(tài)特征以及人臉表情模態(tài)特征采用門控機制進行融合，得到多模態(tài)綜合特征。

9、以多模態(tài)綜合特征為輸入，采用雙向長短期記憶網(wǎng)絡為分類器檢測吸毒特征。

10、在其中一個實施例中，對語音信號進行預處理后進行語音特征提取，得到語音模態(tài)特征，包括：

11、對語音信號進行預加重處理后按照預設時間長度進行分割，得到多幀語音信號；

12、對每幀語音信號進行加窗處理，得到每幀預處理后的語音信號；

13、根據(jù)預處理后的語音信號進行語音特征提取，得到多種語音特征；多種語音特征分別為：共振峰、mfcc系數(shù)、基音頻率、短時過零率以及短時能量；

14、將所有語音特征進行串聯(lián)拼接，得到語音模態(tài)特征。

15、在其中一個實施例中，對每幀語音信號進行加窗處理，得到每幀預處理后的語音信號，包括：

16、采用漢明窗對每幀語音信號進行加窗處理，得到每幀預處理后的語音信號。

17、在其中一個實施例中，輕量級深度學習神經(jīng)網(wǎng)絡包括1個標準卷積層、1個權重稀疏化層、3個深度可分離卷積層、1個全局平均池化層以及1個全連接層。

18、在其中一個實施例中，根據(jù)語音模態(tài)特征和人臉表情模態(tài)特征，采用交叉注意力機制，得到語音模態(tài)交互特征和人臉表情模態(tài)交互特征為：

19、;

20、;

21、其中，、分別表示語音模態(tài)交互特征和人臉表情模態(tài)交互特征，為語音模態(tài)特征，為人臉表情模態(tài)特征，、、、、、為六個自適應系數(shù)矩陣，表示點積，表示鍵向量的維度，softmax表示歸一化函數(shù)，、分別表示語音模態(tài)特征和人臉表情模態(tài)特征的查詢向量，，，、分別表示語音模態(tài)特征和人臉表情模態(tài)特征的鍵矩陣，，，、分別表示語音模態(tài)特征和人臉表情模態(tài)特征的值矩陣，，。

22、在其中一個實施例中，將語音模態(tài)交互特征、人臉表情模態(tài)交互特征、語音模態(tài)特征以及人臉表情模態(tài)特征采用門控機制進行融合，得到多模態(tài)綜合特征為：

23、；

24、其中，為多模態(tài)綜合特征，、分別表示語音模態(tài)交互特征和人臉表情模態(tài)交互特征，為語音模態(tài)特征，為人臉表情模態(tài)特征，表示門控函數(shù)，其定義為， g為門控參數(shù)。

25、一種基于多模態(tài)信息的吸毒特征檢測裝置，裝置包括：

26、多模態(tài)數(shù)據(jù)獲取模塊，用于輸入待檢測視頻圖像；獲取待檢測視頻圖像中的目標人物的人臉表情圖像和語音信號。

27、語音模態(tài)特征提取模塊，用于對語音信號進行預處理后進行語音特征提取，得到語音模態(tài)特征。

28、人臉表情模態(tài)特征提取模塊，用于采用輕量級深度學習神經(jīng)網(wǎng)絡提取人臉表情圖像的人臉表情模態(tài)特征。

29、交互特征提取模塊，用于根據(jù)語音模態(tài)特征和人臉表情模態(tài)特征，采用交叉注意力機制，得到語音模態(tài)交互特征和人臉表情模態(tài)交互特征。

30、多模態(tài)綜合特征提取模塊，用于將語音模態(tài)交互特征、人臉表情模態(tài)交互特征、語音模態(tài)特征以及人臉表情模態(tài)特征采用門控機制進行融合，得到多模態(tài)綜合特征。

31、檢測吸毒特征模塊，用于以多模態(tài)綜合特征為輸入，采用雙向長短期記憶網(wǎng)絡為分類器檢測吸毒特征。

32、一種計算機設備，包括存儲器和處理器，所述存儲器存儲有計算機程序，所述處理器執(zhí)行所述計算機程序時實現(xiàn)以下步驟：

33、輸入待檢測視頻圖像。

34、獲取待檢測視頻圖像中的目標人物的人臉表情圖像和語音信號。

35、對語音信號進行預處理后進行語音特征提取，得到語音模態(tài)特征。

36、采用輕量級深度學習神經(jīng)網(wǎng)絡提取人臉表情圖像的人臉表情模態(tài)特征。

37、根據(jù)語音模態(tài)特征和人臉表情模態(tài)特征，采用交叉注意力機制，得到語音模態(tài)交互特征和人臉表情模態(tài)交互特征。

38、將語音模態(tài)交互特征、人臉表情模態(tài)交互特征、語音模態(tài)特征以及人臉表情模態(tài)特征采用門控機制進行融合，得到多模態(tài)綜合特征。

39、以多模態(tài)綜合特征為輸入，采用雙向長短期記憶網(wǎng)絡為分類器檢測吸毒特征。

40、上述基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備，屬于圖像處理技術，所述方法對視頻圖像進行處理，提取視頻圖像中的目標人物的人臉表情圖像和語音信號，利用語音信號和人臉表情圖像兩種模態(tài)，基于深度學習的方式對吸毒特征進行檢測。利用的語音和人臉表情圖像的采集都是非接觸式的，受檢測人員沒有抵觸心理，且采集過程簡單高效；使用交叉注意力機制融合語音模態(tài)特征和人臉表情模態(tài)特征，使得模型更關注重要的特征再進行特征增強融合，從而增強每種模態(tài)的表示能力，提高吸毒特征提取的準確性。將本方法用于吸毒人員檢測，使檢測過程達到秒級，提高檢測效率，適用于針對海量人員的吸毒情況進行快速篩查。

技術特征：

1.一種基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，所述方法包括：

2.根據(jù)權利要求1所述的基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，對所述語音信號進行預處理后進行語音特征提取，得到語音模態(tài)特征，包括：

3.根據(jù)權利要求2所述的基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，對每幀語音信號進行加窗處理，得到每幀預處理后的語音信號，包括：

4.根據(jù)權利要求1所述的基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，所述輕量級深度學習神經(jīng)網(wǎng)絡包括1個標準卷積層、1個權重稀疏化層、3個深度可分離卷積層、1個全局平均池化層以及1個全連接層。

5.根據(jù)權利要求1所述的基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，根據(jù)所述語音模態(tài)特征和所述人臉表情模態(tài)特征，采用交叉注意力機制，得到語音模態(tài)交互特征和人臉表情模態(tài)交互特征為：

6.根據(jù)權利要求1所述的基于多模態(tài)信息的吸毒特征檢測方法，其特征在于，將所述語音模態(tài)交互特征、所述人臉表情模態(tài)交互特征、所述語音模態(tài)特征以及所述人臉表情模態(tài)特征采用門控機制進行融合，得到多模態(tài)綜合特征為：

7.一種基于多模態(tài)信息的吸毒特征檢測裝置，其特征在于，所述裝置包括：

8.一種計算機設備，包括存儲器和處理器，所述存儲器存儲有計算機程序，其特征在于，所述處理器執(zhí)行所述計算機程序時實現(xiàn)權利要求1至6中任一項所述的基于多模態(tài)信息的吸毒特征檢測方法。

技術總結(jié)
本申請屬于圖像處理技術領域，涉及一種基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備。所述方法基于深度學習的方式對吸毒特征進行檢測；利用的語音和人臉表情圖像的采集都是非接觸式的，受檢測人員沒有抵觸心理，且采集過程簡單高效；使用交叉注意力機制融合語音模態(tài)特征和人臉表情模態(tài)特征，使得模型更關注重要的特征再進行特征增強融合，從而增強每種模態(tài)的表示能力，提高吸毒特征提取的準確性。將本方法用于吸毒人員檢測，使檢測過程達到秒級，提高檢測效率，適用于針對海量人員的吸毒情況進行快速篩查。

技術研發(fā)人員：張明鍵,朱鵬亮,唐如
受保護的技術使用者：湖南警察學院
技術研發(fā)日：
技術公布日：2025/1/2

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：張明鍵,朱鵬亮,唐如
技術所有人：湖南警察學院
我是此專利的發(fā)明人

上一篇：一種神經(jīng)內(nèi)科檢查裝置
上一篇：一種35mm線掃鏡頭及光學系統(tǒng)的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備

基于多模態(tài)信息的吸毒特征檢測方法、裝置和計算機設備