本發(fā)明涉及一種頭部的控制系統(tǒng),尤其涉及到一種智能機器人頭部的控制系統(tǒng),主要用于服務(wù)、娛樂和人工智能互動領(lǐng)域。
背景技術(shù):
目前,具有各式各樣的機器人頭部的控制方法,但一般都是具備一些基本和常見的功能,如語音識別,人臉識別和語音播放等基本應(yīng)用功能。多任務(wù)處理方式單一,這樣并無法真正地體現(xiàn)人與人工智能的互動,現(xiàn)有的互動大多數(shù)也僅是停留在基本動作上,互動方式有所局限。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于解決如何讓人與人工智能更好進行互動的問題,讓人工智能更貼近我們的生活,提高精神生活的質(zhì)量,提高控制系統(tǒng)的運行效率?,F(xiàn)提供一種基于智能機器人頭部的控制方法,解決人與人工智能互動局限和效率的控制方式問題。
本發(fā)明的目的通過如下技術(shù)方案實現(xiàn):
一種基于智能機器人頭部的控制系統(tǒng),包括:
控制模塊,用于輸出控制指令激活與控制智能機器人頭部的電機轉(zhuǎn)速和傳感器,控制機器人頭部運動,實現(xiàn)機器人頭部的視覺和語音互動;
視覺處理模塊,用于對攝像頭采集的視頻信息進行人體姿態(tài)識別和人臉識別,并向控制模塊發(fā)送相應(yīng)識別數(shù)據(jù);
語音處理模塊,用于對麥克風(fēng)采集的音頻信息進行語音合成與識別和節(jié)奏識別,并向控制模塊發(fā)送相應(yīng)識別數(shù)據(jù);
麥克風(fēng)控制模塊,用于初始化麥克風(fēng)采集音頻信息;
攝像頭控制模塊,用于初始化攝像頭采集視頻信息。
進一步地,所述控制模塊在激活與控制電機和傳感器時,首先對睡眠的電機和傳感器進行激活喚醒,初始化電機的配置和開啟各項傳感器,然后結(jié)合傳感器解算得到的數(shù)據(jù),最終換算成PWM輸入量對電機進行控制,再結(jié)合PID控制算法進行控制優(yōu)化。
進一步地,所述的傳感器包含陀螺儀、加速度計、壓力傳感器和溫度傳感器,其中,所述陀螺儀和加速度計用于結(jié)合計算出頭部運轉(zhuǎn)的角度和速度,同時通過壓力傳感器和溫度傳感器,實現(xiàn)觸摸傳感,使動作達到與人的仿真效果。
進一步地,所述的視覺處理模塊采用Kinect深度圖像采集和Opencv幀差法相結(jié)合的方式,提高人體姿態(tài)和人臉識別率、識別范圍,實現(xiàn)姿態(tài)模仿、識別跟蹤和表情識別的效果。
進一步地,所述的語音處理模塊采用多麥克風(fēng)陣列,結(jié)合語音合成與識別技術(shù),實現(xiàn)全方位語音信號采集,并能通過聲源定位來確定聲源的方向。
進一步地,所述的語音處理模塊通過音樂能力波形轉(zhuǎn)換為電信號輸出進行節(jié)奏識別,實現(xiàn)電機PWM輸入量隨音樂節(jié)奏而變化。
進一步地,所述麥克風(fēng)模塊還用于檢測麥克風(fēng)設(shè)備的健康狀態(tài);
進一步地,所述攝像頭模塊還用于檢測攝像頭設(shè)備的健康狀態(tài)。
相對于現(xiàn)有技術(shù),本發(fā)明具有如下優(yōu)點和技術(shù)效果:
1)本發(fā)明結(jié)合人工智能識別技術(shù)和控制算法,實現(xiàn)姿態(tài)模仿、識別跟蹤和表情識別互動效果。
2)本發(fā)明結(jié)合麥克風(fēng)陣列語音識別技術(shù)和聲源定位技術(shù),實現(xiàn)語音互動效果。
3)本發(fā)明創(chuàng)新地運用節(jié)奏識別技術(shù),實現(xiàn)電機的轉(zhuǎn)動速度隨音樂節(jié)奏的快慢進行變化。
4)本發(fā)明的各模塊可靈活地利用多線程的方式進行處理,可實現(xiàn)在單個程序中同時運行多個線程完成不同的工作。
附圖說明
圖1為本發(fā)明實施例控制流程圖。
圖2為本發(fā)明實施例的系統(tǒng)原理示意圖。
具體實施方式
為更好地理解本發(fā)明,下面結(jié)合附圖對本發(fā)明的具體實施作進一步說明。
如圖2所示,一種基于智能機器人頭部的控制系統(tǒng),包括:
控制模塊,用于輸出控制指令激活與控制智能機器人頭部的電機轉(zhuǎn)速和傳感器,控制機器人頭部運動,實現(xiàn)機器人頭部的視覺和語音互動;
視覺處理模塊,用于對攝像頭采集的視頻信息進行人體姿態(tài)識別和人臉識別,并向控制模塊發(fā)送相應(yīng)識別數(shù)據(jù);
語音處理模塊,用于對麥克風(fēng)采集的音頻信息進行語音合成與識別和節(jié)奏識別,并向控制模塊發(fā)送相應(yīng)識別數(shù)據(jù);
麥克風(fēng)控制模塊,用于初始化麥克風(fēng)采集音頻信息;
攝像頭控制模塊,用于初始化攝像頭采集視頻信息。
具體而言,本實施例的所述控制模塊在激活與控制電機轉(zhuǎn)速和傳感器時,首先對睡眠的電機和傳感器進行激活喚醒,初始化電機的配置和開啟各項傳感器,然后結(jié)合傳感器解算得到的數(shù)據(jù),最終換算成PWM輸入量對電機進行控制,再結(jié)合PID控制算法進行控制優(yōu)化。換言之,電機和傳感器等設(shè)備先經(jīng)過初始化配置后等待控制命令,接收到控制命令,執(zhí)行相應(yīng)的動作,若沒有接到控制命令,繼續(xù)處于睡眠狀態(tài)(見圖1)。
具體而言,本實施例的所述傳感器包含陀螺儀、加速度計、壓力傳感器和溫度傳感器,其中,所述陀螺儀和加速度計用于結(jié)合計算出頭部運轉(zhuǎn)的角度和速度,同時通過壓力傳感器和溫度傳感器,實現(xiàn)觸摸傳感,使動作達到與人的仿真效果。
具體而言,本實施例的所述視覺處理模塊采用Kinect深度圖像采集和Opencv幀差法相結(jié)合的方式,提高人體姿態(tài)和人臉識別率、識別范圍,實現(xiàn)姿態(tài)模仿、識別跟蹤和表情識別的效果。所述視覺處理模塊結(jié)合人工智能識別技術(shù)和控制算法,以人臉識別技術(shù)為主,實現(xiàn)攝像頭跟隨識別對象進行運動的效果。
具體而言,本實施例的所述的語音處理模塊采用多麥克風(fēng)陣列,結(jié)合語音合成與識別技術(shù),實現(xiàn)全方位語音信號采集,并能通過聲源定位來確定聲源的方向。
具體而言,本實施例的所述的語音處理模塊通過音樂能力波形轉(zhuǎn)換為電信號輸出進行節(jié)奏識別,實現(xiàn)電機PWM輸入量隨音樂節(jié)奏而變化。
具體而言,本實施例的所述麥克風(fēng)模塊還用于檢測麥克風(fēng)設(shè)備的健康狀態(tài),實現(xiàn)對麥克風(fēng)健康狀態(tài)的及時監(jiān)控,保證智能機器人頭部對音頻信息的正常采集。
具體而言,本實施例的所述攝像頭模塊還用于檢測攝像頭設(shè)備的健康狀態(tài),實現(xiàn)對攝像頭健康狀態(tài)的及時監(jiān)控,保證智能機器人頭部對視頻信息的正常采集。
如圖2所示,以上功能的實現(xiàn),基于電機、各種傳感器和各種算法的結(jié)合實現(xiàn)與人的仿真效果。其中,利用陀螺儀、加速度計、壓力傳感器和溫度傳感器等,通過數(shù)據(jù)的解算,實現(xiàn)動作仿真與人的動作一樣的效果。視頻和音頻算法包括PID控制算法、Kinect深度圖像采集算法、Opencv幀差算法、節(jié)奏識別算法等,同時結(jié)合傅里葉變換和AR模型等進行解算。各模塊的運行各線程同時運行并完成不同的任務(wù),相互之間容錯進行采用多線程的方式,相互之間容錯進行。
本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所做的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。