本發(fā)明屬于人機交互
技術領域:
,尤其涉及一種中控系統(tǒng)。
背景技術:
:隨著人工智能行業(yè)的發(fā)展,語音交互已經比較普遍。在現(xiàn)有的中控系統(tǒng)中通常使用語音識別技術進行語音交互。然而由于語音識別技術的性能受到許多因素的影響,如不同說話人的發(fā)音方式、說話方式、環(huán)境噪音、傳輸信道衰落等,導致現(xiàn)有中控系統(tǒng)對語音的識別度較低。故,有必要提出一種新的技術方案,以解決上述技術問題。技術實現(xiàn)要素:鑒于此,本發(fā)明實施例提供一種中控系統(tǒng),以解決現(xiàn)有中控系統(tǒng)對語音的識別度較低的問題。本發(fā)明實施例的第一方面,提供一種中控系統(tǒng),所述中控系統(tǒng)包括:處理器、麥克風陣列、語音處理模塊以及終端,其中,所述麥克風陣列包括至少兩個麥克風;所述處理器分別與所述語音處理模塊以及終端連接;所述麥克風陣列與所述語音處理模塊連接;所述麥克風陣列,用于采集語音信息,并將所述語音信息發(fā)送給所述語音處理模塊;所述語音處理模塊,用于對接收到的所述語音信息進行處理,并將處理后的所述語音信息發(fā)送給所述處理器;所述處理器,用于在接收到所述語音信息后,根據(jù)所述語音信息控制所述終端執(zhí)行相應的操作。本發(fā)明實施例與現(xiàn)有技術相比存在的有益效果是:本發(fā)明實施例通過采用包括處理器、麥克風陣列、語音處理模塊以及終端的中控系統(tǒng),使得麥克風陣列采集語音信息,并將所述語音信息發(fā)送給所述語音處理模塊,所述語音處理模塊對接收到的所述語音信息進行處理,并將處理后的所述語音信息發(fā)送給所述處理器,所述處理器在接收到所述語音信息后,根據(jù)所述語音信息控制所述終端執(zhí)行相應的操作,進而提高了中控系統(tǒng)的抗干擾能力和穩(wěn)定性,解決了現(xiàn)有中控系統(tǒng)對語音的識別度較低的問題。附圖說明為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例一提供的一種中控系統(tǒng)的組成示意圖;圖2是本發(fā)明實施例二提供的一種中控系統(tǒng)的組成示意圖。具體實施方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。實施例一:圖1示出了本發(fā)明實施例一提供的一種中控系統(tǒng)100的組成示意圖,為了便于說明,僅示出了與本發(fā)明實施例相關的部分,詳述如下:如圖1所示,本發(fā)明實施例所提供的中控系統(tǒng)100包括:處理器11、麥克風陣列12、語音處理模塊13以及終端14。其中,所述麥克風陣列12包括至少兩個麥克風。所述處理器11分別與所述語音處理模塊13以及終端14連接。所述麥克風陣列12與所述語音處理模塊13連接。所述麥克風陣列12,用于采集語音信息,并將所述語音信息發(fā)送給所述語音處理模塊13;所述語音處理模塊13,用于對接收到的所述語音信息進行處理,并將處理后的所述語音信息發(fā)送給所述處理器11;所述處理器11,用于在接收到所述語音信息后,根據(jù)所述語音信息控制所述終端14執(zhí)行相應的操作??蛇x的,所述處理器11可以為單片機芯片或ARM芯片。所述終端14可以指家庭環(huán)境中支持智能家居功能的家電。例如家庭環(huán)境中的燈、空調、冰箱、晾衣架、電視機、監(jiān)控裝置、報警裝置、家庭影院裝置、窗簾等,從而可以實現(xiàn)家庭環(huán)境中的燈控制、空調控制、冰箱管理、晾衣架控制、電視機控制、視頻監(jiān)控、安全告警、家庭影院、窗簾控制等。具體地,所述麥克風陣列12具有對遠場噪聲很強的抑制作用,在噪聲環(huán)境中具有良好的信號采集性。所述麥克風陣列12是指按照一定距離排列放置的一組麥克風,通過聲波抵達陣列中每個麥克風之間的微小時差的相互作用,麥克風陣列可以得到比單個麥克風更好的指向性。通過對麥克風信號的綜合處理,麥克風陣列12可以組合成所要求的強指向性麥克風,形成被稱為波束的指向特性。麥克風陣列12的波束可以經由電路或程序處理,使其指向聲源方向加強音頻采集效果,只接收說話人的聲音的同時抑制環(huán)境中的噪聲與干擾。較佳的,所述麥克風陣列12以四個麥克風線性布局,麥克風間距為80mm。在本發(fā)明實施例中,通過所述麥克風陣列12實現(xiàn)語音信號的采集,通過語音處理模塊13完成噪聲的濾除與語音信號的增強,降低了使用距離、環(huán)境噪聲等限制因素對語音信號的影響,從而實現(xiàn)了較好的語音識別??蛇x的,所述處理器11還用于:在接收到喚醒指令后,向用戶發(fā)送準備就緒的提示信息,并在接收到控制指令后,根據(jù)所述控制指令控制所述中控系統(tǒng)執(zhí)行相應的操作。在本發(fā)明實施例中,可以通過多麥克風陣列接收較遠距離(5m內)用戶的語音指令信息,交互設計以及技術應用上提高了操控智能家居電器的方便性以及可靠性。例如早上起床用戶可以說“小Q小Q”(可用戶自定義的喚醒命令),本系統(tǒng)回復“主人,我在呢”,你說“打開窗簾”,然后窗簾在中控系統(tǒng)的操控下緩緩拉起;用戶也可以在家庭影院播放的嘈雜環(huán)境下說“小Q小Q”,本系統(tǒng)回復“主人,我在呢”,你說“音響聲音調小點”,然后該系統(tǒng)操控音響聲音調小。之所以能夠在較遠距離和背景音嘈雜的環(huán)境中進行語音控制,并且具有較好的識別率,取決于本中控系統(tǒng)采用的多麥克風陣列特性以及較好交互方式。。本發(fā)明實施例通過專有的喚醒系統(tǒng)來實現(xiàn)交互行為的發(fā)起,極大程度提高了語音交互系統(tǒng)的對環(huán)境依賴性,交互邏輯簡單可靠,消除用戶適應語音識別節(jié)奏的難度,同時避免了識別時連續(xù)監(jiān)聽對系統(tǒng)資源的要求和功耗負擔。本發(fā)明實施例結合技術現(xiàn)狀和家庭娛樂交互環(huán)境與特點全局考慮,設計出一種低成本且適合嵌入式系統(tǒng)中控系統(tǒng)使用的一套語音交互系統(tǒng),提高了系統(tǒng)的抗干擾能力以及穩(wěn)定性,降低了使用難度,減少了語音交互出錯概率??蛇x的,所述語音處理模塊13包括:信號調理模塊131以及麥克風陣列數(shù)據(jù)處理模塊132;所述信號調理模塊131分別與所述麥克風陣列12和所述麥克風陣列數(shù)據(jù)處理模塊132連接;所述信號調理模塊131,用于在接收到所述麥克風陣列12發(fā)送的語音信息后,對所述語音信息進行第一處理,并將第一處理后的語音信號發(fā)送給所述麥克風陣列數(shù)據(jù)處理模塊132;所述麥克風陣列數(shù)據(jù)處理模塊132,用于在接收到所述第一處理后的語音信息后,對所述第一處理后的語音信息進行第二處理,并將第二處理后的語音信息發(fā)送給所述處理器11,以使得所述處理器11在接收到該語音信息后,根據(jù)該語音信息控制所述終端14執(zhí)行相應的操作。在本發(fā)明實施例中,所述信號調理模塊131包括濾波電路和放大電路。所述麥克風陣列數(shù)據(jù)處理模塊132包括多通道AD采集、DSP數(shù)據(jù)處理和硬件中斷觸發(fā)。具體的,多個麥克風形成的陣列采集語音信號然后對每路信號進行硬件濾波以及信號放大,該信號通過麥克風陣列數(shù)據(jù)處理模塊132,在其中包含AD采集轉換成數(shù)字信號,然后進行算法數(shù)據(jù)處理,最終的信號傳送到處理器11??蛇x的,所述麥克風陣列數(shù)據(jù)處理模塊132的型號可以為科大訊飛XFM10412模塊。該模塊利用麥克風陣列的空域濾波特性,通過對喚醒人的角度定位,形成定向拾音波束,并對波束以外的噪聲進行抑制,以保證較高的錄音質量。主要有以下特性:4麥克風線性麥克風陣列180度聲源定位;語音喚醒;回聲消除;語音打斷;去混響。其中,所述4麥克風線性麥克風陣列支持遠場拾音,所述遠場拾音是指運用遠場識別和降噪技術,使拾音距離達到5米。所述語音喚醒是指用戶通過說出關鍵詞(默認關鍵詞是“靈犀靈犀”),可以將模塊從休眠狀態(tài)喚醒,喚醒后,會有WAKE_UP標志位輸出。所述聲源定位是指利用麥克風陣列,實現(xiàn)180度聲源定位。所述回聲消除是指在播放和錄音同時進行的場景,模塊通過回聲消除技術,可以將揚聲器的聲音屏蔽,只接收用戶的聲音。語音打斷:在設備播音時,仍然可以喚醒,實現(xiàn)打斷效果。本發(fā)明實施例通過采用麥克風陣列采集語音信息,提高了中控系統(tǒng)的抗干擾能力和穩(wěn)定性,解決了現(xiàn)有中控系統(tǒng)對語音的識別度較低的問題。實施例二:圖2示出了本發(fā)明實施例二提供的一種中控系統(tǒng)的組成示意圖,為了便于說明,僅示出了與本發(fā)明實施例相關的部分,詳述如下:如圖2所示,本發(fā)明實施例所示的中控系統(tǒng)200與圖1所示的中控系統(tǒng)100的區(qū)別之處在于本發(fā)明實施例所示的中控系統(tǒng)200還包括:狀態(tài)采集模塊21、指示模塊22、運動控制模塊23、無線模塊24、存儲模塊25以及電源系統(tǒng)26。其中,所述狀態(tài)采集模塊21與所述處理器11連接;所述狀態(tài)采集模塊21用于采集所述中控系統(tǒng)的狀態(tài)信息,并將所述狀態(tài)信息發(fā)送給所述處理器11。具體地,所述狀態(tài)采集模塊21可以對所述中控系統(tǒng)所在環(huán)境和一些交互信息進行檢測,加強其智能性,增強其可玩性,為其娛樂功能服務??蛇x的,所述狀態(tài)采集模塊21包括:溫度傳感器211、光敏傳感器212、加速度傳感器213、紅外傳感器214以及觸摸傳感器215。所述溫度傳感器211,可以采用電阻式溫度傳感器,只要將其布置在電路板位置能表征室溫的地方,室溫的變化就會轉換成電阻變換,再通過A/D采集便可解析出溫度。所述光敏傳感器212,通過光敏器件(如光敏三極管、光敏二極管、光敏電阻等)獲得光線的變化數(shù)據(jù),獲得光敏信號,經處理后發(fā)送至處理器11。所述加速度傳感器213,通過加速度芯片獲得返回x、y、z三軸的加速度數(shù)值,經處理后發(fā)送至處理器11。所述紅外傳感器214,可以采用紅外線反射式傳感器,利用紅外線反射的原理,根據(jù)反射的強度來判定前方是否有障礙。在距離適中時測量精度很高。由于使用的是紅外線,所以抗干擾能力很強,能有效避免中控系統(tǒng)在運動過程中碰撞問題。所述觸摸傳感器215,通過觸摸片獲得觸摸電容的變化數(shù)據(jù),進而獲得觸摸信息,經處理后發(fā)送至處理器11,可以作為和用戶互動的一種方式??蛇x的,所述指示模塊22與所述處理器11連接;所述指示模塊22,用于在接收到所述處理器11發(fā)送的指示信息后,根據(jù)所述指示信息執(zhí)行相應的操作。在本發(fā)明實施例中,所述指示模塊22包括LED驅動電路和LED。LED驅動電路以及LED可以實現(xiàn)燈光效果以及一些指示功能。可選的,所述中控系統(tǒng)200還可以包括提示模塊,所述提示模塊包括音頻放大電路和喇叭。音頻放大電路為喇叭提供相應的功率,使其將音頻信號還原出聲音,來完成提示音,語音回復等相應響應效果??蛇x的,所述運動控制模塊23與所述處理器11連接;所述運動控制模塊23,用于在接收到所述處理器發(fā)送的控制信息后,根據(jù)所述控制信息執(zhí)行相應的操作。其中,所述運動控制模塊23可以包括電機驅動電路和電機,電機驅動電路按照控制邏輯為電機提供相應的驅動功率,使所述運動控制模塊23執(zhí)行相應的移動??蛇x的,所述無線模塊24與所述處理器11連接。在本發(fā)明實施例中,所述無線模塊24包括但不限于zigbee模塊,Z-wave模塊,wifi模塊,藍牙模塊等,用于實現(xiàn)互聯(lián)網的連接以及與終端14之間的通訊。在本發(fā)明實施例中,可以采用標準zigbee以及wifi作為底層通信協(xié)議,應用層通過自定義的私有協(xié)議完成。該自定義私有通信協(xié)議以兩個特定字節(jié)起始,用來判斷傳輸數(shù)據(jù)流中的開始;數(shù)據(jù)長度用來表征一幀中有效數(shù)據(jù)長度;功能碼用以區(qū)別功能大類;數(shù)據(jù)位為有效通信內容,為要傳輸信息的編碼;校驗位為一個字節(jié)的異或校驗,作為數(shù)據(jù)有效性的驗證手段。數(shù)據(jù)結構表1所示:表1通信協(xié)議數(shù)據(jù)結構數(shù)據(jù)頭數(shù)據(jù)長度功能碼數(shù)據(jù)位校驗位Byte0,Byte1Byte2Byte3Byte4-BytenByten+1Byte0,Byte1,表示起始字節(jié),定義為0xF8F8;Byte2表示消息長度,表示包括數(shù)據(jù)頭在內的所有字節(jié)的數(shù)據(jù)長度。Byte3為通訊功能碼,所有消息都由該功能碼進行唯一標識,具體定義如:Byte3=0x00,表示運動控制;Byte3=0x01,表示照明燈控制;Byte3=0x02,表示空調控制;Byte3=0x03,表示晾衣架控制;Byte3=0x04,表示冰箱狀態(tài)讀?。籅yte3=0x05,表示電視機控制;Byte3=0x06,表示監(jiān)控數(shù)據(jù)調??;Byte3=0x07,表示安全告警信息;Byte3=0x08,表示窗簾控制;Byte3=0x09,表示家庭影院控制;Byte3=0x0A-0xff,預留。Byte4…Byten為十六進制有效數(shù)據(jù)編碼,在不同場合長度不一;最后一個字節(jié)Byten+1為校驗碼,這里采用異或校驗,異或校驗的方法如下:unsignedchardata[10]={0x12,0x21,0x1A,0xB1,0xC1,0xEB,0xDF,0xCA,0xF6,0xDD};unsignedcharout;//用于保存異或結果out=0x00;for(i=0;i<sizeof(data)-1;i++){out^=data;}其中,data為需要計算異或校驗的數(shù)據(jù),out為異或校驗結果數(shù)據(jù)發(fā)送順序為從左到逐個字節(jié)發(fā)送,例如,0xf7最先,校驗最后??蛇x的,所述存儲模塊25與所述處理器11連接。在本發(fā)明實施例中,所述存儲模塊25可以與所述處理器11組合形成主系統(tǒng),所述存儲模塊25可以用于存儲所述處理器11接收到的數(shù)據(jù)或者處理的數(shù)據(jù)。其中,所述存儲模塊25可以為雙倍速率同步動態(tài)隨機存儲器(DoubleDataRate,DDR)、FLASH存儲器、TF卡、SD卡等??蛇x的,所述電源系統(tǒng)26與所述處理器11連接;所述電源系統(tǒng)26,用于向所述處理器11供電。具體地,所述電源系統(tǒng)26可以包括電池(如鋰電池)、充電電路和電壓轉換電路,以實現(xiàn)對整個中控系統(tǒng)的供電。所述充電電路對電池進行充電,并提供充電電流限制、充電電壓管控、充電指示等相關的控制與指示。電壓轉換電路,通過電壓轉換電路,如LDO轉換電路,DC-DC轉換電路、PMU電源管理電路等,將輸入的電壓轉換成內部器件所需要的電壓。鋰電池可以采用常規(guī)的聚合物鋰電池。在本發(fā)明實施例的一種實際應用場景中,以用戶發(fā)起一次功能操作為例,首先用戶語音發(fā)起喚醒指令,如“小Q小Q”,系統(tǒng)的語音偵聽系統(tǒng)進行采集解析,判斷是否喚醒指令,如果是,置位中斷引腳,硬件中斷啟動交互系統(tǒng),準備就緒后給出語音提示。同時根據(jù)喚醒指令的波束信息解析出用戶所處的位置,并啟動控制指令的偵聽。當用戶收到準備就緒提示時發(fā)出控制語音指令,如“冰箱里還有什么菜”,系統(tǒng)通過多麥克風陣列采集到語音信息,進行增強與背景音濾除后,處理器進行語音識別,然后指令解析并轉換成控制信號通過運動控制模塊、指示模塊、提示模塊、zigbee模塊、wifi模塊其中之一發(fā)出控制指令代碼給相應執(zhí)行機構或發(fā)送給相應的從設備,進行控制或數(shù)據(jù)獲取。本條指令“冰箱里還有什么菜”,通過wifi模塊,發(fā)送相應命令代碼到wifi接收能力的智能冰箱,然后獲取返回信息,解析后轉換成語音信息通過提示模塊播放出來。所述領域的技術人員可以清楚地了解到,為描述的方便和簡潔,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即所述裝置的內部結構劃分成不同的功能模塊,上述功能模塊既可以采用硬件的形式實現(xiàn),也可以采用軟件的形式實現(xiàn)。另外,各功能模塊的具體名稱也只是為了便于相互區(qū)別,并不用于限制本申請的保護范圍。綜上所述,本發(fā)明實施例通過采用麥克風陣列采集語音信息,提高了中控系統(tǒng)的抗干擾能力和穩(wěn)定性,解決了現(xiàn)有中控系統(tǒng)對語音的識別度較低的問題。本領域普通技術人員還可以理解,實現(xiàn)上述實施例方法中的全部或部分步驟是可以通過程序來指令相關的硬件來完成,所述的程序可以在存儲于一計算機可讀取存儲介質中,所述的存儲介質,包括ROM/RAM、磁盤、光盤等。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內。當前第1頁1 2 3