本發(fā)明涉及智能機(jī)器人領(lǐng)域,尤其涉及一種機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置、方法。
背景技術(shù):
隨著科技的發(fā)展,家用機(jī)器人因?yàn)槠渲悄芑絹?lái)越收到人們的歡迎。在對(duì)機(jī)器人進(jìn)行操控的過(guò)程中,如果能運(yùn)用語(yǔ)音與機(jī)器人進(jìn)行交流,讓機(jī)器人明白你在說(shuō)什么,并根據(jù)你的語(yǔ)音指令完成相應(yīng)的動(dòng)作,這成為人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。在現(xiàn)有技術(shù)中,通過(guò)語(yǔ)音識(shí)別技術(shù)就能夠讓機(jī)器人識(shí)別和理解用戶的語(yǔ)音命令,并根據(jù)這些語(yǔ)音命令執(zhí)行相應(yīng)的動(dòng)作。
但是,由于家用機(jī)器人的應(yīng)用場(chǎng)所相對(duì)穩(wěn)定,且每戶家庭所處的環(huán)境又有所不同,所以如何提高對(duì)特定環(huán)境下語(yǔ)音中噪聲的處理以提高識(shí)別效率,成為目前亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,本申請(qǐng)記載了一種機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置,包括:
麥克風(fēng),所述麥克風(fēng)位于所述機(jī)器人底座上,用以接收用戶發(fā)出 的目標(biāo)語(yǔ)音信號(hào);
傳送單元,與所述麥克風(fēng)相連,用以將所述目標(biāo)語(yǔ)音信號(hào)傳送至服務(wù)器的服務(wù)器識(shí)別單元中,并將所述服務(wù)器識(shí)別單元對(duì)所述目標(biāo)語(yǔ)音信號(hào)進(jìn)行識(shí)別處理獲取的服務(wù)器識(shí)別結(jié)果傳送回所述機(jī)器人;
機(jī)器人識(shí)別單元,與所述麥克風(fēng)相連,用以對(duì)所述目標(biāo)語(yǔ)音信號(hào)進(jìn)行識(shí)別處理以獲取所述機(jī)器人識(shí)別結(jié)果;
其中,所述機(jī)器人還包括控制模塊,用以對(duì)所述服務(wù)器識(shí)別結(jié)果和所述機(jī)器人識(shí)別結(jié)果進(jìn)行處理,其中,所述控制模塊包括:
處理單元,分別與所述傳送模塊以及所述機(jī)器人識(shí)別單元相連,用以基于所述服務(wù)器識(shí)別結(jié)果和/或所述機(jī)器人識(shí)別結(jié)果以獲取最終識(shí)別結(jié)果;
啟動(dòng)單元,與所述處理單元相連,用以根據(jù)所述識(shí)別結(jié)果啟動(dòng)相應(yīng)的功能模塊;
相似度獲取單元,分別與所述啟動(dòng)單元、所述傳送模塊以及所述機(jī)器人識(shí)別單元相連,用以獲取所述服務(wù)器識(shí)別結(jié)果和所述機(jī)器人識(shí)別結(jié)果的語(yǔ)音相似度,并根據(jù)所述語(yǔ)音相似度從所述服務(wù)器識(shí)別結(jié)果或所述機(jī)器人識(shí)別結(jié)果中獲取所述語(yǔ)音數(shù)據(jù);
所述裝置還包括:
噪聲判斷單元,分別與所述麥克風(fēng)以及所述傳送單元相連,用以判斷所述目標(biāo)語(yǔ)音信號(hào)中是否存在噪聲;
更新單元,與所述噪聲判斷單元相連,用以根據(jù)所述目標(biāo)語(yǔ)音信號(hào)更新噪聲數(shù)據(jù)庫(kù)并停止識(shí)別處理;
降噪單元,分別與所述噪聲判斷單元、傳送單元以及所述機(jī)器人識(shí)別單元相連,用以在所述噪聲數(shù)據(jù)庫(kù)中選擇對(duì)所述噪聲進(jìn)行降噪處理的噪聲數(shù)據(jù),并根據(jù)所述噪聲數(shù)據(jù)對(duì)所述目標(biāo)語(yǔ)音信號(hào)進(jìn)行降噪處理;
其中,所述更新單元包括:
噪聲對(duì)比子單元,與所述麥克風(fēng)相連,用以將所述目標(biāo)語(yǔ)音信號(hào)與所述噪聲數(shù)據(jù)庫(kù)中的所有噪聲數(shù)據(jù)與所述目標(biāo)語(yǔ)音信號(hào)進(jìn)行比對(duì)以獲取所有的噪聲相似度;
閾值比較子單元,分別與所述噪聲對(duì)比子單元以及噪聲數(shù)據(jù)庫(kù)相連,用以判斷是否所有的噪聲相似度均小于所述噪聲閾值,并當(dāng)所有所述噪聲相似度小于所述噪聲閾值時(shí)將所述目標(biāo)語(yǔ)音信號(hào)存儲(chǔ)至所述噪聲數(shù)據(jù)庫(kù)中。
較佳的,當(dāng)所述功能模塊不需要所述語(yǔ)音數(shù)據(jù)時(shí),將所述服務(wù)器識(shí)別結(jié)果輸入至所述功能模塊以控制所述機(jī)器人完成相應(yīng)的功能。
較佳的,所述處理單元獲得所述服務(wù)器和所述機(jī)器人之間的網(wǎng)絡(luò)通信狀態(tài),以及根據(jù)所述網(wǎng)絡(luò)通信信息來(lái)忽略所述服務(wù)器識(shí)別結(jié)果。
較佳的,當(dāng)根據(jù)所述網(wǎng)絡(luò)通信信息忽略所述服務(wù)器識(shí)別結(jié)果時(shí),所述處理單元根據(jù)所述機(jī)器人識(shí)別結(jié)果獲取所述最終結(jié)果。
較佳的,所述控制模塊從所述服務(wù)器識(shí)別結(jié)果或所述機(jī)器人識(shí)別結(jié)果中獲取所述語(yǔ)音數(shù)據(jù)傳送至所述功能模塊中。
較佳的,所述機(jī)器人識(shí)別單元參考獲取所述服務(wù)器識(shí)別單元識(shí)別所述目標(biāo)語(yǔ)音信號(hào)的數(shù)據(jù)庫(kù)以對(duì)所述目標(biāo)語(yǔ)音信號(hào)進(jìn)行識(shí)別處理。
本發(fā)明還提供了一種機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別方法,所述方法適用于上述的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置
上述技術(shù)方案具有如下優(yōu)點(diǎn)或有益效果:本發(fā)明提出的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置,在通過(guò)相互補(bǔ)充的服務(wù)器識(shí)別單元和機(jī)器人識(shí)別單元的共同處理下而獲取最終識(shí)別結(jié)果的過(guò)程中,通過(guò)預(yù)定的算法選擇和使用具有高可靠性的語(yǔ)音識(shí)別結(jié)果作為最終識(shí)別結(jié)果,從而增強(qiáng)機(jī)器人的語(yǔ)音識(shí)別率。除此之外,為了保證數(shù)據(jù)信息的安全性,當(dāng)在語(yǔ)音識(shí)別后所啟動(dòng)的功能模塊需要語(yǔ)音數(shù)據(jù)時(shí),可以選擇使用機(jī)器人識(shí)別單元獲取的機(jī)器人識(shí)別結(jié)果,來(lái)防止與語(yǔ)音數(shù)據(jù)相關(guān)聯(lián)的服務(wù)器識(shí)別結(jié)果在網(wǎng)絡(luò)傳輸中泄漏。最后,在網(wǎng)絡(luò)通信狀態(tài)出現(xiàn)故障或信號(hào)不佳期間,能夠自動(dòng)忽略服務(wù)器識(shí)別結(jié)果,從而消除從處理單元接收服務(wù)器識(shí)別結(jié)果所需要的延遲,進(jìn)而提高了識(shí)別效率。最后,在獲取目標(biāo)語(yǔ)音信號(hào)之后,首先進(jìn)行去噪處理,以提高識(shí)別準(zhǔn)確率。并且根據(jù)噪聲信號(hào)對(duì)噪聲數(shù)據(jù)庫(kù)實(shí)時(shí)進(jìn)行豐富,以提高去噪效率,從而進(jìn)一步提高語(yǔ)音識(shí)別效率。
附圖說(shuō)明
參考所附附圖,以更加充分的描述本發(fā)明的實(shí)施例。然而,所附附圖僅用于說(shuō)明和闡述,并不構(gòu)成對(duì)本發(fā)明范圍的限制。
圖1a為本發(fā)明中機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置的結(jié)構(gòu)示意圖;
圖1b為本發(fā)明中機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置的另一 結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1a是圖示根據(jù)本公開(kāi)的實(shí)施例的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置的結(jié)構(gòu)示意圖。參考圖1a,機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置可以包括與機(jī)器人通過(guò)網(wǎng)絡(luò)相連接的服務(wù)器,通過(guò)機(jī)器人內(nèi)部識(shí)別裝置和服務(wù)器對(duì)語(yǔ)音共同進(jìn)行識(shí)別處理。簡(jiǎn)言之,本實(shí)施例例提供的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置能夠達(dá)到分布式語(yǔ)音識(shí)別技術(shù)。
服務(wù)器中包括相連的服務(wù)器識(shí)別單元13和服務(wù)器數(shù)據(jù)庫(kù)。服務(wù)器識(shí)別單元13可以參考服務(wù)器數(shù)據(jù)庫(kù)識(shí)別由機(jī)器人傳送來(lái)的目標(biāo)語(yǔ)音信號(hào),在該服務(wù)器數(shù)據(jù)庫(kù)中以一般信息指定信息域。值得指出的是,機(jī)器人通過(guò)麥克風(fēng)11接收用戶發(fā)出的目標(biāo)語(yǔ)音信號(hào)。最終,服務(wù)器識(shí)別單元13可以獲取服務(wù)器識(shí)別結(jié)果。服務(wù)器可以將由服務(wù)器識(shí)別單元13生成的服務(wù)器識(shí)別結(jié)果發(fā)送到機(jī)器人中。
機(jī)器人可以包括麥克風(fēng)11、傳送單元12、服務(wù)器識(shí)別單元13、機(jī)器人識(shí)別單元14、以及控制模塊15。麥克風(fēng)11可以接收用戶的目 標(biāo)語(yǔ)音信號(hào)。機(jī)器人識(shí)別單元14可以參考機(jī)器人數(shù)據(jù)庫(kù)識(shí)別麥克風(fēng)11傳送來(lái)的目標(biāo)語(yǔ)音信號(hào),在該機(jī)器人數(shù)據(jù)庫(kù)中以語(yǔ)音數(shù)據(jù)指定信息域。結(jié)果,機(jī)器人識(shí)別單元14可以生成機(jī)器人識(shí)別結(jié)果。傳送單元12可以通過(guò)麥克風(fēng)11將接收到的目標(biāo)語(yǔ)音信號(hào)發(fā)送到服務(wù)器中的服務(wù)器識(shí)別結(jié)果。另外,在本實(shí)施例中,顯示單元可以顯示與機(jī)器人識(shí)別單元14和服務(wù)器識(shí)別單元13進(jìn)行語(yǔ)音識(shí)別過(guò)程中相關(guān)聯(lián)的各種信息和控制菜單,用戶通過(guò)語(yǔ)音數(shù)據(jù)控制菜單對(duì)相應(yīng)的功能進(jìn)行調(diào)控。另外,控制模塊15可以對(duì)服務(wù)器識(shí)別結(jié)果和機(jī)器人識(shí)別結(jié)果進(jìn)行處理,以控制機(jī)器人語(yǔ)音識(shí)別過(guò)程中的整體操作。
具體來(lái)說(shuō),控制模塊15包括:
處理單元151,分別與傳送模塊以及機(jī)器人識(shí)別單元14相連,用以基于服務(wù)器識(shí)別結(jié)果和/或機(jī)器人識(shí)別結(jié)果以獲取最終識(shí)別結(jié)果;
啟動(dòng)單元152,與處理單元151相連,用以根據(jù)識(shí)別結(jié)果啟動(dòng)相應(yīng)的功能模塊;
相似度獲取單元153,分別與啟動(dòng)單元152、傳送模塊以及機(jī)器人識(shí)別單元14相連,用以獲取服務(wù)器識(shí)別結(jié)果和機(jī)器人識(shí)別結(jié)果的語(yǔ)音相似度,并根據(jù)語(yǔ)音相似度從服務(wù)器識(shí)別結(jié)果或機(jī)器人識(shí)別結(jié)果中獲取語(yǔ)音數(shù)據(jù)。
具體來(lái)說(shuō),先由處理單元151基于服務(wù)器識(shí)別結(jié)果和機(jī)器人識(shí)別結(jié)果中的至少一個(gè)來(lái)獲取最終識(shí)別結(jié)果,然后啟動(dòng)單元152根據(jù)識(shí)別結(jié)果啟動(dòng)相應(yīng)的功能模塊。如果該功能模塊需要語(yǔ)音數(shù)據(jù),則相似度獲取單元153還需要獲取服務(wù)器識(shí)別結(jié)果和機(jī)器人識(shí)別結(jié)果的語(yǔ)音 相似度,并根據(jù)語(yǔ)音相似度從服務(wù)器識(shí)別結(jié)果或機(jī)器人識(shí)別結(jié)果中獲取語(yǔ)音數(shù)據(jù)。
下面,分別對(duì)服務(wù)器識(shí)別單元13和機(jī)器人識(shí)別單元14的語(yǔ)音識(shí)別處理過(guò)程進(jìn)行詳細(xì)描述。為了便于解釋,服務(wù)器識(shí)別單元13和機(jī)器人識(shí)別單元14共同地稱為語(yǔ)音識(shí)別單元,并且服務(wù)器識(shí)別單元13和機(jī)器人數(shù)據(jù)庫(kù)共同地稱為數(shù)據(jù)庫(kù),并且服務(wù)器識(shí)別結(jié)果和機(jī)器人識(shí)別結(jié)果共同地稱為識(shí)別結(jié)果。
在語(yǔ)音識(shí)別單元中,通過(guò)語(yǔ)音識(shí)別算法將目標(biāo)語(yǔ)音信號(hào)與數(shù)據(jù)庫(kù)的信息域分析接收到目標(biāo)語(yǔ)音信號(hào)的意義和上下文。因此,在本實(shí)施例中,首先使用語(yǔ)音至文本(stt)算法,將目標(biāo)語(yǔ)音信號(hào)轉(zhuǎn)換成文本形式的數(shù)據(jù),并將其存儲(chǔ)在數(shù)據(jù)庫(kù)中。
另外,由于麥克風(fēng)11獲取到的目標(biāo)語(yǔ)音信號(hào)可能存在噪聲,而這些噪聲會(huì)對(duì)識(shí)別結(jié)果造成影響,因此在將目標(biāo)語(yǔ)音信號(hào)通過(guò)傳送單元12傳送至服務(wù)器識(shí)別單元13或直接送至機(jī)器人識(shí)別單元14中之前,控制模塊15需要對(duì)目標(biāo)語(yǔ)音信號(hào)進(jìn)行去噪處理。因此,如圖1b所示出的另一機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置的結(jié)構(gòu)示意圖中,識(shí)別裝置還包括噪聲判斷單元16、更新單元17以及降噪單元18。
在進(jìn)行去噪的過(guò)程中,由分別與麥克風(fēng)11以及傳送單元12相連的噪聲判斷單元16對(duì)目標(biāo)語(yǔ)音信號(hào)進(jìn)行判斷,以確認(rèn)其是否包含噪聲。若判斷結(jié)果為該目標(biāo)語(yǔ)音信號(hào)中全部為噪聲,則說(shuō)明該目標(biāo)語(yǔ)音信號(hào)并不能對(duì)機(jī)器人進(jìn)行相應(yīng)的控制,所以無(wú)需再對(duì)其進(jìn)行識(shí)別處理。但是,在該過(guò)程中,可以利用更新單元17對(duì)該噪聲進(jìn)行再次判 斷,若能符合要求,那么利用更新單元17將該噪聲存儲(chǔ)至噪聲數(shù)據(jù)庫(kù)中,以豐富噪聲數(shù)據(jù)庫(kù)中的噪聲數(shù)據(jù)。
由于語(yǔ)音識(shí)別單元利用識(shí)別算法將目標(biāo)語(yǔ)音信號(hào)轉(zhuǎn)換成多個(gè)數(shù)據(jù)。所以,為了更高的提高識(shí)別率,在本實(shí)施例中,語(yǔ)音識(shí)別單元采用多個(gè)數(shù)據(jù)庫(kù),并從多個(gè)數(shù)據(jù)庫(kù)中選擇識(shí)別率最高的結(jié)果作為最終的識(shí)別結(jié)果。
具體來(lái)說(shuō),更新單元17包括噪聲對(duì)比子單元171和閾值比較子單元172。噪聲對(duì)比子單元171和麥克風(fēng)11相連接,用以接收麥克風(fēng)11傳送來(lái)的目標(biāo)語(yǔ)音信號(hào),并將目標(biāo)語(yǔ)音信號(hào)與噪聲數(shù)據(jù)庫(kù)中的所有噪聲數(shù)據(jù)與目標(biāo)語(yǔ)音信號(hào)進(jìn)行比對(duì)以獲取所有的相似度值,然后由語(yǔ)音閾值比較子單元172將所有的相似度值與語(yǔ)音閾值進(jìn)行比較,并當(dāng)所有相似度值小于語(yǔ)音閾值時(shí)將目標(biāo)語(yǔ)音信號(hào)存儲(chǔ)至噪聲數(shù)據(jù)庫(kù)中。這種設(shè)置方式,能夠豐富噪聲數(shù)據(jù)庫(kù)的噪聲數(shù)據(jù),從而提供噪聲處理的準(zhǔn)確率。
在本實(shí)施例中,機(jī)器人識(shí)別單元14可以參考服務(wù)器數(shù)據(jù)庫(kù)識(shí)別接收到的語(yǔ)音,在該服務(wù)器數(shù)據(jù)庫(kù)中以語(yǔ)音數(shù)據(jù)指定信息域,并且機(jī)器人識(shí)別單元14可以將語(yǔ)音識(shí)別結(jié)果傳輸?shù)娇刂颇K15??刂颇K15可以基于處理單元151的最終識(shí)別結(jié)果來(lái)估計(jì)和執(zhí)行與用戶的意圖相對(duì)應(yīng)的功能模塊。例如,當(dāng)麥克風(fēng)11到從用戶接收到的目標(biāo)語(yǔ)音信號(hào)為“打開(kāi)電視機(jī)”時(shí),控制模塊15可以執(zhí)行相應(yīng)的開(kāi)啟電視機(jī)的功能模塊。
本實(shí)施例還提供了一種機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別方法, 所述方法適用于上述的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置。
本實(shí)施例提出的機(jī)器人噪聲數(shù)據(jù)庫(kù)更新及語(yǔ)音識(shí)別裝置,在通過(guò)相互補(bǔ)充的服務(wù)器識(shí)別單元13和機(jī)器人識(shí)別單元14的共同處理下而獲取最終識(shí)別結(jié)果的過(guò)程中,通過(guò)預(yù)定的算法選擇和使用具有高可靠性的語(yǔ)音識(shí)別結(jié)果作為最終識(shí)別結(jié)果,從而增強(qiáng)機(jī)器人的語(yǔ)音識(shí)別率。
除此之外,為了保證數(shù)據(jù)信息的安全性,當(dāng)在語(yǔ)音識(shí)別后所啟動(dòng)的功能模塊需要語(yǔ)音數(shù)據(jù)時(shí),可以選擇使用機(jī)器人識(shí)別單元14獲取的機(jī)器人識(shí)別結(jié)果,來(lái)防止與語(yǔ)音數(shù)據(jù)相關(guān)聯(lián)的服務(wù)器識(shí)別結(jié)果在網(wǎng)絡(luò)傳輸中泄漏。
最后,在網(wǎng)絡(luò)通信狀態(tài)出現(xiàn)故障或信號(hào)不佳期間,能夠自動(dòng)忽略服務(wù)器識(shí)別結(jié)果,從而消除從處理單元151接收服務(wù)器識(shí)別結(jié)果所需要的延遲,進(jìn)而提高了識(shí)別效率。
根據(jù)上述實(shí)施例的配置和方法將不會(huì)以有限的方式應(yīng)用于前述的機(jī)器人,并且每個(gè)實(shí)施例的全部或者部分可以被選擇性地組合,并且被配置成對(duì)其進(jìn)行各種修改。
對(duì)于本領(lǐng)域的技術(shù)人員而言,閱讀上述說(shuō)明后,各種變化和修正無(wú)疑將顯而易見(jiàn)。因此,所附的權(quán)利要求書(shū)應(yīng)看作是涵蓋本發(fā)明的真實(shí)意圖和范圍的全部變化和修正。在權(quán)利要求書(shū)范圍內(nèi)任何和所有等價(jià)的范圍與內(nèi)容,都應(yīng)認(rèn)為仍屬本發(fā)明的意圖和范圍內(nèi)。