本申請涉及語音處理,具體涉及一種醫(yī)療陪護機器人語音交互識別方法及系統(tǒng)。
背景技術(shù):
1、醫(yī)療陪護機器人是一種新型的多功能服務機器人,它們可以提供服務、安全監(jiān)護以及人機交互等功能,主要用于輔助醫(yī)療護理人員,特別是在照顧老年人、體弱者或有特殊需求的患者方面。為更方便、準確、快捷的輔助醫(yī)療護理人員照顧患者,需要對醫(yī)療陪護機器人中的語音交互功能進行完善。語音交互主要包含語音識別、信息處理、指令匹配、語音合成四大關(guān)鍵模塊。其中語音識別模塊在語音交互中具有重要作用,通過將患者的語音轉(zhuǎn)換為文本數(shù)據(jù),捕捉并理解患者的需求,從而實現(xiàn)人機之間的有效溝通。
2、在傳統(tǒng)的語音增強算法中,譜減法對患者的語音信號進行增強處理的原理是將未發(fā)音時的功率譜作為噪聲的功率譜,實現(xiàn)對語音的去噪增強。而患者身體可能較為虛弱,故患者氣息較為微弱,聲音較小,與噪聲的對比度較弱,且在醫(yī)院內(nèi)的不同環(huán)境中,背景噪聲的強度不同,如在醫(yī)院大廳中,人聲嘈雜,背景噪聲較強,在病房內(nèi),背景噪聲通常較弱。故使用傳統(tǒng)的譜減法對患者的語音信號進行增強處理時,可能會出現(xiàn)不同程度的噪聲保留,形成節(jié)奏性起伏的音樂噪聲,造成無法準確識別患者語音中的相關(guān)需求,進而影響醫(yī)療陪護機器人的執(zhí)行和響應效果。
技術(shù)實現(xiàn)思路
1、為了解決上述技術(shù)問題,本申請的目的在于提供一種醫(yī)療陪護機器人語音交互識別方法及系統(tǒng),所采用的技術(shù)方案具體如下:
2、第一方面,本申請實施例提供了一種醫(yī)療陪護機器人語音交互識別方法,該方法包括以下步驟:
3、通過醫(yī)療陪護機器人采集患者的語音信號,將語音信號進行分幀得到各語音幀;
4、基于當前語音幀中信號強度的波動特征構(gòu)建當前語音幀的醫(yī)療噪聲混雜因子;
5、基于當前語音幀近鄰的語音幀的醫(yī)療噪聲混雜因子及對應時間段內(nèi)信號強度的峰值特征構(gòu)建當前語音幀的醫(yī)療噪聲匹配指數(shù);
6、基于當前語音幀的醫(yī)療噪聲匹配指數(shù)構(gòu)建當前語音幀的醫(yī)療噪聲抑制因子,基于醫(yī)療噪聲抑制因子結(jié)合語音降噪算法進行語音增強;
7、基于患者增強后的語音與機器人進行交互。
8、在其中一種實施例中,所述醫(yī)療噪聲混雜因子的獲取過程為:
9、獲取當前語音幀的信號強度序列;計算所述信號強度序列中所有元素的均值,記為第一均值;計算所述信號強度序列中各元素與第一均值之間的差異,記為第一差異;將所述信號強度序列中所有元素的第一差異的融合值作為當前語音幀的醫(yī)療噪聲混雜因子。
10、在其中一種實施例中,所述信號強度序列為:當前語音幀內(nèi)所有信號強度構(gòu)成的序列。
11、在其中一種實施例中,所述醫(yī)療噪聲匹配指數(shù)的獲取過程為:
12、將與當前語音幀距離最近的預設(shè)第一數(shù)量個語音幀作為當前語音幀的鄰近語音幀;
13、基于鄰近語音幀的醫(yī)療噪聲混雜因子構(gòu)建當前語音幀的混雜因子序列;
14、基于鄰近語音幀內(nèi)信號強度的峰值特征構(gòu)建當前語音幀的近鄰峰時刻序列;
15、基于近鄰峰時刻序列計算當前語音幀的語調(diào)虛弱匹配因子;
16、將所述語調(diào)虛弱匹配因子與所述混雜因子序列中所有元素的融合值作為當前語音幀的醫(yī)療噪聲匹配指數(shù)。
17、在其中一種實施例中,所述混雜因子序列為:當前語音幀的所有鄰近語音幀的醫(yī)療噪聲混雜因子構(gòu)成的序列。
18、在其中一種實施例中,所述近鄰峰時刻序列的獲取過程為:
19、將當前語音幀的所有鄰近語音幀所在時間段內(nèi)所有信號強度構(gòu)成的序列作為第一鄰近序列;將所述第一鄰近序列作為峰值查找算法的輸入,將輸出的所有特征峰所對應的時刻構(gòu)成的序列記為近鄰峰時刻序列。
20、在其中一種實施例中,所述語調(diào)虛弱匹配因子的獲取過程為:
21、獲取所述近鄰峰時刻序列的一階差分序列,計算所述一階差分序列中所有元素的離散度及平均值,分別記為第一離散度和第二均值;將所述第一離散度與所述第二均值的融合值作為當前語音幀的語調(diào)虛弱匹配因子。
22、在其中一種實施例中,所述醫(yī)療噪聲抑制因子的獲取過程為:
23、將當前語音幀的信號強度序列內(nèi)的所有信號強度與醫(yī)療噪聲匹配指數(shù)的融合值作為當前語音幀的醫(yī)療噪聲抑制因子。
24、在其中一種實施例中,所述基于醫(yī)療噪聲抑制因子結(jié)合語音降噪算法進行語音增強,具體為:
25、將各語音幀作為語音降噪算法的輸入,其中,將各語音幀的醫(yī)療噪聲抑制因子作為噪聲功率譜的系數(shù),輸出為增強后的各語音幀,得到增強后的語音信號。
26、第二方面,本申請實施例還提供了一種醫(yī)療陪護機器人語音交互識別系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述任意一項所述方法的步驟。
27、本申請實施例至少具有如下有益效果:
28、本申請通過分析患者說話時語音信號的平穩(wěn)性特征構(gòu)建醫(yī)療噪聲混雜因子,反映語音幀內(nèi)語音信號的混雜程度;基于醫(yī)療噪聲混雜因子分析患者說話時聲音強度與間隔特征構(gòu)建醫(yī)療噪聲匹配指數(shù),反映語音幀符合噪聲分布特征的程度;基于醫(yī)療噪聲匹配指數(shù)分析噪聲強度特征構(gòu)建醫(yī)療噪聲抑制因子,反映對語音幀內(nèi)噪聲抑制的需求程度;將醫(yī)療噪聲抑制因子作為譜減法中噪聲功率譜的系數(shù),實現(xiàn)對不同環(huán)境中的噪聲進行不同程度的抑制,提高對患者的語音信號進行增強處理的效果,使患者的語音部分更清晰,能夠通過增強后的語音信號更準確的識別患者需求,實現(xiàn)人機之間的有效溝通,使醫(yī)療陪護機器人執(zhí)行相應指令,更準確、及時的輔助醫(yī)療護理人員照顧患者。
1.一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,該方法包括以下步驟:
2.如權(quán)利要求1所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述醫(yī)療噪聲混雜因子的獲取過程為:
3.如權(quán)利要求2所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述信號強度序列為:當前語音幀內(nèi)所有信號強度構(gòu)成的序列。
4.如權(quán)利要求1所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述醫(yī)療噪聲匹配指數(shù)的獲取過程為:
5.如權(quán)利要求4所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述混雜因子序列為:當前語音幀的所有鄰近語音幀的醫(yī)療噪聲混雜因子構(gòu)成的序列。
6.如權(quán)利要求4所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述近鄰峰時刻序列的獲取過程為:
7.如權(quán)利要求4所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述語調(diào)虛弱匹配因子的獲取過程為:
8.如權(quán)利要求2所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述醫(yī)療噪聲抑制因子的獲取過程為:
9.如權(quán)利要求1所述的一種醫(yī)療陪護機器人語音交互識別方法,其特征在于,所述基于醫(yī)療噪聲抑制因子結(jié)合語音降噪算法進行語音增強,具體為:
10.一種醫(yī)療陪護機器人語音交互識別系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并在所述處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1-9任意一項方法的步驟。