本發(fā)明涉及超聲檢查設(shè)備,具體涉及一種掌上超聲的多語種語音控制方法。
背景技術(shù):
1、掌上超聲設(shè)備,也稱手持式超聲,是一種手掌大小,易于掌控的主機(jī)探頭合二為一的醫(yī)用超聲設(shè)備,通常由探頭、處理器、顯示屏和電池等組成,其具有體積小,重量輕及功耗低的特點(diǎn)。
2、比如,中國專利cn201710560949.0公開了一種掌上式三維超聲成像系統(tǒng)和方法,包括掌上式超聲儀探頭,用于掃描并獲取超聲圖像;顯示、控制和處理終端,通過有線或無線連接方式與掌上式超聲儀探頭連接。還包括:掌上式三維空間定位系統(tǒng),與掌上式超聲儀探頭相連,并隨著掌上式超聲儀探頭的移動而移動,通過有線或無線連接方式與顯示、控制和處理終端連接,用于獨(dú)立地定位所述掌上式超聲儀探頭的三維位置。通過應(yīng)用該掌上式三維超聲成像系統(tǒng)和方法,將現(xiàn)有的三維超聲成像系統(tǒng)中龐大的空間定位系統(tǒng)變成了便攜且可隨時使用的空間定位系統(tǒng),使得掌上式三維超聲成像可以得以廣泛應(yīng)用。
3、但是,在實際實施過程中,發(fā)明人發(fā)現(xiàn),掌上超聲設(shè)備在應(yīng)用過程中,往往是處于現(xiàn)場掃查過程中,比如在急救、住院查房等場景中對患者進(jìn)行簡易檢查使用。此時,為提高操作效率,往往會在掌上超聲設(shè)備中添加語音控制系統(tǒng)。但是,現(xiàn)有的語音控制系統(tǒng)通常僅支持單一語種控制,不利于使用。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)中存在的上述問題,現(xiàn)提供一種掌上超聲的多語種語音控制方法。
2、具體技術(shù)方案如下:
3、一種掌上超聲的多語種語音控制方法,包括:
4、步驟s1:獲取輸入語音序列,對所述輸入語音序列中的元音音節(jié)進(jìn)行提??;
5、步驟s2:依照提取得到的所述元音音節(jié)進(jìn)行分類以確定所述輸入語音序列的語種;
6、步驟s3:依照所述語種獲取對應(yīng)語種的語音識別模型,采用所述語音識別模型對所述輸入語音序列進(jìn)行識別以得到操作指令。
7、另一方面,所述步驟s1包括:
8、步驟s11:獲取所述輸入語音序列,將所述輸入語音序列進(jìn)行傅里葉變換得到時頻域數(shù)據(jù);
9、步驟s12:針對所述時頻域數(shù)據(jù)于時域上依照信號幅值進(jìn)行切分以分段得到音節(jié)區(qū)間;
10、步驟s13:對每個所述音節(jié)區(qū)間進(jìn)行分類以得到所述元音音節(jié)。
11、另一方面,所述步驟s12包括:
12、步驟s121:針對所述時頻域數(shù)據(jù)于時域上提取零幅值點(diǎn),依照所述零幅值點(diǎn)對所述時頻域數(shù)據(jù)進(jìn)行切分以得到多組單詞時頻域數(shù)據(jù);
13、步驟s122:采用滑動窗口分別對每組所述單詞時頻域數(shù)據(jù)依照預(yù)設(shè)步長進(jìn)行掃描,并確定每個位置上的滑窗幅值均值;
14、步驟s123:依照所述滑窗幅值均值進(jìn)行切分以分段得到所述音節(jié)區(qū)間。
15、另一方面,所述步驟s13包括:
16、步驟s131:針對所述音節(jié)區(qū)間分別提取頻域信號,以獲得對應(yīng)于氣聲頻段的第一類頻域信號和不屬于所述氣聲頻段的第二類頻域信號;
17、步驟s132:依照所述第一類頻域信號的幅值和所述第二類頻域信號的幅值確定所述音節(jié)區(qū)間對應(yīng)的氣聲能量占比;
18、步驟s133:將所述氣聲能量占比與預(yù)先劃分的氣聲能量閾值進(jìn)行比較以確定所述元音音節(jié)。
19、另一方面,所述步驟s2包括:
20、步驟s21:針對每組所述元音音節(jié),分別映射至梅爾尺度得到非線性感知特征;
21、步驟s22:依照所述非線性感知特征進(jìn)行離散余弦變換得到特征向量;
22、步驟s23:依照所述特征向量對所述元音音節(jié)進(jìn)行分類,依照所述分類結(jié)果確定所述語種。
23、另一方面,所述步驟s23中,采用一個語種識別模型進(jìn)行分類,所述語種識別模型包括:
24、級聯(lián)模塊,所述級聯(lián)模塊對多組所述特征向量進(jìn)行級聯(lián)得到融合向量;
25、卷積網(wǎng)絡(luò),所述卷積網(wǎng)絡(luò)連接所述級聯(lián)模塊,所述卷積網(wǎng)絡(luò)對所述特征向量依次進(jìn)行提取得到提取特征;
26、全連接層,所述全連接層連接所述卷積網(wǎng)絡(luò),所述全連接層依照所述提取特征預(yù)測得到所述語種。
27、另一方面,所述步驟s3包括:
28、步驟s31:依照所述語種獲取對應(yīng)語種的語音識別模型,采用所述語音識別模型對所述輸入語音序列進(jìn)行識別;
29、步驟s32:判斷語音識別模型是否能夠?qū)λ鲚斎胝Z音序列進(jìn)行識別;
30、若是,輸出所述操作指令;
31、若否,轉(zhuǎn)向步驟s33;
32、步驟s33:依照所述語音識別模型的預(yù)識別結(jié)果與指令模板進(jìn)行匹配,以輸出所述操作指令。
33、另一方面,于執(zhí)行所述步驟s1之前還包括:
34、步驟a1:獲取實時音頻信號并輸入緩存區(qū),依照所述緩存區(qū)中的有效信號長度判斷是否存在所述輸入語音序列。
35、上述技術(shù)方案具有如下優(yōu)點(diǎn)或有益效果:
36、針對現(xiàn)有技術(shù)中的掌上超聲設(shè)備的語音控制系統(tǒng)僅支持單一語種,在實際使用過程中效果較差的問題,本實施例中,在掌上超聲設(shè)備中預(yù)置了多種不同語種的語音識別模型,來實現(xiàn)對不同語種的控制指令的有效識別;同時,考慮到掌上超聲設(shè)備計算效率較低、不能采用相對復(fù)雜的模型進(jìn)行跨語種的匹配的問題,還預(yù)先引入了針對元音音節(jié)進(jìn)行提取、語種預(yù)測的分類流程,減少了在分類過程中涉及到的特征量,提高了處理效率,使得該識別方法能夠在低功耗設(shè)備中運(yùn)用。
1.一種掌上超聲的多語種語音控制方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的多語種語音控制方法,其特征在于,所述步驟s1包括:
3.根據(jù)權(quán)利要求2所述的多語種語音控制方法,其特征在于,所述步驟s12包括:
4.根據(jù)權(quán)利要求2所述的多語種語音控制方法,其特征在于,所述步驟s13包括:
5.根據(jù)權(quán)利要求1所述的多語種語音控制方法,其特征在于,所述步驟s2包括:
6.根據(jù)權(quán)利要求5所述的多語種語音控制方法,其特征在于,所述步驟s23中,采用一個語種識別模型進(jìn)行分類,所述語種識別模型包括:
7.根據(jù)權(quán)利要求1所述的多語種語音控制方法,其特征在于,所述步驟s3包括:
8.根據(jù)權(quán)利要求1所述的多語種語音控制方法,其特征在于,于執(zhí)行所述步驟s1之前還包括:
使用協(xié)議| 關(guān)于我們| 聯(lián)系X技術(shù)
? 2008-2025 【X技術(shù)】 版權(quán)所有,并保留所有權(quán)利。津ICP備16005673號-2