本發(fā)明涉及汽車電子技術(shù)領(lǐng)域,特別涉及一種基于本地和云端混合識(shí)別的自然語音識(shí)別方法、裝置和系統(tǒng)。
背景技術(shù):
隨著當(dāng)代信息技術(shù)的日益發(fā)展,語音識(shí)別技術(shù)已經(jīng)被廣泛應(yīng)用于消費(fèi)電子、家用電器及車載領(lǐng)域。以車載領(lǐng)域?yàn)槔?,駕駛員在開車時(shí)需要保持非常高的專注度,傳統(tǒng)的依賴雙手的交互存在一定的安全隱患,因此,語音識(shí)別的交互方式是將來車載交互的方向。車載領(lǐng)域現(xiàn)有的語音識(shí)別技術(shù)中,有只基于本地的語音識(shí)別系統(tǒng),有只基于云端的語音識(shí)別系統(tǒng),也有支持本地和云端識(shí)別的語音系統(tǒng)。
現(xiàn)有專利文獻(xiàn)CN103440867A,公開了一種基于本地和云端的語音識(shí)別技術(shù)。該技術(shù)以云端語音識(shí)別為主,只有當(dāng)網(wǎng)絡(luò)故障,云端的識(shí)別不能在指定時(shí)間內(nèi)返回時(shí),才根據(jù)本地語音識(shí)別的置信度判斷是否輸出本地語音識(shí)別。
這種技術(shù)雖然解決了識(shí)別范圍和功能動(dòng)態(tài)更新的局限性,但無論何種應(yīng)用場景,都考慮以云端識(shí)別結(jié)果為準(zhǔn)。但如果是在與車載環(huán)境強(qiáng)相關(guān)的情況下,比如“空調(diào)溫度太高了”,對(duì)空調(diào)功能的支持是車機(jī)端定制的,則這種情況本地識(shí)別結(jié)果效率更高,且識(shí)別結(jié)果具有較高可靠性。即如果與車載環(huán)境強(qiáng)相關(guān)的情況下也一味只認(rèn)可云端識(shí)別結(jié)果,以云端識(shí)別結(jié)果為準(zhǔn),并不合適,且降低了識(shí)別結(jié)果輸出效率。
技術(shù)實(shí)現(xiàn)要素:
現(xiàn)有技術(shù)中基于本地和云端的語音識(shí)別技術(shù)主要以云端識(shí)別引擎的反饋結(jié)果為準(zhǔn),基本不采用本地引擎識(shí)別結(jié)果,而在與本地應(yīng)用相關(guān)的應(yīng)用環(huán)境下,本地識(shí)別結(jié)果也具有較高可靠性,且識(shí)別效率更高,所以只采用云端引擎的識(shí)別結(jié)果是不合適的,且降低了識(shí)別結(jié)果輸出的效率。本發(fā)明所要解決現(xiàn)有技術(shù)中本地識(shí)別結(jié)果采用率低、識(shí)別結(jié)果輸出效率差的問題。
本發(fā)明為解決現(xiàn)有問題而提出一種基于本地和云端混合識(shí)別的自然語音識(shí)別方法,步驟包括:
獲取自然語音的應(yīng)用場景;
接收本地識(shí)別的第一語音識(shí)別結(jié)果及其置信度和云端識(shí)別的第二語音識(shí)別結(jié)果及其置信度;
根據(jù)所述自然語音的應(yīng)用場景,調(diào)整所述第一語音識(shí)別結(jié)果的置信度和所述第二語音識(shí)別結(jié)果的置信度;其中,若所述應(yīng)用場景與本地應(yīng)用相關(guān),則提高第一語音識(shí)別結(jié)果的置信度;
將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出。
進(jìn)一步地,接收本地識(shí)別的第一語音識(shí)別結(jié)果和云端識(shí)別的第二語音識(shí)別結(jié)果的步驟中還包括以下步驟:
根據(jù)應(yīng)用場景設(shè)定預(yù)設(shè)時(shí)間;
判斷預(yù)設(shè)時(shí)間內(nèi)是否接收到云端識(shí)別的第二語音識(shí)別結(jié)果;
若在預(yù)設(shè)時(shí)間內(nèi)沒有接收到云端識(shí)別的第二語音識(shí)別結(jié)果,則根據(jù)所述應(yīng)用場景,對(duì)所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果的置信度分別進(jìn)行調(diào)整的步驟中:
調(diào)整所述第一語音識(shí)別結(jié)果的置信度高于所述第二語音識(shí)別結(jié)果的置信度。
進(jìn)一步地,步驟還包括根據(jù)調(diào)整后的最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式。
進(jìn)一步地,根據(jù)所述最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式的步驟中:
若所述最終識(shí)別結(jié)果的置信度在第一置信度范圍內(nèi),則響應(yīng)方式為執(zhí)行;
若所述最終識(shí)別結(jié)果的置信度在第二置信度范圍內(nèi),則響應(yīng)方式為交互和引導(dǎo);
若所述最終識(shí)別結(jié)果的置信度在第三置信度范圍內(nèi),則響應(yīng)方式為引導(dǎo)。進(jìn)一步地,根據(jù)所述最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式的步驟中,還包括對(duì)于每一響應(yīng)方式,隨機(jī)輸出預(yù)存的應(yīng)答結(jié)果。
基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提出一種基于本地和云端混合識(shí)別的自然語音識(shí)別裝置,包括:
場景獲取模塊,用于獲取自然語音的應(yīng)用場景;
接收模塊,用于接收本地識(shí)別的第一語音識(shí)別結(jié)果和云端識(shí)別的第二語音識(shí)別結(jié)果;
置信度調(diào)整模塊,用于根據(jù)所述應(yīng)用場景,對(duì)所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果的置信度進(jìn)行調(diào)整;
輸出模塊,用于將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出。
進(jìn)一步地,還包括:
時(shí)間設(shè)定模塊,用于根據(jù)應(yīng)用場景設(shè)定預(yù)設(shè)時(shí)間;
判斷模塊,用于判斷預(yù)設(shè)時(shí)間內(nèi)是否接收到云端識(shí)別的第二語音識(shí)別結(jié)果。
進(jìn)一步地,還包括交互模塊,用于根據(jù)調(diào)整后的最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式。
進(jìn)一步地,所述交互模塊中的響應(yīng)方式為:
若所述最終識(shí)別結(jié)果的置信度在第一置信度范圍內(nèi),則響應(yīng)方式為執(zhí)行;
若所述最終識(shí)別結(jié)果的置信度在第二置信度范圍內(nèi),則響應(yīng)方式為交互和引導(dǎo);
若所述最終識(shí)別結(jié)果的置信度在第三置信度范圍內(nèi),則響應(yīng)方式為引導(dǎo)。
進(jìn)一步地,所述交互模塊中,對(duì)于每一響應(yīng)方式,隨機(jī)輸出預(yù)存的應(yīng)答結(jié)果。
進(jìn)一步地,所述置信度調(diào)整模塊,在所述判斷模塊的判斷結(jié)果為否時(shí)調(diào)整所述第一語音識(shí)別結(jié)果的置信度高于所述第二語音識(shí)別結(jié)果的置信度。
基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提出一種基于本地和云端混合識(shí)別的自然語音識(shí)別系統(tǒng),包括:
自然語音識(shí)別裝置,接收自然語音的應(yīng)用場景,以及所述第一語音識(shí)別結(jié)果及其置信度,所述云端識(shí)別的第二語音識(shí)別結(jié)果及其置信度;根據(jù)所述自然語音的應(yīng)用場景,調(diào)整所述第一語音識(shí)別結(jié)果的置信度和所述第二語音識(shí)別結(jié)果的置信度;其中,若所述應(yīng)用場景與本地應(yīng)用相關(guān),則提高第一語音識(shí)別結(jié)果的置信度;將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出;
語音接收裝置,接收自然語音信號(hào);
語音發(fā)送裝置,將所述自然語音信號(hào)發(fā)送至本地識(shí)別引擎、云端識(shí)別引擎和自然語言識(shí)別模塊;
所述本地識(shí)別引擎,對(duì)所述自然語音信號(hào)進(jìn)行解析,得到本地識(shí)別的第一語音識(shí)別結(jié)果;
所述云端識(shí)別引擎,對(duì)所述自然語音信號(hào)進(jìn)行解析,得到云端識(shí)別的第二語音識(shí)別結(jié)果;
所述自然語言識(shí)別模塊,對(duì)所述自然語音信號(hào)進(jìn)行解析,得到自然語音的應(yīng)用場景。
進(jìn)一步地,所述自然語言識(shí)別模塊,配置于所述本地識(shí)別引擎內(nèi)。
本發(fā)明的有益效果在于,
本發(fā)明所述的基于本地和云端混合識(shí)別的自然語音識(shí)別方法、裝置和系統(tǒng),通過自然語言識(shí)別模塊識(shí)別自然語言的應(yīng)用場景,并根據(jù)應(yīng)用場景,調(diào)整第一語音識(shí)別結(jié)果置信度和第二語音識(shí)別結(jié)果的置信度;當(dāng)應(yīng)用場景與本地應(yīng)用相關(guān)時(shí),則提高第一語音識(shí)別結(jié)果的置信度,最后比較第一語音識(shí)別結(jié)果置信度和第二語音識(shí)別結(jié)果的置信度,輸出置信度高的結(jié)果作為最終結(jié)果。如此,本發(fā)明提高了第一語音識(shí)別結(jié)果的利用程度,并且最終輸出的結(jié)果與應(yīng)用場景相關(guān)。
附圖說明
圖1為本發(fā)明實(shí)施例1所述基于本地和云端混合識(shí)別的自然語音識(shí)別方法的流程圖。
圖2為本發(fā)明實(shí)施例2所述基于本地和云端混合識(shí)別的自然語音識(shí)別方法的流程圖。
圖3為本發(fā)明實(shí)施例3所述基于本地和云端混合識(shí)別的自然語音識(shí)別方法的流程圖。
圖4為本發(fā)明實(shí)施例4所述基于本地和云端混合識(shí)別的自然語音識(shí)別裝置的原理框圖。
圖5為本發(fā)明實(shí)施例5所述基于本地和云端混合識(shí)別的自然語音識(shí)別系統(tǒng)的原理結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步描述。另外,本文中的術(shù)語“第一”、“第二”、“第三”等,用于在類似要素之間進(jìn)行區(qū)別,并且不一定是描述特定的次序或者按時(shí)間的順序。要理解,這樣使用的這些術(shù)語在適當(dāng)?shù)沫h(huán)境下是可互換的,使得在此描述的主題的實(shí)施例如是能夠以與那些說明的次序不同的次序或者以在此描述的另外的次序來進(jìn)行操作。
實(shí)施例1
本實(shí)施例提供一種基于本地和云端混合識(shí)別的自然語音識(shí)別方法,如圖1所示,包括如下步驟。
步驟101,獲取自然語音的應(yīng)用場景。所述應(yīng)用場景,根據(jù)自然語言中出現(xiàn)的與用戶想法契合的詞語直接得到。例如在車輛行駛過程中,用戶提出“我要開空調(diào)”,其自然語音的應(yīng)用場景為控制空調(diào)。當(dāng)用戶對(duì)道路不熟悉時(shí),提出“打開導(dǎo)航”,其自然語言的應(yīng)用場景為控制導(dǎo)航軟件。而且對(duì)每種應(yīng)用場景進(jìn)行了分層式的細(xì)化,例如控制空調(diào)的下一層包括控制空調(diào)開啟和控制空調(diào)溫度;再例如,控制導(dǎo)航軟件的下一層包括控制導(dǎo)航開啟和控制導(dǎo)航到興趣地點(diǎn)。
步驟102,接收本地識(shí)別的第一語音識(shí)別結(jié)果及其置信度和云端識(shí)別的第二語音識(shí)別結(jié)果及其置信度。通常情況下,本地識(shí)別的語料庫不大,內(nèi)容大多跟本地應(yīng)用相關(guān),但識(shí)別速度快;而云端識(shí)別的語料庫強(qiáng)大,可識(shí)別較多信息,但相應(yīng)的識(shí)別速度比較慢,且容易受到網(wǎng)速的影響。
步驟103,根據(jù)所述自然語音的應(yīng)用場景,調(diào)整所述第一語音識(shí)別結(jié)果的置信度和所述第二語音識(shí)別結(jié)果的置信度;其中,若所述應(yīng)用場景與本地應(yīng)用相關(guān),則提高第一語音識(shí)別結(jié)果的置信度。通常不同應(yīng)用場景對(duì)本地識(shí)別和云端識(shí)別的依賴程度是不同的,例如,對(duì)空調(diào)的控制在車機(jī)端,則應(yīng)用場景為控制空調(diào)時(shí),判斷為該應(yīng)用場景與本地應(yīng)用相關(guān),應(yīng)用場景依賴于本地,本地識(shí)別的第一語音識(shí)別結(jié)果的權(quán)重經(jīng)驗(yàn)值調(diào)高;當(dāng)應(yīng)用場景為導(dǎo)航領(lǐng)域時(shí),導(dǎo)航的目的地及路線,都存儲(chǔ)于云端,本地?zé)o法獲取,故該應(yīng)用場景與本地應(yīng)用不相關(guān),應(yīng)用場景依賴于云端,云端識(shí)別的第二語音識(shí)別結(jié)果的權(quán)重經(jīng)驗(yàn)值調(diào)高。
故需要根據(jù)不同的應(yīng)用場景,對(duì)第一語音識(shí)別結(jié)果和第二語音識(shí)別結(jié)果的權(quán)重經(jīng)驗(yàn)值進(jìn)行調(diào)整,根據(jù)調(diào)整后的結(jié)果調(diào)用不同的語音識(shí)別結(jié)果作為最終識(shí)別結(jié)果。根據(jù)大量車載語音識(shí)別領(lǐng)域積累的經(jīng)驗(yàn)和專家判斷,制定了不同應(yīng)用場景下本地識(shí)別的權(quán)重經(jīng)驗(yàn)值和云端識(shí)別的權(quán)重經(jīng)驗(yàn)值,調(diào)整置信度即根據(jù)不同應(yīng)用場景提取本地識(shí)別的權(quán)重經(jīng)驗(yàn)值和云端識(shí)別的權(quán)重經(jīng)驗(yàn)值,結(jié)合本地識(shí)別的原有置信度和云端識(shí)別的原有置信度,經(jīng)過計(jì)算,獲得調(diào)整后的本地識(shí)別置信度和云端識(shí)別置信度。具體計(jì)算方法可以直接由原有置信度與對(duì)應(yīng)的權(quán)重經(jīng)驗(yàn)值進(jìn)行相乘的方式獲取,或者通過其他計(jì)算方法得到。另外,置信度獲取過程也是一種比較復(fù)雜的算法,由于這并不是本發(fā)明的發(fā)明要點(diǎn),因此可選擇現(xiàn)有技術(shù)中的方法即可,在此不再詳細(xì)描述。
步驟104,將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出。
上述方法將自然語音的應(yīng)用場景作為一個(gè)影響因素,用于選擇最后輸出結(jié)果為第一語音識(shí)別結(jié)果還是第二語音識(shí)別結(jié)果。當(dāng)應(yīng)用場景與本地應(yīng)用相關(guān)時(shí),本地識(shí)別的第一語音識(shí)別結(jié)果的可信度較高,識(shí)別速度更快,因此調(diào)高第一語音識(shí)別結(jié)果的置信度,如果第一語音識(shí)別結(jié)果的原有置信度已經(jīng)是一個(gè)較高的值,那么經(jīng)過該調(diào)整后,可使第一語音識(shí)別結(jié)果的置信度高于第二語音識(shí)別結(jié)果的置信度,最后輸出第一語音識(shí)別結(jié)果,提高第一語音識(shí)別結(jié)果的利用率,同時(shí)提高了語音識(shí)別的效率。
實(shí)施例2
本實(shí)施例在實(shí)施例1的基礎(chǔ)上進(jìn)行如下改進(jìn),具體為上述步驟101及步驟104之間,采用如下方式實(shí)現(xiàn):
步驟202,根據(jù)應(yīng)用場景設(shè)定預(yù)設(shè)時(shí)間。即根據(jù)應(yīng)用場景,判斷是否與本地應(yīng)用相關(guān),當(dāng)與本地應(yīng)用相關(guān)時(shí),則預(yù)設(shè)時(shí)間可適當(dāng)縮短;當(dāng)與本地應(yīng)用無關(guān)時(shí),可適當(dāng)延長預(yù)設(shè)時(shí)間。
步驟203,判斷預(yù)設(shè)時(shí)間內(nèi)是否接收到云端識(shí)別的第二語音識(shí)別結(jié)果。由于云端識(shí)別的語料庫強(qiáng)大,與本地識(shí)別相比,雖然云端識(shí)別的識(shí)別結(jié)果準(zhǔn)確性較高,但相應(yīng)的會(huì)比較耗時(shí),而且云端識(shí)別必須依賴網(wǎng)絡(luò),當(dāng)網(wǎng)絡(luò)功能受限時(shí),則只能等待。
步驟204,若在預(yù)設(shè)時(shí)間內(nèi)沒有接收到云端識(shí)別的第二語音識(shí)別結(jié)果,則根據(jù)所述應(yīng)用場景,調(diào)整所述第一語音識(shí)別結(jié)果的置信度高于所述第二語音識(shí)別結(jié)果的置信度。當(dāng)無法接收到云端識(shí)別結(jié)果時(shí),則第二語音識(shí)別結(jié)果的置信度必然為零,根據(jù)應(yīng)用場景調(diào)整置信度時(shí),其調(diào)整后的置信度必然低于第一語音識(shí)別結(jié)果的置信度。
本實(shí)施例中,預(yù)設(shè)時(shí)間根據(jù)應(yīng)用場景調(diào)整。由于本地識(shí)別速度快,而云端識(shí)別會(huì)受到當(dāng)時(shí)網(wǎng)絡(luò)環(huán)境的影響,在接收識(shí)別結(jié)果時(shí)會(huì)有延遲。故當(dāng)所識(shí)別的應(yīng)用場景跟本地應(yīng)用相關(guān)時(shí),本地識(shí)別的第一語音識(shí)別結(jié)果的可靠性高,此時(shí)預(yù)設(shè)時(shí)間較短,即等待云端識(shí)別結(jié)果的時(shí)間較短,最終識(shí)別結(jié)果可以在較短時(shí)間內(nèi)輸出,提高了最終結(jié)果輸出效率。當(dāng)應(yīng)用場景與本地應(yīng)用無關(guān)時(shí),則云端識(shí)別的第二語音識(shí)別結(jié)果可靠性更好,此時(shí)預(yù)設(shè)時(shí)間較長,即盡量等待云端識(shí)別結(jié)果,增強(qiáng)最終輸出的識(shí)別結(jié)果的效率和可靠性。
實(shí)施例3
進(jìn)一步地,在實(shí)施例1或者實(shí)施例2的基礎(chǔ)上,還可以包括步驟305。
以實(shí)施例1為例,步驟104之后采用如下方式實(shí)現(xiàn):
步驟305,根據(jù)調(diào)整后的最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式。
具體內(nèi)容為,若所述最終識(shí)別結(jié)果的置信度在第一置信度范圍內(nèi),則響應(yīng)方式為執(zhí)行;若所述最終識(shí)別結(jié)果的置信度在第二置信度范圍內(nèi),則響應(yīng)方式為交互和引導(dǎo);若所述最終識(shí)別結(jié)果的置信度在第三置信度范圍內(nèi),則響應(yīng)方式為引導(dǎo)。如此,當(dāng)應(yīng)用場景與本地應(yīng)用無關(guān),而云端識(shí)別結(jié)果又遲遲無法反饋時(shí),最后輸出為本地識(shí)別結(jié)果,其調(diào)整后的置信度必然會(huì)在第二置信度范圍或者第三置信度范圍,以交互、引導(dǎo)的方式繼續(xù)跟用戶溝通,以達(dá)到最后執(zhí)行命令的目的。
需要說明的是,為適應(yīng)不同應(yīng)用場景的特點(diǎn),不同的應(yīng)用場景下,三個(gè)置信度劃分的界限是不同的。如此,對(duì)較為復(fù)雜的語音識(shí)別情況,響應(yīng)方式可以更加靈活多變。除此之外,也可以在確定了三個(gè)置信度劃分的界限后,調(diào)整應(yīng)用場景的權(quán)重經(jīng)驗(yàn)值,將調(diào)整后的置信度符合置信度的范圍。
當(dāng)然,置信度的劃分可以是多種多樣的,不限于三個(gè),也不限于三種響應(yīng)方式。下面以打電話的應(yīng)用場景為例進(jìn)行說明:
情況一:當(dāng)用戶提出“打電話”,應(yīng)用場景為撥號(hào)控制,該功能場景下,因?yàn)橛脩粑刺岢龃螂娫捊o哪一個(gè)人,本地識(shí)別的第一語音識(shí)別結(jié)果的置信度較低,識(shí)別結(jié)果經(jīng)權(quán)重經(jīng)驗(yàn)值調(diào)整后,會(huì)落入第三置信度范圍。在這種情況下,相應(yīng)方式應(yīng)以引導(dǎo)為主,例如輸出“請(qǐng)指定通話對(duì)象”,以引導(dǎo)用戶進(jìn)行下一步操作。
情況二:當(dāng)用戶提出“致電唐寅”,應(yīng)用場景為撥號(hào)對(duì)象控制,該功能場景下,第二語音識(shí)別結(jié)果置信度低,而本地引擎進(jìn)行語音識(shí)別時(shí)發(fā)現(xiàn)本地通訊錄中有“唐寅”和“唐銀”兩個(gè)發(fā)音相同的名字,則本地引擎識(shí)別的第一語音識(shí)別結(jié)果的置信度也比較低。在進(jìn)行置信度調(diào)整時(shí),該場景功能與本地應(yīng)用相關(guān),則提高第一語音識(shí)別結(jié)果。最后輸出第一語音識(shí)別結(jié)果,并且輸出的最終結(jié)果的置信度落入第二置信度范圍,以交互和引導(dǎo)為主,例如輸出“請(qǐng)問需要撥號(hào)給唐寅還是唐銀?”,用戶可以再次進(jìn)行選擇。
情況三:當(dāng)用戶提出“致電唐寅”,應(yīng)用場景為撥號(hào)對(duì)象控制,該功能場景下,第二語音識(shí)別結(jié)果置信度低,而本地引擎進(jìn)行語音識(shí)別時(shí)發(fā)現(xiàn)本地通訊錄中只有一個(gè)“唐寅”,則第一語音識(shí)別結(jié)果的置信度較高。同時(shí)由于應(yīng)用場景與本地應(yīng)用相關(guān),則調(diào)整后的第一語音識(shí)別結(jié)果的置信度必然會(huì)高于第二語音識(shí)別結(jié)果的置信度。最后輸出第一語音識(shí)別結(jié)果,并且輸出的最終結(jié)果的置信度落入第一置信度范圍內(nèi),以執(zhí)行為主,則此時(shí)無需進(jìn)行交互直接撥號(hào)致電唐寅即可。
進(jìn)一步地,步驟305中,對(duì)于每一響應(yīng)方式,隨機(jī)輸出預(yù)存的答應(yīng)結(jié)果,例如用戶需要退出語音識(shí)別,則輸出的答應(yīng)結(jié)果可為“再見”或者“有需要請(qǐng)?jiān)賳拘盐摇保瑥亩M了日常生活中人與人之間對(duì)話的隨機(jī)性,降低了車載語音識(shí)別對(duì)話系統(tǒng)的機(jī)械感。
實(shí)施例4
本實(shí)施例提供了一種基于本地和云端混合識(shí)別的自然語音識(shí)別裝置,包括場景獲取模塊401、接收模塊402、置信度調(diào)整模塊403和輸出模塊404。其中場景獲取模塊401用于獲取自然語音的應(yīng)用場景;接收模塊402用于接收本地識(shí)別的第一語音識(shí)別結(jié)果和云端識(shí)別的第二語音識(shí)別結(jié)果;置信度調(diào)整模塊403用于根據(jù)所述應(yīng)用場景,對(duì)所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果的置信度進(jìn)行調(diào)整;輸出模塊404用于將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出。
上述方案中的基于本地和云端混合識(shí)別的自然語音識(shí)別裝置,在獲取應(yīng)用場景后,根據(jù)應(yīng)用場景調(diào)整第一語音識(shí)別結(jié)果的置信度和第二語音識(shí)別結(jié)果的置信度,當(dāng)應(yīng)用場景與本地應(yīng)用相關(guān)時(shí),提高第一語音識(shí)別結(jié)果的置信度,如此可提高本地識(shí)別的利用率,使輸出結(jié)果與應(yīng)用環(huán)境相關(guān)。
進(jìn)一步地,為解決網(wǎng)絡(luò)延遲或網(wǎng)絡(luò)不可用的情況下也能完成用戶的命令,上述裝置還包括時(shí)間設(shè)定模塊405和判斷模塊406。時(shí)間設(shè)定模塊305用于根據(jù)應(yīng)用場景設(shè)定預(yù)設(shè)時(shí)間;判斷模塊406用于判斷預(yù)設(shè)時(shí)間內(nèi)是否接收到云端識(shí)別的第二語音識(shí)別結(jié)果。
為降低車載語音識(shí)別對(duì)話系統(tǒng)的機(jī)械感,進(jìn)一步地,還包括交互模塊407,用于根據(jù)調(diào)整后的最終識(shí)別結(jié)果的置信度和所述應(yīng)用場景,確定對(duì)所述自然語音識(shí)別結(jié)果的響應(yīng)方式。其中交互模塊407中的響應(yīng)方式為,若所述最終識(shí)別結(jié)果的置信度在第一置信度范圍內(nèi),則響應(yīng)方式為執(zhí)行;若所述最終識(shí)別結(jié)果的置信度在第二置信度范圍內(nèi),則響應(yīng)方式為交互和引導(dǎo);若所述最終識(shí)別結(jié)果的置信度在第一置信度范圍內(nèi),則響應(yīng)方式為引導(dǎo)。進(jìn)一步地,還包括對(duì)于每一響應(yīng)方式,隨機(jī)輸出預(yù)存的應(yīng)答結(jié)果。
實(shí)施例5
本實(shí)施例提供一種基于本地和云端混合識(shí)別的自然語音識(shí)別系統(tǒng),其結(jié)構(gòu)包括自然語音識(shí)別裝置501、語音接收裝置502、語音發(fā)送裝置503、本地識(shí)別引擎504、云端識(shí)別引擎505和自然語言識(shí)別模塊506。
自然語音識(shí)別裝置501用于接收自然語音的應(yīng)用場景,以及所述第一語音識(shí)別結(jié)果及其置信度,所述云端識(shí)別的第二語音識(shí)別結(jié)果及其置信度;根據(jù)所述自然語音的應(yīng)用場景,調(diào)整所述第一語音識(shí)別結(jié)果的置信度和所述第二語音識(shí)別結(jié)果的置信度;其中,若所述應(yīng)用場景與本地應(yīng)用相關(guān),則提高第一語音識(shí)別結(jié)果的置信度;將所述第一語音識(shí)別結(jié)果和所述第二語音識(shí)別結(jié)果中置信度高的一個(gè),作為最終識(shí)別結(jié)果輸出。
語音接收裝置502用于接收自然語音信號(hào),該裝置可以是一個(gè)簡單的具有錄音功能的錄音筆、錄音機(jī)等裝置,也可以是具備錄音、存儲(chǔ)、分詞等功能的智能裝置。
語音發(fā)送裝置503將所述自然語音信號(hào)發(fā)送至本地識(shí)別引擎和云端識(shí)別引擎,該裝置可為無線發(fā)射裝置,無線和有線通用的裝置也可。將自然語音信號(hào)發(fā)送至本地識(shí)別引擎時(shí)可采用無線或者有線信號(hào)發(fā)送,當(dāng)將自然語音信號(hào)發(fā)送至云端識(shí)別引擎時(shí),則需采用無線信號(hào)發(fā)送。
本地識(shí)別引擎504對(duì)所述自然語音信號(hào)進(jìn)行解析,得到本地識(shí)別的第一語音識(shí)別結(jié)果。本地識(shí)別引擎可將與本地應(yīng)用相關(guān)、且用戶常用的語言命令存儲(chǔ)于本地語料庫中,方便常用的語言命令的識(shí)別。
云端識(shí)別引擎505對(duì)所述自然語音信號(hào)進(jìn)行解析,得到云端識(shí)別的第二語音識(shí)別結(jié)果。
自然語言識(shí)別模塊506,對(duì)所述自然語音信號(hào)進(jìn)行解析,得到自然語音的應(yīng)用場景。
本實(shí)施例提供的基于本地和云端混合識(shí)別的自然語音識(shí)別系統(tǒng),通過自然語音識(shí)別模塊識(shí)別自然語言的應(yīng)用場景,并根據(jù)功能場景,調(diào)節(jié)本第一語音識(shí)別結(jié)果的置信度和第二語音識(shí)別結(jié)果的置信度,當(dāng)識(shí)別的應(yīng)用場景與本地應(yīng)用相關(guān)時(shí),本地識(shí)別結(jié)果準(zhǔn)確性高,故調(diào)高第一語音識(shí)別結(jié)果的置信度,提高了本地識(shí)別結(jié)果的利用率。
上述自然語言識(shí)別模塊506,可以設(shè)置于本地引擎中也可以設(shè)置于云端引擎中,但是由于其用于獲取與車載應(yīng)用相關(guān)的應(yīng)用場景,將其配置于所述本地識(shí)別引擎504內(nèi),相對(duì)于將其配置于云端引擎中具有更高的識(shí)別效率和準(zhǔn)確度。
具體地,本地識(shí)別引擎中的自然語言識(shí)別模塊,收集了大量用戶在不同車載功能場景下常用的自然語言命令,并針對(duì)這些收集的自然語言命令按照中文語言的特性、特點(diǎn),通過分詞技術(shù)進(jìn)行分析并分詞,確定每個(gè)功能場景下確定的詞匯,通過識(shí)別用戶語音信息,匹配詞匯,達(dá)到功能場景識(shí)別的目的。
另外,本實(shí)施例還提供一種車載控制器,所述車載控制器包括:處理器、存儲(chǔ)器及通信組件。其中,所述存儲(chǔ)器中存儲(chǔ)實(shí)施例1或2或3所述方法的具體代碼,由所述處理器具體執(zhí)行,所述通信組件用于與其他設(shè)備進(jìn)行通信。
此外,上述的存儲(chǔ)器中的邏輯指令通過軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)移動(dòng)終端(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本發(fā)明實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件實(shí)現(xiàn)?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明實(shí)施例的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明實(shí)施例進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。