一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本實(shí)用新型涉及圖像技術(shù)領(lǐng)域,具體涉及一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng)。
【背景技術(shù)】
[0002]擴(kuò)增實(shí)境(AR,Augmented Reality)是利用虛擬物體對真實(shí)場景進(jìn)行現(xiàn)實(shí)增強(qiáng)的技術(shù)。擴(kuò)增實(shí)境基于攝像頭等采集到的真實(shí)物理環(huán)境,通過將文本、二維圖像、三維模型等虛擬生成的信息標(biāo)注在顯示屏所顯示的真實(shí)物理環(huán)境中的物體上,從而實(shí)現(xiàn)對用戶身處的現(xiàn)實(shí)物理環(huán)境的注釋、說明,或者增強(qiáng)、強(qiáng)調(diào)現(xiàn)實(shí)環(huán)境的某些效果。
[0003]語音識別技術(shù),也被稱為自動語音識別Automatic Speech Recognit1n,(ASR),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入。語音識別技術(shù)就是讓機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音評測技術(shù)又稱計(jì)算機(jī)輔助語言學(xué)習(xí)(Computer Assisted Language Learning),是機(jī)器自動對用戶發(fā)音進(jìn)行評分、檢錯并給出矯正指導(dǎo)的技術(shù)。
[0004]移動終端的語音識別及語音評測技術(shù)已經(jīng)非常廣泛的應(yīng)用于教育領(lǐng)域,為用戶提供更為便捷有效的服務(wù),但是千篇一律的應(yīng)用模式及單純的人機(jī)對話,略顯得枯燥乏味;對于教育領(lǐng)域的應(yīng)用,無法真正抓住用戶的注意力以達(dá)到高的留存率。
[0005]在擴(kuò)增實(shí)境應(yīng)用里,將文本、二維圖像、三維模型等虛擬生成的信息輸出到顯示設(shè)備上已經(jīng)司空見慣,炫酷精致的三維立體模型及二維影像及圖像互動展現(xiàn)雖然可吸引大眾眼球,卻無法達(dá)到切實(shí)可行的效益,也將慢慢消逝在時(shí)間的洪流中。
[0006]因此,將語音識別及語音評測技術(shù)應(yīng)用于擴(kuò)增實(shí)境系統(tǒng)可有效結(jié)合兩者的優(yōu)點(diǎn)和克服兩者的缺點(diǎn),開辟出新的領(lǐng)域。
【實(shí)用新型內(nèi)容】
[0007]針對現(xiàn)有技術(shù)的不足,本實(shí)用新型旨在提供一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),通過將語音識別和語音測評技術(shù)應(yīng)用于擴(kuò)增實(shí)境系統(tǒng),既增強(qiáng)了語音識別和語音測評的趣味性,也賦予高了擴(kuò)增實(shí)境較高的實(shí)用性。
[0008]為了實(shí)現(xiàn)上述目的,本實(shí)用新型采用如下技術(shù)方案:
[0009]—種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),包括攝像頭裝置、顯示器、影像處理單元以及影像生成單元,還包括語音接收單元、語音識別單元、語音檢測單元以及存儲有語音模板數(shù)據(jù)庫的對比匹配單元,所述語音接收單元、語音識別單元、語音檢測單元和對比匹配單元依次連接;所述攝像頭裝置分別連接于顯示器和影像處理單元,所述影像生成單元連接于所述顯示器,而影像處理單元和影像生成單元則相互連接;另外,所述對比匹配單元還連接有轉(zhuǎn)換輸出單元,所述轉(zhuǎn)換輸出單元連接于所述顯示器。
[0010]需要說明的是,利用所述系統(tǒng)進(jìn)行語音識別和語音測評的過程為:使用者通過攝像頭裝置掃描卡片、電腦圖片、紙質(zhì)圖片等獲得圖像后,影像處理單元和影像生成單元將從攝像頭裝置獲得的圖像處理生成包含示范語音的三維模型或二維影像及圖像,并通過顯示器向使用者展示。使用者可對示范語音進(jìn)行跟讀,跟讀所得的待測語音被語音接收單元所接收,并由語音識別單元和語音檢測單元進(jìn)行識別和檢測。檢測后由對比匹配單元對待測語音和語音模板數(shù)據(jù)庫中相應(yīng)的語音模板進(jìn)行對比匹配,最后得出的匹配度由轉(zhuǎn)換輸出單元轉(zhuǎn)換為分?jǐn)?shù)形式顯示在顯示器上,該分?jǐn)?shù)即為使用者跟讀所得測評分?jǐn)?shù)。通過上述過程,語音識別和語音測評的趣味性大大增加,有助于增強(qiáng)使用者的興趣,同時(shí)還賦予了擴(kuò)增實(shí)境系統(tǒng)較大的實(shí)用性。
[0011]作為一種優(yōu)選方案,所述顯示器為觸控顯示器。
[0012]作為一種優(yōu)選方案,所述攝像頭裝置、顯示器、影像處理單元、影像生成單元、語音接收單元、語音識別單元、語音檢測單元、對比匹配單元以及轉(zhuǎn)換輸出單元結(jié)合為一整體的移動設(shè)備。
[0013]本實(shí)用新型的有益效果在于:將語音識別和語音測評技術(shù)應(yīng)用于擴(kuò)增實(shí)境,利用擴(kuò)增實(shí)境增強(qiáng)語音識別和語音測評的趣味性的同時(shí),還賦予了擴(kuò)增實(shí)境較強(qiáng)的實(shí)用性。
【附圖說明】
[0014]圖1為本實(shí)用新型的系統(tǒng)原理示意圖。
【具體實(shí)施方式】
[0015]以下將結(jié)合附圖對本實(shí)用新型作進(jìn)一步的說明,需要說明的是,本實(shí)施例以本技術(shù)方案為前提,給出了詳細(xì)的實(shí)施方式和具體的操作過程,但本實(shí)用新型的保護(hù)范圍并不限于本實(shí)施例。
[0016]如圖1所示,一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),包括攝像頭裝置101、顯示器104、影像處理單元102以及影像生成單元103,還包括語音接收單元105、語音識別單元106、語音檢測單元107以及存儲有語音模板數(shù)據(jù)庫的對比匹配單元108,所述語音接收單元105、語音識別單元106、語音檢測單元107和對比匹配單元108依次連接;所述攝像頭裝置101分別連接于顯示器104和影像處理單元102,所述影像生成單元103連接于所述顯示器104,而影像處理單元102和影像生成單元103則相互連接;另外,所述對比匹配單元108還連接有轉(zhuǎn)換輸出單元109,所述轉(zhuǎn)換輸出單元109連接于所述顯示器104。
[0017]需要說明的是,利用所述系統(tǒng)進(jìn)行語音識別和語音測評的過程為:使用者通過攝像頭裝置掃描卡片、電腦圖片、紙質(zhì)圖片等獲得圖像后,影像處理單元和影像生成單元將從攝像頭裝置獲得的圖像處理生成包含示范語音的三維模型或二維影像及圖像,并通過顯示器向使用者展示。使用者可對示范語音進(jìn)行跟讀,跟讀所得的待測語音被語音接收單元所接收,并由語音識別單元和語音檢測單元進(jìn)行識別和檢測。檢測后由對比匹配單元對待測語音和語音模板數(shù)據(jù)庫中相應(yīng)的語音模板進(jìn)行對比匹配,最后得出的匹配度由轉(zhuǎn)換輸出單元轉(zhuǎn)換為分?jǐn)?shù)形式顯示在顯示器上,該分?jǐn)?shù)即為使用者跟讀所得測評分?jǐn)?shù)。通過上述過程,語音識別和語音測評的趣味性大大增加,有助于增強(qiáng)使用者的興趣,同時(shí)還賦予了擴(kuò)增實(shí)境系統(tǒng)較大的實(shí)用性。
[0018]進(jìn)一步地,所述顯示器104為觸控顯示器。
[0019]進(jìn)一步地,所述攝像頭裝置、顯示器、影像處理單元、影像生成單元、語音接收單元、語音檢測單元、對比匹配單元以及轉(zhuǎn)換輸出單元結(jié)合為一整體的移動設(shè)備(如手機(jī)、平板電腦)。
[0020]對于本領(lǐng)域的技術(shù)人員來說,可以根據(jù)以上的技術(shù)方案和構(gòu)思,作出各種相應(yīng)的改變和變形,而所有的這些改變和變形都應(yīng)該包括在本實(shí)用新型權(quán)利要求的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),包括攝像頭裝置、顯示器、影像處理單元以及影像生成單元,其特征在于,還包括語音接收單元、語音識別單元、語音檢測單元以及存儲有語音模板數(shù)據(jù)庫的對比匹配單元,所述語音接收單元、語音識別單元、語音檢測單元和對比匹配單元依次連接;所述攝像頭裝置分別連接于顯示器和影像處理單元,所述影像生成單元連接于所述顯示器,而影像處理單元和影像生成單元則相互連接;另外,所述對比匹配單元還連接有轉(zhuǎn)換輸出單元,所述轉(zhuǎn)換輸出單元連接于所述顯示器。2.根據(jù)權(quán)利要求1所述的一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),其特征在于,所述顯示器為觸控顯示器。3.根據(jù)權(quán)利要求1所述的一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),其特征在于,所述攝像頭裝置、顯示器、影像處理單元、影像生成單元、語音接收單元、語音識別單元、語音檢測單元、對比匹配單元以及轉(zhuǎn)換輸出單元結(jié)合為一整體的移動設(shè)備。
【專利摘要】本實(shí)用新型公開了一種結(jié)合語音識別及語音測評技術(shù)的擴(kuò)增實(shí)境系統(tǒng),包括攝像頭裝置、顯示器、影像處理單元以及影像生成單元,還包括語音接收單元、語音識別單元、語音檢測單元以及存儲有語音模板數(shù)據(jù)庫的對比匹配單元,所述語音接收單元、語音識別單元、語音檢測單元和對比匹配單元依次連接;所述攝像頭裝置分別連接于顯示器和影像處理單元,所述影像生成單元連接于所述顯示器,而影像處理單元和影像生成單元則相互連接;另外,所述對比匹配單元還連接有轉(zhuǎn)換輸出單元,所述轉(zhuǎn)換輸出單元連接于所述顯示器。本實(shí)用新型將語音識別和語音測評技術(shù)應(yīng)用于擴(kuò)增實(shí)境,利用擴(kuò)增實(shí)境增強(qiáng)語音識別和語音測評的趣味性的同時(shí),還賦予了擴(kuò)增實(shí)境較強(qiáng)的實(shí)用性。
【IPC分類】G06F3/01, G10L15/28
【公開號】CN204883593
【申請?zhí)枴緾N201520704865
【發(fā)明人】林家進(jìn)
【申請人】林家進(jìn)
【公開日】2015年12月16日
【申請日】2015年9月11日