專利名稱:具有語(yǔ)音識(shí)別及翻譯功能的移動(dòng)終端的制作方法
技術(shù)領(lǐng)域:
具有語(yǔ)音識(shí)別及翻譯功能的移動(dòng)終端
技術(shù)領(lǐng)城
本實(shí)用新型涉及一種移動(dòng)終端,尤其涉及一種具有語(yǔ)音識(shí)別及翻譯功能的 移動(dòng)終端。背景技術(shù):
隨著科技和經(jīng)濟(jì)的不斷發(fā)展,在日常生活和工作中人們需要與越來(lái)越多的 不同國(guó)籍的人進(jìn)行交流。然而由于語(yǔ)言的不通,不可避免地會(huì)造成交流困難的 問題,不僅信息無(wú)法得到溝通,而且很可能會(huì)產(chǎn)生誤解,給雙方都帶來(lái)了極大
的不便。目前手機(jī)和PDA等移動(dòng)終端由于其結(jié)構(gòu)小巧、便于攜帶等優(yōu)點(diǎn),已經(jīng) 在人們?nèi)粘I钪械玫綇V泛使用。其中,許多移動(dòng)終端中都集成語(yǔ)音識(shí)別系統(tǒng) 和各種翻譯字典,但是目前移動(dòng)終端的語(yǔ)音識(shí)別系統(tǒng)僅限于用戶進(jìn)行電話查詢 以及控制指令的輸入。而翻譯字典需要用戶手動(dòng)輸入自己想要查詢的單詞或句
因而目前的移動(dòng)終端的翻譯功能僅限于文字翻譯,在實(shí)際的語(yǔ)音交流中根本無(wú) 法起到很大的作用。另外,目前移動(dòng)終端中所使用的語(yǔ)音識(shí)別系統(tǒng)的識(shí)別效果 有限,特別當(dāng)輸入中文時(shí),由于中文發(fā)音可能對(duì)應(yīng)多個(gè)同音不同意的詞條時(shí), 往往會(huì)造成識(shí)別錯(cuò)誤。
實(shí)用新型內(nèi)容
為了解決現(xiàn)有技術(shù)的目前的移動(dòng)終端的翻譯功能僅限于文字翻譯,不適用 于實(shí)際的語(yǔ)言交流的技術(shù)問題。本實(shí)用新型提出了一種能夠?qū)τ脩糨斎氲恼Z(yǔ)音 信息進(jìn)行語(yǔ)音識(shí)別并翻譯的移動(dòng)終端。此外,本實(shí)用新型進(jìn)一步通過模糊識(shí)別 方式為用戶提供多個(gè)備選識(shí)別結(jié)果,進(jìn)而提高翻譯的準(zhǔn)確度。
本實(shí)用新型解決現(xiàn)有技術(shù)的移動(dòng)終端不具備備選功能,無(wú)法識(shí)別同音不同 意的詞條的技術(shù)問題所采用的技術(shù)方案是提供一種具有語(yǔ)音識(shí)別和翻譯功能 的移動(dòng)終端,移動(dòng)終端包括用于接收本地語(yǔ)音信息的語(yǔ)音接收單元;對(duì)本地 語(yǔ)音信息進(jìn)行識(shí)別的語(yǔ)音識(shí)別單元;用于存儲(chǔ)翻譯詞庫(kù)的存儲(chǔ)單元;用于進(jìn)行
功能控制和數(shù)據(jù)處理的處理單元;用于顯示信息的顯示單元以及用于輸出語(yǔ)音
信息的語(yǔ)音輸出單元,其中,處理單元根據(jù)語(yǔ)音識(shí)別單元所識(shí)別的語(yǔ)音基元從 翻譯詞庫(kù)中選出相似度大于預(yù)定閾值的本地文本信息,在翻譯詞庫(kù)中檢索相對(duì) 應(yīng)的目標(biāo)文本信息并在顯示單元上進(jìn)行顯示。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,存儲(chǔ)單元上進(jìn)一步存儲(chǔ)與目標(biāo)文本信息相 對(duì)應(yīng)的圖片,處理單元進(jìn)一步在顯示單元上顯示圖片。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,存儲(chǔ)單元中進(jìn)一步存儲(chǔ)與目標(biāo)文本信息相 對(duì)應(yīng)的目標(biāo)語(yǔ)音數(shù)據(jù),移動(dòng)終端進(jìn)一步包括用于對(duì)目標(biāo)語(yǔ)音數(shù)據(jù)進(jìn)行處理并由 語(yǔ)音輸出單元進(jìn)行輸出的語(yǔ)音轉(zhuǎn)換單元。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,存儲(chǔ)器中存儲(chǔ)有多個(gè)備選翻譯詞庫(kù),中央 處理單元從用戶指定的備選翻譯詞庫(kù)或多個(gè)備選翻譯詞庫(kù)中進(jìn)行檢索。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,多個(gè)備選翻譯詞庫(kù)包括按語(yǔ)言進(jìn)行分類 的備選翻i奪詞庫(kù)或者按交流場(chǎng)景進(jìn)行分類的備選翻譯詞庫(kù)。
;f艮據(jù)本實(shí)用新型 一優(yōu)選實(shí)施例,移動(dòng)終端進(jìn)一步包括用于輸入用戶確認(rèn)信 息的用戶輸入界面,處理單元從翻譯詞庫(kù)中選出相似度大于預(yù)定閾值的多個(gè)本 地文本信息,并在顯示單元上進(jìn)行顯示并等待用戶確認(rèn)。
;f艮據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,移動(dòng)終端進(jìn)一步包括用于接收翻譯詞庫(kù)或 語(yǔ)音識(shí)別單元中的聲學(xué)模型的數(shù)據(jù)接口 。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,數(shù)據(jù)接口為USB接口、藍(lán)牙接口或紅外接
根據(jù)本實(shí)用新型 一優(yōu)選實(shí)施例,數(shù)據(jù)接口為與存儲(chǔ)翻譯詞庫(kù)或聲學(xué)模型的 服務(wù)器通過移動(dòng)通信網(wǎng)絡(luò)進(jìn)行連接無(wú)線通信模塊。
根據(jù)本實(shí)用新型一優(yōu)選實(shí)施例,數(shù)據(jù)接口進(jìn)一步用于接收和發(fā)送目標(biāo)文本信息。
上述技術(shù)方案的有益效果是在移動(dòng)終端上增加了對(duì)用戶語(yǔ)音進(jìn)行識(shí)別并 實(shí)時(shí)翻譯的功能,同時(shí)還可以對(duì)翻譯結(jié)果通過顯示或語(yǔ)音方式輸出。此外,還 根-據(jù)用戶的輸入語(yǔ)音從存儲(chǔ)器中識(shí)別出多個(gè)相關(guān)詞條并由用戶進(jìn)行選擇以增加 翻譯的準(zhǔn)確性。存儲(chǔ)器中還存儲(chǔ)多個(gè)備選詞庫(kù),以方便用戶根據(jù)不同的語(yǔ)言環(huán) 境選擇相應(yīng)的詞庫(kù)。
附困說(shuō)明
圖l是本實(shí)用新型的移動(dòng)終端一實(shí)施例的示意框圖2是
圖1所示移動(dòng)終端的工作流程圖; 圖3是本實(shí)用新型的移動(dòng)終端另一實(shí)施例的示意框圖。
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例對(duì)本實(shí)用新型進(jìn)一步說(shuō)明。
參見圖1和圖2,圖1是本實(shí)用新型的移動(dòng)終端一實(shí)施例的示意框圖,圖2 是圖1所示的移動(dòng)終端的工作流程圖。在本實(shí)施例中,本實(shí)用新型的具有語(yǔ)音 識(shí)別和翻譯功能的移動(dòng)終端1包括用于接收本地語(yǔ)音信息的語(yǔ)音接收單元11; 對(duì)本地語(yǔ)音信息進(jìn)行識(shí)別的語(yǔ)音識(shí)別單元12;用于存儲(chǔ)翻譯詞庫(kù)的存儲(chǔ)單元13; 用于進(jìn)行功能控制和數(shù)據(jù)處理的處理單元14;用于顯示信息的顯示單元15以及 用于輸出語(yǔ)音信息的語(yǔ)音輸出單元16。
語(yǔ)音接收單元ll(例如,麥克)接收用戶的本地語(yǔ)音信息,語(yǔ)音識(shí)別單元 12以本地語(yǔ)音信息的語(yǔ)音基元進(jìn)行識(shí)別。在現(xiàn)有的語(yǔ)音命令輸入及控制系統(tǒng)中 一般以詞為單位進(jìn)行聲學(xué)建模,但是由于在翻譯過程中所涉及的詞條較多,因 而聲學(xué)模型就會(huì)很大,不但占用大量的存儲(chǔ)空間而且增加系統(tǒng)開銷,并且在出 現(xiàn)詞表以外的詞條后將無(wú)法識(shí)別。因而,本實(shí)用新型采用的語(yǔ)音基元優(yōu)選采用 音節(jié)、音素或聲韻母。處理單元14將上述語(yǔ)音基元的識(shí)別結(jié)果或結(jié)果組合在存 儲(chǔ)單元13中存儲(chǔ)的翻譯詞庫(kù)中的本地文本信息中選出相似度大于預(yù)定閾值的本 地文本信息,在顯示單元15上進(jìn)行顯示并等待用戶進(jìn)行確認(rèn)。其中,預(yù)定閾值 可以根據(jù)實(shí)際情況進(jìn)行變化,例如以音節(jié)為單位進(jìn)行識(shí)別時(shí),可以是用戶輸入 的連續(xù)音節(jié)與本地文本信息的每個(gè)字相對(duì)應(yīng),或者至少一半以上相對(duì)應(yīng)。用戶 通過語(yǔ)音指令或用戶輸入界面18的按鍵指令選擇出適當(dāng)?shù)谋镜匚谋拘畔ⅰL幚?單元12根據(jù)存儲(chǔ)單元13內(nèi)的翻譯詞庫(kù)將所選擇的本地文本信息翻譯成相應(yīng)的 目標(biāo)文本信息。在移動(dòng)終端1的存儲(chǔ)單元13內(nèi)可以存儲(chǔ)多種翻譯映射詞庫(kù),翻 譯詞庫(kù)可以是各種不同語(yǔ)言之間的翻譯詞庫(kù),例如,漢英文詞庫(kù)、英法詞庫(kù)或
英德詞庫(kù)。翻譯詞庫(kù)可以根據(jù)交流場(chǎng)景進(jìn)行分類,旅游用語(yǔ)詞庫(kù)、商務(wù)用語(yǔ)詞 庫(kù),,工程用語(yǔ)詞庫(kù)等,甚至可以將旅游用語(yǔ)詞庫(kù)進(jìn)一步細(xì)化到交通、購(gòu)物、娛 樂等更小的詞庫(kù)。用戶可以根據(jù)具體的語(yǔ)言環(huán)境通過選擇適當(dāng)?shù)膫溥x翻譯詞庫(kù)
來(lái)進(jìn)行最恰當(dāng)?shù)姆g。處理單元14可以將目標(biāo)文本信息在顯示單元15上進(jìn)行 顯示。存儲(chǔ)單元13上進(jìn)一步存儲(chǔ)與目標(biāo)文本信息相對(duì)應(yīng)的圖片,處理單元14 進(jìn)一步在顯示單元15上顯示圖片,以方便對(duì)方理解。此外,存儲(chǔ)單元13內(nèi)進(jìn) 一步存儲(chǔ)與目標(biāo)文本信息相對(duì)應(yīng)的目標(biāo)語(yǔ)音數(shù)據(jù),移動(dòng)終端1還可以進(jìn)一步包 括將目標(biāo)語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成語(yǔ)音信息的語(yǔ)音轉(zhuǎn)換單元17,語(yǔ)音轉(zhuǎn)換單元17將目標(biāo) 文本信息轉(zhuǎn)4灸成語(yǔ)音信息并通過語(yǔ)音輸出單元16輸出。
使用時(shí),用戶首先根據(jù)自己的翻譯需要確定所需的詞庫(kù),然后對(duì)著移動(dòng)終 端1連續(xù)說(shuō)出自己想要表達(dá)的短句,語(yǔ)音識(shí)別單元12以語(yǔ)音基元為單位對(duì)用戶 的本地語(yǔ)言信息進(jìn)行識(shí)別,并分別從翻譯詞庫(kù)中選擇出與語(yǔ)音基元或語(yǔ)音基元 組合相對(duì)應(yīng)的本地文本信息(例如,單詞或句子)并在顯示單元15上顯示,等 待用戶確認(rèn),并由移動(dòng)終端1翻譯成相應(yīng)的目標(biāo)文本信息,將其拼寫顯示在顯 示單元15上或進(jìn)行語(yǔ)音播才艮,同時(shí)還可以顯示與目標(biāo)文本信息相對(duì)應(yīng)的圖片。 而其他用戶通過語(yǔ)音播報(bào)或查看顯示單元15的顯示內(nèi)容理解用戶想要表達(dá)的意 思,并通過反向的翻譯過程回答提問,進(jìn)而實(shí)現(xiàn)互動(dòng)翻譯。在翻i奪過程中,由 于出現(xiàn)備選內(nèi)容,避免了由于同音不同意的字或詞條所帶來(lái)的翻譯錯(cuò)誤,保證 了翻譯的準(zhǔn)確率。
參見圖3,圖3是本實(shí)用新型的移動(dòng)終端另一實(shí)施例的示意框圖。在本實(shí)施 例中,移動(dòng)終端2除設(shè)有語(yǔ)音輸入單元21、語(yǔ)音識(shí)別單元22、存儲(chǔ)單元23、顯 示單元M、處理單元25、語(yǔ)音轉(zhuǎn)換單元26以及語(yǔ)音輸出單元27外,還進(jìn)一步 設(shè)置數(shù)據(jù)接口 28。數(shù)據(jù)接口28可以是網(wǎng)卡、USB接口、藍(lán)牙接口或紅外接口, 用戶可以通過電腦從網(wǎng)站上下載各種聲學(xué)模型、翻譯詞庫(kù)并通過USB接口、藍(lán) 牙接口或紅外接口存儲(chǔ)在存儲(chǔ)單元23中,也可以通過網(wǎng)卡直接通過互聯(lián)網(wǎng)從服 務(wù)網(wǎng)站上下載。用戶可以根據(jù)自己想要去的國(guó)家、想要交流的對(duì)象等實(shí)際需要 進(jìn)行下載,從而實(shí)現(xiàn)移動(dòng)終端2的按需翻譯。此外,數(shù)據(jù)接口28還可以是無(wú)線 通信模塊,該無(wú)線通信模塊與存儲(chǔ)翻譯詞庫(kù)和聲學(xué)模型的服務(wù)器通過移動(dòng)通信 網(wǎng)絡(luò)進(jìn)行連接并以無(wú)線上網(wǎng)的方式進(jìn)行下載。另外,數(shù)據(jù)接口28可以通過各種 傳輸協(xié)議與其他移動(dòng)終端建立無(wú)線或有線連接,例如通過互聯(lián)網(wǎng)、紅外或藍(lán)牙 〈言號(hào)以及無(wú)線通信網(wǎng)絡(luò)。采用這種聯(lián)機(jī)方式將目標(biāo)文本信息傳遞給對(duì)方,并對(duì) 方通過短信方式顯示或進(jìn)行語(yǔ)音播報(bào),因而無(wú)需將頻繁地將移動(dòng)終端遞交到其
他用戶手中,可以-使用戶更方俊^也進(jìn)^f亍"對(duì)i舌"。
本實(shí)用新型移動(dòng)終端的語(yǔ)音識(shí)別單元可以包括針對(duì)特定人的語(yǔ)音識(shí)別系統(tǒng)
或針對(duì)非特定人的語(yǔ)音識(shí)別系統(tǒng)。在針對(duì)特定人的語(yǔ)音識(shí)別系統(tǒng)中,用戶需要 事先對(duì)每一個(gè)詞條進(jìn)行訓(xùn)練。在訓(xùn)練階段,用戶每個(gè)詞條依次說(shuō)數(shù)遍,移動(dòng)終 端的語(yǔ)音識(shí)別單元提取詞條的特征量,并將特征量按序列存入存儲(chǔ)單元中。在 識(shí)別階段,語(yǔ)音識(shí)別單元將輸入詞條的特征量依次與存儲(chǔ)單元中存儲(chǔ)的每一個(gè) 特征量進(jìn)行相似度比較,將相似度大于預(yù)定閾值的詞條作為識(shí)別結(jié)果輸出。針
對(duì)特定人的識(shí)別系統(tǒng)識(shí)別的詞條數(shù)目一般在100條以下,識(shí)別性能隨著詞條數(shù) 目的增加會(huì)有明顯的下降,并且對(duì)于不同用戶、在不同的噪聲環(huán)境中,以及不 同的時(shí)間相同用戶的不同生理、心理狀態(tài)下,系統(tǒng)的性能都會(huì)受到明顯的影響。 當(dāng)采用針對(duì)非特定人的語(yǔ)音識(shí)別系統(tǒng)中,采用基于統(tǒng)計(jì)模型的算法,系統(tǒng)開發(fā) 者事先采集大量的語(yǔ)音數(shù)據(jù)進(jìn)行訓(xùn)練,得到聲學(xué)模型并存儲(chǔ)在存儲(chǔ)單元中。在 識(shí)別階段,語(yǔ)音識(shí)別單元將用戶的輸入詞條的特征量與通過聲學(xué)模型構(gòu)建的識(shí) 別網(wǎng)絡(luò)進(jìn)行匹配解碼,輸出該詞條。處理單元可根據(jù)語(yǔ)音識(shí)別單元輸出的識(shí)別 結(jié)果進(jìn)行相應(yīng)顯示。非特定人語(yǔ)音識(shí)別系統(tǒng)對(duì)于用戶而言,不需要引入繁瑣的 訓(xùn)練過程,方便了用戶的使用;同時(shí)它可以供不同的人使用,因此大大拓寬了 應(yīng)用范圍。另一方面,由于采用了基于統(tǒng)計(jì)模型的算法,其穩(wěn)健性和識(shí)別性能 都比特定人識(shí)別系統(tǒng)大大的提高。非特定人識(shí)別系統(tǒng)識(shí)別的詞條數(shù)目可以達(dá)到 1000條,識(shí)別性能不會(huì)隨著識(shí)別詞條數(shù)目的增加有明顯的下降,并且具有一定 的抗噪能力。
上述的詳細(xì)描述僅是示范性描述,本領(lǐng)域技術(shù)人員在不脫離本實(shí)用新型所 保護(hù)的范圍和精神的情況下,可根據(jù)不同的實(shí)際需要設(shè)計(jì)出各種實(shí)施方式。
權(quán)利要求1.一種具有語(yǔ)音識(shí)別和翻譯功能的移動(dòng)終端,所述移動(dòng)終端包括用于接收本地語(yǔ)音信息的語(yǔ)音接收單元;對(duì)所述本地語(yǔ)音信息進(jìn)行識(shí)別的語(yǔ)音識(shí)別單元;用于存儲(chǔ)翻譯詞庫(kù)的存儲(chǔ)單元;用于進(jìn)行功能控制和數(shù)據(jù)處理的處理單元;用于顯示信息的顯示單元以及用于輸出語(yǔ)音信息的語(yǔ)音輸出單元;其特征在于所述處理單元根據(jù)所述語(yǔ)音識(shí)別單元所識(shí)別的語(yǔ)音基元從所述翻譯詞庫(kù)中選出相似度大于預(yù)定閾值的本地文本信息,然后在所述翻譯詞庫(kù)中檢索相對(duì)應(yīng)的目標(biāo)文本信息并在所述顯示單元上進(jìn)行顯示。
2. 根據(jù)權(quán)利要求1所述的移動(dòng)終端,其特征在于所述移動(dòng)終端進(jìn)一步包 括用于輸入用戶確認(rèn)信息的用戶輸入界面,所述處理單元從所述翻譯詞庫(kù)中選 出相似度大于預(yù)定閾值的多個(gè)本地文本信息,并在所述顯示單元上進(jìn)行顯示并 等待用戶確-人。
3. 根據(jù)權(quán)利要求1所述的移動(dòng)終端,其特征在于所述移動(dòng)終端進(jìn)一歩包 括用于接收所述翻譯詞庫(kù)或所述語(yǔ)音識(shí)別單元中的聲學(xué)模型的數(shù)據(jù)接口 (,
4. 根據(jù)權(quán)利要求3所述的移動(dòng)終端,其特征在于所述數(shù)據(jù)接口為USB接 口 、藍(lán)矛4妻口或紅外4妻口。
5. 根據(jù)權(quán)利要求3所述的移動(dòng)終端,其特征在于所述數(shù)據(jù)接口為與存儲(chǔ) 所述翻譯詞庫(kù)或所述聲學(xué)模型的服務(wù)器通過移動(dòng)通信網(wǎng)絡(luò)進(jìn)行連接無(wú)線通信模 塊。
專利摘要本實(shí)用新型涉及一種具有語(yǔ)音識(shí)別和翻譯功能的移動(dòng)終端,該移動(dòng)終端包括用于接收本地語(yǔ)音信息的語(yǔ)音接收單元;對(duì)本地語(yǔ)音信息進(jìn)行識(shí)別的語(yǔ)音識(shí)別單元;用于存儲(chǔ)翻譯詞庫(kù)的存儲(chǔ)單元;用于進(jìn)行功能控制和數(shù)據(jù)處理的處理單元;用于顯示信息的顯示單元以及用于輸出語(yǔ)音信息的語(yǔ)音輸出單元;其中,處理單元根據(jù)語(yǔ)音識(shí)別單元所識(shí)別的語(yǔ)音基元從翻譯詞庫(kù)中選出相似度大于預(yù)定閾值的本地文本信息,然后在翻譯詞庫(kù)中檢索相對(duì)應(yīng)的目標(biāo)文本信息并在顯示單元上進(jìn)行顯示。通過采用上述結(jié)構(gòu),在移動(dòng)終端上增加了對(duì)用戶語(yǔ)音進(jìn)行識(shí)別并實(shí)時(shí)翻譯的功能,同時(shí)還可以對(duì)翻譯結(jié)果通過顯示或語(yǔ)音方式輸出,方便、實(shí)用。
文檔編號(hào)H04M11/00GK201054644SQ20062001725
公開日2008年4月30日 申請(qǐng)日期2006年7月25日 優(yōu)先權(quán)日2006年7月25日
發(fā)明者陳修志 申請(qǐng)人:陳修志