欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

Gsm手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法

文檔序號(hào):7685657閱讀:312來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):Gsm手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法
技術(shù)領(lǐng)域
本發(fā)明涉及全球移動(dòng)通訊系統(tǒng)(Global System for Mobile Communications ,以
下簡(jiǎn)稱(chēng)為GSM手機(jī)),特別是一種GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,尤其涉及GSM 手機(jī)應(yīng)用軟件加載需要語(yǔ)音輸出的文本字符串,送給第三方語(yǔ)音合成庫(kù),合成PCM 多媒體流格式數(shù)據(jù),再將PCM數(shù)據(jù)傳遞給GSM手機(jī)多媒體模塊播放,從而實(shí)現(xiàn)GSM 手機(jī)將需要的文本數(shù)據(jù)(短消息、電子書(shū)、電子詞典、來(lái)電號(hào)碼等)合成為語(yǔ)音數(shù) 據(jù)播放出來(lái)的功能。
背景技術(shù)
語(yǔ)音合成技術(shù)(Text-to-Speech,簡(jiǎn)稱(chēng)TTS),學(xué)名為文語(yǔ)轉(zhuǎn)換系統(tǒng),是指利用計(jì) 算機(jī)將任意組合的文本文件轉(zhuǎn)化為聲音文件,并通過(guò)聲卡、電話語(yǔ)音卡等多媒體設(shè) 備將聲音輸出的技術(shù)。目前語(yǔ)音合成技術(shù)已經(jīng)廣泛應(yīng)用于個(gè)人計(jì)算機(jī)中,運(yùn)用TTS 技術(shù)可開(kāi)發(fā)出各種"會(huì)說(shuō)話"的軟件,實(shí)現(xiàn)人機(jī)對(duì)話、語(yǔ)音教學(xué)、助讀助聽(tīng)、有聲校 對(duì)等應(yīng)用。但是嵌入式系統(tǒng),例如GSM手機(jī)中,語(yǔ)音合成技術(shù)的應(yīng)用還不多見(jiàn),將 該技術(shù)應(yīng)用于嵌入式GSM手機(jī)中,可以克服GSM手機(jī)屏幕窄小的缺陷,實(shí)現(xiàn)收聽(tīng)信 息。將語(yǔ)音合成技術(shù)應(yīng)用于閱讀收聽(tīng)短消息、電子書(shū)等文本信息,以及在呼入呼出 時(shí),將電話號(hào)碼以語(yǔ)音播放,能夠進(jìn)一步提升GSM手機(jī)與用戶(hù)的交互環(huán)境,對(duì)于方 便用戶(hù)具有重要的實(shí)際意義。
我們知道,文本數(shù)據(jù)通過(guò)語(yǔ)音合成為PCM數(shù)據(jù)功能的實(shí)現(xiàn)完全是軟件編碼,而 目前GSM手機(jī)基帶處理器都是串行執(zhí)行指令,因而第三方語(yǔ)音合成模塊在進(jìn)行語(yǔ)音 合成時(shí)會(huì)完全占用系統(tǒng)處理器的指令周期,而目前GSM基帶處理器的執(zhí)行速度每秒 處理的百萬(wàn)級(jí)的機(jī)器語(yǔ)言指令數(shù)(Million Instructions Per Second ,簡(jiǎn)稱(chēng)為MIPS) 與個(gè)人計(jì)算機(jī)的處理器相比還非常低,造成語(yǔ)音合成執(zhí)行消耗的時(shí)間都相對(duì)很長(zhǎng), 測(cè)試發(fā)現(xiàn)一塊40字節(jié)的文本,從開(kāi)始送文本數(shù)據(jù)到語(yǔ)音合成結(jié)束耗用的時(shí)間大約是 500毫秒。

發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題重點(diǎn)在于如何實(shí)現(xiàn)文本數(shù)據(jù)能夠在GSM手機(jī)上實(shí)時(shí)進(jìn) 行語(yǔ)音播放。解決語(yǔ)音合成技術(shù)集成到GSM手機(jī)中的技術(shù)問(wèn)題,包括己有軟件系 統(tǒng)對(duì)語(yǔ)音合成模塊的內(nèi)存、堆棧合理分配,由于單次語(yǔ)音合成的文本字節(jié)數(shù)與消耗的 內(nèi)存堆棧是成正比的,我們既要保證模塊消耗的內(nèi)存堆棧不超過(guò)系統(tǒng)ram的極限值,又要保證單次語(yǔ)音合成的文本字節(jié)數(shù)盡可能大,本方法對(duì)系統(tǒng)內(nèi)存的額外消耗大約 在250k字節(jié),單次合成文本40字節(jié);各種應(yīng)用文本字符串的提??;將第三方語(yǔ)音 合成庫(kù)集成到已有的軟件系統(tǒng)架構(gòu)中;TTS合成的PCM語(yǔ)音數(shù)據(jù)實(shí)時(shí)播放;與其他 多媒體語(yǔ)音播放應(yīng)用在并發(fā)事件時(shí)的處理。最終提供一種GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功 能的方法。
本發(fā)明的技術(shù)解決方案如下
一種GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,其特點(diǎn)是包括提取文本文件、將文件 數(shù)據(jù)送給語(yǔ)音合成模塊編碼成脈沖編碼調(diào)制(Pulse Code Modulation,簡(jiǎn)稱(chēng)PCM) 數(shù)據(jù)和PCM數(shù)據(jù)音頻播放三個(gè)過(guò)程,在GSM手機(jī)的基帶處理器中設(shè)置語(yǔ)音合成模塊 和PCM音頻播放模塊,GSM手機(jī)的實(shí)時(shí)多任務(wù)操作系統(tǒng)給語(yǔ)音合成模塊設(shè)置一個(gè)語(yǔ) 音合成任務(wù),給所述的PCM音頻播放模塊設(shè)置PCM數(shù)據(jù)音頻播放任務(wù),并規(guī)定所述 的語(yǔ)音合成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)音頻播放任務(wù)的優(yōu)先級(jí),GSM手機(jī)獲 得文本文件后,所述的基帶處理器的語(yǔ)音合成模塊首先對(duì)第一塊文件數(shù)據(jù)進(jìn)行語(yǔ)音 合成為PCM數(shù)據(jù),送所述的PCM音頻播放模塊進(jìn)行PCM數(shù)據(jù)播放,所述的語(yǔ)音合成 模塊在PCM數(shù)據(jù)播放任務(wù)的時(shí)候完成下一塊文件數(shù)據(jù)的語(yǔ)音合成,在一塊PCM數(shù)據(jù) 音頻播放完成之后,立即將已合成好的下一塊PCM數(shù)據(jù)送給所述的PCM音頻播放模 塊繼續(xù)進(jìn)行播放,從而實(shí)現(xiàn)文本數(shù)據(jù)能夠在GSM手機(jī)上實(shí)時(shí)進(jìn)行語(yǔ)音播放 所述的GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,具體包括下列步驟
步驟1:手機(jī)初始化,建立語(yǔ)音合成任務(wù)及PCM音頻播放任務(wù),并規(guī)定語(yǔ)音合 成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)播放任務(wù)的優(yōu)先級(jí);
步驟2:初始化語(yǔ)音合成模塊,在手機(jī)系統(tǒng)中給模塊分配合適的內(nèi)存及堆棧,
并初始化相關(guān)全局變量及狀態(tài);
步驟3: GSM手機(jī)獲得文本文件后,語(yǔ)音合成模塊狀態(tài)設(shè)置為"運(yùn)行",所述的 語(yǔ)音合成模塊將第1塊文件數(shù)據(jù)的語(yǔ)音合成為第1幀PCM數(shù)據(jù),立刻開(kāi)始第2塊文 件數(shù)據(jù)的語(yǔ)音合成;同時(shí)發(fā)消息給PCM音頻播放模塊,該P(yáng)CM音頻播放模塊通過(guò)外 圍器件和喇叭開(kāi)始播放第1幀PCM數(shù)據(jù);
步驟4:第1幀PCM數(shù)據(jù)播放完成,正好所述的語(yǔ)音合成模塊將第2塊文件數(shù) 據(jù)合成為第2幀PCM數(shù)據(jù),發(fā)消息給所述的PCM音頻播放模塊開(kāi)始第2幀PCM數(shù)據(jù) 播放,同時(shí)啟動(dòng)第3塊文本數(shù)據(jù)的合成;
步驟5:重復(fù)第3第4步,直到最后1幀PCM數(shù)據(jù)合成結(jié)束并播放完成,語(yǔ)音
合成模塊狀態(tài)設(shè)置為"完成"。
所述的步驟2的具體內(nèi)容包括申請(qǐng)存放合成輸出數(shù)據(jù)的緩存ram,申請(qǐng)語(yǔ)音 合成模塊內(nèi)部運(yùn)行所需的堆棧ram,設(shè)置語(yǔ)音合成輸入輸出的回調(diào)方式,設(shè)置語(yǔ)音合成語(yǔ)種、發(fā)音風(fēng)格、音量、音效參數(shù),選定每幀合成文本數(shù)據(jù)的大小為40個(gè)字節(jié), 再將語(yǔ)音合成模塊狀態(tài)設(shè)置為"準(zhǔn)備好";
所述的文本文件是需要經(jīng)語(yǔ)音合成模塊編碼成PCM格式數(shù)據(jù)并進(jìn)行PCM數(shù)據(jù)音 頻播放的文本文件,包括短消息、電子書(shū)、電子詞典或來(lái)電號(hào)碼。
所述的文件數(shù)據(jù)是字符串。
本發(fā)明的技術(shù)效果-
本發(fā)明針對(duì)上述現(xiàn)有技術(shù)提到的語(yǔ)音合成時(shí)間較長(zhǎng)的問(wèn)題,為了在效果上能夠 達(dá)到一邊合成數(shù)據(jù), 一邊語(yǔ)音播放的效果,在GSM手機(jī)軟件實(shí)時(shí)多任務(wù)操作系統(tǒng)給 語(yǔ)音合成模塊設(shè)置一個(gè)語(yǔ)音合成任務(wù),給所述的PCM音頻播放模塊設(shè)置PCM數(shù)據(jù)音 頻播放任務(wù),并規(guī)定所述的語(yǔ)音合成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)音頻播放任 務(wù)的優(yōu)先級(jí),這樣的設(shè)計(jì)能夠?qū)崿F(xiàn)在PCM播放任務(wù)處于空閑的時(shí)候,完成下一塊文 本數(shù)據(jù)的合成。這樣在一塊PCM數(shù)據(jù)播放完成之后,可以立即將已合成好的下一塊 PCM數(shù)據(jù)送給PCM音頻播放模塊繼續(xù)進(jìn)行播放,由于控制每幀合成文本數(shù)據(jù)的大小 為40字節(jié),整個(gè)合成流程消耗系統(tǒng)時(shí)間約500毫秒,而該幀PCM數(shù)據(jù)播放時(shí)間大于 2秒,因而第1幀PCM播放完成時(shí),第2塊文本數(shù)據(jù)也已經(jīng)合成為PCM數(shù)據(jù)。實(shí)現(xiàn) 了語(yǔ)音合成與PCM音頻播放的同步運(yùn)行,文本數(shù)據(jù)能夠在GSM手機(jī)上進(jìn)行實(shí)時(shí)語(yǔ)音 播放,中間不會(huì)感覺(jué)到停頓。運(yùn)用本發(fā)明方法,使GSM手機(jī)更加具有人性化以及智 能化的特征,用戶(hù)使用更加方便,對(duì)于提升GSM手機(jī)與用戶(hù)的交互環(huán)境,有著實(shí)際 使用意義和實(shí)用價(jià)值。


圖1是本發(fā)明GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法的GSM手機(jī)系統(tǒng)方框圖, 圖2是本發(fā)明語(yǔ)音合成及PCM數(shù)據(jù)播放的流程圖,
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,但不要以此限制本發(fā)明的保護(hù) 范圍。
先請(qǐng)參閱圖1,圖1是本發(fā)明GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法的GSM手機(jī)系統(tǒng) 方框圖,
語(yǔ)音合成代碼及PCM編碼資源存儲(chǔ)于手機(jī)系統(tǒng)FLASH13中。在在GSM手機(jī)的基 帶處理器1中設(shè)置語(yǔ)音合成模塊11和PCM音頻播放模塊12,語(yǔ)音合成功能運(yùn)行時(shí), 將要合成的文本字符送給語(yǔ)音合成模塊11,語(yǔ)音合成模塊11依靠TTS編碼資源將 字符數(shù)據(jù)解析并編碼為PCM流媒體格式,之后送給PCM音頻播放模塊12并通過(guò)外圍功放器件2及喇叭3播放。
再參閱圖2,圖2是本發(fā)明語(yǔ)音合成及PCM數(shù)據(jù)播放的流程圖,所述的GSM手機(jī)
實(shí)現(xiàn)語(yǔ)音合成的方法,具體包括下列步驟
步驟1:手機(jī)初始化,建立語(yǔ)音合成任務(wù)及PCM音頻播放任務(wù),并規(guī)定語(yǔ)音合 成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)播放任務(wù)的優(yōu)先級(jí);
步驟2:初始化語(yǔ)音合成模塊12,在手機(jī)系統(tǒng)中給模塊分配合適的內(nèi)存及堆棧,
并初始化相關(guān)全局變量及狀態(tài),并從FLASH獲得TTS資源;
步驟3: GSM手機(jī)獲得文本文件后,所述的語(yǔ)音合成模塊ll獲得第l塊文本字 符并將第1塊文本字符串合成為第1幀PCM數(shù)據(jù),立刻開(kāi)始獲得第2塊文件字符串 并對(duì)第2塊文件字符串進(jìn)行語(yǔ)音合成;同時(shí)發(fā)消息給PCM音頻播放模塊,該P(yáng)CM音 頻播放模塊12通過(guò)外圍器件2和喇叭3開(kāi)始播放第1幀PCM數(shù)據(jù);
步驟4:第1幀PCM數(shù)據(jù)播放完成,正好所述的語(yǔ)音合成模塊11將第2塊文件 數(shù)據(jù)合成為第2幀PCM數(shù)據(jù),發(fā)消息給所述的PCM音頻播放模塊12開(kāi)始第2幀PCM 數(shù)據(jù)播放,同時(shí)啟動(dòng)第3塊文本數(shù)據(jù)的合成;
步驟5:重復(fù)第3第4步,直到最后1幀PCM數(shù)據(jù)合成結(jié)束并播放完成。
試驗(yàn)表明,由于PCM音頻播放任務(wù)優(yōu)先級(jí)高于語(yǔ)音合成任務(wù),在PCM音頻播放 模塊12進(jìn)行第1幀PCM播放的間隙,所述的語(yǔ)音合成模塊11完成第2塊文本數(shù)據(jù) 同步在合成;由于控制每幀合成文本數(shù)據(jù)的大小為40字節(jié),整個(gè)合成流程消耗系統(tǒng) 時(shí)間約500毫秒,而該幀PCM數(shù)據(jù)播放時(shí)間大于2秒,因而第1幀PCM播放完成時(shí), 第2塊文本數(shù)據(jù)也已經(jīng)合成為PCM數(shù)據(jù)。實(shí)現(xiàn)了語(yǔ)音合成與PCM音頻播放的同步運(yùn) 行,達(dá)到了文本字符串實(shí)時(shí)語(yǔ)音播放的效果。
權(quán)利要求
1、一種GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,包括提取文本文件、將文本文件數(shù)據(jù)送給語(yǔ)音合成模塊編碼成PCM格式數(shù)據(jù)和PCM數(shù)據(jù)音頻播放,其特征是在GSM手機(jī)的基帶處理器中設(shè)置語(yǔ)音合成模塊和PCM音頻播放模塊,GSM手機(jī)的實(shí)時(shí)多任務(wù)操作系統(tǒng)給語(yǔ)音合成模塊設(shè)置一個(gè)語(yǔ)音合成任務(wù),給所述的PCM音頻播放模塊設(shè)置PCM數(shù)據(jù)音頻播放任務(wù),并規(guī)定所述的語(yǔ)音合成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)音頻播放任務(wù)的優(yōu)先級(jí),GSM手機(jī)獲得文本文件后,所述的基帶處理器的語(yǔ)音合成模塊首先對(duì)第一塊文本數(shù)據(jù)進(jìn)行語(yǔ)音合成,送所述的PCM音頻播放模塊進(jìn)行PCM數(shù)據(jù)音頻播放,所述的語(yǔ)音合成模塊在PCM數(shù)據(jù)播放任務(wù)的時(shí)間完成下一塊文本數(shù)據(jù)的語(yǔ)音合成,在一塊PCM數(shù)據(jù)音頻播放完成之后,立即將已合成好的下一塊PCM數(shù)據(jù)送給所述的PCM音頻播放模塊繼續(xù)進(jìn)行播放,從而實(shí)現(xiàn)文本數(shù)據(jù)能夠在GSM手機(jī)上實(shí)時(shí)進(jìn)行語(yǔ)音播放
2、 根據(jù)權(quán)利要求1所述的GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,其特征在于包括下列步驟步驟1:手機(jī)初始化,建立語(yǔ)音合成任務(wù)及PCM音頻播放任務(wù),并規(guī)定語(yǔ)音合 成任務(wù)的優(yōu)先級(jí)低于所述的PCM數(shù)據(jù)播放任務(wù)的優(yōu)先級(jí);步驟2:初始化語(yǔ)音合成模塊,在手機(jī)系統(tǒng)中給模塊分配合適的內(nèi)存及堆棧,并初始化相關(guān)全局變量及狀態(tài);步驟3: GSM手機(jī)獲得文本文件后,所述的語(yǔ)音合成模塊將第l塊文本數(shù)據(jù)的語(yǔ) 音合成為第1幀PCM數(shù)據(jù),立刻開(kāi)始第2塊文本數(shù)據(jù)的合成;同時(shí)發(fā)消息給PCM音 頻播放模塊,該P(yáng)CM音頻播放模塊通過(guò)外圍器件和喇叭開(kāi)始播放第1幀PCM數(shù)據(jù);步驟4:第1幀PCM數(shù)據(jù)播放完成,正好所述的語(yǔ)音合成模塊將第2塊文本數(shù) 據(jù)合成為第2幀PCM數(shù)據(jù),發(fā)消息給所述的PCM音頻播放模塊開(kāi)始第2幀PCM數(shù)據(jù) 播放,同時(shí)啟動(dòng)第3塊文本數(shù)據(jù)的合成;步驟5:重復(fù)第3第4步,直到最后1幀PCM數(shù)據(jù)合成結(jié)束并播放完成。
3、 根據(jù)權(quán)利要求2所述的GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,其特征在于所述 的步驟2具體包括申請(qǐng)存放合成輸出數(shù)據(jù)的緩存ram,申請(qǐng)語(yǔ)音合成模塊內(nèi)部運(yùn) 行所需的堆棧ram,設(shè)置語(yǔ)音合成輸入輸出的回調(diào)方式,設(shè)置語(yǔ)音合成語(yǔ)種、發(fā)音 風(fēng)格、音量、音效參數(shù),選定每幀合成文本數(shù)據(jù)的大小為40個(gè)字節(jié),再將語(yǔ)音合成模塊狀態(tài)設(shè)置為"準(zhǔn)備好";
4、 根據(jù)權(quán)利要求1所述的GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,其特征在于所述 的文本是需要經(jīng)語(yǔ)音合成模塊編碼成PCM格式數(shù)據(jù)并進(jìn)行PCM數(shù)據(jù)音頻播放的文本,包括短消息、電子書(shū)、電子詞典或來(lái)電號(hào)碼。
5、根據(jù)權(quán)利要求1所述的GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,其特征在于所述 的文本數(shù)據(jù)是字符串。
全文摘要
一種GSM手機(jī)實(shí)現(xiàn)語(yǔ)音合成功能的方法,尤其涉及GSM手機(jī)應(yīng)用軟件加載需要語(yǔ)音輸出的文本文件,送給第三方語(yǔ)音合成庫(kù),合成PCM數(shù)據(jù),再將PCM數(shù)據(jù)傳遞給PCM音頻播放模塊播放,從而實(shí)現(xiàn)GSM手機(jī)將需要的文本數(shù)據(jù)合成為語(yǔ)音數(shù)據(jù)播放出來(lái)的功能。
文檔編號(hào)H04M1/725GK101299332SQ200810038930
公開(kāi)日2008年11月5日 申請(qǐng)日期2008年6月13日 優(yōu)先權(quán)日2008年6月13日
發(fā)明者進(jìn) 肖 申請(qǐng)人:嘉興聞泰通訊科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
武川县| 临漳县| 桑日县| 彩票| 新田县| 徐闻县| 加查县| 镇原县| 新竹县| 兴山县| 秭归县| 泸西县| 敦煌市| 铜鼓县| 明水县| 神池县| 永济市| 扶绥县| 手游| 利辛县| 博兴县| 民丰县| 织金县| 库伦旗| 海南省| 邯郸县| 大悟县| 竹溪县| 荃湾区| 象山县| 玛曲县| 武冈市| 遂宁市| 双流县| 东乡县| 昭平县| 朔州市| 桐梓县| 崇州市| 阳谷县| 湖南省|