專利名稱::手機短信語音朗讀方法
技術領域:
:本發(fā)明涉及移動通信領域,更具體地說,涉及一種手機短信語音朗讀方法。
背景技術:
:現在世界各國的人口中都有一定比例的盲人,這些盲人出門在外時,常常不知道自己的具體方位,周邊的服務機構有哪些。但是,在中國某些地區(qū),經過注冊的盲人通過用手機撥通特服號碼"96931"或者"38491689"就能在數秒鐘之內獲得自己所處的準確位置以及附近的交通、商店、醫(yī)院、警察局等信息。坐在公交車上,如果不知道是否到站,盲人也可撥打這個號碼,就可以提醒自己在哪里下車。這類系統還能自動提供在當前乘車點的公交線路及時間,方便盲人出行。為了讓盲人也能"看"短信,使盲人與聾啞人可以溝通,定位系統呼叫中心還開通了"05190"的短訊端口,盲人只要撥打這個特服號碼,就可以收聽他人發(fā)來的經過轉換的語音信息。同時還可以撥打"1258",由服務人員為其待發(fā)短訊到對方手機上。但這些都需要通過服務中心的支持,才能做到這一點。每次服務,中心還會收取一定費用。如果盲人用戶自己的手機就能支持自行"朗讀"別人發(fā)來的短信,那么對于盲人用戶來說,會帶來很大的便利。目前,美國微軟公司有一種TTS發(fā)音引擎技術,可以流暢地將文本轉換為英文或者中文朗讀出來。TTS的全稱為TextToSpeech,即"從文本到語音"。它同時運用語言學和心理學的原理,在內置芯片的支持下,通過神經網絡的設計,把文字智能化地轉化為自然語音流。TTS技術對文本文件進行實時轉換,轉換時間以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機器語音輸出的冷漠與生澀感。TTS語音合成技術即將覆蓋國標一、二級漢字,具有英文接口,自動識別中、英文,支持中英文混讀。所有聲音采用真人普通話為標準發(fā)音,實現了120150個漢字/秒的語音合成,朗讀速度達到34個/秒,使用戶可以聽到清晰悅耳的音質和連貫流暢的語調。應用了這種技術的軟件,一般在個人電腦上使用。在高端手機上,也有利用了此技術的軟件出現。該技術盡管語音朗讀的效果很好,但是,其需要的軟硬件配置要求較高,成本很昂貴,不利于在廣大發(fā)展中國家推廣使用。市場上對能朗讀短信的適合中低端盲人用戶使用的手機的需求很大。
發(fā)明內容本發(fā)明要解決的技術問題在于,針對現有技術的上述對軟硬件配置的要求高、成本高昂的缺陷,提供一種成本較低的手機短信語音朗讀方法。本發(fā)明解決其技術問題所采用的技術方案是提供一種手機短信語音朗讀方法,包括下列步驟SI:接收短信;S2:設置語音庫級別計數器n=1;轉步驟S3;S3:在n級語音庫檢索Sl中接收到的短信中在n級語音庫中存有相應語音數據的字的語音數據,并將檢索到的語音的字、以及相應的語音數據記錄到短信語音對照表;轉步驟S4;S4:判斷是否所有的字都已經檢索到對應的語音數據;如果是,轉步驟S6;否則,轉步驟S5;S5:判斷是否各級語音庫都已經檢索完畢;如果是,轉步驟S5.1;否則,轉步驟S5.2;S5.1:將短信語音對照表中,沒有檢索到語音數據的字的語音數據用預定的提示語音數據填入;轉步驟S6;S5.2:將語音庫級別計數器n加1;轉步驟S3;S6:將短信語音對照表中的語音數據按照短信文字的順序串接起來;轉步驟S7;S7:將步驟S6中串接好的短信語音播放出來;轉S8;S8:結束。在本發(fā)明所述的手機短信語音朗讀方法,所述語音庫包括1級語音庫、2級語音庫.......N級語音庫,所述1級語音庫中存放的是常用字中使用頻率高于預定值^的字及其對應的語音數據;所述2級語音庫中存放的是常用字中使用頻率高于預定值x2的字及其對應的語音數據;......所述N級語音庫存放的是常用字中使用頻率低于預定值x,—工的字及其對應的語音數據;所述N的值為大于2的正整數;所述Xl>x2>xN—lt)在本發(fā)明所述的手機短信語音朗讀方法中,所述語音數據為AMR語音數據。在本發(fā)明所述的手機短信語音朗讀方法中,所述1級語音庫至N級語音庫中總共包括30005000個常用漢字的語音數據。在本發(fā)明所述的手機短信語音朗讀方法中,所述步驟S7中,播放短信語音是通過對短信語音數據進行語音合成處理后播放出的。在本發(fā)明所述的手機短信語音朗讀方法中,所述步驟SI中接收短信后,還包括發(fā)出語音提示"語音朗讀短信還是顯示到屏幕?"的步驟。實施本發(fā)明的手機短信語音朗讀方法,具有以下有益效果本方法通過簡化設計,剔除了不常用的漢字,對于不認識的漢字采用預定的語音來標記,大大減少了實施時所需要的存儲空間;并且由于其檢索范圍大為減小、檢索速度快,十分便于在處理器速度較低的中低端手機上實施本方法;本方法實施成本低廉,對廣大中低端手機用戶尤其是盲人用戶具有極大的吸引力。下面將結合附圖及實施例對本發(fā)明作進一步說明,附圖中圖1是本發(fā)明手機短信語音朗讀方法的流程圖。具體實施例方式圖1是本發(fā)明手機短信語音朗讀方法的流程圖。首先是步驟SI:接收短信,發(fā)出語音提示"語音朗讀短信還是顯示到屏幕?"然后用戶通過手機上的某個按鍵對上述語音提示做出選擇,如果用戶選擇"顯示到屏幕"所對應的按鍵,則手機將按照正常的短信顯示流程將短信顯示在手機的屏幕上,然后到步驟S8結束;如果用戶選擇"語音朗讀短信"所對應的按鍵,則轉步驟S2,進入本發(fā)明的方法的各個步驟。步驟S2:設置語音庫級別計數器n=1;然后轉步驟S3。S3:在n級語音庫檢索SI中接收到的短信中設有相應語音的字的語音數據,并將檢索到的語音的字、以及相應的語音數據記錄到短信語音對照表;轉步驟S4;S4:判斷是否所有的字都已經檢索到對應的語音數據;如果是,轉步驟S6;否則,轉步驟S5;S5:判斷是否所有的語音庫都已經檢索完畢;如果是,轉步驟S5.1;否則,轉步驟S5.2;S5.1:將短信語音對照表中,沒有檢索到語音的字的語音數據用預定的提示語音數據填入;轉步驟S6;S5.2:將語音庫級別計數器n加1;轉步驟S3;S6:將短信語音對照表中的語音數據按照短信文字的順序串接起來;轉步驟S7;S7:將步驟S6中串接好的短信語音播放出來;轉S8;S8:結束。上述步驟中,語音庫包括1級語音庫、2級語音庫.......N級語音庫,N的值為大于2的正整數。為了減少檢索的時間,加快語音合成速度,可以將常用字進行分級的語音檢索。將語音庫分為多級(按照常用程度從高到低分為1、2、3、4......N級),每個級別的語音庫中的數據都是互相不重復的,也就是說,在某個級別的語音庫中出現了某個字的語音數據后,其余級別的語音庫中則不會出現此字的語音數據。1級語音庫至N級語音庫中共包括30005000個常用漢字的語音數據。1級語音庫中存放的是常用字中使用頻率高于預定值A的字及其對應的語音數據;2級語音庫中存放的是常用字中使用頻率高于預定值^的字及其對應的語音數據;......N級語音庫存放的是常用字中使用頻率低于預定值xN—工的字及其對應的語音數據;N的值為大于2的正整數;上述Xl>x2>xN—lt)也就是說,1級語音庫中存放的是常用字中的最常用的字的語音數據。1級語音庫中存放的字的使用頻率比2級語音庫中存放的使用頻率高,2級語音庫中存放的字的使用頻率比3級語音庫中存放的使用頻率高......依次類推。對語音庫的檢索按照如下順序先從1級語音庫開始檢索,如果檢索不到則轉到下一級語音庫進行檢索。這種分級檢索順序有利于平均檢索時間較少,檢索速度比較快。檢索到語音的字,以及相應的語音數據會記錄入短信語音對照表。在短信語音對照表中,沒有檢索到語音數據的字用預定的提示語音數據替代(該預定的提示語音數據以特殊語音數據表示該字沒法檢索到相應語音)下面的表1是一個實施例的1級短信語音數據對照表表1:<table>tableseeoriginaldocumentpage6</column></row><table>注英文字母、標點符號、阿拉伯數字都存放在1級短信語音對照表,標點以正常的漢語語音來閱讀,例如,語音將逗號","讀為"逗號"。本方法中的語音庫中,剔除了不常用的漢字,對于英文則按照單個字母朗讀,對于不認識的漢字則采用預定的提示語音來標記(該預定的提示語音采用一定的特殊語音表示該字沒法檢索到相應語音,盲人用戶聽到該語音即可知曉該字沒有檢索到相應語音。在這種情況下,用戶可以利用上下文大致猜測到其含義),通過將常用字語音數據存儲在數據庫文件中(該文件按照5000個常用字來計算,每個字錄制成AMR(Ad即tibveMulti-Rate,自適應多碼率)語音后大約占用1K存儲空間,則數據庫文件占用56M的存儲空間。因為目前T卡的成本已經很低,而且其廣泛地應用在了中低端手機上,所以將數據庫文件存儲在T卡上有利于成本的降低)。然后,根據接收到的短信,在常用字語音數據庫中檢索到短信的每個字的相應的語音數據,然后通過語音合成,即可將短信的內容播放給盲人用戶。本發(fā)明的手機短信語音朗讀方法采用了簡化的合成語音文件的方法,雖然不能做到象微軟的TTS智能語音技術那樣流暢的效果,而且不能做到實時的合成并播放(因為檢索出文字時對應的語音會需要一定的檢索時間,盲人用戶會需要一定的時間來等待短信被合成為語音),但是在成本上會大大優(yōu)于微軟的TTS技術,中低端手機的生產廠商無需購買國外昂貴的專利,因此采用本發(fā)明的方法的成本具有很大的優(yōu)勢,適合廣大的中低端的盲人用戶群,因此必然具有很廣闊的市場前景。以上實施例僅表達了本發(fā)明的優(yōu)選實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制;應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍;因此,凡跟本發(fā)明權利要求范圍所做的等同變換與修飾,均應屬于本發(fā)明權利要求的涵蓋范圍。權利要求一種手機短信語音朗讀方法,其特征在于,包括下列步驟S1接收短信;S2設置語音庫級別計數器n=1;轉步驟S3;S3在n級語音庫檢索S1中接收到的短信中在n級語音庫中存有相應語音數據的字的語音數據,并將檢索到語音數據的字、以及相應的語音數據記錄到短信語音對照表;轉步驟S4;S4判斷是否所有的字都已經檢索到對應的語音數據;如果是,轉步驟S6;否則,轉步驟S5;S5判斷是否各級語音庫都已經檢索完畢;如果是,轉步驟S5.1;否則,轉步驟S5.2;S5.1將短信語音對照表中,沒有在語音庫中檢索到語音數據的字的語音數據用預定的提示語音數據填入;轉步驟S6;S5.2將語音庫級別計數器n加1;轉步驟S3;S6將短信語音對照表中的語音按照短信文字的順序串接起來;轉步驟S7;S7將步驟S6中串接好的短信語音播放出來;轉S8;S8結束。2.根據權利要求1所述的手機短信語音朗讀方法,其特征在于,所述語音庫包括1級語音庫、2級語音庫.......N級語音庫,所述1級語音庫中存放的是常用字中使用頻率高于預定值A的字及其對應的語音數據;所述2級語音庫中存放的是常用字中使用頻率高于預定值X2的字及其對應的語音數據;......所述N級語音庫存放的是常用字中使用頻率低于預定值xN—工的字及其對應的語音數據;所述N的值為大于2的正整數;所述Xl>x2>Xh。3.根據權利要求l所述的手機短信語音朗讀方法,其特征在于,所述語音數據為AMR語音數據。4.根據權利要求2所述的手機短信語音朗讀方法,其特征在于,所述1級語音庫至N級語音庫中總共包括30005000個常用漢字的語音數據。5.根據權利要求2所述的手機短信語音朗讀方法,其特征在于,所述1級語音庫中包括英文字母、標點符號、阿拉伯數字所對應的語音數據。6.根據權利要求1所述的手機短信語音朗讀方法,其特征在于,所述步驟S7中,播放短信語音是通過對短信語音數據進行語音合成處理后播放出的。7.根據權利要求1所述的手機短信語音朗讀方法,其特征在于,所述步驟Sl中接收短信后,還包括發(fā)出語音提示"語音朗讀短信還是顯示到屏幕?"的步驟。全文摘要本發(fā)明涉及一種手機短信語音朗讀方法,包括下列步驟接收短信;在1至n級語音庫中檢索接收到的短信中在語音庫中存有相應語音數據的字的語音數據,并將檢索到語音數據的字、以及相應的語音數據記錄到短信語音對照表;然后將短信語音對照表中,沒有檢索到語音數據的字的語音數據用預定的提示語音數據填入;最后將短信語音對照表中的語音按照短信文字的順序串接起來后將其播放出來。實施本發(fā)明的手機短信語音朗讀方法,具有以下有益效果實施時所需要的存儲空間小,便于在處理器速度較低的中低端手機上實施本方法,且成本低廉。文檔編號G10L13/00GK101753695SQ20081021831公開日2010年6月23日申請日期2008年12月10日優(yōu)先權日2008年12月10日發(fā)明者何斌申請人:康佳集團股份有限公司