專利名稱:一種即時通信方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于即時通信領(lǐng)域,尤其涉及一種輸出語音即時通信消息的即時通信方法及系統(tǒng)。
背景技術(shù):
即時通信(Instant Messaging)系統(tǒng)是一種能夠即時發(fā)送和接收互聯(lián)網(wǎng)消息的系統(tǒng)。通過即時通信系統(tǒng),用戶可以向其他用戶發(fā)送文本消息、傳送文件、或者與其他用戶進(jìn)行音頻對話、視頻對話等通信活動。
文字語音轉(zhuǎn)換(TTS)是一種能通過一定的算法,把輸入的文字信息轉(zhuǎn)化成一定格式的語音信息的技術(shù)。經(jīng)過長時間的發(fā)展,目前文字語音轉(zhuǎn)換技術(shù)已經(jīng)比較成熟。
現(xiàn)有技術(shù)中將即時通信與文字語音轉(zhuǎn)換進(jìn)行結(jié)合,將用戶輸入的文字即時通信消息轉(zhuǎn)換為語音即時消息輸出,這樣當(dāng)用戶收到即時通信消息時,就可以收聽與原來的文字輸入一致的語音即時通信消息,大大提高了用戶的即時通信體驗(yàn)。
但是隨著用戶需求的不斷提高,用戶希望在輸出語音即時通信消息的同時,可以輸出與輸入文字有關(guān)的音頻素材,如背景音樂、用戶錄制的音頻文件等,進(jìn)一步提高用戶的即時通信體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于將音頻數(shù)據(jù)集成到即時通信消息中,使得在輸出由輸入文字轉(zhuǎn)換的語音即時通信消息的同時,能夠輸出對應(yīng)的音頻數(shù)據(jù)。
為了實(shí)現(xiàn)發(fā)明目的,本發(fā)明提供了一種即時通信方法,將文字即時通信消息轉(zhuǎn)換為語音即時通信消息輸出,所述方法進(jìn)一步包括設(shè)置音頻數(shù)據(jù)庫,用于存儲音頻數(shù)據(jù);從所述音頻數(shù)據(jù)庫中選擇音頻數(shù)據(jù);將所述語音即時通信消息和所述音頻數(shù)據(jù)合并為同一數(shù)據(jù)格式的合成語音消息;將所述合成語音消息發(fā)送給對應(yīng)的用戶。
所述音頻數(shù)據(jù)保存在即時通信服務(wù)端。
所述音頻數(shù)據(jù)保存在即時通信客戶端。
為了更好地實(shí)現(xiàn)發(fā)明目的,本發(fā)明進(jìn)一步提供了一種即時通信系統(tǒng),包括文字輸入模塊,用于接收文字即時通信消息;文字語音轉(zhuǎn)換模塊,用于將所述文字即時通信消息轉(zhuǎn)換為語音即時通信消息;消息輸出模塊,用于輸出所述語音即時通信消息,所述系統(tǒng)進(jìn)一步包括音頻數(shù)據(jù)庫,用于存儲音頻數(shù)據(jù);音頻數(shù)據(jù)選擇模塊,用于從所述音頻數(shù)據(jù)庫中選擇音頻數(shù)據(jù);數(shù)據(jù)合成模塊,用于所述語音即時通信消息和所述音頻數(shù)據(jù)合并為同一數(shù)據(jù)格式的合成語音消息,并將所述合成語音消息發(fā)送給消息輸出模塊,由消息輸出模塊將所述合成語音消息發(fā)送給對應(yīng)的用戶。
所述音頻數(shù)據(jù)保存在即時通信服務(wù)端。
所述音頻數(shù)據(jù)保存在即時通信客戶端。
本發(fā)明將音頻數(shù)據(jù)集成到即時通信消息中,使得在輸出語音即時通信消息的同時,能夠輸出對應(yīng)的音頻數(shù)據(jù),提高提高用戶的即時通信體驗(yàn)。
圖1是本發(fā)明提供的即時通信方法的實(shí)現(xiàn)流程圖;圖2是本發(fā)明提供的即使通信系統(tǒng)的結(jié)構(gòu)圖。
具體實(shí)施例方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
圖1示出了本發(fā)明提供的即時通信方法的實(shí)現(xiàn)流程,詳述如下在步驟S101中,接收即時通信用戶輸入的需要發(fā)送的文字即時通信消息;在步驟S102中,將文字即時通信消息轉(zhuǎn)換為語音即時通信消息;在步驟S103中,選擇音頻數(shù)據(jù),音頻數(shù)據(jù)的格式可以是擴(kuò)展名為.cda的音樂CD播放文件;擴(kuò)展名為如.mid、.midi或.rmi的樂器數(shù)字接口(MIDI)文件;擴(kuò)展名為.mp3或.m3u的MP3文件,以及擴(kuò)展名為.aif、.aifc或.aiff音頻交換文件格式(AIFF)等等。
在本發(fā)明的一個實(shí)施例中,音頻數(shù)據(jù)由即時通信系統(tǒng)的服務(wù)端提供,用戶不能更改,只能在服務(wù)端提供的音頻數(shù)據(jù)素材中選擇與輸入文字即時通信消息對應(yīng)的音頻數(shù)據(jù)。
在本發(fā)明的另一個實(shí)施例中,用戶可以根據(jù)自己的即時通信需要,選擇客戶端保存的音頻數(shù)據(jù)或者通過客戶端下載音頻數(shù)據(jù)作為即時通信消息的內(nèi)容。
作為優(yōu)選實(shí)施例,音頻數(shù)據(jù)由即時通信系統(tǒng)的服務(wù)端提供,同時允許將客戶端保存的音頻數(shù)據(jù)或者通過客戶端下載的音頻數(shù)據(jù)作為即時通信消息的內(nèi)容。
在步驟S104中,將語音即時通信消息和音頻數(shù)據(jù)合并為合成語音消息,將語音即時通信消息和音頻數(shù)據(jù)轉(zhuǎn)換為同一的數(shù)據(jù)格式,如MIDI或者M(jìn)P3等;在步驟S105中,將合成語音消息發(fā)送給接收消息的用戶。這樣,用戶在收到消息后,在接聽語音即時通信消息的同時,可以收聽與消息內(nèi)容對應(yīng)的背景音頻數(shù)據(jù)。
圖2示出了本發(fā)明提供的即時通信系統(tǒng)的系統(tǒng)構(gòu)成,為便于理解,僅描述與本發(fā)明相關(guān)的部分。
即時通信子系統(tǒng)100為現(xiàn)有技術(shù)中即時通信系統(tǒng)的組成部分,其功能是將輸入的文字即時通信消息轉(zhuǎn)換成語音即時通信消息輸出。文字輸入模塊101接收用戶輸入的文字即時通信消息,將文字即時通信消息轉(zhuǎn)發(fā)到文字語音轉(zhuǎn)換模塊102進(jìn)行處理。文字語音轉(zhuǎn)換模塊102利用文字語音轉(zhuǎn)換技術(shù)對文字即時通信消息進(jìn)行語音轉(zhuǎn)換處理,將其轉(zhuǎn)換成與輸入文字的內(nèi)容一致的語音即時通信消息,將語音即時通信消息發(fā)送到消息輸出模塊103。消息輸出模塊103對外輸出語音即時通信消息。
即時通信子系統(tǒng)200用于將音頻數(shù)據(jù)與即時通信子系統(tǒng)100生成的語音即時通信消息進(jìn)行合成處理。在具體實(shí)現(xiàn)上,即時通信子系統(tǒng)200可以作為單獨(dú)的系統(tǒng)外掛到即時通信子系統(tǒng)100上,或者集成到現(xiàn)有的即時通信系統(tǒng)中。
音頻數(shù)據(jù)庫201用于存儲用戶的音頻數(shù)據(jù),包括音樂或者用戶錄制的各種音頻素材等。音頻數(shù)據(jù)的格式可以是擴(kuò)展名為.cda的音樂CD播放文件;擴(kuò)展名為如.mid、.midi或.rmi的樂器數(shù)字接口(MIDI)文件;擴(kuò)展名為.mp3或.m3u的MP3文件,以及擴(kuò)展名為.aif、.aifc或.aiff音頻交換文件格式(AIFF)等等。
在本發(fā)明的一個實(shí)施例中,音頻數(shù)據(jù)庫201中的音頻數(shù)據(jù)由即時通信系統(tǒng)的服務(wù)端提供,用戶不能更改,只能在服務(wù)端提供的音頻數(shù)據(jù)素材中選擇與輸入文字即時通信消息對應(yīng)的音頻數(shù)據(jù)。
在本發(fā)明的另一個實(shí)施例中,用戶可以根據(jù)自己的即時通信需要,將客戶端保存的音頻數(shù)據(jù)或者通過客戶端下載音頻數(shù)據(jù)作為音頻數(shù)據(jù)庫201中的內(nèi)容加入到即時通信消息中。
作為優(yōu)選實(shí)施例,音頻數(shù)據(jù)庫201的音頻數(shù)據(jù)由即時通信系統(tǒng)的服務(wù)端提供,同時允許用戶選擇客戶端本地保存的音頻數(shù)據(jù)或者通過客戶端下載的音頻數(shù)據(jù)作為即時通信消息的內(nèi)容。
音頻數(shù)據(jù)選擇模塊202從音頻數(shù)據(jù)庫201中選擇音頻數(shù)據(jù),發(fā)送給數(shù)據(jù)合并模塊203。
數(shù)據(jù)合并模塊203接收文字語音轉(zhuǎn)換模塊102發(fā)送的語音即時通信消息和音頻數(shù)據(jù)選擇模塊202發(fā)送的音頻數(shù)據(jù),將語音即時通信消息和音頻數(shù)據(jù)合并成一個合成語音消息,將語音即時通信消息和音頻數(shù)據(jù)轉(zhuǎn)換為同一的數(shù)據(jù)格式,如MIDI或者M(jìn)P3等。消息輸出模塊102將合成語音消息發(fā)送給相應(yīng)的用戶。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種即時通信方法,將文字即時通信消息轉(zhuǎn)換為語音即時通信消息輸出,其特征在于,所述方法進(jìn)一步包括設(shè)置音頻數(shù)據(jù)庫,用于存儲音頻數(shù)據(jù);從所述音頻數(shù)據(jù)庫中選擇音頻數(shù)據(jù);將所述語音即時通信消息和所述音頻數(shù)據(jù)合并為同一數(shù)據(jù)格式的合成語音消息;將所述合成語音消息發(fā)送給對應(yīng)的用戶。
2.如權(quán)利要求1所述的即時通信方法,其特征在于,所述音頻數(shù)據(jù)保存在即時通信服務(wù)端。
3.如權(quán)利要求1所述的即時通信方法,其特征在于,所述音頻數(shù)據(jù)保存在即時通信客戶端。
4.一種即時通信系統(tǒng),包括文字輸入模塊,用于接收文字即時通信消息;文字語音轉(zhuǎn)換模塊,用于將所述文字即時通信消息轉(zhuǎn)換為語音即時通信消息;消息輸出模塊,用于輸出所述語音即時通信消息,其特征在于,所述系統(tǒng)進(jìn)一步包括音頻數(shù)據(jù)庫,用于存儲音頻數(shù)據(jù);音頻數(shù)據(jù)選擇模塊,用于從所述音頻數(shù)據(jù)庫中選擇音頻數(shù)據(jù);數(shù)據(jù)合成模塊,用于所述語音即時通信消息和所述音頻數(shù)據(jù)合并為同一數(shù)據(jù)格式的合成語音消息,并將所述合成語音消息發(fā)送給消息輸出模塊,由消息輸出模塊將所述合成語音消息發(fā)送給對應(yīng)的用戶。
5.如權(quán)利要求4所述的即時通信系統(tǒng),其特征在于,所述音頻數(shù)據(jù)保存在即時通信服務(wù)端。
6.如權(quán)利要求4所述的即時通信系統(tǒng),其特征在于,所述音頻數(shù)據(jù)保存在即時通信客戶端。
全文摘要
本發(fā)明適用于即時通信領(lǐng)域,提供了一種即時通信方法及系統(tǒng),將用戶輸入的文字即時通信消息轉(zhuǎn)換為語音消息輸出,所述方法包括設(shè)置音頻數(shù)據(jù)庫,用于存儲音頻數(shù)據(jù);從所述音頻數(shù)據(jù)庫中選擇音頻數(shù)據(jù);將所述語音即時通信消息和所述音頻數(shù)據(jù)合并為同一數(shù)據(jù)格式的合成語音消息;將所述合成語音消息發(fā)送給對應(yīng)的用戶。通過本發(fā)明,可以將音頻數(shù)據(jù)集成到即時通信消息中,使得在輸出語音即時通信消息的同時,能夠輸出對應(yīng)的音頻數(shù)據(jù),提高提高用戶的即時通信體驗(yàn)。
文檔編號G10L13/00GK1941747SQ20051003752
公開日2007年4月4日 申請日期2005年9月27日 優(yōu)先權(quán)日2005年9月27日
發(fā)明者張和興, 溫倬卓 申請人:騰訊科技(深圳)有限公司