一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備的制作方法
【專利摘要】本發(fā)明提供一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備。該輸出語(yǔ)音的方法應(yīng)用于一電子設(shè)備中,所述方法包括:獲得第一待輸出內(nèi)容;分析所述第一待輸出內(nèi)容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內(nèi)容所攜帶的情緒;獲得所述第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);基于所述第一情緒信息,對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián);輸出所述第二待輸出語(yǔ)音數(shù)據(jù)。
【專利說(shuō)明】一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備。
【背景技術(shù)】
[0002]隨著電子設(shè)備技術(shù)與語(yǔ)音識(shí)別技術(shù)的發(fā)展,用戶與電子設(shè)備之間的溝通和互動(dòng)越來(lái)越多,電子設(shè)備可以將文本信息轉(zhuǎn)換成語(yǔ)音輸出,而且用戶和電子設(shè)備可以通過(guò)語(yǔ)音互動(dòng),例如,電子設(shè)備可以回答用戶提出的問(wèn)題,使得電子設(shè)備越來(lái)越人性化。
[0003]然而,本發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn),雖然電子設(shè)備可以識(shí)別用戶的語(yǔ)音進(jìn)行相應(yīng)操作、或者將文本轉(zhuǎn)換為語(yǔ)音輸出、或者與用戶進(jìn)行語(yǔ)音交談,但是現(xiàn)有技術(shù)中的語(yǔ)音互動(dòng)系統(tǒng)、或語(yǔ)音輸出系統(tǒng)中電子設(shè)備的語(yǔ)音信息中不帶有與情感表達(dá)相關(guān)的信息,進(jìn)而導(dǎo)致輸出的語(yǔ)音也不帶有任何情緒,所以對(duì)話比較單調(diào),使得語(yǔ)音控制和人機(jī)互動(dòng)的效率較低,用戶體驗(yàn)差。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備,用以解決現(xiàn)有技術(shù)中存在的電子設(shè)備的輸出語(yǔ)音數(shù)據(jù)中不帶有與情感表達(dá)相關(guān)的信息的技術(shù)問(wèn)題,及由此而帶來(lái)的人機(jī)交互時(shí)情感單調(diào),用戶體驗(yàn)差的問(wèn)題。
[0005]本發(fā)明一方面提供了一種輸出語(yǔ)音的方法,應(yīng)用于一電子設(shè)備中,所述方法包括:獲得第一待輸出內(nèi)容;分析所述第一待輸出內(nèi)容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內(nèi)容所攜帶的情緒;獲得所述第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);基于所述第一情緒信息,對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián);輸出所述第二待輸出語(yǔ)音數(shù)據(jù)。
[0006]優(yōu)選地,所述獲得第一待輸出內(nèi)容具體為:獲取通過(guò)即時(shí)通信應(yīng)用接收到的語(yǔ)音數(shù)據(jù);獲取通過(guò)所述電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù);或者獲取顯示在所述電子設(shè)備的顯示單元上的文本信息。
[0007]優(yōu)選地,當(dāng)所述第一待輸出內(nèi)容為所述語(yǔ)音數(shù)據(jù)時(shí),所述分析所述第一待輸出內(nèi)容,獲得第一情緒信息,具體包括:分別將所述語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
[0008]優(yōu)選地,所述對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),具體包括:調(diào)整所述第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二待輸出語(yǔ)音數(shù)據(jù)。
[0009]本發(fā)明另一方面提供一種語(yǔ)音交互的方法,應(yīng)用于一電子設(shè)備,所述方法包括:接收一用戶輸入的第一語(yǔ)音數(shù)據(jù);分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語(yǔ)音數(shù)據(jù)的用戶在輸入所述第一語(yǔ)音數(shù)據(jù)時(shí)的情緒;獲得一針對(duì)所述第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù);基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得所述用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián);輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0010]優(yōu)選地,所述分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,具體包括:分別將所述第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
[0011]優(yōu)選地,所述分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,具體包括:判斷所述第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值;當(dāng)所述連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定所述第一語(yǔ)音數(shù)據(jù)中的情緒信息為所述第一情緒信息。
[0012]優(yōu)選地,所述基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),具體包括:調(diào)整所述第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0013]優(yōu)選地,所述基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),具體為:基于所述第一情緒信息,在所述第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示所述第二情緒信息的語(yǔ)音數(shù)據(jù),獲得所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0014]本發(fā)明一實(shí)施例還提供一種電子設(shè)備,所述電子設(shè)備包括:電路板;獲得單元,電性連接于所述電路板,用于獲得第一待輸出內(nèi)容;處理芯片,設(shè)置于所述電路板上,用于分析所述第一待輸出內(nèi)容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內(nèi)容所攜帶的情緒;獲得所述第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);基于所述第一情緒信息,對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián);輸出單元,電性連接于所述處理芯片,用于輸出所述第二待輸出語(yǔ)音數(shù)據(jù)。
[0015]優(yōu)選地,當(dāng)所述第一待輸出內(nèi)容為一語(yǔ)音數(shù)據(jù)時(shí),所述處理芯片具體用于分別將所述語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
[0016]優(yōu)選地,所述處理芯片具體用于調(diào)整所述第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二待輸出語(yǔ)音數(shù)據(jù)。[0017]本發(fā)明再一實(shí)施例還提供一種電子設(shè)備,所述電子設(shè)備包括:電路板;語(yǔ)音接收單元,電性連接于所述電路板,用于接收一用戶輸入的第一語(yǔ)音數(shù)據(jù);處理芯片,設(shè)置于所述電路板上,用于分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語(yǔ)音數(shù)據(jù)的用戶在輸入所述第一語(yǔ)音數(shù)據(jù)時(shí)的情緒;獲得一針對(duì)所述第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù);基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得所述用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián);輸出單元,電性連接于所述處理芯片,用于輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0018]優(yōu)選地,所述處理芯片具體用于分別將所述第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
[0019]優(yōu)選地,所述處理芯片具體用于判斷所述第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值;當(dāng)所述連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定所述第一語(yǔ)音數(shù)據(jù)中的情緒信息為所述第一情緒信息。
[0020]優(yōu)選地,所述處理芯片具體用于調(diào)整所述第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0021]優(yōu)選地,所述處理芯片具體用于基于所述第一情緒信息,在所述第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示所述第二情緒信息的語(yǔ)音數(shù)據(jù),獲得所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0022]本發(fā)明實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
[0023]本發(fā)明一實(shí)施例采用分析待輸出內(nèi)容(例如短信或其他文本信息、或通過(guò)即時(shí)通信軟件接收到的語(yǔ)音數(shù)據(jù)、或者是通過(guò)電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù))的情緒信息,然后基于情緒信息,對(duì)與待輸出內(nèi)容對(duì)應(yīng)的待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,最后獲得包含第二情緒信息的待輸出語(yǔ)音數(shù)據(jù),所以當(dāng)電子設(shè)備輸出包含第二情緒信息的待輸出語(yǔ)音數(shù)據(jù)時(shí),用戶能夠獲得電子設(shè)備的情緒。因此,通過(guò)這種方法,可以使得電子設(shè)備根據(jù)不同內(nèi)容或場(chǎng)景輸出不同情緒的語(yǔ)音信息,使得用戶能夠更清楚的了解到電子設(shè)備的情緒,所以使得輸出語(yǔ)音的效率更高效,用戶體驗(yàn)更好。
[0024]本發(fā)明另一實(shí)施例中,當(dāng)用戶輸入第一語(yǔ)音數(shù)據(jù)后,分析第一語(yǔ)音數(shù)據(jù),獲得對(duì)應(yīng)的第一情緒,然后獲得針對(duì)第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù),再基于第一情緒信息對(duì)第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),使得第二回應(yīng)語(yǔ)音數(shù)據(jù)輸出時(shí),用戶能夠獲得電子設(shè)備的情緒,所以人機(jī)可以更好的交互,電子設(shè)備也更人性化,使得人機(jī)交互效率更高,用戶體驗(yàn)更好。
【專利附圖】
【附圖說(shuō)明】
[0025]圖1為本發(fā)明第一實(shí)施例中的輸出語(yǔ)音的方法流程圖;
[0026]圖2為本發(fā)明第二實(shí)施例中的語(yǔ)音交互的方法流程圖;
[0027]圖3為本發(fā)明第一實(shí)施例中的電子設(shè)備的功能框圖;[0028]圖4為本發(fā)明第二實(shí)施例中的電子設(shè)備的功能框圖。
【具體實(shí)施方式】
[0029]本發(fā)明實(shí)施例提供一種輸出語(yǔ)音的方法、語(yǔ)音交互的方法及電子設(shè)備,用以解決現(xiàn)有技術(shù)中存在的電子設(shè)備的輸出語(yǔ)音數(shù)據(jù)中不帶有與情感表達(dá)相關(guān)的信息的技術(shù)問(wèn)題,及由此而帶來(lái)的人機(jī)交互時(shí)情感單調(diào),用戶體驗(yàn)差的問(wèn)題。
[0030]本發(fā)明實(shí)施例中的技術(shù)方案為解決上述的技術(shù)問(wèn)題,總體思路如下:
[0031]對(duì)獲得的待輸出內(nèi)容或者用戶輸入的語(yǔ)音數(shù)據(jù)進(jìn)行分析,獲得待輸出內(nèi)容或者用戶輸入的語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一情緒,然后獲得針對(duì)待輸出內(nèi)容或第一語(yǔ)音數(shù)據(jù)的語(yǔ)音數(shù)據(jù),再基于第一情緒信息對(duì)該語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的語(yǔ)音數(shù)據(jù),使得包含第二情緒信息的語(yǔ)音數(shù)據(jù)輸出時(shí),用戶能夠獲得電子設(shè)備的情緒,可以使得電子設(shè)備根據(jù)不同內(nèi)容或場(chǎng)景輸出不同情緒的語(yǔ)音信息,使得用戶能夠更清楚的了解到電子設(shè)備的情緒,所以使得輸出語(yǔ)音的效率更高效,而且,人機(jī)可以更好的交互,電子設(shè)備也更人性化,使得人機(jī)交互效率更高,用戶體驗(yàn)更好。
[0032]為了更好的理解上述技術(shù)方案,下面將結(jié)合說(shuō)明書(shū)附圖以及具體的實(shí)施方式對(duì)上述技術(shù)方案進(jìn)行詳細(xì)的說(shuō)明。
[0033]本發(fā)明一實(shí)施例提供一種輸出語(yǔ)音的方法,應(yīng)用于一電子設(shè)備上,該電子設(shè)備例如是手機(jī)、平板電腦、筆記本電腦等電子設(shè)備。
[0034]請(qǐng)參考圖1,該方法包括:
[0035]步驟101:獲得第一待輸出內(nèi)容;
[0036]步驟102:分析第一待輸出內(nèi)容,獲得第一,清緒信息,第一,清緒信息用于表不第一待輸出內(nèi)容所攜帶的情緒;
[0037]步驟103:獲得第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);
[0038]步驟104:基于第一情緒信息,對(duì)第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,第二情緒信息用于表示電子設(shè)備在輸出第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得電子設(shè)備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián);
[0039]步驟105:輸出第二待輸出語(yǔ)音數(shù)據(jù)。
[0040]其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián),例如可以是第二情緒用于增強(qiáng)第一情緒,也可以是第二情緒用于緩和第一情緒信息,當(dāng)然,在具體實(shí)施過(guò)程中,還可以設(shè)置其他情形的匹配或關(guān)聯(lián)規(guī)則。
[0041]其中,在步驟101中,獲得第一待輸出內(nèi)容,在具體實(shí)施過(guò)程中,可以是獲取通過(guò)即時(shí)通信應(yīng)用接收到的語(yǔ)音數(shù)據(jù),例如是通過(guò)米聊、微信等聊天軟件接收到的語(yǔ)音數(shù)據(jù);也可以是通過(guò)電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù),例如是通過(guò)麥克風(fēng)錄入用戶的語(yǔ)音數(shù)據(jù);也可以是顯示在電子設(shè)備的顯示單元上的文本信息,例如短信、電子書(shū)或者網(wǎng)頁(yè)上的文本信息。
[0042]其中,步驟102和步驟103沒(méi)有先后順序,后續(xù)說(shuō)明以先執(zhí)行步驟102為例,但實(shí)際實(shí)施時(shí),也可以先執(zhí)行步驟103。
[0043]接下來(lái)執(zhí)行步驟102,在該步驟中,如果第一待輸出內(nèi)容是文本信息,則分析第一待輸出內(nèi)容,獲得第一情緒信息,具體可以先對(duì)文本進(jìn)行語(yǔ)言學(xué)分析,逐句進(jìn)行詞匯、語(yǔ)法和語(yǔ)義的分析,確定句子的結(jié)構(gòu)和每個(gè)字的因素的組成,包括但不限于文本的斷句、字詞切分、多音字的處理、數(shù)字的處理、縮略詞的處理,例如還可以分析文本的標(biāo)點(diǎn)符號(hào),確定是問(wèn)句還是陳述句,亦或是感嘆句,所以根據(jù)詞匯本身的意思和標(biāo)點(diǎn)符號(hào)就可以比較簡(jiǎn)單的分析出文本所攜帶的情緒。
[0044]具體來(lái)說(shuō),例如文本信息是“我好開(kāi)心?。?”,那么經(jīng)過(guò)上述方法的分析,其中“開(kāi)心”本身的詞義就是代表著一種聞興的情緒,還有感嘆詞“啊”,就進(jìn)一步表不這種聞興的情緒比較強(qiáng)烈,然后還有感嘆號(hào),更是進(jìn)一步增強(qiáng)了高興的情緒,所以通過(guò)分析到這些信息,就可以獲得該文本所攜帶的情緒,即獲得了第一情緒。
[0045]然后執(zhí)行步驟103,即獲得第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù),即將文本所對(duì)應(yīng)的單字或詞組或短語(yǔ)從語(yǔ)音合成庫(kù)中提取出來(lái),形成第一待輸出語(yǔ)音數(shù)據(jù),其中語(yǔ)音合成庫(kù)可以是現(xiàn)有的語(yǔ)音合成庫(kù),即普通的可以是事先存放在電子設(shè)備本地,也可以存放在網(wǎng)絡(luò)上的服務(wù)器中,當(dāng)電子設(shè)備連接于網(wǎng)絡(luò)中時(shí),可通過(guò)網(wǎng)絡(luò)在服務(wù)器的語(yǔ)音合成庫(kù)中提取出文本所對(duì)應(yīng)的單字或詞組或短語(yǔ)。
[0046]接下來(lái),執(zhí)行步驟104,基于第一情緒信息,對(duì)第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),具體來(lái)說(shuō),可以調(diào)整第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字之間的停頓時(shí)間。繼續(xù)沿用上面的例子,即可將“開(kāi)心”對(duì)應(yīng)的語(yǔ)音音量提高,可以將“啊”感嘆詞的聲調(diào)提高,也可以將程度副詞“好”和后面的“開(kāi)心”之間的停頓時(shí)間增長(zhǎng),增強(qiáng)開(kāi)心情緒的程度。
[0047]關(guān)于從設(shè)備側(cè)來(lái)講,如何調(diào)整上述聲調(diào)、音量、或字與字之間的停頓時(shí)間,可以有很多種實(shí)現(xiàn)方式,例如,可以事先訓(xùn)練一些模型,例如針對(duì)表達(dá)情緒的詞,諸如“開(kāi)心”、“難過(guò)”、“高興”,可以訓(xùn)練為將音量提高;對(duì)于感嘆詞,可以訓(xùn)練為將聲調(diào)提高;而可以訓(xùn)練程度副詞和后面緊跟的形容詞或動(dòng)詞之間的停頓時(shí)間增長(zhǎng),也可以訓(xùn)練形容詞和緊跟其后的名詞之間的停頓時(shí)間增長(zhǎng)。因此,可以按照這樣的模型進(jìn)行調(diào)整,具體調(diào)整可以是調(diào)整相應(yīng)語(yǔ)音的音頻譜。
[0048]當(dāng)將第二待輸出語(yǔ)音信息輸出時(shí),用戶就可以獲得電子設(shè)備的情緒,在本實(shí)施例中,也可以獲得發(fā)短信的人的情緒,使得用戶可以更有效率的使用電子設(shè)備,而且也更人性化,促進(jìn)用戶之間高效的交流。
[0049]在另一實(shí)施例中,當(dāng)步驟101中獲得的第一待輸出內(nèi)容是通過(guò)即時(shí)通信應(yīng)用接收到的語(yǔ)音數(shù)據(jù)或者通過(guò)電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù),那么在步驟102中,分析該語(yǔ)音數(shù)據(jù),獲得第一情緒信息可以通過(guò)方法實(shí)現(xiàn):
[0050]分別將該語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得該語(yǔ)音數(shù)據(jù)的音頻譜與每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);然后基于M個(gè)對(duì)比結(jié)果,確定該語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為第一情緒信肩、O
[0051]在具體實(shí)施過(guò)程中,可以事先訓(xùn)練M個(gè)特征頻譜模板,即通過(guò)大量的訓(xùn)練,得出例如高興的情緒的音頻譜特征,同樣的方法可以得出多個(gè)特征頻譜模板,所以當(dāng)獲得第一待輸出內(nèi)容的語(yǔ)音數(shù)據(jù)時(shí),就將該語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得與每個(gè)特征頻譜模板的相似度值,最后相似度值最大的特征頻譜模板對(duì)應(yīng)的情緒即為該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的情緒,所以就獲取到了第一情緒信息。
[0052]當(dāng)獲得第一情緒信息后,執(zhí)行步驟103,在本實(shí)施例中,因?yàn)榈谝淮敵鰞?nèi)容已經(jīng)是語(yǔ)音數(shù)據(jù)了,所以可以不執(zhí)行該步驟103,而直接進(jìn)入步驟104。
[0053]在另一實(shí)施例中,步驟103也可以是在原語(yǔ)音數(shù)據(jù)的基礎(chǔ)上增加語(yǔ)音數(shù)據(jù),繼續(xù)沿用前述實(shí)例,當(dāng)獲得的語(yǔ)音數(shù)據(jù)是“我好開(kāi)心??! ”,可以在步驟103中,獲得“睡,我好開(kāi)心??! ”的語(yǔ)音數(shù)據(jù),即進(jìn)一步表達(dá)出高興的情緒。
[0054]關(guān)于步驟104和步驟105,與前述第一個(gè)實(shí)施例中的類似,所以在此不再贅述。
[0055]本發(fā)明另一實(shí)施例還提供一種語(yǔ)音交互的方法,應(yīng)用于一電子設(shè)備,請(qǐng)參考圖2,該方法包括:
[0056]步驟201:接收一用戶輸入的第一語(yǔ)音數(shù)據(jù);
[0057]步驟202:分析第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,第一情緒信息用于表示輸入第一語(yǔ)音數(shù)據(jù)的用戶在輸入第一語(yǔ)音數(shù)據(jù)時(shí)的情緒;
[0058]步驟203:獲得一針對(duì)第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù);
[0059]步驟204:基于第一情緒信息對(duì)第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);第二情緒信息用于表示電子設(shè)備在輸出第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得電子設(shè)備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián);
[0060]步驟205:輸出第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0061]其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián),例如可以是第二情緒用于增強(qiáng)第一情緒,也可以是第二情緒用于緩和第一情緒信息,當(dāng)然,在具體實(shí)施過(guò)程中,還可以設(shè)置其他情形的匹配或關(guān)聯(lián)規(guī)則。
[0062]本實(shí)施例中的語(yǔ)音交互方法可以應(yīng)用于例如對(duì)話系統(tǒng)或者即時(shí)聊天軟件中,還可以應(yīng)用于語(yǔ)音控制系統(tǒng),當(dāng)然,這里的應(yīng)用場(chǎng)景僅為舉例說(shuō)明,并非用于限制本發(fā)明。
[0063]以下將舉例詳細(xì)說(shuō)明該語(yǔ)音交互方法的具體實(shí)施過(guò)程。
[0064]在本實(shí)施例中,例如用戶通過(guò)一麥克風(fēng)向電子設(shè)備輸入第一語(yǔ)音數(shù)據(jù)“今天天氣怎么樣? ”然后執(zhí)行步驟202,即分析第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,該步驟具體也可以采用前述第二實(shí)施例中的分析方式分析,即分別將該第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得該第一語(yǔ)音數(shù)據(jù)的音頻譜與每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);然后基于M個(gè)對(duì)比結(jié)果,確定該第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為第一情緒信息。
[0065]在具體實(shí)施過(guò)程中,可以事先訓(xùn)練M個(gè)特征頻譜模板,即通過(guò)大量的訓(xùn)練,得出例如高興的情緒的音頻譜特征,同樣的方法可以得出多個(gè)特征頻譜模板,所以當(dāng)獲得第一語(yǔ)音數(shù)據(jù)時(shí),就將該第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得與每個(gè)特征頻譜模板的相似度值,最后相似度值最大的特征頻譜模板對(duì)應(yīng)的情緒即為該第一語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的情緒,所以就獲取到了第一情緒信息。
[0066]假如在該實(shí)施例中,第一情緒信息是一種低落的情緒,即用戶在輸入第一語(yǔ)音信息時(shí)情緒很低落。
[0067]接下來(lái)執(zhí)行步驟203,當(dāng)然步驟203也可以在步驟202之前執(zhí)行,獲得針對(duì)第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù),繼續(xù)沿用上面的例子,用戶輸入的是“今天天氣怎么樣?”,那么電子設(shè)備可以通過(guò)網(wǎng)絡(luò)實(shí)時(shí)獲取天氣信息,并將天氣信息轉(zhuǎn)化為語(yǔ)音數(shù)據(jù),對(duì)應(yīng)的句子例如是“今天天氣晴朗,溫度28度,適合出游”。
[0068]然后基于步驟202中獲得的第一情緒信息,對(duì)第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,在本實(shí)施例中,第一情緒信息表示一種低落的情緒,說(shuō)明用戶精神狀態(tài)不佳,有點(diǎn)沒(méi)干勁,所以在一實(shí)施例中,可以調(diào)整第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生第二回應(yīng)語(yǔ)音數(shù)據(jù),使得輸出的第二回應(yīng)數(shù)據(jù)是一種歡快、情緒高昂的語(yǔ)氣,即用戶感受到電子設(shè)備輸出的語(yǔ)句是輕松愉快的,所以可以幫助用戶改善負(fù)面的情緒。
[0069]具體的調(diào)整規(guī)則,可以參考前述實(shí)施例中的調(diào)整規(guī)則,例如改變形容詞“晴朗”的音頻譜,使得這個(gè)形容詞的聲調(diào)和音量都比較高昂以及歡快。
[0070]在另一實(shí)施例中,步驟204可以具體是基于第一情緒信息,在第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示第二情緒信息的語(yǔ)音數(shù)據(jù),獲得第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0071]具體來(lái)說(shuō),例如增加一些語(yǔ)氣助詞,例如將第一回應(yīng)語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的語(yǔ)句“今天天氣晴朗,溫度28度,適合出游”調(diào)整為“今天天氣晴朗,溫度28度,適合出游哦”,即在語(yǔ)音合成庫(kù)中提取到“哦”的語(yǔ)音數(shù)據(jù),然后合成在第一回應(yīng)語(yǔ)音數(shù)據(jù)中,就形成了第二回應(yīng)語(yǔ)音數(shù)據(jù)。當(dāng)然,上述兩種不同的調(diào)整方式也可以互相結(jié)合使用。
[0072]在進(jìn)一步的實(shí)施例中,當(dāng)在步驟202中分析第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,也可以是判斷第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值;當(dāng)連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定第一語(yǔ)音數(shù)據(jù)中的情緒信息為第一情緒信息。
[0073]具體來(lái)說(shuō),例如用戶多次輸入“今天天氣怎么樣? ” 一直都沒(méi)有得到答案,可能會(huì)由于網(wǎng)絡(luò)的原因電子設(shè)備沒(méi)有獲取到天氣信息,所以之前一直都回復(fù)了“對(duì)不起,沒(méi)有找到”,所以當(dāng)判斷到第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)已經(jīng)大于一預(yù)定值了,則可以判斷出用戶的心情已經(jīng)很著急,甚至都有生氣的情緒了,但是電子設(shè)備依然未查詢到天氣信息,這時(shí)就去獲取第一回應(yīng)語(yǔ)音數(shù)據(jù)“對(duì)不起,沒(méi)有找到”,然后基于第一情緒信息,可以用上述兩種類似的方法去處理第一回應(yīng)語(yǔ)音數(shù)據(jù),即調(diào)整聲調(diào)、音量、或字與字之間的停頓時(shí)間,或者是加上表示強(qiáng)烈歉意和遺憾的語(yǔ)音數(shù)據(jù),例如“真的非常對(duì)不起,沒(méi)有找到”,使得輸出的語(yǔ)句帶有遺憾和抱歉的情緒,使得用戶聽(tīng)到之后生氣的情緒降低,提高用戶體驗(yàn)。
[0074]以下將再舉一具體實(shí)例來(lái)說(shuō)明該方法的具體實(shí)施過(guò)程,在本實(shí)施例中,例如是應(yīng)用在一個(gè)即時(shí)聊天軟件中,在步驟201中,例如接收的是用戶A輸入的第一語(yǔ)音數(shù)據(jù),例如“你怎么還沒(méi)有完成工作? ”,可以采用前述實(shí)施例中的分析方法分析之后發(fā)現(xiàn),用戶A很生氣,這時(shí)又獲得了用戶B針對(duì)用戶A的第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù),例如用戶B說(shuō)“工作太多了,我完成不了! ”,為了避免用戶A和用戶B之間爭(zhēng)吵起來(lái),因?yàn)橛脩鬉已經(jīng)很生氣了,所以電子設(shè)備就將用戶B的第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,變得情緒比較緩和,這樣用戶A聽(tīng)到之后,情緒也不會(huì)更加生氣,同樣用戶B端的電子設(shè)備同樣也可以做類似的處理,這樣就使得用戶A和用戶B不至于情緒太激動(dòng)而發(fā)生爭(zhēng)執(zhí),所以電子設(shè)備的人性化使得用戶體驗(yàn)更好。
[0075]以上只描述了本實(shí)施例的使用過(guò)程,具體其中如何分析情緒和如何調(diào)整語(yǔ)音數(shù)據(jù)可參考前述各實(shí)施例中的相關(guān)描述,為了說(shuō)明書(shū)的簡(jiǎn)潔,在此不再贅述。
[0076]本發(fā)明一實(shí)施例中還提供一種電子設(shè)備,該電子設(shè)備例如是手機(jī)、平板電腦、筆記本電腦等電子設(shè)備。
[0077]如圖3所示,該電子設(shè)備包括:電路板301 ;獲得單元302,電性連接于電路板301,用于獲得第一待輸出內(nèi)容;處理芯片303,設(shè)置于電路板301上,用于分析第一待輸出內(nèi)容,獲得第一情緒信息,第一情緒信息用于表示待輸出內(nèi)容所攜帶的情緒;獲得第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);基于第一情緒信息,對(duì)第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,第二情緒信息用于表示電子設(shè)備在輸出第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得電子設(shè)備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián);輸出單元304,電性連接于處理芯片303,用于輸出第二待輸出語(yǔ)音數(shù)據(jù)。
[0078]其中,電路板301可以是電子設(shè)備的主板,進(jìn)一步,獲得單元302可以是數(shù)據(jù)接收裝置,或者是聲音輸入裝置,例如麥克風(fēng)。
[0079]進(jìn)一步,處理芯片303可以是單獨(dú)的語(yǔ)音處理芯片,也可以是集成在處理器中。而輸出單元304例如是揚(yáng)聲器或喇叭等聲音輸出裝置。
[0080]在一實(shí)施例中,當(dāng)?shù)谝淮敵鰞?nèi)容為一語(yǔ)音數(shù)據(jù)時(shí),處理芯片303具體用于分別將語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得語(yǔ)音數(shù)據(jù)的音頻譜與每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于M個(gè)對(duì)比結(jié)果,確定語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為第一情緒信息。具體過(guò)程請(qǐng)參考圖1實(shí)施例中的相關(guān)描述。
[0081]在另一實(shí)施例中,處理芯片303具體用于調(diào)整第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生第二待輸出語(yǔ)音數(shù)據(jù)。
[0082]前述圖1實(shí)施例中的輸出語(yǔ)音的方法中的各種變化方式和具體實(shí)例同樣適用于本實(shí)施例的電子設(shè)備,通過(guò)前述對(duì)輸出語(yǔ)音的方法的詳細(xì)描述,本領(lǐng)域技術(shù)人員可以清楚的知道本實(shí)施例中電子設(shè)備的實(shí)施方法,所以為了說(shuō)明書(shū)的簡(jiǎn)潔,在此不再詳述。
[0083]在另一實(shí)施例中,還提供一種電子設(shè)備,該電子設(shè)備例如是手機(jī)、平板電腦、筆記本電腦等電子設(shè)備。
[0084]請(qǐng)參考圖4,該電子設(shè)備包括:電路板401 ;語(yǔ)音接收單元402,電性連接于電路板401,用于接收一用戶輸入的第一語(yǔ)音數(shù)據(jù);處理芯片403,設(shè)置于電路板401上,用于分析第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,第一情緒信息用于表示輸入第一語(yǔ)音數(shù)據(jù)的用戶在輸入第一語(yǔ)音數(shù)據(jù)時(shí)的情緒;獲得一針對(duì)第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù);基于第一情緒信息對(duì)第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);第二情緒信息用于表示電子設(shè)備在輸出第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得電子設(shè)備的情緒,其中,第一情緒信息與第二情緒信息相匹配/相關(guān)聯(lián);輸出單元404,電性連接于處理芯片403,用于輸出第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0085]其中,電路板401可以是電子設(shè)備的主板,進(jìn)一步,語(yǔ)音接收單元402可以是數(shù)據(jù)接收裝置,或者是聲音輸入裝置,例如麥克風(fēng)。
[0086]進(jìn)一步,處理芯片403可以是單獨(dú)的語(yǔ)音處理芯片,也可以是集成在處理器中。而輸出單元404例如是揚(yáng)聲器或喇叭等聲音輸出裝置。
[0087]在一實(shí)施例中,處理芯片403具體用于分別將第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得第一語(yǔ)音數(shù)據(jù)的音頻譜與每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于M個(gè)對(duì)比結(jié)果,確定第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為第一情緒信息。
[0088]在另一實(shí)施例中,處理芯片403具體用于判斷第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值;當(dāng)連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定第一語(yǔ)音數(shù)據(jù)中的情緒信息為第一情緒信息。
[0089]在另一實(shí)施例中,處理芯片403具體用于調(diào)整第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0090]在另一實(shí)施例中,處理芯片403具體用于基于第一情緒信息,在第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示第二情緒信息的語(yǔ)音數(shù)據(jù),獲得第二回應(yīng)語(yǔ)音數(shù)據(jù)。
[0091]前述圖2實(shí)施例中的語(yǔ)音交互的方法中的各種變化方式和具體實(shí)例同樣適用于本實(shí)施例的電子設(shè)備,通過(guò)前述對(duì)語(yǔ)音交互的方法的詳細(xì)描述,本領(lǐng)域技術(shù)人員可以清楚的知道本實(shí)施例中電子設(shè)備的實(shí)施方法,所以為了說(shuō)明書(shū)的簡(jiǎn)潔,在此不再詳述。
[0092]本發(fā)明實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
[0093]本發(fā)明一實(shí)施例采用分析待輸出內(nèi)容(例如短信或其他文本信息、或通過(guò)即時(shí)通信軟件接收到的語(yǔ)音數(shù)據(jù)、或者是通過(guò)電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù))的情緒信息,然后基于情緒信息,對(duì)與待輸出內(nèi)容對(duì)應(yīng)的待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,最后獲得包含第二情緒信息的待輸出語(yǔ)音數(shù)據(jù),所以當(dāng)電子設(shè)備輸出包含第二情緒信息的待輸出語(yǔ)音數(shù)據(jù)時(shí),用戶能夠獲得電子設(shè)備的情緒。因此,通過(guò)這種方法,可以使得電子設(shè)備根據(jù)不同內(nèi)容或場(chǎng)景輸出不同情緒的語(yǔ)音信息,使得用戶能夠更清楚的了解到電子設(shè)備的情緒,所以使得輸出語(yǔ)音的效率更高效,用戶體驗(yàn)更好。
[0094]本發(fā)明另一實(shí)施例中,當(dāng)用戶輸入第一語(yǔ)音數(shù)據(jù)后,分析第一語(yǔ)音數(shù)據(jù),獲得對(duì)應(yīng)的第一情緒,然后獲得針對(duì)第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù),再基于第一情緒信息對(duì)第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),使得第二回應(yīng)語(yǔ)音數(shù)據(jù)輸出時(shí),用戶能夠獲得電子設(shè)備的情緒,所以人機(jī)可以更好的交互,電子設(shè)備也更人性化,使得人機(jī)交互效率更高,用戶體驗(yàn)更好。
[0095]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0096]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。[0097]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。
[0098]這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0099]顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
【權(quán)利要求】
1.一種輸出語(yǔ)音的方法,應(yīng)用于一電子設(shè)備,其特征在于,所述方法包括: 獲得第一待輸出內(nèi)容; 分析所述第一待輸出內(nèi)容,獲得第一情緒信息,所述第一情緒信息用于表示所述第一待輸出內(nèi)容所攜帶的情緒; 獲得所述第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù); 基于所述第一情緒信息,對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián); 輸出所述第二待輸出語(yǔ)音數(shù)據(jù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述獲得第一待輸出內(nèi)容具體為: 獲取通過(guò)即時(shí)通信應(yīng)用接收到的語(yǔ)音數(shù)據(jù); 獲取通過(guò)所述電子設(shè)備的聲音輸入裝置錄入的語(yǔ)音數(shù)據(jù);或者 獲取顯示在所述電子設(shè)備的顯示單元上的文本信息。
3.如權(quán)利要求2所述的方法,其特征在于,當(dāng)所述第一待輸出內(nèi)容為所述語(yǔ)音數(shù)據(jù)時(shí),所述分析所述第一待輸出內(nèi)容,獲得第一情緒信息,具體包括: 分別將所述語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)t匕,獲得所述語(yǔ)音數(shù)據(jù)·的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù); 基于所述M個(gè)對(duì)比結(jié)果,確定所述語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板; 確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),具體包括: 調(diào)整所述第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二待輸出語(yǔ)音數(shù)據(jù)。
5.一種語(yǔ)音交互的方法,應(yīng)用于一電子設(shè)備,其特征在于,所述方法包括: 接收一用戶輸入的第一語(yǔ)音數(shù)據(jù); 分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語(yǔ)音數(shù)據(jù)的用戶在輸入所述第一語(yǔ)音數(shù)據(jù)時(shí)的情緒; 獲得一針對(duì)所述第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù); 基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得所述用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián); 輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
6.如權(quán)利要求5所述的方法,其特征在于,所述分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,具體包括: 分別將所述第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù); 基于所述M個(gè)對(duì)比結(jié)果,確定所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板; 確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
7.如權(quán)利要求5所述的方法,其特征在于,所述分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,具體包括: 判斷所述第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值; 當(dāng)所述連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定所述第一語(yǔ)音數(shù)據(jù)中的情緒信息為所述第一情緒信息。
8.如權(quán)利要求5所述的方法,其特征在于,所述基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),具體包括: 調(diào)整所述第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
9.如權(quán)利要求5所述的方法,其特征在于,所述基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù),具體為: 基于所述第一情緒信息,在所述第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示所述第二情緒信息的語(yǔ)音數(shù)據(jù),獲得所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
10.一種電子設(shè)備,其特征在于,包括: 電路板; 獲得單元,電性連接于所述電路板,用于獲得第一待輸出內(nèi)容; 處理芯片,設(shè)置于所述電路板上,用于分析所述第一待輸出內(nèi)容,獲得第一情緒信息,所述第一情緒信息用于表示所述待輸出內(nèi)容所攜帶的情緒;獲得所述第一待輸出內(nèi)容對(duì)應(yīng)的第一待輸出語(yǔ)音數(shù)據(jù);基于所述第一情緒信息,對(duì)所述第一待輸出語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二待輸出語(yǔ)音數(shù)據(jù),其中,所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二待輸出語(yǔ)音數(shù)據(jù)時(shí)以使得用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián); 輸出單元,電性連接于所述處理芯片,用于輸出所述第二待輸出語(yǔ)音數(shù)據(jù)。
11.如權(quán)利要求10所述的電子設(shè)備,其特征在于,當(dāng)所述第一待輸出內(nèi)容為一語(yǔ)音數(shù)據(jù)時(shí),所述處理芯片具體用于分別將所述語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
12.如權(quán)利要求10所述的電子設(shè)備,其特征在于,所述處理芯片具體用于調(diào)整所述第一待輸出語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二待輸出語(yǔ)音數(shù)據(jù)。
13.—種電子設(shè)備,其特征在于,包括: 電路板;語(yǔ)音接收單元,電性連接于所述電路板,用于接收一用戶輸入的第一語(yǔ)音數(shù)據(jù); 處理芯片,設(shè)置于所述電路板上,用于分析所述第一語(yǔ)音數(shù)據(jù),獲得第一情緒信息,所述第一情緒信息用于表示輸入所述第一語(yǔ)音數(shù)據(jù)的用戶在輸入所述第一語(yǔ)音數(shù)據(jù)時(shí)的情緒;獲得一針對(duì)所述第一語(yǔ)音數(shù)據(jù)的第一回應(yīng)語(yǔ)音數(shù)據(jù);基于所述第一情緒信息對(duì)所述第一回應(yīng)語(yǔ)音數(shù)據(jù)進(jìn)行處理,產(chǎn)生包含第二情緒信息的第二回應(yīng)語(yǔ)音數(shù)據(jù);所述第二情緒信息用于表示所述電子設(shè)備在輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)時(shí)以使得所述用戶獲得所述電子設(shè)備的情緒,其中,所述第一情緒信息與所述第二情緒信息相匹配/相關(guān)聯(lián); 輸出單元,電性連接于所述處理芯片,用于輸出所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
14.如權(quán)利要求13所述的電子設(shè)備,其特征在于,所述處理芯片具體用于分別將所述第一語(yǔ)音數(shù)據(jù)的音頻譜與M個(gè)特征頻譜模板中的每一個(gè)特征頻譜模板進(jìn)行對(duì)比,獲得所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述每一個(gè)特征頻譜模板的M個(gè)對(duì)比結(jié)果,其中M為大于等于2的整數(shù);基于所述M個(gè)對(duì)比結(jié)果,確定所述第一語(yǔ)音數(shù)據(jù)的音頻譜與所述M個(gè)特征頻譜模板中相似度最高的特征頻譜模板;確定所述相似度最高的特征頻譜模板所對(duì)應(yīng)的情緒信息為所述第一情緒信息。
15.如權(quán)利要求13所述的電子設(shè)備,其特征在于,所述處理芯片具體用于判斷所述第一語(yǔ)音數(shù)據(jù)的連續(xù)輸入次數(shù)是否大于一預(yù)定值;當(dāng)所述連續(xù)輸入次數(shù)大于一預(yù)定值時(shí),確定所述第一語(yǔ)音數(shù)據(jù)中的情緒信息為所述第一情緒信息。
16.如權(quán)利要求13所述的電子設(shè)備,其特征在于,所述處理芯片具體用于調(diào)整所述第一回應(yīng)語(yǔ)音數(shù)據(jù)所對(duì)應(yīng)的字 的聲調(diào)、音量、或字與字間的停頓時(shí)間,產(chǎn)生所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
17.如權(quán)利要求13所述的電子設(shè)備,其特征在于,所述處理芯片具體用于基于所述第一情緒信息,在所述第一回應(yīng)語(yǔ)音數(shù)據(jù)上增加一用于表示所述第二情緒信息的語(yǔ)音數(shù)據(jù),獲得所述第二回應(yīng)語(yǔ)音數(shù)據(jù)。
【文檔編號(hào)】G06F3/16GK103543979SQ201210248179
【公開(kāi)日】2014年1月29日 申請(qǐng)日期:2012年7月17日 優(yōu)先權(quán)日:2012年7月17日
【發(fā)明者】戴海生, 王茜鶯, 汪浩 申請(qǐng)人:聯(lián)想(北京)有限公司