欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)處理方法及裝置與流程

文檔序號(hào):11592319閱讀:210來源:國知局

本發(fā)明涉及多媒體技術(shù)領(lǐng)域,具體涉及一種數(shù)據(jù)處理方法及裝置。



背景技術(shù):

唱歌類應(yīng)用是目前深受用戶尤其是年輕用戶喜愛與追捧的一類應(yīng)用,其具備在線練唱或在線語音等多種功能,其中,在線語音功能是指唱歌應(yīng)用可以將用戶原始音頻數(shù)據(jù)(例如,用戶說的一段話)轉(zhuǎn)化為用戶選擇的歌曲的音頻數(shù)據(jù)?,F(xiàn)有技術(shù)中,一般采用樂器數(shù)字接口(musicalinstrumentdigitalinterface,midi)方法或者人工制作方法來實(shí)現(xiàn)在線語音功能,由于midi方法得到的音頻數(shù)據(jù)中的每個(gè)音符均保持一個(gè)標(biāo)準(zhǔn)的音高,進(jìn)而導(dǎo)致音頻數(shù)據(jù)的播放效果產(chǎn)生機(jī)械感;而人工制作方法效率比較低。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供一種數(shù)據(jù)處理方法及裝置,可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

本發(fā)明實(shí)施例第一方面提供一種數(shù)據(jù)處理方法,所述方法包括:

采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)所述音頻數(shù)據(jù)的距離總和;

將距離總和最小的音頻數(shù)據(jù)確定為所述目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù);

對(duì)所述指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取所述指導(dǎo)音頻數(shù)據(jù)的基頻信息;

根據(jù)所述基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù);

將所述調(diào)整后的原始音頻數(shù)據(jù)與所述目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于所述原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

相應(yīng)的,本發(fā)明實(shí)施例第二方面還提供一種數(shù)據(jù)處理裝置,所述裝置包括:

獲取模塊,用于采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)所述音頻數(shù)據(jù)的距離總和;

確定模塊,用于將距離總和最小的音頻數(shù)據(jù)確定為所述目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù);

所述獲取模塊,還用于對(duì)所述指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取所述指導(dǎo)音頻數(shù)據(jù)的基頻信息;

調(diào)整模塊,用于根據(jù)所述基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù);

合成模塊,用于將所述調(diào)整后的原始音頻數(shù)據(jù)與所述目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于所述原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,從針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中,選擇距離總和最小的音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù),并采用指導(dǎo)音頻數(shù)據(jù)的基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,將調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏進(jìn)行合成,得到關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明第一實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖;

圖2是本發(fā)明第二實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖;

圖3是本發(fā)明第三實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖;

圖4是本發(fā)明第一實(shí)施例提供的數(shù)據(jù)處理設(shè)備的結(jié)構(gòu)示意圖;

圖5是本發(fā)明第二實(shí)施例提供的數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖;

圖6是本發(fā)明實(shí)施例提供的一種歌詞文件格式示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和裝置,可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。以下分別進(jìn)行詳細(xì)說明。

請(qǐng)參閱圖1,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法的流程示意圖。該方法可以應(yīng)用于數(shù)據(jù)處理裝置中,本實(shí)施例中所描述的方法,包括以下步驟:

s101、數(shù)據(jù)處理裝置采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)該音頻數(shù)據(jù)的距離總和。

需要說明的是,數(shù)據(jù)處理裝置可以應(yīng)用于客戶端、唱歌類應(yīng)用的服務(wù)器等,其中,客戶端可以為唱歌類應(yīng)用、可以為安裝唱歌類應(yīng)用的終端設(shè)備,該終端設(shè)備可以是筆記本電腦、臺(tái)式電腦、手機(jī)、平板電腦、車載終端、智能可穿戴設(shè)備等,本發(fā)明實(shí)施例不做限定。

另外,目標(biāo)歌曲可以是指用戶指定的歌曲,也可以是數(shù)據(jù)處理裝置的數(shù)據(jù)庫中的任意一首歌曲,本發(fā)明實(shí)施例不做限定。其中,音頻數(shù)據(jù)可以是指用戶演唱目標(biāo)歌曲的清唱數(shù)據(jù),即演唱中不包括音樂伴奏部分的演唱數(shù)據(jù)。

本發(fā)明實(shí)施例中,用戶可以針對(duì)目標(biāo)歌曲進(jìn)行演唱,從而將演唱版本上傳到數(shù)據(jù)處理裝置,數(shù)據(jù)處理裝置從而可以從演唱版本中采集出用戶清唱的音頻數(shù)據(jù),并采集多個(gè)用戶針對(duì)目標(biāo)歌曲上傳的清唱版本,得到目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)。由于不同用戶的演唱水平不同,可能會(huì)導(dǎo)致演唱的音頻數(shù)據(jù)的效果不同,同時(shí)某個(gè)音頻數(shù)據(jù)的距離總和越小,表示該音頻數(shù)據(jù)的演唱效果越好,因而數(shù)據(jù)處理裝置可以根據(jù)各個(gè)音頻數(shù)據(jù)的距離總和來確定出用戶演唱效果較好的音頻數(shù)據(jù)。其中,采集到的音頻數(shù)據(jù)的數(shù)量閾值越大,確定出演唱效果較好的音頻數(shù)據(jù)的概率就越高,所以數(shù)據(jù)處理裝置可以在用戶針對(duì)目標(biāo)歌曲上傳的音頻數(shù)據(jù)的數(shù)量達(dá)到一個(gè)預(yù)設(shè)數(shù)量值時(shí),啟動(dòng)對(duì)該目標(biāo)歌曲的聚類,以獲取該目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

作為一種可選的實(shí)施例,數(shù)據(jù)處理裝置在執(zhí)行步驟s101之前,還可以對(duì)目標(biāo)歌曲的音頻數(shù)據(jù)進(jìn)行處理,具體的,由于用戶上傳的清唱的音頻數(shù)據(jù)在錄制的時(shí)候可能會(huì)有較大的背景噪聲,這些背景噪聲對(duì)后續(xù)的聚類效果會(huì)產(chǎn)生很大的影響,所以將噪聲過大的音頻數(shù)據(jù)(即噪聲能量超過噪聲能量閾值的音頻數(shù)據(jù))過濾掉,步驟如下:

請(qǐng)一并參閱圖6,為本發(fā)明實(shí)施例提供的一種歌詞文件格式示意圖。從圖6中的歌詞可以看出,正式歌詞中每行就是連續(xù)演唱的一句話,在歌詞開始就標(biāo)識(shí)了這句話在目標(biāo)歌曲中的起始毫秒數(shù)與持續(xù)毫秒數(shù),如第三句是從第7.34秒到10.1秒結(jié)束,持續(xù)了2.76秒,而第三句話與第四句話(在第10.1秒到10.55秒)之間是一段純伴奏,理論上在目標(biāo)歌曲的伴奏階段用戶是不會(huì)演唱的,那么清唱音頻數(shù)據(jù)中對(duì)應(yīng)的伴奏階段的能量會(huì)很低,如果能量較高的話,即表明該音頻數(shù)據(jù)存在噪聲,從而需要從獲取的音頻數(shù)據(jù)集合中過濾掉這些在伴奏階段噪聲能量較大超過噪聲能量閾值的音頻數(shù)據(jù)。

具體的,數(shù)據(jù)處理裝置首先會(huì)獲取每個(gè)伴奏階段在目標(biāo)歌曲中的起止時(shí)間,然后根據(jù)起止時(shí)間對(duì)應(yīng)獲取音頻數(shù)據(jù)中這段時(shí)間所對(duì)應(yīng)的能量。

進(jìn)一步的,數(shù)據(jù)處理裝置判斷音頻數(shù)據(jù)中伴奏階段的能量是否超過噪聲能量閾值的具體方式為:從該音頻數(shù)據(jù)中確定出所有伴奏階段對(duì)應(yīng)的采樣點(diǎn),然后獲取每個(gè)采樣點(diǎn)對(duì)應(yīng)的能量,記為xe,e∈[1,g],g為采樣點(diǎn)的數(shù)量,為正整數(shù),從而計(jì)算出該音頻數(shù)據(jù)伴奏部分的平均能量,得到該音頻數(shù)據(jù)的噪聲能量,記為u,即:

當(dāng)u大于噪聲能量閾值時(shí),表明該音頻數(shù)據(jù)的噪聲過大,從而將該音頻數(shù)據(jù)剔除。

數(shù)據(jù)處理裝置對(duì)每個(gè)音頻數(shù)據(jù)進(jìn)行上述處理,將噪聲能量大于噪聲能量閾值的音頻數(shù)據(jù)剔除,最終得到該目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)。

作為一種可選的實(shí)施例,數(shù)據(jù)處理裝置獲取各個(gè)該音頻數(shù)據(jù)的距離總和的具體方式可以為:

提取針對(duì)該目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中每個(gè)音頻數(shù)據(jù)的基頻序列。

針對(duì)該多個(gè)音頻數(shù)據(jù)中的每個(gè)音頻數(shù)據(jù),根據(jù)該基頻序列計(jì)算每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離。

根據(jù)該每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離,計(jì)算各個(gè)所述音頻數(shù)據(jù)的距離總和。

本發(fā)明實(shí)施例中,由于基頻序列中的基頻點(diǎn)對(duì)應(yīng)的基頻值可以體現(xiàn)某個(gè)音頻數(shù)據(jù)中音符的音高,同時(shí)音高可以體現(xiàn)該音頻數(shù)據(jù)的演唱效果,因而可以根據(jù)各個(gè)音頻數(shù)據(jù)的基頻序列來選擇出演唱效果較好音頻數(shù)據(jù)。其中,基頻點(diǎn)對(duì)應(yīng)的基頻值即該基頻點(diǎn)的基音,基音決定了音符的音高。具體的,針對(duì)該多個(gè)音頻數(shù)據(jù)中的每個(gè)音頻數(shù)據(jù),數(shù)據(jù)處理裝置可以提取該音頻數(shù)據(jù)的基頻序列,根據(jù)每?jī)蓚€(gè)音頻數(shù)據(jù)的基頻序列計(jì)算這兩個(gè)音頻數(shù)據(jù)之間的距離,根據(jù)該每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離,計(jì)算各個(gè)該音頻數(shù)據(jù)的距離總和。

具體實(shí)現(xiàn)中,數(shù)據(jù)處理裝置可以針對(duì)該目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)的格式調(diào)整為統(tǒng)一的格式,如16k16bit格式,并針對(duì)每個(gè)音頻數(shù)據(jù),按照指定的幀移和幀長提取基頻點(diǎn),以得到每個(gè)音頻數(shù)據(jù)的基頻集合,基頻集合包括多個(gè)基頻點(diǎn)。其中,指定的幀移可以是10ms,指定的幀長可以為30ms,本發(fā)明實(shí)施例不做限定。

進(jìn)一步,由于用戶在發(fā)聲時(shí)聲帶震動(dòng)產(chǎn)生的頻率經(jīng)過聲道過濾后會(huì)產(chǎn)生大量泛音,因而每個(gè)音頻數(shù)據(jù)的基頻集合中可能包括泛音的基頻點(diǎn),為了便于后續(xù)操作,數(shù)據(jù)處理裝置需要從基頻集合中提取出直接表現(xiàn)聲帶震動(dòng)頻率的基頻序列。其中,數(shù)據(jù)處理裝置可以對(duì)某個(gè)基頻集合中的基頻點(diǎn)進(jìn)行去噪處理以及去差異化處理,從而得到該音頻數(shù)據(jù)的基頻序列。

可以理解的是:對(duì)基頻集合中的基頻點(diǎn)進(jìn)行去噪處理的具體方式為:將音頻數(shù)據(jù)對(duì)應(yīng)的伴奏部分的基頻點(diǎn)進(jìn)行奇異基頻點(diǎn)置零,即,對(duì)于伴奏部分的基頻段中,根據(jù)與前后基頻點(diǎn)的基頻值的差異檢測(cè)出奇異基頻點(diǎn),并將奇異基頻點(diǎn)置零;將音頻數(shù)據(jù)對(duì)應(yīng)的非伴奏部分的基頻點(diǎn)進(jìn)行中值濾波,例如,如果非伴奏部分的基頻段的長度小于指定數(shù)量的幀,如35幀,可以直接將中值濾波的窗口長度設(shè)置為該基頻段的長度,從而進(jìn)行中值濾波,如果非伴奏部分的基頻段的長度大于或等于指定幀數(shù),可以對(duì)每幀數(shù)據(jù)做10點(diǎn)中值濾波。通過這種方式可以去除音頻數(shù)據(jù)中的噪聲頻點(diǎn)。

可以理解的是:對(duì)基頻集合中的基頻點(diǎn)進(jìn)行去差異化處理的具體方式為:如果前后兩個(gè)不為零的基頻段中存在零基頻段,且零基頻段小于指定數(shù)量的幀,如15幀,數(shù)據(jù)處理裝置可以將零基頻段的基頻值都設(shè)置為零基頻段的前一個(gè)基頻段中最后一幀對(duì)應(yīng)的基頻值。也就是說,不同的用戶在唱歌過程中可能換氣的時(shí)間不同,而換氣過程中基頻點(diǎn)的基頻值可能為零,這樣在后續(xù)計(jì)算兩基頻序列的距離的過程中,可能會(huì)將換氣過程中的誤差計(jì)入進(jìn)去,而這換氣過程中存在的誤差是影響音頻數(shù)據(jù)音準(zhǔn)的因素之一,因此,將這換氣部分的誤差去除,有利于數(shù)據(jù)處理裝置篩選出的演唱效果較好的音頻數(shù)據(jù)。

更進(jìn)一步的,數(shù)據(jù)處理裝置可以針對(duì)該多個(gè)音頻數(shù)據(jù)中的每個(gè)音頻數(shù)據(jù),根據(jù)該基頻序列計(jì)算每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離。具體的,針對(duì)該多個(gè)音頻數(shù)據(jù)中的每個(gè)音頻數(shù)據(jù),計(jì)算第一音頻數(shù)據(jù)的第一基頻序列中第一基頻點(diǎn)與第二音頻數(shù)據(jù)的第二基頻序列中第二基頻點(diǎn)之間的距離,并根據(jù)第一基頻點(diǎn)與第二基頻點(diǎn)之間的距離獲取第一基頻序列與第二基頻序列之間的距離,進(jìn)而得到每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離。

其中,第一音頻數(shù)據(jù)為該多個(gè)音頻數(shù)據(jù)中的任一音頻數(shù)據(jù),第二音頻數(shù)據(jù)為該多個(gè)音頻數(shù)據(jù)中除第一音頻數(shù)據(jù)以外的任一音頻數(shù)據(jù),第一基頻點(diǎn)為第一基頻序列中任一基頻點(diǎn),第二基頻點(diǎn)為第二基頻序列中與第一基頻點(diǎn)在第一基頻序列的位置相同的基頻點(diǎn)。

可理解的是:數(shù)據(jù)處理裝置根據(jù)第一基頻點(diǎn)與第二基頻點(diǎn)之間的距離獲取第一基頻序列與第二基頻序列之間的距離的具體方式為:從第一基頻序列中獲取第一基頻點(diǎn),并從第二基頻序列中獲取第二基頻點(diǎn),計(jì)算兩個(gè)基頻點(diǎn)的基頻值的差值,根據(jù)每?jī)蓚€(gè)基頻點(diǎn)的基頻差值的總和計(jì)算第一基頻序列與第二基頻序列之間的距離。其中,第一基頻點(diǎn)與第二基頻點(diǎn)為在基頻序列中位置相同的基頻點(diǎn),如第一基頻點(diǎn)為第一基頻序列中的第三個(gè)基頻點(diǎn),第二基頻點(diǎn)同樣也為第二基頻序列中的第三個(gè)基頻點(diǎn)。通過這種方式分別計(jì)算兩個(gè)基頻序列中每個(gè)基頻點(diǎn)之間的差值,從而得到兩個(gè)基頻序列的距離,可以lij用表示。

其中,yit為基頻序列第i個(gè)基頻序列中第t個(gè)基頻點(diǎn)的基頻值,yjt為基頻序列第j個(gè)基頻序列中第t個(gè)基頻點(diǎn)的基頻值,h為基頻序列中基頻點(diǎn)的個(gè)數(shù),lij表示第i個(gè)基頻序列與第j個(gè)基頻序列之間的距離。i∈[1,n],j∈[1,n],i≠j,n為音頻數(shù)據(jù)的個(gè)數(shù)。

可理解的是,數(shù)據(jù)處理裝置可以將第一基頻序列與第二基頻序列之間的距離作為第一音頻數(shù)據(jù)與第二音頻數(shù)據(jù)之間的距離。在獲取到該音頻數(shù)據(jù)中每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離后,針對(duì)每個(gè)音頻數(shù)據(jù),數(shù)據(jù)處理裝置可以將該音頻數(shù)據(jù)分別與其他音頻數(shù)據(jù)的距離相加,得到該音頻數(shù)據(jù)的距離總和,即

其中,si表示第i個(gè)音頻數(shù)據(jù)的距離總和。

通過這種方式,可以得到各個(gè)音頻數(shù)據(jù)的距離和。

需要說明的是,計(jì)算兩個(gè)音頻數(shù)據(jù)的基頻序列的距離,即為確定兩個(gè)音頻數(shù)據(jù)的音準(zhǔn)的差距的操作。

s102、數(shù)據(jù)處理裝置將距離總和最小的音頻數(shù)據(jù)確定為該目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,如果某個(gè)音頻數(shù)據(jù)的音準(zhǔn)在該多個(gè)音頻數(shù)據(jù)中是最好的,那么該音頻數(shù)據(jù)與其他音頻數(shù)據(jù)之間的距離的總和應(yīng)該是最小的,數(shù)據(jù)處理裝置可以將距離總和最小的音頻數(shù)據(jù)確定為該目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù),以便數(shù)據(jù)處理裝置可以參考該指導(dǎo)音頻數(shù)據(jù)將用戶的原始音頻數(shù)據(jù)轉(zhuǎn)化為關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

舉例來說,某一歌曲的原唱的基頻序列為(1,3,3,2),用戶上傳的音頻數(shù)據(jù)有a、b、c三個(gè),其基頻序列依次為(1,2,3,2)、(2,2,3,2)以及(1,3,2,3),那么a與b的距離為1,a與c的距離為3,b與c的距離為4,因此,a的距離和為4,b的距離和為5,c的距離和為7。從而可以看出a更加接近于原唱,也就是說音頻數(shù)據(jù)a的音準(zhǔn)是音頻數(shù)據(jù)a、b、c中最好的。

s103、數(shù)據(jù)處理裝置對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息。

本發(fā)明實(shí)施中,數(shù)據(jù)處理裝置可以根據(jù)演唱該指導(dǎo)音頻數(shù)據(jù)的時(shí)間信息或者該指導(dǎo)音頻數(shù)據(jù)的歌詞信息等信息對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并在切分后的指導(dǎo)音頻數(shù)據(jù)中獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息,該基頻信息可以包括指導(dǎo)音頻數(shù)據(jù)的頻率或幀長等信息,以便可以采用該指導(dǎo)音頻數(shù)據(jù)的基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整。

作為一種可選的實(shí)施例,步驟s103可以通過以下步驟實(shí)現(xiàn):對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,得到多個(gè)單元數(shù)據(jù);提取該多個(gè)單元數(shù)據(jù)中的每個(gè)單元數(shù)據(jù)的基頻信息,并將提取得到的基頻信息進(jìn)行合成得到該指導(dǎo)音頻數(shù)據(jù)的基頻信息。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以對(duì)該指導(dǎo)音頻數(shù)據(jù)的進(jìn)行格式調(diào)整(如調(diào)整為16k16bit格式),可以根據(jù)演唱該指導(dǎo)音頻數(shù)據(jù)的時(shí)間信息或者該指導(dǎo)音頻數(shù)據(jù)的歌詞信息等信息對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,得到多個(gè)單元數(shù)據(jù),并針對(duì)該多個(gè)單元數(shù)據(jù)中的每個(gè)單元數(shù)據(jù),可以按照預(yù)設(shè)的幀信息(例如,幀移5ms,幀長30ms)提取該每個(gè)單元數(shù)據(jù)的基頻信息,將提取得到的基頻信息進(jìn)行合成得到該指導(dǎo)音頻數(shù)據(jù)的基頻信息。

s104、數(shù)據(jù)處理裝置可以根據(jù)該基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以根據(jù)該基頻信息包含的頻率或幀長等信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù),以使調(diào)整后的原始音頻數(shù)據(jù)的頻率或幀長與該指導(dǎo)音頻數(shù)據(jù)的頻率或幀長相等。

s105、數(shù)據(jù)處理裝置將該調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

本實(shí)施例中,數(shù)據(jù)處理裝置對(duì)該原始音頻數(shù)據(jù)的幀長及頻率進(jìn)行調(diào)整后,得到的調(diào)整后的原始音頻數(shù)據(jù)為該目標(biāo)歌曲的清唱數(shù)據(jù),為了使關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的演唱效果更好,該數(shù)據(jù)處理裝置可以將該調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

可見,在圖1所描述的方法中,數(shù)據(jù)處理裝置可以從針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中選擇距離總和最小(音準(zhǔn)最好)的音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù),對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息,根據(jù)該基頻信息對(duì)需要處理的原始音頻數(shù)據(jù)進(jìn)行調(diào)整,將調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

請(qǐng)參閱圖2,為本發(fā)明實(shí)施例提供的另一種數(shù)據(jù)處理方法的流程示意圖。本實(shí)施例中所描述的方法,包括以下步驟:

s201、數(shù)據(jù)處理裝置采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)該音頻數(shù)據(jù)的距離總和。

s202、數(shù)據(jù)處理裝置將距離總和最小的音頻數(shù)據(jù)確定為該目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

s203、數(shù)據(jù)處理裝置對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息。

其中,該基頻信息包括該指導(dǎo)音頻數(shù)據(jù)的第一單元數(shù)據(jù)的幀長和位于第一幀的第一單元數(shù)據(jù)的頻率。該第一單元數(shù)據(jù)為該指導(dǎo)音頻數(shù)據(jù)的任一單元數(shù)據(jù),該第一幀為該第一單元數(shù)據(jù)的任一幀數(shù)據(jù)。

需要說明的是,第一單元數(shù)據(jù)可以是指導(dǎo)音頻數(shù)據(jù)對(duì)應(yīng)歌詞中的一個(gè)字或者一個(gè)詞語,本發(fā)明實(shí)施例不做限定。

本發(fā)明實(shí)施中,數(shù)據(jù)處理裝置可以根據(jù)演唱該指導(dǎo)音頻數(shù)據(jù)的時(shí)間信息或者該指導(dǎo)音頻數(shù)據(jù)的歌詞信息等信息對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并在切分后的指導(dǎo)音頻數(shù)據(jù)中獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息,該基頻信息可以包括指導(dǎo)音頻數(shù)據(jù)的頻率或幀長等信息,以便可以采用該指導(dǎo)音頻數(shù)據(jù)的基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整。

舉例來說,數(shù)據(jù)處理裝置可以將該指導(dǎo)音頻數(shù)據(jù)的格式調(diào)整為預(yù)設(shè)格式,如,16k16bit,采用人工切分的方式或者已經(jīng)訓(xùn)練好切分模型對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分處理,得到該指導(dǎo)音頻數(shù)據(jù)段的第一單元數(shù)據(jù)的時(shí)間信息,將該時(shí)間信息作為第一單元數(shù)據(jù)的幀長,如,某一歌曲的歌詞為“只剩下鋼琴”,對(duì)該歌曲的某個(gè)音頻數(shù)據(jù)進(jìn)行切分處理,得到該音頻數(shù)據(jù)中的“只”的起始時(shí)間為25570ms,持續(xù)時(shí)間為360ms,則該音頻數(shù)據(jù)中“只”的幀長為360ms;“剩”的起始時(shí)間為25930,持續(xù)時(shí)間為370,則該音頻數(shù)據(jù)中“?!钡膸L為370ms;“下”的起始時(shí)間為26300,持續(xù)時(shí)間為100,則該音頻數(shù)據(jù)中“下”的幀長為100ms;“鋼”的起始時(shí)間為26790,持續(xù)時(shí)間為390,則該音頻數(shù)據(jù)中“鋼”的幀長為390ms;“琴”的起始時(shí)間為27180,持續(xù)時(shí)間為420,則該音頻數(shù)據(jù)中“琴”的幀長為420ms。

進(jìn)一步,基頻序列中的基頻點(diǎn)對(duì)應(yīng)的基頻值可以體現(xiàn)某個(gè)音頻數(shù)據(jù)中音符的音高,即基頻序列中的基頻點(diǎn)對(duì)應(yīng)的基頻值可以體現(xiàn)聲帶振動(dòng)的頻率,所以可以通過位于第一幀的第一單元數(shù)據(jù)的基頻序列來獲取該第一幀的頻率。

s204、數(shù)據(jù)處理裝置將原始音頻數(shù)據(jù)中的第二單元數(shù)據(jù)的幀長調(diào)整為該指導(dǎo)音頻數(shù)據(jù)中的第一單元數(shù)據(jù)的幀長,該第二單元數(shù)據(jù)為該原始音頻數(shù)據(jù)中與該第一單元數(shù)據(jù)在該指導(dǎo)音頻數(shù)據(jù)中的位置相同的單元數(shù)據(jù)。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置為了將原始音頻數(shù)據(jù)轉(zhuǎn)化為關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),數(shù)據(jù)處理裝置可以該原始音頻數(shù)據(jù)中的第二單元數(shù)據(jù)的幀長調(diào)整為該指導(dǎo)音頻數(shù)據(jù)中的第一單元數(shù)據(jù)的幀長,以使原始音頻數(shù)據(jù)中每個(gè)單元數(shù)據(jù)與該指導(dǎo)音頻數(shù)據(jù)的對(duì)應(yīng)單元數(shù)據(jù)的長度進(jìn)行對(duì)齊。其中,該第二單元數(shù)據(jù)為該原始音頻數(shù)據(jù)中與該第一單元數(shù)據(jù)在該指導(dǎo)音頻數(shù)據(jù)中的位置相同的單元數(shù)據(jù)。

需要說明的是,原始音頻數(shù)據(jù)可以是用戶說的一段話進(jìn)行格式處理后的音頻數(shù)據(jù),也可以是用戶針對(duì)該目標(biāo)歌曲上傳的音頻數(shù)據(jù)。第二單元數(shù)據(jù)可以是原始音頻數(shù)據(jù)對(duì)應(yīng)的歌詞中一個(gè)字或者一個(gè)詞語,本發(fā)明實(shí)施例不做限定。

舉例來說,某個(gè)歌曲的音頻數(shù)據(jù)中的第三數(shù)據(jù)單元的幀長為20ms,而需要處理的原始音頻數(shù)據(jù)中的第三個(gè)數(shù)據(jù)單元的幀長為15ms,數(shù)據(jù)處理裝置需要將該原始音頻數(shù)據(jù)中的第三個(gè)數(shù)據(jù)單元進(jìn)行拉伸處理,以使該原始音頻數(shù)據(jù)中的第三單元數(shù)據(jù)的幀長也為20ms。

s205、數(shù)據(jù)處理裝置根據(jù)該第一單元數(shù)據(jù)中位于第一幀的單元數(shù)據(jù)的頻率,對(duì)該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)的頻率進(jìn)行調(diào)整,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù),該第二幀為所述第二單元數(shù)據(jù)中與該第第一幀在該第一單元數(shù)據(jù)中的位置相同的幀。

本發(fā)明實(shí)施例中,由于音頻數(shù)據(jù)的頻率決定該音頻數(shù)據(jù)的音高,為了將該原始音頻數(shù)據(jù)的音高調(diào)整為該指導(dǎo)音頻數(shù)據(jù)的音高,數(shù)據(jù)處理裝置可以對(duì)根據(jù)該指導(dǎo)音頻數(shù)據(jù)的頻率對(duì)該原始音頻數(shù)據(jù)的頻率進(jìn)行調(diào)整。具體的,數(shù)據(jù)處理裝置可以根據(jù)該第一單元數(shù)據(jù)中位于第一幀的單元數(shù)據(jù)的頻率,對(duì)該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)的頻率進(jìn)行調(diào)整,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)。

作為一種可選的實(shí)施例,上述根據(jù)該第一單元數(shù)據(jù)中位于第一幀的單元數(shù)據(jù)的頻率,對(duì)該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)的頻率進(jìn)行調(diào)整,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)的具體方式包括:

根據(jù)該第一單元數(shù)據(jù)中位于第一幀的第一單元數(shù)據(jù)的頻率將該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)劃分為多個(gè)時(shí)間周期,該第二幀為第二單元數(shù)據(jù)中與所述該第一幀在該第一單元數(shù)據(jù)中的位置相同的幀。

根據(jù)位于該第一幀的第一時(shí)間周期的單元數(shù)據(jù)的能量,對(duì)該位于該第二幀的第二時(shí)間周期的單元數(shù)據(jù)的能量進(jìn)行調(diào)整,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù),該第二時(shí)間周期為該第二幀中的任一時(shí)間周期,該第一時(shí)間周期為該第一幀中與該第二時(shí)間周期在該第二幀中的位置相同的時(shí)間周期。

將位于該第二幀中調(diào)整后的各個(gè)時(shí)間周期的單元數(shù)據(jù)進(jìn)行合成,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)。

可理解的是,數(shù)據(jù)處理裝置根據(jù)該第一單元數(shù)據(jù)中位于第一幀的第一單元數(shù)據(jù)的頻率將該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)劃分為多個(gè)時(shí)間周期的具體方式包括:可以根據(jù)位于第一幀的第一單元數(shù)據(jù)的頻率將位于第二幀的第二單元數(shù)據(jù)劃分為多個(gè)時(shí)間周期,例如,位于第一幀的第一單元數(shù)據(jù)的頻率為440hz,數(shù)據(jù)處理裝置可以將該第二單元數(shù)據(jù)中位于第二幀的第二單元數(shù)據(jù)劃分為440個(gè)時(shí)間周期。

可理解的是,數(shù)據(jù)處理裝置根據(jù)位于該第一幀的第一時(shí)間周期的單元數(shù)據(jù)的能量,對(duì)該位于該第二幀的第二時(shí)間周期的單元數(shù)據(jù)的能量進(jìn)行調(diào)整,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù)的具體方式包括:

對(duì)位于該第二幀中的第二時(shí)間周期的單元數(shù)據(jù)進(jìn)行采樣處理,得到多個(gè)采樣點(diǎn)。

以能量最大的采樣點(diǎn)為中心,從該第二時(shí)間周期中獲取滿足指定長度的目標(biāo)單元數(shù)據(jù),該指定長度是根據(jù)位于該第一幀的單元數(shù)據(jù)的頻率確定的。

通過預(yù)設(shè)壓縮算法對(duì)該目標(biāo)單元數(shù)據(jù)的能量進(jìn)行處理,得到壓縮后的目標(biāo)單元數(shù)據(jù)。

將該壓縮后的目標(biāo)單元數(shù)據(jù)的能量與位于該第一幀中第一時(shí)間周期的單元數(shù)據(jù)的能量的進(jìn)行相加,得到能量總和。

將位于該第二幀中第二時(shí)間周期的單元數(shù)據(jù)的能量調(diào)整為該能量總和,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù)。

具體實(shí)現(xiàn)中,數(shù)據(jù)處理裝置可以對(duì)位于所述第二幀中的第二時(shí)間周期的單元數(shù)據(jù)進(jìn)行采樣處理,得到多個(gè)采樣點(diǎn)。由于該第二周期中的單元數(shù)據(jù)并不是所有采樣點(diǎn)都是有用數(shù)據(jù),例如,采樣點(diǎn)中可能包括噪音部分和靜音部分等,這種情況下的采樣點(diǎn)的能量往往比較底,因而數(shù)據(jù)處理裝置可以以能量最大的采樣點(diǎn)為中心,從該第二時(shí)間周期中獲取滿足指定長度的目標(biāo)單元數(shù)據(jù),該指定長度可以是根據(jù)位于該第一幀的單元數(shù)據(jù)的頻率確定的。

進(jìn)一步,為了使得到的關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)更加平滑,數(shù)據(jù)處理裝置可以通過預(yù)設(shè)壓縮算法對(duì)該目標(biāo)單元數(shù)據(jù)的能量進(jìn)行處理,得到壓縮后的目標(biāo)單元數(shù)據(jù),并可以將該壓縮后的目標(biāo)單元數(shù)據(jù)的能量與位于該第一幀中第一時(shí)間周期的單元數(shù)據(jù)的能量的進(jìn)行相加,得到能量總和,將位于該第二幀中第二時(shí)間周期的單元數(shù)據(jù)的能量調(diào)整為該能量總和,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù)。

其中,預(yù)設(shè)壓縮算法可以是各種加窗算法,如,加矩形窗、三角窗、海明窗或高斯窗等算法,該預(yù)設(shè)壓縮算法還可以是huffman壓縮算法等。

舉例來說,數(shù)據(jù)處理裝置可以對(duì)位于所述第二幀中的第二時(shí)間周期的單元數(shù)據(jù)進(jìn)行采樣處理,得到多個(gè)采樣點(diǎn),該第一幀的頻率為f,第二時(shí)間周期的時(shí)間周期為d,數(shù)據(jù)處理裝置可以在第二時(shí)間周期中以能量最大的采樣點(diǎn)為中心獲取長度為1/f的單元數(shù)據(jù)ki,其中i表示獲取的第i個(gè)采樣點(diǎn),i∈[1,m],m表示在第二時(shí)間周期中獲取的采樣點(diǎn)的個(gè)數(shù)。并通過加三角窗的方式對(duì)該單元數(shù)據(jù)ki的能量進(jìn)行壓縮處理,得到壓縮后的單元數(shù)據(jù)ri=ki*0.5*(1-cos2πi/m),將該壓縮后的單元數(shù)據(jù)的能量與位于該第一幀中第一時(shí)間周期的單元數(shù)據(jù)的能量的進(jìn)行相加,得到能量總和,并將位于該第二幀中第二時(shí)間周期的單元數(shù)據(jù)的能量調(diào)整為該能量總和,以使得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù)的頻率與第一幀的單元數(shù)據(jù)的頻率相同。

可理解的是,數(shù)據(jù)處理裝置將位于該第二幀中調(diào)整后的各個(gè)時(shí)間周期的單元數(shù)據(jù)進(jìn)行合成,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)的具體方式包括:由于每幀單元數(shù)據(jù)包括多個(gè)時(shí)間周期,在對(duì)每個(gè)時(shí)間周期進(jìn)行處理后,數(shù)據(jù)處理裝置可以將位于該第二幀中調(diào)整后的各個(gè)時(shí)間周期的單元數(shù)據(jù)進(jìn)行合成,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)。即將調(diào)整后的各個(gè)時(shí)間周期的單元數(shù)據(jù)的順序按照未調(diào)整的各個(gè)時(shí)間周期的順序進(jìn)行排列,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)。

s206、數(shù)據(jù)處理裝置將該原始音頻數(shù)據(jù)中各個(gè)調(diào)整后的單元數(shù)據(jù)進(jìn)行合成,得到該調(diào)整后的原始音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以按照調(diào)整前演唱該原始音頻數(shù)據(jù)的各個(gè)單元數(shù)據(jù)的時(shí)間先后順序?qū)φ{(diào)整后的單元數(shù)據(jù)進(jìn)行合成,得到該調(diào)整后的原始音頻數(shù)據(jù)。

s207、數(shù)據(jù)處理裝置將該調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

需要說明的是,步驟s201~s202的說明可以參考第一實(shí)施例中的步驟s101~s102,步驟s207的說明可以參考第一實(shí)施例中的步驟s105,本發(fā)明實(shí)施例在此不再贅述。

可見,在圖2所描述的方法中,數(shù)據(jù)處理裝置可以從針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中選擇距離總和最小(音準(zhǔn)最好)的音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù),并根據(jù)指導(dǎo)音頻數(shù)據(jù)的幀長及頻率對(duì)需要處理的原始音頻數(shù)據(jù)的幀長及頻率進(jìn)行調(diào)整,可以得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

請(qǐng)參閱圖3,為本發(fā)明實(shí)施例提供的再一種數(shù)據(jù)處理方法的流程示意圖。本實(shí)施例中所描述的方法,包括以下步驟:

s301、數(shù)據(jù)處理裝置采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)該音頻數(shù)據(jù)的距離總和。

s302、數(shù)據(jù)處理裝置在該多個(gè)音頻數(shù)據(jù)中獲取距離總和最小的第一音頻數(shù)據(jù),以及距離總和較小的至少一個(gè)第二音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以在該多個(gè)音頻數(shù)據(jù)中獲取距離總和最小的第一音頻數(shù)據(jù),以及距離總和較小的至少一個(gè)第二音頻數(shù)據(jù)。其中,第二音頻數(shù)據(jù)可以是該多個(gè)音頻數(shù)據(jù)中距離總和較小的至少一個(gè)音頻數(shù)據(jù),第二音頻數(shù)據(jù)也可以是該多個(gè)音頻數(shù)據(jù)中距離總和最小的至少一個(gè)音頻數(shù)據(jù),該第二音頻數(shù)據(jù)的個(gè)數(shù)可以根據(jù)該多個(gè)音頻數(shù)據(jù)的數(shù)量確定,也可以是用戶手動(dòng)設(shè)置,本發(fā)明實(shí)施例中不做限定。

s303、數(shù)據(jù)處理裝置根據(jù)該第一音頻數(shù)據(jù)的距離總和,以及各個(gè)該第二音頻數(shù)據(jù)的距離總和,計(jì)算該第一音頻數(shù)據(jù)的可用度。

本發(fā)明實(shí)施例中,由于該用戶針對(duì)該目標(biāo)歌曲的上傳的多個(gè)音頻數(shù)據(jù)中,可能距離總和最小的音頻數(shù)據(jù)的音準(zhǔn)仍較差,因而數(shù)據(jù)處理裝置可以進(jìn)一步根據(jù)該距離總和最小的音頻數(shù)據(jù)的可用度來判斷該距離總和最小的音頻數(shù)據(jù)是否可用。具體的,數(shù)據(jù)處理裝置可以根據(jù)該第一音頻數(shù)據(jù)的距離總和,以及各個(gè)該第二音頻數(shù)據(jù)的距離總和,計(jì)算該第一音頻數(shù)據(jù)的可用度。

作為一種可選的實(shí)施例,數(shù)據(jù)處理裝置根據(jù)該第一音頻數(shù)據(jù)的距離總和,以及各個(gè)該第二音頻數(shù)據(jù)的距離總和,計(jì)算該第一音頻數(shù)據(jù)的可用度的具體方式可以為:

將各個(gè)該第二音頻數(shù)據(jù)的距離總和相加,得到相加距離值。

將所述第一音頻數(shù)據(jù)的距離總和除以該相加距離值,得到該第一音頻數(shù)據(jù)的可用度。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以將各個(gè)該第二音頻數(shù)據(jù)的距離總和相加,得到相加距離值,并可以將該第一音頻數(shù)據(jù)的距離總和除以該相加距離值,得到該第一音頻數(shù)據(jù)的可用度,用f表示。

其中,s1表示第一音頻數(shù)據(jù)的距離總和,s2表示各個(gè)該第二音頻數(shù)據(jù)的距離總和相加得到相加距離值。

需要說明的是,可用度用于表示距離總和較小的至少一個(gè)第二音頻數(shù)據(jù)音準(zhǔn)的穩(wěn)定程度,其值越大,越穩(wěn)定,即說明距離總和最小的第一音頻數(shù)據(jù)與各個(gè)第二音頻數(shù)據(jù)之間的差距越小,第一音頻數(shù)據(jù)作為音準(zhǔn)效果較好的音頻數(shù)據(jù)的力度也就越大,從而可以將第一音頻數(shù)據(jù)作為合成關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的指導(dǎo)音頻數(shù)據(jù)。

s304、數(shù)據(jù)處理裝置在該第一音頻數(shù)據(jù)的可用度大于預(yù)設(shè)比例閾值時(shí),將該第一音頻數(shù)據(jù)確定為該目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以預(yù)先設(shè)定可用度門限,即預(yù)設(shè)比例閾值,當(dāng)數(shù)據(jù)處理裝置計(jì)算出第一音頻數(shù)據(jù)的可用度后,會(huì)判斷該可用度是否超過預(yù)設(shè)比例閾值,如果超過,則說明第一音頻數(shù)據(jù)與各個(gè)第二音頻數(shù)據(jù)之間的差距較小,第一音頻數(shù)據(jù)的音準(zhǔn)較好,將其作為指導(dǎo)音頻數(shù)據(jù)比較可行,如果沒有超過,則不將其作為指導(dǎo)音頻數(shù)據(jù),只有在下次聚類時(shí)再篩選音準(zhǔn)較好的音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù)。

也即是說,第一音頻數(shù)據(jù)是該多個(gè)音頻數(shù)據(jù)中音準(zhǔn)較好的音頻數(shù)據(jù),如果該多個(gè)音頻數(shù)據(jù)的音準(zhǔn)普遍都比較差,這樣第一音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù)的力度就不夠大,如果該多個(gè)音頻數(shù)據(jù)的音準(zhǔn)普遍都比較好,將第一音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù)的力度就大。

s305、數(shù)據(jù)處理裝置對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息。

s306、數(shù)據(jù)處理裝置根據(jù)該基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù)。

s307、數(shù)據(jù)處理裝置將該調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

需要說明的是,步驟s301的說明可以參考第一實(shí)施例中的步驟s101的說明,步驟s305~s307的說明可以參考第一實(shí)施例中的步驟s103~s105的說明,本發(fā)明實(shí)施例在此不再贅述。

可見,在圖3所描述的方法中,數(shù)據(jù)處理裝置可以從針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中選擇距離總和最小的第一音頻數(shù)據(jù),并確定出距離總和較小的至少一個(gè)第二音頻數(shù)據(jù),根據(jù)第一音頻數(shù)據(jù)的距離總和及各個(gè)第二音頻數(shù)據(jù)的距離總和計(jì)算第一音頻數(shù)據(jù)的可用度,在第一音頻數(shù)據(jù)的可用度大于預(yù)設(shè)比例閾值時(shí),可以將第一音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù),對(duì)該指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取該指導(dǎo)音頻數(shù)據(jù)的基頻信息,根據(jù)指導(dǎo)音頻數(shù)據(jù)的基頻信息對(duì)需要處理的原始音頻數(shù)據(jù)進(jìn)行調(diào)整,將調(diào)整后的原始音頻數(shù)據(jù)與該歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

基于上述實(shí)施例所示的數(shù)據(jù)處理方法,本發(fā)明實(shí)施例還提供了一種數(shù)據(jù)處理設(shè)備,可用于執(zhí)行上述圖1、圖2和圖3所示方法流程的相應(yīng)步驟。請(qǐng)參見圖4,該數(shù)據(jù)處理設(shè)備的內(nèi)部結(jié)構(gòu)可包括但不限于:處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器。其中,數(shù)據(jù)處理設(shè)備內(nèi)的處理器、網(wǎng)絡(luò)接口及存儲(chǔ)器可通過總線或其他方式連接,在本發(fā)明實(shí)施例所示圖4中以通過總線連接為例。

其中,處理器(或稱cpu(centralprocessingunit,中央處理器))是數(shù)據(jù)處理設(shè)備的計(jì)算核心以及控制核心。網(wǎng)絡(luò)接口可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如wi-fi、移動(dòng)通信接口等)。存儲(chǔ)器(memory)是音數(shù)據(jù)處理設(shè)備中的記憶設(shè)備,用于存放程序和數(shù)據(jù)。可以理解的是,此處的存儲(chǔ)器可以是高速ram存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)器;可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器的存儲(chǔ)裝置。存儲(chǔ)器提供存儲(chǔ)空間,該存儲(chǔ)空間存儲(chǔ)了數(shù)據(jù)處理的操作系統(tǒng),可包括但不限于:windows系統(tǒng)(一種操作系統(tǒng))、linux(一種操作系統(tǒng))系統(tǒng)等等,本發(fā)明對(duì)此并不作限定。存儲(chǔ)器的存儲(chǔ)空間還存儲(chǔ)了數(shù)據(jù)處理裝置。

在本發(fā)明實(shí)施例中,數(shù)據(jù)處理設(shè)備通過運(yùn)行存儲(chǔ)器中的數(shù)據(jù)處理裝置來執(zhí)行上述圖1、圖2和圖3所示方法流程的相應(yīng)步驟。請(qǐng)一并參見圖5,在執(zhí)行如何根據(jù)目標(biāo)歌曲的音頻數(shù)據(jù)將需要處理的原始音頻數(shù)據(jù)轉(zhuǎn)化為關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)過程中,該裝置運(yùn)行如下單元:

獲取模塊501,用于采集針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù),并獲取各個(gè)所述音頻數(shù)據(jù)的距離總和。

確定模塊502,用于將距離總和最小的音頻數(shù)據(jù)確定為所述目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

所述獲取模塊501,還用于對(duì)所述指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取所述指導(dǎo)音頻數(shù)據(jù)的基頻信息。

調(diào)整模塊503,用于根據(jù)所述基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù)。

合成模塊504,用于將所述調(diào)整后的原始音頻數(shù)據(jù)與所述目標(biāo)歌曲的伴奏數(shù)據(jù)進(jìn)行合成,得到關(guān)于所述原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)。

需要說明的是,所述基頻信息包括所述指導(dǎo)音頻數(shù)據(jù)的第一單元數(shù)據(jù)的幀長和位于第一幀的所述第一單元數(shù)據(jù)的頻率,所述第一單元數(shù)據(jù)為所述指導(dǎo)音頻數(shù)據(jù)的任一單元數(shù)據(jù),所述第一幀為所述第一單元數(shù)據(jù)的任一幀數(shù)據(jù),所述調(diào)整模塊503根據(jù)所述基頻信息對(duì)原始音頻數(shù)據(jù)進(jìn)行調(diào)整,得到調(diào)整后的原始音頻數(shù)據(jù),具體用于:

將所述原始音頻數(shù)據(jù)中的第二單元數(shù)據(jù)的幀長調(diào)整為所述指導(dǎo)音頻數(shù)據(jù)中的第一單元數(shù)據(jù)的幀長,所述第二單元數(shù)據(jù)為所述原始音頻數(shù)據(jù)中與所述第一單元數(shù)據(jù)在所述指導(dǎo)音頻數(shù)據(jù)中的位置相同的單元數(shù)據(jù)。

根據(jù)位于第一幀的所述第一單元數(shù)據(jù)的頻率,對(duì)位于第二幀的第二單元數(shù)據(jù)的頻率進(jìn)行調(diào)整,得到調(diào)整后的位于第二幀的單元數(shù)據(jù),所述第二幀為所述第二單元數(shù)據(jù)中與所述第一幀在所述第一單元數(shù)據(jù)中的位置相同的幀。

將所述原始音頻數(shù)據(jù)中各個(gè)調(diào)整后的單元數(shù)據(jù)進(jìn)行合成,得到所述調(diào)整后的原始音頻數(shù)據(jù)。

需要說明的是,所述獲取模塊501對(duì)所述指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取所述指導(dǎo)音頻數(shù)據(jù)的基頻信息,具體用于:

對(duì)所述指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,得到多個(gè)單元數(shù)據(jù)。

提取所述多個(gè)單元數(shù)據(jù)中的每個(gè)單元數(shù)據(jù)的基頻信息,并將提取得到的基頻信息進(jìn)行合成得到所述指導(dǎo)音頻數(shù)據(jù)的基頻信息。

需要說明的是,所述調(diào)整模塊503根據(jù)位于第一幀的所述第一單元數(shù)據(jù)的頻率,對(duì)位于第二幀的所述第二單元數(shù)據(jù)的頻率進(jìn)行調(diào)整,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù),具體用于:

根據(jù)位于第一幀的所述第一單元數(shù)據(jù)的頻率將位于第二幀的所述第二單元數(shù)據(jù)劃分為多個(gè)時(shí)間周期。

根據(jù)位于所述第一幀的第一時(shí)間周期的單元數(shù)據(jù)的能量,對(duì)位于所述第二幀的第二時(shí)間周期的單元數(shù)據(jù)的能量進(jìn)行調(diào)整,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù),所述第二時(shí)間周期為所述第二幀中的任一時(shí)間周期,所述第一時(shí)間周期為所述第一幀中與所述第二時(shí)間周期在所述第二幀中的位置相同的時(shí)間周期。

將位于所述第二幀中調(diào)整后的各個(gè)時(shí)間周期的單元數(shù)據(jù)進(jìn)行合成,得到調(diào)整后的位于第二幀的第二單元數(shù)據(jù)。

需要說明的是,所述調(diào)整模塊503根據(jù)位于所述第一幀的第一時(shí)間周期的單元數(shù)據(jù)的能量,對(duì)位于所述第二幀的第二時(shí)間周期的單元數(shù)據(jù)的能量進(jìn)行調(diào)整,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù),具體用于:

對(duì)位于所述第二幀中的第二時(shí)間周期的單元數(shù)據(jù)進(jìn)行采樣處理,得到多個(gè)采樣點(diǎn)。

以能量最大的采樣點(diǎn)為中心,從所述第二時(shí)間周期中獲取滿足指定長度的目標(biāo)單元數(shù)據(jù),所述指定長度是根據(jù)位于所述第一幀的單元數(shù)據(jù)的頻率確定的。

通過預(yù)設(shè)壓縮算法對(duì)所述目標(biāo)單元數(shù)據(jù)的能量進(jìn)行處理,得到壓縮后的目標(biāo)單元數(shù)據(jù)。

將所述壓縮后的目標(biāo)單元數(shù)據(jù)的能量與位于所述第一幀中第一時(shí)間周期的單元數(shù)據(jù)的能量的進(jìn)行相加,得到能量總和。

將位于所述第二幀中第二時(shí)間周期的單元數(shù)據(jù)的能量調(diào)整為所述能量總和,得到調(diào)整后的位于第二時(shí)間周期的單元數(shù)據(jù)。

需要說明的是,獲取模塊501獲取各個(gè)所述音頻數(shù)據(jù)的距離總和,具體用于:

提取針對(duì)所述目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中每個(gè)音頻數(shù)據(jù)的基頻序列。

針對(duì)所述多個(gè)音頻數(shù)據(jù)中的每個(gè)音頻數(shù)據(jù),根據(jù)所述基頻序列計(jì)算每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離。

根據(jù)所述每?jī)蓚€(gè)音頻數(shù)據(jù)之間的距離,計(jì)算各個(gè)所述音頻數(shù)據(jù)的距離總和。

需要說明的是,所述確定模塊502將距離總和最小的音頻數(shù)據(jù)確定為所述目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù),具體用于:

在所述多個(gè)音頻數(shù)據(jù)中獲取距離總和最小的第一音頻數(shù)據(jù),以及距離總和較小的至少一個(gè)第二音頻數(shù)據(jù)。

根據(jù)所述第一音頻數(shù)據(jù)的距離總和,以及各個(gè)所述第二音頻數(shù)據(jù)的距離總和,計(jì)算所述第一音頻數(shù)據(jù)的可用度。

當(dāng)所述第一音頻數(shù)據(jù)的可用度大于預(yù)設(shè)比例閾值時(shí),將所述第一音頻數(shù)據(jù)確定為所述目標(biāo)歌曲的指導(dǎo)音頻數(shù)據(jù)。

需要說明的是,所述確定模塊502根據(jù)所述第一音頻數(shù)據(jù)的距離總和,以及各個(gè)所述第二音頻數(shù)據(jù)的距離總和,計(jì)算所述第一音頻數(shù)據(jù)的可用度,具體用于:

將各個(gè)所述第二音頻數(shù)據(jù)的距離總和相加,得到相加距離值。

將所述第一音頻數(shù)據(jù)的距離總和除以所述相加距離值,得到所述第一音頻數(shù)據(jù)的可用度。

可見,本發(fā)明實(shí)施例中,數(shù)據(jù)處理裝置可以從針對(duì)目標(biāo)歌曲的多個(gè)音頻數(shù)據(jù)中選擇距離總和最小(音準(zhǔn)最好)的音頻數(shù)據(jù)作為指導(dǎo)音頻數(shù)據(jù),將指導(dǎo)音頻數(shù)據(jù)進(jìn)行切分,并獲取指導(dǎo)音頻數(shù)據(jù)的基頻信息,根據(jù)指導(dǎo)音頻數(shù)據(jù)的基頻信息對(duì)需要處理的原始音頻數(shù)據(jù)進(jìn)行調(diào)整,將調(diào)整后的原始音頻數(shù)據(jù)與該目標(biāo)歌曲的伴奏進(jìn)行合成,得到關(guān)于該原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù),可自動(dòng)識(shí)別指導(dǎo)音頻數(shù)據(jù),并可提高關(guān)于原始音頻數(shù)據(jù)的合成音頻數(shù)據(jù)的播放效果。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁碟、光盤、只讀存儲(chǔ)記憶體(read-onlymemory,rom)或隨機(jī)存取存儲(chǔ)器(randomaccessmemory,簡(jiǎn)稱ram)等。

以上所揭露的僅為本發(fā)明一種較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分流程,并依本發(fā)明權(quán)利要求所作的等同變化,仍屬于發(fā)明所涵蓋的范圍。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
巨鹿县| 崇文区| 登封市| 南川市| 延长县| 屏南县| 利辛县| 青冈县| 镇巴县| 台湾省| 凤翔县| 杭锦旗| 兴仁县| 台中市| 揭西县| 镇坪县| 上林县| 余姚市| 天镇县| 汉中市| 溧水县| 河津市| 佛坪县| 安化县| 游戏| 云浮市| 深水埗区| 裕民县| 青浦区| 金沙县| 开远市| 福建省| 安溪县| 江都市| 民县| 南和县| 南康市| 呈贡县| 晋城| 枝江市| 桃江县|