專(zhuān)利名稱(chēng):數(shù)碼音頻數(shù)據(jù)再生裝置(digitalaudio data playing apparatus)的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型涉及數(shù)碼音頻數(shù)據(jù)再生裝置,具體為數(shù)碼音頻數(shù)據(jù),尤其是對(duì)MP3文件,用MP3編碼器儲(chǔ)存音源,并用MP3解碼器使其再生,通過(guò)用硬件方式實(shí)現(xiàn)時(shí)間標(biāo)尺轉(zhuǎn)換技術(shù)SOLA算法的速度調(diào)節(jié)裝置使聲音信號(hào)的丟失及失真受影響的音質(zhì)無(wú)變化,并可調(diào)節(jié)其再生速度的數(shù)碼音頻數(shù)據(jù)再生裝置。
背景技術(shù):
MP3(MP3MPEG-1 Audio Layer 3,以下稱(chēng)MP3)因其數(shù)碼聲音數(shù)據(jù)格式而具有通用性與壓縮性顯著的優(yōu)點(diǎn)。目前利用MP3編解器壓縮與再生是被廣泛應(yīng)用的方法,因此對(duì)于普通人來(lái)說(shuō)具有容易接收也容易找到音源的優(yōu)點(diǎn)。
以聲音為例,采樣頻率為16KHz,用16bits MONO方式儲(chǔ)存聲音時(shí),每秒大約要儲(chǔ)存256kbits數(shù)據(jù)。但是若利用MP3壓縮方式的話(huà),可以每秒儲(chǔ)存約8kbits至160kbits之間的數(shù)據(jù),從而能夠解決數(shù)據(jù)儲(chǔ)存與傳輸上的問(wèn)題。
MP3音頻壓縮方式是利用人類(lèi)的聽(tīng)覺(jué)結(jié)構(gòu)。人的聽(tīng)覺(jué)結(jié)構(gòu)是在頻率區(qū)域內(nèi)與過(guò)濾儲(chǔ)存的同時(shí)把時(shí)間區(qū)域的信號(hào)換成頻率區(qū)域的信號(hào)來(lái)認(rèn)知,這時(shí)根據(jù)每個(gè)頻率帶寬,其敏感度或可聽(tīng)界限也不同。而且,某個(gè)頻率帶寬內(nèi)存在大能量信號(hào)時(shí),發(fā)生聽(tīng)不到周邊帶寬內(nèi)弱信號(hào)的屏蔽現(xiàn)象。利用此現(xiàn)象產(chǎn)生被屏蔽無(wú)法認(rèn)知到的量化雜音,確定其量化電平后,再利用其進(jìn)行位分配來(lái)壓縮數(shù)據(jù)。因此可以維持高音質(zhì)的同時(shí)又可以得到較高壓縮率。
如MP3這樣的再生數(shù)碼音源文件的裝置,已超出單純地把聲音信號(hào)再生及輸出的水平,可提供快速或慢速調(diào)節(jié)再生速度的功能。特別是,這樣的功能可以廣泛應(yīng)用于如語(yǔ)言學(xué)習(xí)的教育方面或者要求有音樂(lè)速度變化的領(lǐng)域內(nèi)多種機(jī)器(歌廳機(jī)器等)上。
以前以軟件方式解決這樣的音源文件的再生速度調(diào)節(jié),下面來(lái)看一下傳統(tǒng)的聲音速度轉(zhuǎn)換技術(shù)。
聲音速度轉(zhuǎn)換(TSMTime Scale Modification,以下稱(chēng)‘TSM’)是在時(shí)間標(biāo)尺上壓縮或放大輸入信號(hào)使信號(hào)的再生速度轉(zhuǎn)換,可在歌廳播放機(jī)器的音樂(lè)速度轉(zhuǎn)換,用于學(xué)習(xí)外語(yǔ)的聲音再生速度轉(zhuǎn)換,還有數(shù)據(jù)壓縮及恢復(fù)等多種領(lǐng)域里得到應(yīng)用。尤其是最近,在MP3播放器類(lèi)便攜式音頻播放器上實(shí)現(xiàn)外語(yǔ)學(xué)習(xí)等附加功能,還可同時(shí)使用特定聲音解碼器。
這類(lèi)TSM算法為轉(zhuǎn)換時(shí)間標(biāo)尺方法,可大致分為時(shí)間區(qū)域方法與頻率區(qū)域方法。特別是在時(shí)間區(qū)域方法中具有代表性的是,1)輸入信號(hào)以窗口(window)為單位分段,并在相鄰的窗口(window)之間,通過(guò)overlap and add演算過(guò)程,壓縮或放大輸入信號(hào)的OLA(Overlap-Add)算法和;2)有利用相鄰的窗口(windows)之間的間距(pitch)同步進(jìn)行overlap and add演算,使其克服OLA算法中壓縮時(shí)發(fā)生‘clicking’現(xiàn)象、而放大時(shí)則發(fā)生‘reverberation’現(xiàn)象的問(wèn)題,從而得到較為自然輸出聲音的SOLA(Synchronized OverLapand Add)算法,此外還有對(duì)SOLA算法進(jìn)行多種變形的算法。而且在頻率帶寬方法中具有代表性的是利用STFT的Griffin and Lim算法等。
但是以前因?yàn)橛密浖绞竭M(jìn)行聲音速度轉(zhuǎn)換,所以其實(shí)現(xiàn)復(fù)雜,不僅使開(kāi)發(fā)及成本增加,而且和設(shè)計(jì)成電路比起來(lái),還存在著轉(zhuǎn)換速度下降的問(wèn)題。
并且,為變化聲音信號(hào)的發(fā)音速度,只單純地把再生速度調(diào)節(jié)成快速或慢速,聲音信號(hào)的頻譜就會(huì)發(fā)生失真使其音色變化,再生的音程發(fā)生或高或低的問(wèn)題。
實(shí)用新型內(nèi)容本實(shí)用新型要解決所述問(wèn)題而提出來(lái)的,因此本實(shí)用新型的目的是提供再生如MP3數(shù)碼音頻數(shù)據(jù)時(shí),可通過(guò)以硬件方式實(shí)現(xiàn)如SOLA算法或SOLA變形算法等時(shí)間標(biāo)尺轉(zhuǎn)換算法的速度調(diào)節(jié)裝置使聲音信號(hào)的丟失、失真引起的音質(zhì)無(wú)變化,調(diào)節(jié)其再生速度,而且還可在同一個(gè)芯片上實(shí)現(xiàn)所述速度調(diào)節(jié)裝置和編解器的數(shù)碼音頻數(shù)據(jù)再生裝置。
為了達(dá)成所述目的,本實(shí)用新型所涉及的數(shù)碼音頻數(shù)據(jù)再生裝置是具有把輸入的數(shù)碼音頻數(shù)據(jù)儲(chǔ)存到規(guī)定的存儲(chǔ)區(qū)內(nèi),并根據(jù)用戶(hù)的需要儲(chǔ)存的數(shù)碼音頻數(shù)據(jù)的再生與利用時(shí)間標(biāo)尺轉(zhuǎn)換算法進(jìn)行再生速度轉(zhuǎn)換的音源處理區(qū)的數(shù)碼音頻數(shù)據(jù)再生裝置,其特征在于,包括處理用戶(hù)輸入的輸入?yún)^(qū);從外部輸入音源信號(hào)的音源輸入?yún)^(qū);提供與外設(shè)裝置輸入輸出數(shù)據(jù)接口的傳輸區(qū);儲(chǔ)存數(shù)碼音頻數(shù)據(jù)的存儲(chǔ)區(qū);控制數(shù)碼音頻數(shù)據(jù)再生裝置的工作并存儲(chǔ)再生數(shù)碼音頻數(shù)據(jù)控制信息與轉(zhuǎn)換再生速度的速度變化率控制信息的第一寄存器主控制單位;顯示數(shù)碼音頻數(shù)據(jù)再生裝置狀態(tài)信息的顯示區(qū);傳輸并儲(chǔ)存第一寄存器控制信息的第二寄存器;具有把外界輸入的音源信號(hào)儲(chǔ)存至存儲(chǔ)區(qū)而進(jìn)行壓縮的編碼器和輸入儲(chǔ)存在存儲(chǔ)區(qū)的數(shù)碼音頻數(shù)據(jù),恢復(fù)其再生格式解碼器的編解器及具有輸入編解器的解碼恢復(fù)的數(shù)碼音頻數(shù)據(jù)與第二寄存器的速度變化率,再根據(jù)數(shù)碼音頻數(shù)據(jù)速度變化率來(lái)轉(zhuǎn)換時(shí)間標(biāo)尺的速度調(diào)節(jié)區(qū)的音源處理區(qū);及輸出音源處理區(qū)處理過(guò)音源的音源輸出區(qū)。
希望速度調(diào)節(jié)區(qū)具備如下特征,具有解碼器輸出的音源信號(hào)按規(guī)定窗口長(zhǎng)度分割的幀頻分割區(qū);在幀頻分割區(qū)分割的幀頻按速度變化率以規(guī)定值選擇固定的輸出信號(hào)合成移位值,并變更輸入信號(hào)的解析移位值來(lái)求下一個(gè)幀頻的幀頻計(jì)算區(qū);在幀頻計(jì)算區(qū)求得的幀頻間重疊區(qū)間里,通過(guò)交叉相關(guān)取得同步長(zhǎng)度的同步長(zhǎng)度計(jì)算部;及移動(dòng)同步長(zhǎng)度的距離,重新排列幀頻并輸出再生速度轉(zhuǎn)換音源信號(hào)的幀頻重新排列區(qū)。
最好是,數(shù)碼音頻數(shù)據(jù)為MP3數(shù)據(jù)格式,且SOLA算法使用時(shí)間標(biāo)尺算法。
使用編解器輸入PCM數(shù)據(jù)時(shí),編碼器及解碼器使輸入的數(shù)據(jù)旁路。
圖1是顯示在SOLA算法上被定義使用的各參數(shù)的圖。
圖2是顯示利用SOLA算法把聲音信號(hào)編碼/解碼過(guò)程的流程圖。
圖3是根據(jù)本實(shí)用新型的數(shù)碼音頻數(shù)據(jù)再生裝置結(jié)構(gòu)圖。
圖4是根據(jù)本實(shí)用新型的呈現(xiàn)音源處理區(qū)內(nèi)部結(jié)構(gòu)的塊結(jié)構(gòu)圖。
具體實(shí)施方式
以下,參照附圖詳細(xì)說(shuō)明本實(shí)用新型的優(yōu)、特點(diǎn)及其實(shí)施例。并且數(shù)碼音頻數(shù)據(jù)以最通用的MP3數(shù)據(jù)格式為中心說(shuō)明,在速度調(diào)節(jié)區(qū),為調(diào)節(jié)數(shù)碼音頻數(shù)據(jù)的再生速度而以電路實(shí)現(xiàn)其聲音速度轉(zhuǎn)換算法則以時(shí)間區(qū)域方法中最廣泛應(yīng)用的SOLA算法為中心來(lái)說(shuō)明。
首先要說(shuō)明的是,在聲音速度轉(zhuǎn)換(TSMTime ScaleModification,以下稱(chēng)‘TSM’)算法中一般使用的SOLA(Synchronized OverLap and Add)算法。
SOLA算法是作為在時(shí)間區(qū)域轉(zhuǎn)換速度的典型方法,利用相鄰窗口之間的間距信息執(zhí)行overlap-add演算,是改善OLA方法缺點(diǎn)的算法。即,SOLA算法是在特定區(qū)間內(nèi)對(duì)先行的全體聲音信號(hào),移動(dòng)另一個(gè)新的聲音信號(hào)幀頻的起始點(diǎn)并尋找具有最高交叉相關(guān)系數(shù)的位置,并在此位置采用模擬信號(hào)轉(zhuǎn)換為數(shù)碼信號(hào)時(shí)使用的采樣方法把幀頻重疊起來(lái),平均后產(chǎn)生新的聲音信號(hào),以此在鄰近區(qū)域內(nèi)連續(xù)的幀頻之間尋找最適合相似性(similarity)的方法。在這里,交叉相關(guān)系數(shù)為利用交叉相關(guān)函數(shù)(Cross-Correlation Function)對(duì)兩個(gè)聲音信號(hào)計(jì)算的值,處于‘-1’與‘1’之間,相關(guān)系數(shù)為‘1’時(shí)表示兩個(gè)信號(hào)間的相關(guān)關(guān)系很大。
圖1是顯示在SOLA算法上被定義使用的各參數(shù)(parameter)的圖。在圖1中,‘winlen’是在原輸入信號(hào)乘以窗口(window)表示具有一定長(zhǎng)度的幀頻長(zhǎng);‘Sa’是解析移位(Analysis Shift),為輸入信號(hào)的解析段單位;‘Ss’是合成移位(Synthesis Shift),為輸出信號(hào)的合成段單位;‘Kmax’是為配合兩個(gè)連續(xù)幀頻間的間距(pitch)同步,定義間距檢索的最大移動(dòng)范圍。
還有速度變化率(a)由Ss/Sa值定義,若a值比1小(a<1)時(shí),因聲音壓縮效果,聲音速度比原音速快;若比1大時(shí)(a>1),因聲音放大效果比原音速慢。一般情況下,速度變化率(a)體現(xiàn)為0.5(快兩倍)至2.0(慢兩倍)之間的值。
圖2是顯示利用SOLA算法把聲音信號(hào)編碼/解碼過(guò)程的流程圖。
在SOLA編碼算法中以時(shí)間標(biāo)尺因子(time scale factor)分類(lèi)求得的同步長(zhǎng)度(synchronization log)值k使用于SOLA解碼。
如圖2a所示,為了求k值,在輸入的原信號(hào)(取樣)乘以窗口分割出一定長(zhǎng)度的幀頻(ST200,ST210),在乘窗口時(shí),使其重疊(overlap)并以一定間隔移動(dòng)。更確切地說(shuō),首先原信號(hào)乘上窗口(window)分割出一定長(zhǎng)度(winlen)的幀頻,把輸入信號(hào)x(n)第一個(gè)幀頻直接復(fù)制到被轉(zhuǎn)換的輸出信號(hào)y(n)上,取下一個(gè)幀頻時(shí),以輸入信號(hào)解析單位Sa大小的一定間隔移動(dòng)并重疊(overlapping)窗口來(lái)求下一個(gè)幀頻。
定義兩個(gè)連續(xù)幀頻后,其次求兩個(gè)連續(xù)幀頻之間的交叉相關(guān)(cross-correlation),并按時(shí)間標(biāo)尺因子尋分類(lèi),尋找最大交叉相關(guān)點(diǎn)求同步長(zhǎng)度值k后(ST220至ST240),重新排列幀頻,在重疊的幀頻采樣上加上加權(quán)值,最終得到速度轉(zhuǎn)換的輸出信號(hào)。兩個(gè)連續(xù)幀頻之間的交叉相關(guān)值可以根據(jù)數(shù)學(xué)式1得到。
Rmxy(k)=Σj=0Ls-1y(mSs|k|j)x(mSa|j)Σj=0Lm-1y2(mSs+k+j)Σj=0La-1x2(mSa+j)]]>
在數(shù)學(xué)式1中Lm是x(mSa+j)和y(mSs+k+i)的重疊長(zhǎng)度。
并且如圖2b所示,SOLA解碼算法是先移動(dòng)窗口(window)并以一定長(zhǎng)度的幀頻單位分割輸入的樣品(ST250,ST260)。
其次是,把窗口重疊(overlap)求得的幀頻按希望時(shí)間標(biāo)尺轉(zhuǎn)換比值即時(shí)間標(biāo)尺因子(time scale factor)及斟酌圖2a編碼時(shí)求得的同步長(zhǎng)度值k重新排列后相加加權(quán)值,得到與原來(lái)不同長(zhǎng)度的信號(hào)即速度轉(zhuǎn)換的信號(hào)(ST270,ST280)。這與數(shù)學(xué)式2及數(shù)學(xué)式3相同。
y(mSs|k|j)=(1-f(j))*y(mSN|k|j)|f(j)*x(xSa|f)for,0≤j≤Lm-1]]>[數(shù)學(xué)式3]y(mSs|k|j)-x(mSa|j),forLm≤j≤N-1]]>即,求同步長(zhǎng)度值k,最終輸出信號(hào)y(n)就根據(jù)數(shù)學(xué)式2和數(shù)學(xué)式3在重疊區(qū)間給x(mSa+j)和y(mSs+k+j)加上加權(quán)值f(j)重新排列幀頻,最終就會(huì)得到與原輸入信號(hào)不同長(zhǎng)度信號(hào),即速度轉(zhuǎn)換信號(hào)。
圖3是根據(jù)本實(shí)用新型的數(shù)碼音頻數(shù)據(jù)再生裝置的結(jié)構(gòu)圖。如圖3所示,本實(shí)用新型所涉及的數(shù)碼音頻數(shù)據(jù)再生裝置100具有處理用戶(hù)輸入的輸入?yún)^(qū)10、從外部接收音源信號(hào)輸入的音源輸入?yún)^(qū)20、給外設(shè)裝置90提供數(shù)據(jù)輸入輸出接口的傳輸區(qū)30、儲(chǔ)存如MP3文件類(lèi)數(shù)碼音頻數(shù)據(jù)的存儲(chǔ)區(qū)40、控制數(shù)碼音頻數(shù)據(jù)再生裝置工作的MCU 50(MCUMain Control Unit,以下稱(chēng)‘MCU’)、顯示數(shù)碼音頻數(shù)據(jù)再生裝置100狀態(tài)信息的顯示區(qū)60、為MP3文件等數(shù)碼音頻數(shù)據(jù)的再生進(jìn)行處理的音源處理區(qū)70及輸出音源處理區(qū)處理過(guò)音源的音源輸出區(qū)80。音源包括聲音或者音樂(lè)等一切聲響,音源信號(hào)則是輸入音源輸入?yún)^(qū)20的此類(lèi)音源的信號(hào),數(shù)碼音頻數(shù)據(jù)則意味著壓縮音源信號(hào)產(chǎn)生的數(shù)據(jù)。
以下對(duì)各個(gè)結(jié)構(gòu)要素進(jìn)一步詳細(xì)說(shuō)明。
輸入?yún)^(qū)10是為了控制數(shù)碼音頻數(shù)據(jù)再生裝置的工作而由用戶(hù)進(jìn)行輸入的部分,可以由小鍵盤(pán)或開(kāi)關(guān)等組成;音源輸入?yún)^(qū)20由CD、收音機(jī)或磁帶等通過(guò)麥克風(fēng)或音頻線(xiàn)等輸入音源信號(hào)。還有,傳輸區(qū)30通過(guò)與外設(shè)裝置90之間的輸出與輸入,從外設(shè)裝置輸入MP3文件或PCM(Pulse Code Modulation,wave)數(shù)據(jù)等,或者把儲(chǔ)存在存儲(chǔ)區(qū)40的數(shù)碼音頻數(shù)據(jù)輸出到外設(shè)裝置90中,并組成USB或UART等各種端口。
存儲(chǔ)區(qū)40是儲(chǔ)存MP3文件等數(shù)碼音頻數(shù)據(jù)的存儲(chǔ)介質(zhì),儲(chǔ)存通過(guò)音源輸入?yún)^(qū)20輸入的音頻快速存儲(chǔ)器等各種存儲(chǔ)介質(zhì)。
MCU 50是控制數(shù)碼音頻數(shù)據(jù)再生裝置100各個(gè)組成要素工作的部分,相當(dāng)于電腦的中央處理器或控制區(qū)。而且MCU 50具有各個(gè)組成要素尤其是要具有儲(chǔ)存控制音源處理區(qū)70控制信息與狀態(tài)信息等的第一寄存器52。在第一寄存器52除儲(chǔ)存MP3文件等一般再生控制信息與狀態(tài)信息以外還同時(shí)儲(chǔ)存再生速度調(diào)節(jié)信息。第一寄存器52儲(chǔ)存的信息傳輸至音源處理區(qū)70的第二寄存器72,用于控制音源處理區(qū)的MP3/PCM編解器74與速度調(diào)節(jié)區(qū)76的工作。調(diào)節(jié)再生速度的信息體現(xiàn)數(shù)碼音頻數(shù)據(jù)的再生速度(例如,0.5快2倍,2.0慢2倍),而這些取決于用戶(hù)通過(guò)輸入?yún)^(qū)輸入的值。
顯示區(qū)60是為了給用戶(hù)顯示數(shù)碼音頻數(shù)據(jù)再生裝置100的工作狀態(tài)信息及MP3文件名等而設(shè)置的,可使用LCD或者LED等。
還有音源處理區(qū)70是為了處理如MP3文件類(lèi)數(shù)碼音頻數(shù)據(jù)再生的部分,除一般再生以外執(zhí)行再生速度調(diào)節(jié)后輸出至音源輸出區(qū)。此時(shí),數(shù)碼音頻數(shù)據(jù)再生處理由MP3/PCM編解器執(zhí)行,而再生速度調(diào)節(jié)則由速度調(diào)節(jié)區(qū)76執(zhí)行。且再生及速度調(diào)節(jié)控制信息及狀態(tài)信息儲(chǔ)存于第二寄存器72內(nèi),而其信息是從儲(chǔ)存在MCU 50第一寄存器52傳輸?shù)摹?br>
MP3/PCM編解器74具有了編碼器與解碼器,通過(guò)MP3編碼器壓縮從音源輸入?yún)^(qū)輸入的音源信號(hào)后,再通過(guò)MP3解碼器再生MP3文件。另外,輸入至MP3/PCM編解器的數(shù)據(jù)為PCM(wave)數(shù)據(jù)時(shí)直接旁路。還有速度調(diào)節(jié)區(qū)76以電路實(shí)現(xiàn)SOLA算法來(lái)調(diào)節(jié)MP3文件的再生速度,特別是可以在音色沒(méi)有變化的情況下快速或慢速調(diào)節(jié)再生速度。即,速度調(diào)節(jié)區(qū)76成為SOLA算法ASIC(Application-Specific Integrated Circuit)化的芯片。
另外,音源處理區(qū)70的第二寄存器72、MP3/PCM編解器74及速度調(diào)節(jié)區(qū)76可實(shí)現(xiàn)在一個(gè)芯片上。
音源輸出區(qū)80把音源處理區(qū)處理并輸出的音源輸出到外部,有喇叭或耳機(jī)等連接插口。
以下對(duì)圖3所示根據(jù)本實(shí)用新型數(shù)碼音頻數(shù)據(jù)再生裝置的工作進(jìn)行說(shuō)明。本實(shí)用新型所涉及的數(shù)碼音頻數(shù)據(jù)再生裝置100的工作大致可分為儲(chǔ)存MP3文件過(guò)程和再生已儲(chǔ)存MP3/PCM的過(guò)程。
MP3文件的儲(chǔ)存過(guò)程是把從外部輸入的音源或文件儲(chǔ)存到存儲(chǔ)區(qū)40的過(guò)程,首先儲(chǔ)存文件時(shí),從外設(shè)裝置90通過(guò)傳輸區(qū)30輸入的MP3文件等在MCU 50的控制下儲(chǔ)存至存儲(chǔ)區(qū)40。另外儲(chǔ)存音源/文件時(shí),通過(guò)音源輸入?yún)^(qū)20輸入的音源信號(hào)輸入到音源處理區(qū)70的MP3/PCM編解器74中,MP3/PCM編解器的MP3編碼器壓縮音源信號(hào)。音源信號(hào)被MP3編碼器壓縮產(chǎn)生的數(shù)據(jù)傳遞至MCU 50被傳輸及儲(chǔ)存在存儲(chǔ)區(qū)40。而這時(shí),儲(chǔ)存在存儲(chǔ)區(qū)40的數(shù)據(jù)也可以按用戶(hù)的選擇通過(guò)傳輸區(qū)30傳輸?shù)酵庠O(shè)裝置90。
MP3/PCM再生過(guò)程是再生通過(guò)傳輸區(qū)30輸入或通過(guò)MP3編碼器壓縮并儲(chǔ)存在存儲(chǔ)區(qū)40的數(shù)碼音頻數(shù)據(jù)的過(guò)程,包括再生速度實(shí)時(shí)轉(zhuǎn)換過(guò)程。首先,儲(chǔ)存在存儲(chǔ)區(qū)40的數(shù)碼音頻數(shù)據(jù)通過(guò)MCU50傳輸?shù)組P3/PCM編解器74中,而MP3文件被MP3/PCM編解器的MP3解碼器恢復(fù),PCM數(shù)據(jù)則旁路。通過(guò)MP3/PCM編解器74的數(shù)碼音頻數(shù)據(jù)輸入至速度調(diào)節(jié)區(qū),按所需速度音色無(wú)變化地合成為音源后通過(guò)音源輸出區(qū)80輸出。
用戶(hù)通過(guò)外部設(shè)置的輸入?yún)^(qū)10控制數(shù)碼音頻數(shù)據(jù)再生裝置100的工作,而數(shù)碼音頻數(shù)據(jù)再生裝置的狀態(tài)則通過(guò)顯示區(qū)60來(lái)掌握。且在所述MP3文件存儲(chǔ)過(guò)程中由MCU 50控制MP3/PCM編解器74的MP3解碼器和存儲(chǔ)區(qū)40之間的數(shù)據(jù),但這個(gè)功能可用其它方式代替。
另外,所述利用MP3方式上,因音源采樣頻率低,每秒儲(chǔ)存數(shù)據(jù)的量小而沒(méi)用MP3壓縮時(shí),其再生不用MP3/PCM編解器74解碼,可直接在PCM文件上利用速度調(diào)節(jié)方式再生音源。
圖4是顯示根據(jù)本實(shí)用新型的音源處理部?jī)?nèi)部結(jié)構(gòu)的塊結(jié)構(gòu)圖。如圖4所示,根據(jù)本實(shí)用新型的音源處理區(qū)70包括時(shí)鐘發(fā)生器120(Clock Generator)、儲(chǔ)存數(shù)碼音頻數(shù)據(jù)再生及速度調(diào)節(jié)控制信息與狀態(tài)信息的第二寄存器72(Control/Status Register),把模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)或把數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)的外部AD/DA轉(zhuǎn)換器122(External AD/DA)和AD/DA接口124、對(duì)音源信號(hào)進(jìn)行編碼的MP3編碼器126、再生被編碼的音源信號(hào)進(jìn)行解碼的MP3解碼器128、儲(chǔ)存需要被編碼的音源信號(hào)與MP3文件的內(nèi)部SRAM 130(Internal SRAM)、以電路實(shí)現(xiàn)SOLA算法,并根據(jù)儲(chǔ)存在第二寄存器72內(nèi)的信息調(diào)節(jié)數(shù)碼音頻數(shù)據(jù)再生速度的速度調(diào)節(jié)區(qū)76(Time-Scale Modification)及提供音源處理區(qū)70各個(gè)裝置電源的供電裝置132(VDD/VSS)。
其中,MP3編碼器126和MP3解碼器128如上所述包含于MP3/PCM編解器74中,經(jīng)音源輸入?yún)^(qū)20輸入的音源信號(hào)被MP3編碼器126壓縮,而MP3文件則通過(guò)MP3解碼器再生。
速度調(diào)節(jié)區(qū)76調(diào)節(jié)被MP3/PCM編解器74的MP3解碼器128解碼再生的MP3文件再生速度,以硬件方式實(shí)現(xiàn)SOLA算法,并隨著儲(chǔ)存在第二寄存器72內(nèi)的再生速度調(diào)節(jié)其再生速度。速度調(diào)節(jié)區(qū)76由幀頻分割區(qū)140、幀頻計(jì)算區(qū)142、同步長(zhǎng)度計(jì)算區(qū)144及幀頻重新排列區(qū)146組成,現(xiàn)對(duì)各部位說(shuō)明如下。
幀頻分割區(qū)140是把從MP3解碼器128輸出的音源信號(hào)分割成具有規(guī)定窗口長(zhǎng)度的幀頻。在這里,窗口的長(zhǎng)度具有輸入聲音信號(hào)2間距周期的長(zhǎng)度,考慮到相鄰幀頻間的同步,最好是取3至4間距周期的長(zhǎng)度。
幀頻計(jì)算區(qū)142是被幀頻分割區(qū)140分割的幀頻隨著儲(chǔ)存在第二寄存器72內(nèi)的速度變化率,以規(guī)定的值選擇固定的輸出信號(hào)合成移位值,并變更輸入信號(hào)的解析移位值后求得下一個(gè)幀頻。
同步長(zhǎng)度計(jì)算區(qū)144是在所述幀頻間的重疊區(qū)間根據(jù)交叉相關(guān)求得同步長(zhǎng)度,這時(shí)由所述數(shù)學(xué)式1求得的最大交叉相關(guān)值來(lái)決定同步長(zhǎng)度。且所述同步長(zhǎng)度為可校準(zhǔn)間距信息的值,從而比1間距周期大但比窗口長(zhǎng)度小。
最后,幀頻重新排列區(qū)146移動(dòng)所述同步長(zhǎng)度的距離,重新排列幀頻來(lái)輸出速度轉(zhuǎn)換的音源信號(hào)。
另外,在圖4雖未圖示,但速度調(diào)節(jié)區(qū)76還具有暫時(shí)儲(chǔ)存從MP3解碼器128輸出的音源信號(hào)與幀頻分割區(qū)140、幀頻計(jì)算區(qū)142、同步長(zhǎng)度計(jì)算區(qū)144及幀頻重新排列區(qū)146處理的各個(gè)音源信號(hào)的緩沖器。
音源處理區(qū)70通過(guò)接口110與示波器54及MCU 50交換信號(hào),特別是時(shí)鐘發(fā)生器120通過(guò)PLL 112(Phase Locked Loop)與示波器54連接,第二寄存器72則通過(guò)接口與第一寄存器52連接,從而接收再生及速度調(diào)節(jié)的控制信息與狀態(tài)信息的傳遞。另外還有內(nèi)部SRAM 130也通過(guò)接口與MCU 50交換數(shù)據(jù)。
對(duì)于圖4所示的各個(gè)組成要素,屬于本實(shí)用新型技術(shù)領(lǐng)域的普通技術(shù)人員,對(duì)其結(jié)構(gòu)與功能都能較容易理解,所以在此不再贅述。
以上只說(shuō)明數(shù)碼音頻數(shù)據(jù)格式中的MP3及PCM方式,此外還可以使用WMA,ADPCM(Adaptive Differential Pulse-CodeModulation)或OGG等多種數(shù)碼音頻數(shù)據(jù)格式方式。另外以上說(shuō)明速度調(diào)節(jié)區(qū)的聲音速度轉(zhuǎn)換算法時(shí),雖以SOLA算法為主,但除此以外還可以用電路實(shí)現(xiàn)SOLA變形算法等時(shí)間區(qū)域方法和頻率區(qū)域方法算法。
如上述說(shuō)明中,根據(jù)本實(shí)用新型的數(shù)碼音頻數(shù)據(jù)再生裝置具有穩(wěn)定快速執(zhí)行如MP3文件類(lèi)數(shù)碼音頻數(shù)據(jù)的再生與速度調(diào)節(jié)的顯著效果。
再次強(qiáng)調(diào),本實(shí)用新型所涉及的數(shù)碼音頻數(shù)據(jù)再生裝置第一、把MP3/PCM編解器與速度調(diào)節(jié)區(qū)結(jié)合組成一個(gè)裝置,從而解決數(shù)據(jù)傳輸及儲(chǔ)存時(shí)發(fā)生的問(wèn)題;
第二、可解決音源再生時(shí)因速度變化引起的音色失真的傳統(tǒng)問(wèn)題;第三、通過(guò)電路以硬件方式實(shí)現(xiàn)SOLA算法,調(diào)節(jié)數(shù)碼音頻數(shù)據(jù)的速度,從而提高處理速度與穩(wěn)定性,并且可降低成本;第四、可廣泛應(yīng)用于語(yǔ)言學(xué)習(xí)或要求音樂(lè)速度有變化的領(lǐng)域內(nèi)。
最后,數(shù)碼音頻數(shù)據(jù)格式方式中,除MP3格式以外還可以使用WMA,PCM,ADPCM或OGG等多種數(shù)碼音頻數(shù)據(jù)格式方式,而在聲音速度轉(zhuǎn)換算法中,有SOLA算法等時(shí)間區(qū)域方法算法外還可以使用頻率區(qū)域方法算法等,因此其應(yīng)用范圍廣。
本實(shí)用新型優(yōu)選實(shí)施例使用了特定術(shù)語(yǔ)來(lái)敘述,但這樣的敘述只是為了用做說(shuō)明而已,在不脫離下面本實(shí)用新型權(quán)利要求的技術(shù)精神與范圍的情況下,應(yīng)理解為還可以具有各種變更及變化。
符號(hào)說(shuō)明10輸入?yún)^(qū)20音源輸入?yún)^(qū)30傳輸區(qū)40存儲(chǔ)區(qū)50MCU 52第一寄存器60顯示區(qū)70音源處理區(qū)72第二寄存器74MP3/PCM編解器76速度調(diào)節(jié)區(qū)80音源輸出區(qū)90外設(shè)裝置 100數(shù)碼音頻數(shù)據(jù)再生裝置
權(quán)利要求1.一種數(shù)碼音頻數(shù)據(jù)再生裝置,其具有接收數(shù)碼音頻數(shù)據(jù)并儲(chǔ)存在規(guī)定存儲(chǔ)區(qū)內(nèi),再根據(jù)用戶(hù)的選擇,利用所述已儲(chǔ)存數(shù)碼音頻數(shù)據(jù)再生和時(shí)間標(biāo)尺轉(zhuǎn)換算法執(zhí)行再生速度轉(zhuǎn)換的音源處理區(qū),其特征在于,具有處理用戶(hù)輸入的輸入?yún)^(qū);從外部輸入音源信號(hào)的音源輸入?yún)^(qū);提供與外設(shè)裝置輸入輸出數(shù)據(jù)接口的傳輸區(qū);儲(chǔ)存所述數(shù)碼音頻數(shù)據(jù)的所述存儲(chǔ)區(qū);具有控制所述數(shù)碼音頻數(shù)據(jù)再生裝置工作,并儲(chǔ)存再生所述數(shù)碼音頻數(shù)據(jù)的控制信息和包括所述要轉(zhuǎn)換再生速度的速度變化率控制信息的第一寄存器的主控制單位;顯示所述數(shù)碼音頻數(shù)據(jù)再生裝置狀態(tài)信息的顯示區(qū);傳輸并儲(chǔ)存所述第一寄存器內(nèi)儲(chǔ)存的所述控制信息的第二寄存器、具有儲(chǔ)存從外部輸入的所述音源信號(hào)并進(jìn)行壓縮的編碼器和輸入所述存儲(chǔ)區(qū)儲(chǔ)存的所述數(shù)碼音頻數(shù)據(jù)并把它恢復(fù)為再生格式解碼器的編解器及具有通過(guò)所述編解器的所述解碼器恢復(fù)的所述數(shù)碼音頻數(shù)據(jù)和接收所述第二寄存器的所述速度變化率,使所述數(shù)碼音頻數(shù)據(jù)根據(jù)速度變化率轉(zhuǎn)換時(shí)間標(biāo)尺速度調(diào)節(jié)區(qū)的所述音源處理區(qū);及輸出在所述音源處理區(qū)被處理過(guò)音源的音源輸出區(qū)。
2.根據(jù)權(quán)利要求1所述數(shù)碼音頻數(shù)據(jù)再生裝置,所述速度調(diào)節(jié)區(qū),其特征在于,具有把所述解碼器輸出的音源信號(hào)按規(guī)定窗口長(zhǎng)度幀頻分割的幀頻分割區(qū);被所述幀頻分割區(qū)分割的所述幀頻按所述速度變化率以規(guī)定值選擇固定的輸出信號(hào)合成移位值,并變更輸入信號(hào)的解析移位值來(lái)求下一個(gè)幀頻的幀頻計(jì)算區(qū);由所述幀頻計(jì)算區(qū)求得的所述幀頻間的重疊區(qū)間內(nèi),根據(jù)交叉相關(guān)求同步長(zhǎng)度的同步長(zhǎng)度計(jì)算區(qū);及移動(dòng)所述同步長(zhǎng)度的距離,重新排列幀頻并輸出再生速度轉(zhuǎn)換音源信號(hào)的幀頻重新排列區(qū)。
3.根據(jù)權(quán)利要求1所述數(shù)碼音頻數(shù)據(jù)再生裝置,其特征在于所述數(shù)碼音頻數(shù)據(jù)為MP3數(shù)據(jù)格式。
4.根據(jù)權(quán)利要求1所述數(shù)碼音頻數(shù)據(jù)再生裝置,其特征在于所述時(shí)間標(biāo)尺轉(zhuǎn)換算法為SOLA算法。
5.根據(jù)權(quán)利要求1所述數(shù)碼音頻數(shù)據(jù)再生裝置,其特征在于給所述編解器輸入PCM數(shù)據(jù)時(shí),所述編碼器及所述解碼器使所述輸入PCM數(shù)據(jù)旁路。
專(zhuān)利摘要本實(shí)用新型涉及一種數(shù)碼音頻數(shù)據(jù)再生裝置,特別是涉及對(duì)MP3文件用MP3編碼器儲(chǔ)存音源,并利用MP3解碼器使其再生,此時(shí)通過(guò)用硬件實(shí)現(xiàn)時(shí)間標(biāo)尺轉(zhuǎn)換(Time Scale Modification)技術(shù)SOLA(Synchronized Overlap-and-Add)算法的速度調(diào)節(jié)裝置,使因聲音信號(hào)丟失及失真受影響的音質(zhì)無(wú)變化,并可調(diào)節(jié)其再生速度的數(shù)碼音頻數(shù)據(jù)再生裝置。根據(jù)本實(shí)用新型的數(shù)碼音頻數(shù)據(jù)再生裝置在執(zhí)行MP3文件類(lèi)數(shù)碼音頻數(shù)據(jù)的再生與速度調(diào)節(jié)時(shí),具有穩(wěn)定快速的顯著效果。
文檔編號(hào)G10L19/00GK2682533SQ20042000297
公開(kāi)日2005年3月2日 申請(qǐng)日期2004年2月20日 優(yōu)先權(quán)日2004年2月20日
發(fā)明者劉起寧, 李光虎, 金幸煥 申請(qǐng)人:莫比獨(dú)特株式會(huì)社