專利名稱:快速或慢速重放模式下不造成音調(diào)變化的音頻信號重現(xiàn)方法及其重現(xiàn)裝置的制作方法
技術領域:
本發(fā)明涉及一種重現(xiàn)音頻信號或者音頻/視頻信號的方法,以及其重現(xiàn)裝置。更具體地,涉及一種音頻信號處理方法,在非正常重放速度的高速度或低速度下重現(xiàn)音頻信號或者音頻/視頻信號時,它能夠重現(xiàn)出不發(fā)生可感知音調(diào)變化的音頻信號。
視頻和音頻節(jié)目信號按照一種確立的算法或方法變換成數(shù)字格式,并進行壓縮、編碼和復用。壓縮的數(shù)字系統(tǒng)信號中,也即比特流中,包括有視頻部分、音頻部分和其它信息部分。這樣的數(shù)據(jù)通過一種傳輸線路傳輸至一個重現(xiàn)裝置上,或者存儲入一個記錄媒體中。安裝有多媒體播放器能用以對復用的視頻數(shù)據(jù)和音頻數(shù)據(jù)中得到的多媒體數(shù)據(jù)進行重現(xiàn)的數(shù)字重現(xiàn)裝置,諸如數(shù)字通用光盤(DVD)系統(tǒng)、數(shù)字盒式錄像機(VCR)或者計算機系統(tǒng)中,配置有解碼裝置,以重現(xiàn)上述的比特流信息。這種解碼裝置按照壓縮算法實現(xiàn)去復用、去壓縮并解碼比特流,由此提供出可重現(xiàn)的信號。解碼的視頻和音頻信號輸出至諸如是熒光屏或揚聲器之類的重現(xiàn)裝置上,使信息呈現(xiàn)給用戶供視聽。
對視頻和音頻信號壓縮和編碼時,由合適的編碼器加以實施,它執(zhí)行一種選定的數(shù)據(jù)壓縮算法,適應于在數(shù)字視頻數(shù)據(jù)的發(fā)射機和接收機之間一致認可的標準或規(guī)范。高效的壓縮標準已經(jīng)由MPEG(活動圖像專家組)開發(fā)成功,包括MPEG-1和MPEG-2,它們又被繼續(xù)改善而出現(xiàn)了MPEG-4。各種MPEG標準除了能在VCR、DVD或者類似的多媒體記錄/重現(xiàn)裝置中支持正常重放模式外,還能支持正向或反向的高速或低速重現(xiàn)。
各種MPEG標準中,根據(jù)一個稱作標準目標解碼器(STD)的理想解碼器,約束了一種建議的同步方案。編碼形式下的視頻或音頻數(shù)據(jù)單元或數(shù)據(jù)幀稱為存取單元(AU),而未編碼或已解碼形式下的則稱為呈現(xiàn)單元(PU)。理想解碼器中,視頻和音頻數(shù)據(jù)呈現(xiàn)單元取自基本流(ES)緩存器,在合適的呈現(xiàn)時間上即時地呈現(xiàn)給用戶供視聽。對一個呈現(xiàn)單元指明正確呈現(xiàn)時間的一種呈現(xiàn)時間標記(PTS),作為系統(tǒng)句法的一部分在MPEG包頭中傳輸。
呈現(xiàn)時間標記和存取單元不必需一起傳輸,因為它們由分層結構中的不同層次運載。所以,解碼器必需與包層中找到的呈現(xiàn)時間標記相聯(lián)系,第一個存取單元就在該呈現(xiàn)時間標記之后。實際情況更為復雜,在實際解碼器中,系統(tǒng)對呈現(xiàn)單元的呈現(xiàn)時間有小量的控制。例如,視頻解碼器中,視頻幀(圖像)必須以幀頻的準確倍數(shù)呈現(xiàn),使視頻圖像顯得勻滑,而音頻幀必須以聲音幀頻的準確倍數(shù)呈現(xiàn),使聲音中沒有喀嚦聲。
理想的MPEG同步方案中,在解碼器里提供一個維持系統(tǒng)時鐘時間的系統(tǒng)時間時鐘(STC)。系統(tǒng)時鐘時間的初始值在系統(tǒng)流內(nèi)傳輸時,在MPEG-1比特流中由編碼器作為系統(tǒng)時鐘基準(SCR)進行傳輸,在MPEG-2比特流中由編碼器作為節(jié)目時鐘基準(PCR)進行傳輸。解碼器將其本地系統(tǒng)時間時鐘設定到該初始值上,然后,在90KHz的時鐘頻率上使初始值不斷增量。
隨后,編碼器對音頻或視頻存取單元傳輸一個呈現(xiàn)時間標記,過一些時間之后跟隨有AU本身。解碼器將PTS與本地系統(tǒng)時鐘時間進行比較。如果它們相等,則從基本流緩存器中取出AU單元,立即解碼,產(chǎn)生出相應的PU以使其呈現(xiàn)。
然而,在安裝有多媒體播放器的常規(guī)多媒體重現(xiàn)裝置諸如是DVD系統(tǒng)、數(shù)字VCR或計算機系統(tǒng)中,當用戶選擇快速或慢速重放模式時,視頻數(shù)據(jù)按照指定的重放模式進行重現(xiàn),但音頻數(shù)據(jù)由于難以與視頻數(shù)據(jù)保持同步而是靜聲抑制的。有所改善的重現(xiàn)裝置,它們在快速或慢速重放模式中可以同時重現(xiàn)音頻數(shù)據(jù)。然而,在此場合下,音頻數(shù)據(jù)樣本的呈現(xiàn)時間間隔在輸出端只是根據(jù)指定的重放速度簡單地增大或減小。更具體地,在快速重放模式下,有關音頻數(shù)據(jù)的呈現(xiàn)時間間隔比之正常重放時的將變得縮窄,由于音頻數(shù)據(jù)率被信頻程而提升,使重現(xiàn)聲音的音調(diào)升高;反之,在慢速重放模式下,有關音頻數(shù)據(jù)的呈現(xiàn)時間間隔比之正常重放時的將變得加寬,由于音頻數(shù)據(jù)受到信頻程作用而丟失,使重現(xiàn)聲音的音調(diào)降低。這樣,導致所謂的音調(diào)變化現(xiàn)象。
上述的音調(diào)變化現(xiàn)象在諸如是模擬信號處理裝置的VCR或盒式磁帶記錄器之類的視頻記錄/重現(xiàn)系統(tǒng)中,有著同樣的表現(xiàn)。這類系統(tǒng)中,如果用戶將正常重放速度變更為高速度或低速度,則由重現(xiàn)裝置從記錄媒體中讀出信號的速度將與變更的重放速度相關聯(lián),變高或變低。因此,當讀出的音頻信號不作改變地輸出時,重現(xiàn)聲音所給出的音調(diào)將變更,比之于正常速度下的重現(xiàn)聲音會給出變高或變低的音調(diào)。
圖1示出與一個MPEG重現(xiàn)裝置之解碼相關聯(lián)的一種功能框圖,用于重現(xiàn)MPEG文件。由一個文件源供給的MPEG文件通過數(shù)據(jù)輸入器10后,通過數(shù)據(jù)分離器12分離成視頻數(shù)據(jù)和音頻數(shù)據(jù)。分離的視頻數(shù)據(jù)和音頻數(shù)據(jù)分別由視頻解碼器14和音頻解碼器18接收,依靠它們的解碼而恢復出原來的數(shù)據(jù),然后,它們分別提供給視頻輸出器16和音頻輸出器20,以重視圖像和聲音。
附帶地說,如果用戶發(fā)出高速或低速重現(xiàn)的指令,則解碼器18按照指定的重放速度之快速狀態(tài)或慢速狀態(tài),改變音頻包之包頭中包含的PTS值。于是,有關音頻樣本的呈現(xiàn)時間間隔比之正常重放模式的將會壓縮或擴展。當常規(guī)的MPEG文件處于快速或慢速重放模式時,重現(xiàn)出有關音頻樣本的時間間隔與正常重放的相比將受到壓縮或擴展,使重現(xiàn)聲音的音調(diào)聽起來有變化,變更成為高音調(diào)或低音調(diào)。
音調(diào)變化之發(fā)生是由于常規(guī)重現(xiàn)系統(tǒng)在快速或慢速重現(xiàn)模式中時,只是在時間標度上簡單地擴展或壓縮有關音頻信號的呈現(xiàn)時間間隔。更麻煩的是,為了防止音調(diào)變化,對快慢速度要獨立地實施某種其它的信號處理。換句話說,在快速或慢速重現(xiàn)模式中,還需要一種附加的方案來防止音調(diào)變化。
考慮到先有技術中上面列舉的問題,本發(fā)明的一個目的是提供一種重現(xiàn)方法以及相應的重現(xiàn)裝置,它們對音頻數(shù)據(jù)應用一種濾波處理,能夠在將重放速度變更為高速或低速模式的場合下使重現(xiàn)的音頻信號或者活動圖像中包容的音頻信號,在音調(diào)上與正常重放模式中的音調(diào)實質(zhì)上相同。
為了實現(xiàn)本發(fā)明的上面的目的,按照本發(fā)明的一個方面,提供出了一種方法,它響應于用戶指定的重放速度的快速狀態(tài)或慢速狀態(tài),通過對音頻數(shù)據(jù)進行濾波后重現(xiàn)音頻數(shù)據(jù)。在使重現(xiàn)的音頻數(shù)據(jù)進行濾波的方法中,它對于按照一種預定的時間標度調(diào)制算法中的音頻數(shù)據(jù),實施一種時間標度調(diào)制,即響應于所指定之重放速度的快速狀態(tài)或慢速狀態(tài),增加或是減少音頻數(shù)據(jù)中的數(shù)據(jù)數(shù)量。隨后,針對已按照指定之重放速度的快速狀態(tài)或慢速狀態(tài)而通過時間標度調(diào)制所得到的音頻數(shù)據(jù),實施一種下取樣或上取樣。當實現(xiàn)這種取樣后得到的數(shù)據(jù)與解碼的音頻數(shù)據(jù)達到幾乎相同的程度時,便恢復出了音頻數(shù)據(jù)的數(shù)量。
借助于這種方法,在濾波之后實施音頻數(shù)據(jù)重現(xiàn),可使得盡管指定的重放速度慢于或快于正常重放速度,仍能維持重現(xiàn)聲音的音調(diào)與正常重放速度的音調(diào)實質(zhì)上相同。按照本重現(xiàn)方法,每當指令重放速度改變時,便根據(jù)指定之重放速度的加快或減慢而對音頻數(shù)據(jù)的呈現(xiàn)時間間隔重新進行計算。又,借助于該新產(chǎn)生的呈現(xiàn)時間間隔重現(xiàn)出經(jīng)實施取樣處理后的音頻數(shù)據(jù)。
更具體地,時間標度調(diào)制的步驟中包括有將存儲在緩存器裝置中的原來的音頻數(shù)據(jù)在每個預定的時間間隔上以一個集合為單位寫入至一個輸入隊列中;當指定的重放速度快于正常重放速度時,根據(jù)輸入隊列中存儲的音頻數(shù)據(jù)以幀為單位實施時間標度調(diào)制算法,以按照指定的重放速度減少音頻數(shù)據(jù)的數(shù)量;以及當指定的重放速度慢于正常重放速度時,便按照指定的重放速度增加音頻數(shù)據(jù)的數(shù)量。由此,其音頻數(shù)據(jù)給出至一個中間隊列中。
更詳細地說,取樣步驟中包括有對于中間隊列內(nèi)存儲的音頻數(shù)據(jù),當指定的重放速度快于正常重放速度時,實施上取樣處理,當指定的重放速度慢于正常重放速度時,實施下取樣處理;于是,要傳輸給一個輸出隊列的已取樣音頻數(shù)據(jù)的數(shù)量將變得與原來的音頻數(shù)據(jù)的數(shù)量實質(zhì)上相同;隨后,將存儲在輸出隊列中的已取樣音頻數(shù)據(jù)在每個預定的時間間隔上以集合為單位寫入至緩存器裝置中。
這里,可取地,該預定的時間間隔是新計算出的取樣音頻數(shù)據(jù)的呈現(xiàn)時間間隔,它是根據(jù)指定的重放速度值而變化的。
更可取地,通過控制一個有關的隊列指針,輸入隊列,中間隊列和輸出隊列它們的工作如同一個環(huán)形隊列。
輸出隊列的取樣音頻數(shù)據(jù)覆蓋寫入緩存器單元中,以取代緩存器單元中已存在的原來的音頻數(shù)據(jù),由此,使得實際重現(xiàn)的音頻數(shù)據(jù)是已經(jīng)按照本發(fā)明受到了濾波處理的音頻數(shù)據(jù)。
如果用戶指令其重現(xiàn)速度減慢到正常重放速度的α倍(α>1),則響應于此指令,在對正常重放速度的呈現(xiàn)時間間隔進行比較之后,將有關音頻數(shù)據(jù)的呈現(xiàn)時間間隔設定為增大至正常的α倍。這樣,與正常重放速度下的八度音相比較,重現(xiàn)聲音的八度音將發(fā)生降低到大約α倍的效應。在此情況下,通過應用時間標度調(diào)制算法使音頻數(shù)據(jù)受到時間標度調(diào)制。這樣做之后有一種效應,由于音頻數(shù)據(jù)的數(shù)量增加至α倍,而增大了α倍的呈現(xiàn)時間間隔不改變,所以總呈現(xiàn)時間增大α倍。接著,在受到1/α倍的時間標度調(diào)制處理以實現(xiàn)減少音頻數(shù)據(jù)數(shù)量的下取樣之后,在時間標度上達到了壓縮音頻數(shù)據(jù)的效果。于是,對于其呈現(xiàn)時間間隔增大α倍下已經(jīng)受到下取樣處理的音頻數(shù)據(jù)之重現(xiàn),重現(xiàn)聲音的八度音將從原來降低到α倍的八度音上提高α倍,從而恢復出正常重放速度的音調(diào)。
與之相反,如果用戶指令其重現(xiàn)加快到正常重放速度的α倍(α>1),則響應于此指令,在對正常重放速度的呈現(xiàn)時間間隔進行比較之后,將有關音頻數(shù)據(jù)的呈現(xiàn)時間間隔簡單地設定為減小至正常的α倍。這樣,與正常重放速度下的八度音相比較,重現(xiàn)聲音的八度音將出現(xiàn)升高到大約α倍的效應。在此情況下,通過應用時間標度調(diào)制算法使音頻數(shù)據(jù)受到時間標度調(diào)制。這樣做之后有一種效應,由于音頻數(shù)據(jù)的數(shù)量增加至α倍,而增大了α倍的呈現(xiàn)時間間隔不改變,所以總呈現(xiàn)時間減小α倍。接著,在受到1/α倍的時間標度調(diào)制處理以實現(xiàn)增加音頻數(shù)據(jù)數(shù)量的上取樣之后,在時間標度上達到了擴展音頻數(shù)據(jù)的效果。于是,對于其呈現(xiàn)時間間隔減小α倍下已經(jīng)受到上取樣處理的音頻數(shù)據(jù)之重現(xiàn),重現(xiàn)聲音的八度音將從原來降低α倍的八度音上提高α倍,從而恢復出正常重放速度的音調(diào)。
考慮一下按照本發(fā)明之重現(xiàn)方法的一個優(yōu)選實施例,它可以用作一種重現(xiàn)出解碼的音頻數(shù)據(jù)的方法以響應于用戶指定的重放速度,而后將MPEG系統(tǒng)中已經(jīng)解碼的、存儲在存儲器單元中的音頻數(shù)據(jù)提供給音頻輸出單元。按照本發(fā)明的此實施例,計算出指定的重放速度與正常重放速度之間的一個重放速度控制比α。又,通過對正常重放速度下音頻數(shù)據(jù)的呈現(xiàn)時間間隔乘上該重放速度控制比,再計算其音頻數(shù)據(jù)之新的呈現(xiàn)時間間隔。將存儲在存儲器單元中的音頻數(shù)據(jù)以集合為單位寫入至輸入隊列中。相對于寫入在輸入隊列內(nèi)的音頻數(shù)據(jù),以幀為單位實施一種預定的時間標度調(diào)制算法,以做到與重放速度控制比α成比例地增加/減少音頻數(shù)據(jù)的數(shù)量,并將實施時間標度調(diào)制算法中得到的已調(diào)制音頻數(shù)據(jù)寫入至中間隊列中。此后,相對于寫入在中間隊列中的音頻數(shù)據(jù),在重放速度控制比α小于1的快速重放模式下,實施一種上取樣,或是在重放速度控制比α大于1的慢速重放模式下,實施一種下取樣。取樣頻率決定于重放速度控制比α的倒數(shù),以使得實施取樣處理后音頻數(shù)據(jù)的數(shù)量實質(zhì)上與解碼的音頻數(shù)據(jù)相同。將取樣處理后的音頻數(shù)據(jù)饋送至一個輸出隊列中。然后,存儲在輸出隊列中的音頻數(shù)據(jù)以集合為單元裝載至存儲器單元中,并使該存儲器單元內(nèi)的音頻數(shù)據(jù)由計算出的呈現(xiàn)時間間隔作出重現(xiàn)。采用這種方法,即使指定的重放速度快于或慢于正常重放速度,重現(xiàn)聲音的音調(diào)仍實質(zhì)上與正常重放速度的相同。
這里,在受到下取樣或上取樣處理后傳輸給輸出隊列的有關音頻數(shù)據(jù)之數(shù)量的確定,是借助于相對于存儲在中間隊列內(nèi)音頻數(shù)據(jù)的數(shù)量,根據(jù)重放速度控制比α的值實行一種內(nèi)插方法來做到的,以使得實質(zhì)上相同地保持住在取樣之前和之后的音頻數(shù)據(jù)的特性。另外,在音頻數(shù)據(jù)的數(shù)量按照指定之重放速度的加快或減慢而增加/減少時,任何算法可以實施作為預定的時間標度調(diào)制算法,同時幾乎能保持住執(zhí)行濾波之前音頻數(shù)據(jù)的全部特性。
與此同時,這里提供出一種裝置,用于與上面的重現(xiàn)音頻數(shù)據(jù)方法相符合的音頻信號重現(xiàn)。按照本發(fā)明的一個實施例,該音頻信號重現(xiàn)裝置能響應于用戶指定的一種重放速度而重現(xiàn)出音頻數(shù)據(jù)。這里,該重現(xiàn)裝置中包括一個重放速度控制單元,用于計算指定的重放速度與正常重放速度之間的一個重放速度控制比,并進一步通過對正常重放速度下的音頻數(shù)據(jù)呈現(xiàn)時間間隔乘上重放速度控制比α,計算出一個新的呈現(xiàn)時間間隔。重現(xiàn)裝置中包括一個存儲器單元,用于以一種在數(shù)據(jù)包單元內(nèi)可區(qū)辨的格式存儲入數(shù)字音頻數(shù)據(jù)。又,包括有一個濾波單元作為其一部分,它相對于存儲在存儲器單元中的音頻數(shù)據(jù)根據(jù)一種預定的時間標度調(diào)制算法實施時間標度調(diào)制,響應于指定的重放速度而增加/減少音頻數(shù)據(jù)的數(shù)量,相對于根據(jù)指定的重放速度通過時間標度調(diào)制而得到的已調(diào)制音頻數(shù)據(jù),實施下取樣或上取樣,并將取樣后音頻數(shù)據(jù)的數(shù)量恢復至實質(zhì)上與解碼的音頻數(shù)據(jù)之數(shù)量相同的程度上。此外,重現(xiàn)裝置中有一個音頻輸出單元,它接收新的呈現(xiàn)時間間隔下存儲單元來的、由音頻數(shù)據(jù)濾波單元已作出處理的音頻數(shù)據(jù),并重現(xiàn)出聲音。采用這種構造,無論用戶指定的重放速度快于或慢于正常重放速度,由新的呈現(xiàn)時間間隔進行重現(xiàn)時重現(xiàn)聲音的音調(diào)實質(zhì)上保持與正常重放速度的音調(diào)相同。
按照本發(fā)明的另一個實施例,一個重現(xiàn)音頻信號的裝置中有一個供讀出用的音頻信號供給單元,以響應于用戶指定的快速模式或慢速模式重放速度而從記錄媒體中提供出音頻信號,并有一個數(shù)字信號處理單元,它包含一個背景部分和一個前景部分。背景部分同時實施音頻數(shù)據(jù)的寫入和讀出,即將音頻信號供給單元的音頻數(shù)據(jù)以集合為單位寫入至輸入隊列中,又在同一時期上以集合為單位對輸出隊列內(nèi)存儲的音頻數(shù)據(jù)進行讀出,并將輸出隊列中讀出的音頻數(shù)據(jù)變換成模擬信號。另外,該數(shù)字信號處理單元的前景部分針對存儲在輸入隊列內(nèi)的音頻數(shù)據(jù),應用一種預定的時間標度調(diào)制算法以幀為單位實施一種預定的時間標度調(diào)制,以便按照指定的重放速度值增加或減少數(shù)據(jù)數(shù)量。前景部分還根據(jù)指定的重放速度而經(jīng)由時間標度調(diào)制處理得到的音頻數(shù)據(jù),實施一種下取樣或上取樣,以便在執(zhí)行取樣處理之后將音頻數(shù)據(jù)的數(shù)量恢復至實質(zhì)上與解碼的音頻數(shù)據(jù)相同的程度,并將取樣處理中得到的音頻數(shù)據(jù)裝載至輸出隊列中??扇〉?,該裝置中還有一個模擬/數(shù)字變換單元,當供給自音頻信號處理單元的音頻信號為模擬信號時,用于將模擬音頻信號變換成在音頻信號供給單元與輸入隊列之間的數(shù)字數(shù)據(jù)。
又需指出,在音頻數(shù)據(jù)的數(shù)量按照指定的重放速度值增加/減少時,任何算法可以實施作為預定的時間標度調(diào)制算法,同時幾乎保持住執(zhí)行濾波之前音頻數(shù)據(jù)的全部特性。其時,更可取地,下取樣或上取樣處理的實施是通過根據(jù)指定的重放速度值而確定一個增加/減少比的,并在按照增加/減少比而對音頻數(shù)據(jù)的數(shù)量進行增加/減少時,實質(zhì)上保持了應用內(nèi)插方法進行取樣之前和之后同樣的音頻數(shù)據(jù)特性。
按照本發(fā)明的另一個方面,提供出一種方法,根據(jù)用戶指定的重放速度值將受到濾波處理后的音頻數(shù)據(jù)進行重現(xiàn)。本方法中包括有步驟響應于指定的重放速度值,增加或減少正常重現(xiàn)速度中音頻信號的呈現(xiàn)時間,并將音頻數(shù)據(jù)的呈現(xiàn)時間間隔維持為具有正常重放速度時的值;針對音頻數(shù)據(jù)應用一種預定的時間標度調(diào)制算法實施一種時間標度調(diào)制處理,以便根據(jù)指定的重放速度值增加或減少音頻數(shù)據(jù)的數(shù)量;以及在改變的呈現(xiàn)時間期內(nèi)對時間標度調(diào)制處理中得到的音頻數(shù)據(jù)以該呈現(xiàn)時間間隔進行重現(xiàn)。因此,即使指定的重放速度快于或慢于正常重放速度,重現(xiàn)聲音的音調(diào)實質(zhì)上與正常重放速度的音調(diào)相同。
按照本方法,有關音頻數(shù)據(jù)的呈現(xiàn)時間和呈現(xiàn)時間間隔都適合于調(diào)整至使重現(xiàn)聲音的音調(diào)與正常重放速度的音調(diào)相同,無論上取樣/下取樣處理怎樣被刪除。又,此種場合下,在音頻數(shù)據(jù)的數(shù)量按照指定的重放速度之快速或慢速模式增加/減少時,任何算法可以實施作為預定的時間標度調(diào)制算法,同時幾乎保持住執(zhí)行濾波之前音頻數(shù)據(jù)的全部特性。
參考附圖,通過對優(yōu)選實施例的詳細敘述,本發(fā)明的上述目的和其它優(yōu)點將變得十分顯明,各附圖中圖1示出一個用于重現(xiàn)一種多媒體文件的功能方框圖,涉及通常的MPEG重現(xiàn)裝置中的解碼;圖2示出一個涉及MPEG重現(xiàn)裝置解碼的功能方框圖,用于實施一種按照本發(fā)明之方法以對音頻信號的濾波進行處理;圖3是一個流程圖,概略示明本方法的一個順序,用于實施在一個實時的時間標度調(diào)制(RTTSM)濾波器中執(zhí)行的音頻信號濾波;圖4、圖5和圖6各是流程圖,分別示明RTTSM-put功能、RTTSM-out功能和RTTSM-calc功能的程序;圖7示例出將緩存器內(nèi)有關的音頻包變換成新的音頻包的過程,它是通過執(zhí)行RTTSM-put功能、RTTSM-out功能和RTTSM-calc功能經(jīng)由輸入隊列Qx、中間隊列Qy和輸出隊列Qz而受到濾波處理的新音頻包;圖8示例出一種得到一個時間標度修改信號y(·)的原理,使得相對于原來的音頻信號x(·)執(zhí)行該時間標度修改算法,以響應于用戶設定的重放速度而增加或減少數(shù)據(jù)數(shù)量;圖9示明在低于正常重放速度2倍的指定慢速重現(xiàn)場合下,按照本發(fā)明的每一數(shù)據(jù)處理步驟中音頻數(shù)據(jù)之呈現(xiàn)時間間隔的狀態(tài)改變;圖10示明在高于正常重放速度2倍的指定快速重現(xiàn)場合下,按照本發(fā)明的每一數(shù)據(jù)處理步驟中音頻數(shù)據(jù)之呈現(xiàn)時間間隔的狀態(tài)改變;
圖11示明按照本發(fā)明用于下取樣處理的一種方法,又圖12示明按照本發(fā)明用于上取樣處理的一種方法;圖13示明按照本發(fā)明用于處理音頻數(shù)據(jù)的數(shù)字信號處理板的組成,它附加到諸如是磁帶錄音機、VCR、DVCR和DVCR系統(tǒng)之類的音頻或音頻/視頻重現(xiàn)裝置上,能在慢速或快速重放模式下使重現(xiàn)聲音的音調(diào)象正常重放速度中那樣地保持不改變;圖14(a)是一個流程圖,示明前景部分的數(shù)據(jù)處理程序,圖14(b)是一個流程圖,示明背景部分的數(shù)據(jù)處理程序,又,圖14(c)示例出執(zhí)行前前景部分和背景部分切換時的關系圖;以及圖15是應用中斷信號作為基準時關于背景部分和前景部分工作時間的定時圖。
作為開始,將說明按照本發(fā)明之一個方面重現(xiàn)出音頻信號的一種方法以及其裝置。
圖2示出一個涉及MPEG重現(xiàn)裝置解碼的功能方框圖,用于示例一種按照本發(fā)明對音頻信號進行處理的方法。該MPEG重現(xiàn)裝置與圖1中所示常規(guī)裝置的不同點在于,音頻解碼器18先使通過去壓縮和解碼后由壓縮音頻數(shù)據(jù)中恢復出的原來的音頻包供給至RTTSM濾波器22上,然后將它供給至音頻輸出器20上,以按照本發(fā)明實施一種音頻信號濾波處理。
經(jīng)執(zhí)行去壓縮和解碼后從音頻解碼器18上得到的輸出數(shù)據(jù)暫時存儲入數(shù)據(jù)包單元內(nèi)的一個輸出緩存器24中。這里假定,用戶指定了重放速度為低速度重現(xiàn)(例如是慢2倍)或是高速度重現(xiàn)(例如是快2倍)。當與正常重放期間解碼出的數(shù)據(jù)(對應于圖9(a))相比較時,輸出緩存器24上記錄的音頻數(shù)據(jù)將變成這樣的數(shù)據(jù)(對應于圖9(b)),它響應于變化的重放速度而在時間標度上修改為具有分別修改好的呈現(xiàn)時間間隔。在此種運行中,MPEG重現(xiàn)裝置響應于用戶指定的快速或慢速模式的重放速度,通過擴展或縮短方式實現(xiàn)一種處理,以重新設定呈現(xiàn)時間間隔。也就是,需要以一種方式來實現(xiàn)一項處理,它計算出用戶指定的重放速度與正常重放速度之間的一個重放速度控制比α,并對正常重放速度的音頻數(shù)據(jù)呈現(xiàn)時間間隔乘上重放速度控制比α以產(chǎn)生出一個新的音頻數(shù)據(jù)呈現(xiàn)時間間隔。本發(fā)明提出的音頻信號重現(xiàn)裝置提供一種工具,也即一個程序,每當用戶通過重現(xiàn)裝置的一個鍵鈕輸入單元(未示出)改變重放速度時,它響應于指定之重放速度的加快或者減慢,重新產(chǎn)生出有關音頻數(shù)據(jù)的呈現(xiàn)時間間隔。并且,根據(jù)計算出的呈現(xiàn)時間間隔,重現(xiàn)出已受到按照本發(fā)明之濾波處理的音頻數(shù)據(jù)。這樣,由諸如是一個CPU(未示出)的控制工具執(zhí)行該提供給重現(xiàn)裝置的程序。這里,當指令低速度重現(xiàn)要比正常重放速度慢1.5倍時,重放速度控制比α的值變?yōu)?.5,或者當指令高速度重現(xiàn)要比正常重放速度快2倍時,重放速度控制比α的值變?yōu)?.5。換句話說,重放速度控制比α是由指定的重放速度與正常重放速度之間速度比的倒數(shù)決定的。
存儲在緩存器24內(nèi)的有關音頻包(此后稱之為原來的信號x(·),它有時是指在處理RTTSM濾波之前的音頻信號)按照本發(fā)明變?yōu)镽TTSM濾波器22的輸入數(shù)據(jù)(參見圖7)。
由RTTSM濾波器22實現(xiàn)的音頻數(shù)據(jù)濾波處理概略地示明于圖3的流程圖中。RTTSM濾波器22的功能可以用軟件或者硬件的方式來實現(xiàn)。首先,參考圖3的流程圖說明RTTSM濾波器22的功能。
RTTSM濾波器22實施的基本功能是響應于用戶指定的快速或慢速重放速度,對輸出緩存器24提供來的輸入隊列Qx中音頻數(shù)據(jù)之數(shù)據(jù)量作出增加/減少,這是音頻數(shù)據(jù)的時間標度修改(TSM),并將它存儲入中間隊列Qy內(nèi)作為一個TSM信號y(·)。音頻數(shù)據(jù)的TSM可以應用已知的諸TSM算法之一來實現(xiàn),不需對之作任何特別的修改,或者為了符合于應用目標而對之做某些修改。
已經(jīng)提出了幾種音頻信號處理技術,用于調(diào)整由用戶所指定的音頻信號重放速度。具體地,有幾種已知的音頻信號處理技術,它們能夠在時間標度基礎上以增加或減少數(shù)據(jù)數(shù)量的方式變更重放速度,而同時保持住與原來音頻信號固有的那些特性相類同的特性。其中,由Roucus和Wilgus于1985年提出的一種重疊-相加(OLA)算法是一種代表性的技術。在它被引入之后,OLA算法已經(jīng)發(fā)展成同步OLA(SOLA)和基于波形相似性的OLA(WSOLA)等。此外,還已經(jīng)知道有修正或改善OLA算法的一些技術,諸如整體和局部搜索的時間標度修改(GLS-TSM),時域音高同步OLA(TD-PSOLA)和指針間隔控制OLA(PICOLA)等。
下面對本發(fā)明的說明中采用的是利用WSOLA技術作為一種RTTSM算法??紤]WSOLA算法時,應用一個預定大小的窗口將音頻數(shù)據(jù)切割成許多塊,使得兩個接連的塊由一個規(guī)則的間隔搭疊上,然后,由對應于速度變化的間隔進行重新安排之后將各塊相加,以使原來的信號變換成在時間標度上增加或減少了的數(shù)據(jù)。這樣,WSOLA算法可以產(chǎn)生出已變換的信號,它能夠在不同于原來重放速度的一個速度上進行重現(xiàn)。然而,如果在改變時間標度間隔之后簡單地使相互不同的塊的信號相加,它們將導致聲音質(zhì)量有下降,很大地不同于原來信號的聲音質(zhì)量。當各塊重新安排時,為了使時間標度修改的信號其聲音質(zhì)量最大地類似于原來信號的聲音質(zhì)量,需要有一種相關性估計,在某一個范圍內(nèi)提供出對時間標度間隔作小量調(diào)整;調(diào)整到所需的基本間隔,同時啟動對兩個信號之間波形相似性的判定。然后,通過移動兩個塊的信號將它們加以綜合,直到時間標度間隔的小量調(diào)整對應的值具有最大的波形相似性。這樣做之后,就可能無論怎樣改變重放速度,聲音質(zhì)量總能保持在與原來聲音的質(zhì)量幾乎相同的程度上。WSOLA算法基于上面所述的概念。也就是,WSOLA算法的特征在于,為了防止在重新安排而綜合兩個塊的信號中聲音質(zhì)量的下降,將兩個接連塊的信號移動一個間隔,以便使兩個接連塊的兩個重疊部分之間的波形相似性有一個最大值。
所以,本發(fā)明采用WSOLA算法進行說明,它已知是音頻數(shù)據(jù)的幾種TSM算法中使重現(xiàn)的原來聲音具有優(yōu)良特性的一種,例如對應于用戶指定的重放速度控制比α的大小,對輸入隊列Qx上積累的原來音頻信號x(·)的長度進行增加或減少而得到TSM信號y(·)。然而,應當指出,本發(fā)明并非僅僅適用于WSOLA算法,也能適用于任何其它算法,只要它們結合前述的TSM算法可響應于重放速度而在時間標度基礎上對音頻數(shù)據(jù)的數(shù)據(jù)量一般地進行增加或減少。
在對適用于WSOLA算法的RTTSM濾波進行處理中,首先,在步驟S10中,每周期地檢查用戶是否指令了變化重放速度而需變更先前設定的重放速度。如果不指令變化重放速度,則按照已經(jīng)設定的重放速度實施處理。如果指令了變化重放速度,則重現(xiàn)裝置發(fā)生一個事件。
步驟S12上,根據(jù)事件的發(fā)生,重新規(guī)定環(huán)境參數(shù)以符合于所指定的重放速度。環(huán)境參數(shù)是實施WSOLA算法所需要的,它們包括原來信號x(·)的幀尺寸n;在先前幀與當前幀之前具有一個最佳相關性的同步滯后Km,由一個檢驗范圍(窗)規(guī)定的Kmax,用于按照原來信號x(·)與TSM信號y(·)之間的波形相似性來檢測最佳相關性;Sa,它定義為從緩存器24中讀出的接連各幀原來信號x(·)的各開始時間之間諸音頻樣本的差值;Ss,它定義為經(jīng)WSOLA算法處理后得到的TSM信號y(·)之接連各時間標度幀的各開始時間之間諸音頻樣本的差值;TSM信號y(·)的接連幀之間重疊樣本L的數(shù)目;以及加權值Wx和Wy,它們施加到TSM信號y(·)的接連幀之間重疊的樣本上。這里,參數(shù)n、Kmax、Sa、Wx和Wy是在重現(xiàn)裝置中先前定義了的,參數(shù)Ss是對當前重放速度乘上參數(shù)Sa得到的一個值,參數(shù)L是由一個相對公式L=n-Ss定義的值,而同步滯后Km是指下一幀原來信號x(·)開始位置的最佳校準點,在這個最佳校準點上原來信號x(·)與TSM信號y(·)具有最佳的相關性。
此外,在步驟S14中,對一些參數(shù)進行再初始化,包括環(huán)形隊列Qx、Qy和Qz,它們使用于實施算法中的暫時存儲工具;隊列指針;取樣頻率;一個標志符,它用于按照重現(xiàn)裝置的性能合適地調(diào)整計算量;以及各個設定值,它們是檢驗波形相關性中規(guī)定出一些單元所必需的。
執(zhí)行該算法后,響應于用戶指定的新重放速度建立起了環(huán)境參數(shù),針對先前存儲于緩存器24中已經(jīng)由音頻解碼器處理的已解碼音頻數(shù)據(jù),RTTSM濾波器22通過應用WSOLA算法對該指定的重放速度起響應而增加或減少數(shù)據(jù)數(shù)量。然后,數(shù)據(jù)再經(jīng)過下取樣或上取樣并返回到緩存器24中。因此,供給至音頻輸出器20的數(shù)據(jù)是已經(jīng)由WSOLA算法進行處理并受到下取樣或上取樣后的數(shù)據(jù)。
更具體地,存儲在緩存器24中的音頻數(shù)據(jù)重復地經(jīng)受圖3中步驟S18至步驟S24的處理,直至到達每個包的結束,并且相同的處理對于隨后的音頻包重復進行。
借助于實施三種功能,完成對于各個音頻包的RTTSM濾波處理,這三種功能是RTTSM-put功能、RTTSM-calc功能和RTTSM-out功能。在步驟S18中,RTTSM-put功能從緩存器24中讀出一個集合的音頻數(shù)據(jù)(對應于圖9(b)),將它寫入輸入隊列Qx。RTTSM-calc功能對幀單元內(nèi)積累在輸入隊列Qx上的音頻數(shù)據(jù)實施WSOLA算法處理,以響應于指定的重放速度而增加或減少數(shù)據(jù)數(shù)量。這樣,通過對當前重放速度的響應,形成了數(shù)據(jù)數(shù)量已經(jīng)增加或減少而時間標度改變的音頻數(shù)據(jù)y(·)(對應于圖9(c)),寫入至中間隊列Qy中。在步驟S20上,當當前指定的重放速度慢于正常重放速度時,積累在中間隊列Qy上的音頻數(shù)據(jù)被下取樣,以減少數(shù)據(jù)數(shù)量,或是當當前指定的重放速度快于正常重放速度時,積累在中間隊列Qy上的音頻數(shù)據(jù)被上取樣,以增加數(shù)據(jù)數(shù)量,并將取樣的數(shù)據(jù)寫入至輸出隊列Qz中。又,在步驟S22上,RTTSM-out功能再將積累在輸出隊列Qz中的音頻數(shù)據(jù)向緩存器24提供給一個集合,由此,以實施RTTSM濾波處理后得到的音頻數(shù)據(jù)取代由音頻解碼器18供給的已有的音頻數(shù)據(jù)。
步驟S24上,每當順序地完成三種功能之后,使音頻集合的指數(shù)增大1,然后返回至步驟S16。在步驟S16上,重復上述程序,直至音頻數(shù)據(jù)集合的指數(shù)值變得與音頻包最后樣本的指數(shù)相同,并對隨后的音頻包重復上面說明的數(shù)據(jù)處理程序。先前存儲在緩存器24中的原來的音頻包按照上面的程序變化成一個新的音頻包,以此種方式變化成的音頻包在重現(xiàn)裝置的控制下輸出至音頻輸出器20中,由此通過揚聲器(未示出)或是耳機端子(未示出)重現(xiàn)出聲音。
通過RTTSM算法處理得到的新音頻包由音頻輸出器20予以重現(xiàn),具有的音調(diào)與正常重放速度的音調(diào)實質(zhì)上相同,不依賴于用戶指定的重放速度。得到如此結果的原由將參照圖4至圖10予以說明。
圖9中示出,當指定的重放速度比之正常重放速度慢2倍時,每個有關的數(shù)據(jù)處理步驟中音頻數(shù)據(jù)呈現(xiàn)時間間隔的變化。圖9(a)示明對應于正常重放速度的音頻數(shù)據(jù)呈現(xiàn)時間間隔。假定在正常重放速度期間各個音頻數(shù)據(jù)d1、d2、……、d10、……的呈現(xiàn)時間間隔為t,圖9(b)中示出音頻解碼器18產(chǎn)生的數(shù)據(jù),各個音頻數(shù)據(jù)d1、d2、……、d10、……的呈現(xiàn)時間間隔簡單地增大至2倍,并使產(chǎn)生的音頻數(shù)據(jù)存儲入緩存器24中。由于存儲入緩存器24中的各個音頻數(shù)據(jù)d1、d2、……、d10、……的呈現(xiàn)時間間隔為2t,所以音頻數(shù)據(jù)的重現(xiàn)時間也擴展至2倍。如果音頻數(shù)據(jù)的呈現(xiàn)時間間隔在時間標度上增大至2倍,盡管能夠滿足用戶所需的重放速度,但重現(xiàn)聲音的音調(diào)將降低大約一個八度音,結果是劣化了重現(xiàn)聲音的質(zhì)量。
存儲在緩存器24中的音頻數(shù)據(jù)如圖9(b)中所示地預定以2t的時間間隔呈現(xiàn)。為了按用戶的指令那樣以慢2倍的重放速度重現(xiàn)它,并維持與視頻數(shù)據(jù)的同步、且能使重現(xiàn)聲音的音調(diào)與正常重放速度下原來的音調(diào)相同,首要地對緩存器24中存儲的音頻數(shù)據(jù)實施WSOLA處理。如圖9(c)中所示,通過實施WSOLA處理得到的音頻數(shù)據(jù)的數(shù)據(jù)量增加至大約2倍。那時,由于各個音頻數(shù)據(jù)的呈現(xiàn)時間間隔仍維持2t那樣大,將不發(fā)生音調(diào)變化。
另外,在用戶指定了2倍的低速度重現(xiàn)的場合下,重現(xiàn)裝置將音頻數(shù)據(jù)的呈現(xiàn)時間間隔從t改變到2t。結果,受到WSOLA處理后的音頻數(shù)據(jù)其重現(xiàn)時間增加為大約4倍,它牽涉到這樣的問題,與視頻數(shù)據(jù)的同步變得不協(xié)調(diào),并且音調(diào)仍然保持為降低一個八度音的音調(diào)變化。
為了解決這些問題,使實施WSOLA算法后得到的音頻數(shù)據(jù)受到下取樣。對于實施下取樣,從概念上假定,相對于實施WSOLA算法之后得到的音頻數(shù)據(jù),如圖9(d)中所示地將音頻數(shù)據(jù)的呈現(xiàn)時間間隔在時間標度上壓縮至要恢復成的t。在實現(xiàn)此種處理之后,總的重現(xiàn)時間變?yōu)槿鐖D9(b)中所示。因此,音頻數(shù)據(jù)的重現(xiàn)能夠符合于用戶設定的新重放速度,并可以與視頻數(shù)據(jù)同步。此外,由于時間標度上有著再壓縮1/2的效應,音頻數(shù)據(jù)的音調(diào)被提升一個八度音地恢復,而幾乎與圖9(a)中所示的音調(diào)相同。
然而,與圖9(b)中所示的相比較,音頻數(shù)據(jù)樣本的數(shù)目仍保持為它的2倍,且重現(xiàn)裝置預安排好呈現(xiàn)出每2t的音頻數(shù)據(jù)。由于這些情況,僅僅在時間標度上的壓縮是不夠的。換句話說,對于按照2t的呈現(xiàn)時間間隔來重現(xiàn)音頻數(shù)據(jù),需要使用9(c)中所示經(jīng)WSOLA算法處理的音頻數(shù)據(jù)其數(shù)量減少一半。為此,針對經(jīng)WSOLA算法處理的音頻數(shù)據(jù)實施下取樣,以使音頻數(shù)據(jù)的數(shù)量減少一半。通過實施下取樣,最后得到如圖9(e)中所示的音頻數(shù)據(jù)。
由于圖9(e)中所示的音頻數(shù)據(jù)是對音頻數(shù)據(jù)(對應于圖9(d))進行下取樣得到的,后者是圖9(c)的音頻數(shù)據(jù)在時間標度上壓縮一半而音調(diào)升高一個八度音的,所以圖9(e)的音調(diào)仍然與圖9(d)音頻數(shù)據(jù)的音調(diào)相同,從而與圖9(a)音頻數(shù)據(jù)的音調(diào)相同。結果,雖然重放速度減慢2倍,重現(xiàn)聲音的音調(diào)保持為幾乎與正常重放速度的音調(diào)相同。當然,在實施下取樣的同時音頻數(shù)據(jù)的分辨率降低了,但是,在實施下取樣期間施加上后面要說明的一種聲音質(zhì)量減低方法時,由分辨率降低造成的聲音質(zhì)量劣化是可以忽略的。
同時,圖10中示出了當指定的重放速度比之正常重放速度快2倍時,每個有關的數(shù)據(jù)處理步驟中音頻數(shù)據(jù)呈現(xiàn)時間間隔的變化。圖10(a)示明實施正常重放速度期間音頻數(shù)據(jù)S1、S2、……、S10、……的呈現(xiàn)時間間隔。當用戶指令2倍的快速重放時,重現(xiàn)裝置使各個音頻數(shù)據(jù)的樣本呈現(xiàn)時間間隔壓縮至1/2,也即從t變?yōu)閠/2,如圖10(b)中所示。存儲在緩存器24中的音頻數(shù)據(jù)在按照它那樣重現(xiàn)時要以Δt/2的時間間隔進行重現(xiàn)。因此,與正常重放速度的音調(diào)相比較,重現(xiàn)聲音的音調(diào)升高一個八度音。所以,音頻數(shù)據(jù)要以這樣的方式進行處理,即針對緩存器24中存儲的音頻數(shù)據(jù)執(zhí)行WSOLA處理和上取樣,以便不僅使重放速度加快至2倍,而且在重現(xiàn)聲音中保持正常重放速度的音調(diào)。
首先,存儲在緩存器24中的音頻數(shù)據(jù)受到WSOLA處理,如圖9(c)中所示地使音頻數(shù)據(jù)的數(shù)量實質(zhì)上減少1/2。此時,由于各個音頻數(shù)據(jù)的呈現(xiàn)時間間隔繼續(xù)保持為t/2不變,所以與正常重放速度的音調(diào)相比較,其音調(diào)亦保持為升高一個八度音的狀態(tài)。實施WSOLA處理后音頻數(shù)據(jù)的重現(xiàn)時間與正常重放速度的重現(xiàn)時間相比較縮短到1/4,引起了與視頻數(shù)據(jù)同步不協(xié)調(diào)的問題,并關聯(lián)到音調(diào)變化保持于高出一個八度音的問題。
為了解決這些問題,對于實施WSOLA處理后得到的音頻數(shù)據(jù)進行上取樣。關于實施上取樣,從概念上假定,相對于自WSOLA處理中得到的音頻數(shù)據(jù),如圖10(d)中所示地將音頻數(shù)據(jù)的呈現(xiàn)時間間隔在時間基線上擴展2倍而成為要恢復的t。實現(xiàn)這樣的處理之后,總重現(xiàn)時間變?yōu)槿鐖D10(b)中所示。因此,音頻數(shù)據(jù)的重現(xiàn)能夠符合于用戶設定的新重放速度,并可以與視頻數(shù)據(jù)同步。此外,由于時間標度上有著再擴展1/2的效應,音頻數(shù)據(jù)的音調(diào)被提升一個八度音地恢復,而與圖10(a)中所示的實質(zhì)上相同。
然而,與圖10(b)中所示的相比較,音頻數(shù)據(jù)樣本的數(shù)目仍保持為它的1/2,且重現(xiàn)裝置預先安排好呈現(xiàn)出每t/2一個的音頻數(shù)據(jù)。由于這些情況,只是在時間標度上壓縮是不足夠的。換句話說,對于按照t/2的呈現(xiàn)時間間隔來重現(xiàn)音頻數(shù)據(jù),需要使用經(jīng)實施WSOLA處理得到的音頻數(shù)據(jù),其數(shù)據(jù)數(shù)量增加2倍。為此,對于自WSOLA處理中得到的音頻數(shù)據(jù)實施上取樣,以使其音頻數(shù)據(jù)的數(shù)量增加2倍。通過實施上取樣,最后得到如圖10(e)中所示的音頻數(shù)據(jù)。
由于圖10(e)中所示的音頻數(shù)據(jù)S1、S2、……、S10、……是對音頻數(shù)據(jù)(對應于圖10(d))進行上取樣得到的,后者是圖10(c)的音頻數(shù)據(jù)在時間標度上擴展2倍而音調(diào)降低一個八度音的,所以圖10(e)的音調(diào)仍然與圖10(d)音頻數(shù)據(jù)的音調(diào)相同,從而與圖10(a)音頻數(shù)據(jù)的音調(diào)相同。結果,雖然重放速度加快到2倍,重現(xiàn)聲音的音調(diào)保持為幾乎與正常重放速度的音調(diào)相同。
執(zhí)行WSOLA算法后,上述的下取樣或上取樣由后面將說明的三種功能來實現(xiàn)。另外,在實現(xiàn)下取樣或上取樣中,數(shù)據(jù)的增加率或減少率是根據(jù)用戶指定之重放速度的加快或減慢狀態(tài)確定的,音頻數(shù)據(jù)之數(shù)量的增加或減少就按照所確定的增加率/減少率。經(jīng)取樣后備個音頻數(shù)據(jù)的幅度可以照原樣地采用自WSOLA處理中得到的TSM音頻數(shù)據(jù)的幅度,或者可以由相鄰音頻數(shù)據(jù)中內(nèi)插出的幅度來確定。下面,將說明應用各別功能進行的特定的數(shù)據(jù)處理算法。
圖4、圖5和圖6的流程圖分別示明RTTSM-put功能、RTTSM-out功能和RTTSM-calc功能的程序。圖7示例出將緩存器24中有關的音頻包變換成新音頻包的過程,它借助于實施三種功能而歷經(jīng)了輸入隊列Qx、中間隊列Qy和輸出隊列Qz。圖8示例出得到TSM信號y(·)的原理,使得響應于用戶設定的重放速度的加快或減慢狀態(tài),原來的音頻信號x(·)的長度也即音頻數(shù)據(jù)的數(shù)量,在時間標度上被擴展或壓縮。本發(fā)明中,利用了三個隊列以應用三種功能來實施WSOLA處理和上取樣/下取樣。
當用戶指定一個重放速度比之正常重放速度加快或減慢時,重現(xiàn)裝置便改變各個音頻數(shù)據(jù)集合的呈現(xiàn)時間間隔以適合于所指定的重放速度。所以,存儲在緩存器24中的各個音頻包集合由圖9(b)或圖10(b)中所示的呈現(xiàn)時間間隔預定地重現(xiàn)。緩存器24中的每個音頻包在音頻數(shù)據(jù)的集合指數(shù)增加1時順序地由一個集合dxj予以讀出,并如圖4中所示地通過實施RTTSM-out功能而在步驟S30中寫入至輸入隊列Qx中。這里,集合有兩種組成類型。對于單聲道系統(tǒng),它可取地由一路音頻數(shù)據(jù)組成;對于立體聲系統(tǒng),它就能由兩路音頻數(shù)據(jù)組成,用于左/右聲道。母庸說明,在音頻數(shù)據(jù)的階序保持不變的前提下,一個集合中可以包含多路音頻數(shù)據(jù)。
輸入隊列Qx可取地要求其大小足以在它上面能積累大約3幀以上的音頻數(shù)據(jù)。當寫入一個集合時,輸入隊列Qx的一個指針值便增大。在增大隊列指針的過程中隊列指針指明是輸入隊列Qx的最后位置之后,便復位而指明開始位置,使輸入隊列Qx起到一個環(huán)形隊列的作用。此外,當輸入隊列Qx上寫入一個集合后,它被計數(shù)。然后,步驟S34中,當計數(shù)的集合數(shù)目變?yōu)榕c參數(shù)Sa的集合值相同時,一個計算下一幀的標志符改變成啟動狀態(tài),用以確定是否對下一幀進行計算。當然,該計算下一幀標志符的默認值為1,表示為不啟動狀態(tài),而標志符改變?yōu)?值的啟動狀態(tài)時,表明輸入隊列Qx中存儲了至少一幀,能實施WSOLA算法。
在按照本發(fā)明實施濾波之前,與輸入隊列Qx上寫入音頻數(shù)據(jù)的同時,從緩存器24中讀出一個集合,如圖5中所示的RTTSM-out功能在其實現(xiàn)中讀出存儲在輸出隊列Qx內(nèi)已經(jīng)受到WSOLA處理和上取樣/下取樣處理的音頻數(shù)據(jù)之一個集合dij,然后在步驟S36中,當集合指數(shù)增大1時用輸入場合時同樣的速率將該集合覆蓋寫入緩存器24中。由于實施WSOLA處理和下取樣/上取樣處理后的數(shù)據(jù)數(shù)量與實施處理前的相同,所以除了總的重現(xiàn)時間延時一短段時間(也即是實施WSOLA處理和下取樣/上取樣處理所需的時間)之外,不發(fā)生別的問題,即使是從輸出隊列Qz中讀出一個集合而順序地寫入緩存器24中也是那樣。輸出隊列Qz的大小設定為能同時存儲入至少兩幀的數(shù)據(jù),并在步驟S38上調(diào)整隊列指針用以起到環(huán)形隊列的作用。
在將積累在輸入隊列Qx上的音頻數(shù)據(jù)傳輸至輸出隊列Qx期間,執(zhí)行圖6中所示的RTTSM-calc功能以實施基于WSOLA算法的TSM處理和下取樣/上取樣處理。應當指出,雖然RTTSM-put功能和RTTSM-out功能的執(zhí)行周期是以集合為單位的,但RTTSM-calc功能的處理以幀為單位,它是多個集合構成的組群。也就是,只當步驟S40中計算下一幀的標志符為啟動狀態(tài)時,才實施RTTSM-calc功能。另外,每當對于當前幀實現(xiàn)上述的處理時,在步驟S42中計算下一幀標志符的值轉移至不啟動狀態(tài),以準備處理下一幀。
在由RTTSM-out功能處理當前幀期間,檢查是否有改變重放速度的指令。這樣,當存在改變重放速度的指令時,在步驟S44和S46上,再修改在處理WSOLA算法中所需的環(huán)境參數(shù)的值,也即重放速度、Sa、Ss、L、Wx和Wy的值。在處理WSOLA算法期間,由重現(xiàn)系統(tǒng)作出控制,產(chǎn)生一個事件以使得RTTSM-calc功能每次處理Sa單位的音頻數(shù)據(jù)。此時,由于必需按照同一個重放速度來處理一個Sa,因重放速度改變引起的修改環(huán)境參數(shù)的程序固有地包括在RTTSM-calc功能的程序內(nèi)。
當重放速度不改變時,如下面那樣以預先設定的環(huán)境參數(shù)值來實施WSOLA處理。在執(zhí)行RTTSM-put功能中,輸入隊列Qx用音頻數(shù)據(jù)積累起來。這里,當每計算下一幀的標志符設置于啟動狀態(tài)一次時,便對存儲在輸入隊列Qx中的音頻數(shù)據(jù)實施RTTSM處理。為了實施WSOLA處理,需要輸入隊列Qx中至少存儲一幀音頻數(shù)據(jù)。
為了有助于理解WSOLA處理,下面將敘述示例的解釋。假定,幀F(xiàn)m由320個樣本組成,重放速度控制比α為2,在輸入隊列Qx上原來信號x(·)的接連幀之間開始點的基本差值S。為120(樣本),以及在原來信號x(·)與TSM信號y(·)之間檢測波形相似性之最佳相關度的檢驗范圍(窗口)Kmax為±40(樣本)。重放速度控制比α表示W(wǎng)SOLA處理期間數(shù)據(jù)數(shù)量的變動。例如,如果指定的重放速度比之正常重放速度慢2倍,則重現(xiàn)裝置將重放速度控制比α設定為2,使得與處理前的數(shù)量相比較,WSOLA處理后音頻數(shù)據(jù)的數(shù)量增大至大約2倍。由于數(shù)據(jù)數(shù)量增大至2倍,重現(xiàn)時間將增大2倍以使得重放速度減慢2倍。與之相反,當重放速度指定為比之正常重放速度快2倍的高速重放時,重放裝置便將重放速度控制比α設定為0.5。這樣,與處理前的數(shù)量相比較,WSOLA處理后音頻數(shù)據(jù)的數(shù)量減少至大約1/2倍。重現(xiàn)時間也將象數(shù)據(jù)數(shù)量的減少那樣縮短那么多。另外,假定音頻數(shù)據(jù)是對于單聲道系統(tǒng)產(chǎn)生的,則其中一個樣本構成一個集合。下面的說明也可應用于立體聲系統(tǒng),因為從基本的數(shù)據(jù)處理系統(tǒng)來看,除了在立體聲系統(tǒng)的場合下一個集合由兩個樣本組成這一事實要給予任一種特定的考慮外,它與單聲道系統(tǒng)并無其它差別。上面這些值只是給出作為例子,按照其作用的環(huán)境它們可以改變?yōu)椴煌闹怠?br>
開始時,原來信號x(·)的初始幀F(xiàn)0從輸入隊列Qx中讀出,以便復寫入中間隊列Qy作為TSM信號y(·),并將幀指數(shù)m的值設置為1。此后,從下一幀起執(zhí)行下面的環(huán)路,直至整個原來的音頻信號x(·)完全地修改好。
然后,從輸入隊列Qx中讀出原來信號x(·)的下一幀F(xiàn)1,以作為TSM信號y(·)加到中間隊列Qy中。這里,當從原來信號x(·)中讀出下一幀F(xiàn)1時,讀出開始位置可能不一樣地確定。該讀出開始位置由對于先前讀出幀F(xiàn)0的同步滯后K1確定,幀F(xiàn)0是先前復寫入中間隊列Qy作為TSM信號y(·)的。另外,將作為TSM信號y(·)的、讀出的下一幀F(xiàn)1加到中間隊列Qy中的哪個位置,是根據(jù)重放速度控制比α的大小而可變化地確定的。
同步滯后Km應用來尋找出一個點,在這個點上原來信號x(·)的下一幀F(xiàn)m與已經(jīng)作為TSM信號y(·)記錄在中間隊列Qy中的先前幀F(xiàn)m-1在一個預定的范圍具有最佳的相關性。
下面的相關性公式應用來確定同步滯后Km。同步滯后Km的計算是通過使Fm圍繞在最小值ms-40和最大值Sa+40之間的范圍y(m*Ss)內(nèi)滑動進行的。c(m,k)=Σj=0L-1y(mSs+j).x(mSα+k+j),Ss=αSα………(1)]]>C(m,Km)=max〔c(m,k)〕,-Kmax≤K≤Kmax……(2)式中,L是接連幀中重疊樣本的數(shù)目。
這里,在計算接連幀之間的最佳相關性時,可應用使音頻數(shù)據(jù)逐一地滑動的計算方法。然而,這種計算方法增加了重現(xiàn)系統(tǒng)在實施許多計算上的負擔。所以,當要求加快計算速度時,一種跳越多個音頻數(shù)據(jù)的方法可以推薦作為最佳相關性的計算方法。然而,不可避免地,從最佳相關性的精確度看,該方法劣于前者的方法。在決定采用哪種方法時,可取地應考慮到重現(xiàn)裝置中CPU的性能更適合于哪一種。
通過應用上面兩個公式得到了具有最佳相關性的同步滯后Km之后,借助于應用所得到的同步滯后Km,從原來信號x(·)中讀出包括有N個樣本數(shù)目的下一幀F(xiàn)m。該下一幀F(xiàn)m的讀出開始位置是這樣一個位置,它決定于從先前幀F(xiàn)m-1的讀出開始位置上跳越Sa±Km個樣本數(shù)目,這里,0<Sa±Km<N。例如,參見圖8,如果K1、K2和K3分別被決定為20、-10和35,則是第二、第三和第四幀F(xiàn)1、F2和F3的讀出開始位置分別是第140、第230和第395個樣本。當然,各個幀中樣本的數(shù)目N恒定地為320。按照上面說明的從輸入隊列Qx中讀出原來信號x(·)的方法,前一幀和下一幀中相當數(shù)量的樣本是重疊的。另外,根據(jù)重放速度控制比α的大小,TSM信號y(·)中的重疊部分可以是大的(α>1時)或是小的(α<1時)。應當指出,各個幀的讀出開始位置不是按Sa與幀指數(shù)m的乘積規(guī)則地改變的,而是按照應用公式(1)和(2)所決定的最佳相關性Km的大小作不規(guī)則地變化的。
如上面所述的讀出之后,將下一幀F(xiàn)m加到中間隊列Qy中的TSM信號y(·)上。要加到TSM信號y(·)上的下一幀F(xiàn)m的各個開始位置決定于mαSa。所以,當圖8中αSa=2×120=240時,對于相加到第二、第三和第四幀F(xiàn)1、F2和F3上的開始位置分別變?yōu)?40、480和720。該相加中,在下一幀F(xiàn)m的前部與前一幀F(xiàn)m-1的后部之間有著重疊部分。接連幀的各重疊部分是加權地相加的,加權值應用下面的公式(3)和(4)得出,而下一幀F(xiàn)m的其余部分只是簡單地復寫。
Y(mSs+j)=(1-g(i))y(mSs+j)+g(j)(mSa+Km+j),0≤j≤L……(3)Y(mSs+j)=(mSa+Km+j),L≤j≤N ……(4)這里,g(j)是一個加權值函數(shù),它的代表形式可取地為一個線性函數(shù)。另一種情況,也可以采用指數(shù)函數(shù)作為加權值函數(shù)。
上面所述的狀態(tài)下,存儲在緩存器24內(nèi)、呈現(xiàn)時間間隔如圖9(b)或圖10(b)中所示的原來信號x(·)以幀為單位從輸入隊列Qx中讀出,然后相加到中間隊列Qy的TSM信號y(·)上。通過此處理,中間隊列Qy上積累了響應于指定的重放速度,已經(jīng)受到WSOLA處理的音頻數(shù)據(jù)。例如,如果指定的重放速度比正常重放速度慢2倍,則將圖9(c)中所示的音頻數(shù)據(jù)存儲入中間隊列Qy中,如果指定的重放速度比正常重放速度快2倍,則將圖10(c)中所示的音頻數(shù)據(jù)存儲入中間隊列Qy中。對于中間隊列Qy,可取地確保其大小能存儲至少兩幀音頻數(shù)據(jù)。
然后,積累在中間隊列Qy中經(jīng)過WSOLA處理的音頻數(shù)據(jù)傳輸至輸出隊列Qz上。在傳輸期間,按照重放速度實施下取樣或上取樣。實施取樣中,根據(jù)用戶指定的重放速度確定一個數(shù)據(jù)增加率/減少率,然后,按照確定的增加率/減少率應用一種內(nèi)插方法使音頻數(shù)據(jù)的數(shù)量改變,能使取樣之前和之后的數(shù)據(jù)特性不致發(fā)生任何變化。內(nèi)插方法是一種數(shù)值分析方法,用于從諸個給定的點上推斷出一個新的點。有幾種典型的內(nèi)插方法一種應用Taylor(泰勒)多項式的內(nèi)插方法,它一般使用于數(shù)值解釋中;一種應用Lagrange(拉格朗日)多項式的內(nèi)插方法;一種重復內(nèi)插方法;一種Hermite內(nèi)插方法和三維Spline內(nèi)插方法;以及一種最為簡單的線性內(nèi)插方法。任一種內(nèi)插方法都可適用于本發(fā)明,只要它能夠使音頻數(shù)據(jù)的特性在取樣之前和之后幾乎相互一樣。
后面將假定,借助線性內(nèi)插方法來實施內(nèi)插,它應用了通過所給定全部音頻數(shù)據(jù)點的一個公式和一些加權值。
當用戶指定比正常重放速度為慢的重放速度時,在數(shù)據(jù)的數(shù)量已經(jīng)由WSOLA處理而增加后,應當實施下取樣處理。將參考圖11予以說明。
作為圖11(a)中所示的第一個例子的情況,指定的重放速度比正常重放速度慢2倍,也即重放速度控制比α設定為2。存儲在中間隊列Qy中、受到WSOLA處理后的音頻數(shù)據(jù)d1′、d2′、d3′、……的數(shù)量在傳輸至輸出隊列Qz之前要先減少一半。為了減少音頻數(shù)據(jù)的數(shù)量,每兩個接連的音頻數(shù)據(jù)或者音頻樣本應減少為一個音頻數(shù)據(jù)。此時,新形成的一個音頻數(shù)據(jù)的量值也即幅度,是通過對兩個接連的音頻數(shù)據(jù)幅度進行平均而得到的一個值。也就是,實施下取樣后音頻數(shù)據(jù)d1″、d2″、d3″、……的幅度值有如下關系式d1″=(d1′+d2′)/2d2″=(d3′+d4′)/2d3″=(d5′+d6′)/2………………圖11(b)示明第二個例子的情況,指定的重放速度比之正常重放速度慢1.5倍,也就是重放速度控制比α設定為1.5。存儲在中間隊列Qy中、受到WSOLA處理后的音頻數(shù)據(jù)d1′、d2′、d3′、……的數(shù)量在傳輸至輸出隊列Qz之前要先減少到2/3倍。在此場合下,下取樣以這樣的方式實施,即看作為一個單元的三個音頻數(shù)據(jù)減少至為兩個音頻數(shù)據(jù),每三個音頻數(shù)據(jù)中第一個音頻數(shù)據(jù)不作變化,對第二和第三個數(shù)據(jù)計算出平均值并將它們減少成為一個音頻數(shù)據(jù)。這樣,從下取樣中得到的音頻數(shù)據(jù)d1″、d2″、d3″、d4″……的幅度值具有下面的關系式d1″=d1′
d2″=(d2′+d3′)/2d3″=d4′d4″=(d5′+d6′)/2………………圖11(c)示明第三個例子的情況,指定的重放速度比之正常重放速度慢1.25倍,也即是重放速度控制比α設定為1.25。存儲在中間隊列Qy中,受到WSOLA處理的音頻數(shù)據(jù)d1′、d2′、d3′、……的數(shù)量減少至4/5倍。下取樣以這樣的方式實施,即看作為一個單元的五個音頻數(shù)據(jù)減少至為四個音頻數(shù)據(jù)。也就是,要傳輸至輸出隊列Qz的、從下取樣中得到的音頻數(shù)據(jù)d1″、d2″、d3″、d4″、d5″、……的幅度值具有下面的關系式d1″=d1′d2″=d2′+(d3′-d2′)/4d3″=d3′+2(d4′-d3′)/4d4″=d4′+3(d5′-d4′)/4d5″=d6′………………可以知道,應將上面的方法修改成規(guī)一化形式,將它應用到重放速度控制比α為任何值的場合。
另一方面,當用戶指定了快速重放模式時,對于存儲在中間隊列Qy中的音頻數(shù)據(jù)應實施上取樣,在此場合下,音頻數(shù)據(jù)由WSOLA處理予以減少后,通過上取樣形成的新音頻數(shù)據(jù)傳輸至輸出隊列Qz中。將參考圖12詳細進行說明。
圖12(a)示明第一個例子的情況,指定的重放速度比之正常重放速度快4/3倍,重放速度控制比α設定為0.75。在此場合下,存儲在中間隊列Qy中的音頻數(shù)據(jù)d1′、d2′、d3′、………的數(shù)量在傳輸至輸出隊列Qz之前需要由上取樣增加至4/3倍。也就是,從音頻數(shù)據(jù)d1′、d2′、d3′、………經(jīng)上取樣4/3倍得到的音頻數(shù)據(jù)d1″、d2″、d3″、d4″、d5″、d6″、………的幅度值具有下面的關系式d1″=d1′d2″=d1′+3(d2′-d1′)/4d3″=d2′+2(d3′-d2′)/4
d4″=d3′+(d4′-d3′)/4d5″=d4′d6″=d4′+3(d5′-d4′)/4………………圖12(b)示明第二個例子的情況,指定的重放速度比之正常重放速度快2倍,也就是,重放速度控制比α設定為0.5。在此場合下,存儲在中間隊列Qy中經(jīng)過實施WSOLA處理后音頻數(shù)據(jù)d1′、d2′、d3′、……的數(shù)量要增加至2倍。對此,將每兩個相鄰音頻數(shù)據(jù)的平均值采用來形成一個新音頻數(shù)據(jù),它隨后插入在這兩個相鄰的音頻數(shù)據(jù)之間。這樣,從上取樣中得到的音頻數(shù)據(jù)d1″、d2″、d3″、d4″、d5″、………的幅度值類似地有下面的關系式d1″=d1′d2″=(d1′+d2′)/2d3″=d2′d4″=(d2′+d3′)/2d5″=d3′………………按照上面說明的下取樣或上取樣,存儲在中間隊列Qy中的每個音頻數(shù)據(jù)幀的數(shù)據(jù)數(shù)量根據(jù)所指定重放速度的快速或慢速狀態(tài)增加或減少,并且在傳輸至輸出隊列Qz上之前,上取樣/下取樣的音頻數(shù)據(jù)的幅度值在確定中或是采用存儲在中間隊列Qy中的音頻數(shù)據(jù)之幅度值,或是根據(jù)上面的規(guī)則采用對它們進行內(nèi)插得到的幅度值。應當指出,上面的說明中各個重放速度控制比α的值是示例性的,當指定任何其它不同的重放速度時,上面的下取樣和上取樣的規(guī)則也是一般地可予應用的。
通過下取樣或上取樣得到的新音頻數(shù)據(jù)以幀為單位傳輸至輸出隊列Qz上。在實施RTTSM-out功能后,輸出隊列Qz中的音頻數(shù)據(jù)以一個個集合為單位順序地寫入緩存器24中。這樣做之后,緩存器24中已有的音頻包由已經(jīng)受到WSOLA處理和下取樣/上取樣而從輸出隊列Qa來的相應的新音頻包取代。要提供給音頻輸出器20的音頻數(shù)據(jù)即是這新的相應的音頻包。
按照本發(fā)明所提出的重現(xiàn)裝置,每當指令重放速度改變時,響應于指定的重放速度值,要重新計算音頻數(shù)據(jù)呈現(xiàn)時間間隔的增加/減少,而音頻輸出器20的工作情況是由新計算出的呈現(xiàn)時間間隔來重現(xiàn)經(jīng)取樣得到的音頻數(shù)據(jù)。所以,即使指定的重放速度不同于正常重放速度時,重現(xiàn)聲音的音調(diào)實質(zhì)上與正常重放速度中重現(xiàn)的聲音音調(diào)相同,并且在與視頻數(shù)據(jù)的同步上不發(fā)生問題。
本發(fā)明引入了輸入隊列,中間隊列和輸出隊列三種數(shù)據(jù)存儲工具,用于TSM處理和上取樣/下取樣處理。但可以理解到,不需要對它們以物理方式來區(qū)分,重現(xiàn)裝置中的一個存儲器可以劃分成三個區(qū)域而加以合適地利用。此外,定義出三個隊列是為了便于軟件的實現(xiàn),其實不需要象上面那樣地定義三個獨立的隊列。換句話說,可以用另一種方式定義這些隊列,一個統(tǒng)一的全規(guī)模隊列劃分成三個區(qū)域,三個區(qū)域之每一個通過控制它的一個指針規(guī)定它起一個環(huán)形隊列的作用。
如上面所述的按照本發(fā)明的音頻數(shù)據(jù)處理方法,可以用軟件方法實施而直接應用于計算機上,計算機內(nèi)裝置Windows操作系統(tǒng)和一個微軟公司的稱為Direct Media的程序。在軟件實現(xiàn)方法中,實現(xiàn)音頻數(shù)據(jù)處理方法的算法程序存儲在計算機內(nèi)的硬盤(未示出)中或是ROM 240中,并當實現(xiàn)一個多媒體重現(xiàn)程序時由CPU 230來執(zhí)行。緩存器24或是三個環(huán)形隊列Qx、Qy和Qz適當?shù)乩糜嬎銠C內(nèi)的RAM(未示出)資源,并利用計算機內(nèi)的一個聲卡(未示出)作為音頻輸出器20。
應用本發(fā)明之音頻數(shù)據(jù)處理方法的可能性并不限制于計算機。本方法也能夠應用于DVD系統(tǒng)100a、數(shù)字VCR系統(tǒng)中或是另外的類似的系統(tǒng)中,也即應用于重現(xiàn)壓縮編碼之視頻數(shù)據(jù)和音頻數(shù)據(jù)的任何數(shù)字重現(xiàn)裝置中。而且,可以應用于模擬系統(tǒng)的磁帶錄音機、VCR系統(tǒng)100 b中,或是類似的系統(tǒng)中。換句話說,按照本發(fā)明的處理音頻數(shù)據(jù)的方法能廣泛地應用于無論是模擬系統(tǒng)或是數(shù)字系統(tǒng),與壓縮方法或編碼方法也無關,而只要重現(xiàn)裝置是涉及音頻數(shù)據(jù)處理的。這樣,就模擬系統(tǒng)的重現(xiàn)裝置而言,是使音頻信號變換成數(shù)字信號,實施按照本發(fā)明的RTTSM濾波處理,并將它再變換成模擬信號予以重現(xiàn)。
這類重現(xiàn)裝置可響應于用戶指定的重放速度值,從記錄媒體中讀出音頻信號。
圖13示出按照本發(fā)明的一種用以處理音頻數(shù)據(jù)的數(shù)字信號處理(DSP)板200的構成,它可以使用于模擬基重現(xiàn)裝置內(nèi)有代表性的諸如VCR系統(tǒng)的音頻/視頻重現(xiàn)裝置中,或是數(shù)字基重現(xiàn)裝置內(nèi)有代表性的DVD系統(tǒng)中,并能夠維持重現(xiàn)聲音的音調(diào)而不受指定的重放速度變化的影響。
母庸置疑,重現(xiàn)裝置中配備有一個重放速度控制部分,用于計算用戶指定的重放速度與正常重放速度之間的重放速度控制比α,以及計算正常重放模式的音頻數(shù)據(jù)呈現(xiàn)時間問隔乘上重放速度控制比α后的新呈現(xiàn)時間間隔。由鍵鈕輸入(未示出)和諸如是微計算機的控制器和CPU 230等組合成的構體,可以起重放速度控制部分的作用。
從硬件基礎的角度看,DSP板200可以由下列各部分構成ROM240;RAM(未示出),并通過規(guī)定RAM資源可在其中確保三個隊列;CPU 230或DSP芯片;振蕩器(未示出);模/數(shù)變換器(ADC)210;數(shù)/模變換器(DAC)220;以及其它等。實現(xiàn)RTTSM-calc功能的程序安裝在ROM 240中,RAM的工作可以實現(xiàn)輸入隊列Qx′、中間隊列Qy′和輸出隊列Qz′。對ADC 210供給以伺服系統(tǒng)100來的、記錄在錄像帶上的音頻信號,使它變換成數(shù)字數(shù)據(jù)。DAC 220將數(shù)字數(shù)據(jù)變換成模擬信號,使它能通過揚聲器300重現(xiàn)出聲音。CPU 230順序地執(zhí)行存儲在ROM 240中的安裝程序,以實施幾種數(shù)據(jù)處理,用于將ADC210的輸出數(shù)據(jù)寫入輸入隊列Qx′中,將積累在輸出隊列Qz′上的音頻數(shù)據(jù)傳輸給DAC 220,并且對積累在輸入隊列Qx′上的音頻數(shù)據(jù)實施上述的RTTSM-calc功能后得到的音頻數(shù)據(jù)進行WSOLA處理和下取樣/上取樣。當記錄在記錄媒體上的源信號象模擬VCR中那樣記錄成模擬信號時,ADC 210是必需的。但當源信號為DVD系統(tǒng)中那樣的數(shù)字信號時,就不需要ADC 210。
DSP板200由一個背景部分200a和一個前景部分200b組成。背景部分200a在硬件基礎上實現(xiàn)音頻數(shù)據(jù)處理的功能,將ADC 210的輸出數(shù)據(jù)寫入到輸入隊列Qx′中,并將積累在輸出隊列Qz′上的音頻數(shù)據(jù)傳輸給DAC 220。前景部分200b實現(xiàn)的功能是將實施WSOLA處理和下取樣/上取樣、并隨后針對輸入隊列Qx′中存儲的音頻數(shù)據(jù)按照程序執(zhí)行RTTSM-calc功能后得到的數(shù)據(jù),傳輸至輸出隊列Qz′中。也就是,背景部分200a在硬件基礎上起到前述的RTTSM-put功能和RTTSM-out功能的作用。換句話說,背景部分200a同時實現(xiàn)寫入操作和讀出操作,前者是將音頻信號供給部分100a或100b中的音頻數(shù)據(jù)以集合為單位寫入輸入隊列Qx′中,后者是以集合為單位讀出存儲在輸出隊列Qz′中的音頻數(shù)據(jù),并將輸出隊列Qz′中讀出的音頻數(shù)據(jù)變換成模擬信號。前景部分200b的作用是針對存儲在輸入隊列Qx′中的音頻數(shù)據(jù)應用一種諸如WSOLA的預定的TSM算法,以幀為單位實施TSM處理,以響應于指定之重放速度的快速或慢速狀態(tài)而對數(shù)據(jù)數(shù)量進行增加/減少,并對于根據(jù)指定的重放速度而通過TSM處理得到的音頻數(shù)據(jù)實施下取樣/上取樣,以使受到取樣后音頻數(shù)據(jù)的數(shù)量程度恢復至與傳輸至輸出隊列Qz′上的原來的音頻數(shù)據(jù)數(shù)量實質(zhì)上相同。
圖14(a)是一個流程圖,示明前景部分200b上的數(shù)據(jù)處理程序;圖14(b)是一個流程圖,示明背景部分200a上的數(shù)據(jù)處理程序;圖14(c)示明在前景部分200b與背景部分200a之間的切換關系。圖15是在應用中斷信號作為基準下關于背景部分200a和前景部分200b工作時間的定時圖。
在前景部分200b執(zhí)行諸如是TSM處理和上取樣/下取樣處理工作的同時,背景部分200a對用于實現(xiàn)此類處理的音頻數(shù)據(jù)的輸入/輸出進行控制。結果,前者要求的處理時間長于后者要求的處理時間。因此,希望CPU資源這樣地工作,即每當供給中斷信號時CPU 230將給出足以供執(zhí)行背景部分200a業(yè)務用的資源,同時由前景部分200b實現(xiàn)RTTSM-calc功能,并當中斷服務程序(ISR)完畢時,就在執(zhí)行上述的ISR之前通過返回到前景處理程序而繼續(xù)進行前景部分200b的處理。
參考圖14(a)和圖14(b),將更詳細地說明執(zhí)行前景部分200b和背景部分200a的程序。一旦開始重現(xiàn)工作,DSP板200上的CPU 230順序地讀出存儲在ROM 240中的程序,以實現(xiàn)重現(xiàn)出音頻數(shù)據(jù)的處理。首先,在步驟S60中,使輸入隊列Qx′、輸出隊列Qz′和實施WSOLA處理的各個環(huán)境參數(shù)初始化。
當通過對重現(xiàn)裝置中一個振蕩器所提供的時鐘信號計數(shù)而每個恒定周期上產(chǎn)生出中斷信號時,有著默認值為不啟動的一個ISR的值轉移至啟動上,在步驟S64至S72內(nèi),每當ISR被啟動時實現(xiàn)背景部分200a的數(shù)據(jù)處理。由于前景部分200b針對實現(xiàn)背景部分200a的ISR所得到的音頻數(shù)據(jù)實施濾波處理,所以在步驟S74上執(zhí)行一個無限循環(huán)的程序,直至下一幀開始標志符轉移入啟動狀態(tài)。
為了實施ISR處理,步驟S64上,CPU 230從ADC 210中取出一個集合的音頻數(shù)據(jù),并從諸如是鍵鈕輸入(未示出)的用戶界面上分別地取出由用戶指定的重放速度。步驟S66上,將ADC 210來的音頻數(shù)據(jù)寫入到輸入隊列Qx′中。在步驟S68和S70上,在寫入至輸入隊列Qx′中一個集合時積累地計數(shù)一個值,檢查一個計數(shù)值是否達到了包括在單個幀內(nèi)的總集合數(shù)目。如果是這樣,使初始設定于不啟動狀態(tài)的下一幀開始標志符的值轉移入啟動狀態(tài)。上面的處理等效于前述的RTTSM-put功能的處理。差別在于,ADC 210的輸出數(shù)據(jù)寫入在輸入隊列Qx′中。接著,步驟S72上,CPU 230訪問輸出隊列Qz′,以讀出存儲在那里的一個集合的音頻數(shù)據(jù),將它傳輸至DAC 220中。這種處理等效于RTTSM-out功能的處理。只當如圖15(b)中所示背景脈沖維持高電平時,才實現(xiàn)上面那樣的ISR處理。
與此同時,前景處理一旦起始后,設計成執(zhí)行一個無限循環(huán)的程序。更詳細地說,如果下一幀開始標志符的值設置為啟動狀態(tài),則在步驟S76上使下一幀開始標志符的值轉移成它的基本設定值即不啟動狀態(tài)。此后,在步驟S78上,按照前面的方法對于存儲在輸入隊列Qx′中的音頻數(shù)據(jù)執(zhí)行RTTSM-calc功能。然后,將處理好的音頻數(shù)據(jù)傳輸至輸出隊列Qz′中,并停留在那里直至輸出到DAC 220上。
當用戶指定重放速度為加快或減慢模式而不是正常模式時,通常的VCR系統(tǒng)以指定的重放速度從磁帶上讀出數(shù)據(jù),它就像通常的重現(xiàn)裝置從諸如是磁帶錄音機、DVCR和DVD之類的記錄媒體上讀出數(shù)據(jù)予以重現(xiàn)一樣。結果,供給至ADC 210的模擬音頻信號是在時間標度上已壓縮或擴展而其音調(diào)有變更的數(shù)據(jù),ADC 210的輸出信號只是改變成了數(shù)字數(shù)據(jù),仍保持著已改變的音調(diào)狀態(tài)原封不動。因此,ADC210的輸出數(shù)據(jù)可認為等效于在按照本發(fā)明實施RTTSM濾波處理之前存儲在緩存器24中的數(shù)據(jù)。這樣,在接收到這種數(shù)據(jù)以實現(xiàn)RTTSM-calc功能之后,形成的音頻信號所保持的音調(diào)實質(zhì)上與正常重放期間的音調(diào)相同,并且在與視頻信號的同步上不發(fā)生不協(xié)調(diào)性,其結果達到了本發(fā)明的目的。
另一方面,當應用于數(shù)字VCR系統(tǒng)時,整體的數(shù)據(jù)處理系統(tǒng)幾乎與前面的情況一樣,微小的差別只是在于,由于原來的信號是數(shù)字信號,所以DSP板200中不需要ADC 210。類似地,在DVD系統(tǒng)中,盡管存在著記錄媒體是DVD而不是磁帶的差異,但由于事實上原來的信號仍是數(shù)字信號,所以DSP板200的組成中也不需使用ADC 210,總的數(shù)據(jù)處理情況幾乎與前面的情況相同。
以上,按照本發(fā)明的一個方面,已經(jīng)給出了如下情況的說明,即按照指定的重放速度,通過對系統(tǒng)中各個音頻數(shù)據(jù)的呈現(xiàn)時間間隔值施加擴展/壓縮作用來重現(xiàn)音頻數(shù)據(jù)。按照上面的方法,由于應當對應于指定的呈現(xiàn)時間間隔來重現(xiàn)和輸出音頻數(shù)據(jù),所以對音頻數(shù)據(jù)進行下取樣或上取樣的處理是需要的。
然而,按照本發(fā)明的另一個方面,按照指定之重放速度的快速或慢速狀態(tài),對音頻輸出器20進行控制,以擴展/壓縮音頻數(shù)據(jù)的總體呈現(xiàn)時間,同時保持各個音頻數(shù)據(jù)的呈現(xiàn)時間間隔象正常重放速度的數(shù)值一樣。按照這個特性,在慢速重放模式或者快速重放模式的場合下,不需要下取樣或上取樣。更具體地是這樣控制的,以正常重放速度作為基準,響應于指定的重放速度值使音頻數(shù)據(jù)集合的總體呈現(xiàn)時間擴展/壓縮,而音頻數(shù)據(jù)的呈現(xiàn)時間間隔保持為正常重放速度的值。與此同時,通過應用上面說明的TSM算法對于音頻數(shù)據(jù)實施TSM處理,以根據(jù)用戶指定的重放速度值增加/減少數(shù)據(jù)數(shù)量。然后,在改變的呈現(xiàn)時間期內(nèi)控制受到TSM處理的音頻數(shù)據(jù),以其呈現(xiàn)時間間隔進行重現(xiàn)。對于重現(xiàn)該音頻信號的信號處理使用上述的前面那種方式予以實施之后,重現(xiàn)聲音的音調(diào)又保持與正常重放速度的音調(diào)實質(zhì)上相同,不受指定的重放速度值的影響。它們優(yōu)點在于,可以取消音頻數(shù)據(jù)的取樣,而能使聲音質(zhì)量較接近于原來的聲音。
按照上面所述的本發(fā)明,即使是用戶指定的重放速度是快速或慢速模式而不是正常重放速度,也可以這樣處理音頻數(shù)據(jù),通過用改變的呈現(xiàn)時間間隔進行重現(xiàn),能使重現(xiàn)聲音的音調(diào)與正常重放速度的音調(diào)實質(zhì)上相同。結果,它可以廣泛地應用于諸如是模擬VCR系統(tǒng)、數(shù)字VCR系統(tǒng)、計算機系統(tǒng)和DVD系統(tǒng)之類的多媒體重現(xiàn)裝置上,以所希望的重放速度同時重現(xiàn)音頻數(shù)據(jù)和視頻數(shù)據(jù),它給出的音調(diào)具有良好的質(zhì)量。
此外,按照本發(fā)明的音頻數(shù)據(jù)處理方法,可以獨立于視頻數(shù)據(jù)的處理予以實施。所以,它能廣泛應用于上面提到的幾種多媒體重現(xiàn)裝置中。換句話說,將其中配置有按照本發(fā)明對音頻數(shù)據(jù)實現(xiàn)濾波處理之方法的模塊,簡單地相加到各個媒體重現(xiàn)裝置的音頻信號處理模塊上,由此便能形成這樣的媒體重現(xiàn)裝置,它具有按照本發(fā)明音頻數(shù)據(jù)重現(xiàn)功能。
雖然,參照具體實施例已經(jīng)詳細地示明和敘述了本發(fā)明,但本技術領域內(nèi)的熟練人員知道,對此可在形式和細節(jié)上作出各種改變,它們偏離不開所附的權利要求書中確定的本發(fā)明的精神和范疇。
權利要求
1.一種響應于用戶指定的一個重放速度值而重現(xiàn)出原來音頻數(shù)據(jù)的方法,包含有步驟對于原來的音頻數(shù)據(jù)按照一種時間標度調(diào)制算法實施時間標度調(diào)制處理,以響應于重放速度值而增加或減少原來音頻數(shù)據(jù)的數(shù)量;以及對于根據(jù)指定的重放速度值而由時間標度調(diào)制處理得到的音頻數(shù)據(jù),進行下取樣或上取樣,以使恢復出的取樣的音頻數(shù)據(jù)數(shù)量與原來的音頻數(shù)據(jù)有同樣的程序,由此,當取樣的音頻數(shù)據(jù)以用戶指定的重放速度重現(xiàn)時,取樣的音頻數(shù)據(jù)的音調(diào)實質(zhì)上與原來音頻數(shù)據(jù)的音調(diào)相同。
2.權利要求1的音頻數(shù)據(jù)重現(xiàn)方法,還包含有步驟,每當指令重放速度改變時,按照指定的重放速度值重新計算要增加/減少的音頻數(shù)據(jù)的呈現(xiàn)時間間隔。
3.權利要求2的音頻數(shù)據(jù)重現(xiàn)方法,還包含有步驟,通過重新計算的呈現(xiàn)時間間隔重現(xiàn)出取樣的音頻數(shù)據(jù)。
4.權利要求1的音頻數(shù)據(jù)重現(xiàn)方法,其中,時間標度調(diào)制的步驟中包含有步驟將存儲在一個緩存器工具中的原來的音頻數(shù)據(jù)按每個預定的時間間隔以集合為單位寫入一個輸入隊列中;以及對存儲在輸入隊列中的音頻數(shù)據(jù)以幀為單位實施時間標度調(diào)制算法,當指定的重放速度快于正常重放速度時,根據(jù)指定的重放速度減少音頻數(shù)據(jù)的數(shù)量,當指定的重放速度慢于正常重放速度時,根據(jù)指定的重放速度增加音頻數(shù)據(jù)的數(shù)量,由此,將該音頻數(shù)據(jù)提供給一個中間隊列。
5.權利要求4的音頻數(shù)據(jù)重現(xiàn)方法,其中,取樣步驟中包含有對于存儲在中間隊列中的音頻數(shù)據(jù),當指定的重放速度快于正常重放速度時,對之實施上取樣處理,當指定的重放速度慢于正常重放速度時,對之實施下取樣處理,其中,要傳輸至一個輸出隊列中的取樣的音頻數(shù)據(jù)的數(shù)量變?yōu)閷嵸|(zhì)上與原來音頻數(shù)據(jù)的數(shù)量相同;以及將存儲在輸出隊列中的取樣的音頻數(shù)據(jù)按每個預定的時間間隔以集合為單位傳輸至緩存器工具中。
6.權利要求5的音頻數(shù)據(jù)重現(xiàn)方法,其中,通過控制一種隊列指針,使輸入隊列、中間隊列和輸出隊列之每一個的工作成為一個環(huán)形隊列。
7.權利要求5的音頻數(shù)據(jù)重現(xiàn)方法,其中,將輸出隊列中取樣的音頻數(shù)據(jù)覆蓋寫入到緩存器工具中,以替代緩存器工具中已存在的原來的音頻數(shù)據(jù)。
8.權利要求4的音頻數(shù)據(jù)重現(xiàn)方法,其中,呈現(xiàn)時間間隔是一種重新計算出的取樣音頻數(shù)據(jù)的呈現(xiàn)時間間隔,它是根據(jù)指定的重放速度值而變化的。
9.權利要求4的音頻數(shù)據(jù)重現(xiàn)方法,其中,寫入到輸入隊列中的原來音頻信號的集合數(shù)目是累加地計數(shù)的,當計數(shù)的集合數(shù)目變到等于一幀中集合的數(shù)目時,默認值為不啟動狀態(tài)的計算下一幀標志符便轉移到啟動狀態(tài),由此以幀為單位實施時間標度調(diào)制算法。
10.權利要求4的音頻數(shù)據(jù)重現(xiàn)方法,其中,在單聲道系統(tǒng)的場合下集合單元由一個音頻數(shù)據(jù)構成,在立體聲系統(tǒng)的場合下集合單元由左/右聲道的兩個音頻數(shù)據(jù)構成。
11.權利要求1的音頻數(shù)據(jù)重現(xiàn)方法,其中,在上取樣/下取樣中,按照指定的重放速度值計算出數(shù)據(jù)數(shù)量的一個變化比,由時間標度調(diào)制處理得到的音頻數(shù)據(jù)的數(shù)量根據(jù)該變化比而變更,但上取樣/下取樣之前和之后音頻數(shù)據(jù)的特性實質(zhì)上借助于應用一種內(nèi)插方法而保持相同。
12.權利要求1的音頻數(shù)據(jù)重現(xiàn)方法,其中,根據(jù)指定的重放速度值由時間標度調(diào)制算法增加或減少原來的音頻數(shù)據(jù)的數(shù)量,同時保持著原來的音頻數(shù)據(jù)的特性。
13.響應于用戶指定的重放速度,在將經(jīng)過MPEG系統(tǒng)中解碼而存儲在存儲器裝置中的解碼音頻數(shù)據(jù)供給至音頻輸出裝置之前,一種重現(xiàn)出解碼音頻數(shù)據(jù)的方法,包含有步驟計算出指定的重放速度與正常重放速度之間的重放速度控制比,將正常重放速度場合下解碼音頻數(shù)據(jù)的呈現(xiàn)時間間隔乘上該重放速度控制比,產(chǎn)生出音頻數(shù)據(jù)的一個新呈現(xiàn)時間間隔;將存儲在存儲器裝置中的解碼音頻數(shù)據(jù)以集合為單位寫入一個輸入隊列中;對于寫入在輸入隊列中的音頻數(shù)據(jù),以幀為單位實施一種時間標度調(diào)制算法,以便與重放速度控制比成比例地增加或減少解碼音頻數(shù)據(jù)的數(shù)量,然后,將經(jīng)過時間標度調(diào)制處理后的音頻數(shù)據(jù)寫入一個中間隊列中;對于寫入在中間隊列中的音頻數(shù)據(jù),在重放速度控制比小于1的快速重放模式場合下實施一種上取樣,在重放速度控制比大于1的慢速重放模式場合下實施一種下取樣,取樣方式中,所應用的取樣速率為重放速度控制比的倒數(shù),以做到實施取樣后的音頻數(shù)據(jù)的數(shù)量實質(zhì)上與解碼音頻數(shù)據(jù)的數(shù)量相同,再將取樣音頻數(shù)據(jù)傳輸至一個輸出隊列中;將存儲在輸出隊列中的音頻數(shù)據(jù)以集合為單位寫入至該存儲器裝置中,取代掉已存在的解碼音頻數(shù)據(jù);以及借助于所產(chǎn)生的呈現(xiàn)時間間隔重現(xiàn)出新寫入存儲器裝置中的音頻數(shù)據(jù),由此,即使指定的重放速度快于或慢于正常重放速度,重現(xiàn)聲音的音調(diào)實質(zhì)上與正常重放速度的音調(diào)相同。
14.權利要求13的音頻數(shù)據(jù)重現(xiàn)方法,其中,輸入隊列、中間隊列和輸出隊列之每一個的工作,通過對其控制一個隊列指針而如同一個環(huán)形隊列。
15.如權利要求13的音頻數(shù)據(jù)重現(xiàn)方法,其中,集合的單位在單聲道系統(tǒng)中由一個音頻數(shù)據(jù)組成,或是在立體聲系統(tǒng)中由左/右聲道的兩個音頻數(shù)據(jù)組成。
16.權利要求13的音頻數(shù)據(jù)重現(xiàn)方法,其中,在上取樣/下取樣中,各個音頻數(shù)據(jù)的幅度通過對于存儲在中間隊列中音頻數(shù)據(jù)的幅度并根據(jù)重放速度控制比所實施的一種內(nèi)插方法來確定,以使取樣之前和之后的音頻特性實質(zhì)上保持相同。
17.權利要求13的音頻數(shù)據(jù)重現(xiàn)方法,其中,時間標度調(diào)制算法根據(jù)指定的重放速度值而增加或減少解碼音頻數(shù)據(jù)的數(shù)量,以保持解碼音頻數(shù)據(jù)的特性。
18.一種根據(jù)用戶指定的重放速度值對受到濾波處理后的音頻數(shù)據(jù)進行重現(xiàn)的方法,包含有步驟響應于指定的重放速度值,增加或減少正常重放速度中音頻數(shù)據(jù)的呈現(xiàn)時間,并保持住音頻數(shù)據(jù)的呈現(xiàn)時間間隔具有正常重放速度的值;應用對于音頻數(shù)據(jù)的一種預定的時間標度調(diào)制算法實施時間標度調(diào)制處理,以根據(jù)指定的重放速度增加或減少音頻數(shù)據(jù)的數(shù)量;以及在改變的呈現(xiàn)時間期內(nèi)以該呈現(xiàn)時間間隔重現(xiàn)出從時間標度調(diào)制處理中得到的音頻數(shù)據(jù),由此,即使指定的重放速度快于或慢于正常重放速度,重現(xiàn)聲音的音調(diào)實質(zhì)上與正常重放速度的音調(diào)相同。
19.權利要求18的音頻數(shù)據(jù)重現(xiàn)方法,其中,預定的時間標度調(diào)制算法根據(jù)指定的重放速度值而增加或減少解碼音頻數(shù)據(jù)的數(shù)量,以保持解碼音頻數(shù)據(jù)的特性。
20.一種響應于用戶指定的重放速度值對音頻數(shù)據(jù)進行重現(xiàn)的裝置,包含有重放速度控制裝置,用于產(chǎn)生出指定的重放速度與正常重放速度之間的一個重放速度控制比,并將正常重放速度上音頻數(shù)據(jù)的呈現(xiàn)時間間隔乘以該重放速度控制比,以產(chǎn)生出一個新的呈現(xiàn)時間間隔;存儲器裝置,用于以包為單位存儲規(guī)定的音頻數(shù)據(jù);濾波裝置,用于對存儲在存儲器裝置中的音頻數(shù)據(jù)根據(jù)預定的時間標度調(diào)制算法實施時間標度調(diào)制處理,以便根據(jù)指定的重放速度值增加或減少音頻數(shù)據(jù)的數(shù)量,并對于從時間標度調(diào)制處理中得到的音頻數(shù)據(jù)根據(jù)指定的重放速度實施下取樣或上取樣,以將取樣音頻數(shù)據(jù)的數(shù)量恢復至與時間標度調(diào)制處理之前音頻數(shù)據(jù)的數(shù)量實質(zhì)上相同的程度,并將取樣的音頻數(shù)據(jù)寫入至存儲器裝置中以取代那里已存在的音頻數(shù)據(jù);以及音頻輸出裝置,用于以新的呈現(xiàn)時間間隔接收從存儲器裝置上來的濾波的音頻數(shù)據(jù),并將濾波的音頻數(shù)據(jù)重現(xiàn)成聲音。由此,即使指定的重放速度無論快于或慢于正常重放速度,以新的呈現(xiàn)時間間隔重現(xiàn)時重現(xiàn)聲音的音調(diào)實質(zhì)上與正常重放速度的音調(diào)相同。
21.權利要求20的音頻數(shù)據(jù)重現(xiàn)裝置,其中,預定的時間標度調(diào)制算法根據(jù)指定的重放速度值而增加或減少音頻數(shù)據(jù)的數(shù)量,以保持音頻數(shù)據(jù)的特性。
22.權利要求20的音頻信號重現(xiàn)裝置,其中,在上取樣/下取樣中,濾波裝置根據(jù)指定的重放速度值計算數(shù)據(jù)數(shù)量的變化比,并根據(jù)該變化比對通過時間標度調(diào)制處理后得到的音頻數(shù)據(jù)的數(shù)量進行變更,而保持住音頻數(shù)據(jù)在應用一種內(nèi)插方法進行上取樣/下取樣之前和之后它們的特性實質(zhì)上相同。
23.一種重現(xiàn)音頻信號的裝置,包含有音頻信號供給裝置,用以響應于用戶指定的重放速度值從記錄媒體中讀出并提供音頻信號;以及數(shù)字信號處理裝置,它具有一個背景部分和一個前景部分,背景部分一方面將音頻信號供給裝置來的音頻數(shù)據(jù)以集合為單位寫入輸入隊列,另一方面又在同樣的一個周期上以集合為單位讀出存儲在輸出隊列中的音頻數(shù)據(jù),并將輸出隊列中讀出的音頻數(shù)據(jù)變換成模擬信號,前景部分對于存儲在輸入隊列中的音頻數(shù)據(jù)以幀為單位應用一種預定的時間標度調(diào)制算法實施預定的時間標度調(diào)制,以便響應于指定的重放速度值通過對時間標度調(diào)制處理后得到的音頻數(shù)據(jù)根據(jù)指定的重放速度值實施下取樣或上取樣,使取樣音頻數(shù)據(jù)的數(shù)量恢復至與時間標度調(diào)制之前音頻數(shù)據(jù)的數(shù)量實質(zhì)上相同的程度,并將該取樣的音頻數(shù)據(jù)傳輸至輸出隊列中。
24.權利要求23的音頻數(shù)據(jù)重現(xiàn)裝置,其中,數(shù)字信號處理裝置中還包含有模擬/數(shù)字變換裝置,用于當從音頻信號處理裝置所加的音頻信號為模擬信號時,將音頻信號供給裝置與輸入隊列之間的模擬音頻信號變換成數(shù)字數(shù)據(jù)。
25.權利要求23的音頻數(shù)據(jù)重現(xiàn)裝置,其中,預定的時間標度調(diào)制算法根據(jù)指定的重放速度值而增加或減少音頻數(shù)據(jù)的數(shù)量,以保持音頻數(shù)據(jù)的特性。
26.權利要求23的音頻數(shù)據(jù)重現(xiàn)裝置,其中,在上取樣/下取樣中,數(shù)字信號處理裝置根據(jù)指定的重放速度值計算出數(shù)據(jù)數(shù)量的變化比,并根據(jù)該變化比對通過時間標度調(diào)制處理后得到的音頻數(shù)據(jù)的數(shù)量進行變更,以保持音頻數(shù)據(jù)在應用一種內(nèi)插方法進行上取樣/下取樣之前和之后它們的特性實質(zhì)上相同。
全文摘要
為了實施濾波處理,改變各個音頻數(shù)據(jù)的呈現(xiàn)時間間隔以符合于用戶指定的重放速度,使存儲于存儲器單元中解碼的音頻數(shù)據(jù)與改變的呈現(xiàn)時間間隔同步地以集合為單位寫入一個輸入隊列中。對輸入隊列中的音頻數(shù)據(jù)以幀為單位實施一種TSM算法,根據(jù)指定的重放速度,當指定的重放速度快于正常重放速度時減少音頻數(shù)據(jù)數(shù)量,或者當指定的重放速度慢于正常重放速度時增加音頻數(shù)據(jù)數(shù)量。
文檔編號G11B27/00GK1359231SQ01121929
公開日2002年7月17日 申請日期2001年6月20日 優(yōu)先權日2000年12月19日
發(fā)明者崔元龍, 李秉哲, 鄭尚憲, 崔元湜 申請人:株式會社考斯默坦