專利名稱:數(shù)據(jù)記錄和再現(xiàn)設(shè)備,記錄和再現(xiàn)數(shù)據(jù)的方法及其程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)記錄和再現(xiàn)設(shè)備,數(shù)據(jù)記錄和再現(xiàn)方法,及為此的程序,它們能夠接收通過對(duì)原始聲音信號(hào)編碼而產(chǎn)生的音頻數(shù)據(jù),并將音頻數(shù)據(jù)解碼為原始聲音信號(hào),以由此再現(xiàn)原始聲音信號(hào)。
背景技術(shù):
近些年,隨著數(shù)字消費(fèi)電子設(shè)備和個(gè)人計(jì)算機(jī)的普及,在磁盤或卡片形式的記錄介質(zhì)上記錄包括模擬電視廣播,數(shù)字電視廣播,無線電廣播,及其它形式,并再現(xiàn)它們的這一使用受到了更廣泛的認(rèn)同。在這些情況下,能夠在更短的時(shí)間內(nèi)觀看和收聽已記錄的內(nèi)容的要求在增加。響應(yīng)于該要求,設(shè)計(jì)了多種可變速的再現(xiàn)方法。在一種方法中,視頻或音頻數(shù)據(jù)以單一恒定間隔被削減。在另一方法中,數(shù)據(jù)以相應(yīng)于視頻和音頻內(nèi)容所具有的特征而以非恒定間隔被削減。
一種摘要再現(xiàn)技術(shù)已被公開,它通過對(duì)具有標(biāo)題的再現(xiàn)數(shù)據(jù)進(jìn)行分類,以高速回放概括的內(nèi)容,根據(jù)再現(xiàn)內(nèi)容的聲音所具有的特征以3種間隔再現(xiàn)例如,靜默間隔,音樂信號(hào)間隔,和語音信號(hào)間隔,并在選擇語音信號(hào)間隔的同時(shí),優(yōu)先再現(xiàn)內(nèi)容(例如,見參考專利1)。在參考專利1中,提出了在音頻輸入信號(hào)被壓縮和編碼之前,執(zhí)行FFT(快速傅立葉變換)處理的技術(shù)。尤其是,觀測(cè)在頻帶中的能量。在子區(qū)間中的特征被分類。而且,參考專利1提出了一種技術(shù),用于通過對(duì)由MPEG(運(yùn)動(dòng)圖象專家組)音頻技術(shù)編碼的數(shù)據(jù)進(jìn)行解碼,以產(chǎn)生子帶數(shù)據(jù)并觀測(cè)子帶具有的能量,從而來分類子區(qū)間所具有的特征。
在參考專利1所述的方法中,例如當(dāng)模擬音頻輸入信號(hào)是單一編碼、與視頻信號(hào)多路傳輸、并記錄在例如是硬盤的記錄介質(zhì)上時(shí),內(nèi)容的特征點(diǎn)能被提取。當(dāng)概括的內(nèi)容隨后再現(xiàn)時(shí),就能利用與特征點(diǎn)有關(guān)的信息。可選的,例如當(dāng)數(shù)字多路傳輸數(shù)據(jù)流由數(shù)字廣播傳送進(jìn)來時(shí),可以一次分離并解碼。生成的數(shù)據(jù)可以被再編碼及再次多路傳輸。然后,數(shù)據(jù)被記錄在記錄介質(zhì)上。此時(shí),內(nèi)容的特征點(diǎn)可以被提取并存儲(chǔ)。當(dāng)概括的內(nèi)容隨后再現(xiàn)時(shí),可以利用與特征點(diǎn)有關(guān)的信息。
參考專利1JP-A-10-247093(第 和 段)。
發(fā)明內(nèi)容
然而,在上面引用的參考專利1的方法中,在由數(shù)字廣播傳送進(jìn)來的數(shù)字多路傳輸數(shù)據(jù)流是一次分離并解碼的情況下,會(huì)產(chǎn)生以下問題。生成的數(shù)據(jù)被再編碼和再次多路傳輸,并記錄在記錄介質(zhì)上。這里聲音特征是根據(jù)編碼的音頻數(shù)據(jù)被分類的,由于數(shù)據(jù)已被解碼以及產(chǎn)生子帶數(shù)據(jù),計(jì)算量增大。這增大了設(shè)備的負(fù)擔(dān)。
另外,在參考專利1的方法中,例如當(dāng)由數(shù)字廣播傳送進(jìn)來的數(shù)字多路傳輸數(shù)據(jù)流被同時(shí)記錄在記錄介質(zhì)上而沒有修改格式時(shí),在記錄介質(zhì)上的其它數(shù)據(jù)(例如,不同的電視節(jié)目)被再現(xiàn)的情況下會(huì)產(chǎn)生另一個(gè)問題。在參考專利1的方法中,數(shù)據(jù)流被解碼以提取特征點(diǎn)。在再現(xiàn)過程中,解碼器被對(duì)其它數(shù)據(jù)流進(jìn)行解碼的處理所占用。因此,就有可能不能實(shí)時(shí)提取當(dāng)前記錄內(nèi)容所具有的特征點(diǎn)。從而就存在問題,即當(dāng)所記錄的數(shù)據(jù)的概括內(nèi)容被再現(xiàn)時(shí),就不可能再執(zhí)行與內(nèi)容所具有的特征相對(duì)應(yīng)的摘要的再現(xiàn)。
以上所指的“摘要再現(xiàn)”的意思是數(shù)據(jù)的概括內(nèi)容被再現(xiàn)。另外,“摘要再現(xiàn)”的意思是內(nèi)容被部分省略并以比通常更短的時(shí)間內(nèi)再現(xiàn)。
鑒于前述的情況,就希望提供一種數(shù)據(jù)記錄和再現(xiàn)設(shè)備,數(shù)據(jù)記錄和再現(xiàn)方法,及其程序,它們能夠提取數(shù)據(jù)內(nèi)容的特征點(diǎn)而又不增大計(jì)算量。
還希望提供一種技術(shù),當(dāng)其它數(shù)據(jù)在記錄音頻數(shù)據(jù)的過程中被再現(xiàn)時(shí),它能夠提取被記錄的數(shù)據(jù)內(nèi)容的特征點(diǎn)。
與本發(fā)明的一實(shí)施例相關(guān)的一種數(shù)據(jù)記錄和再現(xiàn)設(shè)備,它適用于接收音頻數(shù)據(jù),該數(shù)據(jù)由對(duì)原始聲音信號(hào)進(jìn)行編碼而產(chǎn)生,并將音頻數(shù)據(jù)解碼為原始聲音信號(hào)從而再現(xiàn)它。該數(shù)據(jù)記錄和再現(xiàn)設(shè)備具有數(shù)據(jù)存儲(chǔ)裝置,用于存儲(chǔ)音頻數(shù)據(jù);特征點(diǎn)信息產(chǎn)生裝置,用于通過從存儲(chǔ)在數(shù)據(jù)存儲(chǔ)裝置的音頻數(shù)據(jù)中提取與由原始聲音信號(hào)所指示的聲音特征有關(guān)的信息,并通過基于提取的有關(guān)于特征的信息而產(chǎn)生特征點(diǎn)信息從而產(chǎn)生與特征點(diǎn)有關(guān)的信息;及變速再現(xiàn)裝置,用于通過對(duì)音頻數(shù)據(jù)解碼并基于特征點(diǎn)信息削減解碼后的音頻數(shù)據(jù),從而以變化的速度再現(xiàn)原始聲音信號(hào)。
在本發(fā)明的該實(shí)施例中,與由原始聲音信號(hào)所指明的聲音特征有關(guān)的信息從編碼后的音頻數(shù)據(jù)中被提取?;谔崛〉呐c特征有關(guān)的信息,產(chǎn)生與特征點(diǎn)有關(guān)的信息,而無需執(zhí)行解碼操作。與相關(guān)技術(shù)相比,這減少了計(jì)算量。另外,即使以前記錄的其它數(shù)據(jù)正在再現(xiàn),也能提取當(dāng)前記錄的數(shù)據(jù)內(nèi)容的特征點(diǎn)。
特別地,如果用于編碼的編解碼器用MPEG1,MPEG2或類似方式來編碼,指明每個(gè)頻帶中的聲壓級(jí)的“特征點(diǎn)信息”就是“比例因子(在下文中縮寫為SF)”。此處的編解碼器是杜比數(shù)字(AC(音頻編碼)-3)系統(tǒng),在每個(gè)頻帶中指示聲壓級(jí)的“特征點(diǎn)信息”是“指數(shù)”?!芭c聲音特征有關(guān)的信息”的實(shí)例包括聲壓級(jí),頻率,和相位。
“原始聲音信號(hào)”的意思是人能感知的模擬性質(zhì)的信號(hào)或?qū)⒛M信號(hào)通過PCM(脈沖編碼調(diào)制)編碼而獲得的數(shù)字信號(hào)。原始聲音信號(hào)的編碼處理(壓縮編碼)并不總是由該數(shù)據(jù)記錄和再現(xiàn)設(shè)備來完成。例如,也可以想到模擬信號(hào)已經(jīng)由一外部裝置預(yù)先編碼或模擬信號(hào)已經(jīng)預(yù)先完成編碼,例如數(shù)字廣播的內(nèi)容。
更特別的,該數(shù)據(jù)記錄和再現(xiàn)設(shè)備進(jìn)一步包括再現(xiàn)裝置,用于通過從數(shù)據(jù)存儲(chǔ)裝置讀取音頻數(shù)據(jù)而再現(xiàn)原始聲音信號(hào),并在解碼音頻數(shù)據(jù)的同時(shí)以正常速度再現(xiàn)原始聲音信號(hào);及緩沖器控制器,用于提供對(duì)讀取音頻數(shù)據(jù)和存儲(chǔ)特征點(diǎn)信息的并行控制。
當(dāng)原始聲音信號(hào)通過變速再現(xiàn)裝置以變化的速度再現(xiàn)時(shí),特征點(diǎn)信息可以由特征點(diǎn)信息產(chǎn)生裝置實(shí)時(shí)產(chǎn)生??蛇x的,如稍后所述,特征點(diǎn)信息可以由特征點(diǎn)信息存儲(chǔ)裝置存儲(chǔ),存儲(chǔ)的特征點(diǎn)信息可以在以變化的速度再現(xiàn)時(shí)被使用。
在本發(fā)明的實(shí)施例中,當(dāng)原始聲音信號(hào)被再現(xiàn)時(shí),可以僅要求人能夠聽到原始聲音。當(dāng)然,本發(fā)明的思想包括原始聲音沒有通過解碼而被完全重建的情況。即根據(jù)本發(fā)明的實(shí)施例的編解碼過程可以是可逆的或不可逆的。只要由原始聲音信號(hào)指示的與聲音特征有關(guān)的信息保留在由對(duì)原始聲音信號(hào)編碼而獲得的音頻信號(hào)中,任何類型的編解碼過程都能被使用,即使該信號(hào)沒有被解碼。
“數(shù)據(jù)存儲(chǔ)裝置”可以是能夠存儲(chǔ)數(shù)據(jù)的任何介質(zhì)。數(shù)據(jù)存儲(chǔ)裝置的實(shí)例包括磁盤(例如硬盤),使用半導(dǎo)體或介電物質(zhì)的固態(tài)存儲(chǔ)器,CD(光盤),DVD(數(shù)字通用光盤),藍(lán)光光盤,通過例如是全息術(shù)的光學(xué)方法能夠記錄數(shù)據(jù)的其它光盤,MO(磁光盤),MD(微光盤),和其它磁光盤。相同的約定適用于下文所述的每個(gè)存儲(chǔ)裝置。
當(dāng)然,這里假定特征點(diǎn)信息產(chǎn)生裝置能夠從模擬信號(hào)或數(shù)字信號(hào)中提取與特征有關(guān)的信息,并產(chǎn)生特征點(diǎn)信息。
在本發(fā)明的實(shí)施例中,特征點(diǎn)信息產(chǎn)生裝置產(chǎn)生與聲音存在或不存在有關(guān)的信息,以作為特征點(diǎn)信息。例如,在此情況下,變速再現(xiàn)裝置能以變化的速度執(zhí)行再現(xiàn)過程,同時(shí)優(yōu)選地拾取有聲音的部分。特征點(diǎn)信息可以包括存在或不存在人的聲音的有關(guān)信息。因此,例如變速再現(xiàn)裝置能以變化的速度執(zhí)行再現(xiàn)過程,以使得只有人的聲音被拾取。
在本發(fā)明的實(shí)施例中,特征點(diǎn)信息產(chǎn)生裝置以固定的時(shí)間間隔產(chǎn)生特征點(diǎn)信息。在本發(fā)明的實(shí)施例中,例如在音頻與視頻一起再現(xiàn)的情況下,如果“固定的間隔”被縮短,就能產(chǎn)生在使用者看來視頻和音頻以變化的速度再現(xiàn)時(shí)會(huì)同步得更好的優(yōu)勢(shì),因此減小了帶給使用者的不匹配的感覺。反過來說,如果間隔是相對(duì)較短的時(shí)間,如10秒,30秒,或1分鐘,假如視頻和聲音不同步,也會(huì)帶給使用者較小的不匹配的感覺。也就是說,如果音頻被中斷,就會(huì)產(chǎn)生不匹配的感覺。在絕大多數(shù)情況下,視頻變化是恒定的。在每個(gè)指定的時(shí)間中,可以只要求視頻和音頻在某種程度上同步。反過來說,音頻被拾取以使得使用者能聽清楚它,并且在該間隔中的圖像被完全顯示使視頻與音頻同步,則視頻容易被使用者看到。
在本發(fā)明的實(shí)施例中,數(shù)據(jù)記錄和再現(xiàn)設(shè)備進(jìn)一步包括特征點(diǎn)信息存儲(chǔ)裝置,用于以與具有相應(yīng)于特征點(diǎn)信息的特征信息的音頻數(shù)據(jù)對(duì)應(yīng)的方式存儲(chǔ)所產(chǎn)生的特征點(diǎn)信息。特征點(diǎn)信息產(chǎn)生裝置可以在編碼的音頻數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)存儲(chǔ)裝置之前,產(chǎn)生特征點(diǎn)信息??蛇x的,在編碼的音頻數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)存儲(chǔ)裝置之后,特征點(diǎn)信息產(chǎn)生裝置可以在從數(shù)據(jù)存儲(chǔ)裝置讀取音頻數(shù)據(jù)的同時(shí)產(chǎn)生特征點(diǎn)信息。在此情況下,特征點(diǎn)信息可以隨后存儲(chǔ)到特征點(diǎn)信息存儲(chǔ)裝置中。
“特征點(diǎn)信息存儲(chǔ)裝置”和數(shù)據(jù)存儲(chǔ)裝置可以共用相同的物理存儲(chǔ)介質(zhì),或它們可以是不同的存儲(chǔ)介質(zhì)。
根據(jù)本發(fā)明的一實(shí)施例的一種數(shù)據(jù)記錄和再現(xiàn)方法適用于接收音頻數(shù)據(jù),該音頻數(shù)據(jù)由原始聲音信號(hào)經(jīng)編碼產(chǎn)生,并通過將音頻數(shù)據(jù)解碼為原始聲音信號(hào)來再現(xiàn)音頻數(shù)據(jù),該方法包括下列步驟存儲(chǔ)音頻數(shù)據(jù);從存儲(chǔ)的音頻數(shù)據(jù)中提取與由原始聲音信號(hào)所指示的聲音特征有關(guān)的信息;基于提取的與特征有關(guān)的信息產(chǎn)生特征點(diǎn)信息;對(duì)音頻數(shù)據(jù)解碼;及基于特征點(diǎn)信息削減解碼的音頻數(shù)據(jù),從而使用產(chǎn)生的特征點(diǎn)信息以變化的速度再現(xiàn)原始聲音信號(hào)。
如至此所述的,根據(jù)本發(fā)明的實(shí)施例,即使其它數(shù)據(jù)在記錄音頻數(shù)據(jù)的過程中被再現(xiàn),被記錄的數(shù)據(jù)內(nèi)容的特征點(diǎn)也能被提取,而不會(huì)增大計(jì)算量。
圖1是示出與本發(fā)明的一實(shí)施例相關(guān)的數(shù)據(jù)記錄和再現(xiàn)設(shè)備的配置的框圖。
圖2是示出SF提取電路配置的框圖。
圖3是示出通過SF提取電路處理的在MPEG音頻ES中的SF(比例因子)和特征點(diǎn)文件之間關(guān)系的簡(jiǎn)圖。
圖4是示出MPEG音頻/視頻解碼器配置的框圖。
圖5是示出通過使圖4中所示的削減電路使用在記錄時(shí)產(chǎn)生并存儲(chǔ)在HDD中的特征點(diǎn)文件,來再現(xiàn)包含有優(yōu)先權(quán)的音頻的間隔,以實(shí)現(xiàn)倍速再現(xiàn)的方法的簡(jiǎn)圖。
具體實(shí)施例方式
在下文本發(fā)明的實(shí)施例中參照附圖來加以說明。
圖1是示出與本發(fā)明的一實(shí)施例相關(guān)的數(shù)據(jù)記錄和再現(xiàn)設(shè)備的配置的框圖。數(shù)據(jù)記錄和再現(xiàn)設(shè)備100,是能夠記錄模擬電視廣播,數(shù)字電視廣播,和其它廣播并再現(xiàn)所記錄的數(shù)據(jù)的設(shè)備。
系統(tǒng)控制器10控制數(shù)據(jù)記錄和再現(xiàn)設(shè)備100的各部件。系統(tǒng)控制器10根據(jù)需要,通過主機(jī)總線獲得對(duì)ROM(只讀存儲(chǔ)器)11和RAM(隨機(jī)存取存儲(chǔ)器)12的存取,從而這樣來控制整個(gè)設(shè)備。
現(xiàn)在假定一個(gè)模擬廣播信號(hào)通過模擬調(diào)諧器14而提供。當(dāng)這種模擬廣播被記錄時(shí)要使用一些部件。這些部件及其功能在下面說明。
模擬調(diào)諧器14將視頻和音頻信號(hào)提供給切換電路15,信號(hào)通過天線13輸入。還從外部提供給輸入切換電路15一個(gè)復(fù)合視頻信號(hào)和一個(gè)音頻信號(hào)。在系統(tǒng)控制器10的控制下,輸入切換電路15將該復(fù)合視頻信號(hào)提供給Y/C分離電路16,將該音頻信號(hào)提供給音頻A/D(模擬/數(shù)字)轉(zhuǎn)換器22。
Y/C分離電路16執(zhí)行復(fù)合視頻信號(hào)的Y/C分離,并將Y/C的輸出提供給切換電路17。在系統(tǒng)控制器10的控制下,切換電路17選擇從外部來的S-視頻信號(hào)或Y/C分離電路16的輸出。選擇的視頻信號(hào)被提供給NTSC(全國電視系統(tǒng)委員會(huì))解碼器18。
NTSC解碼器18執(zhí)行對(duì)所提供的視頻信號(hào)的A/D轉(zhuǎn)換和色度解碼,將視頻信號(hào)轉(zhuǎn)換為數(shù)字構(gòu)成的視頻數(shù)據(jù)(下文中稱作視頻數(shù)據(jù)),并將該視頻數(shù)據(jù)提供給視頻處理電路20。NTSC解碼器18還將時(shí)鐘信號(hào),水平和垂直同步信號(hào),及場(chǎng)譽(yù)別信號(hào)提供給同步控制電路19。時(shí)鐘信號(hào)基于所提供的視頻信號(hào)的水平同步信號(hào)而產(chǎn)生。水平和垂直同步信號(hào)通過同步分離而獲得。同步控制電路19產(chǎn)生時(shí)鐘和基于那些信號(hào)而生成的同步信號(hào),以使時(shí)鐘和同步信號(hào)選擇在部件(隨后說明)需要的定時(shí)出現(xiàn)。時(shí)鐘和同步信號(hào)提供給這些部件。
視頻處理電路20在提供的視頻數(shù)據(jù)上執(zhí)行各種視頻處理任務(wù),例如預(yù)濾波和將處理后的視頻數(shù)據(jù)提供給MPEG(運(yùn)動(dòng)圖象專家組)視頻編碼器21和視頻處理電路29。
MPEG視頻編碼器21對(duì)從視頻處理電路20而來的視頻數(shù)據(jù)進(jìn)行編碼或處理(例如部件DCT(離散余弦變換)),以產(chǎn)生視頻基本流(ES),并將視頻ES提供給多路傳輸/多路分離電路25。在該實(shí)施例中,使用了MPEG壓縮方法,但也能夠使用其它壓縮方法。
另一方面,音頻A/D轉(zhuǎn)換器22將由輸入切換電路15選擇的音頻信號(hào)轉(zhuǎn)換為數(shù)字音頻數(shù)據(jù),并將音頻數(shù)據(jù)提供給MPEG音頻編碼器23和切換電路32。MPEG音頻編碼器23按照MPEG格式壓縮從音頻A/D轉(zhuǎn)換器22而來的音頻數(shù)據(jù),然后產(chǎn)生音頻ES流,并將其提供給多路傳輸/信號(hào)分離電路25。
在至此提供的該實(shí)施例的說明中,視頻和音頻數(shù)據(jù)按照MPEG格式壓縮??蛇x的,它們也可以按照其它壓縮格式來壓縮或不壓縮。
多路傳輸/多路分離電路25多路傳輸視頻ES,音頻ES,和各種控制信號(hào),以產(chǎn)生傳輸流(TS),并將其提供給緩沖器控制電路26。緩沖器控制電路26提供控制,以使連續(xù)輸入的TS以數(shù)據(jù)包發(fā)送到下一級(jí)的HDD(硬盤驅(qū)動(dòng)器)27。例如,由于在HDD27的查找操作時(shí)不允許寫入TS,緩沖器控制電路26能在緩沖器(為示出)中暫時(shí)存儲(chǔ)該TS,如果可以寫入,該TS就以高于輸入速度的速度寫入HDD27。因此,連續(xù)輸入的TS能不中斷地記錄在HDD27上。HDD27在系統(tǒng)控制器10的控制下,在指定的地址記錄TS。
SF(比例因子)提取電路35分析從多路傳輸/多路分離電路25經(jīng)緩沖器控制電路26發(fā)送到HDD27的TS,在MPEG音頻ES中提取SF,并產(chǎn)生與特征點(diǎn)信息有關(guān)的特征點(diǎn)文件。在系統(tǒng)控制器10的控制下,所產(chǎn)生的特征點(diǎn)文件經(jīng)由緩沖器控制電路26被記錄在HDD27的指定地址上。SF提取電路35將在稍后詳述。
在本實(shí)施例中,IDE(智能驅(qū)動(dòng)電子設(shè)備)被用作緩沖器控制電路26和HDD27的協(xié)議。本發(fā)明并不限于此。而且,在該實(shí)施例中,HDD被用作記錄介質(zhì)的一個(gè)實(shí)例。也可以使用其它記錄介質(zhì),例如光盤,磁光盤,或固態(tài)存儲(chǔ)器。
接下來說明在再現(xiàn)過程中使用的部件及其功能。HDD27在系統(tǒng)控制器10的控制下查找一指定的地址,讀出TS,并將其提供給緩沖器控制電路26。緩沖器控制電路26控制緩沖器,使以數(shù)據(jù)包傳入的TS變成連續(xù)的,并將該TS提供給多路傳輸/信號(hào)分離電路25。多路傳輸/多路分離電路25從該TS提取打包的基本流(PES),并將其提供給MPEG音頻/視頻解碼器28。
MPEG音頻/視頻解碼器28將所提供打包的ES分離為視頻ES和音頻ES,它被分別提供給MPEG視頻解碼器(未示出)和MPEG音頻解碼器(未示出)。視頻和音頻ES隨后被解碼。從而得到在基帶中的視頻數(shù)據(jù)和音頻數(shù)據(jù)。MPEG音頻/視頻解碼器28將視頻數(shù)據(jù)和音頻數(shù)據(jù)分別提供給視頻后處理電路29和切換電路32。如稍后所述,MPEG音頻/視頻解碼器28利用特征點(diǎn)文件來削減解碼的數(shù)據(jù)以用于變速再現(xiàn)。
視頻后處理電路29在從MPEG音頻/視頻解碼器28而來的視頻數(shù)據(jù)和從視頻處理電路20而來的視頻數(shù)據(jù)之間切換,把它們合并,或?qū)ζ錇V波。后處理電路29將視頻數(shù)據(jù)提供給屏幕顯示(OSD)30。OSD30執(zhí)行處理以產(chǎn)生用于圖像顯示的圖形,并將產(chǎn)生的圖形疊加到視頻數(shù)據(jù)上或部分顯示該圖形。處理后的視頻數(shù)據(jù)被提供給NTSC編碼器31。NTSC編碼器31將提供的視頻數(shù)據(jù)(數(shù)字構(gòu)成視頻數(shù)據(jù))轉(zhuǎn)換為Y/C信號(hào),并執(zhí)行D/A轉(zhuǎn)換,從而獲得模擬復(fù)合視頻信號(hào)和S-視頻信號(hào)。
另一方面,切換電路32選擇從MPEG音頻/視頻編碼器28而來的音頻數(shù)據(jù)和從音頻A/D轉(zhuǎn)換器22而來的音頻數(shù)據(jù)中的任意一個(gè),并將選擇的數(shù)據(jù)提供給音頻D/A轉(zhuǎn)換器33。音頻D/A轉(zhuǎn)換器33將所提供的音頻數(shù)據(jù)轉(zhuǎn)換為模擬音頻信號(hào)。
接下來說明從數(shù)字IN/OUT39提供的外部數(shù)字信號(hào)和從數(shù)字IN/OUT39輸出到外部的數(shù)字信號(hào)。
例如,通過例如是IEEE-1394端口的數(shù)字接口從外部IRD(集成接收解碼器)輸入的數(shù)字?jǐn)?shù)據(jù)被記錄,該數(shù)字?jǐn)?shù)據(jù)輸入數(shù)字接口電路24。通過執(zhí)行例如在數(shù)字?jǐn)?shù)據(jù)上的格式化轉(zhuǎn)換的處理,以使數(shù)據(jù)與本方法匹配,數(shù)字接口電路24從而產(chǎn)生一TS。該TS提供給多路傳輸/信號(hào)分離電路25。多路傳輸/多路分離電路25分析并產(chǎn)生一控制信號(hào),將該控制信號(hào)轉(zhuǎn)換為與本方法相匹配的TS,并將該TS提供給緩沖器控制電路26。由于隨后的處理與前述的處理相同,其說明被省略。
在再現(xiàn)過程中,一直到多路傳輸/多路分離電路25的處理與上述的處理相同,因此其說明被省略。如有必要,多路傳輸/多路分離電路25分析并產(chǎn)生控制信號(hào),將一TS提供給數(shù)字接口電路24。數(shù)字接口電路24執(zhí)行與在記錄時(shí)執(zhí)行的轉(zhuǎn)換相反的轉(zhuǎn)換,以將數(shù)據(jù)轉(zhuǎn)換為與外部IRD相匹配的數(shù)字?jǐn)?shù)據(jù),并輸出該數(shù)字?jǐn)?shù)據(jù)。同時(shí),多路傳輸/多路分離電路25執(zhí)行分離處理,并將一個(gè)打包的ES提供給MPEG音頻/視頻解碼器28。因此,能夠獲得模擬視頻和音頻信號(hào)。
在該實(shí)施例中,描述了與IRD的連接。與例如是電視接收機(jī)的AV裝置和個(gè)人電腦的連接也是可能的。
接下來說明當(dāng)用數(shù)字調(diào)諧器36記錄和再現(xiàn)數(shù)字廣播時(shí)所用的功能。
在此由數(shù)字廣播發(fā)送來的TS和ES通過MPEG視頻編碼器21或MPEG音頻編碼器23被再編碼并被記錄,而不是直接將TS和ES記錄在HDD27上,從數(shù)字調(diào)諧器36輸出的TS通過緩沖器控制電路26,被提供給SF提取電路35和多路傳輸/多路分離電路25,其原因如下述。TS例如是數(shù)字廣播的流格式,它被轉(zhuǎn)換為供DVD用的PS(節(jié)目流)格式。因此,數(shù)字廣播的數(shù)據(jù)流能被記錄在DVD上。
如前所述,SF提取電路35分析該TS,從音頻ES中提取SF,并產(chǎn)生一特征點(diǎn)文件。在系統(tǒng)控制器10的控制下,產(chǎn)生的特征點(diǎn)文件通過緩沖器控制電路26被記錄在HDD27的一指定地址上。SF的提取和特征點(diǎn)文件的產(chǎn)生隨后說明。對(duì)于SF提取和特征點(diǎn)文件的產(chǎn)生,在上述的用外部IRD從數(shù)字IN/OUT39輸入來執(zhí)行記錄的情況中,說明被省略了。但在該情況下,操作與當(dāng)使用模擬調(diào)諧器14或數(shù)字調(diào)諧器36時(shí)所執(zhí)行的操作相同。
回到原來的說明,多路傳輸/多路分離電路25從由緩沖器控制電路26提供的TS中提取PES(打包的基本流),并將該P(yáng)ES提供給MPEG音頻/視頻解碼器28。
音頻/視頻解碼器28將輸入的PES分離為視頻ES和音頻ES,并將它們分別提供給MPEG視頻解碼器和MPEG音頻解碼器。完成了與數(shù)字廣播中所用的編碼方法相匹配的解碼。在該實(shí)施例中,MPEG音頻被用作數(shù)字廣播的音頻ES種類的一個(gè)實(shí)例。其它壓縮方案也是可以得到的。從而,在基帶中的圖像數(shù)據(jù)和音頻數(shù)據(jù)被獲得,并分別提供給MPEG視頻編碼器21和MPEG音頻編碼器23。
MPEG視頻編碼器21執(zhí)行MPEG視頻編碼,產(chǎn)生視頻ES,并將該ES提供給多路傳輸/信號(hào)分離電路25。MPEG音頻編碼器23執(zhí)行MPEG音頻編碼,產(chǎn)生音頻ES,并將其提供給多路傳輸/信號(hào)分離電路25。
多路傳輸/多路分離電路25把輸入的MPEG視頻ES和MPEG音頻ES合并,對(duì)它們作多路傳輸,產(chǎn)生用于MPEG系統(tǒng)的TS,并將該TS提供給緩沖器控制電路26。
緩沖器控制電路26控制該TS,它從多路傳輸/多路分離電路25連續(xù)地輸入,并將該TS以數(shù)據(jù)包發(fā)送到其后的級(jí)HDD27,在HDD27上記錄該TS。
同時(shí),由數(shù)字廣播發(fā)送來的TS和ES被直接記錄在HDD27上,無需對(duì)其再編碼,由數(shù)字調(diào)諧器36而來的TS格式的輸出通過緩沖器控制電路26而提供給SF提取電路35和HDD27。
同時(shí),在該情況下,SF提取電路35同樣的分析該TS,以在數(shù)字廣播中所用的壓縮格式從音頻ES提取SF,并產(chǎn)生特征點(diǎn)文件。在系統(tǒng)控制器10的控制下,通過緩沖器控制電路26,產(chǎn)生的特征點(diǎn)文件被記錄在HDD27的指定地址上。HDD27將從緩沖器控制電路26以數(shù)據(jù)包輸入的TS和特征點(diǎn)文件記錄在HDD27上。
圖2是示出SF提取電路35的配置的框圖。
分離電路43分離從緩沖器控制電路26輸入的TS,提取MPEG音頻的PES,并將PES提供給MPEG音頻分析器44。也就是說,分離電路43具有多路傳輸/多路分離電路25的一些功能。
MPEG音頻分析器44分析從分離電路43輸入的MPEG音頻的PES,從PES提取指示再現(xiàn)時(shí)間的PTS(顯現(xiàn)時(shí)間標(biāo)記),從MPEG音頻ES內(nèi)的每個(gè)子帶提取SF,并將它們提供給特征點(diǎn)文件產(chǎn)生電路45。
特征點(diǎn)文件產(chǎn)生電路45產(chǎn)生與從MPEG音頻分析器44輸入的PTS和SF中收集的音頻內(nèi)容的特征有關(guān)的一個(gè)特征點(diǎn)文件。該音頻內(nèi)容包括含有語音波段成分的時(shí)間段,例如人的聲音,含有除人的聲音之外的聲音的非語音波段成分的聲音間隔,及不含有聲音的靜默間隔。在系統(tǒng)控制器10的控制下,產(chǎn)生的特征點(diǎn)文件通過緩沖器控制電路26被記錄在HDD27的指定地址上。
在本發(fā)明中,存儲(chǔ)的特征點(diǎn)文件的內(nèi)容指示含有音頻成分的時(shí)間段和靜默時(shí)間段。還可以想得到例如在MPEG音頻ES中完整地存儲(chǔ)SF。特征點(diǎn)文件的內(nèi)容不限于如本發(fā)明中所述的音頻內(nèi)容的特征。例如,該內(nèi)容還可以包括同時(shí)存儲(chǔ)的視頻內(nèi)容的特征和指示是否存在雙語廣播的特征。
圖3是示出通過SF提取電路35處理的在MPEG音頻ES中的SF和特征點(diǎn)文件之間的關(guān)系的簡(jiǎn)圖。
在圖3中部示出的三維柱狀圖指示圖3中作為實(shí)例在某些子帶(頻帶)中的,在一個(gè)確定的再現(xiàn)時(shí)間期間2T內(nèi)包含在MPEG音頻ES中的SF值。橫軸表明時(shí)間??v軸表明由SF指定的聲壓級(jí)。從左側(cè)近端向右側(cè)遠(yuǎn)端傾斜延伸的軸指示子帶。也就是說,與9個(gè)音頻幀相對(duì)應(yīng)的,在該時(shí)間期間出現(xiàn)的三個(gè)確定的子帶所具有的SF值以三維圖示出。
在圖3中,示出了三個(gè)子帶。在實(shí)際的MPEG兼容系統(tǒng)中具有32個(gè)子帶。子帶的數(shù)量并不限于這些數(shù)值。所示的2T大約是10秒到3分鐘,更優(yōu)選的從30秒到2分鐘,再優(yōu)選的是大約1分鐘。但2T并不限于這些數(shù)值。
在圖3中部示出的SF值已經(jīng)通過圖3上部所示的波形算出。也就是說,與在中部的SF值一起,還沒有經(jīng)過MPEG音頻編碼的聲音波形被示在圖3上部的時(shí)間軸上。在圖中所示的前半段時(shí)間范圍內(nèi),存在具有相對(duì)的高頻成分的聲音。在后半段,存在相對(duì)的低頻成分。由于SF被用來顯示在每個(gè)子帶所具有的頻帶中的最大聲壓程度,在前半段具有相對(duì)的高頻成分的時(shí)間軸聲音波形是位于圖3中部遠(yuǎn)端的三維柱狀圖,即是在相對(duì)的高頻波段被指定的子帶內(nèi)的SF值的累加值。同時(shí),在后半段具有相對(duì)的低頻成分的時(shí)間軸波形是位于圖3中部近端的三維柱狀圖,即是在相對(duì)的低頻波段被指定的子帶內(nèi)的SF值的累加值。相對(duì)于在圖3上部的時(shí)間軸波形的實(shí)例,前后兩半段具有相同的波形振幅。因此,在圖3中部顯示SF值的柱形在前后半段具有相同的高度(長(zhǎng)度)。
在圖3下部是示出特征點(diǎn)文件產(chǎn)生電路45如何從在圖3中部所示的MPEG音頻ES中的SF值提取特征點(diǎn),及該特征點(diǎn)如何作為特征點(diǎn)文件被記錄在HDD27上的簡(jiǎn)圖。該下部具有與圖3的上部和中部相同的時(shí)間軸刻度。然而,在前半段,在相對(duì)的高頻成分被指定為子帶中的SF值增大了數(shù)值。因此,該內(nèi)容具有相對(duì)高頻的聲音。特征點(diǎn)文件產(chǎn)生電路45將這些SF值作為“存在非語音聲音”,它具有的頻率比人聲所具有的頻帶高,并在對(duì)應(yīng)于特征點(diǎn)文件中的再現(xiàn)間隔的位置上存儲(chǔ)與“存在非語音聲音”有關(guān)的信息。
存在著對(duì)應(yīng)于在包含有相對(duì)的高頻成分的信號(hào)的前半段和包含有相對(duì)的低頻成分的信號(hào)的后半段之間的2個(gè)音頻幀的一個(gè)間隔。在該間隔中,任何子帶中的SF值都沒有振幅(即,柱形沒有高度)。因此,特征點(diǎn)文件產(chǎn)生電路45將該間隔作為“靜默”,并在對(duì)應(yīng)于特征點(diǎn)文件中的再現(xiàn)間隔的位置上存儲(chǔ)該數(shù)據(jù)。
在后半段中,具有相對(duì)的低頻成分的子帶有更大的SF值(例如,對(duì)應(yīng)于4個(gè)音頻幀),并與人聲所具有的頻帶正好匹配。因此,特征點(diǎn)文件產(chǎn)生電路45將該間隔作為“存在人聲”,并在對(duì)應(yīng)于特征點(diǎn)文件中的再現(xiàn)間隔的位置上存儲(chǔ)該數(shù)據(jù)。
在本實(shí)施例中,例如假定人的“聲音”具有大約70至350Hz的基本頻率,更具體的從大約100至300Hz。低于或高于該“聲音”的頻率被作為“非語音聲音”。本發(fā)明并不限于這些范圍,所用的范圍可以隨意設(shè)定。系統(tǒng)控制器10用這些頻帶作為閾值,在“存在人聲”,“存在非語音聲音”,和“靜默”之間進(jìn)行識(shí)別。用于頻帶的閾值可以存儲(chǔ)在HDD27,RAM12,或ROM11中。
以該方式在指定時(shí)間間隔(上述的2T)中產(chǎn)生的,與“存在人聲”,“存在非語音聲音”,和“靜默”有關(guān)的信息作為指定時(shí)間間隔特征點(diǎn)文件,被存儲(chǔ)在HDD27中。在該情況下,每個(gè)特征點(diǎn)文件和從其中產(chǎn)生該特征點(diǎn)文件的編碼的音頻數(shù)據(jù)通過一個(gè)表格(未示出)相互對(duì)應(yīng)并存儲(chǔ)在HDD27中。
在該實(shí)施例中,特征點(diǎn)文件保持在特征點(diǎn)文件和再現(xiàn)內(nèi)容之間的時(shí)間關(guān)系,該特征點(diǎn)文件具有利用從PES提取的PTS來提取的特征點(diǎn)。使用其它時(shí)間信息的管理技術(shù)也可以被使用。
另外,在該實(shí)施例中,音頻聲音的存在與否被用作對(duì)存儲(chǔ)在特征點(diǎn)文件中的各條信息進(jìn)行分類的依據(jù),以便于優(yōu)先再現(xiàn)包含在該內(nèi)容中的人聲。這些條信息也能用其它觀點(diǎn)進(jìn)行分類。
圖4是示出MPEG音頻/視頻解碼器28的配置的框圖。
在變速再現(xiàn)的情況下,例如倍速,PES流以兩倍的輸入速度輸入到分離電路37。在該情況下,分離電路37以與在正常再現(xiàn)(1×再現(xiàn))時(shí)所用的速度相比為兩倍的處理速度,將流分離為視頻ES和音頻ES,并以兩倍的輸出速度將視頻ES和音頻ES分別提供給MPEG視頻解碼器40和MPEG音頻解碼器41。如果MPEG視頻解碼器40既沒有執(zhí)行正常再現(xiàn)操作,也沒有以倍速操作,則分離電路37就在系統(tǒng)控制器10的控制下,從視頻ES中僅提取用于倍速的變速再現(xiàn)的部分,并將提取的部分提供給MPEG視頻解碼器40。由MPEG視頻解碼器40解碼的基帶中的視頻數(shù)據(jù)作為從MPEG音頻/視頻解碼器28的輸出和作為與倍速再現(xiàn)相匹配的視頻數(shù)據(jù),提供給視頻后處理電路29。由MPEG音頻解碼器41以兩倍速度解碼的PCM數(shù)據(jù),以與在正常再現(xiàn)時(shí)所用的速度相為比兩倍的輸出速度,提供給削減電路42。削減電路42在使用通過系統(tǒng)控制器10從HDD27讀取的特征點(diǎn)文件的同時(shí),將輸入的視頻數(shù)據(jù)削減到半速率。削減電路42將削減后的音頻數(shù)據(jù)作為從MPEG音頻/視頻解碼器28的輸出提供給切換電路32。
在正常速度再現(xiàn)過程中,削減電路42沒有削減由MPEG音頻解碼器41提供的PCM數(shù)據(jù),而是將該數(shù)據(jù)作為從MPEG音頻/視頻解碼器28的輸出,以正常速度提供給切換電路32。
圖5是示出使削減電路42使用在記錄時(shí)產(chǎn)生并存儲(chǔ)在HDD27中的特征點(diǎn)文件,來再現(xiàn)包含有優(yōu)先權(quán)的音頻的間隔,以實(shí)現(xiàn)倍速再現(xiàn)的方法的簡(jiǎn)圖。
圖5的上部示出了在內(nèi)容的標(biāo)題(例如,電視節(jié)目)以1×速度再現(xiàn)的情況下,在確定的時(shí)間段(圖中的2T)中的時(shí)間軸聲音波形。圖5的中部示出了當(dāng)內(nèi)容的標(biāo)題被記錄并存儲(chǔ)在HDD27上時(shí),產(chǎn)生的特征點(diǎn)文件的內(nèi)容,它以圖3下部同樣的方式,與在上部的時(shí)間軸波形的時(shí)間軸相一致。特征點(diǎn)文件的內(nèi)容,即,“存在非語音聲音”,“靜默”,和“存在(人的)聲音”,已經(jīng)用圖3所示的方法產(chǎn)生。連接圖5上部和中部的四條垂直虛線表明它們與通過解碼而獲得的時(shí)間軸聲音波形(圖5的上部)具有相關(guān)性。
圖5的下部指示再現(xiàn)的聲音的波形,它是當(dāng)削減電路42利用特征點(diǎn)文件,以倍速再現(xiàn)具有優(yōu)先權(quán)的“存在聲音”的間隔時(shí)再現(xiàn)的。由于相應(yīng)于圖5上部的2T時(shí)間期間的內(nèi)容是以倍速再現(xiàn)的,隨后在圖5下部的再現(xiàn)時(shí)間就被減半至?xí)r間段T。削減電路42能通過參考在圖5中部的特征點(diǎn)文件,來辨別相應(yīng)于在圖5上部的2T時(shí)間段的內(nèi)容的特征。因此,通過移去“靜默”的間隔和“存在非語音聲音”的間隔,僅再現(xiàn)“存在聲音”的后半部的時(shí)間段,削減電路42能優(yōu)先再現(xiàn)包含人聲和似乎是重要的場(chǎng)景,同時(shí)適應(yīng)所需的再現(xiàn)速度,即倍速。
該實(shí)施例能夠尤其有利于應(yīng)用到這樣一些節(jié)目,即在所記錄的內(nèi)容中人聲的內(nèi)容對(duì)于節(jié)目是主要的,例如各種演出節(jié)目,新聞節(jié)目,和英文會(huì)話節(jié)目。但是,本發(fā)明當(dāng)然并不僅限于這些節(jié)目。節(jié)目不限于電視廣播。當(dāng)然,節(jié)目可以是無線電廣播節(jié)目。
按照至此所述,根據(jù)該實(shí)施例,SF(比例因子)從壓縮和編碼的音頻數(shù)據(jù)中提取,它是與被原始聲音信號(hào)所指示的聲音的特征有關(guān)的信息?;谔崛〉腟F,可產(chǎn)生特征點(diǎn)文件而無需通過MPEG音頻/視頻解碼器28執(zhí)行解碼。因此,在該實(shí)施例中,與包括執(zhí)行解碼,然后產(chǎn)生子帶數(shù)據(jù),觀測(cè)子帶所具有的能量,及對(duì)子區(qū)間具有的特征進(jìn)行分類的相關(guān)技術(shù)方法相比較,計(jì)算量得以減小。而且,即使過去記錄的其它標(biāo)題的節(jié)目正在被再現(xiàn)時(shí),當(dāng)前記錄的標(biāo)題的內(nèi)容的SF也能被提取。
本發(fā)明不限于至此所述的實(shí)施例。相反地,本發(fā)明能進(jìn)行多種修改。
在上面給出的說明中,倍速的變速再現(xiàn)被作為一個(gè)實(shí)例。然而,再現(xiàn)速度并不限于倍速。例如,再現(xiàn)速度可以是1.5倍速度,4倍速度,8倍速度,10倍速度,或更高??蛇x的,再現(xiàn)速度可以根據(jù)使用者的設(shè)定而逐步的變化。另外,再現(xiàn)速度可以自動(dòng)變化。
在上述實(shí)施例中,給出了“存在聲音”的間隔正好是特征點(diǎn)文件的總時(shí)間(2T)的一半,并與倍速再現(xiàn)相匹配的實(shí)例,以利于理解該說明,例如,如在圖3上部所示。此處的幾乎所有2T時(shí)間期間都是“存在聲音”,如果執(zhí)行倍速再現(xiàn),例如,倍速再現(xiàn)通過從特征點(diǎn)文件中有“存在聲音”的SF值當(dāng)中,提取具有較高聲壓級(jí)的SF值,并削減該SF值來完成??梢詾槁晧杭?jí)設(shè)定唯一的閾值。也可以設(shè)定多個(gè)離散的閾值。
例如,本發(fā)明并不限于如上所述的實(shí)施例中的,再現(xiàn)包含具有優(yōu)先級(jí)的人聲的間隔的方法。例如,可想像這樣一種變速再現(xiàn)方法,其中非靜默間隔具有優(yōu)先權(quán)而被再現(xiàn),僅是靜默間隔被移去,而不考慮聲音是否是人聲。還可以想像將本發(fā)明應(yīng)用于一種方法,在考慮到視頻內(nèi)容的特征的同時(shí),通過削減數(shù)據(jù)以變化的速度執(zhí)行再現(xiàn)。
另外,特征點(diǎn)文件產(chǎn)生的時(shí)間選擇并不限于記錄時(shí)間段。還可以想像這樣一種方法,包括一旦記錄完成,就讀出在HDD上的TS(傳輸流),并分析該傳輸流??蛇x的,當(dāng)變速再現(xiàn)被執(zhí)行并用于在變速再現(xiàn)期間削減內(nèi)容時(shí),如果具有高速讀出速度的記錄介質(zhì)、具有高速計(jì)算能力的SF提取電路、和一個(gè)系統(tǒng)控制器被使用,則特征點(diǎn)文件就可以立即產(chǎn)生,即在實(shí)時(shí)基礎(chǔ)上產(chǎn)生。
本領(lǐng)域技術(shù)人員應(yīng)該明白,依據(jù)設(shè)計(jì)要求和其它因素,可以產(chǎn)生各種修改,合并,變形和變化,它們都在附加的權(quán)利要求或其等同物的范圍內(nèi)。
權(quán)利要求
1.一種數(shù)據(jù)記錄和再現(xiàn)設(shè)備,適用于接收由對(duì)原始聲音信號(hào)編碼而產(chǎn)生的音頻數(shù)據(jù),并將該音頻數(shù)據(jù)解碼為原始聲音信號(hào)以便由此再現(xiàn)該原始聲音信號(hào),所述數(shù)據(jù)記錄和再現(xiàn)設(shè)備包括數(shù)據(jù)存儲(chǔ)裝置,用于存儲(chǔ)該音頻數(shù)據(jù);特征點(diǎn)信息產(chǎn)生裝置,用于通過從存儲(chǔ)在數(shù)據(jù)存儲(chǔ)裝置的音頻數(shù)據(jù)中提取與由原始聲音信號(hào)所指示的聲音特征有關(guān)的信息,并通過基于提取的與特征有關(guān)的信息而產(chǎn)生特征點(diǎn)信息,從而產(chǎn)生與特征點(diǎn)有關(guān)的信息,及變速再現(xiàn)裝置,用于通過對(duì)音頻數(shù)據(jù)解碼并基于該特征點(diǎn)信息削減解碼的音頻數(shù)據(jù),從而以變化的速度再現(xiàn)原始聲音信號(hào)。
2.權(quán)利要求1的數(shù)據(jù)記錄和再現(xiàn)設(shè)備,其中所述的特征點(diǎn)信息產(chǎn)生裝置產(chǎn)生指示聲音存在與否的信息,作為所述的特征點(diǎn)信息。
3.權(quán)利要求1的數(shù)據(jù)記錄和再現(xiàn)設(shè)備,其中所述的特征點(diǎn)信息產(chǎn)生裝置以指定的時(shí)間段產(chǎn)生所述的特征點(diǎn)信息。
4.權(quán)利要求1的數(shù)據(jù)記錄和再現(xiàn)設(shè)備,進(jìn)一步包括特征點(diǎn)信息存儲(chǔ)裝置,用于以與具有和相應(yīng)于所述特征點(diǎn)信息的特征有關(guān)的所述信息的音頻數(shù)據(jù)相對(duì)應(yīng)的方式,存儲(chǔ)產(chǎn)生的特征點(diǎn)信息。
5.一種數(shù)據(jù)記錄和再現(xiàn)方法,用于通過將音頻數(shù)據(jù)解碼為原始聲音信號(hào)來再現(xiàn)音頻數(shù)據(jù),該音頻數(shù)據(jù)是通過對(duì)原始聲音信號(hào)進(jìn)亍編碼而產(chǎn)生的,所述的數(shù)據(jù)記錄和再現(xiàn)方法包括步驟存儲(chǔ)該音頻數(shù)據(jù);從存儲(chǔ)的音頻數(shù)據(jù)中,提取與由原始聲音信號(hào)所指示的聲音的特征有關(guān)的信息;基于提取的與特征有關(guān)的信息,產(chǎn)生特征點(diǎn)信息;把該音頻數(shù)據(jù)解碼;及基于該特征點(diǎn)信息,削減解碼的音頻數(shù)據(jù),從而使用產(chǎn)生的特征點(diǎn)信息以變化的速度再現(xiàn)原始聲音信號(hào)。
6.一種程序,通過接收音頻數(shù)據(jù)并將該音頻數(shù)據(jù)解碼為原始聲音信號(hào)來再現(xiàn)音頻數(shù)據(jù),該音頻數(shù)據(jù)是通過對(duì)原始聲音信號(hào)進(jìn)行編碼而產(chǎn)生的,所述的程序適用于使計(jì)算機(jī)執(zhí)行步驟在數(shù)據(jù)存儲(chǔ)裝置中存儲(chǔ)音頻數(shù)據(jù);從存儲(chǔ)的音頻數(shù)據(jù)中,提取與由原始聲音信號(hào)指定的聲音的特征有關(guān)的信息;基于提取的與特征有關(guān)的信息,產(chǎn)生特征點(diǎn)信息;把音頻數(shù)據(jù)解碼;及基于該特征點(diǎn)信息削減解碼的音頻數(shù)據(jù),從而使用產(chǎn)生的特征點(diǎn)信息以變化的速度再現(xiàn)原始聲音信號(hào)。
7.一種數(shù)據(jù)記錄和再現(xiàn)設(shè)備,適用于接收由原始聲音信號(hào)編碼而產(chǎn)生的音頻數(shù)據(jù),并將該音頻數(shù)據(jù)解碼為原始聲音信號(hào),由此再現(xiàn)該原始聲音信號(hào),該數(shù)據(jù)記錄和再現(xiàn)設(shè)備包括數(shù)據(jù)存儲(chǔ)單元,可用于存儲(chǔ)音頻數(shù)據(jù);特征點(diǎn)信息產(chǎn)生單元,可用于通過從存儲(chǔ)在數(shù)據(jù)存儲(chǔ)單元的音頻數(shù)據(jù)中提取與由原始聲音信號(hào)所指示的聲音特征有關(guān)的信息從而產(chǎn)生與特征點(diǎn)有關(guān)的信息,并基于提取的與特征有關(guān)的信息來產(chǎn)生特征點(diǎn)信息;及變速再現(xiàn)單元,可用于通過對(duì)音頻數(shù)據(jù)解碼并基于該特征點(diǎn)信息削減解碼的音頻數(shù)據(jù),從而以變化的速度再現(xiàn)原始聲音信號(hào)。
全文摘要
公開了一種數(shù)據(jù)記錄和再現(xiàn)設(shè)備,適用于接收由原始聲音信號(hào)編碼而產(chǎn)生的音頻數(shù)據(jù),并將該音頻數(shù)據(jù)解碼為原始聲音信號(hào),由此再現(xiàn)該原始聲音信號(hào)。該數(shù)據(jù)記錄和再現(xiàn)設(shè)備包括數(shù)據(jù)存儲(chǔ)裝置,用于存儲(chǔ)該音頻數(shù)據(jù);特征點(diǎn)信息產(chǎn)生裝置,用于產(chǎn)生與特征點(diǎn)有關(guān)的信息,通過從存儲(chǔ)在數(shù)據(jù)存儲(chǔ)裝置的音頻數(shù)據(jù)中提取與由原始聲音信號(hào)所指示的聲音特征有關(guān)的信息,并通過基于提取的與特征有關(guān)的信息而產(chǎn)生特征點(diǎn)信息;及變速再現(xiàn)裝置,用于通過把音頻數(shù)據(jù)解碼并基于該特征點(diǎn)信息削減解碼的音頻數(shù)據(jù),從而以變化的速度再現(xiàn)原始聲音信號(hào)。
文檔編號(hào)G10L19/00GK1941144SQ20061014638
公開日2007年4月4日 申請(qǐng)日期2006年9月30日 優(yōu)先權(quán)日2005年9月30日
發(fā)明者光野誠 申請(qǐng)人:索尼株式會(huì)社