專利名稱:信息記錄和再現(xiàn)的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及信息記錄和再現(xiàn),更具體地涉及記錄音頻和視頻信號等等連同與這些信號相關(guān)的附加信息,并且基于該附加信息有選擇地再現(xiàn)音頻/視頻信號。
目前,模擬型錄像機(jī)(VTRs)通常用于記錄和再現(xiàn)電視廣播的模擬音頻和視頻信號。打算將相應(yīng)于這樣模擬音頻和視頻信號的數(shù)字?jǐn)?shù)據(jù)通用地記錄在諸如光盤和硬磁盤的數(shù)字存儲(chǔ)介質(zhì)上。
傳統(tǒng)的錄像機(jī)(VTRs)在記錄過程中,通過引入不同的標(biāo)識信號而使再現(xiàn)更方便。例如,使用一種標(biāo)識信號來識別電視廣播是否是一種雙語言廣播或是一種立體聲廣播,因此,電視接收器可在這兩種廣播之間進(jìn)行鑒別,并且相應(yīng)地控制音頻信號輸出方式。
當(dāng)代的光盤和硬盤與模擬磁帶相比,具有優(yōu)良的可存取性,即隨機(jī)存取能力。例如,現(xiàn)在正在考慮各種對這些盤的快速視聽方法,例如語言速度的變換和有選擇地跳過歌曲內(nèi)容。相反,傳統(tǒng)的錄像機(jī)VTRs缺乏這樣的能力?,F(xiàn)有技術(shù)的VTRs有些具有自動(dòng)音頻選擇功能等,而其他一些則具有語速變換特點(diǎn),但是該語速變換特點(diǎn)的缺點(diǎn)是視頻和音頻是獨(dú)立處理的。這就產(chǎn)生了輸出音頻和視頻會(huì)不同步的問題,導(dǎo)致視聽不自然輸出,例如,在音頻產(chǎn)生前或后嘴唇在動(dòng)。
傳統(tǒng)的激光盤播放機(jī)(LDPs)具有起頭處眉頭詞檢索能力用于卡拉OK(也就是在跟唱歌曲機(jī)中使用)。但是,至于平常廣播,在許多情況下使用者要求觀看音樂節(jié)目之間的交談型節(jié)目。在這種情況下,傳統(tǒng)的只具有起頭處眉頭詞檢索功能的激光播放機(jī)LDP就不適用了。
因此,本發(fā)明的一個(gè)目的是提供一種能夠在數(shù)字存儲(chǔ)介質(zhì)上記錄音頻或視聽信號的記錄設(shè)備,并且伴隨著在全部時(shí)間對具體音頻類型分析其特征,以及把代表這樣特征的信息存儲(chǔ)在存儲(chǔ)介質(zhì)上。
本發(fā)明的另一個(gè)目的是提供一種再現(xiàn)設(shè)備,該設(shè)備基于使用者對具體音頻類型的選擇,允許選擇性地再現(xiàn)這樣錄制的音頻或視聽信號。
本發(fā)明的再一個(gè)目的是提供具有增強(qiáng)特性的記錄和再現(xiàn)設(shè)備。
在本發(fā)明一個(gè)示范性實(shí)施例中,提供了一種用于至少將一個(gè)音頻信號記錄到記錄介質(zhì)上的信息記錄設(shè)備,該設(shè)備包括用于檢測音頻信號特征的檢測電路,和用于記錄連同音頻信號一起,對應(yīng)于所檢測特征的附加信息的記錄電路。優(yōu)選以時(shí)間段方式檢測音頻信號特征,使得將音頻信號的段或幀各自特征化。例如,可由檢測電路檢測的特征可包括給出的信號段是否是由無聲音的音頻構(gòu)成的;該給出段是否是由音樂構(gòu)成的;或該給出段是否是由交談構(gòu)成的。
采用存儲(chǔ)在記錄介質(zhì)上的特征信息有利于在再現(xiàn)時(shí)具有多方面的適用性,由此給使用者提供了一個(gè)在重放時(shí)高度適用的工具。例如,使用者可以跳過已錄制的一個(gè)或多個(gè)不需要的音頻類型內(nèi)容部分,或者借助于對音頻類型有選擇地略過而快速定位于所錄制內(nèi)容的所需部分。
在另一個(gè)示范性實(shí)施例中,提供了一種用于再現(xiàn)至少一個(gè)相應(yīng)于錄制在記錄介質(zhì)上音頻數(shù)據(jù)的音頻信號的信息再現(xiàn)設(shè)備,在該記錄介質(zhì)上也錄制了至少相關(guān)于音頻信號的附加信息。該設(shè)備包括用于在任何音頻信號相應(yīng)部分再現(xiàn)前讀出附加信息部分的閱讀裝置;用于根據(jù)該附加信息的讀出部分和一當(dāng)前的操作方式,確定是否再現(xiàn)相應(yīng)音頻信號部分的決策裝置;以及用于根據(jù)決策裝置的決定來控制相應(yīng)音頻信號部分再現(xiàn)的控制裝置。
下文詳細(xì)說明是作為本發(fā)明的例子給出的,并不由此對本發(fā)明進(jìn)行限定,將結(jié)合附圖更好地領(lǐng)會(huì),在附圖中同一參考標(biāo)號表示同一元件或部件,其中
圖1是一根據(jù)本發(fā)明實(shí)施例的信息記錄設(shè)備的說明布局的方框圖;圖2展示盤上存儲(chǔ)區(qū)域的示范性配置;圖3是展示圖1的信息記錄設(shè)備的操作流程圖;圖4和圖5是展示產(chǎn)生表示音頻特征的子碼過程的流程圖;圖6和圖7是展示在圖1的相應(yīng)處理系統(tǒng)中信號流輸出時(shí)間安排的時(shí)間安排圖;圖8是展示根據(jù)發(fā)明一實(shí)施例的信息再現(xiàn)設(shè)備的說明布局的方框圖;圖9是展示圖8的信息再現(xiàn)設(shè)備操作的流程圖;圖10是展示在圖8的相應(yīng)處理系統(tǒng)中信號流輸出時(shí)間安排的時(shí)間安排圖11是展示根據(jù)發(fā)明另一實(shí)施例的信息再現(xiàn)設(shè)備的說明布局的方框圖;圖12是說明圖11的信息再現(xiàn)設(shè)備操作的流程圖;圖13是展示在圖11的相應(yīng)處理系統(tǒng)中信號流輸出時(shí)間安排的時(shí)間安排圖。
圖1是標(biāo)志為記錄設(shè)備100的本發(fā)明第一個(gè)示范性實(shí)施例的方框圖。其詳細(xì)說明如下,記錄設(shè)備100構(gòu)造成可有選擇地接收不同類型的模擬輸入信號,例如電視廣播信號或攝像機(jī)系統(tǒng)輸出信號。該設(shè)備將選擇的輸入信號轉(zhuǎn)換成數(shù)字信號,并且壓縮它并將它記錄在諸如光盤或磁盤的數(shù)字存儲(chǔ)介質(zhì)上。當(dāng)已接收和記錄音頻和視頻信號時(shí),在全部時(shí)間內(nèi)分析音頻信號的特征,以便以時(shí)間段方式分類其內(nèi)容。具體地講,分析該音頻信號的單獨(dú)幀以便確定哪個(gè)或哪些幀序列對應(yīng)于,例如,音樂、交談或無聲音頻。借此對記錄的音頻節(jié)目的每一段進(jìn)行分類。然后相應(yīng)于音頻信號分類情況產(chǎn)生一個(gè)用戶內(nèi)容表。將該內(nèi)容表記錄于數(shù)字存儲(chǔ)介質(zhì)上,或者記錄于記錄介質(zhì)的特定區(qū)域,或者以子碼形式分布在象記錄音頻/視頻數(shù)據(jù)一樣的同一區(qū)域中。該內(nèi)容表允許用戶重放所選擇的音頻類型和相關(guān)的視頻數(shù)據(jù)而跳過其他類型,或者通過選擇跳過某些音頻類型而快速進(jìn)入所記錄的視聽節(jié)目的所需部分,等等。
現(xiàn)在將詳細(xì)說明記錄設(shè)備100。視頻信號處理系統(tǒng)1構(gòu)造成接收外界輸入視頻信號,例如錄像機(jī)VTR視頻輸出,和對例如自動(dòng)增益控制(AGC)的信號進(jìn)行不同類型的處理。攝像機(jī)信號處理系統(tǒng)2用于接收來自電荷耦合器(CCD)攝像機(jī)或類似物的視頻信號,并且將其轉(zhuǎn)換成標(biāo)準(zhǔn)協(xié)議信號,例如國家電視系統(tǒng)委員會(huì)(NTSC)視頻信號。調(diào)諧器系統(tǒng)3通過天線系統(tǒng)(未示出)接收電視廣播信號,并且通過視頻檢測、視頻放大和音頻檢測將所選擇頻道的電視信號轉(zhuǎn)換成視頻和音頻信號。
音頻信號處理系統(tǒng)7適于接收和放大外界的音頻信號,例如來自將視頻信號提供給系統(tǒng)1的VTR的音頻輸出。話筒輸入音頻處理系統(tǒng)8放大通過話筒輸入的音頻信號并在其上進(jìn)行自動(dòng)增益控制AGC處理。
將來自系統(tǒng)1、2和3中的各自的視頻輸出信號作為輸入加到視頻信號切換系統(tǒng)4中,該系統(tǒng)根據(jù)來自系統(tǒng)控制器14的選擇控制信號切換出所選擇的一個(gè)視頻信號作為它的輸出。同樣地,音頻信號切換系統(tǒng)9根據(jù)來自系統(tǒng)控制器14的控制信號,將所選擇的來自系統(tǒng)3、7和8的一個(gè)音頻信號發(fā)送成它的輸出。
在視頻路徑中,將切換系統(tǒng)4的模擬視頻輸出加到視頻信號A/D轉(zhuǎn)換系統(tǒng)5,在那里將它轉(zhuǎn)換成數(shù)字視頻信號,然后量化該數(shù)字視頻信號。其后,根據(jù)諸如聯(lián)合圖片專家組規(guī)范(JPEG)或運(yùn)動(dòng)圖像專家組規(guī)范(MPEG)方案的標(biāo)準(zhǔn)壓縮協(xié)議,通過視頻壓縮和處理系統(tǒng)6將量化的數(shù)字視頻信號進(jìn)行壓縮。將該壓縮的視頻信號加到記錄數(shù)據(jù)處理系統(tǒng)17,并且記錄在記錄介質(zhì)18中,下文將對該記錄介質(zhì)更充分地討論。
在記錄設(shè)備100的音頻路徑中,通過音頻信號A/D轉(zhuǎn)換系統(tǒng)(A/D轉(zhuǎn)換器)10將音頻切換系統(tǒng)9的模擬音頻輸出轉(zhuǎn)換成數(shù)字音頻信號。將來自A/D轉(zhuǎn)換器10的數(shù)字化音頻輸出加到音頻特征提取系統(tǒng)12(檢測裝置)和加到音頻信號帶壓縮系統(tǒng)11,后者將根據(jù)諸如MPEG的標(biāo)準(zhǔn)協(xié)議在必要時(shí)壓縮音頻信號。
音頻特征提取系統(tǒng)12包括處理電路,用于分析來自系統(tǒng)10加到其上的數(shù)字音頻的某些特征,以便由此提取信號的音頻特征。在提取系統(tǒng)12中根據(jù)來自系統(tǒng)控制器14加在其上的操作參數(shù)對量化的音頻信號進(jìn)行正交變換,然后再根據(jù)系統(tǒng)控制器14提供的操作指令對其進(jìn)行確定的操作。在提取系統(tǒng)12中,以逐塊為基礎(chǔ)對該音頻信號進(jìn)行分析,其中每塊對應(yīng)于要記錄的音頻信號的一個(gè)具體時(shí)間段(例如幀或幀組)。舉個(gè)例子來說,為了確定音頻信號的哪一部分對應(yīng)于無聲音情況,可以0.02秒時(shí)間段對音頻信號進(jìn)行分析,以便確定包含無聲音或低強(qiáng)度音頻的塊。以更長的時(shí)間塊對音頻信號進(jìn)行分析,以便確定包含對應(yīng)于例如器樂,人說話或聲樂的音頻的大塊,根據(jù)由提取系統(tǒng)12進(jìn)行分析的結(jié)果,由子碼產(chǎn)生系統(tǒng)13產(chǎn)生子碼,以便將音頻信號的每一個(gè)這樣的塊特征化。暫時(shí)將某些子碼存儲(chǔ)在存儲(chǔ)器16中。
具體地,對于每個(gè)持續(xù)時(shí)間“D1”(例如,0.02秒持續(xù)時(shí)間)的音頻數(shù)據(jù)塊,產(chǎn)生子碼“A”以表示該塊是否對應(yīng)于無聲音的音頻。對于每個(gè)較長持續(xù)時(shí)間“D2”的數(shù)據(jù)塊,產(chǎn)生子碼“B”以表示在該塊中包含諸如交談、器樂或聲樂類型的音頻信號。將子碼A直接傳輸?shù)接涗洈?shù)據(jù)處理系統(tǒng)17,反之,將子碼B傳輸?shù)酱鎯?chǔ)電路16以便暫時(shí)在其中存儲(chǔ)。通常,當(dāng)音頻/視頻數(shù)據(jù)記錄完畢時(shí),根據(jù)系統(tǒng)控制器14的控制,將所有子碼B作為一塊從存儲(chǔ)器16輸送到記錄數(shù)據(jù)處理系統(tǒng)17(通過子碼產(chǎn)生系統(tǒng)13)。
不管怎樣,當(dāng)記錄設(shè)備100接收模擬音頻信號時(shí),將其數(shù)字化、壓縮,并且一般來說實(shí)時(shí)地作為數(shù)據(jù)將其記錄在記錄介質(zhì)18的預(yù)定部分。當(dāng)產(chǎn)生子碼A和B時(shí),產(chǎn)生用戶內(nèi)容表(U-TOC),以便使存儲(chǔ)在記錄介質(zhì)18上的音頻數(shù)據(jù)與表征該音頻數(shù)據(jù)的相應(yīng)段的子碼相關(guān)連。U-TOC存儲(chǔ)在記錄介質(zhì)18上。如圖2所示,數(shù)字化的音頻數(shù)據(jù)可記錄在盤的最外區(qū)域上,而U-TOC數(shù)據(jù)可記錄在盤的在記錄有內(nèi)容表(TOC)的最內(nèi)區(qū)域的外側(cè)區(qū)域的預(yù)定區(qū)域上。
系統(tǒng)控制器14根據(jù)由記錄控制信號輸入系統(tǒng)15,例如鍵盤或類似物輸入的用戶指令,通過對相應(yīng)的處理系統(tǒng)提供控制信號實(shí)現(xiàn)對該相應(yīng)處理系統(tǒng)進(jìn)行控制。
記錄數(shù)據(jù)處理系統(tǒng)17(記錄裝置)的作用是多路傳輸來自視頻信號壓縮系統(tǒng)6、音頻信號壓縮系統(tǒng)11和子碼產(chǎn)生系統(tǒng)13所提供的位(bit)序列,并且將多路傳輸?shù)臄?shù)據(jù)傳送到記錄介質(zhì)18和將該數(shù)據(jù)記錄在其上。(注意某些或者全部子碼可以不與音頻和視頻數(shù)據(jù)一起多路傳輸,而可選作為一個(gè)數(shù)據(jù)塊傳輸,在這種情況下記錄系統(tǒng)17不用多路傳輸僅將該子碼數(shù)據(jù)塊記錄在記錄介質(zhì)上)。記錄介質(zhì)18可以是光盤、硬盤、存儲(chǔ)卡或類似器具。
圖3是說明在系統(tǒng)控制器14中,為了控制記錄設(shè)備100的記錄過程的各方面,執(zhí)行的過程步驟的流程圖。在開始(步驟S1)系統(tǒng)控制器14根據(jù)輸入給輸入系統(tǒng)15的用戶指令,例如,檢測按下的特定方式鍵,確定操作方式。在步驟S2,確定在步驟S1所確定的操作方式是否是常規(guī)記錄方式,也就是說,在該方式中記錄了視頻和音頻兩種信號。如果是這樣,則程序前進(jìn)到步驟S3,在該步驟,系統(tǒng)控制器14在音頻特征提取系統(tǒng)12中設(shè)置操作參數(shù)A、B、C和D。由于下述明顯原因,根據(jù)用戶選擇的音頻信號的類型,例如來自于電視信號、VTR輸出或話筒的音頻信號,設(shè)置參數(shù)A-D的值。這樣,該參數(shù)A-D的值就相對應(yīng)于由系統(tǒng)控制器14控制的音頻切換系統(tǒng)9的切換狀態(tài)。
在按圖3進(jìn)一步前進(jìn)前,先參見圖4,圖4展示了說明在音頻特征提取系統(tǒng)12和子碼產(chǎn)生系統(tǒng)13中程序的流程圖。對于當(dāng)前所描述的實(shí)施例,假設(shè)一個(gè)數(shù)據(jù)塊包括音頻數(shù)據(jù)的N位或N個(gè)字節(jié),這里N是一個(gè)預(yù)先確定的整數(shù)。舉例來說,一個(gè)數(shù)據(jù)塊可包含對應(yīng)于0.02秒長度段的輸入模擬音頻信號的數(shù)字化音頻數(shù)據(jù)。進(jìn)一步假設(shè)子碼A是以逐塊為基礎(chǔ)計(jì)算的,而子碼B是以M塊為基礎(chǔ)計(jì)算的,這里M是一個(gè)特定的整數(shù)。在步驟S21,音頻特征提取系統(tǒng)12接收來自系統(tǒng)控制器14的操作參數(shù)A、B、C和D,如前文所討論的,該系統(tǒng)控制器根據(jù)所選擇的音頻信號類型已設(shè)置了這些參數(shù)。如果在步驟S22,確定還沒有處理M個(gè)數(shù)據(jù)塊,那么就執(zhí)行步驟S27的單數(shù)據(jù)塊處理(“1-數(shù)據(jù)塊處理”)。
圖5是1-數(shù)據(jù)塊處理流程圖。在步驟S31,對單個(gè)音頻信號塊進(jìn)行快速傅立葉變換(FFT),以便確定相應(yīng)于該音頻信號塊信號部分的頻譜成分。下一步在步驟S32,從由系統(tǒng)控制器14提供的操作參數(shù)B確定的Nb個(gè)頻率成分計(jì)算出音頻信號功率。這樣,由參數(shù)B確定了用于計(jì)算信號功率的輸入音頻信號帶的部分。例如,來自攝像機(jī)系統(tǒng)的音頻信號含有大量低頻成分,例如噓噓聲,而電視廣播的音頻信號含有大量幀頻的諧波頻率成分。因此,對于信號功率的計(jì)算,采用按照所分析的音頻信號類型適當(dāng)濾去不需要的頻率的方法,可降低由噪音產(chǎn)生的誤差。
在下一步驟S33中,確定信號是否是無聲的。這就是,如果計(jì)算的功率值小于參數(shù)C,那么就確定在相應(yīng)的塊中信號是無聲的??蛇x擇地,如果計(jì)算功率大于參數(shù)C,那么就可進(jìn)一步確定關(guān)于信號功率是否處在n個(gè)預(yù)先確定的范圍的一個(gè)之內(nèi)。不管怎樣,在步驟S34,根據(jù)步驟S33的確定情況產(chǎn)生子碼A,并且將其提供給記錄數(shù)據(jù)處理系統(tǒng)17。子碼A或者是作為無聲情況的第一個(gè)預(yù)先確定的值,或者是作為各自對應(yīng)于不同信號功率量級范圍的若干其他預(yù)先確定值中的一個(gè)。一般來說,電視廣播和攝像機(jī)系統(tǒng)(如,攝像機(jī)錄像機(jī)組合裝置(camcorders))的信號由于話筒性能方面的不同而具有不同的信噪比(S/N)。因此,根據(jù)音頻切換系統(tǒng)9所選擇的切換位置(和由系統(tǒng)控制器14對其進(jìn)行控制),通過適當(dāng)?shù)剡x擇參數(shù)C的值可減小錯(cuò)誤檢測的可能性。
在1-數(shù)據(jù)塊處理中的下一步驟S35中,確定頻譜的峰值P(f),也就是,特定的Nd個(gè)頻率中的任何一個(gè)的最大幅度,其中Nd是一個(gè)整數(shù)。然后,將這樣確定的頻譜峰值暫時(shí)存儲(chǔ)在存儲(chǔ)電路16中。該Nd個(gè)頻率是根據(jù)由系統(tǒng)控制器14提供的參數(shù)D確定的。如上所討論的,給音頻信號加噪音的頻譜成分是音頻信號類型的函數(shù)。因此,可以通過從主題頻率成分中消除那些噪音成分,以更高精度計(jì)算出最大頻譜功率。
一旦對單數(shù)據(jù)塊計(jì)算出頻譜峰值P(f),并且已暫時(shí)存儲(chǔ),那么軟件流程就返回到圖4的步驟S21和S22。該處理過程繼續(xù)到步驟S27執(zhí)行M次,由此,對M塊音頻信號算出了頻譜峰值P(f),并且存儲(chǔ)在存儲(chǔ)器中。
一旦在步驟S22確定音頻數(shù)據(jù)的M塊都已處理了,那么在步驟S23,軟件計(jì)算平均持續(xù)長度“CLAVG”,在其中確定頻譜峰值P(f)相互具有同樣的值。CLAVG的計(jì)算需要將一系列數(shù)據(jù)塊的頻譜峰值相互比較,并且確定區(qū)段的長度,在該區(qū)段連續(xù)塊的峰值保持在相互預(yù)定的范圍內(nèi)。然后,在步驟S24,確定對連續(xù)的M個(gè)數(shù)據(jù)塊計(jì)算的CLAVG值是否大于由系統(tǒng)控制器14提供的參數(shù)A。一般來說,在聲音的強(qiáng)度比較穩(wěn)定如音樂的場合,為計(jì)算CLAVG,塊的平均數(shù)就大。相反,在音頻信號為人的說話或交談的場合,塊的平均數(shù)就小。如果是音樂,可以確定某個(gè)CLAVG值對應(yīng)于由樂器產(chǎn)生的音樂,而另一個(gè)值對應(yīng)于聲樂。
無論何種情況,在步驟S25,對每一M塊音頻信號段建立一個(gè)子碼B以便對應(yīng)于特定的音頻信號類型。在本例中,根據(jù)值CLAVG是否大于由系統(tǒng)控制器14提供的參數(shù)A,來判定信號是否為音樂,并且相應(yīng)地產(chǎn)生子碼B。在步驟S26,該子碼B存儲(chǔ)于存儲(chǔ)電路16,并且只要操作方式保持常規(guī)記錄方式的情況,該處理過程就重復(fù)下一M個(gè)數(shù)據(jù)塊。一般而言,電視廣播和攝像機(jī)系統(tǒng)(如攝像機(jī)錄像機(jī)組合裝置)的信號具有不同的非音樂節(jié)目,如會(huì)話的出現(xiàn)率。因此,根據(jù)所選擇的輸入音頻信號的類型,通過適當(dāng)選擇參數(shù)A的值,可減小錯(cuò)誤檢測的可能性。
回到圖3,在步驟S3,根據(jù)上述控制正處理音頻信號時(shí),視頻信號也連續(xù)不斷地被處理和數(shù)字化記錄。也即,在步驟S4,根據(jù)來自系統(tǒng)控制器14的控制指令,通過記錄數(shù)據(jù)處理系統(tǒng)17,將出自視頻處理系統(tǒng)6的壓縮視頻輸出信號傳輸?shù)接涗浗橘|(zhì)18。在步驟S5,系統(tǒng)控制器14也控制音頻處理系統(tǒng)11,以便通過記錄處理系統(tǒng)17將壓縮的音頻信號傳輸?shù)接涗浗橘|(zhì)18。在步驟S6,系統(tǒng)控制器14控制記錄處理系統(tǒng)17,以便將前面討論的由子碼產(chǎn)生系統(tǒng)13產(chǎn)生的子碼“A”提供給記錄處理系統(tǒng)17并且傳輸?shù)接涗洷P18。然后,在步驟S7,如果已產(chǎn)生一個(gè)或多個(gè)子碼B,那么指令子碼產(chǎn)生系統(tǒng)13將其傳輸?shù)酱鎯?chǔ)電路16。
其后,程序返回到步驟S1和S2。如果操作方式還是常規(guī)操作方式,那么上面所描述的程序?qū)⒅貜?fù)。如果,在另一方面,已通過諸如用戶按下“停止記錄”鍵或類似方式改變了操作方式,那么程序處理到達(dá)步驟S8,在那里,判定先前產(chǎn)生的子碼B是否已經(jīng)記錄在記錄介質(zhì)18上。如果沒有,系統(tǒng)控制器14控制子碼產(chǎn)生系統(tǒng)13(步驟S9),以便讀出在存儲(chǔ)電路16中存儲(chǔ)的子碼B并且通過記錄數(shù)據(jù)處理系統(tǒng)17將它們傳輸?shù)接涗浗橘|(zhì)18上。
在上述方式中,如果是從常規(guī)記錄方式向一些其他的方式轉(zhuǎn)換,那么將子碼B作為一個(gè)數(shù)據(jù)塊記錄在記錄介質(zhì)18的預(yù)定區(qū)域上,如在上面討論的U-TOC區(qū)域上。
如果在步驟S8子碼B已經(jīng)記錄在記錄介質(zhì)18上了,那么下一步(步驟S10)確定當(dāng)前操作方式是否是停止方式。如果是,則在步驟S12執(zhí)行停止處理。否則,在步驟S11判定操作方式是否是刪除方式,如果是,則在步驟S13執(zhí)行刪除方式處理,程序返回到步驟S1。
圖6和圖7是展示對相應(yīng)的音頻和視頻處理系統(tǒng)信號輸出時(shí)間安排的時(shí)間安排圖。圖6展示在常規(guī)記錄方式中的輸出時(shí)間安排。如從圖的最底下的時(shí)間安排欄顯示易見,當(dāng)常規(guī)操作方式時(shí),音頻、視頻和無聲數(shù)據(jù)(子碼A)以逐幀為基礎(chǔ)連續(xù)地記錄在記錄介質(zhì)上。在當(dāng)前描述的實(shí)施例中,首先記錄第N-1幀的壓縮視頻數(shù)據(jù),接著是第N-1幀的壓縮音頻數(shù)據(jù),然后是作為N-1幀的子碼A,其后接著的是第N幀的視頻數(shù)據(jù)等等。當(dāng)然不同的數(shù)據(jù)存儲(chǔ)次序可以另外方案實(shí)現(xiàn)。圖6的其他時(shí)間安排欄描述了所說明的記錄次序是如何實(shí)施的。任何給定的幀,例如第N幀的壓縮視頻數(shù)據(jù)是視頻壓縮系統(tǒng)6的輸出,并且正好先于由音頻壓縮系統(tǒng)11輸出的壓縮音頻數(shù)據(jù)。需要有足夠的時(shí)間用于對當(dāng)前幀數(shù)據(jù)執(zhí)行前文所說的“1-數(shù)據(jù)塊處理”,也就是對壓縮的音頻數(shù)據(jù)進(jìn)行正交變換(如,快速傅立葉變換(FFT)),以便確定象上面對幀所描述的子碼A和頻譜峰值P(f),其中在本例中一幀對應(yīng)于一個(gè)單獨(dú)數(shù)據(jù)塊。這樣,對第N幀進(jìn)行的正交變換先于第N幀的壓縮的音頻數(shù)據(jù)輸出,而第N幀的子碼A的產(chǎn)生在壓縮的音頻數(shù)據(jù)輸出后立刻完成。而且,每一幀的P(f)存儲(chǔ)在存儲(chǔ)電路16中。然后,當(dāng)處理完M幀后,例如在圖6例子中是4幀(以幀N-1至N+2表示),針對該M幀數(shù)據(jù)塊產(chǎn)生子碼B,并寫入存儲(chǔ)電路16。
圖7展示當(dāng)常規(guī)記錄方式到停止方式再到刪除方式過渡時(shí),說明從相應(yīng)處理系統(tǒng)輸出的信號輸出時(shí)間安排的時(shí)間安排圖。在這個(gè)例子中,假設(shè)捕獲到第N幀時(shí),實(shí)現(xiàn)向停止方式轉(zhuǎn)換。在壓縮視頻和音頻信號以及對應(yīng)于幀N-1和N的子碼A記錄到記錄介質(zhì)18上后,所有的存儲(chǔ)在存儲(chǔ)電路16中的子碼B由子碼產(chǎn)生系統(tǒng)13讀出并且借助于記錄數(shù)據(jù)處理系統(tǒng)17記錄到記錄介質(zhì)18上。
用于子碼A和B的具體扇區(qū)配置和格式對于本發(fā)明并不是決定性的。下面是以舉例方式說明的。子碼A的扇區(qū)配置的例子同步模式 8字節(jié)子碼 9字節(jié)奇偶性8字節(jié)用戶數(shù)據(jù) 2,048字節(jié)ECC(誤差校正碼) 256字節(jié)總計(jì) 2,329字節(jié)子碼A的格式的例子扇區(qū)數(shù)4字節(jié)音頻強(qiáng)度 5字節(jié)總計(jì) 9字節(jié)音頻強(qiáng)度級的例子000無聲001 0級010 1級011 2級1×× N級包括子碼B的用戶內(nèi)容表(U-TOC)配置的例子同步模式 8字節(jié)奇偶性8字節(jié)用戶數(shù)據(jù) 2,048字節(jié)子碼B 8,192字節(jié)ECC(誤差校正碼) 256字節(jié)總計(jì) 10,512字節(jié)子碼B的格式例子0秒型 1字節(jié)
1秒型 1字節(jié)8,191秒型 1字節(jié)總計(jì) 8,192字節(jié)在上面例子中,“0秒型”表示從再現(xiàn)開始計(jì)起,0到1秒時(shí)間段里再現(xiàn)的例如音頻類型,比如聲音、音樂等;“1秒型”表示從再現(xiàn)開始計(jì)起,1至2秒時(shí)間段里再現(xiàn)的音頻類型,等等?!?191秒型”表示從再現(xiàn)開始計(jì)起,8191至8192秒時(shí)間段里再現(xiàn)的音頻類型。例如,音頻類型可按如下定義n秒型的例子000無聲001音樂-0(例如,器樂)010音樂-1(例如,聲樂)011人的聲音(例如,交談)1×× 其他類型因此,可明顯地看出,諸如剛才所描述的記錄設(shè)備100的本發(fā)明實(shí)施例能便利地接收諸如廣播的模擬音頻或視聽節(jié)目,數(shù)字地記錄它,并同時(shí)分析正在記錄的音頻內(nèi)容,產(chǎn)生將記錄的音頻節(jié)目的不同部分特征化的用戶內(nèi)容表(U-TOC)。當(dāng)重放時(shí),用戶能便利地使用U-TOC(用諸如已描述的適當(dāng)?shù)碾娮釉O(shè)備),以便找到記錄內(nèi)容的某一部分,跳過不需要的音頻類型部分等等。從而,向用戶提供了重放時(shí)的高效工具。
現(xiàn)在將舉例說明再現(xiàn)音頻和視頻信息的設(shè)備,該音頻和視頻信息已用上面討論的方式與附加音頻特征信息一起存儲(chǔ)在數(shù)字存儲(chǔ)介質(zhì)上。
圖8是展示根據(jù)本發(fā)明的一個(gè)實(shí)施例的信息再現(xiàn)設(shè)備200舉例性說明配置的方框圖。記錄介質(zhì)18是類似圖1所示的,例如光盤、存儲(chǔ)卡或磁硬盤。音頻和視頻數(shù)據(jù)和相應(yīng)于表征音頻不同時(shí)間段的子碼A和B都記錄在記錄介質(zhì)18上。如果記錄介質(zhì)是一光盤,數(shù)據(jù)可按如下格式記錄扇區(qū)配置的例子同步模式8字節(jié)子碼9字節(jié)奇偶性 8字節(jié)用戶數(shù)據(jù) 2,048字節(jié)ECC(誤差校正碼) 256字節(jié)總計(jì) 2,329字節(jié)子碼格式的例子扇區(qū)段 4字節(jié)音頻ID(標(biāo)識符) 5字節(jié)總計(jì) 9字節(jié)作為例子,存儲(chǔ)的5字節(jié)音頻IDs可以以最低一個(gè)字節(jié)表示音頻強(qiáng)度級,如下所示× × × × 00級× × × × 11級× × × × 22級× × × × AN級并且在這個(gè)例子中,以最低第二個(gè)字節(jié)表示音頻內(nèi)容× × × 0 ×無聲× × × 1 ×音樂(流行)× × × 2 ×音樂(古典)× × × A ×說話聲在以上例子中,×代表一個(gè)0至255中的任意值。
盡管上面例子是子碼和視頻和音頻數(shù)據(jù)置于同一扇區(qū)的情況,但是,作為替代形式,可將一給定的扇區(qū)只含子碼。更進(jìn)一步,在微型盤(MD)場合,子碼可以成批安排在諸如U-TOC區(qū)域的指定區(qū)域。對于這種情況,設(shè)備可以通過與上面例子相同的配置和方法實(shí)施。
在下面討論中,將以假設(shè)記錄介質(zhì)18為一光盤的前提下描述再現(xiàn)設(shè)備200。驅(qū)動(dòng)電路21(在本場合,是光盤驅(qū)動(dòng)電路)配置為伺服控制光盤18,以便能響應(yīng)于外控制信號訪問特定的光盤扇區(qū)。一個(gè)光讀出裝置(未示出),其可以是再現(xiàn)處理系統(tǒng)22的部件,從盤18讀出信號,并且放大和解調(diào)它。再現(xiàn)數(shù)據(jù)處理系統(tǒng)22操作從記錄介質(zhì)18讀出的數(shù)據(jù)中分離出視頻數(shù)據(jù)、音頻數(shù)據(jù)和子碼,并且將子碼提供給子碼檢測系統(tǒng)A28。
視頻信號帶展開處理系統(tǒng)23操作展開由處理系統(tǒng)22提供的壓縮的視頻數(shù)據(jù),并且將展開的數(shù)據(jù)轉(zhuǎn)換成諸如13.5MHz,YUV的基帶信號,或類似物。視頻信號D/A轉(zhuǎn)換系統(tǒng)24將接收的數(shù)字視頻數(shù)據(jù)轉(zhuǎn)換成模擬視頻信號。音頻信號帶展開處理系統(tǒng)25展開已根據(jù)MPEG方案或類似方案壓縮的音頻數(shù)據(jù)。音頻信號D/A轉(zhuǎn)換系統(tǒng)26將接收的數(shù)字音頻數(shù)據(jù)轉(zhuǎn)換成模擬音頻信號。
讀出區(qū)域計(jì)算系統(tǒng)27(控制裝置)根據(jù)由系統(tǒng)控制器29或者子碼檢測系統(tǒng)A 28(檢測裝置)送出的控制信號計(jì)算記錄介質(zhì)18的扇區(qū)號。檢測系統(tǒng)28配置成判定從記錄介質(zhì)18讀出的子碼(和相關(guān)的幀)是否對應(yīng)于當(dāng)前再現(xiàn)方式的音頻類型。檢測系統(tǒng)28根據(jù)該判定向計(jì)算系統(tǒng)27提供控制信號。檢測系統(tǒng)28還向視頻展開系統(tǒng)23和音頻展開系統(tǒng)25提供作為抑制從要跳過的幀來的輸出數(shù)據(jù)指令的控制信號。系統(tǒng)控制器29根據(jù)通過輸入系統(tǒng)30,例如可壓下選擇鍵用戶板,由用戶輸入的數(shù)據(jù),操作控制整個(gè)記錄設(shè)備200。設(shè)備200的不同系統(tǒng),如系統(tǒng)22、23、25和27至29可以裝備為分立的固件或?yàn)榫哂羞m當(dāng)軟件在其中運(yùn)行的公共處理器的部件,以便實(shí)現(xiàn)各相應(yīng)系統(tǒng)的功能。
現(xiàn)在參照圖9的流程描述上述圖8設(shè)備的操作運(yùn)行。在步驟41,系統(tǒng)控制器29根據(jù)用戶按壓的輸入系統(tǒng)30的一個(gè)或n個(gè)按鈕,確定操作方式。操作方式可以從音頻和視頻數(shù)據(jù)連續(xù)輸出的常規(guī)再現(xiàn)方式,或者一種或n種在再現(xiàn)時(shí)跳過特定音頻類型的“跳躍”再現(xiàn)方式中選擇。在步驟42,讀出區(qū)域計(jì)算系統(tǒng)27計(jì)算要讀出的下一個(gè)子碼的扇區(qū)號。接著在步驟S43,將算出的扇區(qū)號提供給驅(qū)動(dòng)電路21,并且根據(jù)驅(qū)動(dòng)電路21的控制從記錄介質(zhì)18中讀出對應(yīng)于算出扇區(qū)號的子碼。通過處理系統(tǒng)22將算出的扇區(qū)號和相關(guān)的子碼提供給檢測系統(tǒng)28。
在下一步驟S44,確定當(dāng)前的操作方式是否是常規(guī)再現(xiàn)方式,如果是,則程序流向步驟S45,在那里,計(jì)算系統(tǒng)27計(jì)算出下一幀的扇區(qū)號,并且將其提供給驅(qū)動(dòng)電路21。在步驟S46,根據(jù)驅(qū)動(dòng)電路21的控制從記錄介質(zhì)18中讀出相應(yīng)于下一幀的壓縮音頻和視頻數(shù)據(jù)。通過處理系統(tǒng)22(步驟S47,S48)將該壓縮視頻和音頻數(shù)據(jù)分別傳輸?shù)揭曨l展開系統(tǒng)23和音頻展開系統(tǒng)25。傳輸?shù)揭曨l展開系統(tǒng)23的壓縮的視頻數(shù)據(jù)在那里展開,然后由視頻D/A轉(zhuǎn)換器24轉(zhuǎn)換成模擬視頻信號,并且最后輸出。傳輸?shù)揭纛l展開系統(tǒng)25的壓縮的音頻數(shù)據(jù)在那里展開,由音頻D/A轉(zhuǎn)換器26轉(zhuǎn)換成模擬音頻信號,然后輸出。其后,程序返回到步驟S41重復(fù)上面進(jìn)行的過程。
如果在步驟S44系統(tǒng)控制器29判定當(dāng)前操作不同于常規(guī)再現(xiàn)方式,例如該方式是再現(xiàn)方式A(步驟S49),或者再現(xiàn)方式B(步驟S51),那么設(shè)備200就根據(jù)選擇的再現(xiàn)方式控制輸出音頻和視頻數(shù)據(jù)。例如,在重放時(shí)按用戶要求所選擇的再現(xiàn)方式使設(shè)備200跳過一個(gè)特定的音頻類型。在這種情況下,如果與幀相關(guān)的子碼對應(yīng)于要躲避的音頻類型,就跳過了該幀。然后,檢測系統(tǒng)28指示展開系統(tǒng)23和25不要輸出相應(yīng)于該幀的數(shù)據(jù)。相伴隨,指示計(jì)算系統(tǒng)27立刻跳過該幀的扇區(qū),并且移到后繼幀扇區(qū)上,直到找到具有不同于要避開的子碼的幀。
同樣地,另一個(gè)再現(xiàn)方式也可包括進(jìn)來,它在重放時(shí)只允許一種類型的音頻而跳過所有其他類型。在這種情況下,如當(dāng)前幀的子碼沒有相應(yīng)于選擇要重放的音頻類型時(shí),就象上面描述的那樣,檢測系統(tǒng)27提供“跳躍”指令給計(jì)算系統(tǒng)27和展開系統(tǒng)23、25。然而,再一種再現(xiàn)方式也可包括進(jìn)來,它執(zhí)行用戶輸入的特定的視和/或聽速度,在這種情況下,通過計(jì)算要再現(xiàn)的幀和要跳過的幀之間的比例,使得能相互同步地跳過視頻和音頻的信號。
在圖9的例子中,假設(shè)再現(xiàn)方式A相應(yīng)于這樣一種方式,在該方式中要跳過具有無聲或低強(qiáng)度級音頻信號的幀。如果在步驟S50判定因?yàn)橐粠淖哟a對應(yīng)于低音頻強(qiáng)度級,而要跳過這一幀,那么,程序回到步驟S42和S43,在那里計(jì)算后繼幀的扇區(qū),讀出子碼并重復(fù)此處理過程。如果該幀不是要跳過的,那么程序就從查詢步驟S50返回到步驟S45,以便開始對該幀的音頻/視頻數(shù)據(jù)的重放過程。
如上所描述的,通過響應(yīng)于來自系統(tǒng)控制器29的指令判定主題子碼的內(nèi)容,能執(zhí)行各種再現(xiàn)操作,然后基于該判定計(jì)算讀出扇區(qū)。使用該技術(shù),由于總是相互同步地跳過或再現(xiàn)視頻信號和音頻信號,它們兩者之間不會(huì)出現(xiàn)時(shí)間安排上的偏差。
圖10是展示在常規(guī)再現(xiàn)方式中和在說明的再現(xiàn)方式A中從各自處理系統(tǒng)輸出的信號的輸出時(shí)間安排的時(shí)間安排圖。在常規(guī)的再現(xiàn)方式中,讀出的每一幀與子碼值無關(guān)。在再現(xiàn)方式A中,根據(jù)讀出子碼值可跳過某些幀。在圖10的例子中,跳過具有0級和1級的音頻強(qiáng)度級的幀,也就是跳過其子碼的例證性5字節(jié)音頻ID的最低位字節(jié)是“0”或“1”的幀。這樣跳過幀N+1、N+2和N+4,并且根據(jù)讀出區(qū)域計(jì)算系統(tǒng)27的控制從記錄介質(zhì)18中讀出幀N+3、N+5和N+6。在這個(gè)例子中,相互同步地再現(xiàn)非跳過幀,也就是幀N+3、N+5和N+6的視頻和音頻信號。
圖11是展示另一個(gè)信息再現(xiàn)設(shè)備300的舉例性說明配置的方框圖,該設(shè)備是本發(fā)明的另一實(shí)施例。再現(xiàn)設(shè)備300不同于上述圖8設(shè)備200的是,用圖11中的子碼檢測系統(tǒng)B 41代替圖8中的系統(tǒng)A 28,并且在圖11中設(shè)有一個(gè)存儲(chǔ)電路42(存儲(chǔ)裝置)。由于設(shè)備300的其他部件及其操作都與設(shè)備200的相應(yīng)部件是一樣的,故在此省略了對其的說明。
子碼檢測系統(tǒng)B 41配置成能讀出在記錄介質(zhì)18上記錄的子碼,并且其后將這些子碼存儲(chǔ)在存儲(chǔ)電路42中。優(yōu)選的方案是,這些子碼在指定的時(shí)間間隔作為一數(shù)據(jù)塊從記錄介質(zhì)18中讀出。系統(tǒng)41還操作接收來自系統(tǒng)控制器29以指令其是再現(xiàn)(或跳過)的音頻數(shù)據(jù)的“再現(xiàn)方式”控制信號。作為響應(yīng),系統(tǒng)41讀出存儲(chǔ)在存儲(chǔ)器42中的子碼,并且根據(jù)將該幀的相關(guān)子碼與選擇的再現(xiàn)方式相比較來判斷是否再現(xiàn)所給幀的音頻/視頻數(shù)據(jù)。然后,系統(tǒng)41根據(jù)比較結(jié)果控制讀出區(qū)域計(jì)算系統(tǒng)27。
存儲(chǔ)電路42是一種半導(dǎo)體存儲(chǔ)裝置或類似裝置,例如隨機(jī)存取存儲(chǔ)器,并且,舉例來說,可以按下列子碼存儲(chǔ)。
地址 數(shù)據(jù)0000 第0幀子碼0001 第一幀子碼×××× 第N幀子碼現(xiàn)在參照圖12的流程圖闡述再現(xiàn)設(shè)備300的操作。在開始(步驟S61),子碼檢測系統(tǒng)B 41讀出所有存儲(chǔ)在記錄介質(zhì)18上的子碼,并且將這些子碼傳輸?shù)酱鎯?chǔ)器42存儲(chǔ)。子碼讀出過程是由提供給計(jì)算系統(tǒng)27控制指令的系統(tǒng)41完成,該系統(tǒng)41也向驅(qū)動(dòng)電路21提供控制信號,以便訪問盤的適當(dāng)區(qū)域。
接著,在步驟S62,根據(jù)用戶借助于輸入系統(tǒng)30按下鍵的數(shù)據(jù)輸入判定操作方式。在步驟S63,檢測系統(tǒng)41從存儲(chǔ)器42讀出特定幀的子碼,也就是在再現(xiàn)序列中選出來作為候選能重放音頻/視頻數(shù)據(jù)的下一幀的子碼。如果在步驟S64,判定當(dāng)前操作方式是常規(guī)再現(xiàn)方式,那么由于不跳過任何幀,所以子碼也就不相干了。在這種情況下,計(jì)算系統(tǒng)27計(jì)算下一幀的扇區(qū)號并且相應(yīng)地控制驅(qū)動(dòng)電路21(步驟S65)。其后,從記錄介質(zhì)18將下一幀的音頻/視頻數(shù)據(jù)讀出并提供給再現(xiàn)數(shù)據(jù)處理系統(tǒng)22(步驟S66)。然后,處理系統(tǒng)22將音頻數(shù)據(jù)和視頻數(shù)據(jù)分離,將音頻數(shù)據(jù)傳輸給展開系統(tǒng)25和將視頻數(shù)據(jù)傳輸給展開系統(tǒng)23(步驟S67,S68)。這些信號在各自的展開系統(tǒng)23,25中展開,并由各自的D/A轉(zhuǎn)換器24、26轉(zhuǎn)換成模擬信號,然后輸出。其后,為后續(xù)幀重復(fù)該過程。
如果在步驟S64,系統(tǒng)控制器29判定當(dāng)前操作方式是不同于常規(guī)再現(xiàn)方式的,例如,再現(xiàn)方式A(步驟S69)或再現(xiàn)方式B(步驟S71),那么按照所選擇的再現(xiàn)方式控制設(shè)備300輸出音頻和視頻數(shù)據(jù)。例如,象記錄設(shè)備200的情況一樣,可設(shè)計(jì)一些可選擇的再現(xiàn)方式以使設(shè)備300在重放時(shí)跳過特定類型的音頻。在這種情況下,如果與幀相關(guān)的子碼對應(yīng)于要避開的音頻類型,那么這些幀就被跳過。另一種再現(xiàn)方式也可包括進(jìn)來,它只允許重放一種類型的音頻而跳過所有其它類型的音頻。然而,象前面所述的那樣,再一種再現(xiàn)方式也可包括進(jìn)來,它執(zhí)行由用戶輸入的特定視和/或聽速度。
在圖12的例子中,如果在步驟S70判定由于一幀的子碼和再現(xiàn)方式A正相關(guān)而跳過該幀的話,(例如無聲情況跳過或聲樂跳過等),那么程序返回到步驟S63,在那里讀出后續(xù)幀的子碼并重復(fù)該過程。如果該幀不會(huì)跳過,則程序返回到步驟S65,如前面描述的,開始對該幀的音頻/視頻的重放過程。
圖13是說明在進(jìn)行從常規(guī)方式向再現(xiàn)方式A轉(zhuǎn)換中從相應(yīng)處理系統(tǒng)輸出的信號的時(shí)間安排的時(shí)間安排圖。當(dāng)開始打開設(shè)備電源或插入一個(gè)新的光盤等時(shí),用子碼讀出方式最初將子碼作為一塊讀出。按常規(guī)再現(xiàn)方式,從存儲(chǔ)電路42讀出相應(yīng)于當(dāng)前要重放幀的子碼,和從記錄介質(zhì)18中讀出該幀的視頻和音頻數(shù)據(jù)。將視頻數(shù)據(jù)提供給視頻展開系統(tǒng)23并由該系統(tǒng)將其展開,然后由視頻D/A轉(zhuǎn)換器系統(tǒng)24將其轉(zhuǎn)換成模擬視頻信號,并最后輸出。將音頻數(shù)據(jù)提供給音頻展開系統(tǒng)25并且由該系統(tǒng)將其展開,然后由音頻D/A轉(zhuǎn)換器26將其轉(zhuǎn)換成模擬音頻信號以便輸出。
按再現(xiàn)方式A,具有表明音頻強(qiáng)度級低于一特定級的子碼的幀,在重放時(shí)將被跳過。在這個(gè)例子中,跳過那些音頻強(qiáng)度級低于2級的幀而再現(xiàn)那些音頻強(qiáng)度高于1級的幀。由于相互同步地跳過視頻數(shù)據(jù)和音頻數(shù)據(jù),所以再現(xiàn)的視頻和音頻信號也是相互同步的。
應(yīng)該懂得,上述記錄和再現(xiàn)設(shè)備的實(shí)施例能夠以不超出本發(fā)明的思路和范圍的各種各樣的方式修改。例如,上面實(shí)施例特定地說明兩級音頻-低強(qiáng)度音頻和音樂之間的區(qū)別,而實(shí)施例也能修改成允許區(qū)別三種或多種類型的音頻信號。再則,替代在為區(qū)別音樂和非音樂的計(jì)算中對每塊檢測一個(gè)頻譜峰值P(f),這種區(qū)別也可以通過檢測多個(gè)相對于每塊最高強(qiáng)度的頻譜峰值,并且計(jì)算它們的在例如M塊上的連續(xù)性來實(shí)現(xiàn)。作為另一種可選方案,音樂與非音樂和/或無聲與非無聲的音頻之間的區(qū)別也可通過使用不同的最新提出的語言識別裝置中的一種裝置來區(qū)別,并作為子碼記錄區(qū)別的結(jié)果。
再者,雖然上面的實(shí)施例是針對這樣情況的,在其中,跳躍是以逐幀為基礎(chǔ)發(fā)生的,但是在音頻系統(tǒng)中由于幀之間的轉(zhuǎn)接而產(chǎn)生的噪聲量在每次跳躍前和后可以通過交叉衰減而使其最小??晒┻x擇的方法是,可通過檢測交零點(diǎn)方式控制轉(zhuǎn)接。
此外,在上面實(shí)施例中,重放和跳過都是根據(jù)子碼內(nèi)容以逐幀為基礎(chǔ)控制的。但是,一個(gè)短的音頻/視頻段,例如一或兩幀段的重放在許多場合也許被作為噪音識別。這問題可通過事先設(shè)置要重放的幀的最短連續(xù)序列加以解決。然后即使幀的子碼表示跳過,但只要最短序列還沒有到達(dá),將會(huì)重放這些幀而不會(huì)跳過。
作為另一種改進(jìn)型,可以以每兩幀而不是象描述的那樣以每幀產(chǎn)生子碼A(它表示音頻強(qiáng)度的特征)。再者,基于子碼A的另一種再現(xiàn)方式可以包括進(jìn)來,它允許用戶自動(dòng)地跳過音頻信號的大聲部分(音強(qiáng)度級),例如大聲的音樂,而重放低強(qiáng)度級的音頻。
再有,雖然上面實(shí)施例直接針對使用相關(guān)于音頻強(qiáng)度級和音樂的子碼的應(yīng)用方式,但是通過產(chǎn)生表示其它音頻特征的子碼,如識別演講者的子碼能實(shí)現(xiàn)不同形式的再現(xiàn)。
雖然結(jié)合本發(fā)明的優(yōu)選實(shí)施例具體地展示和描述了本發(fā)明,但是本技術(shù)領(lǐng)域具有一般技能的人會(huì)理解,可以不超出本發(fā)明的思路和范圍對揭示的實(shí)施例進(jìn)行各種改變。因此,打算將所附的權(quán)利要求解釋為包括在這里所描述的實(shí)施例以及其所有的等同物。
權(quán)利要求
1.一種用于將至少一個(gè)音頻信號記錄到記錄介質(zhì)上的信息記錄設(shè)備,包括用于檢測該音頻信號的特征的檢測裝置;和用于將相應(yīng)于所述檢測特征的附加信息與該音頻信號一起記錄到記錄介質(zhì)上的記錄裝置。
2.根據(jù)權(quán)利要求1所述的信息記錄設(shè)備,其中,所述的記錄裝置還將一個(gè)與該音頻信號相關(guān)連的視頻信號同該音頻信號和所述的附加信息一起記錄到所述的記錄介質(zhì)上。
3.根據(jù)權(quán)利要求1所述的信息記錄設(shè)備,其中,所述的記錄裝置以一種分布方式,將該音頻信號和所述的附加信息記錄在所述的記錄介質(zhì)的一個(gè)公共區(qū)域中。
4.根據(jù)權(quán)利要求3所述的信息記錄設(shè)備,其中,針對多個(gè)該音頻信號塊的每一塊,記錄所述的附加信息。
5.根據(jù)權(quán)利要求1所述的信息記錄設(shè)備,其中,將所述的附加信息記錄在所述的記錄介質(zhì)的一個(gè)預(yù)定區(qū)域中,該區(qū)域不同于在其上至少將記錄該音頻信號的區(qū)域。
6.根據(jù)權(quán)利要求5所述的信息記錄設(shè)備,其中,在所述的音頻信號不被記錄的時(shí)間間隔里,將所有所述的附加信息記錄在所述的預(yù)定區(qū)域中。
7.根據(jù)權(quán)利要求1所述的信息記錄設(shè)備,其中,該檢測裝置在預(yù)定的時(shí)間間隔周期性地在該音頻信號上進(jìn)行正交變換,并且通過確定所得能量成分和能量分布之間的相關(guān)性檢測該音頻信號的特征。
8.根據(jù)權(quán)利要求7所述的信息記錄設(shè)備,其中,如果相互在預(yù)定幅度范圍內(nèi)的頻譜峰值的平均連續(xù)長度大于特定值,則所述的檢測裝置檢測為音樂的特征。
9.根據(jù)權(quán)利要求7所述的信息記錄設(shè)備,還包括一個(gè)用于接收多種類型模擬音頻信號和根據(jù)選擇的切換狀態(tài)在其輸出提供所述的音頻信號的輸入開關(guān),并且其中,所述的檢測裝置檢測作為所選模擬音頻信號類型的函數(shù)的音頻信號的特征。
10.一種用于將至少一個(gè)音頻信號記錄到記錄介質(zhì)上的信息記錄方法,包括的步驟是檢測音頻信號的特征;以及將相應(yīng)于檢測特征的附加信息與音頻信號一起記錄到記錄介質(zhì)上。
11.一種用于再現(xiàn)至少一個(gè)相應(yīng)于記錄在記錄介質(zhì)上的音頻數(shù)據(jù)的音頻信號的信息再現(xiàn)設(shè)備,該記錄介質(zhì)上也記錄有相關(guān)于至少該音頻信號的附加信息,該信息再現(xiàn)設(shè)備包括用于在任何該音頻信號的相應(yīng)部分再現(xiàn)之前,讀出該附加信息部分的閱讀裝置;用于根據(jù)所述的附加信息的所述讀出部分和一個(gè)當(dāng)前操作方式,確定是否再現(xiàn)所述的該音頻信號的相應(yīng)部分的決策裝置;以及用于根據(jù)所述決策裝置的決定,控制該音頻信號相應(yīng)部分再現(xiàn)的控制裝置。
12.根據(jù)權(quán)利要求11所述的信息再現(xiàn)設(shè)備,其中相應(yīng)于該音頻信號的視頻信號也記錄在所述的記錄介質(zhì)上;所述的閱讀裝置在任何該視頻信號和音頻信號的相應(yīng)部分再現(xiàn)前讀出該附加信息部分;所述的決策裝置根據(jù)附加信息的讀出部分和當(dāng)前的操作方式,確定是否再現(xiàn)相應(yīng)于附加信息讀出部分的音頻信號部分和視頻信號部分;所述的控制裝置根據(jù)所述的決策裝置的決定,控制視頻信號和音頻信號部分的再現(xiàn)。
13.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,所述的控制裝置控制再現(xiàn),因而以相互同步方式再現(xiàn)視頻信號和音頻信號。
14.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,以分布方式將附加信號記錄在記錄有視頻信號和音頻信號的記錄介質(zhì)的一個(gè)區(qū)域中。
15.根據(jù)權(quán)利要求14所述的信息再現(xiàn)裝置,其中,所述的音頻信號和相關(guān)的視頻信號按塊記錄在記錄介質(zhì)上,并且為這樣記錄的視頻信號和音頻信號的每塊記錄附加信號。
16.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,將附加信號記錄在所述的記錄介質(zhì)的一個(gè)預(yù)定區(qū)域中,該區(qū)域不同于在其上記錄有視頻信號和音頻信號的區(qū)域。
17.根據(jù)權(quán)利要求16所述的信息再現(xiàn)設(shè)備,其中,所述的閱讀裝置在任何所述的音頻和視頻信號再現(xiàn)前,作為一塊讀出所有所述的附加信息。
18.根據(jù)權(quán)利要求17所述的信息再現(xiàn)設(shè)備,還包括用于存儲(chǔ)已經(jīng)由所述的閱讀裝置以一個(gè)塊讀出的附加信息的存儲(chǔ)裝置,其中所述的決策裝置作為存儲(chǔ)在存儲(chǔ)裝置中的附加信息部分的功能,能操作確定是否再現(xiàn)相應(yīng)于附加信息部分的視頻信號和音頻信號部分。
19.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,附加信息表示音頻信號的一個(gè)強(qiáng)度等級。
20.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,附加信息表示音頻信號的一種類型。
21.根據(jù)權(quán)利要求12所述的信息再現(xiàn)設(shè)備,其中,所述的控制裝置控制視頻信號和音頻信號的再現(xiàn),使得再現(xiàn)的視頻和音頻信號部分和不再現(xiàn)的視頻和音頻信號部分之間的比例是一個(gè)特定的值。
22.一種用于再現(xiàn)至少一個(gè)相應(yīng)于記錄在記錄介質(zhì)上的音頻數(shù)據(jù)的音頻信號的信息再現(xiàn)方法,該記錄介質(zhì)上也記錄有相關(guān)于至少該音頻信號的附加信息,該信息再現(xiàn)方法包括的步驟是在任何該音頻信號的相應(yīng)部分再現(xiàn)前,讀出該附加信息部分;根據(jù)附加信息的讀出部分和一個(gè)當(dāng)前的操作方式,確定是否再現(xiàn)相應(yīng)于附加信息讀出部分的該音頻信號部分;以及根據(jù)判斷步驟,控制所述的相應(yīng)的音頻信號部分的再現(xiàn)。
23.一種用于至少將一個(gè)音頻信號數(shù)字地記錄到記錄介質(zhì)上的記錄設(shè)備,包括一個(gè)配置成檢測多個(gè)時(shí)間段音頻信號的每段的特征的音頻特征提取系統(tǒng);以及一個(gè)用于將識別每個(gè)所述音頻信號時(shí)間段的所述檢測特征的特征信息與相應(yīng)于該音頻信號的數(shù)據(jù)一起記錄在記錄介質(zhì)上的記錄處理系統(tǒng)。
24.根據(jù)權(quán)利要求23所述的記錄設(shè)備,其中,記錄處理系統(tǒng)還操作將相應(yīng)于該音頻信號的視頻信號與該音頻信號和所述的特征信息一起記錄到記錄介質(zhì)上。
25.根據(jù)權(quán)利要求23所述的記錄設(shè)備,其中,該記錄處理系統(tǒng)以分布方式將所述的特征信息記錄在記錄介質(zhì)的至少要記錄該音頻信號的區(qū)域中。
26.根據(jù)權(quán)利要求23所述的記錄設(shè)備,其中,所述的音頻特征提取系統(tǒng)配置成檢測至少一個(gè)所述的特征,該特征是從由一個(gè)音頻功率級和一個(gè)音樂特征組成的組中選取的。
27.根據(jù)權(quán)利要求23所述的記錄設(shè)備,其中,將所述的特征信息記錄在記錄介質(zhì)的預(yù)定的不同于至少記錄該音頻信號區(qū)域的區(qū)域中。
28.根據(jù)權(quán)利要求27所述的記錄設(shè)備,其中,在所述的音頻信號不被記錄在所述記錄介質(zhì)的時(shí)間間隔里,將所有所述的檢測出的特征記錄在預(yù)定的區(qū)域中。
29.根據(jù)權(quán)利要求24所述的記錄設(shè)備,其中,每個(gè)所述的時(shí)間段包括至少一幀的音頻和視頻信號。
30.根據(jù)權(quán)利要求29所述的記錄設(shè)備,其中,所述的音頻特征提取系統(tǒng)操作為對每個(gè)預(yù)定的第一組的幀檢測一個(gè)音頻級特征和對每個(gè)預(yù)定的第二組的幀檢測一個(gè)音頻類型特征,而該預(yù)定的第二組幀比所述的預(yù)定的第一組幀大。
31.根據(jù)權(quán)利要求30所述的記錄設(shè)備,其中,所述的預(yù)定的第一組幀由一個(gè)單幀構(gòu)成。
32.根據(jù)權(quán)利要求23所述的記錄設(shè)備,與其結(jié)合在一起還包括,一個(gè)用于根據(jù)各個(gè)所述段的所述特征信息和一個(gè)與至少一個(gè)所述特征關(guān)連的選擇再現(xiàn)方式之間的相關(guān)性,選擇性地再現(xiàn)所述音頻信號的所述時(shí)間段的再現(xiàn)系統(tǒng)。
33.根據(jù)權(quán)利要求32所述的記錄設(shè)備,其中,所述的選擇再現(xiàn)方式是一種只再現(xiàn)具有特定特征的音頻信號而跳過其他音頻信號的方式。
34.根據(jù)權(quán)利要求32所述的記錄設(shè)備,其中,所述的選擇再現(xiàn)方式是一種只再現(xiàn)沒有特定特征的音頻信號而跳過其他音頻信號的方式。
35.一種用于將至少一個(gè)音頻信號數(shù)字地記錄到記錄介質(zhì)上的記錄方法,包括的步驟是檢測多時(shí)間段音頻信號每段的特征;產(chǎn)生識別每個(gè)所述音頻信號時(shí)間段的所述檢測特征的特征信息;及將所述的特征信息與對應(yīng)于該音頻信號的數(shù)據(jù)一起記錄在記錄介質(zhì)上。
36.一種用于再現(xiàn)至少一個(gè)相應(yīng)于記錄在記錄介質(zhì)上的音頻數(shù)據(jù)的音頻信號的信息再現(xiàn)設(shè)備,該記錄介質(zhì)上也記錄有相對于至少該音頻信號的特征信息,該信息再現(xiàn)設(shè)備包括配置成在任何音頻信號相應(yīng)部分重放前,讀出特征信息部分的數(shù)據(jù)閱讀系統(tǒng);用于根據(jù)所述特征信息讀出部分和當(dāng)前的一操作方式,確定是否再現(xiàn)所述音頻信號相關(guān)部分的處理電路;以及用于根據(jù)所述處理電路的判斷,控制音頻信號部分再現(xiàn)的控制器。
37.根據(jù)權(quán)利要求36所述的信息再現(xiàn)設(shè)備,其中,相應(yīng)于該音頻信號的視頻信號也記錄在記錄介質(zhì)上;所述數(shù)據(jù)閱讀系統(tǒng)在任何視頻信號和音頻信號的相應(yīng)部分重放前,讀出該特征信息部分;所述的處理電路根據(jù)該特征信息的讀出部分和當(dāng)前操作方式,確定是否再現(xiàn)對應(yīng)于特征信息的讀出部分的音頻信號部分和視頻信號部分;以及所述的控制器根據(jù)所述處理電路的判斷,控制音頻信號和視頻信號部分的再現(xiàn)。
38.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,所述的控制器是這樣控制再現(xiàn)的,以致于視頻信號和音頻信號相互同步地再現(xiàn)。
39.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,所述的特征信息以分布方式記錄在已記錄有視頻信號和音頻信號的記錄介質(zhì)的一個(gè)區(qū)域中。
40.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,所述的音頻信號和相關(guān)的視頻信號按塊記錄在記錄介質(zhì)上,并且對這樣記錄的視頻信號和音頻信號的每塊記錄所述的特征信息。
41.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,對記錄在記錄介質(zhì)上的多幀視頻和音頻信號的每一組記錄所述的特征信息。
42.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,在記錄介質(zhì)的一特定區(qū)域里記錄特征信息,該特定區(qū)域不同于記錄視頻信息和音頻信息的區(qū)域。
43.根據(jù)權(quán)利要求42所述的信息再現(xiàn)設(shè)備,其中,該數(shù)據(jù)閱讀系統(tǒng)配置成在一個(gè)配給的無音頻信號再現(xiàn)的時(shí)間間隔里,讀出特征信息。
44.根據(jù)權(quán)利要求43所述的信息再現(xiàn)設(shè)備,還包括一個(gè)用于存儲(chǔ)由所述的數(shù)據(jù)閱讀系統(tǒng)已讀出的特征信息的存儲(chǔ)器,其中,該處理電路根據(jù)存儲(chǔ)在存儲(chǔ)器中的特征信息部分,確定是否再現(xiàn)相應(yīng)于特征信息部分的視頻信號和音頻信號的部分。
45.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,該特征信息表示該音頻信號的強(qiáng)度。
46.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中,該特征信息表示該音頻信號的類型。
47.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,其中控制器控制視頻信號和音頻信號的再現(xiàn),使得在再現(xiàn)的視頻和音頻信號部分與不再現(xiàn)的視頻和音頻信號部分之間的比率是一特定值。
48.根據(jù)權(quán)利要求37所述的信息再現(xiàn)設(shè)備,還包括一個(gè)用于使用戶能選擇一種與至少一種音頻信號特征相關(guān)的再現(xiàn)方式的輸入系統(tǒng)。
49.根據(jù)權(quán)利要求48所述的信息再現(xiàn)設(shè)備,其中,所述的再現(xiàn)方式是一種只再現(xiàn)具有特定特征的音頻信號而跳過其他音頻信號的方式。
50.根據(jù)權(quán)利要求48所述的信息再現(xiàn)設(shè)備,其中,所述的再現(xiàn)方式是一種只再現(xiàn)沒有特定特征的音頻信號而跳過其他音頻信號的方式。
全文摘要
一種實(shí)現(xiàn)接收模擬音頻和視頻信號,將其數(shù)字化和壓縮,并將壓縮的音頻和視頻信號記錄在數(shù)字記錄介質(zhì)上的記錄設(shè)備。當(dāng)接收和記錄音頻和視頻信號時(shí),對音頻信號的時(shí)間段作某種特征分析,如是否是對應(yīng)于器樂、聲樂或交談的時(shí)間段。并對應(yīng)于特征分析作一內(nèi)容表,并將其數(shù)字化地存儲(chǔ)在存儲(chǔ)介質(zhì)上。結(jié)果,在全部時(shí)間上將記錄的音頻信號特征化,如在逐幀基礎(chǔ)上。再現(xiàn)設(shè)備能使使用者有選擇地再現(xiàn)所記錄的音頻和視頻段。
文檔編號G11B27/11GK1197984SQ9712646
公開日1998年11月4日 申請日期1997年12月13日 優(yōu)先權(quán)日1996年12月13日
發(fā)明者高橋孝夫, 秋葉俊哉, 荒井尚久, 富田真己, 太田正志, 村林升, 水藤太郎 申請人:索尼公司