專利名稱:對(duì)音頻信號(hào)進(jìn)行后處理的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總的發(fā)明構(gòu)思涉及一種對(duì)音頻信號(hào)進(jìn)行后處理的方法和設(shè)備。
背景技術(shù):
通過使用由制造商提供的流派信息(經(jīng)典、爵士、搖滾等)來對(duì)音樂進(jìn) 行分類,大多數(shù)聲音再現(xiàn)裝置采用了基于流派分類的均衡濾波器。均衡濾波 器通過調(diào)整音頻信號(hào)的頻率特性來使得聲音再現(xiàn)裝置輸出與所選擇的流派相 應(yīng)的均衡的音頻信號(hào)。然而,由于數(shù)字音樂源的數(shù)量不斷地增加,從而導(dǎo)致巨大的音樂數(shù)據(jù)庫(kù), 所以聽眾需要各種訪問方法來搜索期望的音樂。所述訪問方法之一 包括根據(jù) 情緒(mode)來對(duì)音樂分類。音頻靈敏度對(duì)于消費(fèi)者而言已變成越來越重要 的元素,因此,音頻信號(hào)的多種音效是必要的。與傳統(tǒng)音樂分類方法不同,根據(jù)情緒的音樂分類不僅考慮音頻信號(hào)的頻 率特性,而且還考慮音頻信號(hào)的音色(timbre )、聲強(qiáng)(sound intensity)和節(jié)奏 (rhythm )。然而,根據(jù)傳統(tǒng)的均衡方法,由于只能對(duì)頻率特性進(jìn)行調(diào)整,所以不能 基于根據(jù)情緒的音樂分類來調(diào)整音頻信號(hào)。發(fā)明內(nèi)容本發(fā)明總的發(fā)明構(gòu)思提供了一種對(duì)音頻信號(hào)進(jìn)行后處理的方法和設(shè)備, 由此可基于根據(jù)情緒的音樂分類來調(diào)整音頻信號(hào)。本發(fā)明總的發(fā)明構(gòu)思的其他方面和實(shí)用性將在下面的描述中被部分地闡 述,部分地,將從描述中變得清楚,或可通過實(shí)施本發(fā)明總的發(fā)明構(gòu)思被獲知。
通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的方法來實(shí)現(xiàn)本發(fā)明總的發(fā)明構(gòu)思的以上和/或其他方面和實(shí)用性,所述方法包括選4奪基于音頻信號(hào)的音色、 聲強(qiáng)和節(jié)奏中的至少一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模式之一;以及基于 選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)。 修改步驟可包括增加或減小音頻信號(hào)的采樣率。修改步驟可包括將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào);將頻域的音頻信 號(hào)的位置移動(dòng)預(yù)定頻率到較高頻帶;以及放大移動(dòng)后的音頻信號(hào)的預(yù)定頻帶 中包含的音頻信號(hào)能量。放大音頻信號(hào)能量的步驟可包括放大2KHz和3KHz之間的頻帶中包 含的音頻信號(hào)能量。修改步驟可包括將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào);將頻域的音頻信 號(hào)的位置移動(dòng)預(yù)定頻率到較低頻帶;以及減小移動(dòng)后的音頻信號(hào)的預(yù)定頻帶 中包含的音頻信號(hào)能量。減小音頻信號(hào)能量的步驟可包括減小2KHz和20KHz之間的頻帶中包 含的音頻信號(hào)能量。修改步驟可包括將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào);使頻域的音頻信 號(hào)的動(dòng)態(tài)范圍變寬;以及放大動(dòng)態(tài)范圍變寬的音頻信號(hào)的預(yù)定頻帶中包含的 音頻信號(hào)能量。放大音頻信號(hào)能量的步驟可包括放大基于80Hz的預(yù)定頻帶和基于 5KHz的預(yù)定頻帶中包含的音頻信號(hào)能量。修改步驟可包括將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào);將頻域的音頻信 號(hào)的動(dòng)態(tài)范圍變窄;以及放大動(dòng)態(tài)范圍變窄的音頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。放大音頻信號(hào)能量的步驟可包括放大6KHz和20KHz之間的頻帶中包 含的音頻信號(hào)能量。還可通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備來實(shí)現(xiàn)本發(fā)明總的發(fā)明 構(gòu)思的以上和/或其他方面和實(shí)用性,所述設(shè)備包括模式選擇器,選擇基于 音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少 一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模 式之一;和處理單元,基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的音色、 聲強(qiáng)和節(jié)奏中的至少一個(gè)。還可通過提供一種存儲(chǔ)有用于執(zhí)行對(duì)音頻信號(hào)進(jìn)行后處理的方法的計(jì)算
機(jī)可讀程序的計(jì)算機(jī)可讀記錄介質(zhì)來實(shí)現(xiàn)本發(fā)明總的發(fā)明構(gòu)思的以上和/或其他方面和實(shí)用性,所述方法包括選擇基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏 中的至少一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇的音頻 信號(hào)處理模式來修改音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)。還可通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備來實(shí)現(xiàn)本發(fā)明總的發(fā)明 構(gòu)思的以上和/或其他方面和實(shí)用性,所述設(shè)備包括模式選擇器,基于多種 不同的人類情緒來選擇多個(gè)音頻信號(hào)處理模式之一;和處理單元,基于選擇 的音頻信號(hào)處理模式來修改音頻信號(hào)的頻率、動(dòng)態(tài)范圍和采樣率中的至少一 個(gè)。所述多種不同的人類情緒可包括充滿活力、沮喪、焦慮和滿足中的至少 一個(gè)。當(dāng)選擇了與充滿活力的人類情緒相應(yīng)的音頻信號(hào)處理模式時(shí),處理單元 可將音頻信號(hào)的位置移動(dòng)到較高頻帶,并放大音頻信號(hào)。處理單元可放大2KHz和3KHz之間的頻帶中包含的音頻信號(hào)能量。 當(dāng)選擇了與沮喪的人類情緒相應(yīng)的音頻信號(hào)處理模式時(shí),處理單元可將音頻信號(hào)的位置移動(dòng)到較低頻帶,并可減小音頻信號(hào)。處理單元可》文大2KHz和20KHz之間的頻帶中包含的音頻信號(hào)能量。 當(dāng)選擇了與焦慮的人類情緒相應(yīng)的音頻信號(hào)處理模式時(shí),處理單元可使音頻信號(hào)的動(dòng)態(tài)范圍變寬,并放大音頻信號(hào)。處理單元可放大80Hz和5KHz周圍的頻帶中包含的音頻信號(hào)能量。 當(dāng)選擇了與滿足的人類情緒相應(yīng)的音頻信號(hào)處理模式時(shí),處理單元可將音頻信號(hào)的動(dòng)態(tài)范圍變窄,并可放大音頻信號(hào)。處理單元可放大6KHz和20KHz之間的頻帶中包含的音頻信號(hào)能量。 所述多種人類情緒可包括高興、悲傷、不平靜和平靜中的至少一個(gè)。 音頻信號(hào)處理模式可以基于Thayer情緒模型。還可通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備來實(shí)現(xiàn)本發(fā)明總的發(fā)明 構(gòu)思的以上和/或其他方面和實(shí)用性,所述設(shè)備包括模式選擇器,選擇基于 音頻信號(hào)的音色、聲強(qiáng)、節(jié)奏中的至少一個(gè)的多個(gè)音頻信號(hào)處理模式之一; 和處理單元,基于選"t奪的音頻信號(hào)處理模式來調(diào)整音頻信號(hào)的頻率、動(dòng)態(tài)范 圍、采樣率中的至少一個(gè)。在第一模式下,處理單元可將音頻信號(hào)的位置移動(dòng)到較高頻帶,并可放
大音頻信號(hào)。在第二模式下,處理單元可將音頻信號(hào)的位置移動(dòng)到較低頻帶,并可減 小音頻信號(hào)。在第三模式下,處理單元可使音頻信號(hào)的動(dòng)態(tài)范圍變寬,并可放大音頻 信號(hào)。在第四;^莫式下,處理單元可將音頻信號(hào)的動(dòng)態(tài)范圍變窄,并可放大音頻信號(hào)。還可通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的方法來實(shí)現(xiàn)本發(fā)明總的發(fā)明構(gòu)思的以上和/或其他方面和實(shí)用性,所述方法包括選擇基于多種不同的人 類情緒的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇的音頻信號(hào)處理模式來 修改音頻信號(hào)的頻率、動(dòng)態(tài)范圍和采樣率中的至少 一個(gè)。所述多種不同的人類情緒可包括充滿活力、沮喪、焦慮和滿足中的至少 一個(gè)。還可通過提供一種對(duì)音頻信號(hào)進(jìn)行后處理的方法來實(shí)現(xiàn)本發(fā)明總的發(fā)明 構(gòu)思的以上和/或其他方面和實(shí)用性,所述方法包括選擇基于音頻信號(hào)的音 色、聲強(qiáng)、節(jié)奏中的至少一個(gè)的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇 的音頻信號(hào)處理模式來調(diào)整音頻信號(hào)的頻率、動(dòng)態(tài)范圍、采樣率中的至少一個(gè)。
從下面結(jié)合附圖對(duì)實(shí)施例的描述,本發(fā)明總的發(fā)明構(gòu)思的這些和/或其他 方面和實(shí)用性將變得清楚并更容易理解,其中圖1是根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的對(duì)音頻信號(hào)進(jìn)行后處理的設(shè) 備的框圖;圖2是示出Thayer情緒模型的示圖;圖3是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的處理模式的物理屬性及 其處理方法的表; .圖4是示出根據(jù)本發(fā)明總的方面構(gòu)思的實(shí)施例的其位置被移動(dòng)到較高頻 帶的音頻信號(hào)的示圖;圖5是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在第一處理模式下處理 單元使用的濾波器的特性的示圖; 圖6是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其位置被移動(dòng)到較低頻帶的音頻信號(hào)的示圖;圖7是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在第二處理模式下處理 單元使用的濾波器的特性的示圖;圖8是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其動(dòng)態(tài)范圍變寬的音頻 信號(hào)的示圖;圖9是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在第三處理模式下處理 單元使用的濾波器的特性的示圖;圖10是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在第四處理模式下產(chǎn) 生具有慢速節(jié)奏的音頻信號(hào)的方法的示圖;圖11是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其動(dòng)態(tài)范圍變窄的音 頻信號(hào)的示圖;和圖12是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在第四處理模式下處 理單元使用的濾波器的特性的示圖。
具體實(shí)施方式
示出,其中,相同的標(biāo)號(hào)始終表示相同的部件。以下通過參照附圖來描述所 述實(shí)施例,以解釋本發(fā)明總的發(fā)明構(gòu)思。圖1是根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備的框圖。參照?qǐng)D1,所述設(shè)備包括模式選擇器110和處理單元120。 模式選擇器110選擇多個(gè)音頻信號(hào)處理模式中的一個(gè),其中,所述音頻信號(hào)處理模式可基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏被分類。然而,所述處理模式并不限于此,可包括其他的音頻信號(hào)處理模式。當(dāng)用戶通過使用輸入單元輸入信號(hào)以選擇預(yù)定處理模式時(shí),多個(gè)處理模式之一可被選擇。在當(dāng)前實(shí)施例中,支持四種處理模式,每種處理模式定義物理屬性(例 如,音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏)以提供基于人的情感的四種聲覺(sound sensation )。基于Thayer情緒模型來設(shè)置每種處理模式的物理屬性。圖2是示出Thayer情緒模型的示圖。 Thayer情緒模型通過分析重音(strss )和能量(energy)如何影響人的情 緒來定義四種處理模式。即,當(dāng)聽眾收聽具有高能量級(jí)的音樂時(shí),聽眾的大 腦分泌的腎上腺素的量增加,因此,聽眾體驗(yàn)到想要運(yùn)動(dòng)或者活躍起來的欲 望以及充滿活力的感覺。因此,聽眾可能邊唱邊動(dòng)、打節(jié)拍,或隨音樂跳舞。 相反,具有高重音級(jí)的音樂使聽眾的大腦分泌皮質(zhì)醇(Cortisol)(就是公知的 與重音有關(guān)的荷爾蒙)。因此,聽眾可能體驗(yàn)到不穩(wěn)定的情緒,例如沮喪或焦 慮。Thayer通過使用如上所述的相關(guān)性定義了四種處理模式,其中,第一模 式表示為"充滿活力",第二模式表示為"沮喪",第三模式表示為"焦慮/狂 躁",第四模式表示為"滿足"。表示為"充滿活力"的第一模式是被設(shè)置以表示愉快-精力充沛并高興 (即,快樂)的情緒的模式。"精力充沛"模式下的音頻信號(hào)處于低重音和高 能量的狀態(tài)。因此,由于音頻信號(hào)的動(dòng)態(tài)和高能量的品質(zhì)導(dǎo)致"精力充沛" 模式可能是喧鬧和強(qiáng)勁的,但由于音頻信號(hào)的低級(jí)別的重音品質(zhì)導(dǎo)致對(duì)聽眾 仍流露出低級(jí)別的重音。提供第一模式的情緒的音樂的示例是Rossini的 "William Tell Overture"。表示為"沮喪"的第二模式是被設(shè)置以表示平靜并有些悲傷的情緒的模 式。"沮喪"模式下的音頻信號(hào)處于高重音和低能量的狀態(tài)。提供第二模式的 情緒的音樂的示例是Stravinsky的"Firebird"。表示"焦慮/狂躁"的第三模式是被設(shè)置以表示爆發(fā)和狂熱的情緒(例如, 不平靜)的模式。"焦慮/狂躁"模式下的音頻信號(hào)處于高重音和高能量的狀 態(tài)。提供第三模式的情緒的音樂的示例是Berg的"Lulu"。另外, 一般"搖 滾"、"重金屬,,和"龐克"音樂對(duì)應(yīng)于第三模式。表示"滿足"的第四模式是被設(shè)置以表示非常高興、平靜和積極的情緒 的模式。"滿足"模式下的音頻信號(hào)處于低重音和低能量的狀態(tài)。提供第四模 式的情緒的音樂的示例是Bach的"Jesus, Joy of Man's Desire"??赏ㄟ^上述物理屬性(例如,音頻信號(hào)的音調(diào)(大調(diào)或小調(diào))、音色、聲 強(qiáng)和節(jié)奏)來定義四種處理模式中的每一種。在本實(shí)施例中,由于音調(diào)(tone)識(shí)別方面存在困難,所以排除了音調(diào)。因此,在本實(shí)施例中,通過使用上面 提到的三種屬性(排除音調(diào))來定義四種模式中的每一種,并根據(jù)所選擇的 模式來執(zhí)行處理。
音頻信號(hào)的音色和節(jié)奏與重音級(jí)有關(guān),音頻信號(hào)的聲強(qiáng)與能量級(jí)有關(guān)。聲強(qiáng)使用均方根(RMS)功率來形成音頻信號(hào),其中,高聲強(qiáng)使得聲音聽起來高,低聲強(qiáng)使得聲音聽起來低。音色指示由音頻信號(hào)產(chǎn)生的聲音是歡快的還是低沉的,或者基音是高還是低。節(jié)奏指示音頻信號(hào)的速度(tempo)是快 還是慢,或者由音頻信號(hào)產(chǎn)生的聲音的強(qiáng)度是強(qiáng)還是弱。例如,圖2的處理單元可基于所選擇的處理;漠式來修改音頻信號(hào)的音色、 聲強(qiáng)和節(jié)奏??赏ㄟ^收音機(jī)或其他媒體播放器實(shí)時(shí)輸出音頻信號(hào)。另外,音頻信號(hào)可存在于存儲(chǔ)的文件(例如,mp3文件)中以由媒體播放器在稍后的時(shí)間輸出。現(xiàn)在將參照?qǐng)D3至圖11來詳細(xì)描述處理單元120的操作。 圖3是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的處理模式的物理屬性及 其處理方法的表。參照?qǐng)D3,第一處理模式是表示"充滿活力"的模式,并被設(shè)置為用于 將音頻信號(hào)處理為具有中聲強(qiáng)、高基音(pitch)音色以及快速節(jié)奏。圖2的處理單元120具有兩種處理方法來實(shí)現(xiàn)^皮設(shè)置為第一處理;漠式的 物理屬性,其中, 一種方法是時(shí)域的處理方法,另一種方法是頻域的處理方法。在時(shí)域,處理單元120增加音頻信號(hào)的采樣率。采樣率是將聲音轉(zhuǎn)換成 與1秒相應(yīng)的樣本的比率。例如,44.1KHz的采樣率表示1秒內(nèi)對(duì)聲音進(jìn)行 了 44100次采樣。采樣率的增加表示1秒內(nèi)獲得更多的樣本。增加采樣率的 原因在于,采樣率的增加導(dǎo)致高基音音色和快的速度。然而,增加采樣率的方法不能被應(yīng)用于實(shí)時(shí)輸出的音頻信號(hào),但是能被 應(yīng)用于存儲(chǔ)的音頻信號(hào),例如,mp3文件。在頻域,處理單元120將音頻信號(hào)的位置移動(dòng)到較高頻帶,并放大與 2KHz和3KHz之間的頻帶相應(yīng)的音頻信號(hào)能量。圖4是示出根據(jù)本發(fā)明總的方面構(gòu)思的實(shí)施例的其位置被移動(dòng)到較高頻 帶的音頻信號(hào)的示圖。在圖4中,假設(shè)為正弦波的原始音頻信號(hào)410和通過移動(dòng)原始音頻信號(hào) 410的位置而獲得的音頻信號(hào)420被示出??赏ㄟ^將原始音頻信號(hào)410的頻 率乘以2來獲得音頻信號(hào)420。因此,位于20Hz的信號(hào)被移動(dòng)到40Hz,位于lKHz的信號(hào)被移動(dòng)到2KHz。即,如果將音頻信號(hào)移動(dòng)到較高頻帶,則音頻信號(hào)具有高基音音色。
然而,移動(dòng)頻帶的方法不限于此。即,能移動(dòng)頻帶的所有方法均可使用。
圖5是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在圖3的第一處理才莫式 下圖2的處理單元120使用的濾波器的特性的示圖。
圖5示出函數(shù)值基于2KHz逐漸減小的曲線。如果使用第一處理模式下 的濾波器來對(duì)音頻信號(hào)進(jìn)行濾波,則如圖5所示,2KHz和3KHz之間的頻帶 中的音頻信號(hào)的能量可被增加。
回頭參照?qǐng)D3,第二處理模式是表示"沮喪"的模式,并被設(shè)置為將音 頻信號(hào)處理為具有低聲強(qiáng)、低基音音色以及慢速節(jié)奏。
與第一處理模式相似,處理單元120具有兩種處理方法來實(shí)現(xiàn)第二處理 模式下的物理屬性,其中, 一種方法是時(shí)域的處理方法,另一種方法是頻域 的處理方法。
在時(shí)域中,處理單元120減小音頻信號(hào)的采樣率。因?yàn)椴蓸勇实臏p小導(dǎo) 致低基音音色和慢速,所以減小采樣率。
然而,減小采樣率的方法不能被應(yīng)用于實(shí)時(shí)輸出的音頻信號(hào),但是可被 應(yīng)用于存儲(chǔ)的音頻信號(hào),例如,mp3文件。
在頻域,處理單元120將音頻信號(hào)的位置移動(dòng)到較低頻帶,并減小與 2KHz和20KHz之間的頻帶相應(yīng)的音頻信號(hào)能量。可以按任何順序執(zhí)行音頻 信號(hào)的移動(dòng)和減小操作。
圖6是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其位置被移動(dòng)到較低頻 帶的音頻信號(hào)的示圖。
在圖6中,用正弦波表示的原始音頻信號(hào)610和通過移動(dòng)原始音頻信號(hào) 610的位置而獲得的音頻信號(hào)620被示出??赏ㄟ^將原始音頻信號(hào)610的頻 率乘以0.5來獲得音頻信號(hào)620。
因此,位于20Hz的信號(hào)被移動(dòng)到10Hz,位于lKHz的信號(hào)被移動(dòng)到 500Hz。即,如果將音頻信號(hào)移動(dòng)到較低頻帶,則音頻信號(hào)具有低基音音色。
圖7是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在圖3的第二處理模式 下圖2的處理單元120使用的濾波器的特性的示圖。
圖7示出2KHz和20KHz之間的頻帶中的函數(shù)值根據(jù)頻率的增加逐漸減 小的曲線。如果使用第二處理模式下的濾波器來對(duì)音頻信號(hào)進(jìn)行濾波,則如 圖7所示,2KHz和20KHz之間的頻帶中的音頻信號(hào)的能量可被減小。
回頭參照?qǐng)D3,第三處理模式是表示"焦慮/狂躁"情緒的模式,被設(shè)置 為將音頻信號(hào)處理為具有高聲強(qiáng)和強(qiáng)節(jié)奏。為了實(shí)現(xiàn)被設(shè)置為第三處理模式的物理屬性,處理單元120使音頻信號(hào)的動(dòng)態(tài)范圍變寬,并放大與80Hz和5KHz周圍的頻帶相應(yīng)的音頻信號(hào)能量。 可以按任何順序來執(zhí)行音頻信號(hào)的變寬和放大處理。圖8是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其動(dòng)態(tài)范圍變寬的音頻 信號(hào)的示圖。動(dòng)態(tài)范圍是音頻信號(hào)的能量被最大化的函數(shù)值和音頻信號(hào)的能量纟皮最小 化的函數(shù)值之間的范圍。在圖8中,盡管原始音頻信號(hào)810的動(dòng)態(tài)范圍是40dB 和80dB之間,但是圖2的處理單元120使動(dòng)態(tài)范圍變寬到如變寬的音頻信號(hào) 820所指示的20dB和100dB之間的范圍。如果動(dòng)態(tài)范圍變寬,則在保持音質(zhì) 的同時(shí),可增加整個(gè)能量級(jí)。圖9是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在圖3的第三處理模式 下圖2的處理單元120使用的濾波器的特性的示圖。圖9示出80Hz和5KHz周圍的頻帶中的函數(shù)值的幅度相對(duì)較大的曲線。 如果通過使用第三處理模式下的濾波器來對(duì)音頻信號(hào)濾波,則如圖9所示, 80Hz和5KHz周圍的頻帶中的音頻信號(hào)的能量可^皮增加?;仡^參照?qǐng)D3,第四處理模式是表示"滿足,,的模式,并被設(shè)置為將音 頻信號(hào)處理為具有低聲強(qiáng)、歡快音色和慢速節(jié)奏的物理屬性。為了實(shí)現(xiàn)被設(shè)置為第四處理模式的物理屬性,處理單元120將音頻信號(hào) 的動(dòng)態(tài)范圍變窄,并放大與6KHz和20KHz之間的頻帶相應(yīng)的音頻信號(hào)能量。 可以按任何順序來執(zhí)行音頻信號(hào)的變窄和放大操作。另外,處理單元120可通過使用時(shí)域基音同步疊加(TD-PSOLA)方法 來實(shí)現(xiàn)在降低通過音頻信號(hào)的變窄和放大操作而處理的音頻信號(hào)的時(shí)域的方 法中的低速節(jié)奏。然而,TD-PSOLA方法不能被應(yīng)用于實(shí)時(shí)輸出的音頻信號(hào), 但可被應(yīng)用于存儲(chǔ)的音頻信號(hào),例如,mp3文件。圖IO是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在圖3的第四處理模式 下產(chǎn)生具有'隄速節(jié)奏的音頻信號(hào)的方法的示圖。圖IO是示出TD-PS0LA方法的示意性概念的示圖,并示出通過將具有3 分鐘再現(xiàn)時(shí)間的音頻信號(hào)處理為具有4分鐘再現(xiàn)時(shí)間以減小速度以的方法。參照?qǐng)D10,在時(shí)域,音頻信號(hào)的整個(gè)持續(xù)時(shí)間^C劃分成3個(gè)持續(xù)時(shí)間A、B和C (由標(biāo)號(hào)1010表示)。將兩個(gè)持續(xù)時(shí)間D和E添加到3個(gè)持續(xù)時(shí)間A、 B和C (由標(biāo)號(hào)1020表示)。可通過在添加每個(gè)附加的持續(xù)時(shí)間之前拷貝音 頻信號(hào)而獲得的值或音頻信號(hào)的平均值來添加兩個(gè)附加持續(xù)時(shí)間D和E。通 過合成這5個(gè)持續(xù)時(shí)間,產(chǎn)生具有4分鐘再現(xiàn)時(shí)間的音頻信號(hào)(由標(biāo)號(hào)1030 表示)。由于TD-PSOLA方法為本領(lǐng)域的普通技術(shù)人員所公知,所以將省略對(duì)其 的詳細(xì)描述。圖11是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的其動(dòng)態(tài)范圍變窄的音 頻信號(hào)的示圖。在圖11中,盡管原始音頻信號(hào)1110的動(dòng)態(tài)范圍在40dB和80dB之間, 但是處理單元120將該動(dòng)態(tài)范圍降低到由變窄的音頻信號(hào)1120所示的50dB 和70dB之間的范圍。如果動(dòng)態(tài)范圍變窄,則由于音頻信號(hào)的變化范圍減小, 所以整個(gè)能量級(jí)可被減小。圖12是示出根據(jù)本發(fā)明總的發(fā)明構(gòu)思的實(shí)施例的在圖3的第四處理模式 下圖2的處理單元120使用的濾波器的特性的示圖。圖12示出6KHz以上頻帶的函數(shù)值根據(jù)頻率的增加而逐漸增加的曲線。 如果使用第四處理模式下的濾波器來對(duì)音頻信號(hào)濾波,則如圖12所示,6KHz 以上頻帶的音頻信號(hào)的能量可被增加,導(dǎo)致音頻信號(hào)的歡快音色。還可將本發(fā)明總的發(fā)明構(gòu)思實(shí)施為計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)可讀代 碼。所述計(jì)算機(jī)可讀介質(zhì)可包括計(jì)算機(jī)可讀記錄介質(zhì)和計(jì)算機(jī)可讀傳輸媒介。 所述計(jì)算機(jī)可讀記錄介質(zhì)是可存儲(chǔ)其后能由計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)的任何數(shù) 據(jù)存儲(chǔ)裝置。所述計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲(chǔ)器(ROM)、 隨機(jī)存取存儲(chǔ)器(RAM)、 CD-ROM、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲(chǔ)裝置。所 述計(jì)算機(jī)可讀記錄介質(zhì)還可分布于聯(lián)網(wǎng)的計(jì)算機(jī)系統(tǒng),以使所述計(jì)算機(jī)可讀 代碼以分布式方式被存儲(chǔ)和執(zhí)行。所述計(jì)算機(jī)可讀傳輸媒介可傳輸載波或信 號(hào)(例如,通過互聯(lián)網(wǎng)的有線或無線數(shù)據(jù)傳輸)。另外,實(shí)現(xiàn)本發(fā)明總的發(fā)明 構(gòu)思的功能性程序、代碼和代碼段能夠由本發(fā)明總的發(fā)明構(gòu)思所屬領(lǐng)域的程 序員容易地推出。如上所述,根據(jù)本發(fā)明總的發(fā)明構(gòu)思,通過在基于音頻信號(hào)的音色、聲 強(qiáng)和節(jié)奏分類的音頻信號(hào)處理模式的基礎(chǔ)上,修改音頻信號(hào)的音色、聲強(qiáng)和 節(jié)奏,可基于根據(jù)情緒的音樂分類來調(diào)整音頻信號(hào)。 盡管已經(jīng)顯示和描述了本發(fā)明總的發(fā)明構(gòu)思的 一 些實(shí)施例,但是本領(lǐng)域 的技術(shù)人員應(yīng)該理解,在不脫離總的發(fā)明構(gòu)思的原理和精神的情況下,可對(duì) 這些實(shí)施例進(jìn)行修改,所述總的發(fā)明構(gòu)思的范圍由權(quán)利要求及其等同物來限定。
權(quán)利要求
1. 一種對(duì)音頻信號(hào)進(jìn)行后處理的方法,所述方法包括選擇基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)。
2、 如權(quán)利要求l所述的方法,其中,修改步驟包括增加或減小音頻信 號(hào)的采樣率。
3、 如權(quán)利要求l所述的方法,其中,修改步驟包括 將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào); 將頻域的音頻信號(hào)的位置移動(dòng)預(yù)定頻率到較高頻帶;以及 放大移動(dòng)后的音頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
4、 如權(quán)利要求3所述的方法,其中,放大音頻信號(hào)能量的步驟包括放 大2KHz和3KHz之間的頻帶中包含的音頻信號(hào)能量。
5、 如權(quán)利要求l所述的方法,其中,修改步驟包括 將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào); 將頻域的音頻信號(hào)的位置移動(dòng)預(yù)定頻率到較低頻帶;以及 減小移動(dòng)后的音頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
6、 如權(quán)利要求5所述的方法,其中,減小音頻信號(hào)能量的步驟包括減 小2KHz和20KHz之間的頻帶中包含的音頻信號(hào)能量。
7、 如權(quán)利要求l所述的方法,其中,修改步驟包括 將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào); 使頻域的音頻信號(hào)的動(dòng)態(tài)范圍變寬;以及放大動(dòng)態(tài)范圍變寬的音頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
8、 如權(quán)利要求7所述的方法,其中,放大音頻信號(hào)能量的步驟包括放 大基于80Hz的預(yù)定頻帶和基于5KHz的預(yù)定頻帶中包含的音頻信號(hào)能量。
9、 如權(quán)利要求l所述的方法,其中,修改步驟包括 將音頻信號(hào)轉(zhuǎn)換成頻域的音頻信號(hào); 將頻域的音頻信號(hào)的動(dòng)態(tài)范圍變窄;以及放大動(dòng)態(tài)范圍變窄的音頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
10、 如權(quán)利要求9所述的方法,其中,放大音頻信號(hào)能量的步驟包括 放大6KHz和20KHz之間的頻帶中包含的音頻信號(hào)能量。
11、 一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備,所述設(shè)備包括 模式選4奪器,選4奪基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模式之一;和處理單元,基于選擇的音頻信號(hào)處理;漠式來^^改音頻信號(hào)的音色、聲強(qiáng) 和節(jié)奏中的至少一個(gè)。
12、 如權(quán)利要求11所述的設(shè)備,其中,處理單元增加或減小音頻信號(hào)的采樣率。
13、 如權(quán)利要求11所述的設(shè)備,其中,處理單元將音頻信號(hào)轉(zhuǎn)換成頻域 的音頻信號(hào),將頻域的音頻信號(hào)的位置移動(dòng)預(yù)定頻率到較高頻帶,并放大移 動(dòng)后的頻率信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
14、 如權(quán)利要求13所述的設(shè)備,其中,處理單元放大2KHz和3KHz之 間的頻帶中包含的音頻信號(hào)能量。
15、 如權(quán)利要求11所述的設(shè)備,其中,處理單元將音頻信號(hào)轉(zhuǎn)換成頻域 的音頻信號(hào),將頻域的音頻信號(hào)的位置移動(dòng)預(yù)定頻率到較低頻帶,并減小移 動(dòng)后的頻率信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
16、 如權(quán)利要求15所述的設(shè)備,其中,處理單元減小2KHz和20KHz 之間的頻帶中包含的音頻信號(hào)能量。
17、 如權(quán)利要求11所述的設(shè)備,其中,處理單元將音頻信號(hào)轉(zhuǎn)換成頻域 的音頻信號(hào),使頻域的音頻信號(hào)的動(dòng)態(tài)范圍變寬,并放大動(dòng)態(tài)范圍變寬的音 頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
18、 如權(quán)利要求17所述的設(shè)備,其中,處理單元放大基于80Hz的預(yù)定 頻帶和基于5KHz的預(yù)定頻帶中包含的音頻信號(hào)能量。
19、 如權(quán)利要求11所述的設(shè)備,其中,處理單元將音頻信號(hào)轉(zhuǎn)換成頻域 的音頻信號(hào),將頻域的音頻信號(hào)的動(dòng)態(tài)范圍變窄,并放大動(dòng)態(tài)范圍變窄的音 頻信號(hào)的預(yù)定頻帶中包含的音頻信號(hào)能量。
20、 如權(quán)利要求19所述的設(shè)備,其中,處理單元放大6KHz和20KHz 之間的頻帶中包含的音頻信號(hào)能量。
21 、 一種實(shí)現(xiàn)有用于執(zhí)行一種方法的計(jì)算機(jī)程序的計(jì)算機(jī)可讀記錄介質(zhì), 其中,所述方法包括選擇基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少 一個(gè)進(jìn)行分類的多個(gè)音 頻信號(hào)處理模式之一;以及基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的 至少一個(gè)。
22、 一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備,所述設(shè)備包括 模式選擇器,選擇基于多種不同的人類情緒的多個(gè)音頻信號(hào)處理模式之■~~; 和處理單元,基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的頻率、動(dòng)態(tài) 范圍和釆樣率中的至少 一個(gè)。
23、 如權(quán)利要求22所述的設(shè)備,其中,所述多種不同的人類情緒包括充 滿活力、沮喪、焦慮和滿足中的至少一個(gè)。
24、 如權(quán)利要求23所述的設(shè)備,其中,當(dāng)選擇了與充滿活力的人類情緒 相應(yīng)的音頻信號(hào)處理模式時(shí),處理單元將音頻信號(hào)的位置移動(dòng)到較高頻帶, 并放大音頻信號(hào)。
25、 如權(quán)利要求24所述的設(shè)備,其中,處理單元放大2KHz和3KHz之 間的頻帶中包含的音頻信號(hào)能量。
26、 如權(quán)利要求23所述的設(shè)備,其中,當(dāng)選擇了與沮喪的人類情緒相應(yīng) 的音頻信號(hào)處理模式時(shí),處理單元將音頻信號(hào)的位置移動(dòng)到較低頻帶,并減 小音頻信號(hào)。
27、 如權(quán)利要求26所述的設(shè)備,其中,處理單元減小2KHz和20KHz 之間的頻帶中包含的音頻信號(hào)能量。
28、 如權(quán)利要求23所述的設(shè)備,其中,當(dāng)選^^了與焦慮的人類情緒相應(yīng) 的音頻信號(hào)處理模式時(shí),處理單元使音頻信號(hào)的動(dòng)態(tài)范圍變寬,并放大音頻信號(hào)。
29、 如權(quán)利要求28所述的設(shè)備,其中,處理單元放大80Hz和5KHz周 圍的頻帶中包含的音頻信號(hào)能量。
30、 如權(quán)利要求23所述的設(shè)備,其中,當(dāng)選擇了與滿足的人類情緒相應(yīng) 的音頻信號(hào)處理模式時(shí),處理單元將音頻信號(hào)的動(dòng)態(tài)范圍變窄,并放大音頻信號(hào)。
31、 如權(quán)利要求30所述的設(shè)備,其中,處理單元放大6KHz和20KHz 之間的頻帶中包含的音頻信號(hào)能量。
32、 如權(quán)利要求22所述的設(shè)備,其中,所述多種人類情緒包括高興、悲 傷、不平靜和平靜中的至少一個(gè)。
33、 如權(quán)利要求22所述的設(shè)備,其中,音頻信號(hào)處理模式是基于Thayer情緒模型。
34、 一種對(duì)音頻信號(hào)進(jìn)行后處理的設(shè)備,所述設(shè)備包括 模式選擇器,選擇基于音頻信號(hào)的音色、聲強(qiáng)、節(jié)奏中的至少一個(gè)的多個(gè)音頻信號(hào)處理模式之一;和處理單元,基于選擇的音頻信號(hào)處理模式來調(diào)整音頻信號(hào)的頻率、動(dòng)態(tài) 范圍、采樣率中的至少一個(gè)。
35、 如權(quán)利要求34所述的設(shè)備,其中,在第一模式下,處理單元將音頻 信號(hào)的位置移動(dòng)到較高頻帶,并放大音頻信號(hào)。
36、 如權(quán)利要求34所述的設(shè)備,其中,在第二模式下,處理單元將音頻 信號(hào)的位置移動(dòng)到較低頻帶,并減小音頻信號(hào)。
37、 如權(quán)利要求34所述的設(shè)備,其中,在第三模式下,處理單元使音頻 信號(hào)的動(dòng)態(tài)范圍變寬,并放大音頻信號(hào)。
38、 如權(quán)利要求34所述的設(shè)備,其中,在第四模式下,處理單元將音頻 信號(hào)的動(dòng)態(tài)范圍變窄,并放大音頻信號(hào)。
39、 一種對(duì)音頻信號(hào)進(jìn)行后處理的方法,所述方法包括 選擇基于多種不同的人類情緒的多個(gè)音頻信號(hào)處理模式之一;以及 基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的頻率、動(dòng)態(tài)范圍和采樣率中的至少一個(gè)。
40、 如權(quán)利要求39所述的方法,其中,所述多種不同的人類情緒包括充 滿活力、沮喪、焦慮和滿足中的至少一個(gè)。
41、 一種對(duì)音頻信號(hào)進(jìn)行后處理的方法,所述方法包括 選#^基于音頻信號(hào)的音色、聲強(qiáng)、節(jié)奏中的至少一個(gè)的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇的音頻信號(hào)處理模式來調(diào)整音頻信號(hào)的頻率、動(dòng)態(tài)范圍、采樣 率中的至少一個(gè)。
全文摘要
一種對(duì)音頻信號(hào)進(jìn)行后處理的方法和設(shè)備。所述方法包括選擇基于音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)進(jìn)行分類的多個(gè)音頻信號(hào)處理模式之一;以及基于選擇的音頻信號(hào)處理模式來修改音頻信號(hào)的音色、聲強(qiáng)和節(jié)奏中的至少一個(gè)。
文檔編號(hào)G10H7/00GK101211557SQ20071014011
公開日2008年7月2日 申請(qǐng)日期2007年8月2日 優(yōu)先權(quán)日2006年12月27日
發(fā)明者成鎬鈴, 李在哲 申請(qǐng)人:三星電子株式會(huì)社