專(zhuān)利名稱(chēng):使用具有時(shí)間演化信息的基底函數(shù)來(lái)分解音樂(lè)信號(hào)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)處理。
背景技術(shù):
便攜式裝置(例如,智能手機(jī)、上網(wǎng)本、便攜式計(jì)算機(jī)、平板計(jì)算機(jī))或電子游戲機(jī)上的許多音樂(lè)應(yīng)用程序可供單個(gè)用戶(hù)使用。在這些情況下,裝置的用戶(hù)哼唱旋律、演唱歌曲或演奏樂(lè)器,同時(shí)裝置記錄所得音頻信號(hào)。所記錄的信號(hào)接著可由應(yīng)用程序來(lái)分析其音高/音調(diào)升降曲線(xiàn),并且用戶(hù)可以選擇處理操作,例如,糾正或以其它方式變更升降曲線(xiàn),用不同音高或樂(lè)器音色來(lái)對(duì)信號(hào)進(jìn) 行上混操作(upmix)等。此類(lèi)應(yīng)用程序的實(shí)例包含QUSIC應(yīng)用程序(QUALCOMM公司,圣地亞哥(San Diego), CA);例如吉他英雄(Guitar Hero)和搖滾樂(lè)隊(duì)(Rock Band) (Harmonix音樂(lè)系統(tǒng),劍橋,MA)等的電子游戲;以及卡拉0K、單人樂(lè)隊(duì)(one-man-band)及其它記錄應(yīng)用程序。許多電子游戲(例如,吉他英雄、搖滾樂(lè)隊(duì))和音樂(lè)會(huì)音樂(lè)場(chǎng)景可能涉及多個(gè)樂(lè)器和歌手同時(shí)演出。當(dāng)前市售游戲和音樂(lè)制作系統(tǒng)要求順序地或在具有緊密定位的麥克風(fēng)的情況下演奏這些情形,以能夠單獨(dú)地對(duì)這些情形進(jìn)行分析、后處理及上混操作。這些約束可在音樂(lè)制作的情況下限制控制干擾和/或記錄空間效應(yīng)的能力,且可在電子游戲的情況下導(dǎo)致受限制的用戶(hù)體驗(yàn)。
發(fā)明內(nèi)容
一種根據(jù)一般配置分解音頻信號(hào)的方法包含針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者,計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示。這種方法還包含基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量。在這種方法中,所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表示的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表示。還揭示具有有形特征的計(jì)算機(jī)可讀存儲(chǔ)媒體(例如,非瞬時(shí)媒體),所述有形特征使讀取所述特征的機(jī)器執(zhí)行此種方法。—種用于根據(jù)一般配置分解音頻信號(hào)的設(shè)備包含用于針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示的裝置;及用于基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量的裝置。在這種設(shè)備中,所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表示的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表示。一種用于根據(jù)另一一般配置分解音頻信號(hào)的設(shè)備包含經(jīng)配置以針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示的變換模塊;及經(jīng)配置以基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量的系數(shù)向量計(jì)算器。在這種設(shè)備中,所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表示的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表示。
圖1A展示了根據(jù)一般配置的方法MlOO的流程圖。圖1B展示了方法MlOO的實(shí)施方案M200的流程圖。圖1C展示了根據(jù)一般配置的用于分解音頻信號(hào)的設(shè)備MF100的方框圖。圖1D展示了根據(jù)另一一般配置的用于分解音頻信號(hào)的設(shè)備AlOO的方框圖。圖2A展示了方法MlOO的實(shí)施方案M300的流程圖。圖2B展示了設(shè)備AlOO的實(shí)施方案A300的方框圖。圖2C展示了設(shè)備AlOO的另一實(shí)施方案A310的方框圖。圖3A展示了方法M200的實(shí)施方案M400的流程圖。圖3B展示了方法M200的實(shí)施方案M500的流程圖。圖4A展示了方法MlOO的實(shí)施方案M600的流程圖。圖4B展示了設(shè)備AlOO的實(shí)施方案A700的方框圖。圖5展示了設(shè)備AlOO的實(shí)施方案A800的方框圖。圖6展示了基底函數(shù)庫(kù)存的第二實(shí)例。圖7展示了具有和聲?shū)Q響的語(yǔ)音的聲譜圖。圖8展示了在圖6的庫(kù)存中的圖7的聲譜圖的稀疏表示。圖9圖解說(shuō)明模型Bf=y。圖10展示由方法MlOO產(chǎn)生的分離結(jié)果的曲線(xiàn)圖。圖11圖解說(shuō)明圖9的模型的修改B’ f=y。圖12展示了在鋼琴和長(zhǎng)笛的音調(diào)的未定期間基底函數(shù)的時(shí)域演化的曲線(xiàn)圖。圖13展示了由方法M400產(chǎn)生的分離結(jié)果的曲線(xiàn)圖。圖14展示了在音調(diào)F5處的鋼琴和長(zhǎng)笛的基底函數(shù)的曲線(xiàn)圖(左)和在音調(diào)F5處的鋼琴和長(zhǎng)笛的預(yù)加重基底函數(shù)的曲線(xiàn)圖(右)。圖15圖解說(shuō)明多個(gè)聲源在活躍的情形。圖16圖解說(shuō)明源緊密地挨在一起且一個(gè)源位于另一源之后的情形。圖17圖解說(shuō)明分析個(gè)別空間集群的結(jié)果。圖18展示了基底函數(shù)庫(kù)存的第一實(shí)例。圖19展示了吉他音調(diào)的聲譜圖。圖20展示了在圖18的庫(kù)存中的圖19的聲譜圖的稀疏表示。
圖21展示了將開(kāi)始檢測(cè)方法應(yīng)用于兩個(gè)不同復(fù)合信號(hào)實(shí)例的結(jié)果的聲譜圖。圖22到圖25表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于第一復(fù)合信號(hào)實(shí)例的結(jié)果。圖26到圖32表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于第二復(fù)合信號(hào)實(shí)例的結(jié)果。圖33到圖39是表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于第一復(fù)合信號(hào)實(shí)例的結(jié)果的聲譜圖。圖40到圖46是表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于第二復(fù)合信號(hào)實(shí)例的結(jié)果的聲譜圖。圖47A展示了評(píng)估應(yīng)用于鋼琴-長(zhǎng)笛測(cè)試實(shí)例的開(kāi)始檢測(cè)方法的性能的結(jié)果。圖47B展示了通信裝置D20的方框圖。圖48展示了手機(jī)HlOO的正視圖、后視圖和側(cè)視圖。
具體實(shí)施方式
揭示了使用基底函數(shù)庫(kù)存和稀疏恢復(fù)技術(shù)來(lái)分解音頻信號(hào),其中基底函數(shù)庫(kù)存包含與音調(diào)的未定期間音符的頻譜改變有關(guān)的信息。此類(lèi)分解可用以支持信號(hào)的分析、編碼、再現(xiàn)和/或合成。本文中展示了對(duì)包含來(lái)自和聲(即,非打擊)和打擊樂(lè)器的聲音的混合物的音頻信號(hào)的定量分析的實(shí)例。除非由其上下文明確限制,否則本文中使用術(shù)語(yǔ)“信號(hào)”來(lái)指示其普通意義中的任一者,包括在電線(xiàn)、總線(xiàn)或其它傳輸媒體上表達(dá)的存儲(chǔ)器位置(或存儲(chǔ)器位置集合)的狀態(tài)。除非由其上下文明確限制,否則本文中使用術(shù)語(yǔ)“產(chǎn)生”來(lái)指示其普通意義中的任一者,例如計(jì)算或以其它方式產(chǎn)生。除非由其上下文明確限制,否則本文中使用術(shù)語(yǔ)“計(jì)算”來(lái)指示其普通意義中的任一者,例如計(jì)算、評(píng)估、平滑和/或從多個(gè)值中進(jìn)行選擇。除非由其上下文明確限制,否則使用術(shù)語(yǔ)“獲得”來(lái)指示其普通意義中的任一者,例如計(jì)算、導(dǎo)出、接收(例如,從外部裝置)和/或檢索(例如,從存儲(chǔ)元件陣列)。除非由其上下文明確限制,否則使用術(shù)語(yǔ)“選擇”來(lái)指示其普通意義中的任一者,例如識(shí)別、指示、應(yīng)用和/或使用兩者或兩者以上的集合中的不到全部的至少一者。在術(shù)語(yǔ)“包括”用于本描述及權(quán)利要求書(shū)中的情況下,其不排除其它元件或操作。術(shù)語(yǔ)“基于”(如“A基于B”)用以指示其普通意義中的任一者,包含情況⑴“從……導(dǎo)出”(例如,“B是A的前驅(qū)體”),(ii) “至少基于”(例如,“A至少基于B”)及在特定上下文中適當(dāng)?shù)那闆r下(iii) “等于”(例如,“A等于B”)。類(lèi)似地,術(shù)語(yǔ)“響應(yīng)于”用以指示其普通意義中的任一者,包含“至少響應(yīng)于”。對(duì)多麥克風(fēng)音頻傳感裝置的麥克風(fēng)的“位置”的參考指示麥克風(fēng)的聲學(xué)敏感面的中心的位置,除非上下文以其它方式指示。根據(jù)特定上下文,術(shù)語(yǔ)“信道”有時(shí)用以指示信號(hào)路徑,且在其它時(shí)候指示由此路徑攜帶的信號(hào)。除非以其它方式指示,否則術(shù)語(yǔ)“系列”用以指示兩個(gè)或兩個(gè)以上項(xiàng)目的序列。術(shù)語(yǔ)“對(duì)數(shù)”用以指示以十為底數(shù)的對(duì)數(shù),但此運(yùn)算延伸到其它底數(shù)(例如,底數(shù)二)屬于本發(fā)明的范圍內(nèi)。術(shù)語(yǔ)“頻率分量”用以指示信號(hào)的一組頻率或頻帶當(dāng)中的一者,例如信號(hào)的頻域表示的樣本(例如,通過(guò)快速傅里葉變換產(chǎn)生)或信號(hào)的子帶(例如,巴克(Bark)標(biāo)度或梅爾(mel)標(biāo)度子帶)。除非另外指出,否則對(duì)具有特定特征的設(shè)備的操作的任何揭示內(nèi)容還明確地希望揭示具有類(lèi)似特征的方法(且反之亦然),且對(duì)根據(jù)特定配置的設(shè)備的操作的任何揭示內(nèi)容還明確地希望揭示根據(jù)類(lèi)似配置的方法(且反之亦然)。術(shù)語(yǔ)“配置”可參考方法、設(shè)備和/或系統(tǒng)來(lái)使用,如其特定上下文所指示。術(shù)語(yǔ)“方法”、“過(guò)程”、“程序”和“技術(shù)”被一般地且可互換地使用,除非特定上下文以其它方式指示。術(shù)語(yǔ)“設(shè)備”和“裝置”也被一般地且可互換地使用,除非特定上下文以其它方式指示。術(shù)語(yǔ)“元件”和“模塊”通常用以指示較大配置的一部分。除非其上下文明確地限制,否則術(shù)語(yǔ)“系統(tǒng)”在本文中用以指示其普通意義中的任一者,包含“交互以服務(wù)共同目的的元素的群組”。任何以引用的方式并入有文獻(xiàn)的一部分還應(yīng)理解為并入有所述部分內(nèi)所提及的術(shù)語(yǔ)或變量的定義(在此類(lèi)定義出現(xiàn)在文獻(xiàn)的其它地方的情況下),及所并入有部分中所提及的任何圖式。除非開(kāi)始由定冠詞引入,否則用以修飾權(quán)利要求元素的序數(shù)術(shù)語(yǔ)(例如,“第一”、“第二”、“第三”等)自身并不指示權(quán)利要求元素相對(duì)于彼此的任何優(yōu)先級(jí)或次序,而是僅區(qū)別權(quán)利要求元素與具有同一名稱(chēng)(但使用序數(shù)術(shù)語(yǔ))的另一權(quán)利要求元素。除非其上下文明確地限制,否則術(shù)語(yǔ)“多個(gè)”在本文中用以指示大于一的整數(shù)量。如本文中所描述的方法可經(jīng)配置以將所捕獲的信號(hào)作為一系列片段來(lái)處理。典型片段長(zhǎng)度范圍在約五或十毫秒到約四十或五十毫秒之間,且片段可重疊(例如,鄰近片段重疊25%或50%)或不重疊。在一個(gè)特定實(shí)例中,信號(hào)被分成各自具有十毫秒長(zhǎng)度的一系列不重疊片段或“幀”。由此種方法進(jìn)行處理的片段還可以是由不同操作進(jìn)行處理的較大片段的片段(即,“子幀”),或反之亦然??尚枰獙?duì)音樂(lè)場(chǎng)景進(jìn)行分解,以從兩個(gè)或兩個(gè)以上樂(lè)器和/或聲音信號(hào)的混合物中提取個(gè)別音調(diào)/音高輪廓。潛在使用實(shí)例包含用多個(gè)麥克風(fēng)錄制音樂(lè)會(huì)/電子游戲場(chǎng)景,通過(guò)空間/稀疏恢復(fù)處理來(lái)分解樂(lè)器和聲音,提取音高/音調(diào)輪廓,部分地或完全地用經(jīng)糾正的音高/音調(diào)輪廓來(lái)對(duì)個(gè)別源進(jìn)行上混操作。此類(lèi)操作可用以使音樂(lè)應(yīng)用程序(例如,Qualcomm的QUSIC應(yīng)用程序、例如搖滾樂(lè)隊(duì)或吉他英雄等的電子游戲)的能力延伸到多演奏者/歌唱者情形??尚枰挂魳?lè)應(yīng)用程序能夠處理特定的情形,在所述特定的情形中,一個(gè)以上歌手在活躍和/或多個(gè)樂(lè)器同時(shí)演奏(例如,如圖15中所示)??尚枰四芰σ灾С謱?shí)際音樂(lè)錄制情形(多音高場(chǎng)景)。盡管用戶(hù)可能想要單獨(dú)地編輯且重新合成每一源的能力,但產(chǎn)生音軌可能需要同時(shí)記錄所述源。本發(fā)明描述可用以允許實(shí)現(xiàn)多個(gè)源可同時(shí)活躍的音樂(lè)應(yīng)用程序的使用實(shí)例的方法。此種方法可經(jīng)配置以使用基于基底函數(shù)庫(kù)存的稀疏恢復(fù)(例如,稀疏分解)技術(shù)來(lái)分析音頻混合信號(hào)??尚枰ㄟ^(guò)找到基底函數(shù)集合的激活系數(shù)的最稀疏向量(例如,使用有效稀疏恢復(fù)算法),來(lái)將混合信號(hào)頻譜分解成源分量。可使用激活系數(shù)向量(例如,與基底函數(shù)集合一起)來(lái)重構(gòu)混合信號(hào),或重構(gòu)混合信號(hào)的選定部分(例如,來(lái)自一個(gè)或一個(gè)以上選定樂(lè)器)。還可需要對(duì)稀疏系數(shù)向量進(jìn)行后處理(例如,根據(jù)量值和時(shí)間支持)。圖1A展示了根據(jù)一般配置的分解音頻信號(hào)的方法MlOO的流程圖。方法MlOO包含任務(wù)T100,所述任務(wù)TlOO基于來(lái)自音頻信號(hào)的幀的信息,計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示。方法MlOO還包含任務(wù)T200,所述任務(wù)T200基于由任務(wù)TlOO計(jì)算的信號(hào)表示和多個(gè)基底函數(shù),來(lái)計(jì)算激活系數(shù)的向量,其中激活系數(shù)中的每一者對(duì)應(yīng)于多個(gè)基底函數(shù)中的不同基底函數(shù)??蓪?shí)施任務(wù)TlOO以將信號(hào)表示計(jì)算為頻域向量。此向量的每一元素可指示可根據(jù)梅爾或巴克標(biāo)度獲得的一組子帶中的對(duì)應(yīng)者的能量。然而,通常使用例如快速傅里葉變換(FFT)或短時(shí)傅里葉變換(STFT)等的離散傅里葉變換(DFT)來(lái)計(jì)算此向量。此向量可具有(例如)64、128、256、512或1024個(gè)分格的長(zhǎng)度。在一實(shí)例中,音頻信號(hào)具有8kHz的采樣率,且對(duì)于長(zhǎng)度為32毫秒的每一幀,0到4kHz頻帶由256分格的頻域向量表示。在另一實(shí)例中,對(duì)音頻信號(hào)的重疊片段使用經(jīng)修改的離散余弦變換(MDCT)來(lái)計(jì)算信號(hào)表示。在另一實(shí)例中,實(shí)施任務(wù)TlOO以將信號(hào)表示計(jì)算為倒譜系數(shù)(例如,梅爾倒頻譜系數(shù)或MFCC)的向量,所述向量表示幀的短期功率譜。在此情況下,可實(shí)施任務(wù)TlOO以計(jì)算此向量,計(jì)算的方式是將梅爾標(biāo)度濾波器組應(yīng)用于幀的DFT頻域向量的量值,求得濾波器輸出的對(duì)數(shù),及求得對(duì)數(shù)值的DCT。例如,在標(biāo)題為“STQ:DSR--前端特征提取算法;壓縮算法(STQ:DSR - Front-end feature extraction algorithm; compressionalgorithm),,的ETSI文獻(xiàn)ES201108(歐洲電信標(biāo)準(zhǔn)協(xié)會(huì),2000)中所描述的極光標(biāo)準(zhǔn)(Aurora standard)中描述了此程序(procedure)。樂(lè)器通常具有界限清楚的音色。樂(lè)器的音色可由其頻譜包絡(luò)(例如,頻率范圍內(nèi)能量的分布)描述,使得可使用編碼個(gè)別樂(lè)器的頻譜包絡(luò)的基底函數(shù)庫(kù)存來(lái)建模不同樂(lè)器的音色范圍。每一基底函數(shù)包括在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示??尚枰诵┬盘?hào)表示中的每一者具有與由任務(wù)T100計(jì)算的信號(hào)表示相同的形式。舉例來(lái)說(shuō),每一基底函數(shù)可為長(zhǎng)度為64、128、256、512或1024分格的頻域向量?;蛘?,每一基底函數(shù)可為倒譜域向量,例如MFCC的向量等。在另一實(shí)例中,每一基底函數(shù)為小波域向量?;缀瘮?shù)庫(kù)存A可包含每一樂(lè)器n (例如,鋼琴、長(zhǎng)笛、吉他、鼓等)的基底函數(shù)集合An。舉例來(lái)說(shuō),樂(lè)器的音色通常是依賴(lài)于音高的,使得每一樂(lè)器n的基底函數(shù)集合An通常將包含在某所要音高范圍內(nèi)的每一音高的至少一基底函數(shù),所述音高范圍可在樂(lè)器之間變化。對(duì)應(yīng)于調(diào)諧到(例如)半音階的樂(lè)器的基底函數(shù)集合可包含每八音度十二個(gè)音高中的每一音高的不同基底函數(shù)。鋼琴的基底函數(shù)集合可包含鋼琴的每一基調(diào)的不同基底函數(shù),總計(jì)八十八個(gè)基底 函數(shù)。在另一實(shí)例中,每一樂(lè)器的基底函數(shù)集合包含在所要音高范圍(例如,五個(gè)八音度(例如,56個(gè)音高)或六個(gè)八音度(例如,67個(gè)音高)等)中的每一音高的不同基底函數(shù)。這些基底函數(shù)集合An可不相交,或兩個(gè)或兩個(gè)以上集合可共享一個(gè)或一個(gè)以上基底函數(shù)。圖6展示了特定和聲樂(lè)器的十四個(gè)基底函數(shù)的集合的曲線(xiàn)圖(音高指數(shù)對(duì)頻率)的實(shí)例,其中所述集合的每一基底函數(shù)編碼在不同對(duì)應(yīng)音高處的樂(lè)器的音色。在音樂(lè)信號(hào)的上下文中,人類(lèi)話(huà)音可被視為樂(lè)器,使得庫(kù)存可包含一個(gè)或一個(gè)以上人類(lèi)話(huà)音模型中的每一者的基底函數(shù)集合。圖7展示了具有和聲?shū)Q響的語(yǔ)音的聲譜圖(以Hz為單位的頻率對(duì)以樣本為單位的時(shí)間),且圖8展示了此信號(hào)在圖6中所示的和聲基底函數(shù)集合中的表
/Jn o基底函數(shù)的庫(kù)存可基于從特別記錄的個(gè)別樂(lè)器記錄中獲知的通用樂(lè)器音高數(shù)據(jù)庫(kù),和/或基于分離的混合物流(例如,使用例如獨(dú)立分量分析(ICA)、期望最大化(EM)等的分離方案)。 基于由任務(wù)T100計(jì)算的信號(hào)表示且基于來(lái)自庫(kù)存A的多個(gè)基底函數(shù)B,任務(wù)T200計(jì)算激活系數(shù)的向量。此向量的每一系數(shù)對(duì)應(yīng)于多個(gè)基底函數(shù)B中的不同基底函數(shù)。舉例來(lái)說(shuō),任務(wù)T200可經(jīng)配置以計(jì)算向量,使得所述向量根據(jù)多個(gè)基底函數(shù)B指示信號(hào)表示的最有可能模型。圖9圖解說(shuō)明此模型Bf=y,其中多個(gè)基底函數(shù)B為矩陣,使得B的列為個(gè)別基底函數(shù),f為基底函數(shù)激活系數(shù)的列向量,且y為所記錄的混合信號(hào)的幀的列向量(例如,呈聲譜圖頻率向量形式的五、十或二十毫秒的幀)。任務(wù)T200可經(jīng)配置以通過(guò)求解線(xiàn)性編程問(wèn)題來(lái)恢復(fù)音頻信號(hào)的每一幀的激活系數(shù)向量??捎靡郧蠼獯藛?wèn)題的方法的實(shí)例包含非負(fù)矩陣因式分解(NNMF)??膳渲没贜NMF的單信道參考方法以使用期望最大化(EM)更新規(guī)則(例如,如下文所描述),來(lái)同時(shí)計(jì)算基底函數(shù)和激活系數(shù)??尚枰ㄟ^(guò)找到已知或部分已知基底函數(shù)空間中的最稀疏激活系數(shù)向量,將音頻混合信號(hào)分解成個(gè)別樂(lè)器(其可包含一個(gè)或一個(gè)以上人類(lèi)話(huà)音)。舉例來(lái)說(shuō),可配置任務(wù)T200以使用已知樂(lè)器基底函數(shù)的集合通過(guò)找到基底函數(shù)庫(kù)存中的最稀疏激活系數(shù)向量(例如,使用有效稀疏恢復(fù)算法),將輸入信號(hào)表示分解成源分量(例如,一個(gè)或一個(gè)以上個(gè)別樂(lè)器)。已知地是,對(duì)線(xiàn)性方程的欠定系統(tǒng)(S卩,具有多于方程的未知數(shù)的系統(tǒng))的最小LI范數(shù)解常常也是對(duì)所述系統(tǒng)的最稀疏解??扇缦聢?zhí)行通過(guò)LI范數(shù)的最小化而進(jìn)行的稀疏恢復(fù)。假定目標(biāo)向量&是具有K〈N個(gè)非零項(xiàng)(即,“K稀疏”)的長(zhǎng)度為N的稀疏向量,且對(duì)于大小約為K的集合,投影矩陣(S卩,基底函數(shù)矩陣)A是非相干的(類(lèi)似隨機(jī))。觀測(cè)到
信號(hào)y=Af。。接著,求解服從于Af=y min/||/|iW (其中l(wèi)/^定義為;^f=1|./;|)將精確地恢復(fù)
f。。此外,可通過(guò)求解易處理的程序,從M ^ KdogA/個(gè)非相干量度中恢復(fù)量度的數(shù)目M大約等于有效分量的 數(shù)目。一種方法是使用來(lái)自壓縮傳感的稀疏恢復(fù)算法。在壓縮傳感(也稱(chēng)作“經(jīng)壓縮傳感”)信號(hào)恢復(fù)Ox=y的一實(shí)例中,y是長(zhǎng)度為M的觀測(cè)到的信號(hào)向量,X是具有K〈N個(gè)非零項(xiàng)(即,“K稀疏模型”)的長(zhǎng)度為N的稀疏向量(其為y的精簡(jiǎn)表示),且O是大小為MXN的隨機(jī)投影矩陣。隨機(jī)投影O不是滿(mǎn)秩的,但其對(duì)于稀疏/可壓縮信號(hào)模型以高幾率可逆(即,隨機(jī)投影O求解了病態(tài)求逆問(wèn)題)。圖10展示了由方法MlOO的稀疏恢復(fù)實(shí)施方案產(chǎn)生的分離結(jié)果的曲線(xiàn)圖(音高指數(shù)對(duì)幀指數(shù))。在此情況下,輸入混合信號(hào)包含演奏音調(diào)序列C5-F5-G5-G#5-G5-F5-C5-D#5的鋼琴和演奏音調(diào)序列C6-A#5-G#5-G5的長(zhǎng)笛。鋼琴的經(jīng)分離的結(jié)果以虛線(xiàn)展示(音高序列0-5-7-8-7-5-0-3),且長(zhǎng)笛的經(jīng)分離的結(jié)果以實(shí)線(xiàn)展示(音高序列12_10_8_7)。可認(rèn)為激活系數(shù)向量f包含每一樂(lè)器n的子向量4,所述子向量fn包含對(duì)應(yīng)基底函數(shù)集合An的激活系數(shù)??瑟?dú)立地處理此些樂(lè)器特定激活子向量(例如,在后處理操作中)。舉例來(lái)說(shuō),可需要強(qiáng)加一個(gè)或一個(gè)以上稀疏性約束(例如,向量元素的至少一半為零,樂(lè)器特定子向量中的非零元素的數(shù)目不超過(guò)最大值等)。激活系數(shù)向量的處理可包含編碼每一幀的每一非零激活系數(shù)的指數(shù)編號(hào),編碼每一非零激活系數(shù)的指數(shù)和值,或編碼整個(gè)稀疏向量??墒褂么诵畔?例如,在另一時(shí)間和/或位置)來(lái)使用所指示的活躍基底函數(shù)再現(xiàn)混合信號(hào),或僅再現(xiàn)混合信號(hào)的特定部分(例如,僅再現(xiàn)由特定樂(lè)器演奏的音調(diào))。由樂(lè)器產(chǎn)生的音頻信號(hào)可建模為被稱(chēng)作音調(diào)的一系列事件。演奏音調(diào)的和聲樂(lè)器的聲音可在時(shí)間上分成不同區(qū)域:舉例來(lái)說(shuō),開(kāi)始階段(也被稱(chēng)作起奏)、固定階段(也被稱(chēng)作維持)和偏移階段(也被稱(chēng)作釋放)。對(duì)音調(diào)(ADSR)的時(shí)間包絡(luò)的另一描述包含在起奏與維持之間的額外衰減階段。在此上下文中,音調(diào)的持續(xù)時(shí)間可定義為從起奏階段的開(kāi)始到釋放階段的結(jié)束(或到終止音調(diào)的另一事件,例如同一根弦上的另一音調(diào)的開(kāi)始等)的時(shí)間間隔。假定音調(diào)具有單一音高,但還可以實(shí)施庫(kù)存以建模具有單一起奏和多個(gè)音高的音調(diào)(例如,如由例如顫音或滑音等的音高彎曲效應(yīng)所產(chǎn)生)。一些樂(lè)器(例如,鋼琴、吉他或豎琴)可以在被稱(chēng)作和弦的事件中一次產(chǎn)生一個(gè)以上音調(diào)。由不同樂(lè)器產(chǎn)生的音調(diào)可在維持階段期間具有類(lèi)似音色,使得可能難以在此時(shí)段識(shí)別哪一樂(lè)器正在演奏。然而,可預(yù)期音調(diào)的音色在階段之間變化。舉例來(lái)說(shuō),識(shí)別活躍樂(lè)器可能在起奏或釋放階段期間比在維持階段期間更為容易。圖12展示了鋼琴(虛線(xiàn))和長(zhǎng)笛(實(shí)線(xiàn))的八音度C5到C6中的十二個(gè)不同音高的基底函數(shù)的時(shí)域演化的曲線(xiàn)圖(音高指數(shù)對(duì)時(shí)域幀指數(shù))。可看出(例如)鋼琴基底函數(shù)的起奏與維持階段之間的關(guān)系顯著不同于長(zhǎng)笛基底函數(shù)的起奏與維持階段之間的關(guān)系。為了增加激活系數(shù)向量將指示適當(dāng)基底函數(shù)的可能性,可能需要最大化基底函數(shù)之間的差異。舉例來(lái)說(shuō),可能需要使基底函數(shù)包含與音調(diào)的隨時(shí)間推移的頻譜改變有關(guān)的信息。可能需要基于隨時(shí)間推移的音色改變來(lái)選擇基底函數(shù)。此方法可包含將與音調(diào)的音色的此時(shí)域演化有關(guān)的信息編碼成基底函數(shù)庫(kù)存。舉例來(lái)說(shuō),特定樂(lè)器n的基底函數(shù)的集合An可包含每一音高處的兩個(gè)或兩個(gè)以上對(duì)應(yīng)信號(hào)表不,使得此些信號(hào)表不中的每一者對(duì)應(yīng)于音調(diào)的演化中的不同時(shí)間(例如,起奏階段一個(gè)信號(hào)表不,維持階段一個(gè)信號(hào)表不,且釋放階段一個(gè)信號(hào)表示)??蓮难葑嘁粽{(diào)的樂(lè)器的記錄的對(duì)應(yīng)幀中提取此些基底函數(shù)。圖1C展示了根據(jù)一般配置的用于分解音頻信號(hào)的設(shè)備MF100的方框圖。設(shè)備MF100包含用于基于來(lái)自音頻信號(hào)的幀的信息計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示的裝置FlOO (例如,如本文中參考任務(wù)TlOO所描述)。設(shè)備MF100還包含裝置F200,所述裝置F200用于基于由裝置FlOO計(jì)算的信號(hào)表示和多個(gè)基底函數(shù),來(lái)計(jì)算激活系數(shù)的向量,其中激活系數(shù)中的每一者對(duì)應(yīng)于多個(gè)基底函數(shù)中的不同基底函數(shù)(例如,如本文中參考任務(wù)T200所描述)。圖1D展示了根據(jù)另一一般配置的用于分解音頻信號(hào)的設(shè)備AlOO的方框圖,所述設(shè)備AlOO包含變換模塊100和系數(shù)向量計(jì)算器200。變換模塊100經(jīng)配置以基于來(lái)自音頻信號(hào)的幀的信息計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示(例如,如本文中參考任務(wù)TlOO所描述)。系數(shù)向量計(jì)算器200經(jīng)配置以基于由變換模塊100計(jì)算的信號(hào)表示和多個(gè)基底函數(shù),來(lái)計(jì)算激活系數(shù)的向量,其中激活系數(shù)中的每一者對(duì)應(yīng)于多個(gè)基底函數(shù)中的不同基底函數(shù)(例如,如本文中參考任務(wù)T200所描述)。圖1B展示了方法MlOO的實(shí)施方案M200的流程圖,其中基底函數(shù)庫(kù)存包含針對(duì)每一樂(lè)器的每一音高的多個(gè)信號(hào)表示。此些多個(gè)信號(hào)表示中的每一者描述在頻率范圍內(nèi)的多個(gè)不同能量分布(例如,多個(gè)不同音色)。庫(kù)存還可經(jīng)配置以包含針對(duì)不同時(shí)間相關(guān)模態(tài)的不同多個(gè)信號(hào)表示。在一個(gè)這樣的實(shí)例中,庫(kù)存包含在每一音高處用弓拉弦的多個(gè)信號(hào)表不,和在每一音高處撥弦(例如,撥奏)的不同的多個(gè)信號(hào)表不。方法M200包含任務(wù)TlOO (在此實(shí)例中,任務(wù)T100A和T100B)的多個(gè)例子,其中每一例子基于來(lái)自音頻信號(hào)的對(duì)應(yīng)不同幀的信息,計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示??纱痈鞣N信號(hào)表示,且同樣,每一基底函數(shù)可為多個(gè)信號(hào)表示的串接。在此實(shí)例中,任務(wù)T200將混合幀的串接與每一音高處的信號(hào)表示的串接相匹配。圖11展示了圖S5的模型Bf=y的修改B’ f=y的實(shí)例,其中混合信號(hào)y的幀pl、p2被串接以用于匹配??蓸?gòu)造庫(kù)存以使得從訓(xùn)練信號(hào)的連續(xù)幀中獲得每一音高處之多個(gè)信號(hào)表示。在其它實(shí)施方案中,可能需要使每一音高處的多個(gè)信號(hào)表不橫跨較大的時(shí)間窗(例如,包含時(shí)間上分離而非連續(xù)的幀)。舉例來(lái)說(shuō),可能需要使每一音高處的多個(gè)信號(hào)表示包含來(lái)自起奏階段、維持階段與釋放階段當(dāng)中的至少兩者的信號(hào)表示。通過(guò)包含關(guān)于音調(diào)的時(shí)域演化的更多信息,可增加不同音調(diào)的基底函數(shù)集合之間的差異。在左邊,圖14展示了音調(diào)F5處的鋼琴的基底函數(shù)(虛線(xiàn))和音調(diào)F5處的長(zhǎng)笛的基底函數(shù)(實(shí)線(xiàn))的曲線(xiàn)圖(振幅對(duì)頻率)。可看出指示此特定音高處的樂(lè)器的音色的此些基底函數(shù)極為類(lèi)似。因此,實(shí)踐中可預(yù)期所述基底函數(shù)之間的某一程度的不匹配。為了得到更穩(wěn)健的分離結(jié)果,可能需要最大化庫(kù)存的基底函數(shù)之間的差異。長(zhǎng)笛的實(shí)際音色含有比鋼琴的實(shí)際音色多的高頻能量,但圖14的左曲線(xiàn)圖中所示的基底函數(shù)未編碼此信息。在右邊,圖14展示了音調(diào)F5處的鋼琴的基底函數(shù)(虛線(xiàn))和音調(diào)F5處的長(zhǎng)笛的基底函數(shù)(實(shí)線(xiàn))的另一曲線(xiàn)圖(振幅對(duì)頻率)。在此情況下,除了已預(yù)加重源信號(hào)的高頻區(qū)域之外,從與左曲線(xiàn)圖中的基底函數(shù)相同的源信號(hào)導(dǎo)出基底函數(shù)。因?yàn)殇撉僭葱盘?hào)含有顯著少于長(zhǎng)笛源信號(hào)的高頻能量,所以右曲線(xiàn)圖中所示的基底函數(shù)之間的差異明顯大于左曲線(xiàn)圖中所示的基底函數(shù)之間的差異。圖2A展示了方法MlOO的實(shí)施方案M300的流程圖,所述實(shí)施方案M300包含加重片段的高頻的任務(wù)T300。在此實(shí)例中,任務(wù)TlOO經(jīng)布置以計(jì)算在預(yù)加重之后的片段的信號(hào)表示。圖3A展示了包含任務(wù)T300的多個(gè)例子T300A、T300B的方法M200的實(shí)施方案M400的流程圖。在一實(shí)例中,預(yù)加重任務(wù)T300增加了高于200Hz的能量對(duì)總能量的比率。圖2B展示了設(shè)備AlOO的實(shí)施方案A300的方框圖,所述實(shí)施方案A300包含經(jīng)布置以在變換模塊100的上游對(duì)音頻信號(hào)執(zhí)行高頻加重的預(yù)加重濾波器300 (例如,高通濾波器,例如一階高通濾波器等)。圖2C展示了設(shè)備AlOO的另一實(shí)施方案A310的方框圖,在所述實(shí)施方案A310中,預(yù)加重濾波器300經(jīng)布置以對(duì)變換系數(shù)執(zhí)行高頻預(yù)加重。在此些情況下,還可能需要對(duì)多個(gè)基底函數(shù)B執(zhí)行高頻預(yù)加重(例如,高通濾波)。圖13展示了由方法M300對(duì)于與圖10的分離結(jié)果相同的輸入混合信號(hào)產(chǎn)生的分離結(jié)果的曲線(xiàn)圖(音高指數(shù)對(duì)幀指數(shù))。音符可包含賦色效應(yīng),例如,顫音和/或顫聲等。顫音是具有通常在四或五赫茲到七、八、十或十二赫茲的范圍中的調(diào)制率的頻率調(diào)制。歸因于顫音的音高改變對(duì)于歌唱者來(lái)說(shuō)可在0.6到2個(gè)半音程之間變化,且對(duì)于管樂(lè)器和弦樂(lè)器來(lái)說(shuō)通常小于+/-0.5半音程(例如,對(duì)于弦樂(lè)器來(lái)說(shuō),在0.2與0.35半音程之間)。顫聲是通常具有類(lèi)似調(diào)制率的振幅調(diào)制??赡茈y以在基底函數(shù)庫(kù)存中建模此類(lèi)效應(yīng)??赡苄枰獧z測(cè)此類(lèi)效應(yīng)的存在。舉例來(lái)說(shuō),顫音的存在可由在4Hz到8Hz的范圍中的頻域峰值來(lái)指示。還可能需要記錄所檢測(cè)到的效應(yīng)的水平的量度(例如,作為此峰值的能量),這是因?yàn)榭墒褂么颂匦詠?lái)在再現(xiàn)期間還原所述效應(yīng)。對(duì)于顫聲檢測(cè)和量化,可在時(shí)域中執(zhí)行類(lèi)似處理。一旦效應(yīng)已被檢測(cè)到且可能經(jīng)量化,就可能需要通過(guò)針對(duì)顫音使頻率在時(shí)間上平滑或針對(duì)顫聲使振幅在時(shí)間上平滑,來(lái)移除調(diào)制。圖4B展示了設(shè)備AlOO的實(shí)施方案A700的方框圖,所述實(shí)施方案A700包含調(diào)制水平計(jì)算器MLC。計(jì)算器MLC經(jīng)配置以計(jì)算且可能記錄如上文所描述的音頻信號(hào)的片段中的所檢測(cè)到的調(diào)制的量度(例如,在時(shí)域或頻域中所檢測(cè)到的調(diào)制峰值的能量)。本發(fā)明描述可用以允許實(shí)現(xiàn)多個(gè)源可同時(shí)活躍的音樂(lè)應(yīng)用程序的使用實(shí)例的方法。在此情況下,可能需要在計(jì)算激活系數(shù)向量之前使源分離(如果有可能的話(huà))。為了實(shí)現(xiàn)此目的,提出了多信道和單信道技術(shù)的組合。圖3B展示了方法MlOO的實(shí)施方案M500的流程圖,所述實(shí)施方案M500包含將信號(hào)分離成空間集群的任務(wù)T500。任務(wù)T500可經(jīng)配置以將源隔離成盡可能多的空間集群。在一實(shí)例中,任務(wù)T500使用多麥克風(fēng)處理來(lái)將所記錄的聲學(xué)情形分離成盡可能多的空間集群。此處理可基于麥克風(fēng)信號(hào)之間的增益差和/或相位差,其中可跨越整個(gè)頻帶來(lái)評(píng)估此類(lèi)差或在多個(gè)不同頻率子帶或頻率分格中的每一者處評(píng)估此類(lèi)差。單獨(dú)的空間分離方法可能不足以實(shí)現(xiàn)所要的分離水平。舉例來(lái)說(shuō),一些源可能太靠近麥克風(fēng)陣列或以其它方式次最佳地相對(duì)于麥克風(fēng)陣列布置(例如,多個(gè)小提琴手和/或和聲樂(lè)器可位于一個(gè)角落;打擊樂(lè)器樂(lè)手通常位于后面)。在典型樂(lè)隊(duì)情形下,源可能緊密地挨在一起或甚至在其它源之后(例如,如圖16中所示),使得單獨(dú)使用空間信息來(lái)處理由處于相對(duì)于樂(lè)隊(duì)的同一大體方向的麥克風(fēng)陣列捕獲的信號(hào)可能無(wú)法將所有的源彼此相區(qū)分。任務(wù)TlOO和T200使用如本文中所描述的單信道基于基底函數(shù)庫(kù)存的稀疏恢復(fù)(例如,稀疏分解)技術(shù)來(lái)分析個(gè)別空間集群以分離個(gè)別樂(lè)器(如圖17中所示)。為了便于計(jì)算處理,可能需要多個(gè)基底函數(shù)B顯著地小于基底函數(shù)庫(kù)存A??赡苄枰獙?duì)于給定分離任務(wù)從大庫(kù)存開(kāi)始縮減庫(kù)存。在一實(shí)例中,此減小可通過(guò)以下方式來(lái)執(zhí)行:確定片段是包含來(lái)自打擊樂(lè)器的聲音還是包含來(lái)自和聲樂(lè)器的聲音,及從庫(kù)存中選擇適當(dāng)?shù)亩鄠€(gè)基底函數(shù)B以用于匹配。與和聲聲音的水平線(xiàn)相反,打擊樂(lè)器傾向于具有類(lèi)似脈沖的聲譜圖(例如,垂直線(xiàn))。在聲譜圖中,和聲樂(lè)器的特征通??蔀槟骋换疽舾吆拖嚓P(guān)聯(lián)的音色,及此和聲模式的對(duì)應(yīng)較高頻率延伸。因此,在另一實(shí)例中,可能需要通過(guò)僅分析此些頻譜的較低八音度來(lái)減小計(jì)算任務(wù),這是因?yàn)榭苫诘皖l副本來(lái)預(yù)測(cè)其較高頻率副本。在匹配之后,可將活躍基底函數(shù)外推到較高頻率,且從混合信號(hào)減去,以獲得可以編碼和/或進(jìn)一步分解的殘余信號(hào)。還可通過(guò)用戶(hù)在圖形用戶(hù)接口中的選擇和/或通過(guò)基于第一輪稀疏恢復(fù)或最大可能性擬合預(yù)先分類(lèi)最有可能的樂(lè)器和/或音高來(lái)執(zhí)行此減小。舉例來(lái)說(shuō),可執(zhí)行第一輪稀疏恢復(fù)操作以獲得經(jīng)恢復(fù)的稀疏系數(shù)的第一集合,且基于此第一集合,可對(duì)于另一輪稀疏恢復(fù)操作縮減可適用的音調(diào)基底函數(shù)。一個(gè)減小方法包含通過(guò)測(cè)量某些音程中的稀疏性得分,來(lái)檢測(cè)某些樂(lè)器音調(diào)的存在。此方法可包含基于最初音高估計(jì)來(lái)改進(jìn)一個(gè)或一個(gè)以上基底函數(shù)的頻譜形狀,及使用改進(jìn)的基底函數(shù)作為方法MlOO中的多個(gè)B。減小方法可經(jīng)配置以通過(guò)測(cè)量投影到對(duì)應(yīng)基底函數(shù)中的音樂(lè)信號(hào)的稀疏性得分來(lái)識(shí)別音高。在給定最佳音高得分的情況下,可使基底函數(shù)的振幅形狀最優(yōu)化,以識(shí)別樂(lè)器音調(diào)。接著可使用活躍基底函數(shù)的減小的集合作為方法MlOO中的多個(gè)B。圖18展示了可用于第一輪方法中的稀疏和聲信號(hào)表示的基底函數(shù)庫(kù)存的實(shí)例。圖19展示了吉他音調(diào)的聲譜圖(以Hz為單位的頻率對(duì)以樣本為單位的時(shí)間),且圖20展示了圖18中所示的基底函數(shù)集合中此聲譜圖的稀疏表示(基底函數(shù)數(shù)目以幀為單位的時(shí)間)。圖4A展示了包含此第一輪庫(kù)存減小的方法MlOO的實(shí)施方案M600的流程圖。方法M600包含任務(wù)T600,所述任務(wù)T600計(jì)算在非線(xiàn)性頻域(例如,其中鄰近元素之間的頻率距離隨頻率而增加,如按梅爾或巴克標(biāo)度)中的片段的信號(hào)表示。在一實(shí)例中,任務(wù)T600經(jīng)配置以使用常數(shù)Q變換來(lái)計(jì)算非線(xiàn)性信號(hào)表示。方法M600還包含任務(wù)1700,所述任務(wù)1700基于非線(xiàn)性信號(hào)表示和多個(gè)類(lèi)似非線(xiàn)性基底函數(shù),計(jì)算激活系數(shù)的第二向量?;趤?lái)自第二激活系數(shù)向量的信息(例如,來(lái)自激活的基底函數(shù)的恒等式,其可指示活躍音高范圍),任務(wù)T800選擇用于任務(wù)T200中的多個(gè)基底函數(shù)B。明確地注意到方法M200、M300和M400還可經(jīng)實(shí)施以包含此些任務(wù)T600、T700和T800。圖5展示了設(shè)備AlOO的實(shí)施方案A800的方框圖,所述實(shí)施方案A800包含經(jīng)配置以從基底函數(shù)的較大集合中(例如,從庫(kù)存中)選擇多個(gè)基底函數(shù)的庫(kù)存減小模塊IRM。模塊IRM包含第二變換模塊110,第二變換模塊110經(jīng)配置以計(jì)算非線(xiàn)性頻域中的片段的信號(hào)表示(例如,根據(jù)常數(shù)Q變換)。模塊IRM還包含第二系數(shù)向量計(jì)算器,第二系數(shù)向量計(jì)算器經(jīng)配置以基于非線(xiàn)性頻域中的所計(jì)算的信號(hào)表示和如本文中所描述的第二多個(gè)基底函數(shù),計(jì)算激活系數(shù)的第二向量。模塊IRM還包含基底函數(shù)選擇器,基底函數(shù)選擇器經(jīng)配置以基于如本文中所描述的來(lái)自第二激活系數(shù)向量的信息,從基底函數(shù)的庫(kù)存當(dāng)中選擇多個(gè)基底函數(shù)??赡苄枰椒∕lOO包含開(kāi)始檢測(cè)(例如,檢測(cè)音符的開(kāi)始)和后處理,以改進(jìn)和聲樂(lè)器稀疏系數(shù)??烧J(rèn)為激活系數(shù)向量f包含每一樂(lè)器n的對(duì)應(yīng)子向量fn,所述子向量fn包含樂(lè)器特定基底函數(shù)集合Bn的激活系數(shù),且可獨(dú)立地處理此些子向量。圖21到圖46圖解說(shuō)明了將此方案用于復(fù)合信號(hào)實(shí)例I (在同一八音度下演奏的鋼琴和長(zhǎng)笛)和復(fù)合信號(hào)實(shí)例2 (伴隨打擊樂(lè)器在同一八音度下演奏的鋼琴和長(zhǎng)笛)的音樂(lè)分解的方面。一般開(kāi)始檢測(cè)方法可基于頻譜量值(例如,能量差)。舉例來(lái)說(shuō),此種方法可包含基于頻譜能量和/或峰值斜率找到峰值。圖21展示了將此種方法分別應(yīng)用于復(fù)合信號(hào)實(shí)例I (在同一八音度下演奏的鋼琴和長(zhǎng)笛)和復(fù)合信號(hào)實(shí)例2 (伴隨打擊樂(lè)器在同一八音度下演奏的鋼琴和長(zhǎng)笛)的結(jié)果的聲譜圖(以Hz為單位的頻率對(duì)以幀為單位的時(shí)間),其中垂直線(xiàn)指示所檢測(cè)到的開(kāi)始??赡苓€需要檢測(cè)每一個(gè)別樂(lè)器的開(kāi)始。舉例來(lái)說(shuō),在和聲樂(lè)器當(dāng)中的檢測(cè)開(kāi)始的方法可基于時(shí)間的對(duì)應(yīng)系數(shù)差。在一個(gè)這樣的實(shí)例中,如果當(dāng)前幀的樂(lè)器n的系數(shù)向量(子向量fn)的最高量值元素的指數(shù)不等于先前幀的樂(lè)器n的稀疏向量的最高量值元素的指數(shù),那么觸發(fā)和聲樂(lè)器n的開(kāi)始檢測(cè)??蓪?duì)于每一樂(lè)器,重復(fù)進(jìn)行此操作??赡苄枰獔?zhí)行和聲樂(lè)器的稀疏系數(shù)向量的后處理。舉例來(lái)說(shuō),對(duì)于和聲樂(lè)器,可能需要保持對(duì)應(yīng)子向量的具有高量值和/或滿(mǎn)足指定的標(biāo)準(zhǔn)(例如,足夠尖)的起奏輪廓的系數(shù),和/或移除(例如,歸零)殘余系數(shù)。對(duì)于每一和聲樂(lè)器,可能需要在每一開(kāi)始幀處(例如,當(dāng)指示了開(kāi)始檢測(cè)時(shí))對(duì)系數(shù)向量進(jìn)行后處理,使得保持具有支配量值和可接受起奏時(shí)間的系數(shù),且使殘余系數(shù)歸零。可根據(jù)例如時(shí)間平均量值等的標(biāo)準(zhǔn)來(lái)評(píng)估起奏時(shí)間。在一個(gè)這樣的實(shí)例中,如果系數(shù)的當(dāng)前平均值小于系數(shù)的過(guò)去平均值(例如,如果在當(dāng)前窗(例如,從幀(t-5)到幀(t+4))中的系數(shù)的值的總和小于在過(guò)去窗(例如,從幀(t-15)到幀(t-6))中的系數(shù)的值的總和),那么使當(dāng)前幀t的樂(lè)器的每一系數(shù)歸零(即,起奏時(shí)間不可被接受)。在每一開(kāi)始幀處的和聲樂(lè)器的系數(shù)向量的此后處理還可包含保持具有最大量值的系數(shù),且使其它系數(shù)歸零。對(duì)于每一和聲樂(lè)器,在每一非開(kāi)始幀處,可能需要對(duì)系數(shù)向量進(jìn)行后處理,以便只保持在先前幀中值非零的系數(shù),且使向量的其它系數(shù)歸零。圖22到圖25表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于復(fù)合信號(hào)實(shí)例I (演奏同一八音度的鋼琴和長(zhǎng)笛)的結(jié)果。在此些圖中,垂直軸是稀疏系數(shù)指數(shù),水平軸是以幀為單位的時(shí)間,且垂直線(xiàn)指示特定幀,在所述特定幀處指示了開(kāi)始檢測(cè)。圖22和圖23分別展示了在后處理之前和之后的鋼琴稀疏系數(shù)。圖24和圖25分別展示了在后處理之前和之后的長(zhǎng)笛稀疏系數(shù)。圖26到圖30表明將基于開(kāi)始檢測(cè)的后處理應(yīng)用于復(fù)合信號(hào)實(shí)例2 (伴隨打擊樂(lè)器在同一八音度下演奏的鋼琴和長(zhǎng)笛)的結(jié)果。在此些圖中,垂直軸是稀疏系數(shù)指數(shù),水平軸是以幀為單位的時(shí)間,且垂直線(xiàn)指示特定幀,在所述特定幀處指示了開(kāi)始檢測(cè)。圖26和圖27分別展示了在后處理之前和之后的鋼琴稀疏系數(shù)。圖28和圖29分別展示了在后處理之前和之后的長(zhǎng)笛稀疏系數(shù)。圖30展示了鼓稀疏系數(shù)。圖31到圖39是表明將如本文中所描述的開(kāi)始檢測(cè)方法應(yīng)用于復(fù)合信號(hào)實(shí)例
1(在同一八音度下演奏的鋼琴和長(zhǎng)笛)的結(jié)果的聲譜圖。圖31展示了原始復(fù)合信號(hào)的聲譜圖。圖32展示了在無(wú)后處理的情況下重構(gòu)的鋼琴分量的聲譜圖。圖33展示了在具有后處理的情況下重構(gòu)的鋼琴分量的聲譜圖。圖34展示了通過(guò)使用EM算法獲得的庫(kù)存所建模的鋼琴。圖35展示了原始鋼琴。圖36展示了在無(wú)后處理的情況下重構(gòu)的長(zhǎng)笛分量的聲譜圖。圖37展示了在具有后處理的情況下重構(gòu)的長(zhǎng)笛分量的聲譜圖。圖38展示了通過(guò)使用EM算法獲得的庫(kù)存所建模的長(zhǎng)笛。圖39展示了原始長(zhǎng)笛分量的聲譜圖。圖40到圖46是表明將如本文中所描述的開(kāi)始檢測(cè)方法應(yīng)用于復(fù)合信號(hào)實(shí)例
2(在同一八音度下演奏的鋼琴和長(zhǎng)笛以及鼓)的結(jié)果的聲譜圖。圖40展示了原始復(fù)合信號(hào)的聲譜圖。圖41展示了在無(wú)后處理的情況下重構(gòu)的鋼琴分量的聲譜圖。圖42展示了在具有后處理的情況下重構(gòu)的鋼琴分量的聲譜圖。圖43展示了在無(wú)后處理的情況下重構(gòu)的長(zhǎng)笛分量的聲譜圖。圖44展示了在具有后處理的情況下重構(gòu)的長(zhǎng)笛分量的聲譜圖。圖45和圖46分別展示了經(jīng)重構(gòu)的鼓分量和原始鼓分量的聲譜圖。圖47A展示了使用由文森特(Vincent)等人描述的評(píng)估尺度(盲音頻源分離中的性能測(cè)量,IEEE Trans.ASSP,第14卷,第4期,2006年7月,第1462到1469頁(yè))來(lái)評(píng)估應(yīng)用于鋼琴-長(zhǎng)笛測(cè)試情況的如本文中所描述的開(kāi)始檢測(cè)方法的性能的結(jié)果。信號(hào)干擾比(SIR)是對(duì)不想要的源的抑制的量度,且定義為IOlogltlO IstmgeJ I2/ IeinterfI I2)。信號(hào)偽影比(SAR)是已由分離過(guò)程引入的偽影(例如,音樂(lè)噪聲等)的量度,且定義為101og1Q(| |starget+einterfl I2/ IeartifI I2)。信號(hào)失真比(SDR)是性能的總體量度,這是因?yàn)镾DR考慮以上標(biāo)準(zhǔn)兩者,且定義為101og1(l( I |Sta_| I2/ eartif+einterf| I2)此定量評(píng)估展示了具有可接受的偽影產(chǎn)生水平的穩(wěn)健源分離。
EM算法可用以產(chǎn)生最初基底函數(shù)矩陣和/或更新基底函數(shù)矩陣(例如,基于激活系數(shù)向量)?,F(xiàn)描述EM方法的更新規(guī)則的實(shí)例。在給定聲譜圖Vft的情況下,希望對(duì)于每一時(shí)間幀估計(jì)頻譜基底向量P(f Iz)和加權(quán)向量Pt (z)。此些分布提供了矩陣分解。如下應(yīng)用EM算法:首先,隨機(jī)地初始化加權(quán)向量Pt (Z)和頻譜基底向量P(f|z)。接著,在以下步驟之間重復(fù)直到收斂為止:1)期望(E)步驟-在給定頻譜基底向量P(f |z)和加權(quán)向量Pt(Z)的情況下,估計(jì)后驗(yàn)分布Pt(z|f)。此估計(jì)可表達(dá)如下:
權(quán)利要求
1.一種分解音頻信號(hào)的方法,所述方法包括: 針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者,計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示;及 基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量, 其中所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且其中所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表不的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表不。
2.根據(jù)權(quán)利要求1所述的方法,其中對(duì)于所述多個(gè)片段中的至少一者,(A)在高于200赫茲的頻率下的總能量與(B)在所述頻率范圍內(nèi)的總能量的比率在所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中比在所述對(duì)應(yīng)片段中高。
3.根據(jù)權(quán)利要求1和2中任一權(quán)利要求所述的方法,其中對(duì)于所述多個(gè)片段中的至少一者,所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中的調(diào)制的水平低于所述對(duì)應(yīng)片段中的所述調(diào)制的水平,所述調(diào)制是振幅調(diào)制與音高調(diào)制當(dāng)中的至少一者。
4.根據(jù)權(quán)利要求3所述的方法,其中對(duì)于所述多個(gè)片段中的所述至少一者,所述計(jì)算所述對(duì)應(yīng)信號(hào)表示包括記錄所述調(diào)制的所述水平的量度。
5.根據(jù)權(quán)利要求1到4中任一權(quán)利要求所述的方法,其中所述向量的所述激活系數(shù)的至少百分之五十為零值。
6.根據(jù)權(quán)利要求1到5中任一權(quán)利要求所述的方法,其中所述計(jì)算激活系數(shù)的所述向量包括計(jì)算形式為Bf=y的線(xiàn)性方程系統(tǒng)的解,其中y是包含所述多個(gè)所計(jì)算的信號(hào)表示的向量,B是包含所述多個(gè)基 底函數(shù)的矩陣,且f是激活系數(shù)的所述向量。
7.根據(jù)權(quán)利要求1到6中任一權(quán)利要求所述的方法,其中所述計(jì)算激活系數(shù)的所述向量包括最小化激活系數(shù)的所述向量的LI范數(shù)。
8.根據(jù)權(quán)利要求1到7中任一權(quán)利要求所述的方法,其中在所述音頻信號(hào)中,所述多個(gè)片段中的至少一者通過(guò)所述音頻信號(hào)的不在所述多個(gè)片段當(dāng)中的至少一個(gè)片段而與所述多個(gè)片段中的每一其它片段隔開(kāi)。
9.根據(jù)權(quán)利要求1到8中任一權(quán)利要求所述的方法,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一對(duì)應(yīng)信號(hào)表不描述在所述頻率范圍內(nèi)的對(duì)應(yīng)樂(lè)器的第一音色,且所述第二對(duì)應(yīng)信號(hào)表示描述在所述頻率范圍內(nèi)的所述對(duì)應(yīng)樂(lè)器的不同于所述第一音色的第二音色。
10.根據(jù)權(quán)利要求9所述的方法,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一音色是在對(duì)應(yīng)音調(diào)的第一時(shí)間間隔期間的音色,且 所述第一音色是在所述對(duì)應(yīng)音調(diào)的不同于所述第一時(shí)間間隔的第二時(shí)間間隔期間的首色。
11.根據(jù)權(quán)利要求1到10中任一權(quán)利要求所述的方法,其中對(duì)于所述多個(gè)片段中的每一者,所述對(duì)應(yīng)信號(hào)表示是基于對(duì)應(yīng)頻域向量。
12.根據(jù)權(quán)利要求1到11中任一權(quán)利要求所述的方法,其中所述方法包括在所述計(jì)算激活系數(shù)的所述向量之前,且基于來(lái)自所述多個(gè)片段中的至少一者的信息,從基底函數(shù)的較大集合中選擇所述多個(gè)基底函數(shù)。
13.根據(jù)權(quán)利要求1到12中任一權(quán)利要求所述的方法,其中所述方法包括: 對(duì)于所述多個(gè)片段中的至少一者,計(jì)算在非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表示;及 在所述計(jì)算激活系數(shù)的所述向量之前,且基于在所述非線(xiàn)性頻域中的所述所計(jì)算的信號(hào)表示和第二多個(gè)基底函數(shù),計(jì)算激活系數(shù)的第二向量, 其中所述第二多個(gè)基底函數(shù)中的每一者包括在所述非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表示。
14.根據(jù)權(quán)利要求13所述的方法,其中所述方法包括基于來(lái)自激活系數(shù)的所述所計(jì)算的第二向量的信息,從基底函數(shù)庫(kù)存當(dāng)中選擇所述多個(gè)基底函數(shù)。
15.一種用于分解音頻信號(hào)的設(shè)備,所述設(shè)備包括: 用于針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表示的裝置;及 用于基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量的裝置, 其中所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且 其中所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表不的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表不。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的至少一者,(A)在高于200赫茲的頻率下的總能量與(B)在所述頻率范圍內(nèi)的總能量的比率在所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中比在所述對(duì)應(yīng)片段中高。
17.根據(jù)權(quán)利要求15所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的至少一者,所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中的調(diào)制的水平低于所述對(duì)應(yīng)片段中的所述調(diào)制的水平,所述調(diào)制是振幅調(diào)制與音高調(diào)制當(dāng)中的至少一者。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述用于計(jì)算所述對(duì)應(yīng)信號(hào)表示的裝置包括用于對(duì)于所述多個(gè)片段中的所述至少一者記錄所述調(diào)制的所述水平的量度的裝置。
19.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述向量的所述激活系數(shù)的至少百分之五十為零值。
20.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述用于計(jì)算激活系數(shù)的所述向量的裝置包括用于計(jì)算形式為Bf=y的線(xiàn)性方程系統(tǒng)的解的裝置,其中y是包含所述多個(gè)所計(jì)算的信號(hào)表示的向量,B是包含所述多個(gè)基底函數(shù)的矩陣,且f是激活系數(shù)的所述向量。
21.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述用于計(jì)算激活系數(shù)的所述向量的裝置包括用于最小化激活系數(shù)的所述向量的LI范數(shù)的裝置。
22.根據(jù)權(quán)利要求15所述的設(shè)備,其中在所述音頻信號(hào)中,所述多個(gè)片段中的至少一者通過(guò)所述音頻信號(hào)的不在所述多個(gè)片段當(dāng)中的至少一個(gè)片段而與所述多個(gè)片段中的每一其它片段隔開(kāi)。
23.根據(jù)權(quán)利要求15所述的設(shè)備,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一對(duì)應(yīng)信號(hào)表不描述在所述頻率范圍內(nèi)的對(duì)應(yīng)樂(lè)器的第一音色,且 所述第二對(duì)應(yīng)信號(hào)表示描述在所述頻率范圍內(nèi)的所述對(duì)應(yīng)樂(lè)器的不同于所述第一音色的第二音色。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一音色是在對(duì)應(yīng)音調(diào)的第一時(shí)間間隔期間的音色,且 所述第一音色是在所述對(duì)應(yīng)音調(diào)的不同于所述第一時(shí)間間隔的第二時(shí)間間隔期間的首色。
25.根據(jù)權(quán)利要求15所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的每一者,所述對(duì)應(yīng)信號(hào)表示是基于對(duì)應(yīng)頻域向量。
26.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述設(shè)備包括用于在所述計(jì)算激活系數(shù)的所述向量之前且基于來(lái)自所述多個(gè)片段中的至少一者的信息從基底函數(shù)的較大集合中選擇所述多個(gè)基底函數(shù)的裝置。
27.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述用于從基底函數(shù)的較大集合中選擇所述多個(gè)基底函數(shù)的裝置包括: 用于對(duì)于所述多個(gè)片段中的至少一者計(jì)算在非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表示的裝置;及 用于在所述計(jì)算激活系數(shù)的所述向量之前且基于在所述非線(xiàn)性頻域中的所述所計(jì)算的信號(hào)表示和第二多個(gè)基底函數(shù)計(jì)算激活系數(shù)的第二向量的裝置, 其中所述第二多個(gè)基底函數(shù)中的每一者包括在所述非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表示。
28.根據(jù)權(quán)利要求27所述 的設(shè)備,其中所述設(shè)備包括用于基于來(lái)自激活系數(shù)的所述所計(jì)算的第二向量的信息從基底函數(shù)庫(kù)存當(dāng)中選擇所述多個(gè)基底函數(shù)的裝置。
29.一種用于分解音頻信號(hào)的設(shè)備,所述設(shè)備包括: 變換模塊,其經(jīng)配置以針對(duì)所述音頻信號(hào)的多個(gè)時(shí)間片段中的每一者計(jì)算在頻率范圍內(nèi)的對(duì)應(yīng)信號(hào)表不;及 系數(shù)向量計(jì)算器,其經(jīng)配置以基于所述多個(gè)所計(jì)算的信號(hào)表示和多個(gè)基底函數(shù)計(jì)算激活系數(shù)的向量, 其中所述向量的每一激活系數(shù)對(duì)應(yīng)于所述多個(gè)基底函數(shù)中的不同基底函數(shù),且 其中所述多個(gè)基底函數(shù)中的每一者包括在所述頻率范圍內(nèi)的第一對(duì)應(yīng)信號(hào)表示,和不同于所述第一對(duì)應(yīng)信號(hào)表不的在所述頻率范圍內(nèi)的第二對(duì)應(yīng)信號(hào)表不。
30.根據(jù)權(quán)利要求29所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的至少一者,(A)在高于200赫茲的頻率下的總能量與(B)在所述頻率范圍內(nèi)的總能量的比率在所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中比在所述對(duì)應(yīng)片段中高。
31.根據(jù)權(quán)利要求29所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的至少一者,所述所計(jì)算的對(duì)應(yīng)信號(hào)表示中的調(diào)制的水平低于所述對(duì)應(yīng)片段中的所述調(diào)制的水平,所述調(diào)制是振幅調(diào)制與音高調(diào)制當(dāng)中的至少一者。
32.根據(jù)權(quán)利要求31所述的設(shè)備,其中所述設(shè)備包含調(diào)制水平計(jì)算器,所述調(diào)制水平計(jì)算器經(jīng)配置以對(duì)于所述多個(gè)片段中的所述至少一者計(jì)算所述調(diào)制的所述水平的量度。
33.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述向量的所述激活系數(shù)的至少百分之五十為零值。
34.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述系數(shù)向量計(jì)算器經(jīng)配置以計(jì)算形式為Bf=y的線(xiàn)性方程系統(tǒng)的解,其中I是包含所述多個(gè)所計(jì)算的信號(hào)表示的向量,B是包含所述多個(gè)基底函數(shù)的矩陣,且f是激活系數(shù)的所述向量。
35.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述系數(shù)向量計(jì)算器經(jīng)配置以最小化激活系數(shù)的所述向量的LI范數(shù)。
36.根據(jù)權(quán)利要求29所述的設(shè)備,其中在所述音頻信號(hào)中,所述多個(gè)片段中的至少一者通過(guò)所述音頻信號(hào)的不在所述多個(gè)片段當(dāng)中的至少一個(gè)片段而與所述多個(gè)片段中的每一其它片段隔開(kāi)。
37.根據(jù)權(quán)利要求29所述的設(shè)備,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一對(duì)應(yīng)信號(hào)表不描述在所述頻率范圍內(nèi)的對(duì)應(yīng)樂(lè)器的第一音色,且 所述第二對(duì)應(yīng)信號(hào)表示描述在所述頻率范圍內(nèi)的所述對(duì)應(yīng)樂(lè)器的不同于所述第一音色的第二音色。
38.根據(jù)權(quán)利要求37所述的設(shè)備,其中對(duì)于所述多個(gè)基底函數(shù)中的每一基底函數(shù): 所述第一音色是在對(duì)應(yīng)音調(diào)的第一時(shí)間間隔期間的音色,且 所述第一音色是在所述對(duì)應(yīng)音調(diào)的不同于所述第一時(shí)間間隔的第二時(shí)間間隔期間的首色。
39.根據(jù)權(quán)利要求29所述的設(shè)備,其中對(duì)于所述多個(gè)片段中的每一者,所述對(duì)應(yīng)信號(hào)表示是基于對(duì)應(yīng)頻域向量。
40.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述設(shè)備包括經(jīng)配置以在所述計(jì)算激活系數(shù)的所述向量之前且基于來(lái)自所述多個(gè)片段中的至少一者的信息從基底函數(shù)的較大集合中選擇所述多個(gè)基底函數(shù)的庫(kù)存減小模塊。
41.根據(jù)權(quán)利要求29所述的設(shè)備,其中所述庫(kù)存減小模塊包括: 第二變換模塊,其經(jīng)配置以對(duì)于所述多個(gè)片段中的至少一者計(jì)算在非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表不;及 第二系數(shù)向量計(jì)算器,其經(jīng)配置以在所述計(jì)算激活系數(shù)的所述向量之前且基于在所述非線(xiàn)性頻域中的所述所計(jì)算的信號(hào)表示和第二多個(gè)基底函數(shù)計(jì)算激活系數(shù)的第二向量,其中所述第二多個(gè)基底函數(shù)中的每一者包括在所述非線(xiàn)性頻域中的對(duì)應(yīng)信號(hào)表示。
42.根據(jù)權(quán)利要求41所述的設(shè)備,其中所述設(shè)備包括經(jīng)配置以基于來(lái)自激活系數(shù)的所述所計(jì)算的第二向量的信息從基底函數(shù)庫(kù)存當(dāng)中選擇所述多個(gè)基底函數(shù)的基底函數(shù)選擇器。
43.一種機(jī)器可讀存儲(chǔ)媒體,所述機(jī)器可讀存儲(chǔ)媒體包括在由機(jī)器讀取時(shí)致使所述機(jī)器執(zhí)行根據(jù)權(quán)利要求1到14中任一權(quán)利要求所述的方法的有形特征。
全文摘要
本發(fā)明揭示使用基底函數(shù)庫(kù)存和稀疏恢復(fù)技術(shù)分解多源信號(hào)。
文檔編號(hào)G10L25/48GK103189915SQ201180051682
公開(kāi)日2013年7月3日 申請(qǐng)日期2011年10月25日 優(yōu)先權(quán)日2010年10月25日
發(fā)明者埃里克·維瑟, 郭尹義, 朱默飛, 劉尚憶, 金萊軒, 辛鐘元 申請(qǐng)人:高通股份有限公司