欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于特征向量的向量量化的方法

文檔序號:7912370閱讀:363來源:國知局

專利名稱::用于特征向量的向量量化的方法
技術領域
:本發(fā)明涉及一種用于尤其與待傳輸或待存儲的信號的數(shù)據(jù)壓縮相關的特征向量的向量量化的方法,該信號尤其是語音信號或視頻信號,在該方法中,通過在搜索期間檢驗一系列碼本向量(Codebuchvektor)是否適用于表示特征向量,搜尋由多個碼本向量構(gòu)成的至少一個碼本以尋找表示特征向量的碼向量。
背景技術
:這種方法適用于通過相對較小數(shù)目的碼本向量或者通過這些碼本向量的明確表征這些碼本向量的索引來表示、也就是尤其是編碼多維特征向量,這些多維特征向量的向量分量來自于往往大范圍的可能值。這種方法結(jié)合大量常用編碼方法一起尤其使用在語音編碼、圖像編碼或視頻編碼的領域中,但是也用于其他信號的編碼,以尤其是減少待傳輸或待存儲的數(shù)據(jù)的量(數(shù)據(jù)壓縮)。在此,數(shù)據(jù)量的減少尤其通過由表示所有這些不同特征向量的相同碼向量來代替大量不同的特征向量進行。因此,由于這些特征向量之間的差異而存在編碼誤差,待編碼的特征向量與表示該特征向量的碼向量之間的距離越大,則編碼誤差就越大。在此,借助于由應用定義的距離尺寸來測量向量之間的距離,該距離尺寸應當滿足度量或標準的數(shù)學特性。因此,特征向量空間中圍繞碼本的每個碼本向量的單元屬于該碼本向量,該單元包含通過該單元的碼本向量表示的所有特征向量。該單元對應于所有如下碼本向量的集合,所述碼本向量在所選擇的距離尺寸的意義下距離碼本的其他碼本向量不比距離由該單元圍繞的該碼本向量更近。該單元的形狀因此取決于所選擇的距離尺寸和碼本向量在特征向量空間中的分布。碼本向量的數(shù)目越大且這些碼本向量在特征向量空間中放置地越密集,則與這種方法相聯(lián)系的信息損失就越小。在此,碼本向量不必均勻分布在特征向量空間中,而是碼本向量可以適宜地集中在特征向量空間的在其中需要或期望特別的表示準確性的區(qū)域中。然而另一方面,隨著特征向量空間中碼本向量的數(shù)目及其密度的上升,用于確定最優(yōu)碼向量或者僅近似最優(yōu)的最佳地表示或以合理誤差表示待編碼特征向量的碼向量的耗費也會上升。
發(fā)明內(nèi)容本發(fā)明所基于的任務在于,說明一種用于特征向量的向量量化的方法,該方法(與已知方法相比)將盡可能高的準確性(上升)與盡可能小的耗費(增長)相聯(lián)系。該任務是通過具有根據(jù)權利要求1的特征的用于向量量化的方法來解決。在根據(jù)本發(fā)明的方法中,通過在搜索期間檢驗一系列碼本向量是否適用于表示所述特征向量,搜尋包括多個碼本向量的至少一個碼本以尋找表示所述特征向量的碼向量。在此搜索過程中或者優(yōu)選地在搜索開始之前,針對至少一個待檢驗的碼本向量確定鄰向量3集合,并且對碼向量的搜索延伸到所有鄰向量或者鄰向量的子集。在本發(fā)明的描述的上下文中,在與常用語言習慣一致的情況下,碼向量應當被理解為表示特征向量的碼本向量,該碼本向量在碼本中進行搜索的范圍內(nèi)被確定為在被檢驗是否適用于表示特征向量的碼本向量之中比每個其他經(jīng)檢驗的碼本向量更像該特征向量的碼本向量或者至少經(jīng)檢驗的碼本向量中沒有哪個碼本向量比其更像該特征向量的碼本向量。在此,兩個向量的距離在所選擇的距離尺寸的意義下越小,則這兩個向量越相似。如果對合適的碼本向量的搜索在完全搜尋整個碼本和檢驗所有碼本向量的適用性的意義上還未窮盡,則原則上當然可能在碼本中給出與特征向量相似的一個或多個未檢驗的碼本向量。由于碼本由可數(shù)的、即有限量的碼本向量構(gòu)成,因而可以對碼本向量計數(shù),也就是適宜地通過索引來明確表征碼本向量索引。在碼本向量與碼本向量索引之間存在明確的關系,因此概念“碼本向量”和“碼本向量索弓丨”可同義地使用,這在本說明書的范圍中在有些地方得以采用,因為這對應于本領域技術人員的常用語言習慣。碼本向量的鄰向量集合優(yōu)選包含大量碼本向量,這些碼本向量在碼本向量空間中的距離尺寸的意義下最接近該集合所屬于的碼本向量,即具有與該碼本向量最小的距離。在此,適于作為碼本向量空間中的距離尺寸的是具有度量特性的每種距離尺寸,尤其是歐幾里德(euklidisch)距離尺寸。通過將對應表示特征向量的碼向量的搜索延伸到鄰向量的至少一個子集,應優(yōu)選實現(xiàn)的是,不會忽略碼向量鄰域中能夠更好地表示待編碼特征向量的其他碼本向量。在此,如果第一碼本向量與特征向量的距離尺寸小于第二碼本向量與特征向量的距離尺寸,則第一碼本向量比第二碼本向量更好地表示特征向量。優(yōu)選地,借助鄰向量表(“next-neighbourtable(鄰向量表)”)來確定一個碼本向量的鄰向量集合(“next-neighbourarray(鄰向量陣列)”),該鄰向量表將多個最近的鄰向量分配給至少一個碼本的多個碼本向量中的每個碼本向量。在這種分配中,從其鄰向量集合應當被確定且作為起始向量被記錄到所述鄰向量集合中的碼本向量出發(fā),將所述鄰向量集合中每個已存在記錄的各個最近的鄰向量序列在鄰向量一側(cè)記錄到所述鄰向量集合中。這優(yōu)選一直進行,直至不再添加新的記錄或者直至例如因為所述鄰向量集合中的鄰向量的數(shù)目已達到或已超過預定極限而中斷記錄。優(yōu)選地,確定碼本向量的鄰向量表,所通過的是首先針對所述至少一個碼本的碼本向量的至少一個子集優(yōu)選通過各個距離的確定來確定多個最近的鄰向量并且通過以下步驟的迭代修改如此獲得的鄰向量表(“max-next-neighbourtable(最大鄰向量表)”)(根據(jù)本領域技術人員的語言習慣以下也可稱為“裁剪”)-針對所述鄰向量表中的一個碼本向量,確定其兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成該碼本向量的父向量(Elternvektor);-針對所述第一父向量,從所述鄰向量表中確定兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成所述第一父向量的子向量(Kindervektor);-如果所述第一父向量的兩個子向量之一與所述第二父向量一致,則將所述第二父向量從所述鄰向量表中刪去并且由所述鄰向量表中與其最近的鄰向量代替;-針對所述第二父向量,從所述鄰向量表中確定兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成所述第二父向量的子向量;-如果所述第二父向量的兩個子向量之一與所述第一父向量一致,則將所述第一父向量從所述鄰向量表中刪去并且由所述鄰向量表中與其最近的鄰向量代替。以此方式應避免在其中一些或所有鄰向量中彼此相互指向的鄰向量表。特別優(yōu)選的是將根據(jù)所描述的實施例之一的方法用于減少與用于語音編碼或用于視頻編碼的方法相關聯(lián)的編碼誤差的程度的應用。在此,優(yōu)選與根據(jù)標準方法的搜索相聯(lián)系地將搜索延伸到鄰向量。為此,優(yōu)選針對用標準方法找到的碼向量產(chǎn)生鄰向量集合,隨后將對最優(yōu)或幾乎最優(yōu)的碼向量的搜索延伸到該鄰向量集合。這優(yōu)選發(fā)生在對所有碼本向量或者碼本向量的子集的搜索開始之前,因為由此能夠顯著加速搜索。鄰向量陣列的構(gòu)造以及僅取決于碼本元素而非目前待編碼的向量的完全所有操作不是碼本中的搜索的部分,而是此專用碼本的構(gòu)造的部分或者是該碼本的經(jīng)加速和/或改善的搜索意義下的準備。因此,僅取決于碼本元素而不是目前待編碼的向量的這些操作優(yōu)選不在搜索期間(即在編碼期間)執(zhí)行,而是有利地在之前(本領域技術人員稱為“離線”)已計算。以下根據(jù)優(yōu)選實施例并且借助附圖來進一步描述本發(fā)明。在此,圖1示意性地示出借助鄰向量表來生成碼本向量的鄰向量集合;圖2示意性地示出消除鄰向量表中的多余記錄的流程。具體實施例方式根據(jù)本發(fā)明的方法和優(yōu)選實施例可適宜地用根據(jù)G.711標準的寬帶(“wideband(寬帶)”,WB)語音編解碼器的示例來描述,因為該標準包含流行的標準G.711作為窄帶核("narrowbandcore(窄帶核)”)。G.711標準的寬帶擴展G.711.1使用寬帶MDCT編解碼器(MDCT=改進的離散余弦變換)來編碼位于4kHz與7kHz之間的頻率范圍內(nèi)的信號分量。對此的細節(jié)可例如從Y.Hiwasaki等人的出版物“G.711.1:AWidebandExtensiontoITU-TG.711”,G.711.1_1569104469.pdf獲悉。在G.711標準的該擴展中,寬帶信號分量通過36個加權且標準化的系數(shù)的計算在MDCT范圍內(nèi)編碼,并且隨后編碼為6個6維向量。按照G.711.1標準的標準方法,在此必須通過兩個向量的線性組合來描繪特征向量,這兩個向量來自于分別具有32個碼本向量的兩個碼本。為了使搜索合適的碼本向量時的耗費保持得合理,在此往往不執(zhí)行對碼本向量的窮盡搜索。作為對此的結(jié)果,通過該標準過程找到的碼向量索引并不總是最優(yōu)的并且因此能被改善。根據(jù)本發(fā)明,這種改善優(yōu)選通過如下方式達到根據(jù)標準方法的搜索與根據(jù)本發(fā)明的細化搜索相聯(lián)系,在本發(fā)明的細化搜索中,針對在標準方法中找到的碼向量確定鄰向量集合,并且將搜索延伸到該鄰向量集合或者該集合的子集。該實施方式和其他實施方式中的根據(jù)本發(fā)明的方法的優(yōu)點在于,在此以不改變的方式使用相同的資源,即相同的碼本和相同的準則(例如,所述的“增益(gain)”),并且以與標準方法相同的形式對參數(shù)編碼,以使得為了改善編碼不需要較高的數(shù)據(jù)傳輸耗費或數(shù)據(jù)存儲耗費,所以還可以形象化地涉及“0位增強層”,這是因為為了這種改善不需要用于編碼5的額外位。根據(jù)本發(fā)明的另一優(yōu)點可看作在于,通過對鄰向量集合的大小NN_NB的合適選擇能夠容易地控制附加的耗費和由此獲得的附加準確性。實驗調(diào)查已經(jīng)得出,經(jīng)改善的或最優(yōu)的碼向量往往位于根據(jù)標準方法確定的碼向量的直接鄰域中。該認識通過根據(jù)本發(fā)明的方法以非常有效的方式用于在相對較小的耗費升高的情況下改善準確性。根據(jù)G.711.1標準,通過兩個向量的算術手段逼近(也就是近似)待編碼的特征向量*//■.\士Cwcnv(‘(穸))i(ν*))—■,個“一2這兩個向量來自于碼本大小CB_SIZE=32的兩個碼本.和c_。這些碼本中的每一個因此包括32個向量。由此,獲得總共CB_DIM=4x32x32=4096個碼向量。這種碼本內(nèi)的窮盡搜索在語音或視頻編碼器的背景下是昂貴的計算任務,所以在標準方法中實現(xiàn)次最優(yōu)的碼本搜索,以便將耗費保持在合理的范圍內(nèi)。結(jié)果,以此方式在標準方法中,僅49%的特征向量由最優(yōu)的碼向量表示。根據(jù)本發(fā)明的方法的核心在于鄰向量集合,該集合是針對碼本向量借助碼本產(chǎn)生的。該集合基本上將其兩個最近的鄰向量的索引分配給一個碼本向量。最近的鄰向量的數(shù)目NB_NN在此可以是受限制的,以便限制與根據(jù)本發(fā)明的方法相聯(lián)系的附加耗費。在耗費限制的意義下可利用另外的計算優(yōu)點。因為特征向量的空間是數(shù)學意義下(至少只要特征向量的分量來自于數(shù)學意義下的“體”)的向量空間(“線性”空間),所以碼本適宜地針對每個碼本向量CV也包含其(向量添加的)逆元素-CV。結(jié)合根據(jù)本發(fā)明的方法使用的表(鄰向量集合、鄰向量表等)中的向量或索引的數(shù)目可以因此常常通過充分利用相應的對稱性來減小,例如通過在計算上合適地考慮向量的符號而減小到一半(CB_DIM_H=2048)。然而在此有利地應當注意到,碼本向量的實際數(shù)目較大,在本示例中為CB_DIM=4096。用于生成鄰向量集合的過程可以以圖1為例來描述。在該示例中,首先假定存在鄰向量表,并且根據(jù)標準方法確定暫時最優(yōu)的碼向量。該暫時最佳的碼向量的向量索引隨后作為初始值記錄在鄰向量集合中。在圖1中所示的示例中,該向量索引為索引129。鄰向量表中的屬于該起始索引的兩個索引隨后同樣被記錄到鄰向量集合中。在圖1中所示的示例中,涉及索引126和123,因為根據(jù)圖1中的鄰向量表,這些索引是最近的鄰向量。隨后,為記錄在鄰向量集合中的每個索引重復該處理方式,其中注意不將相同的索引記錄到鄰向量集合中兩次。在圖1中所示的示例中,這例如對于索引125發(fā)生,根據(jù)鄰向量表,離索引125最近的鄰索引具有索引572和126,但是其中索引1已記錄在鄰向量集合中。在不能再找到另外的索引時,或者在鄰向量集合中已達到預定數(shù)目的鄰向量并且這些鄰向量已被記錄到鄰向量集合中時,結(jié)束該過程。隨后,將對于待編碼特征向量的最優(yōu)或近似最優(yōu)的碼向量的搜索優(yōu)選擴展到整個鄰向量集合或者該集合的子集,并且在該搜索中找到的最優(yōu)或近似最優(yōu)的碼本向量被用作改善的用于表示特征向量的碼向量。如容易地從此處描述的實施例中看出,通過根據(jù)本發(fā)明的方法能夠避免碼本中的窮盡搜索;然而,通過尋找改善的碼向量能夠達到編碼準確性的顯著改善。通過圖1中所示的鄰向量表的特殊結(jié)構(gòu),現(xiàn)在需要^2048的表大小而不是NB_NN*2048的表大小,由此能夠節(jié)省存儲空間。鄰向量的表(鄰向量表)優(yōu)選是通過處理最大的鄰向量表(“max-next-neighbourtable(最大鄰向量表)”)獲得的,該最大的鄰向量表包含最大數(shù)目的最近的鄰向量并且優(yōu)選通過稀釋過程來減少。用于稀釋或裁剪(“priming(裁剪)”)鄰向量表的該過程優(yōu)選結(jié)合根據(jù)本發(fā)明的方法使用,以避免在其中所有或許多鄰向量彼此相互指向的情況。起初的鄰向量表的大小(在“裁剪”前)優(yōu)選為CB_DIM_H*MAX_NBR_NN,其中*表示乘積,并且MAX_NBR_NN表示最近的鄰向量的預定數(shù)目。其最近的鄰向量由表包含的碼本向量與該碼本向量的最近的鄰向量之間的最大距離越大,則該數(shù)目就越大。在不預先規(guī)定這種極限的情況下,碼本的所有碼本向量也就是所有碼本向量的最近的鄰向量,這是沒有意義的。在第一步驟中,將其鄰向量應當包含在鄰向量表中的那些碼本向量記錄到鄰向量表的列中。對于這些碼本向量中的每個碼本向量,計算與所有其他碼本向量的距離,并且預定數(shù)目的最近的鄰向量在鄰向量表中分配給每個碼本向量以及記錄到該表中。在此,優(yōu)選根據(jù)距離尺寸對這些記錄進行升序排序。在第二步驟中,為這些碼本向量中的每個碼本向量執(zhí)行稀釋過程。該過程檢查鄰向量表中的碼本向量的單個記錄(“主碼向量”)的前兩個最近的鄰向量(“最近的碼向量”)。該碼本向量的最近的鄰向量的這兩個索引被稱為父索引。對于第一父索引,通過將該父索引簡單地用作鄰向量表中的主索引(“主碼向量”),從該表確定接下去兩個最近的鄰碼本向量或其索引。如此找到的這兩個索引被稱為子索引。如果以此方式根據(jù)第一父索引確定的這兩個子索引中也僅一個子索引與第二父索引一致,則從鄰向量表中刪除該第二父索引。相應地,如果從第二父索引推導出的兩個子索引中也僅一個子索引與第一父索引一致,則刪除鄰向量表中的第一父索引。如果例如觀察主索引123,則這根據(jù)圖2示例性地示出。該索引123的父索引是碼本向量索引127和125。第一父索引的子索引是索引131和124。第二父索引的子索引是索引127和126。在此情形中,從表中刪去第一父索引,因為該第一父索引與第二父索引的子索引之一(即索引127)—致。刪去的、也就是刪除的索引優(yōu)選由鄰向量表中該索引最近的相鄰的碼本向量索引代替。優(yōu)選為鄰向量表的所有元素執(zhí)行此過程,其中優(yōu)選對記錄刪去的數(shù)目進行計數(shù)。隨后重復此步驟直至所計數(shù)的刪去數(shù)目在遍歷鄰向量表時等于0為止,即直至沒有其他刪除出現(xiàn)。用語音信號的實驗調(diào)查已得出,根據(jù)本發(fā)明的方法能夠在語音編碼時導致準確性的顯著改善。對于鄰向量集合的大小NB_NN的不同值,與標準搜索或全搜索相比,下表示出根據(jù)本發(fā)明的搜索的相應覆蓋和復雜度權利要求1.一種用于尤其與待傳輸或待存儲的信號的數(shù)據(jù)壓縮有關的特征向量的向量量化的方法,所述信號尤其是語音信號或視頻信號,在所述方法中,通過在搜索期間檢驗一系列碼本向量是否適用于表示所述特征向量,搜尋由多個碼本向量構(gòu)成的至少一個碼本以尋找表示所述特征向量的碼向量,其特征在于,所述方法包括以下步驟a)針對在搜索所述碼向量的過程中有可能要檢驗的至少一個碼本向量,在所述搜索開始之前確定鄰向量集合;b)對所述碼向量的搜索至少延伸到所述鄰向量的子集。2.根據(jù)權利要求1所述的方法,其中借助鄰向量表確定碼本向量的鄰向量集合,向所述至少一個碼本的多個碼本向量中的每個碼本向量分配多個最近的鄰向量,所通過的方式是,從其鄰向量集合應當被確定且作為起始向量被記錄到所述鄰向量集合中的碼本向量出發(fā),將所述鄰向量集合中每個已存在記錄的各個最近的鄰向量序列在鄰向量一側(cè)記錄到所述鄰向量集合中,直至不再添加新的記錄或者直至因為所述鄰向量集合中的鄰向量的數(shù)目已達到預定極限而中斷記錄。3.根據(jù)權利要求2所述的方法,其中確定碼本向量的鄰向量表,所通過的是首先針對所述至少一個碼本的碼本向量的至少一個子集優(yōu)選通過各個距離的確定來確定多個最近的鄰向量并且通過以下步驟的迭代修改如此獲得的鄰向量表c)針對所述鄰向量表中的一個碼本向量,確定其兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成該碼本向量的父向量;d)針對所述第一父向量,從所述鄰向量表中確定兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成所述第一父向量的子向量;e)如果所述第一父向量的兩個子向量之一與所述第二父向量一致,則將所述第二父向量從所述鄰向量表中刪去并且由所述鄰向量表中與其最近的鄰向量代替;f)針對所述第二父向量,從所述鄰向量表中確定兩個最近的鄰向量;這兩個最近的鄰向量構(gòu)成所述第二父向量的子向量;g)如果所述第二父向量的兩個子向量之一與所述第一父向量一致,則將所述第一父向量從所述鄰向量表中刪去并且由所述鄰向量表中與其最近的鄰向量代替。4.一種將根據(jù)上述權利要求之一所述的方法用于減少與用于語音編碼或用于視頻編碼的方法相關聯(lián)的編碼誤差的程度的應用。全文摘要在一種用于尤其與待傳輸或待存儲的信號的數(shù)據(jù)壓縮相關的特征向量的向量量化的方法中,該信號尤其是語音信號或視頻信號,搜尋由多個碼本向量構(gòu)成的至少一個碼本以尋找表示特征向量的碼向量。在搜索期間,檢驗一系列碼本向量是否適用于表示特征向量。為此,針對在搜索碼向量的過程中有可能要檢驗的至少一個碼本向量,優(yōu)選在搜索開始之前確定鄰向量集合。對碼向量的搜索至少延伸到鄰向量的子集。文檔編號H04N7/28GK102474267SQ201080029964公開日2012年5月23日申請日期2010年6月30日優(yōu)先權日2009年7月2日發(fā)明者塞蒂亞萬P.,尚德爾S.申請人:西門子企業(yè)通訊有限責任兩合公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
丹东市| 丹寨县| 且末县| 石首市| 光泽县| 满洲里市| 韶山市| 桃源县| 三原县| 平潭县| 萝北县| 会同县| 清徐县| 出国| 宁晋县| 彰化县| 琼海市| 汉寿县| 渭源县| 黄平县| 南京市| 遂宁市| 乌苏市| 孟津县| 偏关县| 庐江县| 滦南县| 鹰潭市| 资兴市| 玛纳斯县| 谷城县| 策勒县| 红河县| 四川省| 惠水县| 承德县| 叙永县| 五家渠市| 长葛市| 吉木乃县| 黄龙县|