專利名稱::用于任意形狀2d塊絕對(duì)差之和(sad)計(jì)算引擎的近最優(yōu)可配置加法器樹的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明總地涉及加法器樹,并且具體涉及用于任意形狀2D塊絕對(duì)差之和(SAD)計(jì)算引擎的近最優(yōu)可配置加法器樹。
背景技術(shù):
:諸如視頻編碼器內(nèi)的基于塊的運(yùn)動(dòng)估計(jì)、用于圖像穩(wěn)定的基于塊的軌線估計(jì)、去交錯(cuò)中的線角檢測(cè)以及幀率轉(zhuǎn)換中的運(yùn)動(dòng)分析之類的視頻處理應(yīng)用在像素之間使用二維(2D)塊的絕對(duì)差之和(SAD)。然而,不同的應(yīng)用需要不同的塊大小,例如,去交錯(cuò)器需要5X3的塊SAD,而H.264視頻編碼標(biāo)準(zhǔn)需要4X4至16X16的塊SAD。SAD的軟件實(shí)現(xiàn)需要許多時(shí)鐘周期,而可配置用于任意塊大小的硬件實(shí)現(xiàn)一般會(huì)需要大量多路復(fù)用器和路由線。關(guān)于對(duì)
背景技術(shù):
的詳細(xì)的討論和其他現(xiàn)有技術(shù)解決方案,請(qǐng)參考在2009年5月27日接受的ArvindSudarsanam、AravindRaghavendraDasu禾PKarthikVaithianathan在InternationalJournalofReconfigurableComputing上的“AnalysisandDesignofAdaptableSAD/MSEArchitecture”,其可從Hindawi出版公司(http://www.hindawi.com/journals/ijrc/aip.html)獲得。圖1是根據(jù)本發(fā)明某些實(shí)施例的示例性一維加法器樹的框圖;圖2是根據(jù)本發(fā)明某些實(shí)施例的示例性輸入遮蔽網(wǎng)絡(luò)的電路圖;圖3是根據(jù)本發(fā)明某些實(shí)施例的加法器單元1-8的示例性輸入路由網(wǎng)絡(luò)的電路圖;圖4是根據(jù)本發(fā)明某些實(shí)施例的加法器單元9-15的示例性輸入路由網(wǎng)絡(luò)的電路圖;圖5是根據(jù)本發(fā)明某些實(shí)施例的示例性輸出路由網(wǎng)絡(luò)的電路圖;圖6是根據(jù)本發(fā)明某些實(shí)施例的示例性可配置二維加法器樹結(jié)構(gòu)的框圖;圖7是根據(jù)本發(fā)明某些實(shí)施例的示例性系統(tǒng)的框圖。具體實(shí)施例方式以下描述和附圖充分地說(shuō)明本發(fā)明的特定實(shí)施例,以使本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)它們。其他實(shí)施例可以結(jié)合結(jié)構(gòu)上的、邏輯上的、電子的、流程上的和其他的改變。實(shí)例僅僅表明了可能的變化例。除非明確地要求,否則各個(gè)組件和功能是可選的,而且操作的順序可以改變。某些實(shí)施例的組成部分和特征可以包含在或代替其他實(shí)施例的組成部分和特征。在權(quán)利要求中闡述的本發(fā)明的實(shí)施例包含那些權(quán)利要求中所有可用的等同的方案。在本文中,本發(fā)明的實(shí)施例可以單獨(dú)地或共同地以術(shù)語(yǔ)“發(fā)明”來(lái)指代,使用術(shù)語(yǔ)“發(fā)明”僅僅為了方便起見,而無(wú)意于在實(shí)際上公開了多于一個(gè)的發(fā)明或發(fā)明構(gòu)思的情況下將此申請(qǐng)的范圍限制于任何一個(gè)單獨(dú)的發(fā)明或發(fā)明構(gòu)思。本發(fā)明描述了一種用于任意形狀的2D塊的絕對(duì)差之和(SAD)計(jì)算引擎的近最優(yōu)可配置加法器樹,包括所定義的被要求用來(lái)執(zhí)行加法的流水線化的加法器資源以及所定義的被要求用來(lái)針對(duì)各種塊大小配置加法器樹的路由網(wǎng)絡(luò)資源。所提出的實(shí)施例源自于一種約束性優(yōu)化,其旨在最小化路由網(wǎng)絡(luò)資源,即多路復(fù)用器的數(shù)量、多路復(fù)用器輸入和路由線的數(shù)量。此最優(yōu)化問(wèn)題顯示為非多項(xiàng)式(NP)難度(non-polynomialHard),且運(yùn)用約束來(lái)修剪解空間。產(chǎn)生一種近最優(yōu)的解決方案(在兩輸入多路復(fù)用器方面),從該解決方案中衍生出可配置的IDSAD樹結(jié)構(gòu)。按照順序生成該ID樹的輸出,從而避免使用輸出路由網(wǎng)絡(luò)來(lái)進(jìn)行重新排序。最終,使用級(jí)聯(lián)的兩級(jí)的ID單元來(lái)實(shí)現(xiàn)2D加法器結(jié)構(gòu),其中每一級(jí)包括多個(gè)可配置的IDSAD樹結(jié)構(gòu)。由于對(duì)ID陣列進(jìn)行了排序,因此在這兩個(gè)級(jí)之間就不存在額外的路由開銷。圖1是根據(jù)本發(fā)明某些實(shí)施例的示例性一維加法器樹的框圖。如圖所示,加法器樹100包括樹輸入102、遮蔽(masking)輸入104、遮蔽輸出106、輸入路由網(wǎng)絡(luò)108、加法器輸入110、加法器單元112、加法器輸出114、輸出路由網(wǎng)絡(luò)116和樹輸出118。樹輸入102可以表示針對(duì)ID塊大小的16個(gè)8比特線,從1到16。樹輸入102被路由到遮蔽輸入104,還被路由到輸出路由網(wǎng)絡(luò)116。參照?qǐng)D2,其更詳細(xì)地顯示了遮蔽輸入104和遮蔽輸出106,其適應(yīng)了特定塊大小的數(shù)據(jù)流需要遮蔽特定的輸入的事實(shí)。輸入路由網(wǎng)絡(luò)108對(duì)被遮蔽的輸入和加法器輸出114進(jìn)行排序,以針對(duì)任何塊大小而將加法器輸入110提供至加法器單元112,正如參照?qǐng)D3和4更詳細(xì)地顯示的。正如參照?qǐng)D5更詳細(xì)所顯示的,輸出路由網(wǎng)絡(luò)116針對(duì)任何塊大小來(lái)對(duì)樹輸出118進(jìn)行排序。圖2是根據(jù)本發(fā)明某些實(shí)施例的示例性輸入遮蔽網(wǎng)絡(luò)的電路圖。遮蔽網(wǎng)絡(luò)200基于唯一性的數(shù)據(jù)流,針對(duì)大于8的特定塊大小(P)而屏蔽特定的樹輸入102。多路復(fù)用器202被提供用于輸入10-16,導(dǎo)致有7個(gè)多路復(fù)用器202。每個(gè)多路復(fù)用器202將基于P的值,使得相應(yīng)的輸入通過(guò)或者用O將其遮蔽。例如,如果P為9,則會(huì)用0遮蔽輸入10-16,而如果P為15時(shí),則僅會(huì)用0遮蔽輸入16,并且如果P為4,則所有輸入將會(huì)通過(guò)而不會(huì)用0進(jìn)行遮蔽。圖3和4是根據(jù)本發(fā)明某些實(shí)施例的用于15個(gè)加法器單元的示例性輸入路由網(wǎng)絡(luò)的電路圖。由于用于塊大小16的數(shù)據(jù)流涉及一個(gè)可能的IDSAD操作以及15個(gè)加法操作,所以需要15個(gè)加法器單元,如下表所示ID塊大小(P)可能的I-DSAD操作的數(shù)量加法操作的數(shù)量(η)11602883510權(quán)利要求1.一種可配置的二維加法器樹結(jié)構(gòu),用于計(jì)算針對(duì)多達(dá)16X16的各種塊大小的絕對(duì)差之和(SAD),所述結(jié)構(gòu)包括第一級(jí)的一維加法器樹;以及第二級(jí)的一維加法器樹,其中,每個(gè)一維加法器樹包括輸入路由網(wǎng)絡(luò);15個(gè)加法器單元;以及輸出路由網(wǎng)絡(luò)。2.如權(quán)利要求1所述的加法器樹結(jié)構(gòu),其中,每個(gè)一維加法器樹進(jìn)一步包括針對(duì)大于8的塊大小的遮蔽輸入。3.如權(quán)利要求1所述的加法器樹結(jié)構(gòu),其中,所述輸入路由網(wǎng)絡(luò)包括20個(gè)2對(duì)1多路見用器。4.如權(quán)利要求3所述的加法器樹結(jié)構(gòu),其中,當(dāng)塊大小為3時(shí),第二個(gè)加法器的輸入包括第一個(gè)加法器的輸出。5.如權(quán)利要求1所述的加法器樹結(jié)構(gòu),其中,所述輸出路由網(wǎng)絡(luò)包括39個(gè)2對(duì)1多路見用器。6.如權(quán)利要求5所述的加法器樹結(jié)構(gòu),其中,當(dāng)塊大小為10時(shí),所述輸出路由網(wǎng)絡(luò)的第一個(gè)輸出包括第十五個(gè)加法器的輸出。7.如權(quán)利要求1所述的加法器樹結(jié)構(gòu),其中,所述第一級(jí)和第二級(jí)的一維加法器樹每個(gè)包括16個(gè)加法器樹。8.如權(quán)利要求7所述的加法器樹結(jié)構(gòu),其中,將所述第一級(jí)的第一個(gè)加法器樹的第二個(gè)輸出路由到所述第二級(jí)的第二個(gè)加法器樹的第一個(gè)輸人。9.一種集成電路設(shè)備,包括可配置的二維加法器樹結(jié)構(gòu),用于計(jì)算針對(duì)多達(dá)16X16的各種塊大小的絕對(duì)差之和(SAD),所述結(jié)構(gòu)包括第一級(jí)的一維加法器樹;以及第二級(jí)的一維加法器樹,其中,每個(gè)一維加法器樹包括輸入路由網(wǎng)絡(luò);多個(gè)加法器單元;以及輸出路由網(wǎng)絡(luò),其中,所述輸出路由網(wǎng)絡(luò)包括39個(gè)2對(duì)1多路復(fù)用器。10.如權(quán)利要求9所述的集成電路設(shè)備,其中,所述輸入路由網(wǎng)絡(luò)包括20個(gè)2對(duì)1多路見用器。11.如權(quán)利要求9所述的集成電路設(shè)備,其中,所述多個(gè)加法器單元包括15個(gè)兩輸入加法器。12.如權(quán)利要求9所述的集成電路設(shè)備,其中,所述第一級(jí)和第二級(jí)的一維加法器樹每個(gè)包括16個(gè)加法器樹。13.如權(quán)利要求12所述的集成電路設(shè)備,其中,將所述第一級(jí)的第十六個(gè)加法器樹的第二個(gè)輸出路由到所述第二級(jí)的第二個(gè)加法器樹的第十六個(gè)輸入。14.一種系統(tǒng),包括網(wǎng)絡(luò)控制器;系統(tǒng)存儲(chǔ)器;以及處理器,所述處理器包括可配置的二維加法器樹結(jié)構(gòu),用于計(jì)算針對(duì)多達(dá)16X16的各種塊大小的絕對(duì)差之和(SAD),所述結(jié)構(gòu)包括第一級(jí)的一維加法器樹;以及第二級(jí)的一維加法器樹,其中,每個(gè)一維加法器樹包括輸入路由網(wǎng)絡(luò),其中,所述輸入路由網(wǎng)絡(luò)包括20個(gè)2對(duì)1多路復(fù)用器;多個(gè)加法器單元;以及輸出路由網(wǎng)絡(luò)。15.如權(quán)利要求14所述的系統(tǒng),其中,每個(gè)一維加法器樹進(jìn)一步包括針對(duì)大于8的塊大小的遮蔽輸入。16.如權(quán)利要求14所述的系統(tǒng),其中,所述第一級(jí)和第二級(jí)的一維加法器樹每個(gè)包括16個(gè)加法器樹。17.如權(quán)利要求14所述的系統(tǒng),其中,所述多個(gè)加法器單元包括15個(gè)兩輸入加法器。18.如權(quán)利要求17所述的系統(tǒng),其中,當(dāng)塊大小為3時(shí),第二個(gè)加法器的輸入包括第一個(gè)加法器的輸出。19.如權(quán)利要求14所述的系統(tǒng),其中,所述輸出路由網(wǎng)絡(luò)包括39個(gè)2對(duì)1多路復(fù)用器。20.如權(quán)利要求19所述的系統(tǒng),其中,當(dāng)塊大小為16時(shí),所述輸出路由網(wǎng)絡(luò)的第一個(gè)輸出包括第十五個(gè)加法器的輸出。全文摘要本文總地描述了用于任意形狀2D塊的絕對(duì)差之和(SAD)計(jì)算引擎的近最優(yōu)可配置加法器樹的實(shí)施例??梢悦枋龊驼?qǐng)求保護(hù)其他實(shí)施例。在某些實(shí)施例中,一種用于計(jì)算針對(duì)多達(dá)16×16的各種塊大小的絕對(duì)差之和(SAD)的可配置的二維加法器樹結(jié)構(gòu),其包括第一級(jí)的一維加法器樹和第二級(jí)的一維加法器樹,其中每個(gè)一維加法器樹包括輸入路由網(wǎng)絡(luò)、多個(gè)加法器單元和輸出路由網(wǎng)絡(luò)。文檔編號(hào)H04N7/26GK102075744SQ20101053897公開日2011年5月25日申請(qǐng)日期2010年9月26日優(yōu)先權(quán)日2009年10月19日發(fā)明者A·蘇達(dá)爾薩納姆,K·瓦伊蒂亞納坦申請(qǐng)人:英特爾公司