用于視頻數(shù)據(jù)背景區(qū)域的降低的圖像質(zhì)量的制作方法
【專利摘要】本發(fā)明描述了一些系統(tǒng)、裝置、制品和方法,其包括:至少部分地基于視頻數(shù)據(jù),檢測(cè)面部的操作??梢灾辽俨糠值鼗谒鶛z測(cè)到的面部,確定感興趣區(qū)域和背景區(qū)域??梢孕薷脑摫尘皡^(qū)域,以具有降低的圖像質(zhì)量。
【專利說(shuō)明】用于視頻數(shù)據(jù)背景區(qū)域的降低的圖像質(zhì)量
【背景技術(shù)】
[0001]通常,可視電話指代處于不同位置的用戶接收和傳輸視頻和相關(guān)聯(lián)的音頻數(shù)據(jù),以便實(shí)時(shí)地在這些用戶之間通信而所使用的技術(shù)。在一些實(shí)現(xiàn)中,可以將可視電話設(shè)計(jì)用于遠(yuǎn)程位置和/或移動(dòng)位置的用戶,并且在這些實(shí)現(xiàn)中其可以稱為用戶視頻聊天。例如,在一些實(shí)例中,可以通過(guò)電視、平板計(jì)算機(jī)、膝上型計(jì)算機(jī)、桌面型計(jì)算機(jī)、移動(dòng)電話等等來(lái)實(shí)現(xiàn)這種用戶視頻聊天技術(shù)。
【專利附圖】
【附圖說(shuō)明】
[0002]在附圖中,通過(guò)示例的方式,而不是通過(guò)限制的方式描繪了本申請(qǐng)所描述的材料。為了說(shuō)明的簡(jiǎn)化和清楚起見(jiàn),在附圖中描述的元素沒(méi)有按比例進(jìn)行描繪。例如,為了清楚說(shuō)明起見(jiàn),可以相對(duì)于其它元素,對(duì)一些元素的尺寸進(jìn)行擴(kuò)大。此外,在認(rèn)為適當(dāng)時(shí),在附圖之中重復(fù)的附圖標(biāo)記指示相應(yīng)的或者類似的元素。在附圖中:
[0003]圖1是一種示例性視頻聊天系統(tǒng)的示意圖;
[0004]圖2是描繪一種示例性背景修改處理的流程圖;
[0005]圖3是操作中的示例性視頻聊天系統(tǒng)的示意圖;
[0006]圖4描繪了被處理以具有背景修改的幾幅示例圖像;
[0007]圖5是一種示例性系統(tǒng)的示意圖;并且
[0008]圖6是一種示例性系統(tǒng)的示意圖,其所有部件根據(jù)本發(fā)明的至少一些實(shí)現(xiàn)來(lái)布置。
【具體實(shí)施方式】
[0009]現(xiàn)在參照附圖來(lái)描述一個(gè)或多個(gè)實(shí)施例或者實(shí)現(xiàn)。雖然討論了特定的配置和排列,但應(yīng)當(dāng)理解的是,這僅僅只是用于示例性目的。本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識(shí)到,在不脫離本發(fā)明的精神和保護(hù)范圍的基礎(chǔ)上,可以使用其它配置和排列。對(duì)于相關(guān)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是,本申請(qǐng)所描述的技術(shù)和/或排列還可以用于不同于本申請(qǐng)所描述的系統(tǒng)和應(yīng)用的多種其它系統(tǒng)和應(yīng)用。
[0010]雖然下面的描述闡述了可以在諸如片上系統(tǒng)(SoC)體系結(jié)構(gòu)之類的體系結(jié)構(gòu)中表現(xiàn)的各種實(shí)現(xiàn),但本申請(qǐng)所描述的技術(shù)和/或排列的實(shí)現(xiàn)并不限于特定的結(jié)構(gòu)和/或計(jì)算系統(tǒng),其可以通過(guò)用于類似目的的任何體系結(jié)構(gòu)和/或計(jì)算系統(tǒng)來(lái)實(shí)現(xiàn)。例如,使用諸如多個(gè)集成電路(IC)芯片和/或封裝的各種體系結(jié)構(gòu)和/或諸如機(jī)頂盒、智能電話等等之類的各種計(jì)算設(shè)備和/或消費(fèi)電子(CE)設(shè)備,可以實(shí)現(xiàn)本申請(qǐng)所描述的技術(shù)和/或排列。此夕卜,雖然下面的描述闡述了諸如系統(tǒng)組件的邏輯實(shí)現(xiàn)、類型和相互關(guān)系、邏輯劃分/綜合選項(xiàng)等等之類的眾多特定細(xì)節(jié),但本發(fā)明可以在不使用這些特定細(xì)節(jié)的情況下實(shí)現(xiàn)。在其它實(shí)例中,為了不對(duì)本申請(qǐng)所公開(kāi)的材料造成模糊,沒(méi)有詳細(xì)地顯示諸如控制結(jié)構(gòu)和完整的軟件指令序列之類的一些材料。
[0011]本申請(qǐng)所公開(kāi)的材料可以用硬件、固件、軟件或者其任意組合來(lái)實(shí)現(xiàn)。此外,本申請(qǐng)所公開(kāi)的材料還可以實(shí)現(xiàn)成在機(jī)器可讀介質(zhì)上存儲(chǔ)的指令,其可以由一個(gè)或多個(gè)處理器進(jìn)行讀取和執(zhí)行。機(jī)器可讀介質(zhì)可以包括用于存儲(chǔ)或發(fā)送具有能由機(jī)器(例如,計(jì)算設(shè)備)讀取的形式的信息的任何介質(zhì)和/或裝置。例如,機(jī)器可讀存儲(chǔ)介質(zhì)可以包括:只讀存儲(chǔ)器(ROM);隨機(jī)存取存儲(chǔ)器(RAM);磁盤(pán)存儲(chǔ)介質(zhì);光存儲(chǔ)介質(zhì);閃存設(shè)備;電、光、聲或者其它形式的傳播信號(hào)(例如,載波波形、紅外信號(hào)、數(shù)字信號(hào)等)等等。
[0012]說(shuō)明書(shū)中對(duì)于“一種實(shí)現(xiàn)”、“一個(gè)實(shí)現(xiàn)”、“一種示例性實(shí)現(xiàn)”等等的引用,指示所描述的實(shí)現(xiàn)可以包括具體特征、結(jié)構(gòu)或者特性,但并不需要每一種實(shí)現(xiàn)都包括該特定特征、結(jié)構(gòu)或特性。此外,這種短語(yǔ)并不是必須指代相同的實(shí)現(xiàn)。此外,當(dāng)結(jié)合一種實(shí)現(xiàn)來(lái)描述特定的特征、結(jié)構(gòu)或特性時(shí),提出了結(jié)合其它實(shí)現(xiàn)(無(wú)論本申請(qǐng)是否對(duì)其進(jìn)行了明確描述)實(shí)施這種特征、結(jié)構(gòu)或特性,也在本領(lǐng)域普通技術(shù)人員的知識(shí)范圍之內(nèi)。
[0013]用戶視頻聊天應(yīng)用可能增加對(duì)于與各種技術(shù)(例如,電視、平板計(jì)算機(jī)、膝上型計(jì)算機(jī)、桌面型計(jì)算機(jī)、移動(dòng)電話等等)相關(guān)聯(lián)的帶寬的需求。下面所討論的一些實(shí)現(xiàn)通過(guò)進(jìn)行智能比特分配來(lái)解決這種帶寬需求,同時(shí)保持合理的用戶體驗(yàn)并節(jié)省帶寬。在視頻聊天期間,用戶通常更關(guān)心前景的人,很少把注意力放到背景周圍環(huán)境上。這意味著注意力聚焦于正在說(shuō)話的人。例如,人眼以類似于數(shù)碼相機(jī)的區(qū)域聚焦概念的方式進(jìn)行操作,其中,被聚焦的項(xiàng)目通常對(duì)焦清晰,而前景和/或背景中的項(xiàng)目可能是模糊的或者具有較低的質(zhì)量。如下面將要描述的,可以使視頻數(shù)據(jù)的背景部分預(yù)先模糊,以便模擬區(qū)域聚焦概念,同時(shí)使面部特征保持對(duì)焦清晰。例如,可以將面部感知模糊建模(face-aware blur modeling)和多層次混合方法(mult1-level blending approach)用作預(yù)編碼操作。
[0014]圖1是根據(jù)本發(fā)明的至少一些實(shí)現(xiàn)來(lái)布置的示例性視頻聊天系統(tǒng)100的示意圖。在所描繪的實(shí)現(xiàn)中,視頻聊天系統(tǒng)100可以包括與第一用戶104相關(guān)聯(lián)的第一設(shè)備102。第一設(shè)備102可以包括成像設(shè)備106和顯示器108。成像設(shè)備106可以配置為從第一用戶104捕獲視頻數(shù)據(jù)。
[0015]在一些示例中,第一設(shè)備102可以包括:為了清楚說(shuō)明起見(jiàn)而在圖1中沒(méi)有示出的其它部件。例如,第一設(shè)備102可以包括處理器、射頻類型(RF)收發(fā)機(jī)和/或天線。此外,第一設(shè)備102還可以包括諸如麥克風(fēng)、揚(yáng)聲器、加速計(jì)、存儲(chǔ)器、路由器、網(wǎng)絡(luò)接口邏輯等等之類的其它部件,為了清楚說(shuō)明起見(jiàn),在圖1中沒(méi)有示出這些部件。
[0016]類似地,第二設(shè)備112可以與第二用戶114相關(guān)聯(lián)。第二設(shè)備112可以與第一設(shè)備102相同,也可以是不同類型的設(shè)備。第二設(shè)備112可以包括成像設(shè)備116和顯示器118。成像設(shè)備116可以配置為從第一用戶104捕獲視頻數(shù)據(jù)。
[0017]第一設(shè)備102可以通過(guò)成像設(shè)備106捕獲第一用戶104的視頻數(shù)據(jù)??梢詫⒌谝挥脩?04的該視頻數(shù)據(jù)傳輸給第二設(shè)備112,并通過(guò)第二設(shè)備112的顯示器118進(jìn)行呈現(xiàn)。類似地,第二設(shè)備112可以通過(guò)成像設(shè)備116捕獲第二用戶114的視頻數(shù)據(jù)??梢詫⒌诙脩?14的該視頻數(shù)據(jù)傳輸給第一設(shè)備102,并通過(guò)第一設(shè)備102的顯示器108進(jìn)行呈現(xiàn)。
[0018]如下面所更詳細(xì)討論的,第一設(shè)備102和/或第二設(shè)備112可以用于執(zhí)行下面結(jié)合圖2和/或圖3所討論的各種功能中的一些或者全部。例如,第一設(shè)備102可以包括背景修改模塊(沒(méi)有示出),后者可以配置為執(zhí)行圖2和/或圖3的操作中的任何一個(gè),如下面所進(jìn)一步詳細(xì)討論的。例如,在傳輸?shù)谝挥脩?04的視頻數(shù)據(jù)之前,可以對(duì)該視頻數(shù)據(jù)進(jìn)行修改。例如,該背景修改模塊可以修改視頻數(shù)據(jù)的背景區(qū)域,以具有降低的圖像質(zhì)量。[0019]在操作中,第一設(shè)備102和/或第二設(shè)備112可以使用智能比特分配方法,來(lái)保持合理的良好用戶體驗(yàn),同時(shí)還減少帶寬使用,和/或?yàn)榱怂矫苄躁P(guān)注而替換背景。當(dāng)用戶在使用視頻聊天時(shí),它們的主要注意力通常集中在前景中正在講話的人。無(wú)關(guān)的背景場(chǎng)景很少獲得直接的眼球關(guān)注。因此,可以將前景人物設(shè)置為聚焦,而使背景場(chǎng)景模糊失焦。從觀看者的角度來(lái)看,如果直接觀察的話,這種失焦的背景場(chǎng)景呈現(xiàn)為是模糊的;但是,當(dāng)觀看者的眼球直接關(guān)注于聚焦的前景人物時(shí),其呈現(xiàn)為正常的。
[0020]圖2是根據(jù)本發(fā)明的至少一些實(shí)現(xiàn)布置的,用于描繪一種示例性背景修改處理200的流程圖。在所描繪的實(shí)現(xiàn)中,處理200可以包括一個(gè)或多個(gè)操作、功能或者動(dòng)作,如方框202、204和/或206中的一個(gè)或多個(gè)所描繪的。舉一個(gè)非限制性的示例,本申請(qǐng)將參照?qǐng)D1的示例性視頻聊天系統(tǒng)100來(lái)描述處理200。
[0021]如上所述,可以通過(guò)成像設(shè)備來(lái)捕獲第一用戶的視頻數(shù)據(jù)??梢詫⒌谝挥脩舻脑撘曨l數(shù)據(jù)傳輸給第二設(shè)備。在傳輸?shù)谝挥脩舻脑撘曨l數(shù)據(jù)之前,可以對(duì)該視頻數(shù)據(jù)進(jìn)行修改。例如,背景修改模塊可以修改該視頻數(shù)據(jù)的背景區(qū)域,以具有降低的圖像質(zhì)量。在一些示例中,處理200可以至少部分地基于面部檢測(cè)來(lái)確定背景區(qū)域。
[0022]如下面所更詳細(xì)討論的,可以將圖2的操作執(zhí)行成用戶視頻聊天中的預(yù)編碼操作(例如,其在視頻編碼和轉(zhuǎn)碼之前)。例如,該操作可以包括面部檢測(cè)(和/或跟蹤)、背景模糊化、和/或背景混合。在典型的視頻聊天中,涉及三個(gè)部分:前端、網(wǎng)絡(luò)、以及后端。這里,圖2的操作主要聚焦于前端操作(例如,圖2的操作可以在實(shí)時(shí)視頻數(shù)據(jù)捕獲和視頻編碼之間發(fā)生)。由于圖2的操作主要聚焦于前端操作,因此該方法可以獨(dú)立于音視頻編碼方案,這使得其對(duì)于不同的設(shè)備和帶寬信道是可擴(kuò)展的。
[0023]處理200可以開(kāi)始于方框202,“至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)面部”,其中在該操作中,可以檢測(cè)用戶的面部。例如,可以至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)用戶的面部。
[0024]在一些示例中,面部的檢測(cè)可以包括:至少部分地基于Viola-Jones類型框架來(lái)檢測(cè)面部(例如,參見(jiàn) CVPR2001 中的 Paul Viola, Michael Jones 的 “Rapid ObjectDetection using a Boosted Cascade of Simple Features,,,和/或Yangzhou Du, Qiang Li 在2010 年 12 月 10 日提交的題目為“TECHNIQUES FOR FACE DETECTION AND TRACKING” 的 PCT/CN2010/000997)。這些面部檢測(cè)技術(shù)可以允許相對(duì)累積,以包括面部檢測(cè)、路標(biāo)檢測(cè)、面部對(duì)齊、笑容/眨眼/性別/年齡檢測(cè)、面部識(shí)別、檢測(cè)兩個(gè)或更多面部等等。
[0025]在一些示例中,可以通過(guò)攝像頭傳感器等等(例如,互補(bǔ)金屬氧化物半導(dǎo)體圖像傳感器(CMOS)或者電荷藕合器件圖像傳感器(CCD))來(lái)捕獲第一用戶的視頻數(shù)據(jù),而無(wú)需使用紅綠藍(lán)(RGB)景深相機(jī)和/或陣列式麥克風(fēng)來(lái)定位誰(shuí)在講話。在其它示例中,除了攝像頭傳感器之外或者替代攝像頭傳感器,還可以使用RGB景深相機(jī)和/或陣列式麥克風(fēng)。
[0026]處理可以從操作202轉(zhuǎn)到操作204,“確定感興趣區(qū)域和背景區(qū)域”,其中在該操作中,可以確定感興趣區(qū)域和背景區(qū)域。例如,可以至少部分地基于所檢測(cè)到的面部來(lái)確定感興趣區(qū)域和背景區(qū)域。
[0027]如本申請(qǐng)所使用的,術(shù)語(yǔ)“背景”可以指代:沒(méi)有被定義為感興趣區(qū)域的視頻圖像中的區(qū)域,其可以包括位于所確定的感興趣區(qū)域之后或者之前(例如,前景)的圖像部分。
[0028]處理可以從操作204轉(zhuǎn)到操作206,“修改背景區(qū)域,以具有降低的圖像質(zhì)量”,其中在該操作中,可以對(duì)背景區(qū)域進(jìn)行修改。例如,可以修改背景區(qū)域,以具有降低的圖像質(zhì)量。
[0029]在一些示例中,降低與背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量可以包括:向背景區(qū)域應(yīng)用模糊效果。例如,這種模糊效果可以是至少部分地基于點(diǎn)擴(kuò)散函數(shù)(PointSpreadFunction)和噪聲模型等等。
[0030]照相機(jī)抖動(dòng)或者目標(biāo)的快速移動(dòng)通常會(huì)造成非有意的模糊圖像。很難通過(guò)單獨(dú)地對(duì)噪聲圖像進(jìn)行簡(jiǎn)單地去噪化,或者對(duì)模糊圖像進(jìn)行去模糊化,來(lái)獲得銳化的圖像。圖像去模糊通常要估計(jì)在相機(jī)抖動(dòng)期間,噪聲或者運(yùn)動(dòng)的參數(shù)形式。與去模糊的挑戰(zhàn)不同,可以將有意的背景模糊化實(shí)現(xiàn)為一種生成過(guò)程。在一些示例中,可以通過(guò)指定點(diǎn)擴(kuò)散函數(shù)和噪聲模型來(lái)實(shí)現(xiàn)有意的背景模糊化。在計(jì)算機(jī)圖形學(xué)中,可以使用視覺(jué)真實(shí)感渲染(vision-realistic rendering)來(lái)模擬景深效果(例如,前景和背景模糊)。在一些示例中,可以使用簡(jiǎn)單的模糊算法來(lái)生成針對(duì)整幅圖像的失焦效果。
[0031]在下面關(guān)于圖3所更詳細(xì)討論的實(shí)現(xiàn)的一個(gè)或多個(gè)示例中,描繪了與處理200有關(guān)的一些另外的和/或替代的細(xì)節(jié)。
[0032]圖3是根據(jù)本發(fā)明的至少一些實(shí)現(xiàn)布置的,示例性視頻聊天系統(tǒng)100和運(yùn)行的背景修改處理300的示意圖。在所描繪的實(shí)現(xiàn)中,處理300可以包括一個(gè)或多個(gè)操作、功能或者動(dòng)作,如動(dòng)作310、312、314、316、318、320和/或322中的一個(gè)或多個(gè)所描繪的。舉一個(gè)非限制性的示例,本申請(qǐng)將參照?qǐng)D1的示例性視頻聊天系統(tǒng)100來(lái)描述處理200。
[0033]在所描繪的實(shí)現(xiàn)中,視頻聊天系統(tǒng)100可以包括成像模塊302、背景修改模塊304、視頻編碼器模塊等等和/或其組合。如上所述,成像模塊302能夠與背景修改模塊304進(jìn)行通信,并且背景修改模塊304能夠與視頻編碼器模塊306進(jìn)行通信。如圖3中所示,雖然視頻聊天系統(tǒng)100可以包括與特定的模塊相關(guān)聯(lián)的一組特定的方框或者動(dòng)作,但這些方框或者動(dòng)作可以與和這里所描繪的特定模塊不相同的模塊相關(guān)聯(lián)。
[0034]處理300可以開(kāi)始于方框310,“捕獲視頻數(shù)據(jù)”,其中在該操作中,可以捕獲視頻數(shù)據(jù)。例如,可以通過(guò)成像模塊302來(lái)捕獲第一用戶的視頻數(shù)據(jù)。可以將第一用戶的該視頻數(shù)據(jù)傳輸給背景修改模塊304。在一些示例中,可以實(shí)時(shí)地對(duì)該視頻數(shù)據(jù)進(jìn)行捕獲。
[0035]處理可以從操作310轉(zhuǎn)到操作312,“至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)面部”,其中在該操作中,可以對(duì)用戶的面部進(jìn)行檢測(cè)。例如,可以至少部分地基于視頻數(shù)據(jù),通過(guò)背景修改模塊304,來(lái)檢測(cè)用戶的面部。
[0036]處理可以從操作312轉(zhuǎn)到操作314,“確定感興趣區(qū)域和背景區(qū)域”,其中在該操作中,可以確定感興趣區(qū)域和背景區(qū)域。例如,可以至少部分地基于所檢測(cè)到的面部,通過(guò)背景修改模塊304,確定感興趣區(qū)域和背景區(qū)域。
[0037]處理可以從操作314轉(zhuǎn)到操作316,“修改背景區(qū)域”,其中在該操作中,可以對(duì)背景區(qū)域進(jìn)行修改。例如,可以通過(guò)背景修改模塊304,對(duì)背景區(qū)域進(jìn)行修改,以具有降低的圖
像質(zhì)量。
[0038]處理可以從操作316轉(zhuǎn)到操作318,“應(yīng)用混合效果”,其中在該操作中,可以應(yīng)用混合效果。例如,可以通過(guò)背景修改模塊304,向過(guò)渡區(qū)應(yīng)用混合效果。在一些示例中,過(guò)渡區(qū)位于感興趣區(qū)域和背景區(qū)域之間的邊界處。
[0039]在操作中,該混合效果可以生成從“失焦”背景區(qū)域到“聚焦”感興趣區(qū)域的平滑過(guò)渡,并且避免令人不舒服的人工痕跡。在一些示例中,與處理靜止圖像不同,視頻數(shù)據(jù)圖像可能需要考慮空間-時(shí)間一致性,并且提供自然和平滑的用戶體驗(yàn)。為了提供自然和平滑的用戶體驗(yàn),可以向位于聚焦的感興趣區(qū)域和失焦的背景區(qū)域之間的邊界處的過(guò)渡區(qū),應(yīng)用混合效果。在一些示例中,這種混合效果可以包括阿爾法型混合效果(例如,參見(jiàn)AlexeiEfros, Computational Photography -1mage Blending, CMU, Spring2010)、羽化型混合效果(例如,簡(jiǎn)單的平均、中間縫、模糊的縫、中間加權(quán)等等和/或其組合)、金字塔型混合效果等等和/或其組合。在混合時(shí)的一個(gè)問(wèn)題在于選擇最佳窗,以避免縫隙和鬼影。在一個(gè)示例中,可以使用簡(jiǎn)單的平均阿爾法型混合方法,來(lái)組合“聚焦的”感興趣區(qū)域與“失焦的”背景區(qū)域。
[0040]處理可以從操作318轉(zhuǎn)到操作320,“傳輸修改后的視頻數(shù)據(jù)”,其中在該操作中,可以對(duì)修改后的視頻數(shù)據(jù)進(jìn)行傳輸。例如,可以將修改后的視頻數(shù)據(jù),從背景修改模塊304傳輸給視頻編碼器模塊306。
[0041]處理可以從操作320轉(zhuǎn)到操作322,“對(duì)修改后的視頻數(shù)據(jù)進(jìn)行編碼”,其中在該操作中,可以對(duì)修改后的視頻數(shù)據(jù)進(jìn)行編碼。例如,可以通過(guò)編碼器模塊306,對(duì)修改后的視頻數(shù)據(jù)進(jìn)行編碼。在該示例中,可以在修改背景區(qū)域并且應(yīng)用混合效果之后,發(fā)生該編碼操作。
[0042]雖然示例性處理200和300的實(shí)現(xiàn)(如圖2和圖3所描繪的)可以包括以所描繪的順序來(lái)示出的所有模塊的執(zhí)行,但本發(fā)明在該方面并不受限,在各個(gè)示例中,處理200和300的實(shí)現(xiàn)可以包括僅僅所示出的模塊的一個(gè)子集的執(zhí)行,和/或以與所描繪的不相同的順序來(lái)執(zhí)行。
[0043]此外,圖2和圖3的模塊中的任何一個(gè)或多個(gè),可以是響應(yīng)于一個(gè)或多個(gè)計(jì)算機(jī)程序產(chǎn)品所提供的指令來(lái)執(zhí)行的。這些程序產(chǎn)品可以包括提供指令的信號(hào)承載介質(zhì),其中當(dāng)這些指令被例如處理器執(zhí)行時(shí),可以提供本申請(qǐng)所描述的功能。這些計(jì)算機(jī)程序產(chǎn)品可以用任何形式的計(jì)算機(jī)可讀介質(zhì)來(lái)提供。因此,例如,包括一個(gè)或多個(gè)處理器內(nèi)核的處理器,可以響應(yīng)于計(jì)算機(jī)可讀介質(zhì)向該處理器傳送的指令,執(zhí)行圖5和圖6中所示出的模塊里的一個(gè)或多個(gè)。
[0044]如本申請(qǐng)所描述的任何實(shí)現(xiàn)里所使用的,術(shù)語(yǔ)“模塊”指代:配置為提供本申請(qǐng)所描述的功能的軟件、固件和/或硬件的任意組合。軟件可以實(shí)現(xiàn)成軟件包、代碼和/或指令集或者指令,如本申請(qǐng)所描述的任何實(shí)現(xiàn)里所使用的,例如,“硬件”可以包括下面各項(xiàng)中的單一一個(gè)或者任意組合:硬件連接電路、可編程電路、狀態(tài)機(jī)電路和/或存儲(chǔ)由可編程電路執(zhí)行的指令的固件??梢詫⑦@些模塊統(tǒng)一或者單個(gè)地實(shí)現(xiàn)成形成大型系統(tǒng)的一部分的電路,例如,集成電路(1C)、片上系統(tǒng)(SoC)等等。
[0045]圖4描繪了根據(jù)本發(fā)明的至少一些實(shí)現(xiàn)來(lái)布置的,被處理以具有背景修改的幾幅示例性圖像。在所描繪的實(shí)現(xiàn)中,可以對(duì)未修改的視頻數(shù)據(jù)圖像400進(jìn)行處理,使得能檢測(cè)到用戶的面部402??梢灾辽俨糠值鼗跈z測(cè)到的面部402,來(lái)確定感興趣區(qū)域403。類似地,可以至少部分地基于檢測(cè)到的面部402,來(lái)確定背景區(qū)域404。
[0046]可以對(duì)修改的視頻數(shù)據(jù)圖像406進(jìn)行處理,使得修改的背景區(qū)域408可以具有降低的圖像質(zhì)量。另外,可以對(duì)修改的視頻數(shù)據(jù)圖像406進(jìn)行處理,使得可以應(yīng)用混合效果410。例如,可以向位于感興趣區(qū)域403和修改的背景區(qū)域408之間的邊界處的過(guò)渡區(qū),應(yīng)用混合效果410。[0047]在操作時(shí),初步實(shí)驗(yàn)顯示:獨(dú)立于視頻編碼/解碼方案,平均節(jié)省了多達(dá)百分之五十五的帶寬。例如,示例性的640乘480運(yùn)動(dòng)圖像通常具有5.93MB大小的視頻;使用圖2或者圖3的方法,該視頻可以具有2.68MB的大小。帶寬節(jié)省達(dá)到百分之五十五的節(jié)省,在該示例中,使用XVID (例如,遵循MPEG-4標(biāo)準(zhǔn)的視頻編解碼庫(kù))格式來(lái)壓縮該視頻流。
[0048]圖5根據(jù)本發(fā)明,描繪了一種示例系統(tǒng)500。在各個(gè)實(shí)現(xiàn)中,系統(tǒng)500可以是媒體系統(tǒng),但系統(tǒng)500并不限于該上下文。例如,系統(tǒng)500可以并入到個(gè)人計(jì)算機(jī)(PC)、膝上型計(jì)算機(jī)、超級(jí)本計(jì)算機(jī)、平板計(jì)算機(jī)、觸摸板、便攜式計(jì)算機(jī)、手持計(jì)算機(jī)、掌上計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、蜂窩電話、組合蜂窩電話/PDA、電視、智能設(shè)備(例如,智能電話、智能平板或者智能電視)、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID)、消息設(shè)備、數(shù)據(jù)通信設(shè)備等等。
[0049]在各種實(shí)現(xiàn)中,系統(tǒng)500包括耦接到顯示器520的平臺(tái)502。平臺(tái)502可以從諸如內(nèi)容服務(wù)設(shè)備530或內(nèi)容傳送設(shè)備540或者其它類似內(nèi)容源之類的內(nèi)容設(shè)備接收內(nèi)容??梢允褂冒ㄒ粋€(gè)或多個(gè)導(dǎo)航特征的導(dǎo)航控制器550,來(lái)與例如平臺(tái)502和/或顯示器520進(jìn)行交互。下面將更詳細(xì)地描述這些組件中的每一個(gè)。
[0050]在各種實(shí)現(xiàn)中,平臺(tái)502可以包括芯片組505、處理器510、存儲(chǔ)器512、存貯設(shè)備514、圖形子系統(tǒng)515、應(yīng)用516和/或無(wú)線裝置518的任意組合。芯片組505可以提供處理器510、存儲(chǔ)器512、存貯設(shè)備514、圖形子系統(tǒng)515、應(yīng)用516和/或無(wú)線裝置518之間的相互通信。例如,芯片組505可以包括能夠提供與存貯設(shè)備514的相互通信的存貯適配器(沒(méi)有示出)。
[0051]處理器510可以實(shí)現(xiàn)成復(fù)雜指令集計(jì)算機(jī)(CISC)或者精簡(jiǎn)指令集計(jì)算機(jī)(RISC)處理器;x86指令集兼容處理器、多核或者任何其它微處理器或中央處理單元(CPU)。在各種實(shí)現(xiàn)中,處理器510可以是雙核處理器、雙核移動(dòng)處理器等等。
[0052]存儲(chǔ)器512可以實(shí)現(xiàn)成易失性存儲(chǔ)器件,例如,但不限于:隨機(jī)存取存儲(chǔ)器(RAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)或者靜態(tài)RAM (SRAM)。
[0053]存貯設(shè)備514可以實(shí)現(xiàn)成非易失性存儲(chǔ)設(shè)備,例如,但不限于:磁盤(pán)驅(qū)動(dòng)器、光盤(pán)驅(qū)動(dòng)器、磁帶驅(qū)動(dòng)器、內(nèi)部存貯設(shè)備、附著存貯設(shè)備、閃存、電池供電的SDRAM(同步DRAM)和/或網(wǎng)絡(luò)可訪問(wèn)存貯設(shè)備。在各種實(shí)現(xiàn)中,存貯設(shè)備514可以包括:例如,當(dāng)包括多個(gè)硬盤(pán)驅(qū)動(dòng)器時(shí),增加存貯性能,以增強(qiáng)有價(jià)值數(shù)字媒體的保護(hù)的技術(shù)。
[0054]圖形子系統(tǒng)515可以執(zhí)行諸如靜止或者視頻之類的圖像的處理,以進(jìn)行顯示。例如,圖形子系統(tǒng)515可以是圖形處理單元(GPU)或者視覺(jué)處理單元(VPU)??梢允褂媚M或者數(shù)字接口來(lái)與圖形子系統(tǒng)515和顯示器520進(jìn)行通信耦合。例如,該接口可以是高精度多媒體接口、顯示端口、無(wú)線HDMI和/或遵循無(wú)線HD的技術(shù)中的任何一種。圖形子系統(tǒng)515可以集成到處理器510或芯片組505中。在一些實(shí)現(xiàn)中,圖形子系統(tǒng)515可以是通信耦合到芯片組505的單機(jī)卡。
[0055]本申請(qǐng)所描述的圖形和/或視頻處理技術(shù)可以用各種硬件體系結(jié)構(gòu)來(lái)實(shí)現(xiàn)。例如,圖形和/或視頻功能可以集成在一個(gè)芯片組之中。替代地,可以使用離散圖形和/或視頻處理器。再舉一種實(shí)現(xiàn),這些圖形和/或視頻功能可以由包括多核處理器的通用處理器來(lái)提供。在另外的實(shí)施例中,可以將這些功能實(shí)現(xiàn)在消費(fèi)電子設(shè)備中。
[0056]無(wú)線裝置518可以包括能夠使用各種適當(dāng)?shù)臒o(wú)線通信技術(shù),來(lái)發(fā)送和接收信號(hào)的一個(gè)或多個(gè)無(wú)線裝置。這些技術(shù)可以涉及一個(gè)或多個(gè)無(wú)線網(wǎng)絡(luò)之間的通信。示例性無(wú)線網(wǎng)絡(luò)包括(但不限于)無(wú)線局域網(wǎng)(WLAN)、無(wú)線個(gè)域網(wǎng)(WPAN)、無(wú)線城域網(wǎng)(WMAN)、蜂窩網(wǎng)絡(luò)和衛(wèi)星網(wǎng)絡(luò)。在這些網(wǎng)絡(luò)之間的通信中,無(wú)線裝置518可以根據(jù)任何版本的一個(gè)或多個(gè)可適用標(biāo)準(zhǔn)進(jìn)行操作。
[0057]在各種實(shí)現(xiàn)中,顯示器520可以包括任何電視類型監(jiān)視器或顯示器。例如,顯示器520可以包括計(jì)算機(jī)顯示屏、觸摸屏顯示器、視頻監(jiān)視器、類似電視設(shè)備和/或電視。顯示器520可以是數(shù)字和/或模擬的。在各種實(shí)現(xiàn)中,顯示器520可以是全息顯示器。此外,顯示器520可以是能接收視覺(jué)投影的透明接口。這種投影可以傳送各種形式的信息、圖像和/或?qū)ο蟆@?,這種投影可以是移動(dòng)增強(qiáng)現(xiàn)實(shí)(MAR)應(yīng)用的視覺(jué)覆蓋。在一個(gè)或多個(gè)軟件應(yīng)用516的控制之下,平臺(tái)502可以在顯示器520上顯示用戶界面522。
[0058]在各種實(shí)現(xiàn)中,內(nèi)容服務(wù)設(shè)備530可以由任何國(guó)家、國(guó)際和/或獨(dú)立服務(wù)持有,因此可通過(guò)互聯(lián)網(wǎng)來(lái)訪問(wèn)平臺(tái)502,例如。內(nèi)容服務(wù)設(shè)備530可以耦接到平臺(tái)502和/或顯示器520。平臺(tái)502和/或內(nèi)容服務(wù)設(shè)備530可以耦接到網(wǎng)絡(luò)560,以便傳輸(例如,發(fā)送和/或接收)去往和來(lái)自網(wǎng)絡(luò)560的媒體信息。此外,內(nèi)容傳送設(shè)備540還可以耦接到平臺(tái)502和/或顯示器520。
[0059]在各種實(shí)現(xiàn)中,內(nèi)容服務(wù)設(shè)備530可以包括有線電視盒、個(gè)人計(jì)算機(jī)、網(wǎng)絡(luò)、電話、具備互聯(lián)網(wǎng)能力的設(shè)備或者能夠傳送數(shù)字信息和/或內(nèi)容的器具、以及能夠通過(guò)網(wǎng)絡(luò)560或者直接在內(nèi)容提供商和平臺(tái)502和/或顯示器520之間單向或者雙向傳輸內(nèi)容的任何其它類似的設(shè)備。應(yīng)當(dāng)理解的是,可以通過(guò)網(wǎng)絡(luò)560,單向和/或雙向地傳輸去往和來(lái)自系統(tǒng)500中的組件和內(nèi)容提供商里的任何一個(gè)的內(nèi)容。內(nèi)容的示例可以包括任何媒體信息,例如其包括視頻、首樂(lè)、醫(yī)療和游戲/[目息等等。
[0060]內(nèi)容服務(wù)設(shè)備530可以接收諸如有線電視節(jié)目(其包括媒體信息、數(shù)字信息和/或其它內(nèi)容)之類的內(nèi)容。內(nèi)容提供商的示例可以包括:任何有線或衛(wèi)星電視或者無(wú)線或互聯(lián)網(wǎng)內(nèi)容提供商。所提供的示例并不意味著以任何方式來(lái)限制根據(jù)本發(fā)明的實(shí)現(xiàn)。
[0061]在各種實(shí)現(xiàn)中,平臺(tái)502可以從具有一個(gè)或多個(gè)導(dǎo)航特征的導(dǎo)航控制器550接收控制信號(hào)。例如,控制器550的這些導(dǎo)航特征可以用于與用戶界面522進(jìn)行交互。在一些實(shí)施例中,導(dǎo)航控制器550可以是指向設(shè)備,后者可以是允許用戶向計(jì)算機(jī)輸入空間(例如,連續(xù)和多個(gè)維度的)數(shù)據(jù)的計(jì)算機(jī)硬件組件(具體而言,人類接口設(shè)備)。諸如圖形用戶界面(GUI)之類的很多系統(tǒng)、電視和監(jiān)視器允許用戶使用物理手勢(shì),控制和提供計(jì)算機(jī)或電視的數(shù)據(jù)。
[0062]可以通過(guò)移動(dòng)指針、光標(biāo)、對(duì)焦環(huán)或者在顯示器(例如,顯示器520)上顯示的其它視覺(jué)指示符,在該顯示器上復(fù)制控制器550的導(dǎo)航特征的移動(dòng)。例如,在軟件應(yīng)用516的控制之下,位于導(dǎo)航控制器550上的導(dǎo)航特征可以映射到在用戶界面522上顯示的虛擬導(dǎo)航特征,舉例而言。在一些實(shí)施例中,控制器550可以不是單獨(dú)的組件,而可以集成到平臺(tái)502和/或顯示器520中。但是,本發(fā)明并不限于本申請(qǐng)所示出和描述的這些元素或者上下文。
[0063]在各種實(shí)現(xiàn)中,驅(qū)動(dòng)器(沒(méi)有示出)可以包括:用于在初始啟動(dòng)之后(例如,當(dāng)啟用時(shí)),通過(guò)觸摸一個(gè)按鈕,使用戶能瞬時(shí)地打開(kāi)和關(guān)閉類似電視的平臺(tái)502的技術(shù)。程序邏輯可以使平臺(tái)502能將內(nèi)容流式傳送到媒體適配器或者其它內(nèi)容服務(wù)設(shè)備530或者內(nèi)容傳送設(shè)備540,即使當(dāng)該平臺(tái)關(guān)閉時(shí)。此外,例如,芯片組505可以包括針對(duì)5.1環(huán)繞聲音頻和/或高清晰度7.1環(huán)繞聲音頻的硬件和/或軟件支持。驅(qū)動(dòng)器可以包括用于集成圖形平臺(tái)的圖形驅(qū)動(dòng)器。在一些實(shí)施例中,圖形驅(qū)動(dòng)器可以包括快速外圍組件互連(PCI)圖形卡。
[0064]在各種實(shí)現(xiàn)中,可以將系統(tǒng)500中所示出的組件里的任何一個(gè)或多個(gè)集成在一起。例如,可以將平臺(tái)502和內(nèi)容服務(wù)設(shè)備530集成在一起,或者可以將平臺(tái)502和內(nèi)容傳送設(shè)備540集成在一起,或者可以將平臺(tái)502、內(nèi)容服務(wù)設(shè)備530和內(nèi)容傳送設(shè)備540集成在一起,例如。在各種實(shí)施例中,平臺(tái)502和顯示器520可以是一個(gè)集成單元。例如,可以將顯示器520和內(nèi)容服務(wù)設(shè)備530集成在一起,或者將顯示器520和內(nèi)容傳送設(shè)備540集成在一起。這些示例并不意味著對(duì)本發(fā)明進(jìn)行限制。
[0065]在各種實(shí)施例中,可以將系統(tǒng)500實(shí)現(xiàn)成無(wú)線系統(tǒng)、有線系統(tǒng)或者二者的組合。當(dāng)實(shí)現(xiàn)成無(wú)線系統(tǒng)時(shí),系統(tǒng)500可以包括適合于通過(guò)諸如一付或多付天線、發(fā)射機(jī)、接收機(jī)、收發(fā)機(jī)、放大器、過(guò)濾器、控制邏輯等等之類的無(wú)線共享介質(zhì),進(jìn)行通信的組件和接口。無(wú)線共享介質(zhì)的示例可以包括無(wú)線頻譜的一部分,例如,RF頻譜等等。當(dāng)實(shí)現(xiàn)成有線系統(tǒng)時(shí),系統(tǒng)500可以包括適合于通過(guò)諸如輸入/輸出(I/O)適配器、用于連接I/O適配器與相應(yīng)的有線通信介質(zhì)的物理連接器、網(wǎng)絡(luò)接口卡(NIC)、盤(pán)控制器、視頻控制器、音頻控制器等等之類的有線通信介質(zhì),進(jìn)行通信的組件和接口。有線通信介質(zhì)的示例可以包括金屬線、電纜、金屬導(dǎo)線、印刷電路板(PCB)、背板、交換矩陣、半導(dǎo)體材料、雙絞線、同軸電纜、光纖光纜等
坐寸ο
[0066]平臺(tái)502可以建立用于傳輸信息的一個(gè)或多個(gè)邏輯或物理信道。該信息可以包括媒體信息和控制信息。媒體信息可以指代:表示用于用戶的內(nèi)容的任何數(shù)據(jù)。例如,內(nèi)容的示例可以包括:來(lái)自于語(yǔ)音會(huì)話的數(shù)據(jù)、視頻會(huì)議、流媒體視頻、電子郵件(“email”)消息、語(yǔ)音郵件消息、字母數(shù)字符號(hào)、圖形、圖像、視頻、文本等等。例如,來(lái)自于語(yǔ)音會(huì)話的數(shù)據(jù)可以是語(yǔ)音信息、靜默時(shí)段、背景噪聲、舒適噪聲、音調(diào)等等??刂菩畔⒖梢灾复?表示命令的任何數(shù)據(jù)、用于擴(kuò)增系統(tǒng)的指令或控制詞。例如,可以使用控制信息將媒體信息路由通過(guò)系統(tǒng),或者指示一個(gè)節(jié)點(diǎn)以預(yù)定的方式來(lái)處理該媒體信息。但是,這些實(shí)施例并不限于在圖5中所示出或描述的元素或上下文。
[0067]如上所述,系統(tǒng)500可以用多種物理類型或者形狀因子來(lái)體現(xiàn)。圖6描繪了可以體現(xiàn)系統(tǒng)500的小型形狀因子設(shè)備600的實(shí)現(xiàn)。在一些實(shí)施例中,例如,設(shè)備600可以實(shí)現(xiàn)成具有無(wú)線能力的移動(dòng)計(jì)算設(shè)備。移動(dòng)計(jì)算設(shè)備可以指代具有處理系統(tǒng)和移動(dòng)功率源或電源(例如,一個(gè)或多個(gè)電池)的任何設(shè)備。
[0068]如上所述,移動(dòng)計(jì)算設(shè)備的示例可以包括個(gè)人計(jì)算機(jī)(PO、膝上型計(jì)算機(jī)、超級(jí)本計(jì)算機(jī)、平板計(jì)算機(jī)、觸摸板、便攜式計(jì)算機(jī)、手持計(jì)算機(jī)、掌上計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、蜂窩電話、組合蜂窩電話/PDA、電視、智能設(shè)備(例如,智能電話、智能平板或者智能電視)、移動(dòng)互聯(lián)網(wǎng)設(shè)備(MID)、消息設(shè)備、數(shù)據(jù)通信設(shè)備等等。
[0069]此外,移動(dòng)計(jì)算設(shè)備的示例還可以包括:被布置為由人類進(jìn)行穿戴的計(jì)算機(jī),例如,腕表計(jì)算機(jī)、手指計(jì)算機(jī)、環(huán)計(jì)算機(jī)、眼鏡計(jì)算機(jī)、腰帶計(jì)算機(jī)、臂帶計(jì)算機(jī)、鞋計(jì)算機(jī)、衣服計(jì)算機(jī)和其它可穿戴計(jì)算機(jī)。在各種實(shí)施例中,例如,移動(dòng)計(jì)算設(shè)備可以實(shí)現(xiàn)成能夠執(zhí)行計(jì)算機(jī)應(yīng)用、以及語(yǔ)音通信和/或數(shù)據(jù)通信的智能電話。雖然通過(guò)示例的方式,在將移動(dòng)計(jì)算設(shè)備實(shí)現(xiàn)成智能電話的基礎(chǔ)上,描述了一些實(shí)施例,但應(yīng)當(dāng)理解的是,也可以使用其它無(wú)線移動(dòng)計(jì)算設(shè)備來(lái)實(shí)現(xiàn)其它實(shí)施例。這些實(shí)施例在本上下文中并不受限。
[0070]如圖6中所不,設(shè)備600可以包括殼體602、顯不器604、輸入/輸出(I/O)設(shè)備606和天線608。此外,設(shè)備600還可以包括導(dǎo)航特征612。顯示器604可以包括任何適當(dāng)?shù)娘@示單元,以便顯示適合于移動(dòng)計(jì)算設(shè)備的信息。I/O設(shè)備606可以包括:用于向移動(dòng)計(jì)算設(shè)備輸入信息的任何適當(dāng)?shù)腎/O設(shè)備。用于I/O設(shè)備606的示例可以包括:字母數(shù)字鍵盤(pán)、數(shù)字鍵盤(pán)、觸摸板、輸入鍵、按鍵、開(kāi)關(guān)、蹺板開(kāi)關(guān)、麥克風(fēng)、揚(yáng)聲器、語(yǔ)音識(shí)別設(shè)備和軟件等等。此外,還可以通過(guò)麥克風(fēng)(沒(méi)有示出)的方式,將信息輸入到設(shè)備600中。語(yǔ)音識(shí)別設(shè)備(沒(méi)有示出)可以對(duì)該信息進(jìn)行數(shù)字化。這些實(shí)施例在本上下文中并不受限。
[0071]各種實(shí)施例可以使用硬件元件、軟件元件或者二者的組合來(lái)實(shí)現(xiàn)。硬件元件的示例可以包括處理器、微處理器、電路、電路元件(例如,晶體管、電阻、電容、電感等等)、集成電路、專用集成電路(ASIC)、可編程邏輯器件(PLD)、數(shù)字信號(hào)處理器(DSP)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、邏輯門(mén)、寄存器、半導(dǎo)體器件、芯片、微芯片、芯片組等等。軟件的示例可以包括軟件組件、程序、應(yīng)用、計(jì)算機(jī)程序、應(yīng)用程序、系統(tǒng)程序、機(jī)器程序、操作系統(tǒng)軟件、中間件、固件、軟件模塊、例行程序、子例行程序、函數(shù)、方法、過(guò)程、軟件界面、應(yīng)用程序接口(API)、指令集、計(jì)算代碼、計(jì)算機(jī)代碼、代碼段、計(jì)算機(jī)代碼段、字、值、符號(hào)或者其任意組合。判斷一個(gè)實(shí)施例是使用硬件元件還是軟件元件來(lái)實(shí)現(xiàn),可以根據(jù)任意數(shù)量的因素來(lái)變化,例如,期望的計(jì)算速率、功率電平、熱容忍度、處理循環(huán)預(yù)算、輸入數(shù)據(jù)速率、輸出數(shù)據(jù)速率、存儲(chǔ)器資源、數(shù)據(jù)總線速度和其它設(shè)計(jì)方案或者性能約束。
[0072]至少一個(gè)實(shí)施例的一個(gè)或多個(gè)方面可以通過(guò)在機(jī)器可讀介質(zhì)上存儲(chǔ)的表示性指令來(lái)實(shí)現(xiàn),這些指令表示處理器中的各種邏輯,當(dāng)機(jī)器讀取這些指令時(shí),使得該機(jī)器創(chuàng)造用于執(zhí)行本申請(qǐng)所描述的技術(shù)的邏輯。這些表示(其稱為“IP核”)可以存儲(chǔ)在有形的、機(jī)器可讀介質(zhì)上,并提供給各個(gè)客戶或者制造工廠,以便裝載到實(shí)際制造該邏輯或者處理器的制造機(jī)器中。
[0073]雖然參照各種實(shí)現(xiàn)描述了本申請(qǐng)所闡述的某些特征,但該描述并不旨在以限制性的含義來(lái)解釋。因此,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是,本申請(qǐng)所描述的實(shí)現(xiàn)的各種修改,以及與本發(fā)明公開(kāi)內(nèi)容有關(guān)的其它實(shí)現(xiàn),認(rèn)為落入本發(fā)明的精神和保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: 至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)面部; 至少部分地基于所檢測(cè)到的面部來(lái)確定感興趣區(qū)域和背景區(qū)域;以及 修改所述背景區(qū)域,以具有降低的圖像質(zhì)量。
2.根據(jù)權(quán)利要求1所述的方法,還包括: 實(shí)時(shí)地捕獲所述視頻數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其中,對(duì)所述面部的檢測(cè)包括:檢測(cè)兩個(gè)或更多面部。
4.根據(jù)權(quán)利要求1所述的方法,其中,對(duì)所述面部的檢測(cè)包括:至少部分地基于Viola-Jones類型框架來(lái)檢測(cè)所述面部。
5.根據(jù)權(quán)利要求1所述的方法,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:向所述背景區(qū)域應(yīng)用模糊效果。
6.根據(jù)權(quán)利要求1所述的方法,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:至少部分地基于點(diǎn)擴(kuò)散函數(shù)和噪聲模型,向所述背景區(qū)域應(yīng)用模糊效果。
7.根據(jù)權(quán)利要求1所述的方法,還包括: 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處。
8.根據(jù)權(quán)利要求1所述的方法,還包括: 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果。
9.根據(jù)權(quán)利要求1所述的方法,還包括: 對(duì)包括所述修改后的背景區(qū)域的視頻數(shù)據(jù)進(jìn)行編碼,其中,在修改了所述背景區(qū)域之后發(fā)生所述編碼操作。
10.根據(jù)權(quán)利要求1所述的方法,還包括: 實(shí)時(shí)地捕獲所述視頻數(shù)據(jù); 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果;以及 對(duì)包括所述修改后的背景區(qū)域的視頻數(shù)據(jù)進(jìn)行編碼,其中,在修改所述背景區(qū)域和應(yīng)用所述混合效果之后發(fā)生所述編碼操作。
11.根據(jù)權(quán)利要求1所述的方法,還包括: 實(shí)時(shí)地捕獲所述視頻數(shù)據(jù); 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果;以及 對(duì)包括所述修改后的背景區(qū)域的視頻數(shù)據(jù)進(jìn)行編碼,其中,在修改所述背景區(qū)域和應(yīng)用所述混合效果之后發(fā)生所述編碼操作, 其中,對(duì)所述面部的檢測(cè)包括:檢測(cè)兩個(gè)或更多面部, 其中,對(duì)所述面部的檢測(cè)包括:至少部分地基于Viola-Jones類型框架來(lái)檢測(cè)面部,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:至少部分地基于點(diǎn)擴(kuò)散函數(shù)和噪聲模型,向所述背景區(qū)域應(yīng)用模糊效果。
12.一種包括計(jì)算機(jī)程序產(chǎn)品的制品,所述計(jì)算機(jī)程序產(chǎn)品中存儲(chǔ)有指令,當(dāng)所述指令被執(zhí)行時(shí),產(chǎn)生下面的操作: 至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)面部; 至少部分地基于所檢測(cè)到的面部來(lái)確定感興趣區(qū)域和背景區(qū)域;以及 修改所述背景區(qū)域,以具有降低的圖像質(zhì)量。
13.根據(jù)權(quán)利要求12所述的制品,其中,當(dāng)所述指令被執(zhí)行時(shí)還導(dǎo)致實(shí)時(shí)地捕獲所述視頻數(shù)據(jù)。
14.根據(jù)權(quán)利要求12所述的制品,其中,對(duì)所述面部的檢測(cè)包括:檢測(cè)兩個(gè)或更多面部。
15.根據(jù)權(quán)利要求12所述的制品,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:至少部分地基于點(diǎn)擴(kuò)散函數(shù)和噪聲模型,向所述背景區(qū)域應(yīng)用模糊效果。
16.根據(jù)權(quán)利要求12所述的制品,其中,當(dāng)所述指令被執(zhí)行時(shí)還導(dǎo)致: 向過(guò)渡區(qū)應(yīng)用混合效 果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果。
17.根據(jù)權(quán)利要求12所述的制品,其中,當(dāng)所述指令被執(zhí)行時(shí)還導(dǎo)致: 對(duì)包括所述修改后的背景區(qū)域的視頻數(shù)據(jù)進(jìn)行編碼,其中,在修改了所述背景區(qū)域之后發(fā)生所述編碼操作。
18.一種裝置,包括: 處理器,其配置為: 至少部分地基于視頻數(shù)據(jù)來(lái)檢測(cè)面部; 至少部分地基于所檢測(cè)到的面部來(lái)確定感興趣區(qū)域和背景區(qū)域;以及 修改所述背景區(qū)域,以具有降低的圖像質(zhì)量。
19.根據(jù)權(quán)利要求18所述的裝置,其中,所述處理器還配置為: 實(shí)時(shí)地捕獲所述視頻數(shù)據(jù)。
20.根據(jù)權(quán)利要求18所述的裝置,其中,對(duì)所述面部的檢測(cè)包括:對(duì)兩個(gè)或更多面部的檢測(cè)。
21.根據(jù)權(quán)利要求18所述的裝置,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:向所述背景區(qū)域應(yīng)用模糊效果。
22.根據(jù)權(quán)利要求18所述的裝置,其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:至少部分地基于點(diǎn)擴(kuò)散函數(shù)和噪聲模型,向所述背景區(qū)域應(yīng)用模糊效果。
23.根據(jù)權(quán)利要求18所述的裝置,其中,所述處理器還配置為: 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果。
24.根據(jù)權(quán)利要求18所述的裝置,其中,所述處理器還配置為: 對(duì)包括所述修改后的背景區(qū)域的視頻數(shù)據(jù)進(jìn)行編碼,其中,在修改了所述背景區(qū)域之后發(fā)生所述編碼操作。
25.—種系統(tǒng),包括: 成像設(shè)備,其配置為:捕獲視頻數(shù)據(jù);以及 計(jì)算系統(tǒng),其中,所述計(jì)算系統(tǒng)可通信地耦合到所述成像設(shè)備,并且其中,所述計(jì)算系統(tǒng)配置為: 至少部分地基于所述視頻數(shù)據(jù)來(lái)檢測(cè)面部; 至少部分地基于所檢測(cè)到的面部來(lái)確定感興趣區(qū)域和背景區(qū)域;以及 修改所述背景區(qū)域,以具有降低的圖像質(zhì)量。
26.根據(jù)權(quán)利要求24所述的系統(tǒng),其中,所述計(jì)算系統(tǒng)還配置為: 實(shí)時(shí)地捕獲所述視頻數(shù)據(jù)。
27.根據(jù)權(quán)利要求24所述的系統(tǒng),其中,對(duì)所述面部的檢測(cè)包括:對(duì)兩個(gè)或更多面部的檢測(cè)。
28.根據(jù)權(quán)利要求24所述的系統(tǒng),其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:向所述背景區(qū)域應(yīng)用模糊效果。
29.根據(jù)權(quán)利要求24所述的系統(tǒng),其中,降低與所述背景區(qū)域相關(guān)聯(lián)的圖像質(zhì)量包括:至少部分地基于點(diǎn)擴(kuò)散函數(shù)和噪聲模型,向所述背景區(qū)域應(yīng)用模糊效果。
30.根據(jù)權(quán)利要求24所述的系統(tǒng),其中,所述計(jì)算系統(tǒng)還配置為: 向過(guò)渡區(qū)應(yīng)用混合效果,其中,所述過(guò)渡區(qū)位于所述感興趣區(qū)域和所述背景區(qū)域之間的邊界處,并且其中,所述混合效果包括阿爾法型混合效果、羽化型混合效果、和/或金字塔型混合效果。
【文檔編號(hào)】G06K9/36GK103999096SQ201180075571
【公開(kāi)日】2014年8月20日 申請(qǐng)日期:2011年12月16日 優(yōu)先權(quán)日:2011年12月16日
【發(fā)明者】P·王, Y·張, Q·E·栗, J·李, L·徐 申請(qǐng)人:英特爾公司