視頻通信方法和設(shè)備的制作方法
【專利摘要】本發(fā)明公開了一種視頻通信方法和設(shè)備。所述方法包括:從圖像中提取特征區(qū)域;使用第一編碼方法來對所述特征區(qū)域進行編碼;以及向接收端發(fā)送編碼后的所述特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗。
【專利說明】視頻通信方法和設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信【技術(shù)領(lǐng)域】,更具體地,本發(fā)明涉及一種視頻通信方法和設(shè)備。
【背景技術(shù)】
[0002]隨著計算機技術(shù)及網(wǎng)絡(luò)技術(shù)的發(fā)展,近年來,諸如筆記本計算機、平板電腦(PAD)、移動電話、個人數(shù)字助理(PDA)之類的電子設(shè)備越發(fā)普及,并且越來越多的用戶開始使用在這些電子設(shè)備上裝備的諸如攝像頭之類的圖像捕捉裝置以及相關(guān)應(yīng)用程序來進行視頻聊天、視頻會議等視頻通信應(yīng)用。
[0003]目前,視頻通信應(yīng)用為用戶帶來的直觀體驗是可以讓對方用戶在對端電子設(shè)備上看到本方用戶的視頻并且聽到本方用戶的聲音,其中本方用戶視頻是從本端電子設(shè)備上的攝像頭直接捕捉的視頻數(shù)據(jù)經(jīng)過編碼后、經(jīng)過網(wǎng)絡(luò)而傳輸?shù)綄Χ穗娮釉O(shè)備上的。
[0004]由于在傳統(tǒng)的視頻通信應(yīng)用中、通常是直接通過攝像頭捕捉某個固定分辨率大小(例如,176X144)的視頻數(shù)據(jù)、然后經(jīng)過視頻編碼來實現(xiàn)對整幅圖像的編碼并將編碼后的整幅圖像直接發(fā)送到對端電子設(shè)備的,所以在一幀圖像中往往包含了很多復(fù)雜的背景圖像。
[0005]這樣,在攝像頭由于各種原因而產(chǎn)生晃動的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,編碼之后所產(chǎn)生的視頻數(shù)據(jù)往往具有很大的碼率。而這種具有很大碼率的視頻數(shù)據(jù)在帶寬受限的通信信道中(諸如,在使用電路交換(CS)的通信模式的情況下)傳送時將產(chǎn)
生誤差。
[0006]這時,為了滿足網(wǎng)絡(luò)傳輸對碼率的限制,就不得不在編碼時采用丟幀處理和減少幀率的處理。然而,這樣會導(dǎo)致視頻圖像在對端電子設(shè)備上顯示時產(chǎn)生不連續(xù)性及馬賽克,從而大大降低了視頻通信中的圖像清晰度,最終無法有效地突出在整幅圖像中對方用戶往往更為關(guān)心的某一特征區(qū)域(諸如,本方用戶的臉部)。
[0007]因而,需要一種新型的視頻通信方法和設(shè)備來解決上述問題。
【發(fā)明內(nèi)容】
[0008]為了解決上述技術(shù)問題,根據(jù)本發(fā)明的一個方面,提供了一種視頻通信方法,其特征在于,所述方法包括:從圖像中提取特征區(qū)域;使用第一編碼方法來對所述特征區(qū)域進行編碼;以及向接收端發(fā)送編碼后的所述特征區(qū)域。
[0009]此外,根據(jù)本發(fā)明的另一方面,提供了一種視頻通信設(shè)備,其特征在于,所述設(shè)備包括:提取裝置,用于從圖像中提取特征區(qū)域;第一編碼裝置,用于使用第一編碼方法來對所述特征區(qū)域進行編碼;以及發(fā)送裝置,用于向接收端發(fā)送編碼后的所述特征區(qū)域。
[0010]與現(xiàn)有技術(shù)相比,采用根據(jù)本發(fā)明的視頻通信方法和設(shè)備,在視頻通信過程中,可以在本端電子設(shè)備中,利用特征區(qū)域檢測技術(shù)在每一幀的視頻圖像中提取特征區(qū)域,利用與特征區(qū)域?qū)?yīng)的編碼方法對該特征區(qū)域進行編碼,并且向?qū)Χ穗娮釉O(shè)備傳送僅僅包括特征區(qū)域的編碼后的視頻數(shù)據(jù),使得在解碼操作之后,對方用戶能夠在對端電子設(shè)備中觀看到僅僅關(guān)心的特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗。
[0011]本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
【專利附圖】
【附圖說明】
[0012]附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
[0013]圖1圖示了根據(jù)本發(fā)明的視頻通信方法。
[0014]圖2圖示了根據(jù)本發(fā)明的視頻通信設(shè)備。
[0015]圖3圖示了根據(jù)本發(fā)明第一實施例的視頻通信方法。
[0016]圖4圖示了根據(jù)本發(fā)明第一實施例的視頻通信系統(tǒng)。
[0017]圖5圖示了根據(jù)本發(fā)明第二實施例的視頻通信方法。
[0018]圖6圖示了根據(jù)本發(fā)明第二實施例的視頻通信系統(tǒng)。
【具體實施方式】
[0019]將參照附圖詳細(xì)描述根據(jù)本發(fā)明的各個實施例。這里,需要注意的是,在附圖中,將相同的附圖標(biāo)記賦予基本上具有相同或類似結(jié)構(gòu)和功能的組成部分,并且將省略關(guān)于它們的重復(fù)描述。
[0020]在下文中,將參考圖1和圖2來描述根據(jù)本發(fā)明的視頻通信方法和設(shè)備。
[0021]圖1圖示了根據(jù)本發(fā)明的視頻通信方法,而圖2圖示了根據(jù)本發(fā)明的視頻通信設(shè)備。
[0022]圖1所圖示的視頻通信方法通過圖2所圖示的視頻通信設(shè)備來實現(xiàn)。具體地,所述視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120和發(fā)送裝置130。
[0023]如圖1所圖示的,所述電子設(shè)備定制方法包括:
[0024]在步驟SllO中,提取裝置110從圖像中提取特征區(qū)域;
[0025]在步驟S120中,第一編碼裝置120使用第一編碼方法來對所述特征區(qū)域進行編碼;以及
[0026]在步驟S130中,發(fā)送裝置130向接收端發(fā)送編碼后的所述特征區(qū)域。
[0027]由此可見,采用根據(jù)本發(fā)明的視頻通信方法和設(shè)備,在視頻通信過程中,可以在本端電子設(shè)備中,利用特征區(qū)域檢測技術(shù)在每一幀的視頻圖像中提取特征區(qū)域,利用與特征區(qū)域?qū)?yīng)的編碼方法對該特征區(qū)域進行編碼,并且向?qū)Χ穗娮釉O(shè)備傳送僅僅包括特征區(qū)域的編碼后的視頻數(shù)據(jù),使得在解碼操作之后,對方用戶能夠在對端電子設(shè)備中觀看到僅僅關(guān)心的特征區(qū)域。因此,在本發(fā)明中,可以大大提高特征區(qū)域的清晰度,即使在攝像頭晃動較大的情況下,或者在背景環(huán)境比較復(fù)雜的情況下,由于只傳輸特征區(qū)域,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會大大的減少,這樣可以大大提高視頻通信中用戶更加關(guān)心的特征區(qū)域的清晰度,從而提高了用戶體驗。
[0028]在下文中,將參考圖3和圖4來描述根據(jù)本發(fā)明第一實施例的視頻通信方法和視頻通信系統(tǒng)。
[0029]圖3圖示了根據(jù)本發(fā)明第一實施例的視頻通信方法,而圖4圖示了根據(jù)本發(fā)明第一實施例的視頻通信系統(tǒng)。
[0030]圖3所圖示的根據(jù)本發(fā)明第一實施例的視頻通信方法可以應(yīng)用于圖4所圖示的視頻通信系統(tǒng)300。如圖4所圖示的,該視頻通信系統(tǒng)300包括:本端視頻通信設(shè)備100和對端視頻通信設(shè)備200。該本端視頻通信設(shè)備100與該對端視頻通信設(shè)備200通過各種方式(諸如,有線網(wǎng)絡(luò)和無線網(wǎng)絡(luò))而連接在一起,并且按照約定的數(shù)據(jù)格式來傳輸視頻通信數(shù)據(jù)。
[0031]在此,將移動電話作為本端視頻通信設(shè)備100和對端視頻通信設(shè)備200的示例來進行說明。然而,顯然本發(fā)明不限于此。還可以將本發(fā)明應(yīng)用于筆記本計算機、平板電腦、個人數(shù)字助理等相同類型或者不同類型電子設(shè)備之間的視頻通信過程中。
[0032]該本端視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120、發(fā)送裝置130、和捕捉裝置140。
[0033]該對端視頻通信設(shè)備200包括:接收裝置210、第一解碼裝置220和顯示裝置230。
[0034]如圖3所圖示的,根據(jù)本發(fā)明第一實施例的視頻通信方法包括:
[0035]在步驟S210中,捕捉視頻序列。
[0036]具體地,當(dāng)本方用戶想要與處于其遠程的對方用戶進行視頻通話時,本方用戶可以利用處于其本地的本端視頻通信設(shè)備100 (例如,本方用戶的移動電話),通過諸如第三代移動通信網(wǎng)絡(luò)之類的有線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)來向?qū)Ψ接脩舭l(fā)起視頻通話請求。
[0037]此時,處于對方用戶本地的對端視頻通信設(shè)備200 (類似地,例如移動電話)向?qū)Ψ接脩籼崾颈痉接脩粽谙蚱浒l(fā)起視頻通話請求。在對方用戶選擇接受通話請求之后,在兩者之間建立起視頻通話連接。
[0038]下面,以在本方用戶端的本端視頻通信設(shè)備100向?qū)Ψ接脩舳说膶Ψ揭曨l通信設(shè)備200傳送視頻圖像為例,繼續(xù)說明根據(jù)本發(fā)明第一實施例的視頻通信方法。然而,顯然,對方用戶端的對方視頻通信設(shè)備200同樣可以向本方用戶端的本端視頻通信設(shè)備100傳送視頻圖像,此時在兩者中執(zhí)行的處理將互換。
[0039]例如,在建立視頻通話連接之后,在本端視頻通信設(shè)備100中,捕捉裝置140 (例如,移動電話上的攝像頭)捕捉本方用戶的視頻序列,該視頻序列由一系列的圖像幀組成。
[0040]此時,捕捉裝置140將自身分辨率設(shè)置為第一分辨率。優(yōu)選地,該第一分辨率是該捕捉裝置140能夠支持的最大分辨率。這樣,捕捉裝置140采用最大的分辨率來捕捉一幀視頻圖像,以便獲得一副盡可能高清晰度的視頻圖像,然后它將所捕捉到的視頻圖像發(fā)送到提取裝置110,以進行后續(xù)處理。
[0041]在步驟S220中,從圖像中提取特征區(qū)域。
[0042]具體地,在接收到捕捉裝置140所捕捉的視頻圖像之后,提取裝置110對于該視頻圖像執(zhí)行特征區(qū)域檢測算法,以得到特征區(qū)域在原始視頻圖像中的位置。
[0043]這里認(rèn)為,一般而言,進行視頻通信的雙方比較關(guān)注的是用戶的臉部信息,因此,優(yōu)選地,可以將該特征區(qū)域選取為用戶的人臉區(qū)域,并且該特征區(qū)域檢測算法可以是人臉檢測和/或人臉跟蹤算法。然而,顯然本發(fā)明不限于此。還可以將諸如本方用戶肢體或處于本方用戶本地的顯示器之類的其他區(qū)域選取為對方用戶關(guān)心的特征區(qū)域。
[0044]人臉檢測算法用于在輸入圖像中檢測是否存在人臉,并且確定所有人臉的位置、大小、位姿。人臉檢測是人臉信息處理中的一項關(guān)鍵技術(shù)。根據(jù)利用特征的色彩屬性,可以將人臉檢測算法分為基于膚色特征的方法和基于灰度特征的方法兩類。
[0045]人臉跟蹤算法通常用于在人臉檢測的基礎(chǔ)上對于視頻序列中人臉運動位置的跟蹤。人臉跟蹤算法包括基于運動的方法及基于模型的方法。
[0046]需要說明的是,提取裝置110可以采用現(xiàn)有的或者將來開發(fā)出的任何一種人臉檢測和/或人臉跟蹤算法,來在捕捉裝置140所捕捉到的原始視頻圖像中檢測人臉區(qū)域,確定該人臉區(qū)域的位置,并且從每一幀圖像中提取該人臉區(qū)域。
[0047]此時,優(yōu)選地,在從每一幀圖像中提取人臉區(qū)域的同時,該提取裝置110還進一步監(jiān)視本端視頻通信設(shè)備100中的中央處理器(CPU)在執(zhí)行人臉檢測和/或人臉跟蹤算法時所占用的資源,并且判斷該檢測操作所占用的系統(tǒng)資源是否大于或等于一個預(yù)定的資源閾值,例如,50%。
[0048]例如,當(dāng)該提取裝置110在對捕捉裝置140利用最大分辨率捕捉的視頻序列的第一幀圖像進行檢測時,如果該檢測操作所占用的系統(tǒng)資源超出CPU整體資源的50%,則該提取裝置110認(rèn)為此時人臉檢測和/或人臉跟蹤算法占用CPU的資源過大,可能會影響在本端視頻通信設(shè)備100中運行的其他應(yīng)用。因此,該提取裝置110向捕捉裝置140發(fā)送分辨率改變信號。所述捕捉裝置根據(jù)所述分辨率改變信號,來將作為最大分辨率的第一分辨率改變?yōu)樯孕∫恍┑牡诙直媛?,以便在后續(xù)操作中,采用第二分辨率來捕捉所述視頻序列的第二幀圖像。按照這種方式,該提取裝置Iio可以逐幀地逐漸調(diào)低捕捉裝置140捕捉視頻序列時的分辨率,直到該檢測操作所占用的系統(tǒng)資源小于預(yù)定的資源閾值為止。
[0049]同理,當(dāng)用戶由于退出了在本端視頻通信設(shè)備100中運行的其他應(yīng)用而導(dǎo)致該檢測操作所占用較小的系統(tǒng)資源時,該提取裝置110也可以逐漸調(diào)高捕捉裝置140捕捉視頻序列時的分辨率,使得獲得更加清晰的用戶臉部圖像,直到該分辨率等于最大分辨率為止。
[0050]通過上述處理,與傳統(tǒng)的視頻電話實現(xiàn)一般將攝像頭的分辨率直接設(shè)置為要顯示的尺寸相比,本發(fā)明的第一實施例可以根據(jù)系統(tǒng)資源來調(diào)整攝像頭的分辨率,從而得到一幅盡可能清晰的原始人臉圖像。
[0051]另外,優(yōu)選地,在從原始視頻序列中檢測到人臉區(qū)域之后,該提取裝置110還可以將所檢測到的人臉區(qū)域的尺寸與一個預(yù)設(shè)的尺寸閾值進行比較,其中該尺寸閾值取決于視頻信道的帶寬。如果所檢測到的人臉區(qū)域的尺寸小于所述尺寸閾值,則對所檢測到的人臉區(qū)域進行放大處理,使得所檢測到的人臉區(qū)域的尺寸等于所述尺寸閾值。此場景通常發(fā)生在本方用戶的人像距離攝像頭較遠的情況下。同理,如果所檢測到的人臉區(qū)域的尺寸大于所述尺寸閾值,則對所檢測到的人臉區(qū)域進行縮小處理,使得所檢測到的人臉區(qū)域的尺寸等于所述尺寸閾值。此場景發(fā)生在人像距離攝像頭較近的情況。
[0052]通過上述處理,與不進行人臉檢測操作的傳統(tǒng)視頻電話實現(xiàn)相比,本發(fā)明的第一實施例可以克服可能出現(xiàn)的人臉圖像在對端視頻通信設(shè)備200中顯示過大或者過小的情況。
[0053]由于在步驟S210中捕捉裝置140將攝像頭設(shè)置為最大分辨率,所以在步驟S220中,該提取裝置110提取裝置110可以根據(jù)顯示視頻編碼的尺寸對檢測得到的人臉圖像進行適當(dāng)?shù)目s放,從而使得當(dāng)在后續(xù)對縮放后的人臉視頻流進行編碼的過程中、確保編碼碼率滿足視頻電話傳輸碼率要求的同時,保證在攝像頭清晰成像的范圍內(nèi)得到一張清晰度最聞的人臉圖像。
[0054]最終,該提取裝置110將所提取到的人臉區(qū)域發(fā)送到第一編碼裝置120,以進行后續(xù)處理。
[0055]在步驟S230中,使用第一編碼方法來對特征區(qū)域進行編碼。
[0056]具體地,在接收到提取裝置110所提取到的人臉區(qū)域之后,第一編碼裝置120使用第一編碼方法來對該人臉區(qū)域進行編碼,以生成要傳送的視頻流。
[0057]例如,該第一編碼裝置120可以使用各種視頻編碼方法(諸如,運動圖像專家組(MPEG) 4、H.263、H.264)來對所提取的人臉區(qū)域進行編碼。由于要編碼的視頻圖像僅僅包含人臉區(qū)域、而人臉區(qū)域在整個視頻通話過程中的變化很小,所以在視頻流的幀與幀之間的差別會很小,這樣即使在晃動很大的情況下也可以保證很小的編碼碼率。
[0058]然后,該第一編碼裝置120將編碼后的視頻圖像傳送到發(fā)送裝置130,以用于后續(xù)處理。
[0059]在步驟S240中,向接收端發(fā)送編碼后的特征區(qū)域。
[0060]具體地,在接收到編碼后的人臉區(qū)域之后,發(fā)送裝置130通過例如第三代移動通信網(wǎng)絡(luò)向?qū)Χ艘曨l通信設(shè)備200發(fā)送僅僅包括人臉區(qū)域的視頻流。
[0061]在步驟S250中,接收并解碼該編碼后的特征區(qū)域。
[0062]具體地,在對端視頻通信設(shè)備200中,接收裝置210經(jīng)由例如移動通信網(wǎng)絡(luò)而接收僅僅包括人臉區(qū)域的視頻流,并且將它傳送到第一解碼裝置220。
[0063]該第一解碼裝置220可以使用與第一編碼方法對應(yīng)的第一解碼方法來對該視頻流進行解碼,以便從中恢復(fù)包括人臉區(qū)域的圖像。
[0064]在步驟S260中,顯示特征區(qū)域。
[0065]具體地,在從該第一解碼裝置220接收到所編碼后的人臉區(qū)域之后,顯示裝置230在對端視頻通信設(shè)備200中裝備的顯示裝置(諸如,顯示屏)上顯示固定大小的人臉圖像,并且該人臉圖像遠遠大于在傳統(tǒng)的視頻通信中實現(xiàn)的一般顯示大小176X144。實驗證明,根據(jù)本發(fā)明第一實施例的視頻通信實現(xiàn)可以達到176X144X2、甚至更大的數(shù)量級的顯示大小。
[0066]另外,由于在本端視頻通信設(shè)備100中在人臉圖像的視頻編碼中產(chǎn)生的碼率很小,所以在對端視頻通信設(shè)備200中可以適當(dāng)?shù)財U大視頻圖像的顯示。這個操作可以根據(jù)實際產(chǎn)生的碼率來進行調(diào)節(jié)。因此,在視頻通信系統(tǒng)300中實現(xiàn)了一種高清人像模式的視頻通信。
[0067]由此可見,采用根據(jù)本發(fā)明第一實施例的視頻通信方法和系統(tǒng),可以利用人臉檢測技術(shù)在每一幀的視頻圖像中提取人臉圖像,然后僅對人臉圖像進行適當(dāng)?shù)目s放、編碼,這樣可以大大的提高人臉圖像的清晰度。具體來說,即使在圖像晃動較大的情況下,由于只傳輸人臉圖像,圖像的每幀之間的差別較小,所以編碼后產(chǎn)生的碼率也會大大的減少,從而可以顯著地提高了視頻電話中人臉圖像的清晰度、尺寸以及連續(xù)性,實現(xiàn)了高清人像模式的視頻通信。[0068]因此,在本發(fā)明的第一實施例中,可以將這種視頻通信的高清人像模式作為一種附加選項提供在電子設(shè)備的用戶界面上,使得用戶不但可以通過傳統(tǒng)的普通模式來進行視頻通信,以便在用戶之間傳輸包括人臉和背景等各種圖像信息的視頻數(shù)據(jù),從而了解到與用戶相關(guān)的全面信息;而且還可以通過高清人像模式來進行視頻通信,以便對方用戶可以更清楚地觀察到本方用戶的面部表情等,從而實現(xiàn)更好的交談體驗。
[0069]在下文中,將參考圖5和圖6來描述根據(jù)本發(fā)明第二實施例的視頻通信方法和視頻通信系統(tǒng)。
[0070]圖5圖示了根據(jù)本發(fā)明第二實施例的視頻通信方法,而圖6圖示了根據(jù)本發(fā)明第二實施例的視頻通信系統(tǒng)。
[0071]圖5所圖示的根據(jù)本發(fā)明第二實施例的視頻通信方法可以應(yīng)用于圖6所圖示的視頻通信系統(tǒng)300。如圖6所圖示的,該視頻通信系統(tǒng)300包括:本端視頻通信設(shè)備100和對端視頻通信設(shè)備200。
[0072]該本端視頻通信設(shè)備100包括:提取裝置110、第一編碼裝置120、第二編碼裝置150、發(fā)送裝置130、和捕捉裝置140。
[0073]該對端視頻通信設(shè)備200包括:接收裝置210、第一解碼裝置220、第二解碼裝置240、和顯示裝置230。
[0074]如圖5所圖示的,根據(jù)本發(fā)明第二實施例的視頻通信方法包括:
[0075]在步驟S310中,捕捉視頻序列。
[0076]在步驟S320中,從圖像中提取特征區(qū)域。
[0077]在步驟S330中,使用第一編碼方法來對特征區(qū)域進行編碼,并且使用第二編碼方法來對非特征區(qū)域進行編碼。
[0078]在步驟S340中,向接收端發(fā)送編碼后的特征區(qū)域。
[0079]在步驟S350中,接收并解碼該編碼后的特征區(qū)域。
[0080]在步驟S360中,顯示特征區(qū)域。
[0081]步驟S310-S360與第一實施例中的步驟S210-S260大致相同,其區(qū)別之處在于:
[0082]在步驟S320中,除了提取特征區(qū)域之外,提取裝置110進一步從圖像中提取非特征區(qū)域,其中該非特征區(qū)域是除了特征區(qū)域之外的區(qū)域,例如,除了人臉區(qū)域之外的背景區(qū)域。
[0083]在步驟S330中,與在步驟S230中一樣,第一編碼裝置120使用第一編碼方法來對該人臉區(qū)域進行編碼。然而,與此同時地或者并行地,第二編碼裝置150使用編碼碼率小于第一編碼方法的第二編碼方法來對非特征區(qū)域進行編碼,以生成既包括人臉區(qū)域、又包括背景區(qū)域的要傳送的視頻流。
[0084]在步驟S350中,與在步驟S250中一樣,第一解碼裝置220使用第一解碼方法來對該人臉區(qū)域進行解碼。然而,與此同時地或者并行地,第二解碼裝置240使用與第二編碼方法對應(yīng)的第二解碼方法來對非特征區(qū)域進行解碼,使得在步驟S360中,在對端視頻通信設(shè)備200中裝備的顯示裝置上顯示包括不同清晰度區(qū)域的圖像,即清晰度高的人臉區(qū)域和清晰度低的背景區(qū)域。
[0085]由此可見,采用根據(jù)本發(fā)明第二實施例的視頻通信方法和系統(tǒng),在的提高人臉圖像的清晰度的同時,利用低編碼碼率的編碼方法來編碼和傳輸非人臉區(qū)域的背景圖像,從而可以在帶寬相對充足的情況下,或者在對方用戶希望了解本方用戶所處的環(huán)境的情況下,在視頻電話中提供具有高清晰度、大尺寸以及良好連續(xù)性的人臉圖像的同時,提供具有相對低高清晰度、小尺寸以及一般連續(xù)性的背景圖像,從而實現(xiàn)了更為優(yōu)秀的用戶體驗。
[0086]需要說明的是,盡管在此將使用第一編碼/解碼方法和第二編碼/解碼方法的裝置示出為兩個編碼/解碼裝置,但是也可以通過同一個編碼/解碼裝置來執(zhí)行這兩種不同的編碼/解碼方法。
[0087]通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助于軟件加必需的硬件平臺的方式來實現(xiàn),當(dāng)然也可以全部通過軟件、或硬件來實施?;谶@樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁盤、光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。
[0088]在上面詳細(xì)描述了本發(fā)明的各個實施例。然而,本領(lǐng)域技術(shù)人員應(yīng)該理解,在不脫離本發(fā)明的原理和精神的情況下,可對這些實施例進行各種修改,組合或子組合,并且這樣的修改應(yīng)落入本發(fā)明的范圍內(nèi)。
【權(quán)利要求】
1.一種視頻通信方法,其特征在于,所述方法包括: 從圖像中提取特征區(qū)域; 使用第一編碼方法來對所述特征區(qū)域進行編碼;以及 向接收端發(fā)送編碼后的所述特征區(qū)域。
2.根據(jù)權(quán)利要求1的方法,其特征在于,所述從圖像中提取特征區(qū)域的步驟包括: 捕捉視頻序列; 在所述視頻序列的每一幀圖像中檢測所述特征區(qū)域;以及 從所述每一幀圖像中提取所述特征區(qū)域。
3.根據(jù)權(quán)利要求2的方法,其特征在于,所述捕捉視頻序列的步驟包括: 采用第一分辨率來捕捉所述視頻序列的第一幀圖像。
4.根據(jù)權(quán)利要求3的方法,其特征在于,所述在所述視頻序列的每一幀圖像中檢測所述特征區(qū)域的步驟包括: 在所述第一幀圖像中檢測所述特征區(qū)域; 判斷該檢測操作所占用的系統(tǒng)資源是否大于或等于資源閾值;以及如果是,則將所述第一分辨率改變?yōu)榈诙直媛剩员阍诤罄m(xù)操作中,采用第二分辨率來捕捉所述視頻序列的第二 幀圖像, 其中,所述第二分辨率小于所述第一分辨率。
5.根據(jù)權(quán)利要求2的方法,其特征在于,所述從所述每一幀圖像中提取所述特征區(qū)域的步驟包括: 將所檢測到的特征區(qū)域的尺寸與尺寸閾值進行比較; 如果所檢測到的特征區(qū)域的尺寸小于所述尺寸閾值,則對所檢測到的特征區(qū)域進行放大處理,使得所檢測到的特征區(qū)域的尺寸等于所述尺寸閾值;以及 如果所檢測到的特征區(qū)域的尺寸大于所述尺寸閾值,則對所檢測到的特征區(qū)域進行縮小處理,使得所檢測到的特征區(qū)域的尺寸等于所述尺寸閾值。
6.根據(jù)權(quán)利要求5的方法,其特征在于,所述尺寸閾值取決于視頻通信的帶寬。
7.根據(jù)權(quán)利要求1的方法,其特征在于,所述方法還包括: 從圖像中提取除了特征區(qū)域之外的非特征區(qū)域; 使用第二編碼方法來對所述非特征區(qū)域進行編碼;以及 與所述特征區(qū)域一起,向接收端發(fā)送編碼后的所述非特征區(qū)域, 其中,所述第二編碼方法的編碼碼率小于所述第一編碼方法的編碼碼率。
8.根據(jù)權(quán)利要求1的方法,其特征在于,所述特征區(qū)域是包括人臉的區(qū)域。
9.一種視頻通信設(shè)備,其特征在于,所述設(shè)備包括: 提取裝置,用于從圖像中提取特征區(qū)域; 第一編碼裝置,用于使用第一編碼方法來對所述特征區(qū)域進行編碼;以及 發(fā)送裝置,用于向接收端發(fā)送編碼后的所述特征區(qū)域。
10.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述設(shè)備還包括: 捕捉裝置,用于捕捉視頻序列,并且 所述提取裝置在所述視頻序列的每一幀圖像中檢測所述特征區(qū)域,并且從所述每一幀圖像中提取所述特征區(qū)域。
11.根據(jù)權(quán)利要求10的設(shè)備,其特征在于,所述捕捉裝置采用第一分辨率來捕捉所述視頻序列的第一幀圖像。
12.根據(jù)權(quán)利要求11的設(shè)備,其特征在于,所述提取裝置在所述第一幀圖像中檢測所述特征區(qū)域,判斷該檢測操作所占用的系統(tǒng)資源是否大于或等于資源閾值,如果是,則向所述捕捉裝置發(fā)送分辨率改變信號,并且 所述捕捉裝置根據(jù)所述分辨率改變信號,來將所述第一分辨率改變?yōu)榈诙直媛?,以便在后續(xù)操作中,采用第二分辨率來捕捉所述視頻序列的第二幀圖像, 其中,所述第二分辨率小于所述第一分辨率。
13.根據(jù)權(quán)利要求10的設(shè)備,其特征在于,所述提取裝置將所檢測到的特征區(qū)域的尺寸與尺寸閾值進行比較,如果所檢測到的特征區(qū)域的尺寸小于所述尺寸閾值,則對所檢測到的特征區(qū)域進行放大處理,使得所檢測到的特征區(qū)域的尺寸等于所述尺寸閾值,并且如果所檢測到的特征區(qū)域的尺寸大于所述尺寸閾值,則對所檢測到的特征區(qū)域進行縮小處理,使得所檢測到的特征區(qū)域的尺寸等于所述尺寸閾值。
14.根據(jù)權(quán)利要求13的設(shè)備,其特征在于,所述尺寸閾值取決于視頻通信的帶寬。
15.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述設(shè)備還包括第二編碼裝置, 所述提取裝置還用于從圖像中提取除了特征區(qū)域之外的非特征區(qū)域, 所述第二編碼裝置用于使用第二編碼方法來對所述非特征區(qū)域進行編碼,并且 所述發(fā)送裝置還用于與所述特征區(qū)域一起,向接收端發(fā)送編碼后的所述非特征區(qū)域, 其中,所述第二編碼方法的編碼碼率小于所述第一編碼方法的編碼碼率。`
16.根據(jù)權(quán)利要求9的設(shè)備,其特征在于,所述特征區(qū)域是包括人臉的區(qū)域。
【文檔編號】H04N19/167GK103517072SQ201210206429
【公開日】2014年1月15日 申請日期:2012年6月18日 優(yōu)先權(quán)日:2012年6月18日
【發(fā)明者】陶宇權(quán) 申請人:聯(lián)想(北京)有限公司