專利名稱::視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及視頻會(huì)議
技術(shù)領(lǐng)域:
,尤其涉及一種視頻會(huì)議過(guò)程中視頻對(duì)象切換的方法、裝置及系統(tǒng)。
背景技術(shù):
:視頻會(huì)議系統(tǒng)使得位于不同地方的人們能夠面對(duì)面地進(jìn)行遠(yuǎn)程交流和協(xié)作。一個(gè)會(huì)場(chǎng)的與會(huì)者能夠通過(guò)顯示屏幕看到其它會(huì)場(chǎng)的與會(huì)者,并通過(guò)音頻設(shè)備聽到其它會(huì)場(chǎng)中當(dāng)前發(fā)言人的聲音,使得與會(huì)者感覺自己和其它會(huì)場(chǎng)中的與會(huì)者好像是處于同一個(gè)物理會(huì)場(chǎng)中參加會(huì)議一樣。現(xiàn)今,很多視頻會(huì)議系統(tǒng)為了提高不同會(huì)場(chǎng)間與會(huì)者交流的效率和效果,通常會(huì)以真人大小顯示與會(huì)者,例如,在會(huì)場(chǎng)A中有A1、A2、A3三位與會(huì)者,而在其它會(huì)場(chǎng)的顯示屏幕上只能夠顯示其中兩位與會(huì)者,比如A1和A2;那么,在A3需要發(fā)言的時(shí)候,就需要讓其它會(huì)場(chǎng)的與會(huì)者通過(guò)顯示屏幕看到A3的圖像,這時(shí)候就需要進(jìn)行視頻的切換。目前,在視頻會(huì)議過(guò)程中進(jìn)行視頻切換的方式有以下幾種1)在會(huì)場(chǎng)中每一個(gè)與會(huì)者的前面安裝一個(gè)切換按鈕,當(dāng)某個(gè)與會(huì)者需要發(fā)言且需要其它會(huì)場(chǎng)人員看到該發(fā)言人時(shí),該發(fā)言人可以按下面前的切換按鈕,通知系統(tǒng)進(jìn)行視頻切換,使得其它會(huì)場(chǎng)人員可以通過(guò)顯示屏幕看到該發(fā)言人的視頻;2)在每個(gè)會(huì)場(chǎng)有一個(gè)會(huì)議控制人員來(lái)進(jìn)行手動(dòng)視頻切換,當(dāng)需要切換到含有當(dāng)前發(fā)言人的視頻時(shí),由會(huì)議控制人員通過(guò)自己的視覺和聽覺等感官,判斷出是哪位與會(huì)者正在發(fā)言,然后手動(dòng)進(jìn)行視頻切換,使其它會(huì)場(chǎng)人員可以通過(guò)顯示屏幕看到當(dāng)前發(fā)言人的視頻。在實(shí)現(xiàn)上述視頻會(huì)議中視頻切換的過(guò)程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題不管是發(fā)言人自主進(jìn)行視頻切換,還是由會(huì)議控制人員來(lái)進(jìn)行視頻切換,都是一個(gè)手動(dòng)的過(guò)程,很容易會(huì)打斷會(huì)議的節(jié)奏或者出現(xiàn)視頻切換錯(cuò)誤等情況,從而影響會(huì)議效率。
發(fā)明內(nèi)容本發(fā)明的實(shí)施例提供一種視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng),以實(shí)現(xiàn)視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換。為達(dá)到上述目的,本發(fā)明的實(shí)施例釆用如下技術(shù)方案一種視頻通信中視頻對(duì)象切換的方法,包括獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。一種會(huì)議終端,包括終端設(shè)備以及與所述終端設(shè)備分別連接的視頻呈現(xiàn)設(shè)備、音頻輸出設(shè)備、攝像設(shè)備和麥克風(fēng)陣列,其中,所述終端設(shè)備包括獲取單元,用于獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;確定單元,用于根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);發(fā)送單元,用于將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。一種會(huì)議管理設(shè)備,包括獲取單元,用于獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;確定單元,用于根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);發(fā)送單元,用于將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。一種視頻會(huì)議系統(tǒng),包括一個(gè)第一會(huì)議終端和至少一個(gè)第二會(huì)議終端;其中,所述第一會(huì)議終端,用于獲取第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端,用于接收所述第一會(huì)議終端發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。一種視頻會(huì)議系統(tǒng),包括一個(gè)第一會(huì)議終端、一個(gè)會(huì)議管理設(shè)備以及至少一個(gè)第二會(huì)議終端;其中,所述第一會(huì)議終端,用于采集第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像以及聲音信息,并將所述會(huì)場(chǎng)視頻圖像以及聲音信息發(fā)送到視頻會(huì)議管理設(shè)備;所述會(huì)議管理設(shè)備,接收所述第一會(huì)議終端發(fā)送的所述會(huì)場(chǎng)視頻圖像以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端,用于接收所述視頻會(huì)議管理設(shè)備發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng),能夠在視頻會(huì)議過(guò)程中,根據(jù)第一會(huì)場(chǎng)的會(huì)場(chǎng)圖像信號(hào)和聲音信息自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分以顯示給其它會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng),實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。圖1為本發(fā)明實(shí)施例一中的方法流程圖2為本發(fā)明實(shí)施例二中的方法流程圖3為攝像機(jī)成像原理示意圖4為會(huì)場(chǎng)中所采用的第一種坐標(biāo)系的示意圖5為會(huì)場(chǎng)中所采用的第二種坐標(biāo)系的示意圖6為本發(fā)明實(shí)施例二中第一會(huì)場(chǎng)中發(fā)言人位置的第一示意圖7為本發(fā)明實(shí)施例二中第一會(huì)場(chǎng)中發(fā)言人位置的第二示意圖8為本發(fā)明實(shí)施例二中第一會(huì)場(chǎng)中發(fā)言人位置的第三示意圖9為本發(fā)明實(shí)施例二中第一會(huì)場(chǎng)中發(fā)言人位置的第四示意圖IO為本發(fā)明實(shí)施例二中第一會(huì)場(chǎng)中發(fā)言人位置的第五示意圖11為本發(fā)明實(shí)施例三中會(huì)議終端的結(jié)構(gòu)示意圖12為本發(fā)明實(shí)施例三中會(huì)議終端設(shè)備中確定單元的示意圖13為本發(fā)明實(shí)施例四中會(huì)議管理設(shè)備的結(jié)構(gòu)示意圖14為本發(fā)明實(shí)施例四中會(huì)議管理i殳備中確定單元的示意圖15為本發(fā)明實(shí)施例五中的系統(tǒng)結(jié)構(gòu)示意圖16為本發(fā)明實(shí)施例六中的系統(tǒng)結(jié)構(gòu)示意10圖17為本發(fā)明實(shí)施例六中的系統(tǒng)實(shí)例示意圖。具體實(shí)施例方式為了實(shí)現(xiàn)視頻會(huì)議中當(dāng)某一會(huì)場(chǎng)中發(fā)言人發(fā)生改變時(shí),其它會(huì)場(chǎng)中所顯示的視頻圖像能夠自動(dòng)進(jìn)行切換,本發(fā)明實(shí)施例提供一種視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng)。下面結(jié)合實(shí)施例與附圖對(duì)本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng)進(jìn)行詳細(xì)描述。在視頻會(huì)議過(guò)程中,以當(dāng)前發(fā)言人所在的會(huì)場(chǎng)為第一會(huì)場(chǎng),其它會(huì)場(chǎng)均為第二會(huì)場(chǎng)。實(shí)施例一如圖1所示,本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,包括以下步驟11、獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息。通過(guò)會(huì)場(chǎng)中的攝像設(shè)備和麥克風(fēng)陣列可以采集到會(huì)場(chǎng)內(nèi)的視頻圖像信號(hào)以及聲音信息。12、根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào)。結(jié)合所獲取到的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,通過(guò)圖像識(shí)別技術(shù)和麥克風(fēng)陣列技術(shù)即可確定會(huì)場(chǎng)中的哪位與會(huì)人員是當(dāng)前的發(fā)言人,并將其作為視頻對(duì)象。13、將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。上述將視頻圖像信號(hào)發(fā)送給其他會(huì)場(chǎng),可以是直接將切換后的視頻圖像信號(hào)發(fā)送給第二會(huì)場(chǎng)的終端設(shè)備,也可以是將切換后的視頻圖像信號(hào)通過(guò)會(huì)議管理設(shè)備(比如多點(diǎn)控制單元MCU)發(fā)送到多個(gè)第二會(huì)場(chǎng)的終端設(shè)備。本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,能夠在視頻會(huì)議過(guò)程中,根據(jù)第一會(huì)場(chǎng)的會(huì)場(chǎng)圖像信號(hào)和聲音信息自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分以顯示給其它會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。實(shí)施例二設(shè)定第一會(huì)場(chǎng)內(nèi)有P1、P2、P3、P4四位與會(huì)者,而第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備只能夠顯示第一會(huì)場(chǎng)中的兩位與會(huì)者。如圖2所示,本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,具體包括以下步驟21、獲取第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息。22、根據(jù)上述會(huì)場(chǎng)視頻圖像信號(hào)確定第一會(huì)場(chǎng)中每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息。首先,通過(guò)圖像識(shí)別技術(shù),從攝像機(jī)獲取到的視頻圖像中將所有與會(huì)者的圖像識(shí)別出來(lái);然后,根據(jù)攝像機(jī)的成像原理,計(jì)算出所有與會(huì)者相對(duì)于攝像機(jī)的方位,其原理如圖3所示圖中原點(diǎn)(9點(diǎn)對(duì)應(yīng)攝像機(jī)鏡頭的中心,z軸沿?cái)z像機(jī)鏡頭垂直方向,;c軸與;;軸組成的平面與z軸垂直。空間點(diǎn)C^所在的平面為實(shí)際空間中一點(diǎn)A所在且與z軸相垂直的平面,它與O點(diǎn)沿z軸的距離,即物距為《成像點(diǎn)02所在的平面為P!點(diǎn)的成像點(diǎn)尸2所在且與z軸相垂直的平面,它與O點(diǎn)沿z軸的距離,即像距等于相機(jī)的焦距/(由于物距遠(yuǎn)大于像距,因此這里近似認(rèn)為像距等于相說(shuō)明書第7/18頁(yè)機(jī)的焦距/)。根據(jù)圖像識(shí)別技術(shù),我們可以得到尸2到X2軸和》軸的距離分別為問和H,那么我們就可以通過(guò)P1點(diǎn)的成像點(diǎn)P2在X2》坐標(biāo)系中的坐標(biāo)(VV、/0來(lái)計(jì)算得到A點(diǎn)相對(duì)于攝像機(jī)的方位(在本發(fā)明實(shí)施例中,與會(huì)者相對(duì)于攝像機(jī)的方位信息均以方位角Ct來(lái)表示)。a=arctan(w//),ore(0,180)如圖4所示,其中一名與會(huì)者P4相對(duì)于攝像機(jī)的角度為a,此即為該與會(huì)者相對(duì)于攝像機(jī)的方位信息。23、根據(jù)所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息。在會(huì)場(chǎng)中,視頻呈現(xiàn)設(shè)備和與會(huì)者之間會(huì)設(shè)置一個(gè)麥克風(fēng)陣列,該麥克風(fēng)陣列可以是但不限于是由至少兩個(gè)麥克風(fēng)組成的線形陣列、圓形陣列或者十字形陣列,當(dāng)然也可以是其它形式的麥克風(fēng)陣列。由于麥克風(fēng)陣列中各個(gè)麥克風(fēng)位置的不同而導(dǎo)致聲源發(fā)出的聲音到各個(gè)麥克風(fēng)的距離也不同,我們可以檢測(cè)出各個(gè)麥克風(fēng)錄制的音頻信號(hào)之間的時(shí)延;根據(jù)所述音頻信號(hào)之間的時(shí)延,結(jié)合麥克風(fēng)陣列中麥克風(fēng)對(duì)應(yīng)的位置即可估計(jì)出當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位。通過(guò)上述麥克風(fēng)陣列處理技術(shù),再結(jié)合麥克風(fēng)陣列與攝像機(jī)之間的位置關(guān)系可以計(jì)算出當(dāng)前發(fā)言人、也就是需要顯示的視頻對(duì)象相對(duì)于攝像機(jī)的方位。如果通過(guò)攝像機(jī)獲取的視頻圖像信號(hào)確定與會(huì)者的方位時(shí)所采用的水平坐標(biāo)系(筒稱攝像機(jī)坐標(biāo)系)和通過(guò)麥克風(fēng)陣列計(jì)算當(dāng)前發(fā)言人的方位時(shí)所采用的水平坐標(biāo)系(簡(jiǎn)稱麥克風(fēng)陣列坐標(biāo)系)重合,如圖4所示,此時(shí)攝像機(jī)鏡頭的中心與麥克風(fēng)陣列的中心也是重合的,那么由麥克風(fēng)陣列處理技術(shù)得到的當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息(角度y5)就是所述當(dāng)前發(fā)言人相對(duì)于攝像機(jī)的方位信息,即此時(shí)a=y5。13如果攝像機(jī)坐標(biāo)系和麥克風(fēng)陣列坐標(biāo)系不重合,那么還需要對(duì)兩者所在的水平坐標(biāo)系進(jìn)行統(tǒng)一,例如可以把攝像機(jī)坐標(biāo)系統(tǒng)一到麥克風(fēng)陣列坐標(biāo)系,也可以把麥克風(fēng)陣列坐標(biāo)系統(tǒng)一到攝像機(jī)坐標(biāo)系當(dāng)中。如圖5所示,攝像機(jī)坐標(biāo)系原點(diǎn)O和麥克風(fēng)陣列坐標(biāo)系原點(diǎn)O'并未重合,不過(guò)由于原點(diǎn)O和原點(diǎn)O'的位置關(guān)系是已知的,即xl和yl是已知的,而當(dāng)前發(fā)言人到原點(diǎn)0'的距離(x2和y2)也是可以通過(guò)麥克風(fēng)陣列處理技術(shù)得到的,那么我們就可以方便地由xl、yl、x2和y2得到上述當(dāng)前發(fā)明人相對(duì)于原點(diǎn)0,也就是攝像機(jī)鏡頭中心的方位信息a'=arctan,2"1),cc'"0,180)x2—xl24、從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象。理論上講,當(dāng)前視頻對(duì)象相對(duì)于攝像機(jī)的方位角ct與當(dāng)前發(fā)言人相對(duì)于攝像機(jī)的方位信息〃(或者a')是相同的,因此我們就可以比較不同與會(huì)者相對(duì)于攝像機(jī)的方位信息和當(dāng)前發(fā)言人相對(duì)于攝像機(jī)的方位信息々(或者ct'),其中,方位信息和當(dāng)前發(fā)言人的方位信息A(或者ct')相同的與會(huì)者就是當(dāng)前的視頻對(duì)象。在實(shí)際情況中由于誤差的存在,a和A(或者a')很難完全相等,此時(shí)相對(duì)于攝像機(jī)的方位信息與-(或者ct')具有最小絕對(duì)差值的與會(huì)者就是當(dāng)前的視頻對(duì)象,其中所述絕對(duì)差值為兩個(gè)角的差值的絕對(duì)值。如果與會(huì)者中當(dāng)前只有一個(gè)發(fā)言人或者有兩個(gè)相鄰的發(fā)言人,此時(shí)第二會(huì)場(chǎng)可以正常顯示所述發(fā)言人的視頻圖像,則進(jìn)行步驟26;如果與會(huì)者中當(dāng)前存在不相鄰的發(fā)言人或者有多個(gè)發(fā)言人,且第二會(huì)場(chǎng)無(wú)法同時(shí)顯示上述多個(gè)發(fā)言人的視頻圖像,就需要先對(duì)視頻圖像進(jìn)行處理,進(jìn)行步驟25。1425、從會(huì)場(chǎng)視頻圖像信號(hào)中截取出需要顯示的發(fā)言人的圖像,并將截取出的圖像組合成包含所述需要顯示的發(fā)言人的視頻圖像。如圖6所示,經(jīng)過(guò)圖像識(shí)別后,第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)被劃分為四個(gè)部分,Pl、P2、P3和P4分別對(duì)應(yīng)的區(qū)域如表1所示(其中,所有單位均為像素)。表1<table>tableseeoriginaldocumentpage15</column></row><table>如果系統(tǒng)檢測(cè)到第一會(huì)場(chǎng)中的與會(huì)者P1在進(jìn)行較長(zhǎng)時(shí)間的講話(見圖6),而此時(shí)第二會(huì)場(chǎng)的與會(huì)者觀看到第一會(huì)場(chǎng)的視頻圖像中不包含P1,例如所述視頻圖像包含有P2和P3,那么此時(shí)需要把圖像切換到含有P1的圖像。如果第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備針對(duì)每個(gè)會(huì)場(chǎng)可以顯示兩人,那么可以選擇與Pl相鄰的一個(gè)與會(huì)者進(jìn)行顯示,例如在本實(shí)施例中第一會(huì)場(chǎng)中有四個(gè)人與會(huì),那么就可以考慮在第二會(huì)場(chǎng)中顯示含有P1和P2的圖像。如果在第一會(huì)場(chǎng)中存在兩個(gè)相鄰的發(fā)言人,其確定需要切換的視頻圖像信號(hào)范圍的過(guò)程與上述同時(shí)顯示P1和P2圖像的過(guò)程相似,此處不再贅述。不過(guò),以下幾種情況就需要先對(duì)視頻圖像進(jìn)行處理,然后才能確定需要切換的視頻圖像信號(hào)范圍。1)如果檢測(cè)到多個(gè)人在講話(如圖7),且講話人的數(shù)量不大于第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備可顯示的人數(shù),例如第一會(huì)場(chǎng)中的會(huì)談主要集中在P1和P3,那么可以考慮將Pl和P3從第一會(huì)場(chǎng)所對(duì)應(yīng)的視頻圖像中裁剪出來(lái),然后重新組合拼接后成為一個(gè)新的視頻圖像信號(hào),以便在第二會(huì)場(chǎng)中的顯示設(shè)備中進(jìn)行顯示。2)在協(xié)作類的視頻會(huì)議中,會(huì)遇到講話主要集中在其中幾個(gè)人的情況,而講話人的數(shù)量超過(guò)了第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備可以顯示的人數(shù),如圖8所示,發(fā)言者主要是P1、P2和P3,如果第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備可以顯示同一會(huì)場(chǎng)中的三個(gè)人,那么就可以考慮選擇將P1、P2和P3—起呈現(xiàn)在第二會(huì)場(chǎng)中(如圖8)。但是,實(shí)際情況更多地類似于本發(fā)明實(shí)施例設(shè)定的情況,即在第二會(huì)場(chǎng)中只能同時(shí)顯示一個(gè)會(huì)場(chǎng)中的兩個(gè)人,那么就需要以區(qū)域?yàn)閱挝粊?lái)去定選擇哪些區(qū)域進(jìn)行顯示。例如,Pl、P2和P3都在講話,而第二會(huì)場(chǎng)只能顯示其中兩人,這就需要在Pl與P2所組成的區(qū)域或者P2與P3所組成的區(qū)域中選擇一個(gè)區(qū)域作為需要切換的視頻圖像區(qū)域,此時(shí)可以通過(guò)比較兩個(gè)區(qū)域組合中語(yǔ)音信號(hào)能量的大小,來(lái)選取語(yǔ)音信號(hào)能量大的區(qū)域組合進(jìn)行顯示。針對(duì)P1、P2和P3都在講話的情況,還有一種方案就是根據(jù)會(huì)場(chǎng)視頻圖像信號(hào)計(jì)算出三者的中心位置,并以此中心位置為需要切換的視頻圖像的顯示中心以便在第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備中進(jìn)行顯示(如圖9)。但是,該方案會(huì)導(dǎo)致P1和P3的部分影像被裁掉;在此情況下,考慮到P1、P2、P3之間存在空白無(wú)人區(qū)域,可以將所述空白無(wú)人區(qū)域裁掉,以便所有講話人的圖像都能在第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備中顯示,其顯示效果如圖IO所示。26、將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。在判斷出是哪位與會(huì)者是視頻對(duì)象以后,如果此時(shí)需要顯示的視頻對(duì)象沒有在第二會(huì)場(chǎng)顯示的視頻圖像中出現(xiàn),則要將顯示的視頻圖像切換到包含所述視頻對(duì)象的視頻圖像部分。27、將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。這里,將視頻圖像信號(hào)發(fā)送給其他會(huì)場(chǎng)的方式可以是直接將切換后的視頻圖像信號(hào)發(fā)送給第二會(huì)場(chǎng)的終端設(shè)備,也可以是將切換后的視頻圖像信號(hào)通過(guò)會(huì)議管理設(shè)備(比如多點(diǎn)控制單元MCU)發(fā)送到多個(gè)第二會(huì)場(chǎng)的終端設(shè)備。第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備只能顯示第一會(huì)場(chǎng)中部分與會(huì)者所對(duì)應(yīng)的視頻圖像,因此我們可以考慮在發(fā)送包含視頻對(duì)象的視頻圖像信號(hào)給第二會(huì)場(chǎng)的同時(shí),將一個(gè)低碼率的第一會(huì)場(chǎng)的會(huì)場(chǎng)全景視頻圖像信號(hào)作為輔助視頻信號(hào)一起發(fā)送給第二會(huì)場(chǎng),并進(jìn)行顯示。這樣,可以幫助第二會(huì)場(chǎng)的與會(huì)者更直觀地了解第一會(huì)場(chǎng)的情況,在進(jìn)朽4見頻切換的時(shí)候也不會(huì)感覺太突兀。本實(shí)施例中提供的編號(hào)并不用于限定各步驟的順序,例如步驟22和23是可以同時(shí)進(jìn)行的,且這兩個(gè)步驟都是實(shí)時(shí)進(jìn)行的。本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,能夠根據(jù)每個(gè)與會(huì)者相對(duì)于攝像機(jī)的方位信息同當(dāng)前方言人相對(duì)于攝像機(jī)的方位信息之間的匹配程度來(lái)自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分以顯示給其它會(huì)場(chǎng)人員;針對(duì)在第一會(huì)場(chǎng)存在多個(gè)發(fā)言人導(dǎo)致第二會(huì)場(chǎng)的視頻呈現(xiàn)設(shè)備無(wú)法正常顯示所有發(fā)言人的情況,本發(fā)明實(shí)施例通過(guò)對(duì)視頻圖像進(jìn)行重新剪接,從而實(shí)現(xiàn)在第二會(huì)場(chǎng)中同時(shí)顯示一個(gè)會(huì)場(chǎng)中的多個(gè)發(fā)言人;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。實(shí)施例三為了更好地實(shí)現(xiàn)上述視頻通信中視頻對(duì)象切換的方法,本發(fā)明實(shí)施例提供了一種用于視頻會(huì)議的會(huì)議終端;下面結(jié)合附圖,對(duì)該會(huì)議終端進(jìn)行詳細(xì)描述。如圖ll所示,本發(fā)明實(shí)施例提供的會(huì)議終端,包括終端設(shè)備ill以及與所述終端設(shè)備111分別連接的視頻呈現(xiàn)設(shè)備112、音頻輸出設(shè)備113、攝像設(shè)備114和麥克風(fēng)陣列115,其中,所述終端設(shè)備lll進(jìn)一步包括獲取單元llll、確定單元1112以及發(fā)送單元1113;其中,獲取單元1111通過(guò)會(huì)場(chǎng)中的攝像設(shè)備114和麥克風(fēng)陣列115獲取到會(huì)場(chǎng)內(nèi)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,然后確定單元1112根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);最后,通過(guò)發(fā)送單元1113將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。所述確定單元1112可以結(jié)合所獲取到的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,通過(guò)圖像識(shí)別技術(shù)和麥克風(fēng)陣列技術(shù)即可確定會(huì)場(chǎng)中的哪位與會(huì)人員是當(dāng)前的發(fā)言人,并將其作為^L頻對(duì)象;如圖12所示,所述確定單元1112進(jìn)一步包括第一確定模塊11121、第二確定模塊11122、查找模塊11123以及切換模塊11124;其中,所述第一確定模塊11121根據(jù)圖像識(shí)別技術(shù)以及攝像機(jī)的成像原理,并結(jié)合所述會(huì)場(chǎng)視頻圖像信號(hào)確定每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息;所述第二確定模塊11122根據(jù)麥克風(fēng)陣列技術(shù)并結(jié)合所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;一般情況下,根據(jù)所述聲音信息得到的方位信息都是當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息;如杲當(dāng)前會(huì)場(chǎng)中攝像設(shè)備鏡頭的中心與麥克風(fēng)陣列的中心重合,那么當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息也就是當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;如果攝像設(shè)備鏡頭的中心與麥克風(fēng)陣列的中心不重合,則根據(jù)所述當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息進(jìn)行換算,得到所述當(dāng)前18發(fā)言人相對(duì)于攝像設(shè)備的方位信息。然后,所述查找模塊11123從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象;其中,所述與所述當(dāng)前發(fā)言人的方位信息一致具體為所述與當(dāng)前發(fā)言人的方位信息相同;或者,在所有與會(huì)者的方位信息中,與所述當(dāng)前發(fā)言人所處方位的絕對(duì)差值最??;最后,所述切換模塊11124將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。如果第一會(huì)場(chǎng)中存在至少兩個(gè)視頻對(duì)象且視頻呈現(xiàn)設(shè)備無(wú)法同時(shí)顯示所述至少兩個(gè)視頻對(duì)象,則所述確定單元1112還包括截取模塊11125,用于從所述會(huì)場(chǎng)視頻圖像信號(hào)中截取出每個(gè)需要顯示的所述視頻對(duì)象對(duì)應(yīng)的圖像信號(hào);組合模塊11126,用于將所截取出的圖像信號(hào)組合成包含所述需要顯示的視頻對(duì)象的視頻圖像信號(hào),并將組合后的視頻圖像信號(hào)發(fā)送給所述切換模塊。如果所述第二會(huì)場(chǎng)的數(shù)量大于等于2,則需要一會(huì)議管理設(shè)備對(duì)切換后的視頻圖像信號(hào)進(jìn)行轉(zhuǎn)發(fā),此時(shí)所述發(fā)送單元U13將所述切換后的視頻圖像信號(hào)通過(guò)發(fā)送到所述會(huì)議管理設(shè)備。為了能讓第二會(huì)場(chǎng)的與會(huì)者更直觀地看到第一會(huì)場(chǎng)的情況,所述發(fā)送單元1113還將一個(gè)低碼率的會(huì)場(chǎng)全景視頻圖像信號(hào)同含有視頻對(duì)象的視頻圖像信號(hào)一起發(fā)送給其他會(huì)場(chǎng)。本發(fā)明實(shí)施例提供的會(huì)議終端,能夠根據(jù)每個(gè)與會(huì)者的方位同當(dāng)前方言人方位的匹配程度來(lái)自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分以顯示給其它會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的會(huì)議終端,實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。實(shí)施例四為了更好地實(shí)現(xiàn)上述視頻通信中視頻對(duì)象切換的方法,本發(fā)明實(shí)施例提供了一種用于視頻會(huì)議的會(huì)議管理設(shè)備;下面結(jié)合附圖,對(duì)該會(huì)議管理設(shè)備進(jìn)行詳細(xì)描述。如圖13所示,本發(fā)明實(shí)施例提供的會(huì)議管理設(shè)備,包括接收單元131、確定單元132以及發(fā)送單元133;其中,接收單元131接收第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,然后確定單元132根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);最后,通過(guò)發(fā)送單元133將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。所述確定單元132可以結(jié)合所獲取到的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,通過(guò)圖像識(shí)別技術(shù)和麥克風(fēng)陣列技術(shù)即可確定會(huì)場(chǎng)中的哪位與會(huì)人員是當(dāng)前的發(fā)言人,并將其作為—見頻對(duì)象;如圖14所示,所述確定單元132進(jìn)一步包括第一確定模塊1321、第二確定模塊1322、查找模塊1323以及切換模塊1324;其中,所述第一確定模塊1321根據(jù)圖像識(shí)別技術(shù)以及攝像機(jī)的成像原理,并結(jié)合所述會(huì)場(chǎng)視頻圖像信號(hào)確定每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息;所述第二確定模塊1322根據(jù)麥克風(fēng)陣列技術(shù)并結(jié)合所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;一般情況下,根據(jù)所述聲音信息得到的方位信息都是當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息;如果當(dāng)前會(huì)場(chǎng)中攝像設(shè)備鏡頭的中心與麥克風(fēng)陣列的中心重合,那么當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息也就是當(dāng)前發(fā)言人相對(duì)20于攝像設(shè)備的方位信息;如果攝像設(shè)備鏡頭的中心與麥克風(fēng)陣列的中心不重合,則根據(jù)所述當(dāng)前發(fā)言人相對(duì)于麥克風(fēng)陣列的方位信息進(jìn)行換算,得到所述當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息。然后,所述查找模塊1323從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象;其中,所述與所述當(dāng)前發(fā)言人的方位信息一致具體為所述與當(dāng)前發(fā)言人的方位信息相同;或者,在所有與會(huì)者的方位信息中,與所述當(dāng)前發(fā)言人所處方位的絕對(duì)差值最??;最后,所述切換模塊1324將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。如果第一會(huì)場(chǎng)中存在至少兩個(gè)視頻對(duì)象且視頻呈現(xiàn)設(shè)備無(wú)法同時(shí)顯示所述至少兩個(gè)^L頻對(duì)象,則所述確定單元132還包括截取模塊1325,用于從所述會(huì)場(chǎng)視頻圖像信號(hào)中截取出每個(gè)需要顯示的所述視頻對(duì)象對(duì)應(yīng)的圖像信號(hào);組合模塊1326,用于將所截取出的圖像信號(hào)組合成包含所述需要顯示的視頻對(duì)象的視頻圖像信號(hào),并將組合后的視頻圖像信號(hào)發(fā)送給所述切換模塊。為了能讓第二會(huì)場(chǎng)的與會(huì)者更直觀地看到第一會(huì)場(chǎng)的情況,所述發(fā)送單元133還將一個(gè)低碼率的會(huì)場(chǎng)視頻圖像信號(hào)同含有視頻對(duì)象的視頻圖像信號(hào)一起發(fā)送給其他會(huì)場(chǎng)。本發(fā)明實(shí)施例提供的會(huì)議管理設(shè)備,能夠根據(jù)每個(gè)與會(huì)者的方位同當(dāng)前方言人方位的匹配程度來(lái)自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分以顯示給其它會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻會(huì)議管理設(shè)備,實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因21素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。實(shí)施例五本發(fā)明實(shí)施例還提供了一種可實(shí)現(xiàn)上述視頻通信中視頻對(duì)象切換方法的視頻會(huì)議系統(tǒng),如圖15所示,包括一個(gè)第一會(huì)議終端151和至少一個(gè)第二會(huì)議終端152;其中,所述第一會(huì)議終端151獲取第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端152接收所述第一會(huì)議終端發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。如果所述第二會(huì)議終端的數(shù)量大于等于2,則本發(fā)明實(shí)施例中的視頻會(huì)議系統(tǒng)還需要一個(gè)會(huì)議管理設(shè)備153,用于獲取所述第一會(huì)議終端切換后的視頻圖像信號(hào),并將該視頻圖像信號(hào)發(fā)送給所述第二會(huì)議終端。本發(fā)明實(shí)施例提供的視頻會(huì)議系統(tǒng),能夠在視頻會(huì)議過(guò)程中,所述第一會(huì)議終端151根據(jù)第一會(huì)場(chǎng)的會(huì)場(chǎng)圖像信號(hào)和聲音信息自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換至含有所述視頻對(duì)象的部分并發(fā)送給第二會(huì)議終端152以顯示給第二會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻會(huì)議系統(tǒng),實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。實(shí)施例六本發(fā)明實(shí)施例還提供了一種可實(shí)現(xiàn)上述視頻通信中視頻對(duì)象切換方法的視頻會(huì)議系統(tǒng),如圖16所示,包括一個(gè)第一會(huì)議終端161、一個(gè)會(huì)議管理設(shè)備162和至少一個(gè)第二會(huì)議終端163;其中,所述第一會(huì)議終端161采集第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像以及聲音信息,并將所述會(huì)場(chǎng)視頻圖像以及聲音信息發(fā)送到視頻會(huì)議管理設(shè)備;所述會(huì)議管理設(shè)備162,接收所述第一會(huì)議終端161發(fā)送的所述會(huì)場(chǎng)視頻圖像以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端163,接收所述會(huì)議管理設(shè)備162發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。如圖17所示,為本發(fā)明具體應(yīng)用的一個(gè)實(shí)施例。其中,會(huì)議管理設(shè)備為多點(diǎn)4空制單元。當(dāng)視頻會(huì)議進(jìn)行時(shí),多點(diǎn)控制單元同時(shí)接收會(huì)場(chǎng)Sl、S2和S3中會(huì)議終端提供的會(huì)場(chǎng)圖像信號(hào)以及聲音信息,然后根據(jù)每個(gè)會(huì)場(chǎng)的會(huì)場(chǎng)圖像信號(hào)以及聲音信息判斷出哪個(gè)會(huì)場(chǎng)是第一會(huì)場(chǎng);如果會(huì)場(chǎng)S1即為第一會(huì)場(chǎng),那么多點(diǎn)控制單元根據(jù)會(huì)場(chǎng)Sl的會(huì)場(chǎng)圖像信號(hào)以及聲音信息確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將其發(fā)送給會(huì)場(chǎng)S2和S3的會(huì)議終端以在第二會(huì)場(chǎng)中進(jìn)行顯示0本發(fā)明實(shí)施例提供的視頻會(huì)議系統(tǒng),由第一會(huì)議終端161釆集第一會(huì)場(chǎng)中的會(huì)場(chǎng)圖像信號(hào)以及聲音信息,并發(fā)送給會(huì)議管理設(shè)備162,然后由會(huì)議管理設(shè)備162根據(jù)第一會(huì)場(chǎng)的會(huì)場(chǎng)圖像信號(hào)和聲音信息自動(dòng)地判斷出哪位與會(huì)者是當(dāng)前發(fā)言人、即當(dāng)前視頻圖像中需要顯示的視頻對(duì)象,然后將視頻圖像信號(hào)切換23至含有所述視頻對(duì)象的部分并將含有視頻對(duì)象的視頻圖像信號(hào)發(fā)送給第二會(huì)議終端163以顯示給第二會(huì)場(chǎng)人員;相對(duì)于現(xiàn)有技術(shù),本發(fā)明實(shí)施例提供的視頻會(huì)議系統(tǒng),實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括ROM、RAM、》茲碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域:
的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。權(quán)利要求1、一種視頻通信中視頻對(duì)象切換的方法,其特征在于,包括獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。2、根據(jù)權(quán)利要求1所述的視頻通信中視頻對(duì)象切換的方法,其特征在于,所述根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),具體為根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)確定每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息;根據(jù)所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象;將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。3、根據(jù)權(quán)利要求2所述的視頻通信中視頻對(duì)象切換的方法,其特征在于,所述與當(dāng)前發(fā)言人的方位信息一致,包括與所述當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息相同;或者,在所有與會(huì)者的方位信息中,與所述當(dāng)前發(fā)言人所處方位的絕對(duì)差值最小。4、根據(jù)權(quán)利要求2所述的視頻通信中視頻對(duì)象切換的方法,其特征在于,如果存在至少兩個(gè)視頻對(duì)象且視頻呈現(xiàn)設(shè)備無(wú)法同時(shí)顯示所述至少兩個(gè)視頻對(duì)象,則在所述將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)之前,還包括從所述會(huì)場(chǎng)視頻圖像信號(hào)中截取出每個(gè)需要顯示的所述視頻對(duì)象對(duì)應(yīng)的圖像信號(hào);將所截取出的圖像信號(hào)組合成包含所述需要顯示的視頻對(duì)象的視頻圖像信,5、根據(jù)權(quán)利要求1所述的視頻通信中視頻對(duì)象切換的方法,其特征在于,所述將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng),包括將所述切換后的視頻圖像信號(hào)通過(guò)會(huì)議管理設(shè)備發(fā)送到其他會(huì)場(chǎng)。6、一種會(huì)議終端,包括終端設(shè)備以及與所述終端設(shè)備分別連接的視頻呈現(xiàn)設(shè)備、音頻輸出設(shè)備、攝像設(shè)備和麥克風(fēng)陣列,其特征在于,所述終端設(shè)備包括獲取單元,用于獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;確定單元,用于根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);發(fā)送單元,用于將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。7、根據(jù)權(quán)利要求6所述的會(huì)議終端,其特征在于,所述確定單元,包括第一確定模塊,用于根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)確定每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息;第二確定模塊,用于根據(jù)所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;查找模塊,用于從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象;切換模塊,用于將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。8、根據(jù)權(quán)利要求7所述的會(huì)議終端,其特征在于,如果存在至少兩個(gè)視頻對(duì)象且視頻呈現(xiàn)設(shè)備無(wú)法同時(shí)顯示所述至少兩個(gè)視頻對(duì)象,則所述確定單元還包括截取模塊,用于從所述會(huì)場(chǎng)視頻圖像信號(hào)中截取出每個(gè)需要顯示的所述視頻對(duì)象對(duì)應(yīng)的圖像信號(hào);組合模塊,用于將所截取出的圖像信號(hào)組合成包含所述需要顯示的視頻對(duì)象的視頻圖像信號(hào),并將組合后的視頻圖像信號(hào)發(fā)送給所述切換模塊。9、一種會(huì)議管理設(shè)備,其特征在于,包括接收單元,用于接收第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;確定單元,用于根據(jù)所述第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);發(fā)送單元,用于將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。10、根據(jù)權(quán)利要求9所述的會(huì)議管理設(shè)備,其特征在于,所述確定單元,包括第一確定模塊,用于根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)確定每個(gè)與會(huì)者相對(duì)于攝像設(shè)備的方位信息;第二確定模塊,用于根據(jù)所述聲音信息確定當(dāng)前發(fā)言人相對(duì)于攝像設(shè)備的方位信息;查找模塊,用于從所述與會(huì)者中找出與所述當(dāng)前發(fā)言人的方位信息一致的與會(huì)者作為視頻對(duì)象;切換模塊,用于將所述會(huì)場(chǎng)視頻圖像信號(hào)切換至包含所述視頻對(duì)象的視頻圖像信號(hào)。11、根據(jù)權(quán)利要求10所述的會(huì)議管理設(shè)備,其特征在于,如果存在至少兩個(gè)視頻對(duì)象且視頻呈現(xiàn)設(shè)備無(wú)法同時(shí)顯示所述至少兩個(gè)視頻對(duì)象,則所述確定單元還包括截取模塊,用于從所述會(huì)場(chǎng)視頻圖像信號(hào)中截取出每個(gè)需要顯示的所述視頻對(duì)象對(duì)應(yīng)的圖像信號(hào);組合模塊,用于將所截取出的圖像信號(hào)組合成包含所述需要顯示的視頻對(duì)象的視頻圖像信號(hào),并將組合后的視頻圖像信號(hào)發(fā)送給所述切換模塊。12、一種視頻會(huì)議系統(tǒng),其特征在于,包括一個(gè)第一會(huì)議終端和至少一個(gè)第二會(huì)議終端;其中,所述第一會(huì)議終端,用于獲取第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端,用于接收所述第一會(huì)議終端發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。13、根據(jù)權(quán)利要求12所述的視頻會(huì)議系統(tǒng),其特征在于,還包括一個(gè)會(huì)議管理設(shè)備;所述會(huì)議管理設(shè)備,用于獲取所述第一會(huì)議終端切換后的視頻圖像信號(hào),并將該視頻圖像信號(hào)發(fā)送給所述第二會(huì)議終端。14、一種視頻會(huì)議系統(tǒng),其特征在于,包括一個(gè)第一會(huì)議終端、一個(gè)會(huì)議管理設(shè)備以及至少一個(gè)第二會(huì)議終端;其中,所述第一會(huì)議終端,用于采集第一會(huì)場(chǎng)的會(huì)場(chǎng)視頻圖像以及聲音信息,并將所述會(huì)場(chǎng)視頻圖像以及聲音信息發(fā)送到視頻會(huì)議管理設(shè)備;所述會(huì)議管理設(shè)備,用于接收所述第一會(huì)議終端發(fā)送的所述會(huì)場(chǎng)視頻圖像以及聲音信息,然后根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào),并將切換后的視頻圖像信號(hào)發(fā)送到第二會(huì)場(chǎng)終端;所述至少一個(gè)第二會(huì)議終端,用于接收所述視頻會(huì)議管理設(shè)備發(fā)送的視頻圖像信號(hào),并顯示所述切換后的視頻圖像信號(hào);其中,所述第一會(huì)場(chǎng)為當(dāng)前發(fā)言人所在的會(huì)場(chǎng)。全文摘要本發(fā)明實(shí)施例公開了一種視頻通信中視頻對(duì)象切換的方法、裝置及系統(tǒng),涉及到視頻會(huì)議
技術(shù)領(lǐng)域:
,用以實(shí)現(xiàn)視頻會(huì)議過(guò)程中視頻圖像的自動(dòng)切換。本發(fā)明實(shí)施例提供的視頻通信中視頻對(duì)象切換的方法,包括獲取會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息;根據(jù)所述會(huì)場(chǎng)視頻圖像信號(hào)以及聲音信息,確定需要切換的包含視頻對(duì)象的視頻圖像信號(hào);將所述切換后的視頻圖像信號(hào)發(fā)送到其他會(huì)場(chǎng)。本發(fā)明實(shí)施例提供的方法、裝置及系統(tǒng)實(shí)現(xiàn)了視頻會(huì)議過(guò)程中視頻圖像信號(hào)的自動(dòng)切換,從而可避免人為因素導(dǎo)致的切換錯(cuò)誤且提高了會(huì)議效率。文檔編號(hào)H04N7/15GK101442654SQ20081018892公開日2009年5月27日申請(qǐng)日期2008年12月26日優(yōu)先權(quán)日2008年12月26日發(fā)明者王東琦,詹五洲申請(qǐng)人:深圳華為通信技術(shù)有限公司