專利名稱:一種卡拉ok系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及一種卡拉OK系統(tǒng),其用于一個如視頻剪輯(videoclip)或影片的序列中的演唱。
如例如歐洲專利申請EP0782338中所描述的卡拉OK系統(tǒng)中,音樂、歌詞或任何種類的音頻數(shù)據(jù)由傳輸站傳輸?shù)椒峙湔?。系統(tǒng)的主模塊的音樂控制裝置把音樂通過監(jiān)視器的內設揚聲器播出,且把聲音從一個未示出的麥克風通過所述的揚聲器播出。圖象控制裝置將背景圖象(如視頻圖像或從背景圖象存儲裝置中提取的靜態(tài)圖象)顯示在監(jiān)視器上,而歌詞控制裝置通過把歌詞疊加于背景圖象上來顯示歌詞。圖象拾取設備,如一個CCD攝像機,拾取演唱者的圖像,并將其通過視頻圖象控制裝置疊加于監(jiān)視器屏幕上作為疊加的圖像。這樣的系統(tǒng),可定義為卡拉OK概念中所謂的“視頻混合”。
本發(fā)明的目的是提出另一類型的具備額外功能的卡拉OK系統(tǒng)。
為了這一目的,該系統(tǒng)涉及一種用于在如視頻剪輯或影片的序列過程中演唱的卡拉OK系統(tǒng),并包括一系列用于拾取使用者的圖象和聲音的拾取設備,一個用于把使用者的至少一部分與背景分離的分析與處理設備,一個用于把所述分析與處理設備的輸出信號與預先錄制的材料組合起來的混合與再現(xiàn)(rendering)設備,和一個用于顯示該組合信號的顯示設備。
時至今日,唱卡拉OK的概念只依賴于基于音頻的技術,其只提供有限的功能且不可能把使用者真正插入到視頻虛擬世界中。所建議的引入了視頻混合(video mixing)的概念的解決方案,允許將這一卡拉OK概念擴展到視頻中,并一般地,允許發(fā)展完全音頻-視頻插入概念根據(jù)所述概念,在歌曲的視頻剪輯中的聲音和面孔可由偶然(fortuitous)演唱者的聲音和面孔代替(此后也稱使用者,因為他或她事實上可以是演唱者、表演者、舞蹈者等…)。同樣建議的技術可在其它環(huán)境中發(fā)現(xiàn)相似的應用,例如電子商務領域或用于預先錄制內容的視頻編輯。
下面將參考附圖,通過實例來描述本發(fā)明,其中
圖1根據(jù)本發(fā)明的卡拉OK系統(tǒng)的方框圖。
圖2根據(jù)本發(fā)明的卡拉OK系統(tǒng)的另一實施方案。
如圖1所示,實現(xiàn)根據(jù)本發(fā)明的卡拉OK系統(tǒng)所必需的不同的子系統(tǒng)主要是一個分析與處理設備11和一個混合與再現(xiàn)設備12。
用于接收由拾取設備10拾取到的使用者(黑色示出的人)的圖象和聲音的分析與處理設備11包括一個分割電路,其用于把例如使用者的面孔與背景分離,從而限定一個阿爾法(alpha)平面(如果使用者被置于舞臺上,這樣的電路可基于例如藍色屏幕前的色度鍵技術)?;旌吓c再現(xiàn)設備12是一個利用設備11中分析的形狀信息把使用者與預先錄制的由媒體13傳送的視頻或音頻-視頻背景合成起來的電路(所述的預先錄制的材料在媒體左側示出)。這一合成完成了用于把所述使用者的聲音與來自歌曲的預先錄制的音樂背景混合的音頻合成。然后,利用由設備11限定的阿爾法平面,根據(jù)下述類型的關系式,容易地把兩個來源組合起來[(視頻1×阿爾法)+(視頻2×(255-阿爾法))]/255=最終視頻。最后,一個如監(jiān)視器的顯示設備14,用于最后顯示最終結果(即預先錄制的材料和特別屬于使用者的之組合)。
顯然,為提高質量,在設備11中完成的分析可產(chǎn)生8比特阿爾法平面,其能在被鑲飾的對象邊緣(fronteer)有較好的混合。另外,還指出的是系統(tǒng)可以只替換使用者的頭部或他或她的整個身體。
相對于音頻-視頻來源的類型,可考慮不同的情況(a)兩個音頻/視頻來源沒有被壓縮這一選擇可用于例如卡拉OK餐館,演唱者的全部身體被鑲飾在剪輯/影片中時(預先錄制的數(shù)據(jù)可存儲在磁帶上,且偶然演唱者視頻可被分析并直接傳輸?shù)揭曨l混合器中);(b)一個或兩個來源被壓縮對這一情況的一個適配的架構(framework)是新近發(fā)展起來MPEG-4標準,其能對對象的形狀和阿爾法平面—這里是偶然使用者的面孔進行編碼-(MPEG-4標準已定義了一個能使音頻和視頻對象合成的整個系統(tǒng)架構)。
也可考慮本發(fā)明應用的不同情況(a)使用者可能想記錄混合操作的結果,這在圖2中示出,圖2示出了與圖1實施方案相似的系統(tǒng),只是包括了一個額外的錄制設備25;
(b)在一些情況下,卡拉OK系統(tǒng)可在線工作則預先錄制的剪輯可存儲于數(shù)據(jù)庫(例如互聯(lián)網(wǎng))上,并且使用者在家中錄制他或她的表演并打算產(chǎn)生卡拉OK剪輯的組合并將其放到他或她的個人主頁上(在這一情況下,壓縮技術的使用尤其有用,而且更普遍地,在所有應用中它都運行于帶寬所限的環(huán)境中);(c)另外,在一些情況下,使用者可能打算只把他或她的頭部放在原唱的頭部的位置,其包括在混合與再現(xiàn)設備12中的進一步處理,因為使用者頭部的位置需要與原唱身體的取向和姿勢匹配。
權利要求
1.一種卡拉OK系統(tǒng),其用于在一個如視頻剪輯或影片的序列過程中演唱,并包括一系列用于拾取使用者的圖象和聲音的拾取設備,一個用于把使用者的至少一部分與背景分離的分析與處理設備,一個用于把所述分析與處理設備的輸出信號與預先錄制的材料組合起來的混合與再現(xiàn)設備,以及一個用于顯示該組合信號的顯示設備。
全文摘要
演唱卡拉OK的概念只依賴于基于音頻的技術。本發(fā)明包括對視頻插入概念的發(fā)展:使用者將看到他的(她的)圖象被插入到視頻剪輯或影片中他最喜歡的舞蹈者、演唱者或表演者的位置,以及所以將能夠播放錄象帶上的剪輯/歌曲,且能替換任何明星。更確切地,本發(fā)明涉及一種卡拉OK系統(tǒng),其中提供有連續(xù)的裝置,用于拾取使用者的圖象和他/她的聲音,分析和處理所得的信號,把因此分析和處理的音頻或視頻信號與預先錄制的材料混合,并顯示因而得到的組合信號。
文檔編號G10K15/04GK1383543SQ01801723
公開日2002年12月4日 申請日期2001年6月15日 優(yōu)先權日2000年6月20日
發(fā)明者I·科爾塞特 申請人:皇家菲利浦電子有限公司