專利名稱:寬帶多媒體索引和隨機(jī)檢索系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種多媒體的索引和檢索系統(tǒng),更為詳細(xì)地,涉及一種在寬帶視頻服務(wù)方面提供索引和隨機(jī)檢索功能的系統(tǒng)。
傳統(tǒng)的系統(tǒng)使用MPEG-1、MPEG-2和MPEG-4的譯碼標(biāo)準(zhǔn)來對視頻數(shù)據(jù)進(jìn)行編碼。MPEG-1是在視頻數(shù)據(jù)壓縮中廣泛應(yīng)用的一個基本標(biāo)準(zhǔn)。MPEG-2是第二代壓縮標(biāo)準(zhǔn),能夠把視頻數(shù)據(jù)編碼為6兆字節(jié)/秒的比特流。MPEG-4雖然多了一些處理多媒體內(nèi)容所必需的能力,其根本的數(shù)據(jù)壓縮方法本質(zhì)上與MPEG-1或MPEG-2等同,例如運(yùn)動判斷和隨后的對運(yùn)動圖像補(bǔ)償后幀間差的壓縮。
美國第5,554,161號專利闡述了以MPEG-1為基礎(chǔ)的視頻傳輸網(wǎng)絡(luò)系統(tǒng)。
這種提供多媒體服務(wù)的傳統(tǒng)系統(tǒng)存在三個重要的不利因素。
首先,為了進(jìn)行計(jì)算強(qiáng)度很高的運(yùn)動判斷、對運(yùn)動圖像補(bǔ)償后幀間差的壓縮和復(fù)雜的數(shù)據(jù)緩沖控制,傳統(tǒng)系統(tǒng)要求在每個終端必須配備強(qiáng)大的MPEG-1,MPEG-2或MPEG-4處理器。
其次,因?yàn)閷γ恳粠瑘D像進(jìn)行編碼可能是采用了三種不同方式中的一種,所以對于某一特定幀圖像的隨機(jī)獲取不一定總能實(shí)現(xiàn)。明確地講,任一幀圖像可能被編碼為I幀圖像,或P幀圖像,或B幀圖像。I幀圖像是基于內(nèi)幀編碼的,它獨(dú)立于其他幀圖像,因此能被直接的訪問獲取。然而,P幀圖像和B幀圖像是基于中間態(tài)幀編碼的,意味著其編碼和解碼仰賴其他幀圖像(P幀圖像依賴在它之前若干幀圖像,B幀圖像依賴它之前和之后若干幀圖像).所以P幀圖像和B幀圖像是不能被直接訪問并獲取。其結(jié)果是傳統(tǒng)系統(tǒng)很難針對這些圖像進(jìn)行單獨(dú)注解。這個缺陷導(dǎo)致MPEG-1、MPEG-2和MPEG-4系統(tǒng)很難滿足客戶對圖像索引和隨機(jī)檢索的要求。
最后,系統(tǒng)可能會因?yàn)榭蛻舳嗝襟w終端機(jī)處理數(shù)據(jù)太慢而減慢速度。
本發(fā)明采用的技術(shù)方案如下該系統(tǒng)包括一個寬頻主鏈網(wǎng)絡(luò),一個中央服務(wù)器和一個或多個至少安裝一個Motion-JPEG芯片的客戶終端機(jī)。
為了視頻編碼,所有的客戶多媒體終端機(jī)將會有至少一枚Motion JPEG芯片。JPEG是一種靜止圖像的壓縮格式,Motion JPEG是用于減少數(shù)字視頻圖像所占的儲藏空間的壓縮方法。Motion JPEG基本的算法參照J(rèn)PEG。在Motion JPEG中,JPEG被應(yīng)用于數(shù)碼視頻圖像。它既可靠又簡單。
在對每一幀圖像進(jìn)行壓縮編碼時(shí),這幀圖像的時(shí)間和位置信息可以由用戶終端上的Motion-JPEG芯片或服務(wù)器自動地添加到每幀圖像的數(shù)據(jù)流上,形成一個基本標(biāo)簽,它們不需要用戶直接輸入。在這個標(biāo)簽的基礎(chǔ)上,系統(tǒng)還可以通過對圖像進(jìn)行其他更詳盡的描述來對其進(jìn)行精確注解,比如通過事件的描述來形成一種暗示、一種專門的符號來代表某一特殊的圖像類別,等等這種描述的添加可通過下面二種方法共同實(shí)現(xiàn)。
第一種方法是通過用戶界面,比如系統(tǒng)提供一個對話窗讓用戶去對某一特定幀(或某一段)圖像輸入簡短描述來進(jìn)行自定義。另一種方法是通過在強(qiáng)大的中央服務(wù)器上加入先進(jìn)的圖像分析算法,從而對每一幀圖像進(jìn)行分析而自動地產(chǎn)生事件描述,比如,有藍(lán)天、白雪和一個滑雪人的戶外場景形成運(yùn)動暗示。操作人員可以對自動產(chǎn)生的標(biāo)簽進(jìn)行確認(rèn)。
用戶可以通過發(fā)出檢索圖像標(biāo)簽的指令來獲取圖像。這種簡單的索引技術(shù)允許每一位用戶任意搜尋和隨機(jī)讀取他感興趣的某個視頻片段或某一幀圖像。
當(dāng)然,系統(tǒng)也可以通過其他方式對圖像進(jìn)行更形象和確切的描述來豐富標(biāo)簽的內(nèi)容,不僅僅限于以上舉例所列,這都是本系統(tǒng)的功能所在。
本發(fā)明闡述的系統(tǒng)之所以能提供對每一幀圖像進(jìn)行注釋的能力歸功于其對Motion-JPEG壓縮編碼的使用和擴(kuò)展。此外,每一個客戶多媒體終端上也可配置多個Motion-JPEG芯片來進(jìn)行平行處理,從而可以加快視頻流的編碼。這樣能充分使用寬頻網(wǎng)絡(luò)的能力。換句話說,系統(tǒng)將不會因?yàn)榭蛻舳嗝襟w終端機(jī)處理數(shù)據(jù)太慢而減慢速度。
對照現(xiàn)有技術(shù)本發(fā)明的優(yōu)點(diǎn)在于此發(fā)明闡述的系統(tǒng)并不要求終端有很強(qiáng)的運(yùn)算能力,更重要的是,它提供了對多媒體視頻流中任何一幀圖像進(jìn)行索引和隨機(jī)檢索的功能。因?yàn)橄到y(tǒng)使用Motion-JPEG壓縮技術(shù)來進(jìn)行視頻流編碼,所以該系統(tǒng)能被很快的建立起來,而且它只需要較低的成本、消耗較少的計(jì)算資源,在維護(hù)方面要求也不高。雖然此低成本系統(tǒng)在數(shù)據(jù)壓縮方面不一定最有效,然而,整個系統(tǒng)的寬頻能力使這個問題得到緩解。
圖1是本發(fā)明實(shí)施例的圖形說明。以下是圖1中各部分的附圖標(biāo)記10 中央服務(wù)器15 寬頻主鏈網(wǎng)絡(luò)20 客戶多媒體終端機(jī)30 直接乙太網(wǎng)絡(luò)連接40 ADSL路由器50 IDSN接口60 本地區(qū)域網(wǎng)絡(luò)70 防火墻80 本地服務(wù)器
具體實(shí)施例方式
圖1顯示一個完整的從終端到終端的系統(tǒng),此系統(tǒng)可提供多媒體索引和隨機(jī)檢索。一個強(qiáng)大的中央服務(wù)器10就可提供在寬頻主鏈網(wǎng)絡(luò)15上運(yùn)作的整個多媒體服務(wù)系統(tǒng)??蛻舳嗝襟w終端機(jī)20能以不同方式連接到寬頻主鏈網(wǎng)絡(luò)。如圖所示,客戶多媒體終端機(jī)能經(jīng)過乙太網(wǎng)30直接連接到寬頻主鏈網(wǎng)絡(luò),或者客戶多媒體終端機(jī)能經(jīng)過ADSL路由器40和電話線連接到寬頻主鏈網(wǎng)絡(luò),或者客戶多媒體終端機(jī)能經(jīng)過IDSN調(diào)制器50和電話線連接到寬頻主鏈網(wǎng)絡(luò)。一個客戶多媒體終端機(jī)可以是多種格式的。例如,一個客戶多媒體終端機(jī)可能是有一臺攝像頭連接一個個人計(jì)算機(jī),或者說一個客戶多媒體終端機(jī)也可能就是一臺攝像頭。
在其他的情況,多個客戶多媒體終端機(jī)可連接成一個本地區(qū)域網(wǎng)絡(luò)60,然后通過防火墻70連接到寬頻主鏈網(wǎng)絡(luò)15。通常情況下,該本地網(wǎng)絡(luò)往往有一個本地服務(wù)器80來服務(wù)于本地區(qū)域網(wǎng)絡(luò)。這樣的本地服務(wù)器一般都有強(qiáng)大的計(jì)算和存儲功能。如進(jìn)行多媒體內(nèi)容的集成,或?qū)崿F(xiàn)一個由中央服務(wù)器指定的搜尋請求。一個本地區(qū)域網(wǎng)絡(luò)也能專注于數(shù)據(jù)儲藏和作為網(wǎng)絡(luò)附屬貯藏庫來運(yùn)行。
中央服務(wù)器是系統(tǒng)的中樞,它對來自客戶多媒體終端機(jī)的多媒體內(nèi)容進(jìn)行集成并按照來自客戶多媒體終端機(jī)的要求完成內(nèi)容搜索和反饋。這樣一來,本發(fā)明闡述的系統(tǒng)能提供一個用于網(wǎng)絡(luò)中任何點(diǎn)與點(diǎn)之間的多媒體通訊。
雖然此發(fā)明通過上面特定描述來闡述,但對于熟悉本領(lǐng)域的人員而言可容易地實(shí)現(xiàn)另外的優(yōu)點(diǎn)和進(jìn)行修改。因此在其最廣泛的方面本發(fā)明并不限于特定的細(xì)節(jié)、代表性的設(shè)備和這里示出與描述的圖示示例,因此在不背離附及等同范圍所限定的一般的概念的精神和范圍的情況下可進(jìn)行各種修改。
權(quán)利要求
1.一種多媒體索引和隨機(jī)檢索系統(tǒng),特別是在寬帶視頻服務(wù)方面提供索引和隨機(jī)檢索功能的系統(tǒng)。該系統(tǒng)包括(a)一個寬頻主鏈網(wǎng)絡(luò);和(b)一個中央服務(wù)器;和(c)一個或多個至少有一枚內(nèi)置的Motion-JPEG芯片的客戶多媒體終端機(jī)。
2.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)經(jīng)過乙太網(wǎng)絡(luò)直接連接到寬頻主鏈網(wǎng)絡(luò)。
3.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)經(jīng)過ADSL路由器和電話線連接到寬頻主鏈網(wǎng)絡(luò)。
4.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)經(jīng)過ISDN接口和電話線連接到寬頻主鏈網(wǎng)絡(luò)。
5.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)是在設(shè)有防火墻的本地區(qū)域網(wǎng)絡(luò)內(nèi)。
6.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)是在設(shè)有防火墻和本地服務(wù)器的本地區(qū)域網(wǎng)絡(luò)內(nèi)。
7.在要求1的系統(tǒng)中,客戶多媒體終端機(jī)是一個存儲庫系統(tǒng)。
8.在要求1的系統(tǒng)中,中央服務(wù)器對來自客戶多媒體終端機(jī)的多媒體內(nèi)容進(jìn)行集成。
9.在要求1的系統(tǒng)中,中央服務(wù)器按來自客戶多媒體終端機(jī)的要求完成內(nèi)容搜索和反饋。
10.在要求6的系統(tǒng),本地服務(wù)器對來自客戶多媒體終端機(jī)的多媒體內(nèi)容進(jìn)行集成并發(fā)送給中央服務(wù)器。
11.在要求6的系統(tǒng),本地服務(wù)器按來自中央服務(wù)器的要求完成內(nèi)容搜索和反饋。
全文摘要
一個多媒體索引和隨機(jī)存取系統(tǒng),特別是一個在寬帶視頻服務(wù)方面提供索引和隨機(jī)檢索功能的系統(tǒng)。它由一個寬頻主鏈網(wǎng)絡(luò),一個中央服務(wù)器和多個至少有一枚內(nèi)置的Motion-JPEG芯片的客戶多媒體終端機(jī)組成。該系統(tǒng)通過中央服務(wù)器和用戶終端機(jī)對圖像加入標(biāo)簽并通過中央服務(wù)器對來自客戶終端機(jī)的多媒體內(nèi)容進(jìn)行集成或者按照來自客戶多媒體終端機(jī)的要求完成內(nèi)容搜索和反饋,來完成在多媒體視頻流程中為任何一幀圖像提供隨機(jī)索引,實(shí)現(xiàn)圖像的隨機(jī)獲取。
文檔編號G06F15/163GK1367449SQ0210027
公開日2002年9月4日 申請日期2002年1月15日 優(yōu)先權(quán)日2002年1月15日
發(fā)明者俞青, 金兆瑋, 薛天雄, 張輝 申請人:北京中星微電子有限公司