專利名稱:流媒體中加入廣告信息的方法與系統(tǒng)的制作方法
技術領域:
本發(fā)明涉通信領域,尤其是一種在流媒體中加入廣告信息的方法,所述廣告信息包括廣告、關于視音頻內(nèi)容的介紹信息等。
背景技術:
在做廣告時,最好是把廣告對準適當?shù)臐撛诳蛻羧海皇呛翢o選擇地向一般公眾投放廣告。如果,已知某個用戶正在觀看某一個具體的電視內(nèi)容,就可以假設該用戶對該部分視音頻內(nèi)容感興趣,可以推知該用戶很有可能對該部分視音頻內(nèi)容的相關內(nèi)容也感興趣,如果在這種假設關系下,對用戶推送和正在播放視音頻節(jié)目內(nèi)容相關的廣告無疑是用戶最有可能接收的廣告形式。
盡管這種理念在現(xiàn)有的模擬和數(shù)字電視上都有體現(xiàn),但是缺發(fā)自動快捷的手段來完成這一復雜的工作。隨著因特網(wǎng)的廣泛應用,廣告商們已經(jīng)像目前在電視上宣傳她們的產(chǎn)品和服務一樣利用因特網(wǎng)來宣傳他們的產(chǎn)品和服務。在特定的Web網(wǎng)站或視頻網(wǎng)站上,雖然有許多廣告都是針對網(wǎng)站的主題的,但是在通用網(wǎng)站上的廣告標題多半?yún)s是無目標的,因此是低效率的、投放效果往往也不理想,在視頻網(wǎng)站上廣告更是和視頻內(nèi)容毫無關系,通常采用插播的方法在一頭一尾插播視頻廣告。
授予Alberts的題目為“標題廣告顯示系統(tǒng)以及廣告頻繁度控制方法”的美國專利第5937392號,試圖將廣告具體瞄準尋求某種類型信息的用戶來緩解無目標的廣告宣傳問題。例如,用戶在黃頁上或在搜索引擎上尋找“計算機”時,該用戶可接收到計算機生產(chǎn)廠商所作的有針對性的廣告,同理,廣告也可以針對某一具體地理區(qū)域的用戶等等。
授予Merriman等人的題目為“經(jīng)由網(wǎng)絡發(fā)送、對準和測量廣告的方法”的美國專利第5984061號,公開了一種經(jīng)由因特網(wǎng)、基于對個人用戶進行數(shù)據(jù)跟蹤為廣告發(fā)送定位的裝置。
授予Simmons的題目為“用于給接入廣域計算機網(wǎng)的外部計算機分配布告的系統(tǒng)的方法”的美國專利第5974451號基于某一用戶對信息的具體請求通過因特網(wǎng)發(fā)布廣告。
授予Angles等人的題目為“在交互的通信網(wǎng)絡中發(fā)送定制廣告的系統(tǒng)和方法”的美國專利第59334811號,基于用戶的消費能力或特征,通過因特網(wǎng)將定制廣告發(fā)送給用戶。
最后,授予諾基亞的題目為“選擇性媒體流廣告技術”的中國專利第CN00817788號,基于視音頻內(nèi)容的實時的廣告加入系統(tǒng),通過對語音、視頻、文字的識別,產(chǎn)生廣告頁,并加到數(shù)據(jù)流中轉發(fā)給用戶。這個廣告過程是一個發(fā)現(xiàn)即發(fā)布的過程,是一種實時的廣告系統(tǒng),匹配的廣告信息沒有經(jīng)過存儲和加工的過程直接向用戶發(fā)布。這需要廣告系統(tǒng)有很強的信息識別處理能力,并且需要強大的數(shù)據(jù)庫和算法支持,當廣告資源不斷擴大的時候,該套系統(tǒng)將很難支持龐大的運算量。如果發(fā)布廣告不能及時,則失去了和內(nèi)容相關的廣告價值。而且該專利的廣告信息是通過加載到媒體流中的方式發(fā)送到用戶一側,往往需要媒體傳輸協(xié)議的支持,也沒有做到內(nèi)容和服務分離的要求。而且作為圖像識別這一功能,由于現(xiàn)在對視頻圖像的識別尚處于研究階段,沒有一款產(chǎn)品可以保證對任何對象的識別功能,因此該專利在現(xiàn)實中很難應用。并且該專利只考慮了廣播這一種流媒體播放手段,而沒有考慮點播的情況。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種流媒體中加入廣告信息的方法與系統(tǒng),以解決現(xiàn)有技術中不能針對用戶需要的潛在內(nèi)容和廣告的相關性而設計廣告的問題。
本發(fā)明的目的是將廣告內(nèi)容或廣告內(nèi)容鏈接加載到現(xiàn)有的媒體文件上,現(xiàn)有的媒體文件通常保存在流媒體服務器或?qū)S械拇鎯υO備中,這些媒體文件包括視音頻文件或Flash等可以通過流的方式傳輸?shù)奈募?。在加入廣告時,考慮把廣告和現(xiàn)有媒體文件的內(nèi)容關聯(lián)起來,所以需要對現(xiàn)有媒體文件作關聯(lián)性處理,例如,用戶在看足球比賽的時候,可以推出球衣和球鞋的廣告。處理的步驟如下首先,整理分類所有的廣告信息,把每一條廣告信息抽象出關鍵的廣告關鍵詞、廣告語音記錄、廣告中產(chǎn)品的形象和商標等等。例如,可口可樂的廣告,對應在食品→飲料→軟飲料的目錄之下,廣告關鍵詞是可口可樂(或Coca-Cola)、記錄下可口可樂的發(fā)音(如中文、英文或其它地區(qū)語言發(fā)音等)、記錄下可口可樂的商標和其典型的包裝外形的圖像資料。在相同的軟飲料目錄下保存有類似的產(chǎn)品例如百事可樂、非常可樂等的和可口可樂相似的廣告條目。此類廣告條目還可以擴展,例如專門的廣告詞“我能”或任何和廣告條目有關的信息都可以根據(jù)實際需要加入到廣告條目中,這樣可以提高在搜索現(xiàn)有流媒體文件內(nèi)容尋求匹配時,擴大匹配的命中率,從而加入更多的廣告信息,也增加了流媒體本身的廣告價值。以上的操作通常要借助數(shù)據(jù)庫系統(tǒng)來完成,最終一條廣告條目通常包含圖像部分、語音部分、文字部分中的一種或多種,廣告條目中的多數(shù)信息是為了在搜索和(或)添加媒體廣告信息時作相似性判定的,在廣告信息中還會保留廣告的鏈接信息(鏈接到真實的廣告位置)或針對廣告產(chǎn)品的真實廣告內(nèi)容,包括視音頻、動畫、圖像、文字等。
其次,在擁有了這樣的廣告分類信息以后,就需要對現(xiàn)有的流媒體文件進行處理了。在處理流媒體文件的時候,使用內(nèi)容分析模塊,該模塊將從流媒體文件中分離出三種流,即視頻流、音頻流和字符流,然后對這三種流進行分析,利用人工識別、圖像自動識別等技術來和廣告信息中的搜索信息欄中的圖像信息作比較,并在流媒體文件中視頻的適當位置加入廣告信息,加入的方法是生成流媒體的廣告描述文件(profile)。采用類似的方法,使用內(nèi)容分析模塊通過對音頻流和字符流的分析,加入廣告信息。廣告的信息主要是指廣告的內(nèi)容位置,既可以是具體的內(nèi)容在存儲介質(zhì)中的物理位置,也可以是一個網(wǎng)絡中的抽象位置。廣告信息可以是任何形式的媒體內(nèi)容。
最后,將流媒體文件和流媒體經(jīng)過處理后生成的廣告描述文件一起發(fā)送到用戶。用戶通過播放設備播放流媒體文件,并且通過軟件方式讀取所播放流媒體的廣告描述文件,根據(jù)廣告描述文件的描述來播放廣告。
與現(xiàn)有技術相比,本發(fā)明具有以下優(yōu)點廣告形式對用戶更加友好,廣告對于用戶來說可能就等于用戶所需要的內(nèi)容。而且大大改善了廣告投放效果,同時也可以根據(jù)用戶以往觀看廣告的行為,對用戶更加精確地投放廣告。
本發(fā)明實施例中,針對用戶需要的潛在內(nèi)容和廣告的相關性而設計廣告,采用對用戶推送和正在播放視音頻節(jié)目內(nèi)容相關的廣告形式,并能根據(jù)用戶以往行為,對用戶進行精確的廣告投放。
從以下實施例的詳細說明并結合附圖閱讀,就可以對發(fā)明的上述說明有更好的理解。雖然以上和以下的文字或圖解說明重點在于說明本發(fā)明的示范實施例,但是,顯然這僅是作為圖解說明和示范例,本發(fā)明并不僅限于此。
圖1為本發(fā)明系統(tǒng)結構示意圖;圖2為本發(fā)明廣告描述文件生成和使用示意圖;圖3為本發(fā)明將廣告加入流媒體文件并發(fā)送給用戶端的流程圖;圖4為本發(fā)明廣告分類存儲信息結構示意圖;圖5為本發(fā)明內(nèi)容分析模塊原理示意圖;
圖6為本發(fā)明用戶播放設備內(nèi)部的流程示意圖;圖7為本發(fā)明廣告存儲服務器內(nèi)部流程示意圖;圖8為本發(fā)明在廣告存儲服務器中擴展廣告搜索信息流程示意圖;圖9為本發(fā)明用戶播放設備播放窗口示意圖;圖10為本發(fā)明用戶請求索引示意圖。
具體實施例方式
下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
本發(fā)明的基本構思為在為視頻或音頻等媒體文件加入廣告時,通過對所有廣告采取分類、搜索信息提取的方法建立一個廣告分類存儲信息。然后采用人工識別或自動識別或同時運用以上兩種方法來識別媒體文件中的圖像、聲音、文字部分,并把識別出來的結果和現(xiàn)有的廣告分類信息作匹配,把匹配成功的部分生成廣告描述文件,該文件記錄有提取廣告的位置、播放的時間或在某些幀播放、以及廣告的區(qū)域等信息。最后把廣告描述文件和流媒體文件傳送給用戶播放設備,用戶在播放流媒體文件的時候,通過軟件提取出廣告描述信息,并在設定的位置和時間播放與內(nèi)容相關的廣告。
如圖1所示,本發(fā)明系統(tǒng)結構示意圖,本實施例描述了本發(fā)明可能的一種系統(tǒng)結構。流媒體存儲服務器110的作用是存儲流媒體文件,所述流媒體文件指可以通過流的方式傳輸?shù)奈募Y構,但不僅限于流的方式,因為本系統(tǒng)非實時系統(tǒng),即必須先生成廣告描述文件,然后才能在播放的時候被用戶激活加入廣告,因此非流方式存儲的媒體文件同樣適用于本發(fā)明。這些常見的流媒體文件包含WMV(Windows Media Video,窗口媒體視頻)/Mpeg(Moving Picture Expert Group,移動圖片專家組)2/Mpeg4/H.264或者更先進的編碼格式等。內(nèi)容分析模塊或服務器120可能是一個單獨的設備或者就是一個和流媒體文件放在一起的功能模塊,除圖1外均用內(nèi)容分析模塊表述,主要功能就是結合廣告分類存儲信息210和流媒體文件本身的內(nèi)容產(chǎn)生出一個廣告描述文件230(圖1中沒有出現(xiàn)210和230,應該在圖2中)。廣告分類存儲信息通過廣告存儲服務器140中生成,廣告存儲服務器140用于存儲所有的廣告信息。推送服務器130把流媒體文件以及所述流媒體文件對應的廣告描述文件通過網(wǎng)絡傳輸150推送到用戶播放設備。推送服務器130可以分別推送流媒體文件和該流媒體文件220的廣告描述文件230,也可以同時推送。同時,推送服務器130是一個可選設備,該功能可能由流媒體存儲服務器等流媒體服務器代替。需要注意的是只要將流媒體文件和該流媒體文件對應的廣告描述文件最后推送到用戶播放設備即可。網(wǎng)絡傳輸150可以是任何傳輸媒體文件的網(wǎng)絡,例如基于IP或ATM(Asynchronous Transfer Mode,異步傳輸模式)的網(wǎng)絡結構等,網(wǎng)絡傳輸150在系統(tǒng)中是一個抽象概念,泛指抽象,并不對應某一具體的網(wǎng)絡傳輸設備。用戶播放設備190包括PC160、移動終端170和固定終端180等,用戶媒體播放設備在不斷的變化和融合,因此用戶播放設備不限于此,只要是能夠通過網(wǎng)絡(包括有線或無線)連接,播放流媒體文件的設備均在該播放設備之列。固定終端180指通過機頂盒加電視來播放流媒體文件的模式。用戶播放設備190在播放流媒體文件時,需要同時解析廣告描述文件230,然后更具廣告描述文件的內(nèi)容取回在廣告存儲服務器140存儲的廣告信息。廣告存儲服務器并不限于某一臺具體的服務器,而是任何可以向用戶提供廣告的服務設備,當然在這種情況下,廣告分類存儲信息210必須反應出所有廣告存儲服務器的廣告信息。
在圖2中,流媒體文件220先是被存儲在流媒體存儲服務器110中,廣告分類存儲信息210由廣告存儲服務器140產(chǎn)生,并將廣告分類存儲信息210存放在內(nèi)容分析模塊120中,通過流媒體存儲服務器和內(nèi)容分析模塊協(xié)同處理,產(chǎn)生出廣告描述文件230,廣告描述文件和產(chǎn)生該廣告描述文件的流媒體文件一一對應,并一同被送往用戶播放設備190。通過內(nèi)容分析模塊的處理之后,每一個流媒體文件都會和一個廣告描述文件對應,也可能一個流媒體文件和多個廣告描述文件對應,原因是由于不同的用戶可能會有不同的廣告需求,因此為不同的用戶配置不同的廣告描述文件將會改善用戶收看廣告的效果。但在本發(fā)明實施例中重點討論通過內(nèi)容相關性生成廣告描述文件的方法,因此一個媒體文件對應多個廣告描述文件的方法不在本發(fā)明討論范圍之內(nèi)。在一些特殊的情況下,用戶取回廣告信息240的廣告存儲服務器140和產(chǎn)生廣告分類存儲信息的廣告存儲服務器不是同一個服務器,特別是廣告采用分布式存儲或鏡像技術存儲的時候。在實際應用中內(nèi)容分析模塊有可能作為內(nèi)容分析服務器的形式出現(xiàn),或作為內(nèi)容分析模塊出現(xiàn)在處理流媒體文件內(nèi)容的服務器中,如流媒體存儲服務器或推送服務器。由內(nèi)容分析模塊產(chǎn)生的廣告描述文件可以和流媒體文件存儲在同一服務器或采用專門的廣告描述服務器進行存儲。
如圖3所示,本圖為本發(fā)明將廣告加入流媒體文件并發(fā)送給用戶端的流程圖。包括以下步驟310,在處理流媒體文件時,首先需要打開流媒體文件,打開的方式可以為直接在流媒體存儲服務器110打開或者通過客戶端/服務器的方式在遠端打開流媒體文件。
320,提取出視頻/音頻/字符文件。其中,提取出視頻、音頻、文字的方法有以下兩種,第一種是提取出媒體文件中的視頻、音頻和文字信息構成三個獨立的文件,包括視頻文件、音頻文件、字符文件,然后分別對這三個文件進行處理;第二種是從流媒體文件中提取出視頻流、音頻流和字符流,然后分別對這三種流進行處理。把從流媒體文件中提取的三種文件或三種流通過內(nèi)容分析模塊120進行處理。
330,判斷在流媒體文件中所提取的視頻、音頻、字符是否和廣告信息匹配,如果是則轉步驟340;如果否則繼續(xù)分析是否存在和廣告信息匹配的視頻、音頻和字符。
340,在廣告描述文件中加入廣告信息。
350,最終把廣告描述文件發(fā)送到用戶端進行解析,這個過程通常伴隨著流媒體文件發(fā)送到用戶端的行為而發(fā)生。用戶端在獲得廣告描述文件以后,通過廣告描述解析器解析廣告描述文件,并更具廣告描述文件的內(nèi)容取回在廣告存儲服務器的廣告信息,然后播放廣告文件。播放的方式一般以輔助畫面為主,不影響用戶正在收看的流媒體內(nèi)容。在屏幕上播放廣告信息的位置可以是任意的,也可以是活動的,例如漂移廣告。
圖4為廣告分類存儲信息210結構示意圖,Index410為廣告分類存儲信息的序號或ID號,可以用來識別不同的廣告信息條目。分類信息420是一種對廣告信息進行分類分級存儲的方法,通過這種方法可以把任何一種廣告對象歸于一個完整的分類信息中,這種方法有兩個好處,可以通過分級索引的方法找到具體廣告對象在廣告分類存儲信息230中的位置或區(qū)域位置,還可以在同級或臨級索引找到類似廣告對象的廣告信息。利用這一分級索引方法,可以向用戶推送相關廣告信息,例如,可口可樂的四級索引是碳酸,因此可以通過查找四級索引為碳酸的對象還有百事可樂,可見百事可樂和可口可樂有很強的相關性,這種相關性在將來為用戶推送廣告的時候就可以被使用,推送相同或相近的和內(nèi)容相關的產(chǎn)品同樣容易被用戶所接收。分類信息420即廣告分類索引,其主要作用是通過廣告分類索引的方法存儲廣告可以很好的表現(xiàn)出廣告之間的相關性,例如,可口可樂和百事可樂同屬4級的碳酸飲料,因此相關性也就最高,也可以說相關度最高。這里相關度就是通過分級的概念來劃定的,例如,圖4中從四級到一級相關性逐漸減小。并且定義相關性高的廣告為相關廣告。根據(jù)相關性原理,自身的相關性最高,如,可口可樂和可口可樂相關性最高。
在圖4中,搜索信息430是本專利的重點,對應于可從流媒體文件中提取的視頻、音頻和字符信息同樣分為可對應的三類圖像432、聲音431、文字433。圖像432記錄的信息包括廣告的商標、廣告產(chǎn)品的外形或重要特征或標志、廣告產(chǎn)品相關的一些圖像信息,如果廣告產(chǎn)品的產(chǎn)地或相關人物形象等等,只要和廣告產(chǎn)品相關聯(lián)的圖像均可作為搜索信息記錄在圖像432一欄中。同樣對于聲音的記錄包括廣告產(chǎn)品名稱的讀音,廣告詞讀音,和廣告相關的地名或人名的讀音等任何和廣告產(chǎn)品相關聯(lián)的聲音記錄。搜索信息430中文字433通常和聲音431具有某些相關性,文字433的記錄包括產(chǎn)品名稱、廣告詞、相關的人名或地名等任何與產(chǎn)品相關的文字。聲音和文字的這種相關性在和流媒體內(nèi)容中語音或字符作匹配時也會體現(xiàn)出來,例如文字為流媒體文件的字幕形式,則此時文字和聲音具有很高的相關性。搜索信息430,通常需要對廣告信息作細致的處理,并有可能加入很多人工采集的信息以完善搜索信息的不足。搜索信息將為每一條廣告條目提供盡可能多的相似關系,這種相似關系越充分,將越容易在流媒體內(nèi)容中找到匹配的位置,也就能更多的插入廣告信息。440為位置/屬性欄,該欄包括鏈接和內(nèi)容兩個子欄目,鏈接子欄提供提取廣告信息的位置信息,如可口可樂需要通過某一個具體的HTTP地址取得,這種鏈接的位置可以是在遠端或就在用戶機器本地。內(nèi)容子欄主要是標明廣告條目自身的屬性,如視頻廣告、音頻廣告、圖片廣告、文字廣告等任何一種廣告形式。有了廣告分類存儲信息,就可以為內(nèi)容分析模塊120為內(nèi)容找到準確的廣告信息提供了可能。
這里規(guī)定圖像、聲音、文字為標志性搜索信息,但有些廣告文件只包括圖像、聲音、文字中的一種或兩種,如,一個廣告只包含一張圖片,即圖像信息。這就會造成搜索信息的不充分,為了解決這個問題,就需要在補充搜索信息,盡可能達到圖像、聲音、文字信息都有,增加了可供匹配信息的容量,這樣可以在搜索時大大提高流媒體文件內(nèi)容與廣告內(nèi)容匹配的命中率,例如,在一個可口可樂廣告只包含可口可樂的宣傳圖片,就可以在搜索信息中添加可口可樂的讀音和“可口可樂”文字作為標志性搜索信息。在很多情況下,如果搜索信息內(nèi)容不充分,往往需要添加來自廣告信息之外的與廣告內(nèi)容相關的聲音、圖像、文字信息,添加的內(nèi)容可以來自該廣告產(chǎn)品的網(wǎng)站,對于聲音也可以人工錄制聲音或來自網(wǎng)絡剪輯。
圖5為內(nèi)容分析模塊原理示意圖,從流媒體文件220中提取出視頻流510、音頻流520、字符流530并把這三種流輸入到內(nèi)容分析模塊120中。視頻流510和廣告分類存儲信息210中搜索信息430的圖像432欄信息以及位置/屬性440同時進入視頻分析模塊540,這里輸入的是廣告分類存儲信息210中搜索信息欄中所有的圖像欄信息,即所有可能的與廣告有關的圖像信息全部輸入到視頻分析模塊540中,而每一條圖像432記錄都會與一條廣告的位置/屬性440記錄對應起來。這里需要注意的是,在實際應用中搜索信息430欄中的每一個子欄,例如圖像子欄,和位置/屬性記錄的對應關系可以是多對一,一對一,一對多三種可能。視頻分析模塊提取出視頻流510中每一幀并分析是否存在和廣告分類存儲信息210中搜索信息430的圖像432欄記錄下來的信息有匹配或部分匹配的情況,如果有則和圖像廣告對應的位置/屬性440一起生成一部分信息碼加入廣告描述文件230中。加入的信息碼可以是以下格式視頻中幀的位置或區(qū)域值時間鏈接廣告內(nèi)容格式打開位置其中幀的位置或區(qū)域值是為了標明加入廣告的位置在整個視頻中的位置,如第幾幀或某一個幀的區(qū)域值。時間參數(shù)可以是起始到結束時間。鏈接為廣告存放的地址信息,廣告內(nèi)容格式是指廣告是圖像還是聲音或其它格式,在位置/屬性440欄中得到。打開位置則是根據(jù)廣告屬性(在位置/屬性中獲取)設定打開的位置和打開的方式,如果在右上角用MediaPlayer軟件打開等。
該格式也是構成廣告描述文件的主要方式。
同樣的方法,音頻流520連同所有聲音431記錄和聲音記錄關聯(lián)的位置/屬性440一起輸入音頻分析模塊。如果在音頻流中發(fā)現(xiàn)了和聲音431記錄相同或相似的部分,則生成一部分信息碼加入廣告描述文件230。信息碼產(chǎn)生過程以及信息碼格式和視頻分析模塊產(chǎn)生信息碼的過程和信息碼格式類似。
同樣,字符流530連同所有文字433記錄和文字記錄關聯(lián)的位置/屬性440一起輸入字符分析模塊。如果在字符流中發(fā)現(xiàn)了和文字433記錄相同或相似的部分,則生成一部分信息碼加入廣告描述文件230。信息碼產(chǎn)生過程以及信息碼格式和視頻、音頻分析模塊產(chǎn)生信息碼的過程類似,信息碼格式也類似,為視頻中幀的位置或區(qū)域值時間鏈接廣告內(nèi)容格式打開位置所述信息碼只是廣告描述文件中一個重要組成部分,廣告描述文件可以有標準的標記語言格式,類似于XML或XSL。信息碼表達格式,只是一種抽象的文字表述,概括了信息碼的主要元素,這些元素可以作適當?shù)脑黾踊騽h減,例如,幀的位置和時間往往有內(nèi)在的對應關系,知道在第幾幀取回廣告和在某一個固定時刻取回廣告都可以達到相同的效果,因此只取幀位置或時間兩者之一也能正常工作。同樣也可以更具需要添加一些新元素,如廣告主信息,播放器信息,加密或DRM信息等等。信息碼中元素的順序也不是固定的,可以根據(jù)需要調(diào)整元素之間的排列順序。對于信息碼使用的語言可以使用類XML(可擴展標簽語言)或XSL(可擴展樣式語言)。信息碼也可以采用加密格式或二進制格式。
在視頻和音頻分析模塊中分析視音頻的有幾種模式第一種,人工識別模式。現(xiàn)階段的圖像識別技術還無法做到對廣義任何對象物體進行識別,智能利用建模對一些特殊對象進行識別,例如,人臉識別。因此在現(xiàn)階段引入人工識別廣告對象無疑是一種比較簡單使用的方法。人工識別對象時,需要人工檢查每一幀是否存在和廣告信息匹配或相似的圖像內(nèi)容,如,已知存在廣告信息中有可口可樂,當工作人員在視頻某一位置發(fā)現(xiàn)有可口可樂標志或產(chǎn)品時,就可以在這一位置插入廣告的位置/屬性440信息,并結合位置或時間信息生成廣告描述文件230。該位置可以是具體的某幀或幀內(nèi)某個具體位置。這個時候搜索信息中圖像432欄信息可以省略或作為人工檢查時候的參考。
采用人工識別模式分析音頻的方法和視頻類似,只是存在是使用人類聽覺還是使用視覺來辨別是否存在廣告信息的區(qū)別。
第二種,自動識別。對于聲音的識別現(xiàn)在技術已經(jīng)比較成熟,只要把搜索信息430中的語音提取出來,然后進行識別訓練,可以得到很高的識別準確率。語音自動識別的市售產(chǎn)品有VoiceTone、Nuance OSR、ViaVoice、e-talk等,這些產(chǎn)品都有很強的語音識別功能,只需要把這些產(chǎn)品和語音分析模塊相結合就可以準確的實現(xiàn)對語音的識別功能。對于圖像識別也可以使用一些現(xiàn)有的市售產(chǎn)品,例如,Excalibur Technologies、Mediasiteand Virage等。對于視頻的識別處理過程和音頻識別處理過程相似。在作自動識別的時候,往往存在相似性判斷問題,通常是通過設定相似參數(shù)來解決這個問題。
在字符分析模塊作字符流分析的時候,可以很精確的對搜索信息中文字433欄信息作精確的匹配或相似匹配,把匹配成功的位置加上位置/屬性440一起生成信息碼放入廣告描述文件。在一些情況下,音頻流520和字符流530具有很高的相關性,如字符流為字幕文件和音頻流高度匹配,這個時候只需要對字符流進行分析,生成信息碼加入廣告描述文件就可以了。
如圖6所示,展示了用戶播放設備190內(nèi)部的流程。用戶播放設備通過流媒體解碼模塊610對流媒體文件進行解碼,并把解碼之后的視頻通過視頻窗口展現(xiàn)在用戶面前。同時,廣告描述文件解析模塊620解析接收到的廣告描述文件230,廣告操作模塊630主要是執(zhí)行廣告描述文件中描述的功能,例如在某一時間或某一幀的位置,在某臺廣告存儲服務器取回廣告,并在用戶播放設備的播放窗口上的某一個位置播放該廣告。播放廣告的窗口可以是播放流媒體文件的窗口,這是需要暫停流媒體文件的播放;也可以是在一個多窗口的環(huán)境下,流媒體播放和廣告播放各自有一個播放窗口;還可以是彈出一個廣告窗口的形式來播放廣告。廣告文件640通常是存儲在廣告存儲服務器中,在用戶需要廣告時,從廣告存儲服務器提取所需的廣告文件。
如圖7所示,是廣告存儲服務器140內(nèi)部的流程示意圖。廣告文件640通常會是一個數(shù)據(jù)庫存儲系統(tǒng),然后會把每個廣告文件提取出來放到廣告處理模塊710中,最后通過廣告處理模塊產(chǎn)生廣告分類存儲信息210。在廣告存儲服務器中還會存在一個廣告提取接口720,用戶播放設備通過和廣告提取接口進行通信,提取廣告文件,并在用戶播放設備上進行播放。
圖8為在廣告存儲服務器中擴展廣告搜索信息流程示意圖。擴展廣告所搜信息主要實在廣告處理模塊710中完成。實際上這是一種全新的搜索方法,該搜索方法的重點,不僅僅是要找出被搜索對象本身,而是要找出和和被搜索對象相關的信息。而該系統(tǒng)實際上只是所述新搜索方法中的一個實例,包括以下步驟810,首先通過廣告處理模塊710提取廣告描述文件。
820,判斷廣告信息是否充分,如果是充分的,則記錄在廣告分類存儲信息210中的搜索信息430中;如果不充分,則轉步驟830;830,增加廣告搜索信息,然后在繼續(xù)判斷廣告信息是否充分。最終把形成了廣告分類存儲信息送入廣告分析模塊。在判斷廣告信息是否充分的過程中,通常是一項一項的判斷,如,先判斷視頻或圖像信息,再判斷音頻信息,最后判斷文字信息。再增加廣告搜索信息時也可以采用這種一項一項的方法分類添加。當然也可以一起判斷一起添加。增加廣告搜索信息的方法,主要是盡可能多的補充缺失的關鍵信息,這里的關鍵信息包括圖像、聲音和文字三種。原因是任何廣告信息都可以用這三種中一種或多種概括。其中圖像包含連續(xù)的圖像,也就是視頻,還包含flash動畫、圖標等任何圖像相關的內(nèi)容。
圖9為用戶播放設備播放窗口示意圖,圖中包含主窗口910和子窗口920,該實施例子窗口920包含A、B、C三個子窗口,主窗口910通常是播放流媒體文件220的,而子窗口920通常是播放廣告文件640的。主窗口910中人物穿著了襯衫930、短褲940和鞋950,對應在廣告窗口會出現(xiàn)襯衫的廣告、短褲的廣告以及鞋的廣告。例如,在流媒體文件播放到主窗口910中畫面幀時,子窗口920會自動播放關于主窗口910中內(nèi)容相關的襯衫、短褲和鞋的廣告。圖9只是概念設計,在具體實現(xiàn)中,子窗口920和主窗口910的位置關系可以非常靈活,例如,子窗口在主窗口內(nèi),或者子窗口在主窗口某一側。如果需要,子窗口也可以和主窗口進行切換。這些均是現(xiàn)有技術,就不在這里具體描述。
圖10為用戶請求索引示意圖,該索引通常包含用戶1010、廣告對象1020、數(shù)量1030和優(yōu)先級1040等信息。首先需要生成用戶請求索引,即為每一個用戶建立點擊或收看廣告記錄,在圖10中,可口可樂就被點擊或收看了7次。在用戶請求索引建立以后,就可以根據(jù)用戶請求索引和廣告分類索引為用戶推送廣告服務了。
推送廣告的方式有兩種一種是以用戶為中心,向固定用戶推送廣告。當選定為A用戶推送廣告的時候,先檢索A用戶的所有點擊或收看過的廣告,并選出其中優(yōu)先級最高的或次高的廣告對象作為基準廣告,然后在廣告分類引索中查找基準廣告(如可口可樂)的位置,找到后根據(jù)廣告分類索引的特點選擇相關性高的廣告內(nèi)容,然后把相關的廣告內(nèi)容推送給A用戶。該方法中對于某一個固定的用戶基準廣告可能包括一個或多個該用戶曾經(jīng)關心過的廣告。
另一種是以廣告為中心,把一個廣告推送給所述廣告最容易接受的潛在用戶。如,獲得一個可口可樂廣告,需要推送給潛在的用戶。首先在廣告分類索引中查找和所要推送廣告的相關廣告,如在圖4中可以查到可口可樂、百事可樂等;然后到用戶請求索引中尋找相關廣告的對應用戶,再根據(jù)用戶請求索引中的優(yōu)先級從高到底找出對應用戶中優(yōu)先級高的用戶(如所有優(yōu)先級大于3的用戶),稱為目標用戶;最后,把所要推送的廣告推送給目標用戶。
優(yōu)先級P的計算方法通常為P=αX+βY+γZ其中P代表優(yōu)先級,α、β、γ代表待定的系數(shù),所述待定系數(shù)均可以為0,X表示用戶點擊或收看次數(shù),即關心次數(shù),Y表示廣告本身播出的附加值等播放廣告的收益,Z表示廣告播放時長等播放廣告的成本。廣告分類索引相關性則是在如圖4的分類信息中,從四級網(wǎng)上相關性不斷減小,這是根據(jù)分類的方法決定的,即在一級到四級分類時就不斷縮小分類區(qū)域。
最后應當說明的是以上實施例僅用以說明本發(fā)明的技術方案而非對其限制;盡管參照較佳實施例對本發(fā)明進行了詳細的說明,所屬領域的普通技術人員應當理解依然可以對本發(fā)明的具體實施方式
進行修改或者對部分技術特征進行等同替換;而不脫離本發(fā)明技術方案的精神,其均應涵蓋在本發(fā)明請求保護的技術方案范圍當中。
權利要求
1.一種在流媒體中加入廣告信息的方法,其特征在于,包括以下步驟打開并處理流媒體文件,在所述流媒體中加入和流媒體文件內(nèi)容相關的廣告信息,并生成廣告描述文件;將所述流媒體文件和廣告描述文件發(fā)送給用戶;用戶播放設備播放流媒體文件,并解析所述流媒體文件對應的廣告描述文件;用戶播放設備根據(jù)所述廣告描述文件取回廣告文件并播放廣告。
2.根據(jù)權利要求1所述的方法,其特征在于,所述在流媒體中加入和流媒體文件內(nèi)容相關的廣告信息,并生成廣告描述文件,包括以下步驟從所述流媒體文件中提取視頻和/或音頻和/或字符內(nèi)容,判斷所述內(nèi)容與廣告分類存儲信息中搜索信息是否相匹配,如果匹配則生成信息碼并加入廣告描述文件;如果不匹配則繼續(xù)搜索并判斷余下的視頻和/或音頻和/或字符內(nèi)容是否與廣告分類存儲信息中搜索信息是否相匹配;所述內(nèi)容相關包括圖像相關、聲音相關、文字相關中一種或多種相關性。
3.根據(jù)權利要求1所述的方法,其特征在于,所述廣告描述文件包括廣告文件存儲的位置、廣告文件播放的位置和廣告文件播放的時間中的一種或幾種;所述廣告文件播放的位置指在流媒體文件播放到具體某些幀時,播放廣告文件。
4.根據(jù)權利要求1或2所述的方法,其特征在于,在判斷流媒體內(nèi)容和廣告內(nèi)容相關性的時候,需要對流媒體文件進行圖像識別、聲音識別、文字識別中至少一種識別。
5.一種在流媒體中加入廣告的系統(tǒng),其特征在于,包括內(nèi)容分析模塊,用于分析流媒體文件內(nèi)容和廣告內(nèi)容相關性,包括用于存儲廣告分類存儲信息的數(shù)據(jù)庫,并與存儲流媒體文件服務器以及廣告存儲服務器相連接;廣告存儲服務器,用于存儲廣告信息,并與播放設備和內(nèi)容分析模塊連接;播放設備,用于在用戶端播放媒體文件同時解析廣告描述文件并能夠根據(jù)廣告描述文件提取廣告并播放,播放設備通過網(wǎng)絡傳輸與廣告存儲服務器和存儲流媒體文件以及存儲廣告描述文件的服務器或模塊相連接;流媒體存儲服務器,用于存儲流媒體文件,并與內(nèi)容分析模塊連接。
6.根據(jù)權利要求5所述方法,其特征在于,所述廣告描述文件和所對應的流媒體文件一同保存在同一服務器中或廣告描述文件和所對應的流媒體文件分別存儲在不同服務器中。
7.一種生成廣告描述文件的方法,其特征在于,包括以下步驟根據(jù)已存儲的每一個廣告內(nèi)容條目生成該廣告條目搜索信息,所述搜索信息包括聲音、圖像、文字;根據(jù)已存儲的每一個廣告內(nèi)容條目生成所述廣告條目的位置信息;通過所述搜索信息判斷流媒體文件內(nèi)容是否和所存儲的廣告內(nèi)容匹配,如果發(fā)現(xiàn)存在匹配關系,則將廣告的位置信息和流媒體匹配的位置或時間信息生成廣告描述文件。
8.根據(jù)權利要求7所述的方法,其特征在于,用戶端通過解析廣告描述文件,獲得與流媒體內(nèi)容相關的廣告信息。
9.根據(jù)權利要求7所述的方法,所述廣告描述文件包括類XML格式或類XSL格式腳本語言。
10.一種增加文件相關性搜索命中率的方法,其特征在于,包括以下步驟處理搜索文件,獲得搜索文件的標志性搜索信息;通過相關性處理擴大搜索文件的標志性搜索信息;用所述標志性搜索信息來搜索被搜索文件,判斷被搜索文件中是否存在和標志性搜索信息相匹配的信息。
11.根據(jù)權利要求10所述的方法,其特征在于,通過相關性處理擴大搜索文件的標志性搜索信息,包含以下步驟如果從搜索文件直接提取的所述標志性搜索信息只包含聲音、圖像、文字三者中的一種或兩種信息,則向搜索信息中添加缺失的聲音和/或圖像和/或文字信息。
12.根據(jù)權利要求11所述的方法,其特征在于,所述添加缺失的聲音和/或圖像和/或文字信息,包括來自所述文件之外的聲音、圖像、文字信息。
13.一種以用戶為中心向用戶推送相關廣告信息的方法,其特征在于,包括以下步驟在用戶請求索引中找到需要推送廣告信息的用戶,并根據(jù)所述用戶對所有該用戶訪問過的廣告的優(yōu)先級,選擇需要推送的基準廣告;根據(jù)基準廣告內(nèi)容,在廣告分類索引中尋找相關性高的相關廣告;將相關廣告投放給用戶并在用戶端播放。
14.一種以廣告為中心向潛在用戶推送廣告信息的方法,其特征在于,包括以下步驟獲得要推送的廣告信息,在廣告分類索引中找出相關廣告;在用戶請求索引中找到對所述相關廣告的對應用戶,再選擇優(yōu)先級較高的所述對應用戶作為推送廣告的目標用戶;將要推送的廣告推送給目標用戶并在用戶端播放。
全文摘要
本發(fā)明涉及一種在流媒體中加入廣告信息的方法和系統(tǒng),所述廣告信息往往和流媒體的內(nèi)容或傳播對象或傳播時間地點存在相關性,使用戶對廣告或輔助信息的內(nèi)容更容易接收。本發(fā)明需要對流媒體文件進行基于內(nèi)容的處理,添加更多的廣告信息,然后把經(jīng)過處理的媒體文件通過網(wǎng)絡發(fā)送給客戶。在添加廣告信息的時候,首先擴展現(xiàn)有廣告搜索信息并形成廣告分類存儲信息,再提取流媒體文件中的視頻、音頻及字幕內(nèi)容進行識別,如果發(fā)現(xiàn)存在廣告內(nèi)容和識別結果相吻合,則加入流媒體廣告信息,形成廣告描述文件,并最終和對應的流媒體文件一起發(fā)送到用戶端,用戶通過解析廣告描述文件,從廣告存儲服務器取回廣告信息并播放。
文檔編號H04N7/24GK101072340SQ20071012345
公開日2007年11月14日 申請日期2007年6月25日 優(yōu)先權日2007年6月25日
發(fā)明者孟智平 申請人:孟智平