欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

互聯網第三方媒體網站廣告監(jiān)控方法及系統的制作方法

文檔序號:6373965閱讀:177來源:國知局
專利名稱:互聯網第三方媒體網站廣告監(jiān)控方法及系統的制作方法
技術領域
本發(fā)明涉及廣告監(jiān)控技術,具體涉及互聯網第三方媒體網站廣告監(jiān)控方法及其系統。
背景技術
若某公司擁有或代理了大量的互聯網媒體網站的廣告資源,但是只擁有使用權而
沒有管理權,所以對于這些廣告資源的監(jiān)管能力是非常薄弱的?,F有的技術中,在沒有第三方媒體網站提供接口的情況下,因為廣告的抓取與識別的問題,還不能實現對廣告投放情況的自動監(jiān)控,也就是說,目前對廣告的監(jiān)控,還停留在人工監(jiān)控的階段。

發(fā)明內容
本發(fā)明在于提供一種互聯網第三方媒體網站廣告監(jiān)控方法及系統,其能解決現有技術不能對第三方媒體網站的廣告進行自動監(jiān)控的問題。為了達到上述目的,本發(fā)明所采用的技術方案如下
互聯網第三方媒體網站廣告監(jiān)控方法,其包括以下步驟
步驟A、對媒體網站的頁面內容進行采集,所述媒體網站的頁面內容的網址為廣告位所在的網址,媒體網站的信息及該媒體網站下的廣告位的信息均存儲在媒體管理數據庫中;步驟B、根據廣告內容特征模型對頁面內容進行提取,把與廣告內容特征模型相匹配的頁面內容提取出來,提取出來的頁面內容記為廣告識別內容,所述廣告內容特征模型存儲在廣告特征數據庫中;
步驟C、對廣告識別內容進行分離,分離的內容包括廣告投放創(chuàng)意、廣告投放地址、廣告位權重、廣告位所在媒體網站的頁面地址以及廣告投放排期,分離的內容記為廣告數據;步驟D、將廣告數據與廣告投放信息進行比對,所述廣告投放信息存儲在廣告信息管理數據庫中,所述廣告投放信息包括原廣告投放創(chuàng)意、原廣告投放地址、原廣告位權重、原廣告位所在媒體網站的頁面地址以及原廣告投放排期;
步驟E、輸出廣告數據與廣告投放信息比對后的廣告投放狀態(tài)結果。作為優(yōu)選,為了能夠得到廣告鏈接的集合,對廣告投放地址進行進一步的訪問,鑒別出301跳轉與302跳轉,把每一次跳轉的地址都收集起來直到頁面跳轉到最終頁,所收集到的所有跳轉地址均屬于廣告投放地址。本發(fā)明還提供了一種互聯網第三方媒體網站廣告監(jiān)控系統,其包括以下部件, 廣告采集模塊對媒體網站的頁面內容進行采集,所述媒體網站的頁面內容的網址為
廣告位所在的網址,媒體網站的信息及該媒體網站下的廣告位的信息均存儲在媒體管理數據庫中;
廣告提取模塊根據廣告內容特征模型對頁面內容進行提取,把與廣告內容特征模型相匹配的頁面內容提取出來,提取出來的頁面內容記為廣告識別內容,所述廣告內容特征模型存儲在廣告特征數據庫中;
廣告分離模塊對廣告識別內容進行分離,分離的內容包括廣告投放創(chuàng)意、廣告投放地址、廣告位權重、廣告位所在媒體網站的頁面地址以及廣告投放排期,分離的內容記為廣告數據;
廣告比對模塊將廣告數據與廣告投放信息進行比對,所述廣告投放信息存儲在廣告信息管理數據庫中,所述廣告投放信息包括原廣告投放創(chuàng)意、原廣告投放地址、原廣告位權重、原廣告位所在媒體網站的頁面地址以及原廣告投放排期;
結果顯示模塊輸出廣告數據與廣告投放信息比對后的廣告投放狀態(tài)結果。作為優(yōu)選,為了能夠得到廣告鏈接的集合,廣告分離模塊中,對廣告投放地址進行進一步的訪問,鑒別出301跳轉與302跳轉,把每一次跳轉的地址都收集起來直到頁面跳轉到最終頁,所收集到的所有跳轉地址均屬于廣告投放地址。本發(fā)明具有如下有益效果
通過對第三方媒體網站的頁面內容進行采集,并利用廣告內容特征模型在不通過第三方媒體接口就可以把廣告內容識別出來,從而對廣告投放情況進行自動化監(jiān)控,通過展示廣告投放狀態(tài)結果可以更直觀的知道代理廣告資源的狀態(tài),給管理層提供決策依據,給財務提供結算依據,給媒介和銷售提供資源使用情況。


圖I為本發(fā)明較佳實施例的互聯網第三方媒體網站廣告監(jiān)控方法的流程 圖2為本發(fā)明較佳實施例的互聯網第三方媒體網站廣告監(jiān)控系統的原理方框圖。
具體實施例方式下面,結合附圖以及具體實施方式
,對本發(fā)明做進一步描述,以便于更清楚的理解本發(fā)明所要求保護的技術思想。為了便于理解本發(fā)明,對下述技術術語進行說明
媒體網站,管理屬于它的多個廣告位,相當于對廣告位的分類管理,它本身包含了自增唯一 ID、媒體網站名稱、媒體網站網址,一個媒體網站可以包含多個廣告位。廣告位,它被媒體網站進行管理,一個廣告位只對應有一個媒體網站,它本身包含了自增唯一 ID、關聯的媒體網站ID、廣告位名稱、廣告位權重、廣告位狀態(tài),廣告位所在媒體網站的頁面網址。廣告信息管理數據庫,包括有廣告主信息,廣告投放信息。廣告主信息包括廣告主唯一 ID,廣告主名稱,廣告主聯系方式。廣告投放信息包括自增唯一 ID、關聯投放廣告位ID、關聯廣告主ID、廣告投放排期、廣告投放創(chuàng)意、廣告投放地址、廣告投放形式、廣告分類。
通過廣告位、廣告主、廣告投放信息之間的關聯,就可以形成一個完整的廣告投放,其具體內容包括廣告主、廣告分類、媒體網站、廣告位、廣告創(chuàng)意、廣告鏈接、廣告形式、起止時間、具體廣告投放排期、投放天數。廣告內容特征模型,前期通過對廣告內容、廣告鏈接等進行收集與分析,找出其特征,并對其進行分類歸納,建立起一個數據模型。如圖I所示,聯網第三方媒體網站廣告監(jiān)控方法,其包括以下步驟
501、定時對媒體網站的頁面內容進行采集(比如每隔I個小時或每隔2個小時等),通過廣告位里面的廣告位所在媒體網站的 頁面地址信息定位到需要采集的目標網頁,對頁面內容進行抓取,廣告的相關信息也包含在這抓取的信息里面,也即是說,所述媒體網站的頁面內容的網址為廣告位所在的網址;媒體網站的信息及該媒體網站下的廣告位的信息均存儲在媒體管理數據庫中,媒體管理數據庫中的數據可通過軟件接口把第三方系統(如該媒體網站)的數據進行導入;
502、根據廣告內容特征模型對頁面內容進行提取,把頁面內容里面的廣告找出來,SP把與廣告內容特征模型相匹配的頁面內容提取出來,提取出來的頁面內容記為廣告識別內容,所述廣告內容特征模型存儲在廣告特征數據庫中,其中,廣告特征數據庫中的數據是通過軟件接口把第三方系統(如擁有該廣告特征數據庫的公司)的數據進行導入;
其中,廣告內容特征模型包括廣告信息采集和廣告內容特征分析兩部分;
具體的,廣告信息采集(即對頁面內容進行提取)進行以下步驟
頁面內容抓取,首先收集媒體網址,通過爬蟲的方式(如爬蟲程序)海量采集媒體頁面內容,其中收集的內容是文字超鏈接,包括文字內容、鏈接地址、鏈接出現在頁面的位置(即廣告位權重);
廣告內容特征分析(即把頁面內容里面的廣告找出來)進行以下步驟
E1、對廣告鏈接地址,包括跳轉的鏈接地址,找出其共同關鍵字,比如當鏈接里出現了“ad”、“l(fā)ink”、“C0Unt”、“t0ngji”這些字符,那么這個記錄就可以判斷為廣告(以鏈接為判斷該數據是廣告的第一依據);E2、通常情況,根據鏈接來判斷是否為廣告會比根據文字內容來判斷更加簡單與準確,但是當以鏈接為依據還是不能確定它是不是廣告的時候,就需要根據文字內容來確定是否為廣告,例如,找出廣告語的共同關鍵字,并記錄該關鍵字在廣告語中出現的位置,比如出現在廣告語的頭部,出現在廣告語的中部,出現在廣告語的尾部,例如,廣告語為“特價酒店預訂,秘密工具”中“特價”就是廣告語里面的關鍵字,它的位置就是廣告語的頭部,那么“特價”這個關鍵字,并且出現在廣告語的頭部就是一個廣告語的特征,如果一個文字內容符合這個特征,就可以判斷它就是一個廣告;把El和E2所做的鏈接關鍵字與廣告語特征進行保存,以鏈接關鍵字為第一判斷依據,以廣告語特征為補充判斷依據,就可以建立廣告內容特征分析模型;
503、對廣告識別內容進行分離,分離的內容包括廣告投放創(chuàng)意、廣告投放地址、廣告位權重、廣告位所在媒體網站的頁面地址以及廣告投放排期,分離的內容記為廣告數據;其中,對廣告投放地址進行進一步的訪問,鑒別出301跳轉與302跳轉,把每一次跳轉的地址都收集起來直到頁面跳轉到最終頁,所收集到的所有跳轉地址均屬于廣告投放地址,也對應了廣告鏈接的集合(包含了開始地址、跳轉地址、最終地址,如果廣告投放地址沒有經過跳轉,那么就只有一個開始地址);
權利要求
1.互聯網第三方媒體網站廣告監(jiān)控方法,其特征在于,包括以下步驟 步驟A、對媒體網站的頁面內容進行采集,所述媒體網站的頁面內容的網址為廣告位所在的網址,媒體網站的信息及該媒體網站下的廣告位的信息均存儲在媒體管理數據庫中; 步驟B、根據廣告內容特征模型對頁面內容進行提取,把與廣告內容特征模型相匹配的頁面內容提取出來,提取出來的頁面內容記為廣告識別內容,所述廣告內容特征模型存儲在廣告特征數據庫中; 步驟C、對廣告識別內容進行分離,分離的內容包括廣告投放創(chuàng)意、廣告投放地址、廣告位權重、廣告位所在媒體網站的頁面地址以及廣告投放排期,分離的內容記為廣告數據; 步驟D、將廣告數據與廣告投放信息進行比對,所述廣告投放信息存儲在廣告信息管理數據庫中,所述廣告投放信息包括原廣告投放創(chuàng)意、原廣告投放地址、原廣告位權重、原廣告位所在媒體網站的頁面地址以及原廣告投放排期; 步驟E、輸出廣告數據與廣告投放信息比對后的廣告投放狀態(tài)結果。
2.如權利要求I所述的互聯網第三方媒體網站廣告監(jiān)控方法,其特征在于,步驟C中,對廣告投放地址進行進一步的訪問,鑒別出301跳轉與302跳轉,把每一次跳轉的地址都收集起來直到頁面跳轉到最終頁,所收集到的所有跳轉地址均屬于廣告投放地址。
3.互聯網第三方媒體網站廣告監(jiān)控系統,其特征在于,包括以下部件, 廣告采集模塊對媒體網站的頁面內容進行采集,所述媒體網站的頁面內容的網址為廣告位所在的網址,媒體網站的信息及該媒體網站下的廣告位的信息均存儲在媒體管理數據庫中; 廣告提取模塊根據廣告內容特征模型對頁面內容進行提取,把與廣告內容特征模型相匹配的頁面內容提取出來,提取出來的頁面內容記為廣告識別內容,所述廣告內容特征模型存儲在廣告特征數據庫中; 廣告分離模塊對廣告識別內容進行分離,分離的內容包括廣告投放創(chuàng)意、廣告投放地址、廣告位權重、廣告位所在媒體網站的頁面地址以及廣告投放排期,分離的內容記為廣告數據; 廣告比對模塊將廣告數據與廣告投放信息進行比對,所述廣告投放信息存儲在廣告信息管理數據庫中,所述廣告投放信息包括原廣告投放創(chuàng)意、原廣告投放地址、原廣告位權重、原廣告位所在媒體網站的頁面地址以及原廣告投放排期; 結果顯示模塊輸出廣告數據與廣告投放信息比對后的廣告投放狀態(tài)結果。
4.如權利要求I所述的互聯網第三方媒體網站廣告監(jiān)控方法,其特征在于,廣告分離模塊中,對廣告投放地址進行進一步的訪問,鑒別出301跳轉與302跳轉,把每一次跳轉的地址都收集起來直到頁面跳轉到最終頁,所收集到的所有跳轉地址均屬于廣告投放地址。
全文摘要
本發(fā)明涉及互聯網第三方媒體網站廣告監(jiān)控方法及系統。該方法包括步驟步驟A、對媒體網站的頁面內容進行采集;步驟B、根據廣告內容特征模型對頁面內容進行提取,把與廣告內容特征模型相匹配的頁面內容提取出來;步驟C、對廣告識別內容進行分離;步驟D、將廣告數據與廣告投放信息進行比對;以及步驟E、輸出廣告數據與廣告投放信息比對后的廣告投放狀態(tài)結果。該系統為實現上述方法的系統。本發(fā)明通過對第三方媒體網站的頁面內容進行采集,并利用廣告內容特征模型在不通過第三方媒體接口就可以把廣告內容識別出來,從而對廣告投放情況進行自動化監(jiān)控。
文檔編號G06Q30/02GK102819580SQ20121026058
公開日2012年12月12日 申請日期2012年7月25日 優(yōu)先權日2012年7月25日
發(fā)明者姚羅成, 關振源 申請人:廣州翼鋒信息科技有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
信阳市| 巍山| 舟山市| 滨州市| 黄浦区| 陆良县| 清远市| 浏阳市| 扶余县| 衢州市| 曲水县| 景谷| 靖远县| 新野县| 成武县| 栖霞市| 永德县| 格尔木市| 阿拉善盟| 喀什市| 泰和县| 晋城| 苍溪县| 邵武市| 井陉县| 阿拉善盟| 沅江市| 嘉义市| 六盘水市| 工布江达县| 鄯善县| 花垣县| 隆子县| 连城县| 南投县| 收藏| 镇原县| 永胜县| 平陆县| 乐陵市| 高清|