本發(fā)明涉及技術新聞數(shù)據(jù)內(nèi)容特征提取領域,具體地,涉及新聞數(shù)據(jù)內(nèi)容特征獲取系統(tǒng)及應用系統(tǒng)。
背景技術:
隨著融合媒體時代的到來,廣播電視事業(yè)也在朝著數(shù)字化、網(wǎng)絡化、智能化方向不斷發(fā)展,新聞媒體的生產(chǎn)模式和內(nèi)容的表現(xiàn)形式也變得多種多樣。新聞節(jié)目采編、制作、播出等環(huán)節(jié)對節(jié)目資料的檢索查詢和再利用的需求越來越高,傳統(tǒng)新聞的組織管理模式已無法適應目前的信息增長速度,媒資管理系統(tǒng)的信息維護也變得更加困難,系統(tǒng)的可擴展能力差已成為是傳統(tǒng)新聞節(jié)目丞待解決的問題。同時,傳統(tǒng)的電視臺新聞節(jié)目受到了互聯(lián)網(wǎng)各大新聞門戶網(wǎng)站的沖激,觀眾流失現(xiàn)象嚴重,使收視率及政府的輿論引導都相應受到一定的影響,傳統(tǒng)新聞的組織模式已不適應多樣化的新聞閱讀形式和個性化的閱讀推薦?;ヂ?lián)網(wǎng)新聞媒體受到越來越多的關注,逐漸成為用戶獲取新聞的主要方式,但大部分門戶新聞網(wǎng)站也缺乏統(tǒng)一的新聞存儲管理標準,資訊內(nèi)容大爆炸引來的信息過載問題越來越嚴重。
新聞內(nèi)容的數(shù)據(jù)蘊含著大量的信息,既包括新聞生產(chǎn)制作過程的采編播信息,又涉及傳播過程的用戶行為反饋信息,有效利用新聞大數(shù)據(jù),通過對新聞內(nèi)容數(shù)據(jù)的全面分析,對傳統(tǒng)新聞與互聯(lián)網(wǎng)新聞實現(xiàn)高效生產(chǎn)、有效管理、資源共享及精準傳播等都有著十分重要的意義和作用。
技術實現(xiàn)要素:
本發(fā)明的目的在于,針對上述問題,提出一種新聞數(shù)據(jù)內(nèi)容特征獲取系統(tǒng)及包括該系統(tǒng)的應用系統(tǒng),幫助采編工作者全面獲取素材并且敏銳地捕捉到新聞熱點與焦點,提高電視臺與網(wǎng)站的管理效率,幫助政府準確把握百姓輿情、有效傳播國家政策的主導思想,分析和提升新聞的推薦準確性,解決信息過載問題
為實現(xiàn)上述目的,本發(fā)明采用的技術方案是:一種新聞數(shù)據(jù)內(nèi)容特征獲取系統(tǒng),主要包括:
標簽管理系統(tǒng)和媒資管理管理系統(tǒng)通過網(wǎng)絡接口連接,所述標簽管理系統(tǒng)包括數(shù)據(jù)獲取模塊和標簽提取模塊,所述數(shù)據(jù)獲取模塊獲取電影內(nèi)容信息,所述標簽提取模塊新聞視頻、音頻和文本標簽,而后進行中文分詞,標簽清洗,最后標簽入庫,得到標簽庫;
所述提取新聞標簽具體為,首先將電影內(nèi)容數(shù)據(jù)按照電視新聞節(jié)目內(nèi)容和互聯(lián)網(wǎng)新聞節(jié)目內(nèi)容進行類別劃分;而后按照各類別進行級別劃分,對級別劃分的數(shù)據(jù)內(nèi)容進行詳細的數(shù)據(jù)采集,形成數(shù)據(jù)采集標簽;
所述電視新聞節(jié)目內(nèi)容包括節(jié)目基本信息、節(jié)目制作信息和節(jié)目類型信息三個級別,所述互聯(lián)網(wǎng)新聞節(jié)目內(nèi)容包括互聯(lián)網(wǎng)新聞基本信息、互聯(lián)網(wǎng)新聞題材信息、互聯(lián)網(wǎng)用戶信息和互聯(lián)網(wǎng)用戶來源信息四個級別。
進一步地,電視新聞節(jié)目中的節(jié)目基本信息用于對新聞節(jié)目進行全面客觀分析,了解新聞節(jié)目的市場情況與發(fā)展狀況,發(fā)掘熱點話題;
按照節(jié)目基本信息數(shù)據(jù)進行詳細的數(shù)據(jù)采集,具體包括采集節(jié)目名稱信息、節(jié)目曾用名、播出頻道信息、節(jié)目類型信息、節(jié)目題材信息、節(jié)目摘要信息、節(jié)目關鍵詞信息、節(jié)目內(nèi)容、節(jié)目圖片、節(jié)目視頻、節(jié)目視頻、節(jié)目時長、節(jié)目播出時間、節(jié)目頻次、節(jié)目收視率、節(jié)目在線播放平臺、節(jié)目彈幕、用戶評論信息、合作伙伴信息、鳴謝信息、特別鳴謝信息、播出狀態(tài)信息、發(fā)行時間信息和獲獎記錄信息,最終形成相應的數(shù)據(jù)采集標簽。
進一步地,所述節(jié)目制作信息給新聞節(jié)目的策劃、制作和播出提供指導數(shù)據(jù);
按照節(jié)目制作信息數(shù)據(jù)進行詳細數(shù)據(jù)采集,具體包括采編組信息、編輯組信息、播音組信息、嘉賓組信息、制片組信息、導播組信息、燈光組信息、服裝造型組信息、后期制作組信息、聲音制作組信息和策劃監(jiān)制組信息;
對采編組信息的采集包括采集節(jié)目通訊員信息、特約撰稿人、文字記者、出鏡記者、攝像記者、攝影記者和錄音記者數(shù)據(jù)信息形成7個數(shù)據(jù)信息采集標簽;
對編輯組信息的采集包括采集主編、執(zhí)行主編、選題編輯、策劃編輯、約稿編輯和責任編輯數(shù)據(jù)信息,形成6個數(shù)據(jù)采集標簽。
對播音組信息的采集包括采集固定主持、代班主持、外景主持、解說播音員數(shù)據(jù)信息,形成4個數(shù)據(jù)采集標簽;
對嘉賓組信息的采集包括采集現(xiàn)場邀請嘉賓、電話連續(xù)嘉賓、外景采訪嘉賓數(shù)據(jù)信息,形成相應數(shù)據(jù)采集標簽;
對制片組信息的采集包括采集總制片、制片、執(zhí)行制片數(shù)據(jù)信息,形成相應的數(shù)據(jù)采集標簽;
對導播組信息的采集包括采集編輯部導播、制作部導播、導播助理數(shù)據(jù)信息,形成相應地數(shù)據(jù)采集標簽;
對燈光組信息的采集包括采集燈光指導、燈光師、燈光助理、燈光編程和燈光維修員數(shù)據(jù)信息,形成相應地數(shù)據(jù)采集標簽;
對服裝造型組信息的采集包括采集化妝師、化妝助理、造型師和服裝師數(shù)據(jù)信息,形成相應地數(shù)據(jù)采集標簽;
對后期制作組信息的采集包括采集后期剪輯、美術編輯、美工、動畫特效、視覺包裝、字幕制作和技術審定數(shù)據(jù)信息,并形成相應的數(shù)據(jù)采集標簽;
對聲音制作組信息的采集包括采集錄音師、錄音指導、錄音助理、音頻編輯、同期聲處理、配音指導、背景音樂制作數(shù)據(jù)信息,形成相應的數(shù)據(jù)采集標簽;
對策劃監(jiān)制組信息的采集包括采集總策劃、策劃、聯(lián)合策劃、總監(jiān)制、監(jiān)制、執(zhí)行監(jiān)制、監(jiān)制助理、聯(lián)合監(jiān)制和行政監(jiān)制數(shù)據(jù)信息,形成對應的數(shù)據(jù)采集標簽。
進一步地,通過節(jié)目類型信息深入了解各類新聞節(jié)目之間的聯(lián)系與區(qū)別,為新聞節(jié)目的策劃服務;
按照節(jié)目類型信息數(shù)據(jù)進行詳細的數(shù)據(jù)采集,包括采集新聞資訊類數(shù)據(jù)、專題報道類數(shù)據(jù)、連續(xù)報道類數(shù)據(jù)、新聞評論類數(shù)據(jù)、訪談類數(shù)據(jù)、脫口秀類數(shù)據(jù)和國際新聞類數(shù)據(jù);
所述采集專題報道類數(shù)據(jù)具體包括,采集調(diào)查式專題數(shù)據(jù)信息、專訪式專題數(shù)據(jù)信息、綜述式專題數(shù)據(jù)信息和深度專題數(shù)據(jù)信息,最終形成相應的數(shù)據(jù)采集標簽;
所述采集連續(xù)報道類數(shù)據(jù)具體包括,采集重大事件連續(xù)報道數(shù)據(jù)信息和系列報道數(shù)據(jù)信息,最終形成相應的數(shù)據(jù)采集標簽;
所述采集新聞評論類數(shù)據(jù)信息具體包括,采集新聞述評數(shù)據(jù)信息、電視辯論信息、深度分析信息和主持人評論信息,最終形成相應的數(shù)據(jù)采集標簽;
所述采集訪談類數(shù)據(jù)信息具體包括,采集人物專訪信息和談話節(jié)目信息,最終形成相應的數(shù)據(jù)采集標簽,最終形成相應的數(shù)據(jù)采集標簽;
所述采集國際新聞類數(shù)據(jù)信息具體包括,采集國際新聞節(jié)目信息和對外新聞節(jié)目信息,最終形成相應的數(shù)據(jù)采集標簽。
進一步地,通過對新聞基本信息數(shù)據(jù)的分析,建立資源之間的關聯(lián),生成新聞話題;
對互聯(lián)網(wǎng)新聞基本信息進行采集,具體包括采集,時間、標題、來源網(wǎng)站、被轉(zhuǎn)載量、題材、內(nèi)容提要、關鍵字、新聞內(nèi)容、背景鏈接、相關新聞或延伸閱讀信息、采編記者信息、攝影記者信息、主編信息、文字編輯信息、圖表編輯信息、管理編輯信息、責任編輯信息、圖片、視頻、瀏覽量、點贊數(shù)、轉(zhuǎn)發(fā)量、評論量和新聞評論數(shù)據(jù)信息,最終形成相應的數(shù)據(jù)采集標簽。
進一步地,通過將互聯(lián)網(wǎng)新聞題材信息與新聞基本信息相關聯(lián),為網(wǎng)絡新聞資源的管理、索引及推薦提供幫助;
所述對互聯(lián)網(wǎng)新聞題材信息的采集包括,采集政治題材信息、軍事題材信息、經(jīng)濟、法制、社會民主、體育、娛樂、農(nóng)業(yè)、科技、教育、安全、醫(yī)療衛(wèi)生、健康、旅游、文化藝術和歷史地理題材信息,形成相應的數(shù)據(jù)采集標簽。
進一步地,通過采集互聯(lián)網(wǎng)用戶數(shù)據(jù),分析用戶的行為,挖掘用戶需求以及用戶與資源之間的關聯(lián),實現(xiàn)個性化推薦;
對互聯(lián)網(wǎng)用戶信息采集包括用戶名、用戶來源、用戶性別、用戶年齡、用戶職業(yè)、用戶所在地區(qū)、用戶學歷、用戶偏好、關注量、粉絲量、在線時長、瀏覽記錄和發(fā)表言論信息;
通過采集互聯(lián)網(wǎng)用戶來源信息以用戶為紐帶,實現(xiàn)互聯(lián)網(wǎng)知識共享,同時綜合了解網(wǎng)絡用戶在各大網(wǎng)站的分布情況,分析網(wǎng)絡新聞門戶網(wǎng)站的發(fā)展;
對互聯(lián)網(wǎng)用戶來源信息包括各個新聞門戶網(wǎng)站信息。
基于所述獲取系統(tǒng)的應用系統(tǒng),還包括后臺管理模塊和新聞數(shù)據(jù)內(nèi)容標簽分析應用模塊,所述后臺管理模塊對用戶、消息、內(nèi)容和標簽進行管理;所述新聞數(shù)據(jù)內(nèi)容標簽分析應用模塊包括新聞素材篩選模塊、新聞編排模塊、新聞播出形式模塊、新聞花絮生成模塊和輿情分析模塊;
所述新聞素材分篩選模塊,對搜集的大量新聞素材進行初步篩選,對具體事實有宏觀觀照,在全局形勢下做出準確判斷;同時,以數(shù)據(jù)分析內(nèi)容,用數(shù)據(jù)采集標簽準確定位,挖掘新聞選題搶占獨家報道或?qū)ふ倚侣勛糇C以拓展報道深度;發(fā)揮庫存資料的作用,編輯配發(fā)背景新聞,增加報道深度;
所述新聞編排模塊,將體現(xiàn)同一主題的相關新聞集合編排,豐富新聞的信息量,使內(nèi)容更加飽滿,主題更加深化;同時,從新聞主題出發(fā),貼近當?shù)厣?,編排能夠凸顯地域風情和文化內(nèi)涵的新聞內(nèi)容,發(fā)揮“異質(zhì)”的競爭優(yōu)勢;
所述播出形式模塊包括滾動式播出模塊和多重播式播出模塊,具體為,所述播出形式模塊以大數(shù)據(jù)分析用戶收視習慣的服務,調(diào)整新聞播出形式;同時為滿足不同收視習慣的用戶需求,達到新聞傳播宣傳的最大化效果,實行滾動式多次播放的方式;對于突發(fā)事件和持續(xù)追蹤事件,重播時滾動編排記者采回來的和互聯(lián)網(wǎng)最新發(fā)布的最新消息,及時插入播出;
所述花絮生成模塊,對每日的節(jié)目內(nèi)容進行分時段收視分析,提取收視高峰時段的內(nèi)容標簽,生成摘要,花絮;
所述用戶輿情分析模塊,對節(jié)目播后的用戶評論反饋,進行情感標簽分析,評論熱點分析,了解民眾需求;挖掘預測輿論的熱點話題,對百姓關心的標識性熱點事件進行深度報道,為老百姓釋疑解惑。
一種標簽庫,將新聞數(shù)據(jù)采集標簽內(nèi)容進行存儲,具體包括,
新聞內(nèi)數(shù)據(jù)分類表,對各級分類名進行存儲,并以分類id作為主鍵;
新聞節(jié)目基本信息表,存儲節(jié)目基本信息,并以節(jié)目id作為主鍵;
互聯(lián)網(wǎng)新聞信息表,存儲互聯(lián)網(wǎng)新聞基本信息,并以新聞id作為主鍵;
新聞節(jié)目類型信息表,存儲節(jié)目類型信息,并以類型id作為主鍵;
新聞題材信息表,存儲新聞題材信息,并以題材id作為主鍵
互聯(lián)網(wǎng)用戶基本信息表,存儲用戶信息,并以用戶id作為主鍵
互聯(lián)網(wǎng)用戶來源信息表,存儲用戶來源門戶網(wǎng)站信息,以網(wǎng)站id作為主鍵。
本發(fā)明,通過對新聞數(shù)據(jù)內(nèi)容特征的定義和獲取,幫助新聞工作者全面獲取素材并且敏銳地捕捉到新聞熱點與焦點,提高電視臺與網(wǎng)站的生產(chǎn)效率與管理效率,提升對用戶的推薦準確率,解決信息過載問題,幫助政府準確把握百姓輿情、有效傳播國家政策的主導思想。
同時。本發(fā)明是一個新聞數(shù)據(jù)內(nèi)容特征獲取及應用系統(tǒng),將新聞數(shù)據(jù)分為電視新聞節(jié)目和互聯(lián)網(wǎng)門戶網(wǎng)站新聞信息兩大類,共分為7個級別,包括新聞節(jié)目基本信息、節(jié)目制作信息、節(jié)目類型信息、互聯(lián)網(wǎng)新聞基本信息、新聞題材信息、互聯(lián)網(wǎng)用戶信息、用戶來源門戶網(wǎng)站信息,共涉及采集指標200余個。為實現(xiàn)新聞內(nèi)容數(shù)據(jù)的存儲和分析,設計了適用于新聞數(shù)據(jù)錄入和存儲的數(shù)據(jù)庫結(jié)構,開發(fā)應用系統(tǒng)實現(xiàn)對新聞數(shù)據(jù)的存儲和應用。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。
下面通過附圖和實施例,對本發(fā)明的技術方案做進一步的詳細描述。
附圖說明
附圖用來提供對本發(fā)明的進一步理解,并且構成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構成對本發(fā)明的限制。在附圖中:
圖1是本發(fā)明的新聞內(nèi)容數(shù)據(jù)分類方法圖;
圖2是本發(fā)明的新聞節(jié)目基本信息內(nèi)容特征圖;
圖3是本發(fā)明的新聞節(jié)目制作信息內(nèi)容特征圖;
圖4是本發(fā)明的新聞節(jié)目類型信息內(nèi)容特征圖;
圖5是本發(fā)明的互聯(lián)網(wǎng)新聞基本信息內(nèi)容特征圖;
圖6是本發(fā)明的新聞題材信息內(nèi)容特征圖;
圖7是本發(fā)明的用戶基本信息內(nèi)容特征圖;
圖8是本發(fā)明的網(wǎng)絡用戶來源網(wǎng)站信息內(nèi)容特征圖;
圖9是本發(fā)明的新聞節(jié)目基本信息e-r圖;
圖10是本發(fā)明的互聯(lián)網(wǎng)新聞基本信息e-r圖;
圖11是本發(fā)明的用戶基本信息e-r圖;
圖12是本發(fā)明的新聞內(nèi)容數(shù)據(jù)分類表;
圖13是本發(fā)明的新聞節(jié)目基本信息表;
圖14是本發(fā)明的互聯(lián)網(wǎng)新聞基本信息表;
圖15是本發(fā)明的新聞節(jié)目類型信息表;
圖16是本發(fā)明的新聞題材信息表;
圖17是本發(fā)明的用戶基本信息表;
圖18是本發(fā)明的用戶來源信息表;
圖19是本發(fā)明新聞數(shù)據(jù)內(nèi)容特征獲取及應用系統(tǒng)整體架構圖;
圖20是本發(fā)明的系統(tǒng)實際應用流程圖;
具體實施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明是一個新聞數(shù)據(jù)內(nèi)容特征獲取及應用系統(tǒng),將新聞數(shù)據(jù)分為電視新聞節(jié)目和互聯(lián)網(wǎng)門戶網(wǎng)站新聞信息兩大類,共分為7個級別,包括新聞節(jié)目基本信息、節(jié)目制作信息、節(jié)目類型信息、互聯(lián)網(wǎng)新聞基本信息、新聞題材信息、互聯(lián)網(wǎng)用戶信息、用戶來源門戶網(wǎng)站信息,共涉及采集指標200余個。為實現(xiàn)新聞內(nèi)容數(shù)據(jù)的存儲和分析,設計了適用于新聞數(shù)據(jù)錄入和存儲的數(shù)據(jù)庫結(jié)構,開發(fā)應用系統(tǒng)實現(xiàn)對新聞數(shù)據(jù)的存儲和應用。
本發(fā)明是一個新聞數(shù)據(jù)內(nèi)容特征獲取及應用系統(tǒng)。形成統(tǒng)一的數(shù)據(jù)存儲標準,實現(xiàn)新聞數(shù)據(jù)的內(nèi)容特征獲取及應用,分別提供面向廣播電視、互聯(lián)網(wǎng)、移動網(wǎng)絡客戶端的跨平臺、跨媒體的開放數(shù)據(jù)接口,使其嵌入到相應的媒資管理系統(tǒng)中得以應用,實現(xiàn)新聞的存儲、管理、生產(chǎn)、傳播。將新聞數(shù)據(jù)按照電視新聞節(jié)目與互聯(lián)網(wǎng)新聞分為兩大類別,共7個組別,包括新聞節(jié)目基本信息、節(jié)目制作信息、節(jié)目類型信息、互聯(lián)網(wǎng)新聞基本信息、新聞題材信息、互聯(lián)網(wǎng)用戶信息、用戶來源門戶網(wǎng)站信息,共涉及采集指標200余個。針對新聞數(shù)據(jù)內(nèi)容的研究,采用人工和自動爬取相結(jié)合的方式,主要采集各大電視臺的典型新聞節(jié)目及各大新聞門戶網(wǎng)站的新聞信息。目前已人工錄入2016年度湖南新聞聯(lián)播內(nèi)容數(shù)據(jù)及自動爬取新浪、搜狐、網(wǎng)易、中國新聞網(wǎng)、央視網(wǎng)、千龍網(wǎng)、新華網(wǎng)、人民網(wǎng)等十余個主要門戶網(wǎng)站的近500條新聞數(shù)據(jù)的提取和分析。對幫助提高新聞生產(chǎn)效率,提升新聞質(zhì)量、實現(xiàn)新聞有效管理、推薦,有助政府掌控和引導社會輿情等都有著至關重要的作用。
新聞數(shù)據(jù)內(nèi)容特征的獲取可以幫助采編工作者全面獲取素材并且敏銳地捕捉到新聞熱點與焦點,提高電視臺與網(wǎng)站的管理效率,幫助政府準確把握百姓輿情、有效傳播國家政策的主導思想,分析和提升新聞的推薦準確性,解決信息過載問題。為了全面的描述新聞的內(nèi)容特征,其特征是:將數(shù)據(jù)分為兩大類別,共分為七個級別,每個級別下細分新聞數(shù)據(jù)組別,定義和統(tǒng)計的指標共有200余個。
實現(xiàn)新聞數(shù)據(jù)的存儲和分析,設計了適用于新聞數(shù)據(jù)指標錄入和存儲的數(shù)據(jù)庫結(jié)構,并依據(jù)數(shù)據(jù)庫搭建應用系統(tǒng)。
一、新聞數(shù)據(jù)內(nèi)容特征獲取
結(jié)合附圖1的新聞數(shù)據(jù)分類方法圖,對采集的新聞內(nèi)容數(shù)據(jù)具體介紹如下:
1.電視新聞節(jié)目類
(1)節(jié)目基本信息
新聞節(jié)目基本信息包括節(jié)目類型、節(jié)目內(nèi)容、節(jié)目時長、節(jié)目收視率等近20個指標,其中數(shù)據(jù)定義的具體信息如圖2所示。通過新聞基本信息的獲取,可以對新聞節(jié)目進行全面客觀分析,了解新聞節(jié)目的市場情況與發(fā)展狀況,發(fā)掘熱點話題。
(2)節(jié)目制作信息
對新聞節(jié)目制作流程中的各個環(huán)節(jié)信息進行獲取和分析,從節(jié)目制作端出發(fā),將新聞節(jié)目按生產(chǎn)流程分為11個組別,包括采編、編輯、播音、嘉賓、制片、導播、燈光、服裝造型、后期制作、聲音制作、策劃監(jiān)制,近60個指標,如圖3所示??梢詫σ粰n新聞節(jié)目的策劃、制作、播出提供技術性指導。
(3)節(jié)目類型信息
節(jié)目類型信息包括新聞資訊類、專題報道類、連續(xù)報道類、新聞評論類、訪談類、脫口秀7大類型,近15個細化類型,具體如圖4所示。對不同的新聞節(jié)目細化,將其與具體的節(jié)目信息將關聯(lián),有助于深入了解各類新聞節(jié)目之間的聯(lián)系與區(qū)別,可以為新聞節(jié)目的策劃服務。
2.互聯(lián)網(wǎng)新聞類
(1)新聞基本信息
新聞基本信息包括新聞內(nèi)容、關鍵詞、題材、記者、責編、圖片、視頻、轉(zhuǎn)載量等近30個指標,如圖5所示,通過對新聞基本信息數(shù)據(jù)的分析,可以建立資源之間的關聯(lián),生成新聞話題等。
(2)新聞題材信息
新聞題材包括軍事、政治、經(jīng)濟等13個類型,如圖6所示,將其與新聞基本信息相關聯(lián),為網(wǎng)絡新聞資源的管理、索引及推薦都可以提供一定幫助。
(3)用戶基本信息
用戶基本信息包括用戶年齡、性別、偏好、瀏覽歷史、發(fā)表言論等13個指標,通過采集用戶數(shù)據(jù),分析用戶的行為,挖掘用戶需求以及用戶與資源之間的關聯(lián),實現(xiàn)個性化推薦。
(4)用戶來源信息
用戶來源信息包括新浪、網(wǎng)易、騰訊、新華網(wǎng)、央視網(wǎng)、千龍網(wǎng)等16個新聞門戶網(wǎng)站,可以以用戶為紐帶,實現(xiàn)互聯(lián)網(wǎng)知識共享,同時綜合了解網(wǎng)絡用戶在各大網(wǎng)站的分布情況,分析網(wǎng)絡新聞門戶網(wǎng)站的發(fā)展。
為能對本發(fā)明的數(shù)據(jù)內(nèi)容進行存儲和分析,對新聞內(nèi)容數(shù)據(jù)庫的邏輯結(jié)構設計情況如下:
圖9是本發(fā)明的新聞節(jié)目基本信息e-r圖,顯示了新聞節(jié)目和其他實體間的聯(lián)系。
圖10是本發(fā)明的互聯(lián)網(wǎng)新聞基本信息e-r圖,顯示了門戶網(wǎng)站新聞資源和其他實體間的聯(lián)系。
圖11是本發(fā)明的用戶基本信息e-r圖,顯示了用戶和其他實體間的聯(lián)系。
圖12為本發(fā)明的新聞內(nèi)容數(shù)據(jù)分類表,對各級分類名進行存儲,以分類id作為主鍵。
圖13是本發(fā)明的新聞節(jié)目基本信息表,用來存儲節(jié)目基本信息,以節(jié)目id作為主鍵。
圖14是本發(fā)明的互聯(lián)網(wǎng)新聞信息表,用來存儲互聯(lián)網(wǎng)新聞基本信息,以新聞id作為主鍵。
圖15是本發(fā)明的新聞節(jié)目類型信息表,用來存儲節(jié)目類型信息,以類型id作為主鍵。
圖16是本發(fā)明的新聞題材信息表,用來存儲新聞題材信息,以題材id作為主鍵。
圖17是本發(fā)明的用戶基本信息表,用來存儲用戶信息,以用戶id作為主鍵。
圖18是本發(fā)明的用戶來源信息表,用來存儲用戶來源門戶網(wǎng)站信息,以網(wǎng)站id作為主鍵。
應用系統(tǒng)的整體架構如圖19所示,該系統(tǒng)按照新聞數(shù)據(jù)內(nèi)容特征獲取標準,將新聞數(shù)據(jù)統(tǒng)一存儲管理,對數(shù)據(jù)進行挖掘分析,可進一步實現(xiàn)新聞素材篩選、新聞集合編排、新聞節(jié)目播出形式調(diào)整、花絮片段生成及用戶輿情分析等實際應用,系統(tǒng)的實際操作流程圖如圖20所示。
1.新聞素材篩選(針對采集記者服務)
對搜集的大量新聞素材進行初步篩選,對具體事實有宏觀觀照,在全局形勢下做出準確判斷。
以數(shù)據(jù)分析內(nèi)容,用標簽準確定位,挖掘新聞選題搶占獨家報道或?qū)ふ倚侣勛糇C以拓展報道深度。
發(fā)揮庫存資料的作用,編輯配發(fā)背景新聞,增加報道深度。
2.新聞集合編排(針對編輯服務)
將體現(xiàn)同一主題的相關新聞集合編排,豐富新聞的信息量,使內(nèi)容更加飽滿,主題更加深化。
從新聞主題出發(fā),貼近當?shù)厣?,編排能夠凸顯地域風情和文化內(nèi)涵的新聞內(nèi)容,發(fā)揮“異質(zhì)”的競爭優(yōu)勢。
3.新聞播出形式——滾動式、多重播
提供以大數(shù)據(jù)分析用戶收視習慣的服務,調(diào)整新聞播出形式
為滿足不同收視習慣的用戶需求,達到新聞傳播宣傳的最大化效果,可以實行滾動式多次播放的方式。
對于突發(fā)事件和持續(xù)追蹤事件,重播時可以滾動編排記者采回來的和互聯(lián)網(wǎng)最新發(fā)布的最新消息,及時插入播出。
4.花絮片段生成
對每日的節(jié)目內(nèi)容進行分時段收視分析,提取收視高峰時段的內(nèi)容標簽,生成摘要,花絮。
5.用戶輿情分析
對節(jié)目播后的用戶評論反饋,進行情感標簽分析,評論熱點分析,了解民眾需求。
挖掘預測輿論的熱點話題,對百姓關心的標識性熱點事件進行深度報道,為老百姓釋疑解惑。
至少可以達到以下有益效果:
新聞數(shù)據(jù)內(nèi)容特征獲取及應用系統(tǒng)是一個具有良好擴展性、穩(wěn)定性和高效率的新聞數(shù)據(jù)管理與應用平臺,同時從新聞的制作及用戶角度考慮,以多維的指標獲取新聞內(nèi)容的特征,提供一種新的更加有效的資源整合方式,實現(xiàn)有效管理新聞數(shù)據(jù)資源,促進融合媒體的發(fā)展。信息資源管理全面自動化,提高媒體行業(yè)節(jié)目制作過程的工作效率,使信息維護和發(fā)布更容易,減少二次開發(fā)成本,帶來明顯的經(jīng)濟效益和社會效益,提高傳統(tǒng)廣電應對信息變化的能力,同時使互聯(lián)網(wǎng)發(fā)布信息的有效性、規(guī)范性等質(zhì)量要求得到了有力保障,使三網(wǎng)在業(yè)務上的融合得到技術突破,順應現(xiàn)今的信息資源傳播規(guī)律和新興媒體發(fā)展規(guī)律,強化互聯(lián)網(wǎng)思維,堅持傳統(tǒng)媒體和新興媒體優(yōu)勢互補、一體發(fā)展,推動傳統(tǒng)媒體和新興媒體在內(nèi)容、渠道、平臺、經(jīng)營、管理等方面的深度融合,打造一批形態(tài)多樣、手段先進、具有競爭力的新型主流媒體,提升傳播力和綜合競爭力。
實現(xiàn)新聞素材的自動篩選,節(jié)約人力物力,避免重復采拍,減少選擇新聞的工作量,同時有效避免有價值的新聞事件被遺漏,從而選取編輯出既結(jié)合當?shù)貙嶋H,又面向全國收視用戶的有指導性、借鑒意義的新聞。
實現(xiàn)新聞集合編排,制作適宜當?shù)氐墓?jié)目編排,最大限度地貼近生活,從主題出發(fā),對地方熱點政策資訊和解析,地方文化藝術,地方事件深度報道,精準目標受眾定位,建立認同感,體現(xiàn)原創(chuàng)性和接近性,推動當?shù)亟?jīng)濟、政治、文化等全面發(fā)展的同時,以小見大,引起全國關注,打造自己的品牌化新聞觀點和報道模式。
實現(xiàn)新聞播出形式的有效調(diào)整,使更多的用戶同時接收到最新的新聞信息,提高新聞傳播的影響力和穿透力。
實現(xiàn)新聞花絮片段生存,提高新聞優(yōu)勢,增加關注度,更加深入了解收視觀眾的關注點集中部分,可以對一些受關注的特定事件提供后續(xù)報道,甚至開展專題報道,對今后的新聞內(nèi)容選擇有一定的參考價值,更好地體現(xiàn)新聞的價值,形成良性循環(huán)
實現(xiàn)用戶輿情分析,增加用戶粘度性,使收視率和節(jié)目影響力同時得到提升,更重要的是通過對關系民心向背的熱點事件的報道分析,引導輿論導向,推動中國民風建設和法制建設。
最后應說明的是:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進行了詳細的說明,對于本領域的技術人員來說,其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。