本發(fā)明涉及電視劇技術(shù)領(lǐng)域,具體地,涉及一種電視劇內(nèi)容特征獲取系統(tǒng)及標(biāo)簽庫。
背景技術(shù):
電視劇行業(yè)是帶有原創(chuàng)性的、具備高度文化含量和知識經(jīng)濟特性的一種行業(yè),其核心在于創(chuàng)意開發(fā)及資源整合。電視劇的生產(chǎn)是將抽象的創(chuàng)意轉(zhuǎn)化為具有高度經(jīng)濟價值的商品的過程。中國是全球第二大電視劇市場,同時也是增長最快的市場之一。電視劇產(chǎn)量的爆炸性增長為電視劇市場的發(fā)展奠定了良好的基礎(chǔ)建設(shè)條件。
在“互聯(lián)網(wǎng)+”的時代,觀看電視劇的用戶的行為數(shù)據(jù)如依托行業(yè)可較易獲取,但僅僅依靠用戶行為數(shù)據(jù)來嘗試內(nèi)容創(chuàng)意指導(dǎo)、后期制作和營銷還遠(yuǎn)遠(yuǎn)不夠。電視劇內(nèi)容的數(shù)據(jù)能體現(xiàn)作品的豐富特征,蘊含大量電視劇基本信息、電視劇團隊成員、導(dǎo)演基本信息、編劇基本信息、演員基本信息、電視劇ip影響力、電視劇收視率等語義信息,更是電視劇大數(shù)據(jù)的金礦。通過對電視劇全息數(shù)據(jù)的研究分析,對幫助電視劇決策,提升整體質(zhì)量、制作團隊、收視率、影響力等都有著十分重要的意義和作用。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于,針對上述問題,提出一種電視劇內(nèi)容特征獲取系統(tǒng),通過對電視劇全息數(shù)據(jù)的研究分析,幫助電視劇決策,提升整體質(zhì)量、制作團隊、收視率和影響力。
為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種電視劇內(nèi)容特征獲取系統(tǒng),主要包括:包括標(biāo)簽管理系統(tǒng)和電視劇管理系統(tǒng),所述標(biāo)簽管理系統(tǒng)和電視劇管理系統(tǒng)通過網(wǎng)絡(luò)接口連接,其特征在于,所述標(biāo)簽管理系統(tǒng)包括數(shù)據(jù)獲取模塊和標(biāo)簽提取模塊,所述數(shù)據(jù)獲取模塊獲取電視劇內(nèi)容信息,所述標(biāo)簽提取模塊提取電視劇內(nèi)容標(biāo)簽,標(biāo)引標(biāo)簽,將標(biāo)簽與電視劇關(guān)聯(lián)后存入標(biāo)簽庫;
所述提取電視劇內(nèi)容標(biāo)簽具體為,首先將電視劇內(nèi)容數(shù)據(jù)按照電視劇基本信息數(shù)據(jù)、電視劇用戶數(shù)據(jù)、電視劇拍攝信息數(shù)據(jù)、電視劇制作團隊數(shù)據(jù)、導(dǎo)演基本信息數(shù)據(jù)、編劇基本信息數(shù)據(jù)、演員基本信息數(shù)據(jù)、電視劇ip影響力數(shù)據(jù)和其他數(shù)據(jù)內(nèi)容進行級別劃分,而后按照各級劃分內(nèi)容對電視劇內(nèi)容進行詳細(xì)的數(shù)據(jù)采集,形成數(shù)據(jù)采集標(biāo)簽。
進一步地,所述電視劇基本信息數(shù)據(jù)用于對電視劇內(nèi)容進行綜合分析,并得出電視劇成功的關(guān)鍵要素;
按照電視劇基本信息數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集電視劇名稱信息數(shù)據(jù)、電視劇英文名數(shù)據(jù)、電視劇名拼音數(shù)據(jù)、更多片名數(shù)據(jù)、原著數(shù)據(jù)、ip類型數(shù)據(jù)、導(dǎo)演數(shù)據(jù)、編劇數(shù)據(jù)、主演數(shù)據(jù)、電視劇類型數(shù)據(jù)、電視劇評級數(shù)據(jù)、電視劇票房數(shù)據(jù)、電視劇專資辦數(shù)據(jù)、劇情簡介數(shù)據(jù)、色彩數(shù)據(jù)、imdb編碼、獲獎情況數(shù)據(jù)、發(fā)行日期數(shù)據(jù)、國家/地區(qū)數(shù)據(jù)、時長數(shù)據(jù)、聯(lián)合出品數(shù)據(jù)、制作數(shù)據(jù)、出品人數(shù)據(jù)和聯(lián)合出品人數(shù)據(jù)。
進一步地,根據(jù)電視劇用戶數(shù)據(jù)即用戶對電視劇的口碑、評價和熱度為電視劇的宣傳營銷提供數(shù)據(jù)支持,按照電視劇用戶數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集用戶個人信息特征數(shù)據(jù)和用戶內(nèi)容特征數(shù)據(jù),所述用戶個人信息特征數(shù)據(jù)包括系統(tǒng)用戶id數(shù)據(jù)、用戶名數(shù)據(jù)、用戶年齡數(shù)據(jù)、用戶性別數(shù)據(jù)、地域數(shù)據(jù)、星座數(shù)據(jù)和個人介紹數(shù)據(jù);
所述用戶內(nèi)容特征數(shù)據(jù)包括各網(wǎng)站評分?jǐn)?shù)據(jù)、各網(wǎng)站評分人數(shù)數(shù)據(jù)、最高搜索指數(shù)數(shù)據(jù)、網(wǎng)站評分人數(shù)占比、各網(wǎng)站討論數(shù)據(jù)、問題數(shù)據(jù)、短評數(shù)據(jù)、影評數(shù)據(jù)、各網(wǎng)站視頻數(shù)據(jù)、圖片總數(shù)、新聞數(shù)量、長影評總數(shù)、短影評總數(shù)、想看人數(shù)、評分人數(shù)、電視劇粉絲數(shù)。
進一步地,通過采集的電視劇拍攝信息數(shù)據(jù),為新電視劇拍攝指導(dǎo)提供數(shù)據(jù)支持;
按照電視劇拍攝信息數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集圖像元素數(shù)據(jù)、聲音序列數(shù)據(jù)、男一號主角數(shù)據(jù)、女一號主角數(shù)據(jù)、電視劇高潮數(shù)據(jù)、鏡頭分割獲取數(shù)據(jù)和分鏡頭數(shù)據(jù),并按照上述劃分內(nèi)容進行詳細(xì)的數(shù)據(jù)采集,形成多個對應(yīng)的數(shù)據(jù)采集標(biāo)簽。
進一步地,通過對電視劇制作團隊數(shù)據(jù)進行采集,為構(gòu)建制片團隊庫,并向制片方推薦參與過相似電視劇的制作團隊提供數(shù)據(jù)支持;
根據(jù)電視劇制作團隊數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集演員組數(shù)據(jù)、導(dǎo)演組數(shù)據(jù)、制片組數(shù)據(jù)、編劇和劇本組數(shù)據(jù)、策劃監(jiān)制組數(shù)據(jù)、制作組數(shù)據(jù)、場記統(tǒng)籌和劇務(wù)場務(wù)組數(shù)據(jù)、藝術(shù)組數(shù)據(jù)、攝影組數(shù)據(jù)、燈光組數(shù)據(jù)、美術(shù)組數(shù)據(jù)、化妝組數(shù)據(jù)、服裝道具組數(shù)據(jù)、后期剪輯合成組數(shù)據(jù)、特效動畫數(shù)據(jù)、字幕組數(shù)據(jù)、武術(shù)動作數(shù)據(jù)、音樂制作數(shù)據(jù)、聲音制作數(shù)據(jù)、數(shù)字中間片數(shù)據(jù)、出品團隊數(shù)據(jù)、海報設(shè)計和贊助鳴謝數(shù)據(jù)、模型材質(zhì)數(shù)據(jù)和綁定組數(shù)據(jù)、預(yù)告片、花絮及片頭片尾動畫數(shù)據(jù),以及其他數(shù)據(jù)。
進一步地,通過對導(dǎo)演基本信息數(shù)據(jù)進行采集,對導(dǎo)演參與過相似電視劇進行綜合分析,為制片方推薦相關(guān)的優(yōu)秀導(dǎo)演提供數(shù)據(jù)支持;
按照導(dǎo)演基本信息數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集片名信息、導(dǎo)演中文名信息、外文名信息、別名信息、個人簡介信息、全部電視劇目錄信息、代表目錄信息、代表作品信息、主要獎項信息、出生日期信息、出生地信息、籍貫信息、國籍信息、民族信息、血型信息、身高信息、體重信息、星座信息、經(jīng)紀(jì)公司信息、職業(yè)信息、畢業(yè)院校信息、婚姻狀況信息、配偶信息和家庭孩子信息;
通過對編劇基本信息數(shù)據(jù)進行采集,根據(jù)采集的信息構(gòu)建編劇庫,為制片方挑選編劇提供參考;
按照信息數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集編劇參與的電視劇片名信息、編劇中文名信息、外文名信息和別名信息,編劇的個人簡介信息、編劇作品目錄信息、代表作品信息、主要獎項信息、編劇出生日期、出生地、籍貫、國籍、民族、血型、身高、體重和星座信息,編劇所在經(jīng)紀(jì)公司信息、編劇的職業(yè)信息、畢業(yè)院校信息、婚姻狀況信息、配偶信息和孩子信息;
根據(jù)采集的演員基本信息數(shù)據(jù),構(gòu)建藝人電視劇標(biāo)簽庫,向制片方推薦參與過相似電視劇的演員;
根據(jù)電視劇制作團隊數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集演員的個人簡介信息、演員作品目錄信息、代表作品信息、主要獎項信息、演員出生日期、出生地、籍貫、國籍、民族、血型、身高、體重和星座信息,演員所在經(jīng)紀(jì)公司信息、演員的職業(yè)信息、畢業(yè)院校信息、婚姻狀況信息、配偶信息和孩子信息。
進一步地,通過對采集的電視劇ip影響力數(shù)據(jù)進行分析,得到原著小說的熱度分析結(jié)果,對劇本選擇提供指導(dǎo)數(shù)據(jù)支持;
按照電視劇ip影響力數(shù)據(jù)進行詳細(xì)的數(shù)據(jù)采集,具體包括采集電視劇名信息、電視劇原著信息、原著作者信息、電視劇類型信息、各網(wǎng)站的評分信息、電視劇票房信息、話題度信息、最高搜索指數(shù)信息和評價信息。
基于所述獲取的系統(tǒng)中的標(biāo)簽庫,將數(shù)據(jù)采集標(biāo)簽內(nèi)容進行存儲,具體包括,
存儲觀看電視劇用戶數(shù)據(jù)用戶信息的用戶個人信息表,所述用戶個人信息表以系統(tǒng)用戶分配的id為主鍵作為索引;
電視劇內(nèi)容數(shù)據(jù)指標(biāo)分類表,對各級分類名進行存儲,以分類id作為主鍵作為索引;
導(dǎo)演信息表,存儲導(dǎo)演基本信息數(shù)據(jù),以導(dǎo)演id作為主鍵作為索引;
演員信息表,存儲演員基本信息,以主演id作為主鍵作為索引;
編劇信息表,存儲編劇基本信息,以編劇id作為主鍵作為索引;
所述電視劇團隊成員數(shù)據(jù)和電視劇拍攝信息數(shù)據(jù)以電視劇id為主鍵作為索引。
本發(fā)明各實施例的電視劇內(nèi)容特征獲取系統(tǒng),將電視劇數(shù)據(jù)共分為九個級別,包括電視劇基本信息、電視劇用戶數(shù)據(jù)、電視劇拍攝信息、電視劇制作團隊、導(dǎo)演、編劇、演員基本信息、電視劇ip影響力和其他,每個級別下細(xì)分電視劇數(shù)據(jù)采集組別,共涉及采集指標(biāo)600余個。同時,實現(xiàn)電視劇全息數(shù)據(jù)的存儲和分析,設(shè)計了適用于電視劇數(shù)據(jù)錄入和存儲的數(shù)據(jù)庫結(jié)構(gòu),幫助電視劇決策,提升整體質(zhì)量、制作團隊、收視率和影響力。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。
下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細(xì)描述。
附圖說明
附圖用來提供對本發(fā)明的進一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中:
圖1為本發(fā)明實施例所述的電視劇內(nèi)容數(shù)據(jù)分類方法圖;
圖2為本發(fā)明實施例所述的電視劇基本信息內(nèi)容特征圖;
圖3為本發(fā)明實施例所述的用戶個人信息特征圖;
圖4為本發(fā)明實施例所述的用戶數(shù)據(jù)內(nèi)容特征圖;
圖5是本發(fā)明實施例所述的電視劇拍攝信息內(nèi)容特征圖;
圖6為本發(fā)明實施例所述的導(dǎo)演基本信息內(nèi)容特征圖;
圖7是本發(fā)明實施例所述的編劇基本信息內(nèi)容特征圖;
圖8是本發(fā)明實施例所述的主演基本信息內(nèi)容特征;
圖9是本發(fā)明實施例所述的電視劇ip分析內(nèi)容特征表;
圖10是本發(fā)明實施例所述的導(dǎo)演信息e-r圖;
圖11是本發(fā)明實施例所述的編劇信息e-r圖;
圖12是本發(fā)明實施例所述的主演信息e-r圖;
圖13是本發(fā)明實施例所述的用戶個人信息圖;
圖14是本發(fā)明實施例所述的電視劇內(nèi)容數(shù)據(jù)指標(biāo)分類圖;
圖15是本發(fā)明實施例所述的導(dǎo)演信息圖
圖16是本發(fā)明實施例所述的主演信息圖;
圖17是本發(fā)明實施例所述的編劇信息圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
為能對本發(fā)明的特征、目的及功能有更進一步的認(rèn)知與了解,下文特將本發(fā)明的組成及設(shè)計理念原由進行說明,結(jié)合附圖1的電視劇數(shù)據(jù)分類方法圖,對采集的電視劇內(nèi)容數(shù)據(jù)具體介紹如下:
一、電視劇基本信息
電視劇基本信息包括電視劇類型、評級、出品、發(fā)行、收視率等近三十個指標(biāo),其中數(shù)據(jù)定義的具體信息如圖2所示。通過電視劇基本信息的獲取,可以對電視劇各個方面進行綜合分析,得到電視劇成功的關(guān)鍵要素。
二、用戶數(shù)據(jù)
用戶數(shù)據(jù)分為兩部分:第一部分如圖3所示為用戶的個人信息特征,用包括用戶性別、地域、年齡等數(shù)據(jù);第二部分如圖4所示為用戶數(shù)據(jù)內(nèi)容特征表,包括電視貓網(wǎng)站、時光網(wǎng)、豆瓣網(wǎng)、百度指數(shù)、微博平臺的電視劇口碑和評分等四十多個指標(biāo)。通過分析用戶對電視劇的口碑、評價、熱度等可以為電視劇的宣傳營銷提供依據(jù)和幫助。
三、電視劇拍攝信息
通過對電視劇拍攝過程中各類數(shù)據(jù)的獲取和分析,我們可以通過對優(yōu)秀電視劇中各參數(shù)的分析,為新電視劇的拍攝提供指導(dǎo)。圖5為需要采集電視劇拍攝信息具體的內(nèi)容特征。將電視劇拍攝信息分為8組,包括圖像元素數(shù)據(jù)、聲音序列、男女主角相關(guān)拍攝信息、電視劇高潮信息、鏡頭分割獲取的數(shù)據(jù)、分鏡頭和其他電視劇拍攝信息相關(guān)的參數(shù)。
四、電視劇團隊成員分為25個組別,信息來源為電視劇片頭片尾字幕,包涵近四百個標(biāo)簽。表1為對電視劇團隊成員的分組和組內(nèi)詳情。
電視劇團隊成員組成中,演員組包括參加演出演員、聯(lián)合主演、動作替身等十多個標(biāo)簽;導(dǎo)演組包括導(dǎo)演、助理、現(xiàn)場副導(dǎo)演、執(zhí)行導(dǎo)演等近二十個標(biāo)簽;制片組包括電視劇制片人、總制片、制片人助理等十多個標(biāo)簽;編劇和劇本組包括劇本顧問、劇本繪制等;策劃監(jiān)制組包括總策劃、聯(lián)合策劃等近十個標(biāo)簽;同時還分有制作組、場記、藝術(shù)組、特效動畫組、后期剪輯合成組、服裝道具組、化妝、美術(shù)、燈光、攝影組、字幕、武術(shù)組、音樂制作等組別,包涵近四百個標(biāo)簽。
通過對電視劇制作團隊的成員獲取,可以構(gòu)建制片團隊庫,向制片方推薦參與過相似影片的制作團隊
五、導(dǎo)演基本信息
對導(dǎo)演基本信息包括個人簡介、代表作、主要獎項、生日、籍貫等二十多個指標(biāo)的獲取,其中數(shù)據(jù)定義的具體信息如圖6所示。
通過構(gòu)建導(dǎo)演信息庫,通過對導(dǎo)演參與過相似影片的綜合分析,可以為制片方推薦相關(guān)的優(yōu)秀導(dǎo)演。
六、演員基本信息
對演員基本信息包括個人簡介、代表作、主要獎項、生日、籍貫等二十多個指標(biāo)的獲取,其中數(shù)據(jù)定義的具體信息如圖7所示。
通過采集演員信息來構(gòu)建藝人電視劇標(biāo)簽庫,可以向制片方推薦參與過相似影片的演員。
七、編劇基本信息
對編劇基本信息包括個人簡介、代表作、主要獎項、生日、籍貫等二十多個指標(biāo)的獲取,其中數(shù)據(jù)定義的具體信息如圖8所示。
通過采集編劇信息來構(gòu)建電視劇編劇庫,可以為制片方挑選編劇提供參考。
八、電視劇ip分析
電視劇ip分析包括電視劇原著、作者、話題度、搜索指數(shù)等近二十個指標(biāo),其中數(shù)據(jù)定義的具體信息如圖9所示。通過對電視劇ip的分析,我們可以通過對原著小說的熱度分析來對劇本選擇提供指導(dǎo)。
九、其他
其他為待擴充的、有價值的電視劇數(shù)據(jù),在未來的數(shù)據(jù)處理和分析過程中會有所添加。
至少可以達到以下有益效果:為了全面的描述電影的內(nèi)容特征,將電影全息數(shù)據(jù)共分為八個級別,每個級別下細(xì)分電影數(shù)據(jù)組別,定義和統(tǒng)計的指標(biāo)共有600余個,幫助分析和提升電影整體影片質(zhì)量、幫助影片的宣傳營銷。
最后應(yīng)說明的是:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。