數(shù)據(jù)處理的方法和裝置的制造方法
【專利摘要】本發(fā)明實施例提供了一種數(shù)據(jù)處理的方法和裝置,涉及通信技術領域。本發(fā)明的方法主要包括:獲取視頻播放日志,所述視頻播放日志為終端發(fā)送的視頻播放過程中生成的日志;從所述視頻播放日志中提取與預設屬性匹配的目標數(shù)據(jù);根據(jù)所述預設屬性,為所述目標數(shù)據(jù)添加信息標簽,以便后續(xù)根據(jù)所述信息標簽分析所述視頻播放日志,其中,所述信息標簽用于描述所述目標數(shù)據(jù)的基本特征。與現(xiàn)有技術中直接通過日志中的程序源代碼分析用戶行為信息以及終端狀況相比,本發(fā)明能夠為日志中各個屬性的數(shù)據(jù)添加用于描述其基本特征的信息標簽,在后續(xù)分析日志時,可直接通過信息標簽對其進行分析即可,從而提高了分析日志的效率。
【專利說明】
數(shù)據(jù)處理的方法和裝置
技術領域
[0001] 本發(fā)明實施例設及通信技術領域,尤其設及一種數(shù)據(jù)處理的方法和裝置。
【背景技術】
[0002] 在實際應用中,在視頻播放器播放視頻的過程中會產(chǎn)生大量的日志,用于記錄用 戶的操作行為、網(wǎng)絡狀況、視頻播放器的版本、終端系統(tǒng)的類型等信息。用戶可W通過日志 實現(xiàn)檢查錯誤發(fā)生的原因、尋找受到攻擊時攻擊者留下的痕跡等操作;若終端將生成的日 志上報給日志服務器,管理員還可W通過日志服務器對各個終端用戶的訪問行為信息W及 終端狀況進行分析。
[0003] 由于視頻播放器播放視頻的過程中生成的日志中的內(nèi)容是程序源代碼,所W管理 員分析各個用戶行為信息或者終端狀況時,需要從日志服務器側獲取各個終端發(fā)送的日 志,然后對日志中的程序源代碼進行分析,最后才能獲得需要的信息。然而,程序源代碼只 有專業(yè)的編程人員才能完全看懂,非編程人員并不能完全看懂,并且由于程序源代碼所表 達的信息并不直觀,所W即使是編程人員,也需要進行詳細分析,才能獲取需要的信息。由 此可知,現(xiàn)有的直接通過日志中的程序源代碼分析用戶行為信息W及終端狀況的效率較 低。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實施例提供一種數(shù)據(jù)處理的方法和裝置,用W解決現(xiàn)有技術直接通過日志 中的程序源代碼分析用戶行為信息W及終端狀況的效率較低的問題。
[0005] -方面,本發(fā)明實施例提供一種數(shù)據(jù)處理的方法,所述方法包括:
[0006] 獲取視頻播放日志,所述視頻播放日志為終端發(fā)送的視頻播放過程中生成的日 志;
[0007] 從所述視頻播放日志中提取與預設屬性匹配的目標數(shù)據(jù);
[000引根據(jù)所述預設屬性,為所述目標數(shù)據(jù)添加信息標簽,W便后續(xù)根據(jù)所述信息標簽 分析所述視頻播放日志,其中,所述信息標簽用于描述所述目標數(shù)據(jù)的基本特征。
[0009] 另一方面,本發(fā)明實施例提供一種數(shù)據(jù)處理的裝置,所述裝置包括:
[0010] 獲取單元,用于獲取視頻播放日志,所述視頻播放日志為終端發(fā)送的視頻播放過 程中生成的日志;
[0011] 提取單元,用于從所述獲取單元獲取的所述視頻播放日志中提取與預設屬性匹配 的目標數(shù)據(jù);
[0012] 添加單元,用于根據(jù)所述預設屬性,為所述提取單元提取的所述目標數(shù)據(jù)添加信 息標簽,W便后續(xù)根據(jù)所述信息標簽分析所述視頻播放日志,其中,所述信息標簽用于描述 所述目標數(shù)據(jù)的基本特征。
[0013] 本發(fā)明實施例提供的數(shù)據(jù)處理的方法和裝置,能夠在獲取視頻播放日志后,從該 視頻播放日志中提取與預設屬性匹配的目標數(shù)據(jù),并為目標數(shù)據(jù)添加用于描述目標數(shù)據(jù)基 本特征的信息標簽,在后續(xù)分析視頻播放日志中記錄的用戶行為信息w及終端狀況時,可 直接對信息標簽進行分析,而無需分析日志中的程序源代碼,從而提高了通過視頻播放日 志分析用戶行為信息W及終端狀況的效率。
【附圖說明】
[0014] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可W根 據(jù)運些附圖獲得其他的附圖。
[0015] 圖1為本發(fā)明實施例提供的一種數(shù)據(jù)處理的方法的流程圖;
[0016] 圖2為本發(fā)明實施例提供的一種數(shù)據(jù)處理的裝置的組成框圖;
[0017] 圖3為本發(fā)明實施例提供的另一種數(shù)據(jù)處理的裝置的組成框圖。
【具體實施方式】
[0018] 為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0019]本發(fā)明實施例提供了一種數(shù)據(jù)處理的方法,如圖1所示,該方法包括:
[0020] 101、獲取視頻播放日志。
[0021 ]其中,視頻播放日志為終端發(fā)送的視頻播放過程中生成的日志。當終端生成視頻 播放日志后,會將生成的視頻播放日志上報給服務器,W便分析者(編程人員或非編程人 員)根據(jù)各個終端發(fā)送的視頻播放日志對用戶行為信息W及終端狀況進行分析。在實際應 用中,視頻播放日志主要分為兩類:動作日志和屯、跳日志。其中,動作日志中包括與特定動 作相關的數(shù)據(jù)信息,例如,暫停、快進和快退等;屯、跳日志中包括與視頻播放有關的會持續(xù) 變化的數(shù)據(jù)信息,例如,視頻播放過程中終端的內(nèi)存占用量W及視頻下載量等。
[0022] 需要說明的是,服務器在獲取視頻播放日志時,可W實時獲取接收到的最新的視 頻播放日志,并對該最新的視頻播放日志進行步驟102-103所述的操作;也可W獲取預設周 期內(nèi)接收到的視頻播放日志,并對運段時間內(nèi)的視頻播放日志進行步驟102-103所述的操 作;也可W根據(jù)預設時間規(guī)則獲取視頻播放日志,并對獲取的視頻播放日志進行步驟102- 103所述的操作。
[0023] 102、從視頻播放日志中提取與預設屬性匹配的目標數(shù)據(jù)。
[0024] 其中,視頻播放日志中記錄有各種屬性信息,例如,時間信息、設備信息和網(wǎng)絡信 息等。在實際應用中,設備信息包括設備的靜態(tài)屬性信息和設備的動態(tài)屬性信息。其中,設 備的靜態(tài)屬性信息包括:設備品牌、設備型號、設備內(nèi)存容量、設備內(nèi)置存儲容量、設備外部 擴展存儲容量、設備操作系統(tǒng)、設備CPU(Central Processing Unit,中央處理器)型號、設 備CPU頻率、設備CPU核數(shù)和設備屏幕分辨率;設備的動態(tài)屬性信息包括:設備可用內(nèi)存大 小、設備CPU占用率、設備剩余電量、設備屏幕亮度和設備音量。此外,網(wǎng)絡信息包括網(wǎng)絡類 型、IP( Internet Protocol,網(wǎng)間協(xié)議)地址和地理位置。
[0025] 當服務器獲取視頻播放日志后,會將視頻播放日志中的數(shù)據(jù)分別與預設的各個屬 性進行匹配,從中獲取與各個屬性匹配成功的數(shù)據(jù)作為目標數(shù)據(jù),并對目標數(shù)據(jù)進行后續(xù) 添加信息標簽操作。
[0026] 103、根據(jù)預設屬性,為目標數(shù)據(jù)添加信息標簽,W便后續(xù)根據(jù)信息標簽分析視頻 播放日志。
[0027] 其中,信息標簽用于描述目標數(shù)據(jù)的基本特征。
[0028] 若預設屬性為時間,則從視頻播放日志中提取時間后,可對該時間添加用于描述 其基本特征的信息標簽,例如,工作時間標簽(包括工作時間段和非工作時間段)、自然時段 標簽(包括上午、中午、下午和晚間)、自然季節(jié)標簽(包括春、夏、秋、冬)、節(jié)假日標簽(例如 元旦假期、國慶節(jié)假期等)和帶寬特征標簽(包括帶寬忙時和帶寬閑時)等。
[0029] 若預設屬性為設備,則從視頻播放日志中提取關于設備的數(shù)據(jù)后,可對運些數(shù)據(jù) 添加用于描述其基本特征的信息標簽,例如,設備類型標簽(例如電視、手機等)、設備操作 系統(tǒng)類型標簽(例如蘋果系統(tǒng)、安卓系統(tǒng)或者微軟系統(tǒng))、設備操作系統(tǒng)版本標簽(即操作系 統(tǒng)的版本號)、設備內(nèi)存容量標簽(包括超高容量、高容量、中等容量和低容量四個等級)、設 備存儲容量標簽(包括超高容量、高容量、中等容量和低容量四個等級)、設備屏幕分辨率標 簽(包括移動兼容、極速、流楊、高清和超清五個等級)、設備內(nèi)存占用率標簽(包括非常高、 高、中、低和超低五個等級)、設備CPU占用率標簽(包括非常高、高、中、低和超低五個等級)、 設備剩余電量標簽(包括非常高、高、中、低和超低五個等級)、設備屏幕亮度標簽(包括非常 高、高、中、低和超低五個等級)和設備音量標簽(包括非常高、高、中、低和超低五個等級) 等。
[0030] 若預設屬性為網(wǎng)絡,則從視頻播放日志中提取關于網(wǎng)絡的數(shù)據(jù)后,可對運些數(shù)據(jù) 添加用于描述其基本特征的信息標簽,例如,網(wǎng)絡類型標簽(包括有線網(wǎng)絡、WiFi (Wireless-Fidelity,無線保真)、4G、3G和2G)、國家標簽(例如中國)、省市標簽(例如河北 省)、城市標簽(例如石家莊市)和運營商標簽(例如中國移動)等。
[0031] 當服務器為各個屬性的數(shù)據(jù)添加完對應的信息標簽后,會自動保存運些信息標 簽,W便后續(xù)編程人員或者非編程人員均可通過查看信息標簽分析用戶行為信息或者終端 狀態(tài)。
[0032] 需要說明的是,信息標簽的表現(xiàn)形式可W為自然語言、也可W為其他語言,在此不 作限定。
[0033] 本發(fā)明實施例提供的數(shù)據(jù)處理的方法,能夠在獲取視頻播放日志后,從該視頻播 放日志中提取與預設屬性匹配的目標數(shù)據(jù),并為目標數(shù)據(jù)添加用于描述目標數(shù)據(jù)基本特征 的信息標簽,在后續(xù)分析視頻播放日志中記錄的用戶行為信息W及終端狀況時,可直接對 信息標簽進行分析,而無需分析日志中的程序源代碼,從而提高了通過視頻播放日志分析 用戶行為信息W及終端狀況的效率。
[0034] 進一步的,為了進一步提高分析視頻播放日志的效率,可W在為目標數(shù)據(jù)添加信 息標簽之后,根據(jù)預設格式保存目標數(shù)據(jù)對應的信息標簽,從而使得在存在大量信息標簽 時,各個信息標簽之間的關系更加清晰。
[0035] 下面W W下兩種保存方式為例進行介紹:
[0036] 方式一:將目標數(shù)據(jù)對應的信息標簽導入到特定格式的表格中,并保存表格。
[0037] 在將信息標簽導入到表格中并保存表格后,當需要對視頻播放日志進行分析時, 分析者可直接獲取該表格,并對表格中的信息標簽進行分析,從中獲得用戶行為信息或者 終端狀況等信息。
[0038] 示例性的,表1為方式一中特定格式的表格,從第Ξ行起,每一行對應一條日志,其 中包括運條日志的各個屬性信息的信息標簽,分析者通過查看信息標簽可直觀獲知終端狀 況W及用戶行為信息(例如用戶在哪個時間觀看了視頻),從而提高了分析視頻播放日志的 效率。
[0039] 表 1
[0040]
[0042] 方式二:根據(jù)預設標簽順序,對視頻播放日志中的目標數(shù)據(jù)對應的信息標簽進行 排序;將排序后的信息標簽構成多維標簽向量,并保存多維標簽向量。
[0043] 具體的,當信息標簽W多維標簽向量的形式存儲時,一個多維標簽向量對應一條 視頻播放日志,分析者可通過查看多維標簽向量中的各個元素(一個元素是一個信息標 簽),實現(xiàn)對視頻播放日志的分析。
[0044] 在實際應用中,多維標簽向量的表現(xiàn)形式可W為"((工作時間標簽,自然時段標 簽,自然季節(jié)標簽,節(jié)假日標簽,帶寬特征標簽),(設備類型標簽,設備操作系統(tǒng)類型標簽, 設備操作系統(tǒng)版本標簽,設備內(nèi)存容量標簽,設備存儲容量標簽,設備屏幕分辨率標簽,設 備內(nèi)存占用率標簽,設備CPU占用率標簽,設備剩余電量標簽,設備屏幕亮度標簽,設備音量 標簽),(網(wǎng)絡類型標簽,國家標簽,省市標簽,城市標簽,運營商標簽))",也可W為"(工作時 間標簽,自然時段標簽,自然季節(jié)標簽,節(jié)假日標簽,帶寬特征標簽,設備類型標簽,設備操 作系統(tǒng)類型標簽,設備操作系統(tǒng)版本標簽,設備內(nèi)存容量標簽,設備存儲容量標簽,設備屏 幕分辨率標簽,設備內(nèi)存占用率標簽,設備CPU占用率標簽,設備剩余電量標簽,設備屏幕亮 度柄簽,設備首量t不簽,網(wǎng)絡類型t不簽,國豕t不簽,省市t不簽,城市t不簽,擔宮商柄簽),在此 不作限定。
[0045] 進一步的,根據(jù)預設屬性,為目標數(shù)據(jù)添加信息標簽的具體實現(xiàn)方式可W為:獲取 預設屬性對應的標簽條件;若目標數(shù)據(jù)與某標簽條件匹配成功,則為目標數(shù)據(jù)添加匹配成 功的標簽條件對應的信息標簽。
[0046] 具體的,每個屬性對應至少一個信息標簽,每個信息標簽包含至少一個標簽條件, 若目標數(shù)據(jù)與某信息標簽中的某標簽條件匹配,則服務器會為該目標數(shù)據(jù)添加匹配成功的 標簽條件對應的信息標簽。
[0047] 示例性的,已知預設屬性為時間,時間屬性對應的信息標簽包括工作時間標簽、自 然時段標簽、自然季節(jié)標簽、節(jié)假日標簽和帶寬特征標簽。下面W工作時間標簽為例進行介 紹:工作時間標簽中的標簽條件包括"若滿足工作日期間的8:00-19:00,則為工作時間段" 和"若滿足工作日期間的8 :00-19:00?外的時間,則為非工作時間段"。若目標數(shù)據(jù)為 "2015-11-10,10:36:23",則將目標數(shù)據(jù)分別與運兩個標簽條件進行匹配,匹配結果為目標 數(shù)據(jù)是工作時間段,則為該目標數(shù)據(jù)添加內(nèi)容為工作時間段的工作時間段標簽。
[0048] 進一步的,在上述實施例中提及,在獲取視頻播放日志時,可W實時獲取接收到的 最新的視頻播放日志,并對該最新的視頻播放日志中各個屬性的數(shù)據(jù)添加信息標簽;也可 W獲取在預設周期內(nèi)接收到的視頻播放日志,并對運些視頻播放日志中各個屬性的數(shù)據(jù)分 別添加信息標簽。
[0049] 需要說明的是,通過實時對接收到的最新的視頻播放日志中各個屬性的數(shù)據(jù)添加 信息標簽,能夠在分析者需要分析視頻播放日志中用戶行為信息W及終端狀況時,可快速 獲取當前時間之前的任何一條視頻播放日志的信息標簽,而無需等待信息標簽的添加,從 而提高了分析效率。
[0050] 進一步的,為了節(jié)省服務器側的存儲空間,提高資源利用率,可W在服務器為目標 數(shù)據(jù)添加信息標簽之后,將視頻播放日志刪除。也就是說,在獲得信息標簽后,可W將視頻 播放日中的程序源代碼刪除。
[0051] 進一步的,依據(jù)上述方法實施例,本發(fā)明的另一個實施例還提供了一種數(shù)據(jù)處理 的裝置,該裝置應用于服務器中,如圖2所示,該裝置包括:獲取單元21、提取單元22和添加 單元23。其中,
[0052] 獲取單元21,用于獲取視頻播放日志,視頻播放日志為終端發(fā)送的視頻播放過程 中生成的日志;
[0053] 當終端生成視頻播放日志后,會將生成的視頻播放日志上報給服務器,W便分析 者根據(jù)各個終端發(fā)送的視頻播放日志對用戶行為信息W及終端狀況進行分析。在實際應用 中,視頻播放日志主要分為兩類:動作日志和屯、跳日志。其中,動作日志中包括與特定動作 相關的數(shù)據(jù)信息,例如,暫停、快進和快退等;屯、跳日志中包括與視頻播放有關的會持續(xù)變 化的數(shù)據(jù)信息,例如,視頻播放過程中終端的內(nèi)存占用量W及視頻下載量等。
[0054] 提取單元22,用于從獲取單元21獲取的視頻播放日志中提取與預設屬性匹配的目 標數(shù)據(jù);
[0055] 其中,視頻播放日志中記錄有各種屬性信息,例如,時間信息、設備信息和網(wǎng)絡信 息等。在實際應用中,設備信息包括設備的靜態(tài)屬性信息和設備的動態(tài)屬性信息。其中,設 備的靜態(tài)屬性信息包括:設備品牌、設備型號、設備內(nèi)存容量、設備內(nèi)置存儲容量、設備外部 擴展存儲容量、設備操作系統(tǒng)、設備CPU型號、設備CPU頻率、設備CPU核數(shù)和設備屏幕分辨 率;設備的動態(tài)屬性信息包括:設備可用內(nèi)存大小、設備CPU占用率、設備剩余電量、設備屏 幕亮度和設備音量。此外,網(wǎng)絡信息包括網(wǎng)絡類型、IP地址和地理位置。
[0056] 添加單元23,用于根據(jù)預設屬性,為提取單元22提取的目標數(shù)據(jù)添加信息標簽,W 便后續(xù)根據(jù)信息標簽分析視頻播放日志,其中,信息標簽用于描述目標數(shù)據(jù)的基本特征。
[0057] 需要說明的是,信息標簽的表現(xiàn)形式可W為自然語言、也可W為其他語言,在此不 作限定。
[0058] 本發(fā)明實施例提供的數(shù)據(jù)處理的裝置,能夠在獲取視頻播放日志后,從該視頻播 放日志中提取與預設屬性匹配的目標數(shù)據(jù),并為目標數(shù)據(jù)添加用于描述目標數(shù)據(jù)基本特征 的信息標簽,在后續(xù)分析視頻播放日志中記錄的用戶行為信息W及終端狀況時,可直接對 信息標簽進行分析,而無需分析日志中的程序源代碼,從而提高了通過視頻播放日志分析 用戶行為信息W及終端狀況的效率。
[0化9] 進一步的,如圖3所示,該裝置還包括:
[0060]保存單元24,用于添加單元23為目標數(shù)據(jù)添加信息標簽之后,根據(jù)預設格式保存 目標數(shù)據(jù)對應的信息標簽。
[0061 ] 進一步的,如圖3所示,保存單元24,包括:
[0062] 導入模塊241,用于將目標數(shù)據(jù)對應的信息標簽導入到特定格式的表格中;
[0063] 第一保存模塊242,用于保存表格。
[0064] 進一步的,如圖3所示,保存單元24,包括:
[0065] 排序模塊243,用于根據(jù)預設標簽順序,對視頻播放日志中的目標數(shù)據(jù)對應的信息 標簽進行排序;
[0066] 構建模塊244,用于將排序模塊243排序后的信息標簽構成多維標簽向量;
[0067] 第二保存模塊245,用于保存構建模塊構建的多維標簽向量。
[006引進一步的,如圖3所示,添加單元23,包括:
[0069] 獲取模塊231,用于獲取預設屬性對應的標簽條件;
[0070] 添加模塊232,用于當目標數(shù)據(jù)與某標簽條件匹配成功時,為目標數(shù)據(jù)添加匹配成 功的標簽條件對應的信息標簽。
[0071] 進一步的,如圖3所示,獲取單元21,包括:
[0072] 第一獲取模塊211,用于實時獲取接收到的最新的視頻播放日志;
[0073] 第二獲取模塊212,用于獲取在預設周期內(nèi)接收到的視頻播放日志。
[0074] 通過第一獲取模塊211實時獲取接收到的最新的視頻播放日志,添加單元再對該 最新的視頻播放日志中各個屬性的數(shù)據(jù)添加信息標簽,能夠在分析者需要分析視頻播放日 志中用戶行為信息W及終端狀況時,可快速獲取當前時間之前的任何一條視頻播放日志的 信息標簽,而無需等待信息標簽的添加,從而提高了分析效率。
[00巧]進一步的,如圖3所示,該裝置還包括:
[0076] 刪除單元25,用于在添加單元23為目標數(shù)據(jù)添加信息標簽之后,將視頻播放日志 刪除。
[0077] 在獲得信息標簽后,刪除單元25將視頻播放日志刪除,能夠節(jié)省服務器的存儲空 間,從而提高資源利用率。
[0078] 該裝置實施例與前述方法實施例對應,為便于閱讀,本裝置實施例不再對前述方 法實施例中的細節(jié)內(nèi)容進行逐一寶述,但應當明確,本實施例中的裝置能夠?qū)獙崿F(xiàn)前述 方法實施例中的全部內(nèi)容。
[0079] 上述數(shù)據(jù)處理的裝置包括存儲器和處理器,上述獲取單元、提取單元和添加單元 等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元來實現(xiàn) 相應的功能。
[0080] W上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 W是或者也可W不是物理上分開的,作為單元顯示的部件可W是或者也可W不是物理單 元,即可W位于一個地方,或者也可W分布到多個網(wǎng)絡單元上??蒞根據(jù)實際的需要選擇其 中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性 的勞動的情況下,即可W理解并實施。
[0081] 通過W上的實施方式的描述,本領域的技術人員可W清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當然也可W通過硬件?;谶\樣的理解,上 述技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分可軟件產(chǎn)品的形式體現(xiàn)出來,該 計算機軟件產(chǎn)品可W存儲在計算機可讀存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指 令用W使得一臺計算機設備(可W是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行各個實施 例或者實施例的某些部分所述的方法。
[0082] 最后應說明的是:W上實施例僅用W說明本發(fā)明的技術方案,而非對其限制;盡管 參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可 W對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換; 而運些修改或者替換,并不使相應技術方案的本質(zhì)脫離本發(fā)明各實施例技術方案的精神和 范圍。
【主權項】
1. 一種數(shù)據(jù)處理的方法,其特征在于,所述方法包括: 獲取視頻播放日志,所述視頻播放日志為終端發(fā)送的視頻播放過程中生成的日志; 從所述視頻播放日志中提取與預設屬性匹配的目標數(shù)據(jù); 根據(jù)所述預設屬性,為所述目標數(shù)據(jù)添加信息標簽,以便后續(xù)根據(jù)所述信息標簽分析 所述視頻播放日志,其中,所述信息標簽用于描述所述目標數(shù)據(jù)的基本特征。2. 根據(jù)權利要求1所述的方法,其特征在于,在為所述目標數(shù)據(jù)添加信息標簽之后,所 述方法進一步包括: 根據(jù)預設格式保存所述目標數(shù)據(jù)對應的信息標簽。3. 根據(jù)權利要求1或2所述的方法,其特征在于,根據(jù)預設格式保存所述目標數(shù)據(jù)對應 的信息標簽,包括: 將所述目標數(shù)據(jù)對應的信息標簽導入到特定格式的表格中; 保存所述表格。4. 根據(jù)權利要求1或2所述的方法,其特征在于,根據(jù)預設格式保存所述目標數(shù)據(jù)對應 的信息標簽,包括: 根據(jù)預設標簽順序,對所述視頻播放日志中的目標數(shù)據(jù)對應的信息標簽進行排序; 將排序后的信息標簽構成多維標簽向量; 保存所述多維標簽向量。5. 根據(jù)權利要求1至4中任一項所述的方法,其特征在于,根據(jù)所述預設屬性,為所述目 標數(shù)據(jù)添加信息標簽,包括: 獲取所述預設屬性對應的標簽條件; 若所述目標數(shù)據(jù)與某標簽條件匹配成功,則為所述目標數(shù)據(jù)添加匹配成功的標簽條件 對應的信息標簽。6. 根據(jù)權利要求1至5中任一項所述的方法,其特征在于,在為所述目標數(shù)據(jù)添加信息 標簽之后,所述方法進一步包括: 將所述視頻播放日志刪除。7. -種數(shù)據(jù)處理的裝置,其特征在于,所述裝置包括: 獲取單元,用于獲取視頻播放日志,所述視頻播放日志為終端發(fā)送的視頻播放過程中 生成的日志; 提取單元,用于從所述獲取單元獲取的所述視頻播放日志中提取與預設屬性匹配的目 標數(shù)據(jù); 添加單元,用于根據(jù)所述預設屬性,為所述提取單元提取的所述目標數(shù)據(jù)添加信息標 簽,以便后續(xù)根據(jù)所述信息標簽分析所述視頻播放日志,其中,所述信息標簽用于描述所述 目標數(shù)據(jù)的基本特征。8. 根據(jù)權利要求7所述的裝置,其特征在于,所述裝置進一步包括: 保存單元,用于在所述添加單元為所述目標數(shù)據(jù)添加信息標簽之后,根據(jù)預設格式保 存所述目標數(shù)據(jù)對應的信息標簽。9. 根據(jù)權利要求7或8所述的裝置,其特征在于,所述保存單元,包括: 導入模塊,用于將所述目標數(shù)據(jù)對應的信息標簽導入到特定格式的表格中; 第一保存模塊,用于保存所述表格。10. 根據(jù)權利要求7或8所述的裝置,其特征在于,所述保存單元,包括: 排序模塊,用于根據(jù)預設標簽順序,對所述視頻播放日志中的目標數(shù)據(jù)對應的信息標 簽進彳丁排序; 構建模塊,用于將所述排序模塊排序后的信息標簽構成多維標簽向量; 第二保存模塊,用于保存所述構建模塊構建的所述多維標簽向量。11. 根據(jù)權利要求7至10中任一項所述的裝置,其特征在于,所述添加單元,包括: 獲取模塊,用于獲取所述預設屬性對應的標簽條件; 添加模塊,用于當所述目標數(shù)據(jù)與某標簽條件匹配成功時,為所述目標數(shù)據(jù)添加匹配 成功的標簽條件對應的信息標簽。12. 根據(jù)權利要求7至11中任一項所述的裝置,其特征在于,所述裝置進一步包括: 刪除單元,用于在所述添加單元為所述目標數(shù)據(jù)添加信息標簽之后,將所述視頻播放 日志刪除。
【文檔編號】H04N21/442GK105872731SQ201510845407
【公開日】2016年8月17日
【申請日】2015年11月26日
【發(fā)明人】杜炤
【申請人】樂視云計算有限公司