欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種大數(shù)據(jù)分析系統(tǒng)的制作方法

文檔序號:11584168閱讀:325來源:國知局
一種大數(shù)據(jù)分析系統(tǒng)的制造方法與工藝

本發(fā)明涉及一種數(shù)據(jù)分析系統(tǒng),具體是一種大數(shù)據(jù)分析系統(tǒng)。



背景技術(shù):

近年來網(wǎng)絡(luò)發(fā)展飛快,使用互聯(lián)網(wǎng)的人也越來越多,人們在使用互聯(lián)網(wǎng)進行日?;顒拥臅r候,例如網(wǎng)購、看節(jié)目等,會產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)對于電子商務(wù)網(wǎng)站或者互聯(lián)網(wǎng)媒體類的網(wǎng)站來說是非常寶貴的,利用這些大數(shù)據(jù)的處理分析,能得到寶貴的商業(yè)價值,可以應(yīng)用到很多領(lǐng)域內(nèi),大數(shù)據(jù)的出現(xiàn),正在引發(fā)全球范圍內(nèi)深刻的技術(shù)與商業(yè)變革,在技術(shù)上,大數(shù)據(jù)使從數(shù)據(jù)當中提取信息的常規(guī)方式發(fā)生了變化,在搜索引擎和在線廣告中發(fā)揮著重要作用的機器學習,被認為是大數(shù)據(jù)發(fā)揮真正價值的領(lǐng)域,所以在海量的數(shù)據(jù)統(tǒng)計中分析出人的行為、習慣等方式,從而最大程度幫助廣告主找到精準潛在客戶,提升了廣告的效果。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的在于提供一種大數(shù)據(jù)分析系統(tǒng),以解決上述背景技術(shù)中提出的問題。

為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:

一種大數(shù)據(jù)分析系統(tǒng),包括收集分析系統(tǒng)和數(shù)據(jù)存放系統(tǒng);所述收集分析系統(tǒng)設(shè)置有搜索引擎、第一標記模塊、過濾系統(tǒng)、臨時數(shù)據(jù)存放模塊、數(shù)據(jù)輸入模塊、比對模塊、過濾模塊、數(shù)據(jù)采集模塊、編譯模塊、數(shù)據(jù)庫、網(wǎng)絡(luò)服務(wù)器、計算模塊、對比模塊、storm拓撲結(jié)構(gòu)架構(gòu)、操作系統(tǒng)、調(diào)取模塊、廣告數(shù)據(jù)庫和客戶端;所述搜索引擎為收集分析系統(tǒng)的開始端口,搜索引擎便于使用者輸入關(guān)鍵詞,進行相關(guān)信息搜索;所述第一標記模塊設(shè)置在搜索引擎數(shù)據(jù)的輸出線路上,第一標記模塊用于將每個網(wǎng)絡(luò)ip地址輸出的數(shù)據(jù)標記一個特別的符號;所述過濾系統(tǒng)設(shè)置在第一標記模塊的數(shù)據(jù)輸出端,過濾系統(tǒng)用于阻礙個人搜索時搜索的不良信息數(shù)據(jù);所述臨時數(shù)據(jù)存放模塊連接著第一標記模塊的數(shù)據(jù)輸出端,臨時數(shù)據(jù)存放模塊用于短暫存放通過的數(shù)據(jù),便于對數(shù)據(jù)進行分析;所述數(shù)據(jù)輸入模塊設(shè)置在過濾系統(tǒng)的輸入端口,數(shù)據(jù)輸入模塊便于工作人員提前輸入需要過濾的不良信息數(shù)據(jù);所述比對模塊連接在臨時數(shù)據(jù)存放模塊和數(shù)據(jù)輸入模塊之間,比對模塊用于將臨時數(shù)據(jù)存放模塊和數(shù)據(jù)輸入模塊中的數(shù)據(jù)進行對比,從而標記出臨時數(shù)據(jù)存放模塊中的不良信息數(shù)據(jù);所述過濾模塊設(shè)置在比對模塊的數(shù)據(jù)輸出端口處且過濾模塊的輸出端連接著數(shù)據(jù)采集模塊,過濾模塊用于將比對模塊中標記的不良信息數(shù)據(jù)過濾掉,避免后續(xù)數(shù)據(jù)分析產(chǎn)生問題;所述數(shù)據(jù)采集模塊設(shè)置在第一標記模塊的數(shù)據(jù)輸出端口處,數(shù)據(jù)采集模塊將搜索的關(guān)鍵詞收集起來,便于后續(xù)處理;所述編譯模塊設(shè)置在數(shù)據(jù)采集模塊的數(shù)據(jù)輸出端口處,編譯模塊將收集的數(shù)據(jù)轉(zhuǎn)換為計算機語言,便于計算機系統(tǒng)進行處理;所述數(shù)據(jù)庫的數(shù)量對應(yīng)于網(wǎng)絡(luò)ip地址的數(shù)量,處于編譯模塊的數(shù)據(jù)輸出端口處,每個數(shù)據(jù)庫用于對應(yīng)存放標記有不同符號的數(shù)據(jù);所述數(shù)據(jù)庫選擇為mysql數(shù)據(jù)庫,mysql數(shù)據(jù)庫開放性強,便于工作人員隨時修改數(shù)據(jù)庫內(nèi)的數(shù)據(jù),避免不良信息過多;所述網(wǎng)絡(luò)服務(wù)器設(shè)置在數(shù)據(jù)庫之間,網(wǎng)絡(luò)服務(wù)器用于將各個數(shù)據(jù)庫聯(lián)系在一起,便于將各個數(shù)據(jù)庫的數(shù)據(jù)匯集處理,再反饋到每個數(shù)據(jù)庫中,節(jié)約處理時間;所述網(wǎng)絡(luò)服務(wù)器為apache服務(wù)器,apache服務(wù)器易于外界對數(shù)據(jù)庫進行訪問操作,便于管理者對數(shù)據(jù)庫中的數(shù)據(jù)進行其他方面的使用;所述計算模塊設(shè)置在網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)輸出端口處,計算模塊采用平均值計算規(guī)則,將關(guān)鍵詞出現(xiàn)的次數(shù)除以對應(yīng)天數(shù),得到數(shù)值,公式為l=n/t,其中l(wèi)為比值數(shù)字,n為關(guān)鍵詞出現(xiàn)次數(shù),t為從第一次出現(xiàn)后過的天數(shù);所述對比模塊設(shè)置在計算模塊的數(shù)據(jù)輸出端口,對比模塊用于對比每種標記的各個關(guān)鍵詞的計算比值,輸出最大比值的關(guān)鍵詞;所述storm拓撲結(jié)構(gòu)架構(gòu)設(shè)置在對比模塊的數(shù)據(jù)輸出端口處,storm拓撲結(jié)構(gòu)架構(gòu)用于矯正對比模塊在對比數(shù)據(jù)過程中發(fā)生錯誤,對其進行矯正;所述操作系統(tǒng)設(shè)置在網(wǎng)絡(luò)服務(wù)器的另一個數(shù)據(jù)輸出端口處,操作系統(tǒng)用于從各個數(shù)據(jù)庫中調(diào)取處理過后的數(shù)據(jù);所述操作系統(tǒng)選擇為linux系統(tǒng),linux系統(tǒng)便于不同客戶以各自的訪問權(quán)限訪問,互不影響;所述調(diào)取模塊設(shè)置在操作系統(tǒng)的輸出端口處,調(diào)取模塊根據(jù)操作系統(tǒng)中提取出的數(shù)據(jù)調(diào)取相關(guān)的廣告,發(fā)送至相對應(yīng)的網(wǎng)絡(luò)ip地址,實現(xiàn)人性化的廣告推送;所述廣告數(shù)據(jù)庫與調(diào)取模塊相連通,廣告數(shù)據(jù)庫便于調(diào)取模塊調(diào)取相對應(yīng)的廣告;所述客戶端設(shè)置在調(diào)取模塊的數(shù)據(jù)輸出端口處,一個網(wǎng)絡(luò)ip地址對應(yīng)一個客戶端,便于每個客戶端得到相應(yīng)的廣告推送;所述;所述數(shù)據(jù)存放系統(tǒng)設(shè)置有數(shù)據(jù)庫、第二標記模塊、第一存儲模塊、第二存儲模塊和累加模塊;所述第二標記模塊設(shè)置在每個數(shù)據(jù)庫的網(wǎng)絡(luò)服務(wù)器反饋端口,第二標記模塊將處理過的數(shù)據(jù)再次標記一次,便于與數(shù)據(jù)庫內(nèi)未處理的數(shù)據(jù)分開;所述第一存儲模塊設(shè)置在每個數(shù)據(jù)庫內(nèi),第一存儲模塊用于存放未處理的數(shù)據(jù);所述第二存儲模塊設(shè)置在每個數(shù)據(jù)庫內(nèi),第二存儲模塊用于存放已處理過的數(shù)據(jù);所述累加模塊設(shè)置在第一存儲模塊處,累加模塊用于計數(shù)關(guān)鍵詞出現(xiàn)的次數(shù),并且每過二十四小時,為公式l=n/t中的天數(shù)t加一,提供數(shù)據(jù)分析的準確度。

作為本發(fā)明進一步的方案:所述操作系統(tǒng)選擇為linux系統(tǒng)。

作為本發(fā)明再進一步的方案:所述網(wǎng)絡(luò)服務(wù)器為apache服務(wù)器。

作為本發(fā)明再進一步的方案:所述數(shù)據(jù)庫選擇為mysql數(shù)據(jù)庫。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:

本發(fā)明公布的搜索引擎便于使用者輸入關(guān)鍵詞,進行相關(guān)信息搜索;第一標記模塊用于將每個網(wǎng)絡(luò)ip地址輸出的數(shù)據(jù)標記一個特別的符號;過濾系統(tǒng)用于阻礙個人搜索時搜索的不良信息數(shù)據(jù);臨時數(shù)據(jù)存放模塊用于短暫存放通過的數(shù)據(jù),便于對數(shù)據(jù)進行分析;數(shù)據(jù)輸入模塊便于工作人員提前輸入需要過濾的不良信息數(shù)據(jù);比對模塊用于將臨時數(shù)據(jù)存放模塊和數(shù)據(jù)輸入模塊中的數(shù)據(jù)進行對比,從而標記出臨時數(shù)據(jù)存放模塊中的不良信息數(shù)據(jù);過濾模塊用于將比對模塊中標記的不良信息數(shù)據(jù)過濾掉,避免后續(xù)數(shù)據(jù)分析產(chǎn)生問題;數(shù)據(jù)采集模塊將搜索的關(guān)鍵詞收集起來,便于后續(xù)處理;編譯模塊將收集的數(shù)據(jù)轉(zhuǎn)換為計算機語言,便于計算機系統(tǒng)進行處理;每個數(shù)據(jù)庫用于對應(yīng)存放標記有不同符號的數(shù)據(jù);mysql數(shù)據(jù)庫開放性強,便于工作人員隨時修改數(shù)據(jù)庫內(nèi)的數(shù)據(jù),避免不良信息過多;網(wǎng)絡(luò)服務(wù)器用于將各個數(shù)據(jù)庫聯(lián)系在一起,便于將各個數(shù)據(jù)庫的數(shù)據(jù)匯集處理,再反饋到每個數(shù)據(jù)庫中,節(jié)約處理時間;apache服務(wù)器易于外界對數(shù)據(jù)庫進行訪問操作,便于管理者對數(shù)據(jù)庫中的數(shù)據(jù)進行其他方面的使用;計算模塊采用平均值計算規(guī)則,將關(guān)鍵詞出現(xiàn)的次數(shù)除以對應(yīng)天數(shù),得到數(shù)值,公式為l=n/t,其中l(wèi)為比值數(shù)字,n為關(guān)鍵詞出現(xiàn)次數(shù),t為從第一次出現(xiàn)后過的天數(shù);對比模塊用于對比每種標記的各個關(guān)鍵詞的計算比值,輸出最大比值的關(guān)鍵詞;storm拓撲結(jié)構(gòu)架構(gòu)用于矯正對比模塊在對比數(shù)據(jù)過程中發(fā)生錯誤,對其進行矯正;操作系統(tǒng)用于從各個數(shù)據(jù)庫中調(diào)取處理過后的數(shù)據(jù);linux系統(tǒng)便于不同客戶以各自的訪問權(quán)限訪問,互不影響;調(diào)取模塊根據(jù)操作系統(tǒng)中提取出的數(shù)據(jù)調(diào)取相關(guān)的廣告,發(fā)送至相對應(yīng)的網(wǎng)絡(luò)ip地址,實現(xiàn)人性化的廣告推送;廣告數(shù)據(jù)庫便于調(diào)取模塊調(diào)取相對應(yīng)的廣告;一個網(wǎng)絡(luò)ip地址對應(yīng)一個客戶端,便于每個客戶端得到相應(yīng)的廣告推送;第二標記模塊將處理過的數(shù)據(jù)再次標記一次,便于與數(shù)據(jù)庫內(nèi)未處理的數(shù)據(jù)分開;第一存儲模塊用于存放未處理的數(shù)據(jù);第二存儲模塊用于存放已處理過的數(shù)據(jù);累加模塊用于計數(shù)關(guān)鍵詞出現(xiàn)的次數(shù),并且每過二十四小時,為公式l=n/t中的天數(shù)t加一,提供數(shù)據(jù)分析的準確度;本發(fā)明的設(shè)計原理合理,工作性能好,運行功能強,充分展現(xiàn)了現(xiàn)代化發(fā)明的特點,發(fā)展前景十分良好。

附圖說明

圖1為大數(shù)據(jù)分析系統(tǒng)的示意圖。

圖2為大數(shù)據(jù)分析系統(tǒng)中數(shù)據(jù)存放系統(tǒng)的示意圖。

圖3為大數(shù)據(jù)分析系統(tǒng)中過濾系統(tǒng)的示意圖。

具體實施方式

下面結(jié)合具體實施方式對本專利的技術(shù)方案作進一步詳細地說明。

請參閱圖1-3,一種大數(shù)據(jù)分析系統(tǒng),包括收集分析系統(tǒng)和數(shù)據(jù)存放系統(tǒng);所述收集分析系統(tǒng)設(shè)置有搜索引擎、第一標記模塊、過濾系統(tǒng)、臨時數(shù)據(jù)存放模塊、數(shù)據(jù)輸入模塊、比對模塊、過濾模塊、數(shù)據(jù)采集模塊、編譯模塊、數(shù)據(jù)庫、網(wǎng)絡(luò)服務(wù)器、計算模塊、對比模塊、storm拓撲結(jié)構(gòu)架構(gòu)、操作系統(tǒng)、調(diào)取模塊、廣告數(shù)據(jù)庫和客戶端;所述搜索引擎為收集分析系統(tǒng)的開始端口,搜索引擎便于使用者輸入關(guān)鍵詞,進行相關(guān)信息搜索;所述第一標記模塊設(shè)置在搜索引擎數(shù)據(jù)的輸出線路上,第一標記模塊用于將每個網(wǎng)絡(luò)ip地址輸出的數(shù)據(jù)標記一個特別的符號;所述過濾系統(tǒng)設(shè)置在第一標記模塊的數(shù)據(jù)輸出端,過濾系統(tǒng)用于阻礙個人搜索時搜索的不良信息數(shù)據(jù);所述臨時數(shù)據(jù)存放模塊連接著第一標記模塊的數(shù)據(jù)輸出端,臨時數(shù)據(jù)存放模塊用于短暫存放通過的數(shù)據(jù),便于對數(shù)據(jù)進行分析;所述數(shù)據(jù)輸入模塊設(shè)置在過濾系統(tǒng)的輸入端口,數(shù)據(jù)輸入模塊便于工作人員提前輸入需要過濾的不良信息數(shù)據(jù);所述比對模塊連接在臨時數(shù)據(jù)存放模塊和數(shù)據(jù)輸入模塊之間,比對模塊用于將臨時數(shù)據(jù)存放模塊和數(shù)據(jù)輸入模塊中的數(shù)據(jù)進行對比,從而標記出臨時數(shù)據(jù)存放模塊中的不良信息數(shù)據(jù);所述過濾模塊設(shè)置在比對模塊的數(shù)據(jù)輸出端口處且過濾模塊的輸出端連接著數(shù)據(jù)采集模塊,過濾模塊用于將比對模塊中標記的不良信息數(shù)據(jù)過濾掉,避免后續(xù)數(shù)據(jù)分析產(chǎn)生問題;所述數(shù)據(jù)采集模塊設(shè)置在第一標記模塊的數(shù)據(jù)輸出端口處,數(shù)據(jù)采集模塊將搜索的關(guān)鍵詞收集起來,便于后續(xù)處理;所述編譯模塊設(shè)置在數(shù)據(jù)采集模塊的數(shù)據(jù)輸出端口處,編譯模塊將收集的數(shù)據(jù)轉(zhuǎn)換為計算機語言,便于計算機系統(tǒng)進行處理;所述數(shù)據(jù)庫的數(shù)量對應(yīng)于網(wǎng)絡(luò)ip地址的數(shù)量,處于編譯模塊的數(shù)據(jù)輸出端口處,每個數(shù)據(jù)庫用于對應(yīng)存放標記有不同符號的數(shù)據(jù);所述數(shù)據(jù)庫選擇為mysql數(shù)據(jù)庫,mysql數(shù)據(jù)庫開放性強,便于工作人員隨時修改數(shù)據(jù)庫內(nèi)的數(shù)據(jù),避免不良信息過多;所述網(wǎng)絡(luò)服務(wù)器設(shè)置在數(shù)據(jù)庫之間,網(wǎng)絡(luò)服務(wù)器用于將各個數(shù)據(jù)庫聯(lián)系在一起,便于將各個數(shù)據(jù)庫的數(shù)據(jù)匯集處理,再反饋到每個數(shù)據(jù)庫中,節(jié)約處理時間;所述網(wǎng)絡(luò)服務(wù)器為apache服務(wù)器,apache服務(wù)器易于外界對數(shù)據(jù)庫進行訪問操作,便于管理者對數(shù)據(jù)庫中的數(shù)據(jù)進行其他方面的使用;所述計算模塊設(shè)置在網(wǎng)絡(luò)服務(wù)器的數(shù)據(jù)輸出端口處,計算模塊采用平均值計算規(guī)則,將關(guān)鍵詞出現(xiàn)的次數(shù)除以對應(yīng)天數(shù),得到數(shù)值,公式為l=n/t,其中l(wèi)為比值數(shù)字,n為關(guān)鍵詞出現(xiàn)次數(shù),t為從第一次出現(xiàn)后過的天數(shù);所述對比模塊設(shè)置在計算模塊的數(shù)據(jù)輸出端口,對比模塊用于對比每種標記的各個關(guān)鍵詞的計算比值,輸出最大比值的關(guān)鍵詞;所述storm拓撲結(jié)構(gòu)架構(gòu)設(shè)置在對比模塊的數(shù)據(jù)輸出端口處,storm拓撲結(jié)構(gòu)架構(gòu)用于矯正對比模塊在對比數(shù)據(jù)過程中發(fā)生錯誤,對其進行矯正;所述操作系統(tǒng)設(shè)置在網(wǎng)絡(luò)服務(wù)器的另一個數(shù)據(jù)輸出端口處,操作系統(tǒng)用于從各個數(shù)據(jù)庫中調(diào)取處理過后的數(shù)據(jù);所述操作系統(tǒng)選擇為linux系統(tǒng),linux系統(tǒng)便于不同客戶以各自的訪問權(quán)限訪問,互不影響;所述調(diào)取模塊設(shè)置在操作系統(tǒng)的輸出端口處,調(diào)取模塊根據(jù)操作系統(tǒng)中提取出的數(shù)據(jù)調(diào)取相關(guān)的廣告,發(fā)送至相對應(yīng)的網(wǎng)絡(luò)ip地址,實現(xiàn)人性化的廣告推送;所述廣告數(shù)據(jù)庫與調(diào)取模塊相連通,廣告數(shù)據(jù)庫便于調(diào)取模塊調(diào)取相對應(yīng)的廣告;所述客戶端設(shè)置在調(diào)取模塊的數(shù)據(jù)輸出端口處,一個網(wǎng)絡(luò)ip地址對應(yīng)一個客戶端,便于每個客戶端得到相應(yīng)的廣告推送;所述;所述數(shù)據(jù)存放系統(tǒng)設(shè)置有數(shù)據(jù)庫、第二標記模塊、第一存儲模塊、第二存儲模塊和累加模塊;所述第二標記模塊設(shè)置在每個數(shù)據(jù)庫的網(wǎng)絡(luò)服務(wù)器反饋端口,第二標記模塊將處理過的數(shù)據(jù)再次標記一次,便于與數(shù)據(jù)庫內(nèi)未處理的數(shù)據(jù)分開;所述第一存儲模塊設(shè)置在每個數(shù)據(jù)庫內(nèi),第一存儲模塊用于存放未處理的數(shù)據(jù);所述第二存儲模塊設(shè)置在每個數(shù)據(jù)庫內(nèi),第二存儲模塊用于存放已處理過的數(shù)據(jù);所述累加模塊設(shè)置在第一存儲模塊處,累加模塊用于計數(shù)關(guān)鍵詞出現(xiàn)的次數(shù),并且每過二十四小時,為公式l=n/t中的天數(shù)t加一,提供數(shù)據(jù)分析的準確度。

上面對本專利的較佳實施方式作了詳細說明,但是本專利并不限于上述實施方式,在本領(lǐng)域的普通技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本專利宗旨的前提下做出各種變化。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
华亭县| 庆安县| 揭阳市| 鸡泽县| 磴口县| 巩留县| 固安县| 卢湾区| 高青县| 洪雅县| 团风县| 鄂伦春自治旗| 淅川县| 鲁山县| 齐齐哈尔市| 都兰县| 简阳市| 东山县| 沙湾县| 萝北县| 阿克| 信丰县| 若羌县| 福海县| 建始县| 望奎县| 松阳县| 封丘县| 大埔区| 虎林市| 札达县| 临沭县| 阳谷县| 阜平县| 昭平县| 德钦县| 新民市| 永吉县| 临沂市| 和林格尔县| 子长县|