技術(shù)總結(jié)
本發(fā)明涉及一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法,步驟是:基于分布式日志收集系統(tǒng)Flume,用于將海量日志或數(shù)據(jù)實(shí)時(shí)的收集,達(dá)到實(shí)時(shí)高效可靠得處理各種數(shù)據(jù)源;基于分布式消息隊(duì)列Kafka集群用于將數(shù)據(jù)源的數(shù)據(jù)通過消息隊(duì)列送達(dá)到實(shí)時(shí)處理平臺(tái)上,能夠?qū)崿F(xiàn)高吞吐和線性擴(kuò)展;基于分布式流式計(jì)算集群用于消費(fèi)消息隊(duì)列的數(shù)據(jù),在內(nèi)存里進(jìn)行迭代運(yùn)算,實(shí)現(xiàn)秒級(jí)出運(yùn)算結(jié)果;基于key?value庫Redis集群,用于將結(jié)果存于內(nèi)存,實(shí)現(xiàn)毫秒級(jí)數(shù)據(jù)查詢服務(wù)。本發(fā)明通過建立一套標(biāo)準(zhǔn)流式計(jì)算模型,實(shí)時(shí)處理海量數(shù)據(jù),實(shí)現(xiàn)快速提取號(hào)碼熱度,給業(yè)務(wù)和市場人員快速直接的反應(yīng),為決策做更好的支撐;并不斷實(shí)時(shí)更新壯大號(hào)碼庫。
技術(shù)研發(fā)人員:雷俊智;鄭珍珍;余良波;梁勝利;潘琳;馬鈺璐;洪玉;劉逸;劉彥;陶曉軍;陳益輝
受保護(hù)的技術(shù)使用者:號(hào)百信息服務(wù)有限公司
文檔號(hào)碼:201611175911
技術(shù)研發(fā)日:2016.12.19
技術(shù)公布日:2017.06.13