一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息采集領(lǐng)域,具體涉及一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法及裝置。
【背景技術(shù)】
[0002]微信公眾號(hào)推送的文章可以通過(guò)兩種途徑查看,一個(gè)是搜索引擎的微信搜索,但是搜索的信息太雜亂,且受到服務(wù)器提供商的限制。第二個(gè)是關(guān)注公眾號(hào),可接受公眾號(hào)推送的文章,但是每個(gè)微信賬號(hào)關(guān)注的公眾號(hào)有限。
[0003]在一般的微信采集方法中,通過(guò)模擬搜素引擎的請(qǐng)求,獲取關(guān)鍵詞搜索出來(lái)的微信文章,這種方法缺點(diǎn)是請(qǐng)求頻率會(huì)嚴(yán)格受到限制,出現(xiàn)需要輸入驗(yàn)證碼才能繼續(xù)請(qǐng)求,程序無(wú)法識(shí)別驗(yàn)證而導(dǎo)致采集中斷,信息采集效率低且信息雜亂。
【發(fā)明內(nèi)容】
[0004]為克服上述缺陷,本發(fā)明的目的即在于提供一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法及裝置。
[0005]本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的:
本發(fā)明的一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法,包括以下步驟:
將需要關(guān)注的微信公眾號(hào)賬號(hào)進(jìn)行收集;
在虛擬機(jī)上同時(shí)登陸一個(gè)以上的微信賬號(hào),虛擬機(jī)通過(guò)按鍵精靈模擬操作將收集到的微信公眾號(hào)賬號(hào)添加到微信賬號(hào)的任務(wù)隊(duì)列進(jìn)行關(guān)注;
虛擬機(jī)通過(guò)按鍵精靈模擬操作點(diǎn)擊微信公眾號(hào)主動(dòng)請(qǐng)求微信公眾號(hào)數(shù)據(jù),在虛擬機(jī)與互聯(lián)網(wǎng)數(shù)據(jù)交互時(shí)將虛擬機(jī)與互聯(lián)網(wǎng)交互的微信公眾號(hào)交互數(shù)據(jù)包進(jìn)行監(jiān)控并下載;掃描虛擬機(jī)上的微信公眾號(hào)交互數(shù)據(jù)包并提取所需的微信相關(guān)信息;
根據(jù)提取所需的微信相關(guān)信息解析出微信公眾號(hào)索引信息,訪問(wèn)該微信公眾號(hào)索引信息獲取微信公眾號(hào)的具體微信信息。
[0006]進(jìn)一步,還包括以下步驟:
掃描虛擬機(jī)上的微信公眾號(hào)交互數(shù)據(jù)包提取其他相關(guān)微信公眾號(hào)賬號(hào),將其他相關(guān)微信公眾號(hào)賬號(hào)添加到微信賬號(hào)的任務(wù)隊(duì)列進(jìn)行關(guān)注。
[0007]進(jìn)一步,將需要關(guān)注的微信公眾號(hào)賬號(hào)進(jìn)行收集為:通過(guò)互聯(lián)網(wǎng)信息文本提取微信號(hào),并將該微信號(hào)進(jìn)行審核、干預(yù)、分類(lèi),整理篩選出微信公眾號(hào)并存入微信公眾號(hào)賬號(hào)數(shù)據(jù)庫(kù)。
[0008]進(jìn)一步,所述微信公眾號(hào)索引信息為微信文章鏈接地址或微信公眾號(hào)賬號(hào)。
[0009]進(jìn)一步,所述微信公眾號(hào)的具體微信信息包括標(biāo)題、作者、發(fā)布時(shí)間、文章內(nèi)容。
[0010]更進(jìn)一步,所述虛擬機(jī)為安卓虛擬機(jī)。
[0011]—種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集裝置,該裝置與虛擬機(jī)數(shù)據(jù)連接,該裝置包括依次連接的: 將需要關(guān)注的微信公眾號(hào)賬號(hào)進(jìn)行收集的賬號(hào)收集單元;
在虛擬機(jī)與互聯(lián)網(wǎng)數(shù)據(jù)交互時(shí)將虛擬機(jī)與互聯(lián)網(wǎng)交互的微信公眾號(hào)交互數(shù)據(jù)包進(jìn)行監(jiān)控并下載的數(shù)據(jù)監(jiān)控及下載單元;
掃描虛擬機(jī)上的微信公眾號(hào)交互數(shù)據(jù)包并提取所需的微信相關(guān)信息的數(shù)據(jù)掃描提取單元;
根據(jù)提取所需的微信相關(guān)信息解析出微信公眾號(hào)索引信息,訪問(wèn)該微信公眾號(hào)索引信息獲取微信公眾號(hào)具體微信信息的解析及訪問(wèn)獲取單元。
[0012]進(jìn)一步,該裝置還包括與數(shù)據(jù)監(jiān)控及下載單元連接、掃描虛擬機(jī)上的微信公眾號(hào)交互數(shù)據(jù)包提取其他相關(guān)微信公眾號(hào)賬號(hào)的賬號(hào)提取單元。
[0013]本發(fā)明提供的一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法及裝置,該方法和裝置通過(guò)虛擬機(jī)、按鍵精靈模擬操作在虛擬機(jī)與互聯(lián)網(wǎng)數(shù)據(jù)交互時(shí)將虛擬機(jī)與互聯(lián)網(wǎng)交互的微信公眾號(hào)交互數(shù)據(jù)包進(jìn)行監(jiān)控并下載;虛擬機(jī)模擬登陸微信后,效果和手機(jī)一樣,登陸后可保持登陸狀態(tài)不掉線,如果特殊情況掉線可在恢復(fù)正常網(wǎng)絡(luò)訪問(wèn)的情況下自動(dòng)登陸,所以比較穩(wěn)定;采集對(duì)象智能增加,可自動(dòng)關(guān)注微信公眾號(hào),解決人工關(guān)注的繁瑣,解決了人工關(guān)注量增長(zhǎng)緩慢的問(wèn)題;訪問(wèn)不受限制,登陸狀態(tài)下,模擬點(diǎn)擊獲取微信公眾號(hào)數(shù)據(jù)不受限制,保證數(shù)據(jù)獲取的全面性;及時(shí)性好,模擬操作,可及時(shí)主動(dòng)獲取最新數(shù)據(jù)。
【附圖說(shuō)明】
[0014]為了易于說(shuō)明,本發(fā)明由下述的較佳實(shí)施例及附圖作以詳細(xì)描述。
[0015]圖1為本發(fā)明一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法的步驟流程圖;
圖2為本發(fā)明一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集裝置的模塊框圖。
【具體實(shí)施方式】
[0016]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0017]請(qǐng)參照?qǐng)D1,本發(fā)明的一種基于虛擬機(jī)的微信公眾號(hào)數(shù)據(jù)采集方法,包括以下步驟:
將需要關(guān)注的微信公眾號(hào)賬號(hào)進(jìn)行收集,具體為:通過(guò)互聯(lián)網(wǎng)信息文本提取微信號(hào),并將該微信號(hào)進(jìn)行審核、干預(yù)、分類(lèi),整理篩選出微信公眾號(hào)并存入微信公眾號(hào)賬號(hào)數(shù)據(jù)庫(kù);在服務(wù)器上搭建安卓虛擬機(jī),并且安裝安卓微信客戶(hù)端app,設(shè)置需要采集的微信賬號(hào),將用戶(hù)名和密碼在安卓虛擬機(jī)上登陸微信客戶(hù)端,即在虛擬機(jī)上同時(shí)登陸一個(gè)以上的微信賬號(hào),同時(shí)虛擬機(jī)通過(guò)按鍵精靈模擬操作將收集到的微信公眾號(hào)賬號(hào)添加到微信賬號(hào)的任務(wù)隊(duì)列進(jìn)行關(guān)注,微信賬號(hào)登陸后,為微信采集打開(kāi)了入口,但是采集對(duì)象是微信公眾號(hào)的文章鏈接,所以在采集微信文章鏈接之前,需要給微信公眾號(hào)賬號(hào)添加關(guān)注,關(guān)注需要采集的微信公眾號(hào),將收集到的微信公眾號(hào)添加到任務(wù)隊(duì)列,虛擬機(jī)通過(guò)按鍵精靈,執(zhí)行設(shè)定好的按鍵操作,將需要關(guān)注的微信公眾號(hào)自動(dòng)添加到關(guān)注列表,這樣該微信賬號(hào)就可以獲取關(guān)注的微信公眾號(hào)的文章信息;
虛擬機(jī)通過(guò)按鍵精靈模擬操作點(diǎn)擊微信公眾號(hào)主動(dòng)請(qǐng)求微信公眾號(hào)數(shù)據(jù),在虛擬機(jī)與互聯(lián)網(wǎng)數(shù)據(jù)交互時(shí)將虛擬機(jī)與互聯(lián)網(wǎng)交互的微信公眾號(hào)交互數(shù)據(jù)包進(jìn)行監(jiān)控并下載,即通過(guò)按鍵精靈,模擬點(diǎn)擊公眾號(hào),主動(dòng)請(qǐng)求微信數(shù)據(jù),包括獲取微信公眾號(hào)的歷史數(shù)據(jù),在虛擬機(jī)與互聯(lián)網(wǎng)交互的過(guò)程中,監(jiān)控他們之間的數(shù)據(jù)包,將數(shù)據(jù)包保存到指定路徑下;
解析數(shù)據(jù)包,掃描虛擬機(jī)上的微信公眾號(hào)交互數(shù)據(jù)包并提取所需的微信相關(guān)信息,并將該微信相關(guān)信息保存到指定文件夾;
當(dāng)前第1頁(yè)
1 
2