色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術(shù)文章
文章詳情頁

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

瀏覽:67日期:2022-07-04 10:10:04

鯤之鵬的技術(shù)人員將在本文介紹一種通過模擬操作微信App的方式采集指定公眾號的所有歷史數(shù)據(jù)的方法。

通過我們抓包分析發(fā)現(xiàn),微信公眾號的歷史數(shù)據(jù)是通過HTTP協(xié)議加載的,對應(yīng)的API接口如下圖所示,其中有四個關(guān)鍵參數(shù)(__biz、appmsg_token、pass_ticket以及Cookie)。

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

為了能夠拿到這四個參數(shù),我們需要模擬操作App,讓其產(chǎn)生這些參數(shù),然后我們再抓包獲取。對于模擬App操作,前面我們曾介紹過通過Python模擬安卓App的方法(詳見http://www.site-digger.com/html/articles/20180912/664.html)。對于HTTP集成抓包,前面我們曾介紹過Mitmproxy(詳見http://www.site-digger.com/html/articles/20181109/682.html)。

我們需要模擬操作微信完成如下步驟:

1. 啟動微信App

2. 點擊'通訊錄'

3. 點擊'公眾號'

4. 點擊要采集的公眾號

5. 點擊右上角的用戶圖像圖標(biāo)

6. 點擊'全部消息'

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

此時,我們可以從https://mp.weixin.qq.com/mp/profile_ext?action=home的應(yīng)答數(shù)據(jù)中捕獲__biz、appmsg_token以及pass_ticket三個關(guān)鍵參數(shù),以及請求頭中的Cookie值。如下圖所示。

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

有了上述四個參數(shù),我們就可以構(gòu)造出獲取歷史文章列表的API請求,通過調(diào)用API接口直接獲取數(shù)據(jù)(不需要再模擬App操作)。核心參數(shù)如下所示,通過改變offset參數(shù),可以拿到所有歷史數(shù)據(jù)。

# Cookie headers = {’Cookie’: ’rewardsn=; wxtokenkey=777; wxuin=584068438; devicetype=android-19; version=26060736; lang=zh_CN; pass_ticket=Rr8cO5c2******3tKGqe7aVZzV9TupvrK+1uHHmHYQGL2WFdKIE; wap_sid2=COKhxu4KElxckFZQ3QzTHU4WThEUk0zcWdrZjhGcUdYdEVSV3Y1X2NPWHNUakRrd1ZzMnpLTERpdE5rbmxjSTg******dlRBcUNRazZpOGxTZUVEQUTgNQJVO’} url = ’https://mp.weixin.qq.com/mp/profile_ext?’ data = {} data[’is_ok’] = ’1’ data[’count’] = ’10’ data[’wxtoken’] = ’’ data[’f’] = ’json’ data[’scene’] = ’124’ data[’uin’] = ’777’ data[’key’] = ’777’ data[’offset’] = ’0’ data[’action’] = ’getmsg’ data[’x5’] = ’0’ # 下面三個參數(shù)需要替換 # https://mp.weixin.qq.com/mp/profile_ext?action=home應(yīng)答數(shù)據(jù)里會暴漏這三個參數(shù) data[’__biz’] = ’MjM5MzQyOTM1OQ==’ data[’appmsg_token’] = ’993_V8%2BEmfVD7g%2FvMZ****4DNUJNFkg~~’ data[’pass_ticket’] = ’Rr8cO5c23ZngeQHRGy8E7gv*****pvrK+1uHHmHYQGL2WFdKIE’ url = url + urllib.urlencode(data)

以'數(shù)字工廠'這個微信公眾號為例,采集過程運行截圖如下所示:

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

輸出結(jié)果截圖如下所示:

基于Python采集爬取微信公眾號歷史數(shù)據(jù)

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: 微信 Python
相關(guān)文章:
主站蜘蛛池模板: 国产成人高清精品免费软件 | 全部免费国产潢色一级 | 欧美一级毛片在线看视频 | 国产成人免费网站在线观看 | 久草视频免费播放 | 成熟性xxxxx 成网站在线观看人免费 | 免费一级做a爰片性色毛片 免费一极毛片 | 在线三级网址 | 美女一级ba大片免色野外 | 久久国产精品自线拍免费 | 日本精品一区二区三区在线视频 | 性欧美高清久久久久久久 | 91精品专区 | 国产欧美一区二区三区免费 | 香蕉视频911 | 日韩免费观看的一级毛片 | 日韩欧美a级高清毛片 | 日本红怡院在线 | 欧美91精品久久久久网免费 | 国产日韩欧美一区二区三区综合 | 国产精品久久久久久久福利院 | 美女视频黄的免费视频网页 | 国产精品久久一区二区三区 | 国产综合精品久久久久成人影 | 国产精品黄在线观看免费 | 国内精品七七久久影院 | 日本美女黄网站 | aaa在线 | 亚洲欧美另类在线视频 | 欧美日韩精彩视频 | 欧美精品一区二区精品久久 | 看欧美毛片一级毛片 | 国产欧美日韩一区二区三区 | 自拍偷自拍亚洲精品一区 | 日韩毛片高清在线看 | 亚洲国产成a人v在线 | 暖暖免费高清日本一区二区三区 | 9l国产精品久久久久麻豆 | 亚洲一区二区三区在线视频 | avtt加勒比手机版天堂网 | 亚洲欧美一区二区三区综合 |