文章詳情頁

linux - python 抓取公眾號文章遇到驗(yàn)證問題

瀏覽：105日期：2022-06-25 14:22:41

問題描述

linux 下抓取微信公眾號文章遇到驗(yàn)證問題?。。。。。。?！

這是我要抓取的人民日報(bào)鏈接：http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1：首先瀏覽器上訪問是正常的。2：linux下訪問提示需要驗(yàn)證，以下是簡單的代碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

訪問的結(jié)果如下： linux - python 抓取公眾號文章遇到驗(yàn)證問題

補(bǔ)充說明下公眾號鏈接的獲取方式：1：先訪問鏈接：http://weixin.sogou.com/weixi...2：再獲取人民日報(bào)公眾號的鏈接進(jìn)行跳轉(zhuǎn)。

問題解答

回答1：

都不模擬header請求頭的，就能抓取嗎，建議先模擬request header再試一下

回答2：

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3：

linux - python 抓取公眾號文章遇到驗(yàn)證問題

現(xiàn)在在請求中加了header后，返回的錯(cuò)誤是這樣的。請各位大神麻煩再支下招

回答4：用request可以,本地環(huán)境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)內(nèi)容在紅色框那一行

linux - python 抓取公眾號文章遇到驗(yàn)證問題

Python 編程

上一條：python - linux 下用wsgifunc 運(yùn)行web.py該如何修改代碼下一條：linux - python 安裝 Anaconda 環(huán)境變量問題請教

相關(guān)文章：

1. MySQL的聯(lián)合查詢[union]有什么實(shí)際的用處2. PHP訂單派單系統(tǒng)3. 怎么能做出標(biāo)簽切換頁的效果，（文字內(nèi)容隨動(dòng)）4. mysql - sql 左連接結(jié)果union右連接結(jié)果，導(dǎo)致重復(fù)性計(jì)算怎么解決？5. 網(wǎng)頁爬蟲 - python 爬取網(wǎng)站并解析非json內(nèi)容6. mysql 遠(yuǎn)程連接出錯(cuò)10060，我已經(jīng)設(shè)置了任意主機(jī)了。。。7. php多任務(wù)倒計(jì)時(shí)求助8. 數(shù)組排序，并把排序后的值存入到新數(shù)組中9. 默認(rèn)輸出類型為json，如何輸出html10. mysql時(shí)間格式問題

排行榜

					
					javascript - webpack打包出現(xiàn)react-dom相關(guān)錯(cuò)誤
android - 能夠自定義安卓webview的內(nèi)核版本嗎
怎么能做出標(biāo)簽切換頁的效果，（文字內(nèi)容隨動(dòng)）
python - 安裝anaconda2出錯(cuò)
html - 爬蟲時(shí)出現(xiàn)“DNS lookup failed”，打開網(wǎng)頁卻沒問題，這是什么情況？
vue.js - vue獲取mongodb中的數(shù)據(jù)起初顯示未定義，但還是可以渲染
mac連接阿里云docker集群，已經(jīng)卡了2天了，求問？
javascript - 如何讓手機(jī)端的代碼只能在手機(jī)端執(zhí)行，在pc端的模擬器里面也不執(zhí)行
PHP訂單派單系統(tǒng)
數(shù)組排序，并把排序后的值存入到新數(shù)組中
為啥不用HBuilder?
				

熱門標(biāo)簽

色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

linux - python 抓取公眾號文章遇到驗(yàn)證問題