文章詳情頁
網(wǎng)頁爬蟲 - Python爬蟲返回狀態(tài)碼與實際情況不符?
瀏覽:211日期:2022-09-03 18:57:11
問題描述
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html
比如這個爬蟲,輸出狀態(tài)碼是200。
可是直接訪問http://www.sxxrcs.com/was5/web/是404,抓包響應(yīng)的也是404,請問這是為什么?
問題解答
回答1:用requests吧
import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:
200正常啊,requests方便快捷。
相關(guān)文章:
1. java - 關(guān)于File的問題?2. mysql - 在不允許改動數(shù)據(jù)表的情況下,如何優(yōu)化以varchar格式存儲的時間的比較?3. vim - docker中新的ubuntu12.04鏡像,運行vi提示,找不到命名.4. css - chrome下a標(biāo)簽嵌套img 顯示會多個小箭頭?5. docker網(wǎng)絡(luò)端口映射,沒有方便點的操作方法么?6. javascript - 網(wǎng)頁打印頁另存為pdf的代碼一個問題7. docker - 各位電腦上有多少個容器啊?容器一多,自己都搞混了,咋辦呢?8. java中返回一個對象,和輸出對像的值,意義在哪兒9. 一個網(wǎng)頁怎么連接到數(shù)據(jù)庫抓取信息呢10. 建議首頁視頻往頂部放
排行榜

熱門標(biāo)簽