文章詳情頁

python - 爬取某網站時需要瀏覽器刷新一次才能返回真實的頁面數據？

瀏覽：108日期：2022-08-10 17:31:34

問題描述

請求所需參數全部帶上了，并且已帶上cookies,已修改header，拿到的數據是提示刷新的HTML，如圖： python - 爬取某網站時需要瀏覽器刷新一次才能返回真實的頁面數據？原網頁是動態加載的瀑布流，即往不斷下拉就不斷有內容呈現出來，靜候大神，目前采用scrapy框架，暫時還不想上selenium+phantomjs，太重了

問題解答

回答1：

動態加載的數據你應該找ajax api請求，而不是在網頁找，工欲善其事必先利其器，善用 F12。

回答2：

這種情況比抓取一個代理ip網頁，使用cookie但是報錯好解決多了＝＝，你完全可以判斷當前頁面內容然后進行模擬刷新～重要的是保持會話。

如果還不行的話，可以加referer再試一試

Python 編程

上一條：flask - python 多維字典遍歷下一條：python - 關于基于tornado的websocket服務在本機上調試的問題

相關文章：

1. php怎么連接數據庫2. 在視圖里面寫php原生標簽不是要迫不得已的情況才寫嗎3. 小皮面板MySQL怎么設置開機自起呢4. 多種方式登陸的的用戶數據表設計5. 請問這是jeson嗎？如何遍歷出來？6. 獲取上次登錄ip的原理是啥？7. 為什么點擊登陸沒反應8. 為什么說非對象調用成員函數fetch()9. phpstudy v8打開數據庫就出錯，而phpstudy 2018不會10. 請問下tp6框架的緩存在哪里設置，或者說關閉?

排行榜

					
					javascript - swiper2索引的問題
python lxml解析中文的問題
在視圖里面寫php原生標簽不是要迫不得已的情況才寫嗎
java - git項目遷移到SVN怎么實現的？哪位大神指點指點
python - pymysql操作數據庫成功，但為何檢查了數據庫那邊，數據沒有更新的？
mysql報錯 unknown column ’a.plat’ in ON clause
javascript - nodejs log4js收集訪問者信息的問題
python - (lambda x: lambda: x) 的目的是啥？
求救一下，用新版的phpstudy，數據庫過段時間會消失是什么情況？
java - maven項目，每次使用update project都會把Dynamic Web Module變成3.1？
android - layout_widthPercent加載dependencies后還是不能使用，是什么原因？
				

熱門標簽

亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

python - 爬取某網站時需要瀏覽器刷新一次才能返回真實的頁面數據？