文章詳情頁

python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

瀏覽：90日期：2022-07-25 15:24:15

問題描述

背景： Python3 下使用 bs4 的 select 去獲取 ZOZO首頁上方的 coupon 信息中店鋪名字。（國內ip貌似看不到優惠券信息，需要翻一下才能看到，最好是島國ip）

問題：發現自己找不到他的店鋪名字在寫在什么地方，不知道怎么取，前端 js 不懂，請教諸位解答。謝謝。

自己的代碼如下：

import requests, bs4shopName = ’BEAUTY&YOUTH’url = ’http://zozo.jp/’def getZozoCoupon(): res = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.110 Safari/537.36'}) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, ’html.parser’) elems = soup.select(’.bnrName’) return elems[0].text.strip()

如下截圖中是想要獲取的文字， python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

發現查看源碼中卻沒有文字。

說好的文字呢。。。

請教他的文字是在哪實現的啊，要怎么用bs4 select才出來，謝謝。

問題解答

回答1：

有可能用ajax從服務器獲取之后操作dom動態添加的吧，在瀏覽器里執行了js就文字也被添加進來。而你用爬蟲爬的時候沒有執行有關js所以也沒有添加文字。

要是真的這樣的話，你可以在瀏覽器的f12那里查看network，把獲取文字的那個http請求的url找出來，直接請求這個url獲取你需要的信息。

回答2：

我在瀏覽器中打開http://zozo.jp/查看源代碼并沒有找到你所要找的bnrName python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字

回答3：

你在瀏覽器上右鍵“查看網頁源碼”看看能不能找得你那段文字，如果找不到，那網頁應該是用js或者ajax動態加載的，想要爬取這種動態頁面，兩種方法，要么是自己手動模擬請求，要么就用selenium去抓吧

回答4：

確實是js生成的，已經采用headless瀏覽器模擬抓取了，謝謝大家！

Python 編程

上一條：python - 求解IP分割問題下一條：Python鏈接加中午，輸出中文不在鏈接里

相關文章：

1. javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎？2. javascript - 關于apply（）與call（）的問題3. python 利用subprocess庫調用mplayer時發生錯誤4. python - Pycharm的Debug用不了5. python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe6. html - eclipse 標簽錯誤7. 安全性測試 - nodejs中如何防mySQL注入8. javascript - axios請求回來的數據組件無法進行綁定渲染9. python - pycharm 自動刪除行尾空格10. python文檔怎么查看？

排行榜

					
					python - pycharm 自動刪除行尾空格
python 利用subprocess庫調用mplayer時發生錯誤
java - spring boot 如何打包成asp.net core 那種獨立應用?
docker - 各位電腦上有多少個容器啊？容器一多，自己都搞混了，咋辦呢？
docker start -a dockername 老是卡住，什么情況？
docker網絡端口映射，沒有方便點的操作方法么？
docker綁定了nginx端口 外部訪問不到
html - eclipse 標簽錯誤
python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe
python文檔怎么查看？
javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎？
				

熱門標簽

亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

python - beautifulSoup4 .select(’.bnrName’) 取不到到 text 文字