亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

文章詳情頁

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

瀏覽：117日期：2022-07-25 17:42:22

問題描述

寫了一小段代碼，爬取博客園博客中的圖片，這段代碼對部分鏈接有效，還有一部分鏈接一爬就報錯，這是什么原因呢？

#coding=utf-8import urllibimport refrom lxml import etree#解析地址def getHtml(url): page = urllib.urlopen(url) html = page.read() return html#獲取地址并建樹url = 'http://www.cnblogs.com/fnng/archive/2013/05/20/3089816.html'html = getHtml(url)html = html.decode('utf-8')tree = etree.HTML(html)#保存圖片至本地reg = r’src='http://m.lshqa.cn/wenda/(.*?)' alt’imgre = re.compile(reg)imglist = re.findall(imgre, html)x = 0for imgurl in imglist: urllib.urlretrieve(imgurl, ’%s.jpg’ % x) x += 1

如圖，可以正確爬取圖片網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

若把url換為

url = 'http://www.cnblogs.com/baronzhang/p/6861258.html'

則立馬報錯

網頁爬蟲 - 博客園博客中的圖片怎么用python爬取下來？

求解決，謝謝！

問題解答

回答1：

錯誤提示已經很明顯了，你去看下網頁源代碼，匹配到的第一張圖片是一個GIF格式的，并且還是相對路徑，所以你是下載不到的，故提示IOerror，就算你下載到了，因為你指定了格式為JPG，你也打不開。因此你需要做的就是判斷和篩選

for imgurl in imglist: if 'gif' not in imgurl:urllib.urlretrieve(imgurl, ’%s.jpg’ % x)x += 1

看下我增加的地方，當然這只是最簡單的判斷，但可以保證你第二個程序不會報錯，也是給你一個思路！

Python 編程

上一條：Python鏈接加中午，輸出中文不在鏈接里下一條：python - 關于單例的線程安全問題

相關文章：

1. 安全性測試 - nodejs中如何防mySQL注入2. javascript - 關于apply（）與call（）的問題3. html - eclipse 標簽錯誤4. python 利用subprocess庫調用mplayer時發生錯誤5. python - Pycharm的Debug用不了6. datetime - Python如何獲取當前時間7. 請問PHPstudy中的數據庫如何創建索引8. python - pycharm 自動刪除行尾空格9. python文檔怎么查看？10. javascript - nginx反向代理靜態資源403錯誤?

排行榜

					
					python - pycharm 自動刪除行尾空格
python 利用subprocess庫調用mplayer時發生錯誤
java - spring boot 如何打包成asp.net core 那種獨立應用?
docker - 各位電腦上有多少個容器啊？容器一多，自己都搞混了，咋辦呢？
docker start -a dockername 老是卡住，什么情況？
docker網絡端口映射，沒有方便點的操作方法么？
docker綁定了nginx端口 外部訪問不到
javascript - nginx反向代理靜態資源403錯誤?
html - eclipse 標簽錯誤
請問PHPstudy中的數據庫如何創建索引
python文檔怎么查看？
				

熱門標簽

主站蜘蛛池模板：国产成人精品曰本亚洲 | 97精品国产福利一区二区三区 | 黄视频在线免费看 | 欧美日韩视频免费播放 | 性a视频 | 三级全黄的全黄三级三级播放 | 日韩有码第一页 | 国产国语在线播放视频 | 久草在线视频网 | 日本成人在线视频网站 | 中文字幕亚洲一区二区v@在线 | 亚洲男女视频 | 日本精品夜色视频一区二区 | 老司机午夜在线视频免费观 | 日本在线观看一级高清片 | 久草中文网 | 日本欧美国产精品 | 日韩亚洲天堂 | 国产精品在线观看 | 玖玖精品视频在线观看 | 日韩欧美视频一区二区在线观看 | 国产亚洲人成网站在线观看不卡 | 一区二区欧美视频 | 国产成人免费视频精品一区二区 | 日本乱人伦毛片 | 国产一级成人毛片 | 黄色毛片国产 | 成人影院久久久久久影院 | 97青草香蕉依人在线播放 | 7m视频精品凹凸在线播放 | 国产美女精品视频免费观看 | 普通话对白国产情侣自啪 | 国产精品11p | 免费精品99久久国产综合精品 | 国产成人精品无缓存在线播放 | 欧美成人艳星在线播放 | 一级片aaa| 欧美特黄视频在线观看 | 精品欧美一区二区在线看片 | 亚洲午夜a| 九九视频精品全部免费播放 |