文章詳情頁

網頁爬蟲 - python的多進程怎么配合requests

瀏覽：126日期：2022-06-27 18:08:43

問題描述

這是單進程順序執行的代碼：

import requests,time,os,randomdef img_down(url): with open('{}'.format(str(random.random())+os.path.basename(url)),'wb') as fob:fob.write(requests.get(url).content)urllist=[]with open('urllist.txt','r+') as u: for a in u.readlines():urllist.append(a.strip())s=time.clock()for i in range(len(urllist)): img_down(urllist[i])e=time.clock()print ('time: %d' % (e-s))

這是多進程的代碼：

from multiprocessing import Poolimport requests,os,time,randomdef img_down(url): with open('{}'.format(str(random.random())+os.path.basename(url)),'wb') as fob:fob.write(requests.get(url).content)if __name__=='__main__': urllist=[] with open('urllist.txt','r+') as urlfob:for s in urlfob.readlines(): urllist.append(s.strip()) s=time.clock() p=Pool() for i in range(len(urllist)):p.apply_async(img_down,args=(urllist[i],)) p.close() p.join() e=time.clock()print ('time: {}'.format(e-s))

但是單進程和多進程花費的時間幾乎沒區別，問題大概是requests阻塞IO，請問理解的對不對，代碼該怎么修改達到多進程的目的？謝謝！

問題解答

回答1：

寫文件的瓶頸在磁盤IO，并不在CPU，你并行并沒有多大作用，你可以試試不要寫入文件再對比時間

回答2：

Pool 不帶參數的話是采用 os.cpu_count() or 1如果是單核CPU，或者采集不到數量就只有1個進程而已。

應該是這個原因。

Python 編程

上一條：Python這句話什么意思，語法有點怪？下一條：python3.x - Python中出現AttributeError: object has no attribute

相關文章：

1. windows誤人子弟啊2. mysql優化 - MySQL如何為配置表建立索引？3. 實現bing搜索工具urlAPI提交4. 關于mysql聯合查詢一對多的顯示結果問題5. 數據庫 - Mysql的存儲過程真的是個坑！求助下面的存儲過程哪里錯啦，實在是找不到哪里的問題了。6. 我在網址中輸入localhost/abc.php顯示的是not found是為什么呢？7. 如何用筆記本上的apache做微信開發的服務器8. python - linux怎么在每天的凌晨2點執行一次這個log.py文件9. MySQL主鍵沖突時的更新操作和替換操作在功能上有什么差別(如圖)10. 冒昧問一下，我這php代碼哪里出錯了？？？

排行榜

					
					javascript - 用on方法,綁定ui,下面的li 事件,ui,li是由ajax生成的,新手求教
javascript - ajax請求nodejs后臺，開啟服務器后，localhost:3000/index.html頁面既沒有報錯，也沒有文字。。。
請問browsersync如何監聽多個html文件
windows誤人子弟啊
html5和Flash對抗是什么情況？
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
android-studio - android studio 結巴了，有什么辦法可以治好它嗎？
冒昧問一下，我這php代碼哪里出錯了？？？
android - 安卓使用webview播放騰訊、優酷視頻的方法
javascript - DOM中，獲取屬性
javascript - webpack 使用babel轉es6的時候出現了問題，但是webpack沒有報錯！！急急急
				

熱門標簽

亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

網頁爬蟲 - python的多進程怎么配合requests