色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:106日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: 国产香蕉国产精品偷在线观看 | 国产亚洲欧美ai在线看片 | 欧美一级久久 | 中文字幕精品视频在线 | 免费一级毛片免费播放 | 偷窥女厕国产在线视频 | 国产成人精品精品欧美 | 亚洲成人免费网站 | 中文字幕免费观看 | 国产深夜福利视频网站在线观看 | 欧美日韩国产一区三区 | 日韩三级黄 | 日韩在线播放中文字幕 | 欧美在线一区二区三区不卡 | 一级做a爰片久久毛片潮喷 一级做a爰片久久毛片美女 | 在线播放一区二区精品产 | 国产精品自在自线亚洲 | 热99re久久精品2久久久 | 在线观看免费视频国产 | 国产精品秦先生手机在线 | 韩国一级毛片大全女教师 | 一级片免费在线 | 一级一级毛片免费播放 | 亚洲国产成人91精品 | 精品国产一区二区三区2021 | 久久久午夜精品理论片 | 亚洲免费在线 | 天天爱天天做天天爽天天躁 | 亚洲精品国产一区二区三区在 | 国产精品久久久精品三级 | 131的美女午夜爱爱爽爽视频 | 成人免费看 | 偷自拍 | 国产v精品成人免费视频400条 | 一级特级欧美a毛片免费 | 青青草国产免费久久久91 | 国产成人精品日本亚洲网址 | 精品欧美一区二区精品久久 | 欧美色成人tv在线播放 | 国产一级片播放 | 久久精品成人欧美大片免费 |