亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術文章
文章詳情頁

python - pandas讀取中文的時候亂碼 要如何解決?

瀏覽:135日期:2022-08-19 14:15:22

問題描述

下載了一份新浪微博的數據,但是原始數據是用csv的,在mac上沒辦法直接打開,讀取的時候,也會錯誤,會出現

UnicodeDecodeError: ’utf-8’ codec can’t decode byte 0x84 in position 36: invalid start byte

然后自己google,發現read_csv(’file’, encoding = 'ISO-8859-1') 這樣的時候讀取不會有錯

但是讀取進來發現是這樣的:

中文全部python - pandas讀取中文的時候亂碼 要如何解決?

然后測試了read_csv(’file’, encoding = 'gbk')read_csv(’file’, encoding = 'utf8')read_csv(’file’, encoding = 'gb18030')總之就是各種不行~基本的情況如下:

UnicodeDecodeError: ’gb18030’ codec can’t decode byte 0xaf in position 12: incomplete multibyte sequence

有大神遇到類似的情況嗎?

有大神說要數據 因為比較大,熱心的人可以看看 不過我覺得挺有用的下面是微博的數據鏈接:http://pan.baidu.com/s/1jHCOwCI 密碼:x58f

補充一下代碼吧~上面隨意一個文件下載下來(是csv格式的)然后用pandas打開就會出錯~

import pandasdf = pandas.read_csv('week1.csv')

問題解答

回答1:

給代碼和原數據

你寫點能代碼+有代表性的數據 即可,別搞幾G的大數據阿~

誰看啊?

回答2:

跟你一樣的情況,試了很多編碼仍然沒有用,但是看數據用UTF8編碼的話,有的數據能轉換成功,所以我暫時能想到的辦法就是用open去按行讀取,如果出現編碼轉換錯誤就丟掉,這樣下來數據量其實也不少

回答3:

你也可以試試用cp1252。最好的方法是先通過chardet包(https://pypi.python.org/pypi/...)看文件具體上用什么encoding。

回答4:

試過了沒有問題呀,我猜想應該是你環境編碼問題吧,可以嘗試一下以下代碼

#coding=utf-8import pandas as pdimport sysreload(sys)sys.setdefaultencoding('utf-8')df = pd.read_csv(’week1.csv’, encoding=’utf-8’, nrows=10)print df

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 成人免费福利网站在线看 | 国产亚洲精品午夜一区 | 欧美成人免费香蕉 | 成人毛片网站 | 欧美性另类69xxxx极品 | 在线免费看a | 欧美日韩亚洲在线观看 | 欧美国产日韩一区二区三区 | 特级aaaaaaaaa毛片免费视频 | 国产亚洲影院 | 性做久久久久免费看 | 精品国产一区二区在线观看 | 国产一区二区三区精品视频 | 免费一区二区三区久久 | 免费一级特黄特色黄大任片 | 99久久99久久久99精品齐 | 18videosex性欧美69超高清 | 精品国产成人 | 国产精品久久免费视频 | 国产欧美日韩综合精品一区二区 | 黄网站在线播放视频免费观看 | 亚洲午夜影视 | 久久九九国产精品怡红院 | 大学生久久香蕉国产线观看 | 亚洲男人的天堂网 | 男女男精品视频在线播放 | 秋霞手机入口二日韩区 | 综合图片亚洲网友自拍10p | 中文字幕va一区二区三区 | 久久视频在线免费观看 | 一区二区在线看 | 成人午夜性a一级毛片美女 成人午夜亚洲影视在线观看 | 亚洲美女性生活视频 | 九草在线免费观看 | 久久大胆视频 | 九九香蕉网 | 天天看片欧美 | 国产九九视频在线观看 | 成年女人在线视频 | 永久黄网站色视频免费观看99 | 朝鲜一级毛片 |