亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的示例代碼

瀏覽:53日期:2022-07-15 11:55:35

問(wèn)題

你需要處理一個(gè)很大的數(shù)據(jù)集并需要計(jì)算數(shù)據(jù)總和或其他統(tǒng)計(jì)量。

解決方案

對(duì)于任何涉及到統(tǒng)計(jì)、時(shí)間序列以及其他相關(guān)技術(shù)的數(shù)據(jù)分析問(wèn)題,都可以考慮使用 Pandas庫(kù) 。

為了讓你先體驗(yàn)下,下面是一個(gè)使用Pandas來(lái)分析芝加哥城市的 老鼠和嚙齒類動(dòng)物數(shù)據(jù)庫(kù) 的例子。 在我寫(xiě)這篇文章的時(shí)候,這個(gè)數(shù)據(jù)庫(kù)是一個(gè)擁有大概74,000行數(shù)據(jù)的CSV文件。

>>> import pandas>>> # Read a CSV file, skipping last line>>> rats = pandas.read_csv(’rats.csv’, skip_footer=1)>>> rats<class ’pandas.core.frame.DataFrame’>Int64Index: 74055 entries, 0 to 74054Data columns:Creation Date 74055 non-null valuesStatus 74055 non-null valuesCompletion Date 72154 non-null valuesService Request Number 74055 non-null valuesType of Service Request 74055 non-null valuesNumber of Premises Baited 65804 non-null valuesNumber of Premises with Garbage 65600 non-null valuesNumber of Premises with Rats 65752 non-null valuesCurrent Activity 66041 non-null valuesMost Recent Action 66023 non-null valuesStreet Address 74055 non-null valuesZIP Code 73584 non-null valuesX Coordinate 74043 non-null valuesY Coordinate 74043 non-null valuesWard 74044 non-null valuesPolice District 74044 non-null valuesCommunity Area 74044 non-null valuesLatitude 74043 non-null valuesLongitude 74043 non-null valuesLocation 74043 non-null valuesdtypes: float64(11), object(9)>>> # Investigate range of values for a certain field>>> rats[’Current Activity’].unique()array([nan, Dispatch Crew, Request Sanitation Inspector], dtype=object)>>> # Filter the data>>> crew_dispatched = rats[rats[’Current Activity’] == ’Dispatch Crew’]>>> len(crew_dispatched)65676>>>>>> # Find 10 most rat-infested ZIP codes in Chicago>>> crew_dispatched[’ZIP Code’].value_counts()[:10]60647 383760618 353060614 328460629 325160636 280160657 246560641 223860609 220660651 215260632 2071>>>>>> # Group by completion date>>> dates = crew_dispatched.groupby(’Completion Date’)<pandas.core.groupby.DataFrameGroupBy object at 0x10d0a2a10>>>> len(dates)472>>>>>> # Determine counts on each day>>> date_counts = dates.size()>>> date_counts[0:10]Completion Date01/03/2011 401/03/2012 12501/04/2011 5401/04/2012 3801/05/2011 7801/05/2012 10001/06/2011 10001/06/2012 5801/07/2011 101/09/2012 12>>>>>> # Sort the counts>>> date_counts.sort()>>> date_counts[-10:]Completion Date10/12/2012 31310/21/2011 31409/20/2011 31610/26/2011 31902/22/2011 32510/26/2012 33303/17/2011 33610/13/2011 37810/14/2011 39110/07/2011 457>>>

嗯,看樣子2011年10月7日對(duì)老鼠們來(lái)說(shuō)是個(gè)很忙碌的日子啊!^_^

討論

Pandas是一個(gè)擁有很多特性的大型函數(shù)庫(kù),我在這里不可能介紹完。 但是只要你需要去分析大型數(shù)據(jù)集合、對(duì)數(shù)據(jù)分組、計(jì)算各種統(tǒng)計(jì)量或其他類似任務(wù)的話,這個(gè)函數(shù)庫(kù)真的值得你去看一看。

以上就是Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的方法的詳細(xì)內(nèi)容,更多關(guān)于Python 數(shù)據(jù)的累加與統(tǒng)計(jì)的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 娇喘嗯嗯~轻点啊视频福利 | 国产精品资源手机在线播放 | 亚洲免费视频在线 | 亚洲欧美国产一区二区三区 | 国产亚洲精品激情一区二区三区 | 一级片在线观看视频 | 国产综合亚洲专区在线 | 国产一区二区三区不卡免费观看 | 中文字幕成人 | 成人午夜网 | 亚洲成人在线免费视频 | 日韩三级一区二区 | 91青草久久久久久清纯 | 国产精品久久毛片 | 亚洲第99页 | 午夜国产理论 | 无码精品一区二区三区免费视频 | 国产成人精品一区二三区在线观看 | 俄罗斯18videosex性欧美成人 | 免费特黄一级欧美大片在线看 | 亚洲毛片在线播放 | 一本色道久久88亚洲精品综合 | 欧美一级毛片片免费 | 欧美freesex10一13黑人 | 欧美午夜视频一区二区三区 | 国产三级精品三级 | 99ri在线精品视频在线播放 | 国内精品福利视频 | 久久久影院 | 久久精品二三区 | 国产精品亚洲一区二区在线观看 | 亚洲免费在线视频播放 | 欧美一级特毛片 | 国产伦一区二区三区四区久久 | 久久精品爱 | 性欧美17一18sex性高清播放 | 欧美最爽乱淫视频播放黑人 | 欧美一级片免费 | 国产男女视频 | 精品国产欧美精品v | 免费永久观看美女视频网站网址 |