Pandas 基础 (7) - Group By 的相关知识
引入一个 csv 文件:
import pandas as pd
city_df = pd.read_csv('/Users/rachel/Sites/pandas/py/pandas/7_group_by/weather_by_cities.csv')
city_df
输出:
根据 'city'字段分组:
g=city_df.groupby('city')
g
输出:
<pandas.core.groupby.groupby.DataFrameGroupBy object at 0x112a22c50>
循环输出分组后的数据:
for city, city_df in g:
print(city)
print(city_df)
输出:
获取其中的某一组数据:
g.get_group('mumbai')
输出:
下面是几个对数据处理的常用命令:
取每个组的最大值:
g.max()
输出:
取每个组的平均值:
g.mean()
获取每个组的常规信息:
g.describe()
输出图表:
%matplotlib inline
g.plot()
That's it.
本作品采用《CC 协议》,转载必须注明作者和本文链接