pandas 分时间段对数据进行count、sum、mean等计算?

可以使用 pandas 库中的 resample 函数对时间序列数据进行分组、聚合计算。

例如,假设有一个名为 df 的 DataFrame,其中包含日期时间列和要计算的值列,可以按月份对该数据进行计数:

counted = df.resample('M').count()

 

如果希望对值列进行求和,则可以使用以下代码:

summed = df.resample('M').sum()

 

如果希望计算每个月份的平均值,则可以使用以下代码:

averaged = df.resample('M').mean()

 

在上述代码中,’M’ 表示按月份进行聚合。还可以使用其他时间段(如天、小时等)来进行聚合。

可以使用 pandas 中的 resample 方法来按周对数据进行 count、sum、mean 等计算。假设有一个 DataFrame df,其中包含日期和数值两列,可以按以下方式进行操作:

  1. 将日期列设置为索引:df.set_index(‘日期列’, inplace=True)
  2. 使用 resample 方法将数据按周进行重采样,并选择要进行的计算方法(如 count、sum、mean):df.resample(‘W’).count()、df.resample(‘W’).sum()、df.resample(‘W’).mean()

其中 ‘W’ 表示按周重采样,还可以使用 ‘M’ 表示按月重采样、’D’ 表示按天重采样等。

   
 
 

为你推荐
Ta的个人站点

mb发布文章164篇


imcn微信公众号

分类