pandas 分时间段对数据进行count、sum、mean等计算?
可以使用 pandas 库中的 resample 函数对时间序列数据进行分组、聚合计算。
例如,假设有一个名为 df 的 DataFrame,其中包含日期时间列和要计算的值列,可以按月份对该数据进行计数:
counted = df.resample('M').count()
如果希望对值列进行求和,则可以使用以下代码:
summed = df.resample('M').sum()
如果希望计算每个月份的平均值,则可以使用以下代码:
averaged = df.resample('M').mean()
在上述代码中,’M’ 表示按月份进行聚合。还可以使用其他时间段(如天、小时等)来进行聚合。
可以使用 pandas 中的 resample 方法来按周对数据进行 count、sum、mean 等计算。假设有一个 DataFrame df,其中包含日期和数值两列,可以按以下方式进行操作:
- 将日期列设置为索引:df.set_index(‘日期列’, inplace=True)
- 使用 resample 方法将数据按周进行重采样,并选择要进行的计算方法(如 count、sum、mean):df.resample(‘W’).count()、df.resample(‘W’).sum()、df.resample(‘W’).mean()
其中 ‘W’ 表示按周重采样,还可以使用 ‘M’ 表示按月重采样、’D’ 表示按天重采样等。
为你推荐