pandas如何实现滑动窗口

今天小编给大家分享一下pandas如何实现滑动窗口的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。

介绍

窗口函数(Window Function)是一种在关系型数据库中使用的函数,通常用于计算某个范围内的数据。在数据分析中,窗口函数也是一种非常有用的工具,可以轻松地对数据进行滑动窗口处理,计算移动平均值、移动总和等等。

示例数据

为了演示窗口函数的使用,我们将使用一个示例数据集,其中包含每月的销售数据。

import pandas as pd
 
data = {'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'],
        'Sales': [10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120]}
 
df = pd.DataFrame(data)
df
   Month  Sales
0    Jan     10
1    Feb     20
2    Mar     30
3    Apr     40
4    May     50
5    Jun     60
6    Jul     70
7    Aug     80
8    Sep     90
9    Oct    100
10   Nov    110
11   Dec    120

移动平均值

移动平均值是一种常见的窗口函数,用于计算一段时间内的平均值。在pandas中,我们可以使用rolling函数来计算移动平均值。

df['MA'] = df['Sales'].rolling(window=3).mean()

在上面的代码中,我们使用了rolling函数,并将窗口大小设置为3,即计算每三个月的平均值。计算出的结果将存储在一个名为“MA”的新列中。

移动总和

移动总和是另一种常见的窗口函数,用于计算一段时间内的总和。在pandas中,我们可以使用rolling函数来计算移动总和。

df['MS'] = df['Sales'].rolling(window=3).sum()

在上面的代码中,我们使用了rolling函数,并将窗口大小设置为3,即计算每三个月的总和。计算出的结果将存储在一个名为“MS”的新列中。

df['MA'] = df['Sales'].rolling(window=3).mean()
... 
df
   Month  Sales     MA
0    Jan     10    NaN
1    Feb     20    NaN
2    Mar     30   20.0
3    Apr     40   30.0
4    May     50   40.0
5    Jun     60   50.0
6    Jul     70   60.0
7    Aug     80   70.0
8    Sep     90   80.0
9    Oct    100   90.0
10   Nov    110  100.0
11   Dec    120  110.0

最大值和最小值

除了移动平均值和移动总和之外,我们还可以使用rolling函数来计算一段时间内的最大值和最小值。

df['Max'] = df['Sales'].rolling(window=3).max()
df['Min'] = df['Sales'].rolling(window=3).min()

在上面的代码中,我们使用了rolling函数,并将窗口大小设置为3,分别计算了最大值和最小值。计算出的结果将存储在名为“Max”和“Min”的新列中。

df
   Month  Sales     MA    Max    Min    Sum
0    Jan     10    NaN    NaN    NaN    NaN
1    Feb     20    NaN    NaN    NaN    NaN
2    Mar     30   20.0   30.0   10.0   60.0
3    Apr     40   30.0   40.0   20.0   90.0
4    May     50   40.0   50.0   30.0  120.0
5    Jun     60   50.0   60.0   40.0  150.0
6    Jul     70   60.0   70.0   50.0  180.0
7    Aug     80   70.0   80.0   60.0  210.0
8    Sep     90   80.0   90.0   70.0  240.0
9    Oct    100   90.0  100.0   80.0  270.0
10   Nov    110  100.0  110.0   90.0  300.0
11   Dec    120  110.0  120.0  100.0  330.0

以上就是“pandas如何实现滑动窗口”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注云搜网行业资讯频道。


【AD】美国洛杉矶/香港/日本VPS推荐,回程电信CN2 GIA线路,延迟低、稳定性高、免费备份_搬瓦工

【AD】炭云:36元/年/1GB内存/20GB SSD空间/500GB流量/5Gbps端口/KVM/香港/国际线路LUMEN