文章导读

如何在 Pandas DataFrame 中创建累加和列

作者 2025年8月26日 11

本文介绍了如何使用 pandas DataFrame 创建一个新列，该列的值是另一列的累加和。我们将通过一个简单的示例，演示如何使用 cumsum() 函数实现此目标，并提供相应的代码示例和解释。

Pandas DataFrame 累加和列的创建

在数据分析和处理中，经常需要计算数据的累加和，并将其作为新的一列添加到 DataFrame 中。Pandas 提供了简单而强大的 cumsum() 函数来实现这个功能。

示例代码：

import pandas as pd  # 创建一个示例 DataFrame df = pd.DataFrame({     "field": ["u", "v", "w", "x", "y"],     "A": [60, 78, 42, 61, 36] })  # 使用 cumsum() 函数计算 A 列的累加和，并将其赋值给新列 B df["B"] = df["A"].cumsum()  # 打印 DataFrame print(df)

代码解释：

导入 Pandas 库： 首先，我们需要导入 Pandas 库，它是 python 中用于数据分析的核心库。
创建 DataFrame： 我们使用 pd.DataFrame() 函数创建一个示例 DataFrame，其中包含两列：field 和 A。
计算累加和： df[“A”].cumsum() 这行代码是关键。它调用了 DataFrame df 中 A 列的 cumsum() 方法。cumsum() 方法会计算 A 列的累加和，并返回一个 Series 对象。
创建新列： df[“B”] = … 这行代码将计算得到的累加和 Series 对象赋值给 DataFrame df 的新列 B。如果 B 列不存在，Pandas 会自动创建它。

输出结果：

运行上述代码，将得到以下输出：

  field   A    B 0     u  60   60 1     v  78  138 2     w  42  180 3     x  61  241 4     y  36  277

可以看到，新列 B 的值是 A 列的累加和。例如，B 列的第 1 行（索引为 0）的值是 60，第 2 行的值是 60 + 78 = 138，以此类推。

注意事项：

cumsum() 函数默认情况下会忽略 NaN 值。如果 DataFrame 中存在 NaN 值，可以根据需要使用 fillna() 函数进行填充。
cumsum() 函数可以应用于任何数值类型的列。

总结：

使用 Pandas 的 cumsum() 函数可以轻松地在 DataFrame 中创建累加和列。这个功能在时间序列分析、财务分析等领域非常有用。通过简单的代码，我们可以快速地计算数据的累加和，并将其用于后续的分析和建模。

评论（已关闭）

评论已关闭

Hello! 欢迎来到悠悠畅享网！

如何在 Pandas DataFrame 中创建累加和列

Pandas DataFrame 累加和列的创建

评论（已关闭）