首页 > 科技 >

📊 Pandas 分组占比 | 📊 Pandas中分组统计的占比计算

发布时间:2025-03-30 00:54:06来源:

数据分析时,我们常常需要对数据进行分组并计算占比,这不仅能帮助我们更直观地理解数据分布,还能为决策提供有力支持。今天就来聊聊如何用Pandas实现这一功能!

首先,确保你的数据已经加载到DataFrame中,比如 `df`。假设你有一个包含销售数据的表格,其中有一列是地区(Region),另一列是销售额(Sales)。如果你想知道每个地区的销售额占总销售额的比例,可以这样做:

```python

计算每个地区的销售额占比

df['Sales_Ratio'] = df.groupby('Region')['Sales'].transform(lambda x: x / x.sum())

```

这样,每一行都会新增一列 `Sales_Ratio`,表示该行对应的销售额占该地区总销售额的比例。如果想进一步简化结果,只展示各地区的占比,可以直接使用 `groupby` 和 `agg` 方法:

```python

region_ratio = df.groupby('Region')['Sales'].sum().reset_index(name='Total_Sales')

region_ratio['Ratio'] = region_ratio['Total_Sales'] / region_ratio['Total_Sales'].sum()

print(region_ratio)

```

这种方法不仅高效,还能灵活适应各种复杂场景!✨

快试试吧,让数据为你说话!💪

免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。