DataFrame.groupby()所见的各种用法详解开发者社区

DataFrame.groupby()所见的各种用法详解

import pandas as pd
df = pd.DataFrame({'Gender' : ['男', '女', '男', '男', '男', '男', '女', '女', '女'],
          'name' : ['周杰伦', '蔡依林', '林俊杰', '周杰伦', '林俊杰', '周杰伦', '田馥甄', '蔡依林', '田馥甄'],
          'income' : [4.5, 2.9, 3.8, 3.7, 4.0, 4.1, 1.9, 4.1, 3.2],
         'expenditure' : [1.5, 1.9, 2.8, 1.7, 4.1, 2.5, 1.1, 3.4, 1.2]
#根据其中一列分组
df_expenditure_mean = df.groupby(['Gender']).mean()
#根据其中两列分组
df_expenditure_mean = df.groupby(['Gender', 'name']).mean()
#只对其中一列求均值
df_expenditure_mean = df.groupby(['Gender', 'name'])['income'].mean()

#不以组标签为索引，通过 as_index 来实现
df_expenditure_mean = df.groupby(['Gender', 'name'], as_index=False).mean()

# 使用了 as_index=False，但是从输出结果中可见没起到作用
df_apply = df.groupby(['Gender', 'name'], as_index=False).apply(lambda x: sum(x['income']-x['expenditure'])/sum(x['income']))
df_apply = pd.DataFrame(df_apply,columns=['存钱占比'])#转化成dataframe格式

# 加一句df_apply_index = df_apply.reset_index()
df_apply = df.groupby(['Gender', 'name'], as_index=False).apply(lambda x: sum(x['income']-x['expenditure'])/sum(x['income']))

推荐文章

完美的自行车 · 全功能 Visual Studio 组件集 ComponentOne 2018V2发布，提供轻量级的 .NET BI 仪表板 - 智能报表工具知识园地 - 博客园

1 年前

鬼畜的山羊 · CVPR 2023 | 人脸识别路漫漫：清华、北大等提出AT3D人脸识别系统攻击方法-CSDN博客

1 年前

怕考试的仙人球 · 数据分析-词频统计-nltk自然语言处理 - 简书

2 年前

严肃的苦咖啡 · SpringBoot jackson提供对LocalDate的支持方式_java_脚本之家

2 年前

玉树临风的针织衫 · WPF自己画的圆如何添加点击事件_百度知道

2 年前