# 02. 数据分组整合之unique+groupby-中国经济财经网

您当前的位置：首页观点

# 02. 数据分组整合之unique+groupby

时间：2023-07-01 06:25:14 来源：博客园

(资料图)

前几天帮L师兄处理数据的时候，遇到了这样的问题：

我目前有如下的数据表格（假设数据举例）：但是在实际对数据进行异常点的检测时，我们需要针对不同的班级、不同的科目来进行。所以会需要进行数据的分组与整合。

班级	科目	分数
1班	语文	39.79778
2班	数学	5.846467
2班	英语	6.386726
3班	数学	68.92978
1班	数学	91.70355
3班	英语	5.590154
2班	语文	95.36453
1班	英语	62.11803
3班	语文	24.62038

为了便于分组和整合，在举例数据中特地模糊了姓名这一特征

提取思路：首先获取列中不重复的数据（unique），例如科目中的不重复数据为语文，数学，英语，再通过不重复数据作为索引去获取相关的行数据（groupby）。当我们需要针对不同的班级、不同的科目时，我们可以先对班级分组数据，再拿获取到的数据再进行分组，在代码中的表现就是循环中嵌套循环。

实现代码如下：

# %%# 运行之前需要关掉与程序有关的excel文件import numpy as npimport pandas as pdimport os#conding=utf8  data = pd.read_excel("成绩单.xlsx")# 按班级clas=data["班级"].unique()for c in clas:    print("班级"+clas)    cla=data.groupby(["班级"]).get_group(c)    suject=cla["科目"].unique()    # 按科目    for s in suject:        print("科目为"+s)        data_output=cla.groupby(["科目"]).get_group(s)    # 输出分组结果        print(data_output)# %%print("------------------------程序已运行完成--------------------------------")

标签：

上一篇：记者探访｜百盛商厦外立面已做出外墙改造样板，停业前最后一天人去楼空

下一篇：最后一页

最新推荐

# 02. 数据分组整合之unique+groupby

前几天帮L师兄处理数据的时候，遇到了这样的问题：我目前有如下的数据
2023-07-01
记者探访｜百盛商厦外立面已做出外墙改造样板，停业前最后一天人去楼空

半岛全媒体记者王丽平6月30日是中山路百盛停业改造前营业的最后一天。
2023-07-01
当前报道:割BP是什么意思割bp好处

条友们，我帮一个朋友问一下。就是去男科割bp，医生为什要用手捅你的pg
2023-07-01
肖央电影扑街我的姐姐票房破7亿快资讯

hello大家好，我是城乡经济网小晟来为大家解答以上问题，肖央电影扑街
2023-07-01
世界关注：并网成功！湖南安装首个自投自建的电网侧示范性储能电站通过验收

湖南日报·华声在线6月30日讯（通讯员赵永超胡红平）今天，湖南省工业
2023-06-30
环球观察：击掌的英语单词（击掌的英语）

来为大家解答以上的问题。击掌的英语单词，击掌的英语这个很多人还不知
2023-06-30
GT STEEL GROUP(08402)：陈柏麟获任公司秘书及授权代表_世界快看点

智通财经APP讯，GTSTEELGROUP(08402)发布公告，，陈恒已辞任公司秘书、
2023-06-30
世界实时：纳指期货涨1%

纳指期货涨1%：美股股指期货走强，纳指期货涨1%，标普500指数期货涨约0
2023-06-30
鹏扬双利债券基金基金经理茹昱离任

券中社6月30日讯，6月30日鹏扬双利债券基金公告称，因工作需要基金经理
2023-06-30
闫行知-史家胡同小学-小学组_重点聚焦

02:03北京日报客户端闫行知-史家胡同小学-小学组指导老师：刘杨朗读内
2023-06-30
当前短讯！外汇局：3月末我国全口径（含本外币）外债余额为171169亿元人民币

证券时报网讯，据外汇局消息，截至2023年3月末，我国全口径（含本外币
2023-06-30
香港中文大学北京中心在北京市东城区举行成立典礼天天速递

中国日报北京6月30日电（记者徐好雨）6月28日下午，香港中文大学北京中
2023-06-30
全球看热讯：巴黎5000万欧签拜仁铁卫将官宣南大王平替已找好

卢卡斯-埃尔南德斯现年27岁，2019年以8000万欧的高价从马竞加盟拜仁，
2023-06-30
环球今日报丨Redmi K70现身IMEI数据库：将搭载骁龙8 Gen3

RedmiK70系列手机已现身IMEI数据库，共包含RedmiK70E、RedmiK70以及Red
2023-06-30
世界聚焦：河北科技科技工程职业技术大学_河北科技工程职业技术大学相关内容简介介绍

河北科技工程职业技术大学（HebeiVocationalUniversityofTechnologyandE
2023-06-30
当前焦点!“同心庆七一建功新时代”莱阳举办老干部书画摄影展

大小新闻客户端6月29日讯（YMG全媒体记者纪殿国通讯员孙玮琦王瑞亭摄影
2023-06-30
买了苹果14pro在哪里发朋友圈

现在手机行业的发展可以说是日新月异，各大品牌的手机都是功能越来越强
2023-06-30
【独家】这儿真美作文怎么写_这儿真美作文

1、这儿美丽的景色，被你写的真的唯妙唯俏，你把每一个景色都展现出他
2023-06-30
每日动态!预约难度直线上升，博物馆免费预约票竟被高价代抢？

“明明免费的票，现在却要加价买，逛个博物馆也要找代抢”……暑期临近
2023-06-30
6月份制造业采购经理指数为49.0% 今日热搜

6月份，制造业采购经理指数（PMI）为49 0%，比上月上升0 2个百分点，制
2023-06-30
谁能带领交大昂立更好发展？复盘新旧实控方5次关键“交锋”

文｜和讯财经张星钰本周五，由交大昂立(600530)二股东、原实控方大众交通(600611)提请的临时股东大会...
2023-06-30
全面展示明代散文成就消息

近日，由首都师范大学中国诗歌研究中心、人民文学出版社、国家图书馆出
2023-06-30
6月30日生意社不锈钢板基准价为13721.43元/吨每日关注

6月30日，生意社不锈钢板基准价为13721 43元吨，与本月初(13814 29元
2023-06-30
焦点热讯:6月29日基金净值：鹏华精选成长混合A最新净值2.232，跌0.04%

6月29日，鹏华精选成长混合A最新单位净值为2 232元，累计净值为2 606元
2023-06-30
梦幻水陆大会副本攻略5人_梦幻水陆大会

1、1 112、首先创建副本，选择五人模式，人数够了之后可以通过副本官员
2023-06-30

相关推荐

相关推荐

广告

X 关闭

研报

广告

X 关闭

新股

天天速讯：山东首次统一指标开展部门整体支出绩效评价

天天速讯：山东首次统一指标开展部门整体支出绩效评价

环球热讯:山东未来三天大部地区晴间多云威海北部局部有小雪

环球热讯:山东未来三天大部地区晴间多云威海北部局部有小雪

观点

# 02. 数据分组整合之unique+groupby

# 02. 数据分组整合之unique+groupby

前几天帮L师兄处理数据的时候，遇到了这样的问题：我目前有如下的数据

原油

全球快看：不再安排期末考试！山东1市教育局发布最新通知

全球快看：不再安排期末考试！山东1市教育局发布最新通知

大盘