728x90
split
groupby에 의해 split 된 상태를 추출할 수 있다. 그럼 tuple 형태로 그룹의 key값 value값이 추출된다.
grouped = df.gorupby('team')
for name, group in grouped:
print(name)
print(group)
get_group()
특정 key값을 가진 그룹의 정보만 추출할 수 있다.
grouped.get_group('Devils')
apply
그리고 추출된 group정보에는 세 가지 유형의 apply가 가능하다
- aggregation: 요약된 통계정보를 추출해준다.
- transformation: 해당 정보를 변환해 준다.
- filtration: 특정 정보를 제거해서 보여주는 필터링 기능
aggregation
특정 칼럼에 여러 개의 function을 apply 할 수도 있다.
grouped['Points'].agg([[np.sum, np.mean, np.std]])
transformation
- 그룹화된 칼럼 단위로 적용된다.
df
score = lambda x : (x)
grouped.transformation(score)
max, min
단 max나 min처럼 Series 데이터에 적용되는 데이터들은 Key값을 기준으로 Grouped 된 데이터 기준이다.
score = lambda x: (x.max())
'프로그래밍 언어 > Python' 카테고리의 다른 글
[Matplotlib] 영역을 지정하여 여러 개 그래프 적용 (0) | 2024.08.05 |
---|---|
[Matplotlib] 기본 개념(범례, 축 범위, 산점도) (0) | 2024.08.04 |
[pandas] groupby (0) | 2024.08.04 |
[pandas] loc, iloc (0) | 2024.08.04 |
[numpy] 인덱싱과 슬라이싱, vstack, hstack, hsplit (0) | 2024.08.04 |