728x90

split
groupby에 의해 split 된 상태를 추출할 수 있다. 그럼 tuple 형태로 그룹의 key값 value값이 추출된다.
grouped = df.gorupby('team')
for name, group in grouped:
print(name)
print(group)

get_group()
특정 key값을 가진 그룹의 정보만 추출할 수 있다.
grouped.get_group('Devils')

apply
그리고 추출된 group정보에는 세 가지 유형의 apply가 가능하다
- aggregation: 요약된 통계정보를 추출해준다.
- transformation: 해당 정보를 변환해 준다.
- filtration: 특정 정보를 제거해서 보여주는 필터링 기능
aggregation

특정 칼럼에 여러 개의 function을 apply 할 수도 있다.
grouped['Points'].agg([[np.sum, np.mean, np.std]])

transformation
- 그룹화된 칼럼 단위로 적용된다.
df

score = lambda x : (x)
grouped.transformation(score)

max, min
단 max나 min처럼 Series 데이터에 적용되는 데이터들은 Key값을 기준으로 Grouped 된 데이터 기준이다.
score = lambda x: (x.max())

'프로그래밍 언어 > Python' 카테고리의 다른 글
| [Matplotlib] 영역을 지정하여 여러 개 그래프 적용 (0) | 2024.08.05 |
|---|---|
| [Matplotlib] 기본 개념(범례, 축 범위, 산점도) (0) | 2024.08.04 |
| [pandas] groupby (1) | 2024.08.04 |
| [pandas] loc, iloc (0) | 2024.08.04 |
| [numpy] 인덱싱과 슬라이싱, vstack, hstack, hsplit (0) | 2024.08.04 |