본문 바로가기
Code/혼공단-9기

혼공단 9기 - 혼공분석 - 3주차

by Beyonder 2023. 1. 22.

혼자 공부하는 데이터 분석 with 파이썬

#혼공학습단 #혼공 #혼공분석

# 진도 기본 미션 선택 미션
3주차
(1/16 ~ 1/22)
Chapter 03 p. 182의 확인 문제 2번 풀고 인증하기 p. 219의 확인 문제 5번 풀고 인증하기

Chapter 03 데이터 정제하기

 

03-1 불필요한 데이터 삭제하기

__열 삭제하기

__행 삭제하기

__중복된 행 찾기

__그룹별로 모으기

__원본 데이터 업데이트하기

__[문제해결 과정] 일괄 처리 함수 만들기

[6가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

03-2 잘못된 데이터 수정하기

__데이터프레임 정보 요약 확인하기

__누락된 값 처리하기

__정규 표현식

__잘못된 값 바꾸기

__누락된 정보 채우기

__[문제해결 과정] 데이터를 이해하고 올바르게 정제하기

[2가지 키워드로 정리하는 핵심 포인트]

[표로 정리하는 핵심 함수와 메서드]

[확인 문제]

 

I. 미션

1. 기본 미션 - p. 182의 확인 문제 2번 풀고 인증하기

df1

  col1 col2 col3
0 1 a NaN
1 2 NaN NaN
2 3 c 100.0

 

2. 1번 문제의 df1 데이터프레임에서 'col1' 열의 합을 계산하는 명령으로 올바르지 않은 것은 무엇인가요?
① df['col1'].sum()

df[['col1']].sum()


df.loc[:, df.columns=='col1'].sum()


df.loc[:, [False,False,True]].sum() => 정답

'col1'이 아닌 'True'에 해당하는 'col3'에 대해 합산됨.


 

2. 선택 미션 - p. 219의 확인 문제 5번 풀고 인증하기

5. 다음과 df 데이터프레임에서 df.replace(r'ba.*', 'new', regex=True)의 결과는 무엇인가요?

df

  A B
0 bat abc
1 foo bar
2 bait xyz

'df.replace(r'ba.*', 'new', regex=True)' 는 'ba'로 시작되는 모든 값을 'new'로 변환하는 명령.  따라서, column 'A'의 'bat'와 'bait' 및 column 'B'의 'bar'가 각각 'new'로 변환됨.

① => 정답

  A B
0 new abc
1 foo new
2 new xyz

 

  A B
0 bat abc
1 foo bar
2 new xyz

  A B
0 new abc
1 foo new
2 newt xyz

  A B
0 bat abc
1 foo bar
2 new xyz