Code/혼공단-9기
혼공단 9기 - 혼공분석 - 3주차
Beyonder
2023. 1. 22. 21:27
혼자 공부하는 데이터 분석 with 파이썬
#혼공학습단 #혼공 #혼공분석
# | 진도 | 기본 미션 | 선택 미션 |
3주차 (1/16 ~ 1/22) |
Chapter 03 | p. 182의 확인 문제 2번 풀고 인증하기 | p. 219의 확인 문제 5번 풀고 인증하기 |
Chapter 03 데이터 정제하기
03-1 불필요한 데이터 삭제하기
__열 삭제하기
__행 삭제하기
__중복된 행 찾기
__그룹별로 모으기
__원본 데이터 업데이트하기
__[문제해결 과정] 일괄 처리 함수 만들기
[6가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수와 메서드]
[확인 문제]
03-2 잘못된 데이터 수정하기
__데이터프레임 정보 요약 확인하기
__누락된 값 처리하기
__정규 표현식
__잘못된 값 바꾸기
__누락된 정보 채우기
__[문제해결 과정] 데이터를 이해하고 올바르게 정제하기
[2가지 키워드로 정리하는 핵심 포인트]
[표로 정리하는 핵심 함수와 메서드]
[확인 문제]
I. 미션
1. 기본 미션 - p. 182의 확인 문제 2번 풀고 인증하기
df1
col1 | col2 | col3 | |
0 | 1 | a | NaN |
1 | 2 | NaN | NaN |
2 | 3 | c | 100.0 |
2. 1번 문제의 df1 데이터프레임에서 'col1' 열의 합을 계산하는 명령으로 올바르지 않은 것은 무엇인가요? |
① df['col1'].sum()![]() |
② df[['col1']].sum()![]() |
③ df.loc[:, df.columns=='col1'].sum()![]() |
④ df.loc[:, [False,False,True]].sum() => 정답 'col1'이 아닌 'True'에 해당하는 'col3'에 대해 합산됨. ![]() |
2. 선택 미션 - p. 219의 확인 문제 5번 풀고 인증하기
5. 다음과 df 데이터프레임에서 df.replace(r'ba.*', 'new', regex=True)의 결과는 무엇인가요? |
df
A | B | |
0 | bat | abc |
1 | foo | bar |
2 | bait | xyz |
'df.replace(r'ba.*', 'new', regex=True)' 는 'ba'로 시작되는 모든 값을 'new'로 변환하는 명령. 따라서, column 'A'의 'bat'와 'bait' 및 column 'B'의 'bar'가 각각 'new'로 변환됨.
① => 정답
A | B | |
0 | new | abc |
1 | foo | new |
2 | new | xyz |
②
A | B | |
0 | bat | abc |
1 | foo | bar |
2 | new | xyz |
③
A | B | |
0 | new | abc |
1 | foo | new |
2 | newt | xyz |
④
A | B | |
0 | bat | abc |
1 | foo | bar |
2 | new | xyz |