본문 바로가기
Code/길벗 학습단 14기 - 파이썬 데이터 분석

길벗 학습단 14기 - 파이썬 데이터 분석 - 4주차 학습후기

by Beyonder 2025. 5. 5.

 

 

코딩 자율학습 잔재미코딩의 파이썬 데이터 분석 입문 - 예스24

핵심만 쏙쏙! 반복 학습으로 데이터 인재로 거듭나기이 책은 데이터 분석을 체계적으로 익히려는 분과 파이썬을 배웠지만 다음 단계로 무엇을 해야 할지 고민인 분을 위한 책이다. 파이썬 데이

www.yes24.com

 

4주차
16일
17일
18일
19일
20일
목차
10장 실습: 마케팅 데이터 분석하기
10.3 데이터 시각화하기
11장 실습: 데이터 분석과 시각화 심화
11.1 영화 데이터 심층 분석하기
11장 실습: 데이터 분석과 시각화 심화
11.2 부동산 데이터 심층 분석하기
11장 실습: 데이터 분석과 시각화 심화
11.3 전자상거래 데이터 분석하고 시각화하기
부록 A 향후 학습 가이드
부록 B 생성형 AI 활용 방법

 

10장 실습: 마케팅 데이터 분석하기

10.3 데이터 시각화하기

10.3.1 마케팅 채널별 고객 획득 비용 시각화하기

  • reset_index() 메서드는  인덱스를 데이터프레임의 열로 변환.  그룹화된 결과를 시리즈에서 데이터프레임으로 변환해 데이터 분석이나 시각화를 용이하게 만드는 역할을 함.
10.3.2 마케팅 채널별 평균 구매 전환율 시각화하기
 
 
10.3.3 타깃 고객 그룹별 평균 구매 전환율 시각화하기
 
10.3.4 캠페인 기간별 평균 구매 전환율 시각화하기
 
10.3.5 지역별 고객 획득 비용 시각화하기

11장 실습: 데이터 분석과 시각화 심화

11.1 영화 데이터 심층 분석하기

11.1.1 연도별 평균 영화 평점 확인하기

  • 데이터 확인하기
  • 데이터 전처리하기
  • line() 함수 살펴보기
    • line_shape: 그래프의 선 모양을 결정
      • linear(기본값): 데이터 포인트를 직선으로 연결
      • spine: 부드러운 곡선으로 연결
      • hv: 계단형 그래프, 수평->수직 순서로 이동
      • vh: 계단형 그래프, 수직->수평 순서로 이동
      • hvh: 수평->수직->수평 순서로 이동
      • vhv: 수직->수평->수직 순서로 이동

 

  • markers: 그래프의 데이터 포인트를 점으로 표시
    • False(기본값): 선만 표시
    • True: 각 데이터 포인트에 마커(점) 추가

 

  • color_discrete_sequence: 그래프 선의 색상을 설정
    • 단일 색상: ['green']
    • 여러 색상의 선: ['green', 'blue', 'red']
  • template: Ploty에서 제공하는 다양한 스타일 템플릿으로 그래프의 배경, 글꼴, 색상 조합을 쉽게 변경 가능
    • plotly(기본값): 기본 테마
    • plotly_white: 흰색 배경으로 깔끔한 느낌
    • plotly_dark: 어두운 배경으로 대조를 높임
    • seaborn: 부드러운 색감과 간결한 느낌
    •  simple_white: 머니멀하고 간결한 디자인

11.1.2 장르별 평점 분포 확인하기

  • 상자 그림
  • 상자 그림으로 시각화하기
  • nlargest(): 데이터프레임의 특정 열 값을 기준으로 가장 큰 값 상위 n개 데이터를 추출할 때 사용하는, Pandas에서 제공하는 메서드.
df.nlargest(n, columns, keep='first')

 

  • box() 함수
  • update_laytou() 메서드
  • 데이터 전처리하기
  • 히트맵으로 시각화하기
  • coor() 메서드: 데이터프레임의 수치형 열 간 상관관계수를 계산
df.corr(method='pearson', min_periods=1))
    • method:
      • pearson(기본값): 두 변수간 선형 관례를 측정하는 피어슨 상관계수를 계산.  연속형 데이터에서 사용
      • kendall: 변수간 순서 일치성을 츧ㄱ정하는 켄달 타우 상관관계를 계산
      • spearman: 변수간 비선형 관계를 측정하는 스피어만 상관계수를 계산
    •   min_periods: 상관계수 계산에 필요한 최소한의 유효 데이터 수를 지정
  • imshow() 함수: plotly.express 모듈 제공 함수.  2차원 데이터를 히트맵으로 시각화할 때 사용

11.2 부동산 데이터 심층 분석하기

11.2.1 각 구의 연도별 평균 거래금액 구하기

  • 데이터 확인하기
  • 시군구 열을 시/구/동 열로 분리하기

 

  • 연도 추출하기
문자열[start:end:step]

 

  • 구와 연도별 평균 거래금액 계산하기

11.3 전자상거래 데이터 분석하고 시각화하기

 

 
부록 A 향후 학습 가이드
 
부록 B 생성형 AI 활용 방법