home
📕

파이썬 데이터 전처리와 분석

과정 개요

Python 은 데이터 분석에 가장 많이 사용되는 언어 중의 하나입니다. 배우기 쉬운 장점도 있지만 강력한 능력을 가진 다양한 라이브러리가 있는 것도 Python 이 선호되는 중요한 원인 중 하나입니다. 그 중에서도 Numpy, Pandas 는 데이터 처리를 위한 강력한 라이브러리이며, Matplotlib, Seaborn 은 데이터 시각화를 위한 강력한 라이브러리입니다. 본 과정은 이들 라이브러리를 사용해 다양한 데이터 처리와 분석, 그리고 데이터 시각화를 어떻게 하는지 체계적인 학습과 다양한 실습을 통해 배우는 과정입니다.

교육 대상

Python 을 처음 배우시는 분
Python 을 활용한 데이터 분석에 관심이 있는 분

학습 목표

Python 기본 문법을 정확히 이해하고 사용할 수 있습니다.
Numpy 라이브러리를 사용해 배열을 처리할 수 있습니다.
Pandas 라이브러리를 사용해 데이터를 불러와 탐색하고 처리할 수 있습니다.
Matplotlib 라이브러리를 사용해 데이터를 시각화해 분석할 수 있습니다.
Seaborn 라이브러리를 사용해 더욱 화려한 데이터 시각화를 할 수 있습니다.

커리큘럼

1일차

1. Python 기본 정리
Google Colaboratory 사용
파이썬 기본 문법 복습
문자열, 리스트, 튜플 자료형 복습
딕셔러니, 집합 자료형 복습
Python 실습

2일차

2. Numpy 라이브러리
배열 만들기
배열 인덱싱과 슬라이싱
배열 변환
배열 연산
Shuffle, Sampling, Split
Numpy 실습

3일차

3. Pandas 라이브러리
시리즈 만들기
시리즈 정보 확인
시리즈 인덱싱과 슬라이싱
시리즈 연산
데이터프레임 만들기
인덱스 다루기
데이터프레임 변환
데이터프레임 정보 확인
데이터프레임 인덱싱과 슬라이싱
데이터프레임 변경
데이터프레임 집계
데이터프레임 Null 값 처리
Pandas 실습

4일차

4. Matplotlib 라이브러리
Line Graph
Bar Chart
Scatter Plot
Histogram
Bok Plot
Pie Chart
Matplotlib 실습
5. Seaborn 라이브러리
Line Graph
Bar Chart
Scatter Plot
Histogram
Bok Plot
Pie Chart
Seaborn 실습

5일차

6. 데이터 분석 프로세스
데이터분석 표준 프로세스 이해
다양한 데이터 탐색 방법
다양한 데이터 전 처리 방법
7. 데이터 분석 실습
데이터 불러오기
데이터 탐색
데이터 전 처리
데이터 시각화
8. 머신러닝 개념
머신러닝 이해하기
머신러닝 따라하기