Pandas는 데이터 분석용 오픈 소스 라이브러리입니다.
Python Data Analysis Library
https://pandas.pydata.org/
이 글을 쓰는 시점엔 0.251 버전이 릴리즈 되어 있네요.
이번에 연습해보려고 하는 데이터 분석은 아래 2가지 형태입니다.
(기능적으로는 크게 3가지로 구분됩니다. - 파일 읽기, 필터링, Plot 그리기)
1. 엑셀 or CSV 파일 읽고 Plot 그리기
2. 엑셀 or CSV 파일 읽고, 원하는 형태로 필터링 후 Plot 그리기
하나하나 차근히 코드를 작성해보겠습니다.
우선 엑셀 데이터를 준비해주세요.
전 간단하게 아래와 같은 테이블을 만들었습니다.
엑셀 파일 또는 csv파일로 저장해주세요. 전 test.csv파일로 저장했습니다.
1. 엑셀 or CSV 파일 읽고 Plot 그리기
- Pandas 라이브러리를 pd로 쓰겠다고 import 한 다음, 미리 만들어둔 csv 파일을 읽는 코드입니다.
- *cp949 : 한국어판 마이크로 윈도우즈의 기본 코드 페이지, 한글 인코딩의 한 종류로 EUC-KR의 확장형이다.
'통합 완성형' 이나 '확장 완성형' 이라고도 한다.
- *utf-8 : UTF-8 방식은 대표적인 조합형의 유니코드 인코딩 방식
-----------------------------------------------------------------------------------------------------------------------------------
import pandas as pd
data = pd.read_csv('data/test.csv', encoding='cp949')
print(data)
-----------------------------------------------------------------------------------------------------------------------------------
파일 읽기 완성
한글이 제대로 나오게 하려면 아래와 같이 코드를 추가해 줍니다.
...??? 되어야 하는데. 안되네요. 오늘은 여기까지만 포스팅 하겠습니다.
'프로그래밍 > 파이썬' 카테고리의 다른 글
[23. 네이버 날씨 가져오기] 미세먼지 정보 가져오기 (0) | 2019.09.26 |
---|---|
[22. 파이썬 엑셀 데이터 분석] Pandas로 시작하는 데이터 분석 #1-1 (한글폰트 설정) (0) | 2019.09.25 |
[20. 파이썬 에디트 도구] 파이참 사용하기 (2) (0) | 2019.09.15 |
[18. 자동화 프로그램] 유튜브 구독자 늘리기, 자동 구독 프로그램 (271) | 2019.09.15 |
[17. 웹크롤링] 네이버 영어사전 크롤링을 통한 사전 프로그램 만들기 (3) | 2019.09.11 |