블로그 이미지
잡다한 취미 생활 및 일상에 대한 소소한 이야기를 적어나가는 블로그입니다.
붉은kkk

공지사항

최근에 올라온 글

최근에 달린 댓글

글 보관함

calendar

1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

이제 드디어 제가 파이썬을 사용하고자 한 계기가 됐던 워드 클라우드 만들기 입니다.


빅데이터 분석에 대한 책 & 광고 등을 보다 보면 빠지지 않고 등장했었던 것 같아요. 


시각적으로 바로 알기 쉽게 한번 보여드리고~


이렇게 단어의 빈도수 등을 고려해서, 글자의 크기, 색깔 등등이 강조되서 나오는게 워드 클라우드입니다. 


휴... 한글폰트의 사용이 어려워서 고생했던 생각이 잠깐 나네요. (몇시간을 헤맸습니다...)


이제 윈도우환경에서 워드 클라우드를 구현하기 위해 해야될 일들을 하나 하나 알려드릴게요.


1. 네이버 나눔글꼴 설치

https://hangeul.naver.com/2017/nanum

위 링크로 들어가서 네이버 나눔글꼴을 설치해줍시다. (무료 폰트여서 사용하는데 문제가 없답니다.)

- 나눔글꼴의 지적 재산권은 네이버, 네이버문화재단에 있으며,  오픈 라이선스로 자유롭게 수정하고 재배포 하실 수 있습니다



2. 워드클라우드 라이브러리 설치

     pip install wordcloud

     - pip 설치는 지난 시간에 설명을 했기 때문에, 상세 내용은 생략할게요. 

       

     http://nearman.tistory.com/entry/3-그래프출력-파이썬-matplotlib-그래프-출력-한글폰트-사용 

     


3. 워드클라우드로 표현하고 싶은 텍스트 자료 준비

   - 저는 test.txt 파일에 내용을 기입해서 준비를 해볼게요.

     "워드 클라우드 파이썬 단어구름 빅데이터 분석
      Wordcloud python big data analysis 워드클라우드 워드클라우드 워드클라우드 

      python python python python
     워드클라우드 워드클라우드 워드클라우드 워드클라우드 워드클라우드 워드클라우드 워드클라우드 

     워드클라우드
     python python python python python python python python python python python python python   

     python"

   

4. 코딩을 통해 워드클라우드 표현

   - 코드 몇 줄 되지 않습니다. 너무 간단해서 이래도 되나 싶을 정도네요.


1: import matplotlib.pyplot as plt
2: from wordcloud import WordCloud

3: 
4: font_path = 'c:\\windows\\fonts\\NanumGothic.ttf'
5: wordcloud = WordCloud(
6:     font_path = font_path,
7:    width = 800,
8:    height = 800
9:    )
10:
11: text=open('test.txt').read()
12: wordcloud = wordcloud.generate(text)
13: 
14: fig = plt.figure(figsize=(12,12))
15: plt.imshow(wordcloud)
16: plt.axis("off")
17: plt.show()
18: fig.savefig('wordcloud_without_axisoff.png')


코드는 크게 설명드릴 부분이 없을 정도로 직관적으로 이해하실 수 있을 거라 생각되네요.


'라이브러리를 사용할 수 있게 하고

Font 설정을 하고

Text 파일을 읽고

wordcloud를 사용해서 화면에 부려주고

파일로 저장합니다.'




 [최종 실행 화면]

이로써 워드 클라우드 구현을 해보았습니다.


다음엔 더 재밌는 걸로 찾아뵐게요.

이번에는 파이썬으로 그래프 출력을 해보도록 하겠습니다.


그래프 출력을 위해선 라이브러리 설치가 필요해서 설치부터 진행합니다.


윈도우에서는 cmd를 실행하여 명령프롬프트에서 pip을 실행해주면 됩니다.

(pip은 파이썬 패키지 관리 프로그램이에요.)


pip을 실행해보면 위와 같이 사용법에 대한 내용이 나옵니다.


우리는 matplotlib라는 라이브러리를 설치해야 하므로 아래와 같이 입력 후 실행시켜 줍니다.





[matplotlib 설치]


pip install matplotlib 

실행을 하면 위화면처럼 파일이 복사되고 완료되었다고 출력된다.



이제 파이썬 IDLE에서 파일을 새로 만들고 코드를 입력해봅시다.




코드는 아래와 같이 입력합니다.

1: import matplotlib as mpl

2: import matplotlib.pyplot as plt

3: import matplotlib.font_manager as fm

4: from matplotlib import rc

5: from wordcloud import WordCloud (이부분은 지금 필요 없습니다. 코드 입력시에는 제외해 주세요)

6:

7: mpl.rcParams['axes.unicode_minus'] = False

   --> 그래프 출력할때 마이너스 부분에서 한글깨짐이 발생한다고 위와 같은 코드로 해결가능하다고 하네요

        미리미리 알아둡시다.

8: font_name = fm.FontProperties(fname="c:\\windows\\fonts\\malgun.ttf").get_name()

9: rc('font', family=font_name)

10:

11: plt.title('한글 그래프')

12: plt.plot([1, 2, 3, 4])

13: plt.show()



코드의 해석은 타이핑해보면서 직접 해보시길 권장 드립니다.

그냥 영어를 이해하시면 되요. 

4번행 까지는 라이브러리를 사용하기 위한 import가 진행되었고

한글을 사용하기 위한 폰트 설정이 7~9행까지 이루어졌습니다.

11~13행은 그래프를 그리기 위한 정보들이 입력되어 있네요.



프로그래밍은 무엇을 표현하고 싶은지 먼저 생각하고 그걸 표현하기 위한 코딩은 '구글링'을 통해 확인하면서 구현하면 되는 것 같습니다. 


개인적인 생각은 처음 접할때 문법부터 시작해서 전체를 공부하고 시작하려고 하면 조금 어렵게 느껴지고 익숙해지기 어려운거 같네요. 


잘 모를때는 그냥 따라해보시면 됩니다. 하다보면 천천히 이해가 되는거 같아요.


위와 같이 코드를 다 입력하고 저장하고 실행을 하면 아래와 같이 그래프에 한글이 함께 출력이 됩니다.

(Run명령은 F5번 입니다. )


한글표현이 잘 안되서 엄청나게 삽질하고 깔끔히 가능한 코드만 기록했습니다. (저도 구글링 엄청나게 했어요... 지금 위 코드는 고작 13줄밖에 안되는데, 한글이 안나와서 골머리가 아팠답니다.)





 오늘은 여기까지, 이제 그래프도 그려봤으니 다음엔 워드 클라우드를 표현해볼게요.



[1. 설치] 파이썬 시작합니다.

2018. 12. 7. 06:54 | Posted by 붉은kkk

파이썬을 이제 접해보려고 해요.


요즘 자동화 도구, 빅데이터 분석을 파이썬으로 많이들 한다고 해서 공부해보려고 합니다.


우선 설치부터^^


1. 파이썬 홈페이지에 접속합니다.

https://www.python.org/

2. 자신의 운영체제에 맞는 버전을 설치해줍니다.

- 2.X버전과

- 3.X버전 2가지의 버전이 있는데 저는 우선 3.X만 설치해서 공부해 볼 예정이에요.

이렇게 자신에게 맞는 운영체제 버전으로 설치를 하면 됩니다.


다음엔 공부하면서 익힌 것들을 하나씩 올려보도록 하겠습니다.



이전 1 다음