본문 바로가기

프로그래밍/python

파이썬 한글 텍스트 마이닝 (KoNLPy)

우선, 이런 훌륭한 도구를 개발해 주신 Lucy Park 님께 심심한 감사를 표합니다.


우선 패키지 매니저 업그레이드 후 파이썬으로 영어와 한국어 텍스트 다루기 페이지에 따라 설치

sudo pip install --upgrade pip


도중에 collocation 계산시에 stopwords 관련 오류가 발생하는데 아래와 같이 다운로드 한다.

> python

import nltk

nltk.download('stopwords')


마지막 태그 클라우드에서  d3 스크립트 오류가 발생하는데 아래의 사이트에서 다운로드 받아서 로컬에 설치.

https://gist.github.com/emeeks/3361332.js

https://github.com/jasondavies/d3-cloud/blob/master/build/d3.layout.cloud.js


최종 결과물 태그 클라우드