코딩헤딩

[파이썬 koNLPY] 한글 형태소 분석 라이브러리 본문

python

[파이썬 koNLPY] 한글 형태소 분석 라이브러리

멈머이 2023. 12. 5. 23:31
728x90

<한글 형태소 분석 라이브러리 : koNLPY>

 - java기반으로 만들어진 라이브러리로 JDK 설치 및 환경설정 필요


 1. 환경변수 등록

 

 

 

시작 > 검색창에 환경검색 >  시스템 환경 변수 편집클릭

 

왼쪽 화면이 뜬다.

 

 

 

 

 

 

 

 

 

 

   

2. JAVA_HOME 

 

 

 

 

 

JAVA_HOME의 경로는 JDK설치 폴더까지

 

 

 

 

 

 

 

 

 

 

 3. path 수정 후 두 가지 추가 

%JAVA_HOME%

%JAVA_HOME%\bin

% 기호는 어디서든 접근가능하게 한다는 기호.

 

 

4. pc 재부팅 후 설정 확인

 -  commend창에서 java, javac입력 후 help내용이 나오면 성공

시작 > 검색창에 cmd 검색 > 명령프롬프트 클릭

 

   * java

 

* javac

 

명령 프롬프트에서 java와 javac를 타이핑했을 때 이런 화면이 나온다면 환경변수 설정이 정상적으로 완료되었다.

간혹 java는 나오지만 javac가 나오지 않는 경우가 있는데 javac가 나오지 않는다면

정상적으로 설정되어 있지 않은 상태다.

자바 설정이 끝났다면 다음은 라이브러리 설치이다.


<라이브러리 설치>

환경설정이 아나콘다이기 때문에 아나콘다 명령프롬프트에서 진행한다.

 

 - nltk설치 : 영어 형태소 분석 라이브러리(koNLPY의 상위 라이브러리)
   * pip install nltk



 - nltk플러그인 추가 설치(다운로드 설치 방식)
 ->> nltk플러그인은 최초에 한 번만 설치하면, 추후 다른 가상환경에서도 적용됨
 ->> 다른 가상환경에서는 pip install nltk 라이브러리만 설치하면 됨
   1. python
   2. import nltk
   3.  nltk.download()


   > nltk 창이 open 됨

        All packages탭 선택 > punkt 더블클릭, stopwords 더블클릭


   4. exit()



 - 워드클라우드 라이브러리 설치
   > pip install wordcloud

 - konlpy 설치 전에 파이썬에서 JAVA 라이브러리 인식을 위한 라이브러리 설치
   > pip install JPype1 (끝에는 숫자 1)
   > pip install konlpy

 - jvm.py 파일 내에 별표시(*) 삭제하기
   * 위치 : C:\Users\Administrator\anaconda3\envs\gj_env_01\Lib\site-packages\konlpy
   * 메모장으로 jvm.py열기

   * folder_suffix[] 리스트 내에 별(*) 표시 찾아서 삭제 > 저장 > 닫기

 

 

 

이러한 상태가 되면 설정이 끝난다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

from konlpy.tag import Okt
okt = Okt()
okt

결과 : <konlpy.tag._okt.Okt at 0x1d68c3a97f0>

okt.nouns("안녕 하세요 ~ 파이썬 입니다. 안녕")

결과 : ['안녕', '파이썬', '안녕']

728x90