크롤링(crawling) | 시각화

[웹 크롤링(web crawling)] 영화데이터시각화 5 워드클라우드(wordcloud)

멈머이 2023. 12. 7. 22:19
728x90

https://coding-heading.tistory.com/74

 

[웹 크롤링(web crawling)] 영화데이터시각화 4 (단어 빈도분석)

워드클라우드를 만들기 위해서는 다음 라이브러리가 필요하다. https://coding-heading.tistory.com/73 [파이썬 koNLPY] 한글 형태소 분석 라이브러리 - java기반으로 만들어진 라이브러리로 JDK 설치 및 환경

coding-heading.tistory.com

지난 글 단어빈도분석과 이어집니다.

 

<긍정 및 부정 리뷰 단어 워드클라우드(wordcloud) 시각화>

* 워드클라우드 라이브러리

from wordcloud import WordCloud

 

  - 긍정 리뷰 단어 워드클라우드 시각화

plt.figure(figsize=(8, 8))

### 그래프 제목
plt.title("[긍정] 리뷰 단어 워드클라우드 시각화")

### 사용할 폰트 파일 지정하기
font_path="C:/Windows/Fonts/malgunsl.ttf"
wc = WordCloud(
    ### 폰트 지정
    font_path=font_path,
    ### 배경색 지정
    background_color = "ivory",
    ### 그래프 너비
    width=800,
    ### 그래프 높이
    height=600
)

### 워드클라우드 그래프에 데이터 넣기
# - generate_from_frequencies() : 워드클라우드 이미지로 반환해줌
#cloud=wc.generate_from_frequencies(pos_top_20)

### 긍정 전체 단어 넣어보기
cloud=wc.generate_from_frequencies(pos_word_count)

### 워드클라우드 이미지 보여주기
plt.imshow(cloud)

### x,y 좌표 제외시키기
plt.axis("off")

### 저장하기
plt.savefig("./img/긍정리뷰테이터시각화.png")

### 보여주기
plt.show()

 

  -  부정 리뷰 단어 워드클라우드 시각화

plt.figure(figsize=(8, 8))

### 그래프 제목
plt.title("[부정] 리뷰 단어 워드클라우드 시각화")

### 사용할 폰트 파일 지정하기
font_path="C:/Windows/Fonts/malgunsl.ttf"
wc = WordCloud(
    ### 폰트 지정
    font_path=font_path,
    ### 배경색 지정
    background_color = "black",
    ### 그래프 너비
    width=800,
    ### 그래프 높이
    height=600
)

### 워드클라우드 그래프에 데이터 넣기
# - generate_from_frequencies() : 워드클라우드 이미지로 반환해줌
#cloud=wc.generate_from_frequencies(pos_top_20)

### 긍정 전체 단어 넣어보기
cloud=wc.generate_from_frequencies(neg_word_count)

### 워드클라우드 이미지 보여주기
plt.imshow(cloud)

### x,y 좌표 제외시키기
plt.axis("off")

### 저장하기
plt.savefig("./img/부정리뷰테이터시각화.png")

### 보여주기
plt.show()

728x90