'분류 전체보기' 카테고리의 글 목록 (10 Page)

Notice

Recent Posts

Recent Comments

Link

160x600

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

목록분류 전체보기 (135)

코딩헤딩

[웹 크롤링(web crawling)] 영화데이터시각화 4 (단어 빈도분석)

워드클라우드를 만들기 위해서는 다음 라이브러리가 필요하다. https://coding-heading.tistory.com/73 [파이썬 koNLPY] 한글 형태소 분석 라이브러리 - java기반으로 만들어진 라이브러리로 JDK 설치 및 환경설정 필요 1. 환경변수 등록 시작 > 검색창에 환경검색 > 시스템 환경 변수 편집클릭 왼쪽 화면이 뜬다. 2. JAVA_HOME JAVA_HOME의 경로는 JDK설치 coding-heading.tistory.com * 라이브러리 정의하기 import pandas as pd * 데이터넷 읽어 들이기 - 데이터 프레임 변수명 : df_org df_org = pd.read_csv("./data/df_new.csv") df_org 1. 긍정 및 부정에 대해서만 각각 데이터 ..

카테고리 없음 2023. 12. 6. 21:16

[파이썬 koNLPY] 한글 형태소 분석 라이브러리

- java기반으로 만들어진 라이브러리로 JDK 설치 및 환경설정 필요 1. 환경변수 등록 시작 > 검색창에 환경검색 > 시스템 환경 변수 편집클릭 왼쪽 화면이 뜬다. 2. JAVA_HOME JAVA_HOME의 경로는 JDK설치 폴더까지 3. path 수정 후 두 가지 추가 %JAVA_HOME% %JAVA_HOME%\bin % 기호는 어디서든 접근가능하게 한다는 기호. 4. pc 재부팅 후 설정 확인 - commend창에서 java, javac입력 후 help내용이 나오면 성공 시작 > 검색창에 cmd 검색 > 명령프롬프트 클릭 * java * javac 명령 프롬프트에서 java와 javac를 타이핑했을 때 이런 화면이 나온다면 환경변수 설정이 정상적으로 완료되었다. 간혹 java는 나오지만 javac..

python 2023. 12. 5. 23:31

[웹 크롤링(web crawling)] 영화데이터시각화 3 (원형 그래프)

https://coding-heading.tistory.com/69 [크롤링(crawling)] 영화데이터수집 크롤링(crawling) 웹상에 존재하는 데이터들을 수집하는 작업 (프로그래밍으로 자동화) 웹 페이지의 html 코드를 가져와서, HTML/CSS 등을 필요한 데이터만 추출하는 기법 Open API(Rest API)를 제공하는 서 coding-heading.tistory.com 위 글부터 이어집니다. ### 시각화 라이브러리 import matplotlib.pyplot as plt ### 폰트 설정 라이브러리 from matplotlib import font_manager, rc ### 한글폰트 설정 plt.rc("font", family="Malgun Gothic") ### 마이너스 기호설정 ..

크롤링(crawling) | 시각화 2023. 12. 5. 22:34

[웹 크롤링(web crawling)] 영화데이터시각화 2 (점(분포) 그래프)

https://coding-heading.tistory.com/69 [크롤링(crawling)] 영화데이터수집 크롤링(crawling) 웹상에 존재하는 데이터들을 수집하는 작업 (프로그래밍으로 자동화) 웹 페이지의 html 코드를 가져와서, HTML/CSS 등을 필요한 데이터만 추출하는 기법 Open API(Rest API)를 제공하는 서 coding-heading.tistory.com 위 글부터 이어집니다. https://coding-heading.tistory.com/70 [크롤링(crawling)] 영화데이터시각화 1(막대그래프) # - 행렬데이터 처리 라이브러리 import pandas as pd 1. 외부파일 읽어 들이기 file_path = "./data/movie_reviews.txt" df..

크롤링(crawling) | 시각화 2023. 12. 4. 23:52

[웹 크롤링(web crawling)] 영화데이터시각화 1(막대그래프)

https://coding-heading.tistory.com/69 [크롤링(crawling)] 영화데이터수집 크롤링(crawling) 웹상에 존재하는 데이터들을 수집하는 작업 (프로그래밍으로 자동화) 웹 페이지의 html 코드를 가져와서, HTML/CSS 등을 필요한 데이터만 추출하는 기법 Open API(Rest API)를 제공하는 서 coding-heading.tistory.com 위 글부터 이어집니다. # - 행렬데이터 처리 라이브러리 import pandas as pd 1. 외부파일 읽어 들이기 file_path = "./data/movie_reviews.txt" df_org = pd.read_csv(file_path, delimiter="\t", names=["title", "score", "..

크롤링(crawling) | 시각화 2023. 12. 4. 23:29

[웹 크롤링(web crawling)] 영화데이터수집

크롤링(crawling) 웹상에 존재하는 데이터들을 수집하는 작업 (프로그래밍으로 자동화) 웹 페이지의 html 코드를 가져와서, HTML/CSS 등을 필요한 데이터만 추출하는 기법 Open API(Rest API)를 제공하는 서비스에 Open API를 호출해서, 받은 데이터 중 필요한 데이터만 추출하는 기법 Selenium 등 브라우저를 프로그래밍으로 조작해서, 필요한 데이터만 추출하는 기법 - URL : https://movie.daum.net - 다음영화 > 랭킹 > 박스오피스 > 월간 위치의 데이터 수집 - 수집데이터 : 영화제목, 평점, 댓글 - 생성할 데이터 : 긍정/부정 - 고려할 상황 : 평점에서 한 화면에서 보여주는 평점의 수가 10이다. 10 이상은 "평점 더 보기" 버튼을 눌러주어야 ..

크롤링(crawling) | 시각화 2023. 12. 4. 22:49

[데이터 분석] 교통데이터 전처리 / 시각화 (막대그래프, Histplot)

https://coding-heading.tistory.com/66 [데이터 분석] 교통데이터 수집/가공 * 데이터 출처 - URL : 국가교통 데이터 오픈마켓 1. 데이터 수집 import pandas as pd 파이썬에서 데이터를 다룰 때는 항상 pandas 라이브러리를 정의해 준다. 데이터가 폴더만 80개가 있다. 하지만 폴더 coding-heading.tistory.com ### 시각화 라이브러리 import matplotlib import matplotlib.pyplot as plt import seaborn as sns 저번 글에서 만든 데이터 프레임을 불러오겠다. - 데이터 프레임 변수명 : df_bus_card_tot df_bus_card_tot =pd.read_csv("./01_data/..

데이터 2023. 12. 3. 21:42

이전 Prev 1 ··· 7 8 9 10 11 12 13 ··· 20 Next 다음

목록분류 전체보기 (135)

코딩헤딩

티스토리툴바