일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- HeidiSQL
- 파싱 오류
- sklearn
- python기초
- 데이터 수집
- 데이터 가공
- Database
- DB
- 데이터베이스
- 머신러닝
- Oracle
- tensorflow
- sql
- 데이터
- 예측
- python
- 오라클
- 회귀모델
- MariaDB
- 데이터전처리
- 시각화
- 딥러닝
- Deep Learning
- keras
- 데이터 분석
- 훈련
- pandas
- 해석
- 정확도
- pythone
- Today
- Total
목록전체 글 (128)
코딩헤딩

- 정의된 변수 이름은 없음 - 훈련데이터 : 훈련(fit)에 사용되는 데이터 : (훈련 독립변수) train_input, train-x, X_train : (훈련 종속변수) train_target, train_y, Y_ train - 검증데이터 : 훈련 정확도(score)에 사용되는 데이터 : (검증 독립변수) val_input, val-x, X_val : (검증 종속변수) val_target, val_y, Y_ val - 테스트데이터 : 예측(predict)에 사용되는 데이터 : (테스트 독립변수) test_input, test-x, X_test : (테스트 종속변수) test_target, test_y, Y_ test 앞으로 변수의 이름은 위와 같이 통일한다. 1. 훈련과 테스트를 비율로 먼저 나누..

https://coding-heading.tistory.com/81 [ML(머신러닝)] 생선구분하기 - 1 * 훈련 모델 처리 절차 1. 데이터 전처리 2. 데이터 정규화 3. 훈련 : 검증 : 테스트 데이터로 분류 (또는 훈련 : 테스트 데이터로 분류) - 6 : 2 : 2 또는 7 : 2 : 1, 데이터가 작은 경우에는 8 : 2 또는 7 : 3 coding-heading.tistory.com * 위 글과 이어집니다. - 모델(클래스)의 속성 중에 사람이 직접 값을 지정해줘야 하는 변수들을 통칭 - 모델 성능을 향상하기 위한 방법 - 과대적합(1) 또는 과소적합이 일어난 경우 튜닝 진행 * KNN 모델 생성하기 # n_neighbors : 이웃의 갯수 (하이퍼파라메터 속성) kn20 = KNeighb..

* 훈련 모델 처리 절차 1. 데이터 전처리 2. 데이터 정규화 3. 훈련 : 검증 : 테스트 데이터로 분류 (또는 훈련 : 테스트 데이터로 분류) - 6 : 2 : 2 또는 7 : 2 : 1, 데이터가 작은 경우에는 8 : 2 또는 7 : 3 정도로 분류 4. 모델 생성 5. 모델 훈련 [*fit(함수)] (훈련 데이터와 검증 데이터 사용, 또는 테스트 데이터) 6. 모델 평가 (모델 선정, 검증데이터) 7. 하이퍼파라미터 튜닝 8. 5~6번 진행 9. 최종테스트 [*predict, 예측] (테스트 데이터 사용) * 생선구분하기 방어와 도미 데이터 데이터 처리 방어와 도미 데이터 - 생선의 종류를 분류(구분)하기 위한 모델 생성을 위해 독립변수와 종속변수로 데이터를 가공해야 함 - 독립변수(x) : 길..

1. 용어정리 머신러닝(machine learning) : 기계가 패턴을 학습하여 자동화하는 알고리즘 알고리즘(algorithms) : 어떠한 문제를 해결하기 위한 일련의 절차나 방법 Clustering : 군집 2. 머신러닝? 딥러닝? 머신러닝(machine learning) : 데이터를 컴퓨터에 학습시켜 그 패턴과 규칙을 컴퓨터가 스스로 학습하도록 만 드는 기술 딥러닝(deep learning) : 머신러닝 기법 중 신경망(neural network)을 기반으로 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술 3. 머신러닝 학습의 종류 지도학습(supervised learning) : 문제와 답을 함께 학습 비지도학습(unsupervised learning) : 조력자의 도움 없 이 컴퓨터 ..

https://balsamiq.cloud/ Balsamiq Cloud Fast, Approachable, Collaborative Wireframing balsamiq.cloud 최근 프로젝트 중 웹 화면구성 계획을 할 때 유용한 도구를 찾았다. 1. 발사믹 목업 홈화면에서 product 클릭 2. 트라이얼 버전 시작 클릭 3. 메일인증 후 30일간 무료 트라이얼버전 사용이 가능하다. 4. 작업 화면에 들어오면 구성은 파워포인트와 비슷하다. ① 상단에 택스트박스부터 토글버튼까지 다양한 요소들이 미리 만들어져 있어 드래그 후 가져와서 각각의 프로젝트에 맞게 배치해 나가면 된다. ② 실행버튼같은게 있는데 이거를 누르면 ppt에서 프레젠테이션이 시작된 것 같은 화면으로 전환되며 구성해 놓은 화면 설계를 발표할..

프로젝트에서 사용할 데이터를 전처리 해보겠다. https://bigdata.kepco.co.kr/cmsmain.do?scode=S01&pcode=000166&pstate=L&redirect=Y 전력데이터 개방 포털시스템 꺾은선그래프 라벨관련 js --> 월별 데이터 다운로드 다운로드 (단위: 호, kWh, 원, 원/kWh) caption 지역구분 계약구분 고객호수(호) 사용량(kWh) 전기요금(원) 평균판매단가(원/kWh) caption 그래프 선택 원 bigdata.kepco.co.kr 사용할 데이터 : 업종별 전력사용량 => 엑셀파일 다운로드 1. 판다스 라이브러리 정의 import pandas as pd 2. 데이터 불러오기 file_path="./용도별 전기 사용량 1년 통합.xlsx" df = ..

https://coding-heading.tistory.com/74 [웹 크롤링(web crawling)] 영화데이터시각화 4 (단어 빈도분석) 워드클라우드를 만들기 위해서는 다음 라이브러리가 필요하다. https://coding-heading.tistory.com/73 [파이썬 koNLPY] 한글 형태소 분석 라이브러리 - java기반으로 만들어진 라이브러리로 JDK 설치 및 환경 coding-heading.tistory.com 지난 글 단어빈도분석과 이어집니다. * 워드클라우드 라이브러리 from wordcloud import WordCloud - 긍정 리뷰 단어 워드클라우드 시각화 plt.figure(figsize=(8, 8)) ### 그래프 제목 plt.title("[긍정] 리뷰 단어 워드클라우드..