일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- keras
- pythone
- Deep Learning
- 알고리즘기초
- python
- 데이터전처리
- 데이터 가공
- 해석
- 데이터베이스
- Database
- sklearn
- pandas
- 크롤링(crawling)
- tensorflow
- MariaDB
- 정확도
- 예측
- 머신러닝
- 시각화
- 파이썬
- 데이터 분석
- 선형회기모델
- 딥러닝
- 훈련
- 회귀모델
- python기초
- 데이터 수집
- SQL예제
- 데이터
- HeidiSQL
- Today
- Total
목록KNN (3)
코딩헤딩

- 데이터의 분포가 선형이면서 곡선을 띄는 경우에 사용됨 - 곡선(포물선)의 방정식이 적용되어 있음 - y = (a * x^2) + (b * x) + c - 독립변수는 2개가 사용됨 : x와 x^2 값 * 훈련 및 테스트데이터의 독립변수에 x^2 값 추가하기 # - 훈련독립변수 train_poly = np.column_stack((train_input**2, train_input)) # - 테스트 독립변수 test_poly = np.column_stack((test_input**2, test_input)) train_poly.shape, test_poly.shape 결과 : ((42, 2), (14, 2)) * 모델 생성하기 # - 선형, 다항, 다중회귀모델은 하나의 모델(클래스) 사용 lr = Line..

* KNN회귀모델 - K Nearest Neighbor 1. 데이터 확인 1) 길이로 무게 예측하기 perch_length.shape, perch_weight.shape 결과 : ((56,), (56,)) - 길이 : 문제(독립변수) / 무게(연속형) : 답(종속변수) 2) 산점도 그리기 import matplotlib.pyplot as plt plt.scatter(perch_length, perch_weight) plt.xlabel("length") plt.ylabel("weight") plt.show() - 초반에는 곡선을 띄는 듯하다가, 중반부부터는 직선의 형태를 나타내고 있음. - 종속변수가 연속형 데이터이기에, 선형 분포를 나타내기에 회 귀모델을 사용함. 3) 훈련 및 테스트 데이터 분류하기 *..

https://coding-heading.tistory.com/81 [ML(머신러닝)] 생선구분하기 - 1 * 훈련 모델 처리 절차 1. 데이터 전처리 2. 데이터 정규화 3. 훈련 : 검증 : 테스트 데이터로 분류 (또는 훈련 : 테스트 데이터로 분류) - 6 : 2 : 2 또는 7 : 2 : 1, 데이터가 작은 경우에는 8 : 2 또는 7 : 3 coding-heading.tistory.com * 위 글과 이어집니다. - 모델(클래스)의 속성 중에 사람이 직접 값을 지정해줘야 하는 변수들을 통칭 - 모델 성능을 향상하기 위한 방법 - 과대적합(1) 또는 과소적합이 일어난 경우 튜닝 진행 * KNN 모델 생성하기 # n_neighbors : 이웃의 갯수 (하이퍼파라메터 속성) kn20 = KNeighb..