Machine Learning
-
[Machine Learning] Linear Regression_Part 2
import matplotlib.pyplot as plt plt.plot(ridge.coef_, 's', label='Ridge alpha=1') plt.plot(ridge10.coef_, '^', label='Ridge alpha=10') plt.plot(ridge01.coef_, 'v', label='Ridge alpha=0.1') plt.plot(lr.coef_, 'o', label='LinearRegression') plt.hlines(0, 0, len(lr.coef_)) plt.ylim(-25, 25) plt.legend() 해당 그래프를 보면 규제에 대해서 더 직관적으로 볼 수 있다. 릿지 회귀에서 alpha의 값이 작을수록 규제를 적게 한다고 이야기 하였다. 하지만 훈련 세트와 테스트 세트에..
2023.09.12
-
[Machine Learning] Linear Regression_Part 3
선형 회귀에서 최소자승법 (OLS)라고 불리는 방법은 가장 간단하고 기본적인 방법이다. 선형 회귀는 w 가중치와 b y절편의 값을 mean squared error를 통해 예측과 원본 값의 차이를 최소화 하는 값을 찾는다. 이 mean squared error는 예측값과 원본 값의 차이를 제곱하여 구한다. Example 1. make_wave !pip install mglearn from sklearn.model_selection import train_test_split import mglearn 먼저 필요한 데이터셋을 불러오기 위해서 mglearn 라이브러리를 설치해주자. from sklearn.linear_model import LinearRegression X, y = mglearn.dataset..
2023.09.11
-
[Machine Learning] Linear Models_Part 1
선형 모델은 지난 몇십년간 넓게 연구되었고, 실전에서 자주 사용하는 모델이다. 선형 모델은 입력된 데이터에 대한 선형 함수를 사용하여 데이터들을 예측하는 역할을 한다. 일반적으로 회귀에서 사용되는 모델은 해당 공식을 따른다. 여기서 보이는 x[0]부터 x[p]는 개별적 데이터에 대한 특징을 나타내고, w와 b는 모델에서 학습되는 파라미터이다. 그리고 ŷ는 모델이 예측한 값을 나타낸다. 만약 데이터 셋이 하나의 특징만을 가진다면 아래 방정식을 따른다. 위에 보이는 그래프는 일반적인 단일 선형 방정식의 기본적인 형태이다. 선형 회귀는 간단하고, 회귀에서 가장 기본적인 방법이다. 선형 회귀는 w와 b의 값을 예측값과 타겟 데이터의 값에 평균 제곱 오차의 값을 줄이기 위해 찾는다. 평균 오차 제곱은 예측한 값과..
2023.09.06
-
[Machine Learning] K-NN Algorithms_Part 2
k-nearset neighbors 알고리즘에는 회귀 형태도 존재한다. k-neighbors regression의 경우 주변의 가장 가까운 K개의 샘플을 통해 값을 예측하는 방식이다. 주변에 가까운 값들의 데이터 값을 모두 더해서 n_neighbors의 값으로 나누어 평균을 구해주는 방식이다. 머신러닝에서 알고리즘을 배울 때 가장 좋은 방법은 예시를 보는 것이기 때문에 지금 바로 하나의 문제 풀어보도록 하자. Question 1. 선형적인 구조를 띄는 데이터 셋이 주어졌을 때 n_neighbors가 얼마일때 가장 좋은 효율을 내는지와, 해당 값을 적용시켜서 87에서의 결과 값을 제시하고, 결과 값이 어떻게 도출되었는지를 증명하라. 한가지 문제에 풀어야 할 문제가 총 3가지로 나눠진다. n_neighbor..
2023.09.05
-
[Machine Learning] K-NN Algorithms_Example
Question 1. 유방암 데이터를 이용하여 n_neighbors가 몇일때 최고의 성능을 내는가? Condition 1. 반드시 KNeighborsClassifier를 사용할 것 Condition 2. sklearn.datasets에서 load_breast_cancer 데이터를 이용할 것 주어진 해당 조건에 맞추어 모델을 구현하는데 필요한 파이썬 라이브러리를 불러오자. import matplotlib.pyplot as plt from sklearn.datasets import load_breast_cancer from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selction import train_test_split 다음으로 가..
2023.09.04