[LG Aimers] [지도학습-2] Linear Regression
선형 회귀의 기본 개념
- 목표: 라는 참 함수를 모델링하는 것.
- 데이터셋 ()를 기반으로 모델 를 찾음.
- f(x)는 주어진 데이터와 유사한 값(예측)을 생성해야 함.
단일 입력 선형 회귀
- 데이터: 키(\(x\))와 몸무게(\(y\)).
- 손실 함수:
- 평균 제곱 오차(MSE):
- MSE를 사용하는 이유:
다변량 선형 회귀
정규 방정식 (Normal Equation)
고차 방정식으로 확장
- 예: 2차 방정식 모델 를 사용하고 싶을 때.
- 데이터셋 재정의:
- 모델 클래스:
- 손실 함수: 여전히 .
과적합(Overfitting)과 편향-분산 트레이드오프
- 과적합:
- 모델이 훈련 데이터에 너무 적합하여 일반화 실패.
- 편향-분산 트레이드오프:
- 단순한 모델 → 높은 편향, 낮은 분산.
- 복잡한 모델 → 낮은 편향, 높은 분산.
- 해결책:
- 더 많은 데이터 확보.
- 정규화 (Regularization): 항 추가.
모델 검증
- 훈련 데이터와 검증 데이터로 분리.
- 훈련 손실과 검증 손실을 비교하여 과적합 여부 확인.
- 훈련 손실 ≈ 검증 손실: 일반화 잘됨.
- 훈련 손실 ≪ 검증 손실: 과적합.