[LG Aimers] [지도학습-2] Linear Regression

[LG Aimers] [지도학습-2] Linear Regression

Tags
AI
LG Aimers
Published
January 7, 2025
Author
JH
태그
종류
학문 분야

선형 회귀의 기본 개념

  • 목표: 라는 참 함수를 모델링하는 것.
    • 데이터셋 ()를 기반으로 모델 를 찾음.
    • f(x)는 주어진 데이터와 유사한 값(예측)을 생성해야 함.

단일 입력 선형 회귀

  • 데이터: 키(\(x\))와 몸무게(\(y\)).
  • 함수 클래스 (모델):
  • 손실 함수:
    • 평균 제곱 오차(MSE):
    • MSE를 사용하는 이유:
      • 미분 가능성.
      • 분석적 해가 존재함.

다변량 선형 회귀

  • 데이터: .
  • 모델 클래스:
  • 손실 함수: 다차원 \(MSE\) 동일.
  • 최소화 문제:
    • 기울기를 0으로 만드는 해를 계산.

정규 방정식 (Normal Equation)

  • 선형 회귀의 해:
    • : 특성 행렬.
    • : 실제 값 벡터.
  • 장점:
    • 계산적으로 간단.
    • 소규모 데이터셋에 적합.

고차 방정식으로 확장

  • 예: 2차 방정식 모델 를 사용하고 싶을 때.
    • 데이터셋 재정의:
    • 모델 클래스:
    • 손실 함수: 여전히 .

과적합(Overfitting)과 편향-분산 트레이드오프

  • 과적합:
    • 모델이 훈련 데이터에 너무 적합하여 일반화 실패.
  • 편향-분산 트레이드오프:
    • 단순한 모델 → 높은 편향, 낮은 분산.
    • 복잡한 모델 → 낮은 편향, 높은 분산.
  • 해결책:
    • 더 많은 데이터 확보.
    • 정규화 (Regularization): 항 추가.

모델 검증

  • 훈련 데이터와 검증 데이터로 분리.
    • 훈련 손실과 검증 손실을 비교하여 과적합 여부 확인.
    • 훈련 손실 ≈ 검증 손실: 일반화 잘됨.
    • 훈련 손실 ≪ 검증 손실: 과적합.