[딥러닝을 위한 수학] CHAPTER 2. 확률 1부

[딥러닝을 위한 수학] CHAPTER 2. 확률 1부

Tags
Math
딥러닝을 위한 수학
Published
February 4, 2025
Author
JH
태그
종류
학문 분야

2.1 기본 개념들

  • 확률 : 어떤 일이 일어날 가능성을 [0, 1] 사이의 수치로 표현한 것

2.1.1 표본 공간과 사건

  • 표본 공간(sample space) : 주어진 한 사건의 모든 가능한 결과(outcome)를 나타내는 이산 집합(discrete set) 또는 연속 구간(continuous range)
  • 개별 사건 : 표본 공간에서 뽑은 하나의 표본(sample)
  • 가능도(likelihood) : 어떠한 사건이 일어날 가능성이 어느 정도인지를 나타내는 값

2.1.2 확률 변수

  • 확률 변수(random variable) : 해당 표본 공간에서 하나의 값을 특정한 확률로 취하는 변수
    • 이산 확률 변수(discrete random variable) : 표본 공간이 이산적인 경우, 로 표기함
    • 연속 확률 변수(continuous random variable) : 표본 공간이 연속적인 경우, 로 표기함

2.1.3 인간은 확률에 약하다

2.1.3.1 몬티 홀 딜레마

  • 세 문 중 하나에만 자동차가 존재함
  • 참가자가 세 문 중 하나를 고르면, 몬티 홀은 자동차가 없고 참가자가 고르지 않은 두 문 중 하나를 염 → 문을 바꾸는게 이득, 안 바꾸는게 이득?
    • 문을 바꾸지 않는다면, 차를 얻을 확률은 1/3
    • 문을 바꾼다면, 차를 얻을 확률은 2/3

2.1.3.2 암 진단

  • 유방조영상 사진 진단 결과가 양성인 40대 여성이 실제로 유방암을 가지고 있을 확률
  • 세 가지 정보가 주어져 있음
    • 무작위로 선택한 40대 여성의 유방함 보유 확률은 0.8%(1000명 중 8명)
    • 유방암이 있는 여성의 유방조영상 진단이 양성일 확률은 90%
    • 유방암이 없는 여성의 유방조영상 진단이 양성일 확률은 7%
  • 8 * 0.9 = 7.2, 992 * 0.07 = 69.4, 즉 유방조영상 진단이 양성인 여성은 76명
  • 따라서, 유방조영상 진단이 양성일 때 실제로 유방암이 있을 확률은 7/76 = 0.092

2.2 확률의 법칙들

2.2.1 단일 사건의 확률

  • 표본 공간의 임의의 사건 에 대해
  • 표본 공간의 모든 사건 에 대해
  • 사건 가 발생할 확률이 라고 할 때, 그 사건이 발생하지 않을 확률

2.2.2 합의 법칙

  • 상호 배반(mutually exclusive) : 하나가 발생하면 다른 하나는 발생하지 않을 때
  • 합의 법칙(sum rule) : 둘 이상의 상호 배반 사건들에 대해, 두 사건 중 하나라도 발생할 확률

2.2.3 곱의 법칙

  • 곱의 법칙(product rule) : A 그리고 B가 발생할 확률
    • 위 식은 서로 독립인 사건들에 적용되는 법칙이라는 것을 유의

2.2.4 합의 법칙 보충

  • 사건들이 상호 배반이 아닌 경우

2.2.5 생일 역설

  • 한 방에 있는 사람 중 생일이 같은 사람이 적어도 두 명일 확률이 50%를 넘으려면 방에 최소 몇 명의 사람이 있어야 하는지
    • 그 어떤 쌍도 생일이 같지 않을 확률이 50% 미만이려면 방에 몇 명이 있어야 하느냐는 관점에서 접근
  • n개의 쌍이 모두 생일이 다를 확률
  • n이 253 이상일 시, 적어도 한 쌍은 생일이 같을 확률이 50%를 넘으므로 필요한 사람 수는 다음과 같음

2.2.6 조건부 확률

  • 조건부 확률(conditional probability)
    • 사건 A가 발생했다고 할 때 사건 B의 확률
  • 두 사건이 종속인 경우 곱의 법칙

2.2.7 전체 확률

  • 모든 분할에 관한 한 사건의 확률

2.3 결합 확률과 주변 확률

  • 결합 확률(joint probability)
    • 의 값이 임과 동시에 의 값이 일 확률
  • 주변 확률(marginal probability) : 하나 이상의 조건이 참일 확률을 그 밖의 조건들의 참, 거짓 여부는 신경 쓰지 않고 계산한 것

2.3.1 결합 확률표

  • 분할표(contingency table)
    • 색맹
      비색맹
      합계
      남성
      42
      456
      498
      여성
      3
      499
      502
      합계
      45
      955
      1000
  • 결합 확률표(joint probability table)
    • 색맹
      비색맹
      합계
      남성
      0.042
      0.456
      0.498
      여성
      0.003
      0.499
      0.502
      합계
      0.045
      0.955
      1.000

2.3.2 확률의 연쇄 법칙

  • 확률 변수 개의 결합 확률을 위한 연쇄법칙의 일반형