2.1 기본 개념들
- 확률 : 어떤 일이 일어날 가능성을 [0, 1] 사이의 수치로 표현한 것
2.1.1 표본 공간과 사건
- 표본 공간(sample space) : 주어진 한 사건의 모든 가능한 결과(outcome)를 나타내는 이산 집합(discrete set) 또는 연속 구간(continuous range)
- 개별 사건 : 표본 공간에서 뽑은 하나의 표본(sample)
- 가능도(likelihood) : 어떠한 사건이 일어날 가능성이 어느 정도인지를 나타내는 값
2.1.2 확률 변수
- 확률 변수(random variable) : 해당 표본 공간에서 하나의 값을 특정한 확률로 취하는 변수
- 이산 확률 변수(discrete random variable) : 표본 공간이 이산적인 경우, 로 표기함
- 연속 확률 변수(continuous random variable) : 표본 공간이 연속적인 경우, 로 표기함
2.1.3 인간은 확률에 약하다
2.1.3.1 몬티 홀 딜레마
- 세 문 중 하나에만 자동차가 존재함
- 참가자가 세 문 중 하나를 고르면, 몬티 홀은 자동차가 없고 참가자가 고르지 않은 두 문 중 하나를 염 → 문을 바꾸는게 이득, 안 바꾸는게 이득?
- 문을 바꾸지 않는다면, 차를 얻을 확률은 1/3
- 문을 바꾼다면, 차를 얻을 확률은 2/3
2.1.3.2 암 진단
- 유방조영상 사진 진단 결과가 양성인 40대 여성이 실제로 유방암을 가지고 있을 확률
- 세 가지 정보가 주어져 있음
- 무작위로 선택한 40대 여성의 유방함 보유 확률은 0.8%(1000명 중 8명)
- 유방암이 있는 여성의 유방조영상 진단이 양성일 확률은 90%
- 유방암이 없는 여성의 유방조영상 진단이 양성일 확률은 7%
- 8 * 0.9 = 7.2, 992 * 0.07 = 69.4, 즉 유방조영상 진단이 양성인 여성은 76명
- 따라서, 유방조영상 진단이 양성일 때 실제로 유방암이 있을 확률은 7/76 = 0.092
2.2 확률의 법칙들
2.2.1 단일 사건의 확률
- 표본 공간의 임의의 사건 에 대해
- 표본 공간의 모든 사건 에 대해
- 사건 가 발생할 확률이 라고 할 때, 그 사건이 발생하지 않을 확률
2.2.2 합의 법칙
- 상호 배반(mutually exclusive) : 하나가 발생하면 다른 하나는 발생하지 않을 때
- 합의 법칙(sum rule) : 둘 이상의 상호 배반 사건들에 대해, 두 사건 중 하나라도 발생할 확률
2.2.3 곱의 법칙
- 곱의 법칙(product rule) : A 그리고 B가 발생할 확률
- 위 식은 서로 독립인 사건들에 적용되는 법칙이라는 것을 유의
2.2.4 합의 법칙 보충
- 사건들이 상호 배반이 아닌 경우
2.2.5 생일 역설
- 한 방에 있는 사람 중 생일이 같은 사람이 적어도 두 명일 확률이 50%를 넘으려면 방에 최소 몇 명의 사람이 있어야 하는지
- 그 어떤 쌍도 생일이 같지 않을 확률이 50% 미만이려면 방에 몇 명이 있어야 하느냐는 관점에서 접근
- n개의 쌍이 모두 생일이 다를 확률
- n이 253 이상일 시, 적어도 한 쌍은 생일이 같을 확률이 50%를 넘으므로 필요한 사람 수는 다음과 같음
2.2.6 조건부 확률
- 조건부 확률(conditional probability)
- 사건 A가 발생했다고 할 때 사건 B의 확률
- 두 사건이 종속인 경우 곱의 법칙
2.2.7 전체 확률
- 모든 분할에 관한 한 사건의 확률
2.3 결합 확률과 주변 확률
- 결합 확률(joint probability)
- 의 값이 임과 동시에 의 값이 일 확률
- 주변 확률(marginal probability) : 하나 이상의 조건이 참일 확률을 그 밖의 조건들의 참, 거짓 여부는 신경 쓰지 않고 계산한 것
2.3.1 결합 확률표
- 분할표(contingency table)
ㅤ | 색맹 | 비색맹 | 합계 |
남성 | 42 | 456 | 498 |
여성 | 3 | 499 | 502 |
합계 | 45 | 955 | 1000 |
- 결합 확률표(joint probability table)
ㅤ | 색맹 | 비색맹 | 합계 |
남성 | 0.042 | 0.456 | 0.498 |
여성 | 0.003 | 0.499 | 0.502 |
합계 | 0.045 | 0.955 | 1.000 |
2.3.2 확률의 연쇄 법칙
- 확률 변수 개의 결합 확률을 위한 연쇄법칙의 일반형