1. 확률
- 확률은 주어진 사건 공간에서 특정 사건이 선택되는 경우를 수치적으로 나타낸 것이다
- 모델을 만들거나, 만들어진 모델의 성능을 평가하는 데에 사용 가능하다
2. 종속성과 독립성
- 두 개의 사건이 주어질 때, 한 사건의 발생 여부가 다른 사건의 발생 여부에 대한 정보를 준다면 두 사건은 종속 사건이다. 만약 정보를 주지 않는다면 둘은 독립 사건이다.
ex1) 동전을 두 번 던진다. 사건 A는 첫 번째 동전이 앞면인 경우이고, 사건 B는 두 동전이 모두 뒷면이 나오는 경우이다.
사건 A가 일어난다면 사건 B는 일어날 수 없다. 따라서 두 사건은 종속 사건이 된다.
ex2) 동전을 두 번 던진다. 사건 A는 첫 번째 동전이 앞면인 경우이고, 사건 B는 두 번째 동전이 뒷면이 나오는 경우이다.
첫 번째 동전과 두 번째 동전은 서로 영향을 미치지 않는다. 따라서 두 사건은 독립 사건이다.
다음 식을 만족할 때, 두 사건은 독립 사건임을 의미한다.
- P(EF)는 사건 E와 사건 F가 동시에 발생할 확률이다
3. 조건부 확률(Conditional Probability)
- 조건부 확률은 하나의 사건이 발생했을 때, 다른 사건이 발생할 확률을 나타낸다.
위 식은 사건 B가 일어났을 때, 사건 A가 일어날 확률을 의미한다. 즉, 전체의 Sample Space는 사건 B의 원소로만 이루어져 있다.
*전체 확률의 법칙 (Law of Total Probability)
수형도로 나타낼 수 있는 문제는 위와 같이 조건부 확률을 이용해 풀 수 있다.
ex) 색이 빨강[R], 노랑[Y], 파랑[B]이 세 장의 카드 중 하나를 뽑는 복원 추출을 두 번 반복한다.
빨강이 나올 확률은 0.4, 노랑이 나올 확률은 0.5, 파랑이 나올 확률은 0.1이다.
(1) 사건 A는 두번째에서 빨강 카드가 나오는 경우이고,
(2) 사건 B는 첫번째 카드는 빨강 또는 노랑, 두 번째 카드는 파랑이 나오는 경우이다.
(1) 사건 A의 확률은,
P[A] = P [R|R] P[R] + P [R|Y] P[Y] + P [R|B] P[B]
= 0.16 + 0.2 + 0.04 = 0.4
(2) 사건 B의 확률은,
P[B] = P [B|R] P[R] + P [B|Y] P[Y]
= 0.05 + 0.04 = 0.09
'DataScience' 카테고리의 다른 글
몬티홀 딜레마, 몬티홀 문제 풀이 (3) | 2020.09.08 |
---|---|
베이즈 정리 (Bayes' theorem) (0) | 2020.09.08 |
오차함수와 정규분포와의 관계 (0) | 2020.09.02 |
[Matplotlib] 정규분포 그리기 (0) | 2020.09.02 |
정규분포의 정의와 평균, 분산 (0) | 2020.09.02 |