zenn.skin 무료버전 배포중!
자세히보기

DataScience

조건부 확률 (Conditional Probability)

koosco! 2020. 9. 8. 00:39

1. 확률

- 확률은 주어진 사건 공간에서 특정 사건이 선택되는 경우를 수치적으로 나타낸 것이다

- 모델을 만들거나, 만들어진 모델의 성능을 평가하는 데에 사용 가능하다

 

2. 종속성과 독립성

- 두 개의 사건이 주어질 때, 한 사건의 발생 여부가 다른 사건의 발생 여부에 대한 정보를 준다면 두 사건은 종속 사건이다. 만약 정보를 주지 않는다면 둘은 독립 사건이다.

 

ex1) 동전을 두 번 던진다. 사건 A는 첫 번째 동전이 앞면인 경우이고, 사건 B는 두 동전이 모두 뒷면이 나오는 경우이다.

사건 A가 일어난다면 사건 B는 일어날 수 없다. 따라서 두 사건은 종속 사건이 된다.

 

ex2) 동전을 두 번 던진다. 사건 A는 첫 번째 동전이 앞면인 경우이고, 사건 B는 두 번째 동전이 뒷면이 나오는 경우이다.

첫 번째 동전과 두 번째 동전은 서로 영향을 미치지 않는다. 따라서 두 사건은 독립 사건이다.

 

다음 식을 만족할 때, 두 사건은 독립 사건임을 의미한다.

- P(EF)는 사건 E와 사건 F가 동시에 발생할 확률이다

 

 

3. 조건부 확률(Conditional Probability)

조건부 확률의 정의

- 조건부 확률은 하나의 사건이 발생했을 때, 다른 사건이 발생할 확률을 나타낸다.

위 식은 사건 B가 일어났을 때, 사건 A가 일어날 확률을 의미한다. 즉, 전체의 Sample Space는 사건 B의 원소로만 이루어져 있다.

 

*전체 확률의 법칙 (Law of Total Probability)

 

수형도로 나타낼 수 있는 문제는 위와 같이 조건부 확률을 이용해 풀 수 있다.

 

ex) 색이 빨강[R], 노랑[Y], 파랑[B]이 세 장의 카드 중 하나를 뽑는 복원 추출을 두 번 반복한다.

빨강이 나올 확률은 0.4, 노랑이 나올 확률은 0.5, 파랑이 나올 확률은 0.1이다.

(1) 사건 A는 두번째에서 빨강 카드가 나오는 경우이고,

(2) 사건 B는 첫번째 카드는 빨강 또는 노랑, 두 번째 카드는 파랑이 나오는 경우이다.

 

(1) 사건 A의 확률은,

P[A] = P [R|R] P[R] + P [R|Y] P[Y] + P [R|B] P[B]

      = 0.16 + 0.2 + 0.04 = 0.4

 

(2) 사건 B의 확률은,

P[B] = P [B|R] P[R] + P [B|Y] P[Y]

      = 0.05 + 0.04 = 0.09

 

'DataScience'의 다른글

  • 현재글 조건부 확률 (Conditional Probability)

관련글