1. 확률 공리(Axioms of Probability)

용어 정의

수학적으로 확률을 정의하기 위해서는 우선 몇 가지 용어들을 정의해야 한다.

  • 실험(experiment): 결과가 미리 정해져 있지 않고 무작위로 결정되는 현상을 관찰하는 과정
  • 시행(trial): 실험을 수행하는 일
  • 표본공간(sample space): 시행의 결과로 얻어지는 모든 결과들의 집합
  • 사건(event): (우리가 관심 있어 하는) 표본공간의 부분집합

확률을 공부할 때 가장 많이 등장하는 시행의 예시가 동전 던지기와 주사위 던지기일 것이다. 주사위 던지기를 예로 들어 보자.

  • 실험은 주사위를 던져 몇의 눈이 나왔는지를 관찰하는 전 과정이다.
  • 시행은 주사위를 던져 몇의 눈이 나왔는지를 관찰하는 “행위 자체”이다.
  • 표본공간은 주사위를 던져 나올 수 있는 모든 결과들의 집합, 즉 \(\{1, 2, 3, 4, 5, 6\}\)이다.
  • 사건은 표본공간의 부분집합이라면 다 사건이 될 수 있다. 예를 들어 “나는 주사위를 던져 짝수의 눈이 나오는 경우를 관찰하고 싶다”고 한다면 \(\{2, 4, 6\}\)이 된다.

확률을 이야기할 때 표본공간은 보통 \(\Omega\)나 \(S\)로 쓰고, 사건은 event의 앞글자를 따 \(E\)로 많이 쓴다. 이제 모든 준비가 끝났으니 확률이 무엇인지를 정의해 보자.

확률 공리

확률(probability)이란 표본공간 \(\Omega\)의 각 사건(부분집합)에서 실수로 가는, 다음 성질을 모두 만족시키는 함수 \(P\)이다.

  1. 각 사건 \(E\subseteq\Omega\)에 대하여 \(P(E)\geq0\)
  2. \(P(\Omega)=1\)
  3. 상호 배타적인 사건들의 열 \(E_1, E_2, \cdots, E_n, \cdots\)에 대해 \(\displaystyle P\left(\bigcup_{i=1}^\infty E_i\right)=\sum_{i=1}^\infty P(E_i)\)

이 성질들을 확률 공리(axioms of probability)라고 한다. 이 성질들을 처음 본 사람이라면 셋 중 마지막 성질에 대한 설명이 조금 필요해 보일 수도 있다. 이 글에서는 상호 배타적인 사건이 무엇인지, 사건들의 열이란 무엇인지, 마지막에 등장하는 큰 무한 합집합 기호는 무엇을 의미하는지에 대해 살펴볼 것이다.

상호 배타적인 사건

우리는 앞에서 사건을 표본공간의 부분집합으로써 정의하였다. 여기서 두 사건이 상호 배타적이라 함은 두 사건이 서로소, 즉 (집합으로써) 공유하는 원소가 없다는 뜻이다. 예컨대 주사위를 던져서 “홀수의 눈이 나올 사건”과 “짝수의 눈이 나올 사건”은 상호 배타적이라고 볼 수 있다. 여러 개의 사건이 상호 배타적이라는 말은 그들 중 아무 두개나 뽑아도 상호 배타적이라는 것이다.

사건들의 열

수열에서 수들만 사건(집합)들로 바뀐 것이다. 이렇게 수가 아닌 집합, 함수, (좌표평면상의) 점 등 다른 object를 열로 나타낸다면 가산 무한 개의 object들을 쉽게 다룰 수 있다는 장점이 있다. 가산 무한의 뜻이 궁금하다면? 어렵다면 그냥 이 성질이 가산 무한 개의 사건에 대해서 성립한다 정도로 알아놓아도 된다.

무한 합집합 기호

우선 유한 개의 집합에 대한 큰 합집합은 시그마 정의와 비슷하게 각각을 다 합집합한 것으로 정의된다.

$$ \bigcup_{i=1}^nE_i=E_1\cup E_2\cup\cdots\cup E_n $$

그런데, 합집합의 정의를 잘 생각해본다면 해당 집합을 이렇게 나타낼 수도 있다.

$$ \bigcup_{i=1}^nE_i=\{x:\exists i\in\{1, 2, \cdots, n\} \; x\in E_i\} $$

여기서 \(\exists i\in S\) ~~이란 “~~이라는 성질을 만족하는 집합 \(S\)의 원소 \(i\)가 존재한다”는 말이다. 즉 위 식의 우변은 \(x\)가 \(E_i\)에 포함되는 \(1\)이상 \(n\)이하의 자연수 \(i\)가 존재하는 \(x\)들을 다 모아놓은 것이니, 큰 합집합 \(\displaystyle \bigcup_{i=1}^nE_i\)의 정의에 잘 들어맞는다. 우리는 이를 이용해 무한 합집합에 다가갈 수 있다. 무한 합집합의 정의는 다음과 같다.

$$ \bigcup_{i=1}^\infty E_i=\{x:\exists i\in\mathbb{N} \; x\in E_i\} $$

3번 성질의 의미

따라서, 3번 성질을 말로 풀어 쓴다면 이렇게 쓸 수 있을 것이다.

서로서로 공유하는 원소가 단 하나도 없는 (가산 무한 개의) 집합들이 있을 때, 그것들 중 어느 하나가 일어날 확률은 각각이 일어날 확률을 다 더한 것과 같다.

이러한 성질은 가산가법성(countable additivity)이라고 불린다. 어떤 자연수 \(n\)을 잡아 놓고 \(E_1, E_2, \cdots, E_n\)만 살린 뒤 \(E_{n+1}\)부터는 모두 공집합으로 두면 유한 개의 집합에 대해서도 이 성질을 적용할 수 있다.

예시

주사위 던지기

지금까지 확률을 표본공간의 각 사건에서 실수로 가는 특정한 조건(공리)들을 만족시키는 함수로써 정의하였다. 이 정의를 처음 본 사람들은 왜 굳이 확률을 함수로써 정의하였고, 저 조건들은 어디서 나왔는지 궁금해할 수도 있을 것이다. 이해를 돕기 위해 앞서 살펴보았던 주사위 던지기의 예시로 돌아가보자.

주사위를 던지는 시행에 대한 표본공간은 \(\{1, 2, 3, 4, 5, 6\}\)이며, 확률은 표본공간의 각 사에서 실수로 가는 함수라고 했다. 일반적인 주사위는 모든 눈이 다 같은 빈도로 나오므로, 그 함수를 이렇게 정의해볼 수 있겠다.

$$ P(\{1\})=P(\{2\})=P(\{3\})=P(\{4\})=P(\{5\})=P(\{6\})=\frac{1}{6} $$

이렇게 정의한 함수가 위의 세 조건을 모두 만족할 수 있는지 확인해 보자. 이를 위해서는 위에서 정의한 여섯 개의 사건뿐 아니라 모든 사건(표본공간 \(\Omega\)의 모든 부분집합)에 대한 함숫값을 알아야 한다.

다른 사건의 함숫값

원소의 수가 둘 이상인 사건의 함숫값, 예컨대 \(P(\{1, 2\})\)는 어떻게 구할 수 있을까? 3번 조건에 의해

$$ P(\{1, 2\})=P(\{1\})+P(\{2\})=\frac{2}{6} $$

이 된다. 원소 3개짜리 사건의 함숫값도

$$ P(\{1, 2, 3\})=P(\{1\})+P(\{2\})+P(\{3\})=\frac{3}{6} $$

와 같이 구할 수 있다. 똑같은 방법을 사용한다면 \(E\subseteq\Omega\)의 원소가 \(n\)개일 때, \(P(E)=n/6\)이 된다.

공사건의 함숫값

공사건(공집합)의 확률은 3번 조건을 사용하여 구할 수 있다. 표본공간 \(\Omega\)와 공사건 \(\emptyset\)은 상호 배타적이므로 3번 조건에 의해

$$ P(\Omega\cup\emptyset)=P(\Omega)+P(\emptyset) $$

인데, \(\Omega\cup\emptyset=\Omega\)이므로

$$ P(\Omega)=P(\Omega)+P(\emptyset) $$

즉 \(P(\emptyset)=0\)이 된다. 이는 통상적으로 사용되고 있는 “절대 일어날 수 없는 사건”이라는 공사건의 정의와 들어맞는다.

조건 확인

이제 모든 준비가 끝났으니 \(P\)가 확률 공리를 모두 만족하는지 살펴보자.

  1. 위에서 살펴보았듯이 모든 사건의 함숫값은 음이 아니다.
  2. 표본공간 \(\Omega\)는 6개의 원소를 가지고 있으므로 \(P(\Omega)=6/6=1\)이다.
  3. 성립한다는 사실을 쉽게 알 수 있다. 예를 들어 두 상호 배타적인 사건 \(E, F\)가 각각 \(n, m\)개의 원소를 가지고 있다면 \(P(E)=n/6, P(F)=m/6\)이고, \(E\cup F\)는 \(n+m\)개의 원소를 가지고 있으므로 \(P(E\cup F)=(n+m)/6\)이 된다. 따라서 \(P(E\cup F)=P(E)+P(F)\)이다.

따라서 이렇게 정의한 \(P\)는 해당 과정을 거쳐서 확률이라는 사실이 증명되었다.

직육면체 주사위

만약 주사위가 밑면이 정사각형이고 위아래로 길쭉한 직육면체 모양이라면 각각의 눈이 나오는 빈도가 달라질 것이다. 따라서 이때는 함수를 다르게 정의해야 한다. 밑면에 1과 6의 눈이 있어 1과 6의 눈이 더 적게 나온다고 가정해보면, 함수를 다음과 같이 정의해볼 수 있을 것이다.

$$ P(\{1\})=P(\{6\})=\frac{1}{10}, P(\{2\})=P(\{3\})=P(\{4\})=P(\{5\})=\frac{1}{5} $$

이렇게 정의해도 위와 같은 과정을 통해 \(P\)가 확률이라는 사실을 증명할 수 있다.

Leave a Comment