이 글은 유튜브에 업로드된 강의 김성범[소장 / 인공지능 공학 연구소] 핵심 확률/통계를 보고 작성했다.
Chapter 05. Continuous Random Variable
Exponential Distribution
지수 분포의 연속형 확률 분포 pdf와 cdf가 다음과 같이 나타난다.
$$f(x)=\begin{cases}\lambda e^{-\lambda x}& \quad \text{if }x \geq 0 \\ 0&\quad \text{if }x<0\end{cases}$$
$$F(x)=\begin{cases}0& \quad \text{if }x < 0 \\ 1-e^{-\lambda x}&\quad \text{if }x\geq 0\end{cases}$$
지수 분포는 이벤트 간의 시간을 모델링한다. 이벤트는 Poisson distribution에 의해서 생성된다.
예제로는 서비스 기관에서 고객이 오고 다음 고객이 오는 시간 [Interarrival time]과 같은 것이 있다.
파라미터인 $\lambda$는 단위 시간당 이벤트 발생 평균 수.
지수분포의 평균과 분포
Example)
$X$는 통화를 기다리는 시간이 지수분포로 나타난다. 앞사람의 통화가 10분 보다 길게 끝날 확률을 구하시오.
$$f(x)=\lambda e^{-\lambda x}=\frac{1}{10}e^{-\frac{1}{10}x}$$
$$F(x) = 1-e^{-\lambda x}=1-e^{-\frac{1}{10}x}$$
$$\begin{align}P[X>10]&=1-P[X\leq 10]\\&=1-F(10)\\&=1-(1-e^{-\frac{1}{10}10})\\&=e^{-1}\approx 0.368\end{align}$$
기다리는 시간이 10분에서 20분 사이일 확률은
$$\begin{align}P[10 < X < 20] &= P[x<20]-P[x<10]\\&=F(20)-F(10)\\&=(1-e^{-2})-(1-e^{-1})\\&=e^{-1}-e^{-2}\approx 0.233\end{align}$$
Exponential Distribution - Memortless Property
기억상실 특성으로 불인다.
$$P[X\geq s+t | X\geq t]=P[X\geq s], \quad \text{for }\forall s,t\geq 0$$
좌변인 $X$가 $t$시간 이상 진행 됐을 때의 확률은 우변인 t가 상관없는 확률과 같다. 즉, 이전의 내용은 중요하지 않다.
간단한 예제로 $X$는 기기의 수명이고, 기기가 t시간 동안 작용되고 있다. 추가로 $s$시간 더 작동할 경우의 확률은 $s$시간 기기를 작동할 확률과 같다.
Memoryless property
$$X\sim Expo(\lambda)\quad P[X\geq s+t | X\geq t]=P[X\geq s]$$
$$\begin{align}P[X\geq s+t | X\geq t]&=\frac{P(X\geq s+t)}{P(X\geq t)}\\&=\frac{1-P(X<s+t)}{1-P(X<t)}\\&=\frac{1-(1-e^{-\lambda(s+t)})}{1-(1-e^{-\lambda t})}\\&=\frac{e^{-\lambda(s+t)}}{e^{-\lambda t}}\\&= e^{-\lambda s}\\&=P(X\geq s)\end{align}$$
Example)
자동차 배터리가 모두 소진될 때까지 평균 10,000 mile 걸리는데, 5,000 mile동안 배터리를 교체하지 않아도 될 확률은?
$$\begin{align}P[X\geq t+5000 | X \geq t]&=P[X\geq 5000]\\&= 1-(10e^{-\frac{5000}{10000}})\\&=e^{-\frac{1}{2}}\approx 0.604\end{align}$$
? 이전 상황이 영향이 미치지 않는다면? 성립한다?
Poisson Distribution vs Exponential Distribution
푸아송 분포는 어떤 기간 내에 발생한 이벤트의 개수를 나타내는 확률 분포이다.
지수분포는 발생한 이벤트 간의 시간을 확률 분포를 나타낸다.
Example)
콜 센터에 평균 1분에 3번 전화가 걸려온다. $X$는 전화가 걸려온 개수이고 $s$와 $t$사이 걸려온 전화는 다음과 같다.
$$X\sim Poisson(3(t-s))$$
$i-1$번째 전화와 $i$번째 걸리는 전화 사이의 시간을 다음과 같다.
$$W_i \sim Exp(3)$$
Q. $t=0 and t=2$사이의 전화가 안 올 확률은? $P(x)=\frac{e^{-\lambda}\lambda^x}{x!}$
$$X\sim Pois(3,2), X\sim Pois(6)$$
$$P(X=0)=\frac{e^{-6}6^0}{0!}=e^{-6}=0.0025$$
지수분포로 풀면
Q. 2분이 지나서 전화가 올 확률은?
$$W_1\sim Exp(3)$$
$$\begin{align}P(W_1>2)&=1-P(W_1\leq 2)\\&=1-(1-e^{-6})\\&=e^{-6}=0.0025\end{align}$$