연속확률변수와 확률밀도함수
어떤 범위에 속하는 모든 실수의 값을 가질 수 있는 확률변수를 연속확률변수라고 합니다. $a \leq X \leq b$에서 모든 실수의 값을 가지는 연속확률변수 $X$에 대해 정의된 함수 $f(x)$가 아래 세 가지 조건을 만족하면 이를 확률밀도함수라 합니다.
- $f(x) \geq 0$
- $y = f(x)$의 그래프와 $x$-축 및 두 직선 $x = a$, $x = b$로 둘러싸인 도형의 넓이는 1입니다.
$$
\int_{-\infty}^{\infty} f(x) dx = 1
$$ - 특정 구간에서의 확률은 다음과 같이 계산됩니다.
$$
P(a \leq X \leq b) = \int_a^b f(x) dx
$$
정규분포실수 전체의 집합에서 정의된 연속확률변수 $X$의 확률밀도함수 $f(x)$가 아래 식으로 주어질 때, 이를 정규분포라고 합니다. 이때 $m$은 평균, $\sigma$는 표준편차를 나타냅니다.
$$
f(x) = \frac{1}{\sqrt{2\pi\sigma}} e^{-\frac{(x-m)^2}{2\sigma^2}}
$$
확률밀도함수 $f(x)$의 그래프는 종 모양의 곡선이며, 이를 정규분포 곡선이라고 합니다. 평균이 $m$, 표준편차가 $\sigma$인 정규분포는 기호로 $N(m, \sigma^2)$로 나타냅니다. $e$는 자연상수로 $e \approx 2.71828$이며, $N(m, \sigma^2)$에서 $N$은 Normal Distribution을 의미합니다.
정규분포의 성질
정규분포 $N(m, \sigma^2)$를 따르는 확률변수 $X$의 정규분포 곡선은 다음 성질을 가집니다.
- 직선 $x = m$에 대해 대칭이고 $x$-축이 점근선인 종 모양의 곡선입니다.
- 곡선과 $x$-축 사이의 전체 넓이는 1입니다.
- $\sigma$의 값이 일정할 때, $m$의 값이 달라지면 대칭축의 위치는 바뀌지만 곡선의 모양은 변하지 않습니다.
- $m$의 값이 일정할 때, $\sigma$의 값이 클수록 가운데 부분의 높이는 낮아지고 곡선은 옆으로 퍼집니다.
표준정규분포
평균이 0, 분산이 1인 정규분포 $N(0, 1)$을 표준정규분포라 합니다. 확률변수 $Z$가 표준정규분포 $N(0, 1)$를 따를 때, 확률밀도함수는 다음과 같습니다.
$$
f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}
$$
정규분포의 표준화
정규분포를 따르는 확률변수 $X$를 표준정규분포로 변환하기 위해 다음과 같이 표준화합니다.
$$
Z = \frac{X - m}{\sigma}
$$
이를 통해 다음 관계가 성립합니다.
$$P(a \leq X \leq b) = P\left(\frac{a - m}{\sigma} \leq Z \leq \frac{b - m}{\sigma}\right)$$
이항분포와 정규분포의 관계
확률변수 $X$가 이항분포 $B(n, p)$를 따를 때, $n$이 충분히 크면 $X$는 근사적으로 정규분포 $N(np, npq)$를 따릅니다. 여기서 $q = 1 - p$입니다. 일반적으로 $np \geq 5$, $nq \geq 5$일 때 이 근사가 유효합니다.
You know what's cooler than magic? Math.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!