정규분포 영상
정규분포 밸런스 게임
우리가 제일 흔하게 다루는 확률은 무엇일까?
동전 던지기의 앞면 뒷면
주사위 던지기에서 6이 나올 확률
게임에서의 승리 패배
도전에서의 성공 실패
우리는 이렇게 상호 배타적으로 나뉘어지며
앞의 사건이 다음 사건에 영향을 미치지 않는
독립시행의 확률을 제일 많이 다룬다
이러한 시행을 계속한다고 했을 때
나오는 분포를 보고
바이노미얼 디스트리뷰션 즉 이항분포라고 부른다.
이항분포는 우리가 일상에서 다루는 많은 경우에 대한
확률을 찾아줄 수 있는 좋은 분포이다.
그런데 이러한 분포도 단점이 있다.
첫번째로는 확률변수가 시행횟수이다보니
자연수영역에서 밖에 확률 구하지 못하고
두번째로는 확률을 독립시행의 확률의 합으로 정의하는데
시행횟수가 커지면 커질 수록 확률 계산이 어렵다는 것이였다.
이에 많은 수학자들은 이 문제를 해결할 수 있는
일반적인 분포가 있을지 고민하기 시작했다.
그러던 1733년 드무아브르가
이항분포에서 시행횟수가 충분히 크다면
그 그래프가 좌우 대칭인 종모양의 곡선이 됨을 보이며
근사치를 계산해내 정규분포를 만들어낸다.
이후로 많은 수학자들이 정규분포를 이용하여 많은 현상을 분석하기 시작했지만
이는 근사치였고 정확한 결과값과 이론을 제시하지 못하고 있을 때
가우스가 가우스함수에 이상적분으로
가우스적분을 만들어 내며 정규분포를 정립한다.
정규분포는 연속확률분포 중 가장 널리 알려진 분포로
이미 계산된 표를 이용하여 확률값을 쉽게 찾아낼 수 있으며
표본의 크기가 큰 경우 중심극한 정리에 의해
표본의 평균은 정규분포를 따른다는 것이 알려져 있다.
쉽게 말해 모든 것을 분석할 수 있는 분포이다.
그래서 우리는 확률분포 중 가장 일반적인 정규분포를
고등학교 확률과 통계 마지막 단원에서 배우게 된다.
정규분포 곡선에 대해 잠시 알아보자.
정규분포 곡선은 가장 중심이 되는 평균에 대해 대칭인 종모양을 띄며
확률밀도함수이므로 확률의 성질에 의해 전체 넓이는 1이 나온다.
그리고 표준편차 즉 흩어진 정도가 크면 클수로
중심으로부터 멀어지는 펑퍼짐한 곡선을 띈다.
이러한 정규분포에서 확률을 찾을 때는
확률밀도함수를 적분하면 되는데 이는 고등학교에서 하기에는 너무 어렵기에
미리 계산을 해두어 표로 정리해두고
우리는 표에서 해당하는 값을 찾아서 확률을 계산하게 된다.
그런데 이 표를 보기 위해서는 정규분포를 표준화하는 공식을 써야하는데
사실 정규분포의 의미를 잘 알고있다면
굳이 이 공식을 쓰지않고도 확률을 구해낼 수 있다.
예를들어 [X~N(100,20^2)일 때, P(100<X<120)]
확률변수 X가 평균이 100, 표준편차가 20인 정규분포를 따른다고 할 때,
X가 100보다 크고 120보다 작을 확률을 구해보자.
일단 정규분포문제이므로 종모양의 그래프를 그린다.
그리고 정중앙이 평균이므로
가운데 100을 적으면 120은 100보다 크므로
100보다 오른쪽에 표시할 수 있다.
이때 100부터 120까지의 확률이니까 이 가운데를 색칠해주자.
그렇게 되면 20만큼의 거리차가 생기는데
20은 표준편차 즉 시그마이므로
1시그마라고 쓸 수 있다.
이 때 시그마 앞에 붙게되는 이 1을 표준정규분포 표에서 찾게되면
0.3413 즉 그 넓이값이 확률이 된다.
같은 방법으로 X가 90보다 클 확률을 찾아보자.
먼저 똑같이 종모양의 정규분포를 그린 후
가운데 평균을 적자. 90은 100보다 작으므로 왼쪽에 적고
90보다 클 확률이므로 90보다 큰 영역에 색칠을 하자.
90에서 평균인 100까지의 길이는 10인데
20이 1시그마 이므로 10은 0.5시그마라고 할 수 있다.
따라서 시그마의 계수인 0.5를 표준정규분포표에서 찾게되면
0.1915이고 이게 이 부분의 넓이이다.
다음으로 100부터 오른쪽에 있는 넓이는 정규분포 전체넓이의 반이므로 0.5이므로
전체 넓이는 0.5+0.1915 즉 확률은 0.6915라는 것을 알 수 있다.
표준정규분포 공식을 알고있는 분들은 이 풀이를 보면
어차피 공식써서 푸는건 비슷한데 뭐가 다른거냐고 할 수 있겠지만
보통 Z-score로 푸는게 익숙하면 그래프를 그리지 않으므로
확률계산을 잘못했을 때 오류를 눈으로 확인하기 어렵다.
그리고 실제로 이 방법을 써보면 표준편차의 계수를 암산으로 찾을 수 있어
Z-score 공식보다 더 빠르게 문제를 해결할 수 있다는 장점이 있다.
설명을 듣고 실제로 풀어보는것은 다르기에
아래 링크와 해당영상에 정규분포를 학습할 수 있는 밸런스게임을 넣어두었다.
정규분포는 실생활에서 평균과 표준편차가 주어진 자료가 있다면
내가 원하는 확률을 손쉽게 해결할 수 있다는 장점이 있다.
다소 유치할 수는 있겠지만 실생활문제를 해결하고
웹기반 프로그램으로 분포를 만져보고
문제에를 하나하나 해결하면서 피드백을 받다보면
수능시험에 나오는 수준의 정규분포 문제는 쉽게 해결할 수 있을 것이다.
You know what's cooler than magic? Math.
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!