cs

터닝포인트인가여?!

한동안, 한 두달정도 블로그에 아무것도 못올리고 

 

혼자 공부도 안하고 모든걸 잠시 놨었다. 

 

물론 회사에서 일 엄청하고, 중간에 데이콘도 나가보고, 별별 일에 많이 노력은 했지만 블로그까지 손을 댈 시간은 없었댜..(변명이다)

 

데이콘 나갔던 경험은 천천히 다시 정리해서 올릴것이다.

 

 

암튼 회사에 허리케인? 한번 지나가니까 맨탈 샤르르 날라갔었는데,

 

감사하게도 정말 감사하게도 힘+행복을 다시 주셨다. 고맙고 감사하다.

 

열심히 더 열심히 살거다.  

 


모두들 통계를 한번 배운사람이라면, 

 

아니 중학교?에서 경우의수를 공부한 친구들이라면, 동전 한번쯤은 던져봤을것이다. 

 

동전의 앞면, 뒷면의 두가지 경우의 수, 즉 예, 아니요의 결론, 또는 go, stop 이런 결정들, 

 

두가지 결론에 도달하는 것을 쉽게 이항식의 결론이라고 부른다. 

 

이렇게 두가지 결론이 나오는 걸 이진 결과 라고도 하는데, 무조건 50:50일 필요는 없다.

(사실 동전전지기도 5:5결과, 정확히 반반인 확률이 아니다. 앞면이 아주 미세하게 더 높다)

 

두가지의 확률의 합이 1.0이 되면 된다. 

 

그리고 보통 코드를 짜거나 프로그래밍에서는 1이 성공을 뜻하는데, 무조건 확률이 높을 것에 1을 두는 것도 아니지만, 대부분 관심있는 결과를 1에 두는 경향이 많다. 

 

 

 그럼 이번 챕터에서 나오는 이항 분포는 머냐?

 

이항분포 (Binomial Distribution)

이항분포는, 각 시행마다 그 성공의 확률(p)가 정해져 있을 때, 주어진 시행 횟수(n)중에서 성공한 횟수 (x)의 도수 분포를 의미한다. 

 

맞다 글만 보면 뭐 바로 이해가 쉽지가 않다. 

 

예를 들면, 

 

일반적인 주사위를 10회 던져서 숫자 6이 나오는 횟수를 센다면, 이 분포는 n = 10이고 p = 1/6인 이항분포이다.

 

동전을 10번 던져서 앞면이 나오는 횟수를 센다면, 이 분포는 n=10, p=1/2인 이항분포가 된다.

 

 

여기서 다시 또 느끼지만, 이 책이 아니고 다른 통계 책이나 통계를 제대로 공부해보려면,

 

이항분포 다음에 확률 질량 함수랑 누적 분포 함수를 꼭 집고 넘어가야한다. 

(다음 포스트로 한번 간단히 집고 넘어가보겠드아)

 

 

이항분포에서 n x p를 통해 쉽게 평균을 구할 수 있고, 

 

분산은 n x p(1-p)를 통해 구하면 된다. 

 

또한 시행 횟수가 충분할 경우 (특히 p가 0.50에 가까울 때) 이항분포는 사실상 정규분포와 구별이어렵다고 나온다.

 

즉, 실제로 표본이 커질수록 이항 확률을 구하기 위해 많은 계산이 필요하다 보니, 대부분 통계 절차에서는 평균과 분산으로 근사화한 정규분포를 사용한다고 나온다. 

 


파이썬 코드 예제

from scipy import stats

파이썬에서 보통 scipy.stats 모듈에서 다양한 통계 분포를 구현 가능하다. 

이, 이 책이 맘에 하나 딱 안드는게 통계에 대한 기본적 지식을 너무 대충 써놨다!! 

 

아래 보면 pmf, cdf를 써서 확률을 구하는데, 이 두가지 뜻이 확률질량함수와, 누적분포 함수이다.

 

  • Probability Mass Function:  확률 질량 함수
  • Cumulative Distribution Function: 누적 분포 함수
  • Probability Destiny Function: 확률 밀도 함수

(이거 세게 꼭 중요한거니까 다음 포스트에서 다뤄볼것이당.. )

 

근데 코드에서는 간단히 pdf는 안나오넹..?

 

print('pmf:', stats.binom.pmf(2, n=5, p=0.1))

print('cdf:', stats.binom.cdf(2, n=5, p=0.1))

#stats.binom.pdf(2, n=5, p=0.1)

이번에 데이콘에 나가면서, vscode를 활용하는 법을 많이 배웠다

 

저 pmf, cdf 구하려고 노트에 손수 적어가면서 열나게 공부하게 풀었었는데,,, ㅠ 

 

암튼,

 

다음 포스트에서 이항분포를 살짝 더 깊게 더 정리해보겠다. 

+ Recent posts