cs

증말 운동해야하는디..

요즘 운동을 너무 안하고 바쁘게 지내다 보니까 

 

어깨가 무슨 풍선 바람 빠진마냥 빠져버렸다.... 

 

피부과에 돈을 써버려서, 헬스장 등록을 안했는데 

 

치료 끝나고 연말쯤에 다시 미친듯이 뻠핑할거댜. 


지난번에 이항분포에 대해서 정말 간단하고 간략하게 훑고 넘어갔다. 

 

하지만, 조금은 딥하게 봐도 큰 문제가 없어보이기도 하고, pmf, cmf를 쓰면서 뭔가 설명이 너무 부족하게 넘어가는것 같아서,

 

내가 개인적으로나마 살짝 잡고 가야한다고 맘을 먹었다. 

 

간단히 봐보쟝.

 

딱 간단하게,

 

확률변수, 확률분포, PDF, CDF까지만이라도!


확률 변수 (Random Variable)

말이 어렵지 그냥 확률적인 현상에 대해서 결과값이 확률적으로 정해지는 변수를 말하는 것이다. 

 

확률적이라는게 결과는 알지만, 어떤 결과가 나올지 모르는 것들이다.

 

예를 들면 동전을 던지는 것에 대해서 앞, 뒷면이라는 결과가 있지만, 어떤 결과가 나올지는 모른다. 

 

조금 더 개념적으로 접근한다면, 

 

확률적인 결과에 따라 결과값이 바뀌는 변수를 묘사하는 개념이라고 설명이 되고, 

 

어떤 시행의 결과에 따라 변수 X가 가지는 값과, 확률이 정해질때의 변수 X를 확률 변수라고 말한다. 

 

그리고 변수값이 유한한것이거나, 무한한 것이거나 할 수가 있다. 

 

  • 이산 확률 변수 (Discrete Random Variable): 존재할 수 있는 값의 수가 유한한것 일 경우, P(X)
    • 주사위, 동전 등등 
  • 연속 확률 변수 (Continuous Random Variable): 존재할 수 있는 값의 수가 무한한 경우, 모든 값에 실수를 가질때, P(a <= X <=b)
    • 주머니에서 구슬 100개를 고르는데, 구슬의 무게가 다 다를때... 즉 딱 안떨어질때 

 

 

확률 분포 (Probability Distribution)

확률변수가 특정한 값을 가질 확률이다. 

 

그리고 당연히 확률 변수가 나태는 값들의 집합이 이산적이라면(자연수의 부분집합과 일대일 대응이 된다면) 이산 확률 분포이고, 

 

확률 변수가 취하는 값들의 집합이 연속적이라면 (실수의 구간을 이룬다면) 연속 확률 분포가 된다. 

 

이산 확률 분포와, 연속 확률 분포 이미지 중 가장 유명한 이미지가 있는데

 

위는 주사위 두개를 던졌을때의 확률분포를 나타내고 (이산 확률 분포)

 

위는 연속된 확률 분포의 정규분포 이미지다. 

 

그리고 아래의 PDF, CDF는 연속된 확률 분포에 대한 함수를 나타낸다.

 

확률 밀도 함수 (Probability Density Function)

위의 그래프에서 보이는 것 처럼 딱 떨어지는 이산 확률 분포에서는 딱 떨어지는 값이 나온다. 

 

연속적인 값에서는 딱 떨어지는 값이 아닌 항상 구간을 통해 설명을 할 수 있고, 곡선 그래프에 대한 넓이를 통해 확률을 나타내기 때문에 적분이 필요로 하다. 

 

그래서 연속된 확률 변수에 대해서는 

위와같은 깔끔한 수식을 통해 계산이 가능하다. 

 

 

누적 분포 함수 (Cumulative Distribution Function)

그리고 확률 변수에 대해서 계속 그 과정을 반복한다면? 그게 누적이 될 것이다. 

 

통계학에서는 확률 변수를 정의 한 후, 그 확률 변수로 표현할 수 있는 사건들의 확률을 구하기 위해 누적분포함수를 통해 확률 함수를 미리 정의한다. 

 

즉, 사건에 대해서 얼마나 많이 발생하고 어떤 사건이 얼마나 적게 발생하는지에 대한 의미이다. 

 

이런 분포를누적 시켜서 나타낸다면 누적 분포 함수 그래프가 나온다.

그림만 봐도 대충 이해가 갈것이다
위와 같이 로지스틱 형태의 그래프를 그리게 된다.

그래프에서 보이는 것 처럼, 증가하는 크기는 일정하면서 감소하지 않는다. 

 

확률 변수 값이  음의 무한대로 가면 0에 수렴할 것이고 양의 무한대로 갈 수록 1에 수렴하게 될 것이다. 

 

어떤 사건 발생 이전의 확률이 0 이였지만, 특정 사건이 발생하고 계속 누적된다면 반드시 일어날 확률이 1이 된다는 것이다. 

 

 

 

확률 질량 함수 (Probability Mass Function)

맨 위에서 설명한 이산확률 변수에서 확률 분포를 나타낸다면, 확률 질량 함수이다.

 

다시말해, 확률 변수가 가질 수 있는 값이 정해져 있거나, 자연수처럼 셀수있는 이산확률일때, 그 확률을 나타내는 함수가 확률 질량 함수라고 생각하면 쉽다. 

 

예를 들면, 주사위를 한번 던져서 나올 확률 변수가 X 라고할때, 이때 확률변수에 대응되는 확률 질량 함수는 1/6이다. 조금 더 쉽다. 

 

https://ko.wikipedia.org/wiki/%ED%99%95%EB%A5%A0_%EC%A7%88%EB%9F%89_%ED%95%A8%EC%88%98

위키에 조금 더 좋은 예가 있어 가지고 와본다면, 

 

동전을 한번 덩졌을때 모든 결과의 표본을 S라고 정한다면, S에 의해서 나올 확률 변수를 X라고 가정한다. 

 

그리고 X는 앞면이 나올 확률이 1 이고 뒷면이 나오면 0이라고 하고, 각 나올 확률이 같다면 

 

확률 질량 함수는 아래처럼 나오게 된다..

https://ko.wikipedia.org/wiki/%ED%99%95%EB%A5%A0_%EC%A7%88%EB%9F%89_%ED%95%A8%EC%88%98

조금더 심플~ 

 

 

누적 질량 함수 (Cumulative Mass Function)

이산형 분포의 주어진 확률 변수가 특정 값보다 작거나 같은 확률을 나타내는 함수이다. 

 

근데 위의 CDF와 전혀 다를게 없다. 

 

쉽게 예제로, 주사위의 눈보다 같거나 작은 눈이 나올 확률 값에 대한 CMF를 그래프로 나타내본다면

이렇게 간단하게 나타내 볼 수 있다. 

 


간단하게나마라도 개념만 알고 넘어가는 식으로 정리했기 때문에, 많이 부족하다.

 

디테일하게 보시려면 꼭 책을 한번 보시길 바란댱.. 아니 다른 유투브라도 보면 쉽게 이해가 간댜! 

 

 

 

 

그리고, 블로그 이제 진짜 평일 야근 계속 하면서 조금씩해야겠댜... 

+ Recent posts