koos808

신뢰구간(Confidence Interval) 본문

Statistics

신뢰구간(Confidence Interval)

koos808 2020. 7. 5. 17:46
728x90
반응형
  • 신뢰구간(Confidence Interval)
    • 신뢰구간을 구하는 이유는 모평균의 신뢰성을 가늠하기 위해서이다.
      • 모평균은 왜 구하는 것일까? 우리가 어떤 자료를 파악하고자 할 때는 그 자료의 평균이나 분산 등의 값들을 먼저 구한다. 평균을 알면 자료의 대표적인 값을 알 수 있고 분산을 알면 자료가 평균으로부터 얼마나 떨어져 있는지를 파악할 수 있기 때문이다. but 모평균과 모분산을 직접 계산한다는 것은 일반적으로 거의 불가능하다. -> 모집단의 원소는 일반적으로 매우 크기 때문!!
      • 따라서 조사하고자 하는 어떤 거대한 모집단이 존재한다면, 표본을 추출하여 모평균 혹은 모분산을 추정하는 것이 통계학의 가장 기본적인 방법이다. 이렇게 추출된 표본으로부터 구한 표본평균 및 표본분산을 모평균과 모분산의 추정치로 사용한다.
      • 하지만 추정치를 100% 신뢰할 수 없으므로 추정치들의 모평균(모분산)에 대한 신뢰구간을 구함으로써 그 신뢰성을 어느 정도 측정할 수 있게 만들었다.
    • 신뢰구간의 의미
      • 추출된 표본이 정해진 개념이 아니듯이 신뢰구간 또한 마찬가지로 명확히 정해지는 개념이 아니다.
      • 같은 방법으로 100번 표본을 추출했을 때, 함께 계산되는 100개의 신뢰구간 중 모평균을 포함한 신뢰구간들의 개수는 95개 정도 된다. 라는 의미다.
      • TIP : '모평균을 포함할 확률이 95%가 되는 구간'은 틀린 의미
    • 참고 : http://blog.naver.com/PostView.nhn?blogId=vnf3751&logNo=220823007712
728x90
반응형

'Statistics' 카테고리의 다른 글

코사인 유사도(cosine similarity) + python 코드  (0) 2020.09.25
배깅(Bagging)과 부스팅(Boosting)  (0) 2020.07.05
1종 오류와 2종 오류  (0) 2020.07.05
P-value 정의와 이해  (0) 2020.07.05
확률(Probability)  (0) 2020.07.05
Comments