Pages

2019년 3월 27일 수요일

Standard deviation 추정할 때 n-1로 나누는 이유

두 가지 이유가 있습니다.

  1. 표본분산과 모분산의 차이를 줄이기 위해서
    ( 직관적 이유 )
    1. 1/n 은 모분산의 최대 우도 추정치이지만, 수학적으로도 bias가 존재하는 값 입니다.
    2. 표본분산은 보통 모분산보다 작습니다.
      굉장히 큰 모집단에서 sampling 하면 중앙값 부근에서 표본이 많이 추출될 것이고, 표본분산은 모분산보다 작은 경향을 보일 것입니다.
    3. 1/n-1(unbiased 추정치) 을 사용함으로써 둘 사이의 gap을 줄일 수 있습니다.
    4. 그럼 n-2 는 안되나요?
      1. 이는 자유도와 관련있습니다.
  2. n-1 로 나눌 때 표본분산과 모분산을 계산하면 일치하기 때문에
    ( 수학적인 이유 )
    1. 다음과 같이 가정한 뒤,
      : sample size
      : sample mean
      : sample variance
      : population mean
      : population variance
    2. 아래 수식이 참임을 밝혀봅니다.

    3. first,








    4. as here,



댓글 없음:

댓글 쓰기