두 가지 이유가 있습니다.
- 표본분산과 모분산의 차이를 줄이기 위해서
( 직관적 이유 ) - 1/n 은 모분산의 최대 우도 추정치이지만, 수학적으로도 bias가 존재하는 값 입니다.
- 표본분산은 보통 모분산보다 작습니다.
굉장히 큰 모집단에서 sampling 하면 중앙값 부근에서 표본이 많이 추출될 것이고, 표본분산은 모분산보다 작은 경향을 보일 것입니다. - 1/n-1(unbiased 추정치) 을 사용함으로써 둘 사이의 gap을 줄일 수 있습니다.
- 그럼 n-2 는 안되나요?
- 이는 자유도와 관련있습니다.
- n-1 로 나눌 때 표본분산과 모분산을 계산하면 일치하기 때문에
( 수학적인 이유 ) - 다음과 같이 가정한 뒤,
: sample size
: sample mean
: sample variance
: population mean
: population variance
- 아래 수식이 참임을 밝혀봅니다.
- first,
- as here,
댓글 없음:
댓글 쓰기