✅ 기본 가정

$$ X_1, X_2, \dots, X_n \overset{iid}{\sim} \mathcal{N}(\mu, \sigma^2) $$

표본평균: $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$

불편 표본분산: $S^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \bar{X})^2$


✅ 핵심 아이디어: 중심화된 정규변수의 제곱합은 카이제곱 분포를 따른다

정규분포에서, 다음과 같은 사실이 있습니다:

$$ ⁍ $$

이제 이걸 표본 분산에 적용해 봅시다.


✅ 표본 분산을 표준 정규 변수로 표현

먼저 중심화하고 표준화합니다:

$$ Z_i = \frac{X_i - \mu}{\sigma} \Rightarrow Z_i \sim \mathcal{N}(0, 1) $$

하지만 표본 분산은 $X_i - \bar{X}$의 제곱합을 사용합니다. 이걸 정리하면:

$$ \sum_{i=1}^n (X_i - \bar{X})^2 = \sum_{i=1}^n (X_i - \mu)^2 - n(\bar{X} - \mu)^2 $$

이 차이는 정규분포에서 발생하는 자유도 손실을 반영합니다. $\bar{X}$가 데이터를 "한 번 본" 값이라, 그만큼 자유도가 감소합니다. 그래서 이 합은 자유도 n - 1인 카이제곱 분포를 따릅니다.

[강의7] (참고) 다변량 정규분포의 기하학적 해석과 카이제곱 분포에서 수리적 증명 함.

즉,

$$ \frac{(n - 1) S^2}{\sigma^2} = \sum_{i=1}^n \left( \frac{X_i - \bar{X}}{\sigma} \right)^2 \sim \chi^2_{n - 1} $$