數理統計 Cheat Sheet 13:正態總體均值的假設檢驗
1. 單個總體 $N(\mu, \sigma^2)$ 均值 $\mu$ 的檢驗
1.1. $\sigma^2$ 已知,關於 $\mu$ 的檢驗($Z$ 檢驗)
前文 已經給出正態總體 $N(\mu, \sigma^2)$ 當 $\sigma^2$ 已知時關於 $\mu$ 的檢驗問題。此時使用統計量
\begin{equation}
Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}
\end{equation}
來確定拒絕域。這種檢驗方法常稱為$Z$ 檢驗法 。
1.2. $\sigma^2$ 未知,關於 $\mu$ 的檢驗($t$ 檢驗)
設總體 $X \sim N(\mu, \sigma^2)$,其中 $\mu, \sigma^2$ 未知,考慮檢驗問題
\begin{equation}
H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0
\end{equation}
設 $X_1, X_2, \cdots, X_n$ 是來自總體 $X$ 的一個樣本,由於 $\sigma^2$ 未知,此時不能使用 $\frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 來確定拒絕域。注意到 $S^2$ 是 $\sigma^2$ 的無偏估計,用 $S$ 代替 $\sigma$,採用
\begin{equation}
Z = \frac{\overline X – \mu_0}{S / \sqrt{n}}
\end{equation}
作為檢驗統計量,當觀察值 $|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg|$ 過分大時就拒絕 $H_0$,拒絕域的形式為
\begin{equation}
|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq k
\end{equation}
由前文定理三,當 $H_0$ 為真時,$\frac{\overline X – \mu_0}{S / \sqrt{n}} \sim t(n – 1)$,故由
\begin{equation}
P\{當\;H_0\;為真拒絕\;H_0\} = P_{\mu_0} \bigg\{ \bigg| \frac{\overline X – \mu_0}{S / \sqrt{n}} \bigg| \geq k \bigg\} = \alpha
\end{equation}
得 $t = t_{\alpha / 2}(n – 1)$,即得拒絕域為
\begin{equation}
|t| = \bigg| \frac{\overline x – \mu_0}{S / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \tag{1}
\end{equation}
上述利用 $t$ 統計量得出的檢驗方法稱為$t$ 檢驗法 。在實際應用中,正態總體的方差常為未知,故常用 $t$ 檢驗法來檢驗關於正態總體均值的檢驗問題。
2. 兩個正態總體均值差的檢驗($t$ 檢驗)
$t$ 檢驗法也可以用於檢驗具有相同方差的兩正態總體均值差的假設。設 $X_1, X_2, \cdots, X_n$ 是來自正態總體 $N(\mu_1, \sigma^2)$ 的樣本,$Y_1, Y_2, \cdots, Y_n$ 是來自正態總體 $N(\mu_2, \sigma^2)$ 的樣本,且設兩樣本獨立。記兩個樣本的樣本均值分別為 $\overline X, \overline Y$,樣本方差分別為 $S_1^2, S_2^2$。設 $\mu_1, \mu_2, \sigma_1^2, \sigma_2^2$ 均為未知。對於檢驗問題
\begin{equation}
H_0: \mu_1 – \mu_2 = \delta, \quad H_1:\mu_1 – \mu_2 \neq \delta
\end{equation}
使用下述 $t$ 統計量作為檢驗統計量
\begin{equation}
t = \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}
\end{equation}
其中
\begin{equation}
S_w^2 = \frac{(n_1 – 1)S_1^2 + (n_2 – 1)S_1^2}{n_1 + n_2 – 2}, \quad S_w = \sqrt{S_w^2}
\end{equation}
當 $H_0$ 為真時,由前文定理四,有 $t \sim t(n_1 + n_2 – 2)$。與單個總體的 $t$ 檢驗類似,其拒絕域形式為
\begin{equation}
\Bigg| \frac{(\overline x – \overline y) – \delta}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k
\end{equation}
由
\begin{equation}
P\{當\;H_0\;為真拒絕\;H_0\} = P_{\mu_1 – \mu_2 = \delta} \Bigg\{ \Bigg| \frac{(\overline X – \overline Y) – \delta}{S_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \Bigg| \geq k \Bigg\} = \alpha
\end{equation}
可得 $k = t_{\alpha / 2}(n_1 + n_2 – 2)$。於是得拒絕域為
\begin{equation}
|t| = \frac{|(\overline x – \overline y) – \delta|}{s_w^2 \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \geq t_{\alpha / 2}(n_1 + n_2 – 2) \tag{2}
\end{equation}
類似地,當兩個正態總體的方差均為已知(不一定相等)時,我們可用 $Z$ 檢驗法來檢驗兩正態總體均值差的假設問題。
3. 基於成對資料的檢驗($t$ 檢驗)
有時為了比較兩種產品、兩種方法等的差異,常在相同的條件下做對比實驗,得到一批成對的觀察值,然後分析觀察資料做出推斷。這種方法常稱為逐對觀察法 。
一般地,設有 $n$ 對相互獨立的觀察結果 $(X_1, Y_1), (X_2, Y_2), \cdots, (X_n, Y_n)$,令 $D_1 = X_1 – Y_1$,$D_2 = X_2 – Y_2$, $\cdots$,$D_n = X_n – Y_n$,則 $D_1, D_2, \cdots, D_n$ 相互獨立。又由於 $D_1, D_2, \cdots, D_n$ 是由同一因素所引起的,可以認為它們服從同一分佈。現假設 $D_i \sim N(\mu_D, \sigma_D^2)$($i = 1, 2, \cdots, n$),也就是說 $D_1, D_2, \cdots, D_n$ 構成正態總體 $N(\mu_D, \sigma_D^2)$ 的一個樣本,其中 $\mu_D, \sigma_D^2$ 未知。我們需要基於這一樣本檢驗假設
\begin{align}
&(1) \quad H_0: \mu_D = 0, \quad, H_1: \mu_D \neq 0 \\
&(2) \quad H_0: \mu_D \leq 0, \quad, H_1: \mu_D > 0 \\
&(3) \quad H_0: \mu_D \geq 0, \quad, H_1: \mu_D < 0
\end{align}
分別記 $D_1, D_2, \cdots, D_n$ 的樣本均值和樣本方差的觀察值為 $\overline d, s_D^2$,可知檢驗問題 $(1),(2),(3)$ 的拒絕域分別為(顯著性水平 $\alpha$):
\begin{align}
|t| &= \bigg| \frac{\overline d}{s_D / \sqrt{n}} \bigg| \geq t_{\alpha / 2}(n – 1) \\
t &= \frac{\overline d}{s_D / \sqrt{n}} \geq t_{\alpha}(n – 1) \\
t &= \frac{\overline d}{s_D / \sqrt{n}} \leq – t_{\alpha}(n – 1)
\end{align}