數理統計 Cheat Sheet 12：假設檢驗

適馬 · 發表 2019-04-16 00:52:05

摘要： 1. 定義假設檢驗是在總體分佈函式完全未知或只知其形式、但不知其引數的情況下，為了推斷總體的某些未知特性，提出某些關於總體的假設，並根據樣本對所提出的假設做出接受還是拒絕的決策。例如對於某正態總體 $X$，已知其方差為 $\sigma^2$，但不知其均值 $\mu$...

1. 定義

假設檢驗是在總體分佈函式完全未知或只知其形式、但不知其引數的情況下，為了推斷總體的某些未知特性，提出某些關於總體的假設，並根據樣本對所提出的假設做出接受還是拒絕的決策。

例如對於某正態總體 $X$，已知其方差為 $\sigma^2$，但不知其均值 $\mu$。現在要根據樣本判斷均值 $\mu$ 是否為某一特定值 $\mu_0$，提出兩個相互對立的假設：

\begin{align}

&H_0: \mu = \mu_0 \\

&H_1: \mu \neq \mu_0

\end{align}

因為 $\overline X$ 是 $\mu$ 的無偏估計，$\overline X$ 的觀察值 $\overline x$ 的大小在一定程度上可以反映 $\mu$ 的大小。因此，如果假設 $H_0$ 為真，則觀察值 $\overline x$ 與 $\mu_0$ 的偏差 $|\overline x – \mu_0|$ 一般不應太大。若 $|\overline x – \mu_0|$ 過分大，則有理由懷疑 $H_0$ 的正確性，從而拒絕 $H_0$。當 $H_0$ 為真時，$\frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$，而衡量 $|\overline x – \mu_0|$ 的大小可以回結尾衡量 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$ 的大小。基於以上考慮，可以適當選定一正數 $k$，使當觀察值 $\overline x$ 滿足 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq k$ 時就拒絕 $H_0$；反之，若 $\frac{\overline x – \mu_0}{\sigma / \sqrt{n}} < k$ 時則接受 $H_0$。

由於做出決策的依據是一個樣本，實際上 $H_0$ 為真時仍可能做出拒絕 $H_0$ 的決策，這種錯誤記為

\begin{equation}

P\{當 \; H_0 \; 為真拒絕 \; H_0 \} \; 或 \; P_{\mu_0}\{拒絕 \; H_0 \} \; 或 \; P_{\mu \in H_0}\{拒絕 \; H_0 \}

\end{equation}

記號 $P_{\mu_0}\{\cdot\}$ 表示引數 $\mu$ 取 $\mu_0$ 時事件 $\{\cdot\}$ 的概率，$P_{\mu \in H_0}\{\cdot\}$ 表示 $\mu$ 取 $H_0$ 規定的值時 $\{\cdot\}$ 的概率。我們無法排除犯這類錯誤的可能性，但希望將犯這類錯誤的概率控制在一定範圍內，即給出一個較小的數 $\alpha$（$0 < \alpha < 1$），使犯這類錯誤的概率不超過 $\alpha$，即使得

\begin{equation}

P\{當 \; H_0 \; 為真拒絕 \; H_0 \} \leq \alpha \tag{1}

\end{equation}

為了確定常數 $k$，考慮統計量 $\frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$，由於只允許犯這類錯誤的概率最大為 $\alpha$，令式 $(1)$ 右端取等號，即令

\begin{equation}

P\{當 \; H_0 \; 為真拒絕 \; H_0 \} = P_{\mu_0}\bigg\{ \bigg\vert \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \bigg\vert \geq k \bigg\} = \alpha

\end{equation}

由於當 $H_0$ 為真時，$Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \sim N(0, 1)$，由標準正態分佈分位點的定義，有

\begin{equation}

k = z_{\alpha / 2}

\end{equation}

因而若 $Z$ 的觀察值滿足

\begin{equation}

|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k = z_{\alpha / 2}

\end{equation}

則拒絕 $H_0$。而若

\begin{equation}

|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k = z_{\alpha / 2}

\end{equation}

則接受 $H_0$。

當樣本容量固定時，選定 $\alpha$ 後，數 $k$ 就可以確定，然後按照統計量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 的觀察值的絕對值 $|z|$ 大於等於 $k$ 還是小於 $k$ 來做出決策。數 $k$ 是檢驗假設的一個門檻值，如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| \geq k$，則稱 $\overline x$ 與 $\mu_0$ 的差異是顯著的，這時拒絕 $H_0$；反之，如果 $|z| = \bigg| \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \bigg| < k$，則稱$\overline x$ 與 $\mu_0$ 的差異是不顯著的，這時接受$H_0$。數 $\alpha$ 稱為顯著性水平 ，上面關於 $\overline x$ 與 $\mu_0$ 的有無顯著差異的判斷是在顯著性水平 $\alpha$ 之下做出的。

統計量 $Z = \frac{\overline X – \mu_0}{\sigma / \sqrt{n}}$ 稱為檢驗統計量 。

2. 雙邊假設檢驗

前面的檢驗問題可以敘述成：在顯著性水平 $\alpha$ 下，檢驗假設

\begin{equation}

H_0: \mu = \mu_0, \quad H_1: \mu \neq \mu_0 \tag{2}

\end{equation}

也常說成“在顯著性水平 $\alpha$ 下，針對 $H_1$ 檢驗 $H_0$”。$H_0$ 稱為原假設 或零假設 ，$H_1$ 稱為備擇假設 。我們要根據樣本，按上述檢驗方法做出在 $H_0$ 和 $H_1$ 中接受其一的決策。

當檢驗統計量取某個區域 $C$ 中的值時，我們拒絕原假設 $H_0$，則稱區域 $C$ 為拒絕域 ，拒絕域的邊界點稱為臨界點 。如在前文中，拒絕域為 $|z| \geq z_{\alpha / 2}$，而 $z = – z_{\alpha / 2}$ 和 $z = z_{\alpha / 2}$ 為臨界點。

由於檢驗法則是根據樣本做出的，總有可能做出錯誤的決策。在假設 $H_0$ 為真時，可能犯拒絕 $H_0$ 的錯誤，稱這類“棄真”的錯誤為第 I 累錯誤。又當 $H_0$ 實際上不真時，也有可能接受 $H_0$，稱這類“取偽”的錯誤為第 II 類錯誤。犯第 II 類錯誤的概率記為

\begin{equation}

P\{當 \; H_0 \; 不真接受 \; H_0 \} \; 或 \; P_{\mu_0 \in H_1}\{接受 \; H_0 \}

\end{equation}

為此，在確定檢驗法則時，應儘可能使犯兩類錯誤的概率都較小，但一般來說，當樣本容量固定時，若減小犯一類錯誤的概率，則犯另一類錯誤的概率往往增大。若要使犯兩類錯誤的概率都減小，除非增加樣本容量。在給定樣本容量的情況下，一般來說，我們總是控制犯第 I 類錯誤的概率，是它不大於 $\alpha$，$\alpha$ 通常去 $0.1, 0.05, 0.01, 0.005$ 等值。這種只對犯第 I 類錯誤的概率加以控制，而不考慮犯第 II 類錯誤的概率的檢驗，稱為顯著性檢驗 。

形如式 $(2)$ 中的備擇假設 $H_1$，表示 $\mu$ 可能大於 $\mu_0$，也可能小於 $\mu_0$，稱為雙邊備擇假設 ，而稱形如 $(2)$ 的假設檢驗為雙邊假設檢驗 。

3. 單邊假設檢驗

有時我們只關心總體均值是否增大，例如總體均值為 $\mu$（未知），新樣本的均值為 $\mu_0$，形如

\begin{equation}

H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0 \tag{3}

\end{equation}

的假設檢驗稱為右邊檢驗 。類似地，形如

\begin{equation}

H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0 \tag{4}

\end{equation}

的假設檢驗稱為左邊檢驗 。

設總體 $X \sim N(\mu, \sigma^2)$，$\mu$ 未知，$\sigma^2$ 已知，$X_1, X_2, \cdots, X_n$ 是來自 $X$ 的樣本。給定顯著性水平 $\alpha$，考慮 $(3)$ 中的檢驗問題

\begin{equation}

H_0: \mu \leq \mu_0, \quad H_1: \mu > \mu_0

\end{equation}

因 $H_0$ 中的全部 $\mu$ 都比 $H_1$ 中的 $\mu$ 小，當 $H_1$ 為真時，觀察值 $\overline x$ 往往偏大，因此拒絕域的形式為

\begin{equation}

\overline x > k, \quad k \; 是某一正常數

\end{equation}

為確定常數 $k$，由

\begin{align}

P\{當 \; H_0 \; 為真拒絕 \; H_0\} &= P_{\mu \in H_0} \{\overline X > k \} \\

&= P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu_0}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} \\

&\leq P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\}

\end{align}

要控制 $P\{當 \; H_0 \; 為真拒絕 \; H_0\} \leq \alpha$，只需令

\begin{equation}

P_{\mu \leq \mu_0}\bigg\{ \frac{\overline X – \mu}{\sigma / \sqrt{n}} \geq \frac{k – \mu_0}{\sigma / \sqrt{n}} \bigg\} = \alpha \tag{5}

\end{equation}

由於 $\frac{\overline X – \mu}{\sigma / \sqrt{n}} \sim N(0, 1)$，由式 $(5)$ 得到 $\frac{k – \mu_0}{\sigma / \sqrt{n}} = z_\alpha$，$k = \mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha$，即得檢驗問題 $(3)$ 的拒絕域為

\begin{equation}

\overline x \geq\mu_0 + \frac{\sigma}{\sqrt{n}}z_\alpha

\end{equation}

即

\begin{equation}

z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \geq z_\alpha \tag{6}

\end{equation}

類似地，可得左邊檢驗問題 $(4)$

\begin{equation}

H_0: \mu \geq \mu_0, \quad H_1: \mu < \mu_0

\end{equation}

的拒絕域為

\begin{equation}

z = \frac{\overline x – \mu_0}{\sigma / \sqrt{n}} \leq – z_\alpha \tag{7}

\end{equation}

4. 一般步驟

綜上所述，處理引數的假設檢驗問題的步驟為：

根據實際問題的要求，提出原假設 $H_0$ 及備擇假設 $H_1$；
給定顯著性水平 $\alpha$ 以及樣本容量 $n$；
確定檢驗統計量及拒絕域的形式；
按 $P\{當 \; H_0 \; 為真拒絕 \; H_0\} \leq \alpha$ 求出拒絕域；
取樣，根據樣本觀察值做出決策，是接受 $H_0$ 還是拒絕 $H_0$。、

數理統計 Cheat Sheet 12：假設檢驗

1. 定義

2. 雙邊假設檢驗

3. 單邊假設檢驗

4. 一般步驟

您可能也會喜歡…