t检验和自助法bootstrap的差别

发表于 2025-09-25 更新于 2025-09-26 分类于数理统计

《Practical Statistics for Data Scientists》书籍英文版
 《面向数据科学家的实用统计学》中文版书籍

在对样本做t检验时，背后没有使用自助法（bootstrap）抽样。

t检验是一种参数假设检验，其核心是基于一些严格的统计假设来工作的，例如： * 样本独立性：数据点是相互独立的。 * 正态性：样本数据来自一个呈正态分布的总体。 * 方差齐性：如果进行双样本t检验，两个总体的方差是相等的（对于独立样本t检验，这一假设不是必须的，但通常会影响选择哪种t检验）。

t检验的原理是计算一个t统计量，然后将这个统计量与t分布的临界值进行比较，以确定样本数据是否提供了足够的证据来拒绝原假设。这个过程完全依赖于t分布的理论性质，而不是通过重复抽样来构建经验分布。

t检验与自助法的根本区别

	t检验 (参数方法)	自助法 (非参数方法)
基础	基于对总体分布的假设（通常是正态分布）。	不依赖于任何特定的总体分布假设。
原理	使用固定的数学公式（如t统计量）和理论分布来计算p值。	通过从现有数据中重复有放回地随机抽样，来模拟抽样过程并构建统计量的经验分布。
目的	检验关于总体均值的假设。	估计统计量的抽样分布，从而计算置信区间或进行假设检验。

简单来说，t检验是理论驱动的，它假设数据符合某个模型。而自助法是数据驱动的，它通过从现有数据中反复“重新采样”来模拟抽样过程，以评估统计量的变异性。因此，它们是两种完全不同的统计方法。

t检验示例：新教学方法的效果

假设你是一位教育研究者，想知道一种新的教学方法是否能提高学生的数学成绩。你招募了20名学生，将他们随机分成两组： * 实验组（10名学生）：采用新的教学方法。 * 对照组（10名学生）：采用传统的教学方法。

在一个学期后，你对两组学生进行了同样的数学考试，得到了他们的分数。

实验组分数	对照组分数
85	80
90	78
78	82
92	85
88	75
81	79
86	81
91	77
84	83
89	76

你的问题是：新教学方法的成绩均值是否显著高于传统教学方法的成绩均值？

t检验过程

第一步：提出假设

t检验是基于假设来工作的。我们需要定义原假设（\(H_0\)）和备择假设（\(H_1\)）。

原假设 (\(H_0\))：新教学方法没有提高学生的成绩。也就是说，实验组和对照组的平均分数没有差异。 \(H_0: \mu_{实验组} = \mu_{对照组}\)
备择假设 (\(H_1\))：新教学方法提高了学生的成绩。也就是说，实验组的平均分数高于对照组。这是一个单侧检验。 \(H_1: \mu_{实验组} > \mu_{对照组}\)

第二步：计算样本统计量

接下来，我们需要计算两组的均值、标准差和样本大小。

实验组：
- 均值 (\(\bar{x}_1\)) = 86.4
- 标准差 (\(s_1\)) ≈ 4.39
- 样本大小 (\(n_1\)) = 10
对照组：
- 均值 (\(\bar{x}_2\)) = 79.6
- 标准差 (\(s_2\)) ≈ 3.19
- 样本大小 (\(n_2\)) = 10

第三步：计算t统计量

t统计量衡量了两个样本均值之间的差异，并以标准误为单位进行标准化。其公式为：

\(t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)

其中，\((\mu_1 - \mu_2)\) 在原假设下为0。\(s_p\) 是合并标准差（Pooled Standard Deviation），用于当假设两组方差相等时。

计算合并标准差 (\(s_p\))： \(s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}} = \sqrt{\frac{(10-1)(4.39)^2 + (10-1)(3.19)^2}{10+10-2}} \approx 3.86\)
计算t统计量： \(t = \frac{(86.4 - 79.6)}{3.86 \sqrt{\frac{1}{10} + \frac{1}{10}}} = \frac{6.8}{3.86 \sqrt{0.2}} \approx \frac{6.8}{1.72} \approx 3.95\)

第四步：确定p值并做出决策

现在，我们有了t统计量 (\(t=3.95\)) 和自由度 (\(df = n_1 + n_2 - 2 = 10+10-2 = 18\))。p值是在原假设为真的情况下，观察到像我们这样或更极端结果的概率。

我们可以查阅t分布表，或使用统计软件。对于 \(t=3.95\) 和 \(df=18\) 的单侧检验，p值会非常小（远小于0.001）。

选择显著性水平 (\(\alpha\))：通常选择 \(\alpha = 0.05\)。
进行决策：
- 如果 p值 < \(\alpha\)，我们拒绝原假设。
- 如果 p值 > \(\alpha\)，我们不拒绝原假设。

在这个例子中，p值（约0.0004）远小于0.05。因此，我们拒绝原假设。

第五步：得出结论

我们的结论是：有足够的统计学证据支持备择假设，即新教学方法显著提高了学生的数学成绩。实验组的平均分数（86.4）显著高于对照组（79.6）。