t检验和自助法bootstrap的差别

《Practical Statistics for Data Scientists》书籍英文版
《面向数据科学家的实用统计学》中文版书籍

在对样本做t检验时,背后没有使用自助法(bootstrap)抽样。

t检验是一种参数假设检验,其核心是基于一些严格的统计假设来工作的,例如: * 样本独立性:数据点是相互独立的。 * 正态性:样本数据来自一个呈正态分布的总体。 * 方差齐性:如果进行双样本t检验,两个总体的方差是相等的(对于独立样本t检验,这一假设不是必须的,但通常会影响选择哪种t检验)。

t检验的原理是计算一个t统计量,然后将这个统计量与t分布的临界值进行比较,以确定样本数据是否提供了足够的证据来拒绝原假设。这个过程完全依赖于t分布的理论性质,而不是通过重复抽样来构建经验分布。

t检验与自助法的根本区别

t检验 (参数方法) 自助法 (非参数方法)
基础 基于对总体分布的假设(通常是正态分布)。 不依赖于任何特定的总体分布假设。
原理 使用固定的数学公式(如t统计量)和理论分布来计算p值。 通过从现有数据中重复有放回地随机抽样,来模拟抽样过程并构建统计量的经验分布。
目的 检验关于总体均值的假设。 估计统计量的抽样分布,从而计算置信区间或进行假设检验。

简单来说,t检验是理论驱动的,它假设数据符合某个模型。而自助法是数据驱动的,它通过从现有数据中反复“重新采样”来模拟抽样过程,以评估统计量的变异性。因此,它们是两种完全不同的统计方法。

t检验示例:新教学方法的效果

假设你是一位教育研究者,想知道一种新的教学方法是否能提高学生的数学成绩。你招募了20名学生,将他们随机分成两组: * 实验组(10名学生):采用新的教学方法。 * 对照组(10名学生):采用传统的教学方法。

在一个学期后,你对两组学生进行了同样的数学考试,得到了他们的分数。

实验组分数 对照组分数
85 80
90 78
78 82
92 85
88 75
81 79
86 81
91 77
84 83
89 76

你的问题是:新教学方法的成绩均值是否显著高于传统教学方法的成绩均值?

t检验过程

第一步:提出假设

t检验是基于假设来工作的。我们需要定义原假设(\(H_0\)备择假设(\(H_1\)

  • 原假设 (\(H_0\)):新教学方法没有提高学生的成绩。也就是说,实验组和对照组的平均分数没有差异\(H_0: \mu_{实验组} = \mu_{对照组}\)
  • 备择假设 (\(H_1\)):新教学方法提高了学生的成绩。也就是说,实验组的平均分数高于对照组。这是一个单侧检验\(H_1: \mu_{实验组} > \mu_{对照组}\)

第二步:计算样本统计量

接下来,我们需要计算两组的均值、标准差和样本大小。

  • 实验组:
    • 均值 (\(\bar{x}_1\)) = 86.4
    • 标准差 (\(s_1\)) ≈ 4.39
    • 样本大小 (\(n_1\)) = 10
  • 对照组:
    • 均值 (\(\bar{x}_2\)) = 79.6
    • 标准差 (\(s_2\)) ≈ 3.19
    • 样本大小 (\(n_2\)) = 10

第三步:计算t统计量

t统计量衡量了两个样本均值之间的差异,并以标准误为单位进行标准化。其公式为:

\(t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)

其中,\((\mu_1 - \mu_2)\) 在原假设下为0。\(s_p\) 是合并标准差(Pooled Standard Deviation),用于当假设两组方差相等时。

  • 计算合并标准差 (\(s_p\)): \(s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}} = \sqrt{\frac{(10-1)(4.39)^2 + (10-1)(3.19)^2}{10+10-2}} \approx 3.86\)
  • 计算t统计量: \(t = \frac{(86.4 - 79.6)}{3.86 \sqrt{\frac{1}{10} + \frac{1}{10}}} = \frac{6.8}{3.86 \sqrt{0.2}} \approx \frac{6.8}{1.72} \approx 3.95\)

第四步:确定p值并做出决策

现在,我们有了t统计量 (\(t=3.95\)) 和自由度 (\(df = n_1 + n_2 - 2 = 10+10-2 = 18\))。p值是在原假设为真的情况下,观察到像我们这样或更极端结果的概率

我们可以查阅t分布表,或使用统计软件。对于 \(t=3.95\)\(df=18\) 的单侧检验,p值会非常小(远小于0.001)。

  • 选择显著性水平 (\(\alpha\)):通常选择 \(\alpha = 0.05\)
  • 进行决策
    • 如果 p值 < \(\alpha\),我们拒绝原假设。
    • 如果 p值 > \(\alpha\),我们不拒绝原假设。

在这个例子中,p值(约0.0004)远小于0.05。因此,我们拒绝原假设

第五步:得出结论

我们的结论是:有足够的统计学证据支持备择假设,即新教学方法显著提高了学生的数学成绩。实验组的平均分数(86.4)显著高于对照组(79.6)。