t检验和自助法bootstrap的差别
《Practical
Statistics for Data Scientists》书籍英文版
《面向数据科学家的实用统计学》中文版书籍
在对样本做t检验时,背后没有使用自助法(bootstrap)抽样。
t检验是一种参数假设检验,其核心是基于一些严格的统计假设来工作的,例如: * 样本独立性:数据点是相互独立的。 * 正态性:样本数据来自一个呈正态分布的总体。 * 方差齐性:如果进行双样本t检验,两个总体的方差是相等的(对于独立样本t检验,这一假设不是必须的,但通常会影响选择哪种t检验)。
t检验的原理是计算一个t统计量,然后将这个统计量与t分布的临界值进行比较,以确定样本数据是否提供了足够的证据来拒绝原假设。这个过程完全依赖于t分布的理论性质,而不是通过重复抽样来构建经验分布。
t检验与自助法的根本区别
t检验 (参数方法) | 自助法 (非参数方法) | |
---|---|---|
基础 | 基于对总体分布的假设(通常是正态分布)。 | 不依赖于任何特定的总体分布假设。 |
原理 | 使用固定的数学公式(如t统计量)和理论分布来计算p值。 | 通过从现有数据中重复有放回地随机抽样,来模拟抽样过程并构建统计量的经验分布。 |
目的 | 检验关于总体均值的假设。 | 估计统计量的抽样分布,从而计算置信区间或进行假设检验。 |
简单来说,t检验是理论驱动的,它假设数据符合某个模型。而自助法是数据驱动的,它通过从现有数据中反复“重新采样”来模拟抽样过程,以评估统计量的变异性。因此,它们是两种完全不同的统计方法。
t检验示例:新教学方法的效果
假设你是一位教育研究者,想知道一种新的教学方法是否能提高学生的数学成绩。你招募了20名学生,将他们随机分成两组: * 实验组(10名学生):采用新的教学方法。 * 对照组(10名学生):采用传统的教学方法。
在一个学期后,你对两组学生进行了同样的数学考试,得到了他们的分数。
实验组分数 | 对照组分数 |
---|---|
85 | 80 |
90 | 78 |
78 | 82 |
92 | 85 |
88 | 75 |
81 | 79 |
86 | 81 |
91 | 77 |
84 | 83 |
89 | 76 |
你的问题是:新教学方法的成绩均值是否显著高于传统教学方法的成绩均值?
t检验过程
第一步:提出假设
t检验是基于假设来工作的。我们需要定义原假设(\(H_0\))和备择假设(\(H_1\))。
- 原假设 (\(H_0\)):新教学方法没有提高学生的成绩。也就是说,实验组和对照组的平均分数没有差异。 \(H_0: \mu_{实验组} = \mu_{对照组}\)
- 备择假设 (\(H_1\)):新教学方法提高了学生的成绩。也就是说,实验组的平均分数高于对照组。这是一个单侧检验。 \(H_1: \mu_{实验组} > \mu_{对照组}\)
第二步:计算样本统计量
接下来,我们需要计算两组的均值、标准差和样本大小。
- 实验组:
- 均值 (\(\bar{x}_1\)) = 86.4
- 标准差 (\(s_1\)) ≈ 4.39
- 样本大小 (\(n_1\)) = 10
- 对照组:
- 均值 (\(\bar{x}_2\)) = 79.6
- 标准差 (\(s_2\)) ≈ 3.19
- 样本大小 (\(n_2\)) = 10
第三步:计算t统计量
t统计量衡量了两个样本均值之间的差异,并以标准误为单位进行标准化。其公式为:
\(t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}}\)
其中,\((\mu_1 - \mu_2)\) 在原假设下为0。\(s_p\) 是合并标准差(Pooled Standard Deviation),用于当假设两组方差相等时。
- 计算合并标准差 (\(s_p\)): \(s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1 + n_2 - 2}} = \sqrt{\frac{(10-1)(4.39)^2 + (10-1)(3.19)^2}{10+10-2}} \approx 3.86\)
- 计算t统计量: \(t = \frac{(86.4 - 79.6)}{3.86 \sqrt{\frac{1}{10} + \frac{1}{10}}} = \frac{6.8}{3.86 \sqrt{0.2}} \approx \frac{6.8}{1.72} \approx 3.95\)
第四步:确定p值并做出决策
现在,我们有了t统计量 (\(t=3.95\)) 和自由度 (\(df = n_1 + n_2 - 2 = 10+10-2 = 18\))。p值是在原假设为真的情况下,观察到像我们这样或更极端结果的概率。
我们可以查阅t分布表,或使用统计软件。对于 \(t=3.95\) 和 \(df=18\) 的单侧检验,p值会非常小(远小于0.001)。
- 选择显著性水平 (\(\alpha\)):通常选择 \(\alpha = 0.05\)。
- 进行决策:
- 如果 p值 < \(\alpha\),我们拒绝原假设。
- 如果 p值 > \(\alpha\),我们不拒绝原假设。
在这个例子中,p值(约0.0004)远小于0.05。因此,我们拒绝原假设。
第五步:得出结论
我们的结论是:有足够的统计学证据支持备择假设,即新教学方法显著提高了学生的数学成绩。实验组的平均分数(86.4)显著高于对照组(79.6)。