成对样本的T检验
从单样本到成对
单样本 T 检验的通用公式:
其中:
:样本均值 :零假设下假定的总体均值 :样本标准差 :样本量 - 自由度
应用到成对样本 T 检验: 我们不再直接处理原始的两组数据
样本均值 (
): 变成了差值样本的均值 。 零假设下的总体均值 (
): 在成对 T 检验中,我们的零假设 是:两种处理没有差异,即差值的总体均值 。所以, 样本标准差 (
): 变成了差值样本的标准差 。它衡量的是成对数据间差异 ( ) 的离散程度。 样本量 (
): 这里 指的是配对的对子数,也就是有多少对数据(或者有多少个个体提供了前后/左右/配对的两组数据)。例如,10 个病人服药前后的血压数据, (是 10 对数据,不是 20 个测量值)。 自由度 (
): 和单样本 T 检验一样,计算标准差 时我们使用了 个自由度(用样本均值 估计了总体均值 )。所以,
因此,成对样本 T 检验的公式直接套用单样本 T 检验公式,代入以上对应项:
总结公式中的对应关系:
| 单样本 T 检验项 | 在成对 T 检验中的含义 | 成对 T 检验符号 |
|---|---|---|
| 差值 ( | ||
| 零假设下的差值总体均值 (恒为 0) | 0 | |
| 差值 ( | ||
| 配对的对子数 (个体数) | ||
| 自由度 (恒为 |
所以,我们可以用单样本来理解成对 T 检验:
是配对的对子数 - 自由度是
就是 ,即差值 的样本标准差。
什么是成对
每一对数据都来自同一个个体(或匹配的个体)。例如:
- 同一个病人服药前和服药后的血压
- 同一片叶子左边(处理 A)和右边(处理 B)的长度
- 同一个实验小鼠在训练前和训练后通过迷宫的时间
- 同一块土地使用传统肥料和新型肥料的产量(分成两半使用不同肥料)
成对数据的处理
| 患者编号 | 服药前血压 (mmHg) | 服药后血压 (mmHg) | 差值 d = 后 - 前 |
|---|---|---|---|
| 1 | 160 | 150 | -10 |
| 2 | 165 | 155 | -10 |
| 3 | 170 | 165 | -5 |
| 4 | 155 | 145 | -10 |
| 5 | 162 | 155 | -7 |
| 6 | 158 | 152 | -6 |
| 7 | 172 | 168 | -4 |
| 8 | 166 | 158 | -8 |
| 9 | 159 | 151 | -8 |
| 10 | 164 | 157 | -7 |
我们只关心里面的
需要注意的是,其中的
自由度的确定
其中