Skip to content

成对样本的T检验

从单样本到成对

单样本 T 检验的通用公式:

t=x¯μ0s/n

其中:

  • x¯:样本均值
  • μ0:零假设下假定的总体均值
  • s:样本标准差
  • n:样本量
  • 自由度 df=n1

应用到成对样本 T 检验: 我们不再直接处理原始的两组数据 XAXB,而是处理它们的差值 di=XiAXiB(或 di=XiBXiA,方向需一致且符合研究假设)。

  1. 样本均值 (x¯): 变成了差值样本的均值 d¯

    d¯=1ni=1ndi
  2. 零假设下的总体均值 (μ0): 在成对 T 检验中,我们的零假设 H0 是:两种处理没有差异,即差值的总体均值 μd=0。所以,

    μ0=0
  3. 样本标准差 (s): 变成了差值样本的标准差 sd。它衡量的是成对数据间差异 (di) 的离散程度。

    sd=1n1i=1n(did¯)2
  4. 样本量 (n): 这里 n 指的是配对的对子数,也就是有多少对数据(或者有多少个个体提供了前后/左右/配对的两组数据)。例如,10 个病人服药前后的血压数据,n=10(是 10 对数据,不是 20 个测量值)。

  5. 自由度 (df): 和单样本 T 检验一样,计算标准差 sd 时我们使用了 n1 个自由度(用样本均值 d¯ 估计了总体均值 μd)。所以,

    df=n1

因此,成对样本 T 检验的公式直接套用单样本 T 检验公式,代入以上对应项:

t=d¯μ0sd/n=d¯0sd/n=d¯sd/n

总结公式中的对应关系:

单样本 T 检验项在成对 T 检验中的含义成对 T 检验符号
x¯差值 (di) 的样本均值d¯
μ0零假设下的差值总体均值 (恒为 0)0
s差值 (di) 的样本标准差sd
n配对的对子数 (个体数)n
df自由度 (恒为 n1)n1

所以,我们可以用单样本来理解成对 T 检验:

  • μ0=0
  • n 是配对的对子数
  • 自由度是 n1
  • s 就是 sd,即差值 di 的样本标准差。

什么是成对

每一对数据都来自同一个个体(或匹配的个体)。例如:

  • 同一个病人服药前和服药后的血压
  • 同一片叶子左边(处理 A)和右边(处理 B)的长度
  • 同一个实验小鼠在训练前和训练后通过迷宫的时间
  • 同一块土地使用传统肥料和新型肥料的产量(分成两半使用不同肥料)

成对数据的处理

患者编号服药前血压 (mmHg)服药后血压 (mmHg)差值 d = 后 - 前
1160150-10
2165155-10
3170165-5
4155145-10
5162155-7
6158152-6
7172168-4
8166158-8
9159151-8
10164157-7

我们只关心里面的 d,需要求出里面的 d¯Sd

d¯=i=1ndin

需要注意的是,其中的 n 就是配对数

Sd=i=1n(did¯)2n1

自由度的确定

df=n1

其中 n 也是配对数

最后更新于:

Released under the MIT License.