Statistical Hypothesis Testing

1k 词

核心概念

1. 零假设 ($H_0$)

  • 定义: 假设研究的组间 没有差异,即风险因素/治疗与健康结果之间无关系。
  • 应用: 研究中的默认立场,直到有足够证据推翻它。

2. 备择假设 ($H_a$ 或 $H_1$)

  • 定义: 与零假设相反,声明组间 存在差异
  • 目标: 研究者希望证明的目标,但无法被绝对“证实”。最接近的方法是 拒绝零假设
    image.png

image.png

3. I型错误 ($\alpha$)

  • 定义: 错误地拒绝了零假设,即结论认为存在差异,而实际上没有。俗称 假阳性 (False Positive)
  • 概率: 犯此错误的概率为 Alpha ($\alpha$)
    image.png

4. II型错误 ($\beta$)

  • 定义: 未能拒绝本应拒绝的零假设,即结论认为没有差异,而实际上存在。俗称 假阴性 (False Negative)
  • 概率: 犯此错误的概率为 Beta ($\beta$)
    image.png

5. 统计功效 (Power)

  • 定义: 如果差异真实存在,研究能正确发现它的概率。
  • 计算: $\text{Power} = 1 - \beta$
  • 提升方法:
    • 增加样本量
    • 增加效应大小
    • 提高精确度

6.最强检验 (Most Powerful Test) 和 一致最强检验 (Uniformly Most Powerful Test)。

最强检验 (Most Powerful Test, MP Test)

1. 定义 最强检验(MP Test)是在所有显著性水平为 $\alpha$ 的检验中,对于 一个特定的、简单的备择假设 ($H_1$),具有最高效能(即最小 $\beta$)的检验

一致最强检验 (Uniformly Most Powerful Test, UMP Test)

1. 定义 一致最强检验(UMP Test)是在所有显著性水平为 $\alpha$ 的检验中,对于 某一范围内的所有可能的备择假设值,其效能 始终 是最高的检验

7. P值 (p-Value)

  • 定义: 假设零假设为真时,观察到至少与当前结果一样极端的数据的概率。
  • 解读:
    • 小P值: 强烈证据反对零假设。
    • 大P值: 数据与零假设一致。

8. 统计显著性

  • 判断标准: 将 P值 与预设的 Alpha ($\alpha$) 水平(通常为0.05)比较。
  • 结论: 如果 $P < \alpha$,则结果具有 统计显著性,意味着观察到的差异不太可能由偶然造成。

重要区别与注意事项

统计显著性 ≠ 临床显著性
一个有统计学意义的发现,在临床实践中可能没有实际价值或重要影响。

P值的正确理解

  • P值 不能 用来证明备择假设为真。
  • P值 不能 说明观察到的差异是由于偶然。
  • 它只是一个评估数据与零假设吻合程度的工具。结论需结合研究设计等因素。