核心概念
1. 零假设 ($H_0$)
- 定义: 假设研究的组间 没有差异,即风险因素/治疗与健康结果之间无关系。
- 应用: 研究中的默认立场,直到有足够证据推翻它。
2. 备择假设 ($H_a$ 或 $H_1$)
- 定义: 与零假设相反,声明组间 存在差异。
- 目标: 研究者希望证明的目标,但无法被绝对“证实”。最接近的方法是 拒绝零假设。
3. I型错误 ($\alpha$)
- 定义: 错误地拒绝了零假设,即结论认为存在差异,而实际上没有。俗称 假阳性 (False Positive)。
- 概率: 犯此错误的概率为 Alpha ($\alpha$)。
4. II型错误 ($\beta$)
- 定义: 未能拒绝本应拒绝的零假设,即结论认为没有差异,而实际上存在。俗称 假阴性 (False Negative)。
- 概率: 犯此错误的概率为 Beta ($\beta$)。
5. 统计功效 (Power)
- 定义: 如果差异真实存在,研究能正确发现它的概率。
- 计算: $\text{Power} = 1 - \beta$
- 提升方法:
- 增加样本量
- 增加效应大小
- 提高精确度
6.最强检验 (Most Powerful Test) 和 一致最强检验 (Uniformly Most Powerful Test)。
最强检验 (Most Powerful Test, MP Test)
1. 定义 最强检验(MP Test)是在所有显著性水平为 $\alpha$ 的检验中,对于 一个特定的、简单的备择假设 ($H_1$),具有最高效能(即最小 $\beta$)的检验
一致最强检验 (Uniformly Most Powerful Test, UMP Test)
1. 定义 一致最强检验(UMP Test)是在所有显著性水平为 $\alpha$ 的检验中,对于 某一范围内的所有可能的备择假设值,其效能 始终 是最高的检验
7. P值 (p-Value)
- 定义: 假设零假设为真时,观察到至少与当前结果一样极端的数据的概率。
- 解读:
- 小P值: 强烈证据反对零假设。
- 大P值: 数据与零假设一致。
8. 统计显著性
- 判断标准: 将 P值 与预设的 Alpha ($\alpha$) 水平(通常为0.05)比较。
- 结论: 如果 $P < \alpha$,则结果具有 统计显著性,意味着观察到的差异不太可能由偶然造成。
重要区别与注意事项
统计显著性 ≠ 临床显著性
一个有统计学意义的发现,在临床实践中可能没有实际价值或重要影响。
P值的正确理解
- P值 不能 用来证明备择假设为真。
- P值 不能 说明观察到的差异是由于偶然。
- 它只是一个评估数据与零假设吻合程度的工具。结论需结合研究设计等因素。