统计学相关-R2

\(R^2\) 表示IV解释暴露的程度,它有时候很难直接获取

\[ R^2 = 2 * (1 - MAF) * MAF * \frac{\beta}{SD} \]

其中,

  • \(MAF\) 就是次要等位基因频率(minor allele frequency)
  • \(\beta\) 就是SNP对暴露的效应量(effect size)
  • \(SD\) 是标准差(standard deviation)

这里 \(MAF\)\(\beta\) 都可以直接获取,在计算 \(R^2\) 时它可以和效应等位基因频率(effect allele frequency,EAF)等价。

SD需要经过如下转换

\[ SD = SE * \sqrt{N} \]

其中,

  • \(SE\) 就是 \(\beta\) 的标准误差,可以直接获取
  • \(N\) 表示的是暴露的GWAS样本量。