Two Sample MR

我们将孟德尔随机化的鲁棒方法分为三类

  1. consensus method 共识方法
  2. outlier-robust method 异常点鲁棒方法
  3. modeling method 建模方法

Inverse-variance weighted 反方差加权法

该方法中文叫做逆方差加权法,它的特点是回归时不考虑截距项的存在并且用结局方差(se的二次方)的倒数作为权重来进行拟合

反方差加权法结合了多种遗传变异的汇总数据,提供了一个相当于在有个体水平数据的情况下用两阶段方法得到的估计值。 这使得使用公开数据的孟德尔随机化分析得到了广泛的推广。然而,反方差加权法假设所有的遗传变体都是有效的工具变量,这个假设在实践中可能不成立。

Consensus method

Median method

最直接的共识方法是中位数法。我们不是像IVW方法那样取比率估计值的加权平均值,而是取比率估计值的中位数。 在线性和同质性假设下,所有作为有效工具变量的遗传变体都会估计相同的因果参数。 我们把超过50%的变体是有效IV的假设称为 "多数有效 "假设。

在大样本量中,这意味着有效IV的比率估计值都会趋于相同的数值。只要50%以上的遗传变异是有效的IV,这意味着比率估计的中位数将趋向于真实的因果效应。

在简单的中位数方法中,所有的遗传变异在分析中得到了相同的权重。也可以计算出一个加权版的中位数方法。 在加权中位数法中,我们考虑一个经验分布,其中每个变异体得到的权重相当于下列变量方差的倒数 比值估计的倒数(与IVW方法中的权重相同)。

Mode-based estimation method

"多元有效"假设指出,在大样本中比率估计值所取的所有不同数值中(我们称之为比率估计值), 真正的因果效应是最大数量的遗传变异体所取的数值(即模数比率估计值)。

这个假设允许在少于50%的变异体是有效IV的情况下识别真正的因果效应,前提是不存在更大的具有相同比率估计值的无效IV组。 这个假设也被称为零模态杂交假设(ZEMPA)。

在基于模式的估计方法中,为每个遗传变体构建一个以其比率估计值为中心的正态密度。 这个密度的扩散取决于一个带宽参数,以及(对于基于模式的估计方法的加权版本)比率估计的精度。

Outlier-robust method

接下来,我们提出了三种抑制离群值的方法。这些方法要么降低权重,要么从分析中删除具有离群比率估计值的遗传变体。 MR-PRESSO和MR-Lasso方法将变异体从分析中移除,而MR-Robust则对变异体进行减权。

MR-PRESSO method

在MR-Pleiotropy残差和离群值(MR-PRESSO)方法中,IVW方法通过使用所有遗传变体进行加权回归来实现,并从回归方程中计算残差和(RSS)。 RSS是衡量异质性的一个指标,等于Cochran的Q统计量。

然后,进行IVW方法,依次从分析中省略每个遗传变体。如果RSS与模拟的预期分布相比大幅下降,那么该变体就从分析中删除。

这个过程重复进行,直到没有更多的变体被从分析中删除。然后通过IVW方法利用剩余的遗传变体获得因果估计。

MR-Robust

在MR-Robust中,IVW方法再次通过加权线性回归实现,只是没有使用最小二乘回归,而是使用MM-估计与Tukey的偏重损失函数相结合。 MM-估计(每个'M'代表'最大似然类型')提供了对影响点的稳健性,Tukey损失函数提供了对异常值的稳健性。

Tukey的损失函数是一个截断的二次函数,意味着异常值对分析的贡献程度有一个限制。 这与最小二乘回归中使用的二次损失函数形成对比,后者是无界的,这意味着一个离群点对IVW估计的影响是无限的。

MR-Lasso method

在MR-Lasso中,IVW回归模型通过为每个遗传变异体增加一个截距项。对于有效的IV,它应该是零,但对于无效的IV,它将是非零。

Modeling method

最后,我们介绍了四种稳健的方法,这些方法试图对无效IV的估计值的分布进行建模,或者对IV假设被违反的方式做出具体的假设。

MR-Egger method

MR-Egger方法与IVW方法类似,只是回归模型包含一个截距项。 思考MR-Egger方法的一个直观方式是,它评估了与暴露有关的遗传关联和与结果有关的遗传关联之间是否存在着剂量-反应关系。

Contamination mixture method

污染混合法假定只有部分遗传变异是有效的IV,并在多元有效假设下提供一致的估计值。

为了执行该方法,从比率估计中构建了一个似然函数。 如果一个变体是有效的工具,那么它的比率估计值被假定为关于真实因果效应的正态分布。 如果一个变体不是有效的工具,那么它的比率估计值被假定为关于零的正态分布

MR-Mix method

MR-Mix方法与污染混合法相似,只是该方法不是将遗传变体分为有效和无效的IV,而是将变体分为四类。

  1. 只直接影响暴露的变体(有效IVs)
  2. 影响暴露和结果的变体
  3. 只影响结果的变体
  4. 既不影响暴露也不影响结果的变体。

这使得对遗传变异的建模更加灵活,尽管可能导致在将遗传变异归入类别时有更多的不确定性。

MR-RAPS method

MR-Robust Adjusted Profile Score(RAPS)方法直接使用随机效应分布对遗传变体的多态效应进行建模。

假设多效效应是关于零的正态分布,具有未知的方差,独立于与暴露的遗传关联。 使用因果效应的轮廓似然函数和多态效应分布的方差获得估计值。 为了提供对异常值的进一步稳健性,可以使用Tukey的偏重损失函数或Huber的损失函数。