Bounds and Sensitivity Analysis

Lecture Notes on Causal Inference

Bounds

在之前的(T,W,Y)例子中,还可能存在潜在原因U同时作用与T和Y。此时,不存在未观察到的Confounding这样一种假设是不现实的。如果还是基于这种unconfoundedness假设,那么我们indentify的其实是一个point (一个具体的值),而如果我们做一些更弱的假设,则此时我们indentify的是一个区间。在这里,我们来确定不同假设下该区间的范围,即为bounds

No-Assumption Bound

在这里,我们假设所有的potential outcomes都具有统一的bound,即 $\forall t, a\le Y(t) \le b$
由此我们可以得到 $a-b\le E[Y(1)-Y(0)] \le b-a$ ,整个区间的长度为 2(b-a) 。我们可以通过Observational-Counterfactual Decomposition来进一步压缩区间长度。首先我们用 $\pi$ 来表示 P(T=1),根据定义展开ATE,可得到

\[E[Y(1)-Y(0)]=\pi E[Y\vert T=1]+(1-\pi) E[Y(1)\vert T=0] -\pi E[Y(0)\vert T=1]-(1-\pi) E[Y\vert T=0]\]

其中,展开后的第一项和第四项称为 observation term,可以从观察结果中直接计算得到。而第二项和第三项称为 Counterfactual term,无法通过计算得到。为此,我们保留observation term,将counterfactual term替换为(a,b) bound 区间。此时我们可以得到

\[E[Y(1)-Y(0)]\le \pi E[Y\vert T=1]+(1-\pi) b -\pi a-(1-\pi) E[Y\vert T=0]\] \[E[Y(1)-Y(0)]\ge \pi E[Y\vert T=1]+(1-\pi) a -\pi b-(1-\pi) E[Y\vert T=0]\]

我们可以发现,此时 E[Y(1)-Y(0)] 的区间长度被压缩到了 b-a

Monotone Treatment Bound

Optimal Treatment Selection

总的来说,具体使用哪种假设取决于具体问题。在有的问题里,某些假设可能完全没有意义,而在其他问题里,又可能是最合适的假设 (区间范围最小等)。因此需要具体情况具体分析

Sensitivity Analysis

正如之前所提到的 (T,W,U,Y) 例子,真实的causal effect应该是 $E_{W,U}[…]$ ,而因为我们无法观测到U,实际上我们计算的是 $E_{W}[…]$ ,这就导致了偏差的产生。sensitivity analysis 就是为了分析这样一种偏差程度

以上是最简单形式的 Linear SCM,for arbitrary estimands in arbitrary graphs, where the structural equations are still linear,对应的参考文献为 Sensitivity Analysis of Linear Structural Causal Models” from Cinelli et al. (2019)

其他更广泛形式下的敏感性分析方法见课后参考文档