Causal Models

Lecture Notes on Causal Inference

The do-operator

Conditioning vs. intervening

对于Interventional distributions,通常可记作

\[P(Y (t) = y) \triangleq P(Y = y \vert do(T = t)) \triangleq P(y \vert do(t))\]

在 Identification 的过程中,我们借助 Causal model 将 \(P(y\vert do(t))\) 转化为 \(P(y\vert t)\) (这是在没有confounder的情况下)。前者可由实验获取,后者可由观察数据获取。

Main assumption: modularity

在这里我们引入一个重要的假设,我们假设 the causal mechanisms are modular
具体来说,在DAG中,如果我们 intervene on node \(X_i\),则只改变\(P(x_i\vert parent(x_i))\)。对于其他 \(j \neq i\) 的节点,\(P(x_j\vert parent(x_j))\)保持不变。

也就是说,我们通过do operation,对选取的intervene节点 \(X_i\),将其概率\(P(x_i\vert parent(x_i))\)直接设置为1,而不再关注父节点对其的影响。(注意,这里为了一致性,我们需要保证\(x_i\)就是do operation中\(X_i\)被设置的值,否则概率为0)

该假设还有其他称呼:independent mechanisms, autonomy, invariance, etc.

基于这种假设,我们可以得到对应的数学表达形式,即

\[P(x_1,x_2,...,x_n\vert do(S=s)) = \prod_{i\neq S}P(x_i\vert parent(x_i))\]

回到 introduction中的例子,X 共同影响 T 和 Y,T 影响 Y,此时

\[P(y\vert do(t)) = \sum_xP(y,x\vert do(t)) = \sum_xP(x)P(y\vert t,x)\]

\[P(y\vert t) = \sum_xP(y,x\vert t) = \sum_xP(x\vert t)P(y\vert t,x)\]

可以看出\(P(y\vert do(t))\neq P(y\vert t)\),这也从另一个角度说明了Association not equal causation

Backdoor adjustment

我们可以通过do-operation来消除其他原因产生的影响,但我们想从观测数据出发,就需要利用条件概率。这也引出了backdoor adjustment

我们首先定义 backdoor criteria。对于由 T 到 Y 的因果关系,假设存在一组其他变量W,backdoor criteria的要求是

  1. W 能阻塞从 T 到 Y 的所有backdoor path
  2. W 不能包含 T 的所有子节点

我们可以利用该标准,来选择 conditional exchangeability 假设中的条件。那么,结合 Modularity 假设和满足 backdoor criteria 的 W,We can identify the causal efftec of T on Y,即

\[P(y \vert do(t)) = \sum_w P(y | t, w) P(w)\]

这个式子即为 backdoor adjustment

Structural causal models

在因果推理中,等号并不能传递任何的因果信息。那么,为了表示 A 是 B 的一个原因,我们用结构方程来表示,即 \(B:=f(A)\)
为了提升泛化能力,我们在这里增加一项U,表示可能存在的隐藏原因,即\(B:=f(A, U)\)

在结构化因果模型(SCMs)中,我们用一系列这样的方程来进行建模。其中,直接原因称为endogenous variables,而可能存在的隐藏原因称为exogenous variables

在 Interventional SCM 中,我们需要改写部分结果对应的方程,例如从\(T := f_T (X, U_T)\) 变到 \(T:=t\)。we get this by performing the intervention do(T = t).

在建立 SCM 之后,我们再回头看之前定义的 backdoor criteria 第二条,为什么不能对子节点进行条件处理呢?有两种可能

  1. 对子节点condition,可能会阻塞 chain 形式的因果图模型,即 block causal association
  2. 可能会产生新的association,如果对 immorality 类型的子节点condition,则会产生新的 unblocked path,对结果产生影响。而隐藏原因的存在增大了这样 immorality 类型的出现。这样一种影响称为 Collider bias