高斯无向图模型

1 minute read

Published:

高斯无向图模型是一种重要的概率图模型,与多元高斯分布的各种性质也密切相关。

高斯无向图将变量之间用多元高斯分布建模,此时变量之间的相关关系等价于分析其协方差矩阵。

关于概率图模型的简要介绍,可以移步至 概率图模型

Conditional Distribution of Gaussian

首先推导多元高斯分布的条件分布,

(X1X2)N(μ1μ2),(Σ11Σ12Σ21Σ22)

对其进行Schur补变换,

(IOΣ21Σ111I)(X1μ1X2μ2)N(X1μ1(X2μ2)Σ21Σ111(X1μ1)),(Σ11OOΣ221)With Schur Complement Σ221=Σ22Σ21Σ111Σ21

据此可以得到条件分布,

X2|X1N(μ21,Σ221)With μ21=u2+Σ12Σ122(x1μ1)

根据上述结论,可以得到高斯无向图模型中的独立性判定。

Global Independent

全局的独立性只需要对协方差矩阵进行分析即可,用到了高斯分布不相关和独立等价的结论,可以用矩母函数证明,此处直接用该结论:

XiXj Iff Σij=0

Local Independent

局部独立性也称为Markov性质,刻画了给定其余所有变量之后两个变量的条件独立性,

XiXj,Given All XXi,Xj Iff Θij=0,With Θ=Σ1

其中,矩阵Θ为协方差矩阵Σ的逆矩阵,也被称为精度矩阵或浓度矩阵(Precision Matrix,Concentration Matrix)。

证明用到上述两个矩阵的关系,

(Θ11Θ12Θ21Θ22)=(Σ11Σ12Σ21Σ22)1

利用上述Schur补中的合同变换,可以得到,

Θ111=Σ112Θ122=Σ221

而此时关于i,j的条件协方差矩阵为2×2矩阵,可以算出其逆矩阵并且得到结论,

XiXj,Given All XXi,Xj Iff Θij=0

Conditional Expectation

如果已知除了Xi以外其他所有变量的分布,可以对Xi进行预测,此时可以使用条件分布的均值进行预测。

(Θ11Θ12Θ21Θ22)(Σ11Σ12Σ21Σ22)=I

应用矩阵分块运算,

Θ11Σ11+Θ12Σ21=IΘ11Σ12+Θ12Σ22=OΘ21Σ11+Θ22Σ21=OΘ21Σ12+Θ22Σ22=I

提取我们关心的部分,

Σ21Σ111=Θ122Θ21

而对于Xi的条件分布的上述部分,有明显的含义,代入可以得到,

E[Xi|XXi]=ui+Σ12Σ122(Xμ)=μiΘ122Θ21(Xμ)=μikθik(Xkμk)θii

也即只需要关注θik中的非零部分,对其进行线性组合即可,由于在现实数据中该矩阵通常为稀疏矩阵,上述性质在实际问题的计算中非常有用。