高斯无向图模型
Published:
高斯无向图模型是一种重要的概率图模型,与多元高斯分布的各种性质也密切相关。
高斯无向图将变量之间用多元高斯分布建模,此时变量之间的相关关系等价于分析其协方差矩阵。
关于概率图模型的简要介绍,可以移步至 概率图模型
Conditional Distribution of Gaussian
首先推导多元高斯分布的条件分布,
(X1X2)∼N(μ1μ2),(Σ11Σ12Σ21Σ22)对其进行Schur补变换,
(IO−Σ21Σ−111I)(X1−μ1X2−μ2)∼N(X1−μ1(X2−μ2)−Σ21Σ−111(X1−μ1)),(Σ11OOΣ22−1)With Schur Complement Σ22−1=Σ22−Σ21Σ−111Σ21据此可以得到条件分布,
X2|X1∼N(μ2−1,Σ22−1)With μ2−1=u2+Σ12Σ−122(x1−μ1)根据上述结论,可以得到高斯无向图模型中的独立性判定。
Global Independent
全局的独立性只需要对协方差矩阵进行分析即可,用到了高斯分布不相关和独立等价的结论,可以用矩母函数证明,此处直接用该结论:
Xi⊥Xj Iff Σij=0Local Independent
局部独立性也称为Markov性质,刻画了给定其余所有变量之后两个变量的条件独立性,
Xi⊥Xj,Given All X≠Xi,Xj Iff Θij=0,With Θ=Σ−1其中,矩阵Θ为协方差矩阵Σ的逆矩阵,也被称为精度矩阵或浓度矩阵(Precision Matrix,Concentration Matrix)。
证明用到上述两个矩阵的关系,
(Θ11Θ12Θ21Θ22)=(Σ11Σ12Σ21Σ22)−1利用上述Schur补中的合同变换,可以得到,
Θ−111=Σ11−2Θ−122=Σ22−1而此时关于i,j的条件协方差矩阵为2×2矩阵,可以算出其逆矩阵并且得到结论,
Xi⊥Xj,Given All X≠Xi,Xj Iff Θij=0Conditional Expectation
如果已知除了Xi以外其他所有变量的分布,可以对Xi进行预测,此时可以使用条件分布的均值进行预测。
(Θ11Θ12Θ21Θ22)(Σ11Σ12Σ21Σ22)=I应用矩阵分块运算,
Θ11Σ11+Θ12Σ21=IΘ11Σ12+Θ12Σ22=OΘ21Σ11+Θ22Σ21=OΘ21Σ12+Θ22Σ22=I提取我们关心的部分,
Σ21Σ−111=−Θ−122Θ21而对于Xi的条件分布的上述部分,有明显的含义,代入可以得到,
E[Xi|X≠Xi]=ui+Σ12Σ−122(X−μ)=μi−Θ−122Θ21(X−μ)=μi−∑kθik(Xk−μk)θii也即只需要关注θik中的非零部分,对其进行线性组合即可,由于在现实数据中该矩阵通常为稀疏矩阵,上述性质在实际问题的计算中非常有用。