协方差
维基百科,自由的百科全书
在概率论与统计学中,期望值分别为 E(X) = μ 与 E(Y) = ν 的两个实数随机变量 X 与 Y 之间的协方差定义为:
其中 E 是期望值。它也可以表示为:
直观上来看,协方差表示的是两个变量总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果 X 与 Y 是统计独立的,那么二者之间的协方差就是 0。这是因为
但是,反过来并不成立。即如果 X 与 Y 的协方差为 0,二者并不一定是统计独立的。
协方差 cov(X, Y) 的度量单位是 X 的协方差乘以 Y 的协方差。而取决于协方差的相关性,是一个衡量线性独立的无量纲的数。
协方差为 0 的两个随机变量称为是不相关的。
[编辑] 属性
如果 X 与 Y 是实数随机变量,a 与 b 不是随机变量,那么根据协方差的定义可以得到:
对于随机变量序列 X1, ..., Xn 与 Y1, ..., Ym,有
对于随机变量序列 X1, ..., Xn,有
[编辑] 协方差矩阵
分别为 m 与 n 个标量元素的列向量随机变量 X 与 Y,二者对应的期望值分别为 μ 与 ν,这两个变量之间的协方差定义为 m×n 矩阵
两个向量变量的协方差 cov(X, Y) 与 cov(Y, X) 互为转置矩阵。
协方差有时也称为是两个随机变量之间“线性独立性”的度量,但是这个含义与线性代数中严格的线性独立性线性独立不同。