確率変数に対して、
を、の共分散といいます。また、の標準偏差をとすれば、
をの相関係数といいます。相関係数は共分散の値を[-1,1]の範囲に正規化したものであると考えることができます。式(1)の定義からわかるように、とが同符号の傾向があるとき共分散が正になり、との符号が反対である傾向があるとき、共分散が負になります。つまりの増加に伴っても増加する傾向にあるなら相関係数が正、の減少に伴っても減少する傾向にあるなら相関係数が負です。共分散が0のとき、相関係数が0であり、無相関になります。逆に言えば、共分散が大きいということは同じような値をとりやすいということです。
共分散を多変量の確率変数に一般化したものを分散共分散行列といい、以下の式で表されます。*1
ここで共分散の定義式より、とは等しいことがわかりますから、です。また、各々の確率変数が全て無相関であるなら対角行列になります。
分散共分散行列を用いて、n次元の多変量正規分布は以下のように表されます。
ここで、です。指数部が2次形式になっていることが、多変量正規分布を扱う計算をするときのポイントになります。また別途記事にします。
いま、2変数で互いに無相関である、つまり
であるとき、式(5)に代入して計算すれば
になります。これは2つの正規分布の積の形になっていることがわかります。
分散共分散行列を変化させて2変数の多変量正規分布をプロットしてみました。赤色が確率密度が高く、青色はその逆です。
左から、分散共分散行列が
のときのグラフです。グラフから無相関、正の相関、負の相関が見て取れます。
*1:分散共分散行列は半正定値行列になります。参考:分散共分散行列の半正定値性