概要
前回の以下の記事の続きです。 www.iwanttobeacat.com
前回の記事までのまとめ
訓練データ、が与えられたとき、新たな入力に対するの確率、すなわちを求めることが目標です。そしてこれは、いくつかの式変形によって以下のように表せました。
の計算
式(1)において、ですから、式(1)右辺の前半は簡単に求まりますが、は解析的に求められず、これを何とかしていかなくてはなりません。
確率の周辺化の式を用いて、*1
と変形し、さらにベイズの定理により、*2
です。そして確率の乗法定理により、*3
です。ここでとは独立ですから条件から取り除くことができ、
です。そしてベイズの定理の式(1)より、ですから、以上より
となります。
の計算
ここでまずは式(6)のを考えます。
はガウス過程という前提条件でした。がガウス過程に従うとき、と書けましたから*4、もこの形で書くことができるはずです。ここでの定数倍をカーネル関数の中に含めれば
と書けます。今考えているのは分類問題で離散値データですから、ガウス過程による回帰(1)の式(1)ようにノイズはありませんが、共分散行列の正定値性の保証のため*5、
のようにノイズの項を加えたものを考えます。これが正定値行列であることが、後々最適解を持つことの保証になります。行列の各要素が式(8)で与えられる共分散行列を用いれば、
と書けます。すると、ガウス過程による回帰(1)、ガウス過程による回帰(2)でを計算したのと同様の手順で、
と計算できます。
残りは
次に、式(6)のの計算です。計算の方針はラプラス近似を使って正規分布の形にもっていくことです。そして式(10)とあわせて2つの正規分布の計算とします。
続きは次回 www.iwanttobeacat.com
*1:条件付き確率、同時確率、周辺確率の式(10)
*3:条件付き確率、同時確率、周辺確率の式(2)
*5:分散は0以上であることに注意し、共分散行列の対角成分が正の場合の2次形式を計算してみれば、常に正になることがわかる。