概要
ガウス過程を用いた分類を考えていきます。2クラスの分類なら、確率的生成モデル - シグモイド関数で導出したシグモイド関数を用いて
とモデル化できます。線形識別ではの部分は
のように、係数
の線形結合を考えていましたが、これを今回はガウス過程
によってモデル化します。
はガウス過程なので、仮に
が1次元の入力なら下図左のようなサンプルが得られます。これをシグモイド関数に通したものが下図右で、出力を確率として扱うことができるようになる、というのは確率的生成モデル - シグモイド関数で見たとおりです。縦軸で0.5を閾値にどちらのクラスかを識別します。
2次元入力なら下図のようなイメージです。左がガウス過程から得られた分布、真ん中がそれをシグモイド関数に通したものです。これを識別の結果でよく使う等高線図にしたものが右のグラフです。ガウス過程による分類では、これを訓練データをもとにして期待する識別境界となるようにしていきます。
新たな入力に対する確率分布
さて、目標は、訓練データ、
が与えられたとき、新たな入力
に対する
の確率、すなわち
を求めることです。なお2クラス分類を考えていますので、
とすれば、
の確率が求まれば
の確率も当然求まります。また、以降は入力の条件を省略して
と表記します。
確率の周辺化により、*1
と変形できます。ここでです。つまり新たな入力点に対応したガウス過程の出力値です。2次元入力の上のグラフ左図でいえば、新たな入力座標に対するZ軸の値です。
さらに条件付き同時確率の式変形により式(2)の右辺は、*2
となります。ここで、は、
が与えられれば
で決まりますから、
には依存しません。従って、
となります。この辺りの式変形は線形回帰をベイズ推定で解く(1)予測分布の導出とけっこう似ていますね。
で、この式(4)をなんとかして求めていくのですが、けっこう長い道のりになります、、、。全6回にわたって計算が続きます。 ちなみに最終結果は次のようになります。
最終的な実験結果はこちらです
*1:条件付き確率、同時確率、周辺確率の式(10)
*2:条件付き確率、同時確率、周辺確率の式(8)