フィッシャーの線形判別は、これ自体は判別・識別の手法ではなく、各クラスのデータの分離を保ちつつ次元圧縮する手法のようです。多次元のデータを扱うのは大変なので、次元圧縮して計算を楽にしようということでしょうか。今回は2次元の入力を1次元に圧縮する場合を考えていきます。
2次元の入力、
の2クラスのデータを考え、
で1次元に射影するとします。先回までに考えた線形識別とは異なり、ダミー入力は入れません。どのような線上に射影すれば最も分離しやすくなるか?を考えていきます。イメージは以下のアニメーションです。
上のグラフは赤色のクラスと青色のクラスのデータで、緑色の直線に射影した時の点が下に表示されています。これくらいの単純な例だと、目視でなんとなく良さそうな直線が見つけられそうですけどね。
各クラスにデータが個あるとすると、平均ベクトルは
と書けます。2クラスの問題であれば、
を最大にするを解とするというのが1つの方法です。式(3)において
は平均ベクトルを式(1)で射影した値です。つまり、式(3)を最大にするということは、各クラスのデータの中心点が最も離れるように射影するということです。ただし、
は
とします。射影時に拡大させてしまうとがどれだけでも大きくなってしまうためです。
しかし各クラスのデータのばらつき具合によっては必ずしも最適な解にはなりません。見た目の判断ですが、先程のアニメーションの例でもそうなっていると思います。平均ベクトルの距離が近寄りながら、ばらつきも小さくなっていき、最適な分離が現れていそうです。
ということで、ばらつきを考慮するために、射影後の各クラスのデータの分散
を考慮にいれ、フィッシャーの判別基準は
と定義され、これを最大にするを解とします。射影後の分散は小さく、そしてデータの中心点は遠くとりたいということですね。
この続きはフィッシャーの線形判別(2)です。