フィッシャーの線形判別（１） - 機械学習に詳しくなりたいブログ

フィッシャーの線形判別とは

フィッシャーの線形判別は、これ自体は判別・識別の手法ではなく、各クラスのデータの分離を保ちつつ次元圧縮する手法のようです。多次元のデータを扱うのは大変なので、次元圧縮して計算を楽にしようということでしょうか。今回は2次元の入力を1次元に圧縮する場合を考えていきます。

2次元の入力 $\mathbf x$ 、 $C_1,C_2$ の2クラスのデータを考え、

$y = \mathbf{w}^{T} \mathbf{x} \tag{1}$

で1次元に射影するとします。先回までに考えた線形識別とは異なり、ダミー入力は入れません。どのような線上に射影すれば最も分離しやすくなるか？を考えていきます。イメージは以下のアニメーションです。

上のグラフは赤色のクラスと青色のクラスのデータで、緑色の直線に射影した時の点が下に表示されています。これくらいの単純な例だと、目視でなんとなく良さそうな直線が見つけられそうですけどね。

どういう方向へ射影するのが適切であるのかを考えます。各クラスにデータが $N_k$ 個あるとすると、平均ベクトルは

$\displaystyle \mathbf m_k = \frac{1}{N_k} \sum_{n \in C_k} \mathbf x_n \tag{2}$

と書けます。この平均ベクトルをある方向へ射影したとき、より離れていれば良さそうです。2クラスの問題であれば、

$m_2 - m_1 = \mathbf{w}^{T} (\mathbf m_2 - \mathbf m_1) \tag{3}$

を最大にする $\mathbf w$ を解とするというのが1つの方法です。式(3)において $m_k$ は平均ベクトルを式(1)で射影した値です。つまり、式(3)を最大にするということは、各クラスのデータの中心点が最も離れるように射影するということです。ただし、 $\mathbf w$ は

$\displaystyle \sum_i w_i^2 = 1 \tag{4}$

とします。射影時に拡大させてしまうと $m_2-m_1$ がどれだけでも大きくなってしまうためです。

しかしこれは各クラスのデータのばらつき具合によっては必ずしも最適な解にはなりません。以下のように、平均がベクトルの距離が遠い左図より、距離が近いほうが適切な分離であるという可能性があります。*1

ということで、ばらつきを考慮するために、射影後の各クラスのデータの分散

$\displaystyle s_k^2 = \sum_{n \in C_k} (y_n - m_k)^2 \tag{5}$

を考慮にいれ、フィッシャーの判別基準は

$\displaystyle J(\mathbf w) = \frac{(m_2 - m_1)^2}{s_1^2 + s_2^2} \tag{6}$

と定義され、これを最大にする $\mathbf w$ を解とします。射影後の分散は小さく、そしてデータの中心点は遠くとりたいということですね。

*1:平均ベクトルの位置は説明のために適当に入れています。もしかしたら右図のほうが平均ベクトルの距離も大きいかもしれません。