線形回帰の最小二乗法による解を導出します。
N個の訓練データを、M-1次多項式
で近似することを考えます。 ここで二乗和誤差
を最小にする係数を求めることが目標です。なぜ二乗和誤差を計算するのか?は最小二乗法はなぜ二乗和誤差(残差平方和)を計算するのかに書いてあります。二乗和誤差Eは下に凸なので、偏微分係数が0になるところが最小値となります。よって、式(2)をについて偏微分していけば解が求められますが、M個の係数をまとめて扱ったほうがスマートに導出できます。なお1/2は、計算をきれいするためだけにかかっているもので、本質的なものではありません。あってもなくても導かれる解は一緒です。
式(1)の多項式は、とすれば、行列の積を用いて
と書けます。さらにN個の訓練データをまとめて表せば、
となります。ここで、を並べたN×Mの行列をで表すこととします。すると式(2)の二乗和誤差は、
と書けます。これがなぜ二乗和になるのかは、ベクトルのノルムとベクトルの内積と2乗和より、ベクトルのノルムの二乗は、各要素の二乗和に等しいことが確認できます。もちろんで得られるベクトルの各要素は、予測値と訓練データの誤差です。式(5)を、転置行列の定理、ベクトルのノルムの式(5)を使って展開していくと、
となります。ここで、ベクトルの微分の式(2)、(8)より、
となります。式(8)のは、と変形し、が列ベクトルの形になっていますので、ベクトルの微分の式(2)から計算できます。
よって、となるのは、
のときです。
参考書は初歩的な説明はせずにどんどん進んでいくことが多いので、全ての式変形を理解するのが大変でした。このレベルでこんな調子だと、どこかで致命的につまづくときが来そうですが、、、それまで頑張ります。