はじめに
計量経済学における基本は、回帰分析であり、最小二乗法です。
基本なので、ここで躓くと、それ以上に計量経済学を学び進めることはできません。
また、統計ソフトなどで、パソコンを使えば、簡単に最小二乗法でモデルを推計できるのですが、計算はできなくても、何をやっているのかということを知っていることは重要です。
そこで、入門者向けに、最小二乗法の基本的な考え方を説明します。
基本的な考え方
データがXとYがあるとしましょう。これをグラフにしたとき、次のような散布図が描けるとしましょう。
この図を見たときに、何となく右上がりに点が並んでいるように見えます。
そうすると、下図のような線が引けるのではという考えが浮かんできます。
これを式で表すと、次のような式になるでしょう。
y = a x + b
xの値に対して、yの値が変化するような関数です。
このとき、xを説明変数(独立変数)、yを被説明変数(従属変数)と言います。xの説明でyが説明される(被説明される)からであり、独立したxの値でyが従属的に変化するため、このような呼び方になっています。
ところで、線を引くことは分かりますが、線を引くと言っても、いくつもの線を引くことが考えられます。
このとき1つの考えが、点と線の距離が短いほうが、より線を引くにあたっては相応しいと思われます。
下図のように、点と線の距離(点線)が小さくなるよう、線を当てはめるということです。
ただ、点ごとに距離は違うので、上記の式y=ax+bに、uというものを付け加えて、点と線の距離を表現しましょう。
y = a x + b + u
そして、この距離uを足し合わせて、最も小さくなるように、線を作り上げるということになります。線を作るには、式のaとbと決めるということで、距離uが小さくなるように、aとbを計算するということになります。
そして、uを誤差項と言います。
なお、この距離uは、プラスになったり、マイナスになったりするので、二乗したものを使います。
最期に、最小二乗法の言葉の意味は、この距離であるuの「二乗」を「最小」にするということで、最小二乗法という名前になっています。