マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)

(有)ソルブ 林原安徳

03-3538-6603

lv_r

マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)

売上予測

2017/11/02 マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)

売上予測の手法 その5 重回帰分析を使った売上予測 6 マルチコ

 

マルチコ(multicollinearity)は日本語で”多重共線性”というおどろおどろしい訳語がついています。

これも重回帰分析の弱点の一つです。

知らないと、思わぬワナに掴ってしまいます。

 

マルチコとは、互いに強い相関関係にある2変数を説明変数として取り入れると、一見良さそうな結果(全体の相関係数が上がる・各説明変数のt値があがる)になるのですが

どちらか1つを説明変数から除くと、途端に、だめになる(相関係数が落ちる・t値が落ちる、1を切る)現象を言います。
****************************************************************************************************

************重回帰分析に必要なデータは”統計てきめん2プレミア”で***************

****************************************************************************************************
この場合の相関係数とは、0.9以上を想定しています。

たとえば、人口と世帯数、人口総数と5~9歳人口、人口男性と人口女性、2010年の人口と2005年の人口、これらは、たいていの地域で強い相関、0.97~0.99を示します。

逆に、こういう組合せで、互いの相関が小さいというのは、どこかに間違ったデータが混入している可能性があります。

 

マルチコとまでいかなくても、少々問題がある説明変数同士というのもあります。

よく見つかるのが、「小売業年間販売額」と「競合性」のマルチコです。

競合性を、競合が強いほど大きくなる指数として定義した場合、重回帰分析で判明する競合性の符号は、マイナスであるべきです。

しかし、往々にして、これがプラスになるばかりではなく、「小売業年間販売額」と強く反応する。

 

これでは、常識に合わないばかりか、大事な変数を2つも失うことになります。

これを放置して、売上予測モデルとしてしまうと、競合性が高いほど、売上が高い。そうしたおかしさを含んだものになってしまう。

 

とまれ、このマルチコは、何でもいいから沢山データを入れて一発で決めちゃえ、などという手抜きをする場合に起きるのであって、前回に書いたように

基本を残差分析におくことで、一つ一つ変数を吟味しながら分析していくなら、マルチコに会うことはめったにありません。

 

seven03

 

TOP