048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)
売上予測の手法 その5 重回帰分析を使った売上予測 6 マルチコ
マルチコ(multicollinearity)は日本語で”多重共線性”というおどろおどろしい訳語がついています。
これも重回帰分析の弱点の一つです。
知らないと、思わぬワナに掴ってしまいます。
マルチコとは、互いに強い相関関係にある2変数を説明変数として取り入れると、一見良さそうな結果(全体の相関係数が上がる・各説明変数のt値があがる)になるのですが
どちらか1つを説明変数から除くと、途端に、だめになる(相関係数が落ちる・t値が落ちる、1を切る)現象を言います。 ****************************************************************************************************
************重回帰分析に必要なデータは”統計てきめん2プレミア”で***************
**************************************************************************************************** この場合の相関係数とは、0.9以上を想定しています。
たとえば、人口と世帯数、人口総数と5~9歳人口、人口男性と人口女性、2010年の人口と2005年の人口、これらは、たいていの地域で強い相関、0.97~0.99を示します。
逆に、こういう組合せで、互いの相関が小さいというのは、どこかに間違ったデータが混入している可能性があります。
マルチコとまでいかなくても、少々問題がある説明変数同士というのもあります。
よく見つかるのが、「小売業年間販売額」と「競合性」のマルチコです。
競合性を、競合が強いほど大きくなる指数として定義した場合、重回帰分析で判明する競合性の符号は、マイナスであるべきです。
しかし、往々にして、これがプラスになるばかりではなく、「小売業年間販売額」と強く反応する。
これでは、常識に合わないばかりか、大事な変数を2つも失うことになります。
これを放置して、売上予測モデルとしてしまうと、競合性が高いほど、売上が高い。そうしたおかしさを含んだものになってしまう。
とまれ、このマルチコは、何でもいいから沢山データを入れて一発で決めちゃえ、などという手抜きをする場合に起きるのであって、前回に書いたように
基本を残差分析におくことで、一つ一つ変数を吟味しながら分析していくなら、マルチコに会うことはめったにありません。
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
売上予測の手法 その5 重回帰分析を使った売上予測 6 マルチコ
マルチコ(multicollinearity)は日本語で”多重共線性”というおどろおどろしい訳語がついています。
これも重回帰分析の弱点の一つです。
知らないと、思わぬワナに掴ってしまいます。
マルチコとは、互いに強い相関関係にある2変数を説明変数として取り入れると、一見良さそうな結果(全体の相関係数が上がる・各説明変数のt値があがる)になるのですが
どちらか1つを説明変数から除くと、途端に、だめになる(相関係数が落ちる・t値が落ちる、1を切る)現象を言います。
****************************************************************************************************
************重回帰分析に必要なデータは”統計てきめん2プレミア”で***************
****************************************************************************************************
この場合の相関係数とは、0.9以上を想定しています。
たとえば、人口と世帯数、人口総数と5~9歳人口、人口男性と人口女性、2010年の人口と2005年の人口、これらは、たいていの地域で強い相関、0.97~0.99を示します。
逆に、こういう組合せで、互いの相関が小さいというのは、どこかに間違ったデータが混入している可能性があります。
マルチコとまでいかなくても、少々問題がある説明変数同士というのもあります。
よく見つかるのが、「小売業年間販売額」と「競合性」のマルチコです。
競合性を、競合が強いほど大きくなる指数として定義した場合、重回帰分析で判明する競合性の符号は、マイナスであるべきです。
しかし、往々にして、これがプラスになるばかりではなく、「小売業年間販売額」と強く反応する。
これでは、常識に合わないばかりか、大事な変数を2つも失うことになります。
これを放置して、売上予測モデルとしてしまうと、競合性が高いほど、売上が高い。そうしたおかしさを含んだものになってしまう。
とまれ、このマルチコは、何でもいいから沢山データを入れて一発で決めちゃえ、などという手抜きをする場合に起きるのであって、前回に書いたように
基本を残差分析におくことで、一つ一つ変数を吟味しながら分析していくなら、マルチコに会うことはめったにありません。