ヘドニック回帰分析におけるモデル選択に対する情報提供を目的とした多重共線性のリスク診断

蛭田有希,浅見泰司
2019.1.16

論文情報

 ヘドニック回帰分析におけるモデル選択に対する情報提供を目的とした多重共線性のリスク診断

著者:蛭田有希,浅見泰司
発表年:2018
掲載雑誌:都市住宅学102号113-122

論文へのリンク

キーワード

ヘドニックモデル、多重共線性、VIF、数値解析、一般化線形モデル(GLM)

概要

ヘドニック回帰分析は、環境の価値の評価などに用いられる手法のひとつです。例えば、緑地の価値を評価するために、“緑地までの距離”と“住宅の価格”との関係などを分析します。「緑地に近い住宅ほど価格が高ければ、人々は緑地に価値を見出しているだろう」と考えるのです。このとき、“緑地までの距離”だけでなく、“住宅から駅までの距離”や“住宅の広さ”など、住宅の価格に影響しそうな様々な要因も変数として考慮します。ところが、いくつかの変数が互いに似ている(相関関係にある)と、“緑地までの距離”の影響を表す数値(回帰係数)を正しく推定することができないという問題が生じ、この問題は「多重共線性の影響」と呼ばれます。苦労してモデルを構築しても、多重共線性の影響が大きいモデルは、緑地など環境の価値の評価に使うことができません。

本研究は、研究者や実務者がヘドニック回帰分析を行う際に、できるだけ多重共線性の影響の少ない回帰モデルを構築するための手助けとなるよう、多重共線性が生じるリスクを診断する方法を提案したものです。多重共線性の影響を診断する方法は、これまでにも多く示されてきましたが、本研究では、ある回帰モデル(最小二乗法による)を構築したとき、1)多重共線性の影響は影響のない場合の何倍くらいになるのか、ということだけでなく、2)どのくらいの確率で生じるのか(多重共線性の影響がない場合には0.1%の確率でしか生じないような乖離が、構築したモデルでは何%くらいの確率で生じるのか)、を知るための方法を提案しました。例えば、水害が心配なときに、1)どの程度の高さまで浸水するのか、だけでなく、2)そのような水害はどのくらいの確率で起きるのか、が分かった方が対策を講じやすいように、多重共線性についても1)影響の大きさと、2)影響が生じる確率、の両方が分かれば、研究者や実務者が回帰モデルを構築する際の参考になるのではないでしょうか。
環境の研究をする際には様々な目的で回帰分析が行われます。本研究では多重共線性のリスクを診断するための方法のひとつを提案しましたが、今後この方法を実際に広く活用してもらうためには、参考とする数値の目安をより正確に示す必要があります。今後も、応用研究に携わる者ならではの視点で手法を提案し、環境の研究の進展に貢献できればと考えます。

*本研究は一般財団法人民間都市開発推進機構から助成を受けました。感謝いたします。

上段:生じる乖離の程度H*C
下段:乖離が生じる確率P*C
*図中の黒点つき実線はシミュレーション500回の平均、グレーの範囲は第一四分位点から第三四分位点の範囲、点線は最大値および最小値を示す。