研究課題/領域番号 |
26560163
|
研究機関 | 東京大学 |
研究代表者 |
大西 立顕 東京大学, 情報理工学(系)研究科, 准教授 (10376387)
|
研究期間 (年度) |
2014-04-01 – 2016-03-31
|
キーワード | k近傍法 / 機械学習 / 超並列計算 / データ駆動 / 不動産市場 / 経済物理学 / 社会物理学 / 価格予測 |
研究実績の概要 |
本課題は,超並列計算によるデータ駆動型統計学を用いて動的で複雑なデータを実証分析し,経済・社会現象を帰納的に理解することを目指すものである.過去27年間の首都圏の中古マンション売買の取引データ約100万件を用いて物件価格を予測する問題を考えた.金融市場では同一銘柄の取引が頻繁に行われているため,価格を予測する際にはその銘柄の直近過去の取引価格を参考にすれば良い.しかし,不動産市場ではまったく同一の物件が頻繁に取引されることはほとんどなく,直近過去の取引が10年以上も昔になってしまうこともあり,同一物件の過去の取引事例は必ずしも参考にならない.したがって,実務上は勘と経験に基づいてその物件と同じような特徴を持つ物件を何件か取り出し,価格を外挿して手動で予測を行うのが典型的な方法になっている.そこで,データを十分に活用して価格を自動的に決定する方法を開発するために,直近過去の取引事例の中から予測したい物件に類似した属性(面積,緯度,経度,築年数)を有する物件をk件取り出し,これらの重みつき平均価格を予測値とする重みつきk近傍法のモデルを検討した.スパコンによる超並列計算を活用して分析した結果,予測誤差を最小にする最適な重みと近傍数kが存在し,4つすべての属性を用いたときに予測誤差が最小になることが分かった.また,説明変数として最も重要なのは面積で,次いで緯度,経度,築年数となることを明らかにした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
解析的に表現可能な関数ではなく,機械学習によるデータ駆動の視点から価格決定に重要な変数を抽出することができた.
|
今後の研究の推進方策 |
価格を予測するk近傍法のモデルにおいて,取引事例として直近過去何週間分を参照し,類似した物件として何件の物件を取り出すかについて,最適な期間の長さと物件数を時期に応じて動的に決定する方法を検討する.単純な線形回帰を基本とするヘドニック法との比較を行う.また,今年度の成果を踏まえて,他の動的で複雑な経済・社会データについてもデータ駆動型統計学による分析を試みる.
|
次年度使用額が生じた理由 |
ある企業から業務データを提供していただき,その解析を行う予定であったが,急遽,社内で個人情報保護の観点を見直すことになり,提供していただくことができなくなってしまったため.
|
次年度使用額の使用計画 |
想定していたデータの代わりに,経済・社会現象に関連した他のデータを用いた解析を行う.
|