研究開始時の研究の概要 |
本研究課題では, データのもつ形に注目した統計解析の方法の構築とその実際のデータを用いた応用を目的とする。ここで扱う幾何的な構造をもった空間とは, 円周や球, トーラスやシリンダーといった幾何多様体を指す。このような幾何多様体上のデータ解析において中心的な役割を果たすのは角度変数であり, 角度のもつ周期性を取り入れた確率モデルや統計解析の手法が必要となる。そのような幾何多様体上の統計解析の手法を機械学習やデータサイエンスに応用することが本研究課題の目的である。
|
研究実績の概要 |
1)円周分布, シリンダー分布, トーラス分布の歪対称化法を用いた確率分布族を提案し, その提案分布の性質を調べた. 特に, いくつかの歪み関数に対して, 条件付き分布や周辺分布, また三角モーメントや乱数生成について提案分布の性質を調べた. また, トーラス上の確率モデルについては最尤推定量の一致性及び識別可能性について明らかにした. 2)多尺度地理的荷重回帰モデルを用いて東京都公示地価の推定を行った. 地理的荷重回帰モデルを用いることで公示地価の説明変数が地価に与える影響を局所空間的に評価することができる. 分析により, 都心へのアクセス指数や, 最寄り駅距離が地価に与える影響が年々強くなっていること, これにより, 東京都東西において地価格差が拡大する傾向にあることを明らかにした. 3)統計モデルの識別可能性は, 最尤推定量の一致性を証明するために必要な条件である. 円周上の歪対称分布族の識別可能性について調べた. また, いくつかのシリンダー分布に対する識別可能性も合わせて示した. 4)コンテンツベースフィルタリングとLDAを基にしたハイブリッド推薦システムを提案した. 提案モデルは, 商品集合やユーザー集合を潜在変数であるトピックを用いて特徴付けを可能にする. 提案モデルは, いくつかのベースラインモデルと同等の予測精度をもち, 推薦アイテムやレーティングの予測値をユーザと商品をトピック分布を介して解釈可能にする利点をもつ. 5)マーシーのレーティング手法は, ネットワーク分析におるKatzの中心性指標と関連することが知られている. 本研究では, マーシーのレーティングの標本分布を評価し, 2チームのレーティングが等しいという帰無仮説に対する仮説検定を調べた. 仮説検定の名目有意水準と検出力をシミュレーションによって評価した.
|