提案した情報量の推定法は,データ間の距離のみを用いるため比較的広いクラスのデータに適用可能である.一方その精度は採用する距離に強く依存するため,解析に適切な距離を何らかの基準のもとで選択する必要がある.平成24年度は,データ空間の距離構造を,データ解析者の主観ではなく,データから学習する問題に注力した.前年度に行なった sliced inverse regression の枠組による多重カーネル学習問題での定式化に加え,JIT(just in time)モデリングの枠組においても定式化を行なった.JITモデリングにおいては予測対象の近傍データを説明変数間の距離を用いて抽出し,近傍データの目的変数の平均や中央値といった統計量を用いて予測を行う.目的変数間に適切な距離が定義されていれば,説明変数での近傍と目的変数での近傍が合致するように説明変数間の距離を学習する問題として定式化できる.距離の値そのものではなく,近傍関係を評価しているため,より柔軟な距離のクラスを考えてモデリングを行うことができる.具体的にはマハラノビス距離や距離関数の凸結合を利用したパラメトリックなモデルを用いて最適化する方法を提案している. 理論的な考察と平行して,実データ解析への応用展開についてもいくつか試みた.一つは重み付きデータを対象とした情報量の推定法の応用として,複数の回帰関数を用いた条件付分布の粒子近似法を提案した.実際の市況データの予測問題に適用した結果,この分野で標準的に用いられている進化的プログラミングの手法と比較しても遜色なく,いくつかのデータにおいてはより良い結果を得ることができた.もう一つは提案する距離学習の枠組をエネルギー消費の分析に適用したものである.家庭の電力需要データのクラスタリングや短期予測,コジェネレーションシステムの最適運用問題に対して一定の成果を挙げることができた.
|