研究概要 |
今年度は分散・統合データ解析の基本要素となる問題設定と理論の二つの側面からの定式化に基づいた発展的研究を行った.まず問題設定については,従来研究されてきた転移学習の枠組みを発展させ,分散・統合データ解析のための基本的な数理モデルを「飼い慣らし学習」と名付け,インターネットで収集したデータに対してアルゴリズムを適用し,神嶌と赤穂がいくつかの研究会において発表し,人工知能学会優秀賞を受賞した.これは今後,協調フィルタリングなどの推薦システムを大規模化,高精度化する上で重要な基盤となると考えられる. 次に,理論面では,混合分布モデルのモデルパラメータを情報幾何学的アプローチを用いて圧縮する手法について,線形計画問題によるネットワーク最適化と組み合わせて準最適化するアルゴリズムを考案し,国際会議で発表を行った.これは,顧客分析を行う際に,各サイトごとの情報を混合分布としてクラスタリングし,プライバシーを保ちつつセンターに送って処理できる手法への発展が考えられる. また,指数分布族のベイズ的な取り扱いについて昨年から引き続いて東京大学のグループと共同で研究を進め,文字認識など実際のベンチマークデータに対して有効性を確認し,国際会議で発表した.ベイズ推定は特にサンプル数がパラメータ数に比べて少ないときに有効であり,飼い慣らし学習や混合分布モデルといったテーマについても拡張することが重要であると考えられる.
|