(1)本研究の目標である,大規模複合データの包括的なモデリング・解析手法の開発を行った.複合する関係データを積多様体モデルのネットワークとしてモデリングする汎用的な手法を開発し,さらにデータの全体像を視覚的・対話的に解析する方法を実現した.これは関係データの汎用的ビジュアルアナリティクス法の開発として位置づけられる.また大規模データへのスケーラビリティーを実現するため,多様体モデリングにスパース近似を導入した.これにより,データサイズに対して線形な計算オーダーを実現できた.さらに複合するドメイン間の関係性を可視化するため,積多様体上でのトピック推定と可視化法を開発した. (2)上記手法を実データに応用し,有用性を検証した.第一の応用はバスケットボールのチーム編成支援のためのビジュアルアナリティクスツールであり,選手レベルとチームレベルの階層的なデータ構造をシームレスに扱うことができた.またこれは集合データに対する汎用的なビジュアルアナリティクスの手法としても位置づけられる.第二の応用は文書・単語の同時可視化である.従来法と異なり,文書と単語間の多対多の関係をモデル化するとともに,トピックを可視化することで両者の関係を可視化できることを示した.またこれはヘテロドメイン共起データの汎用的なモデリング・解析法にもなっている. (3)多様体モデリングとその階層的学習に関する原理究明を行った.その結果,多様体モデリングを適切に行うには単純な最尤推定ベースでは適切な学習がなされず,最適輸送距離を考慮する必要があることがわかった.また階層的多様体モデリングの学習原理を情報幾何学的に説明し,m混合およびe混合による情報転移が必要であることを示した.さらに積多様体モデリングの学習原理を相互情報量最大化の基準で理論的に説明することができた.
|