2018 Fiscal Year Annual Research Report
Large-scale data analysis based on latent variable models and sequential estimation methods
Project/Area Number |
15H02703
|
Research Institution | Hiroshima University |
Principal Investigator |
江口 浩二 広島大学, 情報科学部, 教授 (50321576)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 潜在変数モデル / ノンパラメトリックベイズモデル / トピックモデル / 深層生成モデル / マルチモーダルデータ解析 / ネットワーク解析 / 時系列解析 |
Outline of Annual Research Achievements |
本課題では、実世界でしばしばみられる大規模で複雑なデータを想定し、その潜在構造を推定することによって高度な分析や予測を実現するとともに、そのための効率的かつ効果的な推定技術の確立を目指している。2018年度は主として下記の項目の研究成果を実現した。 1. 映像データにおける時系列性とマルチモーダル性に着目し、階層ディリクレ過程に基づくノンパラメトリックベイズモデルとその教師付きモデルを提案し、ラベル付き映像データにおける潜在的な時変構造を推定する新たな解析手段を実現した。前年度に引き続き、現実の映像データを用いたジャンル分類実験により、提案手法の有効性評価を行った。 2. 文書データに階層カテゴリ情報を自動的に付与するため、既知の不完全なカテゴリ階層に対応付けられた文書データ集合に対して、そのカテゴリ階層を拡張して潜在的階層を生成するような階層的トピックモデルを提案した。現実の生物医学文献データベースMEDLINEとウェブ百科事典Wikipediaのそれぞれから抽出したデータセットを用いた評価実験を行い、提案手法の有効性を示した。 3. 有向ネットワークで表現されたデータを対象とした、変分自己符号化器に基づく深層生成モデルを提案した。また、各辺に連続量の関係属性を仮定して辺の重みとするような重み付き有向ネットワークとして、現実の銀行間取引の金額や金利を重みとする金融ネットワークに着目し、未知の重みを予測する問題を仮定した評価分析を行った。 4. 多標本多変量の財務時系列データを想定し、時空間的注視機構を備えた長・短期記憶ネットワークに基づいて、外部時系列(例えばGDPや日経平均株価指数)からの影響と、グループ(例えば業種)内の依存性を反映したモデルを開発した。法人企業統計調査のデータを用いた実験で、提案法によって従来法に比して統計的に有意な改善が得られることを示した。
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
Research Products
(12 results)