• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

不均質なグラフ集合に対する教師付き学習系の設計

研究課題

研究課題/領域番号 26330242
研究機関北海道大学

研究代表者

瀧川 一学  北海道大学, 情報科学研究科, 准教授 (10374597)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード機械学習 / グラフ / 潜在構造
研究実績の概要

本課題では化学構造式とそれが表現する化合物の生物活性など、多数の構造のデータに基づく統計的モデリングにおいて、対象構造が何らかのグラフ表現で抽象化できる場合の教師付き学習の手法構築と実データの特徴空間の性質の理解を目指している。PubChemやChEBIなど各種アッセイとその化学構造の公的リポジトリなど実際の大規模な構造データにおいては、データの出自や計測環境の異なるデータが混合された多混合母集団となってしまう。こうした構造的「不均質さ」を伴うデータを手法側で取り扱うための手法確立への技術的貢献を目標とする。

本年度は調査および技術課題として次の3点に取り組んだ。(1) 各サンプルがグラフ表現で与えられる場合、可能な部分グラフ特徴の有無やカウントの特徴は現在の様々な手法の基盤となっている。 この部分グラフ指示子を特徴量とする特徴空間は、0/1と離散的である点、次元が非常に高いが疎性も非常に高い点、特徴同士に高い相関がある点など、自然言語処理で扱うBag of Wordsの特徴空間と類似する点を多く持つ。そこで潜在構造を利用する機械学習手法の技術的詳細の検討、及び、標準的なトピックモデル等の実装や効率の詳細についてサーベイとグラフ拡張の実装について技術的検討を行った。(2) 代表者が構築してきた一般のロス関数に対しすべての可能な部分グラフ指示子の中から特徴選択と学習パラメタの推定を同時に行う手法の改良を行った。特に、最適化の各反復での列挙木構築反復のキャッシング、実際のデータに対するパラメタ依存性の解析、ヒューリスティクスの導入による実精度を保持した近似アルゴリズムの開発および数値実験を行い、論文投稿を行った。(3) ベンチマークで用いられてきたいくつかの標準的な実データ(化学構造とその活性値のデータ)について、部分グラフ特徴の共起を調べるアルゴリズム開発を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

当初計画では初年度中にグラフ指示子空間上での潜在構造学習のアルゴリズム構築まで完了している予定であったが、基本探索アルゴリズムの改良に予想以上に手間と時間を要したこと、潜在構造学習分野の進展が早く綿密なサーベイに時間を要したことにより、現時点でアルゴリズム構築中である。また、本年度途中での所属・職務変更のため当初計画の見込みに無かった準備が生じ、当初計画での想定より本課題に割ける時間が取れなかった。

今後の研究の推進方策

初年度開発したアルゴリズムと得られた技術課題について、更なる効率改善と検証を行う。この際、部分指示子の空間の特性を具体的に解析できる補助アルゴリズムの開発を引き続き行い、目標とする手法構築の効率や性能の解析に用いる。また予定していたSupervised Latent Dirichlet Allocation (SLDA) (Blei et al, NIPS2007)・Parametric Mixture Models (PMM) (Ueda & Saito, NIPS2003)の2つの学習系をグラフ集合に対する学習法構築を行い、実データの多母集団上での推論構築およびデータ分布の混合度の解析を行う。また、サンプリングベースの手法についても構築の可能性を検討する。

次年度使用額が生じた理由

購入予定の備品および書籍について発売日が次年度となったため。

次年度使用額の使用計画

発売日の後、当初購入予定の備品および書籍の購入に使用する予定である。

  • 研究成果

    (5件)

すべて 2014

すべて 学会発表 (5件) (うち招待講演 1件)

  • [学会発表] Theoretical Analyses on Ensemble and Multiple Kernel Regressor2014

    • 著者名/発表者名
      A Tanaka, I Takigawa, H Imai, M Kudo
    • 学会等名
      The 6th Asian Conference on Machine Learning (ACML2014)
    • 発表場所
      Nha Trang, Vietnam
    • 年月日
      2014-11-26 – 2014-11-28
  • [学会発表] 疎性モデリングに基づく部分グラフ特徴学習2014

    • 著者名/発表者名
      瀧川一学
    • 学会等名
      第17回情報論的学習理論ワークショップ(IBIS2014)
    • 発表場所
      名古屋大学・名古屋工業大学
    • 年月日
      2014-11-16 – 2014-11-19
  • [学会発表] 疎性モデリングに基づく部分グラフ特徴学習2014

    • 著者名/発表者名
      瀧川一学
    • 学会等名
      ERATO湊離散構造処理系プロジェクト 2014年度 秋のワークショップ
    • 発表場所
      北海道礼文島 ピスカ21
    • 年月日
      2014-09-07 – 2014-09-10
  • [学会発表] Analyses on Generalisation Error of Ensemble Kernel Regressors2014

    • 著者名/発表者名
      A Tanaka, I Takigawa, H Imai, M Kudo
    • 学会等名
      Joint International Workshop on Statistical, Structural, and Syntactic Pattern Recognition (S+SSPR 2014)
    • 発表場所
      Joensuu, Finland
    • 年月日
      2014-08-20 – 2014-08-22
  • [学会発表] 多数のグラフからの統計的機械学習2014

    • 著者名/発表者名
      瀧川一学
    • 学会等名
      人工知能学会 第94回人工知能基本問題研究会(SIG-FPAI)
    • 発表場所
      根室市総合文化会館
    • 年月日
      2014-07-24 – 2014-07-24
    • 招待講演

URL: 

公開日: 2016-05-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi