• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

超高次元データに対する非線形解析手法の研究開発

研究課題

研究課題/領域番号 16K16114
研究機関京都大学

研究代表者

山田 誠  京都大学, 化学研究所, 助教 (00581323)

研究期間 (年度) 2016-04-01 – 2018-03-31
キーワード特徴選択 / 非線形
研究実績の概要

本期の研究項目である非線形特徴選択アルゴリズムの大規模データへの対応に関しては, HSIC LassoにNystrom近似を用いることで, アルゴリズムに必要なメモリ量を1000分の1程度に圧縮することに成功した. さらに, 超高次元データへの対応に関してはForward Selectionと大規模分散処理フレームワーク (Apache Spark)を利用することで, 100万次元×1万標本のデータでも効率よく処理できるフレームワークを確立した (A2). 具体的には, 100万次元×1万標本のデータから, 数時間で入力と出力間に非線形性のあるような特徴を選択できることが可能となった. このように, 100万次元を超える超高次元特徴から数時間で非線形性の特徴を選択できるアルゴリズムは世界初である.
また, 提案した超大規模特徴選択アルゴリズムを前立腺癌の予測タスク (27万次元400サンプル)および酵素の識別タスク(106万次元1万5千サンプル)に適用した. その結果, 従来法では高い予測精度を得るために数千特徴が必要であったが, 提案法では数十特徴のみで従来法と同等以上の精度が得られることを確認した. 従来は高い性能を得るために多くの特徴が必要であり, モデルの解釈が難しかったが, 提案手法は数十特徴のみで高い性能が得られるため, モデルの解釈がしやすく大変有用であることがわかった.
本研究成果はすでにIEEE Transactions on Knowledge and Data Engineering (TKDE)に投稿中である. また, 大規模非線形特徴選択アルゴリズム開発で重要な技術であるスパースモデリングを利用して, 共著者らと共にACL, IJCAI, NIPS等の難関会議に推薦技術, クラスタリングの研究成果を報告した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

28年度に予定していた超大規模非線形特徴選択アルゴリズムの開発を完了し, さらにそのアルゴリズムをいくつかの実データ(前立腺癌の判定タスク, 酵素分類タスク)に応用し, 従来法(Lasso)よりもはるかに少ない特徴量で高い予測精度を達成できることを確認した.
本研究成果はすでにIEEE Transactions on Knowledge and Data Engineering (TKDE)に投稿中である.

今後の研究の推進方策

29年度は以下の2点を重点的に実施する.
(1) 提案手法の実応用.
(2) ソフトウェア開発および配布.

今後は28年度に作成したソフトウェアを整備し, Github等で配布できるように準備する. さらに開発したソフトウェアを, バイオインフォマティクスやマテリアルズインフォマティクスの問題に適用し複数のタスクにおいて提案手法の性能を検証していく予定である.

次年度使用額が生じた理由

本務先が2017年3月1日より変更となったことに伴い, 当初予定していた国内学会の参加および出張を取りやめたため.

次年度使用額の使用計画

国内学会(IBIS, 人工知能学会)への参加, ソフトウェア開発環境(Matlab)の購入, および
投稿中のジャーナルが採録された場合のオープンジャーナル化に研究費を利用しようと考えている.

  • 研究成果

    (5件)

すべて 2016

すべて 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 謝辞記載あり 1件) 学会発表 (4件) (うち国際学会 4件)

  • [雑誌論文] Lifecycle Modeling for Buzz Temporal Pattern Discovery2016

    • 著者名/発表者名
      Yi Chang, Makoto Yamada, Antonio Ortega
    • 雑誌名

      ACM Transactions on Knowledge Discovery from Data (TKDD)

      巻: 11 ページ: 20:1-20:24

    • DOI

      10.1145/2994605

    • 査読あり / 国際共著 / 謝辞記載あり
  • [学会発表] Multi-view Anomaly Detection via Robust Probabilistic Latent Variable Models2016

    • 著者名/発表者名
      Tomoharu Iwata, Makoto Yamada
    • 学会等名
      Neural Information Processing Systems (NIPS 2016)
    • 発表場所
      Barcelona Spain
    • 年月日
      2016-12-05 – 2016-12-10
    • 国際学会
  • [学会発表] Which Tumblr Post Should I read Next?2016

    • 著者名/発表者名
      Zornitsa Kozareva, Makoto Yamada
    • 学会等名
      the annual meeting of the Association for Computational Linguistics (ACL)
    • 発表場所
      Berlin Germany
    • 年月日
      2016-08-07 – 2016-08-12
    • 国際学会
  • [学会発表] A Robust Convex Formulation for Ensemble Clustering2016

    • 著者名/発表者名
      Junning Gao, Makoto Yamada, Samuel Kaski, Hiroshi Mamitsuka, Shanfeng Zhu
    • 学会等名
      The Twenty-Fifth International Joint Conference on Artificial Intelligence (IJCAI-16)
    • 発表場所
      New York USA
    • 年月日
      2016-07-09 – 2016-07-15
    • 国際学会
  • [学会発表] Timeline Summarization from Social Media with Life Cycle Models2016

    • 著者名/発表者名
      Yi Chang, Jiliang Tang, Dawei Yin, Makoto Yamada, Yan Liu
    • 学会等名
      The Twenty-Fifth International Joint Conference on Artificial Intelligence (IJCAI-16)
    • 発表場所
      New York USA
    • 年月日
      2016-07-09 – 2016-07-15
    • 国際学会

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi