• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

探索的分析によるデータ駆動型仮説の信頼性評価法の確立と生命科学分野における実証

Research Project

Project/Area Number 20H00601
Research InstitutionNagoya Institute of Technology

Principal Investigator

竹内 一郎  名古屋工業大学, 工学(系)研究科(研究院), 教授 (40335146)

Co-Investigator(Kenkyū-buntansha) 花田 博幸  国立研究開発法人理化学研究所, 革新知能統合研究センター, 特別研究員 (00793035)
寺田 吉壱  大阪大学, 基礎工学研究科, 講師 (10738793)
稲津 佑  名古屋工業大学, 工学(系)研究科(研究院), 助教 (20869896)
本谷 秀堅  名古屋工業大学, 工学(系)研究科(研究院), 教授 (60282688)
津田 宏治  東京大学, 大学院新領域創成科学研究科, 教授 (90357517)
Project Period (FY) 2020-04-01 – 2025-03-31
Keywords機械学習 / 統計科学 / 人工知能 / 選択的推論 / 生命科学
Outline of Annual Research Achievements

機械学習などのデータ分析技術を利用する科学研究のアプローチはデータ駆動型科学と呼ばれさまざまな分野で有望視されている.データ駆動型科学では研究対象に関するデータを分析することによって科学的仮説を生成するため,従来のアプローチでは思いつかないような仮説を生み出せる可能性がある. 一方,複雑なデータを複雑なアルゴリズムで分析して得られた仮説の信頼性を評価するのは難しい.特に,教師なし学習と呼ばれる探索的なデータ分析によって仮説が生成される場合,信頼性を保証する方法は確立されていない.特に,生命医療分野など,誤った判断のもたらすリスクが大きい状況ではデータ駆動型仮説の信頼性を確保することが不可欠である.本研究では,探索的データ分析によって得られたデータ駆動型仮説の信頼性を定量化する数理・情報基盤を構築し,その有用性を生命医療分野において実証する.教師なし学習アルゴリズムが強力であればあるほど(データへの適合力が大きければ大きいほど),有望な仮説が生成できる可能性が高まる一方,仮説選択バイアスも大きくなってしまう.データ駆動型仮説の信頼性保証は,仮説選択バイアスを正しく定量化し,その補正を行うことによって実現できる.本研究では仮説選択バイアスを適切に補正し,アルゴリズムが仮説を生成したという条件のもとで統計的推論(仮説検定の枠組による偽陽性率(p値)や信頼区間の計算)を行う方法を確立する.2020年度は,仮説選択後の統計的推論の検出力を向上するための方法開発を行った.特に,パラメトリック計画法とよばれる最適化手法を利用することで,従来よりも検出力の高い方法へ発展させることができた.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

2020年度は,方法面では仮説選択後の統計的推論の検出力を向上させるための研究を行った.従来の仮説選択後の統計的推論は,計算の都合状,過剰な条件付けが必要であったため,検出力が低いことが問題であったが,本研究では,パラメトリック計画法と呼ばれる最適化手法を活用することでこの問題を解決した.スパース推定に基づく特徴選択法であるLassoで選択された仮説(特徴)の統計的推論にこの方法を適用したところ,実用的な計算コストの範囲内で,大幅に検出力を向上させることができた.また,実用面では,変化点検知後の統計的推論の方法を構築した.様々な生命科学分野の課題で,系列データの分析が必要になるが,系列データの変化点を知ることで重要な科学的発見につながるかことが多い.本研究では,動的計画法と呼ばれる変化点検知アルゴリズムで得られた仮説の統計的推論法を構築し,従来は信頼性の定量化が難しかった問題を克服することができた.これらの成果は機械学習や関連分野の最難関国際会議であるNeurIPSやCVPRなどに採択され,国内外から注目を集めている.

Strategy for Future Research Activity

2021年度以降も方法面の発展と適用先の開拓を並列して実施する予定である.方法面の発展としては,Lassoのように凸最適化問題として定式化できないような問題に対してもパラメトリック計画法と同様の考え方を利用して検出力を向上させるアプローチを検討する.適用際の開拓としては,異常値判定や欠損値補完などの前処理アルゴリズムによる仮説選択バイアスを補正する枠組みにとりくんでいく.

  • Research Products

    (13 results)

All 2021 2020

All Journal Article (9 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 9 results,  Open Access: 5 results) Presentation (4 results) (of which Int'l Joint Research: 3 results,  Invited: 1 results)

  • [Journal Article] Exploration of natural red-shifted rhodopsins using a machine learning-based Bayesian experimental design.2021

    • Author(s)
      Keiichi Inoue, Masayuki Karasuyama, Ryoko Nakamura, Masae Konno, Daichi Yamada, Kentaro Mannen, Takashi Nagata, Yu Inatsu, Hiromu Yawo, Kei Yura, Oded Beja, Hideki Kandori, Ichiro Takeuchi.
    • Journal Title

      Communications Biology

      Volume: 4 Pages: NA

    • DOI

      10.1038/s42003-021-01878-9

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] Selective inference for high-order interaction features selected in a stepwise manner2021

    • Author(s)
      Shinya Suzumura, Kazuya Nakagawa, Yuta Umezu, Koji Tsuda, Ichiro Takeuchi
    • Journal Title

      IPSJ Transactions on Bioinformatics

      Volume: 14 Pages: 1~11

    • DOI

      10.2197/ipsjtbio.14.1

    • Peer Reviewed
  • [Journal Article] Bayesian Experimental Design for Finding Reliable Level Set under Input Uncertainty2020

    • Author(s)
      Shogo Iwazaki, Yu Inatsu, Ichiro Takeuchi.
    • Journal Title

      IEEE Access

      Volume: 8 Pages: 203982~203993

    • DOI

      10.1109/ACCESS.2020.3036863

    • Peer Reviewed / Open Access
  • [Journal Article] Computing Valid p-value for Optimal Changepoint by Selective Inference using Dynamic Programming.2020

    • Author(s)
      Vo Nguyen Le Duy, Hiroki Toda, Ryota Sugiyama, Ichiro Takeuchi
    • Journal Title

      Proceedings of 34th Conference on Neural Information Processing Systems (NeurIPS2020)

      Volume: NA Pages: NA

    • Peer Reviewed / Open Access
  • [Journal Article] Active learning for level set estimation under input uncertainty and its extensions2020

    • Author(s)
      Yu Inatsu, Masayuki Karasuyama, Keiichi Inoue, Ichiro Takeuchi
    • Journal Title

      Neural Computation

      Volume: 32 Pages: 2486~2531

    • DOI

      10.1162/neco_a_01332

    • Peer Reviewed
  • [Journal Article] Active Learning of Bayesian Linear Models with High Dimensional Binary Features by Parameter Confidence-Region Estimation.2020

    • Author(s)
      Yu Inatsu, Masayuki Karasuyama, Keiichi Inoue, Hideki Kandori, Ichiro Takeuchi
    • Journal Title

      Neural Computation

      Volume: 32 Pages: 1998~2031

    • DOI

      10.1162/neco_a_01310

    • Peer Reviewed
  • [Journal Article] Active Learning for Enumerating Local Minima Based on Gaussian Process Derivatives.2020

    • Author(s)
      Yu Inatsu, Daisuke Sugita, Kazuaki Toyoura, Ichiro Takeuchi
    • Journal Title

      Neural Computation

      Volume: 32 Pages: 2032~2068

    • DOI

      10.1162/neco_a_01307

    • Peer Reviewed
  • [Journal Article] Computing Valid P-values for Image Segmentation by Selective Inference.2020

    • Author(s)
      Kousuke Tanizaki, Noriaki Hashimoto, Yu Inatsu, Hidekata Hontani, Ichiro Takeuchi
    • Journal Title

      Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)

      Volume: NA Pages: NA

    • DOI

      10.1109/CVPR42600.2020.00957

    • Peer Reviewed / Open Access
  • [Journal Article] Multi-scale Domain-adversarial Multiple-instance CNN for Cancer Subtype Classification with Non-annotated Histopathological Images.2020

    • Author(s)
      Noriaki Hashimoto, Daisuke Fukushima, Ryoichi Koga, Yusuke Takagi, Kaho Ko, Kei Kohno, Masato Nakaguro, Shigeo Nakamura, Hidekata Hontani, Ichiro Takeuchi
    • Journal Title

      Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)

      Volume: NA Pages: NA

    • DOI

      10.1109/CVPR42600.2020.00391

    • Peer Reviewed / Open Access
  • [Presentation] パラメトリック計画法による選択的推論とその応用2020

    • Author(s)
      竹内一郎
    • Organizer
      電子情報通信学会IBISML研究会
    • Invited
  • [Presentation] Computing Valid p-value for Optimal Changepoint by Selective Inference using Dynamic Programming.2020

    • Author(s)
      Vo Nguyen Le Duy, Hiroki Toda, Ryota Sugiyama, Ichiro Takeuchi
    • Organizer
      34th Conference on Neural Information Processing Systems (NeurIPS2020)
    • Int'l Joint Research
  • [Presentation] Computing Valid P-values for Image Segmentation by Selective Inference.2020

    • Author(s)
      Kosuke Tanizaki, Noriaki Hashimoto, Yu Inatsu, Hidekata Hontani, Ichiro Takeuchi
    • Organizer
      IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
    • Int'l Joint Research
  • [Presentation] Multi-scale Domain-adversarial Multiple-instance CNN for Cancer Subtype Classification with Non-annotated Histopathological Images2020

    • Author(s)
      Noriaki Hashimoto, Daisuke Fukushima, Ryoichi Koga, Yusuke Takagi, Kaho Ko, Kei Kohno, Masato Nakaguro, Shigeo Nakamura, Hidekata Hontani, Ichiro Takeuchi
    • Organizer
      IEEE/CVF Conference on Computer Vision and Pattern Recognition 2020 (CVPR2020)
    • Int'l Joint Research

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi