2021 Fiscal Year Annual Research Report
探索的分析によるデータ駆動型仮説の信頼性評価法の確立と生命科学分野における実証
Project/Area Number |
20H00601
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
竹内 一郎 名古屋工業大学, 工学(系)研究科(研究院), 教授 (40335146)
|
Co-Investigator(Kenkyū-buntansha) |
花田 博幸 国立研究開発法人理化学研究所, 革新知能統合研究センター, 特別研究員 (00793035)
寺田 吉壱 大阪大学, 基礎工学研究科, 講師 (10738793)
稲津 佑 名古屋工業大学, 工学(系)研究科(研究院), 助教 (20869896)
本谷 秀堅 名古屋工業大学, 工学(系)研究科(研究院), 教授 (60282688)
津田 宏治 東京大学, 大学院新領域創成科学研究科, 教授 (90357517)
|
Project Period (FY) |
2020-04-01 – 2025-03-31
|
Keywords | 機械学習 / 統計科学 / 人工知能 / 選択的推論 / 生命科学 |
Outline of Annual Research Achievements |
機械学習などのデータ分析技術を利用する科学研究のアプローチはデータ駆動型科学と呼ばれさまざまな分野で有望視されている.データ駆動型科学では研究対象に関するデータを分析することによって科学的仮説を生成するため,従来のアプローチでは思いつかないような仮説を生み出せる可能性がある. 一方,複雑なデータを複雑なアルゴリズムで分析して得られた仮説の信頼性を評価するのは難しい.特に,教師なし学習と呼ばれる探索的なデータ分析によって仮説が生成される場合,信頼性を保証する方法は確立されていない.特に,生命医療分野など,誤った判断のもたらすリスクが大きい状況ではデータ駆動型仮説の信頼性を確保することが不可欠である.本研究では,探索的データ分析によって得られたデータ駆動型仮説の信頼性を定量化する数理・情報基盤を構築し,その有用性を生命医療分野において実証する.教師なし学習アルゴリズムが強力であればあるほど(データへの適合力が大きければ大きいほど),有望な仮説が生成できる可能性が高まる一方,仮説選択バイアスも大きくなってしまう.データ駆動型仮説の信頼性保証は,仮説選択バイアスを正しく定量化し,その補正を行うことによって実現できる.本研究では仮説選択バイアスを適切に補正し,アルゴリズムが仮説を生成したという条件のもとで統計的推論(仮説検定の枠組による偽陽性率(p値)や信頼区間の計算)を行う方法を確立する.2021年度は,特定の深層学習の選択的推論法を確立した。特に、深層学習の構造を変えるたびに選択イベントの同定が必要とならないようなメタアルゴリズムの構築することができた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2021年度は,方法面では深層学習の選択的推論に重点的に取り組んだ。深層学習モデルは複雑なため、その選択イベントを導出することは困難であるように思えるが、多くの有用な深層学習モデルが区分線形関数として記述できることに着目することで問題を解決した。具体的には、深層学習の畳み込み, プーリング, LeLU伝達関数などの各要素に関して過剰に条件付けを行うと、選択イベントを線形不等式で記述することができ、過剰な条件付けのもとで、選択イベントを凸多面体として表すことができる。続いて、過剰な条件付けを取り除くため、凸多面体として表されるイベントをパラメトリック計画法により列挙するアプローチを考察した。このアプローチにより幅広いクラスの深層学習モデルの仮説選択イベントを特徴づけることができ、これらの深層学習モデルに対する選択的推論が可能となった。また,実用面では,変化点検知後の統計的推論の方法を多次元系列を扱えるように発展させた.様々な生命科学分野の課題で,多次元系列データの分析においては変化点の検出と変化のある系列の両者を選択する必要があり、この発展により方法論の適用範囲が各段に大きくなった.本研究の成果は機械学習や関連分野の最難関国際会議であるICMLやAAAIなどに採択され,国内外から注目を集めている.
|
Strategy for Future Research Activity |
2022年度以降も方法面の発展と適用先の開拓を並列して実施する予定である.特に、深層学習の選択的推論の適用範囲を拡げること、計算時間を削減することに取り組む。また、新たな問題設定として、逐次意思決定プロセスにおける信頼性保障のために選択的推論を活用する方策を検討する。
|