2019 Fiscal Year Annual Research Report
ビッグデータ駆動型科学のための仮説生成・検証法開発と材料,生物,医療分野での実証
Project/Area Number |
17H00758
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
竹内 一郎 名古屋工業大学, 工学(系)研究科(研究院), 教授 (40335146)
|
Co-Investigator(Kenkyū-buntansha) |
二宮 嘉行 統計数理研究所, 数理・推論研究系, 教授 (50343330)
豊浦 和明 京都大学, 工学研究科, 准教授 (60590172)
安河内 彦輝 三重大学, 地域イノベーション推進機構, 助教 (60624525)
井上 圭一 東京大学, 物性研究所, 准教授 (90467001)
|
Project Period (FY) |
2017-04-01 – 2021-03-31
|
Keywords | 機械学習 / Post-Selection Inference / 材料科学 / 生物科学 / 医療科学 |
Outline of Annual Research Achievements |
本研究ではビッグデータに基づいて科学的発見を行うための計算機科学・統計科学技術の研究・開発とその実証である.前者においては,特に,複数の要因が複雑に関連する形式の仮説(以後,複合要因仮説と呼ぶ)の生成と検証を行うための方法を研究・開発することを目的としている.近年の機械学習技術の発展により,複数の要因を複雑に組み合わせた仮説を生成できる基盤が整っている.しかし,ビッグデータから選択された仮説は選択バイアスを持つため,その検証においては適切に選択バイアスを取り除くしくみが不可欠である.本研究では,この目的のため,近年統計科学分野で注目を集めている新たな枠組であるSelective Inferenceの考え方を導入するものである.Selective Inferenceにより,仮説が特定の機械学習によって選択されたことを条件付けたときの統計的推論が可能になると考えられる.後者においては,特に,生物科学,医療科学,材料科学分野で開発した方法の有効性を検証を行うものである.生物科学分野では共同研究者の協力のもと,光吸収型タンパク質のロドプシンの吸光波長の予測因子を発見する課題にとりくみ,また,医療科学分野では共同研究者の協力のもと,疾患感受性要因となる一塩基多型の組み合わせを同定する課題にとりくみ,材料科学分野では共同研究者の協力のもと,イオン伝導性物質の伝導度を効率的に推定する課題にとりくむものである.2019年度は特にグラフや系列などの構造を持つデータからの仮説生成と仮説検証を行った。グラフデータに関しては化合物の機能に関する、系列データに関してはは移動系列に関する仮説の生成と検証を行った。
|
Research Progress Status |
令和元年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和元年度が最終年度であるため、記入しない。
|
Research Products
(5 results)