研究課題/領域番号 |
19J20660
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京医科大学 (2021) 慶應義塾大学 (2019-2020) |
研究代表者 |
引地 志織 東京医科大学, 医学部, 特別研究員(PD)
|
研究期間 (年度) |
2019-04-25 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
3,100千円 (直接経費: 3,100千円)
2021年度: 1,000千円 (直接経費: 1,000千円)
2020年度: 1,000千円 (直接経費: 1,000千円)
2019年度: 1,100千円 (直接経費: 1,100千円)
|
キーワード | セマンティック・コンピューティング / 逆問題 / 複雑性 / データマイニング / データベース / 機械学習 / 乳がん / 腸内細菌 / Semantic Computing / Data Mining / Inverse Analysis / Complexity / Personalized Medicine / Bioinformatics / Breast Cancer / Metastasis |
研究開始時の研究の概要 |
近年、生体物質から数値的情報を抽出できる機器の発達により、公開済み測定データが増え、ビックデータを対象とした網羅的な解析技術が求められている。特に、個人化医療の実現には、1)医療データのデータベースの構築、2)被験者など調査対象の個体差を踏まえた分析手法の確立が必要である。 本研究は、解釈に専門的な知識が必要なデータベースと分析手法を構築し、属性分類の特徴量を発見するアルゴリズム研究を行い、対象データの意味抽出(属性分類に有意な部分空間抽出)を可能とするシステムを実現する。分析対象への専門知識が不十分でもシステムを活用して医療データの包括的な理解・利用ができるシステムと方法論の開発を行う。
|
研究実績の概要 |
2021年度の「逆問題解決型特異的因子・属性分類特徴量計量システム」に関する研究課題について,以下の3点を中心に,生命科学分野の多次元パラメータを持つ実データを対象とした研究・開発・評価を行い,事象発生原因となる特徴量を発見・認知するデータ解析システムを構築した. 情報工学分野からの生命科学データベース構築,知識発見方式の定式化という研究切り口だけではなく,乳がんの5年転移や遺伝子オントロジーという生命科学的・医学的に重要となる指標を対象とした変数選択,数理モデル構築に関する研究も行い,日本癌学会や国際メタボローム学会にて発表を行った. 1)セマンティック・コンピューティングに向けた事象原因探究手法の開発:腸内細菌の保有率を示す次世代シーケンサーデータを対象に,複数の属性の連続性と分布から,属性分類可能な部分空間を生成・記憶する新たなデータマイニング方式に必要な演算セットを定義し,代数系を構築した. 2)機械学習に向けた事象原因探究手法の開発:乳がんの遺伝子発現量を示すマイクロアレイデータを対象に,変数セット(数,種類,多重共線性)と実験手法(学習・検証データ分割と数理モデル構築)を考慮することで,変数間の相関量を測る分散拡大係数と,少ない観測情報で予測する多重ロジスティック回帰モデルを用いて,最小限の遺伝子セットを選択することが可能となった. 3)生命科学分野における事象原因探究の意義の評価:本研究により定式化された特異的因子計量方式(Purity Computing)により,任意のヒト属性に対する複数の集合から1つの集合を識別・分類する部分空間(細菌種)の特徴量計量が可能となった.新たな変数選択手法(Correlation-centered Variable Selection)により,5年転移を既存の類似手法よりも少数かつ高い精度で予測できる遺伝子セットの選択が可能となった.
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|