研究課題/領域番号 |
19H01806
|
研究機関 | 帝京大学 |
研究代表者 |
松浦 正明 帝京大学, 公私立大学の部局等, 教授 (40173794)
|
研究分担者 |
江口 真透 統計数理研究所, 数理・推論研究系, 教授 (10168776)
生亀 清貴 日本大学, 経済学部, 講師 (30711593)
安藤 宗司 東京理科大学, 工学部情報工学科, 助教 (40803226)
牛嶋 大 公益財団法人がん研究会, 有明病院 臨床研究・開発センター, 研究員 (60328565)
小森 理 成蹊大学, 理工学部, 准教授 (60586379)
松井 茂之 名古屋大学, 医学系研究科, 教授 (80305854)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 統計 / 人口知能 / 深層学習 / データ解析 / 個別化医療 |
研究実績の概要 |
初年度は、計画に沿って研究を進めた。初年度の計画の一つは、前回の基盤研究で特許出願した「不均一性抽出アルゴリズム」の高精度化と再評価を計画し、この研究を推進した。本アルゴリズムに対しては、既に日中米国に特許出願した内容を、2018年国際計量生物学会(バルセロナ)で発表し特許開示を行っている。アルゴリズムの概略は、まず信頼度の高い変数を抽出し、これらの信頼度の高い変数を基に信頼度の高いサンプル検体を取り出す。次に、取り出したサンプル検体に対して集団のサブクラスターを作成し、各サブクラスターを規定するバイオマーカーの抽出を行う。この際、抽出したバイオマーカーを用いて、各検体がどのサブクラスターに属するかの予測確率を計算する必要があるが、この部分の改良を行った。特に予測判定に関して、生存時間データへの応用を検討し、その内容を2020年7月中旬に開催予定の国際計量生物学会(韓国ソウルで開催)にて報告するため登録を行い、発表に関して了承を得る事ができていた。ただし、コロナウイルス問題により、学会は中止となったため、今後、他の学会にて報告予定である。 もう一つの研究課題として、深層学習の各層特徴抽出結果に対する各変数による統計学的性能評価法を検討については、深層学習アルゴリズムの検討と、ネットワークを特徴抽出器として使用することができるソフトウェアに対して調査を行った。この課題については、さらに継続の予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予測判定に関して、生存時間データへの応用を検討し、その内容を2020年度の国際計量生物学会(韓国ソウル)にて報告するため登録を行い、発表に関して了承を得る事ができた。 ただし、コロナにより、学会は中止となったため、他の学会にて報告予定である。
|
今後の研究の推進方策 |
今後は、深層学習の各層特徴抽出結果に対する各変数による統計学的性能評価法の検討を継続する。特に、深層学習アルゴリズムにおいて、ネットワークを特徴抽出器として使用できるソフトウェアなどを用いて、問題点の検討を継続する。実装したソフトウェアを用いた解析を行うための教師ありシミュレーションデータの準備が未完であるため、これに関して準備を進める。 本解析では画素データのみから構成されるデータは対象とせず、臨床情報や個別化医療の実現に向けて重要なマイクロアレイや質量分析データを模倣したデータを生成し、疾患サブタイプのシミュレーションデータを作成する予定である。上記で設定したデータを用い、実装した深層学習アルゴリズムを用いてサブタイプ判別学習を行ない、これを種々の困難度に設定したシミュレーションデータで実行し、深層学習アルゴリズムの解析可能性と性能を統計学的に評価・検討することを継続する。 さらに、教師ありデータに対する計算機集約的統計手法を用いたデータ活用法の開発も試みる。
|