研究課題/領域番号 |
15H02705
|
研究機関 | 熊本大学 |
研究代表者 |
櫻井 保志 熊本大学, 自然科学研究科, 教授 (30466411)
|
研究分担者 |
有次 正義 熊本大学, 自然科学研究科, 教授 (40282412)
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
今中 雄一 京都大学, 医学(系)研究科(研究院), 教授 (10256919)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 医療情報解析 / 時系列データマイニング / ビッグデータ |
研究実績の概要 |
医療機関では様々な医療データが大量に蓄積されている.本研究では,大規模医療データを統合的に解析するための高度なデータマイニング技術を確立することを目的とする.平成27年度は,データとして比較的扱いやすいセンサデータやWeb情報を用い,時系列データ解析の理論研究やアルゴリズムの研究に注力して取り組んだ.具体的なテーマおよび研究成果は以下の通りである. (1) 多次元時系列データ解析:医療機関における生体情報は多次元時系列データとして表現される.本研究では,大規模な多次元時系列データを高速に解析するための研究に取り組んだ.特に,非線形方程式に基づく時系列ビッグデータ解析技術を開発した.最初のステップとして,本技術をWeb情報に適用し,その有効性を確認した.技術の新規性および有効性が評価され,Webの分野においてトップ国際会議であるWWW2016に論文が採録されることとなった.さらにデータベース分野のトップ国際会議であるACM SIGMOD2015においてチュートリアル講演に採択され,発表を行った.またWWW2016のチュートリアル講演にも採択されており,国際的に極めてインパクトの高い研究成果となった. (2) 非線形テンソル解析:医療データは,電子カルテのような多項目データも含む複雑なデータである.そのようなデータから潜在的な特徴をとらえるため,非線形テンソル解析技術を開発した.本研究において開発した非線形テンソル解析技術は,世界でも類を見ない,初めての取り組みである.この技術も同様にWeb情報に適用し,データ項目間の相互作用,ユーザのローカルパターン,季節性など,多角的な観点から情報抽出が可能であることを確認した.技術の新規性および有効性が評価され,WWW2016に論文が採録されることとなった.医療データに対しても非線形テンソル解析は有効であると考えられ,現在検証を行っている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
大規模時系列データマイニングのための理論やアルゴリズムの研究に注力して取り組んだ.本研究の時系列データ解析については,静的なデータ解析だけでなく,刻々と生成され続けるデータを解析するため,モデルの更新を動的かつ完全自動で行うためのデータストリーム処理技術も開発し,実用を意識した取り組みを行った. また国内外において研究発表を活発に行った.Webの分野において最難関国際会議であるWWW2015において研究発表を行うとともに,WWW2016にも論文が採録されることとなった.さらにデータベース分野の最難関国際会議であるACM SIGMOD2015において3時間のチュートリアル講演に採択され,発表を行った.またWebの分野においても,WWW2016のチュートリアル講演に採択されており,国際的に極めてインパクトの高い研究成果となった.
|
今後の研究の推進方策 |
平成27年度に開発した非線形テンソル解析技術の有効性を医療データを用いて検証する.モデル推定を行うだけでなく,モデルとその学習アルゴリズムを発展させ,大規模テンソル構造からの大局的もしくは局所的なパターン発見,異常検出,様々なコストや基準値の最適化,そして与えられた条件下での将来予測など,様々な課題に取り組む. また,医療データのレコード数および項目数は非常に多く,そして大規模となる.このような大規模なデータをリアルタイムかつ継続的に処理し,情報提供を行なうために,モデルパラメータの高速推定手法について検討する. さらに,複合医療データの効率的な格納方法,アクセス方法についても検討する.統合的な情報解析を行なうには,データベースにおいては広範囲の部分を検索,参照することになる.そこで新たなデータの格納手法,高速アクセス手法を開発する. 本研究の成果は非常に有用であり,技術の実用性が認められて複数の企業との共同研究を継続して実施しており,産業面での成果につなげていく予定である.
|