2015 Fiscal Year Annual Research Report
Project/Area Number |
15H02705
|
Research Institution | Kumamoto University |
Principal Investigator |
櫻井 保志 熊本大学, 自然科学研究科, 教授 (30466411)
|
Co-Investigator(Kenkyū-buntansha) |
有次 正義 熊本大学, 自然科学研究科, 教授 (40282412)
吉川 正俊 京都大学, 情報学研究科, 教授 (30182736)
今中 雄一 京都大学, 医学(系)研究科(研究院), 教授 (10256919)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 医療情報解析 / 時系列データマイニング / ビッグデータ |
Outline of Annual Research Achievements |
医療機関では様々な医療データが大量に蓄積されている.本研究では,大規模医療データを統合的に解析するための高度なデータマイニング技術を確立することを目的とする.平成27年度は,データとして比較的扱いやすいセンサデータやWeb情報を用い,時系列データ解析の理論研究やアルゴリズムの研究に注力して取り組んだ.具体的なテーマおよび研究成果は以下の通りである. (1) 多次元時系列データ解析:医療機関における生体情報は多次元時系列データとして表現される.本研究では,大規模な多次元時系列データを高速に解析するための研究に取り組んだ.特に,非線形方程式に基づく時系列ビッグデータ解析技術を開発した.最初のステップとして,本技術をWeb情報に適用し,その有効性を確認した.技術の新規性および有効性が評価され,Webの分野においてトップ国際会議であるWWW2016に論文が採録されることとなった.さらにデータベース分野のトップ国際会議であるACM SIGMOD2015においてチュートリアル講演に採択され,発表を行った.またWWW2016のチュートリアル講演にも採択されており,国際的に極めてインパクトの高い研究成果となった. (2) 非線形テンソル解析:医療データは,電子カルテのような多項目データも含む複雑なデータである.そのようなデータから潜在的な特徴をとらえるため,非線形テンソル解析技術を開発した.本研究において開発した非線形テンソル解析技術は,世界でも類を見ない,初めての取り組みである.この技術も同様にWeb情報に適用し,データ項目間の相互作用,ユーザのローカルパターン,季節性など,多角的な観点から情報抽出が可能であることを確認した.技術の新規性および有効性が評価され,WWW2016に論文が採録されることとなった.医療データに対しても非線形テンソル解析は有効であると考えられ,現在検証を行っている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
大規模時系列データマイニングのための理論やアルゴリズムの研究に注力して取り組んだ.本研究の時系列データ解析については,静的なデータ解析だけでなく,刻々と生成され続けるデータを解析するため,モデルの更新を動的かつ完全自動で行うためのデータストリーム処理技術も開発し,実用を意識した取り組みを行った. また国内外において研究発表を活発に行った.Webの分野において最難関国際会議であるWWW2015において研究発表を行うとともに,WWW2016にも論文が採録されることとなった.さらにデータベース分野の最難関国際会議であるACM SIGMOD2015において3時間のチュートリアル講演に採択され,発表を行った.またWebの分野においても,WWW2016のチュートリアル講演に採択されており,国際的に極めてインパクトの高い研究成果となった.
|
Strategy for Future Research Activity |
平成27年度に開発した非線形テンソル解析技術の有効性を医療データを用いて検証する.モデル推定を行うだけでなく,モデルとその学習アルゴリズムを発展させ,大規模テンソル構造からの大局的もしくは局所的なパターン発見,異常検出,様々なコストや基準値の最適化,そして与えられた条件下での将来予測など,様々な課題に取り組む. また,医療データのレコード数および項目数は非常に多く,そして大規模となる.このような大規模なデータをリアルタイムかつ継続的に処理し,情報提供を行なうために,モデルパラメータの高速推定手法について検討する. さらに,複合医療データの効率的な格納方法,アクセス方法についても検討する.統合的な情報解析を行なうには,データベースにおいては広範囲の部分を検索,参照することになる.そこで新たなデータの格納手法,高速アクセス手法を開発する. 本研究の成果は非常に有用であり,技術の実用性が認められて複数の企業との共同研究を継続して実施しており,産業面での成果につなげていく予定である.
|
Research Products
(16 results)
-
-
-
-
-
-
-
-
-
[Presentation] 大規模疫病データのための非線形テンソル解析2016
Author(s)
松原 靖子, 櫻井 保志, Willem G. van Panhuis, Christos Faloutsos
Organizer
第8回データ工学と情報マネジメントに関するフォーラム (DEIM2016)
Place of Presentation
福岡
Year and Date
2016-02-29 – 2016-03-02
-
-
-
-
-
-
-