2013 Fiscal Year Research-status Report
多様な補助知識を利用する高速な統計的機械学習アルゴリズム
Project/Area Number |
25870322
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Gifu University |
Principal Investigator |
志賀 元紀 岐阜大学, 工学部, 助教 (20437263)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 機械学習 / 行列分解 / 半教師あり学習 / クラスタリング |
Research Abstract |
科学や産業におけるデータ計測技術の発展は目覚しく、多様なデータを同時計測する状況が増えており、例えば、多チャネルの脳波(EEG/MEG)の時系列計測や細胞中の全遺伝子発現量の時系列計測などが記録されている。これらの観測データは、複数の変数をもっており、各変数を軸とする多次元配列に記録される。本研究では、こうした多次元配列の情報を縮約している低ランク構造を高感度で発見する方法を目指している。そのために、高次元配列情報のみを用いるのではなく、外的な補助情報を組み合わせる機械学習法を開発している。本年度の成果は、(1)変分ベイズ学習に基づく共クラスタ解析法、(2)オーバーラップ補助情報を用いた行列分解法である。研究成果(1)では、ネットワーク構造情報を補助情報として仮定し、2次元配列(データ行列)情報の2方向クラスタ解析法を提案した。補助ネットワーク上で隣接するノードの計測値が類似することを確率的にモデル化し、ベイズ学習によって観測できないパラメータおよびクラスタ構造を推定するアルゴリズムを導いた。遺伝子発現量による実データ数値実験を行い、補助情報を用いることによる性能向上を確認した。研究成果(2)では、補助グループ情報を用いて2次元配列情報の低ランク構造を発見するアルゴリズムを開発した。グループ構造にオーバーラップを許容するように従来法を一般化し、かつ、学習アルゴリズムの高速化を図った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本課題では高次元配列の解析を目指しているものの、本年度の研究成果は、2次元配列の解析に限定されたものとなった。しかしながら、開発した手法は高次元配列の解析法に拡張しやすいものとなっており、次年度以降の研究につながる成果を得られた。研究の遅れた主な原因は、年度の途中に代表者の所属機関が変更となったため、本研究課題の推進の中断を余儀なくされたことによる。環境の変化、さらに、研究室を新たに立ち上げ・研究構築の再構築が必要になったことが大きく影響した。
|
Strategy for Future Research Activity |
本年度の研究成果(2次元配列の解析)を拡張し、高次元配列データの解析法を目指す。その拡張法に基づき、実際のデータを解析し、精度およびアルゴリズムの観点から、学習法の挙動を理解し、問題点を列挙することから始める。そして、よりスケーラブルかつ汎用的な手法を目指す。
|
Expenditure Plans for the Next FY Research Funding |
主な原因は、代表者が所属機関を変更し、研究の中断を余儀なくされたことである。 上記の理由による研究遅延に伴い、研究費の使用計画の変更が余儀なくされた。該当の研究費を、新たな研究環境における数値計算環境の構築やデータのバックアップ環境の構築のために使用する予定である。
|