2014 Fiscal Year Research-status Report
多様な補助知識を利用する高速な統計的機械学習アルゴリズム
Project/Area Number |
25870322
|
Research Institution | Gifu University |
Principal Investigator |
志賀 元紀 岐阜大学, 工学部, 助教 (20437263)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 機械学習 / 半教師あり学習 / 行列分解 / クラスタリング / スパース正則化 / 特徴選択 |
Outline of Annual Research Achievements |
科学や産業におけるデータ計測技術の発展は目覚しく、多様なデータを同時計測する状況が増えている。例えば、脳科学・生物学において、多チャネルの脳波(EEG/MEG)や遺伝子発現量が同時に時系列で計測されたり、または、SNSにおける2項関係データが時系列で計測されたりする。これらの観測データは、複数の変数を軸とする多次元配列(テンソル)に記録され、このデータ構造に隠れた規則や関係を発見するデータマイニング技術が注目を集めている。 本研究では、補助情報を導入することにより、観測データの計測雑音に頑健な低ランク構造同定法を開発した。この方法では、補助情報の構造を反映するスパース正則化項付き最適化の解として、低ランク構造が同定される。その最適化の問題において、4つの最適化アルゴリズムを導出し、低ランク構造の同定性能、および、アルゴリズムの実行速度の観点から導出法を比較した。これらの研究成果をまとめて、学術雑誌IEEE TKDEに投稿し、採択された。 一方、入出力ペアのデータが観測される場合には、入力と出力の間の確率的な関係を同定することが機械学習の応用問題において重要である。この課題において、重要な入力特徴量を自動的に選択しつつ条件付き確率を推定する問題を、グループ正則化付き最適化問題として新たに定式化し、その最適化アルゴリズムを導出した。この研究成果をまとめて、学術雑誌Machine Learningに投稿し、採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
行列(2次元配列)から低ランク構造を同定する問題において、補助情報を取り入れる手法を提案した論文が学術雑誌に採択され、前年度の進捗の遅れを取り戻しつつある。
|
Strategy for Future Research Activity |
今後は、低ランク構造同定問題において雑音モデルを一般化すること、また、本研究で開発した手法を高次元配列における手法に拡張することを予定している。本研究課題の最終年度となるため、早い段階で、学術論文にまとめることを目指す。
|
Causes of Carryover |
前年度に研究代表者が異動したため、研究機器設置のための環境整備が必要となり、計画に遅延が生じた。
|
Expenditure Plan for Carryover Budget |
環境の整備ができ次第、数値計算用サーバー等の必要機器を順次購入する予定である。また、今年度に参加を見送った学会参加等の出張旅費に費用を計上している。
|