科学や産業におけるデータ計測技術の発展は目覚ましく、多様なデータを同時計測する状況が増えている。計測されたデータは、膨大な数の特徴量(次元)となったり高次元配列(テンソル)に格納されたりと、膨大なサイズになる。こうしたデータから重要な低ランク構造または低次元構造を抽出することが重要な解析とされる。こうした問題において、今年度の研究では、主に2つの課題に取り組んだ。 1つ目の研究課題は、スパース正則化を用いる非負値行列分解法である。グループ正則化による雑音に頑健な方法、また、走査型電子顕微分光計測データ解析のための手法を開発した。後者の手法においては、スパース事前分布に基づく行列ランク数の自動決定法を開発し、実際の電子顕微鏡データにおける有効性を検証した。 2つ目の課題は、高次元の特徴量から有用な特徴量を選択するものである。特に、条件付き確率分布のノンパラメトリック推定における効率的な特徴量の推定法を開発し、国際会議ECML-PKDD2015で発表した。また、生存時間解析における2段階特徴量選択法を提案し、データ解析コンペティションProstate Cancer DREAM challengeで入賞した。(その手法をF1000 Researchにまとめて公開する予定である。)
|