2016 Fiscal Year Annual Research Report
Research on robust independent component analysis applicable to only a few observed signals
Project/Area Number |
26730013
|
Research Institution | The University of Tokyo |
Principal Investigator |
松田 源立 東京大学, 大学院総合文化研究科, 学術研究員 (40433700)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 独立成分分析 / 機械学習 / ウェブデータ分析 / 自然言語処理 |
Outline of Annual Research Achievements |
2016年度は、主に、独立成分分析(ICA)の統一的な目的関数の構築を進めました。更に、機械学習手法の応用として、webデータによるユーザの行動予測と、自然言語処理における同義語判定、加えて情報科学教育分野におけるシラバス分析について研究を進めてきました。ICAに関しては、super-Gaussianとsub-Gaussianと呼ばれる大きく異なる2種類の源信号タイプを、統一的に扱える目的関数を構築しました。従来のICAの目的関数では、分布の種類ごとに異なる目的関数に切り替えたり、あるいは、信号数が多い場合に最適化が困難となる統計量の自乗を含む項を利用したりする必要がありましたが、今回提案した目的関数により、なめらかに多様な源信号を処理することができるようになりました。また、その目的関数の妥当性を、様々な観点から数学的に証明しました。更に、その目的関数を利用することで、源信号の抽出順の不定性を解消し、非ガウス性の強いものから順番に抽出できることを示しました。加えて、正規分布となる源信号を検出し、非ガウスな源信号の個数を推定する手法を提案しました。その結果、少数の非ガウス源信号の効率的な抽出が可能となることを示しました。応用としては、第一に、webデータにおいて類似した行動履歴を持つユーザを集めることで、各ユーザの行動予測精度を向上させる手法を提案しました。第二に、自然言語処理における同義語判定の精度向上について研究を進めました。第三に、シラバス分析については、実際のシラバスを収集して機械学習手法を適用することで、シラバスのトピック間の階層的な関係性の把握を試みました。
|
Research Products
(8 results)