研究課題/領域番号 |
18K11448
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 早稲田大学 |
研究代表者 |
須子 統太 早稲田大学, 社会科学総合学術院, 准教授 (40409660)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | パターン認識 / ラベルノイズ / EMアルゴリズム / 漸近解析 / 機械学習 / 半教師付き学習 / 外れ値 / ノイズ入りデータ |
研究成果の概要 |
本研究では,蓄積されたデータをもとにある特徴量に対応するラベルを予測する分類アルゴリズムについて扱った.分類アルゴリズムの実用では,ノイズ等を含む低品質なデータを用いる場合が多々ある.本研究では様々なノイズを統一的なモデルで表現したもとで高性能な分類アルゴリズムを提案し,理論的な性能限界を導くとともに,性能限界と実アルゴリズムの性能差の解析を行った.
|
研究成果の学術的意義や社会的意義 |
現在,画像認識やテキスト分類などの分類アルゴリズムは広く普及しており,一般にも実用されている.しかしながら,実用の場面ではノイズを含む低品質なデータが用いられる事も多く,分類アルゴリズムの本来の性能が発揮できていない場合があり場合によっては十分な分類精度が得られない事がある.本研究の成果を発展させることで,より多くの場面で高性能な分類アルゴリズムが開発できる可能性がある.
|