2019 Fiscal Year Research-status Report
様々な低品質データに対応するロバストな分類アルゴリズムの開発
Project/Area Number |
18K11448
|
Research Institution | Waseda University |
Principal Investigator |
須子 統太 早稲田大学, 社会科学総合学術院, 准教授 (40409660)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | パターン認識 / ラベルノイズ / EMアルゴリズム / 漸近解析 |
Outline of Annual Research Achievements |
蓄積されたデータをもとに,ある特徴量に対応するラベル(離散値)を予測する分類問題は,古くから統計学や機械学習,人工知能の分野で盛んに研究されている.近年様々な高精度な分類アルゴリズムが開発されたことにより,手書き文字認識,文書分類,購買行動予測など様々な場面でこれら分類アルゴリズムが活用されるようになってきた.その一方,必ずしも理想的な状況でデータが得られるとは限らず,低品質なデータに対する分類アルゴリズムの必要性が増してきている.そのため,ノイズを含むラベルからの学習や半教師あり学習など,様々な低品質なデータ取得状況に応じた分類手法の研究が個別に行われている.本研究では,分類問題におけるこれら低品質データの得られる状況を単一のモデルとして表現し,そのもとで高性能な分類アルゴリズムを構成することで,データの取得状況によらないロバストな分類アルゴリズムの開発を目的としている. 本研究ではデータの発生構造として生成モデルおよび識別モデルと呼ばれる確率的な発生モデルを仮定し,それぞれにラベルノイズモデルを仮定した場合の分類アルゴリズムの提案および性能評価を行う計画を立てていた. 2019年度は,当初予定を一部変更し,ノイズモデルのさらなる拡張を行い,潜在構造を持つ分類問題に対しラベルノイズモデルを適応した高性能な分類アルゴリズムの開発を行った.また,2018年度に行った漸近的な性能の理論解析の結果について,一部不十分な点が判明したため追加の研究を行い,提案したアルゴリズムの理論性能について詳細な解析結果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2019年度の当初予定(研究課題申請時の計画)では,2018年度に行った,基本的な生成モデルを仮定した場合の分類アルゴリズムの開発および,そのアルゴリズムの性能評価を拡張し,生成モデルに対するカーネル法への拡張と識別モデルへの拡張を計画していた.しかし,2018年度の実績報告の際に報告した通り,2019年度開始時には計画を変更しており,2018年度に利用したラベルノイズモデルの更なる一般化および他のラベルノイズモデルを提案し,そのもとでデータの発生モデルとしては生成モデルを仮定した場合の分類アルゴリズムの提案およびその性能評価を行うことを計画していた.(尚この変更は,当初計画における「計画が予定通り進まない場合の対応」で想定していた範囲内の変更である.) 本年度は変更された計画に従い,ラベルノイズモデルの更なる一般化として,潜在構造を持つ分類問題に対しラベルノイズモデルを拡張し分類アルゴリズムの開発とその性能評価を行った.また,2018年度に行った漸近的な性能の理論解析の結果について,一部不十分な点が判明したため追加の研究を行い,提案したアルゴリズムの理論性能について詳細な解析結果を得た. 以上より,課題申請時の計画からは変更は出ているものの,2019年度当初に変更した計画通りに研究は進んでいる.
|
Strategy for Future Research Activity |
2019年度の研究結果より,提案したモデルに対する新たな分類アルゴリズムについて,実験上の性能と理論解析における性能限界との間に大きな乖離がある事が分かった.これは提案したアルゴリズムの性能を更に向上させる事ができる可能性を示唆した結果であると考えられる.そこで2020年度は分類アルゴリズムの性能を理論限界に近づけるべく,アルゴリズムの挙動に対する詳細な調査および,それを元にしたアルゴリズムの改良を進めて行く予定である.
|
Causes of Carryover |
年度末に参加予定であった学会が、新型コロナウィルスの影響により急遽オンライン開催へ変更されたため,出張旅費が発生せず差額が発生してしまった. 差額については,本年度は新型コロナウィルスの影響により,在宅での研究活動が長引く可能性があるため,在宅で研究活動を継続するための備品購入代として消耗品費に上乗せして使用したい.
|