研究課題/領域番号 |
15J09111
|
研究機関 | 東京大学 |
研究代表者 |
坂井 智哉 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2015-04-24 – 2018-03-31
|
キーワード | 機械学習 / 二乗損失相互情報量 / 正データとラベルなしデータからの学習 / 半教師付き学習 / AUC最適化 |
研究実績の概要 |
平成27年度の後半から新たに重要な研究課題となった正データとラベルなしデータからの分類に基づく半教師付き分類に関する研究に関して,平成28年度前半をかけることで様々な知見が蓄積されてきた.特に,その理論的性質と,実際のデータにおける手法の振る舞いに関しての理解が深まった.これらの知見が得られたことで,結果として論文の完成度も高まることとなった.この新たな半教師付き分類に関する研究の成果をまとめた論文を,主要な査読付き国際会議へ投稿中であり,現在はその採択結果を待っている状況である. 新たな半教師付き分類は誤識別率最小化に基づいているが,分類したい2つのクラスのデータ数に大きく偏りがある場合は,AUCと呼ばれる基準に対して分類手法を最適化することがよく行われる.そこで,平成28年度の後半では,新たな半教師付き分類のフレームワークを半教師付きAUC最適化へと拡張した.手法の定式化,その性能の理論保証に関しては既に目途が立ち,現在は計算機実験により手法の性能を評価する準備を進めている.これらの成果を論文としてまとめる準備も進んでおり,次年度の早い時期に国際会議あるいはジャーナル誌へ投稿することを目指している. 上記と並行して,新たに開発した半教師付き分類の手法を多クラス分類へと拡張する研究も進んだ.手法の大枠は既に完成し,現在はその理論性能の解析を進めている. その他に,半教師付き分類のフレームワークを応用した行列補完法の開発の検討も進めている.現在は,既存研究の調査,手法の定式化に向けた準備を進めている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度の前半を通じて,正データとラベルなしデータからの分類に基づく半教師付き分類の理論および実験的性質についての理解が深まった.残念ながら,主要な査読付き国際会議への論文採択にこそ結びつかなかったものの,一歩ずつ着実に研究を進めた.結果として,手法に対する様々な知見が蓄積され,これまでよりも論文の完成度を高めることができた.現在,成果をまとめた論文を主要な査読付き国際会議へ投稿中である. 上記と並行して,28年度の後半では,新たな半教師付き分類のフレームワークを応用した半教師付きAUC最適化に関する研究も進んだ.AUC最適化とは,AUCと呼ばれる基準に対して分類手法を最適化する枠組みであり,分類したい2つのクラスのデータ数に大きく偏りがある場合に有用である.新たな半教師付きAUC最適化法の定式化,その理論解析に関しては目途が立ち,次年度は実データを用いてその性能を評価する予定である. 本年度の終盤では,研究室の学部の方と協力して,提案している半教師付き分類の多クラス分類への拡張や,修士課程の方と協力して,行列補完へ提案法のフレームワークを応用する方法を検討した.多クラス分類への拡張に関しては,手法自体はおよその目途が立ち,次年度以降に理論解析等を進めていく予定である.行列補完に関しては,まだアイデア段階というところであるため,その実現可能性や妥当性についての更なる検討を進めていく. 正データとラベルなしデータのみが与えられる状況で二乗損失相互情報量を推定する手法に関しては一時中断していたが,開発している新たな半教師付き分類手法の研究を通じて,正データとラベルなしデータからの学習に関しての理解が深まったため,次年度以降はそれらの知見を,二乗損失相互情報量を用いた応用手法にも還元していく予定である.
|
今後の研究の推進方策 |
今後も,提案している半教師付き分類のフレームワークを応用した手法の開発を進めていく. 来年度の前半は,半教師付きAUC最適化に関する研究を進めていく.様々なベンチマークデータを用いて,計算機実験により手法の評価を行い,結果がまとまり次第,国際会議あるいはジャーナル誌へ投稿する. 年度の中盤にかけては,一時中断していた,正データとラベルなしデータのみが与えられる状況での二乗損失相互情報量推定法に関する研究を再開する.これまでに蓄積された知見をもとにアルゴリズムを再度見直し,その理論解析等も進めていく.その後,計算機実験により,二乗損失相互情報量を用いた応用手法が,正データとラベルなしデータのみが与えられる状況でも実用上十分な性能が出ることを示す.最終的には,半教師付き学習の設定でも,二乗損失相互情報量を精度良く推定できる手法の開発へと発展させていく. 上記と並行して,開発した新たな半教師付き分類の多クラス分類への拡張,そして新たな行列補完手法の開発を進めていく.これらは,研究室の修士課程の方と協力して進めていくことを予定している.
|