研究課題/領域番号 |
15J09111
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
坂井 智哉 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2015-04-24 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
2,800千円 (直接経費: 2,800千円)
2017年度: 900千円 (直接経費: 900千円)
2016年度: 900千円 (直接経費: 900千円)
2015年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | 機械学習 / 二乗損失相互情報量 / 弱教師付き学習 / 正例とラベルなしデータからの学習 / 半教師付き学習 / AUC最適化 / 情報理論的表現学習 / 正データとラベルなしデータからの学習 / 二乗損失相互 / PU学習 / 半教師あり学習 / 次元削減 / 多様体 |
研究実績の概要 |
平成28年度から引き続き,正例とラベルなしデータからの分類に基づく半教師付き分類に重点を置いて研究を進めた.開発した手法は,クラスタ仮定に代表される,従来法が要求するデータ分布に対する強い仮定なしで,ラベルなしデータを学習に利用できるという利点がある.分類器を訓練する方法として,誤識別率最小化に基づく手法と,AUC最大化に基づく手法を開発した.これらの研究成果は,トップ国際会議であるICMLおよびトップ国際ジャーナルであるMachine Learning Journalに採択された. 年度の後半では,正例とラベルなしデータからの情報理論的表現学習の研究に取り組んだ.テータの有用な低次元表現の尺度として二乗損失相互情報量を用いることで,これまでの正例とラベルなしデータから分類に不可欠な量である,クラス事前確率の推定が学習時に必要なくなる.クラス事前確率の推定は,特に高次元データにおいて難しいことが知られている.しかし,開発した手法を用いることで,先に有用な低次元表現を得ておいて,その後にクラス事前確率推定を行うことができるため,その精度向上が期待できる.上記の成果をまとめて国際会議に投稿した. その後,これまでの研究成果をまとめた博士論文を執筆した.論文は,新領域創成科学研究科の研究科長賞に選ばれた. 年度末には,研究成果の普及を目的として,弱教師付き学習の手法を集めたPythonパッケージの開発を始めた.主要な機械学習パッケージと親和性の高いインタフェースを備えることで,容易に利用できることを目標にしている.既に一部成果を公開中であり,今後も開発を続けて機能を充実させていく. 上記と並行して,正バッグとラベルなしバッグからの分類手法の研究,非観測要素を用いた行列補完法の研究を進めた.これらの成果をまとめた論文を国際ジャーナルに投稿した.
|
現在までの達成度 (段落) |
29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
29年度が最終年度であるため、記入しない。
|