2017 Fiscal Year Annual Research Report
二乗損失相互情報量を用いた実用的な機械学習手法の開発
Project/Area Number |
15J09111
|
Research Institution | The University of Tokyo |
Principal Investigator |
坂井 智哉 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2015-04-24 – 2018-03-31
|
Keywords | 機械学習 / 二乗損失相互情報量 / 弱教師付き学習 / 正例とラベルなしデータからの学習 / 半教師付き学習 / AUC最適化 / 情報理論的表現学習 |
Outline of Annual Research Achievements |
平成28年度から引き続き,正例とラベルなしデータからの分類に基づく半教師付き分類に重点を置いて研究を進めた.開発した手法は,クラスタ仮定に代表される,従来法が要求するデータ分布に対する強い仮定なしで,ラベルなしデータを学習に利用できるという利点がある.分類器を訓練する方法として,誤識別率最小化に基づく手法と,AUC最大化に基づく手法を開発した.これらの研究成果は,トップ国際会議であるICMLおよびトップ国際ジャーナルであるMachine Learning Journalに採択された. 年度の後半では,正例とラベルなしデータからの情報理論的表現学習の研究に取り組んだ.テータの有用な低次元表現の尺度として二乗損失相互情報量を用いることで,これまでの正例とラベルなしデータから分類に不可欠な量である,クラス事前確率の推定が学習時に必要なくなる.クラス事前確率の推定は,特に高次元データにおいて難しいことが知られている.しかし,開発した手法を用いることで,先に有用な低次元表現を得ておいて,その後にクラス事前確率推定を行うことができるため,その精度向上が期待できる.上記の成果をまとめて国際会議に投稿した. その後,これまでの研究成果をまとめた博士論文を執筆した.論文は,新領域創成科学研究科の研究科長賞に選ばれた. 年度末には,研究成果の普及を目的として,弱教師付き学習の手法を集めたPythonパッケージの開発を始めた.主要な機械学習パッケージと親和性の高いインタフェースを備えることで,容易に利用できることを目標にしている.既に一部成果を公開中であり,今後も開発を続けて機能を充実させていく. 上記と並行して,正バッグとラベルなしバッグからの分類手法の研究,非観測要素を用いた行列補完法の研究を進めた.これらの成果をまとめた論文を国際ジャーナルに投稿した.
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Remarks |
本研究プロジェクトの成果をまとめた博士論文が研究科長賞に選ばれた.
|