2017 年度実績報告書

二乗損失相互情報量を用いた実用的な機械学習手法の開発

研究課題

研究課題/領域番号	15J09111
研究機関	東京大学
研究代表者	坂井智哉東京大学, 新領域創成科学研究科, 特別研究員(DC1)
研究期間 (年度)	2015-04-24 – 2018-03-31
キーワード	機械学習 / 二乗損失相互情報量 / 弱教師付き学習 / 正例とラベルなしデータからの学習 / 半教師付き学習 / AUC最適化 / 情報理論的表現学習
研究実績の概要	平成２８年度から引き続き，正例とラベルなしデータからの分類に基づく半教師付き分類に重点を置いて研究を進めた．開発した手法は，クラスタ仮定に代表される，従来法が要求するデータ分布に対する強い仮定なしで，ラベルなしデータを学習に利用できるという利点がある．分類器を訓練する方法として，誤識別率最小化に基づく手法と，AUC最大化に基づく手法を開発した．これらの研究成果は，トップ国際会議であるICMLおよびトップ国際ジャーナルであるMachine Learning Journalに採択された．年度の後半では，正例とラベルなしデータからの情報理論的表現学習の研究に取り組んだ．テータの有用な低次元表現の尺度として二乗損失相互情報量を用いることで，これまでの正例とラベルなしデータから分類に不可欠な量である，クラス事前確率の推定が学習時に必要なくなる．クラス事前確率の推定は，特に高次元データにおいて難しいことが知られている．しかし，開発した手法を用いることで，先に有用な低次元表現を得ておいて，その後にクラス事前確率推定を行うことができるため，その精度向上が期待できる．上記の成果をまとめて国際会議に投稿した．その後，これまでの研究成果をまとめた博士論文を執筆した．論文は，新領域創成科学研究科の研究科長賞に選ばれた．年度末には，研究成果の普及を目的として，弱教師付き学習の手法を集めたPythonパッケージの開発を始めた．主要な機械学習パッケージと親和性の高いインタフェースを備えることで，容易に利用できることを目標にしている．既に一部成果を公開中であり，今後も開発を続けて機能を充実させていく．上記と並行して，正バッグとラベルなしバッグからの分類手法の研究，非観測要素を用いた行列補完法の研究を進めた．これらの成果をまとめた論文を国際ジャーナルに投稿した．
現在までの達成度 (段落)	29年度が最終年度であるため、記入しない。
今後の研究の推進方策	29年度が最終年度であるため、記入しない。
備考	本研究プロジェクトの成果をまとめた博士論文が研究科長賞に選ばれた．

研究成果
(14件)

すべて 2018 2017 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (10件) (うち国際学会 6件、招待講演 2件) 備考 (3件)

[雑誌論文] Semi-supervised AUC optimization based on positive-unlabeled learning2018
- 著者名/発表者名
  T. Sakai, G. Niu, & M. Sugiyama
- 雑誌名
  
  Machine Learning
  
  巻: 107 ページ: 767-794
- DOI
  https://doi.org/10.1007/s10994-017-5678-9
- 査読あり
[学会発表] 正例とラベルなしデータからの分類に基づく半教師付き分類2017
- 著者名/発表者名
  坂井智哉
- 学会等名
  ERATO感謝祭 Season IV
- 招待講演
[学会発表] Semi-supervised classification based on classification from positive and unlabeled data2017
- 著者名/発表者名
  坂井智哉
- 学会等名
  第20回情報論的学習理論ワークショップ (IBIS2017)
- 招待講演
[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017
- 著者名/発表者名
  坂井智哉
- 学会等名
  第20回情報論的学習理論ワークショップ (IBIS2017)
[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017
- 著者名/発表者名
  坂井智哉
- 学会等名
  情報系 Winter Festa Episode 3
[学会発表] Least-squares log-density gradient clustering for Riemannian manifolds2017
- 著者名/発表者名
  Mina Ashizawa, Tomoya Sakai
- 学会等名
  International Conference on Artificial Intelligence and Statistics (AISTATS 2017)
- 国際学会
[学会発表] Positive-unlabeled learning with application to semi-supervised learning2017
- 著者名/発表者名
  Tomoya Sakai
- 学会等名
  Microsoft Research Asia Academic Day 2017
- 国際学会
[学会発表] Semi-supervised classification based on positive-unlabeled classification2017
- 著者名/発表者名
  Tomoya Sakai
- 学会等名
  The Machine Learning Summer School (MLSS 2017 Tuebingen)
- 国際学会
[学会発表] Semi-supervised classification based on positive-unlabeled classification2017
- 著者名/発表者名
  Tomoya Sakai
- 学会等名
  First International Workshop on Symbolic-Neural Learning (SNL-2017)
- 国際学会
[学会発表] Semi-supervised classification based on classification from positive and unlabeled data2017
- 著者名/発表者名
  Tomoya Sakai
- 学会等名
  International Conference on Machine Learning (ICML 2017)
- 国際学会
[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017
- 著者名/発表者名
  Tomoya Sakai
- 学会等名
  Asian Conference on Machine Learning (ACML 2017)
- 国際学会
[備考] PNU-AUC Optimization (MATLAB code)
- URL
  https://github.com/t-sakai-kure/PNU/tree/master/PNU-AUC
[備考] pywsl: python codes for weakly-supervised learning
- URL
  https://github.com/t-sakai-kure/pywsl
[備考] 平成２９年度新領域創成科学研究科長賞授与について
- URL
  http://www.k.u-tokyo.ac.jp/info/entry/22_entry639/

2017 年度 実績報告書

二乗損失相互情報量を用いた実用的な機械学習手法の開発

研究代表者

坂井 智哉 東京大学, 新領域創成科学研究科, 特別研究員(DC1)

研究成果

[雑誌論文] Semi-supervised AUC optimization based on positive-unlabeled learning2018

著者名/発表者名

雑誌名

DOI

[学会発表] 正例とラベルなしデータからの分類に基づく半教師付き分類2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised classification based on classification from positive and unlabeled data2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017

著者名/発表者名

学会等名

[学会発表] Least-squares log-density gradient clustering for Riemannian manifolds2017

著者名/発表者名

学会等名

[学会発表] Positive-unlabeled learning with application to semi-supervised learning2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised classification based on positive-unlabeled classification2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised classification based on positive-unlabeled classification2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised classification based on classification from positive and unlabeled data2017

著者名/発表者名

学会等名

[学会発表] Semi-supervised AUC optimization based on positive-unlabeled learning2017

著者名/発表者名

学会等名

[備考] PNU-AUC Optimization (MATLAB code)

URL

[備考] pywsl: python codes for weakly-supervised learning

URL

[備考] 平成２９年度新領域創成科学研究科長賞授与について

URL

2017 年度実績報告書

坂井智哉東京大学, 新領域創成科学研究科, 特別研究員(DC1)