• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

Study on fast and accurate classifier learning method from unlabeled big data

Research Project

Project/Area Number 20K21815
Research InstitutionOsaka University

Principal Investigator

鷲尾 隆  大阪大学, 産業科学研究所, 教授 (00192815)

Project Period (FY) 2020-07-30 – 2022-03-31
Keywords機械学習 / 分類器 / 回帰式 / 教師無し学習 / UUC学習 / 非結合回帰 / クラス事前分布推定 / ガウス過程回帰
Outline of Annual Research Achievements

近年、ビッグデータから分類器や回帰式を学習するニーズが増しているが、データ収集の制約やコストから教師信号が得られないことが問題となっている。従来、この問題に対し、教師ラレベル付少数事例集合とラベル無事例集合を用いる半教師あり学習や、正事例集合とラベル無し事例集合を用いるPUC手法など、部分的に教師ラベルや目的変数値が与えられる場合に適用可能な手法が研究されてきた。これに対し近年、教師ラベルが陽に与えられない場合について、正負例割合の異なる2つのラベル無し事例集合から分類器を学習するUUC手法や、事例間の目的変数値の大小関係のみが知られた事例集合と目的変数値が知られていない大量事例集合から回帰式を学習する非結合回帰手法が提案されている。しかし、何れも事例集合中の正負例の割合や目的変数値の分布など、教師信号の分布が予め知られていることを前提としている。現実のビッグデータでは教師信号の分布が知られていることは少なく、これらの手法を実適用する上で障害となっている。さらに、真の教師ラベルや目的変数値が全く得られない条件で、如何に学習した分類器や回帰式の精度や不確実性を評価するかも問題である。
そこで本研究では、(1)教師ラベルや目的変数値が知られていないデータから教師信号の分布を推定する手法の研究、(2)教師分布の情報が与えられなくても学習可能な手法の研究、さらに(3)教師信号無しに学習した分類器や回帰式の精度・不確実性を評価する手法の研究に取り組んでいる。令和2年度は(1)教師信号分布を高精度推定する手法を開発し国際ジャーナルでの発表を行った。さらにその推定手法とUUC手法を組み合わせ、分類精度を向上させる手法の開発も行った。(2)についても最尤推定原理を用いる手法の開発を行った。また、(3)についてもガウス過程回帰において非結合回帰を可能とする手法の開発を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

例年に比べ予算交付は遅れたが、各研究項目についてあまり経費を要しない理論的な検討・解析を交付前から開始し、開発すべき機械学習の原理やアルゴリズムの概要を固めた。さらに理論的な検討や解析だけで研究として成立する部分を切り出し、ジャーナル論文化を進めた。予算交付後には理論的な検討や解析結果について、幾つかの学会成果発表やその準備を行った。さらに、プログラム構築やそれを用いた数値計算検証を行う準備を開始しだ。これらの研究作業手順の組み換えと一部前倒しによって、研究計画に比して遅滞なく研究を遂行できた。

Strategy for Future Research Activity

研究目的達成のために、研究課題(1),(2),(3)の各々についてさらに理論的なな検討・解析に取り組むと共に、並行してプログラム構築やそれを用いた数値計算検証作業に取り組み成果を明らかにし、学会発表や国際会議発表、ジャーナル発表を進めて行く。

Causes of Carryover

例年に比べ予算交付は遅れたため、各研究項目についてあまり経費を要しない理論的な検討・解析を交付前から開始し、開発すべき機械学習の原理やアルゴリズムの概要を固めた。さらに理論的な検討や解析だけで研究として成立する部分を切り出し、ジャーナル論文化を進めた。予算交付後には理論的な検討や解析結果について、幾つかの学会成果発表やその準備を行った。さらに、現在、プログラム構築やそれを用いた数値計算検証を行う準備を開始しているが、まだデータ整理や処理に関する外注費や研究の進展に伴って発生する物品費や消耗品の購入には至っていない。新年度に早急にこれらを購入し、予算執行する予定である。

  • Research Products

    (7 results)

All 2021 2020 Other

All Int'l Joint Research (2 results) Journal Article (2 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (3 results)

  • [Int'l Joint Research] Federation University in Australia(オーストラリア)

    • Country Name
      AUSTRALIA
    • Counterpart Institution
      Federation University in Australia
  • [Int'l Joint Research] Nanjing University(中国)

    • Country Name
      CHINA
    • Counterpart Institution
      Nanjing University
  • [Journal Article] Classification from Positive and Unlabeled Data Based on Likelihood Invariance for Measurement2021

    • Author(s)
      Takeshi Yoshida, Takashi Washio, Takahito Ohshiro, Masateru Taniguchi
    • Journal Title

      Intelligent Data Analysis

      Volume: 25 Pages: 57-79

    • DOI

      10.3233/IDA-194980

    • Peer Reviewed / Open Access
  • [Journal Article] Isolation Distributional Kernel: A new tool for kernel based anomaly detection2020

    • Author(s)
      Kai Ming Ting, Takashi Washio, Bi-Cun Xu, Zhi-Hua Zhou
    • Journal Title

      KDD2020: Knowledge Discovery and Data Mining, 2020

      Volume: 1 Pages: 233

    • DOI

      10.1145/3394486.3403062

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Noise2Noise 深層学習を用いた教師無しのナノチャンネル計測ノイズ低減2020

    • Author(s)
      鷹合孝之, 筒井真楠, 鷲尾隆
    • Organizer
      人工知能学会第4回計測インフォマティクス研究会
  • [Presentation] ラベルなし事例集合と負事例混入正事例集合からの密度比を用いたクラス事前確率推定2020

    • Author(s)
      吉田剛, 新家英太郎, 鷲尾隆
    • Organizer
      人工知能学会第4回計測インフォマティクス研究会
  • [Presentation] アンサンブル最近傍距離を用いたラベル無しデータからの分類器学習2020

    • Author(s)
      松本 瑞季, 鷲尾 隆
    • Organizer
      第34回人工知能学会全国大会(2020)

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi