• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

確率的多腕バンディット設定における効率的な良腕識別手法の開発とその応用

研究課題

研究課題/領域番号 18K18099
研究種目

若手研究

配分区分基金
審査区分 小区分61030:知能情報学関連
研究機関北海道大学

研究代表者

田畑 公次  北海道大学, 電子科学研究所, 准教授 (20814445)

研究期間 (年度) 2018-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2021年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2020年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2018年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワード多腕バンディット / 良腕識別 / 分類バンディット / アルゴリズム / 機械学習 / 多腕バンディット問題 / 良腕識別問題
研究成果の概要

本研究は、多腕バンディットという選択と観測を交互に繰り返しながら知識利用と探索のトレードオフを解消するモデルにおいて、与えられた閾値よりも大きな平均報酬を持った選択肢(良腕)を発見するための効率的な手法の開発とその応用のための研究である。ここで効率が良いというのはできるだけ少ない回数の選択で良腕を発見することである。
良腕が存在するかどうかの判定手法と分類バンディットに関してはアルゴリズムの開発と理論解析を行った。
また、本研究により開発されたアルゴリズムを使った診断装置の試作機の開発を行った。

研究成果の学術的意義や社会的意義

学術的意義としては、病理診断に応用することを考慮した新しい問題設定とそのための良腕探索アルゴリズムの開発を行った。本研究により開発された手法は、病理診断だけではなく、品質保証、品質管理、創薬などへも応用可能である。
また、情報計測の分野にとって避けられない偽陽性・偽陰性が扱えるように、多腕バンディットアルゴリズムの平均報酬にバイアスが存在するような設定を新規に開拓した。

報告書

(5件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 2018 実施状況報告書
  • 研究成果

    (8件)

すべて 2021 2019 2018

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (6件) (うち国際学会 3件)

  • [雑誌論文] Classification Bandits: Classification Using Expected Rewards as Imperfect Discriminators2021

    • 著者名/発表者名
      Tabata Koji、Nakumura Atsuyoshi、Komatsuzaki Tamiki
    • 雑誌名

      Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), Workshop on Machine Learning for MEasurement INformatics

      巻: - ページ: 57-69

    • DOI

      10.1007/978-3-030-75015-2_6

    • ISBN
      9783030750145, 9783030750152
    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A bad arm existence checking problem: How to utilize asymmetric problem structure?2019

    • 著者名/発表者名
      Tabata Koji、Nakamura Atsuyoshi、Honda Junya、Komatsuzaki Tamiki
    • 雑誌名

      Machine Learning

      巻: 109 号: 2 ページ: 327-372

    • DOI

      10.1007/s10994-019-05854-7

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] Classification Bandits: Classification Using Expected Rewards as Imperfect Discriminators.2021

    • 著者名/発表者名
      Koji Tabata
    • 学会等名
      PAKDD (Workshops)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Classification Bandits: Classification Using Expected Rewards as Imperfect Discriminators2021

    • 著者名/発表者名
      Koji Tabata
    • 学会等名
      PAKDD2021 Workshop on Machine Learning for MEasurement INformatics
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Bad Arm Existence Checking Algorithm with Bandit Feedback2019

    • 著者名/発表者名
      Koji Tabata, Atsuyoshi Nakamura, Tamiki Komatsuzaki
    • 学会等名
      The 20th RIES-HOKUDAI International Symposium
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会
  • [学会発表] 非対称なグレイゾーン付き悪腕存在チェックアルゴリズム2019

    • 著者名/発表者名
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • 学会等名
      離散構造処理系プロジェクト「2019年度 初夏のワークショップ」
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] バンディットフィードバック下での良腕悪腕の個数による分類問題2019

    • 著者名/発表者名
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • 学会等名
      第22回情報論的学習理論ワークショップ (IBIS 2019)
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] 非対称性を利用した悪腕存在チェックアルゴリズム2018

    • 著者名/発表者名
      田畑 公次, 中村 篤祥, 小松崎 民樹
    • 学会等名
      平成30年度 情報論的学習理論と機械学習研究会
    • 関連する報告書
      2018 実施状況報告書

URL: 

公開日: 2018-04-23   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi