Study on fast and accurate classifier learning method from unlabeled big data
Project/Area Number |
20K21815
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 61:Human informatics and related fields
|
Research Institution | Osaka University |
Principal Investigator |
鷲尾 隆 大阪大学, 産業科学研究所, 教授 (00192815)
|
Project Period (FY) |
2020-07-30 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥6,370,000 (Direct Cost: ¥4,900,000、Indirect Cost: ¥1,470,000)
Fiscal Year 2021: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2020: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
|
Keywords | 機械学習 / 分類器 / 回帰式 / 教師無し学習 / UUC学習 / 非結合回帰 / クラス事前分布推定 / ガウス過程回帰 / 弱学習 / 教師無し分類器学習 / ラベル無しデータ / ビッグデータ |
Outline of Research at the Start |
研究は、(1)事例データの分布密度差推定の原理の構築、(2)理論的な性質や性能保証に関する解析、(3)理論的性質の人工検証データを用いた確認、(4)実用性に関するフィジビリティスタディとして心機能健診データから個人の心不全発症リスク分類、(5)同じく微小生体の形状観測情報から種類識別する分類器構築、の5つの項目からなる。(1)(2)(3)は鷲尾と国際共同研究者のK.M.Ting教授とで取り組み、(4)は国立循環器病研究センターの医療チーム、(5)は大阪大学産業科学研究所の谷口教授の研究室と共同で取り組む。これによって、目指すUUC手法の原理的基礎の確立と、その実用性に関する見通しを得る。
|
Outline of Annual Research Achievements |
近年、ビッグデータから分類器や回帰式を学習するニーズが増しているが、データ収集の制約やコストから目的変数値が教師信号として得られ難いことが問題となっている。これに対し近年、目的変数値無し事例集合とその目的変数値の分布情報のみが与えられる場合に、正負例割合の異なる2つの事例集合から分類器を学習するUUC手法や、事例間の目的変数値の大小関係のみが知られた事例集合と目的変数値無し事例集合から回帰式を学習する非結合回帰手法が提案されている。何れも事例集合中の正負例の割合など目的変数値の分布が予め知られていることを前提としている。しかし、現実のビッグデータでは目的変数値の分布が知られていることは少なく、これらの手法を実適用する上で障害となっている。さらに、真の目的変数値が全く得られない条件で、如何に学習した分類器や回帰式の精度や不確実性を評価するかも問題である。 そこで本研究では令和3年度までに、(1)目的変数値の分布が知られていないデータから目的変数値の分布を推定し、分類器や回帰式を学習する手法の研究、さらに(2)教師信号無しに学習した分類器や回帰式の精度・不確実性を評価する手法の研究に取り組んだ。しかしながら各々の研究項目についてコロナ禍の状況下で研究が十分進まず、(1)については目的変数値分布を用いないUUC手法の開発、(2)については分類器や回帰式のパラメータや目的変数値の事後分布推定手法の構築が積み残しとなった。 令和4年度は、(1)について目的変数値の分布が得られなくても分類器を学習可能な条件を探求し、それに基づくUUC分類器学習原理と学習アルゴリズムの開発を行った。(2)については対象問題に関する事前知識を反映したモデルを補助情報として用いることで、モデルパラメータや目的変数値の事後分布を推定可能な原理とアルゴリズムを開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究においては令和4年度までに、(1)目的変数値の分布が知られていないデータから目的変数値の分布を推定し、分類器や回帰式を学習する手法の研究、さらに(2)教師信号無しに学習した分類器や回帰式の精度・不確実性を評価する手法の研究という2つの研究項目に取り組んだが、コロナ下のオンラインでの研究作業において研究者間の意思疎通が十分に取れず、(1)、(2)の各研究項目において開発した手法とアルゴリズムの最終的な性能検証を完遂できなかった。
|
Strategy for Future Research Activity |
令和5年度において、2つの研究項目(1)目的変数値の分布が知られていないデータから目的変数値の分布を推定し、分類器や回帰式を学習する手法の研究、(2)教師信号無しに学習した分類器や回帰式の精度・不確実性を評価する手法の研究の各々について、これまで開発した各手法とアルゴリズムの最終的な性能検証を実施する。検証に当たっては、なるべく実世界から採取されたデータを用い、現実的な性能を評価する予定である。
|
Report
(3 results)
Research Products
(25 results)
-
-
-
-
-
-
-
[Journal Article] Isolation Kernel Estimators2022
Author(s)
Kai Ming Ting, Takashi Washio, Jonathan Wells, Hang Zhang, Ye Zhu
-
Journal Title
Knowledge and Information Systems (KAIS Journal)
Volume: 65
Issue: 2
Pages: 759-787
DOI
Related Report
Peer Reviewed / Open Access / Int'l Joint Research
-
-
-
[Journal Article] Isolation Kernel Density Estimation2021
Author(s)
Kai Ming Ting, Takashi Washio, Jonathan Wells, and Hang Zhang
-
Journal Title
IEEE ICDM 2021: IEEE ICDM 2021 21st IEEE International Conference on Data Mining
Volume: 1
Pages: 619-628
DOI
Related Report
Peer Reviewed / Open Access / Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-