研究課題/領域番号 |
20K21815
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 大阪大学 |
研究代表者 |
鷲尾 隆 大阪大学, 産業科学研究所, 教授 (00192815)
|
研究期間 (年度) |
2020-07-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2021年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2020年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
|
キーワード | 弱教師有り学習 / 分類器学習 / 機械学習 / UUC / 教師ラベル無しデータ / 分類器 / 回帰式 / クラス事前確率 / 非結合回帰 / 教師無し学習 / UUC学習 / クラス事前分布推定 / ガウス過程回帰 / 弱学習 / 教師無し分類器学習 / ラベル無しデータ / ビッグデータ |
研究開始時の研究の概要 |
研究は、(1)事例データの分布密度差推定の原理の構築、(2)理論的な性質や性能保証に関する解析、(3)理論的性質の人工検証データを用いた確認、(4)実用性に関するフィジビリティスタディとして心機能健診データから個人の心不全発症リスク分類、(5)同じく微小生体の形状観測情報から種類識別する分類器構築、の5つの項目からなる。(1)(2)(3)は鷲尾と国際共同研究者のK.M.Ting教授とで取り組み、(4)は国立循環器病研究センターの医療チーム、(5)は大阪大学産業科学研究所の谷口教授の研究室と共同で取り組む。これによって、目指すUUC手法の原理的基礎の確立と、その実用性に関する見通しを得る。
|
研究成果の概要 |
AI技術の普及に伴い、データ収集の制約やコストから教師ラベルなしビッグデータからの分類器学習ニーズが高まっている。これに対し、正負例割合の異なる2つのラベル無し事例集合から分類器を学習するUUC手法が提案されているが、既存手法はビッグデータに対して膨大な学習計算量を要し、また分類に偏り誤差を生じる問題があった。 そこで、本研究ではより汎用性を有し、低計算量で偏り誤差の無いUUC手法を提案した。そして、実データを含む様々なデータに適用し、教師ラベルあり学習と同等以上の精度で、教師ラベルなし学習が可能であることを検証した。これにより、既存手法の適用範囲限界を遥かに超えるUUC手法を確立した。
|
研究成果の学術的意義や社会的意義 |
IoT社会の深化とAI技術の普及に伴い、ビッグデータからの分類器学習ニーズが増しているが、多くの場合にデータ収集の制約やコストから教師ラベルが得られないことが問題となっている。これに対し近年、正負例割合の異なる2つのラベル無し事例集合から分類器を学習するUUC手法が提案されている。しかし、これらはカーネル法を用いており、訓練データ数NについてO(N3)の学習計算量を要し、またN→∞でも分類に偏り誤差を生じる場合がある。従って、複雑な事例分布を持つビッグデータに適用可能な高速高精度なUUC手法の開発が強く待たれていた。本研究成果は、この社会的要請に応えるものである。
|