研究課題/領域番号 |
19K20277
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 山梨大学 |
研究代表者 |
李 吉屹 山梨大学, 大学院総合研究部, 助教 (30726667)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2019年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
|
キーワード | クラウドソーシング / ラベル付与 / コスト削減 / 機械学習 |
研究開始時の研究の概要 |
本研究は, クラウドソーシングサービスを利用した大規模データへの高精度ラベル付与タスクにおいて, ラベル付与が必要なデータとワーカーの特質に着目することにより, サービス利用時のコストを抑えることが可能な機械学習法を提案する. 本研究は, 大規模データと多数のラベルを対象としたラベル付与においてトレードオフの関係にあるコスト削減と品質向上を同時に目指す点が挑戦的であり, 独自性がある. 本研究の成果は, 近年脚光を浴びている深層学習などの教師付き機械学習において本質的な問題である学習データの作成に直接貢献することから, 産業界における多様な分野での人工知能技術の実用化と進展が期待できる.
|
研究成果の概要 |
本研究は,テキストや画像などメディアを対象とした大規模データへのクラウドソーシングによる高精度ラベル付与タスクにおいて,サービス利用時コストを抑えることが可能な機械学習法を明らかにすることである. クラウドソーシングによって収集したデータの精製を行い,ラベル付与の曖昧さを排除する手法を提案した.事例とワーカーを選出することによって,データ品質を向上させる方法を提案した.多様なメディアにおいてモデルを構築するために,カテゴリーラベルの回答統合方法をシーケンスなどの多様なデータ型に対応できるように拡張した.人工知能に関するトップ国際会議IJCAI,WWW,SIGIR,MMを含む論文8編を発表した.
|
研究成果の学術的意義や社会的意義 |
本研究は,大規模データと多数のラベルを対象としたラベル付与においてトレードオフ関係にあるコスト削減と品質向上を同時に目指す点が挑戦的であり,独自性がある.テキストや画像など実用レベルで利用可能な機械学習モデルを提案することであり,ペアワイズラベル及びシーケンスラベルへの拡張にも挑戦する.ラベル付与で生じる問題点は,機械学習及び自然言語処理など人工知能分野にも還元することができることから,学術的意義は極めて大きい.近年脚光を浴びている深層学習などの教師付き機械学習において本質的な問題である学習データの作成に直接貢献することから,産業界における多様な分野での人工知能技術の実用化と進展が期待できる.
|