研究課題/領域番号 |
20K11917
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61020:ヒューマンインタフェースおよびインタラクション関連
|
研究機関 | お茶の水女子大学 |
研究代表者 |
伊藤 貴之 お茶の水女子大学, 基幹研究院, 教授 (80401595)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2021年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2020年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 可視化 / 訓練データ / アノテーション / 機械学習 / ヒューマンファクタ― |
研究開始時の研究の概要 |
本研究では機械学習のための訓練データの内容を利用者が検証し理解するための可視化手法について研究する.特に,複数の作業者による訓練データへの注釈の揺れに着目した可視化手法,テストデータにおける誤動作と訓練データの対応に着目した可視化手法,といった2種類の可視化手法を実現する.本研究の目標は,訓練データと作業者の関係,テストデータにおける誤動作と訓練データとの関係,といった複合的なデータに対して可読性と対話操作性の高い可視化手法を確立すること,訓練データ作成時の作業者の一貫性や不完全さに関するヒューマンファクタを発見すること,である.
|
研究成果の概要 |
機械学習に用いる訓練データの分布や作成過程を可視化することで、高品質な訓練データの構築を支援する諸手法の研究に着手した。具体的な研究成果として、以下の3種類の可視化手法を提案した。1)訓練データのアノテーション作業の半自動化と、その根拠となる決定木の構築結果とその動作結果の可視化。2)複数の訓練データの特徴量分布とラベル分布の比較可視化。3)複数の作業者によるアノテーションの作業工程の可視化と、アノテーションの信頼性に関する検証。
|
研究成果の学術的意義や社会的意義 |
大規模で複合的な訓練データの分布や制作過程を視認性の高い形で情報提示する手法の開発は、可視化の研究における学術面での本質的な課題であり、これを解くことに学術的意義があった。一方で、機械学習の普及により訓練データの品質は社会的に大きな課題となっている。訓練データ制作の半自動化による信頼性の向上、複数の訓練データ間での特徴量やラベルの分布の検証、訓練データの制作過程での各作業者による工程の信頼性の検証、といった各課題は機械学習の品質を向上するために重要な課題であり、これらの解決には大きな社会的意義があった。
|