2022 Fiscal Year Annual Research Report
機械学習の訓練データ検証のための対話的可視化手法の研究
Project/Area Number |
20K11917
|
Research Institution | Ochanomizu University |
Principal Investigator |
伊藤 貴之 お茶の水女子大学, 基幹研究院, 教授 (80401595)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | 可視化 / 訓練データ / アノテーション |
Outline of Annual Research Achievements |
1つ目の研究として、前年度に引き続き、訓練データの「アノテーションの半自動化」のための可視化に取り組んだ。この研究では、訓練画像データの一部に対してアノテーション作業を実施し、画像データの特徴量とアノテーション結果の関係から決定木を自動生成した。続いて残りの訓練画像データについて、決定木を利用してアノテーションを自動付与した。決定木およびアノテーション付与結果を検証するための可視化機能も開発した。今年度はユーザ評価結果をまとめて国内学会で発表し、最優秀論文賞を受賞した。 2つ目の研究として、前年度に引き続き、「複数の訓練データの比較」のための可視化に取り組んだ。具体的には複数の訓練画像データから特徴量を算出し、同一の次元削減処理を施して単一の画面に表示し、さらにデータセットごと・ラベルごとに色分け表示することでその分布の違いを表現する。次元削減結果として表示される散布図を、点群の密度の高い領域を表す多角形と、外れ値を表す点群にわけて表示することで、データセットごと・ラベルごとの分布の違いを明確に表現する。2021年度の国際会議講演が代表論文に選ばれて書籍に掲載されることになったので、実装と実験結果を一新して原稿作成に取り組んだ。 3つ目の研究として、前年度に引き続き、「アノテーション付与工程の観察」に取り組んだ。具体的には訓練データを構成する多数の画像の各々に複数の作業者がアノテーションを付与する作業のログをとり、アノテーションの信頼度を算出し、それと作業所要時間の関係を可視化している。今年度はユーザ実験結果を再構成して国際会議で発表した。ジャーナル論文としても投稿したが査読結果として問題点が見つかったため投稿を取り下げ、研究内容を再検討した。
|