研究課題/領域番号 |
21H03445
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 東京大学 |
研究代表者 |
豊田 正史 東京大学, 生産技術研究所, 教授 (60447349)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
|
キーワード | ビジュアル解析 / 解析結果の解釈 |
研究開始時の研究の概要 |
ビッグデータ解析に基づくサービスにおいて全自動化が可能な応用は限られており、解析結果の解釈および意思決定はいまだ人間に任されているものが多い。解析に用いられるモデルは複雑化の一途をたどっており、結果が出力された理由を直接人間が理解することはほぼ不可能となっている。本研究では、ビッグデータソリューションの開発者に対して、解析モデルの改善、およびデータのクリーニング等に資するような情報を与えることを目的として、機械学習モデルの説明手法、および情報可視化手法を統合した基盤技術を創出し、ウェブ、ソーシャルメディア、交通データなどの大規模データを用いた実証実験を実施する。
|
研究実績の概要 |
本年度は、機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術の設計を行った。昨年度までに基礎的な検討を行った、複数の機械学習モデルの説明手法を用いるインタラクティブな説明可視化手法について、ウェブ広告関連企業と協力して広告作成に実際に用いられている機械学習モデルを用いた小規模なユーザスタディを行った。当該企業ではウェブ広告のデザイナー支援するツールとして、作成したバナー広告の効果を予測する機械学習モデルが用いられており、このモデルが出力するスコアに加えて、複数の説明手法の結果を提示することでどの部分を編集すれば効果の向上が見込めるか検討可能とするものである。本ユーザスタディでは、代表的な説明手法であるLIME(画像のレイヤ、公告文中の単語を提示)、Grad-CAM(画像中の部分を提示)など複数の種類の説明手法を、複数の入力データに適用して生成された説明群を表示するものであり、入力データに依る説明の差異や、説明手法による説明の差異をユーザが比較検討することを可能としている。本手法を用いたプロトタイプシステムを構築し、小規模なバナー広告データに適用した結果、デザイナーからのシステムに対する評価は高く、作業の効率化についても有望な結果が得られた。 並行して、複数のタスクの検討を継続して行った。具体的には、Twitter上において大規模な議論分析を実施するための基盤データセット構築、イデオロギー変容の分析、新型コロナウイルスワクチンの接種に対するスタンスや接種継続に関する分析、ファクトチェックに値するツイートの抽出について検討を実施した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術に関する設計については順調に進んでおり、プロトタイプシステムの実装と小規模なデータセットを用いたケーススタディについても実際のウェブ広告企業のデータおよびユーザを用いた実験を実施できた。 本プロトタイプシステムの有用性を評価するためのタスク検討についても、主にソーシャルメディア分析の分野において複数のタスクについて検討を実施できている。
|
今後の研究の推進方策 |
機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術に関しては、本年度に実施した設計及びプロトタイプシステムのケーススタディの結果を受けて、システムの実装を行う。 本プロトタイプシステムの有用性を評価するためのタスク検討についても、さらに検討を進めソーシャルメディアを用いた社会分析を主軸に、商用のウェブ広告の分野などについても連携企業と連携してさらに検討を進めていく予定である。
|