研究課題/領域番号 |
21H03445
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分60080:データベース関連
|
研究機関 | 東京大学 |
研究代表者 |
豊田 正史 東京大学, 生産技術研究所, 教授 (60447349)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,290千円 (直接経費: 13,300千円、間接経費: 3,990千円)
2023年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2022年度: 5,460千円 (直接経費: 4,200千円、間接経費: 1,260千円)
2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
|
キーワード | ビジュアル解析 / 解析結果の解釈 |
研究開始時の研究の概要 |
ビッグデータ解析に基づくサービスにおいて全自動化が可能な応用は限られており、解析結果の解釈および意思決定はいまだ人間に任されているものが多い。解析に用いられるモデルは複雑化の一途をたどっており、結果が出力された理由を直接人間が理解することはほぼ不可能となっている。本研究では、ビッグデータソリューションの開発者に対して、解析モデルの改善、およびデータのクリーニング等に資するような情報を与えることを目的として、機械学習モデルの説明手法、および情報可視化手法を統合した基盤技術を創出し、ウェブ、ソーシャルメディア、交通データなどの大規模データを用いた実証実験を実施する。
|
研究実績の概要 |
本年度は、機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術に関する基礎的な検討を行った。まず、複数の機械学習モデルの説明手法を用いて、多数の入力データに対する説明を生成し、複数の特徴や事例を比較しながらインタラクティブに探索可能とする可視化手法を提案した。本手法は、代表的な説明手法であるLIME [Ribeiro+,2016]、Anchor [Ribeiro+,2018]など複数の種類の説明手法を、多数の入力データに適用して生成された説明群をヒートマップ上に重畳して表示するものであり、入力データに依る説明の差異や、説明手法による説明の差異をユーザが比較検討することを可能としている。本手法を用いたプロトタイプシステムを構築し、小規模な医療系データ等に適用していくつかのケーススタディを実施した。
並行して、本プロトタイプシステムの有用性を評価するため、複数のタスクの検討を行った。具体的には、Twitter上において大規模な議論分析を実施するための基盤データセット構築、イデオロギー変容の分析、新型コロナウイルスワクチンの接種に対するスタンスの分類、ファクトチェックに値するツイートの抽出について検討を実施した。また、実用化を目標としていくつかの企業との連携についても検討を行った。
以上の研究内容は代表者を中心に、雇用するリサーチアシスタントと協力して手法・プロトタイプシステムの設計・実装を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術に関する基礎的な検討については順調に進んでおり、プロトタイプシステムの実装と小規模なデータセットを用いたケーススタディの実施についても実施できている。
本プロトタイプシステムの有用性を評価するためのタスク検討についても、主にソーシャルメディア分析の分野において複数のタスクについて検討を実施できている。現状では評価に適切なタスクを絞り切れていない状況だが、企業との連携等も通して検討を進めている。
|
今後の研究の推進方策 |
機械学習の説明手法によって出力された大量の説明をインタラクティブに可視化する技術に関する基礎的な検討については、本年度に実施した検討及びプロトタイプシステムのケーススタディの結果を受けて、システムの設計を行う。
本プロトタイプシステムの有用性を評価するためのタスク検討についても、さらに検討を進めソーシャルメディアを用いた社会分析を主軸に、商用の推薦システムやウェブ広告の分野などについても連携企業と連携して検討を進めていく予定である。
|