研究課題/領域番号 |
22K19807
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
本吉 勇 東京大学, 大学院総合文化研究科, 教授 (60447034)
|
研究期間 (年度) |
2022-06-30 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2022年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
|
キーワード | 脳波 / BMI / 画像 / 音声 / 脳 / BMI / デコーディング / 視覚 |
研究開始時の研究の概要 |
近年,脳活動データから観察者の認識内容のみならず見た映像そのものを復元する研究が進んでいますが,fMRIの巨大なデータを用いてもそれは容易ではありません.本研究では,低次元の特徴統計量により知覚が決まる「テクスチャ」に着目し,データ量の少ない脳波データから木々や肌などの複雑なテクスチャ画像を写真並みの高い質感で復元する新たな深層学習技術を開発します.また,同様の技術を様々な環境音の復元にも応用します.
|
研究実績の概要 |
(1) 20の異なる材質カテゴリからなる約200の物体表面画像に対する視覚誘発電位を計測し,SVMなどの機械学習やEEGNetなどの深層モデルを用いて脳波から材質カテゴリや光沢などの材質特性知覚の判別を試みた結果,いずれも200 ms程度の潜時で十分に判別が可能であることを見出した.さらに,MVAEを用いて画像の深層特徴を脳波から逆推定し,表面のカラー画像そのものを写真レベルの精細さで再構成することに成功した.これらの知見を国内外の学会で発表し,発表賞を得た. (2) 13の異なるカテゴリからなる約200の自然情景画像に対する視覚誘発電位を計測し,EEGNetを用いて抽出した脳波の深層特徴に基づいて情景のカテゴリや人工性・開放性などのプロパティを判別可能であることを見出した.さらに,gradCAMを適用して,どの電極のどの時刻の脳波が判別に寄与したかを示すマップを形成した.その結果,異なるプロパティの判別では異なる時空間マップが得られることがわかった.これらの知見をプリプリントとして公開後,国際学術誌に投稿した.また,(2)と同様の手法で情景画像を復元し,その画像から情景カテゴリの認識が可能であるかどうかを調べる心理実験研究を開始した.(3) 約200の多彩な自然音について聴覚誘発電位を計測し,別の研究で得ていた音響テクスチャ知覚の二段階スペクトル空間を利用した逆相関分析を適用した.その結果,種々の一次・二次周波数帯域と相関する電位成分を抽出することに成功した.この知見を基礎として,深層モデルを用いた分析を開始した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
視覚については,当初の目的である脳波からの高品質の画像復元に成功しつつある.また,復元や判別の性能を決定づけている情報を同定するための技術開発も進展した.聴覚については,画像と異なり音声そのものが動的に変動するため,脳波との関係を解析するには別の方途が必要となることがはっきりした.
|
今後の研究の推進方策 |
脳波から音声を復元する技術の開発を本格化するとともに,(現時点では困難だと想像される)位置関係の情報を含む情景や物体の画像の復元を可能にする技術の開発に挑戦する.
|