研究課題/領域番号 |
20H04217
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
櫻田 健 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (70773670)
|
研究分担者 |
高村 大也 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (80361773)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円)
2022年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2021年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円)
2020年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
|
キーワード | 画像説明文生成 / 変化検出 / 空間モデリング / 変化説明文生成 / 視点 / 3Dキャプショニング / シーン変化 / 多視点 / 説明文生成 / シーン認識 / 3Dモデリング / Visual SLAM / シーングラフ / プライバシー |
研究開始時の研究の概要 |
本研究では、上空・地上の両視点の画像から、地球上で起きている現象を自動で検出し,任意視点の説明文を生成する手法を開発する。人や車,建物など物体レベルのミクロな現象から,都市全体のマクロな現象まで,多様なスケールの事象を横断的に記述する新たな画像認識問題に対し、多視点幾何と画像説明文生成のモデルを融合することで、人間が知覚しきれない膨大なデータから重要な現象を自動で抽出し、分かりやすく提示するシステムの実現を目指す。
|
研究成果の概要 |
本研究では、動画像等から街並みの3次元地図の構築および更新を効率的に行い、地上で起こっている出来事を人間が理解しやすいテキストで説明するための基盤技術を開発した。この技術により、将来、自動運転や運転支援のために搭載したカメラ、ドライブレコーダー、スマートフォンなどから収集した膨大なデータを、3次元地図やテキスト等の形でユーザーに提示し活用できる可能性を示した。さらに、マップ共有時に重要な課題となるプライバシー保護に対して、シーンプライバシーに配慮したリアルタイムの3次元地図構築技術を開発した。
|
研究成果の学術的意義や社会的意義 |
コンピュータビジョンやロボティクス分野では、街並みの変化を検出する研究は行われてきたが、多くの場合3次元地図の更新を目的としているため、画素や点群、ボクセルのような観測単位の変化のみに着目しており、その意味的な理解はほとんど注目されてこなかった。本研究では、シーンを物体の集合として仮定し、物体単位の変化の検出と説明文生成を行うことで、人間が理解しやすく応用タスクで扱いやすい形で提示することを可能とした。また、シーンプライバシー保護手法において、従来の点群マップと異なる直線群マップに対し新たな再投影誤差モデルを定義し、カメラ姿勢と点群・直線群マップを同時に最適化可能とした点も学術的意義が大きい。
|